python正態(tài)密度函數(shù) 正態(tài)密度函數(shù)公式

如何在Python中實(shí)現(xiàn)這五類強(qiáng)大的概率分布

R編程語(yǔ)言已經(jīng)成為統(tǒng)計(jì)分析中的事實(shí)標(biāo)準(zhǔn)。但在這篇文章中，我將告訴你在Python中實(shí)現(xiàn)統(tǒng)計(jì)學(xué)概念會(huì)是如此容易。我要使用Python實(shí)現(xiàn)一些離散和連續(xù)的概率分布。雖然我不會(huì)討論這些分布的數(shù)學(xué)細(xì)節(jié)，但我會(huì)以鏈接的方式給你一些學(xué)習(xí)這些統(tǒng)計(jì)學(xué)概念的好資料。在討論這些概率分布之前，我想簡(jiǎn)單說(shuō)說(shuō)什么是隨機(jī)變量（random variable）。隨機(jī)變量是對(duì)一次試驗(yàn)結(jié)果的量化。

創(chuàng)新互聯(lián)公司專注于天涯網(wǎng)站建設(shè)服務(wù)及定制，我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。熱誠(chéng)為您提供天涯營(yíng)銷型網(wǎng)站建設(shè)，天涯網(wǎng)站制作、天涯網(wǎng)頁(yè)設(shè)計(jì)、天涯網(wǎng)站官網(wǎng)定制、成都微信小程序服務(wù)，打造天涯網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供天涯網(wǎng)站排名全網(wǎng)營(yíng)銷落地服務(wù)。

舉個(gè)例子，一個(gè)表示拋硬幣結(jié)果的隨機(jī)變量可以表示成

Python

X = {1 如果正面朝上,

2 如果反面朝上}

隨機(jī)變量是一個(gè)變量，它取值于一組可能的值（離散或連續(xù)的），并服從某種隨機(jī)性。隨機(jī)變量的每個(gè)可能取值的都與一個(gè)概率相關(guān)聯(lián)。隨機(jī)變量的所有可能取值和與之相關(guān)聯(lián)的概率就被稱為概率分布（probability distributrion）。

我鼓勵(lì)大家仔細(xì)研究一下scipy.stats模塊。

概率分布有兩種類型：離散（discrete）概率分布和連續(xù)（continuous）概率分布。

離散概率分布也稱為概率質(zhì)量函數(shù)（probability mass function）。離散概率分布的例子有伯努利分布（Bernoulli distribution）、二項(xiàng)分布（binomial distribution）、泊松分布（Poisson distribution）和幾何分布（geometric distribution）等。

連續(xù)概率分布也稱為概率密度函數(shù)（probability density function），它們是具有連續(xù)取值（例如一條實(shí)線上的值）的函數(shù)。正態(tài)分布（normal distribution）、指數(shù)分布（exponential distribution）和β分布（beta distribution）等都屬于連續(xù)概率分布。

若想了解更多關(guān)于離散和連續(xù)隨機(jī)變量的知識(shí)，你可以觀看可汗學(xué)院關(guān)于概率分布的視頻。

二項(xiàng)分布（Binomial Distribution）

服從二項(xiàng)分布的隨機(jī)變量X表示在n個(gè)獨(dú)立的是/非試驗(yàn)中成功的次數(shù)，其中每次試驗(yàn)的成功概率為p。

E(X) =?np, Var(X) =?np(1?p)

如果你想知道每個(gè)函數(shù)的原理，你可以在IPython筆記本中使用help file命令。?E(X)表示分布的期望或平均值。

鍵入stats.binom?了解二項(xiàng)分布函數(shù)binom的更多信息。

二項(xiàng)分布的例子：拋擲10次硬幣，恰好兩次正面朝上的概率是多少？

假設(shè)在該試驗(yàn)中正面朝上的概率為0.3，這意味著平均來(lái)說(shuō)，我們可以期待有3次是硬幣正面朝上的。我定義擲硬幣的所有可能結(jié)果為k = np.arange(0,11)：你可能觀測(cè)到0次正面朝上、1次正面朝上，一直到10次正面朝上。我使用stats.binom.pmf計(jì)算每次觀測(cè)的概率質(zhì)量函數(shù)。它返回一個(gè)含有11個(gè)元素的列表（list），這些元素表示與每個(gè)觀測(cè)相關(guān)聯(lián)的概率值。

您可以使用.rvs函數(shù)模擬一個(gè)二項(xiàng)隨機(jī)變量，其中參數(shù)size指定你要進(jìn)行模擬的次數(shù)。我讓Python返回10000個(gè)參數(shù)為n和p的二項(xiàng)式隨機(jī)變量。我將輸出這些隨機(jī)變量的平均值和標(biāo)準(zhǔn)差，然后畫出所有的隨機(jī)變量的直方圖。

泊松分布（Poisson Distribution）

一個(gè)服從泊松分布的隨機(jī)變量X，表示在具有比率參數(shù)（rate parameter）λ的一段固定時(shí)間間隔內(nèi)，事件發(fā)生的次數(shù)。參數(shù)λ告訴你該事件發(fā)生的比率。隨機(jī)變量X的平均值和方差都是λ。

E(X) =?λ, Var(X) =?λ

泊松分布的例子：已知某路口發(fā)生事故的比率是每天2次，那么在此處一天內(nèi)發(fā)生4次事故的概率是多少？

讓我們考慮這個(gè)平均每天發(fā)生2起事故的例子。泊松分布的實(shí)現(xiàn)和二項(xiàng)分布有些類似，在泊松分布中我們需要指定比率參數(shù)。泊松分布的輸出是一個(gè)數(shù)列，包含了發(fā)生0次、1次、2次，直到10次事故的概率。我用結(jié)果生成了以下圖片。

你可以看到，事故次數(shù)的峰值在均值附近。平均來(lái)說(shuō)，你可以預(yù)計(jì)事件發(fā)生的次數(shù)為λ。嘗試不同的λ和n的值，然后看看分布的形狀是怎么變化的。

現(xiàn)在我來(lái)模擬1000個(gè)服從泊松分布的隨機(jī)變量。

正態(tài)分布（Normal Distribution）

正態(tài)分布是一種連續(xù)分布，其函數(shù)可以在實(shí)線上的任何地方取值。正態(tài)分布由兩個(gè)參數(shù)描述：分布的平均值μ和方差σ2?。

E(X) =?μ, Var(X) =?σ2

正態(tài)分布的取值可以從負(fù)無(wú)窮到正無(wú)窮。你可以注意到，我用stats.norm.pdf得到正態(tài)分布的概率密度函數(shù)。

β分布（Beta Distribution）

β分布是一個(gè)取值在?[0, 1]?之間的連續(xù)分布，它由兩個(gè)形態(tài)參數(shù)α和β的取值所刻畫。

β分布的形狀取決于α和β的值。貝葉斯分析中大量使用了β分布。

當(dāng)你將參數(shù)α和β都設(shè)置為1時(shí)，該分布又被稱為均勻分布（uniform distribution）。嘗試不同的α和β取值，看看分布的形狀是如何變化的。

指數(shù)分布（Exponential Distribution）

指數(shù)分布是一種連續(xù)概率分布，用于表示獨(dú)立隨機(jī)事件發(fā)生的時(shí)間間隔。比如旅客進(jìn)入機(jī)場(chǎng)的時(shí)間間隔、打進(jìn)客服中心電話的時(shí)間間隔、中文維基百科新條目出現(xiàn)的時(shí)間間隔等等。

我將參數(shù)λ設(shè)置為0.5，并將x的取值范圍設(shè)置為 $[0, 15]$ 。

接著，我在指數(shù)分布下模擬1000個(gè)隨機(jī)變量。scale參數(shù)表示λ的倒數(shù)。函數(shù)np.std中，參數(shù)ddof等于標(biāo)準(zhǔn)偏差除以 $n-1$ 的值。

結(jié)語(yǔ)（Conclusion）

概率分布就像蓋房子的藍(lán)圖，而隨機(jī)變量是對(duì)試驗(yàn)事件的總結(jié)。我建議你去看看哈佛大學(xué)數(shù)據(jù)科學(xué)課程的講座，Joe Blitzstein教授給了一份摘要，包含了你所需要了解的關(guān)于統(tǒng)計(jì)模型和分布的全部。

如何用python使變量服從正太分布？

正太分布哈哈

首先，如果想要你的一千萬(wàn)個(gè)數(shù)據(jù)嚴(yán)格服從正態(tài)分布，那么先確定這個(gè)分布的數(shù)據(jù)，也就是均值和方差，N(u,o)，這里均值 u=50，方差 o 由你確定，根據(jù)正態(tài)分布概率密度函數(shù)，對(duì)于每一個(gè) 1~100 之間的整數(shù) x，都可以確定它出現(xiàn)的概率 f(x)：

正態(tài)分布概率密度函數(shù)

而共有 10 000 000 個(gè)數(shù)字，那么 10000000*f(x) 就是 x 出現(xiàn)的頻率。

因此，使用一個(gè) 101 元素的數(shù)組 freq[] 存放這些數(shù)出現(xiàn)的頻率，用 f(x)*10000000 逐個(gè)計(jì)算數(shù)組元素，也就是 x 應(yīng)該出現(xiàn)的次數(shù)，假如說(shuō) 2 一共會(huì)出現(xiàn) 3 次，那么 freq[2]=3，計(jì)算出之后放在那里，作為一個(gè)參照。再初始化一個(gè)全為 0 的 100 個(gè)元素的數(shù)組 sam[]，記錄每個(gè)數(shù)字已經(jīng)出現(xiàn)的次數(shù)。之后開始從 1~100 隨機(jī)，每隨機(jī)一個(gè)數(shù)字 x 都給 sam[x] 加1，再和 freq[x] 比較，如果超出了 freq[x] 就說(shuō)明這個(gè)數(shù)字已經(jīng)不能再出現(xiàn)了，將其舍棄。記錄隨機(jī)成功的次數(shù)，達(dá)到了 10000000 次即可。

python 怎么求標(biāo)準(zhǔn)正態(tài)分布某個(gè)值

示例：

1、from numpy import *;

2、def rand_Matrix():

3、randArr=random.randn(2,3);

4、randMat=mat(randArr);

5、return randMat;

一種結(jié)果如下:

1、matrix([[ 0.3150869 , -0.02041996, -0.15361071],

2、[-0.75507988,? 0.80393683, -0.31790917]])

擴(kuò)展資料

Python正態(tài)分布概率計(jì)算方法：

def st_norm(u):

'''標(biāo)準(zhǔn)正態(tài)分布'''

import math

x=abs(u)/math.sqrt(2)

T=(0.0705230784,0.0422820123,0.0092705272,

0.0001520143,0.0002765672,0.0000430638)

E=1-pow((1+sum([a*pow(x,(i+1))

for i,a in enumerate(T)])),-16)

p=0.5-0.5*E if u0 else 0.5+0.5*E

return(p)

def norm(a,sigma,x):

'''一般正態(tài)分布'''

u=(x-a)/sigma

return(st_norm(u))

while 1:

'''輸入一個(gè)數(shù)時(shí)默認(rèn)為標(biāo)準(zhǔn)正態(tài)分布

輸入三個(gè)數(shù)(空格隔開)時(shí)分別為期望、方差、x

輸入 stop 停止'''

S=input('please input the parameters:\n')

if S=='stop':break

try:

L=[float(s) for s in S.split()]

except:

print('Input error!')

continue

if len(L)==1:

print('f(x)=%.5f'%st_norm(L[0]))

elif len(L)==3:

print('f(x)=%.5f'%norm(L[0],L[1],L[2]))

else:

print('Input error!')

如何用python求出某已知正態(tài)分布的概率密度

算出平均值和標(biāo)準(zhǔn)差μ、σ，代入正態(tài)分布密度函數(shù)表達(dá)式：

f(x) = exp{-(x-μ)2/2σ2}/[√(2π)σ]

給定x值,即可算出f值。

高中就開始學(xué)的正態(tài)分布，原來(lái)如此重要

我們從高中就開始學(xué)正態(tài)分布，現(xiàn)在做數(shù)據(jù)分析、機(jī)器學(xué)習(xí)還是離不開它，那你有沒(méi)有想過(guò)正態(tài)分布有什么特別之處？為什么那么多關(guān)于數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的文章都圍繞正態(tài)分布展開？本文作者專門寫了一篇文章，試著用易于理解的方式闡明正態(tài)分布的概念。

機(jī)器學(xué)習(xí)的世界是以概率分布為中心的，而概率分布的核心是正態(tài)分布。本文說(shuō)明了什么是正態(tài)分布，以及為什么正態(tài)分布的使用如此廣泛，尤其是對(duì)數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)專家來(lái)說(shuō)。

我們會(huì)從最基礎(chǔ)的內(nèi)容開始解釋，以便讀者們理解為什么正態(tài)分布如此重要。

Unsplash，由 timJ 發(fā)布。

先讓我們來(lái)看一點(diǎn)背景知識(shí)：

1. 首先，要注意的最重要的一點(diǎn)是，正態(tài)分布也被稱為高斯分布。

2. 它是以天才卡爾·弗里德里希·高斯（Carl Friedrich Gauss）的名字命名的。

3. 最后需要注意的是，簡(jiǎn)單的預(yù)測(cè)模型一般都是最常用的模型，因?yàn)樗鼈円子诮忉專惨子诶斫狻，F(xiàn)在補(bǔ)充一點(diǎn)：正態(tài)分布因?yàn)楹?jiǎn)單而流行。

因此，正態(tài)概率分布很值得我們?nèi)セ〞r(shí)間了解。

什么是概率分布？

想象我們正在自己的數(shù)據(jù)科學(xué)項(xiàng)目中構(gòu)建感興趣的預(yù)測(cè)模型：

概率越高，事件發(fā)生的可能性就越大。

Unsplash，Brett Jordan 發(fā)布

舉個(gè)例子，我們可以大量重復(fù)一個(gè)實(shí)驗(yàn)，并記錄我們檢索到的變量值，這樣概率分布就會(huì)慢慢展現(xiàn)在我們的面前。

每次實(shí)驗(yàn)產(chǎn)生一個(gè)值，這些值可以分配到類別/桶中了。對(duì)每個(gè)桶來(lái)說(shuō)，我們可以記錄變量值出現(xiàn)在桶里的次數(shù)。例如，我們可以扔 10,000 次骰子，每次骰子會(huì)產(chǎn)生 6 個(gè)可能的值，我們可以創(chuàng)建 6 個(gè)桶。并記錄每個(gè)值出現(xiàn)的次數(shù)。

我們可以根據(jù)這些值作圖。所作曲線就是概率分布曲線，目標(biāo)變量得到一個(gè)值的概率就是該變量的概率分布。

理解了值的分布方式后，就可以開始估計(jì)事件的概率了，甚至可以使用公式（概率分布函數(shù)）。因此，我們可以更好地理解它的行為。概率分布依賴于樣本的矩，比如平均值、標(biāo)準(zhǔn)差、偏度及峰度。如果對(duì)所有概率求和，總和為 100%。

現(xiàn)實(shí)世界中存在很多概率分布，最常用的是「正態(tài)分布」。

什么是正態(tài)概率分布

如果對(duì)概率分布作圖，得到一條倒鐘形曲線，樣本的平均值、眾數(shù)以及中位數(shù)是相等的，那么該變量就是正態(tài)分布的。

這是正態(tài)分布鐘形曲線的示例：

上面是一個(gè)變量的高斯分布圖形，像神經(jīng)網(wǎng)絡(luò)那樣上百萬(wàn)的參數(shù)量，每個(gè)參數(shù)都有自己獨(dú)立的分布形狀，還有極其恐怖的聯(lián)合分布形狀。這種高維聯(lián)合分布就主導(dǎo)了不同任務(wù)的表現(xiàn)，因此理解和估計(jì)目標(biāo)變量的概率分布是很重要的。

以下變量非常接近正態(tài)分布：

1. 人群的身高

2. 成年人的血壓

3. 擴(kuò)散后的粒子的位置

4. 測(cè)量誤差

5. 人群的鞋碼

6. 員工回家所需時(shí)間

此外，我們周圍的大部分變量都呈置信度為 x% 的正態(tài)分布（x100）。所以說(shuō)，生活中經(jīng)常出現(xiàn)的各種變量，差不多都能用高斯分布描述。

好理解的正態(tài)分布

正態(tài)分布是只依賴數(shù)據(jù)集中兩個(gè)參數(shù)的分布，這兩個(gè)參數(shù)分別是：樣本的平均值和標(biāo)準(zhǔn)差。

分布的這一特性讓統(tǒng)計(jì)人員省事不少，因此預(yù)測(cè)任何呈正態(tài)分布的變量準(zhǔn)確率通常都很高。值得注意的是，一旦你研究過(guò)自然界中大多數(shù)變量的概率分布，你會(huì)發(fā)現(xiàn)它們都大致遵循正態(tài)分布。

正態(tài)分布很好解釋。因?yàn)椋?/p>

1. 分布的均值、眾數(shù)和中位數(shù)是相等的；

2. 我們只要用平均值和標(biāo)準(zhǔn)差就可以解釋整個(gè)分布。

為什么這么多變量近似正態(tài)分布？

為什么樣本一多，那么總會(huì)有一堆樣本都非常普通？這個(gè)想法背后有這樣一個(gè)定理：你在大量隨機(jī)變量上多次重復(fù)一個(gè)實(shí)驗(yàn)時(shí)，它們的分布總和將非常接近正態(tài)性（normality）。

人的身高是一個(gè)基于其他隨機(jī)變量（比如一個(gè)人所消耗的營(yíng)養(yǎng)量、他們居住的環(huán)境以及他們的基因等）的隨機(jī)變量，這些隨機(jī)變量的分布總和最終是非常接近正態(tài)的。這就是中心極限定理。

我們從前文了解到，正態(tài)分布是許多隨機(jī)分布的和。如果我們對(duì)正態(tài)分布密度函數(shù)作圖，那所作曲線有如下特性：

這個(gè)鐘形曲線平均值為 100，標(biāo)準(zhǔn)差為 1。

上圖介紹了非常出名的 3σ原則，即：

這樣我們就可以輕松地估計(jì)出變量的波動(dòng)性，還可以給出一個(gè)置信水平，估計(jì)它可能取的值是多少。例如，在上面的灰色鐘型曲線中，變量值出現(xiàn)在 101~99 之間的概率約為 68.2%。想象一下，當(dāng)你根據(jù)這樣的信息做決定時(shí)，你的信心有多充足。

概率分布函數(shù)

正態(tài)分布的概率密度函數(shù)是：

概率密度函數(shù)本質(zhì)上是連續(xù)隨機(jī)變量取某些值的概率。例如想知道變量出現(xiàn)在 0 到 1 之間，它的概率就能通過(guò)概率密度函數(shù)求出。

如何用 Python 找出特征分布？

我用過(guò)的最簡(jiǎn)單的方法是在 Pandas 的 DataFrame 中加載所有特征，然后直接調(diào)用它的方法找出特征的概率分布：

這里的 bins 表示分布的柱狀數(shù)量。當(dāng)然上面并不是一個(gè)正態(tài)分布，那么當(dāng)變量滿足正態(tài)分布時(shí)，它意味著什么？

這意味著，如果你把大量分布不同的隨機(jī)變量加在一起，你的新變量最終也服從正態(tài)分布，這就是中心極限定理的魅力。此外，服從正態(tài)分布的變量會(huì)一直服從正態(tài)分布。舉個(gè)例子，如果 A 和 B 是兩個(gè)服從正態(tài)分布的變量，那么：

變量還是乖乖地變成正態(tài)分布吧

如果樣本滿足某個(gè)未知的分布，那么通過(guò)一系列操作，它總是能變成正態(tài)分布。相反，標(biāo)準(zhǔn)正態(tài)分布的疊加與轉(zhuǎn)換，也一定能變化為任意未知分布。從標(biāo)準(zhǔn)正態(tài)轉(zhuǎn)換到未知分布，就是很多機(jī)器學(xué)習(xí)模型希望做到的，不論是視覺(jué)中的 VAE 或 GAN，還是其它領(lǐng)域的模型。

但對(duì)于傳統(tǒng)統(tǒng)計(jì)學(xué)，我們更希望將特征的分布轉(zhuǎn)換成正態(tài)分布，因?yàn)檎龖B(tài)分布簡(jiǎn)單又好算呀。下面展示了幾種轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)的方法，像相信變換什么的，在高中都有學(xué)過(guò)。

1. 線性變換

我們收集到作為變量的樣本后，就可以用下面的公式對(duì)樣本做線性變換，從而計(jì)算出

用下式根據(jù)每一個(gè)值 x 計(jì)算出 Z

以前 x 可能服從某個(gè)未知分布，但是歸一化后的 Z 是服從正態(tài)分布的。嗯，這就是做批量歸一化或其它歸一化的好處吧。

2.Box-cox 變換

你可以用 Python 的 SciPy 包將數(shù)據(jù)轉(zhuǎn)換成正態(tài)分布：

3.YEO-JOHBSON 變換

此外，也可以用強(qiáng)大的 yeo-johnson 變換。Python 的 sci-kit learn 提供了合適的函數(shù)：

最后，非常重要的一點(diǎn)是，在沒(méi)有做任何分析的情況下假設(shè)變量服從正態(tài)分布是很不明智的。

以遵循泊松分布（Poisson distribution）、t 分布（student-t 分布）或二項(xiàng)分布（Binomial distribution）的樣本為例，如果錯(cuò)誤地假設(shè)變量服從正態(tài)分布可能會(huì)得到錯(cuò)誤的結(jié)果。

以上就是關(guān)于正態(tài)分布的一些討論。

如果文章對(duì)你有幫助，歡迎轉(zhuǎn)發(fā)/點(diǎn)贊/收藏~

統(tǒng)計(jì)學(xué)入門級(jí)：常見概率分布+python繪制分布圖

如果隨機(jī)變量X的所有取值都可以逐個(gè)列舉出來(lái)，則稱X為離散型隨機(jī)變量。相應(yīng)的概率分布有二項(xiàng)分布，泊松分布。

如果隨機(jī)變量X的所有取值無(wú)法逐個(gè)列舉出來(lái)，而是取數(shù)軸上某一區(qū)間內(nèi)的任一點(diǎn)，則稱X為連續(xù)型隨機(jī)變量。相應(yīng)的概率分布有正態(tài)分布，均勻分布，指數(shù)分布，伽馬分布，偏態(tài)分布，卡方分布，beta分布等。(真多分布，好恐怖~~)

在離散型隨機(jī)變量X的一切可能值中，各可能值與其對(duì)應(yīng)概率的乘積之和稱為該隨機(jī)變量X的期望值，記作E(X) 。比如有隨機(jī)變量，取值依次為：2，2，2，4，5。求其平均值：(2+2+2+4+5)/5 = 3。

期望值也就是該隨機(jī)變量總體的均值。推導(dǎo)過(guò)程如下：

= (2+2+2+4+5)/5

= 1/5 2 3 + 4/5 + 5/5

= 3/5 2 + 1/5 4 + 1/5 5

= 0.6 2 + 0.2 4 + 0.2 5

= 60% 2 + 20% 4 + 20%*5

= 1.2 + 0.8 + 1

= 3

倒數(shù)第三步可以解釋為值為2的數(shù)字出現(xiàn)的概率為60%，4的概率為20%，5的概率為20%。所以E(X) = 60% 2 + 20% 4 + 20%*5 = μ = 3。

0-1分布（兩點(diǎn)分布），它的隨機(jī)變量的取值為1或0。即離散型隨機(jī)變量X的概率分布為：P{X=0} = 1-p, P{X=1} = p，即：

則稱隨機(jī)變量X服從參數(shù)為p的0-1分布，記作X~B（1，p)。

在生活中有很多例子服從兩點(diǎn)分布，比如投資是否中標(biāo)，新生嬰兒是男孩還是女孩，檢查產(chǎn)品是否合格等等。

大家非常熟悉的拋硬幣試驗(yàn)對(duì)應(yīng)的分布就是二項(xiàng)分布。拋硬幣試驗(yàn)要么出現(xiàn)正面，要么就是反面，只包含這兩個(gè)結(jié)果。出現(xiàn)正面的次數(shù)是一個(gè)隨機(jī)變量，這種隨機(jī)變量所服從的概率分布通常稱為二項(xiàng)分布。

像拋硬幣這類試驗(yàn)所具有的共同性質(zhì)總結(jié)如下：（以拋硬幣為例）

通常稱具有上述特征的n次重復(fù)獨(dú)立試驗(yàn)為n重伯努利試驗(yàn)。簡(jiǎn)稱伯努利試驗(yàn)或伯努利試驗(yàn)概型。特別地，當(dāng)試驗(yàn)次數(shù)為1時(shí)，二項(xiàng)分布服從0-1分布(兩點(diǎn)分布)。

舉個(gè)栗子：拋3次均勻的硬幣，求結(jié)果出現(xiàn)有2個(gè)正面的概率。

已知p = 0.5 (出現(xiàn)正面的概率) ，n = 3 ，k = 2

所以拋3次均勻的硬幣，求結(jié)果出現(xiàn)有2個(gè)正面的概率為3/8。

二項(xiàng)分布的期望值和方差分別為：

泊松分布是用來(lái)描述在一指定時(shí)間范圍內(nèi)或在指定的面積或體積之內(nèi)某一事件出現(xiàn)的次數(shù)的分布。生活中服從泊松分布的例子比如有每天房產(chǎn)中介接待的客戶數(shù)，某微博每月出現(xiàn)服務(wù)器癱瘓的次數(shù)等等。泊松分布的公式為：

其中 λ 為給定的時(shí)間間隔內(nèi)事件的平均數(shù)，λ = np。e為一個(gè)數(shù)學(xué)常數(shù)，一個(gè)無(wú)限不循環(huán)小數(shù)，其值約為2.71828。

泊松分布的期望值和方差分別為：

使用Python繪制泊松分布的概率分布圖：

因?yàn)檫B續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的任意一個(gè)值，所以通常用一個(gè)函數(shù)f(x)來(lái)表示連續(xù)型隨機(jī)變量，而f(x)就稱為概率密度函數(shù) 。

概率密度函數(shù)f(x)具有如下性質(zhì) ：

需要注意的是，f(x)不是一個(gè)概率，即f(x) ≠ P(X = x) 。在連續(xù)分布的情況下，隨機(jī)變量X在a與b之間的概率可以寫成：

正態(tài)分布（或高斯分布）是連續(xù)型隨機(jī)變量的最重要也是最常見的分布，比如學(xué)生的考試成績(jī)就呈現(xiàn)出正態(tài)分布的特征，大部分成績(jī)集中在某個(gè)范圍（比如60-80分），很小一部分往兩端傾斜（比如50分以下和90多分以上）。還有人的身高等等。

正態(tài)分布的定義：

如果隨機(jī)變量X的概率密度為( -∞x+∞)：

則稱X服從正態(tài)分布，記作X~N(μ,σ2)。其中-∞μ+∞，σ0， μ為隨機(jī)變量X的均值，σ為隨機(jī)變量X的標(biāo)準(zhǔn)差。正態(tài)分布的分布函數(shù)

正態(tài)分布的圖形特點(diǎn) ：

使用Python繪制正態(tài)分布的概率分布圖：

正態(tài)分布有一個(gè)3σ準(zhǔn)則，即數(shù)值分布在(μ-σ,μ+σ)中的概率為0.6827，分布在（μ-2σ,μ+2σ)中的概率為0.9545，分布在(μ-3σ,μ+3σ)中的概率為0.9973，也就是說(shuō)大部分?jǐn)?shù)值是分布在(μ-3σ,μ+3σ)區(qū)間內(nèi)，超出這個(gè)范圍的可能性很小很小，僅占不到0.3%，屬于極個(gè)別的小概率事件，所以3σ準(zhǔn)則可以用來(lái)檢測(cè)異常值。

當(dāng)μ=0，σ=1時(shí)，有

此時(shí)的正態(tài)分布N(0,1) 稱為標(biāo)準(zhǔn)正態(tài)分布。因?yàn)棣蹋叶际谴_定的取值，所以其對(duì)應(yīng)的概率密度曲線是一條形態(tài)固定的曲線。

對(duì)標(biāo)準(zhǔn)正態(tài)分布，通常用φ(x)表示概率密度函數(shù)，用Φ(x)表示分布函數(shù)：

假設(shè)有一次物理考試特別難，滿分100分，全班只有大概20個(gè)人及格。與此同時(shí)語(yǔ)文考試很簡(jiǎn)單，全班絕大部分都考了90分以上。小明的物理和語(yǔ)文分別考了60分和80分，他回家后告訴家長(zhǎng)，這時(shí)家長(zhǎng)能僅僅從兩科科目的分值直接判斷出這次小明的語(yǔ)文成績(jī)要比物理好很多嗎？如果不能，應(yīng)該如何判斷呢？此時(shí)Z-score就派上用場(chǎng)了。 Z-Score的計(jì)算定義：

即將隨機(jī)變量X先減去總體樣本均值，再除以總體樣本標(biāo)準(zhǔn)差就得到標(biāo)準(zhǔn)分?jǐn)?shù)啦。如果X低于平均值，則Z為負(fù)數(shù)，反之為正數(shù) 。通過(guò)計(jì)算標(biāo)準(zhǔn)分?jǐn)?shù)，可以將任何一個(gè)一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。

小明家長(zhǎng)從老師那得知物理的全班平均成績(jī)?yōu)?0分，標(biāo)準(zhǔn)差為10，而語(yǔ)文的平均成績(jī)?yōu)?2分，標(biāo)準(zhǔn)差為4。分別計(jì)算兩科成績(jī)的標(biāo)準(zhǔn)分?jǐn)?shù)：

物理：標(biāo)準(zhǔn)分?jǐn)?shù) = (60-40)/10 = 2

語(yǔ)文：標(biāo)準(zhǔn)分?jǐn)?shù) = (85-95)/4 = -2.5

從計(jì)算結(jié)果來(lái)看，說(shuō)明這次考試小明的物理成績(jī)?cè)谌客瑢W(xué)中算是考得很不錯(cuò)的，而語(yǔ)文考得很差。

指數(shù)分布可能容易和前面的泊松分布混淆，泊松分布強(qiáng)調(diào)的是某段時(shí)間內(nèi)隨機(jī)事件發(fā)生的次數(shù)的概率分布，而指數(shù)分布說(shuō)的是隨機(jī)事件發(fā)生的時(shí)間間隔的概率分布。比如一班地鐵進(jìn)站的間隔時(shí)間。如果隨機(jī)變量X的概率密度為：

則稱X服從指數(shù)分布，其中的參數(shù)λ0。對(duì)應(yīng)的分布函數(shù) 為：

均勻分布的期望值和方差分別為：

使用Python繪制指數(shù)分布的概率分布圖：

均勻分布有兩種，分為離散型均勻分布和連續(xù)型均勻分布。其中離散型均勻分布最常見的例子就是拋擲骰子啦。拋擲骰子出現(xiàn)的點(diǎn)數(shù)就是一個(gè)離散型隨機(jī)變量，點(diǎn)數(shù)可能有1，2，3，4，5，6。每個(gè)數(shù)出現(xiàn)的概率都是1/6。

設(shè)連續(xù)型隨機(jī)變量X具有概率密度函數(shù)：

則稱X服從區(qū)間(a,b)上的均勻分布。X在等長(zhǎng)度的子區(qū)間內(nèi)取值的概率相同。對(duì)應(yīng)的分布函數(shù)為：

f(x)和F(x)的圖形分別如下圖所示：

均勻分布的期望值和方差分別為：

當(dāng)前標(biāo)題：python正態(tài)密度函數(shù) 正態(tài)密度函數(shù)公式
地址分享：http://chinadenli.net/article26/hhgpjg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供網(wǎng)站導(dǎo)航、網(wǎng)站設(shè)計(jì)、網(wǎng)站策劃、網(wǎng)站排名、營(yíng)銷型網(wǎng)站建設(shè)、電子商務(wù)

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請(qǐng)盡快告知，我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如需處理請(qǐng)聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時(shí)需注明來(lái)源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容