二項式分布(Binomial Distribution)
二項式分布是一種統計分布,總結了在給定一組參數或假設下,某個值將取兩個獨立值之一的概率。
關鍵要點
- 二項式分布是一種統計概率分布,總結了在給定一組參數或假設下,某個值將取兩個獨立值之一的可能性。
- 二項式分布的基本假設是每次試驗只有一個結果,每次試驗的成功概率相同,並且每次試驗都是相互獨立的。
- 二項式分布是一種常見的離散分布,而非連續分布,如正態分布。
理解二項式分布
首先,二項式分布中的“二項”指的是兩個項——成功次數和嘗試次數。兩者是相互依賴的。
二項式分布是一種常見的離散分布,與連續分布(如正態分布)不同。這是因為二項式分布只計數兩個狀態,通常表示為1(成功)或0(失敗),在數據中的給定試驗次數。二項式分布因此代表了在n次試驗中,給定每次試驗的成功概率p時,x次成功的概率。
二項式分布總結了當每次試驗具有相同概率取得某個特定值時的試驗次數或觀察次數。二項式分布確定在特定試驗次數中觀察到特定成功次數的概率。
二項式分布經常用於社會科學統計中,作為二分結果變量模型的構建基礎,例如共和黨或民主黨是否會贏得即將到來的選舉,某人在指定時間內是否會死亡等。它還應用於金融、銀行和保險等行業。
分析二項式分布
二項式分布的期望值或平均值通過將試驗次數(n)乘以成功概率(p)來計算,即n × p。例如,在100次正反面試驗中正面出現的期望值是50,即(100 × 0.5)。另一個常見的二項式分布例子是估計籃球中自由投籃命中的成功概率,其中1表示命中,0表示未中。
二項式分布函數計算公式為:
P(x : n, p) = nCx * p^x * (1 – p)^(n – x)
其中:
- n 是試驗次數(發生次數)
- x 是成功次數
- p 是單次試驗的成功概率
- nCx 是 n 和 x 的組合。組合是從 n 個不同對象中選擇 x 個元素的方式數,順序不重要,不允許重複。注意 nCx = n! / (x! * (n – x)!),其中 ! 表示階乘(例如,4! = 4 × 3 × 2 × 1)。
二項式分布的平均值為 np,方差為 np(1 – p)。當 p = 0.5 時,分布是對稱的,如擲硬幣,因為獲得正面或反面的機會都是50%,即0.5。當 p > 0.5 時,分布曲線向左偏斜。當 p < 0.5 時,分布曲線向右偏斜。
二項式分布是多個獨立且同分佈的伯努利試驗的總和。在伯努利試驗中,實驗被認為是隨機的,並且只有兩種可能的結果:成功或失敗。
例如,擲硬幣被認為是伯努利試驗;每次試驗只能取兩個值之一(正面或反面),每次成功的概率相同,並且一次試驗的結果不會影響另一個試驗的結果。伯努利分布是二項式分布的一種特殊情況,其中試驗次數 n = 1。
二項式分布的例子
二項式分布通過將成功概率提高到成功次數的次方,失敗概率提高到成功次數與試驗次數差值的次方來計算。然後,將結果乘以試驗次數和成功次數的組合數。
例如,假設某個賭場創建了一個新遊戲,參與者可以下注在指定次數擲硬幣中出現的正反面數量。假設參與者想下注$10,賭20次擲硬幣中正面恰好出現6次。他們希望計算這種情況發生的概率,因此使用二項式分布公式進行計算。
概率計算為 (20! / (6! × (20 – 6)!)) × (0.50^6) × (1 – 0.50)^(20 – 6)。因此,20次擲硬幣中正面恰好出現6次的概率是0.0369,或3.7%。在這種情況下,期望值是10次正面,因此參與者下了一個糟糕的賭注。下圖顯示了期望值是10(期望值),出現6次正面的機會在左側尾部,以紅色顯示。可以看到,出現6次正面的機會比出現7、8、9、10、11、12或13次正面的機會要少。
二項式分布在金融中的應用
那麼,這在金融中如何應用呢?例如,假設您是一家銀行,想知道特定借款人違約的可能性精確到小數點後三位。有多少借款人違約會使銀行破產的可能性是多少?一旦您使用二項式分布函數計算出這個數字,您就能更好地了解如何為保險定價,最終決定放貸金額和保留金額。
二項式分布的重要性
二項式分布用於計算在多次重複的調查或實驗中通過或失敗的概率。這種類型的分布只有兩種潛在結果。更廣泛地說,分布是分析數據集的一個重要部分,用於估計數據的所有潛在結果及其出現的頻率。預測和理解結果的成功或失敗對於業務發展至關重要。
總結
二項式分布是一種重要的統計分布,描述了二元結果(如擲硬幣,是否答案,或開/關狀態)。理解其特徵和功能對於涉及結果取兩個獨立值的各種情境中的數據分析至關重要。
它在社會科學、金融、銀行、保險等領域有廣泛應用。例如,它可用於估計借款人是否會違約、期權合約是否會到期、公司是否會錯過或超過收益預期等。