中央極限定理 (Central Limit Theorem) 是什麼?

在概率論中,中央極限定理 (CLT) 指出,無論母體實際的分布形狀如何,當樣本大小變大時,樣本變量的分布趨近於正態分布(即「鐘形曲線」)。

另一種說法是,CLT是一個統計前提,即從具有有限方差水平的母體中獲得一個足夠大的樣本量時,來自同一母體的所有樣本變量的均值將大約等於整個母體的均值。根據大數定律,這些樣本趨近於正態分布,其方差大約等於母體的方差,隨著樣本量的增大。

儘管這一概念最早由Abraham de Moivre於1733年提出,但直到1920年,著名的匈牙利數學家George Pólya才將其正式命名為中央極限定理。

重點要點

  • 中央極限定理(CLT)指出,隨著樣本量的增大,樣本均值的分布趨近於正態分布,無論母體的分布如何。
  • 樣本量等於或大於30通常被視為使CLT成立的足夠條件。
  • CLT的一個重要方面是樣本均值和標準差的平均值將等於母體的均值和標準差。
  • 足夠大的樣本量可以更準確地預測母體的特徵。
  • CLT在財務分析中非常有用,因為它可以用於分析大量證券以估算投資組合的分布和返回、風險以及相關特徵。

理解中央極限定理 (CLT)

根據中央極限定理,樣本數據的均值將隨著樣本量的增加而接近整體母體的均值,無論數據的實際分布如何。換句話說,無論分布是正常還是異常,數據都是準確的。

一般來說,30個樣本量通常被認為是使CLT成立的足夠條件,這意味著樣本均值的分布是相當正態分布的。因此,樣本越多,圖形結果越接近正態分布的形狀。

中央極限定理通常與大數定律一起使用,大數定律指出,隨著樣本量的增加,樣本均值的平均值將更接近於母體的均值,這在準確預測母體特徵方面極其有用。

中央極限定理的關鍵組成部分

  • 抽樣是連續的:這意味著某些樣本單位與之前選擇的樣本單位是相同的。
  • 抽樣是隨機的:所有樣本必須隨機選擇,這樣它們才能具有相同的統計選擇可能性。
  • 樣本應該是獨立的:一個樣本的選擇或結果應該不會影響未來的樣本或其他樣本結果。
  • 大樣本量:隨著樣本量的增加,抽樣分布趨向於正態分布。

中央極限定理在財務中的應用

中央極限定理在檢查個別股票或更廣泛指數的回報時非常有用,因為分析相對簡單,生成所需的財務數據也較為容易。因此,各類投資者依賴中央極限定理來分析股票回報、構建投資組合和管理風險。

比如,某位投資者希望分析包含1000隻股票的一個股票指數的總回報。在這種情況下,投資者可以簡單地研究隨機樣本的股票以估算總指數的回報。為了安全起見,至少應該抽取30-50隻來自不同部門的隨機選取股票。此外,先前選取的股票必須更換為不同的名稱以幫助消除偏見。

為什麼中央極限定理有用?

中央極限定理在分析大數據集時非常有用,因為它允許假設樣本均值的分布在大多數情況下是正態分布的。這使得統計分析和推斷變得更加容易。例如,投資者可以利用中央極限定理來聚合個別證券的表現數據,並生成代表較大範圍證券回報分布的樣本均值分布。

為什麼中央極限定理的最小樣本量是30?

在統計學中,樣本量為30是應用中央極限定理的常見最小值。樣本量越大,樣本越有可能代表母體集。

中央極限定理的公式是什麼?

中央極限定理在實際應用中沒有具體的公式。其原理是簡單應用的。當樣本量足夠大時,樣本分布將接近於正態分布,樣本均值將趨近於母體均值。因此,如果我們有至少30個樣本量,我們可以開始將數據分析視為符合正態分布。