什麼是變異數分析 (ANOVA)?

變異數分析(ANOVA)是一種統計檢驗,用於評估多於兩個群體之間的平均數差異。這個統計分析工具將數據集內的總變異分為兩個組件:隨機因素和系統因素。

單因素變異數分析(one-way ANOVA)使用一個自變項。雙因素變異數分析(two-way ANOVA)使用兩個自變項。分析師使用ANOVA檢驗來確定自變項在迴歸研究中對應變項的影響。

關鍵要點

  • 變異數分析(ANOVA)是一種統計檢驗,用於評估多於兩個群體之間的平均數差異。
  • 單因素變異數分析(one-way ANOVA)使用一個自變項。
  • 雙因素變異數分析(two-way ANOVA)使用兩個自變項。
  • 如果群體之間不存在真實的變異,ANOVA的F比應接近1。

使用ANOVA

當需要對實驗數據進行分析時,可以應用ANOVA檢驗。如果沒有對統計軟體的訪問權限,需要手動計算ANOVA,這時更適合於小樣本。它適用於受試者、測試組群以及組內和組間。

ANOVA類似於多個雙樣本t檢驗,但會導致更少的一類誤差。ANOVA通過比較每個群體的平均數來分組差異,並將變異分散到不同的來源。分析師使用單因素ANOVA分析針對一個自變項和一個應變項的收集數據。雙因素ANOVA則使用兩個自變項。自變項應至少有三個不同的群體或類別。ANOVA決定應變項是否隨自變項的水平發生變化。

研究人員可能會測試多個大學的學生,看看某一大學的學生是否一貫優於其他學校的學生。在商業應用中,研發研究人員可能會測試兩種不同的製造產品的過程,以查看哪一種更具成本效益。

公式

F = MST / MSE

其中:

F = ANOVA係數

MST = 處理平方和的平均數

MSE = 誤差平方和的平均數

ANOVA的歷史

20世紀發展的t檢驗和z檢驗方法一直用於統計分析,直到1918年羅納德·費雪創建了變異數分析方法。ANOVA也稱為費雪變異數分析,它是t檢驗和z檢驗的擴展。該術語在1925年費雪的書《研究工作者的統計方法》中出現後變得眾所周知。它最初在實驗心理學中使用,後來擴展到更複雜的學科。

ANOVA檢驗是分析影響給定數據集的因素的初步步驟。檢驗完成後,分析師會對方法因素進行額外測試,這些因素對數據集的變異貢獻顯著。分析師利用ANOVA檢驗結果進行F檢驗,以生成與提出的迴歸模型一致的附加數據。

ANOVA揭示了什麼

ANOVA將觀察到的整體變異分為兩部分:系統因素和隨機因素。系統因素影響給定的數據集,而隨機因素則不會。

ANOVA檢驗允許比較多於兩個群體,以確定它們之間是否存在關係。ANOVA公式的結果,即F統計量或F比,可以分析多個數據群體,以確定樣本之間和樣本內的變異性。

如果測試組之間沒有真實差異,即稱為零假設,ANOVA的F比結果將接近1。所有可能的F統計量值的分布是F分布。這是一組分布函數,具有兩個特徵數,稱為分子自由度和分母自由度。

單因素與雙因素ANOVA

單因素ANOVA評估單一因素對單一應變項的影響。它確定所有樣本是否相同。單因素ANOVA用於確定三個或更多獨立群體之間是否存在統計顯著的差異。

雙因素ANOVA是單因素ANOVA的擴展。單因素使用一個自變項影響一個應變項。雙因素ANOVA使用兩個自變項。例如,雙因素ANOVA允許公司根據兩個自變項(如薪水和技能組合)比較工人的生產力。它用於觀察兩個因素之間的交互作用,同時測試兩個因素的效應。

多變量ANOVA(MANOVA)與ANOVA不同,它同時檢驗多個應變項,而ANOVA一次只評估一個應變項。

ANOVA與T檢驗有什麼不同?

ANOVA與T檢驗不同,ANOVA可以比較三個或更多群體,而T檢驗僅適用於一次比較兩個群體。

什麼是協方差分析(ANCOVA)?

協方差分析結合了ANOVA和迴歸。它可以幫助理解ANOVA檢驗無法解釋的組內變異。

ANOVA是否依賴於任何假設?

是的,ANOVA檢驗假設數據是正態分佈的,並且每個群體中的變異水平大致相等。最後,它假設所有觀察都是獨立進行的。如果這些假設不準確,ANOVA可能不適用於比較群體。

總結

ANOVA可以比較多於兩個群體以識別它們之間的關係。該技術可以用於學術界分析研究,或在金融領域預測股票價格的未來變動。