什麼是卡方檢定(Chi-Square (χ2) Statistic)?

卡方(χ2)統計量是一種衡量模型與實際觀察數據相比如何的測試。計算卡方檢定所用的數據必須是隨機的、原始的、互斥的,來自獨立的變量,並且抽取自一個足夠大的樣本。例如,擲一個公平的硬幣的結果符合這些標準。

卡方檢驗通常用於檢驗假設。卡方檢定根據樣本大小和關係中的變量數量,比較期望結果和實際結果之間差異的大小。

在這些測試中,自由度用於確定是否可以根據實驗中的變量和樣本總數拒絕某一特定的虛無假設。與任何統計量一樣,樣本量越大,結果越可靠。

關鍵要點

  • 卡方(χ2)統計量衡量一系列事件或變量的觀察頻率與期望頻率之間的差異。
  • 卡方對分析分類變量中的這些差異尤其有用,特別是那些名義上的變量。
  • χ2取決於實際和觀察值之間差異的大小、自由度和樣本大小。
  • χ2可用於檢驗兩個變量是否相關或獨立。
  • 它也可用於檢驗觀察分佈與理論分佈的適合度。

卡方公式

χc2 = ∑i (Oi - Ei)2 / Ei

其中:

  • c = 自由度
  • O = 觀察值
  • E = 期望值

卡方檢定告訴你什麼?

有兩種主要的卡方測試:

  1. 獨立性檢驗,提出一個關係問題,例如,「學生性別與課程選擇之間有關係嗎?」
  2. 適合度檢驗,提出類似「我手上的硬幣與理論上的公平硬幣匹配得如何?」的問題。

卡方分析應用於分類變量,特別是這些變量是名義上的(順序無關緊要,如婚姻狀況或性別)。

獨立性

在考慮學生性別和課程選擇時,可以使用χ2獨立性檢驗。為進行此測試,研究人員將收集這兩個選定變量(性別和選擇的課程)的數據,然後使用上述公式和χ2統計表比較男性和女性學生選擇提供課程的頻率。

如果性別和課程選擇之間沒有關係(即它們是獨立的),那麼男性和女性學生選擇每門提供課程的實際頻率應期望大致相等,或反過來,任何選定課程中男性和女性學生的比例應該大致等於樣本中男性和女性學生的比例。

χ2獨立性檢驗可以告訴我們隨機機會解釋實際數據中發現的差異的可能性。

適合度檢驗

χ2提供一種測試數據樣本與樣本所要代表的較大人群的已知或假定特徵的匹配程度的方法,這稱為適合度檢驗。

如果樣本數據不符合我們感興趣的人群的期望屬性,那麼我們不希望使用此樣本來對較大人群進行結論。

卡方示例

例如,假設有一個想像中的硬幣,正面和反面的機率各為50/50,並且有一枚實際的硬幣,你將硬幣擲100次。如果這枚硬幣是公平的,那麼它的正反面任何一方的機率也是均等的,擲100次的期望結果是正面出現50次,反面出現50次。

在這種情況下,χ2可以告訴我們100次硬幣擲的實際結果與理論模型(公平硬幣給出50/50結果)相比的匹配度。實際擲可能出現50/50,或60/40,甚至90/10。100次擲的實際結果離50/50越遠,這組擲與理論期望50/50的適合度越差,我們可能會得出這枚硬幣實際上並不公平的結論。

何時使用卡方檢驗

卡方檢驗用於幫助確定觀察結果是否符合期望結果,並排除觀察是由於隨機機會造成的。

當所分析的數據來自隨機樣本,且問題中的變量是分類變量時,卡方檢驗適用。分類變量包括如汽車類型、種族、教育程度、男性或女性、或某人對某政治候選人的喜好程度(從非常喜歡到非常不喜歡)。

這些類型的數據通常通過調查問卷或問卷回應收集。因此,卡方分析在分析這類數據時尤為有用。

如何進行卡方檢驗

  1. 創建觀察頻率和期望頻率的表格。
  2. 使用公式計算卡方值。
  3. 使用卡方值表或統計軟體找到臨界卡方值。
  4. 確定卡方值和臨界值哪個更大。
  5. 拒絕或接受虛無假設。

卡方檢驗的限制

卡方檢驗對樣本量敏感。使用非常大的樣本時,關係可能顯得顯著,但實際上並非如此。

此外,卡方檢驗無法確立一個變量與另一變量之間的因果關係。它只能確定兩個變量是否相關。

卡方檢驗的用途

卡方檢驗是一種統計檢驗,用於檢查來自隨機樣本的分類變量之間的差異,以判斷期望結果與觀察結果之間的適配度。

誰使用卡方分析?

由於卡方適用於分類變量,因此主要被研究調查回應數據的研究人員使用。這類研究範圍可以從人口統計學到消費者和市場研究,再到政治學和經濟學。

當自變量是名義變量或序數變量時是否使用卡方分析?

名義變量是一種分類變量,不同於質,而其數值順序可能無關緊要。例如,問某人他最喜歡的顏色會產生名義變量。而問某人的年齡,則會產生序數數據集。卡方最適用於名義數據。

總結

有兩種類型的卡方檢驗:獨立性檢驗和適合度檢驗。兩者均用於確定假設或假定的有效性。結果是一個可以用於做出決策的證據。

例如:

在獨立性檢驗中,公司可能希望評估其新產品(一種旨在提升能量的草藥補充劑)是否達到最有可能感興趣的人群。它在與運動和健康相關的網站上做廣告,假設活動和健康意識高的人最有可能購買。公司進行了廣泛的民意調查,旨在評估不同人口群體對該產品的興趣。結果顯示,對產品的興趣與最健康意識高的人之間沒有相關性。

在適合度檢驗中,市場專業人士考慮推出一種新產品,公司認為這產品將對45歲以上女性有不可抗拒的吸引力。公司進行了500名潛在買家的產品測試小組。市場專業人士擁有關於測試小組的年齡和性別的信息。這允許構建一個卡方檢驗,顯示表示會購買產品的人的年齡和性別分佈。結果將顯示最有可能的買家是否為45歲以上的女性。如果測試表明45歲以上的男性或18至44歲的女性也同樣可能購買產品,那麼市場專業人士將調整產品的廣告、推廣和定位,以吸引這更廣泛的客戶群體。