什麼是決定係數(coefficient of determination)?
決定係數是一種統計度量,用於檢查在預測給定事件結果時,一個變量的差異如何由第二個變量的差異來解釋。換句話說,這個係數,更常見的是r平方(或r2),評估兩個變量之間線性關係的強度,並在投資者進行趨勢分析時經常依賴它。
這個係數通常回答以下問題:如果一隻股票在指數中上市並經歷價格波動,其價格波動的百分比是由指數的價格波動引起的?
關鍵要點
- 決定係數是一個複雜的概念,集中在數據的統計分析和財務建模上。
- 決定係數用來解釋獨立變量和依賴變量之間的關係。
- 決定係數通常被稱為r平方(或r2),因為它代表的統計值。
- 這個度量的值介於0.0到1.0之間,其中1.0表示完美相關。因此,它是一個可靠的未來預測模型,而0.0表示資產價格不受指數的依賴。
理解決定係數
決定係數是一種測量,用來解釋一個因素的變異性有多少是由其與另一個因素的關係引起的。這種相關性表示為0.0到1.0(0%到100%)之間的值。
值為1.0表示100%的價格相關性,因此是一個可靠的未來預測模型。值為0.0表示模型顯示價格不是指數依賴的函數。
例如,0.20的值表明資產價格波動的20%可以由指數解釋,而0.50的值表明其價格波動的50%可以由指數解釋,以此類推。
決定係數是相關係數的平方,也稱為統計中的“r”。“r”的值可能為負數,但由於r平方是“r”乘以自身(或平方)的結果,因此無論在互聯網上找到什麼,r2不可能為負數——負數的平方總是正數。
計算決定係數
計算決定係數是通過創建數據的散點圖和趨勢線來完成的。
例如,如果你繪製2022年12月21日至2023年1月20日期間S&P 500和蘋果股票(Apple在S&P 500中上市)的收盤價,你會收集如下表所示的價格。
S&P Daily Close | APPL Daily Close |
---|---|
$3,972.61 | $137.87 |
$3,898.85 | $135.27 |
$3,928.86 | $135.21 |
$3,990.97 | $135.94 |
$3,999.09 | $134.76 |
$3,983.17 | $133.41 |
$3,969.61 | $133.49 |
$3,919.25 | $130.73 |
$3,892.09 | $130.15 |
$3,895.08 | $129.62 |
$3,808.10 | $125.02 |
$3,852.97 | $126.36 |
$3,824.14 | $125.07 |
$3,839.50 | $139.93 |
$3,849.28 | $129.61 |
$3,783.22 | $126.04 |
$3,829.25 | $130.03 |
$3,844.82 | $131.86 |
$3,822.39 | $132.23 |
$3,878.44 | $135.45 |
然後,你會創建一個散點圖。在圖表上,數據與回歸模型的擬合程度稱為擬合度,這衡量了趨勢線和散佈在圖中的所有數據點之間的距離。
APPL Daily Close vs. S&P Daily Close 決定係數
大多數電子表格使用相同的公式來計算數據集的r2。所以,如果數據位於電子表格的A和B列:
= RSQ ( A1 : A10 , B1 : B10 )
使用此公式並突出S&P 500和Apple價格的相應單元格,你得到的r2是0.347,這表明兩個價格的相關性低於0.5和1.0之間的值。
手動計算
手動計算決定係數涉及幾個步驟。首先,如前表所示收集數據。其次,你需要計算所有所需的值,如下表所示,其中:
x = S&P 500每日收盤價
y = APPL每日收盤價
x | x2 | y | y2 | xy | xy2 |
---|---|---|---|---|---|
Jan. 20 | 3972.61 | 15781630.21 | 137.87 | 19008.14 | 547703.74 |
19 | 3898.85 | 15201031.32 | 135.27 | 18297.97 | 527397.44 |
18 | 3928.86 | 15435940.90 | 135.21 | 18281.74 | 531221.16 |
17 | 3990.97 | 15927841.54 | 135.94 | 18479.68 | 542532.46 |
13 | 3999.09 | 15992720.83 | 134.76 | 18160.26 | 538917.37 |
12 | 3983.17 | 15865643.25 | 133.41 | 17798.23 | 531394.71 |
11 | 3969.61 | 15757803.55 | 133.49 | 17819.58 | 529903.24 |
10 | 3919.25 | 15360520.56 | 130.73 | 17090.33 | 512363.55 |
9 | 3892.09 | 15148364.57 | 130.15 | 16939.02 | 506555.51 |
6 | 3895.08 | 15171648.21 | 129.62 | 16801.34 | 504880.27 |
5 | 3808.10 | 14501625.61 | 125.02 | 15630.00 | 476088.66 |
4 | 3852.97 | 14845377.82 | 126.36 | 15966.85 | 486861.29 |
3 | 3824.14 | 14624046.74 | 125.07 | 15642.50 | 478285.19 |
Dec. 30 | 3839.50 | 14741760.25 | 139.93 | 19580.40 | 537261.24 |
29 | 3849.28 | 14816956.52 | 129.61 | 16798.75 | 498905.18 |
28 | 3783.22 | 14312753.57 | 126.04 | 15886.08 | 476837.05 |
27 | 3829.25 | 14663155.56 | 130.03 | 16907.80 | 497917.38 |
23 | 3844.82 | 14782640.83 | 131.86 | 17387.06 | 506977.97 |
22 | 3822.39 | 14610665.31 | 132.23 | 17484.77 | 505434.63 |
21 | 3878.44 | 15042296.83 | 135.45 | 18346.70 | 525334.70 |
Sum (Σ) | 77781.69 | 302584424.00 | 2638.05 | 348307.23 | 10262772.73 |
接下來,使用此公式並替換表中每一行的值,其中n等於所取樣本數,在本例中為20:
𝑟^2 = [ (n * (Σxy) - (Σx * Σy))^2 ] / [ (n * Σx^2 - (Σx)^2) * (n * Σy^2 - (Σy)^2) ]
例如:
r^2 = [ 20 * (10,262,772.73) - (77,781.69 * 2,638.05) ]^2 / [ (20 * 302,584,424 - (77,781.69)^2) * (20 * 348,307.23 - (2,638.05)^2) ]
因此,你現在有:
1. (20 * 10,262,772.73) - (77,781.69 * 2,638.05) = 63,467.32
2. [ (20 * 302,584,424) - (77,781.69)^2 = 1,697,180.74 ] = 1,302.76
3. [ (20 * 10,262,772.73) - (2,638.05)^2 = 6,836.85 ] = 82.69
然後,將步驟二和步驟三相乘,將步驟一除以結果,並將其平方:
( 63,467.32 / (1,302.76 * 82.69) )^2 = 0.347
你可以看到,這樣做會變得非常繁瑣,並且有很多出錯的空間,特別是當你使用超過幾周的交易數據時。
解釋決定係數
一旦你有了決定係數,你可以用它來評估你正在評估的資產的價格波動與指數或基準的價格波動的對應程度。在蘋果和S&P 500的例子中,該期間的決定係數為0.347。
由於1.0表示高度相關,0.0表示無相關性,0.357表示蘋果股票價格波動與指數有一定的相關性。
蘋果上市於許多指數,因此你可以計算r2以確定其是否與其他指數的價格波動相對應。
需要考慮的一個方面是,r平方不會告訴分析師決定係數的值是本質上好還是壞。分析師需要自行評估這種相關性的意義以及它在未來趨勢分析中的應用。
如何解釋決定係數?
決定係數顯示一個依賴變量和一個獨立變量之間的相關性。也稱為r2(r平方),其值應該介於0.0和1.0之間。越接近0.0,依賴變量的相關性越低。越接近1.0,相關性越高。
回歸中的R平方告訴你什麼?
它告訴你兩個值之間是否存在依賴性以及一個值對另一個值的依賴程度。
如果決定係數大於1怎麼辦?
決定係數不能大於1,因為公式的結果總是介於0.0和1.0之間。如果大於或小於這些數字,則說明某些東西不正確。
總結
決定係數是一個比率,顯示一個變量對另一個變量的依賴程度。投資者用它來確定資產價格波動與其上市指數的相關性。
當資產的r2接近零時,表明其不受指數價格波動的依賴;如果其r2接近1.0,則表示其更依賴於指數的價格波動。