什麼是相關性(correlation)?
在財務與投資行業中,相關性是一種統計數據,衡量兩種證券之間的移動關係程度。相關性應用於高級投資組合管理中,計算出的相關係數的值必須在 -1.0 和 +1.0 之間。
關鍵要點
- 相關性是一種統計數據,衡量兩個變量之間的移動關係程度。
- 在財務領域中,相關性可以衡量一隻股票與基準指數(如 S&P 500 指數)的移動。
- 相關性與分散投資密切相關,分散投資的概念認為可以通過投資於未相關的資產來緩解某類風險。
- 相關性衡量的是關聯性,但不表明 x 會引起 y,或反之亦然,也可能是由第三因素引起的。
- 相關性最容易通過散佈圖來識別,特別是當變量之間存在非線性但仍然強相關時。
相關性告訴我們什麼
相關性顯示兩個變量之間的關係強度,並通過相關係數以數值形式表達。相關係數的值範圍在 -1.0 到 1.0 之間。
完美的正相關意味著相關係數正好為 1,這表示當一種證券上升或下降時,另一種證券以相同的方式同步移動。完美的負相關表示兩種資產以相反方向移動,而零相關則表示完全沒有線性關係。
例如,大型股共同基金通常與標準普爾(S&P)500 指數具有高度的正相關,約為接近 1。小型股則雖然對S&P有正相關,但相關係數並不那麼高,大約為 0.8。
然而,賣權期權的價格與其基礎股票價格通常具有負相關。賣權期權賦予持有人在特定時間範圍內以預定價格賣出特定數量基礎證券的權利而非義務。
當基礎股票價格下降時,賣權期權合約就會變得更加有利可圖。換句話說,隨著股票價格的上升,賣權期權的價格會下降,這是一種直接且高度的負相關。
如何計算相關性
有幾種方法可以計算相關性。最常用的方法是皮爾森積差相關,這在本文中進一步討論。皮爾森積差相關測量兩個變量之間的線性關係。它可以用於任何具有有限協方差矩陣的數據集。以下是計算相關性的步驟。
- 收集「x 變量」和「y 變量」的數據。
- 找出 x 變量的平均值和 y 變量的平均值。
- 將每個 x 變量值減去 x 變量的平均值,並對 y 變量做同樣的操作。
- 將每個 x 變量與 x 變量平均值之間的差異乘以對應的 y 變量與 y 變量平均值之間的差異。
- 對每個差異進行平方並求和。
- 求出第五步中的值的平方根。
- 將第四步中的值除以第六步中的值。
為避免複雜的手動計算,可以考慮使用 Excel 中的 CORREL 函數。
相關性的公式
使用皮爾森積差相關方法,可以用以下公式求得相關係數 r:
r = n × (∑(X,Y) – (∑(X) × ∑(Y))) / sqrt((n × ∑(X^2) – ∑(X)^2) × (n × ∑(Y^2) – ∑(Y)^2))
其中:
- r = 相關係數
- n = 觀察數目
相關性的例子
投資經理、交易員和分析師發現計算相關性非常重要,因為分散投資的風險減少效益依賴於此統計數據。財務電子表格和軟體可以快速計算相關性。
舉一個假設性的例子,假設一個分析師需要計算以下兩組數據的相關性:
X: (41, 19, 23, 40, 55, 57, 33)
Y: (94, 60, 74, 71, 82, 76, 61)
找到相關性共涉及三步。首先是將所有 X 值加起來求得 SUM(X),將所有 Y 值加起來求得 SUM(Y),並將每個 X 值與其對應的 Y 值相乘並求和得到 SUM(X,Y)。
SUM(X) = (41 + 19 + 23 + 40 + 55 + 57 + 33) = 268
SUM(Y) = (94 + 60 + 74 + 71 + 82 + 76 + 61) = 518
SUM(X,Y) = (41 x 94) + (19 x 60) + (23 x 74) + … (33 x 61) = 20,391
下一步是取每個 X 值,平方它並求和所有這些值以求得 SUM(x^2)。Y 值也要如此操作:
SUM(X^2) = (41^2) + (19^2) + (23^2) + … (33^2) = 11,534
SUM(Y^2) = (94^2) + (60^2) + (74^2) + … (61^2) = 39,174
注意到有七個觀察值 n,可以用以下公式求得相關係數 r:
r = n × (∑(X,Y) – (∑(X) × ∑(Y))) / sqrt((n × ∑(X^2) – ∑(X)^2) × (n × ∑(Y^2) – ∑(Y)^2))
在這個例子中,相關性將為:
r = (7 x 20,391 – (268 x 518) / sqrt((7 x 11,534 – 268^2) x (7 x 39,174 – 518^2)) = 3,913 / 7,248.4 = 0.54
相關性與投資組合分散
在投資中,相關性在多元化投資組合中的重要性最大。希望緩解風險的投資者可以通過投資於不相關的資產來達成目的。例如,假設一個投資者擁有航空公司股票。如果發現航空業與社交媒體行業的相關性很低,該投資者可能會選擇投資於社交媒體股票,因為這樣一個行業的負面影響可能不會影響另一個行業。
這通常是投資於不同資產類別時的考慮因素。股票、債券、貴金屬、房地產、加密貨幣、商品和其他類型的投資之間存在不同的關係。雖然有些可能高度相關,但其他作為分散風險對沖的投資可能不相關。
可以分散掉的風險叫做非系統性風險。這種類型的風險是特定於公司、行業或資產類別的。投資於不同的資產可以降低您的投資組合的相關性並減少暴露於非系統性風險。
特別考慮
相關性通常受其他統計考慮因素的支配和影響。當使用統計分析變量時,通常會引用相關性。
p值
在統計中,p值用來指示發現是否具有統計意義。可能可以確定兩個變量是相關的,但可能沒有足夠的支持證據來強烈聲明這一點。較高的 p 值表明有足夠的證據表明樣本相關係數與零不同。
散佈圖
視覺化識別兩個變量是否相關的最簡單方法是使用散佈圖來圖形顯示它們。散佈圖中的每個點代表一個樣本項。散佈圖的 x 軸表示被測試的變量之一,而散佈圖的 y 軸表示另一變量。
兩個變量的相關係數通常用線性線來圖形表示,顯示兩個變量之間的關係。如果兩個變量呈正相關,可能會在散佈圖上畫出一條上升的線性線。如果兩個變量呈負相關,則會畫出一條下降的線。資料點的關係越強,每個資料點越貼近這條線。
散佈圖在分析更複雜的、可能存在變動關係的數據時可能更有用。例如,兩個變量可能在某點之前有正相關關係,但其後的關係變成負相關。這種非線性關係使用公式可能更難識別,但在散佈圖上更容易看到。
最後,如果散佈圖包含密度陰影,散佈圖可以輕鬆地顯示相關性。密度陰影或密度橢圓是一個散佈圖上的陰影區域,視覺顯示散佈圖上數據點最密集的區域。如果變量是相關的,密度橢圓通常會與線性相關線的方向反映。否則,沒有明確方向的圓形密度橢圓表示相關性較低。
因果關係
統計中另一個內在困難是確定變量之間的關係是否由這些變量引起。考慮以下聲明:
「大多數籃球運動員都很高。因此,如果你打籃球,你就會變得高大。」
很顯然,上述聲明是不正確的。個子高並了解這一優勢的人可能會因為他們的自然身體能力最適合這項運動而向籃球運動靠攏。然而,因為身高和從事籃球活動可能呈正相關,統計學家和數據科學家必須意識到兩個變量之間的強關係可能是否由任一變量引起。
相關性的局限性
與其他統計分析方面類似,相關性可能會被誤解。小樣本大小可能會導致結果不可靠,即使看起來兩個變量之間相關性很強。同樣,小樣本大小也可能導致未相關的發現,即使兩個變量實際上是相關的。
如果存在一個異常值,相關性通常會被扭曲。相關性只顯示一個變量如何與另一個變量連接,可能無法明確識別單個實例或結果如何影響相關係數。
如果兩個變量之間的關係是非線性的,相關性也可能被誤解。識別正相關或負相關的兩個變量要容易得多。然而,兩個變量之間仍然可能存在更複雜的相關關係。
什麼是相關性?
相關性是一個統計術語,用來描述兩個變量的移動協同程度。如果兩個變量向相同方向移動,則這些變量被認為是正相關的。如果它們向相反方向移動,那麼它們是負相關的。
相關性在金融中的重要性
相關性在金融中非常重要,因為它們用來預測未來趨勢並管理投資組合中的風險。如今,可以使用各種軟體程序和網上服務輕鬆計算資產之間的相關性。相關性以及其他統計概念在衍生品和其他複雜金融工具的創建和定價中起著重要作用。
相關性的一個用例
相關性是現代金融中廣泛使用的概念。例如,一名交易員可能利用歷史相關性來預測某公司股票會因利率或商品價格變動而上升或下降。同樣,一名投資組合經理可能會通過確保其投資組合內的單個資產不會過度相關以減少風險。
高相關性更好嗎?
投資者可能對其投資組合中的相關性水平有不同偏好。一般而言,大多數投資者更喜歡低相關性,因為這可以減緩不同資產或證券在相似市場狀況下被影響的風險。然而,冒險型投資者或希望將資金投入特定類型行業或公司的投資者可能願意接受高相關性以換取更大的潛在收益。