查詢列之間的相關性
假設你有一個數值的 DataFrame,例如:
df = pd.DataFrame(np.random.randn(1000, 3), columns=['a', 'b', 'c'])
然後
>>> df.corr()
a b c
a 1.000000 0.018602 0.038098
b 0.018602 1.000000 -0.014245
c 0.038098 -0.014245 1.000000
將找到列之間的 Pearson 相關性 。注意對角線是如何 1 的,因為每列(顯然)與自身完全相關。
pd.DataFrame.correlation
採用可選的 method
引數,指定要使用的演算法。預設為 pearson
。例如,要使用 Spearman 相關,請使用
>>> df.corr(method='spearman')
a b c
a 1.000000 0.007744 0.037209
b 0.007744 1.000000 -0.011823
c 0.037209 -0.011823 1.000000