Dataframes 各種摘要統計
import pandas as pd
df = pd.DataFrame(np.random.randn(5, 5), columns=list('ABCDE'))
生成各種摘要統計資訊。對於數值,非 NA /空值(count
),平均值(mean
),標準差 std
的數量和稱為五個數字摘要的值 :
min
:最小(最小觀察)25%
:下四分位數或第一四分位數(Q1)50%
:中位數(中間值,Q2)75%
:上四分位數或第三四分位數(Q3)max
:最大(最大觀察)
>>> df.describe()
A B C D E
count 5.000000 5.000000 5.000000 5.000000 5.000000
mean -0.456917 -0.278666 0.334173 0.863089 0.211153
std 0.925617 1.091155 1.024567 1.238668 1.495219
min -1.494346 -2.031457 -0.336471 -0.821447 -2.106488
25% -1.143098 -0.407362 -0.246228 -0.087088 -0.082451
50% -0.536503 -0.163950 -0.004099 1.509749 0.313918
75% 0.092630 0.381407 0.120137 1.822794 1.060268
max 0.796729 0.828034 2.137527 1.891436 1.870520