Dataframes 各种摘要统计
import pandas as pd
df = pd.DataFrame(np.random.randn(5, 5), columns=list('ABCDE'))
生成各种摘要统计信息。对于数值,非 NA /空值(count
),平均值(mean
),标准差 std
的数量和称为五个数字摘要的值 :
min
:最小(最小观察)25%
:下四分位数或第一四分位数(Q1)50%
:中位数(中间值,Q2)75%
:上四分位数或第三四分位数(Q3)max
:最大(最大观察)
>>> df.describe()
A B C D E
count 5.000000 5.000000 5.000000 5.000000 5.000000
mean -0.456917 -0.278666 0.334173 0.863089 0.211153
std 0.925617 1.091155 1.024567 1.238668 1.495219
min -1.494346 -2.031457 -0.336471 -0.821447 -2.106488
25% -1.143098 -0.407362 -0.246228 -0.087088 -0.082451
50% -0.536503 -0.163950 -0.004099 1.509749 0.313918
75% 0.092630 0.381407 0.120137 1.822794 1.060268
max 0.796729 0.828034 2.137527 1.891436 1.870520