关于 Pandas 系列的一些快速提示
我们假设我们有以下系列:
>>> import pandas as pd
>>> s = pd.Series([1, 4, 6, 3, 8, 7, 4, 5])
>>> s
0 1
1 4
2 6
3 3
4 8
5 7
6 4
7 5
dtype: int64
以下是一些简单的事情,当你使用 Series 时,它们会派上用场:
要得到 s 的长度:
>>> len(s)
8
要访问 s 中的元素:
>>> s[4]
8
要使用索引访问 s 中的元素:
>>> s.loc[2]
6
要访问 s 内的子系列:
>>> s[1:3]
1 4
2 6
dtype: int64
要获得值大于 5 的子系列:
>>> s[s > 5]
2 6
4 8
5 7
dtype: int64
要获得最小值,最大值,平均值和标准差:
>>> s.min()
1
>>> s.max()
8
>>> s.mean()
4.75
>>> s.std()
2.2519832529192065
要将 Series 类型转换为 float:
>>> s.astype(float)
0 1.0
1 4.0
2 6.0
3 3.0
4 8.0
5 7.0
6 4.0
7 5.0
dtype: float64
要将 s 中的值作为 numpy 数组获取:
>>> s.values
array([1, 4, 6, 3, 8, 7, 4, 5])
制作一份 s:
>>> d = s.copy()
>>> d
0 1
1 4
2 6
3 3
4 8
5 7
6 4
7 5
dtype: int64