关于 Pandas 系列的一些快速提示

我们假设我们有以下系列:

>>> import pandas as pd
>>> s = pd.Series([1, 4, 6, 3, 8, 7, 4, 5])
>>> s
0    1
1    4
2    6
3    3
4    8
5    7
6    4
7    5
dtype: int64

以下是一些简单的事情,当你使用 Series 时,它们会派上用场:

要得到 s 的长度:

>>> len(s)
8

要访问 s 中的元素:

>>> s[4]
8

要使用索引访问 s 中的元素:

>>> s.loc[2]
6

要访问 s 内的子系列:

>>> s[1:3]
1    4
2    6
dtype: int64

要获得值大于 5 的子系列:

>>> s[s > 5]
2    6
4    8
5    7
dtype: int64

要获得最小值,最大值,平均值和标准差:

>>> s.min()
1
>>> s.max()
8
>>> s.mean()
4.75
>>> s.std()
2.2519832529192065

要将 Series 类型转换为 float:

>>> s.astype(float)
0    1.0
1    4.0
2    6.0
3    3.0
4    8.0
5    7.0
6    4.0
7    5.0
dtype: float64

要将 s 中的值作为 numpy 数组获取:

>>> s.values
array([1, 4, 6, 3, 8, 7, 4, 5])

制作一份 s:

>>> d = s.copy()
>>> d
0    1
1    4
2    6
3    3
4    8
5    7
6    4
7    5
dtype: int64