關於 Pandas 系列的一些快速提示
我們假設我們有以下系列:
>>> import pandas as pd
>>> s = pd.Series([1, 4, 6, 3, 8, 7, 4, 5])
>>> s
0 1
1 4
2 6
3 3
4 8
5 7
6 4
7 5
dtype: int64
以下是一些簡單的事情,當你使用 Series 時,它們會派上用場:
要得到 s 的長度:
>>> len(s)
8
要訪問 s 中的元素:
>>> s[4]
8
要使用索引訪問 s 中的元素:
>>> s.loc[2]
6
要訪問 s 內的子系列:
>>> s[1:3]
1 4
2 6
dtype: int64
要獲得值大於 5 的子系列:
>>> s[s > 5]
2 6
4 8
5 7
dtype: int64
要獲得最小值,最大值,平均值和標準差:
>>> s.min()
1
>>> s.max()
8
>>> s.mean()
4.75
>>> s.std()
2.2519832529192065
要將 Series 型別轉換為 float:
>>> s.astype(float)
0 1.0
1 4.0
2 6.0
3 3.0
4 8.0
5 7.0
6 4.0
7 5.0
dtype: float64
要將 s 中的值作為 numpy 陣列獲取:
>>> s.values
array([1, 4, 6, 3, 8, 7, 4, 5])
製作一份 s:
>>> d = s.copy()
>>> d
0 1
1 4
2 6
3 3
4 8
5 7
6 4
7 5
dtype: int64