根據列值遮蔽資料
這將是我們的示例資料框:
color name size
0 red rose big
1 blue violet small
2 red tulip small
3 blue harebell small
從資料框中訪問單個列,我們可以使用簡單的比較 ==
將列中的每個元素與給定變數進行比較,產生一個 True 和 False 的 pd.Series
df['size'] == 'small'
0 False
1 True
2 True
3 True
Name: size, dtype: bool
這個 pd.Series
是 np.array
的擴充套件,它是簡單的 list
的擴充套件。因此我們可以將它交給 __getitem__
或 []
訪問器,如上例所示。
size_small_mask = df['size'] == 'small'
df[size_small_mask]
color name size
1 blue violet small
2 red tulip small
3 blue harebell small