根據列值遮蔽資料

這將是我們的示例資料框:

  color      name   size
0   red      rose    big
1  blue    violet  small
2   red     tulip  small
3  blue  harebell  small

從資料框中訪問單個列,我們可以使用簡單的比較 == 將列中的每個元素與給定變數進行比較,產生一個 True 和 False 的 pd.Series

df['size'] == 'small'
0    False
1     True
2     True
3     True
Name: size, dtype: bool

這個 pd.Seriesnp.array 的擴充套件,它是簡單的 list 的擴充套件。因此我們可以將它交給 __getitem__[] 訪問器,如上例所示。

size_small_mask = df['size'] == 'small'
df[size_small_mask]
  color      name   size
1  blue    violet  small
2   red     tulip  small
3  blue  harebell  small