假设有这么一个DataFrame数据:有两列,name列为姓名,age列为年龄,其中年龄为随机生成,如下图:
我们可以使用loc来得到age>20的行:
data.loc[条件]
其中条件为data['age']>20
即:data.loc[data['age']>20]
这样就会得到age>20的所有行数据(包括所有列)。
如果我们并不需要所有所有列,那可以再指定要保留的列:
data.loc[data['age']>20,'name']
这样就会得到age>20的所有行的数据(只包括name列)。
统计数据表格中‘状态’列中有哪几类状态,每个状态出现了多少次上述代码段 aggfunc='count',表示对状态列中出现的每个值计数。