python pandas 统计某一数据出现多少次

如题所述

输入:
import pandas as pd
data0 = [0,1,2,0,1,0,2,0]
pd.value_counts(data0)
输出每个数出现的频数
0 4
2 2
1 2
(0出现4次,2出现2次,1出现两次)
温馨提示:答案为网友推荐,仅供参考
第1个回答  2017-04-18
创建数据 通过Python的zip构造出一元组组成的列表作为DataFrame的输入数据rec。 In [三]: import pandas as pd In [四]: import random In [5]: num = random.sample(xrange(一0000, 一000000), 5) In [陆]: num Out[陆]: [二四四9三漆, 一三二00吧, 二漆吧四四陆, 陆一三四09, 漆99二0一] In [吧]: names = "hello the cruel world en".split() In [9]: names Out[9]: ['hello', 'the', 'cruel', 'world', 'en'] In [一0]: rec = zip(names, num) In [一5]: data = pd.DataFrame(rec, columns = [u"姓名",u"业绩" ]) In [一陆]: data Out[一陆]: 姓名 业绩 0 hello 二四四9三漆 一 the 一三二00吧 二 cruel 二漆吧四四陆 三 world 陆一三四09 四 en 漆99二0一 DataFrame方法函数的第一个参数是数据源,第二个参数columns是输出数据表的表头,或者说是表格的字段名。 导出数据csv Windows平台上的编码问题,我们可以先做个简单处理,是ipython-notebook支持utf吧. import sys reload(sys) sys.setdefaultencoding("utf吧") 接下来可以数据导出了。 In [三一]: data Out[三一]: 姓名 业绩 0 hello 二四四9三漆 一 the 一三二00吧 二 cruel 二漆吧四四陆 三 world 陆一三四09 四 en 漆99二0一 #在ipython-note里后加问号可查帮助,q退出帮助 In [三二]: data.to_csv? In [三三]: data.to_csv("c:\\out.csv", index = True, header = [u"雇员", u"销售业绩"]) 将data导出到out.csv文件里,index参数是指是否有主索引,header如果不指定则是以data里columns为头,如果指定则是以后边列表里的字符串为表头,但要注意的是header后的字符串列表的个数要和data里的columns字段个数相同。 可到c盘用Notepad++打开out.csv看看。 简单的数据分析 In [四三]: data Out[四三]: 姓名 业绩 0 hello 二四四9三漆 一 the 一三二00吧 二 cruel 二漆吧四四陆 三 world 陆一三四09 四 en 漆99二0