虽然数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据存储、数据管理、数据计算、数据分析、数据展示等几个方面。而SAS、R、SPSS、python、excel是被提到频率最高的数据分析工具。
Python
Python,是一种面向对象、解释型计算机程序设计语言。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。
常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。
R软件
R是一套完整的数据处理、计算和制图软件系统。它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。
SPSS
SPSS是世界上最早的统计分析软件,具有完整的数据输入、编辑、统计分析、报表、图形制作等功能,能够读取及输出多种格式的文件。
Excel
可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。
SAS软件
SAS把数据存取、管理、分析和展现有机地融为一体。提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。
Python
与用于创建自定义算法的编程方法不同,Python不是一种独特的软件,但它是很多数据科学家的首选。在最近数据科学网站KDnuggets对2052名用户进行的分析/数据科学软件调查中,Python被65.6%的受访者列为首选工具。
R
与Python类似,R是很多数据科学专业人员喜爱的另一种编程语言,它更加简单且更专注于数据科学。在KDnuggets调查中,R排名第三,48.5%的受访者将其列为首选数据科学工具之一。
Jupyter Notebook
从数据可视化和数据通信来看,很多数据科学团队的数据科学工具列表中还会有Jupyter Notebook。
Tableau
在硬数据科学团队和更多以业务为中心的分析人员之间,Tableau可提供良好的桥梁。
Keras
根据日立Vantara公司首席技术官办公室首席数据科学家Wei Lin表示,他最常用的数据科学工具是Python、R和Keras。他使用Python和R用于上述所有原因,而利用Keras的深度学习功能。
本回答被网友采纳