在回答这个问题之前,我们先来看一下另外两个问题:
1.统计及相关专业用软件主要做什么?
2.统计及相关专业主要有哪些相关的软件?
以下五款是收费软件:
以下五款是免费软件:
R:是用于统计分析、绘图的语言和操作环境。是属于GNU系统的一个自由、免费、源代码开放的软件。可以说R专门为统计学相关专业的同学准备的开源软件。现在在统计圈非常流程。统计相关的一些工作都有专门的包来处理:比如数据处理包有dplyr、作图相关的包有ggplot2
PYTHON:是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell)。但目前因为其广泛的适应性和简便易学,已经成为人工智能和大数据标配的语言
PySpark:PySpark 是 Spark 为 Python 开发者提供的 API。它可以基于Spark Mllib做分布式的机器学习相关模型的训练,因此可以基于大量数据实现机器学习算法
TensorFlow:最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经 络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域是一个基于数据流编程(dataflow programming)的符 数学系统,被广泛应用于各类机器学习算法的编程实现。在该系统可以基于python编程来实现机器学习和深度学习各种模型的训练和部署。
统计及模型
3.我们到底该学习哪款软件呢?
这个不能一概而论,主要由以下四点决定:
根据四个因素简单罗列一下:
a. 如果只需要做简单的数据处理、数据展示、统计分析、统计模型,又不想编程。那当然好是学EXCEL、SPSS。如果还想做一点数据挖掘相关的工作,也不想学习编程,那学习SPSS Modeler就可以
b.如果是医学、银行类相关的企业,很多企业尤其是外企,无论是数据整理、分析、模型、数据挖掘等等,一般都明确要求SAS,所以最好能学SAS
c.如果数据量不大,想尝试一下编程,想做数据整理、数据展示、模型、算法、机器学习甚至深度学习,那学习R是比较好的
d.如果数据量比较大,如果对编程非常感兴趣,未来也想做机器学习、深度学习相关的项目,那么学好python是必须的。学好python之后可以学学PySpark和TensorFlow。
以上是个人的一点浅见,有不同意见,欢迎批评指正。谢谢!
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!