统计学及相关专业需要学习什么软件?

在回答这个问题之前,我们先来看一下另外两个问题:

1.统计及相关专业用软件主要做什么?

  • 整理数据
  • 用数据做图表
  • 简单统计分析、假设检验、方差分析
  • 统计模型
  • 数据挖掘
  • 机器学习算法
  • 深度学习
  • 大数据相关的机器学习和深度学习
  • 2.统计及相关专业主要有哪些相关的软件?

    以下五款是收费软件:

  • EXCEL:Excel也是统计软件?可能很多人有疑惑,但Excel的确可以做很多统计相关的事情。而且非常普及,方便沟通和展现
  • SPSS : 会统计分析软件,操作比较简单,跟Excel类似。有点类似“傻瓜相机”的感觉,深得广大 会统计相关同仁的喜爱。即便不用编程也能做出很多常见的统计图表、分析和模型
  • SPSS Modeler:“傻瓜式”的数据挖掘软件。即便不编程也能轻松实现数据挖掘的各流程和环节。之前叫Clementine
  • SAS:最早的商业统计分析软件,需要编程。数据处理既可以用SQL,也可以用data步。有自己独特的处理数据机制。一般的统计分析和模型都有专门的Proc过程支持,帮助文档非常详细。能处理比较大的数据量。在Python和R流行之前,Sas是标配。但即便Python和R非常流行,在银行业和医药行业Sas的地位也非常高
  • SAS EM:也是比较“傻瓜式”的数据挖掘软件,但整体而言比SPSS Modeler要灵活,它可以自己写代码生成模块整合进SAS EM原有模块中实现数据挖掘的整个流程
  • 以下五款是免费软件

    R:是用于统计分析、绘图的语言和操作环境。是属于GNU系统的一个自由、免费、源代码开放的软件。可以说R专门为统计学相关专业的同学准备的开源软件。现在在统计圈非常流程。统计相关的一些工作都有专门的包来处理:比如数据处理包有dplyr、作图相关的包有ggplot2

    PYTHON:是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell)。但目前因为其广泛的适应性和简便易学,已经成为人工智能和大数据标配的语言

    PySpark:PySpark 是 Spark 为 Python 开发者提供的 API。它可以基于Spark Mllib做分布式的机器学习相关模型的训练,因此可以基于大量数据实现机器学习算法

    TensorFlow:最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经 络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域是一个基于数据流编程(dataflow programming)的符 数学系统,被广泛应用于各类机器学习算法的编程实现。在该系统可以基于python编程来实现机器学习和深度学习各种模型的训练和部署。

    统计及模型

    3.我们到底该学习哪款软件呢?

    这个不能一概而论,主要由以下四点决定:

  • 数据量
  • 解决的问题
  • 编程的功底
  • 未来的职业规划
  • 根据四个因素简单罗列一下:

    a. 如果只需要做简单的数据处理、数据展示、统计分析、统计模型,又不想编程。那当然好是学EXCEL、SPSS。如果还想做一点数据挖掘相关的工作,也不想学习编程,那学习SPSS Modeler就可以

    b.如果是医学、银行类相关的企业,很多企业尤其是外企,无论是数据整理、分析、模型、数据挖掘等等,一般都明确要求SAS,所以最好能学SAS

    c.如果数据量不大,想尝试一下编程,想做数据整理、数据展示、模型、算法、机器学习甚至深度学习,那学习R是比较好的

    d.如果数据量比较大,如果对编程非常感兴趣,未来也想做机器学习、深度学习相关的项目,那么学好python是必须的。学好python之后可以学学PySpark和TensorFlow。

    以上是个人的一点浅见,有不同意见,欢迎批评指正。谢谢!

    声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

    上一篇 2019年11月23日
    下一篇 2019年11月24日

    相关推荐