最近有一位小伙伴问我,做数据岗该学习哪些软件,我想了想扔给他33个软件
数据分析工具类软件,大体可以分为以下5类:
Excel生态工具、数理统计工具、BI工具、数据库工具、编程工具
(Excel单独分成一类,主要是因为它应用场景广泛,且用户基数过于庞大,甚至超过其他所有工具用户之和)
每个类别的代表工具分别有:
「Excel生态」:Excel、VBA、PowerQuery、PowerPivot、Power View、Power Map
「数理统计工具」:SAS、SPSS、Stata、Minitab、Eviews、Statistica、MATLAB、Mathematica
「BI工具」:PowerBI、Tableau、Qlikview、SAP BI、Oracel BI、FineBI、Yonghong BI
「数据库工具」:MySQL、PostgreSQL、Oracle、SQLServer、MongoDB、Hive
「编程工具」:Python、R、Julia、Scala、Spark、Java、Hadoop
1、Excel
无需多言,几乎人人都在用的数据处理软件,由微软开发,是office三剑客之一。
虽然excel很容易入手,但大部分人对excel的使用程度还处在入门阶段,存取数据、做做表。
其实excel可以制作复杂的 表、模型、应用、系统,比如构建金融分析模型。
大家学习excel,可以从基本界面、导入导出、公式&函数、筛选排序、数据格式、可视化图表、数据透视表、数据模型、工作协作这几个方面入手,最好是按照官 文档指导,配合实践,一般进步会很快。
2、VBA
Excel里的编程语言,通俗理解为宏,自动化地执行一些操作。Office 软件提供丰富的功能接口,VBA 可以调用它们,实现自定义的需求。
VBA最大的作用是自动化、批量化、智能化地操作Excel,被广泛应用于数据分析处理、数据建模、 表开发、应用开发等,在金融、审计、财务等行业非常流行。
3、PowerQuery
一种嵌入Excel Microsoft 产品的技术,旨在帮助你塑造数据。在Excel,选择功能区上的”数据”选项卡,查看”获取&转换数据和查询”&连接”组。
从各种数据源导入和刷新数据后,可以在分步转换中调整数据,逐步创建唯一的表格形状以满足数据分析需求。
4、PowerPivot
一种数据建模技术,用于创建数据模型,建立关系,以及创建计算。可使用 PowerPivot 处理大型数据集,构建广泛的关系,以及创建复杂(或简单)的计算,这些操作全部在高性能环境中和所你熟悉的 Excel 内执行。
5、Power View
一种数据可视化技术,用于创建交互式图表、图形、地图和其他视觉效果,以便直观呈现数据。Power View 在 Excel、BI SharePoint、SQL Server 和 Power BI 中均可用。
6、Power Map
一种三维 (三维) 数据可视化工具,可用于以新方式查看信息。通过电源图,可发现传统二维表格和图表中 (二维) 见解。
使用 Power Map ,可以在三维地球或自定义地图上绘制地理和时态数据,显示这些数据,并创建可以与其他人分享的视觉浏览
数理统计工具
这类工具偏专业数学统计分析,可以做数据挖掘、数据建模、系统搭建等工作,适合学术和大型商业公司。
下图是Gartner统计的BI工具实力榜:
21、MySQL
最流行数据库之一,国内互联 公司最喜欢的数据库,我愿称之为必学。
MySQL在过去由于性能高、成本低、可靠性好,已经成为最流行的开源数据库,因此被广泛地应用在Internet上的中小型 站中。
随着MySQL的不断成熟,它也逐渐用于更多大规模 站和应用,比如维基百科、Google和Facebook等 站。非常流行的开源软件组合LAMP中的“M”指的就是MySQL。
22、PostgreSQL
最强大且最具潜力的数据库之一,开源免费,分析能力强,稳定可靠,支持广泛。在很多方面都比MySQL强,如复杂SQL的执行、存储过程、触发器、索引。我愿称之为最强。
23、Oracle
老牌企业,最稳定的数据库之一。大部分银行、证券、电信等行业都在使用Oracle,因为其商业化程度高、功能强大且稳定,所以备受世界500强欢迎。
24、SQLServer
微软公司数据库产品,windows系统上最强王者。具有易用性、适合分布式组织的可伸缩性、用于决策支持的数据仓库功能、与许多其他服务器软件紧密关联的集成性、良好的性价比等。
25、MongoDB
一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。
MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。
26、Hive
Hadoop大数据生态的数据查询工具,一个用来开发SQL类型脚本来执行MapReduce操作的平台,当前在互联 公司应用非常广泛。
具体来说,Hive是一个数据仓库基础设施工具,用于处理Hadoop中的结构化数据。它位于Hadoop的顶部,用于汇总大数据,并使查询和分析变得轻松。
编程工具
除了上述的数据分析软件外,编程用于数据分析也是大趋势。越来越多的数据分析师通过Python、R等进行数据建模、可视化,而且编程语言快速、灵活、复用性强的特点也适合数据处理分析。
文章知识点与官方知识档案匹配,可进一步学习相关知识MySQL入门技能树数据库组成表31292 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!