原标题:Python数据科学实践 | 初步搭建数据科学工作环境
关注我们
随着信息技术的成熟,不在的信息感知和采集终端使中的各项活动以多种丰富多彩的形式被当做数据收集整合。数据,已经渗透到当今每领域,并且正以难以想象的惊度不断膨胀。否认,在的现代 会,“据”时代已经悄然降临。
由于其在多个和学科领域中的渗透,并且在不同专业领域的数据研究中表现出融合的趋势,据已经成为包含计算机科学和统计学在内的多个学科领域的新研究。同时,由于在据的研究尚且存在诸多误区,迫切地需要对“据”时代的新现象、 理论、、技术、和实践进统的研究。因“数据科学”应运。
为了全解数据科学的状况,2017年kaggle(互联最著名的数据科学竞赛平台之进全调查。从超过16,000名从业者的详尽答卷中,对于业内的发展趋势,我们能够窥得。调查数据表明,在众多数据科学和机器学习的分析中,Python是数据科学家们最常语
图2 同时使ython和R的数据科学家认为应该选择的数据科学排名
看到这你了吗否想学习Python好拳脚,毕竟苦短,你需要Python。这是悄悄告诉你,数据科学家不是简单的使语在的数据科学环境中,利数据思维实现数据科学实践的过程。所以,在进ython的学习之前,咱们最紧要的事情是构建能够让数据科学家轻松的数据科学环境。在这个环境中,你可以轻松使种数据科学的,让你畅游其中“”。这就是下介绍的Anaconda数据科学套件。
1
Anaconda——善其事,必先利其器
1
Anaconda功能简介
确定将Python作为数据科学的之后,我们当然可以选择下载官Python使但Python令疼的环境问题以及多种需要安装的包通常会成为初学者的阻碍。
不少初学者在Python的安装阶段就被纷来的 错信息搞得头麻,即使最终靠着上诸位“”的指示,踩着前过的脚印稀涂地解决问题,也不免会费上好, 多弯路。原本的学习热情也因此冷却了,到时候这本书的名字就真是“Python从到放弃”了。
此时,Anaconda数据科学套件的出现,可谓是初学者的“福。
所谓“Anaconda套件”,通俗来讲是打包的集合,预装好了conda、某个版本的python、众多packages以及科学计算等,所以也称为Python的发。由于包含的内容丰富,因此Anaconda对存储空间有的要求。间有限的,可以选择Miniconda,它只包含最基本的内容——python与conda,以及相关的必需依赖项。
图4 Anaconda官logan截图
Anaconda 称是最受欢迎的Python和R数据分析集成环境。它通过对虚拟环境、包、 Python版本的管理,简化了我们的流程。同时,Anaconda也是适企业级据 分析的Python。它所包含的多个数据科学相关的开源包覆盖了数据可视化、机器学 习、深度学习等多个。
以蔽之,选择Anaconda数据科学套件将会是你“”Python的良好开端。
2
Anaconda的下载和安装
下载Anaconda最简单直接的当然是去官
官提供了Windows、Mac、Linux三种系统下的Anaconda安装包,并且对每个系统都提供 了分别对应Python3.7和Python2.7的两个版本。此处推荐安装对应Python3.7的版本,毕竟官 经宣布2.7的版本只会维护到2020年。不过在后们也会介绍,安装哪个版本在本质上并没有太区别,因为通过环境管理,我们可以很地切换运的Python版本。
图6 清华开源软件镜像站anaconda下载界图
下载好安装包之后,安装的过程按照提示和说明完成即可。值得注意的是,在安装路径的选择 中,请确保你的路径中不包含中空格或其他语常符。否则谁也不能保证你在后续 的使不会被坑得晕头转向。
Windows系统下的安装除了需要选择安装路径外,还有两个需要额外确认的地
● 是否要将Anaconda添加到PATH环境变量中/p>
● 是否要将下载的Anaconda中对应的Python版本设置为默认版本/p>
图8 Windows系统下Anaconda安装结果测试截图
成功安装后会在【开始】菜单中发现Anaconda的夹,下拉后有应
Anaconda Cloud:管理公共或者私有python、jupyter notebook、conda、环境和 packages的地可以分享和追踪。
Anaconda Navigtor:管理包和环境的可视化GUI(Graphical User Interface,简 称 GUI,图形界,后续涉及的众多管理命令也可以在 Navigator 中实现。
Anaconda Prompt: 也被称为终端,管理包和环境的命令可以便捷的 操作conda环境。
IPython : Python 的交互式 shell,认的Python Shell 好多,变量补 全,缩进,bash shell 命令,内置了许多很有功能和函数。
Jupyter Qtconsole:调互式命令台,在很度上感觉像终端,但提供了许多 只能在GUI中使增强功能,例如内联图形,带语法的正确多辑,图形化提示 等等。可以看作IPython的加强版。
Spyder:使ython语开放源代码的科学运算集成开发环境。Spyder可以跨平 台,也可以使加组件扩充,交互式以处理数据。
对Mac的来说,安装成功后在【Launchpad】中会出现Anaconda Navigtor的图标,Mac系统的终端即可Anaconda Prompt,打开终端,同样输onda命令测试安装 结果。
述提到的多个在Windows【开始】菜单中出现的其他应可以选择打开Anaconda Navigtor,在其中点击进或者在终端中输应的应称命令打开应
图10 Anaconda Navigtor环境及包管理界/p>
据上图能够看出,Navigtor对于环境管理和包的管理直观简洁,点击相应位置即可完 成环境及包的搜索、创建、删除、更新等系列操作,因此处不对此进细说明。值 得的是,Navigtor除了提供环境和包管理功能外,其中的学习和 区版块也给我们提供了 很多的学习和互动资源,有兴趣的伴们不妨探索,或许能有意外的收获。

图11 Anaconda Navigtor学习版块界/p>
好了,今天就讲到这接下我们争取每利ython完成数据科学的学习。
“
PS:作业下载安装Anaconda到你的电脑,并测试安装成功。启动Navigtor,并新建一个自己的数据科学环境名字为MyDS。
今天就讲到这里,后续再继续深入,希望大家把Python练习起来。
文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树首页概览210289 人正在系统学习中 相关资源:Veneer:文件屏蔽软件-开源-其它代码类资源-CSDN文库
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!