深度学习新手入门课

课程介绍

伴随人工智能时代的到来,越来越多的人开始关注深度学习,且希望能够入行深度学习,其中不乏一些行业小白、非计算机专业的人士。

本课程共包含三大部分:

第一部分(第1篇)带您初步认识深度学习,了解行业背景、优势、前景以及入行深度学习需要的一些准备工作,为那些准备入行的人答疑、解惑。

第二部分(第2-7篇)带您具体了解深度学习技术在不同行业的应用,并分享学习深度学习的经验,帮助大家找到研究方向。

第三部分(第8-11篇)熟悉深度学习的两种框架 Caffe 和 TensorFlow,通过简单的 Demo 引导大家开始深度学习实战。

课程内容

第01课:深度学习行业概述

目前,“深度学习”这一词已经变得越来越普及,生活中也是到处都充斥着这一词汇,同时也有越来越多的人开始想要从事这一行的相关工作,尝试着接触、了解这一行业。

当然,关于这一行业的相关介绍很多,也很杂乱,初学者往往很容易被各种各样的概念搞得很迷惑,即便是计算机从业者有时候也分不清很多涉及到深度学习的很多问题和概念。

这里我们先了解下深度学习的发展历程。

对于深度学习的框架,可以最早追溯到1980年福岛邦彦提出的新认知机,然而,受限于当时的计算能力,而且缺少有效的训练手段来解决其中涉及到的梯度消失的问题,因此,这一技术也就在20世纪90年代到21世纪初的时候遇到了寒冬期。而在此期间,SVM (支持向量机)处于统治地位,此外,还有随机森林、稀疏表示、判别分析等方法。

这个阶段的机器学习方法,主要是多种方法的集成,虽然在小规模样本上具有较好的性能,但是对于大规模样本却并没有表现出太好的优势。然而,大数据时代的到来,这些传统的机器学习方法难以满足数据处理、表达的新时代需求,不管是工业届还是学术届,都需要一种处理大规模数据的机器学习方法。

恰恰在这个时候,杰弗里·辛顿(Geoffrey Hinton)和鲁斯兰·萨拉赫丁诺夫(Ruslan Salakhutdinov)提出了一种在前馈神经 络中进行有效训练的算法,为深度学习方法带来了新的研究曙光,并在各个领域得到迅速的发展,尤其是在自然语言处理、计算机视觉和语音识别中,成为各种领先系统的一部分。

接下来,我们看下深度学习发展中的大事件。

  • 2007年,杰弗里·辛顿(Geoffrey Hinton)和鲁斯兰·萨拉赫丁诺夫(Ruslan Salakhutdinov)提出了一种在前馈神经 络中进行有效训练的算法;
  • 2009年,在 ICDAR 2009举办的连笔手写识别竞赛中,在没有任何先验知识的情况下,深度多维长短期记忆神经 络取得了其中三场比赛的胜利;
  • 2010年,在于尔根·施密德胡伯位于瑞士人工智能实验室 IDSIA 的研究组中,丹·奇雷尚(Dan Ciresan)和他的同事展示了利用 GPU 直接执行反向传播算法而忽视梯度消失问题的存在。这一方法在燕乐存等人给出的手写识别 MNIST 数据集上战胜了已有的其他方法;
  • 2011年,前馈神经 络深度学习中最新的方法是交替使用卷积层(Convolutional Layers)和最大值池化层(Max-pooling Layers)并加入单纯的分类层作为顶端。训练过程也无需引入无监督的预训练。从2011年起,这一方法的 GPU 实现多次赢得了各类模式识别竞赛的胜利,包括 IJCNN 2011交通标志识别竞赛和其他比赛;
  • 2011年,语音识别领域凭借深度学习取得重大突破;
  • 2012年,AlexNet,一个8层的神经 络,以超越第二名10个百分点的成绩在 ImageNet 竞赛中夺冠(图像分类的 Top5 错误率为16.4%),深度学习终迎来包括学术探索与工业应用中的热潮。不断提升的层数逐步提升计算机分类视觉的准确率;
  • 2013年,Zfnet,获得 ILSVRC 冠军;
  • 2014年,VGGNet、GoogleNet、DeepFace、RCNN,在分类、人脸识别、目标检测等领域取得优异的性能;
  • 2015年,夺冠的 ResNet 深达152层,以3.57%的错误率超越人类视觉的5.1%;
  • 2016年-至今,Fast-Rcnn、Faster-Rcnn、Yolo、SSD 等目标检测算法突破。
  • 2016年,AlphaGo 击败人类。

目前,深度学习技术已经在图像、语音、自然语言、推荐算法等这些常见的领域中,得到重大突破,并且已经服务于我们的日常生产、生活中。比如:安防领域的人脸识别、ADAS 系统中目标检测与跟踪、OCR 识别、语音识别与合成、文本情感分析、主题挖掘等等。

谈了这么多深度学习的历程,那到底什么是深度学习呢实,关于深度学习的解释非常多,总结来说,它是一种具有多层结构的神经 络算法,属于机器学习算法一种,而机器学习则是实现 AI 的一种技术手段。换言之,深度学习对于人工智能技术的发展具有重大意义。我们看一下,如下图所示的深度学习结构:

深度学习与人工智能的关系

1956年,在达特茅斯会议(Dartmouth Conferences)上,计算机科学家首次提出了“AI”术语,AI 由此诞生,在随后的日子里,AI 成为实验室的“幻想对象”。几十年过去了,人们对 AI 的看法不断改变,有时会认为 AI 是预兆,是未来人类文明的关键,有时认为它只是技术垃圾,只是一个轻率的概念,野心过大,注定要失败。直到今天,深度学习技术的发展,才使得 AI 变得越来越可能。

美国每年新增人工智能企业数占当年全球新增人工智能企业总数的比例一直在下降,2000年时这一比例为45%,2016年时下降至26%。而中国每年新增人工智能企业数占全球当年新增企业总数的比例保持上升趋势,2015年达到近17年来的最高值,超过25%。近五年来看,美国新增人工智能企业数占全国人工智能总数的59.38%,中国新增人工智能企业数占全国人工智能总数则为72.71%。在人工智能专利数上,最近五年,中国专利数平均每年增速为43%,美国增数为21.7%。透过这三组数据,可以看到中国近年来在人工智能上发展迅猛。

下图,给出了2017年,人工智能公司的排名,当然,此排名可能存在一些不准确的情况,仅供参考。

那计算机视觉和人工智能是什么关系呢/strong> 它属于人工智能的一个子领域,主要关注于图像信 数据的处理、理解和分析。因此,我们在研究计算机视觉技术的时候,会发现计算机视觉的理念在某些方面其实与很多概念有部分重叠,包括:人工智能、数字图像处理、机器学习、深度学习、模式识别、概率图模型、科学计算以及一系列的数学计算等。

还有一个概念经常会和计算机视觉搞混淆,那就是机器视觉。 很多人在开始接触到这两个概念的时候会简单的认为计算机也属于机器的一种,因此,计算机视觉就是机器视觉的一个方面。当然,这样认为也不是完全有错误,只是会显得有些局限。计算机视觉研究的是人眼的仿真,而机器视觉则侧重于为工业中的制造业提供更多有利于提高产品质量和提高生产效率的支持。我们强调机器视觉、计算机视觉和图像处理不是同义的。它们其中之一都不是任何其他两个的子集。计算机视觉是计算机科学的一个分支,而机器视觉是系统工程一个特殊领域。

深度学习属于机器学习的一种,对于大数据背景下的计算机视觉任务,尤其在检测、分类、识别等任务上,都表现出难以匹配的优势。尤其,目前越来越多的深度学习芯片的生产和制造,也确保了深度学习技术,在计算机视觉任务中的核心地位。接下来,我们看一下深度学习在计算机视觉任务中有哪些重要的应用领域。

1.深度学习在安防领域的重要应用。

利用计算机视觉技术来完成安防领域的解决方案,这是大多数视觉公司都会选择切入的一个领域,涉及到的企业包括海康威视、商汤科技、依图科技、Face++,甚至互联 公司百度、腾讯、阿里巴巴等。其中,一个重要的应用就是人脸识别技术,自2014年的 DeepFace 开始至今,深度学习的方法在该领域几乎达到垄断地位。而人脸识别技术,在安检、反恐等安防领域有着重要的意义。当然,除去人脸识别,近几年也开始研究从行人的角度出发的 ReID 技术,利用深度学习来进行人的检测、并刻画目标的特征,为后续的跟踪、异常行为分析提供有效的支撑。

3.深度学习在智能家居领域的重要应用。

传统的智能家居产品更多的是采用手机端结合蓝牙或者 WiFi 等通信手段来完成对家居的控制和使用。虽然此类解决方案能够实现一定程度上的家居智能,但是我们会依然觉得,智能化的程度依然不够。而深度学习的方法,则对于智能家居的发展起到了重要的作用。除了语音识别、语音合成以外,另一个重要的点就是利用视觉技术进行人机交互,比如:手势识别等。

5.深度学习在 OCR 领域的重要应用。

除了教育会涉及到文字检测与识别,在一些诸如:简历的识别、文档的识别、身份证识别等等领域,同样会存在一些关于图片中文字的内容理解和分析的部分,而对于这也任务而言,同样深度学习是一种更优的选择。此类问题,其实可以直接概括为自然场景下的文本检测和识别任务。

7.深度学习在医疗影像数据中的应用。

深度学习在医疗健康领域的机遇主要有七大方向:一是提供临床诊断辅助系统等医疗服务,应用于早期筛查、诊断、康复、手术风险评估场景;二是医疗机构的信息化,通过数据分析,帮助医疗机构提升运营效率;三是进行医学影像识别,帮助医生更快更准地读取病人的影像所见;四是利用医疗大数据,助力医疗机构大数据可视化及数据价值提升;五是在药企研发领域,解决药品研发周期长、成本高的问题;六是健康管理服务,通过包括可穿戴设备在内的手段,监测用户个人健康数据,预测和管控疾病风险;七是在基因测序领域,将深度学习用于分析基因数据,推进精准医疗。而医学影像是医生判断疾病的一个重要手段,放射科、病理科等擅长读图的医生增长率和诊断效率急需提升,成为很多医疗机构的心病。目前,在人类医学专家的帮助下,国内外研究团队已经在心血管、肿瘤、神内、五官等领域建立了多个精准深度学习医学辅助诊断模型,取得了良好的进展。其中,依图科技则在深度学习医疗领域取得了不错的成绩。

9.深度学习在 Fashion 领域的探索。

目前,阿里巴巴携手香港理工举办了 FashionAI 的比赛,旨在探索如果通过机器学习的方法来完成关于流行趋势的分析和预测。而深度学习无疑会成为众多方法中的宠儿。其中涉及到了服装关键点检测和定位,服装分类等等问题。

当然,除上述领域外,深度学习在其他的很多领域都有着重要的应用,比如:车牌识别、图像质量恢复、自动图像描述等等。总之,深度学习技术对于众多的计算机视觉任务而言,已经逐步占据了统治地位,作为一个计算机视觉从业者,它也成为了大家的基本技能。至于原因,大家可以看一下《为什么深度学习几乎成了计算机视觉研究的标配这篇文章,这里不再赘述。

第03课:深度学习在语音技术领域的应用
第04课:深度学习在自然语言处理行业中的应用
第05课:如何入行深度学习
第06课:怎样选择一个合适自己的深度学习研究方向/strong>
第07课:针对自己的研究方向,如何展开调研、学习和实验/strong>
第08课:动手实战之基于 Caffe 的深度学习环境了解和搭建
第09课:动手实战之基于 Caffe 的分类识别任务
第10课:动手实战之基于 TensorFlow 的深度学习环境了解和搭建
第11课:动手实战之基于 TensorFlow 的分类识别任务

阅读全文: http://gitbook.cn/gitchat/column/5afb8f050fe11d2f8ffc79a8

相关资源:Ztrans丹诚软件Z39.50客户端-其它工具类资源-CSDN文库

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2018年4月13日
下一篇 2018年4月14日

相关推荐