在刚刚过去的2018年,人工智能领域的大事件、新发现和新进展层出不穷。
BERT重磅发布,刷新了很多NLP的任务的最好性能;GAN相关研究论文持续增长,生成的照片达到了以假乱真的程度;Deepfakes发展神速,让许多政客和明星供大众娱乐了一番;强化学习也在与人类的对战游戏中独领风骚……
硬件方面,Nvidia一骑绝尘,Intel努力求变,定制硬件市场繁荣;
除此之外,自动驾驶、AI伦理等也是过去一年的讨论重点。
回顾2018展望2019,人工智能和机器学习将走向何方?
算法
毫无疑问,算法话语权由深度神经 络(DNN)主导。
当然,你可能会听说有人在这里或那里部署了一个“经典的”机器学习模型(比如梯度提升树或多臂老虎机),并声称这是每个人唯一需要的东西。有人宣称,深度学习正处于垂死挣扎中。甚至连顶级的研究人员也在质疑一些深度神经 络( DNN) 架构的效率和抗变换性。
但是,不管你喜欢与否,DNN无处不在: 自动驾驶汽车、自然语言系统、机器人——所有你能想到的皆是如此。
在自然语言处理、生成式对抗 络和深度增强学习中,DNN取得的飞跃尤为明显。
Deep NLP: BERT以及其他
尽管在2018年之前,文本使用DNN(比如word2vec、GLOVE和基于LSTM的模型)已经取得了一些突破,但缺少一个关键的概念元素:迁移学习。
也就是说,使用大量公开可用的数据对模型进行训练,然后根据你正在处理的特定数据集对其进行“微调”。在计算机视觉中,利用在著名的 ImageNet 数据集上发现的模式来解决特定的问题,通常是一种解决方案。
问题是,用于迁移学习的技巧并不能很好地应用于自然语言处理(NLP)问题。在某种意义上,像 word2vec 这样的预先训练的嵌入正在弥补这一点,但它们只能应用于单个单词级别,无法捕捉到语言的高级结构。

但最有趣的进步无疑是BERT的引入。通过让语言模型从英文维基百科的全部文章中进行学习,这个团队能够在11个 NLP 任务中取得最高水准的结果——这是一个壮举!更妙的是,它开源了。所以,你可以把这一突破应用到自己的研究问题上。
生成式对抗 络(GAN)的多面性
CPU的速度不会再呈现指数级的增长,但是生成式对抗 络(GAN)的学术论文数量肯定会继续增长。GAN多年来一直是学术界的宠儿。然而,其在现实生活中的应用似乎很少,而且这一点在2018年几乎没有改变。但是GAN仍然有着惊人的潜力等待着我们去实现。

目前出现了一种新的方法,即逐步增加生成式对抗 络: 使生成器在整个训练过程中逐步提高其输出的分辨率。很多令人印象深刻的论文都使用了这种方法,其中有一篇采用了风格转移技术来生成逼真的照片。有多逼真?你来告诉我:
这些照片中哪一张是真人?

这个问题有陷阱:以上皆不是。
然而,GAN是如何工作的,以及它为什么会起效呢?我们对此还缺乏深入的了解,但是我们正在采取一些重要的措施: 麻省理工学院的一个团队已经对这个问题进行了高质量的研究。
另一个有趣的进展是“对抗补丁“,从技术上来说它并非是一个生成式对抗 络。 它同时使用黑盒(基本上不考虑神经 络的内部状态)和白盒方法来制作一个“补丁”,可以骗过一个基于 CNN的分类器。 从而得出一个重要的结果:它引导我们更好地了解深度神经 络如何工作,以及我们距离获得人类级别的概念认知还有多远。

你能区分香蕉和烤面包机吗?人工智能仍然不能。
强化学习(RL)
在训练中,强化学习依赖于“奖励”信 ,即对其在最后一次尝试中表现的评分。电脑游戏提供了一个与现实生活相反的自然环境,让这种信 随时可用。因此,RL研究的所有注意力都放在了教 AI玩雅达利游戏上。
谈到它们的新发明 DeepMind,AlphaStar又成了新闻。这种新模式击败了星际争霸 II的顶级职业选手之一。星际争霸比国际象棋和围棋复杂得多,与大多数棋类游戏不同,星际争霸有巨大的动作空间和隐藏在玩家身上的重要信息。这次胜利对整个领域来说,都是一次非常重要的飞跃。
在RL这个领域,另一个重要角色OpenAI也没有闲着。让它们声名鹊起的是OpenAI Five,这个系统在2018年8月击败了Dota 2这个极其复杂的电子竞技游戏中99.95%的玩家。
尽管 OpenAI 已经对电脑游戏给予了很多关注,但是他们并没有忽视 RL 真正的潜在应用领域: 机器人。
在现实世界中,一个人能够给予机器人的反馈是非常稀少且昂贵的:在你的 R2-D2(电影中的虚拟机器人)尝试走出第一“步”时,你基本上需要一个人类保姆来照看它。你需要数以百万计的数据点。
为了弥合这一差距,最新的趋势是学会模拟一个环境,同时并行地运行大量场景以教授机器人基本技能,然后再转向现实世界。OpenAI和Google都在研究这种方法。
荣誉奖:Deepfakes
2018年1月发布的名为FakeApp的桌面应用程序,可以让所有拥有计算机科学知识的人和对此一无所知的人都能创建deepfakes。虽然它制作的视频很容易被人看出来是假的,但这项技术已经取得了长足的进步。

基础设施TensorFlow与PyTorch
目前,我们拥有很多深度学习框架。这个领域是广阔的,这种多样性表面上看是有意义的。但实际上,最近大多数人都在使用Tensorflow或PyTorch。如果你关心可靠性、易于部署性和模型重载等SREs 通常关心的问题,那么你可能会选择 Tensorflow。如果你正在写一篇研究论文,而且不在谷歌工作,那么你很可能使用PyTorch。
ML作为一种服务随处可见
今年,我们看到了更多的人工智能解决方案,它们被一个未获得斯坦福大学机器学习博士学位的软件工程师打包成一个供消费的 API。Google Cloud和Azure都改进了旧服务,并且增加了新服务。AWS机器学习服务列表开始看起来十分令人生畏。

天啊,AWS的服务很快就会多到需要两级目录层次结构来展示了。
尽管这种狂热现象已经冷却了一些,但还是有很多创业公司发出了挑战。每个人都承诺了模型训练的速度、推理过程中的易用性和惊人的模型性能。
只要输入你的信用卡信息,上传你的数据,给模型一些时间去训练或者微调,调用 REST (或者,给更有前瞻性的创业公司GraphQL)的 API,就可以成为人工智能方面的大师,甚至不需要搞清楚“随机失活(dropout)”是什么。
有了这么多的选择,为什么还有人会费心自己建造模型和基础设施呢?实际上,现成的 MLaaS 产品在80% 的实用案例中表现得非常好。如果你希望剩下的20% 也能正常工作,那就没那么幸运了: 你不仅不能真正地选择模型,甚至不能控制超参数。或者,如果你需要在云的舒适区之外的某个地方进行推断——一般情况下都做不到。这就是代价。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!