10个深度学习软件
如今您似乎无所不在,您会发现一篇文章,描述了在数据科学问题(或更具体地讲,在人工智能(AI)领域)中使用深度学习获得成功的策略。 但是,对深度学习的清晰解释,为何如此强大以及深度学习在实践中采用的各种形式并不容易。
为了进一步了解深度学习,神经 络,重大创新,使用最广泛的范例(深度学习在哪些地方有用,什么没用,甚至只是历史的一部分),我们提出并回答了一些基本问题。
[ 也在InfoWorld上:今天的人工智能:什么是炒作,什么是真实的 ]
到底什么是深度学习/span>
深度学习是传统神经 络的现代发展。 确实,在经典的前馈,全连接,反向传播训练的多层感知器(MLP)中,已经添加了“更深”的体系结构。 更深层意味着更多的隐藏层和一些新的附加神经范例,例如在递归 络和卷积 络中。
深度学习和神经 络之间有什么区别/span>
没有区别。 深度学习 络是神经 络,其架构比1990年代可能训练的更为复杂。 例如, Hochreiter和Schmidhuber于1997年在循环神经 络(RNN)中引入了长短期记忆(LSTM)单元,但由于需要较长的计算时间和大量的计算资源,因此从未被广泛采用。 具有不只一个隐藏层的多层感知器也已经存在了很长时间,其好处是显而易见的。 主要区别在于现代计算资源已使其实现可行。
深度学习主要是关于更快,更强大的计算资源吗/span>
通常,更快,更强大的计算资源已允许实现和试验更强大,更有前途的神经体系结构。 显然,花几天的时间在 络培训上无法与在GPU加速的帮助下在同一 络上花费的几分钟相匹敌。
什么是引发深度学习普及的突破性项目/span>
最大的突破是在2012年,当时基于深度学习的AlexNet 络以前所未有的优势赢得了ImageNet挑战。 AlexNet的前五位错误率为15%,而次优的竞争对手则为26%。 这次胜利开启了深度学习 络的热潮,如今,最佳模型的错误率低于3%。
如果您认为人为错误率在5%左右,那就尤其令人印象深刻。
是什么使深度学习如此强大/span>
总之,灵活性。 一方面,神经 络是通用函数逼近器,这是明智的说法,可以说只要使神经 络足够复杂,就可以使用神经 络近似任何东西。 另一方面,您可以使用训练有素的 络权重来初始化执行类似任务的另一个 络的权重。 这就是所谓的转移学习 ,即使乍一看似乎相去甚远,您也会惊讶地发现它的效果如何。
[ 也在InfoWorld上:2020年的人工智能预测 ]
最广泛使用的神经 络范例是什么/span>
有四种非常成功且被广泛采用的深度学习范例:循环神经 络中的LSTM单元,卷积神经 络(CNN)中的卷积层,编码器-解码器结构以及生成对抗 络(GAN)。
RNN是用于处理顺序数据(如文本(例如,单词或字符序列)或时间序列数据)的神经 络家族。 这个想法是在每个时间步上应用同一 络的副本,并通过一些状态向量连接不同的副本。 这使 络可以记住过去的信息。 RNN中流行的单元 络结构是门控循环单元(GRU)和LSTM。
CNN图层对于具有空间依赖性(如图像)的数据特别强大。 代替将每个神经元连接到新层,而是使用滑动窗口,该滑动窗口的作用类似于过滤器。 一些卷积可能检测到边缘或角落,而其他卷积可能检测到图像内的猫,狗或路牌。
另一个经常使用的神经 络结构是编码器-解码器 络。 一个简单的示例是自动编码器,其中训练具有瓶颈层的神经 络以将输入重构为输出。 编码器-解码器 络的第二个应用是神经机器翻译,其中在RNN中使用编码器-解码器结构。 基于LSTM的编码器提取源语言中内容的密集表示,而基于LSTM的解码器生成目标语言中的输出序列。
当然,还有生成对抗 络。 生成对抗 络由两个深度学习 络(生成器和鉴别器)组成。 两个 络都经过交替训练以竞争以提高自身水平。 GAN已成功地应用于图像张量中,以创建动画,人物甚至是梵高之类的杰作。
深度学习是否已经占领了整个机器学习领域/span>
不,至少还没有。 在某些领域(例如计算机视觉),您将无法再进行深度学习,但事实证明,其他领域(例如表格数据)对深度学习构成了挑战。
对于表格数据(它仍然是用于存储业务数据的主要格式)而言,深度学习在此处的表现并不差。 但是,如果您可以使用随机森林或梯度增强树来获得类似的精度,则很难证明在昂贵的GPU服务器上训练数日的深度学习模型是合理的,您可以在一台像样的笔记本电脑上在几分钟内进行训练。
[ 也在InfoWorld上:深度学习与机器学习:理解差异 ]
我需要知道如何编码才能使用深度学习吗/span>
并不是的。 确实,TensorFlow和Keras中提供了大多数深度学习范例,并且它们都需要Python技能。 但是,在我们的开源KNIME Analytics Platform中 ,我们提供了一个图形用户界面(GUI),可以在后端使用TensorFlow精确处理那些Keras和深度学习库。 您可以通过将适当的节点一个接一个地拖放来构建所需的复杂神经结构。
下面的图1中显示了一个示例,我们在该示例中训练了基于LSTM的RNN以生成自由文本。 该模型创建的假名称类似于山名,用于新的户外服装系列。 在顶部(棕色节点),您可以看到在哪里构建了神经体系结构,然后使用Keras Network Learner节点对其进行了训练。 经过适当修改的经过训练的 络然后以TensorFlow格式保存。
图1.构建和训练基于LSTM的RNN以生成自由文本。 在顶部,棕色节点构建 络体系结构。 然后,Keras Network Learner节点将训练 络,经过适当的后处理后,该 络将保存在TensorFlow文件中。
在哪里可以找到深度学习 络的示例/span>
您可以在我们的 区KNIME Hub上找到很多东西 。 例如,可以在此示例中找到具有LSTM单位的递归神经 络以生成自由文本 (也显示在图1中),或在此其他示例中找到时间序列预测 。 此外,还有一些使用卷积神经 络来处理图像的示例工作流,例如“ 从头开始构建CNN ”或“ 训练简单CNN” 。 构建了一个简单的前馈,完全连接的多层自动编码结构 ,并将其用作欺诈检测任务的解决方案。 我相信在我们发言时, 区还上传了更多内容。
[ 通过InfoWorld的机器学习和分析 告时事通讯来掌握机器学习,人工智能和大数据分析的最新进展 ]
如果我使用KNIME Analytics Platform,是否需要在云上托管我的工作/span>
KNIME Analytics Platform是一个开源应用程序,其集成也是如此,包括Keras和TensorFlow集成。 您可以将它们安装在任意位置,例如,在您选择的公共云中或在您的计算机上。 但是很明显,机器越强大,执行速度就越快。 您甚至可以在KNIME Keras集成中应用GPU加速。 您只需要配备装有CUDA的配备GPU的计算机,带有安装Keras的Conda环境以安装GPU,以及在其之上的KNIME Keras集成 。
Kathrin Melcher是KNIME的数据科学家。 她拥有德国康斯坦茨大学的数学硕士学位。 她喜欢教学并将其知识应用到数据科学,机器学习和算法中。 在LinkedIn上关注Kathrin。
Adrian Nembach自2015年以来一直是KNIME软件工程师,专门研究包括深度学习在内的机器学习算法。他拥有康斯坦茨大学计算机与信息科学理学硕士学位,他专注于计算机视觉的深度学习。 在LinkedIn上关注Adrian。
有关KNIME的更多信息,请访问www.knime.com和KNIME博客 。
–
翻译自: https://www.infoworld.com/article/3532058/10-questions-about-deep-learning.html
10个深度学习软件
文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树人工智能深度学习208226 人正在系统学习中 相关资源:软件标书范本(技术部分)_软件技术标书-项目管理文档类资源-CSDN文库
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!