解读英特尔软件创新之路

计算硬件的发展帮助 AI 解开了算力的“无形枷锁”,但是,在一些业内人士看来,这或许会造成新的困局。近日,Facebook 的人工智能副总裁 Jerome Pesenti 在公开场合表示了其对 AI 算法开发过于依赖硬件算力的担忧。

根据他的观点,机器的计算能力已经较之前有了较大的提升。然而,这一轮的硬件算力进化还能保持多久的强劲势头?现有的 AI 对硬件算力形成的强依赖性,可能会成为新的增长阻力。

应对 AI 对算力强依赖性的一个思路是,软件和硬件实现协同优化。这是未来半导体行业新的发展趋势。毕竟我们现在处于一个软件定义的时代,软硬协同可以更好地满足用户的需求。

很多以计算硬件为主的公司,如英特尔,也早已意识到软硬件协同创新对性能增长的重要作用。英特尔拥有超过 15,000 名软件工程师,在新近提出的六大技术支柱中,软件也是其中之一。

“软件定义”几乎支配了现代硬件设备的智能化演进,尤其是在消费电子上,带来智能手机、PAD、智能汽车等一系列产品的问世,这个趋势同样也在影响上游的半导体领域。

英特尔就认为,整个 AI 计算技术一定会走向硬件+软件结合。

目前,在计算架构上,英特尔将计算类型分为标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial)四类,分别应用于 CPU、GPU、ASIC 和 FPGA。这 4 类计算分别对应不同场景下不同类型的数据。例如,金融交易的数据更多属于标量计算,即输出风险等级的概率数字,而语音、语义处理则更倾向于矢量计算,需要把语言或者文字进行矢量化。

但无论是什么类型的计算,这些计算硬件的性能还需要软件的配合。这也是为什么近几年来英特尔的发布会、技术展示日上,软件创新的“存在感”越来越强。在最近于深圳举办的英特尔人工智能大会上,该公司在软件上取得的进展同样没有缺席。

英特尔的一位技术负责人对 DeepTech 表示,软件 区和硬件 区相互交流,并真正去思考彼此的问题,比以往任何时候都更重要。“对于全新硬件架构的每一个数量级的性能提升潜力,软件能带来超过两个数量级的性能提升。如果想实现指数级的增长,必须要硬件和软件共同创新”,他说。

DeepTech 了解到,过去几年,英特尔在不断投入软件团队的资源,以应对实际的 AI 部署过程中出现的客户痛点。

英特尔高级首席工程师、大数据技术全球首席技术官戴金权对 DeepTech 透露,英特尔和很多的用户、客户在合作过程当中,发现实验室或者 络上的深度学习模型或者算法可能开发难度并不高,但是真正落地或者是部署在大规模生产环境中时,会出现新的痛点,比如说大量的数据处理分析和流水线的整合并不容易等等。

以医学影像场景的 AI 计算需求为例,将人工智能应用于医疗影像推理是非常复杂的,需要强大的处理能力来应对数据多样化、深度学习和复杂标记等挑战。

医疗影像分析需要支持 3D 甚至 4D 深度神经 络(DNN)体系结构,在处理过程中严重依赖于平台内存。GPU 通常无法满足处理 3D 和 4D 影像数据时所需的大量工作负载。因此,医疗团队通常采用减少 3D 影像数据的像素,并将其分割成多个小的影像块进行顺序识别。

杭州健培科技有限公司董事长程国华对 DeepTech 解释道,在医学影像 AI 计算中,团队发现有一些特别的应用用 GPU 方案或者其他方案来做效果并不是特别好,尤其是三维方面。“使用三维的深度学习来做一些分析的时候,会为了速度不得不降低一些像素的要求、体素块的大小去满足速度上的要求”,他说。

为此,英特尔给健培的解决方案中配备了对 TensorFlow 做的优化的数学核心函数库——MKL-DNN据介绍,这个库有 5000 多项对 TensorFlow 计算方面的优化,健培的一些算法模型平移到这个核心库进行计算,软硬结合之后速度又有新的提高,实现了图像读取性能上 8 倍的提升。

“TensorFlow 的优化不是我们这样的公司应该做的事情,而是平台应该做的事。这种对 TensorFlow 的优化在医学影像 AI 计算上有立竿见影的效果,比如说成本降低了,不用再采购更多的计算单元。对企业而言,省下成本,就是利润”,程国华说。

除了医学影像场景的具体计算优化以外,在软硬协同演进上,还有一个思路是将软件的指令集技术内嵌在芯片方案内部。一个最新的进展是,英特尔在为第二代至强可扩展处理器已经内嵌针对 AI 场景进行加速的指令集——DL Boost 加速指令集。

据了解,这个指令集针对 AI 的推理计算,通用的处理芯片经过指令集加速以后,第二代至强处理器 9000 系列、8000 系列的性能评估显示,推理应用可以达到非常高的水准,甚至在某些场景上面超越 GPU 加速器方案的性能。这种性能正是通过计算技术的软硬件结合带来的。

目前,英特尔 AI 的产品线已经提供了从端到端的丰富产品线的布局,既有通用计算的平台方案,又有加速器的方案,覆盖了从边缘一直到云端的计算场景,而具体到接下来的软件创新上,其策略是“一个架构,围绕架构进行扩展”:对于开发者来说,它应该易于使用,而且不仅可以扩展到所有的架构,更可以扩展到所有的操作系统;向所有人开放标准,英特尔拥有业界最好的开源实践;提供统一的开发体验。

英特尔也对 DeepTech 表示,公司现在正在和 AI 软件生态链的厂商、包括开源业界进行紧密合作,把一些最新的 AI 加速指令集融合到最主流的 AI 计算框架当中去,例如 PyTorch、Caffe、Tensorflow,通过利用这些最新的指令集满足更高的 AI 计算需求。

今年下半年,英特尔也将宣布其软件项目“One API”取得的重要进展。“One API”旨在将为开发者带来一套能提供一个统一编程模型的工具,以简化跨不同计算架构的应用程序开发工作。

不难预料,在接下来的很长一段时间里,新的架构、新的计算方案面世的同时,针对软件层面的优化还会越来越多,半导体领域的硬件公司和软件公司的边界也会越来越模糊。未来,对于半导体行业来说,新的竞争战场也不再局限于硬件,“软实力”也会是重点之一。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年6月20日
下一篇 2019年6月20日

相关推荐