每周AI应用方案精选:骨龄诊断技术;情感计算框架

每周三期,详解人工智能产业解决方案,让AI离你更近一步。

解决方案均选自机器之心Pro行业数据库。

方案1:云服务平台

解决方案简介

利用诸如微软 AirSim 的人工智能技术与混合现实技术,丰田可以训练载货机器人识别图形、自动处理并学习在工厂车间中与人类安全协同工作的正确流程。丰田欧洲公司还在与微软合作开发 T-Stream 全站解决方案,以微软 Azure 云服务为基础,这套系统运行 Windows 系统并能利用 Bing 地图和 GPS 系统为技术人员提供更精准的服务,促使其在故障发生之前,为客户提供保养服务。利用微软的技术,能够有效减少对现有仓储流程的影响,而众所周知,这是大部分工厂在部署自动化系统时都会遇到的最大障碍。

解决方案详解:

微软的 Azure IoT 云服务包括: 1. 面向物联 工厂的自动恢复服务,可以简化制造企业新增工业设施和部署安全性的操作,显著降低了管理成本。这项服务提供 OPC UA 全球恢复服务器(GDS)界面,可确保与现有客户端和服务器端的兼容性; 2. Azure IoT Hub 能运行在 Azure Stack 混合云上,让客户和合作伙伴得以构建出既可完全在本地运行,也可上云的工业物联 解决方案,并在企业内部对数据进行接近实时的采集与分析; 3. 为了给边缘设备提供更加周全的安全保护,微软发布 Azure Sphere 预览,这是首个面向联 微控制器(MCU)提供工业级安全保障的完整平台。预计今年全球将有 90 亿片微控制器被部署到从家用电器到工厂设备的各种机器中; 4. 响应制造企业的需求,微软正在计划对 Time Series Insight(TSI)进行升级,这项服务将带来大规模可伸缩存储和数据存档能力,并有助于降低存储成本。

方案2:骨龄诊断技术

解决方案简介:

临床上通过骨龄检测来判读儿童的生物学年龄,通过生物年龄与日历年龄的差异评估儿童发育状况,了解儿童性成熟的趋势,预测儿童的成年身高等,并广泛用于影响儿童生长发育疾病的治疗监测,对一些儿科内分泌疾病的诊断有很大帮助。国际上已经形成套相对标准的产品骨龄图谱法,能够完成对骨头各个细节的研判,经过精密的计算达到一定的准确度。但是解读图谱的过程繁琐耗时,而全国约存在 20 万的儿科医生缺口,而无法正确地判断骨龄会耽误治疗。长期以来,我国缺乏大样本的骨龄和身高长期追踪观察数据,中国健康儿童的骨龄数据库并未建立起来,临床应用的骨龄检测方法也各有弊端,没有办法满足临床要求。医院和企业共同开发了儿童骨龄智能辅助诊断系统。系统能通过智能阅片自动计算儿童骨龄,大幅减少医生工作量;按照算法模型集成 GP/TW3 等主流骨龄标准可以判读每块手骨特征避免骨龄诊断的误差,产品的精确度可以达到 0.1 岁,与医生计算的骨龄值相比,误差小于半年的占 98%。

解决方案详解:

虽然现在骨龄系统已经可以鉴别异常,但是建立标准一定要采用相对正常的数据。医院里的样本虽然是相对正常的,但基于医院的数据只能搜集到看病儿童的数据。

为了提高样本的代表性,学校、儿童幼儿班的数据不可或缺,系统需要从 0-18 岁不同年龄段男女的正常的骨龄片中学习。依图将该系统作为科研项目递交医院商讨合作,经过医院伦理委员会、科研处批准,企业才可以进入医院信息系统拿到一定量的数据。另外,软件成熟后,还需要在院内进行推广试用,这需要看科室对该系统的接受程度,接受之后才能够打通,否则机器也无法进入临床。

标注数据的专业性强,刚开始标注数据时,放射科投入了 40 多个医生,后来研究骨龄片的医生也提供帮助。医生排除各种可能会影响骨龄因素的骨龄片,训练机器判读。机器学习的时候,就按照 TW3 计分法,取 20 块骨头,每一块骨头按 8 个等级去打分,就像量体裁衣一样。排除特别矮小、早熟、肥胖的样本,截至 2017 年 10 月,医院和企业拥有的健康人群样本量是 1.4 万。 但是后期仅需几千张骨龄片左右就足够训练机器了,医生仅需再稍微校正即可,同一张骨龄片在不同时间段的评判也会有 3 个月的差距,系统的误差在半年以内即达到专家级水准了。

「骨龄」是骨骼年龄的简称,是青少年儿童骨骼发育水平同骨发育标准比较而得出的发育年龄,它比年龄、身高、体重更能精确的反映出身体的成熟程度,更加准确地反映个体的生长发育水平和成熟程度。人的骨骼生长发育受到遗传因素、营养水平、饮食习惯、地理环境、人文环境等多重因素的影响,不同年代、不同种族和区域的儿童青少年的发育会有所不同。

所以,针对不同民族和区域,也应当制定相应的骨发育评价标准,并随 会发展因素的变化及时修订。

以往,传统的骨龄片研判有两种方法:G-P 图谱法和 TW3 计分法,分别依据美国 20 世纪 30-40 年代和欧洲 20 世纪 70-90 年代的白人儿童,由于种族差异和 会经济发展的变化,该标准不完全适用于东亚儿童。为此自 20 世纪 60 年代以来我国学者张果珍、顾光宁、张绍岩、叶义言等曾提出中国人骨龄百分计数法标准、手腕骨发育图谱,CHN 法,TW3-C,RUS-CHN 及叶氏骨龄法等,为我国儿童青少年的骨龄评定做出了巨大贡献。

然而不管经典的 GP 图谱法,TW 计分法以及在 TW2 或 TW3 基础上改良的我国 CHN 法, TW3-C 法和叶氏法均存不足。G-P 图谱法简单但主观性强不够精确; TW3 法精确但较为繁琐,耗时长,需要对桡-尺-掌指骨 13 块骨(RUS(R)系列),以及腕部 7 块骨(Carpal(C)系列)共 20 块骨做 8 个等级的评分和计算,即便使用计算机软件也需耗时 15-30 分钟,临床实际工作中难以推行。

G-P 图谱法由于使用简便、直观、耗时短,在国际上有较高的权威性,因此国内外临床实践中仍广泛使用该方法。然而由于许多儿童手腕骨的发育不一定像标准片那样均衡,G-P 法在使用过程中最大的困难的仍然是整片比较的主观性及不精确性问题。

方案3:基于 LSTM 和 CTC 的上下文无关音素组合建模

解决方案简介:

在 2012 年,公司上线了基于 DNN 的语音识别模型并不断迭代。在 2018 年,提出百度尖峰技术 Deep Peak 2 模型。模型全称为「基于 LSTM 和 CTC 的上下文无关音素组合建模」。它能把高频出现的音素联合在一起,形成一个音素组合体,然后将该音素组合体作为一个基本建模单元。 此前,国际上的研究者但却无法避免建模时出现的「过拟合问题」(意思是神经 络模型对训练数据拟合程度过当,反而导致在测试集上的效果较差),公司通过声学模型学习和语言信息学习相分离的特殊训练方法,使用音素组合来保留最重要的音素连接特性,最终解决了过拟合问题。 利用这种最新的上下文无关建模方式,建模单元从原先的上万量级降到了一千以内,大幅提升了语音解码速度,成为百度输入法语音输入能做到实时同步。 能够充分发挥神经 络模型的参数优势,语音识别过程稳定性更强,准确度更高,解码速度更快。

解决方案详解:

百度输入法现具备语音修改、语音翻译、语音轻声识别、语音联想表情等 AI 功能。

3.「AR 表情」功能则是基于百度的人脸识别技术和 AR 技术。用户不仅可根据相机或相册进行人脸识别、制作表情包,还能够通过自己的表情控制虚拟人物形象。而制作出来的 AR 表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来。该功能希望产品拥抱年轻文化。因为根据公司统计,根据年龄划分的百度输入法用户比例中,90 后占 70%,表情输入使用率高达 60%。

方案4:自主导航的人工智能程序

解决方案简介:

人类在自然空间中游刃有余,可以轻松绕过障碍,找到自己与目的地间的捷径,但其背后的机理却不甚明了。

May-Britt Moser 和 Edvard Moser 夫妇发现了大脑内嗅皮层更为神奇的 格细胞。他们记录大鼠运动时特定神经细胞被相应激活的规律,发现 格细胞能将整个空间环境划分成蜂窝状的六边形 格,就像地图上的坐标系一 Moser 夫妇也因此分享了诺贝尔生理学奖。

人们猜测 格细胞支撑着生物的矢量巡航,即计算通向目标的距离和方向,但人们在发现 格细胞十余年后,对其计算功能以及和矢量巡航的关系,仍然未知。

DeepMind 团队称,其最新研发出的一个人工智能程序具有类似哺乳动物一样的寻路能力,非常类似大脑中 格细胞的工作原理,证明 格模式对矢量巡航的重要性。

解决方案详解:

研究人员首先训练循环神经 络基于运动速度信息在虚拟环境中定位。这与哺乳动物在不熟悉环境中运动定位所用到的信息非常类似。类似 格细胞的模式,研究人员称之为 格单元,在神经 络中自然出现。

DeepMind 团队随后利用强化学习检验这种 格结构是否能够进行矢量导航。研究人员将之前自动出现的 格结构与一个更大型的神经 络架构结合成了人工智能体,置于虚拟现实的游戏环境中。

经历强化学习后,该人工智能在游戏迷宫中向目的地前进的导航能力超越了一般人,达到了职业游戏玩家水平。它能像哺乳动物一样寻找新路线和抄近路。而如果将 格单元静音后,其巡航能力则大打折扣,距离和方向的计算误差都增大,证明 格模式对矢量巡航的重要性。

方案5:情感计算框架

解决方案简介:

微软将小冰智能聊天机器人作为用于对话型人工智能解决情感交流问题的一种方式,希望通过小冰的情感计算去探索更多的未知领域和需求,让整个人工智能产业拥有更大的想象空间。 现在小冰可以作诗、写文章、使用「全双工语音」打电话,以及提供智能客服、接入物联 、智媒体商业平台解决方案等商用服务。

2016 年 7 月,小冰和日本第二大超市集团 LAWSON 合作,进行了第一次商业化试水。小冰在和两千万 LAWSON 用户进行对话交流的过程中,找到合适的机会给用户提供打折券,在传统营销模式转化率不足 10% 的情况下,小冰派送的打折券在 4 日内平均到店消费完成的比率高达 57%。

解决方案详解:

小冰的技术核心是「情感计算框架」,不同于普通聊天机器人使用 Rule Base 的方法来处理对话情景和上下文关系,小冰的情感计算框架中的上下文是覆盖了Long-tail(长尾)的。其「情感计算框架」从大量数据中还原「人际间的情感反应」,再通过一套专门的排序方法,去拟合近似于人的对话,让机器人在某种程度上拥有对话过程中的主动权。

从必应(Bing)中国内部孵化后推向全球的创新项目。 面世 3 年与人类共产生了超过三百亿轮次的对话,CPS 对话处理轮次达到了23,而行业的平均水平只是1.5-2.5。

小冰和小娜拥有共同的基础层——微软在机器学习、大数据、深度学习的技术积累以及整个Bing搜索提供的能力和数据,但小娜小冰在微软内部是保持相对独立的两条业务线发展的。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年4月16日
下一篇 2020年4月16日

相关推荐