技能学习的类型主要包括示教学习(learning from demonstration),强化学习(reinforcement learning),以及二者的结合。以下两个视频分别给出了机器人基于示教学习和强化学习获取操作技能的例子。
机器人单手操作技能与强化学习(美国加州大学伯克利分校)
在现实的工业与科研应用中,机器人操作技能模型的应用非常广泛,如下图中的子图(a-c)分别展示了装配、开门和手术的操作技能。凡是需要完成操作任务的场合,都需要相应的技能。工业机器人面临更高的工艺指标和更复杂的工艺流程,协作机器人面临着与人交互协作所需的安全性和灵活性要求,服务机器人面临人类生活环境中物体非结构化、排列不规则和动态变化程度高的难题,手术机器人自主完成完整的技能具有很大的难度,但是使机器人学习局部的手术技能并在监督下自主执行该局部技能,具有很好的前景。
《机器人操作技能模型综述》首先介绍了机器人操作技能模型的定义、意义与基本性质,并对基于流程、运动、策略和效果预测四种模式的技能模型分别进行阐述,最后对机器人操作技能模型的未来发展趋势做出了如下展望:
1) 高效学习:日常生活中的很多技能,人类只需要观察一次演示过程,甚至根据一段技能流程描述的语句,即可获取该技能。而机器人需要从若干次演示中才能获取一个较为简单的技能,例如学习刨削蔬菜需要18次示教。谷歌的研究者利用14个机械臂耗时2个月收集了超过800,000次物体抓取技能的大量数据,并利用这些数据训练模型,使结果执行抓取的成功率达到82.5%。
2) 模型解释:机器人技能模型如果具有可解释性,则可以让人类更好地理解机器人的行动,确保机器人的行动是安全而合理的,当机器人运行出现问题时,人类可以基于技能模型寻找内部原因。相反,如果技能模型是“黑箱式”的,例如,深度神经 络策略模型有92,000个参数,没有有显式的物理意义,所以人类无法理解机器人学到了什么,也无法预知机器人技能是否是安全的,只能通过来实验来验证,这种验证工作在实际应用中往往是不可行的。以行为树为代表的流程模型具有一定的可解释性,可以被人类直观理解,运动模型也可以通过轨迹生成来直观展示出技能效果。以神经 络为代表的策略模型,虽然具有很强的表达能力和通用性,但是无法被用户直观理解,也难以通过数学分析来评估该模型。
3) 统一框架:人工智能中的视觉、语音等任务,往往具有统一的任务框架,不依赖于具体的硬件平台,“众人拾柴火焰高”,典型例子是视觉任务中具有若干的大型公共数据集如ImageNet,使世界各地研究者具有了统一的数据资源和评价指标,解决同一个核心问题并互相对比竞争,显著促进了视觉技术的进步。机器人技能学习任务,面临着机器人平台和任务指标的差异性问题,研究者不仅要考虑技能模型设计,还要考虑场景设计、数据收集、感知与控制模块开发的问题,从而对相关研究的规模和速度带来一定限制。
4) 云机器人:互联 技术在最近十年内得到了爆发式增长,对机器人领域也产生了积极影响。云技术为机器人提供了互联 的数据和计算资源,可以支持和提高机器人的技能执行,而不是仅仅依赖于机器人自身有限的计算能力和存储容量。云技术可以提供大数据、云计算、集体机器人学习和人力计算,从而实现机器人共享大量的图像、轨迹、地图、控制策略数据资源,并在执行技能时将一部分复杂计算在云端执行,而且人工参与可实现众包数据分析与标注。平行机器人的概念于2015年被首次提出:“平行机器人是物理机器人、软件机器人、仿真系统、物联 、数据库、广义的人工智能技术等相结合而成的机器人控制与管理系统。”其中物理机器人在物理、 络空间中执行具体的任务技能,而软体机器人在 络、交互 会空间中执行搜索、推理、决策、优化等知识自动化的任务。
5) 类脑智能:类脑智能是以计算建模为手段,受脑神经和人类认知行为机制启发,并通过软硬件协同实现的机器智能。人脑能够使人类在新的环境和新的任务中自动获取技能,并在复杂的动态的环境中执行技能并展现出长时间稳定和低功耗的优点,人类甚至能在自身受到损伤时仍然保持技能的鲁棒性。近年来通过多学科交叉实验研究,在脑区、神经蔟、神经元等不同尺度下研究人脑的工作机制,可以对机器人技能建模具有更多的启发。机器人所展现的技能水平仍然与人类相差甚远,在流程层面,人类可以掌握外科手术、烹饪食物等具有很大不确定性和复杂流程的技能,在物理运动层面,人类既可以精细地操作缝衣针,也可以用足够的准确度和适当的力量击打乒乓球。如何使机器人操作技能更接近人类水平,将是一个具有极大挑战的长期目标。
E-mail: de.xu@ia.ac.cn
点击“阅读原文”查看更多内容
相关资源:鸿威台球室计费系统说明书_棋牌室管理系统-专业指导文档类资源…
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!