研究人员开发出了一个全自主的计算系统,该系统能与人类进行现场辩论。研究结果勾勒出一个人工智能帮助人类提出并理解复杂论点的未来。
就在不到十年之前,即使是最先进的AI技术,也绝对没有办法通过分析人类的话语,摸索出有哪些用证据支持结论的方式—— 这个过程现在被称为论辩挖掘(argument mining)[2]。自那以后,AI技术的进步以及论辩技术工程的成熟,加上巨大的商业需求,使得该领域快速发展。目前,全球共有50多个实验室正在钻研这个问题,包括所有大型软件公司的团队。
争论和辩论是人类智能的基本能力。在本期《自然》中,Noam Slonim和同事描述了人工智能系统——Project Debater(意为辩手项目)与人类进行竞技辩论的结果。该系统能通过扫描浏览一个存有4亿篇新闻 道的档案库,自己组织开场白和反驳论点。研究人员用一系列辩题测试了该系统,并将其与人类专业辩手和各种基线系统的表现进行了比较。虽然人类专业辩手仍然更胜一筹,但Project Debater的辩论在虚拟的人类观众这里拿到了高分。研究团队认为该结果证明了人工智能具有参与复杂人类活动的潜力。丨Yijia Xie
无论是作为一个AI系统还是面向整个AI领域的大挑战,Project Debater的野心都不是一般的大。和把目标定得很高的几乎所有AI研究一样,一个关键的瓶颈是如何获得足够多的数据,为设定好的挑战[4]计算出有效的解决办法。 Project Debater利用一种双管齐下的方法克服了这个障碍:首先将目标缩小到100个左右的辩题;再从很大的数据集中搜寻原材料——即使用现代语言处理系统的标准来看,这些数据集也绝不算小。
在2018年和2019年的几次公开亮相中, Project Debater挑战了很多优秀的著名人类辩手( 图1),并由观众对其表现进行非正式打分。在这次的辩论中,该系统基于自身的论辩技巧和已经处理过的数据集,自创了一个4分钟的演讲,从它自己的指令系统中开了一个新的辩题,并得到了人类对手的回应。 该系统随后对对手的论点进行了反驳,做了第二个4分钟的演讲。对手也做了4分钟的反驳,最后以双方各做2分钟总结陈词结束。
Project Debater挑战人类辩手。Project Debater是Slonim等人[1]开发的一个AI系统,可以与人类进行辩论比赛。丨Jason Henry/NYT/Redux/eyevine
Project Debater的最大弱点可能在于它很难模仿人类辩手的连贯性和节奏——该问题关系到其在选择、概括和设计论点方面的最高处理水平,但这种局限性非Project Debater独有。虽然经过了两千年的研究, 我们对论辩结构的理解依然有限。取决于论辩研究的焦点是在语言使用、认识论( 知识的哲学理论)、认知过程还是逻辑正确性,研究人员提出的对论辩和推理的连贯模型至关重要的特征可以千差万别[5]。
正因为此,决定出色论点应该包含哪些因素的模型极其多样[6],但决定优秀辩论应该包含哪些因素的模型基本上就一种形式化的直觉( 将辩论精华编纂成册的学科在这方面已经领先一步,比如法律或是某种程度上的政治科学)。所以,也就不奇怪研究人员会让人类观众来简单评价Project Debater的表现是否 “属于一次出色的表现”了。 人类观众在近三分之二的辩题上都给予Project Debater正面的评价。
此外, 在真实世界中,论点没有清晰的边界:辩论之外的言语不是离散的,而是连着了一张集中了交叉引用、类比、例证、泛化的 络。如何让AI来处理这样的论辩 已经有了理论[9],并用软件得以实现——比如一个叫作DebateGraph( 见go.nature.com/30g2ym4)的系统,这个互联 平台可以提供对复杂互联的思维 络进行可视化和共享的计算工具。然而,与这些实现相关的理论挑战和 会技术问题也不容小觑:设计出吸引大量观众关注这类系统的有效方法,与设计出能让他们与这些复杂论辩 互动的直接机制一样难。
参考文献
[1]Slonim, N. et al. Nature 591, 379–384 (2021).
[2]Lawrence, J. & Reed, C. Comput. Linguist. 45, 765–818 (2020).
[3]]Devlin, J., Chang, M.-W., Lee, K. & Toutanova, K. Preprint at https://arxiv.org/abs/1810.04805 (2018).
[4]Feigenbaum, E. A. Proc. 5th Int. Joint Conf. Artif. Intell. 1014–1029 (Morgan Kauffman, 1977).
[5]van Eemeren, F. H. et al. Handbook of Argumentation Theory (Springer, 2014).
[6]Hahn, U. Trends Cogn. Sci. 24, 363–374 (2020).
[7]Levy, R., Yonatan, B., Hershcovich, D., Aharoni, E. & Slonim, N. Proc. COLING 2014, 25th Int. Conf. Comput. Linguist. Tech. Pap. 1489–1500 (2014).
[8]Trautmann, D., Daxenberger, J., Stab, C., Schütze, H. & Gurevych, I. Proc. AAAI Conf. Artif. Intell. 34, 9048–9056 (2020).
[9]Rahwan, I., Zablith, F. & Reed, C. Artif. Intell. 171, 897–921 (2007).
原文以Argument technology for debating with humans标题发表在 2021年3月17日的《自然》的新闻与观点版块上
版权声明:
? 2021 Springer Nature Limited. All Rights Reserved
欢迎转发到朋友圈。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!