阿里推出会议AI助理“听悟”,可精准实现10人角色分离

10月21日,杭州云栖大会上,阿里巴巴达摩院发布软硬件结合语音产品“听悟”。相比只能逐字转写的上一代语音产品,“听悟”是面向未来会议的AI助理,集成了达摩院最新语音及自然语言处理技术,不仅“听”得准,且“悟”性高,可秒速生成智能会议纪要及待办。

会议场景对语音转文字产品有强需求。但因技术限制,传统语音产品存在“听不准、分不清、看不懂”等问题,往往在噪音下识别准确率较低,无法区分不同说话人,转写内容冗长难以阅读和沉淀。针对痛点,达摩院语音实验室打造了“听悟”,通过让AI深度参与,让线上及线下会议更智能、高效、协同。

“听悟”内置达摩院独创声纹融合方位算法,能对多达10位说话人进行角色分离;融入达摩院新一代端到端语音识别模型,中文识别准确率可达98%,支持14种方言及中英文“自由说”;可嵌入线上音视频会议,实时出字幕及纪要。

此外,“听悟”配置了智能麦克风,融入达摩院指向性差分麦克风阵列技术,可实现7米内远距离360度高清收音,相比传统麦克风收音距离、抗噪能力大为提升。

达摩院语音实验室负责人鄢志杰表示,“语音技术的发展是不断解锁场景的历史,会议作为当下组织协同的核心场景,是语音AI将变革的下一个重要场景。”

鄢志杰介绍,“听悟”适用于企业会议、金融调研、媒体访谈、教育培训等泛会议场景,目前面向企业客户,已为多家头部金融企业提供服务,且应用于钉钉新上线的“钉闪记”功能中。未来,“听悟”还将探索与会议厂商合作。

IDC 告显示,阿里AI近年在语音语义领域表现强劲,市场年增长率达96.6%,增速第一,总营收中国前二,已深入政务、金融、电商、法律等行业,应用于会议、客服、IoT、搜索、文本分析等场景。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年9月17日
下一篇 2021年9月17日

相关推荐