AI软件克隆你的声音，全球诈骗案件已屡次得逞！

热点追踪/深度探讨/ 实地探访 / 商务合作

在2月28 刚于旧金山结束的RSA大会上，一家名为Pindrop的专门检测语音诈骗的初创公司再次向业内发出警告： 络诈骗份子已经开始借助AI软件克隆声音进行诈骗了！

（Pindrop的CEO（右）和CTO(左），图片来自络）

并且，虽然Pindrop只看到了少数这样的案件，但涉案金额很高。Pindrop估算涉及的诈骗金额可能高达1700万美元。

（图片来自络）

来自硅谷的警告消息又一次将AI的安全性问题带到了舆论的风口浪尖。毫无疑问，自从AI成为全球技术发展的主流以来，DeepFake的问题就一直是人们关心的重点。在之前的文章中，小探深度讨论了关于人脸识别的安全问题（点击这里查看）。而今天我们要讨论的AI语音合成的问题，则可能比人脸识别更加危险。

AI声音合成，一面“天使”一面“魔鬼”

语音合成技术现在已经非常成熟了。例如高德导航里的各种明星语音包，“林志玲为您导航祝您好心情”、“郭德纲前方有落石车碎人心碎”、“你镇定一下罗永浩要开始导航了”，基本上能够达到以假乱真的效果。大部分时候用户也分不出来到底是明星自己录的，还是合成的语音。当然这种场景中，语音合成只是为了提升用户体验做的一个小功能。不仅没有对用户造成损失，反而让用户开车的时候拥有更好的体验。

（高德地图的明星导航语音包，图片来自络）

（图片来自络）

既然身边最熟悉的人都被这样“伪装”骗了，那只要使用这种软件不就拥有了“变身”的超能力了吗？

事实上，利用AI语音合成冒充熟人进行电信诈骗的案例这几年时常发生，并且涉及金额都非常的巨大。

根据《华尔街日》2019年道，英国某能源公司高管在一个小时之内通过匈牙利供应商向一诈骗犯转账24万美元，约175万元人民币，仅仅是因为诈骗犯通过AI技术仿造了其母公司CEO的声音。该高管表示，在整个通话过程中，老板轻微的德国口音都展现得淋漓尽致，该高管完全没有任何的怀疑，直到被要求再次转账时才发觉了事件异常。

在案调查后，警方只能发现该笔转账流动到了墨西哥等地区，但是具体嫌疑犯的身份始终无法确定。这个案件带来的损失目前只能由保险公司承担。这位受害者后来在一封电子邮件中写道，虽然“老板”的要求相当奇怪，但声音如此逼真，他觉得自己别无选择，只能服从。

美国络安全公司Symantec的研究人员表示，他们发现至少有三起公司高管的声音被人模仿以用于电信诈骗。虽然Symantec拒绝透露这些受害公司的名称，也不愿透露上述英国能源公司是否是其中之一，但它指出，其中一起案件的损失总计达数百万美元。

（Symabtec公司大楼，图片来自络）

虽然有种种风险，但技术的发展一点也没有慢下来。目前，许多硅谷巨头和人工智能初创企业都在开发这种语音合成软件，用以模仿人的声音节奏和语调，并被用来制作令人信服的演讲。

（Lyrebird 官）

几个月前，Resemble团队发布了一个名为Resemblyzer的开源工具，该工具使用人工智能和机器学习来通过获取语音样本的高级表示并预测它们是真实的还是生成的来检测深度伪造。而在AI语音合成届早已成名已久的Lyrebird，其开发出的AI合成软件更是可以在合成语音中模拟出说话人的感情。

AI技术被滥用，它的工作原理是什么？

无数的研究表明，重现人们讲话的韵律只需要一个小的数据集。像Resemble和Lyrebird这样的商业系统仅需要几分钟的音频样本，而百度最新的Deep Voice实现等复杂的模型可以从3.7秒的样本中复制语音。

斯坦福大学络政策中心研究员、曾任奥巴马和特朗普政府时期白宫络安全政策高级主管的Andrew Grotto（安德鲁·格罗托）表示：“罪犯将使用任何能让他们以最低成本实现目标的工具。也许这是一项在10年前听起来很新奇的技术，但是现在任何有想法的非专业罪犯都可以使用。”

（图片来自络）

目前市面上的AI语音合成软件的工作原理是将一个人的声音分解成不同的组成部分，比如音轨或音节，然后将这些组成部分重新排列，形成具有相似语音模式、音调和音色的新语音。除了借助这种新技术，骗子们还依赖于最常见的诈骗技巧来提高他们的效率，利用时间压力，比如临近的截止日期，或者会压力，比如安抚老板的愿望，来让受害人打消任何疑虑。在某些情况下，犯罪分子会瞄准公司会计或财务的负责人，因为他们知道这些人有能力立即汇款。

视频链接https://www.youtube.com/watch?v=PDs8-Exx6kE&feature=youtu.be

AI声音合成如此猖獗，应该如何防范？

虽然风险重重，但语音模拟技术的发展势不可挡。例如，Google已经为自动识别DeepFake语音的研究项目提供了资金和资源的帮助。但Google也开发了一些世界上最具说服力的语音人工智能，包括它的Duplex服务，它可以用电脑生成的栩栩如生的声音，打电话给餐厅预定座位。

（Google语音助手，图片来自络）

卡内基国际和平基金会(Carnegie Endowment for International Peace)硅谷办公室主任Charlotte Stanton则提醒业界：“在商业领域，人们有很强的的意愿想要制造出好的技术产品，但一定要平衡，避免它被用于非法途径。所以，研究人员在研发像AI语音合成技术这样强大的技术时需要更加谨慎，很明显，AI语音合成已经到了可以被滥用的地步。”

幸运的是，人工智能开发人员正在努力构建能够检测和打击Deepfake音频的解决方案。例如，Pindrop公司已经开发出一种人工智能算法，可以从DeepFake的音轨中辨别真实的语言。它是通过检查说话时单词的实际发音，以及这些发音是否与真实人类的说话模式相匹配，因为人类的声音无法像机器伪装那样标准和快速。

Pindrop还预测到，也许有一天音频安全服务会像数据安全服务一样有巨大的市场。该公司CEO表示：“会有一些公司建立检测这些安全漏洞的机制。如果上出现了伪造的音频，那么这个机制就会开始保护你的声音数据。”

（Pindrop CEOVijay Balasubramaniyan，图片来自络）

（图片来自络）

关于预防DeepFake的安全机制，你还有什么想法吗？欢迎来评论区留言哦！

参考链接：

https://www.pcmag.com/news/is-ai-enabled-voice-cloning-the-next-big-security-scam

Google releases synthetic speech database to help ‘deep fake’ audio detection research

https://www.washingtonpost.com/technology/2019/09/04/an-artificial-intelligence-first-voice-mimicking-software-reportedly-used-major-theft/

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

AI软件克隆你的声音，全球诈骗案件已屡次得逞！

相关推荐