某软件翻译功能被指种族歧视 AI翻译到底达到什么水平了?

有 道最近某IM工具就人工智能翻译的结果进行了紧急修正和道歉,原因是有国内用户说中文的时候,希望自动翻译“黑人迟到了”,结果里面的“黑人”翻译成了字母“n”开头的那个单词,这个单词在黑人看来,是属于极端的侮辱的,所以该公司对此AI翻译结果进行了紧急的干预修正。

应该说,这事目前得到迅速的纠正,没有酿成什么后果,是十分幸运的。因为n开头这个词,现在如果在国外随便开口,就是涉嫌“种族歧视”的大问题,如果身边稍微有一个比较敏感的非洲裔,不仅可能会将你告上法庭,甚至可能忍不住马上胖揍你了(这个真不是说笑)……所以,现阶段的AI翻译,有风险。

那么,当前的AI翻译,到底实际水平如何呢?这里除了说到腾讯和百度的AI翻译之外,肯定不能不提著名的谷歌翻译,以及谷歌最近所推出的Pixel Buds耳机。我就我所知道的情况,跟大家做一些介绍和分析:

首先,中外几家巨头的AI翻译,目前公认已经成熟,不会出现大错误的领域在旅游词汇和句子翻译上。这是没得说的,因为所有语言最频繁的交汇处,都在旅游上,所以大数据的深度学习和训练,基本上都是从旅游开始的,而且旅游的相对简单,共通处很多,不会出现太多的歧义和文化差异。简单来说,你到别的国家旅游,或者有国际友人跟你会面问“某个地方怎么走”这些常见问题,无论你是用谷歌翻译或苹果Siri,还是腾讯自己的翻译君,又或百度翻译等等,在书面上的结果都是大同小异,你是可以基本领会其中的核心意思,不担心出现大错的。

但是在语音翻译上依然翻译水平一般。这个问题稍后详细说。

其次,在日常的常用沟通上,很遗憾,除非是用手机打出常用短句,否则,语音翻译依然有很多错漏。谷歌最近那个卖149美元的Pixel Buds耳机,如果没有弄错的话,都是基于谷歌自己的AI翻译平台,那个平台应付诸如问好、家务、简单购物对答等最基本的日常用语还勉强可以,但稍微涉及到长句子,或者在句子中出现一些品牌或者专业词汇,翻出来的结果就开始走下坡路了,不大容易完全读懂对方的全意。国内的AI翻译在这方面就更吃力,目前我自己没有发现有哪个平台和APP可以非常“信达雅”地全部翻译出日常沟通类的语音段落或者文章,连苹果Siri的翻译效果也一般。

再者,如果遇到一些专业领域的语音沟通,例如把教人如何烹饪的英文视频用AI翻译成中文,那么就不好懂了。如果遇到一些不是特别流行的爱好,例如极限运动或者不时创造出新词出来的其他专业领域,那么各个AI翻译平台的翻译结果就开始惨不忍睹了。

最后,在一些专业性很强的领域,例如财经金融领域,不要说语音方面的翻译了,就连书面翻译,目前都有很大问题,我见过最离谱的例子,是看某公司的财经分析,里面有几个句子,英文原文意思是贬义的,但经过谷歌翻译出来之后,竟然变成褒义。我百思不得其解,后来猜想是谷歌遇到长句,可能断句判断有问题,影响了最终翻译。

无论如何,按照目前的大数据深度学习模式,AI智能翻译是有很长一段路需要走,去慢慢完善的。这里面有几个挑战是无法回避:

1、语音识别。基本上谷歌翻译的痛点就在语音识别上,例如现场的杂音,以及不同区域人的不同口音,还有即使的运算判别,都会严重影响语音识别结果。例如有些时候会把“four”识别成为“for”。我还没有看到Pixel Buds耳机翻译的详细评测,但据现场的媒体所说,由于现场杂音大,所以看来语音识别不是特别理想。如果连专用的Pixel Buds耳机都这样,那么其他产品的语音接收和识别效果更要打折了。

苹果Siri的语音识别虽然很强,但我自己的口音比较重,也发现了如果有些时候口音特别重的时候,虽然旁人都明白我在说什么,但苹果Siri是经常说“我不是很明白你的意思”。

2、AI学习和翻译。基本上现在的AI翻译模式都是通过去深度学习大数据,去读懂词汇的意思和如何使用的,如果没有人工干预,就会把不同语言最频繁的关联当作翻译结果。例如我们在文章一开头那个黑人的英文,就是因为在不人工干预的前提下,系统发现中文的“黑人”跟英文的那个n开头的单词,平时是关联得最频繁的,所以认为这个就是最接近正确的翻译结果,也就是系统认为“这个结果有着最高的正确率百分比”。

这就出现了一个很大的问题,由于各地的风俗、风土人情等方方面面有着太多不同,而且俚语用法、情绪等差异很大,机器无法像人类那样有情感,所以这种完全机械地根据大数据所训练出来的翻译结果,是有很大偏差的。

举个例子:“He is a badass master.”按照机器的理解,应该翻译成为“他是一个混蛋大师”。但是我们知道,现在badass往往包含了“很牛B”的意思,往往要看实际语境和情绪来翻,例如这句就翻译成为“他真是个很牛B的神人”会比较好。

也就是说,机器目前不能去揣摩人的情感和具体语境,所翻译出来的结果会差很多。

可以肯定的是,现在和未来两三年,各位去旅行或者跟国际友人日常的客套对话,AI翻译是可以帮到你的。但是,AI翻译在这几年之内,还不能完全用于各个领域,还有太多的问题需要解决。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2017年9月12日
下一篇 2017年9月12日

相关推荐