快捷搜索:  汽车  科技

微信翻译不对怎么办(微信翻译翻车事件)

微信翻译不对怎么办(微信翻译翻车事件)由于Siri后期的发展方向越发地偏向“搜索引擎”而非“聊天机器人”,加上相对封闭的开发环境,现在的苹果用户就没那么多的机会去教坏Siri了。最广为人知的例子就要数Siri了。苹果手机在上线了这款语音助手之后,广大用户就开始了乐此不疲的“调戏”之路,网络上一度流传着各种与Siri的对话。李逵???对于这次的英文夹杂拼音出现误翻事件,微信团队表示,这是由于翻译引擎在翻译一些没有进行过训练的非正式英文词汇时出现误翻,目前正在紧急修复中。其实,类似的问题在广泛使用了机器学习的各种人工智能产品中并不罕见。

最近有网友发现,使用微信自带的翻译功能翻译“you are so 人名”这种句式时,偶尔会出现奇怪的结果,比如这样——

微信翻译不对怎么办(微信翻译翻车事件)(1)

这则新闻引起了小智的注意,立刻展开了调(tiao)查(xi)。

小智发现,不知道是不是微信团队已经意识到了这个问题,“you are so 人名”的句式基本都无法翻译了。

于是,我换了一种调(tiao)查(xi)方(zi)法(shi),比如中华古典文学。前三个翻译还不错,第四个是什么情况······

微信翻译不对怎么办(微信翻译翻车事件)(2)

李逵???

微信翻译不对怎么办(微信翻译翻车事件)(3)

对于这次的英文夹杂拼音出现误翻事件,微信团队表示,这是由于翻译引擎在翻译一些没有进行过训练的非正式英文词汇时出现误翻,目前正在紧急修复中。

其实,类似的问题在广泛使用了机器学习的各种人工智能产品中并不罕见。

01 被“教坏”的人工智能

最广为人知的例子就要数Siri了。苹果手机在上线了这款语音助手之后,广大用户就开始了乐此不疲的“调戏”之路,网络上一度流传着各种与Siri的对话。

微信翻译不对怎么办(微信翻译翻车事件)(4)

微信翻译不对怎么办(微信翻译翻车事件)(5)

由于Siri后期的发展方向越发地偏向“搜索引擎”而非“聊天机器人”,加上相对封闭的开发环境,现在的苹果用户就没那么多的机会去教坏Siri了。

而另外一些模仿(重复)能力较强、数据来源开放性较大的产品,就没那么走运了。

2016年,微软为18-24岁的年轻人推出了一款智能聊天机器人Tay。刚刚亮相时,Tay表现得彬彬有礼,她活泼健谈,会“观察”你的昵称、性别、爱好以及感情状态等资料,会陪你玩游戏,给你讲笑话,评论你的自拍等等。

微信翻译不对怎么办(微信翻译翻车事件)(6)

然而才上线不到24小时,事情就向着不可控的方向发展了。Tay在网友的“调教”下开始出言不逊、脏话不断,甚至涉及种族主义和色情内容。微软只得不停删除Tay的不当言论,并将其暂时关闭。

从这些例子可以看出,某种意义上,机器学习就像一个小孩子,虽然可以很快地从人们给予的信息中进行学习,但缺少分辨是非的能力。如果网上收集过来的数据没有清洗干净,训练出来的结果就会相应的有不好的成分。

02 从“教学”到“自学”

据了解,这次新闻中微信翻译团队使用的是近年来大火的神经网络翻译引擎。大家可能会因为这些失误吐槽机器翻译,认为根本不够“智能”。可是要知道,与早期相比,现在机器翻译技术的准确度和速度已经进步了太多。

基于规则的机器翻译(RMT)

最早的机器翻译使用的是词语 语法的规则。1954年,IBM与美国乔治敦大学公布了世界上第一台翻译机,这台机器能够将俄语翻译成英文。别看它体积庞大,事实上它只内置了6条语法规则以及250个单词。

微信翻译不对怎么办(微信翻译翻车事件)(7)

世界上第一台翻译机

虽然对翻译技术来说,这已经是一次革命性的进步,但由于此时的逻辑几乎是直接根据词典逐字翻译,所以翻译结果大都惨不忍睹。(可以参照刚学英文的小朋友式的翻译,如:“这个很好吃”会被译成This very good eat.)

基于统计的机器翻译(SMT)

1993年,IBM在《机器翻译的数学理论》一文中提出了5种以词为单位的统计模型。

统计模型的思路是把翻译结果看作概率问题,利用平行语料逐字进行统计。例如,机器不知道“树”的英文是什么,但是语料统计后它发现,只要有“树”出现的句子,对应的英文例句里有99%都会出现“tree“这个词,如此机器就可以“理解”单词的意思了。

这样一来,基于统计的翻译效果就比基于规则的效果好得多,尤其是在短语翻译方面。

神经网络机器翻译(NMT)

2016年,谷歌上线了神经网络机器翻译,成为现代机器翻译的主流技术,错误率与之前的统计机器翻译相比降低了60%,而在长句子的翻译上表现尤为突出。

微信翻译不对怎么办(微信翻译翻车事件)(8)

神经网络的重要特性是它能够从环境中学习。它模拟人脑神经的层级结构,从基础层开始,每一层都对从上一层接收来的信息进行抽象,自动识别出语言的规则、模式。人不了解中间的转换规则也没关系,全都交给机器,只要结果正确即可。

当然,神经网络也并非完美无缺,它最大的问题一是需要大量的语料,二是它的结构如黑盒子般难以拆解

回到微信误翻事件,在发生了这样失误的情况下,几乎是不能通过修改神经网络的结构来改变的,因为无法判断是哪里的结构导致了现在的结果。而唯一的解决方法就是提供更多的正确语料来让机器学习纠正,也就是微信官方表示这些引擎缺少关于拼音语料的训练的原因。

03 除了“变坏”,还可能”偏见“

在一项研究中,研发人员发现项目使用的图像识别引擎总是会误将男人识别成女人。可实际上该引擎的识别能力已经很强,可以精确到人物的五官细节,按照以往的经验来看识别准确率应该很高才对。

后来研究人员终于发现了,那些男人被认成女人的图片有一些共同点——都是站在厨房里,或者在做家务。

微信翻译不对怎么办(微信翻译翻车事件)(9)

所以这并不是程序bug,而是人工智能的“认知”出现了偏差。换句话说,AI产生了“性别定势“:它认为站在厨房里的就“该”是女人。

这样的歧视是怎么产生的呢?

简单地说,如果你成长在一个男主外女主内的社会,那你就会自然地认为女人该操持家务。AI也一样,不过它价值观的产生途径来自于训练用的数据库,数据库中的数据大部分来自于搜索引擎。而如果关于性别的偏见已经存在于这些数据中,经过训练后会被机器放大,小的认知误差就会变成严重错误的机器判断。

微信翻译不对怎么办(微信翻译翻车事件)(10)

不仅是性别方面,在经过本身就隐藏有社会偏见的数据库训练之后,人工智能会在种族、文化等方面产生各种定势。无怪乎业界有这样对于烂数据库训练出烂智能的自嘲:垃圾进,垃圾出(Garbage in,Garbage out)。

微信翻译不对怎么办(微信翻译翻车事件)(11)

原本为解决问题而生的人工智能,似乎给人类带来了不少新问题。不过,这也是复杂事物发展的必经之路。

先不提人工智能在产生大半个世纪的时间里就已经为人类带来了众多便利,试想从第一次工业革命开始,哪一项改变世界的技术不是经历了各种问题的考验呢?

对科技的发展多一点耐心,也是给我们自己和世界更多改变的可能。

以上。

微信翻译不对怎么办(微信翻译翻车事件)(12)

猜您喜欢: