有道翻译可以选择专业吗(网易有道的新尝试)
有道翻译可以选择专业吗(网易有道的新尝试)机器翻译、人工智能其实和上面的例子一样,只是另一种技术革新,它能够让人类专注于更新、更重要、更能发挥创造力的那部分工作。所以,机器翻译对于翻译这个行业并不是洪水猛兽,人与机器之间的互动中,人类通过机器实现对脑力、智力的一个辅助和增强。简单的例子就是纸和笔,这就是增强人记忆力的工具,还有计算器、电脑,都是同样的道理。现在的搜索、机器翻译,图片识别,事实上同样的,也只是更多被开发出来去拓宽人脑力边界的工具而已。传统翻译和机器翻译的关系已经被探讨了太多遍,最关键的地方就在于——机器翻译的极限在哪?这个问题,极客公园在之前专访谷歌神经网络翻译工程师的时候就曾提出过,而得到的答案是「机器翻译可能永远无法替代人类」。其中一个原因是深度学习基础算法结构的能力是限制机器翻译能力的关键,虽然 Deeplearning 就是指多层数多网络的人工智能,但这并不意味着更深层、更多的网络获得更好的效果。虽然按照逻辑
翻译这件事在被人工智能「入侵」后,翻译行业或许反而来到了一个更好的时候。
自从 Google 在 2016 年 9 月推出了 GNMT(Google Neural Machine Translation)谷歌神经机器翻译系统后,所有的翻译工具也纷纷亮出了自己的神经网络翻译多年来的研发成果,这里面同样包括霸占了大半个中国移动翻译市场的网易有道。
在所有 AI 巨头都在对算法结构进行优化的时候,网易有道却在人工智能军备竞赛中做了点「不务正业」的尝试,把神经网络翻译和人工翻译通过一个更理性的方式融合到一起,而不仅仅单纯去尝试和突破目前神经网络翻译的极限。
比起死磕现有深度学习神经网络的技术极限,这种尝试让 AI 和人工分工组合的翻译模式显得更加顺势而为,也更加聪明。就像无数被机械化改造的传统工业一样,网易有道的尝试也是一种启发。
机器翻译和人工翻译
传统翻译和机器翻译的关系已经被探讨了太多遍,最关键的地方就在于——机器翻译的极限在哪?这个问题,极客公园在之前专访谷歌神经网络翻译工程师的时候就曾提出过,而得到的答案是「机器翻译可能永远无法替代人类」。
其中一个原因是深度学习基础算法结构的能力是限制机器翻译能力的关键,虽然 Deeplearning 就是指多层数多网络的人工智能,但这并不意味着更深层、更多的网络获得更好的效果。虽然按照逻辑应该是模型随着深度的增加会更强大,但实际却是随着层数的增加超过一定量级反而会使反应速度下降,这也意味着现有的神经网络很可能是存在极限的。
另一个原因在于现有的机器翻译都是针对现在已经出现过的语言现象,但面对不断更新不断发展的语言来说依然需要人来不断创造新词汇或赋予词汇新含义。
所以,机器翻译对于翻译这个行业并不是洪水猛兽,人与机器之间的互动中,人类通过机器实现对脑力、智力的一个辅助和增强。简单的例子就是纸和笔,这就是增强人记忆力的工具,还有计算器、电脑,都是同样的道理。现在的搜索、机器翻译,图片识别,事实上同样的,也只是更多被开发出来去拓宽人脑力边界的工具而已。
机器翻译、人工智能其实和上面的例子一样,只是另一种技术革新,它能够让人类专注于更新、更重要、更能发挥创造力的那部分工作。
机器是人力的延伸
根据上面简单阐述的人和机器的关系,网易有道不久前的人机翻译其实算是一个很好的例子,把网易自家的神经网络翻译 YNMT 和专业人工翻译进行分工,先由 YNMT 初译,在机器翻译结果的基础上,再由专业译员对初译结果进行编辑润色。
这种新模式的出现其实得益于神经网络让机器翻译的准确率大幅提高,让机器翻译的能力足够辅助专业翻译人员。
因为以前的机器翻译对于句子语序一直没什么好办法,比如英文到中文的词序问题。之前的机器翻译 PBMT 是基于短语的翻译方式,先把句子分成一个个短语和单词,然后独立翻译,最后对翻译出来的独立短语解释进行逻辑整理,变成句子。
而新的神经网络翻译则是将整个句子视作翻译单元,对句子中的每一部分进行带有逻辑的关联翻译,翻译每一个字或单词时都包含着整句话的逻辑。
通俗的讲,如果将翻译比作把食物从生变熟,那 PBMT 像把一颗白菜切碎了烧熟再拼凑起来,而 GNMT 则是将整颗白菜放到锅里煮,变熟后最大程度保持了逻辑原貌。
所以类似网易有道人机翻译这样的体系中,机器翻译扮演的角色就是解放人类初级劳动,让专业翻译人员的精力集中在纠错和润色上,正如每一次行业革新一样,都是将人从低级重复的工作中释放出来。
机器翻译的未来由用户决定
在极客公园之前和 Google Brain 高级研究员 Greg Corrado 的对话中,Greg 曾说过「AI 的未来不是工程师说了算,而是普通用户」。这句话对于机器翻译同样适用,翻译并不是一门炫技的东西。尤其是神经网络翻译这样的深度学习工具,最终是需要依靠用户的使用来完成自我迭代和进化的。而在这样一个正相关的关系中,让更多用户去使用自家产品就是一个关键。而上面提到的人机组合翻译就是一个从用户角度来说很不错的尝试。
吸引用户的方式很多,就产品本身来说提升用户体验、降低使用成本、提高操作效率都是非常不错的方式。就翻译来说,谷歌、微软等等的神经网络翻译对于以往词汇和短句的翻译的使用体验和效率已经有了很大提升。
不过对于一些相对复杂和长篇的翻译来说,目前的翻译软件能力还是有些捉襟见肘,而结合人工和机器翻译则可以在保证效率的同时扩大翻译软件的能力覆盖范畴。
有道人机翻译是一个典型例子,对于那些深度、大篇幅翻译的需求,人工费时、而机器翻译无法独立完成,人机结合后能够用比以往少的多的时间完成同样质量和数量的文章,同时在翻译的人工成本费用上也有了 50% 的降低。相当于用一半的价格、一半的时间完成了和以往相同的翻译工作。
近年来,专业的翻译服务不再是一个小众需求,生活和工作中越来越多专业、快速的翻译需求开始出现。而事实上,对大多数人来讲,专业翻译仍然是个奢侈品。类似通过人机分工为翻译行业带来的不仅是技术上的提升,更重要的是对于专业翻译需求用户的利好。
目前的机器翻译距离机器翻译的极限还很遥远,即使未来终究有一天机器翻译会取代人工翻译,但在此之前先通过简单的人机结合来让更多人从初级重复劳动中解放,这或许也是人工智能为普通人生活带来实质意义的重要途径。