快捷搜索:  汽车  科技

机器翻译的基本流程是什么(机器翻译系统挑战CET6翻译考试)

机器翻译的基本流程是什么(机器翻译系统挑战CET6翻译考试)“经过三百年的发展,唐代中国成为世界上最繁荣的强国,其首都长安是世界上最大的都市,这一时期,经济发达,商业繁荣,社会秩序稳定,甚至边境也对外开放,随着城市化的财富的增加,艺术和文学也繁荣起来。”词汇量是第一需要具备的,目前六级词汇量要求达到6000个,其中不乏生僻词汇和短语;由于汉英间表达习惯的不同,逻辑、语序调整也十分重要。12月18日,合肥师范学院一教室内,试题输入人员在公证人员的见证下现场给科大讯飞机器翻译系统录入试题成绩:轻松获大学英语六级翻译“优秀”大学英语六级翻译测试共有三道考题。按规定,考生们只需作答一题,时间是半小时。

12月18日下午,合肥师范学院举办了一场特殊的考试。说它特殊,是因为“考生”只有一个,而且是一套机器翻译系统。

考题来自三天前刚结束的大学英语六级考试,评分的是两位具有六级阅卷经验的高校资深专家。“考生”一口气做了三道翻译题,每道题满分15分,它得到13分的均分,每题用时只有5秒。

“这套机器翻译系统的表现让我们惊喜,翻译得很地道。”对于成绩,专家的鉴定是:优秀!

看似普通的系统背后,是机器翻译领域近一个世纪的技术积累,也包含着科大讯飞创新实现的领域翻译技术突破以及最新推出的行业翻译解决方案。

机器翻译的基本流程是什么(机器翻译系统挑战CET6翻译考试)(1)

12月18日,合肥师范学院一教室内,试题输入人员在公证人员的见证下现场给科大讯飞机器翻译系统录入试题

成绩:轻松获大学英语六级翻译“优秀”

大学英语六级翻译测试共有三道考题。按规定,考生们只需作答一题,时间是半小时。

词汇量是第一需要具备的,目前六级词汇量要求达到6000个,其中不乏生僻词汇和短语;由于汉英间表达习惯的不同,逻辑、语序调整也十分重要。

“经过三百年的发展,唐代中国成为世界上最繁荣的强国,其首都长安是世界上最大的都市,这一时期,经济发达,商业繁荣,社会秩序稳定,甚至边境也对外开放,随着城市化的财富的增加,艺术和文学也繁荣起来。”

这是去年六月的一道翻译题,一连8个逗号,考验着考生们的逻辑,不少考生连呼“太烧脑”。正因为如此,大学英语六级,每次通过率只有30%左右。

科大讯飞团队12月14日就将机器和系统封存在公证处,“此举旨在确保在断网和无人工干预的情况下测评。”科大讯飞负责机器翻译的研发人员说。12月18日,在公证人员的见证下,考官分别打开三道考题,由人工输入电脑后系统作答,不到5秒便导出了文本。

成绩令人惊喜:每道题取三位评分专家的平均分,再计算三道题的平均分,最终机器翻译系统拿下13分。参考往年大学英语六级翻译考题的表现,可达到优秀六级考生的水平。

现场两位评分专家来自上海交通大学外语学院,“这套系统翻译出来的语言质量很高、语法也很地道,表现好过我们得预期让我们惊喜。” 她们给出的评价称:机器翻译能准确表达原文意思、译文流畅、结构清晰,可以较好的辅助不同语言的信息沟通。

据悉,在参加此次评测前,科大讯飞研发人员在2014年6月到2018年6月的大学英语六级26道翻译考题上进行了测试,平均分达到12.8分,与此次测试结果基本持平,“这也说明机器翻译可以稳定在高水平。”

难点:自然语言的复杂性

“但到目前为止,机器翻译到底达到了什么样的水平,还没有人能够给出明确答案。”科大讯飞负责机器翻译的研发人员说。

大学英语六级考试正是一种权威客观的衡量方式,“借助于六级中的翻译考题,我们想客观公正地给出当前以汉译英为例的机器翻译技术水平的评估,包括还存在哪些差距。”这样一方面为后续研究提供思路,另一方面也可进一步指导机器翻译技术应用。

据了解,科大讯飞自2012年启动机器翻译的研发工作,目前很多技术已达到世界领先水平。2014年,在IWSLT口译翻译比赛上就取得了中英互译的第一名;2015年在NIST国际openMT机器翻译比赛,中英人工主观分获得冠军;刚刚过去的2018年IWSLT比赛,在端到端的语音翻译上再次以显著优势取得第一名的成绩。

“但机器翻译还是很难,主要是其处理的对象——自然语言存在复杂性。”研发人员介绍,自然语言是人类在社会生活中,通过不断的重复性使用而自然进化形成的沟通媒介(语言),并且在此过程中缺少规划和设计,使得语言本身就存在诸多不确定性,“同样一句话,在不同的语境中不同人就有不同的理解。”

创新:不让器翻译系统“偏科”

机器翻译系统何以在大学英语翻译权威评测中获得好成绩?

“一是核心算法,二是大规模语料库,三是高性能计算平台。”研究人员介绍,机器翻译技术是利用计算机把一种自然语言翻译成另一种自然语言,从1933年正式被提出开始,目前已发展有三代技术、取得了长足的进步。

“最新一代技术是基于端到端的神经机器翻译。” 神经机器翻译算法的提出,是当前机器翻译取得重大突破的关键。但想拿到高分,少不了“独门秘笈”。

“六级翻译题涉及文化、经济、历史、社会等多领域,还有不少专业表达或中国特色词汇,在整个翻译系统可供训练的语料中是比较匮乏的。”科大讯飞为了破解这一难题,对神经机器翻译进行若干改进,其中一项重要改进是领域翻译技术,即在通用翻译模型之上进行了领域定制。

其中一项技术是领域个性化。“传统翻译模型一般针对具体应用场景搜集该领域相关语料,但在实际应用中,由于‘精力不够’会导致其他领域的翻译效果受影响。”这就好比学习中的“偏科”,从而影响了总分。为此,科大讯飞研发人员在保持原有翻译系统不变的基础上、引入额外的旁支模型,“可最大程度实现目标领域和其他领域翻译性能的兼顾。”

“翻译中常会遇到行业术语,有的机器可能没有见过、有的见过却在不同行业有不同翻译方式。”科大讯飞给出的解决方案是:提前将行业领域的关键词汇融入翻译模型,指导机器在平日训练中自动学习术语,从而在翻译过程中产生正确的译文。

基于上述领域翻译技术,科大讯飞推出了面向行业的翻译解决方案。

应用:有请“行业翻译官”

早在2016年,科大讯飞就发布了讯飞翻译机产品,并在业界第一个推出了纯离线的神经网络的离线口语翻译系统。而今,讯飞翻译机的用户遍及全球170个国家。

未来,有了最新的翻译技术,它们会有什么改变?

在某跨国医疗技术峰会现场,你可以拿出最新升级的讯飞翻译机2.0,和与会外宾专家畅聊。从“口袋里的翻译官”升级为“行业翻译官”,这台小机器在通用翻译模式下新增行业翻译模式,正是使用了该技术;除了金融,在医疗、计算机等行业专业场景下都可以实现中文与英文的及时互译。

环保论坛会前,有了最新的机器翻译技术,不仅领域和行业术语定制的又准又好,整体的翻译效果也不会打折扣。

即便你是职场新人,当上司给你布置了厚厚一叠出口产品说明书的翻译时,你也不必挑灯夜战了。因为最新的机器翻译技术可以辅助笔译,“可让机器先翻译一遍、人工再精修。”

让人类更便捷的交流、更轻松的工作,机器翻译技术的发展也正在是实现着用人工智能建设美好世界的愿景。

“由于语言本身的复杂性,机器翻译还有很长的路要走。”科大讯飞负责机器翻译的研发人员告诉记者,对翻译技术的研究是为了更好地辅助人类进行语言沟通,帮助普通人达到一定的外语水平;但也需要人工来帮助机器完成无法处理的问题、更好的解决自身局限,“专业翻译人员在翻译过程中积累的语料和知识,反过来也能促进机器进化,这是人机协同的逻辑。”(光明融媒记者 常河)

猜您喜欢: