ai内蒙古(内蒙古自治区蒙古文信息处理技术重点实验室)
ai内蒙古(内蒙古自治区蒙古文信息处理技术重点实验室)“由于蒙古文信息化工作在国内外均没有可借鉴或可运用的技术资源,导致蒙古语言文字信息处理技术发展较为滞后,过去一直没有功能齐全的蒙古文输入法。”实验室副主任飞龙教授告诉记者。在国内,国家通用语言信息处理技术相对成熟,团队利用通用语言优势,广泛学习借鉴相关信息化技术。如今,手机、电脑等终端成为人们获取信息的重要手段。但对于蒙古族语言文字使用者来说,互联互通的信息世界仍有限制,他们对蒙古文信息化有着迫切需求。信息飞速发展的当下,如何传承保护好少数民族语言文字、图书古籍以及音视频文件,让各族人民群众尽享科技发展的红利?在内蒙古自治区蒙古文信息处理技术重点实验室(以下简称实验室),有这样一支年轻的团队,他们视民族文化传承与保护为己任,始终为蒙古文信息化发展付出不懈努力。随着全球首款综合性蒙古文人工智能信息处理云服务平台“蒙古文人工智能AI平台”、国内首款蒙古语“奥云AI合成主播”、国内首款具备手写语
“蒙古文AI云服务平台”获得2020年中国CCF科学技术奖。
飞龙教授(左二)与研究生一同探讨科研问题。
高光来教授(前排左一)指导实验室研究工作。
第三届中蒙博览会上,蒙古语智能交互机器人与参观者进行智能对话。□本报记者 白莲
信息飞速发展的当下,如何传承保护好少数民族语言文字、图书古籍以及音视频文件,让各族人民群众尽享科技发展的红利?在内蒙古自治区蒙古文信息处理技术重点实验室(以下简称实验室),有这样一支年轻的团队,他们视民族文化传承与保护为己任,始终为蒙古文信息化发展付出不懈努力。
随着全球首款综合性蒙古文人工智能信息处理云服务平台“蒙古文人工智能AI平台”、国内首款蒙古语“奥云AI合成主播”、国内首款具备手写语音识别功能的蒙古文输入法等一系列科研成果走出实验室,走入生产生活,不仅让蒙古语与人工智能结合从理想照进现实,也助力蒙古语在教育、气象、交通等多个领域的运用,让蒙古族文化在新时代重新焕发出新的活力。
让计算机“能听会说”蒙古语
如今,手机、电脑等终端成为人们获取信息的重要手段。但对于蒙古族语言文字使用者来说,互联互通的信息世界仍有限制,他们对蒙古文信息化有着迫切需求。
“由于蒙古文信息化工作在国内外均没有可借鉴或可运用的技术资源,导致蒙古语言文字信息处理技术发展较为滞后,过去一直没有功能齐全的蒙古文输入法。”实验室副主任飞龙教授告诉记者。在国内,国家通用语言信息处理技术相对成熟,团队利用通用语言优势,广泛学习借鉴相关信息化技术。
一切从零开始,一点点累积。
韵律建模问题是影响语音合成自然度和可懂度的重要因素。随着深度学习技术的发展,在海量文本和语音数据的支撑下,韵律建模可以取得令人满意的效果。但是,在面对蒙古语这样的低资源语言时,韵律建模往往充满很多挑战。
“第一,蒙古文韵律建模的数据规模有限,没有海量的文本和语音数据用于模型的充分训练;第二,蒙古文独特的黏着语特性导致蒙古文单词具有复杂的构词特点,现有的韵律建模方法并没有充分挖掘与韵律表达相关的构词特点以用于蒙古文韵律模型的训练。”飞龙告诉记者,为了解决以上问题,研究团队提出了一种蒙古文单词表示特征强化方法,并融合自注意力机制进行韵律标签的预测。实验结果证明,该方法可以有效提升蒙古文韵律建模的精度,并且最终提升蒙古语语音合成系统合成语音的整体表现。
飞龙教授现场为记者展示了这款具有自主知识产权的具备手写语音功能的蒙古文输入法,该输入法能够将用户说的蒙古语,在短短几秒内转换成对应的文本内容。同时,还具有蒙古文手写识别输入、蒙古文词组联想输入等6项功能。目前,奥云蒙古文智能手机输入法安装量已超过45万,并且得到了用户的广泛好评。
“自2007年实验室成立以来,研究开发了蒙古文信息检索系统、蒙古文印刷体识别系统、蒙古文古籍检索系统及以蒙古文为主的多语种电子辞典等软件。实验室的基础研究不断提升,为实现计算机‘能听会说’蒙古语奠定了基础。”实验室主任高光来教授表示。
“让计算机‘开口’说话是计算机语音合成研究的成果。利用人工智能深度学习技术,让计算机不仅能听懂蒙古语,还能‘说’蒙古语,是我们一直以来努力的方向。”飞龙教授告诉记者。
2019年,国内首款蒙古语“奥云AI合成主播”首秀成功,实现了蒙古语与人工智能和新闻采编的深度融合。
该AI合成主播采用蒙古语语音合成、蒙汉机器翻译、人脸关键点检测、人脸特征提取、人脸重构、唇语识别、手势姿态合成等多项前沿技术,生成与真人无异的蒙古语AI分身模型,进而提高信息表达和传递的效率。
近年来,国家以及自治区大力推动少数民族语言文字信息化工作,极大地推动了实验室蒙古语智能信息化研发工作。高光来介绍,实验室成立的初衷,就是以蒙古文智能信息处理研究与蒙古文软件开发为重点。研究团队依托内蒙古大学计算机学院,先后承担了国家相关计划专项课题,主要研究方向包括蒙古文智能信息处理、人工智能与模式识别、图像处理与虚拟现实。
2019年,实验室推出了国内首款蒙古文人工智能AI平台,该平台免费为用户提供“蒙古文印刷体识别(OCR)”“蒙汉相互自动机器翻译”“传统蒙古文与新蒙古文相互转换”等一系列功能,为蒙古语言文字信息处理任务提供了全面的智能化解决方案。
目前,该平台已在中国和蒙古国得到广泛应用,满足了宣传、教育、文化、司法、办公、政务等领域的蒙古语言文字智能信息处理需求,提升了我国少数民族语言文字智能化水平,对于保护和传承少数民族语言文字与特色文化,发展少数民族地区经济具有重要意义。
用信息化成果传承保护文化古籍
目前,自治区很多单位保存有大量早期出版发行的蒙古文图书、报纸和文档,是非常珍贵的文献资源。基于这些资源,利用蒙古文信息处理技术,建立蒙古文大数据资源库,对蒙古语言文字信息化发展具有重要意义。
这些宝贵文献的数字化过程中,早期公开的蒙古文印刷体识别系统仅能处理蒙古文白体印刷的文档,识别精度比较低,难以满足实际应用需要。
面向蒙古文共享工程、蒙古文应用推广和蒙古文信息化相关建设需要,实验室做了大量工作,持续研发“蒙古文OCR系统”等应用平台和软件产品,成为助力蒙古文数字化的有效途径。
通过蒙古语言文字信息化建设,推动了区内外相关企事业单位、科研院校之间的技术交流和相互协作,促进了蒙古语言文字信息化在基础研究、人才培养、技术研发、资源建设、推广应用等领域的全面发展,使信息化建设成果不断惠及各族群众。
“人工智能、‘互联网 ’时代,社会对信息相关专业人才的需求日益增长,而我们所做的,正是以完备的软硬件设施与雄厚的师资力量,为国家培养和输送高质量人才。”在高光来教授看来,蒙古语人工智能发展的关键在于聚集培养优秀科技人才。
高光来介绍,实验室的科研团队从最初的5-6人到现在的19人,其中17人具有博士学位,12人是从国内外引进的学术骨干和优秀博士,并且,团队中4人为蒙汉英兼通的蒙古族博士。目前,实验室正在培养16名博士研究生和113名硕士研究生,其中16名学术型硕士研究生和19名专业学位硕士研究生已毕业并获得硕士学位,为少数民族语言信息化的发展提供了人才保障和技术支撑。
目前,实验室共承担科研项目34项,其中包括国家重点研发计划(政府间国际科技创新合作重点专项)1项,国家自然科学基金10项。2019年和2020年,实验室总投入605万元,购置了GPU计算集群,进一步提高了实验室的计算能力,为产出高水平的科研成果提供保障。
“蒙古文信息化建设,对蒙古族文化的发展具有重要的保护及传承作用,所以,对于蒙古文信息化和人工智能化,我们从前在研究,现在在研究,今后也会继续研究下去,助力蒙古族文化走向世界。”高光来教授说。
(配图由受访者提供)