内蒙古社科院蒙古语言研究所(重点实验室巡礼)
内蒙古社科院蒙古语言研究所(重点实验室巡礼)02 推动团队建设 重点实验室收获更多科研成果目前,实验室共承担科研项目34项,其中包括国家重点研发计划(政府间国际科技创新合作重点专项)1项,国家自然科学基金10项。2019年实验室还投入216万元,购置了GPU计算集群,进一步提高了实验室的计算能力,为产出高水平的科研成果提供保障。“2007年,内蒙古科技厅批准建设内蒙古蒙古文信息处理技术重点实验室。实验室成立以来,研究开发了蒙古文信息检索系统、蒙古文印刷体识别系统、蒙古文古籍检索系统及以蒙古文为主的多语种电子辞典等软件。实验室的基础研究不断提升,为实现计算机‘开口’说蒙古语奠定了基础。”重点实验室主任高光来兴奋地说,2019年实验室在自治区科技厅组织的化工、信息、生态和蒙药4个领域的评估考核中,获得全区优秀重点实验室称号,标志着蒙古文处理重点实验室在自治区重点实验室布局中有了一席之地。内蒙古自治区蒙古文信息处理技术重点实验室工作中科研
随着蒙古语AI合成主播问世、蒙古文人工智能AI平台发布,从内蒙古自治区蒙古文信息处理技术重点实验室(以下简称实验室)走出的科研成果,让蒙古语与人工智能结合从理想照进现实。
内蒙古自治区蒙古文信息处理技术重点实验室科研工作者们
01 立足基础研究 计算机“开口”说蒙古语
让计算机“开口”说话是计算机语音合成研究的成果。2016年,蒙古文信息处理技术重点实验室研制成功了国内首款蒙古语语音识别和语音合成系统,该系统实现蒙古语大词汇量连续语音识别功能,识别正确率达到90%以上,让计算机不仅能听懂蒙古语,还能“开口”说蒙古语。
“2007年,内蒙古科技厅批准建设内蒙古蒙古文信息处理技术重点实验室。实验室成立以来,研究开发了蒙古文信息检索系统、蒙古文印刷体识别系统、蒙古文古籍检索系统及以蒙古文为主的多语种电子辞典等软件。实验室的基础研究不断提升,为实现计算机‘开口’说蒙古语奠定了基础。”重点实验室主任高光来兴奋地说,2019年实验室在自治区科技厅组织的化工、信息、生态和蒙药4个领域的评估考核中,获得全区优秀重点实验室称号,标志着蒙古文处理重点实验室在自治区重点实验室布局中有了一席之地。
内蒙古自治区蒙古文信息处理技术重点实验室工作中科研工作者 中新网供图
高光来介绍,实验室研究团队依托内蒙古大学计算机学院,2003年和2007年,团队先后承担了国家863计划课题和国家973计划专项课题,主要研究方向包括蒙古文智能信息处理、人工智能与模式识别、图像处理与虚拟现实。实验室成立初衷就以蒙古文智能信息处理研究、蒙古文软件开发为重点,2019年该实验室获批国家重点研发计划(政府间国际科技创新合作重点专项)1项。率先研制出“蒙古文OCR系统”、“蒙古语大规模连续语音识别系统”、“蒙古语语音合成系统”、“西里尔蒙古文与传统蒙古文相互转换系统”、 “蒙古文校正系统”、 “蒙古文古籍图像检索系统”、“奥云蒙古文智能输入法”和“奥云AI人工智能平台”等,这些成果已在国内外广泛应用,并在国内外同行中产生了重要影响。
目前,实验室共承担科研项目34项,其中包括国家重点研发计划(政府间国际科技创新合作重点专项)1项,国家自然科学基金10项。2019年实验室还投入216万元,购置了GPU计算集群,进一步提高了实验室的计算能力,为产出高水平的科研成果提供保障。
02 推动团队建设 重点实验室收获更多科研成果
“人工智能不仅仅是推动数字经济产业转型升级的核心驱动力,也是新一轮科技竞赛的制高点。”在高光来看来,蒙古语人工智能发展的关键在聚集培养优秀科技人才。
“为了推动团队建设,加强对外交流,2019年实验室团队承办了“全国高性能计算学术年会”(HPC China 2019),该会议是全国高性能计算领域规模最大的盛会,涉及了高性能计算领域的学术、技术和产业等方面。”高光来说,为了进一步推动团队建设,2019年还邀请了中国科学院陈国良院士、中国工程院院士廖湘科来实验室考察交流。同年,实验室派出博士生刘瑞、李号到新加坡和美国等地访学。
高光来介绍,实验室的科研团队从最初的5-6人到现在的19人,其中17人具有博士学位,12人是从国内外引进的学术骨干和优秀博士,并且,团队中4人为蒙汉英兼通的蒙古族博士。目前,实验室正在培养16名博士研究生和113硕士研究生,其中16名学术型硕士研究生和19名专业学位硕士研究生已毕业并获得硕士学位。2012年,该实验室的“蒙古文软件研究与开发团队”入选自治区草原英才产业创新人才团队。2019年实验室团队共发表学术论文42篇,其中SCI收录1篇、CCF A类1篇、CCF B类3篇、CCF C 类21篇。
去年,实验室相继发布了“蒙汉机器翻译系统”、“奥云蒙古文智能输入法”和“奥云蒙古文AI平台”,实现了蒙古文从信息化时代到人工智能时代的重要跨越,它们服务于内蒙古日报社和内蒙古高级人民法院等多家单位,大幅提高了记者、编辑和法官的工作效率。目前,奥云蒙古文智能手机输入法安装量已超过17万,并且得到了用户的广泛好评。
“蒙古文信息化建设,对于蒙古族文化的发展具有重要的保护及传承作用,所以对于蒙古文信息化、人工智能化的研究,我们从前在研究,今天在研究,今后也会继续研究下去,助力蒙古族文化走向世界。”高光来说。
03 发展科学创新 蒙古语“牵手”人工智能
近日,国内首款蒙古语“奥云AI合成主播”首秀成功,实现了蒙古语与人工智能和新闻采编的深度融合。
国内首款蒙古语AI合成主播小道
参与奥云AI合成主播研发的内蒙古大学计算机学院副教授飞龙介绍,“此次的AI合成主播以蒙古文或汉文新闻稿件为输入,通过蒙汉相互自动翻译技术自动生成蒙汉双语稿件,并通过AI合成技术自动生成与蒙古文稿件对应的主播视频和双语字幕,可以对虚拟主播音视频生产编排,一键生成蒙古语音视频智能播报。该AI合成主播采用蒙古语语音合成、蒙汉机器翻译、人脸关键点检测、人脸特征提取、人脸重构、唇语识别、手势姿态合成等多项前沿技术,并结合语音、图像等多模态信息进行建模训练后,生成与真人无异的蒙古语AI分身模型,进而提高信息表达和传递的效率。”
飞龙介绍,“奥云AI合成主播”离不开“蒙古文人工智能AI平台”,平台可以一站式解决蒙古文信息处理需求。该平台的“汉蒙文本相互自动翻译”、“蒙汉语音相互翻译”、“汉蒙人名翻译”等是基于团队积累的大规模蒙汉对照语料和深度学习技术实现的,有效提高了蒙汉文档的翻译效率。“传统蒙古文与西里尔蒙古文相互转换”系统转换准确率可达95%以上。“蒙古文自动校正”功能能够解决显现形式相同但编码错误单词的统计和检索问题,可以较好地校正显现形式相同但编码错误的单词,也可以根据上下文正确选择显现形式相同但编码不同的单词。
蒙古语语音识别、语音合成等系统的成功研发应用,让蒙古语与人工智能接轨,进一步推动蒙古语在教育、气象、交通等多个领域的运用,为蒙古族文化传播插上了高科技羽翼。
(基础研究处)