第一句子大全,网罗天下好句子,好文章尽在本站!

创新实验室|自治区蒙古文信息处理技术重点实验室:当蒙古语“牵手”人工智能

时间:2020-10-06

作为科技创新的桥头堡和主阵地,国家级、自治区级重点实验室是组织高水平基础和应用基础研究、聚集和培养优秀科技人才、开展国内外学术交流、共享先进创

友情提示:本文共有 3161 个字,阅读大概需要 7 分钟。

开栏的话

创新是引领发展的第一动力。作为科技创新的桥头堡和主阵地,国家级、自治区级重点实验室是组织高水平基础和应用基础研究、聚集和培养优秀科技人才、开展国内外学术交流、共享先进创新资源的重要基地。

“针对学科发展前沿和自治区经济社会发展的重要科技领域和方向,开展创新性研究,增强科技储备和原始创新能力”,是国家级、自治区级重点实验室的主要任务。

目前,我区共有各类重点实验室151家,其中,国家重点实验室3家、自治区重点实验室148家,覆盖化工、蒙中医药、农牧业、新能源、生态环保等优势特色领域。这些重点实验室中,依托高校建设的有86家、占比57%;依托科研院所和医院建设的有25家、占比17%;依托企业建设的有40家、占比26%。

高大上的重点实验室有哪些富有成效的创新案例?发生了哪些鲜为人知的创新故事?实验室的技术成果、研发应用等为助推经济高质量发展提供了哪些有益的借鉴?

自治区科技厅与内蒙古日报科技版共同策划《创新实验室》专栏,带领大家走进这些“高冷神秘”的科研机构一窥究竟,敬请关注。

内蒙古自治区蒙古文信息处理技术重点实验室科研工作者们

信息飞速发展的当下,如何传承保护好少数民族语言文字、图书古籍以及音视频文件,让各族人民群众尽享科技发展的红利?在内蒙古自治区蒙古文信息处理技术重点实验室(以下简称实验室),有这样一支年轻的团队,他们视民族文化传承与保护为己任,始终为蒙古文信息化发展付出不懈努力。

随着全球首款综合性蒙古文人工智能信息处理云服务平台“蒙古文人工智能AI平台”、国内首款蒙古语“奥云AI合成主播”、国内首款具备手写语音识别功能的蒙古文输入法等一系列科研成果走出实验室,走入生产生活,不仅让蒙古语与人工智能结合从理想照进现实,也助力蒙古语在教育、气象、交通等多个领域的运用,让蒙古族文化在新时代重新焕发出新的活力。

1

让计算机“能听会说”蒙古语

“由于蒙古文信息化工作在国内外均没有可借鉴或可运用的技术资源,导致蒙古语言文字信息处理技术发展较为滞后,过去一直没有功能齐全的蒙古文输入法。”实验室副主任飞龙教授告诉记者。在国内,国家通用语言信息处理技术相对成熟,团队利用通用语言优势,广泛学习借鉴相关信息化技术。

飞龙教授(左二)与研究生一同探讨科研问题

一切从零开始,一点点累积。

韵律建模问题是影响语音合成自然度和可懂度的重要因素。随着深度学习技术的发展,在海量文本和语音数据的支撑下,韵律建模可以取得令人满意的效果。但是,在面对蒙古语这样的低资源语言时,韵律建模往往充满很多挑战。

“第一,蒙古文韵律建模的数据规模有限,没有海量的文本和语音数据用于模型的充分训练;第二,蒙古文独特的黏着语特性导致蒙古文单词具有复杂的构词特点,现有的韵律建模方法并没有充分挖掘与韵律表达相关的构词特点以用于蒙古文韵律模型的训练。”飞龙告诉记者,为了解决以上问题,研究团队提出了一种蒙古文单词表示特征强化方法,并融合自注意力机制进行韵律标签的预测。实验结果证明,该方法可以有效提升蒙古文韵律建模的精度,并且最终提升蒙古语语音合成系统合成语音的整体表现。

飞龙教授现场为记者展示了这款具有自主知识产权的具备手写语音功能的蒙古文输入法,该输入法能够将用户说的蒙古语,在短短几秒内转换成对应的文本内容。同时,还具有蒙古文手写识别输入、蒙古文词组联想输入等6项功能。目前,奥云蒙古文智能手机输入法安装量已超过45万,并且得到了用户的广泛好评。

“自2007年实验室成立以来,研究开发了蒙古文信息检索系统、蒙古文印刷体识别系统、蒙古文古籍检索系统及以蒙古文为主的多语种电子辞典等软件。实验室的基础研究不断提升,为实现计算机‘能听会说’蒙古语奠定了基础。”实验室主任高光来教授表示。

“让计算机‘开口’说话是计算机语音合成研究的成果。利用人工智能深度学习技术,让计算机不仅能听懂蒙古语,还能‘说’蒙古语,是我们一直以来努力的方向。”飞龙教授告诉记者。

蒙古语AI合成主播小道

2019年,国内首款蒙古语“奥云AI合成主播”首秀成功,实现了蒙古语与人工智能和新闻采编的深度融合。

该AI合成主播采用蒙古语语音合成、蒙汉机器翻译、人脸关键点检测、人脸特征提取、人脸重构、唇语识别、手势姿态合成等多项前沿技术,生成与真人无异的蒙古语AI分身模型,进而提高信息表达和传递的效率。

近年来,国家以及自治区大力推动少数民族语言文字信息化工作,极大地推动了实验室蒙古语智能信息化研发工作。高光来介绍,实验室成立的初衷,就是以蒙古文智能信息处理研究与蒙古文软件开发为重点。研究团队依托内蒙古大学计算机学院,先后承担了国家相关计划专项课题,主要研究方向包括蒙古文智能信息处理、人工智能与模式识别、图像处理与虚拟现实。

2019年,实验室推出了国内首款蒙古文人工智能AI平台,该平台免费为用户提供“蒙古文印刷体识别(OCR)”“蒙汉相互自动机器翻译”“传统蒙古文与新蒙古文相互转换”等一系列功能,为蒙古语言文字信息处理任务提供了全面的智能化解决方案。

目前,该平台已在中国和蒙古国得到广泛应用,满足了宣传、教育、文化、司法、办公、政务等领域的蒙古语言文字智能信息处理需求,提升了我国少数民族语言文字智能化水平,对于保护和传承少数民族语言文字与特色文化,发展少数民族地区经济具有重要意义。

2

用信息化成果传承保护文化古籍

目前,自治区很多单位保存有大量早期出版发行的蒙古文图书、报纸和文档,是非常珍贵的文献资源。基于这些资源,利用蒙古文信息处理技术,建立蒙古文大数据资源库,对蒙古语言文字信息化发展具有重要意义。

这些宝贵文献的数字化过程中,早期公开的蒙古文印刷体识别系统仅能处理蒙古文白体印刷的文档,识别精度比较低,难以满足实际应用需要。

面向蒙古文共享工程、蒙古文应用推广和蒙古文信息化相关建设需要,实验室做了大量工作,持续研发“蒙古文OCR系统”等应用平台和软件产品,成为助力蒙古文数字化的有效途径。

通过蒙古语言文字信息化建设,推动了区内外相关企事业单位、科研院校之间的技术交流和相互协作,促进了蒙古语言文字信息化在基础研究、人才培养、技术研发、资源建设、推广应用等领域的全面发展,使信息化建设成果不断惠及各族群众。

高光来教授(前排左一)指导实验室研究工作

“人工智能、‘互联网+’时代,社会对信息相关专业人才的需求日益增长,而我们所做的,正是以完备的软硬件设施与雄厚的师资力量,为国家培养和输送高质量人才。”在高光来教授看来,蒙古语人工智能发展的关键在于聚集培养优秀科技人才。

高光来介绍,实验室的科研团队从最初的5-6人到现在的19人,其中17人具有博士学位,12人是从国内外引进的学术骨干和优秀博士,并且,团队中4人为蒙汉英兼通的蒙古族博士。目前,实验室正在培养16名博士研究生和113名硕士研究生,其中16名学术型硕士研究生和19名专业学位硕士研究生已毕业并获得硕士学位,为少数民族语言信息化的发展提供了人才保障和技术支撑。

目前,实验室共承担科研项目34项,其中包括国家重点研发计划(政府间国际科技创新合作重点专项)1项,国家自然科学基金10项。2019年和2020年,实验室总投入605万元,购置了GPU计算集群,进一步提高了实验室的计算能力,为产出高水平的科研成果提供保障。

“蒙古文信息化建设,对蒙古族文化的发展具有重要的保护及传承作用,所以,对于蒙古文信息化和人工智能化,我们从前在研究,现在在研究,今后也会继续研究下去,助力蒙古族文化走向世界。”高光来教授说。

(来源:内蒙古日报)

【来源:创新内蒙古】

声明:转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。 邮箱地址:newmedia@xxcb.cn

本文如果对你有帮助,请点赞收藏《创新实验室|自治区蒙古文信息处理技术重点实验室:当蒙古语“牵手”人工智能》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
「铸牢中华民族共同体意识」包立道:多种语言助力蒙医药赢得世界认可

「铸牢中华民族共同体意识」包立道:多种语言助力蒙医药赢得世界认可

...业推向更高的平台。在内蒙古医科大学附属医院精准药学实验室,由包立道的团队研发的国内首个蒙药益生菌复合制剂项目已完成科研转化意向。新产品分别有降血糖和抗失眠的作用,是蒙医药领域的一个新突破,预计年内就能...

2009-06-21 #经典句子

智能语音领域取得突破:猿辅导斩获国际人工智能赛事冠军

智能语音领域取得突破:猿辅导斩获国际人工智能赛事冠军

...(ICASSP)近期公布的比赛结果显示,来自猿辅导人工智能实验室的研究团队在“M2VoC(多说话人多风格音色克隆大赛)”中获得子赛道第一名。这表明该研究团队在智能语音的部分关键核心技术和应用上取得重要进展。作为2021年...

2018-05-17 #经典句子

内蒙古:蓝天白云间铺展民族文化优美画卷

内蒙古:蓝天白云间铺展民族文化优美画卷

...”下基层小分队惠民演出活动都会持续开展。乌兰牧骑的蒙古语原意是“红色的嫩芽”,后被引申为“红色文艺轻骑兵”,是适应草原地区生产生活特点而诞生的文化工作队。2017年11月,习近平总书记在给内蒙古自治区苏尼特右...

2012-01-20 #经典句子

探索中国人工智能国家重点实验室的脉络

探索中国人工智能国家重点实验室的脉络

有:中国科学技术大学人工智能与智能自动化国家重点实验室、北京大学计算机科学与技术国家重点实验室、清华大学经济管理学院国家重点实验室、复旦大学智能计算与系统国家重点实验室、中国科学院网络安全技术国家重点...

2024-01-24 #大杂绘

内蒙古:小城里掀起“语言互学热”

内蒙古:小城里掀起“语言互学热”

何琼参加蒙古语学习班。(受访者供图)新华社呼和浩特11月7日电(记者勿日汗)在长调歌声的悠扬旋律中,身着蒙古族传统摔跤服的何琼,挥舞着双臂,步入草原那达慕的女子摔跤场地。很难有人想到,这位会说蒙古语、爱穿...

2023-06-24 #经典句子

熟练掌握多种语言文字对我的成长很重要——访全国政协委员 内蒙古师范大学党委副书记

熟练掌握多种语言文字对我的成长很重要——访全国政协委员 内蒙古师范大学党委副书记

...不变”,保护少数民族语言文字的政策长期不变,国家和自治区一直在不断推动民族教育的发展。民族学校教师在教学过程中要给孩子多种选择。孩子们掌握国家通用语言文字后,就可以在学习过程中与少数民族语言文字融会贯...

2022-12-18 #经典句子

西媒文章:人工智能展示中国未来

西媒文章:人工智能展示中国未来

...制造产品原型,与对外展示的办公主楼层风格完全两样,实验室里到处都是电缆、屏幕、难以识别用途的零件和各种材料的外壳。但一个经常出现的圆形物体引起了记者的注意,陪同我们采访的交流部经理陈杰恩(音)介绍说:...

2014-05-17 #经典句子

聚焦全球人工智能技术大会 爱数智慧CEO张晴晴分享多语种对话式AI的技术及应用

聚焦全球人工智能技术大会 爱数智慧CEO张晴晴分享多语种对话式AI的技术及应用

...院士李德毅,中国工程院院士、新疆多语种信息技术重点实验室主任吾守尔·斯拉木发表致辞。来自学术界、产业界的多位重磅嘉宾如百度CTO王海峰、科大讯飞研究院执行院长刘聪、华为诺亚实验室语音语义首席科学家刘群等带...

2023-09-24 #经典句子