(MLIP2025)第二十届全国少数民族语言文字信息处理学术研讨会

重要提示:会议信息包含但不限于举办时间,场地,出席人员等可能会随着时间发生变化,报名参会或沟通合作请先联系主办方确认。如果您发现会议信息不是最新版,可以通过主办方邮箱将包含最新会议信息的链接或文件通过邮箱发送至support@huiyi-123.com,审核人员将会尽快为您更新到最新版本。
会议时间:2025-02-21 ~ 2025-02-24
举办场地:相思湖国际大酒店 导航
主办单位:中国中文信息学会民族语言文字信息专业委员会 更多会议
大会主席:尼玛扎西
会议介绍

为构建少数民族语言信息处理学术领域的交互平台,倡导少数民族语言资源建设及信息处理的统一标准、统一平台、资源共享的机制,提高少数民族语言文字信息处理水平,2025年“第二十届全国少数民族语言文字信息处理学术研讨会”(MLIP 2025)将于2025年2月21日至24日在广西南宁举行。会议由中国中文信息学会民族语言文字信息专业委员会主办,广西民族大学承办。本次会议将邀请中国工程院院士、西藏大学尼玛扎西教授、北京大学穗志方教授、中国科学院自动化研究所赵军研究员、中央民族大学赵小兵教授、电子科技大学程建教授等领域专家做特邀报告,同时面向学者举办学术分论坛。

会议组委会

荣誉主席:吾守尔·斯拉木 院士 新疆大学

大会主席:尼玛扎西 院士西藏大学

副主席:韦仕珍 教授 广西民族大学校长

指导委员会

主席:吐尔根·依布拉音 新疆大学

副主席:(按姓氏首字母排序)

才让加 青海师范大学

陈玉忠 中国标准化研究所

程建 电子科技大学

古丽拉·阿东别克 新疆大学

穗志方 北京大学

刘连芳 广西达译科技有限公司

那顺乌日图 内蒙古大学

欧珠 西藏自治区政协

孙乐 中国科学院软件研究所

玄云龙 延边大学

于洪志 西北民族大学

玉素甫·艾白都拉 新疆师范大学

赵军 中国科学院自动化所

程序委员会

主席:赵小兵 中央民族大学

副主席:

华却才让 青海师范大学

海银花 内蒙古大学

飞龙 内蒙古大学

马宁西北民族大学

艾孜尔古丽·玉素甫新疆师范大学

秦董洪广西民族大学

组织委员会

主席:高兴宇广西民族大学副校长

副主席:

高定国 西藏大学

罗丽平 广西民族大学

白凤波广西民族大学

王江苗广西民族语文研究中心

特邀报告

题目:藏语语言智能与大模型

摘要:藏语语言智能是应用自然语言智能处理的方法与技术,对藏语文本、语音和图像等多模态数据进行处理、理解和生成的技术,是藏语智能研究的重要内容。目前已有许多藏语语言智能领域的研究和应用,但是在诸如领域数据不平衡条件下的多模态藏汉机器翻译等方面仍然存在许多痛点问题有待进一步解决。目前大语言模型的研究方兴未艾,技术日新月异,基于大模型的各类下游任务的研究也层出不穷。报告简要介绍了藏语语言智能的痛点问题、藏语大模型的研究情况,以及基于藏语大模型的多领域藏汉机器翻译研究现状。

主讲人简介:尼玛扎西,中国工程院院士、藏语智能全国重点实验室主任、西藏大学信息科学技术学院教授、工学博士、博士生导师。长期从事语言智能和自然语言处理技术研究与工程实践。主持国家重点研发计划重点专项、新一代人工智能国家科技重大专项、国家自然科学基金重点项目等科研课题30余项,获国家科技进步奖二等奖、全国创新争先奖状、何梁何利基金科学与技术创新奖、西藏自治区科学技术奖杰出贡献奖和省部级一等奖等十余项科技奖励。

题目:知识驱动的大模型复杂推理能力评测研究

摘要:推理能力是大模型高阶认知能力的重要体现,也是模型应对复杂多变真实场景的必备能力。人类自然数据中尽管蕴含了大量的推理知识,但推理过程,特别是复杂推理、长程推理数据仍然占比较少。因此现有的推理评测数据集规模受限,缺乏对模型长程复杂推理能力的全面评估。本报告将介绍如何通过知识驱动与数据合成相结合的方式对大模型的复杂推理能力进行细粒度评测,进而为提升模型的推理能力提供有效支撑。

主讲人简介:穗志方,北京大学计算机学院教授、博士生导师,计算语言学教育部重点实验室主任,多媒体信息处理全国重点实验室副主任,中国中文信息学会常务理事。研究领域为:自然语言处理、文本知识工程和知识图谱构建及应用。主持科技部新一代人工智能重大项目以及国家973计划课题、国家自然科学基金、国家社会科学基金等多项科研项目。在计算语言学顶级国际会议发表多篇学术论文,制订国家标准2项,研究成果获2011年度国家科技进步二等奖和2022年度国家级教学成果二等奖。

题目:大模型推理机制分析

摘要:推理是人类智能的重要组成部分,也是人工智能研究的核心内容。人工智能进入了大模型时代,研究大模型的推理机制成为非常重要的任务。该报告将首先介绍大模型推理机制分析的背景和意义、分析现有的推理测试基准,然后从探究影响因素、分析作用关系、解释推理机制三方面重点介绍目前大模型推理机制分析的主要工作,最后进行大模型推理机制分析的反思,以明确下一步的研究方向。

主讲人简介:赵军, 中国科学院自动化研究所二级研究员,博士生导师;中国科学院大学人工智能学院岗位教授;享受国务院政府特殊津贴专家;研究领域为自然语言处理、知识工程等。作为项目负责人承担科技创新2030-新一代人工智能重大项目、国家自然科学基金重点项目、国家自然科学基金联合基金重点支持项目等科研项目。在NIPS、ACL、AAAI、ICLR等重要国际会议和学术期刊上发表论文100余篇,Google Scholar总引用超过26000次;曾获第25届国际计算语言学大会最佳论文奖,第22届国际语义网大会最佳张贴论文奖论文;作为第一完成人获得中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(2018)、北京市科学技术进步奖一等奖(2019)。兼任中国中文信息学会常务理事等学术职务。

题目:少数民族语言智能技术的机遇与挑战

摘要:当今现有的NLP技术,特别是大模型技术在资源丰富语言范畴已经取得了长足进步,人工智能算法在某些领域已经超越了人类的表现。但是在少数民族语言等低资源语言领域,相关分析算法效果不佳,对真实场景的分析效果差,不能很好的在实际应用中发挥作用,对我国的政策推进的支持有限。因此,对低资源语种的NLP技术的研究显得尤为重要。本报告重点介绍我国少数民族语言文字大模型发展现状及面临的挑战,最后重点介绍了中央民族大学在低资源语言大模型研究方面的主要工作。

主讲人简介:赵小兵博士,二级教授,博士生导师。研究方向为自然语言处理、计算语言学、语言信息安全。任中央民族大学“国家语言资源监测与研究民族语言中心(国家安全研究院语言信息安全研究中心)”主任;北京市第十五届人大代表。兼任国家语委第二届全国语言文字标准化技术委员会委员;全国信息技术标准化技术委员会(SAC、TC28)第十四届字符集与编码分委会(SC2)委员;中国语文现代化学会民族语文专委会主任;中国人工智能学会多语种智能专委会副主任;中国中文信息学会民族语文信息处理专委会副主任等。主持国家自然基金重点项目《跨语言社会舆情基础理论与关键技术研究》、国家社科重大项目《多民族语言<十三经>跨学科研究及数据库建设》等科研项目34项;发表SCI Q1论文等154篇,出版学术专著8部,获国家发明专利13项,获国家民委科研成果一等奖等奖励19项;组织了全国第一届(2017)、第二届(2019)民族语文分词技术公共评测、2023年度“多语种图像描述生成评测”及2024年“大模型多语言能力及意识形态安全评测”等。

题目:自然场景文字检测识别研究进展及应用

摘要:该报告系统介绍复杂动态自然场景中文字检测和识别技术的研究进展、发展动态和趋势,并通过自然场景中藏文检测和识别为例探讨自然场景文字检测识别的应用前景和发展趋势。

主讲人简介:程建,男,1978年8月生,教授,博士生导师,电子科技大学信息与通信工程学院计算机视觉与机器智能实验室负责人,中国兵工学会智能武器装备技术专委会委员、中国自动化学会模式识别与智能系统专委会委员,主要研究方向为:人工智能、计算机视觉、机器学习等。2006年9月毕业于上海交通大学图像处理与模式识别研究所,获模式识别与智能系统专业博士学位。2022年作为中组部、团中央第22批博士服务团成员援藏。主持承担国家及省部级项目10多项、企业横向科技合作项目近20项;参与国家及省部级项目近10项。在IEEE TIP、IEEE TMM、IEEE TCSVT、ISPRS、Neural Network、CVPR、AAAI、ACM MM、IGARSS、BMVC、ICIP、ICPR等国际学术期刊和会议上发表论文150多篇,其中SCI收录50多篇,EI收录80多篇;获IEEE信号处理协会2023年最佳论文奖;申请国家发明专利60多项,其中已获得国家发明专利授权40多项。

以下内容为GPT视角对全国少数民族语言文字信息处理学术研讨会相关领域的研究解读,仅供参考:

全国少数民族语言文字信息处理研究现状

一、研究背景与需求

随着信息技术的发展和互联网的普及,对少数民族语言文字信息处理的需求越来越迫切。这不仅有助于保护和传承少数民族的语言文化,还能促进民族之间的沟通交流,提升少数民族地区的信息化水平。

二、研究现状

语料库建设

少数民族语言的语料库建设是信息处理的基础。然而,由于少数民族语言的使用者数量较少且分布广泛,语料收集工作面临巨大挑战。尽管如此,仍有大量研究致力于构建少数民族语言的语料库,并将其应用于机器翻译、语音识别等领域。

词汇表构建

许多少数民族语言缺乏标准词汇表,这限制了信息处理技术的准确性。因此,词汇表的构建成为一项重要任务。这涉及分词、词性标注、命名实体识别等技术,有助于提高机器翻译、信息检索等任务的准确性。

机器翻译

机器翻译是解决少数民族语言信息处理的一种主要手段。由于少数民族语言之间的相似性较小,且与汉语之间的关系复杂,机器翻译技术的研发面临诸多困难。然而,随着深度学习等技术的不断发展,机器翻译的准确性正在逐步提高。

语音识别

少数民族语言的发音特点较为复杂,传统的语音识别技术往往难以准确识别。因此,研究者们正在积极探索适用于少数民族语言的语音识别技术,以更准确地识别语音信息。

三、研究成果与挑战

研究成果

在一些少数民族语言如蒙古文、藏文的信息处理方面,已经取得了显著成果。例如,蒙古文信息处理国家标准已经发布,包括编码字符集、键盘字母区布局、点阵字模集等。藏文也实现了信息处理,并开发了与汉英兼容的藏文操作系统。

此外,一些研究机构和企业也在积极探索少数民族语言信息处理的新技术和新方法,如基于深度学习的机器翻译、语音识别等。

面临的挑战

尽管取得了一定成果,但少数民族语言文字信息处理研究仍面临诸多挑战。例如,语料库建设困难、词汇表构建不完善、机器翻译准确性有待提高、语音识别技术复杂等。

此外,由于少数民族地区信息化水平相对较低,缺乏相关技术和人才支持,也限制了信息处理技术的推广和应用。

四、未来展望

随着技术的进步和研究的深入,未来少数民族语言文字信息处理研究将呈现出以下趋势:

技术融合与创新:深度学习、自然语言处理等技术的不断发展将为少数民族语言文字信息处理提供更多的技术手段和创新思路。

标准化与规范化:随着语料库建设的不断完善和词汇表的构建,少数民族语言文字信息处理将逐渐走向标准化和规范化。

应用场景拓展:随着少数民族语言文字信息处理技术的不断提高,其应用场景也将不断拓展,如教育、文化、旅游等领域。

人才培养与团队建设:加强相关领域的人才培养和团队建设,提高少数民族语言文字信息处理技术的研发能力和应用水平。

全国少数民族语言文字信息处理研究可以应用在哪些行业或产业领域

一、教育行业

教学资源开发:利用少数民族语言文字信息处理技术,可以开发适合少数民族学生的教学资源,如电子教材、在线课程等,提高教学效果。

智能辅导系统:通过自然语言处理和机器学习技术,可以构建智能辅导系统,为学生提供个性化的学习建议和辅导,帮助他们更好地掌握少数民族语言文字。

二、文化传媒行业

多语种内容制作:利用信息处理技术,可以高效地将少数民族语言文字内容转化为其他语种,满足多语种用户的需求。

智能推荐系统:基于用户行为和兴趣分析,可以构建智能推荐系统,向用户推荐符合其喜好的少数民族语言文字内容,提升用户体验。

三、旅游业

旅游信息服务:为少数民族地区提供多语种旅游信息服务,包括景点介绍、交通指南、住宿预订等,方便游客获取所需信息。

智能导览系统:利用自然语言处理和增强现实技术,可以构建智能导览系统,为游客提供沉浸式的旅游体验。

四、电子政务

政务服务:为少数民族地区提供多语种政务服务,包括政策咨询、在线办事等,提高政府服务的便捷性和覆盖面。

信息公示与宣传:利用信息处理技术,可以将政府公告、政策宣传等内容转化为少数民族语言文字,增强信息的传播效果。

五、电子商务

电商平台建设:为少数民族地区搭建多语种电商平台,方便他们在线购物和销售特色产品。

智能客服系统:利用自然语言处理技术,可以构建智能客服系统,为用户提供多语种咨询服务,提高客户满意度。

六、语言保护与传承

语言资源数字化:利用信息处理技术,可以将少数民族语言文字资源进行数字化保存和管理,防止语言失传。

语言教学与研究:为语言学者提供丰富的语言资源和工具,支持他们进行深入的语言教学和研究工作。

七、其他领域

此外,少数民族语言文字信息处理研究还可以应用于智能语音识别、机器翻译、跨语言信息检索等领域,为相关领域的技术创新和产业发展提供有力支持。

全国少数民族语言文字信息处理领域有哪些知名研究机构或企业品牌

研究机构

国家语言资源监测与研究少数民族语言中心

简介:该中心由国家教育部语信司、国家民委教科司、国家新闻出版总署报刊司及中央民族大学共同创建,设立在中央民族大学中国少数民族语言文字信息化工程研究中心。

主要任务:对少数民族语言资源进行收集、整理、建库、加工和处理;对少数民族语言资源实行动态监测与研究,并将监测研究结果以信息报送、决策建议方式提交国家语委或面向社会公开发布;开展民族语言的网络舆情分析、民族语言国情调查与和谐研究、民汉双语教育研究,以及少数民族语言文字信息处理与规范标准建设。

成果:在科学研究、高新技术创新和集成方面产生了一系列创新性成果,取得了较好的社会效益,在国内外同行中独具特色。

中国社会科学院民族学与人类学研究所

简介:该所是全国民族语言文字研究的学术重镇,设有中国少数民族语言研究中心等机构。

主要业务:开展调查研究中国少数民族语言文字,协调国内少数民族语言研究活动,协助有关部门研究少数民族语言发展规划,组织国内外学术交流和合作研究,刊布研究成果,通过科研与教学培养研究中国少数民族语言文字的人才和队伍等。

成果:涵盖了民族语言文字研究的不同领域,出版了大量学术著作,涌现了一批著名专家。

青海师范大学省部共建藏语智能信息处理及应用国家重点实验室

简介:这是中国唯一的藏语信息处理领域的国家重点实验室。

主要成果:已攻克语音识别、语音合成、语音翻译等关键技术,正在开展跨语言人机交互应用、多领域机器翻译、虚拟播音、大语言模型等多维应用研究。发布了班智达翻译、班智达词典、班智达识别等6款应用软件。

企业品牌

蒙科立(内蒙古蒙科立蒙古文化股份有限公司)

简介:是一家专门从事少数民族文字信息化、数字化、网络化技术开发与服务的少数民族专业化高技术服务实体。

主要业务:开发出8个少数民族12种文字、9大体系、共150多项原创专利技术和产品,形成了“蒙科立”品牌少数民族软件自主创新体系。

成果:荣获国家“自主创新新锐奖”,其软件已形成40多个国家、上千家单位、几百万人口用户市场,为蒙古语言文字的信息化、数字化、网络化发展以及蒙古语言文字的保护、传承、创新发展做出了贡献。

全国少数民族语言文字信息处理领域有哪些招聘岗位或就业机会

一、研究机构与高校

研究员/科研人员

岗位职责:负责少数民族语言文字信息处理的相关研究工作,包括算法设计、模型构建、实验验证等。

任职要求:通常需要具备计算机科学、人工智能、语言学等相关专业背景,以及扎实的编程能力和科研能力。

教师/讲师

岗位职责:在高校或研究机构中教授少数民族语言文字信息处理相关的课程,指导学生进行科研工作。

任职要求:需要具备相关专业的博士学位或高级职称,以及丰富的教学经验和科研能力。

二、技术企业

算法工程师

岗位职责:负责设计和实现少数民族语言文字信息处理的算法,优化算法性能,提高处理效率和准确性。

任职要求:需要具备计算机科学、人工智能等相关专业的背景,熟悉机器学习、深度学习等算法,以及良好的编程能力。

数据分析师

岗位职责:对少数民族语言文字数据进行挖掘和分析,提取有价值的信息,为业务决策提供支持。

任职要求:需要具备统计学、数据挖掘等相关专业背景,熟悉数据分析工具和方法,以及良好的沟通能力和团队协作能力。

软件开发工程师

岗位职责:负责开发少数民族语言文字信息处理相关的软件产品或系统,包括需求分析、设计、编码、测试等工作。

任职要求:需要具备计算机科学、软件工程等相关专业背景,熟悉软件开发流程和技术栈,以及良好的编程能力和团队协作能力。

三、政府部门与公共服务机构

民族文化保护与传播岗位

岗位职责:负责少数民族语言文字的保护、传承和传播工作,包括制定相关政策、组织文化活动等。

任职要求:需要具备对少数民族文化的深入了解和热爱,以及良好的组织协调能力和沟通能力。

政务信息化岗位

岗位职责:负责政府部门的信息化建设和管理工作,包括少数民族语言文字信息处理系统的建设和维护。

任职要求:需要具备计算机科学、信息管理等相关专业背景,熟悉政务信息化流程和规范,以及良好的项目管理能力和团队协作能力。

四、文化传媒行业

内容编辑与制作岗位

岗位职责:负责少数民族语言文字内容的编辑、制作和发布工作,包括新闻采编、节目制作等。

任职要求:需要具备对少数民族文化的深入了解,良好的文字表达能力和创意思维,以及熟悉相关媒体平台的操作和规范。

翻译与校对岗位

岗位职责:负责少数民族语言文字的翻译和校对工作,确保内容的准确性和流畅性。

任职要求:需要具备扎实的语言基础和翻译能力,熟悉少数民族语言文字的特点和规范,以及良好的责任心和细致的工作态度。

推荐会议
会议小助手
会议通企业微信客服群
办会,宣传,赞助会议请加入客服群以便于获取合作资源