中国东信研发全球首个老挝语大模型评测数据集LaoBench,相关论文入选ACL 2026主会
摘要:2026年4月7日,计算语言学协会(以下简称“ACL”)官方系统显示,中国—东盟信息港股份有限公司(以下简称“中国东信”)参与合作的论文《LaoBench: A Large-Scale Multidimensional Lao Benchmark for Large Language Models》被第64届ACL年会(ACL 2026)主会正式录用。
2026年4月7日,计算语言学协会(以下简称“ACL”)官方系统显示,中国—东盟信息港股份有限公司(以下简称“中国东信”)参与合作的论文《LaoBench: A Large-Scale Multidimensional Lao Benchmark for Large Language Models》被第64届ACL年会(ACL 2026)主会正式录用。该论文核心成果——全球首个开源老挝语大模型评测数据集LaoBench,已于2025年在Hugging Face平台面向全球开放,填补了东南亚小语种在人工智能评测领域的空白。


ACL是自然语言处理与计算语言学领域的国际顶级学术组织,其年会每年吸引全球顶尖高校、科研机构及科技企业投稿。本届ACL年会(ACL 2026)收到 12, 148篇投稿,主会录取率为19%,论文需通过同行多轮严格评审,在技术创新性、方法严谨性与应用价值上达到领域领先水平,被视为人工智能语言技术方向的风向标。此次LaoBench相关论文入选ACL 2026主会,标志着LaoBench的学术价值与技术前瞻性获得国际权威认可。
LaoBench的核心价值在于构建了系统化的老挝语能力评估体系,其包含超过17,000个经过精心筛选的样本,覆盖知识应用、K12基础教育、老中英双语互译三大维度,采用混合流程构建,将专家编写与智能体辅助验证相结合,确保数据在语言准确性、文化适配性与教育有效性上的高标准。同时,LaoBench设置开源与闭源双子集,通过受控服务开展黑盒评估,既保障了评测公平性,也维护了数据安全。
基于LaoBench的评测结果显示,当前主流大模型在老挝语任务上的表现仍存在明显短板,尤其在知识密集型推理与老挝语翻译上与人类专家水平存在较大差距。这一发现为后续多语言大模型的优化提供了明确方向,也为老挝语人工智能应用的落地建立了可靠标准。
作为数字经济领域的实践者,中国东信始终关注东盟区域的技术需求。此次LaoBench的开源,不仅为全球研究者提供了老挝语评测的标准化工具,更通过技术赋能,为老挝及东南亚地区的数字化发展注入新动力。未来,中国东信将持续深耕东南亚小语种领域,推动人工智能在多语言场景下的包容性发展,为中国与东盟的数字合作提供技术支撑。
