收藏 分享(赏)

东盟国家语料 质量评测规范TGBC 123-2026.docx

安全生产视频网
上传人:一米阳光 文档编号:425545 上传时间:2026-05-08 格式:DOCX 页数:14 大小:51.58KB
下载 相关 举报
东盟国家语料 质量评测规范TGBC 123-2026.docx_第1页
第1页 / 共14页
东盟国家语料 质量评测规范TGBC 123-2026.docx_第2页
第2页 / 共14页
东盟国家语料 质量评测规范TGBC 123-2026.docx_第3页
第3页 / 共14页
东盟国家语料 质量评测规范TGBC 123-2026.docx_第4页
第4页 / 共14页
东盟国家语料 质量评测规范TGBC 123-2026.docx_第5页
第5页 / 共14页
点击查看更多>>
资源描述

1、东盟国家语料 质量评测规范TGBC 123-2026讲解了面向东盟十国多语言场景下人工智能训练语料的系统性质量评估方法与实施要求,东盟国家语料 质量评测规范TGBC 123-2026描述了涵盖预训练、监督微调(SFT)、基于人类反馈的强化学习(RLHF)、ASR/TTS、平行语料、价值观对齐及验证集等七类关键语料类型的评测维度与判定标准,东盟国家语料 质量评测规范TGBC 123-2026明确了基础质量要求(如格式合规性、元数据完整性、版权可追溯性)与核心质量要求(包括准确性、多样性、代表性、安全性、文化适配性、技术参数达标性),建立了四级质量等级评定机制,规定了评测人员在语言能力、领域知识、

2、伦理素养和标注经验等方面的资质条件及持续培训义务,东盟国家语料 质量评测规范TGBC 123-2026构建了覆盖评测启动、执行、复核、争议提交与专家仲裁的全流程闭环管理框架,并通过三个资料性附录细化了格式规范、各语料类型的核心评测指标清单以及标准化评测报告模板,为跨语言、跨机构、跨技术路径的东盟语料质量协同治理提供了可操作、可验证、可追溯的技术依据和制度保障。东盟国家语料 质量评测规范TGBC 123-2026适用于面向东盟国家开展人工智能大模型研发、多语种自然语言处理系统建设、语音识别与合成技术研发、跨境数字内容治理、语言资源库建设与运营的科研机构、高校院所、科技企业及标准化组织,东盟国家语料 质量评测规范TGBC 123-2026特别适用于中国东盟信息港建设相关单位、参与中国东盟数字合作项目的数据服务商、语料采集与标注企业、AI模型训练平台运营商,以及承担东盟语种AI能力测评、认证与监管职能的政府部门与第三方评测机构。该规范支撑中文与东盟十国官方语言(包括越南语、泰语、印尼语、马来语、菲律宾语、柬埔寨语、老挝语、缅甸语、文莱马来语、东帝汶德顿语等)在预训练、指令微调、安全对齐等关键环节的语料质量控制,是推进区域人工智能可信发展、语言数字基础设施共建共享的重要技术基础文件。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 安全标准 > 国家标准

copyright@ 2010-2025 安全人之家版权所有

经营许可证编号:冀ICP备2022015913号-6