1、医保医用耗材 语料库建设导则TSIGA 005-2026讲解了面向医疗保障体系下医用耗材智能化治理所需的语料资源标准化建设路径,明确了语料库在业务分类与用途分类两个维度的系统性架构,涵盖资质证明、技术规格、价格合规三类业务语料,以及预训练、监督微调(SFT)、思维链(CoT)和知识库四类应用导向语料;描述了语料全生命周期管理的技术要求,包括数据属性、数据规模与数据多样性等基础数据规范,规定了语料采集、清洗、标注、存储等生产环节的操作准则,特别强调多模态特征融合(文本、图像、表格)与医保领域语义一致性;阐述了标注审核与数据测试的质量控制机制,提出语料在模型预训练、后训练、知识检索增强、智能体协同
2、应用及持续更新五大场景下的落地逻辑;明确了语料安全治理边界,依据GB/T 436972024落实数据分类分级要求,嵌入附录A中规定的医保耗材领域语料表达细则与附录B推荐的知识库信息结构,旨在支撑医保耗材目录动态管理、智能审核决策与跨机构数据可信共享,推动人工智能技术在医用耗材监管中的安全、专业、可解释应用。医保医用耗材 语料库建设导则TSIGA 005-2026适用于医疗保障行政部门、医疗保险经办机构、各级医疗机构(含医保定点医院、审评中心)、医疗器械注册人/备案人、医用耗材生产企业、人工智能技术研发企业、医学信息平台服务商以及参与医保智能审核系统建设的第三方技术支撑单位;也适用于高校、科研院所中从事医疗健康大数据、医学自然语言处理、多模态AI模型研究的科研团队。该导则为上述主体在构建、采购、评估或使用医保医用耗材领域语料资源时提供统一标准依据,尤其适用于开展医保耗材智能编码映射、合规性初筛、临床适宜性研判、价格异常识别、多智能体协同审核等高价值AI应用场景的组织与项目。同时,该文件对参与国家及地方医保信息化升级、智慧监管平台建设、DRG/DIP配套耗材治理工具开发的相关单位具有直接指导意义。