1、 ICS 01.140.20 CCS A 14 12 天津市地方标准 DB12/T 13032024 地方志数字化加工技术规范 Technical specification for digital processing of Local Chronicles 2024-02-19 发布 2024-03-19 实施 天津市市场监督管理委员会 发 布 DB12/T 13032024 I 前言 本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。本文件由天津市地方志编修委员会办公室提出并归口。本文件起草单位:天津市地方志编修委员会办公室、天津市地方志馆
2、。本文件主要起草人:莫洪胜、仇伟海、郝登奎、梁娜、巩志彬、朱晓飞、朱雅晶、郑佳、张迪、李庆福、王靓、邓滢、柳杨。DB12/T 13032024 1 地方志数字化加工技术规范 1 范围 本文件规定地方志纸质文献数字化加工流程、技术规范和地方志书籍出版的电子文件格式以及著录元数据结构等内容。本文件适用于地方志纸质文献数字化及出版电子书籍的加工处理。2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 22602007 中华人民共和国行政区划
3、代码 GB/T 223732008 标准文献元数据 GB/T 31219.22014 图书馆馆藏资源数字化加工规范 第2部分:文本资源 DA/T 312017 纸质档案数字化规范 3 术语和定义 下列术语和定义适用于本文件。3.1 地方志 local chronicles 包括地方志书和地方年鉴。地方志书是全面系统地记述某一地域或某一专门领域自然、政治、经济、文化、社会和生态建设的历史与现状的资料性文献。地方年鉴是指全面系统记述某一地域或某一专门领域自然、政治、经济、文化、社会和生态建设年度现状的资料性文献。3.2 地方志资源 local chronicle resources 包括但不限于地
4、方志书、地方年鉴、期刊、地方史等地方志书刊类资源。3.3 数字化 digitization 利用计算机技术将模拟信号转换为数字信号的处理过程。DA/T 312017,定义 3.1 3.4 地方志数字化 digitization of paper-based records 采用扫描仪等设备对地方志资源进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字图像、文本数据、图片数据、表格数据,并按照在纸质文献的内在联系,建立起目录数据、内容数据、数字图像间的相互关联关系的处理过程。3.5 分辨率 resolution 单位长度内图像包含的点数或素数,一般用dpi表示。3.6 准确率 pre
5、cision 文本文件中正确识别的字符数与总字符数之比,即准确率=(正确识别字符数/总字符数)100%。DB12/T 13032024 2 3.7 光学字符识别 optical character recognition(OCR)电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,用字符识别方法将形状翻译成计算机文字的过程。3.8 元数据 metadata 描述信息资源或数据的数据。GB/T 223732008,定义3.3 3.9 元素 element 元数据的基本语义单位,描述元数据的基本实体。3.10 简单型 simple type 不具有子元素的元素所对应
6、的元素类型。3.11 容器型 container type 具有子元素且本身不能被赋值的元素所对应的元素类型。3.12 复合型 complex type 本身可以被赋值且在一定条件下可以具有子元素的元素所对应的元素类型。4 地方志数字化加工流程及质量要求 基本要求 4.1 4.1.1 完整性 地方志数字化资源的类型、内容、元数据信息应保证完整。4.1.2 规范性 地方志数字化资源的数据格式、数据文件命名、数据存储应保证规范。4.1.3 有效性 地方志数字化资源应能通过相关软件及系统读出,不允许出现数据损坏、异常报错、无法打开,编码混乱、图像失真等无法使用的错误。4.1.4 准确性 地方志数字化资源的文字、图像、版式文件、资源挂接、元数据应保证准确。4.1.5 合规性 地方志数字化资源的著作权属于作者,出版社或数字化扫描公司未经作者同意不得将地方志数字资源用于任何商业或其他营利性用途。各单位向同级地方志馆移交地方志数字资源应按照附录A,填写 地方志数字资源移交登记表。加工流程 4.2 包括但不限于:建立目录数据库、扫描纸质文献、OCR 识别、制作书签。建立目录数据库 4.3 DB12/T