欢迎来到中博奥技术有限公司官网

档案数字化标准和规范

时间:2022-10-18 作者:中博奥 来源:网络 点击量:

  为统一企业单位纸质、照片、音频、视频档案数字化的主要技术要求,推动档案现代化和数字档案馆的建设,特制定本规范。档案数字化标准和规范适用于各单位档案的数字化处理及数字化成果的管理。

档案数字化标准和规范

  档案数字化标准和规范

  1范围

  本标准规定了纸质档案数字化的基本原则、实施主体、工作组织、管理要求、操作流程。本标准适用于纸质档案数字化工作。

  2规范性引用文件

  下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

  GB/T 20530-2006文献档案资料数字化工作导则

  DA/T 18档案著录规则

  DA/T20.1民国档案著录细则

  DB35/T 161文书档案目录数据交换格式与著录细则

  《国家秘密载体印制资质管理办法》(国保发[2012]7号)

  《档案数字化外包安全管理规范》(档办发[2014]7号)

  3基本原则

  3.1安全

  釆取科学、有效的安全措施和技术手段,建立安全保密机制,做到档案数字化加工全程可控。

  3.2规范

  遵循档案管理的客观规律,统筹规划档案数字化工作,依据相关的法律法规和技术标准,制定、执行工作流程和操作规范,最大限度地呈现档案原貌。

  3.3共享

  以档案信息资源共享为目标,选取通用的数据格式和适当的技术参数,进行档案信息加工、转换和传播,满足档案信息资源服务需求。

  4实施主体

  4.1档案数字化工作的责任主体为实施档案数字化的相关单位与部门(以下简称“数字化实施单位”)。

  4.2档案数字化工作可由数字化实施单位自行组织人员开展,也可由数字化实施单位采取业务外包的方式,委托给具有相关资质和能力的档案数字化服务机构(以下简称“数字化服务机构”)完成。

  5工作组织

  5.1数字化实施单位应在充分调研的基础上,根据档案的重要程度、利用程度、破损程度、开放程度等情况,制定工作方案,并经审批后予以执行。数字化工作方案内容主要包括:数字化的内容、范围、数量;数字化的人员、经费、场地与设备;数字化的形式、技术参数、实施进度等。

  5.2数字化实施单位可成立工作组,明确数字化管理、档案保管等内部部门的职责和分工,确保数字化工作顺利开展。

  5.3档案数字化工作需外包的,数字化实施单位应:

  a)遵照政府采购的相关法律法规要求确定数字化服务机构;

  b)按照《国家秘密载体印制资质管理办法》的要求,审査数字化服务机构的保密资质;

  c)审核数字化服务机构的企业性质、经营范围、股东组成等;

  d)按照GB/T 20530-2006第5章的要求,评估数字化服务机构的技术能力;

  e)在数字化服务机构进驻前,与其签订安全保密协议;

  f)安排专门人员对数字化服务机构进行监督和指导;

  g)按照《档案数字化外包安全管理规范》的要求进行管理。

  5.4加工涉密档案时,应按照保密要求开展工作,相关数据应按涉密信息要求进行存储和管理。

  6管理要求

  6.1人员

  6.1.1档案数字化工作的管理人员应熟悉数字化工作并具有组织协调能力;技术人员应熟悉相关标准规范并能够为数字化工作各环节提供技术支持:操作人员应掌握一定数字化基础知识并熟悉业务。

  6.1.2采取业务外包的数字化实施单位,应加强对数字化服务机构人员的管理,协助进行员工审核:数字化服务机构应与员工签订劳动合同和保密协议,并进行上岗培训和安全保密教育。

  6.2场地

  6.2.1配备符合防火、防水、防盗、防尘、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等要求的数字化加工专用场地。

  6.2.2设置档案存放、档案前处理、档案扫描、图像处理、目录著录、质量检查、档案装订等工作区域,合理布置加工场地,并做好区域标识、规章制度上墙等工作。

  6.2.3数字化加工期间,应设置保管库用于存放调取的档案,并安排专人管理。

  6.2.4场地内应配备可覆盖整个区域的应急设施和监控设备,确保工作区域无监控死角;做好监控硬盘的更换和保管(档案数字化监控硬盘更换情况登记表参见附录A中的表A.1),监控数据自产生之日起保存应不少于6个月。

  6.2.5场地内不存放非工作需要的物品;不擅自带入手机、电脑、录咅、录像等各类电子设备和移动存储介质;不携带火种、易燃易爆品;不在场地内进食、饮水、吸烟;不在场地内从事其他与数字化加工无关的活动;不擅自将场地内的物品带离现场。

  6.2.6建立安全巡査制度,配备专人负责场地巡査并做记录(档案数字化安全巡查情况登记表参见附录A中的表A.2);建立访客登记制度(档案数字化访客出入情况登记表参见附录A中的表A.3),非现场工作人员未经许可不得进入场地。

  6.3设备

  6.3.1配备满足数字化工作需要的设施、设备,并科学管理和使用。

  6.3.2做好设备的物理和技术安全防控,封闭相关设备不必要的信息传输接口;不在设备上安装与加工、安全管理无关的软件;不使用无线传输设备;数字化工作网络应与其他计算机网络物理隔离。

  6.3.3建立设备管理清单,实行专人管理;定期进行设备维护检修,形成完整的台帐(档案数字化设备维护检修情况登记表参见附录A中的表A.4);数字化工作中使用的设备和存储介质不与其他工作交叉使用,不擅自送外检修;数字化加工结束后,应清除设备中存留的数据,并将使用过的硬盘及移动存储介质移交数字化管理部门统一保管。

  6.3.4数字化加工软件应具备流程定义、任务分配、过程跟踪、质量检测、成品制作、数据验收、数据备份、统计分析等功能,并分别设置管理员、保密员、审计员,并实行“三员分离”。

  6.4数据

  6.4.1严格管理数字化加工各环节产生的数据,及时对数字化成果数据进行移交和备份,防止数据丢失和泄露,保障数据安全。

  6.4.2建立数据备份制度,定期对数字化加工的数据进行备份(档案数字化成果备份清单参见附录A中的表A.5),有条件的数字化实施单位,可实时备份;建立数据迁入、迁出备案制度(档案数字化存储数据迁移/修改情况登记表参见附录A中的表A.6),不擅自导入、导出、删除服务器及存储设备上的数据。

  6.4.3配备专人负责数据管理,釆取技术手段,确保成果数据不被篡改。

  6.4.4数字化过程中使用的硬盘、光盘等存储介质(档案数字化硬盘/光盘使用情况登记表参见附录A中的表A.7)应指定专人统一管理,定期检测数据的完整性。

  6.5档案实体

  6.5.1严格档案实体出库、入库的清点核对和流转管理。在数字化加工时,应建立档案实体管理台帐,做好领取和归还登记工作(档案数字化加工环节实体流转情况登记表参见附录A中的表A.8)。

  6.5.2爱护档案,避免损伤档案;发现破损档案时,应及时登记并送专业人员修复。

  6.5.3数字化过程中产生的废纸屑,应统一收集管理,经鉴定后再销毁。

  6.5.4不擅自将档案资料带出场地,不以任何方式复制、抄录、拍摄档案信息。

  6.5.5正在进行数字化加工的档案应每天入库,不在库房外留存。

  6.6工作文件

  6.6.1制定工作所需的制度、管理文件和相关表格。主要工作记录和单据有:工作方案、审批书、流程单、出库申请单、数据移交单、抽检单、归还入库単、数据验收单、成果移交单、验收报告、其他加工记录等。采取外包方式实施的,还应包括项目招投标文件、项目合同、保密协议、加工人员信息资料、项目需求变更文档等。

  6.6.2规范数字化工作文件的管理,及时进行整理、归档和移交,形成内容完整、格式规范、记录清晰的数字化工作档案。

  7操作流程

  7.1基本要求

  7.1.1实施档案数字化加工全流程管理,明确各环节的工作制度和操作规范,把控加工质量,协调整体进度,建立系统、完整的流程单(档案数字化加工流程单参见附录A中的表A.9)和工作台帐。

  7.1.2日常管理中,应关注数字化现场工作情况,做好日常工作记录(档案数字化加工现场工作日志参见附录A中的表A.10)。建立问题反馈和错情追溯机制,确保数字化过程屮产生的问题及时得到反馈和修正。

  7.1.3纸质档案数字化工作操作流程图参见附录B。

  7.2档案出库

  6.2.1数字化管理部门根据数字化工作方案制定调卷计划,拟定数字化对象,提交审批书(档案数字化审批书参见附录A中的表A.11),按序时进度分批次向档案保管部门提出申请。

  6.2.2档案保管部门事先对档案进行清点,经数字化管理部门核对后,填写出库申请单(档案数字化实体出库中清单参见附录A中的表A.12)。经相关责任人批准后,按照档案库房管理规定办理移交手续。

  7.3抽取密件

  7.3.1数字化过程中应做好涉密文件的筛选工作。已有涉密文件记录的,应按照记录进行筛选;缺少密件记录的,应逐卷、逐页翻阅,并根据文件上的涉密标识进行筛选。

  7.3.2涉密文件主要包括:标注有密级的文件、文号带“密”的文件、盖有密件收发章的文件和密码电报等,有解密标识的除外。

  7.3.3登记时以标注有密件信息的一份完整的涉密文件为单位,详细记录档号、密级、起止页号等信息(档案数字化抽取密件情况登记表参见附录A中的表A.13)。

  7.3.4核对密件记录的准确性后,将密件逐一放入专用文件袋中。文件袋标注应清晰准确,与密件一一对应。抽件时,应保持密件的完整性,不得遗落档案。

  7.3.5抽出的密件应按照保密要求进行管理。

  7.3.6数字化过程中,一旦发现涉密文件,应立即停止加工,移交数字化管理部门处置。

  7.4前处理

  7.4.1编页

  7.4.1.1档案中凡载有有效信息的页面均应编页,包括文件处理单或领导(职能部门)签署意见单、止文、草稿、附件等;案卷封面、卷内目录、备考表、空白页、废稿纸、重复件等不编页。

  7.4.1.2采用阿拉伯数字,从“1”开始依次编页:不重号、漏号,不编附页号。

  7.4.1.3宜使用铅笔编页,书写时字迹清晰工整,不压盖档案内容。编页位置根据档案内容与装订线的位置确定,新页号标注于远离装订线的页面侧角。

  7.4.1.4编页时将不规范的原页号划掉,新页号与文件主体内容方向一致;页号缺失或页号不规范的档案,先重新整理再编页。

  7.4.1.5一个页面上并排粘贴有多个小页面档案时,可根据实际内容合编一个页号或分别编页:页面有重叠的,应分别编页。筒子页编页时,不能展开的,正面和背面均单独编页;能展开且档案内容不在折缝上的,可编为两页;能展开但内容在折缝上影响阅读的编为一页,编完后,将筒子页拆出变为折子页。

  7.4.2拆除装订物

  7.4.2.1检査并剔除案卷中的装订物(如金属央、回形针、订书钉、大头针等),并将排列顺序不准确的档案进行重排。

  7.4.2.2拆除装订物应以保护档案为原则,难以恢复原貌的不得拆除。

  7.4.2.3拆除装订物造成破损的,应及时与数字化管理部门进行沟通处理。

  7.4.3档案保护性处理

  7.4.3.1档案粘连或破损严重、霉坏及其他无法直接进行扫描的,应填写处理单(档案数字化实体修复情况登记表参见附录A中的表A.14),由专业人员进行技术处置。

  7.4.3.2页面破损但能够扫描的,可先扫描再送修复。

  7.4.4填写备考表

  7.4.4.1档案有重申新整理编页、页面破损、缺页等情况的,应在备考表上注明。

  7.4.4.2备考表中应注明文件总页数、重份文件、特殊档案和其他需要说明的情况,如照片、邮票、信封、税票、商标、实物、名人手迹等。

  7.5扫描

  7.5.1基本要求

  扫描应以保证档案实体安全、保持档案原貌和信息完整、满足利用要求为原则。可根据档案实际情况、数字化目的、数字化规模、网络和存储条件等选择相应的扫描方式和设备,并进行相关参数的设置和调整。

  7.5.2扫描方式

  7.5.2.1扫描应按照档案标明的页号顺序进行,保证图像顺序号连续且与档案页号一一对应,做到不缺页、不重页:扫描图像内容应清晰完整,包括文件上的正文、页号、有关标记等。一般对档案逐页进行扫描,不可多页重叠扫描。

  7.5.2.2初始扫描时,保持档案平整,对褶皱不平影响图像质量的档案,应先进行平整处理后再扫描。有粘连的档案,不能折叠当前页,允许露出与当前页相连的前后页档案。尽量将档案纸张放置端正,最大限度地减少因纠偏产生的图像失真问题。

  7.5.2.3档案扫描以门底为主。纸质偏薄的双面文字档案则以黑底扫描,避免背面影像显透,影响阅读;破损或缺角较大的档案用黑底扫描,便于辨识缺损部位。

  7.5.2.4附录A中的表A.9中登记的扫描页数与前处理填写的页数一致,不一致时应査找原因并整改。

  7.5.2.5一般档案用普通平板扫描仪;纸张质量好、尺寸一致、未装订、无粘连或折角的档案可用高速扫描仪:字迹过于贴近装订边缘的档案,可用书刊扫描仪;书籍或胶装成册的档案可用零边距扫描仪。

  7.5.2.6幅而较大的档案可釆用大图扫描仪或专业扫描仪,也可分幅扫描后进行图像拼接处理。分幅扫描时,应使各区域的大小尺寸相近,相邻幅面之间应有重叠部分,重叠尺寸一般不小于单幅图像对应原件尺寸的1/3,并说明分幅方法。

  7.5.2.7珍贵且尺寸不规则的档案,可采用标板、标尺等标识原件大小。

  7.5.3扫描参数

  7.5.3.1扫描参数的选择,应保证产生的数字图像清晰、不失真,图像效果接近档案原貌,并综合考虑后期存储与利用方式等因素。

  7.5.3.2采用不低于24位真彩色模式进行扫描。

  7.5.3.3扫描分辨率不小于300dpi;文字偏小、密集、清晰度差的档案,可适当提高分辨率;纸质照片档案扫描分辨率不小于600dpi;应进行仿真复制、印刷出版的档案,扫描分辨率不小于600dpio

  7.5.3.4扫描格式主要有TIFF、JPEG和JPEG2000等通用格式,压缩比率的选择应兼顾图像质量、使用需求与存储能力。一般档案可用JPEG格式;重要档案、历史档案、有仿真复制和出版需求的档案,可用无损压缩TIFF格式。可根据全文检索等实际需要,开展图像光学字符识别(OCR),将图像转换为双层OFD或PDI格式。

  7.5.4图像命名

  7.5.4.1图像命名方式应以档号为基础,确保图像命名的唯一性和与对应档号的一致性。

  7.5.4.2图像存储为单页文件时,按档号与图像流水号组合的方式对图像命名;图像存储为多页文件时,按档号对图像命名[档案数字化图像命名与存储示例(以件为单位)参见附录A中的表A.15,档案数字化图像命名与存储示例(以卷为单位)参见附录A中的表A.16]。

  7.5.4.3建立科学的图像存储路径,确保数据挂接的准确性。一般采用档号层级文件夹进行存储,JPEG/TTFF格式保存图像时,一份文件建立一个文件夹;OFD/PDF格式保存图像时,一份文件合成一个OFD/PDF文件。

  7.6图像处理

  7.6.1纠偏

  7.6.1.1以便于阅读为原则,把图像的底边作为基准进行纠正,确保图像整体不偏斜。

  7.6.1.2特殊形制的页面,以直角边为基准;若图像内容与介质不平行,则以介质为准。

  7.6.2裁边

  7.6.2.1图像裁边时,应保留当前页面完整,宜在距页边最外延2mm~3mm处裁剪。

  7.6.2.2一侧粘连或装订成册的档案,裁剪后应保留粘连线或装订中缝。

  7.6.3去污

  扫描过程中产生的污点、污线、黑边等杂质,在不影响档案有效内容的情况下,应进行去污处理。去污过程遵循保护档案原貌的原则,不得去除档案页面原有的纸张褪变、斑点、水渍、污点、装订孔等痕迹。

  7.6.4图像质量检查

  加强图像质量的检查工作(档案数字化图像抽检情况登记表参见附录A中的表A.17),重点包括以下方面:

  a)图像色彩模式、分辨率、保存格式、压缩比率及命名符合要求情况;

  b)图像画幅数与档案页数相符情况;

  c)图像页号及排列顺序与档案原件一致性情况;

  d)漏页、重复和页号错误情况;

  e)图像完整性、清晰度、色差、彩线、褶皱、压字及失真等情况;

  f)图像纠偏、裁边、去污等情况。

  7.7目录著录

  7.7.1根据DA/T 18、DA/T 20.1和DB35/T 161等要求,结合档案实际,确定著录要求、著录项目、著录细则和目录数据格式等。

  7.7.2以尊重事实、准确有效为原则开展著录工作,形成完整的目录数据。

  7.7.3若档案数字化前已有目录的,应充分尊重原有成果,只对不完整、不合格的目录进行修改或重新著录。

  7.7.4优先采用可将数据转换为DBF、XLS等通用格式的数据库。数据库结构应注重保持档案的内在联系,以便于数字化成果的管理和利用。

  7.7.5采用计算机自动校验与人工检验相结合的方式,对著录项目的完整性、著录内容的规范性和准确性等进行检查(档案数字化目录抽检情况登记表参见附录A中的表A.18)。

  7.8数据挂接

  7.8.1目录数据和图像加载到服务器汇总,实现目录数据与图像的关联。

  7.8.2对挂接结果进行逐条检查,包括目录数据与图像对应的准确性、已挂接图像数量与扫描数量的一致性等,确保导入数据库管理系统的目录数据与图像完全匹配,并与档案实体保持一致。

  7.9数字化成果验收、移交和备份

  7.9.1验收方式和对象

  7.9.1.1数字化实施单位应对档案数字化成果进行验收,也可请第三方数字化服务机构作为监理协助验收。

  7.9.1.2根据内容的不同,采用人工或计算机自动校验的方式进行检查。

  7.9.1.3验收宜采用分批次验收和整体验收相结合的方式进行。验收合格的,出具批次检验报告和验收单(档案数字化图像验收单参见附录A中的表A.19,档案数字化目录验收単参见附录A中的表A.20);验收不合格的,应先整改再验收。各批次验收均合格后,方可进行项目整体验收。

  7.9.1.4验收对象包括:图像数据、目录数据、数据挂接、工作文件等。

  7.9.2图像数据验收

  7.9.2.1采用计算机自动校验的方式对图像的色彩模式、分辨率、压缩比率、格式、命名和可读性等进行100%检查,合格率应达到100%。

  7.9.2.2采用人工抽检的方式对图像的完整性、排列顺序的正确性和图像质量等进行检查,抽检率不低于5%,合格率应不低于99.9%。

  7.9.3目录数据验收

  7.9.3.1采用计算机自动校验的方式对目录著录项目的齐备性和格式的规范性进行100%检查,合格率成达到100%。

  7.9.3.2采用人工抽检的方式对目录内容的完整性、准确性等进行检查,抽检率不低于5%,合格率应不低于95%。

  7.9.4数据挂接验收

  采用计算机自动校验的方式对数据挂接的准确性、一致性等进行100%检査,合格率应达到100%。

  7.9.5工作文件验收

  釆用人工检査的方式对工作文件的完整性和规范性进行100%检查,合格率应达到100%。

  7.9.6数字化成果移交和备份

  7.9.6.1验收合格的数据应按要求进行移交,填写数字化成果移交单(档案数字化成果移交单参见附录A中的表A.21),办理交接手续,并及时将目录数据和图像数据迁入数据库管理系统。

  7.9.6.2数字化成果移交后应进行保存和备份,确保数据安全。数字化实施单位可根据实际情况制定备份方案,综合使用磁盘、磁带、光盘和胶片等介质,采取在线、近线和离线等方式,实现数字化成果的分层次、多套、异质备份。同时,还应按照要求适时对数字化成果进行异地备份。

  7.9.6.3做好备份载体标识,对备份载体和数据进行必要的校验,检査载体的可用性、病毒情况和数据的完整性、可读性等。

  7.10档案装订

  7.10.1扫描完成后,应将密件放回原卷,并按要求对档案实体进行装订。

  7.10.2缺少卷内目录或原卷内目录不准确的案卷,应重新打印卷内目录,装订时可保留原卷内目录。

  7.10.3根据案卷原装订方式,靠装订边将文件整理整齐;没有足够装订位的页面,先用材质、颜色相近的纸张加边;粘连不牢的浮贴等小页面档案,可用修裱专用浆糊加固避免脱落。

  7.10.4尽可能利用原孔装订;若需重新打孔的,应沿装订边适当处进行操作,不可触及档案内容。

  7.10.5逐卷检査档案装订质量,避免出现文件颠倒、顺序错误等问题。

  7.11归还入库

  7.11.1数字化工作完成后,宜先消毒再入库。入库时应清点档案数量,确认无误后填写档案实体归还入库移交单(档案数化实体归还入库移交单参见附录A中的表A.22),分批次归还至档案保管部门。

  7.11.2档案保管部门应对归还档案再次进行核对,确认无误后,按照库房管理规定办理手续。

档案数字化规范和要求

  档案数字化规范和要求

  1适用范围

  为统一公司纸质、照片、音频、视频档案数字化的主要技术要求,推动档案现代化和数字档案馆的建设,特制定本规范。

  本规范适用于各单位档案的数字化处理及数字化成果的管理。

  2总则

  2.1基本原则

  2.1.1同步检查档案实体质量,确保数字化成果的真实、完整。

  2.1.2采用先进的数字技术,确保数字化成果的长期有效、数据兼容和安全迁移。

  2.1.3采取有效的保护措施,确保档案实体及数字化成果的安全。

  2.1.4确保档案实体与数字化成果间的有机联系。

  2.2过程管理要求

  2.2.1制定档案数字化的总体方案、技术路线与工作方法,确保档案数字化工作标准化、规范化和流程化。

  2.2.2档案数字化的基本环节主要包括:档案整理、档案扫描(转换)、数据处理、数据存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。

  2.2.3建立档案数字化各环节的安全保密机制和工作制度,确保档案数字化工作的安全与高效。

  2.2.4档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。

  2.3数据挂接

  2.3.1档案数字化转换过程中形成的图像、音频、视频数据,经质量验收合格后,加载到档案数据库服务器。通过编制的程序或借助相应的软件,实现档案数据库条目与相关联的数字图像、音频、视频批量的快速挂接。

  2.3.2认真填写档案数字化挂接检查情况登记表单,记录数据关联后的页(张、盘)数,核对每一份文件关联后的页(张、盘)数与档案整理、扫描(转换)时填写的页(张、盘)数是否一致,不一致时应注明具体原因和处理办法。

  2.4数据验收

  2.4.1图像、音频、视频数据验收

  以一个全宗或多个目录为单位,随机抽查5%的档案条目数据对应的图像、音频、视频数据。图像、音频、视频应符合本规范中所规定的分辨率、采样频率、数码率、文件格式及色彩模式。图像、音频、视频文件的命名必须与条目数据题名相一致。图像、音频、视频的转换完整性要求达到100%,图像偏斜度、清晰度、整洁度,音频、视频的清晰度等技术指标,要求抽检合格率达到95%以上(含95%)。合格率=抽检合格文件数/抽检文件总数×100%。

  2.4.2验收审核

  验收“通过”的结论,必须经分管领导审核、签字后方有效。

  2.4.3验收登记

  认真填写数字化验收登记表单。

  2.5数据备份

  2.5.1备份范围

  经验收合格的完整数据应及时进行备份。

  2.5.2备份方式

  为保证数据的安全,除将数据上传至集团公司档案管理系统服务器外,还应采用在线(磁盘)、离线(DVD刻录盘)相结合的方式实现多套备份,并注意异地保存。

  2.5.3数据检验

  检验内容包括备份数据能否打开、数据信息是否完整、文件数量是否准确等。

  2.5.4备份标签

  数据备份后应在相应的备份介质上做好标签,以便查找和管理。

  2.5.5备份登记

  填写纸质档案数字化备份管理登记表单。

  2.6、数字化成果管理

  2.6.1应加强对数字化成果的管理,确保其安全、完整和长期可用。

  2.6.2数字化成果提供网上检索利用时,应有制作单位的电子标识(水印),并根据具体情况决定是否采用微软DRM保护的文件格式。

  3纸质档案数字化操作规程

  3.1术语解释

  3.1.1数字化

  用计算机技术将模拟信号转换为数字信号的处理过程。

  3.1.2纸质档案数字化

  采用扫描仪或数码相机等数码设备对纸质档案进行数字化加工,将其转化为存储在磁盘、光盘等载体上并能被计算机识别的数字图像或数字文本的处理过程。

  3.1.3数字图像

  表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。

  3.1.4黑白二值图像

  只有黑白两级灰度的数字图像。它对应于黑白两种状态的文字稿、线条图等。

  3.1.5连续色调静态图像

  以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。

  3.1.6分辨率

  单位长度内图像包含的点数或像素数,一般用每英寸点数(DPI)表示。

  3.1.7失真度

  对档案进行数字化转换后,数字图像与档案原件在色彩、几何等方面的偏离程度。

  3.1.8可懂度

  数字图像向人或机器提供信息的能力。

  3.1.9图像压缩

  消除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。纸质档案数字化过程中,较常见的有TIFF(G4)、TIFF(LZW)、JPEG等压缩格式。

  3.1.10 DRM

  DRM是Digital Rights Management的简称,即数字版权保护或数字版权管理。微软的DRM分为两类,一类是多媒体保护,加密电影、音乐、音视频、流媒体文件,如WMV,WMA,ASF,WMS等格式文件。另外一类是加密文档,如DOC、XLS、PPT、XPS、JPG、TIF、BMP等格式文件。其他格式文件,比如:RM、RMVB、AVI、WAV、MP3、MPG、PDF等均可以转换成微软DRM支持的格式后进行加密保护。

  3.1.11 PDF

  PDF是Portable Document Format的简称,它是Adobe公司开发的电子文件格式,其优点在于跨平台、能保留文件原有格式、开放标准。

  3.1.12双层PDF

  一种具有多层结构的PDF格式文件,其每一页都包含两层,下层是从纸质文件扫描出来的原始图像,上层是用OCR软件对扫描图像进行识别后产生的文字结果,但字体效果设置成透明。这样用户在阅读PDF文件时看到的是扫描图像,可以100%保留原始版面效果,在需要的时候,又可以通过透明的文字信息支持选择、复制、检索等功能。

  3.1.13 XPS

  XPS是XML Paper Specification的简称,它是微软公司开发的一种文档保存与查看的规范。使用者不需拥有制造该文件的软件就可以浏览或打印该文件。作为微软DRM支持的格式,可以提供版权保护。

  3.2档案整理

  3.2.1前期整理

  合理确定档案数字化的范围,区分扫描件与非扫描件。对档案进行适当整理,并视需要做出标识。根据拟数字化档案的数量情况,估算数字化后所需要的存储空间。

  3.2.2目录建库

  已经建立档案数据库,并且使用条形码设备和软件的单位,可以在档案实体上粘贴条形码,使条形码能够正确反映档案数据条目与实体的对应关系,确保档案数字化、数据挂接时的质量和效率。

  没有建立档案数据库的单位,可以按照集团公司档案管理著录规则的要求,确定档案著录项并进行著录。所选定的数据格式,应能直接或间接地通过DBF文件格式或XML文档,与集团公司档案管理系统进行数据交换。

  3.2.3拆除装订物

  去除影响扫描工作的装订物,保证扫描的顺序,确保数字化后正确归卷并不损坏档案。

  3.2.4档案修复

  破损严重、无法直接进行扫描的档案,应先进行技术修复。折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。

  3.2.5建立作业单

  制作并填写数字化加工作业单,全程监控扫描过程,并记录整理数字化过程中各种相关情况。

  3.2.6装订

  图像质检完成后,拆除过装订物的档案应该按档案原貌及保管的要求重新装订,做到安全、准确、无遗漏。

  3.3技术要求

  3.3.1档案扫描

  3.3.1.1扫描方式

  根据档案幅面的大小(A4、A3、A0等)和纸张质量选择相应规格的扫描仪进行扫描。数量较少的大幅面档案,可采用小幅面扫描后的图像拼接方式处理;如果数量较多则使用宽幅工程扫描仪进行扫描。纸张状况较差,以及过薄、过软或超厚的档案,或者不宜拆装的档案,应采用平板扫描方式。纸张状况好并且可以拆装的档案,可采用高速扫描方式以提高工作效率。

  3.3.1.2扫描色彩模式

  扫描色彩模式一般有黑白二值、灰度、彩色等,通常采用黑白二值。页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。页面中插有黑白照片、彩色照片、彩色插图、印章等带色彩标志的档案,可视需要采用彩色模式进行扫描。底图可视需要采用灰度或彩色模式进行扫描。

  如需要进行OCR识别的,应采用黑白二值扫描。

  3.3.1.3扫描分辨率

  采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率应≥200DPI。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。如需要进行OCR识别的,扫描分辨率应≥300DPI。

  3.3.1.4扫描登记

  认真填写档案扫描情况登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。

  3.3.2图像处理

  3.3.2.1对扫描图像偏斜度、清晰度、失真度、完整情况等进行检查,发现问题及时处理或重新扫描。

  3.3.2.2发现文件漏扫、扫描图像排列顺序有误时,应及时补扫并正确插入图像,调整排列顺序。

  3.3.2.3对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。

  3.3.2.4对扫描图像中影响图像质量的杂质(黑点、黑线)、多余边框等,进行去污和裁边处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。

  3.3.2.5对大幅面档案分区扫描形成的多幅图像,进行拼接处理,合并为一个完整的图像。

  3.3.2.6认真填写图像处理情况表单,记录质检结果和处理意见。

  3.3.3图像存储

  3.3.3.1长期保存格式

  采用黑白二值模式扫描的图像文件,使用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,使用JPEG格式存储。如需要进行OCR识别的,识别后可存储为双层PDF格式。

  3.3.3.2网络利用格式

  不需要进行DRM保护的扫描图像,可直接以TIFF、JPEG、PDF格式在网上提供利用。

  需要进行DRM保护的扫描图像,可由集团公司档案管理系统批量转换为XPS格式后再行发布。

  3.3.3.3存储方式和命名规则

  按“档号”建立文件夹方式存储。

  以档案数据库中每份文件的档号,命名该份文件的图像存储文件夹;以每份文件的题名,命名该图像存储文件夹下所保存的扫描图像文件。通过档号的一致性和唯一性,建立起档案数据库条目与图像存储文件夹一一对应的关联关系,从而确保扫描图像文件挂接的正确。

  4照片档案数字化技术规范

  4.1照片整理

  参照纸质档案数字化操作规程。

  4.2照片扫描

  4.2.1扫描要求

  扫描照片、底片能够按原件1:1比例还原,并能忠实反映照片、底片原貌(清晰度、色彩、黑白对比度等)。

  4.2.2扫描色彩模式

  采用灰度和彩色两种模式扫描。黑白照片采用灰度模式扫描,彩色照片采用彩色模式扫描。

  4.2.3扫描分辨率

  对于所扫描的照片,以常见5英寸照片大小(3.5×5英寸)为参照,扫描分辨率≥300DPI;对于所扫描底片以还原5英寸照片为参照,扫描分辨率≥1500DPI;对于其他太大或太小的照片,扫描分辨率可作相应的调整,照片幅面≥10英寸时,可以适当降低分辨率但不能低于200DPI;对于一些涉及重要历史事件和人物的照片,其扫描分辨率可在此基础上适当增加。

  4.3图像处理

  4.3.1对扫描图像的偏斜度、清晰度、失真度、完整情况等进行检查,发现问题及时处理或重新扫描。

  4.3.2发现照片漏扫时,应及时补扫。

  4.3.3对扫描图像进行裁边处理,去除多余的边框。

  4.3.4对大幅面照片分幅扫描形成的多幅图像,进行拼接处理,合并为一个完整的图像。

  4.3.5认真填写图像处理情况表单,记录质检结果和处理意见。

  4.4图像存储

  4.4.1存储格式

  照片扫描后以TIFF和JPEG格式存储。对于重要的照片和扫描质量要求较高的照片,以TIFF(LZW)格式优先存储。

  4.4.2存储方式和命名规则

  按照片档案的“档号”建立文件夹方式存储。

  以档案数据库中每张照片的档号,命名该张照片的图像存储文件夹;以每张照片的题名,命名该图像存储文件夹下所保存的扫描图像文件。通过档号的一致性和唯一性,建立起档案数据库条目与图像存储文件夹一一对应的关联关系,从而确保扫描图像文件挂接的正确。

  5音频档案数字化技术规范

  5.1术语解释

  5.1.1 WAV格式

  微软开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式。

  5.1.2 WMA格式

  WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。

  5.1.3采样频率

  即取样频率,指每秒钟取得模拟信号样本的次数,用Hz或kHz来表示。

  5.2音频档案整理

  参照纸质档案数字化操作规程。

  5.3技术要求

  5.3.1基本原则

  音频档案的数字化要尽可能全面、真实和无损地保存信息,保证数据的可用性不会随着时间的推移和系统的变换而受到影响;满足不同网络和计算机应用条件下数字化数据能从存储介质中正确读取,并能还原成音、视频信号输出。

  5.3.2硬件设备

  5.3.2.1放音设备

  放音设备必须能正确地将声音源输出。根据音频档案原始载体型号配备相应的放音设备。

  5.3.2.2计算机配置

  选用性能稳定配置较高的计算机作为数字化设备。

  5.3.2.3存储设备

  应使用大容量硬盘、磁盘阵列、磁带机等。声音信号除存储在硬盘中随机使用外,应备份至磁带或光盘上脱机保存。

  5.3.3参数设置

  配置相应采集软件的相关参数,根据所要采集格式设定采样率。音频档案数字化选用44.1kHz作为声音采样标准。声音样本的大小可选用16位或更低的。根据原录音带选择声道。

  5.3.4转换文件处理

  5.3.4.1清除与档案无关的信息。

  5.3.4.2根据需要合并相关音频信息,并生成最终文件。

  5.3.5文件存储

  5.3.5.1存储格式

  推荐使用WAV、WMA、MP3格式文件。

  需要进行DRM保护的音频档案,原先为WAV、MP3格式的可由集团公司档案管理系统批量转换为WMA格式后再行发布。

  5.3.5.2存储方式与命名规则

  按音频档案的“档号”建立文件夹方式存储。

  以档案数据库中音频档案的档号,命名该音频档案的存储文件夹;以音频档案的题名,命名该存储文件夹下所保存的音频文件。通过档号的一致性和唯一性,建立起档案数据库条目与存储文件夹一一对应的关联关系,从而确保音频文件挂接的正确。

  5.3.6技术指标与要求

  5.3.6.1采样频率越高,采样位数越多,声道数越多,压缩率越低,得到的数字化声音质量越高,相应的信息量也越大。音频档案数字化选用采样频率为44.1kHz;量化级为16位;立体声双声道采样参数。对于DVD中的声音选用48kHz。

  5.3.6.2声音档案数字化时必须远离强磁场等外部干扰。

  5.3.6.3数字化过程中应检查声音档案载体质量,确保声音档案的真实性、完整性。

  5.3.7音频档案数字化操作规程

  5.3.7.1计算数字化录音带所需的磁盘空间;

  5.3.7.2数字化录音带参数设置;

  5.3.7.3开始进行数字化,打开放音设备,启动数字化采集程序;

  5.3.7.4全程监听数字化采集情况,直至采集完成;

  5.3.7.5重新命名采集的文件名

  5.3.7.6采集完成后,检查形成的文件是否可以正常播放;

  5.3.7.7处理采集的文件:数字化录音带会形成两个文件,分别对应录音带的A、B面,需要将两个文件进行合并形成一个文件;

  5.3.7.8将数字化完成后的档案归档保存。

  6视频档案数字化技术规范

  6.1术语解释

  6.1.1 MPEG-2标准

  ISO/IEC制定的视频压缩编码标准,是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定。

  6.1.2 WMV

  WMV是微软推出的一种流媒体格式,在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。

  6.1.3数码率

  系统在单位时间内传送的数据量。在实时传输情况下,数码率等于取样频率与量化比特数的乘积。数码率的单位通常为Mbps,即兆比特/秒。

  6.2视频档案整理

  参照纸质档案数字化操作规程。

  6.3技术要求

  6.3.1硬件设备

  6.3.1.1采集压缩设备

  采用专业级或广播级的硬件采集压缩设备,应同时具备AV复合端子、S端子、分量等多种视频输入接口,支持MPEG-2硬件压缩。

  6.3.1.2计算机设备

  应用性能稳定、配置较高的计算机作为数字化设备。

  6.3.1.3放像设备

  放像设备必须能正确地将影像信息源输出。根据视频档案原始载体型号配备相应的放像设备。

  6.3.1.4存储设备

  使用硬盘、磁盘阵列和磁带机等,脱机保存可采用光盘存储。影像信号除存储在硬盘中随机使用外,应备份至磁带或光盘上脱机保存,如有必要,应异地保存。

  6.3.2参数设置

  配置相应采集软件的相关参数,根据磁带视频制式,设定所采集的视频制式(PAL、NTSC、SECAM)。采集卡的码流最高值至少应为10MB。

  6.3.3视频转换

  6.3.3.1视频压缩编码规格采用MPEG-1或MPEG-2标准。

  6.3.3.2压缩数码率应大于4MB/S。

  6.3.3.3视频压缩尺寸及帧率参照原影像档案标准。

  6.3.4文件存储

  6.3.4.1存储格式

  采用AVI、MPEG-1、MPEG-2文件格式进行存储。根据视频质量选择参数,MPEG1格式比特率是固定的1.5MB/S,MPEG2格式可根据原视频质量选取比特率,一般平均比特率可选4Mb/S。

  6.3.4.2存储方式和命名规则

  单一视频文件大小不应超过1GB,超过1GB的应进行切割存储。对于物理性必须分割的视频,要求必须有1分钟的重叠区域,便于检索和衔接。

  按视频档案的“档号”建立文件夹方式存储。

  以档案数据库中视频档案的档号,命名该视频档案的存储文件夹;以视频档案的题名,命名该存储文件夹下所保存的视频文件。通过档号的一致性和唯一性,建立起档案数据库条目与存储文件夹一一对应的关联关系,从而确保视频文件挂接的正确。

  6.3.5技术指标与要求

  6.3.5.1对模拟视频信号进行数字化处理的参数:

  主观质量描述采样方式帧数(帧/秒)视频速率(kbps)音频设定音频采样

  保留原有质量1920*1152 30-60 40000 384k立体声、48KHZ

  相当于Dvd质量720*576 25-30 1500 384k立体声、48KHZ

  相当于Vcd质量352*288 15-25 500 224k立体声、48KHZ

  6.3.5.2视频档案数字化时必须远离强磁场等外部干扰。

  6.3.5.3数字化过程中应检查载体质量,确保视频档案的真实性、完整性。

  6.3.6视频档案数字化操作规程

  6.3.6.1计算出数字化录像带所需的磁盘空间,使存储文件的磁盘满足采集的要求;

  6.3.6.2数字化录像带参数设置;

  6.3.6.3开始进行数字化,打开录像设备,启动数字化采集程序;

  6.3.6.4全程监控数字化采集情况,直至采集完成;

  6.3.6.5采集完成后,检查形成的文件是否可以正常播放;

  6.3.6.6将数字化完成后的档案归档保存。

标签

我是中博奥客服:小奥
中博奥技术有限公司& 版权所有工信部备案号:豫ICP备11015869号-8 Copyright © 2023-2024

档案整理档案数字化

档案扫描档案管理软件系统

TEL:18937133779

To Top