欢迎来到中博奥技术有限公司官网

档案数字化加工,档案数字化加工流程

时间:2022-09-13 作者:中博奥 来源:网络 点击量:

  随着社会信息化的迅速发展,为了使档案信息资源,准确、方便、快捷的利用,使可以公开的档案信息资源得到共享,满足对档案利用的需求,我们要进行纸质档案数字化加工。

档案数字化加工

  档案数字化加工定义

  档案数字化加工是随着计算机技术、扫描技术、OCR技术、数字摄影技术(录音、录像)、数据库技术、多媒体技术、存储技术的发展而产生的一种新型档案信息形态将其转化为存储在磁盘、光盘等载体上,并能被计算机识别的数字图像或数字文本的处理过程。

  档案数字化加工是一种新型的档案信息管理模式,它把各种载体的档案资源转化为数字化的档案信息,以数字化的形式储存,网络化的形式互相连接,利用计算机系统进行管理,形成有序结构的档案信息库,及时提供利用,实现资源共享。

  档案数字化加工步骤

  前期档案整理

  档案借出

  从档案室接件,填写档案移交清册,一式两份。拿到档案后,开始核对档案数量,数量核对无误后签字确认,将档案拿回加工现场。

  目录数据准备

  按照各类档案整理规定的要求,在档案管理系统著录目录数据。如有错误或不规范的案卷题名、文件名、责任者、日期、起止页号等,应进行修改。

  拆除装订

  在不去除装订物情况下,会影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。

  页面修整

  破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或熨平等)后再进行扫描。

  档案扫描

  扫描方式

  (1)根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描。

  (2)纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案,可采用高速扫描方式以提高工作效率。

  扫描色彩模式

  (1)扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用彩色。

  (2)页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。

  (3)页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。

  (4)页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可采用彩色模式进行扫描。

  扫描分辨率

  (1)扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。

  (2)采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般应设为200-300dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。

  图像处理

  图像数据质量检查

  (1)对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。

  (2)由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。

  (3)发现文件漏扫时,应及时补扫并正确插入图像。

  (4)发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。

  纠偏、去污、图像拼接、裁边处理

  (1)对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。

  (2)对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。

  (3)对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。

  (4)采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

  图像存储

  存储格式

  (1)采用黑白二值模式扫描的图像文件,一般采用PDF格式存储。

  (2)采用灰度模式和彩色模式扫描的文件,一般采用PDF格式存储。

  图像文件命名

  (1)纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。如图像文件较大,不便于网络浏览,可拆分为多个图像文件,文件名后增加A、B、C等区别。

  (2)分别建立文件夹,以文件档号命名,并存储对应图像文件。

  数据挂接

  将每一份纸质档案扫描所得的图像存储到相应档号的文件夹后,认真核查每一份图像文件的名称与档案目录数据库中该份文件的档号是否相同,图像文件的页数与档案目录数据库中文件的总页数是否相同等。通过每一份图像文件所在文件夹的名称与档案目录数据库中该份文件的档号的一致性和唯一性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。

  档案数字化加工流程

  1.数字化加工流程

  1.1纸质档案数字化加工的基本环节主要包括:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果管理等。

  2.档案扫描

  2.1扫描方式

  2.1.1根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。

  2.1.2纸张状况较差,以及过薄、过软或超厚的档案,应案,以及页面为多色文字的档案,可采用灰度模式扫描。方式以提高工作效率。

  2.2扫描色彩模式

  2.2.1扫描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。

  2.2.2页面为黑白两色,并且字迹清晰、不带插图的档案。可采用黑白二值模式进行扫描。

  2.2.3页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。

  2.2.4页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。

  2.3扫描分辨率

  2.3.1扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。

  2.3.2采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择大于或等于200dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。

  2.3.3需要进行OCR汉字识别的档案,扫描分辨率建议选择大于或等于250dpi。

  2.4扫描登记

  认真填写纸质档案数字化转换过程交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。

  2.5扫描中的文件保护

  2.5.1认真对好流程单,依照目录数据库中案卷的编号在扫描系统中建立同样的案卷编号,然后导入目录数据库中的著录的数据。

  2.5.2核对系统中的案卷信息是否与原件一致,如果发现差错,要在著录系统中更改。

  2.5.3核对实际扫描的页数和档案整理时填写的页数是否一致,不一致时应注明具体的原因和处理的方法。

  2.6扫描仪常出的故障以及处理

  2.6.1扫描时图像有时会出现黑线,或图像不应该出现的污点,和大面积的黑边。说明扫描仪有污渍或纸屑粘在镜头上。

  2.6.2打开扫描仪镜头用干净的海绵,或者专业的镜头布,擦除镜头上的污渍即可。

  3.档案的录入

  3.1录入的规则

  3.1.1根据客户的要求对整理好的档案进行录入,按照《档案著录规则》的要求,规范档案中的目录内容。

  3.1.2录入档案案卷的基本信息(编号,题名,目录号等)。

  3.1.3建成案卷目录后按照卷内的目录顺序对文件级数据进行录入,要祥细的录入每一份文件的题名,时间,文号等。

  3.1.4建立档案目录数据库,录入时要先检查档案,看档案有没有破损的,查看档案的页码是否正确,同时根据客户的要求区分什么需要录入的,什么不需要录入。

  3.1.5录入时要依照档案原件录入,不得私自更改档案的原件,录入完成后要进行检查,核对录入项目是否完整,内容是否规范准确,对于不合格的数据要进行修改或是重录。

  3.1.6录入可以采用OCR识别,可提高录入的工作效率。

  4.图像处理

  4.1图像核对

  4.1.1扫描完的图像要进行图像的优化处理,首先应核对扫描的图像数量是否和导入的目录数据库中文件的页数一致。

  4.1.2如出现不一致只有两种可能,一是录入原档案有错,可依照原档案更改,二是扫描出错可能出现漏扫,要进行补扫。

  4.2图像数据质量检查

  4.2.1对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要求时,应重新进行图像的处理。

  4.2.2由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重新扫描。

  4.2.3发现文件漏扫时,应及时补扫并正确插入图像。

  4.2.4发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。

  4.1.5认真填写相关表单,记录质检结果和处理意见。

  4.3纠偏

  对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。文件标题倾斜的应该予以纠偏,视觉上基本不感觉歪斜。对方向不正确的图像应进行旋转还原,以符合阅读习惯。

  4.4去污

  对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理。文件中的明显装订孔亦要进行处理,处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。

  4.5图像拼接

  对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。

  4.6裁边处理

  采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。

  4.7图像的补扫

  4.7.1补扫主要处理由优化操作不当,造成的图像不完整,误删的情况。

  4.7.2高速扫描造成的漏扫,重张进纸。图像不清晰以及高速扫描仪不能处理的特别文件。

  5.图像存储

  5.1存储格式

  5.1.1采用黑白二值模式扫描的图像文件,一般采用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,一般采用JPEG格式存储。存储时的压缩率的选择,应以保证扫描的图像清晰可读的前提下,尽量减小存储容量为准则。

  5.1.2提供网络查询的扫描图像,也可存储为CEB、PDF或其他格式。

  5.2图像文件的命名

  5.2.1纸质档案目录数据库中的每一份文件,都有一个与之相对应的唯一档号,以该档号为这份文件扫描后的图像文件命名。

  5.2.2多页文件可采用该档号建立相应文件夹,按页码顺序对图像文件命名。

  6.图像的挂机与关联

  6.1图像质检合格后的图像数据要进行图像数据的压缩和转换格式,上传到总数据服务器,通过软件可以实现档案的目录数据库对相关数字图像的挂接。

标签

我是中博奥客服:小奥
中博奥技术有限公司& 版权所有工信部备案号:豫ICP备11015869号-8 Copyright © 2023-2024

档案整理档案数字化

档案扫描档案管理软件系统

TEL:18937133779

To Top