欢迎来到中博奥技术有限公司官网

辽宁省数字档案公司

时间:2024-01-05 作者:中博奥 来源:中博奥 点击量:

  扫描方式要根据档案幅面的大小(A4、A3、A0)选择相应规格的扫描仪和专业扫描仪(如工程扫描可采用0号图纸扫描仪)进行扫描。

辽宁省数字档案公司

      大幅面档案可以采用大幅面数码平台,或者用缩微拍摄后的胶片数字化转换设备进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。如果纸张较长但幅面不超过A3,可采用扫描仪长纸扫描功能,根据纸张状况设定合适的扫描幅长即可。

  纸张较差的情况,或者过于薄、过软、超厚的档案,可采用平板扫描方式。纸张状况较好的档案可采用高速扫描的方式进行扫描,以提高工作效率。

  纸张比较薄的档案(如信纸、便笺纸)容易破损且透光,应采用中、低档进行扫描。

  纸张如有破损,可将破损纸张夹人透明塑料薄膜内,调整扫描仪进纸为厚纸模式并采用中、低档进行扫描,如破损严重且不平整,采用平板扫描仪来完成。下面以图档易扫通扫描软件为例,作以详细介绍。见图1扫描作业平台。

  (1)扫描色彩模式

  扫描色彩模式一般分为黑白二值、灰度、彩色等,通常采用黑白二值。页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。

  页面为黑白两色,但字迹清晰度差或者带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。

  页面中带有红头、印章或者插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。

  底灰较深的纸张(如草浆纸、油印纸),如采用黑白二值应将扫描对比度及亮度适当调低,调节效果不理想则采用灰度扫描。

  字迹较浅(如铅笔字)的纸张:如采用黑白二值扫描应调节临界值,拉大字迹与原稿的反差,效果不理想则采用灰度扫描。见图2扫描色彩模式。

  (2)扫描分辨率

  扫描分辨率参数大小的选择,原则上是以扫描后的图像清晰、完整、不影响图像的利用效果为准。为了方便以后OCR识别,扫描分辨率建议选择大于等于300dpi。一般情况下,分辨率越高识别率也就会越高。但这也不是绝对的,对于一些过大过粗的字体,设置过高的分辨率,识别率可能会降低,而且设置高分辨率后,扫描速度会大大降低。见图3扫描分辨率选择。

  (3)亮度和对比度

  在扫描过程中,适当地调整好扫描仪的亮度和对比度值,对识别率的高低影响比较大,在进行扫描亮度和对比度的设定时,以扫描后的图像中文字的笔画较细、均匀,且没有明显断点为准。如果扫描后的文字图像存在有黑点、黑斑或者文字线条很粗很黑,分不清楚笔画的情况下,说明亮度值太小,应该增加亮度值再重新扫描。如果文字线条凹凸不平,有断线甚至图像中汉字轮廓残缺时,说明亮度太大,应减小亮度后再重新扫描。

  (4)扫描登记

  认真填写纸质档案数字化扫描过程中交接登记表单,登记扫描的页数,核对每份文件的实际扫描页数和档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。

  数字档案的整理和扫描

  (一)档案整理

  在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要作出标识,确保档案数字化质量。

  1、目录数据准备

  按照《档案著录规则》(DA/T 18)等的要求,规范档案中的目录内容,包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件名、责任者、起止页号和页数等,应进行修改。

  2、拆除装订

  在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物;将档案原件的装订线拆除,排好顺序,不得出现任何漏缺页及顺序差错,更不能对档案原件有任何损坏。

  3、区分扫描件和非扫描件

  按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关的重份的文件要剔除,有正式件的文件可以不扫描原稿。

  4、页面修整

  对破损严重、无法直接进行扫描的档案,应先进行技术修复、裱糊;

  折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。

  5、档案整理登记

  制作并填写纸质档案数字化加工过程登记表,详细记录档案整理后每份文件的起始页号和页数。

  (二)档案扫描

  1、扫描方式(扫描前必须准备一台专业的平板扫描仪)

  根据档案幅面的大小(A4、A3、AO等)选择相应规格的扫描仪或专业担描仪,如

  工程图纸可采用0号图纸扫描仪进行扫描。

  普通A4纸质文件,采用高速扫描仪的自动进纸方式扫描;

  纸质过薄、透明的(如信纸、便签纸)采用高速扫描仪的平板扫描;

  纸质过厚、照片等档案采用高速扫描仪的平板扫描;

  对文件页面贴有附属小页面、纸张时,将大小页面单独在平板中扫描;2、扫描模式(纸质档案扫描一般采用黑白、灰度和彩色三种模式)

  页面为黑白两色,字迹清晰的、不带图片的档案材料,采用黑白方式;

  页面为黑白两色,清晰度较差或者带有图片的档案材料,以及页面多为彩色文字的档案,采用彩色或灰度模式(因情况而定);

  页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,采用彩色模式扫描。

  3、分辨率选择

  采用黑白、256级灰度模式扫描的文件,其分辨率选择为不小于300DPI;

  采用24位为彩色模式扫描的文件,其分辨率选择为不小于200DPI。(以上模式分辨率的设定以A4纸张为标准,其他规格纸张酌情处理)

  扫描的线数、阀值、亮度、灰度、对比度等值可根据所扫描文件材料的清晰度进行适当的调整;

  需要时可根据原件的清晰度适当调整扫描分辨率。如原件质量较差且尺寸较小,可适当提高分辨率;反之也可相应减少分辨率,增减的多少以扫描后图像按原尺寸显示后是否清晰为准;

  粘贴折页与表格,对于粘贴折页,可用大幅面扫描仪扫描,或先部分扫描后拼接;对部分字体很小、字迹密集的情况,可适当提高扫描分辨率,选择灰度扫描或彩色扫描,采用局部深化技术解决;对字迹与表格颜色深度不同的,采用局部淡化技术解决。

  4、扫描登记

  填写交接登记表,登记扫描的页数。核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。

  档案数字化扫描方式

  扫描的方式根据档案纸张的大小和状态进行选择,小幅面的可以选择相应规格的扫描仪,大幅面的则选择大幅面数码平台,或者扫描微缩处理后的胶片,或者进行图像拼接。纸张状态较好时,可以选择高速扫描的方式;如有纸张破损或非常规薄、软、厚的情况,则需采用平板扫描仪。

  1扫描色彩模式

  扫描色彩模式一般有二值、灰度以及彩色,第一种方式选择得比较多。一般情况下黑白两色、字迹清晰的纯文本档案可以采用黑白二值模式扫描,若字迹不清或带有插图则可以选择灰度模式。带有红头、印章或者其他颜色以及插图的档案,可以用彩色模式扫描。纸张底色较深的档案,在使用二值模式时,可以把对比度和亮度调低,成品不清晰时可以改用灰度扫描。

  2扫描分辨率

  以扫描成果清晰完好且不影响后续电子档案的利用为前提,来确定扫描分辨率。通常,分辨率与成果识别率呈正相关。但如果档案文字过大或过粗,高扫描分辨率可能会造成识别率和扫描速度双双降低,对档案数字化工作进度造成影响。

  3扫描亮度及对比度

  作业过程中,需要适当调节扫描仪的亮度以及对比值。具体以扫描亮度和对比度不影响扫描后文字及图像笔画清晰、粗细均匀,没有过大断点为准。如果扫描后的电子档案存在噪点、黑斑或者文字线条过粗导致笔画无法辨认的情况,这代表档案扫描时选择的亮度值过小,应该进行适当提高后重新进行扫描。如果文字线条出现较多断点甚至文字残缺,说明亮度过高,应调低后重扫。

  4扫描过程登记

  扫描过程中需要仔细填写纸质档案数字化登记交接单,对于扫描文件页数进行登记,核实每份扫描文件的实际页数和扫描后电子文件的页数一致。如出现二者不一致的情况,应在登记表内写明原因和相应的举措。

  档案数字化与扫描技术

  档案数字化实现文本的输入,主要是采用扫描方式将纸质的文件与档案转换为数字化的形式。扫描加工是通过中高速扫描仪和专用扫描软件将整理和分检好的档案资料批量转化成图像文件,并自动实现图像压缩存储的过程。

  (一)国家规范中的有关标准

  档案数字化直接标准除《电子文件归档与管理规范》外,就是《纸质档案数字化技术规范》。这一技术规范指出,“扫描应该根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。”另外,“纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率。”

  扫描色彩模式一般有黑白二值、灰度、彩色等,通常采用的是黑白二值。具体又细分为三种:“页面为黑白两色,并且字迹清晰、不带插图的档案,可采用黑白二值模式进行扫描。页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可采用灰度模式扫描。页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。”

  扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。因为高分辨率容易使文件遭到复制,基于此,国家规范中规定采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均选择≥100dpi。如遇到文字偏小、密集、清晰度较差等特殊状况,则可以适当提高分辨率。而需要进行OCR汉字识别的档案,扫描分辨率一般建议选择≥200dpi。

  (二)实际操作中的做法

  实际工作中,档案部门根据档案本身不同情况,一般都采用各类扫描仪进行扫描,数码相机则较少使用。另外,实际扫描中受档案状况或扫描设备所限,也存有一些暂时无法进行数字化转换的档案,如纸张过于破损、发脆,或者某些尺寸过大的图纸等。而这些只能等待设备或者技术的更进后才可以解决。

  色彩模式的选择是依据现有的设备以及档案本身状况而定的,可以遵守循序渐进的原则。比如杭州市档案馆在进行纸质档案数字化时,一期以黑白扫描为主,二期对红头文件及其他带有红章的文件进行彩色扫描,三期则全部进行彩色扫描。无疑,彩色扫描的层次更加丰富,清晰度更高,可以更真实地显示档案原貌。

  分辨率的选择与设备关系很大,在不同地区、不同部门也有所差别。如杭州市档案馆在纸质档案数字化的一期工程中,就将扫描分辨率定为300dpi,浙江省档案馆的数字化扫描分辨率一般在200~300dpi左右,有的高达600dpi;而在一些设备相对比较落后的部门与地区,其扫描分辨率大都是按照国家规范来设定的,甚至于很多部门还达不到200dpi。分辨率越高,扫描后的图像就越清晰,但同时必须考虑到图像文件的大小。

  (三)扫描技术发展趋势

  扫描技术中最主要的是色彩模式选择和分辨率选择。

  色彩模式无疑会朝着彩色扫描发展,而分辨率的选择需要根据实际业务进行灵活设置。一般情况下,为了满足网络化查询利用,黑白图像采用200dpi就可以满足要求,彩色图像的扫描分辨率还可以低一些,具体参数可以根据扫描清晰度和质量因素进行综合选择。对于一些特殊的利用如承办展览等可以采用较高的扫描分辨率来进行。值得注意的是,分辨率的选择既不可过低,也不可过高。如福建曾采用了50dpi的扫描分辨率,虽然容量小、费用低,但是根本无法实现上网查询利用,等于做了无用功;另一方面,如果一味追求过高的分辨率,则会导致容量过大,对于网上资源的传播也是一种负担。

  档案数字化后还要考虑文字识别(OCR)的运用,一般来说,文字识别主要用于全文检索之用,而非真正将扫描后的图像文件还原为文档,因而,就这一点看,不要以OCR的识别率来设置扫描分辨率,《纸质档案数字化技术规范》建议需要OCR识别的图像文件,分辨率≥200dpi,这是一个比较中性的标准。

标签

我是中博奥客服:小奥
中博奥技术有限公司& 版权所有工信部备案号:豫ICP备11015869号-8 Copyright © 2023-2024

档案整理档案数字化

档案扫描档案管理软件系统

TEL:18937133779

To Top