时间:2022-04-29 16:19:47
档案管理技术范文第1篇
高校档案信息化管理模式问题
传统的高校档案管理,主要是将计算机运用于手工操作,它是以档案信息载体为核心,以纸张、塑胶和线等为材料,以计算机为辅助工具,服务于档案部门,适用于档案编目,帮助档案人员实现内部管理档案的实体,应用于检索的地方不多,更不是针对具体的档案信息,计算机所具备的资源共享与信息交流作用得不到开发,高校内部与高校之间的档案资源共享网络不畅通,更难以实现档案信息资源的交流与共享。更为突出的是,由于各级各类高校的主管部门不同、隶属关系各异,其档案建设及其管理也就自行其是、各搞一套,带有很大的随意性和盲目性。各高校多根据自身条件与喜好选购设备,所购置的机型各不相同。其数据库管理系统也多用Dbase、Fox-BASE、FoxPro等编写,难以建立覆盖全校各类信息集成的MIS系统。目前,各高校普遍缺少全文数据库和多媒体数据库,而条目数据库已无法满足用户日益增长的各类需求,所研制的应用软件功能单一、数据不完整、大多无主题标引、共享性差,与国际通用的统一规范与标准相距太远。同时,高校档案工作标准中采用国际标准的还不多,仍以传统档案管理为主要内容。而且目前高校档案整理中相近文件的重复与立卷组合的情况很多。高校应该注重校园网的建设,使高校档案馆信息数据库与各学院及各系、部、处、中心数据库实现资源共享,使计算机从辅助性的工具很快发展成为信息传播的主体。档案部门可以及时地对档案的数量需求做出统计、分析,便于准确掌握档案信息的利用规律,及时了解用户对档案信息的需求,满足用户需要。各系、部、处也可以在网上查询自己所需要的材料,同时可以打印,以方便广大师生。校园网络能够使位于不同地点的师生自由地交流、传递有关档案的信息并协同工作,从而实现资源共享,为学校档案工作再上台阶创造良好的环境。在建设好校园网的基础上,可以考虑建立与其他高校和政府部门的档案信息资源共享平台,立足于档案局域网建设,以馆内、馆际之间互联互通的档案网络为基础,满足档案信息化管理需要和服务需求,更广泛地发挥信息技术在高校档案管理中的作用,提升高校档案的地位。软件的质量和数据库的建设也是影响高校档案信息化的重要因素。各高校购置软件时,应按照国家档案局编制的《计算机档案管理软件测评标准》,着重测查和检核其功能度、兼容性、速度、易用性、容错性等8个方面的质量。应选择适用于多种操作系统、多种硬件平台的具有多用户、多任务和能在网络环境下运行,具有客户机、服务器结构的数据库管理系统。比如,选择ORA-CLE新版本数据库,不仅可以降低应用成本,提供实时应用集群(RAC)技术,还能实现数据的完全备份、增量备份、数据恢复和容灾等功能,从而有效地保障档案信息的安全、数据的高可用性及系统的稳定性。各高校档案部门应结合自身实际,加强相关规范、制度和标准的研制。首先,应参照国际标准;其次,应考虑采用国家、行业及地方标准;再次,应结合高校档案信息化过程中积累的宝贵经验,制定切合实际的规范标准。标准一经制定,档案部门和各学院、部门都应遵照执行。只有以档案标准化建设为依托,档案信息化建设才有保障。应按照“整体规划、统一管理”的要求,建立高校范围内统一的档案管理体系(包括管理架构、管理流程和标准规范)和统一的档案管理平台,实现各学院、部门的统一档案管理,构建起二级和三级单位的档案信息化管理网络,达到馆、学院、部门之间的无缝连接。
高校档案信息化服务水平问题
高校档案信息化的建设不是一项局域性的技术工程,而是涉及所有环节的系统工程。档案工作人员既要敬业爱岗,更要精通业务,掌握充分足够的档案信息化管理相关知识,这样才能做好档案的服务工作,发挥档案信息化功能。然而,目前很多高校人事部门为了引进人才,把一些根本不具备档案管理素质的家属分配到档案部门工作,把一些无法安排的快要退休的非档案专业的干部分配到档案部门工作,作为其退休前的中转站。而高校各学院和部门安排的绝大多数是兼职档案员,这些档案工作人员身兼数职,难以全身心投入到档案管理工作中。在这种缺乏有效建设机制的情况下,高校档案工作队伍的整体素质薄弱。信息化进程之所以缓慢,在很大程度上归结于目前高校档案人员的整体素质不高,人才因素已严重影响了高校档案信息化工作的发展。因此,高校人事部门要重视档案工作队伍的专业建设,可以采用档案工作人员职业准入考试制度,对想进入档案部门工作的人员进行岗前培训和上岗资格考试。特别应参照律师、教师、医生等行业、专业所采取的资格准入办法,由国家制定统一考试标准,各省市自治区统一组织本省各高校档案人员的专业考试,既作为从事档案工作的入门条件,又作为职称、职务晋升的必要条件和资格。一考多用,促进档案人员的专业发展,加速高校档案工作队伍的专业化建设。对既精通计算机,同时又非常了解档案专业的人才要加大引进力度,实施优惠政策,加强对其的吸引力。高校应加强档案工作人员的培训交流,将培训情况列入考绩、评审的范围,积极探索推行并不断完善档案信息化知识的考核制度。同时,部门应该为档案工作人员积极搭建各种工作交流平台,特别要与档案信息化建设较好的高校多联系。开展形式多样、生动活泼、效果显著的交流、合作与研讨,资源共享、信息共享,共同进步、共同提高。高校档案工作人员也应自我加压、努力进取,提升自身高校档案工作的信息化素质,提高信息化背景下的档案服务工作质量,从而为高校的教育教学、科学研究、人才培养、社会服务等工作提供良好的安全信息系统保障。上述四个方面是当前我国信息技术应用于高校档案管理过程中亟需解决的问题。信息技术为高校的档案管理带来了生机和活力,也带来了一系列的困惑和问题。让信息技术在高校档案管理中发挥更大的作用,提高高校档案的管理效率,这是我们每一位档案管理工作人员应有的责任和义务。
本文作者:黄宝春作者单位:浙江师范大学
档案管理技术范文第2篇
高校档案管理类目繁多、复杂,档案容量较大,传统的档案管理方式在当前的档案管理工作中显得很混乱,信息技术的引进,使得各项档案管理工作都变得更加轻松,人们只需要借助于档案管理的计算机平台,就可实现的档案的检索和提取,并快速、准确的找到对应的纸质档案。从管理手段上来讲,现在的计算机录入和手工抄录相比,有着绝对优势,且保密度和安全度更高。从人事管理上来讲,信息技术的使用,克服了人工管理的缺陷,革新了档案管理人员的工作方式,极大减轻了大档案馆的工作强度。工作强度的降低和工作方式的革新,提升了人员的工作积极性。
2高校档案管理中存在的问题
2.1档案信息化管理改革不彻底
很多高校在实现信息化档案管理的道路上,始终无法实现全面的信息化管理,由于资金和人事方面的原因,高校信息化档案管理改革始终是进程缓慢。比如,很多高校在进行信息化档案管理改革时,随着信息化管理程度的加深,由于人工依赖程度的降低,必定会涉及人事调动或裁员问题,但很多从事档案管理的人员或高校退休教师,对学校有过贡献,或有过劳动合同的人员,他们既自己不愿意调动离开,学校对此事也难以出面处理,给高校的信息化档案管理改革造成了较大的阻碍。
2.2信息化档案管理改革还未开始
目前,由于资金限制,很多高校还没有进行和信息化管理改革,依旧采用传统人工管理的方式开展档案管理工作。但人工管理效率极低,且高校档案更替速度快、更替容量大,人工进行档案管理势必会有漏洞和力不从心的时候,很多年事久远的档案信息残缺、字迹也不清晰,甚至档案书籍都出现了虫蛀或破损,而人员在进行档案更替时,根本无暇顾及这些档案的管理和修复工作。
2.3人员业务素质低
实现信息化档案管理的一项基本要求是人员必须具备熟练的计算机操作技术,但当前高校用于信息化档案管理的人员都是老一批的工作人员,有些甚至年事已高,计算机操作水平很低,无法迎合信息化档案管理的需求。
2.4缺失完善的档案管理机制
很多高校在进行档案管理信息化建设时,都忽略了新管理机制的订立。由于缺少对应的档案管理机制,部分高校在实现信息化档案管理之后,都出现了管理秩序混乱的问题,尤其是档案的安全管理,面临着严峻挑战,由于没有相应的安全管理机制,导致管理系统软件和程序未定期更新,造成档案的混乱和信息丢失。同类的问题还有很多,如缺少档案维护制度、缺少档案馆计算机管理制度等。
3高校如何实现信息化档案管理
3.1更新管理理念,加强信息化建设
很多高校领导人员并不认为档案管理工作中存在业绩竞争,因此,在制定档案管理工作和薪资发放制度时,未引入竞争理念,导致人员从事档案管理出现懈怠和放任自流的现象。未来加强人员管理意识,高校领导必须更新管理理念,通过开展责任意识教育会议等活动,增强工作人员的责任心,同时,以制度的订立,规制工作人员的工作行为,不断深入到档案管理基层人员当中,了解档案管理存在的问题并有效解决。
3.2加大信息化档案管理建设投资
很多高校忙于教育设施建设,无法抽调资金用于档案的信息化建设,这对信息化档案管理的改革造成了很大影响。因此,高校必须尽快引进先进的计算机设备和信息管理技术,保障院校信息化档案管理的设备条件。同时招聘一部分从事档案管理的专业人才,带动老员工发展,维护信息化建设进程,解决信息化档案管理中的技术问题和安全问题。
3.3强化人员培训工作
高校档案管理要想全面实现信息化建设,就必须实现人才队伍信息技术水平的整体提升,对此,学校必须通过技能培训和技能考核等方式,扎实提升人员素质。学校可将分批将档案馆工作人员,派遣至相关单位学习、进修,或开设培训班,内部组织技术培训。制定人员技能考核机制,同时对人员的业务技能和职业操守、理论知识以及安全意识等进行考核。
3.4标准化建设
所谓标准化建设就是指档案馆信息化管理网络基础的标准化建设。网络是信息化档案管理运作的基础,同时也是保障学校档案管理安全的重要措施,保障网络基础的标准化,学校必须要为档案管理单独开设一个局域网,防止外网的进入,同时,每台计算机设备所使用的管理软件、程序版本等都必须一致。
4结语
档案管理技术范文第3篇
一、人事档案管理理念的不适应
1、缺乏人事档案的知情权。近年来,由于人事档案的不透明、知情权不落实而造成的问题越来越多。有的因原单位在当事人的人事档案中记录了不实之词,甚至塞进了缺乏事实根据的材料,造成了对当事人的伤害;有的因长期无法了解个人档案致使档案丢失而无从知晓。因此,由人事档案丢失而引发的纠纷、诉讼频频出现。
2.人事档案保管权的局限。按国家规定,目前我国只有机关、事业单位和国有企业才有人事档案保管权,而随着我国经济建设的发展,外资企业、民营企业等经济成分在经济发展中占有越来越大的比例,这些单位按国家规定没有人事档案保管权,只能把档案寄放在人才交流中心并向它们交纳一定的管理费用。这种做法,由于用人单位与人才交流中心不存在行政权约束,因此,不能有效地对人事档案进行管理。
二、人事档案管理方法的不适应
1、“档随人走”的传统管理方法受到挑战。改革开放以来,特别是随着市场经济体制逐步推进,人员流动现象日益增加,人档分离现象越来越普遍,尽管《干部档案工作条例》、《企业职工档案工作规定》对流动人员的人事档案作了规定,但实际操作中管理部门与流动人员之间的权益和管理矛盾日益显露。有的单位为了防止人才流失,以档案为关卡,造成了“弃档”现象日益严重,淡化人事档案的呼声越来越高。
2.传统的手工管理制约了人事档案的质量与效率。人事档案多年来采用传统的十大分类制,一份材料归属什么种类常常存在许多主观因素。近年来,虽然采用了计算机进行辅助管理,但也只是采用电脑进行目录录入,并没有带来管理方法质的飞跃,造成人事档案管理效率低。
三、人事档案管理制度的不适应
1、人事档案收集缺乏力度、材料质量差的问题普遍存在。首先是收集归档的工作制度不健全,执行不严格。少数管档案部门只照搬中组部下发的《干部人事档案材料收集归档规定》,没有形成自己的实施细则,内容不具体、不全面。即使建立了制度也存在不同程度上执行不严格的现象。归档工作被动、不及时。其次是收集归档的材料不全面、不准确。特别是交给人才交流,代管的人事档案,职工考核材料、人员鉴定材料和反映个人能力水平的材料等,不能及时收集到个人档案中。
2、缺少有效的检查、监督机制。许多单位的人事档案长期处于凌乱、无人问津的状态,发挥不了应有的作用。由于没有定期检查,使水事档案管理有空可钻,新增加材料的连续性出那断裂现象;部分人员档案材料遗失;一些单位趁人员调动、单位合并之机把未整理的人事档案顺水推舟移交出去,推卸责任。
3、材料的真实性受到质疑。有的个人或单位出于某种考虑或避开某种风险,刻意更换材料或隐瞒事实,使人事档案信息虚假或不全,可信度大大降低,这必然使用人单位处于被动状态,特别是现在录用人员都是采用先进人后调档的方式,一旦用人单位发展问题为时已晚。
四、改变档案管理现状的几点对策
1、要具备现代化的观念。计算机和信息技术的快速发展,已经和正在档案管理工作产生划时代的巨大影响。随着机关、企业单位办公自动化进程的加快,大量机读档案录音、录像、照片等新型电子文档的形成已纳人档案管理。要解决一个观念问题,就是我们档案的现代化建设不是简单地用计算机代替手工劳动,也不是把传统的管理方式搬到网络管理上来,而是要借助现代信息技术,引进先进的管理理念,对档案管理中不适应的一些做法进行改革。尽快树立起现代化的观念是每一个档案工作者紧迫的必修课,是档案管理步人现代化的第一步。
2、要有适应时展的内部管理。对于各级档案部门来说,采用科学的管理手段,为实现档案管理的现代化打下基础是非常必要的。
3.要进行人事档案管理模式的变革。市场经济的建立产生了多种经济组织形式,这有利于人才的吸纳、流动,人事管理变成了一种社会化的管理。传统模式在过去人事管理中起到了重要作用,在今天也还有它一定的适用范围,但不应成为唯一的模式。对于那些企事业单位职工、教师及流动人员的值得保密的东西不多的档案,可以逐步进行社会化、开放式管理。
4、要有先进的设备和技术。目前就大多数档案馆(室)特别是基层档案馆(室)来说,先进设备不可能引进,因此,我们一方面要不失时机地争取相关部门的支持,力争改变我们设备条件,为现代化打下基础,同时也应不失时机地培养人才,使现有的设备尽可能地与自己的馆藏实际相结合,在档案管理和提供使用中发挥作用。这方面重要任务一是充分利用现有设备,使之充分发挥效用,总结经验,培养人才。二是在整理、编目等基础工作的标准化上多下功夫,为进一步引进设备创造条件。三是对电子文件归档工作着眼点要高,立足点要实,在规划电子文件归档工作时应从本单位的实际情况出发,在保管条件,翻拍复印、装订等方面的现代化需要新的知识和新的技术手段。现有的立卷人员尚不能适应工作的需要,要通过组织培训及业务学习等,尽快掌握信息管理自动化的基本知识和技能。总之,在购买和采用现代化设备上,必须以相关人才的调人和培养为前提,因为没有懂技术的相关人才,设备不可能充分发挥作用。另外,购买和引进设备一定要考虑到本单位的实际,重点搞好基础工作,只有基础工作先行,现代化设备才能真正充分发挥作用。
内容摘要:我国档案管理规范化、现代化一直是档案管理追求的目标,而从上个世纪末开始的计算机信息技术的高速发展正是我国档案管理规范化的契机。目前,我国档案管理与我国现代化的发展不能协调。本文从分析现状入手,对我国档案管理的规范化提出了一些行之有效的措施和手段,希望能为我国档案管理的规范化提供一定的帮助。
关键词:档案管理;现状;对策;思考
参考文献:
档案管理技术范文第4篇
一、汉字识别技术的应用价值汉字识别技术的应用价值主要体现在两个方面:
一方面,把纸质档案上的固定信息变成可以被检索利用的活信息,为文本数据管理技术提供丰富的数据源。
首先,从库存档案的情况来看,近几十年来形成的大量印刷汉字档案记载了我们党和国家的重要历史,对我国现代化事业的发展,对精神文明和物质文明的建设都有着非常重要的利用价值。但这部分档案的内容都没有文本数据,或者说都只是固定在纸质载体上的死信息。既使通过扫描以图像方式存储于计算机中,检索利用也有不便之处,难于满足现代社会对档案信息的多种利用需求。其次,从办公自动化的发展情况来看,每年接收的档案中仍然会有相当数量的档案没有文本文件,或为外单位来文,或为丢失损坏等。汉字识别技术的应用价值就是使这两大部分纸质档案上的固定信息变成可以被检索利用的活信息,为全文检索提供数据,使深层次的开发利用成为可能,更好地为现代化建设事业服务。
另一方面,提供了一种新的档案目录数据的录入方式。
应用计算机以来,汉字录入只有一种方式,即健盘录入。虽然目前汉字键盘录入的方法有许多种,而且日趋简便快捷,已是年轻人必备的职业技能,但是它毕竟属于一种技能,不仅需要反应灵敏,手指灵活,而且要熟记录入的原则、方法和要领。这对于在档案部门占有相当比例的中老年同志来说,掌握起来确有难度。因此,键盘录入方式仍然是影响一些档案部门建立档案目录信息数据库的因素之一。OCR软件为我们提供了一条新的途径。它通过“拖拉”的方式,将屏幕上文件的目录项如标题、文号、责任者等直接移植到档案目录数据库的相应字段中去,简单易学,一看就会。遗憾的是手工“拖拉”速度较慢,而且需要即时扫描或调用图像数据,所以单一利用这种方式录入档案目录,速度不及熟练录入员的键入速度。但它毕竟是一种新的录入方式,为建立档案目录信息数据库提供了一条前所未有的途径。而且,如果利用OCR软件同时建立新型的综合档案信息数据库,例如包括档案的文件目录、图像和文本等,效果就此较理想了。
二、汉字识别后生成的文本数据的属性问题。
原始性是档案的基本属性。汉字识别后生成的文本数据是根据档案的本源信息,即固定在纸质载体上的汉字信息进行加工处理:扫描、识别、校对、修改等工序后形成的复制加工品,因此不具有档案的原始性。
知识性是档案的又一个属性。汉字识别后生成的文本数据如果不计算人工校对后仍然可能存在的微小误差,应该说具有与档案原件同等的内容,因此具有档案的知识性。
汉字识别后生成的文本数据是将档案的内容以特殊的物理方式重新记录在特殊的载体之上,比以文字的方式记录在纸质载体之上更具有便于传递、接收、存储、利用以及不磨损、不丢失等属性。因此具有更强的信息性。
汉字识别后生成的文本数据应该说,它是一种新型的档案一次信息的复制品或编研开发成果。但作为一种新型的复制品或编研开发成果,因其生成的目的不同,又具有两种不同的属性:当以提供利用为目的通过汉字识别建立文本数据库时,其文本数据具有类似于汇编类档案编研成果的属性;当以编辑出版纸质的档案编研材料如大事记、组织机构沿革、文件汇编等为目的进行汉字识别时,其文本数据不仅具有类似于档案编研成果的属性,而且具有档案原始性的基本属性,因为它们是印刷品或出版物的本源信息。
由此可见,汉字识别后生成的文本数据是一种不同于传统档案属性的新型档案信息。
三、汉字识别技术的应用方式
汉字识别技术在档案管理工作中的应用,根据其目前的技术水平主要适用于近几十年来印刷汉字档案内容的识别,图像、文本数据的形成、存储和目录数据的录入等项工作。主要的应用方式有:
(一)利用者阅读纸质档案的内容之后,对其所需要的内容进行扫描和汉字识别,或打印出统一格式的利用摘录,或直接提供文本拷贝。
这种利用方式的优点主要有:
1方便用户,可减少信息利用过程中的重复劳动;
2不给档案人员增加建库的工作负担;
3节省建库所需的经费开支。其缺点主要有:
1不能为全文检索提供数据,实现深层次开发档案信息资源的目的;
2存在对同一档案内容重复进行扫描和汉字识别的可能性。
(二)输入档案目录。这是加快档案目录信息数据库建设的一条新路,能够使更多的人员从事输入工作,但输入速度不甚理想,而且成本费用相对较高。
(三)扫描、保存图像并提供利用,只针对利用者需要的图像内容进行汉字识别等利用服务。
这种方式必须在已有文件目录的前提下使用。其优点主要有:1具有提供原件和提高信息利用效率的双重优势;2档案人员不承担汉字识别后生成的文本数据的维护工作。其缺点主要有:1同第一种利用方式的缺点。2汉字识别技术要求图像的光学分辨率较高,一般为3000dpi,而一般图像的分辨率仅为150dpi,因此所需的存储空间较大,约是一般图像的2、3倍,那么,所需的存储成本也要高得多。这种高代价的图像存储仅用来满足用户利用识别的需要似乎有点得不偿失。因此低分辨率的图像也能进行汉字识别,只是识别率相对较低而已。我们也曾做过对比实验,同一页印刷质量良好的B5纸型文件约500字,以300dpi进行扫描,识别率为100%;以150dpi进行扫描,识别率为99.4%(误识3字)。这对于一般用户而言无所谓的。
(四)建立文本数据库。这种方式也应在已有文件目录的条件下使用。其优点主要有:
1节省存储空间和存储成本。仍以一页B5型纸约500汉字的文件为例,以文本方式存储约需1000字节;以图像方式存储约需25000字节。因此,同量汉字的文本方式存储比图像方式存储成本低得多。
2为全文检索提供数据,能够实现深层次开发利用档案信息资源的目的。
其缺点主要有:
1建立文本数据库的工作量较大。
2不能满足用户阅读档案原件的需求。
3由于没有图像随时提供依据,不便于对文本数据的准确性进行核实。
(五)输入目录并保存图像。
(六)输入目录、建立文本数据库。
(七)保存图像、建立文本件数据。
(八)输入目录、保存图像并建立文本数据库。
这是充分发挥OCR软件功能,深层次开发利用档案信息资源的应用方式。但工程量较大,人力、资金需求较多,建库周期较长。
档案管理技术范文第5篇
一、汉字识别技术的应用价值汉字识别技术的应用价值主要体现在两个方面:
一方面,把纸质档案上的固定信息变成可以被检索利用的活信息,为文本数据管理技术提供丰富的数据源。
首先,从库存档案的情况来看,近几十年来形成的大量印刷汉字档案记载了我们党和国家的重要历史,对我国现代化事业的发展,对精神文明和物质文明的建设都有着非常重要的利用价值。但这部分档案的内容都没有文本数据,或者说都只是固定在纸质载体上的死信息。既使通过扫描以图像方式存储于计算机中,检索利用也有不便之处,难于满足现代社会对档案信息的多种利用需求。其次,从办公自动化的发展情况来看,每年接收的档案中仍然会有相当数量的档案没有文本文件,或为外单位来文,或为丢失损坏等。汉字识别技术的应用价值就是使这两大部分纸质档案上的固定信息变成可以被检索利用的活信息,为全文检索提供数据,使深层次的开发利用成为可能,更好地为现代化建设事业服务。
另一方面,提供了一种新的档案目录数据的录入方式。
应用计算机以来,汉字录入只有一种方式,即健盘录入。虽然目前汉字键盘录入的方法有许多种,而且日趋简便快捷,已是年轻人必备的职业技能,但是它毕竟属于一种技能,不仅需要反应灵敏,手指灵活,而且要熟记录入的原则、方法和要领。这对于在档案部门占有相当比例的中老年同志来说,掌握起来确有难度。因此,键盘录入方式仍然是影响一些档案部门建立档案目录信息数据库的因素之一。OCR软件为我们提供了一条新的途径。它通过“拖拉”的方式,将屏幕上文件的目录项如标题、文号、责任者等直接移植到档案目录数据库的相应字段中去,简单易学,一看就会。遗憾的是手工“拖拉”速度较慢,而且需要即时扫描或调用图像数据,所以单一利用这种方式录入档案目录,速度不及熟练录入员的键入速度。但它毕竟是一种新的录入方式,为建立档案目录信息数据库提供了一条前所未有的途径。而且,如果利用OCR软件同时建立新型的综合档案信息数据库,例如包括档案的文件目录、图像和文本等,效果就此较理想了。
二、汉字识别后生成的文本数据的属性问题。
原始性是档案的基本属性。汉字识别后生成的文本数据是根据档案的本源信息,即固定在纸质载体上的汉字信息进行加工处理:扫描、识别、校对、修改等工序后形成的复制加工品,因此不具有档案的原始性。
知识性是档案的又一个属性。汉字识别后生成的文本数据如果不计算人工校对后仍然可能存在的微小误差,应该说具有与档案原件同等的内容,因此具有档案的知识性。
汉字识别后生成的文本数据是将档案的内容以特殊的物理方式重新记录在特殊的载体之上,比以文字的方式记录在纸质载体之上更具有便于传递、接收、存储、利用以及不磨损、不丢失等属性。因此具有更强的信息性。
汉字识别后生成的文本数据应该说,它是一种新型的档案一次信息的复制品或编研开发成果。但作为一种新型的复制品或编研开发成果,因其生成的目的不同,又具有两种不同的属性:当以提供利用为目的通过汉字识别建立文本数据库时,其文本数据具有类似于汇编类档案编研成果的属性;当以编辑出版纸质的档案编研材料如大事记、组织机构沿革、文件汇编等为目的进行汉字识别时,其文本数据不仅具有类似于档案编研成果的属性,而且具有档案原始性的基本属性,因为它们是印刷品或出版物的本源信息。
由此可见,汉字识别后生成的文本数据是一种不同于传统档案属性的新型档案信息。
三、汉字识别技术的应用方式
汉字识别技术在档案管理工作中的应用,根据其目前的技术水平主要适用于近几十年来印刷汉字档案内容的识别,图像、文本数据的形成、存储和目录数据的录入等项工作。主要的应用方式有:
(一)利用者阅读纸质档案的内容之后,对其所需要的内容进行扫描和汉字识别,或打印出统一格式的利用摘录,或直接提供文本拷贝。
这种利用方式的优点主要有:
1方便用户,可减少信息利用过程中的重复劳动;
2不给档案人员增加建库的工作负担;
3节省建库所需的经费开支。其缺点主要有:
1不能为全文检索提供数据,实现深层次开发档案信息资源的目的;
2存在对同一档案内容重复进行扫描和汉字识别的可能性。
(二)输入档案目录。这是加快档案目录信息数据库建设的一条新路,能够使更多的人员从事输入工作,但输入速度不甚理想,而且成本费用相对较高。
(三)扫描、保存图像并提供利用,只针对利用者需要的图像内容进行汉字识别等利用服务。
这种方式必须在已有文件目录的前提下使用。其优点主要有:1具有提供原件和提高信息利用效率的双重优势;2档案人员不承担汉字识别后生成的文本数据的维护工作。其缺点主要有:1同第一种利用方式的缺点。2汉字识别技术要求图像的光学分辨率较高,一般为3000dpi,而一般图像的分辨率仅为150dpi,因此所需的存储空间较大,约是一般图像的2、3倍,那么,所需的存储成本也要高得多。这种高代价的图像存储仅用来满足用户利用识别的需要似乎有点得不偿失。因此低分辨率的图像也能进行汉字识别,只是识别率相对较低而已。我们也曾做过对比实验,同一页印刷质量良好的B5纸型文件约500字,以300dpi进行扫描,识别率为100%;以150dpi进行扫描,识别率为99.4%(误识3字)。这对于一般用户而言无所谓的。
(四)建立文本数据库。这种方式也应在已有文件目录的条件下使用。其优点主要有:
1节省存储空间和存储成本。仍以一页B5型纸约500汉字的文件为例,以文本方式存储约需1000字节;以图像方式存储约需25000字节。因此,同量汉字的文本方式存储比图像方式存储成本低得多。
2为全文检索提供数据,能够实现深层次开发利用档案信息资源的目的。
其缺点主要有:
1建立文本数据库的工作量较大。
2不能满足用户阅读档案原件的需求。
3由于没有图像随时提供依据,不便于对文本数据的准确性进行核实。
(五)输入目录并保存图像。
(六)输入目录、建立文本数据库。
(七)保存图像、建立文本件数据。
(八)输入目录、保存图像并建立文本数据库。
这是充分发挥OCR软件功能,深层次开发利用档案信息资源的应用方式。但工程量较大,人力、资金需求较多,建库周期较长。
免责声明:以上文章内容均来源于本站老师原创或网友上传,不代表本站观点,与本站立场无关,仅供学习和参考。本站不是任何杂志的官方网站,直投稿件和出版请联系出版社。