首页 > 文章中心 > 正文

论气象观测资料电子档案的安全性

论气象观测资料电子档案的安全性

电子档案信息的可修复性及信息逆处理技术的历史连贯性问题其实就是电子文件的可修复性及信息逆处理技术的历史连贯性问题,而这个问题跟电子文件的格式类型直接有关。不同格式类型的电子文件,当文件信息失真或损坏时其可修复的概率是不同的,文件信息的逆处理技术也是不同的。所以,电子档案信息的可修复性及信息逆处理技术的历史连贯性问题首先要解决的是如何选择合适的电子档案文件格式类型的问题。

电子文件格式类型和信息逆处理技术

电子文件格式类型电子文件的格式类型繁多,并有多种分类方法。根据文件中数据元的检索方式可分为顺序文件和非顺序文件;根据文件中数据元的控制方式可分为格式化文件和非格式化文件,而格式化文件又可根据数据元的集合控制方式分为数据库文件和非数据库文件。目前,信息存贮类文件主要有文本文件、纯文本文件、数据库文件、图形文件、音像文件、表格文件、图文混排文件等。上述除文本文件、纯文本文件、数据库文件以外的其他文件,均侧重于信息的特定表现目的而设计的,具有特定的结构信息,并需要特定的软件操作,标准化程度低,可以用于特殊档案信息的保存,如音像资料等,但不适合保存字符数据。文本文件与纯文本文件在字符数据的存贮方面具有相同的效果,但纯文本文件是不带格式控制信息的,具有更好的适应性。所以纯文本文件和数据库文件是组织和存贮数据的两种典型的文件类型,也是目前各级气象档案馆在组织和存贮地面气象观测资料中所采用的主要文件类型。所以下面对该两种文件类型的主要特点进行分析。

纯文本文件信息逆处理技术纯文本文件是非格式化的顺序文件,文件中的所有信息都以标准的ASCII码形式进行存贮,无任何控制信息和结构信息,只有数据元,而且数据元的格式是透明的,信息在文件中的逻辑结构也是透明的,并与显示、修改和打印的视觉形态保持一致,具有最好的“直读”特性,如果向某一物理载体中录入文件时,采取顺序录入方法,则信息存贮的逻辑结构与物理结构保持一致,使“直读”特性更加完备。该类文件的信息可使用任何字编辑软件直接显示、修改和打印,与任何计算机设备及操作系统相兼容,并可自编一个简单的软件直接读出文件信息,所以该类文件的信息逆处理技术的历史连贯性最稳定,几乎不受电子信息技术发展的影响。

数据库文件信息逆处理技术数据库文件是格式化的非顺序文件,文件内容由文件结构信息、控制信息和数据3部分组成,其中文件结构信息是对数据库框架结构的具体描述,控制信息包括各种属性定义、指针链表、定位表和连接信息等内容,数据库的数据元、结构信息和控制信息都是不透明的,数据库中的“记录”是用指针链的方法来定位的,所以数据库中“记录”的逻辑位置、物理位置和显示形态之间的关系也是不透明的。因此,数据库中的数据没有任何“直读”特性,数据的显示、修改和打印等操作完全依赖于数据库开发商所开发的专用软件产品,而这种软件产品经常发生过时、淘汰和升级等现象。所以数据库文件的信息逆处理技术的历史连贯性是不太稳定的,如果永久性档案的电子文件采用数据库文件,则随着软件的过时、淘汰或升级需要对电子档案文件进行格式转换,而每一次的格式转换都存在着一定的风险,因为所有件软产品的兼容性都不是绝对的。

电子文件受损坏的几种可能情况

电子文件的损坏情况可分为物理性损坏和逻辑性损坏两种情况。因存贮介质的物理特性改变或机械性损坏而造成信息不能准确识别的称为物理性损坏;因病毒攻击、人为操作失误或操作平台不兼容等而造成信息失真的称为逻辑性损坏。不管是物理性损坏或是逻辑性损坏,从存贮体的逻辑区域角度分析,其直接损坏的区域往往是局部性的,如果这种损坏发生在某一文件的数据区内,则造成该文件部分数据的丢失;如果发生在某一文件的控制信息区内,则造成该文件中与该控制信息相关联的全部数据的丢失;如果发生在某一文件的结构信息区内,则造成该文件全部数据的丢失;如果发生在存贮介质的文件系统控制信息区内,则将造成该存贮体全部或部分文件资料的丢失。

电子文件损坏时的可修复性情况分析

由于文件的直接损坏区域是局部性的,所以就存在修复的可能性,但可修复的概率和修复后的失真程度与损坏区域及文件格式类型有直接关系。下面以纯文本文件和数据库文件两种典型文件类型为例进行分析。

纯文本文件的可修复性由于纯文本文件中只包含数据元,没有结构信息和控制信息,所以损坏区域只能发生在文件的数据区内或存贮介质的文件系统控制信息区内这两种情况。下面对该两种情况分别进行分析:损坏发生在某一文件的数据区内时。这种情况如果是物理性损坏,则不管采用何种方法都不能直接修复被损坏的数据,除非使用备份数据进行修复,但未损坏部分的数据可全部修复;如果是逻辑性损坏,并且损坏了数据元,该种情况同物理性损坏一样;如果是逻辑性损坏,但没有损坏数据元,只增加了无效信息(病毒攻击往往是这种情况),则可全部修复。损坏发生在存贮介质的文件系统控制信息区内时。这种情况发生时文件中的数据并没有被损坏,只是文件定位信息被破坏,如果在一个存贮体内的所有文件都是以复制追加的方式进行保存,中间不进行删除、覆盖、编辑的操作,则所有文件的物理存贮区域都是按顺序进行的,如果文件的首行和尾行都带有标识内容(中国气象局制定的地面气象模式资料格式文件就属于该类型的文件),则所有文件都可修复,并且也很容易;否则修复难度较大,并且不能保证所有文件的修复。

数据库文件的可修复性由于数据库文件由文件结构信息、控制信息和数据3部分组织,所以按下列几种情况分别进行分析。(1)损坏发生在某一文件的数据区内时。这种情况下不管采用何种方法,都不能直接修复被损坏的数据,除非使用备份数据进行修复。(2)损坏发生在某一文件的控制信息区内时。这种情况下所有与其相关联的数据全都被损坏,无法修复,虽然数据库操作系统提供了修复功能,但其所修复的数据的正确性是不绝对保证的,并且也是不全面的。(3)损坏发生在某一文件的结构信息区内时。这种情况下整个数据库中的数据将全部丢失,并无法修复。(4)损坏发生在存贮介质的文件系统控制信息区内时。这种情况虽然同纯文本文件一样,文件中的数据并没有被损坏,但由于数据库文件结构和数据元都是不透明的,所以是不能修复的,除非整个存贮体内只保存一个文件,才有修复的可能性,但修复难度极大。

纯文本文件和数据库文件的可修复性比较当电子文件受到损坏时,纯文本文件比较容易修复,而且不易受计算机病毒的攻击,这是因为纯文本文件是非格式化的顺序文件,结构和数据都具有透明和可“直读”的特性;而数据库文件是非常不容易修复的,多数情况下是完全不能修复的,而且容易受计算机病毒的攻击,其安全性比纯文本文件要差得很多,其原因是因为数据库文件是格式化的非顺序文件,结构和数据都是不透明和不可“直读”的,信息组织结构非常复杂而严密,当其中某一处结构性信息遭损坏时将引起整个数据库文件的崩溃。根据数据修复服务机构经验统计,文本文件档案资料的可修复率约为85%,而数据库档案资料的可修复率约为65%。

电子档案文件类型对电子档案资料管理和服务效率的影响

数据库文件在设计上侧重于数据的管理与服务,有相应的商业软件支撑,并且有一定的标准化数据库应用接口,所以数据库资料的管理与服务最方便、快捷,档案利用率高。随着数据库标准化水平的不断改进和提高,数据库档案资料的管理、服务和开发利用能力将进一步提高。纯文本文件是非格式化的顺序文件,没有结构信息,信息检索困难,所以档案资料的管理、服务和开发利用能力比效差。

地面观测资料电子档案管理工作建议

通过上面的分析知道,纯文本文件的可修复概率较高,信息逆处理技术的历史连贯性更稳定,几乎不受电子信息技术发展的影响,但档案资料的管理、服务和开发利用能力比效差。而数据库文件的可修复性较差,信息逆处理技术的历史连贯性也不稳定,但档案资料的管理、服务和开发利用能力强。所以,从档案资料的存贮安全性与服务功能性方面考虑,建议如下。(1)采用不同文件格式建立相互备份档案资料。即同一档案资料同时采用纯文本文件和数据库文件分别保存,其中纯文本文件主要用于档案资料的修复,数据库文件主要用于档案资料的服务。同时开发相应的软件,用于纯文本文件资料与数据库文件资料的相互转存、校对、备份和修复。(2)为了使纯文本文件的可修复概率达到最大化,还需要注意以下几方面的问题:①数据格式问题。如果用纯文本文件来组织档案信息,则最好规定每一个文件的首行作为该文件的标识行,并保证能从该标识行的内容中可直观地判别出该文件的文件名和所存贮的数据属性;同时规定每一个文件的尾行作为数据结束的标识行。如,地面气象观测月资料文件(A0、A1、A文件)的首行中包含了资料所属测站的区站号、资料所属的年份和月份,并用6个“#”号组成的一行作为结束行。具有这种标识的文件,可以不依赖其文件名而准确地找到该文件的物理存贮区域,并能判别出它的文件名,从而最快地修复文件。②文件名的唯一性问题。在同一存贮体内所有文件的文件名要确保其唯一性,即不能在其他子目录中备份同一物理载体中的其他文件,防止在文件修复过程中造成文件名混乱。③物理位置的顺序性问题。一个存贮体在录入档案文件前先要清空,然后再录入档案文件,一旦录入了文件就尽可能不要对该存贮体内的文件进行删除、覆盖和编辑的操作,而只能追加文件,以尽量确保文件数据的逻辑形态与物理形态保持一致,使文件更容易修复。7

结语

纯文本文件的安全性高,但档案资料的管理、服务和开发利用能力比效差。而数据库文件的安全性相对差,但档案资料的管理、服务和开发利用能力比效强。所以,利用该两种文件的不同特点,通过建立纯文本文件和数据库文件相互备份机制,不仅可以最大程度地保证电子档案资料的安全性,而且可以保证档案资料的管理、服务及开发利用能力。

作者:封秀燕何志军吴书成单位:浙江省气象信息网络中心浙江省舟山市气象局