邮编:100000
联系电话:13949083182
查档咨询:13949083182
服务业务:13949083182
欢迎来到档案界!2024年11月22日
档案数字化加工
档案信息化建设的主要内容在档案信息化建设过程中,首先需要配置稳定、可靠、安全和较高性能的信息化硬件设施,以满足信息化环境下档案收集、管理、利用等基本需求。档案信息化基础设施建设包括计算机终端设备、数字化加工和存储设备、网络连接设备、服务器和网络布线等内容,下面档案信息化建设的主要内容介绍。
(一)数字化加工和存储设备
1.数字化加工设备
主要用于采集或转换数据,包括:扫描仪、音视频数字化采集和转换设备、数码相机、数码摄像机、非线性编辑设备等。
(1)扫描仪
市场上的扫描仪种类很多,应根据档案的特点、经费和技术性能指标(光学分辨率、扫描幅面、扫描速度等)加以选择。根据采取的扫描技术,可分为平板扫描仪、胶片扫描仪、滚筒式扫描仪等;根据扫描幅面和纸张情况,可分为A4/A3扫描仪、大幅面扫描仪、零边距扫描仪等;根据扫描速度和自动进纸能力,可分为高速扫描仪、一般扫描仪等。
(2)音频采集和数字化转换设备
常见的音频采集设备主要有录音笔等数字设备,其特点是便携、简单易用,但采集质量和降噪处理能力有限,如对音频采集质量等有较高要求,则应采用一些专业的音频采集设备。
音频数字化转换设备主要由放音设备、音频采集卡(声卡)、音频连接线、计算机处理设备等组成。其主要功能是将模拟声音信号转化为数字音频信号,包括采样、量化、编码等处理过程。通过系统设置,可以实现音频的批量化、自动化处理。
(3)视频数字化转换和编辑加工设备
视频数字化转换设备主要由放像设备、视频采集卡、视频数据线、计算机处理设备等组成,用于将模拟视频信号转换为数字视频信号,其处理过程同样包括采样、量化、编码等过程。视频档案的数字化转换比音频档案数字化过程要复杂,除了要采集和处理音频信号,还要同时处理视频信号。电视节目等视频采集可通过专门的视频采集卡进行实时接收和转换。数码摄像机的视频可直接通过1394等接口由软件采集和处理,但速度较慢、占用硬盘空间大;需要实时采集、压缩和专业视频编辑等功能的,可配备视频采集卡(或非线性编辑卡)。
2.存储设备
存储设备是档案信息化硬件设施建设的重点内容。根据设备存储方式,可分为在线存储设备、离线存储设备、近似在线存储设备三类,在线存储一般选用硬磁盘或高速磁盘阵列,离线存储一般选用磁带、光盘、移动硬盘等,近似在线存储是介于在线存储和离线存储之间的应用,如选用由廉价磁盘组成的磁盘阵列。
档案信息化建设的主要内容
(1)硬磁盘和磁盘阵列。硬磁盘即一般所称的硬盘,是利用电磁信号转化来记录和读出信息。按硬盘的接口类型,可分为ST506、IDE、SATA、SCSI、SAS、FC等,如常见的SATA硬盘及用于服务器的SAS硬盘等。随着技术发展,除了传统机械硬盘外,还出现了更高性能的固态硬盘等。硬盘是计算机系统中最常用的外存,其存储容量大、采取随机存取方式,存取速度快,数据传输率高、可靠性较高,适宜作为在线存储介质,但不适合离线存储。
磁盘阵列应用磁盘数据跨盘技术,通过组合多个磁盘并使其协同工作,扩大存储容量。它容量大、安全性好,可以提供在线并发访问,为许多大型存储系统所采用,是档案馆海量数据在线存储的主要设备。
(2)磁带和磁带库。磁带是最早出现的磁存储介质。磁带存储容量较大,成本低,可靠性较好,但以串行方式记录和读取数据,存取速度较慢,通常作为硬磁盘、磁盘阵列的大容量离线备份存储。常见的有盒式磁带(又叫1/4英寸磁带)、DAT磁带(又叫4mm磁带)、1/2英寸磁带(包括DLT磁带和IBM系列)、LTO磁带等。
磁带库技术支持磁带匣中多盘磁带的自动搜寻、存取,在对应软件系统的配合下,可实现数据的连续备份、智能恢复、统计等,存储容量可达数百TB甚至PB级。
(3)光盘和光盘塔(库)。光盘采用激光技术写入和读取信息,主要包括只读光盘、一次写入光盘和可擦写光盘。光盘成本低、制作简单、容量较大、体积较小,其中一次写入光盘是档案部门常用的离线存储载体。
光盘塔由几台或几十台光盘驱动器并联组成,可并发支持多个用户同时访问数据。光盘库是带有机械手和一个光盘驱动器的光盘柜,可对机柜中的指定光盘进行读写和更换位置操作,其容量极大,可同时存放几十或几百张光盘,适合海量多媒体数据的离线存储。
其他存储技术。随着对更高存取效率、存储可靠性和更低存储成本的追求,海量存储、集群存储、存储虚拟化和分布式存储等存储构架技术有了很大进展。在传统直接附加存储(DAS)的基础上,近年来出现了以网络协议或光纤技术相连的网络存储构架,如在数字档案馆存储构架设计中普遍采用的网络附加存储(NAS)和存储区域网络(SAN),以及虚拟磁带库、云存储等存储虚拟化技术。存储虚拟化技术大大提高了存储设备的整体利用率,同时降低了管理成本,较好解决了海量档案数据的存储和共享问题,随着电子政务云平台建设的推进,在数字档案馆建设中逐步得到应用。
(二)网络环境的构建
根据国家电子政务基本构架,档案网络环境建设可以分为三个层次:档案部门内部网、与政府部门连接的政务网、与互联网连接的公众网,并实行三网物理隔离,构成三个相互独立的网络。这三个网络在构建要求、连接设备、网络布线等方面基本类似。下面简要介绍构建档案网络环境所涉及的相关概念和技术。
1.计算机网络概述
计算机网络是地理上分散的多台独立的计算机通过软硬件设备互连,以实现资源共享和信息交换的系统。用户通过网络访问数据和使用程序时,感觉不到地理上的距离,就像使用本地的数据和程序一样。计算机网络一般根据连接距离和规模,可分为局域网(LAN)、广域网(WAN)和互联网(Internet)。局域网是指在某一区域内由多台计算机互联成的计算机组,一般限于一个单位、公司、学校或建筑物内部,覆盖范围比较小。广域网是一种跨越大地域(省、市或国家)的网络,由端点计算机和通信子网构成。互联网是通过广域网把无数分散在各地的局域网利用TCP/IP协议互相连接起来的网络,也称网际网、因特网。近年来,随着宽带上网需求的不断增长和网络连接技术的发展,又出现了城域网(MAN)、无线局域网(WLAN)、虚拟专用网络(VPN),以及物物相连的互联网——物联网(IOT)等。
档案网络环境建设主要是构建三个网络,即局域网、政务专网、互联网。局域网即单位内部办公业务网,是相对独立的网络,一般不与外部网络连通,并与其他网络物理隔绝;政务专网即政府办公业务资源网络,连通并支持各机关部门的办公和决策服务;互联网即因特网,直接面向公众提供相关信息服务,如面向社会公众的档案网站等。有些地区还统一建设政府门户网站(称为政务外网),并面向社会公众提供综合政务信息服务和各机关部门(包括档案部门)的外网链接入口。
2.网络连接设备
常用的网络设备有网卡、中继器、网桥、路由器、网关、调制解调器等。
(1)网卡。又称网络接口卡(NIC)、网络适配器,是计算机与网络相连的硬件设备,一般插在主板扩展槽或集成在主板中,通过网线或无线方式与网络相连。随着存储网络技术发展,有时将用于连接服务器和存储交换设备的适配器(HBA)也称为网卡,如光纤网卡、iSCSI网卡等。
(2)中继器(又称转发器)。中继器是连接网络线路的一种装置,常用于两个网络节点之间物理信号的双向转发工作。它主要完成物理层功能,负责在两个节点的物理层上按位传递信息,完成信号的复制、调整和放大功能,以此延伸网络长度。
(3)集线器。集线器(HUB)是对网络进行集中管理的重要工具,可看成是具有多个端口的特殊中继器。它作为网络传输介质间的中央节点,当网络系统中某条线路或某节点出现故障时,不会影响网络其他节点。根据输入信号处理方式的不同,可分为无源HUB、有源HUB、智能HUB。
(4)网桥(桥接器)。顾名思义,它是网络之间的桥梁,多端口的网桥又称为交换机。
网桥工作在网络体系结构的数据链路层,包含了中继器的功能和特性,不仅可以连接多种介质,还能连接不同的网络分支,如以太网和令牌网,使数据包在更大范围内传送。网桥的典型应用是将局域网分段成子网,从而降低数据传输的瓶颈,这样的网桥叫“本地”桥。用于广域网上的网桥叫做“远地”桥。
(5)路由器。所谓路由就是通过相互连接的网络把信息从源地点移动到目标地点的活动。路由器是网络连接的主要节点设备,工作在网络体系结构中的网络层,它可以在多个网络上交换和路由数据包。比起网桥,路由器不但能过滤和分隔网络信息流、连接网络分支,还能访问数据包中更多的信息,并且用来提高数据包的传输效率。路由器主要用于广域网,或广域网与局域网的互连。
(6)桥由器。是综合桥接器和路由器技术的设备,它既能够桥接多项协议,实现数据链路层的信息交换,又能够为其中的一部分协议提供路由选择功能,实现网络层的信息传递功能。
(7)网关。又称网间连接器、协议转换器,是网络层以上的各类互联设备的总称,是最复杂的网络互连设备。网关一般运行在应用层,可支持不同的协议之间的转换,实现不同协议网络之间的通信。网关可分为传输网关和应用网关。网关能互连异类的网络,既可以用于广域网互连,也可以用于局域网互连,还可以提供过滤和安全功能,其典型应用是安装在网络专用服务器上。
(8)其他网络设备。包括调制解调器、多路复用器和防火墙设备等。调制解调器是一种信号转换装置,用于将计算机通过电话(或有线电视)线路连接上网,并实现数字信号和模拟信号之间的转换,如常见的ADSL猫、光纤猫等。多路复用器用于将多个分离的信号组合在一个传输媒介段上,产生多重信道,从而允许多个不同的设备在单一的传输媒介上同时进行通讯。防火墙设备是位于内部与外部网络之间的网络安全设备,用于保护内部网络免受非法用户侵入,最初从路由器发展而来,一般带路由功能。
下面是典型的某单位办公网络拓扑图(如接入用户较多,可将交换机扩展为核心交换机和多台接入交换机):
3.服务器与客户机
服务器概念有两种理解,一种是指能提供某些专门服务(如Web浏览、电子邮件服务)的程序,如把计算机上安装的Apache软件称为“Web服务器”;另一种是指提供某些专门服务的高性能计算机。本书采用后一种概念,即服务器是指在网络环境中为客户机提供各种服务的、特殊的专用计算机。在网络中,服务器承担着数据的存储、转发、发布等数据服务关键业务,是各类基于客户机/服务器(C/S)和浏览器/服务器(B/S)等模式的网络中不可或缺的重要硬件设备。服务器的高性能主要体现在高速度的运算能力、长时间的可靠运行、强大的外部数据吞吐能力等方面。按服务器的体系构架,可分为非X86服务器(包括大型机、小型机和UNIX服务器)和X86服务器(如常见的入门级PC服务器);按服务器的外形,可分为机架式、刀片和塔式服务器;按服务器的应用层次,可分为入门级、工作组级、部门级和企业级服务器。常见用途的服务器有以下几种:
(1)Web服务器。是指能提供网上信息浏览服务的网络服务器。当客户端的Web浏览器访问Web服务器时,服务器能处理该请求并将文件发送到客户端的浏览器上,并告诉浏览器如何查看该文件。Web服务器可采用各种类型的计算机,从常见的PC服务器到UNIX服务器,以及其他各种类型的计算机,它们通常以一条高速线路与因特网连接,并需要在服务器上安装相关Web服务器程序(如Apache、Tomcat等)。
(2)电子邮件服务器。指能对外提供电子邮件(E-mail)服务的网络服务器。与Web服务器一样,电子邮件服务器可采用各种计算机,并需要在服务器上安装相关电子邮件服务器程序。
(3)数据库服务器。是指安装了数据库管理系统软件,并能够为用户提供查询、更新、事务管理等数据库服务的专门服务器。现在大部分数据库管理系统一般基于C/S构架,并支持数据的分布式存储,因此数据库服务器由多台计算机服务器组成。为了能保障大量用户的并发访问和海量数据存储,档案数据库服务器一般对服务器的性能、网络连接速度、存储器容量、安全性和稳定性等方面有较高要求。
(4)应用服务器。应用服务器一般介于客户端和数据库服务器之间,一方面向客户端提供多种业务服务,另一方面又根据应用需求访问数据库服务器。应用服务器对计算性能和网络传输速度等有较高要求,服务程序一般基于三层或以上构架进行设计(如基于浏览器访问的三层B/S构架),由应用服务器程序和提供特定功能的中间件程序组成,可同时部署在一台或多台计算机服务器上。采用应用服务器避免了传统C/S构架的一些弊端,可提高系统整体性能和安全性,在数字档案馆建设中得到了较好应用。
其他还有专门提供文件存储和传输、对象数据存储和服务等功能的计算机服务器,其原理基本类同,这里不再一一介绍。
客户机又称用户工作站,是用户与网络、服务器打交道的终端计算机,通常指个人计算机(PC),由CPU、主板、内存、硬盘、显卡及输入输出设备等组成,其典型应用是多台客户机通过网络访问某数据库服务器或应用服务器。
4.机房建设及网络布线
建设功能先进、运行可靠的计算机机房,是保障档案信息化建设的基本设施。在档案馆设计建造时,应将机房纳入统一规划与建设,机房设计与施工应符合《电子信息系统机房设计规范》(GB50174—2008)要求。档案机房可分为主机房、监控操作区两大部分,主机房用于置放服务器、存储设备、网络设备、UPS主机、空调、消防监控等设备,并为这些设备提供自动运行环境,监控操作区是为技术人员监控、操作及管理主机房设备的场所。主机房布局应按信息系统功能及网络平台划分区域,各网络平台及区域配置相对独立,各区域的服务器群、存储群、网络交换与配线等部署摆放相对集中。机房设计应确保强电负载均衡、网络集线交换、温度、湿度、电磁场强度、防水、防火、防盗、防震、楼板承重、防静电能力、防雷接地、监控、降噪音等各项指标均能满足设计要求。机房不能用作办公或数字化加工场地,脱机载体存储库房应与机房分开设置。
网络布线是构建网络系统、建设智能化档案馆建筑的物理基础,是档案信息化基础建设的重要内容。目前大多数智能化建筑采用的是综合布线系统(PDS),它是一种模块化的、灵活性极高的建筑物内或建筑群之间的信息传输通道,通过它可使话音设备、数据设备、交换设备及各种控制设备与信息管理系统连接起来,并与外部通信网络相连。综合布线系统包括与外部网络相连的所有线缆,以及相关连接部件,包括传输介质、各类连接硬件、电气保护设备等。综合布线系统具有开放性、标准性、可扩展性、易维护性、经济性和安全性等特点,可满足建筑物内所有计算机系统、自动化控制设备和通信系统的配线需求,一般由以下6个独立子系统组成:
(1)工作区子系统。由终端设备连接到信息插座之间的设备组成,包括信息插座、插座盒(或面板)、连接线、适配器等。
(2)水平子系统。用于将干线子系统线路延伸到用户工作区。水平系统是布置在同一楼层上的,一端接在工作区信息插座上,另一端接在楼层配线间的跳线架上。它能支持大多数现代通信设备,在某些要求宽带传输时,可采用光纤连接方案。当水平区面积相当大时,在这个区间内可能有一个或多个卫星接线间,水平线除了要端接到设备间之外,还要通过卫星接线间,把终端接到信息出口处。在安全性、传输速率要求不高,覆盖区域不大的应用场合,为了降低成本和提高灵活性,可考虑无线接入方案。
(3)管理子系统。也称管理间子系统,是水平子系统与干线子系统间的桥梁,同时又可为同层组网提供条件。包括双绞线跳线架、跳线,在需要有光纤的布线系统中,还有光纤跳线架和光纤跳线。当终端设备位置或局域网的结构变化时,只要改变跳线方式即可解决,而不需要重新布线。
(4)干线子系统。通常由主设备间(如计算机房、程控交换机房)连接至各楼层管理间。它采用大对数的电缆或光缆,两端分别接在设备间和管理间的跳线架上。
(5)设备间子系统。由设备间的电缆、连续跳线架及相关支撑硬件、防雷电保护装置等构成。比较理想的设置是把计算机房、交换机房等设备间设计在同一楼层中,这样既便于管理、又节省投资。当然也可根据建筑物的具体情况设计多个设备间。
(6)建筑群子系统。是将多个建筑物的数据通信信号连接一体的布线系统。采用可架空安装或沿地下电缆管道(或直埋)敷设铜缆和光缆,以及防止电缆浪涌电压进入建筑的电气保护装置。
档案信息化建设主要包括:基础设施建设、档案信息资源建设、应用系统建设、标准规范建设和人才队伍建设等五个方面的内容。
1、基础设施建设。主要指档案信息网络系统和档案数字化设备。它是档案信息传输、交换和资源共享的基础条件,只有建设先进的档案信息网络,才能充分发挥档案信息化的整体效益。
2、档案信息资源建设。档案信息资源建设是档案信息化建设的基础和核心,是一项长期的工作。档案信息是国民经济和社会发展的战略资源之一,它的开发和利用是档案信息化建设取得成败的关键,也是衡量档案信息化水平的一个重要标志。档案信息资源建设主要内容包括馆藏档案的数字化和电子文件的采集和接收。档案信息资源建设主要形式包括馆藏档案目录中心数据库建设、各种数字化档案全文及专门数据库建设。
3、应用系统建设。应用系统建设主要内容包括档案信息的收集、档案信息的管理、档案信息的利用、档案信息的安全等方面,它关系到档案信息化建设的速度与质量、集中体现了档案信息化建设的效益和档案信息服务的效果。
4、标准规范建设。是对电子文件的形成、归档和电子档案信息资源标识、描述、存储、查询、交换、网上传输和管理等方面,制定标准、规范,并指导实施的过程。档案信息化的标准、规范相当于信息高速公路上的“交通规则”,对于确保计算机管理的档案信息和网络运行的安全、畅通,具有十分重大的意义。
5、人才队伍建设。档案信息化建设,人才是关键。人才是最宝贵的资源。它不仅需要档案专业人才,计算机专业人才,更需要既懂档案业务,又熟悉信息技术的复合型人才。