邮编:100000
联系电话:13949083182
查档咨询:13949083182
服务业务:13949083182
欢迎来到档案界!2024年11月22日
档案数字化加工
档案数字化人员需要熟悉档案工作的全流程,学习相关档案规范文件,工作中遇到问题及时思考总结,都是对自己有很好的提升,档案数字化工作包含档案的种类区分,档案数字化加工所要用到的设备软件,拿到档案,提前学习如何进行数字化扫描,以及在扫描过程中可能会出现的情况,例如漏扫需要插扫,扫错需要提扫等,还有数字化处理这一阶段,对于图像的清晰度,最大可能保证完整的档案内容,可以清楚的展示,当然,除此之外,也会有其他相关的,需要去了解,需要学习,都会随着日积月累,不断掌握这些知识。总而言之,档案数字化人员也是档案项目中重要的角色。
档案数字化人员
图片1范围
本标准规定了干部人事档案数字化人员建库、目录建库、档案扫描、图像处理、数据存储、数据验收、数据交换、数据备份、安全管理的技术要求。
本标准适用于各级党政机关、国有企事业单位的干部人事档案数字化工作。
规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 2261.1个人基本信息分类与代码第1部分:人的性别代码
GB/T 3304中国各民族名称的罗马字母拼写法和代码
GB/T 7408数据元和交换格式信息交换日期和时间表示法
GB 11643公民身份号码
GB/T 18788平板式扫描仪通用规范
SJ/T 11292计算机用液晶显示器通用规范
全国公务员管理信息系统信息釆集、报送标准组通字[2012]31号
术语和定义
下列术语和定义适用于本文件。
3.1
干部人事档案数字化digitalization of cadre personnel archives
釆用扫描仪等设备对干部人事档案进行数字化加工,将其转化为可存储在磁盘、光盘等存储介质上,并能被计算机识别,数字方式可信、可取和可用的数字图像或数字文本的处理过程。
3.2
档案信息archival information
干部人事档案中的文字、表格、照片、图章等有效信息。
3.3
数字档案管理信息系统information system for digitalized archives management
具有信息录入、档案扫描、图像处理、提供利用、存储备份、导入导出等功能的信息系统。
3.4
原始图像数据the original image data
纸质档案通过扫描等方式形成数字图像后,再经过纠偏、裁边等处理后的图像数据。
3.5
优化图像数据optimized image data
与原始图像数据一致.经优化处理达到无噪点干扰、字符灰度平均值≤125.0.模糊度≤200.0μm的图像数据。
3.6
图像数据压缩image data compression
清除图像数据冗余的一种过程。
3.7
背景区域background area
衬托档案信息的区域。
3.8
图像背景颜色background color
背景区域所呈现的颜色。
3.9
背景无关标记background extraneous mark
背景区域中与档案信息无关的噪点。
3.10
灰度gray scale
图像每个像素点的颜色深度。
3.11
字符灰度character gray scale
优化图像数据档案信息区域中像素点的灰度,灰度值的范围为0〜255,对应图像中的颜色为从黑到白。
注:字符灰度评价指标见附录A。
3.12
模糊度blurriness
图像中线条(或字符笔画)边缘内边界和外边界的平均距离值。
注:模糊度评价指标见附录A。
3.13
持续数据保护continuous data protection
一种在不影响主要数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法。
基本要求
4.1基本原则
4.1.1真实性
应确保干部人事档案数字化后的内容与纸质档案在内容上一致。确保档案数字化过程中档案信息不被更改。原始图像应保留原纸张颜色、污损情况和文字修改痕迹等原始信息。
4.1.2完整性
应确保数字化前后纸质档案一致,档案数字图像数量与纸质档案数量相符。
4.1.3可用性
应确保数字档案可被查找、检索、呈现等,满足相关业务的要求。确保数字档案的连续性,维护其可跟踪、可回溯、可关联、可被发现和可被再用,数据链不出现断裂。
4.1.4安全性
应建立身份认证体系、加密存储体系及数据流传输方式等安全保密管理机制,确保档案信息的安全。干部人事档案数字化过程应完整记录.可查询、可追溯。档案图像数据应得到有效保护,不被非法利用、更改或销毁。档案原件不受损毁。
4.2数字化对象的确定
数字化对象应是符合干部人事档案审核、整理等有关规定要求的合格档案。
4.3基本环节
干部人事档案数字化基本环节包括:人员建库、目录建库、档案扫描、图像处理、数据存储、数据验收、数据交换、数据备份。其中,图像处理环节包括原始图像处理和优化图像处理,优化图像处理为可选处理环节。
人员建库
5.1人员基本信息集
人员基本信息集的编码为:A01。用于描述某人自然属性和社会属性中最基本的信息。编码引自组通字[2O12]31号文件。
该信息集为单记录信息,每一记录对应一个人。至少由6个信息项(见表1)组成,其他信息项可根据实际情况增加。该信息集内容可单独建立,也可从其他系统中获取。
5.2人员信息录入
人员基本信息录入内容包括:
a)“姓名”,填写户籍登记所用的姓名;
b)“性别”,填写GB/T 2261.1中的性别代码;
c)“民族”,填写GB/T 3304中的民族代码;
d)"出生日期”,按照GB/T 7408要求的格式填写出生年月;
e)“公民身份号码”,填写公安机关为公民编制的符合GB 11643要求的身份代码。
目录建库
6.1干部人事档案目录信息集
干部人事档案目录信息集的编码为:RSDAML。用于描述档案目录的信息,由10个信息项(见表2)组成。该信息集为多记录信息集,每一记录记述该档案目录涉及档案材料的信息。
图片
6.2目录录入
应根据统一的干部人事档案目录格式进行档案目录录入,包括:
a)“类号",填写材料类号;
b)“序号”,填写材料所属分类中的序号;
c)“材料名称”,根据材料题目填写,无题目的材料,应拟定题目;
d)“材料形成时间”,一般采用材料落款标明的最后时间,复制的档案材料,采用原材料形成时间;
e)“页数”,填写每份材料的页码数;
f)“备注”,填写需要说明的情况。
档案扫描
7.1扫描仪校准
扫描仪应符合GB/T 18788的规定,亮度和对比度为中值,无偏移。
7.2扫描方式
应根据纸质档案材料的具体情况,釆用合理的扫描方式进行扫描。扫描方式包括(但不限于):
a)大幅面档案宜釆用大幅面扫描仪扫描,也可采用小幅面扫描后的图像拼接方式处理;
b)纸张状况较差、容易损坏的档案,应釆用平板扫描方式;
c)对于纸张较薄的档案,若扫描时发生背页字迹透印而影响图像阅读的现象,应在背页后垫白色衬底扫描。
7.3扫描色彩模式
应釆用真彩色24位RGB模式扫描。
7.4扫描分辨率
应釆用300 dpi分辨率扫描。
图像处理
8.1原始图像处理
8.1.1纠偏处理
对偏斜度大于1°的图像应进行纠偏处理,纠偏后距离显示器25 cm〜40 cm观看图像应没有明显偏斜。对方向不正确的图像应旋转还原。
8.1.2裁边处理
纠偏后的图像应进行裁边处理,去除扫描过程中产生的白边或黑边。
8.1.3图像拼接
对大幅面干部人事档案材料进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个原始图像,确保档案数字图像的完整性和真实性。
8.2优化图像处理
8.2.1优化图像处理方式
应使用计算机软件或人工方式对原始图像数据进行处理,得到优化图像数据。
原始图像中带有黑白、彩色照片的,应采用人工方式处理,以使优化图像中的照片得到更佳的视觉效果或与原始图像的视觉效果相符。
原始图像中带有印章的图像区域应采用人工方式处理。
带有身份证、学历证件、复印件及带有防伪技术的原始图像,或内容不清晰的红色或紫色背景的早期麻纸基材等,优化处理后仍不具有较好辨识效果的,应直接引用原始图像数据。
8.2.2优化图像质量要求
观看优化图像使用的显示器应符合SJ/T 11292的要求,并调整到sRGB状态。在保证档案信息完整的前提下应满足以下指标:
a)图像背景颜色为24位真彩色,且RGB值为(254,246,197);
b)4X4 pixels(对应300 dpi分辨率的情况约为328μmX328μm)范围以下的背景无关标记为0个,4X4 pixels到8X8 pixels(对应300 dpi分辨率的情况约为656μmX656μm)范围内的背景无关标记以不影响档案信息阅读为准,8X8 pixels范围以上的背景无关标记为0个;
注:大于8X8 pixels范围是能够分辨出该区域是否为有效信息,小于4X4 pixels范围发现有信息则认定为无效信息,4X4 pixels到8X8 pixels之间范围内是无法分辨信息是否为有效信息,如标点符号或污点等。
c)字符灰度平均值≤125.0;
d)模糊度≤200.0μm。
数据存储
9.1图像存储格式
图像数据应釆用JPEG格式存储。原始图像数据存储时,应进行图像数据压缩,压缩率≥80%。优化图像数据不进行压缩。
原始图像数据和优化图像数据应分不同文件夹保存。
9.2图像文件存储路径
干部人事档案图像文件在存储介质上的实际存储路径。
原始图像文件存储路径:系统指定路径人员唯一标识〈原始图像数据〉
优化图像文件存储路径:系统指定路径人员唯一标识〈优化图像数据〉
9.3数据存储索引信息集
数据存储索引信息集的编码为:RSDAWJ。用于描述某页干部人事档案材料图像文件存储的最基本信息,由4个信息项(见表3)组成。该信息集为多记录信息集,每一记录记述该档案目录涉及档案材料图像文件的存储信息。
数据验收
10.1验收范围
应对全部数字档案成品进行质量验收。
10.2验收标准
10.2.1人员建库验收标准
人员建库时录人项目应符合5.1所列人员基本信息集数据格式要求;与其他信息系统共享人员信息的,所引用的姓名、性别、民族、出生日期、公民身份号码等信息项也应符合人员建库要求。
10.2.2目录建库验收标准
目录建库时录入项目应符合6.1所列干部人事档案目录信息集数据格式要求,类号、序号、材料名称、材料形成时间、页数、备注等录入内容项应规范、准确,档案目录应与纸质档案材料名称内容相符,档案目录条数应与纸质档案材料数量相符。
10.2.3原始图像数据验收标准
原始图像应为真彩色24位、JPEG格式、300 dpi。无扫描产生的白边和黑边;偏斜度≤l°,方向正确;图像页码连续;图像中档案信息与纸质档案一致,图像数量与纸质档案一致,图像的排列顺序与纸质档案一致,图像与目录一一对应。
10.2.4优化图像数据验收标准
优化图像应符合8.2.2的要求,与原始图像尺寸一致。
10.3验收登记
应根据验收标准填写相应的验收登记表(样式见附录C),对数字档案作出合格或不合格的结论。
图片11数据交换
11.1数据交换内容
数据交换的内容应包括:
a)人员基本信息及目录信息的描述性文件,以XML格式文件保存,符合5.1、6.1的要求,其中,人员基本信息只交换表1内的5个信息项;
b)干部人事档案数字化形成的图像数据,存放在指定的文件夹内。
11.2数据交换格式
11.2.1 XML文件格式描述
XML根节点为〈数字档案〉。整个XML文件包括人员基本信息及目录信息,分别用〈人员基本信息〉、〈目录信息〉进行标记。人员基本信息中的内容分别用〈姓名〉、〈性别〉、〈民族〉、〈出生日期〉、〈公民身份号码〉进行标记。目录信息中的内容分别用〈类号〉、〈序号〉、〈材料名称〉、〈材料形成时间〉、〈页数〉、〈备注〉、〈原始图像数据〉(即图像文件名称)、〈优化图像数据〉(即图像文件名称)进行标记。XML文件的定义描述见附录D。
11.2.2文件夹及文件命名规范
每个人的干部人事档案图像数据应放在一个文件夹内,该文件夹应以姓名+公民身份号码命名(如李**11010219830606****)。根目录下保存的是一个以姓名+公民身份号码命名的XML文件和一个文件名为“图像数据”的文件夹,前者描述人员基本信息及目录信息,后者存放原始图像数据和优化图像数据。
图像文件名称的命名规则为:干部人事档案材料类号代码+“一”+分类内序号+“一”+三位流水号+后缀名,如1-1-001.jpg(在不同的操作系统中,图像文件扩展名或显示为.jpeg)。类号代码见附录B,目录结构图如图1所示。
数据备份
12.1备份范围
经验收合格的人员基本信息、干部人事档案目录信息、原始图像数据、优化图像数据应及时进行备份。
12.2备份方式
应釆用在线、离线相结合的方式实现备份。在线备份可釆用持续数据保护技术,保障数据备份的持续性。离线备份时,每个人的数字档案应形成一个数据包,数据包应采用硬盘、光盘等不同载体备份,宜异地备份。
12.3备份标签
离线备份后应在相应的备份介质上做好标签,以便查找和管理。
安全管理
13.1密级
13.1.1数字档案的密级和相应纸质档案的密级相同。
13.1.2数字档案管理信息系统(以下简称“管理系统”)和承载管理系统的网络的密级应不低于其所承载的数字档案的密级。
13.2环境安全
13.2.1数字化加工场所应设在独立、可封闭的建筑内,应符合防盗、防火、防尘、防水、防潮、防高温、防日光及紫外线照射、防有害生物、防污染等安全管理要求。
13.2.2应配备满足安全管理需要的视频监控设备,配备符合国家标准并满足工作需要的档案装具。
13.2.3应配备数字化工作人员存放随身物品的专用储物箱柜,并与档案装具分区放置。
13.3设备安全
13.3.1干部人事档案数字化加工设备(计算机、打印机、复印机、扫描仪等)的使用、管理、维修、报废等应符合涉密信息设备使用保密管理的有关规定。
13.3.2与干部人事档案数字化加工相关的计算机、打印机、复印机、扫描仪等设备不得连接互联网及其他公共信息网络。
13.4身份鉴别
13.4.1应建立以数字证书为核心的身份认证系统,按照密级选择安全保密方式实现用户身份鉴别。
13.4.2管理系统应提供专用的登录控制模块对登录用户进行身份标识和鉴别,标识范围应涵盖管理系统的所有用户。
13.4.3管理系统不得设置匿名账户。
13.4.4管理系统应具备用户身份标识和鉴别信息复杂度检查功能,确保管理系统中不存在重复身份标识、身份鉴别信息不被冒用。
13.4.5单个管理系统客户端在同一时间仅允许单个用户登录,用户在同一时间仅允许登录单个管理系统客户端。
13.5访问控制
13.5.1管理系统应具备涉密信息和重要信息的访问控制功能。
13.5.2涉密信息和重要信息的访问控制,主体应控制到单个用户,客体应控制到单个页面。
13.6安全审计
13.6.1干部人事档案数字化应进行全过程日志记录,修改和删除的图像数据应一并存入日志记录。
13.6.2日志记录的内容应包括事件发生时间、发起者信息、类型、描述和结果等。
13.6.3管理系统应具备安全事件审计功能,审计范围应覆盖所有用户。
13.6.4审计事件的类型应包括系统事件、业务事件、成功事件、失败事件等。
13.6.5管理系统应不具备单独中断审计进程功能,不能非授权删除、修改或覆盖日志记录。
13.6.6管理系统应具备对日志数据进行自动或手动备份功能。
13.7权限划分
13.7.1管理系统应设置系统管理员,系统管理员仅负责系统级的管理,不具备任何用户业务操作的权限。
13.7.2管理系统应设置安全保密管理员,负责管理系统的日常安全保密管理工作,包括对用户账号权限管理、安全保密设备管理和管理系统所产生日志的审査分析,不具备任何用户业务操作的权限。
13.7.3管理系统应设置安全审计员,负责对系统管理员、安全保密管理员的操作行为进行审计跟踪分析和监督检查,不具备任何用户业务操作的权限。
13.7.4系统管理员、安全保密管理员、安全审计员应相互独立、相互制约,实行“三员分离”。
13.8数据保护
13.8.1管理系统应釆用加密技术确保存储和传输过程中数据的完整性。
13.8.2数据在网络传输和存储中应采取相应的密码保护措施,确保数据传输和存储的安全。
13.8.3管理系统应具备涉密信息完整性检测功能,能发现信息被篡改、伪造、删除等情况,并产生审计日志。
13.9资质选择
13.9.1采用外包方式开展干部人事档案数字化工作的,涉密系统集成、系统咨询、软件开发、安防监控、运行维护、数据恢复等业务应选择具有涉密信息系统集成资质的单位,涉密档案数字化加工等业务应选择具有国家秘密载体印制资质的单位。
13.9.2管理系统使用之前应委托有资质的第三方信息安全测评机构开展风险评估和检测。