CN108984670A - 一种跨平台电子档案批量挂接的方法 - Google Patents

一种跨平台电子档案批量挂接的方法 Download PDF

Info

Publication number
CN108984670A
CN108984670A CN201810699563.2A CN201810699563A CN108984670A CN 108984670 A CN108984670 A CN 108984670A CN 201810699563 A CN201810699563 A CN 201810699563A CN 108984670 A CN108984670 A CN 108984670A
Authority
CN
China
Prior art keywords
data
text
file
specifically
electronic record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810699563.2A
Other languages
English (en)
Inventor
卢云峰
张少月
陈展鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Zhong Bo Ao Information Technology Co Ltd
Original Assignee
Zhengzhou Zhong Bo Ao Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Zhong Bo Ao Information Technology Co Ltd filed Critical Zhengzhou Zhong Bo Ao Information Technology Co Ltd
Priority to CN201810699563.2A priority Critical patent/CN108984670A/zh
Publication of CN108984670A publication Critical patent/CN108984670A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种跨平台电子档案批量挂接的方法,所述方法包括以下步骤:S1:数据著录;S2:数字化采集;S3:双机校对;S4:数据录入;S5:格式转换;S6:数据检查;S7:目录关联;其中步骤S4具体分为零散数据录入、成档数据导入、扫描文本OCR识别三种;本发明通过在传统的挂接方法上加入数字化采集、数据检查的步骤,对导入过程进行模拟,对导入后数据进行检查,解决了现有的电子档案由于挂接的方式不当,存在数据导入错误和数据缺失的问题,保证了导入的数据的完整性和规范性。

Description

一种跨平台电子档案批量挂接的方法
技术领域
本发明涉及电子档案挂接领域,尤其涉及一种跨平台电子档案批量挂接的方法。
背景技术
电子档案,是指通过计算机磁盘等设备进行存储,与纸质档案相对应,相互关联的通用电子图像文件集合,通常以案卷为单位,用来区别于一些客观存在的档案实体,是将实体档案信息以字节、比特方式表示并使之在电脑网络上流动,只有引入正确的软件,硬件与足够的背景细节,这些字节与比特方可随机定位到用户所在的网络终端,以可被理解的文字、数字、图像、图表、符号等到显示用户所需求的档案实体的真实信息。
但现有的电子档案由于挂接的方式不当,容易存在数据导入错误和数据缺失的问题。
发明内容
本发明的目的在于:为解决现有的电子档案由于挂接的方式不当,存在数据导入错误和数据缺失的问题,特提供一种跨平台电子档案批量挂接的方法。
本发明采用的技术方案如下:
一种跨平台电子档案批量挂接的方法,所述方法包括以下步骤:
S1:数据著录:;
S2:数字化采集;
S3:双机校对;
S4:数据录入;
S5:格式转换;
S6:数据检查;
S7:目录关联;
其中步骤S4具体分为零散数据录入、成档数据导入、扫描文本OCR识别三种
所述零散数据录入具体为:将报送上来的数据进行接收后,数据将进入临时接收库,要进行接收数据登记,以便档案管理员进行数据审核,审核通过数据将进入档案资源正式库,对于不符合要求的数据,档案管理员将进行数据退回操作,并填写退回意见;
所述成档数据导入具体为:数据导入过程中,系统自动对电子目录数据及原始文件数据进行“三性”验证,验证通过的成档数据,录入档案资源正式库;验证不通过的成档数据执行退回操作,并填写退回意见;
所述扫描文本OCR识别具体为:针对扫描型文本的文字识别,将扫描型文本的文字转换为文档文本。
上述方案中,所述S1具体为:
S11:利用数据著录模板进行普通界面著录;
S12:对S11生成的目录进行手动编辑;
S13:对编辑完成后的目录根据档案著录规则进行判断;符合规则的目录保存入库;不符合规则的目录,给出提示并定位错误位置,提示用户修改。
上述方案中,所述步骤S2具体为:
S21:根据步骤S13中入库的目录确定挂接对象;
S22:从本地数据库中选择挂接文件,进行模拟挂接操作;
S23:模拟挂接成功的目录进行步骤S3;模拟挂接失败的目录条,对文件进行文本或图像处理、文件编排、文件类型选择、文件重名命名及格式转化等操作后,重复模拟挂接操作;
上述方案中,所述步骤S3具体为:
寻找数据库中与本档案目录相同的对比档案目录进行元数据的匹配验证;未通过验证的目录条目抛出并进行特殊颜色标注,提醒著录人员检查后进行修改并保存,第二次进行匹配验证,直至整个档案目录无误,进行步骤S4。
上述方案中,所述步骤S5具体为:
将接受到的数据中的文本、图像、音频及视频转换成统一的管理格式;其中文本的标准格式为PDF,图像的标准格式为JPG,音频的标准格式为AVI,视频的标准格式为WNV。
上述方案中,所述步骤S6具体为:
对转换后的数据进行完整性和规范性检查,标注出不合格的文件,提醒著录人员进行人工检查。
上述方案中,所述步骤S7具体为:
S71:设置目录关联规则;
S72:对档案目录利用预设的目录关联规则进行关联;
S73:通过人工进行检测,查看是否关联成功,未关联成功的进行人工关联。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明通过在传统的挂接方法上加入数字化采集、数据检查的步骤,对导入的过程进行模拟,对导入的数据进行检查,解决了现有的电子档案由于挂接的方式不当,存在数据导入错误和数据缺失的问题,保证了导入数据的完整性和规范性;同时将数据录入分为零散数据录入、成档数据录入和扫描文本OCR识别的方式,对不同的数据类型进行不同的归档操作,更近一步的保证了数据的完整性和规范性。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
实施例1
一种跨平台电子档案批量挂接的方法,所述方法包括以下步骤:
S1:数据著录:;
S2:数字化采集;
S3:双机校对;
S4:数据录入;
S5:格式转换;
S6:数据检查;
S7:目录关联;
在本实施例中,所述步骤S4具体分为零散数据录入、成档数据导入、扫描文本OCR识别三种
在本实施例中,所述零散数据录入具体为:将报送上来的数据进行接收后,数据将进入临时接收库,要进行接收数据登记,以便档案管理员进行数据审核,审核通过数据将进入档案资源正式库,对于不符合要求的数据,档案管理员将进行数据退回操作,并填写退回意见;
在本实施例中,所述成档数据导入具体为:数据导入过程中,系统自动对电子目录数据及原始文件数据进行“三性”验证,验证通过的成档数据,录入档案资源正式库;验证不通过的成档数据执行退回操作,并填写退回意见;
在本实施例中,所述扫描文本OCR识别具体为:针对扫描型文本的文字识别,将扫描型文本的文字转换为文档文本。
实施例2
在实施例1的基础上,所述S1具体为:
S11:利用数据著录模板进行普通界面著录;
S12:对S11生成的目录进行手动编辑;
S13:对编辑完成后的目录根据档案著录规则进行判断;符合规则的目录保存入库;不符合规则的目录,给出提示并定位错误位置,提示用户修改。
实施例3
在实施例1或2的基础上,所述步骤S2具体为:
S21:根据步骤S13中入库的目录确定挂接对象;
S22:从本地数据库中选择挂接文件,进行模拟挂接操作;
S23:模拟挂接成功的目录进行步骤S3;模拟挂接失败的目录条,对文件进行文本或图像处理、文件编排、文件类型选择、文件重名命名及格式转化等操作后,重复模拟挂接操作;
实施例4
在上述实施例的基础上,所述步骤S3具体为:
寻找数据库中与本档案目录相同的对比档案目录进行元数据的匹配验证;未通过验证的目录条目抛出并进行特殊颜色标注,提醒著录人员检查后进行修改并保存,第二次进行匹配验证,直至整个档案目录无误,进行步骤S4。
实施例5
在上述实施例的基础上,所述步骤S5具体为:
将接受到的数据中的文本、图像、音频及视频转换成统一的管理格式;其中文本的标准格式为PDF,图像的标准格式为JPG,音频的标准格式为AVI,视频的标准格式为WNV。
实施例6
在上述实施例的基础上,所述步骤S6具体为:
对转换后的数据进行完整性和规范性检查,标注出不合格的文件,提醒著录人员进行人工检查。
实施例7
在上述实施例的基础上,所述步骤S7具体为:
S71:设置目录关联规则;
S72:对档案目录利用预设的目录关联规则进行关联;
S73:通过人工进行检测,查看是否关联成功,未关联成功的进行人工关联。
以上所述,仅为本发明的较佳实施例,并不用以限制本发明,本发明的专利保护范围以权利要求书为准,凡是运用本发明的说明书所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (7)

1.一种跨平台电子档案批量挂接的方法,其特征在于,所述方法包括以下步骤:
S1:数据著录:;
S2:数字化采集;
S3:双机校对;
S4:数据录入;
S5:格式转换;
S6:数据检查;
S7:目录关联;
所述步骤S4具体分为零散数据录入、成档数据导入、扫描文本OCR识别三种
所述零散数据录入具体为:将报送上来的数据进行接收后,数据将进入临时接收库,要进行接收数据登记,以便档案管理员进行数据审核,审核通过数据将进入档案资源正式库,对于不符合要求的数据,档案管理员将进行数据退回操作,并填写退回意见;
所述成档数据导入具体为:数据导入过程中,系统自动对电子目录数据及原始文件数据进行“三性”验证,验证通过的成档数据,录入档案资源正式库;验证不通过的成档数据执行退回操作,并填写退回意见;
所述扫描文本OCR识别具体为:针对扫描型文本的文字识别,将扫描型文本的文字转换为文档文本。
2.根据权利要求1所述的一种跨平台电子档案批量挂接的方法,其特征在于,所述S1具体为:
S11:利用数据著录模板进行普通界面著录;
S12:对S11生成的目录进行手动编辑;
S13:对编辑完成后的目录根据档案著录规则进行判断;符合规则的目录保存入库;不符合规则的目录,给出提示并定位错误位置,提示用户修改。
3.根据权利要求1所述的一种跨平台电子档案批量挂接的方法,其特征在于,所述步骤S2具体为:
S21:根据步骤S13中入库的目录确定挂接对象;
S22:从本地数据库中选择挂接文件,进行模拟挂接操作;
S23:模拟挂接成功的目录进行步骤S3;模拟挂接失败的目录条,对文件进行文本或图像处理、文件编排、文件类型选择、文件重名命名及格式转化等操作后,重复模拟挂接操作。
4.根据权利要求1所述的一种跨平台电子档案批量挂接的方法,其特征在于,所述步骤S3具体为:
寻找数据库中与本档案目录相同的对比档案目录进行元数据的匹配验证;未通过验证的目录条目抛出并进行特殊颜色标注,提醒著录人员检查后进行修改并保存,第二次进行匹配验证,直至整个档案目录无误,进行步骤S4。
5.根据权利要求1所述的一种跨平台电子档案批量挂接的方法,其特征在于,所述步骤S5具体为:
将接受到的数据中的文本、图像、音频及视频转换成统一的管理格式;其中文本的标准格式为PDF,图像的标准格式为JPG,音频的标准格式为AVI,视频的标准格式为WNV。
6.根据权利要求1所述的一种跨平台电子档案批量挂接的方法,其特征在于,所述步骤S6具体为:
对转换后的数据进行完整性和规范性检查,标注出不合格的文件,提醒著录人员进行人工检查。
7.根据权利要求1所述的一种跨平台电子档案批量挂接的方法,其特征在于,所述步骤S7具体为:
S71:设置目录关联规则;
S72:对档案目录利用预设的目录关联规则进行关联;
S73:通过人工进行检测,查看是否关联成功,未关联成功的进行人工关联。
CN201810699563.2A 2018-06-29 2018-06-29 一种跨平台电子档案批量挂接的方法 Pending CN108984670A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810699563.2A CN108984670A (zh) 2018-06-29 2018-06-29 一种跨平台电子档案批量挂接的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810699563.2A CN108984670A (zh) 2018-06-29 2018-06-29 一种跨平台电子档案批量挂接的方法

Publications (1)

Publication Number Publication Date
CN108984670A true CN108984670A (zh) 2018-12-11

Family

ID=64539630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810699563.2A Pending CN108984670A (zh) 2018-06-29 2018-06-29 一种跨平台电子档案批量挂接的方法

Country Status (1)

Country Link
CN (1) CN108984670A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852699A (zh) * 2019-10-10 2020-02-28 暨南大学 一种档案电子化智能管理系统及方法
CN111915424A (zh) * 2020-07-30 2020-11-10 平安证券股份有限公司 信息保存方法及相关产品
CN113742357A (zh) * 2021-08-25 2021-12-03 国核电力规划设计研究院有限公司 一种跨平台设计数据自动归集并关联的方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870826A (zh) * 2014-03-31 2014-06-18 深圳市远行科技有限公司 一种电子档案扫描识别建档的方法及系统
US20170052944A1 (en) * 2014-01-20 2017-02-23 Yo-It Ltd. Content digitization and digitized content characterization systems and methods
CN106815340A (zh) * 2017-01-05 2017-06-09 福建亿榕信息技术有限公司 电力营销业务中的存量档案电子化批量处理方法及系统
CN107958083A (zh) * 2017-12-17 2018-04-24 江西睿创科技有限公司 一种档案一体化管理系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170052944A1 (en) * 2014-01-20 2017-02-23 Yo-It Ltd. Content digitization and digitized content characterization systems and methods
CN103870826A (zh) * 2014-03-31 2014-06-18 深圳市远行科技有限公司 一种电子档案扫描识别建档的方法及系统
CN106815340A (zh) * 2017-01-05 2017-06-09 福建亿榕信息技术有限公司 电力营销业务中的存量档案电子化批量处理方法及系统
CN107958083A (zh) * 2017-12-17 2018-04-24 江西睿创科技有限公司 一种档案一体化管理系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HAYES56K: "档案功能方案", 《百度文库》 *
宗莹 等: "纸质档案数字化加工技术研究", 《黑龙江 科技信息》 *
秦颖: "基于社会计算的档案数字化研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
郑清洁: "焦作市国土资源档案数字化设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852699A (zh) * 2019-10-10 2020-02-28 暨南大学 一种档案电子化智能管理系统及方法
CN111915424A (zh) * 2020-07-30 2020-11-10 平安证券股份有限公司 信息保存方法及相关产品
CN113742357A (zh) * 2021-08-25 2021-12-03 国核电力规划设计研究院有限公司 一种跨平台设计数据自动归集并关联的方法和系统

Similar Documents

Publication Publication Date Title
CN108984670A (zh) 一种跨平台电子档案批量挂接的方法
CN100517313C (zh) 用于验证迁移文件的元数据的方法和系统
CN102495740B (zh) 利用移动存储设备升级mac地址、hdcpkey、电视机id的方法
US10216840B2 (en) Asset tag template creation from readable elements
US10229098B2 (en) Automated processing of transcripts, transcript designations, and/or video clip load files
CN117473940B (zh) 电子设计图纸管理方法、装置、电子设备及存储介质
CN109165170B (zh) 一种自动化请求测试的方法及系统
CN102598018A (zh) 许可管理系统,销售管理设备,以及许可管理设备
JP2006092268A (ja) 画像ファイル記録システムおよびその制御方法
CN102915295A (zh) 文档检测方法及装置
CN104185066A (zh) 一种自动校验电子节目菜单的方法及装置
CN103605639A (zh) 一种基于epub格式电子书籍制作的方法
US20210149772A1 (en) Systems and methods for generating self-notarized backups
CN112783767A (zh) 测试用例管理实现控制方法、装置、设备及存储介质
CN109359878B (zh) 档案数据处理方法、计算机装置及计算机可读存储介质
CN113836152B (zh) 一种高效率数据一致性校验方法、装置及存储介质
CN107430533A (zh) 一种数据校验方法和装置
US20240104185A1 (en) Device registration methods and apparatuses, electronic devices and storage media
CN114968345A (zh) 代码处理方法、系统、计算设备及存储介质
CN111966670B (zh) 基于镶嵌数据集的遥感数据分发方法、装置和管理平台
CN115481589A (zh) 数据交付方法及装置
CN109684962B (zh) Ar电子书质量检测方法
CN114253642A (zh) 系统信息处理方法、装置、电子设备及介质
CN118797085A (zh) 一种基于互联网的图像处理管理系统及方法
CN115130443B (zh) 表格数据处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181211

RJ01 Rejection of invention patent application after publication