CN105512197A - 一种文档数字化归档的装置及其归档和查询方法 - Google Patents
一种文档数字化归档的装置及其归档和查询方法 Download PDFInfo
- Publication number
- CN105512197A CN105512197A CN201510840557.0A CN201510840557A CN105512197A CN 105512197 A CN105512197 A CN 105512197A CN 201510840557 A CN201510840557 A CN 201510840557A CN 105512197 A CN105512197 A CN 105512197A
- Authority
- CN
- China
- Prior art keywords
- inquiry
- file
- document
- word message
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06313—Resource planning in a project environment
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种文档数字化归档的装置,包括:录入文档数据的采集端、管理和存储数据的服务器端,以及用于外部查询的查询端;所述的采集端包括:纸质输入单元,扫描识别单元,采集端通讯接口;所述的服务器端包括:存储单元,第一逻辑单元,数据库,第二逻辑单元;所述的查询端包括:查询输入单元,输出单元,查询端通讯接口。其将纸质文档进行了电子化存储,且其纸质文档转化为图片电子文档的同时,生成了电子的文字信息,并将该文字信息与图片电子文档建立了映射关系,并按该映射关系存储与数据库中,因此在需要查询相关文档时,通过输入查询信息,系统通过文字信息与查询信息匹配后,即可自动调出所需查询的目标文档的图片电子文件。
Description
技术领域
本发明涉及一种将纸质文件以数字化形式归档的装置,以及涉及一种将纸质文档以数字化形式归档的方法和相应查询方法。
背景技术
企业经营管理过程中会产生各类业务单据,如购销合同、货物签收单、质量保证书等,对于企业的有序经营和权益保障起着非常重要的作用。企业往往会根据内外部质量体系管理的要求,明确各业务单据的保管期限,例如合同通常要求永久保存,质量保证书保存至少十年等。以往,企业通常采用纸质单据分类、集中保管的方式进行单据的留存。
随着企业的业务规模扩张,纸质单据量数以万计,传统方式下单据的收集、归类、存放、清点和转移均需要耗费大量的人力物力,给日常管理造成不便。纸质单据一旦保管不当,则容易出现损毁、丢失,无法满足企业的管理要求,甚至为企业的稳定经营留下风险和隐患。
发明内容
本发明目的在于克服上述现有技术存在的缺陷提供一种纸质文档数字化归档装置,以及使用该归档装置进行纸质文档的数字化归档的方法和使用该归档装置进行纸质文档数字化查询方法。
本发明所述的一种文档数字化归档的装置,包括:录入文档数据的采集端、管理和存储数据的服务器端,以及用于外部查询的查询端;
所述的采集端包括:
纸质输入单元,用于接收纸质文档;
扫描识别单元,用于将接收到的纸质文档扫描成图片格式的电子文件,并识别及提取所扫描的电子文件中的文字信息;
采集端通讯接口,用于服务器端与采集端的通讯连接;
所述的服务器端包括:
存储单元,用于缓冲存放输入的电子文件和其所对应的识别及提取的文字信息;
第一逻辑单元,用于对电子文件和其所对应的识别及提取的文字信息建立对应的映射关系;
数据库,用于永久存放形成映射关系的电子文件和其所对应的识别及提取的文字信息;
第二逻辑单元,接收查询端发送的查询信息,根据查询信息与数据库中的文字信息进行匹配,并根据匹配结果确定查询目标文档,并从数据库获取该查询信目标文档的电子文件,并将电子文件和其所对应的识别及提取的文字信息返回外部查询端;
所述的查询端包括:
查询输入单元,用于输入查询目标文档的查询信息;
输出单元,用于接收服务器端第二逻辑单元返回的查询目标文档所对应的电子文件,并将其信息输出;
查询端通讯接口,用于服务器端与查询端的通讯连接。
本发明所述的文档数字化归档的方法,包括以下步骤:
a.通过采集端,将纸质文档扫描,获取图片格式的电子文件;
b.通过扫描识别单元识别及提取图片格式的电子文件中的文字信息;
c.将电子文件和其所对应的识别及提取的文字信息输入存储单元;
d.通过逻辑运算,将电子文件和其所对应的识别及提取文字信息形成对应的映射关系,并将其存储于数据库中。
本发明所述的文档数字化查询的方法,包括以下步骤:
通过外部查询端的查询输入单元输入查询信息;
查询信息通过查询端通讯接口输送到服务器端;
服务器端将接收到的查询信息与数据库中的文字信息进行匹配,并根据匹配结果确定查询目标文档,从数据库获取该查询信目标文档的电子文件,并将电子文件和其所对应的识别及提取的文字信息返回外部查询端。
本发明所述的文档数字化归档的装置,其将纸质文档进行了电子化存储,不但大幅降低了文档存储的占地空间,还可延长文档的保存时间和保存质量。且其纸质文档转化为图片电子文档的同时,生成了电子的文字信息,并将该文字信息与图片电子文档建立了映射关系,并按该映射关系存储与数据库中,因此在需要查询相关文档时,通过输入查询信息,系统通过文字信息与查询信息匹配后,即可自动调出所需查询的目标文档的图片电子文件,因而查询快速方便,可以提高企业管理的效率和降低管理的成本。
附图说明
图1是本发明装置的结构框图。
图2是本发明归档和查询方法的流程图。
具体实施方式
根据图1、图2所示,本发明所述的一种文档数字化归档的装置及其归档和查询方法工作流程如下,首先通过纸质文档的接收单元收入要归档的纸质文档。扫描识别单元对纸质文档进行扫描后得到图片格式的电子文件,再利用图片识别技术识别出电子文件中的文字信息。其中文字信息包括了纸质文档的类型,例如合同、支票、收据、协议等等不同的类型;还包括纸质文档的编号,例如合同编号、支票编码等各文档类型所对应的文档编号;文字信息还可以包括金额、公司名称、合同条款等等用字符表达的信息;然后通过采集端通讯接口发送到服务器端的存储单元。
服务器端的第一逻辑单元将存储单元中的电子文件与其相对应的文字信息形成一一对应的映射关系,并以文档的类型和编号为分类依据,对该纸质文档进行分类归档。最后将处理完毕的电子文件和文字信息同时保存于数据库以供后续查询使用。保存于数据库时相同文档编号和类型有在先数据,则覆盖在先数据。
查询已归档的纸质文档通过以下工作流程,在查询端的查询输入单元输入目标文档的任一信息或任意信息组合,例如输入日期或金额作为查询参数,并通过查询端通讯接口输入到服务器端的第二逻辑单元。第二逻辑单元获取含义该参数或参数组合的目标所对应的映射关系,然后根据映射关系从数据库获取该目标的电子文件以及对应的文字信息。最后将电子文件和文字信息返回查询端,并通过输出单元将查询结果输出到外设设备。
对于本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及变形,而所有的这些改变以及变形都应该属于本发明权利要求的保护范围之内。
Claims (6)
1.一种文档数字化归档的装置,其特征在于,包括:录入文档数据的采集端、管理和存储数据的服务器端,以及用于外部查询的查询端;
所述的采集端包括:
纸质输入单元,用于接收纸质文档;
扫描识别单元,用于将接收到的纸质文档扫描成图片格式的电子文件,并识别及提取所扫描的电子文件中的文字信息;
采集端通讯接口,用于服务器端与采集端的通讯连接;
所述的服务器端包括:
存储单元,用于缓冲存放输入的电子文件和其所对应的识别及提取的文字信息;
第一逻辑单元,用于对电子文件和其所对应的识别及提取的文字信息建立对应的映射关系;
数据库,用于永久存放形成映射关系的电子文件和其所对应的识别及提取的文字信息;
第二逻辑单元,接收查询端发送的查询信息,根据查询信息与数据库中的文字信息进行匹配,并根据匹配结果确定查询目标文档,并从数据库获取该查询信目标文档的电子文件,并将电子文件和其所对应的识别及提取的文字信息返回外部查询端;
所述的查询端包括:
查询输入单元,用于输入查询目标文档的查询信息;
输出单元,用于接收服务器端第二逻辑单元返回的查询目标文档所对应的电子文件,并将其信息输出;
查询端通讯接口,用于服务器端与查询端的通讯连接。
2.一种文档数字化归档的方法,其特征在于,包括以下步骤:
a.通过采集端,将纸质文档扫描,获取图片格式的电子文件;
b.通过扫描识别单元识别及提取图片格式的电子文件中的文字信息;
c.将电子文件和其所对应的识别及提取的文字信息输入存储单元;
d.通过逻辑运算,将电子文件和其所对应的识别及提取文字信息形成对应的映射关系,并将其存储于数据库中。
3.根据权利要求2所述的方法,其特征在于,步骤b中文字信息包括文档编号和类型。
4.根据权利要求3所述的方法,其特征在于,步骤d中保存于数据库时相同文档编号和类型有在先数据,则覆盖在先数据。
5.根据权利要求3所述的方法,其特征在于,步骤d中的分类以文档编号和类型为基础依据。
6.一种文档数字化查询的方法,包括以下步骤:
通过外部查询端的查询输入单元输入查询信息;
查询信息通过查询端通讯接口输送到服务器端;
服务器端将接收到的查询信息与数据库中的文字信息进行匹配,并根据匹配结果确定查询目标文档,从数据库获取该查询信目标文档的电子文件,并将电子文件和其所对应的识别及提取的文字信息返回外部查询端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510840557.0A CN105512197A (zh) | 2015-11-27 | 2015-11-27 | 一种文档数字化归档的装置及其归档和查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510840557.0A CN105512197A (zh) | 2015-11-27 | 2015-11-27 | 一种文档数字化归档的装置及其归档和查询方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105512197A true CN105512197A (zh) | 2016-04-20 |
Family
ID=55720179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510840557.0A Pending CN105512197A (zh) | 2015-11-27 | 2015-11-27 | 一种文档数字化归档的装置及其归档和查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105512197A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145859A (zh) * | 2017-05-04 | 2017-09-08 | 北京小米移动软件有限公司 | 电子书转换处理方法、装置及计算机可读存储介质 |
CN107943898A (zh) * | 2017-11-17 | 2018-04-20 | 浙江建设职业技术学院 | 一种数字多媒体资料管理系统、方法及扫描装置 |
CN108509564A (zh) * | 2018-03-23 | 2018-09-07 | 乐清咔咔网络科技有限公司 | 基于印章印文扫描的电子档案归档和查询服务系统及方法 |
CN109508334A (zh) * | 2018-11-23 | 2019-03-22 | 中科驭数(北京)科技有限公司 | 针对区块链数据库的数据压缩方法、访问方法和系统 |
CN110019015A (zh) * | 2017-12-29 | 2019-07-16 | 中电电气(上海)太阳能科技有限公司 | 一种电子流转单的保存及安全查询系统 |
CN110222070A (zh) * | 2019-04-28 | 2019-09-10 | 平安科技(深圳)有限公司 | 报表归档方法、装置、介质、电子设备 |
CN110245892A (zh) * | 2019-05-30 | 2019-09-17 | 深圳市升蓝物流有限公司 | 一种物流管理系统及其制单方法 |
CN110399334A (zh) * | 2018-04-20 | 2019-11-01 | 北京太章机电设备有限公司 | 对纸质文档进行排序的方法和系统 |
CN111259280A (zh) * | 2020-01-15 | 2020-06-09 | 深圳市元征科技股份有限公司 | 设备信息显示方法、服务器及终端 |
WO2020132850A1 (en) * | 2018-12-25 | 2020-07-02 | Microsoft Technology Licensing, Llc | Technical document issues scanner |
CN112199330A (zh) * | 2020-09-29 | 2021-01-08 | 广东电网有限责任公司韶关供电局 | 一种混合文档归档方法、归档装置及存储介质 |
CN112686262A (zh) * | 2020-12-28 | 2021-04-20 | 广州博士信息技术研究院有限公司 | 一种基于图像识别技术的手册提取结构化数据并快速归档的方法 |
CN112733658A (zh) * | 2020-12-31 | 2021-04-30 | 北京华宇信息技术有限公司 | 电子文档归档方法及其装置 |
CN113360506A (zh) * | 2021-07-26 | 2021-09-07 | 江苏燕宁工程科技集团有限公司 | 一种基于公路工程bim的纸质档案数字化处理方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870826A (zh) * | 2014-03-31 | 2014-06-18 | 深圳市远行科技有限公司 | 一种电子档案扫描识别建档的方法及系统 |
-
2015
- 2015-11-27 CN CN201510840557.0A patent/CN105512197A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103870826A (zh) * | 2014-03-31 | 2014-06-18 | 深圳市远行科技有限公司 | 一种电子档案扫描识别建档的方法及系统 |
Non-Patent Citations (3)
Title |
---|
丁鲜花等: "文件数字化与检索分析系统研究", 《中国无线电》 * |
张照余: "《档案信息化理论与实践》", 31 December 2007, 中国档案出版社 * |
石会鹏等: "空间业务档案数字化与全文检索系统的研究", 《数字通信世界》 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145859A (zh) * | 2017-05-04 | 2017-09-08 | 北京小米移动软件有限公司 | 电子书转换处理方法、装置及计算机可读存储介质 |
CN107943898A (zh) * | 2017-11-17 | 2018-04-20 | 浙江建设职业技术学院 | 一种数字多媒体资料管理系统、方法及扫描装置 |
CN110019015A (zh) * | 2017-12-29 | 2019-07-16 | 中电电气(上海)太阳能科技有限公司 | 一种电子流转单的保存及安全查询系统 |
CN108509564A (zh) * | 2018-03-23 | 2018-09-07 | 乐清咔咔网络科技有限公司 | 基于印章印文扫描的电子档案归档和查询服务系统及方法 |
CN108509564B (zh) * | 2018-03-23 | 2023-03-14 | 乐清咔咔网络科技有限公司 | 基于印章印文扫描的电子档案归档和查询服务系统及方法 |
CN110399334A (zh) * | 2018-04-20 | 2019-11-01 | 北京太章机电设备有限公司 | 对纸质文档进行排序的方法和系统 |
CN109508334B (zh) * | 2018-11-23 | 2019-10-11 | 中科驭数(北京)科技有限公司 | 针对区块链数据库的数据压缩方法、访问方法和系统 |
CN109508334A (zh) * | 2018-11-23 | 2019-03-22 | 中科驭数(北京)科技有限公司 | 针对区块链数据库的数据压缩方法、访问方法和系统 |
US11301633B2 (en) | 2018-12-25 | 2022-04-12 | Microsoft Technology Licensing, Llc | Technical document issues scanner |
WO2020132850A1 (en) * | 2018-12-25 | 2020-07-02 | Microsoft Technology Licensing, Llc | Technical document issues scanner |
CN110222070A (zh) * | 2019-04-28 | 2019-09-10 | 平安科技(深圳)有限公司 | 报表归档方法、装置、介质、电子设备 |
CN110222070B (zh) * | 2019-04-28 | 2023-08-29 | 平安科技(深圳)有限公司 | 报表归档方法、装置、介质、电子设备 |
CN110245892A (zh) * | 2019-05-30 | 2019-09-17 | 深圳市升蓝物流有限公司 | 一种物流管理系统及其制单方法 |
CN111259280A (zh) * | 2020-01-15 | 2020-06-09 | 深圳市元征科技股份有限公司 | 设备信息显示方法、服务器及终端 |
CN112199330A (zh) * | 2020-09-29 | 2021-01-08 | 广东电网有限责任公司韶关供电局 | 一种混合文档归档方法、归档装置及存储介质 |
CN112686262A (zh) * | 2020-12-28 | 2021-04-20 | 广州博士信息技术研究院有限公司 | 一种基于图像识别技术的手册提取结构化数据并快速归档的方法 |
CN112733658A (zh) * | 2020-12-31 | 2021-04-30 | 北京华宇信息技术有限公司 | 电子文档归档方法及其装置 |
CN113360506A (zh) * | 2021-07-26 | 2021-09-07 | 江苏燕宁工程科技集团有限公司 | 一种基于公路工程bim的纸质档案数字化处理方法及系统 |
CN113360506B (zh) * | 2021-07-26 | 2024-03-26 | 江苏燕宁工程科技集团有限公司 | 一种基于公路工程bim的纸质档案数字化处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105512197A (zh) | 一种文档数字化归档的装置及其归档和查询方法 | |
CN108647311B (zh) | 一种用于工程施工管理过程文件电子化处理系统及方法 | |
US10528626B2 (en) | Document processing | |
CN104636469B (zh) | 文件自动分类管理方法和系统 | |
CN107423732A (zh) | 基于Android平台的车辆VIN识别方法 | |
CN103034927A (zh) | 票据影像管理系统和票据影像管理方法 | |
CN112052749A (zh) | 档案的归档方法、装置、电子设备及计算机可读存储介质 | |
US20120265759A1 (en) | File processing of native file formats | |
CN103903171A (zh) | 一种交互式网络发票真伪查验方法 | |
CN104252662A (zh) | 一种会计原始凭证处理方法及管理系统 | |
CN103295034A (zh) | 一种基于dsp的嵌入式图书乱架清点系统及方法 | |
CN104156864A (zh) | 二维码防伪系统及其防伪方法 | |
CN104933539A (zh) | 一种基于rfid技术的快递配送单生成方法 | |
CN105608131A (zh) | 一种档案信息检索及利用电子化的实现方法 | |
JP2019204535A (ja) | 会計支援システム | |
CN107403140A (zh) | 一种名片信息识别和名片图像匹配管理方法 | |
CN110516020A (zh) | 一种基于数字城市地理空间框架的国土资源档案管理系统 | |
CN108509564A (zh) | 基于印章印文扫描的电子档案归档和查询服务系统及方法 | |
CN108897729A (zh) | 一种交易模板共享方法、装置、电子设备及存储介质 | |
CN107844960B (zh) | 一种自动化智能分析商业计划书的投资分析工具 | |
CN106228329A (zh) | 一种基于信息提取系统的快速企业电子面单系统构建方法 | |
CN115357817A (zh) | 一种标识体系互通系统及方法 | |
US20100125617A1 (en) | System for Consolidating Business Documents | |
JP2007519051A (ja) | 文書および電子手段の分散された自主管理装置およびプロセス | |
CN101876999A (zh) | 一种生成传真索引的方法、报文分析装置和传真检索系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160420 |
|
RJ01 | Rejection of invention patent application after publication |