CN111831784A - 一种文件扫描及分类存储的系统及方法 - Google Patents

一种文件扫描及分类存储的系统及方法 Download PDF

Info

Publication number
CN111831784A
CN111831784A CN202010679214.1A CN202010679214A CN111831784A CN 111831784 A CN111831784 A CN 111831784A CN 202010679214 A CN202010679214 A CN 202010679214A CN 111831784 A CN111831784 A CN 111831784A
Authority
CN
China
Prior art keywords
scanning
file
module
storing
file image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010679214.1A
Other languages
English (en)
Inventor
张景瑞
吴金华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Taiyuan Intelligent Technology Co ltd
Original Assignee
Anhui Taiyuan Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Taiyuan Intelligent Technology Co ltd filed Critical Anhui Taiyuan Intelligent Technology Co ltd
Priority to CN202010679214.1A priority Critical patent/CN111831784A/zh
Publication of CN111831784A publication Critical patent/CN111831784A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/178Techniques for file synchronisation in file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Abstract

本发明公开了一种文件扫描及分类存储的系统及方法,方法步骤包括:对文件进行扫描以获取文件图像,并将文件图像临时存储至识别区域;监听识别区域中是否有新存入的文件图像,若有则对其进行内容识别,并将识别出的内容以文本的形式存储至指定位置,同时通过相应目录名对文本内容进行关联;根据目录名对指定位置内的文本进行分类存储,并进行汇集汇总处理;通过网络传输将处理后的文件信息同步到数据中心服务器。该系统及方法在扫描文件的同时,对文件进行识别,识别后可自动分类存储,还能在连网后自动将文件信息同步至数据中心,由此节省了文件处理时间,提高了工作效率,同时保证了文件处理的准确率。

Description

一种文件扫描及分类存储的系统及方法
技术领域
本发明涉及文件处理技术领域,具体涉及一种文件扫描及分类存储的系统及方法。
背景技术
在公司、行政机关、科研机构等单位经常需要将办公用的纸质文档使用扫描仪或扫描、复印、打印一体机等扫描录入设备扫描成电子文档并进行分类管理,这些文档通常分属于不同的部门,不同时间、不同事项等,而且需要经常被多人共享调阅和使用。
针对文档的归档以及上传共享,通常都需要对扫描后的电子文档进行手动归类并创建目录,费时费力,也容易出错。此外,如果是批量放置的纸质原稿,扫描后的电子文档或者是单页一个文件,导致一堆零散的文件,不能迅速区分出哪几个文件属于一份,需要人后期手工整理。
发明内容
本发明的目的在于提供一种文件扫描及分类存储的系统及方法,其能实现文件扫描、自动分类归档以及同步的作用。
本发明通过以下技术方案来实现上述目的:
一种文件扫描及分类存储的系统,包括
扫描模块,用于对文件进行扫描并获取文件图像;
临时存储模块,用于作为识别区域临时存储所获取的文件图像;
识别模块,用于监听识别区域中是否有新存入的文件图像,若有则对其进行内容识别,并将识别出的内容以文本的形式存储至指定位置,同时通过相应目录名对文本内容进行关联;
分类存储模块,由多个具有不同目录名的存储部组成,每个存储部用于存储与其目录名相对应的文本;
处理模块,用于根据目录名对指定位置内的文本进行分类存储,并进行汇集汇总处理;
数据中心服务器,用于通过网络传输将处理模块处理后的文件信息进行同步。
进一步改进在于,所述扫描模块包括
传感器,用于扫描文件;
传送单元,用于带动传感器进行扫描;
光路单元,用于通过其设计的采集光路将图像聚焦到传感器;
采集单元,用于将传感器模拟信号转换为数字信号;
传输单元,用于将转换的数字信号传递给后续模块,留待处理。
进一步改进在于,所述系统还包括网络模块,所述网络模块用于将处理后的文件信息同步到数据中心服务器,网络模块的网络接口支持RJ-45、WIFI模块。
进一步改进在于,所述系统还包括电源模块,所述电源模块作为系统的应急电源,用于在系统断电时自动供电。
进一步改进在于,所述系统还包括显示模块,所述显示模块用于实现系统的可交互模式,以对系统进行设置。
一种文件扫描及分类存储的方法,其利用上述系统,步骤包括:
(1)对文件进行扫描以获取文件图像,并将文件图像临时存储至识别区域;
(2)监听识别区域中是否有新存入的文件图像,若有则对其进行内容识别,并将识别出的内容以文本的形式存储至指定位置,同时通过相应目录名对文本内容进行关联;
(3)根据目录名对指定位置内的文本进行分类存储,并进行汇集汇总处理;
(4)通过网络传输将处理后的文件信息同步到数据中心服务器。
进一步改进在于,所述扫描和识别是异步的过程。
进一步改进在于,所述文件信息包括扫描文件图像、识别后的文件文本、以及图像与文本内容对应的关联信息数据。
进一步改进在于,所述目录名根据归属分类而设定,所述归属分类包括时间分类、部门分类、事项分类和人员分类。
本发明的有益效果在于:该系统及方法在扫描文件的同时,对文件进行识别,识别后可自动分类存储,还能在连网后自动将文件信息同步至数据中心,由此节省了文件处理时间,提高了工作效率,同时保证了文件处理的准确率。
附图说明
图1为文件扫描及分类存储的系统结构图;
图2为文件扫描及分类存储的方法示意图。
具体实施方式
下面结合附图对本申请作进一步详细描述,有必要在此指出的是,以下具体实施方式只用于对本申请进行进一步的说明,不能理解为对本申请保护范围的限制,该领域的技术人员可以根据上述申请内容对本申请作出一些非本质的改进和调整。
如图1所示,一种文件扫描及分类存储的系统,包括
扫描模块,用于对文件进行扫描并获取文件图像,即把纸质文档扫描成高清图片、支持纸张尺寸:A3、A4;
临时存储模块,用于作为识别区域临时存储所获取的文件图像;识别区域根据待扫描的文件布局确定,可通过交互方式,划定待识别区域;
识别模块,用于监听识别区域中是否有新存入的文件图像,若有则对其进行内容识别,并将识别出的内容以文本的形式存储至指定位置,同时通过相应目录名对文本内容进行关联;
分类存储模块,由多个具有不同目录名的存储部组成,每个存储部用于存储与其目录名相对应的文本;分类存储模块的设置可以让系统离线使用,在合适的时间节点,一次性同步数据到服务器;
处理模块,用于根据目录名对指定位置内的文本进行分类存储,存储至不同的存储部内,并进行汇集汇总处理;
数据中心服务器,用于通过网络传输将处理模块处理后的文件信息进行同步。
其中,所述扫描模块包括传感器,用于扫描文件;传送单元,用于带动传感器进行扫描;光路单元,用于通过其设计的采集光路将图像聚焦到传感器;采集单元,用于将传感器模拟信号转换为数字信号;传输单元,用于将转换的数字信号传递给后续模块,留待处理。工作原理为由传送单元带动扫描传感器探头,探头以线阵CCD传感器为主,采集对应的图像,采集完成后,把数据交给软件处理。
本发明中,所述系统还包括网络模块,所述网络模块用于将处理后的文件信息同步到数据中心服务器,网络模块的网络接口支持RJ-45、WIFI模块。
本发明中,所述系统还包括电源模块,所述电源模块作为系统的应急电源,用于在系统断电时自动供电。电源模块作用在于防止突然断电造成的数据丢失,机器内置应急电源,保证数据的安全落地。
本发明中,所述系统还包括显示模块,所述显示模块用于实现系统的可交互模式,以对系统进行设置,满足不同用户的操作需求。
上述系统在使用前,可以进行信息的预设,其包括:1)存储信息设置:比如设置扫描件的存储位置,存储方式等;2)扫描信息设置:比如设置扫描件的格式、分辨率等;3)识别区域设置:这主要根据待扫描的文件布局来的,可通过交互方式,划定待识别区域;4)网络状态设置:网络状态设置,主要是设置网络状态、网络连接方式等信息;5)数据传输设置:可设置是否联网定时同步,设置间隔时间;监听网络状态,保证联网时,自动同步数据;6)服务器信息设置:设置同步到的服务器IP、端口、协议(HTTP/HTTPS/FTP)等信息。
如图2所示,本发明还提供了一种文件扫描及分类存储的方法,其利用上述系统,步骤包括:
(1)对文件进行扫描以获取文件图像,,并将文件图像临时存储至识别区域;
(2)监听识别区域中是否有新存入的文件图像,若有则对其进行内容识别(若没有则继续监听),并将识别出的内容以文本的形式存储至指定位置,同时通过相应目录名对文本内容进行关联,供数据处理组件使用;
(3)根据目录名对指定位置内的文本进行分类存储,并进行汇集汇总处理;目的是在同步到“数据中心”前,可以进行一部分数据的处理,可以减轻“数据中心”一部分的数据处理负担。同时用户也可以预览数据处理的准确度,如果有偏差,可人工进行调整,归类等。
(4)检测网络网络状态和设置的开关,条件满足的情况下,会自动通过网络传输将处理后的文件信息同步到数据中心服务器。
上述步骤中,扫描和识别是异步的过程,数据识别的过程与数据采集的过程是相互独立的。
上述步骤中,文件信息包括扫描文件图像、识别后的文件文本、以及图像与文本内容对应的关联信息数据。
上述步骤中,目录名根据归属分类而设定,所述归属分类包括时间分类、部门分类、事项分类和人员分类,各归属分类之间可交叉,例如时间分类分为2017年、2018年、2019年和2020年,部门分类分为财务部门、人事部门、生产部门、采购部门、质检部门等,其中目录名为2017年-财务部门等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (9)

1.一种文件扫描及分类存储的系统,其特征在于:包括
扫描模块,用于对文件进行扫描并获取文件图像;
临时存储模块,用于作为识别区域临时存储所获取的文件图像;
识别模块,用于监听识别区域中是否有新存入的文件图像,若有则对其进行内容识别,并将识别出的内容以文本的形式存储至指定位置,同时通过相应目录名对文本内容进行关联;
分类存储模块,由多个具有不同目录名的存储部组成,每个存储部用于存储与其目录名相对应的文本;
处理模块,用于根据目录名对指定位置内的文本进行分类存储,并进行汇集汇总处理;
数据中心服务器,用于通过网络传输将处理模块处理后的文件信息进行同步。
2.根据权利要求1所述的一种文件扫描及分类存储的系统,其特征在于:所述扫描模块包括
传感器,用于扫描文件;
传送单元,用于带动传感器进行扫描;
光路单元,用于通过其设计的采集光路将图像聚焦到传感器;
采集单元,用于将传感器模拟信号转换为数字信号;
传输单元,用于将转换的数字信号传递给后续模块,留待处理。
3.根据权利要求1所述的一种文件扫描及分类存储的系统,其特征在于:所述系统还包括网络模块,所述网络模块用于将处理后的文件信息同步到数据中心服务器,网络模块的网络接口支持RJ-45、WIFI模块。
4.根据权利要求1所述的一种文件扫描及分类存储的系统,其特征在于:所述系统还包括电源模块,所述电源模块作为系统的应急电源,用于在系统断电时自动供电。
5.根据权利要求1所述的一种文件扫描及分类存储的系统,其特征在于:所述系统还包括显示模块,所述显示模块用于实现系统的可交互模式,以对系统进行设置。
6.一种文件扫描及分类存储的方法,其特征在于:其利用权利要求1-5任一项所述的系统,步骤包括
(1)对文件进行扫描以获取文件图像,并将文件图像临时存储至识别区域;
(2)监听识别区域中是否有新存入的文件图像,若有则对其进行内容识别,并将识别出的内容以文本的形式存储至指定位置,同时通过相应目录名对文本内容进行关联;
(3)根据目录名对指定位置内的文本进行分类存储,并进行汇集汇总处理;
(4)通过网络传输将处理后的文件信息同步到数据中心服务器。
7.根据权利要求6所述的一种文件扫描及分类存储的方法,其特征在于:所述扫描和识别是异步的过程。
8.根据权利要求6所述的一种文件扫描及分类存储的方法,其特征在于:所述文件信息包括扫描文件图像、识别后的文件文本、以及图像与文本内容对应的关联信息数据。
9.根据权利要求6所述的一种文件扫描及分类存储的方法,其特征在于:所述目录名根据归属分类而设定,所述归属分类包括时间分类、部门分类、事项分类和人员分类。
CN202010679214.1A 2020-07-15 2020-07-15 一种文件扫描及分类存储的系统及方法 Pending CN111831784A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010679214.1A CN111831784A (zh) 2020-07-15 2020-07-15 一种文件扫描及分类存储的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010679214.1A CN111831784A (zh) 2020-07-15 2020-07-15 一种文件扫描及分类存储的系统及方法

Publications (1)

Publication Number Publication Date
CN111831784A true CN111831784A (zh) 2020-10-27

Family

ID=72923220

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010679214.1A Pending CN111831784A (zh) 2020-07-15 2020-07-15 一种文件扫描及分类存储的系统及方法

Country Status (1)

Country Link
CN (1) CN111831784A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934065A (zh) * 2017-03-30 2017-07-07 理光图像技术(上海)有限公司 文件图像扫描存储共享装置以及管理系统
CN107908745A (zh) * 2017-11-16 2018-04-13 理光图像技术(上海)有限公司 批量文档扫描整理装置、方法、介质及设备
CN109658062A (zh) * 2018-12-13 2019-04-19 广州华资软件技术有限公司 一种基于深度学习的电子档案智能处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934065A (zh) * 2017-03-30 2017-07-07 理光图像技术(上海)有限公司 文件图像扫描存储共享装置以及管理系统
CN107908745A (zh) * 2017-11-16 2018-04-13 理光图像技术(上海)有限公司 批量文档扫描整理装置、方法、介质及设备
CN109658062A (zh) * 2018-12-13 2019-04-19 广州华资软件技术有限公司 一种基于深度学习的电子档案智能处理方法

Similar Documents

Publication Publication Date Title
US5659164A (en) Method of and system for apparatus for two-way automatically creating, identifying, routing and storing digitally scanned documents
US6704118B1 (en) Method and system for automatically and transparently archiving documents and document meta data
US20060209333A1 (en) Next-generation facsimile machine of internet terminal type
CN104240047A (zh) 具有报警功能的档案同步存储查阅系统及方法
CN104361013A (zh) 基于云服务器的档案同步存储查阅系统及方法
CN111126952A (zh) 一种电子档案归档处理系统及方法
CN116612484A (zh) 一种档案数字化加工系统
CN111831784A (zh) 一种文件扫描及分类存储的系统及方法
US11436733B2 (en) Image processing apparatus, image processing method and storage medium
US10313538B2 (en) Image forming apparatus and scanning method by image forming apparatus for combining separately scanned documents
JP2006031181A (ja) 画像検索装置、方法、記憶媒体及びプログラム
WO2015174473A1 (en) Information processing system, information processing apparatus and information processing method
JP4766089B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
CN201570029U (zh) 一种基于业务规则库的信息资源收集管理系统
US20110292441A1 (en) Image reading apparatus and setting automation method
JP2004118581A (ja) 不動産業務支援装置、方法及びプログラム
US20220262267A1 (en) System and method for automated generation of study cards
KR20040104821A (ko) 바코드 리더기가 구비된 문서 스캐너를 이용한 문서 자동저장 시스템 및 방법
US8675236B2 (en) Image processing method
JP2016052050A (ja) 文書管理装置、文書管理方法およびプログラム
CN117912043A (zh) 一种纸质财会档案标准数字化管理方法及系统
KR100671984B1 (ko) 인터넷 팩스 전송장치 및 방법
US20130194639A1 (en) Image processing unit for supporting multiple scanners
US20130194615A1 (en) Image scanning and processing system
US20140218771A1 (en) Scanning documents using envelopes as document separators

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination