CN107908745A - 批量文档扫描整理装置、方法、介质及设备 - Google Patents

批量文档扫描整理装置、方法、介质及设备 Download PDF

Info

Publication number
CN107908745A
CN107908745A CN201711138679.0A CN201711138679A CN107908745A CN 107908745 A CN107908745 A CN 107908745A CN 201711138679 A CN201711138679 A CN 201711138679A CN 107908745 A CN107908745 A CN 107908745A
Authority
CN
China
Prior art keywords
document
electronic
template
electronic document
stencil
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711138679.0A
Other languages
English (en)
Inventor
欧阳亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Image Technology (shanghai) Co Ltd
Ricoh Imaging Technology Shanghai Co Ltd
Original Assignee
Ricoh Image Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Image Technology (shanghai) Co Ltd filed Critical Ricoh Image Technology (shanghai) Co Ltd
Priority to CN201711138679.0A priority Critical patent/CN107908745A/zh
Publication of CN107908745A publication Critical patent/CN107908745A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种批量文档扫描整理装置,包括:模板选择单元,用于从预配置的模板库中选取一个电子模板;电子文档生成单元,用于扫描原稿以生成电子文档;归类保存单元,用于根据被选取的电子模板的模板参数来识别电子文档的类别信息,根据类别信息自动创建分类目录,并将电子文档保存于该目录下。此外,本发明还涉及一种批量文档扫描整理方法、介质及设备。本发明通过预置模板自动整理的过程,使批量扫描的文档实现了全自动归档。

Description

批量文档扫描整理装置、方法、介质及设备
技术领域
本发明涉及一种批量文档扫描整理装置、方法、介质及设备。
背景技术
目前,越来越多的机构使用电子文档的方式来对文件进行归档和保存。而随着云服务的使用越来越普及,人们越来越多的使用云存储服务来保存自己的文档,如何方便的,随时随地的进行纸质文档电子化并归档到云端存储也成为随之而来的需求。
一些机构或图书馆购买了云存储服务进行文档的归档保存,有大量文档需要归档保存到云端时,通常都需要对扫描后的电子文档进行手动归类并创建目录,费时费力,也容易出错。此外,如果是批量放置的纸质原稿,扫描后的电子文档或者是单页一个文件,导致一堆零散的文件,不能迅速区分出哪几个文件属于一份,需要人后期手工整理;或者是一批文档扫描后就形成一个大文件,文件包含了多份文档,需要人后期手动分割。同时,即便是整理过的原稿,其中也有可能存在页码乱序,这样扫描出的电子文档也是乱序的,后期需要人工整理。
发明内容
为了解决上述问题,本发明提出了一种批量文档扫描整理装置、方法、介质及设备,以方便快捷地将扫描后的电子文档批量归档到云端。
本申请的第一方面提供了一种批量文档扫描整理装置,包括:模板选择单元,用于从预配置的模板库中选取一个电子模板;电子文档生成单元,用于扫描原稿以生成电子文档;归类保存单元,用于根据被选取的电子模板的模板参数来识别电子文档的类别信息,根据类别信息自动创建分类目录,并将电子文档保存于目录下。
本发明与现有技术相比,通过自动识别提取分类信息,批量扫描的文档实现了全自动归类,而无需像传统方法一样每个文档扫描后再手工归类。
进一步地,前述装置还包括模板创建单元,模板创建单元包括:模板生成单元,用于对模板样张进行扫描,生成电子模板;和模板设置单元,用于设置电子模板的模板参数,并将电子模板保存到模板库中,其中,模板参数包括识别区的坐标、扫描参数和/或识别方式中的任意一种或几种。
进一步地,装置还包括:文档分割单元,文档分割单元被配置为根据被选取的电子模板上的模板参数来识别每份电子文档的首页,并根据首页来按份分割电子文档。
进一步地,识别区包括类别识别区和分割标识识别区;装置进一步包括:文档分割单元,文档分割单元被配置为根据被选取的电子模板上的分割标识识别区的坐标来检测分割标识,以识别每份电子文档的首页,并根据首页来按份分割电子文档;归类保存单元被配置为根据被选取的电子模板上的类别识别区的坐标来识别电子文档的类别信息,根据类别信息自动创建分类目录,并将电子文档保存于目录下。
进一步地,识别区还包括页码识别区;装置进一步包括:排序单元,排序单元被配置为根据被选取的电子模板上的页码识别区的坐标来识别电子文档中的每个页面的页码,根据页码来检测页面顺序是否正确,并将乱序的页面重新排列。
进一步地,模板设置单元进一步包括校验规则设置单元和/或命名规则设置单元;其中,校验规则设置单元用于设置校验规则以便校验电子文档的识别结果;命名规则设置单元用于设置电子文档的命名规则,以便在保存电子文档时,根据命名规则自动为电子文档命名。
本申请的第二方面提供了一种批量文档扫描整理方法,包括:从预配置的模板库中选取一个电子模板,批量扫描原稿以生成电子文档,以及根据被选取的电子模板的模板参数来识别电子文档的类别信息,根据类别信息自动创建分类目录,并将电子文档保存于目录下。
这样,通过模板创建和自动整理的过程,批量扫描的文档实现了全自动归类。
进一步地,电子模板通过以下步骤创建:对模板样张进行扫描,生成电子模板;以及设置电子模板的模板参数,并将电子模板保存到模板库中,其中,模板参数包括识别区的坐标、扫描参数和/或识别方式中的任意一种或几种。
进一步地,该方法还包括:根据被选取的电子模板上的模板参数来识别每份电子文档的首页,以及根据首页来按份分割电子文档。
进一步地,识别区包括类别识别区和分割标识识别区;批量文档扫描整理方法进一步包括:根据被选取的电子模板上的分割标识识别区的坐标来检测分割标识,以识别每份电子文档的首页,并根据首页来按份分割电子文档;以及根据被选取的电子模板上的类别识别区的坐标来检测电子文档的类别信息,根据类别信息自动创建分类目录,并将电子文档保存于目录下。
进一步地,识别区包括页码识别区;批量文档扫描整理方法进一步包括:根据被选取的电子模板上的页码识别区的坐标来识别电子文档中的每个页面的页码,根据页码来检测页面顺序是否正确,以及将乱序的页面重新排列。
进一步地,模板参数中还包括识别结果校验规则和/或命名规则;校验规则用于校验电子文档的识别结果;命名规则用于在保存电子文档时,根据命名规则自动为电子文档命名。
本申请的第三方面提供了一种扫描设备,包括前述第一方面或第一方面的任一实现方式提供的装置。通过将前述装置集成到扫描设备中,用户不需要额外购买PC或移动设备,实现无缝扫描输出和数据自动整理,自动归类,并自动上传云端。
本申请的第四方面提供了一种非易失性存储介质,该非易失性存储介质中存储了程序,该程序被计算设备运行时,计算设备执行前述第二方面或第二方面的任一实现方式提供的方法。
本申请的第五方面提供了一种设备,该设备包括处理器、存储器,处理器与存储器建立通信连接;处理器,用于读取存储器中的程序,以执行前述第二方面或第二方面的任一实现方式提供的方法。
本发明通过自动识别提取页面信息,批量扫描的文档实现了自动整理,自动按份分割,自动修正页码乱序,以及自动归类,本发明一方面提高电子文档的归档效率和准确性,另一方面,该过程基本不需要人工干预,省时省力。
附图说明
图1是根据本发明的一个实施例的批量文档扫描整理装置的结构示意图。
图2是根据本发明的另一实施例的批量文档扫描整理装置的结构示意图。
图3A是根据本发明的实施例的模板创建过程的流程图。
图3B是根据本发明的实施例的批量文档扫描整理方法的流程图。
图4是根据本发明的另一实施例的批量文档扫描整理方法的流程图。
图5是根据本发明的一个实施例的模板创建过程示意图。
图6是根据本发明的一个实施例的按份分割过程示意图。
图7是根据本发明的一个实施例的乱序重排过程示意图。
图8是根据本发明的一个实施例的归类上传过程示意图。
具体实施方式
下面结合具体实施例和附图对本发明做进一步说明。可以理解的是,此处描述的具体实施例仅仅是为了解释本发明,而非对本发明的限定。此外,为了便于描述,附图中仅示出了与本发明相关的部分而非全部的配置或过程。
本发明致力于实现纸质文档电子化、数据整理过程的自动化处理。根据本发明的一个实施例,提供了一种能够与云端进行通信的批量文档扫描整理装置100,其结构如图1所示,包括:模板选择单元101、电子文档生成单元102和归类保存单元103。
其中,模板选择单元101用于从预配置的模板库中选取一个电子模板。电子文档生成单元102可配合扫描装置来使用,批量扫描纸质或其他材质的原稿来生成电子文档。归类保存单元103用于根据被选取的电子模板的模板参数来识别扫描的电子文档的类别信息,根据类别信息自动创建分类目录,并将电子文档保存于该目录下。
这样,该装置通过预先配置的模板,自动识别提取分类信息,使批量扫描的文档自动归类,而无需像传统方法一样扫描后再对每个文档手工归类。
在本实施例中,预配置的模板库可以直接从外部导入,也可以由用户创建。根据本发明的一个实施例,装置100还可以提供供用户创建模板使用的模板创建单元106,如图2所示。该模板创建单元可以进一步包括模板生成单元和模板设置单元,其中,模板生成单元用于对模板样张进行扫描,生成电子模板。模板设置单元用于设置电子模板的模板参数,并将电子模板保存到模板库中,其中,模板参数包括识别区的坐标、扫描参数和/或识别方式中的任意一种或几种。
根据本发明的另一个实施例,如图2所示,装置100还可以进一步包括文档分割单元 104。
在一些被扫描的原稿中,可能只有首页包含模板参数所定义的信息,文档分割单元104 可以在根据模板参数来识别电子文档的类别的同时,识别每份电子文档的首页,并根据首页来按份分割电子文档。例如,以一份专利文件的首页作为模板,设置条形码所在的区域作为识别区,识别方式为条形码识别。那么,在扫描多份专利文件时,根据识别区的条形码来识别该类文件的同时,凡是识别到条形码的文件即为首页,未识别到的即为该份文件的后续页面,由此,可以将多份专利文件区分开来,便于后面按份分别归档。
进一步地,模板设置单元所设置的模板参数中的识别区可以分为类别识别区和分割标识识别区,模板参数中分别包含类别识别区和分割标识识别的坐标以及识别方式等信息。这样,类别识别区的标识可以仅用于识别电子文档的类别,而文档分割识别区的标识则用于识别一份文档的首页。文档分割单元104可以根据分割标识识别区的坐标来检测分割标识,识别每份电子文档的首页,并根据首页来按份分割电子文档,这样,可以将类别的识别与首页的识别区分开来,互不干扰地同步进行。
根据本发明的另一个实施例,如图2所示,装置100还可以进一步包括排序单元105。在该实施例中,模板设置单元所设置的模板参数中的识别区还可以包括页码识别区,在文档分割完成后,排序单元105可以被配置为根据被选取的电子模板上的页码识别区的坐标来在识别每份电子文档中的每个页面的页码,识别方式可以采用光学字符识别(OCR,Optical Character Recognition)方式,根据识别的页码来检测页面顺序是否正确,并将乱序的页面重新排列。
根据本发明的另一实施例,模板设置单元可以进一步包括校验规则设置单元和/或命名规则设置单元;其中,校验规则设置单元用于设置校验规则以便校验电子文档的识别结果;命名规则设置单元用于设置电子文档的命名规则,以便在保存电子文档时,根据命名规则自动为电子文档命名。具体的校验规则和命名规则的设置及应用将在下文详述。
下面介绍利用上述装置进行批量文档扫描整理的方法。
根据本发明的一个实施例,利用图1所示的装置100进行批量文档扫描整理方法的流程如图3A和图3B所示。该方法包括模板创建过程和文档整理过程,其中,图3A示出了模板创建过程的流程图,图3B示出了批量文档整理方法的流程图。
如图3A所示,模板创建过程包括以下步骤:
步骤S201,对模板样张进行扫描,生成电子模板。
步骤S202,设置电子模板的模板参数,其中,模板参数包括识别区的坐标、扫描参数和/或识别方式中的任意一种或几种。
根据本发明的一个实施例,模板参数的具体设置方式可参考图5。扫描完样张后首先划定识别区,在图5所示的实施例中,该装置向用户提供扫描设定用户界面(UI,userinterface),用户可以使用手势划定页面上方的二维码所在区域为识别区。当然,在其他实施例中,也可采用其他方式划定识别区。划定识别区后,装置向用户提供模板参数设置界面,其中模板参数可以包括识别区的坐标、扫描参数和/或识别方式中的任意一种或几种,例如图5中所示的,识别方式为二维码识别,模板参数设置界面包括模板名称、识别区的坐标、扫描参数、颜色、尺寸、页码位置以及校验规则等信息,以供用户按需设置。需要注意的是,以上参数仅仅是举例说明,在一些实施例中,以上参数无需被全部包含在内,在另一些实施例中,各种未在上文或附图中出现是参数也可以被包含其中。
随后,步骤S203,将电子模板保存到模板库,如图5所示。
该模板创建过程的权限可以仅对管理员开放,管理员借助前述的设定UI进行文档模板设定,一次配置,多次使用,普通用户使用时直接选取对应的模板即可。当然,在一些实施例中,也可以不划分管理员与普通用户。
下面介绍电子模板创建完毕后,根据本发明的实施例进行的文档整理的过程,参见图 3B,包括:
步骤S211,在通过前述方式创建的电子模板中选取一个电子模板。
随后,步骤S212,批量扫描原稿以生成电子文档。
随后,步骤S213,根据被选取的电子模板的模板参数来识别电子文档的类别信息。例如,根据模板中的识别区的坐标寻找对应的识别区,并对该识别区以预先设置的模板参数中指定的方式,例如二维码、条形码或OCR等,提取分类信息,识别该电子文档是否是该模板对应的类别。
随后,步骤S214,扫描及识别过程完成后,在文档上传到在云端时,装置100可以根据识别的分别信息,自动在云端创建分类目录,并将电子文档保存于目录下。具体过程可参考图8。在图8所示的实例中,从包含专利模板和报关单模板的模板库中选择模板,并批量扫描原稿,通过识别区的二维码识别得到的分类信息为F01B,则自动在云端目录下创建新的目录F01B,并将该批电子文档上传至该F01B的目录下。
这样,通过模板创建和自动整理的过程,批量扫描的文档实现了全自动归档。
根据本发明的另一实施例,提供另一种利用图1所示的装置100进行批量文档扫描整理方法的流程,其中,模板创建过程与前一实施例类似,只是设置的模板参数与前一实施例略有不同,将在下文进行说明;而模板创建后的文档整理过程如图4所示。
模板创建后,首先,在已创建的电子模板中选取一个电子模板,随后批量扫描原稿以生成电子文档,如图4中的步骤S311-S312所示,其与图3B中的步骤S211-S212相同,此处不再赘述。
随后,步骤S313,利用被选择的模板中的模板参数来识别页面特征,例如,包括:类别信息、分割标识、页码等信息。相应地,这些信息应当在模板创建阶段被设置在模板参数中。
随后,步骤S314,判断此次扫描是否完成,如果没有完成,则返回步骤S312,继续扫描,如果扫描完成,则进入步骤S315,利用文档分割单元进行按份分割处理。对电子文件进行按份分割处理的实例如图6所示。
在图6所示的实例中,扫描3份每份3页的原稿得到9个电子文件,从第一份的第一页B1P1,第一份的第二页B1P2,……,一直到第三份的第三页B3P3。利用每份原稿的首页顶部的二维码作为分割标识,文档分割单元通过检测该分割标识确定每份原稿的首页 B1P1、B2P1和B3P1,并将每个包含分割标识的文件与随后的两个不包含分割标识的文件合并为一份,最终得到三份文件。
随后,步骤S316,检测页码顺序并对乱序的文档重新排序,具体过程如图7所示。首先,扫描得到电子文档后,根据被选取的电子模板上的页码识别区的坐标来在识别每份电子文档中的每个页面的页码,并根据页码来检测页面顺序是否正确,如果检测到乱序问题,例如图7所示的第三页P3和第五页P5的顺序放错,则将P3和P5交换顺序,得到从P1 到P5的正确顺序的文档。
随后,步骤S317,识别并提取类别信息,并根据类别信息自动创建分类目录F01B,将电子文档保存于目录F01B下,如图8所示。
可选择地,此处分类信息的识别与前文中分割标识的识别,二者可以用同一标识来识别,也可以通过划分不同识别区域从而用不同标识来识别。
可选择地,在该实施例中,在模板创建过程中,模板参数中还可以包括命名规则,该命名规则用于在保存电子文档时,根据命名规则自动为电子文档命名,例如图8所示的实施例中,设置命名规则为“分类信息_扫描时间+序号”的形式,则扫描得到的电子文档在保存时即以该方式自动命名为“F01B_20170830153050”。
可选择地,在该实施例中,在模板创建过程中,设置的模板参数中还可以包括识别结果校验规则,例如图5所示的实施例中,设置了内容长度和内容规则作为校验规则,那么,识别完成后,可以依据模板参数中预先配置的校验规则验证识别结果的正确性,以实现自动识别,自动校验。
根据本发明的前述实施例,通过自动识别提取页面信息,批量扫描的文档实现了自动整理,自动按份分割,自动修正页码乱序以及自动归类,实现了扫描文件的方便快捷归档,提高电子文档的归档准确性。
根据本发明的另一个实施例,还提供了一种设备,包括处理器和存储器,处理器和存储器建立通信连接,处理器,用于读取存储器中的程序,以执行图3-8中所示的批量文档扫描整理方法。
根据本发明的另一个实施例,还提供了一种扫描设备,该设备包括前述的装置。通过扫描设备中的嵌入式程序实现该系统,则用户不需要额外购买PC或移动设备,实现无缝扫描输出和数据自动整理,自动归类,并自动上传云端。
根据本发明的另一个实施例,还提供了一种非易失性存储介质,非易失性存储介质中存储了程序,该程序被计算设备运行时,计算设备执行图3-8中所示的批量文档扫描整理方法。
上面结合附图对本发明的实施例做了详细说明,但本发明技术方案的使用不仅仅局限于本专利实施例中提及的各种应用,各种结构和变型都可以参考本发明技术方案轻易地实施,以达到本文中提及的各种有益效果。在本领域普通技术人员所具备的知识范围内,在不脱离本发明宗旨的前提下做出的各种变化,均应归属于本发明专利涵盖范围。

Claims (15)

1.一种批量文档扫描整理装置,其特征在于,包括:
模板选择单元,用于从预配置的模板库中选取一个电子模板;
电子文档生成单元,用于扫描原稿以生成电子文档;
归类保存单元,用于根据被选取的电子模板的模板参数来识别所述电子文档的类别信息,根据所述类别信息自动创建分类目录,并将所述电子文档保存于所述目录下。
2.根据权利要求1所述的装置,其特征在于,还包括模板创建单元,所述模板创建单元包括:
模板生成单元,用于对模板样张进行扫描,生成电子模板;和
模板设置单元,用于设置所述电子模板的模板参数,并将所述电子模板保存到模板库中,其中,所述模板参数包括识别区的坐标、扫描参数和/或识别方式中的任意一种或几种。
3.根据权利要求2所述的装置,其特征在于,所述装置还包括:
文档分割单元,所述文档分割单元被配置为根据所述被选取的电子模板上的所述模板参数来识别每份电子文档的首页,并根据所述首页来按份分割所述电子文档。
4.根据权利要求2所述的装置,其特征在于,所述识别区包括类别识别区和分割标识识别区;
所述装置进一步包括:文档分割单元,所述文档分割单元被配置为根据所述被选取的电子模板上的所述分割标识识别区的坐标来检测分割标识,以识别每份电子文档的首页,并根据所述首页来按份分割所述电子文档;
所述归类保存单元被配置为根据所述被选取的电子模板上的所述类别识别区的坐标来识别所述电子文档的类别信息,根据所述类别信息自动创建分类目录,并将所述电子文档保存于所述目录下。
5.根据权利要求3或4所述的装置,其特征在于,所述识别区还包括页码识别区;所述装置进一步包括:
排序单元,所述排序单元被配置为根据所述被选取的电子模板上的所述页码识别区的坐标来识别电子文档中的每个页面的页码,根据所述页码来检测页面顺序是否正确,并将乱序的页面重新排列。
6.根据权利要求2所述的装置,其特征在于,所述模板设置单元进一步包括校验规则设置单元和/或命名规则设置单元;其中,
所述校验规则设置单元用于设置校验规则以便校验所述电子文档的识别结果;
所述命名规则设置单元用于设置所述电子文档的命名规则,以便在保存所述电子文档时,根据所述命名规则自动为所述电子文档命名。
7.一种批量文档扫描整理方法,其特征在于,包括:
从预配置的模板库中选取一个电子模板,
批量扫描原稿以生成电子文档,以及
根据被选取的电子模板的模板参数来识别所述电子文档的类别信息,根据所述类别信息自动创建分类目录,并将所述电子文档保存于所述目录下。
8.根据权利要求7所述的批量文档扫描整理方法,其特征在于,所述电子模板通过以下步骤创建:
对模板样张进行扫描,生成电子模板;以及
设置所述电子模板的模板参数,并将所述电子模板保存到模板库中,其中,所述模板参数包括识别区的坐标、扫描参数和/或识别方式中的任意一种或几种。
9.根据权利要求8所述的批量文档扫描整理方法,其特征在于,还包括:
根据所述被选取的电子模板上的所述模板参数来识别每份电子文档的首页,以及
根据所述首页来按份分割所述电子文档。
10.根据权利要求8所述的批量文档扫描整理方法,其特征在于,所述识别区包括类别识别区和分割标识识别区;
所述批量文档扫描整理方法进一步包括:
根据所述被选取的电子模板上的所述分割标识识别区的坐标来检测分割标识,以识别每份电子文档的首页,并根据所述首页来按份分割所述电子文档;以及
根据所述被选取的电子模板上的所述类别识别区的坐标来检测电子文档的类别信息,根据所述类别信息自动创建分类目录,并将所述电子文档保存于所述目录下。
11.根据权利要求9或10所述的批量文档扫描整理方法,其特征在于,所述识别区包括页码识别区;所述批量文档扫描整理方法进一步包括:
根据所述被选取的电子模板上的所述页码识别区的坐标来识别电子文档中的每个页面的页码,
根据所述页码来检测页面顺序是否正确,以及
将乱序的页面重新排列。
12.根据权利要求8所述的批量文档扫描整理方法,其特征在于,所述模板参数中还包括识别结果校验规则和/或命名规则;
所述校验规则用于校验所述电子文档的识别结果;
所述命名规则用于在保存所述电子文档时,根据命名规则自动为所述电子文档命名。
13.一种扫描设备,其特征在于,包括如权利要求1-6中任意一项所述的装置。
14.一种非易失性存储介质,其特征在于,所述非易失性存储介质中存储了程序,该程序被计算设备运行时,所述计算设备执行如权利要求7-12中任一项所述的方法。
15.一种设备,包括处理器和存储器,其特征在于,所述处理器与所述存储器建立通信连接;
所述处理器,用于读取存储器中的程序,以执行如权利要求7-12中任意一项所述的方法。
CN201711138679.0A 2017-11-16 2017-11-16 批量文档扫描整理装置、方法、介质及设备 Pending CN107908745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711138679.0A CN107908745A (zh) 2017-11-16 2017-11-16 批量文档扫描整理装置、方法、介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711138679.0A CN107908745A (zh) 2017-11-16 2017-11-16 批量文档扫描整理装置、方法、介质及设备

Publications (1)

Publication Number Publication Date
CN107908745A true CN107908745A (zh) 2018-04-13

Family

ID=61845751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711138679.0A Pending CN107908745A (zh) 2017-11-16 2017-11-16 批量文档扫描整理装置、方法、介质及设备

Country Status (1)

Country Link
CN (1) CN107908745A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109558491A (zh) * 2018-12-07 2019-04-02 用友网络科技股份有限公司 批量数据采集方法、计算机设备和计算机可读存储介质
CN109600428A (zh) * 2018-11-27 2019-04-09 深圳市关运通科技有限公司 一种自动化上传附件并匹配关联的方法和装置
CN109658062A (zh) * 2018-12-13 2019-04-19 广州华资软件技术有限公司 一种基于深度学习的电子档案智能处理方法
CN110942054A (zh) * 2019-12-30 2020-03-31 福建天晴数码有限公司 页面内容识别方法
CN110955784A (zh) * 2018-09-26 2020-04-03 北京国双科技有限公司 电子文书处理方法及装置
CN111079511A (zh) * 2019-10-25 2020-04-28 湖北富瑞尔科技有限公司 基于深度学习的文档自动归类及光学字符识别方法及系统
CN111079677A (zh) * 2019-12-23 2020-04-28 深圳市金政软件技术有限公司 一种电子扫描件的识别与绑定方法及系统
CN111353611A (zh) * 2018-12-20 2020-06-30 核动力运行研究所 一种核电站在役检查大修检验报告自动生成系统及方法
CN111814799A (zh) * 2020-07-21 2020-10-23 北京来也网络科技有限公司 结合rpa和ai的影像归位方法及装置、计算设备、存储介质
CN111831784A (zh) * 2020-07-15 2020-10-27 安徽泰元智能科技有限公司 一种文件扫描及分类存储的系统及方法
CN112115288A (zh) * 2020-09-22 2020-12-22 四川大学 基于二维码的图片的自动整理方法及其系统
CN112199330A (zh) * 2020-09-29 2021-01-08 广东电网有限责任公司韶关供电局 一种混合文档归档方法、归档装置及存储介质
CN112527947A (zh) * 2019-09-19 2021-03-19 北京国双科技有限公司 一种电子文书的归档方法及装置
CN112540965A (zh) * 2020-12-07 2021-03-23 湖北航天信息技术有限公司 一种纸质合同管理方法
CN112733658A (zh) * 2020-12-31 2021-04-30 北京华宇信息技术有限公司 电子文档归档方法及其装置
CN112785464A (zh) * 2021-04-09 2021-05-11 共道网络科技有限公司 一种诉讼文件的整理方法和装置
CN112818653A (zh) * 2021-02-03 2021-05-18 上海虹迪物流科技有限公司 表单存档方法和装置以及仓库管理系统
CN112911003A (zh) * 2021-02-03 2021-06-04 广州市高奈特网络科技有限公司 电子数据提取方法、计算机设备和存储介质
CN113919312A (zh) * 2021-12-13 2022-01-11 北京交研智慧科技有限公司 电子文书模板的生成方法和相关设备
CN114359533A (zh) * 2021-11-18 2022-04-15 珠海读书郎软件科技有限公司 一种基于页面文本的页码识别方法和计算机设备
EP4064228A1 (en) * 2021-03-24 2022-09-28 FUJIFILM Business Innovation Corp. Information processing apparatus, information processing system, information processing program, and information processing method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1867030A (zh) * 2005-05-20 2006-11-22 三星电子株式会社 以预定次序打印扫描文档的成像设备及其方法
US7362455B2 (en) * 2002-12-19 2008-04-22 Hewlett-Packard Development Company, L.P. Processing scanned pages
CN101227542A (zh) * 2007-01-18 2008-07-23 富士施乐株式会社 图像处理系统、图像处理方法及计算机可读介质
CN104346385A (zh) * 2013-07-31 2015-02-11 株式会社理光 云端服务器以及图像存储系统
CN104636700A (zh) * 2013-11-15 2015-05-20 株式会社理光 文档图像管理装置以及文档图像管理系统
CN105335395A (zh) * 2014-07-14 2016-02-17 株式会社理光 文档图像管理装置以及文档图像管理系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7362455B2 (en) * 2002-12-19 2008-04-22 Hewlett-Packard Development Company, L.P. Processing scanned pages
CN1867030A (zh) * 2005-05-20 2006-11-22 三星电子株式会社 以预定次序打印扫描文档的成像设备及其方法
CN101227542A (zh) * 2007-01-18 2008-07-23 富士施乐株式会社 图像处理系统、图像处理方法及计算机可读介质
CN104346385A (zh) * 2013-07-31 2015-02-11 株式会社理光 云端服务器以及图像存储系统
CN104636700A (zh) * 2013-11-15 2015-05-20 株式会社理光 文档图像管理装置以及文档图像管理系统
CN105335395A (zh) * 2014-07-14 2016-02-17 株式会社理光 文档图像管理装置以及文档图像管理系统

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110955784A (zh) * 2018-09-26 2020-04-03 北京国双科技有限公司 电子文书处理方法及装置
CN110955784B (zh) * 2018-09-26 2023-04-07 北京国双科技有限公司 电子文书处理方法及装置
CN109600428A (zh) * 2018-11-27 2019-04-09 深圳市关运通科技有限公司 一种自动化上传附件并匹配关联的方法和装置
CN109600428B (zh) * 2018-11-27 2022-05-27 深圳市关运通科技有限公司 一种自动化上传附件并匹配关联的方法和装置
CN109558491A (zh) * 2018-12-07 2019-04-02 用友网络科技股份有限公司 批量数据采集方法、计算机设备和计算机可读存储介质
CN109658062A (zh) * 2018-12-13 2019-04-19 广州华资软件技术有限公司 一种基于深度学习的电子档案智能处理方法
CN111353611B (zh) * 2018-12-20 2023-05-26 核动力运行研究所 一种核电站在役检查大修检验报告自动生成系统及方法
CN111353611A (zh) * 2018-12-20 2020-06-30 核动力运行研究所 一种核电站在役检查大修检验报告自动生成系统及方法
CN112527947A (zh) * 2019-09-19 2021-03-19 北京国双科技有限公司 一种电子文书的归档方法及装置
CN111079511A (zh) * 2019-10-25 2020-04-28 湖北富瑞尔科技有限公司 基于深度学习的文档自动归类及光学字符识别方法及系统
CN111079677A (zh) * 2019-12-23 2020-04-28 深圳市金政软件技术有限公司 一种电子扫描件的识别与绑定方法及系统
CN110942054A (zh) * 2019-12-30 2020-03-31 福建天晴数码有限公司 页面内容识别方法
CN111831784A (zh) * 2020-07-15 2020-10-27 安徽泰元智能科技有限公司 一种文件扫描及分类存储的系统及方法
CN111814799B (zh) * 2020-07-21 2024-05-14 北京来也网络科技有限公司 结合rpa和ai的影像归位方法及装置、计算设备、存储介质
CN111814799A (zh) * 2020-07-21 2020-10-23 北京来也网络科技有限公司 结合rpa和ai的影像归位方法及装置、计算设备、存储介质
CN112115288A (zh) * 2020-09-22 2020-12-22 四川大学 基于二维码的图片的自动整理方法及其系统
CN112199330A (zh) * 2020-09-29 2021-01-08 广东电网有限责任公司韶关供电局 一种混合文档归档方法、归档装置及存储介质
CN112540965A (zh) * 2020-12-07 2021-03-23 湖北航天信息技术有限公司 一种纸质合同管理方法
CN112733658A (zh) * 2020-12-31 2021-04-30 北京华宇信息技术有限公司 电子文档归档方法及其装置
CN112911003A (zh) * 2021-02-03 2021-06-04 广州市高奈特网络科技有限公司 电子数据提取方法、计算机设备和存储介质
CN112818653A (zh) * 2021-02-03 2021-05-18 上海虹迪物流科技有限公司 表单存档方法和装置以及仓库管理系统
EP4064228A1 (en) * 2021-03-24 2022-09-28 FUJIFILM Business Innovation Corp. Information processing apparatus, information processing system, information processing program, and information processing method
CN112785464B (zh) * 2021-04-09 2021-07-20 共道网络科技有限公司 一种诉讼文件的整理方法和装置
CN112785464A (zh) * 2021-04-09 2021-05-11 共道网络科技有限公司 一种诉讼文件的整理方法和装置
CN114359533A (zh) * 2021-11-18 2022-04-15 珠海读书郎软件科技有限公司 一种基于页面文本的页码识别方法和计算机设备
CN113919312A (zh) * 2021-12-13 2022-01-11 北京交研智慧科技有限公司 电子文书模板的生成方法和相关设备

Similar Documents

Publication Publication Date Title
CN107908745A (zh) 批量文档扫描整理装置、方法、介质及设备
US20210192202A1 (en) Recognizing text in image data
Kaspar et al. Self tuning texture optimization
Shahab et al. An open approach towards the benchmarking of table structure recognition systems
US8086039B2 (en) Fine-grained visual document fingerprinting for accurate document comparison and retrieval
CN110688349B (zh) 一种文档整理方法、装置、终端及计算机可读存储介质
US9591169B2 (en) Image processing apparatus and program
CN109543501A (zh) 图像处理装置、图像处理方法和存储介质
CN110097059B (zh) 基于生成对抗网络的文档图像二值化方法、系统、装置
CN109344740A (zh) 人脸识别系统、方法及计算机可读存储介质
CN103871044B (zh) 一种图像签名生成方法和图像验证方法及装置
CN106846961A (zh) 电子试卷的处理方法和装置
US9854121B2 (en) Image processing apparatus for generating a digitized document by using image data and method for controlling the same
CN105022984A (zh) 指纹采集方法、指纹比对方法、指纹识别装置和系统
CN113780229A (zh) 文本识别方法及装置
CN107679442A (zh) 单证信息录入的方法、装置、计算机设备及存储介质
CN109190611A (zh) 一种基于众包的互联网编修家谱系统
EP3430567A1 (en) Optical character recognition utilizing hashed templates
CN107704520B (zh) 基于人脸识别的多文件检索方法和装置
CN104408403B (zh) 一种二次录入不一致的仲裁方法及装置
US9898236B2 (en) Image processing apparatus and program for printing template images using keyword data
CN109388935A (zh) 单证验证方法及装置、电子设备及可读存储介质
KR102328034B1 (ko) 표가 삽입된 이미지로부터 지식 데이터베이스의 구축이 가능한 데이터베이스 구축 장치 및 그 동작 방법
CN110390081A (zh) 文档比对方法、装置及设备
JP2016018454A (ja) 画像処理装置および画像処理装置の制御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180413