CN110399334A - 对纸质文档进行排序的方法和系统 - Google Patents

对纸质文档进行排序的方法和系统 Download PDF

Info

Publication number
CN110399334A
CN110399334A CN201810362465.XA CN201810362465A CN110399334A CN 110399334 A CN110399334 A CN 110399334A CN 201810362465 A CN201810362465 A CN 201810362465A CN 110399334 A CN110399334 A CN 110399334A
Authority
CN
China
Prior art keywords
paper document
image data
equipment
sequencing
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810362465.XA
Other languages
English (en)
Inventor
刘松涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tai Zhang Mechanical And Electrical Equipment Co Ltd
Original Assignee
Beijing Tai Zhang Mechanical And Electrical Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tai Zhang Mechanical And Electrical Equipment Co Ltd filed Critical Beijing Tai Zhang Mechanical And Electrical Equipment Co Ltd
Priority to CN201810362465.XA priority Critical patent/CN110399334A/zh
Publication of CN110399334A publication Critical patent/CN110399334A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Abstract

本发明提供了一种对纸质文档进行排序的方法,该方法包括:输入乱序排列的多个纸质文档;分别或依次识别每一所述纸质文档的内容、介质或设置于其上的识别标识,并根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系;获得所述图像数据的排序信息;排序设备根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序,并输出排序后的所述多个纸质文档。相应地,本发明还提供了一种对纸质文档进行排序的系统。实施本发明可以提升纸质文档排序的准确度和效率,并进一步提升纸质文档排序时策略制定的灵活性。

Description

对纸质文档进行排序的方法和系统
技术领域
本发明涉及办公自动化技术和纸张识别排序领域,尤其涉及一种对纸质文档进行排序的方法和系统。
背景技术
在现有的办公场景中,除了将纸质文档进行电子扫描归档,人们还常常面临要将乱序的纸质文档进行排序整理的问题,尤其是需要将大量一系列不同的纸质文档装订为标准化卷宗的应用场景中,以法院存档的原始材料卷宗为例,一个标准的原始材料卷宗包括了产生于不同来源、不同时期、携带了不同内容的各种原始文书材料,现有的做法通常是依赖于人工对其进行分类、排序整理,但对于大批量纸质文档而言,人工排序存在如下缺陷:一方面,由于人为误差导致排序标准化程度低,若引入人工排序复核机制则需要投入更多的人力;另一方面,人工排序的处理效率受操作员的经验水平影响较大,排序效率难以有效提升。此外,对于纸质文档还存在对应的电子扫描件的情况下,人工排序不但要对纸质文档进行排序,还需要根据纸质文档的顺序调整电子扫描件的顺序,这又进一步增加了排序所需耗费的时间。上述种种缺陷,不利于纸质文档的办公自动化标准流程的建立,也不利于提升整理纸质文档顺序的处理效率。
发明内容
为了克服现有技术中的上述缺陷,本发明提供了一种对纸质文档进行排序的方法,该方法包括:
输入乱序排列的多个纸质文档;
分别或依次识别每一所述纸质文档的内容、介质或设置于其上的识别标识,并根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系;
获得所述图像数据的排序信息;
排序设备根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序,并输出排序后的所述多个纸质文档。
根据本发明的一个方面,该方法中根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系包括:解析所述纸质文档的内容、介质或识别标识携带的信息以获得文件ID;查找并确定所述文件ID对应的图像数据,将所述文件ID与所述图像数据建立对应映射。
根据本发明的另一个方面,该方法中所述识别标识包括二维码、条形码或无线射频标签;所述二维码和条形码通过打印或印刷的方式设置在所述纸质文档上;所述无线射频标签通过粘贴的方式设置在所述纸质文档上。
根据本发明的另一个方面,该方法中排序设备根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序包括:所述排序设备根据所述映射关系和所述排序信息分别计算出每一所述纸质文档的物理空间位置;所述排序设备包括的机械传送结构将所述纸质文档传送至所述物理空间位置。
根据本发明的另一个方面,该方法中所述排序信息通过预定的计算机策略生成;或所述排序信息通过人工操作计算机图形化界面而生成。
根据本发明的另一个方面,该方法中所述排序信息通过预定的计算机策略生成包括:利用深度学习网络对所述图像数据进行识别,以判断出该图像数据的类型和/或顺序;根据所述图像数据的类型和/或顺序确定其在标准电子卷宗顺序中的位置,以生成所述排序信息。
相应地,本发明还提供了一种对纸质文档进行排序的系统,该系统包括第一承载设备、存储介质、识别设备、排序设备和第二承载设备,其中:
所述第一承载设备,用于放置并承载乱序排列的多个纸质文档;
所述识别设备,用于分别或依次识别每一所述纸质文档的内容、介质或设置于其上的识别标识,并根据所述识别确定所述纸质文档与所述存储介质中的图像数据的映射关系;
所述排序设备,用于获得所述图像数据的排序信息,并根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序,并输出排序后的所述多个纸质文档;
所述第二承载设备,用于放置并承载所述排序后的所述多个纸质文档;
所述存储介质,用于存储所述图像数据、所述映射关系、所述排序信息中任一或其组合。
根据本发明的一个方面,该系统中根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系包括:所述识别设备解析所述内容、介质或识别标识携带的信息以获得文件ID;所述识别设备查找并确定所述文件ID对应的图像数据,将所述文件ID与所述图像数据建立对应映射。
根据本发明的另一个方面,所述系统中所述识别标识包括二维码、条形码或无线射频标签;所述二维码和条形码通过打印或印刷的方式设置在所述纸质文档上;所述无线射频标签通过粘贴的方式设置在所述纸质文档上。
根据本发明的另一个方面,所述系统中排序设备包括计算主机和机械传送结构;所述计算主机,用于根据所述映射关系和所述排序信息分别计算出每一所述纸质文档的物理空间位置;所述机械传送结构受所述计算主机控制,用于将所述纸质文档传送至所述物理空间位置。
根据本发明的另一个方面,所述系统中所述排序信息通过预定的计算机策略生成;或所述排序信息通过人工操作计算机图形化界面而生成。
根据本发明的另一个方面,所述系统中所述排序信息通过预定的计算机策略生成包括:利用深度学习网络对所述图像数据进行识别,以判断出该图像数据的类型和/或顺序;根据所述图像数据的类型和/或顺序确定其在标准电子卷宗顺序中的位置,以生成而所述排序信息。
进一步地,一个或多个存储计算机可执行指令的计算机可读介质,所述指令在由一个或多个计算机设备使用时使得一个或多个计算机设备执行如前文所述的对纸质文档进行排序的方法。。
本发明提供的对纸质文档排序的方法和系统,通过识别纸质文档上的识别标识以确定纸质文档的身份标识,将纸质文档和图像数据建立映射联系,实现了根据图像数据的排序信息对纸质文档啊进行重新排序,并自动输出排序结果。其带来的优点有:第一,提升了文档排序的准确度和效率;第二,可以根据图像数据的排序信息直接对与其相关的纸质文档进行排序,简化了现有场景中纸质文档排序的步骤,进一步提升了排序效率;第三,调整图像数据的排序信息即可实现对纸质文档进行重新排序,而无需更新纸质文档上的识别标识,增强了排序策略的适用性和灵活性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是根据本发明的对纸质文档进行排序的方法的一个具体实施方式的流程图;
图2是图1中示出的步骤S200的一个具体实施方式的详细流程图;
图3是图2中示出的步骤S400的一个具体实施方式的详细流程图;
图4是根据本发明提供的对纸质文档进行排序的系统的一个具体实施方式的结构示意图;
图5是用于执行根据本发明的文档图像的识别方法的一个具体实施方式的计算机设备的结构示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
为了更好地理解和阐释本发明,下面将结合附图对本发明作进一步的详细描述。本发明并不仅仅局限于这些具体实施方式。相反,对本发明进行的修改或者等同替换,均应涵盖在本发明的权利要求范围当中。
需要说明的是,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有这些具体细节,本发明同样可以实施。在下文给出的多个具体实施方式中,对于本领域熟知的结构和部件未作详细描述,以便于凸显本发明的主旨。
本发明提供了一种文档图像的识别方法,请参考图1,图1是根据本发明的对纸质文档进行排序的方法的一个具体实施方式的流程图,该方法包括:
步骤S100,输入乱序排列的多个纸质文档;
步骤S200,分别或依次识别每一所述纸质文档的内容、介质或设置于其上的识别标识,并根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系;
步骤S300,获得所述图像数据的排序信息;
步骤S400,排序设备根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序,并输出排序后的所述多个纸质文档。
具体地,在步骤S100中所输入的乱序排列的多个纸质文档可能由不同时期产生的一系列纸质文档构成,典型地,以人民法院对一个民事案件在不同阶段处理归档的纸质文档为例,上述多个纸质文档内可能包含了诉状、立案通知书、询问笔录、调查笔录、调解笔录、委托书、传票、开庭公告、审判笔录、案情报告、判决书、宣判笔录等不同类型的纸质材料。所述纸质文档可以是上述纸质材料中的一页,也可以是上述纸质材料中的多页装订在一起形成的多页文档。优选地,为了统一纸质材料的规格以降低排序处理的难度,上述纸质文档的尺寸可以设计为符合国际标准纸张的尺寸,例如A4纸的尺寸。步骤S100中的术语“乱序排列”一方面指的是上述多个纸质文档在输入时使用随机顺序输入;另一方面指的是上述多个纸质文档堆叠在一起预准备输入时的堆叠顺序随机。
在步骤S200中,分别或依次识别每一所述纸质文档的内容、介质或设置于其上的识别标识,具体地,由于存在多个所述纸质文档,对多个所述纸质文档的内容、介质或设置于其上的识别标识进行识别的步骤可以依次执行或并行执行。也即,既可以利用多个识别设备并行地对多个所述纸质文档进行识别,以达到分别识别每一所述纸质文档的内容、介质或设置于其上的识别标识的目的,也可以利用单个识别设备依次对多个所述纸质文档进行识别,以达到依次识别设置在每一所述纸质文档的内容、介质或设置于其上的识别标识这一目的。
进一步地,执行步骤S200中,根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系这一步骤的目的是使当前所识别的纸质文档与所述存储介质中的所述图像数据建立对应关系,以便于在后续步骤中根据所述图像数据关联的排序信息对多个所述纸质文档进行排序。典型地,请参考图2,图2是图1中示出的步骤S200的一个具体实施方式的详细流程图,步骤S200中的根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系具体包括如下步骤:
步骤S201,解析所述内容、介质或识别标识携带的信息以获得文件ID;
步骤S202,查找并确定所述文件ID对应的图像数据,将所述文件ID与所述图像数据建立对应映射。
具体地,在步骤S201中通过解析所述内容、介质或识别标识所携带的信息以获得所述文件ID,所述文件ID例如是由数字、字母、符号中任一或组合构成的字符串,用于标识出该识别标志所对应的纸质文档的身份。进一步地,在步骤S202,可用所述文件ID为依据查找并确定与该文件ID对应的图像数据,再将所述文件ID与所述图像数据建立对应映射,建立该对应映射的目的是便于后续步骤中将文件ID与图像数据的排序信息对应起来执行排序。
所述内容,指的是纸质文档本身记录的文字、图片、表格等媒介信息,也即纸质文档上的原生内容。在步骤S201中解析所述内容的方法通常是获得所述纸质文档的实时图像,使用预定的识别模型通过对所述实时图像进行进一步分析获得该实时图像的特征,并可根据所述特征判断出所述实时图像是何种类型的图像,进而判断出所述纸质文档是何种类型的文档以确定其文件ID。所述识别模型可以预先通过样本数据进行训练,以保证判断的准确性和效率。
所述介质,指的是所述纸质文档本身所具有的原生的量化属性值,该量化属性值用作携带可被识别的媒体信息的载体,所述量化属性值例如包括:形成在纸质文档的文字中的隐含编码、纸质文档上文字的字体字号、纸质文档的重量或尺寸、纸质文档的版面格式、纸质文档的上下文关系等。在步骤S201解析所述介质的方法通常是使用合适的传感器获得所述量化属性值,并进一步通过预定的识别模型对所述量化属性值进行解析判断以获得所述文件ID。
本领域技术人员可以理解,所述内容和所述介质均是所述纸质文档在形成时被同时创建的原生媒介信息,伴随所述纸质文档的产生而随之产生。
由于识别所述内容或介质对计算机处理算法有较高的要求,因此步骤S201中也考虑解析额外附加在所述纸质文档上的识别标识来得到所述文件ID。不同于所述内容和所述介质这些纸质文档的原生媒介信息,所述识别标识是特意根据需求设置在所述纸质文档之上的。本具体实施方式中,要求纸质文档上的识别标志与纸质文档具有唯一对应关系,典型地,所述识别标识包括二维码、条形码或无线射频标签,所述二维码和条形码可以通过印刷的方式设置在所述纸质文档上,所述无线射频标签通过可以粘贴的方式设置在所述纸质文档上。相应地,读取识别所述二维码和条形码的方式可以使用光学识别,读取识别所述无线射频标签的方式可以使用近场无线通信的方式。
将识别标识实施为设置在所述纸质文档上的方式,无论是打印或印刷形成上述二维码或条形码,还是粘贴所述无线射频标签,均是用平面化的方式在纸质文档的纸面上形成,其优点为:实施成本低,且不影响所述纸质文档的阅读和保存。在识别过程中,上述识别标识的识别效率相较于现有的OCR(光学字符识别)技术有显著提升,对于识别处理设备的计算负载要求更低。
优选地,可以考虑使用隐形油墨在在所述纸质文档上打印或印刷形成所述二维码或条形码,使用隐形油墨的优点进一步包括:不会遮挡纸质文档的内容,因此且印刷位置可自由定义,使得识别标识在纸质文档上的布局方式更为灵活。
在步骤S300中,获得所述图像数据的排序信息,本领域技术人员可以理解,所述排序信息可预先在生成所述图像数据之后进行定义,只要在步骤S300执行前保证已定义所述排序信息即可。
在步骤S400中,排序设备根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序,并输出排序后的所述多个纸质文档。具体地,所述排序设备根据所述映射关系确定当前所需排序的纸质文档的身份,并根据所述排序信息对所述纸质文档进行排序处理,最终输出排序后的所述多个纸质文档。其中,排序设备对所述纸质文档进行排序处理的过程可以用多种传送纸件的解决方案来实现,例如使用一组传动辊将所述纸质文档进行传送流转。更典型地,请参考图3,图3是图2中示出的步骤S400的一个具体实施方式的详细流程图,步骤S400中排序设备根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序包括:
步骤S401,所述排序设备根据所述映射关系和所述排序信息分别计算出每一所述纸质文档的物理空间位置;
步骤S402,所述排序设备包括的机械传送结构将所述纸质文档传送至所述物理空间位置。
具体地,在步骤S401中,所述排序设备中应具备合适的处理器和存储器,用于对所述映射关系和所述排序信息进行存储和计算,并根据预设的规则计算出每一所述纸质文档应传送至的物理空间位置。接下来在步骤S402中,所述排序设备包括的机械传送结构将所述纸质文档传送至所述物理空间位置,所述机械传送结构包括但不限于前文所述的一组传送辊,还可以包括合适的皮带、电机等,本申请并不对所述机械传送结构进行具体限定。
步骤S400中输出排序后的多个纸质文档,其典型方法是将处于不同所述物理空间位置的纸质文档组合为合适的文档堆叠后输出。
本领域技术人员可以理解,执行步骤400是使用机械自动化处理的方式替代了传统纸质文档排序中人工取纸、人工排序等操作步骤,以提升纸质文档排序的效率。执行步骤S400所需的映射关系和排序信息这两种数据分别在步骤S200和步骤S300中得到。
具体地,前文中已经阐述所述映射关系是所述文件ID与所述图像数据所建立的对应映射,用于标识出所述纸质文档的身份,并标识出所述纸质文档对应的所述图像数据。所述排序信息用于指定某一所述图像数据在多个所述图像数据构成序列中的排列位置,也即可以对应至某一所述纸质文档在多个所述纸质文档构成的堆叠中的排列位置。所述排序信息可以是计算机为所述图像数据所指定的,例如所述排序信息通过预定的计算机策略生成;所述排序信息也可以是人工操作计算机图形化界面而生成,例如用户在包含了多个所述图像数据的摘要信息的web界面中进行人工排序而生成。典型地,所述排序信息通过预定的计算机策略生成的具体方法包括:利用深度学习网络对所述图像数据进行识别,以判断出该图像数据的类型和/或顺序;根据所述图像数据的类型和/或顺序确定其在标准电子卷宗顺序中的位置,以生成所述排序信息。
本领域技术人员可以理解,由于本具体实施方式中排序设备仅通过识别所述纸质文档上的识别标识即可实现后续的自动排序,而所述识别标志仅是用于标识出所述纸质文档的身份及其对应的图像数据,因此即使对所述排序信息进行调整或更新,所述纸质文档上的识别标识也无需更改,因此在配置排序策略时不可能出现由于更换识别标识导致纸质文档原件损坏的情况,这极大提升了文档排序策略制定和维护的灵活性。
需要说明的是,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
例如,步骤S200和步骤S300可以并行执行。
此外,本发明还公开了一个或多个存储计算机可执行指令的计算机可读介质,所述指令在由一个或多个计算机设备使用时使得一个或多个计算机设备执行如前文所述的对纸质文档进行排序的方法,例如图1示出的对纸质文档进行排序的方法。所述计算机可读介质可以是可由计算机设备访问的任何可用介质,且包括用任何方法和技术实现以存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性介质、可移动和不可移动介质。计算机可读介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光存储、盒式磁带、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并且可由计算设备访问的任何其它介质。上述的任意组合也应包含在计算机可读介质的范围内。
相应地,本发明还提供了一种对纸质文档进行排序的系统,请参考图4,图4是根据本发明提供的对纸质文档进行排序的系统的一个具体实施方式的结构示意图,该系统包括第一承载设备100、存储介质500、识别设备200、排序设备300和第二承载设备400,其中:
所述第一承载设备100,用于放置并承载乱序排列的多个纸质文档600;
所述识别设备200,用于分别或依次识别每一所述纸质文档600的内容、介质或设置于其上的识别标识610,并根据所述识别标识610确定所述纸质文档600与所述存储介质500中的图像数据的映射关系;
所述排序设备300,用于获得所述图像数据的排序信息,并根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档600进行重新排序,并输出排序后的所述多个纸质文档600;
所述第二承载设备400,用于放置并承载所述排序后的所述多个纸质文档600;
所述存储介质500,用于存储所述图像数据、所述映射关系、所述排序信息中任一或其组合。
本部分出现的术语和名词与前文中相同的术语或名词具有一致的含义,例如所述“乱序排列”、“映射关系”和“排序信息”等,上述术语或名词及其涉及的工作原理均可参考前文中相关部分的描述和解释,为了简便起见在此不再赘述。
具体地,识别设备200在执行根据所述识别标识610确定所述纸质文档600与存储介质500中的图像数据的映射关系的具体步骤包括:
所述识别设备200解析所述内容、介质或识别标识携带的信息以获得文件ID;
所述识别设备200查找并确定所述文件ID对应的图像数据,将所述文件ID与所述图像数据建立对应映射。
典型地,所述识别标识610包括二维码、条形码或无线射频标签;所述二维码和条形码通过打印或印刷的方式设置在所述纸质文档上;所述无线射频标签通过粘贴的方式设置在所述纸质文档上。相应地,为了能正常读取上述各种类型的识别标识610,识别设备200上应具有合适的扫码枪或RFID读取电路。优选地,所述二维码和所述条形码的印刷油墨是隐形油墨。需要说明的是,虽然图4提供的具体实施方式中已经示出识别设备200是通过识别设置在纸质文档上的识别标识610来得到所述文件ID,但这并不意味着识别设备200仅能识别出识别标志610。相反,识别标志610可以替换为前文所述的纸质文档的内容或介质。在另一具体实施方式中,所述纸质文档上不附加任何额外的识别标识,识别设备200可设计为通过获得并处理纸质文档的实时图像而获得所述文件ID,或通过其他合适的传感器检测所述纸质文档的参数而获得所述文件ID。
优选地,排序设备300包括计算主机310和机械传送结构320。其中,所述所述计算主机310,用于根据所述映射关系和所述排序信息分别计算出每一所述纸质文档600的物理空间位置;所述机械传送结构320受所述计算主机310控制,用于将所述纸质文档600传送至所述物理空间位置。
具体地,所述排序信息通过预定的计算机策略生成;或所述排序信息通过人工操作计算机图形化界面而生成。优选地,所述排序信息通过预定的计算机策略生成包括:利用深度学习网络对所述图像数据进行识别,以判断出该图像数据的类型和/或顺序;根据所述图像数据的类型和/或顺序确定其在标准电子卷宗顺序中的位置,以生成所述排序信息。
请继续参考图4,为了更清楚地说明本发明提供的对纸质文档进行排序的系统对纸质文档的处理流程,图4中还示出了多个纸质文档600从输入到输出各个阶段的一个具体实施方式的状态示意图。如图4所示,乱序排列的多个纸质文档600形成的乱序文档堆叠601承载在第一承载设备100上,识别设备200分别或依次从堆叠601中抽取纸质文档600,并对纸质文档上的识别标识610进行识别生成识别结果,进一步地,识别设备200从存储介质500中读取所述图像数据并确定所述映射关系,或识别设备200将所述映射关系写入所述存储介质500中。排序设备300中的计算主机310接收识别设备200发送的所述映射关系,或从存储介质500中读取所述映射关系,并结合从存储介质500中读取的所述图像数据的排序信息,根据所述映射关系和所述排序信息分别计算出每一所述纸质文档600的物理空间位置,然后计算主机310控制机械传送结构320对堆叠610中包括的纸质文档600进行传送,使堆叠610中包括的多个纸质文档600从乱序状态变为有序状态,其中每一纸质文档600都处于其对应的物理空间位置。最后,机械传送结构320将处于有序状态的多个纸质文档600进行堆叠组合,以形成排序后的多个纸质文档600构成的堆叠602,第二承载设备400承载所述堆叠602。
请参考图5,图5是用于执行根据本发明的文档图像的识别方法的一个具体实施方式的计算机设备的结构示意图,更具体而言,前文所述的识别设备200、计算主机310和存储介质500可作为该计算机设备的一部分包含于其中。所述计算机设备至少包括如下部分:CPU(中央处理器)501、RAM(随机存储器)502、ROM(只读存储器)503、系统总线500、硬盘控制单元504、硬盘505、人机交互外部设备控制单元506、人机交互外部设备507、串行接口控制单元508、串行接口外部设备509、并行接口控制单元510、并行接口外部设备511、显示设备控制单元512和显示设备513。其中,CPU501、RAM 502、ROM 503、硬盘控制单元504、人机交互外部设备控制单元506、串行接口控制单元508、并行接口控制单元510以及显示设备控制单元512与系统总线500相连接,并通过系统总线500实现彼此之前的通信。此外,硬盘控制单元504与硬盘505相连接;人机交互外部设备控制单元506与人机交互外部设备507相连接,典型地该人机交互外部设备是鼠标、轨迹球、触摸屏或键盘;串行接口控制单元508与串行接口外部设备509相连接;并行接口控制单元510与并行接口外部设备511相连接;显示设备控制单元512和显示设备513相连接。
图5所述的结构框图仅仅示出了能实践本发明各个实施例的一种计算机设备的结构,而并非是对本发明的实践环境的限制。在一些情况下,可以根据需要添加或者减少该计算机设备中的一些设备。例如,图5所示的设备可以移除人机交互外部设备507和显示设备513,其具体实施形态仅仅是一个能够被外部设备访问的服务器。当然图5所示的计算机设备可以单独地实现本发明运行的环境,也可以通过网络互相连接起来而提供本发明各个实施例所适用运行环境,例如本发明的各个模块和/步骤可以分布地实现在互相连接的各个计算机设备中。
本发明提供的对纸质文档进行排序的方法中涉及软件逻辑的部分可以使用可编程逻辑器件来实现,也可以实施为计算机程序产品,该程序产品使计算机执行用于所示范的方法。所述计算机程序产品包括计算机可读存储介质,该介质上包含计算机程序逻辑或代码部分,用于实现上述涉及软件逻辑的部分的各个步骤。所述计算机可读存储介质可以是被安装在计算机中的内置介质或者可从计算机主体拆卸的可移动介质(例如可热拔插的存储设备)。所述内置介质包括但不限于可重写的非易失性存储器,例如RAM、ROM和硬盘。所述可移动介质包括但不限于:光存储媒体(例如CD-ROM和DVD)、磁光存储媒体(例如MO)、磁存储媒体(例如磁带或移动硬盘)、具有内置的可重写的非易失性存储器的媒体(例如存储卡)和具有内置ROM的媒体(例如ROM盒)。
本领域技术人员应当理解,任何具有适当编程装置的计算机系统都能够执行包含在计算机程序产品中的本发明的方法的诸步骤。尽管本说明书中描述的多数具体实施方式都侧重于软件程序,但是以硬件方式实现本发明提供的方法的替代实施例同样在本发明要求保护的范围之内。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,在权利要求的等同要件的含义和范围内的所有变化均涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他部件、单元或步骤,单数不排除复数。权利要求中陈述的多个部件、单元或装置也可以由一个部件、单元或装置通过软件或者硬件来实现。
本发明提供的对纸质文档排序的方法和系统,通过识别纸质文档上的识别标识以确定纸质文档的身份标识,将纸质文档和图像数据建立映射联系,实现了根据图像数据的排序信息对纸质文档啊进行重新排序,并自动输出排序结果。其带来的优点有:第一,提升了文档排序的准确度和效率;第二,可以根据图像数据的排序信息直接对与其相关的纸质文档进行排序,简化了现有场景中纸质文档排序的步骤,进一步提升了排序效率;第三,调整图像数据的排序信息即可实现对纸质文档进行重新排序,而无需更新纸质文档上的识别标识,增强了排序策略的适用性和灵活性。
以上所披露的仅为本发明的一些较佳实施例,不能以此来限定本发明之权利范围,依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (13)

1.一种对纸质文档进行排序的方法,该方法包括:
输入乱序排列的多个纸质文档;
分别或依次识别每一所述纸质文档的内容、介质或设置于其上的识别标识,并根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系;
获得所述图像数据的排序信息;
排序设备根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序,并输出排序后的所述多个纸质文档。
2.根据权利要求1所述的方法,其中,根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系包括:
解析所述内容、介质或识别标识携带的信息以获得文件ID;
查找并确定所述文件ID对应的图像数据,将所述文件ID与所述图像数据建立对应映射。
3.根据权利要求1或2所述的方法,其中:
所述识别标识包括二维码、条形码或无线射频标签;
所述二维码和条形码通过打印或印刷的方式设置在所述纸质文档上;
所述无线射频标签通过粘贴的方式设置在所述纸质文档上。
4.根据权利要求1所述的方法,其中,排序设备根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序包括:
所述排序设备根据所述映射关系和所述排序信息分别计算出每一所述纸质文档的物理空间位置;
所述排序设备包括的机械传送结构将所述纸质文档传送至所述物理空间位置。
5.根据权利要求1或4所述的方法,其中:
所述排序信息通过预定的计算机策略生成;或
所述排序信息通过人工操作计算机图形化界面而生成。
6.根据权利要求5所述的方法,其中,所述排序信息通过预定的计算机策略生成包括:
利用深度学习网络对所述图像数据进行识别,以判断出该图像数据的类型和/或顺序;
根据所述图像数据的类型和/或顺序确定其在标准电子卷宗顺序中的位置,以生成所述排序信息。
7.一种对纸质文档进行排序的系统,该系统包括第一承载设备、存储介质、识别设备、排序设备和第二承载设备,其中:
所述第一承载设备,用于放置并承载乱序排列的多个纸质文档;
所述识别设备,用于分别或依次识别每一所述纸质文档的内容、介质或设置于其上的识别标识,并根据所述识别确定所述纸质文档与所述存储介质中的图像数据的映射关系;
所述排序设备,用于获得所述图像数据的排序信息,并根据所述映射关系和所述排序信息对所述乱序排列的多个纸质文档进行重新排序,并输出排序后的所述多个纸质文档;
所述第二承载设备,用于放置并承载所述排序后的所述多个纸质文档;
所述存储介质,用于存储所述图像数据、所述映射关系、所述排序信息中任一或其组合。
8.根据权利要求7所述的系统,其中,根据所述识别确定所述纸质文档与存储介质中的图像数据的映射关系包括:
所述识别设备解析所述内容、介质或识别标识携带的信息以获得文件ID;
所述识别设备查找并确定所述文件ID对应的图像数据,将所述文件ID与所述图像数据建立对应映射。
9.根据权利要求8或9所述的系统,其中:
所述识别标识包括二维码、条形码或无线射频标签;
所述二维码和条形码通过打印或印刷的方式设置在所述纸质文档上;
所述无线射频标签通过粘贴的方式设置在所述纸质文档上。
10.根据权利要求7所述的系统,其中:
排序设备包括计算主机和机械传送结构;
所述计算主机,用于根据所述映射关系和所述排序信息分别计算出每一所述纸质文档的物理空间位置;
所述机械传送结构受所述计算主机控制,用于将所述纸质文档传送至所述物理空间位置。
11.根据权利要求7或10所述的系统,其中:
所述排序信息通过预定的计算机策略生成;或
所述排序信息通过人工操作计算机图形化界面而生成。
12.根据权利要求11所述的系统,其中,所述排序信息通过预定的计算机策略生成包括:
利用深度学习网络对所述图像数据进行识别,以判断出该图像数据的类型和/或顺序;
根据所述图像数据的类型和/或顺序确定其在标准电子卷宗顺序中的位置,以生成而所述排序信息。
13.一个或多个存储计算机可执行指令的计算机可读介质,所述指令在由一个或多个计算机设备使用时使得一个或多个计算机设备执行如权利要求1至6任一项所述的对纸质文档进行排序的方法。
CN201810362465.XA 2018-04-20 2018-04-20 对纸质文档进行排序的方法和系统 Pending CN110399334A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810362465.XA CN110399334A (zh) 2018-04-20 2018-04-20 对纸质文档进行排序的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810362465.XA CN110399334A (zh) 2018-04-20 2018-04-20 对纸质文档进行排序的方法和系统

Publications (1)

Publication Number Publication Date
CN110399334A true CN110399334A (zh) 2019-11-01

Family

ID=68319550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810362465.XA Pending CN110399334A (zh) 2018-04-20 2018-04-20 对纸质文档进行排序的方法和系统

Country Status (1)

Country Link
CN (1) CN110399334A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111326237A (zh) * 2020-01-21 2020-06-23 上海商汤智能科技有限公司 一种重排序处理方法及装置、电子设备和存储介质
CN112785159A (zh) * 2020-09-18 2021-05-11 上海鲲贝管理咨询有限公司 一种实体排序方法和装置
CN114138710A (zh) * 2021-12-02 2022-03-04 山东合联互联网科技有限公司 一种用于城建档案的电子化归档方法及系统
CN116193511A (zh) * 2023-04-21 2023-05-30 广东南方电信规划咨询设计院有限公司 一种5g数据流量乱序处理方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030033319A1 (en) * 2001-08-08 2003-02-13 Van Der Erwin Adrianus Richards Entry of physical documents in a digital back-end system
CN1602486A (zh) * 2001-10-25 2005-03-30 影像标记公司 纸质文件及其图像的管理
CN101227542A (zh) * 2007-01-18 2008-07-23 富士施乐株式会社 图像处理系统、图像处理方法及计算机可读介质
CN104176554A (zh) * 2014-08-28 2014-12-03 电子科技大学 一种用于文件排序归类的装置
CN105512197A (zh) * 2015-11-27 2016-04-20 广州宝钢南方贸易有限公司 一种文档数字化归档的装置及其归档和查询方法
CN106164910A (zh) * 2014-04-11 2016-11-23 弗立有限公司 文档的电子和物理归档方法
CN106379753A (zh) * 2016-11-02 2017-02-08 孔庆周 一种散装文件排序整理装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030033319A1 (en) * 2001-08-08 2003-02-13 Van Der Erwin Adrianus Richards Entry of physical documents in a digital back-end system
CN1602486A (zh) * 2001-10-25 2005-03-30 影像标记公司 纸质文件及其图像的管理
CN101227542A (zh) * 2007-01-18 2008-07-23 富士施乐株式会社 图像处理系统、图像处理方法及计算机可读介质
CN106164910A (zh) * 2014-04-11 2016-11-23 弗立有限公司 文档的电子和物理归档方法
CN104176554A (zh) * 2014-08-28 2014-12-03 电子科技大学 一种用于文件排序归类的装置
CN105512197A (zh) * 2015-11-27 2016-04-20 广州宝钢南方贸易有限公司 一种文档数字化归档的装置及其归档和查询方法
CN106379753A (zh) * 2016-11-02 2017-02-08 孔庆周 一种散装文件排序整理装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111326237A (zh) * 2020-01-21 2020-06-23 上海商汤智能科技有限公司 一种重排序处理方法及装置、电子设备和存储介质
CN112785159A (zh) * 2020-09-18 2021-05-11 上海鲲贝管理咨询有限公司 一种实体排序方法和装置
CN114138710A (zh) * 2021-12-02 2022-03-04 山东合联互联网科技有限公司 一种用于城建档案的电子化归档方法及系统
CN116193511A (zh) * 2023-04-21 2023-05-30 广东南方电信规划咨询设计院有限公司 一种5g数据流量乱序处理方法和系统
CN116193511B (zh) * 2023-04-21 2023-07-21 广东南方电信规划咨询设计院有限公司 一种5g数据流量乱序处理方法和系统

Similar Documents

Publication Publication Date Title
CN110399334A (zh) 对纸质文档进行排序的方法和系统
Cliche et al. Scatteract: Automated extraction of data from scatter plots
US8290272B2 (en) Creating a document template for capturing data from a document image and capturing data from a document image
WO2017216980A1 (ja) 機械学習装置
US8233180B2 (en) Methods for automatically determining workflow for print jobs
CN103019636B (zh) 凭证设计打印方法及系统
US20210064861A1 (en) Identification of table partitions in documents with neural networks using global document context
JP2009122760A (ja) 文書処理装置、文書処理方法及び文書処理プログラム
CN109388675A (zh) 数据分析方法、装置、计算机设备及存储介质
US9582483B2 (en) Automatically tagging variable data documents
CN107209771A (zh) 文档的分类和存储
JP2008145611A (ja) 情報処理装置、プログラム
CN107491536A (zh) 一种试题校验方法、试题校验装置及电子设备
CN110619252B (zh) 识别图片中表单数据的方法、装置、设备及存储介质
CN115758451A (zh) 基于人工智能的数据标注方法、装置、设备及存储介质
CN114626351A (zh) 结合rpa和ai的表单填报方法、装置、电子设备及存储介质
CN112560855B (zh) 图像信息提取方法、装置、电子设备及存储介质
CN109493285A (zh) 基于众包的图像处理方法、装置、服务器及存储介质
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
CN110390081A (zh) 文档比对方法、装置及设备
CN111198664B (zh) 一种文档打印的方法、装置、计算机存储介质及终端
CN103895386B (zh) 装订方法和装置
US8867838B2 (en) Method and system for a text data entry from an electronic document
CN113168527A (zh) 用于从实体文档提取信息的系统和方法
CN102473176A (zh) 文档数据处理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination