CN114863459A

CN114863459A - 一种乱序文档排序的方法、装置及电子设备

Info

Publication number: CN114863459A
Application number: CN202210480937.8A
Authority: CN
Inventors: 李超
Original assignee: Shanghai Zhuofan Information Technology Co ltd
Current assignee: Shanghai Zhuofan Information Technology Co ltd
Priority date: 2022-05-05
Filing date: 2022-05-05
Publication date: 2022-08-05

Abstract

本发明提供了一种乱序文档排序的方法、装置及电子设备，涉及计算机数据处理技术领域，包括获取若干张乱序图像文档；逐一提取若干张乱序图像文档的头部特征、尾部特征；随机抽取一张乱序图像文档；基于抽取的乱序图像文档的头部特征、尾部特征与其他的乱序图像文档的头部特征、尾部特征，得到抽取的乱序图像文档的前后页关系；将已知前后页关系的抽取的乱序图像文档合并作为一张；返回随机抽取一张乱序图像文档，直至若干张乱序图像文档排序完成。本申请提高了图像文档有效管理的工作效率，释放人工，将待处理的图像文档进行排序。

Description

一种乱序文档排序的方法、装置及电子设备

技术领域

本发明涉及计算机数据处理技术领域，尤其涉及一种乱序文档排序的方法、装置及电子设备。

背景技术

现如今，摄像头已经成为智能手机、平板电脑和个人电脑等电子产品的标准配置，人们可以方便的用这些设备获取图像，对于一些信息以拍照的方式进行记录，例如拍摄一些重要的票据、文件等。但是，这些拍摄得到的图像文档存储在这些设备中，由设备根据文件名、拍摄时间或文件大小等信息的顺序进行排序。但是文件名需要由用户来手动设置或者由设备根据拍照的顺序或时间自动生成文件名，拍摄时间或文件大小的随机性也非常强，这些信息与拍摄的内容都没有必然的联系，因此设备对于图像文档的存储顺序是无法参考拍摄内容的，这样对用户的使用而言就具有很大的不便，无法快捷准确的找到需要的图像文档。

因此，提出一种乱序文档排序的方法、装置及电子设备。

发明内容

本说明书提供一种乱序文档排序的方法、装置及电子设备，本申请提高了图像文档有效管理的工作效率，释放人工，将待处理的图像文档进行排序。

本说明书提供一种乱序文档排序的方法，包括：

获取若干张乱序图像文档；

逐一提取若干张所述乱序图像文档的头部特征、尾部特征；

随机抽取一张所述乱序图像文档；

基于抽取的所述乱序图像文档的头部特征、尾部特征与其他的所述乱序图像文档的头部特征、尾部特征，得到所述抽取的乱序图像文档的前后页关系；

将已知前后页关系的所述抽取的乱序图像文档合并作为一张；

返回所述随机抽取一张所述乱序图像文档，直至若干张所述乱序图像文档排序完成。

可选的，所述逐一提取若干张所述乱序图像文档的头部特征、尾部特征，包括：

判断所述乱序图像文档的字数是否满足目标数量，所述目标数量包括第一目标数量、第二目标数量；

当所述乱序图像文档的字数满足所述目标数量时，提取第一目标数量的开头内容作为头部特征、第二目标数量的结尾内容作为尾部特征。

可选的，还包括：

当所述乱序图像文档的字数不满足所述目标数量时：

提取所述乱序图像文档的字数；

在提取的所述乱序图像文档的字数前补全字符直至满足所述第一目标数量，得到所述乱序图像文档的头部特征；

在提取的所述乱序图像文档的字数后补全字符直至满足所述第二目标数量，得到所述乱序图像文档的尾部特征。

可选的，所述基于抽取的所述乱序图像文档的头部特征、尾部特征与其他的所述乱序图像文档的头部特征、尾部特征，得到所

将随机抽取的所述乱序图像文档的头部特征与其他的所述乱序图像文档的尾部特征进行关联度运算，得到第一文档关联度；

将第一目标图像文档作为所述随机抽取的所述乱序图像文档的前一页，所述第一目标图像文档为与所述第一文档关联度最高的所述其他的所述乱序图像文档；

将所述随机抽取的所述乱序图像文档的尾部特征与所述其他的所述乱序图像文档的头部特征进行关联度运算，得到第二文档关联度；

将第二目标图像文档作为所述随机抽取的所述乱序图像文档的后一页，所述第二目标图像文档为与所述第二文档关联度最高的所述其他的所述乱序图像文档。

可选的，所述第一目标数量为200，所述第二目标数量为200。

本说明书还提供一种乱序文档排序的装置，包括：

获取模块，用以获取若干张乱序图像文档；

提取模块，用以逐一提取若干张所述乱序图像文档的头部特征、尾部特征；

抽取模块，用以随机抽取一张所述乱序图像文档；

排序模块，用以基于抽取的所述乱序图像文档的头部特征、尾部特征与其他的所述乱序图像文档的头部特征、尾部特征，得到所述抽取的乱序图像文档的前后页关系；

合并模块，用以将已知前后页关系的所述抽取的乱序图像文档合并作为一张；

循环模块，用以返回所述随机抽取一张所述乱序图像文档，直至若干张所述乱序图像文档排序完成。

可选的，所述提取模块包括：

判断单元，用以判断所述乱序图像文档的字数是否满足目标数量，所述目标数量包括第一目标数量、第二目标数量；

第一提取单元，用以当所述乱序图像文档的字数满足所述目标数量时，提取第一目标数量的开头内容作为头部特征、第二目标数量的结尾内容作为尾部特征。

可选的，还包括：

当所述乱序图像文档的字数不满足所述目标数量时：

第二提取单元，用以提取所述乱序图像文档的字数；

补全单元，用以在提取的所述乱序图像文档的字数前补全字符直至满足所述第一目标数量，得到所述乱序图像文档的头部特征；

第三提取单元，用以在提取的所述乱序图像文档的字数后补全字符直至满足所述第二目标数量，得到所述乱序图像文档的尾部特征。

可选的，所述排序模块包括：

可选的，所述第一目标数量为200，所述第二目标数量为200。

本说明书还提供一种电子设备，其中，该电子设备包括：

处理器；以及，

存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行上述任一项方法。

本说明书还提供一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被处理器执行时，实现上述任一项方法。

本说明书中，通过图像文档抽取头部特征、尾部特征，然后根据各业之间头部特征、尾部特征的关系确定对应的排序，提高了图像文档有效管理的工作效率，释放人工，将乱序图像文档进行排序。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书实施例提供的一种乱序文档排序的方法的原理示意图；

图2为本说明书实施例提供的一种乱序文档排序中的S11的原理示意图；

图3为本说明书实施例提供的一种乱序文档排序中的S13的原理示意图；

图4为本说明书实施例提供的一种乱序文档排序的装置的结构示意图；

图5为本说明书实施例提供的一种电子设备的结构示意图；

图6为本说明书实施例提供的一种计算机可读介质的原理示意图。

具体实施方式

以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例，本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。

以下结合附图1-6更全面地描述本发明的示例性实施例。然而，示例性实施例能够以多种形式实施，且不应被理解为本发明仅限于在此阐述的实施例。相反，提供这些示例性实施例能够使得本发明更加全面和完整，更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分，因而将省略对它们的重复描述。

在符合本发明的技术构思的前提下，在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。

在对于具体实施例的描述中，本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是，并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

术语“和/或”或者“及/或”包括相关联的列出项目中的任一个或多者的所有组合。

图1为本说明书实施例提供的一种乱序文档排序的方法的原理示意图，该方法可以包括：

S10：获取若干张乱序图像文档；

在本说明书具体实施方式中，图像文档是已有的图像文档，或者是以拍摄方式得到新的图像文档。具体的，合同往来是公司合作的重要环节，为了合同生效的时效，通常将合同进行拍照、扫描以bmp、jpg、png、tif、gif、pcx、tga等格式进行储存，亦或是PDF格式进行储存，通常也都是无序储存的，再通过邮件、传真等方式进行传输，即乱序图像文档。

获取若干张乱序图像文档之后，还包括：

对若干张所述乱序图像文档进行切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理。若干张乱序图像文档中，尤其是采用拍摄方式获取的图像文档，难免在图像中会存在拍摄的背景，而且一些图像中的文字颜色各异，对文字识别都会造成影响。因此，还包括对若干张乱序图像文档中的图像以切边、旋转、拉伸以及图像增强中至少一种方式进行图像处理的步骤，之后对进行过图像处理的待处理的图像文档进行文字识别，以提高文字识别的准确性。

S11：逐一提取若干张所述乱序图像文档的头部特征、尾部特征；

在本说明书具体实施方式中，通过图像文字识别模型识别乱序图像文档，得到乱序图像文档的头部特征、尾部特征。图像文字识别模型包括OCR(Optical CharacterRecognition，光学字符识别)模型，OCR模型是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。

可选的，图2为本说明书实施例提供的一种乱序文档排序的方法中的S11原理示意图，所述S11，包括：

S111：判断所述乱序图像文档的字数是否满足目标数量，所述目标数量包括第一目标数量、第二目标数量；

S112：当所述乱序图像文档的字数满足所述目标数量时，提取第一目标数量的开头内容作为头部特征、第二目标数量的结尾内容作为尾部特征。

在本说明书具体实施方式中，当乱序文档的字数满足目标数量时，将乱序文档的第一个字开始第一目标数量的字作为头部特征，将乱序文档的最后一个字往前推第二目标数量的字作为尾部特征。

可选的，当所述乱序图像文档的字数不满足所述目标数量时：

提取所述乱序图像文档的字数；

在本说明书具体实施方式中，比如提取到某一页只有10个字，这10个字通过编码id分别是[10，1，29，30，19，20，19，20，30，31]，第一目标数量为15，第二目标数量为15，如果是头部特征的话，会在头部补全，如[0，0，0，0，0，10，1，29，30，19，20，19，20，30，31]；如果是尾部特征的话，会在尾部补全，[10，1，29，30，19，20，19，20，30，31，0，0，0，0，0]。

可选的，所述第一目标数量为200，所述第二目标数量为200。

S12：随机抽取一张所述乱序图像文档；

S13：基于抽取的所述乱序图像文档的头部特征、尾部特征与其他的所述乱序图像文档的头部特征、尾部特征，得到所述抽取的乱序图像文档的前后页关系；

可选的，图3为本说明书实施例提供的一种乱序文档排序的方法中的S13原理示意图，所述S13，包括：

S131：将随机抽取的所述乱序图像文档的头部特征与其他的所述乱序图像文档的尾部特征进行关联度运算，得到第一文档关联度；

S132：将第一目标图像文档作为所述随机抽取的所述乱序图像文档的前一页，所述第一目标图像文档为与所述第一文档关联度最高的所述其他的所述乱序图像文档；

S133：将所述随机抽取的所述乱序图像文档的尾部特征与所述其他的所述乱序图像文档的头部特征进行关联度运算，得到第二文档关联度；

S134：将第二目标图像文档作为所述随机抽取的所述乱序图像文档的后一页，所述第二目标图像文档为与所述第二文档关联度最高的所述其他的所述乱序图像文档。

在本说明书具体实施方式中，使用word2vec方法将头部特征转换为头部特征向量矩阵，使用word2vec方法将尾部特征转换为尾部特征向量矩阵，word2vec，是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络，用来训练以重新建构语言学之词文本。网络以词表现，并且需猜测相邻位置的输入词，在word2vec中词袋模型假设下，词的顺序是不重要的。训练完成之后，word2vec模型可用来映射每个词到一个向量，可用来表示词对词之间的关系，该向量为神经网络之隐藏层。

将随机抽取的乱序图像文档的头部特征与其他的乱序图像文档的尾部特征进行余弦值计算，得到第一文档关联度；将随机抽取的乱序图像文档的尾部特征与其他的乱序图像文档的头部特征进行余弦值计算，得到第二文档关联度；将与第一文档关联度最高的其他的乱序图像文档作为第一目标图像文档，将第一目标图像文档作为随机抽取的所述乱序图像文档的前一页；将与第二文档关联度最高的其他的乱序图像文档作为第二目标图像文档，将第二目标图像文档作为随机抽取的所述乱序图像文档的后一页。

S14：将已知前后页关系的所述抽取的乱序图像文档合并作为一张；

S15：返回所述随机抽取一张所述乱序图像文档，直至若干张所述乱序图像文档排序完成。

在本说明书具体实施方式中，排序前的乱序图像文档[M₂，M₆，M₁，M₄，M₅，M₃]，第一次排序后的乱序图像文档[[M₃，M₄，M₅]，M₁，M₂，M₆]([M₃，M₄，M₅]表示前后页关系)，第二次排序后的乱序图像文档[[M₂，[M₃，M₄，M₅]，M₆]，M₁]，第三次排序后的乱序图像文档[[M₁，[M₂，[M₃，M₄，M₅]，M₆]]]。

图4为本说明书实施例提供的一种乱序图像文档排序的装置的原理示意图，该装置可以包括：

获取模块201，用以获取若干张乱序图像文档；

提取模块202，用以逐一提取若干张所述乱序图像文档的头部特征、尾部特征；

抽取模块203，用以随机抽取一张所述乱序图像文档；

排序模块204，用以基于抽取的所述乱序图像文档的头部特征、尾部特征与其他的所述乱序图像文档的头部特征、尾部特征，得到所述抽取的乱序图像文档的前后页关系；

合并模块205，用以将已知前后页关系的所述抽取的乱序图像文档合并作为一张；

循环模块206，用以返回所述随机抽取一张所述乱序图像文档，直至若干张所述乱序图像文档排序完成。

可选的，所述提取模块202包括：

可选的，还包括：

当所述乱序图像文档的字数不满足所述目标数量时：

第二提取单元，用以提取所述乱序图像文档的字数；

可选的，所述排序模块包括：

可选的，所述第一目标数量为200，所述第二目标数量为200。

本发明实施例的装置的功能已经在上述的方法实施例中进行了描述，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。

基于同一发明构思，本说明书实施例还提供一种电子设备。

下面描述本发明的电子设备实施例，该电子设备可以视为对于上述本发明的方法和装置实施例的具体实体实施方式。对于本发明电子设备实施例中描述的细节，应视为对于上述方法或装置实施例的补充；对于在本发明电子设备实施例中未披露的细节，可以参照上述方法或装置实施例来实现。

图5为本说明书实施例提供的一种电子设备的结构示意图。下面参照图5来描述根据本发明该实施例的电子设备300。图5显示的电子设备300仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，电子设备300以通用计算设备的形式表现。电子设备300的组件可以包括但不限于：至少一个处理单元310、至少一个存储单元320、连接不同系统组件(包括存储单元320和处理单元310)的总线330、显示单元340等。

其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元310执行，使得所述处理单元310执行本说明书上述处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如，所述处理单元310可以执行如图1所示的步骤。

所述存储单元320可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(RAM)3201和/或高速缓存存储单元3202，还可以进一步包括只读存储单元(ROM)3203。

所述存储单元320还可以包括具有一组(至少一个)程序模块3205的程序/实用工具3204，这样的程序模块3205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线330可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备300也可以与一个或多个外部设备400(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备300交互的设备通信，和/或与使得该电子设备300能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口350进行。并且，电子设备300还可以通过网络适配器360与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。网络适配器360可以通过总线330与电子设备300的其它模块通信。应当明白，尽管图5中未示出，可以结合电子设备300使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述，本领域的技术人员易于理解，本发明描述的示例性实施例可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本发明实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个计算机可读的存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时，使得该计算机可读介质能够实现本发明的上述方法，即：如图1所示的方法。

实现图1所示方法的计算机程序可以存储于一个或多个计算机可读介质上。计算机可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

综上所述，本发明可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，应理解的是，本发明不与任何特定计算机、虚拟装置或者电子设备固有相关，各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种乱序文档排序的方法，其特征在于，包括：

获取若干张乱序图像文档；

逐一提取若干张所述乱序图像文档的头部特征、尾部特征；

随机抽取一张所述乱序图像文档；

2.如权利要求1所述的乱序文档排序的方法，其特征在于，所述逐一提取若干张所述乱序图像文档的头部特征、尾部特征，包括：

3.如权利要求2所述的乱序文档排序的方法，其特征在于，还包括：

当所述乱序图像文档的字数不满足所述目标数量时：

提取所述乱序图像文档的字数；

4.如权利要求3所述的乱序文档排序的方法，其特征在于，所述基于抽取的所述乱序图像文档的头部特征、尾部特征与其他的所述乱序图像文档的头部特征、尾部特征，得到所述抽取的乱序图像文档的前后页关系，包括：

5.如权利要求1所述的乱序文档排序的方法，其特征在于，包括：所述第一目标数量为200，所述第二目标数量为200。

6.一种乱序文档排序的装置，其特征在于，包括：

获取模块，用以获取若干张乱序图像文档；

抽取模块，用以随机抽取一张所述乱序图像文档；

7.如权利要求6所述的乱序文档排序的装置，其特征在于，所述提取模块包括：

8.如权利要求7所述的乱序文档排序的装置，其特征在于，还包括：

当所述乱序图像文档的字数不满足所述目标数量时：

第二提取单元，用以提取所述乱序图像文档的字数；

9.一种电子设备，其中，该电子设备包括：

处理器；以及，

存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器执行根据权利要求1-5中任一项所述的方法。

10.一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被处理器执行时，实现权利要求1-5中任一项所述的方法。