CN117523584A - 一种电子面单的识别方法、装置、设备及介质 - Google Patents

一种电子面单的识别方法、装置、设备及介质 Download PDF

Info

Publication number
CN117523584A
CN117523584A CN202311686565.5A CN202311686565A CN117523584A CN 117523584 A CN117523584 A CN 117523584A CN 202311686565 A CN202311686565 A CN 202311686565A CN 117523584 A CN117523584 A CN 117523584A
Authority
CN
China
Prior art keywords
target
text
assertion
image
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311686565.5A
Other languages
English (en)
Inventor
胡刚
赵燃
刘定龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen 4px Information Technology Co ltd
Original Assignee
Shenzhen 4px Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen 4px Information Technology Co ltd filed Critical Shenzhen 4px Information Technology Co ltd
Priority to CN202311686565.5A priority Critical patent/CN117523584A/zh
Publication of CN117523584A publication Critical patent/CN117523584A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种电子面单的识别方法、装置、设备及介质。该方法包括:获取待识别的目标面单图像以及标准面单图像,并比较目标面单图像与标准面单图像之间的图像相似度;通过预设的识别算法,获取与目标面单图像匹配的目标置信度;将目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找;在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象;将目标识别对象输入至断言接口,获取识别结果。通过本发明的技术方案,能够实现电子面单图像的识别,提高了电子面单的识别的准确率与工作效率,节约了电子面单识别过程中的人力资源投入。

Description

一种电子面单的识别方法、装置、设备及介质
技术领域
本发明涉及智能识别领域,尤其涉及一种电子面单的识别方法、装置、设备及介质。
背景技术
在物流行业中,存在大量的面单数据,使用纯手工识别面单信息需要大量的人力和时间成本,还存在时效性低,错误率高等缺点;相对于传统的手工面单识别方法,光学字符识别(Optical Character Recognition,OCR)的识别速度和精度都有很大优势,可以节省大量的人力成本,同时可以提高业务的处理时效。
发明人在实现本发明的过程中,发现现有的面单识别技术存在如下技术问题:由于公司可能对接上百个不同的服务商,并且每个服务商的面单都会存在差异,并且在与服务商进行对接的时候,各个服务商都会有或多或少的面单升级或者改造。测试人员不但需要检查服务商返回的面单,经过改造或者升级之后面单是否满足转运的要求。同时也要检查面单中是否存在关键信息遗漏或者缺失的情况,既浪费了大量的精力以及人力资源,也会引入大量的人为主观错误。
发明内容
本发明提供了一种电子面单的识别方法、装置、设备及介质,以解决通过人力识别电子面单时,电子面单识别的准确率与工作效率较低,电子面单识别的人力资源被浪费的问题。
第一方面,本发明实施例提供了一种电子面单的识别的方法,该方法包括:
获取待识别的目标面单图像以及标准面单图像,并比较目标面单图像与标准面单图像之间的图像相似度;
在图像相似度大于预设图像相似度阈值时,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度;
在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找;
在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象;
将目标识别对象输入至设定断言接口,以获取与所述目标面单图像匹配的识别结果。
第二方面,本发明实施例提供了一种电子面单的识别装置,该装置包括:
图像相似度判断模块,用于获取待识别的目标面单图像以及标准面单图像,并比较目标面单图像与标准面单图像之间的图像相似度;
目标置信度判断模块,用于在图像相似度大于预设图像相似度阈值时,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度;
匹配模块,用于在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找;
目标识别对象获取模块,用于在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象;
识别结果获取模块,将目标识别对象输入至设定断言接口,以获取与所述目标面单图像匹配的识别结果。
第三方面,本发明实施例提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的电子面单的识别方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的电子面单的识别方法。
本发明实施例的技术方案,通过比较获取的目标面单图像与标准面单图像之间的图像相似度并判断目标断言文本和目标断言文本的目标置信度,之后将目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找,并根据匹配结果将整个识别过程生成的至少一个识别项组织得到目标识别对象,最后将目标识别对象输入至设定断言接口,以获取最终的识别结果,解决了通过人力识别电子面单时,电子面单识别的准确率与工作效率较低,电子面单识别的人力资源被浪费等问题,实现电子面单图像的自动化识别,提高了电子面单的识别准确率与工作效率,节约了电子面单识别过程中的人力资源投入。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种电子面单的识别方法的流程图;
图2a是根据本发明实施例二提供的一种电子面单的识别方法的流程图;
图2b是本发明实施例二的方法所适用的一种的电子面单识别方法的时序图;
图3是根据本发明实施例三提供的一种电子面单的识别装置的结构示意图;
图4是实现本发明实施例的电子面单的识别方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供的一种电子面单的识别方法的流程图,本实施例可适用于对电子面单进行自动化信息识别的情况,该方法可以由电子面单的识别装置来执行,该电子面单的识别装置可以采用硬件和/或软件的形式实现,该电子面单的识别装置可配置于具有数据处理功能的终端或服务器中。如图1所示,该方法包括:
S110、获取待识别的目标面单图像以及标准面单图像,并比较目标面单图像与标准面单图像之间的图像相似度。
其中,所述目标面单可以为携带有需要被识别信息的面单;进一步的,所述标准面单可以为与目标面单在格式上可以进行匹配的示例性的面单;容易理解的是,在实际应用中,由于物流公司不同或者物流种类不同等原因,存在多种不同规格的面单格式,在本实施例中,所述标准面单图像可以为与目标面单具有同种规格的,且具有所述规格的标准格式信息的面单;进一步的,所述标准面单图像可以由服务商进行提供等。
可选的,获取待识别的目标面单图像以及标准面单图像,可以包括:
获取目标标签链接以及基准标签链接;通过所述目标标签链接和基准标签链接,从服务器下载备选面单图像以及标准面单图像;比较所述备选面单图像与所述标准面单图像的图像尺寸是否一致;若否,则对所述备选面单图像进行尺寸调整,得到标准尺寸的目标面单图像。
在本实施例中,目标标签链接为用于下载备选面单图像的服务器链接,基准标签链接为用于下载标准面单图像的服务器链接。其中,目标标签链接和基准标签链接的获取方式可以为:由所述目标面单图像以及标准面单图像的对应服务商通过服务器进行目标标签链接和基准标签链接的传送;其中,备选面单图像可以理解为携带有需要被识别信息,但是尺度未知的面单。
其中,所述标准面单图像的图像尺寸可以由人工进行调整,例如可以设定为100*100的图像尺寸。
进一步的,若所述备选面单图像与所述标准面单图像的图像尺寸一致,则将所述备选面单图像调整尺寸后作为目标面单图像进行输出,以完成后续步骤。
相应的,比较目标面单图像与标准面单图像之间的图像相似度,可以包括:
将所述目标面单图像与标准面单图像组合得到对照面单图像;通过openCV工具,对对照面单图像中的目标面单图像与标准面单图像进行色域差值对比,得到所述图像相似度以及不一致的区域列表;对所述不一致的区域列表进行过滤后,得到目标区域列表,并在所述对照面单图像中标识所述目标区域列表。
其中,所述openCV工具可以为:基于Apache2.0许可发行的跨平台计算机视觉和机器学习软件库,可以实现图像处理和计算机视觉方面的通用算法;进一步的,在本实施例中,使用openCV工具对所述目标面单图像与标准面单图像进行色域差值对比,以得到两幅图像的相似度以及不一致的区域列表;其中,所述区域列表包含所有图像的色域不一致区域。
具体的,在获取得到区域列表后,对所述区域列表进行过滤;示例性的,如果设定大于10*10像素的色域为差异色域,则本申请提供的方法可以将小于10*10像素的区域列表中的色域过滤,并将满足条件的差异色域进行标注;进一步的,所述标注具体可以为利用红色框型将所述差异色域在所述对照面单图像上的目标面单图像位置进行相应区域的标注,并生成带标注的新的图片作为最新的对照面单图像。
现有技术中,通常需要人工将所述目标面单图像与标准面单图像分别进行窗口对比,本实施例提供的方法将图像组合处理,生成带有标注的对照免单图像,可以自动标注出目标面单图像中与标准面单图像不一致的位置,便于测试人员集中进行检查,相比于人工肉眼的比对带了极大地效率提升,避免了由于目标面单图像与标准面单图像不匹配产生的后续对照问题。
S120、在图像相似度大于预设图像相似度阈值时,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度。
其中,所述预设的光学识别算法可以为百度OCR;进一步的,在现有技术中,可供选择的OCR技术由百度OCR、阿里读光以及飞浆等,发明人对比市面上的各种工具,发现在大请求量的情况下,基于性能、精确程度以及性价比的考量,百度OCR可以作为施行本实施例的OCR方案。
其中,所述百度OCR可以提取出图片上的文本内容。具体的,百度OCR可以提取出目标面单图像上的全部文本作为目标断言文本,并同时获取与目标断言文本对应的目标置信度。进一步的,所述目标置信度可以为所述目标断言文本的可信程度,即目标断言文本命中目标面单图像包含的真实文本的置信水平。
相应的,若所述图像相似度不大于预设图像相似度阈值,则对客户端返回错误结果并停止对于所述目标面单图像的识别程序,防止造成比对错误而产生的资源浪费;其中,所述错误结果包括错误提示结果以及所述图像相似度的值。
可选的,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度,可以包括:
按照预设的比对顺序,从光学字符识别算法库中获取当前处理识别算法;通过所述当前处理识别算法,对所述目标面单图像进行光学字符识别,获取备选断言文本,以及所述备选断言文本的备选置信度;如果所述备选置信度超过预设置信度阈值,则将备选断言文本确定为目标断言文本,并将备选置信度确定为目标置信度;如果备选置信度未超过预设置信度阈值,则根据备选置信度,更新已比对最大置信度后,返回执行按照预设的比对顺序,从光学字符识别算法库中获取当前处理识别算法的操作;如果确定完成对全部光学字符识别算法的备选置信度均未超过预设置信度阈值,则将与已比对最大置信度对应的备选断言文本确定为目标断言文本,并将已比对最大置信度确定为目标置信度。
示例性的,在本实施例中,设置预设置信度为90%,首先将所述目标断言文本通过标准百度OCR进行备选置信度的获取,若所述备选置信度超过90%,则将备选断言文本确定为目标断言文本,并将得到的备选置信度确定为目标置信度;若所述备选置信度未超过90%,则将所述备选断言文本输入至通用带位置OCR进行备选置信度的获取,若所述备选置信度超过90%,则将备选断言文本确定为目标断言文本,并将得到的备选置信度确定为目标置信度;若所述备选置信度未超过90%,则将所述备选断言文本再次输入至高精度带位置OCR进行备选置信度的获取,若所述备选置信度超过90%,则将备选断言文本确定为目标断言文本,并将得到的备选置信度确定为目标置信度;进一步的,若所述备选置信度未超过90%,则将所述备选断言文本最后输入至高精度OCR进行备选置信度的获取,若所述备选置信度超过90%,则将备选断言文本确定为目标断言文本,并将得到的备选置信度确定为目标置信度;若所述备选置信度仍未超过90%,则将与已比对最大置信度对应的备选断言文本确定为目标断言文本,并将高精度OCR获得的备选置信度确定为目标置信度。
容易理解的是,在置信度获取的准确度方面,各个光学字符识别算法的准确度从低到高的排列顺序为:标准百度OCR、通用带位置OCR、高精度带位置OCR以及高精度OCR。
S130、在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找。
其中,所述断言文本项可以为:发件地址文本项、姓名文本项、收件地址文本项等;进一步的,目标断言文本由至少一个断言文本项组成。
其中,所述文本内容库可以为:百度OCR曾经获取的或者从服务器接口获取的,具有与所述目标断言文本相同文本格式的文本。进一步的,所述预设算法可以为莱文斯坦算法,具体的,所述莱文斯坦算法可以用于进行文本相似度的比较,在本实施例中,即用于进行目标断言文本与所述文本内容库中全部文本的相似度比较。
相应的,若S120中获取的目标置信度不大于预设置信度阈值,则对客户端返回错误结果并停止对于所述目标面单图像的识别程序,防止造成比对错误而产生的资源浪费;其中,所述错误结果包括错误提示结果、目标断言文本以及目标置信度。
可选的,在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找,可以包括:
基于文本相似度在设定文本内容库中匹配与所述任一断言文本项的文本相似度达到预设相似度阈值的目标文本;若无法匹配到与任一一个断言文本项达到预设相似度阈值的目标文本,则对客户端返回错误结果。
进一步的,基于文本相似度在设定文本内容库中匹配与所述任一断言文本项的文本相似度达到预设相似度阈值的目标文本,可以包括:若在首次匹配操作中无法找到与所述断言文本项具有预设相似度的目标文本,则基于面单排版规则组合对所述断言文本项进行处理,并将处理后的目标断言文本进行二次匹配。
其中,所述面单排版规则可以包括:折行,拆分等文本处理规则。
在实际应用中,通常会出现地址断言文本项或者其他类型的文本项长度过长,又由于目标面单图像有设定大小的规格设置,导致过长的文本无法显示在目标面单图像上,进一步导致所述获取的目标断言文本的内容出现缺失的问题,在本实施例中,通过莱文斯坦算法,进行文本相似度的比较,若出现与所述目标断言文本达到文本相似度的目标文本,则证明所述断言文本获取正确,且可以将可能出现缺失内容的断言文本通过获取目标断言文本的方式进行恢复;若无法匹配到与任一一个断言文本项达到预设相似度阈值的目标文本,则证明所述断言文本不属于所述文本内容库,可能是文本内容或者格式出现失误,此时则返回错误结果,以进行错误处理。
通过本实施例的所述方法,可以保证文本信息的完整性与准确性,提高了电子面单的识别的准确率与工作效率。
S140、在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象。
其中,所述目标识别对象包括:最终断言结果、所述图像相似度与对照面单图像、所述目标置信度与文本相似度以及目标文本。
S150、将目标识别对象输入至设定断言接口,以获取与所述目标面单图像匹配的识别结果。
其中,所述断言接口可以为具有Beanshell断言功能的Beanshell断言接口;进一步的,所述Beanshell断言为jmeter工具中的一个功能,可以在jmeter接口发出后通过编写类似于java的代码进行一些接口请求后的返回进行判断是否正确,在本实施例中,即通过所述目标识别对象判断所述面单识别结果是否正确;进一步的,所述jmeter工具为一个测试领域中的一个性能测试以及自动化测试的一种工具。
其中,所述识别结果包括:面单识别断言成功或者面单识别断言错误。
可选的,将目标识别对象输入至设定断言接口,获取与所述目标面单图像匹配的识别结果,可以包括:
将所述目标识别对象输入至断言接口,并记录所述目标识别对象;根据断言接口收到的目标识别对象,获取与所述目标面单图像匹配的识别结果,并记录所述识别结果;其中,所述目标识别对象包括:最终断言结果、所述图像相似度与对照面单图像、所述目标置信度与文本相似度以及目标文本。
在本实施例中,所述目标识别对象与最终断言结果默认均会被记录在断言接口中,可以通过服务器端口的操作对所述信息进行删除或修改。
本发明实施例的技术方案,通过比较获取的目标面单图像与标准面单图像之间的图像相似度并判断目标断言文本和目标断言文本的目标置信度,之后将目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找,并根据匹配结果将整个识别过程生成的至少一个识别项组织得到目标识别对象,最后将目标识别对象输入至设定断言接口,以获取最终的识别结果,解决了通过人力识别电子面单时,电子面单识别的准确率与工作效率较低,电子面单识别的人力资源被浪费等问题,实现电子面单图像的自动化识别,提高了电子面单的识别准确率与工作效率,节约了电子面单识别过程中的人力资源投入。
实施例二
图2a为本发明实施例二提供的一种电子面单的识别方法的流程图,如图2a所示,该方法包括:
S210、获取目标标签链接以及基准标签链接,并通过目标标签链接和基准标签链接从服务器下载备选面单图像以及标准面单图像。
S220、比较所述备选面单图像与所述标准面单图像的图像尺寸是否一致:若否,执行S230;若是,执行S240。
S230、对所述备选面单图像进行尺寸调整,得到标准尺寸的目标面单图像,执行S240。
S240、比较目标面单图像与标准面单图像之间的图像相似度,执行S250。
S250、按照预设的比对顺序,从光学字符识别算法库中获取当前处理识别算法,并通过当前处理识别算法,对目标面单图像进行光学字符识别,获取备选断言文本,以及备选断言文本的备选置信度。
其中,如果所述备选置信度超过预设置信度阈值,则执行S260;如果备选置信度未超过预设置信度阈值,则执行S270;如果确定完成对全部光学字符识别算法的备选置信度均未超过预设置信度阈值,则执行S280。
S260、将备选断言文本确定为目标断言文本,并将备选置信度确定为目标置信度,执行S290。
S270、根据备选置信度,更新已比对最大置信度后,返回执行S250。
S280、将与已比对最大置信度对应的备选断言文本确定为目标断言文本,并将已比对最大置信度确定为目标置信度,并对客户端返回错误结果。
S290、基于文本相似度在设定文本内容库中匹配与所述任一断言文本项的文本相似度达到预设相似度阈值的目标文本。
S2100、在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象。
S2110、将所述目标识别对象输入至断言接口,并记录所述目标识别对象,并根据断言接口收到的目标识别对象,获取与所述目标面单图像匹配的识别结果,并记录所述识别结果。
本发明实施例的技术方案,通过比较从目标标签链接以及基准标签连接中获取的目标面单图像与标准面单图像之间的图像相似度,并通过光学字符识别算法判断目标断言文本和目标断言文本的目标置信度,对达到预设置信度的目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找,并根据匹配结果将整个识别过程生成的至少一个识别项组织得到目标识别对象,最后将目标识别对象输入至设定断言接口,以获取最终的识别结果,解决了通过人力识别电子面单时,电子面单识别的准确率与工作效率较低,电子面单识别的人力资源被浪费等问题,实现电子面单图像的自动化识别,提高了电子面单的识别准确率与工作效率,节约了电子面单识别过程中的人力资源投入。
具体应用场景
为了更清楚的表述本发明实施例提供的技术方案,本实施例以光学字符识别算法为百度OCR方法为例,在此提供一种如图2b所示的具体应用场景如下:
1、Jmeter工具通过调用Beanshell断言中的Beanshell代码的方式获取到服务商返回的目标标签链接以及基准标签链接。
2、Beanshell断言通过预设的方式将目标标签链接以及基准标签链接以及预设图像相似度阈值、预设置信度阈值以及预设文本相似度阈值发送给flask服务
3、flask服务接收数据,并将请求中的目标标签链接以及基准标签链接对应的备选面单图像以及标准面单图像下载到本地
4、判断备选面单图像以及标准面单图像是否为可支持文件,如果是pdf格式则转化成png格式,如果是base64格式则先转化成pdf格式在进行png格式的转化。
5、判断备选面单图像以及标准面单图像的文件尺寸是否一致。如果比例一致则备选面单图像的尺寸,如果比例不一致则直接返回错误。
6、使用openCV对备选面单图像以及标准面单图像进行色域差值对比得到相似度以及不一致的区域列表。
7、将不一致区域列表中,大小小于10*10像素的区域过滤掉并将较大区域利用红色框进行标注生成新结果的图像。如果相似度小于预设图像相似度阈值则直接返回断言失败以及所述图像相似度。
8、将标记不一致区域带有红框的结果图像与基准图像进行左右合并成一个最终的对照面单图像,便于观察者进行人工对比。
9、图像相似度高于阈值那么则请求百度OCR的标准版,并返回一个置信度和识别到的文字,当置信度低于阈值则会重新使用通用位置版OCR,依次循环,直到置信度达到阈值,如果均达不到则返回断言失败以及图像相似度和目标置信度。
10、当百度OCR返回目标置信度达到阈值之后,遍历接口传过来的目标断言文本的断言文本项,并且在文本内容库返回的文本中寻找相似的文本,如果找不到,那么通过面单排版规则组合二次进行匹配。只有文本与目标断言文本的相似度达到阈值之后则会认定为这个目标断言文本是通过断言的。只有所有的断言文本项都能在OCR返回的文本中找到相似的文本那么所述目标断言文本的断言才能通过。
11、当图像相似度、目标置信度以及文本相似度均达到阈值。那么再将最终断言结果、所述图像相似度与对照面单图像、所述目标置信度与文本相似度以及目标文本组装成一个目标识别对象返回给Jmeter工具,进行Beanshell断言。
12、beanshell根据接口返回的目标识别对象判断此次断言是否成功,并将结果记录到Jmeter工具。
实施例三
图3为本发明实施例三提供的一种电子面单的识别装置的结构示意图。
如图3所示,该装置包括:
图像相似度判断模块310,用于获取待识别的目标面单图像以及标准面单图像,并比较目标面单图像与标准面单图像之间的图像相似度。
目标置信度判断模块320,用于在图像相似度大于预设图像相似度阈值时,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度。
匹配模块330,用于在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找。
目标识别对象获取模块340,用于在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象。
识别结果获取模块350,将目标识别对象输入至设定断言接口,以获取与所述目标面单图像匹配的识别结果。
本发明实施例的技术方案,通过比较获取的目标面单图像与标准面单图像之间的图像相似度并判断目标断言文本和目标断言文本的目标置信度,之后将目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找,并根据匹配结果将整个识别过程生成的至少一个识别项组织得到目标识别对象,最后将目标识别对象输入至设定断言接口,以获取最终的识别结果,解决了通过人力识别电子面单时,电子面单识别的准确率与工作效率较低,电子面单识别的人力资源被浪费等问题,实现电子面单图像的自动化识别,提高了电子面单的识别准确率与工作效率,节约了电子面单识别过程中的人力资源投入。
在上述各实施例的基础上,图像相似度判断模块310,可以包括:
链接获取单元,用于获取目标标签链接以及基准标签链接;
图像下载单元,用于通过所述目标标签链接和基准标签链接,从服务器下载备选面单图像以及标准面单图像;
尺寸对比单元,用于比较所述备选面单图像与所述标准面单图像的图像尺寸是否一致;
尺寸调整单元,用于对所述备选面单图像进行尺寸调整,得到标准尺寸的目标面单图像。
在上述各实施例的基础上,图像相似度判断模块310还可以包括:
图像组合模块,用于将所述目标面单图像与标准面单图像组合得到对照面单图像;
色域差值对比单元,用于通过openCV工具,对对照面单图像中的目标面单图像与标准面单图像进行色域差值对比,得到所述图像相似度以及不一致的区域列表;
目标区域列表获取单元,用于对所述不一致的区域列表进行过滤后,得到目标区域列表,并在所述对照面单图像中标识所述目标区域列表。
在上述各实施例的基础上,目标置信度判断模块320可以包括:
算法获取模块,用于按照预设的比对顺序,从光学字符识别算法库中获取当前处理识别算法;
备选信息获取模块,用于通过所述当前处理识别算法,对所述目标面单图像进行光学字符识别,获取备选断言文本,以及所述备选断言文本的备选置信度;
目标置信度确定模块,用于如果所述备选置信度超过预设置信度阈值,则将备选断言文本确定为目标断言文本,并将备选置信度确定为目标置信度;
返回操作模块,用于如果备选置信度未超过预设置信度阈值,则根据备选置信度,更新已比对最大置信度后,返回执行按照预设的比对顺序,从光学字符识别算法库中获取当前处理识别算法的操作;
目标置信度获取模块,用于如果确定完成对全部光学字符识别算法的备选置信度均未超过预设置信度阈值,则将与已比对最大置信度对应的备选断言文本确定为目标断言文本,并将已比对最大置信度确定为目标置信度。
在上述各实施例的基础上,匹配模块330可以包括:
目标文本匹配单元,用于基于文本相似度在设定文本内容库中匹配与所述任一断言文本项的文本相似度达到预设相似度阈值的目标文本;
错误结果返回单元,用于若无法匹配到与任一一个断言文本项达到预设相似度阈值的目标文本,则对客户端返回错误结果。
在上述各实施例的基础上,目标文本匹配单元可以进一步包括:
二次匹配单元,用于若在首次匹配操作中无法找到与所述断言文本项具有预设相似度的目标文本,则基于面单排版规则组合对所述断言文本项进行处理,并将处理后的目标断言文本进行二次匹配。
在上述各实施例的基础上,识别结果获取模块,可以包括:
目标识别对象记录单元,用于将所述目标识别对象输入至断言接口,并记录所述目标识别对象;
识别结果记录单元,用于根据断言接口收到的目标识别对象,获取与所述目标面单图像匹配的识别结果,并记录所述识别结果。
本发明实施例所提供的电子面单的识别装置可执行本发明任意实施例所提供的电子面单的识别方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备410的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备410包括至少一个处理器420,以及与至少一个处理器420通信连接的存储器,如只读存储器(ROM)430、随机访问存储器(RAM)440等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器420可以根据存储在只读存储器(ROM)430中的计算机程序或者从存储单元490加载到随机访问存储器(RAM)440中的计算机程序,来执行各种适当的动作和处理。在RAM 440中,还可存储电子设备410操作所需的各种程序和数据。处理器420、ROM 430以及RAM440通过总线450彼此相连。输入/输出(I/O)接口460也连接至总线450。
电子设备410中的多个部件连接至I/O接口460,包括:输入单元470,例如键盘、鼠标等;输出单元480,例如各种类型的显示器、扬声器等;存储单元490,例如磁盘、光盘等;以及通信单元4100,例如网卡、调制解调器、无线通信收发机等。通信单元4100允许电子设备410通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器420可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器420的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器420执行上文所描述的各个方法和处理,例如电子面单的识别方法。
相应的,该方法包括:
获取待识别的目标面单图像以及标准面单图像,并比较目标面单图像与标准面单图像之间的图像相似度;
在图像相似度大于预设图像相似度阈值时,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度;
在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找;
在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象;
将目标识别对象输入至设定断言接口,以获取与所述目标面单图像匹配的识别结果。
在一些实施例中电子面单的识别方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元490。在一些实施例中,计算机程序的部分或者全部可以经由ROM 430和/或通信单元4100而被载入和/或安装到电子设备410上。当计算机程序加载到RAM 440并由处理器420执行时,可以执行上文描述的电子面单的识别方法的一个或多个步骤。备选地,在其他实施例中,处理器420可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行电子面单的识别方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种电子面单的识别方法,其特征在于,包括:
获取待识别的目标面单图像以及标准面单图像,并比较目标面单图像与标准面单图像之间的图像相似度;
在图像相似度大于预设图像相似度阈值时,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度;
在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找;
在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象;
将目标识别对象输入至设定断言接口,以获取与所述目标面单图像匹配的识别结果。
2.根据权利要求1所述的方法,其特征在于,获取待识别的目标面单图像以及标准面单图像,包括:
获取目标标签链接以及基准标签链接;
通过所述目标标签链接和基准标签链接,从服务器下载备选面单图像以及标准面单图像;
比较所述备选面单图像与所述标准面单图像的图像尺寸是否一致;
若否,则对所述备选面单图像进行尺寸调整,得到标准尺寸的目标面单图像。
3.根据权利要求2所述的方法,其特征在于,比较目标面单图像与标准面单图像之间的图像相似度,包括:
将所述目标面单图像与标准面单图像组合得到对照面单图像;
通过openCV工具,对对照面单图像中的目标面单图像与标准面单图像进行色域差值对比,得到所述图像相似度以及不一致的区域列表;
对所述不一致的区域列表进行过滤后,得到目标区域列表,并在所述对照面单图像中标识所述目标区域列表。
4.根据权利要求1-3任一项所述的方法,其特征在于,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度,包括:
按照预设的比对顺序,从光学字符识别算法库中获取当前处理识别算法;
通过所述当前处理识别算法,对所述目标面单图像进行光学字符识别,获取备选断言文本,以及所述备选断言文本的备选置信度;
如果所述备选置信度超过预设置信度阈值,则将备选断言文本确定为目标断言文本,并将备选置信度确定为目标置信度;
如果备选置信度未超过预设置信度阈值,则根据备选置信度,更新已比对最大置信度后,返回执行按照预设的比对顺序,从光学字符识别算法库中获取当前处理识别算法的操作;
如果确定完成对全部光学字符识别算法的备选置信度均未超过预设置信度阈值,则将与已比对最大置信度对应的备选断言文本确定为目标断言文本,并将已比对最大置信度确定为目标置信度。
5.根据权利要求1所述方法,其特征在于,在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找,包括:
基于文本相似度在设定文本内容库中匹配与所述任一断言文本项的文本相似度达到预设相似度阈值的目标文本;
若无法匹配到与任一一个断言文本项达到预设相似度阈值的目标文本,则对客户端返回错误结果。
6.根据权利要求5所述的方法,其特征在于,基于文本相似度在设定文本内容库中匹配与所述任一断言文本项的文本相似度达到预设相似度阈值的目标文本,包括:
若在首次匹配操作中无法找到与所述断言文本项具有预设相似度的目标文本,则基于面单排版规则组合对所述断言文本项进行处理,并将处理后的目标断言文本进行二次匹配。
7.根据权利要求1所述方法,其特征在于,将目标识别对象输入至设定断言接口,获取与所述目标面单图像匹配的识别结果,包括:
将所述目标识别对象输入至断言接口,并记录所述目标识别对象;
根据断言接口收到的目标识别对象,获取与所述目标面单图像匹配的识别结果,并记录所述识别结果;
其中,所述目标识别对象包括:最终断言结果、所述图像相似度与对照面单图像、所述目标置信度、文本相似度以及目标文本。
8.一种电子面单的识别装置,其特征在于,包括:
图像相似度判断模块,用于获取待识别的目标面单图像以及标准面单图像,并比较目标面单图像与标准面单图像之间的图像相似度;
目标置信度判断模块,用于在图像相似度大于预设图像相似度阈值时,通过预设的光学字符识别算法,获取与目标面单图像匹配的目标断言文本和目标断言文本的目标置信度;
匹配模块,用于在目标置信度大于预设置信度阈值时,将所述目标断言文本中包括的至少一个断言文本项在设定文本内容库中通过预设算法进行匹配查找;
目标识别对象获取模块,用于在各断言文本项均在文本内容库中查找到满足预设文本相似度的匹配文本时,将整个识别过程生成的至少一个识别项组织得到目标识别对象;
识别结果获取模块,将目标识别对象输入至设定断言接口,以获取与所述目标面单图像匹配的识别结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的电子面单的识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的电子面单的识别方法。
CN202311686565.5A 2023-12-06 2023-12-06 一种电子面单的识别方法、装置、设备及介质 Pending CN117523584A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311686565.5A CN117523584A (zh) 2023-12-06 2023-12-06 一种电子面单的识别方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311686565.5A CN117523584A (zh) 2023-12-06 2023-12-06 一种电子面单的识别方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN117523584A true CN117523584A (zh) 2024-02-06

Family

ID=89745679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311686565.5A Pending CN117523584A (zh) 2023-12-06 2023-12-06 一种电子面单的识别方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN117523584A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117854091A (zh) * 2024-01-15 2024-04-09 金锋馥(滁州)科技股份有限公司 基于图像特征检测的包裹多面密集标签信息提取方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117854091A (zh) * 2024-01-15 2024-04-09 金锋馥(滁州)科技股份有限公司 基于图像特征检测的包裹多面密集标签信息提取方法
CN117854091B (zh) * 2024-01-15 2024-06-07 金锋馥(滁州)科技股份有限公司 基于图像特征检测的包裹多面密集标签信息提取方法

Similar Documents

Publication Publication Date Title
CN113378833B (zh) 图像识别模型训练方法、图像识别方法、装置及电子设备
CN112633276B (zh) 训练方法、识别方法、装置、设备、介质
CN113836925B (zh) 预训练语言模型的训练方法、装置、电子设备及存储介质
CN113377958B (zh) 一种文档分类方法、装置、电子设备以及存储介质
CN117523584A (zh) 一种电子面单的识别方法、装置、设备及介质
CN114419035B (zh) 产品识别方法、模型训练方法、装置和电子设备
CN114429633B (zh) 文本识别方法、模型的训练方法、装置、电子设备及介质
CN113205041B (zh) 结构化信息提取方法、装置、设备和存储介质
CN114120304B (zh) 实体识别方法、装置及计算机程序产品
CN116151240A (zh) 关系抽取模型训练方法及装置、电子设备和存储介质
CN113657395A (zh) 文本识别方法、视觉特征提取模型的训练方法及装置
CN115311469A (zh) 图像标注方法、训练方法、图像处理方法以及电子设备
CN116309963B (zh) 一种图像的批量标注方法、装置、电子设备及存储介质
CN112580620A (zh) 标志图片处理方法、装置、设备和介质
CN116758373A (zh) 深度学习模型的训练方法、图像处理方法、装置和设备
CN116229211A (zh) 样本生成方法、模型训练方法、对象检测方法及装置
CN114612725B (zh) 图像处理方法、装置、设备及存储介质
CN116433936A (zh) 图像检测方法、装置、电子设备及存储介质
CN114239562B (zh) 文档中程序代码块的识别方法、装置和设备
CN114120305B (zh) 文本分类模型的训练方法、文本内容的识别方法及装置
CN112818972B (zh) 兴趣点图像的检测方法、装置、电子设备及存储介质
CN113554062B (zh) 多分类模型的训练方法、设备和存储介质
CN114998906B (zh) 文本检测方法、模型的训练方法、装置、电子设备及介质
CN118365990B (zh) 应用于违禁品检测的模型训练方法、装置及电子设备
CN106446902B (zh) 非文字图像识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination