CN109829457A - 一种图像数据处理方法、设备及计算机可读存储介质 - Google Patents

一种图像数据处理方法、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109829457A
CN109829457A CN201910015284.4A CN201910015284A CN109829457A CN 109829457 A CN109829457 A CN 109829457A CN 201910015284 A CN201910015284 A CN 201910015284A CN 109829457 A CN109829457 A CN 109829457A
Authority
CN
China
Prior art keywords
information
field
image data
text
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910015284.4A
Other languages
English (en)
Inventor
许洋
刘鹏
王健宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910015284.4A priority Critical patent/CN109829457A/zh
Publication of CN109829457A publication Critical patent/CN109829457A/zh
Priority to PCT/CN2019/116971 priority patent/WO2020140608A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种图像数据处理方法、设备及计算机可读存储介质,该方法包括:接收业务终端发送的待检测的图像数据;对待检测的图像数据中的字段信息进行标注,以得到字段标注信息;根据字段标注信息确定待检测的图像数据中字段信息的位置信息,并根据位置信息对待检测的图像数据进行裁剪,得到与位置信息对应的字段图像数据;获取字段图像数据中的文本信息,并根据文本信息对字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息;基于识别模型对文本位置标注信息和字段图像数据进行处理,以识别出字段图像数据中的文本信息。通过这种方式,可实现根据标注信息快速识别文本信息,从而提高识别效率。

Description

一种图像数据处理方法、设备及计算机可读存储介质
技术领域
本发明涉及图像数据处理技术领域,尤其涉及一种图像数据处理方法、设备及计算机可读存储介质。
背景技术
目前绝大部分工业上应用的深度学习的算法都属于有监督学习,基于这一特性,只有在图像数据都标注好的情况下,才能够继续后面的深度学习的模型训练,而这些标注的数据一般都不是现成的,这意味着需要去人工手动制作,大量标注数据和有限的标注人力的落差也导致项目的工期普遍较长,而工期越长,成本也越高。因此如何更有效地缩短工期以及提升效率成为研究的重点。
发明内容
本发明实施例提供一种图像数据处理方法、设备及计算机可读存储介质,可根据标注信息快速识别文本信息,提高了识别效率。
第一方面,本发明实施例提供了一种图像数据处理方法,该方法包括:
接收业务终端发送的待检测的图像数据,所述待检测的图像数据包括字段信息;
对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息;
根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,并根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据;
获取所述字段图像数据中的文本信息,并根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息;
基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。
进一步地,所述字段信息包括载体数据和载体数据中的字段数据;所述对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息,包括:
对所述待检测的图像数据中的载体数据进行标注,得到载体的标注数据;以及,
对所述载体数据中的字段数据进行标注,得到字段的标注数据;
将所述载体的标注数据和所述字段的标注数据确定为所述字段标注信息。
进一步地,所述根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,包括:
根据所述字段标注信息中载体的标注数据,确定出所述待检测的图像数据中载体的位置信息;
根据所述载体的位置信息和所述字段标注信息中字段的标注数据,确定出所述字段在所述载体中的相对位置信息;
所述根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据,包括:
根据所述字段在所述载体中的相对位置信息对所述载体中的字段进行裁剪,得到与所述相对位置信息对应的字段图像数据。
进一步地,所述根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息,包括:
根据所述文本信息对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字;
对每一个文字的位置信息进行标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息。
进一步地,所述基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息,包括:
基于所述识别模型对所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息进行识别,确定出与所述每一个文字的文本位置标注信息对应的位置信息;
按照与所述每一个文字的文本位置标注信息对应的位置信息,对所述文本信息中的文字进行排列组合,以得到所述字段图像数据中的文本信息。
进一步地,所述基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理之前,还包括:
获取样本字段图像数据,所述样本字段图像数据中包括文本位置标注信息;
根据预设的识别算法生成初始识别模型;
基于所述包括文本位置标注信息的样本字段图像数据对所述初始识别模型进行训练,得到所述识别模型。
进一步地,所述获取样本数据集之前,还包括:
获取样本图像数据,所述样本图像数据包括样本字段信息;
对所述样本图像数据的样本字段信息进行标注,以得到样本字段标注信息;
根据所述样本字段标注信息,确定所述样本图像数据中样本字段信息的位置信息;
根据所述样本字段信息的位置信息对所述样本图像数据进行裁剪,得到与所述样本字段信息的位置信息对应的样本字段图像数据。
第二方面,本发明实施例提供了一种图像数据处理设备,该图像数据处理设备包括用于执行上述第一方面的图像数据处理方法的单元。
第三方面,本发明实施例提供了另一种图像数据处理设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持图像数据处理设备执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本发明实施例,通过对图像数据中的字段信息进行标注,确定出所述图像数据中字段的位置信息,并根据字段的位置信息从所述图像数据中裁剪得到字段图像数据,以通过对字段图像数据中文本的位置信息进行标注,得到文本位置标注信息,并基于识别模型对包括文本位置标注信息的字段图像数据进行识别,可根据文本位置标注信息快速识别文本信息,从而提高识别效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种图像数据处理方法的示意流程图;
图2是本发明实施例提供的另一种图像数据处理方法的示意流程图;
图3是本发明实施例提供的一种图像数据处理设备的示意框图;
图4是本发明实施例提供的另一种图像数据处理设备示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的图像数据处理方法可以由一种图像数据处理系统执行,其中,所述图像数据处理系统包括图像数据处理设备和业务终端,在某些实施例中,所述图像数据处理设备可以设置在手机、电脑、平板、智能手表等智能终端上。在某些实施例中,所述图像数据处理设备和所述业务终端之间可以建立通信连接,以进行双向通信。在某些实施例中,所述图像数据处理设备可以安装在所述业务终端上,在某些实施例中,所述图像数据处理设备可以在空间上独立于所述业务终端,在某些实施例中,所述图像数据处理设备可以是所述业务终端的部件,即所述业务终端包括图像数据处理设备。在某些实施例中,所述业务终端可以包括:手机、电脑、平板、智能手表等智能终端。
本发明实施例中,所述图像数据处理系统中的所述业务终端可以向图像数据处理设备发送待检测的图像数据,以使所述图像数据处理设备可以接收业务终端发送的包括字段信息待检测的图像数据,并对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息。所述图像数据处理设备可以根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,从而根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据。所述图像数据处理设备可以获取所述字段图像数据中的文本信息,并根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息,以及基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。下面结合附图对本发明实施例的图像数据处理方法进行示意性说明。
请参见图1,图1是本发明实施例提供的一种图像数据处理方法的示意流程图,如图1所示,该方法可以由图像数据处理设备执行,所述图像数据处理设备的具体解释如前所述,此处不再赘述。具体地,本发明实施例的所述方法包括如下步骤。
S101:接收业务终端发送的待检测的图像数据,所述待检测的图像数据包括字段信息。
本发明实施例中,图像数据处理设备可以接收业务终端发送的待检测的图像数据,所述待检测的图像数据中包括字段信息。在某些实施例中,所述字段信息可以包括载体数据和载体数据中的字段数据。在某些实施例中,所述载体数据可以包括发票数据、证件数据等任意一种或多种。
S102:对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息。
本发明实施例中,图像数据处理设备可以对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息。
在一些实施例中,所述图像数据处理设备内可以设置预设的标注工具,所述图像处理设备在接收到业务终端发送的待检测的图像数据时,可以触发调用所述预设的标注工具对所述待检测的图像数据中的字段信息进行标注,得到字段标注信息。所述预设的标注工具可以将所述字段标注信息返回给所述图像数据处理设备,以使所述图像处理设备获取到所述字段标注信息。
在某些实施例中,所述图像数据处理设备在调用所述预设的标注工具对所述待检测的图像数据中的字段信息进行标注之前,可以输出提示界面,所述提示界面用于提示用户选择标注方式,以便所述图像数据处理设备将用户所选择的标注方式发送给所述预设的标注工具,以便所述预设的标注工具按照用户所选择的标注方式对所述图像数据的字段信息进行标注。在某些实施例中,所述标注方式可以为画圈、画矩形、文字标注等任意一种方式,本发明实施例不做具体限定。
例如,假设图像数据处理设备获取到用户所选择的标注方式为画圈的方式,则所述图像数据处理设备可以将用户所选择的花圈的标注方式发送给预设的标注工具,以使所述预设的标注工具对所述待检测的图像数据中的字段数据进行画圈,将字段数据从所述图像数据中圈出来,以实现对所述字段数据进行标注,并将标注结果返回给所述图像数据处理设备。
在一个实施例中,所述字段信息包括载体数据和载体数据中的字段数据,所述图像数据处理设备可以调用预设的标注工具对所述待检测的图像数据中的载体数据进行标注,得到载体的标注数据,以及对所述载体数据中的字段数据进行标注,得到字段的标注数据,从而将所述载体的标注数据和所述字段的标注数据确定为所述字段标注信息。在某些实施例中,所述标注方式如前所述,此处不再赘述。
例如,假设所述待检测的图像数据中的载体数据为发票数据,则所述图像数据处理设备可以调用预设的标注工具对所述待检测的图像数据中的发票数据进行画圈标注,以得到所述发票数据的标注数据,以及对所述载体数据中的字段数据进行画圈标注,以得到字段的标注数据,从而将所述发票的标注数据和所述字段的标注数据确定为所述字段标注信息。
在一些实施例中,因为实际业务上需求的字段的识别一般都是出现在特定的载体上(如发票、证件等),所以图像数据处理设备需要检测两个部分:一方面是对载体(发票、证件等)的位置信息的检测;另一方面是对字段的位置信息的检测。
S103:根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,并根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据。
本发明实施例中,图像数据处理设备可以根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,并根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据。
在一个实施例中,所述图像数据处理设备可以将所述待检测的图像数据中的字段标注信息输入预设的检测模型中进行检测,以得到所述待检测的图像数据中字段信息的位置信息。
S104:获取所述字段图像数据中的文本信息,并根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息。
本发明实施例中,图像数据处理设备可以获取所述字段图像数据中的文本信息,并根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息。
在一个实施例中,所述图像数据处理设备在对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息时,可以对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字,并调用预设的标注工具对每一个文字的位置信息进行标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息。在某些实施例中,所述标注方式如前所述。
例如,假设所述字段图像数据中包括的文本信息为“我爱中国”,则所述图像数据处理设备可以对所述字段图像数据中“我爱中国”的文本信息进行拆分,得到与所述文本信息对应的每个文字“我”、“爱”、“中”、“国”,并调用预设的标注工具对所述字段图像数据中的“我”、“爱”、“中”、“国”四个字的位置信息进行标注,以得到所述字段图像数据中“我”、“爱”、“中”、“国”四个字的文本位置标注信息。
S105:基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。
本发明实施例中,图像数据处理设备可以基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。
在一个实施例中,所述图像数据处理设备在基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息时,可以基于所述识别模型对所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息进行识别,确定出与所述每一个文字的文本位置标注信息对应的位置信息,并按照与所述每一个文字的文本位置标注信息对应的位置信息,对所述文本信息中的文字进行排列组合,以得到所述字段图像数据中的文本信息。
在一个实施例中,所述图像数据处理设备在基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理之前,可以获取样本字段图像数据,所述样本字段图像数据中包括文本位置标注信息,并根据预设的识别算法生成初始识别模型,以及基于所述包括文本位置标注信息的样本字段图像数据对所述初始识别模型进行训练,得到所述识别模型。
在一个实施例中,所述图像数据处理设备获取样本数据集之前,还可以获取样本图像数据,所述样本图像数据包括样本字段信息,并对所述样本图像数据的样本字段信息进行标注,以得到样本字段标注信息,以及根据所述样本字段标注信息,确定所述样本图像数据中样本字段信息的位置信息,从而根据所述样本字段信息的位置信息对所述样本图像数据进行裁剪,得到与所述样本字段信息的位置信息对应的样本字段图像数据。
本发明实施例,图像数据处理设备可以对待检测的图像数据中的字段信息进行标注,以得到字段标注信息,并根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息。所述图像数据处理设备可以根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据,并根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息,从而基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。通过这种方式,可实现根据标注信息快速识别文本信息,从而提高识别效率。
请参见图2,图2是本发明实施例提供的另一种图像数据处理方法的示意流程图,如图2所示,该方法可以由图像数据处理设备执行,该图像数据处理设备的具体解释如前所述,此处不再赘述。本发明实施例与上述图1所述实施例的区别在于,本发明实施例是对所述图像数据处理方法的具体实施过程进行示意性说明。具体地,本发明实施例的所述方法包括如下步骤。
S201:接收业务终端发送的待检测的图像数据,所述待检测的图像数据包括字段信息。
本发明实施例中,图像数据处理设备可以接收业务终端发送的待检测的图像数据,所述待检测的图像数据包括字段信息。在某些实施例中,所述字段信息可以包括载体数据和载体数据中的字段数据。在某些实施例中,所述载体数据可以包括发票数据、证件数据等。
S202:对所述待检测的图像数据中的载体数据进行标注,得到载体的标注数据,以及对所述载体数据中的字段数据进行标注,得到字段的标注数据。
本发明实施例中,图像数据处理设备可以对所述待检测的图像数据中的载体数据进行标注,得到载体的标注数据,以便图像数据处理设备后续可以根据载体的标注数据确定载体在所述待检测的图像数据中的位置信息。所述图像数据处理设备还可以对所述载体数据中的字段数据进行标注,得到字段的标注数据,以便所述图像数据处理设备后续可以根据所述字段的标注数据,确定出所述字段在载体中的位置信息。在某些实施例中,所述载体包括发票、证件等。
例如,假设所述载体为证件,则所述图像数据处理设备可以对所述待检测的图像数据中的证件所对应的位置进行画圈标注,得到证件的标注数据。以及所述图像数据处理设备可以对所述载体数据中的字段数据进行画圈标注,得到字段的标注数据。
S203:将所述载体的标注数据和所述字段的标注数据确定为所述字段标注信息。
本发明实施例中,图像数据处理设备可以将所述载体的标注数据和所述字段的标注数据确定为所述字段标注信息。
S204:根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息。
本发明实施例中,图像数据处理设备可以根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息。
在一个实施例中,所述图像数据处理设备在根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息时,可以根据所述字段标注信息中载体的标注数据,确定出所述待检测的图像数据中载体的位置信息,并根据所述载体的位置信息和所述字段标注信息中字段的标注数据,确定出所述字段在所述载体中的相对位置信息。
在一个实施例中,所述图像数据处理设备在根据所述载体的位置信息和所述字段标注信息中字段的标注数据,确定出所述字段在所述载体中的相对位置信息时,可以根据所述字段标注信息中字段的标注数据,确定出所述字段在所述待检测的图像数据中的位置信息。所述图像数据处理设备可以根据所述载体在所述待检测的图像数据中的位置信息和所述字段在所述待检测的图像数据中的位置信息,确定出所述字段在所述载体中的相对位置信息。
例如,假设所述载体在所述待检测的图像数据中的位置信息为第一位置,如果所述图像数据处理设备根据所述字段标注信息中字段的标注数据,确定出所述字段在所述待检测的图像数据中的位置信息为第二位置,则所述图像数据处理设备可以根据所述第一位置和第二位置,确定出所述字段在所述载体中的相对位置信息。
S205:根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据。
本发明实施例中,图像数据处理设备可以根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据。
在一个实施例中,所述图像数据处理设备在根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据时,可以根据所述字段在所述载体中的相对位置信息对所述载体中的字段进行裁剪,得到与所述相对位置信息对应的字段图像数据。
S206:对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字。
本发明实施例中,图像数据处理设备可以对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字。
在一个实施例中,所述图像数据处理设备可以获取所述字段图像数据中的文本信息,并对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字。
S207:对每一个文字的位置信息进行标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息。
本发明实施例中,图像数据处理设备可以对每一个文字的位置信息进行标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息。
在一个实施例中,所述图像数据处理可以调用预设的标注工具对所述文本信息中的每一个文字进行画圈标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息,具体实施例如前所述。
在一个实施例中,所述图像数据处理可以调用预设的标注工具对所述文本信息中的每一个文字进行画矩形框标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息,具体实施例如前所述。
S208:基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。
本发明实施例中,图像数据处理设备可以基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。在某些实施例中,所述识别模型的训练生成过程如前所述,此处不再赘述。
本发明实施例中,图像数据处理设备可以对所述待检测的图像数据中的载体数据进行标注,得到载体的标注数据,以及对所述载体数据中的字段数据进行标注,得到字段的标注数据,从而将所述载体的标注数据和所述字段的标注数据确定为所述字段标注信息。所述图像数据处理设备可以根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,并根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据。所述图像数据处理设备额可以对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字,并对每一个文字的位置信息进行标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息,以及基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。通过这种方式,可实现根据标注信息快速识别文本信息,从而提高识别效率和识别的准确率。
本发明实施例还提供了一种图像数据处理设备,该图像数据处理设备用于执行前述任一项所述的方法的单元。具体地,参见图3,图3是本发明实施例提供的一种图像数据处理设备的示意框图。本实施例的图像数据处理设备包括:接收单元301、第一标注单元302、确定单元303、第二标注单元304以及识别单元305。
接收单元301,用于接收业务终端发送的待检测的图像数据,所述待检测的图像数据包括字段信息;
第一标注单元302,用于对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息;
确定单元303,用于根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,并根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据;
第二标注单元304,用于获取所述字段图像数据中的文本信息,并根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息;
识别单元305,用于基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。
进一步地,所述字段信息包括载体数据和载体数据中的字段数据;所述第一标注单元302对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息时,具体用于:
对所述待检测的图像数据中的载体数据进行标注,得到载体的标注数据;以及,
对所述载体数据中的字段数据进行标注,得到字段的标注数据;
将所述载体的标注数据和所述字段的标注数据确定为所述字段标注信息。
进一步地,所述确定单元303根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息时,具体用于:
根据所述字段标注信息中载体的标注数据,确定出所述待检测的图像数据中载体的位置信息;
根据所述载体的位置信息和所述字段标注信息中字段的标注数据,确定出所述字段在所述载体中的相对位置信息;
所述确定单元303根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据时,具体用于:
根据所述字段在所述载体中的相对位置信息对所述载体中的字段进行裁剪,得到与所述相对位置信息对应的字段图像数据。
进一步地,所述第二标注单元304根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息时,具体用于:
根据所述文本信息对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字;
对每一个文字的位置信息进行标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息。
进一步地,所述识别单元305基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息时,具体用于:
基于所述识别模型对所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息进行识别,确定出与所述每一个文字的文本位置标注信息对应的位置信息;
按照与所述每一个文字的文本位置标注信息对应的位置信息,对所述文本信息中的文字进行排列组合,以得到所述字段图像数据中的文本信息。
进一步地,所述识别单元305基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理之前,还用于:
获取样本字段图像数据,所述样本字段图像数据中包括文本位置标注信息;
根据预设的识别算法生成初始识别模型;
基于所述包括文本位置标注信息的样本字段图像数据对所述初始识别模型进行训练,得到所述识别模型。
进一步地,所述识别单元305获取样本数据集之前,还用于:
获取样本图像数据,所述样本图像数据包括样本字段信息;
对所述样本图像数据的样本字段信息进行标注,以得到样本字段标注信息;
根据所述样本字段标注信息,确定所述样本图像数据中样本字段信息的位置信息;
根据所述样本字段信息的位置信息对所述样本图像数据进行裁剪,得到与所述样本字段信息的位置信息对应的样本字段图像数据。
本发明实施例中,图像数据处理设备可以对待检测的图像数据中的字段信息进行标注,以得到字段标注信息,并根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息。所述图像数据处理设备可以根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据,并对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息,从而基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。通过这种方式,可实现根据标注信息快速识别文本信息,从而提高识别效率。
参见图4,图4是本发明实施例提供的另一种图像数据处理设备示意框图。如图所示的本实施例中的图像数据处理设备可以包括:一个或多个处理器401;一个或多个输入设备402,一个或多个输出设备403和存储器404。上述处理器401、输入设备402、输出设备403和存储器404通过总线405连接。存储器404用于存储计算机程序,所述计算机程序包括程序指令,处理器401用于执行存储器404存储的程序指令。其中,处理器401被配置用于调用所述程序指令执行:
接收业务终端发送的待检测的图像数据,所述待检测的图像数据包括字段信息;
对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息;
根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,并根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据;
获取所述字段图像数据中的文本信息,并根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息;
基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。
进一步地,所述字段信息包括载体数据和载体数据中的字段数据;所述处理器401对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息时,具体用于:
对所述待检测的图像数据中的载体数据进行标注,得到载体的标注数据;以及,
对所述载体数据中的字段数据进行标注,得到字段的标注数据;
将所述载体的标注数据和所述字段的标注数据确定为所述字段标注信息。
进一步地,所述处理器401根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息时,具体用于:
根据所述字段标注信息中载体的标注数据,确定出所述待检测的图像数据中载体的位置信息;
根据所述载体的位置信息和所述字段标注信息中字段的标注数据,确定出所述字段在所述载体中的相对位置信息;
所述处理器401根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据时,具体用于:
根据所述字段在所述载体中的相对位置信息对所述载体中的字段进行裁剪,得到与所述相对位置信息对应的字段图像数据。
进一步地,所述处理器401根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息时,具体用于:
根据所述文本信息对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字;
对每一个文字的位置信息进行标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息。
进一步地,所述处理器401基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息时,具体用于:
基于所述识别模型对所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息进行识别,确定出与所述每一个文字的文本位置标注信息对应的位置信息;
按照与所述每一个文字的文本位置标注信息对应的位置信息,对所述文本信息中的文字进行排列组合,以得到所述字段图像数据中的文本信息。
进一步地,所述处理器401基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理之前,还用于:
获取样本字段图像数据,所述样本字段图像数据中包括文本位置标注信息;
根据预设的识别算法生成初始识别模型;
基于所述包括文本位置标注信息的样本字段图像数据对所述初始识别模型进行训练,得到所述识别模型。
进一步地,所述处理器401获取样本数据集之前,还用于:
获取样本图像数据,所述样本图像数据包括样本字段信息;
对所述样本图像数据的样本字段信息进行标注,以得到样本字段标注信息;
根据所述样本字段标注信息,确定所述样本图像数据中样本字段信息的位置信息;
根据所述样本字段信息的位置信息对所述样本图像数据进行裁剪,得到与所述样本字段信息的位置信息对应的样本字段图像数据。
本发明实施例中,图像数据处理设备可以对待检测的图像数据中的字段信息进行标注,以得到字段标注信息,并根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息。所述图像数据处理设备可以根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据,并对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息,从而基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。通过这种方式,可实现根据标注信息快速识别文本信息,从而提高识别效率。
应当理解,在本发明实施例中,所称处理器401可以是中央处理单元(CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigiSalSignal Processor,DSP)、专用集成电路(ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列(Field-Programmable GaSe Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备402可以包括触控板、麦克风等,输出设备403可以包括显示器(LCD等)、扬声器等。
该存储器404可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器404的一部分还可以包括非易失性随机存取存储器。例如,存储器404还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器401、输入设备402、输出设备403可执行本发明实施例提供的图像数据处理方法的图1或图2所述的方法实施例中所描述的实现方式,也可执行本发明实施例图3或图4所描述的图像数据处理设备的实现方式,在此不再赘述。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图1或图2所对应实施例中描述的图像数据处理方法,也可实现本发明图3或图4所对应实施例的图像数据处理设备,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的图像数据处理设备的内部存储单元,例如图像数据处理设备的硬盘或内存。所述计算机可读存储介质也可以是所述图像数据处理设备的外部存储设备,例如所述图像数据处理设备上配备的插接式硬盘,智能存储卡(SmarS Media Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(FlashCard)等。进一步地,所述计算机可读存储介质还可以既包括所述图像数据处理设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述图像数据处理设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种图像数据处理方法,其特征在于,包括:
接收业务终端发送的待检测的图像数据,所述待检测的图像数据包括字段信息;
对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息;
根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,并根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据;
获取所述字段图像数据中的文本信息,并根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息;
基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息。
2.根据权利要求1所述的方法,其特征在于,所述字段信息包括载体数据和载体数据中的字段数据;所述对所述待检测的图像数据中的字段信息进行标注,以得到字段标注信息,包括:
对所述待检测的图像数据中的载体数据进行标注,得到载体的标注数据;以及,
对所述载体数据中的字段数据进行标注,得到字段的标注数据;
将所述载体的标注数据和所述字段的标注数据确定为所述字段标注信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述字段标注信息确定所述待检测的图像数据中字段信息的位置信息,包括:
根据所述字段标注信息中载体的标注数据,确定出所述待检测的图像数据中载体的位置信息;
根据所述载体的位置信息和所述字段标注信息中字段的标注数据,确定出所述字段在所述载体中的相对位置信息;
所述根据所述位置信息对所述待检测的图像数据进行裁剪,得到与所述位置信息对应的字段图像数据,包括:
根据所述字段在所述载体中的相对位置信息对所述载体中的字段进行裁剪,得到与所述相对位置信息对应的字段图像数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息对所述字段图像数据中文本的位置信息进行标注,以得到文本位置标注信息,包括:
根据所述文本信息对所述字段图像数据中的文本信息进行拆分,得到与所述文本信息对应的每个文字;
对每一个文字的位置信息进行标注,以得到所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息。
5.根据权利要求4所述的方法,其特征在于,所述基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理,以识别出所述字段图像数据中的文本信息,包括:
基于所述识别模型对所述字段图像数据中与所述文本信息对应的每一个文字的文本位置标注信息进行识别,确定出与所述每一个文字的文本位置标注信息对应的位置信息;
按照与所述每一个文字的文本位置标注信息对应的位置信息,对所述文本信息中的文字进行排列组合,以得到所述字段图像数据中的文本信息。
6.根据权利要求1所述的方法,其特征在于,所述基于识别模型对所述文本位置标注信息和所述字段图像数据进行处理之前,还包括:
获取样本字段图像数据,所述样本字段图像数据中包括文本位置标注信息;
根据预设的识别算法生成初始识别模型;
基于所述包括文本位置标注信息的样本字段图像数据对所述初始识别模型进行训练,得到所述识别模型。
7.根据权利要求6所述的方法,其特征在于,所述获取样本数据集之前,还包括:
获取样本图像数据,所述样本图像数据包括样本字段信息;
对所述样本图像数据的样本字段信息进行标注,以得到样本字段标注信息;
根据所述样本字段标注信息,确定所述样本图像数据中样本字段信息的位置信息;
根据所述样本字段信息的位置信息对所述样本图像数据进行裁剪,得到与所述样本字段信息的位置信息对应的样本字段图像数据。
8.一种图像数据处理设备,其特征在于,包括用于执行如权利要求1-7任一项权利要求所述的方法的单元。
9.一种图像数据处理设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN201910015284.4A 2019-01-04 2019-01-04 一种图像数据处理方法、设备及计算机可读存储介质 Pending CN109829457A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910015284.4A CN109829457A (zh) 2019-01-04 2019-01-04 一种图像数据处理方法、设备及计算机可读存储介质
PCT/CN2019/116971 WO2020140608A1 (zh) 2019-01-04 2019-11-11 一种图像数据处理方法、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910015284.4A CN109829457A (zh) 2019-01-04 2019-01-04 一种图像数据处理方法、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN109829457A true CN109829457A (zh) 2019-05-31

Family

ID=66860007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910015284.4A Pending CN109829457A (zh) 2019-01-04 2019-01-04 一种图像数据处理方法、设备及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN109829457A (zh)
WO (1) WO2020140608A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020140608A1 (zh) * 2019-01-04 2020-07-09 平安科技(深圳)有限公司 一种图像数据处理方法、设备及计算机可读存储介质
WO2020140607A1 (zh) * 2019-01-04 2020-07-09 平安科技(深圳)有限公司 一种语音信号处理方法、设备及计算机可读存储介质
CN111768405A (zh) * 2020-08-05 2020-10-13 赛维森(广州)医疗科技服务有限公司 处理标注图像的方法、装置、设备和存储介质
WO2021057138A1 (zh) * 2019-09-27 2021-04-01 支付宝(杭州)信息技术有限公司 一种证件识别方法及装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112084932B (zh) * 2020-09-07 2023-08-08 中国平安财产保险股份有限公司 基于图像识别的数据处理方法、装置、设备及存储介质
CN112766418A (zh) * 2021-03-02 2021-05-07 阳光财产保险股份有限公司 图像文本方向分类方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086756A (zh) * 2018-06-15 2018-12-25 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100517374C (zh) * 2005-12-29 2009-07-22 佳能株式会社 从复杂背景文档图像提取文本的装置、方法
CN104850819B (zh) * 2014-02-18 2018-07-03 联想(北京)有限公司 信息处理方法及电子设备
CN104866849A (zh) * 2015-04-30 2015-08-26 天津大学 一种基于移动终端的食品营养成分标签识别方法
CN108549843A (zh) * 2018-03-22 2018-09-18 南京邮电大学 一种基于图像处理的增值税发票识别方法
CN109829457A (zh) * 2019-01-04 2019-05-31 平安科技(深圳)有限公司 一种图像数据处理方法、设备及计算机可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086756A (zh) * 2018-06-15 2018-12-25 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李翌昕 等: "文本检测算法的发展与挑战", 信号处理, vol. 33, no. 04, pages 558 - 571 *
杨学博: "街景地图中基于文字识别的自动标注研究", 中国高新技术企业, no. 13, pages 18 - 19 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020140608A1 (zh) * 2019-01-04 2020-07-09 平安科技(深圳)有限公司 一种图像数据处理方法、设备及计算机可读存储介质
WO2020140607A1 (zh) * 2019-01-04 2020-07-09 平安科技(深圳)有限公司 一种语音信号处理方法、设备及计算机可读存储介质
WO2021057138A1 (zh) * 2019-09-27 2021-04-01 支付宝(杭州)信息技术有限公司 一种证件识别方法及装置
CN111768405A (zh) * 2020-08-05 2020-10-13 赛维森(广州)医疗科技服务有限公司 处理标注图像的方法、装置、设备和存储介质
CN111768405B (zh) * 2020-08-05 2024-02-13 赛维森(广州)医疗科技服务有限公司 处理标注图像的方法、装置、设备和存储介质

Also Published As

Publication number Publication date
WO2020140608A1 (zh) 2020-07-09

Similar Documents

Publication Publication Date Title
CN109829457A (zh) 一种图像数据处理方法、设备及计算机可读存储介质
CN110335367A (zh) 设备巡检方法、设备巡检装置及终端设备
US20130246920A1 (en) Method of enabling voice input for a visually based interface
CN108388674A (zh) 用于推送信息的方法和装置
CN107404481B (zh) 用户信息识别方法及装置
CN104053126B (zh) 显示通话双方位置的无线通信终端、装置及方法
CN107580128A (zh) 待办事项处理方法及装置、终端及可读存储介质
EP3866410B1 (en) Message display method, apparatus, and device
CN107256707A (zh) 一种语音识别方法、系统及终端设备
CN110231947A (zh) 一种应用程序的插件更新方法、设备、服务器及存储介质
CN103065625A (zh) 一种数字语音标签的添加方法及装置
CN106101358A (zh) 一种联系人信息更新的方法及智能设备
CN103369118B (zh) 来电管理系统及其来电管理方法
CN104484486A (zh) 一种信息推荐方法及电子设备
CN109102264A (zh) 一种电子红包检测方法、装置及终端设备
CN104159204A (zh) 基于短信的信息交互方法和装置
CN103297582B (zh) 一种对语音通信内容进行处理的方法及电子设备
CN109002434A (zh) 客服问答匹配方法、服务器及存储介质
CN109862399A (zh) 显示富媒体信息的方法、处理富媒体信息的方法、计算机装置及计算机可读存储介质
CN107729306A (zh) 一种文本处理方法、终端及计算机可读介质
CN106358220A (zh) 异常联系人信息的检测方法、装置及系统
CN107819937A (zh) 一种备忘信息提醒方法及装置、终端和可读存储介质
CN104932661A (zh) 一种信息提示方法及电子设备
CN109857450B (zh) 一种校验服务编排方法及装置
CN107515666A (zh) 一种数据管理方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination