CN114724136A - 标注数据生成的方法及电子设备 - Google Patents
标注数据生成的方法及电子设备 Download PDFInfo
- Publication number
- CN114724136A CN114724136A CN202210459229.6A CN202210459229A CN114724136A CN 114724136 A CN114724136 A CN 114724136A CN 202210459229 A CN202210459229 A CN 202210459229A CN 114724136 A CN114724136 A CN 114724136A
- Authority
- CN
- China
- Prior art keywords
- image
- data
- filling
- target
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000002372 labelling Methods 0.000 claims abstract description 41
- 238000012545 processing Methods 0.000 claims abstract description 11
- 230000004927 fusion Effects 0.000 claims description 12
- 238000010586 diagram Methods 0.000 description 15
- 238000001514 detection method Methods 0.000 description 12
- 238000012015 optical character recognition Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请属于图像处理技术领域,公开了标注数据生成的方法及电子设备,该方法包括,基于目标业务数据,生成模板图像;按照标注配置参数,对模板图像进行数据填充,生成图像样本;基于图像样本中的填充数据,生成图像样本对应的图像标注信息。这样,减少了人工标注耗费的人力成本、时间成本以及标注误差,提高了标注数据生成的效率和准确度。
Description
技术领域
本申请涉及图像处理技术领域,具体而言,涉及标注数据生成的方法及电子设备。
背景技术
随着互联网技术的发展,光学字符识别(Optical Character Recognition,OCR)检测技术的应用也越来越普及。OCR检测技术用于对图像进行文本识别以获得图像中的文字。
现有技术下,通常采用人工标注的方式,生成包含图像样本和图像标注信息的标注数据,并通过标注数据进行模型训练,获得用于OCR检测的OCR模型。
但是,采用人工标注的方式生成标注数据,会耗费大量的人力成本和时间成本,以及人工标注可能会存在一定的标注误差。
发明内容
本申请实施例的目的在于提供标注数据生成的方法及电子设备,用以在生成标注数据时,减少耗费的人力成本和时间成本,以及提高标注的准确度。
一方面,提供一种标注数据生成的方法,包括:基于目标业务数据,生成模板图像;按照标注配置参数,对模板图像进行数据填充,生成图像样本;基于图像样本中的填充数据,生成图像样本对应的图像标注信息。
在上述实现过程中,减少了人工标注耗费的人力成本、时间成本以及标注误差,提高了标注数据生成的效率和准确度。
一种实施方式中,方法还包括:根据图像样本和图像标注信息,生成标注数据。
在上述实现过程中,可以生成包含图像样本及其对应的图像标注信息的标注数据。
一种实施方式中,基于目标业务数据,生成模板图像,包括:获取针对目标业务拍摄的目标业务图像,目标业务图像为目标业务数据;对目标业务图像中指定区域的数据进行清除,获得模板图像。
一种实施方式中,基于目标业务数据,生成模板图像,包括:获取用户基于目标业务数据下发的绘图指令;基于绘图指令进行图像绘制,生成模板图像。
一种实施方式中,基于目标业务数据,生成模板图像,包括:响应于用户针对模板配置界面的组件选取操作,获取用户从模板配置界面的各图像组件中选取的多个目标图像组件,模板配置界面为用于生成模板图像的应用界面,图像组件为用于生成图像的组件;响应于用户的组件配置操作,配置各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,目标图像组件、组件参数以及位置关系均是基于目标业务数据设置的;根据各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,生成模板图像。
在上述实现过程中,可以采用拍摄图像、图像绘制以及图像组件组合等方式,生成模板图像。
一种实施方式中,按照标注配置参数,对模板图像进行数据填充,生成图像样本,包括:基于标注配置参数,确定待填充区域的区域位置;基于标注配置参数,确定待填充区域的填充内容;按照区域位置,将填充内容填充到模板图像中的待填充区域内,生成图像样本。
在上述实现过程中,可以通过选取的填充内容代替用户隐私信息,在模板图像中填充数据,生成不同的图像样本,解决了关键标注信息缺失的问题。
一种实施方式中,基于标注配置参数,确定待填充区域的区域位置,包括:从标注配置参数中,获取待填充区域的填充区域范围;从填充区域范围中,随机选取待填充区域的区域位置。
一种实施方式中,基于标注配置参数,确定待填充区域的填充内容,包括:从标注配置参数中,获取针对待填充区域设置的语料集合,语料集合为用于填充到模板图像中的信息的集合;若确定语料集合为非空集,则从语料集合中,随机选取待填充区域的填充内容;若确定语料集合为空集,则从标注配置参数中,获取针对待填充区域设置的指定的填充内容。
一种实施方式中,按照区域位置,将填充内容填充到模板图像中的待填充区域内,包括:基于标注配置参数,确定填充内容的数据填充格式;按照数据填充格式以及区域位置,将填充内容,填充到待填充区域内。
一种实施方式中,基于标注配置参数,确定填充内容的数据填充格式,包括:从标注配置参数中,获取填充内容的填充格式范围;从填充格式范围内,随机选取填充内容的数据填充格式。
在上述实现过程中,随机调整待填充区域的区域位置、随机选取填充内容,以及随机选取数据填充格式,可以批量生成大量合成的图像样本以及图像标注信息,极大地提高了标注数据生成的效率,降低了标注数据生成的成本。
一种实施方式中,方法还包括:将图像样本进行数据增强,获得数据增强后的图像样本。
一种实施方式中,数据增强包括形变的数据增强和非形变的数据增强;形变的数据增强包括以下至少一种方式:缩放、旋转以及透视;非形变的数据增强包括以下至少一种方式:各类噪声、模糊、对比度以及亮度。
在上述实现过程中,通过数据增强,可以保证图像样本的合理性。
一种实施方式中,方法还包括:从背景图像集合中,选取一个目标背景图像;将图像样本与目标背景图像进行图像融合,获得融合后的图像样本。
一种实施方式中,将图像样本与目标背景图像进行图像融合,获得融合后的图像样本,包括:在目标背景图像中,选取目标覆盖区域;对目标覆盖区域进行像素调整;将图像样本与像素处理后的目标覆盖区域进行图像重叠,获得融合后的图像样本。
一种实施方式中,对目标覆盖区域进行像素调整,包括以下方式中的任意一种:将目标覆盖区域中的所有像素透明化;将目标覆盖区域中的部分像素透明化;将目标覆盖区域中的所有像素或者部分像素调整至指定值;按照设定像素比例,将目标覆盖区域中的所有像素或者部分像素进行调整。
在上述实现过程中,通过图像融合,使得生成的图像样本类似于真实场景的拍摄图像,保证图像样本生成的多样性。
一种实施方式中,图像标注信息包括以下信息中的至少一种:文本位置、文本信息,以及文本信息及其对应的文本位置。
一方面,提供一种标注数据生成的装置,包括:
生成单元,用于基于目标业务数据,生成模板图像;填充单元,用于按照标注配置参数,对模板图像进行数据填充,生成图像样本;标注单元,用于基于图像样本中的填充数据,生成图像样本对应的图像标注信息。
一种实施方式中,标注单元还用于:根据图像样本和图像标注信息,生成标注数据。
一种实施方式中,生成单元用于:获取针对目标业务拍摄的目标业务图像,目标业务图像为目标业务数据;对目标业务图像中指定区域的数据进行清除,获得模板图像。
一种实施方式中,生成单元用于:获取用户基于目标业务数据下发的绘图指令;基于绘图指令进行图像绘制,生成模板图像。
一种实施方式中,生成单元用于:响应于用户针对模板配置界面的组件选取操作,获取用户从模板配置界面的各图像组件中选取的多个目标图像组件,模板配置界面为用于生成模板图像的应用界面,图像组件为用于生成图像的组件;响应于用户的组件配置操作,配置各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,目标图像组件、组件参数以及位置关系均是基于目标业务数据设置的;根据各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,生成模板图像。
一种实施方式中,填充单元用于:基于标注配置参数,确定待填充区域的区域位置;基于标注配置参数,确定待填充区域的填充内容;按照区域位置,将填充内容填充到模板图像中的待填充区域内,生成图像样本。
一种实施方式中,填充单元用于:从标注配置参数中,获取待填充区域的填充区域范围;从填充区域范围中,随机选取待填充区域的区域位置。
一种实施方式中,填充单元用于:从标注配置参数中,获取针对待填充区域设置的语料集合,语料集合为用于填充到模板图像中的信息的集合;若确定语料集合为非空集,则从语料集合中,随机选取待填充区域的填充内容;若确定语料集合为空集,则从标注配置参数中,获取针对待填充区域设置的指定的填充内容。
一种实施方式中,填充单元用于:基于标注配置参数,确定填充内容的数据填充格式;按照数据填充格式以及区域位置,将填充内容,填充到待填充区域内。
一种实施方式中,填充单元用于:从标注配置参数中,获取填充内容的填充格式范围;从填充格式范围内,随机选取填充内容的数据填充格式。
一种实施方式中,填充单元还用于:将图像样本进行数据增强,获得数据增强后的图像样本。
一种实施方式中,数据增强包括形变的数据增强和非形变的数据增强;形变的数据增强包括以下至少一种方式:缩放、旋转以及透视;非形变的数据增强包括以下至少一种方式:各类噪声、模糊、对比度以及亮度。
一种实施方式中,填充单元还用于:从背景图像集合中,选取一个目标背景图像;将图像样本与目标背景图像进行图像融合,获得融合后的图像样本。
一种实施方式中,填充单元还用于:在目标背景图像中,选取目标覆盖区域;对目标覆盖区域进行像素调整;将图像样本与像素处理后的目标覆盖区域进行图像重叠,获得融合后的图像样本。
一种实施方式中,对目标覆盖区域进行像素调整,包括以下方式中的任意一种:将目标覆盖区域中的所有像素透明化;将目标覆盖区域中的部分像素透明化;将目标覆盖区域中的所有像素或者部分像素调整至指定值;
按照设定像素比例,将目标覆盖区域中的所有像素或者部分像素进行调整。
一种实施方式中,图像标注信息包括以下信息中的至少一种:文本位置、文本信息,以及文本信息及其对应的文本位置。
一方面,提供了一种电子设备,包括处理器以及存储器,存储器存储有计算机可读取指令,当计算机可读取指令由处理器执行时,运行如上述任一种标注数据生成的各种可选实现方式中提供的方法的步骤。
一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时运行如上述任一种标注数据生成的各种可选实现方式中提供的方法的步骤。
一方面,提供了一种计算机程序产品,计算机程序产品在计算机上运行时,使得计算机执行如上述任一种标注数据生成的各种可选实现方式中提供的方法的步骤。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种标注数据生成的方法的实施流程图;
图2为本申请实施例提供的一种医疗票据标注数据生成的方法的实施流程图;
图3为本申请实施例提供的一种医疗票据图像的示例图;
图4为本申请实施例提供的一种医疗票据模板图像的示例图;
图5为本申请实施例提供的一种数据增强图像样本的示例图;
图6为本申请实施例提供的一种融合图像样本的示例图;
图7为本申请实施例提供的一种标注数据生成的装置的结构框图;
图8为本申请实施方式中一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
首先对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
终端设备:可以是移动终端、固定终端或便携式终端,例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统设备、个人导航设备、个人数字助理、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。还可预见到的是,终端设备能够支持任意类型的针对用户的接口(例如可穿戴设备)等。
服务器:可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务以及大数据和人工智能平台等基础云计算服务的云服务器。
为了在生成标注数据时,可以减少耗费的人力成本和时间成本,以及提高标注的准确度,本申请实施例提供了标注数据生成的方法及电子设备。
本申请实施例中,应用于电子设备,可选的,电子设备可以为服务器,也可以为终端设备。参阅图1所示,为本申请实施例提供的一种标注数据生成的方法的实施流程图,该方法的具体实施流程如下:
步骤100:基于目标业务数据,生成模板图像。
具体的,模板图像可以为一个,也可以为多个。目标业务数据为针对需要进行OCR检测的目标业务获取的数据。可选的,目标业务数据可以为针对目标业务(如,需要识别的票据)拍摄的目标业务图像,也可以为其它形式的业务数据,在此不作限制。其中,生成模板图像可以采用但不限于以下方式中的任意一种或任意组合:
方式1:获取针对目标业务拍摄的目标业务图像,并对目标业务图像中指定区域的数据进行清除,获得模板图像。其中,对目标业务图像中指定区域的数据进行清除,获得模板图像时可以包括:根据用户的清除指令,清除用户在目标业务图像中选中的指定区域的数据,获得模板图像。
方式2:获取用户基于目标业务数据下发的绘图指令,并基于绘图指令进行图像绘制,生成模板图像。
方式3:响应于所述用户针对模板配置界面的组件选取操作,获取所述用户从所述模板配置界面的各图像组件中选取的多个目标图像组件;响应于用户的组件配置操作,配置各目标图像组件的组件参数,以及各目标图像组件之间的位置关系;根据各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,生成模板图像。
其中,模板配置界面为用于生成模板图像的应用界面。模板配置界面中显示多个图像组件。图像组件为用于生成图像的组件。组件是将一段代码段进行封装后获得的,通常用于独立完成某个功能,如,用于输入文本的输入框组件。可选的,图像组件可以为用户界面(USER INTERFACE,UI)组件。
这样,就可以生成未填充数据的空的模板图像。
步骤101:按照标注配置参数,对模板图像进行数据填充,生成图像样本。
具体的,执行步骤101时,可以采用以下步骤:
S1011:基于所述标注配置参数,确定待填充区域的区域位置。具体的,从所述标注配置参数中,获取所述待填充区域的填充区域范围,并从所述填充区域范围中,随机选取所述待填充区域的区域位置。也就是说,待填充区域位于填充区域范围内。待填充区域可以为一个,也可以为多个。待填充区域和填充区域范围具有一一对应的关系,即每一填充区域范围,用于确定一个待填充区域。一种实施方式中,填充区域范围为第一矩形区域,待填充区域为从填充区域范围内选取的第二矩形区域,即第二矩形区域位于第一矩形区域内。实际应用中,待填充区域的形状可以根据实际应用场景进行设置,在此不作限制。
S1012:基于所述标注配置参数,确定所述待填充区域的填充内容。
具体的,确定所述待填充区域的填充内容时,可以采用以下方式中的任意一种:方式1:从所述标注配置参数中,获取针对所述待填充区域设置的语料集合,并从所述语料集合中,随机选取所述待填充区域的填充内容。其中,所述语料集合为用于填充到模板图像中的信息的集合。例如,语料集合为多个名字的集合,则可以从语料集合中随机选取一个名字作为待填充区域的填充内容。
方式2:从所述标注配置参数中,获取针对所述待填充区域设置的指定的填充内容。其中,标注配置参数中指定的填充内容可以是采用以下方式获取的:用户设置的固定文本信息,或者从预先设置的语料集合中随机选取。
方式3:从所述标注配置参数中,获取针对所述待填充区域设置的语料集合,若确定所述语料集合为非空集,则从所述语料集合中,随机选取所述待填充区域的填充内容;若确定所述语料集合为空集,则从所述标注配置参数中,获取针对所述待填充区域设置的指定的填充内容。
S1013:按照所述区域位置,将所述填充内容填充到所述模板图像中的所述待填充区域内,生成所述图像样本。具体的,基于所述标注配置参数,确定所述填充内容的数据填充格式,并按照所述数据填充格式以及所述区域位置,将所述填充内容,填充到所述待填充区域内。可选的,数据填充格式可以包括以下格式中的至少一种:字体样式、大小、颜色以及字间间隔。例如,数据填充格式包括的格式包括:字体样本、字体大小以及字体颜色。字体样式可以为宋体或楷书,字体大小范围为10-12号,字体颜色包括黑色或者红色。
一种实施方式中,基于所述标注配置参数,确定所述填充内容的数据填充格式的实现过程可以包括:从所述标注配置参数中,获取所述填充内容的填充格式范围,并从所述填充格式范围内,随机选取所述填充内容的数据填充格式。也就是说,标注配置参数中还可以包括针对待填充区域的填充内容设置的填充格式范围。需要说明的是,若填充内容的数据填充格式包括多个格式,则填充格式范围分别包括每一格式的格式范围。实际应用中,标注配置参数可以根据实际应用场景进行设置,在此不作限制。
这样,通过随机选取待填充区域的填充内容和区域位置,以及随机选取待填充区域的填充内容的数据填充格式,可以保证图像样本生成的随机性和多样性。
进一步的,为保证图像样本的合理性,还可以根据用户调整指令,对图像样本进行调整。一种实施方式中,根据用户调整指令,对待填充区域的填充内容和区域位置以及待填充区域的填充内容的数据填充格式中的至少一种进行调整。例如,根据用户调整指令,调整图像样本中某一填充内容的字体样本、字体大小、字体格式、字体颜色以及字间间隔。
进一步的,为使得生成的图像样本类似于真实场景的拍摄图像,保证图像样本生成的多样性,还可以对图像样本进行数据增强。一种实施方式中,根据数据增强参数,将图像样本进行数据增强,获得数据增强后的图像样本。其中,数据增强包括形变的数据增强和非形变的数据增强。形变的数据增强包括但不限于以下至少一种方式:缩放、旋转以及透视。非形变的数据增强包括但不限于以下至少一种方式:各类噪声、模糊、对比度以及亮度。数据增强参数可以根据实际应用场景进行设置,在此不作限制。
进一步的,为使得生成的图像样本类似于真实场景的拍摄图像,保证图像样本生成的多样性,还可以将图像样本与背景图像融合。一种实施方式中,从背景图像集合中,选取一个目标背景图像,并将图像样本与目标背景图像进行图像融合,获得融合后的图像样本。其中,背景图像集合中包含至少一个背景图像,背景图像可以为拍摄的真实场景。
其中,将图像样本与目标背景图像进行图像融合,获得融合后的图像样本时,可以包括:在所述目标背景图像中,选取目标覆盖区域;对所述目标覆盖区域进行像素调整;将所述图像样本与像素处理后的目标覆盖区域进行图像重叠,获得所述融合后的图像样本。其中,对该目标覆盖区域进行像素调整时,可以采用以下任一方式:方式1:将该目标覆盖区域中的所有像素透明化。方式2:将该目标覆盖区域中的部分像素透明化。方式3:将该目标覆盖区域中的所有像素或者部分像素调整至指定值。方式4:按照设定像素比例,将该目标覆盖区域中的所有像素或者部分像素进行调整。
实际应用中,可以根据实际应用场景设置图像融合的方式,在此不作限制。
步骤102:基于图像样本中的填充数据,生成图像样本对应的图像标注信息。
具体的,图像标注信息包括以下信息中的至少一种:文本位置、文本信息,以及文本位置及其对应的文本信息。一种实施方式中,将图像样本中的填充内容,作为图像标注信息中的文本信息。一种实施方式中,将图像样本中待填充区域的区域位置,作为图像标注信息中的文本位置。一种实施方式中,将图像样本中待填充区域的区域位置和填充内容,作为图像标注信息中的文本位置及其对应的文本信息。
进一步的,根据图像样本和图像标注信息,生成标注数据。一种实施方式中,根据图像样本和图像标注信息,获得包含图像样本及其对应的图像标注信息的标注数据。
本申请实施例中,可以根据标注配置参数,对模板图像进行随机填充,获得大量的不同的图像样本以及相应的图像标注信息,减少了用户采集图像样本、多方人员标注信息沟通以及人工标注耗费的时间成本和人力成本,以及减少了由于人工标注造成的不同量级的标注误差,且不需要人工标注不合格时的返工处理,进一步减少了耗费的人力成本和时间成本,再者,可以随机生成填充内容,不会涉及隐私信息的处理,解决了关键信息缺失的问题。采用这种方式可以获得与真实场景相近的标注数据,进而通过标注数据对OCR检测模型进行训练,可以获得高检测精度的OCR检测模型。
下面采用一个具体的应用场景,对上述实施例进行进一步说明。
在医疗票据报销的应用场景中,用户需求为需要通过OCR检测模型对医疗票据进行文本区域检测、文本识别以及文本获取,以获得医疗票据的文本识别结果。为此,需要通过大量的医疗票据标注数据,进行模型训练,以获得训练好的OCR检测模型。参阅图2所示,为一种医疗票据标注数据生成的方法的实施流程图,该方法的具体步骤包括:
步骤200:对医疗票据进行拍摄,获得医疗票据图像。
具体的,目标业务为医疗票据,医疗票据图像即目标业务数据。例如,参阅图3所示,为一种医疗票据图像的示例图。图3中包括某一用户的姓名、票据的流水号、以及医疗的金额等。需要说明的是,本申请实施例中,图3仅用于示例性说明拍摄采集的原始的目标业务图像,若图3中的图像中的线条以及文字不清楚,不影响说明书的清楚性。
步骤201:对医疗票据图像进行数据清除,生成模板图像。
一种实施方式中,通过绘图工具,按照用户的绘图清除指令,将医疗票据图像中部分数据(如,人工填写的数据)均清除,获得模板图像。参阅图4所示,为一种医疗票据模板图像的示例图。图4中,为未填写的医疗票据的图像,即仅包含流水号、姓名以及金额等字段,而未包含各字段的字段值。需要说明的是,本申请实施例中,图4仅用于示例性说明未填写数据的空的模板图像,若图4中的图像中的线条以及文字不清楚,不影响说明书的清楚性。
步骤202:按照标注配置参数,对模板图像进行数据填充,生成图像样本。
步骤203:对图像样本进行数据增强,获得数据增强后的图像样本。
参阅图5所示,为一种数据增强图像样本的示例图。图5是对图像样本进行扭曲后获得的图像。数据增强图像样本即为数据增强后的图像样本。需要说明的是,本申请实施例中,图5仅用于示例性说明图像进行了扭曲处理,若图5中的图像中的线条以及文字不清楚,不影响说明书的清楚性。
步骤204:从背景图像集合中,选取一个目标背景图像,并将数据增强后的图像样本与目标背景图像进行图像融合,生成融合后的图像样本。
参阅图6所示,为一种融合图像样本的示例图。图6是将图5与目标背景图像融合后获得的图像。需要说明的是,本申请实施例中,图6仅用于示例性说明图像样本和背景图像融合,若图6中的图像中的线条以及文字不清楚,不影响说明书的清楚性。
步骤205:根据用户调整指令,对融合后的图像样本进行调整,获得调整后的图像样本。
步骤206:基于调整后的图像样本中的填充内容,获得包含图像样本及其对应的图像标注信息的标注数据。
传统方式中,通常采用人工标注的方式进行标注。由于实际应用场景中的医疗票据中通常包含大量的用户隐私信息,如,用户的姓名以及身份证号等,为保护用户的隐私,通常是无法将用户隐私信息作为标注数据的,因此,造成了关键标注信息的缺失,以及,采用人工标注的方式生成标注数据时,通常会存在数据采集难度大、标注难度大以及周期长的问题。
而本申请实施例中,通过随机选取的填充内容代替用户隐私信息,解决了关键标注信息缺失的问题,以及,通过在模板图像中填充随机选取的填充内容的方式,可以批量生成大量合成的图像样本以及图像标注信息,极大地提高了标注数据生成的效率,降低了标注数据生成的成本。例如,人工标注的速度通常是每人每天30-50张,而采用本申请实施例中的标注数据生成方式,可以每小时生成4000-5000张。
下面采用另一个应用场景,对上述实施例进行进一步举例说明。
在车票报销的应用场景中,需要生成车票标注数据,以根据车票标注数据进行模型训练,生成用于对车票进行文本区域检测、文本识别以及文本提取的OCR检测模型。则可以获取拍摄的动车票图像,并对动车票图像中的列车次信息以及地点信息等进行清除,获得模板图像,以及按照标注配置参数对模板图像进行数据填充,生成图像样本,并对图像样本进行数据增强、图像融合以及图像调整,获得调整后的图像样本,以及获取调整后的图像样本中的图像标注信息,获得包含图像样本和图像标注信息的标注数据。
基于同一发明构思,本申请实施例中还提供了一种标注数据生成的装置,由于上述装置及设备解决问题的原理与一种标注数据生成的方法相似,因此,上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图7所示,其为本申请实施例提供的一种标注数据生成的装置的结构示意图,包括:
生成单元701,用于基于目标业务数据,生成模板图像;填充单元702,用于按照标注配置参数,对模板图像进行数据填充,生成图像样本;标注单元703,用于基于图像样本中的填充数据,生成图像样本对应的图像标注信息。
一种实施方式中,标注单元703还用于:根据图像样本和图像标注信息,生成标注数据。
一种实施方式中,生成单元701用于:获取针对目标业务拍摄的目标业务图像,目标业务图像为目标业务数据;对目标业务图像中指定区域的数据进行清除,获得模板图像。
一种实施方式中,生成单元701用于:获取用户基于目标业务数据下发的绘图指令;基于绘图指令进行图像绘制,生成模板图像。
一种实施方式中,生成单元701用于:响应于用户针对模板配置界面的组件选取操作,获取用户从模板配置界面的各图像组件中选取的多个目标图像组件,模板配置界面为用于生成模板图像的应用界面,图像组件为用于生成图像的组件;响应于用户的组件配置操作,配置各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,目标图像组件、组件参数以及位置关系均是基于目标业务数据设置的;根据各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,生成模板图像。
一种实施方式中,填充单元702用于:基于标注配置参数,确定待填充区域的区域位置;基于标注配置参数,确定待填充区域的填充内容;按照区域位置,将填充内容填充到模板图像中的待填充区域内,生成图像样本。
一种实施方式中,填充单元702用于:从标注配置参数中,获取待填充区域的填充区域范围;从填充区域范围中,随机选取待填充区域的区域位置。
一种实施方式中,填充单元702用于:从标注配置参数中,获取针对待填充区域设置的语料集合,语料集合为用于填充到模板图像中的信息的集合;若确定语料集合为非空集,则从语料集合中,随机选取待填充区域的填充内容;若确定语料集合为空集,则从标注配置参数中,获取针对待填充区域设置的指定的填充内容。
一种实施方式中,填充单元702用于:基于标注配置参数,确定填充内容的数据填充格式;按照数据填充格式以及区域位置,将填充内容,填充到待填充区域内。
一种实施方式中,填充单元702用于:从标注配置参数中,获取填充内容的填充格式范围;从填充格式范围内,随机选取填充内容的数据填充格式。
一种实施方式中,填充单元702还用于:将图像样本进行数据增强,获得数据增强后的图像样本。
一种实施方式中,数据增强包括形变的数据增强和非形变的数据增强;形变的数据增强包括以下至少一种方式:缩放、旋转以及透视;非形变的数据增强包括以下至少一种方式:各类噪声、模糊、对比度以及亮度。
一种实施方式中,填充单元702还用于:从背景图像集合中,选取一个目标背景图像;将图像样本与目标背景图像进行图像融合,获得融合后的图像样本。
一种实施方式中,填充单元702还用于:在目标背景图像中,选取目标覆盖区域;对目标覆盖区域进行像素调整;将图像样本与像素处理后的目标覆盖区域进行图像重叠,获得融合后的图像样本。
一种实施方式中,对目标覆盖区域进行像素调整,包括以下方式中的任意一种:将目标覆盖区域中的所有像素透明化;将目标覆盖区域中的部分像素透明化;将目标覆盖区域中的所有像素或者部分像素调整至指定值;
按照设定像素比例,将目标覆盖区域中的所有像素或者部分像素进行调整。
一种实施方式中,图像标注信息包括以下信息中的至少一种:文本位置、文本信息,以及文本信息及其对应的文本位置。
本申请实施例提供的标注数据生成的方法及电子设备中,基于目标业务数据,生成模板图像;按照标注配置参数,对模板图像进行数据填充,生成图像样本;基于图像样本中的填充数据,生成图像样本对应的图像标注信息。这样,减少了人工标注耗费的人力成本、时间成本以及标注误差,提高了标注数据生成的效率和准确度。
图8示出了一种电子设备8000的结构示意图。参阅图8所示,电子设备8000包括:处理器8010以及存储器8020,可选的,还可以包括电源8030、显示单元8040、输入单元8050。
处理器8010是电子设备8000的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在存储器8020内的软件程序和/或数据,执行电子设备8000的各种功能,从而对电子设备8000进行整体监控。
本申请实施例中,处理器8010调用存储器8020中存储的计算机程序时执行上述实施例中的各个步骤。
可选的,处理器8010可包括一个或多个处理单元;优选的,处理器8010可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器8010中。在一些实施例中,处理器、存储器、可以在单一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
存储器8020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、各种应用等;存储数据区可存储根据电子设备8000的使用所创建的数据等。此外,存储器8020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件等。
电子设备8000还包括给各个部件供电的电源8030(比如电池),电源可以通过电源管理系统与处理器8010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
显示单元8040可用于显示由用户输入的信息或提供给用户的信息以及电子设备8000的各种菜单等,本发明实施例中主要用于显示电子设备8000中各应用的显示界面以及显示界面中显示的文本、图片等对象。显示单元8040可以包括显示面板8041。显示面板8041可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置。
输入单元8050可用于接收用户输入的数字或字符等信息。输入单元8050可包括触控面板8051以及其他输入设备8052。其中,触控面板8051,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触摸笔等任何适合的物体或附件在触控面板8051上或在触控面板8051附近的操作)。
具体的,触控面板8051可以检测用户的触摸操作,并检测触摸操作带来的信号,将这些信号转换成触点坐标,发送给处理器8010,并接收处理器8010发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板8051。其他输入设备8052可以包括但不限于物理键盘、功能键(比如音量控制按键、开关机按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
当然,触控面板8051可覆盖显示面板8041,当触控面板8051检测到在其上或附近的触摸操作后,传送给处理器8010以确定触摸事件的类型,随后处理器8010根据触摸事件的类型在显示面板8041上提供相应的视觉输出。虽然在图8中,触控面板8051与显示面板8041是作为两个独立的部件来实现电子设备8000的输入和输出功能,但是在某些实施例中,可以将触控面板8051与显示面板8041集成而实现电子设备8000的输入和输出功能。
电子设备8000还可包括一个或多个传感器,例如压力传感器、重力加速度传感器、接近光传感器等。当然,根据具体应用中的需要,上述电子设备8000还可以包括摄像头等其它部件,由于这些部件不是本申请实施例中重点使用的部件,因此,在图8中没有示出,且不再详述。
本领域技术人员可以理解,图8仅仅是电子设备的举例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
本申请实施例中,一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使得通信设备可以执行上述实施例中的各个步骤。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。
Claims (17)
1.一种标注数据生成的方法,其特征在于,包括:
基于目标业务数据,生成模板图像;
按照标注配置参数,对所述模板图像进行数据填充,生成图像样本;
基于所述图像样本中的填充数据,生成所述图像样本对应的图像标注信息。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述图像样本和所述图像标注信息,生成所述标注数据。
3.如权利要求1所述的方法,其特征在于,所述基于目标业务数据,生成模板图像,包括:
获取针对目标业务拍摄的目标业务图像,所述目标业务图像为所述目标业务数据;
对所述目标业务图像中指定区域的数据进行清除,获得所述模板图像。
4.如权利要求1所述的方法,其特征在于,所述基于目标业务数据,生成模板图像,包括:
获取用户基于目标业务数据下发的绘图指令;
基于所述绘图指令进行图像绘制,生成所述模板图像。
5.如权利要求1所述的方法,其特征在于,所述基于目标业务数据,生成模板图像,包括:
响应于用户针对模板配置界面的组件选取操作,获取所述用户从所述模板配置界面的各图像组件中选取的多个目标图像组件,所述模板配置界面为用于生成模板图像的应用界面,所述图像组件为用于生成图像的组件;
响应于所述用户的组件配置操作,配置各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,所述目标图像组件、所述组件参数以及所述位置关系均是基于所述目标业务数据设置的;
根据各目标图像组件的组件参数,以及各目标图像组件之间的位置关系,生成所述模板图像。
6.如权利要求1-5任一项所述的方法,其特征在于,所述按照标注配置参数,对所述模板图像进行数据填充,生成图像样本,包括:
基于所述标注配置参数,确定待填充区域的区域位置;
基于所述标注配置参数,确定所述待填充区域的填充内容;
按照所述区域位置,将所述填充内容填充到所述模板图像中的所述待填充区域内,生成所述图像样本。
7.如权利要求6所述的方法,其特征在于,所述基于所述标注配置参数,确定待填充区域的区域位置,包括:
从所述标注配置参数中,获取所述待填充区域的填充区域范围;
从所述填充区域范围中,随机选取所述待填充区域的区域位置。
8.如权利要求6所述的方法,其特征在于,所述基于所述标注配置参数,确定所述待填充区域的填充内容,包括:
从所述标注配置参数中,获取针对所述待填充区域设置的语料集合,所述语料集合为用于填充到模板图像中的信息的集合;
若确定所述语料集合为非空集,则从所述语料集合中,随机选取所述待填充区域的填充内容;
若确定所述语料集合为空集,则从所述标注配置参数中,获取针对所述待填充区域设置的指定的填充内容。
9.如权利要求6所述的方法,其特征在于,所述按照所述区域位置,将所述填充内容填充到所述模板图像中的所述待填充区域内,包括:
基于所述标注配置参数,确定所述填充内容的数据填充格式;
按照所述数据填充格式以及所述区域位置,将所述填充内容,填充到所述待填充区域内。
10.如权利要求9所述的方法,其特征在于,所述基于所述标注配置参数,确定所述填充内容的数据填充格式,包括:
从所述标注配置参数中,获取所述填充内容的填充格式范围;
从所述填充格式范围内,随机选取所述填充内容的数据填充格式。
11.如权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
将所述图像样本进行数据增强,获得数据增强后的图像样本。
12.如权利要求11所述的方法,其特征在于,所述数据增强包括形变的数据增强和非形变的数据增强;
所述形变的数据增强包括以下至少一种方式:缩放、旋转以及透视;
所述非形变的数据增强包括以下至少一种方式:各类噪声、模糊、对比度以及亮度。
13.如权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
从背景图像集合中,选取一个目标背景图像;
将所述图像样本与所述目标背景图像进行图像融合,获得融合后的图像样本。
14.如权利要求13所述的方法,其特征在于,所述将所述图像样本与所述目标背景图像进行图像融合,获得融合后的图像样本,包括:
在所述目标背景图像中,选取目标覆盖区域;
对所述目标覆盖区域进行像素调整;
将所述图像样本与像素处理后的目标覆盖区域进行图像重叠,获得所述融合后的图像样本。
15.如权利要求14所述的方法,其特征在于,所述对所述目标覆盖区域进行像素调整,包括以下方式中的任意一种:
将所述目标覆盖区域中的所有像素透明化;
将所述目标覆盖区域中的部分像素透明化;
将所述目标覆盖区域中的所有像素或者部分像素调整至指定值;
按照设定像素比例,将所述目标覆盖区域中的所有像素或者部分像素进行调整。
16.如权利要求1-5任一项所述的方法,其特征在于,所述图像标注信息包括以下信息中的至少一种:文本位置、文本信息,以及文本信息及其对应的文本位置。
17.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-16任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210459229.6A CN114724136A (zh) | 2022-04-27 | 2022-04-27 | 标注数据生成的方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210459229.6A CN114724136A (zh) | 2022-04-27 | 2022-04-27 | 标注数据生成的方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114724136A true CN114724136A (zh) | 2022-07-08 |
Family
ID=82246502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210459229.6A Pending CN114724136A (zh) | 2022-04-27 | 2022-04-27 | 标注数据生成的方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114724136A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110059518A (ko) * | 2009-11-27 | 2011-06-02 | 후지츠 프론테크 가부시키가이샤 | 지엽류 감별 장치 및 지엽류 감별 방법 |
CN111260601A (zh) * | 2020-02-12 | 2020-06-09 | 北京字节跳动网络技术有限公司 | 图像融合方法、装置、可读介质及电子设备 |
WO2020155763A1 (zh) * | 2019-01-28 | 2020-08-06 | 平安科技(深圳)有限公司 | Ocr识别方法及其电子设备 |
CN111539309A (zh) * | 2020-04-21 | 2020-08-14 | 广州云从鼎望科技有限公司 | 一种基于ocr的数据处理方法、系统、平台、设备及介质 |
CN112446817A (zh) * | 2019-08-29 | 2021-03-05 | 北京小米移动软件有限公司 | 图片融合方法及装置 |
CN112766268A (zh) * | 2021-03-02 | 2021-05-07 | 阳光财产保险股份有限公司 | 一种文本标注生成方法、装置、电子设备及存储介质 |
CN113569528A (zh) * | 2021-07-19 | 2021-10-29 | 湖州度康科技有限公司 | 一种自动版面文档标注生成方法 |
CN114253648A (zh) * | 2021-12-24 | 2022-03-29 | 武汉噢易云计算股份有限公司 | 一种远程应用虚拟化方法与装置 |
CN114332895A (zh) * | 2021-12-27 | 2022-04-12 | 上海浦东发展银行股份有限公司 | 文本图像合成方法、装置、设备、存储介质和程序产品 |
-
2022
- 2022-04-27 CN CN202210459229.6A patent/CN114724136A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110059518A (ko) * | 2009-11-27 | 2011-06-02 | 후지츠 프론테크 가부시키가이샤 | 지엽류 감별 장치 및 지엽류 감별 방법 |
WO2020155763A1 (zh) * | 2019-01-28 | 2020-08-06 | 平安科技(深圳)有限公司 | Ocr识别方法及其电子设备 |
CN112446817A (zh) * | 2019-08-29 | 2021-03-05 | 北京小米移动软件有限公司 | 图片融合方法及装置 |
CN111260601A (zh) * | 2020-02-12 | 2020-06-09 | 北京字节跳动网络技术有限公司 | 图像融合方法、装置、可读介质及电子设备 |
CN111539309A (zh) * | 2020-04-21 | 2020-08-14 | 广州云从鼎望科技有限公司 | 一种基于ocr的数据处理方法、系统、平台、设备及介质 |
CN112766268A (zh) * | 2021-03-02 | 2021-05-07 | 阳光财产保险股份有限公司 | 一种文本标注生成方法、装置、电子设备及存储介质 |
CN113569528A (zh) * | 2021-07-19 | 2021-10-29 | 湖州度康科技有限公司 | 一种自动版面文档标注生成方法 |
CN114253648A (zh) * | 2021-12-24 | 2022-03-29 | 武汉噢易云计算股份有限公司 | 一种远程应用虚拟化方法与装置 |
CN114332895A (zh) * | 2021-12-27 | 2022-04-12 | 上海浦东发展银行股份有限公司 | 文本图像合成方法、装置、设备、存储介质和程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110458918B (zh) | 用于输出信息的方法和装置 | |
US9805511B2 (en) | Interacting with data fields on a page using augmented reality | |
US9245043B2 (en) | Embedded media markers and systems and methods for generating and using them | |
US11158057B2 (en) | Device, method, and graphical user interface for processing document | |
CN109189879B (zh) | 电子书籍显示方法及装置 | |
CN108961157B (zh) | 图片处理方法、图片处理装置及终端设备 | |
CN109766879A (zh) | 字符检测模型的生成、字符检测方法、装置、设备及介质 | |
US9177199B2 (en) | Semantic magazine pages | |
WO2016178896A1 (en) | System and method for embedding a two dimensional code in video images | |
CN111126390A (zh) | 一种用于识别媒体内容中标识图案的相关方法及装置 | |
CN111723746A (zh) | 场景识别模型生成方法、系统、平台、设备及介质 | |
CN112464052A (zh) | 反馈信息的处理方法、显示方法、装置及电子设备 | |
CN111695518A (zh) | 结构化文档信息标注的方法、装置及电子设备 | |
CN113132780A (zh) | 一种视频合成的方法、装置、电子设备及可读存储介质 | |
CN108174270A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
US20150036004A1 (en) | System and method of capturing and sharing media | |
KR102234172B1 (ko) | 디지털 트윈 책장 제공 장치 및 방법 | |
US20170034586A1 (en) | System for content matching and triggering for reality-virtuality continuum-based environment and methods thereof | |
CN113791750A (zh) | 一种虚拟内容显示方法、装置和计算机可读存储介质 | |
KR100985068B1 (ko) | 디스플레이 영역을 구비한 전자기기에 표시되는 맞춤 이미지 생성 시스템 및 방법 | |
CN110036356B (zh) | Vr系统中的图像处理 | |
CN114724136A (zh) | 标注数据生成的方法及电子设备 | |
CN112732100A (zh) | 信息处理方法、装置和电子设备 | |
CN205158392U (zh) | 动态影像的物件辨识系统 | |
CN111986332A (zh) | 展示留言板的方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220708 |
|
RJ01 | Rejection of invention patent application after publication |