CN113610739A - 图像数据增强方法、装置、设备及存储介质 - Google Patents
图像数据增强方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113610739A CN113610739A CN202110913157.3A CN202110913157A CN113610739A CN 113610739 A CN113610739 A CN 113610739A CN 202110913157 A CN202110913157 A CN 202110913157A CN 113610739 A CN113610739 A CN 113610739A
- Authority
- CN
- China
- Prior art keywords
- image
- label
- request
- proportion
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000004927 fusion Effects 0.000 claims description 105
- 230000015654 memory Effects 0.000 claims description 23
- 238000002372 labelling Methods 0.000 claims description 16
- 238000010008 shearing Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 239000000284 extract Substances 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Abstract
本发明涉及人工智能,提供一种图像数据增强方法、装置、设备及存储介质。该方法能够根据数据增强请求确定请求场景,获取请求场景中每个标注标签的图像数量,根据图像数量从标注标签中提取请求标签,获取请求标签所对应的请求图像,融合请求图像中的任一图像对,得到融合图像,根据任一图像对的请求标签生成融合图像的融合标签,根据图像数量及融合标签计算每个标注标签的标签比例,根据标签比例拼接请求图像及融合图像,直至标签比例大于或者等于预设比例,得到增强图像。本发明能够确保请求场景中的数据平衡,从而能够避免因数据不平衡而带来的模型准确性的问题。此外,本发明还涉及区块链技术,所述增强图像可存储于区块链中。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种图像数据增强方法、装置、设备及存储介质。
背景技术
在人工智能中,多标签分类是指任一图像上存在有多个标签类别,例如,带有小猫和小狗的图像所对应的标签有猫标签及狗标签。在目前的图像多标签分类问题上,由于一张图像上对应有多个标签,因此标签数据不平衡的现象相对明显,图像数据不平衡导致网络只能预测数据较多的类别,而忽略了数据较小的类别的预测,从而造成无法准确的训练模型。
发明内容
鉴于以上内容,有必要提供一种图像数据增强方法、装置、设备及存储介质,能够确保请求场景中的数据平衡,从而能够避免因数据不平衡而带来的模型准确性的问题。
一方面,本发明提出一种图像数据增强方法,所述图像数据增强方法包括:
当接收到数据增强请求时,根据所述数据增强请求确定请求场景,并获取所述请求场景中每个标注标签的图像数量;
根据所述图像数量从所述标注标签中提取请求标签,并获取所述请求标签所对应的请求图像;
融合所述请求图像中的任一图像对,得到融合图像,所述任一图像对是指所述请求图像中任意两张图像;
根据所述任一图像对的请求标签生成所述融合图像的融合标签;
根据所述图像数量及所述融合标签计算每个标注标签的标签比例;
根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像。
根据本发明优选实施例,所述根据所述图像数量从所述标注标签中提取请求标签包括:
计算所述标注标签的标签数量,并将所述标签数量的倒数确定为所述标注标签的初始比例;
根据预设调整比例对所述初始比例进行调整,得到所述标注标签的目标比例;
计算所述图像数量的总和,得到运算总量;
基于所述图像数量在所述运算总量上的比值确定每个所述标注标签的标注比例;
将所述标注比例小于所述目标比例的标注标签确定为所述请求标签。
根据本发明优选实施例,所述融合所述请求图像中的任一图像对,得到融合图像包括:
获取所述任一图像对中第一图像的第一尺寸,并获取所述任一图像对中第二图像的第二尺寸;
若所述第一尺寸不等于所述第二尺寸,根据所述第一尺寸及所述第二尺寸对所述第二图像进行尺寸变换,得到第三图像;
基于预设剪切比例对所述第一图像进行剪切处理,得到剪切图像;
确定所述剪切图像在所述第一图像中的图像位置;
将所述第三图像中与所述图像位置对应的区域确定为图像区域;
基于所述剪切图像替换所述图像区域,得到所述融合图像。
根据本发明优选实施例,所述融合所述请求图像中的任一图像对,得到融合图像还包括:
从预设区间中随机获取融合比例;
获取所述第一图像中每个像素点的像素值,得到第一像素值,并获取所述第三图像中每个像素点的像素值,得到第二像素值;
根据所述融合比例对所述第一像素值及所述第二像素值进行加权和运算,得到目标像素值;
拼接所述目标像素值,得到所述融合图像。
根据本发明优选实施例,所述根据所述任一图像对的请求标签生成所述融合图像的融合标签包括:
将所述任一图像对中所对应的所有请求标签确定为所述融合标签。
根据本发明优选实施例,所述根据所述图像数量及所述融合标签计算每个标注标签的标签比例包括:
根据所述融合标签计算所述融合图像在每个标注标签上的融合数量;
根据所述图像数量及所述融合数量计算每个标注标签的目标数量;
将所述目标数量在所述目标数量的总和上的比值确定为所述标签比例。
根据本发明优选实施例,所述根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像包括:
将所述标签比例小于预设比例的标注标签确定为目标标签;
从所述请求图像及所述融合图像中选取与所述目标标签对应的图像作为目标图像;
基于预设偶数量随机拼接所述目标图像,直至所述标签比例大于或者等于所述预设比例,得到所述增强图像。
另一方面,本发明还提出一种图像数据增强装置,所述图像数据增强装置包括:
获取单元,用于当接收到数据增强请求时,根据所述数据增强请求确定请求场景,并获取所述请求场景中每个标注标签的图像数量;
提取单元,用于根据所述图像数量从所述标注标签中提取请求标签,并获取所述请求标签所对应的请求图像;
融合单元,用于融合所述请求图像中的任一图像对,得到融合图像,所述任一图像对是指所述请求图像中任意两张图像;
生成单元,用于根据所述任一图像对的请求标签生成所述融合图像的融合标签;
计算单元,用于根据所述图像数量及所述融合标签计算每个标注标签的标签比例;
拼接单元,用于根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像。
另一方面,本发明还提出一种电子设备,所述电子设备包括:
存储器,存储计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现所述图像数据增强方法。
另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述图像数据增强方法。
由以上技术方案可以看出,本发明通过所述图像数量确定出需要进行数据增强的标签,能够准确的确定出导致数据不平衡的标签,进一步通过所述图像对的请求标签直接生成所述融合图像的融合标签,由于所述融合图像中兼具了所述图像对中任意两张图像,因此将所述图像对所对应的请求标签直接确定为所述融合标签,不仅能够实现对所述请求标签中图像的增强,还能够提高模型对多标签分类问题的处理准确性,进而通过所述标签比例拼接所述请求图像及所述融合图像,能够确保所述请求场景中的数据平衡,从而能够避免因数据不平衡而带来的模型准确性的问题。
附图说明
图1是本发明图像数据增强方法的较佳实施例的流程图。
图2是本发明图像数据增强装置的较佳实施例的功能模块图。
图3是本发明实现图像数据增强方法的较佳实施例的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
如图1所示,是本发明图像数据增强方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
所述图像数据增强方法可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
所述图像数据增强方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视(Internet Protocol Television,IPTV)、智能穿戴式设备等。
所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(CloudComputing)的由大量主机或网络电子设备构成的云。
所述电子设备所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)等。
S10,当接收到数据增强请求时,根据所述数据增强请求确定请求场景,并获取所述请求场景中每个标注标签的图像数量。
在本发明的至少一个实施例中,所述数据增强请求可以由任意图像处理用户触发生成。
所述数据增强请求中携带有所述请求场景的相关信息。
进一步地,所述请求场景是指所述数据增强请求中需要进行数据增强的图像所在的应用场景。例如,所述请求场景可以是识别动物种类。
所述标注标签是指所述请求场景中所对应的具体标签,例如,所述请求场景是识别动物种类,则所述标注标签可以包括:猫、狗、兔子等。
所述图像数量是指对应有所述标注标签的图像的数量。
在本发明的至少一个实施例中,所述电子设备根据所述数据增强请求确定请求场景包括:
解析所述数据增强请求的报文,得到所述报文携带的数据信息;
从所述数据信息中提取场景标识;
将与所述场景标识对应的场景确定为所述请求场景。
通过上述实施方式,能够快速确定出所述请求场景。
在本发明的至少一个实施例中,所述电子设备从图像库中获取同时与所述场景标识及所述标注标签对应的数值作为所述图像数量。
S11,根据所述图像数量从所述标注标签中提取请求标签,并获取所述请求标签所对应的请求图像。
在本发明的至少一个实施例中,所述请求标签是指需要进行数据增强的标签,也就是说,所述请求标签的标注比例较低。
所述请求图像是指与所述请求标签对应的图像。
在本发明的至少一个实施例中,所述电子设备根据所述图像数量从所述标注标签中提取请求标签包括:
计算所述标注标签的标签数量,并将所述标签数量的倒数确定为所述标注标签的初始比例;
根据预设调整比例对所述初始比例进行调整,得到所述标注标签的目标比例;
计算所述图像数量的总和,得到运算总量;
基于所述图像数量在所述运算总量上的比值确定每个所述标注标签的标注比例;
将所述标注比例小于所述目标比例的标注标签确定为所述请求标签。
其中,所述预设调整比例是指根据实际容差需求设定的比例,其中,所述实际容差需求是指所述请求场景中数据平衡的容差需求。可以理解的是,所述预设调整比例小于所述初始比例。
所述目标比例是指所述初始比例与所述预设调整比例的差值。
通过所述预设调整比例调整所述初始比例,能够提高所述目标比例的容差性,进而选取标注比例小于目标比例的标注标签作为请求标签,而不将标注比例大于一定比例的标注标签同时作为请求标签,由于无需对多个对象进行分析处理,因此能够提高所述数据增强请求的响应效率。
S12,融合所述请求图像中的任一图像对,得到融合图像,所述任一图像对是指所述请求图像中任意两张图像。
在本发明的至少一个实施例中,所述融合图像是指基于所述图像对生成的合成图像。
在本发明的至少一个实施例中,所述电子设备融合所述请求图像中的任一图像对,得到融合图像包括:
获取所述任一图像对中第一图像的第一尺寸,并获取所述任一图像对中第二图像的第二尺寸;
若所述第一尺寸不等于所述第二尺寸,根据所述第一尺寸及所述第二尺寸对所述第二图像进行尺寸变换,得到第三图像;
基于预设剪切比例对所述第一图像进行剪切处理,得到剪切图像;
确定所述剪切图像在所述第一图像中的图像位置;
将所述第三图像中与所述图像位置对应的区域确定为图像区域;
基于所述剪切图像替换所述图像区域,得到所述融合图像。
其中,所述第三图像的尺寸与所述第一尺寸相等。可以理解的是,所述第三图像中的图像内容与所述第二图像中的图像内容相同。所述第三图像可以是经过对所述第二图像进行压缩或者拉伸而生成的。
所述预设剪切比例是指根据实际需求设定好的比例,根据实际实验得出,所述预设剪切比例通常设置为30%。
通过所述预设剪切比例的设定能够避免所述第一图像与所述第三图像融合不均的问题,从而能够避免无法准确的生成融合标签。
在本发明的至少一个实施例中,所述电子设备融合所述请求图像中的任一图像对,得到融合图像还包括:
从预设区间中随机获取融合比例;
获取所述第一图像中每个像素点的像素值,得到第一像素值,并获取所述第三图像中每个像素点的像素值,得到第二像素值;
根据所述融合比例对所述第一像素值及所述第二像素值进行加权和运算,得到目标像素值;
拼接所述目标像素值,得到所述融合图像。
其中,所述预设区间通常设置为(0,1)。相对的,所述融合比例可以是(0,1)中的任意一个实数。
通过上述实施方式,能够使生成的融合图像中兼具有所述第一图像及所述第三图像中每个像素点的信息,提高了所述融合图像的融合性。
S13,根据所述任一图像对的请求标签生成所述融合图像的融合标签。
在本发明的至少一个实施例中,所述融合标签是指所述图像对所对应有的所有请求标签。
在本发明的至少一个实施例中,所述电子设备根据所述任一图像对的请求标签生成所述融合图像的融合标签包括:
将所述任一图像对中所对应的所有请求标签确定为所述融合标签。
其中,所述所有请求标签是指所述任一图像对中所对应有的全部标签。
通过直接将所有请求标签确定为所述融合标签,而不采用对请求标签进行加权处理的方式,能够提高数据增强在多标签分类上的适应性,从而能够提高模型的训练准确性。
S14,根据所述图像数量及所述融合标签计算每个标注标签的标签比例。
在本发明的至少一个实施例中,所述标签比例是指对所述图像对进行融合处理后的标注标签的比例。
在本发明的至少一个实施例中,所述电子设备根据所述图像数量及所述融合标签计算每个标注标签的标签比例包括:
根据所述融合标签计算所述融合图像在每个标注标签上的融合数量;
根据所述图像数量及所述融合数量计算每个标注标签的目标数量;
将所述目标数量在所述目标数量的总和上的比值确定为所述标签比例。
通过上述实施方式,能够快速确定出所述标签比例,从而有利于确定是否对所述数据增强请求进一步进行处理。
S15,根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像。
在本发明的至少一个实施例中,所述增强图像包括所述融合图像、拼接所述请求图像及所述融合图像而生成的图像。
所述预设比例可以设置为所述目标比例。
需要强调的是,为进一步保证上述增强图像的私密和安全性,上述增强图像还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述电子设备根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像包括:
将所述标签比例小于预设比例的标注标签确定为目标标签;
从所述请求图像及所述融合图像中选取与所述目标标签对应的图像作为目标图像;
基于预设偶数量随机拼接所述目标图像,直至所述标签比例大于或者等于所述预设比例,得到所述增强图像。
其中,所述预设偶数量是指生成所述增强图像所需的目标图像的数量。为了避免生成所述增强图像时产生图像间隙,所述预设偶数量通常设置为偶数。
通过数量为所述预设偶数量的目标图像拼接生成所述增强图像,能够避免生成的所述增强图像存在图像间隙,提高所述增强图像的图像质量。
在本发明的至少一个实施例中,在得到增强图像后,所述方法还包括:
获取所述数据增强请求的请求编号;
根据所述请求编号及所述增强图像的存储路径生成反馈结果;
将所述反馈结果发送至所述数据增强请求的触发设备。
其中,所述触发设备是指触发所述数据增强请求生成的设备。
通过将所述反馈结果直接发送至所述触发设备,而无需经过其他设备的转发,能够提高所述反馈结果的发送效率。
由以上技术方案可以看出,本发明通过所述图像数量确定出需要进行数据增强的标签,能够准确的确定出导致数据不平衡的标签,进一步通过所述图像对的请求标签直接生成所述融合图像的融合标签,由于所述融合图像中兼具了所述图像对中任意两张图像,因此将所述图像对所对应的请求标签直接确定为所述融合标签,不仅能够实现对所述请求标签中图像的增强,还能够提高模型对多标签分类问题的处理准确性,进而通过所述标签比例拼接所述请求图像及所述融合图像,能够确保所述请求场景中的数据平衡,从而能够避免因数据不平衡而带来的模型准确性的问题。
如图2所示,是本发明图像数据增强装置的较佳实施例的功能模块图。所述图像数据增强装置11包括获取单元110、提取单元111、融合单元112、生成单元113、计算单元114、拼接单元115及发送单元116。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
当接收到数据增强请求时,获取单元110根据所述数据增强请求确定请求场景,并获取所述请求场景中每个标注标签的图像数量。
在本发明的至少一个实施例中,所述数据增强请求可以由任意图像处理用户触发生成。
所述数据增强请求中携带有所述请求场景的相关信息。
进一步地,所述请求场景是指所述数据增强请求中需要进行数据增强的图像所在的应用场景。例如,所述请求场景可以是识别动物种类。
所述标注标签是指所述请求场景中所对应的具体标签,例如,所述请求场景是识别动物种类,则所述标注标签可以包括:猫、狗、兔子等。
所述图像数量是指对应有所述标注标签的图像的数量。
在本发明的至少一个实施例中,所述获取单元110根据所述数据增强请求确定请求场景包括:
解析所述数据增强请求的报文,得到所述报文携带的数据信息;
从所述数据信息中提取场景标识;
将与所述场景标识对应的场景确定为所述请求场景。
通过上述实施方式,能够快速确定出所述请求场景。
在本发明的至少一个实施例中,所述获取单元110从图像库中获取同时与所述场景标识及所述标注标签对应的数值作为所述图像数量。
提取单元111根据所述图像数量从所述标注标签中提取请求标签,并获取所述请求标签所对应的请求图像。
在本发明的至少一个实施例中,所述请求标签是指需要进行数据增强的标签,也就是说,所述请求标签的标注比例较低。
所述请求图像是指与所述请求标签对应的图像。
在本发明的至少一个实施例中,所述提取单元111根据所述图像数量从所述标注标签中提取请求标签包括:
计算所述标注标签的标签数量,并将所述标签数量的倒数确定为所述标注标签的初始比例;
根据预设调整比例对所述初始比例进行调整,得到所述标注标签的目标比例;
计算所述图像数量的总和,得到运算总量;
基于所述图像数量在所述运算总量上的比值确定每个所述标注标签的标注比例;
将所述标注比例小于所述目标比例的标注标签确定为所述请求标签。
其中,所述预设调整比例是指根据实际容差需求设定的比例,其中,所述实际容差需求是指所述请求场景中数据平衡的容差需求。可以理解的是,所述预设调整比例小于所述初始比例。
所述目标比例是指所述初始比例与所述预设调整比例的差值。
通过所述预设调整比例调整所述初始比例,能够提高所述目标比例的容差性,进而选取标注比例小于目标比例的标注标签作为请求标签,而不将标注比例大于一定比例的标注标签同时作为请求标签,由于无需对多个对象进行分析处理,因此能够提高所述数据增强请求的响应效率。
融合单元112融合所述请求图像中的任一图像对,得到融合图像,所述任一图像对是指所述请求图像中任意两张图像。
在本发明的至少一个实施例中,所述融合图像是指基于所述图像对生成的合成图像。
在本发明的至少一个实施例中,所述融合单元112融合所述请求图像中的任一图像对,得到融合图像包括:
获取所述任一图像对中第一图像的第一尺寸,并获取所述任一图像对中第二图像的第二尺寸;
若所述第一尺寸不等于所述第二尺寸,根据所述第一尺寸及所述第二尺寸对所述第二图像进行尺寸变换,得到第三图像;
基于预设剪切比例对所述第一图像进行剪切处理,得到剪切图像;
确定所述剪切图像在所述第一图像中的图像位置;
将所述第三图像中与所述图像位置对应的区域确定为图像区域;
基于所述剪切图像替换所述图像区域,得到所述融合图像。
其中,所述第三图像的尺寸与所述第一尺寸相等。可以理解的是,所述第三图像中的图像内容与所述第二图像中的图像内容相同。所述第三图像可以是经过对所述第二图像进行压缩或者拉伸而生成的。
所述预设剪切比例是指根据实际需求设定好的比例,根据实际实验得出,所述预设剪切比例通常设置为30%。
通过所述预设剪切比例的设定能够避免所述第一图像与所述第三图像融合不均的问题,从而能够避免无法准确的生成融合标签。
在本发明的至少一个实施例中,所述融合单元112融合所述请求图像中的任一图像对,得到融合图像还包括:
从预设区间中随机获取融合比例;
获取所述第一图像中每个像素点的像素值,得到第一像素值,并获取所述第三图像中每个像素点的像素值,得到第二像素值;
根据所述融合比例对所述第一像素值及所述第二像素值进行加权和运算,得到目标像素值;
拼接所述目标像素值,得到所述融合图像。
其中,所述预设区间通常设置为(0,1)。相对的,所述融合比例可以是(0,1)中的任意一个实数。
通过上述实施方式,能够使生成的融合图像中兼具有所述第一图像及所述第三图像中每个像素点的信息,提高了所述融合图像的融合性。
生成单元113根据所述任一图像对的请求标签生成所述融合图像的融合标签。
在本发明的至少一个实施例中,所述融合标签是指所述图像对所对应有的所有请求标签。
在本发明的至少一个实施例中,所述生成单元113根据所述任一图像对的请求标签生成所述融合图像的融合标签包括:
将所述任一图像对中所对应的所有请求标签确定为所述融合标签。
其中,所述所有请求标签是指所述任一图像对中所对应有的全部标签。
通过直接将所有请求标签确定为所述融合标签,而不采用对请求标签进行加权处理的方式,能够提高数据增强在多标签分类上的适应性,从而能够提高模型的训练准确性。
计算单元114根据所述图像数量及所述融合标签计算每个标注标签的标签比例。
在本发明的至少一个实施例中,所述标签比例是指对所述图像对进行融合处理后的标注标签的比例。
在本发明的至少一个实施例中,所述计算单元114根据所述图像数量及所述融合标签计算每个标注标签的标签比例包括:
根据所述融合标签计算所述融合图像在每个标注标签上的融合数量;
根据所述图像数量及所述融合数量计算每个标注标签的目标数量;
将所述目标数量在所述目标数量的总和上的比值确定为所述标签比例。
通过上述实施方式,能够快速确定出所述标签比例,从而有利于确定是否对所述数据增强请求进一步进行处理。
拼接单元115根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像。
在本发明的至少一个实施例中,所述增强图像包括所述融合图像、拼接所述请求图像及所述融合图像而生成的图像。
所述预设比例可以设置为所述目标比例。
需要强调的是,为进一步保证上述增强图像的私密和安全性,上述增强图像还可以存储于一区块链的节点中。
在本发明的至少一个实施例中,所述拼接单元115根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像包括:
将所述标签比例小于预设比例的标注标签确定为目标标签;
从所述请求图像及所述融合图像中选取与所述目标标签对应的图像作为目标图像;
基于预设偶数量随机拼接所述目标图像,直至所述标签比例大于或者等于所述预设比例,得到所述增强图像。
其中,所述预设偶数量是指生成所述增强图像所需的目标图像的数量。为了避免生成所述增强图像时产生图像间隙,所述预设偶数量通常设置为偶数。
通过数量为所述预设偶数量的目标图像拼接生成所述增强图像,能够避免生成的所述增强图像存在图像间隙,提高所述增强图像的图像质量。
在本发明的至少一个实施例中,在得到增强图像后,所述获取单元110获取所述数据增强请求的请求编号;
所述生成单元113根据所述请求编号及所述增强图像的存储路径生成反馈结果;
发送单元116将所述反馈结果发送至所述数据增强请求的触发设备。
其中,所述触发设备是指触发所述数据增强请求生成的设备。
通过将所述反馈结果直接发送至所述触发设备,而无需经过其他设备的转发,能够提高所述反馈结果的发送效率。
由以上技术方案可以看出,本发明通过所述图像数量确定出需要进行数据增强的标签,能够准确的确定出导致数据不平衡的标签,进一步通过所述图像对的请求标签直接生成所述融合图像的融合标签,由于所述融合图像中兼具了所述图像对中任意两张图像,因此将所述图像对所对应的请求标签直接确定为所述融合标签,不仅能够实现对所述请求标签中图像的增强,还能够提高模型对多标签分类问题的处理准确性,进而通过所述标签比例拼接所述请求图像及所述融合图像,能够确保所述请求场景中的数据平衡,从而能够避免因数据不平衡而带来的模型准确性的问题。
如图3所示,是本发明实现图像数据增强方法的较佳实施例的电子设备的结构示意图。
在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如图像数据增强程序。
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
所述处理器13可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述电子设备1中的执行过程。例如,所述计算机可读指令可以被分割成获取单元110、提取单元111、融合单元112、生成单元113、计算单元114、拼接单元115及发送单元116。
所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、TF卡(Trans-flash Card)等等。
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种图像数据增强方法,所述处理器13可执行所述计算机可读指令从而实现:
当接收到数据增强请求时,根据所述数据增强请求确定请求场景,并获取所述请求场景中每个标注标签的图像数量;
根据所述图像数量从所述标注标签中提取请求标签,并获取所述请求标签所对应的请求图像;
融合所述请求图像中的任一图像对,得到融合图像,所述任一图像对是指所述请求图像中任意两张图像;
根据所述任一图像对的请求标签生成所述融合图像的融合标签;
根据所述图像数量及所述融合标签计算每个标注标签的标签比例;
根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像。
具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
当接收到数据增强请求时,根据所述数据增强请求确定请求场景,并获取所述请求场景中每个标注标签的图像数量;
根据所述图像数量从所述标注标签中提取请求标签,并获取所述请求标签所对应的请求图像;
融合所述请求图像中的任一图像对,得到融合图像,所述任一图像对是指所述请求图像中任意两张图像;
根据所述任一图像对的请求标签生成所述融合图像的融合标签;
根据所述图像数量及所述融合标签计算每个标注标签的标签比例;
根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。所述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种图像数据增强方法,其特征在于,所述图像数据增强方法包括:
当接收到数据增强请求时,根据所述数据增强请求确定请求场景,并获取所述请求场景中每个标注标签的图像数量;
根据所述图像数量从所述标注标签中提取请求标签,并获取所述请求标签所对应的请求图像;
融合所述请求图像中的任一图像对,得到融合图像,所述任一图像对是指所述请求图像中任意两张图像;
根据所述任一图像对的请求标签生成所述融合图像的融合标签;
根据所述图像数量及所述融合标签计算每个标注标签的标签比例;
根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像。
2.如权利要求1所述的图像数据增强方法,其特征在于,所述根据所述图像数量从所述标注标签中提取请求标签包括:
计算所述标注标签的标签数量,并将所述标签数量的倒数确定为所述标注标签的初始比例;
根据预设调整比例对所述初始比例进行调整,得到所述标注标签的目标比例;
计算所述图像数量的总和,得到运算总量;
基于所述图像数量在所述运算总量上的比值确定每个所述标注标签的标注比例;
将所述标注比例小于所述目标比例的标注标签确定为所述请求标签。
3.如权利要求1所述的图像数据增强方法,其特征在于,所述融合所述请求图像中的任一图像对,得到融合图像包括:
获取所述任一图像对中第一图像的第一尺寸,并获取所述任一图像对中第二图像的第二尺寸;
若所述第一尺寸不等于所述第二尺寸,根据所述第一尺寸及所述第二尺寸对所述第二图像进行尺寸变换,得到第三图像;
基于预设剪切比例对所述第一图像进行剪切处理,得到剪切图像;
确定所述剪切图像在所述第一图像中的图像位置;
将所述第三图像中与所述图像位置对应的区域确定为图像区域;
基于所述剪切图像替换所述图像区域,得到所述融合图像。
4.如权利要求3所述的图像数据增强方法,其特征在于,所述融合所述请求图像中的任一图像对,得到融合图像还包括:
从预设区间中随机获取融合比例;
获取所述第一图像中每个像素点的像素值,得到第一像素值,并获取所述第三图像中每个像素点的像素值,得到第二像素值;
根据所述融合比例对所述第一像素值及所述第二像素值进行加权和运算,得到目标像素值;
拼接所述目标像素值,得到所述融合图像。
5.如权利要求1所述的图像数据增强方法,其特征在于,所述根据所述任一图像对的请求标签生成所述融合图像的融合标签包括:
将所述任一图像对中所对应的所有请求标签确定为所述融合标签。
6.如权利要求1所述的图像数据增强方法,其特征在于,所述根据所述图像数量及所述融合标签计算每个标注标签的标签比例包括:
根据所述融合标签计算所述融合图像在每个标注标签上的融合数量;
根据所述图像数量及所述融合数量计算每个标注标签的目标数量;
将所述目标数量在所述目标数量的总和上的比值确定为所述标签比例。
7.如权利要求1所述的图像数据增强方法,其特征在于,所述根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像包括:
将所述标签比例小于预设比例的标注标签确定为目标标签;
从所述请求图像及所述融合图像中选取与所述目标标签对应的图像作为目标图像;
基于预设偶数量随机拼接所述目标图像,直至所述标签比例大于或者等于所述预设比例,得到所述增强图像。
8.一种图像数据增强装置,其特征在于,所述图像数据增强装置包括:
获取单元,用于当接收到数据增强请求时,根据所述数据增强请求确定请求场景,并获取所述请求场景中每个标注标签的图像数量;
提取单元,用于根据所述图像数量从所述标注标签中提取请求标签,并获取所述请求标签所对应的请求图像;
融合单元,用于融合所述请求图像中的任一图像对,得到融合图像,所述任一图像对是指所述请求图像中任意两张图像;
生成单元,用于根据所述任一图像对的请求标签生成所述融合图像的融合标签;
计算单元,用于根据所述图像数量及所述融合标签计算每个标注标签的标签比例;
拼接单元,用于根据所述标签比例拼接所述请求图像及所述融合图像,直至所述标签比例大于或者等于预设比例,得到增强图像。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,存储有计算机可读指令;及
处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至7中任意一项所述的图像数据增强方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的图像数据增强方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110913157.3A CN113610739A (zh) | 2021-08-10 | 2021-08-10 | 图像数据增强方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110913157.3A CN113610739A (zh) | 2021-08-10 | 2021-08-10 | 图像数据增强方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113610739A true CN113610739A (zh) | 2021-11-05 |
Family
ID=78307879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110913157.3A Pending CN113610739A (zh) | 2021-08-10 | 2021-08-10 | 图像数据增强方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610739A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440651A (zh) * | 2013-08-26 | 2013-12-11 | 北京理工大学 | 一种基于秩最小化的多标签图像标注结果融合方法 |
US20150248768A1 (en) * | 2014-02-28 | 2015-09-03 | International Business Machines Corporation | Segmentation Using Hybrid Discriminative Generative Label Fusion of Multiple Atlases |
WO2017210690A1 (en) * | 2016-06-03 | 2017-12-07 | Lu Le | Spatial aggregation of holistically-nested convolutional neural networks for automated organ localization and segmentation in 3d medical scans |
CN108133233A (zh) * | 2017-12-18 | 2018-06-08 | 中山大学 | 一种多标签图像识别方法及装置 |
CN109523525A (zh) * | 2018-11-07 | 2019-03-26 | 广州大学 | 图像融合的恶性肺结节识别方法、装置、设备及存储介质 |
CN109711481A (zh) * | 2019-01-02 | 2019-05-03 | 京东方科技集团股份有限公司 | 用于画作多标签识别的神经网络、相关方法、介质和设备 |
CN109871909A (zh) * | 2019-04-16 | 2019-06-11 | 京东方科技集团股份有限公司 | 图像识别方法及装置 |
US20190244357A1 (en) * | 2018-02-07 | 2019-08-08 | International Business Machines Corporation | System for Segmentation of Anatomical Structures in Cardiac CTA Using Fully Convolutional Neural Networks |
US20200334787A1 (en) * | 2019-04-22 | 2020-10-22 | Apple Inc. | Tagging clipped pixels for pyramid processing in image signal processor |
CN112598076A (zh) * | 2020-12-29 | 2021-04-02 | 北京易华录信息技术股份有限公司 | 一种机动车属性识别方法及系统 |
-
2021
- 2021-08-10 CN CN202110913157.3A patent/CN113610739A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440651A (zh) * | 2013-08-26 | 2013-12-11 | 北京理工大学 | 一种基于秩最小化的多标签图像标注结果融合方法 |
US20150248768A1 (en) * | 2014-02-28 | 2015-09-03 | International Business Machines Corporation | Segmentation Using Hybrid Discriminative Generative Label Fusion of Multiple Atlases |
WO2017210690A1 (en) * | 2016-06-03 | 2017-12-07 | Lu Le | Spatial aggregation of holistically-nested convolutional neural networks for automated organ localization and segmentation in 3d medical scans |
CN108133233A (zh) * | 2017-12-18 | 2018-06-08 | 中山大学 | 一种多标签图像识别方法及装置 |
US20190244357A1 (en) * | 2018-02-07 | 2019-08-08 | International Business Machines Corporation | System for Segmentation of Anatomical Structures in Cardiac CTA Using Fully Convolutional Neural Networks |
CN109523525A (zh) * | 2018-11-07 | 2019-03-26 | 广州大学 | 图像融合的恶性肺结节识别方法、装置、设备及存储介质 |
CN109711481A (zh) * | 2019-01-02 | 2019-05-03 | 京东方科技集团股份有限公司 | 用于画作多标签识别的神经网络、相关方法、介质和设备 |
CN109871909A (zh) * | 2019-04-16 | 2019-06-11 | 京东方科技集团股份有限公司 | 图像识别方法及装置 |
US20200334787A1 (en) * | 2019-04-22 | 2020-10-22 | Apple Inc. | Tagging clipped pixels for pyramid processing in image signal processor |
CN112598076A (zh) * | 2020-12-29 | 2021-04-02 | 北京易华录信息技术股份有限公司 | 一种机动车属性识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112989826B (zh) | 基于人工智能的试题分数确定方法、装置、设备及介质 | |
CN111797351A (zh) | 页面数据管理方法、装置、电子设备及介质 | |
CN112668453B (zh) | 视频识别方法及相关设备 | |
CN111860377A (zh) | 基于人工智能的直播方法、装置、电子设备及存储介质 | |
CN111639487A (zh) | 基于分类模型的字段抽取方法、装置、电子设备及介质 | |
JP2023509405A (ja) | 翻訳方法、装置、電子機器及びコンピュータプログラム | |
CN112053143B (zh) | 资金路由方法、装置、电子设备及存储介质 | |
CN112232203A (zh) | 行人识别方法、装置、电子设备及存储介质 | |
CN114418398A (zh) | 场景任务开发方法、装置、设备及存储介质 | |
CN113791750B (zh) | 一种虚拟内容显示方法、装置和计算机可读存储介质 | |
CN113918467A (zh) | 金融系统测试方法、装置、设备及存储介质 | |
CN113536770A (zh) | 基于人工智能的文本解析方法、装置、设备及存储介质 | |
CN113705468A (zh) | 基于人工智能的数字图像识别方法及相关设备 | |
CN116543460A (zh) | 基于人工智能的时空动作识别方法及相关设备 | |
CN112948418A (zh) | 动态查询方法、装置、设备及存储介质 | |
CN113627576B (zh) | 扫码信息检测方法、装置、设备及存储介质 | |
CN113610739A (zh) | 图像数据增强方法、装置、设备及存储介质 | |
CN112102205B (zh) | 图像去模糊方法、装置、电子设备及存储介质 | |
CN112949305B (zh) | 负反馈信息采集方法、装置、设备及存储介质 | |
CN112529116B (zh) | 场景元素融合处理方法、装置和设备及计算机存储介质 | |
CN114003784A (zh) | 请求录制方法、装置、设备及存储介质 | |
CN114329095A (zh) | 系统逻辑图生成方法、装置、设备及存储介质 | |
CN114238296A (zh) | 产品指标数据展示方法、装置、设备及存储介质 | |
CN115037790A (zh) | 异常注册识别方法、装置、设备及存储介质 | |
CN113886263A (zh) | 系统测试方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |