CN112613543B - 增强策略验证方法、装置、电子设备及存储介质 - Google Patents

增强策略验证方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112613543B
CN112613543B CN202011484915.6A CN202011484915A CN112613543B CN 112613543 B CN112613543 B CN 112613543B CN 202011484915 A CN202011484915 A CN 202011484915A CN 112613543 B CN112613543 B CN 112613543B
Authority
CN
China
Prior art keywords
enhancement
verified
strategy
policy
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011484915.6A
Other languages
English (en)
Other versions
CN112613543A (zh
Inventor
黄殿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Unisinsight Technology Co Ltd
Original Assignee
Chongqing Unisinsight Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Unisinsight Technology Co Ltd filed Critical Chongqing Unisinsight Technology Co Ltd
Priority to CN202011484915.6A priority Critical patent/CN112613543B/zh
Publication of CN112613543A publication Critical patent/CN112613543A/zh
Application granted granted Critical
Publication of CN112613543B publication Critical patent/CN112613543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Stored Programmes (AREA)
  • Storage Device Security (AREA)

Abstract

本申请提供的增强策略验证方法、装置、电子设备及存储介质中,针对待验证增强策略所生成的增强数据,该电子设备通过原始样本数据训练生成的目标模型对增强数据进行验证,当目标模型对增强数据处理结果中,目标处理结果的占有率超过设定的阈值,则将待验证增强测策略作为目标增强策略。由于是从模型训练的角度对生成的增强数据进行验证,使得所确定出的目标增强策略更适合为特定用途的模型生成增强数据。

Description

增强策略验证方法、装置、电子设备及存储介质
技术领域
本申请涉及数据处理领域,具体而言,涉及一种增强策略验证方法、装置、电子设备及存储介质。
背景技术
目前,随着人工智能技术的成熟,促进了各个行业的转型发展。并且,几乎所有的深度学习模型都是基于数据驱动,因此,数据的“质”和“量”很大程度上影响了算法的智能程度。然而,在实际使用过程中经常存在数据量不足、质量不高的问题。
为了解决数据量不足、质不高的问题,数据增强技术被广泛应用于人工智能前期,进行数据的预处理。然而,目前对数据增强处理策略的增强效果进行验证时,通常将增强的数据与原始数据进行相似度比对。由于该方式更多的是从视觉层面对增强数据进行验证,并不是从模型训练层面进行验证,因此,生成的增强数据并不能很好的适应对于深度学习模型的训练目的。
发明内容
为了克服现有技术中的至少一个不足,第一方面,本申实施例提供一种增强策略验证方法,应用于电子设备,所述电子设备配置有预训练的目标模型,所述预训练的目标模型经原始样本数据进行训练获得,所述方法包括:
获取待验证增强策略以及增强数据,其中,所述增强数据由所述待验证增强策略对所述原始样本数据进行增强处理获得;
将所述增强数据输入至所述目标模型,获得待验证结果;
根据所述待验证结果确定出满足预设条件的目标增强策略。
在一种可能的实现方式中,所述电子设备配置有多个增强操作,所述获取待验证增强策略以及增强数据,包括:
根据预设筛选策略从所述多个增强操作中确定出所述待验证增强策略,其中,所述待验证增强策略包括至少两个所述增强操作;
通过所述待验证增强策略对所述原始样本数据进行增强处理,获得所述增强数据。
在一种可能的实现方式中,所述根据预设筛选策略从所述多个增强操作中确定出所述待验证增强策略,包括:
通过贝叶斯优化方法从所述多个增强操作中确定出所述待验证增强策略。
在一种可能的实现方式中,所述获取待验证增强策略以及增强数据之前,所述方法还包括:
通过所述原始样本数据训练获得所述目标模型。
第二方面,本申实施例提供一种增强策略验证装置,所述增强策略验证装置包括:
数据获取模块,用于获取待验证增强策略以及增强数据,其中,所述增强数据由所述待验证增强策略对原始样本数据进行增强处理获得;
结果获取模块,用于将所述增强数据输入至预训练的目标模型,获得待验证结果,其中,所述目标模型经原始样本数据进行训练获得;
策略验证模块,用于根据所述待验证结果确定出满足预设条件的目标增强策略。
在一种可能的实现方式中,所述获取模块具体用于:
根据预设筛选策略从多个增强操作中确定出所述待验证增强策略,其中,所述待验证增强策略包括至少两个所述增强操作;
通过所述待验证增强策略对所述原始样本数据进行增强处理,获得所述增强数据。
在一种可能的实现方式中,所述获取模块通过以下方式获得所述待验证增强策略:
通过贝叶斯优化方法从所述多个增强操作中确定出所述待验证增强策略。
在一种可能的实现方式中,所述增强策略验证装置还包括:
模型获取模块,用于通过所述原始样本数据训练获得所述目标模型。
第三方面,本申实施例提供一种电子设备,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序中的计算机可执行指令被出所述处理器执行时,实现所述的增强策略验证方法。
第四方面,本申实施例提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的增强策略验证方法。
相对于现有技术而言,本申请具有以下有益效果:
本申请实施例提供的增强策略验证方法、装置、电子设备及存储介质中,针对待验证增强策略所生成的增强数据,该电子设备通过原始样本数据训练生成的目标模型对增强数据进行验证,当目标模型对增强数据处理结果中,目标处理结果的占有率超过设定的阈值,则将待验证增强测策略作为目标增强策略。由于是从模型训练的角度对生成的增强数据进行验证,使得所确定出的目标增强策略更适合为特定用途的模型生成增强数据。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的电子设备结构示意图;
图2为本申请实施例提供的增强策略验证方法流程示意图;
图3为本申请实施例提供的增强策略生成示原理示意图;
图4为本申请实施例提供的增强策略验证装置结构示意图。
图标:120-存储器;130-处理器;300-原始样本数据;301-增强操作集;302-增强策略集;1101-数据获取模块;1102-结果获取模块;1103-策略验证模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
相关技术中,为了解决数据量不足、质不高的问题,数据增强技术被广泛应用于人工智能前期,进行数据的预处理。然而,目前对数据增强处理策略的增强效果进行验证时,通常将增强的数据与原始数据进行相似度比对。
上述验证方式更多的是从视觉层面对增强数据进行验证,并不是从模型训练层面进行验证,因此,受限于上述验证方式,使得生成的增强数据并不能很好的适应对于深度学习模型的训练目的。
下面以用于进行人脸识别的深度学习模型为例,对上述验证方式进行示例性说明。基于有限数量的人脸原始样本图像,通过增强策略对原始样本图像进行增强处理,获得增强图像。
为了验证增强图像的增强效果,将增强图像与原始样本图像做相似度比对,若两者的相似度超过设定的阈值,则说明该增强策略的增强效果较为理想。然而,两者的相似度超过设定的阈值,仅仅是从设备的角度判断图像的内容是否相似,因此,存在一定的误差(即虽然设备判定为两者相似,但是肉眼感官上可能存在较大的差异);并且,由于误差的存在,使得增强图像并不适用于对是深度学习模型的训练目的。
鉴于此,本申请实施例提供一种增强策略验证方法,应用于电子设备。其中,该电子设备可以是,但不限于,该服务器、智能终端、个人电脑(Personal Computer,PC)等。
请参照图1,为本申请实施例提供的该电子设备一种可能的结构示意图。其中,该电子设备包括存储器120以及处理器130。
该存储器120、处理器130以及其他各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
其中,该存储器120可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器120用于存储程序,该处理器130在接收到执行指令后,执行该程序。
该处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
下面就图1所示电子设备所执行的增强策略验证方法进行详细阐述。如图2所示,该增强策略验证方法包括:
步骤S101,获取待验证增强策略以及增强数据。
其中,增强数据由待验证增强策略对原始样本数据进行增强处理获得。并且,通过该原始样本数据训练有目标模型。
步骤S102,将增强数据输入至目标模型,获得待验证结果。
步骤S103,根据待验证结果确定出满足预设条件的目标增强策略。
作为一种可能的实现方式,上述原始样本数据可以是包括猫的样本图像,经过样本图像训练获得的目标模型能够用于检测待识别图像中是否存在猫这一类的目标。假定基于样本图像,该电子设备通过待验证增强策略生成了100张增强图像,即上述增强数据。
该电子设备将这100张增强图像输入至目标模型,获得该目标模型对这100张增强图像的识别结果。若这100张增强图像的识别结果中,有95张增强图像中存在猫,即识别正确的占有率为0.95。由于0.95大于阈值0.9,因此,说明当前的待验证增强策略的增强效果满足要求,能够用于训练对猫进行识别的模型。
若占有率是小于或者等于0.9,该电子设备则可以获取新的待验证增强策略以及对应的增强数据,再次对新的待验证增强策略的增强效果进行验证。当然,若需要获得多个目标增强策略,可以重复上述步骤,以得到预设数量的目标增强策略。
作为另外一种可能的实现方式,上述待验证增强策略包括多个策略,示例性的,上述待验证增强策略可以包括10个策略。同样以包括猫的样本图像为例,经过样本图像训练获得的目标模型能够用于检测待识别图像中是否存在猫这一类的目标。
该电子设备将样本图分别通过10个策略进行增强操作,获得10组增强图像集;分别将每组增强图像集输入至目标模型,获得每组增强图像中识别结果为猫的占有率;将10组占有率按照从大到小的顺序进行排序,选取前5个占有率对应的增强策略作为目标增强策略。
基于上述目标增强策略,请参照表1,为本申请实施例提供的基于硬件平台NVIDIATesla V100*8+新华三R621OS-G3服务器的实验对比数据。其中,表1中的Dataset为数据集,该实验中使用的是CI FAR-10数据集,其中,CI FAR-10数据集由10个类的60000个32x32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。Model为测试使用的算法模型,其中,不同的训练任务可以使用不同的模型。Baseline为基准测试结果,这个模型结果是通过手动训练(没有添加数据增强)得到的数据。AA为AutoAugmentation数据增强算法。PBA为Population based Augmentation数据增强算法。Fast AA为本申请实施例中的目标增强算法。
表1
Dataset Model Baseline AA PBA Fast AA
CI FAR-10 Wide-ResNet-40-2 5.4 3.6 - 3.6
CI FAR-10 Wide-ResNet-28-10 4.1 2.7 2.6 2.6
CI FAR-10 Shake-Shake(26 2x32d) 3.2 2.5 2.5 2.5
CI FAR-10 Shake-Shake(26 2x96d) 3.0 2.1 2.0 2
CI FAR-10 Shake-Shake(262x112d) 2.8 2.1 2.0 2.1
CI FAR-10 PyramidNet+ShakeDrop 2.6 1.7 1.5 1.7
通过表1中上述实验数据,可以看出,由本申请实施例中的目标增强策略所生成的增强数据训练出的模型的识别错误率,小于或者接近由其他增强策略所生成的增强数据训练出的模型。因此,针对待验证增强策略所生成的增强数据,该电子设备通过原始样本数据训练生成的目标模型对增强数据进行验证,当目标模型对增强数据处理结果中,目标处理结果的占有率超过设定的阈值,则将待验证增强测策略作为目标增强策略。由于是从模型训练的角度对生成的增强数据进行验证,使得所确定出的目标增强策略更适合为特定用途的模型生成增强数据。
其他相关技术中,针对该待验证增强策略,需要基于该待验证增强策略生成原始样本数据的增强数据,并通过增强数据训练获得一增强数据模型。然后,将原始样本数据输入至增强数据模型,验证该模型的识别效果。
该方式中,针对每个待验证的增强策略均需要训练一增强数据模型,然而,进行模型的训练需要耗费大量的时间,继而导致对目标增强策略的筛选效率较为欠佳。
鉴于此,本申请实施例中,通过原始样本数据训练一目标模型,且仅进行一次训练,并通过该目标模型获得增强数据的待验证结果,以筛选出目标增强策略,因此,本申请实施例提供的增强策略验证方法,还能够提高目标增强策略的筛选效率。
基于上述目标增强策略,请参照表2,为本申请供的同样基于硬件平台NVIDIATesla V100*8+新华三R621OS-G3服务器的实验对比数据。表2中,Dataset为数据集。Model为测试使用的算法模型,其中,不同的训练任务可以使用不同的模型。Baseline为基准测试结果,该模型结果是通过手动训练(没有添加数据增强)得到的数据。AA为AutoAugmentation数据增强算法。PBA为Population based Augmentation数据增强算法。Fast AA为本申请实施例中的目标增强算法。
表2
Dataset Model AA PBA Fast AA
CIFAR-10 Wide-ResNet-28-10 5000 52.2 3.5
SVHN Wide-ResNet-28-10 1000 7.2 1.5
ImagesNet ResNet-50 15000 192.7 45.5
通过表2中的上述实验数据,可以看出,本申请实施例通过原始样本数据训练获得的目标模型,用于进行目标增强策略筛选时,所需要的耗时(单位:小时)更短。
本申请实施例中,为了筛选出满足需求的增强策略,该电子设备预先配置有多种增强操作,并从中筛选出至少2种增强操作,用于构成增强策略。因此,作为一种可能的实现方式,上述步骤S101可以包括以下子步骤:
步骤S101-1,根据预设筛选策略从多个增强操作中确定出待验证增强策略,其中,待验证增强策略包括至少两个增强操作。
步骤S101-2,通过待验证增强策略对原始样本数据进行增强处理,获得增强数据。
以增强图像为例,上述增强操作可以包括:
(1)ShearX操作,其中,ShearX操作具体用于将图像中的像素点沿X轴进行偏移操作,对应的可调参数为偏移的像素点数量。
(2)ShearY操作,其中,ShearY操作具体用于将图像中的像素点沿Y轴进行偏移操作,对应的可调参数为偏移的像素点数量。
(3)TranslateX操作,其中,TranslateX操作具体用于将图像中的像素点循沿X轴循环移位,对应可调参数为循环位移的像素点数量。
(4)TranslateY操作,其中,TranslateY操作具体用于将图像中的像素点循沿Y轴循环移位,对应可调参数为循环位移的像素点数量。
(5)Rotate操作,其中,Rotate操作具体用于将图像进行旋转,对应的可调参数为旋转的角度。
(6)AutoContrast操作,其中,AutoContrast操作具体用于调整图像对比度,即计算一个输入图像的直方图,从这个直方图中去除最亮和最暗的部分,然后重新映射图像。
(7)Invert操作,其中,Invert操作具体用于将输入图像转换为反色图像。
(8)Equalize操作,其中,Equalize操作具体用于进行直方图均衡化处理,以产生像素分布均匀的图像。
(9)Solarlize操作,其中,Solarlize操作具体用于反转在预设阈值范围内的像素点。
(10)Posterize操作,其中,Posterize操作具体用于进行色调分离,即将每个颜色通道上像素值对应变量的最低的(8-x)个比特位置为0;对应的x可调范围为[0,8]。
(11)Contrast操作,其中,Contrast操作具体用于调整图片的对比度,及像素值之间的差距,对应的可调参数为像素之间像素值的差距。
(12)Color操作,其中,Color操作具体用于调整图像之间的饱和度,对应的可调参数为像素的饱和程度。
(13)Shearpness操作,其中,Shearpness操作具体用于调整图像的锐度,对应的可调参数为锐度幅值。
(14)Brightness操作,其中,Brightness操作具体用于调整图像的亮度,对应的可调参数为亮度幅值。
(15)CutOut操作,其中,CutOut操作具体用于在图像中添加随机图块,对应的可调参数为随机图块的大小。
(16)RandomErasing操作,其中,RandomErasing操作具体用于随机确定替换掉的区域大小,对应的可调参数为图块的大小以及随机像素值。
(17)SamplePairing操作,其中,SamplePairing操作具体有用于将多张图相互增强后相互混合,对应的可调参数为图片的数量。
(19)MixUp操作,其中,MixUp操作具体用于随机抽取两个样本进行简单的随机加权求和,同时样本的标签也对应加权求和,对应的可调参数为图片的数量和加权的权重。
(20)CutMix操作,其中,CutMix操作具体用于切割掉图像中的图块并用其他图块的部分补充,对应的可调参数为图块的位置以及大小。
(21)Ricap操作,其中,Ricap操作具体用于提取多张图的目标位置,然后重新拼接成新图,对应的可调参数为图块的大小和图块数量。
基于上述操作,该电子设备可以选取至少两种操作进行相互组合,以构成图像增强策略。应理解的是,相同的多种增强操作,调整增强操作的操作顺序可以得到不同的增强策略。例如,先执行CutMix操作,然后再执行Ricap操作,与先执行Ricap操作,再执行CutMix操作属于两种不同的图像增强策略。
作为一种可能的实现方式,由相关领域的技术人员凭借个人经验选取的数据增强方案。但在实际应用中发现,凭借个人经验所筛选的数据增强翻翻可能导致最终训练的模型与实际需要的模型之间表现出巨大的差异,并且极度依赖相关技术人员的个人经验。另外,由于凭借个人经验选取的数据增强方案,不仅制定的数据增强方案的实际效果难以保证,而且效率较为欠佳。
本申请实施例中,为例提高筛选增强策略的效率以及增强策略的鲁棒性,该电子设备通过贝叶斯优化方法从多个增强操作中确定出待验证增强策略。
示例性的,请参照图3,为本申请实施例提供的增强策略筛选流程示意图。如图3所示,基于原始样本数据300,电子设备通过K-Fold方法,将原始样本数据300拆分成K份,并依次选取其中一份作为验证集,将剩余的作为训练集对模型进行训练,获得K个目标模型。
即假定Dtrain为原始样本数据300,将Dtrain切分成K份,
Figure BDA0002838758800000111
其中/>
Figure BDA0002838758800000123
为训练集,/>
Figure BDA0002838758800000122
是为验证集,k表示将第k份原始样本数据作为验证集。
针对每个目标模型,该电子设备基于增强操作集301中的增强操作,通过贝叶斯优化方法进行预设次数的采样操作,生成满足需求的增强策略集302,其中,该增强策略集302中包括至少一个目标增强策略。
即本申请实施例中,该电子设备通过贝叶斯优化方法自动筛选满足需求的目标增强策略,达到自动实现对增强操作进行筛选的目的。其中,作为一种可能的实现方式,电子设备可以通过EM(Expectation-Maximum,期望最大化)算法查找最小化目标模型损失的目标增强策略。
基于相同的发明构思,本申请实施例还提供一种增强策略验证装置。增强策略验证装置包括至少一个可以软件形式存储于存储器120中的功能模块。请参照图4,从功能上划分,增强策略验证装置可以包括:
数据获取模块1101,用于获取待验证增强策略以及增强数据,其中,增强数据由待验证增强策略对原始样本数据进行增强处理获得。
本申请实施例中,该数据获取模块1101中的计算机可执行指令被处理器执行时,实现图2中的步骤S101,关于该数据获取模块1101的详细描述可以参考步骤S101的详细描述。
结果获取模块1102,用于将增强数据输入至预训练的目标模型,获得待验证结果,其中,目标模型经原始样本数据进行训练获得。
本申请实施例中,该结果获取模块1102中的计算机可执行指令被处理器执行时,实现图2中的步骤S102,关于该结果获取模块1102的详细描述可以参考步骤S102的详细描述。
策略验证模块1103,根据所述待验证结果确定出满足预设条件的目标增强策略。
本申请实施例中,该策略验证模块1103中的计算机可执行指令被处理器执行时,实现图2中的步骤S103、S104、S105,关于该策略验证模块1103的详细描述可以参考步骤S103、S104、S105的详细描述。
在一种可能的实现方式中,获取模块具体用于:
根据预设筛选策略从多个增强操作中确定出待验证增强策略,其中,待验证增强策略包括至少两个增强操作;
通过待验证增强策略对原始样本数据进行增强处理,获得增强数据。
在一种可能的实现方式中,获取模块通过以下方式获得待验证增强策略:
通过贝叶斯优化方法从多个增强操作中确定出待验证增强策略。
在一种可能的实现方式中,增强策略验证装置还包括:
模型获取模块,用于通过原始样本数据训练获得目标模型。
本申请实施例还提供一种电子设备,电子设备包括处理器以及存储器,存储器存储有计算机程序,计算机程序中的计算机可执行指令被出处理器执行时,实现增强策略验证方法。
本申请实施例还提供一种存储介质,存储介质存储有计算机程序,计算机程序被处理器执行时,实现增强策略验证方法。
综上所述,本申请实施例提供的增强策略验证方法、装置、电子设备及存储介质中,针对待验证增强策略所生成的增强数据,该电子设备通过原始样本数据训练生成的目标模型对增强数据进行验证,当目标模型对增强数据处理结果中,目标处理结果的占有率超过设定的阈值,则将待验证增强测策略作为目标增强策略。由于是从模型训练的角度对生成的增强数据进行验证,使得所确定出的目标增强策略更适合为特定用途的模型生成增强数据。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种增强策略验证方法,其特征在于,应用于电子设备,所述电子设备配置有预训练的目标模型,所述预训练的目标模型经原始样本数据进行训练获得,所述原始样本数据为样本图像,所述方法包括:
根据预设筛选策略从多个增强操作中确定出待验证增强策略集,其中,所述待验证增强策略集中的每个待验证增强策略包括至少两个所述增强操作;
通过所述待验证增强策略集对所述原始样本数据进行增强处理,获得与每个所述待验证增强策略对应的增强数据,所述增强数据为所述样本图像的增强图像;
将每个所述待验证增强策略对应的增强数据输入至所述目标模型,获得每个所述待验证增强策略的待验证结果;
根据每个所述待验证增强策略的待验证结果,从所述待验证增强策略集中确定出满足预设条件的目标增强策略。
2.根据权利要求1所述的增强策略验证方法,其特征在于,所述根据预设筛选策略从所述多个增强操作中确定出所述待验证增强策略集,包括:
通过贝叶斯优化方法从所述多个增强操作中确定出所述待验证增强策略集。
3.根据权利要求1所述的增强策略验证方法,其特征在于,所述根据预设筛选策略从所述多个增强操作中确定出待验证增强策略集之前,所述方法还包括:
通过所述原始样本数据训练获得所述目标模型。
4.一种增强策略验证装置,其特征在于,应用于电子设备,所述增强策略验证装置包括:
数据获取模块,用于根据预设筛选策略从多个增强操作中确定出待验证增强策略集,其中,所述待验证增强策略集中的每个待验证增强策略包括至少两个所述增强操作;
通过所述待验证增强策略集对原始样本数据进行增强处理,获得与每个所述待验证增强策略对应的增强数据,所述原始样本数据为样本图像,所述增强数据为所述样本图像的增强图像;
结果获取模块,用于将每个所述待验证增强策略对应的增强数据输入至预训练的目标模型,获得每个所述待验证增强策略的待验证结果,其中,所述目标模型经所述原始样本数据进行训练获得;
策略验证模块,用于根据每个所述待验证增强策略的待验证结果,从所述待验证增强策略集中确定出满足预设条件的目标增强策略。
5.根据权利要求4所述的增强策略验证装置,其特征在于,所述数据获取模块通过以下方式获得所述待验证增强策略:
通过贝叶斯优化方法从所述多个增强操作中确定出所述待验证增强策略集。
6.根据权利要求5所述的增强策略验证装置,其特征在于,所述增强策略验证装置还包括:
模型获取模块,用于通过所述原始样本数据训练获得所述目标模型。
7.一种电子设备,其特征在于,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序中的计算机可执行指令被出所述处理器执行时,实现权利要求1-3任意一项所述的增强策略验证方法。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-3任意一项所述的增强策略验证方法。
CN202011484915.6A 2020-12-15 2020-12-15 增强策略验证方法、装置、电子设备及存储介质 Active CN112613543B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011484915.6A CN112613543B (zh) 2020-12-15 2020-12-15 增强策略验证方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011484915.6A CN112613543B (zh) 2020-12-15 2020-12-15 增强策略验证方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112613543A CN112613543A (zh) 2021-04-06
CN112613543B true CN112613543B (zh) 2023-05-30

Family

ID=75239654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011484915.6A Active CN112613543B (zh) 2020-12-15 2020-12-15 增强策略验证方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112613543B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113554474A (zh) * 2021-08-11 2021-10-26 上海明略人工智能(集团)有限公司 模型的验证方法及装置、电子设备和计算机可读存储介质
CN114202673A (zh) * 2021-12-13 2022-03-18 深圳壹账通智能科技有限公司 证件分类模型的训练方法、证件分类方法、装置和介质
CN114595785B (zh) * 2022-03-29 2022-11-04 小米汽车科技有限公司 模型训练方法、装置、电子设备及存储介质
CN115272850A (zh) * 2022-07-20 2022-11-01 哈尔滨市科佳通用机电股份有限公司 一种铁路货车bab型闸调器拉杆头折断故障识别方法
CN116188294B (zh) * 2022-12-22 2023-09-19 东莞理工学院 用于医学图像的数据增强方法、系统、智能终端及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109118445A (zh) * 2018-07-27 2019-01-01 杭州电子科技大学 一种基于多分支生成对抗网络的水下图像增强方法
CN110222577A (zh) * 2019-05-08 2019-09-10 平安科技(深圳)有限公司 一种目标监控方法、装置、计算机设备及存储介质
CN110378419A (zh) * 2019-07-19 2019-10-25 广东浪潮大数据研究有限公司 一种图像集扩充方法、装置、设备及可读存储介质
CN111275129A (zh) * 2020-02-17 2020-06-12 平安科技(深圳)有限公司 一种图像数据的增广策略选取方法及系统
CN111582375A (zh) * 2020-05-09 2020-08-25 北京百度网讯科技有限公司 数据增强策略搜索方法、装置、设备以及存储介质
CN111967487A (zh) * 2020-03-23 2020-11-20 同济大学 一种用于视觉问答模型训练的增量型数据增强方法及应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7490071B2 (en) * 2003-08-29 2009-02-10 Oracle Corporation Support vector machines processing system
CN110851835A (zh) * 2019-09-23 2020-02-28 平安科技(深圳)有限公司 图像模型检测方法、装置、电子设备及存储介质
CN110807109A (zh) * 2019-11-08 2020-02-18 北京金山云网络技术有限公司 数据增强策略的生成方法、数据增强方法和装置
CN110837870B (zh) * 2019-11-12 2023-05-12 东南大学 基于主动学习的声呐图像目标识别方法
CN111339866A (zh) * 2020-02-18 2020-06-26 济南浪潮高新科技投资发展有限公司 一种基于DPN与Faster RCNN的火车票图像生成方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109118445A (zh) * 2018-07-27 2019-01-01 杭州电子科技大学 一种基于多分支生成对抗网络的水下图像增强方法
CN110222577A (zh) * 2019-05-08 2019-09-10 平安科技(深圳)有限公司 一种目标监控方法、装置、计算机设备及存储介质
CN110378419A (zh) * 2019-07-19 2019-10-25 广东浪潮大数据研究有限公司 一种图像集扩充方法、装置、设备及可读存储介质
CN111275129A (zh) * 2020-02-17 2020-06-12 平安科技(深圳)有限公司 一种图像数据的增广策略选取方法及系统
CN111967487A (zh) * 2020-03-23 2020-11-20 同济大学 一种用于视觉问答模型训练的增量型数据增强方法及应用
CN111582375A (zh) * 2020-05-09 2020-08-25 北京百度网讯科技有限公司 数据增强策略搜索方法、装置、设备以及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
M.A.Ganaie 等.LSTSVM classifier with enhanced features from pre-trained functional link network.《Applied Soft Computing》.2020,第93卷1-9. *
邵思羽.基于深度学习的旋转机械故障诊断方法研究.《中国博士学位论文全文数据库 工程科技Ⅱ辑》.2020,(第05期),C029-7. *

Also Published As

Publication number Publication date
CN112613543A (zh) 2021-04-06

Similar Documents

Publication Publication Date Title
CN112613543B (zh) 增强策略验证方法、装置、电子设备及存储介质
CN110378235B (zh) 一种模糊人脸图像识别方法、装置及终端设备
CN108345641B (zh) 一种爬取网站数据的方法、存储介质和服务器
CN109191424B (zh) 一种乳腺肿块检测与分类系统、计算机可读存储介质
CN111709883B (zh) 一种图像检测方法、装置及设备
CN111862035B (zh) 光斑检测模型的训练方法、光斑检测方法、设备及介质
CN109919209A (zh) 一种领域自适应深度学习方法及可读存储介质
CN113222883B (zh) 处理异常检测的装置及方法
US20190294863A9 (en) Method and apparatus for face classification
CN111062903A (zh) 图像水印的自动处理方法、系统、电子设备及存储介质
CN110675334A (zh) 一种图像增强方法及装置
CN111340233B (zh) 机器学习模型的训练方法及装置、样本处理方法及装置
CN114943708A (zh) 图像缺陷检测方法、装置、设备、存储介质和程序产品
CN110363837B (zh) 游戏中纹理图像的处理方法及装置、电子设备、存储介质
CN113344907B (zh) 一种图像检测方法及装置
CN116152577B (zh) 图像分类方法及装置
CN112084936A (zh) 一种人脸图像预处理方法、装置、设备及存储介质
CN111814820A (zh) 图像处理方法及装置
Gibson et al. A no-reference perceptual based contrast enhancement metric for ocean scenes in fog
CN115546554A (zh) 敏感图像的识别方法、装置、设备和计算机可读存储介质
CN107644251B (zh) 对象分类方法、装置和系统
CN111709951B (zh) 目标检测网络训练方法及系统及网络及装置及介质
CN115393756A (zh) 一种基于视觉图像的水印识别方法、装置、设备及介质
CN114913513A (zh) 一种公章图像的相似度计算方法、装置、电子设备和介质
CN114119334A (zh) 基于注意力机制的自动学习嵌入代价的图像隐写方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant