CN110796248A - 数据增强的方法、装置、设备及存储介质 - Google Patents
数据增强的方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110796248A CN110796248A CN201910798040.8A CN201910798040A CN110796248A CN 110796248 A CN110796248 A CN 110796248A CN 201910798040 A CN201910798040 A CN 201910798040A CN 110796248 A CN110796248 A CN 110796248A
- Authority
- CN
- China
- Prior art keywords
- target
- data enhancement
- target data
- training
- termination condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 97
- 238000003860 storage Methods 0.000 title claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 258
- 238000013528 artificial neural network Methods 0.000 claims abstract description 62
- 230000002708 enhancing effect Effects 0.000 claims abstract description 18
- 230000002787 reinforcement Effects 0.000 claims description 32
- 230000015654 memory Effects 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 55
- 230000000694 effects Effects 0.000 abstract description 10
- 230000009466 transformation Effects 0.000 description 36
- 230000006870 function Effects 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000013473 artificial intelligence Methods 0.000 description 10
- 230000002093 peripheral effect Effects 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 241000282414 Homo sapiens Species 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 238000004091 panning Methods 0.000 description 4
- 230000007306 turnover Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了数据增强的方法、装置、设备及存储介质。方法包括:获取目标数据增强操作;保持目标数据增强操作不变,获取目标参数;基于目标数据增强操作和目标参数,对初始训练样本进行数据增强,得到第一目标训练样本;基于第一目标训练样本对神经网络进行训练,直至满足第一终止条件;基于目标数据增强操作和满足第一终止条件时所采用的目标参数,对初始训练样本进行数据增强,得到第二目标训练样本;基于第二目标训练样本对神经网络进行训练,直至满足第二终止条件;基于满足第二终止条件时采用的目标数据增强操作和目标参数,对目标数据进行数据增强。基于上述过程,目标参数可以为任意数值,能够提高数据增强的效率,数据增强的效果较好。
Description
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种数据增强的方法、装置、设备及存储介质。
背景技术
近年来,神经网络在图像识别、物体检测、场景分割等任务上取得了显著的成效。为了提高神经网络的鲁棒性和泛化能力,往往需要利用大规模的数据对神经网络进行训练。在现实情况中,经常会存在训练数据不足的情况,此时,数据增强技术就显得尤为重要。利用数据增强技术对训练数据进行数据增强,能够增大训练数据的数量并且提高训练数据的多样性。
相关技术在数据增强的过程中,根据数据增强操作、数据增强操作的使用概率的离散值以及数据增强操作的强度的离散值,构建搜索空间,在搜索空间中搜索合适的数据增强操作以及该数据增强操作的使用概率和强度,然后对目标数据进行数据增强。
在实现本申请的过程中,发明人发现相关技术至少存在以下问题:
相关技术中,根据数据增强操作、数据增强操作的使用概率的离散值以及数据增强操作的强度的离散值构建的搜索空间庞大,在搜索空间中搜索合适的数据增强操作以及该数据增强操作的使用概率和强度的过程耗时较长,使得数据增强的效率较低。此外,数据增强操作的使用概率和强度均为离散值,可能导致对目标数据进行数据增强的效果较差。
发明内容
本申请实施例提供了一种数据增强的方法、装置、设备及存储介质,可用于解决相关技术中数据增强的效率较低以及数据增强的效果较差的问题。所述技术方案如下:
一方面,本申请实施例提供了一种数据增强的方法,所述方法包括:
获取目标数据增强操作;
保持所述目标数据增强操作不变,获取与所述目标数据增强操作对应的目标参数;基于所述目标数据增强操作和所述目标参数,对初始训练样本进行数据增强,得到第一目标训练样本;基于所述第一目标训练样本对神经网络进行训练,直至满足第一终止条件;
基于所述目标数据增强操作和满足第一终止条件时所采用的目标参数,对所述初始训练样本进行数据增强,得到第二目标训练样本;
基于所述第二目标训练样本对所述神经网络进行训练,直至满足第二终止条件;
基于满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数,对目标数据进行数据增强。
另一方面,提供了一种数据增强的装置,所述装置包括:
第一获取模块,用于获取目标数据增强操作;
第二获取模块,用于保持所述目标数据增强操作不变,获取与所述目标数据增强操作对应的目标参数;
数据增强模块,用于基于所述目标数据增强操作和所述目标参数,对初始训练样本进行数据增强,得到第一目标训练样本;
训练模块,用于基于所述第一目标训练样本对神经网络进行训练,直至满足第一终止条件;
所述数据增强模块,还用于基于所述目标数据增强操作和满足第一终止条件时所采用的目标参数,对所述初始训练样本进行数据增强,得到第二目标训练样本;
所述训练模块,还用于基于所述第二目标训练样本对所述神经网络进行训练,直至满足第二终止条件;
所述数据增强模块,还用于基于满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数,对目标数据进行数据增强。
在一种可能实现方式中,所述第二获取模块,包括:
构建单元,用于保持所述目标数据增强操作不变,构建与所述目标数据增强操作对应的贝叶斯模型;
获取单元,用于基于所述贝叶斯模型,获取与所述目标数据增强操作对应的目标参数。
在一种可能实现方式中,所述第一获取模块,包括:
构建单元,用于构建强化学习模块;
获取单元,用于基于所述强化学习模块,获取目标数据增强操作。
在一种可能实现方式中,所述满足第二终止条件时所采用的目标数据增强操作中包括多个子操作,所述满足第二终止条件时所采用的目标参数中包括与所述多个子操作对应的多个子参数;
所述装置还包括:
选择模块,用于对于所述目标数据中的任一数据,在所述满足第二终止条件时所采用的目标数据增强操作中选择任一子操作;
所述数据增强模块,还用于基于所述任一子操作和与所述任一子操作对应的子参数,对所述任一数据进行数据增强。
在一种可能实现方式中,所述满足第一终止条件,包括:
获取与所述目标数据增强操作对应的目标参数的次数超过第一次数阈值;或者,基于所述第一目标训练样本对神经网络进行训练的训练精度超过第一精度阈值;或者,基于所述第一目标训练样本对神经网络进行训练的训练时间超过第一时间阈值。
在一种可能实现方式中,所述满足第二终止条件,包括:
获取目标数据增强操作的次数超过第二次数阈值;或者,基于所述第二目标训练样本对所述神经网络进行训练的训练精度超过第二精度阈值;或者,基于所述第二目标训练样本对所述神经网络进行训练的训练时间超过第二时间阈值。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现上述任一所述的数据增强的方法。
另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述任一所述的数据增强的方法。
本申请实施例提供的技术方案至少带来如下有益效果:
先获取目标数据增强操作,在保持该目标数据增强操作不变的情况下,获取与该目标数据增强操作对应的满足第一终止条件时所采用的目标参数;接下来改变目标数据增强操作,直至满足第二终止条件;然后基于满足第二终止条件时所采用的目标数据增强操作和目标参数,对目标数据进行数据增强。在上述数据增强的过程,将获取目标数据增强操作的过程和获取与该目标数据增强操作对应的目标参数的过程分开进行,由于可供选择的数据增强操作的数量较少,所以在获取目标数据增强操作的过程中可以避免大量的搜索,减少获取目标数据增强操作的耗时,提高获取到满足条件的目标数据增强操作和与其对应的满足条件的目标参数的效率,进而提高数据增强的效率。此外,在获取满足第一终止条件时所采用的目标参数的过程中,目标参数可以为任意数值,有利于提高对目标数据进行数据增强的效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种数据增强的方法流程图;
图3是本申请实施例提供的一种获取满足第一终止条件时所采用的目标参数的过程示意图;
图4是本申请实施例提供的一种获取满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数的过程示意图;
图5是本申请实施例提供的一种数据增强的实际应用示意图;
图6是本申请实施例提供的一种数据增强的装置示意图;
图7是本申请实施例提供的一种第二获取模块的结构示意图;
图8是本申请实施例提供的一种第一获取模块的结构示意图;
图9是本申请实施例提供的一种数据增强的装置示意图;
图10是本申请实施例提供的一种终端的结构示意图;
图11是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习等几大方向。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习通常包括神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
近年来,机器学习中的神经网络在图像识别、物体检测、场景分割等任务上取得了显著的成效。为了提高神经网络的鲁棒性和泛化能力,往往需要利用大规模的数据对神经网络进行训练。在现实情况中,经常会存在训练数据不足的情况,此时,数据增强技术就显得尤为重要。利用数据增强技术中对训练数据进行数据增强,能够增大训练数据的数量并且提高训练数据的多样性。
对此,本申请实施例提供了一种数据增强的方法,请参考图1,其示出了本申请实施例提供的方法实施环境的示意图。该实施环境可以包括:终端11和服务器12。
其中,终端11可以获取待增强的目标数据,也可以获取合适的数据增强操作及每个操作对应的参数,然后终端11可以根据获取到的合适的数据增强操作及每个操作对应的参数对目标数据进行数据增强。终端11也可以将待增强的目标数据发送至服务器12上,服务器12可以获取合适的数据增强操作及每个操作对应的参数,然后服务器12可以根据获取到的合适的数据增强操作及每个操作对应的参数对由终端11发送的目标数据进行数据增强。
可选地,终端11可以是诸如手机、平板电脑、个人计算机等的智能设备。服务器12可以是一台服务器,也可以是由多台服务器组成的服务器集群,或者是一个云计算服务中心。终端11与服务器12通过有线或无线网络建立通信连接。
本领域技术人员应能理解上述终端11和服务器12仅为举例,其他现有的或今后可能出现的终端或服务器如可适用于本申请,也应包含在本申请保护范围以内,并在此以引用方式包含于此。
基于上述图1所示的实施环境,本申请实施例提供一种数据增强的方法,以该方法应用于终端为例。如图2所示,本申请实施例提供的方法可以包括如下步骤:
在步骤201中,获取目标数据增强操作。
数据增强操作是指能够对数据进行增强的操作。其中,对数据进行增强是指对数据进行处理以增加数据的多样性。例如,对图像数据而言,对图像数据进行增强可以是指通过改变图像的色彩、图像的尺寸等来增加图像的多样性。
目标数据增强操作是由终端在可供选择的多个数据增强操作中选取的部分数据增强操作所组成的。目标数据增强操作中可以包括一个或多个数据增强操作,在本申请实施例中,将目标数据增强操作中包括的每个数据增强操作均作为该目标数据增强操作中的一个子操作。也就是说,目标数据增强操作中包括一个或多个子操作。在一种可能实现方式中,可以预先设置目标数据增强操作中包括的子操作的参考数量,然后终端获取参考数量的子操作组成目标数据增强操作。其中,参考数量可以根据经验设置,也可以根据应用场景进行自由调整,例如,参考数量可以设置为10,也就是说,终端在可供选择的多个数据增强操作中选取10个数据增强操作作为子操作,这10个子操作组成目标数据增强操作。
需要说明的是,可供选择的数据增强操作可以根据待增强的数据类型进行自由调整,本申请实施例对此不加以限定。例如,对于图像数据而言,可供选择的数据增强操作可以为:旋转变换、翻转变换、缩放变换、平移变换、对比度变换、噪声扰动、颜色变化等。其中,旋转变换是指随机旋转图像一定角度,改变图像内容的朝向;翻转变换是指沿着水平或者垂直方向翻转图像;缩放变换是指按照一定的比例放大或者缩小图像;平移变换是指在图像平面上对图像以一定方式进行平移;对比度变换是指在图像的HSV(HueSaturationValue,色调饱和度亮度)颜色空间,保持色调H不变,对每个像素的饱和度S和亮度V分量进行指数运算,增加光照变化;噪声扰动是指对图像的每个像素进行随机扰动,常用的噪声是高斯噪声;颜色变化是指在图像的RGB(Red Green Blue,红绿蓝)通道上添加随机扰动。
在一种可能实现方式中,终端获取目标数据增强操作的方式为:构建强化学习模块;基于强化学习模块,获取目标数据增强操作。在构建的强化学习模块中,可以提供由可供选择的数据增强操作构成的搜索空间,则终端可以基于强化学习模块,在搜索空间中获取目标数据增强操作。
在基于强化学习模块获取目标数据增强操作的过程中,强化学习模块能够不断优化其自身参数,终端可以基于不断优化自身参数的强化学习模块,在搜索空间中获取不断优化的目标数据增强操作。在一种可能实现方式中,强化学习模块能够根据训练精度进行迭代学习,不断优化自身参数。强化学习模块不断优化自身参数的具体实现方式将在步骤204中进行详细叙述。
在步骤202中,保持目标数据增强操作不变,获取与目标数据增强操作对应的目标参数;基于目标数据增强操作和目标参数,对初始训练样本进行数据增强,得到第一目标训练样本;基于第一目标训练样本对神经网络进行训练,直至满足第一终止条件。
需要说明的是,此步骤是在保持目标数据增强操作不变的情况下,获取与该目标数据增强操作对应的满足第一终止条件时所采用的目标参数的过程。也就是在保持目标数据增强操作不变的情况下,不断优化与该目标数据增强操作对应的目标参数,直至获取到与该目标数据增强操作对应的最优的目标参数的过程。
在保持目标数据增强操作不变的情况下,该步骤202可以细分为以下三个步骤:
步骤一:获取与目标数据增强操作对应的目标参数。
与目标数据增强操作对应的目标参数可以是指该目标数据增强操作在进行数据增强时的参数。例如,目标参数可以是指该目标数据增强操作在进行数据增强时的使用概率和强度。其中,使用概率是指该目标数据增强操作在进行数据增强时被使用的可能概率;强度是指该目标数据增强操作在进行数据增强时增强的程度。
当目标数据增强操作中包括多个子操作时,终端获取与每个子操作对应的子参数,由此得到与目标数据增强操作对应的包括多个子参数的目标参数。也就是说,每个子操作均对应一个表示该子操作在进行数据增强时的参数的子参数。例如,子参数可以是指子操作在数据增强时的使用概率和强度。
举例而言,假设目标数据增强操作中包括两个子操作,分别为翻转变换和平移变换,则与该目标数据增强操作对应的目标参数可以为{(a1,b1)(a2,b2)}。其中,(a1,b1)表示翻转变换操作对应的子参数,a1表示翻转变换操作在进行数据增强时的使用概率,b1表示翻转变换操作在进行数据增强时的强度;(a2,b2)表示平移变换操作对应的子参数,a2表示平移变换操作在进行数据增强时的使用概率,b2表示平移变换操作在进行数据增强时的强度。
接下来进一步介绍任一子操作在进行数据增强时的使用概率和强度。使用概率是指该子操作在进行数据增强时被使用的可能概率,使用概率P的取值范围为0<P≤1。当P=1时,说明该子操作在进行数据增强时必然被使用;当P<1时,说明该子操作在进行数据增强时可能不被使用。强度是指该子操作在进行数据增强时增强的程度。需要说明的是,根据子操作的类型不同,强度的取值范围也不同。例如,对于缩放变换操作而言,强度可以是指缩小或者放大的倍数,取值范围可以为[-10,10],也就是缩放变换操作的强度取值范围为从缩小10倍到放大10倍;对于旋转变换操作而言,强度可以是指旋转的角度,取值范围可以为[0,360],也就是旋转变换操作的强度取值范围为从旋转0度到旋转360度。需要说明的是,虽然子操作在数据增强时可能不被使用,但如果该子操作被使用,则该子操作的强度就是固定的。
在一种可能实现方式中,终端保持目标数据增强操作不变,获取与目标数据增强操作对应的目标参数的方式为:终端保持目标数据增强操作不变,构建与目标数据增强操作对应的贝叶斯模型;基于贝叶斯模型,获取与目标数据增强操作对应的目标参数。
需要说明的是,当目标数据增强操作中包括多个子操作时,终端构建与各个子操作对应的多个贝叶斯模型。此种情况下,终端基于贝叶斯模型,获取与目标数据增强操作对应的目标参数的方式为:终端基于每个贝叶斯模型,获取与每个子操作对应的子参数;基于所有子参数得到与目标数据增强操作对应目标参数。
在终端基于每个贝叶斯模型获取与每个子操作对应的子参数的过程中,可以通过不断的迭代训练,获取到不断优化的子参数。
步骤二:基于目标数据增强操作和目标参数,对初始训练样本进行数据增强,得到第一目标训练样本。
训练样本是指能够用于训练的样本。初始训练样本是指未进行数据增强的训练样本,目标训练样本是指对初始训练样本进行数据增强后得到的训练样本。在本申请实施例中,将此步骤中得到的目标训练样本作为第一目标训练样本。
需要说明的是,初始训练样本可以是指所有的训练样本,也可以是指所有的训练样本中的部分训练样本,本申请实施例对此不加以限定。当初始训练样本为所有的训练样本中的部分训练样本时,可以减少单次训练神经网络的时间,提高训练神经网络的效率。
在一种可能实现方式中,终端基于目标数据增强操作和目标参数,对初始训练样本进行数据增强的过程可能有以下两种情况:
情况一:目标数据增强操作中仅包括一个子操作,目标参数中仅包括一个与该子操作对应的子参数。此时,基于该子操作和该子参数对初始训练样本中的每个训练样本进行数据增强。
在该种情况下,虽然初始训练样本中的所有训练样本都用相同的子操作和子参数进行数据增强,但当该子参数中的使用概率不为1时,对于初始训练样本中的任一训练样本,可能会使用该子操作进行数据增强,也可能不会使用该子操作进行数据增强。也就是说,即使目标数据增强操作中仅包括一个子操作,仍然可以在一定程度上保证第一目标训练样本的随机性和多样性。
情况二:目标数据增强操作中包括多个子操作,目标参数中包括与该多个子操作对应的多个子参数。此时,对于初始训练样本中的任一训练样本,在目标数据增强操作中选择任一子操作,基于该子操作和与该子操作对应的子参数,对该训练样本进行数据增强,直至完成对初始训练样本中的所有训练样本的数据增强过程。
在该种情况下,对于初始训练样本中的不同的训练样本,可以选择相同的子操作和与其对应的子参数对其进行数据增强,也可以选择不同的子操作和与其对应的子参数对其进行数据增强。这种随机选择子操作的方式,可以进一步提高第一目标训练样本的随机性和多样性。
举例而言,假设目标数据增强操作中包括两个子操作,分别为翻转变换操作和平移变换操作,目标参数为{(a1,b1)(a2,b2)}。其中,(a1,b1)表示翻转变换操作对应的子参数,a1表示翻转变换操作在进行数据增强时的使用概率,b1表示翻转变换操作在进行数据增强时的强度;(a2,b2)表示平移变换操作对应的子参数,a2表示平移变换操作在进行数据增强时的使用概率,b2表示平移变换操作在进行数据增强时的强度。在对初始训练样本中的任一训练样本进行数据增强的过程中,随机选择翻转变换操作或者平移变换操作。当选择翻转变换操作时,以a1的使用概率对该训练样本进行翻转变换操作,当使用该翻转变换操作时,翻转变换操作的强度为b1;当选择平移变换操作时,以a2的使用概率对该训练样本进行平移变换操作,当使用该平移变换操作时,平移变换操作的强度为b2。
在一种可能实现方式中,可以预先设置子操作与子参数的映射关系,并将该映射关系存储于目标参数中,以能够在目标参数中准确确定与任一子操作对应的子参数。
在对初始训练样本进行数据增强后,终端即可得到第一目标训练样本,然后基于第一目标训练样本执行步骤三。需要说明的是,由于第一目标训练样本是通过对初始训练样本进行数据增强而得到的,所以可以将初始训练样本的标签作为第一目标训练样本的标签。
步骤三:基于第一目标训练样本对神经网络进行训练。
神经网络可以根据初始训练样本的类型进行选取。例如,当初始训练样本为图像时,可以选取能够用于分类的神经网络。需要说明的是,神经网络可以是结构简单的网络,以减少训练耗时。
终端基于第一目标训练样本对神经网络进行训练,可以得到第一训练结果,将该第一训练结果与第一目标训练样本的标签进行比对,可以得到第一训练精度。由于第一目标训练样本是基于目标数据增强操作和目标参数,对初始训练样本进行数据增强得到的,所以根据第一训练精度即可判断数据增强效果的优劣,也就是能够判断目标数据增强操作和目标参数的优劣。由于本步骤是在保持目标数据增强操作不变的情况下进行的,所以可以根据第一训练精度判断目标参数的优劣。当第一训练精度较低时,说明目标参数需要进一步优化,直至满足第一终止条件。
当不满足第一终止条件时,终端循环执行上述步骤一至步骤三,以根据第一训练精度,在保持目标数据增强操作不变的情况下不断优化与该目标数据增强操作对应的目标参数。当满足第一终止条件时,终端执行步骤203。
终端循环执行上述步骤一至步骤三的过程可以为:终端先执行一次步骤一至步骤三,得到一个训练神经网络的第一训练精度。然后根据该第一训练精度,获取与目标数据增强操作对应的优化后的目标参数;基于目标数据增强操作和优化后的目标参数,对初始训练样本进行数据增强,得到优化后的第一目标训练样本;基于优化后的第一目标训练样本对神经网络进行训练,得到优化后的第一训练精度。
需要说明的是,在每次执行步骤一至步骤三的过程中,都对同样的初始训练样本进行数据增强,以控制变量。在执行步骤一至步骤三的过程中,由于目标数据增强操作和初始训练样本均保持不变,所以在每次执行步骤一至步骤三得到不同的第一训练精度的过程中,唯一的变量就是目标参数。此种方式能够通过不断优化该目标参数,得到与该保持不变的目标数据增强操作对应的最优的目标参数。通过控制变量的方法,能够提高获取与目标数据增强操作对应的最优的目标参数的效率。
在一种可能实现方式中,终端根据第一训练精度,获取与目标数据增强操作对应的优化后的目标参数的过程可以为:终端根据第一训练精度,基于贝叶斯模型,获取与目标数据增强操作对应的优化后的目标参数。当目标数据增强操作中包括多个子操作时,每个子操作均对应一个贝叶斯模型。则基于贝叶斯模型,获取与目标数据增强操作对应的优化后的目标参数的过程为:终端基于每个贝叶斯模型,获取与目标数据增强操作中的每个子操作对应的优化后的子参数,基于所有优化后的子参数得到与目标数据增强操作对应的优化后的目标参数。
需要说明的是,对于目标数据增强操作中包括多个子操作,也就是目标参数中包括多个子参数的情况,终端每执行一次步骤一至步骤三,即可基于多个贝叶斯模型得到多个优化后的子参数,基于这多个优化后的子参数即可得到优化后的目标参数。需要进一步说明的是,在优化过程中,目标参数中的子参数可以是为任意连续数值,也就是说子参数不局限于特定的离散数值,从而可以使优化后的目标参数效果更佳,有利于进一步提升数据增强的效果。
接下来以具体的算法流程介绍终端基于一个贝叶斯模型,获取与目标数据增强操作中的一个子操作对应的优化后的子参数的过程:
输入:f,X,S,M
D←初始采样(f,X)
for i←|D|to T do
p(y|x,D)←创建模型(M,D)
xi←argmaxx∈XS(x,p(y|x,D))
yi←f(xi)
D←D∪(xi,yi)
end for
在输入的数据中,f表示神经网络;X表示与目标数据增强操作对应的目标参数,在该目标参数中包括一个或多个子参数x;S表示采集函数,用于获取最优的子参数;M表示基于输入数据假设的函数模型。
D表示数据集,该数据集中包括根据神经网络f和目标参数X得到的采样数据;y表示基于第一目标训练样本对神经网络进行训练的第一训练精度。在每次训练神经网络的过程中,均会得到一个与目标参数X对应的第一训练精度y。需要说明的是,对于同一目标参数中包括的不同子参数,均对应相同的训练精度y。
终端首先初始化采样数据,也就是根据神经网络f和已知的目标参数X,得到已知的(x,y)数据,其中,x是指目标参数中包括的任一子参数,y是指根据已知的目标参数X所得到的第一训练精度。
当获取子参数x的次数i(i为不小于1的整数)不超过T(T为不小于1的整数)时,终端循环执行下述过程:利用函数模型M对数据集D中的数据进行函数拟合,得到拟合函数p(y|x,D);然后利用采集函数S,获取使拟合函数达到最大值的子参数xi;接下来,获取与该子参数xi对应的第一训练精度yi;随后,将(xi,yi)添加到数据集D中,以更新数据集D,也就是将D和(xi,yi)的并集作为新的数据集D。
其中,终端获取与该子参数xi对应的第一训练精度yi的过程为:利用目标数据增强操作和该子参数xi对应的目标参数对初始训练样本进行数据增强,得到第一目标训练样本,基于第一目标训练样本对神经网络进行训练,得到第一训练精度yi。
循环上述过程,直至i=T,也就是直至循环获取子参数T次,将此时得到的子参数xi作为与目标数据增强操作中包括的子操作对应的最优子参数。
需要说明的是,采集函数S可以为任意能够获取当前条件下最优的子参数的函数,采集函数S的具体形式可以参考相关技术,此处不再赘述。函数模型M可以为任意能够对数据集D中的数据进行函数拟合的模型,本申请实施例对此不加以限定,例如,函数模型M可以是KDE(Kernel Density Estimation,核密度估计)模型或者高斯过程模型等。
根据上述过程,终端可以不断优化与目标数据增强操作对应的目标参数,直至满足第一终止条件,得到满足第一终止条件时所采用的目标参数。该满足第一终止条件时所采用的目标参数即可作为与当前目标数据增强操作对应的最优的目标参数。例如,获取满足第一终止条件时所采用的目标参数的过程可以如图3所示,在此过程中,目标数据增强操作保持不变,根据第一训练精度不断优化与该目标数据增强操作对应的目标参数。
在一种可能实现方式中,满足第一终止条件可以有以下三种情况:
情况一:获取与目标数据增强操作对应的目标参数的次数超过第一次数阈值。
具体而言,终端记录获取与目标数据增强操作对应的目标参数的次数,每执行一次步骤一至步骤三,该次数增加1,当该次数超过第一次数阈值时,认为满足第一终止条件,接下来终端执行步骤203。其中,第一次数阈值可以根据经验设置,也可以根据应用场景自由调整。本申请实施例对此不加以限定。例如,第一次数阈值可以设置为20次。当终端获取目标参数的次数超过20次时,认为满足第一终止条件,得到满足第一终止条件时的训练过程中所采用的目标参数。
情况二:基于第一目标训练样本对神经网络进行训练的训练精度超过第一精度阈值。
将基于第一目标训练样本对神经网络进行训练的训练精度作为第一训练精度。每执行一次步骤一至步骤三,得到一个第一训练精度,当该第一训练精度超过第一精度阈值时,认为满足第一终止条件,接下来终端执行步骤203。其中,第一精度阈值可以根据经验设置,也可以根据应用场景自由调整。本申请实施例对此不加以限定。例如,第一精度阈值可以设置为90%。当训练精度超过90%时,认为满足第一终止条件,得到满足第一终止条件时的训练过程中所采用的目标参数。
情况三:基于第一目标训练样本对神经网络进行训练的训练时间超过第一时间阈值。
具体而言,终端每执行一次步骤一至步骤三,记录从第一次执行步骤一至步骤三的开始时间到当前次执行步骤一至步骤三的结束时间所耗用的总的训练时间,当该训练时间超过第一时间阈值时,认为满足第一终止条件,接下来终端执行步骤203。其中,第一时间阈值可以根据经验设置,也可以根据应用场景自由调整。本申请实施例对此不加以限定。例如,第一时间阈值设置可以为120分钟。当训练时间超过120分钟时,认为满足第一终止条件,得到满足第一终止条件时的训练过程中所采用的目标参数。
无论先发生以上三种情况中的哪种情况,均认为满足第一终止条件,得到满足第一终止条件时所采用的目标参数,进而执行步骤203。
在步骤203中,基于目标数据增强操作和满足第一终止条件时所采用的目标参数,对初始训练样本进行数据增强,得到第二目标训练样本。
此步骤的具体实现方式可以参见步骤202中的步骤二。与步骤202中的步骤二相比,在对初始训练样本进行数据增强的过程中,目标数据增强操作相同,目标参数不同。步骤202中的步骤二中的目标参数为不满足第一终止条件的所采用的目标参数,此步骤中的目标参数为满足第一终止条件时所采用的目标参数。
需要说明的是,为了与步骤202中的步骤二中得到的目标训练样本相区分,将此步骤中得到的目标训练样本作为第二目标训练样本。将初始训练样本的标签作为第二目标训练样本的标签。
在步骤204中,基于第二目标训练样本对神经网络进行训练,直至满足第二终止条件。
终端基于第二目标训练样本对神经网络进行训练,可以得到第二训练结果,将该第二训练结果与第二目标训练样本的标签进行比对,可以得到第二训练精度。由于第二目标训练样本是基于目标数据增强操作和满足第一终止条件时所采用的目标参数,对初始训练样本进行数据增强得到的,所以根据第二训练精度即可判断数据增强效果的优劣,也就是能够判断目标数据增强操作和满足第一终止条件时所采用的目标参数的优劣。由于本步骤中的目标参数是与目标数据增强操作对应的最优的目标参数,所以可以根据第二训练精度判断目标数据增强操作的优劣。当第二训练精度较低时,说明目标数据增强操作需要进一步优化,直至满足第二终止条件。
具体而言,当不满足第二终止条件时,终端循环执行步骤201至204,以根据第二训练精度,不断优化目标数据增强操作,在每次获取优化后的目标数据增强操作后,均获取与其对应的最优的目标参数。当满足第二终止条件时,终端执行步骤205。
终端循环执行步骤201至204的过程可以为:终端先执行一次步骤201至204,得到一个训练神经网络的第二训练精度。然后根据该第二训练精度,获取优化后的目标数据增强操作;保持该优化后的数据增强操作不变,获取与该优化后的数据增强操作对应的目标参数;基于优化后的目标数据增强操作和与该优化后的数据增强操作对应的目标参数,对初始训练样本进行数据增强,得到优化后的第一目标训练样本;基于优化后的第一目标训练样本对神经网络进行训练,直至满足第一终止条件;基于优化后的目标数据增强操作和满足第一终止条件时所采用的目标参数,对初始训练样本进行数据增强,得到优化后的第二目标训练样本;基于优化后的第二目标训练样本对神经网络进行训练,得到优化后的第二训练精度。
在一种可能实现方式中,终端根据第二训练精度,获取优化后的目标数据增强操作的过程可以为:根据第二训练精度,基于强化学习模块,在搜索空间中获取优化后的目标数据增强操作。具体而言,终端根据第二训练精度,优化强化学习模块的自身参数,基于优化自身参数后的强化学习模块,在搜索空间中获取优化后的目标数据增强操作。
需要说明的是,在强化学习的过程中,可以将从环境中得到的观察值(Observation)设定为1,因为本申请实施例的目的是针对于固定的初始训练样本,预测出最优的目标数据增强策略,而不需要基于环境中的任何反馈做出相应的改变,所以在更新强化学习模块的自身参数的过程中,观察值始终为1,无需进行改变。
本申请实施例对优化强化学习模块的自身参数的具体算法不加以限定,例如,ARS(Augmented Random Search,增强型随机搜索)算法、遗传算法、近邻策略优化算法等。接下来,以ARS算法为例,介绍强化学习模块的自身参数由Mj优化至Mj+1的过程:
假设强化学习模块的当前自身参数为Mj,当不满足第二终止条件时,终端在搜索空间中随机选取N个方向的随机变量,分别为δ1,δ2,...δN,这N个方向的随机变量满足标准正态分布。根据强化学习模块的当前自身参数Mj和随机选取的N个方向的随机变量,可以构建出2N个强化学习模块的自身参数,然后根据这2N个强化学习模块的自身参数,即可预测出2N个目标数据增强操作。
在ARS算法中,这2N个目标数据增强操作的表示为:
πj,k,+(x)=(Mj+υδk)x
πj,k,-(x)=(Mj-υδk)x
其中k∈{1,2,...N}。
根据这2N个目标数据增强操作,可以得到与其对应的最优的2N个目标参数。根据这2N个目标数据增强操作和与其对应的目标参数,即可得到2N个第二训练精度。这2N个第二训练精度可以表示为:
r(πj,k,+(x))和r(πj,k,-(x))
其中k∈{1,2,...N}。
然后根据这2N个第二训练精度对搜索空间的方向δk进行排序。
排序原则为:对于任一方向δk,将max{r(πj,k,+(x)),r(πj,k,-(x))}作为该方向用于排序的第二训练精度。然后根据每个方向用于排序的第二训练精度对各个方向按照用于排序的第二训练精度由大到小进行排序。
保留排序名次在前的b(b<N)个方向,根据如下公式得到强化学习模块的优化后的自身参数Mj+1:
其中,σR是保留的b个方向的对应的2b个第二训练精度的标准差;α表示步长,ν表示探索噪声的标准差。
在每次得到优化后的强化学习模块的自身参数后,终端即可根据优化后的自身参数获取优化后的目标数据增强操作。然后根据该优化后的目标数据增强操作获取与其对应的最优目标参数。
根据上述过程,可以不断优化目标数据增强操作,直至满足第二终止条件,得到满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数。例如,获取满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数优化目标数据增强操作的过程可以如图4所示,在此过程中,根据第二训练精度不断优化目标数据增强操作,在每次得到优化后的目标数据增强操作后,均根据第一训练精度不断优化与该优化后的目标数据增强操作对应的目标参数。
在一种可能实现方式中,满足第二终止条件包括以下三种情况:
情况一:获取目标数据增强操作的次数超过第二次数阈值。
情况二:基于第二目标训练样本对神经网络进行训练的训练精度超过第二精度阈值。
情况三:基于第二目标训练样本对神经网络进行训练的训练时间超过第二时间阈值。
对上述满足第二终止条件的三种情况的详细介绍可以参见步骤202中对满足第一终止条件的三种情况的介绍,此处不再赘述。无论先发生以上三种情况中的哪种情况,均认为满足第二终止条件,进而执行步骤205。
在步骤205中,基于满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数,对目标数据进行数据增强。
其中,目标数据可以是指任何待增强的数据。
由于第二终止条件是获取目标数据增强操作和与其对应的目标参数的整个过程的终止条件,所以可以将满足第二终止条件时所采用的目标数据增强操作作为最优的目标数据增强操作,将满足第二终止条件时所采用的目标参数作为与该最优的目标数据增强操作对应的最优的目标参数。终端利用该最优的目标数据增强操作和与其对应的最优的目标参数对目标数据进行数据增强,可以有效增加目标数据的数量并且提高目标数据的多样性。
在一种可能实现方式中,终端基于满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数,对目标数据进行数据增强的过程可能有以下两种情况:
情况一:满足第二终止条件时所采用的目标数据增强操作中仅包括一个子操作,满足第二终止条件时所采用的目标参数中仅包括一个与该子操作对应的子参数。此时,基于该子操作和该子参数对对初始训练样本中的每个训练样本进行数据增强。
情况二:满足第二终止条件时所采用的目标数据增强操作中包括多个子操作,满足第二终止条件时所采用的目标参数中包括与多个子操作对应的多个子参数。此时,对于目标数据中的任一数据,在满足第二终止条件时所采用的目标数据增强操作中选择任一子操作;基于任一子操作和与任一子操作对应的子参数,对任一数据进行数据增强,直至完成对所有目标数据的数据增强过程。
在具体的实际应用中,参见图5,本申请实施例提供的方法可以在终端的目标平台上为用户提供数据增强服务,用户将携带有目标神经网络的参数设置的代码提交至终端的目标平台上,目标平台将数据增强方法搜索框架运行在CPU(Central Processing Unit,中央处理器)上,并不断为运行在CPU(Central Processing Unit,中央处理器)或者GPU(Graphics Processing Unit,图形处理器)上的目标神经网络提供目标数据增强操作和与其对应的目标参数;目标神经网络向搜索框架传输训练精度,搜索框架根据返回的训练精度进行优化,接着向目标神经网络提供更优的目标数据增强操作和与其对应的目标参数。训练结束后,目标平台输出最优的目标数据增强操作和与其对应的目标参数,进而利用该最优的目标数据增强操作和与其对应的目标参数为用户提供数据增强服务。目标平台可是指腾讯云平台。在实际应用中发现,本申请实施例中得到的最优的目标数据增强操作和目标参数可以有效地迁移至其他待增强的数据集以及其他神经网络中。
在本申请实施例中,终端先获取目标数据增强操作,在保持该目标数据增强操作不变的情况下,获取与该目标数据增强操作对应的满足第一终止条件时所采用的目标参数;接下来改变目标数据增强操作,直至满足第二终止条件;然后基于满足第二终止条件时所采用的目标数据增强操作和目标参数,对目标数据进行数据增强。在上述数据增强的过程,将获取目标数据增强操作的过程和获取与该目标数据增强操作对应的目标参数的过程分开进行,由于可供选择的数据增强操作的数量较少,所以在获取目标数据增强操作的过程中可以避免大量的搜索,减少获取目标数据增强操作的耗时,提高获取到满足条件的目标数据增强操作和与其对应的满足条件的目标参数的效率,进而提高数据增强的效率。此外,在获取满足第一终止条件时所采用的目标参数的过程中,目标参数可以为任意数值,有利于提高对目标数据进行数据增强的效果。
基于相同技术构思,参见图6,本申请实施例提供了一种数据增强的装置,该装置包括:
第一获取模块601,用于获取目标数据增强操作;
第二获取模块602,用于保持目标数据增强操作不变,获取与目标数据增强操作对应的目标参数;
数据增强模块603,用于基于目标数据增强操作和目标参数,对初始训练样本进行数据增强,得到第一目标训练样本;
训练模块604,用于基于第一目标训练样本对神经网络进行训练,直至满足第一终止条件;
数据增强模块603,还用于基于目标数据增强操作和满足第一终止条件时所采用的目标参数,对初始训练样本进行数据增强,得到第二目标训练样本;
训练模块604,还用于基于第二目标训练样本对神经网络进行训练,直至满足第二终止条件;
数据增强模块603,还用于基于满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数,对目标数据进行数据增强。
在一种可能实现方式中,参见图7,第二获取模块602,包括:
构建单元6021,用于保持目标数据增强操作不变,构建与目标数据增强操作对应的贝叶斯模型;
获取单元6022,用于基于贝叶斯模型,获取与目标数据增强操作对应的目标参数。
在一种可能实现方式中,参见图8,第一获取模块601,包括:
构建单元6011,用于构建强化学习模块;
获取单元6012,用于基于强化学习模块,获取目标数据增强操作。
在一种可能实现方式中,满足第二终止条件时所采用的目标数据增强操作中包括多个子操作,满足第二终止条件时所采用的目标参数中包括与多个子操作对应的多个子参数;
参见图9,该装置还包括:
选择模块605,用于对于目标数据中的任一数据,在满足第二终止条件时所采用的目标数据增强操作中选择任一子操作;
数据增强模块603,还用于基于任一子操作和与任一子操作对应的子参数,对任一数据进行数据增强。
在一种可能实现方式中,满足第一终止条件,包括:
获取与目标数据增强操作对应的目标参数的次数超过第一次数阈值;或者,基于第一目标训练样本对神经网络进行训练的训练精度超过第一精度阈值;或者,基于第一目标训练样本对神经网络进行训练的训练时间超过第一时间阈值。
在一种可能实现方式中,满足第二终止条件,包括:
获取目标数据增强操作的次数超过第二次数阈值;或者,基于第二目标训练样本对神经网络进行训练的训练精度超过第二精度阈值;或者,基于第二目标训练样本对神经网络进行训练的训练时间超过第二时间阈值。
在本申请实施例中,先获取目标数据增强操作,在保持该目标数据增强操作不变的情况下,获取与该目标数据增强操作对应的满足第一终止条件时所采用的目标参数;接下来改变目标数据增强操作,直至满足第二终止条件;然后基于满足第二终止条件时所采用的目标数据增强操作和目标参数,对目标数据进行数据增强。在上述数据增强的过程,将获取目标数据增强操作的过程和获取与该目标数据增强操作对应的目标参数的过程分开进行,由于可供选择的数据增强操作的数量较少,所以在获取目标数据增强操作的过程中可以避免大量的搜索,减少获取目标数据增强操作的耗时,提高获取到满足条件的目标数据增强操作和与其对应的满足条件的目标参数的效率,进而提高数据增强的效率。此外,在获取满足第一终止条件时所采用的目标参数的过程中,目标参数可以为任意数值,有利于提高对目标数据进行数据增强的效果。
需要说明的是,上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图10是本申请实施例提供的一种终端的设备结构示意图。该终端可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端包括有:处理器1001和存储器1002。
处理器1001可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1001可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1001可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1001还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1002可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1002中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1001所执行以实现本申请中方法实施例提供的数据增强的方法。
在一些实施例中,终端还可选包括有:外围设备接口1003和至少一个外围设备。处理器1001、存储器1002和外围设备接口1003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1003相连。具体地,外围设备包括:射频电路1004、触摸显示屏1005、摄像头组件1006、音频电路1007、定位组件1008和电源1009中的至少一种。
外围设备接口1003可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1001和存储器1002。在一些实施例中,处理器1001、存储器1002和外围设备接口1003被集成在同一芯片或电路板上;在一些其他实施例中,处理器1001、存储器1002和外围设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1004用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1004包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1004还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1005用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时,显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时,显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1005可以为一个,设置在终端的前面板;在另一些实施例中,显示屏1005可以为至少两个,分别设置在终端的不同表面或呈折叠设计;在再一些实施例中,显示屏1005可以是柔性显示屏,设置在终端的弯曲表面上或折叠面上。甚至,显示屏1005还可以设置成非矩形的不规则图形,也即异形屏。显示屏1005可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1006用于采集图像或视频。可选地,摄像头组件1006包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1001进行处理,或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1007还可以包括耳机插孔。
定位组件1008用于定位终端的当前地理位置,以实现导航或LBS(Location BasedService,基于位置的服务)。定位组件1008可以是基于美国的GPS(Global PositioningSystem,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源1009用于为终端中的各个组件进行供电。电源1009可以是交流电、直流电、一次性电池或可充电电池。当电源1009包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于:加速度传感器1011、陀螺仪传感器1012、压力传感器1013、指纹传感器1014、光学传感器1015以及接近传感器1016。
加速度传感器1011可以检测以终端建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1011可以用于检测重力加速度在三个坐标轴上的分量。处理器1001可以根据加速度传感器1011采集的重力加速度信号,控制触摸显示屏1005以横向视图或纵向视图进行用户界面的显示。加速度传感器1011还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1012可以检测终端的机体方向及转动角度,陀螺仪传感器1012可以与加速度传感器1011协同采集用户对终端的3D动作。处理器1001根据陀螺仪传感器1012采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1013可以设置在终端的侧边框和/或触摸显示屏1005的下层。当压力传感器1013设置在终端的侧边框时,可以检测用户对终端的握持信号,由处理器1001根据压力传感器1013采集的握持信号进行左右手识别或快捷操作。当压力传感器1013设置在触摸显示屏1005的下层时,由处理器1001根据用户对触摸显示屏1005的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1014用于采集用户的指纹,由处理器1001根据指纹传感器1014采集到的指纹识别用户的身份,或者,由指纹传感器1014根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1001授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1014可以被设置在终端的正面、背面或侧面。当终端上设置有物理按键或厂商Logo时,指纹传感器1014可以与物理按键或厂商Logo集成在一起。
光学传感器1015用于采集环境光强度。在一个实施例中,处理器1001可以根据光学传感器1015采集的环境光强度,控制触摸显示屏1005的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏1005的显示亮度;当环境光强度较低时,调低触摸显示屏1005的显示亮度。在另一个实施例中,处理器1001还可以根据光学传感器1015采集的环境光强度,动态调整摄像头组件1006的拍摄参数。
接近传感器1016,也称距离传感器,通常设置在终端的前面板。接近传感器1016用于采集用户与终端的正面之间的距离。在一个实施例中,当接近传感器1016检测到用户与终端的正面之间的距离逐渐变小时,由处理器1001控制触摸显示屏1005从亮屏状态切换为息屏状态;当接近传感器1016检测到用户与终端的正面之间的距离逐渐变大时,由处理器1001控制触摸显示屏1005从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图10中示出的结构并不构成对终端的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图11是本发明实施例提供的一种服务器的结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(central processing units,CPU)1101和一个或多个存储器1102,其中,该一个或多个存储器1102中存储有至少一条程序代码,该至少一条程序代码由该一个或多个处理器1101加载并执行,以实现上述各个方法实施例提供的数据增强的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由计算机设备的处理器加载并执行,以实现上述任一种数据增强的方法。
可选地,上述计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种数据增强的方法,其特征在于,所述方法包括:
获取目标数据增强操作;
保持所述目标数据增强操作不变,获取与所述目标数据增强操作对应的目标参数;基于所述目标数据增强操作和所述目标参数,对初始训练样本进行数据增强,得到第一目标训练样本;基于所述第一目标训练样本对神经网络进行训练,直至满足第一终止条件;
基于所述目标数据增强操作和满足第一终止条件时所采用的目标参数,对所述初始训练样本进行数据增强,得到第二目标训练样本;
基于所述第二目标训练样本对所述神经网络进行训练,直至满足第二终止条件;
基于满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数,对目标数据进行数据增强。
2.根据权利要求1所述的方法,其特征在于,所述保持所述目标数据增强操作不变,获取与所述目标数据增强操作对应的目标参数,包括:
保持所述目标数据增强操作不变,构建与所述目标数据增强操作对应的贝叶斯模型;
基于所述贝叶斯模型,获取与所述目标数据增强操作对应的目标参数。
3.根据权利要求1所述的方法,其特征在于,所述获取目标数据增强操作,包括:
构建强化学习模块;
基于所述强化学习模块,获取目标数据增强操作。
4.根据权利要求1所述的方法,其特征在于,所述满足第二终止条件时所采用的目标数据增强操作中包括多个子操作,所述满足第二终止条件时所采用的目标参数中包括与所述多个子操作对应的多个子参数;
所述基于满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数,对目标数据进行数据增强,包括:
对于所述目标数据中的任一数据,在所述满足第二终止条件时所采用的目标数据增强操作中选择任一子操作;基于所述任一子操作和与所述任一子操作对应的子参数,对所述任一数据进行数据增强。
5.根据权利要求1所述的方法,其特征在于,所述满足第一终止条件,包括:
获取与所述目标数据增强操作对应的目标参数的次数超过第一次数阈值;或者,
基于所述第一目标训练样本对神经网络进行训练的训练精度超过第一精度阈值;或者,
基于所述第一目标训练样本对神经网络进行训练的训练时间超过第一时间阈值。
6.根据权利要求1所述的方法,其特征在于,所述满足第二终止条件,包括:
获取目标数据增强操作的次数超过第二次数阈值;或者,
基于所述第二目标训练样本对所述神经网络进行训练的训练精度超过第二精度阈值;或者,
基于所述第二目标训练样本对所述神经网络进行训练的训练时间超过第二时间阈值。
7.一种数据增强的装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标数据增强操作;
第二获取模块,用于保持所述目标数据增强操作不变,获取与所述目标数据增强操作对应的目标参数;
数据增强模块,用于基于所述目标数据增强操作和所述目标参数,对初始训练样本进行数据增强,得到第一目标训练样本;
训练模块,用于基于所述第一目标训练样本对神经网络进行训练,直至满足第一终止条件;
所述数据增强模块,还用于基于所述目标数据增强操作和满足第一终止条件时所采用的目标参数,对所述初始训练样本进行数据增强,得到第二目标训练样本;
所述训练模块,还用于基于所述第二目标训练样本对所述神经网络进行训练,直至满足第二终止条件;
所述数据增强模块,还用于基于满足第二终止条件时所采用的目标数据增强操作和满足第二终止条件时所采用的目标参数,对目标数据进行数据增强。
8.根据权利要求7所述的装置,其特征在于,所述第二获取模块,包括:
构建单元,用于保持所述目标数据增强操作不变,构建与所述目标数据增强操作对应的贝叶斯模型;
获取单元,用于基于所述贝叶斯模型,获取与所述目标数据增强操作对应的目标参数。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1至6任一所述的数据增强的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1至6任一所述的数据增强的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910798040.8A CN110796248A (zh) | 2019-08-27 | 2019-08-27 | 数据增强的方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910798040.8A CN110796248A (zh) | 2019-08-27 | 2019-08-27 | 数据增强的方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110796248A true CN110796248A (zh) | 2020-02-14 |
Family
ID=69427064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910798040.8A Pending CN110796248A (zh) | 2019-08-27 | 2019-08-27 | 数据增强的方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110796248A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111582375A (zh) * | 2020-05-09 | 2020-08-25 | 北京百度网讯科技有限公司 | 数据增强策略搜索方法、装置、设备以及存储介质 |
CN111899186A (zh) * | 2020-06-29 | 2020-11-06 | 深圳中兴网信科技有限公司 | 图像数据增强方法、系统、存储介质和堆场覆盖检测方法 |
CN111970584A (zh) * | 2020-07-08 | 2020-11-20 | 国网宁夏电力有限公司电力科学研究院 | 一种用于处理数据的方法、装置、设备以及存储介质 |
CN112200226A (zh) * | 2020-09-27 | 2021-01-08 | 北京达佳互联信息技术有限公司 | 基于强化学习的图像处理方法、图像处理方法及相关装置 |
CN112580689A (zh) * | 2020-11-23 | 2021-03-30 | 北京迈格威科技有限公司 | 神经网络模型的训练方法、应用方法、装置和电子设备 |
WO2021139233A1 (zh) * | 2020-07-16 | 2021-07-15 | 平安科技(深圳)有限公司 | 数据扩充混合策略生成方法、装置和计算机设备 |
CN113379045A (zh) * | 2020-02-25 | 2021-09-10 | 华为技术有限公司 | 数据增强方法和装置 |
CN114462628A (zh) * | 2020-11-09 | 2022-05-10 | 华为技术有限公司 | 数据增强方法、装置、计算设备以及计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108898218A (zh) * | 2018-05-24 | 2018-11-27 | 阿里巴巴集团控股有限公司 | 一种神经网络模型的训练方法、装置、及计算机设备 |
WO2019080900A1 (zh) * | 2017-10-27 | 2019-05-02 | 腾讯科技(深圳)有限公司 | 神经网络训练方法和装置、存储介质及电子装置 |
-
2019
- 2019-08-27 CN CN201910798040.8A patent/CN110796248A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019080900A1 (zh) * | 2017-10-27 | 2019-05-02 | 腾讯科技(深圳)有限公司 | 神经网络训练方法和装置、存储介质及电子装置 |
CN108898218A (zh) * | 2018-05-24 | 2018-11-27 | 阿里巴巴集团控股有限公司 | 一种神经网络模型的训练方法、装置、及计算机设备 |
Non-Patent Citations (2)
Title |
---|
CHUNXU ZHANG, ET AL: "《Learning Optimal Data Augmentation Policies via Bayesian Optimization for Image Classification Tasks》", 《HTTPS://DOI.ORG/10.48550/ARXIV.1905.02610》, pages 61 - 23 * |
陈文兵;管正雄;陈允杰;: "基于条件生成式对抗网络的数据增强方法", 计算机应用, no. 11, pages 3305 - 3311 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379045A (zh) * | 2020-02-25 | 2021-09-10 | 华为技术有限公司 | 数据增强方法和装置 |
CN113379045B (zh) * | 2020-02-25 | 2022-08-09 | 华为技术有限公司 | 数据增强方法和装置 |
CN111582375A (zh) * | 2020-05-09 | 2020-08-25 | 北京百度网讯科技有限公司 | 数据增强策略搜索方法、装置、设备以及存储介质 |
CN111582375B (zh) * | 2020-05-09 | 2024-07-12 | 广州易通达供应链管理有限公司 | 数据增强策略搜索方法、装置、设备以及存储介质 |
CN111899186A (zh) * | 2020-06-29 | 2020-11-06 | 深圳中兴网信科技有限公司 | 图像数据增强方法、系统、存储介质和堆场覆盖检测方法 |
CN111970584A (zh) * | 2020-07-08 | 2020-11-20 | 国网宁夏电力有限公司电力科学研究院 | 一种用于处理数据的方法、装置、设备以及存储介质 |
WO2021139233A1 (zh) * | 2020-07-16 | 2021-07-15 | 平安科技(深圳)有限公司 | 数据扩充混合策略生成方法、装置和计算机设备 |
CN112200226A (zh) * | 2020-09-27 | 2021-01-08 | 北京达佳互联信息技术有限公司 | 基于强化学习的图像处理方法、图像处理方法及相关装置 |
CN114462628A (zh) * | 2020-11-09 | 2022-05-10 | 华为技术有限公司 | 数据增强方法、装置、计算设备以及计算机可读存储介质 |
CN112580689A (zh) * | 2020-11-23 | 2021-03-30 | 北京迈格威科技有限公司 | 神经网络模型的训练方法、应用方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11244170B2 (en) | Scene segmentation method and device, and storage medium | |
CN108629747B (zh) | 图像增强方法、装置、电子设备及存储介质 | |
CN109299315B (zh) | 多媒体资源分类方法、装置、计算机设备及存储介质 | |
CN110059744B (zh) | 训练神经网络的方法、图像处理的方法、设备及存储介质 | |
CN110796248A (zh) | 数据增强的方法、装置、设备及存储介质 | |
CN110097576B (zh) | 图像特征点的运动信息确定方法、任务执行方法和设备 | |
WO2020224479A1 (zh) | 目标的位置获取方法、装置、计算机设备及存储介质 | |
CN110059652B (zh) | 人脸图像处理方法、装置及存储介质 | |
CN110290426B (zh) | 展示资源的方法、装置、设备及存储介质 | |
CN112581358B (zh) | 图像处理模型的训练方法、图像处理方法及装置 | |
CN111104980A (zh) | 确定分类结果的方法、装置、设备及存储介质 | |
CN111178343A (zh) | 基于人工智能的多媒体资源检测方法、装置、设备及介质 | |
CN110705614A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN110991457A (zh) | 二维码处理方法、装置、电子设备及存储介质 | |
CN111488895B (zh) | 对抗数据生成方法、装置、设备及存储介质 | |
CN113343709B (zh) | 意图识别模型的训练方法、意图识别方法、装置及设备 | |
CN118135255A (zh) | 图像匹配模型的训练方法、图像匹配的方法及计算机设备 | |
CN111310701B (zh) | 手势识别方法、装置、设备及存储介质 | |
CN114283395A (zh) | 车道线检测的方法、装置、设备及计算机可读存储介质 | |
CN114462580A (zh) | 文本识别模型的训练方法、文本识别方法、装置和设备 | |
CN109040753B (zh) | 预测模式选择方法、装置及存储介质 | |
CN109388732B (zh) | 音乐地图的生成和显示方法、装置及存储介质 | |
CN111652432A (zh) | 用户属性信息的确定方法、装置、电子设备及存储介质 | |
CN110853704A (zh) | 蛋白质数据获取方法、装置、计算机设备及存储介质 | |
CN112990424A (zh) | 神经网络模型训练的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40021567 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |