CN111931854B - 一种提高图像识别模型可移植性能的方法 - Google Patents

一种提高图像识别模型可移植性能的方法 Download PDF

Info

Publication number
CN111931854B
CN111931854B CN202010806772.XA CN202010806772A CN111931854B CN 111931854 B CN111931854 B CN 111931854B CN 202010806772 A CN202010806772 A CN 202010806772A CN 111931854 B CN111931854 B CN 111931854B
Authority
CN
China
Prior art keywords
image
attribute
searched
attributes
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010806772.XA
Other languages
English (en)
Other versions
CN111931854A (zh
Inventor
谭志
刘兴业
曹红玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Civil Engineering and Architecture
Original Assignee
Beijing University of Civil Engineering and Architecture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Civil Engineering and Architecture filed Critical Beijing University of Civil Engineering and Architecture
Priority to CN202010806772.XA priority Critical patent/CN111931854B/zh
Publication of CN111931854A publication Critical patent/CN111931854A/zh
Application granted granted Critical
Publication of CN111931854B publication Critical patent/CN111931854B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种提高图像识别模型可移植性能的方法,通过改进的最小权重随机搜索算法,为每个属性赋予一个被搜索的权重值,被搜索过次数越多,权重越大,反之越小,根据该权重计算每个属性接下来被搜索到的概率,权重值越小接下来的被搜索概率也就越大,反之被搜索的概率越小,进一步根据被搜索的概率可以把搜索方向偏向于权重值较小的属性,即被搜索到次数较少的属性,适当“忽略”权重较大的对象,达到了搜索均衡的目的;通过E‑S判断方法减少了进一步计算准确性的复杂运算,同时也达到了筛选对象的目的;通过增加每个属性组合的复杂度和运用基于Leaky Relu激活函数构造的具有3个卷积层的卷积神经网络,达到了充分提取图像特征的目的。

Description

一种提高图像识别模型可移植性能的方法
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种提高图像识别模型可移植性能的方法。
背景技术
图像识别是人工智能的一个重要领域,目前在机器学习方面得到广泛应用与发展。然而本文所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别,通过计算机对图像做出各种处理、分析,最终识别我们所要研究的目标。但是计算机在识别过程中,无法像人一样做到对图像做出自主辩证的判断,只能机械化的寻找图像的特性,从完成对图像识别。因此通过训练一个完善的图像识别模型对于图像识别领域尤为重要。
在研究和实验中会发现,如果把经过某个特定的数据集训练的图像识别模型移植到其他的数据集进行识别时,该模型的识别准确性会明显降低,得的预测结果会有很大的偏差。例如对于数字图像识别模型的训练,如果用每张图像大小为28×28且为单通道的MNIST数据集训练模型,当训练的模型达到令人满意的水平(识别的准确率达到0.99+),再用每张图像大小为32×32且为三通道的SVHN数据集测试该识别模型时,得到的识别准确性会明显降低。虽然两个数据集都是用于训练数字识别模型的,但是两个数据集的图像特性之间存在较大的差异,计算机无法像人一样对两个数据集辩证的识别,无法直接判断出相应的差异,从而导致已经在特定数据集上训练好的图像识别模型在其他数据集上表现不佳,即模型的可移植性能过低。
针对上述问题,Volpi等人提出一种基于“内容保留”的组合优化方法,可以使用标准搜索算法评估和处理给定模型中图像空间中较易受影响的区域,使得模型移植后的准确性有了显著的提高。第一步,转换图像的尺寸大小和通道数,将训练模型时所用的数据集(例如上述的MNIST数据集)内的图像尺寸大小和通道数调整到与测试模型时的数据集(例如上述的SVHN数据集)内的图像尺寸大小和通道数相同;第二步,从211个图像的属性中随机选取3个属性构成一个属性组合,共有2113种组合方式;第三步,从所有属性组合中进行随机选取某个属性组合,每次进行100次选取操作;第四步,对第三步中100次随机选取到的100个属性组合依次进行筛选,用整个数据集中的一部分图像进行筛选实验,依次根据属性组合改变这一部分图像的属性,即属性组合中包含哪些属性就改变这一部分图像的哪些属性,共进行100次;第五步,将第四步通过属性组合改变好属性的图像依次输入到具有两层卷积神经网络的识别模型中进行训练,每个属性组合对应一次改变,依次向模型中输入了100次改变后的图像,若训练后识别准确率未达到100%,则对应的属性组合为待优化属性;第六步,从一系列待优化组合中随机选取某个待优化组合,共选取10000次,根据被选取的待优化组合改变据集中的部分图像的属性,即属性组合中包含哪些属性就改变这一部分图像的哪些属性;第七步,将第六步每次改变好属性的图形输入到识别模型,通过梯度下降法优化训练模型,对应第六步选取次数,则共训练10000次;第八步,返回第二步进行循环训练,共循环100次。
发明内容
本发明的实施例提供了一种提高图像识别模型可移植性能的方法,以解决现有技术中存在的技术问题。
为了实现上述目的,本发明采取了如下技术方案。
一种提高图像识别模型可移植性能的方法,包括:
S1通过最小权重随机搜索算法,从数据集的图像属性中获得第一属性组合,该第一属性组合包括数据集的图像的五个属性;
S2选取数据集的多个图像,根据第一属性组合改变该多个图像的属性,获得第一过程图像;
S3构建卷积神经网络,将第一过程图像输入到该卷积神经网络,并结合优化算法,训练图像识别模型,获得训练结果;该训练结果包括数据集的预测值;
S4基于该预测值,结合数据集的真实值,通过E-S判断方法,获得第一属性组合的判断结果;
S5将该第一属性组合的判断结果与预设阈值进行比较,筛选出未达到预设阈值的待优化属性组合;
S6重复多次执行步骤S1至S5,获得待优化属性组合系列;
S7在该待优化属性组合系列中进行随机挑选,获得第二属性组合;
S8将数据集分成多个批次的子数据集,根据第二属性组合改变每个批次的子数据集的图像的属性,获得第二过程图像;
S9将第二过程图像输入到卷积神经网络,并结合优化算法,训练图像识别模型;
S10重复多次执行步骤S7至S9;
S11重复多次执行步骤S1至S10,获得训练完成的图像识别模型。
优选地,通过最小权重随机搜索算法,从数据集的图像属性中获得第一属性组合,该第一属性组合包括数据集的图像的五个属性包括:
S11通过算式W1=W2=......=Wi=1 i∈[1,N](1)、
Figure GDA0002887694640000031
Figure GDA0002887694640000032
和Wsn={Wsn1,Wsn2......Wsni}i∈[1,N](3)获得上一步计算后每个图像属性对应的权重Ws_last;其中,算式(1)用于设定第i个待搜索图像属性的权重,N为待搜索对象的总个数;算式(2)表示第i个待搜索图像属性在初始期间的被搜索到的概率Psi都相同;算式(3)表示每次被搜索到的图像属性对应的权重值加1,在第n次搜索时第i个对象对应的权重为Wsni
Figure GDA0002887694640000033
Figure GDA0002887694640000034
获得每个图像属性的被搜索概率Pssn1,Pssn2.....Pssni;其中,算式(4)用于计算第n次第i个图像属性的权重对应的权重概率Pwsni;算式(5)用于计算图像属性被搜索的概率P′ssni;算式(6)计算由每个图像属性对应的P′ssni在所有图像属性中所占的比重得到的每个图像属性的被搜索概率Pssn1,Pssn2.....Pssni
S13根据每个图像属性的被搜索概率Pssn1,Pssn2.....Pssni,在所有的图像属性内,以较高的被搜索概率随机搜索对应权重值小的图像属性,以较低的被搜索概率随机搜索对应权重值大的图像属性;
S14重复上述子步骤五次,选取五个图像属性,获得第一属性组合。
优选地,基于预测值,结合数据集的真实值,通过E-S判断方法,获得第一属性组合的判断结果包括:
S41通过算式
Figure GDA0002887694640000041
结合Equal函数判断预测值与数据集的真实值是否相等,若预测值等于真实值则Equal函数的返回值为1,反之为0;算式(7)中,
Figure GDA0002887694640000042
为对第i的目标的预测值,yi为第i个目标的真实值,δi为Equal函数的返回值,F为每次预测目标的个数;
S42通过算式
Figure GDA0002887694640000043
结合Sum函数对δi进行求和运算,获得Sum函数的返回值S;将该Sum函数的返回值S与F进行比较,获得第一属性组合的判断结果。
优选地,构建卷积神经网络,将第一过程图像输入到该卷积神经网络,并结合优化算法,训练图像识别模型,获得训练结果包括:
采用Leaky Relu激活函数构造具有3个卷积层的卷积神经网络,将第一过程图像输入到该卷积神经网络,并结合Adam优化算法,通过梯度下降的方法训练图像识别模型,获得训练结果。
优选地,步骤S6中,重复执行步骤S1至S5的次数为100次。
优选地,步骤S10中,重复执行步骤S7至S9的次数为10000次。
优选地,步骤S11中,重复执行步骤S1至S10的次数为100次。
优选地,还具有步骤S0,具体包括:采用MNIST数据集作为数据集;在该数据集中选取211个图像属性。
由上述本发明的实施例提供的技术方案可以看出,本发明提供的一种提高图像识别模型可移植性能的方法,通过改进的最小权重随机搜索算法,为每个属性赋予一个被搜索的权重值,被搜索过次数越多,权重越大,反之越小,根据该权重计算每个属性接下来被搜索到的概率,权重值越小接下来的被搜索概率也就越大,反之被搜索的概率越小,进一步根据被搜索的概率可以把搜索方向偏向于权重值较小的属性,即被搜索到次数较少的属性,适当“忽略”权重较大的对象,达到了搜索均衡的目的;通过E-S判断方法减少了进一步计算准确性的复杂运算,同时也达到了筛选对象的目的;通过增加每个属性组合的复杂度和运用基于Leaky Relu激活函数构造的具有3个卷积层的卷积神经网络,达到了充分提取图像特征的目的。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种提高图像识别模型可移植性能的方法的处理流程图;
图2为本发明提供的一种提高图像识别模型可移植性能的方法的神经网络结构示意图;
图3为本发明提供的一种提高图像识别模型可移植性能的方法的一种优选实施例的处理流程图;
图4为本发明提供的一种提高图像识别模型可移植性能的方法的优选实施例的试验结果图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
本发明提供一种提高图像识别模型可移植性能的方法,用于解决现有技术中存在的如下技术问题:
1、对图像的属性进行随机选取所采用的方式不能够确保选取均衡,可能会导致某些属性被多次选取,而有些属性被选取的次数较少;
2、通过计算准确率筛选图像属性组合的方式过于复杂;
3、图像属性组合的复杂度较低,导致对属性组合的选取范围不够广泛;
4、现有技术中构造的识别模型不够完善,导致图像特征提取不够充分。
参见图1,本发明的方法,包括如下步骤:
S0采用MNIST数据集作为所述数据集;在该数据集中选取211个图像属性;
S1通过最小权重随机搜索算法,从数据集的图像属性中获得第一属性组合,该第一属性组合包括数据集的图像的五个属性;
S2选取数据集的多个图像,根据所述第一属性组合改变该多个图像的属性,获得第一过程图像;
S3构建卷积神经网络,将所述第一过程图像输入到该卷积神经网络,并结合优化算法,训练图像识别模型,获得训练结果;该训练结果包括数据集的预测值;
S4基于该预测值,结合数据集的真实值,通过E-S判断方法,获得第一属性组合的判断结果;
S5将该第一属性组合的判断结果与预设阈值进行比较,筛选出未达到预设阈值的待优化属性组合;
S6重复多次执行上述步骤S1至S5,获得待优化属性组合系列;
S7在该待优化属性组合系列中进行随机挑选,获得第二属性组合;
S8将数据集分成多个批次的子数据集,根据所述第二属性组合改变每个批次的子数据集的图像的属性,获得第二过程图像;
S9将所述第二过程图像输入到所述卷积神经网络,并结合所述优化算法,训练所述图像识别模型;
S10重复多次执行上述步骤S7至S9;
S11重复多次执行上述步骤S1至S10,获得训练完成的图像识别模型,并输出该模型学习到的权重。
为了解决现有技术中图像属性选取不均衡的问题,在本发明提供的方法中期初了最小权重随机搜索算法。对每个属性赋予一定初始权重值,在后续的计算中逐步改变每个属性对应的权重值,属性被选择过的次数越多,对应的权重值就越大。根据权重值计算每个属性接下来被选取的概率,权重值越大,该属性接下来被选取的概率就越小,相反,权重值越小,接下来被选取的概率就越大,从而达到选取均衡的目的。
具体的,在一些优选实施例中,步骤S1具有如下过程:
S11通过算式(1)、(2)和(3)获得上一步计算后每个图像属性对应的权重Ws_last,具体包括:
初始值;
在搜索之前(包括首次执行本方法时),设定第i个待搜索图像属性的权重Wi=1i∈[1,N],具体形式为:
W1=W2=......=Wi=1 i∈[1,N] (1);
其中N为待搜索图像属性的总个数,由此可以得到第i个待搜索图像属性在初始期间的被搜索到的概率Psi都相同,具体形式为:
Figure GDA0002887694640000071
搜索概率;
每次被搜索到的图像属性对应的权重值加1,在第n次搜索时第i个图像属性对应的权重为Wsni(第n次计算图像属性被搜索概率Pssni的权重;),具体形式为:
Wsn={Wsn1,Wsn2......Wsni} i∈[1,N] (3);
S12通过算式(4)、(5)和(6)获得每个图像属性的被搜索概率Pssn1,Pssn2.....Pssni,具体包括:
在第n次第i个图像属性的权重对应的权重概率为Pwsni,具体计算方式为:
Figure GDA0002887694640000072
然而,权重概率越大,表示该图像属性被选择过的次数越多,为了达到选择均衡的目的,因此在下一次搜索的过程中需要降低它被搜索到的概率,即它对应的被搜索概率Pssni i∈[1,N]需要降低。相反,如果图像属性对应的权重概率Pwsni较小,则它对应的被搜索概率Pssni就需要提高。
为了满足上述权重概率Pwsni和被搜索概率Pssni的对应关系,定义了P′ssni i∈[1,N]为被搜索概率Pssni的表现形式,即P′ssni和Pssni具有相同的性质,只是数值不同。近似将权重概率Pwsni设定为不被搜索概率的含义表示,相应的用1-Pssni表示被搜索概率Pssni的含义表示P′ssni。即
Figure GDA0002887694640000081
由于所有图像属性的被搜索概率的含义表示P′ssni之和不等于1,即
Figure GDA0002887694640000082
所以P′ssni不能作为图像属性是否能被搜索这一事件的概率,即被搜索概率Pssni。进一步可由每个图像属性对应的P′ssni在所有P′ssni中所占的比重得到每个图像属性的被搜索概率Pssni,具体形式为:
Figure GDA0002887694640000083
S13搜索过程;根据每个图像属性的对应的被搜索概率(Pssn1,Pssn2......Pssni i∈[1,N]),在所有的图像属性内,以(相对于所有图像属性)较高的被搜索概率随机搜索对应权重值小的图像属性,以较低的被搜索概率随机搜索对应权重值大的图像属性;例如,如果一个图像属性的权重与所有图图像属性的权重相比是最大的,则它对应的搜索概率就是最小的,一个图像属性的权重与所有图图像属性的权重相比是第二大的,则它对应的搜索概率就是第二小的,以此类推。
S14为了解决现有技术中图像属性组合的复杂度较低,导致对属性组合的选取范围不够广泛问题,在本实施例中采用了增加每个属性组合中属性个数的方式,具体为:循环执行上述子步骤五次,选取五个图像属性,获得所述第一属性组合;例如,当采用MNIST数据集时,选用211个图像属性,选取5个属性组成一个属性组合,一共有2115中组合方式,则每个图像属性的对应的被搜索概率为Pssn1,Pssn2......Pssn211
为了解决现有技术中通过计算准确率筛选图像属性组合的方式过于复杂的问题,在本发明提供的优选实施例中,“相等-求和”(Equal-Sum,E-S)的判断的方法。首先根模型的输出结果值判断预测值与真实值是否相等,然后计算预测值与真实值相等的总个数,然后与设定的筛选阀值进行比较,筛选出未达到阀值时对应的属性组合,避免了进一步求解准确率的复杂过程。包括了如下子步骤:
S41用Equal函数判断预测值y*与真实值y是否相等。若预测值等于真实值则函数的返回值为1,反之为0:
Figure GDA0002887694640000091
其中,
Figure GDA0002887694640000092
为对第i的目标的预测值,yi为第i个目标的真实值,δi为Equal函数的返回值,F为每次预测目标的个数;
S42用Sum函数对δi进行求和。若Sum函数的返回值等于F,则表明基于选取的对象对目标元素预测的效果最好。若Sum函数的返回值等于0,则说明预测效果最差。若Sum函数的返回值介于0到F之间,则表明预测效果一般。
Figure GDA0002887694640000093
其种S为Sum函数的返回值,为了使模型的预测效果达到最优,将F(每次预测目标的总个数)设定为判断方法的阀值,将使得Sum函数返回值小于F时对应的对象提取出来。
为了解决现有技术中构造的识别模型不够完善,导致图像特征提取不够充分的问题,在一些优选实施例中,上述步骤S3具体包括:
采用Leaky Relu激活函数构造具有3个卷积层的卷积神经网络(如图2所示),将所述第一过程图像输入到该卷积神经网络,并结合Adam优化算法,通过梯度下降的方法训练图像识别模型,获得训练结果;
更进一步的,在步骤S9中也采用相同的设置。
在本发明提供的优选实施例中,步骤S6中,重复执行所述步骤S1至S5的次数为100次,步骤S10中,重复执行所述步骤S7至S9的次数为10000次,步骤S11中,重复执行所述步骤S1至S10的次数为100次。
本发明还提供一个实施例,用于示例性地显示一个优选的执行过程。
如图3所示,本实施例中包括如下步骤:
第一步,准备训练模型所用的数据集和图像的属性,选用的训练集为MNIST数据集,选用211个图像属性;
第二步,通过最小权重随机搜索算法从211个属性中选取5个属性组成一个属性组合,一共有2115中组合方式;首先由算式(1)到算式(3)得到Ws_last,Ws_last为为上一步运算计算后每个图像属性对应的权重;然后结合Ws_last,根据算式(4)到算式(6)计算每个属性的被搜索概率Pssn1,Pssn2.....Pssn211;最后根据每个属性的对应的被搜索概率Pssn1,Pssn2......Pssn211,在所有的图像属性内,以较高的被搜索概率随机搜索对应权重值小的属性,以较低的被搜索概率随机搜索权重值大的属性;通过循环五次,选取五个属性组成一个属性组合;
第三步,选用数据集中一部分图像,总个数为F,根据属性组合改变这一部分图像的属性,即属性组合中包含哪些属性就改变这一部分图像的哪些属性;
第四步,将第三步改变属性后的图像输入到采用Leaky Relu激活函数构造具有3个卷积层的卷积神经网络(如图2所示),用Adam优化算法训练优化模型,通过梯度下降的方进行训练,并得到训练结果;
第五步,根据第五步的训练结果的预测值,结合真实值,用E-S判断方法,计算出属性组合的判断结果;先根据算式(7)用Equal函数判断预测值与真实值是否相等,再根据算式(8)用Sum函数对Equal函数的返回值进行求和;
第六步,将判断结果与筛选阀值进行比较;若Sum函数的返回值等于F,则表明基于选取的对象对目标元素预测的效果最好;若Sum函数的返回值等于0,则说明预测效果最差;若Sum函数的返回值介于0到F之间,则表明预测效果一般;
第七步,筛选出没有达到筛选阀值时对应的属性组合,将其定为待优化属性组合;为了使模型的预测效果达到最优,将F(每次预测目标的总个数)设定为判断方法的阀值,将使得Sum函数返回值小于F时对应的对象提取出来;
第八步,循环第二步到第七步,共循环100次,等到一系列的待优化属性组合
第九步,从第八步得到的一系列待优化组合中随机挑取一个待优化属性组合;
第十步,将数据集分成若干批次,根据循环过程运用每个批次图像,根据待优化属性组合改变一个批次图像的属性,即待优化属性组合中包含哪些属性就改变这一批次图像的哪些属性;
第十一步,将第十步改变属性后的图像输入到采用Leaky Relu激活函数构造具有3个卷积层的卷积神经网络(如图2所示),使用Adam优化算法训练优化模型,通过梯度下降的方法训练模型;
第十二步,循环第九步到第十一步,共循环10000次;
第十三步,循环第二步到第十二步,共循环100次;
第十四步,输出优化后的模型学习到的权重。
通过本发明提供的方法,明显提高了图像识别模型的可移植性能,实验结果如图4所示。图中,a曲线为改进的识别模型经过MNIST数据集训练后的准确性,b曲线为改进的识别模型经过SVHN数据集测试后的准确性;c曲线为Volpi等人提出的识别模型经过MNIST数据集训练后的准确性,d曲线为Volpi等人提出的识别模型经过SVHN数据集测试后的准确性。可以看出a曲线与c曲线已经重合,即两个模型在训练次数相同的情况下,训练后的准确性达到了相同的且令人满意的状态(0.99+)。但是b、d两条曲线总体显示的结果表明,改进后的识别模型在被移植后的准确性明显高于Volpi等人提出的识别模型。可证明本方法所训练的模型已经达到了预期提高模型可移植性能的效果。
综上所述,本发明提供的一种提高图像识别模型可移植性能的方法,通过改进的最小权重随机搜索算法,为每个属性赋予一个被搜索的权重值,被搜索过次数越多,权重越大,反之越小,根据该权重计算每个属性接下来被搜索到的概率,权重值越小接下来的被搜索概率也就越大,反之被搜索的概率越小,进一步根据被搜索的概率可以把搜索方向偏向于权重值较小的属性,即被搜索到次数较少的属性,适当“忽略”权重较大的对象,达到了搜索均衡的目的;通过E-S判断方法减少了进一步计算准确性的复杂运算,同时也达到了筛选对象的目的;通过增加每个属性组合的复杂度和运用基于Leaky Relu激活函数构造的具有3个卷积层的卷积神经网络,达到了充分提取图像特征的目的。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (8)

1.一种提高图像识别模型可移植性能的方法,其特征在于,包括:
S1通过最小权重随机搜索算法,从数据集的图像属性中获得第一属性组合,该第一属性组合包括数据集的图像的五个属性;
S2选取数据集的多个图像,根据所述第一属性组合改变该多个图像的属性,获得第一过程图像;
S3构建卷积神经网络,将所述第一过程图像输入到该卷积神经网络,并结合优化算法,训练图像识别模型,获得训练结果;该训练结果包括数据集的预测值;
S4基于该预测值,结合数据集的真实值,通过E-S判断方法,获得第一属性组合的判断结果;
S5将该第一属性组合的判断结果与预设阈值进行比较,筛选出未达到预设阈值的待优化属性组合;
S6重复多次执行所述步骤S1至S5,获得待优化属性组合系列;
S7在该待优化属性组合系列中进行随机挑选,获得第二属性组合;
S8将数据集分成多个批次的子数据集,根据所述第二属性组合改变每个批次的子数据集的图像的属性,获得第二过程图像;
S9将所述第二过程图像输入到所述卷积神经网络,并结合所述优化算法,训练所述图像识别模型;
S10重复多次执行所述步骤S7至S9;
S11重复多次执行所述步骤S1至S10,获得训练完成的图像识别模型。
2.根据权利要求1所述的方法,其特征在于,所述的通过最小权重随机搜索算法,从数据集的图像属性中获得第一属性组合,该第一属性组合包括数据集的图像的五个属性包括:
S11通过算式W1=W2=......=Wi=1 i∈[1,N] (1)、
Figure FDA0002887694630000011
Figure FDA0002887694630000012
和Wsn={Wsn1,Wsn2......Wsni}i∈[1,N] (3)获得上一步计算后每个图像属性对应的权重Ws_last;其中,算式(1)用于设定第i个待搜索图像属性的权重,N为待搜索对象的总个数;算式(2)表示第i个待搜索图像属性在初始期间的被搜索到的概率Psi都相同;算式(3)表示每次被搜索到的图像属性对应的权重值加1,在第n次搜索时第i个对象对应的权重为Wsni
S12通过算式
Figure FDA0002887694630000021
Figure FDA0002887694630000022
Figure FDA0002887694630000023
Figure FDA0002887694630000024
获得每个图像属性的被搜索概率Pssn1,Pssn2.....Pssni;其中,算式(4)用于计算第n次第i个图像属性的权重对应的权重概率Pwsni;算式(5)用于计算图像属性被搜索的概率P′ssni;算式(6)计算由每个图像属性对应的P′ssni在所有图像属性中所占的比重得到的每个图像属性的被搜索概率Pssn1,Pssn2.....Pssni
S13根据每个图像属性的被搜索概率Pssn1,Pssn2.....Pssni,在所有的图像属性内,以较高的被搜索概率随机搜索对应权重值小的图像属性,以较低的被搜索概率随机搜索对应权重值大的图像属性;
S14重复上述子步骤五次,选取五个图像属性,获得所述第一属性组合。
3.根据权利要求1所述的方法,其特征在于,所述的基于预测值,结合数据集的真实值,通过E-S判断方法,获得第一属性组合的判断结果包括:
S41通过算式
Figure FDA0002887694630000025
结合Equal函数判断所述预测值与数据集的真实值是否相等,若预测值等于真实值则Equal函数的返回值为1,反之为0;算式(7)中,
Figure FDA0002887694630000026
为对第i的目标的预测值,yi为第i个目标的真实值,δi为Equal函数的返回值,F为每次预测目标的个数;
S42通过算式
Figure FDA0002887694630000027
结合Sum函数对δi进行求和运算,获得Sum函数的返回值S;将该Sum函数的返回值S与F进行比较,获得第一属性组合的判断结果。
4.根据权利要求1所述的方法,其特征在于,构建卷积神经网络,将所述第一过程图像输入到该卷积神经网络,并结合优化算法,训练图像识别模型,获得训练结果包括:
采用Leaky Relu激活函数构造具有3个卷积层的卷积神经网络,将所述第一过程图像输入到该卷积神经网络,并结合Adam优化算法,通过梯度下降的方法训练图像识别模型,获得训练结果。
5.根据权利要求1至4任一所述的方法,其特征在于,所述步骤S6中,重复执行所述步骤S1至S5的次数为100次。
6.根据权利要求1至4任一所述的方法,其特征在于,所述步骤S10中,重复执行所述步骤S7至S9的次数为10000次。
7.根据权利要求1至4任一所述的方法,其特征在于,所述步骤S11中,重复执行所述步骤S1至S10的次数为100次。
8.根据权利要求1至4任一所述的方法,其特征在于,还具有步骤S0,具体包括:采用MNIST数据集作为所述数据集;在该数据集中选取211个图像属性。
CN202010806772.XA 2020-08-12 2020-08-12 一种提高图像识别模型可移植性能的方法 Active CN111931854B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010806772.XA CN111931854B (zh) 2020-08-12 2020-08-12 一种提高图像识别模型可移植性能的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010806772.XA CN111931854B (zh) 2020-08-12 2020-08-12 一种提高图像识别模型可移植性能的方法

Publications (2)

Publication Number Publication Date
CN111931854A CN111931854A (zh) 2020-11-13
CN111931854B true CN111931854B (zh) 2021-03-23

Family

ID=73310738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010806772.XA Active CN111931854B (zh) 2020-08-12 2020-08-12 一种提高图像识别模型可移植性能的方法

Country Status (1)

Country Link
CN (1) CN111931854B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101097564A (zh) * 2006-06-30 2008-01-02 佳能株式会社 参数学习方法及设备、模式识别方法及设备
CN101211341A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 图像智能模式识别搜索方法
WO2016033990A1 (zh) * 2014-09-01 2016-03-10 华为技术有限公司 生成检测模型的方法和设备、用于检测目标的方法和设备
CN107038159A (zh) * 2017-03-09 2017-08-11 清华大学 一种基于无监督领域自适应的神经网络机器翻译方法
CN108520780A (zh) * 2018-03-07 2018-09-11 中国科学院计算技术研究所 一种基于迁移学习的医学数据处理和系统
CN111062465A (zh) * 2019-12-10 2020-04-24 中山大学 一种神经网络结构自调整的图像识别模型及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10860898B2 (en) * 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101097564A (zh) * 2006-06-30 2008-01-02 佳能株式会社 参数学习方法及设备、模式识别方法及设备
CN101211341A (zh) * 2006-12-29 2008-07-02 上海芯盛电子科技有限公司 图像智能模式识别搜索方法
WO2016033990A1 (zh) * 2014-09-01 2016-03-10 华为技术有限公司 生成检测模型的方法和设备、用于检测目标的方法和设备
CN107038159A (zh) * 2017-03-09 2017-08-11 清华大学 一种基于无监督领域自适应的神经网络机器翻译方法
CN108520780A (zh) * 2018-03-07 2018-09-11 中国科学院计算技术研究所 一种基于迁移学习的医学数据处理和系统
CN111062465A (zh) * 2019-12-10 2020-04-24 中山大学 一种神经网络结构自调整的图像识别模型及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
多层卷积神经网络深度学习算法可移植性分析;肖堃;《哈尔滨工程大学学报》;20200331;第41卷(第3期);全文 *
机构知识库相关性检索机制研究与试验;王思丽;《情报科学》;20200229;第38卷(第2期);全文 *

Also Published As

Publication number Publication date
CN111931854A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN111095293B (zh) 图像美学处理方法及电子设备
CN107729999A (zh) 考虑矩阵相关性的深度神经网络压缩方法
CN110969250A (zh) 一种神经网络训练方法及装置
CN110349185B (zh) 一种rgbt目标跟踪模型的训练方法及装置
CN112465120A (zh) 一种基于进化方法的快速注意力神经网络架构搜索方法
CN111915490A (zh) 一种基于多尺度特征的车牌图像超分辨率重建模型及方法
CN111898689A (zh) 一种基于神经网络架构搜索的图像分类方法
CN112101432B (zh) 一种基于深度学习的材料显微图像与性能双向预测方法
TWI761813B (zh) 視頻分析方法及其相關的模型訓練方法、電子設備、儲存介質
CN110110845B (zh) 一种基于并行多级宽度神经网络的学习方法
CN111667016B (zh) 一种基于prototype的增量式信息分类方法
CN110929798A (zh) 基于结构优化稀疏卷积神经网络的图像分类方法及介质
CN112818893A (zh) 一种面向移动终端的轻量化开集地标识别方法
CN110991621A (zh) 一种基于通道数搜索卷积神经网络的方法
CN116052218B (zh) 一种行人重识别方法
CN116258165A (zh) 一种融合卷积及自注意力的多目标神经架构搜索方法
Verma et al. A" Network Pruning Network''Approach to Deep Model Compression
CN115908909A (zh) 基于贝叶斯卷积神经网络的进化神经架构搜索方法及系统
CN111931854B (zh) 一种提高图像识别模型可移植性能的方法
CN112989955B (zh) 基于空时双流异构嫁接卷积神经网络人体动作识别方法
CN112085174A (zh) 一种卷积神经网络优化方法、装置和设备
CN116660756A (zh) 基于条件生成对抗网络的电池容量衰减曲线生成方法
CN109741313A (zh) 独立成分分析和卷积神经网络的无参考图像质量评价方法
CN114781639A (zh) 面向边缘设备多层共享码本向量量化的深度模型压缩方法
CN112149738B (zh) 一种用于改善图像识别模型领域变换现象的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant