CN102999615A - 基于径向基函数神经网络的多样化图像标注和检索方法 - Google Patents

基于径向基函数神经网络的多样化图像标注和检索方法 Download PDF

Info

Publication number
CN102999615A
CN102999615A CN2012104990919A CN201210499091A CN102999615A CN 102999615 A CN102999615 A CN 102999615A CN 2012104990919 A CN2012104990919 A CN 2012104990919A CN 201210499091 A CN201210499091 A CN 201210499091A CN 102999615 A CN102999615 A CN 102999615A
Authority
CN
China
Prior art keywords
sigma
concept
sample
image
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104990919A
Other languages
English (en)
Other versions
CN102999615B (zh
Inventor
赵仲秋
季海峰
谢宝剑
黄德双
吴信东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201210499091.9A priority Critical patent/CN102999615B/zh
Publication of CN102999615A publication Critical patent/CN102999615A/zh
Application granted granted Critical
Publication of CN102999615B publication Critical patent/CN102999615B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于RBFNN的多样化图像标注和检索方法,包括:(1)构建和学习RBFNN模型,构建出能覆盖图像“子概念”的RBFNN模型;(2)将检索资料库预处理后的数据输入步骤(1)构建的RBFNN模型中,对图像库中图片进行多样化标注,同时给图像库中图片标注“概念”和“子概念”标签;(3)根据检索关键词和步骤(2)的标注结果,对标注后的图像库进行多样化检索:首先查找所有标注检索关键词的图片,并根据“概念”相似度进行排序;然后,将分属不同“子概念”的图片按照“概念”相似度由高到低的顺序置前;(4)输出检索结果。本发明的优点在于:提高了图像检索精度,同时大大提高了图像检索结果多样性,节约了检索时间,具有较高的鲁棒性和实用性。

Description

基于径向基函数神经网络的多样化图像标注和检索方法
技术领域
本发明涉及多样化图像标注和检索系统,特别涉及一种基于RBFNN(径向基函数神经网络)的多样化图像标注和检索方法。
背景技术
图像检索是随着计算机科学技术的迅速发展而产生和发展起来的一门科学技术,在国防、社会安全、遥感、医学、商业信息等领域都存在着非常重要的应用前景。近年来,随着诸如扫描仪、数码相机、数码摄像机等数字化设备的快速发展和普及使用,以及多媒体技术的提高和Internet的迅速普及,使得图像数据呈现几何级数的增长,于是出现了大容量的图像及海量的视频数据库,面对日益庞大的信息海洋,如何有效地组织、管理和检索大规模的图像数据成为迫切需要解决的问题,如果能够在检索的过程中自动筛选有用信息,尽量可能避免向用户提交雷同或者近似雷同的检索结果,无疑会提高信息检索和浏览的效率,节约大量的时间。图像数据的规模和应用范围都在不断扩张,从而对现有图像检索技术不断提出新的挑战和需求。
多样化图像检索,就是指在图像检索中使新颖的、独特的、非重复冗余的图像在检索结果中排序靠前。多样化图像检索系统的应用领域主要包括:图像电子设备应用、互联网图像搜索、医学图像检索、商业信息检索、遥感信息侦查等等。当前的图像检索技术都着重于提高检索结果的“概念”相关性,并不注重结果的“新颖性”,致使检索的结果产生大量的冗余信息,一个好的搜索引擎应该能自动去除这些冗余信息,理想情况下,用户所“关注”的检索结果中排名靠前的图像列表应该是对“概念”的全面覆盖,也就是说,能够尽可能覆盖检索“概念”的所有“子概念”,这样,当不同应用背景的用户输入相同的检索信息或者输入的检索信息比较模糊时,多样化的检索结果就更能满足他们的潜在需求。
目前,多样化图像检索技术还不是特别成熟,检索准确率比较低,如何设计出一个高效准确的多样化检索系统,是亟需解决的问题。基于内容的多样化图像检索中,由于受人工标记等客观条件的约束,一般训练数据集所提供的图像都具有“概念”标签,但不具有“子概念”标签,因此,机器学习过程是半监督的,即图像相关性的学习是有监督的,而多样性的学习是无监督的,这是多样化图像检索中需要解决的主要问题。目前的图像多样化检索技术主要存在以下的缺点:
(1)目前图像检索系统中的数据普遍表现为非均衡分布的特征,正类(即与检索“概念”相关的)数据往往要远少于反类(即与检索“概念”不相关的)数据,而且“概念”相关数据中各“子概念”的分布往往也是很不均衡的。这种正反类别分布不均衡的现象将使正类的学习被弱化,从而导致与“概念”相关的样本的识别率降低,检索结果的相关性降低;使非占优“子概念”的学习被弱化,以致检索结果中相应“子概念”样本缺失,从而对检索多样性产生很大影响。
(2)目前的多样化检索技术一般都是独立于相关性预检索的“后序”处理方法,即相关性预检索完成后,再利用某个无监督学习算法对预检索结果进行重新排序,以达到提高多样性的目的,额外“后序”学习耗费将增加用户在线等待的时间。
本发明将针对上述问题提出解决方案,实现图像相关性和多样性标注和检索的并行性,同时也解决检索中非均衡数据分布问题,进而使得图像检索精度提高。
发明内容
本发明所要解决的技术问题在于针对现有多样化图像检索技术的不足,提出一种基于RBFNN的多样化图像标注和检索方法。该方法将RBFNN网络模型,应用到相关性与多样性并行图像标注和检索中,不同隐中心的感受域能区别覆盖和响应不同的局域“子概念”。该方法不仅解决了传统相关性和多样性不能并行学习的问题,而且解决了非均衡数据学习问题,使得图像多样化标注和检索的精度和效率得到提高。
本发明是采用以下技术手段解决上述技术问题的:一种基于径向基函数神经网络(RBFNN)的多样化图像标注和检索方法,包括以下步骤:
(1)构建和学习RBFNN模型,构建出能够覆盖图像“子概念”的RBFNN模型;
(2)根据步骤(1)构建的RBFNN模型,将检索资料库预处理后的数据输入到RBFNN模型中,对图像库中图片进行多样化标注,同时给图像库中图片标注“概念”和“子概念”标签;
(3)根据检索关键词和步骤(2)的标注结果,对标注后的图像库进行多样化检索:首先查找所有标注检索关键词的图片,并根据“概念”相似度进行排序;然后,将分属不同“子概念”的图片按照“概念”相似度由高到低的顺序置前;
(4)输出检索结果。
进一步的,所述步骤(1)具体包括:首先输入训练图像样本,并对图像进行预处理,并提取特征,然后基于这些训练图像样本,采用如下步骤学习RBFNN模型:
1)基于检索相关性和多样性目标的RBF网络结构优化:
首先对训练图像样本聚类,得到Nc个聚类中心作为RBFNN初始化的候选隐中心,结合粒子群优化PSO算法来对RBF网络结构中的随机选取的隐中心位置、数目以及宽度参数进行并行优化,采用离散和连续混合编码形式,其中离散部分是对隐中心位置和数目的二进制编码,长度为候选隐中心的个数,基因值为“1”表示对应的候选隐中心被选中,否则表示未被选中;而连续部分是对宽度参数的编码。
进一步的,所述基于检索相关性和多样性目标的RBF网络结构优化的具体步骤如下:
①适应度函数的设计
使用代价学习误差CE作为适应度函数的自变量,使正类以及正类中“非占优”“子概念”内的样本误差代价增大,而其它样本误差代价减小,CE表示为:
E cos t = Σ i = 1 N β i Σ j = 1 s ( t ij - y ij ) 2 - - - ( 1 )
式中βi是各样本的误差代价,tij,yij分别表示输入第i个样本时,网络第j个输出接点的期望输出值和实际输出值,N表示样本总数,此外,采用 “M交叉认证” M-FOLD-CV对网络的泛化能力进行表达,并定义一种“M交叉认证”代价误差为
E cos t M - FOLD - CV = Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S n ) ) 2 - - - ( 2 )
公式中
Figure BDA0000249006503
表示排除第m个子集Sm,由剩余M-1个子集学习RBFNN分类器连接权值后输入子集Sm中第i个样本时,网络第j个输出接点的输出值,
综上,根据优化目标,设计适应度函数为
fitness = f ( E cos t M - FOLD - CV ) = - E cos t M - FOLD - CV - - - ( 3 )
其中,各样本的误差代价βi根据样本分布情况定义;
②RBF网络连接权值的学习
网络的代价误差是网络连接权值矩阵W的函数,公式(1)可表示为以下形式:
E cos t ( W ) = Σ i = 1 N β i Σ j = 1 s ( t ij - Σ k = 1 c φ ik w kj ) 2 = | | B 1 / 2 ( T - ΦW ) | | 2 - - - ( 4 )
其中tij表示输入第i个样本时,网络第j个输出接点的期望输出值,φik表示网络输入第i个样本时第k个隐接点的响应输出,wkj是网络第k个隐接点到第j个输出接点间的连接权值,T是矩阵(tij), Φ是矩阵(φik),B是对角阵
B = β 1 0 . . . 0 0 β 2 . . . 0 . . . . . . . . . . . . 0 . . . 0 β N - - - ( 5 )
按函数求解极值法,求Ecost(W)对W的偏导数,且令其为0,可得到(ΦTBΦ)WTTBT,解得
W T = ( Φ T BΦ ) - 1 Φ T BT - - - ( 6 )
作为优化的方案,学习RBFNN模型的步骤还包括步骤1)之后的步骤2):RBFNN隐中心C和宽度参数σ的快速、均衡微调,具体包括:
设计一种基于代价误差的梯度下降法来计算C和σ每次迭代的变化量,代价误差CE能修正由于正反类或正类各子概念样本分布不均衡引起的梯度偏差,采用公式(2)中的M-FOLD-CV-CE误差,表示为如下形式:
E cos t M - FOLD - CV ( C , σ ) = Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) 2 - - - ( 7 )
式中
Figure BDA0000249006509
, 
Figure BDA00002490065010
表示排除第m个子集Sm,由剩余M-1个子集学习得到的连接权值,求
Figure BDA00002490065011
对Ck(l)的偏导得C的迭代修正量为:
ΔC k ( l ) = - ξ ∂ E cos t M - FOLD - CV ∂ C k ( l ) = - ξ Σ m = 1 M Σ i = 1 N m β i m ∂ E i m ∂ y ij ( - S m ) ∂ y ij ( - S m ) ∂ φ ik m ∂ φ ik m ∂ C k ( l ) = 2 ξ Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) w kj ( - S m ) φ ik m P i m ( l ) - C k ( l ) σ k 2 - - - ( 8 )
求对σk的偏导得σ的迭代修正量为:
Δσ k = - ξ ∂ E cos t M - FOLD - CV ∂ σ k = - ξ Σ m = 1 M Σ i = 1 N m β i m ∂ E i m ∂ y ij ( - S m ) ∂ y ij ( - S m ) ∂ φ ik m ∂ φ ik m ∂ σ k = 2 ξ Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) w kj ( - S m ) φ ik m | | P m i - C k | | 2 σ k 3 - - - ( 9 ) .
作为优化的方案,学习RBFNN模型的步骤还包括步骤2)之后的步骤3):误差代价βi的计算与优化,具体包括:
网络的学习误差E由Ep和En两部分组成,其中Ep,En分别表示正类样本和反类样本误差,代价误差的设计是基于使正类及正类中“非占优”“子概念”误差代价增大,反之误差代价减小的思想,代价误差函数定义为:
E cos t = Σ k = 1 p α p , k E p , k + α n E n - - - ( 10 )
式中αp,k,αn可分别定义为αp,k=N/Np,kn=N/Nn或者
Figure BDA00002490065015
Figure BDA00002490065016
,Np,k表示正类样本第k个聚类簇中的样本数,Nn表示反类样本数,p表示正类样本的聚类数,Ep,k表示正类样本第k个聚类簇的误差,
Figure BDA00002490065017
Figure BDA00002490065018
分别表示梯度分量,
Figure BDA00002490065019
表示具有最大模的梯度分量,由公式(10)定义各学习样本的代价为:
Figure BDA00002490065020
对误差代价采用如下迭代策略:
β i ( t + 1 ) = β i ( t ) + γ ( β ‾ ( t ) - β i ( t ) ) - - - ( 12 )
其中
Figure BDA00002490065022
,γ是控制速率。
作为更进一步优化的方案,所述步骤(2)中对图像库中图片进行多样化标注的具体过程如下:
1)输入图像库,并对图像库中图像进行预处理,并提取特征,将特征输入RBFNN,根据RBFNN的输出结果对图片进行“概念”相关性和不相关性进行分类,如相关,则进行该“概念”的标注,并根据输出RBFNN结果标出图片与“概念”的相似度;
2)根据RBFNN的隐节点的响应对“概念”相关图片进行“子概念”标注,“主要”响应即隐节点输出值最大的为同一隐节点,则属于同一“子概念”,否则,属于不同“子概念”。
与已有技术相比,本发明有益效果体现在:
1、本发明从分类器模型层面研究实现图像检索中的相关性与多样性的并行学习,与传统的分步学习算法(先学习相关性,再学习多样性)相比较,更具科学性与先进性。同时,由于多样化学习是离线学习的过程,从而减少了图像检索用户在线等待的时间。
2、本发明通过分析图像检索中各“概念”、“子概念”数据的极度不均衡分布这个基本特征,以及其对检索相关性、多样性的影响的基础上,研究相应的RBF网络结构和参数的混合学习算法;提出一种基于M-FOLD-CV -CE误差的PSO全局优化和梯度算法局部调节相结合的RBF神经网络结构和参数学习算法,实现对正反类和各“子概念”的快速、均衡学习,解决了传统图像检索中“概念”、“子概念”数据的极度不均衡分布问题。从而大大提高了图像检索结果的相关性和多样性。
3、本发明通过提出用RBFNN的不同隐中心来覆盖各“子概念”模型,从RBF神经网络结构本身入手解决多“子概念”并行检索的问题,大大提高了图像检索的速度,提高了图像检索结果的多样性。
4、本发明可以扩展应用到文本、网页、视频等信息多样化检索领域,有着重要的应用价值。而且,基于RBF网络的非均衡模式分类的研究成果,也可应用到诸如临床医学检验、网络攻击分类报警、文本分类和产品质量检测等很多涉及非均衡数据分布的模式分类领域。
附图说明
图 1为本发明提出的多样化图像标注和检索总体示意图。
图 2为本发明提出的RBFNN隐中心(“*”表示)感受域覆盖“子概念”示意图。
图 3为本发明提出的能够覆盖图像“子概念”的RBFNN新模型。
具体实施方式
图1是本发明提出的多样化图像标注和检索总体示意图,参照图1,本发明中基于RBFNN(径向基函数神经网络)的多样化图像标注和检索方法具体包括如下步骤:
(1)构建和学习RBFNN模型。
针对相关性与多样性并行图像检索这一特殊问题,不同“子概念”图像在空间上呈聚类簇状分布,结合RBFNN中不同的隐节点能够区别和覆盖不同的局部分布区域的思想,将RBFNN应用到相关性与多样性并行图像检索中,从而,不同隐中心的感受域能区别覆盖和响应不同的局域“子概念”,具有很好的“子概念”解释性。进而构建出能够覆盖图像“子概念”的RBFNN模型。
首先输入训练图像样本,并对图像进行预处理,并提取图像颜色、纹理、形状等特征,然后基于这些训练样本,采用如下步骤学习RBFNN模型:
1)基于检索相关性和多样性目标的RBF网络结构优化
首先对训练图像样本聚类,得到Nc个聚类中心作为RBFNN初始化的候选隐中心。结合粒子群优化(PSO)算法来对RBF网络结构中的随机选取的隐中心位置、数目以及宽度参数进行并行优化。采用离散和连续混合编码形式,其中离散部分是对隐中心位置和数目的二进制编码,长度为候选隐中心的个数,基因值为“1”表示对应的候选隐中心被选中,否则表示未被选中;而连续部分是对宽度参数的编码。具体如下:
①适应度函数的设计
检索相关性由RBFNN的分类性能决定,而在一般情况下,训练样本的学习误差越小可能对应分类器更好的分类性能,而为了保证学习的均衡性,提高检索相关性和多样性,本发明中使用代价学习误差(CE, cost-error)作为适应度函数的自变量,使正类以及正类中“非占优”“子概念”内的样本误差代价增大,而其它样本误差代价减小。CE可表示为:
E cos t = Σ i = 1 N β i Σ j = 1 s ( t ij - y ij ) 2 - - - ( 1 )
式中βi是各样本的误差代价,tij,yij分别表示输入第i个样本时,网络第j个输出接点的期望输出值和实际输出值,N表示样本总数。此外,适应度函数还需体现分类器的泛化性能,即对新样本的分类和检索性能。由于隐接点个数的减少会导致网络对“子概念”覆盖能力的减弱,所以常用的隐接点个数nc对RBF网络泛化能力的表达方法在此并不合适;而且,当适应度函数设计为Ecost和nc的二元函数时,存在着函数形式未知以及Ecost和nc之间权衡参数难以确定等问题。因此,本发明采用较常用的“M交叉认证”(M-fold Cross Validation, M-FOLD-CV)对网络的泛化能力进行表达,为此,我们定义一种“M交叉认证”代价误差(M-FOLD-CV -CE)为
E cos t M - FOLD - CV = Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S n ) ) 2 - - - ( 2 )
公式中
Figure BDA00002490065025
表示排除第m个子集Sm,由剩余M-1个子集学习RBFNN分类器连接权值后输入子集Sm中第i个样本时,网络第j个输出接点的输出值。
综上所述,根据我们的优化目标,可设计适应度函数为
fitness = f ( E cos t M - FOLD - CV ) = - E cos t M - FOLD - CV - - - ( 3 )
其中,误差代价可以根据样本分布情况定义,而且,在实验中,正反类、各“子概念”误差代价之间的差异大小可以调节,则网络结构、检索相关性、检索多样性也随之变化,据此可以分析三者之间的关系,以利针对不同用户检索需求,设计不同结构的分类器。
②RBF网络连接权值的学习
网络的代价误差是网络连接权值矩阵W的函数,公式(1)可表示为以下形式:
E cos t ( W ) = Σ i = 1 N β i Σ j = 1 s ( t ij - Σ k = 1 c φ ik w kj ) 2 = | | B 1 / 2 ( T - ΦW ) | | 2 - - - ( 4 )
其中tij表示输入第i个样本时,网络第j个输出接点的期望输出值,φik表示网络输入第i个样本时第k个隐接点的响应输出,wkj是网络第k个隐接点到第j个输出接点间的连接权值,T是矩阵(tij),Φ是矩阵(φik),B是对角阵
B = β 1 0 . . . 0 0 β 2 . . . 0 . . . . . . . . . . . . 0 . . . 0 β N - - - ( 5 )
按函数求解极值法,求Ecost(W)对W的偏导数,且令其为0,可得到(ΦTBΦ)WTTBT,解得
W T = ( Φ T BΦ ) - 1 Φ T BT - - - ( 6 )
2)RBFNN隐中心和宽度参数的快速、均衡微调
由于RBFNN模型是有关估计参数隐中心C和宽度参数σ的非线性函数,所以拟采用迭代算法对参数微调。为此,设计一种基于代价误差的梯度下降法(cGD, cost-error Gradient Decent)来计算C和σ每次迭代的变化量,代价误差(CE)能修正由于正反类或正类各子概念样本分布不均衡引起的梯度偏差。
这里,采用公式(2)中的M-FOLD-CV-CE误差,以防止 “过学习”,提高网络的泛化能力,M-FOLD-CV-CE是以C和σ为自变量的函数,可表示为如下形式:
E cos t M - FOLD - CV ( C , σ ) = Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) 2 - - - ( 7 )
式中
Figure BDA00002490065031
, 
Figure BDA00002490065032
表示排除第m个子集Sm,由剩余M-1个子集学习得到的连接权值。求
Figure BDA00002490065033
对Ck(l)(Ck(l)表示第k个隐中心的第l维)的偏导可得C的迭代修正量为:
ΔC k ( l ) = - ξ ∂ E cos t M - FOLD - CV ∂ C k ( l ) = - ξ Σ m = 1 M Σ i = 1 N m β i m ∂ E i m ∂ y ij ( - S m ) ∂ y ij ( - S m ) ∂ φ ik m ∂ φ ik m ∂ C k ( l ) = 2 ξ Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) w kj ( - S m ) φ ik m P i m ( l ) - C k ( l ) σ k 2 - - - ( 8 )
求对σk的偏导可得σ的迭代修正量为:
Δσ k = - ξ ∂ E cos t M - FOLD - CV ∂ σ k = - ξ Σ m = 1 M Σ i = 1 N m β i m ∂ E i m ∂ y ij ( - S m ) ∂ y ij ( - S m ) ∂ φ ik m ∂ φ ik m ∂ σ k = 2 ξ Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) w kj ( - S m ) φ ik m | | P m i - C k | | 2 σ k 3 - - - ( 9 ) .
3)误差代价βi的计算与优化
网络的学习误差E由Ep和En两部分组成,其中Ep,En分别表示正类样本和反类样本误差,由于样本分布的不均衡性,导致正类不能得到有效学习,从而TP(True Positive, 实际为正类,预测为正类的样本数)降低;同样,某些样本“稀少”的“子概念”的学习被弱化,也会导致检索结果中这些“子概念”的缺失,从而检索的多样性降低。代价误差的设计是基于使正类及正类中“非占优”“子概念”误差代价增大,反之误差代价减小的思想,因此,代价误差函数可定义为:
E cos t = Σ k = 1 p α p , k E p , k + α n E n - - - ( 10 )
式中αp,k,αn可分别定义为αp,k=N/Np,kn=N/Nn或者
Figure BDA00002490065037
Figure BDA00002490065038
,Np,k表示正类样本第k个聚类簇中的样本数,Nn表示反类样本数,p表示正类样本的聚类数,Ep,k表示正类样本第k个聚类簇的误差,
Figure BDA00002490065039
分别表示梯度分量,
Figure BDA00002490065041
表示具有最大模的梯度分量。由公式(10)可定义各学习样本的代价为:
Figure BDA00002490065042
由于由代价误差学习得到的网络的输出,不能准确表示样本类别的后验概率估计。因此,对误差代价可逐步采用如下迭代策略:
β i ( t + 1 ) = β i ( t ) + γ ( β ‾ ( t ) - β i ( t ) ) - - - ( 12 )
其中
Figure BDA00002490065044
,γ是控制速率。根据迭代策略,各样本点对应的βi在迭代后期能够收敛到
Figure BDA00002490065045
,因此,此策略能解决网络输出后验概率估计的问题,而且,此代价误差的优化策略也能调整AUC指标中的FP(False Positive, 实际为反类,预测为正类的样本数)增大的问题。
(2)利用优化后的RBFNN模型来对图像库中图片进行多样化标注。具体的多样化标注过程如下:
1)输入图像库,并对图像库中图像进行预处理,并提取图像颜色、纹理、形状等特征,将特征输入RBFNN,根据RBFNN的输出结果对图片进行“概念”相关性和不相关性进行分类,如相关,则进行该“概念”的标注,并根据输出RBFNN结果标出图片与“概念”的相似度。
2)根据RBFNN的隐节点的响应对“概念”相关图片进行“子概念”标注。“主要”响应(隐节点输出值最大)为同一隐节点,则属于同一“子概念”,否则,属于不同“子概念”。
(3)根据检索关键词和步骤(2)的标注结果,对标注后的图像库进行多样化检索:首先查找所有标注检索关键词的图片,并根据“概念”相似度进行排序;然后,将分属不同“子概念”的图片按照“概念”相似度由高到低的顺序置前。
(4)输出检索结果。
图2为本发明提出的RBFNN隐中心(“*”表示)感受域覆盖“子概念”示意图;该图说明了针对相关性与多样性并行图像检索这一特殊问题,检索中的结果由“概念”相关数据和“概念”不相关数据组成,“概念”相关数据中的“子概念”的分布往往也是很不均衡,不同组成“子概念”图像在空间上呈聚类簇状分布,结合RBFNN中不同的隐节点能够区别和覆盖不同的局部分布区域的思想,将RBFNN应用到相关性与多样性并行图像检索中,从而,不同隐中心的感受域能区别覆盖和响应不同的局域“子概念”,具有很好的“子概念”解释性。
图3为本发明提出能够覆盖图像“子概念”的RBFNN新模型,该图说明了新型RBFNN模型的组成要素,并且描述了数据的流向。RBFNN新模型主要有由输入层,隐层为图像“子概念”,和输出层三层组成。该图根据不同隐中心的感受域能区别覆盖和响应不同的局域“子概念”思想设计出来的。输入层是接受图像样本进行预处理后的数据。隐层为图像“子概念”的隐节点响应对“概念”相关图片进行“子概念”标注。输出层接受根据网络上的权值将隐节点标注后的结果组合输出。
以上所述仅为本发明创造的较佳实施例而已,并不用以限制本发明创造,凡在本发明创造的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明创造的保护范围之内。

Claims (6)

1.一种基于径向基函数神经网络的多样化图像标注和检索方法,其特征在于:包括以下步骤:
(1)构建和学习RBFNN模型,构建出能够覆盖图像“子概念”的RBFNN模型;
(2)根据步骤(1)构建的RBFNN模型,将检索资料库预处理后的数据输入到RBFNN模型中,对图像库中图片进行多样化标注,同时给图像库中图片标注“概念”和“子概念”标签;
(3)根据检索关键词和步骤(2)的标注结果,对标注后的图像库进行多样化检索:首先查找所有标注检索关键词的图片,并根据“概念”相似度进行排序;然后,将分属不同“子概念”的图片按照“概念”相似度由高到低的顺序置前;
(4)输出检索结果。
2.如权利要求1所述的基于径向基函数神经网络的多样化图像标注和检索方法,其特征在于:所述步骤(1)具体包括:首先输入训练图像样本,并对图像进行预处理,并提取特征,然后基于这些训练图像样本,采用如下步骤学习RBFNN模型:
1)基于检索相关性和多样性目标的RBF网络结构优化:
首先对训练图像样本聚类,得到Nc个聚类中心作为RBFNN初始化的候选隐中心,结合粒子群优化PSO算法来对RBF网络结构中的随机选取的隐中心位置、数目以及宽度参数进行并行优化,采用离散和连续混合编码形式,其中离散部分是对隐中心位置和数目的二进制编码,长度为候选隐中心的个数,基因值为“1”表示对应的候选隐中心被选中,否则表示未被选中;而连续部分是对宽度参数的编码。
3.如权利要求2所述的基于径向基函数神经网络的多样化图像标注和检索方法,其特征在于:所述基于检索相关性和多样性目标的RBF网络结构优化的具体步骤如下:
①适应度函数的设计
使用代价学习误差CE作为适应度函数的自变量,使正类以及正类中“非占优”“子概念”内的样本误差代价增大,而其它样本误差代价减小,CE表示为:
E cos t = Σ i = 1 N β i Σ j = 1 s ( t ij - y ij ) 2 - - - ( 1 )
式中βi是各样本的误差代价,tij,yij分别表示输入第i个样本时,网络第j个输出接点的期望输出值和实际输出值,N表示样本总数,此外,采用 “M交叉认证” M-FOLD-CV对网络的泛化能力进行表达,并定义一种“M交叉认证”代价误差为
E cos t M - FOLD - CV = Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S n ) ) 2 - - - ( 2 )
公式中
Figure FDA0000249006493
表示排除第m个子集Sm,由剩余M-1个子集学习RBFNN分类器连接权值后输入子集Sm中第i个样本时,网络第j个输出接点的输出值,
综上,根据优化目标,设计适应度函数为
fitness = f ( E cos t M - FOLD - CV ) = - E cos t M - FOLD - CV - - - ( 3 )
其中,各样本的误差代价βi根据样本分布情况定义;
②RBF网络连接权值的学习
网络的代价误差是网络连接权值矩阵W的函数,公式(1)可表示为以下形式:
E cos t ( W ) = Σ i = 1 N β i Σ j = 1 s ( t ij - Σ k = 1 c φ ik w kj ) 2 = | | B 1 / 2 ( T - ΦW ) | | 2 - - - ( 4 )
其中tij表示输入第i个样本时,网络第j个输出接点的期望输出值,φik表示网络输入第i个样本时第k个隐接点的响应输出,wkj是网络第k个隐接点到第j个输出接点间的连接权值,T是矩阵(tij), Φ是矩阵(φik),B是对角阵
B = β 1 0 . . . 0 0 β 2 . . . 0 . . . . . . . . . . . . 0 . . . 0 β N - - - ( 5 )
按函数求解极值法,求Ecost(W)对W的偏导数,且令其为0,可得到(ΦTBΦ)WTTBT,解得
W T = ( Φ T BΦ ) - 1 Φ T BT - - - ( 6 )
4.如权利要求3所述的基于径向基函数神经网络的多样化图像标注和检索方法,其特征在于:学习RBFNN模型的步骤还包括步骤1)之后的步骤2):RBFNN隐中心C和宽度参数σ的快速、均衡微调,具体包括:
设计一种基于代价误差的梯度下降法来计算C和σ每次迭代的变化量,代价误差CE能修正由于正反类或正类各子概念样本分布不均衡引起的梯度偏差,采用公式(2)中的M-FOLD-CV-CE误差,表示为如下形式:
E cos t M - FOLD - CV ( C , σ ) = Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) 2 - - - ( 7 )
式中
Figure FDA0000249006499
, 
Figure FDA00002490064910
表示排除第m个子集Sm,由剩余M-1个子集学习得到的连接权值,求
Figure FDA00002490064911
对Ck(l)的偏导得C的迭代修正量为:
ΔC k ( l ) = - ξ ∂ E cos t M - FOLD - CV ∂ C k ( l ) = - ξ Σ m = 1 M Σ i = 1 N m β i m ∂ E i m ∂ y ij ( - S m ) ∂ y ij ( - S m ) ∂ φ ik m ∂ φ ik m ∂ C k ( l ) = 2 ξ Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) w kj ( - S m ) φ ik m P i m ( l ) - C k ( l ) σ k 2 - - - ( 8 )
求对σk的偏导得σ的迭代修正量为:
Δσ k = - ξ ∂ E cos t M - FOLD - CV ∂ σ k = - ξ Σ m = 1 M Σ i = 1 N m β i m ∂ E i m ∂ y ij ( - S m ) ∂ y ij ( - S m ) ∂ φ ik m ∂ φ ik m ∂ σ k = 2 ξ Σ m = 1 M Σ i = 1 N m β i m Σ j = 1 s ( t ij m - y ij ( - S m ) ) w kj ( - S m ) φ ik m | | P m i - C k | | 2 σ k 3 - - - ( 9 )
5.如权利要求4所述的基于径向基函数神经网络的多样化图像标注和检索方法,其特征在于:学习RBFNN模型的步骤还包括步骤2)之后的步骤3):误差代价βi的计算与优化,具体包括:
网络的学习误差E由Ep和En两部分组成,其中Ep,En分别表示正类样本和反类样本误差,代价误差的设计是基于使正类及正类中“非占优”“子概念”误差代价增大,反之误差代价减小的思想,代价误差函数定义为:
E cos t = Σ k = 1 p α p , k E p , k + α n E n - - - ( 10 )
式中αp,k,αn可分别定义为αp,k=N/Np,kn=N/Nn或者
Figure FDA00002490064916
,Np,k表示正类样本第k个聚类簇中的样本数,Nn表示反类样本数,p表示正类样本的聚类数,Ep,k表示正类样本第k个聚类簇的误差,
Figure FDA00002490064917
分别表示梯度分量,
Figure FDA00002490064919
表示具有最大模的梯度分量,由公式(10)定义各学习样本的代价为:
Figure FDA00002490064920
对误差代价采用如下迭代策略:
β i ( t + 1 ) = β i ( t ) + γ ( β ‾ ( t ) - β i ( t ) ) - - - ( 12 )
其中,γ是控制速率。
6.如权利要求1至5任一项所述的基于径向基函数神经网络的多样化图像标注和检索方法,其特征在于:所述步骤(2)中对图像库中图片进行多样化标注的具体过程如下:
1)输入图像库,并对图像库中图像进行预处理,并提取特征,将特征输入RBFNN,根据RBFNN的输出结果对图片进行“概念”相关性和不相关性进行分类,如相关,则进行该“概念”的标注,并根据输出RBFNN结果标出图片与“概念”的相似度;
2)根据RBFNN的隐节点的响应对“概念”相关图片进行“子概念”标注,“主要”响应即隐节点输出值最大的为同一隐节点,则属于同一“子概念”,否则,属于不同“子概念”。
CN201210499091.9A 2012-11-29 2012-11-29 基于径向基函数神经网络的多样化图像标注和检索方法 Active CN102999615B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210499091.9A CN102999615B (zh) 2012-11-29 2012-11-29 基于径向基函数神经网络的多样化图像标注和检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210499091.9A CN102999615B (zh) 2012-11-29 2012-11-29 基于径向基函数神经网络的多样化图像标注和检索方法

Publications (2)

Publication Number Publication Date
CN102999615A true CN102999615A (zh) 2013-03-27
CN102999615B CN102999615B (zh) 2016-04-27

Family

ID=47928183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210499091.9A Active CN102999615B (zh) 2012-11-29 2012-11-29 基于径向基函数神经网络的多样化图像标注和检索方法

Country Status (1)

Country Link
CN (1) CN102999615B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103309953A (zh) * 2013-05-24 2013-09-18 合肥工业大学 一种基于多rbfnn分类器集成的多样化图像标注和检索方法
CN104392253A (zh) * 2014-12-12 2015-03-04 南京大学 一种草图数据集的交互式类别标注方法
CN104462738A (zh) * 2013-09-24 2015-03-25 西门子公司 一种标注医学图像的方法、装置和系统
CN105719006A (zh) * 2016-01-18 2016-06-29 合肥工业大学 基于流特征的因果结构学习方法
CN105868108A (zh) * 2016-03-28 2016-08-17 中国科学院信息工程研究所 基于神经网络的指令集无关的二进制代码相似性检测方法
CN106095966A (zh) * 2016-06-15 2016-11-09 成都品果科技有限公司 一种用户可扩展的标签标注方法及系统
TWI581205B (zh) * 2016-02-16 2017-05-01 國立屏東大學 文具供應商的選擇方法與電腦程式產品
CN107908707A (zh) * 2017-11-09 2018-04-13 程杰 一种图片素材库的建立方法及其图片查找方法
CN108154163A (zh) * 2016-12-06 2018-06-12 北京京东尚科信息技术有限公司 数据处理方法、数据识别和学习方法及其装置
CN108292290A (zh) * 2015-08-06 2018-07-17 科莱里费有限公司 用于学习用于获取与所学习的概念有关的内容的新训练的概念的系统和方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5943661A (en) * 1991-07-11 1999-08-24 Texas Instruments Incorporated Hybrid neural network classifier, systems and methods
CN101196905A (zh) * 2007-12-05 2008-06-11 覃征 一种智能图形检索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5943661A (en) * 1991-07-11 1999-08-24 Texas Instruments Incorporated Hybrid neural network classifier, systems and methods
CN101196905A (zh) * 2007-12-05 2008-06-11 覃征 一种智能图形检索方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
伍小芹,温小斌,康耀红,张宏科: "基于神经网络生成图像语义的算法研究", 《计算机工程与应用》, vol. 43, no. 31, 1 November 2007 (2007-11-01), pages 61 - 63 *
李凌伟等: "基于概念的图像检索方法", 《计算机科学(增刊)》, vol. 29, no. 8, 5 August 2002 (2002-08-05), pages 301 - 304 *
许振伟: "BP神经网络分类器在储粮害虫图像检索中的应用研究", 《中国粮油学报》, vol. 25, no. 1, 31 January 2010 (2010-01-31), pages 103 - 106 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103309953B (zh) * 2013-05-24 2017-02-08 合肥工业大学 一种基于多rbfnn分类器集成的多样化图像标注和检索方法
CN103309953A (zh) * 2013-05-24 2013-09-18 合肥工业大学 一种基于多rbfnn分类器集成的多样化图像标注和检索方法
CN104462738A (zh) * 2013-09-24 2015-03-25 西门子公司 一种标注医学图像的方法、装置和系统
CN104392253A (zh) * 2014-12-12 2015-03-04 南京大学 一种草图数据集的交互式类别标注方法
CN104392253B (zh) * 2014-12-12 2017-05-10 南京大学 一种草图数据集的交互式类别标注方法
CN108292290A (zh) * 2015-08-06 2018-07-17 科莱里费有限公司 用于学习用于获取与所学习的概念有关的内容的新训练的概念的系统和方法
CN105719006A (zh) * 2016-01-18 2016-06-29 合肥工业大学 基于流特征的因果结构学习方法
TWI581205B (zh) * 2016-02-16 2017-05-01 國立屏東大學 文具供應商的選擇方法與電腦程式產品
CN105868108A (zh) * 2016-03-28 2016-08-17 中国科学院信息工程研究所 基于神经网络的指令集无关的二进制代码相似性检测方法
CN105868108B (zh) * 2016-03-28 2018-09-07 中国科学院信息工程研究所 基于神经网络的指令集无关的二进制代码相似性检测方法
CN106095966A (zh) * 2016-06-15 2016-11-09 成都品果科技有限公司 一种用户可扩展的标签标注方法及系统
CN106095966B (zh) * 2016-06-15 2019-12-27 成都品果科技有限公司 一种用户可扩展的标签标注方法及系统
CN108154163A (zh) * 2016-12-06 2018-06-12 北京京东尚科信息技术有限公司 数据处理方法、数据识别和学习方法及其装置
CN108154163B (zh) * 2016-12-06 2020-11-24 北京京东尚科信息技术有限公司 数据处理方法、数据识别和学习方法及其装置和计算机可读介质
CN107908707A (zh) * 2017-11-09 2018-04-13 程杰 一种图片素材库的建立方法及其图片查找方法

Also Published As

Publication number Publication date
CN102999615B (zh) 2016-04-27

Similar Documents

Publication Publication Date Title
CN102999615B (zh) 基于径向基函数神经网络的多样化图像标注和检索方法
CN106599181B (zh) 一种基于主题模型的新闻热点检测方法
CN103309953A (zh) 一种基于多rbfnn分类器集成的多样化图像标注和检索方法
Meng et al. Leveraging concept association network for multimedia rare concept mining and retrieval
CN105393264A (zh) 人机交互学习中的交互区段提取
CN104346440A (zh) 一种基于神经网络的跨媒体哈希索引方法
CN107451278A (zh) 基于多隐层极限学习机的中文文本分类方法
CN112256866B (zh) 一种基于深度学习的文本细粒度情感分析算法
CN103942749B (zh) 一种基于修正聚类假设和半监督极速学习机的高光谱地物分类方法
Elleuch et al. A fuzzy ontology: based framework for reasoning in visual video content analysis and indexing
Yang et al. A decision-making algorithm combining the aspect-based sentiment analysis and intuitionistic fuzzy-VIKOR for online hotel reservation
Zhu et al. Two-stream transformer for multi-label image classification
CN114417851B (zh) 一种基于关键词加权信息的情感分析方法
CN109543038B (zh) 一种应用于文本数据的情感分析方法
Guan et al. Hierarchical neural network for online news popularity prediction
Zhang et al. Reinforced adaptive knowledge learning for multimodal fake news detection
Duan et al. Extreme learning machine with gaussian kernel based relevance feedback scheme for image retrieval
Lu et al. Heterogeneous knowledge learning of predictive academic intelligence in transportation
Gong et al. Erroneous pixel prediction for semantic image segmentation
CN101213539A (zh) 交叉描述符学习系统、方法及其程序产品
CN105787045A (zh) 一种用于可视媒体语义索引的精度增强方法
Xiao et al. Multi-Task CNN for classification of Chinese legal questions
CN117216617A (zh) 文本分类模型训练方法、装置、计算机设备和存储介质
Guo [Retracted] Intelligent Sports Video Classification Based on Deep Neural Network (DNN) Algorithm and Transfer Learning
Huang et al. A Model for Legal Judgment Prediction Based on Multi-model Fusion

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant