CN101546332A - 基于量子遗传优化的流形降维医学图像检索方法 - Google Patents

基于量子遗传优化的流形降维医学图像检索方法 Download PDF

Info

Publication number
CN101546332A
CN101546332A CN200910071965A CN200910071965A CN101546332A CN 101546332 A CN101546332 A CN 101546332A CN 200910071965 A CN200910071965 A CN 200910071965A CN 200910071965 A CN200910071965 A CN 200910071965A CN 101546332 A CN101546332 A CN 101546332A
Authority
CN
China
Prior art keywords
medical image
vector
dimension
sigma
quantum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910071965A
Other languages
English (en)
Other versions
CN101546332B (zh
Inventor
李金�
梁洪
丛望
王磊
汤连志
胡文广
杨广达
冯耀宇
吕美超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN2009100719659A priority Critical patent/CN101546332B/zh
Publication of CN101546332A publication Critical patent/CN101546332A/zh
Application granted granted Critical
Publication of CN101546332B publication Critical patent/CN101546332B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2137Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
    • G06F18/21375Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps involving differential geometry, e.g. embedding of pattern manifold

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供的是一种基于量子遗传优化的流形降维医学图像检索方法。首先由用户通过查询接口向医学图像数据库提出查询目标图像的查询请求;查询处理模块根据请求提取目标图像和医学图像数据库中每幅图像的72维灰度特征和48维纹理特征,将这些高维特征以向量的形式存入高维特征向量库;对描述图像内容的高维特征进行基于量子遗传优化的降维,得到32维低维特征子集;通过相似性度量将检索结果返回给用户。本发明提出了基于量子遗传优化的流形降维医学图像检索方法。在本发明中,对LLE非线性降维方法进行了改进,引入量子遗传优化局部重建权值矩阵,降低了噪声点对样本数据的影响,提高了算法收敛速度,提高了医学图像检索速度和精度。

Description

基于量子遗传优化的流形降维医学图像检索方法
(一)技术领域
本发明涉及的是一种图像的检索方法,特别是一种属于医学图像的检索方法。具体涉及一种基于量子遗传优化的流形降维医学图像检索方法。
(二)背景技术
随着医学影像设备的不断发展,临床上产生的多种模态的医学影像数据越来越多,对影像内容的描述也变得越来越丰富,产生的特征数据集的维数也随之不断增高。在基于内容的医学图像检索(Content-based Medical Image Retrieval,CBMIR)中,对医学影像内容的描述通常用特征向量的形式来表示,为了尽可能准确、全面地描述图像信息,这些特征向量往往是从图像中抽取出来的几十维甚至上百维的高维特征向量,这对数据库的组织、索引、基于距离函数的相似性度量以及检索都是很大的挑战,即所谓的维数灾难。事实上,对于某一特定的高维特征向量集合,以及它们所张成的高维空间,这些高维向量的重要程度是不同的,其间仍然存在着很大的冗余。因此,通过降维技术去除次要信息的特征向量以及相关性较强的特征向量,并保持其内在结构是CBMIR研究的关键问题之一。
流形学习是一种非线性的维数缩减方法,它的本质是将高维空间中的数据映射到一个低维的非线性子空间(即低维流形),从而实现降维。局部线性嵌入(locally linear embedding,LLE)算法是S.T.Roweis和LK.Saul.在2000年提出的一种非线性流形降维方法,其用于医学图像特征降维的基本思想是利用局部线性重建反映高维数据空间中的非线性结果,使降维后的数据保持原始空间的拓扑结构。传统局部线性嵌入--LLE算法中最核心的问题是求取使重建误差最小的近邻局部重建权值矩阵。然而,该算法是针对局部数据进行操作,而大多数的研究者都采用与欧氏距离有关的变量来定义该权值矩阵,默认距离近的点相互影响大而距离远的点间影响小,这使得该算法对样本中的噪音很敏感,此外该算法收敛速度不够快。
量子遗传算法(Quantum Genetic Algorithm,QGA)是量子计算(QuantumComputing)与遗传算法(Genetic Algorithm,GA)相结合的产物。以量子计算的概念和理论为基础,用量子位编码表征染色体,通过量子门旋转更新来完成进化搜索,能够表示出解的线性叠加态,获得更好的种群多样性、更快的收敛速度和全局寻优的能力。但到目前为止,还没有人将该算法应用于局部线性嵌入降维的优化方面。
(三)发明内容
本发明的目的在于提供一种可以降低噪声点对样本数据的影响,提高运行速度的基于量子遗传优化的流形降维医学图像检索方法。
本发明的目的是这样实现的:
1、提出查询请求:首先由用户通过查询接口向医学图像数据库提出查询目标图像的查询请求,所述的医学图像数据库是图像入库时,将各序列的关键图像统一转换为512×512大小的JPG格式图像构成医学图像数据库;
2、提取高维医学图像特征:查询处理模块根据请求提取目标图像和医学图像数据库中每幅图像的72维灰度特征和48维纹理特征,将这些高维特征以向量的形式存入高维特征向量库;
3、基于量子遗传优化的降维:对描述图像内容的高维特征进行基于量子遗传优化的降维,得到32维低维特征子集;
4、相似性度量:通过相似性度量将检索结果返回给用户。
本发明还可以包括:
1、所述的基于量子遗传优化的降维的方法为:
(1)医学图像特征向量高维空间RD中的N个D维随机向量{x1,x2,…xN},xi∈RD,通过降维把它们映射到低维空间Rd中,得到降维后的输出向量yi,i∈[1,N],d<<D;
计算每一个样本点即特征向量xi的k个最近邻点;对高维空间中的样本点xi,计算该点与其他N-1个样本点之间的距离,将距离排序,选择前k个与xi最近的点作为其邻近点;
(2)由每个样本点的近邻点计算出该样本点的局部重建权值矩阵W;用每个特征向量的近邻点对该特征向量进行重建,求取使重建误差最小的近邻局部重建权值矩阵W。
(3)保持上步求取的权值W不变,求xi在低维嵌入空间的输出特征向量yi;为了使输出数据在低维空间保持高维空间原有的拓扑结构需构造一个代价函数,映射过程中必须使代价函数值达到最小,该函数形式为:
&epsiv; ( Y ) = &Sigma; i = 1 N | | y i - &Sigma; j = 1 k w ij y ij | | 2
其中,yi是xj的输出向量,yij(j=1,2,…,k)是yi的k个近邻点;
为使低维重构误差最小化同样也要满足两个约束条件:
1)yi是一个平移不变量,即 &Sigma; i = 1 N y i = 0 ;
2)为了避免产生退化解需使 1 N &Sigma; i = 1 N y i y i T = I , 其中N是数据点的个数,I是d×d的单位矩阵;
对ε(Y)进行求解,求取的最优解yi可以使得代价函数ε(Y)达到最小值;
构造一个N×N的稀疏矩阵W,wij(i=1,2,…,N)可以存储在其中,当xj是xi的近邻点时,Wi,j=wij,否则,Wi,j=0。
此时误差代价函数式可改写为
&epsiv; ( Y ) = &Sigma; i = 1 N &Sigma; j = 1 N M i , j y i T y i = tr ( YMY T )
其中,M=(Mij)是一个N×N的对称矩阵,其表达式为:
M=(I-W)T(I-W)
利用Lagrange乘子法转化为在 1 N &Sigma; i = 1 N y i y i T = I 条件下的特征值和特征向量的问题:(M-Λ)YT=0,即Mα=λα;
要最小化代价函数,则取M的最小d个特征值对应的向量为列向量组成矩阵Y,则Y的列向量即为d维空间的降维向量表示。
2、所述的求取使重建误差最小的近邻局部重建权值矩阵的方法为:
1)初始化种群:初始化医学图像特征高维向量中包含N个个体的种群 Q ( T ) = { q 1 t , q 2 t , . . . , q N t } , 其中
Figure A200910071965D00087
为种群中第t代的第j个个体,种群中全部染色体的所有基因α、β都被初始化为
Figure A200910071965D00088
这意味着一个染色体所表达的是其全部可能状态的等概率叠加;
2)对种群中的个体进行测量:对初始种群中的个体进行一次测量以获得一组确定的解 P ( T ) = { b 1 t , b 2 t , . . . , b N t } , 其中
Figure A200910071965D00092
是第t代种群中的第j个个体的测量值,其表现形式为量子为数目即染色体长度为m的二进制字符串;其中每一位为0或1是根据量子比特的概率
Figure A200910071965D00093
Figure A200910071965D00094
(i=1,...,m)测量得到的;具体实现方法为:随机产生[0,1]上的一个数θ,若 &theta; > | &alpha; i t | 2 ,
Figure A200910071965D00096
中相应的位取值为1,否则取值为0;
3)评价二进制染色体种群P(T)并保留最优解:用适应度评价函数评价种群P(T)中每个染色体,并保留此代中的最优解;如算法获得满意解,算法停止;否则,转入步骤4)继续进行;
4)量子遗传操作:使用量子旋转门U(T)更新P(T);
5)改变进化代数:进化代数加1,如仍未满足最大进化代数Tmax,算法转至步骤2)继续进行。
3、所述的相似性度量的方法为直方图的交,
假设I和Q是两个含有N个bin的颜色直方图,则它们之间的相交距离用下式表示:
&Sigma; j = 1 N min ( I j , Q j )
直方图的相交是指两个直方图在每个bin中共有的像素数量;有时,该值还可以通过除以其中一个直方图中所有的像素数量来实现标准化,从而使其值处于[0,1]的值域范围,如下式所示:
S ( I , Q ) = &Sigma; j = 1 N min ( I j , Q j ) / &Sigma; j = 1 N Q j .
4、所述的相似性度量的方法为余弦距离法:
S(I,Q)=IT*Q/(‖I‖*‖Q‖)
其中,I和Q分别表示查询图像和数据库中图像的特征向量,‖*‖表示向量范数,计算得到的相似性度量值在[0,1]之间,该值越大,表示图像越相似。
5、所述的相似性度量的方法,对于组合特征,相似性度量定义为各个特征相似性度量的加权和,其公式为:
S ( I , Q ) = &Sigma; j = 1 m &omega; j * S j ( I , Q ) , 表示由m个特征组合而成,其中ωj表示第j个特征的权重系数,它表示第j个特征的重要性,一般取各ωj相等,又Sj(I,Q)表示第j个特征的相似性度量函数值。
本发明将量子遗传算法应用于局部线性嵌入降维的优化。
局部线性嵌入(LLE)方法
LLE算法有一个前提假设:采样数据所在的低维流形在局部是线性的,即每个采样点可以用它的近邻点线性表示。
该算法的学习目标是:在低维空间中保持每个邻域中的权值不变,即假设嵌入映射在局部是线性的条件下,最小化重构误差。
设有高维空间RD中的N个D维随机向量{x1,x2,…xN},通过降维把它们映射到低维空间Rd中,得到降维后的输出向量yi,i=1,2,…,N,d<<D。通常希望能够用显示的映射F来表示,但当{xi}是非线性结构时,求出显示映射F相当困难。基于流形学习的原理,可以将非线性结构的局部用线性结构来近似,即可以将非线性结构的降维分解为局部的线性降维。这就是LLE算法的基本原理,该算法的主要步骤如下。
(1)计算每一个样本点(特征向量)xi的k个最近邻点。对高维空间中的样本点xi,计算该点与其他N-1个样本点之间的距离,将距离排序,选择前k个与xi最近的点作为其邻近点。
(2)由每个样本点的近邻点计算出该样本点的局部重建权值矩阵W。用每个特征向量的近邻点对该特征向量进行重建,求取使重建误差最小的近邻局部重建权值矩阵。
定义重建拟合误差函数如下:
&epsiv; ( W ) = &Sigma; i = 1 N | | x i - &Sigma; j = 1 k w ij x ij | | 2
其中,xij(j=1,2,…,k)为xi的第j个近邻点,wij是xi与xij之间的权值在满足以下两个约束条件时,通过最小化误差函数得到局部重建权值矩阵,即由样本点的近邻点,构造出最优W矩阵使误差函数值达到最小。
a)每一个数据点xi都只能由它的邻近点来表示,若xi不是近邻点,则wij=0;
b)权值矩阵的每一行的和为1,即满足归一化约束 &Sigma; j = 1 k w ij = 1 .
(3)保持权值W不变,求xi在低维嵌入空间的输出特征向量yi。为了使输出数据在低维空间保持高维空间原有的拓扑结构需构造一个代价函数,映射过程中必须使代价函数值达到最小。该函数形式为:
&epsiv; ( Y ) = &Sigma; i = 1 N | | y i - &Sigma; j = 1 k w ij y ij | | 2
其中,yi是xj的输出向量,yij(j=1,2,…,k)是yi的k个近邻点。
为使低维重构误差最小化同样也要满足两个约束条件:
a)yi是一个平移不变量,即 &Sigma; i = 1 N y i = 0 ;
b)为了避免产生退化解需使 1 N &Sigma; i = 1 N y i y i T = I , 其中N是数据点的个数,I是d×d的单位矩阵。
此时,对ε(Y)进行求解,求取的最优解yi可以使得代价函数ε(Y)达到最小值。构造一个N×N的稀疏矩阵W,wij(i=1,2,…,N)可以存储在其中,当xj是xi的近邻点时,Wi,j=wij,否则,Wi,j=0。
此时误差代价函数式可改写为
&epsiv; ( Y ) = &Sigma; i = 1 N &Sigma; j = 1 N M i , j y i T y i = tr ( YMY T )
其中,M=(Mij)是一个N×N的对称矩阵,其表达式为:
M=(I-W)T(I-W)
利用Lagrange乘子法可转化为在 1 N &Sigma; i = 1 N y i y i T = I 条件下的特征值和特征向量的问题:(M-Λ)YT=0,即Mα=λα。
要最小化代价函数,则取M的最小d个特征值对应的向量为列向量组成矩阵Y,则Y的列向量即为d维空间的降维向量表示。
量子遗传智能优化算法
传统局部线性嵌入--LLE算法中最核心的问题是求取使重建误差最小的近邻局部重建权值矩阵,然而,该算法是针对局部进行操作,大多数的研究者都采用与欧氏距离有关的变量来定义该权值矩阵,默认距离近的点相互影响大而距离远的点间影响小,这使得该算法对样本中的噪音很敏感,此外该算法收敛速度不够快。量子遗传智能优化算法建立在量子态矢量表述基础上,将量子比特的几率幅表示应用于染色体的编码,使得一条染色体可以表达多个态的叠加,并利用量子旋转门实现染色体的更新操作,从而实现了目标的优化求解。所以,本发明利用量子遗传算法从数据间的本征特性出发,寻找使医学图像特征向量降维重建误差最小的权重值,从而达到符合使误差函数最小的目的。
本发明将LLE算法中样本点与其临近点的重建权值集合构造为量子遗传算法的量子染色体,然后量子遗传中的个体在寻优的过程中找到最优位置,最终得到近邻局部重建权值矩阵。
(1)量子比特编码
在量子遗传算法中,染色体用量子比特来表示,或者说是用随机概率方式表示。量子比特是一个双态量子系统,与经典位的不同之处在于,一个量子比特除了处于量子位的两个基本态0态或1态外,还可以同时处在0,1两个本征态的迭加状态,一个量子比特状态可以表示为:
|Ψ>=α|0>+β|1>
其中,α和β表示相应态出现的概率幅。对量子比特测量时得到0的概率为|α|2,得到1的概率为|β|2。二者满足归一化条件|α|2+|β|2=1。所以,在QGA中,l个量子比特的概率幅可表示为:
q i t = ( &alpha; 1 &beta; 1 &alpha; 2 &beta; 2 &CenterDot; &CenterDot; &CenterDot; &alpha; l &beta; l )
则m个l位基因构成的一个染色体可以表示为::
q i t = ( &alpha; 11 &beta; 11 &alpha; 12 &beta; 12 &CenterDot; &CenterDot; &CenterDot; &alpha; 2 k &beta; lk &alpha; 21 &beta; 21 &alpha; 22 &beta; 22 &CenterDot; &CenterDot; &CenterDot; &alpha; 2 l &beta; 2 l &CenterDot; &CenterDot; &CenterDot; &alpha; m 1 &beta; m 1 &alpha; m 2 &beta; m 2 &CenterDot; &CenterDot; &CenterDot; &alpha; ml &beta; ml )
其中,i表示此染色体的编号,t表示此染色体当前进化的代数,m表示染色体基因的个数,l表示基因里量子比特的个数。因此,如果存在一个具有m个量子比特位的系统,则该系统能同时表达2m个状态。
(2)量子旋转门
在量子遗传算法中,遗传操作主要是将构造的量子门U(T)作用于量子叠加态或纠缠的基态,使其相互干涉,相位发生改变,从而改变各基态的概率幅。在本发明中,量子门主要采用量子旋转门,通过量子旋转门可以实现染色体的调整,其调整操作如下:
&alpha; i &prime; &beta; i &prime; = cos &theta; i - sin &theta; i sin &theta; i cos &theta; i &alpha; i &beta; i
式中(αi,βi)为第i个量子比特,θi为旋转角,其幅度影响收敛速度,但是如果其幅度太大,会导致早熟,因此,θi的大小和方向本文根据通用的、与问题无关的调整策略确定。
(3)适应度评价函数
适应度评价函数是衡量个体优劣的标志,其作用类似于度量自然界中生物适应环境的能力。本发明根据医学图像特征向量作为个体模型的特殊性,所采用的适应度评价函数为:
f ( W ) = &Sigma; i = 1 N | | x i - &Sigma; j = 1 k w ij x ij | | 2
式中,wij表示种群中第i代的第j个个体,N表示种群中个体的数量。
本发明对医学图像检索中高维特征向量的降维情况进行了研究,采用基于量子遗传优化的流形降维方法实现了医学图像的有效检索。
量子遗传算法比传统遗传算法拥有更好的种群多样性和更少的种群规模,并且,由于其采用量子比特编码也可以获得较好的收敛性。因而,本发明利用量子遗传算法从数据间的本征特性出发,寻找在医学图像特征向量降维中使重建误差最小的权重值,从而使得医学图像检索在保证精度的条件下达到较快的检索速度。
为了更好的发现医学图像检索中基于流形的非线性降维方法的本征维数,并寻找使误差函数最小的权值矩阵,本发明提出了基于量子遗传优化的流形降维医学图像检索方法。在本发明中,对LLE非线性降维方法进行了改进,引入量子遗传优化局部重建权值矩阵,降低了噪声点对样本数据的影响,提高了算法收敛速度,提高了医学图像检索速度和精度。
(四)附图说明
图1.量子遗传优化算法流程图;
图2.医学图像检索系统原理图。
(五)具体实施方式
下面结合附图举例对本发明做更详细地描述:
本发明针对不同解剖部位及各类不同疾病的多模态医学影像进行检索研究,选取2种模态(CT与MR),3种解剖部位(脑、胸、腹),6种疾病(血肿、垂体瘤、乳腺癌、肺癌、胰腺癌、膀胱癌)共约800个病例的影像资信与正常或其他非正常资料共约1000例来构成研究数据库。图像入库时,各序列的关键图像统一转换为512×512大小的JPG格式图像。首先由用户通过查询接口提出查询请求(目标图像),查询处理模块根据请求提取目标图像和图像数据库中每幅图像的72维灰度特征和48维纹理特征,这些高维特征以向量的形式存入高维特征向量库;然后,对描述图像内容的高维特征进行基于量子遗传优化的降维,得到32维低维特征子集;通过相似性度量将检索结果返回给用户。系统结构框图如图2所示,具体实施方法如下:
1.提取高维医学图像特征
对医学图像进行检索,首先要自动抽取图像特征,建立特征索引库。灰度特征相对几何体特征而言,具有一定的稳定性,对大小,方向都不敏感,表现出相当强的鲁棒性,因此是医学图像检索最常用的特征之一。由于人体各器官组织的纹理结构具有一定的区别,并且,同一器官组织的纹结构相当明显,因此,对医学图像进行检索也常选取纹理特征。
本发明提取医学图像的灰度和纹理特征,其中,提取的HSV颜色(灰度)特征为72维,Gabor纹理特征为48维,因此检索的联合特征向量为72+48=120维。
2.基于量子遗传优化的特征向量的流形降维
(1)设医学图像特征向量高维空间RD中的N个D维随机向量{x1,x2,…xN},xi∈RD,通过降维把它们映射到低维空间Rd中,得到降维后的输出向量yi,i∈[1,N],d<<D。
计算每一个样本点(特征向量)xi的k个最近邻点。对高维空间中的样本点xi,计算该点与其他N-1个样本点之间的距离,将距离排序,选择前k个与xi最近的点作为其邻近点。
(2)由每个样本点的近邻点计算出该样本点的局部重建权值矩阵W。用每个特征向量的近邻点对该特征向量进行重建,求取使重建误差最小的近邻局部重建权值矩阵。
定义重建拟合误差函数如下:
&epsiv; ( W ) = &Sigma; i = 1 N | | x i - &Sigma; j = 1 k w ij x i j | | 2
其中,xij(j=1,2,…,k)为xi的j个近邻点,wij是xi与xij之间的权值。
在满足以下两个约束条件时,通过最小化误差函数得到局部重建权值矩阵,即由样本点的近邻点,构造出最优W矩阵使误差函数值达到最小。
1)每一个数据点xi都只能由它的邻近点来表示,若xi不是近邻点,则wij=0;
2)权值矩阵的每一行的和为1,即满足归一化约束 &Sigma; j = 1 k w i j = 1 .
在求取最优W矩阵的过程中本发明将LLE算法中样本点与其临近点的重建权值向量集合构造为量子遗传算法的量子染色体,然后量子遗传中的个体在寻优的过程中找到最优位置,最终得到近邻局部重建权值矩阵。
1)初始化种群:初始化医学图像特征高维向量中包含N个个体的种群 Q ( T ) = { q 1 t , q 2 t , . . . , q N t } , 其中
Figure A200910071965D00154
为种群中第t代的第j个个体。种群中全部染色体的所有基因α、β都被初始化为
Figure A200910071965D00155
这意味着一个染色体所表达的是其全部可能状态的等概率叠加。
2)对种群中的个体进行测量:对初始种群中的个体进行一次测量以获得一组确定的解 P ( T ) = { b 1 t , b 2 t , . . . , b N t } , 其中
Figure A200910071965D00157
是第t代种群中的第j个个体的测量值,其表现形式为量子为数目即染色体长度为m的二进制字符串。其中每一位为0或1是根据量子比特的概率
Figure A200910071965D00158
Figure A200910071965D00159
(i=1,...,m)测量得到的。具体实现方法为:随机产生[0,1]上的一个数θ,若 &theta; > | &alpha; i t | 2 ,
Figure A200910071965D001511
中相应的位取值为1,否则取值为0;
3)评价二进制染色体种群P(T)并保留最优解:用适应度评价函数评价种群P(T)中每个染色体,并保留此代中的最优解。如算法获得满意解,算法停止;否则,转入步骤4)继续进行;
4)量子遗传操作:使用量子旋转门U(T)更新P(T);
5)改变进化代数:进化代数加1,如仍未满足最大进化代数Tmax,算法转至步骤2)继续进行。
按照以上步骤即可求取最优近邻局部重建权值矩阵W。
(3)保持上步求取的权值W不变,求xi在低维嵌入空间的输出特征向量yi。为了使输出数据在低维空间保持高维空间原有的拓扑结构需构造一个代价函数,映射过程中必须使代价函数值达到最小。该函数形式为:
&epsiv; ( Y ) = &Sigma; i = 1 N | | y i - &Sigma; j = 1 k w ij y ij | | 2
其中,yi是xj的输出向量,yij(j=1,2,…,k)是yi的k个近邻点。
为使低维重构误差最小化同样也要满足两个约束条件:
1)yi是一个平移不变量,即 &Sigma; i = 1 N y i = 0 ;
2)为了避免产生退化解需使 1 N &Sigma; i = 1 N y i y i T = I , 其中N是数据点的个数,I是d×d的单位矩阵。
此时,对ε(Y)进行求解,求取的最优解yi可以使得代价函数ε(Y)达到最小值。构造一个N×N的稀疏矩阵W,wij(i=1,2,…,N)可以存储在其中,当xj是xi的近邻点时,Wi,j=wij,否则,Wi,j=0。
此时误差代价函数式可改写为
&epsiv; ( Y ) = &Sigma; i = 1 N &Sigma; j = 1 N M i , j y i T y i = tr ( YMY T )
其中,M=(Mij)是一个N×N的对称矩阵,其表达式为:
M=(I-W)T(I-W)
利用Lagrange乘子法可转化为在 1 N &Sigma; i = 1 N y i y i T = I 条件下的特征值和特征向量的问题:(M-Λ)YT=0,即Mα=λα。
要最小化代价函数,则取M的最小d个特征值对应的向量为列向量组成矩阵Y,则Y的列向量即为d维空间的降维向量表示。
3.相似性度量
对医学图像数据库中的图像和待检索图像进行特征向量降维后就可以用该低维特征向量来表征对应的图像,然后需要对待检索图像和数据库中图像进行相似度测量,本发明采用如下相似测度方法:
(1)直方图的交
假设I和Q是两个含有N个bin的颜色直方图,则它们之间的相交距离用下式表示:
&Sigma; j = 1 N min ( I j , Q j )
直方图的相交是指两个直方图在每个bin中共有的像素数量。有时,该值还可以通过除以其中一个直方图中所有的像素数量来实现标准化,从而使其值处于[0,1]的值域范围,如下式所示:
S ( I , Q ) = &Sigma; j = 1 N min ( I j , Q j ) / &Sigma; j = 1 N Q j .
(2)余弦距离法:
S(I,Q)=IT*Q/(‖I‖*‖Q‖)
其中,I和Q分别表示查询图像和数据库中图像的特征向量,‖*‖表示向量范数。计算得到的相似性度量值在[0,1]之间,该值越大,表示图像越相似。
对于组合特征,相似性度量定义为各个特征相似性度量的加权和。其公式为:
S ( I , Q ) = &Sigma; j = 1 m &omega; j * S j ( I , Q ) ,
表示由m个特征组合而成,其中ωj表示第j个
特征的权重系数,它表示第j个特征的重要性,一般取各ωj相等。又Sj(I,Q)表示第j个特征的相似性度量函数值。
4.算法的性能评价
本发明采用MPEG-7推荐的检索性能评价公式来评价本系统的检索性能,设PN为返回的前N个结果中的正确率,又设R为某一具有特定语义含义的图像集合。现给出示例图像qi,(i=1,2,…,M),M为测试系统检索性能而预先设定的示例图像个数,存在qi∈R,在对qi的一次检索中系统返回的前N个结果为pj,j=1,2,…,N,那么正确率pN(qi)定义如下式所示:
p N ( q i ) = &Sigma; j = 1 N &Psi; ( p j , R ) N
其中, &Psi; ( x , Y ) = 1 , if ( x &Element; Y ) 0 , if ( x &NotElement; Y )
前N个结果的查全率RN(qi)可以用下式表示:
R N ( q i ) = &Sigma; j = 1 N &psi; ( p j , R ) | | R | | ,
其中,‖R‖表示图像集R所含的图像数。
查准率和查全率越高,表明该检索系统的效果越好。一般地,查准率和查全率是一对矛盾体,当要求精度较高时,查全率较低,反之亦然。因此,一般的检索系统只要求在这两者之间达到一个最优的平衡点,就认为达到了较好的检索性能。

Claims (6)

1、一种基于量子遗传优化的流形降维医学图像检索方法,其特征是:
(1)提出查询请求:首先由用户通过查询接口向医学图像数据库提出查询目标图像的查询请求,所述的医学图像数据库是图像入库时,将各序列的关键图像统一转换为512×512大小的JPG格式图像构成医学图像数据库;
(2)提取高维医学图像特征:查询处理模块根据请求提取目标图像和医学图像数据库中每幅图像的72维灰度特征和48维纹理特征,将这些高维特征以向量的形式存入高维特征向量库;
(3)基于量子遗传优化的降维:对描述图像内容的高维特征进行基于量子遗传优化的降维,得到32维低维特征子集;
(4)相似性度量:通过相似性度量将检索结果返回给用户。
2、根据权利要求1所述的基于量子遗传优化的流形降维医学图像检索方法,其特征是:所述的基于量子遗传优化的降维的方法为:
(1)医学图像特征向量高维空间RD中的N个D维随机向量{x1,x2,…xN},xi∈RD,通过降维把它们映射到低维空间Rd中,得到降维后的输出向量yi,i∈[1,N],d<<D;
计算每一个样本点即特征向量xi的k个最近邻点;对高维空间中的样本点xi,计算该点与其他N-1个样本点之间的距离,将距离排序,选择前k个与xi最近的点作为其邻近点;
(2)由每个样本点的近邻点计算出该样本点的局部重建权值矩阵W;用每个特征向量的近邻点对该特征向量进行重建,求取使重建误差最小的近邻局部重建权值矩阵W;
(3)保持上步求取的权值W不变,求xi在低维嵌入空间的输出特征向量yi;为了使输出数据在低维空间保持高维空间原有的拓扑结构需构造一个代价函数,映射过程中必须使代价函数值达到最小,该函数形式为:
&epsiv; ( Y ) = &Sigma; i = 1 N | | y i - &Sigma; j = 1 k w ij y ij | | 2
其中,yi是xj的输出向量,yij(j=1,2,…,k)是yi的k个近邻点;
为使低维重构误差最小化同样也要满足两个约束条件:
1)yi是一个平移不变量,即 &Sigma; i = 1 N y i = 0 ;
2)为了避免产生退化解需使 1 N &Sigma; i = 1 N y i y i T = I , 其中N是数据点的个数,I是d×d的单位矩阵;
对ε(Y)进行求解,求取的最优解yi可以使得代价函数ε(Y)达到最小值;
构造一个N×N的稀疏矩阵W,wij(i=1,2,…,N)可以存储在其中,当xj是xi的近邻点时,Wi,j=wij,否则,Wi,j=0;
此时误差代价函数式可改写为
&epsiv; ( Y ) = &Sigma; i = 1 N &Sigma; j = 1 N M i , j y i T y i = tr ( YMY T )
其中,M=(Mij)是一个N×N的对称矩阵,其表达式为:
M=(I-W)T(I-W)
利用Lagrange乘子法转化为在 1 N &Sigma; i = 1 N y i y i T = I 条件下的特征值和特征向量的问题:(M-Λ)YT=0,即Mα=λα;
要最小化代价函数,则取M的最小d个特征值对应的向量为列向量组成矩阵Y,则Y的列向量即为d维空间的降维向量表示。
3、根据权利要求2所述的基于量子遗传优化的流形降维医学图像检索方法,其特征是:所述的求取使重建误差最小的近邻局部重建权值矩阵的方法为:
1)初始化种群:初始化医学图像特征高维向量中包含N个个体的种群 Q ( T ) = { q 1 t , q 2 t , . . . , q N t } , 其中 q j t ( j = 1,2 , &CenterDot; &CenterDot; &CenterDot; N ) 为种群中第t代的第j个个体,种群中全部染色体的所有基因α、β都被初始化为
Figure A200910071965C00037
这意味着一个染色体所表达的是其全部可能状态的等概率叠加;
2)对种群中的个体进行测量:对初始种群中的个体进行一次测量以获得一组确定的解 P ( T ) = { b 1 t , b 2 t , . . . , b N t } , 其中 b j t ( j = 1 , . . . , N ) 是第t代种群中的第j个个体的测量值,其表现形式为量子为数目即染色体长度为m的二进制字符串;其中每一位为0或1是根据量子比特的概率
Figure A200910071965C00041
Figure A200910071965C00042
(i=1,...,m)测量得到的;具体实现方法为:随机产生[0,1]上的一个数θ,若 &theta; > | &alpha; i t | 2 , 中相应的位取值为1,否则取值为0;
3)评价二进制染色体种群P(T)并保留最优解:用适应度评价函数评价种群P(T)中每个染色体,并保留此代中的最优解;如算法获得满意解,算法停止;否则,转入步骤4)继续进行;
4)量子遗传操作:使用量子旋转门U(T)更新P(T);
5)改变进化代数:进化代数加1,如仍未满足最大进化代数Tmax,算法转至步骤2)继续进行。
4、根据权利要求3所述的基于量子遗传优化的流形降维医学图像检索方法,其特征是:所述的相似性度量的方法为直方图的交,
I和Q是两个含有N个bin的颜色直方图,它们之间的相交距离用下式表示:
&Sigma; j = 1 N min ( I j , Q j )
直方图的相交是指两个直方图在每个bin中共有的像素数量;有时,该值还可以通过除以其中一个直方图中所有的像素数量来实现标准化,从而使其值处于[0,1]的值域范围,如下式所示:
S ( I , Q ) = &Sigma; j = 1 N min ( I j , Q j ) / &Sigma; j = 1 N Q j .
5、根据权利要求3所述的基于量子遗传优化的流形降维医学图像检索方法,其特征是:所述的相似性度量的方法为余弦距离法:
S(I,Q)=IT*Q/(‖I‖*‖Q‖)
其中,I和Q分别表示查询图像和数据库中图像的特征向量,‖*‖表示向量范数,计算得到的相似性度量值在[0,1]之间,该值越大,表示图像越相似。
6、根据权利要求3所述的基于量子遗传优化的流形降维医学图像检索方法,其特征是:所述的相似性度量的方法,对于组合特征,相似性度量定义为各个特征相似性度量的加权和,其公式为:
S ( I , Q ) = &Sigma; j = 1 m &omega; j * S j ( I , Q ) , 表示由m个特征组合而成,其中ωj表示第j个特征的权重系数,它表示第j个特征的重要性,一般取各ωj相等,又Sj(I,Q)表示第j个特征的相似性度量函数值。
CN2009100719659A 2009-05-07 2009-05-07 基于量子遗传优化的流形降维医学图像检索方法 Expired - Fee Related CN101546332B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100719659A CN101546332B (zh) 2009-05-07 2009-05-07 基于量子遗传优化的流形降维医学图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100719659A CN101546332B (zh) 2009-05-07 2009-05-07 基于量子遗传优化的流形降维医学图像检索方法

Publications (2)

Publication Number Publication Date
CN101546332A true CN101546332A (zh) 2009-09-30
CN101546332B CN101546332B (zh) 2010-12-01

Family

ID=41193470

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100719659A Expired - Fee Related CN101546332B (zh) 2009-05-07 2009-05-07 基于量子遗传优化的流形降维医学图像检索方法

Country Status (1)

Country Link
CN (1) CN101546332B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894130A (zh) * 2010-06-08 2010-11-24 浙江大学 基于稀疏降维的谱哈希索引方法
CN102495886A (zh) * 2011-11-28 2012-06-13 河南理工大学 基于量子算法的指纹数据库搜索方法
CN103365921A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 基于简笔画搜索对象的方法和设备
CN103440292A (zh) * 2013-08-16 2013-12-11 新浪网技术(中国)有限公司 基于比特向量的多媒体信息检索方法和系统
CN104102647A (zh) * 2013-04-07 2014-10-15 南京邮电大学 基于无参数量子论的图像检索方法
CN104318046A (zh) * 2014-08-18 2015-01-28 南京大学 增量式的高维数据转换为低维数据的系统及方法
CN104317792A (zh) * 2014-08-18 2015-01-28 南京大学 采集的高维数据转换为低维数据的系统及方法
CN104346520A (zh) * 2014-07-28 2015-02-11 南京大学 一种基于神经元网络的数据降维系统及其降维方法
CN105069760A (zh) * 2015-08-28 2015-11-18 哈尔滨工程大学 一种基于f型双链量子遗传算法的小波阈值图像去噪方法
CN105447001A (zh) * 2014-08-04 2016-03-30 华为技术有限公司 高维数据降维方法及装置
CN106354979A (zh) * 2016-10-08 2017-01-25 西安电子科技大学 一种基于量子遗传算法的雷达海杂波反演蒸发波导的方法
CN114202117A (zh) * 2021-12-07 2022-03-18 北京量子信息科学研究院 数据处理方法、装置、计算机设备和存储介质

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894130A (zh) * 2010-06-08 2010-11-24 浙江大学 基于稀疏降维的谱哈希索引方法
CN101894130B (zh) * 2010-06-08 2011-12-21 浙江大学 基于稀疏降维的谱哈希索引方法
CN102495886A (zh) * 2011-11-28 2012-06-13 河南理工大学 基于量子算法的指纹数据库搜索方法
CN103365921A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 基于简笔画搜索对象的方法和设备
CN104102647A (zh) * 2013-04-07 2014-10-15 南京邮电大学 基于无参数量子论的图像检索方法
CN103440292A (zh) * 2013-08-16 2013-12-11 新浪网技术(中国)有限公司 基于比特向量的多媒体信息检索方法和系统
CN103440292B (zh) * 2013-08-16 2016-12-28 新浪网技术(中国)有限公司 基于比特向量的多媒体信息检索方法和系统
CN104346520A (zh) * 2014-07-28 2015-02-11 南京大学 一种基于神经元网络的数据降维系统及其降维方法
CN104346520B (zh) * 2014-07-28 2017-10-13 南京大学 一种基于神经元网络的数据降维系统及其降维方法
CN105447001A (zh) * 2014-08-04 2016-03-30 华为技术有限公司 高维数据降维方法及装置
CN105447001B (zh) * 2014-08-04 2018-12-14 华为技术有限公司 高维数据降维方法及装置
CN104317792A (zh) * 2014-08-18 2015-01-28 南京大学 采集的高维数据转换为低维数据的系统及方法
CN104318046A (zh) * 2014-08-18 2015-01-28 南京大学 增量式的高维数据转换为低维数据的系统及方法
CN104317792B (zh) * 2014-08-18 2017-12-01 南京大学 采集的高维数据转换为低维数据的系统及方法
CN105069760A (zh) * 2015-08-28 2015-11-18 哈尔滨工程大学 一种基于f型双链量子遗传算法的小波阈值图像去噪方法
CN106354979A (zh) * 2016-10-08 2017-01-25 西安电子科技大学 一种基于量子遗传算法的雷达海杂波反演蒸发波导的方法
CN114202117A (zh) * 2021-12-07 2022-03-18 北京量子信息科学研究院 数据处理方法、装置、计算机设备和存储介质
CN114202117B (zh) * 2021-12-07 2022-06-28 北京量子信息科学研究院 数据处理方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN101546332B (zh) 2010-12-01

Similar Documents

Publication Publication Date Title
CN101546332B (zh) 基于量子遗传优化的流形降维医学图像检索方法
Zheng et al. Feature extraction from histopathological images based on nucleus-guided convolutional neural network for breast lesion classification
Zhao et al. Characterizing forest canopy structure with lidar composite metrics and machine learning
CN109375186B (zh) 基于深度残差多尺度一维卷积神经网络的雷达目标识别方法
dos Santos et al. A relevance feedback method based on genetic programming for classification of remote sensing images
CN100419783C (zh) 一种遥感图像空间形状特征提取与分类方法
Sun et al. UL-Isomap based nonlinear dimensionality reduction for hyperspectral imagery classification
CN107220373B (zh) 一种基于医学征象和卷积神经网络的肺结节ct图像哈希检索方法
CN107122809A (zh) 基于图像自编码的神经网络特征学习方法
CN107292341B (zh) 基于成对协同正则化和nmf的自适应多视图聚类方法
Pan et al. A variable precision rough set approach to the remote sensing land use/cover classification
Comber et al. Community detection in spatial networks: Inferring land use from a planar graph of land cover objects
Zheng et al. Encoding histopathological wsis using gnn for scalable diagnostically relevant regions retrieval
Zhao et al. Life-long learning with continual spectral-spatial feature distillation for hyperspectral image classification
CN111326236A (zh) 一种医疗图像自动处理系统
Tolias et al. Towards large-scale geometry indexing by feature selection
Mishra et al. Medical image retrieval using self-organising map on texture features
CN109284414A (zh) 基于语义保持的跨模态内容检索方法和系统
Ferdous et al. LCDEiT: A linear complexity data-efficient image transformer for MRI brain tumor classification
Taghizadeh-Mehrjardi et al. Semi-supervised learning for the spatial extrapolation of soil information
Zhong et al. Fuzzy nonlinear proximal support vector machine for land extraction based on remote sensing image
Mukherjee et al. A bag of constrained informative deep visual words for image retrieval
Vani et al. Improved data clustering methods and integrated A-FP algorithm for crop yield prediction
Yu et al. Visual query processing for efficient image retrieval using a SOM-based filter-refinement scheme
Wu et al. Prior knowledge-based automatic object-oriented hierarchical classification for updating detailed land cover maps

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101201

Termination date: 20170507