CN103678504B - 基于相似度的乳腺图像的匹配图像检索方法及检索系统 - Google Patents
基于相似度的乳腺图像的匹配图像检索方法及检索系统 Download PDFInfo
- Publication number
- CN103678504B CN103678504B CN201310590294.3A CN201310590294A CN103678504B CN 103678504 B CN103678504 B CN 103678504B CN 201310590294 A CN201310590294 A CN 201310590294A CN 103678504 B CN103678504 B CN 103678504B
- Authority
- CN
- China
- Prior art keywords
- image
- hog
- feature
- node
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 210000000481 breast Anatomy 0.000 title claims abstract description 41
- 210000005075 mammary gland Anatomy 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000007306 turnover Effects 0.000 claims description 4
- 235000012571 Ficus glomerata Nutrition 0.000 abstract 2
- 244000153665 Ficus glomerata Species 0.000 abstract 2
- 230000006870 function Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 206010006272 Breast mass Diseases 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 208000030270 breast disease Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 206010048782 Breast calcifications Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002308 calcification Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000009607 mammography Methods 0.000 description 1
- ODOJGYBXTZYZCP-UHFFFAOYSA-N molybdenum palladium Chemical compound [Mo].[Pd].[Pd].[Pd] ODOJGYBXTZYZCP-UHFFFAOYSA-N 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了提供一种基于相似度的乳腺图像的匹配图像检索方法及检索系统,基于相似度的乳腺图像的匹配图像检索方法包括如下步骤:建立图像特征库;建立分层聚类树;提取待检索图像的特征;查找与带检索图像相似的图像并输出。本发明的系统包括图像特征库建立模块、分层聚类树建立模块、待检索图像的特征提取模块和相似图像查找模块。本发明的方法和系统能够实时将需要检索的乳腺X线片的图像输入检索数据库,然后对输入图像进行分析,将检索数据库中的图像按照与输入图像的相似度进行排序输出。本发明的检索速度快且检索结果准确。
Description
技术领域
本发明属于数字图像检索技术领域,具体涉及一种基于相似度的乳腺图像的匹配图像检索方法及检索系统。
背景技术
乳腺疾病是严重危害女性健康的一种疾病,目前乳腺癌已经占到女性新发恶性病的30%左右,排名女性恶性肿瘤发病率的第一位。乳腺X线照相术(Mammography)通过专门的钼钯X线机对乳房进行拍照形成乳腺X线片,目前使用乳腺X线片作为基础数据进行乳腺疾病的研究已经在发达国家成为使用最普遍的方式。乳腺癌X线片中病灶表示形式常见的有较规则或类圆形肿块、不规则或模糊肿块、毛刺肿块、透亮环肿块四类。计算机视觉领域的目标检测技术和人工智能领域的机器学习技术能够非常直观的应用在乳腺肿块的检测中,该技术通过对肿块区域和非肿块区域的训练学习,从乳腺X射线片中检测到疑似肿块区域。但由于目前机器学习技术和目标检测技术还不够不成熟,尤其是“语义鸿沟(SemanticGap)”问题还没有得到根本解决,现有的应用上述技术进行乳腺肿块区域自动检测的方法存在将肿块区域漏掉或者肿块部位不准确等问题。
发明内容
针对上述现有技术中存在的缺陷或不足,本发明的一个目的在于,提供一种基于相似度的乳腺图像的匹配图像检索方法,该方法实时将需要检索的乳腺X线片的图像输入检索数据库,然后对输入图像进行分析,将检索数据库中的图像按照与输入图像的相似度进行排序输出。该方法能够实时、快速、准确地输出与输入图像的相似度最高的若干幅图像,从而为医生在结合检查报告后进行实时分析乳腺肿块或钙化提供更多的参考依据。
为了实现上述目的,本发明采用如下的技术方案予以解决:
一种基于相似度的乳腺图像的匹配图像检索方法,包括如下步骤:
步骤1:建立图像特征库;具体步骤为:遍历图像库中保存的乳腺图像,利用SIFT算法对每幅乳腺图像提取SIFT特征块,并将每个符合规定尺度的SIFT特征块以特征块中心为定点旋转,直至其主方向与水平方向垂直,并利用HOG算法分别提取这些特征块的HOG特征;然后将每个旋转后的SIFT特征块进行水平翻转,并利用HOG算法分别提取这些水平翻转后的特征块的HOG特征;将旋转后以及水平翻转后得到的每幅乳腺图像的图像号、该图像的HOG特征数以及该图像的HOG特征对应保存到图像特征库;
步骤2:建立分层聚类树;具体步骤如下:
步骤201:从图像特征库中读取所有的HOG特征并将它们保存到分层聚类树的根节点;令根节点为当前节点;
步骤202:在当前节点上保存所有的HOG特征中随机选取来自于不同图像的K个HOG特征作为初始聚类中心,使用K-Means算法将当前节点上保存的所有HOG特征分成K个类;同时,令当前节点产生K个子节点,将生成的K个类中的HOG特征以及每个类的聚类中心对应存储到当前节点的K个子节点上;
步骤203:判断分层聚类树的层数是否小于阈值depth,是则将步骤202产生的K个子节点依次作为当前节点,分别执行步骤202;否则结束;
步骤3:提取待检索图像的特征;具体步骤如下:
对一幅待检索图像,利用SIFT算法提取其SIFT特征块并选出符合规定尺度的SIFT特征块,将每个选出的SIFT特征块以特征块的中心为定点旋转,直至其主方向与水平方向垂直,并提取其HOG特征;再对该旋转后的SIFT特征块做水平翻转后提取HOG特征;
步骤4:查找与带检索图像相似的图像并输出;具体步骤如下:
步骤401:遍历待检索图像的所有HOG特征,将待检索图像的每个HOG特征作为当前特征,选出分层聚类树上与当前特征对应的一个叶子节点;
步骤402:对于待检测图像的每个HOG特征,利用kNN算法计算得到与每个HOG特征对应的叶子节点中存储的HOG特征中与该HOG特征最近的k个特征,该k个HOG特征组成该HOG特征的匹配特征集;
步骤403:统计待检测图像的所有HOG特征的匹配特征集中,所有HOG特征来自的乳腺图像的图像号出现的次数,并将每个乳腺图像的图像号出现的次数按照降序排序,取前k个对应的乳腺图像作为与待检测图像相似度高的乳腺图像输出。
进一步的,所述步骤1中的所述符合规定尺度的SIFT特征块是指大小不小于32×32像素的SIFT特征块。
进一步的,所述步骤202中的当前节点产生子节点的个数K=3。
进一步的,所述步骤203中的分层聚类树的层数的阈值depth=4。
进一步的,所述步骤401中选出分层聚类树上与当前特征对应的一个叶子节点的具体步骤如下:
1)将分层聚类树的根节点作为当前节点;
2)计算当前HOG特征与当前节点的K个子节点聚类中心的距离(本发明中采用欧式距离),选出距离最近的节点;判断该选出的节点是否是叶子节点,是则结束;否则将该选出的节点作为当前节点,执行2)。
本发明的另一个目的在于,提供一种基于相似度的乳腺图像的匹配图像检索系统,该系统能够实现计算机实时批量检索,将需要检索的乳腺X线片的图像输入检索数据库,然后对输入图像进行分析,将检索数据库中的图像按照与输入图像的相似度进行排序输出。
为了实现上述目的,本发明采用如下的技术方案予以解决:
一种基于相似度的乳腺图像的匹配图像检索系统,具体包括如下模块:
1)图像特征库建立模块,该模块用于遍历图像库中保存的乳腺图像,利用SIFT算法对每幅乳腺图像提取SIFT特征块,并将每个符合规定尺度的SIFT特征块以特征块中心为定点旋转,直至其主方向与水平方向垂直,并利用HOG算法分别提取这些特征块的HOG特征;然后将每个旋转后的SIFT特征块进行水平翻转,并利用HOG算法分别提取这些水平翻转后的特征块的HOG特征;将旋转后以及水平翻转后得到的每幅乳腺图像的图像号、该图像的HOG特征数以及该图像的HOG特征对应保存到图像特征库;
2)分层聚类树建立模块,该模块包括以下相连接的子模块:
子模块201:从图像特征库中读取所有的HOG特征并将它们保存到分层聚类树的根节点;令根节点为当前节点;
子模块202:在当前节点上保存所有的HOG特征中随机选取来自于不同图像的K个HOG特征作为初始聚类中心,使用K-Means算法将当前节点上保存的所有HOG特征分成K个类;同时,令当前节点产生K个子节点,将生成的K个类中的HOG特征以及每个类的聚类中心对应存储到当前节点的K个子节点上;
子模块203:判断分层聚类树的层数是否小于阈值depth,是则将子模块202产生的K个子节点依次作为当前节点,分别执行子模块202;否则结束;
3)待检索图像的特征提取模块,该模块用于:
对一幅待检索图像,利用SIFT算法提取其SIFT特征块并选出符合规定尺度的SIFT特征块,将每个选出的SIFT特征块以特征块的中心为定点旋转,直至其主方向与水平方向垂直,并提取其HOG特征;再对该旋转后的SIFT特征块做水平翻转后提取HOG特征;
4)相似图像查找模块,该模块包括如下依次相连接的子模块:
子模块401:遍历待检索图像的所有HOG特征,将待检索图像的每个HOG特征作为当前特征,选出分层聚类树上与当前特征对应的一个叶子节点;
子模块402:对于待检测图像的每个HOG特征,利用kNN算法计算得到与每个HOG特征对应的叶子节点中存储的HOG特征中与该HOG特征最近的k个特征,该k个HOG特征组成该HOG特征的匹配特征集;
子模块403:统计待检测图像的所有HOG特征的匹配特征集中,所有HOG特征来自的乳腺图像的图像号出现的次数,并将每个乳腺图像的图像号出现的次数按照降序排序,取前k个对应的乳腺图像作为与待检测图像相似度高的乳腺图像输出。
进一步的,所述图像特征库建立模块中的所述符合规定尺度的SIFT特征块是指大小不小于32×32像素的SIFT特征块。
进一步的,所述子模块202中的当前节点产生子节点的个数K=3。
进一步的,所述子模块203中的分层聚类树的层数的阈值depth=4。
进一步的,所述子模块401中选出分层聚类树上与当前特征对应的一个叶子节点的子模块用于:
1)将分层聚类树的根节点作为当前节点;
2)计算当前HOG特征与当前节点的K个子节点聚类中心的距离(本发明中采用欧式距离),选出距离最近的节点;判断该选出的节点是否是叶子节点,是则结束;否则将该选出的节点作为当前节点,执行2)。
与现有技术相比,本发明的优点如下:
1、从图像中提取特征块时按照特定规则选取特征块,删除了信息量少的特征块,减少了容量存储。
2、针对乳腺图像的特殊性,即一对乳腺左右部分相似的性质,为了检索出一对乳腺的左右部分,对特征块做了水平翻转之后提取特征,丰富了特征库的信息。
3、为了加快检索的速度,采用了分层聚类树来建立特征树,保证检索的运算复杂度在“对数”级别,大大提高了检索效率。
附图说明
图1是本发明的检索方法的总体流程图。
图2是本发明的检索方法的步骤1建立图像特征库的流程图。
图3是本发明的检索方法的步骤2建立分层聚类树流程图。
图4是分层聚类算法的流程图。
图5是本发明的检索方法的步骤3提取检索图像特征流程图。
图6是本发明的检索方法的步骤4查找并输出相似图像的流程图。
图7是本发明的基于相似度的乳腺图像的匹配图像检索系统的结构图。
图8是本发明的实施例的执行过程中的结果。其中,图8(a)实施例中的一张待检索图片,图8(b)为步骤3中使用SIFT算法提取的所有SIFT特征块,图8(c)为去除冗余SIFT特征块之后的剩余的SIFT特征块,图8(d)为待检索图像中一部分完成旋转之后的SIFT特征块。图8(e)为系统输出的最终检索结果。
以下结合附图和具体实施方式对本发明进一步解释说明。
具体实施方式
相关术语介绍如下:
1、SIFT(Scale Invariant Feature Transform)算法
即尺度不变特征变换,是一种基于尺度空间的、对图像缩放、旋转甚至仿射变换保持不变性的图像局部特征描述算子。该算法是图像特征提取技术的经典算法,该算法通过计算一幅图像中的特征点(Feature Points)以及其尺度和方向的描述算子从而得到特征块。SIFT算法输出的结果为:特征块的中心点,特征块的大小和特征块的主方向。通过SIFT算法来提取图像的SIFT特征块具体这样实现:用不同尺度的图像I(x,y)与高斯函数G(xi,yi,σ)做卷积构建高斯金字塔;进而构建DOG(Difference of Gaussians)高斯差分金字塔,从查找出的DOG空间的局部极值点去除不稳定的极值点,得到特征点,最后找出不同尺度下的特征块。其中,(x,y)表示图像中像素点的坐标,σ为尺度大小。高斯函数为:
不同尺度下的图像I(x,y)与高斯函数做卷积的公式为:
L(x,y,σ)=G(x,y,σ)*I(x,y)
高斯金字塔的构建由对图像做高斯平滑和做降采样两步完成,金字塔中上一组图像的底层由前一组图像的倒数第二层图像隔点采样生成,以保持尺度的连续性。构建DOG高斯差分金字塔由高斯差分算子DOG实现,分析DOG函数表达式,将高斯金字塔上相邻层的图像相减即得DOG金字塔,DOG函数为:
D(x,y,σ)=[G(x,y,kσ)-G(x,y,σ)]*I(x,y)
=L(x,y,kσ)-L(x,y,σ)
其中,x,y,σ的含义在前文已说明,相邻两个尺度由一个常数k分开。
2、HOG(Histogram of Oriented Gradient)算法
即方向梯度直方图,是通过计算和统计图像局部区域的梯度方向直方图来构成的特征描述子。其主要思想是在一幅图像中,局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述。首先将图像分成小的连通区域,我们称之为细胞单元,然后采集细胞单元中各像素点的梯度的或边缘的方向直方图,最后把得到的方向直方图组合起来构成特征描述器。
像素点的梯度表示为:
其中,代表对x和y方向求导,L(x,y)为图像I(x,y)与高斯函数G(x,y,σ)做卷积的结果,tan-1为求反正切函数。
设特征块的大小为n*n,为了使不同大小的特征块所提取的信息维数一致,将特征块划分成4*4的单元,每一个单元的大小为(n/4)*(n/4),对每一个单元内的所有像素计算出梯度幅值和梯度方向,把梯度方向分成8个区间,在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计,得到一个8维的特征向量p,由于特征块的大小可能不一样,如果另一个特征块的大小为m*m(m≠n),则划分的单元大小为(m/4)*(m/4),得到的8维的特征向量为q,为了去除特征块大小不一致导致直方图的信息不均匀,通过将8维特征向量每一维都除以该单元的大小来进行归一化,即p/((n/4)*(n/4)),q/((m/4)*(m/4)),最后将所有单元的特征向量串联起来,得到代表该特征块的4*4*8维信息,即一个特征块由128维归一化的直方图信息表示,HOG特征提取结束。
3、K-Means算法
即K-均值聚类算法,是基于划分的聚类方法,其主要思想是以要聚类的数据中的K个点为初始中心进行聚类,对离他们最近的对象进行分类。通过迭代的方法,逐次更新各聚类中心的值,直至聚类中心不再发生改变,从而得到聚类结果。
元素xj与类中心ci的距离为||xj-ci||(欧式距离),类中心ci与类中心cj的距离为||ci-cj||,K-Means算法的目的是在很快的收敛速度之下,使所有元素与离其最近的类中心距离的总和尽可能小,公式如下:
其中
其中K为类别数,xj为一个元素,ci为类中心。
4、kNN(k-Nearest Neighbor)算法
即k-近邻算法,其主要思想是在训练样本集中找出与测试样本距离最近的k个样本。其步骤如下:1)计算出训练样本中所有数据和待检索数据的欧式距离;2)对计算的结果进行降序排序,即找出和待检测数据距离最近的k个样本;
在本发明的方法的步骤1的建立图像特征库的过程中,由于从一副乳腺图像中提取出的SIFT特征块通常达到1000个以上,但研究表明,相当一部分SIFT特征块的信息相对无用,因此步骤1中需从中选择符合规定尺度的SIFT特征块进行处理;同时,由于SIFT特征块的形状各异易导致提取HOG特征时产生错误,因此将选出的SIFT特征块均旋转到主方向与水平方向垂直后再提取其HOG特征。另外,为了检索出一对乳腺左右部分,本发明中利用乳腺图像的特殊性(即一对乳腺左右部分图像相似),对每个旋转到水平位置的SIFT特征块再进行水平翻转后提取HOG特征,使特征库的信息量增加一倍。
由于步骤1建立的图像特征库中的HOG特征数太多会影响检索速度,尤其当图像库中有成千上万副图像时,检索速度会受到很大影响,所以本发明利用K-Means算法和树形结构建立分层聚类树,将已建成的图像特征库按照树形结构重新分布,使检索时无需遍历图像特征库中的所有特征,提高检索效率。
为了说明本发明的可行性与有益效果,发明人遵从本发明的上述技术方案进行了如下实施例,需要说明的是,本发明的保护范围不限于该实施例。
实施例:
本实施例中采用的图像库是西安市某医院的乳腺图像库,共包含2560幅乳腺X线片。
首先,按照步骤1提取每幅乳腺X线片的SIFT特征块,并提取每个特征块的HOG特征。按照步骤2建立检索数据库。在本实施例中,每个节点产生子节点的个数为K=3;分层聚类树的层数的阈值depth=4。
其次,对于任意一张输入的待检索的乳腺图像,按照步骤3和步骤4进行检索。图8示出了一次完整的检索过程。其中,图8(a)为一张输入的待检索图片,图8(b)为步骤3中使用SIFT算法提取的所有SIFT特征块,共计631个。本实施例中,符合规定尺度的SIFT特征块指不小于32×32像素的SIFT特征块。因此,不满足该条件的SIFT特征块作为冗余的特征库被去除,图8(c)为去除冗余SIFT特征块之后的剩余的共计206个SIFT特征块。图中,每个特征块中的白色箭头表示该特征块的主方向。对每一个SIFT特征块按照其中心点进行旋转,使其主方向与水平方向垂直,图8(d)为一部分完成旋转之后的特征块。
对旋转之后的每个SIFT特征块进行HOG特征提取,并按照步骤4进行检索操作,得到图8(e)所示的最终检索结果。在Win7 64、CPU为Intel(R)Core(TM)i5-2300CPU@2.80GHz的电脑上运行,本次检索共耗时1836ms,可以看出,本发明的方法耗时短,检索效率高。
Claims (10)
1.一种基于相似度的乳腺图像的匹配图像检索方法,其特征在于,具体包括如下步骤:
步骤1:建立图像特征库;具体步骤为:遍历图像库中保存的乳腺图像,利用SIFT算法对每幅乳腺图像提取SIFT特征块,并将每个符合规定尺度的SIFT特征块以特征块中心为定点旋转,直至其主方向与水平方向垂直,并利用HOG算法分别提取这些特征块的HOG特征;然后将每个旋转后的SIFT特征块进行水平翻转,并利用HOG算法分别提取这些水平翻转后的特征块的HOG特征;将旋转后以及水平翻转后得到的每幅乳腺图像的图像号、该图像的HOG特征数以及该图像的HOG特征对应保存到图像特征库;
步骤2:建立分层聚类树;具体步骤如下:
步骤201:从图像特征库中读取所有的HOG特征并将它们保存到分层聚类树的根节点;令根节点为当前节点;
步骤202:在当前节点上保存所有的HOG特征中随机选取来自于不同图像的K个HOG特征作为初始聚类中心,使用K-Means算法将当前节点上保存的所有HOG特征分成K个类;同时,令当前节点产生K个子节点,将生成的K个类中的HOG特征以及每个类的聚类中心对应存储到当前节点的K个子节点上;
步骤203:判断分层聚类树的层数是否小于阈值depth,是则将步骤202产生的K个子节点依次作为当前节点,分别执行步骤202;否则结束;
步骤3:提取待检索图像的特征;具体步骤如下:
对一幅待检索图像,利用SIFT算法提取其SIFT特征块并选出符合规定尺度的SIFT特征块,将每个选出的SIFT特征块以特征块的中心为定点旋转,直至其主方向与水平方向垂直,并提取其HOG特征;再对该旋转后的SIFT特征块做水平翻转后提取HOG特征;
步骤4:查找与待检索图像相似的图像并输出;具体步骤如下:
步骤401:遍历待检索图像的所有HOG特征,将待检索图像的每个HOG特征作为当前特征,选出分层聚类树上与当前特征对应的一个叶子节点;
步骤402:对于待检测图像的每个HOG特征,利用kNN算法计算得到与每个HOG特征对应的叶子节点中存储的HOG特征中与该HOG特征最近的k个特征,该k个HOG特征组成该HOG特征的匹配特征集;
步骤403:统计待检测图像的所有HOG特征的匹配特征集中,所有HOG特征来自的乳腺图像的图像号出现的次数,并将每个乳腺图像的图像号出现的次数按照降序排序,取前k个对应的乳腺图像作为与待检测图像相似度高的乳腺图像输出。
2.如权利要求1所述的基于相似度的乳腺图像的匹配图像检索方法,其特征在于,所述步骤1中的所述符合规定尺度的SIFT特征块是指大小不小于32×32像素的SIFT特征块。
3.如权利要求1所述的基于相似度的乳腺图像的匹配图像检索方法,其特征在于,所述步骤202中的当前节点产生子节点的个数K=3。
4.如权利要求1所述的基于相似度的乳腺图像的匹配图像检索方法,其特征在于,所述步骤203中的分层聚类树的层数的阈值depth=4。
5.如权利要求1所述的基于相似度的乳腺图像的匹配图像检索方法,其特征在于,所述步骤401中选出分层聚类树上与当前特征对应的一个叶子节点的具体步骤如下:
1)将分层聚类树的根节点作为当前节点;
2)计算当前HOG特征与当前节点的K个子节点聚类中心的欧式距离,选出距离最近的节点;判断该选出的节点是否是叶子节点,是则结束;否则将该选出的节点作为当前节点,执行2)。
6.一种基于相似度的乳腺图像的匹配图像检索系统,其特征在于,具体包括如下模块:
1)图像特征库建立模块,该模块用于遍历图像库中保存的乳腺图像,利用SIFT算法对每幅乳腺图像提取SIFT特征块,并将每个符合规定尺度的SIFT特征块以特征块中心为定点旋转,直至其主方向与水平方向垂直,并利用HOG算法分别提取这些特征块的HOG特征;然后将每个旋转后的SIFT特征块进行水平翻转,并利用HOG算法分别提取这些水平翻转后的特征块的HOG特征;将旋转后以及水平翻转后得到的每幅乳腺图像的图像号、该图像的HOG特征数以及该图像的HOG特征对应保存到图像特征库;
2)分层聚类树建立模块,该模块包括以下相连接的子模块:
子模块201:从图像特征库中读取所有的HOG特征并将它们保存到分层聚类树的根节点;令根节点为当前节点;
子模块202:在当前节点上保存所有的HOG特征中随机选取来自于不同图像的K个HOG特征作为初始聚类中心,使用K-Means算法将当前节点上保存的所有HOG特征分成K个类;同时,令当前节点产生K个子节点,将生成的K个类中的HOG特征以及每个类的聚类中心对应存储到当前节点的K个子节点上;
子模块203:判断分层聚类树的层数是否小于阈值depth,是则将子模块202产生的K个子节点依次作为当前节点,分别执行子模块202;否则结束;
3)待检索图像的特征提取模块,该模块用于:
对一幅待检索图像,利用SIFT算法提取其SIFT特征块并选出符合规定尺度的SIFT特征块,将每个选出的SIFT特征块以特征块的中心为定点旋转,直至其主方向与水平方向垂直,并提取其HOG特征;再对该旋转后的SIFT特征块做水平翻转后提取HOG特征;
4)相似图像查找模块,该模块包括如下依次相连接的子模块:
子模块401:遍历待检索图像的所有HOG特征,将待检索图像的每个HOG特征作为当前特征,选出分层聚类树上与当前特征对应的一个叶子节点;
子模块402:对于待检测图像的每个HOG特征,利用kNN算法计算得到与每个HOG特征对应的叶子节点中存储的HOG特征中与该HOG特征最近的k个特征,该k个HOG特征组成该HOG特征的匹配特征集;
子模块403:统计待检测图像的所有HOG特征的匹配特征集中,所有HOG特征来自的乳腺图像的图像号出现的次数,并将每个乳腺图像的图像号出现的次数按照降序排序,取前k个对应的乳腺图像作为与待检测图像相似度高的乳腺图像输出。
7.如权利要求6所述的基于相似度的乳腺图像的匹配图像检索系统,其特征在于,所述图像特征库建立模块中的所述符合规定尺度的SIFT特征块是指大小不小于32×32像素的SIFT特征块。
8.如权利要求6所述的基于相似度的乳腺图像的匹配图像检索系统,其特征在于,所述子模块202中的当前节点产生子节点的个数K=3。
9.如权利要求6所述的基于相似度的乳腺图像的匹配图像检索系统,其特征在于,所述子模块203中的分层聚类树的层数的阈值depth=4。
10.如权利要求6所述的基于相似度的乳腺图像的匹配图像检索系统,其特征在于,所述子模块401中选出分层聚类树上与当前特征对应的一个叶子节点的子模块用于:
1)将分层聚类树的根节点作为当前节点;
2)计算当前HOG特征与当前节点的K个子节点聚类中心的欧式距离,选出距离最近的节点;判断该选出的节点是否是叶子节点,是则结束;否则将该选出的节点作为当前节点,执行2)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310590294.3A CN103678504B (zh) | 2013-11-19 | 2013-11-19 | 基于相似度的乳腺图像的匹配图像检索方法及检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310590294.3A CN103678504B (zh) | 2013-11-19 | 2013-11-19 | 基于相似度的乳腺图像的匹配图像检索方法及检索系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103678504A CN103678504A (zh) | 2014-03-26 |
CN103678504B true CN103678504B (zh) | 2017-01-18 |
Family
ID=50316049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310590294.3A Expired - Fee Related CN103678504B (zh) | 2013-11-19 | 2013-11-19 | 基于相似度的乳腺图像的匹配图像检索方法及检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103678504B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484683B (zh) * | 2014-12-31 | 2019-08-02 | 小米科技有限责任公司 | 黄色图片检测方法及装置 |
CN105956391A (zh) * | 2016-04-28 | 2016-09-21 | 深圳市前海安测信息技术有限公司 | 基于大数据的乳腺筛查系统和方法 |
CN106055573B (zh) * | 2016-05-20 | 2019-12-27 | 西安邮电大学 | 一种多示例学习框架下的鞋印图像检索方法及系统 |
CN107451200B (zh) * | 2017-07-06 | 2020-07-28 | 西安交通大学 | 使用随机量化词汇树的检索方法及基于其的图像检索方法 |
CN107423379B (zh) * | 2017-07-13 | 2019-10-11 | 西安电子科技大学 | 基于cnn特征词汇树的图像检索方法 |
CN107862301A (zh) * | 2017-11-29 | 2018-03-30 | 厦门瑞为信息技术有限公司 | 降低人脸识别误识率的方法 |
CN108664583A (zh) * | 2018-05-04 | 2018-10-16 | 北京物灵智能科技有限公司 | 一种索引树建立方法以及图像检索方法 |
CN109145129B (zh) * | 2018-09-07 | 2020-03-31 | 深圳码隆科技有限公司 | 基于层次三元组损失函数的深度度量学习方法及其装置 |
CN109344740A (zh) * | 2018-09-12 | 2019-02-15 | 上海了物网络科技有限公司 | 人脸识别系统、方法及计算机可读存储介质 |
CN109993221B (zh) * | 2019-03-25 | 2021-02-09 | 新华三大数据技术有限公司 | 一种图像分类方法及装置 |
CN110245670B (zh) * | 2019-06-11 | 2021-08-20 | 观博云标(北京)文化科技有限公司 | 基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置 |
CN110942046B (zh) * | 2019-12-05 | 2023-04-07 | 腾讯云计算(北京)有限责任公司 | 图像检索方法、装置、设备及存储介质 |
CN111583320B (zh) * | 2020-03-17 | 2023-04-07 | 哈尔滨医科大学 | 融合深度卷积网络和影像组学特征的乳腺癌超声图分型方法、系统及存储介质 |
CN113436172A (zh) * | 2021-06-29 | 2021-09-24 | 哈尔滨理工大学 | 一种基于Superpoint的医学图像处理方法 |
CN114842977B (zh) * | 2022-06-30 | 2022-10-21 | 北京超数时代科技有限公司 | 一种基于医疗大数据及人工智能的医疗决策系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894130A (zh) * | 2010-06-08 | 2010-11-24 | 浙江大学 | 基于稀疏降维的谱哈希索引方法 |
-
2013
- 2013-11-19 CN CN201310590294.3A patent/CN103678504B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894130A (zh) * | 2010-06-08 | 2010-11-24 | 浙江大学 | 基于稀疏降维的谱哈希索引方法 |
Non-Patent Citations (4)
Title |
---|
具有翻转不变性的特征描述及匹配方法研究;郭晓杰;《中国优秀硕士学位论文全文数据库 信息科技辑》;20110630;全文 * |
基于Feature Forest的图像检索;宋金龙等;《计算机工程》;20101130;第36卷(第21期);全文 * |
基于SIFT特征的图像检索;吴锐航等;《计算机应用研究》;20080229;第25卷(第2期);全文 * |
基于特征提取和机器学习的医学图像分析;张旭亚;《中国优秀硕士学位论文全文库 信息科技辑》;20120430;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103678504A (zh) | 2014-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103678504B (zh) | 基于相似度的乳腺图像的匹配图像检索方法及检索系统 | |
WO2020253629A1 (zh) | 检测模型训练方法、装置、计算机设备和存储介质 | |
Kim et al. | Boundary preserving dense local regions | |
CN109410238B (zh) | 一种基于PointNet++网络的枸杞识别计数方法 | |
CN106055573B (zh) | 一种多示例学习框架下的鞋印图像检索方法及系统 | |
Wu et al. | Metric learning based structural appearance model for robust visual tracking | |
Pan et al. | Cell detection in pathology and microscopy images with multi-scale fully convolutional neural networks | |
Shi et al. | Supervised graph hashing for histopathology image retrieval and classification | |
CN105740378B (zh) | 一种数字病理全切片图像检索方法 | |
CN110737788B (zh) | 快速的三维模型索引建立及检索方法 | |
Li et al. | Co-saliency detection based on hierarchical consistency | |
Xing et al. | Machine learning and its application in microscopic image analysis | |
Alnihoud | Content-based image retrieval system based on self organizing map, fuzzy color histogram and subtractive fuzzy clustering. | |
Huynh et al. | Plant identification using new architecture convolutional neural networks combine with replacing the red of color channel image by vein morphology leaf | |
Dong et al. | An improved YOLOv5 network for lung nodule detection | |
Bhatt et al. | Image retrieval using bag-of-features for lung cancer classification | |
Zhang et al. | Whole slide image classification via iterative patch labelling | |
Akbar et al. | Tumor localization in tissue microarrays using rotation invariant superpixel pyramids | |
Rathore et al. | CBISC: a novel approach for colon biopsy image segmentation and classification | |
Zhu et al. | Scene text relocation with guidance | |
CN110705569A (zh) | 一种基于纹理特征的图像局部特征描述子提取方法 | |
Lu et al. | Snowvision: Segmenting, identifying, and discovering stamped curve patterns from fragments of pottery | |
Kong et al. | SimLocator: robust locator of similar objects in images | |
MAHURKAR et al. | Novel Outline Tracing Techniques for Leaf Species Identification from Shrouded Leaves | |
Boumaraf et al. | Conventional Machine Learning versus Deep Learning for Magnification Dependent Histopathological Breast Cancer Image Classification: A Comparative Study with Visual Explanation. Diagnostics, 2021; 11 (3): 528 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170118 Termination date: 20171119 |