CN101295309A - 一种医学图像识别的方法 - Google Patents

一种医学图像识别的方法 Download PDF

Info

Publication number
CN101295309A
CN101295309A CNA2008100249998A CN200810024999A CN101295309A CN 101295309 A CN101295309 A CN 101295309A CN A2008100249998 A CNA2008100249998 A CN A2008100249998A CN 200810024999 A CN200810024999 A CN 200810024999A CN 101295309 A CN101295309 A CN 101295309A
Authority
CN
China
Prior art keywords
medical image
item sets
frequent
frequent item
reflected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100249998A
Other languages
English (en)
Other versions
CN101295309B (zh
Inventor
朱玉全
陈耿
宋余庆
谢从华
孙蕾
朱峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN2008100249998A priority Critical patent/CN101295309B/zh
Publication of CN101295309A publication Critical patent/CN101295309A/zh
Application granted granted Critical
Publication of CN101295309B publication Critical patent/CN101295309B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种医学图像识别的方法,目的在于提供一种能更准确地识别出新医学图像的类别的方法。该方法包括关联规则分类库的构造及其更新和医学图像识别步骤,所述关联规则分类库的构造及其更新步骤中包括下列步骤:医学图像样本数据的准备及预处理;采用基于密度聚类的医学图像分割方法分别识别出每幅样本医学图像中待分析的局部区域;分别提取出每幅样本医学图像中局部区域的特征,构造医学图像样本数据库T,这些特征包括:均值、方差、倾斜度、峰态、能量、熵和聚类特征;特征值离散化;特征值离散化;挖掘医学图像样本数据库中的频繁项目集;根据频繁项目集构造关联规则分类库。

Description

一种医学图像识别的方法
技术领域
本发明属于医学图像的计算机分析技术的应用领域,具体涉及一种医学图像识别的方法。
背景技术
自20世纪70年代以来,随着计算机断层扫描CT、核磁共振成像MRI、超声US等医学成像技术的产生和飞速发展,医院中产生并存储了大量的可供临床诊断和分析的医学图像。近年来,随着计算机及其相关技术的迅速发展以及图形图像技术的日趋成熟,人们可以对医学图像进行任意放大、缩小、旋转、对比调整、分割、配准、三维重建等处理,医务工作者可以从多方位、多层次、多角度对医学图像进行观察,从而辅助医生对病变体及其他感兴趣区域进行重点分析,提高了临床诊断的准确性,开创了数字医疗的新时代。但是,目前图像诊断方法绝大部分仍是通过肉眼观察图像中的病变区域,依靠医生个人的临床经验和主观判断来进行诊断。该方法存在如下不足:①信息利用率不高,由于医学图像一般具有很高的分辨率(如CT图像灰度级高达4096级),那些人眼无法分辨的图像信息和图像特征就得不到充分应用,从而会影响病情的早期判断;②医生带有个人的主观性,诊断结果很大程度上依赖于医生个人的临床经验,对于那些临床经验较少的医生来说,要做出正确的诊断是非常困难的。另外,同一张医学图像,不同的医生也有可能得出不同的诊断结果,相互之间的差别可能很大,发生误诊或漏诊现象是不可避免的;③人工观察耗时多,对于单个病人的诊断,医生直接观察患者的病变区域所耗时间和精力是可以接受,但若对大量临床图像进行病理研究时,仍然采取人工读图的方式就让人难以接受了。因此,如何充分利用计算机图像处理技术快速、准确地将医学图像中的病变区域识别出来,即确定医学图像中各组织器官所属的类别(正常或异常),确保临床诊断更客观、准确和科学,已成为医学图像诊断中的一个关键技术。另外,医学图像识别也是可视人计划(VHP)、医学图像指导治疗技术、医学图像后处理及其治疗方法、手术计划与导航和医学虚拟现实及其相关技术等实现中的一项重要工作。
目前国内外在这方面的研究很活跃。例如,Maria-Luiza.A(Application of TataMining Techniques for MeTical Image)等人用图像挖掘方法对胸部图像进行了较为深入的研究,所提出的方法首先是对胸部图像进行预处理,然后将图像分成四个规则区域,提取每个区域的纹理特征,最后用两种算法(关联规则和神经网络)对它进行数据挖掘。该方法通过图像数据挖掘,将图像分成正常和异常两类,实现了胸部图像乳腺癌的自动诊断。Vasileios Megalooikonomou(Mining Lesion-Teficit Associationsin ABrain Image Tatabase)等人利用数据挖掘技术对脑部图像进行了研究,发现了人脑的结构与功能的联系,大大方便了医生对人脑疾病的诊断。Petra Perner(MiningKnowleTge for HEp-2 Cell Image Classification)提出基于诊断的图像挖掘系统,首先提取图像的颜色、纹理、形状等低层物理特征和专家对图像的诊断信息,然后用决策树挖掘图像特征和诊断的关联,辅助医生进行临床诊断。
对上述这些研究进行分析可以发现,目前这些医学图像分类研究所采用的方法一般是通过提取描述图像的特征集,使原始图像数据变成适合于传统数据挖掘技术的数据形式,然后进行图像分类研究;还有的是通过特征集的关联规则进行临床自动诊断研究。这些方法或多或少存在以下几个问题:①仅限于对整幅图像的特征进行挖掘研究,而临床诊断中人体图像的局部区域特征更具有临床意义。日前绝大多数的特征提取都是建立在整幅图像基础之上,或者简单地把图像分成规则的几部分,分别提取每部分的特征,这些特征不能真正表示图像中的真实信息,而识别效果的好坏很大程度上取决于所提取的特征;②用于医学图像分类的方法还停留在关联规则等传统的数据挖掘算法的直接使用上,医学图像数据是复杂和高维的,需要研究适合其特点的分类算法;③对于医学图像的识别仅局限于个别特定的组织器官,比如乳房,颅脑等,所取得的研究成果并不具有对其它器官知识挖掘应用的普遍适应性;④方法所取特征仅仅是一些基本的颜色、纹理、形状等特征,还没有充分考虑医学图像本身的特点;⑤分类方法训练时间长、准确率低,不具有实用性。因此,寻找更加高效和准确的医学图像识别方法是计算机和医学研究工作者们所追求的。
四、发明内容
本发明的目的在于针对现有方法的不足,提出一种医学图像识别的方法,该方法能更加准确地识别出新医学图像的类别(正常与异常)。
本发明的进一步目的还在于能够对医学图像库内的图像进行快速分类。
本发明的再一个发明目的是医学图像快速并准确地进行类别识别。
实现本发明目的的技术方案是:一种医学图像识别的方法,包括关联规则分类库的构造及其更新和医学图像识别步骤,其特征在于,所述关联规则分类库的构造及其更新步骤中包括下列步骤:
(1)医学图像样本数据的准备及预处理,包括医学图像的格式转换、尺度归一化以及去噪与增强;
(2)采用基于密度聚类的医学图像分割方法分别识别出每幅样本医学图像中待分析的局部区域;
(3)分别提取出每幅样本医学图像中局部区域的特征,构造医学图像样本数据库T,这些特征包括:means(均值,它反映的是一副医学图像的平均灰度值)、variance(方差,它反映的是一副医学图像灰度在数值上的离散分布情况)、skewness(倾斜度,它反映的是医学图像直方图分布的不对称程度)、kurtosis(峰态,它反映的是医学图像灰度分布在接近均值时的大致状态)、energy(能量,它反映的是灰度分布的均匀程度)、entropy(熵,它反映的是直方图灰度分布的均匀性)和JF(聚类特征);
(4)特征值离散化;
(5)挖掘医学图像样本数据库中的频繁项目集;
(6)根据频繁项目集构造关联规则分类库。
上述技术方案的有益效果如下:
医学图像是表达人体组织、器官等解剖结构的信息集合,其信息很难用人类语言唯一描述,通常用如颜色、纹理、形状、空间关系、圆形、方形、聚类等特征来表示或描述。本发明从医学图像的成像机制、医学图像数据的特性等方面入手,研究了医学图像的灰度及其密度与人体组织器官的解剖语义,给出了一种基于核密度估计聚类的医学图像定性特征表达方式,即本发明所述的聚类特征,聚类特征能够很好地表达医学图像的语义内容,与传统的定量特性相比具有更好的可区分性。
一般情况下,一幅医学图像包含许多丰富的组织,局部组织的病灶有时会与周围正常组织在灰度、形状上十分相似,整幅医学图像的特征可能无法反映出某一局部组织器官的微小病变,仅取图像的全局特征显然是不准确的。本发明以医学图像底层次的可视特征为标准,给出了一种医学图像的自动分割方法,将图像中具有特殊含义的不同区域或组织区分开来,实现医学图像中人体组织器官的自动分割。
本发明通过步骤(2)和步骤(3)的技术特征,建立起更科学合理的医学图像样本数据库,使得新图像的类别识别更加准确,达到本发明的发明目的。
作为本发明的进一步改进,所述步骤(5)中进一步包括下列步骤:
①将医学图像样本数据库T分类,分为正常类T1和异常T2
②分别构造T1、T2的类别属性除外的频繁模式树FP1-t、FP2-t;
③由FP1-t、FP2-t确定各自的频繁项目集FI1、FI2
作为本发明的进一步改进,所述步骤(6)中进一步包括下列步骤:
④分别计算频繁项目集FI1、FI2在T2和T1中的支持数;
⑤根据阈值确定关联规则分类规则;
⑥存入关联规则分类库。
上述改进是针对现有关联分类规则挖掘方法中内存要求高、类别属性处理难、I/O访问次数多等问题提出了相应的解决方案,本发明所提出的关联分类规则挖掘方法同时考虑所有属性,取得比同样基于规则的决策树分类算法C4.5更好的分类效果。
作为本发明的进一步改进,所述频繁项目集更新步骤中进一步包括下列步骤:
⑦候选新频繁项目集的生成
a处理新增医学图像,包括医学图像的格式转换、尺度归一化和去噪与增强;
b采用基于密度聚类的医学图像分割方法分别识别出每幅样本医学图像中待分析的局部区域;
c分别提取出每幅样本医学图像中局部区域的特征,形成新增医学图像样本数据t,这些特征包括:means(均值,它反映的是一副医学图像的平均灰度值)、variance(方差,它反映的是一副医学图像灰度在数值上的离散分布情况)、skewness(倾斜度,它反映的是医学图像直方图分布的不对称程度)、kurtosis(峰态,它反映的是医学图像灰度分布在接近均值时的大致状态)、energy(能量,它反映的是灰度分布的均匀程度)、entropy(熵,它反映的是直方图灰度分布的均匀性)和JF(聚类特征);
d特征值离散化;
e扫描t求得FI(FI=FI1∪FI2)中各项目集在t中的支持数;
f扫描t一次,确定T中的强频繁项目集LT
g确定t中的候选强频繁项目集Ctk,k=1,2,...n;
i.求t中的候选强频繁项目集,所谓t中的强频繁项目集是在指在t和t∪T中均为频繁的项目集;
ii.使用函数Apriori-gen生成t中的候选新频繁项目集,其参数为Ctk
本发明将新频繁项目集的生成分为两部分,一是T中新频繁项目集的生成,二是t中新频繁项目集的生成。对于前者,只需扫描t一次即可完成,其运算量是很少的。对于后者,本发明采用了一种新的方法,具体是:①求t中的候选强频繁项目集,所谓t中的强频繁项目集是在指在t和t∪T中均为频繁的项目集;②使用函数Apriori-gen生成t中的候选新频繁项目集,其参数为t中的候选强频繁项目集,可以证明此方法可以生成t中所有的新频繁项目集,且其规模将远远低于现有更新方法。
⑧候选新频繁项目集的修剪
iii.确认新增医学图像样本数据库t的Ctk是否为空,如果为空执行步骤xiv;
iv.扫描t计算Ctk中各项目集在t中的支持数;
v.删除Ctk中t的非频繁k-项目集;
vi.删除Ctk中T的频繁k-项目集;
vii.确定最小候选项目数阈值mc,mc=max{10,|Lk|*10%},|Lk|为T中频繁k-项目集的个数;
viii.确认|Ctk|≤mc?,如果成立,执行步骤x;
ix.扫描T计算Ctk中各项目集在T中的支持数;
x.生成t中的强频繁k-项目集Ltk’;
xi.生成t中的候选强频繁(k+1)-项目集Ct(k+1)
xii.使k=k+1;
xiii.重复执行步骤iii;
xiv.产生最新样本数据库中的频繁项目集FIn1、FIn2
本发明除使用常用的修剪方法外,还采用了一种新的修剪方法,即:
删除准则1:项目集X∈Cnk,minXT=min{CountT(Y)| Y ⋐ X ,|Y|=|X|-1}。如果Countt(X)+minXT<|T∪t|×minSup,那么有 X ∉ L k , X ∉ SFI t . 其中,minSup表示最小支持度阈值,CountT(Y)表示项目集Y在T中的支持数,Countt(X)表示项目集X在t中的支持数,Lk为T中的频繁k-项目集,SFIt为t中强频繁项目集的集合。
删除准则2:对于项目集X,如果Supt(X)≤minSup,且X为T中的非频繁项目集,那么有 X ∉ L k , X ∉ SFI t 成立。其中,Supt(X)表示项目集X在t中的支持度。
一般情况下,t的规模要远远低于T的规模,相对于原频繁项目集规模而言,新增频繁项目集的规模总是很小的,为此本发明设置了一个最小候选项目数阈值mc,并给出了阈值mc的确定方法,mc的值可以取10和|Lk|*10%中的最大值,当候选新频繁项目集的个数低于mc时,暂不计算其支持数,其支持数在下次扫描T时一起计算,从而不必为了求少数个项目集的支持数而需扫描T一次。
⑨关联分类规则的构造及更新:
根据频繁项目集构造关联分类规则库,关联分类规则的形式为: A ⇒ c , minsup,minconf。其中,c为类别属性(在本发明中,c有两类,即正常与异常),A为医学图像的特征及其范围的集合,minsup、minconf分别表示关联分类规则的支持度和置信度。如关联分类规则:variance∈(0.15,0.20)and JF ∈ ( 0.90,0.95 ) ⇒ normal , minsupport=0.460,minconf=0.719。该规则表示若方差(variance)在0.15与0.20之间,聚类特征(JF)在0.90与0.95之间时,该医学图像为正常(normal)的概率为0.719,此规则的置信度为0.46。
本发明在频繁项目集的挖掘和更新中,主要在以下两方面进行了改进:
1.在对现有频繁项目集更新方法中所存在不足提出了如下的解决方案:
(1)候选项目集的规模。主要表现在以下两个方面:
①在现有更新方法中,扫描t的候选项目集C=Apriori-gen(L’(k-1)),在本发明中,扫描t的候选项目集C=Apriori-gen(L’T(k-1))。由于 L , ( k - 1 ) ⊇ L , T ( k - 1 ) , 因此在扫描t时,本发明将有更小的候选频繁项目集;
②在本发明中,一方面t中较小的候选频繁项目集将导致较小的候选新频繁项目集;另一方面,删除准则1和2的使用进一步减少了候选新频繁项目集的数目,因此,在扫描T时,本发明将具有更小的候选频繁项目集。
(2)扫描事务数据库的次数。主要表现在以下两个方面:
①一方面,T中更小的候选频繁项目集将导致扫描T次数的减少。另一方面,步骤⑧中最小候选项目数阈值mc的设置可以进一步减少扫描T的次数,因此,本发明中更新医学图像样本数据库时,扫描数据库T的次数更少。
②在现有更新方法中,扫描t的结束条件是Ctk=φ,而在本发明中,扫描t的结束条件是C’-tk=φ。由于 C tk ⊇ C , tk , 因此本发明在扫描t的次数上较小。
总之,本发明在扫描医学图像样本数据库T的次数、扫描新增医学图像样本数据库t的次数以及候选项目集规模上均占较大的优势。
作为本发明的进一步改进,所述医学图像的识别步骤进一步包括下列步骤:
①「待处理医学图像数据的准备及预处理,包括医学图像的格式转换、尺度归一化以及去噪与增强;
②「采用基于密度聚类的医学图像分割方法识别出该幅医学图像中待分析的局部区域;
③「提取出该幅医学图像中局部区域的特征,这些特征包括:means(均值,它反映的是一副医学图像的平均灰度值)、variance(方差,它反映的是一副医学图像灰度在数值上的离散分布情况)、skewness(倾斜度,它反映的是医学图像直方图分布的不对称程度)、kurtosis(峰态,它反映的是医学图像灰度分布在接近均值时的大致状态)、energy(能量,它反映的是灰度分布的均匀程度)、entropy(熵,它反映的是直方图灰度分布的均匀性)和JF(聚类特征);
④「特征值离散化;
⑤「根据关联规则分类库中的规则确定该医学图像的类别(正常或异常)。如给定一张医学图像,其类别属性是未知的,经预处理及特征提取后的特征值为:variance=0.17、JF=0.92,则根据关联分类规则库中已有的分类规则可以确定该医学图像为正常的概率为0.719,相应的置信度为0.46。
附图说明
图1是本发明实施例的结构框图
图2是本发明实施例中频繁项目集挖掘流程图
图3是本发明实施例中关联分类规则库构造流程
图4是本发明实施例中候选项目阈值与时间关系图
图5是本发明实施例中频繁项目集更新流程图结构图
图6是本发明实施例中的频繁模式树FP1-t结构图
具体实施方式
下面以肝脏CT医学图像为例,简单地说明本发明的执行过程。本实例共选择了120幅肝脏CT图像,其中正常图像80幅,异常图像40幅,具体执行步骤如下:
如图1所示,一种医学图像识别的方法,包括关联规则分类库的构造及其更新和医学图像识别步骤,其特征在于,所述关联规则分类库的构造及其更新步骤中包括下列步骤:
(1)分别对这120幅肝脏CT图像进行格式转换以及医学图像去噪和增强处理等。
(2)分别提取每张图像的相关特征并进行归一化处理,结果如表1所示。本发明提取的特征包括均值、方差、倾斜度、峰态、能量、熵和聚类特征。在这120幅图像中,前面100幅作为原样本数据,后20幅作为增量样本数据。
表1肝脏CT医学图像特征表
Figure A20081002499900111
Figure A20081002499900121
Figure A20081002499900131
(3)数值属性离散化。分别对表1中的各属性进行离散化,其方法可采用等宽划分、等深划分或基于距离的划分等方法。本例采用等宽划分,即将0到1区间划分成20等份,分别为(0.00,0.05],(0.05,0.10],...,(0.95,1.00]。如:第三条记录{0.66233,0.49494,0.17713,0.17484,0.66512,0.27952,0.70436}的离散化值为:{(0.65,0.70],(0.45,0.50],(0.1 5,0.20],(0.1 5,0.20],(0.65,0.70],(0.25,0.30],(0.70,0.75]}。
(4)离散区间整数化。将数值属性的离散区间映射成连续的整数标识,如分别将(0.00,0.05],(0.05,0.10],...,(0.95,1.00]映射成1,2,3,...,20,则第三条记录离散区间整数化后为{14,10,4,4,14,6,15}。经过(1)至(4)步后,表1转换成如表2的形式,表2仅给出表1中的前10条记录,其余略。
表2离散区间整数化后的结果表
Figure A20081002499900151
(5)在前100幅图像中分别取出类别属性为正常和异常的记录,并分别构造各自的频繁模式树FP1-t、FP2-t,频繁项目集挖掘流程如图2所示,具体包括:
①「将医学图像样本数据库T分类,分为正常类T1和异常T2
②「分别构造T1、T2的类别属性除外的频繁模式树FP1-t、FP2-t;
③「由FP1-t、FP2-t确定各自的频繁项目集FI1、FI2
树中每个结点形式为:
node-name  node-count  node-count  node-parent
其中node-name记录结点所表示的项目名,node-count记录能到达该结点的医学图像数,node-link为指向频繁模式树中具有相同的node-name值的下一结点,即通过node-link将频繁模式树中具有相同node-name值的结点链接起来,node-parent为指向父结点的指针。另外,为了方便树遍历,创建一个频繁项目头表,它由两个域组成:项目名称item-name以及结点链头node-head,其中node-head为指向频繁模式树中具有相同node-name值的首结点的指针。
类别属性为正常的前五条记录所形成的频繁模式树如图6所示,图中结点形式已略做简化。其余记录可用同样的方法插入树FP1-t中。同样可以构造频繁模式树FP2-t。
(6)在FP1-t、FP2-t上挖掘出频繁项目集,得到频繁项目集FI1和FI2。设最小支持度为0.4,则FI1={{聚类特征=18},{倾斜度=01},{聚类特征=18,倾斜度=01},{聚类特征=18,倾斜度=01,均值=20,熵=11,峰态=05},.....},FI2={{聚类特征=04},{聚类特征=04,方差=11,倾斜度=10,能量=04},.....}。
(7)使用FI1和FI2构造关联分类规则,如FI1中的频繁项目集{聚类特征=18,倾斜度=01,均值=20,熵=11,峰态=05}所构造的分类规则为:{聚类特征=18,倾斜度=01,均值=20,熵=11,峰态=05}
Figure A20081002499900161
正常,FI2中的频繁项目集{聚类特征=04,方差=11,倾斜度=10,能量=04}所构造的分类规则为:{聚类特征=04,方差=11,倾斜度=10,能量=04}
Figure A20081002499900162
异常。在实际使用时,应分别将数字属性转换成相应的区间,即将1,2,3,...,20分别转换成(0.00,0.05],(0.05,0.10],...,(0.95,1.00]。关联分类规则库构造流程如图3所示,具体包括:
①分别计算频繁项目集FI1、FI2在T2和T1中的支持数;
②根据阈值确定关联规则分类规则;
③存入关联规则分类库。
(8)使用表1中的后20条记录更新频繁项目集FI1和FI2。如FI1中的频繁项目集{聚类特征=18,倾斜度=01,均值=20,熵=11,峰态=05}将变为{聚类特征=18,倾斜度=01,均值=20,熵=11,峰态=04}等等。频繁项目集FI1和FI2更新过程如图5所示。具体如下:
④候选新频繁项目集的生成
a处理新增医学图像,包括医学图像的格式转换、尺度归一化和去噪与增强;
b采用基于密度聚类的医学图像分割方法分别识别出每幅样本医学图像中待分析的局部区域;
c分别提取出每幅样本医学图像中局部区域的特征,这些特征包括:means(均值,它反映的是一副医学图像的平均灰度值)、variance(方差,它反映的是一副医学图像灰度在数值上的离散分布情况)、skewness(倾斜度,它反映的是医学图像直方图分布的不对称程度)、kurtosis(峰态,它反映的是医学图像灰度分布在接近均值时的大致状态)、energy(能量,它反映的是灰度分布的均匀程度)、entropy(熵,它反映的是直方图灰度分布的均匀性)和JF(聚类特征);
d特征值离散化,形成新增医学图像样本数据库t;
e扫描t求得FI(FI=FI1∪FI2)中各项目集在t中的支持数;
f扫描t一次,确定T中的强频繁项目集LT
g确定t中的候选强频繁项目集Ctk,k=1,2,...n;
i.求t中的候选强频繁项目集,所谓t中的强频繁项目集是在指在t和t∪T中均为频繁的项目集;
ii.使用函数Apriori-gen生成t中的候选新频繁项目集,其参数为Ctk
⑤候选新频繁项目集的修剪
iii.确认新增医学图像样本数据库t的Ctk是否为空,如果为空执行步骤xiv;
iv.扫描t计算Ctk中各项目集在t中的支持数;
v.删除Ctk中t的非频繁k-项目集;
vi.删除Ctk中T的频繁k-项目集;
vii.确定最小候选项目数阈值mc,mc=max{10,|Lk|*10%},|Lk|为T中频繁k-项目集的个数;
viii.确认|Ctk|≤mc?,如果成立,执行步骤x;
ix.扫描T计算Ctk中各项目集在T中的支持数;
x.生成t中的强频繁k-项目集Ltk’;
xi.生成t中的候选强频繁(k+1)-项目集Ct(k+1)
xii.使k=k+1;
xiii.重复执行步骤iii;
xiv.产生最新样本数据库中的频繁项目集FIn1、FIn2
如图1所示,肝脏CT医学图像类别识别流程如下:
⑥「待处理医学图像数据的准备及预处理,包括医学图像的格式转换、尺度归一化以及去噪与增强;
⑦「采用基于密度聚类的医学图像分割方法识别出该幅医学图像中待分析的局部区域;
⑧「提取出该幅医学图像中局部区域的特征,这些特征包括:means(均值,它反映的是一副医学图像的平均灰度值)、variance(方差,它反映的是一副医学图像灰度在数值上的离散分布情况)、skewness(倾斜度,它反映的是医学图像直方图分布的不对称程度)、kurtosis(峰态,它反映的是医学图像灰度分布在接近均值时的大致状态)、energy(能量,它反映的是灰度分布的均匀程度)、entropy(熵,它反映的是直方图灰度分布的均匀性)和JF(聚类特征);
⑨「特征值离散化;
⑩「根据关联规则分类库中的规则确定该医学图像的类别(正常或异常)。

Claims (7)

1、一种医学图像识别的方法,包括关联规则分类库的构造及其更新和医学图像识别步骤,其特征在于,所述关联规则分类库的构造及其更新步骤中包括下列步骤:
(1)医学图像样本数据的准备及预处理,包括医学图像的格式转换、尺度归一化以及去噪与增强;
(2)采用基于密度聚类的医学图像分割方法分别识别出每幅样本医学图像中待分析的局部区域;
(3)分别提取出每幅样本医学图像中局部区域的特征,构造医学图像样本数据库T,这些特征包括:均值、方差、倾斜度、峰态、能量、熵和聚类特征;
(4)特征值离散化;
(5)挖掘医学图像样本数据库中的频繁项目集;根据频繁项目集构造关联规则分类库。
2、根据权利要求1所述的方法,其特征在于,所述步骤(5)中进一步包括下列步骤:
①将医学图像样本数据库T分类,分为正常类T1和异常T2
②分别构造T1、T2的类别属性除外的频繁模式树FP1-t、FP2-t;
③由FP1-t、FP2-t确定各自的频繁项目集FI1、FI2
3、根据权利要求1所述的方法,其特征在于,所述步骤(6)中进一步包括下列步骤:
④分别计算频繁项目集FI1、FI2在T2和T1中的支持数;
⑤根据阈值确定关联规则分类规则;
⑥存入关联规则分类库。
4、根据权利要求1所述的识别方法,其特征在于,频繁项目集更新步骤中进一步包括下列步骤:
⑦候选新频繁项目集的生成
a处理新增医学图像,包括医学图像的格式转换、尺度归一化和去噪与增强;
b采用基于密度聚类的医学图像分割方法分别识别出每幅样本医学图像中待分析的局部区域;
c分别提取出每幅样本医学图像中局部区域的特征,形成新增医学图像样本数据t,这些特征包括:means(均值,它反映的是一副医学图像的平均灰度值)、variance(方差,它反映的是一副医学图像灰度在数值上的离散分布情况)、skewness(倾斜度,它反映的是医学图像直方图分布的不对称程度)、kurtosis(峰态,它反映的是医学图像灰度分布在接近均值时的大致状态)、energy(能量,它反映的是灰度分布的均匀程度)、entropy(熵,它反映的是直方图灰度分布的均匀性)和JF(聚类特征);
d特征值离散化;
e扫描t求得FI(FI=FI1∪FI2)中各项目集在t中的支持数;
f扫描t一次,确定T中的强频繁项目集LT
g确定t中的候选强频繁项目集Ctk,k=1,2,...n;
i.求t中的候选强频繁项目集,所谓t中的强频繁项目集是在指在t和t∪T中均为频繁的项目集;
ii.使用函数Apriori-gen生成t中的候选新频繁项目集,其参数为Ctk
①候选新频繁项目集的修剪;
②关联分类规则的构造及更新。
5、根据权利要求1所述的识别方法,其特征在于,所述医学图像的识别步骤进一步包括下列步骤:
③待处理医学图像数据的准备及预处理,包括医学图像的格式转换、尺度归一化以及去噪与增强;
④采用基于密度聚类的医学图像分割方法识别出该幅医学图像中待分析的局部区域;
⑤提取出该幅医学图像中局部区域的特征,这些特征包括:均值、方差,、倾斜度,它反映的是医学图像直方图分布的不对称程度、峰态、能量和熵;
⑥特征值离散化;
⑦根据关联规则分类库中的规则确定该医学图像的类别。
6、根据权利要求4所述的方法,其特征在于,所述步骤⑧具体包括下列步骤:
iii.确认新增医学图像样本数据库t的Ctk是否为空,如果为空执行步骤xiv;
iv.扫描t计算Ctk中各项目集在t中的支持数;
v.删除Ctk中t的非频繁k-项目集;
vi.删除Ctk中T的频繁k-项目集;
vii.确定最小候选项目数阈值mc,mc=max{10,|Lk|*10%},|Lk|为T中频繁k-项目集的个数;
viii.确认|Ctk|≤mc?,如果成立,执行步骤x;
ix.扫描T计算Ctk中各项目集在T中的支持数;
x.生成t中的强频繁k-项目集Ltk’;
xi.生成t中的候选强频繁(k+1)-项目集Ct(k+1)
xii.使k=k+1;
xiii.重复执行步骤iii;
xiv.产生最新样本数据库中的频繁项目集FIn1、FIn2
7、根据权利要求4所述的方法,其特征在于,所述步骤⑨具体包括下列步骤:根据频繁项目集构造关联分类规则库,关联分类规则的形式为: A ⇒ c , minsup,minconf;其中,c为类别属性,包括正常类与异常类,A为医学图像的特征及其范围的集合,minsup、minconf分别表示关联分类规则的支持度和置信度。
CN2008100249998A 2008-05-22 2008-05-22 一种医学图像识别的方法 Expired - Fee Related CN101295309B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100249998A CN101295309B (zh) 2008-05-22 2008-05-22 一种医学图像识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100249998A CN101295309B (zh) 2008-05-22 2008-05-22 一种医学图像识别的方法

Publications (2)

Publication Number Publication Date
CN101295309A true CN101295309A (zh) 2008-10-29
CN101295309B CN101295309B (zh) 2011-05-04

Family

ID=40065596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100249998A Expired - Fee Related CN101295309B (zh) 2008-05-22 2008-05-22 一种医学图像识别的方法

Country Status (1)

Country Link
CN (1) CN101295309B (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102364498A (zh) * 2011-10-17 2012-02-29 江苏大学 一种基于多标签的图像识别方法
CN102428469A (zh) * 2009-05-19 2012-04-25 皇家飞利浦电子股份有限公司 检索和查看医疗图像
CN102667775A (zh) * 2009-12-21 2012-09-12 国际商业机器公司 训练和使用具有关联规则模型的分类模型的方法
CN103177105A (zh) * 2013-03-26 2013-06-26 新浪网技术(中国)有限公司 一种图像检索方法及装置
CN103345753A (zh) * 2013-07-10 2013-10-09 深圳先进技术研究院 脑部图像处理方法和系统
CN103714153A (zh) * 2013-12-26 2014-04-09 西安理工大学 基于限定区域数据取样的密度聚类方法
CN103761236A (zh) * 2013-11-20 2014-04-30 同济大学 一种增量式频繁模式增长数据挖掘方法
CN103778310A (zh) * 2012-10-19 2014-05-07 信锦企业股份有限公司 终端装置、医疗数据输入系统及医疗数据输入方法
CN103838942A (zh) * 2012-11-21 2014-06-04 大连灵动科技发展有限公司 一种基于知识库的脑功能成像诊断方法
CN104318057A (zh) * 2014-09-25 2015-01-28 新乡医学院第一附属医院 医学影像三维可视化系统
CN104616025A (zh) * 2015-01-19 2015-05-13 南京邮电大学 一种医用温度计识别系统
CN104715436A (zh) * 2013-12-13 2015-06-17 北京美智医疗科技有限公司 一种医疗信息采集和归档方法及系统
CN104798043A (zh) * 2014-06-27 2015-07-22 华为技术有限公司 一种数据处理方法和计算机系统
CN105022719A (zh) * 2014-04-23 2015-11-04 Ge医疗系统环球技术有限公司 医学造影系统及方法
CN105550651A (zh) * 2015-12-14 2016-05-04 中国科学院深圳先进技术研究院 一种数字病理切片全景图像自动分析方法及系统
CN105956386A (zh) * 2016-04-27 2016-09-21 深圳市智影医疗科技有限公司 基于健康人胸片的健康指标指数分类系统和方法
CN106529580A (zh) * 2016-10-24 2017-03-22 浙江工业大学 结合edsvm的软件缺陷数据关联分类方法
CN106791822A (zh) * 2017-01-13 2017-05-31 浙江科技学院 一种基于单双目特征学习的无参考立体图像质量评价方法
CN106960226A (zh) * 2017-04-11 2017-07-18 陕西师范大学 一种基于烟花算法的软子空间mr图像聚类算法
CN107016032A (zh) * 2015-12-24 2017-08-04 西门子公司 用于医疗图像获取协议的自动检测的方法和系统
CN107358014A (zh) * 2016-11-02 2017-11-17 华南师范大学 一种生理数据的临床前处理方法及系统
CN108877922A (zh) * 2017-05-15 2018-11-23 沈渊瑶 病变程度判断系统及其方法
CN109214455A (zh) * 2018-09-05 2019-01-15 北京国网富达科技发展有限责任公司 油色谱数据与台账数据的相关性确定方法及系统
CN110444276A (zh) * 2018-05-04 2019-11-12 西门子医疗有限公司 产生图像数据的方法、计算机断层扫描设备、程序产品和数据载体
CN112102351A (zh) * 2020-10-14 2020-12-18 平安科技(深圳)有限公司 医学图像分析方法、装置、电子设备及可读存储介质
CN114418008A (zh) * 2022-01-21 2022-04-29 平安国际智慧城市科技股份有限公司 就医行为识别方法、装置、终端设备及存储介质
WO2022110525A1 (zh) * 2020-11-24 2022-06-02 江苏大学 一种癌变区域综合检测装置及方法

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102428469A (zh) * 2009-05-19 2012-04-25 皇家飞利浦电子股份有限公司 检索和查看医疗图像
CN102428469B (zh) * 2009-05-19 2015-11-25 皇家飞利浦电子股份有限公司 用于检索和查看医疗图像的装置
CN102667775A (zh) * 2009-12-21 2012-09-12 国际商业机器公司 训练和使用具有关联规则模型的分类模型的方法
CN102667775B (zh) * 2009-12-21 2015-06-03 国际商业机器公司 训练和使用具有关联规则模型的分类模型的方法
CN102364498A (zh) * 2011-10-17 2012-02-29 江苏大学 一种基于多标签的图像识别方法
CN103778310A (zh) * 2012-10-19 2014-05-07 信锦企业股份有限公司 终端装置、医疗数据输入系统及医疗数据输入方法
CN103838942A (zh) * 2012-11-21 2014-06-04 大连灵动科技发展有限公司 一种基于知识库的脑功能成像诊断方法
CN103177105A (zh) * 2013-03-26 2013-06-26 新浪网技术(中国)有限公司 一种图像检索方法及装置
CN103177105B (zh) * 2013-03-26 2016-12-28 新浪网技术(中国)有限公司 一种图像检索方法及装置
CN103345753A (zh) * 2013-07-10 2013-10-09 深圳先进技术研究院 脑部图像处理方法和系统
CN103761236A (zh) * 2013-11-20 2014-04-30 同济大学 一种增量式频繁模式增长数据挖掘方法
CN103761236B (zh) * 2013-11-20 2017-02-08 同济大学 一种增量式频繁模式增长数据挖掘方法
CN104715436A (zh) * 2013-12-13 2015-06-17 北京美智医疗科技有限公司 一种医疗信息采集和归档方法及系统
CN103714153A (zh) * 2013-12-26 2014-04-09 西安理工大学 基于限定区域数据取样的密度聚类方法
CN105022719A (zh) * 2014-04-23 2015-11-04 Ge医疗系统环球技术有限公司 医学造影系统及方法
CN105022719B (zh) * 2014-04-23 2019-06-28 Ge医疗系统环球技术有限公司 医学造影系统及方法
CN104798043A (zh) * 2014-06-27 2015-07-22 华为技术有限公司 一种数据处理方法和计算机系统
CN104318057A (zh) * 2014-09-25 2015-01-28 新乡医学院第一附属医院 医学影像三维可视化系统
CN104616025A (zh) * 2015-01-19 2015-05-13 南京邮电大学 一种医用温度计识别系统
CN105550651A (zh) * 2015-12-14 2016-05-04 中国科学院深圳先进技术研究院 一种数字病理切片全景图像自动分析方法及系统
CN105550651B (zh) * 2015-12-14 2019-12-24 中国科学院深圳先进技术研究院 一种数字病理切片全景图像自动分析方法及系统
CN107016032A (zh) * 2015-12-24 2017-08-04 西门子公司 用于医疗图像获取协议的自动检测的方法和系统
US10698981B2 (en) 2015-12-24 2020-06-30 Siemens Healthcare Gmbh Automatic detection of medical image acquisition protocol
CN105956386B (zh) * 2016-04-27 2018-06-12 深圳市智影医疗科技有限公司 基于健康人胸片的健康指标指数分类系统和方法
CN105956386A (zh) * 2016-04-27 2016-09-21 深圳市智影医疗科技有限公司 基于健康人胸片的健康指标指数分类系统和方法
CN106529580A (zh) * 2016-10-24 2017-03-22 浙江工业大学 结合edsvm的软件缺陷数据关联分类方法
CN107358014B (zh) * 2016-11-02 2021-01-26 华南师范大学 一种生理数据的临床前处理方法及系统
CN107358014A (zh) * 2016-11-02 2017-11-17 华南师范大学 一种生理数据的临床前处理方法及系统
CN106791822A (zh) * 2017-01-13 2017-05-31 浙江科技学院 一种基于单双目特征学习的无参考立体图像质量评价方法
CN106791822B (zh) * 2017-01-13 2018-11-30 浙江科技学院 一种基于单双目特征学习的无参考立体图像质量评价方法
CN106960226A (zh) * 2017-04-11 2017-07-18 陕西师范大学 一种基于烟花算法的软子空间mr图像聚类算法
CN106960226B (zh) * 2017-04-11 2018-04-13 陕西师范大学 一种基于烟花算法的软子空间mr图像聚类方法
CN108877922A (zh) * 2017-05-15 2018-11-23 沈渊瑶 病变程度判断系统及其方法
CN110444276A (zh) * 2018-05-04 2019-11-12 西门子医疗有限公司 产生图像数据的方法、计算机断层扫描设备、程序产品和数据载体
CN109214455A (zh) * 2018-09-05 2019-01-15 北京国网富达科技发展有限责任公司 油色谱数据与台账数据的相关性确定方法及系统
CN112102351A (zh) * 2020-10-14 2020-12-18 平安科技(深圳)有限公司 医学图像分析方法、装置、电子设备及可读存储介质
WO2021189900A1 (zh) * 2020-10-14 2021-09-30 平安科技(深圳)有限公司 医学图像分析方法、装置、电子设备及可读存储介质
WO2022110525A1 (zh) * 2020-11-24 2022-06-02 江苏大学 一种癌变区域综合检测装置及方法
US11587231B2 (en) 2020-11-24 2023-02-21 Jiangsu University Comprehensive detection device and method for cancerous region
CN114418008A (zh) * 2022-01-21 2022-04-29 平安国际智慧城市科技股份有限公司 就医行为识别方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
CN101295309B (zh) 2011-05-04

Similar Documents

Publication Publication Date Title
CN101295309B (zh) 一种医学图像识别的方法
CN111539930B (zh) 基于深度学习的动态超声乳腺结节实时分割与识别的方法
US10467757B2 (en) System and method for computer aided diagnosis
CN112101451B (zh) 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法
ES2914387T3 (es) Estudio inmediato
CN110120033A (zh) 基于改进的U-Net神经网络三维脑肿瘤图像分割方法
CN107582097A (zh) 一种基于多模态超声组学的智能辅助决策系统
CN109493308A (zh) 基于条件多判别生成对抗网络的医疗图像合成与分类方法
CN109886933A (zh) 一种医学图像识别方法、装置和存储介质
CN109671086A (zh) 一种基于三维超声的胎儿头部全自动分割方法
CN110310281A (zh) 一种基于Mask-RCNN深度学习的虚拟医疗中肺结节检测与分割方法
CN109658411A (zh) 一种基于ct影像学特征与非小细胞肺癌患者预后情况的相关性分析方法
CN104000619A (zh) 一种甲状腺ct图像计算机辅助诊断系统及方法
CN112598661B (zh) 一种基于机器学习的踝骨折及韧带损伤诊断方法
CN113034462B (zh) 基于图卷积的胃癌病理切片图像的处理方法及系统
CN104217213B (zh) 一种基于对称性理论的医学图像多阶段分类方法
CN110910377B (zh) 一种基于神经网络的脑梗死mri图像识别方法
CN108510507A (zh) 一种融合加权随机森林的3d椎骨ct图像主动轮廓分割方法
Cao et al. An automatic breast cancer grading method in histopathological images based on pixel-, object-, and semantic-level features
CN114926477A (zh) 一种基于深度学习的脑肿瘤多模态mri影像分割方法
CN112508884A (zh) 一种癌变区域综合检测装置及方法
Bansal et al. An improved hybrid classification of brain tumor MRI images based on conglomeration feature extraction techniques
Kriti et al. A review of Segmentation Algorithms Applied to B-Mode breast ultrasound images: a characterization Approach
CN113674859A (zh) 一种心脏出生缺陷诊断方法及系统
Li et al. Breast MRI segmentation and Ki-67 high-and low-expression prediction algorithm based on deep learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110504

Termination date: 20130522