CN106204532A - 基于特征数据挖掘及神经网络的肿瘤的分类方法 - Google Patents

基于特征数据挖掘及神经网络的肿瘤的分类方法 Download PDF

Info

Publication number
CN106204532A
CN106204532A CN201610488243.3A CN201610488243A CN106204532A CN 106204532 A CN106204532 A CN 106204532A CN 201610488243 A CN201610488243 A CN 201610488243A CN 106204532 A CN106204532 A CN 106204532A
Authority
CN
China
Prior art keywords
feature
tumor
diagnostic mode
neutral net
based data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610488243.3A
Other languages
English (en)
Other versions
CN106204532B (zh
Inventor
黄庆华
陈永东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610488243.3A priority Critical patent/CN106204532B/zh
Publication of CN106204532A publication Critical patent/CN106204532A/zh
Application granted granted Critical
Publication of CN106204532B publication Critical patent/CN106204532B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10132Ultrasound image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于特征数据挖掘及神经网络的肿瘤分类方法,该方法首先选取肿瘤超声图片的有效病变特征的人工评分数据作为原始特征数据集;之后采用双聚类算法从原始训练数据集中挖掘出有效的局部诊断模式;其次根据这些诊断模式提取出更高层的特征,形成新的特征向量;接着,新的特征向量作为神经网络的输入进行训练得到有效的多类别分类器;最后,采用同样的方式为测试样本提取特征向量,利用训练得到的多类别分类器对其进行分类,得到肿瘤的具体分类结果。本方法克服传统计算机辅助方法局限于低级图像特征的不足,通过从大量人工评分特征数据集中挖掘出更高层的有效特征,并利用流行的神经网络分类方法训练出最终识别多类别肿瘤的分类器。

Description

基于特征数据挖掘及神经网络的肿瘤的分类方法
技术领域
本发明涉及超声肿瘤图片识别诊断领域,具体涉及一种基于特征数据挖掘及神经网络的肿瘤分类方法。
背景技术
近几十年来,肿瘤发病率逐年上升,从全球范围内来看,肿瘤癌症已成为居民死亡的首要原因,每年都有好几百万人死于肿瘤癌症。肿瘤癌症严重威胁着人们的生命健康,它的治疗和预防也成为了全球医学及相关领域科学家的关注焦点。临床研究表明,早期对肿瘤疾病进行准确的分类是治疗肿瘤的关键。精准的分类不仅有助于提高肿瘤患者的治愈率,而且对患者产生的副作用也更小。当前,超声影像凭借其性价比高、无辐射、快速方便、副作用小的优势,逐渐成为临床医疗中一种常用的成像技术。但是,受成像原理和一些技术上的限制,超图图像不可避免地具有噪声斑点、信噪比低的缺点。医生仅仅通过观察超声图像进行肿瘤疾病的诊断仍然存在一定的困难,容易造成误诊和漏诊。为此,计算机辅助诊断技术作为医生临床诊断的第二参考,对提高医生诊断准确率起到了积极作用,近年来获得越来越多的关注。
据调研,目前大多数医学计算机辅助诊断系统主要是先对超声影像进行预处理,结合图像分析技术提取出感兴趣区域的纹理特征,通过特征选择方法筛选出有效特征,最后利用支持向量机等机器学习方法进行肿瘤良恶性分类。这些方法存在一些局限性:(1)局限于图像像素灰度、纹理计算出来的低级特征用于分类,与医生临床上描述判断肿瘤的高级语义特征有着较大差异,很难得到医生易于接受和理解的诊断结果;(2)步骤环节过于复杂,数值化特征的准确性严重依赖图像质量、预处理及图像分割效果;(3)只涉及良性、恶性肿瘤大类分类,无法给出更具体分类结果,辅助医生后续进行精准治疗。在模式分类领域,特征选择对最终分类的性能有着至关重要的影响。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于特征数据挖掘及神经网络的肿瘤分类方法。
本发明的目的通过下述技术方案实现:
一种基于特征数据挖掘及神经网络的肿瘤分类方法,该方法包括下列步骤:
S1、医生根据已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量;
S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,进而提取出N个有效的诊断模式;
S4、利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量;
S5、将步骤S4得到的N维特征向量作为输入,利用神经网络模式进行训练,得到肿瘤多类别分类器;
S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
进一步地,所述步骤S3中提取的有效诊断模式具有如下要求:
挖掘到的双聚类只有在行数所代表的病例样本数目及列数所代表的特征数目满足一定阈值,才判断为有效的诊断模式。
进一步地,所述步骤S4中提取出更高层次的特征具体过程如下:
S41、计算肿瘤病例特征打分与每一个诊断模式之间的相似度;
S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则形成维度为N的一个新的特征向量。
进一步地,所述步骤S5中的神经网络模式包括传统反向传播神经网络模型和深度学习神经网络模型。
进一步地,所述相似度的衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差RMSD,其公式如下:
R M S D = Σ j ∈ F S ( V u d ( j ) - V d r ( j ) ) 2 n
其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud为肿瘤样本的第j个特征值,Vdr为诊断模式的第j个特征值。
本发明相对于现有技术具有如下的优点及效果:
1、克服了传统计算机辅助诊断方法从超声图像提取纹理、形态、灰度等低级特征用于训练分类器的不足,直接采用临床医疗中医生常用的有效病变描述特征人工评分数据特征,实施步骤简单且更易于被医生接受。
2、利用双聚类算法挖掘出的有效诊断模式提取出更高层次的特征,使得所产生的特征向量具有更好的识别分类效果,对简化神经网络的复杂度具有积极作用。
3、不同于传统分类器仅仅进行良恶性进行分类,本方法利用神经网络模型训练出的多分类分类器,可以识别出患者肿瘤的具体分类类别,从而辅助医生进行精准治疗,具有重要的临床应用价值。
附图说明
图1是本发明中公开的基于特征数据挖掘及神经网络模型的肿瘤分类方法的流程步骤图;
图2是本发明方法中利用诊断模式产生高层次特征方法的示意图;
图3是本发明实施例中的一种反向传播神经网络模型的示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
请参见图1,图1是本实施例中公开的基于特征数据挖掘及神经网络的肿瘤分类方法的流程步骤图。图1所示的基于特征数据挖掘及神经网络的肿瘤分类方法运用于乳腺肿瘤,具体包括下列步骤:
S1、医生根据M个已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量;
S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,将行数(代表病例样本数目)及列数(代表特征数目)满足一定阈值的双聚类筛选出来,进而提取出N个有效的诊断模式;
S4、如图2所示,利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量,具体步骤为:
S41、计算乳腺肿瘤病例特征打分与每一个诊断模式之间的相似度,本实施例中,相似度衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差(RMSD),具体应用中,该相似度的衡量方法可以扩展为其它常用方法,此次举例不构成对本技术方案的限制。
均方根误差(RMSD)具体如下:
R M S D = Σ j ∈ F S ( V u d ( j ) - V d r ( j ) ) 2 n
其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud为肿瘤样本的第j个特征值,Vdr为诊断模式的第j个特征值。
S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则可以形成维度为N的一个新的特征向量。
S5、将步骤S4特征向量作为新的输入,利用神经网络模式进行训练,得到乳腺肿瘤多类别分类器,其中神经网络模式采用如图3所示的四层多分类反向传播神经网络,具体应用中,神经网络模式不局限于传统反向传播神经网络模型,也可以是深度学习神经网络模型。
S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3中得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
综上所述,本实施例中公开的基于特征数据挖掘及神经网络的肿瘤分类方法,首先选取肿瘤超声图片的有效病变特征的人工评分数据作为原始特征数据集;之后采用双聚类算法从原始训练数据集中挖掘出有效的局部诊断模式;其次根据这些诊断模式提取出更高层的特征,形成新的特征向量;接着,这些新的特征向量作为神经网络的输入进行训练得到有效的多类别分类器;最后,采用同样的方式为测试样本提取特征向量,利用训练得到的多类别分类器对其进行分类,得到肿瘤的具体分类结果。
本发明方法克服了传统计算机辅助诊断方法从超声图像提取纹理、形态、灰度等低级特征用于训练分类器的不足,直接采用临床医疗中医生常用的有效病变描述特征人工评分数据特征,实施步骤简单且更易于被医生接受;利用双聚类算法挖掘出的有效诊断模式提取出更高层次的特征,使得所产生的特征向量具有更好的识别分类效果,对简化神经网络的复杂度具有积极作用;该发明方法不同于传统分类器仅仅进行良恶性进行分类,本方法利用神经网络模型训练出的多分类分类器,可以识别出患者肿瘤的具体分类类别,从而辅助医生进行精准治疗,具有重要的临床应用价值。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,该方法包括下列步骤:
S1、医生根据已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量;
S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,进而提取出N个有效的诊断模式;
S4、利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量;
S5、将步骤S4得到的N维特征向量作为输入,利用神经网络模式进行训练,得到肿瘤多类别分类器;
S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
2.根据权利要求1所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述步骤S3中提取的有效诊断模式具有如下要求:
挖掘到的双聚类只有在行数所代表的病例样本数目及列数所代表的特征数目满足一定阈值,才判断为有效的诊断模式。
3.根据权利要求1所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述步骤S4中提取出更高层次的特征具体过程如下:
S41、计算肿瘤病例特征打分与每一个诊断模式之间的相似度;
S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则形成维度为N的一个新的特征向量。
4.根据权利要求1所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述步骤S5中的神经网络模式包括传统反向传播神经网络模型和深度学习神经网络模型。
5.根据权利要求3所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述相似度的衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差RMSD,其公式如下:
R M S D = Σ j ∈ F S ( V u d ( j ) - V d r ( j ) ) 2 n
其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud为肿瘤样本的第j个特征值,Vdr为诊断模式的第j个特征值。
CN201610488243.3A 2016-06-24 2016-06-24 基于特征数据挖掘及神经网络的肿瘤的分类方法 Active CN106204532B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610488243.3A CN106204532B (zh) 2016-06-24 2016-06-24 基于特征数据挖掘及神经网络的肿瘤的分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610488243.3A CN106204532B (zh) 2016-06-24 2016-06-24 基于特征数据挖掘及神经网络的肿瘤的分类方法

Publications (2)

Publication Number Publication Date
CN106204532A true CN106204532A (zh) 2016-12-07
CN106204532B CN106204532B (zh) 2019-01-18

Family

ID=57460950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610488243.3A Active CN106204532B (zh) 2016-06-24 2016-06-24 基于特征数据挖掘及神经网络的肿瘤的分类方法

Country Status (1)

Country Link
CN (1) CN106204532B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107492071A (zh) * 2017-08-17 2017-12-19 京东方科技集团股份有限公司 医学图像处理方法及设备
CN108231177A (zh) * 2017-12-28 2018-06-29 深圳开立生物医疗科技股份有限公司 一种辅助更新方法、系统及装置
CN108417271A (zh) * 2018-01-11 2018-08-17 复旦大学 基于精神障碍亚型分类的精神抑制药物推荐方法与系统
CN108564582A (zh) * 2018-04-23 2018-09-21 重庆大学 一种基于深度神经网络的mri脑肿瘤自动识别方法
CN108986918A (zh) * 2018-06-28 2018-12-11 东软集团股份有限公司 辅助诊断方法、装置、终端设备和计算机存储介质
CN110111901A (zh) * 2019-05-16 2019-08-09 湖南大学 基于rnn神经网络的可迁移病人分类系统
CN110298383A (zh) * 2019-05-28 2019-10-01 中国科学院计算技术研究所 基于多模态深度学习的病理分类方法及系统
CN113470828A (zh) * 2021-06-30 2021-10-01 上海商汤智能科技有限公司 分类方法及装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110106740A1 (en) * 2002-05-24 2011-05-05 University Of South Florida Tissue classification method for diagnosis and treatment of tumors
US20120157344A1 (en) * 2008-08-06 2012-06-21 Tel Hashomer Medical Research Infrastructure And Services Ltd. Gene expression signature for classification of kidney tumors
CN104143101A (zh) * 2014-07-01 2014-11-12 华南理工大学 一种基于超声图像的乳腺肿瘤区域自动识别方法
CN104834943A (zh) * 2015-05-25 2015-08-12 电子科技大学 一种基于深度学习的脑肿瘤分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110106740A1 (en) * 2002-05-24 2011-05-05 University Of South Florida Tissue classification method for diagnosis and treatment of tumors
US20120157344A1 (en) * 2008-08-06 2012-06-21 Tel Hashomer Medical Research Infrastructure And Services Ltd. Gene expression signature for classification of kidney tumors
CN104143101A (zh) * 2014-07-01 2014-11-12 华南理工大学 一种基于超声图像的乳腺肿瘤区域自动识别方法
CN104834943A (zh) * 2015-05-25 2015-08-12 电子科技大学 一种基于深度学习的脑肿瘤分类方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107492071A (zh) * 2017-08-17 2017-12-19 京东方科技集团股份有限公司 医学图像处理方法及设备
CN108231177A (zh) * 2017-12-28 2018-06-29 深圳开立生物医疗科技股份有限公司 一种辅助更新方法、系统及装置
WO2019128522A1 (zh) * 2017-12-28 2019-07-04 深圳开立生物医疗科技股份有限公司 一种辅助更新方法、系统及装置
CN108417271A (zh) * 2018-01-11 2018-08-17 复旦大学 基于精神障碍亚型分类的精神抑制药物推荐方法与系统
CN108417271B (zh) * 2018-01-11 2021-11-19 复旦大学 基于精神障碍亚型分类的精神抑制药物推荐方法与系统
CN108564582B (zh) * 2018-04-23 2020-08-11 重庆大学 一种基于深度神经网络的mri脑肿瘤图像自动优化方法
CN108564582A (zh) * 2018-04-23 2018-09-21 重庆大学 一种基于深度神经网络的mri脑肿瘤自动识别方法
CN108986918A (zh) * 2018-06-28 2018-12-11 东软集团股份有限公司 辅助诊断方法、装置、终端设备和计算机存储介质
CN110111901A (zh) * 2019-05-16 2019-08-09 湖南大学 基于rnn神经网络的可迁移病人分类系统
CN110111901B (zh) * 2019-05-16 2023-04-18 湖南大学 基于rnn神经网络的可迁移病人分类系统
CN110298383B (zh) * 2019-05-28 2021-07-13 中国科学院计算技术研究所 基于多模态深度学习的病理分类方法及系统
CN110298383A (zh) * 2019-05-28 2019-10-01 中国科学院计算技术研究所 基于多模态深度学习的病理分类方法及系统
CN113470828A (zh) * 2021-06-30 2021-10-01 上海商汤智能科技有限公司 分类方法及装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN106204532B (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
CN106204532A (zh) 基于特征数据挖掘及神经网络的肿瘤的分类方法
CN110010219B (zh) 光学相干层析图像视网膜病变智能检测系统及检测方法
CN106056595B (zh) 基于深度卷积神经网络自动识别甲状腺结节良恶性的辅助诊断系统
CN108257135A (zh) 基于深度学习方法解读医学图像特征的辅助诊断系统
Li et al. A fully automatic computer-aided diagnosis system for hepatocellular carcinoma using convolutional neural networks
CN107680678A (zh) 基于多尺度卷积神经网络甲状腺超声图像结节自动诊断系统
CN106372390A (zh) 一种基于深度卷积神经网络的预防肺癌自助健康云服务系统
US20090082637A1 (en) Multi-modality fusion classifier with integrated non-imaging factors
CN106780448A (zh) 一种基于迁移学习与特征融合的超声甲状腺结节良恶性分类方法
Che et al. Liver disease classification from ultrasound using multi-scale CNN
CN101551854B (zh) 不平衡医学影像处理系统及其处理方法
CN104809480A (zh) 一种基于分类回归树和AdaBoost的眼底图像视网膜血管分割方法
CN106096636A (zh) 一种基于神经影像的进展型轻度认知功能障碍识别方法
CN106203488A (zh) 一种基于受限玻尔兹曼机的乳腺图像特征融合方法
CN111767952B (zh) 一种可解释的肺结节良恶性分类方法
CN106650768A (zh) 基于高斯图模型的脑网络建模与模式分类方法
CN101714153A (zh) 基于视觉感知的交互式乳腺钼靶图像检索方法
Costaridou Medical image analysis methods
CN106529188A (zh) 应用于手术导航的图像处理方法
CN108062749A (zh) 肛提肌裂孔的识别方法、装置和电子设备
Jin et al. White matter hyperintensity segmentation from T1 and FLAIR images using fully convolutional neural networks enhanced with residual connections
Zuo et al. An embedded multi-branch 3D convolution neural network for false positive reduction in lung nodule detection
CN106778830A (zh) 基于双聚类挖掘及AdaBoost的肿瘤分类方法
Chen et al. Classification of breast tumors in ultrasound using biclustering mining and neural network
CN114332572B (zh) 基于显著图引导分层密集特征融合网络用于提取乳腺病变超声图像多尺度融合特征参数方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant