CN106204532B - 基于特征数据挖掘及神经网络的肿瘤的分类方法 - Google Patents
基于特征数据挖掘及神经网络的肿瘤的分类方法 Download PDFInfo
- Publication number
- CN106204532B CN106204532B CN201610488243.3A CN201610488243A CN106204532B CN 106204532 B CN106204532 B CN 106204532B CN 201610488243 A CN201610488243 A CN 201610488243A CN 106204532 B CN106204532 B CN 106204532B
- Authority
- CN
- China
- Prior art keywords
- feature
- neural network
- diagnostic mode
- characteristic
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 17
- 238000009412 basement excavation Methods 0.000 title claims abstract description 13
- 239000013598 vector Substances 0.000 claims abstract description 20
- 238000003745 diagnosis Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000002604 ultrasonography Methods 0.000 claims abstract description 8
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 239000000284 extract Substances 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 9
- 238000003062 neural network model Methods 0.000 claims description 8
- 238000013135 deep learning Methods 0.000 claims description 2
- 230000003902 lesion Effects 0.000 abstract description 4
- 238000013480 data collection Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004195 computer-aided diagnosis Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000505 pernicious effect Effects 0.000 description 3
- 230000008092 positive effect Effects 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10132—Ultrasound image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于特征数据挖掘及神经网络的肿瘤分类方法,该方法首先选取肿瘤超声图片的有效病变特征的人工评分数据作为原始特征数据集;之后采用双聚类算法从原始训练数据集中挖掘出有效的局部诊断模式;其次根据这些诊断模式提取出更高层的特征,形成新的特征向量;接着,新的特征向量作为神经网络的输入进行训练得到有效的多类别分类器;最后,采用同样的方式为测试样本提取特征向量,利用训练得到的多类别分类器对其进行分类,得到肿瘤的具体分类结果。本方法克服传统计算机辅助方法局限于低级图像特征的不足,通过从大量人工评分特征数据集中挖掘出更高层的有效特征,并利用流行的神经网络分类方法训练出最终识别多类别肿瘤的分类器。
Description
技术领域
本发明涉及超声肿瘤图片识别诊断领域,具体涉及一种基于特征数据挖掘及神经网络的肿瘤分类方法。
背景技术
近几十年来,肿瘤发病率逐年上升,从全球范围内来看,肿瘤癌症已成为居民死亡的首要原因,每年都有好几百万人死于肿瘤癌症。肿瘤癌症严重威胁着人们的生命健康,它的治疗和预防也成为了全球医学及相关领域科学家的关注焦点。临床研究表明,早期对肿瘤疾病进行准确的分类是治疗肿瘤的关键。精准的分类不仅有助于提高肿瘤患者的治愈率,而且对患者产生的副作用也更小。当前,超声影像凭借其性价比高、无辐射、快速方便、副作用小的优势,逐渐成为临床医疗中一种常用的成像技术。但是,受成像原理和一些技术上的限制,超图图像不可避免地具有噪声斑点、信噪比低的缺点。医生仅仅通过观察超声图像进行肿瘤疾病的诊断仍然存在一定的困难,容易造成误诊和漏诊。为此,计算机辅助诊断技术作为医生临床诊断的第二参考,对提高医生诊断准确率起到了积极作用,近年来获得越来越多的关注。
据调研,目前大多数医学计算机辅助诊断系统主要是先对超声影像进行预处理,结合图像分析技术提取出感兴趣区域的纹理特征,通过特征选择方法筛选出有效特征,最后利用支持向量机等机器学习方法进行肿瘤良恶性分类。这些方法存在一些局限性:(1)局限于图像像素灰度、纹理计算出来的低级特征用于分类,与医生临床上描述判断肿瘤的高级语义特征有着较大差异,很难得到医生易于接受和理解的诊断结果;(2)步骤环节过于复杂,数值化特征的准确性严重依赖图像质量、预处理及图像分割效果;(3)只涉及良性、恶性肿瘤大类分类,无法给出更具体分类结果,辅助医生后续进行精准治疗。在模式分类领域,特征选择对最终分类的性能有着至关重要的影响。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于特征数据挖掘及神经网络的肿瘤分类方法。
本发明的目的通过下述技术方案实现:
一种基于特征数据挖掘及神经网络的肿瘤分类方法,该方法包括下列步骤:
S1、医生根据已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量;
S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,进而提取出N个有效的诊断模式;
S4、利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量;
S5、将步骤S4得到的N维特征向量作为输入,利用神经网络模式进行训练,得到肿瘤多类别分类器;
S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
进一步地,所述步骤S3中提取的有效诊断模式具有如下要求:
挖掘到的双聚类只有在行数所代表的病例样本数目及列数所代表的特征数目满足一定阈值,才判断为有效的诊断模式。
进一步地,所述步骤S4中提取出更高层次的特征具体过程如下:
S41、计算肿瘤病例特征打分与每一个诊断模式之间的相似度;
S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则形成维度为N的一个新的特征向量。
进一步地,所述步骤S5中的神经网络模式包括传统反向传播神经网络模型和深度学习神经网络模型。
进一步地,所述相似度的衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差RMSD,其公式如下:
其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud(j)为肿瘤样本的第j个特征值,Vdr(j)为诊断模式的第j个特征值。
本发明相对于现有技术具有如下的优点及效果:
1、克服了传统计算机辅助诊断方法从超声图像提取纹理、形态、灰度等低级特征用于训练分类器的不足,直接采用临床医疗中医生常用的有效病变描述特征人工评分数据特征,实施步骤简单且更易于被医生接受。
2、利用双聚类算法挖掘出的有效诊断模式提取出更高层次的特征,使得所产生的特征向量具有更好的识别分类效果,对简化神经网络的复杂度具有积极作用。
3、不同于传统分类器仅仅进行良恶性进行分类,本方法利用神经网络模型训练出的多分类分类器,可以识别出患者肿瘤的具体分类类别,从而辅助医生进行精准治疗,具有重要的临床应用价值。
附图说明
图1是本发明中公开的基于特征数据挖掘及神经网络模型的肿瘤分类方法的流程步骤图;
图2是本发明方法中利用诊断模式产生高层次特征方法的示意图;
图3是本发明实施例中的一种反向传播神经网络模型的示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
请参见图1,图1是本实施例中公开的基于特征数据挖掘及神经网络的肿瘤分类方法的流程步骤图。图1所示的基于特征数据挖掘及神经网络的肿瘤分类方法运用于乳腺肿瘤,具体包括下列步骤:
S1、医生根据M个已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量;
S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,将行数(代表病例样本数目)及列数(代表特征数目)满足一定阈值的双聚类筛选出来,进而提取出N个有效的诊断模式;
S4、如图2所示,利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量,具体步骤为:
S41、计算乳腺肿瘤病例特征打分与每一个诊断模式之间的相似度,本实施例中,相似度衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差(RMSD),具体应用中,该相似度的衡量方法可以扩展为其它常用方法,此次举例不构成对本技术方案的限制。
均方根误差(RMSD)具体如下:
其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud(j)为肿瘤样本的第j个特征值,Vdr(j)为诊断模式的第j个特征值。
S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则可以形成维度为N的一个新的特征向量。
S5、将步骤S4特征向量作为新的输入,利用神经网络模式进行训练,得到乳腺肿瘤多类别分类器,其中神经网络模式采用如图3所示的四层多分类反向传播神经网络,具体应用中,神经网络模式不局限于传统反向传播神经网络模型,也可以是深度学习神经网络模型。
S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3中得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
综上所述,本实施例中公开的基于特征数据挖掘及神经网络的肿瘤分类方法,首先选取肿瘤超声图片的有效病变特征的人工评分数据作为原始特征数据集;之后采用双聚类算法从原始训练数据集中挖掘出有效的局部诊断模式;其次根据这些诊断模式提取出更高层的特征,形成新的特征向量;接着,这些新的特征向量作为神经网络的输入进行训练得到有效的多类别分类器;最后,采用同样的方式为测试样本提取特征向量,利用训练得到的多类别分类器对其进行分类,得到肿瘤的具体分类结果。
本发明方法克服了传统计算机辅助诊断方法从超声图像提取纹理、形态、灰度等低级特征用于训练分类器的不足,直接采用临床医疗中医生常用的有效病变描述特征人工评分数据特征,实施步骤简单且更易于被医生接受;利用双聚类算法挖掘出的有效诊断模式提取出更高层次的特征,使得所产生的特征向量具有更好的识别分类效果,对简化神经网络的复杂度具有积极作用;该发明方法不同于传统分类器仅仅进行良恶性进行分类,本方法利用神经网络模型训练出的多分类分类器,可以识别出患者肿瘤的具体分类类别,从而辅助医生进行精准治疗,具有重要的临床应用价值。
Claims (4)
1.一种基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,该方法包括下列步骤:
S1、医生根据已确诊患者肿瘤超声图片超声所见,对临床医疗中有效的K个诊断特征进行人工评分,构成每个肿瘤样本的K维特征向量;
S2、将获取到的原始训练数据集中的每个特征归一化到0~1范围;
S3、将归一化后的训练数据集作为输入,利用双聚类算法挖掘出列一致模式的双聚类,进而提取出N个有效的诊断模式;
S4、利用提取到N个诊断模式,从原始数据集中提取出更高层次的特征,形成新的N维特征向量;
其中,所述的提取出更高层次的特征具体过程如下:
S41、计算肿瘤病例特征打分与每一个诊断模式之间的相似度;
S42、将上述得到的每一个相似度看做一个新的特征,若有N个诊断模式,则形成维度为N的一个新的特征向量;
S5、将步骤S4得到的N维特征向量作为输入,利用神经网络模式进行训练,得到肿瘤多类别分类器;
S6、对于测试病例,根据超声图片所见获取特征人工评分,归一化后,利用步骤S3得到的诊断模式,提取出高层次特征向量,将其输入到训练好的分类器中,从而得到最终的肿瘤类别信息。
2.根据权利要求1所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述步骤S3中提取的有效诊断模式具有如下要求:
挖掘到的双聚类只有在行数所代表的病例样本数目及列数所代表的特征数目满足一定阈值,才判断为有效的诊断模式。
3.根据权利要求1所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述步骤S5中的神经网络模式包括传统反向传播神经网络模型和深度学习神经网络模型。
4.根据权利要求3所述的基于特征数据挖掘及神经网络的肿瘤分类方法,其特征在于,所述相似度的衡量方法采用样本和诊断模式在诊断模式特征空间下的均方根误差RMSD,其公式如下:
其中,FS为诊断模式的特征空间,n为特征空间FS的特征维度,Vud(j)为肿瘤样本的第j个特征值,Vdr(j)为诊断模式的第j个特征值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610488243.3A CN106204532B (zh) | 2016-06-24 | 2016-06-24 | 基于特征数据挖掘及神经网络的肿瘤的分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610488243.3A CN106204532B (zh) | 2016-06-24 | 2016-06-24 | 基于特征数据挖掘及神经网络的肿瘤的分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106204532A CN106204532A (zh) | 2016-12-07 |
CN106204532B true CN106204532B (zh) | 2019-01-18 |
Family
ID=57460950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610488243.3A Expired - Fee Related CN106204532B (zh) | 2016-06-24 | 2016-06-24 | 基于特征数据挖掘及神经网络的肿瘤的分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106204532B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107492071B (zh) * | 2017-08-17 | 2021-04-27 | 京东方科技集团股份有限公司 | 医学图像处理方法及设备 |
CN108231177A (zh) * | 2017-12-28 | 2018-06-29 | 深圳开立生物医疗科技股份有限公司 | 一种辅助更新方法、系统及装置 |
CN108417271B (zh) * | 2018-01-11 | 2021-11-19 | 复旦大学 | 基于精神障碍亚型分类的精神抑制药物推荐方法与系统 |
CN108564582B (zh) * | 2018-04-23 | 2020-08-11 | 重庆大学 | 一种基于深度神经网络的mri脑肿瘤图像自动优化方法 |
CN108986918A (zh) * | 2018-06-28 | 2018-12-11 | 东软集团股份有限公司 | 辅助诊断方法、装置、终端设备和计算机存储介质 |
CN110111901B (zh) * | 2019-05-16 | 2023-04-18 | 湖南大学 | 基于rnn神经网络的可迁移病人分类系统 |
CN110298383B (zh) * | 2019-05-28 | 2021-07-13 | 中国科学院计算技术研究所 | 基于多模态深度学习的病理分类方法及系统 |
CN113470828A (zh) * | 2021-06-30 | 2021-10-01 | 上海商汤智能科技有限公司 | 分类方法及装置、电子设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104143101A (zh) * | 2014-07-01 | 2014-11-12 | 华南理工大学 | 一种基于超声图像的乳腺肿瘤区域自动识别方法 |
CN104834943A (zh) * | 2015-05-25 | 2015-08-12 | 电子科技大学 | 一种基于深度学习的脑肿瘤分类方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110106740A1 (en) * | 2002-05-24 | 2011-05-05 | University Of South Florida | Tissue classification method for diagnosis and treatment of tumors |
US9068232B2 (en) * | 2008-08-06 | 2015-06-30 | Rosetta Genomics Ltd. | Gene expression signature for classification of kidney tumors |
-
2016
- 2016-06-24 CN CN201610488243.3A patent/CN106204532B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104143101A (zh) * | 2014-07-01 | 2014-11-12 | 华南理工大学 | 一种基于超声图像的乳腺肿瘤区域自动识别方法 |
CN104834943A (zh) * | 2015-05-25 | 2015-08-12 | 电子科技大学 | 一种基于深度学习的脑肿瘤分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106204532A (zh) | 2016-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106204532B (zh) | 基于特征数据挖掘及神经网络的肿瘤的分类方法 | |
CN106780448B (zh) | 一种基于迁移学习与特征融合的超声甲状腺结节良恶性分类系统 | |
CN108257135A (zh) | 基于深度学习方法解读医学图像特征的辅助诊断系统 | |
CN109858540B (zh) | 一种基于多模态融合的医学图像识别系统及方法 | |
CN111767952B (zh) | 一种可解释的肺结节良恶性分类方法 | |
Jony et al. | Detection of lung cancer from CT scan images using GLCM and SVM | |
Šerifović-Trbalić et al. | Classification of benign and malignant masses in breast mammograms | |
Anand et al. | [Retracted] Diagnosis of Prostate Cancer Using GLCM Enabled KNN Technique by Analyzing MRI Images | |
CN106778830A (zh) | 基于双聚类挖掘及AdaBoost的肿瘤分类方法 | |
Li et al. | A dual attention-guided 3D convolution network for automatic segmentation of prostate and tumor | |
Nugroho et al. | Image dermoscopy skin lesion classification using deep learning method: systematic literature review | |
Kukreti et al. | Detection and Classification of Brain Tumour Using EfficientNet and Transfer Learning Techniques | |
CN112508943A (zh) | 基于超声影像的乳腺肿瘤识别方法 | |
CN104331864A (zh) | 基于非下采样轮廓波和视觉显著模型的乳腺影像处理 | |
CN116310525A (zh) | 一种基于对比表示蒸馏与输出蒸馏的病理图像分类方法 | |
Parraga et al. | A review of image-based deep learning algorithms for cervical cancer screening | |
Mohammed et al. | Mammogram images classification using linear discriminant analysis | |
Hussein et al. | Improved model for skin illnesses classification utilizing gray-level co-occurrence matrix and convolution neural network | |
Mangla et al. | Brain tumor detection and classification by MRI images using deep learning techniques | |
Wang et al. | DeepHipp: accurate segmentation of hippocampus using 3D dense-block based on attention mechanism | |
Srilakshmi et al. | Performance enhancement of content based medical image retrieval for MRI brain images based on hybrid approach | |
Nalla et al. | Influence of Convolutional Neural Network Depth on the Efficacy of Automated Breast Cancer Screening Systems | |
Soumya et al. | Enhancing Brain Tumor Diagnosis: Utilizing ResNet-101 on MRI Images for Detection | |
Janapati et al. | A Brief Survey on Feature Extraction Models for Brain Tumor Detection | |
Thepade et al. | Haar wavelet pyramid-based melanoma skin cancer identification with ensemble of machine learning algorithms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190118 |
|
CF01 | Termination of patent right due to non-payment of annual fee |