CN1462884A - 一种高精度、低假阴性率的肺癌细胞图像识别方法 - Google Patents

一种高精度、低假阴性率的肺癌细胞图像识别方法 Download PDF

Info

Publication number
CN1462884A
CN1462884A CN03131975A CN03131975A CN1462884A CN 1462884 A CN1462884 A CN 1462884A CN 03131975 A CN03131975 A CN 03131975A CN 03131975 A CN03131975 A CN 03131975A CN 1462884 A CN1462884 A CN 1462884A
Authority
CN
China
Prior art keywords
neural network
integrated
cell image
image
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN03131975A
Other languages
English (en)
Inventor
周志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN03131975A priority Critical patent/CN1462884A/zh
Publication of CN1462884A publication Critical patent/CN1462884A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种高精度、低假阴性率的肺癌细胞图像识别方法,该方法利用光学显微镜上安置的数字摄像机拍摄细胞病理切片,数字摄像机产生的视频信号经图像采集设备后进入计算机,在经过适当的图像预处理之后,将细胞的图像交给肺癌细胞图像识别部分进行处理。本发明的方法在进行肺癌细胞识别时,先用第一级神经网络集成进行处理,只有第一级神经网络集成中的所有神经网络都预测“正常”,才认为当前细胞图像中不是癌细胞;只要有一个神经网络预测“可能有癌”,就认为当前细胞图像中很可能是癌细胞,需要提交给第二级神经网络进行处理。这种方法使得癌细胞被错当成正常细胞的机会很小,从而可以获得很高的识别精度和很低的假阴性率。

Description

一种高精度、低假阴性率的肺癌细胞图像识别方法
一、技术领域
本发明涉及计算机辅助肺癌诊断装置,特别涉及一种从病理切片细胞图像中高精度、低假阴性率地识别出肺癌细胞的方法。
二、背景技术
肺癌是一种严重的致命性疾病,医学上对其进行诊断的主要手段有X线胸片、CT、核磁共振、同位素、纤维支气管镜、经皮穿刺活检等。随着计算机技术的发展,计算机辅助肺癌诊断装置由于不受疲劳、情绪等因素的影响,已成为重要的辅助诊断手段。目前的绝大多数计算机辅助肺癌诊断装置都是对X线胸片图象、CT图象进行分析处理,直接对病理切片细胞图像进行分析处理的很少。由于病理性诊断可靠性较高,因此利用病理切片细胞图像的辅助诊断装置可望具有更好的性能。值得注意的是,在对肺癌的诊断中,将患者误诊为健康人的代价非常大,因为这会耽误患者获得及时救治的机会,尤其是在肺癌早期,如果诊断及时尚有治疗手段,而一旦在早期误诊,对患者的生命将产生极大的危害。而如果将健康人误诊为患者,虽然会给医护人员和被诊对象及其亲属带来不必要的麻烦,但随着进一步诊治的进行,误诊可望得到纠正,其代价远远小于将患者误诊为健康人的情况。因此,在对病理切片细胞图像进行分析处理时,应在将识别精度保持在较高水平的同时,尽可能降低假阴性率,即尽可能降低将肺癌细胞错误地当成正常细胞的误识率。然而,现有技术只注重获得高的识别精度,没有考虑肺癌诊断中保持较低的假阴性率的要求,这会对整个计算机辅助肺癌诊断装置造成不利影响。
三、发明内容
本发明的目的是针对现有技术难以从病理切片细胞图像中高精度且低假阴性率地识别出肺癌细胞的问题,提供一种高精度且低假阴性率的肺癌细胞图像识别方法以辅助提高计算机辅助肺癌诊断装置的性能。
为实现本发明所述目的,本发明提供一种利用机器学习中的神经网络集成技术对肺癌细胞图像进行识别的方法,该方法包括以下步骤:(1)若识别机制未训练好,则执行步骤2,否则转到步骤4;(2)分别产生两级神经网络集成的训练数据集;(3)利用可重复取样技术分别产生两级神经网络集成;(4)接收待识别的细胞图像;(5)第一级神经网络集成进行预测,若结果为“可能有癌”则执行步骤6,否则给出诊断结论“正常”并转到步骤7;(6)第二级神经网络集成进行预测,给出诊断结论“正常”或具体的癌细胞种类,执行步骤7;(7)结束。
下面将结合附图对最佳实施例进行详细说明。
四、附图说明
图1是基于病理切片细胞图像识别的计算机辅助肺癌诊断装置的工作流程图。
图2是本发明方法的流程图。
图3是产生训练数据集的流程图。
图4是第一级神经网络集成进行预测的流程图。
图5是第二级神经网络集成进行预测的流程图。
五、具体实施方式
如图1所示,计算机辅助肺癌诊断装置利用光学显微镜上安置的数字摄像机拍摄细胞病理切片,该切片通常已用苏木素-伊红等手段进行染色,数字摄像机产生的视频信号经图像采集设备后进入计算机,在经过适当的图像预处理例如增强、去噪、分割等之后,将细胞的图像交给肺癌细胞图像识别部分进行处理。本发明主要涉及图1中肺癌细胞图像识别部分,即图1中步骤1。
本发明的方法如图2所示。步骤10是初始动作。步骤11判断识别机制是否已经训练好,若已训练好则可处理识别任务,执行步骤17;否则需进行训练,执行步骤12。步骤12分别产生两级神经网络集成的训练数据集,为叙述方便,称第一级神经网络集成的训练数据集为L1、第二级神经网络集成的训练数据集为L2,该步骤将在后面的部分结合图3进行具体介绍。
图2的步骤13利用统计学中常用的可重复取样技术从L1中产生N个数据集,N是一个用户预设的整数值例如5,它确定了第一级神经网络集成所包含的神经网络个数。步骤14用步骤13产生的N个数据集中的每一个训练出一个神经网络,这些神经网络就组成了第一级神经网络集成。步骤15利用可重复取样技术从L2中产生M个数据集,M是一个用户预设的整数值例如9,它确定了第二级神经网络集成所包含的神经网络个数。步骤16用步骤15产生的M个数据集中的每一个训练出一个神经网络,这些神经网络就组成了第二级神经网络集成。步骤14和步骤16使用的神经网络可以是任何类型的神经网络,只要可以执行预测任务即可,例如可以使用神经网络教科书中介绍的多层前馈BP网络。
图2的步骤17接收待识别的细胞图像。步骤18对细胞图像进行特征提取并将其表示为向量,例如[t1,t2,…,tn],其中t1表示第一个特征值,t2表示第二个特征值,依此类推。这里可以使用任何特征提取技术,例如图像处理教科书中介绍的形态学技术等。步骤19将细胞图像的特征向量提交给第一级神经网络集成进行预测,该步骤将在后面的部分结合图4进行具体介绍。步骤20对第一级神经网络集成的预测结果进行判断,如果结果为“可能有癌”则执行步骤21;否则转到步骤23给出诊断结论“正常”并执行步骤24。步骤21将细胞图像的特征向量提交给第二级神经网络集成进行预测,该步骤将在后面的部分结合图5进行具体介绍。步骤22将第二级神经网络集成的预测结果作为诊断结论,如果发现癌细胞则给出的是具体的癌细胞种类例如鳞癌、腺癌、小细胞癌等,否则给出的是“正常”。步骤24是结束状态。
图3详细说明了图2的步骤12,其作用是利用一组已知结果的细胞图像产生第一级神经网络集成的训练数据集L1和第二级神经网络集成的训练数据集L2。图3的步骤120是起始状态。步骤121将L1和L2均置为空集。步骤122接收一幅已知结果的细胞图像。然后进行特征提取并将其表示为向量,该步骤与图2中的步骤18相同,采用的特征提取技术和提取出的特征数也相同。
图3的步骤123检查当前细胞图像的已知结果,如果这是一个癌细胞,则执行步骤124;否则转到步骤126。步骤124将“可能有癌”作为当前细胞图像所对应的特征向量的类别,并将该特征向量及其类别一起加入L1。步骤125将具体的癌细胞种类例如鳞癌、腺癌、小细胞癌等作为当前细胞图像所对应的特征向量的类别,并将该特征向量及其类别一起加入L2。步骤126将“正常”作为当前细胞图像所对应的特征向量的类别,并将该特征向量及其类别一起同时加入L1和L2。通常要使用大量已知结果的细胞图像来产生训练数据集,步骤127判断是否还有其他图像,如果是则转到步骤122;否则执行步骤128,即图3的结束状态。
图4详细说明了图2的步骤19,其作用是利用训练好的第一级神经网络集成对待识细胞图像所对应的特征向量进行识别。图4的步骤190是起始状态。步骤191将控制参数k置为1,k是一个大于等于1但小于等于图2中步骤13的N的一个整数值,它用来指示当前考察的第一级神经网络集成中的神经网络的序号。步骤192取得第一级神经网络集成中第k个神经网络对待识细胞图像所对应的特征向量给出的预测结果,为叙述方便,称该结果为Fk (1)。步骤193对Fk (1)进行考察,如果Fk (1)是“正常”,则执行步骤194;否则就转到步骤196给出结果“可能有癌”,然后执行步骤198。步骤194将k加一。步骤195判断k是否小于等于第一级神经网络集成中神经网络的个数,即图2中步骤13的N,如果是则表明还有其他神经网络尚未考察,转到步骤192;否则就执行步骤197给出结果“正常”,然后执行步骤198。步骤198是图4的结束状态。
图5详细说明了图2的步骤21,其作用是利用训练好的第二级神经网络集成对待识细胞图像所对应的特征向量进行识别。图5的步骤210是起始状态。步骤211为每个类别分别设置一个计数器,这些计数器用来记录有多少个第二级神经网络给出的预测结果是该类别,这里的各类别分别对应了“正常”或具体的癌细胞种类例如鳞癌、腺癌、小细胞癌等。步骤212将所有计数器清零。步骤213将控制参数k置为1,k是一个大于等于1但小于等于图2中步骤15的M的一个整数值,它用来指示当前考察的第二级神经网络集成中的神经网络的序号。步骤214取得第二级神经网络集成中第k个神经网络对待识细胞图像所对应的特征向量给出的预测结果,为叙述方便,称该结果为Fk (2)。步骤215将Fk (2)所对应的类别的计数器加一。步骤216将k加一。步骤217判断k是否小于等于第二级神经网络集成中神经网络的个数,即图2中步骤15的M,如果是则表明还有其他神经网络尚未考察,转到步骤214;否则就执行步骤218。步骤218对所有计数器中的值进行比较,找出值最大的计数器,并将其对应的类别作为第二级神经网络集成的预测结果;如果有多个计数器中的值均为最大值,则以这些计数器对应的类别中出现机会最大的癌细胞种类作为预测结果。步骤219是图5的结束状态。
从以上具体实施方式可看出,本发明的方法在进行肺癌细胞识别时,先用第一级神经网络集成进行处理,只有第一级神经网络集成中的所有神经网络都预测“正常”,才认为当前细胞图像中不是癌细胞;只要有一个神经网络预测“可能有癌”,就认为当前细胞图像中很可能是癌细胞,需要提交给第二级神经网络进行处理之后再给出诊断结论。这种独特的二级神经网络集成结构和处理方式就使得癌细胞被错当成正常细胞的机会很小,从而使本发明的方法可以获得很高的识别精度和很低的假阴性率。

Claims (4)

1、一种高精度、低假阴性率的肺癌细胞图像识别方法,包括利用光学显微镜上安置的数字摄像机拍摄细胞病理切片,数字摄像机产生的视频信号经图像采集设备后进入计算机,在经过适当的图像预处理之后,将细胞的图像交给肺癌细胞图像识别部分进行处理;其特征是:所述的肺癌细胞图像识别部分包括以下步骤:
(1)若识别机制未训练好,则执行步骤(2),否则转到步骤(4);
(2)分别产生两级神经网络集成的训练数据集;
(3)利用可重复取样技术分别产生两级神经网络集成;
(4)接收待识别的细胞图像;
(5)第一级神经网络集成进行预测,若结果为“可能有癌”则执行步骤(6),否则给出诊断结论“正常”并转到步骤(7);
(6)第二级神经网络集成进行预测,给出诊断结论“正常”或具体的癌细胞种类,执行步骤(7);
(7)结束。
2、根据权利要求1所述的一种高精度、低假阴性率的肺癌细胞图像识别方法,其特征是:
所述(2)的步骤是:
(1)将L1和L2均置为空集;
(2)接收一幅已知结果的细胞图像,然后进行特征提取并将其表示为向量;
(3)检查当前细胞图像的已知结果,如果这是一个癌细胞,则执行步骤(4);否则转到步骤(6);
(4)将“可能有癌”作为当前细胞图像所对应的特征向量的类别,并将该特征向量及其类别一起加入L1
(5)将具体的癌细胞种类作为当前细胞图像所对应的特征向量的类别,并将该特征向量及其类别一起加入L2
(6)将“正常”作为当前细胞图像所对应的特征向量的类别,并将该特征向量及其类别一起同时加入L1和L2
(7)判断是否还有其他图像,如果是则转到步骤(2);否则执行步骤(8);
(8)结束。
3、根据权利要求1所述的一种高精度、低假阴性率的肺癌细胞图像识别方法,其特征是:
所述(5)中第一级神经网络集成进行预测的步骤是:
(1)将控制参数k置为1,k是一个大于等于1但小于等于N的一个整数值;
(2)取得第一级神经网络集成中第k个神经网络对待识细胞图像所对应的特征向量给出的预测结果Fk (1)
(3)对Fk (1)进行考察,如果Fk (1)是“正常”,则执行步骤(4);否则就给出结果“可能有癌”,然后结束;
(4)将k加一;
(5)判断k是否小于等于第一级神经网络集成中神经网络的个数N,如果是则转到步骤(2);否则给出结果“正常”,然后结束。
4、根据权利要求1所述的一种高精度、低假阴性率的肺癌细胞图像识别方法,其特征是:
所述(6)中第二级神经网络集成进行预测的步骤是:
(1)为每个类别分别设置一个计数器;
(2)将所有计数器清零;
(3)将控制参数k置为1,k是一个大于等于1但小于等于M的一个整数值;
(4)取得第二级神经网络集成中第k个神经网络对待识细胞图像所对应的特征向量给出的预测结果Fk (2)
(5)将Fk (2)所对应的类别的计数器加一;
(6)将k加一;
(7)判断k是否小于等于第二级神经网络集成中神经网络的个数M,如果是则转到步骤(4);否则执行步骤(8);
(8)对所有计数器中的值进行比较,找出值最大的计数器,并将其对应的类别作为第二级神经网络集成的预测结果;如果有多个计数器中的值均为最大值,则以这些计数器对应的类别中出现机会最大的癌细胞种类作为预测结果;
(9)结束。
CN03131975A 2003-06-24 2003-06-24 一种高精度、低假阴性率的肺癌细胞图像识别方法 Pending CN1462884A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN03131975A CN1462884A (zh) 2003-06-24 2003-06-24 一种高精度、低假阴性率的肺癌细胞图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN03131975A CN1462884A (zh) 2003-06-24 2003-06-24 一种高精度、低假阴性率的肺癌细胞图像识别方法

Publications (1)

Publication Number Publication Date
CN1462884A true CN1462884A (zh) 2003-12-24

Family

ID=29748492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN03131975A Pending CN1462884A (zh) 2003-06-24 2003-06-24 一种高精度、低假阴性率的肺癌细胞图像识别方法

Country Status (1)

Country Link
CN (1) CN1462884A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101226133B (zh) * 2008-01-28 2010-04-14 宁波大学 一种血细胞脉冲信号的分类识别方法
CN102253922A (zh) * 2010-05-18 2011-11-23 北京普利生仪器有限公司 远程分析病理切片的方法
WO2012139313A1 (zh) * 2011-05-03 2012-10-18 杭州一二八医院 利用软x射线显微成像进行癌细胞图形识别的方法
CN103175834A (zh) * 2013-01-28 2013-06-26 宁波江丰生物信息技术有限公司 一种数字病理切片质量评价方法和系统
CN106361280A (zh) * 2016-08-30 2017-02-01 孟玲 一种组合虹膜和皮层组织的生物光学成像装置采用的光学成像装置
CN107016665A (zh) * 2017-02-16 2017-08-04 浙江大学 一种基于深度卷积神经网络的ct肺结节检测方法
CN107103182A (zh) * 2017-03-28 2017-08-29 南京医科大学 一种基于深度学习算法的心脏性疾病风险预警系统及方法
CN108231189A (zh) * 2017-12-12 2018-06-29 华南师范大学 基于双深度神经学习网络的数据处理方法和疾病诊断装置
CN108961249A (zh) * 2018-07-19 2018-12-07 厦门理工学院 一种子宫颈癌细胞再识别诊断方法
CN109856015A (zh) * 2018-11-26 2019-06-07 深圳辉煌耀强科技有限公司 一种癌细胞自动诊断的快速处理方法及其系统
CN110119710A (zh) * 2019-05-13 2019-08-13 广州锟元方青医疗科技有限公司 细胞分类方法、装置、计算机设备和存储介质
CN111767929A (zh) * 2019-03-14 2020-10-13 上海市第一人民医院 黄斑下新生血管模型的构建方法及系统
CN113033287A (zh) * 2021-01-29 2021-06-25 杭州依图医疗技术有限公司 病理图像的显示方法及装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101226133B (zh) * 2008-01-28 2010-04-14 宁波大学 一种血细胞脉冲信号的分类识别方法
CN102253922A (zh) * 2010-05-18 2011-11-23 北京普利生仪器有限公司 远程分析病理切片的方法
CN102253922B (zh) * 2010-05-18 2013-07-03 北京普利生仪器有限公司 远程分析病理切片的方法
WO2012139313A1 (zh) * 2011-05-03 2012-10-18 杭州一二八医院 利用软x射线显微成像进行癌细胞图形识别的方法
US9081998B2 (en) 2011-05-03 2015-07-14 NO. 128 Hospital of Hangzhou Method for utilizing soft X-ray microimaging for cancer cell image recognition
CN103175834A (zh) * 2013-01-28 2013-06-26 宁波江丰生物信息技术有限公司 一种数字病理切片质量评价方法和系统
CN103175834B (zh) * 2013-01-28 2016-05-18 宁波江丰生物信息技术有限公司 一种数字病理切片质量检测方法和系统
CN106361280A (zh) * 2016-08-30 2017-02-01 孟玲 一种组合虹膜和皮层组织的生物光学成像装置采用的光学成像装置
CN107016665A (zh) * 2017-02-16 2017-08-04 浙江大学 一种基于深度卷积神经网络的ct肺结节检测方法
CN107016665B (zh) * 2017-02-16 2021-05-04 浙江大学 一种基于深度卷积神经网络的ct肺结节检测方法
CN107103182A (zh) * 2017-03-28 2017-08-29 南京医科大学 一种基于深度学习算法的心脏性疾病风险预警系统及方法
CN108231189A (zh) * 2017-12-12 2018-06-29 华南师范大学 基于双深度神经学习网络的数据处理方法和疾病诊断装置
CN108961249A (zh) * 2018-07-19 2018-12-07 厦门理工学院 一种子宫颈癌细胞再识别诊断方法
CN109856015A (zh) * 2018-11-26 2019-06-07 深圳辉煌耀强科技有限公司 一种癌细胞自动诊断的快速处理方法及其系统
CN109856015B (zh) * 2018-11-26 2021-08-17 深圳辉煌耀强科技有限公司 一种癌细胞自动诊断的快速处理方法及其系统
CN111767929A (zh) * 2019-03-14 2020-10-13 上海市第一人民医院 黄斑下新生血管模型的构建方法及系统
CN110119710A (zh) * 2019-05-13 2019-08-13 广州锟元方青医疗科技有限公司 细胞分类方法、装置、计算机设备和存储介质
CN113033287A (zh) * 2021-01-29 2021-06-25 杭州依图医疗技术有限公司 病理图像的显示方法及装置
CN113033287B (zh) * 2021-01-29 2024-10-15 杭州依图医疗技术有限公司 病理图像的显示方法及装置

Similar Documents

Publication Publication Date Title
AU2020200835B2 (en) System and method for reviewing and analyzing cytological specimens
WO2021093448A1 (zh) 图像处理方法、装置、服务器、医疗图像处理设备及存储介质
CN1462884A (zh) 一种高精度、低假阴性率的肺癌细胞图像识别方法
CN114549469A (zh) 一种基于置信度校准的深层神经网络医疗图像诊断方法
CN116580394A (zh) 一种基于多尺度融合和可变形自注意力的白细胞检测方法
Bouatmane et al. Round-Robin sequential forward selection algorithm for prostate cancer classification and diagnosis using multispectral imagery
WO2019102042A1 (en) Automated screening of histopathology tissue samples via classifier performance metrics
WO2019098415A1 (ko) 자궁경부암에 대한 피검체의 발병 여부를 판정하는 방법 및 이를 이용한 장치
US20230022030A1 (en) Systems and methods for processing images for image matching
JP2023532292A (ja) 機械学習ベースの医療データチェッカ
Krishna et al. An interpretable decision-support model for breast cancer diagnosis using histopathology images
Koriakina et al. The effect of within-bag sampling on end-to-end multiple instance learning
CN112990339B (zh) 胃病理切片图像分类方法、装置及存储介质
Hossain et al. Leukemia detection mechanism through microscopic image and ML techniques
CN115439683A (zh) 基于注意力机制的白细胞细粒度分类方法
CN114155578A (zh) 人像聚类方法、装置、电子设备和存储介质
Chu Machine learning for automation of Chromosome based Genetic Diagnostics
CN112086174A (zh) 一种三维知识诊断模型构建方法和系统
Li et al. An accurate classification method based on multi-focus videos and deep learning for urinary red blood cell
CN115272249B (zh) 一种缺陷检测方法、装置、计算机设备和存储介质
Kukar et al. Multi-resolution image parametrization in stepwise diagnostics of coronary artery disease
Shafique et al. Immunohistochemistry Biomarkers-Guided Image Search for Histopathology
Muttakin et al. Comparative Analysis of Diverse Architectures for Accurate Blood Cancer Cell Classification
CN115100183A (zh) 基于深度可分离卷积模型的结石识别定位方法及相关设备
Subha Darathy et al. A novel deep neural network with adaptive sine cosine crow search (DNN-ASCCS) model for content based medical image reterival

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication