CN110647945A - 液基宫颈细胞涂片分类方法、系统和实现装置 - Google Patents

液基宫颈细胞涂片分类方法、系统和实现装置 Download PDF

Info

Publication number
CN110647945A
CN110647945A CN201910929639.0A CN201910929639A CN110647945A CN 110647945 A CN110647945 A CN 110647945A CN 201910929639 A CN201910929639 A CN 201910929639A CN 110647945 A CN110647945 A CN 110647945A
Authority
CN
China
Prior art keywords
tct
smear
training
classification
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910929639.0A
Other languages
English (en)
Other versions
CN110647945B (zh
Inventor
刘炳宪
谢菊元
桂坤
操家庆
陈炳宪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Zhituan Information Technology Co Ltd
Original Assignee
Hangzhou Zhituan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Zhituan Information Technology Co Ltd filed Critical Hangzhou Zhituan Information Technology Co Ltd
Priority to CN201910929639.0A priority Critical patent/CN110647945B/zh
Publication of CN110647945A publication Critical patent/CN110647945A/zh
Application granted granted Critical
Publication of CN110647945B publication Critical patent/CN110647945B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种液基宫颈细胞涂片分类方法、系统和实现装置,涉及医学细胞图像处理的技术领域,包括获取TCT涂片信息,训练TCT分类模型;TCT分类模型包括第一层模型和第二层模型;提取TCT涂片信息的特征,标记TCT涂片信息的特征构成第一训练样本;利用第一训练样本训练第一层模型;将第一层模型的预测结果合并为第二训练样本,利用第二训练样本,训练第二层模型;测试TCT分类模型的分类性能,从而获得可靠的TCT涂片分类模型,实现了对TCT涂片阴阳性分数的直接判断,大大减少了病理医生的阅片量。

Description

液基宫颈细胞涂片分类方法、系统和实现装置
技术领域
本发明涉及医学细胞图像处理技术领域,尤其是一种液基宫颈细胞涂片分类方法、系统和实现装置。
背景技术
液基薄层细胞检测(Thinprepcytologic test,TCT)是指采用液基薄层细胞检测系统检测宫颈细胞,并进行细胞学分类诊断的技术。一般说来,宫颈病变的诊断分为三步:TCT检测、阴道镜和病理学诊断,如果TCT显示宫颈细胞异常,那么就应该进一步做阴道镜或病理诊断,从而准确判断病情。
TCT检测是应用于妇女宫颈癌早期筛查的最先进的技术,每年将近有6000万人接受检查,大量的TCT涂片需要病理医生审查,存在审查耗时长、经验不足、人才匮乏等问题,因此液基细胞学(TCT)自动筛查分析系统应运而生。TCT自动筛查分析系统先由图像扫描模块将玻片上的细胞扫描成数字图像,然后采用基于CNN的目标检测网络将涂片中的可疑阴阳性细胞检测出来,可以在一定程度上减少病理医生的工作量。但是,TCT自动筛查分析系统检测出的阴阳性细胞并不能直接指导筛查系统给出TCT涂片的阴阳性分数,即无法直接判别涂片的阴阳性,进而做出筛查判断,仍然存在大量TCT涂片需要病理医生审查的问题。
发明内容
有鉴于此,本发明的目的在于提供一种液基宫颈细胞涂片分类方法、系统和实现装置,以解决现有技术中存在的问题。
第一方面,本实施例提供一种液基宫颈细胞涂片分类方法,包括:
获取TCT涂片信息,训练TCT分类模型;所述TCT分类模型包括第一层模型和第二层模型;
提取所述TCT涂片信息的特征,标记所述TCT涂片信息的特征构成第一训练样本;利用所述第一训练样本训练所述第一层模型;
将所述第一层模型的预测结果合并为第二训练样本,利用所述第二训练样本,训练所述第二层模型;
测试所述TCT分类模型的分类性能,所述TCT分类模型的检出率为90%时,当排阴率低于70%时,继续获取所述TCT涂片信息,训练所述TCT分类模型;当所述排阴率至少为70%时,结束训练。
在一种可选的实施方式中,还包括,获取TCT涂片数字图像,构成待检测图像;
利用所述TCT分类模型,预测所述待检测图像的阴阳性。
在一种可选的实施方式中,所述TCT涂片信息的特征包括细胞可靠性特征、加权组合特征、最大值特征和尺度特征;
所述细胞可靠性特征通过细胞属性分数计算所得,用于表示细胞属性的可靠性;
所述加权组合特征的权重为各阳性类别的可靠度与涂片阴阳性皮尔逊相关度的占比;
所述最大值特征为各类别阳性细胞检测分数的最大值;
所述尺度特征,包括所述TCT涂片的宽度特征和高度特征,用于指导模型进行特征归一化;
所述尺度特征,还包括所述TCT涂片数字图像的物理空间大小,所述物理空间大小与所述TCT涂片中总体细胞量的大小正相关。
在一种可选的实施方式中,所述TCT图片信息的特征还包括制片方式特征。
在一种可选的实施方式中,所述第一层模型包括lightGBM算法、支持向量机(Support Vector Machine,SVM)算法和随机森林(Random Forest)算法。
在一种可选的实施方式中,所述第二层模型包括逻辑回归算法(LogisticRegression)。
本实施例提供的液基宫颈细胞涂片分类方法,通过获取TCT涂片信息,并将提取的涂片信息特征作为训练集,对TCT涂片分类模型进行训练,从而获得可靠的TCT涂片分类模型,实现了对TCT涂片阴阳性分数的直接判断,大大减少了病理医生的阅片量。
第二方面,本实施例提供了一种液基宫颈细胞涂片分类系统,包括:
第一获取单元,用于获取TCT涂片信息,并提取所述TCT涂片信息的特征;
标记单元,标记所述TCT涂片信息的特征构成第一训练样本;
第一训练单元,用于训练TCT分类模型,所述TCT分类模型包括第一层模型和第二层模型;所述第一训练单元利用所述第一训练样本,训练所述第一层模型;
第二训练单元,用于训练TCT分类模型,将所述第一层模型的预测结果合并为第二训练样本,利用所述第二训练样本,训练所述第二层模型;
测试单元,用于测试所述TCT分类模型的分类性能,所述TCT分类模型的检出率为90%时,当排阴率低于70%时,继续获取所述TCT涂片信息,训练所述TCT分类模型;当所述排阴率至少为70%时,结束训练;
第二获取单元,用于获取TCT涂片数字图像,构成待检测图像;
预测单元,利用所述TCT分类模型,预测所述待检测图像的阴阳性。
在一种可选的实施方式中,所述获取单元,提取所述TCT涂片信息的特征包括:细胞可靠性特征、加权组合特征、最大值特征、尺度特征和制片方式特征;
所述尺度特征包括:所述TCT涂片的宽度特征和高度特征和所述TCT涂片的数字图像的物理空间大小。
在一种可选的实施方式中,所述第一训练单元训练所述的第一层模型包括:lightGBM算法、支持向量机SVM算法和随机森林算法;
所述第二训练单元训练所述的第二层模型包括逻辑回归算法(LogisticRegression)。
第三方面,本实施例提供了一种液基宫颈细胞涂片分类实现装置,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现第一方面任一种实施方式所述的方法。
本实施例提供的液基宫颈细胞涂片分类方法、系统和实现装置,通过获取TCT涂片信息,并提取对TCT涂片阴阳性分类最重要的特征,结合机器学习集成模型,训练出TCT涂片分类模型,实现了对TCT涂片阴阳性的直接判断,大大减少了病理医生的阅片量。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种液基宫颈细胞涂片分类方法训练阶段流程图;
图2为本发明实施例提供的另一种液基宫颈细胞涂片分类方法训练阶段流程图;
图3为本发明实施例提供的一种液基宫颈细胞涂片分类方法TCT分类模型结构图;
图4为本发明实施例提供的一种液基宫颈细胞涂片分类系统训练阶段结构示意图;
图5为本发明实施例提供的一种液基宫颈细胞涂片分类系统使用阶段结构示意图。
具体实施方式
TCT检查是液基薄层细胞检测的简称,采用液基薄层细胞检测系统检测宫颈细胞并进行细胞学分类诊断,它是目前国际上最先进的一种宫颈癌细胞学检查技术。TCT检查的广泛应用导致大量的TCT涂片需要病理医生审查,存在审查耗时长、经验不足、人才匮乏等问题,TCT自动筛查分析系统可以在一定程度上缓解以上问题。
TCT自动筛查分析系统先由图像扫描模块将玻片上的细胞扫描成数字图像,然后采用基于CNN的目标检测网络将涂片中的可疑阴阳性细胞检测出来,可以在一定程度上减少病理医生的工作量。但是,TCT自动筛查分析系统检测出的阴阳性细胞并不能直接指导筛查系统给出TCT涂片的阴阳性分数,即无法直接判别涂片的阴阳性,进而做出筛查判断,仍然存在大量TCT涂片需要病理医生审查的问题。
有鉴于此,本发明的目的在于提供一种液基宫颈细胞涂片分类方法、系统和实现装置,以解决现有技术中存在的以上问题。为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一方面,本实施例提供了一种液基宫颈细胞涂片分类方法,包括训练阶段:
获取TCT涂片信息,训练TCT分类模型;TCT分类模型包括第一层模型和第二层模型;
提取所述TCT涂片信息的特征,标记TCT涂片信息的特征构成第一训练样本;利用所述第一训练样本训练所述第一层模型;
将所述第一层模型的预测结果合并为第二训练样本,利用第二训练样本,训练第二层模型;
测试所述TCT分类模型的分类性能,TCT分类模型的检出率为90%时,当排阴率低于70%时,继续获取所述TCT涂片信息,训练所述TCT分类模型;当所述排阴率至少为70%时,结束训练。
其中,检出率表示判断为阳性的比率,是指模型正确预测为阳性的数量与数据中实际为阳性的数量的百分比;排阴率表示判断为阴性的比率,是指模型正确预测为阴性的数量与数据中实际为阴性的数量的百分比。
在一些实施方式中,在训练阶段获取TCT涂片信息,指收集大量TCT涂片,如20000张;提取TCT涂片信息的特征,是指使用TCT目标检测模型检测出TCT涂片中的可疑细胞后,收集带有可疑细胞的TCT涂片信息的特征,例如:阴阳性类别、制片方式、涂片的长度、宽度等,并将收集的特征标记后作为第一训练样本。
在一些实施方式中,将收集的大量涂片按照比例分为训练集和测试集,如,收集20000张TCT涂片,按8:2比例分为训练集和测试集,训练集用于训练TCT阴阳性分类模型,测试集用于测试TCT阴阳性分类模型的分类性能。
在一些实施方式中,TCT涂片信息的特征,包括细胞可靠性特征、加权组合特征、最大值特征和尺度特征;
细胞可靠性特征通过细胞属性分数计算所得,用于表示细胞属性的可靠性,计算公式为:
Figure BDA0002218448490000081
其中j表示细胞的类别,i表示具体细胞。
加权组合特征的权重为各阳性类别的可靠度与涂片阴阳性皮尔逊相关度的占比。
最大值特征为各类别阳性细胞检测分数的最大值;
尺度特征,包括涂片的宽度特征和高度特征,用于指导模型进行特征归一化;还包括涂片的数字图像的物理空间大小,所述物理空间大小与涂片中总体细胞量的大小正相关。
在一些实施方式中,TCT涂片信息的特征还包括制片方式特征,制片方式包括:通用制片、美国(Becton,Dickinson and Company,BD)、新柏氏ThinPrep、海世嘉HEALTHSKY、豪洛捷CITOGLAS、安必平Ibp、戴尔Dell,依次编码为0~6的数字。
在一些实施方式中,如图3所示,TCT分类模型采用模型融合STACKING结构,TCT分类模型包括第一层模型和第二层模型;其中,第一层模型包括三个基模型:lightGBM算法、支持向量机(Support Vector Machine,SVM)算法和随机森林(RandomForest)算法。在一些实施方式中,TCT分类模型还可以包括其他机器学习中的二分类方法,如SVM、RandomForest、邻近算法(k-NearestNeighbor,KNN),XGBoost中的一种或多种组合,但是不同模型在分类性能上效果不同,图3所示的实施例所述为一种优选的方式。
在一些实施方式中,第一层模型的预测结果合并为新的特征,构成第二训练样本,作为第二层模型的输入,对第二层模型进行训练;其中,第二层模型包括逻辑回归算法(LogisticRegression)。
具体实施方式如图1和图2所示的液基宫颈细胞涂片分类方法训练阶段流程图,在如图1所示的一种实施方式中,液基宫颈细胞涂片分类方法训练阶段包括以下步骤:
S101:获取TCT涂片信息;
S102:训练TCT分类模型;
S103:检出率为90%时,判断排阴率是否大于70%;
S104:TCT分类模型训练结束。
对于步骤S103,在一些实施方式中,测试集的评价指标为检出率在90%时的排阴率值。经判断,若排阴率小于70%,则返回步骤S101,继续获取TCT涂片信息,增加训练样本,若排阴率至少为70%,则证明TCT分类模型的可靠性。
在如图2所示的一种实施方式中,液基宫颈细胞涂片分类方法训练阶段包括以下步骤:
S201:获取TCT涂片信息的特征;
S202:标记特征构成第一训练样本,训练第一层模型;
S203:获取第二训练样本,训练第二层模型;
S204:检出率为90%时,判断排阴率是否大于70%;
S205:TCT分类模型训练结束。
对于步骤S204,经判断,若排阴率小于70%,则返回步骤S201,继续获取TCT涂片信息的特征,增加训练样本。
在如图3所示的一种实施方式中,液基宫颈细胞涂片分类方法TCT分类模型结构包括:第一训练样本301、第一层模型302、第二训练样本303、第二层模型304,最终的预测结果为TCT涂片的阴阳性分数305。
本实施例提供了一种液基宫颈细胞涂片分类方法,还包括使用阶段:
获取TCT涂片数字图像,构成待检测图像;
利用TCT分类模型,预测待检测图像的阴阳性。
在一些实施方式中,用TCT涂片扫描仪,扫描TCT涂片从而获得数字图像;并且使用TCT细胞检测网络检测出涂片中的所有可疑细胞,构成待检测图像。提取待检测图像的特征,其中,特征包括细胞可靠性特征、加权组合特征、最大值特征和尺度特征。
本实施例提供的液基宫颈细胞涂片分类方法,通过获取TCT涂片信息,并将提取的涂片信息特征作为训练集,对TCT涂片分类模型进行训练,从而获得可靠的TCT涂片分类模型。利用该TCT分类模型对待检测图像进行识别,实现了对TCT涂片阴阳性的直接判断,大大减少了病理医生的阅片量。
第二方面,本实施例提供了一种液基宫颈细胞涂片分类系统,如图4和图5所示的具体实施方式,包括:
第一获取单元401,用于获取TCT涂片信息,并提取TCT涂片信息的特征;
标记单元402,标记TCT涂片信息的特征构成第一训练样本;
第一训练单元403,用于训练TCT分类模型,TCT分类模型包括第一层模型和第二层模型;第一训练单元利用第一训练样本,训练第一层模型;
第二训练单元404,用于训练TCT分类模型,将第一层模型的预测结果合并为第二训练样本,利用第二训练样本,训练第二层模型;
测试单元405,用于测试TCT分类模型的分类性能,TCT分类模型的检出率为90%时,当排阴率低于70%时,继续获取TCT涂片信息,训练TCT分类模型;当排阴率至少为70%时,结束训练;
第二获取单元501,用于获取TCT涂片数字图像,构成待检测图像;
预测单元502,利用TCT分类模型,预测待检测图像的阴阳性。
其中,第一获取单元401获取TCT涂片信息,指收集大量TCT涂片,如20000张。
在一些实施方式中,第一获取单元401提取TCT涂片信息的特征,包括细胞可靠性特征、加权组合特征、最大值特征和尺度特征;
细胞可靠性特征根据细胞属性分数计算所得,用于表示细胞属性的可靠性,计算公式为:
Figure BDA0002218448490000111
其中j表示细胞的类别,i表示具体细胞;
加权组合特征的权重为各阳性类别的可靠度与涂片阴阳性皮尔逊相关度的占比;
最大值特征选择各类别阳性细胞检测分数的最大值;
尺度特征包括涂片的宽度特征和高度特征,还包括涂片的数字图像的物理空间大小。宽度特征和高度特征用于指导模型进行特征归一化;物理空间大小与涂片中总体细胞量的大小正相关。
在一些实施方式中,TCT涂片信息的特征还包括制片方式特征,具体制片方式包括:通用制片、美国BD、ThinPrep、HEALTHSKY、CITOGLAS、Ibp、Dell,依次编码为0~6的数字。
在一些实施方式中,第一获取单元401在收集的大量涂片后,将涂片按照比例分为训练集和测试集,如,收集20000张TCT涂片,按8:2比例分为训练集和测试集;训练集用于训练TCT阴阳性分类模型,测试集用于测试TCT阴阳性分类模型的分类性能。
第一训练单元403,利用第一训练样本,训练第一层模型。在一些实施方式中,第一层模型包括三个基模型:lightGBM算法、支持向量机(Support Vector Machine,SVM)算法和随机森林(Random Forest)算法。
第二训练单元404,利用第二训练样本,训练第二层模型。在一些实施方式中,第二层模型包括逻辑回归算法(LogisticRegression)。
在一些实施方式中,TCT分类模型还可以包括其他机器学习中的二分类方法,如SVM、Random Forest、邻近算法(k-NearestNeighbor,KNN),XGBoost中的一种或多种组合,但是不同模型在分类性能上效果不同,本实施例所述为一种优选的方式。
测试单元405,用于测试TCT分类模型的分类性能。在一些实施方式中,测试集的评价指标为检出率在90%时的排阴率值,TCT分类模型的检出率为90%时,当排阴率低于70%时,继续获取TCT涂片信息,增加训练样本训练TCT分类模型;当排阴率至少为70%时,结束训练。
第二获取单元501,用于在使用阶段获取TCT涂片数字图像,构成待检测图像。在一些实施方式中,第二获取单元包括TCT涂片扫描仪和TCT细胞检测网络。通过TCT涂片扫描仪,扫描TCT涂片从而获得数字图像;并且使用TCT细胞检测网络检测出涂片中的所有可疑细胞,构成待检测图像。在一些实施方式中,第二获取单元还包括提取模块,提取待检测图像的特征,其中,特征包括细胞可靠性特征、加权组合特征、最大值特征和尺度特征。
预测单元502,利用第二训练单元训练出的TCT分类模型,对待检测图像的阴阳性进行预测打分。
第三方面,本实施例提供了一种液基宫颈细胞涂片分类实现装置,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现第一方面中提到的任一种实施方式所述的方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种液基宫颈细胞涂片分类方法,其特征在于,包括:
获取TCT涂片信息,训练TCT分类模型;所述TCT分类模型包括第一层模型和第二层模型;
提取所述TCT涂片信息的特征,标记所述TCT涂片信息的特征构成第一训练样本;利用所述第一训练样本训练所述第一层模型;
将所述第一层模型的预测结果合并为第二训练样本,利用所述第二训练样本,训练所述第二层模型;
测试所述TCT分类模型的分类性能,所述TCT分类模型的检出率为90%时,当排阴率低于70%时,继续获取所述TCT涂片信息,训练所述TCT分类模型;当所述排阴率至少为70%时,结束训练。
2.根据权利要求1所述的液基宫颈细胞涂片分类方法,其特征在于,还包括,
获取TCT涂片数字图像,构成待检测图像;
利用所述TCT分类模型,预测所述待检测图像的阴阳性。
3.根据权利要求1所述的液基宫颈细胞涂片分类方法,其特征在于,
所述TCT涂片信息的特征包括细胞可靠性特征、加权组合特征、最大值特征和尺度特征;
所述细胞可靠性特征通过细胞属性分数计算所得,用于表示细胞属性的可靠性;
所述加权组合特征的权重为各阳性类别的可靠度与涂片阴阳性皮尔逊相关度的占比;
所述最大值特征为各类别阳性细胞检测分数的最大值;
所述尺度特征,包括所述TCT涂片的宽度特征和高度特征,用于指导模型进行特征归一化;
所述尺度特征,还包括所述TCT涂片的数字图像的物理空间大小,所述物理空间大小与所述TCT涂片中总体细胞量的大小正相关。
4.根据权利要求3所述的液基宫颈细胞涂片分类方法,其特征在于,所述TCT涂片信息的特征还包括制片方式特征。
5.根据权利要求1所述的液基宫颈细胞涂片分类方法,其特征在于,所述第一层模型包括lightGBM算法、支持向量机(Support Vector Machine,SVM)算法和随机森林(RandomForest)算法。
6.根据权利要求1所述的液基宫颈细胞涂片分类方法,其特征在于,所述第二层模型包括逻辑回归算法(LogisticRegression)。
7.一种液基宫颈细胞涂片分类系统,其特征在于,包括:
第一获取单元,用于获取TCT涂片信息,并提取所述TCT涂片信息的特征;
标记单元,标记所述TCT涂片信息的特征构成第一训练样本;
第一训练单元,用于训练TCT分类模型,所述TCT分类模型包括第一层模型和第二层模型;所述第一训练单元利用所述第一训练样本,训练所述第一层模型;
第二训练单元,用于训练TCT分类模型,将所述第一层模型的预测结果合并为第二训练样本,利用所述第二训练样本,训练所述第二层模型;
测试单元,用于测试所述TCT分类模型的分类性能,所述TCT分类模型的检出率为90%时,当排阴率低于70%时,继续获取所述TCT涂片信息,训练所述TCT分类模型;当所述排阴率至少为70%时,结束训练;
第二获取单元,用于获取TCT涂片数字图像,构成待检测图像;
预测单元,利用所述TCT分类模型,预测所述待检测图像的阴阳性。
8.根据权利要求7所述的液基宫颈细胞涂片分类系统,其特征在于,所述获取单元,提取所述TCT涂片信息的特征包括:细胞可靠性特征、加权组合特征、最大值特征、尺度特征和制片方式特征;
所述尺度特征包括:所述TCT涂片的宽度特征和高度特征和所述TCT涂片的数字图像的物理空间大小。
9.根据权利要求7所述的液基宫颈细胞涂片分类系统,其特征在于,所述第一训练单元训练所述的第一层模型包括:lightGBM算法、支持向量机SVM算法和随机森林算法;
所述第二训练单元训练所述的第二层模型包括逻辑回归算法(LogisticRegression)。
10.一种液基宫颈细胞涂片分类实现装置,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现权利要求1至6任一项所述的方法。
CN201910929639.0A 2019-09-27 2019-09-27 液基宫颈细胞涂片分类方法、系统和实现装置 Active CN110647945B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910929639.0A CN110647945B (zh) 2019-09-27 2019-09-27 液基宫颈细胞涂片分类方法、系统和实现装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910929639.0A CN110647945B (zh) 2019-09-27 2019-09-27 液基宫颈细胞涂片分类方法、系统和实现装置

Publications (2)

Publication Number Publication Date
CN110647945A true CN110647945A (zh) 2020-01-03
CN110647945B CN110647945B (zh) 2022-11-22

Family

ID=69011842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910929639.0A Active CN110647945B (zh) 2019-09-27 2019-09-27 液基宫颈细胞涂片分类方法、系统和实现装置

Country Status (1)

Country Link
CN (1) CN110647945B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2734440Y (zh) * 2004-07-06 2005-10-19 东莞市粤铭激光技术有限公司 全自动摄像商标切割机
CN102016881A (zh) * 2008-04-25 2011-04-13 皇家飞利浦电子股份有限公司 样本数据的分类
CN108447047A (zh) * 2018-02-11 2018-08-24 深圳市恒扬数据股份有限公司 抗酸杆菌检测方法及装置
CN108537124A (zh) * 2018-03-13 2018-09-14 哈尔滨理工大学 一种基于级联多分类器融合的宫颈癌细胞识别方法
CN108885681A (zh) * 2015-12-18 2018-11-23 雅培实验室 用于评估细胞形态的方法和系统
CN109447078A (zh) * 2018-10-23 2019-03-08 四川大学 一种自然场景图像敏感文字的检测识别方法
CN109686403A (zh) * 2018-12-26 2019-04-26 扬州大学 基于不确定蛋白质相互作用网络中关键蛋白质识别方法
CN109886179A (zh) * 2019-02-18 2019-06-14 深圳视见医疗科技有限公司 基于Mask-RCNN的子宫颈细胞涂片的图像分割方法和系统
CN110009050A (zh) * 2019-04-10 2019-07-12 杭州智团信息技术有限公司 一种细胞的分类方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2734440Y (zh) * 2004-07-06 2005-10-19 东莞市粤铭激光技术有限公司 全自动摄像商标切割机
CN102016881A (zh) * 2008-04-25 2011-04-13 皇家飞利浦电子股份有限公司 样本数据的分类
CN108885681A (zh) * 2015-12-18 2018-11-23 雅培实验室 用于评估细胞形态的方法和系统
CN108447047A (zh) * 2018-02-11 2018-08-24 深圳市恒扬数据股份有限公司 抗酸杆菌检测方法及装置
CN108537124A (zh) * 2018-03-13 2018-09-14 哈尔滨理工大学 一种基于级联多分类器融合的宫颈癌细胞识别方法
CN109447078A (zh) * 2018-10-23 2019-03-08 四川大学 一种自然场景图像敏感文字的检测识别方法
CN109686403A (zh) * 2018-12-26 2019-04-26 扬州大学 基于不确定蛋白质相互作用网络中关键蛋白质识别方法
CN109886179A (zh) * 2019-02-18 2019-06-14 深圳视见医疗科技有限公司 基于Mask-RCNN的子宫颈细胞涂片的图像分割方法和系统
CN110009050A (zh) * 2019-04-10 2019-07-12 杭州智团信息技术有限公司 一种细胞的分类方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王玲: "《数据挖掘学习方法》", 31 August 2017 *

Also Published As

Publication number Publication date
CN110647945B (zh) 2022-11-22

Similar Documents

Publication Publication Date Title
EP3486836B1 (en) Image analysis method, apparatus, program, and learned deep learning algorithm
CN110245657B (zh) 病理图像相似性检测方法及检测装置
NL2024774B1 (en) Blood leukocyte segmentation method based on adaptive histogram thresholding and contour detection
JP6194791B2 (ja) 画像処理装置及びプログラム
CN113658174B (zh) 基于深度学习和图像处理算法的微核组学图像检测方法
CN101809589B (zh) 利用多个波长处理生物试样的方法和系统
CN112819821B (zh) 一种细胞核图像检测方法
JP5953035B2 (ja) 病理診断支援装置、病理診断支援方法、及び病理診断支援プログラム
EP2199776B1 (en) Cell image analysis apparatus, cell image analysis method, and program
CN112991295B (zh) 基于深度学习的淋巴结转移影像分析系统、方法及设备
CN113261012B (zh) 处理图像的方法、装置及系统
CN113343755A (zh) 红细胞图像中的红细胞分类系统及方法
US20170364664A1 (en) Method for stratifying and selecting candidates for receiving a specific therapeutic approach
CN114242245A (zh) 一种基于电子病历记录数据预测糖尿病肾病发生风险的机器学习方法、系统和装置
CN112703531A (zh) 生成组织图像的注释数据
US20200372640A1 (en) Systems and methods for quantitative phenotyping of fibrosis
CN112016618A (zh) 一种用于对图像语义分割模型泛化能力的度量方法
Lee et al. Image analysis using machine learning for automated detection of hemoglobin H inclusions in blood smears-a method for morphologic detection of rare cells
EP4367675A1 (en) Stain-free detection of embryo polarization using deep learning
CN111680575A (zh) 一种人类上皮细胞染色分类装置、设备及存储介质
CN114898866A (zh) 一种甲状腺细胞辅助诊断方法、设备和存储介质
KR101771042B1 (ko) 질병 관련 유전자 탐색 장치 및 그 방법
CN110647945B (zh) 液基宫颈细胞涂片分类方法、系统和实现装置
CN113222928B (zh) 一种尿细胞学人工智能尿路上皮癌识别系统
CN115239947A (zh) 基于无监督学习的小麦条锈病严重度评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Liquid based cervical cell smear classification method, system, and implementation device

Effective date of registration: 20230831

Granted publication date: 20221122

Pledgee: Bank of Shanghai Limited by Share Ltd. Hangzhou branch

Pledgor: Hangzhou Zhituan Information Technology Co.,Ltd.

Registration number: Y2023330001888