CN111652095A - 一种基于人工智能的ctc图像识别方法和系统 - Google Patents

一种基于人工智能的ctc图像识别方法和系统 Download PDF

Info

Publication number
CN111652095A
CN111652095A CN202010438283.3A CN202010438283A CN111652095A CN 111652095 A CN111652095 A CN 111652095A CN 202010438283 A CN202010438283 A CN 202010438283A CN 111652095 A CN111652095 A CN 111652095A
Authority
CN
China
Prior art keywords
ctc
image
module
classifier
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010438283.3A
Other languages
English (en)
Inventor
金炜翔
温冬
李基�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jusbio Sciences Shanghai Co ltd
Original Assignee
Jusbio Sciences Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jusbio Sciences Shanghai Co ltd filed Critical Jusbio Sciences Shanghai Co ltd
Priority to CN202010438283.3A priority Critical patent/CN111652095A/zh
Publication of CN111652095A publication Critical patent/CN111652095A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明公开了一种基于人工智能的CTC图像识别方法和系统,所述方法使用预先建立的分类器进行CTC的自动化判读,包括以下步骤:输入临床样本的原始荧光图像;对所述临床样本的原始荧光图像进行图像前处理;输出临床样本单个细胞的图像和特征参数;采用预先建立的分类器自动化判读,筛选疑似CTC的细胞作为候选细胞,对候选细胞进行审核后,出具CTC报告,本发明还公开了分类器建立的方法和系统,使用人工标注的方法区分CTC,筛选CTC和WBC的特征参数,基于多种机器学习的算法建立多个初步分类器,并优化获得的分类器;本发明采用真实的临床循环肿瘤细胞建立训练集,系统性地对形态学参数进行筛选和验证,保证优化的分类器识别CTC的性能。

Description

一种基于人工智能的CTC图像识别方法和系统
技术领域
本发明涉及循环肿瘤细胞识别技术领域,具体而言,涉及一种基于人工智能的荧光细胞图像识别技术,用于临床循环肿瘤细胞自动化检测。
背景技术
循环肿瘤细胞(Circulating Tumor Cell,CTC)指自发或因诊疗操作由实体瘤或转移灶释放进入外周血循环的肿瘤细胞,恶性肿瘤的侵袭转移是患者复发转移的关键环节,常导致肿瘤治疗失败,危及患者生命。由于入侵发生在肿瘤早期阶段,此时血液中的循环肿瘤细胞数量非常稀少,这意味着准确有效的循环肿瘤细胞识别与分析对于尽早地确诊肿瘤并采取有效的治疗措施具有重要意义。
通过免疫荧光染色来识别标有肿瘤标志物的CTC是一种常见的临床CTC检测方法,这种方法除了依赖于全自动扫描的荧光显微镜之外,还需要对扫描得到的荧光图像进行判读来识别临床样本中的 CTC。
现在临床CTC检测主要还是依赖专业人员对荧光图像进行人工判读,这种判读方式带来的问题包括不同操作人员间的判读误差、不同样本间的判读误差,以及判读效率不高等。现有的CTC判读方法还包括基于各形态学参数threshold的图像筛选,根据经验值,对CTC 的各形态学参数进行限定,设定固定threshold来筛选CTC;这个方式最大缺点是临床样本中CTC的形态各异,基于经验值设定threshold 的方式CTC筛选的灵敏度和特异性均很差。基于机器学习的CTC图像识别方法也在现有文献中有过报道,但现有方法还存在以下缺点:
(1)现有CTC图像识别方法中涉及的多个形态学参数没有系统性地筛选和比较,不同形态学参数集合会最终影响到识别的灵敏度、特异性等;
(2)现有CTC图像识别方法中分类器建立所使用的训练集不是来自于真实的临床CTC,而是采用的掺入肿瘤细胞系细胞在血液中来模拟CTC,基于这样的训练集训练出来的分类器,在临床CTC检测和识别的性能并不可靠;
(3)现有CTC图像识别方法中训练集由于是来自于肿瘤细胞系细胞,所以训练集的细胞比例(CTC和WBC的比例)并不能反映真实情况(实际经过富集后的临床样本中CTC与WBC比例为1:103),这样的训练集训练出来的分类器,无法保证对实际临床样本中极度不平衡的样本比例进行有效地识别;
(4)现有CTC图像识别方法只是简单地比较了几种常见的机器学习算法建立的分类器,对于CTC图像识别方法的性能的优化有限;
(6)现有CTC图像识别方法的泛化能力评估只是在极少量的临床样本中进行,并不能有效反映CTC图像识别方法的实际临床性能;
本专利通过开发基于机器学习的临床CTC图像识别方法和系统来完成对临床CTC图像高效、准确的判读,可以让机器通过对过往的CTC图像数据自我学习,来不断修正改善自身性能,可以有效地保证临床CTC图像识别的准确性,再由专业人员对筛选后的CTC图像进行终审来确认检测结果。
发明内容
本发明提供了一种基于人工智能的CTC图像识别方法和系统。
本发明中用到的技术名词和含义如下:
CTC:循环肿瘤细胞,Circulating Tumor Cell,指自发或因诊疗操作由实体瘤或转移灶释放进入外周血循环的肿瘤细胞。
WBC:白细胞,White Blood Cell,是无色、球形、有核的血细胞,白细胞的主要功能是防卫作用。
临床CTC样本:检测到至少一个CTC的临床样本。
分类器:数据挖掘中对样本进行分类的方法的统称。
DAPI:是一种蓝色荧光DNA染色剂,与dsDNA的AT区结合后,荧光增强约20倍。它被紫罗兰色(405nm)激光线激发,通常用作荧光显微镜,流式细胞仪和染色体染色中的核复染。
TRITC:是罗丹明染料的高性能衍生物,经活化可轻松可靠地标记用作荧光探针的抗体,蛋白质和其他分子。
Cy5:是一种明亮的,远红色荧光染料,具有激发光,非常适合 633nm或647nm激光线;用于标记蛋白质和核酸偶联物。
TP:True Positive,真阳,预测为正样本,实际也为正样本。
FN:False Negative,假阴,预测为负样本,实际为正样本。
FP:False Positive,假阳,预测为正样本,实际为负样本。
TN:True Negative,真阴,预测为负样本,实际为负样本。
Accuracy:准确率,正确预测正负样本例数/样本总数,accuracy=(TP+TN)/(TP+FN+FP+TN)。
Precision:精确率,正确预测正样本例数/预测正样本总数, precision=TP/(TP+FP)。
Recall:召回率,正确预测正样本例数/实际正样本总数, recall=TP/(TP+FN)。
F1 score:F1=2*(prescision*recall)/(precision+recall),精确率和召回率的调和值,更接近两个数较小的那个,所以精确率和召回率接近时,F1值最大。
F2 score:F2=5*(precision*recall)/(4*precision+recall),相比于F1score,F2 score中,召回率权重大于精确率。
TPR:True Positive Rate,真阳性率,正确预测正样本例数/实际正样本总数,TPR=TP/(TP+FN)。
FPR:False Positive Rate,假阳性率,错误预测为正样本例数/实际负样本总数,FPR=FP/(FP+TN)
PR:由精确率Precision(Y轴)和召回率Recall(X轴)组成的曲线。
ROC:Receiver Operating Characteristic,度量分类器好坏的一个标准,其主要分析工具是一个画在二维平面上的曲线——ROC曲线。平面的横坐标是FPR,纵坐标是TPR。对某个分类器而言,可以根据其在测试样本上的表现得到一个TPR和FPR点对。这样,此分类器就可以映射成ROC平面上的一个点。调整这个分类器分类时候使用的阈值,可以得到一个经过(0,0),(1,1)的曲线,这就是此分类器的 ROC曲线。一般情况下,这个曲线都应该处于(0,0)和(1,1)连线的上方,ROC曲线下方的那部分面积越大,分类器效果越好。
AUC:Area Under Curve,是一种用来度量分类器好坏的一个数值化的标准,AUC越大,分类器分类效果越好。AUC为ROC曲线下方的那部分面积的值。
CTC concordance:图像识别系统识别到的CTC与人工判读CTC 结果的一致性,CTCconcordance=100%*(图像系统识别与人工判读的同一CTC的数量/人工判读得到的CTC数量),CTC concordance 值越高,图像识别系统识别CTC灵敏度越高。
Positive sample concordance:图像识别系统识别到的阳性样本(≥1 个CTC)与人工判读结果的一致性,positive sample concordance=100%*(人工判读为阳性,图像识别系统判读也为阳性的样本数量/人工判读的阳性样本数量),positive sampleconcordance 值越高,图像识别系统识别阳性样本灵敏度越高。
Screening efficiency:100%*(图像识别系统排除掉的非CTC数量/该样本中的细胞总数),screening efficiency值越高,图像识别系统识别CTC特异性越高。
CellProfiler:用于基于图像的复杂屏幕的数据探索和分析软件,是一种开源软件,用于交互式探索和分析多维数据,特别是来自基于图像的高通量实验数据。该系统可以对基于图像的屏幕进行交互式数据探索,并可以对复杂的表型进行自动评分,这些复杂的表型需要每个单元结合多个测量特征。
特征参数相关性计算:采用Pearson相关性分析,计算任意2个特征参数的Pearson相关系数,本专利中相关系数大于.75(cutoff>.75) 的2个参数属于高度相关。
特征参数重要性(RFE):即递归式特征消除法,recursive feature elimination,在每轮迭代中,选取不同特征子集,进行模型训练并评估模型,通过计算其决策系数之和,最终得到不同特征的重要程度,然后保留最佳的特征组合。
本发明中,血液前处理、CTC富集和染色制作为原始荧光图像的方法为现有技术,具体如下:
将5ml外周血液与红细胞特异性抗体和白细胞特异性抗体组合进行孵育,使全血样本中红细胞和白细胞耦联在一起,再通过密度梯度离心方法使血液中细胞根据自己的密度达到分离分层的目的,经过梯密度离心的血液样本会分成4层:从上往下分别为血浆、单核细胞、密度梯度离心液以及红细胞和白细胞;CTC做为单核细胞会处于单核细胞层,将单核细胞层提取出来,达到血液中CTC的富集目的;
单核细胞层被提取出来后,进行清洗,然后进行后续的免疫荧光染色流程,包括固定、透化、荧光抗体染色等一系列流程,在染色流程中使用的荧光抗体包括细胞核染料DAPI(DAPI通道)、特异性识别CTC的染色试剂EpCAM/CK(TRITC通道)、特异性识别WBC 的染色试剂CD45(CY5通道),最后剩余约200ul的样本,样本中会包含约0-100个CTC、103-104个白细胞(WBC)、血小板以及杂质等。经过上述荧光抗体染色后,CTC的判定标准是DAPI+且 TRITC+且CY5-,WBC的判定标准是DAPI+且CY5+;其中“+”指有荧光信号,“-”指没有荧光信号;
染好色的样本会转入96孔板中的其中一个孔内,然后进行扫描,扫描可以采用商业化扫描仪ThermoFisher CX5,由于孔底的面积大于单次扫描仪拍照面积,所以扫描仪需要自动移动载物台进行拍照,通过对不同位置进行拍照,然后再进行后期拼接,实现对单个孔内的样本完整扫描;由于是免疫荧光染色样本,所以在每个区域拍照时,会切换不同荧光通道进行拍照,再进行后期叠加。
染好色的样本通过扫描后会生成169组图像覆盖整个样本区域,每组图像包含来自DAPI、TRITC、CY5三个荧光通道的图像,即为本发明中输入图像前处理模块的临床样本的原始荧光图像。
本发明的目的可以通过以下技术方案来实现:
一种基于人工智能的CTC图像识别方法,使用预先建立的分类器进行CTC的自动化判读,包括以下步骤:
步骤一、输入临床样本的原始荧光图像;
步骤二、对所述临床样本的原始荧光图像进行图像前处理;
步骤三、输出临床样本单个细胞的图像和特征参数;
步骤四、采用预先建立的分类器自动化判读,筛选疑似CTC的细胞作为候选细胞,对候选细胞进行审核后,出具CTC报告。
本发明上述技术方案中,分类器的建立方法包括如下步骤:
步骤Ⅰ、输入临床样本的原始荧光图像;
步骤Ⅱ、对所述临床样本的原始荧光图像进行图像前处理;
步骤Ⅲ、输出临床样本单个细胞的图像和特征参数,,人工判断临床样本中是否含有CTC,如含有CTC即为临床CTC样本,继续步骤IV,如人工判断临床样本中没有CTC,则换一个样本重复步骤I;
步骤Ⅳ、人工标注临床CTC样本中的CTC和WBC,筛选CTC 和WBC的特征参数,作为训练集;进一步的,所述训练集包括超过 1700个循环肿瘤细胞图像、超过13000个白细胞图像,和超过200个特征参数。;基于多种机器学习的算法建立多个初步分类器;通过参数调优、交叉验证、平行比较优化分类器。
进一步的,步骤Ⅳ具体包括:
(1)数据中心化和归一化;
(2)基于每个特征参数的散点图,手动筛选能显著区分两种类别细胞的特征参数;
(3)剔除高度相关的特征参数(cutoff>.75);
(4)计算特征参数重要性(RFE),并最终确认用于模型建立的特征参数集合;
经过上述步骤后获得新训练集。其中,(cutoff>.75)是指对每两个特征参数计算Pearson相关系数,相关系数值大于.75的两个参数认为是高度相关参数,因此会剔除其中一个参数,特征参数重要性 (RFE)的计算方式为每轮迭代中,选取不同特征子集,进行模型训练并评估模型,通过计算其决策系数之和,最终得到不同特征的重要程度,然后保留最佳的特征组合。
进一步的,步骤Ⅳ还包括:在新训练集内,分别使用多种监督式机器学习算法以及融合模型算法、多种不平衡训练集的前处理方法、多种评估方法,进行交叉验证,优化参数,建立初步分类器。
进一步的,所述监督式机器学习算法采用了总共8种:7种监督式机器学习算法包括K-Nearest Neighbors(KNN)、Stochastic Gradient Boosting(GBM)、AdaBoostClassification Trees(ADABOOST)、Support Vector Machines(SVM)、Random Forest(RF)、
Figure RE-GDA0002606846500000091
Bayes(NB)、 Extreme Gradient Boosting(XGB),还有1种融合模型算法(Stack),即 7种监督式机器学习算法融合在一起的算法。
进一步的,所述不平衡训练集的前处理方法包括5种:Original、Up-sampling、Down-sampling、SMOTE、ROSE。
进一步的,所述评估方法包括2种:ROC和PR。
在新的训练集内,使用上述7种监督式机器学习的算法以及1个融合模型算法(共8种算法)、5种不平衡训练集的前处理方法、2种测量指标评估方法,进行交叉验证,优化参数,最终生成8*5*2=80个分类器。
进一步的,步骤Ⅳ还包括:用训练集对分类器的性能进行评估,分析比较了AUC、F1score、Accuracy、Precision、Recall、TPR、FPR 参数在80个分类器中的表现,,针对不平衡数据集而言(不平衡数据集是指CTC数量在训练集中占比小于10%),在各项指标均表现良好情况下,F1 score、Recall、TPR指标更关注于识别CTC的灵敏度,所以,F1 score、Recall、TPR数值越高,系统识别CTC的灵敏度越高。
进一步的,步骤Ⅳ还包括:用建立调优好的80个分类器在临床样本中进行泛化能力测试,测试范围涵盖了200例临床CTC检测样本 (200例临床CTC检测样本中人工判读结果约含1000个CTC)。基于 CTC自动化判读需求,泛化能力评估指标包括:CTC concordance,Positive sample concordance,Screening efficiency。针对于临床CTC检测应用,首先,期望分类器的Positive sample concordance达到100%,在满足前述条件的情况下,尽可能选择CTC concordance或Screening efficiency较高的。
综上,优化的分类器的筛选原则为:F1 score、Recall、TPR数值尽量高,Positivesample concordance达到100%,在前述条件都满足的情况下,优选CTC concordance高于90%的,或者Screening efficiency高于95%的,如有多个符合条件的分类器,根据实际场景选择其中一个,例如,可以选择几个分类器中CTC concordance最高的一个。
本发明上述技术方案中,所述图像前处理包括如下步骤:
(1)图像修正;
(2)识别首要目标;
(3)识别次级目标;
(4)计算各类特征参数;
(5)数据导出和保存。
进一步,所述图像前处理步骤中,识别首要目标为识别DAPI通道有信号的目标;识别次级目标为在识别首要目标的基础上分别识别 TRITC通道有信号的目标和CY5通道有信号的目标。
进一步的,所述图像前处理步骤中,识别首要目标为识别DAPI 通道有信号的目标;识别次级目标为在识别首要目标的基础上分别识别TRITC通道有信号的目标和CY5通道有信号的目标。
进一步的,所述计算各类特征参数,包括计算首要目标和次级目标的形态学参数、各通道荧光信号强度;所述形态学参数包括大小& 形状(Area&Shape)、信号强度(Intensity)、表面结构(Texture)、相关性(Correlation)。
进一步的,自动化判读是基于R语言的libraries建立的。
本发明的另一种技术方案为:
一种基于人工智能的CTC图像识别系统,包括输入模块、图像前处理模块、输出模块、自动化判读模块;
所述输入模块用于输入临床样本的原始荧光图像;
所述图像前处理模块用于对临床样本的原始荧光图像进行处理后获得单个细胞的图像和特征参数;
所述输出模块用于输出临床样本中单个细胞的图像和特征参数;
所述自动化判读模块用于识别CTC细胞,使用预先建立的分类器侵权进行筛选,筛选出疑似CTC的细胞作为候选细胞,对CTC候选细胞进行审核后;出具CTC检测报告。
进一步的,所述图像前处理模块包括图像修正模块、识别首要目标模块、识别次级目标模块、计算各类特征参数模块、数据导出和保存模块;所述图像修正模块用于修正不均一光照强度导致的不均一的图像信号和背景;所述识别首要目标模块用于识别DAPI通道有信号的目标;所述识别次级目标模块用于在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别获得单个细胞图像;所述计算各类特征参数模块用于计算单个细胞的形态学参数、各通道荧光信号强度参数;所述数据导出和保存模块用于导出和保存单个细胞的图像和特征参数。
进一步的,所述自动化判读模块包括初审模块和终审模块,所述初审模块使用预先建立的并且优化后的分类器进行筛选,筛选出疑似 CTC的细胞作为候选细胞;所述终审模块采用专业人员判断候选细胞是否确实为CTC,确认后出具CTC检测报告。
本发明上述技术方案中,所述分类器通过分类器建立系统建立和优化,所述分类器建立系统包括输入模块二、图像前处理模块二、输出模块二、分类器建立模块;
所述输入模块二用于输入临床CTC样本的原始荧光图像;
所述图像前处理模块二用于对临床CTC样本的原始荧光图像进行处理后获得单个细胞的图像和特征参数,作为训练集;
所述输出模块二用于输出临床CTC样本中单个细胞的图像和特征参数;
所述分类器建立模块用于建立并优化分类器,人工标注CTC和 WBC,筛选CTC和WBC的特征参数;基于多种机器学习的算法建立多个初步分类器;通过参数调优、交叉验证、平行比较优化分类器。
本发明上述技术方案中,所述图像前处理模块二包括图像修正模块二、识别首要目标模块二、识别次级目标模块二、计算各类特征参数模块二、数据导出和保存模块二;所述图像修正模块二用于修正不均一光照强度导致的不均一的图像信号和背景;所述识别首要目标模块二用于识别DAPI通道有信号的目标;所述识别次级目标模块二用于在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别获得单个细胞图像;所述计算各类特征参数模块二用于计算单个细胞的形态学参数、各通道荧光信号强度参数;所述数据导出和保存模块二用于导出和保存单个细胞的图像和特征参数。
本发明具有以下有益效果:
(1)本发明系统性地对形态学参数进行筛选和验证,可以保证优化的分类器识别CTC的性能;
(2)现有技术中CTC图像识别流程建立使用的训练集采用的掺入肿瘤细胞系细胞在血液中来模拟CTC,本发明采用的是申请人建立的超过1000个临床CTC的建立训练集,验证和测试结果更能直观反映实际临床检测中的性能;
(3)现有技术中CTC图像识别流程建立使用的训练集因为采用的掺入细胞模拟实验,未涉及不平衡训练集问题,本发明针对临床 CTC检测建立的训练集由于真实反映CTC在血液中的稀有情况,所以系统性地对不平衡训练集的不同处理方式进行了测试和评估,寻找了最优的处理方式;
(4)本发明系统性比较了80种分类器的性能,远远超过现有技术比较分类器种类的数量;
(5)现有技术中使用极少量的临床样本对分类器进行泛化能力评估,本发明对前述分类器进行了大规模临床样本的泛化能力评估,检测时间跨度半年,样本量约200例,人工判读的临床CTC数量约 1000个,更真实反映分类器的临床使用性能。
附图说明
图1为本发明CTC图像识别方法的流程图;
图2为本发明分类器建立方法的流程图;
图3为本发明CTC图像识别系统的示意图;
图4为本发明分类器建立系统的示意图;
图5为原始荧光图像的示意图;
图6为单个细胞的图像示意图;
图7为分类器在临床样本中的泛化能力评估示意图,包括:图7A CTC concordance计算结果示意图,图7B Positive sample concordance 计算结果示意图,图7C Screeningefficiency计算结果示意图;
图8为从候选细胞生成CTC报告的流程示意图。
附图标记:
输入模块1,图像处理模块2,图像修正模块201、识别首要目标模块202、识别次级目标模块203、计算各类特征参数模块204、数据导出和保存模块205,输出模块3,自动化判读模块4,初审模块401,终审模块402,输入模块二5,分类器图像处理模块6,图像修正模块601、识别首要目标模块602、识别次级目标模块603、计算各类特征参数模块604、数据导出和保存模块605,输出模块二7,分类器建立模块8。
具体实施方式
结合附图所示,本发明的技术方案作进一步的描述:
本发明的第一个实施例如图1所示,一种基于人工智能的CTC图像识别方法,使用预先建立的分类器进行CTC的自动化判读,包括以下步骤:
步骤一、输入临床样本的原始荧光图像;临床样本为外周血经过 CTC富集处理,扫描后获得;
步骤二、对临床样本的原始荧光图像进行图像前处理,图像前处理是基于Cellprofiler建立的流程;图像前处理包括步骤:(1)图像修正,修正不均一光照强度导致的不均一的图像信号和背景;(2)识别首要目标,识别DAPI通道有信号的目标,并将图片切割成以该目标为中心的图像,即关于首要目标的单个细胞的图像;(3)识别次级目标;在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别将图片切割成以该目标为中心的图像,即关于次级目标的单个细胞的图像;(4)计算各类特征参数,分别计算识别到的首要目标和次级目标的形态学参数,各通道荧光信号强度参数;(5)数据导出和保存,导出并保存各类形态学参数的数据,以及关于首要目标和次级目标的单个细胞图像;
步骤三、输出临床样本单个细胞的图像和特征参数,分别输出关于首要目标、次级目标的单个细胞图像和特征参数;
步骤四、如图8,采用预先建立的分类器自动化判读,筛选疑似 CTC的细胞作为候选细胞,对候选细胞进行打分,将候选细胞按分数从高到低排序,通过CellProfilerAnalyst的交互界面呈现给人工;专业人员在交互界面中,对候选细胞进行审核,确认最终CTC的数量,并出具报告。
进一步的,自动化判读是基于R语言的libraries建立的。
本发明的第二个实施例如图2所示,本发明还公开了用于CTC进行自动化判的分类器的建立方法,包括如下步骤:
步骤Ⅰ、输入临床样本的原始荧光图像,临床样本为外周血经过 CTC富集、扫描后获得;
步骤Ⅱ、对临床样本的原始荧光图像进行图像前处理,图像前处理是基于Cellprofiler建立的流程,图像前处理包括步骤:(1)图像修正,修正不均一光照强度导致的不均一的图像信号和背景;(2)识别首要目标,识别DAPI通道有信号的目标,并将图片切割成以该目标为中心的图像,即关于首要目标的单个细胞的图像;(3)识别次级目标;在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别将图片切割成以该目标为中心的图像,即关于次级目标的单个细胞的图像;(4)计算各类特征参数,分别计算识别到的首要目标和次级目标的形态学参数,各通道荧光信号强度参数;(5)数据导出和保存,导出并保存各类形态学参数的数据,以及关于首要目标和次级目标的单个细胞图像;
步骤Ⅲ、输出临床样本单个细胞的图像和特征参数,具体包括分别输出关于首要目标、次级目标的单个细胞图像和特征参数,人工判断临床样本中是否含有CTC,如含有CTC即为临床CTC样本,继续步骤IV,如人工判断临床样本中没有CTC,则换一个样本重复步骤I,;
步骤Ⅳ、人工标注CTC样本中分别属于CTC和WBC的细胞图像,借助R语言的libraries,对特征参数进行筛选,将单个细胞图像以及各类特征参数作为训练集,将不重要的特征参数剔除,筛选最优特征参数集合;基于多种机器学习的算法建立多个初步分类器;通过参数调优、交叉验证、平行比较优化分类器最终筛选出优化分类器。
进一步的,步骤Ⅲ中Cellprofiler导出的形态学参数如表1所示,包括:DAPI通道的Area&Shape,Intensity,Texture;TRITC通道的Area&Shape,Intensity,Texture;CY5通道的Area&Shape,Intensity, Texture;TRITC通道和CY5通道的Correlation,共计778个特征参数。
Figure RE-GDA0002606846500000171
表1图像前处理导出的细胞全部特征参数,以及筛选后的特征参数列表
优选的,步骤Ⅲ中收集了超过1700个CTC和13000个WBC的图像,同时每个细胞图像分别采集778个特征参数作为训练集。
进一步的,步骤Ⅳ中,筛选最优特征参数集合的流程包括;
(1)数据中心化和归一化;
(2)基于每个特征参数的散点图,手动筛选能显著区分两种类别细胞的特征参数;
(3)剔除高度相关的特征参数(cutoff>.75);
(4)计算特征参数重要性(RFE),并最终确认用于模型建立的特征参数集合;
经过上述步骤将不重要的特征参数剔除掉,获得一个新的训练集。优选的,778个特征参数筛选后数量降到318个。
进一步的,步骤Ⅳ还包括:在新训练集内,分别使用多种监督式机器学习算法以及融合模型算法、多种不平衡训练集的前处理方法和多种评估方法用于测试和比较,进行交叉验证,优化参数,建立初步分类器。多种监督式机器学习算法包括7种算法:K-NearestNeighbors (KNN)、Stochastic Gradient Boosting(GBM)、AdaBoost ClassificationTrees(ADABOOST)、Support Vector Machines(SVM)、Random Forest (RF)、
Figure RE-GDA0002606846500000181
Bayes(NB)、Extreme Gradient Boosting(XGB),以及1种融合模型算法,即7种监督式机器学习算法融合在一起的算法(Stack)。不平衡训练集的前处理方法包括5种处理方式:Original、Up-sampling、 Down-sampling、SMOTE、ROSE。评估方法包括2种:ROC和PR。最终生成的分类器个数为80个,计算方法:(7+1)*5*2=80个分类器,80 个分类器见表2。
Figure RE-GDA0002606846500000191
Figure RE-GDA0002606846500000201
Figure RE-GDA0002606846500000211
表2分类器
进一步的,步骤Ⅳ还包括:用训练集对分类器的性能进行评估,分析比较了AUC、F1score、Accuracy、Precision、Recall、TPR、FPR 参数在80个分类器中的表现,如表3所示,包括:表3A机器学习算法为KNN的分类器建立列表及其调优后性能、表3A机器学习算法为 KNN的分类器建立列表及其调优后性能、表3B机器学习算法为GBM 的分类器建立列表及其调优后性能、表3C机器学习算法为 ADABOOST的分类器建立列表及其调优后性能、表3D机器学习算法为SVM的分类器建立列表及其调优后性能、表3E机器学习算法为 RF的分类器建立列表及其调优后性能、表3F机器学习算法为NB的分类器建立列表及其调优后性能、表3G机器学习算法为XGB的分类器建立列表及其调优后性能。
Figure RE-GDA0002606846500000221
表3A机器学习算法KNN训练后的分类器的表现
Figure RE-GDA0002606846500000231
表3B机器学习算法GBM训练后的分类器的表现
Figure RE-GDA0002606846500000241
表3C机器学习算法ADABOOST训练后的分类器的表现
Figure RE-GDA0002606846500000251
表3D机器学习算法SVM训练后的分类器的表现
Figure RE-GDA0002606846500000261
表3E机器学习算法RF训练后的分类器的表现
Figure RE-GDA0002606846500000271
表3F机器学习算法NB训练后的分类器的表现
Figure RE-GDA0002606846500000281
表3G机器学习算法XGB训练后的分类器的表现
Figure RE-GDA0002606846500000291
表3H融合模型算法Stack训练后的分类器的表现
针对不平衡数据集而言(不平衡数据集是指CTC数量在训练集中占比小于10%),在各项指标均表现良好情况下,F1 score、Recall、TPR指标更关注于识别CTC的灵敏度,所以,80个分类器中,F1 score 值最高为97%,F1 score值为97%的分类器包括:
(1)ADABOOST_PR_Original、
(2)ADABOOST_ROC_Original、
(3)ADABOOST_ROC_Up-sampling、
(4)RF_PR_Original、
(5)RF_PR_Up-sampling、
(6)RF_ROC_Original、
(7)RF_ROC_Up-sampling、
(8)XGB_PR_Original、
(9)XGB_PR_Up-sampling、
(10)XGB_ROC_Original、
(11)XGB_ROC_Up-sampling、
(12)Stack_PR_ROSE、
(13)Stack_ROC_Original、
(14)Stack_PR_Original;
Rcall值最高为99%,Rcall值为99%的分类器包括:
(1)ADABOOST_PR_Original、
(2)ADABOOST_ROC_Original、
(3)ADABOOST_ROC_Up-sampling、
(4)XGB_ROC_Up-sampling、
(5)Stack_PR_ROSE;
TPR值最高为99%,TPR值为99%的分类器包括:
(1)ADABOOST_PR_Original、
(2)ADABOOST_ROC_Original、
(3)ADABOOST_ROC_Up-sampling、
(4)XGB_ROC_Up-sampling、
(5)Stack_ROC_ROSE;
综上,F1 score、Recall、TPR值均表现良好的分类器为:
(1)ADABOOST_PR_Original、
(2)ADABOOST_ROC_Original、
(3)ADABOOST_ROC_Up-sampling、
(4)XGB_ROC_Up-sampling。
进一步的,步骤Ⅳ还包括:用建立调优好的分类器(表2中的80 个分类器)在临床样本中进行泛化能力测试,测试范围涵盖了200例临床CTC检测样本(200例临床CTC检测样本中人工判读结果约1000 个CTC)。基于CTC自动化判读需求,泛化能力评估指标包括:Positive sample concordance,CTC concordance,Screening efficiency。针对于临床CTC检测应用,期望分类器的Positive sample concordance需要达到100%,在Positivesample concordance需要达到100%的前提下,CTC concordance和Screening efficiency尽可能的高,如CTC concordance尽大于90%,Screening efficiency大于95%。将测试结果用图7呈现:
Positive sample concordance达到100%的包括:
(1)XGB_ROC_SMOTE、
(2)XGB_ROC_Down-sampling、
(3)XGB_PR_SMOTE、
(4)XGB_PR_Down-sampling、
(5)SVM_ROC_Down-sampling、
(6)SVM_PR_Down-sampling、
(7)Stack_ROC_Original、
(8)Stack_PR_SMOTE、
(9)Stack_PR_ROSE、
(10)Stack_PR_Down-sampling、
(11)RF_ROC_Down-sampling、
(12)RF_PR_Down-sampling、
(13)KNN_ROC_Up-sampling、
(14)KNN_PR_Up-sampling、
(15)GBM_ROC_Up-sampling、
(16)GBM_ROC_SMOTE、
(17)GBM_ROC_Down-sampling、
(18)GBM_PR_Up-sampling、
(19)GBM_PR_SMOTE、
(20)GBM_PR_Down-sampling、
(21)ADABOOST_ROC_SMOTE、
(22)ADABOOST_ROC_ROSE、
(23)ADABOOST_ROC_Down-sampling、
(24)ADABOOST_PR_ROSE、
(25)ADABOOST_PR_Down-sampling;
进一步的,在Positive sample concordance达到100%的25个分类器中,选择CTCconcordance达到90%的分类器包括8个:
(1)KNN_ROC_Up-sampling
(2)KNN_PR_Up-sampling
(3)XGB_ROC_Down-sampling
(4)XGB_PR_Down-sampling
(5)SVM_ROC_Down-sampling
(6)SVM_PR_Down-sampling
(7)Stack_PR_Down-sampling
进一步的,在Positive sample concordance达到100%的25个分类器中,选择Screening efficiency大于95%的分类器包括1个:
(1)Stack_ROC_Original、
综上,前述9个分类器为优选的分类器,在选择最终使用分类器时,可以:(1)选择优选分类器中任何一个;(2)根据实际应用需求选择;(3)选择优选分类器中CTCconcordance最高的一个。
本发明的第三个实施例,如图3所示,一种基于人工智能的CTC 图像识别系统,包括输入模块1、图像前处理模块2、输出模块3、自动化判读模块4;
输入模块1用于输入临床样本的原始荧光图像;
图像前处理模2块用于临床样本的原始荧光图像进行处理后获得单个细胞的图像和特征参数;
输出模块3用于输出临床样本中单个细胞的图像和特征参数,
自动化判读模块4用于识别CTC细胞,自动化判读模块4包括初审模块401和终审模块402,初审模块401使用预先建立的分类器进行筛选,筛选出疑似CTC的细胞作为候选细胞;终审模块402采用专业人员判断候选细胞是否确实为CTC,确认后出具CTC检测报告。
进一步的,所述图像前处理模块2包括图像修正模块201、识别首要目标模块202、识别次级目标模块203、计算各类特征参数模块204、数据导出和保存模块205;所述图像修正模201块用于修正不均一光照强度导致的不均一的图像信号和背景;所述识别首要目标模202块用于识别DAPI通道有信号的目标;所述识别次级目标模块203用于在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别获得单个细胞图像;所述计算各类特征参数模块204用于计算单个细胞的形态学参数、各通道荧光信号强度参数;所述数据导出和保存模块205用于导出和保存单个细胞的图像和特征参数。
本发明的第四个实施例如图4所示,本发明还公开了分类器建立系统,包括输入模块二5、图像前处理模块二6、输出模块二7、分类器建立模块8;
输入模块二5用于输入临床CTC样本的原始荧光图像;
图像前处理模二6块用于对临床CTC样本的原始荧光图像进行处理后获得单个细胞的图像和特征参数,作为训练集;
输出模块二7用于输出临床CTC样本中单个细胞的图像和特征参数;
分类器建立模块8用于建立并优化分类器,人工标注CTC和 WBC,筛选CTC和WBC的特征参数;基于多种机器学习的算法建立多个初步分类器;通过参数调优、交叉验证、平行比较优化分类器。
进一步的,CTC图像识别系统和分类器建立系统中用到的图像前处理模块二6包括图像修正模块601、识别首要目标模块602、识别次级目标模块603、计算各类特征参数模块604、数据导出和保存模块 605;图像修正模块601用于修正不均一光照强度导致的不均一的图像信号和背景;识别首要目标模块602用于识别DAPI通道有信号的目标;识别次级目标模块603用于在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别获得单个细胞图像;计算各类特征参数模块604用于计算单个细胞的形态学参数、各通道荧光信号强度参数;数据导出和保存模块605 用于导出和保存单个细胞的图像和特征参数。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和变换,应视为本发明的保护范围。

Claims (17)

1.一种基于人工智能的CTC图像识别方法,使用预先建立的分类器进行CTC的自动化判读,其特征在于,包括以下步骤:
步骤一、输入临床样本的原始荧光图像;
步骤二、对所述临床样本的原始荧光图像进行图像前处理;
步骤三、输出临床样本单个细胞的图像和特征参数;
步骤四、采用预先建立的分类器自动化判读,筛选疑似CTC的细胞作为候选细胞,对候选细胞进行审核后,出具CTC报告。
2.如权利要求1所述的基于人工智能的CTC图像识别方法,其特征在于,所述分类器的建立方法包括如下步骤:
步骤Ⅰ、输入临床样本的原始荧光图像;
步骤Ⅱ、对所述临床样本的原始荧光图像进行图像前处理;
步骤Ⅲ、输出临床样本单个细胞的图像和特征参数,人工判断临床样本中是否含有CTC,如含有CTC即为临床CTC样本,继续步骤IV,如人工判断临床样本中没有CTC,则换一个样本重复步骤I;
步骤Ⅳ、人工标注CTC样本中的CTC和WBC,筛选CTC和WBC的特征参数,作为训练集;基于多种机器学习的算法建立多个初步分类器;通过参数调优、交叉验证、平行比较优化分类器。
3.如权利要求1或2所述的基于人工智能的CTC图像识别方法,其特征在于,所述图像前处理包括如下步骤:
(1)图像修正;
(2)识别首要目标;
(3)识别次级目标;
(4)计算各类特征参数;
(5)数据导出和保存。
4.如权利要求2所述的基于人工智能的CTC图像识别方法,其特征在于,所述训练集包括超过1700个CTC图像、超过13000个WBC图像,和超过200个特征参数。
5.如权利要求2所述的基于人工智能的CTC图像识别方法,其特征在于,步骤Ⅳ具体包括:
(1)数据中心化和归一化;
(2)基于每个特征参数的散点图,手动筛选能显著区分两种类别细胞的特征参数;
(3)剔除高度相关的特征参数(cutoff>.75);
(4)计算特征参数重要性(RFE),并最终确认用于模型建立的特征参数集合;
经过上述步骤后获得新训练集。
6.如权利要求5所述的基于人工智能的CTC图像识别方法,其特征在于,步骤Ⅳ还包括:在新训练集内,分别使用多种监督式机器学习算法以及融合模型算法、多种不平衡训练集的前处理方法、多种评估方法,进行交叉验证,优化参数,建立初步分类器。
7.如权利要6所述的基于人工智能的CTC图像识别方法,其特征在于,所述监督式机器学习算法包括K-Nearest Neighbors(KNN)、Stochastic Gradient Boosting(GBM)、AdaBoost Classification Trees(ADABOOST)、Support Vector Machines(SVM)、RandomForest(RF)、
Figure FDA0002503119920000021
Bayes(NB)、Extreme Gradient Boosting(XGB),所述融合模型算法为多种监督式机器学习算法融合在一起的算法。
8.如权利要求6所述的基于人工智能的CTC图像识别方法,其特征在于,所述不平衡训练集的前处理方法包括:Original、Up-sampling、Down-sampling、SMOTE、ROSE。
9.如权利要求6所述的基于人工智能的CTC图像识别方法,其特征在于,所述评估方法包括:ROC和PR。
10.如权利要求6所述的基于人工智能的CTC图像识别方法,其特征在于,步骤Ⅳ还包括:对初步分类器的性能评估和泛化能力测试,优化分类器,所述性能进行评估指标包括AUC、F1 score、Accuracy、Precision、Recall、TPR、FPR,所述泛化能力评估指标包括:Positive sample concordance,CTC concordance,Screening efficiency。
11.如权利要求3所述的基于人工智能的CTC图像识别方法,其特征在于,所述图像前处理步骤中,识别首要目标为识别DAPI通道有信号的目标;识别次级目标为在识别首要目标的基础上分别识别TRITC通道有信号的目标和CY5通道有信号的目标。
12.如权利要求3所述的基于人工智能的CTC图像识别方法,其特征在于,所述计算各类特征参数,包括计算首要目标和次级目标的形态学参数、各通道荧光信号强度;所述形态学参数包括大小&形状(Area&Shape)、信号强度(Intensity)、表面结构(Texture)、相关性(Correlation)。
13.一种基于人工智能的CTC图像识别系统,其特征在于,包括输入模块、图像前处理模块、输出模块、自动化判读模块;
所述输入模块用于输入临床样本的原始荧光图像;
所述图像前处理模块用于对临床样本的原始荧光图像进行处理后获得单个细胞的图像和特征参数;
所述输出模块用于输出临床样本中单个细胞的图像和特征参数,
所述自动化判读模块用于识别CTC细胞,使用预先建立的分类器进行筛选,筛选出疑似CTC的细胞作为候选细胞,对CTC候选细胞进行人工审核后,出具CTC检测报告。
14.根据权利要求13所述的基于人工智能的CTC图像识别系统,其特征在于,所述自动化判读模块包括初审模块和终审模块,所述初审模块使用预先建立的分类器进行筛选,筛选出疑似CTC的细胞作为候选细胞;所述终审模块采用专业人员判断候选细胞是否确实为CTC,确认后出具CTC检测报告。
15.根据权利要求13所述的基于人工智能的CTC图像识别系统,其特征在于,所述分类器通过分类器建立系统建立,所述分类器建立系统包括输入模块二、图像前处理模块二、输出模块二、分类器建立模块;
所述输入模块二用于输入临床CTC样本的原始荧光图像;
所述图像前处理模块二用于对临床CTC样本的原始荧光图像进行处理后获得单个细胞的图像和特征参数,作为训练集;
所述输出模块二用于输出临床CTC样本中单个细胞的图像和特征参数;
所述分类器建立模块用于建立并优化分类器,人工标注CTC和WBC,筛选CTC和WBC的特征参数;基于多种机器学习的算法建立多个初步分类器;通过参数调优、交叉验证、平行比较优化分类器。
16.根据权利要求13所述的基于人工智能的CTC图像识别系统,其特征在于,所述图像前处理模块包括图像修正模块、识别首要目标模块、识别次级目标模块、计算各类特征参数模块、数据导出和保存模块;所述图像修正模块用于修正不均一光照强度导致的不均一的图像信号和背景;所述识别首要目标模块用于识别DAPI通道有信号的目标;所述识别次级目标模块用于在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别获得单个细胞图像;所述计算各类特征参数模块用于计算单个细胞的形态学参数、各通道荧光信号强度参数;所述数据导出和保存模块用于导出和保存单个细胞的图像和特征参数。
17.根据权利要求15所述的基于人工智能的CTC图像识别系统,其特征在于,所述图像前处理模块二包括图像修正模块二、识别首要目标模块二、识别次级目标模块二、计算特征参数模块二、数据导出和保存模块二;所述图像修正模块二用于修正不均一光照强度导致的不均一的图像信号和背景;所述识别首要目标模块二用于识别DAPI通道有信号的目标;所述识别次级目标模块二用于在识别DAPI通道有信号的目标基础上,分别识别TRITC通道有信号的目标和CY5通道有信号的目标,并分别获得单个细胞图像;所述计算特征参数模块二用于计算单个细胞的形态学参数、各通道荧光信号强度参数;所述数据导出和保存模块用于导出和保存单个细胞的图像和特征参数。
CN202010438283.3A 2020-05-21 2020-05-21 一种基于人工智能的ctc图像识别方法和系统 Pending CN111652095A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010438283.3A CN111652095A (zh) 2020-05-21 2020-05-21 一种基于人工智能的ctc图像识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010438283.3A CN111652095A (zh) 2020-05-21 2020-05-21 一种基于人工智能的ctc图像识别方法和系统

Publications (1)

Publication Number Publication Date
CN111652095A true CN111652095A (zh) 2020-09-11

Family

ID=72348288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010438283.3A Pending CN111652095A (zh) 2020-05-21 2020-05-21 一种基于人工智能的ctc图像识别方法和系统

Country Status (1)

Country Link
CN (1) CN111652095A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113588522A (zh) * 2021-08-05 2021-11-02 中国科学技术大学 基于微流控和图像识别的循环肿瘤检测与分选方法及系统
CN113759200A (zh) * 2021-09-29 2021-12-07 中国电子科技集团公司第三十八研究所 一种基于图像处理的数字插件通用自动测试系统及方法
US11714402B2 (en) 2021-09-29 2023-08-01 38Th Research Institute, China Electronics Technology Group Corporation Universal automatic test system for digital plugboard based on imagine processing
CN117288659A (zh) * 2023-11-24 2023-12-26 深圳市前海高新国际医疗管理有限公司 基于ai的肿瘤干细胞与正常细胞的形态学分析系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009140876A1 (zh) * 2008-05-20 2009-11-26 Lin Ping 从生物体液样本中富集与检测稀有细胞的整合方法
CN104508671A (zh) * 2012-06-21 2015-04-08 菲利普莫里斯生产公司 用于通过集成的偏差校正和分类预测生成生物标记签名的系统和方法
CN105408746A (zh) * 2013-02-28 2016-03-16 普罗吉涅股份有限公司 基于图像的人胚胎细胞分类的装置、方法和系统
CN106840816A (zh) * 2017-03-14 2017-06-13 骏实生物科技(上海)有限公司 一种全自动循环肿瘤细胞阴性富集装置
CN108961242A (zh) * 2018-07-04 2018-12-07 北京临近空间飞行器系统工程研究所 一种荧光染色图像ctc智能识别方法
CN110415795A (zh) * 2019-08-02 2019-11-05 杭州智团信息技术有限公司 一种荧光染色ctc图像的识别方法
CN110632069A (zh) * 2019-08-20 2019-12-31 西人马帝言(北京)科技有限公司 循环肿瘤细胞检测方法、装置、设备及介质
CN110702909A (zh) * 2019-10-31 2020-01-17 骏实生物科技(上海)有限公司 循环肿瘤细胞阴性富集检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009140876A1 (zh) * 2008-05-20 2009-11-26 Lin Ping 从生物体液样本中富集与检测稀有细胞的整合方法
CN104508671A (zh) * 2012-06-21 2015-04-08 菲利普莫里斯生产公司 用于通过集成的偏差校正和分类预测生成生物标记签名的系统和方法
CN105408746A (zh) * 2013-02-28 2016-03-16 普罗吉涅股份有限公司 基于图像的人胚胎细胞分类的装置、方法和系统
CN106840816A (zh) * 2017-03-14 2017-06-13 骏实生物科技(上海)有限公司 一种全自动循环肿瘤细胞阴性富集装置
CN108961242A (zh) * 2018-07-04 2018-12-07 北京临近空间飞行器系统工程研究所 一种荧光染色图像ctc智能识别方法
CN110415795A (zh) * 2019-08-02 2019-11-05 杭州智团信息技术有限公司 一种荧光染色ctc图像的识别方法
CN110632069A (zh) * 2019-08-20 2019-12-31 西人马帝言(北京)科技有限公司 循环肿瘤细胞检测方法、装置、设备及介质
CN110702909A (zh) * 2019-10-31 2020-01-17 骏实生物科技(上海)有限公司 循环肿瘤细胞阴性富集检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NATALIA DEMENTEVA 等: "Current Methods of the Circulating Tumor Cells (CTC) Analysis: A Brief Overview", 《CURRENT PHARMACEUTICAL DESIGN》 *
SANNE DE WIT 等: "Classification of Cells in CTC-Enriched Samples by Advanced Image Analysis", 《CANCERS》 *
罗小辉: "循环肿瘤细胞快速自动识别研究", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 *
赵理莉: "宫颈细胞图像智能分析关键技术研究", 《中国优秀博士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113588522A (zh) * 2021-08-05 2021-11-02 中国科学技术大学 基于微流控和图像识别的循环肿瘤检测与分选方法及系统
CN113759200A (zh) * 2021-09-29 2021-12-07 中国电子科技集团公司第三十八研究所 一种基于图像处理的数字插件通用自动测试系统及方法
US11714402B2 (en) 2021-09-29 2023-08-01 38Th Research Institute, China Electronics Technology Group Corporation Universal automatic test system for digital plugboard based on imagine processing
CN117288659A (zh) * 2023-11-24 2023-12-26 深圳市前海高新国际医疗管理有限公司 基于ai的肿瘤干细胞与正常细胞的形态学分析系统
CN117288659B (zh) * 2023-11-24 2024-02-13 深圳市前海高新国际医疗管理有限公司 基于ai的肿瘤干细胞与正常细胞的形态学分析系统

Similar Documents

Publication Publication Date Title
Nassar et al. Label‐free identification of white blood cells using machine learning
US10430640B2 (en) System and method for classification of particles in a fluid sample
CN111652095A (zh) 一种基于人工智能的ctc图像识别方法和系统
Rees et al. Imaging flow cytometry
JP5425814B2 (ja) サポートベクタマシンを用いてフローサイトメトリーデータを分析するための方法及びシステム
CN108021903B (zh) 基于神经网络的人工标注白细胞的误差校准方法及装置
CN1214340C (zh) 多个神经网络的成像设备和方法
US10083340B2 (en) Automated cell segmentation quality control
JP7176697B2 (ja) 細胞評価システム及び方法、細胞評価プログラム
JP2023512560A (ja) 機械学習アルゴリズムを訓練し、患者のプライバシーを維持するための連合学習システム
CN114092934A (zh) 循环肿瘤细胞的分类方法
US20050273271A1 (en) Method of characterizing cell shape
US10108845B2 (en) Anomaly detection for medical samples under multiple settings
Lin et al. Digital pathology and artificial intelligence as the next chapter in diagnostic hematopathology
Khosrosereshki et al. A fuzzy based classifier for diagnosis of acute lymphoblastic leukemia using blood smear image processing
Elbischger et al. Algorithmic framework for HEp-2 fluorescence pattern classification to aid auto-immune diseases diagnosis
Li et al. Label‐free classification of dead and live colonic adenocarcinoma cells based on 2D light scattering and deep learning analysis
CN116046643B (zh) 辅助诊断信息提供装置及血液分析系统
CN112798678A (zh) 基于血清的新型冠状病毒感染快速检测方法
US20220383629A1 (en) Label-free cell classification and screening system based on hybrid transfer learning
CN113537371B (zh) 融入边缘特征两阶段的上皮细胞分类方法及系统
Hussain et al. Digging deep into Golgi phenotypic diversity with unsupervised machine learning
Schüffler et al. Computational TMA analysis and cell nucleus classification of renal cell carcinoma
WO2022117081A1 (zh) 循环肿瘤细胞形态学特征在胃癌临床诊疗中的应用
Schneider et al. Computer-aided cytological cancer diagnosis: cell type classification as a step towards fully automatic cancer diagnostics on cytopathological specimens of serous effusions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200911

RJ01 Rejection of invention patent application after publication