CN113344868A - 一种基于混合转移学习的无标记细胞分类筛查系统 - Google Patents

一种基于混合转移学习的无标记细胞分类筛查系统 Download PDF

Info

Publication number
CN113344868A
CN113344868A CN202110592201.5A CN202110592201A CN113344868A CN 113344868 A CN113344868 A CN 113344868A CN 202110592201 A CN202110592201 A CN 202110592201A CN 113344868 A CN113344868 A CN 113344868A
Authority
CN
China
Prior art keywords
sample
data
image data
image
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110592201.5A
Other languages
English (en)
Other versions
CN113344868B (zh
Inventor
苏绚涛
王卓
刘超
贾俊昆
宋坤
刘宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202110592201.5A priority Critical patent/CN113344868B/zh
Publication of CN113344868A publication Critical patent/CN113344868A/zh
Priority to US17/804,073 priority patent/US20220383629A1/en
Application granted granted Critical
Publication of CN113344868B publication Critical patent/CN113344868B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Abstract

本发明提供了一种基于混合转移学习的无标记细胞分类筛查系统,包括数据预处理模块,被配置为:获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;图像分类模块,被配置为:将筛选后的图像数据按照金标准进行分类并设置标签;特征提取模块,被配置为:根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;细胞分类筛查模块,被配置为:将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到;实现了数据的全自动处理,减少了现实样本的使用量和对现实样本的依赖性。

Description

一种基于混合转移学习的无标记细胞分类筛查系统
技术领域
本发明涉及生物医学检测技术领域,特别涉及一种基于混合转移学习的无标记细胞分类筛查系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术,并不必然构成现有技术。
细胞分类与样本筛查在社会生活中具有广泛应用,特别是在临床疾病样本筛查方面。传统的细胞分类与样本筛查技术主要依靠有经验的专家依据细胞形态特征及荧光特征进行手工筛查。以临床宫颈癌筛查为例,临床上对宫颈癌样本的检测主要借助于巴氏涂片检测技术以及液基细胞学检测技术。两种检测技术主要基于宫颈细胞形态变化,经细胞染色后由有经验的阅片医生进行人工阅片来判断。相比于巴氏涂片技术,液基细胞学技术可以获得更优质与清晰地细胞图片,有效的提高了宫颈癌筛查的敏感性(真阳性)、特异性(真阴性)。但仍然需要依赖经验丰富的病理学医师阅片存在一定的主观性,且耗费较大量的人力成本。此外,许多细胞的鉴别分类依赖于荧光标记,但荧光染料价格昂贵操作复杂,并且对细胞具有一定的毒性。这常被认为是荧光方法的限制性因素。所以,全自动、高准确率、无标记的细胞检测与样本筛查方法具有重要意义与社会应用价值。
深度学习作为近年来发展迅速的人工智能技术,被广泛应用到生物医学领域。计算机的参与在一定程度上有效的减少了人力成本,并且检测结果给用户提供了更多参考,对于提高工作效率以及判断准确率产生了积极的影响。
但是,发明人发现,性能优异的深度学习技术通常需要大量训练图片和手工标注的金标准作为支撑。然而很多实际样本,比如临床样本的获取较为困难,特别是在所需样本量巨大的情况下,往往很难满足深度学习所需数据量;其次由于实际样本中细胞的复杂性,包含有较多的杂质等非细胞干扰物,严重影响深度学习分类的准确性。并且针对实际样本中每一个细胞的金标准标定是一项难以完成的任务,这使得其在实际样本筛查中较难应用。
发明内容
为了解决现有技术的不足,本发明提供了一种基于混合转移学习的无标记细胞分类筛查系统,实现了数据的全自动处理,减少了人力资源成本,通过自然图片数据训练参数的转移以及细胞系数据特征的转移和应用,有效的减少了现实样本的使用量和对现实样本的依赖性;通过对二维光散射图样的分析,有效实现了细胞的无标记分类,摆脱了对荧光标记的依赖性。
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供了一种基于混合转移学习的无标记细胞分类筛查系统。
一种基于混合转移学习的无标记细胞分类筛查系统,包括:
数据预处理模块,被配置为:获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
图像分类模块,被配置为:将筛选后的图像数据按照金标准进行分类并设置标签;
特征提取模块,被配置为:根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
细胞分类筛查模块,被配置为:将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
第二方面,本发明提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如下步骤:
获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
将筛选后的图像数据按照金标准进行分类并设置标签;
根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
第三方面,本发明提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如下步骤:
获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
将筛选后的图像数据按照金标准进行分类并设置标签;
根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
与现有技术相比,本发明的有益效果是:
1、本发明所述的系统、计算机可读存储介质或电子设备,采用一整套全自动算法实现细胞分类与样本筛查,实现了数据的全自动处理,减少了大量人力资源成本。
2、本发明所述的系统、计算机可读存储介质或电子设备,相比于传统的细胞学检查方法,采用免标记的二维光散射图样作为分析基础,省去了传统的染色与荧光步骤,减少了操作复杂性且降低了生物试剂成本。
3、在传统细胞分类与样本筛查时,比如宫颈癌筛查,所获得的样本图像需经由有经验的专家进行鉴定得出结论,主观性较强,本发明所述的系统、介质或电子设备,利用算法通过计算机识别图像,省去了人工观察步骤,使结果更加稳定,从而消除专家经验对结果带来的影响。
4、本发明所述的系统、计算机可读存储介质或电子设备,采用两步混合转移学习的方法来处理现实样本,相比于单纯预训练参数的转移,通过细胞系数据特征的转移和应用能进一步有效减少现实样本的使用量和对现实样本的依赖性,为小样本情况提供一种解决方法。
5、本发明所述的系统、计算机可读存储介质或电子设备,提供了一种新的样本筛查参考指标,可以根据输出的细胞分类概率值以及划定的阈值对样本状态进行判断,为用户提供更多参考;
6、本发明所述的系统、计算机可读存储介质或电子设备,采用卷积神经网络提取图像特征,相比于传统的手工特征寻找方法效率更高,结果更好。
7、本发明所述的系统、计算机可读存储介质或电子设备,适用于其他细胞的成像识别与分类以及其他以细胞检查为基础的实际样本筛查,具备普遍推广性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1提供的基于混合转移学习的无标记细胞分类筛查系统的工作流程示意图。
图2为本发明实施例1提供的数字细胞过滤预处理效果图。
图3为本发明实施例1中案例1提供的三种宫颈癌细胞系分类准确率结果图.
图4为本发明实施例1中案例3提供的特征转移效果分析结果示意图。
图5为本发明实施例1中案例3提供的75次临床样本实验结果与筛查标准示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1:
如图1所示,本发明实施例1提供了一种基于混合转移学习的无标记细胞分类筛查系统,包括:
数据预处理模块,被配置为:获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
图像分类模块,被配置为:将筛选后的图像数据按照金标准进行分类并设置标签;
特征提取模块,被配置为:根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
细胞分类筛查模块,被配置为:将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
具体的,所述系统包括:
A:数字细胞过滤预处理部分,B:CNN-SVM分类部分,C:混合转移部分,D:评价筛查部分。
数字细胞过滤预处理部分将采集到的原始二维光散射视频进行逐帧过滤并依照金标准分类存储;数字过滤后的二维光散射图样数据集进入卷积神经网络(CNN)进行深层特征提取,所提取的特征参数进入支持向量机(SVM)分类器进行分类训练,获得训练模型;混合转移学习部分包括基于实例的转移与基于特征的转移,减少了现实样本比如临床样本使用并且提高了学习效率与精度;最后利用训练模型对测试样本进行测试,测试结果经评价筛查部分进行判断从而给出最终分类筛查结果。
数字细胞过滤预处理部分主要利用形态学粒度分析方法以及机器学习算法进行二维光散射视频数据逐帧过滤。形态学粒度分析方法主要对视频中的细胞碎片以及气泡等简单的杂质进行快速剔除。机器学习算法主要用来剔除形态变化更复杂的杂质,例如临床样本中的复杂杂质。形态学和粒度的分析算法能够提取图样中散斑的强度及梯度相关信息,判别的门限是根据统计数据以均值为中心60%范围内的数据。机器学习的步骤利用预先训练好机器学习模型进行判别,训练集为先验的图样与杂质数据集,训练网络模型为CNN。
CNN-SVM分类部分包括CNN特征提取器和SVM分类器。CNN特征提取器由一系列卷积池化层组成的神经网络构成,输入二维光散射图样训练数据,输出训练数据特征向量。SVM分类器根据输入的特征向量,通过寻找最优参数,自动优化分类函数,实现样本的自动分类。所用的CNN网络为Inception v3网络,该网络首先为5个卷积层和2个池化层交替结构,然后由三个子网络模块组合形成,最终由平均池化层整合输出结果。
混合转移部分主要包含两个方面,基于实例的转移主要是使用预训练模型进行细胞图样特征提取,避免长时间的新模型学习。基于特征的转移主要针对临床等现实样本,通过添加一定比例的细胞系细胞二维光散射图样特征对临床现实数据特征库进行扩增。将纯净的细胞系细胞特征转移到现实样本中达到特征转移目的。用于实例转移的预训练模型由自然图集训练获得,保留预训练参数转移给本文中图样数据使用。
本实施例中用于特征转移的宫颈癌细胞系包括Caski细胞系、Hela细胞系、C33a细胞系,转移目标为临床宫颈癌样本,通过特征拟合使培养的样本在临床模型训练中提供一定的权重,选取拟合系数作为特征空间中目标域和源域特征的均值比。
公式定义为:
Figure BDA0003089677410000081
其中XT表示目标域的特征空间,XS表示源域的特征空间。
评价筛查部分根据分类部分获得的概率值作为筛查样本的分类标准,利用前期对实际数据实验的经验,划定分类阈值,为用户提供样本的分类指标。在案例3中本实施例输出三种指标:患有宫颈癌、正常、可疑,其中可疑样本还提供比率值作为患癌可疑风险值一同输出。
更具体的,系统的工作方法包括以下步骤:
步骤一:配置样本,利用二维光散射视频流式细胞仪获取样本视频数据并进行存储。
步骤二:将视频数据输入数字细胞过滤预处理部分,该部分首先对视频数据逐帧拆分图像数据,然后对得到的图像数据进行过滤处理,每张图像数据经形态学算法与粒度分析算法处理获得图像形态学粒度特征值,判断特征值是否符合标准,若符合则保留该图像,否则将图像剔除;然后利用一个训练好的机器学习模型对保留的图像进行进一步的过滤,去除更加复杂的杂质图样,将筛选后的图像数据集按照金标准进行分类存放并标明标签。
步骤三:将存放好的二维光散射图样数据与标签输入带有预训练参数的卷积神经网络获得最终特征向量。
步骤四:选择一定比例的培养细胞系特征向量与实际样本特征向量混合,生成基于细胞系的转移数据特征向量。
步骤五:将特征向量与标签输入支持向量机分类器进行分类训练,获得最终分类模型。
步骤六:将需要测试的样本数据经数字细胞过滤存储后输入特征提取模型中提取特征,然后将特征向量送入分类模型进行分类,获得样本的分类概率值。
步骤七:依照分类概率值判断样本状态进行样本筛查,将分类概率与判断结果输出并交予用户参考。
下面结合具体实案例进行介绍:
案例1:
使用基于转移学习的细胞分类与样本筛查方法,实现复杂样本细胞二维光散射视频中感兴趣帧提取。在实际样本筛查中,由于样本情况复杂,通常包含气泡、细胞碎片及其他未知杂质。为提高后期分类识别过程的准确性,并同时保证尽可能提取所有感兴趣细胞的二维光散射图样,本发明对于样本原始视频进行自动过滤与筛选。通过过滤程序获得纯净的样本细胞二维光散射图样数据集,方便后续进一步操作。
具体操作步骤:
(1)将大约每分钟13.5G的临床样本细胞二维光散射视频拆分为格式为JPG的帧图像。
(2)将每帧图像依次经过形态学粒度算法处理,算法门限参数设为0.6。
(3)对图样的形态与粒度特征进行门限判别,若在均值为中心的60%区间内则保留图像,反之则作为气泡、细胞碎片等杂质进行剔除。
(4)将步骤(3)保留的图像输入机器学习算法进行判断,算法对图样进行自动的识别,剔除判断为非细胞杂质的图样。
(5)将步骤(4)后保留的图像作为样本感兴趣图像进行分类保存并标明标签。实验结果如图2所示,A为杂质剔除前的部分图像帧,B为保留的感兴趣图像,C为剔除的杂质图像。本实例证明了本发明能够有效提取视频中感兴趣图像,并有效剔除杂质图像。
案例2:
为了验证本发明对于细胞二维光散射图样鉴别的灵敏度和准确性,使用宫颈癌细胞系细胞进行实验验证和算法测试。在本案例中,选择Caski、Hela和C33a三种常见的宫颈癌细胞系作为测试样品,获得其二维散射图样视频数据,并将实验结果与真实标签进行对比分析。
具体操作步骤:
(1)收集三种宫颈癌细胞系的细胞二维光散射视频并拆分为帧图像,将图像输入数字细胞过滤预处理部分对细胞图像进行过滤存储;根据来源的细胞系不同,将图像标签分别标为:Caski细胞、Hela细胞、C33a细胞;
(2)从过滤后的细胞二维光散射图样数据集中随机选择训练数据集和验证数据集,其中训练集大小为11000张,测试集大小为1200张,其中测试集为随机选取的训练集以外的数据;每类细胞训练集比例为Caski细胞:Hela细胞:C33a细胞=1:1:3,测试集比例为Caski细胞:Hela细胞:C33a细胞=1:1:1;
(3)将训练集与测试集输入带有预训练参数的CNN深度学习特征提取器进行特征提取使用的CNN算法模型为Inception v3;选择完整连接层之前的输出作为提取的特征(2048维),将训练集特征输入SVM分类器进行分类训练,获得最终的分类模型;
(4)利用1200张测试集数据(其中Caski细胞400张,Hela细胞400张,C33a细胞400张)依次经过步骤(3)获得的特征提取模型和分类模型得到每张图片的分类标签;
(5)将自动分类标签与真实标签进行比较计算每一类细胞的准确度;其中,准确度定义为能够被正确分类的细胞数量占全部细胞数量的百分比,值越接近于1,表示分类器性能越好;实验结果如图3所示,Caski细胞准确率达到84%,Hela细胞准确率达到90%,C33a细胞准确率达到90.5%;本案例证明了本实施例用于癌细胞分类的可行性以及准确性。
案例3:
使用基于转移学习的宫颈癌筛查方法,对临床宫颈癌样本与正常样本进行自动分类筛查。本实例中共使用了25名志愿者的临床TCT(Thinprep细胞学检测)样本(9例临床宫颈癌患者样本,16例正常人样本);每个样本采集视频数据,并保证每个样本获取2000个以上的细胞图样。对获得的视频用本发明方法进行处理。测试时采取留一交叉验证,以24个样本为训练,1个为测试样本循环进行,直至25个样本都测试完成。
具体实现:
(1)将25例临床样本采集的细胞二维光散射图样视频进行拆帧处理,将图像输入数字细胞过滤预处理部分对细胞图像进行过滤存储;根据临床样本来源状态不同,将图像标签分别标为:来自于宫颈癌患者、来自于正常人;
(2)将训练集与测试集输入带预训练参数的CNN深度学习特征提取器进行特征提取,选择全连接层之前的输出作为提取的特征(2048维),获得每个细胞的特征向量。
(3)进入特征转移部分,由于临床样本较为稀缺且患癌临床样本中同时包含正常细胞干扰,本发明对宫颈癌细胞系提取到的特征进行转移,混合入临床宫颈癌样本特征数据中,既增加了样本量又减少了干扰。在本实例中按照4:6的比例进行临床宫颈癌样本特征与宫颈癌细胞系特征的转移,临床正常样本数据特征不进行转移处理。特征转移效果如图4所示,随着细胞系样本特征所占总特征比例的减少,患癌样本中细胞分类的平均准确率不断减小,正常样本中细胞分类准确率有所增加,为了平衡两类情况,故选择两曲线交叉位置作为最佳混合比(细胞系60%,临床样本40%)。
(4)将转移后的特征输入支持向量机(SVM)分类器进行分类训练,获得最终分类模型。
(5)采取留一交叉验证法,循环(2)、(3)、(4)步骤25次,共获得25个最终特征提取模型和分类模型。
(6)将每次未用来进行训练的1例临床样本数据作为测试样本,依次经过步骤(2)、(4)获得的特征提取模型和分类模型得到每张图片的分类标签并统计其中被提示为来自于宫颈癌患者细胞的比率,获得所有25例临床样本的结果。
(7)为测试系统稳定性,利用相同样本重复(2)-(6)步骤3次,最终共获得75次测试结果(25例样本*3次)。
(8)利用第(7)步获得的结果进行评价筛查,图5展示了本实例75次实验结果,通过对结果进行分析,确定75%为判断阈值。若样本中被分类为来自于宫颈癌患者细胞的比率大于75%,则提示该样本患有宫颈癌。若样本中被分类为来自于正常人细胞的比率大于75%,则提示该样本为正常人。结果介于这两类之间的被称为可疑样本,越接近宫颈癌阈值则样本患宫颈癌可能性越大,越接近正常人阈值则样本正常可能性越大,用来供医生作参考。在此标准下,27次临床患癌样本试验中只有一次超出范围(74.8231%)且接近宫颈癌判断阈值,故显示高危;48次正常样本实验只有三次超出范围(68.2823%,68.3535%,67.1418%)且接近正常人判断阈值,故显示低危。本实例证明了本发明用于宫颈癌等实际筛查的可行性以及准确性。
实施例2:
本发明实施例2提供了一种计算机可读存储介质,其上存储有程序该程序被处理器执行时实现如下步骤:
获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
将筛选后的图像数据按照金标准进行分类并设置标签;
根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
详细的方法与实施例1中提供的相同,这里不再赘述。
实施例3:
本发明实施例3提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如下步骤:
获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
将筛选后的图像数据按照金标准进行分类并设置标签;
根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
详细的方法与实施例1中提供的相同,这里不再赘述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于混合转移学习的无标记细胞分类筛查系统,其特征在于:包括:
数据预处理模块,被配置为:获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
图像分类模块,被配置为:将筛选后的图像数据按照金标准进行分类并设置标签;
特征提取模块,被配置为:根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
细胞分类筛查模块,被配置为:将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
2.如权利要求1所述的基于混合转移学习的无标记细胞分类筛查系统,其特征在于:
对获取的样本进行预处理,包括:
对视频数据逐帧拆分图像数据,对得到的图像数据进行过滤处理;
每张图像数据经形态学算法与粒度分析算法处理获得图像形态学粒度特征值,判断特征值是否符合标准,若符合则保留该图像,否则将图像剔除;
利用一个训练好的机器学习模型对保留的图像进行进一步的过滤。
3.如权利要求2所述的基于混合转移学习的无标记细胞分类筛查系统,其特征在于:
对图像的形态与粒度特征进行门限判别,若在均值为中心的预设比例的区间内则保留图像,否则作为杂质进行剔除。
4.如权利要求1所述的基于混合转移学习的无标记细胞分类筛查系统,其特征在于:
根据自然图像训练第二卷积神经网络,将第二卷积神经网络的预训练参数转移给第一卷积神经网络。
5.如权利要求1所述的基于混合转移学习的无标记细胞分类筛查系统,其特征在于:
根据自然图像训练第二卷积神经网络,将第二卷积神经网络的预训练参数转移给第三卷积神经网络,第三卷积神经网络以细胞系数据为输入,得到细胞系数据特征向量,将细胞系特征向量按比例转移给临床样本特征向量集,利用转移后的特征向量集训练支持向量机模型。
6.如权利要求1所述的基于混合转移学习的无标记细胞分类筛查系统,其特征在于:
根据预设支持向量机模型得到样本的分类概率值,依照分类概率值与预设阈值判断样本状态。
7.如权利要求1所述的基于混合转移学习的无标记细胞分类筛查系统,其特征在于:
卷积神经网络为Inception v3模型,选择完整连接层之前的输出作为提取的特征向量。
8.如权利要求1所述的基于混合转移学习的无标记细胞分类筛查系统,其特征在于:
根据正常细胞和癌变细胞的平均准确性-细胞系样本特征所占总特征比例曲线的交叉位置,进行转移数据特征向量的混合比例设定。
9.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如下步骤:
获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
将筛选后的图像数据按照金标准进行分类并设置标签;
根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如下步骤:
获取二维光散射视频数据样本,对获取的样本进行预处理,得到去除杂质后的图像数据;
将筛选后的图像数据按照金标准进行分类并设置标签;
根据带有预训练参数的第一卷积神经网络以及得到的图像数据和标签,得到图像数据的特征向量;
将得到的特征向量输入到预设支持向量机模型中,得到细胞分类筛查结果;
其中,预设的支持向量机模型由样本数据特征向量和细胞系数据特征向量混合得到的转移数据特征向量训练得到。
CN202110592201.5A 2021-05-28 2021-05-28 一种基于混合转移学习的无标记细胞分类筛查系统 Active CN113344868B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110592201.5A CN113344868B (zh) 2021-05-28 2021-05-28 一种基于混合转移学习的无标记细胞分类筛查系统
US17/804,073 US20220383629A1 (en) 2021-05-28 2022-05-25 Label-free cell classification and screening system based on hybrid transfer learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110592201.5A CN113344868B (zh) 2021-05-28 2021-05-28 一种基于混合转移学习的无标记细胞分类筛查系统

Publications (2)

Publication Number Publication Date
CN113344868A true CN113344868A (zh) 2021-09-03
CN113344868B CN113344868B (zh) 2023-08-25

Family

ID=77471922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110592201.5A Active CN113344868B (zh) 2021-05-28 2021-05-28 一种基于混合转移学习的无标记细胞分类筛查系统

Country Status (1)

Country Link
CN (1) CN113344868B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960073A (zh) * 2018-06-05 2018-12-07 大连理工大学 面向生物医学文献的跨模态图像模式识别方法
CN110110799A (zh) * 2019-05-13 2019-08-09 广州锟元方青医疗科技有限公司 细胞分类方法、装置、计算机设备和存储介质
CN110427875A (zh) * 2019-07-31 2019-11-08 天津大学 基于深度迁移学习和极限学习机的红外图像目标检测方法
CN112417882A (zh) * 2021-01-25 2021-02-26 成都信息工程大学 基于迁移学习的中医临床领域词嵌入学习方法及迁移方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108960073A (zh) * 2018-06-05 2018-12-07 大连理工大学 面向生物医学文献的跨模态图像模式识别方法
CN110110799A (zh) * 2019-05-13 2019-08-09 广州锟元方青医疗科技有限公司 细胞分类方法、装置、计算机设备和存储介质
CN110427875A (zh) * 2019-07-31 2019-11-08 天津大学 基于深度迁移学习和极限学习机的红外图像目标检测方法
CN112417882A (zh) * 2021-01-25 2021-02-26 成都信息工程大学 基于迁移学习的中医临床领域词嵌入学习方法及迁移方法

Non-Patent Citations (10)

* Cited by examiner, † Cited by third party
Title
HAIFENG WEI ET AL.: "Automatic Classification of Label-Free Cells from Small Cell Lung Cancer and Poorly Differentiated Lung Adenocarcinoma with 2D Light Scattering Static Cytometry and Machine Learning", 《2018 INTERNATIONAL SOCIETY FOR ADVANCEMENT OF CYTOMETRY》 *
HAIFENG WEI ET AL.: "Automatic Classification of Label-Free Cells from Small Cell Lung Cancer and Poorly Differentiated Lung Adenocarcinoma with 2D Light Scattering Static Cytometry and Machine Learning", 《2018 INTERNATIONAL SOCIETY FOR ADVANCEMENT OF CYTOMETRY》, 3 December 2018 (2018-12-03), pages 302 *
YANYANG GU ET AL.: "Progressive Transfer Learning and Adversarial Domain Adaptation for Cross-Domain Skin Disease Classification", 《IEEE JOURNAL OF BIOMEDICAL AND HEALTH INFORMATICS》 *
YANYANG GU ET AL.: "Progressive Transfer Learning and Adversarial Domain Adaptation for Cross-Domain Skin Disease Classification", 《IEEE JOURNAL OF BIOMEDICAL AND HEALTH INFORMATICS》, vol. 24, no. 5, 23 September 2019 (2019-09-23), pages 1379, XP011786318, DOI: 10.1109/JBHI.2019.2942429 *
刘兆军: "面向智能辅助驾驶的迁移学习脑机接口", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 *
刘兆军: "面向智能辅助驾驶的迁移学习脑机接口", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》, no. 01, 15 January 2021 (2021-01-15), pages 4 *
李伟;孙星星;户媛姣;: "基于改进CNN的宫颈细胞自动分类算法", 计算机系统应用, no. 06 *
王力锐: "基于深度迁移学习的细胞显微图像分类算法", 《中国优秀博硕士学位论文全文数据库(硕士)医药卫生科技辑》 *
王力锐: "基于深度迁移学习的细胞显微图像分类算法", 《中国优秀博硕士学位论文全文数据库(硕士)医药卫生科技辑》, no. 01, 15 January 2021 (2021-01-15), pages 3 - 4 *
陈磊;李菲菲;陈虬;: "基于迁移学习与权重支持向量机的图像多标签标注算法", 电子科技, no. 03 *

Also Published As

Publication number Publication date
CN113344868B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
CN111079620B (zh) 基于迁移学习的白细胞图像检测识别模型构建方法及应用
CN110473167B (zh) 一种基于深度学习的尿沉渣图像识别系统及方法
Shahin et al. A novel white blood cells segmentation algorithm based on adaptive neutrosophic similarity score
Quiñones et al. Leukocyte segmentation and counting based on microscopic blood images using HSV saturation component with blob analysis
Davidson et al. Automated detection and staging of malaria parasites from cytological smears using convolutional neural networks
CN113393443A (zh) 一种he病理图像细胞核分割方法及系统
Tantikitti et al. Image processing for detection of dengue virus based on WBC classification and decision tree
Cabrera et al. HeMatic: An automated leukemia detector with separation of overlapping blood cells through Image Processing and Genetic Algorithm
CN113537182A (zh) 染色体中期分裂相显微图像的自动识别方法与系统
CN112784767A (zh) 基于白细胞显微图像的细胞实例分割算法
CN113658174A (zh) 基于深度学习和图像处理算法的微核组学图像检测方法
Khan et al. An Adaptive Filtering Technique for Segmentation of Tuberculosis in Microscopic Images
CN112001315A (zh) 基于迁移学习和图像纹理特征的骨髓细胞分类识别方法
JP7326316B2 (ja) 細胞学的試料中の少なくとも1つの異常を有する細胞を検出するための方法
CN110188592B (zh) 一种尿液有形成分细胞图像分类模型构建方法及分类方法
CN114782372A (zh) Dna荧光原位杂交bcr/abl融合状态检测方法、检测系统
CN113470041B (zh) 免疫组化细胞图像细胞核分割与计数方法和系统
CN114387596A (zh) 细胞病理涂片自动判读系统
CN116757998A (zh) 基于ai的ctc细胞和ctc样细胞的筛查方法及装置
CN113344868B (zh) 一种基于混合转移学习的无标记细胞分类筛查系统
CN114037868B (zh) 图像识别模型的生成方法及装置
US20220383629A1 (en) Label-free cell classification and screening system based on hybrid transfer learning
CN112750118B (zh) 一种基于自动视觉检测的单细胞孔板测序中鉴定细胞个数的新方法及系统
Ramarolahy et al. Classification and generation of microscopy images with plasmodium falciparum via artificial neural networks using low cost settings
WO2020120039A1 (en) Classification of cell nuclei

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant