CN115689984A - 一种基于线粒体的单细胞特征提取和分析方法及系统 - Google Patents

一种基于线粒体的单细胞特征提取和分析方法及系统 Download PDF

Info

Publication number
CN115689984A
CN115689984A CN202211012909.XA CN202211012909A CN115689984A CN 115689984 A CN115689984 A CN 115689984A CN 202211012909 A CN202211012909 A CN 202211012909A CN 115689984 A CN115689984 A CN 115689984A
Authority
CN
China
Prior art keywords
image
mitochondria
cell
features
single cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211012909.XA
Other languages
English (en)
Inventor
苏绚涛
谢金美
宋坤
刘珊珊
褚然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202211012909.XA priority Critical patent/CN115689984A/zh
Publication of CN115689984A publication Critical patent/CN115689984A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及一种基于线粒体的单细胞特征提取和分析方法及系统,包括:获取单细胞的明场图像、细胞核荧光图像以及线粒体荧光图像等多模态图像;对获取的三个模态的图像进行图像预处理;针对不同的线粒体等结构,提取形态和纹理等特征,并进行特征分析;进一步的,通过线粒体等特征与机器学习技术融合,实现细胞的自动化分类。本发明用于人宫颈上皮细胞(H8)和宫颈癌细胞(HeLa)的分类,形态学特征和纹理特征的机器学习分析显示了细胞内线粒体在宫颈细胞分类中的潜力。本发明适用性强,可与机器学习等分析方法结合,并可应用于多种生物细胞中,具备普遍性,易于推广。

Description

一种基于线粒体的单细胞特征提取和分析方法及系统
技术领域
本发明涉及一种基于线粒体的单细胞特征提取和分析方法及系统,可用于人类宫颈上皮细胞(H8)和宫颈癌细胞(HeLa)的分类,临床形态学特征和纹理特征的分析显示了细胞内线粒体在宫颈细胞分类中的潜力。
背景技术
细胞是构成有机体的基本单位,一切有机体都由细胞构成。而线粒体是一种存在于大多数细胞中的细胞器,是细胞中制造能量的结构。除了为细胞供能外,线粒体还参与细胞分化和细胞凋亡等过程,并拥有调控细胞生长和细胞周期的能力。一般来说,细胞中线粒体数量取决于该细胞的代谢水平,代谢活动越旺盛的细胞,其线粒体越多。在病理状态下,线粒体的大小数量等会发生相应的变化。科学家还发现了促进癌症转移的线粒体开关,当肿瘤细胞中线粒体的功能发生改变时会促进细胞的迁移,最终导致肿瘤成功转移。所以,线粒体的形态学特征和纹理特征的研究有利于促进某些疾病及癌症的诊治。目前临床病理学家利用细胞学经验来鉴定细胞时,主要关注细胞的异常形态变化和细胞核的大小,而对线粒体形态学和纹理特征的研究非常少。
宫颈癌是女性常见恶性肿瘤中的高发疾病。幸运的是,宫颈癌的发展是缓慢的,早期筛查为降低治疗成本和死亡率提供了一个很好的机会。临床常见的子宫颈普查方法包括人乳头瘤病毒检测、液基细胞学检测和阴道镜检查,活检病理为其诊断的金标准。这些临床检查通常需要病理学家的密切参与。然而,缺乏经验丰富的病理学家是全球大规模筛查的巨大障碍,尤其是在欠发达地区。
目前单细胞中线粒体的特征提取和分析一方面通过靶向探针连接线粒体的基因或蛋白质等物质,来分析线粒体与癌症等疾病之间的关系,该方法虽然精确度高,但处理过程复杂,且价格昂贵;另一方面对于单细胞中线粒体的荧光成像分析主要集中在其强度的量化分析,忽视了其形态特征的量化分析,又因其形态特征携带着线粒体与癌症等疾病密不可分的分布状态信息和数量信息,所以有必要对线粒体形态特征进行提取和量化。
发明内容
针对现有技术的不足,本发明提供了一种基于线粒体的单细胞特征提取和分析方法,本发明还提供了一种基于线粒体的单细胞特征提取和分析系统;
本发明验证线粒体作为细胞癌变标志物的潜力;验证线粒体图像在机器学习自动分类细胞的潜力。可得线粒体的形态学特征和纹理特征能够较好地对单细胞进行特征分析和自动分类,并应用于人类宫颈上皮细胞和宫颈癌细胞的分类。
术语解释:
1、明场图像,明场是现代显微镜的一种成像模式,如果只允许透射束通过物镜光阑成像得到的图像,则为明场图像。
2、细胞核荧光图像,对细胞样本用DAPI进行染色固定后,在卤素灯的照射下,通过激发滤光片(激发波长325-369nm)和发射滤光片(发射波长430-490nm)得到的细胞核被特异性表示成蓝色的细胞荧光图像。
3、线粒体荧光图像,对细胞样本用MitoTracker Red CMXRos进行染色固定后,在卤素灯的照射下,通过激发滤光片(激发波长542-582nm)和发射滤光片(发射波长604-644nm)得到的线粒体被特异性表示成红色的细胞荧光图像。
4、中值滤波去噪,中值滤波法是一种非线性平滑技术,将每一像素点的灰度值设置为该点某邻域窗口内的所有像素点灰度值的中值,可以去除噪声用以平滑图像。
5、canny算子边缘提取,Canny算子是一种边缘检测算子,是目前理论上相对完善的一种边缘检测算法。可用MATLAB、OpenCV等常用图像处理软件的工具包计算得到。
6、扩张操作,使二值图像的像素向周围膨胀,使图像中原本独立的一些临近区域相连接,能更好的得到一个完整的闭合区域用于表征细胞边缘。
7、闭合操作,对二值图像实现闭计算,使其融合一般的窄缺口和细长的弯口,填补轮廓上的缝隙。
8、孔洞填充,对二值图像中的区域和“空洞”进行填充。
9、轮廓勾勒,使用细线条将图像边缘勾勒出来,得到一个闭合的线条即为细胞图像边缘。
10、k-最近邻kNN,是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分类到这个类中。
11、支持向量机SVM,是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面,SVM可以通过核方法进行非线性分类,是常见的核学习方法之一。
12、随机森林RF,指的是利用多棵树对样本进行训练并预测的一种分类器。
13、逻辑回归LR,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。
14、CLGM算子,灰度共生矩阵算子。
15、LBP算子,局部二值模式算子。
16、光激励系统,由卤素灯(U-HGLGPS,Olympus,Japan)产生的光源经过中性密度滤光器滤光,然后传播到荧光滤光器立方体中。
17、样本系统,细胞悬液置于夹芯芯片中,该芯片由两个厚度为1.1mm的玻片作为底层和顶层和两个170μm的覆盖层作为间隔层组成一个静态单元室,安装在倒置显微镜(IX73,Olympus,Japan)的台子上。
18、三个模态的异步成像系统,通过切换滤波器组,可以通过一个40物镜(LUCPLFLN40X,Olympus,Japan)到CMOS传感器(800D,Canon,Japan)上异步获得芯片上静态细胞的明场图像、细胞核荧光图像、线粒体荧光图像。
本发明的技术方案为:
一种基于线粒体的单细胞特征提取和分析方法,包括:
获取单细胞的三个模态的图像;包括:获得单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像;
对获取的三个模态的图像进行图像预处理;
针对不同的数据特征,分别提取三个模态的特征并进行特征分析,获得细胞核与细胞质面积之比和线粒体与细胞质面积之比,并得到细胞核与细胞质之比和线粒体与细胞质之比的直方图分布及其核密度估计曲线;
通过机器学习实现自动分类。
根据本发明优选的,图像预处理,包括:
分别对单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像进行裁剪和归一化,去除与细胞无关的大块背景;
分别对单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像进行边缘检测,提取轮廓,提取轮廓的步骤依次包括中值滤波去噪、canny算子边缘提取、扩张操作、闭合操作、孔洞填充、轮廓勾勒。
根据本发明优选的,提取三个模态的特征,是指:提取形态学特征;包括:
针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,每幅图像提取7个形态学特征,包括:面积、周长、最大轴长、最小轴长、长宽比、矩形度和圆度;这样,每个细胞的三模态图像总共获得21个形态学特征,用于细胞形态学信息的定量显示。
通过计算面积比,获得细胞核与细胞质面积之比和线粒体与细胞质面积之比。
特征分析,是指:对得到的形态特征数值进行对比分析,得到细胞核与细胞质之比和线粒体与细胞质之比的直方图分布及其核密度估计曲线。
根据本发明优选的,自动分类,包括:使用多种机器学习分类器对定量化的形态特征即获得的21个形态学特征及细胞核与细胞质面积之比和线粒体与细胞质面积之比进行细胞分类。
进一步优选的,多种机器学习分类器包括k-最近邻kNN、支持向量机SVM、随机森林RF和逻辑回归LR四种机器学习分类器。
根据本发明优选的,提取三个模态的特征,还包括:
通过灰度共生矩阵算子(CLGM)算子提取纹理特征:针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,每幅图像提取4个方向上的6个CLGM特征:对比度、差异性、同质性、能量、自相关性、角二阶矩,这样,每一张图片获得24个CLGM特征,单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像这3种图像共获取72个多模态CLGM特征;
同时,通过局部二值模式(LBP)算子提取纹理特征:针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,处理得到邻域半径为1、邻域点的个数为8的LBP图像,并统计LBP图像灰度值的直方图,每一张图片获得59个LBP特征,单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像这3种图像共获取177个多模态LBP特征。
根据本发明优选的,自动分类,还包括:将提取的纹理特征包括72个多模态CLGM特征和177个多模态LBP特征与提取的形态学特征进行结合,来实现细胞的自动分类;
具体是指:72个多模态CLGM特征和177个多模态LBP特征与提取的形态学特征进行数组拼接,组合成新的特征数组,输入机器学习分类器中进行学习训练;学习训练采用python开源的Scikit-learn图像处理包进行;机器学习分类器输出得到图像的类别结果,通过与真实类别进行对比,统计得到分类准确率、灵敏度、特异性、精确性。
一种基于线粒体的单细胞特征提取和分析系统,包括:
静态细胞术单元,被配置为:获取单细胞的三个模态的图像;包括:获得单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像;
图像预处理单元,被配置为:对获取的三个模态的图像进行图像预处理;
图像特征提取单元,被配置为:提取三个模态的特征;
图像特征分析单元,被配置为:对提取的三个模态的特征进行特征分析,获得细胞核与细胞质面积之比和线粒体与细胞质面积之比,并得到细胞核与细胞质之比和线粒体与细胞质之比的直方图分布及其核密度估计曲线;
分类单元,被配置为:将采集的样本结果分为训练集和测试集,根据输入的特征值,通过寻找最优参数,优化分类函数,实现样本的自动分类。
根据本发明优选的,图像特征提取单元包括图像形态学特征提取单元及图像纹理特征提取单元;
图像形态学特征提取单元,被配置为:提取形态学特征;
图像纹理特征提取单元,被配置为:通过CLGM算子和LBP算子提取纹理特征。
根据本发明优选的,所述静态细胞术单元,包括光激励系统、样本系统和三个模态的异步成像系统,用以获取单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现基于线粒体的单细胞特征提取和分析方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现基于线粒体的单细胞特征提取和分析方法的步骤。
本发明的有益效果为:
1、本发明采用将单细胞的明场图像和线粒体荧光图像的多种特征结合,提供了线粒体作为单细胞分类有力的内部生物标志物;
2、本发明提取单细胞三个模态的图像的临床形态学特征和纹理特征,可在分析中以临床为参考,更为有力地保证实验结论的可靠性;
3、本发明采用直方图分布及其核密度估计曲线,可直观地实现单模态中细胞核与线粒体临床形态学特征的比较;
4、本发明能够实现对人宫颈癌细胞与正常细胞的快速自动分类,摆脱了人工阅片的繁琐过程;
5、本发明适用于与多种细胞分析方法相结合,比如可与细胞核成像分析、细胞的二维光散射技术等多种技术结合,实现对细胞更有效更全面的分析和自动分类;
6、本发明关于线粒体的细胞标志物潜力的探究适用于其他生物细胞的图像分析与分类,具备普遍推广性。
附图说明
图1为本发明基于线粒体的单细胞特征提取和分析方法的流程示意图;
图2为本发明实例提供的H8细胞和HeLa细胞的明场图像、细胞核荧光图像和线粒体荧光图像示意图;
图3为本发明实例提供的三个模态的数据预处理流程图;
图4为本发明实例提供的两种细胞系2个临床形态学特征的直方图和核密度估计曲线示意图;
图5为本发明实例提供的形态学和纹理特征的单模态的机器学习分类结果示意图。
具体实施方式
下面结合说明书附图与实例对本发明作进一步说明。
实施例1
一种基于线粒体的单细胞特征提取和分析方法,包括:
获取单细胞的三个模态的图像;包括:获得单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像;
对获取的三个模态的图像进行图像预处理;
针对不同的数据特征,提取三个模态的特征并进行特征分析,获得细胞核与细胞质面积之比和线粒体与细胞质面积之比,并得到细胞核与细胞质之比和线粒体与细胞质之比的直方图分布及其核密度估计曲线;
通过机器学习实现自动分类。
实施例2
根据实施例1所述的一种基于线粒体的单细胞特征提取和分析方法,如图1所示,其区别在于:
图像预处理,包括:分别对单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像进行裁剪和归一化,去除与细胞无关的大块背景;
分别对单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像进行边缘检测,提取轮廓,提取轮廓的步骤依次包括中值滤波去噪、canny算子边缘提取、扩张操作、闭合操作、孔洞填充、轮廓勾勒。
提取三个模态的特征,是指:提取形态学特征;包括:
针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,每幅图像提取7个形态学特征,包括:面积、周长、最大轴长、最小轴长、长宽比、矩形度和圆度;在图像预处理中根据图像边缘检测后得到的轮廓,统计闭合轮廓内的像素点个数,再根据图像比例尺可以换算得到尺寸。根据表1的特征描述分别计算统计得到7个需要的形态特征。
表1
Figure BDA0003811281930000071
这样,每个细胞的三模态图像总共获得21个形态学特征,用于细胞形态学信息的定量显示。
通过计算面积比,获得细胞核与细胞质面积之比和线粒体与细胞质面积之比;
特征分析,是指:对得到的形态特征数值进行对比分析,得到细胞核与细胞质之比和线粒体与细胞质之比的直方图分布及其核密度估计曲线。直方图分布是一种统计报告图,用于显示定量数据的分布情况。横轴是一个需要统计的连续变量的数据值,纵轴表示累积的频数。核密度估计曲线类似于直方图,其纵轴表示数据值的出现概率,可视化展示数据的连续概率密度,曲线“峰”越高,表示此处数据越“密集”。
自动分类,包括:使用多种机器学习分类器对定量化的形态特征即获得的21个形态学特征及细胞核与细胞质面积之比和线粒体与细胞质面积之比进行细胞分类。每个细胞的三模态图像可同时获得21个基本形态学特征和2个面积比特征,用于细胞形态学信息的定量显示,并可用定量化的形态学特征对细胞进行自动分类;
多种机器学习分类器包括k-最近邻kNN、支持向量机SVM、随机森林RF和逻辑回归LR四种机器学习分类器。
本实施例使用单细胞特征提取和分析方法对单个人类宫颈上皮细胞(H8)和宫颈癌细胞(HeLa)的三个模态的图像的临床形态学特征进行分析。本实施例中对所获得的三个模态的图像进行预处理,对预处理后的三个模态的图像进行统计计算,每幅图像可获得7个临床形态学特征。另外通过计算轮廓区域像素的比例得到细胞核与细胞质面积之比、线粒体与细胞质面积之比的形态学特征均值和方差数值的统计。具体操作步骤如下:
(1)H8和HeLa细胞的培养,将培养好的宫颈细胞离心,并在Dulbecco改良的Eagle培养基中重悬,悬浮细胞用MitoTracker Red CMXRos在37℃的黑暗环境中染色30分钟,工作浓度为100nM。随后,用磷酸盐缓冲盐水洗涤细胞,用4%多聚甲醛在37℃固定10分钟。随后,用PBS洗涤细胞,在室温下用DAPI固定5分钟,洗细胞后制备细胞悬液;
(2)获取处理后的H8和HeLa细胞的明场图像、细胞核和线粒体的荧光图像,如图2所示。图2中(a)为H8细胞的明场图像、细胞核荧光图像和线粒体荧光图像示意图;图2中(b)为HeLa细胞的明场图像、细胞核荧光图像和线粒体荧光图像示意图;总共获得了两种宫颈细胞的2005组三模态数据,其中H8细胞990组(每个模态990张),HeLa细胞1015组(每个模态1015张);
(3)如图3所示,对所获得的三模态图像进行中值滤波去噪、canny算子边缘提取、扩张、闭合和孔洞填充,得到细胞的轮廓边缘;
(4)对预处理后的三模态图像进行统计计算,每幅图像可获得7个临床形态学特征:面积、周长、最大轴长、最小轴长、长宽比、矩形度、圆度;
(5)计算所有H8和HeLa细胞三模态图像下的细胞核与细胞质面积之比、线粒体与细胞质面积之比,进一步探究直方图分布及其核密度估计曲线,来展示细胞核与细胞质之比和线粒体与细胞质之比的分布特征,如图4所示。在图4的(a)中,两种细胞的细胞核与细胞质之比的差异不显著,密度峰基本重合在0.47左右。图4的(b)中,H8的线粒体与细胞质之比密度峰约为0.76,HeLa细胞约为0.78。线粒体与细胞质之比统计结果表明,与传统临床上以细胞核为分类方法相比,利用线粒体分类恶性肿瘤细胞更具有潜在的临床应用价值。
(6)将H8和HeLa细胞的明场图像和细胞核荧光图像的7个形态学特征以及细胞核与细胞质面积之比共15个特征输入四种机器学习方法中,并采用5-折交叉验证法构建机器学习分类器,将两类细胞结果的2005个数据随机分为5个数据集,每个数据集有401个样本,轮流将其中的4个数据集作为训练集,剩余的一个数据集作为测试集,重复交叉验证5次后,将5次预测结果的正确率的平均值作为最终的准确率。其中,准确率定义为能够被正确分类的细胞数量占全部细胞数量的百分比;灵敏度定义为HeLa细胞能被正确分类的数量与HeLa细胞总数量的比值;特异性定义为H8细胞被正确分类的数量与H8细胞总数量的比;精确性指的是正确预测HeLa细胞的数量与HeLa预测总数的比率。AUC参数用于评估分类器的性能,值越接近于1,表示分类器性能越好。人类宫颈上皮细胞和宫颈癌细胞基于细胞形态学特征的四种分类结果如表2所示。
表2
分类方法 准确率 灵敏度 特异性 精确性
KNN 68.48%±2.90% 72.81%±9.76% 64.04%±13.32% 68.37%±5.58%
SVM 69.13%±3.84% 64.93%±14.21% 73.43%±14.13% 72.83%±6.21%
RF 69.63%±2.88% 74.38%±12.33% 64.75%±16.95% 69.85%±6.99%
LR 71.07%±2.54% 74.78%±12.94% 67.27%±15.06% 71.26%±5.90%
四种机器学习算法的分类准确率均在70%左右,其中LR方法的分类准确率为71.07%,灵敏度为74.78%,特异性为67.27%,取得了最佳的分类结果。
实施例3
根据实施例2所述的一种基于线粒体的单细胞特征提取和分析方法,其区别在于:
提取三个模态的特征,还包括:
通过CLGM算子提取纹理特征:针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,每幅图像提取4个方向上的6个CLGM特征:对比度、差异性、同质性、能量、自相关性、角二阶矩,表3为灰度共生矩阵特征的描述:
表3
Figure BDA0003811281930000091
Figure BDA0003811281930000101
这样,每一张图片获得24个CLGM特征,单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像这3种图像共获取72个多模态CLGM特征;
同时,通过LBP算子提取纹理特征:针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,采用python开源的Scikit-Image图像处理包处理得到邻域半径为1、邻域点的个数为8的LBP图像,并统计LBP图像灰度值的直方图,每一张图片获得59个LBP特征,单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像这3种图像共获取177个多模态LBP特征。以获得更多的信息来反映单细胞图像的纹理差异。
自动分类,还包括:将提取的纹理特征包括72个多模态CLGM特征和177个多模态LBP特征与提取的形态学特征进行结合,来实现细胞的自动分类;
具体是指:72个多模态CLGM特征和177个多模态LBP特征与提取的形态学特征进行数组拼接,组合成新的特征数组,输入机器学习分类器中进行学习训练;学习训练采用python开源的Scikit-learn图像处理包进行;机器学习分类器输出得到图像的类别结果,通过与真实类别进行对比,统计得到分类准确率、灵敏度、特异性、精确性。
采用与k-最近邻kNN、支持向量机SVM、随机森林RF和逻辑回归LR四种机器学习分类器对实验结果自动分类,对预处理后的实验结果进行分组学习训练和预测,提供分类结果以及分类评估值。
本实施例中使用单细胞特征提取和分析方法,对H8和HeLa进行细胞识别和自动分类。本实施例中对所获得的三模态图像进行预处理,对预处理后的三模态图像进行统计计算,每幅图像可获得7个临床形态学特征。利用灰度共生矩阵和局部二值模式算子对明场图像和双色荧光图像进行纹理特征提取,通过CLGM算子得到24个特征,LBP算子得到59个特征。将临床形态特征和纹理特征输入四种机器学习算法作为特征参数,对两类细胞进行自动分类。具体操作步骤如下:
(1)选择实施例1中的7个形态学特征:面积、周长、最大轴长、最小轴长、长宽比、矩形度和圆度;
(2)选择CLGM算子和LBP算子对明场图像和两种荧光图像进行纹理特征提取,以获得更多的信息来反映单细胞图像的纹理差异。三模态中每幅图像通过CLGM算子得到24个特征,LBP算子得到59个特征;
(3)将明场图像、细胞核荧光图像和线粒体荧光图像的临床形态学特征和纹理特征作为四种机器学习的分类特征值,人类宫颈上皮细胞和宫颈癌细胞基于单模态的四种机器学习分类结果如表4所示。
表4
Figure BDA0003811281930000111
Figure BDA0003811281930000121
图5中(a)为基于H8和HeLa细胞的形态学和纹理特征的LR分类结果的ROC曲线。以实线为代表的线粒体荧光图像的分类结果最好,准确率为73.92%,AUC为0.84。本实施例采用t分布随机邻域嵌入降维方法将不同模态的输入特征可视化。图5中(b)、(c)、(d)分别显示了明场图像、细胞核荧光图像和线粒体荧光图像三种单一模式的t分布随机邻域结果。三个单模态特征都有一些聚类,但聚类不显著,结果相差不大。此外,线粒体荧光图像在三种模式中分类效果最好,进一步显示了线粒体对癌细胞分类的潜力。
实施例4
一种基于线粒体的单细胞特征提取和分析系统,包括:
静态细胞术单元,被配置为:获取单细胞的三个模态的图像;图像预处理单元,被配置为:对获取的三个模态的图像进行图像预处理;图像特征提取单元,被配置为:提取三个模态的特征;图像特征分析单元,被配置为:对提取的三个模态的特征进行特征分析;分类单元,被配置为:将采集的样本结果分为训练集和测试集,根据输入的特征值,通过寻找最优参数,优化分类函数,实现样本的自动分类。
图像特征提取单元包括图像形态学特征提取单元及图像纹理特征提取单元;
图像形态学特征提取单元,被配置为:提取形态学特征;图像纹理特征提取单元,被配置为:通过CLGM算子和LBP算子提取纹理特征。
静态细胞术单元,包括光激励系统、样本系统和三个模态的异步成像系统,用以获取单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像。
实施例5
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现实施例1-3任一基于线粒体的单细胞特征提取和分析方法的步骤。
实施例6
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现实施例1-3任一基于线粒体的单细胞特征提取和分析方法的步骤。
上述虽然结合说明书附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于线粒体的单细胞特征提取和分析方法,其特征在于,包括:
获取单细胞的三个模态的图像;包括:获得单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像;对获取的三个模态的图像进行图像预处理;
针对不同的数据特征,分别提取三个模态的特征并进行特征分析,获得细胞核与细胞质面积之比和线粒体与细胞质面积之比,并得到细胞核与细胞质之比和线粒体与细胞质之比的直方图分布及其核密度估计曲线;通过机器学习实现自动分类。
2.根据权利要求1所述的一种基于线粒体的单细胞特征提取和分析方法,其特征在于,
图像预处理,包括:分别对单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像进行裁剪和归一化,去除与细胞无关的大块背景;
分别对单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像进行边缘检测,提取轮廓,提取轮廓的步骤依次包括中值滤波去噪、canny算子边缘提取、扩张操作、闭合操作、孔洞填充、轮廓勾勒。
3.根据权利要求1所述的一种基于线粒体的单细胞特征提取和分析方法,其特征在于,提取三个模态的特征,是指:提取形态学特征;包括:
针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,每幅图像提取7个形态学特征,包括:面积、周长、最大轴长、最小轴长、长宽比、矩形度和圆度;这样,每个细胞的三模态图像总共获得21个形态学特征;
通过计算面积比,获得细胞核与细胞质面积之比和线粒体与细胞质面积之比;
特征分析,是指:对得到的形态特征数值进行对比分析,得到细胞核与细胞质之比和线粒体与细胞质之比的直方图分布及其核密度估计曲线。
4.根据权利要求1所述的一种基于线粒体的单细胞特征提取和分析方法,其特征在于,自动分类,包括:使用多种机器学习分类器对定量化的形态特征即获得的21个形态学特征及细胞核与细胞质面积之比和线粒体与细胞质面积之比进行细胞分类;
进一步优选的,多种机器学习分类器包括k-最近邻kNN、支持向量机SVM、随机森林RF和逻辑回归LR四种机器学习分类器。
5.根据权利要求3所述的一种基于线粒体的单细胞特征提取和分析方法,其特征在于,提取三个模态的特征,是指:提取纹理特征;包括:
通过CLGM算子提取纹理特征:针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,每幅图像提取4个方向上的6个CLGM特征:对比度、差异性、同质性、能量、自相关性、角二阶矩,这样,每一张图片获得24个CLGM特征,单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像这3种图像共获取72个多模态CLGM特征;
同时,通过LBP算子提取纹理特征:针对预处理后的单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像,处理得到邻域半径为1、邻域点的个数为8的LBP图像,并统计LBP图像灰度值的直方图,每一张图片获得59个LBP特征,单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像这3种图像共获取177个多模态LBP特征。
6.根据权利要求5所述的一种基于线粒体的单细胞特征提取和分析方法,其特征在于,自动分类,还包括:将提取的纹理特征包括72个多模态CLGM特征和177个多模态LBP特征与提取的形态学特征进行结合,来实现细胞的自动分类;
具体是指:72个多模态CLGM特征和177个多模态LBP特征与提取的形态学特征进行数组拼接,组合成新的特征数组,输入机器学习分类器中进行学习训练;学习训练采用python开源的Scikit-learn图像处理包进行;机器学习分类器输出得到图像的类别结果,通过与真实类别进行对比,统计得到分类准确率、灵敏度、特异性、精确性。
7.一种基于线粒体的单细胞特征提取和分析系统,其特征在于,包括:
静态细胞术单元,被配置为:获取单细胞的三个模态的图像;
图像预处理单元,被配置为:对获取的三个模态的图像进行图像预处理;
图像特征提取单元,被配置为:提取三个模态的特征;
图像特征分析单元,被配置为:对提取的三个模态的特征进行特征分析;
分类单元,被配置为:将采集的样本结果分为训练集和测试集,根据输入的特征值,通过寻找最优参数,优化分类函数,实现样本的自动分类。
8.根据权利要求7所述的一种基于线粒体的单细胞特征提取和分析系统,其特征在于,图像特征提取单元包括图像形态学特征提取单元及图像纹理特征提取单元;
图像形态学特征提取单元,被配置为:提取形态学特征;
图像纹理特征提取单元,被配置为:通过CLGM算子和LBP算子提取纹理特征;
进一步优选的,所述静态细胞术单元,包括光激励系统、样本系统和三个模态的异步成像系统,用以获取单个细胞的明场图像、细胞核荧光图像和线粒体荧光图像。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7任一所述的基于线粒体的单细胞特征提取和分析方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一所述的基于线粒体的单细胞特征提取和分析方法的步骤。
CN202211012909.XA 2022-08-23 2022-08-23 一种基于线粒体的单细胞特征提取和分析方法及系统 Pending CN115689984A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211012909.XA CN115689984A (zh) 2022-08-23 2022-08-23 一种基于线粒体的单细胞特征提取和分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211012909.XA CN115689984A (zh) 2022-08-23 2022-08-23 一种基于线粒体的单细胞特征提取和分析方法及系统

Publications (1)

Publication Number Publication Date
CN115689984A true CN115689984A (zh) 2023-02-03

Family

ID=85061044

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211012909.XA Pending CN115689984A (zh) 2022-08-23 2022-08-23 一种基于线粒体的单细胞特征提取和分析方法及系统

Country Status (1)

Country Link
CN (1) CN115689984A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116313115A (zh) * 2023-05-10 2023-06-23 浙江大学 基于线粒体动态表型和深度学习的药物作用机制预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116313115A (zh) * 2023-05-10 2023-06-23 浙江大学 基于线粒体动态表型和深度学习的药物作用机制预测方法
CN116313115B (zh) * 2023-05-10 2023-08-15 浙江大学 基于线粒体动态表型和深度学习的药物作用机制预测方法

Similar Documents

Publication Publication Date Title
Salvi et al. The impact of pre-and post-image processing techniques on deep learning frameworks: A comprehensive review for digital pathology image analysis
Kaushal et al. Recent trends in computer assisted diagnosis (CAD) system for breast cancer diagnosis using histopathological images
Saraswat et al. Automated microscopic image analysis for leukocytes identification: A survey
Kowal et al. Cell nuclei segmentation in cytological images using convolutional neural network and seeded watershed algorithm
Kwak et al. Nuclear architecture analysis of prostate cancer via convolutional neural networks
JP6503382B2 (ja) 血液学用デジタルホログラフィ顕微鏡検査データ分析
AlZubaidi et al. Computer aided diagnosis in digital pathology application: Review and perspective approach in lung cancer classification
Linkon et al. Deep learning in prostate cancer diagnosis and Gleason grading in histopathology images: An extensive study
Arora et al. A review of metaphase chromosome image selection techniques for automatic karyotype generation
Shirazi et al. Extreme learning machine based microscopic red blood cells classification
Mathew et al. Computational methods for automated mitosis detection in histopathology images: A review
Jia et al. Multi-layer segmentation framework for cell nuclei using improved GVF Snake model, Watershed, and ellipse fitting
JP2023510915A (ja) 腫瘍検出および分析を支援するための非腫瘍セグメンテーション
He et al. A review: The detection of cancer cells in histopathology based on machine vision
Albayrak et al. A hybrid method of superpixel segmentation algorithm and deep learning method in histopathological image segmentation
Sunny et al. Oral epithelial cell segmentation from fluorescent multichannel cytology images using deep learning
Jiang et al. A systematic review of deep learning-based cervical cytology screening: from cell identification to whole slide image analysis
CN115689984A (zh) 一种基于线粒体的单细胞特征提取和分析方法及系统
Bejnordi et al. Novel chromatin texture features for the classification of pap smears
Shirazi et al. Automated pathology image analysis
Carvajal et al. An early experience toward developing computer aided diagnosis for gram-stained smears images
Baker Evaluation of histopathological images segmentation techniques for breast cancer detection
Peng et al. Integrating multi-scale blob/curvilinear detector techniques and multi-level sets for automated segmentation of stem cell images
Battula et al. Automatic classification of Non Hodgkin‘s lymphoma using histological images: Recent advances and directions
Dey et al. Automated detection of early oral cancer trends in habitual smokers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination