CN107944360A - 一种诱导多能干细胞识别方法、系统及电子设备 - Google Patents

一种诱导多能干细胞识别方法、系统及电子设备 Download PDF

Info

Publication number
CN107944360A
CN107944360A CN201711126423.8A CN201711126423A CN107944360A CN 107944360 A CN107944360 A CN 107944360A CN 201711126423 A CN201711126423 A CN 201711126423A CN 107944360 A CN107944360 A CN 107944360A
Authority
CN
China
Prior art keywords
cell
machine learning
sequence image
static nature
delayed sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711126423.8A
Other languages
English (en)
Inventor
滕彦宁
魏彦杰
张海山
郭宁
葛健秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201711126423.8A priority Critical patent/CN107944360A/zh
Publication of CN107944360A publication Critical patent/CN107944360A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10056Microscopic image
    • G06T2207/10061Microscopic image from scanning electron microscope
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20036Morphological image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种诱导多能干细胞识别方法、系统及电子设备。所述诱导多能干细胞识别方法包括:步骤a:获取显微镜延时序列图像;步骤b:对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;步骤c:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。本申请借助图像识别、机器学习等技术,实现对显微镜延时序列图像中IPS细胞的识别与追踪,同时获得与其相关联的静态特征参数以及动态特征参数构建机器学习分类模型,通过机器学习分类模型完成对IPS细胞的识别分类,提高IPS细胞分类的效率。

Description

一种诱导多能干细胞识别方法、系统及电子设备
技术领域
本申请涉及细胞识别技术领域,特别涉及一种诱导多能干细胞识别方法、系统及电子设备。
背景技术
干细胞是一种具有自我复制和分化潜能的细胞。干细胞的干性维持及分化是组织发育和再生修复的驱动力,同时与组织病变包括肿瘤发生发展等密切相关。干细胞技术历经数十年的发展,人们越来越意识到干细胞作为疾病治疗手段,具有挽救生命的能力,造福广大受病痛折磨的患者。事实上,许多难治性疾病都与体内某种特定细胞缺失引起的功能丧失或紊乱相关,譬如免疫衰老、心脏衰竭、癌症、阿兹海默氏症、帕金森症、糖尿病以及骨关节炎等。干细胞技术的深入研究和发展,有望从根本上治疗这些顽症。胚胎干细胞是最有潜能的全能干细胞,可分化形成机体组织的各种细胞。但是,由于胚胎干细胞来源涉及伦理学障碍,限制了其在临床治疗中的应用。重编程诱导性多功能干细胞(Inducedpluripotent stem cells,IPS cells)是近年来发展的新技术,它可以把终端分化的体细胞逆向重编程为类似胚胎干细胞的细胞。利用该技术可以为科学研究和临床治疗提供不限数量的干细胞,同时也完全回避了伦理困扰,为干细胞走向临床应用打通了关键一步。
进入新世纪以来,IPS细胞研究领域已取得了许多重大突破。但是,目前重编程技术还面临几个重要缺陷,比如低诱导率和高致瘤性。特别是在重编程早期,由于最终被诱导成为干细胞的比例非常低(通常小于1%),以及缺乏相应的生物标记对这些细胞进行标注,导致寻找IPS细胞十分浪费人力物力财力。
现有技术中,德国弗莱堡大学的研究团队在2015年提出了一种新的在相差显微镜图片中识别细胞的有效的、十分简单的方法(Bensch R,Ronneberger O.Cellsegmentation and tracking in phase contrast images using graph cut withasymmetric boundary costs[C]//Biomedical Imaging(ISBI),2015IEEE 12thInternational Symposium on.IEEE,2015:1220-1223.)。该方法的关键在于利用分割掩膜边界处的明暗过渡进行分析,相关分割掩膜可以通过快速最小分割法获得,与基于标准最小分割方法本质上不同的地方是这个方法的图包含不对称权重的有向边,从而大大增加了分割的准确性。
此外,根据全局跟踪、高效的数据集训练学习网络提出了很多不同的追踪算法,例如Klas E.G.Magnusson等人提出了一种全局跟踪链接算法(Magnusson K E G,Jaldén J,Gilbert P M,et al.Global linking of cell tracks using the Viterbi algorithm[J].IEEE transactions on medical imaging,2015,34(4):911-929.),将由分割算法生成的单元轮廓链接到轨道中,该算法使用来自完整图像序列信息的方式,每次向图像序列中添加一个轨迹进行追踪,并且该算法不仅可以处理有丝分裂、细胞凋亡和进出成像区域,还可以处理假阳性、错过检测和共同分割细胞簇等情况。
Olaf Ronneberger,等人在追踪方面也提出了一种网络及训练策略(RonnebergerO,Fischer P,Brox T.U-net:Convolutional networks for biomedical imagesegmentation[C]//International Conference on Medical Image Computing andComputer-Assisted Intervention.Springer International Publishing,2015:234-241.),依靠对数据增强的大力利用来充分有效地使用注释的样本,这种架构包含一条获得上下文信息的约束路径和一条能够精确定位的对称扩张路径,实验表明,这种网络可以对较少的图片进行端对端的训练,表现优于现有基于滑动窗口的卷积网络的方法。
机器学习是人工智能的一个分支,机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。至今已有数种机器学习框架,如支持向量机、深度神经网络、卷积神经网络和深度置信网络等,这些框架已被广泛应用于计算机视觉、语音识别、自然语言处理等领域,相关技术已经十分成熟。
与此同时,机器学习近年来在基于生物医学图像的一般疾病诊断与预测方面也取得了不错的效果,包括对自闭症谱系障碍(Autism spectrum disorder,ASD)、阿尔茨海默病(Alzheimer’s disease,AD)、皮肤癌、白内障等疾病的诊断。HC Hazlett等人利用神经影像学技术研究了106名自闭症谱系障碍(autism spectrum disorder,ASD)家族性高风险婴儿和42名低危婴儿,通过深度神经网络对6-12个月婴儿的脑磁共振成像进行学习,预测ADS家族性高风险婴儿在24月时候患病率,其精度可以达到81%,灵敏度可以达到88%(Ronneberger O,Fischer P,Brox T.U-net:Convolutional networks for biomedicalimage segmentation[C]//International Conference on Medical Image Computingand Computer-Assisted Intervention.Springer International Publishing,2015:234-241.)。Siqi Liu等人设计了一种深层学习架构(Hazlett H C,Gu H,Munsell B C,etal.Early brain development in infants at high risk for autism spectrumdisorder[J].Nature,2017,542(7641):348-351.),辅助AD早期阶段和轻度认知障碍(MildCognitive Impairment,MCI)的诊断,其中包含堆栈式自动编码器和softmax输出层,以克服诊断性能上的瓶颈。AEsteva等人直接利用皮肤镜图像,仅用像素和病变类别标签作为输入,训练端到端的单卷积神经网络来对皮肤癌进行诊断(Liu S,Liu S,Cai W,et al.Earlydiagnosis of Alzheimer's disease with deep learning[C]//Biomedical Imaging(ISBI),2014IEEE 11th International Symposium on.IEEE,2014:1015-1018.),用来训练卷积神经网络的数据集含有129450张临床图片,在所有的测试任务中,卷积神经网络的表现已经能够与所有的测试专家相提并论。Erping Long等人利用卷积神经网络算法,来对白内障进行诊断、病情分级以及给出相应的治疗建议(Esteva A,Kuprel B,Novoa R A,etal.Dermatologist-level classification of skin cancer with deep neuralnetworks[J].Nature,2017,542(7639):115-118.)。
除此之外,在一些医学图像分析中,想要获取大的数据集是非常困难的,针对机器学习在小样本医学图像处理中的应用,Bilwaj Gaonkar等人提出了一种基于前馈神经网络的堆栈-监督训练技术来对医学扫描图片中的器官进行识别(Long E,Lin H,Liu Z,etal.Anartificial intelligence platform for the multihospital collaborativemanagement of congenital cataracts[J].Nature Biomedical Engineering,2017,1:0024.),该技术可以在数据集相对较小的环境中工作,即使只训练了单张带有手动标注真值的图片,网络堆栈也能实现精确地分割。Jun Shi等人针对基于超声波图像的小样本肿瘤分类问题设计了一种堆叠的深度多项式网络(Gaonkar B,Hovda D,Martin N,et al.Deeplearning in the small sample size setting:cascaded feed forward neuralnetworks for medical image segmentation[C]//SPIE MedicalImaging.International Society for Optics and Photonics,2016:97852I-97852I-8.),来进一步提升原始深度多项式网络的性能,该算法不仅在训练大规模数据时性能卓越,在面对特征参数较为有效的小数据集时也展现出了巨大的潜力。王浩军等人提出了利用逐步分解的分级聚类算法进行多级支持向量机的构建,然后通过一定准则在各级中确定支持向量机相应的最优控制参数,实现了对骨髓中不同成熟阶段的血细胞的多分类问题(Shi J,Zhou S,Liu X,et al.Stacked deep polynomial network basedrepresentation learning for tumor classification with small ultrasound imagedataset[J].Neurocomputing,2016,194:87-94.)。
综上所述,现有的细胞分割与追踪方法存在以下缺点:
第一、不能有效处理显微镜图像数据中的黏连细胞,容易造成过分割或者欠分割;
第二、不能准确地判断细胞的运动变化,如细胞的出现或消失,即使做出判断,对于复杂的运动也不能达到理想的追踪效果;
第三、只在针对部分图像中具有特定特征或者运动规律的细胞时,追踪效果比较理想,但不具有很好的泛化性。
此外,对于显微镜图像中的干细胞与非细胞分类,使用现有的机器学习方法直接对图像数据进行处理,效果并不十分理想。
发明内容
本申请提供了一种诱导多能干细胞识别方法、系统及电子设备,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本申请提供了如下技术方案:
一种诱导多能干细胞识别方法,包括:
步骤a:获取显微镜延时序列图像;
步骤b:对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
步骤c:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
本申请实施例采取的技术方案还包括:在所述步骤b中,所述对显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数具体包括:
步骤b1:对所述显微镜延时序列图像中的颜色通道进行分离;
步骤b2:利用高斯滤波对通道分离后的显微镜延时序列图像进行平滑降噪;
步骤b3:利用阈值法提取出平滑降噪后的显微镜延时序列图像中的细胞及细胞核区域;
步骤b4:利用基于标记的分水岭算法,将提取的细胞及细胞核区域作为标记区域,根据标记区域对黏连细胞进行分割,并提取标记区域内细胞的静态特征参数;
步骤b5:利用基于质心追踪的目标追踪算法,对同一个细胞在多个帧图像之间的运动轨迹进行追踪,并根据运动轨迹提取细胞的动态特征参数。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述根据细胞的静态特征参数以及动态特征参数构建机器学习分类模型还包括:对提取到的静态特征参数及动态特征参数进行特征提取与预处理,得到用于构建机器学习分类模型的样本数据集。
本申请实施例采取的技术方案还包括:在所述步骤a中,所述获取显微镜延时序列图像还包括:利用影像倒溯的方法对所述显微镜延时序列图像中早期阶段被成功诱导为干细胞的前体细胞进行人工标注。
本申请实施例采取的技术方案还包括:在所述步骤c中,所述根据细胞的静态特征参数以及动态特征参数构建机器学习分类模型还包括:通过所述样本数据集中的静态特征参数和动态特征参数训练至少两个细胞分类器,通过至少两个细胞分类器分别输出细胞识别分类结果;并通过所述人工标注对至少两个细胞分类器的性能进行评价,并选取性能最优的细胞分类器作为最终的机器学习分类模型。
本申请实施例采取的另一技术方案为:一种诱导多能干细胞识别系统,包括:
数据获取模块:用于获取显微镜延时序列图像;
细胞分割与追踪模块:用于对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
模型构建模块:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
本申请实施例采取的技术方案还包括:所述细胞分割与追踪模块包括:
通道分离单元:用于对所述显微镜延时序列图像中的颜色通道进行分离;
滤波单元:用于利用高斯滤波对通道分离后的显微镜延时序列图像进行平滑降噪;
区域提取单元:用于利用阈值法提取出平滑降噪后的显微镜延时序列图像中的细胞及细胞核区域;
细胞分割单元:用于利用基于标记的分水岭算法,将提取的细胞及细胞核区域作为标记区域,根据标记区域对黏连细胞进行分割,并提取标记区域内细胞的静态特征参数;
细胞追踪单元:用于利用基于质心追踪的目标追踪算法,对同一个细胞在多个帧图像之间的运动轨迹进行追踪,并根据运动轨迹提取细胞的动态特征参数。
本申请实施例采取的技术方案还包括数据预处理模块,所述数据预处理模块用于对提取到的静态特征参数及动态特征参数进行特征提取与预处理,得到用于构建机器学习分类模型的样本数据集。
本申请实施例采取的技术方案还包括:所述数据获取模块还用于利用影像倒溯的方法对所述显微镜延时序列图像中早期阶段被成功诱导为干细胞的前体细胞进行人工标注。
本申请实施例采取的技术方案还包括模型评估模块,所述模型构建模块构建机器学习分类模型具体为:通过所述样本数据集中的静态特征参数和动态特征参数训练至少两个细胞分类器,通过至少两个细胞分类器分别输出细胞识别分类结果;所述模型评估模块用于通过所述人工标注对至少两个细胞分类器的性能进行评价,并选取性能最优的细胞分类器作为最终的机器学习分类模型。
本申请实施例采取的又一技术方案为:一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的诱导多能干细胞识别方法的以下操作:
步骤a:步骤a:获取显微镜延时序列图像;
步骤b:对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
步骤c:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
相对于现有技术,本申请实施例产生的有益效果在于:本申请实施例的诱导多能干细胞识别方法、系统及电子设备创新性地借助图像识别、机器学习等技术,实现对显微镜延时序列图像中IPS细胞的识别与追踪,同时获得与其相关联的静态特征参数以及动态特征参数,并对这些特征参数进行分析与处理,挑选出合适的特征子集,通过机器学习分类模型完成对IPS细胞的识别分类,从而大幅提高IPS细胞分类的效率。
附图说明
图1是本申请实施例的诱导多能干细胞识别方法的流程图;
图2是本申请实施例子细胞分割与追踪方法的流程图;
图3是本申请实施例的诱导多能干细胞识别系统的结构示意图;
图4是本申请实施例提供的诱导多能干细胞识别方法的硬件设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
基于现有技术存在的缺点,为了能在细胞诱导早期将干细胞识别并分类提取出来,本申请实施例的诱导多能干细胞识别方法采用阈值法及基于标记的分水岭算法实现图像中细胞的提取及黏连细胞较的分割,利用基于质心追踪的目标追踪算法对细胞的运动进行追踪,同时提取出相关细胞特征参数,并通过机器学习分类方法,将细胞特征参数作为特征参数进行训练测试,实现细胞的分类,大大缩短了干细胞的识别时间。
具体地,请参阅图1,是本申请实施例的诱导多能干细胞识别方法的流程图。本申请实施例的诱导多能干细胞识别方法包括以下步骤:
步骤100:获取显微镜延时序列图像,并利用影像倒溯的方法对显微镜延时序列图像中早期阶段被成功诱导为干细胞的前体细胞进行人工标注;
在步骤100中,本申请通过从奥林巴斯xcellence活细胞工作站获取显微镜延时序列图像,人工标注用于对后期的细胞分类器的分类结果进行验证。
步骤200:采用阈值法及基于标记的分水岭算法对显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
在步骤200中,请一并参阅图2,是本申请实施例子细胞分割与追踪方法的流程图。本申请实施例子细胞分割与追踪方法包括以下步骤:
步骤201:对显微镜延时序列图像中的颜色通道进行分离;
步骤202:利用高斯滤波对通道分离后的显微镜延时序列图像进行平滑降噪;
步骤203:利用阈值法将平滑降噪后的显微镜延时序列图像中的细胞及细胞核与背景区分开来,提取出细胞及细胞核区域;
步骤204:利用基于标记的分水岭算法,将提取的细胞及细胞核区域作为标记区域,根据标记区域对显微镜延时序列图像的形态梯度图进行形态学重建,对黏连细胞进行分割,并提取标记区域内细胞的面积、周长等静态特征参数;
在步骤204中,根据提取的标记区域对图像的形态梯度图进行形态学重建,避免了过分割,同时实现绝大部分黏连细胞的分割,最终分割结果与真实情况相符合。
步骤205:利用基于质心追踪的目标追踪算法,对同一个细胞在多个帧图像之间的运动轨迹进行追踪,并根据运动轨迹提取细胞的速度、位移等动态特征参数。
步骤300:对提取到的静态特征参数及动态特征参数进行特征提取与预处理,得到用于构建机器学习分类模型的样本数据集;
在步骤300中,特征提取及预处理的目的在于挑选出合适的特征子集,从而解决静态特征参数及动态特征参数中的冗余、残缺等问题。
步骤400:通过样本数据集中的静态特征参数、动态特征参数训练多个细胞分类器,通过多个细胞分类器分别输出细胞识别分类结果;
在步骤400中,细胞分类器包括但不限于SVM(Support Vector Machine,支持向量机)、K-NN((K-Nearest Neighbor,K最邻近结点算法)、Adaboost(一种迭代算法)等。
步骤500:通过人工标注对多个细胞分类器输出的细胞识别分类结果分别进行验证,根据验证结果对多个细胞分类器的性能进行评价,并选取性能最优的细胞分类器作为最终的机器学习分类模型;
步骤600:通过机器学习分类模型对待识别的干细胞与非干细胞进行识别分类;
在步骤600中,细胞分类模型对细胞进行识别分类的操作具体为:将待识别的细胞显微镜序列图像进行细胞分割与追踪,提取细胞的静态特征参数和动态特征参数,将提取到的静态特征参数和动态特征参数输入细胞分类模型,通过细胞分类模型输出最终的细胞识别分类结果。与现有技术中的等到干细胞可以表达相关荧光信号才可以识别相比,本申请在保证较好的分类效果的同时,能够大大缩短诱导多能干细胞的识别时间。
请参阅图3,是本申请实施例的诱导多能干细胞识别系统的结构示意图。本申请实施例的诱导多能干细胞识别系统包括数据获取模块、细胞分割与追踪模块、数据预处理模块、模型构建模块和模型评估模块。
数据获取模块:用于获取显微镜延时序列图像,并利用影像倒溯的方法对显微镜延时序列图像中早期阶段被成功诱导为干细胞的前体细胞进行人工标注;其中,本申请通过从奥林巴斯xcellence活细胞工作站获取显微镜延时序列图像,人工标注用于对后期的细胞分类器的分类结果进行验证。
细胞分割与追踪模块:用于采用阈值法及基于标记的分水岭算法对显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;具体地,细胞分割与追踪模块包括:
通道分离单元:用于对显微镜延时序列图像中的颜色通道进行分离;
滤波单元:用于利用高斯滤波对通道分离后的显微镜延时序列图像进行平滑降噪;
区域提取单元:用于利用阈值法将平滑降噪后的显微镜延时序列图像中的细胞及细胞核与背景区分开来,提取出细胞及细胞核区域;
细胞分割单元:用于利用基于标记的分水岭算法,将提取的细胞及细胞核区域作为标记区域,根据标记区域对显微镜延时序列图像的形态梯度图进行形态学重建,对黏连细胞进行分割,并提取标记区域内细胞的面积、周长等静态特征参数;其中,根据提取的标记区域对图像的形态梯度图进行形态学重建,避免了过分割,同时实现绝大部分黏连细胞的分割,最终分割结果与真实情况相符合。
细胞追踪单元:用于利用基于质心追踪的目标追踪算法,对同一个细胞在多个帧图像之间的运动轨迹进行追踪,并根据运动轨迹提取细胞的速度、位移等动态特征参数。
数据预处理模块:用于对提取到的静态特征参数及动态特征参数进行特征提取与预处理,得到用于构建机器学习分类模型的样本数据集;其中,特征提取及预处理的目的在于挑选出合适的特征子集,从而解决静态特征参数及动态特征参数中的冗余、残缺等问题。
模型构建模块:用于通过样本数据集中的静态特征参数、动态特征参数训练多个细胞分类器,通过多个细胞分类器分别输出细胞识别分类结果;其中,细胞分类器包括但不限于SVM(Support Vector Machine,支持向量机)、K-NN((K-Nearest Neighbor,K最邻近结点算法)、Adaboost(一种迭代算法)等。
模型评估模块:用于通过人工标注对多个细胞分类器输出的细胞识别分类结果分别进行验证,根据验证结果对多个细胞分类器的性能进行评价,并选取性能最优的细胞分类器作为最终的机器学习分类模型,通过该机器学习分类模型对待识别的干细胞与非干细胞进行识别分类;机器学习分类模型对细胞进行识别分类的操作具体为:将待识别的细胞显微镜序列图像进行细胞分割与追踪,提取细胞的静态特征参数和动态特征参数,将提取到的静态特征参数和动态特征参数输入细胞分类模型,通过细胞分类模型输出最终的细胞识别分类结果。与现有技术中的等到干细胞可以表达相关荧光信号才可以识别相比,本申请在保证较好的分类效果的同时,能够大大缩短诱导多能干细胞的识别时间。
图4是本申请实施例提供的诱导多能干细胞识别方法的硬件设备结构示意图。如图4所示,该设备包括一个或多个处理器以及存储器。以一个处理器为例,该设备还可以包括:输入系统和输出系统。
处理器、存储器、输入系统和输出系统可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述方法实施例的处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入系统可接收输入的数字或字符信息,以及产生信号输入。输出系统可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器中,当被所述一个或者多个处理器执行时,执行上述任一方法实施例的以下操作:
步骤a:步骤a:获取显微镜延时序列图像;
步骤b:对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
步骤c:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例提供的方法。
本申请实施例提供了一种非暂态(非易失性)计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行以下操作:
步骤a:步骤a:获取显微镜延时序列图像;
步骤b:对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
步骤c:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
本申请实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行以下操作:
步骤a:步骤a:获取显微镜延时序列图像;
步骤b:对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
步骤c:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
本申请实施例的诱导多能干细胞识别方法、系统及电子设备创新性地借助图像识别、机器学习等技术,实现对显微镜延时序列图像中IPS细胞的识别与追踪,同时获得与其相关联的静态特征参数以及动态特征参数,并对这些特征参数进行分析与处理,挑选出合适的特征子集,通过机器学习分类模型完成对IPS细胞的识别分类,从而大幅提高IPS细胞分类的效率。本申请可作为诱导多能干细胞机制研究的准备工作,在早期阶段就将干细胞筛选出来,使得生物医学研究人员能都对干细胞的整个诱导发育过程进行更加全面的研究分析,为研究IPS细胞建立全新的研究平台。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (11)

1.一种诱导多能干细胞识别方法,其特征在于,包括:
步骤a:获取显微镜延时序列图像;
步骤b:对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
步骤c:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
2.根据权利要求1所述的诱导多能干细胞识别方法,其特征在于,在所述步骤b中,所述对显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数具体包括:
步骤b1:对所述显微镜延时序列图像中的颜色通道进行分离;
步骤b2:利用高斯滤波对通道分离后的显微镜延时序列图像进行平滑降噪;
步骤b3:利用阈值法提取出平滑降噪后的显微镜延时序列图像中的细胞及细胞核区域;
步骤b4:利用基于标记的分水岭算法,将提取的细胞及细胞核区域作为标记区域,根据标记区域对黏连细胞进行分割,并提取标记区域内细胞的静态特征参数;
步骤b5:利用基于质心追踪的目标追踪算法,对同一个细胞在多个帧图像之间的运动轨迹进行追踪,并根据运动轨迹提取细胞的动态特征参数。
3.根据权利要求2所述的诱导多能干细胞识别方法,其特征在于,在所述步骤c中,所述根据细胞的静态特征参数以及动态特征参数构建机器学习分类模型还包括:对提取到的静态特征参数及动态特征参数进行特征提取与预处理,得到用于构建机器学习分类模型的样本数据集。
4.根据权利要求3所述的诱导多能干细胞识别方法,其特征在于,在所述步骤a中,所述获取显微镜延时序列图像还包括:利用影像倒溯的方法对所述显微镜延时序列图像中早期阶段被成功诱导为干细胞的前体细胞进行人工标注。
5.根据权利要求4所述的诱导多能干细胞识别方法,其特征在于,在所述步骤c中,所述根据细胞的静态特征参数以及动态特征参数构建机器学习分类模型还包括:通过所述样本数据集中的静态特征参数和动态特征参数训练至少两个细胞分类器,通过至少两个细胞分类器分别输出细胞识别分类结果;并通过所述人工标注对至少两个细胞分类器的性能进行评价,并选取性能最优的细胞分类器作为最终的机器学习分类模型。
6.一种诱导多能干细胞识别系统,其特征在于,包括:
数据获取模块:用于获取显微镜延时序列图像;
细胞分割与追踪模块:用于对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
模型构建模块:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
7.根据权利要求6所述的诱导多能干细胞识别系统,其特征在于,所述细胞分割与追踪模块包括:
通道分离单元:用于对所述显微镜延时序列图像中的颜色通道进行分离;
滤波单元:用于利用高斯滤波对通道分离后的显微镜延时序列图像进行平滑降噪;
区域提取单元:用于利用阈值法提取出平滑降噪后的显微镜延时序列图像中的细胞及细胞核区域;
细胞分割单元:用于利用基于标记的分水岭算法,将提取的细胞及细胞核区域作为标记区域,根据标记区域对黏连细胞进行分割,并提取标记区域内细胞的静态特征参数;
细胞追踪单元:用于利用基于质心追踪的目标追踪算法,对同一个细胞在多个帧图像之间的运动轨迹进行追踪,并根据运动轨迹提取细胞的动态特征参数。
8.根据权利要求7所述的诱导多能干细胞识别系统,其特征在于,还包括数据预处理模块,所述数据预处理模块用于对提取到的静态特征参数及动态特征参数进行特征提取与预处理,得到用于构建机器学习分类模型的样本数据集。
9.根据权利要求8所述的诱导多能干细胞识别系统,其特征在于,所述数据获取模块还用于利用影像倒溯的方法对所述显微镜延时序列图像中早期阶段被成功诱导为干细胞的前体细胞进行人工标注。
10.根据权利要求9所述的诱导多能干细胞识别系统,其特征在于,还包括模型评估模块,所述模型构建模块构建机器学习分类模型具体为:通过所述样本数据集中的静态特征参数和动态特征参数训练至少两个细胞分类器,通过至少两个细胞分类器分别输出细胞识别分类结果;所述模型评估模块用于通过所述人工标注对至少两个细胞分类器的性能进行评价,并选取性能最优的细胞分类器作为最终的机器学习分类模型。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述1至5任一项所述的诱导多能干细胞识别方法的以下操作:
步骤a:步骤a:获取显微镜延时序列图像;
步骤b:对所述显微镜延时序列图像中的细胞进行分割及运动轨迹追踪,并分别根据细胞分割结果及运动轨迹追踪结果提取出细胞的静态特征参数以及动态特征参数;
步骤c:根据所述细胞的静态特征参数以及动态特征参数构建机器学习分类模型,通过所述机器学习分类模型输出细胞识别分类结果。
CN201711126423.8A 2017-11-13 2017-11-13 一种诱导多能干细胞识别方法、系统及电子设备 Pending CN107944360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711126423.8A CN107944360A (zh) 2017-11-13 2017-11-13 一种诱导多能干细胞识别方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711126423.8A CN107944360A (zh) 2017-11-13 2017-11-13 一种诱导多能干细胞识别方法、系统及电子设备

Publications (1)

Publication Number Publication Date
CN107944360A true CN107944360A (zh) 2018-04-20

Family

ID=61932200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711126423.8A Pending CN107944360A (zh) 2017-11-13 2017-11-13 一种诱导多能干细胞识别方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN107944360A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064477A (zh) * 2018-07-06 2018-12-21 陕西师范大学 用改进的U-Net检测细胞核边缘的方法
CN109584861A (zh) * 2018-12-03 2019-04-05 江苏师范大学 基于深度学习的阿尔茨海默症语音信号的筛查方法
CN111553206A (zh) * 2020-04-14 2020-08-18 中国科学院深圳先进技术研究院 一种基于机器学习的细胞识别方法及装置
CN111925934A (zh) * 2020-07-31 2020-11-13 深圳先进技术研究院 一种生物样本分选方法、声表面波微流控芯片、系统、终端以及存储介质
CN112183210A (zh) * 2020-08-28 2021-01-05 江苏康尚生物医疗科技有限公司 一种基于稀疏矩阵的粒子自动聚焦方法、系统及存储介质
CN112634243A (zh) * 2020-12-28 2021-04-09 吉林大学 一种强干扰因素下基于深度学习的图像分类识别系统
CN113607628A (zh) * 2021-09-02 2021-11-05 清华大学 神经形态计算驱动图像流式细胞仪对细胞图像流处理方法
WO2022021338A1 (zh) * 2020-07-31 2022-02-03 深圳先进技术研究院 一种生物样本分选方法、声表面波微流控芯片、系统、终端以及存储介质
WO2023019559A1 (zh) * 2021-08-20 2023-02-23 深圳先进技术研究院 一种自动化干细胞检测方法、系统、终端以及存储介质
CN116778483A (zh) * 2023-08-25 2023-09-19 泰州骆华生物科技有限公司 一种基于反射共聚焦显微镜技术的细胞死亡类型识别方法
US11989960B2 (en) 2019-02-20 2024-05-21 Bluerock Therapeutics Lp Detecting cells of interest in large image datasets using artificial intelligence

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559724A (zh) * 2013-10-31 2014-02-05 苏州相城常理工技术转移中心有限公司 一种高粘连度细胞环境下的多细胞同步跟踪方法
CN105095865A (zh) * 2015-07-17 2015-11-25 广西师范大学 基于有向加权复杂网络的宫颈细胞识别方法及宫颈细胞识别装置
CN106022250A (zh) * 2016-05-17 2016-10-12 华中科技大学 一种基于细胞运动信息和灰度特性的胚胎分裂检测方法
CN106846296A (zh) * 2016-12-19 2017-06-13 深圳大学 一种细胞图像跟踪智能算法
US20170193175A1 (en) * 2015-12-30 2017-07-06 Case Western Reserve University Prediction of recurrence of non-small cell lung cancer

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559724A (zh) * 2013-10-31 2014-02-05 苏州相城常理工技术转移中心有限公司 一种高粘连度细胞环境下的多细胞同步跟踪方法
CN105095865A (zh) * 2015-07-17 2015-11-25 广西师范大学 基于有向加权复杂网络的宫颈细胞识别方法及宫颈细胞识别装置
US20170193175A1 (en) * 2015-12-30 2017-07-06 Case Western Reserve University Prediction of recurrence of non-small cell lung cancer
CN106022250A (zh) * 2016-05-17 2016-10-12 华中科技大学 一种基于细胞运动信息和灰度特性的胚胎分裂检测方法
CN106846296A (zh) * 2016-12-19 2017-06-13 深圳大学 一种细胞图像跟踪智能算法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
XINGHUA LOU等: "Structured Learning for Cell Tracking", 《25TH ANNUAL CONFERENCE ON ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》 *
候宏花: "《数字图像处理与分析》", 30 September 2011, 北京理工大学出版社 *
漆树鹏: "基于机器视觉的显微细胞图像有形成分自动识别研究", 《中国中国优秀硕士学位论文全文数据库》 *
赵中祥: "显微视频细胞分割与跟踪方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064477A (zh) * 2018-07-06 2018-12-21 陕西师范大学 用改进的U-Net检测细胞核边缘的方法
CN109584861A (zh) * 2018-12-03 2019-04-05 江苏师范大学 基于深度学习的阿尔茨海默症语音信号的筛查方法
US11989960B2 (en) 2019-02-20 2024-05-21 Bluerock Therapeutics Lp Detecting cells of interest in large image datasets using artificial intelligence
CN111553206A (zh) * 2020-04-14 2020-08-18 中国科学院深圳先进技术研究院 一种基于机器学习的细胞识别方法及装置
CN111553206B (zh) * 2020-04-14 2021-08-24 中国科学院深圳先进技术研究院 一种基于机器学习的细胞识别方法及装置
WO2021208491A1 (zh) * 2020-04-14 2021-10-21 中国科学院深圳先进技术研究院 一种基于机器学习的细胞识别方法及装置
CN111925934A (zh) * 2020-07-31 2020-11-13 深圳先进技术研究院 一种生物样本分选方法、声表面波微流控芯片、系统、终端以及存储介质
WO2022021338A1 (zh) * 2020-07-31 2022-02-03 深圳先进技术研究院 一种生物样本分选方法、声表面波微流控芯片、系统、终端以及存储介质
CN112183210A (zh) * 2020-08-28 2021-01-05 江苏康尚生物医疗科技有限公司 一种基于稀疏矩阵的粒子自动聚焦方法、系统及存储介质
CN112183210B (zh) * 2020-08-28 2024-06-14 江苏康尚生物医疗科技有限公司 一种基于稀疏矩阵的粒子自动聚焦方法、系统及存储介质
CN112634243A (zh) * 2020-12-28 2021-04-09 吉林大学 一种强干扰因素下基于深度学习的图像分类识别系统
CN112634243B (zh) * 2020-12-28 2022-08-05 吉林大学 一种强干扰因素下基于深度学习的图像分类识别系统
WO2023019559A1 (zh) * 2021-08-20 2023-02-23 深圳先进技术研究院 一种自动化干细胞检测方法、系统、终端以及存储介质
CN113607628B (zh) * 2021-09-02 2023-02-10 清华大学 神经形态计算驱动图像流式细胞仪对细胞图像流处理方法
CN113607628A (zh) * 2021-09-02 2021-11-05 清华大学 神经形态计算驱动图像流式细胞仪对细胞图像流处理方法
CN116778483A (zh) * 2023-08-25 2023-09-19 泰州骆华生物科技有限公司 一种基于反射共聚焦显微镜技术的细胞死亡类型识别方法
CN116778483B (zh) * 2023-08-25 2023-10-31 泰州骆华生物科技有限公司 一种基于反射共聚焦显微镜技术的细胞死亡类型识别方法

Similar Documents

Publication Publication Date Title
CN107944360A (zh) 一种诱导多能干细胞识别方法、系统及电子设备
Zhang et al. Deep learning-based object detection improvement for tomato disease
Li et al. Contour knowledge transfer for salient object detection
Chi et al. Dual deep network for visual tracking
Andrea et al. Precise weed and maize classification through convolutional neuronal networks
Cai et al. Iterative attention mining for weakly supervised thoracic disease pattern localization in chest x-rays
Juneja et al. Real time object detection using CNN based single shot detector model
Pan et al. Cell detection in pathology and microscopy images with multi-scale fully convolutional neural networks
Silva-Rodriguez et al. Self-learning for weakly supervised gleason grading of local patterns
Weng et al. Early action recognition with category exclusion using policy-based reinforcement learning
Bhardwaj et al. Diabetic retinopathy severity grading employing quadrant‐based Inception‐V3 convolution neural network architecture
Wang et al. Morphological analysis of dendrites and spines by hybridization of ridge detection with twin support vector machine
Cheng et al. Self-similarity student for partial label histopathology image segmentation
Sert A deep learning based approach for the detection of diseases in pepper and potato leaves
Jin et al. Cvt-assd: convolutional vision-transformer based attentive single shot multibox detector
Li et al. Graph diffusion convolutional network for skeleton based semantic recognition of two-person actions
Deotale et al. HARTIV: Human Activity Recognition Using Temporal Information in Videos.
Zhao et al. Pulmonary nodule detection based on multiscale feature fusion
Struski et al. ProMIL: Probabilistic multiple instance learning for medical imaging
Fujii et al. Cell detection from imperfect annotation by pseudo label selection using P-classification
Pan et al. A review of machine learning approaches, challenges and prospects for computational tumor pathology
Yang et al. Leveraging auxiliary information from EMR for weakly supervised pulmonary nodule detection
Tasci Pre-processing effects of the tuberculosis chest x-ray images on pre-trained cnns: an investigation
Mercaldo et al. Blood cells counting and localisation through deep learning object detection
Chen et al. Tea Bud Detection and 3D Pose Estimation in the Field with a Depth Camera Based on Improved YOLOv5 and the Optimal Pose-Vertices Search Method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180420

RJ01 Rejection of invention patent application after publication