CN115063794B - 一种秀丽隐杆线虫全身细胞自动识别的方法 - Google Patents
一种秀丽隐杆线虫全身细胞自动识别的方法 Download PDFInfo
- Publication number
- CN115063794B CN115063794B CN202210677321.XA CN202210677321A CN115063794B CN 115063794 B CN115063794 B CN 115063794B CN 202210677321 A CN202210677321 A CN 202210677321A CN 115063794 B CN115063794 B CN 115063794B
- Authority
- CN
- China
- Prior art keywords
- cell
- asp
- map
- cells
- obtaining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 241000244203 Caenorhabditis elegans Species 0.000 title claims abstract description 31
- 241000244206 Nematoda Species 0.000 claims abstract description 34
- 238000002372 labelling Methods 0.000 claims abstract description 11
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 230000011218 segmentation Effects 0.000 claims abstract description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 21
- 230000009466 transformation Effects 0.000 claims description 19
- 230000009885 systemic effect Effects 0.000 claims description 15
- 238000009826 distribution Methods 0.000 claims description 10
- 238000000513 principal component analysis Methods 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000000137 annealing Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000011524 similarity measure Methods 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 description 85
- 230000006870 function Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 208000003098 Ganglion Cysts Diseases 0.000 description 1
- 208000005400 Synovial Cyst Diseases 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 230000005859 cell recognition Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002610 neuroimaging Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/693—Acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/695—Preprocessing, e.g. image segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Image Processing (AREA)
Abstract
本发明提出了一种秀丽隐杆线虫全身细胞自动识别的方法,通过基于秀丽隐杆线虫数据集构建包含细胞位置信息和拓扑结构信息的统计学图谱;其中,图谱包含平均空间位置ASP、空间位置方差SLV、拓扑结构方差TSV;获得细胞中心位置,通过人工标注或者自动分割细胞获得测试样本线虫中细胞质心位置;基于点集配准获得细胞位置和图谱的初始匹配关系;并基于统计图谱迭代优化细胞位置与图谱的匹配关系;基于图谱中已知的细胞身份通过匹配关系自动识别细胞。通过构件秀丽隐杆线虫全身细胞统计学图谱,基于包含细胞位置和拓扑结构等多种先验信息的统计学图谱实现了线虫全身细胞的自动识别。
Description
技术领域
本发明涉及3D生物医学图像处理领域,具体来说是一种秀丽隐杆线虫全身细胞自动识别的方法。
背景技术
在包括神经科学和发育生物学在内的广泛的生物学领域中,细胞的鉴定是一个必不可少的数据分析步骤,如基因表达模式分析、系谱追踪、多细胞钙成像和全脑成像。这对于跨动物、试验和实验条件的细胞分辨率的数据比较是必要的。特别是在全脑功能成像中,对群体活动的有意义的解释关键取决于细胞的身份,因为它们有助于纳入有关系统的现有知识。应用常见的统计数据分析方法,如主成分分析、张量成分分析、去混合主成分分析等,也需要细胞身份,因为在应用这些方法之前,需要通过细胞身份进行索引和汇集。
线虫由于其独特的特性,所有细胞及其谱系都已被鉴定,是许多发育生物学研究的理想生物。然而,对其细胞的识别仍然是一个重要的瓶颈。尽管L1秀丽隐杆线虫整体的细胞位置具有刻板的特性,但细胞的密集分布和其空间排列的变化足以使细胞识别成为挑战。而且,这种刻板的特性不能扩展到神经节细胞。现有算法要么只能识别全身中部分的细胞要么需要额外的荧光标记。而构建转基因动物的成本和荧光颜色通道的限制,直接在无标记的单通道显微图像上自动识别线虫全身细胞更受人们青睐。
因此针对高度密集且空间分布多样性的秀丽隐杆线虫全身细胞,提供出一种秀丽隐杆线虫全身细胞自动识别的方法已经成为了急需解决的技术问题。
发明内容
有鉴于此,本发明实施例的目的在于解决高度密集且空间分布多样性的秀丽隐杆线虫全身细胞的识别问题,提供了一种秀丽隐杆线虫全身细胞自动识别的方法来解决上述问题。
本发明的第一方面提供了一种秀丽隐杆线虫全身细胞自动识别的方法,所述方法包括:
S1,基于秀丽隐杆线虫数据集构建包含细胞位置信息和拓扑结构信息的统计学图谱;其中,图谱包含平均空间位置ASP、空间位置方差SLV、拓扑结构方差TSV;
S2,获得细胞中心位置,通过人工标注或者自动分割细胞获得测试样本线虫中细胞质心位置;
S3,基于点集配准获得细胞位置和图谱的初始匹配关系;并基于统计图谱迭代优化细胞位置与图谱的匹配关系;
S4,基于图谱中已知的细胞身份通过匹配关系自动识别细胞。
进一步,所述S1还包括:ASP的生成方法、SLV的生成方法、以及TSV的生成方法;
其中,ASP的生成方法,包括:
S101,选择一个任意的线虫细胞位置作为初始ASP,其余的线虫细胞使用三维仿射变换全局地与初始ASP对齐,然后平均在一起,得到新的ASP;
S102,计算所有样本的平均形变场,使用平均形变场的逆形变场对S101中创建的新的ASP进行形变;
S103,回到步骤S101,用步骤S102中形变后的ASP替换初始ASP。继续迭代,直到ASP收敛到稳定状态;
S104,使用分段仿射变换将每个线虫的细胞映射到ASP上,并对结果进行平均,生成最终的ASP;
所述SLV的生成方法,包括:在ASP的制作方法中步骤S104中分段仿射结果上,计算每个细胞位置沿X、Y和Z方向的标准偏差作为SLV;
所述TSV的生成方法,包括:分别获得在ASP的制作方法中步骤S104中分段仿射结果以及ASP上的每个细胞的形状上下文特征,然后计算ASP中细胞相应位置的形状上下文特征的标准偏差,作为TSV。
进一步,所述基于点集配准获得细胞位置和图谱的初始匹配关系,包括:
S301,使用主成分分析法(PCA)提取样本点集和图谱ASP的三个主轴,对样本点集进行刚性变换;
S302,基于确定性退火框架的鲁棒性点集匹配算法(RPM)获得样本点集和ASP的初始匹配关系,并且在RPM的概率密度函数中融合了细胞位置的拓扑结构特征。融合了拓扑结构特征的密度函数定义如下:
其中,所述sn和vm分别表示样本点集中的第n个点和图谱ASP中第m个点,α和β表示权重参数,Δd和Δs分别表示空间位置和形状上下文特征的相似性度量。
进一步,基于统计图谱迭代优化细胞位置与图谱的匹配关系,包括:
S311,通过所述初始匹配关对样本点集进行全局仿射变换,之后再进行分段仿射变换更新样本点集的空间位置;
S312,通过各向异性高斯分布来模拟样本线虫中每个细胞与图谱中所有细胞的匹配分数;对所得到的匹配得分矩阵通过二分图匹配算法获得新的匹配关系;分别定义基于TSV和SLV的各向异性高斯分布的第n个点和第m个点的匹配得分为:
其中,和/>分别表示统计图谱中SLV中第m个点在x、y和z方向上的方差,γm表示统计图谱中TSV的第m个点的方差,ω为常数参数。g(.)是形状上下文特征的卡方矩阵,用于计算点sn和vm的形状上下文特征的差异;
S313,返回到S311,使用新的匹配关系进行全局仿射变换;循环迭代,直至匹配关系达到一个稳定的状态。
进一步,步骤S4包括:
获取优化后的细胞位置与图谱的匹配关系,通过优化后的细胞位置与图谱的匹配关系给每个位置的细胞匹配一个图谱中已知细胞的身份。
进一步,步骤S1之前,还包括执行图像的收集、挑选和标注,形成数据集:线虫图像的搜集,通过人工标注获得细胞中心点的位置;
所述S1包括抽取数据集中的一部分来构建包含细胞位置信息和拓扑结构信息的统计学图谱。
此外,本发明第二方面还提供一种存储介质,所述存储介质存储有计算机程序;所述程序由处理器加载并执行以实现如上所述的秀丽隐杆线虫全身细胞自动识别的方法步骤。
本发明的方案中,针对高度密集且空间分布多样性的秀丽隐杆线虫全身细胞,提供了一种秀丽隐杆线虫全身细胞自动识别的方法。由于线虫固有的生物变异性,线虫中细胞的空间分布与图谱中细胞的位置有很大不同,而拓扑结构仍然保持相似。本发明在识别中融合了线虫细胞的位置和拓扑结构等多种先验统计信息,在单通道的三维线虫显微图像上不仅有效的识别了神经元等密集细胞的身份,而且实现了L1阶段线虫全身细胞的识别。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例公开的秀丽隐杆线虫全身细胞自动识别的方法的流程示意图;
图2是本发明实施例公开的包含ASP、SLV、TSV的统计图谱;
图3是本发明实施例公开的秀丽隐杆线虫识别的主要6个步骤以及对应的效果图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
需要说明的是:在本文中提及的“多个”是指两个或两个以上。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
请参阅图1,图1是本发明实施例公开的一种秀丽隐杆线虫全身细胞自动识别的方法的流程示意图。如图1所示,本发明实施例的一种秀丽隐杆线虫全身细胞自动识别的方法,包括:
S1,基于秀丽隐杆线虫数据集构建包含细胞位置信息和拓扑结构信息的统计学图谱;其中,图谱包含平均空间位置ASP、空间位置方差SLV、拓扑结构方差TSV;
需要说明的是,本实施例,步骤S1之前,还包括执行图像的收集、挑选和标注,形成数据集:线虫图像的搜集,通过人工标注获得细胞中心点的位置;其具体步骤如下:(1)挑选580张秀丽隐杆线虫无标记三维显微图像作为数据集;(2)通过标注软件标注出每条线虫上558个线虫细胞的中心位置。
所述S1包括抽取数据集中的一部分,构建包含细胞位置信息和拓扑结构信息的统计学图谱;抽取数据集中的一部分进行统计图谱的制作,图谱包含平均空间位置ASP、空间位置方差SLV、拓扑结构方差TSV。
本实施例,从580条线虫中选择464条线虫制作统计学图谱。
进一步,所述S1还包括:ASP的生成方法、SLV的生成方法、以及TSV的生成方法;
其中,ASP的生成方法,包括:
S101,选择一个任意的线虫细胞位置作为初始ASP,其余的线虫细胞使用三维仿射变换全局地与初始ASP对齐,然后平均在一起,得到新的ASP;具体地,本实施例,通过选择464条线虫中任意一条线虫的细胞位置作为初始ASP。
S102,计算所有样本的平均形变场,使用平均形变场的逆形变场对S101中创建的新的ASP进行形变;
S103,回到步骤S101,用步骤S102中形变后的ASP替换初始ASP。继续迭代,直到ASP收敛到稳定状态;
S104,使用分段仿射变换将每个线虫的细胞映射到ASP上,并对结果进行平均,生成最终的ASP;
所述SLV的生成方法,包括:在ASP的制作方法中步骤S104中分段仿射结果上,计算每个细胞位置沿X、Y和Z方向的标准偏差作为SLV;
所述TSV的生成方法,包括:分别获得在ASP的制作方法中步骤S104中分段仿射结果以及ASP上的每个细胞的形状上下文特征,然后计算ASP中细胞相应位置的形状上下文特征的标准偏差,作为TSV。
如图2所示,为本实施例包含ASP、SLV、TSV的统计图谱。从图中可以看出细胞分布密集,而且细胞空间位置分布的多样性。
S2,获得细胞中心位置,通过人工标注或者自动分割细胞获得测试样本线虫中细胞质心位置;
具体地,本实施例,对于580个线虫中剩余的116条线虫进行识别,首先获得细胞中心点位置,可以通过现有开源的细胞分割方法分割细胞再求取细胞质心获得细胞位置,也可以通过人工标注获得细胞中心位置,所提供的细胞位置越准确越有利于后期的细胞识别。
S3,基于点集配准获得细胞位置和图谱的初始匹配关系;并基于统计图谱迭代优化细胞位置与图谱的匹配关系;
具体地,本实施例,进一步,所述基于点集配准获得细胞位置和图谱的初始匹配关系,包括:
S301,使用主成分分析法(PCA)提取样本点集和图谱ASP的三个主轴,对样本点集进行刚性变换;
S302,基于确定性退火框架的鲁棒性点集匹配算法(RPM)获得样本点集和ASP的初始匹配关系,并且在RPM的概率密度函数中融合了细胞位置的拓扑结构特征。融合了拓扑结构特征的密度函数定义如下:
其中,所述sn和vm分别表示样本点集中的第n个点和图谱ASP中第m个点,α和β表示权重参数,Δd和Δs分别表示空间位置和形状上下文特征的相似性度量。
进一步,基于统计图谱迭代优化细胞位置与图谱的匹配关系,包括:
S311,通过所述初始匹配关系对样本点集进行全局仿射变换,之后再进行分段仿射变换更新样本点集的空间位置;
S312,通过各向异性高斯分布来模拟样本线虫中每个细胞与图谱中所有细胞的匹配分数;对所得到的匹配得分矩阵通过二分图匹配算法获得新的匹配关系;分别定义基于TSV和SLV的各向异性高斯分布的第n个点和第m个点的匹配得分为:
其中,和/>分别表示统计图谱中SLV中第m个点在x、y和z方向上的方差,γm表示统计图谱中TSV的第m个点的方差,ω为常数参数。g(.)是形状上下文特征的卡方矩阵,用于计算点sn和vm的形状上下文特征的差异;
S313,返回到S311,使用新的匹配关系进行全局仿射变换;循环迭代,直至匹配关系达到一个稳定的状态。
S4,基于图谱中已知的细胞身份通过匹配关系自动识别细胞。
进一步,步骤S4包括:
获取优化后的细胞位置与图谱的匹配关系,通过优化后的细胞位置与图谱的匹配关系给每个位置的细胞匹配一个图谱中已知细胞的身份。如图3所示为本实施例秀丽隐杆线虫识别的主要6个步骤以及对应的效果图。①,首先通过先提取已分割的细胞的质心;②经过PCA的刚性变换,获得测试图片的细胞质心点集;③基于融合拓扑结构特征的RPM进行匹配;得到初始匹配关系;进一步,步骤④+⑤,进一步执行对应关系的优化;⑥,循环迭代,直至匹配关系达到一个稳定的状态。从图3中可以看出基于统计图谱进行匹配关系的优化后,匹配度得到明显提高。
此外,本实施例第二方面还提供一种存储介质,所述存储介质存储有计算机程序;所述程序由处理器加载并执行以实现如上所述的秀丽隐杆线虫全身细胞自动识别的方法步骤。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网格设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种秀丽隐杆线虫全身细胞自动识别的方法,其特征在于,所述方法包括:
S1,基于秀丽隐杆线虫数据集构建包含细胞位置信息和拓扑结构信息的统计学图谱;其中,图谱包含平均空间位置ASP、空间位置方差SLV、拓扑结构方差TSV;
所述S1还包括:ASP的生成方法、SLV的生成方法以及TSV的生成方法;
其中,ASP的生成方法,包括:
S101,选择一个任意的线虫细胞位置作为初始ASP,其余的线虫细胞使用三维仿射变换全局地与初始ASP对齐,然后平均在一起,得到新的ASP;
S102,计算所有样本的平均形变场,使用平均形变场的逆形变场对S101中创建的新的ASP进行形变;
S103,回到步骤S101,用步骤S102中形变后的ASP替换初始ASP,继续迭代,直到ASP收敛到稳定状态;
S104,使用分段仿射变换将每个线虫的细胞映射到ASP上,并对结果进行平均,生成最终的ASP;
所述SLV的生成方法,包括:在ASP的制作方法中步骤S104中分段仿射结果上,计算每个细胞位置沿X、Y和Z方向的标准偏差作为SLV;
所述TSV的生成方法,包括:分别获得在ASP的制作方法中步骤S104中分段仿射结果以及ASP上的每个细胞的形状上下文特征,然后计算ASP中细胞相应位置的形状上下文特征的标准偏差,作为TSV;
S2,获得细胞中心位置,通过人工标注或者自动分割细胞获得测试样本线虫中细胞质心位置;
S3,基于点集配准获得细胞位置和图谱的初始匹配关系;并基于统计图谱迭代优化细胞位置与图谱的匹配关系;
S4,基于图谱中已知的细胞身份通过匹配关系自动识别细胞。
2.根据权利要求1所述的秀丽隐杆线虫全身细胞自动识别的方法,其特征在于,所述基于点集配准获得细胞位置和图谱的初始匹配关系,包括:
S201,使用主成分分析法(PCA)提取样本点集和图谱ASP的三个主轴,对样本点集进行刚性变换;
S202,基于确定性退火框架的鲁棒性点集匹配算法(RPM)获得样本点集和ASP的初始匹配关系,并且在RPM的概率密度函数中融合了细胞位置的拓扑结构特征,融合了拓扑结构特征的密度函数定义如下:
其中,所述sn和vm分别表示样本点集中的第n个点和图谱ASP中第m个点,α和β表示权重参数,Δd和Δs分别表示空间位置和形状上下文特征的相似性度量。
3.根据权利要求2所述的秀丽隐杆线虫全身细胞自动识别的方法,其特征在于,基于统计图谱迭代优化细胞位置与图谱的匹配关系,包括:
S311,通过所述初始匹配关系对样本点集进行全局仿射变换,之后再进行分段仿射变换更新样本点集的空间位置;
S312,通过各向异性高斯分布来模拟样本线虫中每个细胞与图谱中所有细胞的匹配分数;对所得到的匹配得分矩阵通过二分图匹配算法获得新的匹配关系;分别定义基于TSV和SLV的各向异性高斯分布的第n个点和第m个点的匹配得分为:
其中,和/>分别表示统计图谱中SLV中第m个点在x、y和z方向上的方差,γm表示统计图谱中TSV的第m个点的方差,ω为常数参数,g(.)是形状上下文特征的卡方矩阵,用于计算点sn和vm的形状上下文特征的差异;
S313,返回到S311,使用新的匹配关系进行全局仿射变换;循环迭代,直至匹配关系达到一个稳定的状态。
4.根据权利要求3所述的秀丽隐杆线虫全身细胞自动识别的方法,其特征在于,步骤S4包括:
获取优化后的细胞位置与图谱的匹配关系,通过优化后的细胞位置与图谱的匹配关系给每个位置的细胞匹配一个图谱中已知细胞的身份。
5.根据权利要求4所述的秀丽隐杆线虫全身细胞自动识别的方法,其特征在于,步骤S1之前,还包括执行图像的收集、挑选和标注,形成数据集:线虫图像的搜集,通过人工标注获得细胞中心点的位置;
所述S1包括抽取数据集中的一部分来构建包含细胞位置信息和拓扑结构信息的统计学图谱。
6.一种存储介质,所述存储介质存储有计算机程序;其特征在于,所述程序由处理器加载并执行以实现如权利要求1-5任一项所述的秀丽隐杆线虫全身细胞自动识别的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210677321.XA CN115063794B (zh) | 2022-06-15 | 2022-06-15 | 一种秀丽隐杆线虫全身细胞自动识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210677321.XA CN115063794B (zh) | 2022-06-15 | 2022-06-15 | 一种秀丽隐杆线虫全身细胞自动识别的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115063794A CN115063794A (zh) | 2022-09-16 |
CN115063794B true CN115063794B (zh) | 2024-03-08 |
Family
ID=83200264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210677321.XA Active CN115063794B (zh) | 2022-06-15 | 2022-06-15 | 一种秀丽隐杆线虫全身细胞自动识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115063794B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115984341B (zh) * | 2023-03-20 | 2023-05-23 | 深圳市朗诚科技股份有限公司 | 海洋水质微生物检测方法、装置、设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914099A (zh) * | 2020-07-24 | 2020-11-10 | 吉林大学珠海学院 | 一种交通优化策略的智能问答方法、系统、装置及介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8861891B2 (en) * | 2010-03-05 | 2014-10-14 | Siemens Aktiengesellschaft | Hierarchical atlas-based segmentation |
-
2022
- 2022-06-15 CN CN202210677321.XA patent/CN115063794B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914099A (zh) * | 2020-07-24 | 2020-11-10 | 吉林大学珠海学院 | 一种交通优化策略的智能问答方法、系统、装置及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115063794A (zh) | 2022-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Long et al. | A 3D digital atlas of C. elegans and its application to single-cell analyses | |
Peng et al. | Image‐derived, three‐dimensional generative models of cellular organization | |
Shariff et al. | A generative model of microtubule distributions, and indirect estimation of its parameters from fluorescence microscopy images | |
CN108229347B (zh) | 用于人识别的拟吉布斯结构采样的深层置换的方法和装置 | |
Buck et al. | Toward the virtual cell: automated approaches to building models of subcellular organization “learned” from microscopy images | |
CN112328715B (zh) | 视觉定位方法及相关模型的训练方法及相关装置、设备 | |
Murphy | CellOrganizer: image-derived models of subcellular organization and protein distribution | |
Liu et al. | Automated tracking of stem cell lineages of arabidopsis shoot apex using local graph matching | |
Megjhani et al. | Population-scale three-dimensional reconstruction and quantitative profiling of microglia arbors | |
Qu et al. | Simultaneous recognition and segmentation of cells: application in C. elegans | |
CN110188825B (zh) | 基于离散多视图聚类的图像聚类方法、系统、设备及介质 | |
CN115063794B (zh) | 一种秀丽隐杆线虫全身细胞自动识别的方法 | |
JP7336806B2 (ja) | 細胞および細胞内の形態モデリングと分類のための、細胞および組織の3次元画像解析 | |
CN109685830B (zh) | 目标跟踪方法、装置和设备及计算机存储介质 | |
Li et al. | Protein subcellular location pattern classification in cellular images using latent discriminative models | |
Amato et al. | A multi-step approach to time series analysis and gene expression clustering | |
CN112488148A (zh) | 基于变分自编码器的聚类方法和装置 | |
Biot et al. | Strategy and software for the statistical spatial analysis of 3D intracellular distributions | |
Jagalur et al. | Analyzing in situ gene expression in the mouse brain with image registration, feature extraction and block clustering | |
CN113705674B (zh) | 一种非负矩阵分解聚类方法、装置及可读存储介质 | |
Preibisch et al. | Image-based representation of massive spatial transcriptomics datasets | |
CN116051959A (zh) | 一种目标检测方法、装置 | |
CN113177602B (zh) | 图像分类方法、装置、电子设备和存储介质 | |
Zhen et al. | A novel framework for single-cell hi-c clustering based on graph-convolution-based imputation and two-phase-based feature extraction | |
Dalton | Optimal Bayesian feature selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |