CN116823761A - 基于细胞分割的信息处理方法、装置、设备及存储介质 - Google Patents
基于细胞分割的信息处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116823761A CN116823761A CN202310752008.2A CN202310752008A CN116823761A CN 116823761 A CN116823761 A CN 116823761A CN 202310752008 A CN202310752008 A CN 202310752008A CN 116823761 A CN116823761 A CN 116823761A
- Authority
- CN
- China
- Prior art keywords
- cell
- image
- microsphere
- segmentation result
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 176
- 230000010365 information processing Effects 0.000 title claims abstract description 40
- 238000003672 processing method Methods 0.000 title claims abstract description 34
- 239000004005 microsphere Substances 0.000 claims abstract description 92
- 238000000018 DNA microarray Methods 0.000 claims abstract description 39
- 238000000034 method Methods 0.000 claims abstract description 15
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 210000004027 cell Anatomy 0.000 claims description 303
- 210000003855 cell nucleus Anatomy 0.000 claims description 59
- 210000001519 tissue Anatomy 0.000 claims description 27
- 230000032823 cell division Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 12
- 230000014509 gene expression Effects 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000000265 homogenisation Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 230000007797 corrosion Effects 0.000 claims description 4
- 238000005260 corrosion Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 210000004940 nucleus Anatomy 0.000 description 3
- 210000001550 testis Anatomy 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 230000003628 erosive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20152—Watershed segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30024—Cell structures in vitro; Tissue sections in vitro
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Quality & Reliability (AREA)
- Radiology & Medical Imaging (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种基于细胞分割的信息处理方法、装置、设备及存储介质,涉及生物信息技术领域,该方法包括:获取矫正后的扫描图像;扫描图像是基于贴附于生物芯片上的组织切片得到的;对扫描图像进行细胞分割,得到细胞分割结果;基于生物芯片中各条形码微球的固有位置,提取细胞分割结果中的每个细胞所对应的条形码微球的位置信息;基于细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各细胞的第一位置信息和相应的条形码微球的统计信息。本发明可以提升细胞分析的效率和准确性。
Description
技术领域
本发明涉及生物信息技术领域,尤其涉及一种基于细胞分割的信息处理方法、装置、设备及存储介质。
背景技术
随着计算机视觉和机器学习技术的发展,越来越多的自动化细胞分割方法被提出和应用。这些方法主要包括:边缘检测、阈值分割、形态学运算、区域生长、图像分割和深度学习等方法。
然而,现有技术在进行细胞分割之后没有将细胞分割结果和包含条形码微球的生物芯片进行结合,导致不能获得各细胞的准确位置信息和相应的条形码微球的统计信息,从而导致细胞分析的效率和准确性较低。
发明内容
本发明提供一种基于细胞分割的信息处理方法、装置、设备及存储介质,用以解决现有技术中细胞分析的效率和准确性较低的缺陷。
本发明提供一种基于细胞分割的信息处理方法,包括:
获取矫正后的扫描图像;所述扫描图像是基于贴附于生物芯片上的组织切片得到的;
对所述扫描图像进行细胞分割,得到细胞分割结果;
基于所述生物芯片中各条形码微球的固有位置,提取所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
基于所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各所述细胞的第一位置信息和相应的条形码微球的统计信息。
根据本发明提供的一种基于细胞分割的信息处理方法,所述细胞分割结果包括细胞核边界分割结果和细胞边界分割结果;所述对所述扫描图像进行细胞分割,得到细胞分割结果,包括:
将所述扫描图像拆分为多个子图;
针对每个所述子图,对所述子图进行预处理,得到目标子图;
获取与所述组织切片的细胞类型匹配的预训练模型,并采用所述预训练模型对所述目标子图进行细胞核边界分割结果预测,得到所述目标子图中各细胞核的所述细胞核边界分割结果;
合并各所述目标子图,得到目标图像;
合并各所述目标子图中各细胞核的所述细胞核边界分割结果,得到所述目标图像中各细胞核的所述细胞核边界分割结果;
对所述目标图像中各细胞核的所述细胞核边界分割结果进行外扩处理,生成所述目标图像中各细胞的所述细胞边界分割结果。
根据本发明提供的一种基于细胞分割的信息处理方法,所述将所述扫描图像拆分为多个子图,包括:
采用自定义滑动窗口将所述扫描图像拆分为多个初始子图;
对所述多个初始子图进行边缘分界线微调,得到所述多个子图。
根据本发明提供的一种基于细胞分割的信息处理方法,所述针对每个所述子图,对所述子图进行预处理,得到目标子图,包括:
针对每个所述子图,对所述子图进行包括均衡化、尺寸调整、彩色空间转换、腐蚀、膨胀以及像素值均一化的预处理,得到所述目标子图。
根据本发明提供的一种基于细胞分割的信息处理方法,所述对所述目标图像中各细胞核的所述细胞核边界分割结果进行外扩处理,生成所述目标图像中各细胞的所述细胞边界分割结果,包括:
基于所述目标图像中各细胞核的所述细胞核边界分割结果,生成二值化图像;
通过距离变换计算所述二值化图像的距离图;所述距离图用于表征每个像素到最近的细胞核边界的距离;
采用分水岭算法对所述距离图和预设的细胞边界阈值进行处理,得到所述目标图像中各细胞的所述细胞边界分割结果。
根据本发明提供的一种基于细胞分割的信息处理方法,所述基于所述生物芯片中各条形码微球的固有位置,提取所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息,包括:
基于所述生物芯片中每个条形码微球的固有位置,计算所述条形码微球的中心坐标位置;
基于所述中心坐标位置提取所述细胞分割结果的细胞数据中对应位置的区域;
创建圆形蒙版,并将所述区域内的细胞数据与所述圆形蒙版相乘,得到圆形范围内的细胞数据;
统计各所述圆形范围内的细胞数据,得到所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息。
根据本发明提供的一种基于细胞分割的信息处理方法,还包括:
对各所述细胞的第一位置信息和相应的条形码微球的统计信息进行生信分析,得到每个所述第一位置信息对应的细胞的表达量矩阵;
对各所述细胞分别对应的所述表达量矩阵进行聚类处理,得到细胞聚类信息;
基于所述细胞聚类信息中各所述细胞的聚类编号,在所述扫描图像中每个所述聚类编号对应的细胞区域绘制相应的颜色,得到聚类图像;
通过对所述聚类图像进行细胞轮廓查找,生成所述聚类图像中各所述细胞的第二位置信息;
对所述聚类图像和所述聚类图像中各所述细胞的第二位置信息进行可视化展示。
本发明还提供一种基于细胞分割的信息处理装置,包括:
获取模块,用于获取矫正后的扫描图像;所述扫描图像是基于贴附于生物芯片上的组织切片得到的;
分割模块,用于对所述扫描图像进行细胞分割,得到细胞分割结果;
提取模块,用于基于所述生物芯片中各条形码微球的固有位置,提取所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
确定模块,用于基于所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各所述细胞的第一位置信息和相应的条形码微球的统计信息。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的基于细胞分割的信息处理方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的基于细胞分割的信息处理方法的步骤。
本发明提供的基于细胞分割的信息处理方法、装置、设备及存储介质,首先,获取矫正后的扫描图像,扫描图像是基于贴附于生物芯片上的组织切片得到的,可以在细胞分割之前获取到准确无误的经过矫正的扫描图像;而后,对扫描图像进行细胞分割,得到细胞分割结果;基于生物芯片中各条形码微球的固有位置,提取细胞分割结果中的每个细胞所对应的条形码微球的位置信息;可以将细胞分割结果和包含条形码微球的生物芯片进行结合,提取出单个细胞对应的条形码微球的位置信息;最后,基于细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各细胞的第一位置信息和相应的条形码微球的统计信息,可以基于单个细胞对应的条形码微球的位置信息统计出各细胞的准确位置信息和相应的条形码微球的统计信息,从而提升细胞分析的效率和准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于细胞分割的信息处理方法的流程示意图;
图2是本发明实施例提供的百创S1000空间转录组芯片的基底图案的示意图;
图3是本发明实施例提供的矫正后的扫描图像的示意图;
图4是本发明实施例提供的细胞核边界分割结果的示意图;
图5是本发明实施例提供的细胞边界分割结果的示意图;
图6是本发明实施例提供的聚类图像的示意图;
图7是本发明实施例提供的基于细胞分割的信息处理装置的结构示意图;
图8是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图6描述本发明的基于细胞分割的信息处理方法。
请参照图1,图1是本发明实施例提供的基于细胞分割的信息处理方法的流程示意图。如图1所示,该方法可以包括以下步骤:
步骤101、获取矫正后的扫描图像;扫描图像是基于贴附于生物芯片上的组织切片得到的;
步骤102、对扫描图像进行细胞分割,得到细胞分割结果;
步骤103、基于生物芯片中各条形码微球的固有位置,提取细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
步骤104、基于细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各细胞的第一位置信息和相应的条形码微球的统计信息。
在步骤101中,生物芯片可以为空间转录组芯片等,例如:图2所示的百创S1000空间转录组芯片,本实施例不限于此。
组织切片可以为植物的组织切片或者动物的组织切片。组织切片贴附于生物芯片上。
扫描图像可以为荧光扫描图像或明场扫描图像,本实施例不限于此。
以小鼠睾丸的组织切片为例,首先通过扫描仪采集多张扫描图像,然后将多张扫描图像进行拼接,获得初始扫描图像。由于扫描仪存在系统误差,初始扫描图像通常存在错位、缺失、覆盖等情况。因此,在细胞分割之前,需要矫正初始扫描图像,获得如图3所示的矫正后的扫描图像。矫正后的扫描图像无缝合错误,且图像位置已矫正到正确的底板分布上,使得矫正后的扫描图像与实际情况相吻合。
在步骤102中,细胞分割指的是将组织切片中的细胞从背景和其他细胞中分离出来,以便准确测量每个细胞的基因表达。
具体地,将扫描图像中的每个细胞从背景和其他细胞中分离出来,得到细胞分割结果。
在步骤103中,生物芯片包含条形码微球,细胞分割结果中的每个细胞下均覆盖多个条形码微球。基于生物芯片中各条形码微球的固有位置,可以查找出每个细胞下覆盖的条形码微球的位置信息。
在步骤104中,由于确定了每个细胞下覆盖的条形码微球的位置信息,便可以统计出每个细胞的准确位置信息,以及每个细胞下覆盖的各条形码微球的统计信息。
本发明实施例提供的基于细胞分割的信息处理方法,首先,获取矫正后的扫描图像,扫描图像是基于贴附于生物芯片上的组织切片得到的,可以在细胞分割之前获取到准确无误的经过矫正的扫描图像;而后,对扫描图像进行细胞分割,得到细胞分割结果;基于生物芯片中各条形码微球的固有位置,提取细胞分割结果中的每个细胞所对应的条形码微球的位置信息;可以将细胞分割结果和包含条形码微球的生物芯片进行结合,提取出单个细胞对应的条形码微球的位置信息;最后,基于细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各细胞的第一位置信息和相应的条形码微球的统计信息,可以基于单个细胞对应的条形码微球的位置信息统计出各细胞的准确位置信息和相应的条形码微球的统计信息,从而提升细胞分析的效率和准确性。
基于图1对应实施例的基于细胞分割的信息处理方法,细胞分割结果包括细胞核边界分割结果和细胞边界分割结果;步骤102可以包括以下子步骤:
步骤1021、将扫描图像拆分为多个子图;
步骤1022、针对每个子图,对子图进行预处理,得到目标子图;
步骤1023、获取与组织切片的细胞类型匹配的预训练模型,并采用预训练模型对目标子图进行细胞核边界分割结果预测,得到目标子图中各细胞核的细胞核边界分割结果;
步骤1024、合并各目标子图,得到目标图像;
步骤1025、合并各目标子图中各细胞核的细胞核边界分割结果,得到目标图像中各细胞核的细胞核边界分割结果;
步骤1026、对目标图像中各细胞核的细胞核边界分割结果进行外扩处理,生成目标图像中各细胞的细胞边界分割结果。
在步骤1021中,由于扫描图像的尺寸过大,需要将扫描图像拆分为合适尺寸的多个子图。合适尺寸是根据当前设备的显示屏参数预先配置好的。
在一种可能的实施方式中,采用自定义滑动窗口将扫描图像拆分为多个初始子图;对多个初始子图进行边缘分界线微调,得到多个子图。
具体地,采用自定义滑动窗口,以从左到右、从上到下的顺序,以图像左上角(0,0)为原点,开始滑动分割,直至扫描图像被完整分割成若干初始子图。这些初始子图分割后无重叠部位,且能够完整复原拆分前原图。由于均匀分割的初始子图的边缘分界线可能会把单个完整细胞分开,可通过偏移操作对多个初始子图进行边缘分界线微调,得到多个子图。
循环嵌套的第一个循环通过y_start变量遍历图像的垂直方向,每次迭代的步长为self.sub_size[0]-self.overlap[0];循环嵌套的第二个循环通过x_start变量遍历图像的水平方向,每次迭代的步长为self.sub_size[1]-self.overlap[1];通过切片操作,根据y_start和x_start获取当前子图的垂直和水平切片范围;根据切片范围,从cell_mask中提取当前子图的二值化掩码tmp_mask;从原始图像img中提取当前子图img_sub;创建当前子图的副本tmp_img,以防止对原始图像进行更改;将已经存在于掩码中的区域在当前子图中置为0,这样这些区域将不参与细胞分割计算;通过调用model.eval()函数对当前子图进行细胞分割。传入参数包括当前子图tmp_img、细胞直径、通道数和流场阈值;从分割结果中获取掩码mask_sub,并移除边缘部分;根据掩码mask_sub的值更新tmp_mask,将对应位置置为True;根据掩码mask_sub生成细胞轮廓。
在该实施方式中,采用自定义滑动窗口进行子图分割和微调,可以提升子图分割的效率和准确性。
在步骤1022中,为了改善图像质量、凸显或强化图像中的特定信息以及削弱干扰信息,对每个子图进行预处理,得到目标子图,可以更好地适应后续的图像处理或分析任务。
在一种可能的实施方式中,针对每个子图,对子图进行包括均衡化、尺寸调整、彩色空间转换、腐蚀、膨胀以及像素值均一化的预处理,得到目标子图。
具体地,预处理可以包括以下内容:
1)均衡化
通过直方图均衡化等方法调整子图的像素分布,使得子图中的亮度或颜色更加均衡,可以增强图像的视觉效果和特征表达。
2)尺寸调整
调整子图的尺寸大小,使其符合特定的要求或适应特定的处理算法或模型。
3)彩色空间转换
将子图从一种彩色空间转换为另一种彩色空间,例如:将RGB图像转换为灰度图像或其他彩色空间图像,以适应不同的分析需求。
4)腐蚀和膨胀
将子图进行腐蚀和膨胀,可以削弱子图中组织切片下的条形码微球对于预训练模型的影响。
5)像素值均一化
将子图的像素值调整在均一范围内,可以避免过亮、过暗造成误识别现象。
在该实施方式中,通过对子图进行包括均衡化、尺寸调整、彩色空间转换、腐蚀、膨胀以及像素值均一化的预处理,可以改善图像质量、凸显或强化图像中的特定信息以及削弱干扰信息,从而更好地适应后续的图像处理或分析任务。
在步骤1023中,在进行细胞分割之前,可以基于带动物细胞标签的样本训练出动物细胞对应的预训练模型,以及基于带植物细胞标签的样本训练出植物细胞对应的预训练模型。
以小鼠睾丸的组织切片为例,使用开源细胞分割算法cellpose,加载与小鼠睾丸的组织切片的细胞类型匹配的预训练模型。采用预训练模型对目标子图进行细胞核边界分割结果预测,得到如图4所示的目标子图中各细胞核的细胞核边界分割结果。
具体地,可以调用model.eval()函数对目标子图进行细胞核边界分割结果预测,model.eval()函数的传入参数可以包括:当前目标子图tmp_img、细胞直径、通道数和流场阈值。
为了更好适应各类细胞的特性,本步骤提供了多种分割参数,例如:细胞直径大小diameter、分割颜色通道seg_channel、是否反转颜色inversion、识别阈值大小flow_threshold,通过提供多种分割参数选项可以适应不同的染色下的不同类型细胞。
以细胞直径大小为35像素,分割颜色通道为0RED 1GREEN 2BLUE,目标子图为img_dist_fg7.GIF为例,通过命令“python SegtoBarcode.py--img_path'./img_dist_fg7.GIF'--diameter 35--inversion True--seg_channel 1”传入指定图片以及分割自定义参数。其他自定义参数可以通过命令行传入也可以修改setup.yaml配置文件。
在步骤1024和1025中,合并所有目标子图以及对应的细胞核边界分割结果,得到目标图像和目标图像中各细胞核的细胞核边界分割结果。
创建int32类型的原图尺寸npy矩阵文件作为细胞核边界分割结果的存储结构,可以保证像素级别点对点对应,并且int32类型可以存储更多数据信息,避免细胞统计数量超过数据类型上限。
在步骤1026中,将目标图像中每个细胞核的细胞核边界分割结果外扩指定范围,可生成如图5所示的目标图像中各细胞的细胞边界分割结果。
在一种可能的实施方式中,步骤1026可以包括:基于目标图像中各细胞核的细胞核边界分割结果,生成二值化图像;通过距离变换计算二值化图像的距离图;距离图用于表征每个像素到最近的细胞核边界的距离;采用分水岭算法对距离图和预设的细胞边界阈值进行处理,得到目标图像中各细胞的细胞边界分割结果。
具体地,首先,使用Numpy.load函数加载核掩码文件(nucleus.npy),并将其进行缩放处理。缩放倍率为1/self.calculate_rate,通过Ndimage.zoom函数实现。缩放后的结果存储在mask_rs中。将mask_rs中大于0的像素值设为255,其余设为0,以获得细胞核的二值化图像。这可以通过Numpy.where函数和类型转换实现。使用距离变换(Ndimage.distance_transform_edt)计算细胞核边界的距离图。距离图表示每个像素到最近的细胞核边界的距离。根据设定的细胞边缘阈值(self.cell_edge)和缩放倍率(self.calculate_rate),生成细胞分割结果。使用watershed函数进行分水岭算法,其中距离图作为输入,核掩码(mask_rs)用作标记。使用cellpose.utils.masks_to_outlines函数将细胞分割结果转换为细胞分割边界。这将得到一个包含细胞分割边界的掩码。将细胞分割结果(cells)进行缩放,使其尺寸与原始核掩码(masks)一致。这里使用Ndimage.zoom函数和尺寸比例计算。将细胞分割结果(cells)保存为cells.npy文件,文件路径为self.save_dir目录下。返回原始核掩码(masks)、细胞分割结果(cells)以及细胞分割结果的保存路径(cell s_path)。该算法的目的是从核掩码生成细胞分割结果,通过距离变换和分水岭算法实现细胞边界的提取,并保存结果供后续使用。
在本实施例中,可以实现细胞分割的便捷和高效。
基于前述各实施例对应的基于细胞分割的信息处理方法,步骤103可以包括:基于生物芯片中每个条形码微球的固有位置,计算条形码微球的中心坐标位置;基于中心坐标位置提取细胞分割结果的细胞数据中对应位置的区域;创建圆形蒙版,并将区域内的细胞数据与圆形蒙版相乘,得到圆形范围内的细胞数据;统计各圆形范围内的细胞数据,得到细胞分割结果中的每个细胞所对应的条形码微球的位置信息。
具体地,加载条形码模板,读取生物芯片中每个条形码微球的固有位置。加载细胞数据,计算图像的放大倍率zoom_scale。根据放大倍率计算出标准宽度std_w和标准高度std_h。初始化半径radius,计算为标准宽度的0.618倍的一半,如果小于1,则取1。遍历生物芯片中各条形码微球的固有位置,对于每个条形码微球计算其中心坐标位置。根据中心坐标位置,提取细胞数据中对应位置的区域。创建圆形蒙版,将区域内的细胞数据与蒙版相乘,得到圆形范围内的细胞数据。统计各圆形范围内的细胞数据,得到每个细胞所对应的条形码微球的位置信息,并将其添加到all_barcode列表中。遍历all_barcode列表,将条形码微球名称和对应的细胞数据写入all_barcode_txt列表,将all_barcode_txt列表中的内容保存到文件all_barcode_num.txt中。
在本实施例中,可以将细胞分割结果和包含条形码微球的生物芯片进行结合,提取出单个细胞对应的条形码微球的位置信息,从而准确地定位和识别每个细胞。
基于前述各实施例对应的基于细胞分割的信息处理方法,该方法还包括:
步骤105、对各细胞的第一位置信息和相应的条形码微球的统计信息进行生信分析,得到每个第一位置信息对应的细胞的表达量矩阵;
步骤106、对各细胞分别对应的表达量矩阵进行聚类处理,得到细胞聚类信息;
步骤107、基于细胞聚类信息中各细胞的聚类编号,在扫描图像中每个聚类编号对应的细胞区域绘制相应的颜色,得到聚类图像;
步骤108、通过对聚类图像进行细胞轮廓查找,生成聚类图像中各细胞的第二位置信息;
步骤109、对聚类图像和聚类图像中各细胞的第二位置信息进行可视化展示。
在步骤106中,定义聚类字典,将聚类编号与颜色序号进行映射。通过对各细胞分别对应的表达量矩阵进行聚类处理,得到聚类编号,并根据聚类字典获取相应的颜色序号。创建一个用于存储细胞颜色序号的数组cell_color,将对应的颜色序号赋值给cell_color数组中的相应位置。
在步骤107中,加载颜色信息,如果存在之前保存的颜色文件,则加载之前保存的颜色,否则随机生成一组颜色并保存。在扫描图像中每个聚类编号对应的细胞区域绘制相应的颜色,得到聚类图像,并保存至指定目录。在绘制颜色时,细胞核内的颜色和细胞边界与细胞核边界之间区域的颜色不同。
在步骤107中,关于细胞轮廓查找,从细胞分割结果中提取细胞边界,并将边界坐标保存为JSON文件。
具体地,首先,使用Numpy.load函数加载细胞分割结果(cells_path),并将其存储在masks中。创建一个空字典cell_contours,用于存储每个细胞的边界坐标。使用Ndimage.find_objects函数查找mask s中的每个细胞的位置。返回一个由组织切片组成的列表slices。对于每个非空组织切片si,提取相应的行索引sr和列索引sc。创建一个二值化掩码mask,将属于当前细胞的像素值设为1,其余像素值设为0。通过将masks[sr,sc]与(i+1)进行比较实现。使用cv2.findContours函数找到二值化掩码的轮廓,返回的结果为contours。提取轮廓的点坐标pvc和pvr,并根据组织切片的起始位置进行偏移,得到相对于原始图像的绝对坐标vr和vc。将细胞标签和对应的边界坐标添加到cell_contours字典中,键为细胞标签,值为包含边界坐标的列表。将cell_contours字典以JSON格式保存到指定的文件中,文件路径为sa ve_dir目录下的json_name.json。返回cell_contours字典。可以从细胞分割结果中提取每个细胞的边界坐标,并将其保存为JSON文件,以便后续使用。
在步骤109中,将聚类图像中各细胞的第二位置信息以JSON格式进行可视化展示,将聚类图像在可视化界面展示,可以清晰地展示出不同类型细胞的分布。
在本实施例中,可以通过生信分析、聚类处理和细胞轮廓查找得到聚类图像和聚类图像中各细胞的第二位置信息,便于可视化展示。
下面对本发明提供的基于细胞分割的信息处理装置进行描述,下文描述的基于细胞分割的信息处理装置与上文描述的基于细胞分割的信息处理方法可相互对应参照。
请参照图7,图7是本发明实施例提供的基于细胞分割的信息处理装置的结构示意图。如图7所示,该装置可以包括:
获取模块10,用于获取矫正后的扫描图像;扫描图像是基于贴附于生物芯片上的组织切片得到的;
分割模块20,用于对扫描图像进行细胞分割,得到细胞分割结果;
提取模块30,用于基于生物芯片中各条形码微球的固有位置,提取细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
确定模块40,用于基于细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各细胞的第一位置信息和相应的条形码微球的统计信息。
在一种示例实施例中,分割模块20包括:
拆分单元,用于将扫描图像拆分为多个子图;
预处理单元,用于针对每个子图,对子图进行预处理,得到目标子图;
预测单元,用于获取与组织切片的细胞类型匹配的预训练模型,并采用预训练模型对目标子图进行细胞核边界分割结果预测,得到目标子图中各细胞核的细胞核边界分割结果;
第一合并单元,用于合并各目标子图,得到目标图像;
第二合并单元,用于合并各目标子图中各细胞核的细胞核边界分割结果,得到目标图像中各细胞核的细胞核边界分割结果;
外扩单元,用于对目标图像中各细胞核的细胞核边界分割结果进行外扩处理,生成目标图像中各细胞的细胞边界分割结果。
在一种示例实施例中,拆分单元具体用于:
采用自定义滑动窗口将扫描图像拆分为多个初始子图;
对多个初始子图进行边缘分界线微调,得到多个子图。
在一种示例实施例中,预处理单元具体用于:
针对每个子图,对子图进行包括均衡化、尺寸调整、彩色空间转换、腐蚀、膨胀以及像素值均一化的预处理,得到目标子图。
在一种示例实施例中,外扩单元具体用于:
基于目标图像中各细胞核的细胞核边界分割结果,生成二值化图像;
通过距离变换计算二值化图像的距离图;距离图用于表征每个像素到最近的细胞核边界的距离;
采用分水岭算法对距离图和预设的细胞边界阈值进行处理,得到目标图像中各细胞的细胞边界分割结果。
在一种示例实施例中,提取模块30具体用于:
基于生物芯片中每个条形码微球的固有位置,计算条形码微球的中心坐标位置;
基于中心坐标位置提取细胞分割结果的细胞数据中对应位置的区域;
创建圆形蒙版,并将区域内的细胞数据与圆形蒙版相乘,得到圆形范围内的细胞数据;
统计各圆形范围内的细胞数据,得到细胞分割结果中的每个细胞所对应的条形码微球的位置信息。
在一种示例实施例中,该装置还包括:可视化模块,该可视化模块具体用于:
对各细胞的第一位置信息和相应的条形码微球的统计信息进行生信分析,得到每个第一位置信息对应的细胞的表达量矩阵;
对各细胞分别对应的表达量矩阵进行聚类处理,得到细胞聚类信息;
基于细胞聚类信息中各细胞的聚类编号,在扫描图像中每个聚类编号对应的细胞区域绘制相应的颜色,得到聚类图像;
通过对所述聚类图像进行细胞轮廓查找,生成所述聚类图像中各所述细胞的第二位置信息;
对聚类图像和所述聚类图像中各所述细胞的第二位置信息进行可视化展示。
图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行基于细胞分割的信息处理方法,该方法包括:
获取矫正后的扫描图像;扫描图像是基于贴附于生物芯片上的组织切片得到的;
对扫描图像进行细胞分割,得到细胞分割结果;
基于生物芯片中各条形码微球的固有位置,提取细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
基于细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各细胞的第一位置信息和相应的条形码微球的统计信息。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于细胞分割的信息处理方法,该方法包括:
获取矫正后的扫描图像;扫描图像是基于贴附于生物芯片上的组织切片得到的;
对扫描图像进行细胞分割,得到细胞分割结果;
基于生物芯片中各条形码微球的固有位置,提取细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
基于细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各细胞的第一位置信息和相应的条形码微球的统计信息。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的基于细胞分割的信息处理方法,该方法包括:
获取矫正后的扫描图像;扫描图像是基于贴附于生物芯片上的组织切片得到的;
对扫描图像进行细胞分割,得到细胞分割结果;
基于生物芯片中各条形码微球的固有位置,提取细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
基于细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各细胞的第一位置信息和相应的条形码微球的统计信息。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于细胞分割的信息处理方法,其特征在于,包括:
获取矫正后的扫描图像;所述扫描图像是基于贴附于生物芯片上的组织切片得到的;
对所述扫描图像进行细胞分割,得到细胞分割结果;
基于所述生物芯片中各条形码微球的固有位置,提取所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
基于所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各所述细胞的第一位置信息和相应的条形码微球的统计信息。
2.根据权利要求1所述的基于细胞分割的信息处理方法,其特征在于,所述细胞分割结果包括细胞核边界分割结果和细胞边界分割结果;所述对所述扫描图像进行细胞分割,得到细胞分割结果,包括:
将所述扫描图像拆分为多个子图;
针对每个所述子图,对所述子图进行预处理,得到目标子图;
获取与所述组织切片的细胞类型匹配的预训练模型,并采用所述预训练模型对所述目标子图进行细胞核边界分割结果预测,得到所述目标子图中各细胞核的所述细胞核边界分割结果;
合并各所述目标子图,得到目标图像;
合并各所述目标子图中各细胞核的所述细胞核边界分割结果,得到所述目标图像中各细胞核的所述细胞核边界分割结果;
对所述目标图像中各细胞核的所述细胞核边界分割结果进行外扩处理,生成所述目标图像中各细胞的所述细胞边界分割结果。
3.根据权利要求2所述的基于细胞分割的信息处理方法,其特征在于,所述将所述扫描图像拆分为多个子图,包括:
采用自定义滑动窗口将所述扫描图像拆分为多个初始子图;
对所述多个初始子图进行边缘分界线微调,得到所述多个子图。
4.根据权利要求2所述的基于细胞分割的信息处理方法,其特征在于,所述针对每个所述子图,对所述子图进行预处理,得到目标子图,包括:
针对每个所述子图,对所述子图进行包括均衡化、尺寸调整、彩色空间转换、腐蚀、膨胀以及像素值均一化的预处理,得到所述目标子图。
5.根据权利要求2所述的基于细胞分割的信息处理方法,其特征在于,所述对所述目标图像中各细胞核的所述细胞核边界分割结果进行外扩处理,生成所述目标图像中各细胞的所述细胞边界分割结果,包括:
基于所述目标图像中各细胞核的所述细胞核边界分割结果,生成二值化图像;
通过距离变换计算所述二值化图像的距离图;所述距离图用于表征每个像素到最近的细胞核边界的距离;
采用分水岭算法对所述距离图和预设的细胞边界阈值进行处理,得到所述目标图像中各细胞的所述细胞边界分割结果。
6.根据权利要求1至5任一项所述的基于细胞分割的信息处理方法,其特征在于,所述基于所述生物芯片中各条形码微球的固有位置,提取所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息,包括:
基于所述生物芯片中每个条形码微球的固有位置,计算所述条形码微球的中心坐标位置;
基于所述中心坐标位置提取所述细胞分割结果的细胞数据中对应位置的区域;
创建圆形蒙版,并将所述区域内的细胞数据与所述圆形蒙版相乘,得到圆形范围内的细胞数据;
统计各所述圆形范围内的细胞数据,得到所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息。
7.根据权利要求1至5任一项所述的基于细胞分割的信息处理方法,其特征在于,还包括:
对各所述细胞的第一位置信息和相应的条形码微球的统计信息进行生信分析,得到每个所述第一位置信息对应的细胞的表达量矩阵;
对各所述细胞分别对应的所述表达量矩阵进行聚类处理,得到细胞聚类信息;
基于所述细胞聚类信息中各所述细胞的聚类编号,在所述扫描图像中每个所述聚类编号对应的细胞区域绘制相应的颜色,得到聚类图像;
通过对所述聚类图像进行细胞轮廓查找,生成所述聚类图像中各所述细胞的第二位置信息;
对所述聚类图像和所述聚类图像中各所述细胞的第二位置信息进行可视化展示。
8.一种基于细胞分割的信息处理装置,其特征在于,包括:
获取模块,用于获取矫正后的扫描图像;所述扫描图像是基于贴附于生物芯片上的组织切片得到的;
分割模块,用于对所述扫描图像进行细胞分割,得到细胞分割结果;
提取模块,用于基于所述生物芯片中各条形码微球的固有位置,提取所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息;
确定模块,用于基于所述细胞分割结果中的每个细胞所对应的条形码微球的位置信息,确定各所述细胞的第一位置信息和相应的条形码微球的统计信息。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的基于细胞分割的信息处理方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于细胞分割的信息处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310752008.2A CN116823761A (zh) | 2023-06-25 | 2023-06-25 | 基于细胞分割的信息处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310752008.2A CN116823761A (zh) | 2023-06-25 | 2023-06-25 | 基于细胞分割的信息处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116823761A true CN116823761A (zh) | 2023-09-29 |
Family
ID=88128688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310752008.2A Pending CN116823761A (zh) | 2023-06-25 | 2023-06-25 | 基于细胞分割的信息处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116823761A (zh) |
-
2023
- 2023-06-25 CN CN202310752008.2A patent/CN116823761A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107194400B (zh) | 一种财务报销全票据图片识别处理方法 | |
CN106875546B (zh) | 一种增值税发票的识别方法 | |
CN102567300B (zh) | 图片文档的处理方法及装置 | |
CN108090511B (zh) | 图像分类方法、装置、电子设备及可读存储介质 | |
US11151402B2 (en) | Method of character recognition in written document | |
CN111461100A (zh) | 一种票据识别方法、装置、电子设备和存储介质 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN109741273A (zh) | 一种手机拍照低质图像的自动处理与评分方法 | |
CN112435214A (zh) | 基于先验框线性缩放的花粉检测方法、装置和电子设备 | |
CN115578741A (zh) | 一种基于Mask R-cnn算法和类型分割的扫描文件版面分析方法 | |
CN113963353A (zh) | 一种文字图像处理识别方法、装置、计算机设备和存储介质 | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN112200789B (zh) | 一种图像识别的方法及装置、电子设备和存储介质 | |
CN116868226A (zh) | 图像中注释的感兴趣区域的检测 | |
CN112597868A (zh) | 基于无定位点的试卷识别和矫正方法 | |
CN115908363B (zh) | 肿瘤细胞统计方法、装置、设备和存储介质 | |
CN114511862B (zh) | 表格识别方法、装置及电子设备 | |
CN116823761A (zh) | 基于细胞分割的信息处理方法、装置、设备及存储介质 | |
CN113177602A (zh) | 图像分类方法、装置、电子设备和存储介质 | |
CN111768384A (zh) | 基于三维扫描成像的细胞计数方法及系统 | |
CN111382741A (zh) | 一种自然场景图片中文本检测方法、系统及设备 | |
CN116311262B (zh) | 一种仪器仪表信息的识别方法、系统、设备和存储介质 | |
CN112507999B (zh) | 基于视觉特征的非侵入式用户界面输入项识别方法 | |
CN109271986B (zh) | 一种基于Second-Confirm的数字识别方法 | |
WO2024001051A1 (zh) | 空间组学单细胞数据获取方法及装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |