CN117523557A - 一种空间转录组芯片的检测方法、装置、设备及介质 - Google Patents
一种空间转录组芯片的检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117523557A CN117523557A CN202311545931.5A CN202311545931A CN117523557A CN 117523557 A CN117523557 A CN 117523557A CN 202311545931 A CN202311545931 A CN 202311545931A CN 117523557 A CN117523557 A CN 117523557A
- Authority
- CN
- China
- Prior art keywords
- intersection point
- region
- determining
- tissue
- intersection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000001514 detection method Methods 0.000 claims abstract description 46
- 238000013135 deep learning Methods 0.000 claims abstract description 20
- 238000004043 dyeing Methods 0.000 claims abstract description 16
- 238000010186 staining Methods 0.000 claims abstract description 7
- 230000015654 memory Effects 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 11
- 230000008520 organization Effects 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 239000000523 sample Substances 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 14
- 239000011159 matrix material Substances 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 9
- 230000000007 visual effect Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 108090000623 proteins and genes Proteins 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000003908 quality control method Methods 0.000 description 6
- 238000007405 data analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000227 grinding Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/695—Preprocessing, e.g. image segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/469—Contour-based spatial representations, e.g. vector-coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Bioethics (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Image Processing (AREA)
Abstract
本发明涉及生物信息技术领域,公开了一种空间转录组芯片的检测方法、装置、设备及介质,该方法包括:获取空间转录组芯片的染色图像,芯片包括若干子区域,芯片中放置有待分析组织;将染色图像输入深度学习检测模型,检测染色图像中基准框的交点,基准框框边的宽度不同,交点为基准框的横基准线与竖基准线的交叉点;基于每一个交点的宽度比,校正交点的正确位置顺序,并确定每一个交点的交点坐标;基于交点坐标,确定待检测范围以及待检测范围中每一个子区域的区域坐标;确定待检测范围内的组织区域并确定组织区域的barcode列表,barcode列表中包括与区域坐标一一对应的barcode。本发明不仅具有针对性,而且检测的准确率及效率高。
Description
技术领域
本发明涉及生物信息技术领域,具体涉及一种空间转录组芯片的检测方法、装置、设备及介质。
背景技术
随着生命科学领域的发展,对基因表达的研究已经成为了重要的研究方向。其中,空间转录组技术能够提供组织中基因在空间位置上的信息,有助于研究者更深入地理解生物学过程。
目前,空间转录组的主流分析技术如10X Genomics公司的Visium技术,可以使用space ranger软件对空间转录组芯片数据进行检测分析。10x Visium空间转录组技术结合了细胞在组织分布的位置信息和转录组信息,以较高分辨率来展示组织中不同位置的基因表达信息。但是,由于不同公司研发的空间转录组芯片的布局样式存在不同的原因,10XVisium技术并不适用于分析所有转录组芯片,例如,德运康瑞公司自研的空间转录组芯片。如若仍然采用10X Visium技术进行检测分析,则存在准确性低的问题。
发明内容
有鉴于此,本发明提供了一种空间转录组芯片的检测方法、装置、设备及介质,以解决上述问题。
第一方面,本发明提供了一种空间转录组芯片的检测方法,方法包括:
获取空间转录组芯片的染色图像,芯片包括若干子区域,芯片中放置有待分析组织;
将染色图像输入深度学习检测模型,检测染色图像中基准框的交点,基准框框边的宽度不同,交点为基准框的横基准线与竖基准线的交叉点;
基于每一个交点的宽度比,校正交点的正确位置顺序,并确定每一个交点的交点坐标;
基于交点坐标,确定待检测范围以及待检测范围中每一个子区域的区域坐标;
确定待检测范围内的组织区域并确定组织区域的barcode列表,barcode列表中包括与区域坐标一一对应的barcode。
该方法通过检测芯片的基本框的交点,根据交点的宽度比,准确的确定出交点的正确位置,并根据交点确定出了待检测范围,进而根据待检测范围中的组织区域,确定出了barcode列表。本方法不仅具有针对性,而且基准框以及组织区域的检测准确率高,进而提高了分析的准确性。
在一种可选的实施方式中,确定待检测范围内的组织区域,包括:
将染色图像进行灰度处理,获得灰度图像;
检测待检测范围内的所有轮廓,获得多个轮廓区域;
将轮廓区域按照轮廓面积,从大到小依次叠加至初始化区域,初始化区域与染色图像尺寸相同,且灰度值为0;
每向初始化区域中叠加一个轮廓区域,则生成由已叠加的所有轮廓区域围成的多边形区域,将多边形区域内部的灰度值设置为255,并计算叠加后的多边形区域与染色图像的Pearson相关系数;
当Pearson相关系数达到预设阈值后停止添加,获得目标多边形区域;
在目标多边形区域基础上,确定组织区域。
根据轮廓区域的迭代添加,当添加后的初始化区域与染色图像的Pearson相关系数到达峰值后即停止添加,从而获得目标初始区域,不仅确定效率高,确定方法简单,而且准确性高。
在一种可选的实施方式中,在目标多边形区域基础上,确定组织区域,包括:
确定目标多边形区域中每一个子区域对应的非0灰度值的占比;
若占比大于预设值,则确定对应的子区域为组织子区域;
若占比小于预设值,则确定对应的子区域为非组织子区域;
将所有组织子区域对应的区域,作为组织区域。
根据轮廓区域确定出目标多边形区域后,可以在目标多边形区域基础上,进一步确定组织区域。根据每个子区域非0灰度值的占比,确定组织子区域,从而可以提高组织区域确定的准确性。
在一种可选的实施方式中,对根据占比确定的组织子区域再次进行筛选:
计算每一个组织子区域的平均灰度值;
基于平均灰度值,统计所有组织子区域的第一均值和所有非组织子区域的第二均值;
基于平均灰度值、第一均值、第二均值,计算信任值;
将达到信任值阈值的子区域,确定为最终的组织子区域。
对根据占比确定的组织子区域再次进行筛选,确定出筛选后的组织子区域,最终根据筛选后的组织子区域,组成组织区域,进一步提高了组织区域确定的准确性。
在一种可选的实施方式中,基于交点坐标,确定待检测范围,包括:
基于交点坐标,确定感兴趣区域;
根据感兴趣区域内灰度值的变化,检测出横直线与竖直线;
确定横直线与竖直线的交叉区域;
基于交叉区域,校正交点坐标,获得校正后的交点坐标;
将校正后的交点坐标对应的感兴趣区域,作为待检测范围。
在一种可选的实施方式中,深度学习检测模型通过以下步骤建立:
获取若干空间转录组芯片的样本图像;
标记每一个样本图像中基准框的交点,并作为样本交点;
将样本图像以及对应的样本交点,按照预设比例,划分为训练集与测试集;
基于训练集与测试集,训练初始深度学习网络,以获得深度学习检测模型。
在一种可选的实施方式中,在确定每一个交点的交点坐标之后,还包括:
提供手动检测工具,用于用户选择是否手动检测交点;
在用户选择手动检测交点后,载入染色图像;
获取用户按交叉点顺序选择的交点位置;
提供微调工具,用于用户对需要调整的点进行微调;
根据最终确定的交点的位置,利用投影变换进行图片矫正;
基于校正后的交点的位置,确定交点的交点坐标。
对基准框交点以及组织区域的检测,包含自动和手动两种操作模式,能够在不同情况下提供灵活的处理方式,保证数据分析的准确性和效率。两种工作模式方便用户进行操作和调整,降低了使用难度。
第二方面,本发明提供了一种空间转录组芯片的检测装置,装置包括:
获取模块,用于获取空间转录组芯片的染色图像,芯片包括若干子区域,芯片中放置有待分析组织;
学习模块,用于将染色图像输入深度学习检测模型,检测染色图像中基准框的交点,基准框框边的宽度不同,交点为基准框的横基准线与竖基准线的交叉点;
第一确定模块,用于基于每一个交点的宽度比,校正交点的正确位置顺序,并确定每一个交点的交点坐标;
第二确定模块,基于交点坐标,确定待检测范围以及待检测范围中每一个子区域的区域坐标;
第三确定模块,确定待检测范围内的组织区域并确定组织区域的barcode列表,barcode列表中包括与区域坐标一一对应的barcode。
第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的空间转录组芯片的检测方法。
第四方面,本发明提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的空间转录组芯片的检测方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的空间转录组芯片的检测方法的流程示意图;
图2是根据本发明实施例的若干子区域的结构示意图;
图3是根据本发明实施例的基准框的结构示意图;
图4是根据本发明实施例的步骤S105包括的方法的流程示意图;
图5是根据本发明实施例的轮廓区域叠加的示意图;
图6是根据本发明实施例的空间转录组芯片的检测装置的结构框图;
图7是本发明实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对于空间转录组的主流分析技术10X Visium,虽然具有一定的数据检测分析功能,但无法有效处理一些公司自研的设备数据,原因主要在于芯片的布局样式及数据特征存在显著差异。例如,苏州德运康瑞生物科技有限公司研发出的空间转录组实验芯片。由于芯片的布局样式不同,如若仍然采用10X Visium技术进行检测分析,则存在分析准确性低的问题。
鉴于此,根据本发明实施例,提供了一种空间转录组芯片的检测方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种空间转录组芯片的检测方法,可用于检测一些特定布局样式的空间转录组芯片,可由服务器、终端等设备执行,图1是根据本发明实施例的空间转录组芯片的检测方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,获取空间转录组芯片的染色图像,芯片包括若干子区域,芯片中放置有待分析组织。可以参照图2所示。芯片上的若干子区域实则为spot阵列。在转录组研究中,spot区域通常指的是芯片上的微阵列区域,每个spot区域有相同的barcode序列,用于检测若干基因的表达水平。待分析组织可以是来自不同组织、细胞类型或条件下的样本。将待分析组织放入芯片上,并进行H&E染色,从而获得染色图像。
获得染色图像之后,还使用图像处理技术对图像进行预处理,包括但不限于高斯滤波对图像进行平滑、去除噪声,开运算去除图像杂质,闭运算去除图像孔洞等操作,以提高后续处理步骤的准确性。
步骤S102,将染色图像输入深度学习检测模型,检测染色图像中基准框的交点,基准框框边的宽度不同,交点为基准框的横基准线与竖基准线的交叉点。可以参照图3所示,一个基准框由两条横基准线与两条竖基准线组成。本实施例中,基准框采用两宽两窄的设计,即L1与L2的宽度相等,L3与L4的宽度相等,L1与L2的宽度小于L3与L4,当然,基准框的每条框边的宽度均不相同,因此,四个基准框交点拥有不同的宽度比。
步骤S103,基于每一个交点的宽度比,校正交点的正确位置顺序,并确定每一个交点的交点坐标。本实施例中,已知自研芯片预定义的基准框交点的宽度比,因此,可以根据检测出的每个交点的宽度比,区分四个交点的位置顺序,进而实现对交点位置的校正。交点的交点坐标可以根据预先定义的坐标系进行确定。
步骤S104,基于交点坐标,确定待检测范围以及待检测范围中每一个子区域的区域坐标。根据基准框交点在正确顺序位置上的交点坐标,根据每个子区域与交点坐标的相对位置,可以自动确定出待检测范围中每一个子区域的区域坐标,区域坐标可以是每个子区域的中心。检测范围可以是基准框内的区域。
步骤S105,确定待检测范围内的组织区域并确定组织区域的barcode列表,barcode列表中包括与每一个子区域的区域坐标一一对应的barcode。其中,待检测范围内的组织区域,指的是覆盖有组织的区域。空间转录组芯片将待检测组织上的RNA序列与子区域内的探针进行杂交,从而可以检测待检测组织中的特定基因表达水平。而barcode则为条形码,即一段特殊的DNA序列,用于标识不同的spot。每一个包含有组织的子区域,则对应有一个barcode,则组织区域对应有barcode列表。即完成了空间转录组芯片的初步检测。
本实施例中,针对自研的空间转录组实验芯片,提供一种空间转录组芯片的检测方法,该方法通过检测芯片的基准框的交点,根据交点的宽度比,准确的确定出交点的正确位置,并根据交点确定出了待检测范围,进而根据待检测范围中的组织区域,确定出了barcode列表。本实施例提供的方法,不仅具有针对性,而且基准框以及组织区域的检测准确率高,进而提高了分析的准确性。
在一些可选的实施方式中,在上述检测完之后,还包括:
基于捕获到的所有序列进行测序,获得测序数据;也即是,从这些测序数据中筛选被组织区域覆盖的spot对应的barcode所在序列,用于后续分析;
根据所述测序数据,计算表达矩阵;
根据所述表达矩阵,计算质控指标;
根据所述表达矩阵以及所述质控指标生成可视化报告。
具体地,从测序数据中提取序列特征,通过X、Y两段Barcode标记所属spot,参照表1所示。并通过UMI序列标记转录本,建库完成后基于NGS技术对芯片上每个spot中的表达基因进行测序。再从测序数据中根据自研技术特异性的序列组成特征来解析R1端中包含的Barcode及UMI信息,并对不存在于自研平台特有的Barcode白名单中的无效Barcode进行过滤。
表1
Barcode | X | Y |
AGATCGCA AGATCGCA | 1 | 1 |
AGATCGCA ATGCCTAA | 1 | 2 |
AGATCGCA AGTGGTCA | 1 | 3 |
AGATCGCA ACCACTGT | 1 | 4 |
AGATCGCA ACATTGGC | 1 | 5 |
表达矩阵计算:将测序数据比对到对应物种的参考基因组上,使用统计方法获取基因表达的UMI定量数据,提取的Barcode特征结合组织区域检测获得的组织区域spot的barcode列表,计算出基因与Barcode对应的表达矩阵。结合Barcode对应的spot空间位置,该矩阵描述了每个基因在不同组织区域中的表达水平,是进一步分析的重要基础,全面反映组织在空间位置上的基因表达情况。
质控指标计算:通过对图像及表达矩阵的分析,计算出质控指标,主要包括:Estimated Number of Spots、Mean Reads per Spot、Median Genes per Spot、Sequencing Saturation、Reads Mapped Confidently to Exonic Regions、FractionReads in Spots等。这些指标用于评估实验的质量和数据的可靠性。
报告生成:根据数据分析结果及质控指标,生成包含详细分析结果和可视化图像的报告。报告中包括基因表达的分布、组织区域的分割图像等可视化图像,以及详细的统计信息和质控指标。
本实施例中,在确定出了barcode列表的基础上,继续进行数据分析,提高了分析准确性。
参照图4所示,在一些可选的实施方式中,步骤S105,确定待检测范围内的组织区域,包括:
步骤S1051,将染色图像进行灰度处理,获得灰度图像。并将灰度图像缩放成固定尺寸。
步骤S1052,检测待检测范围内的所有轮廓,获得多个轮廓区域。可以先使用Canny边缘检测算法找出灰度图像中的所有边缘,对边缘图进行闭运算处理以平滑组织轮廓,再对边缘图进行轮廓检测。
步骤S1053,将轮廓区域按照轮廓面积,从大到小依次叠加至初始化区域,初始化区域与染色图像尺寸相同,且灰度值为0,可以参照图5所示。
按照轮廓面积从大到小的顺序循环累积轮廓,每加入一个新轮廓就在一个和灰度图等尺寸的全0矩阵(初始化区域)上生成由已累积的所有轮廓围成的多边形区域(即组织区域)。
步骤S1054,每向初始化区域中叠加一个轮廓区域,则生成由已叠加的所有轮廓区域围成的多边形区域,将多边形区域内部的灰度值设置为255,并计算叠加后的初始化区域与染色图像的Pearson相关系数。
步骤S1055,当Pearson相关系数达到预设阈值后停止添加,获得目标多边形区域。在累积轮廓的迭代过程中不断保留该相关系数,在相关系数到达预设阈值后停止累积轮廓。该预设阈值可以为峰值,例如,如果相关系数达到0.9及以上或者最近N次迭代中相邻系数差异的均值小于0.001同样停止累积轮廓,输出Mask矩阵,即目标多边形区域。
步骤S1056,在目标多边形区域基础上,确定组织区域。
本实施例中,根据轮廓区域的迭代添加,当添加后的初始化区域与染色图像的Pearson相关系数到达峰值后即停止添加,从而获得目标初始区域,不仅确定效率高,确定方法简单,而且准确性高。
在一些可选的实施方式中,步骤S1056,在目标多边形区域基础上,确定组织区域,包括:
步骤S10561,确定目标多边形区域中每一个子区域对应的非0灰度值的占比。如上所述,spot区域通常指的是芯片上的微阵列区域,获取的染色图像上,每一个子区域中包含多个像素,确定出子区域灰度值不为0的像素的个数,以及像素总数,计算非0灰度值的像素个数与像素总数的比值,即为占比。
步骤S10562,若占比大于预设值,则确定对应的子区域为组织子区域。预设值可以是0.5。
步骤S10563,若占比小于预设值,则确定对应的子区域为非组织子区域。
步骤S10564,将所有组织子区域对应的区域,作为组织区域。
本实施例中,在根据轮廓区域确定出目标多边形区域后,可以在目标多边形区域基础上,进一步确定组织区域。根据每个子区域非0灰度值的占比,确定组织子区域,从而可以提高组织区域确定的准确性。
在一些可选的实施方式中,对根据占比确定的组织子区域再次进行筛选,包括;
步骤S10565,计算每一个组织子区域的平均灰度值;
步骤S10566,基于平均灰度值,统计所有组织子区域的第一均值和所有非组织子区域的第二均值;
步骤S10567,基于平均灰度值、第一均值、第二均值,计算信任值;
步骤S10568,将达到信任值阈值的子区域,确定为最终的组织子区域。
根据非0灰度值的占比确定组织子区域,可以视为是子区域的初次分类,本实施例中,进而对子区域进行二次分类。
计算灰度图像中每个子区域的平均像素灰度值,统计初次分类中所有组织子区域的第一均值Pin和所有非组织子区域第二均值Pout,设任意以子区域的平均灰度值为u,则计算信任值:(Pout-u)/(Pout–Pin),若信任值大于信任值阈值k,则对应的子区域为组织子区域,k是可调的阈值,范围限定在0-1之间,k越大,spot检测越严格。若小于等于信任值阈值k,则对应的子区域为非组织子区域。
进一步地,对筛选后的组织子区域去噪声,即将8个相邻子区域都是非组织子区域的孤立组织子区域,重新分类为非组织子区域。
本实施例中,对根据占比确定的组织子区域再次进行筛选,确定出筛选后的组织子区域,最终根据筛选后的组织子区域,组成组织区域,进一步提高了组织区域确定的准确性。
在一些可选的实施方式中,步骤S104,基于交点坐标,确定待检测范围,包括:
步骤S1041,基于交点坐标,确定感兴趣区域;
步骤S1042,根据感兴趣区域内灰度值的变化,检测出横直线与竖直线;
步骤S1043,确定横直线与竖直线的交叉区域;
步骤S1044,基于交叉区域,校正交点坐标,获得校正后的交点坐标;
步骤S1045,将校正后的交点坐标对应的感兴趣区域,作为待检测范围。
根据深度学习检测模型检测出的染色图像中基准框的交点,一般为基准框交点的粗定位。进而根据粗定位位置,获取基准框交点区域ROI,即感兴趣区域,ROI包含基准框交点与交点周围区域。在ROI范围内根据灰度值变化检测横线与竖线,根据横线与竖线的相交区域对基准框交点位置进行像素级的精确定位,获得校正后的交点坐标。并将校正后的交点坐标对应的感兴趣区域,即基准框内区域,作为待检测范围。
本实施例中,对待检测范围进行了进一步精确,提高了待检测范围的精确度,进而提高了检测组织区域的准确性。
在一些可选的实施方式中,深度学习检测模型通过以下步骤建立:
获取若干空间转录组芯片的样本图像;
标记每一个样本图像中基准框的交点,并作为样本交点;
将样本图像以及对应的样本交点,按照预设比例,划分为训练集与测试集;
基于训练集与测试集,训练初始深度学习网络,以获得深度学习检测模型。
收集自研芯片图像样本,即空间转录组芯片的样本图像,将每张芯片的基准框交点位置标记为检测目标。为了保证检测结果内包含完整的基准框交点,标注是将基准框交点周围区域也纳入标记位置。
针对可能存在的目标形变的问题,对训练集进行手动模拟形变并充入训练集,保证训练集涵盖更多的形变情况。为了避免检测误差影响基准框交点排序,对于四个基准框交点不分别标注,而是统一标注为交点。
输入初始深度学习网络模型进行训练。具体如下:
1)将训练图像集以及对应的样本交点按照9:1的比例拆分成训练集与测试集,用于模型训练与反馈;
2)将图像缩放至设定尺寸;
3)将图像进行上采样与下采样,使模型具有尺度不变性;
4)模型赋予初始权重;
5)图像与标注信息输入神经网络并提取特征;
6)模型训练;
7)根据测试集的测试结果反向调整模型内部权重;
8)返回第5)步,循环训练,直至训练完成。
在一些可选的实施方式中,在确定每一个交点的交点坐标之后,还包括:
提供手动检测工具,用于用户选择是否手动检测交点;
在用户选择手动检测交点后,载入染色图像;
获取用户按交叉点顺序选择的交点位置;
提供微调工具,用于用户对需要调整的点进行微调;
根据最终确定的交点的位置,利用投影变换进行图片矫正;
基于校正后的交点的位置,确定交点的交点坐标。
如果根据软件自动识别出的基准框及组织区域效果不佳,本实施例中,还提供手动检测工具进行手动检测,以获取更精确的结果。该工具能方便用户对基准框及组织区域进行选择和调整,同时提供实时的反馈及引导,以降低手动操作的难度。具体步骤如下:
在用户选择手动检测交点后,载入染色图像并展示图像;
选择四个基准框交点的位置:从左上角开始,在图像上顺时针点选取交点位置;
对点的位置进行微调:选择需要微调的点,在图像上重新点选该点的位置或者在微调框中进行像素级的微调;
根据四个基准框交点的位置利用投影变换进行图像矫正;
基于校正后的交点的位置,确定交点的交点坐标;
输出图像对应的子区域的坐标位置。
在输出图像对应的子区域的坐标位置之后,还包括,手动组织区域检测:
以圈选的方式获取组织区域覆盖的子区域;
对组织区域检测的结果进行子区域增删微调;
输出被组织区域覆盖的子区域列表。
本实施例中,对基准框交点以及组织区域的检测,包含自动和手动两种操作模式,能够在不同情况下提供灵活的处理方式,保证数据分析的准确性和效率。两种工作模式方便用户进行操作和调整,降低了使用难度。
在本实施例中还提供了一种空间转录组芯片的检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种空间转录组芯片的检测装置,如图6所示,包括:
获取模块601,用于获取空间转录组芯片的染色图像,芯片包括若干子区域,芯片中放置有待分析组织;
学习模块602,用于将染色图像输入深度学习检测模型,检测染色图像中基准框的交点,基准框框边的宽度不同,交点为基准框的横基准线与竖基准线的交叉点;
第一确定模块603,用于基于每一个交点的宽度比,校正交点的正确位置顺序,并确定每一个交点的交点坐标;
第二确定模块604,基于交点坐标,确定待检测范围以及待检测范围中每一个子区域的区域坐标;
第三确定模块605,确定待检测范围内的组织区域并确定组织区域的barcode列表,barcode列表中包括与区域坐标一一对应的barcode。
在一些可选的实施方式中,第三确定模块605包括:
灰度单元,用于将染色图像进行灰度处理,获得灰度图像;
轮廓单元,用于检测待检测范围内的所有轮廓,获得多个轮廓区域;
叠加单元,用于将轮廓区域按照轮廓面积,从大到小依次叠加至初始化区域,初始化区域与染色图像尺寸相同,且灰度值为0;
计算单元,用于每向初始化区域中叠加一个轮廓区域,则生成由已叠加的所有所述轮廓区域围成的多边形区域,并将所述多边形区域内部的灰度值设置为255,并计算添加后的初始化区域与染色图像的Pearson相关系数;
获得单元,用于当Pearson相关系数达到预设阈值后停止添加,获得目标多边形区域;
区域单元,用于在目标多边形区域基础上,确定组织区域。
在一些可选的实施方式中,还包括:
样本模块,用于获取若干空间转录组芯片的样本图像;
标记模块,用于标记每一个样本图像中基准框的交点,并作为样本交点;
划分模块,用于将样本图像以及对应的样本交点,按照预设比例,划分为训练集与测试集;
训练模块,用于基于训练集与测试集,训练初始深度学习网络,以获得深度学习检测模型。
本实施例中的空间转录组芯片的检测装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本发明实施例还提供一种计算机设备,具有上述图6所示的空间转录组芯片的检测装置。
请参阅图7,图7是本发明可选实施例提供的一种计算机设备的结构示意图,如图7所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据一种小程序落地页的展现的计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种空间转录组芯片的检测方法,其特征在于,所述方法包括:
获取空间转录组芯片的染色图像,所述芯片包括若干子区域,所述芯片中放置有待分析组织;
将所述染色图像输入深度学习检测模型,检测所述染色图像中基准框的交点,所述基准框框边的宽度不同,所述交点为所述基准框的横基准线与竖基准线的交叉点;
基于每一个所述交点的宽度比,校正所述交点的正确位置顺序,并确定每一个所述交点的交点坐标;
基于所述交点坐标,确定待检测范围以及所述待检测范围中每一个子区域的区域坐标;
确定待检测范围内的组织区域并确定所述组织区域的barcode列表,所述barcode列表中包括与所述区域坐标一一对应的barcode。
2.根据权利要求1所述的方法,其特征在于,所述确定待检测范围内的组织区域,包括:
将所述染色图像进行灰度处理,获得灰度图像;
检测所述待检测范围内的所有轮廓,获得多个轮廓区域;
将所述轮廓区域按照轮廓面积,从大到小依次叠加至初始化区域,所述初始化区域与所述染色图像尺寸相同,且灰度值为0;
每向所述初始化区域中叠加一个所述轮廓区域,则生成由已叠加的所有所述轮廓区域围成的多边形区域,将所述多边形区域内部的灰度值设置为255,并计算叠加后的所述多边形区域与所述染色图像的Pearson相关系数;
当所述Pearson相关系数达到预设阈值后停止添加,获得目标多边形区域;
在所述目标多边形区域基础上,确定所述组织区域。
3.根据权利要求2所述的方法,其特征在于,所述在所述目标多边形区域基础上,确定所述组织区域,包括:
确定所述目标多边形区域中每一个所述子区域对应的非0灰度值的占比;
若所述占比大于预设值,则确定对应的所述子区域为组织子区域;
若所述占比小于所述预设值,则确定对应的所述子区域为非组织子区域;
将所有所述组织子区域对应的区域,作为所述组织区域。
4.根据权利要求3所述的方法,其特征在于,对根据所述占比确定的所述组织子区域再次进行筛选:
计算每一个所述组织子区域的平均灰度值;
基于所述平均灰度值,统计所有所述组织子区域的第一均值和所有所述非组织子区域的第二均值;
基于所述平均灰度值、所述第一均值、所述第二均值,计算信任值;
将达到信任值阈值的子区域,确定为最终的所述组织子区域。
5.根据权利要求1所述的方法,其特征在于,所述基于所述交点坐标,确定待检测范围,包括:
基于所述交点坐标,确定感兴趣区域;
根据所述感兴趣区域内灰度值的变化,检测出横直线与竖直线;
确定所述横直线与所述竖直线的交叉区域;
基于所述交叉区域,校正所述交点坐标,获得校正后的交点坐标;
将所述校正后的交点坐标对应的感兴趣区域,作为所述待检测范围。
6.根据权利要求1所述的方法,其特征在于,所述深度学习检测模型通过以下步骤建立:
获取若干空间转录组芯片的样本图像;
标记每一个所述样本图像中基准框的交点,并作为样本交点;
将所述样本图像以及对应的所述样本交点,按照预设比例,划分为训练集与测试集;
基于所述训练集与所述测试集,训练初始深度学习网络,以获得所述深度学习检测模型。
7.根据权利要求1所述的方法,其特征在于,在所述确定每一个所述交点的交点坐标之后,还包括:
提供手动检测工具,用于用户选择是否手动检测所述交点;
在用户选择手动检测所述交点后,载入所述染色图像;
获取用户按交叉点顺序选择的交点位置;
提供微调工具,用于用户对需要调整的点进行微调;
根据最终确定的所述交点的位置,利用投影变换进行图片矫正;
基于校正后的所述交点的位置,确定所述交点的交点坐标。
8.一种空间转录组芯片的检测装置,其特征在于,所述装置包括:
获取模块,用于获取空间转录组芯片的染色图像,所述芯片包括若干子区域,所述芯片中放置有待分析组织;
学习模块,用于将所述染色图像输入深度学习检测模型,检测所述染色图像中基准框的交点,所述基准框框边的宽度不同,所述交点为所述基准框的横基准线与竖基准线的交叉点;
第一确定模块,用于基于每一个所述交点的宽度比,校正所述交点的正确位置顺序,并确定每一个所述交点的交点坐标;
第二确定模块,基于所述交点坐标,确定待检测范围以及所述待检测范围中每一个子区域的区域坐标;
第三确定模块,确定待检测范围内的组织区域并确定所述组织区域的barcode列表,所述barcode列表中包括与所述区域坐标一一对应的barcode。
9.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-7任一项所述的空间转录组芯片的检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-7任一项所述的空间转录组芯片的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311545931.5A CN117523557A (zh) | 2023-11-20 | 2023-11-20 | 一种空间转录组芯片的检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311545931.5A CN117523557A (zh) | 2023-11-20 | 2023-11-20 | 一种空间转录组芯片的检测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117523557A true CN117523557A (zh) | 2024-02-06 |
Family
ID=89741541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311545931.5A Pending CN117523557A (zh) | 2023-11-20 | 2023-11-20 | 一种空间转录组芯片的检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117523557A (zh) |
-
2023
- 2023-11-20 CN CN202311545931.5A patent/CN117523557A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7422825B2 (ja) | 顕微鏡スライド画像のための焦点重み付き機械学習分類器誤り予測 | |
CN111448582B (zh) | 用于单通道全细胞分割的系统和方法 | |
CN108961180B (zh) | 红外图像增强方法及系统 | |
CN107590512B (zh) | 一种模板匹配中参数的自适应方法和系统 | |
EP3506165A1 (en) | Using a first stain to train a model to predict the region stained by a second stain | |
US20220335600A1 (en) | Method, device, and storage medium for lesion segmentation and recist diameter prediction via click-driven attention and dual-path connection | |
EP2263191A1 (en) | System and method for identifying complex tokens in an image | |
JP5852919B2 (ja) | ひび割れ検出方法 | |
CN110189341B (zh) | 一种图像分割模型训练的方法、图像分割的方法及装置 | |
WO2018207261A1 (ja) | 画像解析装置 | |
CN112215217B (zh) | 模拟医师阅片的数字图像识别方法及装置 | |
CN110599453A (zh) | 一种基于图像融合的面板缺陷检测方法、装置及设备终端 | |
CN112183557A (zh) | 基于胃癌组织病理图像纹理特征的msi预测模型构建方法 | |
CN116740728B (zh) | 一种用于晶圆读码器动态获取方法和系统 | |
CN114764789B (zh) | 病理细胞的量化方法、系统、装置及存储介质 | |
CN115170548A (zh) | 基于无监督学习的皮革缺陷自动检测方法及装置 | |
CN113205511B (zh) | 基于深层神经网络的电子元器件批量信息检测方法及系统 | |
WO2013148485A2 (en) | Detection of tissue regions in microscope slide images | |
CN112699919B (zh) | 基于三维卷积神经网络模型的木材鉴别方法、装置 | |
CN112435214A (zh) | 基于先验框线性缩放的花粉检测方法、装置和电子设备 | |
CN117523557A (zh) | 一种空间转录组芯片的检测方法、装置、设备及介质 | |
CN114897797A (zh) | 印刷电路板的缺陷检测方法、装置、设备及存储介质 | |
CN107527365A (zh) | 一种动态计算类圆物体形态学直径的方法及装置 | |
CN112200803A (zh) | 精子核蛋白成熟度检测方法及装置 | |
CN112184708B (zh) | 精子存活率检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |