CN114496099A - 细胞功能注释方法、装置、设备及介质 - Google Patents

细胞功能注释方法、装置、设备及介质 Download PDF

Info

Publication number
CN114496099A
CN114496099A CN202210094184.7A CN202210094184A CN114496099A CN 114496099 A CN114496099 A CN 114496099A CN 202210094184 A CN202210094184 A CN 202210094184A CN 114496099 A CN114496099 A CN 114496099A
Authority
CN
China
Prior art keywords
sequencing
gene
matrix
data
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210094184.7A
Other languages
English (en)
Inventor
沈荣波
姚建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210094184.7A priority Critical patent/CN114496099A/zh
Publication of CN114496099A publication Critical patent/CN114496099A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请公开了一种细胞功能注释方法、装置、设备及介质,涉及人工智能领域。方法包括:获取组织样本的测序数据,所述测序数据中包含各个测序点的基因表达数据以及空间位置数据,所述测序点对应至少一个细胞;基于所述测序数据生成所述组织样本的基因测序矩阵,所述基因测序矩阵用于表征所述组织样本中不同空间位置处的基因分布情况;基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果。采用本申请实施例提供的方案能够提高细胞功能注释的准确性。

Description

细胞功能注释方法、装置、设备及介质
技术领域
本申请实施例涉及人工智能领域,特别涉及一种细胞功能注释方法、装置、设备及介质。
背景技术
对细胞的转录组测序数据进行分析,从分子层面得知细胞的基因选择性表达,进而从分子层面对细胞进行分类的过程被称为细胞功能注释。
相关技术中,进行细胞功能注释前,首先借助于组织样本的高倍成像技术(例如组织切片成像、共聚焦荧光成像等),在多空间位点抽取细胞,分别进行单细胞转录组测序,得到单细胞空间转录组数据;然后采用聚类方式对单细胞空间转录组数据进行分析,得到细胞功能注释。
然而,由于细胞功能由细胞的基因选择性表达、组织中多细胞间的相互作用共同决定,因此采用聚类方式进行细胞功能注释的准确性较差。
发明内容
本申请实施例提供了一种细胞功能注释方法、装置、设备及介质,能够提高细胞功能注释的准确性。所述技术方案如下:
一方面,本申请实施例提供了一种细胞功能注释方法,所述方法包括:
获取组织样本的测序数据,所述测序数据中包含各个测序点的基因表达数据以及空间位置数据,所述测序点对应至少一个细胞;
基于所述测序数据生成所述组织样本的基因测序矩阵,所述基因测序矩阵用于表征所述组织样本中不同空间位置处的基因分布情况;
基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果。
另一方面,本申请实施例提供了一种细胞功能注释装置,所述装置包括:
第一获取模块,用于获取组织样本的测序数据,所述测序数据中包含各个测序点的基因表达数据以及空间位置数据,所述测序点对应至少一个细胞;
第一生成模块,用于基于所述测序数据生成所述组织样本的基因测序矩阵,所述基因测序矩阵用于表征所述组织样本中不同空间位置处的基因分布情况;
第一注释模块,用于基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上述方面所述的细胞功能注释方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上述方面所述的细胞功能注释方法。
另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面提供的细胞功能注释方法。
本申请实施例中,获取到组织样本的测序数据后,基于测序数据生成组织样本的基因测序矩阵,由于基因测序矩阵能够反映组织样本中不同空间位置处的基因分布情况,即基因测序矩阵融合了基因表达和空间位置这两个模态的数据,且深度学习在处理结构化数据时具备优势,因此通过深度学习方式,基于基因测序矩阵进行细胞功能注释时,能够综合考虑组织样本的全局特征以及局部细胞群的局部特征,有助于提高细胞功能注释的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例示出的细胞功能注释过程的原理示意图;
图2是本申请一个示例性实施例提供的实施环境的示意图;
图3是本申请一个示例性实施例提供的细胞功能注释方法的流程图;
图4是本申请一个示例性实施例示出的原位捕获技术中捕获点与细胞的示意图;
图5是本申请一个示例性实施例示出的组织样本中不同功能区域的示意图;
图6是本申请另一个示例性实施例提供的细胞功能注释方法的流程图;
图7是本申请一个示例性实施例示出的基因测序矩阵生成以及降维过程的实施示意图;
图8是本申请一个示例性实施例示出的功能分割模型的结构示意图;
图9是本申请一个示例性实施例示出的功能分割模型训练过程的流程图;
图10是本申请一个示例性实施例示出的掩膜生成过程实施示意图;
图11是本申请另一个示例性实施例示出的细胞功能注释过程的原理示意图;
图12是本申请一个示例性实施例提供的细胞功能注释装置的结构框图;
图13示出了本申请一个示例性实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
本申请实施例提供的方案,即机器学习/深度学习在医学领域的应用,用于通过深度学习方法对组织样本的基因测序矩阵(基于组织样本的测序数据生成)进行细胞功能注释,确定组织样本中各个细胞的细胞功能。
如图1所示,本申请实施例提供的细胞功能注释方案中,通过测序仪器对组织样本11进行测序后,得到包含基因表达数据12以及空间位置数据13的测序数据。计算机设备通过对基因表达数据12以及空间位置数据13这两种模态的数据进行融合(融合过程中需要进行一系列的数据预处理),得到组织样本11对应的基因测序矩阵14。进一步的,利用深度学习在处理结构化数据时的优势,计算机设备将基因测序矩阵14输入预先训练得到的功能分割模型15,由功能分割模型进行功能区域分割,得到组织样本11中细胞(或细胞群)对应的细胞功能注释结果16。由于功能分割模型进行功能区域分割时,能够综合考虑组织样本的全局特征以及局部细胞群的局部特征,因此相较于聚类算法,采用本申请实施例提供的方案能够提高细胞功能注释的准确性。
图2示出了本申请一个示例性实施例提供的实施环境的示意图。该实施环境中包括终端210和服务器220。其中,终端210与服务器220之间通过通信网络进行数据通信,可选地,通信网络可以是有线网络也可以是无线网络,且该通信网络可以是局域网、城域网以及广域网中的至少一种。
终端210是具有细胞功能注释需求的电子设备,该电子设备可以是智能手机、平板电脑或个人计算机等等,本实施例并此不作限定。图2中,以终端210为科研人员使用的个人计算机为例进行说明。
服务器220可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。本实施例中,服务器220是用于提供细胞功能标注服务的服务器。
在一些实施例中,如图2所示,当需要对组织样本中的细胞进行功能注释,或者,需要对组织样本进行功能区域划分时,科研人员即通过测序设备对组织样本进行测序,得到测序数据,并将测序数据导入终端210。终端210将测序数据上传至服务器220,由服务器220对测序数据进行数据预处理和数据融合,得到基因测序矩阵。服务器220将基因测序矩阵输入预先训练得到功能分割模型,由功能分割模型进行功能分割,得到细胞功能注释结果。服务器220将细胞功能注释结果反馈至终端210,供终端210进行展示。
在其他可能的实施方式中,也可以由终端210对测序数据进行预处理并生成基因测序矩阵,从而将基因测序矩阵上报至服务器220,由服务器220进行细胞功能注释,或者,由终端210独立执行细胞功能注释,本实施例对此不作限定。为了方便表述,下述各个实施例以细胞功能注释方法由计算机设备执行为例进行说明。
图3示出了本申请一个示例性实施例提供的细胞功能注释方法的流程图。本实施例以该方法用于计算机设备为例进行说明,该方法包括如下步骤。
步骤301,获取组织样本的测序数据,测序数据中包含各个测序点的基因表达数据以及空间位置数据,测序点对应至少一个细胞。
其中,该组织样本可以是脑部组织切片、肿瘤组织切片等病理切片,本申请实施例对组织样本的具体类型不作限定。
测序数据由基因测序设备对组织样本进行测序得到。可选的,该测序数据通过空间转录组测序技术采集得到,包括但不限于:seqFISH、MERFISH、seqFISH+、osmFISH、Slide-seq、Visium、STARmap、HDST。本申请实施例并不对测序数据的具体类型进行限定。
在一些实施例中,测序数据中包含各个测序点对应的基因表达数据以及空间位置数据,其中,该基因表达数据用于表征在测序点处测序得到转录本对应的基因,空间位置数据则用于表征测序点在组织样本中所处的空间位置。
在一种可能的实施方式中,计算机设备根据测序点处测序得到的转录本,确定转录本对应的基因(属于预先设置的基因库,且不同转录本可能对应同一基因),从而得到该测序点对应的基因表达数据,该基因表达数据可以采用长度为N的一维向量表示,N为基因库中的基因数量,且一维向量中各个位置值表示基因的数量。
在一些实施例中,该测序数据采用原位捕获技术采集得到。当原位捕获技术的分辨率较高时,该测序点对应单个细胞(即针对单个细胞进行测序,单个细胞可能覆盖原位捕获的多个捕获点);当原位捕获技术的分辨率较低时,该测序点对应若干细胞(bulkdata)。示意性的,如图4所示,当原位捕获技术下,捕获点41之间的间距为0.5um,对单个细胞42进行测序时,由于细胞的平均直径在10-20um之间,因此细胞42覆盖超过10×10个捕获点41。
步骤302,基于测序数据生成组织样本的基因测序矩阵,基因测序矩阵用于表征组织样本中不同空间位置处的基因分布情况。
由于细胞功能由细胞的基因选择性表达、组织中多细胞间的相互作用共同决定,因为为了提高细胞功能注释的准确性,计算机设备对测序数据中基因表达数据以及空间位置数据这两种模态的数据进行融合,构建得到表征组织样本中不同空间位置处基因分布情况的基因测序矩阵,以便后续基于该基因测序矩阵进行功能注释。
在一些实施例中,该基因测序矩阵为三维矩阵,且尺寸为H×W×C,其中,H和W可以是以测序点为度量单位(通常在分辨率较低的情况下,表征测序点在组织样本中所处的空间位置),也可以以细胞为度量单位(通常在分辨率较高的情况下,表征细胞在组织样本中所处的位置);C为通道数,且每种基因对应各自的通道。
可选的,基于测序数据生成基因测序矩阵前,计算机设备还需要对测序数据进行数据预处理,以此消除测序数据采集过程中引入的噪声,提高后续功能注释的准确性,下述实施例将进行详述。
步骤303,基于基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果。
由于深度学习在处理结构化数据时具备更好的表现,因此本申请实施例中,计算机设备通过深度学习方式,基于基因测序矩阵对组织样本进行细胞功能注释,得到细胞功能注释结果。
可选的,该细胞功能注释结果与测序点相对应。其中,当测序点对应单细胞时,测序点对应的细胞功能注释结果用于表征单细胞的细胞功能;当测序点对应多个细胞时,测序点对应的细胞功能注释结果用于表征细胞群的细胞功能。
在一种可能的实施方式中,计算机设备预先基于训练样本,通过深度学习方式训练得到深度学习模型,从而利用深度学习模型基于结构化的基因测序矩阵进行细胞功能注释。
在一些实施例中,计算机设备可以根据细胞功能注释结果,对组织样本进行功能区域划分,并对划分出的功能区域进行可视化展示。示意性的,图5中不同灰度区域表征组织样本中不同的功能区域。
综上所述,本申请实施例中,获取到组织样本的测序数据后,基于测序数据生成组织样本的基因测序矩阵,由于基因测序矩阵能够反映组织样本中不同空间位置处的基因分布情况,即基因测序矩阵融合了基因表达和空间位置这两个模态的数据,且深度学习在处理结构化数据时具备优势,因此通过深度学习方式,基于基因测序矩阵进行细胞功能注释时,能够综合考虑组织样本的全局特征以及局部细胞群的局部特征,有助于提高细胞功能注释的准确性。
由于进行测序数据采集过程中可能会引入噪声,而测序数据中的噪声会影响后续功能注释的准确性,因此基于测序数据生成基因测序矩阵前,计算机设备需要对测序数据进行质量控制(即数据预处理),以消除数据采集过程中引入的噪声。并且,由于不同基因对细胞功能的影响程度不同,因此为了进一步降低后续细胞功能注释时的计算量,计算机设备需要进行基因选择,以此降低基因测序矩阵的维度。下面采用示例性的实施例对上述过程进行说明。
图6示出了本申请另一个示例性实施例提供的细胞功能注释方法的流程图。本实施例以该方法用于计算机设备为例进行说明,该方法包括如下步骤。
步骤601,获取组织样本的测序数据,测序数据中包含各个测序点的基因表达数据以及空间位置数据,测序点对应至少一个细胞。
本步骤的实施方式可以参考上述步骤301,本实施例在此不再赘述。
步骤602,对基因表达数据以及空间位置数据进行数据对齐。
在一种可能的实施方式中,计算机设备对基因表达数据以及空间位置数据进行数据对齐,确定细胞中各种基因的基因表达量,从而构建得到细胞(或细胞群)对应的基因表达向量,该基因表达向量可以为长度为N的一维向量,N为基因库中基因的总数量。
比如,当基因库(预先设置)中包含10000种基因时,细胞的基因表达向量为长度为10000的一维向量。当一维向量中第一位为10时,表示该细胞中第一基因的基因表达量为10,当一维向量中第二位为0时,表示该细胞中不包含第二基因。
步骤603,基于数据对齐后的基因表达数据以及空间位置数据,过滤测序点中的异常测序点。
单个细胞的转录本数量或转录本对应基因的基因表达量通常位于一定范围内,而当多个细胞重叠、细胞死亡或细胞提前破裂导致mRNA提前扩散时,会导致单个细胞的转录本数量或基因表达量超出范围,进而影响后续功能注释的准确性。因此,计算机设备完成数据对齐后,需要对测序点进行异常识别,从而过滤其中的异常测序点。在一种可能的实施方式中,计算机设备过滤异常测序点可以包括如下步骤:
1、基于数据对齐后的基因表达数据以及空间位置数据,确定各个细胞的转录本数量和基因表达量。
可选的,计算机设备基于对齐后的数据,对细胞内转录本的总量以及转录本对应基因的总量进行统计,得到转录本数量以及基因表达量。
2、将转录本数量不属于数量区间,或,基因表达量不属于表达量区间的细胞确定为异常细胞。
在一种可能的实施方式中,计算机设备设置有正常细胞中转录本的数量区域,以及正常细胞中基因的表达量区间。当细胞的转录本数量位于该数量区间,且基因表达量位于该表达量区间时,计算机确定该细胞为正常细胞;当细胞的转录本数量位于该数量区间之外,或基因表达量位于该表达量区间之外时,计算机确定该细胞为异常细胞。其中,该数量区域和表达量区域可以由研发人员预先设置。比如,该数量区间为2000-10000,该表达量区间为50-200,本实施例对此并不构成限定。
3、过滤异常细胞对应的异常测序点。
进一步的,计算机设备将异常细胞对应的测序点确定为异常测序点,并对异常测序点进行过滤。后续生成的基因测序矩阵中即不包含异常测序点对应的测序数据。
步骤604,基于数据对齐后的基因表达数据以及空间位置数据,生成基因对应的基因分布矩阵,基因分布矩阵用于表征不同空间位置上基因的基因表达量。
完成属于预处理后,计算机设备确定组织样本中细胞包含的所有基因,并确定各种基因在组织样本中不同空间位置的基因表达量,生成各种基因各自对应的基因分布矩阵(二维矩阵)。其中,该基因分布矩阵的尺寸为H×W。
在一种可能的实施方式中,当以细胞为单位时,计算机设备对组织样本中各个细胞包含的基因进行去重,确定该组织样本包含基因的基因类型总量,从而根据同一种基因在不同细胞中的数量生成基因分布矩阵。比如,基因1对应的基因分布矩阵即用于表示组织样本中各个细胞中基因1的基因表达量。
示意性的,如图7所示,计算机设备确定组织样本的基因类型总量为C,并针对每一种基因生成对应的基因分布矩阵,该基因分布矩阵中不同矩阵位置对应不同空间位置,共计生成C个基因分布矩阵。
步骤605,基于不同基因对应的基因分布矩阵,生成基因测序矩阵,基因测序矩阵为三维矩阵。
进一步的,计算机设备对不同基因对应的基因分布矩阵进行三维拼接,得到三维的基因测序矩阵,其中,基因测序矩阵中每一个通道对应的二维矩阵即为基因对应的基因分布矩阵。
示意性的,如图7所示,计算机设备对C个H×W的基因分布矩阵进行三维拼接,得到H×W×C的基因测序矩阵。
可选的,为了消除在不同空间位置处进行测序数据采集时的差异性(可能由RNA分离不均衡、测序深度不一致等原因造成),计算机设备首先对各个基因分布矩阵中的基因表达量进行归一化(normalization)处理,得到归一化基因分布矩阵,然后对归一化基因分布矩阵进行三维拼接,得到基因测序矩阵。
步骤606,基于基因测序矩阵,确定高表达且高可变基因。
通过上述步骤构建得到的基因测序矩阵的维度通常较高,直接基于该基因测序矩阵进行功能注释的运算量较大。并且,基因测序矩阵中可能包含大量对功能注释影响较小的基因,过滤这部分基因对应的测序数据并不会对功能注释的准确性造成影响。因此,在保证功能注释准确性的前提下,为了降低运算量,计算机设备进一步基因筛选,降低基因测序矩阵的维度。
由于细胞功能受高表达基因以及高可变基因的影响较大,因此本申请实施例中,计算机设备基于基因测序矩阵筛选出高表达且高可变基因。可选的,该过程可以包括如下步骤:
1、基于基因测序矩阵,确定各个基因的平均表达强度以及可变性方差,平均表达强度基于基因总表达量和测序点数量确定得到,可变性方差用于表征不同测序点处同一基因的基因表达量差异。
在一种可能的实施方式中,对于基因测序矩阵中的每一个通道,计算机设备对该通道对应基因分布矩阵中各个矩阵位置的数值求和,得到该基因的基因总表达量,从而基于基因总表达量和测序点数量确定该基因的平均表达强度。进一步的,计算机设备基于各个测序点处基因的基因表达量以及平均表达强度,确定该基因对应可变性方差,其中,可变性方差越大,表明不同测序点处同一基因的基因表达量差异越大。
2、基于平均表达强度和可变性方差确定高表达且高可变基因。
在一种可能的实施方式中,计算机设备将平均表达强度高于强度阈值,且可变性方差大于方差阈值的基因确定为高表达且高可变基因。其中,强度阈值和方差阈值可以由研发人员自定义。
在另一种可能的实施方式中,计算机设备将平均表达强度前k1的基因确定为高表达基因,然后将高表达基因中可变性方差前k1的基因确定为高表达且高可变基因。
当然,计算机设备可以采用图表分析等其他方式确定出高表达且高可变基因,本申请实施例并不对此构成限定。
步骤607,基于高表达且高可变基因对基因测序矩阵进行降维处理,其中,降维处理后的基因测序矩阵中包含高表达且高可变基因对应的基因分布矩阵。
确定出高表达且高可变基因后,计算机设备删除基因测序矩阵中高表达且高可变基因以外其他基因对应的基因分布矩阵,从而得到降维处理后的基因测序矩阵。
示意性的,如图7所示,计算机设备根据确定出的C’个高表达且高可变基因对基因测序矩阵进行降维处理,得到H×W×C’的基因测序矩阵。
步骤608,将基因测序矩阵输入功能分割模型,得到功能分割模型输出的功能分割结果,功能分割模型通过深度学习方式训练得到,功能分割结果中包含测序点对应的细胞功能注释结果。
在一种可能的实施方式中,计算机设备中设置有通过深度学习方式训练得到的功能分割模型。计算机设备将基因测序矩阵作为功能分割模型的输入,通过功能分割模型对各个测序点对应的细胞进行功能注释,并输出细胞功能注释结果。基因测序矩阵可以看做多通道图像,而功能分割模型则用于对多通道图像进行像素级标注。
可选的,该功能分割模型包括多个卷积层构成的编码器(encoder)以及多个反卷积层构成的解码器(decoder)。如图8所示,编码器82中的卷积层用于对输入的基因测序矩阵81进行滑窗卷积运算,然后使用池化层降低维度,最终编码器82输出维度低于基因测序矩阵81的特征图。编码器82这种分层的计算操作获得了一种非线性、局部到全局的特征映射,融合了局部感知的显著性特征和全局风格。解码器83中反卷积层对编码器82的输出的特征图进行滑窗反卷积运算,逐步将特征图尺寸还原到原始输入尺寸,在此过程中可从编码器82中引入一些卷积层的特征图进行融合,提升解码器83的识别分辨率(即U-net结构)。功能分割模型使用softmax多元分类器将解码器83的输出归一化,得到功能分割结果84。
需要说明的是,功能分割模型除了采用上述全卷机网络外,还可以采用EfficientNet,ResNet和DenseNet等其他网络结构,本申请实施例并不对功能分割模型的具体网络结构进行限定。
本实施例中,计算机设备基于测序数据生成基因测序矩阵前,基于细胞的转录本数量以及基因表达量,过滤异常测序点,避免异常测序点的测序数据对后续功能注释造成影响,有助于提高功能注释的准确性。
并且,计算机设备通过识别高表达且高可变基因,实现对基因测序矩阵的降维,避免后续对低表达、低可变基因对应的数据进行运算造成的运算资源浪费,并有助于提高功能注释的速度。
在一种可能的实施方式中,如图9所示,功能分割模型的训练过程可以包括如下步骤。
步骤901,基于标准功能分区图,生成训练样本对应的功能分割掩膜,标准功能分区图对应的标准样本与训练样本属于同一组织类型,功能分割掩膜包含训练样本中各个样本测序点对应的细胞功能注释。
模型训练前,计算机设备首先基于与训练样本属于同一组织类型的标准样本对应的标准功能分区图,生成功能分割掩膜(mask),该功能分割掩膜即为模型训练的真值(groundtruth)。比如,当训练样本为脑部组织样本时,该标准功能分区图则用于指示标准脑部组织样本中各个功能分区的划分情况。
由于标准样本与训练样本并非完全一致,即标准样本与训练样本的组织轮廓存在差异,因此计算机设备需要对标准功能分区图和训练样本进行图像空间对齐,使标准功能分区图的轮廓与训练样本的轮廓匹配,从而基于图像空间对齐后的标准功能分区图,生成训练样本对应的功能分割掩膜。
可选的,图像空间对齐方式可以包括旋转、缩放、仿射变换等等,本实施例对此不作限定。
可选的,计算机设备根据标准功能分区与训练样本图像之间的映射关系,将功能标签赋予训练样本中功能分区内的测序点,从而得到功能分割掩膜。
示意性的,如图10所示,计算机设备对标准功能分区图1001和训练样本1002进行图像空间对齐,并在对齐后进行功能分区映射,得到功能分割掩膜1003。
步骤902,获取训练样本的样本测序数据。
训练过程中获取到样本测序数据与实际应用过程中获取的测试数据类似,本实施例在此不作赘述。
步骤903,基于样本测序数据生成训练样本的样本基因测序矩阵。
训练过程中生成样本基因测序矩阵的过程可以参考上述应用过程,本实施例在此不作赘述。
步骤904,将样本基因测序矩阵输入功能分割模型,得到功能分割模型输出的功能分割预测结果。
本步骤的实施过程可以参考上述步骤608,本实施在此不作赘述。
步骤905,将功能分割掩膜作为功能分割预测结果的监督,训练功能分割模型。
在一种可能的实施方式中,计算机设备计算功能分割预测结果与功能分割掩膜之间的分割损失,从而基于分割损失,采用反向传播算法对功能分割模型的模型参数进行更新。当满足训练结束条件时(达到迭代轮数,或者参数收敛),计算机设备停止模型训练。其中,该分割损失可以为交叉熵损失。
为了进一步提高功能注释的准确性,在一种可能的实施方式中,计算机设备还可以获取组织样本中细胞的细胞形态学特征以及细胞纹理特征,并对细胞形态学特征、细胞纹理特征和基因测序矩阵进行特征融合,得到融合特征矩阵,从而将融合特征矩阵输入功能分割模型,得到功能分割模型输出的功能分割结果。其中,在进行特征融合时,计算机设备需要将细胞纹理特征和细胞形态学特征对齐基因测序矩阵上的每一个测序点。
在一些实施例中,细胞形态学特征通过对细胞轮廓进行特征提取得到。比如,该细胞形态学特征通过openCV等图像处理工具提取得到,包括但不限于:细胞面积、细胞周长、细胞轮廓复杂度、细胞等价直径、细胞椭圆度、细胞极性等等。
在一些实施例中,细胞纹理特征基于组织样本图像中细胞范围内像素点的像素值确定得到,其中,组织样本图像可使用各种染色方式和各种原始分辨率,包括但不限于:H&E染色、ssDNA染色、DAPI染色等,原始分辨率可为显微镜10倍镜、20倍镜、40倍镜等。
可选的,细胞纹理特征可以采用局部二值化(Local Binary Pattern,LBP)算法计算得到。比如,计算机设备比较一个像素点与周围8个像素点的像素值的大小,得到该像素点对应的8bit二值化编码,并将该二值化编码转化为0-255的整数,从而将该整数作为LBP图中该像素点的LBP值。最后,计算机设备对细胞范围内所有像素点的LBP值进行直方图转换,得到细胞的纹理特征向量。
在一个示意性的例子中,如图11所示,通过测序仪器对组织样本11进行测序后,得到包含基因表达数据12以及空间位置数据13的测序数据。计算机设备通过对基因表达数据12以及空间位置数据13这两种模态的数据进行融合(融合过程中需要进行一系列的数据预处理),得到组织样本11对应的基因测序矩阵14。同时,计算机设备对组织样本11的图像进行形态学特征提取,得到细胞形态学特征17,对组织样本11的图像进行纹理特征提取,得到细胞纹理特征18。进一步的,计算机设备对基因测序矩阵14、细胞形态学特征17以及细胞纹理特征18进行融合,得到融合特征矩阵19。计算机设备将融合特征矩阵19输入预先训练得到的功能分割模型15,由功能分割模型进行功能区域分割,得到组织样本11中细胞(或细胞群)对应的细胞功能注释结果16。
需要说明的是,当功能分割模型的输入为融合特征矩阵时,模型训练过程中,同样需要对训练样本进行形态学以及纹理特征提取,并将样本细胞形态学特征、样本细胞纹理特征以及样本基因测序矩阵进行融合,本实施例对此不作赘述。
图12是本申请一个示例性实施例提供的细胞功能注释装置的结构框图,该装置包括:
第一获取模块1201,用于获取组织样本的测序数据,所述测序数据中包含各个测序点的基因表达数据以及空间位置数据,所述测序点对应至少一个细胞;
第一生成模块1202,用于基于所述测序数据生成所述组织样本的基因测序矩阵,所述基因测序矩阵用于表征所述组织样本中不同空间位置处的基因分布情况;
第一注释模块1203,用于基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果。
可选的,所述第一生成模块1202,包括:
数据对齐单元,用于对所述基因表达数据以及所述空间位置数据进行数据对齐;
第一生成单元,用于基于数据对齐后的所述基因表达数据以及所述空间位置数据,生成基因对应的基因分布矩阵,所述基因分布矩阵用于表征不同空间位置上所述基因的基因表达量;
第二生成单元,用于基于不同基因对应的所述基因分布矩阵,生成所述基因测序矩阵,所述基因测序矩阵为三维矩阵。
可选的,所述第一生成模块1202,还包括:
过滤单元,用于基于数据对齐后的所述基因表达数据以及所述空间位置数据,过滤所述测序点中的异常测序点。
可选的,所述过滤单元,用于:
基于数据对齐后的所述基因表达数据以及所述空间位置数据,确定各个细胞的转录本数量和基因表达量;
将所述转录本数量不属于数量区间,或,基因表达量不属于表达量区间的细胞确定为异常细胞;
过滤所述异常细胞对应的所述异常测序点。
可选的,所述第二生成单元,用于:
对各个所述基因分布矩阵中的所述基因表达量进行归一化处理,得到归一化基因分布矩阵;
对所述归一化基因分布矩阵进行三维拼接,得到所述基因测序矩阵。
可选的,所述装置还包括:
确定模块,用于基于所述基因测序矩阵,确定高表达且高可变基因;
降维模块,用于基于所述高表达且高可变基因对所述基因测序矩阵进行降维处理,其中,降维处理后的所述基因测序矩阵中包含所述高表达且高可变基因对应的所述基因分布矩阵。
可选的,所述确定模块,包括:
第一确定单元,用于基于所述基因测序矩阵,确定各个基因的平均表达强度以及可变性方差,所述平均表达强度基于基因总表达量和测序点数量确定得到,所述可变性方差用于表征不同测序点处同一基因的基因表达量差异;
第二确定单元,用于基于所述平均表达强度和所述可变性方差确定所述高表达且高可变基因。
可选的,所述第一注释模块1203,用于:
将所述基因测序矩阵输入功能分割模型,得到所述功能分割模型输出的功能分割结果,所述功能分割模型通过深度学习方式训练得到,所述功能分割结果中包含所述测序点对应的所述细胞功能注释结果。
可选的,所述装置还包括:
掩膜生成模块,用于基于标准功能分区图,生成训练样本对应的功能分割掩膜,所述标准功能分区图对应的标准样本与所述训练样本属于同一组织类型,所述功能分割掩膜包含所述训练样本中各个样本测序点对应的细胞功能注释;
第二获取模块,用于获取所述训练样本的样本测序数据;
第二生成模块,用于基于所述样本测序数据生成所述训练样本的样本基因测序矩阵;
第二注释模块,用于将所述样本基因测序矩阵输入所述功能分割模型,得到所述功能分割模型输出的功能分割预测结果;
训练模块,用于将所述功能分割掩膜作为所述功能分割预测结果的监督,训练所述功能分割模型。
可选的,所述掩膜生成模块,用于:
对所述标准功能分区和所述训练样本进行图像空间对齐;
基于图像空间对齐后的所述标准功能分区,生成所述训练样本对应的所述功能分割掩膜。
可选的,所述装置还包括:
第三获取模块,用于获取所述组织样本中细胞的细胞形态学特征以及细胞纹理特征,所述细胞形态学特征通过对细胞轮廓进行特征提取得到,所述细胞纹理特征基于组织样本图像中细胞范围内像素点的像素值确定得到;
所述第一注释模块1203,还用于:
对所述细胞形态学特征、所述细胞纹理特征和所述基因测序矩阵进行特征融合,得到融合特征矩阵;
将所述融合特征矩阵输入功能分割模型,得到所述功能分割模型输出的功能分割结果,所述功能分割模型通过深度学习方式训练得到,所述功能分割结果中包含所述测序点对应的所述细胞功能注释结果。
综上所述,本申请实施例中,获取到组织样本的测序数据后,基于测序数据生成组织样本的基因测序矩阵,由于基因测序矩阵能够反映组织样本中不同空间位置处的基因分布情况,即基因测序矩阵融合了基因表达和空间位置这两个模态的数据,且深度学习在处理结构化数据时具备优势,因此通过深度学习方式,基于基因测序矩阵进行细胞功能注释时,能够综合考虑组织样本的全局特征以及局部细胞群的局部特征,有助于提高细胞功能注释的准确性。
需要说明的是:上述实施例提供的装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其实现过程详见方法实施例,这里不再赘述。
请参考图13,其示出了本申请一个示例性实施例提供的计算机设备的结构示意图。具体来讲:所述计算机设备1300包括中央处理单元(Central Processing Unit,CPU)1301、包括随机存取存储器1302和只读存储器1303的系统存储器1304,以及连接系统存储器1304和中央处理单元1301的系统总线1305。所述计算机设备1300还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(Input/Output,I/O系统)1306,和用于存储操作系统1313、应用程序1314和其他程序模块1315的大容量存储设备1307。
所述基本输入/输出系统1306包括有用于显示信息的显示器1308和用于用户输入信息的诸如鼠标、键盘之类的输入设备1309。其中所述显示器1308和输入设备1309都通过连接到系统总线1305的输入输出控制器1310连接到中央处理单元1301。所述基本输入/输出系统1306还可以包括输入输出控制器1310以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1310还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备1307通过连接到系统总线1305的大容量存储控制器(未示出)连接到中央处理单元1301。所述大容量存储设备1307及其相关联的计算机可读介质为计算机设备1300提供非易失性存储。也就是说,所述大容量存储设备1307可以包括诸如硬盘或者驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括随机存取记忆体(RAM,Random Access Memory)、只读存储器(ROM,Read Only Memory)、闪存或其他固态存储其技术,只读光盘(Compact Disc Read-Only Memory,CD-ROM)、数字通用光盘(Digital Versatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1304和大容量存储设备1307可以统称为存储器。
存储器存储有一个或多个程序,一个或多个程序被配置成由一个或多个中央处理单元1301执行,一个或多个程序包含用于实现上述方法的指令,中央处理单元1301执行该一个或多个程序实现上述各个方法实施例提供的方法。
根据本申请的各种实施例,所述计算机设备1300还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1300可以通过连接在所述系统总线1305上的网络接口单元1311连接到网络1312,或者说,也可以使用网络接口单元1311来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由计算机设备所执行的步骤。
本申请实施例还提供一种计算机可读存储介质,该可读存储介质中存储有至少一条指令,至少一条指令由处理器加载并执行以实现上述任一实施例所述的细胞功能注释方法。
可选地,该计算机可读存储介质可以包括:ROM、RAM、固态硬盘(SSD,Solid StateDrives)或光盘等。其中,RAM可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例所述的细胞功能注释方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种细胞功能注释方法,其特征在于,所述方法包括:
获取组织样本的测序数据,所述测序数据中包含各个测序点的基因表达数据以及空间位置数据,所述测序点对应至少一个细胞;
基于所述测序数据生成所述组织样本的基因测序矩阵,所述基因测序矩阵用于表征所述组织样本中不同空间位置处的基因分布情况;
基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述测序数据生成所述组织样本的基因测序矩阵,包括:
对所述基因表达数据以及所述空间位置数据进行数据对齐;
基于数据对齐后的所述基因表达数据以及所述空间位置数据,生成基因对应的基因分布矩阵,所述基因分布矩阵用于表征不同空间位置上所述基因的基因表达量;
基于不同基因对应的所述基因分布矩阵,生成所述基因测序矩阵,所述基因测序矩阵为三维矩阵。
3.根据权利要求2所述的方法,其特征在于,所述对所述基因表达数据以及所述空间位置数据进行数据对齐之后,所述方法还包括:
基于数据对齐后的所述基因表达数据以及所述空间位置数据,过滤所述测序点中的异常测序点。
4.根据权利要求3所述的方法,其特征在于,所述基于数据对齐后的所述基因表达数据以及所述空间位置数据,过滤所述测序点中的异常测序点,包括:
基于数据对齐后的所述基因表达数据以及所述空间位置数据,确定各个细胞的转录本数量和基因表达量;
将所述转录本数量不属于数量区间,或,基因表达量不属于表达量区间的细胞确定为异常细胞;
过滤所述异常细胞对应的所述异常测序点。
5.根据权利要求2所述的方法,其特征在于,所述基于不同基因对应的所述基因分布矩阵,生成所述基因测序矩阵,包括:
对各个所述基因分布矩阵中的所述基因表达量进行归一化处理,得到归一化基因分布矩阵;
对所述归一化基因分布矩阵进行三维拼接,得到所述基因测序矩阵。
6.根据权利要求2所述的方法,其特征在于,所述基于不同基因对应的所述基因分布矩阵,生成所述基因测序矩阵之后,所述方法还包括:
基于所述基因测序矩阵,确定高表达且高可变基因;
基于所述高表达且高可变基因对所述基因测序矩阵进行降维处理,其中,降维处理后的所述基因测序矩阵中包含所述高表达且高可变基因对应的所述基因分布矩阵。
7.根据权利要求6所述的方法,其特征在于,所述基于所述基因测序矩阵,确定高表达且高可变基因,包括:
基于所述基因测序矩阵,确定各个基因的平均表达强度以及可变性方差,所述平均表达强度基于基因总表达量和测序点数量确定得到,所述可变性方差用于表征不同测序点处同一基因的基因表达量差异;
基于所述平均表达强度和所述可变性方差确定所述高表达且高可变基因。
8.根据权利要求1至7任一所述的方法,其特征在于,所述基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果,包括:
将所述基因测序矩阵输入功能分割模型,得到所述功能分割模型输出的功能分割结果,所述功能分割模型通过深度学习方式训练得到,所述功能分割结果中包含所述测序点对应的所述细胞功能注释结果。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
基于标准功能分区图,生成训练样本对应的功能分割掩膜,所述标准功能分区图对应的标准样本与所述训练样本属于同一组织类型,所述功能分割掩膜包含所述训练样本中各个样本测序点对应的细胞功能注释;
获取所述训练样本的样本测序数据;
基于所述样本测序数据生成所述训练样本的样本基因测序矩阵;
将所述样本基因测序矩阵输入所述功能分割模型,得到所述功能分割模型输出的功能分割预测结果;
将所述功能分割掩膜作为所述功能分割预测结果的监督,训练所述功能分割模型。
10.根据权利要求9所述的方法,其特征在于,所述基于标准功能分区,生成训练样本对应的功能分割掩膜,包括:
对所述标准功能分区和所述训练样本进行图像空间对齐;
基于图像空间对齐后的所述标准功能分区,生成所述训练样本对应的所述功能分割掩膜。
11.根据权利要求1至7任一所述的方法,其特征在于,所述方法还包括:
获取所述组织样本中细胞的细胞形态学特征以及细胞纹理特征,所述细胞形态学特征通过对细胞轮廓进行特征提取得到,所述细胞纹理特征基于组织样本图像中细胞范围内像素点的像素值确定得到;
所述基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果,包括:
对所述细胞形态学特征、所述细胞纹理特征和所述基因测序矩阵进行特征融合,得到融合特征矩阵;
将所述融合特征矩阵输入功能分割模型,得到所述功能分割模型输出的功能分割结果,所述功能分割模型通过深度学习方式训练得到,所述功能分割结果中包含所述测序点对应的所述细胞功能注释结果。
12.一种细胞功能注释装置,其特征在于,所述装置包括:
第一获取模块,用于获取组织样本的测序数据,所述测序数据中包含各个测序点的基因表达数据以及空间位置数据,所述测序点对应至少一个细胞;
第一生成模块,用于基于所述测序数据生成所述组织样本的基因测序矩阵,所述基因测序矩阵用于表征所述组织样本中不同空间位置处的基因分布情况;
第一注释模块,用于基于所述基因测序矩阵,通过深度学习方式进行细胞功能注释,得到细胞功能注释结果。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至11任一所述的细胞功能注释方法。
14.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至11任一所述的细胞功能注释方法。
15.一种计算机程序产品或计算机程序,其特征在于,所述计算机程序产品或所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中;计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备实现如权利要求1至11任一所述的细胞功能注释方法。
CN202210094184.7A 2022-01-26 2022-01-26 细胞功能注释方法、装置、设备及介质 Pending CN114496099A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210094184.7A CN114496099A (zh) 2022-01-26 2022-01-26 细胞功能注释方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210094184.7A CN114496099A (zh) 2022-01-26 2022-01-26 细胞功能注释方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN114496099A true CN114496099A (zh) 2022-05-13

Family

ID=81477160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210094184.7A Pending CN114496099A (zh) 2022-01-26 2022-01-26 细胞功能注释方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN114496099A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115346599A (zh) * 2022-10-19 2022-11-15 四川大学华西医院 H&e图像基因和细胞异质性预测方法、系统和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115346599A (zh) * 2022-10-19 2022-11-15 四川大学华西医院 H&e图像基因和细胞异质性预测方法、系统和存储介质

Similar Documents

Publication Publication Date Title
CN112734775B (zh) 图像标注、图像语义分割、模型训练方法及装置
CN112687327B (zh) 一种基于多任务和多模态的癌症生存分析系统
Megjhani et al. Population-scale three-dimensional reconstruction and quantitative profiling of microglia arbors
CN110097921B (zh) 基于影像组学的胶质瘤内基因异质性可视化定量方法和系统
CN113139628A (zh) 样本图像的识别方法、装置、设备及可读存储介质
CN110930378B (zh) 基于低数据需求的肺气肿影像处理方法及系统
CN114693624A (zh) 一种图像检测方法、装置、设备及可读存储介质
CN111738044A (zh) 一种基于深度学习行为识别的校园暴力评估方法
CN109034218B (zh) 模型训练方法、装置、设备及存储介质
CN113763385A (zh) 视频目标分割方法、装置、设备及介质
CN114330499A (zh) 分类模型的训练方法、装置、设备、存储介质及程序产品
CN113065551A (zh) 利用深度神经网络模型执行图像分割的方法
CN114037699B (zh) 一种病理图像分类方法、设备、系统及存储介质
CN113764034B (zh) 基因组序列中潜在bgc的预测方法、装置、设备及介质
CN114496099A (zh) 细胞功能注释方法、装置、设备及介质
CN114445356A (zh) 基于多分辨率的全视野病理切片图像肿瘤快速定位方法
CN114372532A (zh) 标签标注质量的确定方法、装置、设备、介质及产品
CN113160886A (zh) 基于单细胞Hi-C数据的细胞类型预测系统
CN115908363B (zh) 肿瘤细胞统计方法、装置、设备和存储介质
CN116978464A (zh) 数据处理方法、装置、设备以及介质
CN117095460A (zh) 基于长短时关系预测编码的自监督群体行为识别方法及其识别系统
CN116188428A (zh) 一种桥接多源域自适应的跨域组织病理学图像识别方法
CN113160987B (zh) 健康状态预测方法、装置、计算机设备及存储介质
CN113177602B (zh) 图像分类方法、装置、电子设备和存储介质
CN114913921A (zh) 一种标志基因识别的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40070825

Country of ref document: HK