CN116189770A - 一种单细胞转录组rna污染去除方法、介质和设备 - Google Patents

一种单细胞转录组rna污染去除方法、介质和设备 Download PDF

Info

Publication number
CN116189770A
CN116189770A CN202310149252.XA CN202310149252A CN116189770A CN 116189770 A CN116189770 A CN 116189770A CN 202310149252 A CN202310149252 A CN 202310149252A CN 116189770 A CN116189770 A CN 116189770A
Authority
CN
China
Prior art keywords
barcode
gene
pollution
gene expression
inflection point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310149252.XA
Other languages
English (en)
Other versions
CN116189770B (zh
Inventor
陈哲名
陈志锋
方超
韩斐然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Link Care Medical Laboratory Co ltd
Original Assignee
Hangzhou Link Care Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Link Care Medical Laboratory Co ltd filed Critical Hangzhou Link Care Medical Laboratory Co ltd
Priority to CN202310149252.XA priority Critical patent/CN116189770B/zh
Publication of CN116189770A publication Critical patent/CN116189770A/zh
Application granted granted Critical
Publication of CN116189770B publication Critical patent/CN116189770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)

Abstract

本发明公开了一种单细胞转录组RNA污染鉴定方法,涉及生物数据分析方法。包括以下步骤:根据基因表达量从大到小对barcode进行排序;求得基因表达量变化幅度由小变大的A类拐点和基因表达量变化幅度由大变小的B类拐点;取规定区间内对应基因表达量最大的A类拐点为起点拐点,对应基因表达量最小的B类拐点为终点拐点;将起点拐点到终点拐点之间的所有barcode设为背景barcode;提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例;将表达比例大于污染阈值GP的基因设定为污染基因;若存在污染基因,则判定单细胞转录组数据存在RNA污染。本发明可以分析单细胞转录组数据中是否存在背景RNA污染,便于提高后续分析的可靠程度。

Description

一种单细胞转录组RNA污染去除方法、介质和设备
相关申请的交叉引用
本申请是基于申请号为2022113640956,申请日为:2022年11月02日,发明名称为:一种单细胞转录组RNA污染鉴定方法、介质和设备的分案申请。
技术领域
本发明涉及生物数据分析方法,尤其涉及一种单细胞转录组RNA污染去除方法、介质和设备。
背景技术
基于微流控技术的单细胞转录组测序能够在单个实验中对数万个细胞的基因表达进行量化。其主要是基于序列标签来识别单细胞,其核心技术是给每个细胞添加一个独特的序列标签,在测序时把携带相同标签的核酸序列视为来自同一个细胞。10X Genomics单细胞转录组测序平台为目前应用广泛的一种技术,该平台利用微流控、油滴包裹和barcode标签等技术来实现高通量的细胞分选与捕获,能够一次性分离、并标记500至数万个单细胞,测序后可获得每个细胞的转录组信息,具有细胞通量高、建库成本低、捕获周期短等优势。
典型的单细胞转录组测序实验流程如下,首先制备细胞悬浮液,在相应的平台仪器上利用微流控芯片将细胞悬浮液与磁珠混合,并用油滴包裹。每个微珠带有独特的核苷酸序列,即barcode标签,可以对单个细胞进行标记。而每条barcode标签还连有一段由核苷酸序列组成的分子标识符(unique molecular identifier,UMI),每个UMI可以标记一个mRNA转录本。经过逆转录、PCR扩增、生成文库和测序,在测序数据中,根据barcode标签和UMI标记,即可确定结果中每条序列是否来自于同一个细胞、同一个mRNA,这一方法可以减少PCR对不同分子的偏好影响。通过匹配和计数barcode和UMI,汇总基因表达信息在计数矩阵中,由此获得单个细胞的转录组表达谱。
基于液滴的单细胞转录组数据分析的前提是假设所有获得的RNA序列都是细胞内源性的。然而,在实际实验过程中,难免混入其他非细胞RNA,这些RNA可能来源于样本中已经破裂甚至破碎的细胞,或者来源于试剂溶液中,也可能来源于实验人员等环境因素。实验过程中,非细胞RNA与内源性细胞RNA会被一起包裹在液滴中,可能与细胞RNA一起被标记、扩增和计数。这导致不同细胞群之间转录本的交叉污染,构成了单细胞转录组数据的背景污染,使单细胞转录组数据的生物学解释偏离真实情况。目前还未有系统判定是否存在RNA污染的方法。
发明内容
为了解决背景技术中提到的至少一个技术问题,本发明的目的在于提供一种单细胞转录组RNA污染鉴定方法、介质和设备,分析单细胞转录组数据中是否存在背景RNA污染。
为实现上述目的,本发明提供如下技术方案:
一种单细胞转录组RNA污染鉴定方法,包括以下步骤:
S1,根据基因表达量从大到小对barcode进行排序;
S2,求得基因表达量变化幅度由小变大的A类拐点和基因表达量变化幅度由大变小的B类拐点;
S3,取规定区间内对应基因表达量最大的A类拐点为起点拐点,对应基因表达量最小的B类拐点为终点拐点;将起点拐点到终点拐点之间的所有barcode设为背景barcode;
S4,提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例;将表达比例大于污染阈值GP的基因设定为污染基因;
S5,若存在污染基因,则判定单细胞转录组数据存在RNA污染。
进一步的,所述A类拐点的求解方法如下:
SA21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;
SA22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;
SA23,当斜率的变化趋势为由小到大,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为A类拐点。
进一步的,所述B类拐点的求解方法如下:
SB21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;
SB22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;
SB23,当斜率的变化趋势为由大到小,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为B类拐点。
进一步的,在S21绘制散点图之前,对barcode的排名和基因表达量先进行对数处理。
进一步的,所述表达比例的计算方法如下:
P=NA/Ntotal*100%
其中,P为基因的表达比例;NA为表达了该基因的barcode数量;Ntotal为背景barcode的总数。
进一步的,所述规定区间的确定方法如下:设定基因表达量阈值G1和G2,G1>G2;所述规定区间为基因表达量大于G2且小于G1。
进一步的,所述基因表达量阈值G1=800,G2=80。
进一步的,所述污染阈值GP为70%。
一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的单细胞转录组RNA污染鉴定方法。
一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的单细胞转录组RNA污染鉴定方法。
与现有技术相比,本发明的有益效果是:
本发明通过基因表达量的变化幅度求得两类拐点,并进一步确定背景barcode,进而提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例,若存在某一基因的表达比例大于污染阈值,则判定单细胞转录组数据存在RNA污染,从而提高后续分析的可靠程度。
附图说明
图1为本发明一实施例的RNA污染鉴定方法流程图。
图2为本发明一实施例的散点图。
图3为本发明一实施例的拐点示意图。
图4为本发明一实施例的RNA污染去除方法流程图。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
请参阅图1,本实施例提供一种单细胞转录组RNA污染鉴定方法,包括以下步骤:
计算分析基因表达量(UMI counts数,简称CUMI)的剧烈变化点(称为“拐点”),通过如下步骤S1和S2实现:
S1,根据基因表达量CUMI从大到小对barcode进行排序,并赋予排名Rn
S2,求得基因表达量CUMI变化幅度由小变大的A类拐点和基因表达量CUMI变化幅度由大变小的B类拐点;
具体的,所述A类拐点的求解方法如下:
SA21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;为了放大基因表达量CUMI的变化幅度,本实施例还对barcode的排名Rn和基因表达量CUMI进行log10处理,即以log10Rn为X轴,以log10CUMI为Y轴,如图2所示,绘制散点图。
SA22,在所述散点图上,沿X轴,间隔0.1取最近的一个点,间隔长度可以自定义设置,还可以是0.2或0.3。
求相邻两个点之间的斜率kn,求解公式为:kn=(yn-yn-1)/(xn-xn-1);公式中,(xn,yn)为第n个点的坐标,(xn-1,yn-1)为第n-1个点的坐标;下表1展示了一实施例的基因表达量排名及斜率。
表1:基因表达量排名及斜率
Figure BDA0004090302310000061
SA23,当斜率kn的变化趋势为由小到大,即kn>kn-1,且在该趋势持续过程中,斜率kn首次大于设定的斜率阈值时,将对应的点设为A类拐点;于本实施例中,所述斜率阈值为-1。
由上表1可得知,排名5007的barcode对应的斜率在连续增大的情况下首次大于-1,因此认定为A类拐点。
同理,所述B类拐点的求解方法如下:
SB21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;
SB22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;
SB23,当斜率的变化趋势为由大到小,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为B类拐点。
同理,由上表1可得知,排名1996的barcode对应的斜率在连续降低的情况下首次小于-1,因此认定为B类拐点。
如图3所示,通过步骤S2,可以在散点图上求得若干A类拐点和B类拐点,对拐点的数量进行统计以便后续步骤使用。
S3,设定基因表达量阈值G1和G2,G1>G2;基因表达量CUMI大于G2且小于G1设为规定区间。取上述规定区间内对应基因表达量CUMI最大的A类拐点为“起点拐点”,对应基因表达量CUMI最小的B类拐点为“终点拐点”;将起点拐点到终点拐点之间的所有barcode设为背景barcode。基因表达量阈值G1和G2可根据实际情况进行调整,通常设置为800和80。
S4,提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例P。表达了某基因(假设为基因A)的barcode数量用NA表示,背景barcode总数用Ntotal表示。表达比例P的计算公式如下:
P=NA/Ntotal*100% (1)
其中,P为基因的表达比例;NA为表达了该基因的barcode数量;Ntotal为背景barcode的总数。设定污染阈值GP,将表达比例P大于污染阈值GP的基因设定为污染基因。GP可调整,通常设定为70%。
值得一提的是,表达比例P的计算还可采用基因表达量计算。而此步骤中采用barcode数量而不是基因表达量计算表达比例P的原因是,污染本身应具有普遍性,即较多背景barcode中能检测到污染基因的表达,若用基因表达量计算比例P,容易受到个别高表达背景barcode(如细胞碎片barcode)的影响,且与普遍性这一特性存在异质性。总之,使用barcode数量计算比例P的结果更稳定,更符合污染的定义中的普遍性特点,更接近真实情况。
S5,若存在污染基因,则判定单细胞转录组数据存在RNA污染,反之则判定无RNA污染。
实施例二:
本实施例二在实施例一判定单细胞转录组数据存在RNA污染的基础上,还进一步去除细胞中的RNA污染。请参照图4,通过如下步骤实现:
T1,根据污染基因在背景barcode中的表达谱,计算每个污染基因的基因表达量的平均值u1和标准差a1;如下表2所示为一实施例的污染基因A在背景barcode中的表达谱:
表2:污染基因A在背景barcode中的表达谱
背景barcode编号 No.P1 No.P2 No.P3 No.P4 No.P5
污染基因A表达量 10 2 6 3 8
可以求得以上5个污染基因表达量以下数据:
平均值u1=5.8;
标准差a1=2.99。
T2,输入单细胞转录组数据,首先使用10X Genomics官方的cellranger软件筛选出细胞barcode,再使用Seurat软件对细胞barcode进行分群。针对每一细胞群,分别计算污染基因在该群细胞中基因表达量的平均值u2和标准差a2。
将细胞barcode分群后进行再进行计算的原因为,单细胞转录组数据中的每个barcode可能代表不同的细胞类型,且不同细胞类型的barcode数量不同,若未进行分群处理,污染基因的分布难以形成可计算的模型,去污染的误差较大。进行分群处理后再去除细胞污染,可以最大程度上保留细胞的原始表达量,尽可能准确地去除污染部分。
例如:分群之后,得到一个细胞群包括5个细胞barcode,其表达谱针对上述污染基因A的表达谱如下表3所示:
表3:污染基因A在某细胞群中的表达谱
细胞barcode编号(同群) No.C1 No.C2 No.C3 No.C4 No.C5
污染基因A原始表达量Craw 26 32 66 45 40
可以求得以上5个污染基因表达量以下数据:
平均值u2=41.8;
标准差a2=13.7。
T3,根据公式Cp=(Craw-u2)/a2*a1+u1计算每个污染基因在每个细胞中的污染表达量Cp,再将细胞的污染基因的基因表达量Craw减去计算得到的污染表达量,则为实际表达量Cclean。下表4为求得的污染表达量Cp以及对应的实际表达量Cclean
表4:求得的污染表达量Cp以及对应的实际表达量Cclean
细胞barcode编号(同群) No.C1 No.C2 No.C3 No.C4 No.C5
污染基因A原始表达量Craw 26 32 66 45 40
污染基因A污染表达量Cp 2 4 11 6 5
污染基因A实际表达量Cclean 24 28 55 39 35
注:以上污染表达量Cp以及对应的实际表达量Cclean为四舍五入的数值。
对每个污染基因和每个细胞都进行如上处理后,则获得去除污染后的单细胞转录组数据。
实施例三:
一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如实施例一所述的单细胞转录组RNA污染鉴定方法和/或实施例二所述的单细胞转录组RNA污染去除方法。
实施例四:
一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的单细胞转录组RNA污染鉴定方法和/或实施例二所述的单细胞转录组RNA污染去除方法。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

Claims (10)

1.一种单细胞转录组RNA污染去除方法,其特征在于,包括以下步骤:
S1,根据基因表达量从大到小对barcode进行排序;
S2,求得基因表达量变化幅度由小变大的A类拐点和基因表达量变化幅度由大变小的B类拐点;
S3,取规定区间内对应基因表达量最大的A类拐点为起点拐点,对应基因表达量最小的B类拐点为终点拐点;将起点拐点到终点拐点之间的所有barcode设为背景barcode;
S4,提取背景barcode的表达谱,统计不同基因在背景barcode中的表达比例;将表达比例大于污染阈值GP的基因设定为污染基因;
S5,若存在污染基因,则判定单细胞转录组数据存在RNA污染;
T1,根据污染基因在背景barcode中的表达谱,计算每个污染基因的基因表达量的平均值u1和标准差a1;
T2,对细胞barcode进行分群,针对每一细胞群,分别计算污染基因在该群细胞中基因表达量的平均值u2和标准差a2;
T3,根据公式Cp=(Craw-u2)/a2*a1+u1计算每个污染基因在每个细胞中的污染表达量Cp,再将细胞的污染基因的基因表达量Craw减去计算得到的污染表达量,则为实际表达量Cclean
2.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述A类拐点的求解方法如下:
SA21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;
SA22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;
SA23,当斜率的变化趋势为由小到大,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为A类拐点。
3.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述B类拐点的求解方法如下:
SB21,以barcode的排名为X轴,基因表达量为Y轴绘制散点图;
SB22,在所述散点图上,间隔规定距离取最近的一个点,求相邻两个点之间的斜率;
SB23,当斜率的变化趋势为由大到小,且在该趋势持续过程中,斜率首次小于设定的斜率阈值时,将对应的点设为B类拐点。
4.根据权利要求2或3所述的一种单细胞转录组RNA污染去除方法,其特征在于,在S21绘制散点图之前,对barcode的排名和基因表达量先进行对数处理。
5.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述表达比例的计算方法如下:
P=NA/Ntotal*100%
其中,P为基因的表达比例;NA为表达了该基因的barcode数量;Ntotal为背景barcode的总数。
6.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述规定区间的确定方法如下:设定基因表达量阈值G1和G2,G1>G2;所述规定区间为基因表达量大于G2且小于G1。
7.根据权利要求6所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述基因表达量阈值G1=800,G2=80。
8.根据权利要求1所述的一种单细胞转录组RNA污染去除方法,其特征在于,所述污染阈值GP为70%。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至7任意一项所述的单细胞转录组RNA污染去除方法。
10.一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述的单细胞转录组RNA污染去除方法。
CN202310149252.XA 2022-11-02 2022-11-02 一种单细胞转录组rna污染去除方法、介质和设备 Active CN116189770B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310149252.XA CN116189770B (zh) 2022-11-02 2022-11-02 一种单细胞转录组rna污染去除方法、介质和设备

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202211364095.6A CN115472222B (zh) 2022-11-02 2022-11-02 一种单细胞转录组rna污染鉴定方法、介质和设备
CN202310149252.XA CN116189770B (zh) 2022-11-02 2022-11-02 一种单细胞转录组rna污染去除方法、介质和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202211364095.6A Division CN115472222B (zh) 2022-11-02 2022-11-02 一种单细胞转录组rna污染鉴定方法、介质和设备

Publications (2)

Publication Number Publication Date
CN116189770A true CN116189770A (zh) 2023-05-30
CN116189770B CN116189770B (zh) 2023-08-18

Family

ID=84337942

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211364095.6A Active CN115472222B (zh) 2022-11-02 2022-11-02 一种单细胞转录组rna污染鉴定方法、介质和设备
CN202310149252.XA Active CN116189770B (zh) 2022-11-02 2022-11-02 一种单细胞转录组rna污染去除方法、介质和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211364095.6A Active CN115472222B (zh) 2022-11-02 2022-11-02 一种单细胞转录组rna污染鉴定方法、介质和设备

Country Status (1)

Country Link
CN (2) CN115472222B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118298918B (zh) * 2024-06-05 2024-08-30 四川大学华西医院 线粒体基因比例质控和阈值确定方法、系统及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109559780A (zh) * 2018-09-27 2019-04-02 华中科技大学鄂州工业技术研究院 一种高通量测序的rna数据处理方法
WO2020154885A1 (zh) * 2019-01-29 2020-08-06 北京大学 单细胞类型检测方法、装置、设备和存储介质
CN112700820A (zh) * 2021-01-07 2021-04-23 广州华银健康医疗集团股份有限公司 一种基于单细胞转录组测序的细胞亚群注释方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005049307A (ja) * 2003-07-31 2005-02-24 Kyocera Kinseki Corp 質量センサ素子
EP1524320A1 (en) * 2003-10-15 2005-04-20 Deutsches Krebsforschungszentrum Stiftung des öffentlichen Rechts Rapid determination and quantification of mycoplasma contamination using DNA chip technology
CN104975107A (zh) * 2015-08-04 2015-10-14 张晓梅 一种应用贻贝检测水体污染物的方法
CN105219861A (zh) * 2015-10-19 2016-01-06 华中农业大学 一种检测西瓜cDNA样品中是否有基因组DNA污染的方法
CN106777870A (zh) * 2016-11-18 2017-05-31 邹欣 一种针对单细胞转录组数据的降噪声算法
CN108410990B (zh) * 2018-05-30 2021-07-06 中国医学科学院北京协和医院 Igfbp3在制备诊断i型神经纤维瘤合并脊柱畸形病产品中的应用
CN110415767B (zh) * 2019-06-20 2022-04-22 清华大学 液滴单细胞转录组测序数据降噪方法、装置和存储介质
CN113662538A (zh) * 2021-08-24 2021-11-19 西安理工大学 一种基于时频域综合分析的无创血糖检测方法
CN114944193A (zh) * 2022-05-20 2022-08-26 南开大学 整合单细胞转录组与空间转录组数据的分析方法及系统
CN115035950A (zh) * 2022-06-28 2022-09-09 广州燃石医学检验所有限公司 基因型检测方法、样本污染检测方法、装置、设备及介质
CN115064209B (zh) * 2022-08-17 2022-11-01 普瑞基准科技(北京)有限公司 一种恶性细胞鉴定方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109559780A (zh) * 2018-09-27 2019-04-02 华中科技大学鄂州工业技术研究院 一种高通量测序的rna数据处理方法
WO2020154885A1 (zh) * 2019-01-29 2020-08-06 北京大学 单细胞类型检测方法、装置、设备和存储介质
CN112700820A (zh) * 2021-01-07 2021-04-23 广州华银健康医疗集团股份有限公司 一种基于单细胞转录组测序的细胞亚群注释方法

Also Published As

Publication number Publication date
CN115472222B (zh) 2023-03-24
CN116189770B (zh) 2023-08-18
CN115472222A (zh) 2022-12-13

Similar Documents

Publication Publication Date Title
CN116189770B (zh) 一种单细胞转录组rna污染去除方法、介质和设备
US20220025443A1 (en) Methods for screening biological samples for contamination
CN104153004A (zh) 一种用于扩增子测序的建库方法
CN115440303B (zh) 一种单细胞转录组低质量细胞过滤方法、介质和设备
CN113470743A (zh) 一种基于bd单细胞转录组和蛋白组测序数据的差异基因分析方法
CN111192637B (zh) 一种lncRNA鉴定和表达定量的分析方法
CN107832584B (zh) 宏基因组的基因分析方法、装置、设备及存储介质
Schwender et al. Identifying interesting genes with siggenes
CN117133354B (zh) 一种高效鉴定林木关键育种基因模块的方法
Prawer et al. Pervasive effects of RNA degradation on Nanopore direct RNA sequencing
US8086412B2 (en) Corrective methodology for processing results of transcriptome experiments obtained by differential analysis
Zhang et al. One read per cell per gene is optimal for single-cell RNA-Seq
CN116525010A (zh) 一种单细胞转录组双源多细胞过滤方法、介质和设备
CN110232951B (zh) 判断测序数据饱和的方法、计算机可读介质和应用
CN114863994B (zh) 污染评估方法、装置、电子设备及存储介质
CN116072217B (zh) 一种单细胞转录组数据可用性处理方法、介质及设备
Harrison et al. Characterizing microbiomes via sequencing of marker loci: techniques to improve throughput, account for cross-contamination, and reduce cost
Yang et al. Background modeling, quality control and normalization for GeoMx RNA data with GeoDiff
CN108715891A (zh) 一种转录组数据的表达定量方法及系统
Martini et al. RNA sequencing for transcript 5′-end mapping in mycobacteria
CN117095748B (zh) 一种构建植物miRNA遗传调控通路的方法
CN117672373A (zh) 一种溶血血液样本单细胞转录组数据分析方法、介质和设备
CN116525004B (zh) 一种基于两组比较的单细胞表达模式差异评估方法、介质和设备
Kick et al. CRMetrics-an R package for Cell Ranger Filtering and Metrics Visualisation
CN116312769A (zh) 一种过滤低复杂度高通量测序数据的装置、方法及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant