CN107580632A - 用于全转录组扩增的方法和组合物 - Google Patents

用于全转录组扩增的方法和组合物 Download PDF

Info

Publication number
CN107580632A
CN107580632A CN201680022865.5A CN201680022865A CN107580632A CN 107580632 A CN107580632 A CN 107580632A CN 201680022865 A CN201680022865 A CN 201680022865A CN 107580632 A CN107580632 A CN 107580632A
Authority
CN
China
Prior art keywords
certain embodiments
nucleic acid
common tags
adapter
chain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680022865.5A
Other languages
English (en)
Other versions
CN107580632B (zh
Inventor
格伦·弗
克雷格·贝茨
克里斯蒂娜·范
格雷琴·因博恩·拉姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Becton Dickinson and Co
Original Assignee
Cellular Research Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cellular Research Inc filed Critical Cellular Research Inc
Publication of CN107580632A publication Critical patent/CN107580632A/zh
Application granted granted Critical
Publication of CN107580632B publication Critical patent/CN107580632B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips

Abstract

本披露提供了用于使用随机条形码进行全转录组扩增的方法、组合物、系统、装置和试剂盒。

Description

用于全转录组扩增的方法和组合物
相关申请的交叉引用
本申请要求2015年7月24日提交的美国临时专利申请序列号62/196,782和2015年4月23日提交的美国临时专利申请序列号62/151,583的权益,出于所有目的将这些相关申请的内容通过引用以其全文并入本文。
序列表的引用
本申请是连同电子格式的序列表一起提交的。序列表被提供为题为BDCRI-014WO_Sequence_Listing.TXT的文件,创建于2016年4月21日,大小为6.96Kb。将在电子格式的序列表中的信息通过引用以其全文并入本文。
背景技术
已经开发了用于标记扩增或测序用的核酸分子的方法和组合物。有时样品提供太少的起始材料以用于进行样品中核酸分子的计数。扩增可以增加下游分析方法(如随机计数)的材料量。本文描述了用于全转录组扩增(WTA)的方法、组合物、试剂盒和系统,包括使用随机条形码对样品中的核酸分子计数。
发明内容
本文披露的一些实施例提供了用于对来自样品的多个靶标进行标记的方法,所述方法包括:将来自所述样品的所述多个靶标与多个核酸杂交,所述多个核酸中的每一个包含第一通用标记;延伸所述多个核酸以产生多个第一链多核苷酸;使用所述多个第一链多核苷酸作为模板合成多个第二链多核苷酸,以产生多个双链多核苷酸;将衔接子连接到所述多个双链多核苷酸,其中所述衔接子包含第二通用标记;并且使用所述第一通用标记和所述第二通用标记扩增所述多个双链多核苷酸,从而产生包含所述多个靶标的多个扩增子。在一些实施例中,所述多个核酸中的每一个包含随机条形码。在一些实施例中,所述随机条形码包括分子标记、细胞标记、靶标特异性区域或其任何组合。在一些实施例中,所述靶标特异性区域包含寡聚dT序列、随机序列、靶标特异性序列或其任何组合。在一些实施例中,所述多个靶标是DNA。在一些实施例中,所述多个靶标是mRNA。在一些实施例中,合成所述多个第二链多核苷酸包括用RNA酶切割所述多个mRNA,从而产生一个或多个mRNA引物。在一些实施例中,所述RNA酶是RNaseH。在一些实施例中,所述一个或多个mRNA引物中的至少一个的长度为至少15个核苷酸。在一些实施例中,所述方法还包括用聚合酶延伸所述一个或多个mRNA引物,从而产生延伸的区段。在一些实施例中,所述聚合酶具有5'-3'外切核酸酶活性。在一些实施例中,所述聚合酶包括DNA Pol I。在一些实施例中,所述方法还包括用连接酶连接所述延伸的区段,从而产生第二链多核苷酸。在一些实施例中,所述方法还包括用链置换聚合酶延伸所述一个或多个mRNA引物,从而产生延伸的第二链。在一些实施例中,所述方法还包括从延伸的第二链去除所述一个或多个mRNA引物。在一些实施例中,所述多个靶标是来自单个细胞的核酸。在一些实施例中,所述多个扩增子包含全转录组扩增(WTA)产物。在一些实施例中,所述衔接子是双链多核苷酸。在一些实施例中,所述衔接子包含AsiSI位点。在一些实施例中,所述衔接子是部分双链的多核苷酸。在一些实施例中,所述方法还包括使所述多个双链多核苷酸中的至少一个平端化。在一些实施例中,所述方法还包括向所述多个双链多核苷酸添加A突出端。在一些实施例中,所述方法还包括从所述多个第二链多核苷酸合成多个第三链多核苷酸。在一些实施例中,所述多个核酸中的每一个被固定在固体支持物上。在一些实施例中,所述固体支持物是珠粒。在一些实施例中,固定在单个固体支持物上的所述多个核酸中的至少两个包含不同的分子标记。在一些实施例中,附接到固体支持物上的所述多个核酸包含相同的细胞标记。在一些实施例中,所述样品包括单个细胞。在一些实施例中,所述样品包括多个细胞。在一些实施例中,所述第一通用标记和所述第二通用标记是相同的。在一些实施例中,所述第一通用标记和所述第二通用标记是不同的。在一些实施例中,所述多个扩增子中的每一个包含第一通用标记、第二通用标记或两者的至少一部分。
本文披露的一些实施例提供了用于对来自样品的多个靶标进行标记的方法,所述方法包括:将来自所述样品的所述多个靶标与多个核酸杂交,所述多个核酸中的每一个包含第一通用标记;延伸所述多个核酸以产生多个第一链多核苷酸,其中所述多个第一链多核苷酸和所述多个靶标形成多个双链多核苷酸;使用第一转座体将所述多个双链多核苷酸片段化,以产生与第一衔接子连接的多个双链多核苷酸,其中所述第一衔接子包含第二通用标记,并且其中所述第一转座体包含第一转座酶和所述第一衔接子;并且使用所述第一通用标记和所述第二通用标记扩增与所述第一衔接子连接的所述多个双链多核苷酸,从而产生包含所述多个靶标的多个扩增子。在一些实施例中,所述方法还包括使用第二转座体将所述多个双链多核苷酸片段化,以产生与所述第一衔接子和第二衔接子连接的多个双链多核苷酸,其中所述第二衔接子包含第三通用标记,并且其中所述第二转座体包含第二转座酶和所述第二衔接子。在一些实施例中,所述第一转座酶和所述第二转座酶是相同的。在一些实施例中,所述第一转座酶和所述第二转座酶是不同的。在一些实施例中,所述第一衔接子和所述第二衔接子是相同的。在一些实施例中,所述第一衔接子和所述第二衔接子是不同的。在一些实施例中,所述方法还包括使用所述多个第一链多核苷酸作为模板合成多个第二链多核苷酸。在一些实施例中,所述第一衔接子包含随机条形码。在一些实施例中,所述第二通用标记是转座体序列。在一些实施例中,所述第一衔接子包含测序引物结合位点。在一些实施例中,所述测序引物是P7或P5。在一些实施例中,所述第二衔接子包含随机条形码。在一些实施例中,所述第三通用标记是转座体序列。在一些实施例中,所述第二衔接子包含测序引物结合位点。在一些实施例中,所述测序引物是P7或P5。在一些实施例中,所述多个核酸中的每一个被固定在固体支持物上。在一些实施例中,所述固体支持物是珠粒。在一些实施例中,所述方法包括纯化固定在珠粒上的双链多核苷酸,其中所述双链多核苷酸是与所述第一衔接子、所述第二衔接子或两者连接的双链多核苷酸。
本文披露的一些实施例提供了试剂盒,所述试剂盒包含:多个固体支持物,其中所述固体支持物中的每一个包含多个核酸,所述多个核酸中的每一个包含第一通用标记序列;包含第二通用标记序列的核酸衔接子;和酶,其中所述酶是连接酶或转座酶。在一些实施例中,所述酶是连接酶。在一些实施例中,所述酶是转座酶。在一些实施例中,所述多个核酸包含不同的分子标记。在一些实施例中,所述多个核酸包含相同的细胞标记。在一些实施例中,所述多个固体支持物是多个珠粒。在一些实施例中,所述试剂盒包含一种或多种选自下组的其他酶,该组由以下各项组成:逆转录酶、DNA聚合酶、RNA酶、外切核酸酶或其任何组合。在一些实施例中,所述试剂盒还包含基底。在一些实施例中,所述基底包含微孔。
本文披露的一些实施例提供了用于对来自单个细胞的多个靶序列进行标记的方法,所述方法包括:将所述单个细胞提供到包含固定有多个核酸的固体支持物的分隔物上,所述多个核酸中的每一个包含第一通用标记;将所述单个细胞裂解以释放所述多个靶序列;将来自所述单个细胞的所述多个靶序列与所述多个核酸杂交;延伸所述多个核酸以产生多个第一链多核苷酸;向所述多个第一链多核苷酸添加衔接子序列,其中所述衔接子序列包含第二通用标记;并且使用所述第一通用标记和所述第二通用标记扩增所述多个第一链多核苷酸,从而产生包含所述多个靶序列的多个扩增子。在一些实施例中,所述衔接子序列由转座体添加。在一些实施例中,所述转座体包含转座酶和衔接子序列。在一些实施例中,所述衔接子是通过连接步骤添加。在一些实施例中,所述多个靶序列是mRNA。在一些实施例中,所述方法还包括使用所述多个第一链多核苷酸作为模板合成多个第二链多核苷酸。在一些实施例中,合成所述多个第二链多核苷酸包括用RNA酶切割所述多个mRNA,从而产生一个或多个mRNA引物。在一些实施例中,所述RNA酶是RNaseH。在一些实施例中,所述一个或多个mRNA引物中的至少一个的长度为至少15个核苷酸。在一些实施例中,所述方法还包括用聚合酶延伸所述一个或多个mRNA引物,从而产生延伸的区段。在一些实施例中,所述聚合酶具有5'-3'外切核酸酶活性。在一些实施例中,所述聚合酶包括DNA PolI。在一些实施例中,所述方法还包括用连接酶连接所述延伸的区段,从而产生第二链多核苷酸。在一些实施例中,所述方法还包括用链置换聚合酶延伸所述一个或多个mRNA引物,从而产生延伸的第二链。在一些实施例中,所述方法还包括从延伸的第二链去除所述一个或多个mRNA引物。在一些实施例中,所述多个扩增子包含全转录组扩增(WTA)产物。在一些实施例中,所述WTA产物包含单个细胞中至少10%的mRNA。在一些实施例中,所述WTA产物包含单个细胞中至少50%的mRNA。在一些实施例中,所述WTA产物包含单个细胞中至少90%的mRNA。在一些实施例中,所述多个扩增子中的每一个包含随机条形码。在一些实施例中,所述随机条形码包括分子标记、细胞标记、靶标特异性区域或其任何组合。在一些实施例中,所述方法还包括对所述多个扩增子进行测序以产生包含分子标记、细胞标记、靶标特异性区域或其任何组合的多个测序读段(read)。在一些实施例中,所述方法还包括使用所述细胞标记分析所述多个测序读段。在一些实施例中,所述方法还包括使用所述分子标记分析所述多个测序读段。在一些实施例中,所述分隔物是微孔。
本文披露的一些实施例提供了用于从多个单细胞产生全转录组扩增(WTA)产物的系统,所述系统包含:基底,所述基底包含多个分隔物,所述多个分隔物中的每一个包含单个细胞和固定有多个核酸的固体支持物,其中所述多个核酸中的每一个包含:第一通用标记;细胞标记;和分子标记;包含第二通用标记序列的核酸衔接子;和酶,其中所述酶是连接酶或转座酶。在一些实施例中,所述基底是微孔阵列。在一些实施例中,所述多个细胞包括一种或多种不同的细胞类型。在一些实施例中,所述一种或多种细胞类型选自下组,该组由以下各项组成:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移细胞、良性细胞、原代细胞、和循环细胞,或其任何组合。
在一方面,本披露提供了一种组合物,所述组合物包含:准对称的随机条形码化的核酸,所述准对称的随机条形码化的核酸包含:随机条形码序列,其包含第一通用标记;第二链合成引物序列,其包含第二通用标记,其中所述第二通用标记与所述第一通用标记是至多99%一致的。在一些实施例中,所述准对称的随机条形码化的核酸能够进行抑制PCR。在一些实施例中,所述链合成引物序列还包含限制性位点。在一些实施例中,所述第二通用标记是所述第一通用标记的子集。在一些实施例中,所述第二通用标记比所述第一通用标记短。在一些实施例中,所述第二通用标记比所述第一通用标记短至少1个核苷酸。在一些实施例中,所述第二通用标记比所述第一通用标记短至少2个核苷酸。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的5'端。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的3'端。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的3'和5'端之间。在一些实施例中,所述第二通用标记包含与所述第一通用标记相比而言的错配。在一些实施例中,所述第二通用标记与所述第一通用标记的至少80%杂交。在一些实施例中,在所述第一通用标记的长度的至少90%上所述第二通用标记与所述第一通用标记是至多99%一致的。在一些实施例中,所述第二通用标记与所述第一通用标记是不一致的。在一些实施例中,所述随机条形码包括靶结合区、分子标记、细胞标记、和通用标记,或其任何组合。在一些实施例中,所述靶结合区包含选自下组的序列,该组由以下各项组成:寡聚dT、随机多聚体和基因特异性序列。在一些实施例中,所述第一通用标记是第一测序读段引物序列。在一些实施例中,全转录组扩增标签还包含与均聚物尾互补的序列、基因特异性序列或随机多聚体。在一些实施例中,所述随机条形码化的核酸包含均聚物尾。在一些实施例中,所述第二链合成引物序列还包含限制性内切核酸酶切割位点。在一些实施例中,所述第一通用标记位于准对称的随机条形码化的核酸的一端,并且其中所述第二通用标记位于准对称的随机条形码化的核酸的另一端。在一些实施例中,所述第一通用标记位于准对称的随机条形码化的核酸的3'端,并且所述第二通用标记位于准对称的随机条形码化的核酸的5'端。在一些实施例中,所述准对称的随机条形码化的核酸是单链的。在一些实施例中,所述准对称的随机条形码化的核酸是双链的。
在一方面,本披露提供了一种用于破坏有条形码的核酸的对称性的方法,所述方法包括:产生准对称的随机条形码化的核酸,其包含随机条形码序列、第一通用标记和第二通用标记,其中所述第二通用标记与所述第一通用标记是至多99%一致的;并且鉴定来自所述准对称的随机条形码化的核酸的3'和5'测序读段,从而破坏所述准对称的随机条形码化的核酸的对称性。在一些实施例中,产生包括使靶RNA与随机条形码接触。在一些实施例中,所述随机条形码包括细胞标记、分子标记、所述第一通用标记、和靶结合区,或其任何组合。在一些实施例中,所述方法还包括逆转录所述随机条形码,从而产生包含所述靶RNA的互补序列的随机标记的cDNA。在一些实施例中,所述方法还包括向所述随机标记的cDNA附加3'均聚物尾。在一些实施例中,所述3'均聚物尾的长度为2-10个核苷酸。在一些实施例中,所述3'均聚物尾是聚A尾。在一些实施例中,所述方法还包括用包含与所述均聚物尾互补的序列和所述第二通用标记的第二链合成引物进行第二链合成,从而产生所述准对称的随机条形码化的核酸。在一些实施例中,与所述均聚物尾互补的序列包含聚T序列。在一些实施例中,与所述均聚物尾互补的序列包含聚U序列。在一些实施例中,所述引物还包含限制性内切核酸酶切割位点。在一些实施例中,所述方法还包括用全转录组扩增引物扩增所述准对称的随机条形码化的核酸。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的一部分杂交。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的至少18个核苷酸杂交。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的至多18个核苷酸杂交。在一些实施例中,所述全转录组扩增引物与从所述第二通用标记的5'端的约18个核苷酸杂交。在一些实施例中,还包括用限制性内切核酸酶切割所述限制性内切核酸酶切割位点,从而产生不对称的随机条形码化的核酸。在一些实施例中,所述不对称的随机条形码化的核酸不包含第二通用标记。在一些实施例中,产生3'和5'测序读段包括使所述不对称的随机条形码化的核酸与简并引物接触,从而产生不对称的读段产物。在一些实施例中,所述简并引物包含基因特异性序列、随机多聚体序列和第三通用标记,或其任何组合。在一些实施例中,所述第三通用标记是测序引物结合位点。在一些实施例中,所述第三通用标记不同于所述第一通用标记。在一些实施例中,所述方法还包括用文库扩增引物扩增所述不对称的读段产物。在一些实施例中,所述文库扩增引物的引物不结合至所述第二通用标记。在一些实施例中,所述文库扩增引物结合至所述第一通用标记和所述第三通用标记。在一些实施例中,所述方法还包括用包含所述第二通用标记和随机多聚体序列的简并引物进行第二链合成,从而产生所述准对称的随机条形码化的核酸。在一些实施例中,所述准对称的随机条形码化的核酸是单链的。在一些实施例中,所述方法还包括用全转录组扩增引物扩增所述准对称的随机条形码化的核酸。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的一部分杂交。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的至少18个核苷酸杂交。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的至多18个核苷酸杂交。在一些实施例中,所述全转录组扩增引物与从所述第二通用标记的5'端的约18个核苷酸杂交。在一些实施例中,鉴定包括对所述3'和5'测序读段进行测序。在一些实施例中,所述3'测序读段包含随机条形码序列。在一些实施例中,所述3'测序读段还包含所述第一通用标记、细胞标记和核酸序列的一部分,或其任何组合。在一些实施例中,所述5'测序读段包含限制性内切核酸酶切割位点和所述第二通用标记,或其任何组合。在一些实施例中,3'测序读段的数目为5'序列读段数目的至少2倍。在一些实施例中,5'测序读段的数目小于1,000。在一些实施例中,产生包括通过模板转换来添加切割位点和所述第二通用标记。在一些实施例中,产生包括通过体外转录来添加切割位点和所述第二通用标记。在一些实施例中,鉴定测序读段包括确定所述随机条形码和所述核酸的序列的一部分的序列。在一些实施例中,所述测序读段的长度为至少25个核苷酸。在一些实施例中,所述测序读段的长度为至少75个核苷酸。在一些实施例中,所述有条形码的核酸来自样品。在一些实施例中,所述样品包括单个细胞。在一些实施例中,所述样品包括多个细胞。在一些实施例中,所述多个细胞包括一种或多种不同的细胞类型。在一些实施例中,所述一种或多种细胞类型选自下组,该组由以下各项组成:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移细胞、良性细胞、原代细胞、和循环细胞,或其任何组合。在一些实施例中,所述样品包括实体组织。在一些实施例中,所述样品是从受试者获得的。在一些实施例中,所述受试者是选自下组的受试者,该组由以下各项组成:人、哺乳动物、狗、大鼠、小鼠、鱼、蝇、蠕虫、植物、真菌、细菌、病毒、脊椎动物和无脊椎动物。在一些实施例中,所述靶标是脱氧核糖核酸分子。在一些实施例中,所述方法还包括将单个细胞和单个珠粒分离到基底上的多个孔中,其中所述多个孔中的单个孔具有所述单个细胞和所述单个珠粒。在一些实施例中,所述基底包括至少1,000个孔。在一些实施例中,所述单个珠粒包含多个随机条形码。在一些实施例中,所述方法还包括将来自所述单个细胞的靶标与所述随机条形码杂交。在一些实施例中,所述多个随机条形码中的单独随机条形码具有不同的分子标记。在一些实施例中,所述多个随机条形码中的单独随机条形码具有相同的细胞标记。在一些实施例中,所述多个随机条形码中的单独随机条形码包含分子标记、细胞标记、所述第一通用标记、和靶结合区,或其任何组合。在一些实施例中,所述多个孔的不同孔中的随机条形码具有不同的细胞标记。在一些实施例中,所述方法还包括去除所述珠粒。在一些实施例中,去除是用磁体进行的。
在一方面,本披露提供了一种试剂盒,所述试剂盒包含:一组随机条形码,其中所述随机条形码组中的每个随机条形码包含靶标特异性区域;分子标记;细胞标记;和第一通用标记;第二链合成引物,其包含第二通用标记,其中所述第二通用标记与所述第一通用标记是至多99%一致的;和酶。在一些实施例中,所述随机条形码组中的单独随机条形码包含不同的分子标记。在一些实施例中,所述随机条形码组中的单独随机条形码包含相同的细胞标记。在一些实施例中,所述靶标特异性区域包含选自下组的序列,该组由以下各项组成:寡聚dT、随机多聚体和基因特异性序列。在一些实施例中,所述酶选自下组,该组由以下各项组成:逆转录酶、末端转移酶、RNA酶抑制剂、DNA聚合酶、限制性内切核酸酶、和外切核酸酶,或其任何组合。在一些实施例中,所述试剂盒还包含全转录组扩增引物。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的一部分杂交。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的至少18个核苷酸杂交。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的至多18个核苷酸杂交。在一些实施例中,所述全转录组扩增引物与从所述第二通用标记的5'端的约18个核苷酸杂交。在一些实施例中,所述第二通用标记与所述第一通用标记具有至少一个核苷酸的差异。在一些实施例中,所述第二通用标记比所述第一通用标记短至少一个核苷酸。在一些实施例中,所述第二通用标记比所述第一通用标记短至少两个核苷酸。在一些实施例中,所述第二通用标记比所述第一通用标记短两个核苷酸。在一些实施例中,所述第二通用标记包含作为第一通用标记序列的子集的序列。在一些实施例中,所述第二链合成引物包含切割位点。在一些实施例中,所述切割位点包括限制性内切核酸酶切割位点。在一些实施例中,所述试剂盒还包含使用说明书。在一些实施例中,所述试剂盒还包含一种或多种通用引物。在一些实施例中,所述一种或多种通用引物适于与第一和第二通用标记、第一通用标记或第二通用标记杂交。在一些实施例中,所述试剂盒还包含一组基因特异性引物。在一些实施例中,所述试剂盒还包含用于逆转录反应的试剂。在一些实施例中,所述试剂盒还包含用于聚合酶链式反应的试剂。在一些实施例中,所述试剂盒还包含用于限制性内切核酸酶切割反应的试剂。在一些实施例中,所述随机条形码组附接到固体支持物上。在一些实施例中,所述固体支持物包括珠粒。在一些实施例中,所述试剂盒还包含基底。在一些实施例中,所述基底包括微孔。
在一方面,本披露提供了一种用于使用衔接子连接进行全转录组扩增的方法,所述方法包括:使样品中的一个或多个mRNA靶标与包含第一通用标记的核酸接触;进行逆转录和第二链合成,从而产生标记的cDNA;将衔接子连接到标记的cDNA,从而产生准对称cDNA,其中所述衔接子包含第二通用标记;并且用全转录组扩增引物扩增所述衔接子连接的cDNA,从而产生全转录组扩增产物。在一些实施例中,所述核酸包含随机条形码。在一些实施例中,所述随机条形码包括分子标记、细胞标记、靶标特异性区域,或其任何组合。在一些实施例中,所述靶标特异性区域包含寡聚dT序列。在一些实施例中,第二链合成包括用RNA酶切割mRNA,从而产生mRNA引物。在一些实施例中,所述RNA酶是RNaseH。在一些实施例中,所述mRNA引物的长度为至少15个核苷酸。在一些实施例中,所述方法还包括用聚合酶延伸所述mRNA引物,从而产生延伸的区段。在一些实施例中,所述聚合酶包含5'-3'外切核酸酶活性。在一些实施例中,所述聚合酶包括DNA Pol I。在一些实施例中,所述方法还包括将延伸的区段与连接酶连接,从而产生第二链。在一些实施例中,所述衔接子是双链的。在一些实施例中,所述衔接子包含限制性内切核酸酶切割位点。在一些实施例中,所述第二通用标记是所述第一通用标记的子集。在一些实施例中,所述第二通用标记比所述第一通用标记短。在一些实施例中,所述第二通用标记比所述第一通用标记短至少1个核苷酸。在一些实施例中,所述第二通用标记比所述第一通用标记短至少2个核苷酸。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的5'端。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的3'端。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的3'和5'端之间。在一些实施例中,所述第二通用标记包含与所述第一通用标记相比而言的错配。在一些实施例中,所述第二通用标记与所述第一通用标记的至少80%杂交。在一些实施例中,在所述第一通用标记的长度的至少90%上所述第二通用标记与所述第一通用标记是至多99%一致的。在一些实施例中,所述第二通用标记与所述第一通用标记是不一致的。在一些实施例中,连接包括将所述衔接子连接到所述标记的cDNA的两条链上。在一些实施例中,所述衔接子包含单个5'磷酸化位点。在一些实施例中,在连接后,所述准对称cDNA在每条链的3'端包含相同的序列。在一些实施例中,所述相同的序列包含第二通用引物序列。在一些实施例中,所述全转录组扩增引物包含与所述衔接子上的第二通用引物序列互补的序列。在一些实施例中,所述全转录组扩增引物包含与所述衔接子上的第一通用引物序列互补的序列。在一些实施例中,扩增包括抑制性PCR。在一些实施例中,扩增包括半抑制性PCR。在一些实施例中,扩增包括所述准对称cDNA的一条链的线性扩增和另一条链的指数扩增。在一些实施例中,所述方法不是基因特异性的。在一些实施例中,扩增不是基因特异性的。在一些实施例中,至少5%的mRNA靶标被扩增。在一些实施例中,至少10%的mRNA靶标被扩增。在一些实施例中,至少15%的mRNA靶标被扩增。在一些实施例中,所述方法还包括对所述全转录组扩增产物进行测序。在一些实施例中,所述方法还包括对所述mRNA靶标的分子数目进行计数。在一些实施例中,计数包括对具有所述mRNA靶标的序列的每个全转录组扩增产物的独特分子标记数目进行计数。
在一方面,本披露提供了一种用于第二链合成的方法,所述方法包括:使样品中的mRNA靶标与包含第一通用标记的核酸接触;将所述mRNA靶标逆转录为标记的单链cDNA;用链置换聚合酶从所述标记的单链cDNA合成第二链;并且从具有包含所述第一通用标记的序列的第二链产生第三链,从而产生双链标记的cDNA。在一些实施例中,所述核酸包含随机条形码。在一些实施例中,所述随机条形码包括分子标记、细胞标记、靶标特异性区域、和通用标记,或其任何组合。在一些实施例中,接触包括将所述核酸的靶标特异性区域与所述mRNA杂交。在一些实施例中,所述靶标特异性区域包含寡聚dT序列。在一些实施例中,在逆转录后,将所述标记的单链cDNA与所述mRNA靶标杂交。在一些实施例中,合成包括用RNA酶切割所述mRNA,从而产生mRNA引物。在一些实施例中,所述RNA酶是RNaseH。在一些实施例中,所述mRNA引物的长度为至少15个核苷酸。在一些实施例中,所述方法还包括用链置换聚合酶延伸所述mRNA引物,从而产生延伸的区段。在一些实施例中,所述延伸的区段包含所述mRNA引物。在一些实施例中,所述方法还包括去除所述mRNA引物。在一些实施例中,去除包括用外切核酸酶去除。在一些实施例中,产生包括延伸所述第一通用标记以并入第二链的序列。在一些实施例中,所述方法还包括使所述双链cDNA的末端平端化。在一些实施例中,所述方法还包括向所述双链cDNA添加A突出端。在一些实施例中,所述方法还包括将衔接子连接到所述双链cDNA,从而产生准对称cDNA。在一些实施例中,所述衔接子是双链的。在一些实施例中,所述衔接子包含限制性内切核酸酶切割位点。在一些实施例中,所述衔接子包括第二通用标记。在一些实施例中,所述第二通用标记是所述第一通用标记的子集。在一些实施例中,所述第二通用标记比所述第一通用标记短。在一些实施例中,所述第二通用标记比所述第一通用标记短至少1个核苷酸。在一些实施例中,所述第二通用标记比所述第一通用标记短至少2个核苷酸。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的5'端。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的3'端。在一些实施例中,所述至少2个核苷酸位于所述第二通用标记的3'和5'端之间。在一些实施例中,所述第二通用标记包含与所述第一通用标记相比而言的错配。在一些实施例中,所述第二通用标记与所述第一通用标记的至少80%杂交。在一些实施例中,在所述第一通用标记的长度的至少90%上所述第二通用标记与所述第一通用标记是至多99%一致的。在一些实施例中,所述第二通用标记与所述第一通用标记是不一致的。在一些实施例中,连接包括将所述衔接子连接到所述标记的cDNA的两条链上。在一些实施例中,在连接后,所述衔接子连接的cDNA在每条链的3'端包含相同的序列。在一些实施例中,所述相同的序列包含第二通用引物序列。在一些实施例中,所述方法还包括用全转录组扩增引物扩增所述准对称cDNA。在一些实施例中,所述全转录组扩增引物包含与所述衔接子上的第二通用引物序列互补的序列。在一些实施例中,扩增包括抑制性PCR。在一些实施例中,扩增包括半抑制性PCR。在一些实施例中,扩增包括所述衔接子连接的cDNA的一条链的线性扩增和另一条链的指数扩增。在一些实施例中,所述方法不是基因特异性的。在一些实施例中,扩增不是基因特异性的。
在一方面,本披露提供了一种试剂盒,所述试剂盒包含:一组随机条形码,其中所述随机条形码组中的每个随机条形码包含靶标特异性区域;分子标记;细胞标记;和第一通用标记;衔接子,其包含第二通用标记,其中所述第二通用标记与所述第一通用标记是至多99%一致的;和酶。在一些实施例中,所述随机条形码组中的单独随机条形码包含不同的分子标记。在一些实施例中,所述随机条形码组中的单独随机条形码包含相同的细胞标记。在一些实施例中,所述靶标特异性区域包含选自下组的序列,该组由以下各项组成:寡聚dT、随机多聚体和基因特异性序列。在一些实施例中,所述酶选自下组,该组由以下各项组成:逆转录酶、末端转移酶、RNA酶抑制剂、DNA聚合酶、RNA酶、限制性内切核酸酶、和外切核酸酶,或其任何组合。在一些实施例中,所述试剂盒还包含全转录组扩增引物。在一些实施例中,所述全转录组扩增引物与所述第二通用标记的一部分杂交。在一些实施例中,所述全转录组扩增引物与所述第一通用标记的至少10个核苷酸杂交。在一些实施例中,所述全转录组扩增引物与所述第一通用标记的至多10个核苷酸杂交。在一些实施例中,所述全转录组扩增引物与从所述第一通用标记的5'端的约10个核苷酸杂交。在一些实施例中,所述第二通用标记与所述第一通用标记具有至少一个核苷酸的差异。在一些实施例中,所述第二通用标记比所述第一通用标记短至少一个核苷酸。在一些实施例中,所述第二通用标记比所述第一通用标记短至少两个核苷酸。在一些实施例中,所述第二通用标记比所述第一通用标记短两个核苷酸。在一些实施例中,所述第二通用标记包含作为第一通用标记序列的子集的序列。在一些实施例中,所述衔接子包含切割位点。在一些实施例中,所述切割位点包括限制性内切核酸酶切割位点。在一些实施例中,所述试剂盒还包含使用说明书。在一些实施例中,所述试剂盒还包含一种或多种通用引物。在一些实施例中,所述一种或多种通用引物适于与第一和第二通用标记、第一通用标记或第二通用标记杂交。在一些实施例中,所述试剂盒还包含用于逆转录反应的试剂。在一些实施例中,所述试剂盒还包含用于聚合酶链式反应的试剂。在一些实施例中,所述试剂盒还包含用于限制性内切核酸酶切割反应的试剂。在一些实施例中,所述随机条形码组附接到固体支持物上。在一些实施例中,所述固体支持物包括珠粒。在一些实施例中,所述试剂盒还包含基底。在一些实施例中,所述基底包括微孔。
在一方面,本披露提供了一种用于产生链特异性测序文库的方法,所述方法包括:使RNA片段与包含第一序列的引物接触;产生并入所述第一序列的双链cDNA;将衔接子连接到所述双链cDNA上,从而产生不对称衔接子连接的cDNA,其中所述不对称衔接子连接的cDNA的测序读段指示链特异性。在一些实施例中,所述第一序列包含第一测序引物序列的一部分。在一些实施例中,所述第一序列包含样品条形码。在一些实施例中,所述第一序列包含分子条形码。在一些实施例中,产生包括逆转录、第二链合成。在一些实施例中,所述衔接子是双链的。在一些实施例中,所述衔接子连接到所述双链cDNA的3'端、5'端、或3'端和5'端二者。在一些实施例中,所述衔接子包含第二序列。在一些实施例中,所述第二序列包含第二测序引物序列的一部分。在一些实施例中,所述第二序列包含样品条形码。在一些实施例中,所述方法还包括扩增所述不对称衔接子连接的cDNA,由此产生不对称扩增子。在一些实施例中,扩增包括用第一引物和第二引物进行PCR扩增。在一些实施例中,所述第一引物与所述第一序列的至少一部分杂交。在一些实施例中,所述第二引物与第二序列的至少一部分杂交。在一些实施例中,所述第一和第二引物包含有待添加到所述衔接子连接的cDNA中的其他序列。在一些实施例中,所述其他序列包括其他流式细胞序列。在一些实施例中,所述其他序列包括其他测序引物序列。在一些实施例中,所述其他序列包括样品条形码。在一些实施例中,所述方法还包括将通用序列并入所述RNA中。在一些实施例中,并入包括使用PolyA聚合酶。在一些实施例中,所述读段中的一些并入所述衔接子的序列。在一些实施例中,所述读段对应于所述双链cDNA的第一链。在一些实施例中,所述读段中的一些并入所述第一序列的序列。在一些实施例中,所述读段对应于所述双链cDNA的第二链。在一些实施例中,通过所述测序读段的读段是否包含所述衔接子或所述第一序列的序列来确定链特异性。在一些实施例中,所述RNA选自下组,该组由以下各项组成:mRNA、非编码RNA、lncRNA、miRNA、双链RNA和单链RNA。在一些实施例中,所述方法不包括降解所述双链cDNA的一条链。在一些实施例中,所述方法还包括对所述扩增子进行测序。
在一方面,本披露提供了一种用于产生链特异性测序文库的方法,所述方法包括:使DNA片段与包含第一序列的引物接触;延伸所述引物,从而产生DNA序列拷贝;并且将衔接子连接到所述DNA序列拷贝的一端,其中所述衔接子包含第二序列,从而产生不对称衔接子连接的cDNA,其中所述不对称衔接子连接的cDNA的测序读段指示链特异性。在一些实施例中,所述第一序列包含第一测序引物序列的一部分。在一些实施例中,所述第一序列包含样品条形码。在一些实施例中,所述第一序列包含分子条形码。在一些实施例中,产生包括逆转录、第二链合成。在一些实施例中,所述衔接子是双链的。在一些实施例中,所述衔接子连接到所述双链cDNA的3'端、5'端、或3'端和5'端二者。在一些实施例中,所述第二序列包含第二测序引物序列的一部分。在一些实施例中,所述第二序列包含样品条形码。在一些实施例中,所述方法还包括扩增所述不对称衔接子连接的cDNA,由此产生不对称扩增子。在一些实施例中,扩增包括用第一引物和第二引物进行PCR扩增。在一些实施例中,所述第一引物与所述第一序列的至少一部分杂交。在一些实施例中,所述第二引物与第二序列的至少一部分杂交。在一些实施例中,所述第一和第二引物包含有待添加到所述衔接子连接的cDNA中的其他序列。在一些实施例中,所述其他序列包括其他流式细胞序列。在一些实施例中,所述其他序列包括其他测序引物序列。在一些实施例中,所述其他序列包括样品条形码。在一些实施例中,所述方法还包括将通用序列并入所述RNA中。在一些实施例中,并入包括使用末端转移酶。在一些实施例中,所述读段中的一些并入所述衔接子的序列。在一些实施例中,所述读段对应于所述双链cDNA的第一链。在一些实施例中,所述读段中的一些并入所述第一序列的序列。在一些实施例中,所述读段对应于所述双链cDNA的第二链。在一些实施例中,通过所述测序读段的读段是否包含所述衔接子或所述第一序列的序列来确定链特异性。在一些实施例中,所述方法不包括降解所述双链cDNA的一条链。
附图说明
本发明的新颖特征在所附权利要求书中具体阐述。通过参考对说明性实施例进行阐述的以下详细说明,将获得对本发明的特征和优点的更好理解,在所述实施例中利用了本发明的原理,并且在所述附图中:
图1展示了本披露的均聚物加尾方法的示例性实施例。
图2展示了用于破坏准对称的随机条形码化的核酸的对称性的示例性实施例。
图3展示了本披露的随机引发方法的示例性实施例。
图4描绘了本披露的示例性随机条形码。
图5描绘了本披露的随机条形码化方法的示例性实施例的示意图。
图6A、图6B和图6C描绘了实例1中使用的示例性衔接子连接方法的效率和质量产量。
图7描绘了使用实例2中使用的示例性衔接子连接方法的WTA产物的核酸尺寸分布。
图8A和图8B描绘了实例2和3中使用的示例性方法的效率。图8A示出了使用如图15中描述的第二链合成方法的效率。图8B示出了使用如图16中描述的切割和延伸方法的效率。
图9A和图9B描绘了图8B中的产物的(A)琼脂糖凝胶和(B)质量产量。
图10描绘了使用实例4中的示例性均聚物加尾方法的WTA产物的生物分析仪迹线。
图11描绘了从用实例5中的示例性均聚物加尾方法制得的WTA产物制备的测序文库的生物分析仪迹线。
图12描绘了实例6中的示例性限制性酶消化方法所映射的读段的百分比。
图13描绘了使用实例6中的示例性衔接子连接方法的样品的碱基含量的fastQC数据。
图14示出了同时使用限制性酶切割和错配WTA引物(例如,第二通用引物)所映射的读段的百分比。
图15描绘了本披露的衔接子连接方法的示例性实施例。
图16描绘了本披露的RNA酶引发方法的示例性实施例。
图17描绘了在本披露的方法中使用的示例性衔接子。
图18A和图18B比较了实例13的示例性衔接子连接方法的效率,使用1ng RNA/孔(A)和10pg RNA/孔(B)。
图19示出了使用实例13的示例性衔接子连接方法的1ng/孔或10pg/孔总RNA之间的相关。
图20A和图20B是图18和图19中生成的数据的图形表示。图20A是将UHRR(通用人类参考RNA)孔与人类脑参考RNA(HBRR)孔清楚分离的PCA图;图20B是用于PCA连同分层聚类的基因的热图,其示出了聚类在一起的所有相似RNA类型。
图21示出了展示使用模板转换进行本披露的全转录组扩增方法的示例性实施例的示意图。
图22A和图22B示出了证实用实例7的方法将示例性衔接子连接至附接到固体支持物上的核酸的数据。
图23示出高抑制衔接子防止引物二聚体形成。
图24A和图24B示出了从单独的珠粒(A)或与细胞组合(B)产生的全转录组扩增产物。
图25A和图25B示出了从图24产生的样品的WTA产物(A)和文库制备(B)的生物分析仪迹线。
图26展示了使用本披露的衔接子连接方法进行RNA-seq文库制备的示例性实施例。
图27展示了使用本披露的衔接子连接方法进行DNA-seq文库制备的示例性实施例。
图28A和图28B示出了外切核酸酶处理对本披露的WTA衔接子连接方法的影响。
图29示出了用本披露的全转录组方法分析1ng RNA的示例性实验方案。
图30示出了用本披露的全转录组方法分析10pg RNA的示例性实验方案。
图31示出了展示使用用珠粒进行的衔接子连接的本披露全转录组扩增方法的示例性实施例的示意图。
图32示出了展示使用基于转录组的片段化和用珠粒进行的连接的本披露全转录组扩增方法的示例性实施例的示意图。
图33A、图33B、图33C和图33D示出了使用基于转录组的片段化和用珠粒进行的连接和用珠粒进行的衔接子连接的TWA分析的示例性结果。
具体实施方式
定义
除非另有定义,否则本文使用的所有技术术语具有与本披露所属领域的本领域普通技术人员通常理解的相同的含义。如本说明书和所附权利要求书中使用的,除非上下文另有明确指示,否则单数形式“一个/一种(a/an)”和“所述(the)”包括复数的提及物。除非另有说明,否则本文中“或”的任何提及旨在包含“和/或”。
如本文使用的,术语“转录组”是指样品(例如,单个细胞或细胞群)中的所有转录物(如信使RNA(mRNA)分子、小干扰RNA(siRNA)分子、转运RNA(tRNA)分子、核糖体RNA(rRNA)分子)的集合。在一些实施例中,转录组不仅指转录物的种类(如mRNA种类),而且指样品中每种种类的量。在一些实施例中,转录组包括样品中的每个mRNA分子,如单个细胞中的所有mRNA分子。
如本文使用的,术语“关联”或“与……相关联”可意指两个或更多个种类可以被识别为在某个时间点处同位。关联可意指两个或更多个种类在或曾经在相似的容器内。关联可以是信息学关联,其中例如关于两个或更多个种类的数字信息被存储并且可以用于确定所述种类中的一个或多个在某个时间点处同位。关联也可以是物理关联。在一些情况下,两个或更多个相关种类彼此“拴系”、“附接”或“固定”,或“拴系”、“附接”或“固定”到共同的固体或半固体表面上。关联可以指用于将标记附接到固体或半固体支持物(如珠粒)上的共价或非共价方式。关联可以包括靶标与标记之间的杂交。
如本文使用的,术语“互补性”可以指两个核苷酸之间精确配对的能力。例如,如果核酸的在给定位置的核苷酸能够与另一个核酸的核苷酸以氢键结合,则两个核酸被认为在所述位置处是彼此互补的。两单链核酸分子之间的互补性可以是“部分的”,其中这些核苷酸中仅一些结合,或者当这些单链分子之间存在完全互补性时,这种互补性可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补,则可以认为第一核苷酸序列是第二序列的“互补体”。如果第一核苷酸序列互补于和第二序列相反的序列(即,核苷酸顺序相反),则可以认为第一核苷酸序列是第二序列的“反向互补体”。如本文使用的,术语“互补体”、“互补”和“反向互补体”可以互换使用。从本披露可以理解,如果一个分子可以与另一个分子杂交,则其可以是杂交的分子的互补体。
如本文使用的,术语“数字计数”可以指用于估计样品中靶分子数目的方法。数字计数可以包括确定已经与样品中的靶标相关联的独特标记的数目的步骤。这种随机方法将计数分子的问题从相同分子的定位和鉴定之一转化为有关检测到一组预定义标记的一系列是/否数字问题。
如本文使用的,术语“第一通用标记”可以指对于本披露的条形码而言通用的标记。第一通用标记可以是测序引物结合位点(例如,读段引物结合位点,即对于亿明达(Illumina)测序仪)。
如本文使用的,术语(多个)“标记”可以指与样品中的靶标相关联的核酸代码。标记可以是例如核酸标记。标记可以是完全或部分可扩增的标记。标记可以是完全或部分可测序的标记。标记可以是可鉴定为有区别的天然核酸的一部分。标记可以是已知的序列。标记可以包含核酸序列的接点,例如天然和非天然序列的接点。如本文使用的,术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如,在各种实施例中,可以使用标记来确定样品的身份、样品的来源、细胞的身份和/或靶标。
如本文使用的,术语“非耗尽性储库(non-depleting reservoir)”可以指由许多不同标记组成的随机条形码池。非耗尽性储库可以包含大量不同的随机条形码,使得当非耗尽性储库与靶标池相关联时,每个靶标可能与独特的随机条形码相关联。每个标记的靶分子的独特性可以通过随机选择的统计来确定,并且取决于与多样的标记相比在集合中相同的靶分子的拷贝数。所得的标记的靶分子集合的大小可以通过条形码化处理的随机性质来确定,然后对检测到的随机条形码的数目的分析允许计算原始集合或样品中存在的靶分子的数目。当存在的靶分子的拷贝数与独特的随机条形码的数目的比率低时,标记的靶分子是高度独特的(即,用给定的标记来标记多于一个靶分子的概率非常低)。
如本文使用的,“核酸”通常可指多核苷酸序列或其片段。核酸可以包含核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可以包含一种或多种类似物(例如改变的骨架、糖或核碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶,肽核酸、异种核酸、吗啉代、锁核酸、二醇核酸、苏糖核酸、双脱氧核苷酸、虫草素、7-脱氮杂-GTP、荧光团(例如与糖连接的罗丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱类似物、CpG岛、甲基-7-鸟苷、甲基化核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷和怀俄苷。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。
核酸可以包含一种或多种修饰(例如,碱基修饰、骨架修饰),以为核酸提供新的或增强的特征(例如,改进的稳定性)。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两个最常见的类别是嘌呤和嘧啶。核苷酸可以是还包含与核苷的糖部分共价连接的磷酸基团的核苷。对于包含呋喃戊糖的那些核苷,磷酸基团可以连接到糖的2'、3'或5'羟基部分。在形成核酸中,磷酸基团可以将相邻的核苷彼此共价连接以形成线性高分子化合物。转而此线性高分子化合物的各自末端可以进一步接合而形成环状化合物;然而,线性化合物通常是合适的。此外,线性化合物可以具有内部核苷酸碱基互补性,并且因此可以按产生完全或部分双链化合物的方式折叠。在核酸中,磷酸基团通常可以提及为形成核酸的核苷间骨架。核酸的连键或骨架可以是3'到5'磷酸二酯键。
核酸可以包含修饰的骨架和/或修饰的核苷间键。修饰的骨架可以包括在骨架中保留磷原子和在骨架中不具有磷原子的那些。其中含有磷原子的合适修饰的核酸骨架可以包含例如硫代磷酸酯;手性硫代磷酸酯;二硫代磷酸酯;磷酸三酯;氨基烷基磷酸三酯;甲基膦酸酯和其他烷基膦酸酯,如3'-亚烷基膦酸酯、5'-亚烷基膦酸酯;手性膦酸酯;亚磷酸酯;包括3'-氨基磷酰胺酯和氨基烷基磷酰胺酯的磷酰胺酯;磷二酰胺酯;硫代羰基磷酰胺酯;硫代羰基烷基膦酸酯;硫代羰基烷基磷酸三酯;硒代磷酸酯;以及具有正常3'-5'键的硼烷磷酸酯,2'-5'连接的类似物和具有反向极性的那些,其中一个或多个核苷酸间键是3'至3'、5'至5'或2'至2'键。
核酸可以包含由短链烷基或环烷基核苷间键、混合杂原子、和烷基或环烷基核苷间键或者一个或多个短链杂原子的或杂环的核苷间键形成的多核苷酸骨架。这些可包括具有以下结构的那些:吗啉代键(从核苷的糖部分部分地形成);硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰乙酰基和硫代甲酰乙酰基骨架;亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架;核糖乙酰基骨架;含烯的骨架;氨基磺酸盐骨架;亚甲亚氨基和亚甲肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;和具有混合的N、O、S和CH2组分部分的其他骨架。
核酸可以包含核酸模拟物。术语“模拟物”可以旨在包括其中只有呋喃糖环或呋喃糖环和核苷酸间键两者被非呋喃糖基团替代的多核苷酸,仅替代呋喃糖环也可以称为糖替代物。可以保持杂环碱基部分或修饰的杂环碱基部分以便与适当的靶核酸杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中,多核苷酸的糖骨架可以被含酰胺的骨架(特别是氨基乙基甘氨酸骨架)替代。核苷酸可以被保持并且直接或间接地结合至骨架的酰胺部分的氮杂氮原子上。PNA化合物中的骨架可以包含两个或更多个连接的氨基乙基甘氨酸单元,其给予PNA含酰胺的骨架。杂环碱基部分可以直接或间接地结合到骨架的酰胺部分的氮杂氮原子上。
核酸可以包含吗啉代骨架结构。例如,核酸可以包含代替核糖环的6元吗啉代环。在这些实施例的一些中,磷二酰胺酯或其他非磷酸二酯核苷间键可替代磷酸二酯键。
核酸可以包含具有附接到吗啉代环上的杂环碱基的连接的吗啉代单元(即吗啉代核酸)。连接基团可以连接吗啉代核酸中的吗啉代单体单元。非离子型基于吗啉代的寡聚化合物可以与细胞蛋白具有较少的不希望的相互作用。基于吗啉代的多核苷酸可以是核酸的非离子模拟物。吗啉代类别中的多种化合物可以使用不同的连接基团连接。另一类多核苷酸模拟物可称为环己烯基核酸(CeNA)。通常存在于核酸分子中的呋喃糖环可以被环己烯基环替代。可以制备CeNA DMT保护的亚磷酰胺单体,并用于使用亚磷酰胺化学的寡聚化合物合成。将CeNA单体并入核酸链可以增加DNA/RNA杂交体的稳定性。CeNA寡聚腺苷酸可以与具有和天然复合物相似的稳定性的核酸互补体形成复合物。另外的修饰可以包括锁核酸(LNA),其中2'-羟基基团连接到糖环的4'碳原子,从而形成2'-C,4'-C-氧亚甲基键联,由此形成双环糖部分。键联可以是桥连2'氧原子和4'碳原子的基团亚甲基(—CH2-),其中n是1或2。LNA和LNA类似物可以显示与互补核酸非常高的双重热稳定性(Tm=+3℃到+10℃)、对于3'-外切核酸水解降解的稳定性和良好的溶解特性。
核酸还可以包括核碱基(通常简称为“碱基”)修饰或取代。如本文使用的,“未修饰的”或“天然的”核碱基可以包括嘌呤碱基(例如腺嘌呤(A)和鸟嘌呤(G))、以及嘧啶碱基(例如胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。修饰的核碱基可以包括其他合成以及天然的核碱基,如5-甲基胞嘧啶(5-me-C),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基以及其他烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基以及其他烷基衍生物,2-硫尿嘧啶,2-硫胸腺嘧啶以及2-硫胞嘧啶,5-卤代尿嘧啶以及胞嘧啶,5-丙炔基(—C═C—CH3)尿嘧啶及胞嘧啶以及嘧啶碱基的其他炔基衍生物,6-偶氮基尿嘧啶,胞嘧啶以及胸腺嘧啶,5-尿嘧啶(假尿嘧啶),4-硫尿嘧啶,8-卤基、8-氨基、8-巯基、8-硫烷基、8-羟基以及其他8-取代的腺嘌呤和鸟嘌呤,5-卤基特别是5-溴、5-三氟甲基以及其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮杂鸟嘌呤和7-脱氮杂腺嘌呤、以及3-脱氮杂鸟嘌呤和3-脱氮杂腺嘌呤。修饰的核碱基可以包括三环嘧啶如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮),G-夹(clamp)如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)苯并噁嗪-2(3H)-酮),咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮),吡啶并吲哚胞苷(H吡啶并(3′,′:4,5)吡咯并[2,3-d]嘧啶-2-酮)。
如本文使用的,术语“准对称的随机条形码化的核酸”可以指包含本披露的随机条形码和末端的分子,所述末端足够对称以杂交在一起而形成锅柄结构(例如,用于抑制PCR)但可以不是相同的。准对称的随机条形码化的核酸可以表现为类似于对称的核酸,但具有不对称的序列。
如本文使用的,术语“样品”可以指包含靶标的组合物。用于通过披露的方法、装置和系统进行分析的合适样品包括细胞、单细胞、组织、器官或生物体。
如本文使用的,术语“采样装置”或“装置”可以指可以取一部分样品和/或将所述部分放置在基底上的装置。采样装置可以指例如荧光激活细胞分选(FACS)机、细胞分选机、活检针、活检装置、组织切片装置、微流体装置、叶栅和/或超薄切片机。
如本文使用的,术语“第二通用标记”可以指对于本披露的条形码而言通用的标记。第二通用标记可以是测序引物结合位点(例如,读段引物结合位点,即对于亿明达测序仪)的修饰形式。第二通用标记可以是本披露的标记(例如,第一通用标记)的修饰形式。
如本文使用的,术语“固体支持物”可以指可以附接多个随机条形码的离散固体或半固体表面。固体支持物可以包括任何类型的实心的、多孔的或空心的球体、球、承座、圆柱体或其他类似配置,其由塑料、陶瓷、金属或高分子材料(例如,水凝胶)构成,其上可以固定核酸(例如,共价地或非共价地)。固体支持物可以包括可以是球形(例如,微球体)或具有非球形或不规则形状(如立方体、长方体、金字塔形、圆柱形、圆锥形、椭圆形或圆盘状等)的离散粒子。以阵列间隔开的多个固体支持物可以不包括基底。固体支持物可以与术语“珠粒”互换使用。
固体支持物可以指“基底”。基底可以是一种固体支持物。基底可以指可以在其上进行本披露的方法的连续的固体或半固体表面。例如,基底可以指阵列、盒、芯片、装置和载玻片。如本文使用的,“固体支持物”和“基底”可以互换使用。
如本文使用的,术语“随机条形码”可以指包含本披露标记的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可用于对样品中的靶标定量。随机条形码可用于控制标记与靶标相关联后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶标相关联的随机条形码可以称为随机条形码-靶标或随机条形码-标签-靶标。
如本文使用的,术语“随机条形码化”可以指核酸的随机标记(例如,条形码化)。随机条形码化可以利用递归泊松策略来关联并对与靶标相关的标记进行定量。如本文使用的,术语“随机条形码化”可以与“随机标记”互换使用。
如本文使用的,术语“靶标”可以指可与随机条形码相关联的组合物。用于通过披露的方法、装置和系统进行分析的示例性合适靶标包括寡核苷酸、DNA、RNA、mRNA、微小RNA、tRNA等。靶标可以是单链的或双链的。在一些实施例中,靶标可以是蛋白质。在一些实施例中,靶标是脂质。
术语“逆转录酶”可以指具有逆转录酶活性(即,催化从RNA模板合成DNA)的一组酶。通常,此类酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶、细菌逆转录酶、II型内含子衍生的逆转录酶,及其突变体、变体或衍生物。非逆转录病毒逆转录酶包括非LTR逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶和II型内含子逆转录酶。II型内含子逆转录酶的实例包括乳酸乳球菌Ll.LtrB内含子逆转录酶、细长嗜热聚球藻(Thermosynechococcus elongatus)TeI4c内含子逆转录酶或嗜热脂肪土芽孢杆菌GsI-IIC内含子逆转录酶。其他类别的逆转录酶可以包括许多类型的非逆转录病毒逆转录酶(即,逆转录子、II型内含子、以及多样性产生型逆转录元件等等)。
术语“模板转换”可以指逆转录酶从初始核酸序列模板转换到新核酸序列模板的3'端的能力,新核酸序列模板的3'端与从初始模板合成的核酸的3'端几乎没有或没有互补性。可以使用模板转换来制备靶多核苷酸的核酸拷贝。模板转换允许例如使用从初始核酸序列模板转换到新核酸序列模板的3'端的逆转录酶制备DNA拷贝,新核酸序列模板的3'端与从初始模板合成的DNA的3'端几乎没有或没有互补性,从而允许将衔接子序列直接连接到靶寡核苷酸序列(不用连接)的连续产物DNA的合成。模板转换可以包括衔接子的连接、均聚物加尾(例如,多聚腺苷酸化)、随机引物或聚合酶可以关联的寡核苷酸。
随机条形码
如本文使用的,术语“随机条形码”是指可用于随机标记(例如,条形码化、标签化)靶标的多核苷酸序列。随机条形码可以包含一个或多个标记。示例性标记可以包括通用标记、细胞标记、分子标记、样品标记、板标记、空间标记和/或前空间标记。图4展示了本披露的示例性随机条形码。随机条形码404可以包含可将随机条形码连接到固体支持物405上的5'胺。在一些实施例中,随机条形码可以包含通用标记、维度标记、空间标记、细胞标记和/或分子标记。在一些实施例中,通用标记可以是5'端标记。在一些实施例中,分子标记可以是3'端标记。在一些实施例中,空间标记、维度标记和细胞标记可以是任何顺序的。在一些实施例中,通用标记、空间标记、维度标记、细胞标记和分子标记是任何顺序的。在一些实施例中,随机条形码可以包含靶结合区。在一些实施例中,靶结合区可以与样品中的靶标(例如,靶核酸、RNA、mRNA、DNA)相互作用。例如,靶结合区可以包含可与mRNA的聚A尾相互作用的寡聚dT序列。在一些实施例中,随机条形码的标记(例如,通用标记、维度标记、空间标记、细胞标记和分子标记)可以由或由约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个或更多个核苷酸分开。
随机条形码可以例如包含一个或多个通用标记。对于随机条形码组中的所有随机条形码(例如,附接到给定的固体支持物上的),一个或多个通用标记可以是相同的。在一些实施例中,对于附接到多个珠粒上的所有随机条形码,一个或多个通用标记可以是相同的。在一些实施例中,通用标记可以包含能够与测序引物杂交的核酸序列。在一些实施例中,测序引物可用于对包含通用标记的随机条形码测序。在一些实施例中,测序引物(例如,通用测序引物)可以包括与高通量测序平台相关联的测序引物。在一些实施例中,通用标记可以包含能够与PCR引物杂交的核酸序列。在一些实施例中,通用标记可以包含能够与测序引物和PCR引物杂交的核酸序列。在一些实施例中,能够与测序引物或PCR引物杂交的通用标记的核酸序列可以称为引物结合位点。在一些实施例中,通用标记可以包含可用于起始随机条形码转录的序列。在一些实施例中,通用标记可以包含可用于延伸随机条形码或随机条形码内的区域的序列。在一些实施例中,通用标记的长度可以是或可以至少是约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。在一些实施例中,通用标记可以包含至少约10个核苷酸。在一些实施例中,通用标记的长度可以是或可以至多是约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。在一些实施例中,可切割接头或修饰的核苷酸可以是通用标记序列的一部分,以使随机条形码能够从支持物上被切割下来。如本文使用的,通用标记可以与“通用PCR引物”互换使用。
在一些实施例中,随机条形码可以包含一个或多个维度标记。维度标记可以包含提供关于随机标记发生的维度的信息的核酸序列。例如,维度标记可以提供关于靶标被随机条形码化的时间的信息。在一些实施例中,维度标记可以与样品中随机条形码化的时间相关联。在一些实施例中,维度标记可以在随机标记时激活。在一些实施例中,可以在不同的时间激活不同的维度标记。在一些实施例中,维度标记提供关于靶标、靶标组和/或样品被随机条形码化的顺序的信息。例如,细胞群可以在细胞周期的G0期被随机条形码化。在一些实施例中,可以在细胞周期的G1期用随机条形码再次对细胞脉冲。可以在细胞周期的S期用随机条形码再次对细胞脉冲,以此类推。每个脉冲(例如,细胞周期的每个阶段)处的随机条形码可以包含不同的维度标记。以这种方式,维度标记提供关于哪些靶标在细胞周期的哪个阶段被标记的信息。在一些实施例中,维度标记可以探询许多不同的生物学时间。示例性生物学时间可以包括但不限于细胞周期、转录(例如,转录起始)和转录物降解。在另一个实例中,样品(例如,细胞、细胞群)可以在用药物和/或疗法治疗之前和/或之后随机标记。不同靶标的拷贝数的变化可以指示样品对药物和/或疗法的反应。
维度标记可以是可激活的。例如,可以在特定时间点激活可激活的维度标记。可激活的维度标记可以被组成性地激活(例如,不关闭)。可激活的维度标记可以被可逆地激活(例如,可激活的维度标记可以打开和关闭)。维度标记可以被可逆地激活至少1、2、3、4、5、6、7、8、9或10次或更多次。维度标记可以被可逆地激活至少1、2、3、4、5、6、7、8、9或10次或更多次。维度标记可以用荧光、光、化学事件(例如,切割、连接另一分子、添加修饰(例如,聚乙二醇化、sumo化、乙酰化、甲基化、脱乙酰化、去甲基化))、光化学事件(例如,光笼蔽)、以及引入非天然核苷酸来激活。
维度标记对于附接到给定固体支持物(例如,珠粒)上的所有随机条形码可以是相同的,但对于不同的固体支持物(例如,珠粒)是不同的。在一些实施例中,相同固体支持物上的至少60%、70%、80%、85%、90%、95%、97%、99%或100%的随机条形码可以包含相同的维度标记。在一些实施例中,相同固体支持物上的至少60%的随机条形码可以包含相同的维度标记。在一些实施例中,相同固体支持物上的至少95%的随机条形码可以包含相同的维度标记。
可以存在在多个固体支持物(例如,珠粒)中呈现的104、105、106、107、108、109、1010个或更多个独特的维度标记序列。维度标记的长度可以是至少或至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。在一些实施例中,维度标记的长度可以是或是至多约300、200、100、90、80、70、60、50、40、30、20、15、12、10、9、8、7、6、5、4个或更少或更多个核苷酸。在一些实施例中,维度标记包含从约5至约200个核苷酸。在一些实施例中,维度标记包含从约10至约150个核苷酸。在一些实施例中,维度标记的长度包含从约20至约125个核苷酸。
随机条形码可以包含一个或多个空间标记。空间标记可以包含提供与随机条形码相关联的靶分子的空间取向的信息的核酸序列。在一些实施例中,空间标记可以与样品中的坐标相关联。在一些实施例中,坐标可以是固定坐标。例如,坐标可以相对于基底是固定的。在一些实施例中,空间标记可以参考二维或三维网格。在一些实施例中,坐标可以相对于界标是固定的。在一些实施例中,界标在空间中可以是可识别的。在一些实施例中,界标可以是可成像的结构。在一些实施例中,界标可以是生物结构,例如解剖学界标。在一些实施例中,界标可以是细胞界标,例如细胞器。在一些实施例中,界标可以是非天然界标,如具有可识别标识符(如颜色代码、条形码、磁性、荧光、放射性或独特尺寸或形状)的结构。在一些实施例中,空间标记可以与物理分隔物(例如孔、容器或液滴)相关联。在一些情况下,多个空间标记一起用于编码空间中的一个或多个位置。
空间标记对于附接到给定固体支持物(例如,珠粒)上的所有随机条形码可以是相同的,但对于不同的固体支持物(例如,珠粒)是不同的。在一些实施例中,相同固体支持物上的至少60%、70%、80%、85%、90%、95%、97%、99%或100%的随机条形码可以包含相同的空间标记。在一些实施例中,相同固体支持物上的至少60%的随机条形码可以包含相同的空间标记。在一些实施例中,相同固体支持物上的至少95%的随机条形码可以包含相同的空间标记。
可以存在在多个固体支持物(例如,珠粒)中呈现的104、106、106、107、108、109、1010个或更多个独特的空间标记序列。空间标记的长度可以是或是至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。空间标记的长度可以是或是至多约300、200、100、90、80、70、60、50、40、30、20、15、12、10、9、8、7、6、5、4个或更少或更多个核苷酸。在一些实施例中,空间标记包含从约5至约200个核苷酸。在一些实施例中,空间标记包含从约10至约150个核苷酸。在一些实施例中,空间标记的长度包含从约20至约125个核苷酸。
随机条形码可以包含一个或多个细胞标记(即,样品标记)。如本文使用的,术语“样品标记”和“细胞标记”可互换使用。细胞标记可以包含提供用于确定哪个靶核酸来自哪个细胞的信息的核酸序列。在一些实施例中,细胞标记对于附接到给定固体支持物(例如,珠粒)上的所有随机条形码是相同的,但对于不同的固体支持物(例如,珠粒)是不同的。在一些实施例中,相同固体支持物上的至少60%、70%、80%、85%、90%、95%、97%、99%或100%的随机条形码可以包含相同的细胞标记。在一些实施例中,相同固体支持物上的至少60%的随机条形码可以包含相同的细胞标记。在一些实施例中,相同固体支持物上的至少95%的随机条形码可以包含相同的细胞标记。
可以存在在多个固体支持物(例如,珠粒)中呈现的104、106、106、107、108、109、1010个或更多个独特的细胞标记序列。细胞标记的长度可以是或是至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。细胞标记的长度可以是或是至多约300、200、100、90、80、70、60、50、40、30、20、15、12、10、9、8、7、6、5、4个或更少或更多个核苷酸。在一些实施例中,细胞标记包含从约5至约200个核苷酸。在一些实施例中,细胞标记包含从约10至约150个核苷酸。在一些实施例中,细胞标记的长度包含从约20至约125个核苷酸。
随机条形码可以包含一个或多个分子标记。分子标记可以包含为与随机条形码杂交的特定类型的靶核酸种类提供识别信息的核酸序列。分子标记可以包含为与随机条形码杂交的靶核酸种类的特定出现提供计数器的核酸序列。在一些实施例中,将一组不同的分子标记附接到给定的固体支持物(例如,珠粒)上。在一些实施例中,可以存在附接到给定固体支持物(例如,珠粒)上的104、106、106、107、108、109、1010个或更多个独特的分子标记序列。在一些实施例中,可以存在附接到给定固体支持物(例如,珠粒)上的多达105个或更多个独特的分子标记序列。在一些实施例中,可以存在附接到给定固体支持物(例如,珠粒)上的104、106、106、107、108、109、1010个或更多个独特的分子标记序列。在一些实施例中,可以存在附接到给定固体支持物(例如,珠粒)上的多达102、103、104、106、106、107、108、109、1010个或更多个独特的分子标记序列。在一些实施例中,可以存在附接到给定固体支持物(例如,珠粒)上的多达10、102、103、104、106个或更多个独特的分子标记序列。分子标记的长度可以是或是至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。分子标记的长度可以是或是至多约300、200、100、90、80、70、60、50、40、30、20、15、12、10、9、8、7、6、5、4个或更少核苷酸。
随机条形码可以包含一个或多个靶结合区。在一些实施例中,靶结合区可以包含与靶标(例如,靶核酸、靶分子,例如待分析的细胞核酸)(例如特定基因序列)特异性地杂交的核酸序列。在一些实施例中,靶结合区可以包含可附接(例如,杂交)至特定靶核酸的特定位置的核酸序列。在一些实施例中,靶结合区可以包含能够与限制性位点突出端(例如EcoRI粘性末端突出端)进行特异性杂交的核酸序列。然后随机条形码可以连接到包含与限制性位点突出端互补的序列的任何核酸分子。
靶结合区可以例如与感兴趣的靶标杂交。例如,靶结合区可以包含可与包含聚腺苷酸化末端的mRNA杂交的寡聚dT。靶结合区可以是基因特异性的。例如,靶结合区可以被配置为与靶标的特定区域杂交。靶结合区的长度可以是或是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个或更多个核苷酸。靶结合区的长度可以是或是至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个或更多个核苷酸。靶结合区的长度可以为从5-30个核苷酸。当随机条形码包含基因特异性靶结合区时,随机条形码可以称为基因特异性随机条形码。
靶结合区可以包含一个或多个非特异性靶核酸序列。非特异性靶核酸序列可以指独立于靶核酸的特定序列可与多个靶核酸结合的序列。例如,靶结合区可以包含与mRNA分子上的聚A尾杂交的随机多聚体序列或寡聚-dT序列。随机多聚体序列可以是例如随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或任何长度的更高多聚体序列。在一些实施例中,对于附接到给定珠粒上的所有随机条形码,靶结合区是相同的。在一些实施例中,对于附接到给定珠粒上的多个随机条形码,靶结合区可以包含两个或更多个不同的靶结合序列。靶结合区的长度可以是或是至少约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。靶结合区的长度可以是或是至多约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。
随机条形码可以包含一种或多种可用于定向(例如,比对)随机条形码的定向特性。随机条形码可以包含用于等电聚焦的一个或多个部分。在一些实施例中,不同的随机条形码可以包含不同的等电聚焦点。例如,在一些实施例中,当将这些随机条形码引入样品中时,样品可以进行等电聚焦,以便将随机条形码定向成已知的方式。以这种方式,可以使用定向特性来开发样品中随机条形码的已知映射。示例性定向特性可以包括电泳迁移率(例如,基于随机条形码的尺寸)、等电点、自旋、电导率和/或自组装。例如,随机条形码可以包含自组装的定向特性,其可以在激活时自组装成特定取向(例如,核酸纳米结构)。
随机条形码可以包含一种或多种亲和特性。例如,空间标记可以包含亲和特性。在一些实施例中,亲和特性可以包括可促进随机条形码与另一实体(例如,细胞受体)结合的化学和/或生物部分。例如,亲和特性可以包含抗体。在一些实施例中,抗体可以对样品上的特定部分(例如,受体)是特异性的。在一些实施例中,抗体可以将随机条形码引导到特定细胞类型或分子上。在特定细胞类型或分子处的和/或附近的靶标可以被随机标记。除了空间标记的核苷酸序列之外,亲和特性还可以提供空间信息,因为抗体可以将随机条形码引导到特定位置。抗体可以是治疗性抗体、单克隆抗体或多克隆抗体。抗体可以是人源化的或嵌合的。抗体可以是裸抗体或融合抗体。
抗体可以指全长(即,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如,IgG抗体)或免疫球蛋白分子的免疫活性(即,特异性结合)部分(像抗体片段)。
在一些实施例中,抗体可以是抗体片段。抗体片段可以是例如抗体的一部分,如F(ab')2、Fab'、Fab、Fv、sFv等。在一些实施例中,抗体片段可以与全长抗体识别的相同抗原结合。在一些实施例中,抗体片段可以包括由抗体的可变区组成的分离的片段,如由重链和轻链的可变区组成的“Fv”片段和其中轻链和重链可变区通过肽接头连接的重组单链多肽分子(“scFv蛋白”)。示例性抗体可以包括但不限于癌细胞抗体、病毒抗体、结合至细胞表面受体(CD8、CD34、CD45)的抗体和治疗性抗体。
本披露的细胞标记和/或任何标记还可以包含一组独特的具有限定长度的核酸子序列,例如,每个为7个核苷酸(相当于一些汉明纠错码中使用的位数),其被设计为提供纠错能力。可以设计包含7个核苷酸序列的纠错子序列组,使得所述组中的序列的任何成对组合展现出定义的“遗传距离”(或错配碱基数),例如一组纠错子序列可被设计为展现3个核苷酸的遗传距离。在一些实施例中,用于产生纠错码的核酸子序列的长度可以变化,例如它们的长度可以是至少3个核苷酸、至少7个核苷酸、至少15个核苷酸、或至少31个核苷酸。在一些实施例中,可以使用其他长度的核酸子序列来产生纠错码。
在一些实施例中,随机条形码在其中可以包含用于纠错的纠错序列(例如,汉明码)。汉明码可以参考基于能够纠正单个位错误的固有冗余鉴别独特的二进制码的运算过程。例如,汉明码可以与核酸条形码匹配,以便筛选在核酸扩增期间发生的单核苷酸错误。通过使用汉明码鉴别单核苷酸错误,从而可以允许核酸条形码的纠正。
当随机条形码包含多于一种类型的标记(例如,多于一种细胞标记或多于一种分子标记)时,所述标记可以穿插着接头标记序列。例如,接头标记序列的长度可以是或是至少约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。在一些实施例中,接头标记序列的长度可以是或是至多约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。在一些实施例中,接头标记序列的长度是12个核苷酸。在一些实施例中,可以使用接头标记序列来促进随机条形码的合成。在一些实施例中,接头标记可以包括纠错(例如,汉明)码。
准对称的随机条形码化的核酸
本披露提供了包含准对称的随机条形码化的核酸的组合物。准对称的随机条形码化的核酸可以包含本披露的随机条形码。准对称的随机条形码化的核酸可以包含准对称的两端。准对称的随机条形码化的核酸可以包含任何靶序列和/或任何长度的核酸。例如,准对称的随机条形码化的核酸可以是RNA(例如,mRNA、miRNA、tRNA、lncRNA、非编码RNA、编码RNA等),DNA(例如,基因组DNA、内含子、外显子、编码区、非编码区等)或其组合。准对称的随机条形码化的核酸的长度可以是或是至少10、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、或1000个或更多个核苷酸。准对称的随机条形码化的核酸的长度可以是或是至多10、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、或1000个或更多个核苷酸。
准对称的随机条形码化的核酸可以包含准对称的两端。两端可以包含通用标记(例如,随机条形码上的通用标记(本文是第一通用标记))和来自衔接子的通用标记(本文是第二通用标记))。衔接子的通用标记(例如,第二通用标记)可以与随机条形码上的通用标记(例如在单链cDNA分子的5'端上,例如第一通用标记)相同。第二通用标记可以包含作为第一个通用标记子集的序列。例如,第二通用标记可以包含第一通用标记的序列的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%。第二通用标记可以包含第一通用标记的序列的至多10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%。第二通用标记可以比或至少比第一通用标记短或长1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。第二通用标记可以比或至多比第一通用标记短或长1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。在一些实施例中,第二通用标记比第一通用标记短2个核苷酸。通用标记与第一通用标记的差异可以为至少1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。通用标记与第一通用标记的差异可以为至多1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。第二通用标记与第一通用标记可以是至多99%、98%、7%、96%、95%、94%、93%、92%、91%或90%或更少一致的。第二通用标记与所述第一通用标记可以是不一致的。在至少50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的所述第一通用标记上,第二通用标记可以与第一通用标记杂交。在50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的第一通用标记上,第二通用标记可以是或是至多与第一通用标记99%一致的。第一通用标记的序列可以是测序引物结合位点(例如,亿明达读段2序列)。第二通用标记的序列可以是修饰的测序引物结合位点(例如,亿明达修饰的读段2序列)。
在一些实施例中,第一通用标记和第二通用标记能够彼此杂交(例如,用于抑制PCR)。在一些实施例中,第一和第二通用标记能以至少1、2、3、4、5、6、7、8、9或10个或更多个错配杂交。在一些实施例中,第一和第二通用标记能以至多1、2、3、4、5、6、7、8、9或10个或更多个错配杂交。杂交的程度可以与抑制PCR过程中发生的抑制量有关。例如,可以强烈杂交的序列比弱杂交的序列可以被抑制更多。
固体支持物
本文披露的随机条形码可以附接到固体支持物(例如,珠粒、基底)上。如本文使用的,术语“拴系”、“附接”和“固定”可互换使用,并且可以指用于将随机条形码附接到固体支持物上的共价或非共价方式。可以将多种不同的固体支持物中的任何一种用作固体支持物,以用于附接预先合成的随机条形码或用于随机条形码的原位固相合成。
在一些实施例中,固体支持物是珠粒(例如,磁性或聚合物珠粒)。珠粒可以包括任何类型的实心的、多孔的或空心的球体、球、承座、圆柱体或其他类似配置,其由塑料、陶瓷、金属或高分子材料构成,其上可以固定核酸(例如,共价地或非共价地)。珠粒可以包括可以是球形(例如,微球体)或具有非球形或不规则形状(如立方体、长方体、金字塔形、圆柱形、圆锥形、椭圆形或圆盘状等)的离散粒子。珠粒的形状可以是非球形的。
本文披露的珠粒可以包括多种材料中的一种或多种,包括但不限于顺磁材料(例如镁、钼、锂和钽)、超顺磁材料(例如铁氧体(Fe3O4;磁铁矿)纳米粒子)、铁磁材料(例如铁、镍、钴、它们的一些合金和一些稀土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙及其任何组合。
珠粒的直径可以变化,例如是或是至少约5μm、10μm、20μm、25μm、30μm、35μm、40μm、45μm或50μm。珠粒的直径可以是至多约5μm、10μm、20μm、25μm、30μm、35μm、40μm、45μm或50μm。在一些实施例中,珠粒的直径可以与基底的孔的直径相关。例如,珠粒的直径可以比孔的直径长或短至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠粒的直径可以比孔的直径长或短至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠粒的直径可以与细胞(例如,由基底的孔截留的单个细胞)的直径有关。珠粒的直径可以比细胞的直径长或短至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、或300%或更多。珠粒的直径可以比细胞的直径长或短至多10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、或300%或更多。
珠粒可以附接到和/或包埋在基底中。例如,珠粒可以附接到和/或包埋在凝胶、水凝胶、聚合物和/或基质中。可以使用存在于可用作位置地址的珠粒上的随机条形码上的空间标记来鉴别基底(例如,凝胶、基质、支架或聚合物)内的珠粒的空间位置。
珠粒的实例可以包括但不限于链霉亲和素珠粒、琼脂糖珠粒、磁珠粒、微珠粒、缀合抗体的珠粒(例如,抗免疫球蛋白微珠粒)、缀合A蛋白的珠粒、缀合G蛋白的珠粒、缀合A/G蛋白的珠粒、缀合L蛋白的珠粒、缀合寡聚dT的珠粒、二氧化硅珠粒、二氧化硅样珠粒、抗生物素微珠粒、抗荧光染料微珠粒以及BcMagTM羧基封端的磁珠粒。
在一些实施例中,珠粒可以关联(例如浸渍)量子点或荧光染料,以使其在一个荧光光通道或多个光通道中发荧光。在一些实施例中,珠粒可以与氧化铁或氧化铬相关联以使其具有顺磁性或铁磁性。在一些实施例中,珠粒可以是可鉴别的。在一些实施例中,珠粒可以使用相机成像。在一些实施例中,珠粒可以具有与珠粒相关联的可检测代码。例如,珠粒可以包含RFID标签。在一些实施例中,珠粒包含可检测标签(例如,UPC代码、电子条形码、蚀刻标识符)。在一些实施例中,珠粒可以改变尺寸,例如由于在有机或无机溶液中的溶胀。珠粒可以是疏水的或亲水的。在一些实施例中,珠粒是生物相容的。
可以使固体支持物(例如,珠粒)可视化。固体支持物可以包含可视化标签(例如,荧光染料)。固体支持物(例如,珠粒)可以例如用标识符(例如,数字)蚀刻。在一些实施例中,可以通过对固体支持物(例如,珠粒)进行成像而使标识符可视化。
固体支持物可由一种或多种不溶性的、半溶性的和不溶性的材料制成或包含一种或多种不溶性的、半溶性的和不溶性的材料。当固体支持物包括接头、支架、结构单元或附接至其上的其他反应性部分时,它可以被称为“官能化的”,而当固体支持物缺少附接至其上的这样一个反应性部分时,它可以被称为“非官能化的”。固体支持物可以在溶液中不受约束地利用,如以微量滴定孔形式;以流通形式,如在柱中;或在试纸条(dipstick)中。
固体支持物可以包括膜、纸、塑料、涂覆的表面、平表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以例如采取树脂、凝胶、微球或其他几何构型的形式。固体支持物可以例如包括二氧化硅芯片、微粒子、纳米粒子、板、阵列、毛细管、平支持物如玻璃纤维过滤器、玻璃表面、金属表面(钢、金、银、铝、硅以及铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、包括多孔板或膜的塑料材料(例如,由聚乙烯、聚丙烯、聚酰胺、聚偏二氟乙烯形成)、和/或晶片、梳状物(comb)、针或针头(例如,适于组合合成或分析的针阵列)、或平表面(如晶片(例如,硅晶片)、带有具有或不具有滤底的凹陷的晶片)的凹陷或纳升孔的阵列中的珠粒。
固体支持物可以例如包括聚合物基质(例如,凝胶、水凝胶)。在一些实施例中,聚合物基质能够渗透细胞内空间(例如,在细胞器周围)。在一些实施例中,聚合物基质能够在整个循环系统中泵送。
固体支持物可以是生物分子。例如,固体支持物可以是核酸、蛋白质、抗体、组蛋白、细胞隔室、脂质、碳水化合物等。在一些实施例中,作为生物分子的固体支持物可被扩增、翻译、转录、降解和/或修饰(例如,聚乙二醇化、sumo化、乙酰化、甲基化)。除了附接至生物分子的空间标记之外,作为生物分子的固体支持物可以例如提供空间和时间信息。例如,生物分子可以在未修饰时包含第一确认,但是在修饰时可以改变为第二确认。不同的构象可以将本披露的随机条形码暴露于靶标。例如,生物分子可以包含由于生物分子的折叠而不可接近的随机条形码。在修饰生物分子(例如,乙酰化)时,生物分子可以改变构象以暴露随机标记。修饰的时间设置可以为本披露的随机条形码化的方法提供另外的时间维度。
在一些实施例中,包含本披露的随机条形码的生物分子可以位于细胞的细胞质中。激活时,生物分子可以移动到细胞核,于此可以进行随机条形码化。以这种方式,生物分子的修饰可以编码由随机条形码鉴别的靶标的另外的空间-时间信息。
维度标记可以提供关于生物事件(例如,细胞分裂)的空间-时间的信息。例如,可以将维度标记添加到第一细胞,第一细胞可以分裂产生第二子细胞,第二子细胞可以包含维度标记的全部、一些或不包含维度标记。维度标记可以在原始细胞和子细胞中激活。以这种方式,维度标记可以提供关于随机条形码在不同空间中的时间的信息。
基底
基底可以指一种固体支持物。基底可以指可包含本披露的随机条形码的固体支持物。基底可以包括多个微孔。微孔可以包括具有确定体积的小反应室。微孔可以截留一个或多个细胞。在一些实施例中,微孔只能截留一个细胞。在一些实施例中,微孔可以截留一个或多个固体支持物。在一些实施例中,微孔只能截留一个固体支持物。在一些实施例中,微孔截留单个细胞和单个固体支持物(例如,珠粒)。在一些实施例中,微孔的尺寸被确定为使其仅能截留单个细胞。在一些实施例中,微孔的尺寸被确定为使其仅能截留单个固体支持物(例如,珠粒)。在一些实施例中,微孔的尺寸被确定为使其仅能截留单个细胞和单个固体支持物(例如,珠粒)。
微孔阵列的微孔能以多种形状和尺寸制造。适宜的几何形状包括但不限于圆柱形、圆锥形、半球形、矩形或多面体(例如,由若干平面组成的三维几何体,例如六角柱、八角柱、倒三棱锥、倒四棱锥、倒五棱锥、倒六棱椎或倒截棱锥)。微孔可以包括组合了这些几何形状中的两种或更多种的形状。例如,微孔可以是部分圆柱形的,其余部分具有倒锥形的形状。微孔可以包括两个并排的圆柱体,其中一个的直径(例如大致对应于珠粒的直径)比另一个(例如大致对应于细胞的直径)大,其通过延伸圆柱体全长(深度)的竖直通道(即平行于圆柱体轴线)连接。微孔的开口可以在基底的上表面。微孔的开口可以在基底的下表面。微孔的封闭端(或底部)可以是平的。微孔的封闭端(或底部)可以具有弯曲表面(例如,凸形或凹形)。微孔的形状和/或尺寸可以基于有待被捕获在微孔内的细胞或固体支持物的类型来确定。
基底的孔之间的部分可具有拓扑结构。例如,基底的孔之间的部分可以是圆形的。基底的孔之间的部分可以是尖的。基底的孔之间的间隔部分可以是平的。基底的孔之间的部分可以不是平的。在一些情况下,基底的孔之间的部分是圆形的。换言之,基底的不包括孔的部分可以具有弯曲表面。可以将弯曲表面制造为使得弯曲表面的最高点(例如,顶点)可以位于两个或更多个孔的边缘之间的最远点处(例如,与孔等距)。可以将弯曲表面制造为使得弯曲表面的开始处位于第一微孔的边缘,并产生在第二微孔结束时结束的抛物线。这种抛物线可以在二维上延伸,以在孔的六角网格上捕获附近的微孔。可以将弯曲表面制造为使得孔之间的表面比孔的开口的平面更高和/或更弯曲。弯曲表面的高度可以是或是至少0.1、0.5、1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、或7微米或更大微米。弯曲表面的高度可以是或是至多0.1、0.5、1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、或7微米或更大微米。
微孔尺寸可以例如按照孔的直径和深度来表征。如本文使用的,微孔的直径是指可以内切于微孔几何体的平面横截面内的最大圆。微孔的直径的范围可以是有待捕获在微孔内的细胞或固体支持物的直径的从约1倍至约10倍。微孔直径可以是有待捕获在微孔内的细胞或固体支持物的直径的至少1倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍或至少10倍。微孔直径可以是有待捕获在微孔内的细胞或固体支持物的直径的至多10倍、至多5倍、至多4倍、至多3倍、至多2倍、至多1.5倍或至多1倍。微孔直径可以是有待捕获在微孔内的细胞或固体支持物的直径的约2.5倍。
微孔的直径可以例如按照绝对尺寸来指定。例如,微孔的直径的范围可以是从约5至约60微米。微孔直径可以是至少5微米、至少10微米、至少15微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少45微米、至少50微米、或至少60微米。微孔直径可以是至多60微米、至多50微米、至多45微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米、至多15微米、至多10微米、或至多5微米。微孔直径可以是约30微米。
可以将微孔深度选择为提供细胞和固体支持物的有效捕获。可以将微孔深度选择为提供包含在孔内的测定缓冲液和其他试剂的有效交换。可以将直径与高度的比率(即,纵横比)选择为使得一旦细胞和固体支持物沉入微孔内,它们将不会因微孔上方的流体运动而移位。可以将微孔的尺寸选择为使得微孔具有足够的空间以容纳各种尺寸的固体支持物和细胞,而不会因微孔上方的流体运动而被逐出。微孔的深度的范围可以是有待捕获在微孔内的细胞或固体支持物的直径的从约1倍至约10倍。微孔深度可以是有待捕获在微孔内的细胞或固体支持物的直径的至少1倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍或至少10倍。微孔深度可以是有待捕获在微孔内的细胞或固体支持物的直径的至多10倍、至多5倍、至多4倍、至多3倍、至多2倍、至多1.5倍或至多1倍。微孔深度可以是有待捕获在微孔内的细胞或固体支持物的直径的约2.5倍。
微孔的深度可以例如按照绝对尺寸来指定。例如,微孔的深度的范围可以是从约10至约60微米。例如,微孔深度可以是至少10微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少50微米、或至少60微米。例如,微孔深度可以是至多60微米、至多50微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米、或至多10微米。微孔深度可以是约30微米。
微孔的体积可以变化,例如范围为从约200皮米3至约120,000皮米3。微孔体积可以是至少200皮米3、至少500皮米3、至少1,000皮米3、至少10,000皮米3、至少25,000皮米3、至少50,000皮米3、至少100,000皮米3、或至少120,000皮米3。微孔体积可以是至多120,000皮米3、至多100,000皮米3、至多50,000皮米3、至多25,000皮米3、至多10,000皮米3、至多1,000皮米3、至多500皮米3、或至多200皮米3。微孔体积可以是约25,000皮米3。微孔体积可以落在由这些值中的任何值限定的任何范围内(例如从约18,000皮米3至约30,000皮米3)。
微孔的体积也可以变化,例如为至少5、10、15、20、25、30、35、40、45或50纳升3或更多纳升3。微孔的体积可以是至多5、10、15、20、25、30、35、40、45或50纳升3或更多纳升3。可以容纳在微孔中的液体的体积可以是至少5、10、15、20、25、30、35、40、45或50纳升3或更多纳升3。可以容纳在微孔中的液体的体积可以是至多5、10、15、20、25、30、35、40、45或50纳升3或更多纳升3。微孔的体积可以是至少5、10、15、20、25、30、35、40、45或50皮升3或更多皮升3。微孔的体积可以是至多5、10、15、20、25、30、35、40、45或50皮升3或更多皮升3。可以容纳在微孔中的液体的体积可以是至少5、10、15、20、25、30、35、40、45或50皮升或更多皮升3。可以容纳在微孔中的液体的体积可以是至多5、10、15、20、25、30、35、40、45或50皮升3或更多皮升3
微孔的体积可以按照微孔之间的体积变化进一步表征。微孔体积的变异系数(以百分数表示)的范围可以是从约1%至约10%。微孔体积的变异系数可以是至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、或至少10%。微孔体积的变异系数可以是至多10%、至多9%、至多8%、至多7%、至多6%、至多5%、至多4%、至多3%、至多2%、或至多1%。微孔体积的变异系数可以具有在这些值所包含的范围内(例如在约1.5%和约6.5%之间)的任何值。在一些实施例中,微孔体积的变异系数可以是约2.5%。
在本披露的方法、装置和系统中使用的微孔体积与珠粒表面积(或可附接随机条形码寡核苷酸的固体支持物的表面积)的比率的范围可以是例如从约2.5至约1,520微米。所述比率可以是至少2.5、至少5、至少10、至少100、至少500、至少750、至少1,000、或至少1,520。所述比率可以是至多1,520、至多1,000、至多750、至多500、至多100、至多10、至多5、或至多2.5。所述比率可以为约67.5。微孔体积与珠粒(或用于固定的固体支持物)的表面积的比率可以落在由这些值中的任何值限定的任何范围内(例如从约30至约120)。
微孔阵列的孔可以排列成一维、二维或三维阵列。例如,可以通过堆叠一系列两个或更多个二维阵列(即,通过堆叠包括微孔阵列的两个或更多个基底)来实现三维阵列。
可以选择微孔之间的模式和间隔,以优化在每个孔中捕获单个细胞和单个固体支持物(例如,珠粒)的效率,并且使每单位面积的阵列中的孔的数目最大化。微孔可以根据多种随机或非随机模式进行分布。例如,它们可以完全随机分布在阵列基底的表面上,或者它们可以排列成方格、矩形网格、六边形网格等。在一些情况下,微孔以六边形排列。孔之间的中心到中心距离(或间距)可以在从约5微米到约75微米之间变化。在一些情况下,微孔之间的间距为约10微米。在其他实施例中,孔之间的间距是至少5微米、至少10微米、至少15微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少45微米、至少50微米、至少55微米、至少60微米、至少65微米、至少70微米、或至少75微米。微孔间距可以是至多75微米、至多70微米、至多65微米、至多60微米、至多55微米、至多50微米、至多45微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米、至多15微米、至多10微米、至多5微米。微孔间距可以为约55微米。微孔间距可以落在由这些值中的任何值限定的任何范围内(例如从约18微米至约72微米)。
微孔阵列在微孔之间可以包括表面特征,其被设计成帮助引导细胞和固体支持物进入孔和/或防止它们沉降在孔之间的表面上。适合的表面特征的实例可以包括但不限于环绕孔或跨过孔之间的表面的圆顶形的、脊形的或峰形的表面特征。
微孔阵列中的孔的总数目可以由孔的模式和间隔以及阵列的总尺寸决定。阵列中的微孔数目的范围可以是从约96至约5,000,000或更多。阵列中的微孔数目可以是至少96、至少384、至少1,536、至少5,000、至少10,000、至少25,000、至少50,000、至少75,000、至少100,000、至少500,000、至少1,000,000或至少5,000,000。阵列中的微孔数目可以是至多5,000,000、至多1,000,000、至多75,000、至多50,000、至多25,000、至多10,000、至多5,000、至多1,536、至多384或至多96个孔。阵列中的微孔数目可以为约96。微孔数目可以为约150,000。阵列中的微孔数目可以落在由这些值中的任何值限定的任何范围内(例如从约100至325,000)。
微孔阵列可以使用多种制造技术中的任何一种来制造。可以使用的制造方法的实例包括但不限于体微机械加工技术,如光刻法和湿化学蚀刻、等离子蚀刻或深反应离子蚀刻;微模塑和微压花;激光微机械加工;3D打印或使用可固化材料的其他直接写入制造工艺;以及类似技术。
微孔阵列可以由多种基底材料中的任何一种制造。材料的选择可以取决于制造技术的选择,反之亦然。适合的材料的实例可以包括但不限于硅、熔融二氧化硅、玻璃、聚合物(例如,琼脂糖、明胶、水凝胶、聚二甲基硅氧烷(PDMS;弹性体)、聚甲基丙烯酸甲酯(PMMA)、聚碳酸酯(PC)、聚丙烯(PP)、聚乙烯(PE)、高密度聚乙烯(HDPE)、聚酰亚胺、环烯烃聚合物(COP)、环烯烃共聚物(COC)、聚对苯二甲酸乙二酯(PET)、环氧树脂、基于硫醇烯的树脂、金属或金属膜(例如,铝、不锈钢、铜、镍、铬和钛)等。在一些情况下,微孔包含光学粘合剂。在一些情况下,微孔由光学粘合剂制成。在一些情况下,微孔阵列包含PDMS和/或由PDMS制成。在一些情况下,微孔由塑料制成。亲水材料可期望用于制造微孔阵列(例如以增强润湿性并使细胞和其他生物材料的非特异性结合最小化)。也可以使用可被处理或涂覆(例如通过氧等离子体处理或聚环氧乙烷表面层的接枝)的疏水材料。使用多孔亲水材料来制造微孔阵列可以是令人希望的,以便有助于装置中截留的气泡的毛细管芯吸/通气。微孔阵列可以由单一材料制成。微孔阵列可以包括已经结合在一起或机械连接的两种或更多种不同的材料。
微孔阵列可以使用具有多种尺寸和形状中的任何一种的基底来制造。例如,在其内制造微孔的基底的形状(或足迹)可以是方形、矩形、圆形或不规则形状。微孔阵列基底的足迹可以类似于微量滴定板的足迹。微孔阵列基底的足迹可以类似于标准显微镜载玻片的足迹,例如约75mm长×25mm宽(约3”长×1”宽)或约75mm长×50mm宽(约3”长×2”宽)。在其内制造微孔的基底的厚度的范围可以是从约0.1mm厚至约10mm厚或更厚。微孔阵列基底的厚度可以是至少0.1mm厚、至少0.5mm厚、至少1mm厚、至少2mm厚、至少3mm厚、至少4mm厚、至少5mm厚、至少6mm厚、至少7mm厚、至少8mm厚、至少9mm厚或至少10mm厚。微孔阵列基底的厚度可以是至多10mm厚、至多9mm厚、至多8mm厚、至多7mm厚、至多6mm厚、至多5mm厚、至多4mm厚、至多3mm厚、至多2mm厚、至多1mm厚、至多0.5mm厚或至多0.1mm厚。微孔阵列基底的厚度可以为约1mm厚。微孔阵列基底的厚度可以是这些范围内的任何值,例如,微孔阵列基底的厚度可以在约0.2mm和约9.5mm之间。微孔阵列基底的厚度可以是均匀的。
多种表面处理和表面改性技术可以用于改变微孔阵列表面的特性。实例可以包括但不限于氧等离子体处理以使得疏水材料表面更亲水、使用湿或干蚀刻技术以使玻璃和硅表面光滑(或粗糙)、将聚氧乙烯或其他聚合物层(如普朗尼克)、或牛血清白蛋白吸附或接枝到基底表面以使它们更亲水并且更不易于生物分子和细胞的非特异性吸附、使用硅烷反应以将化学反应性官能团接枝到另外的惰性硅和玻璃表面等。光脱保护技术可以用于选择性地活化阵列结构中的特定位置处的化学反应性官能团,例如,选择性添加或活化微孔的内壁上的化学反应性官能团(如伯胺或羧基基团)可以用于将寡核苷酸探针、肽、蛋白质或其他生物分子共价偶联至微孔壁。利用的表面处理或表面改性的选择可取决于所希望的表面特性的类型和制成微孔阵列的材料的类型两者或任一者。
可以例如在细胞裂解步骤期间密封微孔的开口,以防止靶核酸在相邻微孔之间的交叉杂交。微孔(或微孔的阵列)可以使用例如夹靠在微孔阵列基底的表面的柔性膜或固体材料的片材(即板或台板)或者合适的珠粒进行密封或封盖,其中珠粒的直径大于微孔的直径。
使用柔性膜或固体材料的片材形成的密封件可以包括例如无机纳米孔膜(例如,氧化铝)、透析膜、载玻片、盖玻片、弹性膜(例如PDMS)、或亲水性聚合物膜(例如,涂覆有已经用裂解缓冲液水合的琼脂糖薄膜的聚合物膜)。
用于封盖微孔的固体支持物(例如,珠粒)可以包括本披露的任何固体支持物(例如,珠粒)。在一些情况下,固体支持物是交联的葡聚糖珠粒(例如,Sephadex)。交联葡聚糖的范围可以是从约10微米至约80微米。用于封盖的交联葡聚糖珠粒可以为从20微米至约50微米。在一些实施例中,珠粒可以比微孔的直径大至少约10%、20%、30%、40%、50%、60%、70%、80%或90%。用于封盖的珠粒可以比微孔的直径大至多约10%、20%、30%、40%、50%、60%、70%、80%或90%。
密封件或盖可以允许缓冲液穿进穿出微孔,同时阻止大分子(例如,核酸)从孔中迁移出来。通过密封件或盖可以阻挡至少约1、2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19、或20个或更多个核苷酸的大分子迁移进入或离开微孔。通过密封件或盖可以阻挡至多约1、2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19、或20个或更多个核苷酸的大分子迁移进入或离开微孔。
固体支持物(例如,珠粒)可以分布在基底中。可以将固体支持物(例如,珠粒)分布在基底的孔中,从基底的孔中除去,或者经离心或其他非磁性方式通过包含一个或多个微孔阵列的装置以其他方式传输。可以在基底的微孔上预先加载固体支持物。基底的微孔可以容纳至少1、2、3、4或5个或更多个固体支持物。基底的微孔可以容纳至多1、2、3、4或5个或更多个固体支持物。在一些情况下,基底的微孔可以容纳一个固体支持物。
可以使用微孔的替代物来区室化单独的细胞和珠粒,例如,单个固体支持物和单个细胞可以被限制在乳液中的单个液滴中(例如在液滴数字微流体系统中)。
细胞可以潜在地限制在其自身包含多个拴系随机条形码的多孔珠粒内。可以在任何类型的容器、微容器、反应室、反应容器等中区室化单独的细胞和固体支持物。
可以在不使用微孔的情况下进行单细胞随机条形码化。可以在不使用任何物理容器的情况下进行单细胞随机条形码化测定。例如,在没有物理容器的情况下随机条形码化可以通过在聚合物层或凝胶层内将细胞和珠粒包埋为彼此极为接近以在不同的细胞/珠粒对之间产生扩散屏障来进行。在另一个实例中,在没有物理容器的情况下随机条形码化可以在原位、体内、在完整的实体组织、完整的细胞和/或亚细胞上进行。
微孔阵列可以是测定系统的消耗性部件。微孔阵列可以是可重复使用的。微孔阵列可以被配置为用作手动进行测定的独立式装置,或者它们可以被配置为包括提供测定程序的全部或部分自动化的仪器系统的固定的或可移除的部件。在披露的方法的一些实施例中,随机条形码的基于珠粒的文库可以作为测定程序的一部分沉积在微孔阵列的孔中。在一些实施例中,珠粒可以预先加载到微孔阵列的孔中,并且作为例如用于进行核酸靶标的随机条形码化和数字计数的试剂盒的一部分提供给使用者。
在一些实施例中,可以提供两个成对的微孔阵列,一个预先加载有由第一磁体保持在适当位置的珠粒,而另一个用于由使用者加载单独的细胞。在将细胞分配到第二微孔阵列中之后,两个阵列可以面对面地放置,并且第一磁体被去除,而第二磁体被用于将珠粒从第一阵列拉到第二阵列的对应的微孔中,从而确保珠粒位于第二微孔阵列中的细胞上方,并且由此使细胞裂解后靶分子的扩散损失最小化,同时使靶分子与珠粒上的随机条形码的有效附接最大化。
本披露的微孔阵列可以预先加载固体支持物(例如,珠粒)。微孔阵列的每个孔可以包含单个固体支持物。微孔阵列中的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%的孔可预先加载单个固体支持物。微孔阵列中的至多10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%的孔可预先加载单个固体支持物。固体支持物可以包含本披露的随机条形码。不同固体支持物上的随机条形码的细胞标记可以是不同的。相同固体支持物上的随机条形码的细胞标记可以是相同的。
三维基底
三维阵列可以是任何形状。三维基底可以由本披露的基底中使用的任何材料制成。在一些情况下,三维基底包含DNA折纸(origami)。DNA折纸结构并入DNA作为建筑材料制成纳米级的形状。DNA折纸过程可以涉及使用多个合理设计的“订书钉(staple)DNA链”将一个或多个长的“支架”DNA链折叠成特定形状。可以将订书钉链的序列设计成使得它们与支架链的特定部分杂交,并且在这样做时,迫使支架链形成特定形状。DNA折纸可以包括支架链和多个合理设计的订书钉链。支架链可以具有足够非重复的序列。
可以将订书钉链的序列选择为使得DNA折纸具有至少一种能够附接随机标记的形状。在一些实施例中,DNA折纸可以是具有至少一个内表面和至少一个外表面的任何形状。内表面可以是空间上排除与样品表面相互作用的DNA折纸的任何表面区域,而外表面是并非空间上排除与样品表面相互作用的DNA折纸的任何表面区域。在一些实施例中,DNA折纸具有一个或多个开口(例如,两个开口),使得DNA折纸的内表面可以由粒子(例如,固体支持物)接近。例如,在某些实施例中,DNA折纸具有允许小于10微米、5微米、1微米、500nm、400nm、300nm,250nm、200nm、150nm、100nm、75nm、50nm、45nm或40nm的粒子接触DNA折纸的内表面的一个或多个开口。
DNA折纸可以响应于一种或多种某些环境刺激而改变形状(构象)。因此,当DNA折纸采取一些构象时,DNA折纸的区域可以是内表面,但是当装置采取其他构象时,它可以是外表面。在一些实施例中,DNA折纸可以通过采取新的构象来响应于某些环境刺激。
在一些实施例中,可以将DNA折纸的订书钉链选择为使得DNA折纸基本上是桶形或管形。可以将DNA折纸的订书钉选择为使得桶形在两端均封闭或在一端或两端开放,从而允许粒子进入桶的内部并接近其内表面。在某些实施例中,DNA折纸的桶形可以是六边形管。
在一些实施例中,可以将DNA折纸的订书钉链选择为使得DNA折纸具有第一结构域和第二结构域,其中第一结构域的第一端通过一个或多个单链DNA铰链附接到第二结构域的第一端,并且第一结构域的第二端通过一个或多个分子闩锁(latch)附接到第二结构域的第二结构域。可以将多个订书钉选择为使得如果所有分子闩锁都被它们各自的外部刺激接触,则第一结构域的第二端变得不附接到第二结构域的第二端。闩锁可以由两个或更多个订书钉链形成,包括具有能够结合至外部刺激物的至少一个刺激物结合结构域的至少一个订书钉链以及具有结合至刺激物结合结构域的至少一个闩锁结构域的至少一个其他订书钉链,外部刺激物是如核酸、脂质或蛋白质。刺激结合结构域与闩锁结构域的结合支持DNA折纸的第一构象的稳定性。
在固体支持物和基底上的随机条形码的合成
可以在固体支持物(例如,珠粒)上合成随机条形码。预先合成的随机条形码(例如,包含可连接至固体支持物的5'胺)可以通过涉及固体支持物和随机条形码上的官能团对的多种固定技术中的任何一种来附接到固体支持物(例如,珠粒)。随机条形码可以包含官能团。固体支持物(例如,珠粒)可以包含官能团。随机条形码官能团和固体支持物官能团可以包括例如生物素、链霉亲和素、一个或多个伯胺、一个或多个羧基、一个或多个羟基、一个或多个醛、一个或多个酮及其任何组合。随机条形码可以例如通过将随机条形码上的5'氨基的1-氨基偶联到官能化固体支持物的羧基上(例如使用1-乙基-3-(3-二甲基氨丙基)碳二亚胺)而拴系在固体支持物上。可以通过执行多次冲洗步骤从反应混合物中除去残留的非偶联随机条形码。在一些实施例中,随机条形码和固体支持物是使用类似的附接化学经由接头分子(例如短的官能化烃分子或聚环氧乙烷分子)间接附接。接头可以是可切割接头,例如酸不稳定接头或光可切割接头。
使用多种固相寡核苷酸合成技术中的任何一种,例如磷酸二酯合成、磷酸三酯合成、亚磷酸三酯合成和亚磷酰胺合成,可以在固体支持物(例如,珠粒)上合成随机条形码。单核苷酸能以逐步的方式偶联至生长的拴系随机条形码。可以将几种寡核苷酸的短的预合成序列(或嵌段)偶联至生长的拴系随机条形码上。
随机条形码可以通过分步穿插或嵌段偶联反应以一轮或多轮分离-聚池合成(split-pool synthesis)进行合成,其中将合成珠粒的总池分成多个单独较小的池,然后每个池都进行不同的偶联反应,随后进行重组和混合单独的池以随机化整个珠粒池中生长的随机条形码序列。分离-聚池合成是组合合成方法的实例,其中使用最少数目的化学偶联步骤合成最大数目的化合物。由此产生的化合物文库的潜在多样性是由可用于每个偶联步骤的独特构建单元(例如核苷酸)的数目以及用于产生文库的偶联步骤的数目决定。例如,在每个步骤中包含10轮偶联使用4种不同核苷酸的分离-聚池合成将产生410=1,048,576个独特的核苷酸序列。在一些实施例中,分离-聚池合成可以使用酶法(如聚合酶延伸或连接反应)而不是化学偶联进行。例如,在每一轮分离-聚池聚合酶延伸反应中,在给定的池中拴系到珠粒上的随机条形码的3'端可以与一组半随机引物的5'端杂交,所述半随机引物组例如为具有5'-(M)k-(X)i-(N)j-3'结构的引物,其中(X)i是长度为i个核苷酸的核苷酸随机序列(所述引物组包括(X)i的所有可能的组合),(N)j是特定核苷酸(或j个核苷酸系列),并且(M)k是特定核苷酸(或k个核苷酸系列),其中不同的脱氧核糖核苷酸三磷酸(dNTP)加入到每个池中并通过聚合酶并入到拴系寡核苷酸中。
在固体支持物上缀合或合成的随机条形码的数目可以包括至少100、1000、10000或1000000个或更多个随机条形码。在固体支持物上缀合或合成的随机条形码数目可以包括至多100、1000、10000或1000000个或更多个随机条形码。缀合至固体支持物(如珠粒)的或在其上合成的寡核苷酸的数目可以比细胞中靶核酸的数目多至少1、2、3、4、5、6、7、8、9、或10倍。缀合至固体支持物(如珠粒)的或在其上合成的寡核苷酸的数目可以比细胞中靶核酸的数目多至多1、2、3、4、5、6、7、8、9、或10倍。随机条形码的至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%可以被靶核酸结合。随机条形码的至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%可以被靶核酸结合。至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个或更多个不同靶核酸可以被固体支持物上的随机条形码捕获。至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个或更多个不同靶核酸可以被固体支持物上的随机条形码捕获。
样品
细胞
用于在本披露的方法、组合物、系统和试剂盒中使用的样品可以包括一个或多个细胞。在一些实施例中,细胞是从癌组织切除的癌细胞,例如乳腺癌、肺癌、结肠癌、前列腺癌、卵巢癌、胰腺癌、脑癌、黑色素瘤和非黑素瘤皮肤癌等。在一些情况下,细胞来源于癌症,但是从体液收集(例如循环肿瘤细胞)。癌症的非限制性实例可以包括腺瘤、腺癌、鳞状细胞癌、基底细胞癌、小细胞癌、大细胞未分化癌、软骨肉瘤、以及纤维肉瘤。
在一些实施例中,细胞是已经被病毒感染并含有病毒寡核苷酸的细胞。在一些实施例中,病毒感染可以由选自下组的病毒引起,该组由以下各项组成:双链DNA病毒(例如腺病毒、疱疹病毒、痘病毒)、单链(+链或“有义”)DNA病毒(例如细小病毒)、双链RNA病毒(例如呼肠孤病毒)、单链(+链或有义)RNA病毒(例如微小核糖核酸病毒、披膜病毒)、单链(-链或反义)RNA病毒(例如正粘病毒、弹状病毒)、单链((+链或有义)RNA病毒,在其生命周期中具有DNA中间体)RNA-RT病毒(例如逆转录病毒)、和双链DNA-RT病毒(例如嗜肝DNA病毒)。示例性病毒可以包括但不限于SARS、HIV、冠状病毒、埃博拉病毒、疟疾、登革热、丙型肝炎、乙型肝炎和流感。
在一些实施例中,细胞是细菌细胞。这些可以包括来自革兰氏阳性细菌和/或革兰氏阴性细菌的细胞。可以使用披露的方法、装置和系统分析的细菌的实例包括但不限于马杜拉放线菌属(Actinomedurae)、衣氏放线菌、炭疽杆菌、蜡样芽孢杆菌、肉毒梭菌、艰难梭菌、产气荚膜梭菌、破伤风梭菌、棒状杆菌属、粪肠球菌、单核细胞增生李斯特菌、诺卡氏菌属、痤疮丙酸杆菌、金黄色葡萄球菌、表皮葡萄球菌(Staphylococcus epiderm)、变异链球菌、肺炎链球菌等。革兰氏阴性细菌包括但不限于猫阿菲波菌(Afipia felis)、类杆菌(Bacteriodes)、杆状巴尔通体、百日咳杆菌(Bortadella pertussis)、伯氏疏螺旋体、回归热疏螺旋体、布鲁氏菌属、肉芽肿鞘杆菌、弯曲杆菌属、大肠杆菌、土拉热弗朗西丝菌、阴道加德纳菌、埃及嗜血杆菌(Haemophilius aegyptius)、杜克雷嗜血杆菌(Haemophiliusducreyi)、流感嗜血杆菌(Haemophilius influenziae)、幽门螺杆菌、嗜肺军团菌、问号钩端螺旋体、脑膜炎奈瑟菌、牙龈卟啉单胞菌、斯氏普罗维登斯菌(Providencia sturti)、铜绿假单胞菌、肠炎沙门菌(Salmonella enteridis)、伤寒沙门菌、粘质沙雷菌、鲍氏志贺氏菌、念珠状链杆菌、化脓链球菌、梅毒螺旋体、霍乱弧菌、小肠结肠炎耶尔森菌、鼠疫耶尔森菌等。其他细菌可以包括鸟分枝杆菌(Myobacterium avium)、麻风分枝杆菌(Myobacteriumleprae)、结核分枝杆菌(Myobacterium tuberculosis)、汉式巴尔通体(Bartonellahenseiae)、鹦鹉热衣原体、沙眼衣原体、伯氏考克斯体、肺炎支原体、螨立克次体、普氏立克次体、立氏立克次体、姜虫病立克次体、斑疹伤寒立克次体、尿素分解脲原体、肺炎双球菌、查菲埃立克体(Ehrlichia chafensis)、屎肠球菌、脑膜炎球菌等。
在一些实施例中,细胞是来自真菌的细胞。可以使用披露的方法、装置和系统分析的真菌的非限制性实例包括但不限于曲霉属、假丝酵母属(Candidae)、白色念珠菌、粗球孢子菌、隐球菌属(Cryptococci)及其组合。
在一些实施例中,细胞是来自原生动物或其他寄生虫的细胞。有待使用本披露的方法、装置和系统分析的寄生虫的实例包括但不限于结肠小袋纤毛虫、微小隐孢子虫、卡晏环孢子虫(Cyclospora cayatanensis)、脑炎微孢子虫属(Encephalitozoa)、溶组织内阿米巴(Entamoeba histolytica)、比氏肠孢虫(Enterocytozoon bieneusi)、兰伯贾第虫、利什曼原虫(Leishmaniae)、疟原虫(Plasmodii)、鼠弓形体、锥体虫(Trypanosomae)、梯形阿米巴(trapezoidal amoeba)、蠕虫(worm)(例如,蠕虫(helminthes)),尤其是寄生蠕虫,包括但不限于线虫纲(蛔虫(roundworm),例如鞭虫、钩虫、蛲虫、蛔虫(ascarid)、丝状虫(filarid)等)、绦虫纲(例如,绦虫)。
如本文使用的,术语“细胞”可以指一个或多个细胞。在一些实施例中,细胞是正常细胞,例如不同发育阶段的人类细胞或来自不同器官或组织类型的人类细胞(例如白细胞,红细胞,血小板,上皮细胞,内皮细胞,神经元,神经胶质细胞,成纤维细胞,骨骼肌细胞,平滑肌细胞,配子或来自心脏、肺、脑、肝、肾、脾、胰腺、胸腺、膀胱、胃、结肠、小肠的细胞)。在一些实施例中,细胞可以是未分化的人类干细胞或已被诱导分化的人类干细胞。在一些实施例中,细胞可以是人类胎儿细胞。人类胎儿细胞可以获得自怀有胎儿的母亲。在一些实施例中,细胞是稀有细胞。稀有细胞可以是例如循环肿瘤细胞(CTC)、循环上皮细胞、循环内皮细胞、循环子宫内膜细胞、循环干细胞、干细胞、未分化干细胞、癌症干细胞、骨髓细胞、祖细胞、泡沫细胞、间充质细胞、滋养层细胞、免疫系统细胞(宿主或移植物)、细胞片段、细胞器(例如线粒体或细胞核)、病原体感染的细胞等。
在一些实施例中,细胞是非人类细胞,例如其他类型的哺乳动物细胞(例如小鼠、大鼠、猪、狗、牛或马)。在一些实施例中,细胞是其他类型的动物或植物细胞。在一些实施例中,细胞可以是任何原核或真核细胞。
在一些实施例中,第一细胞样品获得自未患疾病或病症的人,并且第二细胞样品获得自患有疾病或病症的人。在一些实施例中,所述人是不同的。在一些实施例中,所述人是相同的,但是细胞样品是在不同时间点取得。在一些实施例中,所述人是患者,并且细胞样品是患者样品。所述疾病或病症可以是癌症、细菌感染、病毒感染、炎性疾病、神经退行性疾病、真菌性疾病、寄生虫病、遗传性障碍或其任何组合。
在一些实施例中,适用于本发明披露的方法的细胞的尺寸可以变动,例如直径的范围为从约2微米至约100微米。在一些实施例中,细胞可以具有至少2微米、至少5微米、至少10微米、至少15微米、至少20微米、至少30微米、至少40微米、至少50微米、至少60微米、至少70微米、至少80微米、至少90微米、或至少100微米的直径。在一些实施例中,细胞可以具有至多100微米、至多90微米、至多80微米、至多70微米、至多60微米、至多50微米、至多40微米、至多30微米的直径、至多20微米、至多15微米、至多10微米、至多5微米、或至多2微米的直径。细胞可以具有在一定范围内(例如从约5微米至约85微米)的任何值的直径。在一些实施例中,细胞具有约10微米的直径。
在一些实施例中,在将细胞中的一个或多个与珠粒和/或在微孔中关联之前对细胞进行分选。例如,可以通过荧光激活细胞分选或磁激活细胞分选,或例如通过流式细胞术来分选细胞。可以按尺寸过滤细胞。在一些情况下,滞留物包含有待与珠粒相关联的细胞。在一些情况下,流过物(flow through)包含有待与珠粒相关联的细胞。
全转录组扩增方法
本披露提供了用于样品的全转录组扩增的方法。如本文使用的“全转录组扩增”可以指样品(如单个细胞)的转录组的全部或一部分的扩增。扩增可以使用如本文披露的各种基于PCR或非PCR的方法来完成。
本文披露的用于全转录组扩增的方法可以扩增在样品(如单个细胞)中的多个靶标(包括但不限于mRNA、微小RNA、siRNA、tRNA、rRNA及其任何组合)。在一些实施例中,本文披露的用于全转录组扩增的方法可扩增样品(如单个细胞)中的转录物或转录物种类的全部或部分。如本文使用的“转录物种类”是指来自单个基因或基因座的所有转录物。在一些实施例中,转录组可以包括在样品(如单个细胞)中的至少100、1,000、10,000、100,000、1,000,000种或更多种转录物。在一些实施例中,转录组可以包括在样品(如单个细胞)中的至少100、1,000、10,000、100,000、1,000,000、10,000,000、100,000,000种或更多种转录物。在一些实施例中,本文披露的用于全转录组扩增的方法可产生包含样品(如单个细胞)中的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%的转录物的WTA产物。在一些实施例中,本文披露的用于全转录组扩增的方法可产生包含样品(如单个细胞)中的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%的转录物种类的WTA产物。
在一些实施例中,对于全转录组扩增,可以将一个或多个通用引物结合位点加入样品中的靶标(如mRNA分子)中。在各种实施例中,本文披露的方法包括在样品中标记多个靶标,如mRNA分子。在一些实施例中,标记多个靶标包括将随机条形码添加到多个靶标中的一个或多个中。随机条形码可以包含一个或多个包含用于扩增引物(如PCR引物)的结合位点的通用标记。在一些实施例中,随机条形码可以包含通用标记、分子标记、细胞标记、空间标记、靶标特异性区域或其任何组合。随机条形码可以按照序列依赖方式或优选序列独立方式添加到靶标中。
准对称的随机条形码
提供了使用准对称的随机条形码的用于全转录组扩增的方法。所述方法的非限制性实施例在图1中示出。在图1中,靶标105可以包含聚A尾。靶标105可以是mRNA。靶标105可以与随机条形码110杂交。随机条形码110可以包含多个标记。例如,随机条形码110可以包含靶标特异性区域(例如,用于结合至mRNA的聚A尾的寡聚dT)115、分子标记120、细胞标记125和第一通用标记130。随机条形码110可以使用逆转录酶逆转录135,从而产生标记的cDNA分子。可以在步骤140用降解酶145处理多余的随机条形码111。降解酶145可以是例如外切核酸酶。标记的cDNA分子可以在步骤150中加尾。加尾可以包括例如均聚物加尾。例如,可以在标记的cDNA分子的3'端附加均聚物尾155,从而产生加尾分子156。在一些情况下,对外切核酸酶具有抗性的多余的随机条形码111也可以加尾。
可以使加尾分子156与第二链合成引物165接触。第二链合成引物165可以包含与均聚物尾155互补的区域166。第二链合成引物165可以包含限制性位点170。第二链合成引物165可以包含第二通用标记131。第二通用标记131可以比第一通用标记130短。第二通用标记131可以不同于第一通用标记130。可以延伸第二链合成引物175,从而在步骤180产生准对称的随机条形码化的核酸181。在一些情况下,多余的随机条形码111也可以被加尾并延伸。
在一些实施例中,被加尾并延伸的多余的随机条形码111可以形成锅柄结构185。锅柄结构可以通过第一和第二通用标记130和131在加尾并延伸的多余随机条形码111的每一端上的杂交来形成。锅柄结构185可以防止加尾并延伸的多余随机条形码的扩增。
可将准对称的随机条形码化的核酸181扩增190。扩增可以例如用WTA(全转录组扩增)引物195进行。WTA引物195可以与第一和第二通用标记130和131杂交。可以例如用全转录组扩增引物扩增准对称的随机条形码化的核酸181,从而产生准对称的随机条形码化的扩增子。
可以制备用于测序文库(例如,用于产生测序读段)的WTA扩增的准对称的随机条形码化的核酸。例如,如图2所示,可以在步骤210切割限制性位点205,从而产生非对称的随机条形码化的核酸215。可以用简并引物220扩增不对称的随机条形码化的核酸215。简并引物220可以包含多核苷酸序列,其可以包含第三通用标记225。第三通用标记225可以不同于第一和第二通用标记130和131。简并引物220可以包含随机多聚体序列。随机多聚体序列可以随机地与不对称的随机条形码化的核酸的有义链和/或反义链杂交。例如,可以制得两种产物。当简并引物扩增出有义链时,它可以产生5'产物230。如果限制性消化210未进行完成,则5'产物230可以例如包含第二通用序列131。以此方式,第二通用标记131可以是用于破坏准对称的随机条形码化的核酸181的对称性的第二机构。当简并引物扩增出反义链时,它可以产生3'产物235。3'产物235可以包含随机条形码的序列。
3'和5'产物230和235可用于下游测序文库制备。例如,3'和5'产物230和235可以用测序文库扩增引物240/245扩增。测序文库扩增引物之一240可以与第三通用标记225杂交。测序文库扩增引物之一245可以与第一通用标记130杂交。测序文库扩增引物245可不能与第二通用标记131杂交。测序文库扩增引物245可以不太有效地与第二通用标记131杂交。5'产物230的扩增可以不发生。5'产物230的扩增可以不太有效地发生。以此方式,第二通用标记131可以是用于破坏准对称的随机条形码化的核酸181的对称性的机构。3'产物可以是经历测序反应的大部分产物。测序反应的结果可以是更有用和有效的,因为仅对3'产物进行测序,从而生成包含随机条形码的数据。测序数据可用于本披露的下游方法,如分仓(binning)、计数和估计单个细胞中原始靶mRNA的数目。
细胞裂解
在细胞和随机条形码的分布之后,可以裂解细胞以释放靶分子。细胞裂解可以通过多种手段中的任何一种来完成,例如通过化学或生化手段,通过渗透冲击,或通过热裂解、机械裂解或光学裂解。可以通过添加包含洗涤剂(例如SDS、十二烷基硫酸锂、Triton X-100、Tween-20或NP-40)的细胞裂解缓冲液、有机溶剂(例如甲醇或丙酮)或消化酶(例如蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合来裂解细胞。为了增加靶标和随机条形码的关联,可通过例如降低裂解物的温度和/或增加裂解物的粘度来改变靶分子的扩散速率。
随机条形码与靶标的关联
在细胞裂解和核酸分子从中释放之后,核酸分子可以随机地与共定位的固体支持物的随机条形码相关联。关联可以包括随机条形码的靶识别区与靶核酸分子的互补部分的杂交(例如,随机条形码的寡聚dT可与靶标的聚A尾相互作用)。可以选择用于杂交的测定条件(例如缓冲液pH、离子强度、温度等)以促进形成特定的稳定的杂交体。
在一些实施例中,本文披露的方法可以包括将随机条形码与样品极为接近地放置、裂解样品、将不同靶标与随机条形码关联、扩增靶标和/或对靶标进行数字计数。在一些实施例中,所述方法还包括对从随机条形码上的空间标记获得的信息进行分析和/或可视化。随机条形码可以使用多种方法与靶标相关联,例如基于引物的延伸或转录、连接、基于转录组的连接或其任何组合。在一些实施例中,样品可以包含总量是、大约是、是小于1pg、2pg、3pg、4pg、5pg、6pg、7pg、8pg、9pg、10pg、20pg、30pg、40pg、50pg、60pg、70pg、80pg、90pg、100pg、200pg、300pg、400pg、500pg、600pg、700pg、800pg、900pg、1ng或任何两个上述值之间的范围的靶标。
附接还可包括随机条形码的靶识别区和靶核酸分子的一部分的连接。例如,靶结合区可以包含可能够与限制性位点突出端(例如EcoRI粘性末端突出端)进行特异性杂交的核酸序列。测定程序还可以包括用限制性酶(例如EcoRI)处理靶核酸以产生限制性位点突出端。然后随机条形码可以连接到包含与限制性位点突出端互补的序列的任何核酸分子。连接酶(例如,T4 DNA连接酶)可用于连接两个片段。
可以随后汇集来自多个细胞(或多个样品)(例如,靶标-条形码分子)的标记的靶标,例如通过检索随机条形码和/附接有靶标-条形码分子的珠粒。可以通过使用磁珠和外部施加的磁场来实现附接的靶标-条形码分子的基于固体支持物的集合的检索。一旦靶标-条形码分子已经汇集,所有进一步的处理可以在单个反应容器中进行。进一步的处理可以包括例如逆转录反应、扩增反应、切割反应、解离反应和/或核酸延伸反应。可以在含有反应混合物和/或如单个细胞的样品的单个微孔内进行进一步的处理反应,即,不首先从多个细胞中汇集标记的靶核酸分子。
多余的随机条形码可以用酶降解。酶可以是核酸酶,例如像外切核酸酶或内切核酸酶。示例性核酸酶可以包括DNA酶I、Cas9核酸酶、内切核酸酶III、内切核酸酶IV、内切核酸酶III、内切核酸酶IV、内切核酸酶V、内切核酸酶VIII、外切核酸酶I、外切核酸酶III、外切核酸酶I、外切核酸酶V、微球菌核酸酶、T7内切核酸酶、T7外切核酸酶、尿嘧啶糖基化酶抑制剂和尿嘧啶DNA糖基化酶。在一些实施例中,可以用酶(例如,外切核酸酶)降解至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余条形码。在一些实施例中,可以用酶(例如,外切核酸酶)降解至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余条形码。在一些实施例中,至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余条形码可以逃避用酶(例如,外切核酸酶)进行的降解。在一些实施例中,至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余条形码可以逃避用酶(例如,外切核酸酶)进行的降解。
可以将包含例如细胞、器官或组织薄片的样品与随机条形码接触。在一些实施例中,随机条形码可以固定在固体支持物上。固体支持物可以自由浮动。固体支持物可包埋在半固体或固体阵列中。随机条形码可以不与固体支持物关联。随机条形码可以是单独的核苷酸。随机条形码可与基底相关联。当随机条形码与靶标极为接近时,靶标可以与随机条形码杂交。随机条形码可以按不可耗尽的比率接触,使得每个不同的靶标可以与本披露的不同随机条形码相关联。为了确保靶标和随机条形码之间的有效关联,靶标可以与随机条形码交联。
样品的两个不同靶标可以接触相同的独特随机条形码的概率可以是至少10-6、10-5、10-4、10-3、10-2、或10-1或更多。样品的两个不同靶标可以接触相同的独特随机条形码的概率可以是至多10-6、10-5、10-4、10-3、10-2、或10-1或更多。来自相同细胞的相同基因的两个靶标可以接触相同的随机条形码的概率可以是至少10-6、10-5、10-4、10-3、10-2、或10-1或更多。来自相同细胞的相同基因的两个靶标可以接触相同的随机条形码的概率可以是至多10-6、10-5、10-4、10-3、10-2、或10-1或更多。
在一些实施例中,来自细胞群的细胞可以分离(例如,隔离)到本披露的基底的孔中。细胞群可以在分离前稀释。例如,细胞群可以被稀释为使得基底的至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%的孔接收单个细胞。在一些实施例中,细胞群可以被稀释为使得基底的至多1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%的孔接收单个细胞。在一些实施例中,细胞群可以被稀释为使得在稀释的群体中的细胞数目是基底上的孔数目的至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些实施例中,细胞群可以被稀释为使得在稀释的群体中的细胞数目是基底上的孔数目的至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些实施例中,细胞群被稀释为使得细胞数目为基底中孔数目的约10%。
将单个细胞分布到基底的孔中可以遵循泊松分布。例如,可以有或可以至少有0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更多的概率,使得基底的一个孔具有多于一个细胞。在一些实施例中,可以至少有0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更多的概率,使得基底的一个孔具有多于一个细胞。将单个细胞分布到底物的孔中可以是随机的。将单个细胞分布到底物的孔中可以是非随机的。可以分离细胞,使得基底的孔仅接收一个细胞。
固体支持物上的随机条形码
在一些实施例中,本文披露的全转录组扩增的方法可以包括去除非随机标记的靶标或非靶标等的步骤。在一些实施例中,本披露的方法的随机条形码化(例如,标记、加索引)步骤可以在固体支持物上进行。在一些实施例中,本文披露的方法可以包括去除非随机标记的靶标、非靶标(如DNA)或其他细胞组分或试剂的步骤。在一些实施例中,去除可以包括在将固体支持物(如珠粒)与来自样品的靶标接触后洗涤固体支持物。在一些实施例中,去除可以包括延伸在固体支持物上的随机条形码之后洗涤固体支持物。在一些实施例中,洗涤可以包括从反应混合物中收集固体支持物如珠粒。
如图3所示,随机条形码310可以附接(例如,缀合、共价附接、非共价附接)到固体支持物312上。可以在固体支持物312上进行逆转录反应335。可以将附接到固体支持物312上的多余随机条形码310去除(例如,通过洗涤、通过磁体)。逆转录反应335可以产生第一链标记的cDNA 340。第一链标记的cDNA 340可以与第二链合成引物345接触。第二链合成引物345可以包含随机多聚体序列350。第二链合成引物345可以包含第二通用标记355。可以延伸第二链合成引物345(例如,通过引物延伸),从而产生准对称的双链标记的cDNA 360。可以例如用全转录组扩增引物扩增准对称的双链标记的cDNA 360,从而产生准对称的随机条形码化的扩增子。所述方法可以如图2所述继续进行,其中准对称的随机条形码化的扩增子可以与简并引物365接触并经历随机引发。简并引物可包含第三通用标记(U2)。用简并引物随机引发而产生的3'(375)和5'(370)产物可以用测序文库扩增引物扩增。3'产物375可以是有利的。可以对反应进行测序,并进行本披露的下游方法,如测序、计数和估计单个细胞中靶mRNA的数目。
逆转录
在一些实施例中,cDNA合成(如通过逆转录)可用于将随机条形码与靶标(例如,mRNA)相关联。例如,随机靶标-条形码缀合物可以包含随机条形码和靶核酸(即随机条形码化的cDNA分子)的全部或部分的互补序列。关联的RNA分子的逆转录可以通过添加逆转录引物连同逆转录酶一起而发生。逆转录引物可以是寡聚dT引物、随机六核苷酸引物或靶标特异性寡核苷酸引物。寡聚dT引物的长度可以是12-18个核苷酸,并与哺乳动物mRNA的3'端的内源性聚A尾结合。随机六核苷酸引物可在多个互补位点处结合至mRNA。靶标特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。
图5展示了本披露的随机条形码化方法的示例性实施例。可以将样品(例如,样品的部分、薄片或一个或多个细胞)与包含随机条形码的固体支持物接触。样品中的靶标可以与随机条形码相关联。可以收集固体支持物。可以在固体支持物上进行cDNA合成。cDNA合成可以在固体支持物之外进行。cDNA合成可以将来自随机条形码中的标记的标记信息并入正在合成的新cDNA靶分子中,从而产生靶标-条形码分子。可以使用PCR扩增靶标-条形码分子。在靶标-条形码分子上的靶标和随机条形码的标记的序列可以通过测序方法确定。
合成第一cDNA链后,可以使用多种方法合成第二链以产生双链cDNA。优选地,第二链合成可不以靶标特异性方式进行。例如,可以使用与第一cDNA链结合的随机引物,并且可以将引物使用DNA聚合酶延伸。在一些实施例中,均聚物加尾可用于第二链合成。在一些实施例中,第二链合成可以按引物无关的方式进行。
使用均聚物加尾的第二链合成
在一些实施例中,本文披露的方法提供了在逆转录后获得的单链cDNA分子的均聚物加尾。均聚物加尾可以包括在选择的dNTP的存在下,与末端脱氧核苷酸转移酶(TdT)的反应,以在3'cDNA末端形成均聚物区域。可以在RNA/cDNA双链体或单链cDNA上进行均聚物加尾反应。如果存在RNA链,则在一些实施例中,可以通过以下方式增强反应效率:用5'外切核酸酶的初始消化以暴露3'片段末端,或在钴离子的存在下进行反应。均聚物尾可以包含聚A尾、聚T尾、聚U尾、聚C尾和/或聚G尾。
均聚物加尾反应可以向cDNA引入至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个或更多个核苷酸。均聚物加尾反应可以向cDNA引入至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个或更多个核苷酸。例如通过cDNA片段沉淀去除酶(例如,RNA酶和/或TdT)和选择的dNTP。在一些情况下,逃避外切核酸酶的降解的多余随机条形码可以加上均聚物尾。这些可以视为反应副产物。
可将单链cDNA与第二链合成引物接触以起始第二链合成,从而产生双链标记的cDNA。第二链合成引物可以包含与均聚物尾互补的区域(例如,它可以结合至均聚物尾序列)。例如,如果均聚物尾由腺嘌呤构成,则与均聚物尾互补的区域可以包含胸苷。与均聚物尾互补的区域的长度可以与均聚物尾的长度相同。与均聚物尾互补的区域的长度可以比均聚物尾短或至少短10%、20%、30%、40%、50%、60%、或70%。与均聚物尾互补的区域的长度可以比均聚物尾短或至多短10%、20%、30%、40%、50%、60%、或70%。与均聚物尾互补的区域的长度可以比均聚物尾长或至少长10%、20%、30%、40%、50%、60%、或70%。与均聚物尾互补的区域的长度可以比均聚物尾长或至多长10%、20%、30%、40%、50%、60%、或70%。
第二链合成引物可以包含切割位点。切割位点可以是限制性内切酶切割位点。示例性限制性内切核酸酶可以包括BamH1、EcoR1、AleI、ApaI、BglII、BsaI、KpnI或任何内切核酸酶切割酶。
第二链合成引物可以包含第二通用标记。第二链合成引物的通用标记(例如,第二通用标记)可以与随机条形码上的通用标记(例如在单链cDNA分子的5'端上,例如第一通用标记)相同。第二通用标记可以包含作为第一个通用标记子集的序列。例如,第二通用标记可以包含第一通用标记的序列的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%。第二通用标记可以包含第一通用标记的序列的至多10%、20%、30%、40%、50%、60%、70%、80%、90%、95%或100%。第二通用标记可以比或至少比第一通用标记短或长1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。第二通用标记可以至多比第一通用标记短或长1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。在一些情况下,第二通用标记比第一通用标记短2个核苷酸。通用标记与第一通用标记的差异可以为至少1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。通用标记与第一通用标记的差异可以为至多1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。第二通用标记与所述第一通用标记可以是或是至多99%、98%、7%、96%、95%、94%、93%、92%、91%或90%或更少一致的。第二通用标记与所述第一通用标记可以是不一致的。在至少50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的所述第一通用标记上,第二通用标记可以与所述第一通用标记杂交。在50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的所述第一通用标记上,第二通用标记可以是至多与所述第一通用标记99%一致的。第一通用标记的序列可以是测序引物结合位点(例如,亿明达读段2序列)。第二通用标记的序列可以是修饰的测序引物结合位点(例如,亿明达修饰的读段2序列)。
在一些情况下,第一通用标记和第二通用标记能够彼此杂交(例如,用于抑制PCR)。第一和第二通用标记能以至少1、2、3、4、5、6、7、8、9或10个或更多个错配杂交。第一和第二通用标记能以至多1、2、3、4、5、6、7、8、9或10个或更多个错配杂交。杂交的程度可以与抑制PCR过程中发生的抑制量有关。例如,可以强烈杂交的序列比弱杂交的序列可以被抑制更多。
第二链合成引物可以在第一cDNA链的长度上延伸(例如,使用引物延伸),从而产生准对称的随机条形码化的核酸。准对称的随机条形码化的核酸可以包含第二链合成引物、第二通用标记、和标记的cDNA分子(例如,第一cDNA链,即包括靶结合区和随机条形码的序列)的序列。以此方式,准对称的随机条形码化的核酸可以在分子的每个末端包含通用标记。
在一些情况下,第二链合成引物可以在加尾的多余随机条形码上与均聚物尾退火。可以延伸第二链合成引物以产生合成的第二链cDNA分子,其并入多余的随机条形码的序列。在一些情况下,合成的第二链cDNA分子可以不包含靶标(例如,靶多核苷酸)。
有随机引发情况下的第二链合成
在一些实施例中,如图3所例示,本披露的方法可以不包括均聚物加尾。本披露的方法可以提供随机引发。所述方法可以包括将靶核酸(例如,靶RNA、靶多聚腺苷酸化转录物、靶mRNA)与本披露的随机条形码接触。例如,随机条形码可以包含可与靶核酸的聚A尾杂交的寡聚dT区。随机条形码可以附接到固定支持物上。随机条形码可不附接到固定支持物上。可以使用随机条形码作为引物将靶RNA逆转录,从而产生单链标记的cDNA分子。
多余的随机条形码可以用酶降解。酶可以是核酸酶,例如像外切核酸酶或内切核酸酶。示例性核酸酶可以包括DNA酶I、Cas9核酸酶、内切核酸酶III、内切核酸酶IV、内切核酸酶III、内切核酸酶IV、内切核酸酶V、内切核酸酶VIII、外切核酸酶I、外切核酸酶III、外切核酸酶I、外切核酸酶V、微球菌核酸酶、T7内切核酸酶、T7外切核酸酶、尿嘧啶糖基化酶抑制剂和尿嘧啶DNA糖基化酶。可以用酶(例如,外切核酸酶)降解至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余条形码。可以用酶(例如,外切核酸酶)降解至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余条形码。至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余条形码可以逃避用酶(例如,外切核酸酶)进行的降解。至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余条形码可以逃避用酶(例如,外切核酸酶)进行的降解。在一些实施例中,当多余的条形码附接到固体支持物(例如,珠粒)上时,可以去除珠粒。可以通过例如洗涤或使用磁体进行去除。可以去除至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余珠粒/随机条形码。可以去除至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的多余珠粒/随机条形码。
在一些实施例中,单链标记的cDNA分子(即,由逆转录反应产生)可以附接到固体支持物上。在一些实施例中,单链标记的cDNA分子(即,由逆转录反应产生)可不附接到固体支持物上。
在一些实施例中,可将单链标记的cDNA分子与本披露的第二链合成引物接触。在一些实施例中,第二链合成引物可以包含第二通用标记(例如,如上所述的)。
在一些实施例中,第二链合成引物可以包含随机多聚体序列。随机多聚体序列的长度可以例如是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸。在一些实施例中,随机多聚体序列的长度可以是至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸。在一些实施例中,随机多聚体序列可以与单链标记的cDNA上的随机位置杂交。
在一些实施例中,第二链合成引物可以在第一cDNA链的长度上延伸(例如,使用引物延伸),从而产生准对称的随机条形码化的核酸。准对称的随机条形码化的核酸可以例如包含第二链合成引物和标记的cDNA分子(例如,第一cDNA链,即包括靶结合区和随机条形码的序列)的序列。以此方式,准对称的随机条形码化的核酸可以在分子的每个末端包含通用标记。在一些实施例中,可以扩增准对称的随机条形码化的核酸,例如使用聚合酶链式反应和结合至第一和第二通用标记上的全转录组扩增引物。
没有引发情况下的第二链合成
在一些实施例中,本披露的方法在不使用加入的引物的情况下从第一链产生第二链(例如,逆转录反应)。例如,如图15所示的方法所述,第二链合成可以使用RNA酶、DNA PolI聚合酶和连接酶发生。RNA酶可以切割与逆转录反应产生的第一链杂交的mRNA链,从而产生切割的mRNA引物。在一些实施例中,RNA酶可以在一个或多个特定位置处切割mRNA链。在一些实施例中,RNA酶可以在非特定位置处切割mRNA链。切割的mRNA引物的长度可以例如是或是至少5、10、15、20、25、30、35、40、45、或50个或更多个核苷酸。在一些实施例中,切割的mRNA引物的长度可以是或是至多5、10、15、20、25、30、35、40、45、或50个或更多个核苷酸。
切割的mRNA引物可以例如用作第一链延伸的起始点。可以用聚合酶(例如,DNAPol I)进行延伸。聚合酶可以降解下游mRNA引物(例如,根据第二链合成的古伯霍夫曼(Gubler Hoffman)法)。在一些实施例中,第二链合成的这种方法可以是与基因无关的。例如,第二链合成的这种方法可以不使用基因特异性引物。
用链置换聚合酶的第二链合成
在一些情况下,本披露的方法在不使用加入的引物的情况下从第一链产生第二链(例如,逆转录反应)。例如,如图16所示的方法所述,第二链合成可以使用RNA酶和链置换聚合酶进行。RNA酶可以切割与逆转录反应产生的第一链杂交的mRNA链,从而产生切割的mRNA引物。RNA酶可以例如在一个或多个特定位置处切割mRNA链。在一些实施例中,RNA酶可以在非特定位置处切割mRNA链。切割的mRNA引物的长度可以是或是至少5、10、15、20、25、30、35、40、45、或50个或更多个核苷酸。切割的mRNA引物的长度可以是或是至多5、10、15、20、25、30、35、40、45、或50个或更多个核苷酸。
切割的mRNA引物可以例如用作第一链延伸的起始点。延伸可以用链置换聚合酶(例如,phi29、Bst DNA聚合酶、Large Fragment,Klenow(Exo-))进行。聚合酶可延伸通过下游mRNA引物,从而释放单链cDNA,其中的一些包含不同长度的5'mRNA引物序列。第二链的长度可以与离mRNA被切割的3'端的距离成比例。在一些实施例中,第二链合成的这种方法可以是与基因无关的。例如,第二链合成的这种方法可以不使用基因特异性引物。
第三链合成
在一些实施例中,如图16所披露的,可以从如上所述的链置换聚合酶产生的单链第二链产生第三链。可以通过使用引物生成第三链。引物可以包含通用序列(例如,第一通用序列,即用于标记mRNA的随机条形码的通用序列)。可以延伸引物,从而产生双链cDNA(例如,包含第二和第三链)。
衔接子连接
在一些实施例中,衔接子连接可用于将随机条形码(例如,通用标记、分子标记、细胞标记、空间标记或其任何组合)与靶标相关联。在一些实施例中,可以使用或不使用随机条形码将衔接子连接到靶标。例如,可以将衔接子连接到双链cDNA、mRNA/cDNA杂交体等。衔接子可以包含本披露的第一通用引物序列、本披露的第二通用引物序列、本披露的随机条形码、限制性内切核酸酶切割位点、或其任何组合。在一些实施例中,衔接子包含本披露的第二通用引物序列和限制性内切核酸酶结合位点。在一些实施例中,衔接子可以连接到核酸分子(例如,双链cDNA分子或mRNA/cDNA杂合分子)的一端。在一些实施例中,衔接子可以连接到未固定在固体支持物如珠粒上的核酸分子的末端。在一些实施例中,核酸分子的两端可以与相同或不同的衔接子连接。在一些实施例中,核酸分子可以在衔接子连接之前被平端化。
术语“衔接子”可以指可附接到核酸末端的具有至少10、15、20或25个碱基的单链的、部分双链的或双链的寡核苷酸。衔接子序列可以使用例如引发位点、引发位点的互补体、和内切核酸酶的识别位点、共同序列和启动子来合成。衔接子可以完全是或基本上是双链的。双链衔接子可以包含至少部分互补的两个寡核苷酸。衔接子可以在一条或两条链上磷酸化或未磷酸化。衔接子可以具有与突出端(例如,由限制性酶或聚合酶产生的)完全或部分互补的双链部分和单链突出部分。衔接子中的突出端可以是例如4到8个碱基。例如,当用限制性酶EcoRI消化DNA时,所得双链片段的任一末端的侧翼为单链突出端5'-AATT-3',携带单链突出端5'-AATT-3'的衔接子可以通过突出区域之间的互补性与所述片段杂交。衔接子与片段的“粘性末端”杂交促进衔接子与片段的连接;然而,平端连接也是可能的。可使用例如Klenow片段的外切核酸酶活性将平端转化为粘性末端。例如当用PvuII消化DNA时,通过在dTTP和dCTP的存在下将片段与Klenow一起孵育,可以将平端转化成两个碱基对突出端。突出端也可以通过填充突出端或去除突出端而转化为平端。
本披露的衔接子可以被设计成使得一旦附接(例如,连接)到随机条形码化的核酸,它们可以参与抑制和/或半抑制PCR扩增(例如,所得到的具有衔接子的准对称的随机条形码化的核酸可以进行抑制和/或半抑制PCR)。在一些实施例中,本披露的衔接子可以被设计为包含随机条形码,使得衔接子可以用于将核酸随机条形码化。
在一些实施例中,衔接子可以具有可以增强抑制(衔接子的抑制结构)或阻抑抑制(衔接子的允许结构)的结构。例如,可以例如通过其顺序的改变来调整衔接子,以影响抑制的水平。抑制水平可以与样品中矫作物(artifact)的扩增量有关。
在一些实施例中,与抑制结构和允许结构的形成以及因此在PCR期间特定DNA片段的抑制效率相关联的平衡常数可以与例如抑制和允许结构的解链温度的差异、抑制衔接子的长度和衔接子的一级结构有关。如果衔接子的抑制子序列部分大致等于或长于引物结合部分,则抑制结构可以由于抑制结构相对于允许结构的更高的解链温度而优先形成。如果抑制子部分是引物结合部分的长度的约一半或更少,或完全不存在,则可以形成扩增允许结构。抑制结构的解链温度可以比允许结构高至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。抑制结构的解链温度可以比允许结构高至多0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。抑制结构的解链温度可以比允许结构的高至少0.01倍、0.05倍、0.1倍、0.5倍或1倍。抑制结构的解链温度可以比允许结构的高至多0.01倍、0.05倍、0.1倍、0.5倍或1倍。
除了序列长度之外,抑制和允许结构的解链温度的差异可以通过在衔接子的引物结合和抑制子序列部分中鸟苷和胞苷残基与腺苷和胸苷残基的相对比率来确定(下文将所述比率称为序列的GC含量)。对于具有引物结合部分和固定长度的抑制子部分的衔接子,抑制子部分的GC含量越高,可以实现的抑制效率越高(使用衔接子的相同引物结合部分)。
在一些实施例中,当与衔接子的相同引物结合部分结合使用时,衔接子的抑制子部分越长,抑制效率越高。衔接子的抑制子部分的长度可以是或是至少1、2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、或40个或更多个核苷酸。衔接子的抑制子部分的长度可以是或是至多1、2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、或40个或更多个核苷酸。
在一些实施例中,衔接子不包含可导致形成“发夹”或可以例如阻止衔接子连接和/或引物延伸的其他二级结构的任何序列。
在一些情况下,本披露的衔接子可以是图17所述的衔接子。衔接子可以包含测序引物序列(例如,亿明达读段1(IR1))序列。本披露的WTA引物可以与测序引物序列1705的子序列杂交。
本披露的衔接子可以包含抑制序列1710和限制性酶结合位点1715。在一些实施例中,衔接子可以被设计成使得在RT引物序列和衔接子之间存在错配,参见“*”。例如,错配数目可以是或是至少1、2、3、4、5、6、7、8、9、或10或更多。在一些实施例中,错配数目可以是至多1、2、3、4、5、6、7、8、9、或10或更多。在一些实施例中,错配数目是1。在一些实施例中,错配数目是4。在一些实施例中,抑制序列可以包含至少1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。在一些实施例中,抑制序列可以包含至多1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。在一些实施例中,低抑制衔接子可以包含与RT引物序列的更多错配,从而降低锅柄结构形成的能力,从而限制抑制。在一些实施例中,高抑制衔接子可以包含与RT引物序列的更少错配,从而提高锅柄结构形成的能力,从而增加抑制。
衔接子可以连接到本披露的双链cDNA。连接方法可以包括使用T4 DNA连接酶,其催化在具有平端和粘性末端的双链体DNA或RNA中并列的5'磷酸和3'羟基末端之间形成磷酸二酯键;使用Taq DNA连接酶,其催化在与互补靶DNA杂交的两个相邻寡核苷酸中并列的5'磷酸和3'羟基末端之间形成磷酸二酯键;使用大肠杆菌DNA连接酶,其催化在含有粘性末端的双链体DNA中并列的5'-磷酸和3'-羟基末端之间形成磷酸二酯键;以及使用T4RNA连接酶,其催化通过形成3'到5'磷酸二酯键使末端为5'磷酰基的核酸供体与末端为3'羟基的核酸受体连接,底物包括单链RNA和DNA以及二核苷焦磷酸;或本领域已知的任何其他方法。不同的酶产生不同的突出端,并且衔接子的突出端可以靶向连接到由选择的限制性酶产生的片段。
在一些实施例中,使用双链衔接子,并且将衔接子的仅一条链连接到双链cDNA。可以选择性地阻断衔接子的一条链的连接。为了阻断连接,例如,可以将衔接子的一条链设计为在衔接子的此链的5'端和靶核酸的3'端之间引入一个或多个核苷酸的缺口。从衔接子的5'端缺少磷酸酯可以阻断此5'端与可用的3'OH的连接。将衔接子与本披露的双链标记的cDNA连接可产生准对称的核酸(例如,核酸的一条或多条链包含第一和第二通用标记,如图15,1575所示)。
在一些实施例中,可以使用如图15所述的衔接子连接方法进行全转录组扩增。靶标1505可以包含聚A尾。靶标1505可以是mRNA。靶标1505可以与随机条形码1510杂交。随机条形码1510可以包含多个标记。例如,随机条形码1510可以包含靶标特异性区域(例如,用于结合至mRNA的聚A尾的寡聚dT)1515、分子标记1520、细胞标记1525和第一通用标记1530。随机条形码可以使用逆转录酶逆转录1535,从而产生标记的cDNA分子1556。多余的随机条形码1511可以用降解酶1545处理1540。降解酶1545可以是外切核酸酶。
标记的cDNA分子1556可以经历第二链合成1557,从而产生双链标记的cDNA分子1558。第二链合成可以通过以下方式进行:将标记的cDNA分子-mRNA杂交体与切口酶(例如,RNA酶)接触,所述切口酶可以将和标记的cDNA分子1556杂交的mRNA切割从而产生切割的mRNA。切割的mRNA可以用作引物并使用聚合酶(例如,DNA Pol I)延伸,从而并入第一链的序列。聚合酶可以包含5'-3'外切核酸酶活性。聚合酶可降解充当第二链合成的引物的下游mRNA切口。可以使用连接酶将延伸的序列连接在一起,从而产生第二链(例如,双链标记的cDNA分子1558)。
双链标记的cDNA分子1558可以包含与第一通用标记1530互补的序列1531。可以将双链标记的cDNA分子1558与衔接子1560接触。衔接子1560可以是双链的。衔接子1560可以包含限制性内切核酸酶切割位点1562。衔接子1560可以包含第二通用引物序列1561(与1531相同)。衔接子1560可以包含3'突出端。衔接子1560可以包含可连接到双链标记的cDNA分子1558的3'羟基的游离5'磷酸(P)。衔接子1560可以连接到双链标记的cDNA分子1558的两条链上。
可以使用一种或多种WTA扩增引物1565扩增产物。可以扩增产物,使得一条链线性扩增1570,而一条链指数扩增1575。线性扩增的链1570可以在一端包含可扩增的通用序列。可指数扩增的链1575可以在两端包含通用序列。可指数扩增的链1575可以在两端包含不同的通用序列,从而产生准对称的随机条形码化的核酸。WTA扩增的产物(例如,准对称的随机条形码化的核酸)1575可以经受本披露的下游方法,如随机引发和/或测序。
在一些实施例中,可以使用链置换步骤合成第二链。如图16所示,可以使用随机条形码引物(如图15所示)将mRNA逆转录为cDNA,从而产生标记的cDNA 1605。标记的cDNA1605可用切口酶如可以切割RNA 1610的RNaseH来处理。切割的RNA 1610可以充当延伸引物,从而复制标记的cDNA 1605的测序。可以用链置换聚合酶延伸切割的RNA1610。所得的链置换片段1620可以包含作为延伸反应的引物的RNA末端1621。所述方法可以包括从引物/链置换片段1620中去除RNA的RNA去除步骤。链置换片段1620的随机条形码可以是原始条形码的互补体。链置换片段1620可以包含平端。可以将链置换片段1620用包含随机条形码的原始通用序列(参见图15)的序列或互补序列的核酸1625延伸,从而产生双链全转录组扩增产物1630。双链全转录组扩增产物1630可以包含平端或A-突出端。双链全转录组扩增产物1630可以经受本披露的下游方法,如衔接子连接(参见图15)和全转录组扩增,其可以产生本披露的准对称的随机条形码化的核酸。
用固体支持物的衔接子连接
在一些实施例中,可以使用用固体支持物(如珠粒)进行的衔接子连接方法进行全转录组扩增。如本文所披露的,固定在固体支持物(如珠粒)上的随机条形码可用于对来自样品(如单个细胞)的多个靶标进行标记。在一些实施例中,珠粒上的所有随机条形码都包含相同的细胞标记。在一些实施例中,珠粒上的随机条形码包含不同的分子标记。
用固体支持物进行的衔接子连接的示例性实施例示于图31中。在图31中,靶mRNA包含聚A尾。靶标可以与固定在珠粒3125上的随机条形码杂交。随机条形码可以包含多个标记。例如,随机条形码可以包含靶标特异性区域(例如,用于结合至mRNA的聚A尾的寡聚dT)3120、分子标记3115、细胞标记3110和第一通用标记3105。随机条形码可以使用逆转录酶逆转录3130,从而产生固定在珠粒上的标记的cDNA分子3135。多余的随机条形码可以用降解酶去除3140。降解酶可以是外切核酸酶。
标记的cDNA分子3135可以经历第二链合成3150,从而产生双链标记的cDNA分子3155。第二链合成可以通过以下方式进行:将标记的cDNA分子-mRNA杂交体与切口酶(例如,RNA酶)接触,所述切口酶可以将和标记的cDNA分子3135杂交的mRNA切割从而产生切割的mRNA。切割的mRNA可以用作引物并使用聚合酶(例如,DNA Pol I)延伸,从而并入第一链的序列。聚合酶可以包含5'-3'外切核酸酶活性。聚合酶可降解充当第二链合成的引物的下游mRNA切口。可以使用连接酶将延伸的序列连接在一起,从而产生第二链(例如,双链标记的cDNA分子3155)。
双链标记的cDNA分子3155可以在步骤3160进行末端补齐并在游离端加A尾3165,以为衔接子连接做准备。可以将双链标记的cDNA分子3155与衔接子3170接触。衔接子可以是单链的、部分双链的或完全双链的。衔接子可以包含限制性位点3185,例如AsiSI位点。衔接子可以包含5'突出端,其可以包含第二通用引物序列3175。衔接子可以包含可连接到双链标记的cDNA分子3155的3'羟基的游离5'磷酸(P)。衔接子可以连接到双链标记的cDNA分子3155的两条链上。
任选地,连接产物可用作第三链合成3190的模板。CBO40引物3195可以与第二通用引物序列3175杂交以合成第三链。第三链合成产物可以使用一种或多种WTA扩增引物(例如,CBO40引物)和DNA聚合酶(例如,KAPA Fast2G)进行WTA扩增。WTA扩增的产物可以经受本披露的下游方法,如随机引发和/或测序。
使用转座体的衔接子连接
在一些实施例中,衔接子连接步骤可以使用基于转座体的方法来实现。基于转座体的衔接子连接可用于以多种方式标记样品中的靶标。例如,基于转座体的衔接子连接可用于标记在一端包含可固定在固体支持物上的随机条形码的靶标。在一些实施例中,基于转座体的衔接子连接可用于标记在任一端不包含随机条形码的靶标。因此,基于转座体的衔接子连接可用于在一端或两端随机标记靶标。在一些实施例中,基于转座体的衔接子连接可以用于用通用标记、分子标记、细胞标记、空间标记或其任何组合来标记靶标。在一些实施例中,可以在两端将两个衔接子连接到靶标,所述两个衔接子可以是相同的或不同的。
在一些实施例中,靶标可以是通过如本文披露的逆转录和第二链合成方法产生的双链cDNA分子。在一些实施例中,在将加载衔接子的转座酶添加至靶标之前不需要第二链合成,所述靶标可以是mRNA/cDNA杂交体。在一些实施例中,转座体可以随机将靶标片段化。例如,转座体可以将靶标片段化为具有是、是约、小于、大于20nt、30nt、40nt、50nt、60nt、70nt、80nt、90nt、100nt、200nt、300nt、400nt、500nt、或任意两个上述值之间的范围的尺寸的片段。
在一些实施例中,固定在固体支持物上的靶标可以使用转座体连接,使得固体支持物可用于去除未固定在固体支持物上的片段。在一些实施例中,固定在固体支持物上的靶标可以使用转座体连接,使得固体支持物可用于去除固定在固体支持物上的片段。
本文披露的衔接子可以加载到转座酶中,将其添加至靶标,如随机条形码化的分子。在一些实施例中,转座酶可以是Tn5转座酶或其过度活性衍生物,如在Adey等人,GenomeBiology[基因组生物学](2010)11:R119中所披露,将其内容通过引用以其全文特此结合。在一些实施例中,衔接子可以包含野生型转座子DNA序列或其衍生物。
如图32所示,靶mRNA可以包含聚A尾。靶标可以与固定在珠粒3225上的随机条形码杂交。随机条形码可以包含多个标记。例如,随机条形码可以包含靶标特异性区域(例如,用于结合至mRNA的聚A尾的寡聚dT)3220、分子标记3215、细胞标记3210和第一通用标记3205。随机条形码可以使用逆转录酶逆转录3230,从而产生固定在珠粒上的标记的cDNA分子3235。多余的随机条形码可以用降解酶去除3240。降解酶可以是外切核酸酶。
标记的cDNA分子3235可以经历第二链合成3250,从而产生双链标记的cDNA分子3255。第二链合成可以通过以下方式进行:将标记的cDNA分子-mRNA杂交体与切口酶(例如,RNA酶)接触,所述切口酶可以将和标记的cDNA分子3135杂交的mRNA切割从而产生切割的mRNA。切割的mRNA可以用作引物并使用聚合酶(例如,DNA Pol I)延伸,从而并入第一链的序列。聚合酶可以包含5'-3'外切核酸酶活性。聚合酶可降解充当第二链合成的引物的下游mRNA切口。可以使用连接酶将延伸的序列连接在一起,从而产生第二链(例如,双链标记的cDNA分子3255)。
双链标记的cDNA分子3255可以用转座体3260(例如,来自亿明达的Nextera或Nextera XT)进行处理以进行衔接子连接。可以将双链标记的cDNA分子3155与加载有衔接子3270的转座体3265接触。双链标记的cDNA分子3155可以与加载有第二衔接子3280的第二转座体3275接触。转座体可以将双链标记的cDNA分子3255片段化3290并连接双链衔接子。双链衔接子可以包含通用引物结合序列,例如转座酶引物。在一些实施例中,基于转座体的衔接子连接可以在mRNA-cDNA杂交体上进行。因此,不需要第二链合成。
可以将衔接子连接的产物使用一种或多种文库扩增引物例如ILR2引物和转座酶引物进行扩增3295,以产生带索引的文库。可以使用第二个扩增步骤完成使用全长P5和P7引物创建测序文库。P5和P7引物用于产生用于亿明达的HiSeq和MiSeq平台的测序文库。
通过模板转换进行衔接子连接
在一些实施例中,本披露提供了使用模板转换将衔接子添加到随机条形码化的分子的方法。如图21所示,mRNA 2120可以与可缀合到固体支持物(例如,珠粒)2105上的随机条形码2110接触。随机条形码2110可以包含本披露的任何标记(例如,分子标记、细胞标记、通用标记2111)和靶标特异性区域2115。mRNA 2120可逆转录成cDNA。可以使用模板转换将衔接子2125(例如,本披露的衔接子)添加至cDNA中。可以在添加衔接子的cDNA上发生第二链合成,从而产生可进行半抑制性PCR的双链cDNA 2130。双链cDNA 2130可以进行半抑制性PCR,因为衔接子可以包含与通用标记2111至少部分互补的序列2112。双链cDNA 2130可以称为准对称的随机条形码化的核酸。
用全转录组扩增引物扩增
随机条形码化的核酸(例如,包含由随机引发产生的或从本披露的非引发性第二链和第三链合成或衔接子连接方法产生的均聚物尾或衔接子)可以使用全转录组扩增引物扩增。在一些实施例中,全转录组扩增引物的长度可以是或是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个或更多个核苷酸。在一些实施例中,全转录组扩增引物的长度可以是至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个或更多个核苷酸。在一些实施例中,全转录组扩增引物可以结合至第一和第二通用标记的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个或更多个核苷酸。在一些实施例中,全转录组扩增引物可以结合至第一和第二通用标记的至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个或更多个核苷酸。全转录组扩增引物可不结合至第一和/或第二通用标记的整体。在一些情况下,全转录组扩增引物结合至第一和/或第二通用标记的18个核苷酸。
用全转录组扩增引物扩增可以产生全转录组扩增子。全转录组扩增子可以是准对称的。可以保存全转录组扩增子(例如,在-20℃、-80℃)。全转录组扩增子可以代表来自样品(例如单个细胞)的转录物的永生化文库。
扩增
可以进行一个或多个核酸扩增反应以产生随机条形码化的核酸的多个拷贝(例如,包含由随机引发产生的或从本披露的非引发性第二链和第三链合成或衔接子连接方法产生的均聚物尾或衔接子)。扩增能以多路方式进行,其中多个靶核酸序列同时进行扩增。扩增反应可用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(如果存在)的至少一部分。扩增反应可以包括扩增细胞和/或分子标记的至少一部分。扩增反应可以包括扩增样品标签、细胞标记、空间标记、分子标记、靶核酸或其组合的至少一部分。扩增反应可以包括扩增样品(如单个细胞)中的多个核酸的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、或100%。所述方法还可以包括进行一个或多个cDNA合成反应以产生包含样品标记、细胞标记、空间标记和/或分子标记的靶标-条形码分子的一个或多个cDNA拷贝。
在一些实施例中,可以使用聚合酶链式反应(PCR)进行扩增。如本文使用的,PCR可以指用于通过DNA的互补链的同时引物延伸使特异性DNA序列体外扩增的反应。如本文使用的,PCR可包括所述反应的派生形式,包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、数字PCR、和组装PCR。
标记的核酸的扩增可以包括基于非PCR的方法。基于非PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、全转录组扩增(WTA)、全基因组扩增(WGA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环到环扩增(circle-to-circle amplification)。其他基于非PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多个循环以扩增DNA或RNA靶标、连接酶链式反应(LCR)和Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、使引物杂交至核酸序列并且将所得双链体在延伸反应和扩增之前切割的扩增方法、使用缺乏5'外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和分支延伸扩增(RAM)。在一些实施例中,扩增可不产生环化转录物。
抑制PCR可用于本披露的扩增方法。抑制PCR可以指选择性地排除小于某一尺寸的侧翼为末端反向重复序列的分子,这是因为当用于扩增的一个或多个引物对应于整个重复序列或重复序列的一部分时,所述分子无效扩增。对此原因可在于片段互补端的生产性PCR引物退火和非生产性自退火之间的平衡。在侧翼末端反向重复序列的尺寸固定的情况下,插入物越短,抑制效果越强,反之亦然。同样,在插入物尺寸固定的情况下,末端反向重复序列越长,抑制效果越强。
抑制PCR可以使用在PCR扩增之前连接到DNA片段末端的衔接子。在解链和退火时,在链的5'端和3'端具有自互补衔接子的单链DNA片段可形成抑制PCR过程中片段扩增的抑制性“网球拍”形结构。
在一些实施例中,本文披露的方法还包括对标记的核酸(例如,标记的RNA、标记的DNA、标记的cDNA)进行聚合酶链式反应,以产生随机标记的扩增子。标记的扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或分子标记。随机标记的扩增子可以是单链分子。单链分子可包括DNA、RNA或其组合。本披露的核酸可以包含合成的或改变的核酸。
扩增可以包括使用一个或多个非天然核苷酸。非天然核苷酸可包括光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)、以及二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或多个循环中。添加非天然核苷酸也可以用于鉴别扩增反应中特定循环或时间点的产物。
进行一个或多个扩增反应可以包括使用一种或多种引物。一种或多种引物可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、或15个或更多个核苷酸。一种或多种引物可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、或15个或更多个核苷酸。一种或多种引物可以包含少于12-15个核苷酸。一种或多种引物可以退火至多个随机标记的靶标的至少一部分。一种或多种引物可以退火至多个随机标记的靶标的3'端或5'端。一种或多种引物可以退火至多个随机标记的靶标的内部区域。内部区域可以是或是至少从所述多个随机标记的靶标的3'端的约50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸。一种或多种引物可以包括一组固定的引物。一种或多种引物可以包括至少一种或多种定制引物。一种或多种引物可以包括至少一种或多种对照引物。一种或多种引物可以包括至少一种或多种基因特异性引物。
一种或多种引物可以包括本披露的任何通用引物。通用引物可以退火至通用引物结合位点。一种或多种定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、分子标记、靶标或其任何组合。一种或多种引物可以包括通用引物和定制引物。定制引物可以设计用于扩增一个或多个靶标。靶标可以包括一个或多个样品中总核酸的子集。靶标可以包括一个或多个样品中总随机标记的靶标的子集。一种或多种引物可以包括至少96种或更多种定制引物。一种或多种引物可以包括至少960种或更多种定制引物。一种或多种引物可以包括至少9600种或更多种定制引物。一种或多种定制引物可以退火至两个或更多个不同的标记的核酸。两个或更多个不同的标记的核酸可以对应于一个或多个基因。
可以在本披露的方法中使用任何扩增方案。例如,在一个方案中,第一轮PCR可以使用基因特异性引物和针对通用亿明达测序引物1序列的引物来扩增分子(例如,附接到珠粒上)。第二轮PCR可以使用侧翼于亿明达测序引物2序列的巢式基因特异性引物和针对通用亿明达测序引物1序列的引物扩增第一PCR产物。第三轮PCR添加P5和P7以及样品索引,以便使PCR产物进入亿明达测序文库。使用150bp x 2测序的测序可以揭示读段1上的细胞标记和分子索引、读段2上的基因以及索引1读段上的样品索引。
扩增可以进行一轮或多轮。在一些情况下,存在多轮扩增。扩增可以包括两轮或更多轮扩增。第一次扩增可以是X'外的延伸以产生基因特异性区域。当样品核酸与新产生的链杂交时,可发生第二次扩增。
在一些实施例中,杂交不需要发生在核酸分子的末端。在一些实施例中,将较长核酸的完整链内的靶核酸杂交并扩增。例如在基因组DNA或mRNA的较长部分内的靶标。靶标可以是离多核苷酸的一端多于50nt、多于100nt、或多于1000nt。
文库制备
本披露提供了用于文库制备的方法。在一些实施例中,随机条形码化的核酸(例如,包含由随机引发产生的或从本披露的非引发性第二链和第三链合成或衔接子连接方法产生的均聚物尾或衔接子)和/或来自其的全转录组扩增子、或准对称的随机条形码化的核酸和/或来自其的全转录组扩增子可用于文库制备。在一些情况下,随机条形码化的核酸(例如,包含由随机引发产生的或从本披露的非引发性第二链和第三链合成或衔接子连接方法产生的均聚物尾或衔接子)和/或来自其的全转录组扩增子、或准对称的随机条形码化的核酸和/或全转录组扩增子(例如,产生自准对称的随机条形码化的核酸的全转录组扩增)可包含限制性内切核酸酶切割位点。限制性内切核酸酶切割位点的切割可以用如本文披露的限制性内切核酸酶进行。用限制性内切核酸酶处理可导致限制性位点至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的切割。用限制性内切核酸酶处理可导致限制性位点至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的切割。准对称的随机条形码化的核酸和/或全转录组扩增子的切割可以代表破坏准对称的随机条形码化的核酸的对称性的第一机制。切割可产生非对称的随机条形码化的核酸和/或不对称的全转录组扩增子(如本文使用的这些术语可互换使用)。准对称的随机条形码化的核酸和/或准对称的随机条形码化的核酸的扩增子可不被切割。
随机条形码化的核酸(例如,包含由随机引发产生的或从本披露的非引发性第二链和第三链合成或衔接子连接方法产生的均聚物尾或衔接子)和/或来自其的全转录组扩增子、或不对称的随机条形码化的核酸、准对称的随机条形码化的核酸和/或扩增子(例如,未切割的扩增子,即准对称的随机条形码化的核酸的扩增子)可以经受随机引发。在一些实施例中,包含随机多聚体序列和第三通用标记的简并引物可以与随机条形码化的核酸和/或扩增子接触。例如,随机多聚体序列的长度可以是或是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸。在一些实施例中,随机多聚体序列的长度可以是至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸。随机多聚体序列可以与随机条形码化的核酸和/或扩增子上的随机位置杂交。
引物寡核苷酸的第三通用标记与本披露的第一和/或第二通用标记可以是相同的。引物寡核苷酸的第三通用标记与本披露的第一和/或第二通用标记可以是不同的。引物寡核苷酸的第三通用标记与第一和/或第二通用标记的差异可以是至少1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。引物寡核苷酸的第三通用标记与第一和/或第二通用标记的差异可以是至多1、2、3、4、5、6、7、8、9、或10个或更多个核苷酸。第三通用标记可以包含测序引物结合位点。例如,第一和/或第二通用标记可以包含第一测序引物结合位点(例如,亿明达读段2引物)。第三通用标记可以包含第二测序引物结合位点(例如,亿明达读段1引物)。
随机多聚体可以与随机条形码化的核酸和/或扩增子的有义链和/或反义链杂交。可以延伸简并引物(例如,用引物延伸),从而产生3'和5’读段产物(例如,可在测序仪上产生3'和5'读段的产物)。3'和5'读段产物可称为不对称的读段产物。读段产物中的一些可以包含靶核酸、随机条形码和第一通用标记(例如,3'读段产物)的序列。多核苷酸产物中的一些可以包含靶核酸和第二通用标记(如果切割不是有效的,则为限制性切割位点)(例如,5'读段产物)的序列。
可以用测序文库扩增引物扩增读段产物。测序文库扩增引物可以指用于添加可用于测序反应的序列的引物(例如,测序流动池引物)。测序文库扩增引物的第一引物可以与第三通用标记(例如,在随机引发中使用的简并引物上)杂交。测序文库扩增引物的第二引物可以与第一通用标记杂交。第二引物可不能与第二通用标记物杂交(例如,由于第一通用标记和第二通用标记之间的序列的差异)。在一些实施例中,5'读段产物可不通过第一测序文库扩增引物扩增。在一些实施例中,5'读段产物可以通过第一测序文库扩增引物较低效地扩增。在一些实施例中,5'读段产物的有效扩增可以比3'读段产物少至少10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%。在一些实施例中,5'读段产物的有效扩增可以比3'读段产物少至多10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%。在一些实施例中,3'读段产物的扩增可以比5'读段产物多至少1、2、3、4、5、6、7、8、9、10、15、20、225、30、35、或40倍或更多倍。在一些实施例中,3'读段产物的扩增可以比5'读段产物多至多1、2、3、4、5、6、7、8、9、10、15、20、225、30、35、或40倍或更多倍。在一些实施例中,第二通用标记可以是用于破坏准对称的随机条形码化的核酸的对称性的第二机构(例如,可优先制备来自准对称的随机条形码化的核酸的仅一侧的读段产物)。
可以确定读段产物的序列(例如,通过测序反应)。来自测序反应的读段可以优先映射到3'读段产物。在一些实施例中,3'读段产物的读段数目可以比或至少比来自5'产物的读段多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、或40倍或更多倍。在一些实施例中,3'读段产物的读段数目可以至多比来自5'产物的读段多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、或40倍或更多倍。在一些实施例中,包含随机条形码的3'产物(例如,3'端)可以用于通过对产物上的独特随机条形码计数来估计样品中不同靶核酸的数目。
在一些实施例中,可以制备读段产物以用于测序反应。例如,读段产物可以片段化以用于衔接子连接。片段化可以包括使用机械(Covaris聚焦电声、雾化器、声处理、涡旋)或酶促(例如Fragmentase)片段化的片段化。片段可以是任何长度。例如,片段的长度可以是从1至3,000,000个核苷酸。
在一些实施例中,本披露提供了可产生不对称双链cDNA的文库制备方法(例如,可不产生准对称的随机条形码化的核酸,例如具有包含不同序列的末端,例如可不进行抑制性PCR)。如图26和图27所示,核酸(例如,RNA、mDNA、DNA)可以逆转录,并拷贝或复制成双链cDNA。可以用包含第一序列的引物进行逆转录或引物延伸事件(分别取决于起始物质是RNA还是DNA)。第一序列可以例如包含第一测序引物序列(例如,亿明达读段1)的至少一部分。在一些实施例中,第一序列可以包含测序引物序列的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%。在一些实施例中,第一序列可以包含测序引物序列的至多10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%。
可以将包含第一测序的双链cDNA与衔接子接触。衔接子可以是双链的。衔接子可以是单链的。衔接子可以连接到双链cDNA的3'端。衔接子可以连接到双链cDNA的5'端。双链衔接子的一条链可以连接到双链cDNA的一条链的3'端。
衔接子可以包含第二序列。第二序列可以包含第二测序引物序列(例如,亿明达读段2)的至少一部分。在一些实施例中,第二序列可包含流动池序列的序列的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%。在一些实施例中,第二序列可包含流动池序列的序列的至多10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%。
可以扩增衔接子连接的双链cDNA。扩增可用于使第一和第二序列的序列完整(例如,添加可用于下游应用的完整序列,即添加完整序列以用于对引物序列(例如,亿明达读段1和2)测序和流动池衔接子杂交)。可以在扩增过程中添加流动池序列(例如,亿明达流动池序列)。扩增可用于增加衔接子连接的双链cDNA的量。扩增可以用包含衔接子序列的至少一部分的引物进行。引物可以包含有待添加的其他序列(例如,以使流动池引物的序列完整)。PCR扩增的分子可在测序中使用。
可以基于来自测序的读段确定测序的链。读段包含源自双链衔接子连接的分子的第一链的第一序列。读段包含源自双链衔接子连接的分子的第二链的第二序列。文库制备方法可用于RNA-seq或DNA-seq。所述方法可用于确定RNA分子的哪条链参与调节(例如,反义链)。所述方法可用于确定足迹测定法(例如,Chip-Seq)的碱基对分辨率。所述方法可以不包括一条链的降解以保持方向性(例如,去除一条链仅允许另一条链被测序)。
测序
确定不同的随机标记的核酸的数目可以包括确定标记的靶标、空间标记、分子标记、样品标记和细胞标记或其任何产物(例如标记的扩增子、标记的cDNA分子)的序列。扩增的靶标可以经受测序。确定随机标记的核酸或其任何产物的序列可以包括进行测序反应以确定样品标记、空间标记、细胞标记、分子标记的至少一部分和/或随机标记的靶标、其互补体、其反向互补体的至少一部分、或其任何组合的序列。
可以使用多种测序方法确定核酸的序列(例如,扩增的核酸、标记的核酸、标记的核酸的cDNA拷贝等),所述方法包括但不限于合成测序(SBS)、杂交测序(SBH)、连接法测序(SBL)、量化增量荧光核苷酸附加测序(quantitative incremental fluorescentnucleotide addition sequencing,QIFNAS)、分段连接与断裂、荧光共振能量转移(FRET)、分子信标、TaqMan报告探针消化、焦磷酸测序、荧光原位测序(FISSEQ)、FISSEQ珠粒、摆动测序(wobble sequencing)、多重测序、聚合集群(polymerized colony,POLONY)测序;纳米格滚环测序(nanogrid rolling circle sequencing,ROLONY)、等位基因特异性寡核苷酸连接检验(allele-specific oligo ligation assay)(例如,寡核苷酸连接检验(OLA)、使用连接的线性探针和滚环扩增(RCA)读出、连接的持锁探针的单模板分子(single templatemolecule)OLA、或使用连接的环形持锁探针和滚环扩增(RCA)读出的单模板分子OLA)等。
在一些实施例中,确定标记的核酸或其任何产物的序列包括配对末端测序、纳米孔测序、高通量测序、鸟枪法测序、染料终止剂测序、多重引物DNA测序、引物步移、桑格双脱氧测序法、马克西姆-吉尔伯特(Maxim-Gilbert)测序、焦磷酸测序、真正的单分子测序或其任何组合。可替代地,可以通过电子显微镜分析法或化学敏感场效应晶体管(chemFET)阵列来确定标记的核酸或其任何产物的序列。
也可以使用高通量测序方法,如使用平台(如Roche 454、Illumina Solexa、ABI-SOLiD、ION Torrent、Complete Genomics、Pacific Bioscience、Helicos、或Polonator平台)的循环阵列测序。测序可以包括MiSeq测序。测序可以包括HiSeq测序。
在一些实施例中,随机标记的靶标可以包括代表从约0.01%的生物体基因组基因至约100%的生物体基因组基因的核酸。例如,可以使用包含多个多聚体的靶标互补区域,通过从样品中捕获含有互补序列的基因,对约0.01%的生物体基因组基因至约100%的生物体基因组基因进行测序。在一些实施例中,标记的核酸包括代表从约0.01%的生物体转录组转录物至约100%的生物体转录组转录物的核酸。例如,可以使用包含聚T尾的靶标互补区域,通过从样品中捕获mRNA,对约0.501%的生物体转录组转录物至约100%的生物体转录组转录物进行测序。
在一些实施例中,测序可以包括对标记的核酸和/或随机条形码的至少约10、20、30、40、50、60、70、80、90、100个或更多个核苷酸或碱基对进行测序。在一些实施例中,测序可以包括对标记的核酸和/或随机条形码的至多约10、20、30、40、50、60、70、80、90、100个或更多个核苷酸或碱基对进行测序。在一些实施例中,测序可以包括对标记的核酸和/或随机条形码的至少约200、300、400、500、600、700、800、900、1,000个或更多个核苷酸或碱基对进行测序。在一些实施例中,测序可以包括对标记的核酸和/或随机条形码的至多约200、300、400、500、600、700、800、900、1,000个或更多个核苷酸或碱基对进行测序。在一些实施例中,测序可以包括对标记的核酸和/或随机条形码的至少约1,500、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、或10,000个或更多个核苷酸或碱基对进行测序。在一些实施例中,测序可以包括对标记的核酸和/或随机条形码的至多约1,500、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、或10,000个或更多个核苷酸或碱基对进行测序。
在一些实施例中,测序可以包括每次运行至少约200、300、400、500、600、700、800、900、1,000个或更多个测序读段。在一些实施例中,测序可以包括每次运行至多约200、300、400、500、600、700、800、900、1,000个或更多个测序读段。在一些实施例中,测序包括每次运行对至少约1,500、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、或10,000个或更多个测序读段进行测序。在一些实施例中,测序包括每次运行对至多约1,500、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、或10,000个或更多个测序读段进行测序。在一些实施例中,测序可以包括每次运行对至少10、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1000或更多百万个测序读段进行测序。在一些实施例中,测序可以包括每次运行对至多10、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1000或更多百万个测序读段进行测序。在一些实施例中,测序可以包括对总计至少100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、2000、3000、4000、或5000或更多百万个测序读段进行测序。在一些实施例中,测序可以包括对总计至多100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、2000、3000、4000、或5000或更多百万个测序读段进行测序。在一些实施例中,测序可以包括每次运行小于或等于约1,600,000,000个测序读段。在一些实施例中,测序可以包括每次运行小于或等于约200,000,000个读段。
使用衔接子连接的RNA-Seq文库产生
在一些情况下,本披露提供了用于使用衔接子连接产生RNA-seq文库的方法。下一代测序仪的测序可以在有待测序的核酸的两端上使用平台特异性衔接子序列。可以将衔接子连接到第二链cDNA的两条链上,随后进行PCR扩增,然而衔接子可以有形成二聚体的倾向,这可能产生矫作物。原始样品的方向性可能会丢失(例如,样品的5'和3'端的差异)。衔接子连接中的新方法可用于改进用于下一代测序的文库制备,如图26和27中所示的那些。
如图26所示,RNA 2605(例如,mRNA或片段化的RNA)可以与包含第一序列(例如,第一测序引物序列(例如,亿明达读段1)的一部分)的引物2610接触。RNA 2605可以被逆转录,从而产生第一cDNA链。可以在第二链合成期间拷贝第一cDNA链,由此产生双链cDNA 2615。衔接子2620可与双链DNA 2615连接。衔接子2620可以包含第二序列(例如,第二测序引物序列(例如,亿明达读段2)的一部分)。衔接子2620可以连接到双链cDNA 2615的3'、5'端或3'和5’两端。衔接子2620可以是双链的,但是衔接子仅一条链可以连接到双链cDNA 2615的一条链上。可以使用引物2625通过PCR扩增使第一和第二测序引物序列完整。扩增引物2625可以包含测序引物序列的一部分。扩增引物2625可以包含流动池测序引物。可以对所得分子2630测序。包含衔接子序列2620的读段可以对应于分子2630的第一链。包含第一序列2610的读段可以对应于分子2630的第二链。以此方式,可以用保持分子方向性的衔接子制备RNA-seq文库。
使用衔接子连接的DNA-Seq文库产生
在一些实施例中,本披露提供了用于制备DNA测序文库的衔接子连接方法,如图27所示。DNA 2705可与包含第一序列(例如,第一引物序列(例如,亿明达读段1序列)的一部分)的引物2710接触。可以延伸DNA,从而产生双链cDNA。衔接子2715可以连接到双链cDNA。衔接子2715可以包含第二序列(例如,第二引物序列(例如,亿明达读段2序列)的一部分)。衔接子2715可以连接到双链cDNA的3'、5'端或3'和5’两端。衔接子2715可以是双链的,但是衔接子仅一条链可以连接到双链cDNA的一条链上。可以使用引物2720通过PCR扩增使第一和第二测序引物序列完整。扩增引物2720可以包含测序引物序列的一部分。扩增引物2720可以包含流动池测序引物。可以对所得分子2725测序。包含衔接子序列2715的读段可以对应于分子2725的第一链。包含第一序列2710的读段可以对应于分子2735的第二链。以此方式,可以用保持分子方向性的衔接子制备DNA-seq文库。
跨基底的扩散
当根据本披露的方法将样品(例如,细胞)随机条形码化时,可以将细胞裂解。细胞的裂解可导致裂解内容物(例如,细胞内容物)远离裂解的初始位置而扩散。换言之,裂解内容物可以移动到比细胞占据的表面积更大的表面积中。
样品裂解混合物(例如,包含靶标)的扩散可以通过多种参数来调节,所述参数包括但不限于裂解混合物的粘度、裂解混合物的温度、靶标的尺寸、基底中物理屏障的尺寸、裂解混合物的浓度等。例如,裂解反应的温度可以在至少1℃、2℃、3℃、4℃、5℃、10℃、15℃、20℃、25℃、30℃、35℃、或40℃或更高的温度下进行。在一些实施例中,裂解反应的温度可以在至多1℃、2℃、3℃、4℃、5℃、10℃、15℃、20℃、25℃、30℃、35℃、或40℃或更高的温度下进行。裂解混合物的粘度可以通过例如添加增稠剂(例如,甘油、珠粒)以减慢扩散速率来改变。裂解混合物的粘度可以通过例如添加稀释剂(例如,水)以增加扩散速率来改变。基底可包括可改变靶标从样品扩散的速率的物理屏障(例如,孔、微孔、微丘)。可以改变裂解混合物的浓度以增加或降低靶标从样品扩散的速率。在一些实施例中,裂解混合物的浓度可以增加或降低至少1、2、3、4、5、6、7、8、或9倍或更多倍。在一些实施例中,裂解混合物的浓度可以增加或降低至多1、2、3、4、5、6、7、8、或9倍或更多倍。
可以增加或降低扩散速率。在一些实施例中,与未改变的裂解混合物相比,裂解混合物的扩散速率可以增加或降低至少1、2、3、4、5、6、7、8、9、或10倍或更多倍。在一些实施例中,与未改变的裂解混合物相比,裂解混合物的扩散速率可以增加或降低至多1、2、3、4、5、6、7、8、9、或10倍或更多倍。在一些实施例中,与未改变的裂解混合物相比,裂解混合物的扩散速率可以增加或降低至少10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%。在一些实施例中,与未改变的裂解混合物相比,裂解混合物的扩散速率可以增加或降低至少10%、20%、30%、40%、50%、60%、70%、80%、90%、或100%。
数据分析和显示软件
对靶标空间分辨率的数据分析和可视化
本披露提供了使用空间标记用随机条形码和数字计数来估计靶标的数目和位置的方法。从披露的方法获得的数据可以在图谱上可视化。可以使用用本文所述方法生成的信息来构建来自样品的靶标数目和位置的图谱。图谱可用于定位靶标的物理位置。图谱可用于鉴定多个靶标的位置。多个靶标可以是相同的靶标种类,或多个靶标可以是多个不同的靶标。例如,可以构建脑的图谱,以显示多个靶标的数字计数和位置。
可以从来自单个样品的数据生成图谱。可以使用来自多个样品的数据构建图谱,从而生成组合图谱。可以使用来自数十、数百和/或数千个样品的数据构建图谱。从多个样品构建的图谱可以示出与多个样品共同区域相关联的靶标的数字计数的分布。例如,重复的测定可以显示在同一个图谱上。在一些实施例中,可以在同一图谱上显示(例如,叠加)至少1、2、3、4、5、6、7、8、9、或10个或更多个重复。在一些实施例中,可以在同一图谱上显示(例如,叠加)至多1、2、3、4、5、6、7、8、9、或10个或更多个重复。靶标的空间分布和数目可以通过多种统计学来表示。
组合来自多个样品的数据可以增加组合图谱的位置分辨率。多个样品的方向可以通过常见的界标来记录,其中跨样品的各个位置测量是至少部分不连续的。一个特别的例子是在一个轴上使用超薄切片机对样品进行切片,并且然后沿着不同的通路对第二个样品进行切片。组合数据集可以给出与靶标的数字计数相关联的三维空间位置。复用上述方法可以允许数字计数统计的高分辨率三维图谱。
在一些实施例中,系统包括计算机可读介质,其包括用于提供对通过执行单细胞随机条形码化测定而产生的序列数据集的数据分析的代码。可以由数据分析软件提供的数据分析功能的实例包括但不限于(i)用于解码/多路解编通过对在运行测定中产生的随机条形码文库进行测序所提供的样品标记、细胞标记、空间标记和分子标记以及靶序列数据的算法,(ii)用于基于数据确定每个细胞每个基因的读段数目和每个细胞每个基因的独特转录物分子数目、并且创建汇总表的算法,(iii)对序列数据的统计分析,例如用于通过基因表达数据对细胞聚类,或用于预测确定每个细胞每个基因的转录物分子数目的置信区间等,(iv)用于鉴定罕见细胞亚群的算法,例如使用主成分分析、分层聚类、k均值聚类、自组织映射、神经网络等,(v)基因序列数据与已知参考序列比对以及突变、多态性标记物和剪接变体的检测的序列比对能力,以及(vi)分子标记的自动聚类,以补偿扩增或测序错误。在一些实施例中,可商购的软件可用于执行数据分析的全部或一部分,例如,可以使用七桥(Seven Bridges,https://www.sbgenomics.com/)软件来编译在整个细胞集合中每个细胞中出现的一个或多个基因的拷贝数目表。在一些实施例中,数据分析软件可以包括用于以有用的图形格式输出测序结果的选项,例如,指示在细胞集合的每个细胞中存在的一个或多个基因的拷贝数的热图。在一些实施例中,数据分析软件还可以包括用于从测序结果提取生物学意义的算法,例如通过将在细胞集合的每个细胞中存在的一个或多个基因的拷贝数与一种细胞、一种稀有细胞、或来源于具有特定疾病或病症的受试者的细胞相关联。在一些实施例中,数据分析软件还可以包括用于比较跨不同生物样品的细胞群的算法。
在一些实施例中,所有数据分析功能都可以打包在单个软件包中。在一些实施例中,完整的数据分析能力集合可以包括一套软件包。在一些实施例中,数据分析软件可以是独立于测定仪器系统的使得使用者可用的独立包。在一些实施例中,软件可以是基于网络的,并且可以允许使用者共享数据。
系统处理器和网络
通常,包括在当前披露的仪器系统中的计算机或处理器还可以被理解为可以从媒体或网络端口读取指令的逻辑设备,其可以任选地连接到具有固定媒体的服务器上。系统可以包括CPU、磁盘驱动器、任选的输入设备(如键盘或鼠标)以及任选的显示器。可以通过从指定的通信介质传至在本地或远程位置的服务器来实现数据通信。通信介质可以包括发送或接收数据的任何工具。例如,通信介质可以是网络连接、无线连接或因特网连接。这样的连接可以提供经由万维网的通信。可以设想的是,与本披露有关的数据可以通过这样的网络或连接进行传输,以由接收方接收或审阅。
可以结合本披露的示例实施例使用计算机系统的第一示例架构的示例性实施例。示例计算机系统可以包括用于处理指令的处理器。处理器的非限制性实例包括:英特尔XeonTM处理器、AMD OpteronTM处理器、三星32位RISC ARM 1176JZ(F)-S v1.0TM处理器、ARM Cortex-A8三星S5PC100TM处理器、ARM Cortex-A8苹果A4TM处理器、迈威尔(Marvell)PXA 930TM处理器或功能等效的处理器。多个执行线程可以用于并行处理。在一些实施例中,也可以使用多处理器或具有多个核心的处理器,无论是以单个计算机系统、成群地还是通过网络跨系统分布的,所述网络包括多个计算机、手机、或个人数据助理装置。
可以将高速缓存连接至或并入处理器中,以便为最近已经被或频繁地被处理器使用的指令或数据提供高速存储器。可以通过处理器总线将处理器与北桥连接。北桥通过存储总线与随机存取存储器(RAM)连接并且管理处理器对RAM的访问。北桥还通过芯片集总线与南桥连接。南桥进而与外设总线连接。外设总线可以是例如PCI、PCI-X、PCI Express或其他外设总线。北桥和南桥常常称作处理器芯片集并且管理处理器、RAM和外设总线上的外设部件之间的数据传送。在一些替代性架构中,可以将北桥的功能并入处理器中而取代使用单独的北桥芯片。
系统可以包括附接到外设总线上的加速器卡。加速器可以包括现场可编程门阵列(FPGA)或其他用于加速某些处理的硬件。例如,加速器可以用于自适应性数据重构或用于评价扩展集处理中所用的代数表达式。
软件和数据可以被存储在外部存储器中并且可以被加载到RAM或缓存中,以便为处理器所用。系统包括用于管理系统资源的操作系统;操作系统的非限制性实例包括:Linux、WindowsTM、MACOSTM、BlackBerry OSTM、iOSTM和其他功能等效的操作系统,以及在操作系统之上运行的用于根据本发明的示例实施例管理数据存储和优化的应用软件。
例如,系统还包括网络接口卡(NIC)并与外设总线连接,用于为外部存储器(如附网存储(NAS))和其他可以用于分布式并行处理的计算机系统提供网络接口。
网络的示例图可以包括多个计算机系统、多个手机和个人数据助理以及附网存储(NAS)。在示例实施例中,系统可以管理数据存储并针对存储在附网存储(NAS)中的数据优化数据访问。数学模型可以用于数据并且使用跨计算机系统、和手机以及个人数据助理系统的分布式并行处理进行评价。计算机系统和手机以及个人数据助理系统还可以为存储在附网存储(NAS)中的数据的自适应性数据重构提供并行处理。多种多样的其他计算机架构和系统也可以与本发明的各种实施例结合使用。例如,刀片式服务器可以用来提供并行处理。处理器刀片可以通过底板进行连接,以提供并行处理。存储器也可以通过单独的网络接口与底板连接或作为附网存储(NAS)。
在一些实施例中,处理器可以保持分开的存储空间并且通过网络接口、底板或其他连接器传输数据,用于通过其他处理器进行并行处理。在其他实施例中,一些或所有处理器可以使用共享的虚拟地址存储空间。
根据一个示例实施例,多处理器计算机系统的示例性框图可以包括共享的虚拟地址存储空间。在一些实施例中,所述系统可以包括多个可以访问共享的存储子系统的处理器。在一些实施例中,所述系统可以在存储子系统中并入多个可程编硬件存储算法处理器(MAP)。每个MAP可以包括存储器和一个或多个现场可编程门阵列(FPGA)。MAP可以提供可配置的功能单元,并且可以向FPGA提供特定算法或算法部分,以便与相应的处理器紧密协调进行处理。例如,MAP可以用于相对于数据模型来评价代数表达式以及用于在示例实施例中进行自适应性数据重构。在这个实例中,每个MAP都可被所有处理器全球访问,用于这些目的。在一种配置中,每个MAP可以使用直接存储器访问(DMA)来访问关联的存储器,从而允许其独立于相应的微处理器并且和相应的微处理器异步地执行任务。在此配置中,MAP可以将结果直接馈至另一个MAP,用于流水线操作和并行执行算法。
以上计算机架构和系统仅仅是实例,并且多种多样的其他计算机、手机和个人数据助理架构和系统可以与示例实施例结合使用,包括使用一般处理器、协同处理器、FPGA和其他可编程逻辑装置、片上系统(SOC)、专用集成电路(ASIC)以及其他处理和逻辑元件的任何组合的系统。在一些实施例中,全部或部分的计算机系统可以在软件或硬件中实施。任何种类的数据存储介质都可以与示例实施例结合使用,包括随机存取存储器、硬盘驱动器、闪速存储器、磁带驱动器、磁盘阵列、附网存储(NAS)以及其他局部或分布式数据存储装置和系统。
在一些实施例中,可以使用在任何以上或其他计算机架构和系统上执行的软件模块来实施本披露的计算机子系统。在其他实施例中,可以部分地或完全地在以下项中实现所述系统的功能:固件、可编程逻辑装置(如现场可编程门阵列(FPGA))、片上系统(SOC)、专用集成电路(ASIC)或其他处理和逻辑元件。例如,可以通过使用硬件加速器卡(如加速器卡)通过硬件加速来实施集处理器和优化器。
试剂盒
本文披露了用于进行单细胞随机条形码化测定的试剂盒。试剂盒可以包含一个或多个基底(例如,微孔阵列),作为包含一个或多个微孔阵列的独立基底(或芯片),或包装在一个或多个流动池或盒内。在一些实施例中,试剂盒包含一种或多种固体支持物悬浮液,其中悬浮液内的单独固体支持物包含本披露的多个附接的随机条形码。在一些实施例中,试剂盒包含可不附接至固体支持物的随机条形码。在一些实施例中,试剂盒还可以包含用于安装独立的基底的机械固定装置,以便产生便于将样品和试剂移液至基底中的反应孔。试剂盒还可以包含试剂,例如裂解缓冲液、漂洗缓冲液或杂交缓冲液,以用于进行随机条形码化测定。在一些实施例中,试剂盒还包含用于进行核酸延伸反应(例如,逆转录反应和引物延伸反应)的试剂(例如酶、引物、dNTP、NTP、RNA酶抑制剂或缓冲液)。在一些实施例中,试剂盒还包含用于进行扩增反应以制备测序文库的试剂(例如酶、通用引物、测序引物、靶标特异性引物或缓冲液)。在一些实施例中,试剂盒可以包含连接酶、转座酶、逆转录酶、DNA聚合酶、RNA酶、外切核酸酶或其任何组合。在一些实施例中,试剂盒包含用于分子的均聚物加尾的试剂(例如,末端转移酶和dNTP)。试剂盒可以包含用于例如本披露的任何酶促切割的试剂(例如,ExoI核酸酶、限制性酶)。在一些实施例中,试剂盒可以包含用于衔接子连接的试剂(例如,连接酶、还原剂)。在一些实施例中,试剂盒可以包含用于文库制备(例如,添加测序文库/流动池引物)的试剂,其可以包括测序/流动池引物、用于附接引物的酶、dNTP等。
在一些实施例中,试剂盒包含本披露的全转录组扩增引物。在一些实施例中,试剂盒可以包含本披露的测序文库扩增引物。在一些实施例中,试剂盒可以包含本披露的第二链合成引物。例如,第二链合成引物可以包含第二通用标记、基因特异性序列、随机多聚体序列、限制性酶切割位点和与均聚物尾互补的序列或其任何组合。试剂盒可以包含本披露的任何引物(例如,基因特异性引物、随机多聚体、测序引物和通用引物)。
在一些实施例中,试剂盒可以包含一个或多个用于铸造基底(例如,微孔阵列)的模具(例如,包含微孔阵列的模具)、和一个或多个固体支持物(例如,珠粒),其中悬浮液内的单独珠粒包含本披露的多个附接的随机条形码。在一些实施例中,试剂盒还可以包含用于铸造基底的材料(例如琼脂糖、水凝胶、PDMS、光学粘合剂等)。
在一些实施例中,试剂盒可以包含用固体支持物预先加载的一个或多个基底,所述固体支持物包含本披露的多个附接的随机条形码。在一些情况下,基底的每个微孔可以存在一个固体支持物。在一些实施例中,多个随机条形码可以直接附接到基底的表面,而不是固体支持物上。在任何这些实施例中,一个或多个微孔阵列能以独立的基底(或芯片)的形式提供,或者它们可以包装在流动池或盒中。
在一些实施例中,试剂盒可以包含并入一个或多个基底的一个或多个盒。在一些实施例中,一个或多个盒还可以包括一个或多个预先加载的固体支持物,其中悬浮液内的单独固体支持物包含括本披露的多个附接的随机条形码。在一些实施例中,珠粒可以预先分布到盒的一个或多个微孔阵列中。在一些实施例中,悬浮液形式的珠粒可以预先加载并储存在盒的试剂孔中。在一些实施例中,一个或多个盒还可以包含预先加载的并储存在盒的试剂储器内的其他测定试剂。
试剂盒还可以包括用于实施本文所述的一种或多种方法的说明书。试剂盒中包含的说明书可以贴在包装材料上,或者可以作为包装插入物而被包含。虽然说明书通常是书面材料或印刷材料,但它们不限于此。任何能够存储此类说明书并将其传送给最终使用者的介质都被本披露所涵盖。此类介质可以包括但不限于电子存储介质(例如,磁盘、磁带、盒式磁带、芯片或其任何组合)、光学介质(例如,CD ROM)、RF标签等。如本文使用的,术语“说明书”可以包括提供说明书的互联网网站的地址。
系统
本文披露了用于从多个单细胞产生全转录组扩增(WTA)产物的系统。在一些实施例中,本文披露的系统可以包含基底,所述基底包含多个分隔物,所述多个分隔物中的每一个包含单个细胞和固定有多个核酸的固体支持物。在一些实施例中,本文披露的系统可以包含一种或多种固体支持物悬浮液,其中悬浮液内的单独固体支持物包含本披露的多个附接的随机条形码。在一些实施例中,本文披露的系统可以包含可不附接至固体支持物的随机条形码。在一些实施例中,本文披露的系统还可以包含用于安装独立的基底的机械固定装置,以便产生便于将样品和试剂移液至基底中的反应孔。在一些实施例中,本文披露的系统还可以包含试剂,例如裂解缓冲液、漂洗缓冲液或杂交缓冲液,以用于进行随机条形码化测定。在一些实施例中,本文披露的系统还可以包含用于进行核酸延伸反应(例如,逆转录反应和引物延伸反应)的试剂(例如酶、引物、dNTP、NTP、RNA酶抑制剂或缓冲液)。在一些实施例中,本文披露的系统还包含用于进行扩增反应以制备测序文库的试剂(例如酶、通用引物、测序引物、靶标特异性引物或缓冲液)。在一些实施例中,本文披露的系统可以包含连接酶、转座酶、逆转录酶、DNA聚合酶、RNA酶、外切核酸酶或其任何组合。
装置
流动池
微孔阵列基底可以被包装在流动池内,所述流动池提供与流体处理系统的其余部分的方便界面结合,并且促进流体的交换,所述流体是例如细胞和固体支持物悬浮液、裂解缓冲液、漂洗缓冲液等,其被递送到微孔阵列和/或乳滴。设计特征可以包括:(i)一个或多个用于引入细胞样品、固体支持物悬浮液或其他测定试剂的入口,(ii)一个或多个被设计成提供均匀填充和有效流体交换同时最小化回涡或死区的微孔阵列室,以及(iii)一个或多个用于将流体递送到样品收集点或废物储器的出口。流动池的设计可以包括与多个微孔阵列界面结合的多个微孔阵列室,这样使得可以平行处理一个或多个不同的细胞样品。流动池的设计还可以包括用于跨阵列室的宽度产生匀流速度剖面图(即“活塞流”)的特征,以提供细胞和珠粒到微孔的更均匀递送,例如,通过使用作为“流动扩散器(flow diffuser)”的位于室入口附近和微孔阵列上游的多孔隔板,或通过将每个阵列室分成若干分段,所述分段共同覆盖相同的总阵列区,但是通过它们分开的入口液流平行地流动。在一些实施例中,流动池可以围绕或并入多于一个微孔阵列基底。在一些实施例中,整合的微孔阵列/流动池组件可以构成系统的固定部件。在一些实施例中,微孔阵列/流动池可以是从仪器可移除的。
在一些实施例中,优化流体通道和一个或多个阵列室在流动池设计中的尺寸,以便(i)提供细胞和珠粒到微孔阵列的均匀递送,和(ii)最小化样品和试剂消耗。在一些实施例中,流体通道的宽度在50um和20mm之间。在一些实施例中,流体通道的宽度可以是至少50um、至少100um、至少200um、至少300um、至少400um、至少500um、至少750um、至少1mm、至少2.5mm、至少5mm、至少10mm、至少20mm、至少50mm、至少100mm、或至少150mm。在一些实施例中,流体通道的宽度可以是至多150mm、至多100mm、至多50mm、至多20mm、至多10mm、至多5mm、至多2.5mm、至多1mm、至多750um、至多500um、至多400um、至多300um、至多200um、至多100um、或至多50um。在一些实施例中,流体通道的宽度是约2mm。流体通道的宽度可以落在由这些值中的任何值限定的任何范围内(例如从约250um至约3mm)。
在一些实施例中,流体通道的深度在50um和2mm之间。在其他实施例中,流体通道的深度可以是至少50um、至少100um、至少200um、至少300um、至少400um、至少500um、至少750um、至少1mm、至少1.25mm、至少1.5mm、至少1.75mm、或至少2mm。在再其他实施例中,流体通道的宽度可以是至多2mm、至多1.75mm、至多1.5mm、至多1.25mm、至多1mm、至多750um、至多500um、至多400um、至多300um、至多200um、至多100um、或至多50um。在一个实施例中,流体通道的深度是约1mm。流体通道的深度可以落在由这些值中的任何值限定的任何范围内(例如从约800um至约1mm)。
流动池可以使用本领域的普通技术人员已知的多种技术和材料制造。在一些实施例中,流动池被制造为单独零件并且随后被机械地夹固或永久地结合到微孔阵列基底上。适合的制造技术的实例包括常规机械加工、CNC机械加工、注塑、3D打印、对齐并层压一层或多层激光切割或冲切聚合物薄膜或多种微制造技术中的任何一种,如光刻法和湿化学蚀刻、干蚀刻、深反应离子蚀刻或激光微机械加工。一旦流动池零件已经被制造出,则它可以机械地附接至微孔阵列基底,例如通过将它抵着微孔阵列基底夹紧(使用或未使用垫圈),或者可以使用本领域的普通技术人员已知的多种技术中的任何一种(取决于使用的材料的选择)使它直接结合到微孔阵列基底上,例如通过使用阳极键合、热键合、或多种粘合剂或粘附膜中的任何一种,包括基于环氧树脂的、基于丙烯酸的、基于硅酮的、可UV固化的、基于聚氨酯的或基于氰基丙烯酸酯的粘合剂。
流动池可以使用本领域的普通技术人员已知的多种材料制造。在一些实施例中,使用的材料的选择取决于所使用的制造技术的选择,反之亦然。适合的材料的实例包括但不限于硅、熔融二氧化硅、玻璃、多种聚合物中的任何一种(例如,聚二甲基硅氧烷(PDMS;弹性体)、聚甲基丙烯酸甲酯(PMMA)、聚碳酸酯(PC)、聚丙烯(PP)、聚乙烯(PE)、高密度聚乙烯(HDPE)、聚酰亚胺、环烯烃聚合物(COP)、环烯烃共聚物(COC)、聚对苯二甲酸乙二酯(PET)、环氧树脂)、金属(例如,铝、不锈钢、铜、镍、铬和钛)、非粘性材料(如特氟龙(PTFE))或这些材料的组合。
在系统的一些实施例中,具有或不具有附接的流动池的微孔阵列可以包装在与仪器系统界面结合的消耗性盒内。盒的设计特征可以包括(i)一个或多个入口,用于与仪器形成流体连接或将细胞样品、珠粒悬浮液或其他测定试剂手动引入盒中;(ii)一个或多个旁路通道,即用于自计量细胞样品和珠粒悬浮液,以避免满溢或回流;(iii)一个或多个整合的微孔阵列/流动池组件、或一个或多个室,其内定位有一个或多个微阵列基底;(iv)整合的微型泵或其他流体致动机构,用于控制流体流动通过装置;(v)整合的微型阀(或其他约束机构),用于将预加载试剂(例如,珠粒悬浮液)隔区化或控制流体流动通过装置;(vi)用于为捕获空气提供逃逸路径的一个或多个通气孔;(vii)一个或多个样品和试剂废物储器;(viii)一个或多个出口,用于与仪器形成流体连接或提供经处理的样品收集点;(ix)机械接口特征,用于相对于仪器系统重复性定位可移除的消耗性盒,并且用于提供进入,这样使得外磁体可以与微孔阵列非常接近;(x)整合的温度控制部件或热接口,用于提供与仪器系统的良好热接触;以及(xi)光学接口特征,例如透明窗,用于对微孔阵列进行光学探询。
盒可以设计成并行处理多于一个样品。盒还可以包括适于与独立式PCR热循环仪或测序仪界面结合的一个或多个可移除样品收集室。盒本身可以适用于与独立式PCR热循环仪或测序仪界面结合。如本披露中使用的术语“盒”可以意为包括在进行测定过程中包含样品和珠粒的零件的任何组件。
盒还可以包括部件,所述部件被设计成产生防止大分子扩散(或增加其路径长度和扩散时间)的物理或化学屏障,以便最小化微孔之间的交叉污染。此类屏障的实例可以包括但不限于用于将细胞和固体支持物(例如,珠粒)递送到微孔阵列的一套蛇形通道,在裂解或孵育步骤过程中经过按压与微孔阵列基底表面接触的可伸缩压板或可变形膜,使用较大的珠粒(例如如上所述的交联葡萄糖珠粒)来堵塞微孔的开口,或在裂解或孵育步骤过程中使不互混的疏水流体从盒内的储器中释放出来以有效地分离并隔区化阵列中的每个微孔。
可以优化流体通道和一个或多个阵列室在盒设计中的尺寸,以便(i)提供细胞和珠粒到微孔阵列的均匀递送,和(ii)最小化样品和试剂消耗。例如,流体通道的宽度可以在50微米和20mm之间。在一些实施例中,流体通道的宽度可以是至少50微米、至少100微米、至少200微米、至少300微米、至少400微米、至少500微米、至少750微米、至少1mm、至少2.5mm、至少5mm、至少10mm、或至少20mm。在一些实施例中,流体通道的宽度可以是至多20mm、至多10mm、至多5mm、至多2.5mm、至多1mm、至多750微米、至多500微米、至多400微米、至多300微米、至多200微米、至多100微米、或至多50微米。在一些实施例中,流体通道的宽度可以是约2mm。在一些实施例中,流体通道的宽度可以落在由这些值中的任何值限定的任何范围内(例如从约250μm至约3mm)。
盒中的流体通道可以具有一定深度。盒设计中流体通道的深度可以是例如50微米与2mm之间。在一些实施例中,流体通道的深度可以是至少50微米、至少100微米、至少200微米、至少300微米、至少400微米、至少500微米、至少750微米、至少1mm、至少1.25mm、至少1.5mm、至少1.75mm、或至少2mm。在一些实施例中,流体通道的深度可以是至多2mm、至多1.75mm、至多1.5mm、至多1.25mm、至多1mm、至多750微米、至多500微米、至多400微米、至多300微米、至多200微米、至多100微米、或至多50微米。在一些实施例中,流体通道的深度可以是约1mm。在一些实施例中,流体通道的深度可以落在由这些值中的任何值限定的任何范围内(例如从约800微米至约1mm)。
盒可以使用本领域的普通技术人员已知的多种技术和材料制造。在一些实施例中,使用多种机械组装或结合技术中的任何一种将盒制造为一系列单独的零部件并且随后组装。适合的制造技术的实例包括但不限于常规机械加工、CNC机械加工、注塑、热成形以及3D打印。一旦盒部件已经被制造出,可以使用螺钉、夹子等将它们进行机械组装,或使用多种技术中的任何一种(取决于使用的材料的选择)使它们永久结合,例如通过使用热键合/焊接或多种粘合剂或粘附膜中的任何一种,包括基于环氧树脂的、基于丙烯酸的、基于硅酮的、可UV固化的、基于聚氨酯的或基于氰基丙烯酸酯的粘合剂。
盒部件可以使用多种适合的材料中的任何一种制造而来,包括但不限于硅、熔融二氧化硅、玻璃、多种聚合物中的任何一种(例如,聚二甲基硅氧烷(PDMS;弹性体)、聚甲基丙烯酸甲酯(PMMA)、聚碳酸酯(PC)、聚丙烯(PP)、聚乙烯(PE)、高密度聚乙烯(HDPE)、聚酰亚胺、环烯烃聚合物(COP)、环烯烃共聚物(COC)、聚对苯二甲酸乙二酯(PET)、环氧树脂、非粘性材料(如特氟龙(PTFE))、金属(例如,铝、不锈钢、铜、镍、铬和钛)、或其任何组合。
盒的入口和出口特征可以被设计成提供与仪器的方便且防漏的流体连接,或可以用作开放储器,用于将样品和试剂手动地移进或移出盒。入口和出口连接器的方便机械设计的实例可以包括但不限于螺纹连接器、鲁尔锁紧连接器、鲁尔滑锁(Luer slip)或“滑动型(slip tip)”连接器、压入配合连接器等。盒的入口和出口还可以包括帽、弹簧加载盖或塞、或聚合物膜,当盒被定位在仪器中时,其被打开或刺破,并且用于防止在储存过程中盒内表面的污染或当盒被从仪器上移除时防止流体溢出。盒的一个或多个出口可以进一步包括可移除的样品收集室,其适于与独立式PCR热循环仪和/或测序仪界面结合。
盒可以包括例如整合的微型泵或其他流体致动机构,用于控制流体流动通过装置。适合的微型泵或流体致动机构的实例可以包括但不限于机电或气动致动的微型注射器或柱塞机构、气动地或通过外部活塞致动的膜隔膜泵、气动致动的试剂小袋或气囊、或电渗泵。
盒可以包括例如用于隔区化预先加载的试剂或控制流动通过装置的流体的微型阀。适合的微型阀的实例可以包括但不限于使用可以被熔化或溶解的蜡或聚合物塞或可以被刺破的聚合物膜制造的一次性“阀”;使用可变形膜构造的夹管阀和使用可变形膜片构造的气动、磁、电磁或机电(螺线管)致动的止回阀以及微型门阀。
盒可以包括例如用于为捕获的空气提供逃逸路径的通气孔。可以根据多种技术构造通气孔,例如使用聚二甲基硅氧烷(PDMS)或其他疏水材料的多孔塞,所述材料允许毛细管芯吸空气但阻止被水渗透。
盒的机械接口特征可以提供盒相对于仪器系统的易于移除但高度精确且可重复的定位。适合的机械接口特征可以包括但不限于定位销、定位导件、机械止动件等。机械设计特征可以包括凸凹特征,用于使外部设备(例如,磁体或光学部件)与微孔阵列室非常接近。
在一些实施例中,盒可以包括温度控制部件或热接口特征,用于与外部温度控制模块配合。适合的温度控制元件的实例可以包括但不限于电阻加热元件、微型红外发射光源、珀耳帖(Peltier)加热或冷却装置、散热器、热敏电阻、热电偶等。热接口特征可以由作为良好热导体的材料(例如,铜、金、银等)制成并且可以包括一个或多个能够与外部加热块或冷却块产生良好热接触的平表面。
在一些实施例中,盒可以包括光学接口特征,用于对微孔阵列进行光学成像或光谱学探询。盒可以包括光学透明窗,例如,微孔基底本身或与微孔阵列相对的流动池的或微阵列室的侧面,所述透明窗由满足用于探测微孔阵列的成像或光谱技术的频谱要求的材料制成。适合的光学窗材料的实例可以包括但不限于玻璃、熔融二氧化硅、聚甲基丙烯酸甲酯(PMMA)、聚碳酸酯(PC)、环烯烃聚合物(COP)或环烯烃共聚物(COC)。
虽然已经在本文示出并描述了本发明的优选实施例,但是对本领域的普通技术人员而言应该显而易见是这样的实施例仅以举例方式提供。在不背离本发明的情况下众多变化、改变和替代现在将被本领域的普通技术人员想到。应该理解的是,在实践本发明中可以采用本文描述的本发明的实施例的不同替代方案。预期的是以下权利要求书限定了本发明的范围以及由此覆盖在这些权利要求和它们的等效物的范围内的方法和结构。
实例
提供以下实例以说明但不限制本发明。
为了便于理解,提供了具体实施例以帮助解释技术方案,即,这些实施例仅用于说明目的,而不以任何方式限制本发明的范围。除非另有规定,否则实施例不表示具体条件,符合常规条件或制造商的推荐条件。
实例1:使用在5'端具有通用序列的寡聚dT引物合成第一链cDNA
本实例描述了本披露的衔接子连接方法。使用在其5'端具有通用序列的寡聚dT引物,进行第一链cDNA合成。在第一链合成后,通过古伯-霍夫曼方法(DNA PolI、RNaseH和大肠杆菌DNA连接酶)合成第二链cDNA。在第二链合成后,任选地进一步处理cDNA的末端(即平端化或加dA尾),并将cDNA的3'端连接到具有相同或不同通用引发序列的5'磷酸化衔接子上。由于衔接子为部分单链且5'磷酸化的,因此它可以仅连接至cDNA,具有可忽略的自连接。使用来自原始RT引物的通用序列和连接的衔接子作为引发位点,通过PCR扩增cDNA。引发位点可以是相同序列或本披露的第一和第二通用引物序列,并且可以涉及半抑制性PCR以防止矫作物形成。
在具体的示例性实施例中,所述方法用于从范围为1-100ng总RNA的单独样品并同时从96个1ng样品产生扩增的cDNA。对于每个反应,1ng、10ng、100ng人类脑参考RNA(HBRR)中加有10,000个条形码化的对照RNA,用作第一链cDNA合成的模板,使用由来自PreciseTM测定的所有96个RT引物池组成的200nM RT引物。根据制造商的方案,使用NEBNext第二链cDNA模块产生第二链cDNA。在反应结束前5分钟,加入3U T4 DNA聚合酶以确保平端化cDNA,通过加入EDTA终止反应,并使用1.8X比的AmpureXP珠粒进行纯化。使用NEBNext快速连接模块将300nM磷酸化衔接子CBO102/103(退火的/5Phos/GCGATCGCGATCGGAAGAGCACACGTCTGA(SEQID NO:1)和CTTCCGATCGCGATCGC(SEQ ID NO:2))连接到平端化的cDNA。用1X体积的AmpureXP珠粒纯化连接的cDNA,并将洗脱的产物使用2X Q5 HotStart Mastermix(NEB)和500nM引物CBO23(序列:TCAGACGTGTGCTCTTCC(SEQ ID NO:3))扩增。将5μl所得PCR产物在1%TBE琼脂糖凝胶上解析(见图6A,泳道:1)NEB 2-对数梯状物,2)100ng HBRR,3)10ngHBRR 4)1ng HBRR)。第二链合成和连接的效率是通过如经Nanodrop测定的WTA产物的质量产量(见图6C)并且用PixelTM仪器计数对照添加物(spike-in)分子(kan,dap,phe)(见图6B)来确定。
实例2:使用在5'端具有通用序列的寡聚dT引物合成第一链cDNA
将1ng人类脑参考RNA或人类通用参考RNA添加至96孔板(例如,PreciseTM测定板)的每个孔中。根据制造商的方案(例如,42℃持续30分钟,然后80℃持续5分钟,保持在4℃)合成第一链cDNA,并使用1X比的AmpureXP珠粒纯化,洗脱到水中。
根据制造商的方案(例如,缓冲液的组合,在16℃下孵育2.5小时),使用NEBNext第二链cDNA模块产生第二链cDNA。在反应结束前5分钟,加入3U T4 DNA聚合酶以确保平端化cDNA,通过加入EDTA终止反应,并使用1.8X比的AmpureXP珠粒进行纯化,洗脱到水中。通过在室温下孵育30min,使用NEBNext快速连接模块将300nM磷酸化衔接子CBO105/106(退火的/5Phos/GCGATCGCGGAAGAGCACACGTCTGA(SEQ ID NO:4)和GCTCTTCCGCGATCGC(SEQ ID NO:5))连接到平端化的cDNA。用1X体积的AmpureXP珠粒纯化连接的cDNA,并将洗脱的产物使用2X Q5 HotStart Mastermix(NEB)和500nM引物CBO23(序列:TCAGACGTGTGCTCTTCC(SEQ IDNO:6))扩增。扩增包括:98℃30秒,一个循环;98℃持续20s、65℃持续15s、72℃持续3分钟,15个循环;以及72℃持续5min,一个循环。WTA产物的尺寸分布是通过安捷伦生物分析仪(Agilent Bioanalyzer)确定。为了确定WTA产物的尺寸分布,将来自96X 1ng WTA板的30ng/μl的WTA产物稀释1:10,并在安捷伦生物分析仪高灵敏度测定中运行。图7示出了WTA尺寸分布,范围为从约200bp-3kb,峰值在约1.2kb。
通过用PixelTM计数4320个对照分子,来测量第二链合成和衔接子连接的总效率,如图8A所示。在如上所述的96x 1ng WTA之后,通过PixelTM对Dap和Phe板添加物进行定量。然后将PixelTM计数与板中的添加物分子总数4320进行比较,以确定整体反应效率。
实例3:用RNaseH和链置换聚合酶合成第二链
使用此实例中披露的方法从10ng总RNA扩增cDNA。将cDNA根据实例1的方法合成。使用RNaseH和链置换聚合酶或其中至少一种具有链置换活性的聚合酶混合物进行第二链合成。这导致产生许多重叠的第二链cDNA,其偏向原始RNA的3'并在其3'端含有通用引物序列的互补体。合成后,任选地通过RNA酶或碱处理来去除第二链的RNA引物部分。这可以有助于由DNA聚合酶进行的全长延伸。将这些第二链cDNA用通用引物引发并延伸以产生双链分子。如实例1所述连接并扩增这些双链分子。使用链置换聚合酶可以通过为每个第一链产生若干第二链cDNA来扩增信号扩增。
在具体的示例性实施例中,对于每个反应,10ng人类脑参考RNA(HBRR)中加有10,000个条形码化的对照RNA,用作第一链cDNA合成的模板,使用由来自PreciseTM测定的所有96个RT引物池组成的200nM RT引物。使用18U Klenow(Exo-)和15U RNaseH在16℃持续2小时,随后在37℃持续30min进行第二链合成,在NEB第二链缓冲液或ThermoPol缓冲液+200nMdNTP中进行。将酶热灭活,或者将反应使用1.8X AmpureXP珠粒纯化,并将洗脱的cDNA添加至1X ThermoPol缓冲液+dNTP中。添加200nM引物CBO17(序列:TCAGACGTGTGCTCTTCCGAT(SEQID NO:7))和5U Taq DNA聚合酶,并且将反应在94℃孵育3min,55℃30秒和72℃持续40min,以产生互补链并将产物加A尾。将反应使用1.8X比的AmpureXP珠粒纯化。使用NEBNext快速连接模块将300nM磷酸化衔接子CBO105/107(退火的/5Phos/GCGATCGCGGAAGAGCACACGTCTGA(SEQ ID NO:8)和GCTCTTCCGCGATCGC*T(SEQ ID NO:9))连接到加尾的cDNA。用1X体积的AmpureXP珠粒纯化连接的cDNA,并将洗脱的产物使用2X Q5 HotStart Mastermix(NEB)和500nM引物CBO23(序列:TCAGACGTGTGCTCTTCC(SEQ ID NO:10))扩增。将5μl所得PCR产物在1%TBE琼脂糖凝胶上解析(见图9A,泳道:1)NEB 2-对数梯状物,2)在NEB第二链缓冲液中进行的10ng HBRR第二链合成和Taq延伸,3)在NEB ThermoPol缓冲液中进行10ng HBRR第二链合成和Taq延伸,4)在NEB第二链缓冲液中进行10ng HBRR第二链合成,随后进行纯化和在ThermoPol缓冲液中Taq延伸)。
第二链合成的效率是通过WTA产物的质量产量(见图9B)并且用Pixel仪器计数对照添加物分子(见图8B)来确定。
实例4:均聚物加尾
此实例描述了本披露的均聚物加尾方法。将96个10μl逆转录反应在42℃进行30分钟并且在80℃进行热灭活5min,所述逆转录反应中的每一个由以下构成:1ng淋巴细胞总RNA、12.5nM RT引物(例如,包含本披露的随机条形码)池、500μM dNTP、1X Protoscript缓冲液、40U ProtoscriptII逆转录酶(NEB)、和4U鼠RNA酶抑制剂(NEB)。
将反应合并到八个管中,并使用1X比的AmpureXP珠粒进行纯化。将cDNA在20μlExoI消化混合物(1X CutSmart缓冲液、20外切核酸酶I(NEB))中洗脱,并在37℃孵育30分钟,随后在80℃灭活20分钟。
将5μl加尾混合物(1X CutSmart缓冲液、1.25mM dATP、12.5μM ddATP、10U末端转移酶(NEB)1U RNaseH(NEB))添加至每个反应中,并在37℃孵育15分钟,随后在75℃下灭活10分钟。
将25μl PCR Mastermix(1X Q5缓冲液、400μM dNTP、100nM CBO16
TCAGACGTGTGCTCTTCCGATCTgcgatcgcTTTTTTTTTTTTTTTTTTTTTTTT(SEQ ID NO:11)、1.76μM CBO20TCAGACGTGTGCTCTTCCGAT、1U Q5HotStart聚合酶(NEB))添加至每个反应中,并且按以下程序进行热循环:98℃2min、45℃30s、72℃2min、15X的(98℃10s、65℃15s、72℃1.5min)、以及72℃1.5min。将PCR反应聚池在一起,并且用0.7X比的AmpureXP珠粒清洁,并且在50μl 10mM Tris pH 8.0、0.05%Tween-20中洗脱。总反应产量为约1.5μg。
将WTA产物(例如,准对称的随机条形码化的核酸)稀释并在安捷伦生物分析仪的高灵敏度DNA测定上运行,如图10所示。
实例5:使用均聚物加尾的文库产生方案
此实例描述了来自均聚物加尾方法(例如,实例4中所述)的WTA产物的文库产生。将100ng的WTA产物在37℃在1X CutSmart缓冲液中在具有10U AsiSI(NEB)的20μl中消化30min。将反应加热至95℃持续2min,并且然后放置在冰上持续5min。
将30μl随机引发混合物(1X CutSmart缓冲液、333μM dNTP、1.66μMCBO12CCCTACACGACGCTCTTCCGATCTNNNNNN(SEQ ID NO:12)、5U Klenow(exo-)(NEB))添加至每个反应中,并且在37℃孵育30min。
将体积调节至150μl,并与120μl AmpureXP珠粒结合5min。将珠粒结合到磁体上,并且将上清液转移到新管中,并弃去珠粒。然后用60μl Ampure Xp珠粒纯化上清液,并在22μl水中洗脱。将28μl PCR混合物(1.79X Q5缓冲液,357nM dNTP,800nM CBO32AATGATACGGCGACCACCGAGATCTACACTATAGCCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T(SEQID NO:13)、800nM CBO33CAAGCAGAAGACGGCATACGAGATCGAGTAATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC*T(SEQ IDNO:14),和1U Q5 HotStart DNA聚合酶(NEB))添加至每个反应中,并且按以下程序进行热循环:98℃30s、15X的(98℃10s、65℃15s、72℃20s)以及72℃2min。
将PCR反应用1X比的AmpureXP珠粒清洁,并且在30μl 10mM Tris pH 8.0、0.05%Tween-20中洗脱。最终产物浓度为约20ng/μl。
将测序文库稀释并在安捷伦生物分析仪的高灵敏度DNA测定上运行,如图11所示。
实例6:去除限制性酶位点
此实例比较了用以从本披露的准对称的随机条形码化的核酸产物中去除限制性酶结合位点从而破坏分子的对称性的各种方法。
使用如本文描述的不同方案创建文库,从而在文库构建之前、期间或之后从文库去除标签序列。图12示出了来自用不同的限制性酶结合位点去除方案制备的WTA样品的测序运行的多路解编结果的比较。图12的组1是通过本披露的均聚物加尾和限制性消化方案制备的样品。三联图的第一个条形物指示映射到有效随机条形码(例如,在测定中使用的随机条形码)的读段百分比。三联图的第二个条形物指示针对标签引物/连接的衔接子独特的序列(例如,直接在WTA引物退火位点之后的限制性切割位点)。这指示在5'端上的读段。
三联图的第三个条形物指示来源不明的读段百分比。图12的组2是通过均聚物尾加制备并用10U AsiSI消化的WTA样品。图12的组3是用在WTA扩增后在随机引发步骤期间包括的10U AsiSI限制性酶进行均聚物加尾而制备的WTA样品。图12的组4是用在WTA扩增后在随机引发步骤期间包括的10U AsiSI限制性酶进行均聚物加尾并且进行热灭活而制备的WTA样品。图12的组5是用本披露的替代标签引物(CBO10TCAGACGTGTGCTCTTCCGATgcgatcgcTTTTTTTTTTTTTTTTTTTTTTTT(SEQ ID NO:15))制备的WTA样品。引物与WTA扩增引物的最3'核苷酸具有2nt错配。文库构建省略了AsiSI消化。
来自图14中制备的文库的测序读段的碱基分布示于图13中。碱基分布均匀,指示没有来自WTA引物(例如,第二通用引物)的任何污染性AsiSI序列。来自图14的文库是从使用CBO10和同时进行类似组3的AsiSI处理的组合制备的。
实例7:衔接子添加方法和同时限制性酶处理的组合
此实例基于序列的前8bp示出了读段百分比,映射到有效随机条形码、包含限制性酶结合位点(即,紧接在读段2序列的下游)的WTA引物(例如,第二通用引物)或未知序列。
WTA产物是通过均聚物加尾方法或第二链/连接方案产生。均聚物方案使用与文库扩增引物的3'端具有2nt错配的标签引物,而本文所述的基于连接的方法具有5nt的错配。
通过用Klenow(Exo-)进行随机引发但在引物延伸期间包含10U AsiSI来产生文库。在亿明达MiSeq上使用配对末端化学对文库进行测序。
如图14所示,将酶消化和3'错配组合到文库扩增引物表现最好,错配越多越好。
实例8:珠粒上的衔接子连接方法
此实例展示了用于将本披露的衔接子与珠粒上的条形码化cDNA的第二链连接的方法和数据。所述方法包括:
珠粒制备:将40μl 2.5M珠粒/ml Resolve珠粒置于1.5ml管中。将珠粒结合到磁体上并去除上清液。将珠粒用200μl无RNA酶的水洗涤2次。将珠粒重悬浮于21.5μl退火混合物中,并在65℃在加热块中伴随偶尔涡旋下孵育3min。将珠粒放置于冰上。
第一链合成:将18.5μl RT Mastermix添加至珠粒中。将反应混合物在热混合器中在42℃孵育10min,并在加热块上在80℃孵育5min。将珠粒结合到磁体上以去除上清液。
第二链合成:将80μl第二链合成混合物添加至珠粒中。将反应混合物在16℃于热混合器中孵育2.5hr,并且添加1μl 3U/μl T4 DNA聚合酶,并在16℃孵育5分钟(平端化cDNA)。将反应混合物转移至冰中,添加5μl 0.5M EDTA并混合,以终止所有酶活性,随后添加1X 100μl 10mM Tris pH 8.0。
衔接子连接:将50μl连接混合物添加到每个管中,并在室温下在旋转器上孵育30min。将珠粒结合到磁体上并用2X 200μl Tris-Tween洗涤,并重悬浮于50μl Tris-Tween中并在4℃下储存。
WTA扩增:在WTA Mastermix中用1μl重悬浮珠粒建立WTA PCR反应,并进行PCR。
PCR循环条件
上述方法的结果示于图22中。左侧描绘的凝胶显示WTA扩增产物。Q5洗涤和KAPA洗涤泳道示出WTA扩增产物,因为涂点代表扩增的转录组。通过洗涤去除第二链酶比热灭活更有效。在聚合酶之间未观察到明显差异。
使用如本文所述的PixelTM方法来定量左侧显示的样品的效率。
实例9:抑制性衔接子的表征
此实例示出了不同衔接子的抑制能力的表征。所述方法遵循衔接子连接WTA方案(实例8),使用高或低抑制衔接子,然后用不同浓度的WTA引物扩增。所述方法包括:
珠粒制备:将40μl 2.5M珠粒/ml Resolve珠粒置于1.5ml管中。将珠粒结合到磁体上并去除上清液。将珠粒用200μl无RNA酶的水洗涤2次。将珠粒重悬浮于21.5μl退火混合物中,并在65℃在加热块中伴随偶尔涡旋下孵育3min。将珠粒放置于冰上。
第一链合成:将18.5μl RT Mastermix添加至珠粒中。将反应混合物在热混合器中在42℃孵育10min,并在加热块上在80℃孵育5min。将珠粒结合到磁体上以去除上清液。
第二链合成:将80μl第二链合成混合物添加至珠粒中。将反应混合物在16℃于热混合器中孵育2.5hr,并且添加1μl 3U/μl T4 DNA聚合酶,并在16℃孵育5分钟(平端化cDNA)。将反应混合物转移至冰中,添加5μl 0.5M EDTA并混合,以终止所有酶活性,随后添加1X 100μl 10mM Tris pH 8.0。将经清洁的第二链反应分到两个管中。
衔接子连接:将50μl连接混合物添加到每个管中,并在室温下在旋转器上孵育30min。将珠粒结合到磁体上并用2X 200μl Tris-Tween洗涤,并重悬浮于50μl Tris-Tween中并在4℃下储存。
WTA扩增:在WTA Mastermix中用1μl重悬浮珠粒建立WTA PCR反应,并进行PCR。
PCR循环条件
所述方法的结果如图23所示。H指高抑制衔接子。L指低抑制衔接子。引物浓度变化显示在每个泳道下面。图23示出虽然所有样品具有相似水平的转录组扩增,但在较低引物浓度下高抑制衔接子具有最少的引物-矫作物(primer-artifact)(由凝胶底部缺乏引物-二聚体条带证明)。
实例10:针对WTA扩增测试珠粒容量
此实例描述了针对WTA扩增测试珠粒容量而进行的实验。所述方法包括:
珠粒制备:将80μl 2M珠粒/ml未偶联的珠粒放入1.5ml管中并结合到磁体上以去除上清液。将珠粒用200μl无RNA酶的水洗涤2次,并重悬浮于在水中的两个10μl等分试样中。
WTA扩增:用1μl重悬浮珠粒建立WTA PCR反应。
循环条件
珠粒制备:珠粒在约100μl Tris-Tween中,进行两次10μl珠粒扩增,其中一个使用BSA而一个不使用BSA。
WTA扩增:用1μl重悬浮珠粒建立WTA PCR反应。
循环条件
所述方法的结果如图24所示。如左侧所示,将不同量的具有从大宗RNA转录的cDNA(cDNA)的珠粒与未偶联的珠粒(空)(例如,不具有缀合的寡核苷酸的珠粒)混合以从典型的实验模拟加载和未加载的珠粒。使用Q5聚合酶2X mastermix或KAPA Hifi聚合酶将不同量的珠粒添加到标准的50μl PCR反应中。在两种情况下,每个PCR的最大珠粒数为约10,000。
如图24中右侧所示,从已经与细胞接触的样品制备WTA方案(与没有细胞的图24的左图相反)。然后在两个PCR反应中的每一个中添加来自实验的约10,000个珠粒,使用或不使用BSA。BSA用于对抗珠粒抑制。引物二聚体上方的涂点指示一些RNA种类的扩增。
使用上述样品来制备文库。使用生物分析仪分析WTA产物和文库。用于产生文库的方案包括:将退火混合物添加至50ng WTA产物中,加热至95℃持续2min并冷却至4℃持续5min。将7μl Klenow(exo-)mastermix添加至每个管中。将反应混合物在37℃孵育30min,并在80℃孵育20min,并用35μl AmpureXP清洁,随后在22μl水中洗脱。
文库制备:添加28μl Q5Mastermix,并使用下述循环条件进行PCR。清洁是用与文库大小选择所使用的相同比率的珠粒进行,并且在30μl Tris-Tween中洗脱。
循环条件
如图25所示,左侧迹线示出从图24右侧产生的WTA产物。图25中的右侧迹线来自WTA产物的文库。每个的产物的尺寸均是正确的,正如迹线所证明的。这指示将正确的序列添加到WTA连接和文库制备方法中,并且有效的文库可以从固体支持物制备。
实例12:外切核酸酶处理的分析
进行此实例以使用本披露的衔接子连接方法测试在珠粒上进行外切核酸酶处理的作用。所述方法包括:
珠粒制备:将16μl 2.5M珠粒/ml Resolve珠粒置于1.5ml管中。将144μl珠粒置于单独的管中。将珠粒结合到磁体上并去除上清液。将珠粒重悬浮于100μl Trsi-Tween中并加热至95℃持续2min。将珠粒用200μl无RNA酶的水洗涤2次(留出144μl珠粒供以后用)。将珠粒重悬浮于21.5μl退火混合物中,并在65℃在加热块中伴随偶尔涡旋下孵育3min。将珠粒放置于冰上。
第一链合成:将18.5μl RT Mastermix添加至珠粒中。将反应混合物在热混合器中在42℃孵育30min,并在加热块上在80℃孵育5min。将珠粒结合到磁体上以去除上清液。将来自第一链反应的珠粒与无RT珠粒混合,并用200μTris-Tween洗涤2次。在重悬浮以用于第二次洗涤后,将珠粒分到四个50μl管中。仅对于3号和4号管(其他管直接进入第二链反应),将珠粒结合到磁体上并去除上清液。将珠粒重悬浮于40μl ExoI mastermix中。将反应混合物在37℃孵育30min,并在80℃孵育20min。将珠粒在200μl Tris-Tween中洗涤1次。
第二链合成:将80μl第二链合成混合物添加至珠粒中。添加没有酶的20μl第二链缓冲液混合物。将反应混合物在16℃于热混合器中孵育2.5hr,并且添加1μl 3U/μl T4 DNA聚合酶,并在16℃孵育5min(平端化cDNA)到1号(或3号)管。将反应混合物转移到冰中,并且添加5μl 0.5M EDTA并混合以终止所有酶活性,随后在100μl洗涤缓冲液(10mM Tris pH8.0、150mM NaCl、5mM EDTA、0.05%tween-20)中洗涤2次并在100μl Tris-Tween中洗涤两次,以去除第二链酶。
衔接子连接:将50μl连接混合物添加到每个管中,并在室温下在旋转器上孵育30min。将珠粒结合到磁体上并用2X 200μl Tris-Tween洗涤,并重悬浮于50μl Tris-Tween中并在4℃下储存。
WTA扩增:在WTA Mastermix中用5μl重悬浮珠粒建立WTAPCR反应,并进行PCR。
循环条件
实验结果如图28所示。左侧显示无处理迹线。用外切核酸酶处理的cDNA样品显示于右侧。处理是在进行第二链合成和衔接子连接之前发生。WTA PCR显示,当进行ExoI处理时,产量高得多。
实例13:使用1ng和10pg RNA进行WTA分析
此实例描述了本披露的使用未缀合至珠粒的引物的方法。用于分析1ng RNA的方案描述于图29中。用于分析10pg RNA的方案描述于图30中。
使用1ng/孔或10pg/孔两者产生合适的WTA产物,如图18中所示的生物分析仪迹线的正确尺寸分布所证明的。
此外,1ng/孔和10pg/孔实验两者均使得每个实验的读段数目相对应。图19示出了测定中每个基因的读段数目。两个样品的读段数目是相似的。这示出了测定的稳健性。
以图形显示来自读段(例如,图19)的测序输出,如图20所示。左侧为将UHRR(通用人类参考RNA)孔清晰地与人类脑参考RNA(HBRR)孔分开的PCA图。右侧为用于PCA连同分层聚类的基因的热图,其示出了聚类在一起的所有相似RNA类型。图20示出可以使用本披露的方法来鉴定不同的细胞类型。
实例14:基于连接的和基于转座体的WTA的比较
使用Nextera XT或Nextera试剂盒(亿明达)从珠粒直接产生测序文库。使用Tn5转座酶将捕获的mRNA(仍以原始形式处于RNA/DNA复合物中,或转化为cDNA)随机片段化,并附接衔接子。使用可以与这些衔接子序列杂交的引物来附接P5和P7索引以用于多重亿明达测序运行。不需要进一步的文库制备。虽然使用商业性的Nextera测序文库试剂盒进行了原理证明实验,但仅使用试剂盒的转座体组分。可以商购转座酶,并且可以定制转座体,以允许附接所选择的任何寡聚物序列(在这种情况下为通用序列)。如果定制,转座体可以用含有独特分子索引的寡聚物构建,使得当转座酶切DNA时,除通用序列外还附接独特的分子索引。这将为分子中的每一个添加第二分子索引(在使用Resolve珠粒上的引物转录cDNA时已经添加一个分子索引)。
图33示出了使用基于连接的或基于转座体的方案与珠粒的3种细胞类型的WTA分析的PCA图。结果显示,在进行或不进行第二链合成的情况下,基于转座体的WTA分析能够基于WTA区分3种细胞类型。基于连接的WTA分析也能够区分这3种细胞类型。
出于所有目的,本说明书中提到的所有出版物、专利和专利申请都通过引用并入本文,如同每一单独的出版物、专利或专利申请具体且单独地指明通过引用并入。
在至少一些先前描述的实施例中,在一个实施例中使用的一个或多个元件可以互换地用于另一个实施例中,除非这种替换在技术上不可行。本领域技术人员将理解,在不脱离所要求保护的主题的范围的情况下,可以对上述方法和结构进行各种其他的省略、添加和修改。所有这些修改和改变都旨在落在由所附权利要求书限定的主题的范围内。
关于本文中使用基本上任何复数和/或单数术语,在对于背景和/或应用适当的情况下,本领域技术人员可以从复数转换为单数和/或从单数转换为复数。为了清楚起见,可以在本文明确阐述各种单数/复数排列。如本说明书和所附权利要求书中使用的,除非上下文另有明确指示,否则单数形式“一个/一种(a/an)”和“所述(the)”包括复数的提及物。除非另有说明,否则本文中“或”的任何提及旨在包含“和/或”。
本领域技术人员将理解,一般来说,本文使用的术语,尤其是所附权利要求书(例如,所附权利要求书的主体)中的术语,通常旨在作为“开放性的”术语(例如,术语“包括(including)”应解释为“包括但不限于(including but not limited to)”,术语“具有(having)”应解释为“具有至少(having at least)”,术语“包括(includes)”应解释为“包括但不限于(includes but is not limited to)”等)。本领域技术人员将进一步理解,如果预期到所介绍的权利要求陈述的特定数目,这样的预期将明确地陈述于权利要求中,并且在不存在这种陈述的情况下没有这种意图存在。例如,作为对理解的帮助,以下所附权利要求书可以包含介绍性短语“至少一个”和“一个或多个”的使用,以介绍权利要求陈述。然而,此类短语的使用不应解读为意味着由不定冠词“一个”或“一种”介绍权利要求陈述会将任何包含这种介绍的权利要求陈述的具体权利要求限制到包含仅一个这种陈述的实施例中,甚至当相同的权利要求包括介绍性短语“一个或多个”或“至少一个”以及不定冠词如“一个”或“一种”时也是如此(例如,“一个”和/或“一种”应解释为意指“至少一个”或“一个或多个”);这对于使用定冠词来介绍权利要求陈述同样适用。此外,即使明确地陈述了介绍的权利要求陈述的特定数目,本领域技术人员将认识到,这种陈述应解释为意指至少所陈述的数字(例如,仅陈述“两个陈述”而没有其他修饰词意指至少两个陈述、或两个或更多个陈述)。此外,在使用类似于“A、B和C等中的至少一个”的惯例的那些情况下,通常这种句法结构是在本领域技术人员将理解所述惯例的意义上预期(例如,“具有A、B和C中的至少一个的系统”将包括但不限于仅具有A,仅具有B,仅具有C,A和B一起,A和C一起,B和C一起,和/或A、B、和C一起等的系统)。在使用类似于“A、B或C等中的至少一个”的惯例的那些情况下,通常这种句法结构是在本领域技术人员将理解所述惯例的意义上预期(例如,“具有A、B或C中的至少一个的系统”将包括但不限于仅具有A,仅具有B,仅具有C,A和B一起,A和C一起,B和C一起,和/或A、B、和C一起等的系统)。本领域技术人员将进一步理解,实际上,无论在说明书、权利要求书还是在附图中,呈现两个或更多个替代术语的任何分离性词语和/或短语应被理解为考虑到包括术语之一、任一术语或两个术语的可能性。例如,短语“A或B”将被理解为包括“A”或“B”或“A和B”的可能性。
此外,当本披露的特征或方面以马库什组(Markush group)描述时,本领域技术人员将意识到本披露还由此以马库什组的任何单独的成员或成员子组描述。
如本领域技术人员将理解的,出于任何和所有目的,如在提供书面描述方面,本文披露的所有范围还包括任何和所有可能的它的子范围和子范围组合。任何列出的范围都可以容易地被识别为充分地描述并使同一范围能被分解成至少相等的两等份、三等份、四等份、五等份、十等份等。作为非限制性实例,本文讨论的每个范围都可以容易地分解成下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,所有语言,如“多至”、“至少”、“大于”、“小于”等包括所陈述的数字,并且指代可以随后分解为如上讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包括每个单独的成员。因此,例如,具有1-3个物品的组是指具有1、2或3个物品的组。类似地,具有1-5个物品的组指代具有1、2、3、4或5个物品的组,等等。
尽管本文已经披露了各种方面和实施例,但其他方面和实施例对本领域技术人员将是明显的。本文披露的各种方面和实施例用于说明的目的而并不意于限制由以下权利要求所指出的真实范围和精神。
序列表
<110> 赛卢拉研究公司(Cellular Research, Inc.)
格伦·弗
克雷格·贝茨
克里斯蒂娜·范
格雷琴·因博恩·拉姆
<120> 用于全转录组扩增的方法和组合物
<130> BDCRI.014WO/P-12191.70
<150> 62/196,782
<151> 2015-07-24
<150> 62/151,583
<151> 2015-04-23
<160> 38
<170> 针对Windows 4.0版本的FastSEQ
<210> 1
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> CBO102
<400> 1
gcgatcgcga tcggaagagc acacgtctga 30
<210> 2
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> CBO103
<400> 2
cttccgatcg cgatcgc 17
<210> 3
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> CBO23
<400> 3
tcagacgtgt gctcttcc 18
<210> 4
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> CBO105
<400> 4
gcgatcgcgg aagagcacac gtctga 26
<210> 5
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> CBO106
<400> 5
gctcttccgc gatcgc 16
<210> 6
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> CBO23
<400> 6
tcagacgtgt gctcttcc 18
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> CBO17
<400> 7
tcagacgtgt gctcttccga t 21
<210> 8
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> CBO105
<400> 8
gcgatcgcgg aagagcacac gtctga 26
<210> 9
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> CBO107
<400> 9
gctcttccgc gatcgct 17
<210> 10
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> CBO23
<400> 10
tcagacgtgt gctcttcc 18
<210> 11
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> CBO16
<400> 11
tcagacgtgt gctcttccga tctgcgatcg cttttttttt tttttttttt ttttt 55
<210> 12
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> CBO12
<220>
<221> 尚未归类的特征
<222> (25)...(30)
<223> n = 随机核苷酸
<400> 12
ccctacacga cgctcttccg atctnnnnnn 30
<210> 13
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> CBO32
<400> 13
aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60
cttccgatct 70
<210> 14
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> CBO33
<400> 14
caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60
cgatct 66
<210> 15
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> CBO10
<400> 15
tcagacgtgt gctcttccga tgcgatcgct tttttttttt tttttttttt ttt 53
<210> 16
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 亿明达读段1
<400> 16
ccctacacga cgctcttccg atct 24
<210> 17
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> CBO122
<400> 17
cttccgatcg cgatcgc 17
<210> 18
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> CBO103
<400> 18
gcgatcgcga tcggaagagc gtcgtgtag 29
<210> 19
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> CBO123
<400> 19
gctcttccgc gatcgc 16
<210> 20
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> CBO106
<400> 20
gcgatcgcgg aagagcgtcg tgtag 25
<210> 21
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 聚A
<400> 21
aaaaaaaaaa aaaa 14
<210> 22
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 寡聚dT
<400> 22
tttttttttt tttt 14
<210> 23
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 聚A
<400> 23
aaaaaaaaaa aaaa 14
<210> 24
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 寡聚dT
<400> 24
tttttttttt tttt 14
<210> 25
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 聚A
<400> 25
aaaaaaaaaa aaa 13
<210> 26
<211> 14
<212> DNA
<213> 人工序列
<220>
<223> 寡聚dT
<400> 26
tttttttttt tttt 14
<210> 27
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 通用序列1
<400> 27
cttccgctag cgatcgct 18
<210> 28
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 通用序列2
<400> 28
agcgatcgcg atcggaagag cgtcgtgtag 30
<210> 29
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> CBO40
<400> 29
ctacacgacg ctcttccg 18
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> ILR2
<400> 30
acacgacgct cttccgatct 20
<210> 31
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 转座体序列P7
<400> 31
ctgtctctta tacacatctc cgagcccacg agac 34
<210> 32
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 通用序列3
<400> 32
ctacacgacg ctcttccgat ct 22
<210> 33
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 转座酶引物
<400> 33
agatgtgtat aagagacag 19
<210> 34
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 转座体序列P5
<400> 34
ctgtctctta tacacatctg acgctgccga cga 33
<210> 35
<211> 62
<212> DNA
<213> 人工序列
<220>
<223> P5
<400> 35
aatgatacgg cgaccaccga gatctacaca cactctttcc ctacacgacg ctcttccgat 60
ct 62
<210> 36
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 转座体序列
<400> 36
ctgtctctta tacacatct 19
<210> 37
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> P7
<400> 37
caagcagaag acggcatacg agatgtctcg tgggctcgga gatgtgtata agagacag 58
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 通用序列4
<400> 38
acacgacgct cttccgatct 20

Claims (133)

1.一种用于对来自样品的多个靶标进行标记的方法,所述方法包括:
将来自所述样品的所述多个靶标与多个核酸杂交,所述多个核酸中的每一个包含第一通用标记;
延伸所述多个核酸以产生多个第一链多核苷酸;
使用所述多个第一链多核苷酸作为模板合成多个第二链多核苷酸,以产生多个双链多核苷酸;
将衔接子连接到所述多个双链多核苷酸,其中所述衔接子包含第二通用标记;并且
使用所述第一通用标记和所述第二通用标记扩增所述多个双链多核苷酸,从而产生包含所述多个靶标的多个扩增子。
2.如权利要求1所述的方法,其中所述多个核酸中的每一个包含随机条形码。
3.如权利要求2所述的方法,其中所述随机条形码包括分子标记、细胞标记、靶标特异性区域或其任何组合。
4.如权利要求3所述的方法,其中所述靶标特异性区域包含寡聚dT序列、随机序列、靶标特异性序列或其任何组合。
5.如权利要求1-4中任一项所述的方法,其中所述多个靶标是DNA。
6.如权利要求1-5中任一项所述的方法,其中所述多个靶标是mRNA。
7.如权利要求6所述的方法,其中合成所述多个第二链多核苷酸包括用RNA酶切割所述多个mRNA,从而产生一个或多个mRNA引物。
8.如权利要求7所述的方法,其中所述RNA酶是RNaseH。
9.如权利要求7所述的方法,其中所述一个或多个mRNA引物中的至少一个的长度为至少15个核苷酸。
10.如权利要求7所述的方法,还包括用聚合酶延伸所述一个或多个mRNA引物,从而产生延伸的区段。
11.如权利要求10所述的方法,其中所述聚合酶具有5'-3'外切核酸酶活性。
12.如权利要求10所述的方法,其中所述聚合酶包括DNA Pol I。
13.如权利要求10所述的方法,还包括用连接酶连接所述延伸的区段,从而产生第二链多核苷酸。
14.如权利要求7所述的方法,还包括用链置换聚合酶延伸所述一个或多个mRNA引物,从而产生延伸的第二链。
15.如权利要求14所述的方法,还包括从所述延伸的第二链去除所述一个或多个mRNA引物。
16.如权利要求1-15中任一项所述的方法,其中所述多个靶标是来自单个细胞的核酸。
17.如权利要求1-16中任一项所述的方法,其中所述多个扩增子包含全转录组扩增(WTA)产物。
18.如权利要求1-17中任一项所述的方法,其中所述衔接子是双链多核苷酸。
19.如权利要求1-18中任一项所述的方法,其中所述衔接子包含AsiSI位点。
20.如权利要求1-19中任一项所述的方法,其中所述衔接子是部分双链的多核苷酸。
21.如权利要求1-20中任一项所述的方法,还包括使所述多个双链多核苷酸中的至少一个平端化。
22.如权利要求1-21中任一项所述的方法,还包括向所述多个双链多核苷酸添加A突出端。
23.如权利要求1-22中任一项所述的方法,还包括从所述多个第二链多核苷酸合成多个第三链多核苷酸。
24.如权利要求1-23中任一项所述的方法,其中所述多个核酸中的每一个被固定在固体支持物上。
25.如权利要求24所述的方法,其中所述固体支持物是珠粒。
26.如权利要求24或25所述的方法,其中固定在单个固体支持物上的所述多个核酸中的至少两个包含不同的分子标记。
27.如权利要求24-26中任一项所述的方法,其中附接到固体支持物上的所述多个核酸包含相同的细胞标记。
28.如权利要求1-27中任一项所述的方法,其中所述样品包括单个细胞。
29.如权利要求1-27中任一项所述的方法,其中所述样品包括多个细胞。
30.如权利要求1-29中任一项所述的方法,其中所述第一通用标记和所述第二通用标记是相同的。
31.如权利要求1-29中任一项所述的方法,其中所述第一通用标记和所述第二通用标记是不同的。
32.如权利要求1-31中任一项所述的方法,其中所述多个扩增子中的每一个包含所述第一通用标记、所述第二通用标记或两者的至少一部分。
33.一种用于对来自样品的多个靶标进行标记的方法,所述方法包括:
将来自所述样品的所述多个靶标与多个核酸杂交,所述多个核酸中的每一个包含第一通用标记;
延伸所述多个核酸以产生多个第一链多核苷酸,其中所述多个第一链多核苷酸和所述多个靶标形成多个双链多核苷酸;
使用第一转座体将所述多个双链多核苷酸片段化,以产生与第一衔接子连接的多个双链多核苷酸,其中所述第一衔接子包含第二通用标记,并且其中所述第一转座体包含第一转座酶和所述第一衔接子;并且
使用所述第一通用标记和所述第二通用标记扩增与所述第一衔接子连接的所述多个双链多核苷酸,从而产生包含所述多个靶标的多个扩增子。
34.如权利要求33所述的方法,还包括使用第二转座体将所述多个双链多核苷酸片段化,以产生与所述第一衔接子和第二衔接子连接的多个双链多核苷酸,其中所述第二衔接子包含第三通用标记,并且其中所述第二转座体包含第二转座酶和所述第二衔接子。
35.如权利要求33或34所述的方法,其中所述第一转座酶和所述第二转座酶是相同的。
36.如权利要求33或34所述的方法,其中所述第一转座酶和所述第二转座酶是不同的。
37.如权利要求33-36中任一项所述的方法,其中所述第一衔接子和所述第二衔接子是相同的。
38.如权利要求33-36中任一项所述的方法,其中所述第一衔接子和所述第二衔接子是不同的。
39.如权利要求33-38中任一项所述的方法,还包括使用所述多个第一链多核苷酸合成多个第二链多核苷酸。
40.如权利要求33-39中任一项所述的方法,其中所述第一衔接子包含随机条形码。
41.如权利要求33-40中任一项所述的方法,其中所述第二通用标记是转座体序列。
42.如权利要求33-41中任一项所述的方法,其中所述第一衔接子包含测序引物结合位点。
43.如权利要求42所述的方法,其中所述测序引物是P7或P5。
44.如权利要求33-43中任一项所述的方法,其中所述第二衔接子包含随机条形码。
45.如权利要求34-44中任一项所述的方法,其中所述第三通用标记是转座体序列。
46.如权利要求34-45中任一项所述的方法,其中所述第二衔接子包含测序引物结合位点。
47.如权利要求46所述的方法,其中所述测序引物是P7或P5。
48.如权利要求34-47中任一项所述的方法,其中所述多个核酸中的每一个被固定在固体支持物上。
49.如权利要求48所述的方法,其中所述固体支持物是珠粒。
50.如权利要求49所述的方法,包括纯化固定在珠粒上的双链多核苷酸,其中所述双链多核苷酸是与所述第一衔接子、所述第二衔接子或两者连接的双链多核苷酸。
51.一种试剂盒,包含:
多个固体支持物,其中所述固体支持物中的每一个包含多个核酸,所述多个核酸中的每一个包含第一通用标记序列;
包含第二通用标记序列的核酸衔接子;和
酶,其中所述酶是连接酶或转座酶。
52.如权利要求51所述的试剂盒,其中所述酶是连接酶。
53.如权利要求51所述的试剂盒,其中所述酶是转座酶。
54.如权利要求51-53中任一项所述的试剂盒,其中所述多个核酸包含不同的分子标记。
55.如权利要求51-54中任一项所述的试剂盒,其中所述多个核酸包含相同的细胞标记。
56.如权利要求51-55中任一项所述的试剂盒,其中所述多个固体支持物是多个珠粒。
57.如权利要求51-56中任一项所述的试剂盒,包含一种或多种选自下组的其他酶,该组由以下各项组成:逆转录酶、DNA聚合酶、RNA酶、外切核酸酶或其任何组合。
58.如权利要求51-57中任一项所述的试剂盒,还包含基底。
59.如权利要求58所述的试剂盒,其中所述基底包含微孔。
60.一种用于对来自单个细胞的多个靶序列进行标记的方法,所述方法包括:
将所述单个细胞提供到包含固定有多个核酸的固体支持物的分隔物上,所述多个核酸中的每一个包含第一通用标记;
将所述单个细胞裂解以释放所述多个靶序列;
将来自所述单个细胞的所述多个靶序列与所述多个核酸杂交;
延伸所述多个核酸以产生多个第一链多核苷酸;
向所述多个第一链多核苷酸添加衔接子序列,其中所述衔接子序列包含第二通用标记;并且
使用所述第一通用标记和所述第二通用标记扩增所述多个第一链多核苷酸,从而产生包含所述多个靶序列的多个扩增子。
61.如权利要求60所述的方法,其中所述衔接子序列由转座体添加。
62.如权利要求61所述的方法,其中所述转座体包含转座酶和所述衔接子序列。
63.如权利要求60-62中任一项所述的方法,其中所述衔接子是通过连接步骤添加。
64.如权利要求60-63中任一项所述的方法,其中所述多个靶序列是mRNA。
65.如权利要求64所述的方法,还包括使用所述多个第一链多核苷酸作为模板合成多个第二链多核苷酸。
66.如权利要求65所述的方法,其中合成所述多个第二链多核苷酸包括用RNA酶切割所述多个mRNA,从而产生一个或多个mRNA引物。
67.如权利要求66所述的方法,其中所述RNA酶是RNaseH。
68.如权利要求66或67所述的方法,其中所述一个或多个mRNA引物中的至少一个的长度为至少15个核苷酸。
69.如权利要求66-69中任一项所述的方法,还包括用聚合酶延伸所述一个或多个mRNA引物,从而产生延伸的区段。
70.如权利要求69所述的方法,其中所述聚合酶具有5'-3'外切核酸酶活性。
71.如权利要求69所述的方法,其中所述聚合酶包括DNA Pol I。
72.如权利要求69-71中任一项所述的方法,还包括用连接酶连接所述延伸的区段,从而产生第二链多核苷酸。
73.如权利要求66-69中任一项所述的方法,还包括用链置换聚合酶延伸所述一个或多个mRNA引物,从而产生延伸的第二链。
74.如权利要求73所述的方法,还包括从所述延伸的第二链去除所述一个或多个mRNA引物。
75.如64-74所述的方法,其中所述多个扩增子包含全转录组扩增(WTA)产物。
76.如权利要求75所述的方法,其中所述WTA产物包含所述单个细胞中至少10%的mRNA。
77.如权利要求75所述的方法,其中所述WTA产物包含所述单个细胞中至少50%的mRNA。
78.如权利要求75所述的方法,其中所述WTA产物包含所述单个细胞中至少90%的mRNA。
79.如权利要求60-78中任一项所述的方法,其中所述多个扩增子中的每一个包含随机条形码。
80.如权利要求79所述的方法,其中所述随机条形码包括分子标记、细胞标记、靶标特异性区域或其任何组合。
81.如权利要求80所述的方法,还包括对所述多个扩增子进行测序以产生包含分子标记、细胞标记、靶标特异性区域或其任何组合的多个测序读段。
82.如权利要求81所述的方法,还包括使用所述细胞标记分析所述多个测序读段。
83.如权利要求81或82所述的方法,还包括使用所述分子标记分析所述多个测序读段。
84.如权利要求60-83中任一项所述的方法,其中所述分隔物是微孔。
85.一种用于从多个单细胞产生全转录组扩增(WTA)产物的系统,所述系统包含:
基底,所述基底包含多个分隔物,所述多个分隔物中的每一个包含单个细胞和固定有多个核酸的固体支持物,其中所述多个核酸中的每一个包含:
第一通用标记;
细胞标记;和
分子标记;
包含第二通用标记序列的核酸衔接子;和
酶,其中所述酶是连接酶或转座酶。
86.如权利要求85所述的系统,其中所述基底是微孔阵列。
87.如权利要求85或86所述的系统,其中所述多个细胞包括一种或多种不同的细胞类型。
88.如权利要求87所述的系统,其中所述一种或多种细胞类型选自下组,该组由以下各项组成:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移细胞、良性细胞、原代细胞、和循环细胞,或其任何组合。
89.一种组合物,包含:准对称的随机条形码化的核酸,其包含:
随机条形码序列,其包含第一通用标记;
第二链合成引物序列,其包含第二通用标记,
其中所述第二通用标记与所述第一通用标记是至多99%一致的。
90.如权利要求89所述的组合物,其中所述准对称的随机条形码化的核酸能够进行抑制PCR。
91.如权利要求89或90所述的组合物,其中所述链合成引物序列还包含限制性位点。
92.如权利要求89-91中任一项所述的组合物,其中所述第二通用标记包含与所述第一通用标记相比而言的错配。
93.如权利要求89-92中任一项所述的组合物,其中所述第二通用标记与所述第一通用标记的至少80%杂交。
94.如权利要求89-93中任一项所述的组合物,其中在所述第一通用标记的长度的至少90%上所述第二通用标记与所述第一通用标记是至多99%一致的。
95.如权利要求89-94中任一项所述的组合物,其中所述第二通用标记与所述第一通用标记是不一致的。
96.如权利要求89-95中任一项所述的组合物,其中所述随机条形码包括靶结合区、分子标记、细胞标记、和通用标记,或其任何组合。
97.如权利要求96所述的组合物,其中所述靶结合区包含选自下组的序列,该组由以下各项组成:寡聚dT、随机多聚体和基因特异性序列。
98.一种用于破坏有条形码的核酸的对称性的方法,所述方法包括:
产生准对称的随机条形码化的核酸,其包含随机条形码序列、第一通用标记和第二通用标记,其中所述第二通用标记与所述第一通用标记是至多99%一致的;并且
鉴定来自所述准对称的随机条形码化的核酸的3'和5'测序读段,从而破坏所述准对称的随机条形码化的核酸的对称性。
99.如权利要求98所述的方法,其中所述产生包括使靶RNA与随机条形码接触。
100.如权利要求99所述的方法,其中所述随机条形码包括细胞标记、分子标记、所述第一通用标记、和靶结合区,或其任何组合。
101.如权利要求99或100所述的方法,还包括逆转录所述随机条形码,从而产生包含所述靶RNA的互补序列的随机标记的cDNA。
102.如权利要求101所述的方法,还包括向所述随机标记的cDNA附加3'均聚物尾。
103.如权利要求102所述的方法,其中所述3'均聚物尾的长度为从2-10个核苷酸。
104.如权利要求102或103所述的方法,其中所述3'均聚物尾是聚A尾。
105.如权利要求102-104中任一项所述的方法,还包括用包含与所述均聚物尾互补的序列和所述第二通用标记的第二链合成引物进行第二链合成,从而产生所述准对称的随机条形码化的核酸。
106.如权利要求101-105中任一项所述的方法,还包括用包含所述第二通用标记和随机多聚体序列的简并引物进行第二链合成,从而产生所述准对称的随机条形码化的核酸。
107.如权利要求106所述的方法,其中所述准对称的随机条形码化的核酸是单链的。
108.如权利要求106所述的方法,还包括用全转录组扩增引物扩增所述准对称的随机条形码化的核酸。
109.如权利要求108所述的方法,其中所述全转录组扩增引物与所述第二通用标记的一部分杂交。
110.一种试剂盒,包含:
一组随机条形码,其中所述随机条形码组中的每个随机条形码包含靶标特异性区域;分子标记;细胞标记;和第一通用标记;
第二链合成引物,其包含第二通用标记,其中所述第二通用标记与所述第一通用标记是至多99%一致的;和
酶。
111.如权利要求110所述的试剂盒,其中所述随机条形码组中的单独随机条形码包含不同的分子标记。
112.如权利要求110或111所述的试剂盒,其中所述随机条形码组中的单独随机条形码包含相同的细胞标记。
113.如权利要求110-112中任一项所述的试剂盒,其中所述靶标特异性区域包含选自下组的序列,该组由以下各项组成:寡聚dT、随机多聚体和基因特异性序列。
114.如权利要求110-113中任一项所述的试剂盒,其中所述酶选自下组,该组由以下各项组成:逆转录酶、末端转移酶、RNA酶抑制剂、DNA聚合酶、限制性内切核酸酶、和外切核酸酶,或其任何组合。
115.一种用于第二链合成的方法,所述方法包括:
使样品中的mRNA靶标与包含第一通用标记的核酸接触;
将所述mRNA靶标逆转录为标记的单链cDNA;
用链置换聚合酶从所述标记的单链cDNA合成第二链;并且
从具有包含所述第一通用标记的序列的所述第二链产生第三链,从而产生双链标记的cDNA。
116.如权利要求115所述的方法,其中所述核酸包含随机条形码。
117.如权利要求116所述的方法,其中所述随机条形码包括分子标记、细胞标记、靶标特异性区域、和通用标记,或其任何组合。
118.如权利要求115-117中任一项所述的方法,其中所述接触包括将所述核酸的靶标特异性区域与所述mRNA杂交。
119.如权利要求118所述的方法,其中所述靶标特异性区域包含寡聚dT序列。
120.如权利要求115-119中任一项所述的方法,其中在所述逆转录后,将所述标记的单链cDNA与所述mRNA靶标杂交。
121.如权利要求115-120中任一项所述的方法,其中所述合成包括用RNA酶切割所述mRNA,从而产生mRNA引物。
122.如权利要求121所述的方法,其中所述RNA酶是RNaseH。
123.如权利要求121或122所述的方法,其中所述mRNA引物的长度为至少15个核苷酸。
124.如权利要求121-123中任一项所述的方法,还包括用所述链置换聚合酶延伸所述mRNA引物,从而产生延伸的区段。
125.如权利要求124所述的方法,其中所述延伸的区段包含所述mRNA引物。
126.如权利要求125所述的方法,还包括去除所述mRNA引物。
127.如权利要求126所述的方法,其中所述去除包括用外切核酸酶去除。
128.一种用于产生链特异性测序文库的方法,所述方法包括:
使RNA片段与包含第一序列的引物接触;
产生并入所述第一序列的双链cDNA;
将衔接子连接到所述双链cDNA上,从而产生不对称衔接子连接的cDNA,其中所述不对称衔接子连接的cDNA的所述测序读段指示链特异性。
129.如权利要求128所述的方法,其中所述第一序列包含第一测序引物序列的一部分。
130.如权利要求128或129所述的方法,其中所述第一序列包含样品条形码。
131.如权利要求128-130中任一项所述的方法,其中所述第一序列包含分子条形码。
132.如权利要求128-131中任一项所述的方法,其中所述产生包括逆转录、第二链合成。
133.如权利要求128-132中任一项所述的方法,其中所述衔接子是双链的。
CN201680022865.5A 2015-04-23 2016-04-21 用于全转录组扩增的方法和组合物 Active CN107580632B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562151583P 2015-04-23 2015-04-23
US62/151,583 2015-04-23
US201562196782P 2015-07-24 2015-07-24
US62/196,782 2015-07-24
PCT/US2016/028694 WO2016172373A1 (en) 2015-04-23 2016-04-21 Methods and compositions for whole transcriptome amplification

Publications (2)

Publication Number Publication Date
CN107580632A true CN107580632A (zh) 2018-01-12
CN107580632B CN107580632B (zh) 2021-12-28

Family

ID=55861270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680022865.5A Active CN107580632B (zh) 2015-04-23 2016-04-21 用于全转录组扩增的方法和组合物

Country Status (4)

Country Link
US (2) US11390914B2 (zh)
EP (1) EP3286326A1 (zh)
CN (1) CN107580632B (zh)
WO (1) WO2016172373A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109097467A (zh) * 2018-08-08 2018-12-28 江苏苏博生物医学科技南京有限公司 基于illumina平台的乳腺癌分型检测试剂盒及应用
CN109136372A (zh) * 2018-08-08 2019-01-04 江苏苏博生物医学科技南京有限公司 一种基于illumina平台的乳腺癌分型检测建库试剂盒
CN109295048A (zh) * 2018-10-09 2019-02-01 中国农业科学院深圳农业基因组研究所 一种全基因组分子标记检测的方法
CN109554443A (zh) * 2018-12-29 2019-04-02 杭州迪安医学检验中心有限公司 一种基于高通量测序技术检测dmd基因变异的引物及其应用
CN112969789A (zh) * 2018-11-08 2021-06-15 贝克顿迪金森公司 使用随机引发的单细胞全转录组分析
CN113454234A (zh) * 2019-02-14 2021-09-28 贝克顿迪金森公司 杂合体靶向和全转录物组扩增
CN114645074A (zh) * 2022-03-07 2022-06-21 华南农业大学 一种单花蕾微量rna建库方法

Families Citing this family (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US8825412B2 (en) 2010-05-18 2014-09-02 Natera, Inc. Methods for non-invasive prenatal ploidy calling
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
EP2656263B1 (en) 2010-12-22 2019-11-06 Natera, Inc. Methods for non-invasive prenatal paternity testing
JP6153874B2 (ja) 2011-02-09 2017-06-28 ナテラ, インコーポレイテッド 非侵襲的出生前倍数性呼び出しのための方法
SG11201405274WA (en) 2012-02-27 2014-10-30 Cellular Res Inc Compositions and kits for molecular counting
SG10201806890VA (en) 2013-08-28 2018-09-27 Cellular Res Inc Massively parallel single cell analysis
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US9582877B2 (en) 2013-10-07 2017-02-28 Cellular Research, Inc. Methods and systems for digitally counting features on arrays
RU2717641C2 (ru) 2014-04-21 2020-03-24 Натера, Инк. Обнаружение мутаций и плоидности в хромосомных сегментах
ES2824700T3 (es) 2015-02-19 2021-05-13 Becton Dickinson Co Análisis unicelular de alto rendimiento que combina información proteómica y genómica
US9727810B2 (en) 2015-02-27 2017-08-08 Cellular Research, Inc. Spatially addressable molecular barcoding
EP3277843A2 (en) 2015-03-30 2018-02-07 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
CN107580632B (zh) 2015-04-23 2021-12-28 贝克顿迪金森公司 用于全转录组扩增的方法和组合物
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
WO2016196229A1 (en) 2015-06-01 2016-12-08 Cellular Research, Inc. Methods for rna quantification
WO2017044574A1 (en) 2015-09-11 2017-03-16 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization
KR20180097536A (ko) * 2015-11-04 2018-08-31 아트레카, 인크. 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트
US10822643B2 (en) 2016-05-02 2020-11-03 Cellular Research, Inc. Accurate molecular barcoding
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
CN109074430B (zh) 2016-05-26 2022-03-29 贝克顿迪金森公司 分子标记计数调整方法
US10240196B2 (en) 2016-05-27 2019-03-26 Agilent Technologies, Inc. Transposase-random priming DNA sample preparation
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
EP4050112A1 (en) 2016-06-21 2022-08-31 10X Genomics, Inc. Nucleic acid sequencing
WO2018058073A2 (en) 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
EP3539035B1 (en) 2016-11-08 2024-04-17 Becton, Dickinson and Company Methods for expression profile classification
KR20190077061A (ko) 2016-11-08 2019-07-02 셀룰러 리서치, 인크. 세포 표지 분류 방법
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
WO2018119399A1 (en) 2016-12-23 2018-06-28 Grail, Inc. Methods for high efficiency library preparation using double-stranded adapters
JP7104048B2 (ja) 2017-01-13 2022-07-20 セルラー リサーチ, インコーポレイテッド 流体チャネルの親水性コーティング
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
CA3049139A1 (en) 2017-02-21 2018-08-30 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
US11274344B2 (en) 2017-03-30 2022-03-15 Grail, Inc. Enhanced ligation in sequencing library preparation
US11118222B2 (en) 2017-03-31 2021-09-14 Grail, Inc. Higher target capture efficiency using probe extension
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
JP7049103B2 (ja) * 2017-12-11 2022-04-06 株式会社日立製作所 単一細胞の網羅的3’末端遺伝子発現解析法
EP3728636A1 (en) 2017-12-19 2020-10-28 Becton, Dickinson and Company Particles associated with oligonucleotides
CN109971843B (zh) * 2017-12-27 2022-11-11 复旦大学泰州健康科学研究院 一种单细胞转录组的测序方法
EP3543351B1 (en) * 2018-03-19 2022-08-10 Ricoh Company, Ltd. Nucleic acid sample-contained container, method for producing nucleic acid sample-contained container, and nucleic acid sample
JP7358388B2 (ja) 2018-05-03 2023-10-10 ベクトン・ディキンソン・アンド・カンパニー 反対側の転写物末端における分子バーコーディング
US11773441B2 (en) 2018-05-03 2023-10-03 Becton, Dickinson And Company High throughput multiomics sample analysis
EP4269618A3 (en) * 2018-06-04 2024-01-10 Illumina, Inc. Methods of making high-throughput single-cell transcriptome libraries
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
DK3821011T3 (da) * 2018-07-11 2023-07-24 Cygnus Biosciences Beijing Co Ltd Transposom-aktiveret dna/rna-sekventering (ted rna-seq)
US11639517B2 (en) * 2018-10-01 2023-05-02 Becton, Dickinson And Company Determining 5′ transcript sequences
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
US11371076B2 (en) 2019-01-16 2022-06-28 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
EP3914728B1 (en) 2019-01-23 2023-04-05 Becton, Dickinson and Company Oligonucleotides associated with antibodies
US20200255888A1 (en) 2019-02-12 2020-08-13 Becton, Dickinson And Company Determining expressions of transcript variants and polyadenylation sites
US11965208B2 (en) 2019-04-19 2024-04-23 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
US20200385791A1 (en) * 2019-06-07 2020-12-10 Bio-Rad Laboratories, Inc. Multiple Beads Per Droplet Resolution
JPWO2021006353A1 (zh) * 2019-07-11 2021-01-14
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
CN115698282A (zh) 2020-01-13 2023-02-03 福路伦特生物科学公司 单细胞测序
CN115427584A (zh) * 2020-01-31 2022-12-02 贝克顿迪金森公司 嗜中温dna聚合酶延伸阻断物
EP4121016A1 (en) 2020-03-16 2023-01-25 Fluent Biosciences Inc. Multi-omic analysis in monodisperse droplets
WO2021231779A1 (en) 2020-05-14 2021-11-18 Becton, Dickinson And Company Primers for immune repertoire profiling
US10941453B1 (en) * 2020-05-20 2021-03-09 Paragon Genomics, Inc. High throughput detection of pathogen RNA in clinical specimens
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022015925A1 (en) 2020-07-17 2022-01-20 13.8, Inc. Methods, compositions, and systems for mapping locations of single molecules in multi-dimensional space
CN116635533A (zh) 2020-11-20 2023-08-22 贝克顿迪金森公司 高表达的蛋白和低表达的蛋白的谱分析
CA3220482A1 (en) * 2021-05-18 2022-11-24 Fluent Biosciences Inc. Pre-templated instant partitions for screening
WO2023044307A1 (en) * 2021-09-14 2023-03-23 Becton, Dickinson And Company Full length single cell rna sequencing
US11680293B1 (en) 2022-04-21 2023-06-20 Paragon Genomics, Inc. Methods and compositions for amplifying DNA and generating DNA sequencing results from target-enriched DNA molecules
JP2023183556A (ja) * 2022-06-16 2023-12-28 株式会社日立製作所 単一細胞解析用容器及びそれを用いた単一細胞解析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102933721A (zh) * 2010-06-09 2013-02-13 凯津公司 用于高通量筛选的组合序列条形码
WO2014071361A1 (en) * 2012-11-05 2014-05-08 Rubicon Genomics Barcoding nucleic acids
WO2014201273A1 (en) * 2013-06-12 2014-12-18 The Broad Institute, Inc. High-throughput rna-seq
WO2015031691A1 (en) * 2013-08-28 2015-03-05 Cellular Research, Inc. Massively parallel single cell analysis

Family Cites Families (457)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4510244A (en) 1980-04-17 1985-04-09 The Board Of Trustees Of The Leland Stanford Jr. University Cell labeling with antigen-coupled microspheres
US4725536A (en) 1985-09-19 1988-02-16 Genetics Institute, Inc. Reagent polynucleotide complex with multiple target binding regions, and kit and methods
US6150517A (en) 1986-11-24 2000-11-21 Gen-Probe Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms
WO1989001050A1 (en) 1987-07-31 1989-02-09 The Board Of Trustees Of The Leland Stanford Junior University Selective amplification of target polynucleotide sequences
US5149625A (en) 1987-08-11 1992-09-22 President And Fellows Of Harvard College Multiplex analysis of DNA
US5124246A (en) 1987-10-15 1992-06-23 Chiron Corporation Nucleic acid multimers and amplified nucleic acid hybridization assays using same
US5656731A (en) 1987-10-15 1997-08-12 Chiron Corporation Nucleic acid-amplified immunoassay probes
WO1990001065A1 (en) 1988-07-26 1990-02-08 Genelabs Incorporated Rna and dna amplification techniques
US5871928A (en) 1989-06-07 1999-02-16 Fodor; Stephen P. A. Methods for nucleic acid analysis
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US6040138A (en) 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US6309822B1 (en) 1989-06-07 2001-10-30 Affymetrix, Inc. Method for comparing copy number of nucleic acid sequences
US5925525A (en) 1989-06-07 1999-07-20 Affymetrix, Inc. Method of identifying nucleotide differences
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US6551784B2 (en) 1989-06-07 2003-04-22 Affymetrix Inc Method of comparing nucleic acid sequences
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5200314A (en) 1990-03-23 1993-04-06 Chiron Corporation Polynucleotide capture assay employing in vitro amplification
JP3164814B2 (ja) 1990-08-27 2001-05-14 科学技術振興事業団 均一化cDNAライブラリーの作製法
DE69132843T2 (de) 1990-12-06 2002-09-12 Affymetrix Inc N D Ges D Staat Identifizierung von Nukleinsäuren in Proben
JPH04337446A (ja) 1991-05-15 1992-11-25 Hitachi Ltd 微粒子計測方法、定量方法および微粒子計測装置
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5424413A (en) 1992-01-22 1995-06-13 Gen-Probe Incorporated Branched nucleic acid probes
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5981176A (en) 1992-06-17 1999-11-09 City Of Hope Method of detecting and discriminating between nucleic acid sequences
WO1995000530A1 (en) 1993-06-25 1995-01-05 Affymax Technologies N.V. Hybridization and sequencing of nucleic acids
US6087186A (en) 1993-07-16 2000-07-11 Irori Methods and apparatus for synthesizing labeled combinatorial chemistry libraries
US5500356A (en) 1993-08-10 1996-03-19 Life Technologies, Inc. Method of nucleic acid sequence selection
US6309823B1 (en) 1993-10-26 2001-10-30 Affymetrix, Inc. Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same
US5681697A (en) 1993-12-08 1997-10-28 Chiron Corporation Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor
US5714330A (en) 1994-04-04 1998-02-03 Lynx Therapeutics, Inc. DNA sequencing by stepwise ligation and cleavage
GB2293238A (en) 1994-09-13 1996-03-20 Inceltec Ltd Primers for replication and/or amplification reactions
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US6600996B2 (en) 1994-10-21 2003-07-29 Affymetrix, Inc. Computer-aided techniques for analyzing biological sequences
ATE340866T1 (de) 1994-10-28 2006-10-15 Gen Probe Inc Zusammensetzungen und verfahren für die gleichzeitige detektion und quantifizierung von einer mehrheit spezifischer nuklein säure sequenzen
CN1181720A (zh) 1995-04-25 1998-05-13 伊萝莉公司 可远程编程的存储器材料及其应用
US5648245A (en) 1995-05-09 1997-07-15 Carnegie Institution Of Washington Method for constructing an oligonucleotide concatamer library by rolling circle replication
US5968740A (en) 1995-07-24 1999-10-19 Affymetrix, Inc. Method of Identifying a Base in a Nucleic Acid
US5763175A (en) 1995-11-17 1998-06-09 Lynx Therapeutics, Inc. Simultaneous sequencing of tagged polynucleotides
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
US6613544B1 (en) 1995-12-22 2003-09-02 Amgen Inc. Osteoprotegerin
US5962271A (en) 1996-01-03 1999-10-05 Cloutech Laboratories, Inc. Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end
US5830712A (en) 1996-02-06 1998-11-03 Allelix Biopharmaceuticals Inc. Selective template deletion method
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
WO1997045559A1 (en) * 1996-05-29 1997-12-04 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
JPH1021373A (ja) 1996-07-05 1998-01-23 Fuji Photo Film Co Ltd 画像解析装置
US7169556B2 (en) 1996-07-29 2007-01-30 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US20020172953A1 (en) 1996-07-29 2002-11-21 Mirkin Chad A. Movement of biomolecule-coated nanoparticles in an electric field
US6984491B2 (en) 1996-07-29 2006-01-10 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US6100029A (en) 1996-08-14 2000-08-08 Exact Laboratories, Inc. Methods for the detection of chromosomal aberrations
US5935793A (en) 1996-09-27 1999-08-10 The Chinese University Of Hong Kong Parallel polynucleotide sequencing method using tagged primers
US6124092A (en) 1996-10-04 2000-09-26 The Perkin-Elmer Corporation Multiplex polynucleotide capture methods and compositions
US6117631A (en) 1996-10-29 2000-09-12 Polyprobe, Inc. Detection of antigens via oligonucleotide antibody conjugates
US6046005A (en) 1997-01-15 2000-04-04 Incyte Pharmaceuticals, Inc. Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group
EP0985142A4 (en) 1997-05-23 2006-09-13 Lynx Therapeutics Inc SYSTEM AND APPARATUS FOR THE SEQUENTIAL TREATMENT OF ANALYTES
US6974669B2 (en) 2000-03-28 2005-12-13 Nanosphere, Inc. Bio-barcodes based on oligonucleotide-modified nanoparticles
US6399334B1 (en) 1997-09-24 2002-06-04 Invitrogen Corporation Normalized nucleic acid libraries and methods of production thereof
AU1603199A (en) 1997-12-03 1999-06-16 Curagen Corporation Methods and devices for measuring differential gene expression
US6265163B1 (en) 1998-01-09 2001-07-24 Lynx Therapeutics, Inc. Solid phase selection of differentially expressed genes
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
WO2000014282A1 (en) 1998-09-04 2000-03-16 Lynx Therapeutics, Inc. Method of screening for genetic polymorphism
US6480791B1 (en) 1998-10-28 2002-11-12 Michael P. Strathmann Parallel methods for genomic analysis
US6197554B1 (en) 1998-11-20 2001-03-06 Shi-Lung Lin Method for generating full-length cDNA library from single cells
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US20020019005A1 (en) 1999-02-18 2002-02-14 Arcaris, Inc. Process for identification of genes encoding proteins having cell proliferation-promoting activity
US6629040B1 (en) 1999-03-19 2003-09-30 University Of Washington Isotope distribution encoded tags for protein identification
EP1165839A2 (en) 1999-03-26 2002-01-02 Whitehead Institute For Biomedical Research Universal arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6699661B1 (en) 1999-04-20 2004-03-02 Kankyo Engineering Co., Ltd. Method for determining a concentration of target nucleic acid molecules, nucleic acid probes for the method, and method for analyzing data obtained by the method
US6372813B1 (en) 1999-06-25 2002-04-16 Motorola Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays
US6326148B1 (en) 1999-07-12 2001-12-04 The Regents Of The University Of California Detection of copy number changes in colon cancer
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
SE9903988D0 (sv) 1999-11-03 1999-11-03 Amersham Pharm Biotech Ab Method of analysis
US6489114B2 (en) 1999-12-17 2002-12-03 Bio Merieux Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby
US6500620B2 (en) 1999-12-29 2002-12-31 Mergen Ltd. Methods for amplifying and detecting multiple polynucleotides on a solid phase support
US7022479B2 (en) 2000-01-24 2006-04-04 Compound Therapeutics, Inc. Sensitive, multiplexed diagnostic assays for protein analysis
WO2001053539A1 (en) 2000-01-24 2001-07-26 Phylos, Inc. Sensitive, multiplexed diagnostic assays for protein analysis
US6235483B1 (en) 2000-01-31 2001-05-22 Agilent Technologies, Inc. Methods and kits for indirect labeling of nucleic acids
US20050214825A1 (en) 2000-02-07 2005-09-29 John Stuelpnagel Multiplex sample analysis on universal arrays
US20020006617A1 (en) 2000-02-07 2002-01-17 Jian-Bing Fan Nucleic acid detection methods using universal priming
GB2364054B (en) 2000-03-24 2002-05-29 Smithkline Beecham Corp Method of amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof
DK2206791T3 (en) * 2000-04-10 2016-10-24 Taxon Biosciences Inc Methods of study and genetic analysis of populations
US20030207300A1 (en) 2000-04-28 2003-11-06 Matray Tracy J. Multiplex analytical platform using molecular tags
US7630063B2 (en) 2000-08-02 2009-12-08 Honeywell International Inc. Miniaturized cytometer for detecting multiple species in a sample
US6511809B2 (en) 2000-06-13 2003-01-28 E. I. Du Pont De Nemours And Company Method for the detection of an analyte by means of a nucleic acid reporter
EP1368460B1 (en) 2000-07-07 2007-10-31 Visigen Biotechnologies, Inc. Real-time sequence determination
JP2004525607A (ja) 2000-08-11 2004-08-26 ナノスフェアー インコーポレイテッド オリゴヌクレオチドを付着させたナノ粒子とその使用方法
ATE344834T1 (de) 2000-08-25 2006-11-15 Riken Methode zur herstellung von genormten und/oder subtrahierten cdna
US6934408B2 (en) 2000-08-25 2005-08-23 Amnis Corporation Method and apparatus for reading reporter labeled beads
EP1366192B8 (en) 2000-10-24 2008-10-29 The Board of Trustees of the Leland Stanford Junior University Direct multiplex characterization of genomic dna
AU2002230593A1 (en) 2000-12-08 2002-06-18 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US20020142345A1 (en) 2000-12-22 2002-10-03 Nelsen Anita J. Methods for encoding and decoding complex mixtures in arrayed assays
US20030049616A1 (en) 2001-01-08 2003-03-13 Sydney Brenner Enzymatic synthesis of oligonucleotide tags
WO2002070684A2 (en) 2001-01-11 2002-09-12 Lion Bioscience Ag Gene library for screening methods
WO2002059355A2 (en) 2001-01-25 2002-08-01 Tm Bioscience Corporation Polynucleotides for use as tags and tag complements, manufacture and use thereof
MXPA02012739A (es) 2001-03-09 2004-04-20 Nugen Technologies Inc Metodos y composiciones para amplificacion de secuencias de arn.
US7027932B2 (en) 2001-03-21 2006-04-11 Olympus Optical Co., Ltd. Biochemical examination method
JP2005233974A (ja) 2001-03-21 2005-09-02 Olympus Corp 生化学的検査方法
JP4146239B2 (ja) 2001-03-28 2008-09-10 ナノスフェアー インコーポレイテッド オリゴヌクレオチド修飾粒子をベースとするバイオバーコード
WO2002083922A2 (en) 2001-04-11 2002-10-24 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Modified random primers for probe labeling
US20030170675A1 (en) 2001-04-11 2003-09-11 The Gov't Of The U.S Of America As Represented By The Secretary Of The Dept. Of Health & Human Serv. Methods of manipulating nucleic acids
AUPR480901A0 (en) 2001-05-04 2001-05-31 Genomics Research Partners Pty Ltd Diagnostic method for assessing a condition of a performance animal
CA2344599C (en) 2001-05-07 2011-07-12 Bioneer Corporation Selective polymerase chain reaction of dna of which base sequence is completely unknown
US6905827B2 (en) 2001-06-08 2005-06-14 Expression Diagnostics, Inc. Methods and compositions for diagnosing or monitoring auto immune and chronic inflammatory diseases
WO2002101358A2 (en) 2001-06-11 2002-12-19 Illumina, Inc. Multiplexed detection methods
JP4244534B2 (ja) 2001-06-12 2009-03-25 横河電機株式会社 バイオチップ
US7473767B2 (en) 2001-07-03 2009-01-06 The Institute For Systems Biology Methods for detection and quantification of analytes in complex mixtures
US6830931B2 (en) 2001-07-12 2004-12-14 Automated Cell, Inc. Method and apparatus for monitoring of proteins and cells
AU2002363062B2 (en) 2001-10-09 2007-03-22 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US20030077611A1 (en) 2001-10-24 2003-04-24 Sention Methods and systems for dynamic gene expression profiling
CN100360722C (zh) 2001-11-21 2008-01-09 艾普勒拉公司 数字化分析
US20030175749A1 (en) * 2001-12-08 2003-09-18 Jong-Yoon Chun Annealing control primer and its uses
AU2003202026A1 (en) 2002-01-16 2003-09-02 Dynal Biotech Asa Method for isolating nucleic acids and protein from a single sample
AU2003206095A1 (en) 2002-01-29 2003-09-02 Global Genomics Ab Methods and means for amplifying nucleic acid
WO2003069421A2 (en) 2002-02-14 2003-08-21 Immunivest Corporation Methods and algorithms for cell enumeration in a low-cost cytometer
US20030186251A1 (en) 2002-04-01 2003-10-02 Brookhaven Science Associates, Llc Genome sequence tags
US20050175993A1 (en) 2002-04-12 2005-08-11 Chia-Lin Wei Method for making full-length coding sequence cDNA libraries
US20070178478A1 (en) 2002-05-08 2007-08-02 Dhallan Ravinder S Methods for detection of genetic disorders
US6808906B2 (en) 2002-05-08 2004-10-26 Rigel Pharmaceuticals, Inc. Directionally cloned random cDNA expression vector libraries, compositions and methods of use
AU2003256285A1 (en) 2002-06-28 2004-01-19 Igen International, Inc. Improved assay systems and components
US20050019776A1 (en) 2002-06-28 2005-01-27 Callow Matthew James Universal selective genome amplification and universal genotyping system
US7192700B2 (en) 2002-12-20 2007-03-20 Orchid Cellmark Inc. Methods and compositions for conducting primer extension and polymorphism detection reactions
EP1546723A4 (en) 2002-08-16 2007-03-07 Decision Biomarkers Inc READING FLUORESCENCE CARIES
ATE447040T1 (de) 2002-09-03 2009-11-15 Quanta Biosciences Inc Verbesserte zusammensetzungen und verfahren für die cdna-synthese
US7361821B2 (en) 2002-09-20 2008-04-22 Intel Corporation Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading
JP4201203B2 (ja) * 2002-09-30 2008-12-24 エフ.ホフマン−ラ ロシュ アーゲー チミジル酸シンターゼ遺伝子の遺伝子型判別のためのオリゴヌクレオチド
WO2004040001A2 (en) 2002-10-02 2004-05-13 California Institute Of Technology Microfluidic nucleic acid analysis
AU2003291481A1 (en) 2002-11-11 2004-06-03 Affymetrix, Inc. Methods for identifying dna copy number changes
US7822555B2 (en) 2002-11-11 2010-10-26 Affymetrix, Inc. Methods for identifying DNA copy number changes
US7704687B2 (en) 2002-11-15 2010-04-27 The Johns Hopkins University Digital karyotyping
EP1587940A4 (en) 2002-12-20 2006-06-07 Caliper Life Sciences Inc SINGLE MOLECULAR AMPLIFICATION AND DNA PROOF
DE602004015408D1 (de) 2003-01-23 2008-09-11 Us Genomics Inc Verfahren zur analyse von polymer-populationen
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US8206913B1 (en) 2003-03-07 2012-06-26 Rubicon Genomics, Inc. Amplification and analysis of whole genome and whole transcriptome libraries generated by a DNA polymerization process
DK2374900T3 (en) * 2003-03-07 2016-10-17 Rubicon Genomics Inc Polynucleotides for amplification and analysis of the total genomic and total transcription libraries generated by a DNA polymerization
WO2006102264A1 (en) 2005-03-18 2006-09-28 Fluidigm Corporation Thermal reaction device and method for using the same
US7269518B2 (en) 2003-04-30 2007-09-11 Agilent Technologies, Inc. Chemical array reading
US20040259118A1 (en) 2003-06-23 2004-12-23 Macevicz Stephen C. Methods and compositions for nucleic acid sequence analysis
WO2005010145A2 (en) 2003-07-05 2005-02-03 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
EP1651776A2 (de) 2003-07-24 2006-05-03 Qiagen GmbH Verfahren zur reversen transkription und/oder amplifikation von nukleinsäuren
JP2007502116A (ja) 2003-08-13 2007-02-08 アフィメトリックス インコーポレイテッド 核酸サンプルを調製するための方法およびキット
GB0319332D0 (en) 2003-08-16 2003-09-17 Astrazeneca Ab Amplification
US20050048498A1 (en) 2003-08-29 2005-03-03 Applera Corporation Compositions, methods, and kits for assembling probes
US7341837B2 (en) 2003-09-02 2008-03-11 Lawton Robert L Soluble analyte detection and amplification
US7354706B2 (en) * 2003-09-09 2008-04-08 The Regents Of The University Of Colorado, A Body Corporate Use of photopolymerization for amplification and detection of a molecular recognition event
CA2536565A1 (en) 2003-09-10 2005-05-12 Althea Technologies, Inc. Expression profiling using microarrays
JP2007512811A (ja) * 2003-11-10 2007-05-24 インベスチゲン, インコーポレイテッド 検出のための核酸を調製する方法
CA2552858A1 (en) 2004-01-23 2005-08-04 Lingvitae As Improving polynucleotide ligation reactions
WO2005080604A2 (en) 2004-02-12 2005-09-01 Compass Genetics, Llc Genetic analysis by sequence-specific sorting
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US7432055B2 (en) 2004-03-05 2008-10-07 Uchicago Argonne Llc Dual phase multiplex polymerase chain reaction
EP1745155B1 (en) 2004-05-07 2014-10-15 Cepheid Multiplexed detection of biological agents
US20050250147A1 (en) 2004-05-10 2005-11-10 Macevicz Stephen C Digital profiling of polynucleotide populations
US20060294606A1 (en) * 2004-05-18 2006-12-28 Istefo Moisyadi Tn5 transposase-mediated transgenesis
US20060002824A1 (en) 2004-06-07 2006-01-05 Irm, Llc Dispensing systems, software, and related methods
US20060035258A1 (en) 2004-08-06 2006-02-16 Affymetrix, Inc. Methods for identifying DNA copy number changes
US20060041385A1 (en) 2004-08-18 2006-02-23 Bauer Kenneth D Method of quantitating proteins and genes in cells using a combination of immunohistochemistry and in situ hybridization
US7713697B2 (en) 2004-08-27 2010-05-11 Gen-Probe Incorporated Methods and kits for amplifying DNA
US20060073506A1 (en) 2004-09-17 2006-04-06 Affymetrix, Inc. Methods for identifying biological samples
US7435084B2 (en) 2004-12-14 2008-10-14 Align Technology, Inc. System and methods for casting physical tooth model
EP1842226B2 (en) 2004-11-03 2014-07-02 Iris International, Inc. Homogeneous analyte detection
US8883487B2 (en) 2004-12-23 2014-11-11 Abbott Point Of Care Inc. Molecular diagnostics system and methods
DE602005020691D1 (de) 2004-12-23 2010-05-27 Ge Healthcare Bio Sciences Rna-amplifikation auf ligationsbasis
EP1845160A4 (en) 2005-02-10 2009-07-01 Riken NUCLEOTIDE-amplification
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7407757B2 (en) 2005-02-10 2008-08-05 Population Genetics Technologies Genetic analysis by sequence-specific sorting
EP1856293A2 (en) 2005-03-16 2007-11-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
US20060263789A1 (en) 2005-05-19 2006-11-23 Robert Kincaid Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using
US7695886B2 (en) 2005-05-19 2010-04-13 Fuji Xerox Co., Ltd. Process for producing resin particle liquid dispersion for electrostatic image developing toner, electrostatic image developing toner and production process thereof
US8407013B2 (en) * 2005-06-07 2013-03-26 Peter K. Rogan AB initio generation of single copy genomic probes
US20070065844A1 (en) 2005-06-08 2007-03-22 Massachusetts Institute Of Technology Solution-based methods for RNA expression profiling
US7796815B2 (en) 2005-06-10 2010-09-14 The Cleveland Clinic Foundation Image analysis of biological objects
US20090264299A1 (en) * 2006-02-24 2009-10-22 Complete Genomics, Inc. High throughput genome sequencing on DNA arrays
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
US8486621B2 (en) 2005-08-11 2013-07-16 Cornell Research Foundation, Inc. Nucleic acid-based matrixes
US20070117121A1 (en) 2005-09-16 2007-05-24 Hutchison Stephen K cDNA library preparation
WO2007044974A2 (en) 2005-10-12 2007-04-19 The Research Foundation Of State University Of New York Absolute pcr quantification
WO2007053692A1 (en) 2005-11-01 2007-05-10 Symyx Technologies, Inc. Liquid dispensing for high-throughput experimentation
US7375211B2 (en) 2005-11-18 2008-05-20 Kou Zhong C Method for detection and quantification of T-cell receptor Vβ repertoire
US20080070303A1 (en) 2005-11-21 2008-03-20 West Michael D Methods to accelerate the isolation of novel cell strains from pluripotent stem cells and cells obtained thereby
US7636465B2 (en) 2005-12-09 2009-12-22 Cytyc Corporation Cross-frame object reconstruction for image-based cytology applications
WO2007087310A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Nucleic acid analysis using sequence tokens
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
US8460878B2 (en) 2006-02-21 2013-06-11 The Trustees Of Tufts College Methods and arrays for detecting cells and cellular components in small defined volumes
US20080038727A1 (en) 2006-03-10 2008-02-14 Applera Corporation MicroRNA and Messenger RNA Detection on Arrays
EP2002246A1 (en) 2006-04-04 2008-12-17 Sidec Technologies AB Extended electron tomography
US20080194414A1 (en) 2006-04-24 2008-08-14 Albert Thomas J Enrichment and sequence analysis of genomic regions
WO2007136874A2 (en) 2006-05-18 2007-11-29 President And Fellows Of Harvard College Genomic library construction
EP4108780A1 (en) 2006-06-14 2022-12-28 Verinata Health, Inc. Rare cell analysis using sample splitting and dna tags
EP2077912B1 (en) 2006-08-07 2019-03-27 The President and Fellows of Harvard College Fluorocarbon emulsion stabilizing surfactants
CA2660286A1 (en) 2006-08-09 2008-02-21 Homestead Clinical Corporation Organ-specific proteins and methods of their use
US20100159590A1 (en) 2006-10-05 2010-06-24 Nanopoint, Inc. Systems and methods for active microfluidic cell handling
WO2008057163A2 (en) 2006-10-09 2008-05-15 Carnegie Mellon University Preparation of functional gel particles with a dual crosslink network
SK50302009A3 (sk) 2006-10-18 2010-03-08 Osaki Electric Co., Ltd. Elektronický watthodinový elektromer
US20100184152A1 (en) 2006-10-23 2010-07-22 Vladislav Sandler Target-oriented whole genome amplification of nucleic acids
DK2518162T3 (en) 2006-11-15 2018-06-18 Biospherex Llc Multi-tag sequencing and ecogenomic analysis
US8050476B2 (en) 2006-11-22 2011-11-01 General Electric Company Heart rate demodulation of periodic movement in ultrasound data for object identification
EP2677309B9 (en) 2006-12-14 2014-11-19 Life Technologies Corporation Methods for sequencing a nucleic acid using large scale FET arrays, configured to measure a limited pH range
EP2096429A4 (en) 2007-01-16 2009-12-16 Olympus Corp FLUORESCENT SIGNAL ANALYSIS APPARATUS AND FLUORESCENT SIGNAL ANALYSIS METHOD
WO2008109207A2 (en) 2007-01-30 2008-09-12 The Regents Of The University Of California Methods and devices for biomolecular arrays
US20080269068A1 (en) 2007-02-06 2008-10-30 President And Fellows Of Harvard College Multiplex decoding of sequence tags in barcodes
WO2008096318A2 (en) 2007-02-09 2008-08-14 Koninklijke Philips Electronics N.V. Identification system
US8003312B2 (en) 2007-02-16 2011-08-23 The Board Of Trustees Of The Leland Stanford Junior University Multiplex cellular assays using detectable cell barcodes
SI2472264T1 (sl) 2007-02-27 2016-06-30 SentoClone International AB Karolinska Institute Science Park Multipleksna detekcija tumorskih celic z uporabo plošč vezavnih sredstev na zunajcelične markerje
US9029085B2 (en) 2007-03-07 2015-05-12 President And Fellows Of Harvard College Assays and other reactions involving droplets
KR100882711B1 (ko) 2007-03-12 2009-02-06 성균관대학교산학협력단 사이크로박터 스피시스 hj147 균주 유래의 우라실-dna글리코실라제 및 이의 용도
JP2008256428A (ja) 2007-04-03 2008-10-23 Intec Systems Institute Inc マイクロアレイ画像のブロック位置検出方法
US20080268508A1 (en) 2007-04-30 2008-10-30 Sowlay Mohankumar R Methods and kits for negative selection of desired nucleic acid sequences
US20080274458A1 (en) 2007-05-01 2008-11-06 Latham Gary J Nucleic acid quantitation methods
US20090061513A1 (en) 2007-05-15 2009-03-05 Picovitro Ab Cell sorting and cell cultivation methods
CN101720359A (zh) 2007-06-01 2010-06-02 454生命科学公司 从多重混合物中识别个别样本的系统和方法
US20100304445A1 (en) * 2007-06-16 2010-12-02 Waclaw Szybalski Nucleic acid packaging system
EP2395113A1 (en) 2007-06-29 2011-12-14 Population Genetics Technologies Ltd. Methods and compositions for isolating nucleic acid sequence variants
EP2036989B1 (en) 2007-09-12 2012-07-25 Institut Pasteur Polynucleotide suitable for single cell based reporter assay to monitor gene expression patterns with high spatio-temporal resolution
US8114681B2 (en) 2007-10-05 2012-02-14 Affymetrix, Inc. Highly multiplexed particle-based assays
EP2294408A4 (en) 2008-02-21 2011-05-25 Gentel Biosciences Inc SUBSTRATES FOR MULTIPLEX TEST PROCEDURES AND USES THEREFOR
US8687189B2 (en) 2008-03-03 2014-04-01 Ajjer, Llc Analysis of arrays by laser induced breakdown spectroscopy
DE102008025656B4 (de) 2008-05-28 2016-07-28 Genxpro Gmbh Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
US20090298709A1 (en) 2008-05-28 2009-12-03 Affymetrix, Inc. Assays for determining telomere length and repeated sequence copy number
WO2009148560A2 (en) 2008-05-30 2009-12-10 Board Of Regents, The Universtiy Of Texas System Methods and compositions for nucleic acid sequencing
WO2010021936A1 (en) 2008-08-16 2010-02-25 The Board Of Trustees Of The Leland Stanford Junior University Digital pcr calibration for high throughput sequencing
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
WO2010053980A2 (en) 2008-11-04 2010-05-14 The Johns Hopkins University Dna integrity assay (dia) for cancer diagnostics, using confocal fluorescence spectroscopy
WO2010059820A1 (en) 2008-11-21 2010-05-27 Saint Louis University Biosensor for detecting multiple epitopes on a target
US20100159533A1 (en) 2008-11-24 2010-06-24 Helicos Biosciences Corporation Simplified sample preparation for rna analysis
US8492096B2 (en) 2008-12-24 2013-07-23 Boris Pasche TGFBR1 expression modifies risk for colorectal cancer
AU2010206843B2 (en) 2009-01-20 2015-01-29 The Board Of Trustees Of The Leland Stanford Junior University Single cell gene expression for diagnosis, prognosis and identification of drug targets
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
JPWO2010101164A1 (ja) 2009-03-05 2012-09-10 第一三共株式会社 ピリジン誘導体
EP2230312A1 (en) * 2009-03-19 2010-09-22 Helmholtz-Zentrum für Infektionsforschung GmbH Probe compound for detecting and isolating enzymes and means and methods using the same
US20120010091A1 (en) 2009-03-30 2012-01-12 Illumina, Inc. Gene expression analysis in single cells
AU2010232439C1 (en) 2009-04-02 2017-07-13 Fluidigm Corporation Multi-primer amplification method for barcoding of target nucleic acids
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
FR2945545B1 (fr) * 2009-05-14 2011-08-05 Univ Aix Marseille Ii Methode de detection d'adn procaryote extrait d'un echantillon de selles
JPWO2010131645A1 (ja) 2009-05-14 2012-11-01 和光純薬工業株式会社 Rnaに対応する二本鎖dnaの合成方法及び増幅方法
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
GB0909923D0 (en) 2009-06-09 2009-07-22 Oxford Gene Tech Ip Ltd Picowell capture devices for analysing single cells or other particles
US20120058902A1 (en) 2009-06-25 2012-03-08 Livingston Robert J Method of measuring adaptive immunity
US8330957B2 (en) 2009-06-29 2012-12-11 Hager Enviromental and Atmospheric Technologies, LLC Device and method for quantification of gases in plumes by remote sensing
EP2449104B1 (en) 2009-06-29 2014-06-04 Luminex Corporation Chimeric primers with hairpin conformations and methods of using same
WO2011021102A2 (en) 2009-08-20 2011-02-24 Population Genetics Technologies Ltd Compositions and methods for intramolecular nucleic acid rearrangement
WO2011028818A2 (en) 2009-09-01 2011-03-10 Trustees Of Boston University High throughput multichannel reader and uses thereof
BR112012004382A2 (pt) * 2009-09-01 2016-03-22 Koninkl Philips Electronics Nv dispositivo para a seleção específica de moléculas-alvo, método para selecionar especificamente moléculas-alvo e uso de um dispositivo
US9625454B2 (en) 2009-09-04 2017-04-18 The Research Foundation For The State University Of New York Rapid and continuous analyte processing in droplet microfluidic devices
US9488656B2 (en) 2009-09-30 2016-11-08 Quest Diagnostics Investments Incorporated BCR-ABL truncation mutations
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US10662474B2 (en) 2010-01-19 2020-05-26 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
EP2366031B1 (en) 2010-01-19 2015-01-21 Verinata Health, Inc Sequencing methods in prenatal diagnoses
EP2534267B1 (en) 2010-02-12 2018-04-11 Raindance Technologies, Inc. Digital analyte analysis
JP5901046B2 (ja) * 2010-02-19 2016-04-06 国立大学法人 千葉大学 OATP1B3mRNAの新規な選択的スプライシングバリアント
WO2011106738A2 (en) 2010-02-25 2011-09-01 Fred Hutchinson Cancer Research Center Use of tcr clonotypes as biomarkers for disease
US8951940B2 (en) 2010-04-01 2015-02-10 Illumina, Inc. Solid-phase clonal amplification and related methods
PT2556171E (pt) 2010-04-05 2015-12-21 Prognosys Biosciences Inc Ensaios biológicos codificados espacialmente
EP2569453B1 (en) 2010-05-14 2015-12-16 Fluidigm Corporation Nucleic acid isolation methods
US8828688B2 (en) 2010-05-27 2014-09-09 Affymetrix, Inc. Multiplex amplification methods
US20120004132A1 (en) 2010-07-02 2012-01-05 Affymetrix, Inc. Detection of Nucleic Acids and Proteins
EP2407242A1 (en) 2010-07-13 2012-01-18 Dublin City University Direct clone analysis and selection technology
US20120040843A1 (en) 2010-08-12 2012-02-16 Dublin City University Centrifugal capture system
ES2595433T3 (es) 2010-09-21 2016-12-30 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
EP2436766A1 (en) 2010-09-29 2012-04-04 Deutsches Krebsforschungszentrum Means and methods for improved protein interaction screening
WO2012042374A2 (en) 2010-10-01 2012-04-05 Anssi Jussi Nikolai Taipale Method of determining number or concentration of molecules
US20120088691A1 (en) 2010-10-08 2012-04-12 Gao Chen Highly multiplexed real-time pcr using encoded microbeads
CA2814049C (en) 2010-10-08 2021-07-13 President And Fellows Of Harvard College High-throughput single cell barcoding
US20130225623A1 (en) * 2010-10-27 2013-08-29 Mount Sinai School Of Medicine Methods of Treating Psychiatric or Neurological Disorders with MGLUR Antagonists
EP2646795B1 (en) 2010-11-29 2019-02-20 Dako Denmark A/S Methods for analyzing images of specimens processed by a programmable quantitative assay
US9394511B2 (en) 2010-12-05 2016-07-19 Wenbin Jiang Rapid single cell based parallel biological cell sorter
CA2858608C (en) 2010-12-09 2020-03-10 Akonni Biosystems Sample analysis system
EP2652155B1 (en) 2010-12-16 2016-11-16 Gigagen, Inc. Methods for massively parallel analysis of nucleic acids in single cells
EP2656263B1 (en) 2010-12-22 2019-11-06 Natera, Inc. Methods for non-invasive prenatal paternity testing
WO2012092515A2 (en) 2010-12-30 2012-07-05 Life Technologies Corporation Methods, systems, and computer readable media for nucleic acid sequencing
ES2632768T3 (es) 2011-01-17 2017-09-15 Life Technologies Corporation Flujo de trabajo para la detección de ligandos empleando ácidos nucleicos
WO2012103154A1 (en) 2011-01-24 2012-08-02 Nugen Technologies, Inc. Stem-loop composite rna-dna adaptor-primers: compositions and methods for library generation, amplification and other downstream manipulations
US20120190020A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
WO2016100976A2 (en) 2014-12-19 2016-06-23 Apprise Bio, Inc. Methods for identifying multiple epitopes in selected sub-populations of cells
US9365897B2 (en) 2011-02-08 2016-06-14 Illumina, Inc. Selective enrichment of nucleic acids
EP2675819B1 (en) 2011-02-18 2020-04-08 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
KR20120110431A (ko) 2011-03-29 2012-10-10 에스케이하이닉스 주식회사 반도체 메모리 장치
GB201106254D0 (en) 2011-04-13 2011-05-25 Frisen Jonas Method and product
ES2625288T3 (es) 2011-04-15 2017-07-19 The Johns Hopkins University Sistema de secuenciación segura
EP3401679A1 (en) * 2011-04-20 2018-11-14 Life Technologies Corporation Methods, compositions and systems for sample deposition
EP2702175B1 (en) 2011-04-25 2018-08-08 Bio-Rad Laboratories, Inc. Methods and compositions for nucleic acid analysis
SI2702146T1 (sl) 2011-04-28 2019-06-28 The Board Of Trustees Of The Leland Stanford Junior University Identifikacija polinukleotidov, povezanih z vzorcem
GB201108259D0 (en) 2011-05-17 2011-06-29 Cambridge Entpr Ltd Gel beads in microfluidic droplets
WO2012162267A2 (en) 2011-05-20 2012-11-29 Fluidigm Corporation Nucleic acid encoding reactions
SG193553A1 (en) 2011-05-24 2013-10-30 Biontech Ag Individualized vaccines for cancer
WO2012162621A1 (en) 2011-05-26 2012-11-29 Brandeis University Methods for suppression pcr
US8841071B2 (en) 2011-06-02 2014-09-23 Raindance Technologies, Inc. Sample multiplexing
US9752176B2 (en) 2011-06-15 2017-09-05 Ginkgo Bioworks, Inc. Methods for preparative in vitro cloning
WO2013003498A2 (en) 2011-06-27 2013-01-03 Life Technologies Corporation Acoustic cytometry methods and protocols
US9340826B2 (en) 2011-08-01 2016-05-17 Celemics, Inc. Method of preparing nucleic acid molecules
WO2013022961A1 (en) 2011-08-08 2013-02-14 3The Broad Institute Compositions and methods for co-amplifying subsequences of a nucleic acid fragment sequence
JP5816486B2 (ja) 2011-08-18 2015-11-18 オリンパス株式会社 蛍光観察装置および蛍光観察システム並びに蛍光観察装置の蛍光画像処理方法
KR102087062B1 (ko) 2011-09-16 2020-03-11 렉소겐 게엠베하 핵산 전사 방법
US9297047B2 (en) * 2011-10-24 2016-03-29 Jennifer Furchak Molecular beacon based assay for the detection of biomarkers for breast cancer metastasis
US9777338B2 (en) 2011-11-11 2017-10-03 Meso Scale Technologies, Llc. Co-binder assisted assay methods
KR101337094B1 (ko) 2011-11-30 2013-12-05 삼성에스디에스 주식회사 염기 서열 정렬 장치 및 그 방법
WO2013117595A2 (en) 2012-02-07 2013-08-15 Illumina Cambridge Limited Targeted enrichment and amplification of nucleic acids on a support
WO2013120089A1 (en) 2012-02-10 2013-08-15 Raindance Technologies, Inc. Molecular diagnostic screening assay
US10202628B2 (en) 2012-02-17 2019-02-12 President And Fellows Of Harvard College Assembly of nucleic acid sequences in emulsions
EP2817418B1 (en) 2012-02-24 2017-10-11 Raindance Technologies, Inc. Labeling and sample preparation for sequencing
SG11201405274WA (en) 2012-02-27 2014-10-30 Cellular Res Inc Compositions and kits for molecular counting
ES2776673T3 (es) 2012-02-27 2020-07-31 Univ North Carolina Chapel Hill Métodos y usos para etiquetas moleculares
WO2013137737A1 (en) 2012-03-16 2013-09-19 Flexgen B.V. Methods of creating and screening of dna encoded combinatorial libraries of chemical antibodies
US9803239B2 (en) 2012-03-29 2017-10-31 Complete Genomics, Inc. Flow cells for high density array chips
EP2647426A1 (en) 2012-04-03 2013-10-09 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Replication of distributed nucleic acid molecules with preservation of their relative distribution through hybridization-based binding
ES2582554T3 (es) 2012-05-08 2016-09-13 Adaptive Biotechnologies Corporation Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas
CA2873585C (en) 2012-05-14 2021-11-09 Cb Biotechnologies, Inc. Method for increasing accuracy in quantitative detection of polynucleotides
SG11201407901PA (en) 2012-05-21 2015-01-29 Fluidigm Corp Single-particle analysis of particle populations
CN104508492B (zh) 2012-05-25 2018-07-27 北卡罗来纳-查佩尔山大学 微流体装置、用于试剂的固体支持体和相关方法
JP6558830B2 (ja) 2012-06-15 2019-08-14 ボード・オブ・リージエンツ,ザ・ユニバーシテイ・オブ・テキサス・システム 複数転写産物のハイスループットシークエンシング
EP2861761A1 (en) 2012-06-15 2015-04-22 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
US9957549B2 (en) 2012-06-18 2018-05-01 Nugen Technologies, Inc. Compositions and methods for negative selection of non-desired nucleic acid sequences
US20150011396A1 (en) * 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
ES2637538T3 (es) 2012-07-17 2017-10-13 Counsyl, Inc. Sistema y métodos para la detección de una variación genética
US9695416B2 (en) 2012-07-18 2017-07-04 Siemens Healthcare Diagnostics Inc. Method of normalizing biological samples
JP2015523087A (ja) 2012-07-24 2015-08-13 シーケンタ インコーポレイテッド 配列タグを用いる単一細胞分析
WO2014018093A1 (en) 2012-07-26 2014-01-30 Illumina, Inc. Compositions and methods for the amplification of nucleic acids
WO2014026032A2 (en) 2012-08-08 2014-02-13 Apprise Bio, Inc. Increasing dynamic range for identifying multiple epitopes in cells
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20140378322A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
US20140378349A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
MX364957B (es) 2012-08-14 2019-05-15 10X Genomics Inc Composiciones y metodos para microcapsulas.
US20150005199A1 (en) 2012-08-14 2015-01-01 10X Technologies, Inc. Compositions and methods for sample processing
US20150005200A1 (en) * 2012-08-14 2015-01-01 10X Technologies, Inc. Compositions and methods for sample processing
US20140378345A1 (en) 2012-08-14 2014-12-25 10X Technologies, Inc. Compositions and methods for sample processing
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20150376609A1 (en) 2014-06-26 2015-12-31 10X Genomics, Inc. Methods of Analyzing Nucleic Acids from Individual Cells or Cell Populations
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9644199B2 (en) * 2012-10-01 2017-05-09 Agilent Technologies, Inc. Immobilized transposase complexes for DNA fragmentation and tagging
CA2886974C (en) 2012-10-17 2021-06-29 Spatial Transcriptomics Ab Methods and product for optimising localised or spatial detection of gene expression in a tissue sample
GB201218909D0 (en) 2012-10-22 2012-12-05 Univ Singapore Assay for the parallel detection of biological material based on PCR
CA2894694C (en) 2012-12-14 2023-04-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
WO2014108850A2 (en) 2013-01-09 2014-07-17 Yeda Research And Development Co. Ltd. High throughput transcriptome analysis
US9562269B2 (en) 2013-01-22 2017-02-07 The Board Of Trustees Of The Leland Stanford Junior University Haplotying of HLA loci with ultra-deep shotgun sequencing
WO2014116979A1 (en) 2013-01-24 2014-07-31 Sabic Innovative Plastics Ip B.V. Microwell plate made from a polyester-polycarbonate
US10017761B2 (en) 2013-01-28 2018-07-10 Yale University Methods for preparing cDNA from low quantities of cells
ES2931314T3 (es) 2013-02-01 2022-12-28 Becton Dickinson Co Métodos y sistemas para evaluar el comportamiento de una muestra en un citómetro de flujo
CA2900481A1 (en) 2013-02-08 2014-08-14 10X Genomics, Inc. Polynucleotide barcode generation
CN105102696B (zh) 2013-02-08 2017-08-15 生物辐射实验室股份有限公司 用于目标分子检测的基于亲和力的划分试验
WO2014126937A1 (en) 2013-02-14 2014-08-21 The Board Of Trustees Of The Leland Stanford Junior University Suspension arrays and multiplexed assays based thereon
US9621600B2 (en) 2013-02-26 2017-04-11 PortAura Group Method and system for providing recommendations using location information
US20140274811A1 (en) 2013-03-14 2014-09-18 Lyle J. Arnold Methods for Amplifying a Complete Genome or Transcriptome
US9255265B2 (en) 2013-03-15 2016-02-09 Illumina, Inc. Methods for producing stranded cDNA libraries
CN114107458A (zh) 2013-03-15 2022-03-01 血统生物科学公司 测序免疫组库的方法
GB2525568B (en) 2013-03-15 2020-10-14 Abvitro Llc Single cell barcoding for antibody discovery
US9938523B2 (en) 2013-03-15 2018-04-10 Arizona Board Of Regents On Behalf Of Arizona State University Nucleic acid-tagged compositions and methods for multiplexed protein-protein interaction profiling
US9328382B2 (en) 2013-03-15 2016-05-03 Complete Genomics, Inc. Multiple tagging of individual long DNA fragments
US20140303005A1 (en) 2013-04-05 2014-10-09 Raindance Technologies, Inc. Rare cell analysis after negative selection
JP6633514B2 (ja) 2013-04-25 2020-01-22 ファイアフライ バイオワークス, インコーポレイテッド 標的核酸の多重化分析
EP2805769A1 (en) 2013-05-24 2014-11-26 European Molecular Biology Laboratory Methods for nano-scale single cell analysis
CA2915033C (en) 2013-06-12 2023-08-29 The General Hospital Corporation Methods, kits, and systems for multiplexed detection of target molecules and uses thereof
US20150011398A1 (en) 2013-06-17 2015-01-08 Kim Lewis Methods for quantitative determination of protein-nucleic acid interactions in complex mixtures
WO2014210223A1 (en) 2013-06-25 2014-12-31 Prognosys Biosciences, Inc. Spatially encoded biological assays using a microfluidic device
KR102436171B1 (ko) 2013-06-27 2022-08-24 10엑스 제노믹스, 인크. 샘플 처리를 위한 조성물 및 방법
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
US10395758B2 (en) 2013-08-30 2019-08-27 10X Genomics, Inc. Sequencing methods
CN105683397A (zh) 2013-09-04 2016-06-15 富鲁达公司 用于检测单细胞中的核酸和蛋白的邻近测定
GB201317301D0 (en) 2013-09-30 2013-11-13 Linnarsson Sten Method for capturing and encoding nucleic acid from a plurality of single cells
ES2875998T3 (es) 2013-09-30 2021-11-11 Vesicode Ab Procedimientos de perfilado de complejos moleculares mediante el uso de códigos de barras dependientes de la proximidad
US9582877B2 (en) 2013-10-07 2017-02-28 Cellular Research, Inc. Methods and systems for digitally counting features on arrays
DK3572527T3 (da) 2013-10-17 2021-08-23 Illumina Inc Fremgangsmåder og præparater til fremstilling af nukleinsyrebiblioteker
US10288608B2 (en) 2013-11-08 2019-05-14 Prognosys Biosciences, Inc. Polynucleotide conjugates and methods for analyte detection
ES2912183T3 (es) 2013-12-30 2022-05-24 Atreca Inc Análisis de ácidos nucleicos asociados a células individuales utilizando códigos de barras de ácidos nucleicos
CA2938080A1 (en) 2014-01-27 2015-07-30 The General Hospital Corporation Methods of preparing nucleic acids for sequencing
EP3102678A2 (en) 2014-02-03 2016-12-14 Integrated DNA Technologies Inc. Methods to capture and/or remove highly abundant rnas from a heterogeneous rna sample
CA2941612A1 (en) 2014-03-05 2015-09-11 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US20150298091A1 (en) 2014-04-21 2015-10-22 President And Fellows Of Harvard College Systems and methods for barcoding nucleic acids
CA3060708A1 (en) 2014-04-29 2015-11-05 Illumina, Inc Multiplexed single cell gene expression analysis using template switch and tagmentation
US10975371B2 (en) 2014-04-29 2021-04-13 Illumina, Inc. Nucleic acid sequence analysis from single cells
EP3146080B1 (en) 2014-05-19 2021-01-06 William Marsh Rice University Allele-specific amplification using a composition of overlapping non-allele-specific primer and allele-specific blocker oligonucleotides
US20150376700A1 (en) 2014-06-26 2015-12-31 10X Genomics, Inc. Analysis of nucleic acid sequences
EP3626834B1 (en) 2014-07-15 2022-09-21 Qiagen Sciences, LLC Semi-random barcodes for nucleic acid analysis
WO2016040446A1 (en) 2014-09-10 2016-03-17 Good Start Genetics, Inc. Methods for selectively suppressing non-target sequences
AU2015318011B2 (en) 2014-09-15 2020-07-23 Abvitro Llc High-throughput nucleotide library sequencing
IL299976A (en) 2014-10-17 2023-03-01 Illumina Cambridge Ltd Continuity-preserving transposition
CN107407691B (zh) 2015-01-22 2021-07-27 贝克顿迪金森公司 用于单细胞中核酸靶标的分子条码化的装置和系统
EP3763825B1 (en) 2015-01-23 2023-10-04 Qiagen Sciences, LLC High multiplex pcr with molecular barcoding
US10854315B2 (en) 2015-02-09 2020-12-01 10X Genomics, Inc. Systems and methods for determining structural variation and phasing using variant call data
ES2824700T3 (es) 2015-02-19 2021-05-13 Becton Dickinson Co Análisis unicelular de alto rendimiento que combina información proteómica y genómica
US9727810B2 (en) 2015-02-27 2017-08-08 Cellular Research, Inc. Spatially addressable molecular barcoding
EP3262189B1 (en) 2015-02-27 2021-12-08 Becton, Dickinson and Company Methods for barcoding nucleic acids for sequencing
US11873483B2 (en) 2015-03-11 2024-01-16 The Broad Institute, Inc. Proteomic analysis with nucleic acid identifiers
US20180073073A1 (en) 2015-03-18 2018-03-15 Cellular Research, Inc. Methods and compositions for labeling targets and haplotype phasing
EP3277843A2 (en) 2015-03-30 2018-02-07 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
US10301660B2 (en) 2015-03-30 2019-05-28 Takara Bio Usa, Inc. Methods and compositions for repair of DNA ends by multiple enzymatic activities
US20180057873A1 (en) 2015-04-17 2018-03-01 Centrillion Technology Holdings Corporation Methods for performing spatial profiling of biological materials
CN107580632B (zh) 2015-04-23 2021-12-28 贝克顿迪金森公司 用于全转录组扩增的方法和组合物
US9618871B2 (en) 2015-04-28 2017-04-11 Kyocera Document Solutions Inc. Image forming apparatus
US10988802B2 (en) 2015-05-22 2021-04-27 Sigma-Aldrich Co. Llc Methods for next generation genome walking and related compositions and kits
WO2016190795A1 (en) 2015-05-28 2016-12-01 Kaarel Krjutskov Blocking oligonucleotides
WO2016196229A1 (en) 2015-06-01 2016-12-08 Cellular Research, Inc. Methods for rna quantification
JP6886962B2 (ja) 2015-08-24 2021-06-16 キアゲン ゲーエムベーハー Rnaシークエンシングライブラリーを生成する方法
CN115928221A (zh) 2015-08-28 2023-04-07 Illumina公司 单细胞核酸序列分析
WO2017044574A1 (en) 2015-09-11 2017-03-16 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization
US11156611B2 (en) 2015-09-24 2021-10-26 Abvitro Llc Single cell characterization using affinity-oligonucleotide conjugates and vessel barcoded polynucleotides
KR20180097536A (ko) 2015-11-04 2018-08-31 아트레카, 인크. 단일 세포와 연관된 핵산의 분석을 위한 핵산 바코드의 조합 세트
EP3263715B1 (en) 2016-06-28 2020-01-08 Hifibio Method for transcriptome analysis of single cells
US11965891B2 (en) 2015-12-30 2024-04-23 Bio-Rad Laboratories, Inc. Digital protein quantification
US20170260584A1 (en) 2016-02-11 2017-09-14 10X Genomics, Inc. Cell population analysis using single nucleotide polymorphisms from single cell transcriptomes
WO2017164936A1 (en) 2016-03-21 2017-09-28 The Broad Institute, Inc. Methods for determining spatial and temporal gene expression dynamics in single cells
CN109312331B (zh) 2016-04-01 2022-08-02 贝勒医学院 全转录组扩增的方法
US10822643B2 (en) 2016-05-02 2020-11-03 Cellular Research, Inc. Accurate molecular barcoding
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
CN109074430B (zh) 2016-05-26 2022-03-29 贝克顿迪金森公司 分子标记计数调整方法
TWI600309B (zh) 2016-05-28 2017-09-21 Hon Hai Prec Ind Co Ltd 角度調整機構
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10809266B2 (en) 2016-07-22 2020-10-20 Verily Life Sciences Llc Quantitative massively parallel proteomics
WO2018020489A1 (en) 2016-07-24 2018-02-01 Yeda Research And Development Co. Ltd. Methods and kits for analyzing dna binding moieties attached to dna
US20180037942A1 (en) 2016-08-03 2018-02-08 Cellular Research, Inc. Enzyme-independent molecular indexing
WO2018031631A1 (en) 2016-08-10 2018-02-15 President And Fellows Of Harvard College Methods of de novo assembly of barcoded genomic dna fragments
WO2018058073A2 (en) 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
CN109790537A (zh) * 2016-09-29 2019-05-21 富士胶片株式会社 供多重pcr的引物的设计方法
CN109804079A (zh) * 2016-09-29 2019-05-24 富士胶片株式会社 供多重pcr的引物的设计方法
EP4026905B1 (en) 2016-10-19 2024-04-17 10X Genomics, Inc. Methods for barcoding nucleic acid molecules from individual cells or cell populations
WO2018111872A1 (en) 2016-12-12 2018-06-21 Grail, Inc. Methods for tagging and amplifying rna template molecules for preparing sequencing libraries
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20190177800A1 (en) 2017-12-08 2019-06-13 10X Genomics, Inc. Methods and compositions for labeling cells
GB201622222D0 (en) 2016-12-23 2017-02-08 Cs Genetics Ltd Reagents and methods for molecular barcoding of nucleic acids of single cells
US20180208975A1 (en) 2017-01-20 2018-07-26 Merck Sharp & Dohme Corp. Assay for simultaneous genomic and proteomic analysis
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
EP4324931A2 (en) 2017-02-02 2024-02-21 New York Genome Center, Inc. Methods and compositions for identifying or quantifying targets in a biological sample
KR20190133711A (ko) 2017-03-24 2019-12-03 싱가포르국립대학교 분자의 다중 검출 방법
EP3601606A2 (en) 2017-03-24 2020-02-05 Cellular Research, Inc. Synthetic multiplets for multiplets determination
US20200370105A1 (en) 2017-05-23 2020-11-26 Centrillion Technology Holdings Corporation Methods for performing spatial profiling of biological molecules
US10400235B2 (en) 2017-05-26 2019-09-03 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
JP2020521486A (ja) 2017-05-29 2020-07-27 プレジデント アンド フェローズ オブ ハーバード カレッジ シングルセルトランスクリプトームの増幅法
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
US20200217850A1 (en) 2017-09-15 2020-07-09 Apton Biosystems, Inc. Heterogeneous single cell profiling using molecular barcoding
CN111247589A (zh) 2017-09-25 2020-06-05 贝克顿迪金森公司 免疫受体条形码错误校正
EP3720605A1 (en) 2017-12-07 2020-10-14 Massachusetts Institute Of Technology Single cell analyses
WO2019113499A1 (en) 2017-12-07 2019-06-13 The Broad Institute, Inc. High-throughput methods for identifying gene interactions and networks
WO2019113506A1 (en) 2017-12-07 2019-06-13 The Broad Institute, Inc. Methods and compositions for multiplexing single cell and single nuclei sequencing
SG11201907566TA (en) 2017-12-08 2019-09-27 10X Genomics Inc Methods and compositions for labeling cells
WO2019118355A1 (en) 2017-12-12 2019-06-20 10X Genomics, Inc. Systems and methods for single cell processing
CN111712579A (zh) 2017-12-22 2020-09-25 10X基因组学有限公司 用于处理来自一个或多个细胞的核酸分子的系统和方法
WO2019157529A1 (en) 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
JP7358388B2 (ja) 2018-05-03 2023-10-10 ベクトン・ディキンソン・アンド・カンパニー 反対側の転写物末端における分子バーコーディング
US11773441B2 (en) 2018-05-03 2023-10-03 Becton, Dickinson And Company High throughput multiomics sample analysis
JP7413351B2 (ja) 2018-08-03 2024-01-15 ベクトン・ディキンソン・アンド・カンパニー 単一細胞における核バーコード化および捕捉
EP3837378B1 (en) 2018-08-17 2023-04-05 Becton, Dickinson and Company Aptamer barcoding
WO2020046833A1 (en) 2018-08-28 2020-03-05 Cellular Research, Inc. Sample multiplexing using carbohydrate-binding and membrane-permeable reagents
US11639517B2 (en) 2018-10-01 2023-05-02 Becton, Dickinson And Company Determining 5′ transcript sequences
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
EP3914728B1 (en) 2019-01-23 2023-04-05 Becton, Dickinson and Company Oligonucleotides associated with antibodies
CN113454234A (zh) 2019-02-14 2021-09-28 贝克顿迪金森公司 杂合体靶向和全转录物组扩增

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102933721A (zh) * 2010-06-09 2013-02-13 凯津公司 用于高通量筛选的组合序列条形码
WO2014071361A1 (en) * 2012-11-05 2014-05-08 Rubicon Genomics Barcoding nucleic acids
WO2014201273A1 (en) * 2013-06-12 2014-12-18 The Broad Institute, Inc. High-throughput rna-seq
WO2015031691A1 (en) * 2013-08-28 2015-03-05 Cellular Research, Inc. Massively parallel single cell analysis

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GLENN K. FU, ET LA.: "Counting individual DNA molecules by the stochastic attachment of diverse labels", 《PNAS》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109097467A (zh) * 2018-08-08 2018-12-28 江苏苏博生物医学科技南京有限公司 基于illumina平台的乳腺癌分型检测试剂盒及应用
CN109136372A (zh) * 2018-08-08 2019-01-04 江苏苏博生物医学科技南京有限公司 一种基于illumina平台的乳腺癌分型检测建库试剂盒
CN109295048A (zh) * 2018-10-09 2019-02-01 中国农业科学院深圳农业基因组研究所 一种全基因组分子标记检测的方法
CN112969789A (zh) * 2018-11-08 2021-06-15 贝克顿迪金森公司 使用随机引发的单细胞全转录组分析
CN109554443A (zh) * 2018-12-29 2019-04-02 杭州迪安医学检验中心有限公司 一种基于高通量测序技术检测dmd基因变异的引物及其应用
CN109554443B (zh) * 2018-12-29 2024-03-12 杭州迪安医学检验中心有限公司 一种基于高通量测序技术检测dmd基因变异的引物及其应用
CN113454234A (zh) * 2019-02-14 2021-09-28 贝克顿迪金森公司 杂合体靶向和全转录物组扩增
CN114645074A (zh) * 2022-03-07 2022-06-21 华南农业大学 一种单花蕾微量rna建库方法

Also Published As

Publication number Publication date
CN107580632B (zh) 2021-12-28
EP3286326A1 (en) 2018-02-28
WO2016172373A1 (en) 2016-10-27
US20160312276A1 (en) 2016-10-27
US20220333185A1 (en) 2022-10-20
US11390914B2 (en) 2022-07-19

Similar Documents

Publication Publication Date Title
CN107580632A (zh) 用于全转录组扩增的方法和组合物
CN107406888A (zh) 用于组合条形编码的方法和组合物
CN107208157A (zh) 用于条形编码核酸以用于测序的方法和组合物
CN108026524A (zh) 用于核酸文库标准化的方法和组合物
CN107208158A (zh) 空间上可寻址的分子条形编码
JP7169290B2 (ja) マルチプレットを決定するための合成マルチプレット
JP2021533740A (ja) 単一細胞における核バーコード化および捕捉
JP2021522796A (ja) 反対側の転写物末端における分子バーコーディング
JP2021522797A (ja) ハイスループットマルチオミクスサンプル解析
JP2022511398A (ja) 5’転写物配列の決定
US20180073073A1 (en) Methods and compositions for labeling targets and haplotype phasing
CN110382708A (zh) 使用阻断性寡核苷酸进行选择性扩增
CN109906274A (zh) 用于细胞标记分类的方法
JP2018530998A6 (ja) ライブラリー正規化のための方法および組成物
US20200157600A1 (en) Methods and compositions for whole transcriptome amplification
CN111492068A (zh) 与寡核苷酸相关联的颗粒
JP2024056705A (ja) コンビナトリアルバーコーディングのための方法および組成物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201224

Address after: new jersey

Applicant after: Becton, Dickinson and Co.

Address before: California, USA

Applicant before: Cellular Research, Inc.

GR01 Patent grant
GR01 Patent grant