CN117106871A - 用于分析细胞组分的方法和组合物 - Google Patents

用于分析细胞组分的方法和组合物 Download PDF

Info

Publication number
CN117106871A
CN117106871A CN202310862581.9A CN202310862581A CN117106871A CN 117106871 A CN117106871 A CN 117106871A CN 202310862581 A CN202310862581 A CN 202310862581A CN 117106871 A CN117106871 A CN 117106871A
Authority
CN
China
Prior art keywords
nucleic acid
reporter
analyte
sequence
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310862581.9A
Other languages
English (en)
Inventor
K·L·冈德森
F·J·斯蒂莫斯
J·S·费希尔
R·里加蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Publication of CN117106871A publication Critical patent/CN117106871A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/149Particles, e.g. beads
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/159Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals

Abstract

本发明提供了用于分析细胞组分的方法和组合物。本发明的实施方案涉及分析细胞的组分。在一些实施方案中,本发明涉及分析单细胞的组分。在一些实施方案中,所述方法和组合物涉及测序核酸。在一些实施方案中,所述方法和组合物涉及鉴定和/或定量核酸、蛋白质、细胞器和/或细胞代谢物。

Description

用于分析细胞组分的方法和组合物
本申请是申请日:2016年2月10日,申请号:201680017121.4,发明名称“用于分析细胞组分的方法和组合物”的中国专利申请的分案申请。
技术领域
本申请的实施方案涉及用于分析细胞组分的方法和组合物。在一些实施方案中,本申请涉及用于分析单细胞(single cell)的组分的方法和组合物。在一些实施方案中,本申请涉及用于鉴定单细胞类型的方法和组合物。在一些实施方案中,所述方法和组合物涉及测序核酸。提供的方法和组合物的一些实施方案在得出此类单细胞的复合状态中是有用的。
背景技术
已经使用存在于生物样品中的特定核酸序列的检测,例如,作为用于鉴定和分类微生物、诊断感染性疾病、检测和表征遗传异常、鉴定与癌症相关的遗传变化、研究对疾病的遗传易感性、以及测量对各种类型治疗的反应的方法。用于检测生物样品中特定核酸序列的常见技术是核酸测序。
核酸测序方法已经从由Maxam和Gilbert使用的化学降解法和由Sanger使用的链延长法显著演化。今天,几种测序方法在使用,其允许用于均在单次测序运行中的核酸的并行处理。因此,从单次测序运行产生的信息可能是巨大的。
发明内容
本发明包括以下内容:
1.分析单细胞的至少两个或更多个分析物的方法,所述方法包括:
(a)提供多个邻近保留元件(contiguity preserving elements(CE)),其中每个CE包含单细胞;
(b)在所述CE内裂解所述单细胞,其中在所述单细胞内的所述分析物在所述CE内释放;
(c)向每个CE的所述单细胞内的第一分析物提供第一报告物部分;
(d)向每个CE的所述单细胞内的第二分析物提供第二报告物部分;
(e)修饰所述分析物,使得所述CE的所述第一和第二分析物的至少一些分别包含所述第一和第二报告物部分;
(f)组合包含所述分析物的CE,所述分析物包含所述报告物部分;
(g)将包含所述第一和第二分析物的CE分隔(compartmentalizing)成多个隔室,所述第一和第二分析物分别包含所述第一和第二报告物部分;
(h)向包含每个CE的所述第一报告物部分的所述第一分析物提供第三报告物部分;
(i)向包含每个CE的所述第二报告物部分的所述第二分析物提供第四报告物部分;
(j)进一步修饰所述分析物,使得至少一些第一分析物包含所述第一和第三报告物部分以及至少一些第二分析物包含所述第二和第四报告物部分;
(j)分析每个隔室的包含所述报告物部分的所述分析物,其中此类分析检测单细胞的所述分析物。
2.项1的方法,其中所述第一和第二报告物部分鉴定所述分析物的来源。
3.项1的方法,其中所述报告物部分的组合鉴定所述分析物的来源。
4.项1-3中任一项的方法,其中同时进行所述分析物的检测。
5.项1-4中任一项的方法,所述第一分析物是基因组DNA并且所述第二分析物是cDNA或RNA。
6.项5的方法,其中修饰基因组DNA、cDNA或RNA的至少一些以包含第一和第二报告物部分包括在条件下将基因组DNA、cDNA或RNA与多个转座体(transposome)相接触,每个转座体包含转座酶和包含第一报告物部分或第二报告物部分的转座子序列,使得将所述转座子序列的至少一些插入到所述基因组DNA、cDNA或RNA中。
7.项6的方法,其中步骤(g)还包括从所述基因组DNA、cDNA或RNA除去转座酶。
8.项7的方法,其中在步骤(e)修饰所述分析物后除去所述转座酶。
9.项8的方法,其中除去转座酶包括选自下组的方法:添加去污剂、改变温度、改变pH、添加蛋白质酶、添加蛋白质伴侣(chaperone)、改变盐浓度,以及添加链置换聚合酶。
10.项6的方法,其中步骤(e)包括将目标核酸与多个转座体接触,每个转座子含有包含第一报告物部分的第一转座子序列、与所述第一转座子序列不连续(noncontiguous)的第二转座子序列,以及与所述第一转座子序列和所述第二转座子序列相关的转座酶。
11.项6-10中任一项的方法,其中所述第一转座子序列包含第一引物位点并且所述第二转座子序列包含第二引物位点。
12.项13的方法,其中所述第一引物位点还包含第一条形码(barcode)并且所述第二引物位点还包含第二条形码。
13.项1-12中任一项的方法,其中所述第一、第二、第三,或第四报告物部分包含条形码。
14.项1的方法,其中一个分析物是蛋白质,并且任选地其中用核酸报告物部分标记所述蛋白质,并且进一步任选地其中所述核酸报告物部分包含组合衍生的条形码集。
15.项14的方法,其中所述蛋白质来自单细胞。
16.项1-15中任一项的方法,其中至少再重复一次步骤(c)-(j)。
17.项16的方法,其中每个额外步骤中的额外报告物部分与所述第一、第二、第三,和第四报告物部分不同。
18.分析分析物的方法,所述方法包括:
(a)提供邻近保留元件(CE),其中每个CE包含至少一个分析物;
(b)将包含所述至少一个分析物的所述CE分隔成多个第一隔室;
(c)在所述第一隔室中将第一组报告物部分提供至每个CE的分析物,其中所述第一组报告物部分鉴定CE;
(d)修饰所述分析物,使得所述CE的至少一些分析物包含所述第一报告物部分;
(e)组合包含所述分析物的所述CE,所述分析物包含所述第一报告物部分;
(f)将包含所述分析物的所述CE分隔成多个第二隔室,所述分析物包含所述第一报告物部分;
(g)将第二组报告物部分提供至所述分析物,所述分析物包含每个CE的所述第一报告物部分;
(h)进一步修饰所述分析物,使得至少一些分析物包含所述第二报告物部分;
(i)分析所述分析物,所述分析物包含每个第二隔室的所述第一和第二报告物部分。
19.项18的方法,其中所述分析物包含核酸。
20.项19的方法,其中所述核酸包含DNA。
21.项20的方法,其中所述DNA包含基因组DNA。
22.项19的方法,其中所述核酸包含RNA或cDNA。
23.项18的方法,其中所述分析物选自下组:组织切片、细胞器、脂质、碳水化合物,和细胞代谢物。
24.项19的方法,其中步骤(d)包括在条件下将核酸与多个转座体相接触,每个转座体包含转座酶和包含第一报告物部分的转座子序列,使得将转座子序列的至少一些插入到目标核酸。
25.项19的方法,其中步骤(d)包括将目标核酸与多个转座体相接触,每个转座体含有包含第一报告物部分的第一转座子序列,与所述第一转座子序列不连续的第二转座子序列,以及与第一转座子序列和第二转座子序列相关的转座酶。
26.项19的方法,其中步骤(f)包括从分隔的第一索引化(indexed)模板核酸中除去转座酶。
27.项26的方法,其中在步骤(d)之后除去所述转座酶。
28.项26的方法,其中在步骤(i)之前除去所述转座酶。
29.项26的方法,其中除去转座酶包括选自下组的方法:添加去污剂、改变温度、改变pH、添加蛋白质酶、添加蛋白质伴侣、改变盐浓度,以及添加链置换聚合酶。
30.项24-29中任一项的方法,其中所述第一转座子序列包含第一引物位点并且所述第二转座子序列包含第二引物位点。
31.项30的方法,其中所述第一引物位点还包含第一条形码条形码并且所述第二引物位点还包含第二条形码。
32.项18的方法,其中所述第一报告物部分包含引物,并且其中步骤(d)包括用至少一个引物扩增所述核酸。
33.项18的方法,其中所述第一报告物部分包含引物,并且其中步骤(d)包括用至少一个引物连接所述核酸。
34.项18-33中任一项的方法,其中提供至每个第一隔室的分析物的所述第一报告物部分是不同的。
35.项18-34中任一项的方法,其中所述分析物是单细胞的组分,其中所述第一和/或第二报告物部分中的每个对所述第一细胞是独特的,并且其中所述第一和/或第二报告物部分鉴定单细胞。
36.项18-35中任一项的方法,其还包括在步骤(c)中将质粒提供至CE,其中在步骤(d)-(h)中修饰所述质粒以包含所述第一和/或第二报告物部分,其中包含所述第一或所述所述报告物部分的所述质粒鉴定所述CE。
37.项18的方法,其中所述分析物是蛋白质。
38.项37的方法,其中所述蛋白质来自单细胞。
39.项18-37中任一项的方法,其中至少再重复一次步骤(c)-(h)。
40.项39的方法,其中每个额外步骤中的报告物部分的额外组与报告物部分的所述第一和第二组是不同的。
41.项18的方法,其中所述分析物是mRNA或cDNA。
42.项41的方法,其中所述mRNA或cDNA来自单细胞。
43.项41-42中任一项的方法,其中所述CE包含能够固定所述mRNA或cDNA的固体支持物。
44.项43的方法,其中所述固体支持物包含固定在所述固体支持物上的寡聚物(dT)探针。
45.项41-44中任一项的方法,其中所述第一组报告物部分包含第一条形码序列。
46.项41-45中任一项的方法,其中所述第二组报告物部分包含第二条形码序列。
47.项41-44中任一项的方法,其中步骤(d)包括在条件下将核酸与多个转座体相接触,每个转座体包含转座酶和包含第一报告物部分的转座子序列,使得将转座子序列的至少一些插入到目标核酸。
48.项41-44中任一项的方法,其中步骤(d)包括将目标核酸与多个转座体接触,每个转座子含有包含第一报告物部分的第一转座子序列、与所述第一转座子序列不连续的第二转座子序列,以及与所述第一转座子序列和所述第二转座子序列相关的转座酶。
49.项47-48中任一项的方法,其中所述步骤(f)包括从所述分隔的第一索引化模板核酸除去所述转座酶。
50.项49的方法,其中在步骤(d)之后除去所述转座酶。
51.项49的方法,其中在步骤(i)之前除去所述转座酶。
52.项49的方法,其中除去转座酶包括选自下组的方法:添加去污剂、改变温度、改变pH、添加蛋白质酶、添加蛋白质伴侣、改变盐浓度,以及添加链置换聚合酶。
53.项41-52中任一项的方法,其中所述第一和第二报告物部分鉴定所述分析物的来源。
54.项41-52中任一项的方法,其中所述报告物部分的组合鉴定所述分析物的来源。
55.项41-54的方法,其中至少再重复一次步骤(d)-(i)。
56.项55的方法,其中每个额外步骤中的报告物部分的额外组与报告物部分的所述第一和第二组是不同的。
57.项1-56中任一项的方法,其中所述单细胞与疾病相关。
58.项57的方法,其中所述单细胞与癌症相关。
59.项57的方法,其中所述单细胞与遗传疾病相关。
60.从单细胞中的目标核酸获得序列信息的方法,所述方法包括:
a)将细胞悬浮液导入第一液滴执行器(droplet actuator);
b)使用电极介导的液滴操作以分散包含细胞悬浮液的液滴阵列,每个液滴包含单细胞;
c)将细胞裂解缓冲液导入第二液滴执行器;
c)使用电极介导的液滴操作以分配包含细胞裂解缓冲液的液滴阵列;
d)使用电极介导的液滴操作以组合细胞裂解缓冲液液滴的阵列和细胞悬浮液液滴的阵列以生成细胞裂解物液滴的阵列;
e)将包含第一报告物部分和酶的试剂溶液导入第三液滴执行器,其中至少一个酶能够将所述第一报告物部分导入所述目标核酸,并且其中所述第一报告物部分鉴定所述单细胞;
f)使用电极介导的液滴操作以分配包含试剂溶液的液滴阵列;
g)使用电极介导的液滴操作以组合细胞裂解物液滴的阵列与试剂液滴以生成第一报告物部分液滴的阵列,其中将所述报告物部分导入细胞裂解物液滴的核酸;
h)使用电极介导的液滴操作以分配包含洗涤溶液的液滴阵列;
i)使用电极介导的液滴操作以组合第一报告物部分液滴的阵列与洗涤溶液液滴,其中在反应后从所述核酸除去所述酶以生成包含目标核酸的液滴阵列,其中所述目标核酸包含第一报告物部分;
(j)重复步骤(e)-(i)至少一次,其中后续的试剂溶液包含与所述第一报告物部分不同的报告物部分以生成包含目标核酸的液滴阵列,所述目标核酸包含多个报告物部分;
(k)从所述包含一个或更多个报告物部分的目标核酸获得序列信息并将所述序列信息与所述单细胞相关联。
61.项60的方法,其还包括:
(l)向液滴执行器导入包含对蛋白质特异性的标记物的蛋白质标记试剂溶液;
(m)使用电极介导的液滴操作以分配包含蛋白质标记试剂溶液的液滴阵列;
(n)使用电极介导的液滴操作以将蛋白质标记试剂溶液阵列组合至包含目标核酸的液滴阵列,所述目标核酸包含多个报告物部分,其中来自所述单细胞的蛋白质的至少一部分包含对所述单细胞独特的标记物,并且鉴定包含所述标记物的蛋白质的至少一部分。
62.项61的方法,其中从目标核酸获得序列信息的所述方法与鉴定包含所述标记物的蛋白质的至少一部分同时进行。
63.项60-62中任一项的方法,其中所述目标核酸是RNA。
64.项60-62中任一项的方法,其中所述目标核酸是DNA。
65.项64的方法,其中所述目标核酸是基因组DNA。
66.项60-62中任一项的方法,其中所述目标核酸是RNA和DNA两者。
67.项60-66中任一项的方法,其中通过连接将所述第一报告物部分导入所述目标核酸。
68.项60-67中任一项的方法,其还包括:
(i)将包含对细胞代谢物特异性的报告物部分的试剂溶液导入液滴执行器;
(ii)使用电极介导的液滴操作以分配包含对细胞代谢物特异性的报告物部分的试剂液滴阵列;
(iii)使用电极介导的液滴操作以将所述试剂液滴阵列组合至包含目标核酸的液滴阵列,所述目标核酸包含多个报告物部分,其中细胞代谢物的至少一部分来自所述单细胞,所述单细胞包含对所述单细胞独特的报告物部分,并鉴定所述细胞代谢物的至少一部分。
69.从细胞核酸获得序列信息的方法,所述方法包括:
(a)向固体支持物导入一个或更多个细胞,其中所述固体支持物包含细胞附接部分,并且其中在此类导入后,将所述一个或更多个细胞固定到所述固体支持物;
(b)裂解固定在所述固体支持物上的细胞以生成细胞裂解物;
(c)向所述细胞裂解物的核酸提供报告物部分并修饰所述核酸以生成包含第一报告物部分的核酸;
(d)从包含所述第一报告物部分的所述核酸获得序列信息。
70.项69的方法,其中所述核酸是基因组DNA。
71.项69的方法,其中所述核酸是RNA。
72.项71的方法,还包括将RNA逆转录为cDNA。
73.项69-72中任一项的方法,还包括向步骤(c)的包含第一报告物部分的核酸提供额外的报告物部分,修饰来自步骤(c)的所述核酸以进一步包含一种或多种额外的报告物部分。
74.项73的方法,其中额外的报告物部分与所述第一报告物部分不同。
75.项69-74中任一项的方法,其中所述第一报告物部分对于每个细胞是独特的,使得可以鉴定出包含所述第一索引的核酸的细胞来源。
76.项69-75中任一项的方法,其中所述核酸来自单细胞。
77.项69-76中任一项的方法,其中所述核酸是RNA和DNA两者。
78.项69-77中任一项的方法,其中所述固体支持物选自下组:流动池、珠,和微孔。
79.项69-78中任一项的方法,其中所述细胞附接部分是抗体,其中所述抗体结合细胞表面蛋白质。
80.项69的方法,其中所述抗体是单克隆抗体。
81.项61-62中任一项的方法,其中所述抗体特异性结合对癌细胞特异的细胞表面蛋白质。
82.项69-81中任一项的方法,其还包括用对蛋白质特异的标记物暴露细胞裂解物蛋白质,其中来自所述细胞的蛋白质的至少一部分包括对所述细胞独特的标记物,并且鉴定包含所述标记物的蛋白质的至少一部分。
83.项82的方法,其中鉴定包含所述标记物的蛋白质的至少一部分和从细胞核酸获得序列信息同时完成。
84.项69-83中任一项的方法,其中一个或更多个报告物部分包含至少一个条形码。
85.项69-84中任一项的方法,其中一个或更多个报告物部分包含引物结合位点。
86.项69-85中任一项的方法,其中通过连接来修饰包含所述第一报告物部分的所述核酸。
87.项69-84中任一项的方法,其中通过连接来修饰包含所述一个或更多个额外的报告物部分的所述核酸。
88.项69-87中任一项的方法,所述在获得序列信息前扩增包含所述第一报告物部分的所述修饰的核酸。
89.项69-88中任一项的方法,其中在获得序列信息前扩增包含两个或更多个报告物部分的所述修饰的核酸。
90.项69-88中任一项的方法,其中所述细胞的至少一部分与疾病相关。
91.项90的方法,其中所述细胞的至少一部分与癌症相关。
92.分析细胞组成的方法,所述方法包括:
(a)向固体支持物导入一个或更多个细胞,其中所述固体支持物包括细胞附接部分,并且其中在此类导入后将所述一个或更多个细胞固定至所述固体支持物;
(b)裂解固定在所述固体支持物上的细胞以生成细胞裂解物;
(c)向所述细胞裂解物提供一个或更多个报告物部分,使得所述细胞裂解物内的一个或更多个分析物包含所述一个或更多个报告物部分,其中所述一个或更多个报告物部分鉴定所述细胞;
(d)分析包含所述一个或更多个报告物部分的所述分析物,其中所述分析物鉴定所述细胞并检测所述细胞的组成。
93.项92的方法,其中将单细胞固定至所述固体支持物。
94.项92-93中任一项的方法,其中所述固体支持物选自下组:流动池、珠、和微孔。
95.项92-94中任一项的方法,其中所述细胞附接部分是抗体,其中所述抗体结合细胞表面蛋白质。
96.项95的方法,其中所述抗体是单克隆抗体。
97.项95-96中任一项的方法,其中所述抗体特异性结合对癌细胞特异的细胞表面蛋白质。
98.项90的方法,其中所述分析物选自下组:蛋白质、核酸、细胞器、脂质、碳水化合物,和细胞代谢物。
99.项1-13中任一项的方法,其中所述第一、第二、第三,或第四报告物部分包含引物结合位点。
100.项1-17中任一项的方法,其中所述第一、第二,或这两种分析物是核酸。
101.项100的方法,其中在分析前扩增包含报告物部分的所述核酸。
102.项100-101中任一项的方法,其中通过测序来分析核酸。
附图说明
图1:4层组合索引化,描绘了通过将单细胞内容物包埋入聚合物基质或附接于珠而创建的DNA邻近保留元件(CE)的四层组合索引化(four tier combinatoric indexing)的示意图。在每个组合的合并(pooling)和再分布(redistribution)步骤(层)中附接隔室特异的索引。在所示的示例中,四个层次导致被串联在一起的四个索引(经由连接、聚合酶延伸、标签片段化(tagmentation)等的重复的轮次),使得能够易于测序读出。可选地,包含DNA的邻近保留元件可以通过包封在基质中或固定在珠上的分隔的(compartmentalized)DNA分区(partition)(即对原始DNA样品进行二次抽样的DNA稀释)来创建。稀释的这种类型在定相和组装应用中是有用的。
图2:用于单细胞文库的两层组合索引化,描绘了使用两层组合索引化方案制备单细胞DNA或cDNA文库的方法,其中经由标签片段化(在转座子中的隔室特异的索引)附接第一水平索引,并且通过PCR(在PCR引物上的隔室特异的索引)附接第二层索引。单细胞容器的内容物(即基因组DNA或cDNA)可以采用任选的全基因组扩增(WGA)或全转录组扩增步骤。
图3:在CE(如液滴)中单细胞基因表达,描绘了从在CE例如液滴中的单细胞的内容物制备cDNA文库的方法。在所示实例中,索引正被用于标记不同的样品。
图4:容器中的单细胞内容物,描绘了可以经由提出的组合索引化方案分析的单细胞的代表性内容物。
图5A:邻近元件(CE)的形成,和图5B:由邻近元件(CE)的创建定制的测定,描绘了用于从包封和裂解捕获在CE内例如在聚合物珠内的单细胞的内容物创建邻近保留元件(CE)的示例性示意的实施方案。细胞包埋在例如聚合物珠内。来自单细胞的所有组分在珠中保持彼此接近(proximity)。随后,可以扩增、修饰(cDNA合成)以及随后用索引或标签标记一种或更多种组分。图5C:邻近元件(CE)的形成,描绘了示例性示意的实施方案,其中可以通过在包封、扩增/cDNA、或聚合阶段加入(spiking)编码DNA序列(例如质粒)来完成样品索引化。用不同组的编码质粒或编码质粒的组合制备每个样品。每个组合的索引化的CE将产生相应的编码文库元件的组合的索引化的样品。以这种方式,每个文库元件都可以定位回到其起源CE和起源样品。
图6:单细胞包囊和扩增,描绘了在CE例如聚合物基质珠中包封单细胞内容物的示意图。
图7:通过直接表面捕获的细胞组分的高通量分析,描绘了通过直接表面捕获对细胞组分的高通量分析的示例性示意图。“A”表示细胞的集合。“B”表示表面结合的转座体。在“C”中细胞流到表面上。在“D”中细胞被裂解,并且允许细胞组分以受控的方式在捕获细胞的部位周围扩散。在“E”中,核酸被转座体捕获(标签片段化(tagmented))。取决于细胞膜或细胞核是否裂解,捕获不同的细胞组分。通过使用组分特异的捕获部分(即抗体、受体、配体),可以捕获各种细胞组分。对捕获的分子的分析可以直接在捕获表面上进行。可选地,捕获的分子可以在不同的表面上收获和分析。在这种情况下,第一表面由多个区域(即,垫)组成,并且每个垫涂覆有共享相同条形码的寡聚物,使得捕获在同一垫上的分子将共享相同的识别条形码(identifying barcode)。
图8:流线型CPT-seq:在珠上的工作流程,描绘了在珠上使用邻近保留元件分析核酸的示例性示意图。
图9A-图9D:分别为在基因组DNA中组装重复区域的划分和诱变法、在基因组DNA中组装重复区域的划分和诱变法、在基因组DNA中组装重复区域的划分和诱变法,以及在基因组DNA中组装重复区域的划分和诱变法,其描绘了示例性建模策略。
图10示出了创建颗粒的方法,该颗粒对创建邻近元件是有用的。
具体实施方式
本发明的一些方面涉及与评估保留或包埋或包含在邻近保留元件(CE)内的单细胞的组分有关的方法和组合物。
一方面,本文公开的是用于分析来自单细胞的多个分析物类型的方法。在一些实施方案中,提供了多个邻近保留元件(CE),每个CE包含单细胞。细胞在CE内裂解,使得单细胞内的多个分析物在CE内释放。在一些实施方案中,提供多种类型的报告物部分,使得每种类型的报告物部分对每种类型的分析物是特异性的。在一些实施方案中,报告物部分鉴定单细胞。修饰多个分析物,使得每种类型的分析物包含对分析物类型特异的报告物部分。在一些实施方案中,组合包含分析物的CE,该分析物包含报告物部分。在一些实施方案中,分隔包含分析物的组合的CE,该分析物包含报告物部分。在一些实施方案中,提供额外的报告物部分并与包含分析物的分析物组合,使得分析物包含两个或更多个不同的报告物部分。分析包含报告物部分的分析物,使得检测分析物的身份(identity),并且报告物部分鉴定来自单细胞的分析物的来源。
在一些实施方案中,示例性多个分析物包括但不限于DNA、RNA、cDNA、蛋白质、脂质、碳水化合物、细胞的细胞器(例如细胞核、高尔基体、核糖体、线粒体、内质网、叶绿体、细胞膜、等等)、细胞代谢物、组织切片、细胞、单细胞、来自细胞或来自单细胞的内容物、从细胞或单细胞分离的核酸、或从细胞或单细胞分离并进一步修饰的核酸、或无细胞的DNA(例如,来自胎盘液或血浆)。在一些实施方案中,多个分析物包括基因组DNA和mRNA。在一些实施方案中,mRNA具有poly A尾。在一些实施方案中,将基因组DNA和mRNA同时固定在CE内的固体支持物上。在一些实施方案中,基因组DNA的固定与将mRNA固定至固体支持物是序贯的。在一些实施方案中,将基因组DNA与转座体复合物组合,并将转座子末端固定在固体支持物上,并通过固定在固体支持物上的寡聚体(dT)探针的杂交将mRNA固定至固体。在一些实施方案中,将基因组DNA与转座体复合物组合,并且任选地,转座子末端杂交至固定在固体支持物上的互补序列,使得通过固定在固体支持物上的寡聚体(dT)探针的杂交将mRNA固定至固体。也可以使用其它方法以固定mRNA。在一些实施方案中,固体支持物是珠。在一些实施方案中,固体支持物是流动池表面。在一些实施方案中,固体表面是反应容器的壁。
在一些实施方案中,所述方法包括对在CE内保留或包埋或包含的核酸进行测序。特别地,本文提供的方法和组合物的实施方案涉及制备核酸模板并从其获得序列数据。本文提供的方法和组合物涉及在美国专利申请公开号2002/0208705、美国专利申请公开号2012/0208724和国际专利申请公开WO 02/061832中提供的方法和组合物,每一个通过引用以其全部并入。本发明的一些实施方案涉及在CE内制备DNA以从目标核酸获得定相和序列组装信息,以及从此类模板获得定相和序列组装序列信息。本文提供的具体实施方案涉及使用整合酶,例如转座酶以维持片段化核酸的相关末端的物理接近性;以及使用组合的索引化以从每个CE创建单个文库(individual libraries)。从CE获得单倍型信息包括区分目标核酸中的不同等位基因(例如,SNP、遗传异常等)。此类方法可用于表征目标核酸中的不同等位基因,并减少序列信息中的错误率。
在一个实施方案中,模板核酸可以稀释成CE,例如液滴。可以使用任选的全基因组扩增,并且可以从相当于目标核酸的大约等量单倍型的模板核酸的量获得序列信息。
在进一步的实施方案中,可分隔模板核酸,使得染色体的多个拷贝可以存在于相同的隔室中,作为本文提供的两个或多个索引化的结果,仍然也可以确定单倍型。换句话说,可以使用虚拟隔室制备模板核酸。在此类实施方案中,可以在几个第一隔室之间分布核酸,为每个隔室的核酸提供第一索引,组合核酸,在几个第二隔室之间分布核酸,并为每个隔室的核酸提供第二索引。有利地,与在单个隔室中将核酸仅稀释至相当于核酸单倍型的量相比较,此类索引化使单倍型信息以在核酸的较高浓度上获得。
如本文所使用的,术语“隔室”意指将某物与其它物质分开或分离的区域或体积。示例性隔室包括但不限于小瓶、管、孔、液滴、大药丸(boluses)、珠、容器、表面特征或通过物理力(例如流体流动、磁性、电流等)分开的区域或体积。
用于制造隔室的示例性方法如图10所示。具有柱的硅母板(silicon masterplate)可用于将孔印制到水凝胶片中(水凝胶中的孔是柱的倒像)。水凝胶中的所得孔可以填充与目标分析物或其它试剂一起形成颗粒(例如凝胶或聚合物)的材料。然后可以通过不溶解颗粒的技术溶解水凝胶片。然后可以使用本文所述的方法收集和操纵颗粒。
在本文提供的一些实施方案中,使用转座体制备模板文库。在一些此类文库中,目标核酸可以被片段化。因此,本文提供的一些实施方案涉及用于维持相邻片段的物理邻近性的序列信息的方法。此类方法包括使用整合酶以维持在目标核酸中相邻的模板核酸片段的缔合。有利地,整合酶维持片段化核酸的物理接近性的此类用途增加了来自相同原始分子例如染色体的片段化核酸将在相同隔室中出现的可能性。
本文提供的其它实施方案涉及从核酸的每条链获得序列信息,其可用于降低测序信息中的错误率。可以准备制备模板核酸的文库以从核酸的每条链获得序列信息的方法,使得可以区分每个链,并且还可以区分每条链的产物。
本文提供的一些方法包括分析核酸的方法。此类方法包括制备目标核酸的模板核酸的文库,从模板核酸的文库获得序列数据,以及从此类序列数据组装目标核酸的序列表示。
通常,本文提供的方法和组合物涉及在美国专利申请公开号2002/0208705、美国专利申请公开号2012/0208724和国际专利申请公开号WO 02/061832中提供的方法和组合物,其每一个通过引用以其全部并入。本文提供的方法涉及使用用于将特征插入目标核酸的转座体。此类特征包括片段化位点(fragmentation site)、引物位点、条形码、亲和标签、报告物部分等。
在用于本文提供的实施方案的方法中,模板核酸文库从包含目标核酸的CE制备。通过在整个目标核酸上插入或附加多个独特的条形码来制备文库。在一些实施方案中,每个条形码包括置于其间的具有片段化位点的第一条形码序列和第二条形码序列。第一条形码序列和第二条形码序列可以被鉴定或指定为彼此配对。配对可以是信息性的,使得第一条形码与第二条形码相关联。有利地,配对的条形码序列可用于组装来自模板核酸文库的测序数据。例如,鉴定包含第一条形码序列的第一模板核酸和包含与第一条形码序列配对的第二条形码序列的第二模板核酸指示第一和第二模板核酸表示在目标核酸的序列表示中彼此相邻的序列。此类方法可以用于从头组装目标核酸的序列表示,而不需要参考基因组。
在一些实施方案中,可以使用多重组合条形码编码(combinatorial barcoding),使得来自每个单细胞的目标核酸包含独特的条形码(例如条形码的独特组合),并且可以从来自不同单细胞的不同目标核酸容易地鉴定目标核酸。在一些实施方案中,CE可以包含来自单细胞的目标核酸。在一些实施方案中,CE内的目标核酸将具有不同于不同CE内的目标核酸的可识别的独特的条形码。
在一些实施方案中,除了核酸之外,可以将多重组合标记(combinatoriallabeling)方案用于单细胞内的组分,,例如蛋白质、细胞器、脂质或细胞膜,使得可以与来自不同单细胞的组分鉴定单细胞内的组分。在一些实施方案中,CE可以包含单细胞内的组分。在一些实施方案中,CE内的单细胞的组分将具有不同于不同CE内的单细胞的组分的可识别的独特的标记物。
在一些实施方案中,多重组合条形码编码方案可以用于来自单细胞的目标核酸,并且多重组合标记方案可以一起用于单细胞内的组分。在一些实施方案中,可以在包含单细胞的CE内进行此类组合条形码编码和组合的标记。在一些实施方案中,可以平行地对包含单细胞的多个CE进行此类组合条形码编码和组合标记。
在一些实施方案中,可以测序保留、包埋、固定或包含在CE内的蛋白质。在一些实施方案中,此类蛋白质是独特标记的。在一些实施方案中,可以通过本领域已知的方法鉴定保留、包埋、固定或包含在CE内的蛋白质。在一些实施方案中,可以与收集核酸的序列信息一起进行蛋白质的鉴定和/或测序。
如本文所用的,术语“核酸”和/或“寡核苷酸”和/或其语法等同物可以指连接在一起的至少两个核苷酸单体。核酸通常可以含有磷酸二酯键;然而,在一些实施方案中,核酸类似物可以具有其它类型的骨架,包括,例如磷酰胺(Beaucage等人,Tetrahedron,49:1925(1993);Letsinger,J.Org.Chem.,35:3800(1970);Sprinzl等人,Eur.J.Biochem.,81:579(1977);Letsinger等人,Nucl.Acids Res.,14:3487(1986);Sawai等人,Chem.Lett.,805(1984),Letsinger等人,J.Am.Chem.Soc.,110:4470(1988);和Pauwels等人,ChemicaScripta,26:141(1986)),硫代磷酸酯(Mag等人,19:1437(1991);和美国专利号5,644,048),二硫代磷酸酯(Briu等人,J.Am.Chem.Soc.,111:2321(1989)),O-甲基亚磷酰胺连接(参见Eckstein;Oligonucleotides and Analogues:A Practical Approach,OxfordUniversity Press),和肽核酸骨架和连接(参见Egholm,J.Am.Chem.Soc.,114:1895(1992);Meier等人,Chem.Int.Ed,Engl,31:1008(1992);Nielsen,Nature,365:566(1993);Carlsson等人,Nature,380:207(1996))。上述参考文献通过引用并入本文。
其它类似核酸包括具有以下的那些:正电荷骨架(Denpcy等人,Proc.Natl.Acad.Sci.USA,92:6097(1995));非离子型骨架(美国专利号5,386,023;5,637,684;5,602,240;5,216,141;和4,469,863;Kiedrowshi等人,Angew.Chem.Intl.Ed.English,30:423(1991);Letsinger等人,J.Am.Chem.Soc.110:4470(1988);Letsinger等人,Nucleosides&Nucleotides,13:1597(1994);第2章和第3章,ASCSymposium Series 580,“Carbohydrate Modifications in Antisense Research”,Ed.Y.S.Sanghui和P.Dan Cook;Mesmaeker等人,Bioorganic&Medicinal Chem.Lett,4:395(1994);Jeffs等人,J.Biolecularlecular NMR,34:17(1994);Tetrahedron Lett,31:7433(1996))和非核糖(美国专利号5,235,033和5,034,506,和第6和7章,ASC SymposiumSeries 580,“Carbohydrate Modifications in Antisense Research”,Ed.Y.S.Sanghui和P.Dan Coo)。核酸还可以含有一种或多种碳环糖(参见Jenkins等人,Chem.Soc.Rev.,(1995)pp.169,176)。以上参考文献通过引用并入本文。
可以进行核糖-磷酸骨架的修饰以促进额外的部分例如标记物的添加,或者在某些条件下提高此类分子的稳定性。此外,可以制备天然存在的核酸和类似物的混合物。可选地,可以制备不同核酸类似物的混合物,以及天然存在的核酸和类似物的混合物。核酸可以是单链或双链,如指定的,或包含双链或单链序列二者的一部分。核酸可以是DNA,例如基因组或cDNA、RNA或杂合物,其来自单细胞、多细胞,或来自多个物种,如具有宏基因组的样品,例如来自环境样品,还来自混合样品例如混合的组织样品或用于相同物种的不同个体的混合样品,疾病样品如癌症相关核酸等。核酸可以包含脱氧核糖核苷酸和核糖核苷酸的任何组合,以及碱基的任何组合,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤和碱基类似物如硝基吡咯(包括3-硝基吡咯)和硝基吲哚(包括5-硝基吲哚)等。
在一些实施方案中,核酸可以包括至少一个混杂的碱基(promiscuous base)。混杂的碱基可以与多于一种不同类型的碱基进行碱基配对。在一些实施方案中,混杂的碱基可以与至少两种不同类型的碱基和不超过三种不同类型的碱基进行碱基配对。混杂的碱基的实例包括可以与腺嘌呤、胸腺嘧啶或胞嘧啶配对的肌苷。其它实例包括次黄嘌呤、5-硝基吲哚、无环5-硝基吲哚、4-硝基吡唑、4-硝基咪唑和3-硝基吡咯(Loakes等人,Nucleic AcidRes.22:4039(1994);Van Aerschot等人,Nucleic Acid Res.23:4363(1995);Nichols等人,Nature 369:492(1994);Bergstrom等人,Nucleic Acid Res.25:1935(1997);Loakes等人,Nucleic Acid Res.23:2361(1995);Loakes等人,J.Mol.Biol.270:426(1997);和Fotin等人,Nucleic Acid Res.26:1515(1998))。也可以使用与至少三种、四种或更多种类型的碱基进行碱基配对的混杂的碱基。以上参考文献通过引用并入本文。
如本文所用的,术语“核苷酸类似物”和/或其语法等同物可以指具有修饰的核苷酸碱基部分、修饰的戊糖部分,和/或修饰的磷酸酯部分,并且,在多核苷酸的情况下,修饰的核苷酸间连接(internucleotide linkage)的合成类似物,如通常其它地方所述(例如,Scheit,Nucleotide Analogs,John Wiley,New York,1980;Englisch,Angew.Chem.Int.Ed.Engl.30:613-29,1991;Agarwal,Protocols for Polynucleotidesand Analogs,Humana Press,1994;以及S.Verma和F.Eckstein,Ann.Rev.Biochem.67:99-134,1998)。通常,修饰的磷酸酯部分包含磷酸酯的类似物,其中磷原子处于+5氧化态,并且一个或更多个氧原子被非氧部分例如硫替代。示例性的磷酸酯类似物包括但不限于硫代磷酸酯、二硫代磷酸酯、磷酸硒酸酯、磷酸二硒酸酯、苯胺磷酸硫醇酯(Phosphoroanilothioate)、苯胺磷酸酯(Phosphoranilidate)、氨基磷酸酯、硼酸磷酸盐,包括相关的抗衡离子(counter ion)、例如H+、NH4 +、Na+(如果存在这种抗衡离子)。修饰的核苷酸碱基部分实例包括但不限于5-甲基胞嘧啶(5mC);C-5-丙炔基类似物,包括但不限于,C-5丙炔基-C和C-5丙炔基-U;2,6-二氨基嘌呤,也称为2-氨基腺嘌呤或2-氨基-dA);次黄嘌呤、假尿苷、2-硫代嘧啶、异胞嘧啶(isoC)、5-甲基异胞嘧啶和异鸟嘌呤(isoG;参见,例如美国专利号5,432,272)。示例性的修饰的戊糖部分包括但不限于,锁定核酸(LNA)类似物,包括但不限于Bz-A-LNA、5-Me-Bz-C-LNA、dmf-G-LNA和T-LNA(参见,例如The Glen Report,16(2):5,2003;Koshkin等人,Tetrahedron 54:3607-30,1998),和2'-或3'-修饰,其中2'-或3'-位是氢、羟基、烷氧基(例如甲氧基、乙氧基、烯丙氧基、异丙氧基、丁氧基、异丁氧基和苯氧基)、叠氮基、氨基、烷基氨基、氟、氯或溴。修饰的核苷酸间连接包括磷酸酯类似物,具有非手性和不带电的亚基间连接的类似物(例如,Sterchak,E.P.等人,Organic Chem.,52:4202,1987),和具有非手性亚基间键的不带电荷的吗啉基聚合物(参见,例如美国专利号5,034,506)。一些核苷酸间连接类似物包括吗啉酸、缩醛、和聚酰胺连接的杂环。在一类核酸类似物,称为肽核酸,包括假互补肽核酸(“PNA”)中,常规的糖和核苷酸间连接已用2-氨基乙基甘氨酰胺骨架聚合物替代(参见,例如Nielsen等人,Science,254:1497-1500,1991;Egholm等人,J.Am.Chem.Soc.,114:1895-1897 1992;Demidov等人,Proc.Natl.Acad.Sci.99:5953-58,2002;Peptide Nucleic Acids:Protocols andApplications,Nielsen,ed.,Horizon Bioscience,2004)。以上参考文献通过引用并入本文。
如本文所使用的,术语“测序读取(sequencing read)”和/或其语法等同物可以指进行物理或化学步骤的重复过程以获得指示聚合物中单体的顺序的信号。信号可以在单个单体分辨率或更低分辨率下指示单体的顺序。在具体实施方案中,可以在核酸目标上开始步骤并进行以获得指示核酸目标中碱基顺序的信号。该过程可以进行至其典型的完成,其通常由下述点定义,在该点上来自过程的信号不再能以确定的合理水平将目标的碱基区分。如果需要,可以更早地发生完成,例如,一旦获得所需量的序列信息。可以在单个目标核酸分子上或同时在具有相同序列的目标核酸分子群上,或同时在具有不同序列的目标核酸群上进行测序读取。在一些实施方案中,当不再从开始信号获取的一个或更多个目标核酸分子获得信号时,终止测序读取。例如,可以对存在于固相基板(solid phase substrate)上的一个或更多个目标核酸分子开始测序读取,并在从基板中除去一个或更多个目标核酸分子后终止。可以通过在其它情况下停止当测序运行开始时存在于基板上的目标核酸的检测来终止测序。
如本文所用的,术语“测序表示(seqencing representation)”和/或其语法等同物可以指表明聚合物中单体单元的顺序和类型的信息。例如,该信息可以指示核酸中核苷酸的顺序和类型。该信息可以是各种形式中的任一种,包括例如绘图、图像、电子介质、一系列符号、一系列数字、一系列字母、一系列颜色等。该信息可以是以单个单体分辨率或以更低的分辨率。示例性聚合物是具有核苷酸单元的核酸,例如DNA或RNA。一系列“A”、“T”、“G”和“C”字母是对DNA的众所周知的序列表示,该DNA可以以单核苷酸分辨率与DNA分子的实际序列相关。其它示例性聚合物是具有氨基酸单元的蛋白质和具有糖单元的多糖。
如本文所用的,术语“至少一部分”和/或其语法等同物可以指总量的任何分数(fraction)。例如,“至少一部分”可以指总量的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%、99.9%或100%。
如本文所使用的,术语“检测”和/或其语法等同物可以指鉴定分析物的在场或存在(presence or existence),鉴定分析物的各个组分(individual component),例如序列信息,和/或定量这种分析物的量。
片段化位点(Fragmentation site)
在包含环状转座体的一些实施方案中,接头(linker)可以包含片段化位点。可以使用片段化位点以切割第一条形码序列和第二条形码序列之间的物理的,而不是信息的关联。切割可能是通过生化、化学或其它方式。在一些实施方案中,片段化位点可以包括可以通过各种方式片段化的核苷酸或核苷酸序列。例如,片段化位点可以包含限制性内切核酸酶位点;用RNA酶可切割的至少一个核糖核苷酸;在某些化学试剂存在下可切割的核苷酸类似物;通过用高碘酸盐处理可切割的二醇连接;用化学还原剂可切割的二硫键;可以经受光化学切割的可切割的部分;以及用肽酶或其它合适方式可切割的肽。参见例如,美国专利申请公开号2002/0208705,美国专利申请公开号2012/0208724和国际专利申请公开号WO 02/061832,其每一个通过引用以其全部并入。
引物位点
在一些实施方案中,报告物部分可以包含可与引物杂交的引物位点。在一些实施方案中,报告物部分可以包括用于扩增、测序等的至少一个第一引物位点。
在一些实施方案中,转座子序列可以包括“测序衔接子(sequencing adaptor)”或“测序衔接子位点”,也就是说包含可以杂交至引物的一个或更多个位点的区域。在一些实施方案中,转座子序列可以包括用于扩增、测序等的至少一个第一引物位点。在包含环状转座体的一些实施方案中,接头可以包括测序衔接子。在包含环状转座体的更多实施方案中,接头包含至少第一引物位点和第二引物位点。在此类实施方案中引物位点的方向可以是使得杂交至第一引物位点的引物和与杂交至第二引物位点的引物处于相同的方向或不同方向。
在一些实施方案中,接头可以包括第一引物位点、第二引物位点,具有置于其间的不可扩增位点。不可扩增位点对阻断第一和第二引物位点之间的多核苷酸链的延伸是有用的,其中多核苷酸链杂交至引物位点之一。不可扩增的位点对防止串联体(concatamer)也是有用的。不可扩增位点的实例包括核苷酸类似物、非核苷酸化学部分、氨基酸、肽和多肽。在一些实施方案中,不可扩增位点包含不与A、C、G或T显著碱基配对的核苷酸类似物。一些实施方案包括包含第一引物位点的接头、第二引物位点,具有置于其间的片段化位点。其它实施方案可以使用用于定向测序的叉形或Y形衔接子设计,如美国专利号7,741,463中所述的,其公开通过引用以其整体并入本文。
引物结合位点的示例性序列包括但不限于AATGATACGGCGACCACCGAGATCTACAC(P5序列)和CAAGCAGAAGACGGCATACGAGAT(P7序列)。
报告物部分
如本文所用的,术语“报告物部分”和语法等同物可以指能够确定所研究的分析物的组成(composition)、身份和/或来源的任何可识别的标签、标记物、索引、条形码或基团。
本领域技术人员将理解,可以将许多不同种类的报告物部分用于本文所述的方法和组合物,单独或与一种或更多种不同的报告物部分组合。在一些实施方案中,可以使用多于一种不同的报告物部分以同时分析多于一种的分析物。在一些实施方案中,可以同时使用多个不同的报告物部分以独特地鉴定单细胞或单细胞的组分。
在某些实施方案中,报告物部分可以发射信号。信号的实例包括但不限于荧光、化学发光、生物发光、磷光、放射性、量热、离子活性、电或电化学发光信号。实例报告物分子列于例如美国专利申请公开号2002/0208705、美国专利申请公开号2012/0208724和国际专利申请公开号WO 02/061832,其每一个通过引用以其全部并入。
在一些实施方案中,报告物部分可以是衔接子。在本文所述的组合物和方法的一些实施方案中,转座子序列可以包括报告物部分。在包含环状转座体的一些实施方案中,接头或衔接子可以包含报告物部分。
在一些实施方案中,报告物部分可以不发射信号。在一些实施方案中,报告物部分可以是核酸片段,例如条形码、独特的分子索引、质粒。在一些实施方案中,报告物部分可以包含特异性结合蛋白质的抗体。在一些实施方案中,抗体可以包含可检测标记。在一些实施方案中,报告物可以包括用核酸标签标记的抗体或亲和试剂。核酸标签可以例如经由接近连接测定法(PLA)或接近延伸测定法(PEA)来检测。
在一些实施方案中,可以使用一组报告物部分。在一些实施方案中,该组报告物部分可以包含报告物部分的亚组的混合物,其中报告物部分的每个亚组对不同类型的分析物,例如蛋白质、核酸、脂质、碳水化合物是特异的。在一些实施方案中,该组报告物部分可以包含报告物部分的亚组的混合物,其中报告物部分的每个亚组彼此不同,但对相同类型的分析物是特异性的。
条形码
通常,条形码可以包括可用于鉴定本文所述或本领域已知的一种或更多种特定分析物(例如核酸、蛋白质、代谢物或其它分析物)的一个或更多个核苷酸序列。条形码可以是人工序列,或者可以是在转座期间产生的天然存在的序列,例如在以前毗连(juxtaposed)的DNA片段的末端的相同的侧翼基因组DNA序列(g-码)。条形码可以包括至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个连续的核苷酸。在一些实施方案中,条形码包含至少约10、20、30、40、50、60、70、80、90、100或更多个连续核苷酸。在一些实施方案中,在包含条形码的核酸群中的条形码的至少一部分是不同的。在一些实施方案中,条形码的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%是不同的。在更多此类实施方案中,所有条形码是不同的。在包含条形码的核酸群中不同条形码的多样性可以随机生成或非随机生成。
在一些实施方案中,转座子序列包含至少一个条形码。在一些实施方案中,例如包含两个不连续转座子序列的转座体,第一转座子序列包含第一条形码,和第二转座子序列包括第二条形码。在一些实施方案中,例如在环状转座体中,转座子序列包含条形码,该条形码包含第一条形码序列和第二条形码序列。在前述实施方案的一些中,可以鉴定或指定第一条形码序列以与第二条形码序列配对。例如,可以知晓,使用包含已知彼此配对的多个第一和第二条形码序列的参考表,已知的第一条形码序列与已知的第二条形码序列配对。
在另一实例中,第一条形码序列可以包含与第二条形码序列相同的序列。在另一实例中,第一条形码序列可以包含第二条形码序列的反向互补物。在一些实施方案中,第一条形码序列和第二条形码序列是不同的。第一和第二条形码序列可以包含双码。
在本文所述的组合物和方法的一些实施方案中,条形码用于模板核酸的制备。如将理解的,大量可用的条形码允许每个模板核酸分子包含独特标识(uniqueIdentification)。模板核酸混合物中每个分子的独特标识可用于多种应用。例如,在具有多个染色体的样品中、在基因组中、在细胞中、在细胞类型中、在细胞疾病状态中和在物种中,例如在单倍型测序中、在亲代等位基因鉴别中、在宏基因组测序中,和在基因组样品测序中,可以将独特识别的分子用于鉴定个体核酸分子(individual nucleic acidmolecule)。示例性条形码序列包括但不限于TATAGCCT、ATAGAGGC、CCTATCCT、GGCTCTGA、AGGCGAAG、TAATCTTA、CAGGACGT和GTACTGAC。
接头
包含环状转座体的一些实施方案包含转座子序列,该转座子序列包含第一条形码序列和第二条形码序列,具有置于其间的接头。在其它实施方案中,接头可以不存在,或可以是将一个核苷酸连接到另一个核苷酸的糖-磷酸骨架。接头可包含例如核苷酸、核酸、非核苷酸化学部分、核苷酸类似物、氨基酸、肽、多肽或蛋白质中的一种或更多种。在优选的实施方案中,接头包含核酸。接头可包含至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在一些实施方案中,接头可以包含至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500或更多个核苷酸。
在一些实施方案中,接头可以例如通过PCR、滚环扩增、链置换扩增等可扩增。在其它实施方案中,接头可以包含不可扩增部分。不可扩增接头的实例包括有机化学接头如烷基、丙基、PEG;非天然碱基,如IsoC、isoG;或在基于DNA的扩增方案中不扩增的任何基团。例如,含有isoC、isoG对的转座子可以用缺乏互补isoG和isoC的dNTP混合物扩增,确保跨越插入的转座子不发生扩增。
在一些实施方案中,接头包含单链核酸。在一些实施方案中,接头以5'-3'方向、5'-5'方向或3'-3'方向偶联转座子序列。
亲和标签
在一些实施方案中,转座子序列可以包含亲和标签。在包含环状转座体的一些实施方案中,接头可以包含亲和标签。亲和标签可用于各种应用,例如杂交至杂交标签的目标核酸的大量分离。额外的应用包括但不限于,例如,使用亲和标签用于纯化转座酶/转座子复合物和转座子插入目标DNA、目标RNA或目标蛋白质。如本文所用的,术语“亲和标签”和语法等同物可以指多组分复合物的组分,其中多组分复合物的组分特异性地相互作用或彼此结合。例如,亲和标签的实例可以包含分别结合链霉抗生物素蛋白质或镍的生物素或多聚His(poly-His)。列出了多组分亲和标签复合物的其它实例,例如美国专利申请公开号2002/0208705、美国专利申请公开号2012/0208724和国际专利申请公开号WO 02/061832,其每一个通过引用以其全部并入。
固体支持物
固体支持物可以是二维或三维的并且可以包括平面表面(例如,载玻片)或可以成形。固体支持物可以包括玻璃(例如、受控孔玻璃(CPG))、石英、塑料(例如聚苯乙烯(低交联和高交联聚苯乙烯)、聚碳酸酯、聚丙烯和聚(甲基丙烯酸甲酯))、丙烯酸共聚物、聚酰胺、硅、金属(例如,链烷硫醇(alkanethiolate)衍生的金)、纤维素、尼龙、胶乳、葡聚糖、凝胶基质(例如硅胶)、聚丙烯醛(polyacrolein)或复合材料。
合适的三维固体支持物包括,例如,球、微粒、珠、纳米颗粒、聚合物基质例如琼脂糖、聚丙烯酰胺、藻酸盐、膜、载玻片、平板、微机械加工的芯片、管(例如,毛细管)、微孔、微流体装置、通道、过滤器、流动池、适于固定核酸、蛋白质或细胞的结构。固体支持物可以包含能够具有包含模板核酸或引物的群的区域的平面阵列或基质。实例包括核苷衍生的CPG和聚苯乙烯载玻片;衍生的磁性载玻片;用聚乙二醇接枝的聚苯乙烯等。
在一些实施方案中,固体支持物包含微球或珠。本文中的“微球”或“珠”或“颗粒”或语法等效物是指小的离散颗粒。合适的珠组合物包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸聚合物、顺磁性材料、氧化钍溶胶、碳石墨、二氧化钛、胶乳或交联的葡聚糖,如琼脂糖(Sepharose)、纤维素、尼龙、交联胶束和聚四氟乙烯,以及用于固体支持物的本文概述的任何其它材料都可以使用。来自Bangs Laboratories,Fishers Ind.的“Microsphere Detection Guide”是一个有用的指南。在某些实施方案中,微球是磁性微球或珠。在一些实施方案中,珠可以是彩色编码的。例如,可以使用来自Luminex,Austin,TX的微球。
珠不需要是球形的;可以使用不规则的颗粒。可选地或额外地,珠可以是多孔的。珠的尺寸范围为从纳米,即,100纳米,至以毫米,即1mm,具有从约0.2微米至约200微米的珠是优选的,以及从约0.5至约5微米是特别优选的,尽管在一些实施方案中可以使用更小或更大的珠。在一些实施方案中、珠在直径上可以是约1、1.5、2、2.5、2.8、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、15或20μm。
在一些实施方案中,珠可以包含抗体或其它亲和探针(参见mmobilizedBiomolecules in Analysis.A Practical Approach.Cass T,Ligler F S,eds.OxfordUniversity Press,New York,1998.pp 1-14,通过引用并入本文,用于典型的附接方案)。在一些实施方案中,抗体可以是单克隆的,在其它实施方案中,抗体可以是多克隆的。在一些实施方案中,抗体可以对细胞表面表位是特异的。在一些实施方案中,抗体可以对细胞内的蛋白质是特异的。
在一些实施方案中,本文提供的核酸模板可以附接至固体支持物。可以使用本领域众所周知的各种方法将核酸附接、锚定或固定至固体支持物的表面。
分析物
分析物是研究其功能、组成、身份和/或其来源的生物分子。示例性分析物包括但不限于DNA、RNA、cDNA、蛋白质、脂质、碳水化合物、细胞的细胞器(例如核、高尔基体、核糖体、线粒体、内质网、叶绿体、细胞膜等)、细胞代谢物、组织切片、细胞、单细胞、来自细胞或来自单细胞的内容物、从细胞或单细胞分离的核酸,或从细胞或单细胞分离并进一步修饰的核酸,或无细胞的DNA(例如,来自胎盘液或血浆)。
目标核酸
目标核酸可以包括感兴趣的任何核酸。在一个实施方案中,目标核酸可以包括包含、捕获、包埋或固定在CE中的感兴趣的任何核酸,该CE例如基质、液滴、乳剂、固体支持物,或隔室,其在内部保持核酸邻近但允许对液体和酶试剂的可及性。目标核酸可以包括DNA、cDNA、WGA的产物、RNA、肽核酸、吗啉代核酸、锁定核酸、二醇核酸、苏糖核酸、核酸的混合样品、多倍性DNA(即,植物DNA)、其混合物、以及其杂合体(hybrid)。在优选的实施方案中,使用基因组DNA片段或其扩增的拷贝作为目标核酸。在另一个优选的实施方案中,使用cDNA、线粒体DNA或叶绿体DNA。
目标核酸可以包含任何核苷酸序列。在一些实施方案中,目标核酸包含均聚物序列。目标核酸还可以包括重复序列。重复序列可以是各种长度中的任何一种,包括例如2、5、10、20、30、40、50、100、250、500或1000个核苷酸或更多个核苷酸。重复序列可以是重复的,连续地或不连续地,各种次数的任一个包括例如2、3、4、5、6、7、8、9、10、15或20次或更多。
本文所述的一些实施方案可以利用单个目标核酸。其它实施方案可以利用多个目标核酸。在此类实施方案中,多个目标核酸可以包括多个相同的目标核酸,其中一些目标核酸是相同的多个不同的目标核酸,或其中所有目标核酸是不同的多个目标核酸。利用多个目标核酸的实施方案可以以多重形式进行,使得试剂同时递送至目标核酸,例如在一个或更多个室中或在阵列表面上。在一些实施方案中,多个目标核酸可以包括基本上所有特定生物体的基因组。多个目标核酸可以包括特定生物体基因组的至少一部分,包括例如基因组的至少约1%、5%、10%、25%、50%、75%、80%、85%、90%、95%或99%。在具体实施方案中,该部分可以具有基因组的至多约1%、5%、10%、25%、50%、75%、80%、85%、90%、95%或99%的上限。
目标核酸可以从任何来源获得。例如,目标核酸可以从获自单个生物体的核酸分子或从获自包含一种或多种生物体的天然来源的核酸分子的群制备。核酸分子的来源包括但不限于细胞器、细胞、组织、器官或生物体。可用作目标核酸分子来源的细胞可以是原核的(细菌细胞,例如埃希氏菌属、芽孢杆菌属、沙雷氏菌属、沙门氏菌属、葡萄球菌属、链球菌属、梭菌属、衣原体属、奈瑟球菌属、螺旋体虫属、支原体属、疏螺旋体属、军团菌属、假单胞菌属、分枝杆菌、螺杆菌属、欧文氏菌属、土壤杆菌属、根瘤菌属和链霉菌属);古细菌(archeaon),例如泉古菌(crenarchaeota)、纳古生菌(nanoarchaeota)或广古菌门(euryarchaeotia);或真核生物如真菌(例如酵母)、植物、原生动物和其它寄生虫,以及动物(包括昆虫(例如果蝇属物种)、线虫(例如秀丽隐杆线虫)),和哺乳动物(例如大鼠、小鼠、猴、非人类灵长类和人类)。
为了某些感兴趣的序列可以使用本领域众所周知的各种方法富集目标核酸和模板核酸。此类方法的实例在国际公开号WO/2012/108864中提供,其通过引用以其全部并入本文。在一些实施方案中,在制备模板文库的方法期间可以进一步富集核酸。例如,对于某些序列,可以在转座体的插入之前、在转座体的插入之后和/或核酸的扩增之后富集核酸。
此外,在一些实施方案中,目标核酸和/或模板核酸可以是高度纯化的,例如,在用于本文提供的方法之前,核酸可以是至少约70%、80%、90%、95%、96%、97%、98%、99%或100%不含污染物。在一些实施方案中,使用本领域已知的保持目标核酸的质量和大小的方法是有益的,例如可以使用琼脂糖栓(agarose plug)进行目标DNA的分离和/或直接转座。
在一些实施方案中,目标核酸可以获自生物样品或患者样品。如本文使用的术语“生物样品”或“患者样品”包括例如一个或更多个细胞、组织或体液的样品。“体液”可以包括但不限于血液、血清、血浆、唾液、脑脊髓液、胸膜液、眼泪、乳腺导管液、淋巴、痰、尿液、羊水或精液。样品可以包括是“无细胞(acellular)”的体液。“无细胞体液”包括小于约1%(w/w)的全细胞材料。血浆或血清是无细胞体液的实例。样品可以包括天然或合成来源的样本(specimen)(即,制成是无细胞的细胞样品)。
如本文所用的,术语“血浆”是指在血液中发现的无细胞液。通过本领域已知的方法(例如,离心、过滤等)从血液中除去全细胞材料可以从血液获得“血浆”。
制备模板核酸的某些方法
一些实施方案包括制备模板核酸的方法。如本文所用的,“模板核酸”可以指用于获得序列信息的底物(substrate)。在一些实施方案中,模板核酸可以包括目标核酸、其片段,或其任何拷贝,包含至少一个转座子序列,其片段,或其任何拷贝。在一些实施方案中,模板核酸可以包括包含测序衔接子的目标核酸,例如测序引物位点。在一些实施方案中,CE可以包含目标核酸。
制备模板核酸的一些方法包括将转座子序列插入目标核酸中,从而制备模板核酸。一些插入的方法包括在足以用于一种或多种转座子序列整合入目标核酸中的条件下,在酶例如转座酶或整合酶存在下使本文提供的转座子序列与目标核酸接触。在一些实施方案中,CE可以包含此类目标核酸。
在一些实施方案中,将转座子序列插入目标核酸中可以是非随机的。在一些实施方案中,转座子序列可以与包含在某些位点抑制整合的蛋白质的目标核酸接触。例如,可以抑制转座子序列整合到包含蛋白质的基因组DNA、包含染色质的基因组DNA、包含核小体的基因组DNA、或包含组蛋白质的基因组DNA中。在一些实施方案中,转座子序列可以与亲和标签相关联,以便在特定的序列将转座子序列整合到目标核酸中。例如,转座子序列可以与靶向特定核酸序列的蛋白质相关联,例如组蛋白质、染色质结合蛋白质、转录因子、起始因子等,以及结合到特定的序列特异性核酸结合蛋白质的抗体或抗体片段。在示例性实施方案中,转座子序列与亲和标签例如生物素相关联;亲和标签可以与核酸结合蛋白质相关联。在一些实施方案中,CE可以包含此类目标核酸。
应当理解,在将一些转座子序列整合到目标核酸中期间,在整合位点处的目标核酸的几个连续核苷酸在整合产物中是重复的(duplicated)。因此,整合的产物可以在目标核酸中在整合序列的每个末端包括重复的序列。如本文所用的,术语“宿主标签”或“g标签”可以指在整合的转座子序列的每个末端是重复的目标核酸序列。可以通过转座子序列的插入产生的核酸的单链部分可以通过本领域众所周知的多种方法进行修复,例如通过使用连接酶、寡核苷酸和/或聚合酶。
在一些实施方案中,将本文提供的多个转座子序列插入目标核酸中。一些实施方案包括选择足以实现将多个转座子序列整合到目标核酸中的条件,使得每个整合的转座子序列之间的平均距离在目标核酸中包含一定数目的连续核苷酸。
一些实施方案包括选择足以实现将一种或多种转座子序列插入目标核酸中而不是插入另一种或多种转座子序列中的条件。可以使用多种方法来降低转座子序列插入另一个转座子序列中的可能性。可以在例如美国专利申请公开号2002/0208705、美国专利申请公开号2012/0208724和国际专利申请公开号WO 02/061832中找到用于本文提供的实施方案的此类方法的实例,其每一个通过引用以其全部并入。
在一些实施方案中,可以选择条件,使得整合的转座子序列之间的目标核酸中的平均距离为至少约5、10、20、30、40、50、60、70、80、90、100或更多连续核苷酸。在一些实施方案中,整合的转座子序列之间的目标核酸中的平均距离为至少约100、200、300、400、500、600、700、800、900、1000或更多连续的核苷酸。在一些实施方案中,整合的转座子序列之间的目标核酸中的平均距离为至少约1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、90kb、100kb,或更多连续的核苷酸。在一些实施方案中,整合的转座子序列之间的目标核酸中的平均距离为至少约100kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kb、1000kb,或更多连续的核苷酸。如将理解的,可以选择的一些条件包括将目标核酸与一定数量的转座子序列接触。
本文所述的方法的一些实施方案包括选择足以实现将转座子序列的至少一部分整合到不同的目标核酸中的条件。在本文所述的方法和组合物的优选实施方案中,整合到目标核酸中的每个转座子序列是不同的。可以选择以实现转座子序列的某一部分整合到不同的目标序列中的一些条件包括选择转座子序列群的多样性程度。如将理解的,转座子序列的多样性部分地由于此类转座子序列的条形码的多样性而产生。因此,一些实施方案包括提供其中条形码的至少一部分是不同的转座子序列群。在一些实施方式中,在转座子序列群中条形码的至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或100%是不同的。在一些实施方案中,整合入目标核酸中的转座子序列的至少一部分是相同的。
制备模板核酸的一些实施方案可以包括复制包含目标核酸的序列。例如,一些实施方案包括将引物杂交至整合到目标核酸中的转座子序列的引物位点。在一些此类实施方案中,可以将引物杂交至引物位点并延伸。复制的序列可以包括至少一个条形码序列和目标核酸的至少一部分。在一些实施方案中,拷贝的序列可以包括第一条形码序列、第二条形码序列、以及置于其间的目标核酸的至少一部分。在一些实施方案中,至少一个复制的核酸可以包括可被鉴定或指定为与第二复制核酸的第二条形码序列配对的第一复制核酸的至少第一条形码序列。在一些实施方案中,引物可以包括测序引物。在一些实施方案中,使用测序引物获得测序数据。在更多的实施方案中,包含引物位点的衔接子可以连接至核酸的每个末端,并且从此类引物位点扩增核酸。
制备模板核酸的一些实施方案可以包括扩增包含一个或更多个转座子序列的至少一部分和目标核酸的至少一部分的序列。在一些实施方案中,目标核酸的至少一部分可以使用杂交至整合到目标核酸中的整合转座子序列的引物位点的引物进行扩增。在一些此类实施方案中,扩增的核酸可以包括第一条形码序列和第二条形码序列,其间置有目标核酸的至少一部分。在一些实施方案中,至少一个扩增的核酸可以包括可被鉴定为与第二扩增序列的第二条形码序列配对的第一扩增核酸的至少第一条形码序列。
制备模板核酸的一些方法包括插入包含单链接头的转座子序列。在一个实例中,将转座子序列(ME-P1-接头-P2-ME;镶嵌末端(mosaic end)-引物位点1-接头-引物位点2-镶嵌末端)插入到目标核酸中。可以延伸和扩增具有插入的转座子/接头序列的目标核酸。
在本文所述的组合物和方法的一个实施方案中,使用具有对称可转座末端序列以产生末端加标签的(end-tagged)目标核酸片段(标签片段化的片段或标签片段化)的转座体。因此,每个标签片段化的片段包含相同的末端,缺乏方向性。然后可以应用使用转座子末端序列的单引物PCR以扩增从2n到2n*2x的模板拷贝数,其中x对应于PCR循环的数目。在随后的步骤中,使用引物的PCR可以添加额外的序列,例如测序衔接子序列。
在一些实施方案中,为每个模板核酸以掺入至少一个通用引物位点可以是有利的。例如,模板核酸可以包括包含第一通用引物位点的第一末端序列和包含第二通用引物位点的第二末端序列。通用引物位点可以具有各种应用,例如在扩增、测序、和/或鉴定一种或更多种模板核酸中使用。第一和第二通用引物位点可以相同、基本相似、相似或不同。可以通过本领域众所周知的各种方法将通用引物位点引入核酸,例如,引物位点至核酸的连接,使用加尾引物的核酸的扩增,以及包含通用引物位点的转座子序列的插入。
转座体
“转座体”包含整合酶(integration enzyme)如整合酶(integrase)或转座酶,以及包含整合识别位点如转座酶识别位点的核酸。在本文提供的实施方案中,转座酶可以与能够催化转座反应的转座酶识别位点形成功能性复合物。转座酶可以结合转座酶识别位点,并在有时称为“标签片段化”的过程中将转座酶识别位点插入CE内的目标核酸中。在一些此类插入事件中,转座酶识别位点的一条链可以转移到目标核酸中。在一个实例中,转座体含有包含两个亚基的二聚转座酶,和两个不连续的转座子序列。在另一个实例中,转座酶含有包含两个亚基二聚转座酶,和连续的转座子序列。
一些实施方案可以包括使用超活性Tn5转座酶和Tn5型转座酶识别位点(Goryshin和Reznikoff,J.Biol.Chem.,273:7367(1998))或MuA转座酶和包含R1和R2末端序列的Mu转座酶识别位点(Mizuuchi,K.,Cell,35:785,1983;Savilahti,H等人,EMBO J.,14:4893,1995)。ME序列也可以由本领域技术人员优化使用。以上参考文献通过引用并入本文。
可以用于本文提供的组合物和方法的某些实施方案的转座系统的更多实例包括金黄色葡萄球菌Tn552(Colegio等人,J.Bacteriol,183:2384-8,2001;Kirby C等人,Mol.Microbiol.,43:173-86,2002),Tyl(Devine&Boeke,Nucleic Acids Res.,22:3765-72,1994和国际公开WO 95/23875),转座子Tn7(Craig,N L,Science.271:1512,1996;Craig,N L,综述于:Curr Top Microbiol Immuno.l,204:27-48,1996),Tn/O和IS10(Kleckner N等人,Curr Top Microbiol Immunol.,204:49-82,1996),Mariner转座酶(Lampe D J,等人,EMBO J.,15:5470-9,1996),Tcl(Plasterk R H,Curr.TopicsMicrobiol.Immunol.,204:125-43,1996),P元件(Gloor,G B,Methods Mol.Biol.,260:97-114,2004),Tn3(Ichikawa&Ohtsubo,J Biol.Chem.265:18829-32,1990),细菌插入序列(Ohtsubo&Sekine,Curr.Top.Microbiol.Immunol.204:1-26,1996),逆转录病毒(Brown等人,Proc Natl Acad Sci USA,86:2525-9,1989),和酵母的反转座子(Boeke&Corces,AramRev Microbiol.43:403-34,1989)。更多例子包括IS5、Tn10、Tn903、IS911,和转座酶家族酶的工程化版本(Zhang等人,(2009)PLoS Genet.5:el000689.Epub 2009Oct 16;Wilson C.等人(2007)J.Microbiol.Methods 71:332-5)。以上参考文献通过引用并入本文。
可以用于本文提供的方法和组合物的整合酶的更多实例包括逆转录病毒整合酶和用于此类逆转录病毒整合酶的整合酶识别序列,例如来自HIV-1、HIV-2、SIV、PFV-1、RSV的整合酶。
转座子序列
本文提供的组合物和方法的一些实施方案包括转座子序列。在一些实施方案中,转座子序列包括至少一个转座酶识别位点。在一些实施方案中,转座子序列包括至少一个转座酶识别位点和至少一个条形码。在美国专利申请公开号2002/0208705、美国专利申请公开号2012/0208724和国际专利申请公开号WO 02/061832中提供用于本文提供的方法和组合物的转座子序列,其每一个通过引用以其全部并入本文。在一些实施方案中,转座子序列包括第一转座酶识别位点、第二转座酶识别位点和置于其间的条形码。
具有不连续转座子序列的转座体
本文提供的一些转座体包括包含两个转座子序列的转座酶。在一些此类实施方案中,两个转座子序列彼此不相连,换言之,转座子序列彼此不连续。此类转座体的实例是本领域已知的,参见例如美国专利申请公开号2010/0120098,其公开通过引用以其全部并入本文。
环状结构
在一些实施方案中,转座体包含结合两个转座酶亚基以形成“环状复合物”或“环状转座体”的转座子序列核酸。在一个实例中,转座体包含二聚转座酶和转座子序列。环状复合物可以确保转座子插入目标DNA中,同时保持原始目标DNA的排序信息(orderinginformation),且不使目标DNA片段化。如将理解的,环状结构可以将引物、条形码、索引等插入到目标核酸中,同时保持目标核酸的物理连接性(physical connectivity)。在一些实施方案中,CE可以包含目标核酸。在一些实施方案中,环状转座体的转座子序列可以包括片段化位点,使得可以使转座子序列片段化以产生包含两个转座子序列的转座体。此类转座体对确保其中插入转座子的相邻目标DNA片段接收可以在测定的稍后阶段被明确组装的密码组合是有用的。
制备转座子序列的某些方法
本文提供的转座子序列可以通过多种方法制备。示例性的方法包括直接合成和发夹延伸方法。在一些实施方案中,转座子序列可以通过直接合成来制备。例如,包含核酸的转座子序列可以通过包含化学合成的方法制备。此类方法是本领域众所周知的,例如使用亚磷酰胺前体如衍生自保护的2'-脱氧核苷、核糖核苷或核苷类似物的亚磷酰胺前体的固相合成。可以在例如美国专利申请公开号2002/0208705、美国专利申请公开号2012/0208724和国际专利申请公开号WO 02/061832中找到制备转座子测序的示例性方法,其每一个通过引用以其全部并入。
在包含环状转座体的一些实施方案中,可以制备包含单链接头的转座子序列。在一些实施方案中,接头偶联转座体的转座子序列,使得包含第一转座酶识别序列的转座子序列以5'至3'方向偶联至包含第二转座酶识别序列的第二转座子序列。在一些实施方案中,接头将包含第一转座酶识别序列的转座子序列以5'至5'方向或3'至3'方向偶联至包含第二转座酶识别序列的第二转座子序列。以5'至5'方向或3'至3'方向偶联转座体的转座子序列对防止转座酶识别元件,特别是镶嵌元件(ME或M)彼此相互作用可以是有利的。可以通过制备包含醛基或羟胺基(oxyamine)的转座子序列来制备偶联的转座子序列。醛和羟胺基可以相互作用以形成共价键,从而偶联转座子序列。
在一些实施方案中,可以制备包含互补序列的转座体。在一个实施方案中,转座酶载有包含互补尾部的转座子序列。尾部杂交以形成连接的转座子序列。杂交可以在稀释条件下发生以减少转座体之间杂交的可能性。
靶向的插入
在本文提供的方法和组合物的一些实施方案中,可以在目标核酸的特定靶向的序列插入转座子序列。转座成dsDNA可以比转座成ssDNA目标更有效。在一些实施方案中,将dsDNA变性为ssDNA并用寡核苷酸探针(20-200个碱基)退火。这些探针产生dsDNA的位点,其可以与本文提供的转座体有效地用作整合位点。在一些实施方案中,使用具有recA-包被的寡聚物探针的D环形成和随后的三链体形成,可以靶向dsDNA。在一些此类实施方案中,D环是对于包含Tn4430转座酶的转座体的优选底物。在更多实施方案中,使用序列特异性DNA结合蛋白质如锌指复合物和对特定DNA区的其它亲和配体,可以靶向dsDNA中感兴趣的区。
在一些实施方案中,包含转座酶的转座体可以用于靶向插入目标核酸中,该转座酶具有在目标核酸中错配位置的优选的底物。例如,一些MuA转座酶,如HYPERMU(Epicenter),对错配的目标具有偏好。在一些此类实施方案中,将包含错配的寡核苷酸探针退火至单链目标核酸。包含MuA转座酶如HYPERMU的转座体可用于靶向目标核酸的错配序列。
邻近保留元件(CE)
邻近保留元件(CE)是一种物理实体,其通过一个或更多个测定步骤在紧密接近(close proximity)(或邻近)保留至少两个或更多或全部分析物,并提供对测定试剂的接近并且可以合并和分离多次而不会失去分析物的接近性。
在一些实施方案中,CE可以是固体支持物。在一个实施方案中,CE可以是乳剂或液滴。在一些实施方案中,CE是凝胶、水凝胶或凝胶珠。在一些实施方案中,CE可以包含固体支持物,例如珠。在一些实施方案中,珠可以进一步包含抗体、寡核苷酸和/或条形码。在另一个实施方案中,CE可以构成由WGA、RCA或任何核酸试剂的浓缩(condensation)产生的DNA纳米球。
在一些实施方案中,可以通过在聚合物基质如琼脂糖、聚丙烯酰胺、藻酸盐等中包埋来自细胞或来自单细胞的核酸,或其扩增产物(来自WGA等)来制备CE。在一些实施方案中,由通过包封(例如在聚合物基质中)、固定在珠上、或捕获保持组分彼此的物理接近性,通过合并和再分配的重复的轮次在CE内有效地保持邻近信息,来保持在CE内的细胞或单细胞的内容物的邻近性。CE的集合可以独立地合并和分离,与测定试剂反应,再次合并和分离等等,还保持构成单个CE的分析物的连续性的特征使得能够通过不同的分离和合并步骤进行组合索引化。
在一些实施方案中,邻近保留元件中的分析物可接近测定试剂,该试剂包括水溶液、酶(例如片段化酶(fragmentase)、聚合酶、连接酶、转座酶、激酶、限制性内切核酸酶、蛋白质酶、磷酸酶、脂肪酶)、核酸衔接子、核酸条形码、标记物。
在一些实施方案中,CE包括细胞或单细胞。在一些实施方案中,CE包含来自细胞或来自单细胞的核酸,如DNA、mRNA或cDNA;包括蛋白质、多糖、脂质和核酸、以及小分子如初级代谢物、次级代谢产物的细胞或单细胞的大分子,和来自细胞或来自单细胞的天然产物。在一些实施方案中,在形成包含核酸的CE之前,核酸经历扩增,例如PCR或全基因组扩增。在一些实施方案中,DNA和mRNA的分析可以平行地进行。
在一些实施方案中,CE的一个或更多个分析物用一个或更多个标记物标记。示例性标记物包括但不限于DNA条形码或索引、荧光标记物、化学发光标记物、RNA条形码或索引、放射性标记物、包含标记物的抗体、包含标记物的珠。
在一些实施方案中,方法可以包括以下步骤:(a)将包含目标核酸的CE分隔成多个第一容器;(b)向每个第一容器的目标核酸提供第一索引,从而获得第一索引化的核酸;(c)组合第一索引化的核酸;(d)将第一索引化的模板核酸分隔成多个第二容器;(e)向每个第二容器的第一索引化的模板核酸提供第二索引,从而获得第二索引化的核酸。可以用从a-e系列的一个或更多个步骤的额外的循环继续步骤a-e以衍生额外的虚拟隔室。组合索引化的这种方法可用于从有限数量的物理隔室有效地创建大量的虚拟隔室。
在一些实施方案中,方法可以包括以下步骤:(a)提供包含具有附接的核酸报告物的非核酸分析物(例如蛋白质)的CE;(b)将CE分隔成多个第一容器;(c)向每个第一容器的目标核酸报告物提供第一索引,从而获得第一索引化的目标核酸报告物;(c)组合第一索引化的核酸报告物;(d)将第一索引化的CE分隔成多个第二容器;(e)向每个第二容器的第一索引化的核酸报告物提供第二索引,从而获得第二索引化的核酸报告物。可以用从a-e系列的一个或更多个步骤的额外的循环继续步骤a-e以衍生额外的虚拟隔室。分隔步骤可以进一步包括核酸扩增或捕获步骤,例如PLA、PEA或捕获或扩增核酸的其它技术。
在一些实施方案中,将福尔马林固定的、石蜡包埋的组织可以切成切片,每个切片加至CE。可以随后分析每个CE的内容物或序列,并且在稍后的阶段可以获得每个切片的内容物的2D或3D图。
在一些实施方案中,一种或多种核酸可以包埋入基质,该基质将核酸限制在限定的空间,但允许试剂进入以进行步骤,包括但不限于扩增(PCR、全基因组扩增、随机引物延伸等)、连接、转座、杂交、限制性消化和DNA诱变。诱变的实例包括但不限于易错延伸、烷基化、亚硫酸氢盐转化,和活化诱导的(胞苷)脱氨酶等。
在一些实施方案中,使用CE的方法和组合物可以与诱变组装方法一起组合,以大大改善DNA序列信息的组装。可以使基因组DNA片段化并分成多个CE,每个CE包含一定分数的基因组。基因组的不同分数接收不同的条形码,允许各分数的基因组独立组装。更大的挑战之一是重复的组装。由Levy,D.and Wigler,M.(2014)Facilitated sequence countingand assembly by template mutagenesis.Proc.of the Natl.Acad.Sci.,Ill(43).E4632-E4637.ISSN 0027-8424概述了组装重复的一种方法。在US20140024537中也讨论了组装方法,标题为:Methods And Systems for Determining Haplotypes And Phasing ofHaplotypes,并且该申请通过引用以其全部并入。以上参考文献通过引用并入本文。
对于组合DNA片段的划分(partitioning)与诱变或相关方法的方法,可以用CE、孔、索引、虚拟索引、物理隔室、液滴等进行划分。可以通过几种方法进行诱变,该方法包括但不限于易错延伸、烷基化、亚硫酸氢盐转化,和活化诱导的(胞苷)脱氨酶等。在常规方法使得组装重复或不同区域具有挑战性的情况下,将核酸划分成CE的方法和诱变方法可以是有用的。
在一些实施方案中,本文阐述的方法可用于变体定相、(从头)基因组组装,筛选细胞群以确定跨群体的异质性和确定细胞与细胞的差异。
在一些实施方案中,在容器中分离来自细胞或来自单细胞的cDNA并转化成如上所述的通过虚拟隔室化(compartmentalization)方法索引化的CE。这使得能够从1000、10,000、100,000、甚至更多数量的不同索引化的单细胞文库中进行基因表达和转录物序型分析(transcript profiling)。
在一些实施方案中,由于泊松取样,可分析的单细胞的数量大约为虚拟隔室总数的10%。对于在每个步骤中具有96孔隔室的四层索引化方案,可以在一次实验中使用总共4×96=384个物理隔室来分析总共10%X96X96X96X96=超过800万个单细胞。在图3的实例中,使用四个组合的稀释和合并步骤来创建大量虚拟隔室(包含独特索引组合的一组分子或DNA库元件)。在该实例中,通过将单细胞的内容物包封在聚合物基质(例如PAM=聚丙烯酰胺)中创建连续的DNA容器。在用于基因组分析的优选具体实施方案中,通过MDA(WGA多重置换扩增反应)扩增单细胞的基因组DNA内容物。该单细胞MDA产物构成通过组合的索引化方案进行的DNA容器。对于基因表达,如Picelli(Picelli,2014)所述,可以从单细胞容器进行单细胞cDNA制备。在优选的实施方案中,通过使用片段化(酶法)和衔接子连接,或通过使用转座酶复合物的标签片段化(tagmentation),通过标准文库制备技术将初始索引附接于基因组DNA或cDNA。在优选的实施方案中,经由连接或PCR将随后的索引附接至文库。连接是优选的,因为以顺序的方式添加索引化的接头是容易的。最后一步可能涉及到仅仅索引化的PCR或连接和PCR。
在一些实施方案中,目标核酸是组蛋白/蛋白质保护的(参见Buenrostro等人,Nature Methods 10,1213-1218(2013)doi:10.1038/nmeth.2688,通过引用并入本文)。应用包括表观遗传学序型分析,以及打开的染色质和DNA结合蛋白质和核小体位置的分析。
在一些实施方案中,邻近保留元件可以包含单细胞,并且可以扩增来自细胞的核酸。随后,可以通过组合的索引化方案将每个邻近保留元件进行独特地索引化。短测序读取可以基于独特的索引进行分组。长合成读取可以基于独特的索引各自从头组装(McCoy等人,Plosone 2014(DOI:10.1371/journal.pone.0106689)Illumina TruSeq SyntheticLong-Reads Empower De Novo Assembly and Resolve Complex,Highly-RepetitiveTransposable Elements,通过引用并入本文)
在一些实施方案中,CE可以包含细胞的内容物,例如蛋白质、细胞器、RNA、DNA、核糖体、抗体、类固醇、专门的结构、聚糖、脂质、小分子、可能影响生物学途径的分子、单和多糖、生物碱类、初级和次级代谢产物。
在一些实施方案中,CE内的细胞器可以被差异染色。细胞器染色试剂的实例是细胞器靶向荧光蛋白质(Cellular LightsTM),经典细胞器染色剂或染料缀合物,其选择性或非选择性地可以标记细胞器或细胞结构。
在一些实施方案中,在CE中感兴趣的分析物是蛋白质。蛋白质可以用条形码或替代标记物来标记。可以使用传统阵列或基于序列的方法读出条形码或标记物。邻近连接方法和抗体索引序列可以用于与条形码序列的检测一起检测蛋白质(Fredriksson等人,Nature Biotechnology20,473-477(2002),通过引用并入本文)以在每个单个细胞中建立蛋白质的身份和丰度。蛋白质可以由技术人员通过已知的各种方法(www.piercenet.com/cat/protein-antibody-labeling)进行标记,包括体内和体外位点特异性化学标记策略。
接近连接(proximity ligation)(Duo-link PLA,www.sigmaaldrich.com/life-science/molecular-biology/molecular-biology-products.html?TablePage=l12232138,多重接近连接检测EP 2714925 A1)是用于检测蛋白质、蛋白质-蛋白质相互作用和翻译后修饰的实例,所述修饰可适合在邻近保留元件中使用。该方法可用于检测和量化在邻近保留元件中的特定蛋白质或蛋白质复合物。工作流程的一个例子如下:(1)制备一个或多个邻近保留元件,(2)洗涤并添加对感兴趣的蛋白质特异的一对或多对一抗,(3)洗涤并用条形码标记的抗体染色。容器中的邻近保留元件的每个群接收不同的条形码标记的抗体。通过接近连接,一对或多对一抗、可扩增产物可以得到形成,其含有用于特定蛋白质的独特条形码。一个条形码对感兴趣的蛋白质可以是特异性的,而其它条形码用于将蛋白质分配至特定的邻近保留元件和或细胞。通过一个或更多个分开和合并步骤,可以差别性地标记各份。照此,可以分析单个邻近保留元件的内容物,而不需要在许多平行步骤中各自处理每个邻近保留元件。以此类方式处理10、100、1000、10,000、100,000、1,000,000、10,000,000、100,000,000和更多个邻近保留元件是特别大的优点。可以以如为蛋白质所述相似的方式检测类固醇和小分子。条形码标记的抗体可以开发用于类固醇(Hum Reprod.1988Jan;3(l):63-8.Antibodies against steroids.Bosze P等人。可选地,已描述了荧光染料和放射性缀合物(www jenabioscience.eom/cms/en/l/catalog/2305_fluorescent_hormones.html)。可如上所述处理这些用于类固醇的抗体缀合物。可以使用各种方法以检测邻近保留元件的一个或更多个组分。邻近保留元件的一个或更多个组分可以用化学发光、荧光、放射性探针、DNA标签、条形码和索引进行标记。扩增策略可用于增强信号。例如,可以使用滚环扩增(RCA)以检测分析物。随后可以通过测序、荧光解码器(探针)检测RCA产物。此外,微阵列、蛋白质阵列、测序,纳米孔测序、下一代测序、毛细管电泳、珠阵列可以用于读出。
建立细胞的内容物的邻近性
在一些实施方案中,细胞或来自单细胞的内容物(例如但不限于DNA、RNA、蛋白质、细胞器、代谢物、小分子)的邻近性可以保留在邻近保留元件(CE)中。可以通过几种方法创建CE,包括但不限于将内容物包封在液滴内、将内容物包埋在聚合物基质中(包封之后)、以及将内容物附接至珠。在优选实施方案中,CE对检测试剂例如水性缓冲液、酶(聚合酶、连接酶、转座酶等)、核苷酸、寡核苷酸衔接子、转座子和引物等是可渗透的。如以上所描述的,从该CE创建索引化的文库。稀释成物理隔室的重复轮次、隔室特异索引的附接、合并和再稀释成额外的隔室导致许多虚拟隔室的指数产生(exponential creation)。如果设计恰当,则每个CE的内容物最终将用独特的条形码虚拟索引化。图1中作为例子,四层索引化方案导致大量虚拟隔室和索引(>84百万),仅仅4X96=384总物理隔室。在优选的实施方案中,经由标签片段化、连接或PCR在每个区室化层加入隔室特异性索引。在优选实施方案中,在每个步骤每个物理隔室具有独特的索引。后续的区室化可以使用相同或不同的索引。如果从一个区室化层到下一个使用相同的索引,则在最终序列串内的索引的位置将鉴定隔室和区室化层。
使用液滴分析细胞的组分
在一个实施方案中,CE可以是乳剂或液滴。在一个实施方案中,CE是与油接触的液滴。在一个实例中,包含核酸的CE包括将核酸样品稀释和划分为液滴、隔室或珠。在一个实施方案中,液滴包括细胞或单细胞。在一个实施方案中,包含单细胞的CE包括将单细胞稀释和划分成液滴、隔室或珠。
在一些实施方案中,“液滴”可以是至少部分地由填料流体(filler fluid)界定的液滴执行器上的液体体积。例如,液滴可以由填料流体完全包围,或者可以由填料流体和液滴执行器的一个或更多个表面界定。液滴可以采用各种形状;非限制性实例包括通常为圆盘状、块状、截球、椭球、球形、部分压缩球、半球形、卵形、圆柱形和各种形状,其在液滴操作期间形成,例如合并或分开,或者由于此类形状与液滴执行器的一个或更多个表面的接触而形成。
液滴执行器用于进行极其多种液滴操作。液滴执行器通常包括由空间分开的两个基板。基板包括用于进行液滴操作的电极。该空间通常填充有与待在液滴执行器上操作的流体不混溶的填料流体。暴露于空间的表面通常是疏水性的。遗传物质(基因组学)及其表达(功能基因组学)、蛋白质组学的分析、组合的文库分析和其它多重化生物分析应用可以在液滴中进行,并且可以在分析液滴执行器上进行以下操作。分别在美国专利申请公开20100130369和20130203606中公开了使用液滴执行器操纵液滴的方法,其的每一个通过引用并入本文。
“液滴执行器”是指用于操纵液滴的装置。对于液滴执行器的例子,参见Pamula等人,美国专利号6,911,132,题名为“Apparatus for Manipulating Droplets byElectrowetting-Based Techniques”,公告于2005年6月28日;Pamula等人,美国专利公开号20060194331,题名为“Apparatus and Methods for Manipulating Droplets on aPrinted Circuit Board”,公开于2006年8月31日;Pollack等人,国际公开号WO/2007/120241,题名为“Droplet-Based Biochemistry”,公开于2007年10月25日;Shenderov,美国专利号6,773,566,题名为“Electrostatic Actuators for Microfluidics and Methodsfor Using Same”,公告于2004年8月10日;Shenderov,美国专利号6,565,727,题名为“Actuators for Microfluidics Without Moving Parts”,公告于2003年5月20日;Kim等人,美国专利公开号20030205632,题名为“Electrowetting-driven Micropumping”,公开于2003年11月6日;Kim等人,美国专利公开号20060164490,题名为“Method and Apparatusfor Promoting the Complete Transfer of Liquid Drops from a Nozzle”,公开于2006年7月27日;Kim等人,美国专利公开号20070023292,题名为“Small Object Moving onPrinted Circuit Board”,公开于2007年2月1日;Shah等人,美国专利公开号20090283407,题名为“Method for Using Magnetic Particles in Droplet Microfluidics”,公开于2009年11月19日;Kim等人,美国专利公开号20100096266,题名为“Method and Apparatusfor Real-time Feedback Control of Electrical Manipulation of Droplets onChip”,公开于2010年4月22日;Velev,美国专利号7,547,380,题名为“DropletTransportation Devices and Methods Having a Fluid Surface”,公告于2009年6月16日;Sterling等人,美国专利号7,163,612,题名为“Method,Apparatus and Article forMicrofluidic Control via Electrowetting,for Chemical,Biochemical andBiological Assays and the Like”,公告于2007年1月16日;Becker等人,美国专利号7,641,779,题名为“Method and Apparatus for Programmable Fluidic Processing”,公告于2010年1月5日;Becker等人,美国专利号6,977,033,题名为“Method and Apparatus forProgrammable Fluidic Processing”,公告于2005年12月20日;Decre等人,美国专利号7,328,979,题名为“System for Manipulation of a Body of Fluid”,公告于2008年2月12日;Yamakawa等人,美国专利公开号20060039823,题名为“Chemical AnalysisApparatus”,公开于2006年2月23日;Wu,美国专利公开号20110048951,题名为“DigitalMicrofluidics Based Apparatus for Heat-exchanging Chemical Processes”,公开于2011年3月3日;Fouillet等人,美国专利公开号20090192044,题名为“ElectrodeAddressing Method”,公开于20097月30日;Fouillet等人,美国专利号7,052,244,题名为“Device for Displacement of Small Liquid Volumes Along a Micro-catenary Lineby Electrostatic Forces”,公告于2006年5月30日;Marchand等人,美国专利公开号20080124252,题名为“Droplet Microreactor”,公开于2008年5月29日;Adachi等人,美国专利公开号20090321262,题名为“Liquid Transfer Device”,公开于2009年12月31日;Roux等人,美国专利公开号20050179746,题名为“Device for Controlling theDisplacement of a Drop Between Two or Several Solid Substrates”,公开于2005年8月18日;和Dhindsa等人,“Virtual Electrowetting Channels:Electronic LiquidTransport with Continuous Channel Functionality”Lab Chip,10:832–836(2010),其全部公开通过引用并入本文。某些液滴执行器将包括其间布置有液滴操作间隙一个或更多个基板和与一个或更多个基板相关联(例如,在基板上分层、附接于基板和/或包埋进基板)且布置成进行一个或更多个液滴操作的电极。例如,某些液滴执行器将包括基底(或底部)基板,与基板相关联的液滴操作电极,位于基板和/或电极顶部的一个或更多个介电层,以及任选地位于基板、介电层和/或电极顶部形成液滴操作表面的一个或更多个疏水层。还可以提供顶部基板,其通过间隙(通常称为液滴操作间隙)与液滴操作表面分隔。在上述参考专利和申请中讨论了顶部和/或底部基板上的各种电极布置,并且在本公开的说明书中讨论了某些新颖的电极布置。在液滴操作期间,液滴优选保持与接地或参比电极的连续接触或频繁接触。接地或参比电极可以与间隙中面向间隙的顶部基板、面向间隙的底部基板相关联。在电极设置在两个基板上的情况下,用于将电极偶联至液滴执行器装置用于控制或监测电极的电触头可以与一个或两个板相关联。在一些情况下,在一个基板上的电极电偶联至另一个基板,使得仅一个基板与液滴执行器接触。在一个实施方案中,导电材料(例如,环氧树脂,例如可得自Master Bond,Inc.,Hackensack,NJ的MASTER BONDTM PolymerSystem EP79)提供了在一个基板上电极和在其它基板上的电路径间的电连接,例如,在顶部基板上的接地电极可以通过此类导电材料偶联到底部基板上的电路径。在使用多个基板的情况下,可以在基板之间提供间隔物以确定其间的间隙的高度并且限定执行器上的分配的储存器。间隔物高度可以例如为至少约5μm、100μm、200μm、250μm、275μm或更大。可选地或额外地,间隔物高度可以为至多约600μm、400μm、350μm、300μm或更小。间隔物可以例如由顶部或底部基板的突起层,和/或插入在顶部和底部基板之间的材料形成。可以在一个或更多个基板中提供一个或更多个开口,用于形成流体路径,通过该流体路径,液体可被输送入液滴操作间隙中。在一些情况下,一个或更多个开口可以对齐用于与一个或更多个电极相互作用,例如对齐,使得流过开口的液体将变得与一个或更多个液滴操作电极足够接近以允许使用液体由液滴操作电极实现液滴操作。在一些情况下,基底(或底部)和顶部基板可以形成为一个整体部件(integral component)。可以在基底(或底部)和/或顶部基板上和/或在间隙中提供一个或更多个参比电极。在上述参考专利和专利申请中提供了参比电极布置的实例。在各种实施方案中,通过液滴执行器的液滴的操纵可以是电极介导的,例如电润湿介导的或介电电泳介导的或库仑力介导的。用于控制可用于本公开的液滴执行器中的液滴操作的其它技术的实例包括使用引起流体动力学流体压力的装置,例如基于机械原理操作的那些(例如外部注射泵、气动膜泵、振动膜泵、真空装置、离心力、压电/超声波泵和声力);电或磁性原理(例如电渗流、电动泵、铁流体塞、电动力泵、使用磁力的吸引或排斥力和磁流体动力泵);热力学原理(例如气泡产生/相变诱导的体积膨胀);表面润湿原理的其它种类(例如电润湿,和光电润湿,以及化学、热、结构和放射性诱导的表面张力梯度);重力;表面张力(如毛细作用);静电力(例如电渗流);离心流(置于光盘上并旋转的基板);磁力(例如,振荡离子引起流动);磁流体动力;和真空或压力差。在某些实施方案中,可以采用两种或更多种前述技术的组合来在本公开的液滴执行器中进行液滴操作。类似地,前述中的一种或更多种可以用于将液体输送到液滴操作间隙中,例如从另一装置中的储存器或液滴执行器的外部储存器(例如,与液滴执行器基板相关的储存器和从储存器到液滴操作间隙的流动路径)。本公开的某些液滴执行器的液滴操作表面可以由疏水材料制成,或者可以被涂覆或处理以使其疏水。例如,在一些情况下,一些部分或全部液滴操作表面可以用低表面能材料或化学物质衍生化,例如通过沉积或使用原位合成,采用例如在溶液中的聚或全氟化的化合物,或可聚合单体进行。实例包括(可得自DuPont,Wilmington,DE)、材料的cytop系列的成员、在疏水和超疏水涂层的/>系列中的涂层(可得自Cytonix Corporation,Beltsville,MD),硅烷涂层,氟硅烷涂层、疏水性膦酸酯衍生物(例如,由Aculon,Inc.出售的那些)、和NOVECTM电子涂层(可得自3MCompany,St.Paul,MN)、用于等离子体增强化学气相沉积(PECVD)的其它氟化单体和用于PECVD的有机硅氧烷(例如,SiOC)。在一些情况下,液滴操作表面可以包括具有厚度范围从约10nm至约1,000nm的疏水涂层。此外,在一些实施方案中,液滴执行器的顶部基板包括导电有机聚合物,然后其用疏水涂层涂覆或以其它方式处理以使液滴操作表面疏水。例如,沉积在塑料基板上的导电有机聚合物可以是聚(3,4-亚乙基二氧噻吩)聚(苯乙烯磺酸)(PEDOT:PSS)。导电有机聚合物和替代导电层的其它实例描述于Pollack等人,国际专利公开号WO/2011/002957,题名为“Droplet Actuator Devices and Methods”,公开于2011年1月6日,其全部公开通过引用并入本文。可以使用印刷电路板(PCB)、玻璃、氧化铟锡(ITO)涂覆的玻璃和/或半导体材料作为基板来制造一个或两个基板。当基板是ITO涂覆的玻璃时,ITO涂层优选的厚度为至少约20nm、50nm、75nm、100nm或更大。可选地或额外地,厚度可以是至多约200nm、150nm、125nm或更小。在一些情况下,顶部和/或底部基板包括用电介质例如聚酰亚胺电介质涂覆的PCB基板,其在一些情况下也可以被涂覆或以其它方式处理以使液滴操作表面疏水。当基板包括PCB时,以下材料是合适材料的实例:MITSUITM BN-300(可得自MITSUI ChemicalsAmerica,Inc.,San Jose CA);ARLONTM 11N(可得自Arlon,Inc,Santa Ana,CA);N4000-6和N5000-30/32(可得自Park Electrochemical Corp.,Melville,NY);ISOLATM FR406(可得自Isola Group,Chandler,AZ),特别是IS620;氟聚合物系列(适用于荧光检测,因为它具有低背景荧光);聚酰亚胺系列;聚酯;聚萘二甲酸乙二醇酯(polyethylene naphthalate);聚碳酸酯;聚醚醚酮;液晶聚合物;环烯烃共聚物(COC);环烯烃聚合物(COP);芳香族聚酰胺(aramid);/>非织造芳香族聚酰胺增强材料(可得自DuPont,Wilmington,DE);/>牌纤维(可得自DuPont,Wilmington,DE);和纸。各种材料也适合用作基板的介电部件。实例包括:气相沉积电介质,例如PARYLENETM C(特别是玻璃上),PARYLENETM N和PARYLENETM HT(用于高温,约300℃)(可得自Parylene Coating Services,Inc.,Katy,TX);/>AF涂料;CYTOP;焊接掩模(soldermask),例如类似TAIYOTM PSR4000系列、TAIYOTM PSR和AUS系列(可得自TaiyoAmerica,Inc.Carson City,NV)(用于涉及热控的应用的良好的热特性)的液体可光成象的焊接掩模(例如在PCB上),以及PROBIMERTM 8165(用于涉及热控的应用的良好的热特性(可得自Huntsman Advanced Materials Americas Inc.,Los Angeles,CA);干膜焊接掩模,例如在/>干膜焊接掩模系列(可得自DuPont,Wilmington,DE)中的那些;膜电介质,例如聚酰亚胺膜(例如/>聚酰亚胺膜,可得自DuPont,Wilmington,DE),聚乙烯和含氟聚合物(例如FEP),聚四氟乙烯;聚酯;聚萘二甲酸乙二醇酯;环烯烃共聚物(COC);环烯烃聚合物(COP);上面列出的任何其它PCB基板材料;黑色基质树脂(black matrix resin);聚丙烯;以及黑色柔性电路材料,例如DuPontTM Pyralux HXC和DuPontTM Kapton MBC(可得自DuPont,Wilmington,DE)。可以选择液滴输送电压和频率用于在特定测定方案中使用的试剂所具有的性能。设计参数可以变化,例如,执行器上储存器的数量和布置,独立电极连接的数量,不同储存器的尺寸(体积),磁体/珠洗涤区的布置,电极尺寸,电极间间距,和间隙高度(顶部和底部基板之间)可以变化以用于特定试剂、方案、液滴体积等。在一些情况下,本公开的基板可以用低表面能材料或化学物质衍生化,例如使用沉积或原位合成,其在溶液或可聚合单体中使用聚或全氟化合物进行。实例包括用于浸涂或喷涂的涂层和/>涂层,用于等离子体增强化学气相沉积的其它氟化单体(PECVD),和用于PECVD的有机硅氧烷(例如SiOC)。此外,在一些情况下,一些部分或全部液滴操作表面可以涂覆有用于降低背景噪声的物质,例如来自PCB基板的背景荧光。例如,降噪涂层可以包括黑色基质树脂,例如可获自Toray industries,Inc.,Japan的黑色基质树脂。液滴执行器的电极通常由控制器或处理器控制,控制器或处理器本身作为系统的一部分提供,其可以包括处理功能以及数据和软件存储以及输入和输出能力。可以在液滴操作间隙中或在流体偶联到液滴操作间隙的储存器中液滴执行器上提供试剂。试剂可以以液体形式,例如液滴,或者在液滴操作间隙中或在流体偶联到液滴操作间隙的储存器中,它们可以以可重构的形式提供。可重构试剂通常可以与用于重构的液体组合。适用于与本文所述的方法和装置使用的可重构试剂的实例包括Meathrel等人在2010年6月1日公告的题名为“Disintegratable Films for Diagnostic Devices”的美国专利号7,727,466中描述的那些,其全部公开通过引用并入本文。
“液滴操作”是指液滴执行器上液滴的任何操作。液滴操作可以例如包括:将液滴加载到液滴执行器中;从源液滴分配一个或更多个液滴;将液滴分裂、分离或分成两个或更多个液滴;在任何方向将液滴从一个位置运输到另一个位置;将两个或更多个液滴合并或组合成单个液滴;稀释液滴;混合液滴;搅动液滴;使液滴变形;将液滴保持在位置;孵育液滴;加热液滴;蒸发液滴;冷却液滴;处理液滴;将液滴从液滴执行器运输出去;本文所述的其它液滴操作;和/或前述的任何组合。术语“合并(merge)”,“合并(merging)”,“组合(combine)”,“组合(combing)”等用于描述从两个或更多个液滴形成一个液滴。应当理解,当此类术语用于关于两个或更多个液滴时,可以使用足以导致两个或更多个液滴组合成一个液滴的液滴操作的任何组合。例如,“将液滴A与液滴B合并”可以通过运输液滴A到与静止的液滴B接触,运输液滴B到与静止的液滴A接触,或运输液滴A和B到彼此接触来实现。术语“分裂”,“分离”和“分开”并不意味着暗示相对于所得液滴的体积的任何特定结果(即,所得液滴的体积可以相同或不同)或所得液滴的数量(所得液滴的数量可以是2、3、4、5或更多)。术语“混合”是指导致液滴内的一种或多种组分的更均匀分布的液滴操作。“加载”液滴操作的实例包括微透析加载、压力辅助加载、机器人加载、被动加载和移液管加载。液滴操作可以是电极介导的。在一些情况下,通过在表面上亲水和/或疏水区域的使用和/或通过物理障碍物进一步促进液滴操作。关于液滴操作的实例,参见上述在“液滴执行器”的定义下引用的专利和专利申请。有时可以使用阻抗或电容感测或成像技术以确定或确认液滴操作的结果。此类技术的实例描述于Sturmer等人的美国专利公开号20100194408,题名为“Capacitance Detection in a Droplet Actuator”,公开于2010年8月5日,其全部通过引用并入本文。一般来说,感测或成像技术可用于确认特定电极处液滴的存在或不存在。例如,在液滴分配操作之后在目标电极处存在分配的液滴证实了液滴分配操作是有效的。类似地,在测定方案中在适当步骤的检测点处的液滴的存在可以确认先前的液滴操作组已成功地产生用于检测的液滴。滴液运输时间可以相当快。例如,在各种实施方案中,从一个电极到下一个的液滴的运输可以超过约1秒、或约0.1秒、或约0.01秒、或约0.001秒。在一个实施方案中,电极以AC模式操作,但切换到DC模式用于成像。对于液滴的足迹区域(footprintarea)与电润湿区域相似对于进行液滴操作是有帮助的;换句话说,通常使用1、2和3个电极分别有效地受控操作lx-、2x-、3x-液滴。如果液滴足迹(droplet footprint)大于可用于在给定时间进行液滴操作的电极数量,则液滴尺寸和电极数量之间的不同通常不应大于1;换句话说,使用1个电极有效地控制了2个液滴,并且使用2个电极有效地控制了3个液滴。当液滴包括珠时,液滴尺寸等于控制液滴的电极数量是有用的,例如运输液滴。
在一些方面,可以使用CE例如液滴从细胞或单细胞制备核酸文库。在一些实施方案中,细胞可以悬浮在缓冲液中。在一些实施方案中,可以将细胞悬浮液引入液滴执行器。使用电极介导的液滴操作可以分配包含细胞悬浮液的液滴的阵列,使得每个液滴包含单细胞。使用电极介导的液滴操作,可以分配包含细胞裂解缓冲液的试剂液滴的阵列(裂解缓冲液液滴)。可以使用电极介导的操作组合裂解缓冲液液滴和包含单细胞的细胞悬浮液液滴的阵列以形成细胞裂解物液滴,使得细胞裂解物液滴包含单细胞的组分。可以向液滴执行器引入包含独特的核酸条形码、转座子和合适的酶(例如片段化酶(fragmentase)、聚合酶、连接酶、转座酶、逆转录酶等)的反应试剂。在一些实施方案中,转座子和/或条形码可以包含引物结合位点。使用电极介导的液滴操作,可以分配包含反应试剂的试剂液滴的阵列,使得每个试剂液滴包含独特的核酸条形码和合适的酶。可以使用电极介导的操作组合细胞裂解物液滴和试剂液滴以形成第一条形码液滴的阵列,其中来自单细胞的核酸被来自试剂液滴的酶作用,使得核酸包含条形码。在一些实施方案中,当组合细胞裂解物液滴和试剂液滴并且cDNA可以包含条形码时,可以逆转录细胞裂解物液滴中的mRNA。在一些实施方案中,条形码可以包含引物结合位点和独特的分子索引。使用电极介导的液滴操作,可以将第一条形码编码液滴进一步与试剂液滴组合多次以产生第二条形码液滴的阵列、第三条形码液滴的阵列等。在一些实施方案中,对于每轮组合,条形码是不同的。因此,将条形码液滴与试剂液滴多轮组合将产生组合的条形码编码。最后可以汇集和测序来自不同液滴的核酸。测序信息可以揭示来自细胞的核酸的测序信息,并且任选地也可以鉴定核酸的来源(例如细胞或单细胞)。如果核酸包含如与遗传性遗传疾病或癌症等疾病相关的突变,则此类信息是有价值的。
在一些方面,本申请的方法可以应用于蛋白质组学。可以如下制备包含液滴的珠的阵列,即通过将珠悬浮液引入液滴执行器以分配来自珠悬浮液的液滴的阵列,使得在液滴的阵列中的每个液滴包含单个珠(参见美国申请公开20100130369,通过引用并入本文)。珠可以包含抗体或其它亲和探针(参见Immobilized Biomolecules in Analysis.APractical Approach.Cass T,Ligler FS,eds.Oxford University Press,New York,1998.pp 1-14,,通过引用并入本文,用于典型的附接方案)。在一些实施方案中,抗体对细胞表面表位可以是特异性的。在一些实施方案中,抗体可以是单克隆抗体,并且在其它实施方案中,抗体可以是多克隆的。使用电极介导的液滴操作,珠悬浮液滴的阵列可以与包含单细胞的液滴的阵列组合以产生珠液滴上的细胞的阵列,使得珠上的抗体结合至细胞表面蛋白质。在一些实施方案中,抗体对细胞内的蛋白质可以是特异性的。使用电极介导的液滴操作,珠悬浮液滴的阵列可以与包含单细胞裂解物的液滴的阵列组合,使得珠上的抗体结合至细胞内的蛋白质,以产生珠液滴上的蛋白质的阵列。任选地,使用电极介导的液滴操作,珠液滴上的蛋白质的阵列可以与包含蛋白质标记试剂的试剂液滴的阵列组合,使得蛋白质可以被独特地标记。可以从相关标记物或通过其它方式检测结合蛋白质(SDS-聚丙烯酰胺凝胶电泳,ELISA等)。可以确定蛋白质的身份和蛋白质的来源。在一些实施方案中,蛋白质组学数据可以与测序数据相关。
在一些实施方案中,抗体可以对其它生物分子,且不限于蛋白质是特异性的。此类生物分子可以包括但不限于多糖或脂质。在一些实施方案中,此类生物分子的身份和来源可以与上面产生的序列数据相关。
原位细胞分析
在一些实施方案中,可以原位分析细胞及其组分。在一些实施方案中,可使细胞通过流动池。
如本文所用的,术语“流动池”旨在表示具有可以流过一种或更多种流体试剂的表面的室。通常,流动池将具有流入口和流出口以促进流体的流动。例如在Bentley等人,Nature 456:53-59(2008),WO 04/018497;US 7,057,026;WO 91/06678;WO 07/123744;US7,329,492;US 7,211,414;US 7,315,019;US 7,405,281和US 2008/0108082中描述了可容易地用于本公开的方法中的流动池和相关流体系统和检测平台的实例,其的每一个通过引用并入本文。
在一些实施方案中,流动池可容纳阵列。用于核酸测序的阵列通常具有核酸特征的随机空间图案(random spatial pattern)。例如,可得自Illumina Inc.(San Diego,CA)的HiSeqTM或MiSeqTM测序平台利用流动池,通过随机接种随后桥接扩增在其上形成核酸阵列。然而,图案化的阵列也可用于核酸测序或其它分析应用。示例性图案化的阵列,其制造方法及其使用方法阐述于美国系列号13/787,396号;美国系列第13/783,043号;美国系列第13/784,368号;美国专利申请公开号2013/0116153A1;和美国专利申请公开号212/0316086A1中,其的每一个通过引用并入本文。此类图案化阵列的特征可以用于捕获单个核酸模板分子以接种随后形成均质集落,例如通过桥扩增。此类图案化阵列对于核酸测序应用是特别有用的。
在一些实施方案中,流动池表面可以包含捕获部分,例如抗体以将通过其的细胞固定在流动池表面上。在一些实施方案中,流动池表面上的抗体可以特异性结合细胞表面蛋白质。在一些实施方案中,抗体可以特异性结合癌细胞的细胞表面蛋白质,从而在流动池表面上富集癌细胞。
在一些实施方案中,可以在将细胞送入流动池之前通过本领域已知的细胞分选技术将细胞分成各种类型。示例性细胞分选技术包括但不限于荧光激活细胞分选术或使用流式细胞术的FACS,磁激活细胞分选术(MACS)(Miltenyi Biotec Inc.,San Diego,CA)),或通过其中将标记细胞的管放置在磁场内的无柱细胞分离技术。阳性选择的细胞保留在管中,而阴性选择的细胞在液体悬浮液中(STEMCELL Technologies Inc.,Vancouver,BC,Canada)。
在一些实施方案中,通过流动池的细胞可以在流动池内裂解,并从而在流动池中释放细胞的核酸(DNA和RNA)。在一些实施方案中,细胞在裂解前固定在流动池上。细胞裂解的方法是本领域已知的,其包括但不限于超声处理、蛋白质酶处理、通过渗透压休克(osmotic shock)、高盐处理。在一些实施方案中,可以逆转录整个RNA。在一些实施方案中,可以将独特的条形码引入来自细胞的核酸,例如DNA、RNA或cDNA。将条形码引入核酸的方法已在上文中讨论并且包括但不限于使用NexteraTM技术、连接酶、聚合酶的标签片段化。在一些实施方案中,条形码可用于鉴定细胞来源。在一些实施方案中,条形码可具有引物结合位点。在一些实施方案中,可以将多个条形码引入到核酸中。在一些实施方案中,多个条形码彼此是不同的。在一些实施方案中,可以将具有条形码的核酸扩散;再次合并,并可能引入额外的条形码。在一些实施方案中,在引入条形码之后或期间,可以将核酸片段化。在一些实施方案中,可以在扩散到流动池之前扩增片段化的核酸。在一些实施方案中,包含条形码的片段化核酸可以扩散到包含捕获探针并固定在流动池上的流动池的不同部分。在一些实施方案中,固定化的片段化核酸可以经受桥接扩增。
在上述方面的一些实施方案中,通过流动池的细胞是单细胞。在一些实施方案中,可评估整个转录组。在一些实施方案中,为了序列信息可以同时评估来自细胞或来自单细胞的DNA和RNA。在一些实施方案中,可以评估来自细胞或来自单细胞的蛋白质的身份或序列信息。在一些实施方案中,可以评估来自细胞或来自单细胞的其它分析物例如脂质、碳水化合物、细胞的细胞器。
使模板核酸片段化
制备模板核酸的一些实施方案可以包括对目标核酸进行片段化。在一些实施方案中,条形码编码的或索引化的衔接子附接到片段化的目标核酸。可以使用本领域众所周知的任何方法附接衔接子,例如连接(酶或化学)、标签片段化、聚合酶延伸等。在一些实施方案中,包含不连续转座子序列的转座体的插入可导致目标核酸的片段化。在包含环状转座体的一些实施方案中,可以在转座子序列的片段化位点将包含转座子序列的目标核酸片段化。可以在例如美国专利申请公开号2002/0208705、美国专利申请公开号2012/0208724和国际专利申请公开WO 02/061832中找到用于片段化用于本文提供的实施方案的目标核酸的方法的其它实例,其的每一个通过引用以其全部并入本文。
使单分子标签化(Tagging)
本发明提供了用于使分子标签化的方法,使得可以追踪和鉴定单个分子。然后可以将批量数据去卷积并转换回单个分子。当从原始分子到最终产物的过程改变原始群的(化学计量)表示时,区分单个分子并将信息返回关联到原始分子的能力是特别重要的。例如,扩增导致可偏向原始表示的重复(例如PCR复本或偏向的扩增)。这可以改变由于不均匀扩增和/或扩增偏性(amplification bias)引起的甲基化状态调用、拷贝数、等位基因比例。通过鉴定单个分子,在加工后,密码-标签化区分相同的分子。照此,可以滤除重复和扩增偏性,允许分子或分子群的原始表示的精确确定。
独特地标签化单分子的优点是,原始池中的相同分子由于其标签化而被独特地识别。在进一步的下游分析中,现在可以区分这些独特标签化的分子。该技术可开发用于其中使用扩增的测定方案中。例如,已知扩增会扭曲分子的混合群的原始表现。如果不使用独特的标签化,则原始表示(如拷贝数或等位基因比率)将需要考虑在表示中每个分子的偏性(已知或未知)。使用独特的标签化,可以通过去除复本和计数分子(每个具有独特的标签)的原始表示来准确地确定表示。因此,可以扩增和测序cDNA,而不用担心偏性,因为可以过滤数据,以便仅选择真实的序列或感兴趣的序列用于进一步分析。可以通过在具有相同条形码的许多读取中达成一致来构建准确的读取。
在本文所述的组合物和方法的一些实施方案中,优选在测定的早期阶段对原始群进行标签化,尽管如果较早的步骤不引起偏性或不重要,但可以在稍后阶段进行标签化。在任何这些应用中,条形码序列的复杂度应该大于待标签化的单个分子的数量。这确保不同的目标分子接收不同的和独特的标签。因此,一定长度(例如长度为5、10、20、30、40、50、100或200个核苷酸)的随机寡核苷酸库是所期望的。标签的随机库(random pool)代表具有密码空间4n的标签的大复杂度,其中n是核苷酸的数量。可以在不同的阶段掺入额外的密码(无论是设计的还是随机的)以用作进一步的检查,例如用于纠错的奇偶校验。
在本文所述的组合物和方法的一个实施方案中,将单个分子(例如目标DNA)附接至独特的标记物,例如独特的寡聚物序列和/或条形码。标记物的附接可以通过连接、偶联化学、吸附、转座子序列的插入等进行。其它方法包括扩增(例如通过PCR、RCA或LCR)、复制(例如通过聚合酶的添加)和非共价相互作用。
具体方法包括含有条形码(例如,设计的或随机的序列)至PCR引物,使得每个模板将在密码空间内接收单独的密码,从而产生可以与其它扩增子区分开的独特的扩增子。该概念可以应用于使用聚合酶扩增的任何方法,例如GoldenGateTM测定法和美国专利号7,582,420、7,955,794和8,003,354中所公开的测定法,其的每一个通过引用以其全部并入。密码-标签化的目标序列可以通过例如滚环扩增的方法进行环化和扩增,以产生密码-标签化的扩增子。类似地,密码也可以添加到RNA中。
分析模板核酸的方法
本文所述的技术的一些实施方案包括分析模板核酸的方法。在此类实施方案中,可以从模板核酸获得测序信息,并且该信息可以用于产生一个或更多个目标核酸的序列表示。
在本文所述的测序方法的一些实施方式中,可以使用连接的读取策略(linkedread strategy)。连接读取策略可以包括鉴定连接至少两个测序读取的测序数据。例如,第一次测序读取可以包含第一标志物(marker),并且第二次测序读取可以包含第二标志物。第一和第二标志物可以鉴定在目标核酸的序列表示中来自相邻的每个测序读取的测序数据。在本文所述的组合物和方法的一些实施方案中,标志物可以包括第一条形码序列和第二条形码序列,其中第一条形码序列可以与第二条形码序列配对。在其它实施方案中,标志物可以包括第一宿主标签和第二宿主标签。在更多实施方案中,标记物可以包括具有第一宿主标签的第一条形码序列和具有第二宿主标签的第二条形码序列。
用于测序模板核酸的方法的示例性实施方案可以包括以下步骤:(a)使用杂交至第一引物位点的测序引物对第一条形码序列进行测序;和(b)使用杂交至第二引物的测序引物对第二条形码序列进行测序。结果是两个序列读取,其有助于将模板核酸与其基因组邻居连接。鉴于足够长的读取和足够短的文库片段,可以在信息上合并这两个读取以制备覆盖整个片段的一个长读取。使用条形码序列读取和从插入中存在的9个核苷酸重复序列,现在可以将读取与它们的基因组邻居连接以便在计算机中形成长得多的“连接读取”。
如将理解的,包含模板核酸的文库可以包括重复的核酸片段。测序重复的核酸片段在包括为重复片段创建共有序列的方法中是有利的。此类方法可以提高为了向模板核酸和/或模板核酸的文库提供共有序列的准确性。
在本文所述的测序技术的一些实施方案中,进行实时序列分析。例如,可以通过同时获取和分析测序数据来进行实时测序。在一些实施方案中,获得测序数据的测序方法可以在各个点终止,包括在获得目标核酸序列数据的至少一部分之后或在整个核酸读取被测序之前。在国际专利公开号WO 2010/062913中提供了示例性方法、系统和进一步的实施方案,其公开内容通过引用以其全部并入本文。
在用于使用连接的读取策略组装短测序读取的方法的示例性实施方案中,将包含条形码的转座子序列插入到基因组DNA中,制备文库并获得用于模板核酸的文库的测序数据。可以通过鉴定配对的条形码来组装模板块,然后组装更大的重叠群。在一个实施方案中,通过使用重叠读取的密码配对,组装的读数可以进一步组装成更大的重叠群。
本文所述的测序技术的一些实施方案包括错误检测和校正特征。错误的实例可包括测序过程期间在碱基调用中的错误,以及在将片段组装成更大重叠群中的错误。如将理解的,错误检测可以包括在检测数据集中的错误的存在或可能性,并且照此,可能不需要检测错误的位置或错误的数量。对于纠错,有关在数据集中错误的位置和/或错误的数量的信息是有用的。用于纠错的方法是本领域众所周知的。实例包括汉明距离(hammingdistance)的使用,以及校验和算法(checksum algorithm)的使用(参见,例如,美国专利申请公开号2010/0323348;美国专利号7,574,305;和美国专利号6,654,696,其公开内容通过引用以其全部并入本文)。
巢式文库(Nested libraries)
另一种方法涉及上述的结合标签化法(junction tagging method)和巢式测序文库的制备。巢式子文库由密码-加标签的DNA片段创建。这可以允许跨基因组更少频率的转座子标签化。它也可以创建(巢式)测序读取的更大的多样性。这些因素可以提高覆盖度和准确性。
二次采样和全基因组扩增可以创建起始分子的某些群的许多拷贝。然后通过转座子特异性片段化产生DNA片段,其中每个片段接收密码,该密码允许将片段返回与具有匹配密码的原始邻居(无论相同、互补或以其它方式信息上连接)连接。加标签的片段通过随机方法或序列特异性方法(例如酶消化、随机剪切、基于转座子的剪切或其它方法)至少第二次片段化,从而产生密码-标签化的DNA片段的亚文库。在前述方法的有用变型中,可以通过使用含有用于下游富集目的的生物素或其它亲和官能度的转座子来优先分离密码-标签化的片段。随后的文库制备将巢式DNA片段转化为测序模板。配对末端测序导致DNA片段的和目标DNA的密码-标签的序列确定。由于创建了用于相同密码-标签的巢式文库,因此可以用短读取对长DNA片段进行测序。
测序方法
本文所述的方法和组合物可以与各种测序技术结合使用。在一些实施方案中,确定目标核酸的核苷酸序列的方法可以是自动化方法。
本文所述的测序方法的一些实施方案包括通过合成(SBS)技术测序,例如焦磷酸测序技术。焦磷酸测序检测到无机焦磷酸盐(PPi)的释放,因为特定的核苷酸被掺入新生链中(Ronaghi等人,Analytical Biochemistry 242(1):84-9(1996);Ronaghi,M.GenomeRes.11(1):3-11(2001);Ronaghi等人,Science 281(5375):363(1998);美国专利号6,210,891;美国专利号6,258,568和美国专利好6,274,320,其的每一个通过引用以其全部并入本文)。
在SBS的另一实例性的类型中,循环测序通过逐步添加可逆终止子核苷酸来完成,该可逆终止子核苷酸含有例如可切割或可光漂白的染料标记物,例如在美国专利号7,427,67、美国专利号7,414,163和美国专利号7,057,026中所述的,其的每一个通过引用以其全部并入。这种由Illumina Inc.商业化的方法也描述于国际专利申请公开号WO 91/06678和WO 07/123744中,其的每一个通过引用以其全部并入本文。荧光标记的终止子的可用性(其中可以逆转终止并且可以切割荧光标记物)促进有效的循环可逆终止(CRT)测序。聚合酶也可以被共同工程化以有效地掺入这些修饰的核苷酸并从这些修饰的核苷酸延伸出来。
可用于本文所述方法和组合物的其它示例性SBS系统和方法描述于美国专利申请公开号2007/0166705,美国专利申请公开号2006/0188901,美国专利号7057026,美国专利申请公开号2006/0240439,美国专利申请公开号2006/0281109,PCT公开号WO 05/065814,美国专利申请公开号2005/0100900,PCT公开号WO 06/064199和PCT公开号WO 07/010251中,其的每一个通过引用以其全部并入。
本文所述的测序技术的一些实施方案可以通过连接技术利用测序。此类技术利用DNA连接酶掺入核苷酸并鉴定此类核苷酸的掺入。可与本文所述方法和组合物使用的示例性SBS系统和方法描述于美国专利号6,969,488,美国专利号6,172,218和美国专利6,306,597中,其的每一个通过引用以其全部并入。
本文所述的测序方法可以有利地以多种形式进行,使得同时操纵多个不同的目标核酸。在具体实施方案中,不同的目标核酸可以在常见的反应容器中或在特定的基板的表面上进行处理。这以多重方式允许方便地递送测序试剂,去除未反应的试剂和检测掺入事件。在使用表面结合目标核酸的实施方案中,目标核酸可以是以阵列形式。以阵列形式,目标核酸通常可以以空间上可区分的方式偶联到表面。例如,目标核酸可以通过直接共价附,附接于珠或其它颗粒或与聚合酶或与附接至表面的其它分子相关联而结合。阵列可以包括在每个位点的目标核酸的单拷贝(也称为特征),或者可以在每个位点或特征处存在具有相同序列的多拷贝。通过扩增方法例如桥联扩增或乳液PCR可以产生多拷贝,如本文进一步详细描述的。
本文提出的方法可以在各种密度中的任一个使用具有特征的阵列,包括例如至少约10个特征/cm2、100特征/cm2、500特征/cm2、1,000特征/cm2、5,000特征/cm2、10,000特征/cm2、100,000特征/cm2、100,000特征/cm2、5,000,000特征/cm2、107特征/cm2、5×107特征/cm2、108特征/cm2、5×108特征/cm2、109特征/cm2/、5×109特征/cm2或更高。
降低测序数据中错误率的方法
本文提供的方法和组合物的一些实施方案包括降低测序数据中的错误率。在一些此类实施方案中,双链目标核酸的有义链和反义链各自与不同的条形码相关联。扩增每个链,从扩增的链的多拷贝获得序列信息,并且从冗余序列信息产生目标核酸的共有序列表示。因此,序列信息可以源自每条链并从每条链鉴定。因此,当源自一条链的序列信息与来自另一条链的序列信息不一致时,可以鉴定和减少序列错误。
在一些实施方案中,目标核酸的有义链和反义链与不同的条形码相关联。条形码可以通过各种方法与目标核酸相关联,该方法包括衔接子的连接和转座子序列的插入。在一些此类实施方案中,Y-衔接子可以连接至目标核酸的至少一个末端。Y-衔接子可以包括双链序列和非互补链,每条链包含不同的条形码。可以扩增和测序具有连接的Y-衔接子的目标核酸,使得每个条形码可用于鉴定原始有义链或反义链。在Kinde I等人(2011)PNAS108:9530-9535中描述了类似的方法,其公开通过引用以其全部并入本文。在一些实施方案中,通过插入本文提供的转座子序列,目标核酸的有义链和反义链与不同的条形码相关联。在一些此类实施方案中,转座子序列可以包含不互补条形码。
此类方法的一些实施方案包括从目标双链核酸的链获得序列信息,其包括(a)从包含第一测序衔接子和第二测序衔接子(具有置于其间的双链目标核酸的至少一部分)的模板核酸获得序列数据,其中:(i)第一测序衔接子包含双链第一条形码、单链第一引物位点和单链第二引物位点,其中第一和第二引物位点是不互补的,和(ii)第二测序衔接子,其包含双链第二条形码、单链第三引物位点和单链第四引物位点,其中第三和第四引物位点是不互补的。在一些实施方案中,模板核酸的有义链的第一引物位点和模板核酸的反义链的第三引物位点包含相同的序列。在一些实施方案中,每个条形码是不同的。在一些实施方案中,第一测序衔接子包含偶联第一引物位点和第二引物位点的单链发夹。
在另一个实施方案中,目标核酸的每个末端与包含不同条形码的衔接子相关联,使得来自核酸的有义链和反义链的延伸产物可以彼此区分。在一些实施方案中,选择引物位点序列和条形码,使得从退火至有义链的引物的延伸产生可以与从退火至反义链的引物的延伸的产物区分开的产物。在实例中,3'有义引物位点与3'反义引物位点相同,但不同于5'有义和5'反义引物位点两者。退火到3'有义引物位点和3'反义引物位点的引物的延伸将产生从每条链的以下产物:
有义链:(5')条形码2-[目标序列]-条形码1(3')
反义链:(5')条形码1-[目标序列]-条形码2(3')
因此,从核酸的有义链和反义链的延伸产物可以彼此区分。在Schmitt M.W.,等人.,PNAS(2012)109:14508-13中示出了示例性方法,其公开通过引用以其全部并入本文。在一些此类方法中,条形码和引物位点可以通过多种方法与目标核酸相关联,该方法包括衔接子的连接和转座子序列的插入。在一些实施方案中,可以设计转座子序列以提供具有发夹的衔接子。发夹提供维持目标核酸的有义链和反义链的物理邻近性的能力。可以使用包含本文所述的接头的转座子序列制备包含发夹的模板核酸。接头的实例包括单链核酸。
制备用于从双链目标核酸的每条链获得序列信息的模板核酸的文库的一些实施方案包括(a)提供转座体群,所述转座体包含转座酶和第一转座子序列,所述第一转座子序列包含:(i)第一转座酶识别位点、第一引物位点和第一条形码,和(ii)第二转座子序列,其包含第二转座酶识别位点、第二引物位点和第二条形码,其中第一转座子序列与第二转座子序列是不连续的;和(b)在条件下使转座体与双链核酸接触,使得所述第一和第二转座子序列插入双链目标核酸中,从而制备模板核酸的文库用于从双链目标核酸的每条链中获得序列信息。在一些实施方案中,转座体群还含有包含转座酶和转座子序列的转座体,所述转座子序列包含第三转座酶识别位点和第四转座酶识别位点,具有置于其间的条形码序列,所述条形码序列包括第三条形码和第四条形码,具有置于其间的测序衔接子,所述测序衔接子包含第三引物位点和第四引物位点,具有置于其间的接头。在一些实施方案中,模板核酸的有义链的第一引物位点和模板核酸的反义链的第三引物位点包含相同的序列。一些实施方案还包括步骤(c)选择包含转座子序列的模板核酸,其中第一转座子序列与包含接头的第二转座子序列是不连续的。在一些实施方案中,接头包含适于与捕获探针结合的亲和标签。在一些实施方案中,亲和标签选自下组:His、生物素和链霉抗生物素蛋白质。在一些实施方案中,每个条形码是不同的。在一些实施方案中,接头包含单链核酸。在一些实施方案中,目标核酸包含基因组DNA。
获取单倍型信息的方法
本文提供的方法和组合物的一些实施方案包括从目标核酸获得单倍型信息的方法。单倍型信息可以包括确定在目标核酸(例如基因组)中在特定基因座处存在或不存在不同序列。例如,可获得针对等位基因的母亲和父亲拷贝的序列信息。在多倍体生物体中,可获得针对至少一种单倍型的序列信息。此类方法也可用于降低从目标核酸获得序列信息的错误率。
通常,获得单倍型信息的方法包括将核酸分布到一个或更多个隔室中,使得每个隔室包含相当于大约核酸的单倍型的核酸量,或相当于小于大约核酸的单倍型的核酸量。然后可以从每个隔室获得序列信息,从而获得单倍型信息。将模板核酸分布到多个容器中增加单个容器包含等位基因或SNP的单拷贝的可能性,或者从单个容器获得的共有序列信息反映等位基因或SNP的序列信息的可能性。如将理解的,在一些此类实施方案中,模板核酸可以在将模板核酸分隔成多个容器之前进行稀释。例如,每个容器可以含有等于目标核酸的大约单倍型等同物的目标核酸的量。在一些实施方案中,容器可以包含小于目标核酸的约一个单倍型等同物。
确定单倍型信息的方法、用虚拟隔室进行单倍型分析的方法、制备用于单倍型分析的目标核酸的方法描述于WIPO公开WO/2014/142850中,其通过引用并入本文。
实施例
实施例1:维持模板邻近性
本实施例说明了用于在CE内维持模板核酸的邻近信息的方法。使用包含不连续转座子序列的转座体制备模板核酸,其中Tn5转座酶保持结合至转座后的模板DNA。目标核酸与包含Tn5转座酶和不连续转座子序列的转座体接触。用SDS进一步处理的样品可能显示为模板核酸的各种片段的涂片;未用SDS处理的样品可能显示推定的高分子量模板核酸的保留。因此,即使可以将核酸片段化,相邻序列仍然可以通过转座酶彼此相关联。
在又一示例性方法中,用包含人染色体的目标核酸,使用包含不连续转座子序列的转座体制备模板核酸文库。CE包含目标核酸。对于其中稀释后通过SDS去除转座酶的样品,可以观察到DNA的单倍型阻断。因此,通过实施本文所述的方法,当转座、稀释、以及转化成测序文库时,目标核酸可以保持目标完整性。
本文所用的术语“包含(comprising)”是“包括(including)”、“含有(containing)”或“特征在于(characterized by)”的同义词,并且是包容性的或开放式的,并且不排除额外的未列举的要素(element)或方法步骤。
在说明书中使用的表示组分的量、反应条件等的所有数字应被理解为在所有情况下被术语“约”修饰。因此,除非有相反指示,否则本文所述的数值参数是近似值,其可以根据寻求获得的所期望性质而变化。至少,并不是如将等同原则的应用限制在要求本申请优先权的任何申请中的任何权利要求的范围的尝试,每个数值参数应根据有效数字的数量和常规的舍入法来解释。
上述说明书公开了本发明的几种方法和材料。本发明在方法和材料上易于修改,并且在制造方法和设备上易于改变。通过考虑本文公开的本发明的这一公开或实践,此类修改对于本领域技术人员将变得显而易见。因此,本发明并不旨在限于本文公开的具体实施方式,而是涵盖进入本发明的真实范围和精神内的所有修改和替代方案。
本文引用的所有参考文献,包括但不限于已发表和未发表的申请、专利和参考文献,其通过引用以其全部并入本文,并由此作为本说明书的一部分。在通过引用并入的出版物和专利或专利申请与说明书中包含的公开内容相矛盾的程度上,本说明书旨在取代和/或优先于任何这种相互矛盾的材料。
实施例2:单细胞全转录组测序
本实施例描述了一种方法,该方法用于在cDNA整个长度上进行均匀条形码编码并使用条形码来确定cDNA的邻近信息以及鉴定细胞来源,即鉴定与mRNA相关的单细胞。
本实施例说明了用于测序单细胞转录组的方法。在本实施例中,使用液滴微流体(droplet microfluidics)捕获在单个捕获珠上的多个单细胞的转录组,然后使用邻近保留转座和组合索引化(CPT-seq)以条形码编码源自每个单细胞的转录组的cDNA。在一个实施方案中,本发明的方法使用多个条形码编码方法以对单细胞cDNA进行索引化,其中在标签片段化反应中加入第一条形码,并在PCR扩增反应中加入第二条形码。
在一个实例中,从单细胞捕获poly-A+RNA,并且批量处理捕获的poly-A+RNA用于产生多重测序文库。
该方法可以包括以下步骤。在步骤1,将来自单细胞的RNA捕获在捕获珠上。例如,将多个单细胞(例如,约1000个单细胞)包封在包含裂解缓冲液和捕获珠的单个液滴(即,平均每个液滴一个细胞和一个珠)中。在捕获珠的表面上固定的是多个捕获探针,其包括多聚-dT(poly-dT)捕获序列和PCR引物序列。液滴的裂解缓冲液组合物解离单细胞胞质膜,释放胞质RNA。通过将RNA上的多聚-A(poly-A)+序列杂交至固定在共包封的捕捉珠的表面上的寡聚-dT(oligo-dT)捕获序列来捕获释放的多聚-A+RNA。每个捕获珠现在包括来自单细胞的转录组的多聚-A+RNA。来自单细胞的所有多聚-A+RNA在捕获珠上保持彼此接近。
在步骤2,将其上具有单细胞多聚-A+RNA的捕获珠从多个液滴(例如,约1000个捕获珠)合并,并合成双链cDNA。例如,将捕获珠合并、洗涤,并使用能够进行链转换的RNA酶H减去逆转录酶来合成第一链cDNA。在第一链cDNA合成期间包括链转换引物,允许在cDNA的3'末端放置通用引物位点。然后在PCR反应中使用通用引物和高保真DNA聚合酶制备双链cDNA(例如,PCR的1至2个循环)。每个捕获珠现在包括从单细胞的多聚-A+RNA逆转录的cDNA。
在步骤3,将其上具有双链cDNA的捕获珠分布在96孔板的孔中,使得每孔约有10个捕获珠。
在步骤4中,使用96个独特索引化的转座体对每个孔中的双链cDNA进行标签片段化。标签片段化用于用衔接子和索引序列修饰cDNA,同时保持单细胞邻接。在标签片段化反应中使用的96个独特索引化的转座体组合物的组装在下面更详细地描述。标签片段化反应为每个未来的cDNA片段添加二分条形码的第一部分。每个捕获珠现在包括来自单细胞的标签片段化的cDNA。
在步骤5,收集所有孔中的捕获珠,合并,洗涤并重新分布到另一个96孔板的孔中,使得每孔有约10个捕获珠。来自单个细胞的mRNA/cDNA停留在单个珠的表面上,并且转座酶仍然结合到片段化的cDNA上并保持片段免于离解。
在步骤6,从捕获珠释放转座酶和标签片段化的cDNA。例如,将SDS(1%SDS)溶液的等分试样加入到每个孔中以从捕获珠释放结合的转座酶和标签片段化的cDNA。
在步骤7,使用包括P5或P7序列和独特条形码序列的PCR引物扩增每个孔中的标签片段化的cDNA。例如,将条形码编码的P5和P7 PCR引物的96个独特组合中的一个添加到每个孔中,并扩增标签片段化的cDNA片段。PCR反应将二分条形码的剩余部分添加至每个cDNA片段。每个cDNA片段现在包括4个条形码序列:在标签片段化反应中添加的两个序列和在PCR扩增期间添加的2个序列。因此,通过标签片段化索引和通过扩增步骤添加的PCR索引的组合来鉴定来自单个细胞的mRNA/cDNA。
在步骤8,将来自每个孔的条形编码的cDNA片段合并并测序。
在本实施例中,96×96组合索引化用于条形码编码约1000个单细胞,具有具备相同条形码的两个细胞的大约5%的几率。通过增加“隔室”的数量可以容易地扩大通量。例如,通过使用384×384组合条形码编码(大约147,456个虚拟隔室),各自平行地条形码编码大约10,000个单细胞,具有具备相同条形码的两个细胞的大约3%的几率。
本实施例还描述了组装96个独特的条形编码转座体复合物的过程,用于在组合条形码编码方案中添加二分条形码的第一部分。该过程包括但不限于以下步骤。
在步骤A中,通过将各自索引化的寡核苷酸(每一个在其3'末端含有Tn5镶嵌末端(ME))退火至通用的5'磷酸化的ME互补寡核苷酸(pMENTS),形成20个独特索引化的转座子。例如,将包括P5序列、独特的8碱基“i5”索引序列、通用连接子(connector)序列Universalconnector A-C15的索引化寡核苷酸1110和ME序列退火至ME互补序列1115。ME互补序列1115是通用5'磷酸化寡核苷酸(pMENTS),其与索引化的寡核苷酸1110中的ME序列是互补的。随后使用通用连接子序列A-C15以退火定制索引2(custom index 2)测序引物。
执行第二组退火反应(即,12个单独的退火反应)以形成12个转座子的第二组,每个转座子包含与P7序列相邻的独特的8碱基“i7”索引序列。例如,将包括P7序列、独特的8碱基i7索引序列、通用连接子序列B-D15和ME序列的索引化寡核苷酸1120退火至ME互补序列1115。随后使用通用连接子序列B-D15以退火定制索引1(custom index 1)测序引物。
在步骤B中,在单独反应中用Tn5转座酶组装退火的P5_i5转座子1125(即,各具有独特的8碱基i5索引序列的8个P5_i5转座子1125)和退火的P7_i7转座子1130(即,各具有独特的8碱基i7索引序列的12个转座子1130)以形成转座体复合物。例如,将每个退火的P5_i5转座子1125与Tn5转座酶1135在约37℃孵育约1小时以形成P5_i5转座体复合体1140。类似地,将每个退火的P7_i7转座子1130与Tn5转座酶1135在约37℃孵育约1小时形成P7_i7转座体复合物1145。
在步骤C中,通过将P5_i5转座体复合物1140的等分试样与P7_7转座体复合物1145的等分试样组合来制备96个独特的转座体复合物。例如,将P5_i5转座体复合物1140等分到96孔板的A至H行中,并且将P7_i7转座体复合物1145等分到相同96孔板的第1至第12列中。8个P5_i5转座体复合物1140和12个P7_i7转座体复合物1145的组合产生96个不同的索引组合。
为了评估组装的转座体复合物,使用单次标签片段化反应和单次PCR反应制备来自10个单细胞的测序文库。合并10个包含来自10个单细胞的cDNA的捕获珠,并使用P5_i5_1加P7_i7_1转座体混合物进行标签片段化。然后将标签化的cDNA从捕获珠释放,并使用条形码编码的P5和P7引物进行PCR扩增以产生测序文库。然后使用生物分析仪(Bioanalyzer)分析测序文库中的片段大小分布。在一些实施方案中,在PCR之后进行清理。在一些实施方案中,在第一SPRI清理之后进行第二SPRI清理。在一些实施方案中,在生物分析仪中进行分析之前,将样品稀释10倍。
在另一个实例中,使用两种不同的转座体复合物混合物以从100个单细胞制备测序文库。在该实例中,使用分离和合并实验设计来评估转座体复合物。将包含来自100个单细胞的cDNA的100个捕获珠分布到两个标签片段化反应中,使用P5_i5_2加P7_i7_2转座体混合物进行一次标签片段化反应,并使用P5_i5_3加P7_i7_3转座体混合物进行第二标签片段化反应。标签片段化反应后,合并来自每个反应的捕获珠并重新分布用于使用条形码编码的P5和P7 PCR引物的两种独特组合(即,P5和P7 PCR引物的第一组合以及P5和P7 PCR的第二组合引物)的PCR扩增以产生两个测序文库。然后使用生物分析仪分析每个测序文库中的片段大小分布。在单个0.7x SPRI清理步骤后分析条形编码的文库。

Claims (29)

1.分析多个邻近保留元件(CE)的一个或多个分析物的方法,所述方法包括:
(a)提供多个CE,其中所述CE是以紧密接近保留分析物的物理实体;
(b)将所述CE分隔成多个第一隔室,其中每个隔室包含多个CE;
(c)向所述多个第一隔室的每一个中的每个CE的分析物提供第一报告物部分的集合,其中向每个第一隔室的所述分析物提供的所述第一报告物部分的集合中的每个第一报告物部分不同于向其他第一隔室中每个的所述分析物提供的所述第一报告物部分;
(d)将包含所述第一报告物部分的所述CE组合;
(e)将包含所述第一报告物部分的所述CE分裂成多个第二隔室;
(f)向所述多个第二隔室的每一个中的每个CE的分析物提供第二报告物部分的集合,其中向每个第二隔室的所述分析物提供的所述第二报告物部分的集合中的每个第二报告物部分不同于向其他第二隔室中每个的所述分析物提供的所述第二报告物部分;
(g)将包含所述第一和第二报告物部分的所述CE组合;
(h)分析包含每个隔室的所述报告物部分的所述分析物,
其中此类分析检测作为每个分析物来源的单细胞。
2.权利要求1的方法,其中所述CE是细胞、包埋的细胞或保留的细胞。
3.权利要求1的方法,其中步骤(e)的每个隔室包含多个CE。
4.权利要求1的方法,其中所述分析物包含核酸,并且所述第一报告物部分通过标签片段化、连接或PCR引入。
5.权利要求1的方法,其中所述分析物包含核酸,并且所述第一报告物部分通过将RNA转录为cDNA引入。
6.权利要求1的方法,其中所述分析物包含核酸,并且所述第二报告物部分通过标签片段化、连接或PCR引入。
7.权利要求1的方法,其中所述第一报告物部分包含核酸条形码。
8.权利要求1的方法,其中所述第二报告物部分包含核酸条形码。
9.权利要求1-8中任一项的方法,其中在步骤(h)之前,所述方法进一步包括:将包含所述第一和第二报告物部分的所述CE分裂成多个第三隔室;向所述多个第三隔室的每一个中每个CE的所述分析物提供第三报告物部分的集合,其中向每个第三隔室的所述分析物提供的所述第三报告物部分的集合中的每个第三报告物部分不同于向其他第三隔室中每个的所述分析物提供的所述第三报告物部分;和将包含所述第一、第二和第三报告物部分的所述CE组合。
10.权利要求9的方法,其中所述分析物包含核酸,并且所述第三报告物部分通过标签片段化、连接或PCR引入。
11.权利要求9的方法,其中所述第三报告物部分包含核酸条形码。
12.权利要求1-8中任一项的方法,其中用额外的报告物部分的一个或多个集合重复步骤(b)-(g)。
13.权利要求1的方法,其中所述分析物包含DNA、RNA或cDNA。
14.权利要求13的方法,其中所述DNA包含基因组DNA。
15.权利要求1-8、13或14中任一项的方法,其中使用所述第一报告物部分鉴定每个单细胞的样品来源。
16.权利要求1-8、13或14中任一项的方法,其中同时进行来自同一CE的分析物的检测。
17.组合物,其包含多个隔室,每个隔室包含多个CE,
其中每个CE包含分析物,所述分析物包含第一报告物部分和第二报告物部分,
其中基本上所有CE的分析物以独特的组合、独特的位置或其组合包含所述第一报告物部分和所述第二报告物部分。
18.权利要求17的组合物,其中每个CE以独特的组合、独特的位置或其组合包含所述第一报告物部分和所述第二报告物部分。
19.权利要求17的组合物,其中所述隔室包含三维固体支持物。
20.权利要求19的组合物,其中所述三维固体支持物包含多孔板。
21.权利要求17的组合物,其中所述CE是细胞、包埋的细胞或保留的细胞。
22.权利要求17-21中任一项的组合物,其中所述分析物包含核酸。
23.权利要求22的组合物,其中所述分析物包含DNA、RNA或cDNA。
24.权利要求23的组合物,其中所述DNA包含基因组DNA。
25.权利要求17-21中任一项的组合物,其中所述第一报告物部分包含核酸条形码。
26.权利要求17-21中任一项的组合物,其中所述第二报告物部分包含核酸条形码。
27.权利要求17-21中任一项的组合物,其中所述多个CE包含至少100,000个CE。
28.权利要求17-21中任一项的组合物,其中所述多个CE包含至少1,000,000个CE。
29.权利要求17-21中任一项的组合物,其中所述CE包含报告物部分的额外的集合,
其中每个CE的所述分析物以独特的组合、独特的位置或其组合包含所述第一报告物部分、所述第二报告物部分和所述报告物部分的额外的集合。
CN202310862581.9A 2015-02-10 2016-02-10 用于分析细胞组分的方法和组合物 Pending CN117106871A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562114505P 2015-02-10 2015-02-10
US62/114,505 2015-02-10
PCT/US2016/017391 WO2016130704A2 (en) 2015-02-10 2016-02-10 Methods and compositions for analyzing cellular components
CN201680017121.4A CN107406890B (zh) 2015-02-10 2016-02-10 用于分析细胞组分的方法和组合物

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201680017121.4A Division CN107406890B (zh) 2015-02-10 2016-02-10 用于分析细胞组分的方法和组合物

Publications (1)

Publication Number Publication Date
CN117106871A true CN117106871A (zh) 2023-11-24

Family

ID=55587329

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202310862581.9A Pending CN117106871A (zh) 2015-02-10 2016-02-10 用于分析细胞组分的方法和组合物
CN202310017511.3A Pending CN116083546A (zh) 2015-02-10 2016-02-10 用于分析细胞组分的方法和组合物
CN201680017121.4A Active CN107406890B (zh) 2015-02-10 2016-02-10 用于分析细胞组分的方法和组合物

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202310017511.3A Pending CN116083546A (zh) 2015-02-10 2016-02-10 用于分析细胞组分的方法和组合物
CN201680017121.4A Active CN107406890B (zh) 2015-02-10 2016-02-10 用于分析细胞组分的方法和组合物

Country Status (14)

Country Link
US (2) US11634707B2 (zh)
EP (2) EP3725893A1 (zh)
JP (1) JP7001475B2 (zh)
KR (3) KR20200020997A (zh)
CN (3) CN117106871A (zh)
AU (2) AU2016219328B2 (zh)
BR (1) BR112017017025B1 (zh)
CA (2) CA3174951A1 (zh)
DK (1) DK3256604T3 (zh)
ES (1) ES2786652T3 (zh)
PT (1) PT3256604T (zh)
RU (2) RU2717491C2 (zh)
SG (2) SG10202104816QA (zh)
WO (1) WO2016130704A2 (zh)

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2625288T3 (es) 2011-04-15 2017-07-19 The Johns Hopkins University Sistema de secuenciación segura
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20150376609A1 (en) 2014-06-26 2015-12-31 10X Genomics, Inc. Methods of Analyzing Nucleic Acids from Individual Cells or Cell Populations
ES2701742T3 (es) 2012-10-29 2019-02-25 Univ Johns Hopkins Prueba de Papanicolaou para cánceres de ovario y de endometrio
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA2894694C (en) 2012-12-14 2023-04-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA2900481A1 (en) 2013-02-08 2014-08-14 10X Genomics, Inc. Polynucleotide barcode generation
EP3795697A1 (en) 2014-02-04 2021-03-24 Jumpcode Genomics, Inc. Genome fractioning
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
CN107407638B (zh) 2014-12-03 2021-01-12 伊索普莱西斯公司 细胞分泌特征的分析和筛选
SG11201705615UA (en) 2015-01-12 2017-08-30 10X Genomics Inc Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
EP3262407B1 (en) 2015-02-24 2023-08-30 10X Genomics, Inc. Partition processing methods and systems
US10968536B2 (en) * 2015-02-25 2021-04-06 Jumpcode Genomics, Inc. Methods and compositions for sequencing
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
US11371094B2 (en) 2015-11-19 2022-06-28 10X Genomics, Inc. Systems and methods for nucleic acid processing using degenerate nucleotides
US11339427B2 (en) 2016-02-12 2022-05-24 Jumpcode Genomics, Inc. Method for target specific RNA transcription of DNA sequences
DK3452591T3 (da) 2016-05-02 2023-09-18 Encodia Inc Makromolekyleanalyse under anvendelse af nukleinsyrekodning
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10894990B2 (en) 2016-05-17 2021-01-19 Shoreline Biome, Llc High throughput method for identification and sequencing of unknown microbial and eukaryotic genomes from complex mixtures
US11708574B2 (en) 2016-06-10 2023-07-25 Myriad Women's Health, Inc. Nucleic acid sequencing adapters and uses thereof
KR102475710B1 (ko) 2016-07-22 2022-12-08 오레곤 헬스 앤드 사이언스 유니버시티 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
WO2018057779A1 (en) * 2016-09-23 2018-03-29 Jianbiao Zheng Compositions of synthetic transposons and methods of use thereof
EP3518974A4 (en) 2016-09-29 2020-05-27 Myriad Women's Health, Inc. NON-INVASIVE PRENATAL SCREENING USING DYNAMIC ITERATIVE DEEP OPTIMIZATION
WO2018089910A2 (en) 2016-11-11 2018-05-17 IsoPlexis Corporation Compositions and methods for the simultaneous genomic, transcriptomic and proteomic analysis of single cells
US11525783B2 (en) 2016-11-22 2022-12-13 IsoPlexis Corporation Systems, devices and methods for cell capture and methods of manufacture thereof
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA3048863A1 (en) * 2016-12-29 2018-07-05 Illumina, Inc. Analysis system for orthogonal access to and tagging of biomolecules in cellular compartments
EP3573646B1 (en) * 2017-01-27 2022-02-23 Integrated DNA Technologies, Inc. Construction of next generation sequencing (ngs) libraries using competitive strand displacement
US10894979B2 (en) 2017-01-27 2021-01-19 Integrated Dna Technologies, Inc. Construction of next generation sequencing (NGS) libraries using competitive strand displacement
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
US10968447B2 (en) 2017-01-31 2021-04-06 Myriad Women's Health, Inc. Methods and compositions for enrichment of target polynucleotides
US10752946B2 (en) 2017-01-31 2020-08-25 Myriad Women's Health, Inc. Methods and compositions for enrichment of target polynucleotides
US10995333B2 (en) 2017-02-06 2021-05-04 10X Genomics, Inc. Systems and methods for nucleic acid preparation
KR102607830B1 (ko) * 2017-02-21 2023-12-01 일루미나, 인코포레이티드 링커를 갖는 고정된 트랜스포좀을 사용한 태그먼트화
WO2018175907A1 (en) 2017-03-24 2018-09-27 Counsyl, Inc. Copy number variant caller
EP3615671B1 (en) 2017-04-23 2021-07-21 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
EP3615692A1 (en) 2017-04-23 2020-03-04 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
US10934584B2 (en) 2017-04-23 2021-03-02 Illumina, Inc. Compositions and methods for improving sample identification in indexed nucleic acid libraries
AU2018260627A1 (en) 2017-04-23 2019-11-14 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA3060369A1 (en) 2017-05-01 2018-11-08 Illumina, Inc. Optimal index sequences for multiplex massively parallel sequencing
US20180320173A1 (en) * 2017-05-05 2018-11-08 Scipio Bioscience Methods for trapping and barcoding discrete biological units in hydrogel
CA3062174A1 (en) 2017-05-08 2018-11-15 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples
US11530436B2 (en) 2017-05-23 2022-12-20 President And Fellows Of Harvard College Multiplex end-tagging amplification of nucleic acids
CN116064732A (zh) 2017-05-26 2023-05-05 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
US10400235B2 (en) 2017-05-26 2019-09-03 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
DK3981884T3 (da) 2017-06-07 2023-09-04 Univ Oregon Health & Science Enkeltcelle-helgenombiblioteker til methyleringssekventering
CN110785813A (zh) 2017-07-31 2020-02-11 伊鲁米那股份有限公司 具有多路生物样本聚合的测序系统
US11352668B2 (en) 2017-08-01 2022-06-07 Illumina, Inc. Spatial indexing of genetic material and library preparation using hydrogel beads and flow cells
SG11202001010UA (en) 2017-08-07 2020-03-30 Univ Johns Hopkins Methods and materials for assessing and treating cancer
ES2924185T3 (es) 2017-09-25 2022-10-05 Fred Hutchinson Cancer Center Perfiles in situ de alta eficiencia dirigidos a todo el genoma
US10590244B2 (en) 2017-10-04 2020-03-17 10X Genomics, Inc. Compositions, methods, and systems for bead formation using improved polymers
US10837047B2 (en) 2017-10-04 2020-11-17 10X Genomics, Inc. Compositions, methods, and systems for bead formation using improved polymers
SG11202003924YA (en) 2017-10-31 2020-05-28 Encodia Inc Kits for analysis using nucleic acid encoding and/or label
SG11201913654QA (en) 2017-11-15 2020-01-30 10X Genomics Inc Functionalized gel beads
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
KR102370055B1 (ko) * 2018-01-08 2022-03-03 일루미나, 인코포레이티드 반도체-기반 검출을 사용하는 고-처리율 서열분석용 시스템 및 디바이스
WO2019157529A1 (en) 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
CA3067140C (en) 2018-02-13 2023-03-21 Illumina, Inc. Dna sequencing using hydrogel beads
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
US20190367909A1 (en) 2018-04-02 2019-12-05 Illumina, Inc. Compositions and methods for making controls for sequence-based genetic testing
SG11202009889VA (en) 2018-04-06 2020-11-27 10X Genomics Inc Systems and methods for quality control in single cell processing
EP3781706A1 (en) * 2018-04-20 2021-02-24 Illumina, Inc. Methods of encapsulating single cells, the encapsulated cells and uses thereof
CN112334578A (zh) * 2018-05-07 2021-02-05 比特拜欧姆株式会社 进行单细胞分析的方法及其装置
EP4269618A3 (en) * 2018-06-04 2024-01-10 Illumina, Inc. Methods of making high-throughput single-cell transcriptome libraries
US11703427B2 (en) 2018-06-25 2023-07-18 10X Genomics, Inc. Methods and systems for cell and bead processing
US20200032335A1 (en) 2018-07-27 2020-01-30 10X Genomics, Inc. Systems and methods for metabolome analysis
CA3113271A1 (en) 2018-10-26 2020-04-30 Illumina, Inc. Modulating polymer beads for dna processing
US20220010373A1 (en) * 2018-11-07 2022-01-13 The University Of Tokyo Method for detecting genome-related information of cell coexisting with at least one type of test substance
CN109540855B (zh) * 2018-11-07 2021-03-23 沈阳化工大学 一种荧光金壳磁性椭球的制备方法
FI3887540T3 (fi) * 2018-11-30 2023-09-14 Illumina Inc Useiden analyyttien analyysi käyttäen yhtä määritystä
CN112654718A (zh) 2018-12-05 2021-04-13 伊卢米纳剑桥有限公司 通过桥式扩增进行簇生成的方法和组合物
US11459607B1 (en) 2018-12-10 2022-10-04 10X Genomics, Inc. Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes
WO2020126602A1 (en) 2018-12-18 2020-06-25 Illumina Cambridge Limited Methods and compositions for paired end sequencing using a single surface primer
BR112020026667A2 (pt) 2018-12-19 2021-07-27 Illumina, Inc. métodos para melhorar a prioridade de clonalidade do agrupamento de polinucleotídeo
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
TW202100247A (zh) 2019-01-29 2021-01-01 美商伊路米納有限公司 流通槽
TW202043486A (zh) 2019-01-29 2020-12-01 美商伊路米納有限公司 定序套組
TW202045709A (zh) 2019-01-29 2020-12-16 美商伊路米納有限公司 流體槽
EP3921081A4 (en) 2019-02-04 2022-11-30 Illumina Inc MICROFLUIDIC DROPLET GENERATORS
US11851683B1 (en) 2019-02-12 2023-12-26 10X Genomics, Inc. Methods and systems for selective analysis of cellular samples
WO2020180778A1 (en) 2019-03-01 2020-09-10 Illumina, Inc. High-throughput single-nuclei and single-cell libraries and methods of making and of using
MX2021003760A (es) 2019-04-29 2021-09-21 Illumina Inc Identificacion y analisis de muestras microbianas por incubacion rapida y enriquecimiento de acido nucleico.
CA3138367A1 (en) 2019-04-30 2020-11-05 Encodia, Inc. Methods for preparing analytes and related kits
US11137385B2 (en) 2019-05-31 2021-10-05 Illumina, Inc. Obtaining information from a biological sample in a flow cell
CN111088331B (zh) * 2019-12-16 2023-04-14 中国科学院苏州生物医学工程技术研究所 一种基于压电声波传感器的单分子测序方法
CA3134746A1 (en) 2019-12-19 2021-06-24 Illumina, Inc. High-throughput single-cell libraries and methods of making and of using
AU2021271637A1 (en) 2020-05-12 2022-12-08 Illumina Singapore Pte. Ltd. Generating nucleic acids with modified bases using recombinant terminal deoxynucleotidyl transferase
WO2021252617A1 (en) 2020-06-09 2021-12-16 Illumina, Inc. Methods for increasing yield of sequencing libraries
AU2021299216A1 (en) 2020-06-30 2022-12-08 Illumina, Inc. Catalytically controlled sequencing by synthesis to produce scarless DNA
JP2023532905A (ja) 2020-07-08 2023-08-01 イルミナ インコーポレイテッド トランスポソーム担体としてのビーズ
US20230265499A1 (en) * 2020-08-14 2023-08-24 Factorial Diagnostics, Inc. In Situ Library Preparation for Sequencing
WO2022040176A1 (en) * 2020-08-18 2022-02-24 Illumina, Inc. Sequence-specific targeted transposition and selection and sorting of nucleic acids
EP4229216A1 (en) * 2020-10-15 2023-08-23 The Board of Trustees of the Leland Stanford Junior University Detection and analysis of structural variations in genomes
KR102576409B1 (ko) * 2021-01-18 2023-09-08 충남대학교병원 알지네이트 비드 매개의 세포절편 제작방법
WO2022182682A1 (en) 2021-02-23 2022-09-01 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
KR102526386B1 (ko) * 2021-03-19 2023-05-02 충남대학교병원 알지네이트와 pva 복합비드를 매개로 하는 세포절편 제작방법
CN117597453A (zh) 2021-06-23 2024-02-23 伊鲁米纳公司 用于测序试剂的组合物、方法、试剂盒、料筒和系统
US11753677B2 (en) 2021-11-10 2023-09-12 Encodia, Inc. Methods for barcoding macromolecules in individual cells
US20230193147A1 (en) 2021-12-21 2023-06-22 Illumina Cambridge Limited Wax-microsphere matrix compositions and methods of making and using the same
EP4206674A1 (en) 2021-12-28 2023-07-05 Encodia, Inc. High-throughput serotyping and antibody profiling assays
AU2022424380A1 (en) 2021-12-29 2024-01-18 Illumina, Inc. Methods of nucleic acid sequencing using surface-bound primers
WO2023196572A1 (en) 2022-04-07 2023-10-12 Illumina Singapore Pte. Ltd. Altered cytidine deaminases and methods of use
US20230348967A1 (en) 2022-04-29 2023-11-02 Illumina Cambridge Limited Methods and systems for encapsulating lyophilised microspheres
EP4272764A1 (en) 2022-05-03 2023-11-08 Scipio Bioscience Method of complexing biological units with particles
GB202208728D0 (en) * 2022-06-14 2022-07-27 Cambridge Entpr Ltd Methods for spatial genomic, epigenomic and multi-omic profiling using transposases and light-activated spatial barcoding
WO2023245129A2 (en) * 2022-06-15 2023-12-21 Quantum-Si Incorporated Directed protein evolution
WO2024073047A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Cytidine deaminases and methods of use in mapping modified cytosine nucleotides
WO2024073043A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Methods of using cpg binding proteins in mapping modified cytosine nucleotides
WO2024069581A1 (en) 2022-09-30 2024-04-04 Illumina Singapore Pte. Ltd. Helicase-cytidine deaminase complexes and methods of use

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
US5386023A (en) 1990-07-27 1995-01-31 Isis Pharmaceuticals Backbone modified oligonucleotide analogs and preparation thereof through reductive coupling
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US5644048A (en) 1992-01-10 1997-07-01 Isis Pharmaceuticals, Inc. Process for preparing phosphorothioate oligonucleotides
US5637684A (en) 1994-02-23 1997-06-10 Isis Pharmaceuticals, Inc. Phosphoramidate and phosphorothioamidate oligomeric compounds
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
CA2256128A1 (en) 1998-12-29 2000-06-29 Stephen William Davies Coded dna processing
US6565727B1 (en) 1999-01-25 2003-05-20 Nanolytics, Inc. Actuators for microfluidics without moving parts
US6294063B1 (en) 1999-02-12 2001-09-25 Board Of Regents, The University Of Texas System Method and apparatus for programmable fluidic processing
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
EP1368460B1 (en) 2000-07-07 2007-10-31 Visigen Biotechnologies, Inc. Real-time sequence determination
US8529743B2 (en) 2000-07-25 2013-09-10 The Regents Of The University Of California Electrowetting-driven micropumping
US6773566B2 (en) 2000-08-31 2004-08-10 Nanolytics, Inc. Electrostatic actuators for microfluidics and methods for using same
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
BR0213520A (pt) * 2001-10-26 2006-05-23 Immunivest Corp método para diagnosticar a gravidade de uma doença em um indivìduo de teste, e, kit de teste para triagem de uma amostra de paciente quanto à presença de células cancerosas circulantes
US7163612B2 (en) 2001-11-26 2007-01-16 Keck Graduate Institute Method, apparatus and article for microfluidic control via electrowetting, for chemical, biochemical and biological assays and the like
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
FR2841063B1 (fr) 2002-06-18 2004-09-17 Commissariat Energie Atomique Dispositif de deplacement de petits volumes de liquide le long d'un micro-catenaire par des forces electrostatiques
EP3002289B1 (en) 2002-08-23 2018-02-28 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
US6911132B2 (en) 2002-09-24 2005-06-28 Duke University Apparatus for manipulating droplets by electrowetting-based techniques
US7547380B2 (en) 2003-01-13 2009-06-16 North Carolina State University Droplet transportation devices and methods having a fluid surface
CN101044404A (zh) 2003-03-03 2007-09-26 长冈实业株式会社 用于不同类型细胞检测和定量的方法和装置以及生物光盘在该检测和定量中的应用
US7574305B2 (en) 2003-07-15 2009-08-11 Bioarray Solutions Ltd. Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP1680079A4 (en) 2003-10-24 2008-01-02 Adhesives Res Inc QUICKLY FILING FILMS FOR THE DISTRIBUTION OF PHARMACEUTICAL OR COSMETIC AGENTS
CN100478075C (zh) 2003-11-17 2009-04-15 皇家飞利浦电子股份有限公司 用于操纵流体实体的系统
EP1701785A1 (en) 2004-01-07 2006-09-20 Solexa Ltd. Modified molecular arrays
FR2866493B1 (fr) 2004-02-16 2010-08-20 Commissariat Energie Atomique Dispositif de controle du deplacement d'une goutte entre deux ou plusieurs substrats solides
FR2872715B1 (fr) 2004-07-08 2006-11-17 Commissariat Energie Atomique Microreacteur goutte
FR2872809B1 (fr) 2004-07-09 2006-09-15 Commissariat Energie Atomique Methode d'adressage d'electrodes
JP2006058031A (ja) 2004-08-17 2006-03-02 Hitachi High-Technologies Corp 化学分析装置
US7476503B2 (en) 2004-09-17 2009-01-13 Pacific Biosciences Of California, Inc. Apparatus and method for performing nucleic acid analysis
EP1828412B2 (en) 2004-12-13 2019-01-09 Illumina Cambridge Limited Improved method of nucleotide detection
US7458661B2 (en) 2005-01-25 2008-12-02 The Regents Of The University Of California Method and apparatus for promoting the complete transfer of liquid drops from a nozzle
PL1859330T3 (pl) 2005-01-28 2013-01-31 Univ Duke Urządzenia i sposoby manipulacji kropelkami na płytkach obwodów drukowanych
JP4990886B2 (ja) 2005-05-10 2012-08-01 ソレックサ リミテッド 改良ポリメラーゼ
US20090081688A1 (en) 2005-06-20 2009-03-26 Advanced Cell Diagnostics Methods of detecting nucleic acids in individual cells and of identifying rare cells from large heterogeneous cell populations
US7464936B2 (en) 2005-07-19 2008-12-16 New Vision Gaming & Development, Inc. Method of playing a video poker game
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US20070023292A1 (en) 2005-07-26 2007-02-01 The Regents Of The University Of California Small object moving on printed circuit board
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
CN101460953B (zh) 2006-03-31 2012-05-30 索雷克萨公司 用于合成分析的序列的系统和装置
DE602006018794D1 (de) 2006-04-18 2011-01-20 Advanced Liquid Logic Inc Biochemie auf tröpfchenbasis
EP2040082A4 (en) 2006-07-10 2014-04-23 Hitachi High Tech Corp LIQUID TRANSFER DEVICE
US7414163B1 (en) 2006-07-28 2008-08-19 Uop Llc Iridium and germanium-containing catalysts and alkylaromatic transalkylation processes using such catalysts
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US9266076B2 (en) 2006-11-02 2016-02-23 The Regents Of The University Of California Method and apparatus for real-time feedback control of electrical manipulation of droplets on chip
US8872527B2 (en) 2007-02-15 2014-10-28 Advanced Liquid Logic, Inc. Capacitance detection in a droplet actuator
US9029085B2 (en) 2007-03-07 2015-05-12 President And Fellows Of Harvard College Assays and other reactions involving droplets
WO2008134153A1 (en) 2007-04-23 2008-11-06 Advanced Liquid Logic, Inc. Bead-based multiplexed analytical methods and instrumentation
US8926811B2 (en) 2007-06-27 2015-01-06 Digital Biosystems Digital microfluidics based apparatus for heat-exchanging chemical processes
US8093064B2 (en) 2008-05-15 2012-01-10 The Regents Of The University Of California Method for using magnetic particles in droplet microfluidics
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
WO2010062913A2 (en) 2008-11-26 2010-06-03 Illumina, Inc. Methods and systems for analysis of sequencing data
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
KR101423936B1 (ko) 2009-03-11 2014-07-29 (주)바이오니아 실시간 핵산 분석 통합 장치 및 이를 이용한 타겟 핵산의 검출방법
WO2011002957A2 (en) 2009-07-01 2011-01-06 Advanced Liquid Logic, Inc. Droplet actuator devices and methods
WO2011038403A1 (en) * 2009-09-28 2011-03-31 Yuling Luo Methods of detecting nucleic acid sequences with high specificity
ES2565563T3 (es) 2010-02-25 2016-04-05 Advanced Liquid Logic, Inc. Método para preparar bibliotecas de ácidos nucleicos
CA2814049C (en) * 2010-10-08 2021-07-13 President And Fellows Of Harvard College High-throughput single cell barcoding
EP2635679B1 (en) * 2010-11-05 2017-04-19 Illumina, Inc. Linking sequence reads using paired code tags
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
US8829171B2 (en) * 2011-02-10 2014-09-09 Illumina, Inc. Linking sequence reads using paired code tags
US10144950B2 (en) * 2011-01-31 2018-12-04 Roche Sequencing Solutions, Inc. Methods of identifying multiple epitopes in cells
WO2012106546A2 (en) * 2011-02-02 2012-08-09 University Of Washington Through Its Center For Commercialization Massively parallel continguity mapping
US9365897B2 (en) 2011-02-08 2016-06-14 Illumina, Inc. Selective enrichment of nucleic acids
EP2675819B1 (en) * 2011-02-18 2020-04-08 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
WO2012162267A2 (en) * 2011-05-20 2012-11-29 Fluidigm Corporation Nucleic acid encoding reactions
GB201108678D0 (en) 2011-05-24 2011-07-06 Olink Ab Multiplexed proximity ligation assay
WO2012170936A2 (en) 2011-06-09 2012-12-13 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
CA3003082C (en) 2011-10-28 2020-12-15 Illumina, Inc. Microarray fabrication system and method
WO2013078470A2 (en) * 2011-11-22 2013-05-30 MOTIF, Active Multiplex isolation of protein-associated nucleic acids
CN102703426A (zh) * 2012-05-21 2012-10-03 吴江汇杰生物科技有限公司 构建核酸库的方法、试剂及试剂盒
US9977861B2 (en) 2012-07-18 2018-05-22 Illumina Cambridge Limited Methods and systems for determining haplotypes and phasing of haplotypes
EP4001426A1 (en) * 2012-08-13 2022-05-25 The Regents of The University of California Methods and systems for detecting biological components
CA2900481A1 (en) * 2013-02-08 2014-08-14 10X Genomics, Inc. Polynucleotide barcode generation
DK3553175T3 (da) 2013-03-13 2021-08-23 Illumina Inc Fremgangsmåde til fremstilling af et nukleinsyresekvenseringsbibliotek
CN104032377A (zh) * 2014-06-30 2014-09-10 北京诺禾致源生物信息科技有限公司 单细胞转录组测序文库的构建方法及其应用

Also Published As

Publication number Publication date
RU2017127628A (ru) 2019-03-12
RU2020110764A (ru) 2020-05-29
EP3256604B1 (en) 2020-03-25
US20230374493A1 (en) 2023-11-23
WO2016130704A3 (en) 2016-10-06
RU2761432C2 (ru) 2021-12-08
AU2016219328A1 (en) 2017-08-17
US20180273933A1 (en) 2018-09-27
RU2717491C2 (ru) 2020-03-23
US11634707B2 (en) 2023-04-25
CN107406890A (zh) 2017-11-28
ES2786652T3 (es) 2020-10-13
RU2020110764A3 (zh) 2021-04-21
EP3256604A2 (en) 2017-12-20
CA3174951A1 (en) 2016-08-18
WO2016130704A2 (en) 2016-08-18
BR112017017025A2 (pt) 2018-04-10
AU2016219328B2 (en) 2022-04-21
CN107406890B (zh) 2023-07-18
KR20210135626A (ko) 2021-11-15
KR20200020997A (ko) 2020-02-26
EP3725893A1 (en) 2020-10-21
SG10202104816QA (en) 2021-06-29
RU2017127628A3 (zh) 2019-03-12
CA2975739A1 (en) 2016-08-18
JP2018509140A (ja) 2018-04-05
BR112017017025B1 (pt) 2024-01-02
PT3256604T (pt) 2020-05-18
JP7001475B2 (ja) 2022-01-19
AU2022202345A1 (en) 2022-04-28
DK3256604T3 (da) 2020-05-25
KR20170135834A (ko) 2017-12-08
CN116083546A (zh) 2023-05-09
CA2975739C (en) 2022-12-06
SG11201706504RA (en) 2017-09-28

Similar Documents

Publication Publication Date Title
CN107406890B (zh) 用于分析细胞组分的方法和组合物
JP7035128B2 (ja) 単一細胞の核酸配列分析
US20210130885A1 (en) Spatial mapping of nucleic acid sequence information
EP3887540B1 (en) Analysis of multiple analytes using a single assay
CN107580632B (zh) 用于全转录组扩增的方法和组合物
JP2019107035A (ja) ポリヌクレオチドバーコード生成
KR20150109356A (ko) 고체 지지체 상의 샘플 제조법
CA3115155A1 (en) Methods and means for preparing a library for sequencing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination