CN110719959B - 针对单细胞的样品索引 - Google Patents
针对单细胞的样品索引 Download PDFInfo
- Publication number
- CN110719959B CN110719959B CN201880037720.1A CN201880037720A CN110719959B CN 110719959 B CN110719959 B CN 110719959B CN 201880037720 A CN201880037720 A CN 201880037720A CN 110719959 B CN110719959 B CN 110719959B
- Authority
- CN
- China
- Prior art keywords
- sample
- oligonucleotide
- barcode
- cells
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6804—Nucleic acid analysis using immunogens
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6811—Selection methods for production or design of target specific oligonucleotides or binding molecules
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6865—Promoter-based amplification, e.g. nucleic acid sequence amplification [NASBA], self-sustained sequence replication [3SR] or transcription-based amplification system [TAS]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/5308—Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/531—Production of immunochemical test materials
- G01N33/532—Production of labelled immunochemicals
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B82—NANOTECHNOLOGY
- B82Y—SPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
- B82Y5/00—Nanobiotechnology or nanomedicine, e.g. protein engineering or drug delivery
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
- C12Q1/6837—Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/179—Modifications characterised by incorporating arbitrary or random nucleotide sequences
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/131—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a member of a cognate binding pair, i.e. extends to antibodies, haptens, avidin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/149—Particles, e.g. beads
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/185—Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2458/00—Labels used in chemical analysis of biological material
- G01N2458/10—Oligonucleotides as tagging agents for labelling antibodies
Abstract
本文披露了用于样品鉴定的系统、方法、组合物和试剂盒。样品索引组合物可以包含例如与样品索引寡核苷酸关联的蛋白质结合试剂。不同的样品索引组合物可以包括具有不同序列的样品索引寡核苷酸。可以基于所述样品索引寡核苷酸的序列来鉴定细胞的样品来源。可以将样品索引寡核苷酸使用条形码进行条形码编码,并使用菊花链式引物延长。
Description
相关申请
本申请要求2017年6月5日提交的美国临时专利申请号62/515,285、2017年7月14日提交的美国临时申请号62/532,905;2017年7月14日提交的美国临时申请号62/532,949;2017年7月14日提交的美国临时申请号62/532,971;2017年9月5日提交的美国临时申请号62/554,425;2017年10月30日提交的美国临时申请号62/578,957;以及2018年3月20日提交的美国临时申请号62/645,703的优先权。这些相关申请中的每一个的内容通过引用整体并入本文。
参考序列表
本申请连同以电子格式的序列表一起提交。序列表作为名为Sequence_Listing_BDCRI_033A.txt的文件提供,产生于2018年3月20日,大小为3,181字节。电子格式的序列表中的信息通过引用以其整体结合在此。
发明背景
技术领域
本披露总体上涉及分子生物学领域,例如使用分子条形码编码来鉴定不同样品的细胞并检测细胞组分之间的相互作用。
背景技术
当前技术允许通过将细胞特异性寡核苷酸条形码附着到来自单细胞的聚(A)mRNA分子上,从而以大规模并行方式(例如,>10000个细胞)测量单细胞的基因表达,因为这些细胞中的每个都与经条形码编码的试剂珠在隔室中共定位。基因表达可以影响蛋白质表达。蛋白质-蛋白质间相互作用可以影响基因表达和蛋白质表达。需要能够定量分析蛋白质表达,同时测量细胞中蛋白质表达和基因表达以及确定细胞中蛋白质-蛋白质相互作用的系统和方法。
发明内容
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个抗原靶,其中所述多个样品索引组合物中的至少一个样品索引组合物包含两个或更多个抗原结合试剂(例如蛋白质结合试剂和抗体),其中所述两个或更多个抗原结合试剂中的每个与样品索引寡核苷酸关联,其中所述两个或更多个抗原结合试剂中的至少一个能够与所述一个或多个抗原靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸;获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源(例如基于所述至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定所述多个经条形码编码的靶的样品来源)。所述方法可以例如包括去除所述多个样品索引组合物中未结合的样品索引组合物。
在一些实施例中,样品索引序列的长度是25-60个核苷酸(例如,长度是45个核苷酸),长度是约128个核苷酸或长度是至少128个核苷酸。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列可以包含不同的序列。多个样品索引组合物中的至少100或1000个样品索引组合物的样品索引序列可以包含不同的序列。
在一些实施例中,抗原结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与抗原结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至抗原结合试剂。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,多个样品中的至少一个样品包含单细胞。一个或多个抗原靶中的至少一个可以在细胞表面或细胞内部。多个样品中的样品可以包含多个细胞、组织、肿瘤样品或其任何组合。多个样品可以包含哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。
在一些实施例中,去除所述未结合的样品索引组合物包括用洗涤缓冲液洗涤来自所述多个样品的每个的一个或多个细胞。所述方法可以包括裂解来自所述多个样品中的每个的一个或多个细胞。样品索引寡核苷酸可以被配置为与所述抗原结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与抗原结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与抗原结合试剂分离。
在一些实施例中,样品索引寡核苷酸与多个样品的细胞的基因组序列不同源。样品索引寡核苷酸可以包含分子标记序列、聚(A)区或其组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码的靶结合区可包含捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(A)尾。样品索引寡核苷酸可以包含分子标记。
在一些实施例中,抗原靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。抗原靶可以是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。抗原靶可以是或包含脂质、碳水化合物或其任何组合。抗原靶可以选自包含10-100个不同抗原靶的组。抗原结合试剂可以与两个或更多个具有相同序列的样品索引寡核苷酸关联。抗原结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与样品索引寡核苷酸缀合的第二抗原结合试剂。抗原结合试剂和第二抗原结合试剂可以相同。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列。多个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上、部分固定在颗粒上、封闭在颗粒中、部分封闭在颗粒中,或其任何组合。颗粒可以是可降解的。颗粒可以是珠。珠可以选自由以下组成的组:链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠及其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含至少10000个条形码。在一些实施例中,颗粒的条形码可以包含选自至少1000或10000个不同分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使多个条形码与样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的条形码;并且延伸与样品索引寡核苷酸杂交的条形码以产生多个经条形码编码的样品索引寡核苷酸。延伸条形码可以包括使用DNA聚合酶延伸条形码以产生多个经条形码编码的样品索引寡核苷酸。延伸条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括扩增多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。获得多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。
在一些实施例中,鉴定至少一个细胞的样品来源可以包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸可以包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。在获得所述多个经条形码编码的靶的测序数据之前,所述方法可以包括扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
在一些实施例中,多个样品索引组合物中的每个包含抗原结合试剂。与两个或更多个抗原结合试剂关联的样品索引寡核苷酸的样品索引序列可以是相同的。与两个或更多个抗原结合试剂关联的样品索引寡核苷酸的样品索引序列可以包含不同的序列。多个样品索引组合物中的每个可以包含两个或更多个抗原结合试剂。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的至少一个样品索引组合物包含两个或更多个细胞组分结合试剂(例如抗原结合试剂或抗体),其中所述两个或更多个细胞组分结合试剂中的每个与样品索引寡核苷酸关联,其中所述两个或更多个细胞组分结合试剂中的至少一个能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸;获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。所述方法可以包括去除所述多个样品索引组合物中未结合的样品索引组合物。
在一些实施例中,样品索引序列的长度是25-60个核苷酸(例如,长度是45个核苷酸),长度是约128个核苷酸或长度是至少128个核苷酸。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列可以包含不同的序列。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列可以包含不同的序列。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列包含不同的序列。
在一些实施例中,细胞组分结合试剂包括细胞表面结合试剂、抗体、四聚体、适体、蛋白质支架,整合素或其组合。样品索引寡核苷酸可以通过接头与细胞组分结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,多个样品中的至少一个样品包含单细胞。一个或多个细胞组分靶中的至少一个可以在细胞表面上表达。多个样品中的样品可以包含多个细胞、组织、肿瘤样品或其任何组合。多个样品可以包含哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。
在一些实施例中,去除所述未结合的样品索引组合物包括用洗涤缓冲液洗涤来自所述多个样品的每个的一个或多个细胞。所述方法可以包括裂解来自所述多个样品中的每个的一个或多个细胞。样品索引寡核苷酸可以被配置为与所述细胞组分结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与细胞组分结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与细胞组分结合试剂分离。
在一些实施例中,样品索引寡核苷酸与多个样品的细胞的基因组序列不同源。样品索引寡核苷酸可以包含分子标记序列、聚(A)区或其组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码的靶结合区可包含捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(A)尾。样品索引寡核苷酸可以包含分子标记。
在一些实施例中,细胞组分靶是或包含碳水化合物、脂质、蛋白质、细胞外蛋白质、细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素、细胞内蛋白质或其任何组合。细胞组分靶可以选自包含10-100个不同细胞组分靶的组。细胞组分结合试剂可以与两个或更多个具有相同序列的样品索引寡核苷酸关联。细胞组分结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与所述样品索引寡核苷酸缀合的第二细胞组分结合试剂。细胞组分结合试剂和第二细胞结合试剂可以相同。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列。多个条形码中的至少两个条形码的分子标记序列可以包含不同的分子标记序列。条形码可以包含细胞标记、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码被封闭在颗粒中。颗粒可以是珠。多个条形码中的至少一个条形码可以固定在颗粒上、部分固定在颗粒上、封闭在颗粒中、部分封闭在颗粒中,或其任何组合。颗粒可以是可降解的。珠可以选自由以下组成的组:链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠及其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含至少10000个条形码。在一些实施例中,颗粒的条形码可以包含选自至少1000或10000个不同分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括扩增多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。获得多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。
在一些实施例中,鉴定至少一个细胞的样品来源可以包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸可以包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。所述方法可以包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
在一些实施例中,多个样品索引组合物中的每个包含细胞组分结合试剂。与两个或更多个细胞组分结合试剂关联的样品索引寡核苷酸的样品索引序列可以是相同的。与两个或更多个细胞组分结合试剂关联的样品索引寡核苷酸的样品索引序列可以包含不同的序列。多个样品索引组合物中的每个可以包含两个或更多个细胞组分结合试剂。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的至少一个样品索引组合物包含两个或更多个细胞组分结合试剂,其中所述两个或更多个细胞组分结合试剂中的每个与样品索引寡核苷酸关联,其中所述两个或更多个细胞组分结合试剂中的至少一个能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;并且基于所述多个样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。所述方法可以例如包括去除所述多个样品索引组合物中未结合的样品索引组合物。
在一些实施例中,样品索引序列的长度是25-60个核苷酸(例如,长度是45个核苷酸),长度是约128个核苷酸或长度是至少128个核苷酸。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列可以包含不同的序列。多个样品索引组合物中的至少100或1000个样品索引组合物的样品索引序列可以包含不同的序列。
在一些实施例中,抗原结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与抗原结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至抗原结合试剂。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,多个样品中的至少一个样品包含单细胞。一个或多个抗原靶中的至少一个可以在细胞表面上表达。多个样品中的样品可以包含多个细胞、组织、肿瘤样品或其任何组合。多个样品可以包含哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。
在一些实施例中,去除所述未结合的样品索引组合物包括用洗涤缓冲液洗涤来自所述多个样品的每个的一个或多个细胞。所述方法可以包括裂解来自所述多个样品中的每个的一个或多个细胞。样品索引寡核苷酸可以被配置为与所述抗原结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与抗原结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与抗原结合试剂分离。
在一些实施例中,样品索引寡核苷酸与多个样品的细胞的基因组序列不同源。样品索引寡核苷酸可以包含分子标记序列、聚(A)区或其组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码的靶结合区可包含捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(A)尾。样品索引寡核苷酸可以包含分子标记。
在一些实施例中,抗原靶是或包含碳水化合物、脂质、蛋白质、细胞外蛋白质、细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白质或其任何组合。抗原靶可以选自包含10-100个不同抗原靶的组。抗原结合试剂可以与两个或更多个具有相同序列的样品索引寡核苷酸关联。抗原结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与样品索引寡核苷酸缀合的第二抗原结合试剂。抗原结合试剂和第二抗原结合试剂可以相同。
在一些实施例中,鉴定所述至少一个细胞的样品来源包括:使用多个条形码对所述多个样品索引组合物中的样品索引寡核苷酸进行条形码编码,以产生多个经条形码编码的样品索引寡核苷酸;获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述细胞的样品来源。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列。多个条形码中的至少两个条形码的分子标记序列可以包含不同的分子标记序列。条形码可以包含细胞标记、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码固定在颗粒上。多个条形码中的至少一个条形码可以固定在颗粒上、部分固定在颗粒上、封闭在颗粒中、部分封闭在颗粒中,或其任何组合。颗粒可以是可降解的。颗粒可以是珠。珠可以选自由以下组成的组:链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠及其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含至少10000个条形码。在一些实施例中,颗粒的条形码可以包含选自至少1000或10000个不同分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码可以包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括扩增多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。获得多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。鉴定至少一个细胞的样品来源可以包括鉴定多个样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定所述样品索引序列的存在或不存在可以包括:复制所述至少一个样品索引寡核苷酸以产生多个复制的样品索引寡核苷酸;获得所述多个复制的样品索引寡核苷酸的测序数据;并且基于所述多个样品索引寡核苷酸中的复制的样品索引寡核苷酸的样品索引序列来鉴定所述细胞的样品来源,所述样品索引序列相应于测序数据中的至少一个经条形码编码的样品索引寡核苷酸。
在一些实施例中,复制所述至少一个样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸包括:在复制至少一个经条形码编码的样品索引寡核苷酸之前,将复制衔接子连接到至少一个经条形码编码的样品索引寡核苷酸。复制至少一个经条形码编码的样品索引寡核苷酸可以包括使用连接到至少一个经条形码编码的样品索引寡核苷酸的复制衔接子来复制至少一个经条形码编码的样品索引寡核苷酸以产生多个复制的样品索引寡核苷酸。
在一些实施例中,复制所述至少一个样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸包括:在复制所述至少一个经条形码编码的样品索引寡核苷酸之前,使捕获探针与所述至少一个样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的捕获探针;并且扩展与所述样品索引寡核苷酸杂交的所述捕获探针以产生与所述捕获探针关联的样品索引寡核苷酸。复制所述至少一个样品索引寡核苷酸可以包括复制与所述捕获探针关联的样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。鉴定所述至少一个经条形码编码的样品索引寡核苷酸的样品来源可以包括基于所述至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定所述多个经条形码编码的靶的样品来源。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。所述方法可以包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
在一些实施例中,多个样品索引组合物中的每个包含抗原结合试剂。与两个或更多个抗原结合试剂关联的样品索引寡核苷酸的样品索引序列可以是相同的。与两个或更多个抗原结合试剂关联的样品索引寡核苷酸的样品索引序列可以包含不同的序列。多个样品索引组合物中的每个可以包含两个或更多个抗原结合试剂。
本文的披露包括多个样品索引组合物。多个样品索引组合物中的每个可以包含两个或更多个抗原结合试剂。所述两个或更多个抗原结合试剂中的每个可以与样品索引寡核苷酸关联。所述两个或更多个抗原结合试剂中的至少一个能够与至少一个抗原靶特异性结合。所述样品索引寡核苷酸可以包含用于鉴定样品的一个或多个细胞的样品来源的样品索引序列。所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列可以包含不同的序列。
在一些实施例中,样品索引序列包含的寡核苷酸序列的长度是25-60个核苷酸(例如,长度是45个核苷酸),长度是约128个核苷酸或长度是至少128个核苷酸。多个样品索引组合物中的至少10、100或1000个样品索引组合物的样品索引序列包含不同的序列。
在一些实施例中,抗原结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与抗原结合试剂缀合。所述至少一个样品索引寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至抗原结合试剂的分子。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,样品索引寡核苷酸不与物种的基因组序列同源。样品索引寡核苷酸可以包含分子标记序列、聚(A)区或其组合。在一些实施例中,多个样品中的至少一个样品可以包含单细胞、多个细胞、组织、肿瘤样品或其任何组合。样品可以包含哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。
在一些实施例中,抗原靶是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、或其任何组合。抗原靶可以选自包含10-100个不同抗原靶的组。抗原结合试剂可以与两个或更多个具有相同序列的样品索引寡核苷酸关联。抗原结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与样品索引寡核苷酸缀合的第二抗原结合试剂。抗原结合试剂和第二抗原结合试剂可以相同。
本文的披露包括对照颗粒组合物。在一些实施例中,对照颗粒组合物包含与对照颗粒关联的多个对照颗粒寡核苷酸,其中所述多个对照颗粒寡核苷酸中的每个包含对照条形码序列和聚(dA)区。所述多个对照颗粒寡核苷酸中的至少两个可以包含不同的对照条形码序列。所述对照颗粒寡核苷酸可以包含分子标记序列。所述对照颗粒寡核苷酸可以包含通用引物的结合位点。
在一些实施例中,对照条形码序列的长度是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。对照颗粒寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其组合。多个对照颗粒寡核苷酸中的至少5、10、100、1000或更多个的对照条形码序列可以是相同的。多个对照颗粒寡核苷酸中约10、100、1000或更多个的对照条形码序列可以是相同的。多个对照颗粒寡核苷酸中的至少3、5、10、100或更多个可以包含不同的对照条形码序列。
在一些实施例中,多个对照颗粒寡核苷酸包含各自包含第一对照条形码序列的多个第一对照颗粒寡核苷酸和各自包含第二对照条形码序列的多个第二对照颗粒寡核苷酸,并且其中所述第一对照条形码序列和所述第二对照条形码序列具有不同的序列。所述多个第一对照颗粒寡核苷酸的数量和所述多个第二对照颗粒寡核苷酸的数量可以大约相同。所述多个第一对照颗粒寡核苷酸的数量和所述多个第二对照颗粒寡核苷酸的数量可以不同。所述多个第一对照颗粒寡核苷酸的数量可以是所述多个第二对照颗粒寡核苷酸的数量的至少2倍、10倍、100倍或更大。
在一些实施例中,对照条形码序列与物种的基因组序列不同源。对照条形码序列可以与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种可以是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,多个对照颗粒寡核苷酸中的至少一个通过接头与所述对照颗粒关联。多个对照颗粒寡核苷酸中的至少一个可以包含接头。接头可以包含化学基团。化学基团可以可逆地附接至多个对照颗粒寡核苷酸中的至少一个。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,对照颗粒的直径是约1-1000微米、约10-100微米、7.5微米或其组合。
在一些实施例中,多个对照颗粒寡核苷酸固定在对照颗粒上。多个对照颗粒寡核苷酸可以部分固定在对照颗粒上。多个对照颗粒寡核苷酸可以封闭在对照颗粒中。多个对照颗粒寡核苷酸可以部分地封闭在对照颗粒中。对照颗粒可以是可破坏的。对照颗粒可以是珠。珠可以是或包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。对照颗粒可以包含以下材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮或其任何组合。对照颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,对照颗粒与可检测部分关联。对照颗粒寡核苷酸可以与可检测部分关联。
在一些实施例中,对照颗粒与多个第一蛋白质结合试剂关联,并且所述多个第一蛋白质结合试剂中的至少一个与多个对照颗粒寡核苷酸中的一个关联。所述第一蛋白质结合试剂可以包含第一抗体。对照颗粒寡核苷酸可以通过接头与所述第一蛋白质结合试剂缀合。第一对照颗粒寡核苷酸可包含接头。接头可以包含化学基团。化学基团可以可逆地附接至所述第一蛋白质结合试剂。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,第一蛋白质结合试剂与具有相同对照条形码序列的多个对照颗粒寡核苷酸中的两个或更多个关联。第一蛋白质结合试剂可以与具有不同对照条形码序列的多个对照颗粒寡核苷酸中的两个或更多个关联。在一些实施例中,多个第一蛋白质结合试剂中的至少一个不与所述多个对照颗粒寡核苷酸中的任何一个关联。与对照颗粒寡核苷酸关联的第一蛋白质结合试剂和不与任何对照颗粒寡核苷酸关联的第一蛋白质结合试剂可以是相同的蛋白质结合试剂。
在一些实施例中,对照颗粒与多个第二蛋白质结合试剂关联。多个第二蛋白质结合试剂中的至少一个可以与多个对照颗粒寡核苷酸中的一个关联。与第一蛋白质结合试剂关联的对照颗粒寡核苷酸和与第二蛋白质结合试剂关联的对照颗粒寡核苷酸可以包含不同的对照条形码序列。第一蛋白质结合试剂和第二蛋白质结合试剂可以是相同的蛋白质结合试剂。
在一些实施例中,第一蛋白质结合试剂可以与伴侣结合试剂关联,并且其中第一蛋白质结合试剂使用伴侣结合试剂与对照颗粒关联。伴侣结合试剂可以包含伴侣抗体。伴侣抗体可包含抗猫抗体、抗鸡抗体、抗牛抗体、抗狗抗体、抗驴抗体、抗山羊抗体、抗豚鼠抗体、抗-仓鼠抗体、抗马抗体、抗人抗体、抗美洲驼抗体、抗猴抗体、抗小鼠抗体、抗猪抗体、抗兔抗体、抗大鼠抗体、抗绵羊抗体或其组合。伴侣抗体可以包含免疫球蛋白G(IgG)、F(ab’)片段、F(ab’)2片段、其组合或其片段。
在一些实施例中,第一蛋白质结合试剂可以与可检测部分关联。第二蛋白质结合试剂可以与可检测部分关联。
本文披露包括用于确定靶数量的方法。在一些实施例中,所述方法包括:使用多个随机条形码对多个细胞中的细胞的多个靶和多个对照颗粒寡核苷酸进行随机条形码编码,以产生多个随机经条形码编码的靶和多个随机经条形码编码的对照颗粒寡核苷酸,其中所述多个随机条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个随机条形码中的至少两个随机条形码的分子标记序列包含不同的序列,并且其中所述多个随机条形码中的至少两个随机条形码包含相同的细胞标记序列,其中对照颗粒组合物包含与所述多个对照颗粒寡核苷酸关联的对照颗粒,其中所述多个对照颗粒寡核苷酸中的每个包含对照条形码序列和伪靶区,所述伪靶区包含与所述多个随机条形码中的至少一个的靶结合区基本互补的序列。所述方法可以包括:获得所述多个随机经条形码编码的靶和所述多个随机经条形码编码的对照颗粒寡核苷酸的测序数据;对测序数据中与具有所述对照条形码序列的所述多个对照颗粒寡核苷酸关联的具有不同序列的分子标记序列的数量进行计数。所述方法可以包括:对于所述多个靶中的至少一个靶:对所述测序数据中与所述靶关联的具有不同序列的分子标记序列的数量进行计数;并且估计所述靶的数量,其中所估计的靶数量与以下相关:与计数的靶关联的具有不同序列的分子标记序列的数量和与所述对照条形码序列关联的具有不同序列的分子标记序列的数量。
在一些实施例中,伪靶区包含聚(dA)区。伪靶区可以包含靶的子序列。在一些实施例中,对照条形码序列的长度可以是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。对照颗粒寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其任何组合。多个对照颗粒寡核苷酸中的至少5、10、100、1000或更多个的对照条形码序列可以是相同的。多个对照颗粒寡核苷酸中的至少3、5、10、100或更多个可以包含不同的对照条形码序列。
在一些实施例中,多个对照颗粒寡核苷酸包含各自包含第一对照条形码序列的多个第一对照颗粒寡核苷酸和各自包含第二对照条形码序列的多个第二对照颗粒寡核苷酸。所述第一对照条形码序列和所述第二对照条形码序列可以具有不同的序列。所述多个第一对照颗粒寡核苷酸的数量和所述多个第二对照颗粒寡核苷酸的数量可以大约相同。所述多个第一对照颗粒寡核苷酸的数量和所述多个第二对照颗粒寡核苷酸的数量可以不同。所述多个第一对照颗粒寡核苷酸的数量可以是所述多个第二对照颗粒寡核苷酸的数量的至少2倍、10倍、100倍或更大。
在一些实施例中,对测序数据中与具有所述对照条形码序列的所述多个对照颗粒寡核苷酸关联的具有不同序列的分子标记序列的数量进行计数包括:对所述测序数据中与所述第一对照条形码序列关联的具有不同序列的分子标记序列的数量进行计数;并且对所述测序数据中与所述第二对照条形码序列关联的具有不同序列的分子标记序列的数量进行计数。估计的所述靶的数量可以与以下相关与计数的所述靶关联的具有不同序列的分子标记序列的数量,与所述第一对照条形码序列关联的具有不同序列的分子标记序列的数量,以及与所述第二对照条形码序列关联的具有不同序列的分子标记序列的数量。估计的所述靶的数量可以与以下相关与计数的所述靶关联的具有不同序列的分子标记序列的数量,与所述对照条形码序列关联的具有不同序列的分子标记序列的数量,以及包含所述对照条形码序列的所述多个对照颗粒寡核苷酸的数量。估计的所述靶的数量可以与以下相关与计数的所述靶关联的具有不同序列的分子标记序列的数量,以及包含所述对照条形码序列的所述多个对照颗粒寡核苷酸的数量与所述对照条形码序列关联的具有不同序列的分子标记序列的数量的比例。
在一些实施例中,对照颗粒寡核苷酸不与细胞的基因组序列同源。对照颗粒寡核苷酸可以不与物种的基因组序列同源。对照颗粒寡核苷酸可以与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种可以是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,对照颗粒寡核苷酸通过接头可以与所述对照颗粒缀合。多个对照颗粒寡核苷酸中的至少一个可以通过接头与所述对照颗粒关联。多个对照颗粒寡核苷酸中的至少一个可以包含接头。化学基团可以可逆地附接至多个对照颗粒寡核苷酸中的至少一个。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,对照颗粒的直径是约1-1000微米、约10-100微米、约7.5微米或其组合。多个对照颗粒寡核苷酸固定在对照颗粒上。多个对照颗粒寡核苷酸可以部分固定在对照颗粒上。多个对照颗粒寡核苷酸可以封闭在对照颗粒中。多个对照颗粒寡核苷酸可以部分地封闭在对照颗粒中。
在一些实施例中,所述方法包括在随机地对所述多个靶和所述对照颗粒和所述多个对照颗粒寡核苷酸进行条形码编码之前,从所述对照颗粒释放所述多个对照颗粒寡核苷酸中的至少一个。
在一些实施例中,对照颗粒是可破坏的。对照颗粒可以是对照颗粒珠。对照颗粒珠可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。对照颗粒可以包含以下材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮或其任何组合。对照颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,对照颗粒与可检测部分关联。对照颗粒寡核苷酸可以与可检测部分关联。
在一些实施例中,对照颗粒可以与多个第一蛋白质结合试剂关联,并且所述多个第一蛋白质结合试剂中的至少一个可以与多个对照颗粒寡核苷酸中的一个关联。所述第一蛋白质结合试剂可以包含第一抗体。对照颗粒寡核苷酸可以通过接头与所述第一蛋白质结合试剂缀合。第一对照颗粒寡核苷酸可包含接头。接头可以包含化学基团。化学基团可以可逆地附接至所述第一蛋白质结合试剂。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,第一蛋白质结合试剂可以与具有相同对照条形码序列的多个对照颗粒寡核苷酸中的两个或更多个关联。第一蛋白质结合试剂可以与具有不同对照条形码序列的多个对照颗粒寡核苷酸中的两个或更多个关联。多个第一蛋白质结合试剂中的至少一个可以不与多个对照颗粒寡核苷酸中的任何关联。与对照颗粒寡核苷酸关联的第一蛋白质结合试剂和不与任何对照颗粒寡核苷酸关联的第一蛋白质结合试剂可以是相同的蛋白质结合试剂。对照颗粒可以与多个第二蛋白质结合试剂关联,多个第二蛋白质结合试剂中的至少一个可以与多个对照颗粒寡核苷酸中的一个关联。与第一蛋白质结合试剂关联的对照颗粒寡核苷酸和与第二蛋白质结合试剂关联的对照颗粒寡核苷酸可以包含不同的对照条形码序列。第一蛋白质结合试剂和第二蛋白质结合试剂可以是相同的蛋白质结合试剂。
在一些实施例中,第一蛋白质结合试剂与伴侣结合试剂关联,并且其中第一蛋白质结合试剂使用伴侣结合试剂与对照颗粒关联。伴侣结合试剂可以包含伴侣抗体。伴侣抗体可包含抗猫抗体、抗鸡抗体、抗牛抗体、抗狗抗体、抗驴抗体、抗山羊抗体、抗豚鼠抗体、抗-仓鼠抗体、抗马抗体、抗人抗体、抗美洲驼抗体、抗猴抗体、抗小鼠抗体、抗猪抗体、抗兔抗体、抗大鼠抗体、抗绵羊抗体或其组合。伴侣抗体可以包含免疫球蛋白G(IgG)、F(ab’)片段、F(ab’)2片段、其组合或其片段。
在一些实施例中,第一蛋白质结合试剂可以与可检测部分关联。第二蛋白质结合试剂可以与可检测部分关联。
在一些实施例中,随机条形码包含通用引物的结合位点。靶结合区可包含聚(dT)区。
在一些实施例中,多个随机条形码与条形码编码颗粒关联。多个随机条形码中的至少一个随机条形码可以固定在条形码编码颗粒上。多个随机条形码中的至少一个随机条形码可以部分地固定在条形码编码颗粒上。多个随机条形码中的至少一个随机条形码可以被封闭在条形码编码颗粒中。多个随机条形码中的至少一个随机条形码可以部分地封闭在条形码编码颗粒中。
在一些实施例中,条形码编码颗粒是可破坏的。条形码编码颗粒可以是条形码编码珠。条形码编码珠可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。条形码编码颗粒可以包含以下材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮或其任何组合。条形码编码颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,条形码编码颗粒的随机条形码包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。在一些实施例中,随机条形码的分子标记序列包含随机序列。在一些实施例中,条形码编码颗粒包含至少10000个随机条形码。
在一些实施例中,使用所述多个随机条形码对所述多个靶和所述多个对照颗粒寡核苷酸进行随机条形码编码包括:使所述多个随机条形码与所述多个靶中的靶和所述多个对照颗粒寡核苷酸中的对照颗粒寡核苷酸接触,以产生与所述靶和所述对照颗粒寡核苷酸杂交的随机条形码;并且延伸与所述靶和所述对照颗粒寡核苷酸杂交的所述随机条形码,以产生所述多个随机经条形码编码的靶和所述多个随机经条形码编码的对照颗粒寡核苷酸。延伸所述随机条形码可以包括使用DNA聚合酶、逆转录酶或其组合来延伸所述随机条形码。
在一些实施例中,所述方法包括扩增所述多个随机经条形码编码的靶和所述多个随机经条形码编码的对照颗粒寡核苷酸以产生多个扩增子。扩增所述多个随机经条形码编码的靶和所述多个随机经条形码编码的对照颗粒寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增所述分子标记序列的至少一部分和所述对照颗粒寡核苷酸的至少一部分或所述分子标记序列的至少一部分和所述对照颗粒寡核苷酸的至少一部分。获得所述测序数据可以包括获得所述多个扩增子的测序数据。获得所述测序数据可以包括对所述分子标记序列的所述至少一部分和所述对照颗粒寡核苷酸的所述至少一部分进行测序,或所述分子标记序列的所述至少一部分和所述对照颗粒寡核苷酸的所述至少一部分。
本文披露的还包括用于测序对照的试剂盒。在一些实施例中,试剂盒包含:一种对照颗粒组合物,其包含与对照颗粒关联的多个对照颗粒寡核苷酸,其中所述多个对照颗粒寡核苷酸中的每个包含对照条形码序列和聚(dA)区。
在一些实施例中,所述多个对照颗粒寡核苷酸中的至少两个包含不同的对照条形码序列。在一些实施例中,对照条形码序列的长度可以是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。对照颗粒寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其任何组合。多个对照颗粒寡核苷酸中的至少5、10、100、1000或更多个的对照条形码序列可以是相同的。多个对照颗粒寡核苷酸中的至少3、5、10、100或更多个可以包含不同的对照条形码序列。
在一些实施例中,多个对照颗粒寡核苷酸包含各自包含第一对照条形码序列的多个第一对照颗粒寡核苷酸和各自包含第二对照条形码序列的多个第二对照颗粒寡核苷酸。所述第一对照条形码序列和所述第二对照条形码序列可以具有不同的序列。所述多个第一对照颗粒寡核苷酸的数量和所述多个第二对照颗粒寡核苷酸的数量可以大约相同。所述多个第一对照颗粒寡核苷酸的数量和所述多个第二对照颗粒寡核苷酸的数量可以不同。所述多个第一对照颗粒寡核苷酸的数量可以是所述多个第二对照颗粒寡核苷酸的数量的至少2倍、10倍、100倍或更大。
在一些实施例中,对照颗粒寡核苷酸不与细胞的基因组序列同源。对照颗粒寡核苷酸可以不与物种的基因组序列同源。对照颗粒寡核苷酸可以与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种可以是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,对照颗粒寡核苷酸通过接头可以与所述对照颗粒缀合。多个对照颗粒寡核苷酸中的至少一个可以通过接头与所述对照颗粒关联。多个对照颗粒寡核苷酸中的至少一个可以包含接头。化学基团可以可逆地附接至多个对照颗粒寡核苷酸中的至少一个。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,对照颗粒的直径是约1-1000微米、约10-100微米、约7.5微米或其组合。多个对照颗粒寡核苷酸固定在对照颗粒上。多个对照颗粒寡核苷酸可以部分固定在对照颗粒上。多个对照颗粒寡核苷酸可以封闭在对照颗粒中。多个对照颗粒寡核苷酸可以部分地封闭在对照颗粒中。
在一些实施例中,试剂盒包含多个条形码。所述多个条形码中的条形码可以包含靶结合区和分子标记序列,以及多个条形码中的至少两个条形码的分子标记序列可以包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。所述靶结合区包含聚(dT)区。
在一些实施例中,多个条形码可以与条形码编码颗粒关联。多个条形码中的至少一个条形码可以固定在条形码编码颗粒上。多个条形码中的至少一个条形码部分地固定在条形码编码颗粒上。多个条形码中的至少一个条形码可以被封闭在条形码编码颗粒中。多个条形码中的至少一个条形码可以部分地封闭在条形码编码颗粒中。条形码编码颗粒可以是可破坏的。条形码编码颗粒可以是第二珠。珠可以是或包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。条形码编码颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。条形码编码颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,条形码编码颗粒的条形码包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。条形码编码颗粒可以包含至少10000个条形码。试剂盒可包含DNA聚合酶。试剂盒可包含用于聚合酶链式反应(PCR)的试剂。
本文披露的用于细胞鉴定的方法可以包括:使第一多个细胞和第二多个细胞分别与两个样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个蛋白质靶,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的蛋白质结合试剂,其中所述蛋白质结合试剂能够与所述一个或多个蛋白质靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且在获得的测序数据中鉴定与两个或更多个样品索引序列关联的细胞标记序列;并且从获得的测序数据中去除与所述细胞标记序列关联的测序数据。在一些实施例中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点、或其组合。如本文所述,可以从与第二多个细胞不同的组织或器官获得或衍生出第一多个细胞,并且第一多个细胞和第二多个细胞可以来自相同或不同的受试者(例如,哺乳动物)。例如,第一多个细胞可以从与第二多个细胞不同的人受试者获得或衍生。在一些实施例中,第一多个细胞和第二多个细胞获自或衍生自同一人类受试者的不同组织。
在一些实施例中,使所述第一多个细胞和所述第二多个细胞分别与所述两个样品索引组合物接触包括:使所述第一多个细胞与所述两个样品索引组合物中的第一样品索引组合物接触;并且使所述第一多个细胞与所述两个样品索引组合物中的第二样品索引组合物接触。
如本文所述,样品索引序列的长度可以是例如至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。样品索引寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其组合。在一些实施例中,多个样品索引组合物中的至少10、100、1000或更多个样品索引组合物的样品索引序列包含不同的序列。
在一些实施例中,蛋白质结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与蛋白质结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地附接至蛋白质结合试剂。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,多个样品中的至少一个样品包含单细胞。一个或多个蛋白质靶中的至少一个可以在细胞表面上。
在一些实施例中,所述方法包括:去除所述两个样品索引组合物中未结合的样品索引组合物。去除所述未结合的样品索引组合物可以包括用洗涤缓冲液洗涤所述第一多个细胞中的和所述第二多个细胞中的细胞。去除所述未结合的样品索引组合物可以包括使用流式细胞术选择与所述两个样品索引组合物中的至少一个蛋白质结合试剂结合的细胞。在一些实施例中,所述方法包括:裂解来自所述多个样品中的每个的一个或多个细胞。
在一些实施例中,样品索引寡核苷酸被配置为与蛋白质结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与蛋白质结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理、加热、酶处理或其任何组合使所述样品索引寡核苷酸与蛋白质结合试剂分离。
在一些实施例中,样品索引寡核苷酸与一个或多个细胞中的任何一个的基因组序列不同源。对照条形码序列可以不与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,多个样品中的样品包含多个细胞、组织、肿瘤样品或其任何组合。多个样品可以包含哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码可以包含靶结合区,所述靶结合区包含所述捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。
在一些实施例中,蛋白质靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。蛋白质靶可以是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。蛋白质靶可以是或包含脂质、碳水化合物或其任何组合。蛋白质靶可以选自包含10-100个不同蛋白质靶的组。
在一些实施例中,蛋白质结合试剂与两个或更多个具有相同序列的样品索引寡核苷酸关联。蛋白质结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与样品索引寡核苷酸缀合的第二蛋白质结合试剂。蛋白质结合试剂和第二蛋白质结合试剂可以相同。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列,并且所述多个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码可以与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上。多个条形码中的至少一个条形码可以部分地固定在颗粒上。多个条形码中的至少一个条形码可以被封闭在颗粒中。多个条形码中的至少一个条形码可以部分地封闭在颗粒中。颗粒可以是可破坏的。颗粒可以是珠。珠可以是或包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,蛋白质结合试剂与可检测部分关联。在一些实施例中,颗粒与可检测部分关联。样品索引寡核苷酸与光学部分关联。
在一些实施例中,颗粒的条形码可以包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。颗粒可以包含至少10000个条形码。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:扩增所述多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。在一些实施例中,获得多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得所述测序数据包括对所述分子标记序列的至少一部分和所述样品索引寡核苷酸的至少一部分进行测序。在一些实施例中,鉴定至少一个细胞的样品来源包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用所述多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。
在一些实施例中,所述方法包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
本文披露还包括可用于测序对照的方法和组合物。在一些实施例中,用于测序对照的方法包括:使多个细胞中的一个或多个细胞与多个对照组合物中的对照组合物接触,其中所述多个细胞中的细胞包含多个靶和多个蛋白质靶,其中所述多个对照组合物中的每个包含与对照寡核苷酸关联的蛋白质结合试剂,其中所述蛋白质结合试剂能够与所述多个蛋白质靶中的至少一个特异性结合,并且其中所述对照寡核苷酸包含对照条形码序列和伪靶区,所述伪靶区包含与所述多个条形码中的至少一个的靶结合区基本互补的序列;使用多个条形码对所述对照寡核苷酸进行条形码编码,以产生多个经条形码编码的对照寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的对照寡核苷酸的测序数据;使用所述测序数据中的所述多个经条形码编码的对照寡核苷酸的至少一个特征来确定所述一个或多个细胞的至少一个特征。在一些实施例中,伪靶区包含聚(dA)区。
在一些实施例中,对照条形码序列的长度是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。对照颗粒寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其组合。多个对照颗粒寡核苷酸中的至少2、10、100、1000或更多个的对照条形码序列可以是相同的。多个对照颗粒寡核苷酸中的至少2、10、100、1000或更多个可以包含不同的对照条形码序列。
在一些实施例中,确定所述一个或多个细胞的所述至少一个特征包括:确定所述测序数据中与所述多个经条形码编码的对照寡核苷酸关联的具有不同序列的细胞标记序列的数量;并且使用与所述多个经条形码编码的对照寡核苷酸关联的具有不同序列的细胞标记序列的数量来确定所述一个或多个细胞的数量。所述方法可以包括:根据所确定的所述一个或多个细胞的数量确定单细胞捕获效率。所述方法可以包括:包括根据所确定的所述一个或多个细胞的数量与所述多个细胞的数量的比例,确定单细胞捕获效率。
在一些实施例中,使用所述测序数据中的所述多个经条形码编码的对照寡核苷酸的特征来确定所述一个或多个细胞的至少一个特征包括:对于所述测序数据中的每个细胞标记,确定与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量;并且使用与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量确定所述一个或多个细胞的数量。确定与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量可以包括:对于所述测序数据中的每个细胞标记,确定与所述细胞标记和所述对照条形码序列关联的具有最高量的不同序列的分子标记序列的数量。使用与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量确定所述一个或多个细胞的数量可以包括:产生具有最高不同序列数量的分子标记序列的数量和测序数据中与具有最高不同序列数量的分子标记序列的数量关联的细胞标记的数量的图;并且将所述图中的截断值确定为所述一个或多个细胞的数量。
在一些实施例中,对照寡核苷酸不与多个细胞中的任何一个的基因组序列同源。对照寡核苷酸可以与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种可以是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,所述方法包括在对所述对照寡核苷酸进行条形码编码之前,从所述蛋白质结合试剂释放所述对照寡核苷酸。在一些实施例中,所述方法包括去除所述多个对照组合物中未结合的对照组合物。去除所述未结合的对照组合物可以包括用洗涤缓冲液洗涤所述多个细胞中的一个或多个细胞。去除所述未结合的样品索引组合物可以包括使用流式细胞术选择与所述对照组合物中的至少一个蛋白质结合试剂结合的细胞。
在一些实施例中,多个蛋白质靶中的至少一个在细胞表面上。多个蛋白质靶中的至少一个可以包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。蛋白质结合试剂可包含抗体。对照寡核苷酸可以通过接头与蛋白质结合试剂缀合。对照寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地附接至所述第一蛋白质结合试剂。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,蛋白质结合试剂与两个或更多个具有相同对照条形码序列的对照寡核苷酸关联。蛋白质结合试剂可以与具有不同相同对照条形码序列的两个或更多个对照寡核苷酸关联。在一些实施例中,多个对照组合物中的第二蛋白质结合试剂不与对照寡核苷酸关联。蛋白质结合试剂和第二蛋白质结合试剂可以相同。
在一些实施例中,条形码包含通用引物的结合位点。靶结合区可包含聚(dT)区。在一些实施例中,多个条形码与条形码编码颗粒关联。多个条形码中的至少一个条形码可以固定在条形码编码颗粒上。多个条形码中的至少一个条形码可以部分地固定在条形码编码颗粒上。多个条形码中的至少一个条形码被封闭在条形码编码颗粒中。多个条形码中的至少一个条形码部分地封闭在条形码编码颗粒中。条形码编码颗粒可以是可破坏的。条形码编码颗粒可以是条形码编码珠。条形码编码珠可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。条形码编码颗粒可以包含以下材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮或其任何组合。条形码编码颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,条形码编码颗粒与光学部分关联。对照寡核苷酸可以与光学部分关联。
在一些实施例中,条形码编码颗粒的条形码包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。在一些实施例中,随机条形码的分子标记序列包含序列。在一些实施例中,条形码编码颗粒包含至少10000个条形码。
在一些实施例中,对条形码对照寡核苷酸进行条形码编码包括:使用多个随机条形码对所述对照寡核苷酸进行条形码编码,以产生多个随机经条形码编码的对照寡核苷酸。在一些实施例中,使用多个条形码对多个对照寡核苷酸进行条形码编码包括:使所述多个条形码与所述多个对照组合物的对照寡核苷酸接触,以产生与所述对照寡核苷酸杂交的条形码;并且延伸与所述对照寡核苷酸杂交的随机条形码以产生所述多个经条形码编码的对照寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶、逆转录酶或其组合来延伸所述条形码。在一些实施例中,所述方法包括扩增多个经条形码编码的对照寡核苷酸以产生多个扩增子。扩增所述多个经条形码编码的对照寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增所述分子标记序列的至少一部分和所述对照寡核苷酸的至少一部分。在一些实施例中,获得测序数据包括获得所述多个扩增子的测序数据。获得所述测序数据可以包括对所述分子标记序列的所述至少一部分和所述对照寡核苷酸的所述至少一部分进行测序。
本披露包括用于测序对照的方法。在一些实施例中,所述方法包括:使多个细胞中的一个或多个细胞与多个对照组合物中的对照组合物接触,其中所述多个细胞中的细胞包含多个靶和多个结合靶,其中所述多个对照组合物中的每个包含与对照寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述多个结合靶中的至少一个特异性结合,并且其中所述对照寡核苷酸包含对照条形码序列和伪靶区,所述伪靶区包含与所述多个条形码中的至少一个的靶结合区基本互补的序列;使用多个条形码对所述对照寡核苷酸进行条形码编码,以产生多个经条形码编码的对照寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的对照寡核苷酸的测序数据;使用所述测序数据中的所述多个经条形码编码的对照寡核苷酸的至少一个特征来确定所述一个或多个细胞的至少一个特征。在一些实施例中,伪靶区包含聚(dA)区。
在一些实施例中,对照条形码序列的长度是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。对照颗粒寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其组合。多个对照颗粒寡核苷酸中的至少2、10、100、1000或更多个的对照条形码序列可以是相同的。多个对照颗粒寡核苷酸中的至少2、10、100、1000或更多个可以包含不同的对照条形码序列。
在一些实施例中,确定所述一个或多个细胞的所述至少一个特征包括:确定所述测序数据中与所述多个经条形码编码的对照寡核苷酸关联的具有不同序列的细胞标记序列的数量;并且使用与所述多个经条形码编码的对照寡核苷酸关联的具有不同序列的细胞标记序列的数量来确定所述一个或多个细胞的数量。在一些实施例中,所述方法包括:根据所确定的所述一个或多个细胞的数量确定单细胞捕获效率。在一些实施例中,所述方法包括:根据所确定的所述一个或多个细胞的数量与所述多个细胞的数量的比例,确定单细胞捕获效率。
在一些实施例中,确定所述一个或多个细胞的所述至少一个特征可以包括:对于所述测序数据中的每个细胞标记,确定与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量;并且使用与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量确定所述一个或多个细胞的数量。确定与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量包括:对于所述测序数据中的每个细胞标记,确定与所述细胞标记和所述对照条形码序列关联的具有最高量的不同序列的分子标记序列的数量。使用与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量确定所述一个或多个细胞的数量可以包括:产生具有最高不同序列数量的分子标记序列的数量和测序数据中与具有最高不同序列数量的分子标记序列的数量关联的细胞标记的数量的图;并且将所述图中的截断值确定为所述一个或多个细胞的数量。
在一些实施例中,对照寡核苷酸不与多个细胞中的任何一个的基因组序列同源。对照寡核苷酸可以与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种可以是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,所述方法包括:在对所述对照寡核苷酸进行条形码编码之前,从所述细胞组分结合试剂释放所述对照寡核苷酸。多个结合靶中的至少一个可以在细胞表面上表达。多个结合靶中的至少一个可以包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。在一些实施例中,细胞组分结合试剂可以包括细胞表面结合试剂、抗体、四聚体、适体、蛋白质支架、侵入物或其组合。
在一些实施例中,细胞组分结合试剂的结合靶选自包括10-100个不同结合靶的组。细胞组分结合试剂的结合靶可以包含碳水化合物、脂质、蛋白质、细胞外蛋白质、细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素、细胞内蛋白质或其任何组合。对照寡核苷酸可以通过接头与细胞组分结合试剂缀合。对照寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地附接至所述第一细胞组分结合试剂。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,细胞组分结合试剂可以与两个或更多个具有相同对照条形码序列的对照寡核苷酸关联。细胞组分结合试剂可以与具有不同相同对照条形码序列的两个或更多个对照寡核苷酸关联。在一些实施例中,多个对照组合物中的第二细胞组分结合试剂不与对照寡核苷酸关联。细胞组分结合试剂和第二细胞组分结合试剂可以相同。
在一些实施例中,条形码包含通用引物的结合位点。在一些实施例中,靶结合区包含聚(dT)区。
在一些实施例中,多个条形码与条形码编码颗粒关联。多个条形码中的至少一个条形码可以固定在条形码编码颗粒上。多个条形码中的至少一个条形码可以部分地固定在条形码编码颗粒上。多个条形码中的至少一个条形码可以被封闭在条形码编码颗粒中。多个条形码中的至少一个条形码可以部分地封闭在条形码编码颗粒中。条形码编码颗粒可以是可破坏的。条形码编码颗粒可以是条形码编码珠。在一些实施例中,条形码编码珠包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。条形码编码颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其组合。条形码编码颗粒可以包含可破坏的水凝胶颗粒。条形码编码颗粒可以与光学部分关联。
在一些实施例中,对照寡核苷酸可以与光学部分关联。在一些实施例中,条形码编码颗粒的条形码包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。在一些实施例中,随机条形码的分子标记序列包含序列。条形码编码颗粒可以包含至少10000个条形码。
在一些实施例中,对条形码对照寡核苷酸进行条形码编码包括:使用多个随机条形码对所述对照寡核苷酸进行条形码编码,以产生多个随机经条形码编码的对照寡核苷酸,使用所述多个条形码对所述多个对照寡核苷酸进行条形码编码可以包括:使所述多个条形码与所述多个对照组合物的对照寡核苷酸接触,以产生与所述对照寡核苷酸杂交的条形码;并且延伸与所述对照寡核苷酸杂交的随机条形码以产生所述多个经条形码编码的对照寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶、逆转录酶或其组合来延伸所述条形码。在一些实施例中,所述方法包括扩增多个经条形码编码的对照寡核苷酸以产生多个扩增子。扩增所述多个经条形码编码的对照寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增所述分子标记序列的至少一部分和所述对照寡核苷酸的至少一部分。获得所述测序数据可以包括获得所述多个扩增子的测序数据。获得所述测序数据可以包括对所述分子标记序列的所述至少一部分和所述对照寡核苷酸的所述至少一部分进行测序。
在一些实施例中,用于测序对照的方法可以包括:使多个细胞中的一个或多个细胞与多个对照组合物中的对照组合物接触,其中所述多个细胞中的细胞包含多个靶和多个蛋白质靶,其中所述多个对照组合物中的每个包含与对照寡核苷酸关联的蛋白质结合试剂,其中所述蛋白质结合试剂能够与所述多个蛋白质靶中的至少一个特异性结合,并且其中所述对照寡核苷酸包含对照条形码序列和伪靶区,所述伪靶区包含与所述多个条形码中的至少一个的靶结合区基本互补的序列;并且使用所述多个对照寡核苷酸的至少一个特征来确定所述一个或多个细胞的至少一个特征。所述伪靶区可以包含聚(dA)区。
在一些实施例中,对照条形码序列的长度是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。对照颗粒寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其组合。多个对照颗粒寡核苷酸中的至少2、10、100、1000或更多个的对照条形码序列可以是相同的。多个对照颗粒寡核苷酸中的至少2、10、100、1000或更多个可以包含不同的对照条形码序列。
在一些实施例中,确定所述一个或多个细胞的所述至少一个特征包括:确定所述测序数据中与所述多个经条形码编码的对照寡核苷酸关联的具有不同序列的细胞标记序列的数量;并且使用与所述多个经条形码编码的对照寡核苷酸关联的具有不同序列的细胞标记序列的数量来确定所述一个或多个细胞的数量。所述方法可以包括:根据所确定的所述一个或多个细胞的数量确定单细胞捕获效率。所述方法可以包括:包括根据所确定的所述一个或多个细胞的数量与所述多个细胞的数量的比例,确定单细胞捕获效率。
在一些实施例中,使用所述测序数据中的所述多个经条形码编码的对照寡核苷酸的特征来确定所述一个或多个细胞的至少一个特征包括:对于所述测序数据中的每个细胞标记,确定与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量;并且使用与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量确定所述一个或多个细胞的数量。确定与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量可以包括:对于所述测序数据中的每个细胞标记,确定与所述细胞标记和所述对照条形码序列关联的具有最高量的不同序列的分子标记序列的数量。使用与所述细胞标记和所述对照条形码序列关联的具有不同序列的分子标记序列的数量确定所述一个或多个细胞的数量可以包括:产生具有最高不同序列数量的分子标记序列的数量和测序数据中与具有最高不同序列数量的分子标记序列的数量关联的细胞标记的数量的图;并且将所述图中的截断值确定为所述一个或多个细胞的数量。
在一些实施例中,对照寡核苷酸不与多个细胞中的任何一个的基因组序列同源。对照寡核苷酸可以与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种可以是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,所述方法包括在对所述对照寡核苷酸进行条形码编码之前,从所述蛋白质结合试剂释放所述对照寡核苷酸。在一些实施例中,所述方法包括去除所述多个对照组合物中未结合的对照组合物。去除所述未结合的对照组合物可以包括用洗涤缓冲液洗涤所述多个细胞中的一个或多个细胞。去除所述未结合的样品索引组合物可以包括使用流式细胞术选择与所述对照组合物中的至少一个蛋白质结合试剂结合的细胞。
在一些实施例中,多个蛋白质靶中的至少一个在细胞表面上。多个蛋白质靶中的至少一个可以包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。蛋白质结合试剂可包含抗体。对照寡核苷酸可以通过接头与蛋白质结合试剂缀合。对照寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地附接至所述第一蛋白质结合试剂。化学基团可包含UV光可切割基团、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,蛋白质结合试剂与两个或更多个具有相同对照条形码序列的对照寡核苷酸关联。蛋白质结合试剂可以与具有不同相同对照条形码序列的两个或更多个对照寡核苷酸关联。在一些实施例中,多个对照组合物中的第二蛋白质结合试剂不与对照寡核苷酸关联。蛋白质结合试剂和第二蛋白质结合试剂可以相同。
在一些实施例中,条形码包含通用引物的结合位点。靶结合区可包含聚(dT)区。在一些实施例中,多个条形码与条形码编码颗粒关联。多个条形码中的至少一个条形码可以固定在条形码编码颗粒上。多个条形码中的至少一个条形码可以部分地固定在条形码编码颗粒上。多个条形码中的至少一个条形码被封闭在条形码编码颗粒中。多个条形码中的至少一个条形码部分地封闭在条形码编码颗粒中。条形码编码颗粒可以是可破坏的。条形码编码颗粒可以是条形码编码珠。条形码编码珠可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。条形码编码颗粒可以包含以下材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮或其任何组合。条形码编码颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,条形码编码颗粒与光学部分关联。对照寡核苷酸可以与光学部分关联。
在一些实施例中,所述方法包括:使用多个条形码对所述对照寡核苷酸进行条形码编码,以产生多个经条形码编码的对照寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得多个条形码对照寡核苷酸的测序数据;
在一些实施例中,条形码编码颗粒的条形码包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。在一些实施例中,随机条形码的分子标记序列包含序列。在一些实施例中,条形码编码颗粒包含至少10000个条形码。
在一些实施例中,对条形码对照寡核苷酸进行条形码编码包括:使用多个随机条形码对所述对照寡核苷酸进行条形码编码,以产生多个随机经条形码编码的对照寡核苷酸。在一些实施例中,使用多个条形码对多个对照寡核苷酸进行条形码编码包括:使所述多个条形码与所述多个对照组合物的对照寡核苷酸接触,以产生与所述对照寡核苷酸杂交的条形码;并且延伸与所述对照寡核苷酸杂交的随机条形码以产生所述多个经条形码编码的对照寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶、逆转录酶或其组合来延伸所述条形码。在一些实施例中,所述方法包括扩增多个经条形码编码的对照寡核苷酸以产生多个扩增子。扩增所述多个经条形码编码的对照寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增所述分子标记序列的至少一部分和所述对照寡核苷酸的至少一部分。在一些实施例中,获得测序数据包括获得所述多个扩增子的测序数据。获得所述测序数据可以包括对所述分子标记序列的所述至少一部分和所述对照寡核苷酸的所述至少一部分进行测序。
在一些实施例中,用于细胞鉴定的方法可以包括:使第一多个细胞和第二多个细胞分别与两个样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个抗原靶,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的抗原结合试剂,其中所述抗原结合试剂能够与所述一个或多个抗原靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且在获得的测序数据中鉴定与两个或更多个样品索引序列关联的细胞标记序列;并且从获得的测序数据中去除与所述细胞标记序列关联的测序数据和/或从后续分析中排除与细胞标记序列关联的测序数据。在一些实施例中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点、或其组合。
本文披露还包括用于多重态鉴定的方法。多重态表达谱或多重态可以是包含多重态细胞的表达谱的表达谱。当确定单细胞的表达谱时,可以将n个细胞鉴定为一个细胞,并且将n个细胞的表达谱鉴定为一个细胞的表达谱(称为多重态或n重态表达谱)。例如,当使用条形码编码(例如,随机条形码编码)确定两个细胞的表达谱时,所述两个细胞的mRNA分子可以与具有相同细胞标记的条形码关联。作为另一示例,两个细胞可以与一个颗粒(例如,珠)关联。颗粒可以包括具有相同的细胞标记的条形码。裂解细胞后,所述两个细胞中的mRNA分子可以与所述颗粒的条形码(由此与相同的细胞标记)关联。双重态表达谱可能会偏离表达谱的解释。在不同的实施中,多重态可以不同。在一些实施例中,多个多重态可以包括双重态、三重态、四重态、五重态、六重态、七重态、八重态、九重态或其任何组合。
多重态可以是任何n重态。在一些实施例中,n是或约是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20,或这些值中任意两个之间的范围。在一些实施例中,n至少或至多是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。单重态可以是不是多重态表达特征的表达特征。
使用样品索引寡核苷酸索引样品并鉴定多重态的性能可与使用合成多重态表达谱鉴定多重态的性能(于2018年3月20日提交的题为“SYNTHETIC MULTIPLETS FORMULTIPLETS DETERMINATION[合成多重态用于多重态测定]”的美国申请号15/926977中,其全部内容合并于此)相媲美。在一些实施例中,可以使用样品索引寡核苷酸和合成多重态表达谱来鉴定多重态。
在一些实施例中,本文披露的多重态鉴定的方法包括:使第一多个细胞和第二多个细胞分别与两个样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个抗原靶,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的抗原结合试剂,其中所述抗原结合试剂能够与所述一个或多个抗原靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且在获得的测序数据中鉴定一个或多个各自与两个或更多个样品索引序列关联的多重态细胞标记序列。在一些实施例中,所述方法包括:从获得的测序数据中去除与一个或多个多重态细胞标记序列关联的测序数据和/或从后续分析中排除与一个或多个多重态细胞标记序列关联的测序数据。在一些实施例中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点、或其组合。
在一些实施例中,使所述第一多个细胞和所述第二多个细胞分别与所述两个样品索引组合物接触包括:使所述第一多个细胞与所述两个样品索引组合物中的第一样品索引组合物接触;并且使所述第一多个细胞与所述两个样品索引组合物中的第二样品索引组合物接触。
在一些实施例中,样品索引序列的长度是至少6个核苷酸,长度是25-60个核苷酸(例如,长度是45个核苷酸),长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。样品索引寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其组合。在一些实施例中,多个样品索引组合物中的至少10、100、1000或更多个样品索引组合物的样品索引序列包含不同的序列。
在一些实施例中,抗原结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与抗原结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至抗原结合试剂。化学基团可包含UV光可切割基团、二硫键、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,第一多个细胞和第二多个细胞中的至少一个包含单细胞。一个或多个抗原靶中的至少一个可以在细胞表面上。
在一些实施例中,所述方法包括:去除所述两个样品索引组合物中未结合的样品索引组合物。去除所述未结合的样品索引组合物可以包括用洗涤缓冲液洗涤所述第一多个细胞中的和所述第二多个细胞中的细胞。去除所述未结合的样品索引组合物可以包括使用流式细胞术选择与所述两个样品索引组合物中的至少一个抗原结合试剂结合的细胞。在一些实施例中,所述方法包括:裂解第一多个细胞和所述第二多个细胞中的一个或多个细胞。
在一些实施例中,样品索引寡核苷酸被配置为与抗原结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与抗原结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与抗原结合试剂分离。
在一些实施例中,样品索引寡核苷酸与一个或多个细胞中的任何一个的基因组序列不同源。对照条形码序列可以不与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,第一多个细胞和第二多个细胞包含肿瘤细胞,哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码可以包含靶结合区,所述靶结合区包含所述捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。
在一些实施例中,抗原靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。抗原靶可以是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。抗原靶可以是或包含脂质、碳水化合物或其任何组合。抗原靶可以选自包含10-100个不同抗原靶的组。
在一些实施例中,抗原结合试剂与两个或更多个具有相同序列的样品索引寡核苷酸关联。抗原结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与样品索引寡核苷酸缀合的第二抗原结合试剂。抗原结合试剂和第二抗原结合试剂可以相同。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列,并且所述多个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码可以与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上。多个条形码中的至少一个条形码可以部分地固定在颗粒上。多个条形码中的至少一个条形码可以被封闭在颗粒中。多个条形码中的至少一个条形码可以部分地封闭在颗粒中。颗粒可以是可破坏的。颗粒可以是珠。珠可以是或包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷/(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,抗原结合试剂与可检测部分关联。在一些实施例中,颗粒与可检测部分关联。样品索引寡核苷酸与光学部分关联。在一些实施例中,颗粒的条形码可以包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。颗粒可以包含至少10000个条形码。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:扩增所述多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。在一些实施例中,获得多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得所述测序数据包括对所述分子标记序列的至少一部分和所述样品索引寡核苷酸的至少一部分进行测序。在一些实施例中,鉴定至少一个细胞的样品来源包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用所述多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。
在一些实施例中,所述方法包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
在一些实施例中,用于细胞鉴定的方法可以包括:使第一多个细胞和第二多个细胞分别与两个样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个细胞组分靶,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;在获得的测序数据中鉴定一个或多个各自与两个或更多个样品索引序列关联的细胞标记序列;并且从获得的测序数据中去除与所述一个或多个各自与两个或更多个样品索引序列关联的细胞标记序列关联的测序数据和/或从后续分析中排除与所述一个或多个各自与两个或更多个样品索引序列关联的细胞标记序列关联的测序数据。在一些实施例中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点、或其组合。
本文披露包括用于多重态鉴定的方法。在一些实施例中,所述方法包括:使第一多个细胞和第二多个细胞分别与两个样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个细胞组分靶,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;在获得的测序数据中鉴定一个或多个各自与两个或更多个样品索引序列关联的多重态细胞标记序列。在一些实施例中,所述方法包括:从获得的测序数据中去除与一个或多个多重态细胞标记序列关联的测序数据和/或从后续分析中排除与一个或多个多重态细胞标记序列关联的测序数据。在一些实施例中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点、或其组合。
在一些实施例中,使所述第一多个细胞和所述第二多个细胞分别与所述两个样品索引组合物接触包括:使所述第一多个细胞与所述两个样品索引组合物中的第一样品索引组合物接触;并且使所述第一多个细胞与所述两个样品索引组合物中的第二样品索引组合物接触。
在一些实施例中,样品索引序列的长度是至少6个核苷酸,长度是25-60个核苷酸(例如,长度是45个核苷酸),长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。样品索引寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其组合。在一些实施例中,多个样品索引组合物中的至少10、100、1000或更多个样品索引组合物的样品索引序列包含不同的序列。
在一些实施例中,细胞组分结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与细胞组分结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂。化学基团可包含UV光可切割基团、二硫键、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,第一多个细胞和第二多个细胞中的至少一个包含单细胞。一个或多个细胞组分靶中的至少一个可以在细胞表面上。
在一些实施例中,所述方法包括:去除所述两个样品索引组合物中未结合的样品索引组合物。去除所述未结合的样品索引组合物可以包括用洗涤缓冲液洗涤所述第一多个细胞中的和所述第二多个细胞中的细胞。去除所述未结合的样品索引组合物可以包括使用流式细胞术选择与所述两个样品索引组合物中的至少一个细胞组分结合试剂结合的细胞。在一些实施例中,所述方法包括:裂解第一多个细胞和所述第二多个细胞中的一个或多个细胞。
在一些实施例中,样品索引寡核苷酸被配置为与细胞组分结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与细胞组分结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与细胞组分结合试剂分离。
在一些实施例中,样品索引寡核苷酸与一个或多个细胞中的任何一个的基因组序列不同源。对照条形码序列可以不与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,第一多个细胞和第二多个细胞包含肿瘤细胞,哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码可以包含靶结合区,所述靶结合区包含所述捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。
在一些实施例中,抗原靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。抗原靶可以是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。抗原靶可以是或包含脂质、碳水化合物或其任何组合。抗原靶可以选自包含10-100个不同抗原靶的组。
在一些实施例中,细胞组分结合试剂与两个或更多个具有相同序列的样品索引寡核苷酸关联。细胞组分结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与所述样品索引寡核苷酸缀合的第二细胞组分结合试剂。细胞组分结合试剂和第二细胞组分结合试剂可以相同。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列,并且所述多个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码可以与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上。多个条形码中的至少一个条形码可以部分地固定在颗粒上。多个条形码中的至少一个条形码可以被封闭在颗粒中。多个条形码中的至少一个条形码可以部分地封闭在颗粒中。颗粒可以是可破坏的。颗粒可以是珠。珠可以是或包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,细胞组分结合试剂与可检测部分关联。在一些实施例中,颗粒与可检测部分关联。样品索引寡核苷酸与光学部分关联。
在一些实施例中,颗粒的条形码可以包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。颗粒可以包含至少10000个条形码。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:扩增所述多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。在一些实施例中,获得多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得所述测序数据包括对所述分子标记序列的至少一部分和所述样品索引寡核苷酸的至少一部分进行测序。在一些实施例中,鉴定至少一个细胞的样品来源包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用所述多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。
在一些实施例中,所述方法包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
本文披露包括用于细胞鉴定的方法。在一些实施例中,所述方法包括:使来自第一多个细胞和第二多个细胞中的每个的一个或多个细胞分别与多个两个样品索引组合物的样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个抗原靶,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的抗原结合试剂,其中所述抗原结合试剂能够与所述一个或多个抗原靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述两个样品索引组合物的样品索引序列包含不同的序列;并且鉴定一个或多个各自与两个或更多个样品索引序列关联的细胞。在一些实施例中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点、或其组合。
本文披露包括用于多重态鉴定的方法。在一些实施例中,所述方法包括:使来自第一多个细胞和第二多个细胞中的每个的一个或多个细胞分别与多个两个样品索引组合物的样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个抗原靶,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的抗原结合试剂,其中所述抗原结合试剂能够与所述一个或多个抗原靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述两个样品索引组合物的样品索引序列包含不同的序列;并且将一个或多个各自与两个或更多个样品索引序列关联的细胞鉴定为多重态细胞。
在一些实施例中,鉴定所述各自与两个或更多个样品索引序列关联的细胞包括:使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、分子标记序列和靶结合区,其中所述多个条形码中的至少两个条形码的分子标记序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且在获得的测序数据中鉴定一个或多个各自与两个或更多个样品索引序列关联的细胞标记序列。所述方法可以包括从获得的测序数据中去除与所述一个或多个各自与两个或更多个样品索引序列关联的细胞标记序列关联的测序数据和/或从后续分析中排除与所述一个或多个各自与所述两个或更多个样品索引序列关联的细胞标记序列关联的测序数据。
在一些实施例中,使所述第一多个细胞和所述第二多个细胞分别与所述两个样品索引组合物接触包括:使所述第一多个细胞与所述两个样品索引组合物中的第一样品索引组合物接触;并且使所述第一多个细胞与所述两个样品索引组合物中的第二样品索引组合物接触。
在一些实施例中,样品索引序列的长度是至少6个核苷酸,长度是25-60个核苷酸(例如,长度是45个核苷酸),长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200-500个核苷酸,或其组合。样品索引寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200-300个核苷酸,长度是约500个核苷酸,或其组合。在一些实施例中,多个样品索引组合物中的至少10、100、1000或更多个样品索引组合物的样品索引序列包含不同的序列。
在一些实施例中,抗原结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与抗原结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至抗原结合试剂。化学基团可包含UV光可切割基团、二硫键、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,第一多个细胞和第二多个细胞中的至少一个包含单细胞。一个或多个抗原靶中的至少一个可以在细胞表面上。在一些实施例中,所述方法包括:去除所述两个样品索引组合物中未结合的样品索引组合物。去除所述未结合的样品索引组合物可以包括用洗涤缓冲液洗涤所述第一多个细胞中的和所述第二多个细胞中的细胞。去除所述未结合的样品索引组合物可以包括使用流式细胞术选择与所述两个样品索引组合物中的至少一个抗原结合试剂结合的细胞。在一些实施例中,所述方法包括:裂解第一多个细胞和所述第二多个细胞中的一个或多个细胞。
在一些实施例中,样品索引寡核苷酸被配置为与抗原结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与抗原结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与抗原结合试剂分离。
在一些实施例中,样品索引寡核苷酸与一个或多个细胞中的任何一个的基因组序列不同源。对照条形码序列可以不与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种是T7噬菌体、PhiX噬菌体或其组合。
在一些实施例中,第一多个细胞和第二多个细胞包含肿瘤细胞,哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码可以包含靶结合区,所述靶结合区包含所述捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。
在一些实施例中,抗原靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。抗原靶可以是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。抗原靶可以是或包含脂质、碳水化合物或其任何组合。抗原靶可以选自包含10-100个不同抗原靶的组。
在一些实施例中,抗原结合试剂与两个或更多个具有相同序列的样品索引寡核苷酸关联。抗原结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与样品索引寡核苷酸缀合的第二抗原结合试剂。抗原结合试剂和第二抗原结合试剂可以相同。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列,并且所述多个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码可以与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上。多个条形码中的至少一个条形码可以部分地固定在颗粒上。多个条形码中的至少一个条形码可以被封闭在颗粒中。多个条形码中的至少一个条形码可以部分地封闭在颗粒中。颗粒可以是可破坏的。颗粒可以是珠。珠可以是或包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含可破坏的水凝胶颗粒。
在一些实施例中,抗原结合试剂与可检测部分关联。在一些实施例中,颗粒与可检测部分关联。样品索引寡核苷酸与光学部分关联。
在一些实施例中,颗粒的条形码可以包含选自至少1000、10000个或更多个不同的分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。颗粒可以包含至少10000个条形码。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:扩增所述多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。在一些实施例中,获得多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得所述测序数据包括对所述分子标记序列的至少一部分和所述样品索引寡核苷酸的至少一部分进行测序。在一些实施例中,鉴定至少一个细胞的样品来源包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用所述多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。
在一些实施例中,所述方法包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
本文披露包括用于确定细胞组分靶之间例如蛋白质之间的相互作用的系统、方法和试剂盒。在一些实施例中,所述方法包括:使细胞与第一对相互作用确定组合物接触,其中所述细胞包含第一蛋白质靶和第二蛋白质靶,其中所述第一对相互作用确定组合物的每个包含与相互作用确定寡核苷酸关联的蛋白质结合试剂,其中所述第一对相互作用确定组合物中的一个的蛋白质结合试剂能够与所述第一蛋白质靶特异性结合并且所述第一对相互作用确定组合物中的另一个的蛋白质结合试剂能够与所述第二蛋白质靶特异性结合,并且其中所述相互作用确定寡核苷酸包含相互作用确定序列和桥寡核苷酸杂交区,并且其中所述第一对相互作用确定组合物的相互作用确定序列包含不同的序列;使用桥寡核苷酸连接所述第一对相互作用确定组合物的相互作用确定寡核苷酸以产生连接的相互作用确定寡核苷酸,其中所述桥寡核苷酸包含能够与所述第一对相互作用确定组合物的桥寡核苷酸杂交区特异性结合的两个杂交区;使用多个条形码对所述连接的相互作用确定寡核苷酸进行条形码编码,以产生多个经条形码编码的相互作用确定寡核苷酸,其中所述多个条形码中的每个条形码包含条形码序列和捕获序列;获得所述多个经条形码编码的相互作用确定寡核苷酸的测序数据;并且基于获得的测序数据中所述第一对相互作用确定组合物的相互作用确定序列的关联,确定所述第一蛋白质靶和所述第二蛋白质靶之间的相互作用。
本文披露包括用于确定细胞组分靶之间的相互作用的系统、方法和试剂盒。在一些实施例中,所述方法包括:使细胞与第一对相互作用确定组合物接触,其中所述细胞包含第一细胞组分靶和第二细胞组分靶,其中所述第一对相互作用确定组合物的每个包含与相互作用确定寡核苷酸关联的细胞组分结合试剂,其中所述第一对相互作用确定组合物中的一个的细胞组分结合试剂能够与所述第一细胞组分靶特异性结合并且所述第一对相互作用确定组合物中的另一个的细胞组分结合试剂能够与所述第二细胞组分靶特异性结合,并且其中所述相互作用确定寡核苷酸包含相互作用确定序列和桥寡核苷酸杂交区,并且其中所述第一对相互作用确定组合物的相互作用确定序列包含不同的序列;使用桥寡核苷酸连接所述第一对相互作用确定组合物的相互作用确定寡核苷酸以产生连接的相互作用确定寡核苷酸,其中所述桥寡核苷酸包含能够与所述第一对相互作用确定组合物的桥寡核苷酸杂交区特异性结合的两个杂交区;使用多个条形码对所述连接的相互作用确定寡核苷酸进行条形码编码,以产生多个经条形码编码的相互作用确定寡核苷酸,其中所述多个条形码中的每个条形码包含条形码序列和捕获序列;获得所述多个经条形码编码的相互作用确定寡核苷酸的测序数据;并且基于获得的测序数据中所述第一对相互作用确定组合物的相互作用确定序列的关联,确定所述第一细胞组分靶和所述第二细胞组分靶之间的相互作用。两个细胞组分结合试剂中的至少一个可以包含蛋白质结合试剂。蛋白质结合试剂可以与两个相互作用确定寡核苷酸中的一个关联。一个或多个细胞组分靶可以包含至少一个蛋白质靶。
在一些实施例中,使所述细胞与所述第一对相互作用确定组合物接触包括:使所述细胞与所述第一对相互作用确定组合物中的每个依次或同时接触。所述第一蛋白质靶可以与所述第二蛋白质靶相同,或者所述第一蛋白质靶可以与所述第二蛋白质靶不同。
相互作用确定序列的长度可以变化。例如,相互作用确定序列的长度可以是2个核苷酸至约1000个核苷酸。在一些实施例中,相互作用确定序列的长度可以是至少6个核苷酸,长度是25-60个核苷酸,长度是约45个核苷酸,长度是约50个核苷酸,长度是约100个核苷酸,长度是约128个核苷酸,至少长度是128个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是约200-300个核苷酸,长度是约200-500个核苷酸,长度是约500个核苷酸,或其任何组合。
在一些实施例中,所述方法包括:使所述细胞与第二对相互作用确定组合物接触,其中所述细胞包含第三蛋白质靶和第四蛋白质靶,其中所述第二对相互作用确定组合物的每个包含与相互作用确定寡核苷酸关联的蛋白质结合试剂,其中所述第二对相互作用确定组合物中的一个的蛋白质结合试剂能够与所述第三蛋白质靶特异性结合并且所述第二对相互作用确定组合物中的另一个的蛋白质结合试剂能够与所述第四蛋白质靶特异性结合。所述第三和第四蛋白质靶中的至少一个可以与所述第一和第二蛋白质靶中的一个不同。在一些实施例中,所述第三和第四蛋白质靶中的至少一个可以与所述第一和第二蛋白质靶中的至少一个相同。
在一些实施例中,所述方法包括:使所述细胞与三对或更多对相互作用确定组合物接触。所述多对相互作用确定组合物中的至少10个或其组合的相互作用确定组合物的相互作用确定序列可以包含不同的序列。所述多对相互作用确定组合物中的至少100个或其组合的相互作用确定组合物的相互作用确定序列可以包含不同的序列。所述多对相互作用确定组合物中的至少1000个或其组合的相互作用确定组合物的相互作用确定序列可以包含不同的序列。
在一些实施例中,第一对相互作用确定组合物的桥寡核苷酸杂交区包含不同的序列。所述桥寡核苷酸杂交区中的至少一个可以与所述桥寡核苷酸的两个杂交区中的至少一个互补。
在一些实施例中,使用所述桥寡核苷酸连接所述第一对相互作用确定组合物的相互作用确定寡核苷酸包括:使所述桥寡核苷酸的第一杂交区与所述相互作用确定寡核苷酸的桥寡核苷酸杂交区的第一桥寡核苷酸杂交区杂交;使所述桥寡核苷酸的第二杂交区与所述相互作用确定寡核苷酸的桥寡核苷酸杂交区的第二桥寡核苷酸杂交区杂交;并且连接与所述桥寡核苷酸杂交的相互作用确定寡核苷酸以产生连接的相互作用确定寡核苷酸。
在一些实施例中,蛋白质结合试剂包含抗体、四聚体、适体、蛋白质支架、整合素或其组合。相互作用确定寡核苷酸可以通过接头与蛋白质结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至蛋白质结合试剂。化学基团可包含UV光可切割基团、二硫键、链霉亲和素、生物素、胺、二硫键或其任何组合。
蛋白质靶在细胞中的位置可以变化,例如在细胞表面或细胞内部。在一些实施例中,一个或多个蛋白质靶中的至少一个在细胞表面上。在一些实施例中,一个或多个蛋白质靶中的至少一个是细胞内蛋白质。在一些实施例中,一个或多个蛋白质靶中的至少一个是跨膜蛋白质。在一些实施例中,一个或多个蛋白质靶中的至少一个是细胞外蛋白质。在一些实施例中,所述方法可以包括:在使所述细胞与所述第一对相互作用确定组合物接触之前将所述细胞固定。在一些实施例中,所述方法可以包括:去除所述第一对相互作用确定组合物的未结合的相互作用确定组合物。去除所述未结合的相互作用确定组合物可以包括用洗涤缓冲液洗涤所述细胞。去除所述未结合的相互作用确定组合物可以包括使用流式细胞术选择所述细胞。在一些实施例中,所述方法可以包括:裂解所述细胞。
在一些实施例中,相互作用确定寡核苷酸被配置为与蛋白质结合试剂可分离或不可分离。所述方法可以包括:使所述相互作用确定寡核苷酸与所述蛋白质结合试剂分离。分离所述相互作用确定寡核苷酸可以包括通过UV光切割、化学处理、加热、酶处理或其任何组合使所述相互作用确定寡核苷酸与所述蛋白质结合试剂分离。相互作用确定寡核苷酸可以不与细胞的基因组序列同源。相互作用确定寡核苷酸可以与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种可以是T7噬菌体、PhiX噬菌体或其组合。在一些实施例中,第一对相互作用确定组合物中的一个的相互作用确定寡核苷酸包含与捕获序列互补的序列。捕获序列可以包含聚(dT)区。与捕获序列互补的相互作用确定寡核苷酸的序列可以包含聚(dA)区。在一些实施例中,相互作用确定寡核苷酸包含第二条形码序列。第一对相互作用鉴定组合物中的另一个的相互作用确定寡核苷酸可以包含通用引物的结合位点。相互作用确定寡核苷酸可以与可检测部分关联。
在一些实施例中,所述蛋白质结合试剂可以与两个或更多个具有不同相互作用确定序列的相互作用确定寡核苷酸关联。在一些实施例中,所述多个相互作用确定组合物中的一个包含不与所述相互作用确定寡核苷酸关联的第二蛋白质结合试剂。蛋白质结合试剂和第二蛋白质结合试剂可以相同。蛋白质结合试剂可以与可检测部分关联。
在一些实施例中,细胞是肿瘤细胞或非肿瘤细胞。例如,细胞可以是哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。在一些实施例中,所述方法包括:使两个或更多个细胞与所述第一对相互作用确定组合物接触,并且其中所述两个或更多个细胞中的每个包含所述第一蛋白质靶和所述第二蛋白质靶。所述两个或更多个细胞中的至少一个可以包含单细胞。
在一些实施例中,蛋白质靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。蛋白质靶可以是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。蛋白质靶可以是或包含脂质、碳水化合物或其任何组合。蛋白质靶可以选自包含10-100个不同蛋白质靶的组。蛋白质结合试剂可以与两个或更多个具有相同序列的相互作用确定寡核苷酸关联。
在一些实施例中,条形码包含细胞标记序列、通用引物的结合位点或其任何组合。多个条形码中的至少两个条形码可以包含相同的细胞标记序列。在一些实施例中,多个条形码与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上。多个条形码中的至少一个条形码可以部分地固定在颗粒上。多个条形码中的至少一个条形码可以被封闭在颗粒中。多个条形码中的至少一个条形码可以部分地封闭在颗粒中。颗粒可以是可破坏的。颗粒可以包含珠。颗粒可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含可破坏的水凝胶颗粒。颗粒可以与可检测部分关联。
在一些实施例中,颗粒的条形码包含选自至少1000个不同条形码序列的条形码序列。颗粒的条形码可以包含选自至少10000个不同条形码序列的条形码序列。条形码的条形码序列可以包含随机序列。颗粒可以包含至少10000个条形码。
在一些实施例中,使用多个条形码对相互作用确定寡核苷酸进行条形码编码包括:使所述多个条形码与所述相互作用确定寡核苷酸接触以产生与所述相互作用确定寡核苷酸杂交的条形码;并且延伸与所述相互作用确定寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的相互作用确定寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的相互作用确定寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生所述多个经条形码编码的相互作用确定寡核苷酸。延伸所述条形码可以包括使用莫洛尼鼠白血病病毒(M-MLV)逆转录酶或Taq DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的相互作用确定寡核苷酸。延伸所述条形码可以包括从所述连接的相互作用确定寡核苷酸置换所述桥寡核苷酸。
在一些实施例中,所述方法包括:扩增所述多个经条形码编码的相互作用确定寡核苷酸以产生多个扩增子。扩增所述多个经条形码编码的相互作用确定寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增所述条形码序列的至少一部分和所述相互作用确定寡核苷酸的至少一部分。获得所述多个经条形码编码的相互作用确定寡核苷酸的测序数据可以包括获得所述多个扩增子的测序数据。获得所述测序数据可以包括对所述条形码序列的至少一部分和所述相互作用确定寡核苷酸的至少一部分进行测序。
在一些实施例中,获得所述多个经条形码编码的相互作用确定寡核苷酸的测序数据包括获得所述多个经条形码编码的相互作用确定寡核苷酸的部分序列和/或完整序列。
在一些实施例中,多个条形码包含多个随机条形码。多个随机条形码中的每个的条形码序列可以包含分子标记序列。多个随机条形码中的至少两个随机条形码的分子标记序列可以包含不同的序列。使用多个条形码对相互作用确定寡核苷酸进行条形码编码以产生多个经条形码编码的相互作用确定寡核苷酸可以包括使用多个随机条形码对相互作用确定寡核苷酸进行随机条形码编码以产生多个经随机经条形码编码的相互作用确定寡核苷酸。
在一些实施例中,所述方法包括:使用所述多个条形码对所述细胞的多个靶进行条形码编码以产生多个经条形码编码的靶;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。所述方法可以包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
本文披露包括用于鉴定细胞组分例如蛋白质-蛋白质之间的相互作用的试剂盒。在一些实施例中,试剂盒包含:第一对相互作用确定组合物,其中所述第一对相互作用确定组合物的每个包含与相互作用确定寡核苷酸关联的蛋白质结合试剂,其中所述第一对相互作用确定组合物中的一个的蛋白质结合试剂能够与第一蛋白质靶特异性结合并且所述第一对相互作用确定组合物中的另一个的蛋白质结合试剂能够与所述第二蛋白质靶特异性结合,其中所述相互作用确定寡核苷酸包含相互作用确定序列和桥寡核苷酸杂交区,并且其中所述第一对相互作用确定组合物的相互作用确定序列包含不同的序列;以及多个桥寡核苷酸,其各自包含能够与所述第一对相互作用确定组合物的桥寡核苷酸杂交区特异性结合的两个杂交区。
相互作用确定序列的长度可以变化。在一些实施例中,相互作用测定序列的长度是至少6个核苷酸,长度是25-60个核苷酸,长度是约45个核苷酸,长度是约50个核苷酸,长度是约100个核苷酸,长度是约128个核苷酸,长度是至少128个核苷酸,长度是约200至500个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度是小于约200至300个核苷酸,长度是约500个核苷酸,或其任何组合。
在一些实施例中,试剂盒进一步包含:第二对相互作用确定组合物,其中所述第二对相互作用确定组合物的每个包含与相互作用确定寡核苷酸关联的蛋白质结合试剂,其中所述第二对相互作用确定组合物中的一个的蛋白质结合试剂能够与第三蛋白质靶特异性结合并且所述第二对相互作用确定组合物中的另一个的蛋白质结合试剂能够与第四蛋白质靶特异性结合。所述第三和第四蛋白质靶中的至少一个可以与所述第一和第二蛋白质靶中的一个不同。所述第三和第四蛋白质靶中的至少一个可以与所述第一和第二蛋白质靶中的至少一个相同。
在一些实施例中,试剂盒可以包含三对或更多对相互作用确定组合物。所述三对或更多对相互作用确定组合物中的至少10个或其组合的相互作用确定组合物的相互作用确定序列可以包含不同的序列。所述三对或更多对相互作用确定组合物中的至少100个或其组合的相互作用确定组合物的相互作用确定序列可以包含不同的序列。所述三对或更多对相互作用确定组合物中的至少1000个或其组合的相互作用确定组合物的相互作用确定序列可以包含不同的序列。
在一些实施例中,所述多个相互作用确定组合物中的两个相互作用确定组合物的桥寡核苷酸杂交区包含不同的序列。所述桥寡核苷酸杂交区中的至少一个可以与所述桥寡核苷酸的两个杂交区中的至少一个互补。
在一些实施例中,蛋白质结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。相互作用确定寡核苷酸可以通过接头与蛋白质结合试剂缀合。至少一个相互作用确定寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至蛋白质结合试剂。化学基团可包含UV光可切割基团、二硫键、链霉亲和素、生物素、胺、二硫键或其任何组合。相互作用确定寡核苷酸可以与任何目的细胞的基因组序列不同源。目的细胞可以是肿瘤细胞或非肿瘤细胞。目的细胞可以是单细胞、哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。
在一些实施例中,试剂盒进一步包含:多个条形码,其中所述多个条形码中的每个包含条形码序列和捕获序列。所述第一对相互作用确定组合物中的一个的相互作用确定寡核苷酸可以包含与多个条形码中的至少一个条形码的捕获序列互补的序列。捕获序列可以包含聚(dT)区。与所述条形码的所述捕获序列互补的所述相互作用确定寡核苷酸的序列可以包含聚(dA)区。所述第一对相互作用鉴定组合物中的另一个的相互作用确定寡核苷酸可以包含细胞标记序列、通用引物的结合位点或其任何组合。所述多个条形码可以包含多个随机条形码,其中所述多个随机条形码中的每个的条形码序列包含分子标记序列,其中所述多个随机条形码中的至少两个随机条形码的分子标记序列包含不同的序列。
在一些实施例中,蛋白质靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。蛋白质靶可以是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。蛋白质靶可以选自包含10-100个不同蛋白质靶的组。蛋白质结合试剂可以与两个或更多个具有相同序列的相互作用确定寡核苷酸关联。所述蛋白质结合试剂可以与两个或更多个具有不同相互作用确定序列的相互作用确定寡核苷酸关联。在一些实施例中,蛋白质结合试剂可以与可检测部分关联。
在一些实施例中,第一对相互作用确定组合物中的一个包含不与相互作用确定寡核苷酸关联的第二蛋白质结合试剂。第一蛋白质结合试剂和第二蛋白质结合试剂可以相同。相互作用确定寡核苷酸可以与可检测部分关联。
在一些实施例中,多个条形码与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上。多个条形码中的至少一个条形码可以部分地固定在颗粒上。多个条形码中的至少一个条形码可以被封闭在颗粒中。多个条形码中的至少一个条形码可以部分地封闭在颗粒中。颗粒可以是可破坏的。颗粒可以包含珠。颗粒可以包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含可破坏的水凝胶颗粒。颗粒可以与可检测部分关联。
在一些实施例中,颗粒的条形码包含选自至少1000个不同条形码序列的条形码序列。颗粒的条形码可以包含选自至少10000个不同条形码序列的条形码序列。条形码的条形码序列可以包含随机序列。颗粒可以包含至少10000个条形码。
在一些实施例中,试剂盒包含:DNA聚合酶、逆转录酶、莫洛尼鼠白血病病毒(M-MLV)逆转录酶、Taq DNA聚合酶或其任何组合。试剂盒可以包含固定剂。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂(例如抗体),其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶(例如蛋白质)中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸;使用多个菊花链式扩增引物扩增所述多个经条形码编码的样品索引寡核苷酸,以产生多个菊花链式延长的扩增子;获得所述多个菊花链式延长的扩增子的测序数据,所述测序数据包含所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。所述方法可以包括去除所述多个样品索引组合物中未结合的样品索引组合物。
在一些实施例中,样品索引序列的长度是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,或长度是至少128个核苷酸,或其组合。样品索引寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度小于约200-300个核苷酸,长度是约200-500个核苷酸,长度是500个核苷酸,或其组合。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列可以包含不同的序列。多个样品索引组合物中的至少100或1000个样品索引组合物的样品索引序列可以包含不同的序列。
在一些实施例中,细胞组分结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与细胞组分结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,多个样品中的至少一个样品包含单细胞。一个或多个细胞组分靶中的至少一个可以在细胞表面上。多个样品中的样品可以包含多个细胞、组织、肿瘤样品或其任何组合。多个样品可以包含哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。
在一些实施例中,去除所述未结合的样品索引组合物包括用洗涤缓冲液洗涤来自所述多个样品的每个的一个或多个细胞。所述方法可以包括裂解来自所述多个样品中的每个的一个或多个细胞。样品索引寡核苷酸可以被配置为与所述细胞组分结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与细胞组分结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与细胞组分结合试剂分离。
在一些实施例中,样品索引寡核苷酸与多个样品的细胞的基因组序列不同源。样品索引寡核苷酸可以包含分子标记序列、聚(A)区或其组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码的靶结合区可包含捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(A)尾。样品索引寡核苷酸可以包含分子标记。
在一些实施例中,细胞组分靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。细胞组分靶可以是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。细胞组分靶可以是或包含脂质、碳水化合物或其任何组合。细胞组分靶可以选自包含10-100个不同细胞组分靶的组。细胞组分结合试剂可以与两个或更多个具有相同序列的样品索引寡核苷酸关联。细胞组分结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与所述样品索引寡核苷酸缀合的第二细胞组分结合试剂。细胞组分结合试剂和第二细胞组分结合试剂可以相同。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列。多个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上、部分固定在颗粒上、封闭在颗粒中、部分封闭在颗粒中,或其任何组合。颗粒可以是可降解的。颗粒可以是珠。珠可以选自由以下组成的组:链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠及其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含至少10000个条形码。在一些实施例中,颗粒的条形码可以包含选自至少1000或10000个不同分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,扩增所述多个经条形码编码的样品索引寡核苷酸包括使用聚合酶链式反应(PCR)扩增所述多个经条形码编码的样品索引寡核苷酸。扩增所述多个经条形码编码的样品索引寡核苷酸可以包括扩增所述分子标记序列的至少一部分和所述样品索引寡核苷酸的至少一部分。获得所述多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得所述多个菊花链式延长的扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。
在一些实施例中,所述多个菊花链式扩增引物中的每个菊花链式扩增引物包含经条形码编码的样品索引寡核苷酸结合区和突出端区,其中所述经条形码编码的样品索引寡核苷酸结合区能够与所述样品索引寡核苷酸的菊花链式样品索引区结合。经条形码编码的样品索引寡核苷酸结合区长度可以是至少20个核苷酸,长度是至少30个核苷酸,长度是约40个核苷酸,长度是至少40个核苷酸,长度是约50个核苷酸或其组合。所述多个菊花链式扩增引物中的两个菊花链扩增引物可以包含具有相同序列的经条形码编码的样品索引寡核苷酸结合区。所述多个菊花链式扩增引物可以包含具有相同序列的经条形码编码的样品索引寡核苷酸结合区。所述突出端区的长度可以是至少50个核苷酸,长度是至少100个核苷酸,长度是至少150个核苷酸,长度是约150个核苷酸,长度是至少200个核苷酸,或其组合。所述突出端区可以包含菊花链式扩增引物条形码序列。所述多个菊花链式扩增引物中的两个菊花链式扩增引物可以包含具有相同菊花链式扩增引物条形码序列的突出端区。所述多个菊花链式扩增引物中的两个菊花链式扩增引物可以包含具有两个菊花链式扩增引物条形码序列的突出端区。所述多个菊花链式扩增引物的突出端区可以包含不同的菊花链式扩增引物条形码序列。所述多个菊花链式延长的扩增子中的菊花链式延长的扩增子的长度可以是至少250个核苷酸,长度是至少300个核苷酸,长度是至少350个核苷酸,长度是至少400个核苷酸,长度是约400个核苷酸,长度是至少450个核苷酸,长度是至少500个核苷酸或其组合。
在一些实施例中,鉴定至少一个细胞的样品来源可以包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸可以包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。在获得所述多个经条形码编码的靶的测序数据之前,所述方法可以包括扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
在一些实施例中,多个样品索引组合物中的每个包含细胞组分结合试剂。与两个或更多个细胞组分结合试剂关联的样品索引寡核苷酸的样品索引序列可以是相同的。与两个或更多个细胞组分结合试剂关联的样品索引寡核苷酸的样品索引序列可以包含不同的序列。多个样品索引组合物中的每个可以包含两个或更多个细胞组分结合试剂。在一些实施例中,细胞组分是抗原。细胞组分结合试剂可以是抗体。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个结合靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个结合靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸;使用多个菊花链式扩增引物获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。所述方法可以包括去除所述多个样品索引组合物中未结合的样品索引组合物。
在一些实施例中,样品索引序列的长度是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,或长度是至少128个核苷酸,或其组合。样品索引寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度小于约200-300个核苷酸,长度是约200-500个核苷酸,长度是500个核苷酸,或其组合。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列可以包含不同的序列。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列可以包含不同的序列。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列包含不同的序列。
在一些实施例中,细胞组分结合试剂包括细胞表面结合试剂、抗体、四聚体、适体、蛋白质支架,整合素或其组合。样品索引寡核苷酸可以通过接头与细胞组分结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,多个样品中的至少一个样品包含单细胞。一个或多个细胞组分靶中的至少一个可以在细胞表面上表达。多个样品中的样品可以包含多个细胞、组织、肿瘤样品或其任何组合。多个样品可以包含哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。
在一些实施例中,去除所述未结合的样品索引组合物包括用洗涤缓冲液洗涤来自所述多个样品的每个的一个或多个细胞。所述方法可以包括裂解来自所述多个样品中的每个的一个或多个细胞。样品索引寡核苷酸可以被配置为与所述细胞组分结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与细胞组分结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与细胞组分结合试剂分离。
在一些实施例中,样品索引寡核苷酸与多个样品的细胞的基因组序列不同源。样品索引寡核苷酸可以包含分子标记序列、聚(A)区或其组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码的靶结合区可包含捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(A)尾。样品索引寡核苷酸可以包含分子标记。
在一些实施例中,细胞组分靶是或包含碳水化合物、脂质、蛋白质、细胞外蛋白质、细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素、细胞内蛋白质或其任何组合。细胞组分靶可以选自包含10-100个不同细胞组分靶的组。细胞组分结合试剂可以与两个或更多个具有相同序列的样品索引寡核苷酸关联。细胞组分结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与所述样品索引寡核苷酸缀合的第二细胞组分结合试剂。细胞组分结合试剂和第二细胞结合试剂可以相同。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列。多个条形码中的至少两个条形码的分子标记序列可以包含不同的分子标记序列。条形码可以包含细胞标记、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码被封闭在颗粒中。颗粒可以是珠。多个条形码中的至少一个条形码可以固定在颗粒上、部分固定在颗粒上、封闭在颗粒中、部分封闭在颗粒中,或其任何组合。颗粒可以是可降解的。珠可以选自由以下组成的组:链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠及其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含至少10000个条形码。在一些实施例中,颗粒的条形码可以包含选自至少1000或10000个不同分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括扩增多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。扩增所述多个经条形码编码的样品索引寡核苷酸可以包括使用所述多个菊花链式扩增引物扩增所述多个经条形码编码的样品索引寡核苷酸,以产生所述多个菊花链式延长的扩增子。获得所述多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得所述多个菊花链式延长的扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。
在一些实施例中,所述多个菊花链式扩增引物中的菊花链式扩增引物包含经条形码编码的样品索引寡核苷酸结合区和突出端区,其中所述经条形码编码的样品索引寡核苷酸结合区能够与所述样品索引寡核苷酸的菊花链式样品索引区结合。经条形码编码的样品索引寡核苷酸结合区长度可以是至少20个核苷酸,长度是至少30个核苷酸,长度是约40个核苷酸,长度是至少40个核苷酸,长度是约50个核苷酸或其组合。所述多个菊花链式扩增引物中的两个菊花链扩增引物可以包含具有相同序列的经条形码编码的样品索引寡核苷酸结合区。所述多个菊花链式扩增引物可以包含具有相同序列的经条形码编码的样品索引寡核苷酸结合区。所述突出端区的长度可以是至少50个核苷酸,长度是至少100个核苷酸,长度是至少150个核苷酸,长度是约150个核苷酸,长度是至少200个核苷酸,或其组合。所述突出端区可以包含菊花链式扩增引物条形码序列。所述多个菊花链式扩增引物中的两个菊花链式扩增引物可以包含具有相同菊花链式扩增引物条形码序列的突出端区。所述多个菊花链式扩增引物中的两个菊花链式扩增引物可以包含具有两个菊花链式扩增引物条形码序列的突出端区。所述多个菊花链式扩增引物的突出端区可以包含不同的菊花链式扩增引物条形码序列。所述多个菊花链式延长的扩增子中的菊花链式延长的扩增子的长度可以是至少250个核苷酸,长度是至少300个核苷酸,长度是至少350个核苷酸,长度是至少400个核苷酸,长度是约400个核苷酸,长度是至少450个核苷酸,长度是至少500个核苷酸或其组合。
在一些实施例中,鉴定至少一个细胞的样品来源可以包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸可以包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。所述方法可以包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
在一些实施例中,多个样品索引组合物中的每个包含细胞组分结合试剂。与两个或更多个细胞组分结合试剂关联的样品索引寡核苷酸的样品索引序列可以是相同的。与两个或更多个细胞组分结合试剂关联的样品索引寡核苷酸的样品索引序列可以包含不同的序列。多个样品索引组合物中的每个可以包含两个或更多个细胞组分结合试剂。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;并且基于所述多个样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列和多个菊花链式扩增引物,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。鉴定所述至少一个细胞的样品来源可以包括:使用多个条形码对所述多个样品索引组合物中的样品索引寡核苷酸进行条形码编码,以产生多个经条形码编码的样品索引寡核苷酸;获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于测序数据中的所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述细胞的样品来源。所述方法可以例如包括去除所述多个样品索引组合物中未结合的样品索引组合物。
在一些实施例中,样品索引序列的长度是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,或长度是至少128个核苷酸,或其组合。样品索引寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度小于约200-300个核苷酸,长度是约200-500个核苷酸,长度是500个核苷酸,或其组合。多个样品索引组合物中的至少10个样品索引组合物的样品索引序列可以包含不同的序列。多个样品索引组合物中的至少100或1000个样品索引组合物的样品索引序列可以包含不同的序列。
在一些实施例中,细胞组分结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与细胞组分结合试剂缀合。寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,多个样品中的至少一个样品包含单细胞。一个或多个细胞组分靶中的至少一个可以在细胞表面上表达。多个样品中的样品可以包含多个细胞、组织、肿瘤样品或其任何组合。多个样品可以包含哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。
在一些实施例中,去除所述未结合的样品索引组合物包括用洗涤缓冲液洗涤来自所述多个样品的每个的一个或多个细胞。所述方法可以包括裂解来自所述多个样品中的每个的一个或多个细胞。样品索引寡核苷酸可以被配置为与所述细胞组分结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与细胞组分结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与细胞组分结合试剂分离。
在一些实施例中,样品索引寡核苷酸与多个样品的细胞的基因组序列不同源。样品索引寡核苷酸可以包含分子标记序列、聚(A)区或其组合。样品索引寡核苷酸可以包含与所述多个条形码中的至少一个条形码的捕获序列互补的序列。条形码的靶结合区可包含捕获序列。靶结合区可包含聚(dT)区。与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(A)尾。样品索引寡核苷酸可以包含分子标记。
在一些实施例中,细胞组分靶是或包含碳水化合物、脂质、蛋白质、细胞外蛋白质、细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白质或其任何组合。细胞组分靶可以选自包含10-100个不同细胞组分靶的组。细胞组分结合试剂可以与两个或更多个具有相同序列的样品索引寡核苷酸关联。细胞组分结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与所述样品索引寡核苷酸缀合的第二细胞组分结合试剂。细胞组分结合试剂和第二细胞组分结合试剂可以相同。
在一些实施例中,鉴定所述至少一个细胞的样品来源包括:使用多个条形码对所述多个样品索引组合物中的样品索引寡核苷酸进行条形码编码,以产生多个经条形码编码的样品索引寡核苷酸;获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述细胞的样品来源。
在一些实施例中,其中多个条形码中的条形码包含靶结合区和分子标记序列。多个条形码中的至少两个条形码的分子标记序列可以包含不同的分子标记序列。条形码可以包含细胞标记、通用引物的结合位点或其任何组合。靶结合区可包含聚(dT)区。
在一些实施例中,多个条形码固定在颗粒上。多个条形码中的至少一个条形码可以固定在颗粒上、部分固定在颗粒上、封闭在颗粒中、部分封闭在颗粒中,或其任何组合。颗粒可以是可降解的。颗粒可以是珠。珠可以选自由以下组成的组:链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠及其任何组合。颗粒可以包含选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮及其任何组合。颗粒可以包含至少10000个条形码。在一些实施例中,颗粒的条形码可以包含选自至少1000或10000个不同分子标记序列的分子标记序列。条形码的分子标记序列可以包含随机序列。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码可以包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,扩增所述多个经条形码编码的样品索引寡核苷酸包括使用聚合酶链式反应(PCR)扩增所述多个经条形码编码的样品索引寡核苷酸。扩增所述多个经条形码编码的样品索引寡核苷酸可以包括扩增所述分子标记序列的至少一部分和所述样品索引寡核苷酸的至少一部分。扩增所述多个经条形码编码的样品索引寡核苷酸可以包括使用所述多个菊花链式扩增引物扩增所述多个经条形码编码的样品索引寡核苷酸,以产生多个菊花链式延长的扩增子。获得所述多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得所述多个菊花链式延长的扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。
在一些实施例中,所述多个菊花链式扩增引物中的菊花链式扩增引物包含经条形码编码的样品索引寡核苷酸结合区和突出端区,其中所述经条形码编码的样品索引寡核苷酸结合区能够与所述样品索引寡核苷酸的菊花链式样品索引区结合。经条形码编码的样品索引寡核苷酸结合区长度可以是至少20个核苷酸,长度是至少30个核苷酸,长度是约40个核苷酸,长度是至少40个核苷酸,长度是约50个核苷酸或其组合。所述多个菊花链式扩增引物中的两个菊花链扩增引物可以包含具有相同序列的经条形码编码的样品索引寡核苷酸结合区。所述多个菊花链式扩增引物可以包含具有相同序列的经条形码编码的样品索引寡核苷酸结合区。所述突出端区的长度可以是至少50个核苷酸,长度是至少100个核苷酸,长度是至少150个核苷酸,长度是约150个核苷酸,长度是至少200个核苷酸,或其组合。所述突出端区可以包含菊花链式扩增引物条形码序列。所述多个菊花链式扩增引物中的两个菊花链式扩增引物可以包含具有相同菊花链式扩增引物条形码序列的突出端区。所述多个菊花链式扩增引物中的两个菊花链式扩增引物可以包含具有两个菊花链式扩增引物条形码序列的突出端区。所述多个菊花链式扩增引物的突出端区可以包含不同的菊花链式扩增引物条形码序列。所述多个菊花链式延长的扩增子中的菊花链式延长的扩增子的长度可以是至少250个核苷酸,长度是至少300个核苷酸,长度是至少350个核苷酸,长度是至少400个核苷酸,长度是至少450个核苷酸,长度是至少500个核苷酸或其组合。多个菊花链式延长的扩增子中的菊花链式延长的扩增子的长度可以是约200个核苷酸,长度是约250个核苷酸,长度是约300个核苷酸,长度是约350个核苷酸,长度是约400个核苷酸,长度是约450个核苷酸,长度是约500个核苷酸,长度是约600个核苷酸,或这些值中的任何两个之间的范围。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。鉴定至少一个细胞的样品来源可以包括鉴定多个样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定所述样品索引序列的存在或不存在可以包括:复制所述至少一个样品索引寡核苷酸以产生多个复制的样品索引寡核苷酸;获得所述多个复制的样品索引寡核苷酸的测序数据;并且基于所述多个样品索引寡核苷酸中的复制的样品索引寡核苷酸的样品索引序列来鉴定所述细胞的样品来源,所述样品索引序列相应于测序数据中的至少一个经条形码编码的样品索引寡核苷酸。
在一些实施例中,复制所述至少一个样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸包括:在复制至少一个经条形码编码的样品索引寡核苷酸之前,将复制衔接子连接到至少一个经条形码编码的样品索引寡核苷酸。复制至少一个经条形码编码的样品索引寡核苷酸可以包括使用连接到至少一个经条形码编码的样品索引寡核苷酸的复制衔接子来复制至少一个经条形码编码的样品索引寡核苷酸以产生多个复制的样品索引寡核苷酸。
在一些实施例中,复制所述至少一个样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸包括:在复制所述至少一个经条形码编码的样品索引寡核苷酸之前,使捕获探针与所述至少一个样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的捕获探针;并且扩展与所述样品索引寡核苷酸杂交的所述捕获探针以产生与所述捕获探针关联的样品索引寡核苷酸。复制所述至少一个样品索引寡核苷酸可以包括复制与所述捕获探针关联的样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。鉴定所述至少一个经条形码编码的样品索引寡核苷酸的样品来源可以包括基于所述至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定所述多个经条形码编码的靶的样品来源。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。所述方法可以包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
在一些实施例中,多个样品索引组合物中的每个包含细胞组分结合试剂。与两个或更多个细胞组分结合试剂关联的样品索引寡核苷酸的样品索引序列可以是相同的。与两个或更多个细胞组分结合试剂关联的样品索引寡核苷酸的样品索引序列可以包含不同的序列。多个样品索引组合物中的每个可以包含两个或更多个细胞组分结合试剂。
本文披露包括试剂盒,所述试剂盒包含:多个样品索引组合物;以及多个菊花链式扩增引物。多个样品索引组合物中的每个可以包含两个或更多个细胞组分结合试剂。所述两个或更多个细胞组分结合试剂中的每个可以与样品索引寡核苷酸关联。所述两个或更多个细胞组分结合试剂中的至少一个能够与至少一个细胞组分靶特异性结合。所述样品索引寡核苷酸可以包含用于鉴定样品的一个或多个细胞的样品来源的样品索引序列。所述样品索引寡核苷酸可以包含菊花链式扩增引物结合序列。所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列可以包含不同的序列。
所述多个菊花链式扩增引物中的菊花链扩增引物可以包含经条形码编码的样品索引寡核苷酸结合区和突出端区,其中所述经条形码编码的样品索引寡核苷酸结合区能够与所述样品索引寡核苷酸的菊花链式样品索引区结合。经条形码编码的样品索引寡核苷酸结合区长度可以是至少20个核苷酸,长度是至少30个核苷酸,长度是约40个核苷酸,长度是至少40个核苷酸,长度是约50个核苷酸或其组合。所述多个菊花链式扩增引物中的两个菊花链扩增引物可以包含具有相同序列的经条形码编码的样品索引寡核苷酸结合区。所述多个菊花链式扩增引物中的两个菊花链扩增引物可以包含具有不同序列的经条形码编码的样品索引寡核苷酸结合区。所述经条形码编码的样品索引寡核苷酸结合区可以包含所述菊花链式扩增引物结合序列、其互补序列、其反向互补序列,或其组合。所述多个样品索引组合物中的至少两个样品索引组合物的菊花链式扩增引物结合序列颗可以包含相同的序列。所述多个样品索引组合物中的至少两个样品索引组合物的菊花链式扩增引物结合序列包含不同的序列。所述突出端区的长度可以是至少50个核苷酸,长度是至少100个核苷酸,长度是至少150个核苷酸,长度是约150个核苷酸,或其组合。所述突出端区的长度可以是至少200个核苷酸。所述突出端区可以包含菊花链式扩增引物条形码序列。所述多个菊花链式扩增引物中的两个菊花链式扩增引物可以包含具有相同菊花链式扩增引物条形码序列的突出端区。所述多个菊花链式扩增引物中的两个菊花链式扩增引物可以包含具有两个菊花链式扩增引物条形码序列的突出端区。所述多个菊花链式扩增引物的突出端区可以包含不同的菊花链式扩增引物条形码序列。
在一些实施例中,样品索引序列的长度是至少6个核苷酸,长度是25-45个核苷酸,长度是约128个核苷酸,或长度是至少128个核苷酸,或其组合。样品索引寡核苷酸的长度可以是约50个核苷酸,长度是约100个核苷酸,长度是约200个核苷酸,长度是至少200个核苷酸,长度小于约200-300个核苷酸,长度是约200-500个核苷酸,长度是500个核苷酸,或其组合。多个样品索引组合物中的至少10、100或1000个样品索引组合物的样品索引序列包含不同的序列。
在一些实施例中,细胞组分结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。样品索引寡核苷酸可以通过接头与细胞组分结合试剂缀合。所述至少一个样品索引寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂的分子。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,样品索引寡核苷酸不与物种的基因组序列同源。样品索引寡核苷酸可以包含分子标记序列、聚(A)区或其组合。在一些实施例中,多个样品中的至少一个样品可以包含单细胞、多个细胞、组织、肿瘤样品或其任何组合。样品可以包含哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。
在一些实施例中,细胞组分靶是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、或其任何组合。细胞组分靶可以选自包含10-100个不同细胞组分靶的组。细胞组分结合试剂可以与两个或更多个具有相同序列的样品索引寡核苷酸关联。细胞组分结合试剂可以与两个或更多个具有不同样品索引序列的样品索引寡核苷酸关联。多个样品索引组合物中的样品索引组合物可以包含不与所述样品索引寡核苷酸缀合的第二细胞组分结合试剂。细胞组分结合试剂和第二细胞组分结合试剂可以相同。
附图说明
图1示出了非限制性示例性随机条形码。
图2示出了随机条形码编码和数字计数的非限制性示例性工作流程。
图3是示出了用于由多个靶生成经随机经条形码编码的靶的索引文库的非限制性示例性过程的示意图。
图4显示了与寡核苷酸缀合的示例性的蛋白质结合试剂(此处所示的抗体)的示意图,所述寡核苷酸包含所述蛋白质结合试剂的独特标识的。
图5显示了与寡核苷酸缀合的示例性结合试剂(此处所示的抗体)的示意图,所述寡核苷酸包含用于样品索引以确定来自相同或不同样品的细胞的独特标识。
图6示出了使用寡核苷酸缀合的抗体以高通量方式同时确定蛋白质表达和基因表达的示例性工作流程的示意图。
图7示出了使用寡核苷酸缀合的抗体进行样品索引的示例性工作流程的示意图。
图8A1和图8A2显示了菊花链式的经条形码编码的寡核苷酸的示例性工作流程的示意图。图8B1和图8B2显示了菊花链式的经条形码编码的寡核苷酸的另一个示例性工作流程的示意图。
图9A-图9E显示了用寡核苷酸官能化的颗粒的非限制性示例性示意图。
图10A是使用寡核苷酸官能化的颗粒用于单细胞测序对照的示例性工作流程的示意图。图10B是使用寡核苷酸官能化的颗粒用于单细胞测序对照的另一个示例性工作流程的示意图。
图11显示了使用对照寡核苷酸缀合的抗体确定单细胞测序效率的示例性工作流程的示意图。
图12显示了使用对照寡核苷酸缀合的抗体确定单细胞测序效率的示例性工作流程的另一示意图。
图13A-图13C是显示对照寡核苷酸可用于细胞计数的图。
图14A-图14F示出了使用一对相互作用确定组合物确定细胞组分(例如蛋白质)之间相互作用的示例性工作流程的示意图。
图15A-图15D显示了寡核苷酸的非限制性示例性设计,所述寡核苷酸用于同时确定蛋白质表达和基因表达并用于样品索引。
图16显示了非限制性示例性寡核苷酸序列的示意图,所述寡核苷酸序列用于同时确定蛋白质表达和基因表达并用于样品索引。
图17A-图17F是非限制性示例性tSNE投影图,所述tSNE投影图显示了使用寡核苷酸缀合的抗体以高通量方式同时测量CD4蛋白表达和基因表达的结果。
图18A-图18F是非限制性示例性条形图,所述条形图显示了CD4 T细胞、CD8 T细胞和髓样细胞中CD4 mRNA和蛋白质的表达。
图19是非限制性示例性条形图,显示了在相似测序深度情况下,CD4蛋白质水平的检测灵敏度随着抗体:寡核苷酸的比率增加而增加,其中1:3比率表现优于1:1和1:2比率。
图20A-图20D是显示使用流式细胞仪分选的细胞的细胞表面上CD4蛋白表达的图。
图21A-图21F是非限制性示例性条形图,所述条形图显示了两个样品中CD4 T细胞、CD8 T细胞和髓样细胞中CD4 mRNA和蛋白质的表达。
图22是显示使用不同样品制备方案确定的CD4蛋白质水平的检测灵敏度的非限制性示例性条形图,其中抗体:寡核苷酸比率为1:3。
图23示出了用于执行样品索引并确定样品索引寡核苷酸的长度的影响和样品索引寡核苷酸在样品索引时的可切割性的非限制性示例性实验设计。
图24A-图24C是非限制性示例性tSNE图,其显示了与不同的样品索引寡核苷酸(可切割的95mer,不可切割的95mer和可切割的200mer)缀合的三种类型的抗CD147抗体可以用于确定CD147的蛋白表达水平。
图25是非限制性示例性tSNE图,其中叠加GAPDH表达/细胞。
图26A-图26C是非限制性示例性直方图,其示出了使用三种类型的样品索引寡核苷酸检测到的样品索引寡核苷酸的分子数量。
图27A-图27C是非限制性示例性图和条形图,显示了CD147表达在分裂细胞中更高。
图28A-图28C是非限制性的示例性tSNE投影图,其示出了可以将样品索引用于鉴定不同样品的细胞。
图29A-图29C是基于确定的样品索引寡核苷酸的分子数量的每个细胞的样品索引序列的非限制性示例性直方图。
图30A-图30D是非限制性示例性图,其比较了基于CD3D(对于Jurkat细胞)和JCHAIN(对于Ramos细胞)的mRNA表达以及Jurkat和Ramos细胞的样品索引确定的细胞类型的注释。
图31A-图31C是Jurkat和Ramos细胞的mRNA表达谱的非限制性tSNE投影图,其中叠加CD3D和JCHAIN(图31A)、JCHAIN(图31B)和CD3D(图31C)的mRNA表达。
图32是Jurkat和Ramos细胞的表达谱的非限制性示例性tSNE投影图,其中叠加使用样品索引以250的DBEC截断值确定的细胞类型。
图33A-图33C是针对Ramos和Jurkat细胞(图33)、Ramos细胞(图33B)和Jurkat细胞(图33C)(这些细胞未标记或标记“短3”样品索引寡核苷酸,“短2”和“短3”样品索引寡核苷酸以及“短2”样品索引寡核苷酸)的每个细胞的样品索引寡核苷酸的分子数量的非限制性示例性条形图。
图34A-图34C是非限制性示例性图,其显示少于1%的单细胞被“短2”和“短3”样品索引寡核苷酸标记。
图35A-图35C是非限制性示例性tSNE图,其显示了对如图23中概述的使用不同流通池制备的样品中的Jurkat和Ramos细胞的表达谱的批次效应。
图36A1-图36A9、图36B和图36C是非限制性示例性图,其显示了使用稀释滴定法确定抗体储备液的最佳稀释度。
图37显示了用于确定寡核苷酸-缀合的抗体的染色浓度使得抗体寡核苷酸占测序数据中总读数的所需百分比的非限制性示例性实验设计。
图38A-图38D是非限制性示例性生物分析仪迹线,这些生物分析仪迹线显示与抗体寡核苷酸的预期大小一致的峰(由箭头指示)。
图39A1-图39A3和图39B1-图39B3是非限制性示例性直方图,其示出了针对用不同抗体稀释液染色的样品和与抗体寡核苷酸缀合的抗体分子(“热抗体”)的不同百分比染色的样品检测到的抗体寡核苷酸的分子数量。
图40A-图40C是非限制性示例性图,这些示例性图显示寡核苷酸-缀合的抗CD147抗体分子可用于标记各种细胞类型。使用血液图(图40A)中的488个基因的表达谱确定细胞类型。用使用1:100稀释的储备液制备的10%热抗体:90%冷抗体的混合物对细胞染色,在直方图中产生显示检测到的抗体寡核苷酸分子数的清晰信号(图40B)。抗体寡核苷酸对各种细胞类型的标记示于图40C中。
图41A-图41C是非限制性示例性图,这些示例性图显示寡核苷酸-缀合的抗CD147抗体可用于标记各种细胞类型。使用血液图(图41A)中的488个基因的表达谱确定细胞类型。用使用1:100稀释的储备液制备的1%热抗体:99%冷抗体的混合物对细胞染色,在直方图中不产生显示检测到的抗体寡核苷酸分子数的清晰信号(图41B)。抗体寡核苷酸对各种细胞类型的标记示于图41C中。
图42A-图42C是非限制性示例性图,这些示例性图显示寡核苷酸-缀合的抗CD147抗体分子可用于标记各种细胞类型。使用血液图(图42A)中的488个基因的表达谱确定细胞类型。用1:800稀释的储备液对细胞染色,在直方图中产生显示检测到的抗体寡核苷酸分子数的清晰信号(图42B)。抗体寡核苷酸对各种细胞类型的标记示于图42C中。
图43A-图43B是显示在染色缓冲液中的对照颗粒寡核苷酸和使用图10所示的工作流程检测的与对照颗粒关联的对照颗粒寡核苷酸的组成的图。
图44A-图44B是血细胞计数器中的细胞(图44A,白色圆圈)和对照颗粒(图44B,黑色圆圈)的明场图像。
图45A-图45B是与跟荧光团关联的寡核苷酸缀合抗体结合的对照颗粒的相差(图45A,10X)和荧光(图45B,10X)图像。
图46是示出装载到盒的微孔中的细胞和对照颗粒的图像。
图47A-图47C是显示使用抗体混合物用于样品索引可以增加标记灵敏度的图。
图48是非限制性示例性图,其显示可以使用样品索引从测序数据中鉴定并去除多重态。
图49A是使用样品索引寡核苷酸鉴定为单态或多重态的来自两只小鼠的六个组织的12个样品的CD45+单细胞的表达谱的非限制性示例性tSNE投影图。
图49B是来自两只小鼠的六个组织的12个样品的CD45+单细胞的表达谱(其中使用样品索引寡核苷酸鉴定并在图49A中显示的多重态被去除)的非限制性示例性tSNE投影图。
图50A是来自两只小鼠的CD45+单细胞的表达谱(其中使用样品索引寡核苷酸鉴定的多重态被去除)的非限制性示例性tSNE投影图。
图50B和图50C是非限制性示例性饼图,其显示在去除多重态表达谱后,生物学重复的两只小鼠表现出相似的表达谱。
图51A-图51F是非限制性示例性饼图,其显示在测序数据中使用样品索引寡核苷酸鉴定和去除具有多重态表达谱的情况下六个不同组织的免疫细胞谱。
图52A-图52C是非限制性示例性图,其显示在测序数据中使用样品索引寡核苷酸鉴定和去除多重态表达谱之后,来自六个不同组织的巨噬细胞、T细胞和B细胞的表达谱。
图53A-图53D是比较结肠和脾中的巨噬细胞的非限制性示例性图。
图54是非限制性示例性图,其显示用样品索引组合物标记细胞不改变PBMC中的mRNA表达谱。
具体实施方式
在以下详细描述中参考附图,附图形成在此的一部分。在图中,类似的符号典型地鉴别类似的部件,除非上下文另外规定。在详细描述、图示以及权利要求书中所描述的说明性实施例并不意图进行限制。在不脱离在此呈现的主题精神或范围的情况下,可以采用其他实施例,并且可做出其他改动。易于理解的是,如在此总体所述的和在附图中示出的本披露的方面可以各种的不同构造方式进行布置、取代、组合、分隔和设计,所有这些明显是涵盖于此的并且组成在此的披露内容的一部分。
所有专利、公开的专利申请、其他出版物和GenBank上的序列以及此处引用的其他数据库就相关技术而言均通过引用的方式完整地结合。
量化少量核酸(例如信使核糖核酸(mRNA)分子)在临床上对于确定例如在不同发育阶段或在不同环境条件下在细胞中表达的基因非常重要。然而,确定核酸分子(例如,mRNA分子)的绝对数量也是非常具有挑战性的,尤其是当分子数量非常小时。确定样品中分子绝对数量的一种方法是数字聚合酶链式反应(PCR)。理想情况下,PCR在每个循环中产生相同的分子拷贝。但是,PCR可能具有缺点,即每个分子均以随机概率复制,并且该概率随PCR周期和基因序列而变化,从而导致扩增偏差和基因表达测量不准确。具有独特分子标记(也称为分子索引(MI))的随机条形码可用于计算分子数量并校正扩增偏差。诸如PreciseTM测定法(细胞研究公司(Cellular Research,Inc.)(加利福尼亚州帕洛阿尔托))的随机条形码编码可通过在逆转录(RT)期间使用分子标记(ML)对mRNA进行标记来校正PCR和文库制备步骤引起的偏差。
PreciseTM测定法可利用具有大量的(例如6561至65536个)随机条形码的非耗尽性池、聚(T)寡核苷酸上的独特分子标记,以在RT步骤期间与样品中的所有聚(A)-mRNA杂交。随机条形码可包括通用PCR引发位点。在RT期间,靶基因分子与随机条形码随机地反应。每个靶分子可以与随机条形码杂交,从而产生经随机经条形码编码的互补核糖核苷酸(cDNA)分子。在标记后,可将来自微孔板微孔的经随机经条形码编码的cDNA分子合并到单个管中用于PCR扩增和测序。可以分析原始测序数据以产生读数数量、具有独特分子标记的随机条形码数量以及mRNA分子数量。
确定单细胞的mRNA表达谱的方法可以以大规模平行的方式进行。例如,PreciseTM测定法可用于同时确定超过10000个细胞的mRNA表达谱。每个样品的用于进行分析的单细胞数量(例如单细胞的100s或1000s)可以低于当前单细胞技术的容量。合并来自不同样品的细胞可提高当前单细胞技术的容量的利用,从而降低试剂浪费和单细胞分析的成本。本披露提供了用于区分不同样品(其用于针对细胞分析(例如单细胞分析)的cDNA文库制备)的细胞的样品索引方法。合并来自不同样品的细胞可以最大程度地减少不同样品的细胞的cDNA文库制备中的差异,从而可以更准确地比较不同样品。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个抗原靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的蛋白质结合试剂,其中所述蛋白质结合试剂能够与所述一个或多个抗原靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;去除所述多个样品索引组合物中未结合的样品索引组合物;使用多个条形码(例如,随机条形码)对所述样品索引寡核苷酸进行条形码编码(例如,随机条形码编码)以产生多个经条形码编码的样品索引寡核苷酸(例如,经随机经条形码编码的样品索引寡核苷酸);获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。
在一些实施例中,本文披露的样品鉴定方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;去除所述多个样品索引组合物中未结合的样品索引组合物;使用多个条形码(例如,随机条形码)对所述样品索引寡核苷酸进行条形码编码(例如,随机条形码编码)以产生多个经条形码编码的样品索引寡核苷酸(例如,经随机经条形码编码的样品索引寡核苷酸);获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个抗原靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的蛋白质结合试剂,其中所述蛋白质结合试剂能够与所述一个或多个抗原靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;去除所述多个样品索引组合物中未结合的样品索引组合物;并且基于所述多个样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。
本文的披露是多个样品索引组合物。多个样品索引组合物中的每个可以包含与样品索引寡核苷酸关联的蛋白质结合试剂。蛋白质结合试剂可以能够与至少一个抗原靶特异性结合。所述样品索引寡核苷酸可以包含用于鉴定样品的一个或多个细胞的样品来源的样品索引序列。所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列可以包含不同的序列。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂(例如抗体),其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶(例如蛋白质)中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸;使用多个菊花链式扩增引物扩增所述多个经条形码编码的样品索引寡核苷酸,以产生多个菊花链式延长的扩增子;获得所述多个菊花链式延长的扩增子的测序数据,所述测序数据包含所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。所述方法可以包括去除所述多个样品索引组合物中未结合的样品索引组合物。
在一些实施例中,本文披露的样品索引方法、试剂盒和组合物可以增加样品通量(例如,对于具有低细胞数、难以分离的细胞和异质细胞的稀有样品),降低试剂成本,减少在单管反应中执行文库制备中的技术错误和批次效应和/或在数据分析期间鉴定样品间多重态细胞。在一些实施例中,可以使用不同的样品索引组合物来标记来自不同淋巴器官和非淋巴器官的组织的细胞,以例如增加样品通量并且减少或最小化批次效应。在一些实施例中,可以使用本披露的方法、试剂盒和组合物研究免疫防御和组织稳态和功能。
定义
除非另有定义,否则在此所使用的技术和科学术语具有与本披露所属领域的普通技术人员通常理解的相同的含义。参见例如Singleton等人,微生物学和分子生物学字典(Dictionary of Microbiology and Molecular Biology)第2版,约翰·威利父子公司(J.Wiley&Sons)(纽约州纽约市(New York,NY)1994);Sambrook等人,分子克隆实验室手册(Molecular Cloning,A Laboratory Manual),冷泉港出版社(Cold Springs HarborPress)(纽约冷泉港(Cold Springs Harbor,NY)1989)。出于本披露的目的,以下术语定义如下。
如在此所用,术语“衔接子”可以意指有利于关联的核酸的扩增或测序的序列。关联的核酸可以包括靶核酸。关联的核酸可以包含空间标记、靶记、样品标记、索引标记或条形码序列(例如,分子标记)中的一个或多个。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子。衔接子可以是双链或单链的。一个或多个衔接子可以位于核酸的5’或3’端上。当衔接子包含在5’和3’端上的已知序列时,已知序列可以是相同或不同的序列。位于多核苷酸的5’和/或3’端上的衔接子可以能够与固定在表面上的一个或多个寡核苷酸杂交。在一些实施例中,衔接子可以包含通用序列。通用序列可以是两个或更多个核酸分子共有的核苷酸序列区域。两个或更多个核酸分子还可以具有不同序列区域。因此,例如,5’衔接子可以包含相同和/或通用核酸序列并且3’衔接子可以包含相同和/或通用序列。可以存在于多个核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单一通用引物复制或扩增多个不同的序列。类似地,可以存在于核酸分子集合体的不同成员中的两个(例如一对)或更多个通用序列可以允许使用与通用序列互补的至少一个、两个(例如一对)或更多个通用引物复制或扩增多个不同的序列。因此,通用引物包含可与这种通用序列杂交的序列。具有靶核酸序列的分子可以被修饰成将通用衔接子(例如,非靶核酸序列)连接到不同的靶核酸序列的一端或两端。连接到靶核酸的一个或多个通用引物可以为通用引物的杂交提供位点。连接到靶核酸的一个或多个通用引物可以是彼此相同或不同的。
如本文所用,抗体可以是全长(例如,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如IgG抗体)或免疫球蛋白分子的免疫活性(即特异性结合)部分,如抗体片段。
在一些实施例中,抗体是功能性抗体片段。例如,抗体片段可以抗体的一部分,诸如F(ab’)2、Fab’、Fab、Fv、sFv等。抗体片段可以结合通过全长抗体鉴定的相同抗原。抗体片段可以包括由抗体的可变区组成的分离片段,诸如由重链和轻链的可变区组成的“Fv”片段以及其中轻链可变区和重链可变区通过肽接头(“scFv蛋白”)连接的重组单链多肽分子。示例性抗体可以包括但不限于用于癌细胞的抗体、用于病毒的抗体、结合到细胞表面受体(例如CD8、CD34和CD45)上的抗体以及治疗性抗体。
如在此所用,术语“关联的”或“与……关联的”可以意指两个或更多个物质在某一时间点可识别为共定位。关联可以意指两个或更多个物质在或曾经在类似容器内。关联可以是信息学关联。例如关于两个或更多个物质的数字信息可以被存储并且可以用于确定一个或多个物质在某一时间点共定位。关联还可以是物理关联。在一些实施例中,两个或更多个关联的物质彼此“系接”、“连接”或“固定”,或“系接”、“连接”或“固定”至共同的固体或半固体表面。关联可以是指用于将标记连接到固体或半固体支持物诸如珠上的共价或非共价方式。关联可以是靶与标记之间的共价键。关联可以包括两个分子(例如靶分子和标记)之间的杂交。
如在此所用,术语“互补的”可以是指两个核苷酸之间精确配对的能力。例如,如果核酸的指定位置处的核苷酸能够与另一个核酸的核苷酸氢键结合,则认为两个核酸在那一位置是彼此互补的。两个单链核酸分子之间的互补性可以是“部分的”,其中仅一些核苷酸结合,或者当单链分子之间存在总体互补性时该结合可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补,则可以称为第一核苷酸序列是第二序列的“补体”。如果第一核苷酸序列与反向(即核苷酸的次序是相反的)于第二序列的序列互补,则可以称为第一核苷酸序列是第二序列的“反向补体”。如在此所用,术语“补体”、“互补性”和“反向补体”可以互换使用。从本披露中理解的是,如果分子可以与另一分子杂交,则该分子可以是杂交分子的补体。
如在此所用,术语“数字计数”可以是指用于估计样品中靶分子的数量的方法。数字计数可以包括确定已与样品中的靶关联的独特标记数量的步骤。所述方法本质上可以是随机的,其将计数分子的问题从定位并识别相同分子的一个问题转变成关于检测一组预先定义的标记的一系列是/否数字问题。
如在此所用,术语“一个标记”或“多个标记”可以是指与样品内的靶相关联的核酸编码。标记可以是例如核酸标记。标记可以是整体或部分可扩增的标记。标记可以是整体或部分可测序的标记。标记可以是天然核酸中可鉴定为不同的一部分。标记可以是已知序列。标记可以包括核酸序列的接合点,例如天然序列和非天然序列的接合点。如在此所用,术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如,在不同的实施例中,标记可用于确定样品身份、样品来源、细胞身份和/或靶。
如在此所用,术语“非消耗贮存池(non-depleting reservoirs)”可以是指由许多不同的标记构成的条形码(例如,随机条形码)池。非消耗贮存池可以包含大量的不同条形码,使得当非消耗贮存池与靶库相关联时,每个靶很可能与独特的条形码相关联。每个标记的靶分子的独特性可以通过随机选择的统计学确定,并且取决于与标记的多样性相比集合体中相同靶分子的拷贝数。所得到的标记的靶分子组的大小可以通过条形码编码过程的随机性质和检测到的条形码的数量分析确定,然后允许计算原始集合体或样品中存在的靶分子的数量。当存在的靶分子的拷贝数与独特的条形码的数量的比率较低时,标记的靶分子是高度独特的(即用指定的标记来标记一个以上的靶分子的可能性非常低)。
如本文所用,术语“核酸”是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对细胞可以是外源性或内源性的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可以包括一个或多个类似物(例如改变的骨架、糖或核碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、xeno核酸、吗啉化合物、锁核酸、二醇核酸、苏糖核酸、双脱氧核苷酸、蛹虫草菌素、7-脱氮-GTP、荧光团(例如,连接至糖的罗丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷以及怀俄苷。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。
核酸可以包含一个或多个修饰(例如,碱基修饰、骨架修饰)以提供具有新的或增强的特征(例如,改善的稳定性)的核酸。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两种最常见的种类是嘌呤和嘧啶。核苷酸可以是进一步包含共价连接至核苷的糖部分的磷酸酯基团的核苷。对于包含戊呋喃糖的那些核苷,磷酸酯基团可以连接至糖的2’、3’或5’羟基部分。在形成核酸时,磷酸酯基团可以共价连接彼此相邻的核苷以形成线性聚合化合物。进而,该线性聚合化合物的对应末端可以进一步连接以形成环状化合物;然而,线性化合物通常是适合的。此外,线性化合物可以具有内部的核苷酸碱基互补性并且因此可以便于产生完全或部分双链化合物的方式折叠。在核酸内,磷酸酯基团可以通常涉及形成核酸的核苷间骨架。键联或骨架可以是3’至5’磷酸二酯键。
核酸可以包含修饰的骨架和/或修饰的核苷间键联。修饰的骨架可以包括在骨架中保留磷原子的那些和在骨架中不具有磷原子的那些。其中含有磷原子的适合的修饰的核酸骨架可以包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基以及其他烷基膦酸酯(诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯)、亚膦酸酯、氨基磷酸酯(包括3’-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、二氨基磷酸酯)、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基膦酸三酯、硒代磷酸酯以及具有正常3’-5’键联、2’-5’键联类似物的硼烷磷酸酯,以及具有其中一个或多个核苷酸间键联是3’至3’、5’至5’或2’至2’键联的反向极性的那些。
核酸可以包含这样的多核苷酸骨架,这些多核苷酸骨架通过短链烷基或环烷基核苷间键联、混合杂原子以及烷基或环烷基核苷间键联、或一个或多个短链杂原子或杂环核苷间键联形成。这些骨架可以包括具有以下各项的那些:吗啉代键联(部分地从核苷的糖部分中形成);硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰乙酰基和硫代甲酰乙酰基骨架;亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架;核乙酰基(riboacetyl)骨架;含烯烃的骨架;氨基磺酸酯骨架;亚甲基亚氨基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;以及具有混合的N、O、S和CH2组分的其他骨架。
核酸可以包括核酸模拟物。术语“模拟物”可以旨在包括这样的多核苷酸,其中仅呋喃糖环或呋喃糖环和核苷酸间键联两者被非呋喃糖基团置换,仅呋喃糖环的置换也可以称之为糖替代物。杂环碱基部分或修饰的杂环碱基部分可以被保持以用于与适当的靶核酸的杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中,多核苷酸的糖骨架可以被含酰胺骨架,具体地氨基乙基甘氨酸骨架置换。核苷酸可以被保留并且直接或间接地结合至骨架的酰胺部分的氮杂氮原子。PNA化合物中的骨架可以包含给予PNA含酰胺骨架的两个或更多个连接的氨基乙基甘氨酸单元。杂环碱基部分可以直接或间接地结合至该骨架的酰胺部分的氮杂氮原子。
核酸可以包含吗啉代骨架结构。例如,核酸可以包含6元吗啉代环以取代核糖环。在这些实施例中的一些中,二氨基磷酸酯或其他非磷酸二酯核苷间键联可以置换磷酸二酯键。
核酸可以包含连接的吗啉代单元(例如吗啉代核酸),这些吗啉代单元具有连接到吗啉代环的杂环碱基。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物可以与细胞蛋白质具有不太希望的相互作用。基于吗啉代的多核苷酸可以是核酸的非离子模拟物。吗啉代种类内的多种化合物可以使用不同的连接基团连接。另一种类的多核苷酸模拟物可以称之为环己烯基核酸(CeNA)。核酸分子中正常地存在的呋喃糖环可以被环己烯基环置换。可以制备CeNA DMT保护的亚磷酰胺单体并且将其用于使用亚磷酰胺化学的寡聚化合物合成。将CeNA单体掺入到核酸链可以增加DNA/RNA杂合体的稳定性。CeNA寡腺苷酸可以与核酸补体形成复合体,这些复合体具有与天然复合体类似的稳定性。另一修饰可以包括锁核酸(LNA),其中2’-羟基基团连接至糖环的4’碳原子,从而形成2’-C、4’-C-氧基亚甲基键,从而形成二环糖部分。键可以是桥接2’氧原子和4’碳原子的亚甲基(-CH2)基团,其中n是1或2。LNA和LNA类似物可以显示出与互补核酸相当高的双链体热稳定性(Tm=+3至+10℃)、3’核酸外切降解稳定性和良好的溶解特性。
核酸还可以包含核碱基(经常简称为“碱基”)修饰或取代。如在此所用,“非修饰”或“天然”核碱基可以包括嘌呤碱基(例如腺嘌呤(A)和鸟嘌呤(G)),以及嘧啶碱基(例如胸腺嘧啶(T)、胞嘧啶(C)以及尿嘧啶(U))。修饰的核碱基可以包括其他合成以及天然的核碱基,诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基以及其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基以及其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶以及2-硫胞嘧啶、5-卤代尿嘧啶以及胞嘧啶、5-丙炔基(-C=C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮基尿嘧啶、胞嘧啶以及胸腺嘧啶,5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶,8-卤基、8-氨基、8-氢硫基、8-硫烷基、8-羟基以及其他8-取代腺嘌呤和鸟嘌呤,5-卤基具体地5-溴、5-三氟甲基以及其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮鸟嘌呤和8-氮腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤、以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基可以包括三环嘧啶诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、酚噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G夹环(G-clamp)诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、酚噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮)、G夹环诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3’,2’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。
如在此所用,术语“样品”可以是指包含靶的组合物。适合用于由本披露方法、装置和系统进行的分析的样品包括细胞、组织、器官或生物体。
如在此所用,术语“取样装置”或“装置”可以是指可获得样品切片和/或将切片放置于基底上的装置。样品装置可以是指例如荧光激活细胞分选(FACS)器、细胞分选器、活检针、活检装置、组织切片装置、微流体装置、刀片网格和/或切片机。
如在此使用,术语“固体支持物”可以是指多个条形码(例如,随机条形码)可以连接到其上的离散固体或半固体表面。固体支持物可以涵盖核酸可固定(例如共价地或非共价地)在其上的由塑料、陶瓷、金属或聚合物材料(例如水凝胶)组成的任何类型的固体、多孔或中空球体、球、轴承、圆柱或其他类似的构型。固体支持物可以包括离散颗粒,该离散颗粒可以是球形(例如微球)或具有非球形或不规则形状诸如立方体、长方体、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。珠的形状可以是非球形的。以阵列间隔开的多个固体支持物可以不包含基底。固体支持物可以与术语“珠”互换使用。
如在此所用,术语“随机条形码”可以是指包含本披露的标记的多核苷酸序列。随机条形码可以是可用于随机经条形码编码的多核苷酸序列。随机条形码可以用于定量样品内的靶。随机条形码可以用于控制在标记与靶关联后可能发生的错误。例如,随机条形码可以用于评价扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
如在此所用,术语“基因特异性随机条形码”可以是指包含标记和基因特异性的靶结合区的多核苷酸序列。随机条形码可以是可用于随机经条形码编码的多核苷酸序列。随机条形码可以用于定量样品内的靶。随机条形码可以用于控制在标记与靶关联后可能发生的错误。例如,随机条形码可以用于评价扩增或测序错误。与靶关联的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。
如在此所用,术语“随机条形码编码”可以是指核酸的随机标记(例如条形码编码)。随机条形码编码可以利用递归泊松策略来相关联和定量与靶关联的标记。如在此所用,术语“随机条形码编码”可以与“随机进行标记”互换使用。
如在此所用,术语“靶”可以是指可以与条形码(例如,随机条形码)关联的成分。适合用于由本披露方法、装置和系统进行的分析的示例性靶包括寡核苷酸、DNA、RNA、mRNA、微小RNA、tRNA等。靶可以是单链或双链的。在一些实施例中,靶可以是蛋白质、肽或多肽。在一些实施例中,靶是脂质。如本文所使用的,“靶”可以与“种类”互换使用。
如在此所用,术语“逆转录酶”可以是指具有逆转录酶活性(即催化由RNA模板对DNA的合成)的一组酶。一般来讲,此类酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶、细菌逆转录酶、II组内含子衍生的逆转录酶以及其突变体、变体或衍生物。非逆转录病毒逆转录酶包括非LTR逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶以及II组内含子逆转录酶。II组内含子逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)LI.LtrB内含子逆转录酶、嗜热细长聚球藻(Thermosynechococcus elongates)TeI4c内含子逆转录酶或嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)GsI-IIC内含子逆转录酶。其他种类的逆转录酶可以包括许多种类的非逆转录病毒逆转录酶(即转录子、II组内含子以及多样性生成的逆转录因子等等)。
术语“通用衔接引物”、“通用引物衔接子”或“通用衔接序列”可互换使用,是指可以用于杂交条形码(例如,随机条形码)以生成基因特异性条形码的核苷酸序列。通用衔接序列可以例如是在用于本披露方法中的所有条形码上通用的已知序列。例如,当使用在此披露的方法标记多个靶时,靶特异性序列中的每一个可以连接到相同通用衔接序列上。在一些实施例中,多于一个通用衔接序列可以用于在此披露的方法中。例如,当使用在此披露的方法标记多个靶时,靶特异性序列中的至少两个连接到不同通用衔接序列上。通用衔接引物和其补体可以被包含在两个寡核苷酸中,这两个寡核苷酸中的一个包含靶特异性序列而另一个包含条形码。例如,通用衔接序列可以是包含靶特异性序列以生成与靶核酸互补的核苷酸序列的寡核苷酸部分。包含条形码和通用衔接序列的互补序列的第二寡核苷酸可以与该核苷酸序列杂交并且生成靶特异性条形码(例如,靶特异性随机条形码)。在一些实施例中,通用衔接引物具有与用于本披露方法中的通用PCR引物不同的序列。
条形码
条形码编码(如,随机条形码编码)已描述于例如US 20150299784、WO2015031691、以及Fu等人,Proc Natl Acad Sci[美国国家图书馆院刊]U.S.A.2011年5月31日;108(22):9026-31中,这些出版物的内容全部结合于此。在一些实施例中,本文披露的条形码可以是随机条形码,所述随机条形码可以是指可以用于随机地标记(例如条形码编码、加标签)靶的多核苷酸序列。如果随机条形码的不同条形码序列的数量与有待标记的任何靶的出现的数量的比率可以是或约是1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1,或这些值中任何两个之间的数字或范围,则条形码可以称作随机条形码。靶可以是包含具有相同或几乎相同序列的mRNA分子的mRNA种类。如果随机条形码的不同条形码序列的数量与有待标记的任何靶的出现的数量的比率是至少或至多1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1,则条形码可以称作随机条形码。随机条形码的条形码序列可以称为分子标记。
条形码,例如随机条形码,可以包含一个或多个标记。示例性标记可以包括通用标记、细胞标记、条形码序列(例如,分子标记)、样品标记、板标记、空间标记和/或预空间标记。图1示出了具有空间标记的示例性条形码104。条形码104可以包含可以将条形码连接至固体支持物105的5’胺。条形码可以包含通用标记、维标记、空间标记、细胞标记和/或分子标记。条形码中不同标记(包括但不限于通用标记、维标记、空间标记、细胞标记和分子标记)的顺序可以变化。例如,如图1所示,通用标记可以是最5’端标记,并且分子标记可以是最3'端标记。空间标记、维标记和细胞标记可以呈任何顺序。在一些实施例中,通用标记、空间标记、维标记、细胞标记以及分子标记呈任何次序。条形码可以包含靶结合区。靶结合区可以与样品中的靶(例如,靶核酸、RNA、mRNA、DNA)相互作用。例如,靶结合区可以包含可以与mRNA的聚(A)尾相互作用的寡(dT)序列。在一些情况中,条形码的标记(例如,通用标记、维标记、空间标记、细胞标记以及条形码序列)可以通过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸分开。
标记例如细胞标记可以进一步包含限定长度例如各自七个核苷酸(等于在一些汉明纠错码中使用的位数)的独特的核酸子序列组,该核酸子序列组可以被设计成提供纠错能力。包括七个核苷酸序列的纠错子序列组可以被设计成使得组中的任何成对序列组合表现出限定的“遗传距离”(或错配碱基数),例如纠错子序列组可以被设计成表现出三个核苷酸的遗传距离。在这种情况下,检查针对标记的靶核酸分子(下文更全面描述的)的序列数据组中的纠错序列可以允许检测或校正扩增或测序错误。在一些实施例中,用于产生纠错码的核酸子序列的长度可以变化,例如,它们可以是或约是1、2、3、4、5、6、7、8、9、10、15、20、30、31、40、50个核苷酸长度或这些值中任何两个之间的数字或范围。在一些实施例中,其他长度的核酸子序列可以用于产生纠错码。
条形码可以包含靶结合区。靶结合区可以与样品中的靶相互作用。靶可以是或包括核糖核酸(RNA)、信使RNA(mRNA)、微小RNA、小干扰RNA(siRNA)、RNA降解产物、各自包含多聚(A)尾的RNA或其任何组合。在一些实施例中,多个靶可以包括脱氧核糖核酸(DNA)。
在一些实施例中,靶结合区可以包含可以与mRNA的聚(A)尾相互作用的寡(dT)序列。条形码的一个或多个标记(例如,通用标记、维标记、空间标记、细胞标记和条形码序列(例如,分子标记))可以通过间隔子与条形码的另一个或两个其余标记分开。间隔子可以是例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个,或更多个核苷酸。在一些实施例中,条形码的标记中没有标记被间隔物分开。
通用标记
条形码可以包含一个或多个通用标记。一些实施例中,一个或多个通用标记对于连接到指定固体支持物的条形码组中的所有条形码可以是相同的。在一些实施例中,一个或多个通用标记对于连接到多个珠的所有条形码可以是相同的。在一些实施例中,通用标记可以包含能够与测序引物杂交的核酸序列。测序引物可以用于对包含通用标记的条形码进行测序。测序引物(例如,通用的测序引物)可以包括与高通量测序平台相关联的测序引物。在一些实施例中,通用标记可以包含能够与PCR引物杂交的核酸序列。在一些实施例中,通用标记可以包含能够与测序引物和PCR引物杂交的核酸序列。通用标记的能够与测序引物或PCR引物杂交的核酸序列可以称之为引物结合位点。通用标记可以包含可以用于启动条形码的转录的序列。通用标记可以包含可以用于延伸条形码或条形码内的区域的序列。通用标记的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。例如,通用标记可以包含至少约10个核苷酸。通用标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。在一些实施例中,可切割接头或修饰的核苷酸可以是通用标记序列的一部分以能够使条形码从支持物上切割下来。
维标记
条形码可以包含一个或多个维标记。在一些实施例中,维标记可以包含提供关于出现标记(例如随机标记)的维度的信息的核酸序列。例如,维标记可以提供关于靶被经条形码编码的时间的信息。维标记可以与样品的条形码编码(例如随机条形码编码)时间关联。维标记可以在标记的时间处被激活。不同的维标记可以在不同的时间处被激活。维标记提供了关于靶、靶组和/或样品被经条形码编码的顺序的信息。例如,可以在细胞周期的G0期时条形码编码细胞群。可以在细胞周期的G1期时用条形码(例如,随机条形码)再次脉冲处理细胞。可以在细胞周期的S期时用条形码再次脉冲处理细胞,如此类推。每次脉冲(例如细胞周期的每个阶段)下的条形码可以包含不同的维标记。以此方式,维标记提供了关于在细胞周期的哪个阶段标记了哪个靶的信息。维标记可以询问许多不同的生物时期。示例性的生物时期可以包括但不限于细胞周期、转录(例如转录起始)以及转录物降解。在另一实例中,样品(例如一个细胞、细胞群)可以在用药物和/或疗法治疗之前和/或之后被标记。不同靶的拷贝数量的变化可以指示样品对药物和/或疗法的应答。
维标记可以是可激活的。可激活的维标记可以在特定时间点处被激活。可激活的标记可以例如是组成型激活的(例如不被关闭的)。可激活的维标记可以例如是可逆型激活的(例如,可激活的维标记可以被打开和关闭)。维标记可以例如可逆地激活至少1、2、3、4、5、6、7、8、9、10次或更多次。维标记可以可逆地激活例如至少1、2、3、4、5、6、7、8、9、10次或更多次。在一些实施例中,维标记可以用以下各项激活:荧光、日光、化学事件(例如切割、另一分子的连接、修饰的添加(例如聚乙二醇化、苏素化、乙酰化、甲基化、脱乙酰化、脱甲基化)、光化学事件(例如光笼蔽)以及非天然核苷酸的引入。
在一些实施例中,维标记对于连接到指定固体支持物(例如珠)的所有条形码(例如随机条形码)可以是相同的,但对于不同的固体支持物(例如珠)可以是不同的。在一些实施例中,相同固体支持物上的至少60%、70%、80%、85%、90%、95%、97%、99%或100%的条形码可以包含相同的维标记。在一些实施例中,相同固体支持物上的至少60%的条形码可以包含相同的维标记。在一些实施例中,相同固体支持物上的至少95%的条形码可以包含相同的维标记。
在多个固体支持物(例如珠)中可以呈现多至106种或更多个独特的维标记序列。维标记的长度可以是或可约以是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。维标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。维标记可以包含约5个至约200个之间的核苷酸。维标记可以包含约10个至约150个之间的核苷酸。维标记的长度可以包含约20个至约125个之间的核苷酸。
空间标记
条形码可以包含一个或多个空间标记。在一些实施例中,空间标记可以包含提供关于与条形码相关联的靶分子的空间取向的信息的核酸序列。空间标记可以与样品的坐标相关联。坐标可以是固定坐标。例如坐标可以相对于基底是固定的。空间标记可以是参考二维或三维网格。坐标可以相对于界标是固定的。界标在空间中可以是可鉴定的。界标可以是可被成像的结构。界标可以是生物结构,例如解剖学界标。界标可以是细胞界标,例如细胞器。界标可以是非天然界标诸如具有可鉴定的标识符诸如颜色编码、条形码编码、磁性特性、荧光剂、放射性或独特的大小或形状的结构。空间标记可以与物理分割(例如,孔、容器或微滴)相关联。在一些实施例中,多个空间标记一起使用以编码空间中的一个或多个位置。
空间标记对于连接到指定固体支持物(例如珠)上的所有条形码可以是相同的,但对于不同的固体支持物(例如珠)可以是不同的。在一些实施例中,在包含相同空间标记的相同固体支持物上的条形码的百分比可以是或约是60%、70%、80%、85%、90%、95%、97%、99%、100%,或这些值中任何两个之间的数字或范围。在一些实施例中,在包含相同空间标记的相同固体支持物上的条形码的百分比可以是至少或至多60%、70%、80%、85%、90%、95%、97%、99%、或100%。在一些实施例中,相同固体支持物上的至少60%的条形码可以包含相同的空间标记。在一些实施例中,相同固体支持物上的至少95%的条形码可以包含相同的空间标记。
在多个固体支持物(例如珠)中可以呈现多至106种或更多个独特的空间标记序列。空间标记的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。空间标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。空间标记可以包含约5个至约200个之间的核苷酸。空间标记可以包含约10个至约150个之间的核苷酸。空间标记的长度可以包含约20个至约125个之间的核苷酸。
细胞标记
条形码(例如,随机条形码)可以包括一个或多个细胞标记。在一些实施例中,细胞标记可以包含提供用于确定哪种靶核酸源自于哪个细胞的信息的核酸序列。在一些实施例中,细胞标记对于连接至指定固体支持物(例如珠)的所有条形码是相同的,但对于不同的固体支持物(例如珠)是不同的。在一些实施例中,在包含相同细胞标记的相同固体支持物上的条形码的百分比可以是或约是60%、70%、80%、85%、90%、95%、97%、99%、100%,或这些值中任何两个之间的数字或范围。在一些实施例中,在包含相同细胞标记的相同固体支持物上的条形码的百分比可以是或约是60%、70%、80%、85%、90%、95%、97%、99%、或100%。例如,相同固体支持物上的至少60%的条形码可以包含相同的细胞标记。作为另一个实例,相同固体支持物上的至少95%的条形码可以包含相同的细胞标记。
在多个固体支持物(例如珠)中可以呈现多至106种或更多个独特的细胞标记序列。细胞标记的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。细胞标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。例如,细胞标记可以包含约5个至约200个之间的核苷酸。作为另一个实例,细胞标记可以包含约10个至约150个之间的核苷酸。作为又一个实例,细胞标记的长度可以包含约20个至约125个之间的核苷酸。
条形码序列
条形码可以包含一个或多个条形码序列。在一些实施例中,条形码序列可以包含提供对与条形码杂交的靶核酸物质的具体类型的鉴定信息的核酸序列。条形码序列可以包含为与条形码(例如靶结合区)杂交的靶核酸物质的具体出现次数提供计数器的核酸序列(例如,提供粗略的近似)。
在一些实施例中,一组不同的条形码序列被连接到指定固体支持物(例如珠)上。在一些实施例中,可以存在或大约存在102、103、104、105、106、107、108、109个独特分子标记序列或这些值中的任意两个或两个之间的数字或范围。例如,多个条形码可以包含具有不同序列的约6561个条形码序列。作为另一个实例,多个条形码可以包含具有不同序列的约65536个条形码序列。在一些实施例中,可以存在至少或至多102、103、104、105、106、107、108或109个独特条形码序列。独特分子标记序列可以连接至给定的固体支持物(例如珠)。
在不同的实现方式中,条形码的长度可以不同。例如,条形码的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。作为另一个实例,条形码的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。
分子标记
条形码(例如,随机条形码)可以包括一个或多个分子标记。分子标记可以包括条形码序列。在一些实施例中,分子标记可以包含提供对与条形码杂交的靶核酸物质的具体类型的鉴定信息的核酸序列。分子标记可以包含为与条形码(例如靶结合区)杂交的靶核酸物质的具体出现次数提供计数器的核酸序列。
在一些实施例中,一组不同的分子标记被连接到指定固体支持物(例如珠)上。在一些实施例中,可以存在或大约存在102、103、104、105、106、107、108、109个独特分子标记序列或这些值中的任意两个或两个之间的数字或范围。例如,多个条形码可以包含具有不同序列的约6561个分子标记。作为另一个实例,多个条形码可以包含具有不同序列的约65536个分子标记。在一些实施例中,可以存在至少或至多102、103、104、105、106、107、108或109个独特分子标记序列。具有独特分子标记序列的条形码可以连接至给定的固体支持物(例如珠)。
对于使用多个随机条形码的随机条形码编码,不同分子标记序列的数量与任何靶的出现数量的比率可以是或约是1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1,或这些值中任何两个之间的数字或范围,则条形码可以称作随机条形码。靶可以是包含具有相同或几乎相同序列的mRNA分子的mRNA种类。在一些实施例中,不同分子标记序列的数量与任何靶的出现数量的比率是至少或至多1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1。
分子标记的长度可以是或可以约是1、2、3、4、5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。分子标记的长度可以是至少或至多1、2、3、4、5、10、15、20、25、30、35、40、45、50、100、200、或300个核苷酸。
靶结合区
条形码可包含一个或多个靶结合区,例如捕获探针。在一些实施例中,靶结合区可以与目的靶杂交。在一些实施例中,靶结合区可以包含与靶(例如靶核酸、靶分子,例如待分析的细胞核酸)例如特定基因序列特异性杂交的核酸序列。在一些实施例中,靶结合区可以包含可以连接(杂交)至特定靶核酸的特异性位置的核酸序列。在一些实施例中,靶结合区可以包含能够与限制性内切酶位点突出端(例如EcoRI粘性突出端)特异性杂交的核酸序列。条形码然后可以连接至包含与限制性内切位点突出端互补的序列的任何核酸分子。
在一些实施例中,靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以是指可以不依赖于靶核酸的特异性序列结合多个靶核酸的序列。例如,靶结合区可以包含随机多聚体序列,或与mRNA分子上的聚(A)尾杂交的寡(dT)序列。随机多聚体序列可以是例如随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或具有任何长度的较高的多聚体序列。在一些实施例中,靶结合区对于连接到指定珠上的所有条形码是相同的。在一些实施例中,对于连接到指定珠的多个条形码的靶结合区可以包含两个或更多个不同的靶结合序列。靶结合区的长度可以是或可以约是5、10、15、20、25、30、35、40、45、50个或者这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至多约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。
在一些实施例中,靶结合区可以包含寡(dT),所述寡(dT)可以与包含聚腺苷酸化端部的mRNA杂交。靶结合区可以是基因特异性的。例如,靶结合区可以被配置成杂交到靶的特异性区域上。靶结合区的长度可以是或约是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26 27、28、29、30个或者这些值中的任何两个值之间的数字或范围的核苷酸。靶结合区的长度可以是至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。靶结合区的长度可以是从约5-30个核苷酸。当条形码包含基因特异性靶结合区时,条形码可以在此被称为基因特异性条形码。
取向特性
随机条形码(例如,随机条形码)可以包含可以用于定向(例如比对)条形码的一个或多个取向特性。条形码可以包含用于等电聚焦的一个部分。不同的条形码可以包含不同的等电聚焦点。当这些条形码被引入到样品时,可以使样品经受等电聚焦以便使条形码取向为已知方式。以此方式,取向特性可以用于发展样品中条形码的已知谱图。示例性取向特性可以包括电泳迁移率(例如基于条形码的大小)、等电点、自旋、导电性和/或自组装。例如,具有自组装取向特性的条形码可以在激活后自组装为特定取向(例如核酸纳米结构)。
亲和特性
条形码(例如,随机条形码)可以包括一个或多个亲和特性。例如,空间标记可以包含亲和特性。亲和特性可以包括可以有利于条形码结合到另一实体(例如细胞受体)上的化学和/或生物部分。例如,亲和特性可包含抗体,例如对样品上的特定部分(例如受体)具有特异性的抗体。在一些实施例中,抗体可以将条形码引导至特定细胞类型或分子。在特定细胞类型或分子处和/或附近的靶可以是标记的(例如随机标记的)。在一些实施例中,亲和特性还可以提供除空间标记的核苷酸序列之外的空间信息,因为抗体可以将条形码引导至特定位置。该抗体可以是治疗性抗体,例如单克隆抗体或多克隆抗体。抗体可以是人源化的或嵌合的。该抗体可以是裸抗体或融合抗体。
抗体可以是指全长(即天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如IgG抗体)或免疫球蛋白分子的免疫活性(即特异性结合)部分,如抗体片段。
抗体片段可以是抗体的一部分,诸如F(ab’)2、Fab’、Fab、Fv、sFv等。在一些实施例中,抗体片段可以结合通过全长抗体鉴定的相同抗原。抗体片段可以包括由抗体的可变区组成的分离片段,诸如由重链和轻链的可变区组成的“Fv”片段以及其中轻链可变区和重链可变区通过肽接头(“scFv蛋白”)连接的重组单链多肽分子。示例性抗体可以包括但不限于用于癌细胞的抗体、用于病毒的抗体、结合到细胞表面受体(CD8、CD34、CD45)上的抗体以及治疗性抗体。
通用衔接子引物
条形码可以包含一个或多个通用衔接子引物。例如,基因特异性条形码,例如基因特异性随机条形码,可以包含通用衔接子引物。通用衔接子引物可以是指在所有条形码上通用的核苷酸序列。通用衔接子引物可用于构建基因特异性条形码。通用衔接子引物可以是或约是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、2627、28、29、30个或者在这些中的任何两个值之间的数值或范围的核苷酸。通用衔接子引物的长度可以是至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。通用衔接引物的长度可以是从5-30个核苷酸。
接头
当条形码包含一个以上一种类型的标记(例如,一个以上细胞标记或一个以上条形码序列,例如一个分子标记)时,标记可以散布有接头标记序列。接头标记序列的长度可以是至少约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。接头标记序列的长度可以是至多约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。在某些情况下,接头标记序列的长度是12个核苷酸。接头标记序列可用于促进条形码的合成。接头标记可以包括纠错码(例如汉明码)。
固体支持物
在一些实施例中,本文披露的条形码,例如随机条形码,可以与固体支持物关联。固体支持物可以是例如合成颗粒。在一些实施例中,一些或全部条形码序列,例如固体支持物上多个条形码(例如,第一多个条形码)中的随机条形码(例如,第一多个条形码序列)的分子标记相差至少一个核苷酸。同一固体支持物上条形码的细胞标记可以相同。不同固体支持物上条形码的细胞标记可以相差至少一个核苷酸。例如,第一固体支持物上的第一多个条形码的第一细胞标签可以具有相同的序列,第二固体支持物上的第二多个条形码的第二细胞标签可以具有相同的序列。第一固体支持物上的第一多个条形码的第一细胞标记和第二固体支持物上的第二多个条形码的第二细胞标记可以相差至少一个核苷酸。细胞标记可以是例如约5-20个核苷酸长。条形码序列可以是例如约5-20个核苷酸长。合成颗粒可以是例如珠。
珠可以是例如硅胶珠、可控孔度玻璃珠、磁性珠、Dynabead、交联葡聚糖/交联琼脂糖珠、纤维素珠、聚苯乙烯珠、或其任何组合。珠可以包含以下材料:例如聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮或其任何组合。
在一些实施例中,珠可以是用条形码或随机条形码官能化的聚合物珠,例如可变形珠或凝胶珠(例如来自10X基因公司(10X Genomics)(旧金山,加利福尼亚州)的凝胶珠)。在一些实施方式中,凝胶珠可以包含基于聚合物的凝胶。凝胶珠可以例如通过将一个或多个聚合物前体包封成液滴来产生。当聚合物前体暴露于促进剂(例如四甲基乙二胺(TEMED))后,可产生凝胶珠。
在一些实施例中,颗粒可以是可降解的。例如,聚合物珠可以例如在期望条件下溶解、熔化或降解。期望条件可以包括环境条件。期望条件可以导致聚合物珠以受控方式溶解、熔融或降解。凝胶珠可由于化学刺激、物理刺激、生物刺激、热刺激、磁刺激、电刺激、光刺激或其任何组合而溶解、熔化或降解。
可以将分析物和/或试剂(例如寡核苷酸条形码)例如偶联/固定在凝胶珠的内表面上(例如,通过寡核苷酸条形码和/或用于产生寡核苷酸条形码的材料的扩散进入内部空间)和/或本文所述的凝胶珠或任何其他微胶囊的外表面。偶联/固定化可以通过任何形式的化学键合(例如,共价键,离子键)或物理现象(例如,范德华力,偶极-偶极相互作用等)来进行。在一些实施例中,试剂与本文所述的凝胶珠或任何其他微胶囊的偶联/固定可以是可逆的,例如经由不稳定的部分(例如,经由包括此处所述化学交联剂的化学交联剂)。在施加刺激后,不稳定部分可以被切割并释放固定化的试剂。在一些实施例中,不稳定部分是二硫键。例如,在通过二硫键将寡核苷酸条形码固定在凝胶珠上的情况下,将二硫键暴露于还原剂可以切割二硫键并使寡核苷酸条形码从珠脱离。不稳定部分可以作为凝胶珠或微胶囊的一部分,作为将试剂或分析物与凝胶珠或微胶囊连接的化学接头的一部分和/或作为试剂或分析物的一部分而包括在内。在一些实施例中,多个条形码中的至少一个条形码可以固定在颗粒上、部分固定在颗粒上、封闭在颗粒中、部分封闭在颗粒中,或其任何组合。
在一些实施例中,凝胶珠可包含多个不同的聚合物,包括但不限于:聚合物、热敏聚合物、光敏聚合物、磁性聚合物、pH敏感聚合物、盐敏感聚合物、化学敏感聚合物、聚电解质、多糖、肽、蛋白质和/或塑料。聚合物可以包括但不限于以下材料,例如聚(N-异丙基丙烯酰胺)(PNIPAAm)、聚(苯乙烯磺酸盐)(PSS)、聚(烯丙基胺)(PAAm)、聚(丙烯酸)(PAA)、聚(乙烯亚胺)(PEI)、聚(二烯丙基二甲基氯化铵)(PDADMAC)、聚(吡咯)(PPy)、聚(乙烯吡咯烷酮)(PVPON)、聚(乙烯基吡啶)(PVP)、聚(甲基丙烯酸)(PMAA)、聚(甲基丙烯酸甲酯)(PMMA)、聚苯乙烯(PS)、聚(四氢呋喃)(PTHF)、聚(邻苯二甲醛)(PTHF)、聚(己基紫精)(PHV)、聚(L-赖氨酸)(PLL)、聚(L-精氨酸)(PARG)、聚(乳酸-共-乙醇酸)(PLGA)。
可以使用多种化学刺激来触发珠的破坏、溶解或降解。这些化学变化的例子可以包括但不限于pH介导的珠壁的变化,通过交联键的化学切割使珠壁崩解,触发珠壁的解聚和珠壁转换反应。容积变化也可以用于引发珠的破坏。
通过各种刺激对微胶囊进行体积或物理改变在设计释放试剂的胶囊方面也具有许多优势。容积或物理变化发生在宏观范围内,其中珠破裂是由刺激引起的机械物理力的结果。这些过程可包括但不限于压力引起的破裂、珠壁熔化或珠壁的孔隙率变化。
生物刺激还可以用于引发珠的破坏、溶解或降解。通常,生物触发物类似于化学触发物,但是许多实例使用生物分子或生物系统中常见的分子,例如酶、肽、糖、脂肪酸、核酸等。例如,珠可以包含具有对特定蛋白酶的切割敏感的肽交联的聚合物。更具体地,一个实例可以包括包含GFLGK肽交联的微胶囊。添加诸如蛋白酶组织蛋白酶B的生物触发物后,壳孔的肽交联被切割,珠的内容物被释放。在其他情况下,蛋白酶可以被热激活。在另一个实例中,珠包括包含纤维素的壳壁。水解酶壳聚糖的添加是纤维素键切割、壳壁解聚和释放其内部内容物的生物触发物。
施加热刺激后,也可诱导珠释放其内容物。温度变化会可导致珠发生多种变化。热的变化可能导致珠熔化,从而使珠壁崩解。在其他情况下,热可能会增加珠内部组分的内部压力,从而使珠破裂或爆破。在其他情况下,热可以将珠转变成收缩的脱水状态。热还可以作用在珠壁内的热敏聚合物上,从而导致珠破裂。
将磁性纳米颗粒包含到微胶囊的珠壁中可允许珠的触发破裂以及将珠引导成阵列。为了任何一个目的,本披露的设备可以包括磁珠。在一个实例中,在存在振荡磁场刺激的情况下,将Fe3O4纳米颗粒掺入到包含珠的聚电解质中引发破裂。
由于电刺激,珠也可以被破坏、溶解或降解。类似于上一部分中所述的磁性颗粒,电敏感珠可同时触发珠破裂和其他功能,例如在电场中对齐、电导率或氧化还原反应。在一个实例中,将包含电敏材料的珠在电场中对齐,使得可以控制内部试剂的释放。在其他实例中,电场可在珠壁自身内引起氧化还原反应,这可增加孔隙率。
光刺激也可以用来破坏珠。许多光触发物都是可能的,并且可以包括使用各种分子(例如能够吸收特定波长范围的光子的纳米颗粒和发色团)的系统。例如,金属氧化物涂层可以用作胶囊触发物。涂有SiO2的聚电解质胶囊的UV照射可以导致珠壁崩解。在又一个实例中,可将光可切换材料例如偶氮苯基团掺入在珠壁中。施加UV或可见光后,此类化学药品在吸收光子后会发生可逆的顺式至反式异构化。在这个方面,光子开关的引入导致珠壁可在施加光触发物后崩解或变得更加多孔。
例如,在图2中所示的条形码编码(例如,随机条形码编码)的非限制性实例中,在框208处将诸如单细胞的细胞引入微孔阵列的多个微孔之后,可以在框212将珠引入微孔阵列的多个微孔。每个微孔可包含一个珠。珠可以包含多个条形码。条形码可以包含附着在珠上的5'胺区。条形码可以包含通用标记、条形码序列(例如,分子标记)、靶结合区或其任何组合。
在此披露的条形码可以与固体支持物(例如珠)关联(例如连接)。与固相支持物关联的条形码可各自包含选自包含具有独特序列的至少100或1000个条形码序列的组的条形码序列。在一些实施例中,与固体支持物关联的不同条形码可以包含具有不同序列的条形码。在一些实施例中,与固体支持物关联的条形码的一定百分比包含相同的细胞标记。例如,所述百分比可以是或约是60%、70%、80%、85%、90%、95%、97%、99%、100%或这些值中任意两个之间的数字或范围。作为另一个实例,所述百分比可以是至少或至多60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施例中,与固体支持物关联的条形码可以具有相同的细胞标签。与不同固体支持物关联的条形码可以具有不同的细胞标记,所述细胞标记选自包含具有独特序列的至少100或1000个细胞标记的组。
在此披露的条形码可以与固体支持物(例如珠)关联(例如连接)。在一些实施例中,条形码编码样品中的多个靶可以通过包括与多个条形码关联的多个合成颗粒的固体支持物执行。在一些实施例中,固体支持物可以包括与多个随机条形码关联的多个合成颗粒。不同固体支持物上的多个条形码的空间标记的区别可以在于至少一个核苷酸。固体支持物可以例如包含呈二维或三维的多个条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔度玻璃珠、磁性珠、Dynabeads、交联葡聚糖/交联琼脂糖珠、纤维素珠、聚苯乙烯珠、或其任何组合。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体、或其任何组合。在一些实施例中,固体支持物可以是自由浮动的。在一些实施例中,固体支持物可以被包埋在半固体或固体阵列中。条形码可以不与固体支持物关联。条形码可以是单个核苷酸。条形码可以与基底关联。
如在此所用,术语“系接”、“连接”和“固定”可互换使用,并且可以是指用于将条形码连接到固体支持物的共价或非共价方式。多个不同的固体支持物中的任一种可以用作用于连接预先合成的条形码或用于条形码的原位固相合成的固体支持物。
在一些实施例中,固体支持物是珠。珠可以涵盖核酸可固定(例如共价地或非共价地)在其上的固体、多孔或中空球体、球、轴承、圆柱或其他类似构型中的一种或多种类型。珠可以是例如由塑料、陶瓷、金属、聚合物材料或其任何组合组成的。珠可以是或包括离散颗粒,该离散颗粒是球形(例如微球)或具有非球形或不规则形状诸如立方体、长方体、锥形、圆柱形、圆锥形、椭圆形或圆盘形等等。在一些实施例中,珠可以是非球形形状。
珠可以包括多种材料,包括但不限于,顺磁体材料(如镁、钼、锂和钽),超顺磁体材料(如铁氧体(Fe3O4;磁铁矿)纳米粒子)、铁磁材料(例如铁、镍、钴、其一些合金以及一些稀土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙或其任何组合。
在一些实施例中,珠(例如,标记附着于其上的珠)是水凝胶珠。在一些实施例中,珠包含水凝胶。
本文披露的一些实施例包括一个或多个颗粒(例如,珠)。每个颗粒可以包含多个寡核苷酸(例如,条形码)。多个寡核苷酸中的每个可以包含条形码序列(例如,分子标记序列)、细胞标记和靶结合区(例如,寡(dT)序列、基因特异性序列、随机多聚体,或其组合)。多个寡核苷酸中的每个的细胞标记序列可以相同。不同颗粒上的寡核苷酸的细胞标记序列可以不同,从而可以鉴定不同颗粒上的寡核苷酸。在不同的实现方式中,不同的细胞标记序列的数量可以不同。在一些实施例中,细胞标记序列的数量可以是或约是10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108、109,这些值中任何两个之间的数字或范围,或更大。在一些实施例中,细胞标记序列的数量可以是至少或至多10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108或109。在一些实施例中,多个颗粒中的不超过1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个包括具有相同细胞序列的寡核苷酸。在一些实施例中,包括具有相同细胞序列的寡核苷酸的多个颗粒可以是至多0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%或更多。在一些实施例中,多个颗粒中没有颗粒具有相同的细胞标记序列。
每个颗粒上的多个寡核苷酸可包含不同的条形码序列(例如,分子标记)。在一些实施例中,条形码序列的数量可以是或约是10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108、109,或这些值中任何两个之间的数字或范围。在一些实施例中,条形码序列的数量可以是至少或至多10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、106、107、108或109。例如,多个寡核苷酸中的至少100个包含不同的条形码序列。作为另一个实例,在单个颗粒中,多个寡核苷酸中的至少100、500、1000、5000、10000、15000、20000、50000个、这些值中的任何两个之间的数量或范围、或者更多个包含不同的条形码序列。一些实施例提供了多个包含条形码的颗粒。在一些实施例中,有待标记的靶的出现(或拷贝或数量)与不同条形码序列的比率可以是至少1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:30、1:40、1:50、1:60、1:70、1:80、1:90或更多。在一些实施例中,多个寡核苷酸中的每个进一步包含样品标记、通用标记或两者。颗粒可以是例如纳米颗粒或微粒。
珠的大小可以变化。例如,珠的直径可以在0.1微米至50微米的范围内。在一些实施例中,珠的直径可以是或约是0.1、0.5、1、2、3、4、5、6、7、8、9、10、20、30、40、50微米,或这些值中任何两个之间的数字或范围。
珠的直径可以与基底的孔直径相关。在一些实施例中,珠的直径可以比孔的直径长或短或约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或这些值中任何两个之间的数字或范围。珠的直径可以与细胞(例如由基底的孔截留的单细胞)直径相关。在一些实施例中,例如,珠的直径可以比孔的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠的直径可以与细胞(例如由基底的孔截留的单细胞)直径相关。在一些实施例中,珠的直径可以比细胞的直径长或短或约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%或这些值中任何两个之间的数字或范围。在一些实施例中,例如,珠的直径可以比细胞的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%或300%。
珠可以连接到和/或包埋在基底中。珠可以连接到和/或包埋在凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上条形码上存在的可以充当位置地址的空间标记鉴定。
珠的实例可以包括但不限于链霉亲和素珠、琼脂糖珠、磁性珠、微珠、抗体缀合的珠(例如抗免疫球蛋白微珠)、蛋白质A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠以及BcMagTM羧基末端的磁性珠。
珠可以关联有(例如浸渗有)量子点或荧光染料以使得其在一个荧光光学通道或多个光学通道中发荧光。珠可以与氧化铁或氧化铬关联以使得其具有顺磁性或铁磁性。珠可以是可鉴定的。例如,可以使用照相机对珠进行成像。珠可以具有与珠关联的可检测编码。例如,珠可以包含条形码。珠可以例如由于在有机或无机溶液中的溶胀而改变大小。珠可以是疏水性的。珠可以是亲水性的。珠可以是生物相容的。
固体支持物(例如珠)可以是可视化的。固体支持物可以包含可视化标签(例如荧光染料)。固体支持物(例如珠)可以被蚀刻有鉴定物(例如数字)。鉴定物可以通过对珠进行成像来可视化。
固体支持物可以包含不溶性、半溶性或不溶性材料。当固体支持物包含接头、支架、构建块或连接到其上的其他反应性部分时它可以被称为“官能化的”,然而,当固体支持物没有连接到其上的这种反应性部分时它可以被称为“非官能化的”。固体支持物可以下述形式采用:游离于溶液中,诸如以微量滴定孔形式;以流通形式,诸如在柱中;或在测试条(dipstick)中。
固体支持物可以包括膜、纸、塑料、涂覆表面、平表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以呈树脂、凝胶、微球或其他几何构型的形式。固体支持物可以包含二氧化硅芯片、微粒、纳米颗粒、板、阵列、毛细管、板支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢铁、金、银、铝、硅以及铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、塑料材料包括多孔板或膜(例如由聚乙烯、聚丙烯、聚酰胺、聚偏氟乙烯形成的)、和/或晶片、梳状物、插针或针(例如适合于组合性合成或分析的插针阵列)或平表面诸如晶片(硅晶片)、带有具有或不具有滤底的凹陷的晶片的凹陷或纳升孔的阵列中的珠。
固体支持物可以包含聚合物基质(例如,凝胶,水凝胶)。聚合物基质可以能够渗透细胞内空间(例如在细胞器周围)。聚合物基质可以能够被泵送贯穿整个循环系统。
基底和微孔阵列
如本文所用,基底可以指固体支持物的类型。基底可以是指可以包含本披露的条形码随机条形码的固体支持物。基底可以例如包含多个微孔。例如,基底可以是包含两个或更多个微孔的孔阵列。在一些实施例中,微孔可以包括限定体积的小反应室。在一些实施例中,微孔可以截留一个或多个细胞。在一些实施例中,微孔可以仅截留一个细胞。在一些实施例中,微孔可以截留一个或多个固体支持物。在一些实施例中,微孔可以仅截留一个固体支持物。在一些实施例中,微孔截留单细胞和单个固体支持物(例如珠)。微孔可包含本披露的条形码试剂。
条形码编码方法
本披露提供了用于估计身体样品(例如,组织、器官、肿瘤、细胞)中的不同位置处的不同靶的数量的方法。这些方法可以包括将条形码(例如,随机条形码)放置成紧密接近样品、裂解样品、使不同的靶与条形码关联、扩增靶并且/或者数字计数靶。该方法可以进一步包括分析和/或可视化从条形码上的空间标记获得的信息。在一些实施例中,方法包括可视化样品中的多个靶。将多种靶映射到样品的谱图上可以包括生成样品的二维谱图或三维谱图。二维谱图和三维谱图可在对样品中的多各靶进行条形码编码(例如,随机条形码编码)之前或之后生成。可视化样品中的多种靶可以包括将多种靶映射到样品的谱图(map)上。将多种靶映射到样品的谱图上可以包括生成样品的二维谱图或三维谱图。二维谱图和三维谱图可在条形码编码样品中的多种靶之前或之后生成。在一些实施例中,二维谱图和三维谱图可在裂解样品之前生成。在生成二维谱图或三维谱图之前或之后裂解样品可以包括加热样品、使样品与洗涤剂接触、改变样品的pH、或其任何组合。
在一些实施例中,对多个靶进行条形码编码包括将多个条形码与多个靶进行杂交以产生经条形码编码的靶(例如,经随机经条形码编码的靶)。对多个靶进行条形码编码可以包括生成经条形码编码的靶的索引文库。可以使用包括多个条形码(例如,随机条形码)的固体支持物来执行经条形码编码的靶的索引文库的产生。
使样品和条形码接触
本披露提供了用于使样品(例如细胞)与本披露的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与条形码(例如,随机条形码)接触。可以例如通过重力流动接触细胞,其中细胞可以沉降并且产生一个单层。样品可以是组织薄切片。薄切片可以置于基底上。样品可以是一维的(例如形成平表面)。样品(例如细胞)可以例如通过使细胞生长/培养在基底上而铺开在基底上。
当条形码紧密接近靶时,靶可以与条形码杂交。可以非可消耗比接触条形码,使得每个不同的靶可以与本披露的不同的条形码关联。为了确保靶与条形码之间的有效关联,靶可以交联至条形码。
细胞裂解
在分布细胞和条形码之后,可以裂解细胞以释放靶分子。细胞裂解可以通过多种方式中的任何一种完成,例如通过化学或生化方式、通过渗透压休克或通过热裂解、机械裂解或光线裂解。细胞可以通过添加以下各项来裂解:包含洗涤剂(例如SDS、十二烷基硫酸锂、Triton X-100、吐温-20或NP-40)的细胞裂解缓冲液、有机溶剂(例如甲醇或丙酮)或消化酶(例如蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合。为了增加靶和条形码的关联,可以通过例如降低温度和/或增加裂解物的粘度改变靶分子的扩散速率。
在一些实施例中,样品可以使用滤纸裂解。滤纸可以用在滤纸之上的裂解缓冲液浸湿。可以在可以有助于样品的裂解和样品的靶与基底的杂交的压力存在下,将滤纸施加至样品。
在一些实施例中,裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解执行。化学裂解可以包括使用消化酶诸如蛋白酶K、胃蛋白酶和胰蛋白酶。裂解可以通过向基底添加裂解缓冲液来执行。裂解缓冲液可以包含Tris HCl。裂解缓冲液可包括至少约0.01M、0.05M、0.1M、0.5M、或1M或更多Tris HCl。裂解缓冲液可包括至多约0.01M、0.05M、0.1M、0.5M、或1M或更多Tris HCL。裂解缓冲液可以包含约0.1M Tris HCl。裂解缓冲液的pH可以是至少约1、2、3、4、5、6、7、8、9、10,或更高。裂解缓冲液的pH可以是至多约1、2、3、4、5、6、7、8、9、10,或更高。在一些实施例中,裂解缓冲液的pH是约7.5。裂解缓冲液可以包含盐(例如LiCl)。在裂解缓冲液中盐的浓度可以是至少约0.1M、0.5M、或1M、或更高。在裂解缓冲液中盐的浓度可以是至多约0.1M、0.5M、或1M、或更高。在一些实施例中,裂解缓冲液中盐的浓度是约0.5M。裂解缓冲液中可以包含洗涤剂(例如SDS、十二烷基硫酸锂、triton X、吐温、NP-40)。裂解缓冲液中洗涤剂的浓度可以是至少约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、或7%或更高。裂解缓冲液中洗涤剂的浓度可以是至多约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。在一些实施例中,裂解缓冲液中洗涤剂的浓度是约1%十二烷基硫酸锂。裂解方法中使用的时间可以取决于使用的洗涤剂的量。在一些实施例中,使用的洗涤剂越多,裂解需要的时间越少。裂解缓冲液可以包含螯合剂(例如EDTA、EGTA)。裂解缓冲液中螯合剂的浓度可以是至少约1、5、10、15、20、25或30mM或更高。裂解缓冲液中螯合剂的浓度可以是至多约1、5、10、15、20、25或30mM或更高。在一些实施例中,裂解缓冲液中螯合剂的浓度是约10mM。裂解缓冲液可以包含还原剂(例如β-巯基乙醇、DTT)。裂解缓冲液中还原剂的浓度可以是至少约1、5、10、15、或20mM或更高。裂解缓冲液中还原剂的浓度可以是至多约1、5、10、15、或20mM或更高。在一些实施例中,裂解缓冲液中还原剂的浓度是约5mM。在一些实施例中,裂解缓冲液可以包含约0.1M TrisHCl、约pH 7.5、约0.5M LiCl、约1%十二烷基硫酸锂、约10mMEDTA以及约5mM DTT。
裂解可以在约4C、10C、15C、20C、25C或30C的温度下执行。裂解可以执行约1、5、10、15或20或更多分钟。裂解细胞可以包含至少约100000、200000、300000、400000、500000、600000或700000个或更多个靶核酸分子。裂解细胞可以包含至多约100000、200000、300000、400000、500000、600000或700000个或更多个靶核酸分子。
条形码连接到靶核酸分子上
在裂解细胞并使核酸分子从其释放之后,核酸分子可以与共定位的固体支持物的条形码随机地关联。关联可以包括条形码的靶识别区与靶核酸分子的互补部分的杂交(例如条形码的寡(dT)可以与靶的聚(A)尾相关作用)。用于杂交的测定条件(例如缓冲液pH、离子强度、温度等)可以被选择以促进特定的稳定性杂交体的形成。在一些实施例中,从裂解的细胞中释放的核酸分子可以与基底上的多个探针关联(例如与基底上的探针杂交)。当探针包含寡(dT)时,mRNA分子可以与探针杂交并且进行逆转录。寡核苷酸的寡(dT)部分可以充当用于cDNA分子的第一链合成的引物。例如,在图2中所示的条形码的非限制性实例中,在框216,mRNA分子可以与珠上的条形码杂交。例如,单链核苷酸片段可以与条形码的靶结合区杂交。
连接可以进一步包括将条形码的靶识别区与靶核酸分子的一部分连接。例如,靶结合区可以包含可以能够与限制性内切位点突出端(例如EcoRI粘性突出端)特异性杂交的核酸序列。测定程序可以进一步包括用限制性内切酶(例如EcoRI)处理靶核酸以产生限制位点突出端。条形码然后可以连接至包含与限制性内切位点突出端互补的序列的任何核酸分子。连接酶(例如T4 DNA连接酶)可以用于接合两个片段。
例如,在图2中所示的条形码的非限制性实例中,在框220处,来自多个细胞(或多个样品)的经标记的靶(例如,靶-条形码分子)可以随后合并到例如管中。可以通过例如回收条形码和/或与靶-条形码分子连接的珠来合并经标记的靶。
连接的靶-条形码分子的基于固体支持物的集合体的收回可以通过使用磁性珠和外部施加的磁场来实现。一旦靶-条形码分子已被合并,所有进一步的加工可以在单一反应器中进行。另外的加工可以包括例如逆转录反应、扩增反应、切割反应、解离反应和/或核酸延伸反应。另外的加工反应可以在微孔内进行,也就是说,无需首先合并来自多个细胞的标记的靶核酸分子。
逆转录
本披露提供了一种用于使用逆转录产生靶-条形码缀合物的方法(例如,在图2的框224处)。靶-条形码缀合物可以包含条形码和靶核酸(即,经条形码编码的cDNA分子,例如经随机经条形码编码的cDNA分子)的全部或一部分的互补序列。关联的RNA分子的逆转录可以通过添加逆转录引物以及逆转录酶发生。逆转录引物可以是寡(dT)引物、随机的六核苷酸引物或靶特异性寡核苷酸引物。寡(dT)引物可以是或可以约是12-18个核苷酸的长度并且结合哺乳动物mRNA的3’端处的内源性聚(A)尾。随机的六核苷酸引物可以在多个互补位点处结合mRNA。靶特异性寡核苷酸引物典型选择性地引发目的mRNA。
在一些实施例中,标记的RNA分子的逆转录可以通过添加逆转录引物发生。在一些实施例中,逆转录引物是寡(dT)引物、随机的六核苷酸引物或靶特异性寡核苷酸引物。一般来讲,寡(dT)引物是约12-18个核苷酸的长度并且结合哺乳动物mRNA的3’端处的内源性聚(A)尾。随机的六核苷酸引物可以在多个互补位点处结合mRNA。靶特异性寡核苷酸引物典型选择性地引发目的mRNA。
逆转录可以重复地发生以产生多个标记的cDNA分子。在此披露的方法可以包括进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次逆转录反应。该方法可以包括进行至少约25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100次逆转录反应。
扩增
可以执行一次或多次核酸扩增反应(例如,在图2的框228处)以产生经标记的靶核酸分子的多个拷贝。扩增可以多重复路方式执行,其中多个靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(若存在的话)的至少一部分。扩增反应可以包括扩增细胞标记和/或条形码序列(例如,分子标记)的至少一部分。扩增反应可包括扩增样品标签、细胞标记、空间标记、条形码序列(例如,分子标记)、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多个核酸的0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%或在这些值的任何两个值之间的范围或数值。该方法可以进一步包括进行一次或多次cDNA合成反应以产生包含样品标记、细胞标记、空间标记和/或条形码序列(例如,分子标记)的靶-条形码分子的一个或多个cDNA拷贝。
在一些实施例中,扩增可以使用聚合酶链式反应(PCR)执行。如在此所用,PCR可以是指用于通过同时引物延伸DNA的互补链进行特定DNA序列的体外扩增的反应。如在此所用,PCR可以涵盖反应的衍生形式,包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、数字PCR以及组装PCR。
标记的核酸的扩增可以包括基于非PCR的方法。基于非PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环-对-环扩增。其他基于非PCR的方法包括用于扩增DNA或RNA靶的DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多个循环、连接酶链式反应(LCR)和Qβ复制酶(Qβ)方法、使用回文探针、链置换扩增、使用限制性内切酶的寡核苷酸驱动的扩增、其中引物与核酸序列杂交并且所得双链体在延伸反应和扩增之前被切割的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增以及分枝式延伸扩增(RAM)。在一些实施例中,扩增不产生环化的转录物。
在一些实施例中,本文披露的方法进一步包括对经标记的核酸(例如,经标记的RNA、经标记的DNA、经标记的cDNA)进行聚合酶链式反应,以产生经标记的扩增子(例如,经随机标记的扩增子)。经标记的扩增子可以是双链分子。双链分子可以包括双链RNA分子、双链DNA分子或与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或条形码序列(例如分子标记)。经标记的扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本披露的核酸可以包括合成的或改变的核酸。
扩增可以包括使用一个或多个非天然核苷酸。非天然核苷酸可以包括光不稳定性或可触发的核苷酸。非天然核苷酸的实例可以包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及二醇核酸(GNA)和苏糖核酸(TNA)。非天然核苷酸可以添加到扩增反应的一个或多个循环。非天然核苷酸的添加可以用于鉴定扩增反应中特定循环或时间点的产物。
进行一次或多次扩增反应可以包括使用一个或多个引物。一个或多个引物可以包含例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或更多个核苷酸。一个或多个引物可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或更多个核苷酸。一个或多个引物可以包含小于12-15个核苷酸。一个或多个引物可以退火至多个经标记的靶(例如,经随机标记的靶)的至少一部分。一个或多个引物可以退火至多个经标记的靶的3’末端或5’末端。一个或多个引物可以退火至多个经标记的靶的内部区域。内部区域可以是自多个经标记的靶的3’末端的至少约50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸。一个或多个引物可以包括一组固定引物。一个或多个引物可以包括至少一个或多个定制引物。一个或多个引物可以包括至少一个或多个对照引物。一个或多个引物可以包括至少一个或多个基因特异性引物。
一个或多个引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一个或多个定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、条形码序列(例如,分子标记)、靶或其任何组合。一个或多个引物可以包括通用引物和定制引物。定制引物可以被设计用于扩增一个或多个靶。靶可以包括一个或多个样品中总核酸的亚组。靶可以包括一个或多个样品中总的标记的靶的亚组。一个或多个引物可以包括至少96个或更多个定制引物。一个或多个引物可以包括至少960个或更多个定制引物。一个或多个引物可以包括至少9600个或更多个定制引物。一个或多个定制引物可以退火至两个或更多个不同的标记的核酸。两个或更多个不同的标记的核酸可以对应于一个或多个基因。
任何扩增方案可以用于本披露的方法中。例如,在一种方案中,第一轮PCR可以使用基因特异性引物和针对通用Illumina测序引物1序列的引物扩增连接到珠的分子。第二轮PCR可以使用侧接Illumina测序引物2序列的巢式基因特异性引物和针对通用Illumina测序引物1序列的引物扩增第一PCR产物。第三轮PCR添加P5和P7以及样品索引以将PCR产物转入到Illumina测序文库中。使用150bp×2测序的测序可以揭示读数1上的细胞标记和条形码序列(例如分子标记)、读数2上的基因和索引1读数上的样品索引。
在一些实施例中,可以使用化学切割将核酸从基底去除。例如,可以使用核酸中存在的化学基团或修饰碱基来有助于其从固体支持物的去除。例如,可以使用酶将核酸从基底去除。例如,可以通过限制性内切核酸酶消化将核酸从基底去除。例如,用尿嘧啶-d-糖基化酶(UDG)处理含有dUTP或ddUTP的核酸可以用于将核酸从基底去除。例如,可以使用执行核苷酸切除的酶诸如碱基切除修复酶诸如脱嘌呤/脱嘧啶(AP)将核酸从基底去除。在一些实施例中,可以使用光可切割的基团和光将核酸从基底去除。在一些实施例中,可以使用可切割接头将核酸从基底去除。例如,可切割接头可以包括生物素/抗生物素蛋白、生物素/链霉亲和素、生物素/中性链亲和素、Ig蛋白A、光不稳定性接头、酸或碱不稳定性接头或适体中的至少一种。
当探针是基因特异性的时,分子可以与探针杂交并且进行逆转录和/或扩增。在一些实施例中,在核酸已合成(例如逆转录)之后,可以对其进行合成。扩增可以多重复路方式执行,其中多个靶核酸序列同时进行扩增。扩增可以向核酸添加测序衔接子。
在一些实施例中,扩增可以在基底上例如以桥式扩增执行。可以对cDNA进行同聚物加尾以生成用于使用基底上的寡(dT)探针进行的桥式扩增的相容性端。在桥式扩增中,与模板核酸的3’端互补的引物可以是每对中共价地连接到固体颗粒的第一引物。当含有模板核酸的样品与颗粒接触并且执行单个热循环时,模板分子可以退火至第一引物并且通过添加核苷酸使第一引物在正向方向上延长以形成由模板分子和与模板互补的新形成的DNA组成的双链体分子。在下一循环的加热步骤中,可以使双链体分子变性,从而模板分子从颗粒中释放并且留下通过第一引物连接到颗粒的互补DNA链。在随后进行的退火和延长步骤的退火阶段中,互补链可以与第二引物杂交,该第二引物与从第一引物去除的位置处的互补链的区段互补。这种杂交可以使得互补链在第一引物与第二引物之间形成桥,该桥通过共价键固定到第一引物并且通过杂交固定到第二引物。在延长阶段中,可以通过在相同反应混合物中添加核苷酸使第二引物在反向方向上延长,从而将桥转化为双链桥。然后开始下一循环,并且可以使双链桥变性以产生两个单链的核酸分子,每个核酸分子具有经由第一引物和第二引物连接到颗粒的一端,并且每个核酸分子的另一端是未连接的。在这个第二循环的退火和延长步骤中,每个链可以与相同颗粒上的先前未使用的另外的互补引物杂交以形成新的单链桥。现在杂交的两种先前未使用的引物进行延长以将两个新桥转化为双链桥。
扩增反应可以包括扩增多个核酸的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%。
标记的核酸的扩增可以包括基于PCR的方法或基于非PCR的方法。标记的核酸的扩增可以包括标记的核酸的指数式扩增。标记的核酸的扩增可以包括标记的核酸的线性扩增。扩增可以通过聚合酶链式反应(PCR)执行。PCR可以是指用于通过同时引物延伸DNA的互补链进行特定DNA序列的体外扩增的反应。PCR可以涵盖反应的衍生形式,包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、数字PCR、抑制PCR、半抑制PCR以及组装PCR。
在一些实施例中,标记的核酸的扩增包括基于非PCR的方法。基于非PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环-对-环扩增。其他基于非PCR的方法包括用于扩增DNA或RNA靶的DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多个循环、连接酶链式反应(LCR)、Qβ复制酶(Qβ)、使用回文探针、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、其中引物与核酸序列杂交并且所得双链体在延伸反应和扩增之前被切割的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和/或分枝式延伸扩增(RAM)。
在一些实施例中,在此披露的方法进一步包括在扩增的扩增子(例如靶)上进行巢式聚合酶链式反应。扩增子可以是双链分子。双链分子可以包括双链RNA分子、双链DNA分子或与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标签或分子鉴定物标记。可替代地,扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本发明的核酸可以包括合成的或改变的核酸。
在一些实施例中,该方法包括重复地扩增标记的核酸以产生多个扩增子。在此披露的方法可以包括进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次扩增反应。可替代地,该方法包括进行至少约25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100次扩增反应。
扩增可以进一步包括将一个或多个对照核酸添加到包含多个核酸的一个或多个样品。扩增可以进一步包括将一个或多个对照核酸添加到多个核酸。对照核酸可以包含对照标记。
扩增可以包括使用一个或多个非天然核苷酸。非天然核苷酸可以包括光不稳定性和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及二醇核酸(GNA)和苏糖核酸(TNA)。非天然核苷酸可以添加到扩增反应的一个或多个循环。非天然核苷酸的添加可以用于鉴定扩增反应中特定循环或时间点的产物。
进行一次或多次扩增反应可以包括使用一个或多个引物。一个或多个引物可以包括一个或多个寡核苷酸。一个或多个寡核苷酸可以包含至少约7-9个核苷酸。一个或多个寡核苷酸可以包含小于12-15个核苷酸。一个或多个引物可以退火至多个标记的核酸的至少一部分。一个或多个引物可以退火至多个标记的核酸的3’端和/或5’端。一个或多个引物可以退火至多个标记的核酸的内部区域。内部区域可以是自多个标记的核酸的3’端的至少约50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸。一个或多个引物可以包括一组固定引物。一个或多个引物可以包括至少一个或多个定制引物。一个或多个引物可以包括至少一个或多个对照引物。一个或多个引物可以包括至少一个或多个管家基因引物。一个或多个引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一个或多个定制引物可以退火至第一样品标签、第二样品标签、分子鉴定物标记、核酸或其产物。一个或多个引物可以包括通用引物和定制引物。定制引物可以被设计用于扩增一个或多个靶核酸。靶核酸可以包括一个或多个样品中总核酸的亚组。在一些实施例中,引物是连接到本披露的阵列的探针。
在一些实施例中,对样品中的多个靶进行条形码编码(例如,随机条形码编码)还包括生成经条形码编码的靶(例如,经随机经条形码编码的靶)或经条形码编码的靶片段的索引文库。不同条形码的条形码序列(例如,不同随机条形码的分子标记)可以彼此是不同的。生成经条形码编码的靶的索引文库包括由样品中的多个靶生成多个索引的多核苷酸。例如,对于包含第一索引的靶和第二索引的靶的经条形码编码的靶的索引文库,第一索引的多核苷酸的标记区与第二索引的多核苷酸的标记区的区别可以在于,在于约,在于至少或在于至多1、2、3、4、5、6、7、8、9、10、20、30、40、50个核苷酸,或这些值中的任何两个之间的数字或范围。在一些实施例中,生成经条形码编码的靶的索引文库包括使多个靶例如mRNA分子与多个寡核苷酸(包含聚(T)区和标记区)接触;并且使用逆转录酶进行第一链合成以产生单链标记的cDNA分子,每个cDNA分子包含cDNA区和标记区,其中多个靶包括具有不同序列的至少两个mRNA分子并且多个寡核苷酸包括具有不同序列的至少两个寡核苷酸。生成经条形码编码的靶的索引文库可以进一步包括扩增单链标记的cDNA分子,以产生双链标记的cDNA分子;并且对双链标记的cDNA分子进行巢式PCR,以产生标记的扩增子。在一些实施例中,该方法可以包括生成衔接子标记的扩增子。
条形码编码(例如,随机条形码编码)可以使用核酸条形码或标签标记单独的核酸(例如DNA或RNA)分子。在一些实施例中,当cDNA分子由mRNA生成时,随机条形码编码涉及将DNA条形码或标签添加到cDNA分子中。巢式PCR可以被进行来使PCR扩增偏移最小化。衔接子可以被添加来使用例如下一代测序(NGS)进行测序。测序结果可用于确定靶的一个或多个拷贝的细胞标记、分子标记和核苷酸片段序列,例如在图2的框232处。
图3是显示用于产生经条形码编码的靶(例如经随机经条形码编码的靶)(例如经条形码编码的mRNA或其片段)的索引文库的非限制性示例性过程的示意图。如步骤1所示,逆转录过程可以编码具有独特分子标记、细胞标记和通用PCR位点的每个mRNA分子。具体地,通过将一组条形码(例如随机条形码)310与RNA分子302的聚(A)尾区308杂交(例如随机杂交),RNA分子302可以被逆转录来产生经标记的cDNA分子304(包括cDNA区306)。条形码310中的每个可以包含靶结合区,例如聚(dT)区312、标记区314(例如条形码序列或分子)和通用PCR区316。
在一些实施例中,细胞标记可以包含3至20个核苷酸。在一些实施例中,分子标记可以包含3至20个核苷酸。在一些实施例中,多个随机条形码中的每个进一步包含通用标记和细胞标记中的一个或多个,其中通用标记对于固体支持物上的多个随机条形码是相同的并且细胞标记对于固体支持物上的多个随机条形码是相同的。在一些实施例中,通用标记可以包含3至20个核苷酸。在一些实施例中,细胞标记包含3至20个核苷酸。
在一些实施例中,标记区314可以包含条形码序列或分子标记318和细胞标记320。在一些实施例中,标记区314可以包含通用标记、维标记以及细胞标记中的一个或多个。条形码序列或分子标记318的长度可以是,可以是约,可以是至少或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。细胞标记320的长度可以是,可以是约,可以是至少,或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。通用标记的长度可以是,可以是约,可以是至少或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。通用标记对于固体支持物上的多个随机条形码可以是相同的并且细胞标记对于固体支持物上的多个随机条形码可以是相同的。维标记的长度可以是,可以是约,可以是至少,或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。
在一些实施例中,标记区314可以包含,包含约,包含至少或包含至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个或者在这些值中的任何值之间的数值或范围的不同标记,诸如条形码序列或分子标记318和细胞标记320。每个标记的长度可以是,可以是约,可以是至少或可以是至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。条形码或随机条形码310的组可以包含,包含约,包含至少或包含至多10、20、40、50、70、80、90、102、103、104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1020或这些值中的任何值之间的数值或范围的条形码或随机条形码310。并且,条形码或随机条形码310的组可以例如各自包含独特标记区314。经标记的cDNA分子304可以被纯化以去除多余的条形码或随机条形码310。纯化可以包括Ampure珠纯化。
如步骤2所示,来自步骤1的逆转录过程的产物可以合并到1个管中并且使用第1PCR引物库和第1通用PCR引物进行PCR扩增。由于独特的标记区314,合并是可能的。具体地,标记的cDNA分子304可以被扩增来产生巢式PCR标记的扩增子322。扩增可以包括多重PCR扩增。扩增可以包括在单一反应体积中使用96种多重引物进行的多重PCR扩增。在一些实施例中,多重PCR扩增可以利用,利用约,利用至少或利用至多10、20、40、50、70、80、90、102、103、104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1020个或者在这些值中的任何值之间的数值或范围的多重引物。扩增可包括使用第一PCR引物池324,其包含靶向特定基因的定制引物326A-C和通用引物328。定制引物326可以与经标记的cDNA分子304的cDNA部分306’内的区域杂交。通用引物328可以与经标记的cDNA分子304的通用PCR区316杂交。
如图3的步骤3所示,来自步骤2的PCR扩增的产物可以用巢式PCR引物库和第2通用PCR引物扩增。巢式PCR可以使PCR扩增偏移最小化。具体地,巢式PCR标记的扩增子322可以通过巢式PCR进一步扩增。巢式PCR可以包括在单一反应体积中使用巢式PCR引物332a-c的巢式PCR引物池330和第2通用PCR引物328’进行多重PCR。巢式PCR引物池328可以包含,包含约,包含至少或包含至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个或者在这些值中的任何值之间的数值或范围的不同巢式PCR引物330。巢式PCR引物332可以含有衔接子334并且与经标记的扩增子322的cDNA部分306”内的区域杂交。通用引物328’可以含有衔接子336并且与标记的扩增子322的通用PCR区316杂交。因此,步骤3产生衔接子标记的扩增子338。在一些实施例中,巢式PCR引物332和第2通用PCR引物328’可以不含有衔接子334和336。衔接子334和336反而可以连接至巢式PCR的产物,以产生经衔接子标记的扩增子338。
如步骤4所示,来自步骤3的PCR产物可以使用文库扩增引物进行PCR扩增以用于测序。具体地,衔接子334和336可以用于对衔接子标记的扩增子338进行一种或多种另外的测定。衔接子334和336可以与引物340和342杂交。一个或多个引物340和342可以是PCR扩增引物。一个或多个引物340和342可以是测序引物。一个或多个衔接子334和336可以用于进一步扩增经衔接子标记的扩增子338。一个或多个衔接子334和336可以用于对经衔接子标记的扩增子338进行测序。引物342可以包含板索引344,从而可以使用下一代测序(NGS)在一个测序反应中对使用同一组条形码或随机条形码310产生的扩增子进行测序。
包含与寡核苷酸关联的细胞组分结合试剂的组合物
本文披露的一些实施例提供了多个组合物,其各自包含与寡核苷酸缀合的细胞组分结合试剂(例如蛋白质结合试剂),其中寡核苷酸包含与其缀合的细胞组分结合试剂的独特标识。在一些实施例中,细胞组分结合试剂能够与细胞组分靶特异性结合。例如,细胞组分结合试剂的结合靶可以是或可以包含碳水化合物、脂质、蛋白质、细胞外蛋白质、细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素、细胞内蛋白质或其任何组合。在一些实施例中,细胞组分结合试剂(例如蛋白质结合试剂)能够特异性结合抗原靶或蛋白质靶。在一些实施例中,每个寡核苷酸可包含条形码,例如随机条形码。条形码可包含条形码序列(例如,分子标记)、细胞标记、样品标记或其任何组合。在一些实施例中,每个寡核苷酸可包含接头。在一些实施例中,每个寡核苷酸可包含寡核苷酸探针的结合位点,例如聚(A)尾。例如,聚(A)尾可以例如不锚定在固体支持物上或锚定在固体支持物上。聚(A)尾的长度可以是约10至50个核苷酸。在一些实施例中,聚(A)尾的长度可以是18个核苷酸。寡核苷酸可包含脱氧核糖核苷酸、核糖核苷酸或两者。
独特标识可以是例如具有任何合适长度的核苷酸序列,例如约4个核苷酸至约200个核苷酸。在一些实施例中,独特标识是长度是25个核苷酸至约45个核苷酸的核苷酸序列。在一些实施例中,独特标识的长度可以是,约是,小于,大于4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、55个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、200个核苷酸或以上值中的任何两个之间的范围。
在一些实施例中,独特标识是从独特标识的多样化组中选择的。独特标识的多样化组可以包含或包含约20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000或5000个或这些值中任何两个之间的数字或范围的不同的独特标识。独特标识的多样化组可以包含至少或包含至多20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000或5000个不同的独特标识。在一些实施例中,独特标识的组被设计成与待分析样品的DNA或RNA序列具有最小的序列同源性。在一些实施例中,独特标识的组的序列彼此或与其互补链相差或相差约1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸或这些值中任何两个之间的数字或范围。在一些实施例中,独特标识的组的序列彼此或与其互补链相差至少或相差至多1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸。在一些实施例中,独特标识的组的序列彼此或与其互补链相差至少3%、至少5%、至少8%、至少10%、至少15%、至少20%或更高。
在一些实施例中,独特标识可包含引物(例如通用引物)的结合位点。在一些实施例中,独特标识可包含引物(例如通用引物)的至少两个结合位点。在一些实施例中,独特标识可包含引物(例如通用引物)的至少三个结合位点。引物可用于例如通过PCR扩增独特标识符。在一些实施例中,引物可用于巢式PCR反应。
在本披露中考虑了任何合适的细胞组分结合试剂,例如蛋白质结合试剂、抗体或其片段、适体、小分子、配体、肽、寡核苷酸等、或其任何组合。在一些实施例中,细胞组分结合试剂可以是多克隆抗体、单克隆抗体、重组抗体、单链抗体(sc-Ab)或其片段,例如Fab、Fv等。在一些实施例中,多个细胞组分结合试剂可包含或包含约20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、5000个或这些值中的任何两个之间的数字或范围的不同的细胞组分试剂。在一些实施例中,多个细胞组分结合试剂可包含至少或包含至多20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、或5000个不同的细胞组分试剂。
寡核苷酸可以通过各种机制与细胞组分结合试剂缀合。在一些实施例中,寡核苷酸可以与细胞组分结合试剂共价缀合。在一些实施例中,寡核苷酸可以与细胞组分结合试剂非共价缀合。在一些实施例中,寡核苷酸通过接头与细胞组分结合试剂缀合。接头可以是例如可与细胞组分结合试剂和/或寡核苷酸可切割或可分离的。在一些实施例中,接头可以包含化学基团,所述化学基团将寡核苷酸可逆地连接至细胞组分结合试剂。化学基团可以例如通过胺基团缀合至接头。在一些实施例中,接头可包含化学基团,所述化学基团与缀合至细胞组分结合试剂的另一个化学基团形成稳定的键。例如,化学基团可以是UV光可切割基团、二硫键、链霉亲和素、生物素、胺等。在一些实施例中,化学基团可以通过氨基酸(例如赖氨酸)或N末端上的伯胺与细胞组分结合试剂缀合。可以使用市售的缀合试剂盒,例如蛋白质-寡核苷酸缀合试剂盒(苏鲁接头公司(Solulink,Inc.),加利福尼亚州圣地亚哥),寡核苷酸缀合系统(英诺华生物科学公司(Innova Biosciences),剑桥,英国)等将寡核苷酸缀合至细胞组分结合试剂。
寡核苷酸可以与细胞组分结合试剂(例如蛋白质结合试剂)的任何合适的位点缀合,只要它不干扰细胞组分结合试剂与其细胞组分靶之间的特异性结合即可。在一些实施例中,细胞组分结合试剂是蛋白质,例如抗体。在一些实施例中,细胞组分结合试剂不是抗体。在一些实施例中,寡核苷酸可以在除抗原结合位点以外的任何地方与抗体缀合,例如Fc区,CH1结构域,CH2结构域,CH3结构域,CL结构域等。例如美国专利号6,531,283(其内容特此通过引用明确地全文并入本文)先前已披露了将寡核苷酸与细胞组分结合试剂(例如抗体)缀合的方法。寡核苷酸对细胞组分结合试剂的化学计量可以改变。为了增加在测序中检测细胞组分结合试剂特异性寡核苷酸的灵敏度,增加缀合过程中寡核苷酸与细胞组分结合试剂的比例可能是有利的。在一些实施例中,每个细胞组分结合试剂可以与单个寡核苷酸分子缀合。在一些实施例中,每个细胞组分结合试剂可以与一个以上的寡核苷酸分子缀合,例如至少或至多2、3、4、5、10、20、30、40、50、100、1000个或者这些值中任意两个之间的数字或范围的寡核苷酸分子,其中每个寡核苷酸分子都包含相同或不同的独特标识。在一些实施例中,每个细胞组分结合试剂可以与一个以上的寡核苷酸分子缀合,例如至少或至多2、3、4、5、10、20、30、40、50、100、1000个寡核苷酸分子,其中每个寡核苷酸分子都包含相同或不同的独特标识。
在一些实施例中,多个细胞组分结合试剂能够特异性结合样品中的多个细胞组分靶,例如单细胞、多个细胞、组织样品、肿瘤样品、血液样品、或类似物。在一些实施例中,多个细胞组分靶包括细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体、或其任何组合。在一些实施例中,多个细胞组分靶可以包含细胞内细胞组分。在一些实施例中,多个细胞组分靶可以包含细胞内细胞组分。在一些实施例中,多个细胞组分可以是或约是细胞或生物中所有细胞组分(例如,蛋白质)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或这些值中任意两个之间的数字或范围。在一些实施例中,多个细胞组分可以是细胞或生物中所有细胞组分(例如,蛋白质)的至少或至多1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、或99%。在一些实施例中,多个细胞组分靶可以包含或包含约2、3、4、5、10、20、30、40、50、100、1000、10000个或这些值中任意两个之间的数值或范围的不同的细胞组分靶。在一些实施例中,多个细胞组分靶可包含至少或包含至多2、3、4、5、10、20、30、40、50、100、1000、10000个不同的细胞组分靶。
图4显示了示例性细胞组分结合试剂例如抗体的示意图,所述抗体与包含所述抗体的独特标识序列的寡核苷酸缀合。与细胞组分结合试剂缀合的寡核苷酸、用于与细胞组分结合试剂缀合的寡核苷酸或先前与细胞组分结合试剂缀合的寡核苷酸在本文中可被称为抗体寡核苷酸(简称为结合试剂寡核苷酸)。在本文中可以将与抗体缀合的寡核苷酸,用于与抗体缀合的寡核苷酸或先前与抗体缀合的寡核苷酸称为抗体寡核苷酸(缩写为“AbOligo”或“AbO”)。寡核苷酸还可包含其他组分,包括但不限于一个或多个接头、抗体的一个或多个独特标识、任选地一个或多个条形码序列(例如,分子标记)和聚(A)尾。在一些实施例中,寡核苷酸从5’至3’可包含接头、独特标识,条形码序列(例如分子标记)和聚(A)尾。抗体寡核苷酸可以是mRNA模拟物。
图5显示了示例性细胞组分结合试剂例如抗体的示意图,所述抗体与包含所述抗体的独特标识序列的寡核苷酸缀合。细胞组分结合试剂可以能够特异性结合至少一个细胞组分靶,例如抗原靶或蛋白质靶。结合试剂寡核苷酸(例如,样品索引寡核苷酸或抗体寡核苷酸)可包含用于执行本披露的方法的序列(例如,样品索引序列)。例如,样品索引寡核苷酸可以包含用于鉴定样品的一个或多个细胞的样品来源的样品索引序列。包含细胞组分结合试剂的多个组合物中的至少两个包含两个细胞组分结合试剂的组合物(例如样品索引组合物)的索引序列(例如样品索引序列)可以包含不同的序列。在一些实施例中,结合试剂寡核苷酸不与物种的基因组序列同源。结合试剂寡核苷酸可以被配置为与所述细胞组分结合试剂可分离或不可分离。
与细胞组分结合试剂缀合的寡核苷酸可以例如包含条形码序列(例如,分子标记序列)、聚(A)尾或其组合。与细胞组分结合试剂缀合的寡核苷酸可以是mRNA模拟物。在一些实施例中,样品索引寡核苷酸包含与多个条形码中的至少一个条形码的捕获序列互补的序列。条形码的靶结合区可包含捕获序列。靶结合区可例如包含聚(dT)区。在一些实施例中,与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(A)尾。样品索引寡核苷酸可以包含分子标记。
在一些实施例中,结合试剂寡核苷酸(例如,样品寡核苷酸)包含具有以下数量核苷酸长度的核苷酸序列或具有约以下数量核苷酸长度的核苷酸序列:6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000个或这些值中任何两个之间的数字或范围。在一些实施例中,结合试剂寡核苷酸包含具有至少或至多以下数量的核苷酸长度的核苷酸序列:6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、或1000。
在一些实施例中,细胞组分结合试剂包含抗体、四聚体、适体、蛋白质支架或其组合。结合试剂寡核苷酸可以例如通过接头与细胞组分结合试剂缀合。结合试剂寡核苷酸可包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至细胞组分结合试剂的分子。化学基团可以选自由以下组成的组:UV光可切割基团、二硫键、链霉亲和素、生物素、胺及其任何组合。
在一些实施例中,细胞组分结合试剂可以结合ADAM10、CD156c、ANO6、ATP1B2、ATP1B3、BSG、CD147、CD109、CD230、CD29、CD298、ATP1B3、CD44、CD45、CD47、CD51、CD59、CD63、CD97、CD98、SLC3A2、CLDND1、HLA-ABC、ICAM1、ITFG3、MPZL1、NA KATP酶α1、ATP1A1、NPTN、PMCA ATP酶、ATP2B1、SLC1A5、SLC29A1、SLC2A1、SLC44A2或其任何组合。
在一些实施例中,蛋白质靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。在一些实施例中,抗原或蛋白质靶是或包含细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素或其任何组合。抗原或蛋白质靶可以是或包含脂质、碳水化合物或其任何组合。蛋白质靶可以选自包含许多个蛋白质靶的组。抗原靶或蛋白质靶的数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000或这些值的任何两个之间的数字或范围。蛋白质靶的数量可以至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10000。
细胞组分结合试剂(例如蛋白质结合试剂)可以与具有相同序列的两个或更多个结合试剂寡核苷酸(例如样品索引寡核苷酸)关联。细胞组分结合试剂可以与具有不同序列的两个或更多个结合试剂寡核苷酸关联。与细胞组分结合试剂关联的结合试剂寡核苷酸的数量在不同的实施方式中可以不同。在一些实施例中,结合试剂寡核苷酸的数量,无论具有相同序列还是具有不同序列,可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值的任何两个之间的数字或范围。在一些实施例中,结合试剂寡核苷酸的数量可以至少或至多为1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、或1000。
包含细胞组分结合试剂的多个组合物(例如,多个样品索引组合物)可以包含一个或多个不与结合试剂寡核苷酸(例如样品索引寡核苷酸)缀合的其他细胞组分结合试剂,其在本文中也称为不含结合试剂寡核苷酸的细胞组分结合试剂(例如不含样品索引寡核苷酸的细胞组分结合试剂)。在多种实施方式中,多个组合物中的其他细胞组分结合试剂的数量可以不同。在一些实施例中,其他细胞组分结合试剂的数量可以是或约是为1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100或这些值的任何两个之间的数字或范围。在一些实施例中,其他细胞组分结合试剂的数量可以至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、或100。在一些实施例中,细胞组分结合试剂和任何其他细胞组分结合试剂可以相同。
在一些实施例中,提供了一种混合物,其包含与一个或多个结合试剂寡核苷酸(例如,样品索引寡核苷酸)缀合的一个或多个细胞组分结合试剂和不与结合试剂寡核苷酸缀合的一个或多个细胞组分结合试剂。所述混合物可以用于本文披露的方法的一些实施例中,例如以接触一个或多个样品和/或一个或多个细胞。混合物中(1)与结合试剂寡核苷酸缀合的细胞组分结合试剂的数量和(2)不与结合试剂寡核苷酸(例如样品索引寡核苷酸)或一个或多个其他结合试剂寡核苷酸缀合的另一种细胞组分结合试剂(例如同一细胞组分结合试剂)的数量的比率在不同的实施方式中可以不同。在一些实施例中,该比率可以是或约是1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99、1:100、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:2000、1:3000、1:4000、1:5000、1:6000、1:7000、1:8000、1:9000、1:10000或这些值中任何两个之间的数字或范围。在一些实施例中,该比率可以是至少或至多1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99、1:100、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:2000、1:3000、1:4000、1:5000、1:6000、1:7000、1:8000、1:9000或1:10000。
在一些实施例中,该比率可以是或约是1:1、1.1:1、1.2:1、1.3:1、1.4:1、1.5:1、1.6:1、1.7:1、1.8:1、1.9:1、2:1、2.5:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1、2000:1、3000:1、4000:1、5000:1、6000:1、7000:1、8000:1、9000:1、10000:1或这些值中任何两个之间的数字或范围。在一些实施例中,该比率可以是至少或至多1:1、1.1:1、1.2:1、1.3:1、1.4:1、1.5:1、1.6:1、1.7:1、1.8:1、1.9:1、2:1、2.5:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1、2000:1、3000:1、4000:1、5000:1、6000:1、7000:1、8000:1、9000:1、或10000:1。
细胞组分结合试剂可以与结合试剂寡核苷酸(例如,样品索引寡核苷酸)缀合或不缀合。在一些实施例中,在包含与结合试剂寡核苷酸缀合的细胞组分结合试剂和不与结合试剂寡核苷酸缀合的一个或多个细胞组分结合试剂的混合物中的与结合试剂寡核苷酸(例如样品索引寡核苷酸)缀合的细胞组分结合试剂的百分比可以是或约是0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或这些值中任何两个之间的数字或范围。在一些实施例中,在混合物中与样品索引寡核苷酸缀合的细胞组分结合试剂的百分比可以是至少或至多0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
在一些实施例中,在包含与结合试剂寡核苷酸(例如样品索引寡核苷酸)缀合的细胞组分结合试剂和不与样品索引寡核苷酸缀合的细胞组分结合试剂的混合物中不与结合剂寡核苷酸(例如样品索引寡核苷酸)缀合的细胞组分结合试剂的百分比可以是或约是0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或这些值中任何两个之间的数字或范围。在一些实施例中,混合物中不与结合试剂寡核苷酸缀合的细胞组分结合试剂的百分比可以是至少或至多0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
细胞组分混合物
在一些实施例中,细胞组分结合试剂的混合物(例如抗体混合物)可用于在本文披露的方法中增加标记灵敏度。不受任何特定理论的束缚,据信这可能是因为细胞组分表达或蛋白质表达可以在细胞类型和细胞状态之间变化,从而使得寻找标记所有细胞类型的通用细胞组分结合试剂或抗体具有挑战性。例如,细胞组分结合试剂的混合物可以用于允许对更多样品类型进行更灵敏和有效地标记。细胞组分结合试剂的混合物可以包括两个或更多个不同类型的细胞组分结合试剂,例如更广泛范围的细胞组分结合试剂或抗体。可以将标记不同细胞组分靶的细胞组分结合试剂合并在一起,以形成足以标记所有细胞类型或一个或多个目的细胞类型的混合物。
在一些实施例中,多个组合物(例如,样品索引组合物)中的每个包含细胞组分结合试剂。在一些实施例中,多个组合物中的组合物包含两个或更多个细胞组分结合试剂,其中所述两个或更多个细胞组分结合试剂中的每个与结合试剂寡核苷酸(例如,样品索引寡核苷酸)关联,其中所述至少两个或更多个细胞组分结合试剂中的至少一个能够与所述一个或多个细胞组分靶中的至少一个特异性结合。与两个或更多个细胞组分结合试剂关联的结合试剂寡核苷酸的序列可以是相同的。与两个或更多个细胞组分结合试剂关联的结合试剂寡核苷酸的序列可以包含不同的序列。多个组合物中的每个可以包含两个或更多个细胞组分结合试剂。
组合物中不同类型的细胞组分结合试剂(例如CD147抗体和CD47抗体)的数量在不同的实现方式中可以不同。具有两个或更多个不同类型的细胞组分结合试剂的组合物在本文中可以被称为细胞组分结合试剂混合物(例如,样品索引组合物混合物)。混合物中不同类型的细胞组分结合试剂的数量可以变化。在一些实施例中,混合物中不同类型的细胞组分结合试剂的数量可以是或约是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、或这些值的任何两个之间的数字或范围。在一些实施例中,混合物中不同类型的细胞组分结合试剂的数量可以是至少或至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000或100000。可以将不同类型的细胞组分结合试剂与具有相同或不同序列(例如样品索引序列)的结合试剂寡核苷酸缀合。
细胞组分靶的定量分析方法
在一些实施例中,本文披露的方法还可以用于使用本文披露的组合物和寡核苷酸探针(其可以将条形码序列(例如分子标记序列)与细胞组分结合试剂(例如蛋白质结合试剂)的寡核苷酸相关联)定量分析样品中的多个细胞组分靶(例如,蛋白质靶)。细胞组分结合试剂的寡核苷酸可以是或包含抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸、相互作用确定寡核苷酸等。在一些实施例中,样品可以是单细胞、多个细胞、组织样品、肿瘤样品、血液样品等。在一些实施例中,样品可包含细胞类型(例如正常细胞、肿瘤细胞、血细胞、B细胞、T细胞、母体细胞、胎儿细胞等)的混合物,或来自不同受试者的细胞混合物。
在一些实施例中,样品可以包含分离进入单独隔室(例如微孔阵列中的微孔)的多个单细胞。
在一些实施例中,多个细胞组分靶的结合靶(即,细胞组分靶)可以是或包含碳水化合物、脂质、蛋白质、细胞外蛋白质、细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整合素、细胞内蛋白质或其任何组合。在一些实施例中,细胞组分靶是蛋白质靶。在一些实施例中,多个细胞组分靶包括细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体、或其任何组合。在一些实施例中,多个细胞组分靶可以包含细胞内细胞组分。在一些实施例中,多个细胞组分可以是生物中所有编码的细胞组分中的至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%、或更多。在一些实施例中,多个细胞组分靶可以包含至少2个、至少3个、至少4个、至少5个、至少10个、至少20个、至少30个、至少40个、至少50、至少100个、至少1000个、至少10000个或更多个不同的细胞组分靶。
在一些实施例中,多个细胞组分结合试剂与样品接触,以与多个细胞组分靶特异性结合。未结合的细胞组分结合试剂可以例如通过洗涤去除。在样品包含细胞的实施例中,可以去除未与细胞特异性结合的任何细胞组分结合试剂。
在一些情况下,可以将来自细胞群的细胞分开(例如分离)进入本披露的基底的孔中。可以在分离之前稀释细胞群。可以稀释细胞群,以使基底的至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的孔接收单细胞。可以稀释细胞群,以使基底的至多1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的孔接收单细胞。可以稀释细胞群,使得稀释的群中的细胞数量是或至少是基底上孔数量的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。可以稀释细胞群,使得稀释的群中的细胞数量是或至少是基底上孔数量的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些情况下,稀释细胞群以使细胞数量是基底中孔数量的约10%。
单细胞向基板的孔中的分布可以遵循泊松分布。例如,可能存在至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、或10%或更高的概率在基板的一个孔中有多个细胞。可能存在至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、或10%或更高的概率在基板的一个孔中有多个细胞。单细胞向基板的孔中的分布可以是随机的。单细胞向基板的孔中的分布可以是非随机的。可以分离细胞,使得基板的孔仅接收一个细胞。
在一些实施例中,细胞组分结合试剂可以另外与荧光分子缀合,以使得能够将细胞流分选到各个隔室中。
在一些实施例中,本文披露的方法提供了使多个组合物与样品接触以与多个细胞组分靶特异性结合。应当理解,所使用的条件可以允许细胞组分结合试剂例如抗体与细胞组分靶特异性结合。接触步骤之后,可以去除未结合的组合物。例如,在样品包含细胞且组合物与细胞组分靶(其是细胞表面细胞组分如细胞表面蛋白质)特异性结合的实施例中,未结合的组合物可通过用缓冲液洗涤细胞而去除,从而仅与细胞组分靶特异性结合的组合物保留在细胞中。
在一些实施例中,本文披露的方法可包括将寡核苷酸(例如,条形码或随机条形码)(所述寡核苷酸包括条形码序列(例如分子标记)、细胞标记、样品标记等或其任何组合)与跟细胞组分结合试剂关联的多个寡核苷酸关联。例如,包含条形码的多个寡核苷酸探针可用于与组合物的多个寡核苷酸杂交。
在一些实施例中,多个寡核苷酸探针可以固定在固体支持物上。固体支持物可以自由漂浮,例如溶液中的珠。固体支持物可以被嵌入在半固体或固体阵列中。在一些实施例中,多个寡核苷酸探针可以不固定在固体支持物上。当多个寡核苷酸探针非常接近与细胞组分结合试剂的寡核苷酸相关联的多个寡核苷酸时,细胞组分结合试剂的多个寡核苷酸可以与寡核苷酸探针杂交。寡核苷酸探针可以以不消耗的比率接触,使得细胞组分结合试剂的每个不同的寡核苷酸可以与具有本披露的不同条形码序列(例如,分子标记)的寡核苷酸探针关联。
在一些实施例中,本文披露的方法提供了将寡核苷酸与特异性结合至细胞组分靶的细胞组分结合试剂分离。分离可以以多种方式进行以将化学基团与细胞组分结合试剂分离,例如UV光切割、化学处理(例如二硫苏糖醇处理)、加热、酶处理或其任何组合。将寡核苷酸与细胞组分结合试剂分离可以在使多个寡核苷酸探针与组合物的多个寡核苷酸杂交的步骤之前、之后或过程中进行。
同时定量分析细胞组分和核酸靶的方法
在一些实施例中,本文披露的方法还可用于使用本文披露的组合物和寡核苷酸探针(其可以将条形码序列(例如分子标记序列)与细胞组分结合试剂的寡核苷酸和核酸靶分子两者相关联)同时定量分析样品中的多个细胞组分靶(例如蛋白质靶)和多个核酸靶分子。在2017年9月25日提交的美国专利申请号15/715028中描述了同时定量分析多个细胞组分靶和多个核酸靶分子的其他方法;其内容通过引用整体并入本文。在一些实施例中,样品可以是单细胞、多个细胞、组织样品、肿瘤样品、血液样品等。在一些实施例中,样品可包含细胞类型(例如正常细胞、肿瘤细胞、血细胞、B细胞、T细胞、母体细胞、胎儿细胞)的混合物,或来自不同受试者的细胞混合物。
在一些实施例中,样品可以包含分离进入单独隔室(例如微孔阵列中的微孔)的多个单细胞。
在一些实施例中,多个细胞组分靶包括细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体、或其任何组合。在一些实施例中,多个细胞组分靶可以包含细胞内细胞组分。在一些实施例中,多个细胞组分可以是或约是生物体中或生物体的一个或多个细胞中的所有细胞组分(例如表达的蛋白质)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或这些值中任意两个之间的数值或范围。在一些实施例中,多个细胞组分可以是生物体中或生物体的一个或多个细胞中的所有细胞组分(例如表达的蛋白质)的至少或至多1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或这些值中任意两个之间的数值或范围。在一些实施例中,多个细胞组分靶可以包含或包含约2、3、4、5、10、20、30、40、50、100、1000、10000个或这些值中任意两个之间的数字或范围的不同的细胞组分靶。在一些实施例中,多个细胞组分靶可包含至少或包含至多2、3、4、5、10、20、30、40、50、100、1000或10000个不同的细胞组分靶。
在一些实施例中,多个细胞组分结合试剂与样品接触,以与多个细胞组分靶特异性结合。未结合的细胞组分结合试剂可以例如通过洗涤去除。在样品包含细胞的实施例中,可以去除未与细胞特异性结合的任何细胞组分结合试剂。
在一些情况下,可以将来自细胞群的细胞分开(例如分离)进入本披露的基底的孔中。可以在分离之前稀释细胞群。可以稀释细胞群,以使基底的至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的孔接收单细胞。可以稀释细胞群,以使基底的至多1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的孔接收单细胞。可以稀释细胞群,使得稀释的群中的细胞数量是或至少是基底上孔数量的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。可以稀释细胞群,使得稀释的群中的细胞数量是或至少是基底上孔数量的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些情况下,稀释细胞群以使细胞数量是基底中孔数量的约10%。
单细胞向基板的孔中的分布可以遵循泊松分布。例如,可能存在至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、或10%或更高的概率在基板的一个孔中有多个细胞。可能存在至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、或10%或更高的概率在基板的一个孔中有多个细胞。单细胞向基板的孔中的分布可以是随机的。单细胞向基板的孔中的分布可以是非随机的。可以分离细胞,使得基板的孔仅接收一个细胞。
在一些实施例中,细胞组分结合试剂可以另外与荧光分子缀合,以使得能够将细胞流分选到各个隔室中。
在一些实施例中,本文披露的方法提供了使多个组合物与样品接触以与多个细胞组分靶特异性结合。应当理解,所使用的条件可以允许细胞组分结合试剂例如抗体与细胞组分靶特异性结合。接触步骤之后,可以去除未结合的组合物。例如,在样品包含细胞且组合物与细胞组分靶(其在细胞表面如细胞表面蛋白质)特异性结合的实施例中,未结合的组合物可通过用缓冲液洗涤细胞而去除,从而仅与细胞组分靶特异性结合的组合物保留在细胞中。
在一些实施例中,本文披露的方法可以提供从样品例如细胞释放多个核酸靶分子。例如,可以裂解细胞以释放多个核酸靶分子。细胞裂解可以通过多种手段中的任何一种来完成,例如,通过化学处理、渗透压休克、热处理、机械处理、光学处理或其任何组合。细胞可以通过添加以下各项来裂解:包含洗涤剂(例如SDS、十二烷基硫酸锂、Triton X-100、吐温-20或NP-40)的细胞裂解缓冲液、有机溶剂(例如甲醇或丙酮)或消化酶(例如蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合。
本领域普通技术人员将理解,多个核酸分子可包含多种核酸分子。在一些实施例中,多个核酸分子可以包含DNA分子、RNA分子、基因组DNA分子、mRNA分子、rRNA分子、siRNA分子或其组合,并且可以是双链或单链的。在一些实施例中,多个核酸分子包含或包含约100、1000、10000、20000、30000、40000、50000、100000、1000000或这些值中的任何两个之间的数量或范围的种类。在一些实施例中,多个核酸分子包含至少或包含至多100、1000、10000、20000、30000、40000、50000、100000或1000000个种类。在一些实施例中,多个核酸分子可以来自样品,例如单细胞或多个细胞。在一些实施例中,可以从多个样品例如多个单细胞合并多个核酸分子。
在一些实施例中,本文披露的方法可以包括将条形码(例如,随机条形码)(其可以包括条形码序列(例如分子标记)、细胞标记、样品标记等,或其任何组合)与多个核酸靶分子和细胞组分结合试剂的多个寡核苷酸关联。例如,包含随机条形码的多个寡核苷酸探针可用于与多个核酸靶分子和组合物的多个寡核苷酸杂交。
在一些实施例中,多个寡核苷酸探针可以固定在固体支持物上。固体支持物可以自由漂浮,例如溶液中的珠。固体支持物可以被嵌入在半固体或固体阵列中。在一些实施例中,多个寡核苷酸探针可以不固定在固体支持物上。当多个寡核苷酸探针与多个核酸靶分子和细胞组分结合试剂的多个寡核苷酸非常接近时,多个核酸靶分子和细胞组分结合试剂的多个寡核苷酸可以与寡核苷酸探针杂交。寡核苷酸探针可以以不消耗的比率接触,使得每个不同的核酸靶分子和细胞组分结合试剂的寡核苷酸可以与具有本披露的具有不同条形码序列(例如,分子标记)的寡核苷酸探针关联。
在一些实施例中,本文披露的方法提供了将寡核苷酸与特异性结合至细胞组分靶的细胞组分结合试剂分离。分离可以以多种方式进行以将化学基团与细胞组分结合试剂分离,例如UV光切割、化学处理(例如二硫苏糖醇处理)、加热、酶处理或其任何组合。使寡核苷酸与细胞组分结合试剂分离可以在使多个寡核苷酸探针与多个核酸靶分子和组合物的多个寡核苷酸杂交的步骤之前、之后或过程中进行。
同时定量分析蛋白质和核酸靶
在一些实施例中,本文披露的方法也可以用于同时定量分析多种类型的靶分子,例如蛋白质和核酸靶。例如,靶分子可以是或包含细胞组分。图6示出了在单细胞中同时定量分析核酸靶和其他细胞组分靶(例如蛋白质)的示例性方法的示意图。在一些实施例中,提供了多个组合物605、605b、605c等,每个组合物包含细胞组分结合试剂,例如抗体。与不同细胞组分靶结合的不同细胞组分结合试剂,例如抗体,与不同的独特标识缀合。接下来,可以将细胞组分结合试剂与包含多个细胞610的样品一起孵育。不同的细胞组分结合试剂可以特异性结合细胞表面的细胞组分,例如细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体、或其任何组合。可以例如通过用缓冲液洗涤细胞来去除未结合的细胞组分结合试剂。然后可以将具有细胞组分结合试剂的细胞分开进入多个隔室,例如微孔阵列,其中单隔室615的大小适合单细胞和单珠620。每个珠可包含多个寡核苷酸探针,其可包含珠上所有寡核苷酸探针所共同的细胞标记,和条形码序列(例如分子标记序列)。在一些实施例中,每个寡核苷酸探针可包含靶结合区,例如聚(dT)序列。可以使用化学、光学或其他手段将缀合至细胞组分结合试剂的寡核苷酸625与细胞组分结合试剂分离。可以裂解635细胞以释放细胞内的核酸,例如基因组DNA或细胞mRNA 630。细胞mRNA 630、寡核苷酸625或两者均可被珠620上的寡核苷酸探针捕获,例如,通过与聚(dT)序列杂交。逆转录酶可以用于以细胞mRNA 630和寡核苷酸625为模板来延伸与细胞mRNA 630和寡核苷酸625杂交的寡核苷酸探针。由逆转录酶产生的延伸产物可以进行扩增和测序。可以使测序读数经受序列的多路解析或对细胞标记、条形码(例如分子标记)、基因、细胞组分结合试剂特异性寡核苷酸(例如抗体特异性寡核苷酸)等进行鉴定,从而产生样品中每个单细胞的细胞组分和基因表达的数字表示。
条形码的关联
与细胞组分结合试剂(例如,抗原结合试剂或蛋白质结合试剂)和/或核酸分子关联的寡核苷酸可以与寡核苷酸探针随机结合。与细胞组分结合试剂关联的寡核苷酸,在本文中称为结合试剂寡核苷酸,可以是或包含本披露的寡核苷酸,例如抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸、相互作用确定寡核苷酸等等。例如,关联可以包括寡核苷酸探针的靶结合区与靶核酸分子的互补部分和/或蛋白质结合试剂的寡核苷酸的杂交。例如,条形码(例如,随机条形码)的寡(dT)区可以与靶核酸分子的聚(A)尾和/或蛋白质结合试剂的寡核苷酸的聚(A)尾相互作用。用于杂交的测定条件(例如缓冲液pH、离子强度、温度等)可以被选择以促进特定的稳定性杂交体的形成。
本披露提供了使用逆转录将分子标记与靶核酸和/或与细胞组分结合试剂关联的寡核苷酸相关联的方法。作为逆转录酶,可以同时使用RNA和DNA作为模板。例如,最初缀合在细胞组分结合试剂上的寡核苷酸可以是RNA或DNA碱基,或两者。除了结合试剂序列的序列或其部分之外,可以复制结合试剂寡核苷酸并将其连接(例如,共价连接)至细胞标记和条形码序列(例如,分子标记)。作为另一个实例,除了mRNA分子或其部分的序列之外,可以复制mRNA分子并将其连接(例如,共价连接)至细胞标记和条形码序列(例如,分子标记)。
在一些实施例中,分子标记可以通过寡核苷酸探针靶结合区和靶核酸分子的一部分和/或与(例如,当前或先前与)细胞组分结合试剂关联的寡核苷酸连接来添加。例如,靶结合区可以包含可以能够特异性杂交到限制位点突出端(例如EcoRI粘性突出端)上的核酸序列。所述方法可以进一步包括用限制酶(例如,EcoRI)处理与细胞组分结合试剂关联的靶核酸和/或寡核苷酸,以产生限制位点突出端。连接酶(例如T4 DNA连接酶)可以用于接合两个片段。
确定独特的分子标记序列的数量或存在
在一些实施例中,本文披露的方法包括确定每个独特标识、每个核酸靶分子和/或每个结合试剂寡核苷酸(例如抗体寡核苷酸)的独特分子标记序列的数量或存在。例如,测序读数可用于确定每个独特标识、每个核酸靶分子和/或每个结合试剂寡核苷酸的独特分子标记序列的数量。作为另一个实例,测序读数可用于确定分子标记序列(例如与靶、结合试剂寡核苷酸、抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸、相互作用确定寡核苷酸等等关联的分子标记序列)的存在与否。
在一些实施例中,每个独特标识、每个核酸靶分子和/或每个结合试剂寡核苷酸的独特分子标记序列的数量指示样品中的每个细胞组分靶(例如抗原靶或蛋白质靶)和/或每个核酸靶分子的数量。在一些实施例中,可以将细胞组分靶的数量及其相应的核酸靶分子例如mRNA分子的数量相互比较。在一些实施例中,可以计算细胞组分靶的数量与其相应的核酸靶分子例如mRNA分子的数量的比率。细胞组分靶可以是例如细胞表面蛋白质标志物。在一些实施例中,细胞表面蛋白质标志物的蛋白质水平与细胞表面蛋白质标志物的mRNA水平之间的比率低。
本文披露的方法可以用于多种应用。例如,本文披露的方法可以用于样品的蛋白质组和/或转录组分析。在一些实施例中,本文披露的方法可用于鉴定样品中的细胞组分靶和/或核酸靶,即生物标志物。在一些实施例中,细胞组分靶和核酸靶彼此对应,即,核酸靶编码细胞组分靶。在一些实施例中,本文披露的方法可用于鉴定细胞组分靶的量与在样品中其相应的核酸靶分子例如mRNA分子的量之间具有所需比率的细胞组分靶。在一些实施例中,所述比率是或约是0.001、0.01、0.1、1、10、100、1000或以上值中的任何两个之间的数值或范围。在一些实施例中,所述比率是至少或至多为0.001、0.01、0.1、1、10、100或1000。在一些实施例中,本文披露的方法可用于鉴定样品中的细胞组分靶,所述细胞组分靶的相应核酸靶分子在样品中的量是或约是1000、100、10、5、2 1、0或这些值中任何两个之间的数字或范围。在一些实施例中,本文披露的方法可以用于鉴定样品中的细胞组分靶,所述细胞组分靶的相应核酸靶分子在样品中的量大于或小于1000、100、10、5、2 1、0。
组合物和试剂盒
本文披露的一些实施例提供了试剂盒和组合物,用于同时定量分析样品中的多个细胞组分(例如蛋白质)和/或多个核酸靶分子。在一些实施例中,试剂盒和组合物可包含各自与寡核苷酸(其中所述寡核苷酸包含细胞组分结合试剂的独特标识)缀合的多个细胞组分结合试剂(例如,多个蛋白质结合试剂)以及多个寡核苷酸探针,其中所述多个寡核苷酸探针中的每个包含靶结合区、条形码序列(例如,分子标记序列),其中所述条形码序列来自独特标识的多样化组。在一些实施例中,每个寡核苷酸可包含分子标记、细胞标记、样品标记或其任何组合。在一些实施例中,每个寡核苷酸可包含接头。在一些实施例中,每个寡核苷酸可包含寡核苷酸探针的结合位点,例如聚(A)尾。例如,聚(A)尾可以是例如寡dA18(不锚定在固体支持物上)或寡A18V(锚定在固体支持物上)。寡核苷酸可包含DNA残基、RNA残基或两者。
本文的披露包括多个样品索引组合物。多个样品索引组合物中的每个可以包含两个或更多个细胞组分结合试剂。所述两个或更多个细胞组分结合试剂中的每个可以与样品索引寡核苷酸关联。所述两个或更多个细胞组分结合试剂中的至少一个能够与至少一个细胞组分靶特异性结合。所述样品索引寡核苷酸可以包含用于鉴定样品的一个或多个细胞的样品来源的样品索引序列。所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列可以包含不同的序列。
本文的披露包括包含对照颗粒组合物的试剂盒。在一些实施例中,对照颗粒组合物包含与对照颗粒关联的多个对照颗粒寡核苷酸,其中所述多个对照颗粒寡核苷酸中的每个包含对照条形码序列和聚(dA)区。所述多个对照颗粒寡核苷酸中的至少两个可以包含不同的对照条形码序列。所述对照颗粒寡核苷酸可以包含分子标记序列。所述对照颗粒寡核苷酸可以包含通用引物的结合位点。本文的披露还包括用于测序对照的试剂盒。在一些实施例中,试剂盒包含:对照颗粒组合物,其包含与对照颗粒关联的多个对照颗粒寡核苷酸,其中所述多个对照颗粒寡核苷酸中的每个包含对照条形码序列和聚(dA)区。
本文的披露包括试剂盒,所述试剂盒包含用于测序对照的多个对照组合物。在一些实施例中,多个对照组合物中的每个包含与对照寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与多个结合靶中的至少一个特异性结合,并且其中对照寡核苷酸包含对照条形码序列和伪靶区,所述伪靶区包含与多个条形码中的至少一个的靶结合区基本互补的序列。在一些实施例中,伪靶区包含聚(dA)区。
本文的披露包括试剂盒,所述试剂盒包含用于细胞鉴定的样品索引组合物。在一些实施例中。两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂(例如蛋白质结合试剂),其中细胞组分结合试剂能够与一个或多个细胞组分靶(例如一个或多个蛋白质靶)中的至少一个特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两个样品索引组合物的样品索引序列包含不同的序列。在一些实施例中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点、或其组合。
本文披露包括用于细胞鉴定的试剂盒。在一些实施例中,试剂盒包含:两个或更多个样品索引组合物。两个或更多个样品索引组合物中的每个可以包含与样品索引寡核苷酸关联的细胞组分结合试剂(例如抗原结合试剂),其中细胞组分结合试剂能够与一个或多个细胞组分靶中的至少一个特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两个样品索引组合物的样品索引序列包含不同的序列。在一些实施例中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点、或其组合。本文披露包括用于多重态鉴定的试剂盒。在一些实施例中,试剂盒包含两个样品索引组合物。两个样品索引组合物中的每个可以包含与样品索引寡核苷酸关联的细胞组分结合试剂(例如抗原结合试剂),其中抗原结合试剂能够与一个或多个细胞组分靶(例如抗原靶)中的至少一个特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两个样品索引组合物的样品索引序列包含不同的序列。
本文披露包括用于鉴定细胞组分例如蛋白质-蛋白质之间的相互作用的试剂盒。在一些实施例中,试剂盒包含:第一对相互作用确定组合物,其中所述第一对相互作用确定组合物的每个包含与相互作用确定寡核苷酸关联的蛋白质结合试剂,其中所述第一对相互作用确定组合物中的一个的蛋白质结合试剂能够与第一蛋白质靶特异性结合并且所述第一对相互作用确定组合物中的另一个的蛋白质结合试剂能够与所述第二蛋白质靶特异性结合,其中所述相互作用确定寡核苷酸包含相互作用确定序列和桥寡核苷酸杂交区,并且其中所述第一对相互作用确定组合物的相互作用确定序列包含不同的序列;以及多个桥寡核苷酸,其各自包含能够与所述第一对相互作用确定组合物的桥寡核苷酸杂交区特异性结合的两个杂交区。
独特标识(或与细胞组分结合试剂关联的寡核苷酸,例如结合试剂寡核苷酸、抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸或相互作用确定寡核苷酸)可以具有任何合适的长度,例如从约25个核苷酸长到约45个核苷酸长。在一些实施例中,独特标识的长度可以是,约是,小于,大于4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、55个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、200个核苷酸或以上值中的任何两个之间的范围。
在一些实施例中,独特标识是从独特标识的多样化组中选择的。独特标识的多样化组可以包含或包含约20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000或5000个或这些值中任何两个之间的数字或范围的不同的独特标识。独特标识的多样化组可以包含至少或包含至多20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000或5000个不同的独特标识。在一些实施例中,独特标识的组被设计成与待分析样品的DNA或RNA序列具有最小的序列同源性。在一些实施例中,独特标识的组的序列彼此或与其互补链相差或相差约1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸或这些值中任何两个之间的数字或范围。在一些实施例中,独特标识的组的序列彼此或与其互补链相差至少或相差至多1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸或10个核苷酸。
在一些实施例中,独特标识可包含引物(例如通用引物)的结合位点。在一些实施例中,独特标识可包含引物(例如通用引物)的至少两个结合位点。在一些实施例中,独特标识可包含引物(例如通用引物)的至少三个结合位点。引物可用于例如通过PCR扩增独特标识符。在一些实施例中,引物可用于巢式PCR反应。
在本披露中考虑了任何合适的细胞组分结合试剂,例如任何蛋白质结合试剂(例如抗体或其片段、适体、小分子、配体、肽、寡核苷酸等、或其任何组合)。在一些实施例中,细胞组分结合试剂可以是多克隆抗体、单克隆抗体、重组抗体、单链抗体(scAb)或其片段,例如Fab、Fv等。在一些实施例中,多个蛋白质结合试剂可包含或包含约20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、5000个或这些值中的任何两个之间的数字或范围的不同的蛋白质结合试剂。在一些实施例中,多个蛋白质结合试剂可包含至少或包含至多20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、或5000个不同的蛋白质结合试剂。
在一些实施例中,寡核苷酸通过接头与细胞组分结合试剂缀合。在一些实施例中,寡核苷酸可以与蛋白质结合试剂共价缀合。在一些实施例中,寡核苷酸可以与蛋白质结合试剂非共价缀合。在一些实施例中,接头可以包含化学基团,所述化学基团将寡核苷酸可逆地或不可逆地连接至蛋白质结合试剂。化学基团可以例如通过胺基团缀合至接头。在一些实施例中,接头可包含化学基团,所述化学基团与缀合至蛋白质结合试剂的另一个化学基团形成稳定的键。例如,化学基团可以是UV光可切割基团、二硫键、链霉亲和素、生物素、胺等。在一些实施例中,化学基团可以通过氨基酸(例如赖氨酸)或N末端上的伯胺与蛋白质结合试剂缀合。寡核苷酸可以与蛋白质结合试剂的任何合适的位点缀合,只要它不干扰蛋白质结合试剂与其蛋白质靶之间的特异性结合即可。在蛋白质结合试剂是抗体的实施例中,寡核苷酸可以在除抗原结合位点以外的任何地方与抗体缀合,例如Fc区,CH1结构域,CH2结构域,CH3结构域,CL结构域等。在一些实施例中,每个蛋白质结合试剂可以与单个寡核苷酸分子缀合。在一些实施例中,每个蛋白质结合试剂可以与以下数量或约以下数量的寡核苷酸分子缀合:2、3、4、5、10、20、30、40、50、100、1000或这些值中的任何两个之间的数量或范围,其中每个寡核苷酸分子包含相同的独特标识。在一些实施例中,每个蛋白质结合试剂可以与一个以上的寡核苷酸分子缀合,例如至少或至多2、3、4、5、10、20、30、40、50、100或1000个寡核苷酸分子,其中每个寡核苷酸分子包含相同的独特标识。
在一些实施例中,多个细胞组分结合试剂(例如,蛋白质结合试剂)能够特异性地结合样品中的多个细胞组分靶(例如,蛋白质靶)。样品可以是或包含单细胞、多个细胞、组织样品、肿瘤样品、血液样品等。在一些实施例中,多个细胞组分靶包括细胞表面蛋白质、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体、或其任何组合。在一些实施例中,多个细胞组分靶可以包含细胞内蛋白质。在一些实施例中,多个细胞组分靶可以包含细胞内蛋白质。在一些实施例中,多个细胞组分靶可以是或是约生物中所有细胞组分靶(例如,表达的或将会表达的蛋白质)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或这些值中任意两个之间的数字或范围。在一些实施例中,多个细胞组分靶可以是生物中所有细胞组分靶(例如,表达的或将会表达的蛋白质)的至少或至多1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、或99%。在一些实施例中,多个细胞组分靶可以包含或包含约2、3、4、5、10、20、30、40、50、100、1000、10000个或这些值中任意两个之间的数字或范围的不同的细胞组分靶。在一些实施例中,多个细胞组分靶可包含至少或包含至多2、3、4、5、10、20、30、40、50、100、1000或10000个不同的细胞组分靶。
使用寡核苷酸缀合的细胞组分结合试剂进行样品索引
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;去除所述多个样品索引组合物中未结合的样品索引组合物;使用多个条形码(例如,随机条形码)对所述样品索引寡核苷酸进行条形码编码(例如,随机条形码编码)以产生多个经条形码编码的样品索引寡核苷酸;获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在本文中可以将与抗体缀合的寡核苷酸,用于与抗体缀合的寡核苷酸或先前与抗体缀合的寡核苷酸称为抗体寡核苷酸(“AbOligo”)。在样品索引的情况下,抗体寡核苷酸在本文中称为样品索引寡核苷酸。与抗体寡核苷酸缀合的抗体在本文中称为热抗体或寡核苷酸抗体。不与抗体寡核苷酸缀合的抗体在本文中称为冷抗体或无寡核苷酸抗体。与结合试剂(例如,蛋白质结合试剂)缀合的寡核苷酸、用于与结合试剂缀合的寡核苷酸或先前与结合试剂缀合的寡核苷酸在本文中称为试剂寡核苷酸。在样品索引的情况下,试剂寡核苷酸在本文中称为样品索引寡核苷酸。与抗体寡核苷酸缀合的结合试剂在本文中称为热结合试剂或寡核苷酸结合试剂。不与抗体寡核苷酸缀合的结合试剂在本文中称为冷结合试剂或无寡核苷酸结合试剂。
图7显示了使用寡核苷酸缀合的细胞组分结合试剂进行样品索引的示例性工作流程的示意图。在一些实施例中,提供了多个组合物705a,705b等,每个组合物包含结合试剂。结合试剂可以是蛋白质结合试剂,例如抗体。所述细胞组分结合试剂可以包含抗体、四聚体、适体、蛋白质支架或其组合。多个组合物705a、705b的结合试剂可以结合相同的细胞组分靶。例如,多个组合物705、705b的结合试剂可以是相同的(与结合试剂关联的样品索引寡核苷酸除外)。
不同的组合物可以包括与具有不同样品索引序列的样品索引寡核苷酸缀合的结合试剂。在不同的实现方式中,不同组合物的数量可以不同。在一些实施例中,不同组合物的数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、或这些值的任何两个之间的数字或范围内。在一些实施例中,不同组合物的数量可以是至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10000。
在一些实施例中,一个组合物中结合试剂的样品索引寡核苷酸可包括相同的样品索引序列。一种组合物中结合试剂的样品索引寡核苷酸可以不同。在一些实施例中,具有相同样品索引序列的一个组合物中结合试剂的样品索引寡核苷酸的百分比可以是或约是50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或这些值中任何两个之间的数字或范围。在一些实施例中,具有相同样品索引序列的一个组合物中结合试剂的样品索引寡核苷酸的百分比可以是至少或至多50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.9%。
组合物705a和705b可用于标记不同样品的样品。例如,组合物705a中细胞组分结合试剂的样品索引寡核苷酸可具有一个样品索引序列,并可用于标记样品707a(例如患者样品)中的细胞710a,如黑色圆所示。组合物705b中的细胞组分结合试剂的样品索引寡核苷酸可具有另一个样品索引序列,并可用于标记样品707b(例如另一个患者的样品或同一患者的另一个样品)中的细胞710b,如阴影圆所示。细胞组分结合试剂可以特异性结合细胞表面的细胞组分靶或蛋白质,例如细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体、或其任何组合。可以例如通过用缓冲液洗涤细胞来去除未结合的细胞组分结合试剂。
然后可以将具有细胞组分结合试剂的细胞分开进入多个隔室,例如微孔阵列,其中单隔室715a、715b的尺寸设置为适合单细胞710a和单珠720a或单细胞710b和单珠720b。每个珠720a、720b可包含多个寡核苷酸探针,其可包含珠上所有寡核苷酸探针所共同的细胞标记,和分子标记序列。在一些实施例中,每个寡核苷酸探针可包含靶结合区,例如聚(dT)序列。与组合物705a的细胞组分结合试剂缀合的样品索引寡核苷酸725a可以被配置为与细胞组分结合试剂可分离或不可分离。可以使用化学、光学或其他手段将缀合至组合物705a的细胞组分结合试剂的样品索引寡核苷酸725a与细胞组分结合试剂分离。与组合物705b的细胞组分结合试剂缀合的样品索引寡核苷酸725b可以被配置为与细胞组分结合试剂可分离或不可分离。可以使用化学、光学或其他手段将缀合至组合物705b的细胞组分结合试剂的样品索引寡核苷酸725b与细胞组分结合试剂分离。
可以裂解细胞710a以释放细胞710a内的核酸,例如基因组DNA或细胞mRNA 730a。裂解的细胞735a显示为虚线圆。细胞mRNA730a,样品索引寡核苷酸725a或两者均可被珠720a上的寡核苷酸探针捕获,例如,通过与聚(dT)序列杂交。逆转录酶可以用于以细胞mRNA730a和寡核苷酸725a为模板来延伸与细胞mRNA 730a和寡核苷酸725a杂交的寡核苷酸探针。由逆转录酶产生的延伸产物可以进行扩增和测序。
类似地,可以裂解细胞710b以释放细胞710b内的核酸,例如基因组DNA或细胞mRNA730b。裂解的细胞735b显示为虚线圆。细胞mRNA 730b,样品索引寡核苷酸725b或两者均可被珠720b上的寡核苷酸探针捕获,例如,通过与聚(dT)序列杂交。逆转录酶可以用于以细胞mRNA 730b和寡核苷酸725b为模板来延伸与细胞mRNA 730b和寡核苷酸725b杂交的寡核苷酸探针。由逆转录酶产生的延伸产物可以进行扩增和测序。
可以使测序读数经受细胞标记、分子标记、基因身份和样品身份的多路解析(例如,根据样品索引寡核苷酸725a和725b的样品索引序列)。细胞标记、分子标记和基因身份的多路解析可以产生样品中每个单细胞的基因表达的数字表示。使用样品索引寡核苷酸的样品索引序列对细胞标记、分子标记和样品身份进行多路解析,可用于确定样品来源。
在一些实施例中,可以将针对细胞表面上的细胞组分结合试剂的细胞组分结合试剂缀合至独特样品索引寡核苷酸的文库,以使细胞保持样品身份。例如,可以将针对细胞表面标志物的抗体与独特索引寡核苷酸的文库缀合,以使细胞保持样品身份。由于在整个文库制备和测序过程中都会保留与样品来源有关的信息,因此这将使得能够多个样品装载到同一个RhapsodyTM盒中。样品索引可以使多个样品在单个实验中一起运行,从而简化和缩短实验时间,并消除批次效应。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;去除所述多个样品索引组合物中未结合的样品索引组合物。所述方法可以包括使用多个条形码(例如,随机条形码)对所述样品索引寡核苷酸进行条形码编码(例如,随机条形码编码)以产生多个经条形码编码的样品索引寡核苷酸;获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。
在一些实施例中,样品鉴定方法包括:使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触,其中所述一个或多个细胞中的每个包含一个或多个细胞组分靶,其中所述多个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分靶中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述多个样品索引组合物中的至少两个样品索引组合物的样品索引序列包含不同的序列;去除所述多个样品索引组合物中未结合的样品索引组合物;并且基于所述多个样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列,鉴定所述一个或多个细胞中的至少一个细胞的样品来源。
在一些实施例中,鉴定所述至少一个细胞的样品来源包括:使用多个条形码(例如,随机条形码)对所述多个样品索引组合物中的样品索引寡核苷酸进行条形码编码(例如,随机条形码编码),以产生多个经条形码编码的样品索引寡核苷酸;获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且基于所述多个经条形码编码的样品索引寡核苷酸中的至少一个经条形码编码的样品索引寡核苷酸的样品索引序列,鉴定所述细胞的样品来源。在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,鉴定至少一个细胞的样品来源可以包括鉴定多个样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定所述样品索引序列的存在或不存在可以包括:复制所述至少一个样品索引寡核苷酸以产生多个复制的样品索引寡核苷酸;获得所述多个复制的样品索引寡核苷酸的测序数据;并且基于所述多个样品索引寡核苷酸中的复制的样品索引寡核苷酸的样品索引序列来鉴定所述细胞的样品来源,所述样品索引序列相应于测序数据中的至少一个经条形码编码的样品索引寡核苷酸。
在一些实施例中,复制所述至少一个样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸包括:在复制至少一个经条形码编码的样品索引寡核苷酸之前,将复制衔接子连接到至少一个经条形码编码的样品索引寡核苷酸。复制至少一个经条形码编码的样品索引寡核苷酸可以包括使用连接到至少一个经条形码编码的样品索引寡核苷酸的复制衔接子来复制至少一个经条形码编码的样品索引寡核苷酸以产生多个复制的样品索引寡核苷酸。
在一些实施例中,复制所述至少一个样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸包括:在复制所述至少一个经条形码编码的样品索引寡核苷酸之前,使捕获探针与所述至少一个样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的捕获探针;并且扩展与所述样品索引寡核苷酸杂交的所述捕获探针以产生与所述捕获探针关联的样品索引寡核苷酸。复制所述至少一个样品索引寡核苷酸可以包括复制与所述捕获探针关联的样品索引寡核苷酸以产生所述多个复制的样品索引寡核苷酸。
菊花链式寡核苷酸
本文的披露包括通过使用具有长突出端(例如长度为160个或更多核苷酸)的引物进行经条形码编码的寡核苷酸的PCR扩增来延伸经条形码编码的寡核苷酸(例如样品索引寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸或与抗体缀合用于确定蛋白质表达的寡核苷酸)的系统、方法、试剂盒和组合物。此类引物的长度可以是例如200个或更多个核苷酸,例如DNA寡核苷酸,单链DNA片段或基因片段(整合DNA技术公司(Integrated DNA Technologies,Inc.)(科勒尔维尔(Coralville),爱荷华州))的单链DNA片段。经条形码编码的寡核苷酸可包含用于长引物在PCR过程中结合和延伸的共同序列(例如,长度是40个核苷酸的共同序列)。在一些实施例中,长突出端可包括二级条形码序列(例如,分子标记序列),以增加样品的复杂性。因此,经条形码编码的寡核苷酸的长度可以从例如200-300个核苷酸增加到超过400个核苷酸。这样的更长的经条形码编码的寡核苷酸可以使用例如固相可逆固定化(SPRI)_磁珠(应用生物材料公司(Applied BiologicalMaterials Inc.)(列治文(Richmond),不列颠哥伦比亚(British Columbia),加拿大))在DNA纯化过程中不断增长的大小选择中幸免。
在一些实施例中,与细胞组分结合试剂(例如,抗体分子)关联(例如,连接)的寡核苷酸在与细胞组分结合试剂解离后可以被条形码编码(例如,随机条形码编码)以产生经条形码编码的寡核苷酸。经条形码编码的寡核苷酸可以使用具有长突出端的引物进一步延长。因此,与细胞组分结合试剂关联的寡核苷酸的长度和经条形码编码的寡核苷酸的长度可能受到DNA合成技术或实验设计考虑的限制,而不限制随后的工作流程(例如,DNA纯化期间的大小选择)。一种非限制性的示例性实验设计考虑因素是,连接在细胞组分结合试剂上的长寡核苷酸对试剂结合特异性和/或功效的影响。经条形码编码的寡核苷酸的PCR菊花链式可以克服或解决DNA合成技术的局限性,同时保持抗体的特异性和/或功效。本披露的用于使用具有长突出端的引物来延长具有共同序列的经条形码编码的寡核苷酸的方法在本文中被称为使用菊花链式扩增引物以菊花链式延伸经条形码编码的寡核苷酸以产生菊花链式延长的扩增子。
本文的披露包括用于延伸样品索引寡核苷酸(或其他经条形码编码的寡核苷酸,例如对照颗粒寡核苷酸)的方法。在一些实施例中,在使来自多个样品中的每个的一个或多个细胞与多个样品索引组合物的样品索引组合物接触之后,可以使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸(参见图7)。可以使用具有长突出端的多个引物(在本文中称为菊花链式扩增引物)来扩增多个经条形码编码的样品索引寡核苷酸,以产生多个更长的扩增子(在本文中称为菊花链式延长的扩增子)。这样的更长的扩增子可以例如比经条形码编码的样品索引寡核苷酸长得多(例如长160个核苷酸)。
图8A8和图8A2显示了菊花链式的经条形码编码的寡核苷酸的示例性工作流程的示意图。在一些实施例中,样品索引组合物805可以包括与样品索引寡核苷酸825关联的细胞组分结合试剂,例如抗体。样品索引寡核苷酸825可以包括样品索引序列825s,用于与菊花链式扩增引物结合的共同区825d(在本文中称为菊花链式扩增引物结合区或序列825d)和聚(A)尾825a。在一些实施例中,用于与菊花链式扩增引物结合的共同区825d对于样品索引寡核苷酸825的所有或一些可以是相同的。在一些实施例中,不同样品索引寡核苷酸825的菊花链式扩增引物结合区825d是不同的。样品索引寡核苷酸825可以是mRNA模拟物。多个样品索引组合物中的至少两个样品索引组合物805的样品索引序列825s可以包含不同的序列。
菊花链式扩增引物结合区825d在不同的实施方式中可以不同,长度范围为10至200个核苷酸。在一些实施例中,菊花链式扩增引物结合区825d的长度可以是或约是11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190、200或这些值中任何两个之间的数字或范围的核苷酸。在一些实施例中,菊花链式扩增引物结合区825d的长度可以是至少或至多11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190或200个核苷酸。
可以使用多个条形码815(例如,与颗粒例如珠81关联的条形码815)对样品索引寡核苷酸825进行条形码编码,以产生多个经条形码编码的样品索引寡核苷酸840。在一些实施例中,条形码815可以包括用于结合至样品索引寡核苷酸825的聚(dT)区815t,任选地分子标记815m(例如,用于确定样品索引寡核苷酸的出现数)、细胞标记815c、和通用标记815u。经条形码编码的样品索引寡核苷酸840可以包括菊花链式扩增引物结合区825d的反向互补序列825d_rt。
可以使用正向和反向引物845、850(包括多个菊花链式扩增引物845)扩增经条形码编码的样品索引寡核苷酸840,以产生多个菊花链式延长的扩增子860。菊花链式扩增引物845可包含序列845d、菊花链式扩增引物结合区825d的互补序列,反向互补序列或其组合(在本文中称为经条形码编码的样品索引寡核苷酸结合区845d)。菊花链式扩增引物结合区825d和经条形码编码的样品索引寡核苷酸结合区845d可以具有相同的长度或不同的长度。菊花链式扩增引物845的经条形码编码的样品索引寡核苷酸结合区845d可以与在经条形码编码的样品索引寡核苷酸840上的其反向互补序列825d_rt结合。菊花链式扩增引物845可包括突出端区845o(当菊花链式扩增引物845结合经条形码编码的样品索引寡核苷酸850时,突出端区845o是菊花链式扩增引物845的突出端)。可以对多个菊花链式延伸的扩增子860或其一部分进行测序,以用于样品鉴定(或蛋白质表达谱,测序对照等)。如在图8A1-8A2中所示,样品索引寡核苷酸825的长度可以是200个核苷酸,经条形码编码的样品索引寡核苷酸840的长度可以是240个核苷酸,并且菊花链式延长的扩增子860的长度可以是400个核苷酸。
经条形码编码的样品索引寡核苷酸结合区845d在不同的实现方式中可以具有不同的长度,例如,长度是10至200个核苷酸。在一些实施例中,经条形码编码的样品索引寡核苷酸结合区845d的长度可以是或约是11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190、200或这些值中任何两个之间的数字或范围的核苷酸。在一些实施例中,经条形码编码的样品索引寡核苷酸结合区845d的长度可以是至少或至多为11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、110、120、130、140、150、160、170、180、190或200个核苷酸。
在一些实施例中,至少两个菊花链式扩增引物845可以包含具有相同序列的茎经条形码编码的样品索引寡核苷酸结合区845d。两个或更多个菊花链式扩增引物845可以包含具有不同序列的茎经条形码编码的样品索引寡核苷酸结合区845d。菊花链式扩增引物845中的一些或全部可包含具有相同序列的进经条形码编码的样品索引寡核苷酸结合区845d。经条形码编码的样品索引寡核苷酸结合区845d可以包含菊花链式扩增引物结合序列825d、其互补序列、其反向互补序列,或其组合。至少两个样品索引组合物805的菊花链式扩增引物结合序列825d可以包含相同序列。至少两个样品索引组合物805的菊花链式扩增引物结合序列825d可以包含不同的序列。
在一些实施例中,突出端区845o可包含条形码序列(本文称为菊花链式扩增引物条形码序列),例如分子标记。例如,两个菊花链式扩增引物845o可以包含具有相同的菊花链式扩增引物条形码序列的突出端区845o。作为另一个实例,两个菊花链式扩增引物845可以包含具有两个不同的菊花链式扩增引物条形码序列的突出端区845o。菊花链式扩增引物845的突出端区845o可包含不同的菊花链式扩增引物条形码序列。
突出端区845在不同的实施方式中可以具有不同的长度,例如,长度是50至1000个核苷酸。在一些实施例中,突出端区845的长度可以是或约是50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或这些值中任何两个之间的数字或范围的核苷酸。在一些实施例中,突出端区845可以是至少或至多50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。
菊花链式延长的扩增子860在不同的实施方式中可以具有不同的长度,例如,长度是50至1000个核苷酸。在一些实施例中,菊花链式延长的扩增子860的长度可以是或约是50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或这些值中任何两个之间的数字或范围的核苷酸。在一些实施例中,菊花链式延长的扩增子860可以是至少或至多50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。
图8B1和图8B2显示了菊花链式的经条形码编码的寡核苷酸的另一个示例性工作流程的示意图。在此工作流程中,可以将切换寡核苷酸860的反向互补序列选择性地添加到经条形码编码的样品索引寡核苷酸840中。在逆转录过程中,到达样品索引寡核苷酸824的5’末端后,酶(例如逆转录酶,例如莫洛尼鼠白血病病毒(MMLV))的末端转移酶活性会添加一些其他核苷酸(主要是脱氧胞苷)到新合成链840的3’末端。这些碱基可用作模板切换(TS)寡核苷酸860的锚定位点。在模板切换寡核苷酸860和附加的脱氧胞苷区段之间进行碱基配对后,酶将模板链从样品索引寡核苷酸825“切换”到模板切换寡核苷酸860,并继续复制到TS寡核苷酸860的5’末端。因此,所得的经条形码编码的样品索引寡核苷酸840包含样品索引寡核苷酸825和模板切换寡核苷酸860的反向互补序列。
可以使用正向和反向引物845、850扩增具有模板切换寡核苷酸860的反向互补序列的经条形码编码的样品索引寡核苷酸840,以产生具有模板切换寡核苷酸860的反向互补序列的菊花链式延长的扩增子860。两个引物之一可以结合读数1序列845r1,该序列是用于扩增的通用序列,其可以等同于图8A1-图8A2中的通用标记845u。第二引物,即菊花链式扩增引物845,可以结合至菊花链式扩增引物结合区825d的反向互补序列825d_rt。因此,可以将长尾添加到经条形码编码的样品索引寡核苷酸860。在酶促片段化、末端修复、A-加尾和任选的样品索引PCR之后,所得的扩增子可包括P5序列865p5、P7序列865p7、读数1序列815r1和读数2序列865r2,用于下一代测序(例如,使用桥扩增)。如在图8A1-8A2中所示,样品索引寡核苷酸825的长度可以是200个核苷酸,经条形码编码的样品索引寡核苷酸840的长度可以是约260个核苷酸,并且菊花链式延长的扩增子860的长度可以是超过406个核苷酸。
单细胞测序对照颗粒
本文的披露包括可用于例如单细胞测序对照的对照颗粒组合物。在一些实施例中,对照颗粒组合物包含与对照颗粒关联的多个对照颗粒寡核苷酸。与多个对照颗粒寡核苷酸关联的对照颗粒在本文中也称为官能化的对照颗粒。图9A是用多个寡核苷酸官能化的颗粒的非限制性示例性示意图。图9A显示了与对照颗粒关联的对照颗粒寡核苷酸可包含对照条形码序列和模拟mRNA聚(A)尾的聚(dA)区。对照颗粒寡核苷酸可包含分子标记序列、通用引物的结合位点或其组合。与对照颗粒关联的对照颗粒寡核苷酸可以彼此相同或不同。在一些实施例中,与对照颗粒关联的对照颗粒寡核苷酸中的至少两个具有不同的对照条形码序列。在一些实施例中,多个第一对照颗粒寡核苷酸和多个第二对照寡核苷酸与对照颗粒关联,其中第一和第二颗粒寡核苷酸具有不同的对照条形码序列。
可以用与寡核苷酸缀合的抗体将珠,例如CompBeadTM Plus(BD公司(富兰克林湖(Franklin Lake),新泽西州))官能化。CompBeads Plus的尺寸约为7.5微米,与免疫细胞的尺寸相似。当用与寡核苷酸缀合的抗体进行官能化时,CompBead Plus可用作单细胞工作流程的对照细胞或对照颗粒。AbO官能化的珠可与任何单细胞工作流程一起用作单细胞测序对照。
对照颗粒寡核苷酸
在不同的实施方式中,对照条形码序列的长度可以不同。在一些实施例中,对照条形码序列的长度是或约是6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000个或这些值中任何两个之间的数字或范围的核苷酸。在一些实施例中,对照条形码序列的长度是至少或至多6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、或1000个核苷酸。
对照颗粒寡核苷酸的长度在不同的实施方式中可以不同。在一些实施例中,对照颗粒寡核苷酸的长度是或约是25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000个或这些值中任何两个之间的数字或范围的核苷酸。在一些实施例中,对照颗粒寡核苷酸的长度是至少或至多25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、或1000个核苷酸。
在一些实施例中,多个对照颗粒寡核苷酸的数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、1000000、10000000、100000000、1000000000,或这些值的任何两个之间的数字或范围。在一些实施例中,多个对照颗粒寡核苷酸的数量可以至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、1000000、10000000、100000000或1000000000。
多个对照颗粒寡核苷酸可包含相同或不同的对照条形码序列。例如,所述多个对照颗粒寡核苷酸中的至少两个可以包含不同的对照条形码序列。在一些实施例中,多个对照颗粒寡核苷酸中的至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、1000000、10000000、100000000、或1000000000的对照条形码序列可以是相同的。在一些实施例中,多个对照颗粒寡核苷酸中的或多个对照颗粒寡核苷酸中的约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、1000000、10000000、100000000、1000000000或这些值的任何两个之间的数字或范围的对照条形码序列可以是相同的。
至少或至多以下比例的多个对照颗粒寡核苷酸中的对照条形码序列可以是相同的:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或这些值的任何两个之间的数字或范围。以下比例的多个对照颗粒寡核苷酸中的或约以下比例的多个对照颗粒寡核苷酸中的对照条形码序列可以是相同的:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或这些值中任何两个之间的数字或范围。
在一些实施例中,对照条形码序列与物种的基因组序列不同源。对照条形码序列可以与物种的基因组序列同源。所述物种可以是非哺乳动物物种。非哺乳动物物种可以是噬菌体物种。噬菌体物种可以是T7噬菌体、PhiX噬菌体或其组合。
对照颗粒
在一些实施例中,多个对照颗粒寡核苷酸中的至少一个通过接头与所述对照颗粒关联。多个对照颗粒寡核苷酸中的至少一个可以包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至多个对照颗粒寡核苷酸中的至少一个。化学基团可包含UV光可切割基团、二硫键、链霉亲和素、生物素、胺、二硫键或其任何组合。
对照颗粒的直径可以是或约是1-1000微米,例如10-100微米或7.5微米。在一些实施例中,对照颗粒的直径可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000微米,或者这些值中任何两个之间的数字或范围。在一些实施例中,对照颗粒的直径可以是至少或至多为1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000微米。
在一些实施例中,多个对照颗粒寡核苷酸固定在对照颗粒上。多个对照颗粒寡核苷酸可以部分固定在对照颗粒上。多个对照颗粒寡核苷酸可以封闭在对照颗粒中。多个对照颗粒寡核苷酸可以部分地封闭在对照颗粒中。对照颗粒可以是可破坏的。
在一些实施例中,对照颗粒可以是珠。珠可以是或包含交联琼脂糖(Sepharose)珠、链霉亲和素珠、琼脂糖珠、磁性珠、缀合的珠、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、寡(dT)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠或其任何组合。对照颗粒可以包含以下材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁体、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、胶乳、交联琼脂糖、纤维素、尼龙、硅酮或其任何组合。对照颗粒可以包含可破坏的水凝胶颗粒。
蛋白质结合试剂
在一些实施例中,对照颗粒与多个第一蛋白质结合试剂关联,并且所述多个第一蛋白质结合试剂中的至少一个与多个对照颗粒寡核苷酸中的一个关联。图9B显示了用许多被寡核苷酸官能化的抗体包被的非限制性示例性颗粒。第一蛋白质结合试剂可包含第一抗体(例如,第一抗体或第二抗体)。对照颗粒寡核苷酸可以通过接头与所述第一蛋白质结合试剂缀合。第一对照颗粒寡核苷酸可包含接头。接头可以包含化学基团。化学基团可以可逆地或不可逆地附接至第一蛋白质结合试剂。化学基团可包含UV光可切割基团、二硫键、链霉亲和素、生物素、胺、二硫键或其任何组合。
在一些实施例中,对照颗粒与多个第二蛋白质结合试剂关联。多个第二蛋白质结合试剂中的至少一个可以与多个对照颗粒寡核苷酸中的一个关联。图9C显示了非限制性的示例性颗粒,其包被有多个被寡核苷酸官能化的第一抗体和多个未被寡核苷酸官能化的第二抗体。可以用热抗体(例如,与对照颗粒寡核苷酸关联)和冷抗体(例如,不与对照颗粒寡核苷酸关联)的比例滴定对照颗粒上的抗体,以改变从对照颗粒获得的测序读数的量。第一抗体和第二抗体可以相同或不同。
图9D是用多个第一对照颗粒寡核苷酸、缀合至多个第二抗体的多个第二对照颗粒寡核苷酸和多个第三对照颗粒寡核苷酸(在相对高、中、和低丰度情况下)官能化的颗粒的非限制性示例性示意图。多个第一对照颗粒寡核苷酸可以与多个第一蛋白质结合试剂缀合。多个第二对照颗粒寡核苷酸可以与多个第二蛋白质结合试剂缀合。多个第三对照颗粒寡核苷酸可以与多个第三蛋白质结合试剂缀合。
第一、第二和第三对照颗粒寡核苷酸的相对丰度可以模拟具有不同表达水平的mRNA。与第一蛋白质结合试剂关联的对照颗粒寡核苷酸和与第二蛋白质结合试剂关联的对照颗粒寡核苷酸可以包含不同的对照条形码序列。可以滴定不同的蛋白质结合试剂(例如抗体)和对照颗粒上的不同对照颗粒寡核苷酸以生成标准曲线。第一蛋白质结合试剂、第二蛋白质结合试剂或第三蛋白质结合试剂可以是相同或不同的蛋白质结合试剂。
在一些实施例中,多个第一对照颗粒寡核苷酸的数量与多个第二(或第三)对照颗粒寡核苷酸的数量的比率可以是或约是1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99、1:100或这些数字中任何两个之间的数字或范围。在一些实施例中,多个第一对照颗粒寡核苷酸的数量与多个第二(或第三)对照颗粒寡核苷酸的数量的比率可以是至少或至多1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99或1:100。
在一些实施例中,第一蛋白质结合试剂可以与伴侣结合试剂(例如,第二抗体)关联,并且第一蛋白质结合试剂使用伴侣结合试剂与对照颗粒关联。伴侣结合试剂可以包含伴侣抗体。伴侣抗体可包含抗猫抗体、抗鸡抗体、抗牛抗体、抗狗抗体、抗驴抗体、抗山羊抗体、抗豚鼠抗体、抗-仓鼠抗体、抗马抗体、抗人抗体、抗美洲驼抗体、抗猴抗体、抗小鼠抗体、抗猪抗体、抗兔抗体、抗大鼠抗体、抗绵羊抗体或其组合。伴侣抗体可以包含免疫球蛋白G(IgG)、F(ab’)片段、F(ab’)2片段、其组合或其片段。
在一些实施例中,第一蛋白质结合试剂与具有相同对照条形码序列的多个对照颗粒寡核苷酸中的两个或更多个关联。第一蛋白质结合试剂可以与具有不同对照条形码序列的多个对照颗粒寡核苷酸中的两个或更多个关联。在一些实施例中,多个第一蛋白质结合试剂中的至少一个不与所述多个对照颗粒寡核苷酸中的任何一个关联。与对照颗粒寡核苷酸关联的第一蛋白质结合试剂和不与任何对照颗粒寡核苷酸关联的第一蛋白质结合试剂可以是相同的蛋白质结合试剂。
对照条形码多样性
与一个对照颗粒关联的多个对照颗粒寡核苷酸可包含许多具有不同对照条形码序列的对照颗粒寡核苷酸。在不同的实施方式中,对照颗粒寡核苷酸所具有的对照条形码序列的数量可以不同。在一些实施例中,对照颗粒寡核苷酸具有的对照条形码序列的数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或这些值中任何两个之间的数字或范围。在一些实施例中,对照颗粒寡核苷酸具有的对照条形码序列的数量可以是至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或1000000。
在一些实施例中,具有相同对照颗粒寡核苷酸序列的对照颗粒寡核苷酸的数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或这些值中任何两个之间的数字或范围。在一些实施例中,具有相同对照颗粒寡核苷酸序列的对照颗粒寡核苷酸的数量可以是至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或1000000。
在一些实施例中,多个对照颗粒寡核苷酸包含各自包含第一对照条形码序列的多个第一对照颗粒寡核苷酸和各自包含第二对照条形码序列的多个第二对照颗粒寡核苷酸,并且所述第一对照条形码序列和所述第二对照条形码序列具有不同的序列。所述多个第一对照颗粒寡核苷酸的数量和所述多个第二对照颗粒寡核苷酸的数量可以大约相同。所述多个第一对照颗粒寡核苷酸的数量和所述多个第二对照颗粒寡核苷酸的数量可以不同。所述多个第一对照颗粒寡核苷酸的数量可以是所述多个第二对照颗粒寡核苷酸的数量的至少2倍、10倍、100倍或更大。在一些实施例中,多个第一对照颗粒寡核苷酸的数量与多个第二对照颗粒寡核苷酸的数量的比率可以是或约是1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99、1:100、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:2000、1:3000、1:4000、1:5000、1:6000、1:7000、1:8000、1:9000、1:10000或这些值中任何两个之间的数字或范围。在一些实施例中,多个第一对照颗粒寡核苷酸的数量与多个第二对照颗粒寡核苷酸的数量的比率可以是至少或至多1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99、1:100、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:2000、1:3000、1:4000、1:5000、1:6000、1:7000、1:8000、1:9000或1:10000。
可检测部分
在一些实施例中,对照颗粒与可检测部分(例如光学部分,例如荧光团或发色团)关联。对照颗粒寡核苷酸可以与可检测部分(例如光学部分)关联。在一些实施例中,第一蛋白质结合试剂可以与光学部分关联(图9E)。第二蛋白质结合试剂可以与光学部分关联。与光学部分(例如,荧光标记的珠)关联的对照颗粒也可以用于成像和流式细胞术。
可检测部分可以选自光谱上不同的可检测部分的组。光谱上不同的可检测部分包括具有可识别的发射光谱的可检测部分,即使它们的发射光谱可能重叠。可检测部分的非限制性实例包括氧杂蒽衍生物:荧光素、罗丹明、俄勒冈绿、伊红以及德克萨斯红;花菁衍生物:花菁、吲哚碳菁、氧杂碳青(oxacarbocyanine)、噻碳菁(thiacarbocyanine)以及部花青;方酸衍生物和环取代的方酸菁,包括Seta、SeTau和Square染料;萘衍生物(丹酰和氟硅酸钠(prodan)衍生物);香豆素衍生物、噁二唑衍生物:吡啶基噁唑、硝基苯噁二唑和苯噁二唑;蒽衍生物:蒽醌类包括DRAQ5、DRAQ7和CyTRAK橙;芘衍生物:瀑布蓝(cascade blue);噁嗪衍生物:尼罗红、尼罗蓝、甲酚紫、噁嗪170;吖啶衍生物:二氨基吖啶、叮啶橙、叮啶黄;芳基次甲基衍生物:金胺、结晶紫、孔雀石绿;以及四吡咯衍生物:卟吩、酞菁、胆红素。可检测部分的其他非限制性实例包括羟基香豆素、氨基香豆素、甲氧基香豆素、瀑布蓝、太平洋蓝、太平洋橙、荧光黄、NBD、R-藻红蛋白(PE)、PE-Cy5缀合物、PE-Cy7缀合物、红613、PerCP、TruRed、FluorX、荧光素、BODIPY-FL、Cy2、Cy3、Cy3B、Cy3.5、Cy5、Cy5.5、Cy7、TRITC、X-罗丹明、丽丝胺罗丹明B、德克萨斯红、别藻蓝素(APC)、APC-Cy7缀合物、赫斯特(Hoechst)33342、DAPI、赫斯特33258、SYTOX蓝、色霉素A3、光神霉素、YOYO-1、溴化乙锭、吖啶橙、SYTOX绿、TOTO-1、TO-PRO-1、TO-PRO:花菁单体、噻唑单体、CyTRAK橙、碘化丙啶(PI)、LDS 751、7-AAD、SYTOX橙、TOTO-3、TO-PRO-3、DRAQ5、DRAQ7、Indo-1、Fluo-3、Fluo-4、DCFH、DHR以及SNARF。
可检测部分的激发波长可以变化,例如是或约是10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000纳米或这些值中的任何两个值之间的数字或范围。可检测部分的发射波长也可以变化,例如是或是约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000纳米或这些值中的任何两个值之间的数字或范围。
可检测部分的分子量可以变化,例如是或是约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000道尔顿(Da)或这些值中的任何两个值之间的数字或范围。可检测部分的分子量也可以变化,例如是或是约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000千道尔顿(kDa)或这些值中的任何两个值之间的数字或范围。
光谱上不同的可检测部分组可以例如包括五种不同的荧光团、五种不同的发色团、五种荧光团和发色团的组合、四种不同的荧光团和非荧光团的组合、四种发色团和非发色团的组合或四种荧光团和发色团和非荧光团非发色团的组合。在一些实施例中,可检测部分可以是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者这些值中的任何两个值之间的数字或范围的在光谱上不同的部分中的一个。
对照颗粒工作流程
AbO官能化的珠可与任何单细胞工作流程一起用作单细胞测序对照。单细胞工作流程可以利用微孔阵列或微孔盒(例如BD RhapsodyTM)或微流控设备(10X Genomics(旧金山,加利福尼亚州)、Drop-seq(马克罗实验室(McCarroll Lab),哈佛医学院(剑桥,马萨诸塞州);Macosko等人.,Cell[细胞],2015年五月21 16;5:1202,其内容通过引用整体并入本文)或Abseq(密逊生物公司(Mission Bio)(旧金山,加利福尼亚州);Shahi等人.,Sci Rep.[科学通讯]2017三月14;7:44447,其内容通过引用整体并入本文)结合与随机条形码关联的固体或半固体颗粒(例如BD Rhapsody或Drop-seq),或封装有可释放的随机条形码的可破坏水凝胶颗粒(例如10XGenomics或Abseq)。官能化的珠可以是用于确定单细胞工作流程效率的对照,类似于用于批量RNAseq或微阵列研究的外部RNA对照体(ERCC)。
本文的披露包括使用多个对照颗粒寡核苷酸确定靶数量的方法。确定靶数量(例如基因表达)的方法可以与本文披露的其他方法一起使用。例如,工作流程可用于使用多个对照颗粒寡核苷酸确定蛋白质表达和基因表达。在一些实施例中,所述方法包括:使用多个条形码(例如随机条形码)对多个细胞中的细胞的多个靶和多个对照颗粒寡核苷酸进行条形码编码(例如随机条形码编码),以产生多个经条形码编码的靶(例如经随机经条形码编码的靶)和多个经条形码编码的对照颗粒寡核苷酸(例如经随机经条形码编码的对照颗粒寡核苷酸),其中所述多个条形码中的每个包含细胞标记序列、条形码序列(例如分子标记)和靶结合区,其中所述多个条形码中的至少两个条形码包含不同的条形码序列(例如,分子标记),并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,其中对照颗粒组合物包含与所述多个对照颗粒寡核苷酸关联的对照颗粒,其中所述多个对照颗粒寡核苷酸中的每个包含对照条形码序列和伪靶区,所述伪靶区包含与所述多个条形码中的至少一个的靶结合区基本互补的序列。所述方法可以包括:获得所述多个经条形码编码的靶和所述多个经条形码编码的对照颗粒寡核苷酸的测序数据;对测序数据中与具有所述对照条形码序列的所述多个对照颗粒寡核苷酸关联的具有不同序列的条形码序列(例如分子标记)的数量进行计数。所述方法可以包括:对于所述多个靶中的至少一个靶:对所述测序数据中与所述靶关联的具有不同序列的条形码序列的数量进行计数;并且估计所述靶的数量,其中估计的所述靶的数量与以下相关:与计数的所述靶关联的具有不同序列的条形码序列(例如分子标记)的数量以及与所述对照条形码序列关联的具有不同序列的条形码序列(例如分子标记)的数量。在一些实施例中,伪靶区包含聚(dA)区。伪靶区可以包含靶的子序列。
在一些实施例中,估计的所述靶的数量可以与以下相关:与计数的所述靶关联的具有不同序列的条形码序列(例如分子标记)的数量,与所述对照条形码序列关联的具有不同序列的条形码序列(例如分子标记)的数量,以及包含所述对照条形码序列的所述多个对照颗粒寡核苷酸的数量。估计的所述靶的数量可以与以下相关:与计数的所述靶关联的具有不同序列的条形码序列(例如分子标记)的数量,以及包含所述对照条形码序列的所述多个对照颗粒寡核苷酸的数量与跟所述对照条形码序列关联的具有不同序列的条形码序列(例如分子标记)的数量的比例。
例如,如果所述对照颗粒具有100个具有特定对照条形码序列的对照颗粒寡核苷酸并且与所述对照条形码序列关联的具有不同序列的条形码序列(例如分子标记)的数量(文库制备过程中幸存的具有所述对照条形码序列的对照颗粒寡核苷酸的数量)是80,则文库制备的效率(例如逆转录,扩增等)是80%。因此,可以通过使用文库制备效率进行归一化来比较来自不同文库制备的数据。
作为另一个实例,所述对照颗粒可包含五个对照颗粒寡核苷酸,其具有模仿低表达基因的特定对照条形码测序。如果与所述对照条形码序列关联的具有不同序列的条形码序列(例如分子标记)的数量是五个并且未检测到低表达基因,则可以得出结论:低表达基因未表达(或细胞具有基因的少于五个的mRNA)。然而,如果与所述对照条形码序列关联的具有不同序列的条形码序列(例如分子标记)的数量是零并且未检测到低表达基因,则不可以得出低表达基因未表达的结论。
可以确定具有不同丰度的对照颗粒寡核苷酸的捕获效率。可以基于具有两个或更多个对照条形码序列的对照颗粒寡核苷酸的捕获效率来进行归一化。在一些实施例中,对测序数据中与具有所述对照条形码序列的所述多个对照颗粒寡核苷酸关联的具有不同序列的条形码序列(例如分子标记)的数量进行计数包括:对所述测序数据中与所述第一对照条形码序列关联的具有不同序列的条形码序列(例如,分子标记)的数量进行计数;并且对所述测序数据中与所述第二对照条形码序列关联的具有不同序列的条形码序列(例如,分子标记)的数量进行计数。估计的所述靶的数量可以与以下相关:与计数的所述靶关联的具有不同序列的条形码序列(例如分子标记)的数量,与所述第一对照条形码序列关联的具有不同序列的条形码序列(例如分子标记)的数量,以及与所述第二对照条形码序列关联的具有不同序列的条形码序列(例如分子标记)的数量。
在一些实施例中,所述方法包括在随机地对所述多个靶和所述对照颗粒和所述多个对照颗粒寡核苷酸进行条形码编码之前,从所述对照颗粒释放所述多个对照颗粒寡核苷酸中的至少一个。
在一些实施例中,使用所述多个条形码(例如随机条形码)对所述多个靶和所述多个对照颗粒寡核苷酸进行条形码编码(随机条形码编码)包括:使所述多个条形码与所述多个靶中的靶和所述多个对照颗粒寡核苷酸中的对照颗粒寡核苷酸接触,以产生与所述靶和所述对照颗粒寡核苷酸杂交的条形码;并且延伸与所述靶和所述对照颗粒寡核苷酸杂交的所述条形码,以产生所述多个经条形码编码的靶和所述多个经条形码编码的对照颗粒寡核苷酸(例如多个经随机经条形码编码的靶和多个经随机经条形码编码的对照颗粒寡核苷酸)。延伸所述条形码可以包括使用DNA聚合酶、逆转录酶或其组合来延伸所述条形码。
在一些实施例中,所述方法包括扩增所述多个随机经条形码编码的靶和所述多个随机经条形码编码的对照颗粒寡核苷酸以产生多个扩增子。扩增所述多个随机经条形码编码的靶和所述多个随机经条形码编码的对照颗粒寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增所述条形码序列(例如分子标记)的至少一部分和所述对照颗粒寡核苷酸的至少一部分或所述条形码序列(例如分子标记)的至少一部分和所述对照颗粒寡核苷酸的至少一部分。获得所述测序数据可以包括获得所述多个扩增子的测序数据。获得测序数据可包括对以下进行测序:所述条形码序列(例如分子标记)的至少一部分和所述对照颗粒寡核苷酸的至少一部分,所述条形码序列(例如分子标记)的至少一部分和所述对照颗粒寡核苷酸的至少一部分。
微孔盒或阵列工作流程
图10是使用寡核苷酸官能化的颗粒用于单细胞测序对照的示例性工作流程的示意图。在一些实施例中,对照颗粒组合物包含与对照颗粒1004关联的多个对照颗粒寡核苷酸。例如,对照颗粒1040可以与对照颗粒寡核苷酸1025关联,所述对照颗粒寡核苷酸1025与抗体1005缀合,所述抗体1005与对照颗粒1040结合。可以将被对照颗粒寡核苷酸1025官能化的多个对照颗粒1040以例如5%掺入多个细胞中。可以将对照颗粒1040在后续工作流程中视为“细胞”。对照颗粒1040也可以称为对照细胞或对照细胞颗粒。然后可以将细胞1010和对照颗粒1040分开进入多个隔室,例如微孔阵列的孔,其中单隔室1015a、1015b的尺寸设置成适合单细胞或对照颗粒和单珠1020a、1020b。可以将珠1020a、1020b装入隔室1015a、1015b。
每个珠可包含多个寡核苷酸探针,其可包含珠上所有寡核苷酸探针所共同的细胞标记,和条形码序列(例如分子标记序列)。在一些实施例中,每个寡核苷酸探针可包含靶结合区,例如聚(dT)序列。可以使用化学、光学或其他手段将缀合至抗体1005的寡核苷酸1025与抗体1005分离。可以裂解1035细胞1010以释放细胞内的核酸,例如基因组DNA或细胞mRNA1030。细胞mRNA 1030和对照颗粒寡核苷酸1025可以例如通过与聚(dT)序列杂交而分别由珠1020a、1020b上的寡核苷酸探针捕获。可以回收珠,并且可以合并捕获的细胞mRNA 1030和对照颗粒寡核苷酸1025(例如,对应于总共约5000个细胞)。
逆转录酶可以用于以细胞mRNA 1030和寡核苷酸1025为模板来延伸与细胞mRNA1030和对照颗粒寡核苷酸1025杂交的寡核苷酸探针。由逆转录酶产生的延伸产物可以进行扩增和测序。可以使测序读数经受细胞标记、条形码序列(例如分子标记)、基因身份、对照颗粒寡核苷酸序列等的多路解析,这可用于确定单细胞基因表达谱和定量全部或部分工作流程的效率(例如,细胞捕获效率)。例如,可以基于与数据中的对照条形码序列关联的细胞标记的数量来确定捕获的对照颗粒的数量。工作流程的效率可以是捕获的对照颗粒的数量与掺入的对照颗粒的数量的比率。
微流体工作流程
图10是使用寡核苷酸官能化的颗粒用于单细胞测序对照的另一个示例性工作流程的示意图。可以将被对照颗粒寡核苷酸1025官能化的多个对照颗粒1040以例如5%掺入多个细胞中。可以将对照颗粒1040在后续工作流程中视为“细胞”。对照颗粒1040也可以称为对照细胞或对照细胞颗粒。然后可以使用微流体装置将细胞1010和对照颗粒1040分离成多个隔室,例如液滴1045a、1045。每个液滴1045a、1045b可包括一个细胞1010或一个对照颗粒1040以及水凝胶珠1020a、1020b。
每个珠1020a、1020b可包含多个寡核苷酸探针,其可包含珠上所有寡核苷酸探针所共同的细胞标记,和条形码序列(例如分子标记序列)。在一些实施例中,每个寡核苷酸探针可包含靶结合区,例如聚(dT)序列。珠1020a、1020b可以包括用于随后的工作流程(例如,逆转录)的试剂。可以使用化学、光学或其他手段将缀合至抗体1005的寡核苷酸1025与抗体1005分离。可以裂解1035细胞1010以释放细胞内的核酸,例如基因组DNA或细胞mRNA 1030。细胞mRNA 630和对照颗粒寡核苷酸1025可以例如通过与聚(dT)序列杂交而分别从珠1020a、1020b释放的寡核苷酸探针捕获。逆转录酶可以用于以细胞mRNA 1030和寡核苷酸1025为模板来延伸与细胞mRNA 1030和寡核苷酸1025杂交的寡核苷酸探针。
在破裂液滴1045a、1045b之后,可以合并由逆转录酶产生的延伸产物,并进行扩增和测序。可以使测序读数经受细胞标记、分子标记、基因身份、对照颗粒寡核苷酸序列等的多路解析以确定单细胞基因表达谱和定量全部或部分工作流程的效率。
用于确定单细胞测序效率的对照寡核苷酸
本文的披露还包括用于确定单细胞测序效率的方法、试剂盒和系统。这样的方法、试剂盒和系统可以与本文披露的任何合适的方法、试剂盒和系统(例如使用与寡核苷酸关联的细胞组分结合试剂测量细胞组分表达水平(例如蛋白质表达水平)的方法、试剂盒和系统)一起使用。
在一些实施例中,通过用与寡核苷酸缀合的抗体(例如,用通用抗体或生物标志物抗体)标记单细胞并用它们产生下一代测序文库,来自NGS读数中的寡核苷酸的信号可用于确定单细胞NGS效率。然后可以将其用作针对不同单细胞测序平台功效的QC步骤或评估工具。例如,对照寡核苷酸可以与本文披露的任何合适的方法、试剂盒和系统(例如使用与寡核苷酸关联的细胞组分结合试剂测量细胞组分表达水平(例如蛋白质表达水平)的方法、试剂盒和系统)一起使用。
与寡核苷酸缀合的抗体(在本文中称为“AbO”)可与任何单细胞工作流程一起用作单细胞测序对照。单细胞工作流程可以利用微孔阵列或微孔盒(例如BD RhapsodyTM)或微流控设备(10X Genomics(旧金山,加利福尼亚州)、Drop-seq(马克罗实验室(McCarrollLab),哈佛医学院(剑桥,马萨诸塞州);Macosko等人.,Cell[细胞],2015年五月2116;5:1202,其内容通过引用整体并入本文)或Abseq(密逊生物公司(MissionBio)(旧金山,加利福尼亚州);Shahi等人.,Sci Rep.[科学通讯]2017三月14;7:44447,其内容通过引用整体并入本文)结合与条形码(例如随机条形码)关联的固体或半固体颗粒(例如BD Rhapsody或Drop-seq),或封装有可释放的条形码(例如随机条形码)的可破坏水凝胶颗粒(例如10XGenomics或Abseq)。AbO可以作为确定单细胞工作流程效率的对照。例如,来自10XGenomics的单细胞测序平台使用乳液将单细胞包封在液滴中来进行单细胞捕获。由于这些液滴不容易可视化,因此无法轻松确定单细胞的捕获效率。在此类单细胞测序工作流程上游使用AbO允许使用户评估测序后的单细胞捕获效率和双重态形成速率。
图11显示了使用对照寡核苷酸缀合的抗体确定单细胞测序效率的示例性工作流程的示意图。在一些实施例中,在将一个或多个细胞(例如5000个)1100装载到微孔盒或阵列的微孔1115上之前,可以用与对照寡核苷酸1125缀合的抗体1105染色。然后可以将细胞1110分开进入多个隔室,例如微孔阵列的孔,其中单隔室1115的大小适合单细胞和单珠1120。
每个珠可例如包含多个寡核苷酸探针,其可包含珠上所有寡核苷酸探针所共同的细胞标记,和条形码序列(例如分子标记序列)。在一些实施例中,每个寡核苷酸探针可包含靶结合区,例如聚(dT)序列。可以使用化学、光学或其他手段将缀合至抗体1105的寡核苷酸1125与抗体1105分离。可以裂解1135细胞1110以释放细胞内的核酸,例如基因组DNA或细胞mRNA 1130。细胞mRNA 1130和对照寡核苷酸1125可以例如通过与聚(dT)序列杂交而被珠1120上的寡核苷酸探针捕获。可以回收珠,并且可以合并捕获的细胞mRNA 1130(例如,对应于总共约5000个细胞)。
逆转录酶可以用于以细胞mRNA 1130和寡核苷酸1125为模板来延伸与细胞mRNA1130和寡核苷酸1125杂交的寡核苷酸探针。由逆转录酶产生的延伸产物可以进行扩增和测序。可以使测序读数经受细胞标记、条形码序列(例如分子标记)、基因身份、对照寡核苷酸序列等的多路解析以确定单细胞基因表达谱和定量全部或部分工作流程的效率(例如,细胞捕获效率)。可以确定捕获并成功通过文库制备的细胞的数量(例如,少于5000个细胞)。
图12显示了使用对照寡核苷酸缀合的抗体确定单细胞测序效率的示例性工作流程的另一示意图。在图12中,可以使用微流体装置形成包含单细胞1210a、1210b和单颗粒1220a、1220b的液滴1245a、1245b。单细胞1210a、1210b可以与跟对照寡核苷酸1225a、1225b缀合的抗体1205a、1205b结合。在细胞裂解并在液滴1245a、1245b中逆转录后,可将液滴破裂并合并内容物以用于文库制备。可以确定捕获并成功通过文库制备的细胞的数量。
图13A-图13C是显示对照寡核苷酸可用于细胞计数的图。图13A-图13B显示AbO的对照寡核苷酸可用作细胞计数的对照。如果达到100%捕获和文库制备效率,则mRNA计数图的下降点和对照寡核苷酸计数图的下降点可以一致。图13C显示使用常规的仅mRNA的细胞标记调用可能会错过高转录细胞中的低转录细胞。此方法可以在n个细胞标记处调用截断值。当静止T细胞在活化的T细胞的大群(其中活化的T细胞的RNA转录可能高若干倍)中时可能会发生这种情况。当在靶组(例如,癌症组)中具有低靶向基因表达的非靶向细胞(非癌细胞)将被丢弃时,也可能发生这种情况。但是,由于蛋白质表达高得多,因此低转录细胞仍具有更高的被调用概率。该方法可以在m个细胞标记处调用截断值,其中m>n。
本披露包括用于测序对照的方法。例如,所述方法可以用于确定单细胞测序效率。确定单细胞测序效率的方法可以与本文披露的其他方法一起使用。例如,针对单细胞测序效率使用的方法可以与用于确定蛋白质表达的方法一起使用。作为另一个实例,工作流程可以用于确定单细胞测序效率、蛋白质表达和/或基因表达。
在一些实施例中,所述方法包括:使多个细胞中的一个或多个细胞与多个对照组合物中的对照组合物接触,其中所述多个细胞中的细胞包含多个靶和多个蛋白质靶,其中所述多个对照组合物中的每个包含与对照寡核苷酸关联的蛋白质结合试剂,其中所述蛋白质结合试剂能够与所述多个蛋白质靶中的至少一个特异性结合,并且其中所述对照寡核苷酸包含对照条形码序列和伪靶区,所述伪靶区包含与所述多个条形码中的至少一个的靶结合区基本互补的序列;使用多个条形码对所述对照寡核苷酸进行条形码编码,以产生多个经条形码编码的对照寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、条形码序列(例如,分子标记序列)和靶结合区,其中所述多个条形码中的至少两个条形码的条形码序列(例如,分子标记序列)包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;获得所述多个经条形码编码的对照寡核苷酸的测序数据;使用所述测序数据中的所述多个经条形码编码的对照寡核苷酸的至少一个特征来确定所述一个或多个细胞的至少一个特征(例如,捕获并成功通过文库制备的细胞数量)。在一些实施例中,伪靶区包含聚(dA)区。
在一些实施例中,确定所述一个或多个细胞的所述至少一个特征包括:确定所述测序数据中与所述多个经条形码编码的对照寡核苷酸关联的具有不同序列的细胞标记序列的数量;并且使用与所述多个经条形码编码的对照寡核苷酸关联的具有不同序列的细胞标记序列的数量来确定所述一个或多个细胞的数量。所述方法可以包括:根据所确定的所述一个或多个细胞的数量确定单细胞捕获效率。所述方法可以包括:包括根据所确定的所述一个或多个细胞的数量与所述多个细胞的数量的比例,确定单细胞捕获效率。
在一些实施例中,使用所述测序数据中的所述多个经条形码编码的对照寡核苷酸的特征来确定所述一个或多个细胞的至少一个特征包括:对于所述测序数据中的每个细胞标记,确定与所述细胞标记和所述对照条形码序列关联的具有不同序列的条形码序列(例如,分子标记序列)的数量;并且使用与所述细胞标记和所述对照条形码序列关联的具有不同序列的条形码序列的数量确定所述一个或多个细胞的数量。确定与所述细胞标记和所述对照条形码序列关联的具有不同序列的条形码序列的数量可以包括:对于所述测序数据中的每个细胞标记,确定与所述细胞标记和所述对照条形码序列关联的具有最高量的不同序列的条形码序列的数量。使用与所述细胞标记和所述对照条形码序列关联的具有不同序列的条形码序列的数量确定所述一个或多个细胞的数量可以包括:产生具有最高不同序列数量的条形码序列的数量和测序数据中与具有最高不同序列数量的条形码序列的数量关联的细胞标记的数量的图;并且将所述图中的截断值确定为所述一个或多个细胞的数量。
在一些实施例中,所述方法包括在对所述对照寡核苷酸进行条形码编码之前,从所述细胞组分结合试剂(例如,蛋白质结合试剂)释放所述对照寡核苷酸。在一些实施例中,所述方法包括去除所述多个对照组合物中未结合的对照组合物。去除所述未结合的对照组合物可以包括用洗涤缓冲液洗涤所述多个细胞中的一个或多个细胞。去除所述未结合的未结合的对照组合物可以包括使用流式细胞术选择与所述对照组合物中的至少一个细胞组分结合试剂结合的细胞。
在一些实施例中,对条形码对照寡核苷酸进行条形码编码包括:使用多个随机条形码对所述对照寡核苷酸进行条形码编码,以产生多个随机经条形码编码的对照寡核苷酸。在一些实施例中,使用多个条形码对多个对照寡核苷酸进行条形码编码包括:使所述多个条形码与所述多个对照组合物的对照寡核苷酸接触,以产生与所述对照寡核苷酸杂交的条形码;并且延伸与所述对照寡核苷酸杂交的随机条形码以产生所述多个经条形码编码的对照寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶、逆转录酶或其组合来延伸所述条形码。在一些实施例中,所述方法包括扩增多个经条形码编码的对照寡核苷酸以产生多个扩增子。扩增所述多个经条形码编码的对照寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增所述随机条形码序列(例如,分子标记序列)的至少一部分和所述对照寡核苷酸的至少一部分。在一些实施例中,获得测序数据包括获得所述多个扩增子的测序数据。获得所述测序数据可以包括对所述分子标记序列的所述至少一部分和所述对照寡核苷酸的所述至少一部分进行测序。
细胞超加载和多重态鉴定
本文的披露还包括用于鉴定细胞超加载和多重态的方法、试剂盒和系统。这样的方法、试剂盒和系统可以与本文披露的任何合适的方法、试剂盒和系统(例如使用与寡核苷酸关联的细胞组分结合试剂测量细胞组分表达水平(例如蛋白质表达水平)的方法、试剂盒和系统)一起使用。
使用当前的细胞加载技术,当将约20000个细胞加载到具有约60000个微孔的微孔盒或阵列中时,具有两个或更多个细胞(称为双重态或多重态)的微孔或液滴的数量可能最少。但是,当加载的细胞数量增加时,具有多个细胞的微孔或液滴的数量会大大增加。例如,当将约50000个细胞加载入微孔盒或阵列的约60000个微孔中时,具有多个细胞的微孔的百分比可能非常高,例如11%-14%。这种将大量细胞加载入微孔中可以称为细胞超加载。但是,如果将细胞分为多个组(例如5个),并且每个组中的细胞都用具有不同样品索引序列的样品索引寡核苷酸标记,则与两个或更多个样品索引序列关联的细胞标记(例如条形码的细胞标记,例如随机条形码)可以在测序数据中鉴定,并从后续处理中去除。在一些实施例中,如果将细胞分为多个组(例如10000个),并且每个组中的细胞都用具有不同样品索引序列的样品索引寡核苷酸标记,则与两个或更多个样品索引序列关联的样品标记可以在测序数据中鉴定,并从后续处理中去除。在一些实施例中,不同的细胞用具有不同细胞鉴定序列的细胞鉴定寡核苷酸标记,与两个或更多个细胞鉴定寡核苷酸关联的细胞鉴定序列可以在测序数据中鉴定并且从后续处理中去除。相对于微孔盒或阵列中的微孔数量,可以将这种更高数量的细胞加载到微孔中。
本文披露了用于样品鉴定的方法。在一些实施例中,所述方法包括:使第一多个细胞和第二多个细胞分别与两个样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个细胞组分,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、条形码序列(例如分子标记序列)和靶结合区,其中所述多个条形码中的至少两个条形码的条形码序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且在获得的测序数据中鉴定一个或多个各自与两个或更多个样品索引序列关联的细胞标记序列;并且从获得的测序数据中去除与所述一个或多个各自与两个或更多个样品索引序列关联的细胞标记序列关联的测序数据和/或从后续分析(例如单细胞mRNA分析或整个转录组分析)中排除与所述一个或多个各自与两个或更多个样品索引序列关联的细胞标记序列关联的测序数据。在一些实施例中,样品索引寡核苷酸包含条形码序列(例如,分子标记序列)、通用引物的结合位点、或其组合。
例如,所述方法可用于使用样品索引加载50000个或更多的细胞(相比于10000-20000个细胞)。样品索引可以使用寡核苷酸缀合的细胞组分结合试剂(例如抗体)或针对细胞组分的细胞组分结合试剂(例如通用蛋白质标志物)来标记来自具有独特样品索引的不同样品的细胞。当来自不同样品的两个或更多个细胞、来自样品的不同细胞群的两个或更多个细胞,或样品的两个或更多个细胞被捕获在同一微孔或液滴中时,组合的“细胞”(或具有两个或更多个细胞的内容物)可以与具有不同样品索引序列的样品索引寡核苷酸(或具有不同细胞鉴定序列的细胞鉴定寡核苷酸)关联。在不同的实施方式中,不同的细胞群的数量可以不同。在一些实施例中,不同的群的数量可以是或约是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或这些值中任何两个之间的数字或范围。在一些实施例中,不同的群的数量可以是至少或至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个。在不同的实施方式中,每个群中的细胞的数量或平均数量可以不同。在一些实施例中,每个群中的细胞的数量或平均数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100或这些值中任何两个之间的数字或范围。在一些实施例中,每个群中的细胞的数量或平均数量可以是至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100。当每个群中的细胞的数量或平均数量足够少(例如,等于或少于每个群50、25、10、5、4、3、2或1个细胞)时,用于细胞超加载和多重态鉴定的样品索引组合物可以称为细胞鉴定组合物。
通过将样品的细胞等分到多个群中,可以将样品的细胞分为多个群。可以基于与一个细胞标记序列(例如,条形码的细胞标记序列,例如随机条形码)关联的两个或更多个样品索引序列,将与测序数据中一个以上样品索引序列关联的“细胞”鉴定为“多重态”。组合的“细胞”的测序数据在本文中也称为多重态。多重态可以是双重态、三重态、四重态、五重态、六重态、七重态、八重态、九重态或其任何组合。多重态可以是任何n重态。在一些实施例中,n是或约是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20,或这些值中任意两个之间的范围。在一些实施例中,n至少或至多是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。
当确定单细胞的表达谱时,可以将两个细胞鉴定为一个细胞,并且将两个细胞的表达谱鉴定为一个细胞的表达谱(称为双重态表达谱)。例如,当使用条形码编码(例如,随机条形码编码)确定两个细胞的表达谱时,所述两个细胞的mRNA分子可以与具有相同细胞标记的条形码关联。作为另一示例,两个细胞可以与一个颗粒(例如,珠)关联。颗粒可以包括具有相同的细胞标记的条形码。裂解细胞后,所述两个细胞中的mRNA分子可以与所述颗粒的条形码(由此与相同的细胞标记)关联。双重态表达谱可能会偏离表达谱的解释。
双重态可能是指与具有不同样品索引序列的两个样品索引寡核苷酸关联的组合的“细胞”。双重态也可能是指与具有两个样品索引序列的样品索引寡核苷酸关联的组合的“细胞”。当与具有不同序列的两个样品索引寡核苷酸关联的两个细胞(或与具有两个不同样品索引序列的样品索引寡核苷酸关联的两个或更多个细胞)被捕获在同一微孔或液滴中时,可以会产生双重态,组合的“细胞”与具有不同样品索引序列的两个样品索引寡核苷酸关联。三重态可以指与全部具有不同样品索引序列的三个样品索引寡核苷酸关联的组合的“细胞”,或与具有三个不同样品索引序列的样品索引寡核苷酸关联的组合的“细胞”。四重态可以指与全部具有不同样品索引序列的四个样品索引寡核苷酸关联的组合的“细胞”,或与具有四个不同样品索引序列的样品索引寡核苷酸关联的组合的“细胞”。五重态可以指与全部具有不同样品索引序列的五个样品索引寡核苷酸关联的组合的“细胞”,或与具有五个不同样品索引序列的样品索引寡核苷酸关联的组合的“细胞”。六重态可以指与全部具有不同样品索引序列的六个样品索引寡核苷酸关联的组合的“细胞”,或与具有六个不同样品索引序列的样品索引寡核苷酸关联的组合的“细胞”。七重态可以指与全部具有不同样品索引序列的七个样品索引寡核苷酸关联的组合的“细胞”,或与具有七个不同样品索引序列的样品索引寡核苷酸关联的组合的“细胞”。八重态可以指与全部具有不同样品索引序列的八个样品索引寡核苷酸关联的组合的“细胞”,或与具有八个不同样品索引序列的样品索引寡核苷酸关联的组合的“细胞”。九重态可以指与全部具有不同样品索引序列的九个样品索引寡核苷酸关联的组合的“细胞”,或与具有九个不同样品索引序列的样品索引寡核苷酸关联的组合的“细胞”。当与具有不同序列的两个或更多个样品索引寡核苷酸关联的两个或更多个细胞(或与具有两个或更多个不同样品索引序列的样品索引寡核苷酸关联的两个或更多个细胞)被捕获在同一微孔或液滴中时,可以会产生多重态,组合的“细胞”与具有两个或更多个不同样品索引序列的样品索引寡核苷酸关联。
作为另一个实例,所述方法可以用于多重态鉴定,无论是在样品超加载的情况下还是在将细胞加载到微孔阵列的微孔上或产生包含细胞的液滴的情况下。当将两个或更多个细胞加载到一个微孔中时,来自组合的“细胞”(或具有两个或更多个细胞的内容物)的结果数据是具有异常基因表达谱的多重态。通过使用样品索引,可以通过查找各自与具有不同样品索引序列的两个或更多个样品索引寡核苷酸(或具有两个或更多个样品索引序列的样品索引寡核苷酸)关联或分配给具有不同样品索引序列的两个或更多个样品索引寡核苷酸(或具有两个或更多个样品索引序列的样品索引寡核苷酸)的细胞标记,来鉴定其中的一些多重态。利用样品索引序列,本文披露的方法可以用于多重态鉴定(无论是否在样品超加载的情况下,或在将细胞加载到微孔阵列的微孔上或产生包含细胞的液滴的情况下)。在一些实施例中,所述方法包括:使第一多个细胞和第二多个细胞分别与两个样品索引组合物接触,其中所述第一多个细胞中的每个和所述第二多个细胞中的每个包含一个或多个细胞组分,其中所述两个样品索引组合物中的每个包含与样品索引寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分中的至少一个特异性结合,其中所述样品索引寡核苷酸包含样品索引序列,并且其中所述两个样品索引组合物的样品索引序列包含不同的序列;使用多个条形码对所述样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、条形码序列(例如分子标记序列)和靶结合区,其中所述多个条形码中的至少两个条形码的条形码序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的样品索引寡核苷酸的测序数据;并且在获得的测序数据中鉴定一个或多个各自与两个或更多个样品索引序列关联的多重态细胞标记序列。
可以加载到微孔盒的微孔上或使用微流控设备生成的液滴中的细胞数量可能受到多重态率的限制。加载更多的细胞会导致更多的多重态,这可能难以鉴定并在单细胞数据中产生噪音。通过样品索引,所述方法可用于更准确地标记或鉴定多重态,并从测序数据或后续分析中去除多重态。能够以更高的置信度鉴定多重态可以提高用户对多重态率的容忍度,并将更多的细胞加载到每个微孔盒上,或产生各自至少有一个细胞的液滴。
在一些实施例中,使所述第一多个细胞和所述第二多个细胞分别与所述两个样品索引组合物接触包括:使所述第一多个细胞与所述两个样品索引组合物中的第一样品索引组合物接触;并且使所述第一多个细胞与所述两个样品索引组合物中的第二样品索引组合物接触。在不同的实现方式中,多个细胞的数量和多个样品索引组合物的数量可以不同。在一些实施例中,多个细胞和/或样品索引组合物的数量可以是或约是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或这些值中任何两个之间的数字或范围。在一些实施例中,多个细胞和/或样品索引组合物的数量可以是至少或至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或1000000。在不同的实施方式中,细胞的数量可以不同。在一些实施例中,细胞的数量或平均数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或这些值中任何两个之间的数字或范围。在一些实施例中,细胞的数量或平均数量可以是至少或针对2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、或1000000。
在一些实施例中,所述方法包括:去除所述两个样品索引组合物中未结合的样品索引组合物。去除所述未结合的样品索引组合物可以包括用洗涤缓冲液洗涤所述第一多个细胞中的和所述第二多个细胞中的细胞。去除所述未结合的样品索引组合物可以包括使用流式细胞术选择与所述两个样品索引组合物中的至少一个细胞组分结合试剂结合的细胞。在一些实施例中,所述方法包括:裂解来自所述多个样品中的每个的一个或多个细胞。
在一些实施例中,样品索引寡核苷酸被配置为与细胞组分结合试剂可分离或不可分离。所述方法可以包括使样品索引寡核苷酸与细胞组分结合试剂分离。分离样品索引寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸与细胞组分结合试剂分离。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码包括:使所述多个条形码与所述样品索引寡核苷酸接触以产生与所述样品索引寡核苷酸杂交的条形码;并且延伸与所述样品索引寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的样品索引寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生多个经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:扩增所述多个经条形码编码的样品索引寡核苷酸以产生多个扩增子。扩增多个经条形码编码的样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增条形码序列(例如,分子标记序列)的至少一部分和样品索引寡核苷酸的至少一部分。在一些实施例中,获得多个经条形码编码的样品索引寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得所述测序数据包括对所述条形码序列的至少一部分和所述样品索引寡核苷酸的至少一部分进行测序。在一些实施例中,鉴定至少一个细胞的样品来源包括基于至少一个经条形码编码的样品索引寡核苷酸的样品索引序列来鉴定多个经条形码编码的靶的样品来源。
在一些实施例中,使用多个条形码对样品索引寡核苷酸进行条形码编码以产生多个经条形码编码的样品索引寡核苷酸包括使用多个随机条形码对样品索引寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的样品索引寡核苷酸。
在一些实施例中,所述方法包括:使用所述多个条形码对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶,其中所述多个条形码中的每个包含细胞标记序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得所述经条形码编码的靶的测序数据。使用所述多个条形码对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使所述靶的拷贝与所述条形码的靶结合区接触;并且使用所述多个条形码对所述多个靶进行逆转录以产生多个逆转录的靶。
在一些实施例中,所述方法包括:在获得所述多个经条形码编码的靶的测序数据之前,扩增所述经条形码编码的靶以产生多个扩增的经条形码编码的靶。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用所述多个条形码对所述细胞的所述多个靶进行条形码编码以产生所述多个经条形码编码的靶可以包括使用多个随机条形码对所述细胞的所述多个靶进行随机条形码编码以产生多个随机经条形码编码的靶。
在一些实施例中,细胞鉴定方法包括:使第一多个的一个或多个细胞和第二多个的一个或多个细胞分别与两个细胞鉴定组合物接触,其中所述第一多个的一个或多个细胞中的每个和所述第二多个的一个或多个细胞中的每个包含一个或多个细胞组分,其中所述两个细胞鉴定组合物中的每个包含与细胞鉴定寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分中的至少一个特异性结合,其中所述细胞鉴定寡核苷酸包含细胞鉴定序列,并且其中所述两个细胞鉴定组合物的细胞鉴定序列包含不同的序列;使用多个条形码对所述细胞鉴定寡核苷酸进行条形码编码以产生多个经条形码编码的细胞鉴定寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、条形码序列(例如分子标记序列)和靶结合区,其中所述多个条形码中的至少两个条形码的条形码序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的细胞鉴定寡核苷酸的测序数据;并且在获得的测序数据中鉴定一个或多个各自与两个或更多个细胞鉴定序列关联的细胞标记序列;并且从获得的测序数据中去除与所述一个或多个各自与两个或更多个细胞鉴定序列关联的细胞标记序列关联的测序数据和/或从后续分析(例如单细胞mRNA分析或整个转录组分析)中排除与所述一个或多个各自与两个或更多个细胞鉴定序列关联的细胞标记序列关联的测序数据。在一些实施例中,细胞鉴定寡核苷酸包含条形码序列(例如,分子标记序列)、通用引物的结合位点、或其组合。
当与具有不同序列的两个或更多个细胞鉴定寡核苷酸关联的两个或更多个细胞(或与具有两个或更多个不同细胞鉴定序列的细胞鉴定寡核苷酸关联的两个或更多个细胞)被捕获在同一微孔或液滴中时,可以会产生多重态(例如双重态、三重态等),组合的“细胞”与具有两个或更多个不同细胞鉴定序列的细胞鉴定寡核苷酸关联。
细胞鉴定组合物可以用于多重态鉴定,无论是在细胞超加载的情况下还是在将细胞加载到微孔阵列的微孔上或产生包含细胞的液滴的情况下。当将两个或更多个细胞加载到一个微孔中时,来自组合的“细胞”(或具有两个或更多个细胞的内容物)的结果数据是具有异常基因表达谱的多重态。通过使用细胞鉴定,可以通过查找各自与具有不同细胞鉴定序列的两个或更多个细胞鉴定寡核苷酸(或具有两个或更多个样品细胞鉴定的细胞鉴定寡核苷酸)关联或分配给具有不同细胞鉴定序列的两个或更多个细胞鉴定寡核苷酸(或具有两个或更多个细胞鉴定序列的细胞鉴定寡核苷酸)的细胞标记(例如条形码的细胞标记,例如随机条形码),来鉴定其中的一些多重态。利用细胞鉴定序列,本文披露的方法可以用于多重态鉴定(无论是否在样品超加载的情况下,或在将细胞加载到微孔阵列的微孔上或产生包含细胞的液滴的情况下)。在一些实施例中,所述方法包括:使第一多个的一个或多个细胞和第二多个的一个或多个细胞分别与两个细胞鉴定组合物接触,其中所述第一多个的一个或多个细胞中的每个和所述第二多个的一个或多个细胞中的每个包含一个或多个细胞组分,其中所述两个细胞鉴定组合物中的每个包含与细胞鉴定寡核苷酸关联的细胞组分结合试剂,其中所述细胞组分结合试剂能够与所述一个或多个细胞组分中的至少一个特异性结合,其中所述细胞鉴定寡核苷酸包含细胞鉴定序列,并且其中所述两个细胞鉴定组合物的细胞鉴定序列包含不同的序列;使用多个条形码对所述细胞鉴定寡核苷酸进行条形码编码以产生多个经条形码编码的细胞鉴定寡核苷酸,其中所述多个条形码中的每个包含细胞标记序列、条形码序列(例如分子标记序列)和靶结合区,其中所述多个条形码中的至少两个条形码的条形码序列包含不同的序列,并且其中所述多个条形码中的至少两个条形码包含相同的细胞标记序列,获得所述多个经条形码编码的细胞鉴定寡核苷酸的测序数据;并且在获得的测序数据中鉴定一个或多个各自与两个或更多个细胞鉴定序列关联的多重态细胞标记序列。
可以加载到微孔盒的微孔上或使用微流控设备生成的液滴中的细胞数量可能受到多重态率的限制。加载更多的细胞会导致更多的多重态,这可能难以鉴定并在单细胞数据中产生噪音。通过细胞鉴定,所述方法可用于更准确地标记或鉴定多重态,并从测序数据或后续分析中去除多重态。能够以更高的置信度鉴定多重态可以提高用户对多重态率的容忍度,并将更多的细胞加载到每个微孔盒上,或产生各自至少有一个细胞的液滴。
在一些实施例中,使第一多个的一个或多个细胞和第二多个的一个或多个细胞分别与两个细胞鉴定组合物接触包括:使第一多个的一个或多个细胞与两个细胞鉴定组合物中的第一细胞鉴定组合物接触;使第一多个的一个或多个细胞与两个细胞鉴定组合物中的第二细胞鉴定组合物接触。在不同的实施方式中,多个细胞鉴定组合物的数量可以不同。在一些实施例中,细胞鉴定组合物的数量可以是或约是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或这些值中任何两个之间的数字或范围。在一些实施例中,细胞鉴定组合物的数量可以是至少或至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或1000000。在不同的实现中,每一多个的一个或多个细胞中的细胞的数量或平均数量可以不同。在一些实施例中,每一多个的一个或多个细胞中的细胞的数量或平均数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或这些值中任何两个之间的数字或范围。在一些实施例中,每一多个的一个或多个细胞中的细胞的数量或平均数量可以是至少或至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、或1000000。
在一些实施例中,所述方法包括:去除两个细胞鉴定组合物中未结合的细胞鉴定组合物。去除所述未结合的细胞鉴定组合物可以包括用洗涤缓冲液洗涤所述第一多个的一个或多个细胞中的和所述第二多个的一个或多个细胞中的细胞。去除所述未结合的细胞鉴定组合物可以包括使用流式细胞术选择与所述两个细胞鉴定组合物中的至少一个细胞组分结合试剂结合的细胞。在一些实施例中,所述方法包括:裂解来自所述多个样品中的每个的一个或多个细胞。
在一些实施例中,细胞鉴定寡核苷酸被配置为与细胞组分结合试剂可分离或不可分离。所述方法可以包括使细胞鉴定寡核苷酸与细胞组分结合试剂分离。分离细胞鉴定寡核苷酸可以包括通过UV光切割、化学处理(例如,使用还原试剂,比如二硫苏糖醇)、加热、酶处理或其任何组合使细胞鉴定寡核苷酸与细胞组分结合试剂分离。
在一些实施例中,使用多个条形码对细胞鉴定寡核苷酸进行条形码编码包括:使所述多个条形码与所述细胞鉴定寡核苷酸接触以产生与所述细胞鉴定寡核苷酸杂交的条形码;并且延伸与所述细胞鉴定寡核苷酸杂交的所述条形码以产生所述多个经条形码编码的细胞鉴定寡核苷酸。延伸所述条形码可以包括使用DNA聚合酶延伸所述条形码以产生所述多个经条形码编码的细胞鉴定寡核苷酸。延伸所述条形码可以包括使用逆转录酶延伸所述条形码以产生所述多个经条形码编码的细胞鉴定寡核苷酸。
在一些实施例中,所述方法包括:扩增所述多个经条形码编码的细胞鉴定寡核苷酸以产生多个扩增子。扩增多个经条形码编码的细胞鉴定寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增条形码序列(例如,分子标记序列)的至少一部分和细胞鉴定寡核苷酸的至少一部分。在一些实施例中,获得多个经条形码编码的细胞鉴定寡核苷酸的测序数据可以包括获得多个扩增子的测序数据。获得所述测序数据包括对所述条形码序列的至少一部分和所述细胞鉴定寡核苷酸的至少一部分进行测序。在一些实施例中,鉴定至少一个细胞的样品来源包括基于至少一个经条形码编码的细胞鉴定寡核苷酸的细胞鉴定序列来鉴定多个经条形码编码的靶的样品来源。
在一些实施例中,使用多个条形码对细胞鉴定寡核苷酸进行条形码编码以产生多个经条形码编码的细胞鉴定寡核苷酸包括使用多个随机条形码对细胞鉴定寡核苷酸进行随机条形码编码以产生多个随机经条形码编码的细胞鉴定寡核苷酸。
确定细胞组分-细胞组分相互作用
本文的披露包括用于确定细胞组分之间的相互作用的方法,例如多重邻近连接方法。这样的方法、试剂盒和系统可以与本文披露的任何合适的方法、试剂盒和系统(例如使用与寡核苷酸关联的细胞组分结合试剂测量细胞组分表达水平(例如蛋白质表达水平)的方法、试剂盒和系统)一起使用。
本文披露的方法可以用于检测、鉴定、确定和/或测量一个或多个细胞组分(例如蛋白质)之间的相互作用。例如,这些方法可用于检测、鉴定、确定和/或测量两对、三对、四对、五对、六对、七对、八对、九对、十对、二十对、三十对、四十对、五十对、一百对、两百对、三百个或更多对细胞组分。一对细胞组分靶中的细胞组分靶可以与另一对细胞组分靶中的细胞组分靶重叠。例如,第一对细胞组分靶可以包括蛋白A和蛋白B,而第二对细胞组分靶可以包括蛋白A和蛋白C。
在一些实施例中,所述方法使用与相互作用确定寡核苷酸关联的细胞组分结合试剂来确定细胞组分结合试剂的靶(在本文中称为细胞组分靶)之间的相互作用。例如,所述方法可以使用抗体-寡核苷酸缀合物来检测单细胞中的蛋白质-蛋白质相互作用。抗体可以是同二聚体或异二聚体。每个细胞组分结合试剂可以与含有独特相互作用确定序列的相互作用确定寡核苷酸关联(例如,连接或结合)。例如,每个抗体可以与含有独特条形码序列的寡核苷酸缀合。确定连接在一起的相互作用确定寡核苷酸对可以揭示彼此相互作用的细胞组分靶。例如,确定连接在一起的条形码对可以揭示蛋白质彼此相互作用。所述方法也可以与单细胞mRNA测序方法结合使用,例如基于孔和基于液滴的单细胞mRNA测序方法。
在一些实施例中,所述方法可以利用线性扩增来产生用于测序的扩增子。所述方法可以不生成环模板,并且使用滚环扩增来生成足够的模板以用于荧光探针或其他方法的下游检测。所述方法可用于确定单细胞中细胞组分靶之间的相互作用。例如,所述方法可用于检测跨数千至数万个单细胞的数百个细胞组分-细胞组分相互作用(例如,蛋白质-蛋白质相互作用),并将测序用作读数。也可以确定相同蛋白质或细胞组分靶之间的相互作用。所述方法不依赖荧光和定量PCR(qPCR),因为读数需要大量RNA作为输入,一次只能处理少量细胞(例如,少于100个细胞),并且一次只能检测有限量的细胞组分-细胞组分的相互作用。所述多路复用方法可以利用与抗体关联或缀合的经条形码编码的寡核苷酸,或者可以使用细胞组分结合试剂以高通量的方式确定大量单细胞中的细胞组分与细胞组分的相互作用。
此外,所述方法还可以与其他单细胞RNA测序方法一起使用。例如,一个单工作流程可以用于确定mRNA表达水平、蛋白质表达水平(或细胞组分靶的水平)和/或蛋白质-蛋白质相互作用(或细胞组分之间的相互作用)。结果,在单实验中,可以获得单细胞(或多个单细胞)中有关mRNA表达、蛋白质表达和蛋白质-蛋白质相互作用的数据。
在一些实施例中,所述方法可以用于检测两个细胞之间的细胞组分-细胞组分相互作用以及细胞内细胞组分-细胞组分相互作用。例如,所述方法可以用于检测两个细胞之间的蛋白质-蛋白质相互作用以及细胞内蛋白质-蛋白质相互作用。所述方法可能需要在抗体染色或孵育之前进行其他细胞准备工作(例如,进行细胞固定以使抗体与细胞内蛋白质或靶结合)。
图14A-图14F示出了使用一对相互作用确定组合物确定细胞组分(例如蛋白质)之间相互作用的示例性工作流程的示意图。所述方法可以利用图14A所示的两种类型的抗体-寡核苷酸组合物1404a、1404b(例如,抗体-寡核苷酸缀合物)。两种类型的抗体-寡核苷酸组合物1404a、1404b可以包括与两种类型的寡核苷酸1412a、1412b关联的两个相同或不同的抗体1408a、1408b。关联(例如,缀合)可以是可逆的或不可逆的(例如,可切割的或不可切割的)。一种类型的寡核苷酸1412a(在本文中称为1型寡核苷酸1412a)可以具有通用测序区1416。在一些实施例中,通用测序区1416可以是所有抗体-寡核苷酸组合物共同的,用于用通用引物扩增。其他类型的寡核苷酸1412b(在本文中称为2型寡核苷酸1412b)可以具有用于与条形码(例如,随机条形码)杂交的聚(dA)序列1420。例如,第二种类型的寡核苷酸1412b的聚(dA)序列1420可以与跟珠关联的随机条形码杂交(例如,固定在珠上,部分固定在珠上,可释放地封闭在珠中,部分封闭在珠中,或其任何组合)。两种寡核苷酸类型1412a、1412b还包括对于每个抗体1404a,1404b独特的条形码序列1424a、1424b。两种寡核苷酸类型1412a、1412b可以包括不同的序列1428a、1428b,用于与图14B所示的桥寡核苷酸1432杂交。尽管显示出第一种类型寡核苷酸1412a和第二种类型寡核苷酸1412b在5'至3'方向和3'至5'方向与抗体1408a、1408b关联,但它们仅是示例性的,而无意于限制。在一些实施例中,第一种类型寡核苷酸1412a和第二种类型寡核苷酸1412b可以在3'至5'方向和5'至3'方向与抗体1408a、1408b关联。
参考图14B,桥寡核苷酸1432可结合至桥寡核苷酸杂交区1428a、1428b以使抗体-寡核苷酸组合物1404a、1404b在一起以进行连接。对于每个组合物1404a、1404b,桥寡核苷酸杂交区1428a、1428b的序列可以不同。在一些实施例中,不同的桥寡核苷酸1432可以用于每个抗体对。
所述方法可以基于使抗体-寡核苷酸组合物对1404a、1404b在一起,使得关联的寡核苷酸1412a、1412b可以接合在一起或彼此连接,并且随后被与珠关联的条形码(例如,随机条形码)捕获用于测序。如果抗体1408a、1408b的靶1436a、1436b在彼此的某个阈值距离或范围内,例如30-40nm,则寡核苷酸1412a、1412b可以彼此连接。
多路复用方法可以利用与抗体或细胞组分结合试剂关联或缀合的经条形码编码的寡核苷酸,以高通量的方式确定大量单细胞中的蛋白质-蛋白质相互作用或细胞组分之间的相互作用。在一些实施例中,可以在细胞工作流程中确定以下数量或约以下数量的细胞中的细胞组分间的相互作用:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、105、106、107、108、109或这些值中任何两个之间的数字或范围。在一些实施例中,可以在细胞工作流程中确定至少或至多以下数量的细胞中的细胞组分间的相互作用:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、105、106、107、108或109或这些值中任何两个之间的数字或范围。
染色
为了进行测定,可以首先用抗体-寡核苷酸组合物1404a、1404b或成对的抗体-寡核苷酸组合物1404a、1404b(或细胞组分结合试剂-寡核苷酸组合物)对细胞染色。抗体-寡核苷酸组合物1404a、1404b(或细胞组分结合试剂)的数量在不同的实施方式中可以不同。在一些实施例中,抗体-寡核苷酸组合物1404a、1404b的数量可以是或约是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值中任何两个之间的数字或范围。在一些实施例中,抗体-寡核苷酸组合物1404a、1404b的数量可以是至少或至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。
不同组合物1404a、1404b的抗体1408a、1408b(或细胞组分结合试剂)可以与具有不同或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合。在一些实施例中,与具有不同条形码序列或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b的抗体1408a、1408b的数量可以是或约是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值中任何两个之间的数字或范围。在一些实施例中,与具有不同条形码序列或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b的抗体1408a、1408b的数量可以是至少或至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。在一些实施例中,与具有不同条形码序列或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b的抗体1408a、1408b的百分比可以是或约是0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%、100%或这些值中任何两个之间的数字或范围。在一些实施例中,与具有不同条形码序列或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b的抗体1408a、1408b的百分比可以是至少或至多0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%或100%。
抗体1408a、1408b(或细胞组分结合试剂)中的一些、全部或没有抗体可与具有桥寡核苷酸杂交区1428a、1428b(其相同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合。在一些实施例中,与具有桥寡核苷酸杂交区1428a、1428b(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合的抗体1408a、1408b的数量可以是或约是0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值中任何两个之间的数字或范围。在一些实施例中,与具有桥寡核苷酸杂交区1428a、1428b(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合的抗体1408a、1408b的数量可以是至少或至多0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。在一些实施例中,与具有桥寡核苷酸杂交区1428a、1428b(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合的抗体1408a、1408b的百分比可以是或约是0%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%、100%或这些值中任何两个之间的数字或范围。在一些实施例中,与具有桥寡核苷酸杂交区1428a、1428b(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合的抗体1408a、1408b的百分比可以是至少或至多0%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%或100%。
抗体1408a(或细胞组分结合试剂)中的一些、全部或没有抗体可以与具有通用测序区(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合。在一些实施例中,与具有通用测序区1416a(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合的抗体1408a的数量可以是或约是0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值中的任何两个之间的数字或范围。在一些实施例中,与具有通用测序区1416a(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合的抗体1408a的数量可以是至少或至多0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。在一些实施例中,与具有通用测序区1416a(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合的抗体1408a的百分比可以是或约是0%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%、100%或这些值中的任何两个之间的数字或范围。在一些实施例中,与具有通用测序区1416a(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合的抗体1408a的数量可以是至少或至多0%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%或100%。
抗体-寡核苷酸组合物1404a、1404b(细胞组分结合试剂-寡核苷酸组合物)对的数量在不同的实施方式中可以不同。在一些实施例中,抗体-寡核苷酸组合物对1404a、1404b对的数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值中任何两个之间的数字或范围。在一些实施例中,抗体-寡核苷酸组合物对1404a、1404b对的数量可以是至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。
不同组合物1404a、1404b对的抗体1408a、1408b(或细胞组分结合试剂)可以与具有不同或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合。在一些实施例中,与具有不同条形码序列或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b对的抗体1408a、1408b的数量可以是或约是2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值中任何两个之间的数字或范围。在一些实施例中,与具有不同条形码序列或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b对的抗体1408a、1408b的数量可以是至少或至多2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。在一些实施例中,与具有不同条形码序列或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b对的抗体1408a、1408b的百分比可以是或约是0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%、100%或这些值中任何两个之间的数字或范围。在一些实施例中,与具有不同条形码序列或相同条形码序列1424a、1424b的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b对的抗体1408a、1408b的百分比可以是至少或至多0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%或100%。
不同组合物1404a、1404b对的抗体1408a、1408b(或细胞组分结合试剂)中的一些、全部或没有抗体可以与具有相同桥寡核苷酸杂交区的相互作用确定寡核苷酸1412a、1412b关联或结合。在一些实施例中,与具有桥寡核苷酸杂交区1428a、1428b(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b对的抗体1408a、1408b的数量可以是或约是0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值中任何两个之间的数字或范围。在一些实施例中,与具有桥寡核苷酸杂交区1428a、1428b(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b对的抗体1408a、1408b的数量可以是至少或至多0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。在一些实施例中,与具有桥寡核苷酸杂交区1428a、1428b(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b对的抗体1408a、1408b的%可以是或约是0%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%、100%或这些值中任何两个之间的数字或范围。在一些实施例中,与具有桥寡核苷酸杂交区1428a、1428b(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a、1412b关联或结合的不同组合物1404a、1404b对的抗体1408a、1408b的百分比可以是至少或至多0%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%或100%。
不同组合物1404a的抗体1408a(或细胞组分结合试剂)中的一些、全部或没有抗体可以与具有通用测序区(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合。在一些实施例中,与具有通用测序区1416a(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合的不同组合物1404a的抗体1408a的数量可以是或约是0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或这些值中的任何两个之间的数字或范围。在一些实施例中,与具有通用测序区1416a(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合的不同组合物1404a的抗体1408a的数量可以是至少或至多0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。在一些实施例中,与具有通用测序区1416a(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合的不同组合物1404a的抗体1408a的百分比可以是或约是0%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%、100%或这些值中的任何两个之间的数字或范围。在一些实施例中,与具有通用测序区1416a(其具有相同序列或不同序列)的相互作用确定寡核苷酸1412a关联或结合的不同组合物1404a的抗体1408a的百分比可以是至少或至多0%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、33%、40%、50%、60%、70%、80%、90%、99.9%、99.99%或100%。
靶1436a、1436b的数量在不同的实施方式中可以不同,例如2至至少50-100个蛋白质靶。在一些实施例中,靶1436a、1436b的数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、或这些值的任何两个之间的数字或范围。在一些实施例中,靶1436a、1436b的数量可以是至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。
连接
在洗去未结合的组合物1404a、1404b之后,可以添加桥寡核苷酸1432。可以通过桥寡核苷酸1432将由类型1和类型2组合物1404a、1404b制成的对连接在一起,所述桥寡核苷酸可以与桥寡核苷酸杂交区杂交。例如,如果相应的蛋白质靶1436a、1436b位于阈值距离之内,例如30-40nm,则可以通过桥寡核苷酸1432将由类型1和类型2组合物1404a、1404b制成的对连接在一起,所述桥寡核苷酸可以与桥寡核苷酸杂交区杂交。然后可以添加DNA连接酶以连接两个寡核苷酸1412a、1412b以形成连接的寡核苷酸1412,从而将组合物1436a、1436b连接在一起。例如,桥寡核苷酸1432可以使连接区双链化以促进连接。桥寡核苷酸1432可以结合到每个寡核苷酸1412a、1412b上的杂交区1428a、1428b,这允许DNA连接酶将两个寡核苷酸1412a、1412b连接在一起。
在不同的实施方式中,阈值距离可以不同。在一些实施例中,阈值距离可以是或约是1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、1000nm,或这些值中任何两个之间的数字或范围。例如,所述距离可以在30-40nm的范围内。在一些实施例中,阈值距离可以是至少或至多为1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm或1000nm。阈值距离可受寡核苷酸1412a、1412b的长度,寡核苷酸1412a、1412b与抗体1408a、1408b的关联或连接的位置,靶1436a、1436b的大小或其任何组合影响。
细胞裂解和连接的寡核苷酸与条形码杂交
然后,可以裂解细胞以允许捕获连接的寡核苷酸1412,如图14C所示。例如,携带具有聚(dT)区1444的条形码1440(例如,随机条形码)的珠1438可以经由聚(dA)区捕获连接的寡核苷酸1412。珠1438可以另外包括标记,例如细胞和/或分子标记1448和用于子序列扩增的通用序列1452。
逆转录
然后可以进行逆转录以产生图14D所示的连接的寡核苷酸1412的互补序列1456。例如,基于莫洛尼鼠白血病病毒(MMLV)或基于Taq的逆转录酶可用于产生连接的寡核苷酸1412的互补序列。基于MMLV的逆转录酶具有链置换机制,以在互补链产生期间置换桥寡核苷酸1432。基于Taq的逆转录酶具有5'至3'核酸外切酶活性,以去除桥寡核苷酸1432。
文库制备
逆转录后,可以按照例如单细胞mRNA测序的标准方案制备测序文库。参考图14E,互补序列1456(或其反向补序列1456r)可以通过条形码1440上的通用序列1452(例如,通用P5序列或部分通用P5序列)和类型一的抗体-寡核苷酸组合物1404a的通用测序区域1416(例如通用N1序列)进行扩增。上标r表示反向互补。第一轮PCR(在本文中称为PCR1)可以使用通用引物(例如,具有P5和N1序列的引物,或其反向互补序列)生成全长(或接近全长)扩增子,所述扩增子对应于具有一个或多个标记和通用序列的连接的寡核苷酸1456r。
相同的引物可用于本文称为PCR2的第二轮PCR扩增,或N1引物可被N2引物代替,所述N2引物结合桥寡核苷酸杂交区1428a、1428b两者以获得进一步的特异性,如图14F所示。当使用该N2引物时,可以扩增具有通用测序区1416和通用序列1452两者的连接的寡核苷酸1456r的大部分。在一些实施例中,当该N2引物用于第二轮PCR时,可以扩增具有通用测序区1416和通用序列1452两者的连接的寡核苷酸1456r的大部分。
使用成对的相互作用确定组合物确定细胞组分之间的相互作用
本文的披露包括用于确定蛋白质-蛋白质相互作用的系统、方法和试剂盒。在一些实施例中,所述方法包括:使细胞与图14A中所示的第一对相互作用确定组合物1404a、1404b接触。细胞可以包含第一蛋白质靶1436a和第二蛋白质靶1436b。第一对相互作用确定组合物1404a、1404b中的每个包含与相互作用确定寡核苷酸1412a、1412b关联的蛋白质结合试剂1408a、1408b。第一对相互作用确定组合物中的一个的蛋白质结合试剂1408a、1408b能够与第一蛋白质靶1436a特异性结合,并且第一对相互作用确定组合物中的另一个的蛋白质结合试剂1408b能够与第二蛋白质靶1436b特异性结合到。相互作用确定寡核苷酸1412a、1412b包含相互作用确定序列1424a、1434b和桥寡核苷酸杂交区1428a、1428b。第一对相互作用确定组合物1404a、1404b的相互作用确定序列1424a、1424b可以包含不同的序列。
参照图14B,所述方法可以包括使用桥寡核苷酸1432连接第一对相互作用确定组合物1404a、1404b的相互作用确定寡核苷酸1412a、1412b以产生连接的相互作用确定寡核苷酸1412。桥寡核苷酸1432可包含能够与第一对相互作用确定组合物1404a、1404b的桥寡核苷酸杂交区1428a、1428b特异性结合的两个杂交区。
参照图14C,所述方法可以包括使用多个条形码1440对连接的相互作用确定寡核苷酸1412进行条形码编码以产生多个经条形码编码的相互作用确定寡核苷酸1456。多个条形码1440中的每个可以包含条形码序列1448和捕获序列1444。所述方法可以包括获得多个经条形码编码的相互作用确定寡核苷酸1456的测序数据。所述方法可以包括基于获得的测序数据中第一对相互作用确定组合物1404a、1404b的相互作用确定序列1424a、1424b的关联,确定第一蛋白质靶和第二蛋白质靶1436a、1436b之间的相互作用。
本文披露包括用于确定细胞组分靶之间的相互作用的系统、方法和试剂盒。在一些实施例中,所述方法包括:使细胞与图14A中所示的第一对相互作用确定组合物1404a、1404b接触。细胞可以包含第一细胞组分靶和第二细胞组分靶(例如,第一蛋白质靶1436a和第二蛋白质靶1436b)。第一对相互作用确定组合物中的每个可包含与相互作用确定寡核苷酸1412a、1412b关联的细胞组分结合试剂(例如抗体1408a、1408b)。第一对相互作用确定组合物1404a、1404b中的一个的细胞组分结合试剂能够与第一细胞组分靶(例如蛋白质靶1436a)特异性结合,并且第一对相互作用确定组合物中的另一个1404b的细胞组分结合试剂能够与第二细胞组分靶(例如蛋白质靶1436b)特异性结合。相互作用确定寡核苷酸1412a、1412b可以包含相互作用确定序列1424a、1424b和桥寡核苷酸杂交区1428a、1428b。第一对相互作用确定组合物1404a、1404b的相互作用确定序列1424a、1424b可以包含不同的序列。
参照图14B,所述方法可以包括使用桥寡核苷酸1432连接第一对相互作用确定组合物1404a、1404b的相互作用确定寡核苷酸1412a、1412b以产生连接的相互作用确定寡核苷酸1412。桥寡核苷酸1432可包含能够与第一对相互作用确定组合物1404a、1404b的桥寡核苷酸杂交区1428a、1428b特异性结合的两个杂交区。
参照图14C,所述方法可以包括使用多个条形码1440对连接的相互作用确定寡核苷酸1412进行条形码编码以产生多个经条形码编码的相互作用确定寡核苷酸1456。多个条形码1440中的每个可以包含条形码序列1448和捕获序列1444。所述方法可以包括获得多个经条形码编码的相互作用确定寡核苷酸1456的测序数据。所述方法可以包括基于获得的测序数据中第一对相互作用确定组合物1404a、1404b的相互作用确定序列1424a、1424b的关联,确定第一细胞组分靶和第二细胞组分靶1436a、1436b之间的相互作用。在一些实施例中,两个细胞组分结合试剂中的至少一个可以包含蛋白质结合试剂。蛋白质结合试剂可以与两个相互作用确定寡核苷酸中的一个关联。一个或多个细胞组分靶可以包含至少一个蛋白质靶。
在一些实施例中,使所述细胞与所述第一对相互作用确定组合物1404a、1404b接触包括:使所述细胞与所述第一对相互作用确定组合物1404a、1404b中的每个依次或同时接触。第一蛋白质靶1436a可以与第二蛋白质靶1436b相同。第一蛋白质靶1436a可以与第二蛋白质靶1436b不同。第一和第二细胞组分靶可以相同或不同。
在不同的实施方式中,相互作用确定寡核苷酸1412a、1412可以具有不同的长度。在一些实施例中,相互作用确定寡核苷酸1412a、1412b的长度是或约是6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000个或这些值中任何两个之间的数字或范围的核苷酸。在一些实施例中,相互作用确定寡核苷酸1412a、1412b的长度是至少或至多6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、110、120、128、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、或1000个核苷酸。
在一些实施例中,所述方法包括:使细胞与第二对相互作用确定组合物接触。细胞可以包含第三细胞组分靶和第四细胞组分靶(例如第三蛋白质靶和第四蛋白质靶)。第二对相互作用确定组合物中的每个可以包含与相互作用确定寡核苷酸关联的细胞组分结合试剂。第二对相互作用确定组合物中的一个的细胞组分结合试剂能够与第三细胞组分靶特异性结合,并且第二对相互作用确定组合物中的另一个的细胞组分结合试剂能够与第四细胞组分靶特异性结合。在一些实施例中,第三和第四细胞组分靶中的至少一个可以与第一和第二细胞组分靶中的一个不同。在一些实施例中,第三和第四细胞组分靶中的至少一个可以与第一和第二细胞组分靶中的至少一个相同。
在一些实施例中,所述方法包括:使所述细胞与三对或更多对相互作用确定组合物接触。多对相互作用确定组合物中的许多相互作用确定组合物的相互作用确定序列可以包含相同或不同的序列。在一些实施例中,具有相互作用确定序列(其具有相同或不同序列)的相互作用确定组合物的数量可以是或约是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、或这些值的任何两个之间的数字或范围。在一些实施例中,具有相互作用确定序列(其具有相同或不同序列)的相互作用确定组合物的数量可以是至少或至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10000。
在一些实施例中,第一对相互作用确定组合物1404a、1404b的桥寡核苷酸杂交区1428a、1428b包含不同的序列。桥寡核苷酸杂交区1428a、1428b中的至少一个可以与桥寡核苷酸1432的两个杂交区中的至少一个互补。
在一些实施例中,使用桥寡核苷酸1432连接第一对相互作用确定组合物1404a、1404b的相互作用确定寡核苷酸1412a、1412b包括:将桥寡核苷酸1432的第一杂交区与相互作用确定寡核苷酸的桥寡核苷酸杂交区的第一桥寡核苷酸杂交区1428a杂交;使桥寡核苷酸的第二杂交区与相互作用确定寡核苷酸的桥寡核苷酸杂交区的第二桥寡核苷酸杂交区1428b杂交;并且连接与桥寡核苷酸1432杂交的相互作用确定寡核苷酸1428a、1428b以产生连接的相互作用确定寡核苷酸。
在一些实施例中,一个或多个细胞组分靶(例如蛋白质靶1436a、1436b)中的至少一个在细胞表面上。在一些实施例中,所述方法可以包括:在使细胞与第一对相互作用确定组合物1404a、1404b接触之前固定细胞。在一些实施例中,所述方法可以包括:去除第一对相互作用确定组合物1404a、1404b中的未结合的相互作用确定组合物。去除所述未结合的相互作用确定组合物可以包括用洗涤缓冲液洗涤所述细胞。去除所述未结合的相互作用确定组合物可以包括使用流式细胞术选择所述细胞。在一些实施例中,所述方法可以包括:裂解所述细胞。
在一些实施例中,相互作用确定寡核苷酸被配置为与蛋白质结合试剂可分离或不可分离。所述方法可以包括:使相互作用确定寡核苷酸1412a、1412b或连接的相互作用确定寡核苷酸1412与细胞组分结合试剂分离。分离相互作用确定寡核苷酸1412a、1412b可以包括通过UV光切割、化学处理,加热,酶处理或其任何组合使相互作用确定寡核苷酸1412a、1412b与细胞组分结合试剂分离。相互作用确定寡核苷酸1412a、1412b可以与细胞的基因组序列不同源。相互作用确定寡核苷酸1412a、1412b可以与物种的基因组序列同源。
在一些实施例中,第一对相互作用确定组合物1404a、1404b中的一个的相互作用确定寡核苷酸1412b包含与捕获序列1444互补的序列1420。捕获序列1444可以包含聚(dT)区。与捕获序列1444互补的相互作用确定寡核苷酸的序列1420可包含聚(dA)区。在一些实施例中,相互作用确定寡核苷酸1412a、1412b包含第二条形码序列。第一对相互作用鉴定组合物1404a、1404b中的另一个的相互作用确定寡核苷酸1412a可包含通用引物1416的结合位点。相互作用确定寡核苷酸1404a、1404b可以与可检测部分关联。
在一些实施例中,细胞组分结合试剂可以与具有相同或不同相互作用确定序列1428a、1428b的两个或更多个相互作用确定寡核苷酸1412a、1412b关联。在一些实施例中,多个相互作用确定组合物1404a、1404b中的一个包含不与相互作用确定寡核苷酸关联的第二蛋白质结合试剂。细胞组分结合试剂和第二细胞组分结合试剂可以相同。细胞组分结合试剂可以与可检测部分关联。细胞组分结合试剂1404a、1404b可以与具有相同序列的两个或更多个相互作用确定寡核苷酸1412a、1412b关联。
在一些实施例中,所述方法包括:使两个或更多个细胞与第一对相互作用确定组合物1404a、1404b接触。两个或更多细胞中的每个可以包含第一和第二细胞组分靶(例如,第一和第二蛋白靶1436a、1436b)。所述两个或更多个细胞中的至少一个可以包含单细胞。
参考图14B,条形码1440包含细胞标记序列1448、通用引物的结合位点或其任何组合。多个条形码中的至少两个条形码可以包含相同的细胞标记序列1448。
在一些实施例中,细胞组分靶是或包含细胞外蛋白质、细胞内蛋白质或其任何组合。细胞组分靶可以是或包含脂质、碳水化合物或其任何组合。细胞组分靶可以选自包含10-100个不同细胞组分靶的组。
在一些实施例中,多个条形码与颗粒(例如,珠1438)关联。多个条形码中的至少一个条形码可以固定在颗粒上。多个条形码中的至少一个条形码可以部分地固定在颗粒上。多个条形码中的至少一个条形码可以被封闭在颗粒中。多个条形码中的至少一个条形码可以部分地封闭在颗粒中。颗粒可以是可破坏的。在一些实施例中,颗粒的条形码包含选自至少1000、10000或更多个不同条形码序列的条形码序列。
参考图14C,使用多个条形码1440对相互作用确定寡核苷酸1412进行条形码编码包括:使多个条形码1440与相互作用确定寡核苷酸1412接触以产生与相互作用确定寡核苷酸杂交的条形码;并且延伸与相互作用确定寡核苷酸杂交的条形码以产生多个经条形码编码的相互作用确定寡核苷酸1456。延伸条形码1440可以包括使用DNA聚合酶延伸条形码1440以产生多个经条形码编码的相互作用确定寡核苷酸1456。延伸条形码1440可以包括使用逆转录酶延伸条形码1440以产生多个经条形码编码的相互作用确定寡核苷酸14。延伸条形码14可以包括使用莫洛尼鼠白血病病毒(M-MLV)逆转录酶或Taq DNA聚合酶延伸条形码14以产生多个经条形码编码的相互作用确定寡核苷酸1456。延伸条形码14可以包括从连接的相互作用确定寡核苷酸1412置换桥寡核苷酸1432。
参照图14D和图14E,所述方法可以包括:扩增多个经条形码编码的相互作用确定寡核苷酸1456以产生多个扩增子。扩增多个经条形码编码的相互作用确定寡核苷酸1456可以包括使用聚合酶链式反应(PCR)扩增条形码序列1448的至少一部分和相互作用确定寡核苷酸1428a、1428b的至少一部分。获得多个经条形码编码的相互作用确定寡核苷酸1456的测序数据可以包括获得多个扩增子的测序数据。获得测序数据可以包括对条形码序列1448的至少一部分和相互作用确定寡核苷酸1428a、1428b的至少一部分进行测序。在一些实施例中,获得多个经条形码编码的相互作用确定寡核苷酸1456的测序数据包括获得多个经条形码编码的相互作用确定寡核苷酸1456(或反向序列、互补序列、反向互补序列1456r或其任何组合)的部分序列和/或完整序列。
参考图14C,多个条形码1440可包含多个随机条形码。多个随机条形码中的每个的条形码序列可以包含分子标记序列1448。多个随机条形码中的至少两个随机条形码的分子标记序列1448可以包含不同的序列。使用多个条形码1440对相互作用确定寡核苷酸1412进行条形码编码以产生多个经条形码编码的相互作用确定寡核苷酸1456可以包括使用多个随机条形码对相互作用确定寡核苷酸1412进行随机条形码编码以产生多个经随机经条形码编码的相互作用确定寡核苷酸。
所述方法还可以与其他单细胞RNA测序方法一起使用。例如,一个单工作流程可以用于确定mRNA表达水平、蛋白质表达水平(或细胞组分靶的表达水平)和/或蛋白质-蛋白质相互作用(或细胞组分之间的相互作用)。结果,在单实验中,可以获得单细胞(或多个单细胞)中有关mRNA表达、蛋白质表达和蛋白质-蛋白质相互作用的数据。在一些实施例中,所述方法包括:使用多个条形码1440对细胞的多个靶(例如,目的mRNA种类)进行条形码编码以产生多个经条形码编码的靶;并且获得所述经条形码编码的靶的测序数据。使用多个条形码1440对所述多个靶进行条形码编码以产生多个经条形码编码的靶可以包括:使靶的拷贝与条形码1440的靶结合区(例如,聚(dT)区1444)接触;并且使用多个条形码1440对所述多个靶进行逆转录以产生多个逆转录的靶。所述方法可以包括:在获得多个经条形码编码的靶的测序数据之前,扩增经条形码编码的靶以产生多个扩增的经条形码编码的靶(类似于扩增图14E和图14F所示的经条形码编码的相互作用确定寡核苷酸1456)。扩增所述经条形码编码的靶以产生所述多个扩增的经条形码编码的靶可以包括:通过聚合酶链式反应(PCR)扩增所述经条形码编码的靶。使用多个条形码1440对细胞的多个靶进行条形码编码以产生多个经条形码编码的靶可以包括使用多个随机条形码对细胞的多个靶进行随机条形码编码以产生多个经随机经条形码编码的靶。
本文披露的实施例还包括用于鉴定细胞组分-细胞组分相互作用(例如,蛋白质-蛋白质相互作用)的试剂盒。在一些实施例中,试剂盒包含:第一对相互作用确定组合物,其中所述第一对相互作用确定组合物的每个包含与相互作用确定寡核苷酸关联的细胞组分结合试剂,其中所述第一对相互作用确定组合物中的一个的细胞组分结合试剂能够与第一细胞组分靶特异性结合并且所述第一对相互作用确定组合物中的另一个的细胞组分结合试剂能够与所述第二细胞组分靶特异性结合,其中所述相互作用确定寡核苷酸包含相互作用确定序列和桥寡核苷酸杂交区,并且其中所述第一对相互作用确定组合物的相互作用确定序列包含不同的序列;以及多个桥寡核苷酸,其各自包含能够与所述第一对相互作用确定组合物的桥寡核苷酸杂交区特异性结合的两个杂交区。
在一些实施例中,试剂盒包含:第二对相互作用确定组合物,其中所述第二对相互作用确定组合物的每个包含与相互作用确定寡核苷酸关联的细胞组分结合试剂,其中所述第二对相互作用确定组合物中的一个的细胞组分结合试剂能够与第三细胞组分靶特异性结合并且所述第二对相互作用确定组合物中的另一个的细胞组分结合试剂能够与第四细胞组分靶特异性结合。在一些实施例中,试剂盒包含:三对或更多对相互作用确定组合物。
在一些实施例中,试剂盒包含:多个条形码,其中所述多个条形码中的每个包含条形码序列和捕获序列。所述多个条形码可以包含多个随机条形码,其中所述多个随机条形码中的每个的条形码序列包含条形码序列(例如,分子标记序列),其中所述多个随机条形码中的至少两个随机条形码的条形码序列包含不同的序列。在一些实施例中,多个条形码与颗粒关联。多个条形码中的至少一个条形码可以固定在颗粒上、部分固定在颗粒上、封闭在颗粒中、部分封闭在颗粒中,或其任何组合。颗粒可以是可破坏的。颗粒可以包含珠。
在一些实施例中,试剂盒包含:DNA聚合酶。试剂盒可以包含逆转录酶。试剂盒可以包含:莫洛尼鼠白血病病毒(M-MLV)逆转录酶或Taq DNA聚合酶。在一些实施例中,所述方法包含固定剂(例如福尔马林、多聚甲醛、戊二醛/四氧化锇、酒精固定剂、Hepes-谷氨酸缓冲液介导的有机溶剂保护作用(HOPE),波恩溶液(Bouin solution)或其任何组合)。
实例
上文所讨论的实施例的一些方面在以下实例中进一步详细地披露,这些实例不以任何方式旨在限制本披露的范围。
实例1
与蛋白质结合试剂缀合的寡核苷酸
该实例表明设计可以与蛋白质结合试剂缀合的寡核苷酸。可以将这些寡核苷酸用于同时确定蛋白质表达和基因表达。寡核苷酸也可用于样品索引以确定相同或不同样品的细胞。
95mer寡核苷酸设计
将以下方法用于生成候选寡核苷酸序列和相应的引物序列用于同时确定蛋白质表达和基因表达或样品索引。
1.序列生成和消除
将以下方法用于生成用于同时确定蛋白质表达和基因表达或样品索引的候选寡核苷酸序列。
步骤1a.随机生成许多具有所需长度(45bp)的候选序列(50000个序列)。
步骤1b.将转录调控LSRR序列附接在所生成的序列的5’末端,并且将聚(A)序列(25bp)附接在所生成的序列的3’末端。
步骤1c.去除所生成并附接的不具有在40%至50%范围内的GC含量的序列。
步骤1d.去除各自具有一个或多个发夹结构的剩余序列。
剩余候选寡核苷酸序列的数量是423。
2.引物设计
将以下方法用于设计针对剩余423个候选寡核苷酸序列的引物。
2.1 N1引物:使用通用N1序列:5’-GTTGTCAAGATGCTACCGTTCAGAG-3’(LSRR序列;SEQ ID NO.5)作为N1引物。
2.2N2引物(用于扩增特定的样品索引寡核苷酸;例如图15B-图15D中的N2引物):
2.2a.去除不从N1序列下游开始的候选N2引物。
2.2b.去除与候选寡核苷酸序列的最后35bp重叠的候选N2引物。
2.2c.使用寡核苷酸(例如,人转录组或小鼠转录组)去除与正在被研究的细胞种类的转录组对齐的引物候选物。
2.2d.使用ILR2序列作为默认对照(ACACGACGCTCTTCCGATCT;SEQ ID NO.8)以最小化或避免引物-引物相互作用。
在423个候选寡核苷酸序列中,设计针对390个候选序列的N2引物。
3.筛选
将以下方法用于筛选剩余390个候选引物序列。
3a.消除具有以As结尾的随机序列的任何候选寡核苷酸序列(即聚(A)序列的有效长度大于25bp),以使聚(A)尾对于所有条形码保持相同的长度。
3b.消除具有4个或更多个连续G(>3G)的任何候选寡核苷酸序列,因为Gs运行的寡核苷酸合成中的额外成本和潜在较低的产率。
图15A示出了使用以上方法生成的非限制性示例性候选寡核苷酸序列。
200mer寡核苷酸设计
将以下方法用于生成候选寡核苷酸序列和相应的引物序列用于同时确定蛋白质表达和基因表达和样品索引。
1.序列生成和消除
将以下用于生成用于同时确定蛋白质表达和基因表达和样品索引的候选寡核苷酸序列。
1a.随机生成许多具有所需长度(128bp)的候选序列(100000个序列)。
1b.将转录调控LSRR序列和另外的非人类、非小鼠锚定序列附接在所生成的序列的5’末端,并且将聚(A)序列(25bp)附接在所生成的序列的3’末端。
1c.去除所生成并附接的不具有在40%至50%范围内的GC含量的序列。
1d.基于发夹结构得分分选剩余的候选寡核苷酸序列。
1e.选择具有最低发夹得分的1000个剩余的候选寡核苷酸序列。
2.引物设计
将以下方法用于设计针对具有最低发夹得分的400个候选寡核苷酸序列的引物。
2.1N1引物:使用通用N1序列:5’-GTTGTCAAGATGCTACCGTTCAGAG-3’(LSRR序列;SEQID NO.5)作为N1引物。
2.2 N2引物(用于扩增特定的样品索引寡核苷酸;例如图15B和图15C中的N2引物):
2.2a.去除不从N1序列的下游23nts开始的候选N2引物(该锚定序列在所有候选寡核苷酸序列中是通用的)。
2.2b.去除在靶序列的最后100bp重叠的候选N2引物。所得引物候选物可以在靶序列的第48个核苷酸和第100个核苷酸之间。
2.2c.使用寡核苷酸(例如,人转录组或小鼠转录组)去除与正在被研究的细胞种类的转录组对齐的引物候选物。
2.2d.使用ILR2序列5’-ACACGACGCTCTTCCGATCT-3’(SEQ ID NO.8)作为默认对照,以最小化或避免引物-引物相互作用。
2.2e.去除在靶序列的最后100bp重叠的N2引物候选物。
在400个候选寡核苷酸序列中,设计针对392个候选序列的N2引物。
3.筛选
将以下用于筛选剩余392个候选引物序列。
3a.消除具有以As结尾的随机序列的任何候选寡核苷酸序列(即聚(A)序列的有效长度大于25bp),以使聚(A)尾对于所有条形码保持相同的长度。
3b.消除具有4个或更多个连续G(>3G)的任何候选寡核苷酸序列,因为Gs运行的寡核苷酸合成中的额外成本和潜在较低的产率。
图15B示出了使用以上方法生成的非限制性示例性候选寡核苷酸序列。图15B中所示的巢式N2引物可以结合抗体或样品特异性序列用于靶向扩增。图15C示出了具有与锚定序列相对应的用于靶向扩增的巢式通用N2引物的相同非限制性示例性候选寡核苷酸序列。图15D示出了具有用于一步靶向扩增的N2引物的相同的非限制性示例性候选寡核苷酸序列。
总之,这些数据表明可以设计不同长度的寡核苷酸序列用于同时确定蛋白质表达和基因表达或样品索引。这些寡核苷酸序列可以包括通用引物序列、抗体特异性寡核苷酸序列或样品索引序列、和聚(A)序列。
实例2
对不同抗体:寡核苷酸比率情况下的检测灵敏度的比较
该实例表明使用与1、2、或3个寡核苷酸缀合的抗CD4抗体,CD4蛋白质的检测灵敏度。
将受试者的冷冻的外周血单核细胞(PBMC)解冻。将解冻的PBMC用三种类型的抗CD4抗体以0.06μg/100μl(寡核苷酸-缀合的抗体储备液的1:333稀释物)在室温下染色20分钟。抗CD4抗体类型中的每一种与1、2、或3个寡核苷酸缀合(“抗体寡核苷酸”)。抗体寡核苷酸的序列示出在图16中。洗涤细胞以去除未结合的抗CD4抗体。将这些细胞用钙黄绿素AM(BD(富兰克林湖(Franklin Lake),新泽西))和Draq7TM(Abcam(剑桥,英国))染色用于使用流式细胞术进行分选以获得活细胞。将这些细胞进行洗涤以去除过量的钙黄绿素AM和Draq7TM。使用流式细胞术,将钙黄绿素AM(活细胞)而不是Draq7TM(非死细胞或透化细胞)染色的单细胞分选进入BD RhapsodyTM盒中。
在含有单细胞和珠的孔中,孔中的3500个单细胞在含有5mM DTT的裂解缓冲液中裂解。使用BD RhapsodyTM珠确定CD4 mRNA表达谱。使用BD RhapsodyTM珠和抗体寡核苷酸确定CD4蛋白质表达谱。简言之,细胞裂解后释放mRNA分子。RhapsodyTM珠与随机条形码相关联,这些随机条形码各自含有分子标记、细胞标记、和聚T区。从裂解的细胞中释放mRNA分子的聚(A)区与随机条形码的聚T区杂交。寡核苷酸的聚(A)区与随机条形码的聚T区杂交。使用随机条形码将mRNA分子逆转录。使用随机条形码复制抗体寡核苷酸。在一个样品等分试样中同时发生逆转录和复制。
使用引物(使用血液图N1引物确定488个血液图基因的mRNA表达谱,并且使用抗体寡核苷酸N1引物(“PCR 1”)确定CD4蛋白质的表达谱)将逆转录产物和复制产物在60度退火温度下PCR扩增15个循环。用Ampure清理去除过量的随机条形码。将来自PCR1的产物分成两个等分试样,使用血液图N2引物确定其中一个等分试样的488个血液图基因的mRNA表达谱,并且使用抗体寡核苷酸N2引物(“PCR 2”)确定另一个等分试样的CD4蛋白质的表达谱。在60度退火温度下将两个等分试样PCR扩增15个循环。如图16(“PCR 2”)中的说明,基于抗体寡核苷酸确定在裂解的细胞中CD4蛋白质的表达。测序衔接子连接(“PCR 3”)后获得测序数据并进行分析。基于488个血液图基因的表达谱确定细胞类型。
图17A-图17F是非限制性示例性t-分布随机邻接嵌入(tSNE)投影图,这些tSNE投影图显示了使用寡核苷酸缀合的抗体以高通量方式同时测量CD4蛋白表达和基因表达的结果。在与1、2、或3个抗体寡核苷酸缀合的抗CD4抗体的情况下,表达CD4的细胞类型(例如,CD4 T细胞)中明显且有力地检测CD4蛋白质表达(分别为图17B,图17D和图17F)。图18A-图18F是显示在CD4 T细胞(高CD4表达)、CD8 T细胞(最低CD4表达)、和髓样细胞(一些CD4表达)中CD4 mRNA和蛋白质表达的非限制性示例性条形图。在相似测序深度情况下,CD4蛋白质水平的检测灵敏度随着抗体:寡核苷酸的比率增加而增加,其中1:3比率表现优于1:1和1:2比率(图19)。如图20A-图20D显示,使用FlowJo(FlowJo(亚什兰公司(Ashland),OR))确认在使用流式细胞术分选的细胞的细胞表面上CD4蛋白质的表达。图21A-图21F是非限制性示例性条形图,所述条形图显示了两个样品中CD4 T细胞、CD8 T细胞和髓样细胞中CD4mRNA和CD4蛋白质的表达。使用两种不同样品的制备方案制备第二样品。图22是显示使用不同样品制备方案确定的CD4蛋白质水平的检测灵敏度的非限制性示例性条形图,其中抗体:寡核苷酸比率为1:3。
总之,这些数据表明基于与抗CD4抗体缀合的寡核苷酸可以明显且有力地检测CD4蛋白质表达。CD4蛋白质水平的检测灵敏度可以随着更高的抗体:寡核苷酸比率而增加。
实例3
样品索引
本实例说明了使用具有高标记效率和低非特异性标记或溢出标记(spill over)的样品索引鉴定不同样品的细胞。该实例还说明了样品索引寡核苷酸的长度和样品索引寡核苷酸的可切割性对样品索引的影响。
图23示出了用于执行样品索引并确定样品索引寡核苷酸的长度的影响和样品索引寡核苷酸在样品索引时的可切割性的非限制性示例性实验设计。图23的左列显示Jurkat细胞用具有不同样品索引寡核苷酸的抗CD147抗体标记,以确定样品索引寡核苷酸的长度和样品索引寡核苷酸的可切割性对样品索引的影响。与抗CD147抗体缀合的寡核苷酸是可从抗体切割的200个核苷酸的长度(T-接头),可切割的95个核苷酸的长度(T-接头)和不可切割的95个核苷酸的长度。在进一步的样品制备之后,使用RhapsodyTM流动池(图23中标记为“流动池1”,缩写为FC1)确定样品索引寡核苷酸的长度和样品索引寡核苷酸的可切割性对样品索引的影响。样品制备包括钙黄绿素AM和Draq7TM染色,使用流式细胞仪进行细胞分选以及随机条形码编码。
图23的中间列显示了用抗CD147抗体标记的细胞,所述抗体与可切割的三个不同的样品索引寡核苷酸缀合(图23中的样品索引寡核苷酸,标记为“短1”,“短2”和“短3”,可以缩写为S1、S2和S3)。Ramos细胞用两种类型的抗CD147抗体标记,所述抗体与可切割的不同样品索引寡核苷酸缀合(所述样品索引寡核苷酸在图23中标记为“短1”和“短2”)。Jurkat细胞用两种类型的抗CD147抗体标记,所述抗体与可切割的不同样品索引寡核苷酸缀合(所述样品索引寡核苷酸在图23中标记为“短1”和“短3”)。将经标记的细胞以1:1的比例混合,然后进一步制备样品并使用RhapsodyTM流动池(图23中标记为“流动池2”,缩写为FC2)确定样品索引的效率和特异性。图23中的右列显示了对照实验,其中未经标记的Jurkat细胞和Ramos细胞以1:1的比例混合,然后进一步制备样品并使用RhapsodyTM流动池(图23中标记为“流动池3”,缩写为FC3)分析)。
在室温下用与样品索引寡核苷酸以1:3的抗体:寡核苷酸比率缀合的抗体对细胞染色20分钟。使用pH 7.5稀释剂,从寡核苷酸结合的抗体储备液以1:20的稀释度在100μl中稀释抗体。洗涤细胞以去除未结合的抗CD147抗体。用钙黄绿素AM(活细胞染色)和Draq7TM(死细胞或透化细胞染色)对细胞染色,用流式细胞仪分选以获得活细胞。将这些细胞进行洗涤以去除过量的钙黄绿素AM和Draq7TM。使用流式细胞仪将用钙黄绿素AM染色而不是Draq7TM染色的单细胞分选到含有流动池的BD RhapsodyTM盒中。
在含有单细胞和珠的孔中,孔中的1000个单细胞在裂解缓冲液中裂解。使用BDRhapsodyTM珠确定CD147 mRNA表达谱。简言之,细胞裂解后释放mRNA分子。RhapsodyTM珠与随机条形码相关联,这些随机条形码各自含有分子标记、细胞标记、和聚T区。从裂解的细胞中释放mRNA分子的聚(A)区与随机条形码的聚T区杂交。将如果可切割的话从抗体切割的样品索引寡核苷酸的聚(A)区杂交到随机条形码的聚T区。使用随机条形码将mRNA分子逆转录。使用随机条形码复制抗体寡核苷酸。在一个样品等分试样中同时发生逆转录和复制(在60度退火温度下进行15个循环)。
使用引物(使用血液图N1引物确定488个血液图基因的mRNA表达谱,并且使用样品索引寡核苷酸N1引物(“PCR 1”)确定CD147蛋白质的表达)将逆转录产物和复制产物在60度退火温度下PCR扩增15个循环。用Ampure清除去除过量的引物。使用具有用于衔接子连接的侧翼序列的血液图N2引物和样品索引寡核苷酸N1引物,在60度退火温度下将来自PCR1的产物进一步PCR扩增(“PCR 2”)15个循环。测序衔接子连接(“PCR 3”)后获得测序数据并进行分析。基于488个血液图基因的表达谱确定细胞类型。
表1示出了使用图23所示的实验设计获得的测序数据的度量。与三种类型的样品索引寡核苷酸(图23左栏所示的可切割的95mer,不可切割的95mer和可切割的200mer)中的任何一种缀合的三种类型的抗CD147抗体已成功用于样品索引。测序数据中读数总数的11%以上归因于样品索引寡核苷酸。
表1.样品索引寡核苷酸的测序度量。
与三个可切割的95mer(在图23的中间列标记为“短1”,“短2”和“短3”)中的任何一个缀合的三种类型的抗CD147抗体已成功用于样品索引以区分不同样品的Ramos和Jurkat细胞。测序数据中读数总数的11%以上归因于样品索引寡核苷酸。对于同时包含Jurkat和Ramos细胞的样品,该百分比最高(16.7%)。
图24A-图24C是细胞表达谱的非限制性示例性tSNE图,其显示了与不同的样品索引寡核苷酸(可切割的95mer,不可切割的95mer和可切割的200mer)缀合的三种类型的抗CD147抗体可以用于确定CD147的蛋白表达水平。使用样品索引寡核苷酸确定的在细胞表达谱的tSNE投影图上的CD147表达的叠加显示使用不同样品索引寡核苷酸确定的CD147表达模式相似。三个样品索引寡核苷酸的检测为100%。图25是非限制性示例性tSNE图,其中叠加GAPDH表达/细胞。该图右上角的“细胞”的GAPDH值较低,表明它们不是真实的细胞。这些“细胞”的样品索引寡核苷酸很高。
图26A-图26C是非限制性示例性直方图,其示出了使用三种类型的样品索引寡核苷酸检测到的样品索引寡核苷酸的分子数量。就检测的分子数量而言,不可切割的样品索引寡核苷酸是最敏感的。
图27A-图27C是显示CD147表达在分裂细胞中更高的图和条形图(使用图23中的“流动池1”确定)。在Jurkat细胞样品中,跨细胞的CD147表达不一致。可以基于细胞周期基因AURKB对细胞进行分类。AURKB基因的mRNA表达与使用样品索引确定的CD147蛋白表达相关。图27C显示了使用三个样品索引寡核苷酸确定的AURKB+和AURKB-细胞中CD147表达的比较。
图28A-图28C是细胞表达谱的非限制性的示例性tSNE投影图,其示出了可以将样品索引用于鉴定不同样品的细胞。过滤测序数据中样品索引寡核苷酸的读数,其中包含488个血液图基因的表达谱。图28A-图28C中的tSNE投影图使用过滤的测序数据产生。对应于Jurkat细胞的簇和对应于Ramos细胞的簇(根据图23中标记为“短1”的样品索引寡核苷酸的丰度确定)在图28A的tSNE投影图中清楚地分开(类似于图28B-图28C)。
样品索引正确匹配细胞类型。例如,图28B显示了用在图23中标记为“短2”的样品索引寡核苷酸标记的Ramos细胞具有高表达的CD147,而未经标记的Jurkat细胞具有最低的CD147表达。例如,图28C显示了用在图23中标记为“短3”的样品索引寡核苷酸标记的Jurkat细胞具有高表达的CD147,而未经标记的Ramos细胞具有低CD147表达。频率为3.6%的小双重态簇与孔占用率的图像分析得出的预期双重态率为3.92%紧密匹配。
图29A-图29C是基于确定的样品索引寡核苷酸的分子数量的每个细胞的样品索引序列的非限制性示例性直方图。测序数据已使用基于分布的错误校正(DBEC)(截断值为250)进行了校正。DBEC已经内描述于2017年5月25日提交的美国专利申请号15/605874中,通过引用将该内容以其全文并入本文。在DBEC之后,在100s中似乎存在明显的“噪音”峰值,该峰值可与在1000s中的“信号”峰值区分开(图29B-图29C)。图29B-图29C还显示,在减去250的噪音后,检测到样品索引寡核苷酸处于高100s中。
图30A-图30D是非限制性示例性图,其比较了基于CD3D(对于Jurkat细胞)和JCHAIN(对于Ramos细胞)的mRNA表达以及Jurkat和Ramos细胞的样品索引确定的细胞类型的注释。图30A是非限制性示例性直方图,其示出了JCHAIN表达的信号峰与噪音信号(其中每个细胞具有少量样品索引寡核苷酸分子)的清楚分开。图30B是非限制性示例性直方图,其示出了Ramos表达的信号峰与噪音信号(其中每个细胞具有少量样品索引寡核苷酸分子)的清楚分开。双重态被鉴定为具有计数超过250的多于一个样品索引序列的细胞。在图30C下,使用JCHAIN的mRNA表达鉴定Ramos细胞,并使用CD3D的mRNA表达鉴定Jurkat细胞。
Ramos细胞用两种类型的抗CD147抗体标记,所述抗体与可切割的不同样品索引寡核苷酸缀合(所述样品索引寡核苷酸在图23中标记为“短1”和“短2”)。Jurkat细胞用两种类型的抗CD147抗体标记,所述抗体与可切割的不同样品索引寡核苷酸缀合(所述样品索引寡核苷酸在图23中标记为“短1”和“短3”)。在图30D中,根据测序数据中“短2”样品索引寡核苷酸的计数数量(大于250)鉴定Ramos细胞的身份,并根据测序数据中“短3”样品索引寡核苷酸的计数数量(大于250)鉴定Jurkat细胞的身份。
图31A-图31C是Jurkat和Ramos细胞的mRNA表达谱的非限制性tSNE投影图,其中叠加CD3D和JCHAIN(图31A)、JCHAIN(图31B)和CD3D(图31C)的mRNA表达。如所预期的,JCHAIN的mRNA表达在Ramos细胞中较高(图31B),而在Jurkat细胞中最低(图31C)。CD3D的mRNA表达在Jurkat细胞中较高(图31C),而在Ramos细胞中最低(图31B)。
图28B-图28C与图31B-图31C的比较揭示了在区分不同样品的细胞中样品索引的高性能。在确定样品来源方面样品索引的性能示于图32。图32是Jurkat和Ramos细胞的表达谱的非限制性示例性tSNE投影图,其中叠加使用样品索引以250的DBEC截断值确定的细胞类型。表2是使用图32中所示的样品索引确定的细胞类型的汇总。表3显示了在确定样品来源方面样品索引的灵敏度和特异性,其中排除了表2中的双重态和不确定细胞。
表2.使用样品索引确定样品来源的汇总。
S2 | S2+S3 | S3 | 未经标记 | |
双重态 | 0 | 36 | 1 | 0 |
Jurkat | 0 | 5 | 658 | 12 |
Ramos | 833 | 4 | 0 | 0 |
未知 | 30 | 0 | 17 | 0 |
表3.样品索引在确定样品来源方面的特异性和灵敏度。
特异性 | 灵敏度 | |
S2(Ramos) | 99.5%(833/(833+4)) | 100%(833/(833+0)) |
S3(Jurkat) | 99.25%(658/(658+4)) | 98.2%(658/(658+12)) |
图33A-图33C是针对Ramos和Jurkat细胞(图33)、Ramos细胞(图33B)和Jurkat细胞(图33C)(这些细胞未标记或标记“短3”样品索引寡核苷酸,“短2”和“短3”样品索引寡核苷酸以及“短2”样品索引寡核苷酸)的每个细胞的样品索引寡核苷酸的分子数量的非限制性示例性条形图。少于1%的单细胞被“短2”和“短3”样品索引寡核苷酸标记(图34A-34C)。
图35A-图35C是非限制性示例性tSNE图,其显示了对如图23中概述的使用不同流通池制备的样品间的Jurkat和Ramos细胞的表达谱的批次效应。图35A显示了Jurkat和Ramos细胞的表达谱的非限制性示例性tSNE投影图,其中所述细胞的不同样品制备物叠加。不同样品制备物之间的488个血液图基因(图35B)和CD3D基因(图35C)的mRNA表达谱的变化可能是由于使用不同流动池制备的样品的测序深度不同而产生的批次效应的结果。
总而言之,这些数据表明样品索引寡核苷酸的所有三个版本(95mer可切割,95mer不可切割和200mer可切割)可用于样品索引,其中95mer不可切割具有最高效率。用于确定样品来源的样品索引可以具有高特异性和灵敏度。
实例4
热:冷抗体滴定
该实例表明确定寡核苷酸-缀合的抗体(“热抗体”)和不与寡核苷酸缀合的抗体(“冷抗体”)的比率,使得这些抗体寡核苷酸占测序数据中总读数的所希望的百分比(例如,2%)。
用PE缓冲液将抗CD147抗体储备液按1:20、1:100、1:200、1:300、1:400、1:600、1:800、和1:1000稀释液进行稀释。在室温下,将100μl染色缓冲液(FBS)中(BD(富兰克林湖(Franklin Lake),新泽西))的大约150000个Jurkat细胞在各种抗体稀释液中染色20分钟。染色后,用500μl染色缓冲液将这些细胞洗涤一次,并重悬浮于200μl中用于测量荧光强度。将MuseTM Autophagy LC3-抗体(EMD密理博公司(EMD Millipore)(比勒利卡(Billerica),马萨诸塞州))用于检测与Jurkat细胞结合的抗CD147抗体。测量并比较在各种抗CD147抗体稀释液中染色的细胞或未被染色的细胞的荧光强度,从而确定抗体的最佳稀释(图36A1-图36A9、图36B和图36C)。荧光强度随着稀释的增加而增加。在1:800的稀释比率情况下超过99%的细胞被染色。荧光信号在1:800处开始下降。将细胞染色至饱和直至稀释比率为1:200。将细胞染色接近饱和直至稀释比率为1:400。
图37显示了用于确定寡核苷酸-缀合的抗体的染色浓度使得抗体寡核苷酸占测序数据中总读数的所需百分比的非限制性示例性实验设计。按1:3(“热抗体”)的抗体:寡核苷酸比率将抗CD147抗体与可切割的95mer抗体寡核苷酸缀合。使用pH 7.5稀释液,按1:100比率或按1:800比率稀释热抗体。使用9μl冷抗CD147抗体和1μl热抗体制备10%热抗体:90%冷抗体的混合物。使用9μl冷抗CD147抗体以及1μl的10%热抗体:90%冷抗体的混合物制备1%热抗体:90%冷抗体的混合物。
在具有1:100稀释的储备液(其具有100%热抗体(1%的储备热抗体)、10%热抗体:90%冷抗体(0.1%的储备热抗体)的混合物、1%热抗体:99%冷抗体(0.01%的储备热抗体)的混合物)和1:800稀释的储备液(其具有100%热抗体(0.0125%的储备热抗体)的100μl染色缓冲液(FBS)中,对具有大约50万个细胞的解冻的外周血单核细胞(PBMC)进行染色。染色后,洗涤细胞以去除未结合的抗体分子。将这些细胞用钙黄绿素AM和Draq7TM染色用于使用流式细胞术分选以获得活细胞。将这些细胞进行洗涤以去除过量的钙黄绿素AM和Draq7TM。使用流式细胞术,将钙黄绿素AM(活细胞)而不是Draq7TM(非死细胞或透化细胞)染色的单细胞分选进入BD RhapsodyTM盒中。
在含有单细胞和珠的孔中,孔中的1000个单细胞在裂解缓冲液中裂解。对于每个单细胞,使用针对细胞的与珠缀合的随机条形码将mRNA分子逆转录并复制抗体寡核苷酸。使用引物(使用血液图N1引物确定488个血液图基因的mRNA表达谱,并且使用样品索引寡核苷酸N1引物(“PCR 1”)确定CD147蛋白质的表达)将逆转录并复制后的样品在60度退火温度下PCR扩增15个循环。用Ampure清除去除过量的引物。使用具有用于衔接子连接的侧翼序列的血液图N2引物和样品索引寡核苷酸N1引物,在60度退火温度下将来自PCR1的产物进一步PCR扩增(“PCR 2”)15个循环。测序衔接子连接(“PCR 3”)后获得测序数据并进行分析。
图38A-图38D是非限制性示例性生物分析仪迹线,这些生物分析仪迹线显示与抗体寡核苷酸的预期大小一致的峰(由箭头指示)。随着用冷抗体滴定热抗体,抗体寡核苷酸峰减少。
表4是测序数据度量的汇总。通过用使用1:100稀释的储备液制备的1%热抗体:99%冷抗体的混合物对细胞染色,抗体寡核苷酸占测序数据中总的原始读数的2.4%。然而,如图39A1-图39A3和图39B1-图39B3和图40B、图41B和图42B中所示,如果用使用1:100稀释的储备液制备的1%热抗体:99%冷抗体的混合物对细胞染色,在递推性取代误差校正(substitution error correction,RSEC)或基于分布的误差校正(distribution-basederror correction,DBEC)后检测的抗体寡核苷酸的分子数的分布直方图不包括明确的信号峰。RSEC已经内描述于2017年5月25日提交的美国专利申请号15/605874中,通过引用将该内容以其全文并入本文。
图40A-图40C是非限制性示例性图,这些示例性图显示寡核苷酸-缀合的抗CD147抗体分子可用于标记各种细胞类型。使用血液图(图40A)中的488个基因的表达谱确定细胞类型。用使用1:100稀释的储备液制备的10%热抗体:90%冷抗体的混合物对细胞染色,在直方图中产生显示检测到的抗体寡核苷酸分子数的清晰信号(图40B)。抗体寡核苷酸对各种细胞类型的标记示于图40C中。
图41A-图41C是非限制性示例性图,这些示例性图显示寡核苷酸-缀合的抗CD147抗体可用于标记各种细胞类型。使用血液图(图41A)中的488个基因的表达谱确定细胞类型。用使用1:100稀释的储备液制备的1%热抗体:99%冷抗体的混合物对细胞染色,在直方图中不产生显示检测到的抗体寡核苷酸分子数的清晰信号(图41B)。抗体寡核苷酸对各种细胞类型的标记示于图41C中。
图42A-图42C是非限制性示例性图,这些示例性图显示寡核苷酸-缀合的抗CD147抗体分子可用于标记各种细胞类型。使用血液图(图42A)中的488个基因的表达谱确定细胞类型。用1:800稀释的储备液对细胞染色,在直方图中产生显示检测到的抗体寡核苷酸分子数的清晰信号(图42B)。抗体寡核苷酸对各种细胞类型的标记示于图42C中。
表4.测序数据度量的汇总。
总之,这些数据表明可以调整寡核苷酸-缀合的抗体(“热抗体”)和不与寡核苷酸缀合的抗体(“冷抗体”)的比率,使得抗体寡核苷酸占测序数据中总读数的所希望的百分比,并且代表信号抗体寡核苷酸的数据明确地与代表噪音抗体寡核苷酸的数据分开。
实例5
归一化
该实例表明归一化(使用寡核苷酸-缀合的抗体(“热抗体”)和不与寡核苷酸缀合的抗体(“冷抗体”)的混合物)是如何在无论抗体的蛋白质靶的丰度如何的情况下以所需的覆盖率导致这些抗体寡核苷酸占测序数据中总读数的所希望的百分比。
表5显示了使用热抗体对10,000个B细胞中不同丰度的三种细胞表面标志物的定量比较。解析三种细胞表面标志物的相对表达水平所需的总读数为4752万读数。
表5.使用热抗体进行实例蛋白质定量。
表6.使用热抗体和冷抗体进行实例蛋白质定量。
表6显示,使用热抗体:冷抗体的混合物,解析三种细胞表面标志物的相对表达水平所需的总读数为1百万读数。同样,与表5中所示的定量结果相比,当使用热抗体:冷抗体的混合物定量三种细胞表面标志物的表达水平时,仅需2%的读数数量(1百万读数相比于4752万读数)即可实现所有三种蛋白质标志物的最佳覆盖率(例如,测序深度为4)。使用具有较高百分比的冷抗体的混合物对高表达蛋白分子进行归一化,这减少低丰度蛋白的检测、参数数量和测序成本之间的折衷,使所述测定法作为一种工具更具吸引力。
总而言之,这些数据表明,使用热抗体:冷抗体的混合物,对于具有不同丰度的蛋白质靶(例如抗原),可以实现测序数据中具有所需覆盖率的所需的总读数数量。
实例6
对照颗粒
该实例证明了产生包含具有不同序列的对照颗粒寡核苷酸的对照颗粒,以及使用官能化的对照颗粒来确定捕获效率。
材料
BD CompBead Plus抗小鼠Ig(7.5um)颗粒组(51-9006274)
BD染色缓冲液(FBS)
程序
1.使用前彻底涡旋BD CompBead Plus(至少1分钟)。
2.向试管中添加800uL染色缓冲液(表7显示了CD147与五种不同丰度序列的寡核苷酸缀合的染色缓冲液的组成。图43A是示出染色缓冲液的组成的图。
3.添加5完整滴的CompBead Plus抗小鼠(约300uL)。
4.在试管中添加20uL的染色混合物。涡旋。
5.在室温下避光孵育30分钟。
6.以200g的速度旋转珠10分钟。
7.小心除去上清液,并用1mL染色缓冲液重悬。
8.以200g的速度旋转珠10分钟。
9.小心除去上清液,并用1mL染色缓冲液重悬以生成官能化的CompBead储备溶液。
10.对珠计数。
表7.染色混合物组成
结果
图44A-图44B是血细胞计数器中的细胞(图44A,白色圆圈)和对照颗粒(图44B,黑色圆圈)的明场图像。图45A-图45B是与跟荧光团关联的寡核苷酸缀合抗体结合的对照颗粒的相差(图45A,10X)和荧光(图45B,10X)图像。使用荧光显微镜确定5ul的官能化的CompBeads储备溶液包含约2000个细胞(占总输入量的4%),其中制得约400000个官能化的CompBeads。
图46是对照颗粒的图像,其示出加载到盒的微孔中的细胞和颗粒。CompBeads可与常规RhapsodyTM实验一起使用。将522个官能化的CompBeads添加到多个细胞中。在20000个细胞(包括对照颗粒)序列中,156个细胞的所有对照颗粒寡核苷酸的总和大于20。因此,156个对照颗粒是序列。图43B是显示具有五个不同对照条形码序列(LZ15-LZ19)的对照颗粒寡核苷酸的数量(与它们在染色缓冲液中的丰度相关)的图。
总而言之,这些数据表明颗粒(例如CompBead Plus)可以用寡核苷酸(例如对照颗粒寡核苷酸)官能化。官能化的颗粒可与单细胞测序工作流程一起使用,以确定捕获和测序的颗粒数量。
实例7
用于样品索引的抗体混合物
该实例证明了使用抗体混合物用于样品索引可以增加标记灵敏度。
样品索引可以利用针对多个蛋白质靶的寡核苷酸偶联抗体来标记样品。在该实例中,不是使用单抗体,而是使用两个抗体的混合物。抗体混合物用相同的样品索引寡核苷酸标记。图47A-图47C是显示使用抗体混合物用于样品索引可以增加标记灵敏度的图。图47A-图47C显示了PBMC用CD147抗体、CD47抗体以及CD147和CD47抗体两者进行标记的灵敏度。图47C显示,当同时使用CD147和CD47抗体两者时,标记了更多的细胞,并且实现了更好的信噪比分离。表8显示了使用CD147和CD47抗体两者时增加的标记灵敏度。CD147和CD47抗体两者的使用导致对异质样品类型进行标记的灵敏度更高。
表8.CD147、CD47或CD147和CD47抗体两者的标记灵敏度。
抗体 | 灵敏度 |
CD147 | 86.2% |
CD47 | 82.5% |
CD147+CD47 | 92.6% |
总体而言,数据显示使用抗体混合物可以提高标记灵敏度。这可能是因为蛋白质表达可能会在细胞类型和细胞状态之间变化,这使得寻找一种通用抗体来标记所有细胞类型具有挑战性。使用抗体混合物可允许对更多样品类型进行更灵敏且有效地标记。抗体混合物还可以包括范围更广的抗体。可以将很好地标记不同样品类型的抗体合并在一起,以形成可以充分标记所有细胞类型或目的细胞类型的混合物。
实例8
数据集中存在多重态
该实例描述了可以通过用不同的样品索引寡核苷酸标记细胞来鉴定和去除测序数据中的多重态。
图48是非限制性示例性图,其显示可以使用样品索引从测序数据中鉴定并去除多重态。如图48所示,当使用基于液滴的平台将具有20000个单细胞的样品分配进入多个液滴时,液滴和单细胞表达数据中的多重态率可以接近百分之八。当具有20000个单细胞的样品分配进入RhapsodyTM(美国BD公司(Becton,Dickinson and Company)(富兰克林湖,新泽西州))的孔中时,微孔阵列和单细胞表达数据的多重态率可以低得多(例如,接近百分之四)。可以使用具有不同样品索引序列的样品索引寡核苷酸来鉴定和去除测序数据中的多重态。例如,将具有20000个单细胞的样品分为两个亚群时,每个亚群中的细胞都用具有相同样品索引序列的样品索引寡核苷酸标记,而不同亚群中的细胞则用具有两个不同样品索引序列的样品索引寡核苷酸标记,可以鉴定和去除与多重态关联的序列数据,所得的测序数据包含约2%的多重态。使用具有八个不同样品索引序列的样品索引寡核苷酸,20000个单细胞的测序数据可以仅包含约0.5%的多重态。随着样品索引序列数量的增加,测序数据中的多重态率可甚至可以更低。
因此,通过用具有不同样品索引序列的样品索引寡核苷酸标记细胞,可以显著降低或消除保留在单细胞测序数据中的多重态率。
实例9
用于鉴定多重态的样品索引
本实例展示使用样品标签来鉴定和去除测序数据中的多重态。
从两只小鼠中获得了六种组织(骨髓、脂肪(性腺白色脂肪组织(gWAT)、结肠、肝、肺和脾))。从分离的组织中分离CD45+单细胞,并使用荧光激活细胞分选(FACS)进行分选,以城市12个样品。使用用于RNA测序的BDTM单细胞多路复用试剂盒,用12个不同的样品标签(在本文中称为样品索引组合物)标记12个样品的CD45+单细胞,并将其加载到RhapsodyTM盒中。样品标签是缀合至寡核苷酸(本文称为样品索引寡核苷酸)的抗体,所述寡核苷酸可以在3’RNA-seq测定(例如BDRhapsodyTM测定)中捕获并扩增。这样的样品标签具有高的特异性和灵敏度(>99%)。使用RhapsodyTM磁珠捕获来自细胞的mRNA分子和样品索引寡核苷酸,并使用RhapsodyTM免疫应答面板小鼠(小鼠)对进行条形码编码和扩增。确定细胞的表达谱,并使用合成的多重态表达谱将其鉴定为单重态表达谱和多重态表达谱。
图49是使用样品标签鉴定为单态或多重态的来自两只小鼠的六个组织的12个样品的CD45+单细胞的表达谱的非限制性示例性tSNE投影图。图49将多重态表达谱显示为多个簇。用于标记不同组织的样品标签序列(在本文中也称为样品索引寡核苷酸的样品索引指标)被用于鉴定多重态表达谱,每个表达谱包括两个或更多个细胞类型或亚型的细胞的表达谱。基于从细胞获得的序列数据中样品标签序列的存在,鉴定了来自两个不同组织的CD45+细胞的多重态。使用核酸样品标签索引样品并鉴定多重态的性与使用合成多重态表达谱鉴定多重态的性能相媲美。图49B是来自两只小鼠的六个组织的12个样品的CD45+单细胞的表达谱(其中使用样品索引寡核苷酸鉴定的多重态被去除)的非限制性示例性tSNE投影图。
图50A是来自两只小鼠的CD45+单细胞的表达谱(其中使用样品索引寡核苷酸鉴定的多重态被去除)的非限制性示例性tSNE投影图。在去除多重态表达谱的情况下,生物学重复的两只小鼠表现出相似的表达谱,如图50A-图50C所示。在去除多重态表达谱之后,六个不同组织的免疫谱分析的结果显示在图51A-图51F中。图51A-图51F所示的六个样品中的不同细胞类型(例如,B细胞,巨噬细胞等)是基于细胞的表达谱鉴定。
来自六个不同组织的巨噬细胞、T细胞和B细胞的示例性表达图谱显示在图52A-图52C中。图52A-图52C显示,不同组织中的相同细胞类型表现出独特表达谱并且结肠免疫群是六个组织中最明显的。图53A-图53D是比较结肠和脾中的巨噬细胞的非限制性示例性图。图53A是非限制性的示例性tSNE投影图,其比较了结肠和脾中的巨噬细胞的表达谱,表明两种组织中的巨噬细胞具有不同的表达谱。图53B是显示结肠和脾中巨噬细胞的表达谱具有低相关性的非限制性示例性图。低相关性进一步支持了两种组织中的巨噬细胞具有图53A所示的不同表达谱。图53C和图53D是结肠和脾中巨噬细胞中Areg基因和Rora基因的表达谱的非限制性示例性tSNE投影图。这两个基因在结肠和脾中的巨噬细胞的5.2%和9.5%中表达。图53A、图53C和图53D显示这两个基因仅在结肠的巨噬细胞中表达。如图52A-图52C和图53A-图53D所示,来自六种不同组织的超过28000个小鼠免疫细胞的单细胞分析揭示了主要免疫细胞类型的组织特异性基因表达特征。
总而言之,这些数据表明进行样品标记可以允许将多个样品合并到同一单细胞实验中。进行样品标记可以提高样品通量,消除由于技术错误造成的样品间批次效应,并使得能够检测多重态。
实例10
样品索引和表达谱
该实例证明了使用细胞的样品标记不会改变细胞的mRNA表达谱。
图54是非限制性示例性图,其显示了用样品索引组合物标记或染色细胞不改变外周血单核细胞(PBMC)中的mRNA表达谱。图54显示在或不在进行样品标记情况下的PBMC的表达谱的tSNE投影图的叠加。叠加显示进行样品标记不改变PBMC中的mRNA表达谱。
总而言之,数据表明进行样品标记或用寡核苷酸缀合的抗体染色不改变细胞的表达谱。因此,进行样品标记可以允许合并多个样品,增加样品通量,消除样品之间的批次效应,和/或使得能够检测多重态而不改变经标记的细胞的表达谱。
术语
在至少一些先前描述的实施例中,在一个实施例中使用的一个或多个元件可以在另一个实施例中互换地使用,除非这种置换是技术上不可行的。本领域技术人员将了解的是,可以在不背离所要求保护的主题的范围的情况下对以上所述的方法和结构做出各种其他省略、添加和修改。所有这样的修改和改变预期属于如所附权利要求书所限定的主题的范围之内。
关于在此使用基本上任何复数和/或单数术语,那些本领域技术人员可以根据上下文和/或应用的需要将复数翻译成单数和/或将单数翻译成复数。为了清晰起见,可以在此清晰地列出各种单数/复数的转换。除非上下文另外明确指示,否则如本说明书和所附权利要求书所使用的单数形式“一个(a)”、“一种(an)”以及“该(the)”包括复数指示物。除非另外说明,否则在此对“或”的任何引用旨在涵盖“和/或”。
本领域技术人员将理解的是,一般而言,在此所使用的术语,尤其是在所附权利要求书中的术语(例如,所附权利要求书的主体)通常意指“开放性的”术语(例如,术语“包含(including)”应当被解释为“包含但不局限于”,术语“具有”应当被解释为“具有至少”,术语“包括(includes)”应当被解释为“包括但不限于”等)。本领域的普通技术人员另外将认识到的是,如果意指特定数量的一种所介绍的权利要求陈述,那么将在该权利要求中明确陈述这种意思,并且在无这类陈述的存在下,不呈现这种意思。例如,为了有助于理解,以下所附权利要求书可以包含介绍性短语“至少一个”和“一个或多个”的使用,以用来介绍权利要求陈述。然而,此类短语的使用不应当解释为意指经由不定冠词“一个”或“一种”介绍权利要求陈述将任何含有此类介绍的权利要求陈述的具体权利要求限制于仅含有一个这种陈述的实施例,即使在相同的权利要求包括介绍性短语“一个或多个”或“至少一个”以及不定冠词例如“一个”或“一种”(例如,“一个”和/或“一种”,也应当解释为表示“至少一个”或“一个或多个”)的时候也是如此;这对于使用定冠词来介绍权利要求陈述同样适用。另外,即使明确地陈述一个介绍的权利要求陈述的特定数量,本领域技术人员将会意识到此陈述物也应当解释为意味着至少该陈述的数量(例如,仅陈述“两个陈述”而无其他修饰语意指至少两个陈述,或两个或者多个陈述)。此外,在使用类似于“A、B以及C等中的至少一个”的惯例的情况下,通常这样的句法结构意指在一定意义上本领域技术人员将理解该惯例(例如,“具有A、B以及C中的至少一个的系统”将包括但不局限于仅具有A、仅具有B、仅具有C、同时具有A和B、同时具有A和C、同时具有B和C、和/或同时具有A、B以及C等的系统)。在使用类似于“A、B以及C等中的至少一个”的惯例的情况下,通常这样的句法结构意指在一定意义上本领域技术人员将理解该惯例(例如,“具有A、B或C中的至少一个的系统”将包括但不局限于仅具有A、仅具有B、仅具有C、同时具有A和B、同时具有A和C、同时具有B和C、和/或同时具有A、B以及C等的系统)。本领域的普通技术人员将进一步理解的是无论是在说明书、权利要求书还是附图中,呈现两个或更多个替代性术语的几乎任何分离性词语和/或短语都应当理解为考虑到了包括这些术语中的一者、这些术语中的任一者或这两个术语的可能性。例如,短语“A或B”应理解为包括“A”或“B”或“A和B”的可能性。
此外,当以马库什(Markush)组的方式描述本披露的多个特征或方面时,在本领域内的技术人员将会认识到还以该马库什组中任一个单独的成员或多个成员的子组的方式来对本披露进行描述。
如本领域技术人员将理解,出于诸如就提供书面说明而言的任何和所有目的,在此披露的所有范围也包括任何和所有可能的子范围及其子范围的组合。任何列出的范围都可以容易被认为已经充分描述并使得同一范围分成至少相等的二等分、三等分、四等分、五等分、十等分等。作为一个非限制性实例,在此讨论的每个范围可以容易分为下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的是,所有诸如“至多”、“至少”、“大于”、“小于”等语言包括所提数值,并且是指可以接着分成如上所讨论的子范围的范围。最后,如本领域技术人员将理解,一个范围包括每个独立成员。因此例如,具有1-3个物品的组是指具有1个、2个或3个物品的组。类似地,具有1-5个物品的组是指具有1个、2个、3个、4个或5个物品的组等。
虽然在此已披露了各个方面和实施例,其他方法和实施例对于本领域技术人员而言将是清楚的。在此所披露的各个方面和实施例是出于说明的目的并且不预期是限制性的,其中真实的范围和精神是由以下权利要求书所指示的。
序列表
<110> 赛卢拉研究公司(Cellular Research, Inc. )
克里斯蒂娜·张
克里斯蒂娜·范
艾琳·夏姆
乔迪·马丁
尼坦杰里·班萨尔
詹姆斯·贾迪亚里
凯瑟琳·拉扎鲁克
格雷琴·拉姆
<120> 针对单细胞的样品索引
<130> BDCRI.033WO
<150> 62/515,285
<151> 2017-06-05
<150> 62/532,905
<151> 2017-07-14
<150> 62/532,949
<151> 2017-07-14
<150> 62/532,971
<151> 2017-07-14
<150> 62/554,425
<151> 2017-09-05
<150> 62/578,957
<151> 2017-10-30
<150> 62/645,703
<151> 2018-03-20
<160> 8
<170> PatentIn 版本3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 注释=“人工序列的描述: 合成的
寡核苷酸"
<400> 1
aaaaaaaaaa aaaaaaaaaa 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 注释=“人工序列的描述: 合成的
寡核苷酸"
<400> 2
tttttttttt tttttttttt 20
<210> 3
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 注释=“人工序列的描述: 合成的
寡核苷酸"
<220>
<221> 5AmMC6
<222> (1)..(1)
<223> 5' 氨基修饰剂 C6
<400> 3
gttgtcaaga tgctaccgtt cagagtacgt ggagttggtg gcccgacccc gagcgctacg 60
agccccccgg aaaaaaaaaa aaaaaaaaaa aaaaa 95
<210> 4
<211> 200
<212> DNA
<213> 人工序列
<220>
<223> 注释=“人工序列的描述: 合成的
寡核苷酸"
<220>
<221> 5AmMC6
<222> (1)..(1)
<223> 5' 氨基修饰剂 C6
<400> 4
gttgtcaaga tgctaccgtt cagagctact gtccgaagtt accgtgtatc taccacgggt 60
ggtttttcga atccggaaaa gatagtaata agtgttttag ttggaataag tcgcaacttt 120
tggagacggt tacctctcaa tttttctgat ccgtaggccc cccgatctcg gcctcaaaaa 180
aaaaaaaaaa aaaaaaaaaa 200
<210> 5
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 注释=“人工序列的描述: 合成的
寡核苷酸"
<400> 5
gttgtcaaga tgctaccgtt cagag 25
<210> 6
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 注释=“人工序列的描述: 合成的
寡核苷酸"
<400> 6
gttgtcaaga tgctaccgtt cagagcccca tgtctagtac ctattggtcc cctatcctca 60
gattcgttta aaaaaaaaaa aaaaaaaaaa aaaaa 95
<210> 7
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 注释=“人工序列的描述: 合成的
寡核苷酸"
<400> 7
tttttttttt tttttttttt tttttt 26
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 注释=“人工序列的描述: 合成的
寡核苷酸"
<400> 8
acacgacgct cttccgatct 20
Claims (52)
1.一种方法,所述方法包括:
(a)使包含第一多个细胞的第一样品和包含第二多个细胞的第二样品分别与第一样品索引寡核苷酸缀合的抗体和第二样品索引寡核苷酸缀合的抗体接触,以分别形成经第一样品索引寡核苷酸条形码编码的第一样品和经第二样品索引寡核苷酸条形码编码的第二样品,所述第一样品和第二样品各自分别包含与所述第一样品索引寡核苷酸缀合的抗体关联的细胞和与所述第二样品索引寡核苷酸缀合的抗体关联的细胞,
其中所述第一抗体能够与所述第一多个细胞中的每一个细胞的蛋白质靶特异性结合,并且缀合有包含聚A尾和第一样品索引序列的第一样品索引寡核苷酸,
其中所述第二抗体能够与所述第二多个细胞中的每一个细胞的蛋白质靶特异性结合,并且缀合有包含聚A尾和第二样品索引序列的第二样品索引寡核苷酸,
其中所述第一样品索引序列和所述第二样品索引序列包含不同的序列,并且
其中所述第一多个细胞中的每一个细胞的蛋白质靶和所述第二多个细胞中的每一个细胞的蛋白质靶是相同的;
(b)汇集经第一样品索引寡核苷酸条形码编码的所述第一样品和经第二样品索引寡核苷酸条形编码的所述第二样品以形成组合的经条形码编码的样品,所述组合的经条形码编码的样品包含与所述第一样品索引寡核苷酸缀合的抗体关联的所述第一多个细胞和与所述第二样品索引寡核苷酸缀合的抗体关联的所述第二多个细胞;
(c)将所述组合的经条形码编码的样品的与所述第一样品索引寡核苷酸缀合的抗体关联的所述第一多个细胞和与所述第二样品索引寡核苷酸缀合的抗体关联的所述第二多个细胞分配至多个分割,其中所述多个分割各自包含所述组合的经条形码编码的样品的单细胞;
(d)在所述多个分割中的每一个分割中,使含条形码的颗粒与所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸接触,其中所述含条形码的颗粒包含多个寡核苷酸探针,所述多个寡核苷酸探针各自包含聚T区和所述含条形码的颗粒的多个寡核苷酸探针所共同的条形码序列;
(e)经由所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸的所述聚A尾和所述寡核苷酸探针的所述聚T区之间的杂交延伸与所述第一样品索引寡核苷酸或所述第二索引寡核苷酸杂交的每一个寡核苷酸探针以产生第一标记的核酸或第二标记的核酸,其中所述第一标记的核酸和所述第二标记的核酸分别包含第一样品索引序列和第二样品索引序列或其互补序列,以及所述条形码序列;并且
(f)获得包含所述第一样品索引序列的所述第一标记的核酸或包含所述第二样品索引序列的所述第二标记的核酸或其部分的序列信息;并且
(g)分别基于所述序列信息中的所述第一样品索引序列或所述第二样品索引序列或其互补序列或其部分,确定所述组合的经条形码编码的样品的所述多个分割中的每个单细胞来自所述第一样品还是所述第二样品。
2.如权利要求1所述的方法,所述方法包括在步骤(a)后,去除分别不与所述第一多个细胞和所述第二多个细胞关联的所述第一样品索引寡核苷酸缀合的抗体和所述第二样品索引寡核苷酸缀合的抗体。
3.如权利要求1所述的方法,其中能够与所述第一多个细胞中的每一个细胞的所述蛋白质靶特异性结合的所述第一抗体和能够与所述第二多个细胞中的每一个细胞的所述蛋白质靶特异性结合的所述第二抗体是相同的。
4.如权利要求1所述的方法,所述方法包括将所述第一样品索引寡核苷酸和所述第二样品索引寡核苷酸分别从所述第一样品索引寡核苷酸缀合的抗体和所述第二样品索引寡核苷酸缀合的抗体分离。
5.如权利要求1所述的方法,其中所述第一样品索引序列和所述第二样品索引序列中的至少一个的长度为6-60个核苷酸。
6.如权利要求1所述的方法,其中所述第一样品索引寡核苷酸和所述第二样品索引寡核苷酸中的至少一个的长度为50-500个核苷酸。
7.如权利要求1所述的方法,其中所述第一多个细胞中的每一个细胞的所述蛋白质靶和所述第二多个细胞中的每一个细胞的所述蛋白质靶中的至少一个是细胞表面蛋白质、细胞内蛋白质、细胞标志物、抗体、主要组织相容性复合体、肿瘤抗原、受体或其组合。
8.如权利要求7所述的方法,其中所述细胞受体是B细胞受体或T细胞受体。
9.如权利要求1所述的方法,其中步骤(c)中将所述组合的经条形码编码的样品的所述第一多个细胞和所述第二多个细胞分配包括将与所述组合的样品的所述第一样品索引寡核苷酸缀合的抗体关联的所述第一多个细胞和与所述组合的样品的所述第二样品索引寡核苷酸缀合的抗体关联的所述第二多个细胞以及包括所述含条形码的颗粒的多个含条形码的颗粒分配至所述多个分割。
10.如权利要求1所述的方法,其中步骤(f)获得所述第一标记的核酸或所述第二标记的核酸或其部分的序列信息包括使所述第一标记的核酸或所述第二标记的核酸进行一个或更多个反应以产生用于核酸测序的第一组核酸或第二组核酸。
11.如权利要求1所述的方法,其中所述寡核苷酸探针中的每一个包含细胞标记、通用引物的结合位点、扩增衔接子、测序衔接子或其组合。
12.如权利要求1所述的方法,其中所述多个寡核苷酸探针中的至少一个寡核苷酸探针固定在所述含条形码的颗粒上、部分固定在所述颗粒上、封闭在所述颗粒中、部分封闭在所述颗粒中或其组合。
13.如权利要求1所述的方法,其中步骤(d)包括从包含所述单细胞的所述分割中的所述含条形码的颗粒释放所述多个寡核苷酸探针。
14.如权利要求1所述的方法,其中所述含条形码的颗粒是交联琼脂糖珠、链霉亲和素珠、琼脂糖珠、磁性珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠、水凝胶珠或可破坏的水凝胶珠。
15.如权利要求1所述的方法,其中所述多个分割包括孔或液滴。
16.如权利要求1所述的方法,其中所述第一多个细胞和所述第二多个细胞包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
17.如权利要求1所述的方法,其中所述多个分割中的一个分割的单细胞包含多个目的蛋白质,并且其中:
步骤(a)还包括使第三多个样品索引寡核苷酸缀合的抗体与所述单细胞接触,其中所述第三多个样品索引寡核苷酸缀合的抗体中的每一个包括与抗体特异性寡核苷酸缀合的抗体,所述抗体特异性寡核苷酸包含针对所缀合的抗体的独特标识以及聚A尾,并且其中所述抗体能够与所述多个目的蛋白质中的至少一个特异性结合;
步骤(e)还包括经由所述抗体特异性寡核苷酸的所述聚A尾和所述寡核苷酸探针的所述聚T区之间的杂交延伸与所述抗体特异性寡核苷酸杂交的所述寡核苷酸探针以产生第一多个标记的核酸,其中所述第一多个标记的核酸中的每一个包含独特标识或其互补序列以及条形码序列;并且
步骤(f)还包括获得所述第一多个标记的核酸或其部分的序列信息以确定所述单细胞中的所述多个目的蛋白质中的一个或更多个的数量。
18.如权利要求17所述的方法,其中所述抗体特异性寡核苷酸包含分子标记、细胞标记、通用引物的结合位点、扩增衔接子、测序衔接子或其组合。
19.如权利要求17所述的方法,其中所述多个目的蛋白质中的目的蛋白质是细胞表面蛋白质、细胞内蛋白质、细胞标志物、抗体、主要组织相容性复合体、肿瘤抗原、受体或其组合。
20.如权利要求19所述的方法,其中所述受体是B细胞受体或T细胞受体。
21.如权利要求17所述的方法,其中所述单细胞包含多个mRNA靶分子,并且其中:
步骤(d)还包括使来自所述单细胞的mRNA靶分子与所述多个寡核苷酸探针中的寡核苷酸探针在所述mRNA靶分子的聚A尾和所述寡核苷酸探针的聚T区之间杂交;
步骤(e)还包括经由所述mRNA靶分子的聚A尾和所述寡核苷酸探针的聚T区之间的杂交延伸与所述mRNA靶分子杂交的所述寡核苷酸探针以产生第二多个标记的核酸,其中所述第二多个标记的核酸中的每一个包含所述mRNA靶分子中的一个的互补序列以及条形码序列;并且
步骤(f)还包括获得所述第二多个标记的核酸或其部分的序列信息以确定所述单细胞中所述多个mRNA靶分子中的一个或更多个的数量。
22.一种方法,所述方法包括:
(a)使包含第一多个细胞的第一样品和包含第二多个细胞的第二样品分别与第一样品索引组合物和第二样品索引组合物接触,以分别形成第一标记的样品和第二标记的样品,所述第一标记的样品和所述第二标记的样品各自包含分别与所述第一样品索引组合物和所述第二样品索引组合物关联的细胞,
其中所述第一样品索引组合物包含与第一样品索引寡核苷酸关联的第一细胞组分结合试剂,其中所述第一细胞组分结合试剂能够与所述第一多个细胞中的每一个细胞的细胞组分靶特异性结合,
其中所述第二样品索引组合物包含与第二样品索引寡核苷酸关联的第二细胞组分结合试剂,其中所述第二细胞组分结合试剂能够与所述第二多个细胞中的每一个细胞的细胞组分靶特异性结合,
其中所述第一样品索引寡核苷酸和所述第二样品索引寡核苷酸分别包含第一样品索引序列和第二样品索引序列,并且其中所述第一样品索引序列和所述第二样品索引序列包含不同的序列,并且
其中所述第一多个细胞中的每一个细胞的细胞组分靶和所述第二多个细胞中的每一个细胞的细胞组分靶是相同的;
(b)汇集所述第一标记的样品和所述第二标记的样品以形成组合的标记的样品,所述组合的标记的样品包含分别与所述第一样品索引组合物关联的细胞和与所述第二样品索引组合物关联的细胞;
(c)将与所述组合的标记的样品的所述第一样品索引组合物关联的细胞和与所述组合的标记的样品的所述第二样品索引组合物关联的细胞分配至多个分割,其中所述多个分割各自包含所述组合的标记的样品的单细胞;
(d)使所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸进行一个或更多个反应以产生包含所述第一样品索引序列或其互补序列的第一经条形码编码的样品索引寡核苷酸,或包含所述第二样品索引序列或其互补序列的第二经条形码编码的样品索引寡核苷酸;
(e)获得所述第一经条形码编码的样品索引寡核苷酸或第二经条形码编码的样品索引寡核苷酸或其部分的序列信息;并且
(f)基于(e)中获得的所述序列信息中的所述第一样品索引序列或所述第二样品索引序列或其互补序列或其部分分别确定所述组合的标记的样品中的细胞来自所述第一样品还是所述第二样品。
23.如权利要求22所述的方法,其中所述细胞组分结合试剂包括蛋白质结合试剂,其中所述蛋白质结合试剂与所述样品索引寡核苷酸关联,所述样品索引寡核苷酸与相应的细胞组分结合试剂关联,并且其中所述细胞组分靶包括蛋白质靶。
24.如权利要求22所述的方法,其中(d)中使所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸进行一个或更多个反应以产生包含所述第一样品索引序列或其互补序列的第一经条形码编码的样品索引寡核苷酸,或包含所述第二样品索引序列或其互补序列的第二经条形码编码的样品索引寡核苷酸包括:
使用多个条形码对所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸进行条形码编码以产生所述第一经条形码编码的样品索引寡核苷酸或所述第二经条形码编码的样品索引寡核苷酸。
25.如权利要求22所述的方法,其中确定所述组合的标记的样品中的所述细胞来自所述第一样品还是所述第二样品包括鉴定所述经条形码编码的样品索引组合物中所述第一样品索引序列、所述第二样品索引序列、其互补序列、或其部分的存在或不存在。
26.如权利要求22所述的方法,其中所述第一样品索引序列和所述第二样品索引序列中的至少一个的长度为6-60个核苷酸。
27.如权利要求22所述的方法,其中所述第一多个细胞中的每一个细胞的细胞组分靶和所述第二多个细胞中的每一个细胞的细胞组分靶中的至少一个在细胞表面上。
28.如权利要求22所述的方法,所述方法包括去除不与所述第一多个细胞和所述第二多个细胞关联的所述第一样品索引组合物和所述第二样品索引组合物。
29.如权利要求22所述的方法,其中所述第一样品索引寡核苷酸被配置为与所述第一细胞组分结合试剂不可分离;或所述第二样品索引寡核苷酸被配置为与所述第二细胞组分结合试剂不可分离;或所述第一样品索引寡核苷酸被配置为与所述第一细胞组分结合试剂不可分离且所述第二样品索引寡核苷酸被配置为与所述第二细胞组分结合试剂不可分离。
30.如权利要求22所述的方法,所述方法包括使所述第一样品索引寡核苷酸与所述第一细胞组分结合试剂分离;使所述第二样品索引寡核苷酸与所述第二细胞组分结合试剂分离;或使所述第一样品索引寡核苷酸与所述第一细胞组分结合试剂分离且使所述第一样品索引寡核苷酸与所述第一细胞组分结合试剂分离。
31.如权利要求24所述的方法,其中所述第一样品索引寡核苷酸和/或所述第二样品索引寡核苷酸包含与被配置为捕获所述第一样品索引寡核苷酸和/或所述第二样品索引寡核苷酸的序列的捕获序列互补的序列,并且其中所述条形码中的每一个包含靶结合区,所述靶结合区包含所述捕获序列。
32.如权利要求31所述的方法,其中所述靶结合区包含聚dT区,并且其中与所述捕获序列互补的所述样品索引寡核苷酸的序列包含聚dA区。
33.如权利要求22所述的方法,其中所述第一样品索引寡核苷酸和所述第二样品索引寡核苷酸中的至少一个包含分子标记序列、通用引物的结合位点,或分子标记序列和通用引物的结合位点两者。
34.如权利要求22所述的方法,其中所述第一多个细胞中的每一个细胞的细胞组分靶、所述第二多个细胞中的每一个细胞的细胞组分靶,或所述第一多个细胞中的每一个细胞的细胞组分靶和所述第二多个细胞中的每一个细胞的细胞组分靶两者包括碳水化合物、脂质、蛋白质、细胞外蛋白质、细胞表面蛋白质、细胞标志物、主要组织相容性复合体、肿瘤抗原、受体、细胞内蛋白质或其任何组合。
35.如权利要求34所述的方法,其中所述受体是B细胞受体或T细胞受体。
36.如权利要求24所述的方法,其中所述多个条形码与颗粒关联。
37.如权利要求36所述的方法,其中所述多个条形码中的至少一个条形码固定在所述颗粒上、部分固定在所述颗粒上、封闭在所述颗粒中、部分封闭在所述颗粒中或其组合。
38.如权利要求36所述的方法,其中所述颗粒是可破坏的珠或可破坏的水凝胶珠。
39.如权利要求36所述的方法,其中使用所述多个条形码对所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸进行条形码编码包括:
使所述多个条形码与所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸接触以允许条形码与所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸杂交,其中所述条形码中的每一个包含能够与所述第一样品索引寡核苷酸、所述第二样品索引寡核苷酸,或所述第一样品索引寡核苷酸和所述第二样品索引寡核苷酸两者特异性结合的靶结合区;并且
延伸与所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸杂交的所述条形码以产生所述第一经条形码编码的样品索引寡核苷酸或所述第二经条形码编码的样品索引寡核苷酸。
40.如权利要求36所述的方法,其中所述多个条形码中的每一个包含相同的条形码序列。
41.如权利要求22所述的方法,其中所述第一样品索引寡核苷酸和所述第二样品索引寡核苷酸中的至少一个的长度为50-500个核苷酸。
42.如权利要求22所述的方法,其中所述第一细胞组分结合试剂和所述第二细胞组分结合试剂中的至少一个包括抗体、四聚体、适体、蛋白质支架或其组合。
43.如权利要求22所述的方法,其中所述第一样品索引寡核苷酸通过接头与所述第一细胞组分结合试剂缀合;或所述第二样品索引寡核苷酸通过接头与所述第二细胞组分结合试剂缀合;或所述第一样品索引寡核苷酸通过接头与所述第一细胞组分结合试剂缀合且所述第二样品索引寡核苷酸通过接头与所述第二细胞组分结合试剂缀合。
44.如权利要求22所述的方法,其中所述第一细胞组分结合试剂和所述第二细胞组分结合试剂是相同的。
45.如权利要求22所述的方法,其中所述第一多个细胞中的每一个细胞的细胞组分靶和所述第二多个细胞中的每一个细胞的细胞组分靶中的至少一个包括细胞表面蛋白质、细胞内蛋白质、细胞标志物、抗体、主要组织相容性复合体、肿瘤抗原、受体或其组合。
46.如权利要求45所述的方法,其中所述受体是B细胞受体或T细胞受体。
47.如权利要求22所述的方法,其中所述多个分割包括孔或液滴。
48.如权利要求22所述的方法,其中所述第一多个细胞、所述第二多个细胞,或所述第一多个细胞和所述第二多个细胞两者包括T细胞、B细胞、肿瘤细胞、髓样细胞、血细胞、正常细胞、胎儿细胞、母体细胞或其混合物。
49.如权利要求24所述的方法,其中所述多个条形码中的每一个包含细胞标记、通用引物的结合位点、扩增衔接子、测序衔接子或其组合。
50.如权利要求36所述的方法,其中(c)中将与所述组合的经条形码编码的样品的所述第一样品索引组合物关联的所述第一多个细胞和与所述组合的经条形码编码的样品的所述第二样品索引组合物关联的所述第二多个细胞分配至多个分割包括将所述组合的经条形码编码的样品的与所述第一样品索引组合物关联的所述第一多个细胞、所述组合的经条形码编码的样品的与所述第二样品索引组合物关联的所述第二多个细胞以及包括所述颗粒的多个颗粒分配,所述颗粒包含所述多个条形码。
51.如权利要求36所述的方法,所述方法包括在(d)之前从包含所述单细胞的所述分割中的所述颗粒释放所述多个条形码中的一个或更多个。
52.如权利要求22所述的方法,其中使所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸进行一个或更多个反应包括在所述多个分割中,使所述第一样品索引寡核苷酸或所述第二样品索引寡核苷酸进行一个或更多个反应以产生包含所述第一样品索引序列或其互补序列的第一经条形码编码的样品索引寡核苷酸或包含所述第二样品索引序列或其互补序列的第二经条形码编码的样品索引寡核苷酸。
Applications Claiming Priority (15)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762515285P | 2017-06-05 | 2017-06-05 | |
US62/515,285 | 2017-06-05 | ||
US201762532949P | 2017-07-14 | 2017-07-14 | |
US201762532971P | 2017-07-14 | 2017-07-14 | |
US201762532905P | 2017-07-14 | 2017-07-14 | |
US62/532,905 | 2017-07-14 | ||
US62/532,949 | 2017-07-14 | ||
US62/532,971 | 2017-07-14 | ||
US201762554425P | 2017-09-05 | 2017-09-05 | |
US62/554,425 | 2017-09-05 | ||
US201762578957P | 2017-10-30 | 2017-10-30 | |
US62/578,957 | 2017-10-30 | ||
US201862645703P | 2018-03-20 | 2018-03-20 | |
US62/645,703 | 2018-03-20 | ||
PCT/US2018/024602 WO2018226293A1 (en) | 2017-06-05 | 2018-03-27 | Sample indexing for single cells |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110719959A CN110719959A (zh) | 2020-01-21 |
CN110719959B true CN110719959B (zh) | 2021-08-06 |
Family
ID=61913700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880037720.1A Active CN110719959B (zh) | 2017-06-05 | 2018-03-27 | 针对单细胞的样品索引 |
Country Status (8)
Country | Link |
---|---|
US (4) | US10676779B2 (zh) |
EP (2) | EP4345172A2 (zh) |
JP (2) | JP2020522262A (zh) |
KR (2) | KR20220124280A (zh) |
CN (1) | CN110719959B (zh) |
AU (2) | AU2018281745B2 (zh) |
CA (1) | CA3059559A1 (zh) |
WO (1) | WO2018226293A1 (zh) |
Families Citing this family (94)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
EP3321378B1 (en) | 2012-02-27 | 2021-11-10 | Becton, Dickinson and Company | Compositions for molecular counting |
US9388465B2 (en) | 2013-02-08 | 2016-07-12 | 10X Genomics, Inc. | Polynucleotide barcode generation |
US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10400280B2 (en) | 2012-08-14 | 2019-09-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
KR102536833B1 (ko) | 2013-08-28 | 2023-05-26 | 벡톤 디킨슨 앤드 컴퍼니 | 대량의 동시 단일 세포 분석 |
CN113249435A (zh) | 2014-06-26 | 2021-08-13 | 10X基因组学有限公司 | 分析来自单个细胞或细胞群体的核酸的方法 |
KR102321863B1 (ko) | 2015-01-12 | 2021-11-08 | 10엑스 제노믹스, 인크. | 핵산 시퀀싱 라이브러리의 제조 방법 및 시스템 및 이를 이용하여 제조한 라이브러리 |
EP3262192B1 (en) | 2015-02-27 | 2020-09-16 | Becton, Dickinson and Company | Spatially addressable molecular barcoding |
EP4180535A1 (en) | 2015-03-30 | 2023-05-17 | Becton, Dickinson and Company | Methods and compositions for combinatorial barcoding |
WO2016172373A1 (en) | 2015-04-23 | 2016-10-27 | Cellular Research, Inc. | Methods and compositions for whole transcriptome amplification |
CN108026524A (zh) | 2015-09-11 | 2018-05-11 | 赛卢拉研究公司 | 用于核酸文库标准化的方法和组合物 |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
JP7091348B2 (ja) | 2016-09-26 | 2022-06-27 | ベクトン・ディキンソン・アンド・カンパニー | バーコード付きオリゴヌクレオチド配列を有する試薬を用いたタンパク質発現の測定 |
AU2017359047A1 (en) | 2016-11-08 | 2019-05-02 | Becton, Dickinson And Company | Methods for cell label classification |
US10815525B2 (en) | 2016-12-22 | 2020-10-27 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CN110382708A (zh) | 2017-02-01 | 2019-10-25 | 赛卢拉研究公司 | 使用阻断性寡核苷酸进行选择性扩增 |
US20180276332A1 (en) * | 2017-03-24 | 2018-09-27 | Cellular Research, Inc. | Synthetic multiplets for multiplets determination |
CN110719959B (zh) | 2017-06-05 | 2021-08-06 | 贝克顿迪金森公司 | 针对单细胞的样品索引 |
US11946095B2 (en) | 2017-12-19 | 2024-04-02 | Becton, Dickinson And Company | Particles associated with oligonucleotides |
SG11202009889VA (en) * | 2018-04-06 | 2020-11-27 | 10X Genomics Inc | Systems and methods for quality control in single cell processing |
WO2019213294A1 (en) | 2018-05-03 | 2019-11-07 | Becton, Dickinson And Company | High throughput multiomics sample analysis |
WO2019213237A1 (en) | 2018-05-03 | 2019-11-07 | Becton, Dickinson And Company | Molecular barcoding on opposite transcript ends |
JP7437161B2 (ja) | 2018-06-29 | 2024-02-22 | イラミーナ インコーポレーテッド | フローセル |
JP2021533781A (ja) * | 2018-08-17 | 2021-12-09 | ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company | アプタマーバーコーディング |
US20200056223A1 (en) * | 2018-08-20 | 2020-02-20 | 10X Genomics, Inc. | Compositions and methods for cellular processing |
EP3844299A1 (en) * | 2018-08-28 | 2021-07-07 | Becton Dickinson and Company | Sample multiplexing using carbohydrate-binding and membrane-permeable reagents |
JP2022511398A (ja) | 2018-10-01 | 2022-01-31 | ベクトン・ディキンソン・アンド・カンパニー | 5’転写物配列の決定 |
US11162143B2 (en) | 2018-10-21 | 2021-11-02 | The University Of Kansas | Methods for generating therapeutic delivery platforms |
JP2022506546A (ja) | 2018-11-08 | 2022-01-17 | ベクトン・ディキンソン・アンド・カンパニー | ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析 |
US11459607B1 (en) | 2018-12-10 | 2022-10-04 | 10X Genomics, Inc. | Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes |
EP3894552A1 (en) | 2018-12-13 | 2021-10-20 | Becton, Dickinson and Company | Selective extension in single cell whole transcriptome analysis |
WO2020150356A1 (en) | 2019-01-16 | 2020-07-23 | Becton, Dickinson And Company | Polymerase chain reaction normalization through primer titration |
EP4242322A3 (en) | 2019-01-23 | 2023-09-20 | Becton, Dickinson and Company | Oligonucleotides associated with antibodies |
WO2020163789A1 (en) * | 2019-02-08 | 2020-08-13 | The Trustees Of Columbia University In The City Of New York | Single cell/exosome/vesicle protein profiling |
CA3132029A1 (en) * | 2019-04-02 | 2020-10-08 | Dalia Dhingra | Methods and systems for proteomic profiling and characterization |
JP2022520669A (ja) * | 2019-04-02 | 2022-03-31 | ミッション バイオ インコーポレイテッド | 核酸検出のための方法、システム、及び装置 |
WO2020226854A2 (en) * | 2019-04-12 | 2020-11-12 | The Johns Hopkins University | Tolerogenic artificial antigen-presenting cells |
WO2020214642A1 (en) | 2019-04-19 | 2020-10-22 | Becton, Dickinson And Company | Methods of associating phenotypical data and single cell sequencing data |
WO2020235607A1 (ja) * | 2019-05-21 | 2020-11-26 | 凸版印刷株式会社 | 標的分子の検出方法 |
WO2020237222A1 (en) | 2019-05-22 | 2020-11-26 | Mission Bio, Inc. | Method and apparatus for simultaneous targeted sequencing of dna, rna and protein |
US11939622B2 (en) | 2019-07-22 | 2024-03-26 | Becton, Dickinson And Company | Single cell chromatin immunoprecipitation sequencing assay |
CN114555827A (zh) * | 2019-08-12 | 2022-05-27 | 使命生物公司 | 用于对相同单细胞中的蛋白质表达、单核苷酸变异和拷贝数变异进行多组学同时检测的方法、系统和设备 |
WO2021067966A1 (en) * | 2019-10-05 | 2021-04-08 | Mission Bio, Inc. | Methods, systems and apparatus for copy number variations and single nucleotide variations simultaneously detected in single-cells |
CN114729350A (zh) | 2019-11-08 | 2022-07-08 | 贝克顿迪金森公司 | 使用随机引发获得用于免疫组库测序的全长v(d)j信息 |
CN111088250B (zh) * | 2019-12-25 | 2022-03-08 | 中国科学院苏州生物医学工程技术研究所 | 一种mRNA捕获序列、捕获载体的合成方法、高通量单细胞测序文库制备方法 |
JP7107535B2 (ja) * | 2020-01-10 | 2022-07-27 | シンクサイト株式会社 | 新規細胞表現型スクリーニング方法 |
WO2021146207A1 (en) | 2020-01-13 | 2021-07-22 | Becton, Dickinson And Company | Methods and compositions for quantitation of proteins and rna |
CN115279919A (zh) | 2020-01-13 | 2022-11-01 | 贝克顿迪金森公司 | 使用含有du的寡核苷酸的细胞捕获 |
EP4090762A1 (en) * | 2020-01-17 | 2022-11-23 | Becton, Dickinson and Company | Methods and compositions for single cell secretomics |
US11702693B2 (en) | 2020-01-21 | 2023-07-18 | 10X Genomics, Inc. | Methods for printing cells and generating arrays of barcoded cells |
US11732299B2 (en) | 2020-01-21 | 2023-08-22 | 10X Genomics, Inc. | Spatial assays with perturbed cells |
US20210230583A1 (en) * | 2020-01-29 | 2021-07-29 | Becton, Dickinson And Company | Barcoded wells for spatial mapping of single cells through sequencing |
US11835462B2 (en) | 2020-02-11 | 2023-12-05 | 10X Genomics, Inc. | Methods and compositions for partitioning a biological sample |
EP4103744A2 (en) | 2020-02-12 | 2022-12-21 | Becton, Dickinson and Company | Intracellular abseq |
US11926863B1 (en) | 2020-02-27 | 2024-03-12 | 10X Genomics, Inc. | Solid state single cell method for analyzing fixed biological cells |
EP4150118A1 (en) | 2020-05-14 | 2023-03-22 | Becton Dickinson and Company | Primers for immune repertoire profiling |
EP4153775A1 (en) | 2020-05-22 | 2023-03-29 | 10X Genomics, Inc. | Simultaneous spatio-temporal measurement of gene expression and cellular activity |
WO2021247593A1 (en) | 2020-06-02 | 2021-12-09 | Becton, Dickinson And Company | Oligonucleotides and beads for 5 prime gene expression assay |
WO2021258024A1 (en) * | 2020-06-19 | 2021-12-23 | California Institute Of Technology | Sensitive and multiplexed detection of nucleic acids and proteins for large scale serological testing |
WO2022008649A1 (en) * | 2020-07-08 | 2022-01-13 | F. Hoffmann-La Roche Ag | Spatial analysis of multiple targets in tissue samples |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
CN116157534A (zh) * | 2020-07-13 | 2023-05-23 | 贝克顿迪金森公司 | 用于单细胞分析的cDNA加标对照 |
EP4189114A1 (en) * | 2020-07-31 | 2023-06-07 | Singleron Biotechnologies Inc. | High throughput analysis of fixed cells |
EP4189112A1 (en) | 2020-07-31 | 2023-06-07 | Becton Dickinson and Company | Single cell assay for transposase-accessible chromatin |
EP4247969A1 (en) | 2020-11-17 | 2023-09-27 | Becton, Dickinson and Company | Combined analysis of cell-free nucleic acids and single cells for oncology diagnostics |
US20220162695A1 (en) | 2020-11-20 | 2022-05-26 | Becton, Dickinson And Company | Use of dextramer in single cell analysis |
EP4247967A1 (en) | 2020-11-20 | 2023-09-27 | Becton, Dickinson and Company | Profiling of highly expressed and lowly expressed proteins |
US20220187286A1 (en) | 2020-12-15 | 2022-06-16 | Becton, Dickinson And Company | Single cell secretome analysis |
EP4267761A1 (en) * | 2020-12-22 | 2023-11-01 | Pixelgen Technologies Ab | Method for making a physical map of a population of barcoded particles |
AU2022227563A1 (en) * | 2021-02-23 | 2023-08-24 | 10X Genomics, Inc. | Probe-based analysis of nucleic acids and proteins |
WO2022182903A1 (en) * | 2021-02-24 | 2022-09-01 | California Institute Of Technology | Multiplexing of experimental conditions and samples in spatial genomics |
WO2022188054A1 (en) * | 2021-03-10 | 2022-09-15 | Nanjing University | Methods and reagents for sample multiplexing for high throughput single-cell rna sequencing |
WO2023034739A1 (en) | 2021-08-30 | 2023-03-09 | Becton, Dickinson And Company | Template switch oligonucleotide (tso) for mrna 5' analysis |
WO2023034790A1 (en) | 2021-08-31 | 2023-03-09 | Becton, Dickinson And Company | Use of decoy polynucleotides in single cell multiomics |
CN117897613A (zh) | 2021-08-31 | 2024-04-16 | 贝克顿迪金森公司 | 使用寡核苷酸缀合的抗体的多重蛋白质组学分析 |
CN117897498A (zh) | 2021-08-31 | 2024-04-16 | 贝克顿迪金森公司 | 来自固定的细胞的rna保存及回收 |
WO2023034872A1 (en) | 2021-09-01 | 2023-03-09 | Becton, Dickinson And Company | Spatial multiomics using in situ reverse transcription |
WO2023028954A1 (zh) * | 2021-09-02 | 2023-03-09 | 新格元(南京)生物科技有限公司 | 高通量单细胞靶向测序的试剂和方法 |
WO2023039433A1 (en) | 2021-09-08 | 2023-03-16 | Becton, Dickinson And Company | Non-sequencing pcr-based method for detection of antibody-conjugated oligonucleotides |
WO2023044307A1 (en) | 2021-09-14 | 2023-03-23 | Becton, Dickinson And Company | Full length single cell rna sequencing |
WO2023150763A1 (en) | 2022-02-07 | 2023-08-10 | Becton, Dickinson And Company | Preparing nucleic acid for further analysis of their sequence |
WO2023150764A1 (en) | 2022-02-07 | 2023-08-10 | Becton, Dickinson And Company | Sorting of mrna and abseq containing barcoded beads by flow |
WO2023154694A1 (en) | 2022-02-08 | 2023-08-17 | Becton, Dickinson And Company | Reference beads for linking imaging and sequencing readouts with single-cell resolution |
WO2023164615A2 (en) * | 2022-02-25 | 2023-08-31 | Georgia Tech Research Corporation | Single-cell nanoparticle targeting-sequencing (sent-seq) |
WO2023172977A1 (en) | 2022-03-09 | 2023-09-14 | Becton, Dickinson And Company | Modified flow proxy assay prior to single-cell cite-seq |
WO2023205020A1 (en) * | 2022-04-18 | 2023-10-26 | Becton, Dickinson And Company | Methods and compositions for obtaining linked image and sequence data for single cells |
WO2024006373A1 (en) * | 2022-06-29 | 2024-01-04 | Natera, Inc. | Compositions and methods for identification of chromosomal microdeletions |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015031691A1 (en) * | 2013-08-28 | 2015-03-05 | Cellular Research, Inc. | Massively parallel single cell analysis |
WO2015061844A1 (en) * | 2013-10-30 | 2015-05-07 | The University Of Sydney | Assay to stratify cancer patients |
CN104812915A (zh) * | 2012-10-22 | 2015-07-29 | 新加坡国立大学 | 基于pcr用于平行检测生物材料的测定 |
CN105392902A (zh) * | 2014-06-24 | 2016-03-09 | 生物辐射实验室股份有限公司 | 数字式pcr条码化 |
WO2016049418A1 (en) * | 2014-09-25 | 2016-03-31 | Everspin Technologies, Inc. | Ecc word configuration for system-level ecc compatibility |
Family Cites Families (430)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4510244A (en) | 1980-04-17 | 1985-04-09 | The Board Of Trustees Of The Leland Stanford Jr. University | Cell labeling with antigen-coupled microspheres |
US4725536A (en) | 1985-09-19 | 1988-02-16 | Genetics Institute, Inc. | Reagent polynucleotide complex with multiple target binding regions, and kit and methods |
US6150517A (en) | 1986-11-24 | 2000-11-21 | Gen-Probe | Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms |
WO1989001050A1 (en) | 1987-07-31 | 1989-02-09 | The Board Of Trustees Of The Leland Stanford Junior University | Selective amplification of target polynucleotide sequences |
US5149625A (en) | 1987-08-11 | 1992-09-22 | President And Fellows Of Harvard College | Multiplex analysis of DNA |
US5656731A (en) | 1987-10-15 | 1997-08-12 | Chiron Corporation | Nucleic acid-amplified immunoassay probes |
US5124246A (en) | 1987-10-15 | 1992-06-23 | Chiron Corporation | Nucleic acid multimers and amplified nucleic acid hybridization assays using same |
WO1990001065A1 (en) | 1988-07-26 | 1990-02-08 | Genelabs Incorporated | Rna and dna amplification techniques |
US6309822B1 (en) | 1989-06-07 | 2001-10-30 | Affymetrix, Inc. | Method for comparing copy number of nucleic acid sequences |
US6040138A (en) | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
US5424186A (en) | 1989-06-07 | 1995-06-13 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5925525A (en) | 1989-06-07 | 1999-07-20 | Affymetrix, Inc. | Method of identifying nucleotide differences |
US5871928A (en) | 1989-06-07 | 1999-02-16 | Fodor; Stephen P. A. | Methods for nucleic acid analysis |
US6551784B2 (en) | 1989-06-07 | 2003-04-22 | Affymetrix Inc | Method of comparing nucleic acid sequences |
US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US5200314A (en) | 1990-03-23 | 1993-04-06 | Chiron Corporation | Polynucleotide capture assay employing in vitro amplification |
EP0834576B1 (en) | 1990-12-06 | 2002-01-16 | Affymetrix, Inc. (a Delaware Corporation) | Detection of nucleic acid sequences |
JPH04337446A (ja) | 1991-05-15 | 1992-11-25 | Hitachi Ltd | 微粒子計測方法、定量方法および微粒子計測装置 |
US5981179A (en) | 1991-11-14 | 1999-11-09 | Digene Diagnostics, Inc. | Continuous amplification reaction |
US5424413A (en) | 1992-01-22 | 1995-06-13 | Gen-Probe Incorporated | Branched nucleic acid probes |
US5573905A (en) | 1992-03-30 | 1996-11-12 | The Scripps Research Institute | Encoded combinatorial chemical libraries |
US5981176A (en) | 1992-06-17 | 1999-11-09 | City Of Hope | Method of detecting and discriminating between nucleic acid sequences |
WO1995000530A1 (en) | 1993-06-25 | 1995-01-05 | Affymax Technologies N.V. | Hybridization and sequencing of nucleic acids |
US6087186A (en) | 1993-07-16 | 2000-07-11 | Irori | Methods and apparatus for synthesizing labeled combinatorial chemistry libraries |
US5500356A (en) | 1993-08-10 | 1996-03-19 | Life Technologies, Inc. | Method of nucleic acid sequence selection |
US6309823B1 (en) | 1993-10-26 | 2001-10-30 | Affymetrix, Inc. | Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same |
US5681697A (en) | 1993-12-08 | 1997-10-28 | Chiron Corporation | Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor |
US5714330A (en) | 1994-04-04 | 1998-02-03 | Lynx Therapeutics, Inc. | DNA sequencing by stepwise ligation and cleavage |
GB2293238A (en) | 1994-09-13 | 1996-03-20 | Inceltec Ltd | Primers for replication and/or amplification reactions |
US6013445A (en) | 1996-06-06 | 2000-01-11 | Lynx Therapeutics, Inc. | Massively parallel signature sequencing by ligation of encoded adaptors |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5604097A (en) | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
US5695934A (en) | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
US6600996B2 (en) | 1994-10-21 | 2003-07-29 | Affymetrix, Inc. | Computer-aided techniques for analyzing biological sequences |
DE69535240T2 (de) | 1994-10-28 | 2007-06-06 | Gen-Probe Inc., San Diego | Zusammensetzungen und Verfahren für die gleichzeitige Detektion und Quantifizierung von einer Mehrheit spezifischer Nuklein Säure Sequenzen |
CA2216645A1 (en) | 1995-04-25 | 1996-11-21 | Irori | Remotely programmable matrices with memories and uses thereof |
US5648245A (en) | 1995-05-09 | 1997-07-15 | Carnegie Institution Of Washington | Method for constructing an oligonucleotide concatamer library by rolling circle replication |
US5968740A (en) | 1995-07-24 | 1999-10-19 | Affymetrix, Inc. | Method of Identifying a Base in a Nucleic Acid |
US5763175A (en) | 1995-11-17 | 1998-06-09 | Lynx Therapeutics, Inc. | Simultaneous sequencing of tagged polynucleotides |
US5854033A (en) | 1995-11-21 | 1998-12-29 | Yale University | Rolling circle replication reporter systems |
US6613544B1 (en) | 1995-12-22 | 2003-09-02 | Amgen Inc. | Osteoprotegerin |
US5962271A (en) | 1996-01-03 | 1999-10-05 | Cloutech Laboratories, Inc. | Methods and compositions for generating full-length cDNA having arbitrary nucleotide sequence at the 3'-end |
US5830712A (en) | 1996-02-06 | 1998-11-03 | Allelix Biopharmaceuticals Inc. | Selective template deletion method |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
EP0912761A4 (en) | 1996-05-29 | 2004-06-09 | Cornell Res Foundation Inc | DETERMINATION OF DIFFERENCES IN THE NUCLEIC ACID SEQUENCE BY MEANS OF A COMBINATION OF LIGASE DETERMINATION AND POLYMERASE CHAIN REACTION |
JPH1021373A (ja) | 1996-07-05 | 1998-01-23 | Fuji Photo Film Co Ltd | 画像解析装置 |
US6984491B2 (en) | 1996-07-29 | 2006-01-10 | Nanosphere, Inc. | Nanoparticles having oligonucleotides attached thereto and uses therefor |
US20020172953A1 (en) | 1996-07-29 | 2002-11-21 | Mirkin Chad A. | Movement of biomolecule-coated nanoparticles in an electric field |
US7169556B2 (en) | 1996-07-29 | 2007-01-30 | Nanosphere, Inc. | Nanoparticles having oligonucleotides attached thereto and uses therefor |
US6100029A (en) | 1996-08-14 | 2000-08-08 | Exact Laboratories, Inc. | Methods for the detection of chromosomal aberrations |
US5935793A (en) | 1996-09-27 | 1999-08-10 | The Chinese University Of Hong Kong | Parallel polynucleotide sequencing method using tagged primers |
US6124092A (en) | 1996-10-04 | 2000-09-26 | The Perkin-Elmer Corporation | Multiplex polynucleotide capture methods and compositions |
US6117631A (en) | 1996-10-29 | 2000-09-12 | Polyprobe, Inc. | Detection of antigens via oligonucleotide antibody conjugates |
US6046005A (en) | 1997-01-15 | 2000-04-04 | Incyte Pharmaceuticals, Inc. | Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group |
CA2291180A1 (en) | 1997-05-23 | 1998-11-26 | Lynx Therapeutics, Inc. | System and apparatus for sequential processing of analytes |
US6974669B2 (en) | 2000-03-28 | 2005-12-13 | Nanosphere, Inc. | Bio-barcodes based on oligonucleotide-modified nanoparticles |
US6399334B1 (en) | 1997-09-24 | 2002-06-04 | Invitrogen Corporation | Normalized nucleic acid libraries and methods of production thereof |
AU1603199A (en) | 1997-12-03 | 1999-06-16 | Curagen Corporation | Methods and devices for measuring differential gene expression |
US6265163B1 (en) | 1998-01-09 | 2001-07-24 | Lynx Therapeutics, Inc. | Solid phase selection of differentially expressed genes |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
US6653077B1 (en) | 1998-09-04 | 2003-11-25 | Lynx Therapeutics, Inc. | Method of screening for genetic polymorphism |
US6480791B1 (en) | 1998-10-28 | 2002-11-12 | Michael P. Strathmann | Parallel methods for genomic analysis |
US6197554B1 (en) | 1998-11-20 | 2001-03-06 | Shi-Lung Lin | Method for generating full-length cDNA library from single cells |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
US20020019005A1 (en) | 1999-02-18 | 2002-02-14 | Arcaris, Inc. | Process for identification of genes encoding proteins having cell proliferation-promoting activity |
US6629040B1 (en) | 1999-03-19 | 2003-09-30 | University Of Washington | Isotope distribution encoded tags for protein identification |
EP1165839A2 (en) | 1999-03-26 | 2002-01-02 | Whitehead Institute For Biomedical Research | Universal arrays |
CA2304260C (en) | 1999-04-20 | 2009-03-24 | Japan Bioindustry Association | Method for determining a concentration of target nucleic acid molecules, nucleic acid probes for the method and method for analyzing data obtained by the method |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
US6372813B1 (en) | 1999-06-25 | 2002-04-16 | Motorola | Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays |
US6326148B1 (en) | 1999-07-12 | 2001-12-04 | The Regents Of The University Of California | Detection of copy number changes in colon cancer |
US6440706B1 (en) | 1999-08-02 | 2002-08-27 | Johns Hopkins University | Digital amplification |
SE9903988D0 (sv) | 1999-11-03 | 1999-11-03 | Amersham Pharm Biotech Ab | Method of analysis |
US6489114B2 (en) | 1999-12-17 | 2002-12-03 | Bio Merieux | Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby |
EP1255860A2 (en) | 1999-12-29 | 2002-11-13 | Mergen Ltd. | Methods for amplifying and detecting multiple polynucleotides on a solid phase support |
WO2001053539A1 (en) | 2000-01-24 | 2001-07-26 | Phylos, Inc. | Sensitive, multiplexed diagnostic assays for protein analysis |
US7022479B2 (en) | 2000-01-24 | 2006-04-04 | Compound Therapeutics, Inc. | Sensitive, multiplexed diagnostic assays for protein analysis |
US6235483B1 (en) | 2000-01-31 | 2001-05-22 | Agilent Technologies, Inc. | Methods and kits for indirect labeling of nucleic acids |
DE60136166D1 (de) | 2000-02-07 | 2008-11-27 | Illumina Inc | Nukleinsäure-nachweisverfahren mit universellem priming |
US20050214825A1 (en) | 2000-02-07 | 2005-09-29 | John Stuelpnagel | Multiplex sample analysis on universal arrays |
GB2364054B (en) | 2000-03-24 | 2002-05-29 | Smithkline Beecham Corp | Method of amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof |
AU2001253310A1 (en) | 2000-04-10 | 2001-10-23 | Matthew Ashby | Methods for the survey and genetic analysis of populations |
US20030207300A1 (en) | 2000-04-28 | 2003-11-06 | Matray Tracy J. | Multiplex analytical platform using molecular tags |
US7630063B2 (en) | 2000-08-02 | 2009-12-08 | Honeywell International Inc. | Miniaturized cytometer for detecting multiple species in a sample |
US6511809B2 (en) * | 2000-06-13 | 2003-01-28 | E. I. Du Pont De Nemours And Company | Method for the detection of an analyte by means of a nucleic acid reporter |
US6531283B1 (en) | 2000-06-20 | 2003-03-11 | Molecular Staging, Inc. | Protein expression profiling |
CN100462433C (zh) | 2000-07-07 | 2009-02-18 | 维西根生物技术公司 | 实时序列测定 |
AU2001281248A1 (en) | 2000-08-11 | 2002-03-13 | Nanosphere Inc. | Nanoparticles having oligonucleotides attached thereto and uses therefor |
US6934408B2 (en) | 2000-08-25 | 2005-08-23 | Amnis Corporation | Method and apparatus for reading reporter labeled beads |
ATE380883T1 (de) | 2000-10-24 | 2007-12-15 | Univ Leland Stanford Junior | Direkte multiplex charakterisierung von genomischer dna |
EP1356109A2 (en) | 2000-12-08 | 2003-10-29 | Nanosphere, Inc. | Nanoparticles having oligonucleotides attached thereto and uses therefor |
US20020142345A1 (en) | 2000-12-22 | 2002-10-03 | Nelsen Anita J. | Methods for encoding and decoding complex mixtures in arrayed assays |
US20030049616A1 (en) | 2001-01-08 | 2003-03-13 | Sydney Brenner | Enzymatic synthesis of oligonucleotide tags |
AU2002249116A1 (en) | 2001-01-11 | 2002-09-19 | Lion Bioscience Ag | Gene library for screening methods |
WO2002059355A2 (en) | 2001-01-25 | 2002-08-01 | Tm Bioscience Corporation | Polynucleotides for use as tags and tag complements, manufacture and use thereof |
ZA200210369B (en) | 2001-03-09 | 2004-07-08 | Nugen Technologies Inc | Methods and compositions for amplification or RNA sequences. |
JP2005233974A (ja) | 2001-03-21 | 2005-09-02 | Olympus Corp | 生化学的検査方法 |
US7027932B2 (en) | 2001-03-21 | 2006-04-11 | Olympus Optical Co., Ltd. | Biochemical examination method |
ATE431853T1 (de) | 2001-03-28 | 2009-06-15 | Nanosphere Inc | Auf oligonukleotid-modifizierten partikeln basierende bio-strichcodes |
EP1377683A4 (en) | 2001-04-11 | 2004-09-08 | Us Gov Health & Human Serv | MODIFIED RANDOM SPRAYERS FOR PROBE MARKING |
US20030170675A1 (en) | 2001-04-11 | 2003-09-11 | The Gov't Of The U.S Of America As Represented By The Secretary Of The Dept. Of Health & Human Serv. | Methods of manipulating nucleic acids |
AUPR480901A0 (en) | 2001-05-04 | 2001-05-31 | Genomics Research Partners Pty Ltd | Diagnostic method for assessing a condition of a performance animal |
CA2344599C (en) | 2001-05-07 | 2011-07-12 | Bioneer Corporation | Selective polymerase chain reaction of dna of which base sequence is completely unknown |
US6905827B2 (en) | 2001-06-08 | 2005-06-14 | Expression Diagnostics, Inc. | Methods and compositions for diagnosing or monitoring auto immune and chronic inflammatory diseases |
EP1395805A4 (en) | 2001-06-11 | 2005-03-09 | Illumina Inc | MULTIPLEXED DETECTION TECHNIQUES |
JP4244534B2 (ja) | 2001-06-12 | 2009-03-25 | 横河電機株式会社 | バイオチップ |
US7473767B2 (en) | 2001-07-03 | 2009-01-06 | The Institute For Systems Biology | Methods for detection and quantification of analytes in complex mixtures |
US6830931B2 (en) | 2001-07-12 | 2004-12-14 | Automated Cell, Inc. | Method and apparatus for monitoring of proteins and cells |
CA2463323C (en) | 2001-10-09 | 2010-12-21 | Nanosphere, Inc. | Nanoparticles having oligonucleotides attached thereto and uses therefor |
US20030077611A1 (en) | 2001-10-24 | 2003-04-24 | Sention | Methods and systems for dynamic gene expression profiling |
JP2005517900A (ja) | 2001-11-21 | 2005-06-16 | アプレラ コーポレイション | デジタルアッセイ |
CN1617938A (zh) | 2002-01-16 | 2005-05-18 | 戴诺生物技术有限公司 | 从单个样品中分离核酸和蛋白质的方法 |
AU2003206095A1 (en) | 2002-01-29 | 2003-09-02 | Global Genomics Ab | Methods and means for amplifying nucleic acid |
EP1474772A4 (en) | 2002-02-14 | 2005-11-09 | Immunivest Corp | METHOD AND ALGORITHMS FOR CELL DETERMINATION IN A COST-EFFECTIVE CYTOMETER |
US20030186251A1 (en) | 2002-04-01 | 2003-10-02 | Brookhaven Science Associates, Llc | Genome sequence tags |
US20050175993A1 (en) | 2002-04-12 | 2005-08-11 | Chia-Lin Wei | Method for making full-length coding sequence cDNA libraries |
US6808906B2 (en) | 2002-05-08 | 2004-10-26 | Rigel Pharmaceuticals, Inc. | Directionally cloned random cDNA expression vector libraries, compositions and methods of use |
US20070178478A1 (en) | 2002-05-08 | 2007-08-02 | Dhallan Ravinder S | Methods for detection of genetic disorders |
US20050019776A1 (en) | 2002-06-28 | 2005-01-27 | Callow Matthew James | Universal selective genome amplification and universal genotyping system |
US20040096368A1 (en) | 2002-06-28 | 2004-05-20 | Igen International, Inc. | Assay systems and components |
US7192700B2 (en) | 2002-12-20 | 2007-03-20 | Orchid Cellmark Inc. | Methods and compositions for conducting primer extension and polymorphism detection reactions |
WO2004017374A2 (en) | 2002-08-16 | 2004-02-26 | Clinical Microarrays, Inc. | Reading of fluorescent arrays |
US7638612B2 (en) | 2002-09-03 | 2009-12-29 | Quanta Biosciences, Inc. | Compositions and methods for cDNA synthesis |
US7361821B2 (en) | 2002-09-20 | 2008-04-22 | Intel Corporation | Controlled alignment of nanobarcodes encoding specific information for scanning probe microscopy (SPM) reading |
WO2004031408A1 (en) | 2002-09-30 | 2004-04-15 | F.Hoffmann-La Roche Ag | Oligonucleotides for genotyping thymidylate synthase gene |
JP5695287B2 (ja) | 2002-10-02 | 2015-04-01 | カリフォルニア インスティテュート オブ テクノロジー | 微小流体の核酸解析 |
US7424368B2 (en) | 2002-11-11 | 2008-09-09 | Affymetix, Inc. | Methods for identifying DNA copy number changes |
US7822555B2 (en) | 2002-11-11 | 2010-10-26 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
US7704687B2 (en) | 2002-11-15 | 2010-04-27 | The Johns Hopkins University | Digital karyotyping |
CA2510166A1 (en) | 2002-12-20 | 2004-09-30 | Caliper Life Sciences, Inc. | Single molecule amplification and detection of dna |
US20040214211A1 (en) | 2003-01-23 | 2004-10-28 | U.S. Genomics, Inc. | Methods for analyzing polymer populations |
US7575865B2 (en) | 2003-01-29 | 2009-08-18 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
US8206913B1 (en) | 2003-03-07 | 2012-06-26 | Rubicon Genomics, Inc. | Amplification and analysis of whole genome and whole transcriptome libraries generated by a DNA polymerization process |
EP1604040B1 (en) | 2003-03-07 | 2010-10-13 | Rubicon Genomics, Inc. | Amplification and analysis of whole genome and whole transcriptome libraries generated by a dna polymerization process |
WO2006102264A1 (en) | 2005-03-18 | 2006-09-28 | Fluidigm Corporation | Thermal reaction device and method for using the same |
US7269518B2 (en) | 2003-04-30 | 2007-09-11 | Agilent Technologies, Inc. | Chemical array reading |
US20040259118A1 (en) | 2003-06-23 | 2004-12-23 | Macevicz Stephen C. | Methods and compositions for nucleic acid sequence analysis |
EP2532745B1 (en) | 2003-07-05 | 2015-09-09 | The Johns Hopkins University | Method and Compositions for Detection and Enumeration of Genetic Variations |
CA2535602A1 (en) | 2003-08-13 | 2005-02-24 | Affymetrix, Inc. | Methods and kits for preparing nucleic acid samples |
GB0319332D0 (en) | 2003-08-16 | 2003-09-17 | Astrazeneca Ab | Amplification |
US20050048498A1 (en) | 2003-08-29 | 2005-03-03 | Applera Corporation | Compositions, methods, and kits for assembling probes |
US7341837B2 (en) | 2003-09-02 | 2008-03-11 | Lawton Robert L | Soluble analyte detection and amplification |
US7354706B2 (en) | 2003-09-09 | 2008-04-08 | The Regents Of The University Of Colorado, A Body Corporate | Use of photopolymerization for amplification and detection of a molecular recognition event |
JP5171037B2 (ja) | 2003-09-10 | 2013-03-27 | アルセア・ディーエックス,インク. | マイクロアレイを用いた発現プロファイリング |
WO2005047521A2 (en) | 2003-11-10 | 2005-05-26 | Investigen, Inc. | Methods of preparing nucleic acid for detection |
EP1709203A2 (en) | 2004-01-23 | 2006-10-11 | Lingvitae AS | Improving polynucleotide ligation reactions |
CA2555377A1 (en) | 2004-02-12 | 2005-09-01 | Compass Genetics, Llc | Genetic analysis by sequence-specific sorting |
US20100216153A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
US7432055B2 (en) | 2004-03-05 | 2008-10-07 | Uchicago Argonne Llc | Dual phase multiplex polymerase chain reaction |
US7294466B2 (en) | 2004-05-07 | 2007-11-13 | Cepheid | Multiplexed detection of biological agents |
US20050250147A1 (en) | 2004-05-10 | 2005-11-10 | Macevicz Stephen C | Digital profiling of polynucleotide populations |
JP2008505345A (ja) | 2004-06-07 | 2008-02-21 | アイアールエム エルエルシー | 分注システム、ソフトウェア、および関連する方法 |
US20060035258A1 (en) | 2004-08-06 | 2006-02-16 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
US20060041385A1 (en) | 2004-08-18 | 2006-02-23 | Bauer Kenneth D | Method of quantitating proteins and genes in cells using a combination of immunohistochemistry and in situ hybridization |
US7713697B2 (en) | 2004-08-27 | 2010-05-11 | Gen-Probe Incorporated | Methods and kits for amplifying DNA |
US20060073506A1 (en) | 2004-09-17 | 2006-04-06 | Affymetrix, Inc. | Methods for identifying biological samples |
US7435084B2 (en) | 2004-12-14 | 2008-10-14 | Align Technology, Inc. | System and methods for casting physical tooth model |
ATE480643T1 (de) * | 2004-11-03 | 2010-09-15 | Iris Molecular Diagnostics Inc | Homogener nachweis von analyten |
WO2006071770A2 (en) | 2004-12-23 | 2006-07-06 | I-Stat Corporation | Molecular diagnostics system and methods |
EP1836302B1 (en) | 2004-12-23 | 2010-04-14 | Amersham Biosciences Corp. | Ligation-based rna amplification |
US7407757B2 (en) | 2005-02-10 | 2008-08-05 | Population Genetics Technologies | Genetic analysis by sequence-specific sorting |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
EP1845160A4 (en) | 2005-02-10 | 2009-07-01 | Riken | NUCLEOTIDE-amplification |
US20060211030A1 (en) | 2005-03-16 | 2006-09-21 | Sydney Brenner | Methods and compositions for assay readouts on multiple analytical platforms |
US7695886B2 (en) | 2005-05-19 | 2010-04-13 | Fuji Xerox Co., Ltd. | Process for producing resin particle liquid dispersion for electrostatic image developing toner, electrostatic image developing toner and production process thereof |
US20060263789A1 (en) | 2005-05-19 | 2006-11-23 | Robert Kincaid | Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using |
US8407013B2 (en) | 2005-06-07 | 2013-03-26 | Peter K. Rogan | AB initio generation of single copy genomic probes |
US7796815B2 (en) | 2005-06-10 | 2010-09-14 | The Cleveland Clinic Foundation | Image analysis of biological objects |
US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
US8486621B2 (en) | 2005-08-11 | 2013-07-16 | Cornell Research Foundation, Inc. | Nucleic acid-based matrixes |
CN101263227A (zh) | 2005-09-16 | 2008-09-10 | 454生命科学公司 | cDNA文库制备 |
US8831887B2 (en) | 2005-10-12 | 2014-09-09 | The Research Foundation For The State University Of New York | Absolute PCR quantification |
WO2007053692A1 (en) | 2005-11-01 | 2007-05-10 | Symyx Technologies, Inc. | Liquid dispensing for high-throughput experimentation |
US7375211B2 (en) | 2005-11-18 | 2008-05-20 | Kou Zhong C | Method for detection and quantification of T-cell receptor Vβ repertoire |
US20080070303A1 (en) | 2005-11-21 | 2008-03-20 | West Michael D | Methods to accelerate the isolation of novel cell strains from pluripotent stem cells and cells obtained thereby |
US7636465B2 (en) | 2005-12-09 | 2009-12-22 | Cytyc Corporation | Cross-frame object reconstruction for image-based cytology applications |
WO2007087310A2 (en) | 2006-01-23 | 2007-08-02 | Population Genetics Technologies Ltd. | Nucleic acid analysis using sequence tokens |
WO2007087312A2 (en) | 2006-01-23 | 2007-08-02 | Population Genetics Technologies Ltd. | Molecular counting |
US8460879B2 (en) | 2006-02-21 | 2013-06-11 | The Trustees Of Tufts College | Methods and arrays for target analyte detection and determination of target analyte concentration in solution |
US20080038727A1 (en) | 2006-03-10 | 2008-02-14 | Applera Corporation | MicroRNA and Messenger RNA Detection on Arrays |
WO2007114772A1 (en) | 2006-04-04 | 2007-10-11 | Sidec Technologies Ab | Extended electron tomography |
US20080194414A1 (en) | 2006-04-24 | 2008-08-14 | Albert Thomas J | Enrichment and sequence analysis of genomic regions |
US9074242B2 (en) | 2010-02-12 | 2015-07-07 | Raindance Technologies, Inc. | Digital analyte analysis |
WO2007136874A2 (en) | 2006-05-18 | 2007-11-29 | President And Fellows Of Harvard College | Genomic library construction |
CA2655272C (en) | 2006-06-14 | 2017-04-18 | Living Microsystems, Inc. | Rare cell analysis using sample splitting and dna tags |
EP3536396B1 (en) | 2006-08-07 | 2022-03-30 | The President and Fellows of Harvard College | Fluorocarbon emulsion stabilizing surfactants |
AU2007284651B2 (en) | 2006-08-09 | 2014-03-20 | Institute For Systems Biology | Organ-specific proteins and methods of their use |
WO2008147428A1 (en) | 2006-10-05 | 2008-12-04 | Nanopoint, Inc. | Systems and methods for active microfluidic cell handling |
US8367051B2 (en) | 2006-10-09 | 2013-02-05 | Carnegie Mellon University | Preparation of functional gel particles with a dual crosslink network |
WO2008047428A1 (fr) | 2006-10-18 | 2008-04-24 | Osaki Electric Co., Ltd. | COMPTEUR ÉLECTRONIQUE DE kWh |
US20100184152A1 (en) | 2006-10-23 | 2010-07-22 | Vladislav Sandler | Target-oriented whole genome amplification of nucleic acids |
EP2518162B1 (en) | 2006-11-15 | 2018-03-07 | Biospherex LLC | Multitag sequencing and ecogenomics analysis |
US8050476B2 (en) | 2006-11-22 | 2011-11-01 | General Electric Company | Heart rate demodulation of periodic movement in ultrasound data for object identification |
EP2653861B1 (en) | 2006-12-14 | 2014-08-13 | Life Technologies Corporation | Method for sequencing a nucleic acid using large-scale FET arrays |
EP2096429A4 (en) | 2007-01-16 | 2009-12-16 | Olympus Corp | FLUORESCENT SIGNAL ANALYSIS APPARATUS AND FLUORESCENT SIGNAL ANALYSIS METHOD |
WO2008109207A2 (en) | 2007-01-30 | 2008-09-12 | The Regents Of The University Of California | Methods and devices for biomolecular arrays |
US20080269068A1 (en) | 2007-02-06 | 2008-10-30 | President And Fellows Of Harvard College | Multiplex decoding of sequence tags in barcodes |
WO2008096318A2 (en) | 2007-02-09 | 2008-08-14 | Koninklijke Philips Electronics N.V. | Identification system |
US8003312B2 (en) | 2007-02-16 | 2011-08-23 | The Board Of Trustees Of The Leland Stanford Junior University | Multiplex cellular assays using detectable cell barcodes |
JP5409395B2 (ja) | 2007-02-27 | 2014-02-05 | セントクローネ インターナショナル エービー | 細胞外マーカーに結合する剤のパネルを用いる腫瘍細胞の多重検出 |
WO2008109176A2 (en) | 2007-03-07 | 2008-09-12 | President And Fellows Of Harvard College | Assays and other reactions involving droplets |
KR100882711B1 (ko) | 2007-03-12 | 2009-02-06 | 성균관대학교산학협력단 | 사이크로박터 스피시스 hj147 균주 유래의 우라실-dna글리코실라제 및 이의 용도 |
JP2008256428A (ja) | 2007-04-03 | 2008-10-23 | Intec Systems Institute Inc | マイクロアレイ画像のブロック位置検出方法 |
US20080274458A1 (en) | 2007-05-01 | 2008-11-06 | Latham Gary J | Nucleic acid quantitation methods |
US20090061513A1 (en) | 2007-05-15 | 2009-03-05 | Picovitro Ab | Cell sorting and cell cultivation methods |
EP2164985A4 (en) | 2007-06-01 | 2014-05-14 | 454 Life Sciences Corp | SYSTEM AND METHOD FOR IDENTIFYING INDIVIDUAL SAMPLES FROM A MULTIPLEX MIXTURE |
EP2171097A2 (en) | 2007-06-29 | 2010-04-07 | Population Genetics Technologies LTD. | Methods and compositions for isolating nucleic acid sequence variants |
ES2391906T3 (es) | 2007-09-12 | 2012-11-30 | Institut Pasteur | Polinucleótido apto para un ensayo indicador basado en una sola célula para controlar los patrones de expresión génica con una resolución espacio-temporal elevada |
EP3136103B1 (en) | 2007-10-05 | 2018-08-29 | Affymetrix, Inc. | Highly multiplexed assays |
WO2009105670A2 (en) | 2008-02-21 | 2009-08-27 | Gentel Biosciences, Inc. | Substrates for multiplexed assays and uses thereof |
US8687189B2 (en) | 2008-03-03 | 2014-04-01 | Ajjer, Llc | Analysis of arrays by laser induced breakdown spectroscopy |
US20090298709A1 (en) | 2008-05-28 | 2009-12-03 | Affymetrix, Inc. | Assays for determining telomere length and repeated sequence copy number |
DE102008025656B4 (de) | 2008-05-28 | 2016-07-28 | Genxpro Gmbh | Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung |
WO2009148560A2 (en) | 2008-05-30 | 2009-12-10 | Board Of Regents, The Universtiy Of Texas System | Methods and compositions for nucleic acid sequencing |
WO2010021936A1 (en) | 2008-08-16 | 2010-02-25 | The Board Of Trustees Of The Leland Stanford Junior University | Digital pcr calibration for high throughput sequencing |
US8476013B2 (en) | 2008-09-16 | 2013-07-02 | Sequenom, Inc. | Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses |
US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
US8835110B2 (en) | 2008-11-04 | 2014-09-16 | The Johns Hopkins University | DNA integrity assay (DIA) for cancer diagnostics, using confocal fluorescence spectroscopy |
EP2703816B1 (en) * | 2008-11-21 | 2016-10-05 | Saint Louis University | Biosensor for detecting multiple epitopes on a target |
US20100159533A1 (en) | 2008-11-24 | 2010-06-24 | Helicos Biosciences Corporation | Simplified sample preparation for rna analysis |
US8492096B2 (en) | 2008-12-24 | 2013-07-23 | Boris Pasche | TGFBR1 expression modifies risk for colorectal cancer |
CN102333891A (zh) | 2009-01-20 | 2012-01-25 | 利兰·斯坦福青年大学托管委员会 | 用于药靶诊断、预后和鉴别的单细胞基因表达 |
US20100323348A1 (en) | 2009-01-31 | 2010-12-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process |
CA2754446A1 (en) | 2009-03-05 | 2010-09-10 | Daiichi Sankyo Company, Limited | Pyridine derivative |
EP2230312A1 (en) | 2009-03-19 | 2010-09-22 | Helmholtz-Zentrum für Infektionsforschung GmbH | Probe compound for detecting and isolating enzymes and means and methods using the same |
EP3002337B1 (en) | 2009-03-30 | 2018-10-24 | Illumina, Inc. | Gene expression analysis in single cells |
JP5985390B2 (ja) | 2009-04-02 | 2016-09-06 | フリューダイム・コーポレイション | 標的核酸にバーコードを付加するためのマルチプライマー増幅方法 |
US9085798B2 (en) | 2009-04-30 | 2015-07-21 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
FR2945545B1 (fr) | 2009-05-14 | 2011-08-05 | Univ Aix Marseille Ii | Methode de detection d'adn procaryote extrait d'un echantillon de selles |
JPWO2010131645A1 (ja) | 2009-05-14 | 2012-11-01 | 和光純薬工業株式会社 | Rnaに対応する二本鎖dnaの合成方法及び増幅方法 |
US8673627B2 (en) | 2009-05-29 | 2014-03-18 | Life Technologies Corporation | Apparatus and methods for performing electrochemical reactions |
GB0909923D0 (en) | 2009-06-09 | 2009-07-22 | Oxford Gene Tech Ip Ltd | Picowell capture devices for analysing single cells or other particles |
CN102686728B (zh) | 2009-06-29 | 2018-09-18 | 卢米耐克斯公司 | 具有发夹构象的嵌合引物及其使用方法 |
US8330957B2 (en) | 2009-06-29 | 2012-12-11 | Hager Enviromental and Atmospheric Technologies, LLC | Device and method for quantification of gases in plumes by remote sensing |
EP2467479B1 (en) | 2009-08-20 | 2016-01-06 | Population Genetics Technologies Ltd | Compositions and methods for intramolecular nucleic acid rearrangement |
US8936762B2 (en) | 2009-09-01 | 2015-01-20 | Trustees Of Boston University | High throughput multichannel reader and uses thereof |
JP2013503605A (ja) | 2009-09-01 | 2013-02-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マイクロアレイの選択のためのデバイス及び方法 |
US9625454B2 (en) | 2009-09-04 | 2017-04-18 | The Research Foundation For The State University Of New York | Rapid and continuous analyte processing in droplet microfluidic devices |
WO2011041308A1 (en) | 2009-09-30 | 2011-04-07 | Quest Diagnostics Investments Incorporated | Bcr-abl truncation mutations |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
US20110245085A1 (en) | 2010-01-19 | 2011-10-06 | Rava Richard P | Methods for determining copy number variations |
EP2513341B1 (en) | 2010-01-19 | 2017-04-12 | Verinata Health, Inc | Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing |
JP5901046B2 (ja) | 2010-02-19 | 2016-04-06 | 国立大学法人 千葉大学 | OATP1B3mRNAの新規な選択的スプライシングバリアント |
WO2011123246A2 (en) | 2010-04-01 | 2011-10-06 | Illumina, Inc. | Solid-phase clonal amplification and related methods |
ES2555106T3 (es) | 2010-04-05 | 2015-12-29 | Prognosys Biosciences, Inc. | Ensayos biológicos codificados espacialmente |
SG185544A1 (en) | 2010-05-14 | 2012-12-28 | Fluidigm Corp | Nucleic acid isolation methods |
US8828688B2 (en) | 2010-05-27 | 2014-09-09 | Affymetrix, Inc. | Multiplex amplification methods |
EP3425062B1 (en) | 2010-06-09 | 2023-08-02 | Keygene N.V. | Combinatorial sequence barcodes for high throughput screening |
US20120004132A1 (en) | 2010-07-02 | 2012-01-05 | Affymetrix, Inc. | Detection of Nucleic Acids and Proteins |
EP2407242A1 (en) | 2010-07-13 | 2012-01-18 | Dublin City University | Direct clone analysis and selection technology |
US20120040843A1 (en) | 2010-08-12 | 2012-02-16 | Dublin City University | Centrifugal capture system |
ES2523140T3 (es) | 2010-09-21 | 2014-11-21 | Population Genetics Technologies Ltd. | Aumento de la confianza en las identificaciones de alelos con el recuento molecular |
EP2436766A1 (en) * | 2010-09-29 | 2012-04-04 | Deutsches Krebsforschungszentrum | Means and methods for improved protein interaction screening |
WO2012042374A2 (en) | 2010-10-01 | 2012-04-05 | Anssi Jussi Nikolai Taipale | Method of determining number or concentration of molecules |
EP2625320B1 (en) | 2010-10-08 | 2019-03-27 | President and Fellows of Harvard College | High-throughput single cell barcoding |
US20120088691A1 (en) | 2010-10-08 | 2012-04-12 | Gao Chen | Highly multiplexed real-time pcr using encoded microbeads |
US20130225623A1 (en) | 2010-10-27 | 2013-08-29 | Mount Sinai School Of Medicine | Methods of Treating Psychiatric or Neurological Disorders with MGLUR Antagonists |
EP2646795B1 (en) | 2010-11-29 | 2019-02-20 | Dako Denmark A/S | Methods for analyzing images of specimens processed by a programmable quantitative assay |
US9394511B2 (en) | 2010-12-05 | 2016-07-19 | Wenbin Jiang | Rapid single cell based parallel biological cell sorter |
CN103403545B (zh) | 2010-12-09 | 2018-06-22 | 阿科尼生物系统公司 | 样本分析系统 |
DK2652155T3 (en) | 2010-12-16 | 2017-02-13 | Gigagen Inc | Methods for Massive Parallel Analysis of Nucleic Acids in Single Cells |
US10241075B2 (en) | 2010-12-30 | 2019-03-26 | Life Technologies Corporation | Methods, systems, and computer readable media for nucleic acid sequencing |
DK2665833T3 (en) | 2011-01-17 | 2017-07-24 | Life Technologies Corp | WORKING PROCEDURE FOR DETECTING LIGANDS USING NUCLEIC ACIDS |
WO2012103154A1 (en) | 2011-01-24 | 2012-08-02 | Nugen Technologies, Inc. | Stem-loop composite rna-dna adaptor-primers: compositions and methods for library generation, amplification and other downstream manipulations |
US20120190020A1 (en) | 2011-01-25 | 2012-07-26 | Aria Diagnostics, Inc. | Detection of genetic abnormalities |
WO2016100976A2 (en) | 2014-12-19 | 2016-06-23 | Apprise Bio, Inc. | Methods for identifying multiple epitopes in selected sub-populations of cells |
US9365897B2 (en) | 2011-02-08 | 2016-06-14 | Illumina, Inc. | Selective enrichment of nucleic acids |
WO2012112804A1 (en) | 2011-02-18 | 2012-08-23 | Raindance Technoligies, Inc. | Compositions and methods for molecular labeling |
US9260753B2 (en) | 2011-03-24 | 2016-02-16 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
KR20120110431A (ko) | 2011-03-29 | 2012-10-10 | 에스케이하이닉스 주식회사 | 반도체 메모리 장치 |
GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
EP3907297A1 (en) | 2011-04-15 | 2021-11-10 | The Johns Hopkins University | Safe sequencing system |
EP2702175B1 (en) | 2011-04-25 | 2018-08-08 | Bio-Rad Laboratories, Inc. | Methods and compositions for nucleic acid analysis |
CN103732738A (zh) | 2011-04-28 | 2014-04-16 | 小利兰斯坦福大学托管委员会 | 与样品相关的多核苷酸的鉴定 |
GB201108259D0 (en) | 2011-05-17 | 2011-06-29 | Cambridge Entpr Ltd | Gel beads in microfluidic droplets |
CN112592960A (zh) | 2011-05-20 | 2021-04-02 | 富鲁达公司 | 核酸编码反应 |
RS64230B1 (sr) | 2011-05-24 | 2023-06-30 | BioNTech SE | Individualizovane vakcine protiv kancera |
US9518292B2 (en) | 2011-05-26 | 2016-12-13 | Brandeis University | Methods for suppression PCR |
US8841071B2 (en) | 2011-06-02 | 2014-09-23 | Raindance Technologies, Inc. | Sample multiplexing |
US9752176B2 (en) | 2011-06-15 | 2017-09-05 | Ginkgo Bioworks, Inc. | Methods for preparative in vitro cloning |
US20140147860A1 (en) | 2011-06-27 | 2014-05-29 | Life Technologies Corporation | Acoustic Cytometry Methods and Protocols |
WO2013019075A2 (ko) | 2011-08-01 | 2013-02-07 | 연세대학교산학협력단 | 핵산분자의 제조방법 |
US10364464B2 (en) | 2011-08-08 | 2019-07-30 | The Broad Institute, Inc. | Compositions and methods for co-amplifying subsequences of a nucleic acid fragment sequence |
JP5816486B2 (ja) | 2011-08-18 | 2015-11-18 | オリンパス株式会社 | 蛍光観察装置および蛍光観察システム並びに蛍光観察装置の蛍光画像処理方法 |
WO2013033721A1 (en) * | 2011-09-02 | 2013-03-07 | Atreca, Inc. | Dna barcodes for multiplexed sequencing |
EP3467500B1 (en) | 2011-11-11 | 2021-05-12 | Eli N. Glezer | Co-binder assisted assay methods |
KR101337094B1 (ko) | 2011-11-30 | 2013-12-05 | 삼성에스디에스 주식회사 | 염기 서열 정렬 장치 및 그 방법 |
WO2013117595A2 (en) | 2012-02-07 | 2013-08-15 | Illumina Cambridge Limited | Targeted enrichment and amplification of nucleic acids on a support |
EP3495817A1 (en) | 2012-02-10 | 2019-06-12 | Raindance Technologies, Inc. | Molecular diagnostic screening assay |
US10202628B2 (en) | 2012-02-17 | 2019-02-12 | President And Fellows Of Harvard College | Assembly of nucleic acid sequences in emulsions |
US9176031B2 (en) | 2012-02-24 | 2015-11-03 | Raindance Technologies, Inc. | Labeling and sample preparation for sequencing |
ES2776673T3 (es) | 2012-02-27 | 2020-07-31 | Univ North Carolina Chapel Hill | Métodos y usos para etiquetas moleculares |
EP3321378B1 (en) | 2012-02-27 | 2021-11-10 | Becton, Dickinson and Company | Compositions for molecular counting |
WO2013137737A1 (en) | 2012-03-16 | 2013-09-19 | Flexgen B.V. | Methods of creating and screening of dna encoded combinatorial libraries of chemical antibodies |
US9803239B2 (en) | 2012-03-29 | 2017-10-31 | Complete Genomics, Inc. | Flow cells for high density array chips |
PL2831276T3 (pl) | 2012-05-08 | 2016-10-31 | Kompozycje i sposób oznaczania i kalibracji dla odchylenia amplifikacji w reakcjach multipleksowej pcr | |
US20150132754A1 (en) | 2012-05-14 | 2015-05-14 | Cb Biotechnologies, Inc. | Method for increasing accuracy in quantitative detection of polynucleotides |
CN104471077B (zh) | 2012-05-21 | 2017-05-24 | 富鲁达公司 | 颗粒群的单颗粒分析 |
WO2013176767A1 (en) | 2012-05-25 | 2013-11-28 | The University Of North Carolina At Chapel Hill | Microfluidic devices, solid supports for reagents and related methods |
AU2013273987B2 (en) | 2012-06-15 | 2018-08-09 | Adaptive Biotechnologies Corporation | Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set |
ES2774165T3 (es) | 2012-06-15 | 2020-07-17 | Univ Texas | Secuenciación de alto rendimiento de múltiples transcritos de una única célula |
JP6181751B2 (ja) | 2012-06-18 | 2017-08-16 | ニューゲン テクノロジーズ, インコーポレイテッド | 望まれない核酸配列のネガティブ選択のための組成物および方法 |
EP2875173B1 (en) | 2012-07-17 | 2017-06-28 | Counsyl, Inc. | System and methods for detecting genetic variation |
EP2875131B1 (en) | 2012-07-18 | 2018-03-14 | Siemens Healthcare Diagnostics Inc. | A method of normalizing biological samples |
AU2013293240A1 (en) | 2012-07-24 | 2015-03-05 | Adaptive Biotechnologies Corp. | Single cell analysis using sequence tags |
DK3428290T3 (da) | 2012-07-26 | 2022-07-04 | Illumina Inc | Sammensætninger og fremgangsmåder til amplifikation af nukleinsyrer |
US10174310B2 (en) | 2012-08-08 | 2019-01-08 | Roche Sequencing Solutions, Inc. | Increasing dynamic range for identifying multiple epitopes in cells |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10400280B2 (en) | 2012-08-14 | 2019-09-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
CN113528634A (zh) | 2012-08-14 | 2021-10-22 | 10X基因组学有限公司 | 微胶囊组合物及方法 |
US20150005200A1 (en) | 2012-08-14 | 2015-01-01 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US9567631B2 (en) | 2012-12-14 | 2017-02-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US20140378345A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US20140378349A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US9388465B2 (en) | 2013-02-08 | 2016-07-12 | 10X Genomics, Inc. | Polynucleotide barcode generation |
US10273541B2 (en) | 2012-08-14 | 2019-04-30 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US20140378322A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US20150005199A1 (en) | 2012-08-14 | 2015-01-01 | 10X Technologies, Inc. | Compositions and methods for sample processing |
EP3901280A1 (en) | 2012-10-17 | 2021-10-27 | Spatial Transcriptomics AB | Methods and product for optimising localised or spatial detection of gene expression in a tissue sample |
JP6454281B2 (ja) | 2012-11-05 | 2019-01-16 | タカラ バイオ ユーエスエー, インコーポレイテッド | バーコード化する核酸 |
WO2014108850A2 (en) | 2013-01-09 | 2014-07-17 | Yeda Research And Development Co. Ltd. | High throughput transcriptome analysis |
US9683230B2 (en) | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
WO2014116729A2 (en) | 2013-01-22 | 2014-07-31 | The Board Of Trustees Of The Leland Stanford Junior University | Haplotying of hla loci with ultra-deep shotgun sequencing |
CN104955576A (zh) | 2013-01-24 | 2015-09-30 | 沙特基础全球技术有限公司 | 由聚酯-聚碳酸酯制成的微孔板 |
US10017761B2 (en) | 2013-01-28 | 2018-07-10 | Yale University | Methods for preparing cDNA from low quantities of cells |
US10190963B2 (en) | 2013-02-01 | 2019-01-29 | Becton, Dickinson And Company | Methods and systems for assessing sample behavior in a flow cytometer |
CN105102696B (zh) | 2013-02-08 | 2017-08-15 | 生物辐射实验室股份有限公司 | 用于目标分子检测的基于亲和力的划分试验 |
WO2014126937A1 (en) | 2013-02-14 | 2014-08-21 | The Board Of Trustees Of The Leland Stanford Junior University | Suspension arrays and multiplexed assays based thereon |
US9621600B2 (en) | 2013-02-26 | 2017-04-11 | PortAura Group | Method and system for providing recommendations using location information |
US20140274811A1 (en) | 2013-03-14 | 2014-09-18 | Lyle J. Arnold | Methods for Amplifying a Complete Genome or Transcriptome |
DK2970959T3 (en) | 2013-03-15 | 2018-08-06 | Lineage Biosciences Inc | METHODS AND COMPOSITIONS FOR MARKING AND ANALYSIS OF SAMPLES |
WO2014145458A1 (en) | 2013-03-15 | 2014-09-18 | Arizona Board Of Regents On Behalf Of Arizona State University | Nucleic acid-tagged compositions and methods for multiplexed protein-protein interaction profiling |
US9328382B2 (en) | 2013-03-15 | 2016-05-03 | Complete Genomics, Inc. | Multiple tagging of individual long DNA fragments |
GB2584364A (en) | 2013-03-15 | 2020-12-02 | Abvitro Llc | Single cell bar-coding for antibody discovery |
US9255265B2 (en) | 2013-03-15 | 2016-02-09 | Illumina, Inc. | Methods for producing stranded cDNA libraries |
WO2014165762A1 (en) | 2013-04-05 | 2014-10-09 | Raindance Technologies, Inc. | Rare cell analysis after negative selection |
CA2909861C (en) | 2013-04-25 | 2022-12-06 | Firefly Bioworks, Inc. | Multiplexed analysis of target nucleic acids |
EP2805769A1 (en) | 2013-05-24 | 2014-11-26 | European Molecular Biology Laboratory | Methods for nano-scale single cell analysis |
WO2014201273A1 (en) | 2013-06-12 | 2014-12-18 | The Broad Institute, Inc. | High-throughput rna-seq |
AU2014278537B2 (en) | 2013-06-12 | 2018-04-19 | The General Hospital Corporation | Methods, kits, and systems for multiplexed detection of target molecules and uses thereof |
US20150011398A1 (en) | 2013-06-17 | 2015-01-08 | Kim Lewis | Methods for quantitative determination of protein-nucleic acid interactions in complex mixtures |
WO2014210225A1 (en) | 2013-06-25 | 2014-12-31 | Prognosys Biosciences, Inc. | Methods and systems for determining spatial patterns of biological targets in a sample |
KR102366116B1 (ko) | 2013-06-27 | 2022-02-23 | 10엑스 제노믹스, 인크. | 샘플 처리를 위한 조성물 및 방법 |
US9708657B2 (en) | 2013-07-01 | 2017-07-18 | Adaptive Biotechnologies Corp. | Method for generating clonotype profiles using sequence tags |
US10395758B2 (en) | 2013-08-30 | 2019-08-27 | 10X Genomics, Inc. | Sequencing methods |
US20150132743A1 (en) | 2013-09-04 | 2015-05-14 | Fluidigm Corporation | Proximity assays for detecting nucleic acids and proteins in a single cell |
GB201317301D0 (en) | 2013-09-30 | 2013-11-13 | Linnarsson Sten | Method for capturing and encoding nucleic acid from a plurality of single cells |
CN105745334B (zh) | 2013-09-30 | 2019-12-10 | 吴迪 | 通过使用邻近条形编码分析分子复合物的概况的方法 |
JP2017504307A (ja) | 2013-10-07 | 2017-02-09 | セルラー リサーチ, インコーポレイテッド | アレイ上のフィーチャーをデジタルカウントするための方法およびシステム |
EP3875601A1 (en) | 2013-10-17 | 2021-09-08 | Illumina, Inc. | Methods and compositions for preparing nucleic acid libraries |
US10288608B2 (en) | 2013-11-08 | 2019-05-14 | Prognosys Biosciences, Inc. | Polynucleotide conjugates and methods for analyte detection |
DK3089822T3 (da) | 2013-12-30 | 2022-05-02 | Atreca Inc | Analyse af nukleinsyrer associeret med enkelte celler under anvendelse af nukleinsyrestregkoder |
EP3099820A4 (en) | 2014-01-27 | 2018-01-03 | The General Hospital Corporation | Methods of preparing nucleic acids for sequencing |
US20150218620A1 (en) | 2014-02-03 | 2015-08-06 | Integrated Dna Technologies, Inc. | Methods to capture and/or remove highly abundant rnas from a heterogenous rna sample |
WO2015134787A2 (en) | 2014-03-05 | 2015-09-11 | Adaptive Biotechnologies Corporation | Methods using randomer-containing synthetic molecules |
US20150298091A1 (en) | 2014-04-21 | 2015-10-22 | President And Fellows Of Harvard College | Systems and methods for barcoding nucleic acids |
EP3136013B1 (en) | 2014-04-25 | 2023-02-22 | Mitsubishi Electric Corporation | Heat pump chilling system and control method therefor |
US20170044525A1 (en) | 2014-04-29 | 2017-02-16 | Illumina, Inc. | Multiplexed single cell gene expression analysis using template switch and tagmentation |
US10975371B2 (en) | 2014-04-29 | 2021-04-13 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
KR20170026383A (ko) | 2014-06-26 | 2017-03-08 | 10엑스 제노믹스, 인크. | 핵산 서열의 분석 |
CN113249435A (zh) | 2014-06-26 | 2021-08-13 | 10X基因组学有限公司 | 分析来自单个细胞或细胞群体的核酸的方法 |
EP3169799B1 (en) | 2014-07-15 | 2019-09-04 | Qiagen Sciences, LLC | Semi-random barcodes for nucleic acid analysis |
WO2016040446A1 (en) | 2014-09-10 | 2016-03-17 | Good Start Genetics, Inc. | Methods for selectively suppressing non-target sequences |
EP3194593B1 (en) * | 2014-09-15 | 2019-02-06 | AbVitro LLC | High-throughput nucleotide library sequencing |
SG10201903408VA (en) | 2014-10-17 | 2019-05-30 | Illumina Cambridge Ltd | Contiguity preserving transposition |
US20160289669A1 (en) | 2015-01-22 | 2016-10-06 | Becton, Dickinson And Company | Devices and systems for molecular barcoding of nucleic acid targets in single cells |
EP3247804B1 (en) | 2015-01-23 | 2020-08-05 | Qiagen Sciences, LLC | High multiplex pcr with molecular barcoding |
SG11201705996PA (en) | 2015-02-09 | 2017-09-28 | 10X Genomics Inc | Systems and methods for determining structural variation and phasing using variant call data |
WO2016134078A1 (en) | 2015-02-19 | 2016-08-25 | Becton, Dickinson And Company | High-throughput single-cell analysis combining proteomic and genomic information |
EP3262189B1 (en) | 2015-02-27 | 2021-12-08 | Becton, Dickinson and Company | Methods for barcoding nucleic acids for sequencing |
EP3262192B1 (en) | 2015-02-27 | 2020-09-16 | Becton, Dickinson and Company | Spatially addressable molecular barcoding |
US20180073073A1 (en) | 2015-03-18 | 2018-03-15 | Cellular Research, Inc. | Methods and compositions for labeling targets and haplotype phasing |
WO2016160965A1 (en) | 2015-03-30 | 2016-10-06 | Rubicon Genomics, Inc. | Methods and compositions for repair of dna ends by multiple enzymatic activities |
EP4180535A1 (en) | 2015-03-30 | 2023-05-17 | Becton, Dickinson and Company | Methods and compositions for combinatorial barcoding |
CN107636169A (zh) | 2015-04-17 | 2018-01-26 | 生捷科技控股公司 | 对生物分子进行空间概况分析的方法 |
WO2016172373A1 (en) | 2015-04-23 | 2016-10-27 | Cellular Research, Inc. | Methods and compositions for whole transcriptome amplification |
US9618871B2 (en) | 2015-04-28 | 2017-04-11 | Kyocera Document Solutions Inc. | Image forming apparatus |
US10988802B2 (en) | 2015-05-22 | 2021-04-27 | Sigma-Aldrich Co. Llc | Methods for next generation genome walking and related compositions and kits |
US11124823B2 (en) | 2015-06-01 | 2021-09-21 | Becton, Dickinson And Company | Methods for RNA quantification |
KR20180036712A (ko) | 2015-08-24 | 2018-04-09 | 키아겐 게엠베하 | Rna-서열결정 라이브러리를 생성하는 방법 |
WO2017040306A1 (en) | 2015-08-28 | 2017-03-09 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
CN108026524A (zh) | 2015-09-11 | 2018-05-11 | 赛卢拉研究公司 | 用于核酸文库标准化的方法和组合物 |
EP3933047A1 (en) * | 2015-09-24 | 2022-01-05 | AbVitro LLC | Affinity-oligonucleotide conjugates and uses thereof |
JP7064439B2 (ja) | 2015-11-04 | 2022-05-10 | アトレカ インコーポレイテッド | 単一細胞に関連する核酸の解析のための、核酸バーコードの組み合わせセット |
WO2017117358A1 (en) | 2015-12-30 | 2017-07-06 | Bio-Rad Laboratories, Inc. | Digital protein quantification |
WO2017139690A1 (en) | 2016-02-11 | 2017-08-17 | 10X Genomics, Inc. | Cell population analysis using single nucleotide polymorphisms from single cell transcriptomes |
US20190218276A1 (en) | 2016-03-21 | 2019-07-18 | The Broad Institute, Inc. | Methods for determining spatial and temporal gene expression dynamics in single cells |
EP3436581B1 (en) | 2016-04-01 | 2020-10-14 | Baylor College of Medicine | Methods of whole transcriptome amplification |
AU2017261189B2 (en) | 2016-05-02 | 2023-02-09 | Becton, Dickinson And Company | Accurate molecular barcoding |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
EP3465502B1 (en) | 2016-05-26 | 2024-04-10 | Becton, Dickinson and Company | Molecular label counting adjustment methods |
TWI600309B (zh) | 2016-05-28 | 2017-09-21 | Hon Hai Prec Ind Co Ltd | 角度調整機構 |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
EP3686287A1 (en) | 2016-06-28 | 2020-07-29 | Hifibio | Method for transcriptome analysis of single cells |
WO2018017949A1 (en) | 2016-07-22 | 2018-01-25 | Verily Life Sciences Llc | Quantitative massively parallel proteomics |
WO2018020489A1 (en) | 2016-07-24 | 2018-02-01 | Yeda Research And Development Co. Ltd. | Methods and kits for analyzing dna binding moieties attached to dna |
US20180037942A1 (en) | 2016-08-03 | 2018-02-08 | Cellular Research, Inc. | Enzyme-independent molecular indexing |
JP2019528059A (ja) | 2016-08-10 | 2019-10-10 | プレジデント アンド フェローズ オブ ハーバード カレッジ | バーコード化ゲノムdna断片のデノボアセンブリの方法 |
JP7091348B2 (ja) | 2016-09-26 | 2022-06-27 | ベクトン・ディキンソン・アンド・カンパニー | バーコード付きオリゴヌクレオチド配列を有する試薬を用いたタンパク質発現の測定 |
CN114875125A (zh) | 2016-10-19 | 2022-08-09 | 10X基因组学有限公司 | 用于条形码化单个细胞或细胞群的核酸分子的方法和系统 |
EP3551768B1 (en) | 2016-12-12 | 2024-03-06 | Grail, LLC | Methods for tagging and amplifying rna template molecules for preparing sequencing libraries |
WO2019113533A1 (en) | 2017-12-08 | 2019-06-13 | 10X Genomics, Inc. | Methods and compositions for labeling cells |
US10011872B1 (en) | 2016-12-22 | 2018-07-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US20190177800A1 (en) | 2017-12-08 | 2019-06-13 | 10X Genomics, Inc. | Methods and compositions for labeling cells |
GB201622222D0 (en) | 2016-12-23 | 2017-02-08 | Cs Genetics Ltd | Reagents and methods for molecular barcoding of nucleic acids of single cells |
US20180208975A1 (en) | 2017-01-20 | 2018-07-26 | Merck Sharp & Dohme Corp. | Assay for simultaneous genomic and proteomic analysis |
EP4310183A3 (en) | 2017-01-30 | 2024-02-21 | 10X Genomics, Inc. | Methods and systems for droplet-based single cell barcoding |
CN110382708A (zh) | 2017-02-01 | 2019-10-25 | 赛卢拉研究公司 | 使用阻断性寡核苷酸进行选择性扩增 |
WO2018144813A1 (en) | 2017-02-02 | 2018-08-09 | New York Genome Center | Methods and compositions for identifying or quantifying targets in a biological sample |
JP2020513826A (ja) | 2017-03-24 | 2020-05-21 | ナショナル ユニヴァーシティー オブ シンガポール | 分子の多重検出方法 |
US20200370105A1 (en) | 2017-05-23 | 2020-11-26 | Centrillion Technology Holdings Corporation | Methods for performing spatial profiling of biological molecules |
US20180340169A1 (en) | 2017-05-26 | 2018-11-29 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
EP3631004A4 (en) | 2017-05-29 | 2021-03-03 | President and Fellows of Harvard College | MONOCELLULAR TRANSCRIPTOME AMPLIFICATION PROCESS |
CN110719959B (zh) | 2017-06-05 | 2021-08-06 | 贝克顿迪金森公司 | 针对单细胞的样品索引 |
US20200217850A1 (en) | 2017-09-15 | 2020-07-09 | Apton Biosystems, Inc. | Heterogeneous single cell profiling using molecular barcoding |
CN111247589A (zh) | 2017-09-25 | 2020-06-05 | 贝克顿迪金森公司 | 免疫受体条形码错误校正 |
WO2019113506A1 (en) | 2017-12-07 | 2019-06-13 | The Broad Institute, Inc. | Methods and compositions for multiplexing single cell and single nuclei sequencing |
CA3084439A1 (en) | 2017-12-07 | 2019-06-13 | Massachusetts Institute Of Technology | Single cell analyses |
WO2019113499A1 (en) | 2017-12-07 | 2019-06-13 | The Broad Institute, Inc. | High-throughput methods for identifying gene interactions and networks |
WO2019118355A1 (en) | 2017-12-12 | 2019-06-20 | 10X Genomics, Inc. | Systems and methods for single cell processing |
CN111712579A (zh) | 2017-12-22 | 2020-09-25 | 10X基因组学有限公司 | 用于处理来自一个或多个细胞的核酸分子的系统和方法 |
WO2019157529A1 (en) | 2018-02-12 | 2019-08-15 | 10X Genomics, Inc. | Methods characterizing multiple analytes from individual cells or cell populations |
WO2019213294A1 (en) | 2018-05-03 | 2019-11-07 | Becton, Dickinson And Company | High throughput multiomics sample analysis |
WO2019213237A1 (en) | 2018-05-03 | 2019-11-07 | Becton, Dickinson And Company | Molecular barcoding on opposite transcript ends |
-
2018
- 2018-03-27 CN CN201880037720.1A patent/CN110719959B/zh active Active
- 2018-03-27 AU AU2018281745A patent/AU2018281745B2/en active Active
- 2018-03-27 US US15/937,713 patent/US10676779B2/en active Active
- 2018-03-27 CA CA3059559A patent/CA3059559A1/en active Pending
- 2018-03-27 EP EP23216012.7A patent/EP4345172A2/en active Pending
- 2018-03-27 WO PCT/US2018/024602 patent/WO2018226293A1/en unknown
- 2018-03-27 KR KR1020227029623A patent/KR20220124280A/ko active Search and Examination
- 2018-03-27 JP JP2019566787A patent/JP2020522262A/ja active Pending
- 2018-03-27 KR KR1020197038794A patent/KR102438495B1/ko active IP Right Grant
- 2018-03-27 EP EP18716877.8A patent/EP3635135A1/en not_active Withdrawn
- 2018-06-19 US US16/012,635 patent/US10669570B2/en active Active
-
2020
- 2020-02-12 US US16/789,311 patent/US20200172957A1/en active Pending
- 2020-04-14 US US16/848,241 patent/US20200385780A1/en active Pending
-
2022
- 2022-04-22 JP JP2022071002A patent/JP2022106832A/ja active Pending
- 2022-08-02 AU AU2022211826A patent/AU2022211826A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104812915A (zh) * | 2012-10-22 | 2015-07-29 | 新加坡国立大学 | 基于pcr用于平行检测生物材料的测定 |
WO2015031691A1 (en) * | 2013-08-28 | 2015-03-05 | Cellular Research, Inc. | Massively parallel single cell analysis |
WO2015061844A1 (en) * | 2013-10-30 | 2015-05-07 | The University Of Sydney | Assay to stratify cancer patients |
CN105392902A (zh) * | 2014-06-24 | 2016-03-09 | 生物辐射实验室股份有限公司 | 数字式pcr条码化 |
WO2016049418A1 (en) * | 2014-09-25 | 2016-03-31 | Everspin Technologies, Inc. | Ecc word configuration for system-level ecc compatibility |
Also Published As
Publication number | Publication date |
---|---|
EP4345172A2 (en) | 2024-04-03 |
KR20200014370A (ko) | 2020-02-10 |
EP3635135A1 (en) | 2020-04-15 |
AU2018281745A1 (en) | 2019-10-24 |
US10676779B2 (en) | 2020-06-09 |
JP2020522262A (ja) | 2020-07-30 |
US20200385780A1 (en) | 2020-12-10 |
CN110719959A (zh) | 2020-01-21 |
US20180346970A1 (en) | 2018-12-06 |
KR20220124280A (ko) | 2022-09-13 |
US20200172957A1 (en) | 2020-06-04 |
WO2018226293A1 (en) | 2018-12-13 |
US10669570B2 (en) | 2020-06-02 |
CA3059559A1 (en) | 2018-12-13 |
JP2022106832A (ja) | 2022-07-20 |
AU2018281745B2 (en) | 2022-05-19 |
KR102438495B1 (ko) | 2022-09-01 |
AU2022211826A1 (en) | 2022-08-25 |
US20180346969A1 (en) | 2018-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110719959B (zh) | 针对单细胞的样品索引 | |
EP3837378B1 (en) | Aptamer barcoding | |
EP3914728B1 (en) | Oligonucleotides associated with antibodies | |
US11649497B2 (en) | Methods and compositions for quantitation of proteins and RNA | |
US11932849B2 (en) | Whole transcriptome analysis of single cells using random priming | |
US20210214770A1 (en) | Cell capture using du-containing oligonucleotides | |
US20200071691A1 (en) | Sample multiplexing using carbohydrate-binding and membrane-permeable reagents | |
CN113454234A (zh) | 杂合体靶向和全转录物组扩增 | |
US11371076B2 (en) | Polymerase chain reaction normalization through primer titration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |