CN108291257A - 亲和-寡核苷酸缀合物及其用途 - Google Patents

亲和-寡核苷酸缀合物及其用途 Download PDF

Info

Publication number
CN108291257A
CN108291257A CN201680068588.1A CN201680068588A CN108291257A CN 108291257 A CN108291257 A CN 108291257A CN 201680068588 A CN201680068588 A CN 201680068588A CN 108291257 A CN108291257 A CN 108291257A
Authority
CN
China
Prior art keywords
container
sequence
affine
cell
oligonucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680068588.1A
Other languages
English (en)
Other versions
CN108291257B (zh
Inventor
弗朗索瓦·维格纳尔特
阿德里安·阮格汉姆·布里格斯
斯蒂芬·J·戈德弗莱斯
布莱恩·J·贝尔蒙特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abu Vitello LLC
Original Assignee
Abu Vitello LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abu Vitello LLC filed Critical Abu Vitello LLC
Publication of CN108291257A publication Critical patent/CN108291257A/zh
Application granted granted Critical
Publication of CN108291257B publication Critical patent/CN108291257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56966Animal cells
    • G01N33/56972White blood cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/159Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/7051T-cell receptor (TcR)-CD3 complex
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70514CD4
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70517CD8
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70539MHC-molecules, e.g. HLA-molecules
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • G01N2458/10Oligonucleotides as tagging agents for labelling antibodies

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Treatment Of Liquids With Adsorbents In General (AREA)

Abstract

本文提供了使用亲和‑寡核苷酸缀合物进行单细胞表征的方法和组合物。

Description

亲和-寡核苷酸缀合物及其用途
交叉引用
本申请要求于2015年9月24日提交的美国临时申请号62/232,209的优先权,该临时申请通过引用以其全文并入本文。
背景技术
许多细胞类型可通过内源性表达的且位于其质膜上的特定组蛋白质的丰度来进行鉴定和分类。该现象使得能够利用被称为免疫表型分型的方法研究细胞,其中将细胞与对所述细胞的已知表面蛋白质具有特异性的荧光标记的抗体一起温育,并且该细胞被该荧光标记的抗体结合。流式细胞术常用于测量每种细胞的表面结合抗体的水平。然而,基于流式细胞术的方法受限于在同一实验中可同时使用的荧光团的数目。另外,在使用基于流式细胞术的方法的同一实验中可同时使用的荧光团的数目受到光谱重叠的限制。此外,流式细胞术不适于许多生物学上相关的测定和后续DNA测序。
发明内容
因此,存在对于在没有这些限制的情况下对单细胞进行表征,例如进行免疫表型分型的方法的需要。不同于基于流式细胞术的方法,本文所述的方法使用序列读出(readout)来分析单独细胞的蛋白质,并且不受限于同一实验中可同时使用的荧光团的数目或其光谱重叠。此外,本文所述的方法适于许多生物学上相关的测定和后续DNA测序。本文所述的方法利用亲和-寡核苷酸缀合物(例如,抗体-寡核苷酸缀合物)。所述缀合物的寡核苷酸包含条码化地加至(barcoded to)亲和-寡核苷酸缀合物的亲和部分特异性结合的表面抗原的抗原ID(AID)序列。因此,使用本文所述的方法可在不需要荧光团的情况下分析单细胞的抗原(例如,表面蛋白质)。例如,显示出的单细胞的表面蛋白质可由抗原ID序列鉴别。单细胞的一种或多种表面蛋白质可用于定义该单细胞的身份、特征或相关性。
本文所述方法的亲和-寡核苷酸缀合物可用于克服以下问题:缓慢的细胞分选、与细胞分选有关的目标产量降低、有限数目的输出流以及与亲和-寡核苷酸缀合物的定量性质如亲和力不对应的选定箱元(bin)。描述的示例性亲和-寡核苷酸缀合物可代替或增强在容器中采用四聚体结合的单细胞测量进行的分选。描述的示例性亲和-寡核苷酸缀合物可在本文所述的方法中用于同时获得TCR对序列、克隆丰度和相对的四聚体亲和力。
本文描述了采用亲和-寡核苷酸缀合物对容器(例如,乳液)中的细胞进行表征,例如免疫表型分型的方法。在一些实施方案中,所述方法用于以与基于乳液的单细胞分析相容的方式鉴别细胞亚群。在一些实施方案中,所述方法用于以与基于乳液的单细胞分析相容的方式鉴别对抗原具有特异性的免疫细胞。在一些实施方案中,在细胞分析之前,使表面蛋白质特异性抗体与寡核苷酸缀合。在一些实施方案中,寡核苷酸被设计为含有对于所缀合的抗体的靶特异性独特的序列基序。寡核苷酸可与亲和-寡核苷酸缀合物的亲和部分(例如,抗体)共价或非共价缀合(例如,生物素-寡核苷酸与链霉亲和素-抗体缀合)。
方法可包括将细胞在具有一个或多个亲和-寡核苷酸缀合物的混合物或溶液中温育。可洗涤所述细胞以去除未结合的亲和-寡核苷酸缀合物。随后将细胞封装在容器,例如乳液中。细胞可以以每个容器单个细胞的密度存在于容器中。因此,容器例如小液滴内的亲和-寡核苷酸缀合物,例如,通过特异性抗体-表面蛋白质相互作用结合至细胞表面。所述方法可包括将容器特异性DNA序列(例如,独特的容器条码)附接至亲和-缀合的寡核苷酸。可在将亲和-缀合的寡核苷酸条码化(例如,采用DNA条码)之前、同时或之后,进行附加的细胞DNA或mRNA分析、表型测量、功能测试、细胞分选或其他的反应。
方法可包括例如,在乳液实验之后从乳液提取核酸。可准备好提取的核酸以供测序并进行测序(例如,使用下一代测序技术)。方法可包括对来自含有抗原ID序列和小液滴特异性条码序列的容器的多核苷酸分子进行测序。抗原ID序列可定义由寡核苷酸缀合的抗体所结合的特异性细胞表面蛋白质。抗原ID序列可定义与特定细胞表面蛋白质结合的寡核苷酸缀合的抗体的特异性抗体。因此,抗原ID序列可指示分析的细胞所表达的表面蛋白质。在包含单细胞的容器中,含有共有小液滴特异性条码序列的所有序列都与单细胞相关联。因此,可以以显示一组表面蛋白质的方式分析单细胞,这组表面蛋白质可用于定义单细胞的身份、特征或相关性。
在一个方面,提供了一种方法,其包括在多个容器中进行反应,所述反应包括将包含容器条码序列的容器条码化多核苷酸附接至与隔离在多个容器中的容器中的单细胞的靶抗原结合的亲和-寡核苷酸缀合物中的寡核苷酸。
在一个方面,本文提供了一种方法,其包括在多个容器中的容器中进行反应,所述反应包括将包含容器条码序列的容器条码化多核苷酸附接至亲和-寡核苷酸缀合物中的寡核苷酸部分,其中所述亲和-寡核苷酸缀合物与由所述多个容器中的所述容器中的细胞表达的靶抗原结合。
在一些实施方案中,所述细胞是所述容器内包含的单细胞。在一些实施方案中,所述容器包括所述多个容器中的两个或更多个容器。在一些实施方案中,所述容器包括所述多个容器中的每个容器。在一些实施方案中,所述反应在所述多个容器中的两个或更多个容器中发生。在一些实施方案中,每个容器中的细胞来自相同的样品。在一些实施方案中,所述两种或更多种多个容器中的第一多个容器中的容器中的细胞与所述两种或更多种多个容器中的第二多个容器中的容器中的细胞来自相同的样品。在一些实施方案中,所述寡核苷酸部分包含抗原标识序列(AID)。在一些实施方案中,所述AID被条码化地加至所述靶抗原或所述亲和-寡核苷酸缀合物的亲和部分。
在一些实施方案中,所述寡核苷酸进一步包含条码化地加至所述靶抗原或所述亲和-寡核苷酸缀合物的亲和部分的抗原标识序列(AID)。在一些实施方案中,所述抗原标识序列(AID)是已知序列。
在一些实施方案中,所述容器条码化多核苷酸来自所述容器中的模板容器条码化多核苷酸。
在一些实施方案中,所述方法进一步包括对所述寡核苷酸或其扩增子进行测序以获得序列信息。
在一些实施方案中,所述方法进一步包括基于所述序列信息确定所述单细胞的特征。在一些实施方案中,所述序列信息包含抗原标识(AID)序列。在一些实施方案中,所述方法进一步包括基于所述序列信息确定所述单细胞的特征。在一些实施方案中,所述特征为表型。在一些实施方案中,所述表型为免疫表型。
在一些实施方案中,所述方法进一步包括使所述亲和-寡核苷酸缀合物与包含所述单细胞的多个细胞接触。在一些实施方案中,所述接触在将所述单细胞隔离在所述容器中之前。在一些实施方案中,所述方法进一步包括在所述接触之后洗涤所述多个细胞。
在一些实施方案中,所述容器不包含不与靶抗原结合的亲和-寡核苷酸缀合物。
在一些实施方案中,所述方法进一步包括将所述单细胞隔离在所述容器中。在一些实施方案中,在所述隔离之前使所述单细胞与所述亲和-寡核苷酸缀合物结合。
在一些实施方案中,所述方法进一步包括裂解所述单细胞。在一些实施方案中,所述裂解在将所述单细胞隔离在所述容器中之后。
在一些实施方案中,所述多个细胞是多个未分选的细胞。
在一些实施方案中,所述多个容器中的第一容器中的容器条码化多核苷酸或其扩增子的容器条码序列不同于所述多个容器中的第二容器中的容器条码化多核苷酸或其扩增子的容器条码序列。在一些实施方案中,所述多个容器中的单个容器中的每个容器条码化多核苷酸或其扩增子的容器条码序列包含相同的容器条码序列。在一些实施方案中,所述多个容器中的任何单个容器中的每个容器条码化多核苷酸及其扩增子的容器条码序列相对于所述多个容器中的任何其他单个容器中的每个容器条码化多核苷酸及其扩增子的容器条码序列是独特的。
在一些实施方案中,所述方法进一步包括将容器条码化多核苷酸附接至来自所述单细胞的细胞多核苷酸。在一些实施方案中,将容器条码化多核苷酸附接至亲和-寡核苷酸缀合物中的寡核苷酸和将容器条码化多核苷酸附接至来自所述单细胞的细胞多核苷酸同时进行。
在一些实施方案中,所述方法进一步包括扩增所述寡核苷酸或其互补体。在一些实施方案中,所述方法进一步包括扩增所述细胞多核苷酸或其互补体。在一些实施方案中,所述扩增所述寡核苷酸或其互补体和所述扩增所述细胞多核苷酸或其互补体同时进行。
在一些实施方案中,所述细胞多核苷酸的容器条码序列与所述寡核苷酸的容器条码序列相同。
在一些实施方案中,所述方法进一步包括将来自所述多个容器中的两个或更多个容器的寡核苷酸或其扩增子合并。在一些实施方案中,所述方法进一步包括将来自所述多个容器中的两个或更多个容器的寡核苷酸或其扩增子和细胞多核苷酸或其扩增子合并。在一些实施方案中,所述合并在测序之前。
在一些实施方案中,所述亲和-寡核苷酸缀合物包含多个不同的亲和-寡核苷酸缀合物。在一些实施方案中,所述多个亲和-寡核苷酸缀合物中的每个亲和-寡核苷酸缀合物包含独特的抗原标识(AID)序列。在一些实施方案中,所述寡核苷酸包含条码化地加至多个亲和-寡核苷酸缀合物分子中的单个亲和-寡核苷酸缀合物分子的亲和分子条码(AMB)序列。在一些实施方案中,所述多个亲和-寡核苷酸缀合物分子中的每个亲和-寡核苷酸缀合物分子包含独特的亲和分子条码(AMB)序列。
在一些实施方案中,所述寡核苷酸包含融合序列,并且所述附接包括将所述容器条码化多核苷酸附接至该融合序列。在一些实施方案中,所述寡核苷酸包含引物结合序列。在一些实施方案中,所述寡核苷酸包含恒定序列。
在一些实施方案中,所述方法进一步包括对所述寡核苷酸、其互补体、其扩增产物或它们的组合进行测序,从而产生寡核苷酸序列读取。在一些实施方案中,所述方法进一步包括将一个或多个第一寡核苷酸序列读取与一个或多个第二寡核苷酸序列读取进行比较。在一些实施方案中,所述方法进一步包括分析所述寡核苷酸序列读取。在一些实施方案中,所述方法进一步包括分析所述寡核苷酸序列读取的容器条码序列。在一些实施方案中,所述方法进一步包括分析所述寡核苷酸序列读取的抗原标识(AID)序列。在一些实施方案中,所述方法进一步包括分析所述寡核苷酸序列读取的亲和分子条码(AMB)序列。在一些实施方案中,所述分析包括测定一个或多个容器条码序列、一个或多个AID序列、一个或多个亲和分子条码(AMB)序列或其组合的频率。在一些实施方案中,所述分析包括比较。在一些实施方案中,所述方法进一步包括将寡核苷酸序列读取的抗原标识(AID)序列与寡核苷酸序列读取的亲和分子条码(AMB)序列进行比较。
在一些实施方案中,所述方法进一步包括对所述细胞多核苷酸、其互补体、其扩增产物或它们的组合进行测序,从而产生细胞多核苷酸序列读取。在一些实施方案中,其中所述方法进一步包括将寡核苷酸序列读取与所述细胞多核苷酸序列读取进行比较。在一些实施方案中,所述方法进一步包括将寡核苷酸序列读取的容器条码序列与所述细胞多核苷酸序列读取的容器条码序列进行比较。在一些实施方案中,所述方法进一步包括比较所述细胞多核苷酸序列读取。在一些实施方案中,所述方法进一步包括分析所述细胞多核苷酸序列读取的容器条码序列。在一些实施方案中,所述方法进一步包括分析所述细胞多核苷酸序列读取的分子条码序列。
在一些实施方案中,所述方法进一步包括基于所述分析或所述比较来确定细胞的特征。在一些实施方案中,所述方法进一步包括基于所述寡核苷酸序列读取选择抗体或TCR。在一些实施方案中,所述方法包括基于所述细胞多核苷酸序列读取选择抗体或TCR。
在一些实施方案中,附接至所述寡核苷酸的容器条码化多核苷酸和附接至所述细胞多核苷酸的容器条码化多核苷酸来自所述容器中相同的模板容器条码化多核苷酸。在一些实施方案中,附接至所述寡核苷酸的容器条码化多核苷酸是模板容器条码化多核苷酸的扩增产物。
在一些实施方案中,附接至所述细胞多核苷酸的容器条码化多核苷酸是所述模板容器条码化多核苷酸的扩增产物。
在一些实施方案中,所述容器包含固体支持体。在一些实施方案中,所述容器不包含固体支持体。在一些实施方案中,所述多个容器中的每个容器均包含单细胞。在一些实施方案中,所述容器是孔、乳液或小液滴。在一些实施方案中,所述模板容器条码化多核苷酸不与固体支持体结合。在一些实施方案中,所述模板容器条码化多核苷酸与固体支持体结合。
在一些实施方案中,所述方法进一步包括将多个分子条码化多核苷酸中的分子条码化多核苷酸的分子条码序列附接至所述细胞多核苷酸,其中所述分子条码序列被条码化地加至单细胞多核苷酸分子及其扩增子。
在一些实施方案中,所述附接包括将所述容器多核苷酸与所述寡核苷酸连接。在一些实施方案中,所述附接包括采用酶将所述容器多核苷酸附接至所述寡核苷酸。在一些实施方案中,所述附接包括使所述容器多核苷酸与所述寡核苷酸杂交。在一些实施方案中,所述附接进一步包括延伸所述寡核苷酸。在一些实施方案中,所述附接包括扩增模板容器条码化多核苷酸。
在一些实施方案中,所述寡核苷酸是双链的。在一些实施方案中,所述寡核苷酸是单链的。在一些实施方案中,所述寡核苷酸是DNA。在一些实施方案中,所述寡核苷酸是RNA。
在一些实施方案中,所述细胞多核苷酸包含可变区序列。在一些实施方案中,所述方法进一步包括使含有可变区序列的天然链序列配对。在一些实施方案中,所述细胞多核苷酸是DNA。在一些实施方案中,所述细胞多核苷酸是RNA。在一些实施方案中,所述RNA是mRNA。
在一些实施方案中,所述单细胞是B细胞。在一些实施方案中,所述单细胞是T细胞。
在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分与所述单细胞的细胞外抗原结合。在一些实施方案中,所述单细胞的细胞外抗原是对免疫细胞具有特异性的抗原。在一些实施方案中,所述单细胞的细胞外抗原是对T细胞具有特异性的抗原。在一些实施方案中,所述细胞外抗原是CD4。在一些实施方案中,所述细胞外抗原是CD8。在一些实施方案中,所述单细胞的细胞外抗原是对B细胞具有特异性的抗原。在一些实施方案中,所述细胞外抗原是免疫球蛋白。
在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分是抗体或其片段。在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分是肽。在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分是蛋白质。在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分是适体。在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分是小分子。在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分是药物。在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分是细胞。在一些实施方案中,所述细胞是抗原呈递细胞(APC)。在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分包含主要组织相容性复合体(MHC)。在一些实施方案中,所述MHC是可溶和/或多聚体(例如,四聚体)形式。在一些实施方案中,所述MHC与肽结合。在一些实施方案中,所述肽是合成肽。在一些实施方案中,所述MHC与例如,所述单细胞的T细胞受体(TCR)和/或TCR样结合分子,如TCR样抗体或免疫球蛋白或嵌合抗原受体结合。
在一些实施方案中,所述亲和部分与抗原识别分子和/或免疫受体(如抗体或免疫球蛋白或其部分或融合物)、工程化免疫受体、嵌合抗原受体(CAR)或TCR特异性结合。在一些这样的实施方案中,所述亲和部分包含由抗体或受体如CAR识别的抗原或其表位或部分。在一些实施方案中,所述亲和部分包含与免疫受体特异性结合的抗体或其抗原结合片段。在一些方面,所述抗体或其抗原结合片段与所述受体的可变部分和/或抗原结合部分如独特位(idiotope)特异性结合。在一些方面,所述亲和分子是抗独特型(anti-idiotypic)抗体或其片段。
在一些实施方案中,所述亲和-寡核苷酸缀合物的亲和部分包含主要组织相容性复合体(MHC)或其功能或结合部分。在一些实施方案中,所述亲和部分包含所述MHC的多聚体,任选地包含所述MHC的四聚体。在一些实施方案中,所述MHC是可溶形式。在一些实施方案中,所述MHC与肽结合并且/或者在所述MHC的沟槽内含有肽。在一些实施方案中,所述肽是合成肽。在一些实施方案中,所述MHC与所述单细胞的T细胞受体(TCR)结合。在一些实施方案中,所述亲和部分包含与抗体或嵌合抗原受体(CAR)结合的肽,并且/或者其中所述靶标是抗体或CAR。在一些实施方案中,所述亲和部分是或包含由所述抗体或所述嵌合抗原受体特异性识别的抗原或表位,并且/或者包含与其特异性结合的抗体,任选地包含与其抗原结合部分特异性结合的抗独特型抗体。
在一个方面,提供了一种组合物,其包含多个容器,每个容器均包含来自包含多个细胞的样品的单细胞、与所述单细胞的靶抗原结合的亲和-寡核苷酸缀合物以及包含容器条码序列的容器条码化多核苷酸。在一些实施方案中,所述容器条码化多核苷酸或其互补体附接至所述亲和-寡核苷酸缀合物中的寡核苷酸。
在一个方面,提供了一种组合物,其包含多个容器,每个容器均包含来自包含多个细胞的样品的单个裂解细胞和与所述单个裂解细胞的靶抗原结合的亲和-寡核苷酸缀合物;其中所述亲和-寡核苷酸缀合物中的寡核苷酸包含容器条码序列,并且其中来自所述单个裂解细胞的细胞多核苷酸包含相同的容器条码序列。
在一个方面,本文提供了一种组合物,其包含多个容器,其中所述多个容器中的容器包含来自包含多个细胞的样品的单细胞,以及含有容器条码序列的容器条码化多核苷酸,其中所述容器进一步包含与所述单细胞的靶抗原结合的亲和-寡核苷酸缀合物,或所述亲和-寡核苷酸缀合物中的寡核苷酸部分。
在一些实施方案中,在所述多个容器中的两个或更多个容器中发生反应。在一些实施方案中,所述容器包括所述多个容器中的每个容器。在一些实施方案中,所述多个容器包括两种或更多种多个容器。在一些实施方案中,每个容器中的细胞来自相同的样品。在一些实施方案中,所述两种或更多种多个容器中的第一多个容器中的容器中的细胞与所述两种或更多种多个容器中的第二多个容器中的容器中的细胞来自相同的样品。在一些实施方案中,所述容器条码化多核苷酸或其互补体附接至所述亲和-寡核苷酸缀合物中的寡核苷酸。在一些实施方案中,所述单细胞被裂解。
在一个方面,本文提供了一种组合物,其包含多个容器,其中所述多个容器中的容器包含来自包含多个细胞的样品的单个裂解细胞,以及含有与所述单个裂解细胞的靶抗原结合的亲和部分的亲和-寡核苷酸缀合物或所述亲和-寡核苷酸缀合物中的寡核苷酸部分;其中所述亲和-寡核苷酸缀合物中的寡核苷酸部分包含容器条码序列,并且其中来自所述单个裂解细胞的细胞多核苷酸包含相同的容器条码序列。
在一个方面,提供了一种试剂盒,其包含:第一器皿,其包含含有第一抗原标识(AID)序列的第一寡核苷酸,其中所述第一AID序列是已知序列;第二器皿,其包含含有第二抗原标识(AID)序列的第二寡核苷酸,其中所述第二AID序列是已知序列并且不同于所述第一AID序列;一个或多个第三器皿,其包含能够使所述第一寡核苷酸与第一亲和分子缀合的试剂和能够使所述第二寡核苷酸与第二亲和分子缀合的试剂;一套说明书,其描述了如何使所述第一寡核苷酸与所述第一亲和分子缀合以及如何使所述第二寡核苷酸与所述第二亲和分子缀合。
在一个方面,提供了一种试剂盒,其包含:第一器皿,其包含含有抗原标识(AID)序列的寡核苷酸,其中所述AID序列是已知序列;第二器皿,其包含能够使所述寡核苷酸与亲和分子缀合的试剂;第三器皿,其包含多个容器条码化多核苷酸;以及一套说明书,其描述了当与所述亲和分子缀合时如何将所述多个容器条码化多核苷酸中的容器条码化多核苷酸附接至所述寡核苷酸。
本文公开的方法和组合物可用于肿瘤分析。例如,所述方法可包括将细胞表型与患者样品中的免疫组库(repertoire)联系起来以鉴别肿瘤反应性TCR。本文公开的方法和组合物可用于过继性细胞疗法。例如,所述方法可包括在不进行分选的情况下对T细胞进行遗传分析。例如,所述方法可包括在产品制造和处理过程中将T细胞克隆信息(利用TCR)与基因表达谱相结合。在一些实施方案中,本文公开的方法可用于在过继性细胞疗法之前、过程中或之后追踪、表征、监测和/或评估从患者获得的过继转移的细胞。本文公开的方法和组合物可用于鉴别针对已知靶标的TCR。例如,所述方法可包括鉴别可高度响应于抗原但增殖差的高亲和力克隆。本文公开的方法和组合物可用于细胞样品多路化。例如,含有与一个或多个亲和-寡核苷酸缀合物接触的合并的细胞样品的乳液可用于在处理多个样品的同时鉴别原始细胞样品。
援引并入
本说明书中提到的所有出版物、专利和专利申请均为了所有目的通过引用以其全文并入本文,其程度犹如特别地且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。
附图说明
本文所述的新颖特征在随附权利要求中具体阐述。通过参考以下对应用本文所述特征的原理的说明性实例加以阐述的详细描述以及附图,将会获得对本文所述特征的特点和优点的更好理解,在这些附图中:
图1描绘了本文所述方法的容器的示例性示意图。
图2描绘了与抗体缀合的寡核苷酸标签的示例性设计。每个有色模块均代表完整寡核苷酸序列的一部分。融合序列用于乳液反应内小液滴特异性DNA条码的酶促附接。仅示出了一种可能的序列排列,但其他排列也与所描述的方法兼容。
图3A描绘了免疫受体序列与附加的mRNA和蛋白质靶标的示例性共同捕获。通过在乳液测序之前将细胞与DNA标记的染色抗体一起预温育而对表面蛋白质靶标进行定量。
图3B描绘了针对由健康人T细胞生成的3,682个小液滴条码TCRVαVβ对的示例性CD4和CD8mRNA和蛋白质测量结果。
图3C描绘了mRNA与蛋白质测量结果之间的示例性一致性(每个点为与TCR VαVβ对有关的小液滴条码)。
图3D描绘了对来自乳液中的未分选T细胞的CD4和CD8同时进行mRNA和蛋白质检测的示例性表格。从30,000个输入T细胞中回收(recover)了3,682个TCR对。通过mRNA相比蛋白质(基于分子计数,少数服从多数原则)被判定为CD4+或CD8+的TCR对的频率显示在矩阵中。
图3E描绘了使用靶向CD4的亲和-寡核苷酸缀合物和靶向CD8的亲和-寡核苷酸缀合物得到的45,870个单细胞TCR对的示例性结果。
图4描绘了使用靶向CD4的亲和-寡核苷酸缀合物和靶向CD8的亲和-寡核苷酸缀合物的示例性方法的示意图。
图5例示了来自乳液中单个免疫细胞条码化的方法的结果。
图5A是将两种含有细胞和裂解/反应(LR)混合物的水性流传递到油中,从而以每小时超过800万个小液滴产生单分散乳液的示例性描述。
图5B是示例性描述,显示容器内的细胞在单个反应中裂解并经历分子特异性条码化和小液滴特异性条码化。
图5C是示例性描述,显示靶mRNA被逆转录并模板转换标记有通用衔接子序列。随后,对在开始时稀释至每个小液滴约1个分子的小液滴条码模板进行PCR扩增。通过互补重叠延伸将扩增的条码附加至模板转换的cDNA。在另外的文库处理步骤和高通量测序之前,从乳液中回收产物并使用RT引物上的生物素进行纯化。
图5D是示例性描述,显示双条码化允许将测序读取簇集到其分子和起源小液滴中,从而在尽可能减少测序错误和扩增偏差的同时重建天然受体链配对。
图6例示了来自从分离的健康B细胞回收BCR的方法的结果。
图6A是小液滴的示例性描述,其中3百万个B细胞以0.2个细胞/小液滴传递到乳液中,导致约90%的占用细胞含有单细胞。
图6B是VHVL配对精确度的示例性描述。在乳液条码化和测序后,针对来自单细胞小液滴的数据对数据进行富集,并且使用扩增克隆间的配对一致性估计VHVL配对精确度。
图6C是小液滴条码百分比与Ig同种型的示例性图示。显示了259,368个过滤的VHVL对的重链同种型(每个小液滴内最丰富的同种型)和轻链基因座使用。
图6D是六个独立乳液级分中的每一个中100个最高频重链克隆的等级丰度的示例性图示。标出了0.05%的总频率。
图6E是如通过每个小液滴条码内捕获的mRNA的数目所估计的细胞内VH与VL表达的示例性图示。每种同种型显示5,000个点。
图6F是针对BCR对的VH与VL突变相关性和每种同种型内的密度分布的示例性图示。
图7例示了来自HIV广谱中和抗体(bNAb)发现方法的结果。
图7A是将来自HIV elite控制器的B细胞的38,620个回收的VHVL对输入到乳液中的重链同种型分布示例性图示。少量比例的IgG链与先前已知的bNAb(“PGT样”)良好对齐。
图7B是已知bNAb(黑色)加新回收的bNAb(红色,用小液滴条码标记)的完整VDJ氨基酸序列的系统树(phylogenetic tree)的示例性描述,其中重链(左)和轻链(右)单独绘制。潜在错配的抗体PGT122和PGT123呈蓝色。
图7C是与PGT121的对照原种相比,8个新发现的PGT样变体针对十种HIV株的中和活性(IC50,μg/mL)的示例性描述。
图8例示了对来自卵巢肿瘤的TIL进行表征的方法的结果。
图8A是小液滴的示例性描述,其中将来自卵巢肿瘤的400,000个未分选的解离细胞输入到乳液中,并且通过乳液条码化同时回收BCR对和TCR对。
图8B是小液滴条码与受体链组合的示例性图示,显示在过滤后于小液滴条码内观察到的所有VH/VL和Vα/Vβ组合的数目。
图8C是所回收的BCR对的小液滴条码百分比与重链同种型分布的示例性图示。
图8D是BCR对的VH与VL突变相关性和每种同种型内密度分布的示例性图示。
图8E描绘了针对TCR对和BCR对整体(上图)和针对不同同种型(下图)的捕获mRNA的数目的示例性图示。
图8F描绘了克隆分析的示例性图示,显示了六个独立的乳液级分中的每一个中30个最高频BCR重链克隆(上图)和30个最高频TCRβ链克隆的等级丰度。显示了1%和10%的总频率水平。
图9例示了使用抗体-寡核苷酸缀合物进行免疫分型的方法。
图9A描绘了显示2个容器的示例性示意图,每个容器均含有与抗体-寡核苷酸缀合物结合的单细胞。(DB1-小液滴条码1;DB2-小液滴条码2;MB1-分子条码1;MB2-分子条码2;AID-抗原ID条码;AMB1-抗体分子条码1;AMB2-抗体分子条码2)。
图9B描绘了显示2个容器的示例性示意图,每个容器均含有来自图9A容器的裂解细胞的RNA分子。将RNA分子逆转录,并将非模板核苷酸添加到由逆转录产生的cDNA分子的末端。使分子条码与添加到由逆转录产生的cDNA分子末端的非模板核苷酸杂交。
图9C描绘了显示2个容器的示例性示意图,每个容器均含有模板条码化多核苷酸,将该模板条码化多核苷酸被扩增并通过杂交附接至来自图9B的容器的cDNA,并且cDNA被延伸(上图)。然后延伸的cDNA被扩增(下图)。
图9D描绘了示例性示意图,显示相同分子条码(MB)附接至相同的同一RNA序列的RNA-MB-DB种类可能是PCR复制的结果。两个不同MB附接至相同的同一RNA序列的RNA-MB-DB种类(RNA1-MB1-DB和RNA1-MB2-DB)是来自起源而非PCR复制的两个独立RNA分子。
图9E描绘了示例性示意图,显示相同抗体分子条码(AMB)附接至具有相同小液滴条码(DB)和抗原ID条码(AID)的序列的DB-AMB-AID种类可能是PCR复制的结果。两个不同AMB附接至具有相同小液滴条码(DB)和抗原ID条码(AID)的序列的DB1-AMB1-AID1和DB1-AMB2-AID1种类是来自两个独立抗体寡核苷酸缀合物分子的两个独立寡核苷酸分子,所述两个独立抗体寡核苷酸缀合物分子各自具有特异性结合附接至容器中的相同单细胞的相同靶抗原的抗体,而并非来自PCR复制。两个不同AID附接至具有相同小液滴条码(DB)和相同或不同抗体分子条码(AMB)的序列的DB1-AMBn-AID1和DB1-AMBn-AID2种类是来自附接至容器中的相同单细胞的两个独立抗体寡核苷酸缀合物分子的两个独立寡核苷酸分子,其中该抗体寡核苷酸缀合物分子中的一个具有特异性结合第一靶抗原的抗体,而另一个抗体寡核苷酸缀合物分子具有特异性结合第二靶抗原的抗体。
图10A描绘了本文所述方法的示例性亲和-寡核苷酸缀合物的示意图。
图10B描绘了本文所述方法的示例性亲和-寡核苷酸缀合物的示意图。
图11A描绘了本文所述方法的含有与TCR结合的亲和部分的两种示例性亲和-寡核苷酸缀合物的结合信号的示例性图。
图12A描绘了与本文所述方法的示例性亲和-寡核苷酸缀合物结合的T细胞的示例性示意图。
图12B描绘了与本文所述方法的示例性亲和-寡核苷酸缀合物结合的小液滴中的T细胞的示例性示意图。小液滴中的核酸用小液滴标识序列标记并且并入下一代测序文库中。
图13描绘了与示例性亲和-寡核苷酸缀合物四聚体缀合的寡核苷酸标签的示例性示意图。四聚体ID是短恒定DNA序列,其与四聚体批次对应且允许在单一实验中多路检测不同的靶标,如肽-MHC靶标。分子条码是允许对结合的四聚体的定量进行分子计数的简并序列。
图14描绘了由DNA标记的MHC四聚体试剂生成的示例性亲和-寡核苷酸缀合物的示意图。在一个实施方案中,合成Cy5连接的DNA寡核苷酸并使其与链霉亲和素或中性抗生物素蛋白(neutravidin)缀合。在一个实施方案中,将非荧光DNA寡核苷酸与APC-链霉亲和素缀合。在一个实施方案中,将非荧光DNA寡核苷酸和链霉亲和素或中性抗生物素蛋白的混合物与激活的APC缀合。
图15描绘了利用点击化学将寡核苷酸与亲和-寡核苷酸缀合物的亲和部分缀合的示例性方法。
图16描绘了用于制备和表征示例性亲和-寡核苷酸的示例性工作流程的示意图。
图17描绘了使用靶向CD3、CD19、CD4、CD8、HLA-DR和CTLA-4的6种不同的亲和-寡核苷酸缀合物进行的本文所述示例性方法的结果。每个点为小液滴条码/单细胞。根据回收的受体对的类型(TCR=T细胞;Ig=B细胞)揭示细胞身份。
具体实施方式
参考用于说明的实例应用,多个方面描述如下。应当理解,许多具体细节、关系和方法的阐述是为了提供对本文所述的特征的全面了解。然而,相关领域普通技术人员将容易认识到,本文所述的特征可以在不存在一个或多个具体细节或采用其他方法的情况下实践。本文所述的特征不受限于所阐述的行为或事件的排序,因为一些行为可能以不同顺序发生和/或与其他行为或事件同时发生。此外,实施依照本文所述的特征的方法并非需要全部所阐述的行为或事件。
本文使用的术语仅为了描述具体情况,而并非意在限制。如本文所用的,除非上下文另有明确说明,否则单数形式“一个”、“一种”和“该”意在还包括复数形式。此外,在术语“包括”、“具有”或其变化形式用于具体实施方式和/或权利要求时,这样的术语意为包含性的,类似于术语“包含”。
术语“约”或“大约”可意指如本领域普通技术人员所确定的,位于特定值的可接受的误差范围内,其将部分取决于该值如何测量或确定,即测量系统的局限性。例如,“约”可意指按照本领域中的实践,在1个或超过1个标准差内。或者,“约”可意指给定值的多达20%、多达10%、多达5%或多达1%的范围。或者,特别是对于生物系统或过程,该术语可意指在数值的数量级内,在5倍以内,更优选在2倍以内。在本申请和权利要求书中描述特定值的情况下,除非另有说明,应当假定术语“约”意指对于该特定值在可接受的误差范围内。
本发明的一个目的是提供利用亲和-寡核苷酸缀合物(例如,抗体-寡核苷酸缀合物)对单细胞(例如,免疫细胞)进行表型分型(例如,在乳液中)的方法和组合物。
定义
因此,本文中的术语“抗体”以最广泛的含义使用,并且包括多克隆抗体和单克隆抗体,包括完整抗体及其功能性(抗原结合)抗体片段,该功能性(抗原结合)抗体片段包括片段抗原结合(Fab)片段、F(ab')2片段、Fab'片段、Fv片段、重组IgG(rIgG)片段、单链抗体片段(包括单链可变片段(scFv))和单结构域抗体(例如,sdAb、sdFv、纳米抗体)片段。该术语包含免疫球蛋白的基因工程化形式和/或以其他方式修饰的形式,诸如胞内抗体、肽抗体、嵌合抗体、完全人类抗体、人源化抗体和异源偶联抗体、多特异性抗体(例如,双特异性抗体)、双抗体、三抗体和四抗体、串联双-scFv、串联三-scFv。除非另有说明,术语“抗体”应理解为包括其功能性抗体片段。该术语还包含完整抗体或全长抗体,包括任何类别或亚类的抗体,包括IgG及其亚类(IgM、IgE、IgA和IgD)。
与“高变区”或“HVR”同义的术语“互补决定区”和“CDR”在本领域中是已知的,用于指代抗体可变区内氨基酸赋予抗原特异性和/或结合亲和力的非连续序列。通常,每个重链可变区中有三个CDR(CDR-H1、CDR-H2、CDR-H3),并且每个轻链可变区中有三个CDR(CDR-L1、CDR-L2、CDR-L3)。“构架区”和“FR”在本领域中是已知的,用于指代重链和轻链可变区的非CDR部分。通常,每个全长重链可变区中有四个FR(FR-H1、FR-H2、FR-H3和FR-H4),并且每个全长轻链可变区有四个FR(FR-L1、FR-L2、FR-L3和FR-L4)。
给定CDR或FR的精确氨基酸序列边界可使用许多众所周知的方案中的任一种容易地确定,所述方案包括Kabat等人(1991),“Sequences of Proteins of ImmunologicalInterest,”第5版.Public Health Service,National Institutes of Health,Bethesda,MD(“Kabat”编号方案)、Al-Lazikani等人,(1997)JMB 273,927-948(“Chothia”编号方案)、MacCallum等人,J.Mol.Biol.262:732-745(1996),“Antibody-antigen interactions:Contact analysis and binding site topography,”J.Mol.Biol.262,732-745.”(“Contact”编号方案)、Lefranc MP等人,“IMGT unique numbering for immunoglobulinand T cell receptor variable domains and Ig superfamily V-like domains,”DevComp Immunol,2003年1月;27(1):55-77(“IMGT”编号方案)和Honegger A and PlückthunA,“Yet another numbering scheme for immunoglobulin variable domains:anautomatic modeling and analysis tool,”J Mol Biol,2001年6月,8;309(3):657-70,(“Aho”编号方案)所述的编号方案。
给定CDR或FR的边界可根据用于鉴别的方案而变化。例如,Kabat方案是基于结构比对,而Chothia方案是基于结构信息。Kabat方案和Chothia方案二者的编号均基于最常见的抗体区序列长度,其中在一些抗体中出现缺失和插入,所述插入伴以(accommodated by)插入字母(例如,“30a”)。这两种方案在不同位置处放置某些插入和缺失(“indel”),从而导致差异的编号。Contact方案基于对复合晶体结构的分析,并且在许多方面与Chothia编号方案相似。
以下表A列出了分别通过Kabat、Chothia和Contact方案鉴别的CDR-L1、CDR-L2、CDR-L3和CDR-H1、CDR-H2、CDR-H3的示例性位置边界。对于CDR-H1,使用Kaba编号方案和Chothia编号方案二者来列出残基编号。FR位于CDR之间,例如FR-L1位于CDR-L1与CDR-L2之间,等等。值得注意的是,由于所示的Kabat编号方案在H35A和H35B处放置了插入,因此Chothia CDR-H1环的末端在使用所示的Kabat编号惯例进行编号时根据环的长度而在H32与H34之间变化。
表A
因此,除非另有规定,否则给定抗体或其区域(如其可变区)的“CDR”或“互补决定区”或单个指定的CDR(例如,“CDR-H1、CDR-H2)应理解为包括如由任何前述方案所定义的互补决定区(或特定互补决定区)。例如,在阐明特定CDR(例如,CDR-H3)含有给定VH或VL氨基酸序列中相应CDR的氨基酸序列的情况下,应当理解,此类CDR具有如由任何前述方案所定义的可变区内的相应CDR(例如,CDR-H3)的序列。在一些实施方案中,指定了特定的CDR序列。
同样地,除非另有规定,否则给定抗体或其区域(如其可变区)的FR或单个指定FR(例如,FR-H1、FR-H2)应理解为包括如由任何已知方案所定义的构架区(或特定构架区)。在一些情况下,指定了用于鉴别特定CDR、FR或FR或CDR(如由Kabat、Chothia或Contact方法所定义的CDR)的方案。在其他情况下,给出了CDR或FR的具体氨基酸序列。
术语“可变区”或“可变域”是指涉及抗体与抗原结合的抗体重链或轻链的结构域。天然抗体的重链和轻链(分别为VH和VL)的可变域通常具有相似的结构,其中每个结构域包含四个保守的构架区(FR)和三个CDR。(参见例如,Kindt等人.Kuby Immunology,第6版,W.H.Freeman and Co.,第91页(2007))。单个VH或VL域可足以赋予抗原结合特异性。此外,结合特定抗原的抗体可使用来自结合该抗原的抗体的VH或VL域分别筛选互补的VL或VH域的文库来进行分离,参见例如,Portolano等人,J.Immunol.150:880-887(1993);Clarkson等人,Nature 352:624-628(1991)。
所提供的抗体包括抗体片段。“抗体片段”是指除了完整抗体以外的包含完整抗体的一部分的分子,该部分结合该完整抗体所结合的抗原。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab’-SH、F(ab')2;双抗体;线性抗体;单链抗体分子(例如,scFv);以及由抗体片段形成的多特异性抗体。在特定的实施方案中,抗体是包含可变重链区和/或可变轻链区的单链抗体片段,如scFv。
除非另有说明,术语“TCR”应理解为包括完整TCR以及其抗原结合部分或抗原结合片段(也被称为MHC-肽结合片段)。在一些实施方案中,TCR为完整或全长TCR。在一些实施方案中,TCR为小于全长TCR但与结合至MHC分子(即,在MHC分子的语境下)的特定抗原肽(即,MHC-肽复合体)结合的抗原结合部分。在一些情况下,TCR的抗原结合部分或片段可以仅含有全长或完整TCR的结构域中的一部分,但仍能够结合该完整TCR结合的表位(例如,MHC-肽复合体)。在一些情况下,TCR的抗原结合部分或片段含有TCR的可变域,诸如TCR的可变α链和可变β链,该可变区足以形成用于与特定MHC-肽复合体结合的结合位点(诸如通常在每条链含有三个互补决定区的情况下)。包括具有结合域的多肽或蛋白质,该结合域为抗原结合域或与抗原结合域同源。这些术语还涉及互补决定区(CDR)移植抗体和TCR以及其他人源化抗体和TCR(包括CDR修饰和构架区修饰)。应当注意,虽然可能只提及了免疫球蛋白链(例如,重链和轻链),但是本公开发明可应用于多种其他不同类型的成对序列,例如T细胞受体链对(TCRα和TCRβ链以及TCRγ和TCRδ链),且不限于免疫球蛋白。
T细胞识别与多种癌症或传染性生物体相关的抗原的能力由其TCR赋予,TCR由alpha(α)链和beta(β)链或由gamma(γ)和delta(δ)链构成。构成这些链的蛋白质由DNA编码,其采用独特的机理生成了TCR的巨大多样性。这种多亚单元免疫识别受体与CD3复合体相关联,并与抗原呈递细胞(APC)表面上的MHC I类和II类蛋白质所呈递的肽相结合。TCR与APC上的抗原肽的结合是T细胞活化的核心事件,其在T细胞与APC之间的接触点上的免疫突触处发生。
每个TCR均包含可变互补决定区(CDR)以及构架区(FR)。α和β链可变域的第三互补决定区(CDR3)环的氨基酸序列很大程度上分别决定了由β链基因座中可变性(Vβ)、多样性(Dβ)和连接(Jβ)基因区段之间,以及α链基因座中类似的Vα和Jα基因区段之间的重组引起的αβT细胞的序列多样性。多种这类基因区段在TCRα和β链基因座中的存在允许大量不同的CDR3序列得到编码。在TCR基因重排过程期间,在Vβ-Dβ、Dβ-Jβ和Vα-Jα连接处的核苷酸的独立添加和缺失进一步增加了CDR3序列多样性。在此方面,免疫活性反映在TCR的多样性中。
在一些方面,由B细胞表达的免疫球蛋白(Ig)是由四条多肽链——即两条重链(IgH)和两条轻链(IgL)组成的蛋白质,从而形成H2L2结构。每一对IgH和IgL链含有高变域和恒定域,该高变域由VL和VH区组成。Ig的IgH链有多个类型,μ、δ、γ、α和β。个体内的Ig的多样性主要由高变域决定。与TCR相似,IgH链的V结构域通过VH、DH和JH基因区段的组合连接而创建。在Ig基因重排过程期间,在VH-DH、DH-JH和VH-JH连接处的核苷酸的独立添加或缺失进一步增加了高变域序列多样性。在此,免疫活性反映在Ig的多样性中。
术语“可变区”或“可变域”是指参与抗体与抗原结合的抗体重链或轻链的结构域。天然抗体的重链和轻链的可变域(分别为VH和VL)通常具有相似的结构,其中每个结构域包含四个保守的构架区(FR)和三个CDR。(参见例如,Kindt等人.Kuby Immunology,第6版,W.H.Freeman and Co.,第91页(2007))。单个VH或VL域可足以赋予抗原结合特异性。此外,结合特定抗原的抗体可使用来自结合该抗原的抗体的VH或VL域分别筛选互补VL或VH域的文库来进行分离,参见例如,Portolano等人,J.Immunol.150:880-887(1993);Clarkson等人,Nature 352:624-628(1991)。
“亲和部分”是指与靶抗原相互作用的亲和-寡核苷酸缀合物的部分。示例性亲和部分包括抗体、肽、蛋白质、适体、小分子、药物、细胞及其他。
“高变区”是指抗体或TCR中的负责抗原结合的氨基酸残基。高变区包含来自互补决定区或CDR的氨基酸残基。构架或FR残基是除了如本文所定义的高变区残基之外的那些可变域残基。
所提供的抗体包括抗体片段。“抗体片段”是指除了完整抗体以外的包含完整抗体的一部分的分子,该部分结合该完整抗体所结合的抗原。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab’-SH、F(ab')2;双抗体;线性抗体;单链抗体分子(例如,scFv);以及由抗体片段形成的多特异性抗体。在特定的实施方案中,抗体是包含可变重链区和/或可变轻链区的单链抗体片段,如scFv。
单结构域抗体是包含抗体的全部或部分重链可变域或全部或部分轻链可变域的抗体片段。在某些实施方案中,单结构域抗体为人类单结构域抗体。
抗体片段可以通过各种技术制备,包括但不限于完整抗体的蛋白质水解消化以及通过重组宿主细胞的生产。在一些实施方案中,抗体是重组产生的片段,诸如包含非天然存在的排列的片段,诸如具有两个或更多个通过合成连接体(例如,肽连接体)连接的抗体区或链和/或可能无法通过天然存在的完整抗体的酶消化而产生的片段。在一些方面,抗体片段为scFv。
还提供了TCR片段,包括抗原结合片段。在一些实施方案中,TCR为其抗原结合部分,诸如可被称为完全可溶性TCR的不含其跨膜区和/或胞质区的全长TCR的变体。在一些实施方案中,TCR为二聚TCR(dTCR)。在一些实施方案中,TCR为单链TCR(scTCR),诸如具有如PCT专利公开号WO 03/020763、WO 04/033685或WO2011/044186中所描述的结构的scTCR。在某些实施方案中,TCR为包含与β链可变区连接的α链可变区的单链TCR片段,如scTv。在一些实施方案中,scTv也被称为scFv。
在一些方面,单链Fv或scFv是指包含抗体的可变重链(VH)域和可变轻链(VL)域或TCR的可变α或γ链(Vα或Vγ)域和可变β或δ链(Vβ或Vδ)域的抗体片段或TCR片段,其中这些结构域存在于单条多肽链中。通常,Fv多肽进一步在VH和VL结构域或Vα和Vβ结构域或Vγ和Vδ结构域之间包含多肽连接体,其使sFv能够形成用于抗原结合的所需结构。
在一些方面,双抗体是指具有两个抗原结合位点的小抗体和/或TCR片段,该片段包含同一多肽链中的与VL连接的VH(VH-VL),或同一多肽链中的与Vβ连接的Vα(Vα-Vβ),或同一多肽链中的与Vδ连接的Vγ(Vγ-Vδ)。通过使用因太短而无法允许在同一链上的两个结构域之间配对的连接体,该结构域被迫与另一条链的互补结构域配对,并形成了两个抗原结合位点。示例性的双抗体更充分地描述于例如EP404097和WO93111161中。
在一些方面,双特异性抗体或双特异性TCR是指对两种不同类型的抗原显示出特异性的抗体或TCR。具体地,如本文使用的该术语包括但不限于,对靶抗原和帮助向特定组织递送的另一个靶标显示出结合特异性的抗体和TCR。类似地,多特异性抗体和TCR具有两种或更多种结合特异性。
在一些方面,线性抗体或线性TCR是指形成一对抗原结合区的一对串联Fd区段(例如,VH-CH1-VH-CH1或Vα-Cα1-Vα-Cα1)。线性抗体和TCR可为双特异性或单特异性的,例如,如Zapata等人,ProteinEng.8(10):1057-1062(1995)所述。
在一些方面,抗原结合域是指抗体或TCR的一个或多个片段,其保留了与抗原特异性结合的能力。这类术语内包含的抗体片段的非限制性实例包括但不限于:(i)Fab片段,即由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,即含有在铰链区处由二硫桥连接的两个Fab片段的二价片段;(iii)由VH和CH1结构域组成的Fd片段;(iv)含有抗体的单臂的VL和VH结构域的Fv片段,包括scFv,(v)dAb片段(Ward等人,(1989)Nature 341:544 546),其含有VH结构域;以及(vi)分离的CDR。此定义中还包括包含单个重链和单个轻链的抗体或具有单个α链或单个β链的TCR。
“F(ab’)2”和“Fab”部分可通过用蛋白酶如胃蛋白酶和木瓜蛋白酶处理Ig而产生,并包括通过在两条重链各自的铰链区之间存在的二硫键附近消化免疫球蛋白生成的抗体片段。例如,木瓜蛋白酶在两条重链各自的铰链区之间存在的二硫键的上游切割IgG,以生成两个同源抗体片段,其中由VL和CL组成的轻链和由VH和CHγ1(重链的恒定区中的γ1区)组成的重链片段通过二硫键在它们的C末端区处相连接。这两个同源抗体片段各自称为Fab’。胃蛋白酶还在两条重链各自的铰链区之间存在的二硫键的下游切割IgG,以生成比该片段略大的抗体片段,其中两个上述Fab’在铰链区处相连接。此抗体片段被称为F(ab’)2。Fab片段还含有轻链的恒定域和重链的第一恒定域(CH1)。Fab’片段与Fab片段的不同在于在重链CH1结构域的羧基末端添加少量残基,包括来自抗体铰链区的一个或多个半胱氨酸。Fab’-SH在此是指其中恒定域的半胱氨酸残基带有游离巯基的Fab’。F(ab’)2抗体片段最初以其间具有铰链半胱氨酸的Fab’片段对的形式产生。
在一些方面,Fv是指含有完整的抗原识别和抗原结合位点的抗体或TCR片段。此区域由紧密、非共价缔合的一个重链和一个轻链可变域或一条TCRα链和一条TCRβ链或一条TCRγ链和一条TCRδ链的二聚体组成。在此构型中,每个可变域的三个CDR相互作用,在VH-VL二聚体或Vα-Vβ二聚体或Vγ-Vδ二聚体的表面上限定了抗原结合位点。共同地,来自每条VH和VL链或Vα-Vβ链或Vγ-Vδ链的一个或多个CDR的组合给抗体或TCR赋予了抗原结合特异性。例如,应当理解,例如,当转移到受体选择的抗体、TCR或其抗原结合片段的VH和VL链或Vα和Vβ链或Vγ-Vδ链时,CDRH3和CDRL3可能足以给抗体或TCR赋予抗原结合特异性,并且可检测此CDR组合的结合、亲和力等。即使单个可变域(或只含有对抗原具有特异性的三个CDR的一半Fv)也具有识别并结合抗原的能力,但是可能比与第二可变域组合时具有更低的亲和力。此外,虽然Fv片段的两个结构域(VL和VH或Vα和Vβ或Vγ和Vδ)由单独的基因编码,但是它们可使用重组方法通过合成的连接体连接,这使它们能够成为单个蛋白质链,其中VL和VH或Vα和Vβ或Vγ和Vδ链区配对以形成单价分子(称为单链Fv(scFv);Bird等人(1988)Science242:423-426;Huston等人(1988)Proc.Natl.Acad.Sci.USA 85:5879-5883;以及Osbourn等人(1998)Nat.Biotechnol.16:778)。这样的scFv还意在包含在术语抗体的“抗原结合部分”内。特定scFv的任何VH和VL序列都可与Fc区cDNA或基因组序列相连接,以便生成编码完整的Ig(例如IgG)分子或其他同种型的表达载体。VH和VL还可用于使用蛋白质化学或重组DNA技术生成Fab、Fv或Ig的其他片段。
抗原结合多肽还包括重链二聚体,例如,来自驼类和鲨鱼的抗体。驼类和鲨鱼抗体包含V-样和C-样结构域(均不具有轻链)的两条链的同源二聚体对。因为驼类中重链二聚体IgG的VH区不需要与轻链进行疏水相互作用,所以在驼类中通常与轻链接触的重链区域变为亲水氨基酸残基。重链二聚体IgG的VH结构域被称为VHH结构域。鲨鱼Ig-NAR包含一个可变域(称为V-NAR结构域)和五个C-样恒定域(C-NAR结构域)的同源二聚体。在驼类中,抗体组库的多样性由VH或VHH区中的CDR1、2和3决定。驼类VHH区中的CDR3的特征为其相对较长的长度,平均为16个氨基酸(Muyldermans等人,1994,Protein Engineering 7(9):1129)。
“人源化”抗体是其中全部或基本上全部CDR氨基酸残基都来源于非人类CDR且全部或基本上全部FR氨基酸残基都来源于人类FR的抗体。人源化抗体可任选地包括来源于人类抗体的抗体恒定区的至少一部分。非人类抗体的“人源化形式”是指已经历人源化的非人类抗体的变体,该人源化通常用于降低对人的免疫原性,同时保留亲代非人类抗体的特异性和亲和力。在一些实施方案中,将人源化抗体中的一些FR残基用来自非人类抗体(例如,衍生出CDR残基的抗体)的相应残基置换,例如用以恢复或提高抗体特异性或亲和力。
所提供的抗体包括人类抗体。“人类抗体”是具有这样的氨基酸序列的抗体,该氨基酸序列与由人或人细胞或采用人类抗体组库或其他人抗体编码序列(包括人类抗体文库)的非人来源产生的抗体的氨基酸序列相对应。该术语排除包含非人类抗原结合区的非人类抗体的人源化形式,诸如其中全部或基本上全部CDR均是非人类的那些。
人类抗体可通过向转基因动物施用免疫原来制备,该转基因动物已经被修饰以响应于抗原激发而产生完整人类抗体或具有人类可变区的完整抗体。这样的动物通常含有全部或部分人类免疫球蛋白基因座,该人类免疫球蛋白基因座取代内源性免疫球蛋白基因座,或者存在于染色体外或被随机整合到动物染色体中。在这样的转基因动物中,内源性免疫球蛋白基因座通常已经失活。人类抗体还可以来源于含有源自人组库的抗体编码序列的人类抗体文库,包括噬菌体展示文库和无细胞文库。
所提供的抗体包括单克隆抗体,包括单克隆抗体片段。如本文所用的,术语“单克隆抗体”是指从基本均质的抗体群体(即,组成该群体的各个抗体是相同的)获得的抗体或在基本均质的抗体群体内的抗体,而含有天然存在的突变或在生产单克隆抗体制备物期间产生的可能变体(这样的变体通常以少量存在)除外。与通常包括针对不同表位的不同抗体的多克隆抗体制备物相反,单克隆抗体制备物的每个单克隆抗体是针对抗原上的单个表位。该术语不应被解释为抗体生产需要通过任何特定的方法。单克隆抗体可通过多种技术制备,包括但不限于从杂交瘤生成、重组DNA方法、噬菌体展示以及其他抗体展示方法。
术语“多肽”和“蛋白质”可互换使用,用于指代氨基酸残基的聚合物,且不限制最小长度。包括所提供的抗体和抗体链以及其他肽(例如,连接体和结合肽)在内的多肽可包括氨基酸残基,包括天然和/或非天然的氨基酸残基。该术语还包括多肽的表达后修饰,例如糖基化、唾液酸化、乙酰化、磷酸化等。在一些方面,多肽可含有相对于原始或天然序列的修饰,只要该蛋白质仍保持所需的活性即可。这些修饰可以是故意的,诸如通过定点诱变,或可以是偶然的,诸如通过产生该蛋白质的宿主的突变或由于PCR扩增引起的错误。
“种系序列”是指来自种系(单倍体配子和形成它们的那些二倍体细胞)的基因序列。种系DNA含有编码单个Ig重链或轻链、或单个TCRα或TCRβ链或单个TCRγ或TCRδ链的多个基因区段。这些基因区段携带于生殖细胞中,但在排列为功能性基因之前不能转录和翻译。在骨髓中的B细胞和T细胞分化期间,这些基因区段被能够生成超过108种特异性的动态遗传系统随机改组。这些基因区段中的大部分由种系数据库公布并收集。
亲和力是指两种物质可逆结合的平衡常数,且表示为KD。结合蛋白质对配体的亲和力,诸如抗体对表位的亲和力,或者诸如TCR对MCH-肽复合体的亲和力可为,例如,约100纳摩尔(nM)至约0.1nM、约100nM至约1皮摩尔(pM)或约100nM至约1飞摩尔(fM)。术语“亲合力”是指两种或多种物质的复合体在稀释后解离的阻力。
在一些方面,表位是指能够与抗体或TCR的可变区结合袋形成结合相互作用的抗原或其他大分子的一部分。这样的结合相互作用可表现为与一个或多个CDR的一个或多个氨基酸残基的分子间接触。抗原结合可涉及,例如,CDR3、CDR3对,或在一些情况下,涉及多达VH和VL链的所有六个CDR的相互作用。表位可为线性肽序列(即“连续的”)或可由非邻接的氨基酸序列组成(即“构象的”或“不连续的”)。抗体或TCR可识别一个或多个氨基酸序列;因此表位可限定超过一个不同的氨基酸序列。在一些方面,TCR可识别在MHC的环境中的一个或多个氨基酸序列或表位。被抗体和TCR识别的表位可通过本领域技术人员公知的肽作图和序列分析技术来确定。结合相互作用表现为与CDR的一个或多个氨基酸残基的分子间接触。
在一些实施方案中,提及具有特异性结合的抗体或TCR是指这样的情况:除了含有被该抗体或TCR识别的表位的抗原以外,抗体或TCR将不会对其他分子显示出任何显著的结合。该术语还适用于,例如,抗原结合域对多个抗原携带的特定表位具有特异性的情况,在这种情况下,携带该抗原结合域的选定的抗体、TCR或抗原结合片段能够与携带该表位的各种抗原结合。术语“优先结合”或“特异性结合”意指该抗体、TCR或其片段与表位结合的亲和力大于它与无关氨基酸序列结合的亲和力,并且,如果与含有该表位的其他多肽具有交叉反应性,则在其配制用于人类给药应用的水平下无毒。在一个方面,这样的亲和力比该抗体、TCR或其片段对无关氨基酸序列的亲和力大至少1倍、至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍、至少100倍或至少1000倍。术语“结合”是指在生理条件下两个分子之间由于例如共价、静电、疏水和离子和/或氢键相互作用的直接缔合,且包括诸如盐桥和水桥等相互作用,以及结合的任何其他常规方式。
术语“结合”是指在生理条件下两个分子之间由于例如共价、静电、疏水和离子和/或氢键相互作用的直接缔合,且包括诸如盐桥和水桥等相互作用,以及结合的任何其他常规方式。
“药学上可接受的”是指生理上可忍受,且在施用给人类时通常不产生变应性或类似的不良反应,诸如胃不适、头晕等的分子实体和组合物。
防止是指预防、阻止症状的发作,防止与蛋白质水平过量相关或与蛋白质活性相关的疾病或病症的进展。
“抑制”、“治疗”和“处理”可互换使用,并且是指,例如,停滞症状、延长存活、部分或完全减轻症状,以及部分或全部消除与蛋白质水平过量相关或与蛋白质活性相关的病况、疾病或病症。例如,癌症的治疗包括但不限于停滞、部分或完全消除癌生长或肿瘤。治疗或部分消除包括,例如,生长或肿瘤大小和/或体积的成倍减少,诸如约2倍、约3倍、约4倍、约5倍、约10倍、约20倍、约50倍或之间的任何倍数减少。类似地,治疗或部分消除可包括约1%、2%、3%、4%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%的生长或肿瘤大小和/或体积减少百分比,或之间的任何减少百分比。
在一些方面,中和抗体或中和TCR是指抑制病原体如病毒或细菌复制的任何抗体或TCR,而无论实现中和的机理如何。
抗体组库或TCR组库是指抗体、TCR或其片段的集合。例如,抗体组库可用来选择特定的抗体或针对诸如结合能力、结合特异性、胃肠转运能力、稳定性、亲和力等特定性质进行筛选。该术语特别地包括抗体和TCR文库,包括所有形式的组合文库,例如抗体噬菌体展示文库,包括但不限于来自任何来源的单链Fv(scFv)和Fab抗体噬菌体展示文库,包括原始、合成和半合成文库。
“目标核酸分子”、“目标多核苷酸”、“目标多核苷酸分子”是指任何感兴趣的核酸。
聚合酶链反应(PCR)是指通过双链多核苷酸的互补链的同时引物延伸,多核苷酸序列的体外扩增反应。PCR反应产生侧翼为引物结合位点的模板多核苷酸的拷贝。采用两条引物的结果是,对于每次循环,两条链的模板多核苷酸拷贝数的指数增加,因为每次循环两条链都得到复制。多核苷酸双链体具有对应于所用引物的末端的末端。PCR可包括使模板多核苷酸变性、使引物与引物结合位点退火以及在核苷酸的存在下通过DNA或RNA聚合酶延伸引物的一次或多次重复。特定温度、每个步骤的持续时间和步骤之间的变化率取决于本领域普通技术人员公知的许多因素。(McPherson等人,IRL Press,Oxford(1991和1995))。例如,在使用Taq DNA聚合酶的传统PCR中,双链模板多核苷酸可在>90℃的温度下变性,引物可在50-75℃范围内的温度下退火,且引物可在72-78℃范围内的温度下延伸。在一些实施方案中,PCR包括逆转录PCR(RT-PCR)、实时PCR、巢式PCR、定量PCR、多重PCR等。在一些实施方案中,PCR不包括RT-PCR。(美国专利号5,168,038、5,210,015、6,174,670、6,569,627和5,925,517;Mackay等人,Nucleic Acids Research,30:1292-1305(2002))。RT-PCR包括在PCR反应之前的逆转录反应,并扩增所产生的cDNA。巢式PCR包括两级PCR,其中使用第一引物组的第一PCR反应的扩增子成为使用第二引物组的第二PCR反应的样品,至少一个第二引物与第一PCR反应的扩增子的内部位置相结合。多重PCR包括PCR反应,其中多个多核苷酸序列在同一反应混合物中同时经历PCR。PCR反应体积可为0.2pL-1000μL之间的任何体积。定量PCR包括设计用于测量样品中一个或多个序列的绝对或相对量、丰度或浓度的PCR反应。定量测量可包括将一个或多个参考序列或标准与感兴趣的多核苷酸序列进行比较。(Freeman等人,Biotechniques,26:112-126(1999);Becker-Andre等人,Nucleic Acids Research,17:9437-9447(1989);Zimmerman等人,Biotechniques,21:268-279(1996);Diviacco等人,Gene,122:3013-3020(1992);Becker-Andre等人,Nucleic Acids Research,17:9437-9446(1989))。
如本文所用的,“核苷酸”、“核苷”、“核苷酸残基”和“核苷残基”可意指能够作为适于在扩增反应(例如PCR反应)中使用的引物的组分的脱氧核糖核苷酸或核糖核苷酸残基,或其他相似的核苷类似物。除非另有说明,这类核苷及其衍生物可用作本文所述的引物的构件。本申请中的任何内容都不意在排除使用经化学修饰以增强它们的稳定性或在扩增反应中的有效性的核苷衍生物或碱基,条件是该化学修饰不干扰它们被聚合酶适当地识别为脱氧鸟嘌呤、脱氧胞嘧啶、脱氧胸腺嘧啶或脱氧腺嘌呤。在一些实施方案中,核苷酸类似物可以稳定杂合体形成。在一些实施方案中,核苷酸类似物可以去稳定杂合体形成。在一些实施方案中,核苷酸类似物可以增强杂交特异性。在一些实施方案中,核苷酸类似物可以降低杂交特异性。
“核酸”或语法上的等同物是指单个核苷酸或共价连接在一起的至少两个核苷酸。
“多核苷酸”或语法上的等同物是指共价连接在一起的至少两个核苷酸。多核苷酸包括含有两个或更多个核苷酸的分子。多核苷酸包括任何长度的核苷酸的聚合形式,该核苷酸为核糖核苷酸、脱氧核糖核苷酸或肽核酸(PNA),其包含嘌呤和嘧啶碱基,或其他天然的、化学或生物修饰的、非天然的核苷酸碱基或其衍生物。多核苷酸的骨架可包含糖和磷酸基团,或修饰或取代的糖或磷酸基团。多核苷酸可包含修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。核苷酸的序列可被非核苷酸组分中断。多核苷酸可包括其他分子,诸如另一种杂交的多核苷酸。多核苷酸包括脱氧核糖核酸(DNA)、核糖核酸(RNA)或两者的序列。多核苷酸的非限制性实例包括基因、基因片段、外显子、内含子、基因间DNA(包括但不限于异染色质DNA)、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、小干扰RNA(siRNA)、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、序列的分离的DNA、序列的分离的RNA、核酸探针和引物。多核苷酸可从天然来源中分离、重组或人工合成。
多核苷酸可包括非标准核苷酸,诸如核苷酸类似物或修饰的核苷酸。在一些实施方案中,非标准核苷酸可稳定杂合体形成。在一些实施方案中,非标准核苷酸可去稳定杂合体形成。在一些实施方案中,非标准核苷酸可增强杂交特异性。在一些实施方案中,非标准核苷酸可降低杂交特异性。非标准核苷酸修饰的实例包括2’O-Me、2’O-烯丙基、2’O-炔丙基、2’O-烷基、2’氟代、2’阿拉伯糖基、2’木糖基、2’氟阿拉伯糖基、硫代磷酸、二硫代磷酸、磷酰胺化物、2’氨基、5-烷基-取代嘧啶、3’脱氧鸟苷、5-卤代-取代嘧啶、烷基-取代嘌呤、卤代-取代嘌呤、二环核苷酸、2’MOE、PNA分子、LNA-分子、LNA-样分子、二氨基嘌呤、S2T、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨甲基-2-硫代尿苷、5-羧甲基氨甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基queosine、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨甲基尿嘧啶、5-甲氧基氨甲基-2-硫尿嘧啶、β-D-甘露糖基queosine、5’-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-D46-异戊烯基腺嘌呤、尿嘧啶-5-氧基乙酸(v)、wybutoxosine、假尿嘧啶、queosine、2-硫代胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5氧基乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤及其衍生物。
“受试者”、“个体”、“宿主”或“患者”是指活生物体,诸如哺乳动物。受试者和宿主的实例包括但不限于马、牛、骆驼、绵羊、猪、山羊、狗、猫、兔、豚鼠、大鼠、小鼠(例如人源化小鼠)、沙鼠、非人灵长类动物(例如猕猴)、人等,非哺乳动物,包括例如,非哺乳类脊椎动物,诸如禽类(例如,鸡或鸭)、鱼(例如鲨鱼)或蛙(例如爪蟾),和非哺乳类无脊椎动物,以及其转基因物种。在某些方面,受试者是指单个生物体(例如人)。在某些方面,提供了一组个体,其组成具有待研究的共同免疫因子和/或疾病的小队列,和/或不具有该疾病的个体的队列(例如,阴性/正常对照)。从中获得样品的受试者可患有疾病和/或病症(例如,一种或多种变态反应、感染、癌症或自身免疫疾病等),并可与未患有该疾病的阴性对照受试者相比较。
“试剂盒”是指为了实施本文所公开的方法而递送材料或试剂的递送系统。在一些实施方案中,试剂盒包括允许将反应试剂(例如,适当容器中的探针、酶等)和/或支持材料(例如,缓冲液,关于进行分析的书面说明等)储存、运输或从一个位置递送到另一个位置的系统。例如,试剂盒包括一个或多个含有相关反应试剂和/或支持材料的包围体(例如,盒子)。这类内容物可一起或分开递送给预期的接受者。例如,第一容器可含有供在分析中使用的酶,而第二容器含有多个引物。
在一些方面,多肽是指包含至少两个氨基酸的分子。在一些实施方案中,多肽由单个肽组成。在一些实施方案中,多肽包含两个或更多个肽。例如,多肽可包含至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个肽或氨基酸。多肽的实例包括但不限于氨基酸链、蛋白质、肽、激素、多肽糖、脂质、糖脂、磷脂、抗体、酶、激酶、受体、转录因子和配体。
在一些方面,样品是指生物、环境、医学、受试者或患者样品或含有多核苷酸如目标多核苷酸的样品。
亲和-寡核苷酸缀合物
亲和-寡核苷酸缀合物包含亲和分子部分(例如,抗体或MHC-肽复合体)和寡核苷酸部分。亲和-寡核苷酸缀合物中的寡核苷酸的抗原标识序列可用于标识与该亲和-寡核苷酸缀合物特异性相互作用的一个或多个抗原。在一些实施方案中,所述寡核苷酸与该缀合物的亲和部分共价附接。在一些实施方案中,所述寡核苷酸与该缀合物的亲和部分非共价附接。
在一些实施方案中,亲和-寡核苷酸缀合物包含单个亲和部分。在一些实施方案中,亲和-寡核苷酸缀合物是多价亲和-寡核苷酸缀合物。例如,多价亲和-寡核苷酸缀合物可包含与一个或多个寡核苷酸缀合的至少两个亲和分子的抗原结合域。例如,多价亲和-寡核苷酸缀合物可包含与一个或多个寡核苷酸缀合的至少约2、3、4、5、6、7、8、9、10、20、50、100、200、500或1,000个亲和分子的抗原结合域。
在一些实施方案中,亲和-寡核苷酸缀合物包含单个寡核苷酸。在一些实施方案中,亲和-寡核苷酸缀合物包含2个或更多个寡核苷酸。例如,亲和-寡核苷酸缀合物可包含与一个或多个亲和分子(例如,抗体或MHC-肽复合体)缀合的至少约2、3、4、5、6、7、8、9、10、20、50、100、200、500或1,000个寡核苷酸。在一些实施方案中,亲和-寡核苷酸缀合物包含2个或更多个含有相同抗原ID(AID)序列的寡核苷酸。例如,亲和-寡核苷酸缀合物可包含至少约2、3、4、5、6、7、8、9、10、20、50、100、200、500或1,000个含有相同AID序列的寡核苷酸。
亲和-寡核苷酸缀合物的亲和部分
亲和-寡核苷酸缀合物的亲和部分(或结构域)包含亲和-寡核苷酸缀合物的与靶抗原结合的区域、分子、结构域、区段、片段或部分。因此,亲和部分赋予与给定的靶抗原如细胞表面蛋白质的胞外域结合或特异性结合的能力。在一些实施方案中,亲和部分基本不与包含不同的抗原ID序列的另一个亲和-寡核苷酸缀合物的抗原相互作用。在一些实施方案中,亲和部分是可含有核酸的分子,或在基本不消除该亲和部分与靶抗原的结合的情况下可附接寡核苷酸的分子。
亲和-寡核苷酸缀合物的亲和部分可以是核酸分子或可以是蛋白质。亲和部分包括但不限于RNA、DNA、RNA-DNA杂合体、小分子(例如,药物)、适体、多肽、蛋白质、抗体及其片段、TCR及其片段、病毒、病毒颗粒、细胞、其碎片以及它们的组合。(参见,例如,Fredriksson等人,(2002)Nat Biotech 20:473-77;Gullberg等人,(2004)PNAS,101:8420-24)。例如,亲和部分可以是单链RNA、双链RNA、单链DNA、双链DNA、包含一个或多个双链区域和一个或多个单链区域的DNA或RNA、RNA-DNA杂合体、小分子、适体、多肽、蛋白质、抗体、抗体片段、TCR、TCR片段、MHC、MHC-肽复合体、病毒颗粒、细胞或其任何组合。
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分靶向细胞。例如,亲和-寡核苷酸缀合物的亲和部分可靶向T细胞或B细胞。在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分靶向特定的细胞类型或细胞亚群。例如,亲和-寡核苷酸缀合物的亲和部分可靶向CD4+T细胞或CD8+T细胞。例如,亲和-寡核苷酸缀合物的亲和部分可靶向包含特异性识别特定抗原的TCR的T细胞。例如,亲和-寡核苷酸缀合物的亲和部分可靶向包含特异性识别特定MHC-肽复合体的TCR的T细胞。
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分靶向细胞靶标的胞外域。例如,亲和-寡核苷酸缀合物的亲和部分可靶向细胞的受体例如T细胞受体的胞外域。例如,亲和-寡核苷酸缀合物的亲和部分可靶向细胞受体的胞外域的糖基化区域。例如,亲和-寡核苷酸缀合物的亲和部分可靶向细胞受体的胞外域的配体结合区。例如,亲和-寡核苷酸缀合物的亲和部分可靶向细胞受体的胞外域的不结合配体的区域。
蛋白质
在一些实施方案中,亲和部分是多肽、蛋白质或其任何片段。在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是蛋白质。在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是肽。例如,亲和-寡核苷酸缀合物的亲和部分可以是抗体,如抗体的结合域。例如,亲和-寡核苷酸缀合物的亲和部分可以是MHC-肽复合体。例如,亲和部分可以是纯化的多肽、分离的多肽、融合标记的多肽、附接至或跨越细胞或病毒或病毒体的膜的多肽、胞质蛋白质、细胞内蛋白质、细胞外蛋白质、激酶、磷酸酶、芳香化酶、解旋酶、蛋白酶、氧化还原酶、还原酶、转移酶、水解酶、裂合酶、异构酶,糖基化酶、细胞外基质蛋白、连接酶、离子转运蛋白、通道、孔、凋亡蛋白、细胞粘附蛋白、致病蛋白质、异常表达的蛋白质、转录因子、转录调节因子、翻译蛋白质、伴侣蛋白、分泌性蛋白质、配体、激素、细胞因子、趋化因子、核蛋白、受体、跨膜受体、信号转导蛋白、抗体、膜蛋白质、膜内在蛋白质、外周膜蛋白、细胞壁蛋白质、球状蛋白质、纤维状蛋白质、糖蛋白、脂蛋白、染色体蛋白质、其任何片段或它们的任何组合。在一些实施方案中,亲和部分是异源性多肽。在一些实施方案中,亲和部分是利用分子技术如转染在细胞中过表达的蛋白质。在一些实施方案中,亲和部分是重组多肽。例如,亲和部分可包含在细菌(例如,大肠杆菌(E.coli))、酵母、哺乳动物或昆虫细胞中产生的样品(例如,由生物体过表达的蛋白质)。在一些实施方案中,亲和部分是含有突变、插入、缺失或多态性的多肽。在一些实施方案中,亲和部分是抗原,如用于免疫生物体或用于在生物体中产生免疫应答如用于产生抗体的多肽。
抗体
在一些实施方案中,亲和部分是抗体,例如,抗体的结合片段。抗体可与另一个分子的存在于特定空间的极性结构特异性结合。例如,抗体可以是纯化的抗体、分离的抗体、抗体的片段或融合标记的抗体。在一些实施方案中,抗体利用分子技术如转染在细胞中过表达。在一些实施方案中,抗体是重组抗体。抗体可与另一个分子如细胞表面分子的存在于特定空间的极性结构特异性结合。抗体可以是单克隆抗体、多克隆抗体或重组抗体,并且可通过本领域公知的技术如宿主的免疫和血清的收集进行制备(多克隆),或通过制备连续杂交细胞系和收集分泌性蛋白质进行制备(单克隆),或通过克隆和表达核苷酸序列或其诱变处理形式进行制备,所述核苷酸序列或其诱变处理形式编码天然抗体的特异性结合所需的氨基酸序列。此外,只要保持对于特定分子的结合亲和力,在合适的情况下可使用聚集体、聚合物和免疫球蛋白或其片段的缀合物。抗体片段的实例包括Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;F(ab)2片段,包含在铰链区通过二硫键连接的两个Fab片段的二价片段;由VH和CH1结构域组成的Fd片段;由抗体的单臂的VL和VH结构域组成的Fv片段;单结构域抗体(dAb)片段(Ward等人,(1989)Nature 341:544-46),其由VH结构域组成;以及分离的CDR和单链片段(scFv),其中VL和VH区域配对形成单价分子(被称为单链Fv(scFv);参见,例如,Bird等人,(1988)Science 242:423-26;和Huston等人,(1988)PNAS 85:5879-83)。因此,抗体片段包括Fab、F(ab)2、scFv、Fv、dAb等。尽管两个结构域VL和VH通过单独的基因进行编码,但它们可以使用重组方法通过人工肽连接体进行连接,所述人工肽连接体使得它们能够被制成单个蛋白质链。这样的单链抗体包括一个或多个抗原结合部分。可使用本领域技术人员已知的常规技术获得这些抗体片段,并且可以用与完整抗体相同的方式针对可用性对这些片段进行筛选。抗体可以是人类的、人源化的、嵌合的、分离的、狗、猫、驴、羊、任何植物、动物或哺乳动物的抗体。
MHC
在一些情况下,由细胞免疫系统对抗原结构的识别是通过表面表达的主要组织相容性复合体(MHC)介导的。在一些方面,细胞如抗原呈递细胞(APC)将蛋白质如抗原加工成短肽,该短肽可在MHC分子的特异性肽结合折叠中呈递,并且在一些方面可因此被T细胞识别。由T细胞受体(TCR)对表位(肽片段)的特异性识别通常需要同时与MHC分子相互作用。可采用含有结合肽的MHC蛋白质亚单位制备稳定的多聚体复合体。MHC-抗原复合体可与T细胞(通过该T细胞的抗原受体识别该复合体)形成稳定的结构,从而允许与特异性识别该抗原的T细胞结合。亲和-寡核苷酸缀合物的亲和部分可靶向T细胞。亲和-寡核苷酸缀合物的亲和部分可特异性地靶向T细胞。亲和-寡核苷酸缀合物的亲和部分可靶向T细胞受体或TCR样分子,如TCR样CAR。亲和-寡核苷酸缀合物的亲和部分可特异性地靶向T细胞受体。例如,亲和-寡核苷酸缀合物的亲和部分可包含MHC分子。例如,亲和-寡核苷酸缀合物的亲和部分可包含MHC-肽复合体(MHC-p)。亲和-寡核苷酸缀合物的亲和部分可具有式(A-B-P)n,其中A是MHC I类或MHC II类蛋白质的α链,B是II类MHC蛋白质的β链或MHC I类蛋白质的β2微球蛋白,并且P是肽。在一些实施方案中,n为1。在一些实施方案中,n大于或等于2。MHC蛋白质亚单位可以是可溶形式。例如,可溶性MHC蛋白质亚单位可通过缺失跨膜结构域或其部分从天然MHC蛋白质亚单位获得。在一些实施方案中,MHC蛋白质亚单位不包含细胞质结构域。在一些实施方案中,MHC蛋白质亚单位不包含跨膜结构域。
对于具有I类MHC蛋白质的复合体,所述肽(P)的长度可以为约6至12个氨基酸,例如,约8至10个氨基酸。对于具有II类MHC蛋白质的复合体,所述肽的长度可以为约6至20个氨基酸,例如,约10至18个氨基酸。所述肽可具有来源于很多种蛋白质的序列。所述肽可以是T细胞表位。许多抗原的表位序列是本领域已知的。或者,可通过分离与天然MHC蛋白质结合的肽并对该肽进行测序,通过由靶序列合成一系列肽,随后测定T细胞对不同肽的反应性,或通过产生一系列具有不同肽的结合复合体并量化T细胞结合,凭经验确定表位序列。制备片段、鉴别序列和鉴别最小序列描述在美国专利号5,019,384及其中引用的参考文献中。可以以多种方式制备肽。方便地,所述肽可通过采用自动合成仪的常规技术来合成,或可人工合成。或者,可制备DNA序列,所述DNA序列编码特定肽并且可进行克隆和表达以提供所需的肽。在这种情况下,甲硫氨酸可以是第一氨基酸。此外,可通过重组方法产生以与蛋白质的融合物形式(所述蛋白质是特异性结合对的其中之一)的肽,从而允许通过亲和试剂的方式纯化该融合蛋白,然后通常在工程化位点进行蛋白质水解裂解,以产生所需的肽(参见,例如,Driscoll等人.(1993)J.Mol.Bio.232:342-350)。所述肽还可从天然来源分离并通过已知技术进行纯化,该技术包括例如,离子交换材料上的层析、按大小分离、免疫亲和层析和电泳。
在一些实施方案中,单独地产生α亚单位和β亚单位并使它们在体外缔合以形成稳定的异源双链体复合体(参见,例如,Altman等人.(1993)或Garboczi等人.(1992))。在一些实施方案中,α亚单位和β亚单位在单细胞中一起表达。在一些实施方案中,使用具有α亚单位和β亚单位的单个分子。例如,可通过使用短肽连接体例如,15至25个氨基酸的肽或连接体,将这两个亚单位融合在一起而产生单链异二聚体(参见,例如,Bedzyk等人.(1990)J.Biol.Chem.265:18615)。还可通过分离天然异二聚体并采用用于产生可溶性产物的蛋白酶例如木瓜蛋白酶裂解来产生可溶性异二聚体。
可溶性亚单位可以由编码截短的蛋白质的DNA构建体独立地表达。为了表达,可将DNA序列插入合适的表达载体中,其中可采用天然转录起始区或外源性转录起始区,例如,除了与正常存在的染色体中的基因缔合的启动子以外的启动子。该启动子可通过体外重组方法,或作为将序列同源整合至染色体的结果而被引入。对于很多种表达宿主,转录起始区是已知的。表达宿主可包括原核生物或真核生物,特别是大肠杆菌、枯草杆菌、哺乳动物细胞,如CHO细胞、COS细胞、猴肾细胞、淋巴样细胞、人细胞系等。
所述亚单位可在合适的宿主细胞中表达,并且在必要时被溶解。可使这两种亚单位与肽结合并使其在体外折叠以与链内二硫键键合结构域形成稳定的异二聚体复合体。所述肽可包含在起始折叠反应中,或者可在后续步骤中添加至空的异二聚体中。在添加肽之前,MHC结合位点可不含肽。例外将会是以下的情况,其中需要用天然的肽-MHC复合体(如在细胞表面上存在的作为自身免疫攻击的靶标的那些肽-MHC复合体)标记T细胞。MHC异二聚体将与通过两个膜远端结构域(对于I类为α2和α1,或对于II类为α1和β1)形成的沟槽中的肽结合。允许所述亚单位和肽的折叠和缔合的条件是本领域已知的(参见,例如,Altman等人.(1993)和Garboczi等人.(1992))。作为允许条件的一个实例,将大约等摩尔量的溶解的α和β亚单位在尿素溶液中混合。通过稀释或透析至不含尿素的缓冲溶液中开始重折叠。将肽加载至约pH 5至5.5下的空的II类异二聚体中,然后进行中和、浓缩和缓冲液更换。然而,本领域技术人员将容易理解,特定的折叠条件对于本发明的实施并不是关键性的。
在一些实施方案中,单体复合体(α-β-P)可以多聚化。例如,可通过经由α或β亚单位上的特定附接位点使单体与多价实体结合来形成多聚体。在一些实施方案中,通过单体的化学交联形成多聚体。能够交联蛋白质的许多试剂是本领域已知的,该试剂包括但不限于叠氮基苯甲酰肼、N-[4-(对叠氮基水杨基氨基)丁基]-3'-[2'-吡啶基二硫代]丙酰胺)、双琥珀酰亚胺辛二酸酯磺酸盐、二甲基二亚胺代己二酸酯、双琥珀酰亚胺基酒石酸酯、N-γ-马来酰亚胺基丁酰基氧基琥珀酰亚胺酯、N-羟基磺基琥珀酰亚胺基-4-叠氮基苯甲酸酯、N-琥珀酰亚胺基[4-叠氮基苯基]-1,3'-二硫代丙酸酯、N-琥珀酰亚胺基[4-碘乙酰基]氨基苯甲酸酯、戊二醛、甲醛和4-[N-马来酰亚胺基甲基]环己烷-1-甲酸琥珀酰亚胺酯。用于结合多价实体的附接位点可以是天然存在的,或者可通过基因工程引入。该位点可以是特异性结合对成员或者是经修饰以提供特异性结合对成员的位点,其中互补对具有特异性结合位点的多重性。与互补结合成员的结合可以是化学反应、表位-受体结合或半抗原-受体结合(其中半抗原与亚单位链连接)。在优选的实施方案中,所述亚单位中的一个与氨基酸序列融合,从而提供了用于修饰酶的识别位点。识别序列通常将在其中一个亚单位的羧基末端的近端融合,以避免在抗原肽结合位点处的潜在障碍。方便地,表达盒将包括编码该识别位点的序列。
感兴趣的修饰酶包括BirA、各种糖基化酶、法呢基蛋白转移酶、蛋白激酶等。所述亚单位可在任何方便的时间,通常在形成单体之后与该修饰酶反应。通过修饰酶引入的基团,例如,生物素、糖、磷酸酯、法呢基等提供了互补结合对成员,或用于进一步修饰,如化学交联、生物素化等的独特位点(其将提供互补结合对成员)。备选的策略是将未配对的半胱氨酸残基引入亚单位,从而引入用于结合的独特的化学反应性的位点。附接位点也可以是天然存在的或引入的表位,其中所述多价结合配偶体将会是抗体,例如,IgG、IgM等。任何修饰将会在不会干扰结合的位点处,例如,C-末端近端。示例性的多聚体形成是催化蛋白质底物生物素化的酶BirA的识别序列的引入。随后具有生物素化的亚单位的单体与多价结合配偶体结合,所述多价结合配偶体例如,与生物素以极高亲和力结合的链霉亲和素或亲和素。链霉亲和素的化合价为4,从而提供了(α-β-P)4的多聚体。多价结合配偶体可以在溶液中游离,或者可附接至不溶性支持体。合适的不溶性支持体的实例包括珠子例如,磁珠、膜和微量滴定板。这些不溶性支持体通常由玻璃、塑料(例如,聚苯乙烯)、多糖、尼龙或硝酸纤维素制成。当所述结合复合体用于分离T细胞时,附接至不溶性支持体是有用的。
细胞
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是细胞。例如,亲和部分可以是完整细胞、用化合物(例如,药物)处理的细胞、固定的细胞、裂解的细胞或其任何组合。在一些实施方案中,亲和部分是单细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以是T细胞或B细胞。在一些实施方案中,亲和部分是多个细胞。在一些实施方案中,亲和部分是T细胞。在一些实施方案中,亲和部分是B细胞。在一些实施方案中,亲和部分是抗原呈递细胞(APC)。在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是特定的细胞类型或细胞亚群。例如,亲和-寡核苷酸缀合物的亲和部分可以是CD4+T细胞或CD8+T细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以是包含特异性识别特定抗原的TCR的T细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以是包含特异性识别特定MHC-肽复合体的TCR的T细胞。在一些实施方案中,亲和部分是细胞。
小分子
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是小分子,如药物。例如,小分子可以是大环分子、抑制剂、药物或化合物。在一些实施方案中,小分子含有不超过五个氢键供体。在一些实施方案中,小分子含有不超过十个氢键受体。在一些实施方案中,小分子的分子量为500道尔顿或更小。在一些实施方案中,小分子的分子量为约180道尔顿至500道尔顿。在一些实施方案中,小分子具有不超过五的辛醇-水分配系数log P。在一些实施方案中,小分子具有-0.4至5.6的分配系数log P。在一些实施方案中,小分子具有40至130的摩尔折射率。在一些实施方案中,小分子含有约20至约70个原子。在一些实施方案中,小分子具有140埃2或更小的极性表面积。
核酸
在一些实施方案中,亲和部分是聚合物形式的核糖核苷酸和/或脱氧核糖核苷酸(腺嘌呤、鸟嘌呤、胸腺嘧啶或胞嘧啶),如DNA或RNA(例如,mRNA)。DNA包括在线性DNA分子(例如,限制性片段)、病毒、质粒和染色体中发现的双链DNA。在一些实施方案中,多核苷酸亲和部分是单链、双链、小干扰RNA(siRNA)、信使RNA(mRNA)、转移RNA(tRNA)、染色体、基因、非编码基因组序列、基因组DNA(例如,片段化基因组DNA)、纯化的多核苷酸、分离的多核苷酸、杂交的多核苷酸、转录因子结合位点、线粒体DNA、核糖体RNA、真核多核苷酸、原核多核苷酸、合成的多核苷酸、连接的多核苷酸、重组多核苷酸、含有核酸类似物的多核苷酸、甲基化多核苷酸、脱甲基化多核苷酸、其任何片段或其任何组合。在一些实施方案中,亲和部分是包含双链区域和非双链末端(例如,5’或3’突出端区)的多核苷酸。在一些实施方案中,亲和部分是重组多核苷酸。在一些实施方案中,亲和部分是异源性多核苷酸。例如,亲和部分可包含在细菌(例如,大肠杆菌)、酵母、哺乳动物或昆虫细胞中产生的多核苷酸(例如,与生物体异源的多核苷酸)。在一些实施方案中,亲和部分是含有突变、插入、缺失或多态性的多核苷酸。
在一些实施方案中,亲和部分是适体。适体是以高特异性和亲和力与目标分析物如蛋白质结合的分离的核酸分子。适体是保持在某种(某些)构象中的三维结构,该三维结构提供化学接触以特异性结合其给定靶标。尽管适体是基于核酸的分子,但适体与其他核酸分子如基因和mRNA之间存在根本性差异。在后者中,核酸结构通过其线性碱基序列编码信息,并因此该序列对于信息储存的功能而言是重要的。完全相反地,基于靶分子的特异性结合的适体功能不完全依赖于保守的线性碱基序列(非编码序列),而是依赖于特定的二级/三级/四级结构。适体可能具有的任何编码潜力完全是偶然的,并且在适体与其同源靶标的结合中没有发挥任何作用。适体还必须区别于与某些蛋白质结合的天然存在的核酸序列。后一序列是嵌入生物体的基因组内的天然存在的序列,该序列与参与天然存在的核酸的转录、翻译和转运的特化蛋白质亚组(例如,核酸结合蛋白质)结合。另一方面,适体是短的、分离的、非天然存在的核酸分子。虽然可以识别结合核酸结合蛋白质的适体,但是在大多数情况下这样的适体与由天然的核酸结合蛋白质识别的序列没有或具有很小的序列同一性。更重要的是,适体可以结合几乎任何蛋白质(不仅仅核酸结合蛋白质)以及几乎任何感兴趣的靶标,包括小分子、碳水化合物、肽等。对于大多数靶标,甚至蛋白质,不存在与其结合的天然存在的核酸序列。对于那些具有这样的序列的靶标,例如核酸结合蛋白质,这样的序列将不同于适体,这是因为与紧密结合适体相比在自然界中使用的结合亲和力相对较低。适体能够与所选择的靶标特异性结合并且调节靶标活性或结合相互作用,例如,通过结合,适体可阻止其靶标发挥作用的能力。与靶标特异性结合的功能特性是适体的固有性质。典型适体的大小为6-35kDa(2-100个核苷酸),其以微摩尔至次纳摩尔的亲和力与其靶标结合,并且可以辨别密切相关的靶标(例如,适体可选择性地结合来自同一基因家族的相关蛋白质)。适体能够利用常见的分子间相互作用,如氢键结合、静电互补性、疏水性接触和空间排阻,与特定的靶标结合。适体具有许多用作治疗和诊断的理想特征,包括高特异性和亲和力、低免疫原性、生物学功效和优良的药代动力学性质。适体可包含由共价连接的互补多核苷酸的杂交形成的分子茎和环结构(例如,发夹环结构)。所述茎包含杂交的多核苷酸,而所述环是共价连接这两个互补多核苷酸的区域。
在一些实施方案中,亲和部分是多个亲和部分,如亲和部分的混合物或库。在一些实施方案中,亲和部分是多个不同的亲和部分。例如,亲和部分可包含多个至少约2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、200、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000或30,000个亲和部分。
亲和-寡核苷酸缀合物中的寡核苷酸部分
亲和-寡核苷酸缀合物中的寡核苷酸部分是与亲和-寡核苷酸缀合物的亲和部分偶联的核酸。在一些实施方案中,寡核苷酸与亲和部分直接偶联。在一些实施方案中,寡核苷酸与亲和部分间接偶联。在一些实施方案中,寡核苷酸与亲和部分非共价偶联。在一些实施方案中,寡核苷酸与亲和部分共价偶联。在一些实施方案中,寡核苷酸是合成的寡核苷酸。在优选的实施方案中,寡核苷酸基本上不直接与亲和部分的目标分析物相互作用。
与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可包含一个或多个条码序列。例如,与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可包含抗原ID(AID)序列和抗原分子条码(AMB)序列。寡核苷酸可包含抗原ID(AID)序列、融合序列、引物位点、分子条码序列、恒定序列或其任何组合。
寡核苷酸可含有实现与亲和-寡核苷酸缀合物的亲和部分的缀合的化学修饰(例如,胺、硫醇或生物素)。
寡核苷酸可包含多个寡核苷酸。所述多个寡核苷酸可构成多个亲和-寡核苷酸缀合物。例如,寡核苷酸可包含多个至少约2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、200、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000或30,000个寡核苷酸。例如,多个至少约2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、200、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000或30,000个寡核苷酸可构成多个至少约2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100、200、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000或30,000个亲和-寡核苷酸缀合物。
寡核苷酸可包含寡核苷酸条码序列、寡核苷酸融合序列、寡核苷酸引物结合序列、寡核苷酸恒定序列或其任何组合。
寡核苷酸抗原ID(AID)序列
寡核苷酸可包含寡核苷酸抗原条码序列或其互补序列。寡核苷酸抗原条码可允许标识包含该寡核苷酸抗原条码的亲和-寡核苷酸复合体。寡核苷酸抗原条码可允许标识该寡核苷酸抗原条码所附接的亲和部分。寡核苷酸抗原条码可用于标识来自与不同目标分析物结合的多个不同亲和部分的亲和部分。寡核苷酸抗原条码可唯一地条码化地加至亲和-寡核苷酸复合体。寡核苷酸抗原条码可唯一地条码化地加至亲和部分。因此,寡核苷酸抗原条码序列可条码化地加至特定的亲和部分。
寡核苷酸抗原条码可以是独特的条码序列。例如,多个寡核苷酸抗原条码中的任何一个寡核苷酸抗原条码可以是独特的条码序列。理论上可能的不同抗原条码序列的数目可能直接依赖于条码序列的长度。例如,如果可以使用具有随机组装的腺嘌呤、胸苷、鸟苷和胞苷核苷酸的DNA条码,则对于十个核苷酸的长度,可能的条码序列的理论最大数可以是1,048,576,而对于十五个核苷酸的长度,可能的条码序列的理论最大数可以是1,073,741,824。寡核苷酸抗原条码序列可包含至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、45或50个或更多个连续核苷酸的序列。寡核苷酸可包含两个或更多个寡核苷酸抗原条码序列或其互补序列。寡核苷酸抗原条码序列可包含随机组装的核苷酸序列。寡核苷酸抗原条码序列可以是简并序列。寡核苷酸抗原条码序列可以是已知序列。寡核苷酸抗原条码序列可以是预定义序列。在优选的实施方案中,寡核苷酸抗原条码序列是条码化地加至其偶联的亲和部分的已知的独特的序列,使得含有寡核苷酸抗原条码(例如,序列读取)或其互补体的信号可用于标识与不同目标分析物相互作用的多个不同亲和部分中的亲和部分。
例如,与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可包含作为抗原ID(AID)序列的条码。AID序列可被条码化地加至亲和-寡核苷酸缀合物的亲和部分。AID序列可被条码化地加至亲和部分所靶向的抗原。AID序列可用于鉴别亲和-寡核苷酸缀合物的亲和部分和/或亲和部分所靶向的抗原。例如,AID序列可被条码化地加至抗体-寡核苷酸缀合物的抗体。例如,AID序列可被条码化地加至抗体-寡核苷酸缀合物的抗体所靶向的抗原。例如,AID序列可用于对细胞进行免疫表型分型。例如,AID序列可被条码化地加至MHC-肽复合体的肽。
对于亲和-寡核苷酸缀合物的亲和部分靶向的每个抗原,AID序列可以是独特的。对于亲和-寡核苷酸缀合物的亲和部分,AID序列可以是独特的。例如,对于与细胞的不同靶抗原特异性结合的每个抗体,AID序列可以是独特的。在一些实施方案中,AID序列是定义的序列。在一些实施方案中,AID序列是已知序列。可通过例如采用下一代测序对寡核苷酸或寡核苷酸的扩增产物进行测序来确定每个寡核苷酸的AID序列。
寡核苷酸分子条码序列
寡核苷酸可包含寡核苷酸分子条码序列或其互补序列。寡核苷酸条码可允许标识包含该寡核苷酸条码的亲和-寡核苷酸复合体的分子。寡核苷酸分子条码可唯一地条码化地加至亲和-寡核苷酸复合体的分子。寡核苷酸分子条码可唯一地条码化地加至亲和部分的分子。因此,寡核苷酸分子条码序列可条码化地加至亲和部分的特定分子。
寡核苷酸分子条码可以是独特的条码序列。例如,多个寡核苷酸分子条码中的任何一个寡核苷酸分子条码可以是独特的条码序列。理论上可能的不同分子条码序列的数目可能直接依赖于条码序列的长度。例如,如果可以使用具有随机组装的腺嘌呤、胸苷、鸟苷和胞苷核苷酸的DNA条码,则对于十个核苷酸的长度,可能的条码序列的理论最大数可以是1,048,576,而对于十五个核苷酸的长度,可能的条码序列的理论最大数可以是1,073,741,824。寡核苷酸分子条码序列可包含至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、45或50个或更多个连续核苷酸的序列。寡核苷酸可包含两个或更多个寡核苷酸分子条码序列或其互补序列。寡核苷酸分子条码序列可包含随机组装的核苷酸序列。寡核苷酸分子条码序列可以是简并序列。寡核苷酸分子条码序列可以是已知序列。寡核苷酸分子条码序列可以是预定义序列。在优选的实施方案中,寡核苷酸分子条码序列是可用于标识与目标分析物相互作用的多个亲和部分分子中的亲和部分分子的独特序列。
例如,与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可包含条码,该条码是抗原分子条码(AMB)序列。对于亲和-寡核苷酸缀合物中的每个寡核苷酸分子,抗原分子条码(AMB)序列可以是独特的。AMB序列可以实现对与抗原(如容器,例如,乳液小液滴中单细胞的抗原)结合的亲和-寡核苷酸缀合物中的寡核苷酸分子的数目的计数。可通过例如采用下一代测序对寡核苷酸或寡核苷酸的扩增产物进行测序来确定每个寡核苷酸的AMB序列。
寡核苷酸融合序列
与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可包含融合序列。融合序列可允许将小液滴特异性条码序列PCR延伸至亲和-寡核苷酸缀合物例如,细胞表面结合的亲和-寡核苷酸缀合物中的寡核苷酸上。多个寡核苷酸中的每个寡核苷酸的融合序列可以是相同的。融合序列可包含与小液滴条码的序列互补的序列。在一些实施方案中,融合序列位于寡核苷酸的末端。在一些实施方案中,寡核苷酸末端的融合序列不直接与抗体-寡核苷酸缀合物的亲和部分缀合。在一些实施方案中,寡核苷酸末端的融合序列包含游离末端。
融合序列可包含与3’标记多核苷酸如包含容器条码的多核苷酸的区域互补的区域。融合序列可包含与多核苷酸如包含容器条码的多核苷酸的区域的互补体互补的区域。例如,融合序列可包含与含有条码如容器条码的3’标记多核苷酸或其互补体互补的3’区,如3’末端区。
3’标记多核苷酸可以是用于将核酸添加至目标多核苷酸如亲和-寡核苷酸缀合物中的寡核苷酸的3’端的多核苷酸。3’标记多核苷酸可以是用作模板以将核酸添加至目标多核苷酸如亲和-寡核苷酸缀合物中的寡核苷酸的3’端的多核苷酸。3’标记多核苷酸可以是与目标多核苷酸如亲和-寡核苷酸缀合物中的寡核苷酸的3’端杂交的多核苷酸。3’标记多核苷酸可以是含有与目标多核苷酸如亲和-寡核苷酸缀合物中的寡核苷酸的3’端杂交的3’区如3’末端区的多核苷酸。
在一些实施方案中,3’标记多核苷酸是容器条码化多核苷酸。可将容器条码添加至亲和-寡核苷酸缀合物中的寡核苷酸。例如,可使容器条码与亲和-寡核苷酸缀合物中的寡核苷酸杂交。容器条码化多核苷酸可包含与亲和-寡核苷酸缀合物中的寡核苷酸的3’端杂交的3’区如3’末端区。
在一些实施方案中,3’标记多核苷酸是扩增产物。在一些实施方案中,3’标记多核苷酸是来源于单个分子的扩增产物。在一些实施方案中,3’标记多核苷酸是容器条码化多核苷酸的扩增产物。在一些实施方案中,3’标记多核苷酸是来源于单个容器条码化多核苷酸的扩增产物。与亲和-寡核苷酸缀合物中的寡核苷酸的3’端杂交的区域5’至3’区可包含与引物或其互补体互补的区域。与亲和-寡核苷酸缀合物中的寡核苷酸的3’端杂交的区域5’至3’区可包含与可用于扩增亲和-寡核苷酸缀合物中的寡核苷酸的引物互补的区域。例如,可使用引物组扩增亲和-寡核苷酸缀合物中的寡核苷酸,所述引物组包含第一引物和第二引物,该第一引物与区域5’至3’区互补,该区域5’至3’区与亲和-寡核苷酸缀合物中的寡核苷酸或其互补体的3’端杂交,该第二引物与亲和-寡核苷酸缀合物中的寡核苷酸的引物位点互补。
与亲和-寡核苷酸缀合物中的寡核苷酸的3’端杂交的区域5’至3’区可包含与引物或其互补体互补的区域,所述引物或其互补体用于扩增容器条码化多核苷酸。
寡核苷酸融合序列可以为至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100个或更多个连续核苷酸。寡核苷酸融合序列可以是已知长度的序列。寡核苷酸融合序列可以是已知序列。寡核苷酸融合序列可以是预定义序列。寡核苷酸融合序列可以是已知长度的未知序列。寡核苷酸融合序列可以是已知长度的已知序列。
寡核苷酸恒定序列
与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可包含恒定序列。恒定序列是可选的。多个亲和-寡核苷酸缀合物中的每个寡核苷酸的恒定序列可以是相同的。
寡核苷酸恒定序列可用于增加寡核苷酸的长度或用于将寡核苷酸条码、寡核苷酸融合体和寡核苷酸引物结合位点中的一个或多个彼此分隔开。在一些实施方案中,寡核苷酸不包含寡核苷酸恒定序列。例如,寡核苷酸可在包含寡核苷酸引物结合位点的寡核苷酸末端与亲和部分偶联。
在一些实施方案中,将寡核苷酸恒定序列附接至亲和-寡核苷酸复合体的亲和部分。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸引物结合序列的上游。例如,寡核苷酸恒定序列可位于寡核苷酸引物结合序列的5’侧。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸引物结合序列的下游。例如,寡核苷酸恒定序列可位于寡核苷酸引物结合序列的3’侧。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸条码的上游。例如,寡核苷酸恒定序列可位于寡核苷酸条码的5’侧。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸条码的下游。例如,寡核苷酸恒定序列可位于寡核苷酸条码的3’侧。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸融合序列的上游。例如,寡核苷酸恒定序列可位于寡核苷酸融合序列的5’侧。
在一些实施方案中,将寡核苷酸恒定序列插入到寡核苷酸引物结合序列与亲和-寡核苷酸复合体的亲和部分之间。例如,寡核苷酸恒定序列可位于寡核苷酸引物结合序列的5’侧并附接至寡核苷酸的亲和部分。在一些实施方案中,将寡核苷酸恒定序列插入到寡核苷酸引物结合序列与寡核苷酸条码之间。例如,寡核苷酸恒定序列可位于寡核苷酸引物结合序列的3’侧和寡核苷酸条码的5’侧。在一些实施方案中,将寡核苷酸恒定序列插入到寡核苷酸融合序列与寡核苷酸条码之间。例如,寡核苷酸恒定序列可位于寡核苷酸条码的3’侧和寡核苷酸融合序列的5’侧。
寡核苷酸恒定序列可以为至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、250、300、400、500个或更多个连续核苷酸。寡核苷酸恒定序列可包含核苷酸的非随机序列。寡核苷酸恒定序列可以是已知长度的序列。寡核苷酸恒定序列可以是已知序列。寡核苷酸恒定序列可以是预定义序列。寡核苷酸恒定序列可以是已知长度的未知序列。寡核苷酸恒定序列可以是已知长度的已知序列。寡核苷酸引物结合位点
与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可包含引物位点。该引物位点可包含与引物如扩增引物互补的序列。寡核苷酸引物结合序列可用作用于反应如扩增或测序的引物结合位点。寡核苷酸引物结合序列可以是用于反应如扩增或测序的一对引物的第一引物结合序列。例如,寡核苷酸引物结合序列可以是正向引物结合位点。例如,寡核苷酸引物结合位点可以是反向引物结合位点。例如,寡核苷酸引物结合位点可以是正向引物结合位点,并且附接至寡核苷酸的容器条码化多核苷酸的引物结合序列可以是反向引物结合序列。在一些实施方案中,寡核苷酸引物结合序列是通用引物结合序列。
寡核苷酸引物结合序列和附接至寡核苷酸的多核苷酸(例如,容器条码化多核苷酸)的引物结合序列可包含相差不超过6、5、4、3、2或1摄氏度的解链温度。寡核苷酸引物结合序列和附接至寡核苷酸的多核苷酸的引物结合序列的核苷酸序列可以不同,使得与寡核苷酸引物结合序列杂交的多核苷酸不与附接至寡核苷酸的多核苷酸的引物结合序列杂交。寡核苷酸引物结合序列和附接至寡核苷酸的多核苷酸的引物结合序列的核苷酸序列可以不同,使得与附接至寡核苷酸的多核苷酸的引物结合序列杂交的多核苷酸不与寡核苷酸引物结合序列杂交。
寡核苷酸元件的排列
寡核苷酸可以以一定顺序排列,使得寡核苷酸融合序列位于寡核苷酸的一个末端。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在寡核苷酸融合序列上游含有寡核苷酸条码。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在寡核苷酸条码的上游含有寡核苷酸引物结合序列。寡核苷酸可以以一定顺序排列,使得寡核苷酸恒定序列位于寡核苷酸引物结合序列的上游或下游。寡核苷酸可以以一定顺序排列,使得寡核苷酸恒定序列位于寡核苷酸条码序列的上游。寡核苷酸可以以一定顺序排列,使得寡核苷酸恒定序列位于寡核苷酸的一个末端,例如,不含有寡核苷酸融合序列的寡核苷酸的末端。例如,寡核苷酸可以以寡核苷酸融合序列、寡核苷酸条码序列、寡核苷酸引物结合序列和寡核苷酸恒定序列的顺序排列。例如,寡核苷酸可以朝着亲和部分的方向,以寡核苷酸融合序列、寡核苷酸条码序列、寡核苷酸引物结合序列和寡核苷酸恒定序列的顺序排列。例如,寡核苷酸可以从5’端至3’端或从3’端至5’端,以寡核苷酸融合序列、寡核苷酸条码序列、寡核苷酸引物结合序列和寡核苷酸恒定序列的顺序排列。例如,寡核苷酸可以以所述顺序包含5’端寡核苷酸融合序列、独特的寡核苷酸条码序列、反向寡核苷酸引物结合序列和附接至亲和部分(例如,经由附接至3’端的伯胺基团)的3’寡核苷酸恒定序列。例如,附接至亲和部分的寡核苷酸可以朝着亲和部分的方向,以寡核苷酸融合序列、寡核苷酸条码序列、寡核苷酸恒定序列和寡核苷酸引物结合位点序列的顺序排列。
寡核苷酸可以以一定顺序排列,使得融合序列位于寡核苷酸的一个末端。寡核苷酸可以以一定顺序排列,使得融合序列位于AID序列的下游。寡核苷酸可以以一定顺序排列,使得融合序列位于AMB序列的下游。寡核苷酸可以以一定顺序排列,使得融合序列位于恒定序列的下游。寡核苷酸可以以一定顺序排列,使得融合序列位于引物位点的下游。
寡核苷酸可以以一定顺序排列,使得引物位点位于寡核苷酸的一个末端。寡核苷酸可以以一定顺序排列,使得引物位点位于AID序列的上游。寡核苷酸可以以一定顺序排列,使得引物位点位于AMB序列的上游。寡核苷酸可以以一定顺序排列,使得引物位点位于恒定序列的上游。寡核苷酸可以以一定顺序排列,使得引物位点位于融合序列的上游。
寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列的上游含有AID序列。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在引物位点的下游含有AID序列。AID序列可位于AMB序列的上游或下游。AID序列可位于恒定序列的上游或下游。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列与引物位点之间含有AID序列。
寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列的上游含有AMB序列。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在引物位点的下游含有AMB序列。AMB序列可位于AID序列的上游或下游。AMB序列可位于恒定序列的上游或下游。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列与引物位点之间含有AMB序列。
寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列的上游含有恒定序列。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在引物位点的下游含有恒定序列。恒定序列可位于AID序列的上游或下游。恒定序列可位于AMB序列的上游或下游。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列与引物位点之间含有恒定序列。
寡核苷酸可以以一定顺序排列,使得AMB序列和/或AID序列不位于寡核苷酸的一个末端,例如,含有融合序列或引物位点的寡核苷酸的末端。例如,寡核苷酸可以以融合序列、AID序列、AMB序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、AMB序列、AID序列和引物位点的顺序排列。
例如,寡核苷酸可以以融合序列、AID序列、AMB序列、恒定序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、AMB序列、AID序列、恒定序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、恒定序列、AID序列、AMB序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、恒定序列、AMB序列、AID序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、AID序列、恒定序列、AMB序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、AMB序列、恒定序列、AID序列和引物位点的顺序排列。
例如,寡核苷酸可以朝着亲和-寡核苷酸缀合物的亲和部分的方向,以融合序列、AID序列、AMB序列、恒定序列和引物位点的顺序排列。例如,寡核苷酸可以从寡核苷酸的5’端至3’端,以融合序列、AID序列、AMB序列、恒定序列和引物位点的顺序排列。例如,寡核苷酸可以以所述顺序包含5’端融合序列、AID序列、AMB序列、恒定序列和附接至亲和-寡核苷酸缀合物的亲和部分(例如,经由附接至寡核苷酸的3’端的抗体的伯胺基团)的3’引物位点。
亲和-寡核苷酸缀合物制备
可使用任何方便的方法制备本文所述的方法和组合物中采用的亲和-寡核苷酸缀合物。亲和部分可与寡核苷酸直接或间接偶联(例如,经由连接体)。亲和部分可与寡核苷酸共价偶联(例如,经由化学交联)或非共价偶联(例如,经由链霉亲和素-生物素)。在本领域中广泛描述了亲和-寡核苷酸缀合物的设计和制备,包括可使用的各种不同的亲和部分、设计用于邻近连接测定的寡核苷酸以及将这样的寡核苷酸与亲和部分偶联以形成亲和-寡核苷酸缀合物。本领域中描述的细节和原理可应用于亲和-寡核苷酸缀合物的设计,以用于在本发明的方法中使用(参见,例如,WO2007107743和美国专利号7,306,904和6,878,515)。
可利用寡核苷酸与亲和部分之间的直接偶联反应,例如,其中各自均具有能够与另一个的官能团反应的官能团(例如,取代基或化学手柄)。官能团可存在于寡核苷酸或亲和部分上或被引入到这些组分上(例如,经由氧化反应、还原反应、裂解反应等)。已描述了用于产生核酸/多肽缀合物的方法(参见,例如,美国专利号5,733,523)。
可用于与寡核苷酸偶联的抗体或多肽的官能团包括但不限于碳水化合物、氨基酸的巯基(HS-)、氨基酸的胺基团(H2N-)和氨基酸的羧基基团。例如,碳水化合物结构可被氧化为醛,并与含H2NNH基团的化合物反应以形成官能团-C═NH-NH-。例如,硫醇基团可与硫醇反应性基团反应以形成硫醚或二硫化物。例如,可通过天然半胱氨酸残基中二硫化物的硫醇化或分裂将蛋白质的游离硫醇基团引入蛋白质中。例如,氨基基团(例如,赖氨酸残基的氨基末端或ω氨基基团)可与亲电基团(例如,激活的羧基基团)反应以形成酰胺基团。例如,羧基基团(例如,二酸α氨基酸的羧基末端或羧基基团)可被激活并与氨基基团接触以形成酰胺基团。其他的示例性官能团包括,例如,SPDP、碳二亚胺、戊二醛等。
在示例性的实施方案中,使用商用试剂盒(“一体化抗体-寡核苷酸缀合试剂盒(All-in-One Antibody-Oligonucleotide Conjugation Kit)”;Solulink,Inc.)将寡核苷酸与亲和部分共价偶联。例如,首先,可采用Sulfo-S-4FB衍生化3’-氨基-寡核苷酸。第二,可采用S-HyNic基团修饰亲和部分。第三,可使HyNic修饰的亲和部分与4FB修饰的寡核苷酸反应以产生双芳基腙介导的亲和-寡核苷酸缀合物。可经由磁性亲和基质进一步去除过量的4FB修饰的寡核苷酸。总的亲和部分回收率可以为至少约95%、96%、97%、98%、99%或100%不含HyNic修饰的亲和部分和4FB修饰的寡核苷酸。双芳基腙键可对于热(例如,94oC)和pH(例如,3-10)均是稳定的。
在采用连接基团的情况下,可以选择这样的连接体来提供亲和部分与寡核苷酸通过该连接基团的共价附接或非共价附接。多种合适的连接体是本领域已知的。在一些实施方案中,连接体为至少约50或100道尔顿。在一些实施方案中,连接体为至多约300、500、1,000、10,000或100,000道尔顿。连接体可在任何一端包含具有能够与寡核苷酸键合的反应功能性的官能团。连接体可在任何一端包含具有能够与亲和部分键合的反应功能性的官能团。官能团可存在于寡核苷酸、亲和部分和/或连接体上或被引入到这些组分上(例如,经由氧化反应、还原反应、裂解反应等)。
示例性的连接体包括聚合物、脂肪族烃链、不饱和烃链、多肽、多核苷酸、环状连接体、无环连接体、碳水化合物、醚、聚胺和本领域已知的其他连接体。连接体的示例性官能团包括亲核官能团(例如,胺、氨基基团、羟基基团、巯基基团、氨基基团、醇、硫醇和酰肼)、亲电官能团(例如,醛、酯、乙烯酮、环氧化物、异氰酸酯和马来酰亚胺)以及能够进行环加成反应、形成二硫键或与金属结合的官能团。例如,连接体的官能团可以是伯胺、仲胺、氧肟酸、N-羟基琥珀酰亚胺酯、N-羟基琥珀酰亚胺碳酸酯、氧羰基咪唑、硝基苯基酯、三氟乙基酯、缩水甘油醚、乙烯砜、马来酰亚胺、叠氮基苯甲酰肼、N-[4-(对叠氮基水杨基氨基)丁基]-3’-[2’-吡啶基二硫代]丙酰胺)、双琥珀酰亚胺辛二酸酯磺酸盐、二甲基二亚胺代己二酸酯、双琥珀酰亚胺基酒石酸酯、N-马来酰亚胺基丁酰基氧基琥珀酰亚胺酯、N-羟基磺基琥珀酰亚胺基-4-叠氮基苯甲酸酯、N-琥珀酰亚胺基[4-叠氮基苯基]-1,3’-二硫代丙酸酯、N-琥珀酰亚胺基[4-碘乙酰基]氨基苯甲酸酯、戊二醛和4-[N-马来酰亚胺基甲基]环己烷-1-甲酸琥珀酰亚胺酯、3-(2-吡啶基二硫代)丙酸N-羟基琥珀酰亚胺酯(SPDP)、4-(N-马来酰亚胺基甲基)-环己烷-1-羧酸N-羟基琥珀酰亚胺酯(SMCC)等。
在其他实施方案中,可使用产生亲和-寡核苷酸缀合物的体外方案产生亲和-寡核苷酸缀合物,如由编码亲和部分的载体在体外产生亲和部分。感兴趣的此类体外方案的实例包括:基于RepA的方案(参见,例如,Fitzgerald等人,Drug Discov Today(2000)5:253-58和WO9837186)、基于核糖体展示的方案(参见,例如,Hanes等人,PNAS(1997)94:4937-42;Roberts等人,Curr Opin Chem Biol(1999)6月;3:268-73;Schaffitzel等人,J ImmunolMethods(1999)12月10日;231:119-35;以及WO9854312)等。
用于将核酸分子与抗体缀合的技术是本领域公知的(参见,例如,MonoclonalAntibodies And Cancer Therapy(Reisfeld等人编著,Alan R.Liss,Inc.,1985)中的Arnon等人,"Monoclonal Antibodies For Immunotargeting Of Drugs In CancerTherapy,";Controlled Drug Delivery(Robinson等人编著,Marcel Deiker,Inc.,第2版.1987)中的Hellstrom等人,"Antibodies For Drug Delivery,";MonoclonalAntibodies'84:Biological And Clinical Applications(Pinchera等人编著,1985)中的Thorpe,"Antibody Carriers Of Cytotoxic Agents In Cancer Therapy:A Review,";Monoclonal Antibodies For Cancer Detection And Therapy(Baldwin等人编著,Academic Press,1985)中的"Analysis,Results,and Future Prospective of theTherapeutic Use of Radiolabeled Antibody In Cancer Therapy,";以及Thorpe等人,1982,Immunol.Rev.62:119-58。还参见,例如,PCT公开WO 89/12624)。例如,核酸分子可以,例如分别通过N-羟基琥珀酰亚胺酯或马来酰亚胺功能性共价附接至抗体上的赖氨酸或半胱氨酸。
靶抗原
亲和部分的靶抗原可以是核酸分子,或者可以是蛋白质,如靶蛋白或肽。靶抗原可以是存在于样品中的细胞上的化合物或组合物。在一些实施方案中,靶抗原可以是特别在哺乳动物如人类中能够引起细胞介导的免疫应答(即,适应性免疫应答)的化合物或组合物。在一些实施方案中,在MHC分子的环境中靶抗原可由T细胞识别。靶抗原包括但不限于细胞、组织提取物、组织或细胞裂解物、蛋白质(单独地或作为混合物,多种蛋白质)、肽、肽的混合物、脂质、碳水化合物、糖等。靶抗原可以是疾病特有的,如感染性疾病、自身免疫病或癌症。靶抗原可以是例如病毒抗原、细菌抗原、癌症抗原等。
在一些实施方案中,靶抗原是病毒抗原。病毒抗原包括例如,病毒外壳蛋白、流感病毒抗原、HIV抗原、乙型肝炎抗原或丙型肝炎抗原。
在一些实施方案中,靶抗原是癌症抗原(例如,蛋白质、肽、脂质、碳水化合物等),该癌症抗原单独或主要由肿瘤细胞或癌细胞表达或过表达,使得所述抗原与肿瘤或癌症相关联。癌症抗原可以是仅一种类型的癌症或肿瘤的癌症抗原,使得所述癌症抗原与仅一种类型的癌症或肿瘤相关联,或为仅一种类型的癌症或肿瘤所特有。或者,癌症抗原可以是超过一种类型的癌症或肿瘤的癌症抗原(例如,可以是超过一种类型的癌症或肿瘤所特有的)。例如,癌症抗原可由乳腺和前列腺癌细胞表达,而完全不被正常的非肿瘤或非癌细胞所表达,或仅最低限度地表达。癌症抗原可以是黑素瘤癌症抗原或乳腺癌抗原。示例性的癌症抗原包括gp100.MART-1、NY-ESO-1、蛋白质的MAGE家族的成员例如MAGE-A1、间皮素、酪氨酸酶、TRP-1、TRP-2、PMSA、Her-2和p53。
靶抗原可以天然地、人工地、合成地或重组产生。因此,靶抗原可以是合成的、重组的、分离的和/或纯化的蛋白质、多肽或肽。制备或获得这样的抗原的方法是本领域已知的。例如,从头合成多肽和蛋白质(例如,抗原多肽和蛋白质)的合适的方法描述在Chan等人,Fmoc Solid Phase Peptide Synthesis,Oxford University Press.Oxford,UnitedKingdom,2005;Peptide and Protein Drug Analysis,Reid,R编著,Marcel Dekker,Inc.,2000;Epitope Mapping,Westwood等人编著,Oxford University Press.Oxford.UnitedKingdom,2000;和美国专利号5,449,752中。此外,可使用编码多肽或蛋白质的核酸,利用标准重组方法重组产生多肽和蛋白质(例如,抗原多肽和蛋白质)。参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Press,ColdSpring Harbor,N.Y.2001;和Ausubel等人,Current Protocols in MolecularBiology.Greene Publishing Associates and John Wiley&Sons,NY,1994。许多抗原的核苷酸序列是本领域已知的,并且可从国家生物技术信息中心(NCBI)网站的GenBank数据库获得。另外,抗原可从来源如植物、细菌、昆虫、哺乳动物,例如,大鼠、人类等中分离和/或纯化。分离和纯化的方法是本领域公知的。
抗原可以是游离抗原,例如,未结合的抗原肽(例如,游离肽),或者可以是结合抗原,例如,通过用肽脉冲处理的载体细胞呈递的MHC-肽四聚体或抗原肽。
在一些实施方案中,目标分析物是膜结合蛋白质。在一个实施方案中,膜结合蛋白质是CD4、具有单个跨膜(TM)结构域的经典I型膜蛋白质。(Carr等人,(1989)J.Biol.Chem.264:21286-95)。在另一个实施方案中,膜结合蛋白质是GPR77,即多跨越的G蛋白偶联受体(GPCR)膜蛋白质。(Cain&Monk,(2002)J.Biol.Chem.277:7165-69)。
附加的示例性膜结合蛋白质包括但不限于GPCR(例如,肾上腺素能受体、血管紧张素受体、胆囊收缩素受体、蕈毒碱乙酰胆碱受体、神经降压素受体、甘丙肽受体、多巴胺受体、阿片受体、5-羟色胺(erotonin)受体、生长抑素受体等)、离子通道(例如,烟碱乙酰胆碱受体、钠通道、钾通道等)、受体酪氨酸激酶、受体丝氨酸/苏氨酸激酶、受体鸟苷酸环化酶、生长因子和激素受体(例如,表皮生长因子(EGF)受体)等等。也可以使用膜结合蛋白质的突变体或经修饰的变体。例如,GPCR的一些单个或多个点突变保留了功能并参与疾病(参见,例如,Stadel等人,(1997)Trends in Pharmacological Review 18:430-37)。
单细胞表征、细胞多核苷酸条码化和链配对
本文所述的方法可包括利用亲和-寡核苷酸缀合物对细胞进行表征。可使多个细胞与一个或多个亲和-寡核苷酸缀合物接触。可洗涤细胞以去除未结合的缀合物。可将细胞以单细胞的形式隔离在容器中。可例如通过将容器条码化多核苷酸附接至所述缀合物的寡核苷酸,将与隔离的细胞结合的亲和-寡核苷酸缀合物修饰为含有容器条码序列。
还可在容器的形成过程中引入具有容器条码的多核苷酸。这些容器条码化多核苷酸可携带简并条码,使得含有容器条码的每个寡核苷酸均含有与这些条码所在的容器相对应的独特识别码。
寡核苷酸可以进行扩增且反应的扩增产物可从容器中回收。扩增产物可以进行PCR富集以添加下一代测序(NGS)标签。可以使用高通量测序平台对文库进行测序,然后分析容器条码序列和/或AID序列和/或AMB序列。由于每个单细胞被隔离在其各自的容器中,因此对于被两次观察到的每个容器条码,经测序的扩增寡核苷酸产物来源于同一容器,并因此来自独特的单细胞。由于寡核苷酸的每个AID被条码化地加至其附接的亲和-寡核苷酸缀合物的亲和部分,并且每个单细胞被隔离在其各自的容器中,因此对于观察到的含有相同容器条码的序列的每个AID,经测序的扩增寡核苷酸产物来源于与同一容器中的单细胞结合的特定的亲和-寡核苷酸缀合物。对于在全部含有相同容器条码的序列组中单独地观察到的每个不同的AMB,在该组中经测序的具有AMB的扩增寡核苷酸产物来源于与同一容器中的细胞结合的(例如,在使用单细胞容器的情况下,与该容器中的单细胞结合的)单个亲和-寡核苷酸缀合物分子的不同(与其他单独的AMB相比)的单个寡核苷酸部分。对于观察到的每个单个AMB,具有含有所述相同容器条码的序列的全部扩增寡核苷酸产物均来源于单个(相同的)亲和-寡核苷酸缀合物分子的寡核苷酸部分(例如,表示PCR复制或扩增子)。因此,观察到的具有特定AMB和特定容器条码的给定组合的每个寡核苷酸指示亲和-寡核苷酸缀合物的单个分子与单细胞结合;因此,检测的具有这样的AMB/容器条码组合的经测序的多个寡核苷酸的给定数目(例如,2、3、4个或更多个)指示与例如测定的细胞群体或样品内的单细胞结合的亲和-寡核苷酸缀合物的数目(例如,2、3、4个或更多个)。因此,这样的数目可以指示亲和-寡核苷酸缀合物的给定亲和部分被设计结合的细胞上的分子的数目,例如,在该单细胞上或该单细胞中表达的拷贝的数目。
在一些实施方案中,本文所述的方法进一步包括对来源于细胞的多核苷酸和/或容器中的多核苷酸进行条码化,所述多核苷酸不同于亲和-寡核苷酸缀合物并且不同于其部分或拷贝。例如,与亲和-寡核苷酸缀合物已经结合或结合的封装在容器中的单细胞可以裂解,并且其他的多核苷酸如来自单细胞的或单细胞内的多核苷酸可被条码化。在一些实施方案中,容器中的亲和-寡核苷酸缀合物,例如与该容器中的单细胞已经结合或结合的亲和-寡核苷酸缀合物中的寡核苷酸部分,和/或其拷贝或扩增产物可采用容器条码序列进行条码化。在一些实施方案中,来自单细胞的一个或多个细胞多核苷酸可采用相同的容器条码化序列进行条码化;在一些实施方案中,这样的附加的一个或多个细胞多核苷酸进一步采用分子条码进行条码化。
T细胞受体链对和抗体免疫球蛋白链对是两种类型的免疫受体。在一些实施方案中,细胞多核苷酸是抗体免疫球蛋白链(或部分)编码多核苷酸;在一些实施方案中,细胞多核苷酸是或包含TCR(或部分)编码多核苷酸。在一些实施方案中,被亲和-寡核苷酸缀合物结合的抗原是TCR或抗体或链或其部分。在一个方面,本文所述的方法进一步包括生成用于高通量测序和诊断的多核苷酸文库。在一个方面,本文所述的方法进一步包括开发从患者或具有特定的共同属性的群组发现的抗体和/或TCR的人类衍生的文库组。本文公开的发明可应用于多种不同类型的成对的可变序列,例如,T细胞受体链对和抗体免疫球蛋白链对,以及使用亲和-寡核苷酸缀合物的单细胞表征。例如,与细胞多核苷酸互补的多核苷酸,如重链和/或轻链,例如VH和/或VL,抗体链和/或α链和/或β链和/或γ链和/或δ链,例如Vα/Vβ和Vγ/VδT细胞受体(TCR)链(如来源于其框架部分的那些链)可在容器形成的过程中被引入(或被包含在容器内)。具有容器条码的多核苷酸还可在容器的形成过程中被引入(或被包含在容器内)。这些容器条码化多核苷酸可携带简并条码,使得含有容器条码的每个细胞多核苷酸均含有与反应过程中该条码所在的容器相对应的独特识别码。因此,在一些这样的实施方案中,具有相同的独特识别码的多个多核苷酸被认为来源于同一容器,并因此在一些方面来自单细胞。具有分子条码的多个多核苷酸还可在容器的形成过程中被引入或被包含在容器内。这些分子条码化多核苷酸可携带简并条码,使得每个含有分子条码的细胞多核苷酸分子含有对应于它们所来自的单细胞多核苷酸分子的独特识别码。数百万个单个免疫细胞可在乳液内裂解,而细胞转录物,如VH和VL和/或Vα/Vβ和/或Vγ/Vδ链转录物,可使用引物进行逆转录或拷贝,随后用容器条码和分子条码标记,并PCR扩增该条码化多核苷酸。起源于单个免疫细胞(例如,B细胞或T细胞)的每个VH和VL和/或Vα/Vβ和/或Vγ/Vδ链可借助相同的容器条码标识实际上彼此关联。
然后,可从容器中回收VH和VL和/或Vα/Vβ和/或Vγ/Vδ链并PCR富集,以便添加下一代测序(NGS)标签。可使用高通量测序平台对该文库进行测序,然后分析组库多样性、抗体频率、CDR3表征、体细胞超突变系统发生分析等。可通过对容器和分子条码序列进行去卷积来生成正确匹配的VH和VL和/或Vα/Vβ和/或Vγ/Vδ对的数据库。因为每个单个免疫细胞都隔离在它们各自的容器中,所以对于每个观察到两次的容器条码,测序的转录物来源于相同的乳液小液滴,并因此来自独特的单细胞。对于观察到的每个不同分子条码,对于含有相同容器条码的序列,测序的转录物来源于来自单细胞的不同转录物分子。对于观察到的每个相同分子条码,对于含有相同容器条码的序列,测序的转录物来源于来自单细胞的相同转录物分子(例如,PCR复制物)。
与测序并行地,从容器中回收的VH和VL和/或Vα/Vβ和/或Vγ/Vδ链的文库可克隆到抗体表达载体中并共转染以供酵母展示筛选。与在开始时就分裂生物样品相比,克隆此一致的文库集合体是优选的方法,因为一些罕见的免疫细胞将只在一个或另一个分析中被捕获。人源的VH和VL和/或Vα/Vβ和/或Vγ/Vδ链的文库不论正确或错误的成对匹配均可表达,如经典展示分析一样。然后,可针对一个或多个抗原靶标进行酵母展示,以富集潜在的抗体候选物。
从展示技术如酵母展示得到的阳性候选抗体可进行测序并查询匹配对的条码数据库。每个酵母展示的VH和/或Vα和/或Vγ链可分别回溯匹配于其各自的VL或Vβ或Vδ链,且每个酵母展示的VL和/或Vβ和/或Vδ链可分别回溯匹配于其各自的VH或Vα或Vγ链。这些正确配对的候选物可在哺乳动物细胞系中基因合成并表达,并针对感兴趣的靶标进行功能性验证。这些候选物可以是完全人类抗体和/或TCR。
样品
在一些实施方案中,含有多核苷酸的任何样品均可在本文所述的方法中使用。含有细胞的任何样品通常可在本文所述的方法中使用。例如,样品可以是来自受试者或来自来源于受试者的样品的含有RNA或DNA的生物样品。可从生物样品中提取多核苷酸,或者可直接对样品进行该方法而无需提取或纯化多核苷酸。样品可为提取或分离的DNA或RNA。样品还可为从生物试样中提取的总RNA或DNA、cDNA文库、病毒或基因组DNA。在一个实施方案中,从含有多种其他组分如蛋白质、脂质和非模板核酸的生物样品中分离多核苷酸。可从任何细胞材料获得核酸模板分子,该细胞材料从动物、植物、细菌、真菌或任何其他细胞生物体获得。在某些实施方案中,从单细胞获得多核苷酸。多核苷酸可从生物体直接获得或从由生物体获得的生物样品获得。任何组织或体液试样都可用作供本发明使用的核酸的来源。多核苷酸还可从培养的细胞如原代细胞培养或细胞系中分离。可用病毒或其他细胞内病原体感染从中获得模板核酸的细胞或组织。
在某些实施方案中,产生抗体或TCR的免疫细胞可从受试者或宿主的血液或其他生物样品中分离,以鉴别具有潜在临床意义的病原体、肿瘤和/或疾病特异性抗体或TCR,该受试者或宿主例如是人或其他动物,诸如已经免疫或患有感染、癌症、自身免疫病况或任何其他疾病的人或其他动物。例如,该人可被诊断为患有疾病、表现出疾病的症状、未被诊断为患有疾病或未表现出疾病的症状。例如,该人可为暴露于传染原(例如,病毒、细菌、寄生虫、朊病毒等)、抗原或疾病和/或可产生对其有用的抗体或TCR的人。例如,该动物可为暴露于传染原(例如,病毒、细菌、寄生虫、朊病毒等)、抗原或疾病和/或可产生对其有用的抗体或TCR的动物。来自经免疫的宿主的某些免疫细胞产生针对一种或多种所述靶抗原和/或一种或多种未知抗原的抗体或TCR。在本发明中,可通过任何合适的方法,诸如使用荧光激活细胞分选(FACS)、磁性激活细胞分选、淘选或其他筛选方法来筛选并分选细胞,以生成来自样品的多种免疫细胞,诸如免疫细胞文库,从而针对所需免疫细胞对淋巴细胞集合体进行富集,之后对抗体链进行测序、产生抗体,或产生表达文库。与只提供表达不同抗体的免疫细胞的很少子集,并因此只提供很少的天然存在的可变域组合的现有技术富集方法相比,本发明的免疫细胞文库含有表达不同抗体或TCR的单独的免疫细胞或其至少2个子集。例如,本发明的免疫细胞文库可含有表达不同抗体或TCR的单独的免疫细胞或其至少5、10、100、250、500、750、1000、2500、5000、10000、25000、50000、75000、10000、250000、500000、750000、1000000、2500000、5000000、7500000或10000000个子集。本发明的方法使免疫细胞回收最大化,并提供了非常高的多样性。
可从许多来源获得T细胞,该来源包括外周血单核细胞、骨髓、胸腺、组织活检物、肿瘤、淋巴结组织、肠相关淋巴样组织、粘膜相关淋巴样组织、脾脏组织或任何其他淋巴样组织和肿瘤。可从T细胞系以及自体或同种异体来源获得T细胞。可从单个个体或个体群,例如,全部患有相同的疾病如癌症或感染性疾病的个体群获得T细胞。在一些实施方案中,通过分离术(apheresis)或白细胞提取法获得来自个体的循环血液的细胞。分离术产品通常含有淋巴细胞,包括T细胞、单核细胞、粒细胞、B细胞、其他有核白细胞、红细胞和血小板。在一个实施方案中,可洗涤通过分离术或白细胞提取法收集的细胞以去除血浆级分,并将这些细胞置于合适的缓冲液或介质中以进行后续处理步骤。在本发明的一个实施方案中,采用磷酸盐缓冲盐水(PBS)洗涤这些细胞。在替代的实施方案中,洗涤溶液缺少钙,并且可缺少镁或者可缺少许多(如果不是全部的话)二价阳离子。正如本领域普通技术人员将会容易理解的,洗涤步骤可通过本领域技术人员已知的方法来完成,如通过使用半自动化无逆流离心机。洗涤之后,可将这些细胞重悬于多种生物相容的缓冲液,例如无Ca++/Mg++的PBS中。或者,可去除分离术样品中不需要的组分,并将这些细胞直接重悬于培养基中。在其他实施方案中,通过裂解红细胞和通过经由PERCOLLTM梯度进行离心从外周血淋巴细胞分离T细胞。可通过阳性或阴性选择技术进一步分离特定的T细胞亚群,如CD28+、CD4+、CD8+、CD45RA+和CD45RO+T细胞。例如,CD3+、CD28+T细胞可使用CD3/CD28缀合的磁珠(例如,M-450CD3/CD28T细胞扩增器(M-450CD3/CD28TCell Expander))进行阳性选择。在一些实施方案中,通过阴性选择对T细胞群体的富集可采用针对对于阴性选择的细胞独特的表面标志物的抗体的组合来完成。一种这样的方法是经由阴性磁性免疫粘附或流式细胞术的细胞分选和/或选择,所述阴性磁性免疫粘附或流式细胞术使用针对存在于阴性选择的细胞上的细胞表面标志物的单克隆抗体的混合物。例如,为了通过阴性选择富集CD4+细胞,单克隆抗体混合物通常包括针对CD14、CD20、CD11b、CD16、HLA-DR和CD8的抗体。另一种制备用于刺激的T细胞的方法是在洗涤步骤之后冷冻这些细胞,该方法不需要单核细胞去除步骤。不希望受到理论的束缚,冷冻和后续的解冻步骤通过去除细胞群体中的粒细胞,以及在某种程度上去除单核细胞来提供更均匀的产品。在去除血浆和血小板的洗涤步骤之后,可将这些细胞悬浮于冷冻溶液中。虽然许多冷冻溶液和参数是本领域已知的并且可用于本文,但是一种方法包括使用含20%DMSO和8%人血清白蛋白(HSA)的PBS或其他合适的细胞冷冻介质。其随后用介质以1:1稀释,使得DMSO和HSA的最终浓度分别为10%和4%。随后将这些细胞以每分钟1℃的速率冷冻至-80℃,并在液氮储罐的气相中储存。
在一些实施方案中,采用来自非免疫的人类或非人类供体的免疫细胞。动物的起始组库(抗原激发之前的组库)向动物提供了能以适度的亲和力(KA为约1x10-6至1x10-7M)与基本上任何非自身分子结合的抗体或TCR。抗体或TCR结合位点的序列多样性不在种系中直接编码,而是以组合的方式从V基因区段装配。免疫引发任何免疫细胞产生VH-VL或Vα-Vβ或Vγ-Vδ组合,该组合与免疫原结合以增殖(克隆扩充)并分泌如上所述的相应抗体。然而,使用来自未经免疫的受试者的脾细胞和/或免疫细胞或其他外周血淋巴细胞(PBL)可提供对可能的抗体或TCR组库的更好呈现,并且还允许使用任何动物物种构建随后的B细胞或T细胞抗体或TCR文库。
在一些情况下,为了获得足够的核酸以供测试,抽取至少0.001、0.005、0.01、0.05、0.1、0.5、1、2、3、4、5、10、20、25、30、35、40、45或50mL的血液体积。
在一些情况下,起始材料为外周血。外周血细胞可针对特定细胞类型(例如,单个核细胞;红细胞;CD4+细胞;CD8+细胞;免疫细胞;T细胞,NK细胞等)进行富集。外周血细胞还可选择性消耗特定细胞类型(例如,单个核细胞;红细胞;CD4+细胞;CD8+细胞;免疫细胞;T细胞,NK细胞等)。
在一些情况下,起始材料可为组织样品,包括固体组织,其非限制性实例包括脑、肝、肺、肾、前列腺、卵巢、脾、淋巴结(包括扁桃体)、甲状腺、胰腺、心脏、骨骼肌、肠、喉、食道和胃。在其他情况下,起始材料可为含有核酸的细胞、免疫细胞,并且特别是B细胞或T细胞。在一些情况下,起始材料可为来自可从中获得遗传物质的任何生物体的含有核酸的样品。在一些情况下,样品为流体,例如血液、唾液、淋巴或尿液。
可从具有病况的受试者取得样品。在一些情况下,从中取得样品的受试者可为患者,例如,癌症患者或疑似患有癌症的患者。受试者可为哺乳动物,例如人类,并可为雄性或雌性。在一些情况下,该雌性为妊娠的。该样品可为肿瘤活检物。活检可由例如医疗服务人员进行,包括内科医师、医师助理、护士、兽医、牙医、脊椎推拿师、急救医师、皮肤科医师、肿瘤科医师、胃肠科医师或外科医师。
在一些情况下,可使用酶处理(如蛋白酶消化)从起始材料中去除非核苷酸物质。
在一些情况下,血液可收集到含有镁螯合剂(包括但不限于EDTA)的装置中,并在4℃下储存。任选地,可添加钙螯合剂,包括但不限于EGTA。在另一种情况下,向血液中添加细胞裂解抑制剂,包括但不限于甲醛、甲醛衍生物、福尔马林、戊二醛、戊二醛衍生物、蛋白质交联剂、核酸交联剂、蛋白质和核酸交联剂、伯胺反应性交联剂、巯基反应性交联剂、巯基添加剂或二硫化物还原剂、碳水化合物反应性交联剂、羧基反应性交联剂、光反应性交联剂或可裂解交联剂。
在一些情况下,当提取的材料包含单链RNA、双链RNA或DNA-RNA杂合体时,可使用本领域已知的技术将这些分子转化为双链DNA。例如,可使用逆转录酶从RNA分子合成DNA。在一些情况下,RNA到DNA的转化可能需要预先的连接步骤,以将连接体片段与RNA相连接,从而允许使用通用引物来启动逆转录。在其他情况下,mRNA分子的聚-A尾例如可用来启动逆转录。在一些情况下,在转化为DNA后,可使用本文详细描述的方法来进一步捕获、选择、标记或分离所需序列。
核酸分子包括脱氧核糖核酸(DNA)和/或核糖核酸(RNA)。核酸分子可为合成的或来源于天然存在的来源。在一个实施方案中,从含有多种其他组分如蛋白质、脂质和非模板核酸的生物样品中分离核酸分子。可从任何细胞材料获得核酸模板分子,该细胞材料从动物、植物、细菌、真菌或任何其他细胞生物体获得。在某些实施方案中,从单细胞获得核酸分子。供本发明使用的生物样品包括病毒颗粒或制品。核酸分子可从生物体直接获得,或从自生物体获得的生物样品获得,例如,从血液、尿液、脑脊液、精液、唾液、痰、粪便和组织获得。任何组织或体液试样都可用作供本发明使用的核酸的来源。核酸分子还可从培养的细胞如原代细胞培养物或细胞系中分离。可用病毒或其他细胞内病原体感染从中获得模板核酸的细胞或组织。
样品还可以是从生物试样中提取的总RNA、cDNA文库、病毒或基因组DNA。在某些实施方案中,核酸分子与诸如蛋白质、酶、底物、抗体、结合剂、珠子、小分子、肽或任何其他分子等其他目标分子结合。通常,可通过多种技术从生物样品中提取核酸,诸如Sambrook andRussell,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor,N.Y.(2001)描述的技术。核酸分子可为单链的、双链的或具有单链区的双链(例如,茎结构和环结构)。
DNA提取方法是本领域公知的。经典的DNA分离方案基于使用有机溶剂如苯酚和氯仿的混合物来提取,然后用乙醇沉淀(J.Sambrook等人,“Molecular Cloning:ALaboratory Manual,”1989,第二版,Cold Spring Harbour Laboratory Press:New York,N.Y.)。其他方法包括:盐析DNA提取(P.Sunnucks等人,Genetics,1996,144:747-756;S.M.Aljanabi等人,Nucl.Acids Res.1997,25:4692-4693)、三甲基溴化铵DNA提取(S.Gustincich等人,BioTechniques,1991,11:298-302)和硫氰酸胍DNA提取(J.B.W.Hammond等人,Biochemistry,1996,240:298-300)。用于从生物样品中提取DNA的多种试剂盒可商购获得(例如,BD Biosciences Clontech(Palo Alto,CA);EpicentreTechnologies(Madison,WI);Gentra Systems,Inc.(Minneapolis,MN);MicroProbe Corp.(Bothell,WA);Organon Teknika(Durham,NC);和Qiagen Inc.(Valencia,CA))。
RNA提取方法也是本领域公知的(例如,J.Sambrook等人,“Molecular Cloning:ALaboratory Manual”1989,211d Ed.,Cold Spring Harbour Laboratory Press:NewYork)且用于从体液中提取RNA的试剂盒可商购获得(例如,Ambion,Inc.(Austin,TX);Amersham Biosciences(Piscataway,NJ);BD Biosciences Clontech(Palo Alto,CA);BioRad Laboratories(Hercules,CA);Dynal Biotech Inc.(Lake Success,NY);Epicentre Technologies(Madison,WI);Gentra Systems,Inc.(Minneapolis,MN);GIBCOBRL(Gaithersburg,MD);Invitrogen Life Technologies(Carlsbad,CA);MicroProbeCorp.(Bothell,WA);Organon Teknika(Durham,NC);Promega,Inc.(Madison,WI);和Qiagen Inc.(Valencia,CA))。
一个或多个样品可来自一个或多个来源。一个或多个样品可来自两个或更多个来源。一个或多个样品可来自一个或多个受试者。一个或多个样品可来自两个或更多个受试者。一个或多个样品可来自相同的受试者。一个或多个受试者可来自相同的物种。一个或多个受试者可来自不同的物种。该一个或多个受试者可为健康的。该一个或多个受试者可患有疾病、病症或病况。
在一些实施方案中,样品为流体,诸如血液、唾液、淋巴、尿液、脑脊液、精液、痰、粪便或组织匀浆。
可从具有病况的受试者取得样品。在一些实施方案中,从中取得样品的受试者可为患者,例如,癌症患者或疑似患有癌症的患者。受试者可为哺乳动物,例如人,并可为雄性或雌性。在一些实施方案中,该雌性为妊娠的。该样品可为肿瘤活检物。活检可由例如医疗服务人员进行,包括内科医师、医师助理、护士、兽医、牙医、脊椎推拿师、急救医师、皮肤科医师、肿瘤科医师、胃肠科医师或外科医师。
在一些实施方案中,多核苷酸与诸如蛋白质、酶、底物、抗体、结合剂、珠子、小分子、肽或任何其他分子等其他目标分子结合。在一些实施方案中,多核苷酸不与固体支持体结合。可通过多种技术从生物样品中提取核酸(Sambrook等人,Molecular Cloning:ALaboratory Manual,第三版,Cold Spring Harbor,N.Y.(2001))。
在一些实施方案中,样品为唾液。在一些实施方案中,样品为全血。在一些实施方案中,为了获得足量的多核苷酸以供测试,取得至少0.001、0.005、0.01、0.05、0.1、0.5、1、2、3、4、5、10、20、25、30、35、40、45或50mL的血液体积。在一些实施方案中,血液可收集到含有镁螯合剂(包括但不限于EDTA)的装置中,并在4℃下储存。任选地,可添加钙螯合剂,包括但不限于EGTA。
在一些实施方案中,向血液中添加细胞裂解抑制剂,包括但不限于甲醛、甲醛衍生物、福尔马林、戊二醛、戊二醛衍生物、蛋白质交联剂、核酸交联剂、蛋白质和核酸交联剂、伯胺反应性交联剂、巯基反应性交联剂、巯基添加剂或二硫化物还原剂、碳水化合物反应性交联剂、羧基反应性交联剂、光反应性交联剂或可裂解交联剂。在一些实施方案中,可使用酶处理(诸如蛋白酶消化)从起始材料中去除非核苷酸物质。
多个样品可包括至少2、3、4、5、10、20、30、40、50、60、70、80、90或100个或更多样品。多个样品可包括至少约100、200、300、400、500、600、700、800、900或1000个或更多个样品。多个样品可包括至少约1000、2000、3000、4000、5000、6000、7000、8000个样品、9000或10,000个样品、或100,000个样品、或1,000,000个或更多个样品。多个样品可包括至少约10,000个样品。
第一样品中的一个或多个多核苷酸可与第二样品中的一个或多个多核苷酸不同。第一样品中的一个或多个多核苷酸可与多个样品中的一个或多个多核苷酸不同。样品中的一个或多个多核苷酸可包含至少约80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。在一些实施方案中,样品中的一个或多个多核苷酸可以有少于约100、90、80、70、60、50、40、30、25、20、25、10、9、8、7、6、5、4、3、2或1个核苷酸或碱基对不同。多个样品的一个或多个样品中的多个多核苷酸可包含两个或更多个相同序列。多个样品的一个或多个样品中的总多核苷酸的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%可包含相同的序列。多个样品的一个或多个样品中的多个多核苷酸可包含至少两个不同的序列。多个样品的一个或多个样品中的总多核苷酸的至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%可包含至少两个不同的序列。在一些实施方案中,一个或多个多核苷酸为彼此的变体。例如,一个或多个多核苷酸可含有单核苷酸多态性或其他类型的突变。在另一个实例中,一个或多个多核苷酸为剪接变体。
第一样品可包含一个或多个细胞,且第二样品可包含一个或多个细胞。第一样品的一个或多个细胞与第二样品的一个或多个细胞可属于相同的细胞类型。第一样品的一个或多个细胞与所述多个样品的一个或多个不同细胞可属于不同的细胞类型。
所述多个样品可同时获得。多个样品可在相同时间获得。多个样品可顺序获得。多个样品可在获得一个或多个不同样品的数年过程中获得,例如100年、10年、5年、4年、3年、2年或1年。一个或多个样品可在获得一个或多个不同样品的约一年内获得。一个或多个样品可在获得一个或多个不同样品的12个月、11个月、10个月、9个月、8个月、7个月、6个月、4个月、3个月、2个月或1个月内获得。一个或多个样品可在获得一个或多个不同样品的30天、28天、26天、24天、21天、20天、18天、17天、16天、15天、14天、13天、12天、11天、10天、9天、8天、7天、6天、5天、4天、3天、2天或1天内获得。一个或多个样品可在获得一个或多个不同样品的约24小时、22小时、20小时、18小时、16小时、14小时、12小时、10小时、8小时、6小时、4小时、2小时或1小时内获得。一个或多个样品可在获得一个或多个不同样品的约60秒、45秒、30秒、20秒、10秒、5秒、2秒或1秒内获得。一个或多个样品可在获得一个或多个不同样品的少于一秒内获得。
样品的不同多核苷酸可以不同浓度或量存在于样品中(例如,不同的分子数目)。例如,样品中一个多核苷酸的浓度或量可大于另一个多核苷酸的浓度或量。在一些实施方案中,样品中至少一个多核苷酸的浓度或量是样品中至少一个其他多核苷酸的浓度或量的至少约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍或更多倍。在另一个实例中,样品中一个多核苷酸的浓度或量小于另一个多核苷酸的浓度或量。样品中至少一个多核苷酸的浓度或量可比样品中至少一个其他多核苷酸的浓度或量小至少约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍或更多倍。
在一些实施方案中,两个或更多个样品可含有不同量或浓度的多核苷酸。在一些实施方案中,一个样品中一个多核苷酸的浓度或量可大于不同样品中相同多核苷酸的浓度或量。例如,血液样品可比尿液样品含有更高的特定多核苷酸的量。或者,单个样品可分为两个或更多个亚样品。亚样品可含有不同量或浓度的相同多核苷酸。一个样品中至少一个多核苷酸的浓度或量可以是另一个样品中相同多核苷酸的浓度或量的至少约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍或更多倍。或者,一个样品中一个多核苷酸的浓度或量可小于不同样品中相同多核苷酸的浓度或量。例如,一个样品中至少一个多核苷酸的浓度或量可比另一个样品中相同多核苷酸的浓度或量小至少约1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍或更多倍。
目标多核苷酸
在一些情况下,本文提供的方法涉及对目标多核苷酸分子,如来自细胞的多核苷酸分子、亲和-寡核苷酸缀合物中的寡核苷酸或其扩增子进行扩增和测序。在一些情况下,本文提供的方法涉及对目标多核苷酸分子的至少一个区域进行扩增和测序。在一些情况下,本文提供的方法涉及对至少一个目标多核苷酸分子进行扩增和测序。在一个方面,目标多核苷酸是亲和-寡核苷酸缀合物中的寡核苷酸。在一个方面,目标多核苷酸是RNA。在一些实施方案中,目标RNA多核苷酸是mRNA。在一些实施方案中,目标RNA多核苷酸是聚腺苷酸化的。在一些实施方案中,RNA多核苷酸不是聚腺苷酸化的。在一些实施方案中,目标多核苷酸是DNA多核苷酸。例如,目标多核苷酸包括cDNA。DNA多核苷酸可以是基因组DNA。DNA多核苷酸可包含外显子、内含子、非翻译区或其任何组合。
在一个方面,目标多核苷酸为基因组核酸。来源于特定生物体的染色体中的遗传物质的DNA可为基因组DNA。在一些实施方案中,目标多核苷酸包括包含由免疫细胞产生的抗体或TCR的可变区的序列。在一些实施方案中,目标多核苷酸包括包含由免疫细胞产生的抗体的重链可变区的序列。在一些实施方案中,目标多核苷酸包括包含由免疫细胞产生的抗体的轻链可变区的序列。在一些实施方案中,目标多核苷酸包括包含由免疫细胞产生的TCR的α链可变区的序列。在一些实施方案中,目标多核苷酸包括包含由免疫细胞产生的TCR的β链可变区的序列。在一些实施方案中,目标多核苷酸包括包含由免疫细胞产生的TCR的γ链可变区的序列。在一些实施方案中,目标多核苷酸包括包含由免疫细胞产生的TCR的δ链可变区的序列。例如,目标多核苷酸可包括用于生成逆转录反应或引物延伸反应的产物的多核苷酸模板,并且还包括逆转录反应或引物延伸反应产物本身。例如,目标多核苷酸包括可进行逆转录反应或引物延伸反应的感兴趣的多核苷酸。
在一些实施方案中,目标多核苷酸包括含有亲和-寡核苷酸缀合物中的寡核苷酸的AID的序列。在一些实施方案中,目标多核苷酸包括含有亲和-寡核苷酸缀合物中的寡核苷酸的AMD的序列。例如,目标多核苷酸包括RNA或DNA。例如,目标多核苷酸包括合成的寡核苷酸。例如,目标多核苷酸包括含有AID和/或AMB的寡核苷酸。
目标多核苷酸可从实质上任何来源获得,并可使用本领域已知的方法制备。例如,目标多核苷酸可直接分离,而无需使用本领域已知的方法扩增,该方法包括但不限于从生物体或细胞(例如免疫细胞)中提取基因组DNA或mRNA的片段以获得目标多核苷酸。目标多核苷酸还可包含通过逆转录-PCR从RNA(诸如mRNA)生成的cDNA。在一些情况下,目标多核苷酸为RNA分子。在一些情况下,目标多核苷酸为mRNA分子,或从mRNA分子产生的cDNA。在一些情况下,目标多核苷酸为来自单个免疫细胞的mRNA分子或从mRNA分子产生的cDNA分子。在一些情况下,目标多核苷酸为来自单独免疫细胞的mRNA分子或从mRNA分子产生的cDNA分子。在一些情况下,目标多核苷酸为编码来自单个免疫细胞的抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单独免疫细胞的重链抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单个免疫细胞的重链抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单独免疫细胞的轻链抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单个免疫细胞的轻链抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单独免疫细胞的抗体可变序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单个免疫细胞的可变抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单独免疫细胞的可变轻链抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单个免疫细胞的可变轻链抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单独免疫细胞的可变重链抗体序列的mRNA分子。在一些情况下,目标多核苷酸为编码来自单个免疫细胞的可变重链抗体序列的mRNA分子。在一些情况下,目标多核苷酸可为无细胞的核酸,例如DNA或RNA。在一些情况下,目标多核苷酸为编码来自单独免疫细胞的可变α、β、γ和/或δ链TCR序列的mRNA分子。
本文所述的方法可用来由一个或多个目标多核苷酸生成多核苷酸文库以供测序。在一些实施方案中,文库可从目标多核苷酸的两个或更多个区域生成。在一些实施方案中,方法文库可从两个或更多个目标多核苷酸生成。在一些实施方案中,目标多核苷酸为基因组核酸或来源于染色体的DNA。在一些实施方案中,目标多核苷酸包括包含诸如多态性或突变等变体的序列。在一些实施方案中,目标多核苷酸包括DNA且不包括RNA。在一些实施方案中,目标多核苷酸包括RNA且不包括DNA。在一些实施方案中,目标多核苷酸包括DNA和RNA。在一些实施方案中,目标多核苷酸为单链多核苷酸。在一些实施方案中,目标多核苷酸为双链多核苷酸。在一些实施方案中,目标多核苷酸为双链多核苷酸的单链。
目标多核苷酸可以合成或从任何生物样品中获得,并使用本领域已知的方法制备。在一些实施方案中,目标多核苷酸直接分离而无需扩增。直接分离方法是本领域已知的。非限制性实例包括从生物样品、生物体或细胞中提取基因组DNA或mRNA。在一些实施方案中,一个或多个目标多核苷酸从生物样品中纯化。在一些实施方案中,目标多核苷酸不从包含它的生物样品中纯化。在一些实施方案中,目标多核苷酸从生物样品中分离。在一些实施方案中,目标多核苷酸不从包含它的生物样品中分离。在一些实施方案中,目标多核苷酸可为无细胞的核酸。在一些实施方案中,目标多核苷酸可为成片段化的核酸。在一些实施方案中,目标多核苷酸可为经转录的核酸。在一些实施方案中,目标多核苷酸为经修饰的多核苷酸。在一些实施方案中,目标多核苷酸为未经修饰的多核苷酸。
在一些实施方案中,目标多核苷酸是来自亲和-寡核苷酸缀合物中的寡核苷酸。在一些实施方案中,多个目标多核苷酸包含来自多个亲和-寡核苷酸缀合物中的多个寡核苷酸。在一些实施方案中,多个目标多核苷酸包含来自多个亲和-寡核苷酸缀合物中的2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个或更多个寡核苷酸。在一些实施方案中,多个目标多核苷酸包含来自2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个或更多个亲和-寡核苷酸缀合物中的多个寡核苷酸。在一些实施方案中,多个目标多核苷酸包含来自2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个或更多个亲和-寡核苷酸缀合物中的2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个或更多个寡核苷酸。
在一些实施方案中,目标多核苷酸包含AID序列。在一些实施方案中,多个目标多核苷酸包含2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900或1000个或更多个AID序列。在一些实施方案中,目标多核苷酸包含AMB序列。在一些实施方案中,多个目标多核苷酸包含至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1x106、2x106、3x106、4x106、5x106、6x106、7x106、8x106、9x106、1x107、2x107、3x107、4x107、5x107、6x107、7x107、8x107、9x107、1x108、2x108、3x108、4x108、5x108、6x108、7x108、8x108、9x108、1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109、9x109、1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010、9x1010、1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011、9x1011、1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012或9x1012个或更多个AMB序列。
在一些实施方案中,目标多核苷酸是来自单细胞的多核苷酸。在一些实施方案中,目标多核苷酸来自单个细胞。在一些实施方案中,目标多核苷酸是来自含有多个细胞的样品的多核苷酸。
在一些实施方案中,目标多核苷酸编码生物标志物序列。在一些实施方案中,目标多核苷酸编码两个或更多个生物标志物序列。在一些实施方案中,多个目标多核苷酸编码生物标志物序列。在一些实施方案中,多个目标多核苷酸编码两个或更多个生物标志物序列。在一些实施方案中,多个目标多核苷酸编码3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100个或更多个生物标志物序列。
在一些实施方案中,多个目标多核苷酸包含一组寡核苷酸序列。在一些实施方案中,多个目标多核苷酸包含一组免疫球蛋白序列。在一些实施方案中,多个目标多核苷酸包含一组TCR序列。例如,一组免疫球蛋白序列可为VH和/或VL序列。在一些实施方案中,一组免疫球蛋白或TCR序列含有1、2、3、4、5、6、7、8、9或10个免疫球蛋白或TCR序列。在一些实施方案中,一组免疫球蛋白或TCR序列含有至少约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1x106、2x106、3x106、4x106、5x106、6x106、7x106、8x106、9x106、1x107、2x107、3x107、4x107、5x107、6x107、7x107、8x107、9x107、1x108、2x108、3x108、4x108、5x108、6x108、7x108、8x108、9x108、1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109、9x109、1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010、9x1010、1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011、9x1011、1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012或9x1012个免疫球蛋白或TCR序列。在一些实施方案中,一组免疫球蛋白或TCR序列含有最多约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1x106、2x106、3x106、4x106、5x106、6x106、7x106、8x106、9x106、1x107、2x107、3x107、4x107、5x107、6x107、7x107、8x107、9x107、1x108、2x108、3x108、4x108、5x108、6x108、7x108、8x108、9x108、1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109、9x109、1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010、9x1010、1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011、9x1011、1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012或9x1012个免疫球蛋白或TCR序列。在一些实施方案中,一组免疫球蛋白或TCR序列含有约10-20、10-30、10-40、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、50-60、50-70、50-80、50-90、50-100、100-200、100-300、100-400、100-300、100-400、100-500、100-600、100-700、100-800、100-900、100-1000、500-600、500-700、500-800、500-900、500-1000、1000-2000、1000-3000、1000-4000、1000-3000、1000-4000、1000-5000、1000-6000、1000-7000、1000-8000、1000-9000、1000-10000、5000-6000、5000-7000、5000-8000、5000-9000、5000-10000、1-1x105、1-2x105、1-3x105、1-4x105、1-5x105、1-6x105、1-7x105、1-8x105、9x105、1-1x106、1-2x106、1-3x106、1-4x106、1-5x106、1-6x106、1-7x106、1-8x106、9x106、1x107、1-2x107、1-3x107、1-4x107、1-5x107、1-6x107、1-7x107、1-8x107、1-9x107、1-1x108、1-2x108、1-3x108、1-4x108、1-5x108、1-6x108、1-7x108、1-8x108、1-9x108、1-1x109、1-2x109、1-3x109、1-4x109、1-5x109、1-6x109、1-7x109、1-8x109、1-9x109、1-1x1010、1-2x1010、1-3x1010、1-4x1010、1-5x1010、1-6x1010、1-7x1010、1-8x1010、1-9x1010、1-1x1011、1-2x1011、1-3x1011、1-4x1011、1-5x1011、1-6x1011、1-7x1011、1-8x1011、1-9x1011、1-1x1012、1-2x1012、1-3x1012、1-4x1012、1-5x1012、1-6x1012、1-7x1012、1-8x1012或1-9x1012个免疫球蛋白或TCR序列。
在一些实施方案中,目标多核苷酸的长度为约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000或20,000个碱基或碱基对。在一些实施方案中,目标多核苷酸的长度为至少约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000或20,000个碱基或碱基对。在一些实施方案中,目标多核苷酸的长度为最多约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000或20,000个碱基或碱基对。在一些实施方案中,目标多核苷酸的长度为约10-20、10-30、10-40、10-30、10-40、10-50、10-60、10-70、10-80、10-90、10-100、50-60、50-70、50-80、50-90、50-100、100-200、100-300、100-400、100-300、100-400、100-500、100-600、100-700、100-800、100-900、100-1000、500-600、500-700、500-800、500-900、500-1000、1000-2000、1000-3000、1000-4000、1000-3000、1000-4000、1000-5000、1000-6000、1000-7000、1000-8000、1000-9000、1000-10000、5000-6000、5000-7000、5000-8000、5000-9000或5000-10000个碱基或碱基对。在一些实施方案中,目标多核苷酸或其片段的平均长度可为小于约100、200、300、400、500或800个碱基对,或小于约5、10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200个核苷酸,或小于约1、2、5、10、20、30、40、50、60、70、80、90、100千碱基。在一些实施方案中,来自相对较短的模板(诸如含有目标多核苷酸的样品)的目标序列为约40、45、50、55、60、65、70、75、80、85、90、95或100个碱基。在某些实施方案中,使用含有与疾病或病况相关联的序列或免疫球蛋白或TCR序列的数据库将测序数据与已知或预期的序列进行比对。
在一些实施方案中,方法进一步包括测定第一细胞多核苷酸、第二细胞多核苷酸或二者的种系序列,其中所述第一细胞多核苷酸包含IgH或VH序列,并且其中所述第二细胞多核苷酸包含IgL或VL序列或其任何组合。在一些实施方案中,方法进一步包括测定IgL、IgH、VH、VL序列或其任何组合与种系的相应序列相比的变化。在一些实施方案中,方法进一步包括测定以下的至少一项:独特IgH序列的总数;独特IgL序列的总数;独特的IgH和IgL序列的总数;独特的成对IgL和IgH序列的总数;IgH序列或IgL序列的频率;或IgH序列和IgL序列的组合相对于一个或多个其他序列的频率。
在一些实施方案中,方法进一步包括测定第一细胞多核苷酸、第二细胞多核苷酸或二者的种系序列,其中所述第一细胞多核苷酸包含TCRα或Vα序列,并且其中所述第二细胞多核苷酸包含TCRβ或Vβ序列或其任何组合。在一些实施方案中,方法进一步包括测定TCRα、TCRβ、Vα、Vβ序列或其任何组合与种系的相应序列相比的变化。
在一些实施方案中,方法进一步包括测定以下的至少一项:独特TCRα序列的总数;独特TCRβ序列的总数;独特的TCRα和TCRβ序列的总数;独特的成对的TCRβ和TCRα序列的总数;TCRα序列或TCRβ序列的频率;或TCRα序列和TCRβ序列的组合相对于一个或多个其他序列的频率。在一些实施方案中,方法进一步包括测定第一细胞多核苷酸、第二细胞多核苷酸或二者的种系序列,其中所述第一细胞多核苷酸包含TCRγ或Vγ序列,并且其中所述第二细胞多核苷酸包含TCRδ或Vδ序列或其任何组合。在一些实施方案中,方法进一步包括测定TCRγ、TCRδ、Vγ、Vδ序列或其任何组合与种系的相应序列相比的变化。在一些实施方案中,方法进一步包括测定以下的至少一项:独特TCRγ序列的总数;独特TCRδ序列的总数;独特的TCRγ和TCRδ序列的总数;独特的成对的TCRδ和TCRγ序列的总数;TCRγ序列或TCRδ序列的频率;或TCRγ序列和TCRδ序列的组合相对于一个或多个其他序列的频率。在一些实施方案中,方法进一步包括测定以下的至少一项:来自第一基因的序列的总数;来自第二基因的序列的总数;来自第一基因的独特序列的总数;来自第二基因的独特序列的总数;或来自第一基因的序列或来自第二基因的序列的频率。
在一些实施方案中,方法进一步包括基于单独的成对的IgL和IgH序列或TCRα和TCRβ序列或TCRγ和TCRδ序列中的一对或多对的总量以及相对于种系的变化来选择抗体或TCR。在一些实施方案中,方法进一步包括基于一个或多个IgL或IgH序列、TCRα和TCRβ序列或TCRγ和TCRδ序列以及相对于种系的变化来选择抗体或TCR。在一些实施方案中,方法进一步包括基于序列模式、变化分析、动力学或频率中的一个或多个来选择抗体或TCR。在一些实施方案中,方法进一步包括基于频率选择抗体或TCR。
抗体和TCR的克隆和表达
如本文所用的“抗体表达文库”或“TCR表达文库”或“表达文库”可指在核酸或蛋白质水平上的分子的集合(即,两个或更多个分子)。因此,该术语可指编码多种抗体或TCR分子的表达载体的集合(即,在核酸水平上),或者可指已在适当的表达系统中表达后的抗体或TCR分子的集合(即,在蛋白质水平上)。或者,表达载体/表达文库可被包含在可表达它们的合适的宿主细胞内。在本发明的表达文库中编码或表达的抗体分子可为任何适当的形式,例如,可为完整的抗体或TCR分子,或者可为抗体或TCR片段,例如,单链抗体(例如,scFv抗体)、Fv抗体、Fab’抗体、(Fab’)2片段、双抗体等。如“编码”特定酶的核酸序列或特定酶的DNA编码序列或“编码”特定酶的核苷酸序列中的术语“编码”,以及其他同义术语,是指当置于适当调节序列的控制下时转录并翻译为酶的DNA序列。“启动子序列”是能够与细胞中的RNA聚合酶结合并启动下游(3’方向)编码序列的转录的DNA调节区。启动子是DNA序列的一部分。此序列区域在其3’末端具有起始密码子。启动子序列包含最小数目的碱基,以及以高于背景的可检测水平启动转录所必需的元件。然而,在RNA聚合酶与序列结合并且转录在起始密码子处(具有启动子的3’末端)启动之后,转录以3’方向向下游进行。在启动子序列内将发现转录起始位点(方便地通过用核酸酶S1作图来定义)以及负责RNA聚合酶结合的蛋白质结合域(共有序列)。
由本发明的抗体或TCR表达文库鉴别、衍生、选择或获得的抗体或TCR分子构成本发明的又一方面。同样,这些抗体或TCR分子可为蛋白质或编码抗体或TCR分子的核酸,该核酸进而可并入适当的表达载体中和/或包含在合适的宿主细胞内。
cDNA集合体可同与抗体基因的重链的恒定区杂交的多核苷酸以及与抗体或TCR基因的VH或Vα或Vγ链区域的5’端杂交的多核苷酸一起经历PCR反应。cDNA集合体可同与抗体或TCR基因的重链或α或γ链的恒定区杂交的多核苷酸以及与包含抗体或TCR序列的条码化多核苷酸的VH或Vα或Vγ链区域5’端的5’侧区域杂交的多核苷酸一起经历PCR反应。还可设置PCR反应用于扩增例如κ和λ类别的VL或Vβ或Vδ链集合体。cDNA集合体可同与抗体基因的轻链的恒定区杂交的多核苷酸以及与抗体或TCR基因的VL或Vβ或Vδ链区域的5’端杂交的多核苷酸一起经历PCR反应。cDNA集合体可同与抗体基因的轻链的恒定区杂交的多核苷酸以及与包含抗体或TCR序列的条码化多核苷酸的VL或Vβ或Vδ链区域5’端的5’侧区域杂交的多核苷酸一起经历PCR反应。可基于已知且可公开获得的免疫球蛋白或TCR基因序列数据库信息来设计这类寡核苷酸或引物。
在一些实施方案中,可从使用对重链或轻链基因,特别是对VH和VL或Vα和Vβ或Vγ和Vδ多核苷酸的末端区域之一或两者均无特异性的一个或多个引物通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库便利地获得VH和VL或Vα和Vβ或Vγ和Vδ序列。在一些实施方案中,可从使用对容器条码化多核苷酸的区域具有特异性的引物通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库便利地获得VH和VL序列。在一些实施方案中,可从使用C-基因家族特异性引物或C-基因特异性引物通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库便利地获得VH和VL序列。在一些实施方案中,可从使用具有对容器条码化多核苷酸的区域具有特异性的第一引物和作为C-基因家族特异性引物或C-基因特异性引物的第二引物或多个第二引物的引物组通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库便利地获得VH和VL序列。在一些实施方案中,可从使用具有对容器条码化多核苷酸的区域具有特异性的第一引物和对通用序列具有特异性的第二引物的引物组通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库便利地获得VH和VL或Vα和Vβ或Vγ和Vδ序列。
在一些实施方案中,一旦逆转录,可使用对免疫球蛋白基因,特别是对VH和VL或Vα和Vβ或Vγ和Vδ多核苷酸的末端区域之一或两者均具有特异性的一个或多个引物,通过PCR来扩增所得到的cDNA序列。在一些实施方案中,可从使用V-基因家族特异性引物或V-基因特异性引物通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库获得VH和VL序列(Nicholls等人,J.Immunol.Meth.,1993,165:81;W093/12227),或基于可获得的序列信息根据本领域已知的标准方法设计VH和VL序列。(VH和VL或Vα和Vβ或Vγ和Vδ序列可进行连接,通常采用介于中间的间隔区序列(例如,编码符合读框的柔性肽间隔区),从而形成编码单链抗体的盒)。对于免疫球蛋白表达细胞,V区域序列可便利地克隆为cDNA或PCR扩增产物。任选地,在本文所述的方法中,并且特别是在指出的某些步骤之后(例如,在单细胞PCR后;在哺乳动物或其他细胞表面展示后,在FACS筛选后,等等),对VH和VL或Vα和Vβ或Vγ和Vδ区域进行测序。除其他原因外,测序可用来证实多样性水平为可接受的水平。测序可包括高通量测序、深度测序(其中从多个单独的样品对相同的基因进行测序,以鉴别序列中的差异)或二者的组合。
在一些实施方案中,不必要使用本文所述的方法在物理上连接天然的VH和VL或Vα和Vβ或Vγ和Vδ组合。在一些实施方案中,cDNA、条码化多核苷酸或PCR扩增的条码化cDNA未物理连接。在一些实施方案中,cDNA、条码化多核苷酸或PCR扩增的条码化cDNA未在相同的反应或容器中物理连接。
在一些实施方案中,除了cDNA引物之外,还使用针对VH或Vα或Vγ基因的5’端的一个引物或多个引物和针对VL或Vβ或Vδ基因的5’端的另一个引物或多个引物,对天然的VH和VL或Vα和Vβ或Vγ和Vδ组合进行物理连接。这些引物还含有额外序列的互补尾,以允许VH和VL或Vα和Vβ或Vγ和Vδ基因的自装配。在PCR扩增和连接后,得到混合产物即混合可变区的机会减至最小,因为扩增和连接反应在每个细胞内进行。可通过利用大体积试剂如地高辛标记的核苷酸来进一步确保V区域cDNA对不离开细胞区室并混合,而是停留在细胞内以供PCR扩增和连接,从而进一步降低混合的风险。扩增的序列通过互补末端序列的杂交而连接。在连接后,可从细胞中回收序列,以供在本文所述的进一步方法步骤中使用。例如,如果必要的话,回收的DNA可使用末端引物进行PCR扩增,并克隆入载体中,该载体可以是如下详述的质粒、噬菌体、粘粒、噬菌粒、病毒载体或其组合。可将适宜的限制酶位点并入杂交的序列中以帮助克隆。这些载体还可保存为连接的可变区的文库供以后使用。
为了提供附加的VH和VL或Vα和Vβ或Vγ和Vδ组合,可选择表达系统。例如,噬菌体表达系统允许重链和轻链序列的随机重组。其他合适的表达系统是本领域技术人员已知的。
应当注意,在VH和VL或Vα和Vβ或Vγ和Vδ序列来源于非人类的情况下,在一些实施方案中,可优选将这些序列与完全人类Fc嵌合。如本文所用的,“嵌合”是指这样的免疫球蛋白或TCR,其中重链和轻链可变区或Vα和Vβ或Vγ和Vδ区不是人源的,且其中重链和轻链或Vα和Vβ或Vγ和Vδ链的恒定区是人源的。这通过将可变域扩增并克隆到人类Fc中来实现。该人类Fc可为载体的一部分,或在单独的分子中,并且还可使用Fc的文库。在优选的实施方案中,嵌合分子在哺乳动物细胞如CHO细胞中生长,用FACS筛选两次,以针对表达感兴趣的抗体的细胞来富集该细胞群体。通过测序然后功能性表征或通过直接功能性表征或动力学来表征嵌合抗体或TCR。生长、筛选和表征详细描述如下。
重要的是要注意到,以上所述的PCR反应均针对克隆IgG形式的抗体而描述。这些是优选的,因为它们通常与更成熟的免疫应答相关,并且通常比IgM抗体展现出更高的亲和力,从而使它们更理想地用于某些治疗和诊断应用。然而,显然可设计多核苷酸,如果需要或适当的话,其将允许克隆一种或多种其他形式的免疫球蛋白分子,例如IgM、IgA、IgE和IgD。
在鉴别了抗体或TCR,并且适当的所述细胞的群体在适当的时间已经分离并任选地如上所述进行富集之后,抗体或TCR表达文库不需要立刻生成,这使得包含在细胞内的遗传物质可保持完整,从而使文库能够在以后的日期制备。因此,可通过适当的方法,例如,通过冷冻,将例如细胞、细胞裂解物或核酸,例如由其衍生的RNA或DNA储存到以后的日期,且表达文库在需要时在以后的日期生成。
一旦生成了表达载体的文库,则编码的抗体分子可在适当的表达系统中表达,并使用本领域公知和记载的适当技术进行筛选。因此,以上定义的本发明方法可包括在适当的表达系统中表达表达载体的文库,并且针对具有所需性质的抗体筛选表达文库的进一步的步骤。
如本文所表明的,通过本发明的方法制备的、包括编码抗体或TCR序列的多核苷酸的多核苷酸可包括但不限于,单独编码抗体或TCR片段的氨基酸序列的多核苷酸,整个抗体或TCR或其部分的非编码序列,抗体或TCR、片段或部分的编码序列,以及附加序列,诸如至少一个信号前导区或融合肽的编码序列,其具有或不具有上述的附加编码序列,诸如至少一个内含子,以及附加的非编码序列,包括但不限于非编码5’和3’序列,诸如在转录、RNA加工(包括剪接)和聚腺苷酸化信号(例如——核糖体结合和mRNA的稳定性)中起作用的转录的非翻译序列;编码附加氨基酸的附加编码序列,诸如提供附加功能性的序列。因此,编码抗体的序列可融合至标记序列,诸如编码帮助纯化包含抗体或TCR片段或部分的融合抗体或TCR的肽的序列。
然后初级PCR产物可任选地经历使用新的多核苷酸组的次级PCR反应,该多核苷酸组与抗体或TCR可变域VH、VLκ和VLλ或Vα和Vβ或Vγ和Vδ的5’和3’端杂交(视情况取决于使用新多核苷酸组的初级PCR反应是否经过设计以扩增重链或轻链抗体基因或Vα或VβTCR基因或Vγ或VδTCR基因的部分)。这些多核苷酸有利地包含对限定的一组限制酶具有特异性的DNA序列(即,限制酶位点)以供后续克隆。选定的限制酶必须进行选择以便不在人类抗体或TCR V-基因区段内切割。可基于已知且可公开获得的免疫球蛋白或TCR基因序列和限制酶数据库信息来设计这样的多核苷酸。然而,所包括的优选限制酶位点为NcoI、Hind III、MluI和NotI。这样的次级PCR反应的产物为多种V-重、V-轻κ和V-轻λ抗体片段/结构域的组库。因此,这种类型的次级PCR反应通常在以下情况时进行:感兴趣的表达文库形式为scFv或Fv形式,其中只存在抗体或TCR的VH和VL或Vα和Vβ或Vγ和Vδ结构域。
PCR产物还可经历采用与条码化多核苷酸的5’和3’端杂交的新引物组的PCR反应。这些多核苷酸可有利地包含对限定的一组限制酶具有特异性的DNA序列(即,限制酶位点)以供后续克隆。选定的限制酶必须进行选择以便不在人类抗体或TCR V-基因区段内切割。可基于已知且可公开获得的免疫球蛋白或TCR基因序列和限制酶数据库信息来设计这样的多核苷酸。然而,所包括的优选限制酶位点为NcoI、Hind III、MluI和NotI。这样的次级PCR反应的产物为各种VH、VLκ和VLλ抗体片段/结构域或Vα和Vβ或Vγ和VδTCR片段/结构域的组库。
该系统还可使用重链或轻链或Vα或Vβ链或Vγ或Vδ链Fv或Fab片段或者单链抗体或TCR。重链或轻链或Vα或Vβ链或Vγ或Vδ链可经诱变,然后向溶液中添加互补链。然后使两条链组合并形成功能性抗体片段。随机非特异性轻链或重链或Vα或Vβ链或Vγ或Vδ链序列的添加允许产生组合系统以生成多样性成员的文库。
如本文所定义的这类克隆片段组库的文库构成了本发明的其他方面,所述片段包含由免疫激发的宿主的B或T淋巴细胞衍生的抗体或TCR基因的可变重链或Vα链或Vγ链区域或其片段,和/或可变轻链或Vβ链或Vδ链区域或其片段。包含克隆的可变区的这些文库可任选地插入表达载体中以形成表达文库。
在一些实施方案中,可设置PCR反应以便保持分离的免疫细胞群体中含有的各种抗体或TCR链的全部或部分恒定区。这在以下情况时是理想的:表达文库形式为Fab形式,其中重链或α或γ链组分包含VH或Vα或Vγ和CH或Cα或Cγ结构域,且轻链或Vβ链或Vδ链组分包含VL或Vβ或Vδ链和CL或Cβ或Cδ结构域。同样,包含抗体或TCR链的所有或部分恒定区的这类克隆片段的文库构成了本发明的进一步的方面。
这些核酸可便利地包含除了本发明的多核苷酸之外的序列。例如,可将包含一个或多个核酸内切酶限制位点的多克隆位点插入核酸中,以帮助多核苷酸的分离。同样,可插入可翻译的序列以帮助分离本发明的翻译的多核苷酸。例如,六聚组氨酸标记序列提供了纯化本发明的蛋白质的便利方式。本发明的核酸,除了编码序列之外,任选地为用于克隆和/或表达本发明的多核苷酸的载体、衔接子或连接体。
附加序列可添加至这样的克隆和/或表达序列上,以优化它们在克隆和/或表达中的功能,帮助多核苷酸的分离,或改善多核苷酸向细胞内的引入。克隆载体、表达载体、衔接子和连接体的使用是本领域公知的。(参见例如,Ausubel,同上;或Sambrook,同上)。
本文所公开的文库可用于多种应用。如本文所用的,文库包含多个分子。在一些实施方案中,文库包含多个多核苷酸。在一些实施方案中,文库包含多个引物。在一些实施方案中,文库包含来自一个或多个多核苷酸、扩增子或扩增子集的多个序列读取。文库可多次储存并多次使用以生成用于分析的样品。一些应用包括,例如,对多态性进行基因型分型,研究RNA加工,和选择克隆代表来根据本文所提供的方法进行测序。可以生成包含多个多核苷酸的文库,诸如用于测序或扩增的引物或文库,其中多个多核苷酸包含至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000个或更多个分子条码或容器条码。在一些实施方案中,多核苷酸的文库包含多个至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000个或更多个独特的多核苷酸,其中每个独特的多核苷酸包含一个或多个分子条码和容器条码。
条码
分子条码如抗原分子条码包含对于单分子独特的信息,如亲和-寡核苷酸复合体中的单个寡核苷酸或来自单细胞或来自单个容器的多核苷酸分子。与来自不同单细胞或存在于不同单个容器中的多核苷酸相比,容器条码包含对于来自单细胞或存在于单个容器中的多核苷酸独特的信息。在一些实施方案中,所述独特的信息包含独特的核苷酸序列。例如,分子条码或容器条码的序列可通过确定含有该分子条码或容器条码的核苷酸的独特或随机序列的身份和顺序来确定。在一些实施方案中,独特的信息不能用于鉴别目标多核苷酸的序列。例如,分子条码可与一个目标多核苷酸相附接,但该分子条码不能用于确定其附接的目标多核苷酸。在一些实施方案中,独特的信息不是与目标多核苷酸的序列的身份相关联的已知序列。例如,容器条码可与一个或多个目标多核苷酸相附接,但该容器条码不能用于确定其附接的是该一个或多个目标多核苷酸中的哪一个。在一些实施方案中,独特的信息包含核苷酸的随机序列。在一些实施方案中,独特的信息包含多核苷酸上核苷酸的一个或多个独特序列。在一些实施方案中,独特的信息包含简并核苷酸序列或简并条码。简并条码可包含可变核苷酸碱基组成或序列。例如,简并条码可为随机序列。在一些实施方案中,分子条码或容器条码的互补序列也是分子条码或容器条码序列。
条码可包含任何长度的核苷酸。例如,本文所述的任何条码可具有2至36个核苷酸、4至36个核苷酸、或6至30个核苷酸、或8至20个核苷酸、2至20个核苷酸、4至20个核苷酸、或6至20个核苷酸范围内的长度。在某些方面,组内条码的解链温度彼此在10℃以内、彼此在5℃以内或彼此在2℃以内。在某些方面,组内条码的解链温度彼此不在10℃以内、彼此不在5℃以内或彼此不在2℃以内。在某些方面,条码是交叉杂交最低的组的成员。例如,这样的组中的每个成员的核苷酸序列可不同于该组中所有其他成员的核苷酸序列,其差异足以使得在严格的杂交条件下成员不能与任何其他成员的互补体形成稳定的双链体。在一些实施方案中,交叉杂交最低的组的每个成员的核苷酸序列与每个其他成员的核苷酸序列有至少两个核苷酸不同。条码技术描述于Winzeler等人.(1999)Science 285:901;Brenner(2000)Genome Biol.1:1Kumar等人.(2001)Nature Rev.2:302;Giaever等人.(2004)Proc.Natl.Acad.Sci.USA 101:793;Eason等人.(2004)Proc.Natl.Acad.Sci.USA 101:11046;以及Brenner(2004)Genome Biol.5:240。
例如,条码可包含至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸。例如,条码可包含最多约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸。在一些实施方案中,条码具有特定的核苷酸长度。例如,条码的长度可为约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸。
在一些实施方案中,多个条码中的每个条码具有至少约2个核苷酸。例如,多个条码中的每个条码的长度可以为至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸。在一些实施方案中,多个条码中的每个条码具有至多约1000个核苷酸。例如,多个条码中的每个条码的长度可以为至多约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸。
分子条码的数目可超过将在多个容器中标记的分子的总数目。容器条码的数目可超过将在多个容器中标记的分子的总数目。例如,分子条码或容器条码的数目可以是将在多个容器中标记的分子的总数目的至少约2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90或100倍。
不同分子条码的数目可超过将在多个容器中标记的分子的总数目。在一些实施方案中,不同分子条码的数目是将在多个容器中标记的分子的总数目的至少约1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90或100倍。
单个容器中不同分子条码的数目可超过将在单个容器中标记的不同分子的数目。在一些实施方案中,单个容器中不同分子条码的数目是将在单个容器中标记的不同分子的数目的至少约1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90或100倍。
不同容器条码的数目可小于将在多个容器中标记的分子的总数目。在一些实施方案中,不同容器条码的数目比将在多个容器中标记的分子的总数目小至少约1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90或100倍。
来自单个容器中容器条码化多核苷酸分子的扩增产物分子的数目可超过将在单个容器中标记的不同分子的数目。在一些实施方案中,来自单个容器中容器条码化多核苷酸分子的扩增产物分子的数目是将在单个容器中标记的不同分子的数目的至少约1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90或100倍。
单个容器中容器条码化多核苷酸分子的数目可小于将在单个容器中标记的不同分子的数目。在一些实施方案中,单个容器中容器条码化多核苷酸分子的数目比将在单个容器中标记的不同分子的数目小至少约1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90或100倍。
单个容器中容器条码化多核苷酸分子的数目可为一个分子。单个容器中非扩增的容器条码化多核苷酸分子的数目可为一个分子。
在一些实施方案中,至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%的不同分子条码具有相同的浓度。在一些实施方案中,至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%的不同容器条码具有相同的浓度。
在一些实施方案中,至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%的不同分子条码具有不同的浓度。在一些实施方案中,至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%的不同容器条码具有不同的浓度。
分子条码或容器条码群体中的分子条码或容器条码可具有至少10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个或更多个不同的序列。例如,群体中的分子条码或容器条码可具有至少2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000个或更多个不同的序列。因此,多个分子条码或容器条码可用于从一个或多个多核苷酸如目标多核苷酸生成至少10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个或更多个不同的序列。例如,多个分子条码或容器条码可用于从一个或多个多核苷酸如目标多核苷酸生成至少2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1x106、2x106、3x106、4x106、5x106、6x106、7x106、8x106、9x106、1x107、2x107、3x107、4x107、5x107、6x107、7x107、8x107、9x107、1x108、2x108、3x108、4x108、5x108、6x108、7x108、8x108、9x108、1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109、9x109、1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010、9x1010、1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011、9x1011、1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012、9x1012个或更多个不同的序列。例如,多个分子条码或容器条码可用于从至少约10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1x106、2x106、3x106、4x106、5x106、6x106、7x106、8x106、9x106、1x107、2x107、3x107、4x107、5x107、6x107、7x107、8x107、9x107、1x108、2x108、3x108、4x108、5x108、6x108、7x108、8x108、9x108、1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109、9x109、1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010、9x1010、1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011、9x1011、1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012、9x1012个或更多个目标多核苷酸生成至少约10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1x106、2x106、3x106、4x106、5x106、6x106、7x106、8x106、9x106、1x107、2x107、3x107、4x107、5x107、6x107、7x107、8x107、9x107、1x108、2x108、3x108、4x108、5x108、6x108、7x108、8x108、9x108、1x109、2x109、3x109、4x109、5x109、6x109、7x109、8x109、9x109、1x1010、2x1010、3x1010、4x1010、5x1010、6x1010、7x1010、8x1010、9x1010、1x1011、2x1011、3x1011、4x1011、5x1011、6x1011、7x1011、8x1011、9x1011、1x1012、2x1012、3x1012、4x1012、5x1012、6x1012、7x1012、8x1012、9x1012个或更多个不同的序列。
在一些实施方案中,一个或多个分子条码用于将序列分组或分箱。在一些实施方案中,一个或多个分子条码用于将序列分组或分箱,其中每个箱元中的序列含有相同的分子条码。在一些实施方案中,一个或多个分子条码或容器条码用于将序列分组或分箱,其中每个箱元中的序列包含扩增子集。在一些实施方案中,一个或多个分子条码用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于扩增反应中的相同多核苷酸分子。
在一些实施方案中,一个或多个容器条码用于将序列分组或分箱。在一些实施方案中,一个或多个容器条码用于将序列分组或分箱,其中每个箱元中的序列含有相同的容器条码。在一些实施方案中,一个或多个容器条码用于将序列分组或分箱,其中每个箱元中的序列包含一个或多个扩增子集。在一些实施方案中,一个或多个容器条码用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于来自单个容器或单细胞的多核苷酸。
在一些实施方案中,使用一个或多个AID序列将序列分组或分箱。在一些实施方案中,使用一个或多个AID序列将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列。在一些实施方案中,使用一个或多个AID序列将序列分组或分箱,其中每个箱元中的序列包含一个或多个扩增子集。在一些实施方案中,使用一个或多个AID序列将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于来自单个容器或单细胞的多核苷酸。
在一些实施方案中,使用一个或多个AMB序列将序列分组或分箱。在一些实施方案中,使用一个或多个AMB序列将序列分组或分箱,其中每个箱元中的序列含有相同的AMB序列。在一些实施方案中,使用一个或多个AMB序列将序列分组或分箱,其中每个箱元中的序列包含一个或多个扩增子集。在一些实施方案中,使用一个或多个AMB序列将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于来自单个容器或单细胞的多核苷酸。
在一些实施方案中,使用一个或多个AID序列和AMB序列将序列分组或分箱。在一些实施方案中,使用一个或多个AID序列和AMB序列将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列。在一些实施方案中,使用一个或多个AID序列和AMB序列将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列和不同的AMB序列。在一些实施方案中,使用一个或多个AID序列和AMB序列将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列和相同的AMB序列。在一些实施方案中,使用一个或多个AID序列和AMB序列将序列分组或分箱,其中每个箱元中的序列包含一个或多个扩增子集。在一些实施方案中,使用一个或多个AID序列和AMB序列将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于扩增反应中以及来自相同的单细胞或容器的相同的多核苷酸。
在一些实施方案中,使用一个或多个容器条码和AMB序列将序列分组或分箱。在一些实施方案中,使用一个或多个容器条码和AMB序列将序列分组或分箱,其中每个箱元中的序列含有相同的容器条码。在一些实施方案中,使用一个或多个容器条码和AMB序列将序列分组或分箱,其中每个箱元中的序列含有相同的容器条码和不同的AMB序列。在一些实施方案中,使用一个或多个容器条码和AMB序列将序列分组或分箱,其中每个箱元中的序列含有相同的容器条码和相同的AMB序列。在一些实施方案中,使用一个或多个容器条码和AMB序列将序列分组或分箱,其中每个箱元中的序列包含一个或多个扩增子集。在一些实施方案中,使用一个或多个容器条码和AMB序列将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于扩增反应中以及来自相同的单细胞或容器的相同的多核苷酸。
在一些实施方案中,使用一个或多个AID序列和容器条码将序列分组或分箱。在一些实施方案中,使用一个或多个AID序列和容器条码将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列。在一些实施方案中,使用一个或多个AID序列和容器条码将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列和相同的容器条码。在一些实施方案中,使用一个或多个AID序列和容器条码将序列分组或分箱,其中每个箱元中的序列包含一个或多个扩增子集。在一些实施方案中,使用一个或多个AID序列和容器条码将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于扩增反应中以及来自相同的单细胞或容器的相同的多核苷酸。
在一些实施方案中,使用一个或多个分子条码和容器条码将序列分组或分箱。在一些实施方案中,使用一个或多个分子条码和容器条码将序列分组或分箱,其中每个箱元中的序列含有相同的分子条码和相同的容器条码。在一些实施方案中,使用一个或多个分子条码和容器条码将序列分组或分箱,其中每个箱元中的序列包含一个或多个扩增子集。在一些实施方案中,使用一个或多个分子条码和容器条码将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于扩增反应中的相同多核苷酸且来自相同的单细胞或容器。在一些实施方案中,不使用一个或多个分子条码和容器条码来比对序列。
在一些实施方案中,不使用一个或多个分子条码来比对序列。在一些实施方案中,使用一个或多个分子条码来比对序列。在一些实施方案中,使用一个或多个分子条码将序列分组或分箱,且使用目标特异性区域来比对序列。在一些实施方案中,不使用一个或多个容器条码来比对序列。在一些实施方案中,使用一个或多个容器条码来比对序列。在一些实施方案中,使用一个或多个容器条码将序列分组或分箱,且使用目标特异性区域来比对序列。在一些实施方案中,使用一个或多个分子条码和容器条码来比对序列。在一些实施方案中,使用一个或多个分子条码和容器条码将序列分组或分箱,且使用目标特异性区域来比对序列。
在一些实施方案中,比对的序列含有相同的AID。在一些实施方案中,比对的序列含有相同的AMB。在一些实施方案中,比对的序列含有相同的AID和AMB。在一些实施方案中,比对的序列含有相同的AID和容器条码。在一些实施方案中,比对的序列含有相同的AMB和容器条码。在一些实施方案中,比对的序列含有相同的分子条码。在一些实施方案中,比对的序列含有相同的容器条码。在一些实施方案中,比对的序列含有相同的分子条码和容器条码。在一些实施方案中,使用一个或多个分子条码或容器条码来比对序列,其中比对的序列包含来自扩增子集的两个或更多个序列。在一些实施方案中,使用一个或多个分子条码或容器条码来比对序列,其中比对的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于扩增反应中的相同多核苷酸分子。在一些实施方案中,使用一个或多个分子条码或容器条码来比对序列,其中比对的序列包含多个序列,其中从中生成该多个序列的多核苷酸来源于单细胞或单个容器。
小液滴生成
将多个细胞的样品分成小反应体积,结合来自或来源于来自所述多个细胞的单个细胞的多核苷酸的分子和容器条码化,可使得能够对序列如生物标志物序列的组库进行高通量测序。
将多个细胞的样品分成小反应体积,结合来自或来源于来自所述多个细胞的单个细胞的多核苷酸的分子和容器条码化,可使得能够对序列(诸如代表生物体的转录物组的百分比的序列)的组库进行高通量测序。例如,序列组库可包含多个序列,所述序列代表生物体的转录物组的至少约0.00001%、0.00005%、0.00010%、0.00050%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、30%、35%、40%、45、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%。
将免疫细胞的样品分成小反应体积,结合来自或来源于来自所述多个免疫细胞的单个免疫细胞的多核苷酸的分子和容器条码化,可使得能够对重链和轻链序列的组库进行高通量测序。这些方法还可允许在基于条码化序列的测序后将重链和轻链配对。如本文所述将样品分成小反应体积还可使得能够使用减少的试剂量,从而降低该分析的材料成本。
在一些情况下,逆转录反应和/或扩增反应(例如,PCR)在小液滴中进行,诸如在小液滴数字PCR中。在某些方面,本发明提供了流体区室以包含所有或部分的目标材料。在一些实施方案中,区室为小液滴。当在本说明书各处提及“小液滴”时,除非另有说明,该术语与流体区室和流体分区可互换使用。除非另有说明,为了方便起见使用“小液滴”,并且可使用任何流体分区或区室。本文所使用的小液滴可包括乳液组合物(或两种或多种不混溶流体的混合物),诸如美国专利号7,622,280中所述。可通过WO/2010/036352中所述的装置生成小液滴。如本文所述,术语乳液可指不混溶液体(诸如油和水)的混合物。油相和/或油包水乳液允许水性小液滴内反应混合物的区室化。乳液可含有连续油相中的水性小液滴。本文所提供的乳液可为水包油乳液,其中小液滴为连续水相中的油小液滴。本文所提供的小液滴被设计用于防止区室间的混合,每个区室保护其内容物不蒸发且不与其他区室的内容物聚结。
本文所述的混合物或乳液可为稳定或不稳定的。该乳液可为相对稳定的,且具有最小的聚结。当小的小液滴合并以形成逐渐更大的小液滴时发生聚结。在一些情况下,由小液滴生成器生成的少于0.00001%、0.00005%、0.00010%、0.00050%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%或10%的小液滴与其他小液滴聚结。该乳液还可具有有限的絮凝,这是分散相从悬浮液中以薄片形式生成的过程。
可生成具有约、小于约、或大于约、或至少约0.001、0.01、0.05、0.1、1、5、10、20、30、40、50、60、70、80、100、120、130、140、150、160、180、200、300、400或500微米的平均直径的小液滴。小液滴可具有约0.001至约500、约0.01至约500、约0.1至约500、约0.1至约100、约0.01至约100、约1至约100微米的平均直径。使用微通道交叉流聚焦或物理搅拌产生乳液小液滴的微流体方法已知用于产生单分散或多分散乳液。该小液滴可为单分散小液滴。可生成小液滴以使得小液滴的大小变化不超过小液滴平均大小的加或减5%。在一些情况下,生成小液滴以使得小液滴的大小变化不超过小液滴平均大小的加或减2%。小液滴生成器可从单个样品生成小液滴群体,其中小液滴的大小变化都不超过小液滴总群体的平均大小的加或减约0.1%、0.5%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%或10%。
更高的机械稳定性对微流体操作和更高剪切的流体处理可能是有用的(例如,在微流体毛细管中或通过流体路径中的90度转角,诸如阀门时)。预先和随后热处理的小液滴或胶囊对于标准移液管操作和离心可以是机械稳定的。
可通过使油相流动穿过水性样品来形成小液滴。水相可包含用于进行扩增反应的缓冲溶液和试剂,包括细胞、核苷酸、核苷酸类似物、分子条码化多核苷酸、容器条码化多核苷酸、模板核酸和酶,诸如DNA聚合酶、RNA聚合酶和/或逆转录酶。
水相可包含具有或不具有固体表面如珠子的用于进行扩增反应的缓冲溶液和试剂。缓冲溶液可包含约、多于约或少于约1、5、10、15、20、30、50、100或200mM Tris。在一些情况下,氯化钾的浓度可为约、大于约或小于约10、20、30、40、50、60、80、100或200mM。缓冲溶液可包含约15mM Tris和50mM KCl。核苷酸可包括脱氧核苷三磷酸分子,包括dATP、dCTP、dGTP和dTTP,每种的浓度为约、大于约或小于约50、100、200、300、400、500、600或700μm。在一些情况下,dUTP在水相中添加到约、大于约或小于约50、100、200、300、400、500、600或700、800、900或1000μm的浓度。在一些情况下,将氯化镁(MgCl2)或乙酸镁以约、大于约或小于约1.0、2.0、3.0、4.0或5.0mM的浓度添加到水相。MgCl2的浓度可为约3.2mM。在一些情况下,使用乙酸镁或镁。在一些情况下,使用硫酸镁。
可使用诸如BSA或来自牛皮肤的明胶的非特异性封闭剂,其中明胶或BSA的浓度范围为约0.1-0.9%w/v。其他可能的封闭剂可包括β乳球蛋白、酪蛋白、奶粉或其他常见的封闭剂。在一些情况下,BSA和明胶的优选浓度为约0.1%w/v。
水相中用于扩增的引物可具有约、大于约或小于约0.05、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.2、1.5、1.7或2.0μm的浓度。水相中的引物浓度可为约0.05至约2、约0.1至约1.0、约0.2至约1.0、约0.3至约1.0、约0.4至约1.0或约0.5至约1.0μm。引物的浓度可为约0.5μm。在PCR中对于目标核酸浓度适用的范围包括但不限于约1pg至约500ng。
在一些情况下,水相还可包含添加剂,包括但不限于非特异性背景/封闭核酸(例如,鲑精DNA)、生物防腐剂(例如,叠氮化钠)、PCR增强剂(例如,甜菜碱、海藻糖等)和抑制剂(例如,RNA酶抑制剂)。其他添加剂可包括,例如,二甲亚砜(DMSO)、甘油、甜菜碱(单)水合物(N,N,N-三甲基甘氨酸=[羧甲基]三甲基铵)、海藻糖、7-脱氮-2’-脱氧鸟苷三磷酸(dC7GTP或7-脱氮-2’-dGTP)、BSA(牛血清蛋白)、甲酰胺(formamide/methanamide)、四甲基氯化铵(TMAC)、其他四烷基铵衍生物(例如,四乙基氯化铵(TEA-Cl)和四丙基氯化铵(TPrA-Cl)、非离子型去污剂(例如,Triton X-100、吐温20、Nonidet P-40(NP-40))或PREXCEL-Q。在一些情况下,水相可包含0、1、2、3、4、5、6、7、8、9或10种不同添加剂。在其他情况下,水相可包含至少0、1、2、3、4、5、6、7、8、9或10种不同添加剂。
在一些情况下,非离子型环氧乙烷/环氧丙烷嵌段共聚物可以约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%或1.0%的浓度添加到水相。常见的生物表面活性剂包括非离子型表面活性剂,诸如Pluronic F-68、Tetronics和Zonyl FSN。Pluronic F-68可以约0.5%w/v的浓度存在。
在一些情况下,硫酸镁可以相似浓度替代氯化镁。来自多个供应商的广泛的常见、商用PCR缓冲液可替代缓冲溶液。
可配制乳液以产生高度单分散的具有液体样界面膜的小液滴,该小液滴可通过加热转化为具有固体样界面膜的微胶囊;这样的微胶囊可表现为能够保持它们的内容物经过反应过程如PCR扩增的生物反应器。转化为微胶囊形式一经加热即可发生。例如,这样的转化可在大于约50℃、60℃、70℃、80℃、90℃或95℃的温度下发生。在一些情况下,使用热循环仪发生该加热。在加热过程中,可使用流体或矿物油覆盖物防止蒸发。在加热之前可去除或可不去除过量的连续相油。生物相容的胶囊可在广泛的热和机械处理中抵抗聚结和/或絮凝。在转化后,胶囊可储存于约、大于约或小于约3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、15℃、20℃、25℃、30℃、35℃或40℃下。这些胶囊可在生物医学应用中有用,诸如稳定、数字化封装大分子,特别是含有核酸或蛋白质或二者的混合物的水性生物流体;药物和疫苗递送;生物分子文库;临床成像应用和其他。
微胶囊可含有一种或多种多核苷酸,并可抵抗聚结,特别是在高温下。因此,PCR扩增反应可以非常高的密度发生(例如,每单位体积的反应数目)。在一些情况下,每ml可发生大于100,000、500,000、1,000,000、1,500,000、2,000,000、2,500,000、5,000,000或10,000,000个单独的反应。在一些情况下,反应在单个孔(例如微量滴定板的孔)中发生,在反应体积之间没有相互混合。微胶囊还可含有使逆转录、引物延伸和/或PCR反应能够发生所必需的其他组分,例如,引物、探针、dNTP、DNA或RNA聚合酶等。这些胶囊在广泛的热和机械处理中展现出对聚结和絮凝的抗性。
在一些情况下,通过进行数字PCR,诸如基于微流体的数字PCR或小液滴数字PCR,进行扩增步骤。
可使用微流体系统或装置生成小液滴。如本文所用的,“微-”前缀(例如,“微通道”或“微流体”)通常是指具有小于约1mm,且在一些情况下小于约100微米(micron/micrometer)的宽度或直径的元件或物品。在一些情况下,该元件或物品包括流体可流动穿过的通道。另外,如本文所用的“微流体”是指包含至少一个微型通道的设备、装置或系统。
微流体系统和装置已经在多个情境下描述,典型地是在微型化实验室(例如,临床)分析的情境下。其他用途也已经描述。例如,国际专利申请公开号WO 01/89788;WO2006/040551;WO 2006/040554;WO 2004/002627;WO 2008/063227;WO 2004/091763;WO2005/021151;WO 2006/096571;WO 2007/089541;WO 2007/081385和WO 2008/063227。
小液滴通常在第二载流中包含一定量的第一样品流。本发明的方法可使用本领域已知的用于形成小液滴的任何技术。示例性的方法包括使含有目标材料(例如,免疫细胞)的样品流体流流动,以便其与流动载流的两股相对流相交。载流与样品流不混溶。样品流与流动载流的两股相对流的相交导致将样品流体分隔为含有目标材料的单独样品小液滴。
载流可为与样品流体不混溶的任何流体。示例性的载流为油。在某些实施方案中,载流包含表面活性剂。
相同的方法可用于创建含有其他试剂的单个小液滴,该其他试剂例如是用于扩增反应如聚合酶链反应(PCR)、或非基于PCR的扩增反应如多链置换扩增、或本领域普通技术人员已知的其他方法的试剂。用于进行基于PCR扩增反应的合适的试剂为本领域普通技术人员已知的,且包括但不限于DNA聚合酶、正向和反向引物、脱氧核苷三磷酸(dNTP)和一种或多种缓冲液。
在某些实施方案中,通过提供包含目标材料(例如,免疫细胞和/或固体支持体,如珠子)的第一流体分区(例如,小液滴)和第二流体(例如,作为液流或位于小液滴内)形成流体隔室。合并第一和第二流体以形成小液滴。可通过将电场施加于两种流体来完成合并。在某些实施方案中,第二流体含有用于进行诸如聚合酶链反应或扩增反应的扩增反应的试剂。
在某些方面,本发明提供了制备独特条码化重链和轻链抗体序列和/或α和β链TCR序列和/或γ和δ链TCR序列的文库的方法,包括获得多个核酸构建体,其中每个构建体包含独特的N-聚体和功能性N-聚体。功能性N-聚体可为随机N-聚体、PCR引物、通用引物、抗体、粘性末端或任何其他序列。该方法可包括制备M组N个流体隔室,每个隔室含有独特构建体的一个或多个拷贝。该方法可通过向组中的每个隔室添加另外的构建体来创建具有更高复杂性的条码文库,并对每个组重复此步骤,以产生N×M个隔室,每个含有独特的一对构建体。可杂交或连接该对,以产生新构建体。在条码文库中的每个构建体中,每种独特的N-聚体可适用于通过测序、探针杂交、其他方法或方法的组合来鉴别。
小液滴文库
通常,小液滴文库由在单个集合中合并在一起的许多文库元件组成。文库的复杂性可从单个文库元件到1x1015个文库元件或更多不等。每个文库元件是固定浓度的一种或多种给定的组分。该元件可为但不限于细胞、珠子、氨基酸、蛋白质、多肽、核酸、多核苷酸或小分子化合物。该元件可含有标识符,诸如分子条码或容器条码或二者。
细胞文库元件可包括但不限于杂交瘤、B细胞、T细胞、原代细胞、培养的细胞系、癌症细胞、干细胞或任何其他细胞类型。通过将一千到上万个数目的细胞封装在单个小液滴中来制备细胞文库元件。封装细胞的数目通常由来自细胞的数量密度和小液滴体积的Poisson统计给出。然而,在一些情况下,该数目偏离Poisson统计,如Edd等人,Lab Chip,8(8):1262-1264,2008中所述。细胞的离散性质允许用多个细胞变体诸如各自产生一种抗体或TCR的免疫细胞大量制备文库,所有都存在于单一的起始介质中,然后该介质分解为含有最多一个细胞的单个小液滴胶囊。然后裂解单个小液滴胶囊中的细胞,用分子条码和容器条码对来自裂解细胞的重链和轻链多核苷酸和/或α和β链多核苷酸和/或γ和δ链多核苷酸进行条码化,并扩增,然后组合或合并以形成由重链和轻链和/或α和β链和/或γ和δ链文库元件组成的文库。
基于珠子的文库元件含有一个或多个珠子,并且还可含有其他试剂,诸如抗体、酶或其他蛋白质。在所有文库元件都含有不同类型的珠子但含有相同的周围介质的情况下,所有文库元件都可从单一起始流体制备,或具有多个起始流体。在从变体的集合大量制备细胞文库的情况下,将从多个起始流体制备文库元件。当以多个细胞开始时,期望每滴恰好具有一个细胞,只有少量小液滴含有超过一个细胞。在一些情况下,可达到相对于Poisson统计的变化以提供增强的小液滴装载,以便更多小液滴恰好每个小液滴具有一个细胞,并且空小液滴或含有超过一个细胞的小液滴的例外极少。
在一些实施方案中,当从多个容器条码化多核苷酸开始时,期望每滴恰好具有一个容器条码化多核苷酸,只有少量小液滴含有超过一个容器条码化多核苷酸。在一些情况下,可达到相对于Poisson统计的变化以提供增强的小液滴装载,以便更多小液滴恰好每个小液滴具有一个容器条码化多核苷酸,并且空小液滴或含有超过一个容器条码化多核苷酸的小液滴的例外极少。
小液滴文库的实例是具有不同内容物的小液滴的集合,该内容物的范围包括珠子、细胞、小分子、DNA、引物、抗体和分子条码。小液滴的直径大小范围从大致0.5微米到500微米,其相当于约1皮升到1纳升。然而,小液滴可小到5微米且大到500微米。优选地,小液滴的直径为小于100微米,约1微米至约100微米。最优选的直径大小为约20至40微米(10至100皮升)。对小液滴文库检查的优选性质包括渗透压平衡、均匀大小和大小范围。
由本发明提供的小液滴文库中包含的小液滴优选大小均匀。也就是说,当与相同文库中其他小液滴的直径相比时,文库中任何小液滴的直径的变化将小于5%、4%、3%、2%、1%或0.5%。文库中小液滴的均匀大小对维持小液滴的稳定性和完整性可能非常关键,并且可能还对文库中的小液滴随后用于本文所述的各种生物和化学分析非常重要。
本发明提供了包含不混溶流体内的多个水性小液滴的小液滴文库,其中每个小液滴优选是基本上大小均匀的,且包含不同的文库元件。本发明提供了用于形成小液滴文库的方法,其包括提供包含不同文库元件的单个水性流体,将每个文库元件封装进不混溶流体中的水性小液滴内。
在某些实施方案中,将不同类型的元件(例如,细胞或珠子)合并在相同介质中含有的单个来源中。在初始合并后,将元件封装在小液滴中,以形成小液滴的文库,其中具有不同类型珠子或细胞的每个小液滴均为不同的文库元件。对初始溶液的稀释允许封装过程。在一些实施方案中,形成的小液滴将含有单个元件或将不含任何物体,即为空的。在其他实施方案中,形成的小液滴将含有文库元件的多个拷贝。封装的元件通常为某种类型的变体。在一个实例中,元件为血液样品的免疫细胞,且封装每个免疫细胞以对免疫细胞中核苷酸的抗体序列进行扩增并条码化。
例如,在一种类型的乳液文库中,存在的文库元件具有不同的粒子,即不同介质中的细胞或条码化多核苷酸,并且在合并之前封装。在一个实例中,在不同介质中包含指定数目的文库元件,即n个数目的不同细胞或条码化多核苷酸。每个文库元件分开乳化并合并,在该点处,n个合并的不同文库元件中的每一个组合并合并成单个集合体。产生的集合体含有多个油包水乳液小液滴,每个含有不同类型的粒子。
在一些实施方案中,形成的小液滴将含有单个文库元件或将不含任何物体,即为空的。在其他实施方案中,形成的小液滴将含有文库元件的多个拷贝。珠子的内容物遵循Poisson分布,其中存在离散概率分布,其表达了如果若干事件以已知的平均率发生,且独立于自上一次事件以来的时间,则这些事件在固定的时间段内发生的概率。用于创建文库的油和表面活性剂防止了小液滴之间文库内容物的交换。
引物
通常,在扩增反应中可使用一对或多对引物;引物对的一个引物可为正向引物且引物对的一个引物可为反向引物。
在一些情况下,在扩增反应中可使用第一对引物;第一对的一个引物可为与第一目标多核苷酸分子的序列互补的正向引物,且第一对的一个引物可为可与第一目标多核苷酸分子的第二序列互补的反向引物,且第一目标基因座可位于第一序列与第二序列之间。在一些实施方案中,第一目标基因座包含VH或Vα或Vγ序列。在一些实施方案中,第一目标基因座包含AID序列和/或AMB序列。
在一些情况下,在扩增反应中可使用第二对引物;第二对的一个引物可为与第二目标多核苷酸分子的第一序列互补的正向引物,且第二对的一个引物可为与第二目标多核苷酸分子的第二序列互补的反向引物,且第二目标基因座可位于第一序列与第二序列之间。在一些实施方案中,第二目标基因座包含VL或Vβ或Vδ序列。
在一些情况下,在扩增反应中可使用第三对引物;第三对的一个引物可为与第三目标多核苷酸分子的第一序列互补的正向引物,且第三对的一个引物可为与第三目标多核苷酸分子的第二序列互补的反向引物,且第三目标基因座可位于第一序列与第二序列之间。在一些实施方案中,第三目标基因座包含条码,诸如分子条码或容器条码。
正向引物和反向引物的长度可取决于目标多核苷酸的序列和目标基因座。例如,可优化正向引物和反向引物的长度和/或TM。在一些情况下,引物的长度可为约、大于约或小于约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。在一些情况下,引物的长度为约15至约20、约15至约25、约15至约30、约15至约40、约15至约45、约15至约50、约15至约55、约15至约60、约20至约25、约20至约30、约20至约35、约20至约40、约20至约45、约20至约50、约20至约55或约20至约60个核苷酸。
在与模板多核苷酸结合之前,引物可为单链DNA。在一些情况下,引物最初含有双链序列。引物的适当长度可取决于引物的预期用途,但范围可为约6至约50个核苷酸,或约15至约35个核苷酸。短引物分子通常可需要更冷的温度以与模板形成足够稳定的杂合复合体。在一些实施方案中,引物不需要反映模板核酸的准确序列,但可足够互补以与模板杂交。在一些情况下,在与模板多核苷酸结合前,引物可为部分双链的。具有双链序列的引物可具有约、大于约或小于约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个碱基的发夹环。引物的双链部分可为约、大于约或小于约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个碱基对。用于扩增给定目标序列的合适引物的设计是本领域公知的。
引物可包含附加特征,该特征允许检测或固定引物,但不改变引物的基本性质(例如,作为DNA合成的起始点)。例如,引物可在5’端含有附加核酸序列,该序列不与目标核酸杂交,但其促进克隆或进一步的扩增,或对扩增产物的测序。例如,该附加序列可包含引物结合位点,诸如通用引物结合位点。本文可将与模板足够互补以杂交的引物区域称作杂交区域。
在另一种情况下,本文所述的方法和组合物中所采用的引物可包含一个或多个通用核苷。通用核苷的非限制性实例为5-硝基吲哚和肌苷,如美国申请公开号2009/0325169和2010/0167353中所述。
可根据已知参数设计引物,以便避免二级结构和自身杂交。不同的引物对可在大约相同的温度下退火和解链,例如,在另一个引物对的1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃或10℃内。在一些情况下,最初使用多于1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、100、200、500、1000、5000、10,000个或更多个引物。这样的引物可与本文所述的目标多核苷酸杂交。
可通过多种方法制备引物,包括但不限于使用本领域公知的方法克隆适当的序列和直接化学合成(Narang等人,Methods Enzymol.68:90(1979);Brown等人,MethodsEnzymol.68:109(1979))。还可从商业来源获得引物。引物可具有相同的解链温度。引物可具有不相同的解链温度。引物的长度可在5’端或3’端延伸或缩短,以产生具有所需解链温度的引物。引物对的一个引物可比另一个引物长。引物对中引物的3’退火长度可不同。同样,可设计引物对的退火位置,以使得引物对的序列和长度产生所需的解链温度。用于确定小于25个碱基对的引物的解链温度的等式为Wallace规则(TM=2(A+T)+4(G+C))。还可使用计算机程序设计引物。可使用软件程序计算每个引物的TM(解链或退火温度)。在任何扩增循环(包括但不限于循环1、2、3、4、5、循环6-10、循环10-15、循环15-20、循环20-25、循环25-30、循环30-35或循环35-40)后,引物的退火温度可重新计算并提高。在扩增的初始循环后,引物的5’一半可从每个感兴趣的基因座并入产物中;因此可基于每个引物的5’一半和3’一半两者的序列重新计算TM
引物位点包括引物杂交的模板区域。在一些实施方案中,引物能够作为模板指导的核酸合成的起始点。例如,当存在四种不同的核苷酸和聚合试剂或酶如DNA或RNA聚合酶或逆转录酶时,引物可启动模板指导的核酸合成。引物对包含2个引物:具有与模板序列的5’端杂交的5’上游区的第一引物,以及具有与模板序列的3’端的互补体杂交的3’下游区的第二引物。引物组包含两个或更多个引物:具有与模板序列或多个模板序列的5’端杂交的5’上游区的第一引物或第一多个引物,以及具有与模板序列或多个模板序列的3’端的互补体杂交的3’下游区的第二引物或第二多个引物。在一些实施方案中,引物包含目标特异性序列。在一些实施方案中,引物包含样品条码序列。在一些实施方案中,引物包含通用引发序列。在一些实施方案中,引物包含PCR引发序列。在一些实施方案中,引物包含用于启动多核苷酸扩增的PCR引发序列。(Dieffenbach,PCR Primer:A Laboratory Manual,第二版(Cold Spring Harbor Press,New York(2003))。通用引物结合位点或序列允许通用引物与多核苷酸和/或扩增子附接。通用引物是本领域公知的,并且包括但不限于-47F(M13F)、alfaMF、AOX3’、AOX5’、BGHr、CMV-30、CMV-50、CVMf、LACrmt、lamgda gt10F、lambda gt10R、lambda gt11F、lambda gt11R、M13rev、M13Forward(-20)、M13Reverse、male、p10SEQPpQE、pA-120、pet4、pGAP Forward、pGLRVpr3、pGLpr2R、pKLAC14、pQEFS、pQERS、pucU1、pucU2、reversA、seqIREStam、seqIRESzpet、seqori、seqPCR、seqpIRES-、seqpIRES+、seqpSecTag、seqpSecTag+、seqretro+PSI、SP6、T3-prom、T7-prom和T7-termInv。如本文所用的,附接可指共价相互作用和非共价相互作用两者或之一。通用引物与通用引物结合位点的附接可用于多核苷酸和/或扩增子的扩增、检测和/或测序。通用引物结合位点可包含至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个核苷酸或碱基对。在另一个实例中,通用引物结合位点包含至少约1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500或10000个核苷酸或碱基对。在一些实施方案中,通用引物结合位点包含1-10、10-20、10-30或10-100个核苷酸或碱基对。在一些实施方案中,通用引物结合位点包含约1-90、1-80、1-70、1-60、1-50、1-40、1-30、1-20、1-10、2-90、2-80、2-70、2-60、2-50、2-40、2-30、2-20、2-10、1-900、1-800、1-700、1-600、1-500、1-400、1-300、1-200、1-100、2-900、2-800、2-700、2-600、2-500、2-400、2-300、2-200、2-100、5-90、5-80、5-70、5-60、5-50、5-40、5-30、5-20、5-10、10-90、10-80、10-70、10-60、10-50、10-40、10-30、10-20、10-10、5-900、5-800、5-700、5-600、5-500、5-400、5-300、5-200、5-100、10-900、10-800、10-700、10-600、10-500、10-400、10-300、10-200、10-100、25-900、25-800、25-700、25-600、25-500、25-400、25-300、25-200、25-100、100-1000、100-900、100-800、100-700、100-600、100-500、100-400、100-300、100-200、200-1000、200-900、200-800、200-700、200-600、200-500、200-400、200-300、300-1000、300-900、300-800、300-700、300-600、300-500、300-400、400-1000、400-900、400-800、400-700、400-600、400-500、500-1000、500-900、500-800、500-700、500-600、600-1000、600-900、600-800、600-700、700-1000、700-900、700-800、800-1000、800-900或900-1000个核苷酸或碱基对。
引物可具有与其在合成引物延伸产物中的应用相匹配的长度。引物可为长度为8-200个核苷酸的多核苷酸。引物的长度可取决于模板多核苷酸的序列和模板基因座。例如,可优化引物或引物组的长度和/或解链温度(TM)。在一些情况下,引物的长度可为约、大于约或小于约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或60个核苷酸。在一些实施方案中,引物的长度为约8-100个核苷酸,例如10-75、15-60、15-40、18-30、20-40、21-50、22-45、25-40、7-9、12-15、15-20、15-25、15-30、15-45、15-50、15-55、15-60、20-25、20-30、20-35、20-45、20-50、20-55或20-60个核苷酸的长度和之间的任何长度。在一些实施方案中,引物的长度为最多约10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个核苷酸。
通常,在指数扩增反应中可使用一对或多对引物;引物对的一个引物可为正向引物且引物对的一个引物可为反向引物。在一些实施方案中,在指数扩增反应中可使用第一对引物;第一对的一个引物可为与第一模板多核苷酸分子的序列互补的正向引物,且第一对的一个引物可为与第一模板多核苷酸分子的第二序列互补的反向引物,且第一模板基因座可位于第一序列与第二序列之间。在一些实施方案中,在扩增反应中可使用第二对引物;第二对的一个引物可为与第二目标多核苷酸分子的第一序列互补的正向引物,且第二对的一个引物可为与第二目标多核苷酸分子的第二序列互补的反向引物,且第二目标基因座可位于第一序列与第二序列之间。在一些实施方案中,第二目标基因座包含可变轻链抗体序列。在一些实施方案中,在扩增反应中可使用第三对引物;第三对的一个引物可为与第三模板多核苷酸分子的第一序列互补的正向引物,且第三对的一个引物可为与第三模板多核苷酸分子的第二序列互补的反向引物,且第三模板基因座可位于第一序列与第二序列之间。
所述一个或多个引物可与多个模板多核苷酸的至少一部分退火。所述一个或多个引物可与所述多个模板多核苷酸的3’端和/或5’端退火。所述一个或多个引物可与所述多个模板多核苷酸的内部区域退火。该内部区域可以距所述多个模板多核苷酸的3’端或5’端至少约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸。所述一个或多个引物可包含固定的引物组。所述一个或多个引物可包含至少一个或多个定制引物。所述一个或多个引物可包含至少一个或多个控制引物。所述一个或多个引物可包含至少一个或多个管家基因引物。所述一个或多个引物可包含通用引物。该通用引物可与通用引物结合位点退火。在一些实施方案中,所述一个或多个定制引物与SBC、目标特异性区域、其互补体或其任意组合退火。所述一个或多个引物可包含通用引物。可设计所述一个或多个引物以扩增或进行引物延伸、逆转录、线性延伸、非指数扩增、指数扩增、PCR或一个或多个目标或模板多核苷酸的任何其他扩增方法。
目标特异性区域可包含至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸或碱基对。在另一个实例中,目标特异性区域包含至少约1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500或10000个核苷酸或碱基对。在一些实施方案中,目标特异性区域包含约5-10、10-15、10-20、10-30、15-30、10-75、15-60、15-40、18-30、20-40、21-50、22-45、25-40、7-9、12-15、15-20、15-25、15-30、15-45、15-50、15-55、15-60、20-25、20-30、20-35、20-45、20-50、20-55、20-60、2-900、2-800、2-700、2-600、2-500、2-400、2-300、2-200、2-100、25-900、25-800、25-700、25-600、25-500、25-400、25-300、25-200、25-100、100-1000、100-900、100-800、100-700、100-600、100-500、100-400、100-300、100-200、200-1000、200-900、200-800、200-700、200-600、200-500、200-400、200-300、300-1000、300-900、300-800、300-700、300-600、300-500、300-400、400-1000、400-900、400-800、400-700、400-600、400-500、500-1000、500-900、500-800、500-700、500-600、600-1000、600-900、600-800、600-700、700-1000、700-900、700-800、800-1000、800-900或900-1000个核苷酸或碱基对。
可根据已知参数设计引物,以便避免二级结构和自身杂交。在一些实施方案中,不同的引物对可在大约相同的温度下退火和解链,例如,在另一个引物对的1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃或10℃内。在一些实施方案中,多个引物中的一个或多个引物可在大约相同的温度下退火和解链,例如,在多个引物中另一个引物的1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃或10℃内。在一些实施方案中,多个引物中的一个或多个引物可在与所述多个引物中另一个引物不同的温度下退火和解链。
用于本文所述方法的一个或多个步骤的多个引物可包括多个引物,其包含约、最多约或至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000个不同引物。例如,多个引物中的每个引物可包含不同的目标或模板特异性区域或序列。
逆转录
在一些情况下,通过逆转录从RNA制备目标多核苷酸。在一些情况下,通过引物延伸,诸如使用聚合酶,从DNA制备目标多核苷酸。
本文所述的方法可在耦合的逆转录-PCR(逆转录-PCR)中使用。例如,逆转录和PCR可在两个不同的步骤中进行。首先,可使用多核苷酸dT引物、序列特异性引物、通用引物或本文所述的任何引物合成样品mRNA的cDNA拷贝。
可在单个密闭容器反应中进行逆转录和PCR。例如,可使用三种引物,一种用于逆转录,而两种用于PCR。用于逆转录的引物可与PCR扩增子的位置的3’侧的mRNA结合。虽然不是必要的,但逆转录引物可包含RNA残基或修饰的类似物,诸如2’-O-甲基RNA碱基,当其与mRNA杂交时将不形成RNA酶H的底物。
进行逆转录反应的温度取决于使用的逆转录酶。在一些情况下,使用热稳定的逆转录酶,且逆转录反应在约37℃至约75℃下、在约37℃至约50℃下、在约37℃至约55℃下、在约37℃至约60℃下、在约55℃至约75℃下、在约55℃至约60℃下、在约37℃下或在约60℃下进行。在一些情况下,使用将3个或更多个非模板末端核苷酸转移到转录产物末端的逆转录酶。
本文所述的逆转录反应和PCR反应可在本领域已知的多种形式中进行,诸如在管、微量滴定板、微流体装置或优选地在小液滴中进行。
逆转录反应可在范围为5μL至100μL或10μL至20μL反应体积的体积内进行。在小液滴中,反应体积可为1pL至100nL或10pL至1nL。在一些情况下,逆转录反应在具有约或小于1nL体积的小液滴中进行。在一些情况下,PCR反应在具有1pL至100nL,优选10pL至1nL的反应体积范围的小液滴中进行。在一些情况下,PCR反应在具有约或小于1nL体积的小液滴中进行。在一些情况下,逆转录反应和PCR反应在相同的具有1pL至100nL或10pL至1nL的反应体积范围的相同小液滴中进行。在一些情况下,逆转录反应和PCR反应在具有约或小于1nL的体积或约或小于1pL的体积的小液滴中进行。在一些情况下,逆转录反应和PCR反应在不同的小液滴中进行。在一些情况下,逆转录反应和PCR反应在多个小液滴中进行,每个小液滴具有1pL至100nL或10pL至1nL的反应体积范围。在一些情况下,逆转录反应和PCR反应在多个小液滴中进行,每个小液滴具有约或小于1nL的体积。
在一些情况下,第一PCR反应在具有1pL至100nL、优选10pL至1nL的反应体积范围的第一小液滴内进行,且第二PCR反应在具有1pL至100nL、优选10pL至1nL的反应体积范围的第二小液滴内进行。在一些情况下,第一PCR反应在具有约或小于1nL的体积的第一小液滴内进行,且第二PCR反应在具有约或小于1nL的体积的第二小液滴内进行。
在一些情况下,第一PCR反应和第二PCR反应在多个小液滴中进行,每个小液滴具有1pL至100nL或10pL至1nL的反应体积范围。在一些情况下,第一PCR反应和第二PCR反应在多个小液滴中进行,每个小液滴具有约或小于1nL的体积。
可使用一种或多种逆转录引物将目标多核苷酸如RNA逆转录为cDNA。该一种或多种逆转录引物可包含与RNA的区域如恒定区(例如,重链或轻链恒定区,或mRNA的聚A尾)互补的区域。在一些实施方案中,逆转录引物可包括第一逆转录引物和第二逆转录引物,第一逆转录引物具有与第一RNA的恒定区互补的区域,第二逆转录引物具有与第二RNA的恒定区互补的区域。在一些实施方案中,逆转录引物可包括第一逆转录引物和一个或多个逆转录引物,第一逆转录引物具有与第一RNA的恒定区互补的区域,所述一个或多个逆转录引物分别具有与一个或多个RNA的恒定区互补的区域。
在一些实施方案中,逆转录引物不包含条码。
逆转录引物可进一步包含不与RNA的区域互补的区域。在一些实施方案中,不与RNA的区域互补的区域在与RNA互补的引物区域的5’侧。在一些实施方案中,不与RNA的区域互补的区域在与RNA互补的引物区域的3’侧。在一些实施方案中,不与RNA的区域互补的区域为5’突出端区域。在一些实施方案中,不与RNA的区域互补的区域包含用于扩增和/或测序反应的引发位点。通过使用本文所述的一种或多种引物,使用本领域已知的合适试剂逆转录RNA分子。
在进行RNA分子的逆转录反应后,产生的cDNA分子可用分子条码和容器条码进行条码化,并通过一个或多个PCR反应进行扩增,诸如第一和/或第二PCR反应。第一和/或第二PCR反应可利用一对引物或多个引物对。第一和/或第二PCR反应可利用多个正向/反向引物和反向引物。第一和/或第二PCR反应可利用多个正向/反向引物和正向引物。多个正向/反向引物的第一和/或第二引物可为含有与cDNA分子或条码化cDNA分子互补的区域的正向/反向引物。多个正向/反向引物的第一和/或第二引物可为含有与条码化cDNA分子互补的区域的正向/反向引物。
在一些实施方案中,多个正向/反向引物包括一个或多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与cDNA或条码化cDNA的V区段的一个或多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与cDNA或条码化cDNA的V区段的上游或下游区域互补的区域的正向/反向引物,以及包含与cDNA或条码化cDNA的V区段的一个或多个其他上游或下游区域互补的区域的一个或多个其他正向/反向引物。例如,多个正向/反向引物包括包含与cDNA或条码化cDNA的V区段的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与cDNA或条码化cDNA的V区段的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与cDNA或条码化cDNA的V区段的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与cDNA或条码化cDNA的V区段的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与cDNA或条码化cDNA的V区段的第三上游或下游区域互补的区域的第三正向/反向引物,等等。多个正向/反向引物中的引物可用来与样品中的细胞(诸如免疫B细胞或T细胞)表达的所有V区段的所有可能的上游或下游区域退火。
在一些实施方案中,多个正向/反向引物包括一个或多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与cDNA或条码化cDNA的C区段的一个或多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与cDNA或条码化cDNA的C区段的上游或下游区域互补的区域的正向/反向引物,以及包含与cDNA或条码化cDNA的C区段的一个或多个其他上游或下游区域互补的区域的一个或多个其他正向/反向引物。例如,多个正向/反向引物包括包含与cDNA或条码化cDNA的C区段的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与cDNA或条码化cDNA的C区段的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与cDNA或条码化cDNA的C区段的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与cDNA或条码化cDNA的V区段的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与cDNA或条码化cDNA的C区段的第三上游或下游区域互补的区域的第三正向/反向引物,等等。多个正向/反向引物中的引物可用来与样品中的细胞(诸如免疫B细胞或T细胞)表达的所有C区段的所有可能的上游或下游区域退火。
在一些实施方案中,多个正向/反向引物包括一个或多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与条码化cDNA的分子条码的一个或多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与条码化cDNA的分子条码的上游或下游区域互补的区域的正向/反向引物,以及包含与条码化cDNA的分子条码的一个或多个其他上游或下游区域互补的区域的一个或多个其他正向/反向引物。例如,多个正向/反向引物包括包含与条码化cDNA的分子条码的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与条码化cDNA的分子条码的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与条码化cDNA的分子条码的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与条码化cDNA的分子条码的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与条码化cDNA的分子条码的第三上游或下游区域互补的区域的第三正向/反向引物等。多个正向/反向引物可用来与样品中的细胞(诸如免疫B细胞或T细胞)表达的所有分子条码的所有可能的上游或下游区域退火。
在一些实施方案中,多个正向/反向引物包括一个或多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与条码化cDNA的容器条码的一个或多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与条码化cDNA的容器条码的上游或下游区域互补的区域的正向/反向引物,以及包含与条码化cDNA的容器条码的一个或多个其他上游或下游区域互补的区域的一个或多个其他正向/反向引物。例如,多个正向/反向引物包括包含与条码化cDNA的容器条码的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与条码化cDNA的容器条码的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与条码化cDNA的容器条码的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与条码化cDNA的容器条码的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与条码化cDNA的容器条码的第三上游或下游区域互补的区域的第三正向/反向引物等。多个正向/反向引物中的引物可用来与样品中的细胞(诸如免疫B细胞或T细胞)表达的所有容器条码的所有可能的上游或下游区域退火。
多个正向/反向引物中的正向/反向引物进一步包含不与RNA的区域互补的区域。在一些实施方案中,不与RNA的区域互补的区域在与RNA互补的正向/反向引物区域(即,V区段的上游或下游区域)的5’侧。在一些实施方案中,不与RNA的区域互补的区域在与RNA互补的正向/反向引物区域的3’侧。在一些实施方案中,不与RNA的区域互补的区域为5’突出端区域。在一些实施方案中,不与RNA的区域互补的区域包含用于扩增和/或第二测序反应的引发位点。在一些实施方案中,不与RNA的区域互补的区域包含用于扩增和/或第三测序反应的引发位点。在一些实施方案中,不与RNA的区域互补的区域包含用于第二和第三测序反应的引发位点。在一些实施方案中,用于第二和第三测序反应的引发位点的序列是相同的。通过使用如本文所述的一个或多个正向/反向引物和反向引物,使用本领域已知的合适试剂扩增cDNA分子。在一些实施方案中,区域互补于RNA的区域,诸如恒定区或mRNA的聚A尾。
在一些实施方案中,多个正向/反向引物包含一个或多个正向/反向引物,其中所述多个正向/反向引物中的每个正向/反向引物包含与亲和-寡核苷酸缀合物的条码化寡核苷酸的容器条码的一个或多个上游或下游区域互补的区域。在一些实施方案中,多个正向/反向引物包含一个或多个正向/反向引物,其中所述多个正向/反向引物中的每个正向/反向引物包含与亲和-寡核苷酸缀合物的条码化寡核苷酸的AID的一个或多个上游或下游区域互补的区域。在一些实施方案中,多个正向/反向引物包含一个或多个正向/反向引物,其中所述多个正向/反向引物中的每个正向/反向引物包含与亲和-寡核苷酸缀合物的条码化寡核苷酸的AMB的一个或多个上游或下游区域互补的区域。例如,多个正向/反向引物包含这样的正向/反向引物,其含有与亲和-寡核苷酸缀合物的条码化寡核苷酸的容器条码、AID和/或AMB的上游或下游区域互补的区域;以及一个或多个其他的正向/反向引物,该正向/反向引物含有与亲和-寡核苷酸缀合物的条码化寡核苷酸的容器条码、AID和/或AMB的一个或多个其他上游或下游区域互补的区域。例如,多个正向/反向引物包含第一和/或第二正向/反向引物,其含有与亲和-寡核苷酸缀合物的条码化寡核苷酸的容器条码、AID和/或AMB的第一和/或第二上游或下游区域互补的区域;以及第二正向/反向引物,其含有与亲和-寡核苷酸缀合物的条码化寡核苷酸的容器条码、AID和/或AMB的第二上游或下游区域互补的区域。例如,多个正向/反向引物包含第一和/或第二正向/反向引物,其含有与亲和-寡核苷酸缀合物的条码化寡核苷酸的容器条码、AID和/或AMB的第一和/或第二上游或下游区域互补的区域;第二正向/反向引物,其含有与亲和-寡核苷酸缀合物的条码化寡核苷酸的容器条码、AID和/或AMB的第二上游或下游区域互补的区域;以及第三正向/反向引物,其含有与亲和-寡核苷酸缀合物的条码化寡核苷酸的容器条码、AID和/或AMB的第三上游或下游区域互补的区域,等等。
扩增
在将容器条码添加至目标多核苷酸之后,可扩增目标多核苷酸。例如,在将容器条码添加至亲和-寡核苷酸缀合物中的寡核苷酸之后,可扩增该寡核苷酸。例如,在将容器条码添加至细胞多核苷酸之后,可扩增容器条码化细胞多核苷酸。
扩增反应可包含一种或多种添加剂。在一些情况下,所述一种或多种添加剂为二甲亚砜(DMSO)、甘油、甜菜碱(单)水合物(N,N,N-三甲基甘氨酸=[羧甲基]三甲基铵)、海藻糖、7-脱氮-2’-脱氧鸟苷三磷酸(dC7GTP或7-脱氮-2’-dGTP)、BSA(牛血清蛋白)、甲酰胺、四甲基氯化铵(TMAC)、其他四烷基铵衍生物(例如,四乙基氯化铵(TEA-Cl)和四丙基氯化铵(TPrA-Cl)、非离子型去污剂(例如,Triton X-100、吐温20、Nonidet P-40(NP-40))或PREXCEL-Q。在一些情况下,扩增反应包含0、1、2、3、4、5、6、7、8、9或10种不同添加剂。在其他情况下,扩增反应包含至少0、1、2、3、4、5、6、7、8、9或10种不同添加剂。
可在包含于反应体积(例如,小液滴)中的样品上进行热循环反应。小液滴可为多分散的或优选单分散的,通过搅拌、超声处理或穿过T通道接合点以微流体方式或本领域熟知的其他手段生成。密度可超过20,000个小液滴/40ul(1nL小液滴)、200,000个小液滴/40ul(100pL小液滴)。在热循环期间,小液滴可保持完整。在热循环期间,小液滴可以大于约10,000个小液滴/μL、100,000个小液滴/μL、200,000个小液滴/μL、300,000个小液滴/μL、400,000个小液滴/μL、500,000个小液滴/μL、600,000个小液滴/μL、700,000个小液滴/μL、800,000个小液滴/μL、900,000个小液滴/μL或1,000,000个小液滴/μL的密度保持完整。在其他情况下,两个或更多个小液滴在热循环期间不聚结。在其他情况下,大于100个或大于1,000个小液滴在热循环期间不聚结。
可使用催化引物延伸的任何DNA聚合酶,包括但不限于大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶1的Klenow片段、T7DNA聚合酶、T4DNA聚合酶、Taq聚合酶、Pfu DNA聚合酶、Vent DNA聚合酶、噬菌体29、REDTaqTM、基因组DNA聚合酶或测序酶。在一些情况下,使用热稳定的DNA聚合酶。还可进行热启动PCR,其中在添加聚合酶之前将反应加热到95℃保持两分钟,或聚合酶可保持无活性直到循环1中的第一加热步骤。热启动PCR可用于使非特异性扩增最小化。可以使用任何数目的PCR循环来扩增DNA,例如约、大于约或小于约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个循环。扩增循环的数目可为约1-45、10-45、20-45、30-45、35-45、10-40、10-30、10-25、10-20、10-15、20-35、25-35、30-35或35-40。
可通过本领域已知的任何手段进行目标核酸的扩增。可通过聚合酶链反应(PCR)或等温DNA扩增来扩增目标核酸。可使用的PCR技术的实例包括但不限于定量PCR、定量荧光PCR(QF-PCR)、多重荧光PCR(MF-PCR)、实时PCR(逆转录-PCR)、单细胞PCR、限制性片段长度多态性PCR(PCR-RFLP)、PCR-RFLP/逆转录-PCR-RFLP、热启动PCR、巢式PCR、原位聚合酶克隆PCR、原位滚环扩增(RCA)、数字PCR(dPCR)、小液滴数字PCR(ddPCR)、桥式PCR、皮升PCR和乳液PCR。其他合适的扩增方法包括连接酶链反应(LCR)、转录扩增、分子倒置探针(MIP)PCR、自动维持序列复制、目标多核苷酸序列的选择性扩增、共有序列引物聚合酶链反应(CP-PCR)、任意引物聚合酶链反应(AP-PCR)、简并多核苷酸引物PCR(DOP-PCR)和基于核酸的序列扩增(NABSA)。本文可使用的其他扩增方法包括美国专利号5,242,794、5,494,810、4,988,617和6,582,938中描述的方法,以及包括Qβ复制酶介导的RNA扩增。扩增可为恒温扩增,例如,恒温线性扩增
在一些实施方案中,扩增不在固体支持体上发生。在一些实施方案中,扩增不在小液滴中的固体支持体上发生。在一些实施方案中,当不在小液滴中扩增时,扩增在固体支持体上发生。
测序
在进行本文所述的一个或多个方法或方法步骤后,可对生成的多核苷酸文库进行测序。
可通过本领域已知的任何测序方法进行测序。在一些实施方案中,可进行高通量测序。合适的下一代测序技术包括454Life Sciences平台(Roche,Branford,CT)(Margulies等人,Nature,437,376-380(2005));lllumina的基因组分析仪、GoldenGate甲基化分析或Infinium甲基化分析,即Infinium人类甲基化27K BeadArray或VeraCodeGoldenGate甲基化分析(Illumina,San Diego,CA;Bibkova等人,Genome Res.16,383-393(2006);和美国专利号6,306,597、7,598,035、7,232,656),或DNA连接测序,SOLiD系统(Applied Biosystems/Life Technologies;美国专利号6,797,470、7,083,917、7,166,434、7,320,865、7,332,285、7,364,858和7,429,453);或Helicos True单分子DNA测序技术(Harris等人,Science,320,106-109(2008);以及美国专利号7,037,687、7,645,596、7,169,560和7,769,400)、Pacific Biosciences的单分子、实时(SMRTTM)技术和测序(Soni等人,Clin.Chem.53,1996-2001(2007))。这些系统允许对从样品中分离的许多多核苷酸进行多重平行测序(Dear,Brief Funct.Genomic Proteomic,1(4),397-416(2003)和McCaughan等人,J.Pathol.,220,297-306(2010))。在一些实施方案中,通过染料修饰的探针的连接测序、焦磷酸测序或单分子测序对多核苷酸进行测序。对多核苷酸序列的测定可通过如下测序方法进行,诸如HelioscopeTM单分子测序、纳米孔DNA测序、Lynx Therapeutics大规模平行签名测序(MPSS)、454焦磷酸测序、单分子实时(RNAP)测序、Illumina(Solexa)测序、SOLiD测序、Ion TorrentTM、离子半导体测序、单分子SMRTTM测序、聚合酶克隆测序、DNA纳米球测序和VisiGen Biotechnologies方法。或者,测定多核苷酸的序列可采用测序平台,包括但不限于基因组分析仪IIx、HiSeq,以及Illumina提供的MiSeq,单分子实时(SMRTTM)技术,诸如Pacific Biosciences(California)提供的PacBio RS系统以及Solexa测序仪、真正单分子测序(tSMSTM)技术,诸如Helicos Inc.(Cambridge,MA)提供的HeliScopeTM测序仪。测序可包括MiSeq测序。测序可包括HiSeq测序。在一些实施方案中,测定多核苷酸的序列包括配对末端测序、纳米孔测序、高通量测序、鸟枪法测序、染料终止子测序、多引物DNA测序、引物步移、Sanger双脱氧测序、Maxim-Gilbert测序、焦磷酸测序、真正单分子测序或其任意组合。或者,可通过电子显微术或化学敏感性场效应晶体管(chemFET)阵列测定多核苷酸的序列。
方法可进一步包括对文库中的一个或多个多核苷酸进行测序。方法可进一步包括将文库中的一个或多个多核苷酸序列、序列读取、扩增子序列或扩增子集序列彼此进行比对。
比对可包括将测试序列如序列读取与一个或多个其他测试序列、参考序列或其组合进行比较。在一些实施方案中,比对可用于从多个序列或比对的序列确定共有序列。在一些实施方案中,比对包括从各自具有相同分子条码或容器条码的多个序列确定共有序列。在一些实施方案中,为了比较目的而比对的序列的长度为参考序列长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。可通过公知的方法,例如,使用数学算法完成对两个或更多个序列的实际比较。这样的数学算法的非限制性实例描述于Karlin,S.和Altschul,S.,Proc.Natl.Acad.Sci.USA,90-5873-5877(1993)中。这样的算法并入NBLAST和XBLAST程序(版本2.0)中,如Altschul,S.等人,Nucleic AcidsRes.,25:3389-3402(1997)中所述。当利用BLAST和Gapped BLAST程序时,可使用相应程序(例如,NBLAST)的任何相关参数。例如,用于序列比较的参数可设置为分数=100,字长=12,或可变化(例如,W=5或W=20)。其他实例包括Myers和Miller,CABIOS(1989)的算法、ADVANCE、ADAM、BLAT和FASTA。在一些实施方案中,可使用例如GCG软件包中的GAP程序(Accelrys,Cambridge,UK)完成两个氨基酸序列之间的百分比同一性。
测序可包括对多核苷酸的至少约10、20、30、40、50、60、70、80、90、100个或更多个核苷酸或碱基对进行测序。在一些实施方案中,测序包括对多核苷酸的至少约200、300、400、500、600、700、800、900、1000个或更多个核苷酸或碱基对进行测序。在其他情况下,测序包括对多核苷酸的至少约1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000个或更多个核苷酸或碱基对进行测序。
测序可包括每次运行至少约200、300、400、500、600、700、800、900、1000个或更多个测序读取。如本文所用的,序列读取包括从通过测序技术生成的序列或数据流确定的核苷酸序列。在一些实施方案中,测序包括每次运行对至少约1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000个或更多个测序读取进行测序。测序可包括每次运行多于、少于或等于约1,000,000,000个测序读取。测序可包括每次运行多于、少于或等于约200,000,000个读取。
本文所公开的方法和试剂盒可包含一种或多种酶。酶的实例包括但不限于连接酶、逆转录酶、聚合酶和限制酶。
在一些实施方案中,衔接子与多核苷酸的附接包括使用一种或多种连接酶。连接酶的实例包括但不限于DNA连接酶,诸如DNA连接酶I、DNA连接酶III、DNA连接酶IV和T4DNA连接酶,以及RNA连接酶,诸如T4RNA连接酶I和T4RNA连接酶II。
本文所公开的方法和试剂盒可进一步包括使用一种或多种逆转录酶。在一些实施方案中,该逆转录酶为HIV-1逆转录酶、M-MLV逆转录酶、AMV逆转录酶和端粒酶逆转录酶。在一些实施方案中,该逆转录酶为M-MLV逆转录酶。
在一些实施方案中,本文所公开的方法和试剂盒包括使用一种或多种蛋白酶。
在一些实施方案中,本文所公开的方法和试剂盒包括使用一种或多种聚合酶。聚合酶的实例包括但不限于DNA聚合酶和RNA聚合酶。在一些实施方案中,该DNA聚合酶为DNA聚合酶I、DNA聚合酶II、DNA聚合酶III全酶和DNA聚合酶IV。可商购获得的DNA聚合酶包括但不限于Bst 2.0DNA聚合酶、Bst 2.0WarmStartTM DNA聚合酶、Bst DNA聚合酶、硫化叶菌DNA聚合酶IV、Taq DNA聚合酶、9°NTMm DNA聚合酶、Deep VentRTM(exo-)DNA聚合酶、DeepVentRTMDNA聚合酶、Hemo KlenTaqTMTaq DNA聚合酶、DNA聚合酶、DNA聚合酶、Q5TM高保真DNA聚合酶、TherminatorTMγDNA聚合酶、TherminatorTMDNA聚合酶、TherminatorTMII DNA聚合酶、TherminatorTMIII DNA聚合酶、DNA聚合酶、(exo-)DNA聚合酶、Bsu DNA聚合酶、phi29DNA聚合酶、T4DNA聚合酶、T7DNA聚合酶、末端转移酶、Taq聚合酶、KAPA Taq DNA聚合酶和KAPA Taq热启动DNA聚合酶。
在一些实施方案中,所述聚合酶为RNA聚合酶,诸如RNA聚合酶I、RNA聚合酶II、RNA聚合酶III、大肠杆菌聚(A)聚合酶、phi6RNA聚合酶(RdRP)、聚(U)聚合酶、SP6RNA聚合酶和T7RNA聚合酶。
附加试剂
本文所公开的方法和试剂盒可包括使用一种或多种试剂。试剂的实例包括但不限于PCR试剂、连接试剂、逆转录试剂、酶试剂、杂交试剂、样品制备试剂、亲和捕获试剂、固体支持体如珠子,以及用于核酸纯化和/或分离的试剂。
在其他实施方案中,本文公开的方法、试剂盒和组合物可包含支持体。在其他实施方案中,本文公开的方法、试剂盒和组合物不包含支持体。通常,固体支持体包含一种或多种材料,该材料包含一个或多个刚性或半刚性表面。在一些实施方案中,该支持体为非固体支持体。该支持体或基底可包括膜、纸、塑料、涂层表面、平面、玻璃、载片、芯片或其任意组合。在一些实施方案中,支持体的一个或多个表面基本上为平面,然而在一些实施方案中,可期望其对于不同的化合物在物理上分隔合成区域,例如采用孔、凸起区、针、蚀刻沟槽等。在一些实施方案中,固体支持体包括珠子、树脂、凝胶、微球或其他几何构型。或者,固体支持体可包括二氧化硅芯片、微粒、纳米粒子、平板和阵列。固体支持体可包括使用在微孔中自组装的珠子。例如,固体支持体包括Illumina的BeadArray技术。或者,固体支持体包括Abbott Molecular的Bead Array珠阵列技术和Applied Microarray的FlexiPlexTM系统。在其他情况下,固体支持体为板。板的实例包括但不限于MSD多阵列板、MSD板、微板、ProteOn微板、AlphaPlate、DELFIA板、IsoPlate和LumaPlate。在一些实施方案中,支持体可包括多个珠子。在一些实施方案中,支持体可包括阵列。在一些实施方案中,支持体可包括载玻片。适用于聚合物的方法、基底和技术(美国专利号5,744,305、5,143,854、5,242,974、5,252,743、5,324,633、5,384,261、5,405,783、5,424,186、5,451,683、5,482,867、5,491,074、5,527,681、5,550,215、5,571,639、5,578,832、5,593,839、5,599,695、5,624,711、5,631,734、5,795,716、5,831,070、5,837,832、5,856,101、5,858,659、5,936,324、5,968,740、5,974,164、5,981,185、5,981,956、6,025,601、6,033,860、6,040,193、6,090,555、6,136,269、6,269,846和6,428,752;美国专利公开号20090149340、20080038559、20050074787;以及PCT公开号WO 00/58516、WO 99/36760和WO 01/58593)。多核苷酸与支持体的附接可包括胺-巯基交联、马来酰亚胺交联、N-羟基琥珀酰亚胺或N-羟基磺基琥珀酰亚胺、Zenon或SiteClick。将标记的核酸附接至支持体可包括将生物素与多个多核苷酸附接,并用链霉亲和素涂覆一个或多个珠子。在一些实施方案中,固体支持体为珠子。珠子的实例包括但不限于链霉亲和素珠子、琼脂糖珠子、磁珠、微珠、抗体偶联的珠子(例如,抗免疫球蛋白微珠)、蛋白A偶联的珠子、蛋白G偶联的珠子、蛋白A/G偶联的珠子、蛋白L偶联的珠子、多核苷酸dT偶联的珠子、二氧化硅珠子、二氧化硅样珠子、抗生物素微珠、抗荧光染料微珠和BcMagTM羧基封端磁珠。珠子的直径可为约5μm、10μm、20μm、25μm、30μm、35μm、40μm、45μm或50μm。固体支持体可为阵列或微阵列。固体支持体可包含离散的区域。固体支持体可为阵列,例如可寻址阵列。
固体支持体可包含实际上任何不溶性或固体材料,并且通常选择不溶于水的固体支持体材料组合物。例如,固体支持体可包含以下成分或基本由以下成分组成:硅胶、玻璃(例如,可控孔玻璃(CPG))、尼龙、纤维素、金属表面(例如,钢、金、银、铝、硅和铜)、磁性材料、塑料材料(例如,聚乙烯、聚丙烯、聚酰胺、聚酯、聚偏氟乙烯(PVDF))等。根据实施方案使用的珠子的实例可包含允许珠子与核酸分子相互作用的亲和部分。固相(例如,珠子)可包含结合对的成员(例如,抗生物素蛋白、链霉亲和素或其衍生物)。例如,该珠子可为链霉亲和素包被的珠子,并且用于固定在珠子上的核酸分子可包含生物素部分。在一些情况下,每个多核苷酸分子可包含两个亲和部分,如生物素,来进一步稳定多核苷酸。珠子可包含用于固定核酸的附加特征,或可用于下游筛选或选择过程的附加特征。例如,珠子可包含亲和力部分、荧光标记或荧光猝灭剂。在一些情况下,珠子可为磁性的。在一些情况下,固体支持体为珠子。珠子的实例包括但不限于链霉亲和素珠子、琼脂糖珠子、磁珠、微珠、抗体偶联的珠子(例如,抗免疫球蛋白微珠)、蛋白A偶联的珠子、蛋白G偶联珠子、蛋白A/G偶联的珠子、蛋白L偶联的珠子、多核苷酸dT偶联的珠子、二氧化硅珠子、二氧化硅样珠子、抗生物素微珠、抗荧光染料微珠和BcMagTM羧基末端磁珠。珠子或粒子可为可膨胀的(例如,聚合物珠子,诸如Wang树脂)或不可膨胀的(例如,CPG)。在一些实施方案中,固相基本上为亲水的。在一些实施方案中,固相(例如,珠子)基本上为疏水的。在一些实施方案中,固相包含结合对的成员(例如,抗生物素蛋白、链霉亲和素或其衍生物),并且基本上为疏水的或基本上为亲水的。在一些实施方案中,固相包含结合对的成员(例如,抗生物素蛋白、链霉亲和素或其衍生物),并且具有每mg固体支持体大于约1350皮摩尔游离捕获剂(例如,游离生物素)的结合能力。在一些实施方案中,包含结合对成员的固相的结合能力为每mg固体支持体大于800、900、1000、1100、1200、1250、1300、1350、1400、1450、1500、1600、1800、2000皮摩尔的游离捕获剂。适用于本发明的珠子的其他实例为金胶体或珠子,诸如聚苯乙烯珠或二氧化硅珠。可使用基本上任何珠半径。珠子的实例可包括半径范围为150纳米至10微米的珠子。还可使用其他大小。
本文所公开的方法和试剂盒可包括使用一种或多种缓冲液。缓冲液的实例包括但不限于洗涤缓冲液、连接缓冲液、杂交缓冲液、扩增缓冲液和逆转录缓冲液。在一些实施方案中,杂交缓冲液为可商购获得的缓冲液,诸如TMAC Hyb溶液、SSPE杂交溶液和ECONOTM杂交缓冲液。本文所公开的缓冲液可包含一种或多种去污剂。
本文所公开的方法和试剂盒可包括使用一种或多种载体。载体可增强或改善本文所公开的一种或多种反应(例如,连接反应、逆转录、扩增、杂交)的效率。载体可降低或防止分子或其任何产物(例如,多核苷酸和/或扩增子)的非特异性损失。例如,载体可通过吸附至表面而降低多核苷酸的非特异性损失。载体可降低多核苷酸对表面或基底(例如,器皿、Eppendorf管、移液管尖端)的亲和力。或者,载体可提高多核苷酸对表面或基底(例如,珠子、阵列、玻璃、载片、芯片)的亲和力。载体可保护多核苷酸免于降解。例如,载体可保护RNA分子不受核糖核酸酶作用。或者,载体可保护DNA分子不受DNA酶作用。载体的实例包括但不限于多核苷酸如DNA和/或RNA,或多肽。DNA载体的实例包括质粒、载体、聚腺苷酸化DNA和DNA多核苷酸。RNA载体的实例包括聚腺苷酸化RNA、噬菌体RNA、噬菌体MS2RNA、大肠杆菌RNA、酵母RNA、酵母tRNA、哺乳动物RNA、哺乳动物tRNA、短聚腺苷酸化合成核糖核苷酸和RNA多核苷酸。RNA载体可为聚腺苷酸化RNA。或者,RNA载体可为非聚腺苷酸化RNA。在一些实施方案中,载体来自细菌、酵母或病毒。例如,载体可为来源于细菌、酵母或病毒的多核苷酸或多肽。例如,载体为来自枯草芽孢杆菌(Bacillus subtilis)的蛋白质。在另一个实例中,载体为来自大肠杆菌(Escherichia coli)的多核苷酸。或者,载体为来自哺乳动物(例如,人类、小鼠、山羊、大鼠、牛、绵羊、猪、狗或兔)、禽、两栖动物或爬行动物的多核苷酸或肽。
本文所公开的方法和试剂盒可包括使用一种或多种对照剂。对照剂可包括对照多核苷酸、非活性酶、非特异性竞争剂。或者,对照剂包括亮杂交、亮探针对照、核酸模板、掺加对照、PCR扩增对照。PCR扩增对照可为阳性对照。在其他情况下,PCR扩增控制物为阴性对照。核酸模板对照可为已知浓度。对照剂可包含一种或多种标记。
掺加对照可为向反应或样品中添加的模板。例如,掺加模板可添加到扩增反应中。掺加模板可在第一扩增循环后的任何时间添加到扩增反应中。在一些实施方案中,掺加模板在循环数2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45或50后添加到扩增反应中。掺加模板可在最终扩增循环前的任何时间添加到扩增反应中。掺加模板可包含一种或多种核苷酸或核酸碱基对。掺加模板可包含DNA、RNA或其任意组合。掺加模板可包含一种或多种标记。
本文公开了可用于、可结合使用、可用于准备本文所公开的方法和组合物或作为其产物的分子、材料、组合物和组分。应当理解,当公开这些材料的组合、子集、相互作用、组等时,尽管这些分子和化合物的每个不同单独和共同组合和排列的具体提及不能明确公开时,但每种提及都在此具体涉及并描述。例如,如果公开并讨论了核苷酸或核酸,并且讨论了可对包括核苷酸或核酸在内的许多分子作出的大量修饰,则具体涵盖各种和每一种核苷酸或核酸组合和排列以及可能的修饰,除非有明确的相反指示。此概念适用于本申请的所有方面,包括但不限于形成及使用所公开的方法和组合物的方法中的步骤。因此,如果存在可进行的多个其他步骤,则可以理解,这些其他步骤中的每一个都可用所公开方法的任何具体实施方案或实施方案的组合来进行,并且具体涉及每个这样的组合,并且应被认为是已公开的。
虽然本文中已经示出并描述了本文所述的一些实施方案,但这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本文所提供的公开内容的情况下现将想到多种变化、改变和替代。应当理解,本文中所述的实施方案的各种替代方案可用于实施本文所述的方法。
除非另有解释,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的含义。下列参考文献含有可用于本文的方法和组合物的实施方案:The Merck Manual of Diagnosis and Therapy,第18版,Merck ResearchLaboratories出版,2006(ISBN0-9119102);Benjamin Lewin,Genes IX,Jones&BartlettPublishing出版,2007(ISBN-13:9780763740634);Kendrew等人(编),The Encyclopediaof Mol.Biology,Blackwell Science Ltd.出版,1994(ISBN 0-632-02182-9);以及RobertA.Meyers(编),Mol.Biology and Biotechnology:a Comprehensive Desk Reference,VCHPublishers出版,Inc.,1995(ISBN 1-56081-569-8)。
本发明的标准程序描述于例如,Maniatis等人,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,USA(1982);Sambrook等人,Molecular Cloning:A Laboratory Manual(第二版),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,USA(1989);Davis等人,Basic Methods in Molecular Biology,Elsevier Science Publishing,Inc.,NewYork,USA(1986);或Methods in Enzymology:Guide to Molecular Cloning TechniquesVol.152,S.L.Berger和A.R.Kimmerl(编),Academic Press Inc.,San Diego,USA(1987))。Current Protocols in Molecular Biology(CPMB)(Fred M.Ausubel等人编,John Wileyand Sons,Inc.),Current Protocols in Protein Scienc(CPPS)(John E.Coligan等人编,John Wiley and Sons,Inc.),Current Protocols in Immunology(CPI)(JohnE.Coligan等人编,John Wiley and Sons,Inc.),Current Protocols in Cell Biology(CPCB)(Juan S.Bonifacino等人编,John Wiley and Sons,Inc.),R.Ian Freshney的Culture of Animal Cells:A Manual of Basic Technique,出版商:Wiley-Liss;第5版(2005),以及Animal Cell Culture Methods(Methods in Cell Biology,Vol.57,JennieP.Mather和David Barnes编,Academic Press,第1版,1998)。
实施例
实施例1-T细胞群体中单个T淋巴细胞的免疫分型
通过分析CD4和CD8mRNA以及人T淋巴细胞中的表面蛋白质表达来验证本文所述的免疫表型分型方法(图1)。典型地,预计成熟T细胞是CD4亚型或CD8亚型。CD4亚型应同时表达CD4mRNA和CD4蛋白质,而不应表达CD8mRNA或CD8蛋白质。CD8亚型应同时表达CD8mRNA和CD8蛋白质,而不应表达CD4mRNA或CD4蛋白质。
将30,000个T细胞与包含CD4抗原ID序列的CD4特异性抗体-寡核苷酸和包含CD8抗原ID序列的CD8特异性抗体-寡核苷酸一起温育。还在单细胞乳化实验中分析了T细胞的CD4、CD8和TCR mRNA含量。将T细胞受体α、T细胞受体β、CD4和CD8mRNA逆转录为cDNA,并通过聚合酶链反应将小液滴特异性条码序列融合至cDNA和抗体缀合的寡核苷酸。从乳液中提取该DNA并采用下一代测序进行分析。
几乎所有的小液滴-条码(与单细胞有关的)均与CD4特异性抗原ID或CD8特异性抗原ID相关联。发现mRNA与基于表面蛋白质的分配之间基本上一致(图3)。
实施例2
免疫组库的测序在基础免疫学、自身免疫性疾病、传染性疾病和肿瘤学中具有广泛的应用。许多研究已经探讨了循环血液中的BCR和TCR多样性,但对TIL的免疫受体的兴趣日益增加,该免疫受体的功能与癌症生长或退化高度相关,但可变且通常未得到表征。达到TIL的更好理解的关键步骤是其BCR和TCR的回收和功能表征,因为这可允许鉴别新的肿瘤相关抗原。迫切需要肿瘤抗原来开发癌症疫苗、了解检查点抑制剂的作用以及在实体瘤中推进嵌合抗原受体T细胞(CAR-T)疗法。然而,尽管数十年来在免疫测序方面取得了技术进展,但研究均未在不进行使所观察的组库受限并产生偏差的步骤——体外培养或细胞分选的情况下从异质样品如肿瘤中回收到全长、天然配对的BCR(重链和轻链)和TCR(α和β链)。由于原代未培养的免疫细胞可含有比体外刺激的细胞少100倍的受体RNA,所以技术挑战特别大。为了允许对来自复杂异质样品的天然配对BCR和TCR进行综合分析,开发了基于微流体乳液的方法以供大量单细胞的平行分离和DNA条码化(图4)。在单个约65皮升的乳液小液滴中每小时分离高达一百万个细胞。细胞在小液滴内裂解,靶mRNA用靶特异性引物进行逆转录,并且两步式DNA条码化过程将分子特异性条码和小液滴特异性条码二者附接至cDNA。在随后的回收和下一代测序后,双重条码化策略允许将序列读取簇集到其来源的分子和细胞二者中。这允许对错误和扩增偏差进行大量校正、在mRNA水平和细胞水平下进行克隆计数、进行重链同种型测定,并且重要的是,同时以极高的通量回收BCR和TCR的全长、天然配对的V(D)J序列。
肿瘤浸润淋巴细胞(TIL)对于抗癌免疫应答是至关重要的,但由于其不可预测的丰度、表型和功能,研究具有挑战性。本发明人开发了在不需要细胞分选、刺激或培养的情况下进行深度TIL表征的方法。基于乳液的单细胞条码化方法从数百万个输入细胞中的淋巴细胞中捕获天然配对的B细胞和T细胞受体(BCR和TCR)序列。与先前的方法相比,所回收的可变区是全长的,并且可以伴有额外的mRNA和蛋白质靶标。在处理来自卵巢腺癌的400,000个未分选细胞之前,用来自健康人血液中的3百万个B细胞和来自HIV患者的350,000个B细胞验证了该方法,回收到来自超过11,000个TIL的配对BCR和TCR。我们的研究结果代表了任何配对BCR或TCR组库的最深采样,以及在乳液中从单细胞同时进行RNA测序和蛋白质测量的首次演示。
实施例3-从健康血液样品大规模回收B细胞VHVL
首先开发了该技术,并用通过阴性珠子富集从健康志愿者的外周血分离的3百万个B细胞来评估配对能力和通量。将乳液分成六个单独的级分,其并行处理且在测序之前没有再混合。以每个小液滴0.2个细胞装载乳液,得到约90%被占据的小液滴含有单细胞的泊松期望值(Poisson expectation),这与乳液小液滴的观察一致(图5A)。在破乳和另外的文库处理步骤之后,用Illumina MiSeq进行配对末端325+300bp测序。为了处理测序数据,将小液滴和分子条码一起用于从每个原始mRNA分子收集PCR复制读取,并且确定每个mRNA的共有序列,仅保留由至少两个读取构建的mRNA序列。将正向和反向读取拼接以生成包含5’UTR、完整V(D)J序列和足以用于同种型测定的恒定区的全长产物。重排的免疫球蛋白重链和轻链序列用IMGTHigh-VQuest和/或IgBLAST进行注释。
所得数据集含有324,988个与至少一个重链(VH)和一个轻链(VL)mRNA相关联的小液滴条码,如通过重链簇集分析所估计的,存在229,869个不同的VH克隆谱系。由于该原始数据集包括来自多细胞以及单细胞小液滴的数据,因此通过过滤掉与非一致的重链或轻链V(D)J序列连接的小液滴条码来富集来自单细胞小液滴的数据(图5B)。该步骤因典型免疫组库的高度多样性而变得可能,其中来自两个随机细胞的VH或VL mRNA将几乎从不匹配。所得到的富集数据集包含259,368个VHVL小液滴条码,并含有182,745个VH克隆谱系,充分地代表迄今为止配对免疫组库的最深采样。由于克隆相关细胞应该在其VHVL配对中显示一致性,因此直接估计通过鉴别克隆扩增的发生率的VHVL配对的精确度。鉴别出2,604个VH克隆,其在超过一个乳液级分中以高置信度被观察到为克隆扩增的细胞。整个级分中VL序列与这些VH克隆配对的一致性非常高,并且显示出96.1%的配对精确度,从而允许在259,368个VHVL对的整个过滤数据集中具有高置信度。交叉级分的VH和VL序列不变地与每个级分中的不同小液滴和分子条码相关联,因此不代表文库交叉污染。该分析可能低估配对精确度,因为已知一些B细胞表达多个轻链。259,368个过滤的VHVL小液滴条码或“VHVL对”中的75.0%含有IgM和/或IgD(图5C),考虑到原始B细胞的典型IgM+IgD+表型,IgM和IgD不出意料地经常一起观察到。还发现较低但仍大量的IgA(18.3%)和IgG(6.6%)VHVL对。所有VH同种型与Igκ或Igλ以约3:2的比例进行配对。在182,745个VH克隆谱系中,以两种方式评估克隆扩增:与克隆相关的小液滴条码的数目和跨乳液级分克隆的观察结果。在多个小液滴条码中观察到的克隆可以反映克隆扩增或多条码小液滴,在条码向小液滴中的初始λ=1泊松分散的情况下,其预计存在于约37%的小液滴中。然而,由>8个小液滴条码代表的任何克隆均可能被真正扩增(单个小液滴中的泊松概率<10-6)。虽然在超过一个级分中观察到总体6.0%的克隆,但对于在超过8个小液滴条码中观察到的克隆(总体为0.7%),其中的99%都在超过一个级分中观察到。100个最常见的克隆(各自30-137个小液滴条码,图5D)全部在六个级分中的至少五个中观察到。因此,条码计数和独立级分分析的组合允许在非扩增克隆的巨大背景中检测罕见的扩增谱系。然而值得注意的是,即使是最丰富的扩增克隆也仅存在于不到千分之一的细胞,这例证了人类外周免疫组库的巨大的多样性。
配对内每个VH和VL链的捕获mRNA的数目作为表达水平的估计值(图5E)。通常每个小液滴条码捕获小于10个重链(平均2.0个)和轻链(平均4.0个)mRNA,观察到每个细胞具有数十至数百个捕获的重链和轻链mRNA的较小的小液滴条码群体,该细胞几乎完全来自表达IgG和IgA的细胞。有趣的是,配对内VH和VL突变的程度在每个同种型(例如,IgG的VH与VL)内和同种型(例如,IgG与IgM)之间均强烈相关。此外,IgG和IgA对在其VH和VL链中几乎基本全部突变,而IgM和IgD对大部分显示很少的VH或VL突变。这些结果与B细胞激活导致IgM和IgD类别转换成IgG或IgA的机制、增加的免疫球蛋白表达和影响细胞中的重链基因座和轻链基因座的体细胞超突变一致。除了高度突变的VH链倾向于与高度突变的VL链配对的这一观察以外,该方法还能够从静息的人B细胞组库生成大量全长、天然配对的BCR。
实施例4-从HIV elite控制器回收已知的低频率VHVL
作为测定的配对灵敏度和准确度的进一步验证,对样品进行处理,其中几个罕见(10,000个细胞中<1个细胞)的天然VHVL配对是已经公开已知的。获得来自HIV elite控制器患者的外周B细胞,近年来针对展示HIV中和活性的抗体大量甄选了该HIV elite控制器的记忆B细胞。处理350,000个B细胞以生成总共38,620个过滤的VHVL对。有趣的是,该个体显示出比先前的健康样品(图3A)或典型健康外周B细胞组库更大的IgG比例。将来自该数据集的VH序列与来自该个体(包括PGT121)的所有报道的广谱中和抗体(bNAb)进行比较,发现八个接近或相同的VH序列,表明该bNAb家族代表少于0.03%的循环B细胞。至关重要的是,与这些重链配对的所有轻链均属于所预期且类似罕见的bNAb谱系,其展示出与先前报道相同的Igλ-V3-21/J3重排和标志性三联密码子插入,这支持我们方法的高精确度和高灵敏度。此外,在来自该个体的所有已知和新生成的PGT121样VHVL对的系统树上(图3B),VH和VL树显示出惊人相似的拓扑结构,其中配对的VH和VL序列占据镜样位置,这可能反映了共享系统发生史。本文发现的变体对很符合这个规则。有趣的是,两个公开的抗体PGT122和PGT123表现为例外;没有发现对这两种配对的支持,反而发现了PGT122VH:PGT123VL样配对和PGT123VH:PGT122VL样配对,对应于原始报告中的未经证实的配对。合成了编码8个新型PGT样VHVL对的完整V(D)J区的DNA,将抗体表达为完全IgG并测试其中和多个HIV假毒株的能力(图6C)。该抗体表达良好,并且均显示出对该病毒的强中和活性,证明了我们的方法在从相关生物样品快速生成天然配对的功能性抗体变体方面的实用性。
实施例5-来自肿瘤浸润淋巴细胞的B细胞和T细胞受体对
在针对配对受体的高通量回收验证的乳液条码化之后,从肿瘤直接回收免疫受体。取得蛋白酶解离的切除的卵巢腺癌样品,并使400,000个未分选的细胞进入乳液中。对样品单独等分试样的CD3/CD19染色表明材料中相当数目的浸润B细胞(约5%)和浸润T细胞(约20%)。乳液中的单细胞分散与纯化的细胞相似,尽管可见一些有限的凝集,并且考虑到样品的细胞类型异质性,小液滴内的细胞大小和形状的广泛变化符合预期(图7A)。
将靶向T细胞受体α和β链的恒定区的引物一起与之前使用的BCR引物一起使用,并且随后的测序和严格过滤回收了数千个与BCR或TCR产物连接的小液滴条码。为了评估单细胞精确度,对小液滴条码内的四个靶基因座(VH、VL、Vα、Vβ)的所有可能组合进行计数(图7B)。绝大多数(97.9%)的具有超过一个靶链的小液滴条码包含生物学上预期的BCR VH +VL或TCR Vα+Vβ配对,其中仅含有2.1%的混合BCR-TCR组合。由于产物的条码化相对于靶链是无偏倚的,因此该结果允许所得到的6,056个BCR VHVL和5,217个TCR VαVβ对具有高置信度。尽管BCR和其他同种型全都存在IgG(仅IgE<0.05%),但BCR与其他同种型相比显示出明显的IgG优势(>80%)(图7C)。κ和λ轻链以与外周血数据集相似的比例存在。
与外周血类似,在BCR同种型与VH和VL链二者的突变水平之间观察到相关性,其中IgG和IgA对显示出比IgD和IgM更多的VH和VL突变,并且在每个同种型内的VH与VL之间显示出突变的一般相关性(图7D)。有趣的是,尽管IgD、IgM和IgA对在肿瘤与外周血数据集之间显示出非常相似的突变分布(图5F),但肿瘤IgG级分还含有相当大比例的在外周血中未观察到的较少突变序列或无突变序列。对于TCR和含有IgD的BCR,每个小液滴条码所观察到的捕获mRNA的数目与来自外周血的BCR结果相似(图7E,每个小液滴条码几乎都<10)。形成鲜明对比的是,肿瘤衍生的IgM、IgA和IgG对显示出提高10至100倍的平均表达水平,其中数百或数千个靶mRNA被捕获在许多小液滴条码中。然后评估了所捕获的TIL-TCR和BCR组库的多样性(图7F)。在5,217个总TCR对中观察到2,423个不同的TCRβ克隆。七个克隆以>1%的频率存在,其中频率最高的克隆代表所有小液滴条码中的16.9%。在6,056个总BCR对中观察到1,518个不同的重链克隆,其中15个克隆的频率>1%但均未>5%。虽然这代表比健康的外周BCR组库(其中克隆均未以大于0.06%的频率存在)明显更受限的多样性,但在肿瘤样品中存在如此多的类别转换的、突变的和高度表达的克隆表明需要深度和敏感的采样方法来进行TIL表征。这些方法允许同时从B细胞和T细胞二者中快速找回大量的TIL免疫受体对,而无需事先分选或外源性地激活所确定的TIL群体。
实施例6-捕获其他感兴趣的表型标志物
通过小液滴条码化的受体链配对潜在地允许捕获除了免疫受体之外的另外的靶标。为了探讨这种可能性,通过磁珠富集将健康T细胞分离为CD4+群体和CD8+群体,并将每种类型的20,000个细胞输入至具有靶向TCRα和β链以及CD4mRNA和CD8mRNA的引物的单独乳液运行中。测序后,含有来自CD4+分离细胞的TCR Vα和Vβ(“TCR对”)的3,861个小液滴条码中的47.0%与CD4mRNA相联系,而仅0.3%与CD8mRNA相联系。相比之下,来自CD8+分离细胞的2,235个TCR对的50.6%与CD8mRNA相关联,而仅有0.6%与CD4mRNA相关联。这表明与先前的报道相似,基于mRNA的途径用于细胞表型的特异性较高但灵敏度有限。相比之下,诸如细胞表面受体等蛋白质通常以远多于其编码mRNA的数目(每个细胞1,000-100,000个蛋白质)存在,这可能使得它们更容易检测以及可能与细胞表型更直接地相关。为了测量每个细胞上的靶蛋白质水平,将定制的寡核苷酸DNA标记与抗人CD4和CD8抗体缀合,并将标记的抗体与未分离的CD4+和CD8+T细胞混合物一起温育,然后将30,000个细胞输入乳液中(图8A)。该DNA标记带有抗体特异性序列标签和分子条码以及与扩增的小液滴条码的序列互补性,从而允许乳液小液滴条码化和分子计数与针对mRNA类似地进行。同时靶向DNA标记以及TCR、CD4和CD8mRNA。测序和过滤后,3,682个小液滴条码被鉴别为具有高置信度的TCR VαVβ。与先前的实验一致,基于mRNA,可将大约一半(52%)的TCR对分配为CD4或CD8状态(图8B)。然而,基于蛋白质状态,可将超过95%的小液滴条码分配为CD4或CD8,其中对于每个小液滴的平均分子计数,CD4/8蛋白质(平均值20.5)明显高于CD4/8mRNA(平均值1.0)。mRNA与蛋白质信号之间的一致性很高(图8C):既给出mRNA判定又给出蛋白质判定的小液滴中的96.0%是一致的。在一些罕见的情况下,检测到CD4蛋白质和CD8蛋白质二者,这可能是含有两个或更多个细胞的小液滴的结果。乳液条码化首次允许将单细胞免疫受体与感兴趣的mRNA和蛋白质标志物直接联系,所有这些均以高通量进行。有理由将这种途径应用于具有扩展的免疫肿瘤相关标志物组如抗PD-1和抗CTLA-4的TIL。
实施例7-人类样品
在个人基因组计划(Personal Genome Project)的批准下收集了用于健康组库验证的血液样品。用于HIV bNAb实验的PBMC从供体17中获得,供体17是来自IAVI Protocol G队列的HIV-1感染供体。根据由卢旺达国家伦理委员会(the Republic of RwandaNational Ethics Committee)、埃默里大学机构审查委员会(the Emory UniversityInstitutional Review Board)、赞比亚大学研究伦理委员会(the University of ZambiaResearch Ethics Committee)、查林十字研究伦理委员会(the Charing Cross ResearchEthics Committee)、UVRI科学与伦理委员会(the UVRI Science and EthicsCommittee)、新南威尔士大学研究伦理委员会(the University of New South WalesResearch Ethics Committee)、圣文森特医院和东悉尼地区卫生服务机构(St.Vincent’sHospital and Eastern Sydney Area Health Service)、肯雅塔国家医院伦理研究委员会(Kenyatta National Hospital Ethics and Research Committee)、开普敦大学研究伦理委员会(University of Cape Town Research Ethics Committee)、国际机构审查委员会(the International Institutional Review Board)、玛希隆大学伦理委员会(theMahidol University Ethics Committee)、沃尔特里德陆军研究所(WRAIR)机构审查委员会(the Walter Reed Army Institute of Research(WRAIR)Institutional ReviewBoard)和象牙海岸“国家生命科学和健康伦理”委员会(CNESVS)(the Ivory Coast Comite“National d’Ethique des Sciences de la Vie et de la Sante”(CNESVS))批准的临床方案,在书面知情同意的情况下收集所有人类HIV样品。根据IRB批准的方案,在知情同意的情况下从Conversant Biologics获得来自单个供体的冷冻保存的、解离切除的卵巢腺癌。
实施例8-细胞制备
为了研究3百万个健康B细胞,将50mL血液抽取到具有肝素钠(BD)的真空采血管CPT细胞制备管中,以1800×g离心20min,在细胞制备缓冲液(补充有2%胎牛血清和2mMEDTA的1x PBS)中洗涤两次,使用200×g旋转来去除血小板,并将所得PBMC在RPMI-1640培养基(Life Technologies)+20%胎牛血清+10%DMSO中以-80℃冷冻保存,直至需要。在生成乳液之前,将PBMC解冻,在细胞制备缓冲液中洗涤两次并计数。根据制造商的说明书使用基于阴性选择的人类B细胞富集试剂盒(Stem Cell Technologies)来分离B细胞。使细胞通过20μm细胞过滤器并在细胞制备缓冲液中稀释至6.2×106个细胞/mL(3百万B细胞实验)或3.1×106个细胞/mL(PGT供体和卵巢肿瘤实验)。
实施例9-乳液中的免疫受体条码化
乳液生成平台由三个通过单个空气压缩机驱动的Mitos P-泵(DolomiteMicrofluidics)组成,每个泵均具有Mitos流速传感器,以允许两个水相和一个亲氟油连续相计算机控制地流入亲氟涂覆的石英白云石Small 2-Reagent芯片。一个水性入口通道含有所需密度的细胞以产生期望的单位小液滴细胞占据水平,而第二水性通道含有裂解和反应混合物,该混合物由AbPairTM反应缓冲液和寡核苷酸(www.abvitro.com/catalogAV2070-1S和AV2080-1S)、5单位/μL的基于MuMLV的逆转录酶(Thermo Scientific)以及0.1单位/μL的Herculase II PCR聚合酶组成。使用100μL Hamilton Microliter注射器以两次各约100μL的LR混合物的注射来过度装载100μL内径PEEK管样品环。使用100μL HamiltonGastight注射器将约110μL细胞悬浮液装载到约100μL、内径为0.2mm的FEP管环中。通过在伴有来自芯片中两个油通道的油流动的同时使水相以相同流速聚焦流动喷射穿过两试剂(2-Reagent)芯片而形成乳液。将离开芯片出口通道的乳液滴入在冷却块(cold block)上的0.2-mL PCR带管(Eppendorf)中,之后通过移液从管的底部移除过量的油,添加40μL覆盖溶液(25mM Na-EDTA,pH 8.0)并将管转移至标准热循环仪以供转录物标记反应。在45-min的逆转录(RT)步骤期间,RNA在42℃下用靶特异性RT引物进行逆转录,其中基于模板转换添加了含有随机分子条码的通用衔接子序列。在达到室温后,使乳液经历40次热循环(每个循环:82℃持续10℃,65℃持续25秒)以进行小液滴条码模板的PCR扩增,将其在初始裂解和反应混合物中稀释至30,000cp/μL,从而在最终混合物中生成15,000cp/μL或每约65pl小液滴约1cp的浓度。小液滴条码的一端包含Illumina读取2(“P7”)引物位点,而另一端匹配通用衔接子寡核苷酸的共同序列。因此,在PCR期间,模板转换的cDNA可以与扩增的小液滴条码链退火,并通过重叠延伸而剪接以产生含有靶标、分子条码和小液滴条码序列的全长产物。
实施例10-破乳、清理、下游PCR、合并和测序
在热循环之后,通过移液移除覆盖溶液,并将40μL破乳溶液(1:1FC-40:全氟辛醇)与15μL裂解物澄清溶液(12.5μL Qiagen蛋白酶,2.5μL 0.5M Na-EDTA,pH 8.0)一起添加。颠倒10次以破坏乳液后,将混合物在50℃下温育15分钟并在95℃下温育3分钟以将蛋白酶灭活。在以15,000×g离心1min以分离水相后,将回收的物质严格纯化以除去寡核苷酸、试剂和过量的小液滴条码PCR产物。由于全长产物因RT引物的5’生物素化而含有生物素,因此可以通过在链霉亲和素珠子上进行清理而有效地将其与过量的小液滴条码PCR产物分离,从而尽可能减少下游PCR重组伪迹(在重叠延伸方法中的常见问题)。首先使用AMPure XP珠子(Agencourt),利用制造商的说明书以1:1的比例纯化第一产物,随后使用链霉亲和素珠子(New England Biolabs)同样利用制造商的说明书进行清理,然后在95℃的去离子水中洗脱,接着用AMPure XP珠子以1:1的比例进行第二次清理。然后将产物输入靶标富集PCR,其中对B细胞或T细胞受体靶标的恒定区具有特异性的引物与对小液滴条码序列的通用末端具有特异性的引物一起使用。根据制造商的说明书,该反向引物还含有用于MiSeq仪器上的多路测序的六碱基索引条码。因此,仅全长的、小液滴条码化的靶序列在该步骤中得以扩增。首先使用Q5 Hot Start聚合酶(New England Biolabs)在制造商推荐的条件下将所有靶标一起扩增7个循环:98℃ 10秒;64℃ 20秒;72℃ 15秒(包括在反应开始时进行的2分钟98℃聚合酶激活步骤)。随后以1.5:1的珠子:PCR比例进行AMPure XP清理。然后使用与之前相同的热循环条件进行分别针对每个链(VH、VL、Vα、Vβ)的第二次七个循环,随后进行AMPureXP清理。然后进行具有相同热循环条件和5-15个循环(取决于通过qPCR判断的产率)的最终PCR以添加全长Illumina测序衔接子并生成足够的物质以供TapeStation D1000(Agilent)定量。然后合并文库并在V3 2x 300bp MiSeq平台(Illumina)上进行测序。
实施例11-对MiSeq平台的修改
BCR或TCR的完整可变V(D)J区的重建需要拼接两个配对末端Illumina读取。为了改善这一过程,将2x 300bp试剂盒的正向读取延伸至325bp。由于免疫受体文库在恒定区引物位点具有有限的多样性,因此使用10%phiX掺加来减轻文库多样性有限的问题。
实施例12-对读取进行生物信息学处理的概述
使用围绕pRESTO软件包(0.4版)建立的定制流程来处理Illumina MiSeq读取,以从每个小液滴生成mRNA分子的全长共有序列,用IgBLAST和/或IMGT/HighV-QUEST对其进行注释,并进一步比对、过滤并用自定义脚本和Change-O软件包处理以生成统计数据。
实施例13-读取处理和注释,同种型分配。
利用pRESTO和Change-O软件包,用定制流程进行原始读取处理、V(D)J注释和克隆分配。简言之,对原始Illumina配对末端325+300bp读取进行质量控制、引物修剪,并经由引物位点的模糊匹配来鉴别小液滴特异性条码(DB)和分子特异性条码(MB)。DB和MB一起唯一地指定起源分子,并且该唯一分子标识符(UMI)被用于将来自相同分子的一致PCR复制读取(最少两个)分组以生成每个mRNA序列的共有序列。通过经引物修剪的序列内的已知同种型特异性恒定区的模糊匹配来验证同型特异性引发。使用IgBLAST确定V(D)J种系区段和重排结构,并在适当的情况下用IMGT/HighV-QUEST来验证,通过Change-O和自定义脚本进行解析。
通过如在Change-O中实施的在具有匹配的IGHV基因、IGHJ基因和接合长度的功能性V(D)J序列组内的单联簇集来分配克隆。对于3百万个循环细胞数据集,将使用对称化转换/颠换模型的加权克隆内距离4.0用作克隆内的最近邻距离截止值。
实施例14-小液滴免疫受体内容物过滤和配对保真度计算
可以用这种条码化方法以以下两种方式评估从小液滴回收B细胞序列的精确度:使用小液滴内mRNA序列一致性,以及通过交叉级分配对一致性。在每个小液滴内,每个基因座捕获多个mRNA;从一个细胞表达的V(D)J序列应该一致。使用多重比对V(D)J区段的2%序列多样性(平均成对核苷酸差异pi55<0.02)的截止值来限定序列一致性,将每个小液滴存在超过一个生产性VDJ和一个生产性VJ序列生物信息学地标记为推定的免疫受体包含或多细胞占据。针对每个等位基因排除的小液滴构建重链和轻链共有序列,并将其用于克隆限定和交叉级分配对分析。对于3百万个循环B细胞数据集,每个VH谱系与数据集中>20,000个轻链克隆中的一个(理想情况下)相关联。在具有VHVL对的259,368个免疫基因座排除的小液滴中,10,870个VDJ重链基因重排簇集存在于6个物理分隔的乳液级分的至少两个中。这些簇集代表扩增的谱系或相同VJ外显子的独立但相似的重排。当两个复制中的VDJ重排与一致VJ重排配对时,两个实验均独立地产生真阳性(对于2,604个具有更罕见重排的克隆,35,922个可能成对比较中有33,157个)。因此,每个复制的精确度为96.1%(0.923^0.5)。
实施例15-HIV bNAb候选序列的发现
通过针对与已知bNAb HCDR3s、VDJ序列和使用tblastx、MUSCLE和PhyML从文献中选出的供体17谱系的相似性甄选我们的38,620个VHVL对来发现针对HIV的新的天然配对的广泛中和抗体(BNAb),随后手动检查全V(D)J氨基酸序列的系统树以选择散布有已知bNAb序列的抗体候选物。
实施例16-HIV bNAb蛋白的表达和纯化
合成抗体序列并将其克隆到先前描述的重链和轻链载体中。根据制造商的方案使用293fectin(Invitrogen)将重链和轻链质粒共转染(1:1比例)在293FreeStyle细胞中。转染后四天收获抗体上清液并通过蛋白-A亲和层析进行纯化。在用于进一步测定之前将纯化的抗体缓冲液交换为PBS。
实施例17-假病毒生产和中和测定
通过用HIV-1Env表达质粒和Env缺陷的基因组骨架质粒(pSG3ΔEnv)转染293T细胞来生成假病毒。转染后72hr收获假病毒用于中和测定。使用单轮复制假病毒测定和TZM-B1靶细胞评估中和活性。简言之,将TZM-B1细胞接种在96孔平底板中。向该板添加假病毒,其在37℃下与抗体的连续稀释一起预温育1hr。一旦裂解并添加Bright-Glo萤光素酶底物(Promega),在感染后的72hr对萤光素酶报道基因表达进行定量。为了确定IC50值,通过非线性回归拟合剂量-响应曲线。
实施例18-卵巢肿瘤靶链的鉴别
在乳液中从卵巢解离的肿瘤组织同时捕获BCR和TCR后,使用如先前所述的分子和小液滴条码来过滤读取,但随后寻找四种可能的靶链类型(BCR VH、BCR VL、TCR Vα、TCR Vβ)中每一种的存在。如果靶链由至少两个mRNA支持且每个mRNA至少有两个测序读取,则保留靶链。进一步分析仅含有BCR VHVL对或TCR VαVβ对的所有小液滴条码。基于不同的CDR3氨基酸序列判定BCR重链和TCRβ链克隆。
实施例19-通过DNA标记的抗体染色在乳液中进行蛋白质检测
单链的200bp DNA寡核苷酸被设计为含有独特的5bp抗原ID序列,并用5'氨基基团进行修饰(Integrated DNA Technologies)。根据制造商的方案,使用Thunder-Link试剂盒(Innova Biosciences)将小鼠单克隆抗人CD4(BioLegend,#300516)和CD8a(BioLegend,#301018)抗体与DNA寡核苷酸标签缀合。对于乳液前的细胞标记,将两百万个来自外周血的阴性选择的T细胞在400μL细胞缓冲液+2mM EDTA+0.05%叠氮化钠中稀释。将单链鲑鱼精子DNA添加至细胞,以使最终浓度为200μg/mL,并将细胞在室温下旋转五分钟。将CD4和CD8aDNA标记的抗体(各自至最终浓度为5nM)的混合物添加至细胞并在室温下温育30分钟。用细胞缓冲液+2mM EDTA+0.05%叠氮化钠+200μg/mL单链鲑鱼精子DNA将细胞洗涤三次。在进入乳液分析之前,将细胞重悬于细胞缓冲液+0.05%叠氮化钠中。将30,000个细胞用于乳液测序。

Claims (124)

1.一种方法,其包括在多个容器中的容器中进行反应,所述反应包括将包含容器条码序列的容器条码化多核苷酸附接至亲和-寡核苷酸缀合物中的寡核苷酸部分,其中所述亲和-寡核苷酸缀合物与由所述多个容器中的所述容器中的细胞表达的靶抗原结合。
2.如权利要求1所述的方法,其中所述细胞是所述容器内包含的单细胞。
3.如权利要求1或2所述的方法,其中在所述多个容器中的两个或更多个容器中发生反应。
4.如权利要求1-3中任一项所述的方法,其中所述容器包括所述多个容器中的每个容器。
5.如权利要求1-4中任一项所述的方法,其中所述多个容器包括两种或更多种多个容器。
6.如权利要求4或5所述的方法,其中每个容器中的细胞来自相同的样品。
7.如权利要求5所述的方法,其中所述两种或更多种多个容器中的第一多个容器中的容器中的细胞与所述两种或更多种多个容器中的第二多个容器中的容器中的细胞来自相同的样品。
8.如权利要求1-7中任一项所述的方法,其中所述寡核苷酸部分包含抗原标识序列(AID)。
9.如权利要求8所述的方法,其中所述AID被条码化地加至所述靶抗原或所述亲和-寡核苷酸缀合物的亲和部分。
10.如权利要求8或9所述的方法,其中所述抗原标识序列(AID)是已知序列。
11.如权利要求1-10中任一项所述的方法,其中所述容器条码化多核苷酸来自所述容器中的模板容器条码化多核苷酸。
12.如权利要求1-10中任一项所述的方法,其中所述方法进一步包括对所述寡核苷酸或其扩增子进行测序以获得序列信息。
13.如权利要求12所述的方法,其中所述方法进一步包括基于所述序列信息确定所述容器中的细胞的特征。
14.如权利要求12或13所述的方法,其中所述序列信息包含抗原标识(AID)序列或其互补序列并且/或者包含具有所述AID序列的分子的拷贝数。
15.如权利要求12-14中任一项所述的方法,其中所述方法进一步包括基于所述序列信息确定所述单细胞的特征。
16.如权利要求15所述的方法,其中所述特征为表型。
17.如权利要求16所述的方法,其中所述表型为免疫表型。
18.如权利要求1-17中任一项所述的方法,其中所述方法进一步包括使所述亲和-寡核苷酸缀合物与包含所述单细胞的多个细胞接触。
19.如权利要求18所述的方法,其中所述接触在将所述单细胞隔离在所述容器中之前。
20.如权利要求18或19所述的方法,其中所述方法进一步包括在所述接触之后洗涤所述多个细胞。
21.如权利要求1-20中任一项所述的方法,其中所述容器不包含不与靶抗原结合的亲和-寡核苷酸缀合物。
22.如权利要求1-21中任一项所述的方法,其中所述方法进一步包括将所述单细胞隔离在所述容器中。
23.如权利要求22所述的方法,其中在所述隔离之前使所述单细胞与所述亲和-寡核苷酸缀合物结合。
24.如权利要求1-23中任一项所述的方法,其中所述方法进一步包括裂解所述单细胞。
25.如权利要求24所述的方法,其中所述裂解在将所述单细胞隔离在所述容器中之后。
26.如权利要求1-25中任一项所述的方法,其中所述多个细胞是多个未分选的细胞。
27.如权利要求1-26中任一项所述的方法,其中所述多个容器中的第一容器中的容器条码化多核苷酸或其扩增子的容器条码序列不同于所述多个容器中的第二容器中的容器条码化多核苷酸或其扩增子的容器条码序列。
28.如权利要求1-27中任一项所述的方法,其中所述多个容器中的单个容器中的每个容器条码化多核苷酸或其扩增子的容器条码序列包含相同的容器条码序列。
29.如权利要求1-28中任一项所述的方法,其中所述多个容器中的任何单个容器中的每个容器条码化多核苷酸及其扩增子的容器条码序列相对于所述多个容器中的任何其他单个容器中的每个容器条码化多核苷酸及其扩增子的容器条码序列是独特的。
30.如权利要求1-29中任一项所述的方法,其中所述方法进一步包括将包含容器条码的容器条码化多核苷酸附接至来自所述细胞的细胞多核苷酸。
31.如权利要求30所述的方法,其中将容器条码化多核苷酸附接至亲和-寡核苷酸缀合物中的寡核苷酸和将容器条码化多核苷酸附接至来自所述单细胞的细胞多核苷酸同时进行。
32.如权利要求1-31中任一项所述的方法,其中所述方法进一步包括扩增所述寡核苷酸或其互补体。
33.如权利要求30-32中任一项所述的方法,其中所述方法进一步包括扩增所述细胞多核苷酸或其互补体。
34.如权利要求33所述的方法,其中所述扩增所述寡核苷酸或其互补体和所述扩增所述细胞多核苷酸或其互补体同时进行。
35.如权利要求30-34中任一项所述的方法,其中所述细胞多核苷酸的容器条码序列与所述寡核苷酸的容器条码序列相同。
36.如权利要求1-35中任一项所述的方法,其中所述方法进一步包括将来自所述多个容器中的两个或更多个容器的寡核苷酸或其扩增子合并。
37.如权利要求36所述的方法,其中所述方法进一步包括将来自所述多个容器中的两个或更多个容器的寡核苷酸或其扩增子和细胞多核苷酸或其扩增子合并。
38.如权利要求36或37所述的方法,其中所述合并在测序之前。
39.如权利要求1-38中任一项所述的方法,其中所述亲和-寡核苷酸缀合物包含多个不同的亲和-寡核苷酸缀合物。
40.如权利要求39所述的方法,其中所述多个亲和-寡核苷酸缀合物中的每个亲和-寡核苷酸缀合物包含独特的抗原标识(AID)序列。
41.如权利要求1-40中任一项所述的方法,其中所述寡核苷酸包含条码化地加至多个亲和-寡核苷酸缀合物分子中的单个亲和-寡核苷酸缀合物分子的亲和分子条码(AMB)序列。
42.如权利要求41所述的方法,其中所述多个亲和-寡核苷酸缀合物分子中的每个亲和-寡核苷酸缀合物分子包含独特的亲和分子条码(AMB)序列。
43.如权利要求1-42中任一项所述的方法,其中所述寡核苷酸包含融合序列,并且所述附接包括将所述容器条码化多核苷酸附接至该融合序列。
44.如权利要求1-43中任一项所述的方法,其中所述寡核苷酸包含引物结合序列。
45.如权利要求1-44中任一项所述的方法,其中所述寡核苷酸包含恒定序列。
46.如权利要求1-45中任一项所述的方法,其中所述方法进一步包括对所述寡核苷酸、其互补体、其扩增产物或它们的组合进行测序,从而产生寡核苷酸序列读取。
47.如权利要求46所述的方法,其中所述方法进一步包括将一个或多个第一寡核苷酸序列读取与一个或多个第二寡核苷酸序列读取进行比较。
48.如权利要求46或47所述的方法,其中所述方法进一步包括分析所述寡核苷酸序列读取。
49.如权利要求46-48中任一项所述的方法,其中所述方法进一步包括分析所述寡核苷酸序列读取的容器条码序列。
50.如权利要求46-49中任一项所述的方法,其中所述方法进一步包括分析所述寡核苷酸序列读取的抗原标识(AID)序列。
51.如权利要求46-50中任一项所述的方法,其中所述方法进一步包括分析所述寡核苷酸序列读取的亲和分子条码(AMB)序列。
52.如权利要求48-51中任一项所述的方法,其中所述分析包括测定一个或多个容器条码序列、一个或多个AID序列、一个或多个亲和分子条码(AMB)序列或其组合的频率。
53.如权利要求48-52中任一项所述的方法,其中所述分析包括比较。
54.如权利要求46-53中任一项所述的方法,其中所述方法进一步包括将寡核苷酸序列读取的抗原标识(AID)序列与寡核苷酸序列读取的亲和分子条码(AMB)序列进行比较。
55.如权利要求30-54中任一项所述的方法,其中所述方法进一步包括对所述细胞多核苷酸、其互补体、其扩增产物或它们的组合进行测序,从而产生细胞多核苷酸序列读取。
56.如权利要求55所述的方法,其中所述方法进一步包括将寡核苷酸序列读取与所述细胞多核苷酸序列读取进行比较。
57.如权利要求55或56所述的方法,其中所述方法进一步包括将寡核苷酸序列读取的容器条码序列与所述细胞多核苷酸序列读取的容器条码序列进行比较。
58.如权利要求55-54中任一项所述的方法,其中所述方法进一步包括比较所述细胞多核苷酸序列读取。
59.如权利要求55-58中任一项所述的方法,其中所述方法进一步包括分析所述细胞多核苷酸序列读取的容器条码序列。
60.如权利要求55-59中任一项所述的方法,其中所述方法进一步包括分析所述细胞多核苷酸序列读取的分子条码序列。
61.如权利要求46-61中任一项所述的方法,其中所述方法进一步包括基于所述分析或所述比较来确定细胞的特征。
62.如权利要求46-61中任一项所述的方法,其中所述方法进一步包括基于所述寡核苷酸序列读取选择抗体或TCR。
63.如权利要求55-62中任一项所述的方法,其中所述方法包括基于所述细胞多核苷酸序列读取选择抗体或TCR。
64.如权利要求1-63中任一项所述的方法,其中附接至所述寡核苷酸的容器条码化多核苷酸和附接至所述细胞多核苷酸的容器条码化多核苷酸来自所述容器中相同的模板容器条码化多核苷酸。
65.如权利要求1-64中任一项所述的方法,其中附接至所述寡核苷酸的容器条码化多核苷酸是模板容器条码化多核苷酸的扩增产物。
66.如权利要求64或65所述的方法,其中附接至所述细胞多核苷酸的容器条码化多核苷酸是所述模板容器条码化多核苷酸的扩增产物。
67.如权利要求1-66中任一项所述的方法,其中所述容器包含固体支持体。
68.如权利要求1-66中任一项所述的方法,其中所述容器不包含固体支持体。
69.如权利要求1-68中任一项所述的方法,其中所述多个容器中的每个容器均包含单细胞。
70.如权利要求1-69中任一项所述的方法,其中所述容器是孔、乳液或小液滴。
71.如权利要求1-70中任一项所述的方法,其中所述模板容器条码化多核苷酸不与固体支持体结合。
72.如权利要求1-70中任一项所述的方法,其中所述模板容器条码化多核苷酸与固体支持体结合。
73.如权利要求1-72中任一项所述的方法,其中所述方法进一步包括将多个分子条码化多核苷酸中的分子条码化多核苷酸的分子条码序列附接至所述细胞多核苷酸,其中所述分子条码序列被条码化地加至单细胞多核苷酸分子及其扩增子。
74.如权利要求1-73中任一项所述的方法,其中所述附接包括将容器多核苷酸与所述寡核苷酸连接。
75.如权利要求1-74中任一项所述的方法,其中所述附接包括采用酶将所述容器多核苷酸附接至所述寡核苷酸。
76.如权利要求1-75中任一项所述的方法,其中所述附接包括使所述容器多核苷酸与所述寡核苷酸杂交。
77.如权利要求76所述的方法,其中所述附接进一步包括延伸所述寡核苷酸。
78.如权利要求1-77中任一项所述的方法,其中所述附接包括扩增模板容器条码化多核苷酸。
79.如权利要求1-78中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分与所述单细胞的细胞外抗原结合。
80.如权利要求1-79中任一项所述的方法,其中所述单细胞的细胞外抗原是对免疫细胞具有特异性的抗原。
81.如权利要求80所述的方法,其中所述单细胞的细胞外抗原是对T细胞具有特异性的抗原或由T细胞表达的抗原。
82.如权利要求81所述的方法,其中所述细胞外抗原是CD4。
83.如权利要求81所述的方法,其中所述细胞外抗原是CD8。
84.如权利要求81所述的方法,其中所述细胞外抗原选自CD154、CD4、CD8、CD137、CD40L、CD80、CD86、CD11c、CD25、CD69、CD44、CD125、CD2、CD3、CD5、CD14和CD19。
85.如权利要求80所述的方法,其中所述单细胞的细胞外抗原是对B细胞具有特异性的抗原或由B细胞表达的抗原。
86.如权利要求85所述的方法,其中所述细胞外抗原是免疫球蛋白。
87.如权利要求1-86中任一项所述的方法,其中所述寡核苷酸是双链的。
88.如权利要求1-86中任一项所述的方法,其中所述寡核苷酸是单链的。
89.如权利要求1-88中任一项所述的方法,其中所述寡核苷酸是DNA。
90.如权利要求1-88中任一项所述的方法,其中所述寡核苷酸是RNA。
91.如权利要求1-90中任一项所述的方法,其中所述细胞多核苷酸包含可变区序列。
92.如权利要求1-91中任一项所述的方法,其中所述方法进一步包括使含有可变区序列的天然链序列配对。
93.如权利要求1-84和87-92中任一项所述的方法,其中所述单细胞是T细胞。
94.如权利要求1-80和85-92中任一项所述的方法,其中所述单细胞是B细胞。
95.如权利要求30-94中任一项所述的方法,其中所述细胞多核苷酸是DNA。
96.如权利要求30-94中任一项所述的方法,其中所述细胞多核苷酸是RNA。
97.如权利要求96所述的方法,其中所述RNA是mRNA。
98.如权利要求1-97中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分是抗体或其片段。
99.如权利要求1-97中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分是肽。
100.如权利要求1-97中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分是蛋白质。
101.如权利要求1-97中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分是适体。
102.如权利要求1-97中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分是小分子。
103.如权利要求1-97中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分是药物。
104.如权利要求1-97中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分是细胞。
105.如权利要求104所述的方法,其中所述细胞是抗原呈递细胞(APC)。
106.如权利要求1-97中任一项所述的方法,其中所述亲和-寡核苷酸缀合物的亲和部分包含主要组织相容性复合体(MHC)或其功能或结合部分。
107.如权利要求106所述的方法,其中所述亲和部分包含所述MHC的多聚体,任选地包含所述MHC的四聚体。
108.如权利要求106或107所述的方法,其中所述MHC是可溶形式。
109.如权利要求106-108中任一项所述的方法,其中所述MHC与肽结合并且/或者在所述MHC的沟槽内含有肽。
110.如权利要求109所述的方法,其中所述肽是合成肽。
111.如权利要求106-110中任一项所述的方法,其中所述MHC与所述单细胞的T细胞受体(TCR)结合。
112.如权利要求1-97中任一项所述的方法,其中所述亲和部分包含与抗体或嵌合抗原受体(CAR)结合的肽,并且/或者其中所述靶标是抗体或CAR。
113.如权利要求112所述的方法,其中所述亲和部分是或包含由所述抗体或所述嵌合抗原受体特异性识别的抗原或表位,并且/或者包含与其特异性结合的抗体,任选地包含与其抗原结合部分特异性结合的抗独特型抗体。
114.一种组合物,其包含多个容器,其中所述多个容器中的容器包含:
(a)来自包含多个细胞的样品的单细胞,以及
(b)包含容器条码序列的容器条码化多核苷酸
其中所述容器进一步包含与所述单细胞的靶抗原结合的亲和-寡核苷酸缀合物,或所述亲和-寡核苷酸缀合物中的寡核苷酸部分。
115.如权利要求114所述的组合物,其中在所述多个容器中的两个或更多个容器中发生反应。
116.如权利要求114或115所述的组合物,其中所述容器包括所述多个容器中的每个容器。
117.如权利要求114-116中任一项所述的组合物,其中所述多个容器包括两种或更多种多个容器。
118.如权利要求116或117所述的组合物,其中每个容器中的细胞来自相同的样品。
119.如权利要求117所述的组合物,其中所述两种或更多种多个容器中的第一多个容器中的容器中的细胞与所述两种或更多种多个容器中的第二多个容器中的容器中的细胞来自相同的样品。
120.如权利要求114-119中任一项所述的组合物,其中所述容器条码化多核苷酸或其互补体附接至所述亲和-寡核苷酸缀合物中的寡核苷酸。
121.如权利要求114-120中任一项所述的组合物,其中所述单细胞被裂解。
122.一种组合物,其包含多个容器,其中所述多个容器中的容器包含:
(a)来自包含多个细胞的样品的单个裂解细胞,以及
(b)包含与所述单个裂解细胞的靶抗原结合的亲和部分的亲和-寡核苷酸缀合物,或所述亲和-寡核苷酸缀合物中的寡核苷酸部分;
其中所述亲和-寡核苷酸缀合物中的寡核苷酸部分包含容器条码序列,并且其中来自所述单个裂解细胞的细胞多核苷酸包含相同的容器条码序列。
123.一种试剂盒,其包含:
(a)第一器皿,其包含含有第一抗原标识(AID)序列的第一寡核苷酸,其中所述第一AID序列是已知序列;
(b)第二器皿,其包含含有第二抗原标识(AID)序列的第二寡核苷酸,其中所述第二AID序列是已知序列并且不同于所述第一AID序列;
(c)一个或多个第三器皿,其包含能够使所述第一寡核苷酸与第一亲和分子缀合的试剂和能够使所述第二寡核苷酸与第二亲和分子缀合的试剂;
(d)一套说明书,其描述了如何使所述第一寡核苷酸与所述第一亲和分子缀合以及如何使所述第二寡核苷酸与所述第二亲和分子缀合。
124.一种试剂盒,其包含:
(a)第一器皿,其包含含有抗原标识(AID)序列的寡核苷酸,其中所述AID序列是已知序列;
(b)第二器皿,其包含能够使所述寡核苷酸与亲和分子缀合的试剂;
(c)第三器皿,其包含多个容器条码化多核苷酸;以及
(d)一套说明书,其描述了当与所述亲和分子缀合时如何将所述多个容器条码化多核苷酸中的容器条码化多核苷酸附接至所述寡核苷酸。
CN201680068588.1A 2015-09-24 2016-09-24 亲和-寡核苷酸缀合物及其用途 Active CN108291257B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562232209P 2015-09-24 2015-09-24
US62/232,209 2015-09-24
PCT/US2016/053598 WO2017053905A1 (en) 2015-09-24 2016-09-24 Affinity-oligonucleotide conjugates and uses thereof

Publications (2)

Publication Number Publication Date
CN108291257A true CN108291257A (zh) 2018-07-17
CN108291257B CN108291257B (zh) 2023-12-29

Family

ID=57121536

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201680068588.1A Active CN108291257B (zh) 2015-09-24 2016-09-24 亲和-寡核苷酸缀合物及其用途
CN201780072719.8A Pending CN109996889A (zh) 2015-09-24 2017-01-12 亲和-寡核苷酸缀合物及其用途

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201780072719.8A Pending CN109996889A (zh) 2015-09-24 2017-01-12 亲和-寡核苷酸缀合物及其用途

Country Status (17)

Country Link
US (4) US11156611B2 (zh)
EP (3) EP3353326B1 (zh)
JP (2) JP6869233B2 (zh)
KR (2) KR20180085717A (zh)
CN (2) CN108291257B (zh)
AU (1) AU2016326737B2 (zh)
BR (1) BR112018005937A2 (zh)
CA (2) CA2999888C (zh)
ES (1) ES2928681T3 (zh)
IL (1) IL258248B (zh)
MX (3) MX2018003532A (zh)
MY (2) MY193806A (zh)
PH (2) PH12018500647A1 (zh)
RU (1) RU2763554C2 (zh)
SA (1) SA518391159B1 (zh)
SG (1) SG10201912906RA (zh)
WO (1) WO2017053905A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111223532A (zh) * 2019-11-14 2020-06-02 腾讯科技(深圳)有限公司 确定目标化合物的反应物的方法、设备、装置、介质
CN114555827A (zh) * 2019-08-12 2022-05-27 使命生物公司 用于对相同单细胞中的蛋白质表达、单核苷酸变异和拷贝数变异进行多组学同时检测的方法、系统和设备

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2865575C (en) 2012-02-27 2024-01-16 Cellular Research, Inc. Compositions and kits for molecular counting
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
AU2013302756C1 (en) 2012-08-14 2018-05-17 10X Genomics, Inc. Microcapsule compositions and methods
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3567116A1 (en) 2012-12-14 2019-11-13 10X Genomics, Inc. Methods and systems for processing polynucleotides
KR102190198B1 (ko) 2013-02-08 2020-12-14 10엑스 제노믹스, 인크. 폴리뉴클레오티드 바코드 생성
AU2014312208B2 (en) 2013-08-28 2019-07-25 Becton, Dickinson And Company Massively parallel single cell analysis
DE202015009494U1 (de) 2014-04-10 2018-02-08 10X Genomics, Inc. Fluidische Vorrichtungen und Systeme zur Einkapselung und Partitionierung von Reagenzien, und deren Anwendungen
EP3155426B1 (en) 2014-06-13 2023-07-19 Immudex ApS General detection and isolation of specific cells by binding of labeled molecules
MX2016016902A (es) 2014-06-26 2017-03-27 10X Genomics Inc Metodos para analizar acidos nucleicos de celulas individuales o poblaciones de celulas.
CN107002128A (zh) 2014-10-29 2017-08-01 10X 基因组学有限公司 用于靶核酸测序的方法和组合物
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
SG11201705615UA (en) 2015-01-12 2017-08-30 10X Genomics Inc Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
AU2016222719B2 (en) 2015-02-24 2022-03-31 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
EP3262407B1 (en) 2015-02-24 2023-08-30 10X Genomics, Inc. Partition processing methods and systems
CN107208158B (zh) 2015-02-27 2022-01-28 贝克顿迪金森公司 空间上可寻址的分子条形编码
EP3835431B1 (en) 2015-03-30 2022-11-02 Becton, Dickinson and Company Methods for combinatorial barcoding
EP3286326A1 (en) 2015-04-23 2018-02-28 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
JP6940484B2 (ja) 2015-09-11 2021-09-29 セルラー リサーチ, インコーポレイテッド ライブラリー正規化のための方法および組成物
CN108289954B (zh) 2015-09-24 2022-05-31 阿布维特罗有限责任公司 Hiv抗体组合物和使用方法
KR20180085717A (ko) 2015-09-24 2018-07-27 에이비비트로, 엘엘씨 친화성-올리고뉴클레오타이드 콘쥬게이트 및 그것의 사용
DK3882357T3 (da) 2015-12-04 2022-08-29 10X Genomics Inc Fremgangsmåder og sammensætninger til analyse af nukleinsyrer
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
CN109791157B (zh) 2016-09-26 2022-06-07 贝克顿迪金森公司 使用具有条形码化的寡核苷酸序列的试剂测量蛋白质表达
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) * 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
GB201622222D0 (en) 2016-12-23 2017-02-08 Cs Genetics Ltd Reagents and methods for molecular barcoding of nucleic acids of single cells
EP4029939B1 (en) 2017-01-30 2023-06-28 10X Genomics, Inc. Methods and systems for droplet-based single cell barcoding
EP3577232A1 (en) 2017-02-01 2019-12-11 Cellular Research, Inc. Selective amplification using blocking oligonucleotides
SG11201907762RA (en) * 2017-03-24 2019-10-30 Nat Univ Singapore Methods for multiplex detection of molecules
WO2018203576A1 (ja) 2017-05-02 2018-11-08 国立大学法人 東京大学 一細胞の非破壊的計測情報とゲノム関連情報とを一体的に検出する方法
WO2018203575A1 (ja) * 2017-05-02 2018-11-08 国立大学法人 東京大学 細胞またはその由来物の動的変化のモニタリング方法およびそれを用いた細胞分類方法
CN109526228B (zh) 2017-05-26 2022-11-25 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
WO2018218222A1 (en) 2017-05-26 2018-11-29 Goldfless Stephen Jacob High-throughput polynucleotide library sequencing and transcriptome analysis
US10844372B2 (en) 2017-05-26 2020-11-24 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
WO2019051335A1 (en) 2017-09-07 2019-03-14 Juno Therapeutics, Inc. METHODS OF IDENTIFYING CELLULAR CHARACTERISTICS RELATED TO RESPONSES ASSOCIATED WITH CELL THERAPY
EP3625361A1 (en) 2017-11-15 2020-03-25 10X Genomics, Inc. Functionalized gel beads
EP3710594B1 (en) * 2017-11-16 2023-07-19 The Regents of The University of Colorado, A Body Corporate Methods to measure functional heterogeneity among single cells
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
GB201801481D0 (en) * 2018-01-30 2018-03-14 Immunovia Ab Methods, conjugates and systems
WO2019157529A1 (en) 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
EP3775271A1 (en) 2018-04-06 2021-02-17 10X Genomics, Inc. Systems and methods for quality control in single cell processing
EP3788170A1 (en) 2018-05-03 2021-03-10 Becton, Dickinson and Company Molecular barcoding on opposite transcript ends
EP3788171B1 (en) 2018-05-03 2023-04-05 Becton, Dickinson and Company High throughput multiomics sample analysis
WO2019226631A1 (en) * 2018-05-21 2019-11-28 The Regents Of The University Of California Single cell mapping and transcriptome analysis
WO2019236571A1 (en) * 2018-06-04 2019-12-12 Chan Zuckerberg Biohub, Inc. Compositions and methods involving non-natural aptamer libraries
EP3861134A1 (en) 2018-10-01 2021-08-11 Becton, Dickinson and Company Determining 5' transcript sequences
JP2022506546A (ja) 2018-11-08 2022-01-17 ベクトン・ディキンソン・アンド・カンパニー ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析
WO2020102287A1 (en) * 2018-11-14 2020-05-22 University Of Hawaii Compositions and methods for the synthesis and identification of covalent aptamers
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
WO2020132087A1 (en) * 2018-12-18 2020-06-25 Mbl International Corp. COMPOSITIONS OF STREPTAVIDIN-OLIGO CONJUGATES OF VARYING pMHC OCCUPANCY
CA3125560A1 (en) * 2019-01-04 2020-07-09 Repertoire Immune Medicines, Inc. Peptide libraries and methods of use thereof
ES2945227T3 (es) 2019-01-23 2023-06-29 Becton Dickinson Co Oligonucleótidos asociados con anticuerpos
JP6821230B2 (ja) * 2019-02-04 2021-01-27 国立大学法人愛媛大学 CARライブラリおよびscFvの製造方法
CN109979528B (zh) * 2019-03-28 2021-06-25 广州基迪奥生物科技有限公司 一种单细胞免疫组库测序数据的分析方法
CN113795591A (zh) * 2019-04-02 2021-12-14 使命生物公司 表征肿瘤并且识别肿瘤异质性的方法和系统
CA3138806A1 (en) 2019-05-22 2020-11-26 Dalia Dhingra Method and apparatus for simultaneous targeted sequencing of dna, rna and protein
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
EP4041868A1 (en) * 2019-10-03 2022-08-17 Regeneron Pharmaceuticals, Inc. High-throughput method to screen cognate t cell and epitope reactivities in primary human cells
AU2020357191A1 (en) * 2019-10-05 2022-06-02 Mission Bio, Inc. Methods, systems and apparatus for copy number variations and single nucleotide variations simultaneously detected in single-cells
WO2021081466A1 (en) * 2019-10-25 2021-04-29 Phitonex, Inc. Polynucleotide-linked bioconjugates and methods of making and using
US11773436B2 (en) 2019-11-08 2023-10-03 Becton, Dickinson And Company Using random priming to obtain full-length V(D)J information for immune repertoire sequencing
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
IL296435A (en) * 2020-03-18 2022-11-01 Chan Zuckerberg Biohub Inc Single-cell combinatorial index sequencing cytometry
WO2021231779A1 (en) 2020-05-14 2021-11-18 Becton, Dickinson And Company Primers for immune repertoire profiling
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022076914A1 (en) * 2020-10-09 2022-04-14 10X Genomics, Inc. Methods and compositions for profiling immune repertoire
EP4247967A1 (en) 2020-11-20 2023-09-27 Becton, Dickinson and Company Profiling of highly expressed and lowly expressed proteins
WO2022182672A1 (en) * 2021-02-23 2022-09-01 10X Genomics, Inc. Single cell glycan profiling
JPWO2022190733A1 (zh) * 2021-03-10 2022-09-15
WO2023086847A1 (en) * 2021-11-10 2023-05-19 Encodia, Inc. Methods for barcoding macromolecules in individual cells
WO2023108000A1 (en) * 2021-12-07 2023-06-15 Fred Hutchinson Cancer Center Synthetic constructs and methods for processing antigen-specific cells
WO2023225201A1 (en) * 2022-05-20 2023-11-23 10X Genomics, Inc. Compositions and methods for characterizing t cell, or t cell-like, receptors from single cells
WO2024015378A1 (en) * 2022-07-13 2024-01-18 10X Genomics, Inc. Methods and systems for characterizing antigen-binding molecules expressed by immune cells

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012048341A1 (en) * 2010-10-08 2012-04-12 President And Fellows Of Harvard College High-throughput single cell barcoding
WO2012048340A2 (en) * 2010-10-08 2012-04-12 President And Fellows Of Harvard College High-throughput immune sequencing
WO2014144495A1 (en) * 2013-03-15 2014-09-18 Abvitro, Inc. Single cell bar-coding for antibody discovery
WO2015006379A2 (en) * 2013-07-08 2015-01-15 The Trustees Of Columbia University In The City Of New York Selection of cells for elimination
WO2015103339A1 (en) * 2013-12-30 2015-07-09 Atreca, Inc. Analysis of nucleic acids associated with single cells using nucleic acid barcodes

Family Cites Families (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5019384A (en) 1986-06-30 1991-05-28 Massachusetts Institute Of Technology Immunonodulating compositions and their use
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
DE68921982T4 (de) 1988-06-14 1996-04-25 Cetus Oncology Corp Kupplungsmittel und sterisch gehinderte, mit disulfid gebundene konjugate daraus.
US5168038A (en) 1988-06-17 1992-12-01 The Board Of Trustees Of The Leland Stanford Junior University In situ transcription in cells and tissues
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5242974A (en) 1991-11-22 1993-09-07 Affymax Technologies N.V. Polymer reversal on solid surfaces
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
DE3920358A1 (de) 1989-06-22 1991-01-17 Behringwerke Ag Bispezifische und oligospezifische, mono- und oligovalente antikoerperkonstrukte, ihre herstellung und verwendung
US5252743A (en) 1989-11-13 1993-10-12 Affymax Technologies N.V. Spatially-addressable immobilization of anti-ligands on surfaces
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5733523A (en) 1990-12-10 1998-03-31 Akzo Nobel N.V. Targeted delivery of a therapeutic entity using complementary oligonucleotides
JP3266311B2 (ja) 1991-05-02 2002-03-18 生化学工業株式会社 新規ポリペプチドおよびこれを用いる抗hiv剤
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
CA2124087C (en) 1991-11-22 2002-10-01 James L. Winkler Combinatorial strategies for polymer synthesis
US5324633A (en) 1991-11-22 1994-06-28 Affymax Technologies N.V. Method and apparatus for measuring binding affinity
US5550215A (en) 1991-11-22 1996-08-27 Holmes; Christopher P. Polymer reversal on solid surfaces
ES2241710T3 (es) 1991-11-25 2005-11-01 Enzon, Inc. Procedimiento para producir proteinas multivalentes de union a antigeno.
CA2124967C (en) 1991-12-17 2008-04-08 Nils Lonberg Transgenic non-human animals capable of producing heterologous antibodies
US5491074A (en) 1993-04-01 1996-02-13 Affymax Technologies Nv Association peptides
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5858659A (en) 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
US6090555A (en) 1997-12-11 2000-07-18 Affymetrix, Inc. Scanned image alignment systems and methods
US5631734A (en) 1994-02-10 1997-05-20 Affymetrix, Inc. Method and apparatus for detection of fluorescently labeled materials
US5578832A (en) 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
AU2360195A (en) 1994-05-05 1995-11-29 Beckman Instruments, Inc. Oligonucleotide repeat arrays
US5571639A (en) 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US5795716A (en) 1994-10-21 1998-08-18 Chee; Mark S. Computer-aided visualization and analysis system for sequence evaluation
US5599695A (en) 1995-02-27 1997-02-04 Affymetrix, Inc. Printing molecular library arrays using deprotection agents solely in the vapor phase
US5635363A (en) 1995-02-28 1997-06-03 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for the detection, quantitation and purification of antigen-specific T cells
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5624711A (en) 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
SE504798C2 (sv) 1995-06-16 1997-04-28 Ulf Landegren Immunanalys och testkit med två reagens som kan tvärbindas om de adsorberats till analyten
US5968740A (en) 1995-07-24 1999-10-19 Affymetrix, Inc. Method of Identifying a Base in a Nucleic Acid
ATE199572T1 (de) 1995-11-21 2001-03-15 Univ Yale Unimolekulare segmentamplifikation und bestimmung
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
JP2000512744A (ja) 1996-05-16 2000-09-26 アフィメトリックス,インコーポレイテッド 標識材料を検出するシステムおよび方法
EP0912761A4 (en) 1996-05-29 2004-06-09 Cornell Res Foundation Inc DETERMINATION OF DIFFERENCES IN THE NUCLEIC ACID SEQUENCE BY MEANS OF A COMBINATION OF LIGASE DETERMINATION AND POLYMERASE CHAIN REACTION
DE69735313T2 (de) 1996-06-04 2006-11-02 University Of Utah Research Foundation, Salt Lake City Fluoreszenz-Donor-Akzeptor Paar
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
JP4060892B2 (ja) 1997-05-28 2008-03-12 ディサーナ リミテッド タンパク質のin vitroディスプレイ及び進化のための選択粒子としてのリボソーム複合体
EP1027456B1 (en) 1997-10-31 2005-03-16 Affymetrix, Inc. (a Delaware Corporation) Expression profiles in adult and fetal organs
US6428752B1 (en) 1998-05-14 2002-08-06 Affymetrix, Inc. Cleaning deposit devices that form microarrays and the like
US6269846B1 (en) 1998-01-13 2001-08-07 Genetic Microsystems, Inc. Depositing fluid specimens on substrates, resulting ordered arrays, techniques for deposition of arrays
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
US5936324A (en) 1998-03-30 1999-08-10 Genetic Microsystems Inc. Moving magnet scanner
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
JP3813818B2 (ja) 1998-05-01 2006-08-23 アリゾナ ボード オブ リージェンツ オリゴヌクレオチドおよびdna分子のヌクレオチド配列の決定方法
ATE255583T1 (de) 1998-07-10 2003-12-15 Meiji Seika Kaisha Metallkomplexe von chlorinderivaten zum abschirmen von röntgenstrahlen
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
JP2002539849A (ja) 1999-03-26 2002-11-26 ホワイトヘッド インスチチュート フォアー バイオメディカル リサーチ ユニバーサルアレイ
US6582938B1 (en) 2001-05-11 2003-06-24 Affymetrix, Inc. Amplification of nucleic acids
US7306904B2 (en) 2000-02-18 2007-12-11 Olink Ab Methods and kits for proximity probing
US6686184B1 (en) 2000-05-25 2004-02-03 President And Fellows Of Harvard College Patterning of surfaces utilizing microfluidic stamps including three-dimensionally arrayed channel networks
US7902121B2 (en) 2001-07-02 2011-03-08 The Board Of Trustees Of The Leland Stanford Junior University MHC-antigen arrays for detection and characterization of immune responses
NZ531208A (en) 2001-08-31 2005-08-26 Avidex Ltd Multivalent soluble T cell receptor (TCR) complexes
GB0127564D0 (en) 2001-11-16 2002-01-09 Medical Res Council Emulsion compositions
JP2006507921A (ja) 2002-06-28 2006-03-09 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ 流体分散のための方法および装置
JP4436319B2 (ja) 2002-10-09 2010-03-24 メディジーン リミテッド 単鎖組換えt細胞レセプター
US20060078893A1 (en) 2004-10-12 2006-04-13 Medical Research Council Compartmentalised combinatorial chemistry by microfluidic control
EP3616781A1 (en) 2003-04-10 2020-03-04 President and Fellows of Harvard College Formation and control of fluidic species
EP1658133A1 (en) 2003-08-27 2006-05-24 President And Fellows Of Harvard College Electronic control of fluidic species
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US20050221339A1 (en) 2004-03-31 2005-10-06 Medical Research Council Harvard University Compartmentalised screening by microfluidic control
US7643818B2 (en) 2004-11-22 2010-01-05 Seven Networks, Inc. E-mail messaging to/from a mobile terminal
JP2008535644A (ja) 2005-03-04 2008-09-04 プレジデント・アンド・フエローズ・オブ・ハーバード・カレツジ 多重エマルジョンの形成のための方法および装置
JP5452922B2 (ja) 2005-09-13 2014-03-26 アフィメトリックス・インコーポレーテッド コード化されたマイクロ粒子
US20100137163A1 (en) 2006-01-11 2010-06-03 Link Darren R Microfluidic Devices and Methods of Use in The Formation and Control of Nanoreactors
GB0600927D0 (en) * 2006-01-17 2006-02-22 Glaxosmithkline Biolog Sa Assay and materials therefor
JP2009524825A (ja) 2006-01-27 2009-07-02 プレジデント アンド フェロウズ オブ ハーバード カレッジ 流体ドロップレットの合体
GB0605584D0 (en) 2006-03-20 2006-04-26 Olink Ab Method for analyte detection using proximity probes
US20080003142A1 (en) 2006-05-11 2008-01-03 Link Darren R Microfluidic devices
US8883691B2 (en) 2007-06-25 2014-11-11 Affymetrix, Inc. Encoded microparticles
US8911948B2 (en) 2008-04-30 2014-12-16 Integrated Dna Technologies, Inc. RNase H-based assays utilizing modified RNA monomers
US20090325169A1 (en) 2008-04-30 2009-12-31 Integrated Dna Technologies, Inc. Rnase h-based assays utilizing modified rna monomers
CA3149293C (en) 2008-09-23 2023-09-12 Bio-Rad Laboratories, Inc. Droplet-based assay system
WO2011044186A1 (en) 2009-10-06 2011-04-14 The Board Of Trustees Of The University Of Illinois Human single-chain t cell receptors
CA2907050C (en) 2013-03-15 2023-09-26 Prognosys Biosciences, Inc. Methods for detecting peptide/mhc/tcr binding
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
EP3152232B1 (en) * 2014-06-06 2019-11-13 Herlev Hospital Determining antigen recognition through barcoding of mhc multimers
EP3155426B1 (en) * 2014-06-13 2023-07-19 Immudex ApS General detection and isolation of specific cells by binding of labeled molecules
ES2727656T3 (es) * 2014-09-15 2019-10-17 Abvitro Llc Secuenciación de alto rendimiento de banco de nucleótidos
US10993997B2 (en) 2014-12-19 2021-05-04 The Broad Institute, Inc. Methods for profiling the t cell repertoire
KR20180085717A (ko) * 2015-09-24 2018-07-27 에이비비트로, 엘엘씨 친화성-올리고뉴클레오타이드 콘쥬게이트 및 그것의 사용

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012048341A1 (en) * 2010-10-08 2012-04-12 President And Fellows Of Harvard College High-throughput single cell barcoding
WO2012048340A2 (en) * 2010-10-08 2012-04-12 President And Fellows Of Harvard College High-throughput immune sequencing
WO2014144495A1 (en) * 2013-03-15 2014-09-18 Abvitro, Inc. Single cell bar-coding for antibody discovery
WO2015006379A2 (en) * 2013-07-08 2015-01-15 The Trustees Of Columbia University In The City Of New York Selection of cells for elimination
WO2015103339A1 (en) * 2013-12-30 2015-07-09 Atreca, Inc. Analysis of nucleic acids associated with single cells using nucleic acid barcodes

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114555827A (zh) * 2019-08-12 2022-05-27 使命生物公司 用于对相同单细胞中的蛋白质表达、单核苷酸变异和拷贝数变异进行多组学同时检测的方法、系统和设备
CN111223532A (zh) * 2019-11-14 2020-06-02 腾讯科技(深圳)有限公司 确定目标化合物的反应物的方法、设备、装置、介质
CN111223532B (zh) * 2019-11-14 2023-06-20 腾讯科技(深圳)有限公司 确定目标化合物的反应物的方法、设备、装置、介质

Also Published As

Publication number Publication date
JP2018535652A (ja) 2018-12-06
CN108291257B (zh) 2023-12-29
CA2999888A1 (en) 2017-03-30
JP6869233B2 (ja) 2021-05-12
KR20190052084A (ko) 2019-05-15
RU2019112395A (ru) 2020-10-26
KR20180085717A (ko) 2018-07-27
MX2018003532A (es) 2019-04-25
IL258248A (en) 2018-05-31
EP3516069A1 (en) 2019-07-31
CA2999888C (en) 2024-04-09
US20170268056A1 (en) 2017-09-21
EP3516069B1 (en) 2023-10-11
SG10201912906RA (en) 2020-02-27
RU2018115247A (ru) 2019-10-24
RU2018115247A3 (zh) 2020-02-19
RU2763554C2 (ru) 2021-12-30
PH12018500647A1 (en) 2018-09-24
MX2022012937A (es) 2022-11-08
SA518391159B1 (ar) 2022-02-22
AU2016326737B2 (en) 2023-01-12
CA3037845A1 (en) 2018-03-29
JP7282121B2 (ja) 2023-05-26
MY193806A (en) 2022-10-27
EP3353326B1 (en) 2022-08-24
JP2021118704A (ja) 2021-08-12
US20200088725A1 (en) 2020-03-19
US20220065856A1 (en) 2022-03-03
US10393743B2 (en) 2019-08-27
RU2019112395A3 (zh) 2020-11-30
WO2017053905A1 (en) 2017-03-30
MX2019003272A (es) 2019-09-13
US20190025304A1 (en) 2019-01-24
AU2016326737A1 (en) 2018-04-12
ES2928681T3 (es) 2022-11-21
BR112018005937A2 (pt) 2019-05-21
EP3933047A1 (en) 2022-01-05
MY191035A (en) 2022-05-30
IL258248B (en) 2022-07-01
US11156611B2 (en) 2021-10-26
CN109996889A (zh) 2019-07-09
US11061030B2 (en) 2021-07-13
PH12019500627A1 (en) 2019-08-05
EP3353326A1 (en) 2018-08-01

Similar Documents

Publication Publication Date Title
US20220065856A1 (en) Affinity-oligonucleotide conjugates and uses thereof
US20210293812A1 (en) High throughput process for t cell receptor target identification of natively-paired t cell receptor sequences
EP3631012B1 (en) High-throughput polynucleotide library sequencing and transcriptome analysis
JP6929354B2 (ja) 親和性−オリゴヌクレオチドコンジュゲートおよびその使用
RU2778754C2 (ru) Конъюгаты аффинная часть-олигонуклеотид и их применения

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant