CN109996889A - 亲和-寡核苷酸缀合物及其用途 - Google Patents

亲和-寡核苷酸缀合物及其用途 Download PDF

Info

Publication number
CN109996889A
CN109996889A CN201780072719.8A CN201780072719A CN109996889A CN 109996889 A CN109996889 A CN 109996889A CN 201780072719 A CN201780072719 A CN 201780072719A CN 109996889 A CN109996889 A CN 109996889A
Authority
CN
China
Prior art keywords
sequence
container
tcr
cell
polynucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780072719.8A
Other languages
English (en)
Inventor
弗朗索瓦·维格纳尔特
阮格汉姆·阿德里安·布里格斯
斯蒂芬·J·戈德弗莱斯
布莱恩·J·贝尔蒙特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abu Vitello LLC
Abvitro LLC
Original Assignee
Abu Vitello LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abu Vitello LLC filed Critical Abu Vitello LLC
Priority claimed from PCT/US2017/013274 external-priority patent/WO2018057051A1/en
Publication of CN109996889A publication Critical patent/CN109996889A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56966Animal cells
    • G01N33/56972White blood cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0634Cells from the blood or the immune system
    • C12N5/0636T lymphocytes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/159Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/185Nucleic acid dedicated to use as a hidden marker/bar code, e.g. inclusion of nucleic acids to mark art objects or animals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/7051T-cell receptor (TcR)-CD3 complex
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70514CD4
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70517CD8
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70539MHC-molecules, e.g. HLA-molecules
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • G01N2458/10Oligonucleotides as tagging agents for labelling antibodies

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Hematology (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Treatment Of Liquids With Adsorbents In General (AREA)

Abstract

本文提供了使用亲和‑寡核苷酸缀合物用于单个细胞表征的方法和组合物。本文提供了使用四聚体‑寡核苷酸缀合物用于单个细胞表征的方法和组合物。

Description

亲和-寡核苷酸缀合物及其用途
交叉引用
本申请要求于2016年9月24日提交的国际专利申请第PCT/US2016/053598号的优先权,该国际专利申请通过引用以其整体并入本文。
背景
许多细胞类型可以通过内源性表达的且位于其质膜上的特定组的蛋白质的丰度来鉴定和分类。该现象使得能够利用被称为免疫表型分型的方法研究细胞,在免疫分型中将细胞与对细胞的已知表面蛋白特异性的荧光标记的抗体一起孵育,并且细胞被该荧光标记的抗体结合。流式细胞术通常用于测量每种细胞的表面结合抗体的水平。然而,基于流式细胞术的方法受限于在同一实验中可以同时使用的荧光团的数目。此外,在使用基于流式细胞术的方法的同一实验中可以同时使用的荧光团的数目受到光谱重叠的限制。此外,流式细胞术不适于许多生物学相关的测定和后续DNA测序。
概述
因此,对于对单个细胞进行表征,例如进行免疫表型分型,而没有这些局限的方法存在需要。不同于基于流式细胞术的方法,本文描述的方法使用序列读出(readout)来分析个体细胞的蛋白质,并且不受同一实验中可以同时使用的荧光团的数目或其光谱重叠的限制。此外,本文描述的方法适于许多生物学相关的测定和后续DNA测序。本文描述的方法利用亲和-寡核苷酸缀合物(例如,抗体-寡核苷酸缀合物或四聚体-寡核苷酸缀合物)。缀合物的寡核苷酸包含抗原ID(AID)序列,该序列条形码化地加至(barcoded to)亲和-寡核苷酸缀合物的亲和部分特异性结合的表面抗原的。因此,使用本文描述的方法可以在不需要荧光团的情况下分析单个细胞的抗原(例如,表面蛋白)。例如,展示出的单个细胞的表面蛋白可以从抗原ID序列识别。作为另一示例,展示出的单个细胞的T细胞受体(TCR)或B细胞受体(BCR)可以从抗原ID序列识别。在一些方面中,展示在细胞表面上的TCR或BCR的结合亲和力可以使用本文描述的亲和-寡核苷酸缀合物来确定。单个细胞的一种或更多种表面蛋白可以用于定义该单个细胞的身份、特征或相关性。
本文描述的方法的亲和-寡核苷酸缀合物可以用于克服以下问题:缓慢的细胞分选、与细胞分选相关的目标产量降低、有限数目的输出流以及与亲和-寡核苷酸缀合物的定量性质诸如亲和力不对应的选定箱元(bin)。描绘的示例性亲和-寡核苷酸缀合物可以替代或增强在容器中采用四聚体结合的单个细胞测量的分选。描绘的示例性亲和-寡核苷酸缀合物可以在本文描述的方法中用于同时获得TCR配对序列、克隆丰度和相对的四聚体亲和力。例如,为四聚体-寡核苷酸缀合物的亲和-寡核苷酸缀合物可以在本文描述的方法中用于同时获得与四聚体的肽结合的TCR配对序列,确定TCR与四聚体-寡核苷酸缀合物的主要组织相容性复合物(MHC)-肽复合物结合的亲和力,并且区分出与对四聚体-寡核苷酸缀合物的MHC-肽复合物具有高结合亲和力的TCR相比,对其具有低结合亲和力的TCR。作为另一示例,为四聚体-寡核苷酸缀合物的亲和-寡核苷酸缀合物可以在本文描述的方法中用于同时获得与四聚体的B-细胞受体抗原结合的BCR配对序列,确定BCR与四聚体-寡核苷酸缀合物的B-细胞受体抗原结合的亲和力,并且区分与对四聚体-寡核苷酸缀合物的B-细胞受体抗原具有高结合亲和力的BCR的具有低结合亲和力的BCR。
本文描述了用亲和-寡核苷酸缀合物对容器(例如,乳液)中的细胞进行表征,例如免疫表型分型,的方法。在一些实施方案中,方法用于以与基于乳液的单个细胞分析相容的方式识别细胞亚群。在一些实施方案中,方法用于以与基于乳液的单个细胞分析相容的方式识别对抗原特异的免疫细胞。在一些实施方案中,在细胞分析之前,表面蛋白特异性抗体与寡核苷酸缀合。在一些实施方案中,寡核苷酸被设计为含有对于缀合的抗体的靶特异性独特的序列基序。在一些实施方案中,寡核苷酸被设计为含有对于缀合的四聚体的靶特异性独特的序列基序。寡核苷酸可以与亲和-寡核苷酸缀合物的亲和部分(例如,抗体或四聚体)共价地或非共价地缀合(例如,生物素-寡核苷酸与链霉亲和素-抗体缀合)。
方法可以包括将细胞在具有一种或更多种亲和-寡核苷酸缀合物的混合物或溶液中孵育。可以洗涤细胞以去除未结合的亲和-寡核苷酸缀合物。然后将细胞封装在容器,例如乳液中。细胞可以以每个容器单个细胞的密度存在于容器中。因此,容器例如液滴(droplet)内的亲和-寡核苷酸缀合物,通过例如特异性抗体-表面蛋白相互作用结合至细胞表面。方法可以包括将容器特异性DNA序列(例如,独特的容器条形码)附接至亲和-缀合的寡核苷酸。另外的细胞DNA或mRNA分析、表型测量、功能测试、细胞分选或其他反应可以在将亲和-缀合的寡核苷酸条形码化(例如,用DNA条形码)之前、同时或之后进行。
方法可以包括将细胞在具有一种或更多种四聚体-寡核苷酸缀合物的混合物或溶液中孵育。可以洗涤细胞以去除未结合的四聚体-寡核苷酸缀合物。然后将细胞封装在容器,例如乳液中。细胞可以以每个容器单个细胞的密度存在于容器中。因此,容器例如液滴内的四聚体-寡核苷酸缀合物,通过例如特异性TCR-MHC-肽复合物相互作用或通过四聚体的特异性BCR-B-细胞受体抗原相互作用结合至细胞表面。方法可以包括将容器特异性DNA序列(例如,独特的容器条形码)附接至四聚体-缀合的寡核苷酸。另外的细胞DNA或mRNA分析、表型测量、功能测试、细胞分选或其他反应可以在将四聚体-缀合的寡核苷酸条形码化(例如,用DNA条形码)之前、同时或之后进行。
方法可以包括在例如乳液实验之后从乳液提取核酸。提取的核酸可以准备用于测序并进行测序(例如,使用下一代测序技术)。方法可以包括对来自含有抗原ID序列和液滴特异性条形码序列两者的容器的多核苷酸分子测序。抗原ID序列可以定义被寡核苷酸缀合的抗体结合的特异性细胞表面蛋白。抗原ID序列可以定义与特定的细胞表面蛋白结合的寡核苷酸缀合的抗体的特异性抗体。抗原ID序列可以定义与特定的细胞TCR结合的寡核苷酸缀合的四聚体的特异性MHC-肽复合物。抗原ID序列可以定义与特定的细胞BCR结合的寡核苷酸缀合的四聚体的特异性B-细胞受体抗原。因此,抗原ID序列可以指示分析的细胞表达何种表面蛋白。在包含单个细胞的容器中,含有共有液滴特异性条形码序列的所有序列与单个细胞相缔合。因此,单个细胞可以以展示一组表面蛋白的方式来分析,这组表面蛋白可以用于定义单个细胞的身份、特征或相关性。例如,单个细胞可以被分析为展示对MHC-肽复合物具有一定亲和力的TCR,其中该TCR的序列也可以被鉴定,或者单个细胞可以被分析为展示对四聚体的B细胞受体抗原具有一定亲和力的BCR,其中该BCR的序列也可以被鉴定。
在一个方面中,提供了一种方法,所述方法包括在多个容器中进行反应,该反应包括将包含容器条形码序列的容器条形码化多核苷酸附接至与在多个容器中的容器中分离的单个细胞的靶抗原结合的亲和-寡核苷酸缀合物的寡核苷酸。在一个方面中,提供了一种方法,所述方法包括在多个容器中进行反应,该反应包括将包含容器条形码序列的容器条形码化多核苷酸附接至与在多个容器中的容器中分离的单个细胞的TCR结合的四聚体-寡核苷酸缀合物的寡核苷酸。在一个方面中,提供了一种方法,所述方法包括在多个容器中进行反应,该反应包括将包含容器条形码序列的容器条形码化多核苷酸附接至与在多个容器中的容器中分离的单个细胞的BCR结合的四聚体-寡核苷酸缀合物的寡核苷酸。
在一个方面中,本文提供了一种方法,所述方法包括在多个容器中的容器中进行反应,该反应包括将包含容器条形码序列的容器条形码化多核苷酸附接至亲和-寡核苷酸缀合物的寡核苷酸部分,其中该亲和-寡核苷酸缀合物与由在多个容器中的容器中的细胞表达的靶抗原结合。在一个方面中,本文提供了一种方法,所述方法包括在多个容器中的容器中进行反应,该反应包括将包含容器条形码序列的容器条形码化多核苷酸附接至四聚体-寡核苷酸缀合物的寡核苷酸部分,其中该四聚体-寡核苷酸缀合物与由在多个容器中的容器中的细胞表达的TCR结合。在一个方面中,本文提供了一种方法,所述方法包括在多个容器中的容器中进行反应,该反应包括将包含容器条形码序列的容器条形码化多核苷酸附接至四聚体-寡核苷酸缀合物的寡核苷酸部分,其中该四聚体-寡核苷酸缀合物与由在多个容器中的容器中的细胞表达的BCR结合。
在一些实施方案中,细胞是容器内包含的单个细胞。在一些实施方案中,容器包括多个容器中的两个或更多个容器。在一些实施方案中,容器包括多个容器中的每个容器。在一些实施方案中,反应在多个容器中的两个或更多个容器中发生。在一些实施方案中,每个容器中的细胞来自相同的样品。在一些实施方案中,两种或更多种多个容器中的第一多个容器中的容器中的细胞与两种或更多种多个容器中的第二多个容器中的容器中的细胞来自相同的样品。在一些实施方案中,寡核苷酸部分包含抗原识别序列(AID)。在一些实施方案中,AID被条形码化地加至靶抗原或亲和-寡核苷酸缀合物的亲和部分。在一些实施方案中,AID被条形码化地加至具有已知特异性的TCR或四聚体-寡核苷酸缀合物的MHC-肽复合物。在一些实施方案中,AID被条形码化地加至具有已知特异性的BCR或四聚体-寡核苷酸缀合物的B-细胞受体抗原。
在一些实施方案中,寡核苷酸还包含条形码化地加至靶抗原或亲和-寡核苷酸缀合物的亲和部分的抗原识别序列(AID)。在一些实施方案中,寡核苷酸还包含条形码化地加至具有已知特异性的TCR或四聚体-寡核苷酸缀合物的MHC-肽复合物的抗原识别序列(AID)。在一些实施方案中,抗原识别序列(AID)是已知序列。
在一些实施方案中,容器条形码化多核苷酸来自容器中的模板容器条形码化多核苷酸。
在一些实施方案中,方法还包括对寡核苷酸或其扩增子测序以获得序列信息。
在一些实施方案中,方法还包括基于序列信息确定单个细胞的特征。在一些实施方案中,序列信息包含抗原识别(AID)序列。在一些实施方案中,方法还包括基于序列信息确定单个细胞的特征。在一些实施方案中,特征为表型。在一些实施方案中,表型为免疫表型。在一些实施方案中,特征为亲和力。在一些实施方案中,亲和力是MHC-肽复合物的亲和力。在一些实施方案中,亲和力是MHC-肽复合物的相对亲和力(例如,与具有较低结合亲和力的TCR相比,具有较高结合亲和力的TCR)。在一些实施方案中,亲和力是BCR的亲和力。在一些实施方案中,亲和力是BCR的相对亲和力(例如,与具有较低结合亲和力的BCR相比,具有较高结合亲和力的BCR)。
在一些实施方案中,方法还包括使亲和-寡核苷酸缀合物与包含单个细胞的多个细胞接触。在一些实施方案中,方法还包括使四聚体-寡核苷酸缀合物与包含单个细胞的多个细胞接触。在一些实施方案中,接触是在将单个细胞在容器中分离之前。在一些实施方案中,方法还包括在接触之后洗涤多个细胞。
在一些实施方案中,容器不包含不与靶抗原结合的亲和-寡核苷酸缀合物。在一些实施方案中,容器不包含不与TCR结合的四聚体-寡核苷酸缀合物。在一些实施方案中,容器不包含不与BCR结合的四聚体-寡核苷酸缀合物。
在一些实施方案中,方法还包括将单个细胞在容器中分离。在一些实施方案中,在分离之前,单个细胞与亲和-寡核苷酸缀合物结合。
在一些实施方案中,方法还包括裂解单个细胞。在一些实施方案中,裂解是在将单个细胞在容器中分离之后。
在一些实施方案中,多个细胞是多个未分选的细胞。在一些实施方案中,多个细胞是多个分选的细胞。在一些实施方案中,多个细胞是多个富集的细胞。
在一些实施方案中,多个容器中的第一容器中的容器条形码化多核苷酸或其扩增子的容器条形码序列不同于多个容器中的第二容器中的容器条形码化多核苷酸或其扩增子的容器条形码序列。在一些实施方案中,多个容器中的单个容器中的每个容器条形码化多核苷酸或其扩增子的容器条形码序列包含相同的容器条形码序列。在一些实施方案中,多个容器中的任何单个容器中的每个容器条形码化多核苷酸及其扩增子的容器条形码序列相对于多个容器中的任何其他单个容器中的每个容器条形码化多核苷酸及其扩增子的容器条形码序列是独特的。
在一些实施方案中,方法还包括将容器条形码化多核苷酸附接至来自单个细胞的细胞多核苷酸。在一些实施方案中,将容器条形码化多核苷酸附接至亲和-寡核苷酸缀合物的寡核苷酸和将容器条形码化多核苷酸附接至来自单个细胞的细胞多核苷酸同时进行。
在一些实施方案中,方法还包括扩增寡核苷酸或其互补物。在一些实施方案中,方法还包括扩增细胞多核苷酸或其互补物。在一些实施方案中,扩增寡核苷酸或其互补物和扩增细胞多核苷酸或其互补物同时进行。
在一些实施方案中,细胞多核苷酸的容器条形码序列与寡核苷酸的容器条形码序列相同。
在一些实施方案中,方法还包括将来自多个容器中的两个或更多个容器的寡核苷酸或其扩增子合并。在一些实施方案中,方法还包括将来自多个容器中的两个或更多个容器的寡核苷酸或其扩增子和细胞多核苷酸或其扩增子合并。在一些实施方案中,合并是在测序之前。
在一些实施方案中,亲和-寡核苷酸缀合物包含多个不同的亲和-寡核苷酸缀合物。在一些实施方案中,多个亲和-寡核苷酸缀合物中的每个亲和-寡核苷酸缀合物包含独特的抗原识别(AID)序列。在一些实施方案中,寡核苷酸包含条形码化地加至多个亲和-寡核苷酸缀合物分子中的单个亲和-寡核苷酸缀合物分子的亲和分子条形码(AMB)序列。在一些实施方案中,多个亲和-寡核苷酸缀合物分子中的每个亲和-寡核苷酸缀合物分子包含独特的亲和分子条形码(AMB)序列。
在一些实施方案中,本文描述的方法和缀合物包含多个不同的四聚体-寡核苷酸缀合物。在一些实施方案中,多个亲和-寡核苷酸缀合物中的每个四聚体-寡核苷酸缀合物包含独特的抗原识别(AID)序列。在一些实施方案中,寡核苷酸包含条形码化地加至多个四聚体-寡核苷酸缀合物分子中的单个四聚体-寡核苷酸缀合物分子的亲和分子条形码(AMB)序列。在一些实施方案中,多个四聚体-寡核苷酸缀合物分子中的每个四聚体-寡核苷酸缀合物分子包含独特的亲和分子条形码(AMB)序列。
在一些实施方案中,寡核苷酸包含融合序列,并且附接包括将容器条形码化多核苷酸附接至融合序列。在一些实施方案中,寡核苷酸包含引物结合序列。在一些实施方案中,寡核苷酸包含恒定序列。
在一些实施方案中,方法还包括对寡核苷酸、其互补物、其扩增产物或它们的组合测序,从而产生寡核苷酸序列读段。在一些实施方案中,方法还包括比较一个或更多个第一寡核苷酸序列读段与一个或更多个第二寡核苷酸序列读段。在一些实施方案中,方法还包括分析寡核苷酸序列读段。在一些实施方案中,方法还包括分析寡核苷酸序列读段的容器条形码序列。在一些实施方案中,方法还包括分析寡核苷酸序列读段的抗原识别(AID)序列。在一些实施方案中,方法还包括分析寡核苷酸序列读段的亲和分子条形码(AMB)序列。在一些实施方案中,分析包括确定一个或更多个容器条形码序列、一个或更多个AID序列、一个或更多个亲和分子条形码(AMB)序列或其组合的频率。在一些实施方案中,分析包括比较。在一些实施方案中,方法还包括比较寡核苷酸序列读段的抗原识别(AID)序列与寡核苷酸序列读段的亲和分子条形码(AMB)序列。
在一些实施方案中,方法还包括对细胞多核苷酸、其互补物、其扩增产物或它们的组合测序,从而产生细胞多核苷酸序列读段。在一些实施方案中,方法还包括比较寡核苷酸序列读段与细胞多核苷酸序列读段。在一些实施方案中,方法还包括比较寡核苷酸序列读段的容器条形码序列与细胞多核苷酸序列读段的容器条形码序列。在一些实施方案中,方法还包括比较细胞多核苷酸序列读段。在一些实施方案中,方法还包括分析细胞多核苷酸序列读段的容器条形码序列。在一些实施方案中,方法还包括分析细胞多核苷酸序列读段的分子条形码序列。
在一些实施方案中,方法还包括基于分析或比较来确定细胞的特征。在一些实施方案中,方法还包括基于寡核苷酸序列读段选择抗体、BCR或TCR。在一些实施方案中,方法包括基于细胞多核苷酸序列读段选择抗体、BCR或TCR。
在一些实施方案中,方法还包括基于分析或比较来确定四聚体对TCR或BCR的亲和力和/或TCR或BCR对四聚体的亲和力。在一些实施方案中,测序读段的数目指示四聚体对TCR或BCR的亲和力。在一些实施方案中,与具有较低数目的序列读段的单个细胞相比,单个细胞的较高数目的序列读段指示四聚体-寡核苷酸缀合物和/或TCR或BCR的较高的结合亲和力。四聚体的结合亲和力可以指示四聚体的MHC-肽复合物或四聚体的B-细胞受体抗原的结合。
在一些实施方案中,确定TCR或BCR对四聚体寡核苷酸缀合物的亲和力的方法包括在一种或多种四聚体寡核苷酸缀合物的存在下孵育一个或多个T细胞,其中多种四聚体寡核苷酸缀合物可以各自包含独特标识符条形码。在一些实施方案中,方法还包括分离每个细胞四聚体复合物,并且对与四聚体复合物缀合的寡核苷酸或其互补序列的至少一部分测序,如本文描述的。在一些实施方案中,方法还包括计数针对每个独特条形码序列在测序期间获得的测序读段的数目。在一些实施方案中,方法还包括分析或比较测序信息与标准曲线。在一些实施方案中,方法还包括基于测序或测序信息的分析或比较,确定TCR或BCR对四聚体的亲和力、或四聚体对TCR或BCR的亲和力。在一些实施方案中,附接至寡核苷酸的容器条形码化多核苷酸和附接至细胞多核苷酸的容器条形码化多核苷酸来自容器中的相同的模板容器条形码化多核苷酸。在一些实施方案中,附接至寡核苷酸的容器条形码化多核苷酸是模板容器条形码化多核苷酸的扩增产物。
在一些实施方案中,附接至细胞多核苷酸的容器条形码化多核苷酸是模板容器条形码化多核苷酸的扩增产物。
在一些实施方案中,容器包含固体支持体。在一些实施方案中,容器不包含固体支持体。在一些实施方案中,多个容器中的每个容器包含单个细胞。在一些实施方案中,容器是孔、乳液或液滴。在一些实施方案中,模板容器条形码化多核苷酸不与固体支持体结合。在一些实施方案中,模板容器条形码化多核苷酸与固体支持体结合。
在一些实施方案中,方法还包括将多个分子条形码化多核苷酸中的分子条形码化多核苷酸的分子条形码序列附接至细胞多核苷酸,其中该分子条形码序列被条形码化地加至单个细胞多核苷酸分子及其扩增子。
在一些实施方案中,附接包括将容器多核苷酸连接至寡核苷酸。在一些实施方案中,附接包括用酶将容器多核苷酸附接至寡核苷酸。在一些实施方案中,附接包括使容器多核苷酸与寡核苷酸杂交。在一些实施方案中,附接还包括延伸寡核苷酸。在一些实施方案中,附接包括扩增模板容器条形码化多核苷酸。
在一些实施方案中,寡核苷酸是双链的。在一些实施方案中,寡核苷酸是单链的。在一些实施方案中,寡核苷酸是DNA。在一些实施方案中,寡核苷酸是RNA。
在一些实施方案中,细胞多核苷酸包含可变区序列。在一些实施方案中,方法还包括使含有可变区序列的天然链序列配对。在一些实施方案中,细胞多核苷酸是DNA。在一些实施方案中,细胞多核苷酸是RNA。在一些实施方案中,RNA是mRNA。
在一些实施方案中,单个细胞是B-细胞。在一些实施方案中,单个细胞是T-细胞。
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分与单个细胞的细胞外抗原结合。在一些实施方案中,单个细胞的细胞外抗原是对免疫细胞特异的抗原。在一些实施方案中,单个细胞的细胞外抗原是对T-细胞特异的抗原。在一些实施方案中,细胞外抗原是CD4。在一些实施方案中,细胞外抗原是CD8。在一些实施方案中,单个细胞的细胞外抗原是对B-细胞特异的抗原。在一些实施方案中,细胞外抗原是免疫球蛋白。
在一些实施方案中,亲和寡核苷酸缀合物的亲和部分是抗体或其片段。在一些实施方案中,亲和寡核苷酸缀合物的亲和部分是肽。在一些实施方案中,亲和寡核苷酸缀合物的亲和部分是蛋白质。在一些实施方案中,亲和寡核苷酸缀合物的亲和部分是适体。在一些实施方案中,亲和寡核苷酸缀合物的亲和部分是小分子。在一些实施方案中,亲和寡核苷酸缀合物的亲和部分是药物。在一些实施方案中,亲和寡核苷酸缀合物的亲和部分是细胞。在一些实施方案中,细胞是抗原呈递细胞(APC)。在一些实施方案中,亲和寡核苷酸缀合物的亲和部分包含MHC-肽复合物。在一些实施方案中,亲和寡核苷酸缀合物的亲和部分包含主要组织相容性复合物(MHC)。在一些实施方案中,MHC呈可溶和/或多聚体(例如,四聚体)形式。在一些实施方案中,MHC与肽结合。在一些实施方案中,肽是合成肽。在一些实施方案中,MHC与例如单个细胞的T细胞受体(TCR)和/或TCR样结合分子,诸如TCR样抗体或免疫球蛋白或嵌合抗原受体结合。
在一些实施方案中,四聚体-寡核苷酸缀合物的亲和部分包含MHC-肽复合物。在一些实施方案中,四聚体-寡核苷酸缀合物的亲和部分包含呈可溶和/或多聚体(例如,四聚体)形式的主要组织相容性复合物(MHC)。在一些实施方案中,MHC与链霉亲和素蛋白结合,链霉亲和素蛋白与中心生物素蛋白复合,允许多达四种MHC-链霉亲和素复合物连接成多聚体复合物(例如,如图10A中描绘的)。在一些实施方案中,MHC与肽相缔合。在一些实施方案中,MHC经由共价键或非共价键与肽相缔合。在一些实施方案中,肽是合成肽。在一些实施方案中,肽是合成肽。在一些实施方案中,MHC与例如单个细胞的TCR和/或TCR样结合分子,诸如TCR样抗体或免疫球蛋白或嵌合抗原受体结合。在一些实施方案中,四聚体-寡核苷酸缀合物的亲和部分包含呈可溶和/或多聚体(例如,四聚体)形式的B-细胞受体抗原。在一些实施方案中,B细胞受体抗原先前被施用至细胞或受试者。在一些实施方案中,B细胞受体抗原与例如单个细胞的BCR和/或BCR样结合分子,诸如嵌合抗原受体结合。
在一些实施方案中,亲和部分与抗原识别分子和/或免疫受体,诸如抗体或免疫球蛋白或其部分或融合物,工程化免疫受体、嵌合抗原受体(CAR)或TCR特异性结合。在一些这样的实施方案中,亲和部分包含由抗体或受体诸如CAR识别的抗原或其表位或部分。在一些实施方案中,亲和部分包含与免疫受体特异性结合的抗体或其抗原结合片段。在一些方面中,抗体或其抗原结合片段与受体的可变部分和/或抗原结合部分诸如独特位(idiotope)特异性结合。在一些方面中,亲和分子是抗独特型(anti-idiotypic)抗体或其片段。
在一些实施方案中,亲和寡核苷酸缀合物的亲和部分包含主要组织相容性复合物(MHC)或其功能部分或结合部分。在一些实施方案中,亲和部分包含MHC的多聚体,任选地MHC的四聚体。在一些实施方案中,MHC呈可溶形式。在一些实施方案中,MHC与肽结合和/或在MHC的沟槽内含有肽。在一些实施方案中,肽是合成肽。在一些实施方案中,MHC与单个细胞的T细胞受体(TCR)结合。在一些实施方案中,亲和部分包含与抗体或嵌合抗原受体(CAR)结合的肽,和/或其中靶是抗体或CAR。在一些实施方案中,亲和部分是或包含由抗体或嵌合抗原受体特异性识别的抗原或表位,并且/或者包含与其特异性结合的抗体,任选地包含与其抗原结合部分特异性结合的抗独特型抗体。
在一个方面中,提供了一种组合物,所述组合物包含多个容器,每个容器包含来自包含多个细胞的样品的单个细胞、与单个细胞的靶抗原结合的亲和-寡核苷酸缀合物以及包含容器条形码序列的容器条形码化多核苷酸。在一些实施方案中,容器条形码化多核苷酸或其互补物被附接至亲和-寡核苷酸缀合物的寡核苷酸。
在一个方面中,提供了一种组合物,所述组合物包含多个容器,每个容器包含来自包含多个细胞的样品的单个细胞、与单个细胞的TCR或BCR结合的四聚体-寡核苷酸缀合物以及包含容器条形码序列的容器条形码化多核苷酸。在一些实施方案中,容器条形码化多核苷酸或其互补物被附接至四聚体-寡核苷酸缀合物的寡核苷酸。在一个方面中,提供了一种组合物,所述组合物包含多个容器,每个容器包含来自包含多个细胞的样品的单个裂解的细胞和与单个裂解的细胞的靶抗原结合的亲和-寡核苷酸缀合物;其中该亲和-寡核苷酸缀合物的寡核苷酸包含容器条形码序列,并且其中来自单个裂解的细胞的细胞多核苷酸包含相同的容器条形码序列。
在一个方面中,提供了一种组合物,所述组合物包含多个容器,每个容器包含来自包含多个细胞的样品的单个裂解的细胞,以及与单个裂解的细胞的TCR或BCR结合的四聚体-寡核苷酸缀合物;其中该四聚体-寡核苷酸缀合物的寡核苷酸包含血管条形码序列,并且其中来自单个裂解的细胞的细胞多核苷酸包含相同的容器条形码序列。在一个方面中,本文提供了一种组合物,所述组合物包含多个容器,其中多个容器中的容器包含来自包含多个细胞的样品的单个细胞,以及包含容器条形码序列的容器条形码化多核苷酸,其中该容器还包含与该单个细胞的靶抗原结合的亲和-寡核苷酸缀合物,或亲和-寡核苷酸缀合物的寡核苷酸部分。
在一个方面中,本文提供了一种组合物,所述组合物包含多个容器,其中多个容器中的容器包含来自包含多个细胞的样品的单个细胞,以及包含容器条形码序列的容器条形码化多核苷酸,其中该容器还包含与该单个细胞的TCR或BCR结合的四聚体-寡核苷酸缀合物,或该四聚体-寡核苷酸缀合物的寡核苷酸部分。
在一些实施方案中,反应在多个容器中的两个或更多个容器中发生。在一些实施方案中,容器包括多个容器中的每个容器。在一些实施方案中,多个容器包括两种或更多种的多个容器。在一些实施方案中,每个容器中的细胞来自相同的样品。在一些实施方案中,两种或更多种多个容器中的第一多个容器中的容器中的细胞与两种或更多种多个容器中的第二多个容器中的容器中的细胞来自相同的样品。在一些实施方案中,容器条形码化多核苷酸或其互补物被附接至亲和-寡核苷酸缀合物的寡核苷酸。在一些实施方案中,容器条形码化多核苷酸或其互补物被附接至四聚体-寡核苷酸缀合物的寡核苷酸。在一些实施方案中,单个细胞被裂解。
在一个方面中,本文提供了一种组合物,所述组合物包含多个容器,其中多个容器中的容器包含来自包含多个细胞的样品的单个裂解的细胞,以及包含与单个裂解的细胞的靶抗原结合的亲和部分的亲和-寡核苷酸缀合物或亲和-寡核苷酸缀合物的寡核苷酸部分;其中该亲和-寡核苷酸缀合物的寡核苷酸部分包含容器条形码序列,并且其中来自该单个裂解的细胞的细胞多核苷酸包含相同的容器条形码序列。
在一个方面中,本文提供了一种组合物,所述组合物包含多个容器,其中多个容器中的容器包含来自包含多个细胞的样品的单个裂解的细胞,以及包含与单个裂解的细胞的TCR或BCR结合的亲和部分的四聚体-寡核苷酸缀合物或该四聚体-寡核苷酸缀合物的寡核苷酸部分;其中该四聚体-寡核苷酸缀合物的寡核苷酸部分包含容器条形码序列,并且其中来自该单个裂解的细胞的细胞多核苷酸包含相同的容器条形码序列。
在一个方面中,提供了一种试剂盒,所述试剂盒包含:第一器皿(container),该第一器皿包含含有第一抗原识别(AID)序列的第一寡核苷酸,其中第一AID序列是已知序列;第二器皿,该第二器皿包含含有第二抗原识别(AID)序列的第二寡核苷酸,其中第二AID序列是已知序列并且不同于第一AID序列;一个或更多个第三器皿,该第三器皿包含能够使第一寡核苷酸与第一亲和分子缀合的试剂和能够使第二寡核苷酸与第二亲和分子缀合的试剂;一组说明,描述如何使第一寡核苷酸与第一亲和分子缀合以及如何使第二寡核苷酸与第二亲和分子缀合。
在一个方面中,提供了一种试剂盒,所述试剂盒包含:第一器皿,该第一器皿包含含有第一抗原识别(AID)序列的第一寡核苷酸,其中该第一AID序列是已知序列;第二器皿,该第二器皿包含含有第二抗原识别(AID)序列的第二寡核苷酸,其中第二AID序列是已知序列并且不同于第一AID序列;一个或更多个第三器皿,该第三器皿包含能够使第一寡核苷酸与第一四聚体缀合的试剂和能够使第二寡核苷酸与第二四聚体缀合的试剂;一组说明,描述如何使第一寡核苷酸与第一四聚体缀合以及如何使第二寡核苷酸与第二四聚体分子缀合。
在一个方面中,提供了一种试剂盒,所述试剂盒包含:第一器皿,该第一器皿包含含有抗原识别(AID)序列的寡核苷酸,其中该AID序列是已知序列;第二器皿,该第二器皿包含能够使寡核苷酸与亲和分子缀合的试剂;第三器皿,该第三器皿包含多个容器条形码化多核苷酸;以及一组说明,描述当与亲和分子缀合时如何将多个容器条形码化多核苷酸中的容器条形码化多核苷酸附接至寡核苷酸。
在一个方面中,提供了一种试剂盒,所述试剂盒包含:第一器皿,该第一器皿包含含有抗原识别(AID)序列的寡核苷酸,其中该AID序列是已知序列;第二器皿,该第二器皿包含能够使寡核苷酸与四聚体缀合的试剂;第三器皿,该第三器皿包含多个容器条形码化多核苷酸;以及一组说明,描述当与四聚体缀合时如何将多个容器条形码化多核苷酸中的一个容器条形码化多核苷酸附接至寡核苷酸。
本文公开的方法和组合物可以用于肿瘤谱分析(profiling)。例如,方法可以包括将细胞表型与患者样品中的免疫组库(repertoire)相关联以鉴定肿瘤反应性TCR。本文公开的方法和组合物可以用于过继细胞疗法。例如,方法可以包括在没有分选的情况下对T细胞进行遗传分析。例如,方法可以包括在产品制造和处理期间将T细胞克隆信息(使用TCR)与基因表达模式组合。在一些实施方案中,本文公开的方法可以用于在过继细胞疗法之前、过继细胞疗法过程期间或之后追踪、表征、监测和/或评估从患者获得的过继转移的细胞。本文公开的方法和组合物可以用于鉴定针对已知靶的TCR。例如,方法可以包括鉴定可以高度响应于抗原但增殖差的高亲和力克隆。本文公开的方法和组合物可以用于细胞样品多重化(multiplexing)。例如,含有与一个或更多个亲和-寡核苷酸缀合物接触的合并的细胞样品的乳液可以用于在处理多个样品的同时鉴定原始细胞样品。
本文公开的方法和组合物可以用于通过测序进行多重TCR或BCR亲和力测量。本文公开的方法和组合物可以用于定量单个细胞的TCR或BCR对四聚体-寡核苷酸缀合物的四聚体的结合亲和力。此外,该定量可以对四聚体-寡核苷酸缀合物浓度敏感,其中结合亲和力信号可以依赖于四聚体-寡核苷酸缀合物浓度(例如,降低四聚体-寡核苷酸缀合物浓度导致结合亲和力信号相应降低)。此外,本文公开的方法和组合物可以用于区分抗原特异性细胞与非特异性细胞。例如,区分具有结合四聚体-寡核苷酸缀合物的四聚体的TCR或BCR的细胞相比于具有不结合四聚体-寡核苷酸缀合物的四聚体的TCR或BCR的细胞。此外,本文公开的方法和组合物的一个益处是能够区分抗原特异性细胞(即四聚体+细胞)的群体与非特异性细胞(即四聚体-细胞)的群体,而不使用流式细胞术门控来分离这两个群体。许多时候,流式细胞术门控可以是基于流式细胞术图上四聚体+群体与四聚体-群体的分离的群体分离的“最佳猜测”,这可能是不精确的,并且因此可能导致每个群体的细胞损失或细胞的错误表征。相比之下,本文描述的方法和组合物不依赖于门控技术来区分细胞群体,而是可以是高通量方法,其单独定量样品中每个细胞的结合亲和力。此外,本文公开的方法和组合物可以用于区分对MHC肽具有高结合亲和力的TCR(即高结合物)的细胞和对MHC肽具有低结合亲和力的TCR(即低结合物)的细胞,以及使用本文描述的高通量方法区分样品中的高结合亲和力细胞和低结合亲和力细胞。
通过引用并入
本说明书中提及的所有出版物、专利和专利申请均为了所有目的通过引用以其整体并入本文,其程度如同每个单独的出版物、专利或专利申请被特别地和单独地指出通过引用并入。
附图简述
本文描述的新颖特征在随附权利要求中具体阐述。通过参考以下对应用本文描述的特征的原理的说明性实例加以阐述的详细描述以及附图,将获得对本文描述的特征的特点和优点的更好理解,在附图中:
图1描绘了本文描述的方法的容器的示例性示意图。
图2描绘了与抗体缀合的寡核苷酸标签的示例性设计。每个有色模块代表完整寡核苷酸序列的一部分。融合序列用于乳液反应内液滴特异性DNA条形码的酶促附接。仅示出了一种可能的序列排列,但其他排列也与所描述的方法相容。
图3A描绘了免疫受体序列与另外的mRNA和蛋白质靶的示例性共捕获。表面蛋白靶通过在乳液测序之前将细胞与DNA标记的染色抗体一起预孵育来定量。
图3B描绘了针对由健康人T细胞生成的3,682个液滴条形码TCR VαVβ对的示例性CD4和CD8 mRNA和蛋白质测量结果。
图3C描绘了mRNA和蛋白质测量结果之间的示例性一致性(每个点为与TCR VαVβ对连接的液滴条形码)。
图3D描绘了对来自乳液中的未分选的T细胞的CD4和CD8同时进行mRNA和蛋白质检测的示例性表格。从30,000个输入T细胞中回收了3,682个TCR对。通过mRNA相比蛋白质(基于分子计数,少数服从多数原则)被判定为CD4+或CD8+的TCR对的频率示出在矩阵中。
图3E描绘了使用靶向CD4的亲和-寡核苷酸缀合物和靶向CD8的亲和-寡核苷酸缀合物得到的45,870个单个细胞TCR对的示例性结果。
图4描绘了使用靶向CD4的亲和-寡核苷酸缀合物和靶向CD8的亲和-寡核苷酸缀合物的示例性方法的示意图。
图5例示了来自乳液中单个免疫细胞条形码化的方法的结果。
图5A是将两种含有细胞和裂解/反应(LR)混合物的水性流传递到油中,从而以每小时超过800万个液滴产生单分散乳液的示例性描绘。
图5B是示出容器内的细胞在单个反应中裂解并且经历分子特异性条形码化和液滴特异性条形码化的示例性描绘。
图5C是示出靶mRNA被逆转录并且用通用衔接子序列模板转换加标签的示例性描绘。随后,在开始时稀释至每个液滴~1个分子的液滴条形码模板发生PCR扩增。扩增的条形码通过互补重叠延伸被附加至模板转换的cDNA。在另外的文库处理步骤和高通量测序之前,产物从乳液回收并且使用RT引物上的生物素纯化。
图5D是示出双重条形码化允许将测序读段簇集到其分子和原始液滴中,在最小化测序错误和扩增偏差的同时重建天然受体链配对的示例性描绘。
图6例示了从分离的健康B细胞回收BCR的方法的结果。
图6A是液滴的示例性描述,其中3百万个B细胞以0.2个细胞/液滴传递到乳液中,导致~90%的占用细胞含有单个细胞。
图6B是VHVL配对精确度的示例性描绘。在乳液条形码化和测序后,针对来自单个细胞液滴的数据将数据富集,并且使用扩展克隆间的配对一致性估计VHVL配对精确度。
图6C是液滴条形码百分比相比于Ig同种型的示例性图。示出了259,368个过滤的VHVL对的重链同种型(每个液滴内最丰富的同种型)和轻链基因座使用。
图6D是六个独立乳液级分中的每一个中100个最高频重链克隆的等级丰度的示例性图。标出了0.05%的总频率。
图6E是如通过每个液滴条形码内捕获的mRNA的数目所估计的细胞内VH相比于VL表达的示例性图。针对每种同种型示出了5,000个点。
图6F是针对BCR对的VH相比于VL突变相关性和每种同种型内的密度分布的示例性图。
图7例示了HIV广谱中和抗体(bNAb)发现方法的结果。
图7A是将从来自HIV elite控制者的B细胞的38,620个回收的VHVL对输入到乳液中的重链同种型分布的示例性图。少量比例的IgG链与先前已知的bNAb(“PGT样”)良好对齐。
图7B是已知bNAb(黑色)加新回收的bNAb(红色,用液滴条形码标记)的完整VDJ氨基酸序列的系统树(phylogenetic tree)的示例性描绘,其中重链(左)和轻链(右)单独绘制。潜在错配的抗体PGT122和PGT123呈蓝色。
图7C是与PGT121的对照原种相比,8个新发现的PGT样变体针对十株HIV的中和活性(IC50,μg/mL)的示例性描绘。
图8例示了对来自卵巢肿瘤的TIL进行表征的方法的结果。
图8A是液滴的示例性描绘,其中将来自卵巢肿瘤的400,000个未分选的解离细胞输入到乳液中,并且通过乳液条形码化同时回收BCR对和TCR对。
图8B是液滴条形码相比于受体链组合的示例性图,示出在过滤后在液滴条形码内观察到的所有VH/VL和Vα/Vβ组合的数目。
图8C是所回收的BCR对的液滴条形码百分比相比于重链同种型分布的示例性图。
图8D是针对BCR对的VH相比于VL突变的相关性和每种同种型内的密度分布的示例性图。
图8E描绘了针对TCR对和BCR对整体(上图)和针对不同同种型(下图)的所捕获的mRNA的数目的示例性图。
图8F描绘了克隆分析的示例性图,示出了六个独立的乳液级分中的每一个中30个最高频BCR重链克隆(上图)和30个最高频TCRβ链克隆的等级丰度。示出了1%和10%的总频率水平。
图9例示了使用抗体-寡核苷酸缀合物进行免疫表型分型的方法。
图9A描绘了示出2个容器的示例性示意图,每个容器含有与抗体-寡核苷酸缀合物结合的单个细胞。(DB1-液滴条形码1;DB2-液滴条形码2;MB1-分子条形码1;MB2-分子条形码2;AID-抗原ID条形码;AMB1-抗体分子条形码1;AMB2-抗体分子条形码2)。
图9B描绘了示出2个容器的示例性示意图,每个容器含有来自图9A的容器的裂解的细胞的RNA分子。RNA分子被逆转录并且非模板核苷酸被添加至由逆转录产生的cDNA分子的末端。分子条形码与添加至由逆转录产生的cDNA分子的末端的非模板核苷酸杂交。
图9C描绘了示出2个容器的示例性示意图,每个容器含有模板条形码化多核苷酸,该模板条形码化多核苷酸被扩增并且经由杂交被附接至来自图9B的容器的cDNA,并且cDNA被延伸(上图)。然后延伸的cDNA被扩增(下图)。
图9D描绘了示例性示意图,示出具有被附接至同一相同的RNA序列的相同分子条形码(MB)的RNA-MB-DB物质可能是PCR复制的结果。具有被附接至同一相同的RNA序列的两个不同的MB的RNA-MB-DB物质(RNA1-MB1-DB和RNA1-MB2-DB)是两个独立的原始RNA分子,而非PCR复制的。
图9E描绘了示例性示意图,示出具有被附接至具有相同液滴条形码(DB)和抗原ID条形码(AID)的序列的相同抗体分子条形码(AMB)的DB-AMB-AID物质可能是PCR复制的结果。具有被附接至具有相同液滴条形码(DB)和抗原ID条形码(AID)的序列的两个不同的AMB的DB1-AMB1-AID1和DB1-AMB2-AID1物质是来自两个独立抗体寡核苷酸缀合物分子的两个独立寡核苷酸分子,而并非来自PCR复制,所述两个独立抗体寡核苷酸缀合物分子各自具有特异性结合附接至容器中的相同单个细胞的相同靶抗原的抗体。具有被附接至具有相同液滴条形码(DB)和相同或不同的抗体分子条形码(AMB)的序列的两个不同的AID的DB1-AMBn-AID1和DB1-AMBn-AID2物质是来自附接至容器中的相同单个细胞的两个独立抗体寡核苷酸缀合物分子的两个独立寡核苷酸分子,其中抗体寡核苷酸缀合物分子中的一个具有特异性结合第一靶抗原的抗体,而另一个抗体寡核苷酸缀合物分子具有特异性结合第二靶抗原的抗体。
图10A描绘了本文描述的方法的示例性亲和-寡核苷酸缀合物的示意图。如所描绘的,示例性亲和-寡核苷酸缀合物可以包含MHC-肽亲和部分。在一些方面中,这样的缀合物可以被称为四聚体-寡核苷酸缀合物。
图10B描绘了本文描述的方法的示例性亲和-寡核苷酸缀合物的示意图。在一些方面中,这样的缀合物可以被称为四聚体-寡核苷酸缀合物。
图11A描绘了本文描述的方法的含有与TCR结合的亲和部分的两种示例性亲和-寡核苷酸缀合物的结合信号的示例性图。
图12A描绘了与本文描述的方法的示例性亲和-寡核苷酸缀合物结合的T细胞的示例性示意图。
图12B描绘了与本文描述的方法的示例性亲和-寡核苷酸缀合物结合的液滴中的T细胞的示例性示意图。液滴中的核酸用液滴标识序列标记并且掺入下一代测序文库中。
图13描绘了与示例性亲和-寡核苷酸缀合物四聚体缀合的寡核苷酸标签的示例性示意图。四聚体ID是短恒定DNA序列,其与四聚体批次对应并且允许在单一实验中多重检测不同的靶,诸如肽-MHC靶。分子条形码是允许对结合的四聚体的定量进行分子计数的简并序列。
图14描绘了由DNA标记的MHC四聚体试剂生成的示例性亲和-寡核苷酸缀合物(四聚体-寡核苷酸缀合物)的示意图。在一个实施方案中,合成Cy5连接的DNA寡核苷酸并且使其与链霉亲和素或中性抗生物素蛋白(neutravidin)缀合。在一个实施方案中,将非荧光DNA寡核苷酸与APC-链霉亲和素缀合。在一个实施方案中,将非荧光DNA寡核苷酸和链霉亲和素或中性抗生物素蛋白的混合物与活化的APC缀合。
图15描绘了使用点击化学将寡核苷酸与亲和-寡核苷酸缀合物的亲和部分缀合的示例性方法。
图16描绘了用于制备和表征示例性亲和-寡核苷酸的示例性工作流程的示意图。
图17描绘了使用靶向CD3、CD19、CD4、CD8、HLA-DR和CTLA-4的6种不同的亲和-寡核苷酸缀合物的本文描述的示例性方法的结果。每个点是液滴条形码/单个细胞。根据回收的受体对的类型(TCR=T细胞;Ig=B细胞)揭示细胞身份。
图18描绘了示例性四聚体-寡核苷酸缀合物的另一视图。在一些实施方案中,四聚体-寡核苷酸包含荧光团(Fluor)。在一些实施方案中,四聚体-寡核苷酸不包含荧光团。
图19描绘了本文描述的方法的含有与TCR结合的MHC-肽亲和部分的两种示例性四聚体-寡核苷酸缀合物的示例性结合曲线。
图20描绘了流式细胞术图,其中将靶特异性原代CD8+ T细胞或非靶特异性原代CD8+ T细胞与标准pMHC四聚体试剂或DNA标记的pMHC四聚体(四聚体-寡核苷酸缀合物)一起孵育。DNA标记的pMHC四聚体以递减的浓度使用,如最右边三列图正上方的三角形所示。
图21描绘了展示非结合TCR(例如,不被四聚体-寡核苷酸缀合物试剂特异性识别的TCR)和结合TCR(例如,被四聚体-寡核苷酸缀合物试剂特异性识别的TCR)的细胞之间,每个细胞的四聚体-寡核苷酸缀合物计数的比较。如沿着X轴所示,使用浓度递增的四聚体-寡核苷酸缀合物。
详细描述
为了说明,以下参考实例应用描述了若干方面。应该理解,许多具体细节、关系和方法被阐述以提供本文描述的特征的充分理解。然而,相关领域的普通技术人员将容易认识到本文描述的特征可以在没有一个或更多个具体细节的情况下或用其他方法来实践。本文描述的特征不受动作或事件的所示顺序限制,因为一些动作可以以不同的顺序和/或与其他动作或事件同时发生。此外,并不是所有示出的动作或事件都是实施根据本文描述的特征的方法所要求的。
本文使用的术语仅用于描述特定情况的目的,并且不意图是限制性的。如本文使用的,单数形式“一(a)”、“一(an)”和“该(the)”意图也包括复数形式,除非上下文另有清楚地指示。此外,在术语“包括(including)”、“包括(includes)”、“具有(having)”、“具有(has)”、“带有(with)”或其变化形式在详细描述和/或权利要求书中使用的情况下,这样的术语意图以类似于术语“包含(comprising)”的方式为包含性的。
术语“约”或“大约”可以意指在如由本领域普通技术人员确定的特定值的可接受误差范围之内,其将部分地取决于值如何被测量或确定,即,测量系统的局限性。例如,“约”可以意指按照本领域中的实践,在1个或超过1个标准差内。可选择地,“约”可以意指给定值的多达20%、多达10%、多达5%或多达1%的范围。可选择地,特别地,关于生物系统或过程,该术语可以意指在值的数量级内,在值的5倍内,并且更优选地在值的2倍内。除非另有说明,在特定值在本申请和权利要求书中被描述的情况下,应该假定术语“约”意指特定值的可接受的误差范围以内。
本发明的一个目的是提供使用亲和-寡核苷酸缀合物(例如,抗体-寡核苷酸缀合物)对单个细胞(例如,免疫细胞)进行表型分型(例如,在乳液中)的方法和组合物。
定义
因此,本文中的术语“抗体”以最广泛的含义使用,并且包括多克隆抗体和单克隆抗体,包括完整抗体及其功能性(抗原结合)抗体片段,该功能性(抗原结合)抗体片段包括片段抗原结合(Fab)片段、F(ab')2片段、Fab'片段、Fv片段、重组IgG(rIgG)片段、单链抗体片段,包括单链可变片段(scFv)和单结构域抗体(例如,sdAb、sdFv、纳米抗体)片段。该术语涵盖免疫球蛋白的遗传工程化形式和/或以其他方式修饰的形式,诸如胞内抗体、肽体、嵌合抗体、完全人抗体、人源化抗体和异源缀合抗体、多特异性抗体(例如,双特异性抗体)、双抗体、三抗体和四抗体、串联双-scFv、串联三-scFv。除非另有说明,术语“抗体”应理解为涵盖其功能性抗体片段。该术语还涵盖完整抗体或全长抗体,包括任何类别或亚类的抗体,包括IgG及其亚类,IgM、IgE、IgA和IgD。
与“高变区”或“HVR”同义的术语“互补决定区”和“CDR”在本领域中是已知的,指的是抗体可变区内赋予抗原特异性和/或结合亲和力的非连续氨基酸序列。通常,每个重链可变区中存在三个CDR(CDR-H1、CDR-H2、CDR-H3),并且每个轻链可变区中存在三个CDR(CDR-L1、CDR-L2、CDR-L3)。“框架区”和“FR”在本领域中是已知的,指的是重链和轻链的可变区的非CDR部分。通常,每个全长重链可变区中存在四个FR(FR-H1、FR-H2、FR-H3和FR-H4),并且每个全长轻链可变区中存在四个FR(FR-L1、FR-L2、FR-L3和FR-L4)。
给定CDR或FR的精确氨基酸序列边界可以使用许多熟知的方案中的任一种容易地确定,所述方案包括由Kabat等人(1991),“Sequences of Proteins of ImmunologicalInterest,”第5版.Public Health Service,National Institutes of Health,Bethesda,MD(“Kabat”编号方案)、Al-Lazikani等人,(1997)JMB 273,927-948(“Chothia”编号方案)、MacCallum等人,J.Mol.Biol.262:732-745(1996),“Antibody-antigen interactions:Contact analysis and binding site topography,”J.Mol.Biol.262,732-745.”(“Contact”编号方案)、Lefranc MP等人,“IMGT unique numbering for immunoglobulinand T cell receptor variable domains and Ig superfamily V-like domains,”DevComp Immunol,2003Jan;27(1):55-77(“IMGT”编号方案)和Honegger A and Plückthun A,“Yet another numbering scheme for immunoglobulin variable domains:anautomatic modeling and analysis tool,”J Mol Biol,2001Jun 8;309(3):657-70,(“Aho”编号方案)描述的那些方案。
给定CDR或FR的边界可以取决于用于鉴定的方案而变化。例如,Kabat方案是基于结构比对,而Chothia方案是基于结构信息。Kabat方案和Chothia方案两者的编号是基于最常见的抗体区序列长度,其中在一些抗体中出现插入和缺失,所述插入伴以(accommodatedby)插入字母,例如,“30a”。这两种方案在不同位置处放置某些插入和缺失(“indel”),导致差异的编号。Contact方案是基于对复合晶体结构的分析,并且在许多方面与Chothia编号方案相似。
下表A列出了分别通过Kabat方案、Chothia方案和Contact方案鉴定的CDR-L1、CDR-L2、CDR-L3和CDR-H1、CDR-H2、CDR-H3的示例性位置边界。对于CDR-H1,使用Kaba编号方案和Chothia编号方案两者来列出残基编号。FR位于CDR之间,例如FR-L1位于CDR-L1和CDR-L2之间,等等。应注意,由于所示的Kabat编号方案在H35A和H35B处放置插入,因此在使用所示的Kabat编号惯例进行编号时,Chothia CDR-H1环的末端取决于环的长度而在H32和H34之间变化。
表A
因此,除非另有规定,否则给定抗体或其区域诸如其可变区的“CDR”或“互补决定区”或单个指定的CDR(例如,“CDR-H1、CDR-H2)应理解为涵盖如由任何上述方案定义的互补决定区(或特定互补决定区)。例如,在陈述特定CDR(例如,CDR-H3)含有给定VH或VL氨基酸序列中相应CDR的氨基酸序列的情况下,应理解,这样的CDR具有如由任何上述方案定义的可变区内的相应CDR(例如,CDR-H3)的序列。在一些实施方案中,指定了特定的CDR序列。
同样地,除非另有规定,否则给定抗体或其区域诸如其可变区的FR或单个指定的FR(例如,FR-H1、FR-H2)应理解为涵盖如由任何已知方案定义的框架区(或特定构架区)。在一些情况下,指定了用于鉴定特定一种或更多种CDR、FR(诸如由Kabat、Chothia或Contact方法定义的CDR)的方案。在其他情况下,给出了CDR或FR的具体氨基酸序列。
术语“可变区”或“可变结构域”指的是涉及抗体与抗原结合的抗体重链或轻链的结构域。天然抗体的重链和轻链的可变结构域(分别为VH和VL)通常具有相似的结构,其中每个结构域包含四个保守的框架区(FR)和三个CDR。(参见,例如,Kindt等人.KubyImmunology,第6版,W.H.Freeman and Co.,第91页(2007))。单个VH或VL结构域可以足以赋予抗原结合特异性。此外,结合特定抗原的抗体可以使用来自结合该抗原的抗体的VH结构域或VL结构域分别筛选互补的VL结构域或VH结构域的文库来分离。参见,例如,Portolano等人,J.Immunol.150:880-887(1993);Clarkson等人,Nature 352:624-628(1991)。
所提供的抗体包括抗体片段。“抗体片段”指的是除了完整抗体以外的包含完整抗体的一部分的分子,该完整抗体的一部分结合该完整抗体所结合的抗原。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab’-SH、F(ab')2;双抗体;线性抗体;单链抗体分子(例如,scFv);以及由抗体片段形成的多特异性抗体。在特定的实施方案中,抗体是包含可变重链区和/或可变轻链区的单链抗体片段,诸如scFv。
除非另有说明,术语“TCR”应理解为涵盖完整TCR以及其抗原结合部分或抗原结合片段(也被称为MHC-肽结合片段)。在一些实施方案中,TCR是完整或全长TCR。在一些实施方案中,TCR是小于全长TCR但与结合至MHC分子(即,在MHC分子的环境中)的特定抗原肽,即,MHC-肽复合物结合的抗原结合部分。在一些情况下,TCR的抗原结合部分或片段可以仅含有全长或完整TCR的结构域中的一部分,但仍能够结合该完整TCR结合的表位(例如,MHC-肽复合物)。在一些情况下,TCR的抗原结合部分或片段含有TCR的可变结构域,诸如TCR的可变α链和可变β链,该可变结构域足以形成用于与特定MHC-肽复合物结合的结合位点,诸如通常在每条链含有三个互补决定区的情况下。包括具有结合结构域的多肽或蛋白质,该结合结构域为抗原结合结构域或与抗原结合结构域同源。互补决定区(CDR)移植抗体和TCR以及其他人源化抗体和TCR(包括CDR修饰和框架区修饰)也由这些术语设想。应注意,虽然可能仅提及了免疫球蛋白链(例如,重链和轻链),但是本公开发明可以应用于多种其他不同类型的配对序列,例如T细胞受体链对(TCRα链和TCRβ链以及TCRγ链和TCRδ链),并且不限于免疫球蛋白。
T细胞识别与多种癌症或传染性生物体相关的抗原的能力由其TCR赋予,TCR由alpha(α)链和beta(β)链两者或由gamma(γ)链和delta(δ)链两者构成。构成这些链的蛋白质由DNA编码,其采用独特的机理以用于生成TCR的巨大多样性。该多亚单位免疫识别受体与CD3复合物相关联,并且结合抗原呈递细胞(APC)表面上由MHC I类和II类蛋白质所呈递的肽。TCR与APC上的抗原肽的结合是T细胞活化的核心事件,其在T细胞与APC之间的接触点处的免疫突触处发生。
每个TCR包含可变互补决定区(CDR)以及框架区(FR)。α链和β链可变结构域的第三互补决定区(CDR3)环的氨基酸序列很大程度上分别决定了由β链基因座中的可变(Vβ)基因区段、多样性(Dβ)基因区段和连接(Jβ)基因区段之间,以及α链基因座中类似的Vα基因区段和Jα基因区段之间的重组产生的αβT细胞的序列多样性。多种这样的基因区段在TCR α和β链基因座中的存在允许大量不同的CDR3序列被编码。在TCR基因重排过程期间,在Vβ-Dβ、Dβ-Jβ和Vα-Jα连接处的核苷酸的独立添加和缺失还增加了CDR3序列多样性。在该方面,免疫活性反映在TCR的多样性中。
在一些方面中,由B细胞表达的免疫球蛋白(Ig)是由四条多肽链——两条重链(IgH)和两条轻链(IgL)组成的蛋白质,形成H2L2结构。每对IgH和IgL链含有高变结构域和恒定结构域,该高变结构域由VL区和VH区组成。Ig的IgH链有多个类型,μ、δ、γ、α和β。个体内的Ig的多样性主要由高变结构域决定。与TCR相似,IgH链的V结构域通过VH、DH和JH基因区段的组合连接而创建。在Ig基因重排过程期间,在VH-DH、DH-JH和VH-JH连接处的核苷酸的独立添加或缺失还增加了高变结构域序列多样性。此处,免疫活性反映在Ig的多样性中。
术语“可变区”或“可变结构域”指的是涉及抗体与抗原结合的抗体重链或轻链的结构域。天然抗体的重链和轻链的可变结构域(分别为VH和VL)通常具有相似的结构,其中每个结构域包含四个保守的框架区(FR)和三个CDR。(参见,例如,Kindt等人.KubyImmunology,第6版,W.H.Freeman and Co.,第91页(2007))。单个VH或VL结构域可以足以赋予抗原结合特异性。此外,结合特定抗原的抗体可以使用来自结合该抗原的抗体的VH结构域或VL结构域分别筛选互补的VL结构域或VH结构域的文库来分离。参见,例如,Portolano等人,J.Immunol.150:880-887(1993);Clarkson等人,Nature 352:624-628(1991)。
“亲和部分”指的是与靶抗原相互作用的亲和-寡核苷酸缀合物的部分。示例性亲和部分包括抗体、肽、蛋白质、适体、小分子、药物、细胞、MHC及其他。
“高变区”指的是抗体或TCR中的负责抗原结合的氨基酸残基。高变区包含来自互补决定区或CDR的氨基酸残基。框架或FR残基是除了如本文定义的高变区残基之外的那些可变结构域残基。
所提供的抗体包括抗体片段。“抗体片段”指的是除了完整抗体以外的包含完整抗体的一部分的分子,该完整抗体的一部分结合该完整抗体所结合的抗原。抗体片段的实例包括但不限于Fv、Fab、Fab'、Fab’-SH、F(ab')2;双抗体;线性抗体;单链抗体分子(例如,scFv);以及由抗体片段形成的多特异性抗体。在特定的实施方案中,抗体是包含可变重链区和/或可变轻链区的单链抗体片段,诸如scFv。
单结构域抗体是包含抗体的全部或部分重链可变结构域或全部或部分轻链可变结构域的抗体片段。在某些实施方案中,单结构域抗体是人类单结构域抗体。
抗体片段可以通过各种技术制备,包括但不限于完整抗体的蛋白质水解消化以及通过重组宿主细胞的生产。在一些实施方案中,抗体是重组产生的片段,诸如包含非天然存在的排列的片段,诸如具有两个或更多个通过合成连接体(例如,肽连接体)连接的抗体区或链和/或可能无法通过天然存在的完整抗体的酶消化而产生的片段。在一些方面中,抗体片段是scFv。
还提供了TCR片段,包括抗原结合片段。在一些实施方案中,TCR是其抗原结合部分,诸如可以被称为完全可溶性TCR的不含其跨膜区和/或胞质区的全长TCR的变体。在一些实施方案中,TCR是二聚TCR(dTCR)。在一些实施方案中,TCR是单链TCR(scTCR),诸如具有如PCT专利公布号WO 03/020763、WO 04/033685或WO2011/044186中描述的结构的scTCR。在某些实施方案中,TCR是包含与β链可变区连接的α链可变区的单链TCR片段,诸如scTv。在一些实施方案中,scTv也被称为scFv。
在一些方面中,单链Fv或scFv指的是包含抗体的可变重链(VH)结构域和可变轻链(VL)结构域或TCR的可变α链或γ链(Vα或Vγ)结构域和可变β链或δ链(Vβ或Vδ)结构域的抗体片段或TCR片段,其中这些结构域存在于单条多肽链中。通常,Fv多肽在VH和VL结构域或Vα和Vβ结构域或Vγ和Vδ结构域之间还包含多肽连接体,其使sFv能够形成用于抗原结合的期望的结构。
在一些方面中,双抗体指的是具有两个抗原结合位点的小抗体和/或TCR片段,该片段包含同一多肽链中的与VL连接的VH(VH-VL),或同一多肽链中的与Vβ连接的Vα(Vα-Vβ),或同一多肽链中的与Vδ连接的Vγ(Vγ-Vδ)。通过使用因太短而无法允许在同一链上的两个结构域之间配对的连接体,该结构域被迫与另一条链的互补结构域配对,并且产生了两个抗原结合位点。示例性双抗体在例如EP404097和WO93111161中更充分地描述。
在一些方面中,双特异性抗体或双特异性TCR指的是对两种不同类型的抗原示出特异性的抗体或TCR。具体地,如本文使用的该术语包括但不限于,对靶抗原和有助于向特定组织递送的另一个靶示出结合特异性的抗体和TCR。类似地,多特异性抗体和TCR具有两种或更多种结合特异性。
在一些方面中,线性抗体或线性TCR指的是形成一对抗原结合区的一对串联Fd区段(例如,VH-CH1-VH-CH1或Vα-Cα1-Vα-Cα1)。线性抗体和TCR可以是双特异性或单特异性的,例如,如由Zapata等人,Protein Eng.8(10):1057-1062(1995)描述的。
在一些方面中,抗原结合结构域指的是抗体或TCR的一个或更多个片段,其保留了与抗原特异性结合的能力。这样的术语内包含的抗体片段的非限制性实例包括但不限于:(i)Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,含有在铰链区处由二硫桥连接的两个Fab片段的二价片段;(iii)由VH和CH1结构域组成的Fd片段;(iv)含有抗体的单臂的VL和VH结构域的Fv片段,包括scFv,(v)dAb片段(Ward等人,(1989)Nature 341:544-546),其含有VH结构域;以及(vi)分离的CDR。该定义中还包括包含单个重链和单个轻链的抗体或具有单个α链或单个β链的TCR。
“F(ab’)2”和“Fab”部分可以通过用蛋白酶诸如胃蛋白酶和木瓜蛋白酶处理Ig来产生,并且包括通过在两条重链各自的铰链区之间存在的二硫键附近消化免疫球蛋白生成的抗体片段。例如,木瓜蛋白酶在两条重链各自的铰链区之间存在的二硫键的上游裂解IgG,以生成两个同源抗体片段,其中由VL和CL组成的轻链和由VH和CHγ1(重链的恒定区中的γ1区)组成的重链片段通过二硫键在它们的C末端区处相连接。这两个同源抗体片段各自被称为Fab’。胃蛋白酶还在两条重链各自的铰链区之间存在的二硫键的下游裂解IgG,以生成比该片段略大的抗体片段,其中两个上述Fab’在铰链区处相连接。该抗体片段被称为F(ab’)2。Fab片段还含有轻链的恒定结构域和重链的第一恒定结构域(CH1)。Fab’片段与Fab片段的不同在于在重链CH1结构域的羧基末端处添加少量残基,包括来自抗体铰链区的一个或更多个半胱氨酸。Fab’-SH在本文中是指其中恒定结构域的半胱氨酸残基带有游离巯基基团的Fab’。F(ab’)2抗体片段最初以其间具有铰链半胱氨酸的Fab’片段对的形式产生。
在一些方面中,Fv指的是含有完整的抗原识别位点和抗原结合位点的抗体或TCR片段。该区域由紧密、非共价缔合的一个重链可变结构域和一个轻链可变结构域或一条TCRα链和一条TCRβ链或一条TCRγ链和一条TCRδ链的二聚体组成。在该构型中,每个可变结构域的三个CDR相互作用以在VH-VL二聚体或Vα-Vβ二聚体或Vγ-Vδ二聚体的表面上限定抗原结合位点。共同地,来自每条VH链和VL链或Vα-Vβ链或Vγ-Vδ链的一个或更多个CDR的组合对抗体或TCR赋予抗原结合特异性。例如,将理解,例如,当转移到受体选择的抗体、TCR或其抗原结合片段的VH链和VL链或Vα链和Vβ链或Vγ-Vδ链时,CDRH3和CDRL3能够足以对抗体或TCR赋予抗原结合特异性,并且可以检测该CDR组合的结合、亲和力等。即使单个可变结构域(或仅含有对抗原特异的三个CDR的一半Fv)具有识别并结合抗原的能力,但是可能比与第二可变结构域组合时具有更低的亲和力。此外,虽然Fv片段的两个结构域(VL和VH或Vα和Vβ或Vγ和Vδ)由单独的基因编码,但是它们可以使用重组方法通过合成连接体连接,这使得它们能够成为单个蛋白质链,其中VL和VH或Vα和Vβ或Vγ和Vδ链区配对以形成单价分子(被称为单链Fv(scFv);Bird等人.(1988)Science 242:423-426;Huston等人.(1988)Proc.Natl.Acad.Sci.USA 85:5879-5883;和Osbourn等人.(1998)Nat.Biotechnol.16:778)。这样的scFv也意图被涵盖在术语抗体的“抗原结合部分”内。特定scFv的任何VH和VL序列可以与Fc区cDNA或基因组序列连接,以便生成编码完整的Ig(例如IgG)分子或其他同种型的表达载体。VH和VL还可以用于使用蛋白质化学或重组DNA技术生成Fab、Fv或Ig的其他片段。
抗原结合多肽还包括重链二聚体,诸如例如,来自驼类(camelids)和鲨鱼的抗体。驼类和鲨鱼抗体包含V-样结构域和C-样结构域(均不具有轻链)的两条链的同源二聚体对。因为驼类中重链二聚体IgG的VH区不必进行与轻链的疏水相互作用,所以在驼类中通常与轻链接触的重链区变为亲水氨基酸残基。重链二聚体IgG的VH结构域被称为VHH结构域。鲨鱼Ig-NAR包含一个可变结构域(被称为V-NAR结构域)和五个C-样恒定结构域(C-NAR结构域)的同源二聚体。在驼类中,抗体组库的多样性由VH区或VHH区中的CDR1、CDR2和CDR3决定。驼类VHH区中的CDR3的特征为其相对长的长度,平均为16个氨基酸(Muyldermans等人,1994,Protein Engineering 7(9):1129)。
“人源化”抗体是其中全部或基本上全部CDR氨基酸残基来源于非人类CDR并且全部或基本上全部FR氨基酸残基来源于人类FR的抗体。人源化抗体可以任选地包括来源于人类抗体的抗体恒定区的至少一部分。非人类抗体的“人源化形式”指的是已经经历人源化的非人类抗体的变体,该人源化典型地用于降低对人的免疫原性,同时保留亲代非人类抗体的特异性和亲和力。在一些实施方案中,人源化抗体中的一些FR残基用来自非人类抗体(例如,CDR残基所来源的抗体)的相应残基置换,例如用以恢复或提高抗体特异性或亲和力。
所提供的抗体包括人类抗体。“人类抗体”是具有这样的氨基酸序列的抗体,该氨基酸序列对应于由人类或人类细胞或利用人类抗体组库或其他人类抗体编码序列(包括人类抗体文库)的非人类来源产生的抗体的氨基酸序列。该术语排除包含非人类抗原结合区的非人类抗体的人源化形式,诸如其中全部或基本上全部CDR是非人类的那些。
人类抗体可以通过向转基因动物施用免疫原来制备,该转基因动物已经被修饰以响应于抗原攻击来产生完整人类抗体或具有人类可变区的完整抗体。这样的动物典型地含有全部或部分人类免疫球蛋白基因座,该人类免疫球蛋白基因座取代内源性免疫球蛋白基因座,或者存在于染色体外或被随机整合到动物染色体中。在这样的转基因动物中,内源性免疫球蛋白基因座通常已被失活。人类抗体还可以来源于含有源自人类组库的抗体编码序列的人类抗体文库,包括噬菌体展示文库和无细胞文库。
所提供的抗体包括单克隆抗体,包括单克隆抗体片段。如本文使用的,术语“单克隆抗体”指的是从基本均质的抗体群体(即,组成该群体的各个抗体是相同的)获得的抗体或在基本均质的抗体群体内的抗体,而含有天然存在的突变或在生产单克隆抗体制品期间产生的可能变体(这样的变体通常以少量存在)除外。与典型地包括针对不同表位的不同抗体的多克隆抗体制品不同,单克隆抗体制品的每个单克隆抗体是针对抗原上的单个表位。该术语不应被解释为抗体生产需要通过任何特定的方法。单克隆抗体可以通过多种技术制备,包括但不限于从杂交瘤生成、重组DNA方法、噬菌体展示以及其他抗体展示方法。
术语“多肽”和“蛋白质”可互换使用,指的是氨基酸残基的聚合物,并且不限于最小长度。包括所提供的抗体和抗体链以及其他肽,例如,连接体和结合肽的多肽可以包括氨基酸残基,包括天然和/或非天然的氨基酸残基。该术语还包括多肽的表达后修饰,例如糖基化、唾液酸化、乙酰化、磷酸化等。在一些方面中,多肽可以含有相对于原始或天然序列的修饰,只要蛋白质保持期望的活性即可。这些修饰可以是有意的,如通过定点诱变,或者可以是偶然的,诸如通过产生蛋白质的宿主的突变或由于PCR扩增引起的错误。
“种系序列”指的是来自种系(单倍体配子和形成它们的那些二倍体细胞)的遗传序列。种系DNA含有编码单个Ig重链或轻链、或单个TCRα链或TCRβ链或单个TCRγ链或TCRδ链的多个基因区段。这些基因区段携带于生殖细胞中,但在排列为功能性基因之前不能被转录和翻译。在骨髓中的B细胞和T细胞分化期间,这些基因区段被能够生成超过108种特异性的动态遗传系统随机改组。这些基因区段中的大部分由种系数据库公布并收集。
亲和力指的是两种剂可逆结合的平衡常数,并且表示为KD。结合蛋白对配体的亲和力,诸如抗体对表位的亲和力或者诸如TCR对MCH-肽复合物的亲和力可以是例如从约100纳摩尔(nM)至约0.1nM、从约100nM至约1皮摩尔(pM)或从约100nM至约1飞摩尔(fM)。术语“亲合力”指的是两种或更多种剂的复合物在稀释后解离的阻力。
在一些方面中,表位指的是能够与抗体或TCR的可变区结合袋形成结合相互作用的抗原或其他大分子的一部分。这样的结合相互作用可以表现为与一个或更多个CDR的一个或更多个氨基酸残基的分子间接触。抗原结合可以涉及,例如,CDR3、CDR3对,或在一些情况下,涉及多达VH链和VL链的所有六个CDR的相互作用。表位可以是线性肽序列(即“连续的”)或可以由非连续氨基酸序列组成(即“构象的”或“不连续的”)。抗体或TCR可以识别一个或更多个氨基酸序列;因此表位可以限定超过一个不同的氨基酸序列。在一些方面中,TCR可以识别在MHC的环境中的一个或更多个氨基酸序列或表位。被抗体和TCR识别的表位可以通过本领域技术人员熟知的肽映射和序列分析技术来确定。结合相互作用表现为与CDR的一个或更多个氨基酸残基的分子间接触。
在一些实施方案中,提及具有特异性结合的抗体或TCR指的是这样的情况:除了含有被抗体或TCR识别的表位的抗原以外,抗体或TCR将不会对其他分子示出任何显著的结合。该术语还适用于,例如,抗原结合结构域对多个抗原携带的特定表位特异的情况,在这种情况下,携带抗原结合结构域的选择的抗体、TCR或其抗原结合片段将能够与携带该表位的各种抗原结合。术语“优先结合”或“特异性结合”意指,抗体、TCR或其片段与表位结合的亲和力大于它与无关氨基酸序列结合的亲和力,并且,如果与含有该表位的其他多肽具有交叉反应性,则在其被配制用于人类施用应用的水平无毒。在一个方面中,这样的亲和力是抗体、TCR或其片段对无关氨基酸序列的亲和力的至少1倍大、至少2倍大、至少3倍大、至少4倍大、至少5倍大、至少6倍大、至少7倍大、至少8倍大、至少9倍大、10倍大、至少20倍大、至少30倍大、至少40倍大、至少50倍大、至少60倍大、至少70倍大、至少80倍大、至少90倍大、至少100倍大或至少1000倍大。术语“结合”指的是在生理条件下两个分子之间由于例如共价、静电、疏水和离子和/或氢键相互作用的直接缔合,并且包括诸如盐桥和水桥的相互作用,以及结合的任何其他常规方式。
术语“结合”指的是在生理条件下两个分子之间由于例如共价、静电、疏水和离子和/或氢键相互作用的直接缔合,并且包括诸如盐桥和水桥的相互作用,以及结合的任何其他常规方式。
在一些方面中,术语“四聚体”可以指的是包含结合至单个链霉亲和素分子的四个亚单位的复合物,该复合物可以结合并且因此鉴定细胞群体。亚单位可以是MHC-肽复合物。亚单位可以是无相关肽的MHC。亚单位可以是B细胞受体抗原。由四聚体识别的细胞群体可以是表达受体诸如TCR或BCR,与四聚体的亚单位结合的群体。细胞群体可以是抗原特异性T细胞。细胞群体可以是抗原特异性B细胞。四聚体可以被荧光标记。如本文使用的,MHC-肽四聚体可以与pMHC互换地使用。
“药学上可接受的”指的是生理上可耐受的并且当被施用至人类时通常不产生过敏或类似的不良反应诸如胃部不适、头晕等的分子实体和组合物。
“防止”指的是预防、防止症状的发作、防止与过量的蛋白质水平相关或与蛋白质活性相关的疾病或紊乱的进展。
“抑制”、“治疗(treatment)”和“治疗(treating)”可互换地使用,并且指的是,例如,停滞症状、延长存活、部分或完全改善症状,以及部分或全部消除与过量的蛋白质水平相关或与蛋白质活性相关的状况、疾病或紊乱。例如,癌症的治疗包括但不限于停滞、部分或完全消除癌性生长或肿瘤。治疗或部分消除包括,例如,生长或肿瘤尺寸和/或体积的成倍减少,诸如约2倍、约3倍、约4倍、约5倍、约10倍、约20倍、约50倍或之间的任何倍数减少。类似地,治疗或部分消除可以包括约1%、2%、3%、4%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%的生长或肿瘤尺寸和/或体积减少百分比,或之间的任何减少百分比。
在一些方面中,中和抗体或中和TCR指的是抑制病原体诸如病毒或细菌复制的任何抗体或TCR,而无论实现中和的机理如何。
抗体组库或TCR组库指的是抗体、TCR或其片段的集合。例如,抗体组库可以用于选择特定的抗体或针对特定性质诸如结合能力、结合特异性、胃肠转运能力、稳定性、亲和力等进行筛选。该术语特别地包括抗体和TCR文库,包括所有形式的组合文库,诸如例如抗体噬菌体展示文库,包括但不限于来自任何来源的单链Fv(scFv)和Fab抗体噬菌体展示文库,包括原始文库、合成文库和半合成文库。
“靶核酸分子”、“靶多核苷酸”、“靶多核苷酸分子”指的是任何感兴趣的核酸。
聚合酶链式反应(PCR)指的是通过双链多核苷酸的互补链的同时引物延伸,多核苷酸序列的体外扩增反应。PCR反应产生侧翼为引物结合位点的模板多核苷酸的拷贝。用两条引物的结果是,对于每次循环,两条链的模板多核苷酸拷贝数的指数增加,因为每次循环两条链都被复制。多核苷酸双链体具有对应于所使用的引物的末端的末端。PCR可以包括使模板多核苷酸变性、使引物与引物结合位点退火以及在核苷酸的存在下通过DNA或RNA聚合酶延伸引物的一次或更多次重复。特定温度、每个步骤的持续时间和步骤之间的变化率取决于本领域普通技术人员熟知的许多因素。(McPherson等人,IRL Press,Oxford(1991和1995))。例如,在使用Taq DNA聚合酶的常规PCR中,双链模板多核苷酸可以在>90℃的温度变性,引物可以在50℃-75℃范围内的温度退火,并且引物可以在72℃-78℃范围内的温度延伸。在一些实施方案中,PCR包括逆转录PCR(RT-PCR)、实时PCR、巢式PCR、定量PCR、多重PCR等。在一些实施方案中,PCR不包括RT-PCR。(美国专利第5,168,038号、第5,210,015号、第6,174,670号、第6,569,627号和第5,925,517号;Mackay等人,Nucleic Acids Research,30:1292-1305(2002))。RT-PCR包括在逆转录反应之前的PCR反应,并且扩增产生的cDNA。巢式PCR包括两级PCR,其中使用第一引物组的第一PCR反应的扩增子成为使用第二引物组的第二PCR反应的样品,至少一个第二引物与第一PCR反应的扩增子的内部位置结合。多重PCR包括PCR反应,其中多个多核苷酸序列在同一反应混合物中同时经历PCR。PCR反应体积可以是从0.2pL-1000μL的任何体积。定量PCR包括被设计用于测量样品中一个或更多个序列的绝对或相对量、丰度或浓度的PCR反应。定量测量可以包括比较一个或更多个参考序列或标准物与感兴趣的多核苷酸序列。(Freeman等人,Biotechniques,26:112-126(1999);Becker-Andre等人,Nucleic Acids Research,17:9437-9447(1989);Zimmerman等人,Biotechniques,21:268-279(1996);Diviacco等人,Gene,122:3013-3020(1992);Becker-Andre等人,Nucleic Acids Research,17:9437-9446(1989))。
如本文使用的,“核苷酸”、“核苷”、“核苷酸残基”和“核苷残基”可以意指能够作为适合于在扩增反应(例如PCR反应)中使用的引物的组分的脱氧核糖核苷酸残基或核糖核苷酸残基,或其他相似的核苷类似物。除非另有指示,这样的核苷及其衍生物可以用作本文描述的引物的构建单元。本申请中的任何内容都不意指排除使用经化学修饰以增强它们的稳定性或在扩增反应中的有效性的核苷衍生物或碱基,条件是该化学修饰不干扰它们被聚合酶适当地识别为脱氧鸟嘌呤、脱氧胞嘧啶、脱氧胸苷或脱氧腺嘌呤。在一些实施方案中,核苷酸类似物可以稳定杂交体形成。在一些实施方案中,核苷酸类似物可以使杂交体形成不稳定。在一些实施方案中,核苷酸类似物可以增强杂交特异性。在一些实施方案中,核苷酸类似物可以降低杂交特异性。
“核酸”或语法等同物指的是单个核苷酸或共价连接在一起的至少两个核苷酸。
“多核苷酸”或语法等同物指的是共价连接在一起的至少两个核苷酸。多核苷酸包括含有两个或更多个核苷酸的分子。多核苷酸包括任何长度的核苷酸的聚合形式,该核苷酸为核糖核苷酸、脱氧核糖核苷酸或肽核酸(PNA),其包含嘌呤和嘧啶碱基,或其他天然的、化学或生物化学修饰的、非天然的核苷酸碱基或其衍生物。多核苷酸的骨架可以包含糖和磷酸基团,或修饰的或被取代的糖或磷酸基团。多核苷酸可以包含修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以包括其他分子,诸如另一种杂交的多核苷酸。多核苷酸包括脱氧核糖核酸(DNA)、核糖核酸(RNA)或两者的序列。多核苷酸的非限制性实例包括基因、基因片段、外显子、内含子、基因间DNA(包括但不限于异染色质DNA)、信使RNA(mRNA)、转移RNA、核糖体RNA、核酶、小干扰RNA(siRNA)、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、序列的分离的DNA、序列的分离的RNA、核酸探针和引物。多核苷酸可以从天然来源分离、重组或人工合成。
多核苷酸可以包括非标准核苷酸,诸如核苷酸类似物或修饰的核苷酸。在一些实施方案中,非标准核苷酸可以稳定杂交体形成。在一些实施方案中,非标准核苷酸可以使杂交体形成不稳定。在一些实施方案中,非标准核苷酸可以增强杂交特异性。在一些实施方案中,非标准核苷酸可以降低杂交特异性。非标准核苷酸修饰的实例包括2’O-Me、2’O-烯丙基、2’O-炔丙基、2’O-烷基、2’氟代、2’阿拉伯糖基、2’木糖基、2’氟阿拉伯糖基、硫代磷酸、二硫代磷酸、氨基磷酸酯、2’氨基、5-烷基-取代的嘧啶、3’脱氧鸟苷、5-卤代-取代的嘧啶、烷基-取代的嘌呤、卤素-取代的嘌呤、二环核苷酸、2’MOE、PNA分子、LNA-分子、LNA-样分子、二氨基嘌呤、S2T、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫代尿苷、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基辫苷(β-D-galactosylqueosine)、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基辫苷、5’-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-D46-异戊烯基腺嘌呤、尿嘧啶-5-氧基乙酸(v)、wybutoxosine、假尿嘧啶、辫苷、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5氧基乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤及其衍生物。
“受试者”、“个体”、“宿主”或“患者”指的是活生物体,诸如哺乳动物。受试者和宿主的实例包括但不限于马、牛、骆驼、绵羊、猪、山羊、狗、猫、兔、豚鼠、大鼠、小鼠(例如人源化小鼠)、沙鼠(gerbils)、非人类灵长类动物(例如猕猴)、人等,非哺乳动物,包括例如,非哺乳类脊椎动物,诸如禽类(例如,鸡或鸭)、鱼(例如鲨鱼)或蛙(例如爪蟾(Xenopus)),和非哺乳类无脊椎动物,以及其转基因物种。在某些方面中,受试者指的是单个生物体(例如人)。在某些方面中,提供了一组个体,其组成为具有待研究的共同免疫因子和/或疾病的小群组,和/或不具有该疾病的个体的群组(例如,阴性/正常对照)。从其获得样品的受试者可以患有疾病和/或紊乱(例如,一种或更多种变态反应、感染、癌症或自身免疫紊乱等),并且可以与未患有该疾病的阴性对照受试者相比较。
“试剂盒”指的是用于递送用于实施本文公开的方法的材料或试剂的递送系统。在一些实施方案中,试剂盒包括允许反应试剂(例如,适当的容器中的探针、酶等)和/或支持材料(例如,缓冲液,用于进行测定的书面说明等)从一个位置到另一个位置的储存、运输或递送的系统。例如,试剂盒包括含有相关反应试剂和/或支持材料的一种或更多种外罩(例如盒子)。这样的内容物可以一起或单独地被递送至预期的接受者。例如,第一器皿可以含有用于在测定中使用的酶,而第二器皿含有多个引物。
在一些方面中,多肽指的是包含至少两个氨基酸的分子。在一些实施方案中,多肽由单个肽组成。在一些实施方案中,多肽包含两个或更多个肽。例如,多肽可以包含至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、或1000个肽或氨基酸。多肽的实例包括但不限于氨基酸链、蛋白质、肽、激素、多肽糖、脂质、糖脂、磷脂、抗体、酶、激酶、受体、转录因子和配体。
在一些方面中,样品指的是生物样品、环境样品、医学样品、受试者样品或患者样品或含有多核苷酸诸如靶多核苷酸的样品。
亲和-寡核苷酸缀合物
亲和-寡核苷酸缀合物包含亲和分子部分(例如,抗体或MHC-肽复合物)和寡核苷酸部分。亲和-寡核苷酸缀合物的寡核苷酸的抗原识别序列可以用于识别与亲和-寡核苷酸缀合物特异性相互作用的一个或更多个抗原。在一些实施方案中,寡核苷酸被共价地附接至缀合物的亲和部分。在一些实施方案中,寡核苷酸被非共价地附接至缀合物的亲和部分。亲和-寡核苷酸缀合物可以是四聚体-寡核苷酸缀合物。四聚体-寡核苷酸缀合物可以包含四聚体(例如,B细胞受体抗原四聚体或MHC-肽复合物四聚体)和寡核苷酸部分。四聚体-寡核苷酸缀合物的寡核苷酸的抗原识别序列可以用于识别与四聚体-寡核苷酸缀合物特异性相互作用的一个或更多个抗原。在一些实施方案中,寡核苷酸被共价地附接至缀合物的亲和部分或四聚体。在一些实施方案中,寡核苷酸被非共价地附接至缀合物的亲和部分或四聚体。
在一些实施方案中,亲和-寡核苷酸缀合物包含单个亲和部分。在一些实施方案中,亲和-寡核苷酸缀合物是多价亲和-寡核苷酸缀合物。例如,多价亲和-寡核苷酸缀合物可以包含与一个或更多个寡核苷酸缀合的至少两个亲和分子的抗原结合结构域。例如,多价亲和-寡核苷酸缀合物可以包含与一个或更多个寡核苷酸缀合的至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、50个、100个、200个、500个或1,000个亲和分子的抗原结合结构域。在一些实施方案中,亲和-寡核苷酸缀合物包含单个寡核苷酸。在一些实施方案中,亲和-寡核苷酸缀合物包含2个或更多个寡核苷酸。例如,亲和-寡核苷酸缀合物可以包含与一个或更多个亲和分子(例如,抗体或MHC-肽复合物)缀合的至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、50个、100个、200个、500个或1,000个寡核苷酸。在一些实施方案中,亲和-寡核苷酸缀合物包含2个或更多个含有相同抗原ID(AID)序列的寡核苷酸。例如,亲和-寡核苷酸缀合物可以包含至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、50个、100个、200个、500个或1,000个含有相同AID序列的寡核苷酸。
亲和-寡核苷酸缀合物的亲和部分
亲和-寡核苷酸缀合物的亲和部分(或结构域)包含亲和-寡核苷酸缀合物的与靶抗原结合的区域、分子、结构域、部分(portion)、片段或部分(moiety)。因此,亲和部分赋予与给定的靶抗原诸如细胞表面蛋白的细胞外结构域结合或特异性结合的能力。在一些实施方案中,亲和部分基本不与包含不同的抗原ID序列的另一个亲和-寡核苷酸缀合物的抗原相互作用。在一些实施方案中,亲和部分是可以含有核酸的分子,或可以附接寡核苷酸而基本不消除该亲和部分与靶抗原的结合的分子。
亲和-寡核苷酸缀合物的亲和部分可以是核酸分子或可以是蛋白质。亲和部分包括但不限于RNA、DNA、RNA-DNA杂交体、小分子(例如,药物)、适体、多肽、蛋白质、抗体及其片段、TCR及其片段、病毒、病毒颗粒、细胞、其碎片以及其组合。(参见,例如,Fredriksson等人,(2002)Nat Biotech 20:473-77;Gullberg等人,(2004)PNAS,101:8420-24)。例如,亲和部分可以是单链RNA、双链RNA、单链DNA、双链DNA、包含一个或更多个双链区域和一个或更多个单链区域的DNA或RNA、RNA-DNA杂交体、小分子、适体、多肽、蛋白质、抗体、抗体片段、TCR、TCR片段、MHC、MHC-肽复合物、病毒颗粒、细胞或其任何组合。
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分靶向细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以靶向T细胞或B细胞。在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分靶向特定的细胞类型或细胞亚群。例如,亲和-寡核苷酸缀合物的亲和部分可以靶向CD4+T细胞或CD8+T细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以靶向包含特异性识别特定抗原的TCR的T细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以靶向包含特异性识别特定MHC-肽复合物的TCR的T细胞。
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分靶向细胞的靶的细胞外结构域。例如,亲和-寡核苷酸缀合物的亲和部分可以靶向细胞的受体例如T细胞受体(TCR)的细胞外结构域。例如,亲和-寡核苷酸缀合物的亲和部分可以靶向细胞的受体的细胞外结构域的糖基化区域。例如,亲和-寡核苷酸缀合物的亲和部分可以靶向细胞的受体的细胞外结构域的配体结合区。例如,亲和-寡核苷酸缀合物的亲和部分可以靶向细胞的受体的细胞外结构域的不与配体结合的区域。
在一些实施方案中,四聚体-寡核苷酸缀合物的亲和部分包含MHC-肽复合物。在一些实施方案中,MHC-肽复合物靶向TCR。在一些实施方案中,四聚体-寡核苷酸缀合物的亲和部分包含B细胞受体抗原。在一些实施方案中,B细胞受体抗原靶向BCR。
蛋白质
在一些实施方案中,亲和部分是多肽、蛋白质或其任何片段。在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是蛋白质。在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是肽。例如,亲和-寡核苷酸缀合物的亲和部分可以是抗体,诸如抗体的结合结构域。例如,亲和-寡核苷酸缀合物的亲和部分可以是MHC-肽复合物。例如,亲和部分可以是纯化的多肽、分离的多肽、融合加标签的多肽、附接至或跨越细胞或病毒或病毒体的膜的多肽、细胞质蛋白质、细胞内蛋白质、细胞外蛋白质、激酶、磷酸酶、芳香化酶、解旋酶、蛋白酶、氧化还原酶、还原酶、转移酶、水解酶、裂解酶、异构酶,糖基化酶、细胞外基质蛋白、连接酶、离子转运蛋白、通道、孔、凋亡蛋白、细胞粘附蛋白、致病蛋白质、异常表达的蛋白质、转录因子、转录调节因子、翻译蛋白、伴侣蛋白、分泌蛋白、配体、激素、细胞因子、趋化因子、核蛋白、受体、跨膜受体、信号转导蛋白、抗体、膜蛋白、整合膜蛋白、外周膜蛋白、细胞壁蛋白质、球状蛋白质、纤维状蛋白质、糖蛋白、脂蛋白、染色体蛋白质、其任何片段或它们的任何组合。在一些实施方案中,亲和部分是异源多肽。在一些实施方案中,亲和部分是使用分子技术诸如转染在细胞中过表达的蛋白质。在一些实施方案中,亲和部分是重组多肽。例如,亲和部分可以包含在细菌(例如,大肠杆菌(E.coli))、酵母、哺乳动物或昆虫细胞中产生的样品(例如,由生物体过表达的蛋白质)。在一些实施方案中,亲和部分是含有突变、插入、缺失或多态性的多肽。在一些实施方案中,亲和部分是抗原,诸如用于免疫生物体或用于在生物体中产生免疫应答诸如用于产生抗体的多肽。
在一些实施方案中,四聚体-寡核苷酸缀合物的亲和部分是四聚体。在一些实施方案中,四聚体的亚单位是蛋白质。在一些实施方案中,四聚体的亚单位是肽。在一些实施方案中,四聚体的亚单位是蛋白质和/或肽的复合物。在一些实施方案中,蛋白质和/或肽的复合物可以共价地或非共价地连接和/或缔合。例如,四聚体-寡核苷酸缀合物的亲和部分可以是MHC-肽复合物。MHC-肽复合物中的肽的一些非限制性实例可以是来自以下的肽:纯化的多肽、分离的多肽、融合加标签的多肽、附接至或跨越细胞或病毒或病毒体的膜的多肽、细胞质蛋白质、细胞内蛋白质、细胞外蛋白质、激酶、磷酸酶、芳香化酶、解旋酶、蛋白酶、氧化还原酶、还原酶、转移酶、水解酶、裂解酶、异构酶,糖基化酶、细胞外基质蛋白、连接酶、离子转运蛋白、通道、孔、凋亡蛋白、细胞粘附蛋白、致病蛋白质、异常表达的蛋白质、转录因子、转录调节因子、翻译蛋白、伴侣蛋白、分泌蛋白、配体、激素、细胞因子、趋化因子、核蛋白、受体、跨膜受体、信号转导蛋白、抗体、膜蛋白、整合膜蛋白、外周膜蛋白、细胞壁蛋白质、球状蛋白质、纤维状蛋白质、糖蛋白、脂蛋白、染色体蛋白质、其任何片段或它们的任何组合。在一些实施方案中,肽来源于疾病相关抗原。例如,在一些方面中,肽来源于或可以来源于肿瘤相关抗原,包括通用肿瘤抗原、病毒相关抗原、自身免疫相关抗原、炎性相关抗原、细菌相关抗原或其任何组合。在一些实施方案中,亲和部分是使用分子技术诸如转染在细胞中过表达的蛋白质。在一些实施方案中,亲和部分是重组多肽。例如,亲和部分可以包含在细菌(例如,大肠杆菌)、酵母、哺乳动物或昆虫细胞中产生的样品(例如,由生物体过表达的蛋白质)。在一些实施方案中,亲和部分是含有突变、插入、缺失或多态性的多肽。在一些实施方案中,亲和部分是抗原,诸如用于免疫生物体或用于在生物体中产生免疫应答诸如用于产生抗体的多肽。作为另一实例,四聚体-寡核苷酸缀合物的亲和部分可以是B细胞受体抗原。B细胞受体抗原可以是四聚体的亚单位。
抗体
在一些实施方案中,亲和部分是抗体,例如,抗体的结合片段。抗体可以与另一个分子的特定空间和极性结构特异性结合。例如,抗体可以是纯化的抗体、分离的抗体、抗体的片段或融合加标签的抗体。在一些实施方案中,抗体使用分子技术诸如转染在细胞中过表达。在一些实施方案中,抗体是重组抗体。抗体可以与另一个分子诸如细胞表面分子的特定空间和极性结构特异性结合。抗体可以是单克隆抗体、多克隆抗体或重组抗体,并且可以通过本领域熟知的技术诸如宿主的免疫和血清的收集来制备(多克隆),或通过制备连续杂交细胞系和收集分泌蛋白来制备(单克隆),或通过克隆和表达核苷酸序列或其诱变处理形式来制备,所述核苷酸序列或其诱变处理形式编码天然抗体的特异性结合所需的氨基酸序列。此外,只要保持对于特定分子的结合亲和力,在合适的情况下可以使用免疫球蛋白或其片段的聚集体、聚合物和缀合物。抗体片段的实例包括Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;F(ab)2片段,包含在铰链区通过二硫键连接的两个Fab片段的二价片段;由VH和CH1结构域组成的Fd片段;由抗体的单臂的VL和VH结构域组成的Fv片段;单结构域抗体(dAb)片段(Ward等人,(1989)Nature 341:544-46),其由VH结构域组成;以及分离的CDR和单链片段(scFv),其中VL和VH区域配对形成单价分子(被称为单链Fv(scFv);参见,例如,Bird等人,(1988)Science 242:423-26;和Huston等人,(1988)PNAS 85:5879-83)。因此,抗体片段包括Fab、F(ab)2、scFv、Fv、dAb等。尽管两个结构域VL和VH通过单独的基因来编码,但它们可以使用重组方法通过人工肽连接体来连接,所述人工肽连接体使得它们能够被制成单个蛋白质链。这样的单链抗体包括一个或更多个抗原结合部分。这些抗体片段可以使用本领域技术人员已知的常规技术获得,并且可以用与完整抗体相同的方式针对可用性对这些片段进行筛选。抗体可以是人类的、人源化的、嵌合的、分离的、狗、猫、驴、绵羊、任何植物、动物或哺乳动物的抗体。
MHC
在一些情况下,由细胞免疫系统对抗原结构的识别是由表面表达的主要组织相容性复合物(MHC)介导的。在一些方面中,细胞诸如抗原呈递细胞(APC)将蛋白质诸如抗原加工成短肽,该短肽可以以MHC分子的特异性肽结合折叠呈递,并且在一些方面中可以因此被T细胞识别。由T细胞受体(TCR)对表位(肽片段)的特异性识别通常需要同时与MHC分子相互作用。稳定的多聚体复合物可以用含有结合肽的MHC蛋白质亚单位制备。MHC-抗原复合物可以与T细胞(通过该T细胞的抗原受体识别复合物)形成稳定的结构,从而允许与特异性识别该抗原的T细胞结合。亲和-寡核苷酸缀合物的亲和部分或四聚体-寡核苷酸缀合物的亲和部分可以靶向T细胞。亲和-寡核苷酸缀合物的亲和部分可以特异性地靶向T细胞。亲和-寡核苷酸缀合物的亲和部分或四聚体-寡核苷酸缀合物的亲和部分可以靶向T细胞受体或TCR样分子,诸如TCR样CAR。亲和-寡核苷酸缀合物的亲和部分可以特异性地靶向T细胞受体。例如,亲和-寡核苷酸缀合物的亲和部分或四聚体-寡核苷酸缀合物的亲和部分可以包含MHC分子。例如,亲和-寡核苷酸缀合物的亲和部分或四聚体-寡核苷酸缀合物的亲和部分可以包含MHC-肽复合物(MHC-p)。亲和-寡核苷酸缀合物的亲和部分或四聚体-寡核苷酸缀合物的亲和部分可以具有式(A-B-P)n,其中A是MHC I类或MHC II类蛋白质的α链,B是II类MHC蛋白质的β链或MHC I类蛋白质的β2微球蛋白,并且P是肽。在一些实施方案中,n是1。在一些实施方案中,n大于或等于2。MHC蛋白质亚单位可以呈可溶形式。例如,可溶性MHC蛋白质亚单位可以通过缺失跨膜结构域或其部分来源于天然MHC蛋白质亚单位。在一些实施方案中,MHC蛋白质亚单位不包含细胞质结构域。在一些实施方案中,MHC蛋白质亚单位不包含跨膜结构域。
对于具有I类MHC蛋白质的复合物,肽(P)的长度可以是从约6个至12个氨基酸,例如,约8个至10个氨基酸。对于具有II类MHC蛋白质的复合物,肽的长度可以是从约6个至20个氨基酸,例如,约10个至18个氨基酸。肽可以具有来源于各种各样的蛋白质的序列。肽可以是T细胞表位。来自许多抗原的表位序列是本领域已知的。可选择地,表位序列可以通过以下来根据经验确定:通过分离与天然MHC蛋白质结合的肽并对该肽测序,通过从靶序列合成一系列肽,然后测定T细胞对不同肽的反应性,或通过产生一系列具有不同肽的结合复合物并定量T细胞结合。制备片段、鉴定序列和鉴定最小序列在美国专利第5,019,384号及其中引用的参考文献中描述。肽可以以多种方式制备。方便地,肽可以通过采用自动合成仪的常规技术来合成,或可以人工合成。可选择地,可以制备编码特定肽的DNA序列并且DNA序列可以被克隆和表达以提供期望的肽。在该情况下,甲硫氨酸可以是第一氨基酸。此外,肽可以通过重组方法作为蛋白质的融合物(蛋白质是特异性结合对的其中之一)来产生,允许通过亲和试剂的方式纯化融合蛋白,然后通常在工程化位点进行蛋白质水解裂解,以产生期望的肽(参见,例如,Driscoll等人.(1993)J.Mol.Bio.232:342-350)。肽还可以从天然来源分离并且通过已知技术纯化,该已知技术包括例如,离子交换材料上的层析、按尺寸分离、免疫亲和层析和电泳。
在一些实施方案中,单独地产生α-亚单位和β-亚单位并且允许它们在体外缔合以形成稳定的异源双链体复合物(参见,例如,Altman等人.(1993)或Garboczi等人.(1992))。在一些实施方案中,α-亚单位和β-亚单位在单个细胞中一起表达。在一些实施方案中,使用具有α-亚单位和β-亚单位的单个分子。例如,可以通过使用短肽连接体例如,15个至25个氨基酸的肽或连接体,将这两个亚单位融合在一起而产生单链异二聚体(参见,例如,Bedzyk等人.(1990)J.Biol.Chem.265:18615)。可溶性异二聚体还可以通过分离天然异二聚体并且用用于产生可溶性产物的蛋白酶例如木瓜蛋白酶裂解来产生。
可溶性亚单位可以由编码截短蛋白的DNA构建体独立地表达。为了表达,DNA序列可以被插入合适的表达载体中,其中可以采用天然转录起始区或外源性转录起始区,例如,除了与正常存在的染色体中的基因相关的启动子以外的启动子。启动子可以通过体外重组方法,或作为将序列同源整合至染色体的结果来引入。对于各种各样的表达宿主,转录起始区是已知的。表达宿主可以包括原核生物或真核生物,特别地大肠杆菌、枯草杆菌(B.subtilis)、哺乳动物细胞,诸如CHO细胞、COS细胞、猴肾细胞、淋巴样细胞、人类细胞系等。
亚单位可以在合适的宿主细胞中表达,并且,如果需要的话,被溶解。两种亚单位可以与肽组合并且允许其在体外折叠以与链内二硫键键合结构域形成稳定的异二聚体复合物。肽可以被包含在起始折叠反应中,或者可以在后续步骤中添加至空的异二聚体中。在添加肽之前,MHC结合位点可以不含肽。例外将会是以下的情况,其中期望用天然的肽-MHC复合物,诸如可能在细胞表面上存在的作为自身免疫攻击的靶的那些肽-MHC复合物等,标记T细胞。MHC异二聚体将与通过两个膜远端结构域(对于I类为α2和α1,或对于II类为α1和β1)形成的沟槽中的肽结合。允许亚单位和肽折叠和缔合的条件是本领域已知的(参见,例如,Altman等人.(1993)和Garboczi等人.(1992))。作为允许条件的一个实例,将约等摩尔量的溶解的α和β亚单位在尿素溶液中混合。重折叠通过稀释或透析至不含尿素的缓冲溶液中开始。在约pH 5至5.5将肽加载至空的II类异二聚体中持续约1至3天,然后进行中和、浓缩和缓冲液更换。然而,本领域技术人员将容易理解,特定的折叠条件对于本发明的实践并不是关键的。
在一些实施方案中,单体复合物(α-β-P)可以被多聚化。例如,多聚体可以通过经由α亚单位或β亚单位上的特定附接位点使单体与多价实体结合来形成。在一些实施方案中,多聚体通过单体的化学交联形成。能够使蛋白质交联的许多试剂是本领域已知的,包括但不限于叠氮基苯甲酰肼、N-[4-(对叠氮基水杨基氨基)丁基]-3'-[2'-吡啶基二硫代]丙酰胺)、双磺基琥珀酰亚胺基辛二酸酯、己二亚胺酸二甲酯、二琥珀酰亚胺基酒石酸酯、N-γ-马来酰亚胺基丁酰基氧基琥珀酰亚胺酯、N-羟基磺基琥珀酰亚胺基-4-叠氮基苯甲酸酯、N-琥珀酰亚胺基[4-叠氮基苯基]-1,3'-二硫代丙酸酯、N-琥珀酰亚胺基[4-碘乙酰基]氨基苯甲酸酯、戊二醛、甲醛和4-[N-马来酰亚胺基甲基]环己烷-1-羧酸琥珀酰亚胺酯。用于结合多价实体的附接位点可以是天然存在的,或者可以通过遗传工程引入。位点可以是特异性结合对成员或者是被修饰以提供特异性结合对成员的位点,其中互补对具有特异性结合位点的多重性。与互补结合成员的结合可以是化学反应、表位-受体结合或半抗原-受体结合,其中半抗原连接至亚单位链。在优选的实施方案中,亚单位中的一个与提供用于修饰酶的识别位点的氨基酸序列融合。识别序列通常将在其中一个亚单位的羧基末端的近端融合,以避免在抗原肽结合位点处的潜在障碍。方便地,表达盒将包括编码识别位点的序列。
感兴趣的修饰酶包括BirA、各种糖基化酶、法尼基蛋白转移酶、蛋白激酶等。亚单位可以在任何方便的时间,通常在形成单体之后与修饰酶反应。通过修饰酶引入的基团,例如,生物素、糖、磷酸酯、法尼基等提供了互补结合对成员,或用于进一步修饰,诸如化学交联、生物素化等的独特位点,其将提供互补结合对成员。可选择的策略是将未配对的半胱氨酸残基引入亚单位,从而引入用于结合的独特的化学反应性位点。附接位点也可以是天然存在的或引入的表位,其中多价结合配偶体将是抗体,例如,IgG、IgM等。任何修饰将会在不会干扰结合的位点处,例如,C-末端近端。示例性的多聚体形成是催化蛋白质底物生物素化的酶BirA的识别序列的引入。然后具有生物素化的亚单位的单体与多价结合配偶体结合,所述多价结合配偶体例如与生物素以极高亲和力结合的链霉亲和素或亲和素。链霉亲和素具有4的化合价,提供(α-β-P)4的多聚体。多价结合配偶体可以在溶液中游离,或者可以附接至不溶性支持体。合适的不溶性支持体的实例包括珠例如,磁珠、膜和微量滴定板。这些不溶性支持体通常由玻璃、塑料(例如,聚苯乙烯)、多糖、尼龙或硝酸纤维素制成。当结合复合物将用于分离T细胞时,附接至不溶性支持体是有用的。
B细胞受体抗原
B细胞,诸如小的B细胞群体或B细胞亚群,可以经由B细胞受体(BCR)识别抗原。具有B细胞受体抗原的亚单位的四聚体可以用于鉴定和研究这些B细胞或B细胞亚群。B细胞受体抗原包括任何具有能够经由BCR诱导免疫应答的表位的抗原。例如,B细胞受体抗原可以是已经用于免疫受试者的抗原。B细胞受体抗原可以通过使用B细胞受体抗原的小的线性肽部分被制成四聚体,其中肽部分含有BCR表位。然后,小的线性化肽部分可以用表达载体中的生物素化位点表达,并且纯化为将用在四聚体中的单体。然后具有生物素化的亚单位的单体可以与多价结合配偶体结合,所述多价结合配偶体例如与生物素以极高亲和力结合的链霉亲和素或亲和素。链霉亲和素具有4的化合价,提供B细胞受体抗原的四聚体。产生的四聚体可以使用尺寸排阻柱纯化。
细胞
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是细胞。例如,亲和部分可以是完整细胞、用化合物(例如,药物)处理的细胞、固定的细胞、裂解的细胞或其任何组合。在一些实施方案中,亲和部分是单个细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以是T细胞或B细胞。在一些实施方案中,亲和部分是多个细胞。在一些实施方案中,亲和部分是T细胞。在一些实施方案中,亲和部分是B细胞。在一些实施方案中,亲和部分是抗原呈递细胞(APC)。在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是特定的细胞类型或细胞亚群。例如,亲和-寡核苷酸缀合物的亲和部分可以是CD4+T细胞或CD8+T细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以是包含特异性识别特定抗原的TCR的T细胞。例如,亲和-寡核苷酸缀合物的亲和部分可以是包含特异性识别特定MHC-肽复合物的TCR的T细胞。在一些实施方案中,亲和部分是细胞。
小分子
在一些实施方案中,亲和-寡核苷酸缀合物的亲和部分是小分子,诸如药物。例如,小分子可以是大环分子、抑制剂、药物或化学化合物。在一些实施方案中,小分子含有不超过五个氢键供体。在一些实施方案中,小分子含有不超过十个氢键受体。在一些实施方案中,小分子具有500道尔顿或更小的分子量。在一些实施例中,小分子具有从约180道尔顿至500道尔顿的分子量。在一些实施方案中,小分子含有不超过五的辛醇-水分配系数log P。在一些实施方案中,小分子具有从-0.4至5.6的分配系数log P。在一些实施方案中,小分子具有从40至130的摩尔折射率。在一些实施方案中,小分子含有从约20个至约70个原子。在一些实施方案中,小分子具有140埃2或更小的极性表面积。
核酸
在一些实施方案中,亲和部分是聚合物形式的核糖核苷酸和/或脱氧核糖核苷酸(腺嘌呤、鸟嘌呤、胸腺嘧啶或胞嘧啶),诸如DNA或RNA(例如,mRNA)。DNA包括在线性DNA分子(例如,限制性片段)、病毒、质粒和染色体中发现的双链DNA。在一些实施方案中,多核苷酸亲和部分是单链、双链、小干扰RNA(siRNA)、信使RNA(mRNA)、转移RNA(tRNA)、染色体、基因、非编码基因组序列、基因组DNA(例如,片段化基因组DNA)、纯化的多核苷酸、分离的多核苷酸、杂交的多核苷酸、转录因子结合位点、线粒体DNA、核糖体RNA、真核多核苷酸、原核多核苷酸、合成的多核苷酸、连接的多核苷酸、重组多核苷酸、含有核酸类似物的多核苷酸、甲基化多核苷酸、脱甲基化多核苷酸、其任何片段或其任何组合。在一些实施方案中,亲和部分是包含双链区域和非双链末端(例如,5’或3’突出端区)的多核苷酸。在一些实施方案中,亲和部分是重组多核苷酸。在一些实施方案中,亲和部分是异源多核苷酸。例如,亲和部分可以包含在细菌(例如,大肠杆菌)、酵母、哺乳动物或昆虫细胞中产生的多核苷酸(例如,与生物体异源的多核苷酸)。在一些实施方案中,亲和部分是含有突变、插入、缺失或多态性的多核苷酸。
在一些实施方案中,亲和部分是适体。适体是以高特异性和亲和力与靶分析物诸如蛋白质结合的分离的核酸分子。适体是保持在某种(些)构象中的三维结构,该构象提供化学接触以特异性结合其给定靶。尽管适体是基于核酸的分子,但适体和其他核酸分子诸如基因和mRNA之间存在根本差异。在后者中,核酸结构通过其线性碱基序列编码信息,并且因此该序列对于信息储存的功能是重要的。完全相反地,基于靶分子的特异性结合的适体功能不完全依赖于保守的线性碱基序列(非编码序列),而是依赖于特定的二级/三级/四级结构。适体可能具有的任何编码潜力完全是偶然的,并且在适体与其同源靶的结合中没有发挥任何作用。适体还必须区别于与某些蛋白质结合的天然存在的核酸序列。后者的序列是嵌入生物体的基因组内的天然存在的序列,该序列与参与天然存在的核酸的转录、翻译和转运的专门蛋白质亚组(例如,核酸结合蛋白质)结合。在另一方面,适体是短的、分离的、非天然存在的核酸分子。虽然可以鉴定结合核酸结合蛋白的适体,但是在大多数情况下这样的适体与自然界中被核酸结合蛋白识别的序列具有很小的或没有序列同一性。更重要地,适体可以结合几乎任何蛋白质(不仅仅核酸结合蛋白)以及几乎任何感兴趣的靶,包括小分子、碳水化合物、肽等。对于大多数靶,甚至蛋白质,不存在与其结合的天然存在的核酸序列。对于那些具有这样的序列的靶,例如核酸结合蛋白,这样的序列将不同于适体,这是因为与紧密结合适体相比在自然界中使用的结合亲和力相对较低。适体能够与所选择的靶特异性结合并且调节靶活性或结合相互作用,例如,通过结合,适体可以阻止其靶起作用的能力。与靶特异性结合的功能性质是适体的固有性质。典型适体的大小为6kDa-35kDa(20个-100个核苷酸),其以微摩尔至次纳摩尔的亲和力结合靶,并且可以辨别密切相关的靶(例如,适体可以选择性地结合来自同一基因家族的相关蛋白质)。适体能够使用常见的分子间相互作用,诸如氢键键合、静电互补性、疏水性接触和空间排斥,以与特定的靶结合。适体具有许多用作治疗和诊断的期望特征,包括高特异性和亲和力、低免疫原性、生物功效和优良的药代动力学性质。适体可以包含由共价连接的互补多核苷酸的杂交形成的分子茎和环结构(例如,发夹环结构)。茎包含杂交的多核苷酸,并且环是共价连接两个互补多核苷酸的区域。
在一些实施方案中,亲和部分是多个亲和部分,诸如亲和部分的混合物或文库。在一些实施方案中,亲和部分是多个不同的亲和部分。例如,亲和部分可以包含多个至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、500个、1,000个、2,000个、3,000个、4,000个、5,000个、6,000个、7,000个、8,000个、9,000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、25,000个或30,000个亲和部分。
亲和-寡核苷酸缀合物的寡核苷酸部分
亲和-寡核苷酸缀合物的寡核苷酸部分是与亲和-寡核苷酸缀合物的亲和部分偶联的核酸。在一些实施方案中,四聚体-寡核苷酸缀合物的寡核苷酸部分是与四聚体-寡核苷酸缀合物的亲和部分偶联的核酸。在一些实施方案中,四聚体-寡核苷酸缀合物的寡核苷酸部分是与四聚体复合物的一个或更多个核心元件偶联的核酸。例如,核酸可以与单体或四聚体链霉亲和素核心缀合。四聚体-寡核苷酸缀合物的示例性示意图在图10A、图10B、图13、图14和图18中描绘。在一些实施方案中,寡核苷酸与亲和部分直接偶联。在一些实施方案中,寡核苷酸与亲和部分间接偶联。在一些实施方案中,寡核苷酸与亲和部分非共价地偶联。在一些实施方案中,寡核苷酸与亲和部分共价地偶联。在一些实施方案中,寡核苷酸是合成的寡核苷酸。在优选的实施方案中,寡核苷酸基本上不直接与亲和部分的靶分析物相互作用。
与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可以包含一个或更多个条形码序列。例如,与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可以包含抗原ID(AID)序列和抗原分子条形码(AMB)序列。寡核苷酸可以包含抗原ID(AID)序列、融合序列、引物位点、分子条形码序列、恒定序列或其任何组合。
寡核苷酸可以含有使得能够与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的亲和部分缀合的化学修饰(例如,胺、硫醇或生物素)。
寡核苷酸可以包含多个寡核苷酸。多个寡核苷酸可以构成多个亲和-寡核苷酸缀合物或多个四聚体-寡核苷酸缀合物。例如,寡核苷酸可以包含多个至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、500个、1,000个、2,000个、3,000个、4,000个、5,000个、6,000个、7,000个、8,000个、9,000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、25,000个或30,000个寡核苷酸。例如,多个至少约2、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、500个、1,000个、2,000个、3,000个、4,000个、5,000个、6,000个、7,000个、8,000个、9,000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、25,000个或30,000个寡核苷酸可以构成多个至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、500个、1,000个、2,000个、3,000个、4,000个、5,000个、6,000个、7,000个、8,000个、9,000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000、25,000个或30,000个亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物。
寡核苷酸可以包含寡核苷酸条形码序列、寡核苷酸融合序列、寡核苷酸引物结合序列、寡核苷酸恒定序列或其任何组合。
寡核苷酸抗原ID(AID)序列
寡核苷酸可以包含寡核苷酸抗原条形码序列或其互补物。寡核苷酸抗原条形码可以允许识别包含寡核苷酸抗原条形码的亲和-寡核苷酸复合物或四聚体-寡核苷酸复合物。寡核苷酸抗原条形码可以允许识别寡核苷酸抗原条形码所附接的亲和部分。寡核苷酸抗原条形码可以用于识别来自与不同靶分析物结合的多个不同亲和部分的亲和部分。寡核苷酸抗原条形码可以唯一地条形码化地加至亲和-寡核苷酸复合物或唯一地条形码化地加至四聚体-寡核苷酸复合物。寡核苷酸抗原条形码可以唯一地条形码化地加至亲和部分。因此,寡核苷酸抗原条形码序列可以条形码化地加至特定的亲和部分。
寡核苷酸抗原条形码可以是独特的条形码序列。例如,多个寡核苷酸抗原条形码中的任一个寡核苷酸抗原条形码可以是独特的条形码序列。理论上可能的不同抗原条形码序列的数目可以直接取决于条形码序列的长度。例如,如果可以使用具有随机组装的腺嘌呤、胸苷、鸟苷和胞苷核苷酸的DNA条形码,则对于十个核苷酸的长度,可能的条形码序列的理论最大数目可以是1,048,576,并且对于十五个核苷酸的长度,可能的条形码序列的理论最大数目可以是1,073,741,824。寡核苷酸抗原条形码序列可以包含至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、40个、45个或50个或更多个连续核苷酸的序列。寡核苷酸可以包含两个或更多个寡核苷酸抗原条形码序列或其互补物。寡核苷酸抗原条形码序列可以包含随机组装的核苷酸序列。寡核苷酸抗原条形码序列可以是简并序列。寡核苷酸抗原条形码序列可以是已知序列。寡核苷酸抗原条形码序列可以是预定义序列。在优选的实施方案中,寡核苷酸抗原条形码序列是条形码化地加至其偶联的亲和部分的已知的独特的序列,使得含有寡核苷酸抗原条形码(例如,序列读段)或其互补物的信号可以用于识别与不同靶分析物相互作用的多个不同亲和部分中的亲和部分。
例如,与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可以包含为抗原ID(AID)序列的条形码。AID序列可以被条形码化地加至亲和-寡核苷酸缀合物的亲和部分。AID序列可以被条形码化地加至亲和部分所靶向的抗原。AID序列可以用于识别亲和-寡核苷酸缀合物的亲和部分和/或亲和部分所靶向的抗原。例如,AID序列可以被条形码化地加至抗体-寡核苷酸缀合物的抗体。例如,AID序列可以被条形码化地加至抗体-寡核苷酸缀合物的抗体所靶向的抗原。例如,AID序列可以用于对细胞进行免疫表型分型。例如,AID序列可以被条形码化地加至MHC-肽复合物的肽。
对于亲和-寡核苷酸缀合物的亲和部分靶向的每个抗原,AID序列可以是独特的。对于亲和-寡核苷酸缀合物的亲和部分,AID序列可以是独特的。例如,对于与细胞的不同靶抗原特异性结合的每个抗体,AID序列可以是独特的。在一些实施方案中,AID序列是定义的序列。在一些实施方案中,AID序列是已知序列。每个寡核苷酸的AID序列可以通过例如通过下一代测序对寡核苷酸或寡核苷酸的扩增产物测序来确定。
寡核苷酸分子条形码序列
寡核苷酸可以包含寡核苷酸分子条形码序列或其互补物。寡核苷酸条形码可以允许识别包含寡核苷酸条形码的亲和-寡核苷酸复合物的分子。寡核苷酸分子条形码可以唯一地条形码化地加至亲和-寡核苷酸复合物的分子。寡核苷酸分子条形码可以唯一地条形码化地加至亲和部分的分子。因此,寡核苷酸分子条形码序列可以条形码化地加至亲和部分的特定分子。
寡核苷酸分子条形码可以是独特的条形码序列。例如,多个寡核苷酸分子条形码中的任一个寡核苷酸分子条形码可以是独特的条形码序列。理论上可能的不同分子条形码序列的数目可以直接取决于条形码序列的长度。例如,如果可以使用具有随机组装的腺嘌呤、胸苷、鸟苷和胞苷核苷酸的DNA条形码,则对于十个核苷酸的长度,可能的条形码序列的理论最大数目可以是1,048,576,并且对于十五个核苷酸的长度,可能的条形码序列的理论最大数目可以是1,073,741,824。寡核苷酸分子条形码序列可以包含至少3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、40个、45个或50个或更多个连续核苷酸的序列。寡核苷酸可以包含两个或更多个寡核苷酸分子条形码序列或其互补物。寡核苷酸分子条形码序列可以包含随机组装的核苷酸序列。寡核苷酸分子条形码序列可以是简并序列。寡核苷酸分子条形码序列可以是已知序列。寡核苷酸分子条形码序列可以是预定义序列。在优选的实施方案中,寡核苷酸分子条形码序列是可以用于识别与靶分析物相互作用的多个亲和部分分子中的亲和部分分子的独特序列。
例如,与亲和-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可以包含条形码,该条形码是抗原分子条形码(AMB)序列。对于亲和-寡核苷酸缀合物中的每个寡核苷酸分子,抗原分子条形码(AMB)序列可以是独特的。AMB序列可以实现对与抗原(诸如容器,例如,乳液液滴中单个细胞的抗原)结合的亲和-寡核苷酸缀合物的寡核苷酸分子的数目的计数。每个寡核苷酸的AMB序列可以通过例如通过下一代测序对寡核苷酸或寡核苷酸的扩增产物测序来确定。
寡核苷酸融合序列
与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可以包含融合序列。融合序列可以允许将液滴特异性条形码序列PCR延伸至亲和-寡核苷酸缀合物例如,细胞表面结合的亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物例如,TCR或BCR结合的四聚体寡核苷酸缀合物的寡核苷酸上。多个寡核苷酸中的每个寡核苷酸的融合序列可以是相同的。融合序列可以包含与液滴条形码的序列互补的序列。在一些实施方案中,融合序列位于寡核苷酸的末端。在一些实施方案中,寡核苷酸末端处的融合序列不直接与抗体-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的亲和部分缀合。在一些实施方案中,寡核苷酸末端处的融合序列包含游离末端。
融合序列可以包含与3’加标签多核苷酸诸如包含容器条形码的多核苷酸的区域互补的区域。融合序列可以包含与多核苷酸诸如包含容器条形码的多核苷酸的区域的互补物互补的区域。例如,融合序列可以包含与含有条形码诸如容器条形码的3’加标签多核苷酸或其互补物互补的3’区,诸如3’末端区。
3’加标签多核苷酸可以是用于将核酸添加至靶多核苷酸诸如亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的3’末端的多核苷酸。3’加标签多核苷酸可以是用作模板以将核酸添加至靶多核苷酸诸如亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的3’末端的多核苷酸。3’加标签多核苷酸可以是与靶多核苷酸诸如亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的3’末端杂交的多核苷酸。3’加标签多核苷酸可以是含有与靶多核苷酸诸如亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的3’末端杂交的3’区诸如3’末端区的多核苷酸。
在一些实施方案中,3’加标签多核苷酸是容器条形码化多核苷酸。容器条形码可以被添加至亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸。例如,容器条形码可以与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸杂交。容器条形码化多核苷酸可以包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的3’末端杂交的3’区,诸如3’末端区。
在一些实施方案中,3’加标签多核苷酸是扩增产物。在一些实施方案中,3’加标签多核苷酸是源自单个分子的扩增产物。在一些实施方案中,3’加标签多核苷酸是容器条形码化多核苷酸的扩增产物。在一些实施方案中,3’加标签多核苷酸是源自单个容器条形码化多核苷酸的扩增产物。在与亲和-寡核苷酸缀合物的寡核苷酸的3’末端杂交的3’区域5’的区域可以包含与引物或其互补物互补的区域。在与亲和-寡核苷酸缀合物的寡核苷酸的3’末端杂交的3’区域5’的区域可以包含与可以用于扩增亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的引物互补的区域。例如,引物组可以用于扩增亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸,所述引物组包含第一引物和第二引物,该第一引物与同亲和-寡核苷酸缀合物、四聚体-寡核苷酸缀合物的寡核苷酸或其互补物的3’末端杂交的3’区域5’的区域互补,该第二引物与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的引物位点互补。
在与亲和-寡核苷酸缀合物的寡核苷酸的3’末端杂交的3’区域5’的区域可以包含与引物或其互补物互补的区域,所述引物或其互补物用于扩增容器条形码化多核苷酸。
寡核苷酸融合序列可以是至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个或更多个连续核苷酸。寡核苷酸融合序列可以是已知长度的序列。寡核苷酸融合序列可以是已知序列。寡核苷酸融合序列可以是预定义序列。寡核苷酸融合序列可以是已知长度的未知序列。寡核苷酸融合序列可以是已知长度的已知序列。
寡核苷酸恒定序列
与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可以包含恒定序列。恒定序列是任选的。多个亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物中的每个寡核苷酸的恒定序列可以是相同的。
寡核苷酸恒定序列可以用于增加寡核苷酸的长度或用于将寡核苷酸条形码、寡核苷酸融合物和寡核苷酸引物结合位点中的一个或更多个彼此分离。在一些实施方案中,寡核苷酸不包含寡核苷酸恒定序列。例如,寡核苷酸可以在包含寡核苷酸引物结合位点的寡核苷酸末端处与亲和部分偶联。
在一些实施方案中,寡核苷酸恒定序列被附接至亲和-寡核苷酸复合物或四聚体-寡核苷酸复合物的亲和部分。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸引物结合序列的上游。例如,寡核苷酸恒定序列可以位于寡核苷酸引物结合序列的5’处。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸引物结合序列的下游。例如,寡核苷酸恒定序列可以位于寡核苷酸引物结合序列的3’处。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸条形码的上游。例如,寡核苷酸恒定序列可以位于寡核苷酸条形码的5’处。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸条形码的下游。例如,寡核苷酸恒定序列可以位于寡核苷酸条形码的3’处。在一些实施方案中,寡核苷酸恒定序列位于寡核苷酸融合序列的上游。例如,寡核苷酸恒定序列可以位于寡核苷酸融合序列的5’处。
在一些实施方案中,寡核苷酸恒定序列介于寡核苷酸引物结合序列和亲和-寡核苷酸复合物或四聚体-寡核苷酸复合物的亲和部分之间。例如,寡核苷酸恒定序列可以位于寡核苷酸引物结合序列的5’处并且被附接至寡核苷酸的亲和部分。在一些实施方案中,寡核苷酸恒定序列介于寡核苷酸引物结合序列和寡核苷酸条形码之间。例如,寡核苷酸恒定序列可以位于寡核苷酸引物结合序列的3’处和寡核苷酸条形码的5’处。在一些实施方案中,寡核苷酸恒定序列介于寡核苷酸融合序列和寡核苷酸条形码之间。例如,寡核苷酸恒定序列可以位于寡核苷酸条形码的3’处和寡核苷酸融合序列的5’处。
寡核苷酸恒定序列可以是至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个、200个、250个、300个、400个、500个或更多个连续核苷酸。寡核苷酸恒定序列可以包含核苷酸的非随机序列。寡核苷酸恒定序列可以是已知长度的序列。寡核苷酸恒定序列可以是已知序列。寡核苷酸恒定序列可以是预定义序列。寡核苷酸恒定序列可以是已知长度的未知序列。寡核苷酸恒定序列可以是已知长度的已知序列。
寡核苷酸引物结合位点
与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的亲和部分偶联的寡核苷酸可以包含引物位点。引物位点可以包含与引物诸如扩增引物互补的序列。寡核苷酸引物结合序列可以用作用于反应诸如扩增或测序的引物结合位点。寡核苷酸引物结合序列可以是用于反应诸如扩增或测序的一对引物的第一引物结合序列。例如,寡核苷酸引物结合序列可以是正向引物结合位点。例如,寡核苷酸引物结合位点可以是反向引物结合位点。例如,寡核苷酸引物结合位点可以是正向引物结合位点,并且附接至寡核苷酸的容器条形码化多核苷酸的引物结合序列可以是反向引物结合序列。在一些实施方案中,寡核苷酸引物结合序列是通用引物结合序列。
寡核苷酸引物结合序列和附接至寡核苷酸的多核苷酸(例如,容器条形码化多核苷酸)的引物结合序列可以包含相差不超过6摄氏度、5摄氏度、4摄氏度、3摄氏度、2摄氏度或1摄氏度的解链温度。寡核苷酸引物结合序列和附接至寡核苷酸的多核苷酸的引物结合序列的核苷酸序列可以不同,使得与寡核苷酸引物结合序列杂交的多核苷酸不与附接至寡核苷酸的多核苷酸的引物结合序列杂交。寡核苷酸引物结合序列和附接至寡核苷酸的多核苷酸的引物结合序列的核苷酸序列可以不同,使得与附接至寡核苷酸的多核苷酸的引物结合序列杂交的多核苷酸不与寡核苷酸引物结合序列杂交。
寡核苷酸元件的排列
寡核苷酸可以以一定顺序排列,使得寡核苷酸融合序列位于寡核苷酸的一个末端。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在寡核苷酸融合序列的上游含有寡核苷酸条形码。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在寡核苷酸条形码的上游含有寡核苷酸引物结合序列。寡核苷酸可以以一定顺序排列,使得寡核苷酸恒定序列位于寡核苷酸引物结合序列的上游或下游。寡核苷酸可以以一定顺序排列,使得寡核苷酸恒定序列位于寡核苷酸条形码序列的上游。寡核苷酸可以以一定顺序排列,使得寡核苷酸恒定序列位于寡核苷酸的一个末端,例如,寡核苷酸的不含有寡核苷酸融合序列的末端。例如,寡核苷酸可以以寡核苷酸融合序列、寡核苷酸条形码序列、寡核苷酸引物结合序列和寡核苷酸恒定序列的顺序排列。例如,寡核苷酸可以朝着亲和部分的方向,以寡核苷酸融合序列、寡核苷酸条形码序列、寡核苷酸引物结合序列和寡核苷酸恒定序列的顺序排列。例如,寡核苷酸可以从5’末端至3’末端或从3’末端至5’末端,以寡核苷酸融合序列、寡核苷酸条形码序列、寡核苷酸引物结合序列和寡核苷酸恒定序列的顺序排列。例如,寡核苷酸可以以所述顺序包含5’末端寡核苷酸融合序列、独特的寡核苷酸条形码序列、反向寡核苷酸引物结合序列和附接至亲和部分(例如,经由附接至3’末端的伯胺基团)的3’寡核苷酸恒定序列。例如,附接至亲和部分的寡核苷酸可以朝着亲和部分的方向,以寡核苷酸融合序列、寡核苷酸条形码序列、寡核苷酸恒定序列和寡核苷酸引物结合位点序列的顺序排列。
寡核苷酸可以以一定顺序排列,使得融合序列位于寡核苷酸的一个末端。寡核苷酸可以以一定顺序排列,使得融合序列位于AID序列的下游。寡核苷酸可以以一定顺序排列,使得融合序列位于AMB序列的下游。寡核苷酸可以以一定顺序排列,使得融合序列位于恒定序列的下游。寡核苷酸可以以一定顺序排列,使得融合序列位于引物位点的下游。
寡核苷酸可以以一定顺序排列,使得引物位点位于寡核苷酸的一个末端。寡核苷酸可以以一定顺序排列,使得引物位点位于AID序列的上游。寡核苷酸可以以一定顺序排列,使得引物位点位于AMB序列的上游。寡核苷酸可以以一定顺序排列,使得引物位点位于恒定序列的上游。寡核苷酸可以以一定顺序排列,使得引物位点位于融合序列的上游。
寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列的上游含有AID序列。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在引物位点的下游含有AID序列。AID序列可以位于AMB序列的上游或下游。AID序列可以位于恒定序列的上游或下游。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列和引物位点之间含有AID序列。
寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列的上游含有AMB序列。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在引物位点的下游含有AMB序列。AMB序列可以位于AID序列的上游或下游。AMB序列可以位于恒定序列的上游或下游。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列和引物位点之间含有AMB序列。
寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列的上游含有恒定序列。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在引物位点的下游含有恒定序列。恒定序列可以位于AID序列的上游或下游。恒定序列可以位于AMB序列的上游或下游。寡核苷酸可以以一定顺序排列,使得该寡核苷酸在融合序列和引物位点之间含有恒定序列。
寡核苷酸可以以一定顺序排列,使得AMB序列和/或AID序列不位于寡核苷酸的一个末端,例如,寡核苷酸的含有融合序列或引物位点的末端。例如,寡核苷酸可以以融合序列、AID序列、AMB序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、AMB序列、AID序列和引物位点的顺序排列。
例如,寡核苷酸可以以融合序列、AID序列、AMB序列、恒定序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、AMB序列、AID序列、恒定序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、恒定序列、AID序列、AMB序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、恒定序列、AMB序列、AID序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、AID序列、恒定序列、AMB序列和引物位点的顺序排列。例如,寡核苷酸可以以融合序列、AMB序列、恒定序列、AID序列和引物位点的顺序排列。
例如,寡核苷酸可以朝着亲和-寡核苷酸缀合物的亲和部分的方向,以融合序列、AID序列、AMB序列、恒定序列和引物位点的顺序排列。例如,寡核苷酸可以从寡核苷酸的5’末端至3’末端,以融合序列、AID序列、AMB序列、恒定序列和引物位点的顺序排列。例如,寡核苷酸可以以所述顺序包含5’末端融合序列、AID序列、AMB序列、恒定序列和附接至亲和-寡核苷酸缀合物的亲和部分(例如,经由附接至寡核苷酸的3’末端的抗体的伯胺基团)的3’引物位点。
亲和-寡核苷酸缀合物制备
本文描述的方法和组合物中采用的亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物可以使用任何方便的方法制备。亲和部分可以与寡核苷酸直接地或间接地(例如,经由连接体)偶联。亲和部分可以与寡核苷酸共价地偶联(例如,经由化学交联)或非共价地偶联(例如,经由链霉亲和素-生物素)。在本领域中广泛描述了亲和-寡核苷酸缀合物的设计和制备,包括可以使用的各种不同的亲和部分、设计用于邻近连接测定的寡核苷酸以及将这样的寡核苷酸与亲和部分偶联以形成亲和-寡核苷酸缀合物。本领域中描述的细节和原理可以应用于亲和-寡核苷酸缀合物的设计,以用于在本发明的方法中使用(参见,例如,WO2007107743和美国专利第7,306,904号和第6,878,515号)。
可以利用寡核苷酸和亲和部分之间的直接偶联反应,例如,其中各自具有能够与另一个上的官能团反应的官能团(例如,取代基或化学把柄(chemical handle))。官能团可以存在于寡核苷酸或亲和部分上或被引入到这些组分(例如,经由氧化反应、还原反应、裂解反应等)。已经描述了用于产生核酸/多肽缀合物的方法(参见,例如,美国专利第5,733,523号)。
可以用于与寡核苷酸偶联的抗体或多肽的官能团包括但不限于碳水化合物、氨基酸的硫醇基团(HS-)、氨基酸的胺基团(H2N-)和氨基酸的羧基基团。例如,碳水化合物结构可以被氧化为醛,并且与含H2NNH基团的化合物反应以形成官能团-C═NH-NH-。例如,硫醇基团可以与硫醇反应性基团反应以形成硫醚或二硫化物。例如,蛋白质的游离硫醇基团可以通过天然半胱氨酸残基中的二硫化物的硫醇化或分裂被引入蛋白质中。例如,氨基基团(例如,赖氨酸残基的氨基末端或ω氨基基团)可以与亲电基团(例如,活化的羧基基团)反应以形成酰胺基团。例如,羧基基团(例如,二酸α氨基酸的羧基末端或羧基基团)可以被活化并且与氨基基团接触以形成酰胺基团。其他示例性官能团包括,例如,SPDP、碳二亚胺、戊二醛等。
在示例性实施方案中,使用商业试剂盒(“一体化抗体-寡核苷酸缀合试剂盒(All-in-One Antibody-Oligonucleotide Conjugation Kit)”;Solulink,Inc.)将寡核苷酸与亲和部分共价地偶联。例如,首先,3’-氨基-寡核苷酸可以用Sulfo-S-4FB衍生。第二,亲和部分可以用S-HyNic基团修饰。第三,HyNic修饰的亲和部分可以与4FB修饰的寡核苷酸反应以产生双芳基腙居间的亲和-寡核苷酸缀合物。过量的4FB修饰的寡核苷酸可以经由磁性亲和基质进一步去除。总亲和部分回收率可以是至少约95%、96%、97%、98%、99%或100%不含HyNic修饰的亲和部分和4FB修饰的寡核苷酸。双芳基腙键对于热(例如,94℃)和pH(例如,3-10)两者可以是稳定的。
在采用连接基团的情况下,可以选择这样的连接体来提供亲和部分与寡核苷酸通过连接基团的共价附接或非共价附接。多种合适的连接体是本领域已知的。在一些实施方案中,连接体是至少约50道尔顿或100道尔顿。在一些实施方案中,连接体是至多约300道尔顿、500道尔顿、1,000道尔顿、10,000道尔顿或100,000道尔顿。连接体可以在任一端包含具有能够与寡核苷酸键合的反应功能性的官能团。连接体可以在任一端包含具有能够与亲和部分键合的反应功能性的官能团。官能团可以存在于寡核苷酸、亲和部分和/或连接体上或被引入到这些组分上(例如,经由氧化反应、还原反应、裂解反应等)。
示例性连接体包括聚合物、脂肪族烃链、不饱和烃链、多肽、多核苷酸、环状连接体、无环连接体、碳水化合物、醚、聚胺和本领域已知的其他连接体。连接体的示例性官能团包括亲核官能团(例如,胺、氨基基团、羟基基团、巯基基团、氨基基团、醇、硫醇和酰肼)、亲电官能团(例如,醛、酯、乙烯酮、环氧化物、异氰酸酯和马来酰亚胺)以及能够进行环加成反应、形成二硫键或与金属结合的官能团。例如,连接体的官能团可以是伯胺、仲胺、异羟肟酸、N-羟基琥珀酰亚胺酯、N-羟基琥珀酰亚胺碳酸酯、氧羰基咪唑、硝基苯基酯、三氟乙基酯、缩水甘油醚、乙烯砜、马来酰亚胺、叠氮基苯甲酰肼、N-[4-(对叠氮基水杨基氨基)丁基]-3’-[2’-吡啶基二硫代]丙酰胺)、双磺基琥珀酰亚胺基辛二酸酯、己二亚胺酸二甲酯、二琥珀酰亚胺基酒石酸酯、N-马来酰亚胺基丁酰基氧基琥珀酰亚胺酯、N-羟基磺基琥珀酰亚胺基-4-叠氮基苯甲酸酯、N-琥珀酰亚胺基[4-叠氮基苯基]-1,3’-二硫代丙酸酯、N-琥珀酰亚胺基[4-碘乙酰基]氨基苯甲酸酯、戊二醛和4-[N-马来酰亚胺基甲基]环己烷-1-羧酸琥珀酰亚胺酯、3-(2-吡啶基二硫代)丙酸N-羟基琥珀酰亚胺酯(SPDP)、4-(N-马来酰亚胺基甲基)-环己烷-1-羧酸N-羟基琥珀酰亚胺酯(SMCC)等。
在其他实施方案中,亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物可以使用产生亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的体外方案来产生,诸如由编码亲和部分的载体在体外产生亲和部分。感兴趣的这样的体外方案的实例包括:基于RepA的方案(参见,例如,Fitzgerald等人,Drug Discov Today(2000)5:253-58和WO9837186)、基于核糖体展示的方案(参见,例如,Hanes等人,PNAS(1997)94:4937-42;Roberts等人,Curr OpinChem Biol(1999)6月;3:268-73;Schaffitzel等人,J Immunol Methods(1999)12月10日;231:119-35;和WO9854312)等。
用于将核酸分子与抗体缀合的技术是本领域熟知的(参见,例如,MonoclonalAntibodies And Cancer Therapy(Reisfeld等人编著,Alan R.Liss,Inc.,1985)中的Arnon等人,"Monoclonal Antibodies For Immunotargeting Of Drugs In CancerTherapy,";Controlled Drug Delivery(Robinson等人编著,Marcel Deiker,Inc.,第2版.1987)中的Hellstrom等人,"Antibodies For Drug Delivery,";MonoclonalAntibodies'84:Biological And Clinical Applications(Pinchera等人编著,1985)中的Thorpe,"Antibody Carriers Of Cytotoxic Agents In Cancer Therapy:A Review,";Monoclonal Antibodies For Cancer Detection And Therapy(Baldwin等人编著,Academic Press,1985)中的"Analysis,Results,and Future Prospective of theTherapeutic Use of Radiolabeled Antibody In Cancer Therapy,";和Thorpe等人,1982,Immunol.Rev.62:119-58。还参见,例如,PCT公布WO 89/12624)。例如,核酸分子可以诸如分别通过N-羟基琥珀酰亚胺酯或马来酰亚胺官能度共价地附接至抗体上的赖氨酸或半胱氨酸。
靶抗原
亲和部分的靶抗原可以是核酸分子,或者可以是蛋白质,诸如靶蛋白或肽。靶抗原可以是存在于样品中的细胞上的化合物或组合物。在一些实施方案中,靶抗原可以是特别地在哺乳动物诸如人类中能够引发细胞介导的免疫应答(即,适应性免疫应答)的化合物或组合物。在一些实施方案中,在MHC分子的环境中靶抗原可以被T细胞识别。靶抗原包括但不限于细胞、组织提取物、组织或细胞裂解物、蛋白质,单独地或作为混合物,多种蛋白质,肽、肽的混合物、脂质、碳水化合物、糖等。靶抗原可以是疾病特有的,所述疾病诸如感染性疾病、自身免疫病或癌症。靶抗原可以是例如病毒抗原、细菌抗原、癌症抗原等。
在一些实施方案中,靶抗原是病毒抗原。病毒抗原包括例如,病毒外壳蛋白、流感病毒抗原、HIV抗原、乙型肝炎抗原或丙型肝炎抗原。
在一些实施方案中,靶抗原是癌症抗原(例如,蛋白质、肽、脂质、碳水化合物等),该癌症抗原单独或主要由肿瘤细胞或癌细胞表达或过表达,使得抗原与肿瘤或癌症相关联。癌症抗原可以是仅一种类型的癌症或肿瘤的癌症抗原,使得癌症抗原与仅一种类型的癌症或肿瘤相关联,或为仅一种类型的癌症或肿瘤所特有。可选择地,癌症抗原可以是超过一种类型的癌症或肿瘤的癌症抗原(例如,可以是超过一种类型的癌症或肿瘤所特有的)。例如,癌症抗原可以由乳腺癌细胞和前列腺癌细胞两者表达,而完全不由正常的非肿瘤或非癌细胞表达,或仅最低限度地表达。癌症抗原可以是黑素瘤癌症抗原或乳腺癌抗原。示例性的癌症抗原包括由gp100.MART-1、NY-ESO-1、蛋白质的MAGE家族的成员例如MAGE-A1、间皮素、酪氨酸酶、TRP-1、TRP-2、PMSA、Her-2和p53组成的组的那些。
靶抗原可以天然地、人工地、合成地或重组地产生。因此,靶抗原可以是合成的、重组的、分离的和/或纯化的蛋白质、多肽或肽。制备或获得这样的抗原的方法是本领域已知的。例如,从头合成多肽和蛋白质(例如,抗原多肽和蛋白质)的合适的方法在Chan等人,Fmoc Solid Phase Peptide Synthesis,Oxford University Press.Oxford,UnitedKingdom,2005;Peptide and Protein Drug Analysis,Reid,R编著,Marcel Dekker,Inc.,2000;Epitope Mapping,Westwood等人编著,Oxford University Press.Oxford.UnitedKingdom,2000;和美国专利第5,449,752号中描述。此外,多肽和蛋白质(例如,抗原多肽和蛋白质)可以使用编码多肽或蛋白质的核酸,利用标准重组方法重组地产生。参见,例如,Sambrook等人,Molecular Cloning:A Laboratory Manual,第3版.Cold Spring HarborPress,Cold Spring Harbor,N.Y.2001;和Ausubel等人,Current Protocols inMolecular Biology.Greene Publishing Associates and John Wiley&Sons,NY,1994。许多抗原的核苷酸序列是本领域已知的,并且从美国国家生物技术信息中心(NCBI)网站的GenBank数据库可获得。此外,抗原可以从来源诸如植物、细菌、昆虫、哺乳动物,例如,大鼠、人类等分离和/或纯化。分离和纯化的方法是本领域熟知的。
抗原可以是游离抗原,例如,未结合的抗原肽(例如,游离肽),或者可以是结合的抗原,例如,通过用肽脉冲的载体细胞呈递的MHC-肽四聚体或抗原肽。
在一些实施方案中,靶分析物是膜结合蛋白。在一个实施方案中,膜结合蛋白是CD4,一种具有单个跨膜(TM)结构域的经典I型膜蛋白。(Carr等人,(1989)J.Biol.Chem.264:21286-95)。在另一个实施方案中,膜结合蛋白是GPR77,一种多跨越的G蛋白偶联受体(GPCR)膜蛋白。(Cain&Monk,(2002)J.Biol.Chem.277:7165-69)。
另外的示例性膜结合蛋白包括但不限于GPCR(例如,肾上腺素能受体、血管紧张素受体、胆囊收缩素受体、毒蕈碱乙酰胆碱受体、神经降压素受体、甘丙肽受体、多巴胺受体、阿片受体、5-羟色胺受体、生长抑素受体等)、离子通道(例如,烟碱乙酰胆碱受体、钠通道、钾通道等)、受体酪氨酸激酶、受体丝氨酸/苏氨酸激酶、受体鸟苷酸环化酶、生长因子和激素受体(例如,表皮生长因子(EGF)受体)及其他。也可以使用膜结合蛋白的突变体或修饰的变体。例如,GPCR的一些单个或多个点突变保留功能并参与疾病(参见,例如,Stadel等人,(1997)Trends in Pharmacological Review 18:430-37)。
单个细胞表征、细胞多核苷酸条形码化和链配对
本文描述的方法可以包括利用亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物对细胞进行表征。多个细胞可以与一个或更多个亲和-寡核苷酸缀合物或一个或更多个四聚体-寡核苷酸缀合物接触。可以洗涤细胞以去除未结合的缀合物。细胞可以在容器中分离为单个细胞。与分离的细胞结合的亲和-寡核苷酸缀合物可以通过诸如将容器条形码化多核苷酸附接至缀合物的寡核苷酸被修饰为含有容器条形码序列。与分离的细胞结合的四聚体-寡核苷酸缀合物可以通过诸如将容器条形码化多核苷酸附接至缀合物的寡核苷酸被修饰为含有容器条形码序列。
具有容器条形码的多核苷酸还可以在容器形成期间被引入。这些容器条形码化多核苷酸可以携带简并条形码,使得含有容器条形码的每个寡核苷酸含有与这些条形码所在的容器相对应的独特识别码。
寡核苷酸可以被扩增并且反应的扩增产物可以被从容器回收。扩增产物可以被PCR富集以添加下一代测序(NGS)标签。可以使用高通量测序平台对文库测序,然后分析容器条形码序列和/或AID序列和/或AMB序列。由于每个单个细胞被分离在其各自的容器中,因此对于被两次观察到的每个容器条形码,被测序的扩增的寡核苷酸产物源自同一容器,并且因此来自独特的单个细胞。由于寡核苷酸的每个AID被条形码化地加至其附接的亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的亲和部分,并且每个单个细胞被分离在其各自的容器中,因此对于观察到的含有相同容器条形码的序列的每个AID,被测序的扩增的寡核苷酸产物源自与同一容器中的单个细胞结合的特定的亲和-寡核苷酸缀合物。对于在全部含有相同容器条形码的序列组中单独地观察到的每个不同的AMB,在该组中被测序的具有AMB的扩增寡核苷酸产物源自与同一容器中的细胞结合的(例如,在使用单细胞的容器的情况下,与该容器中的单个细胞结合的)单个亲和-寡核苷酸缀合物分子的不同(与其他单独的AMB相比)的单个寡核苷酸部分。对于观察到的每个单个AMB,具有含有该相同容器条形码的序列的全部扩增寡核苷酸产物源自单个(同一)亲和-寡核苷酸缀合物分子或四聚体-寡核苷酸缀合物分子的寡核苷酸部分(例如,代表PCR复制物或扩增子)。因此,观察到的具有特定AMB和特定容器条形码的给定组合的每个寡核苷酸指示与单个细胞结合的亲和-寡核苷酸缀合物的单个分子或与单个细胞结合的四聚体-寡核苷酸缀合物的单个分子;因此,检测具有这样的AMB/容器条形码组合的被测序的多于一个(multiple)寡核苷酸的给定数目(例如,2个、3个、4个或更多个)指示在例如测定的细胞群体或样品内与单个细胞结合的亲和-寡核苷酸缀合物的数目(例如,2个、3个、4个或更多个)或与单个细胞结合的四聚体-寡核苷酸缀合物的数目(例如,2个、3个、4个或更多个)。因此,这样的数目可以指示亲和-寡核苷酸缀合物的给定亲和部分被设计结合至的细胞上的分子的数目,例如,在单个细胞上或单个细胞中表达的拷贝的数目。
在一些实施方案中,本文描述的方法还包括对来源于细胞的多核苷酸和/或容器中的多核苷酸条形码化,所述来源于细胞的多核苷酸和/或容器中的多核苷酸不同于亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物并且不同于其部分或拷贝。例如,与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物结合或已经结合的封装在容器中的单个细胞可以被裂解,并且另外的多核苷酸诸如来自单个细胞的或单个细胞内的多核苷酸可以被条形码化。在一些实施方案中,容器中的亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物寡核苷酸部分,例如与容器中的单个细胞结合或已经结合的亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸部分,和/或其拷贝或扩增产物可以用容器条形码序列来条形码化。在一些实施方案中,来自单个细胞的一个或更多个细胞多核苷酸可以用相同的容器条形码化序列来条形码化;在一些实施方案中,这样的另外的一个或更多个细胞多核苷酸进一步用分子条形码来条形码化。
T细胞受体链对和抗体免疫球蛋白链对是两种类型的免疫受体。在一些实施方案中,细胞多核苷酸是抗体免疫球蛋白链(或部分)编码多核苷酸;在一些实施方案中,细胞多核苷酸是或包含TCR(或部分)编码多核苷酸。在一些实施方案中,被亲和-寡核苷酸缀合物结合的抗原是TCR或抗体或其链或部分。在一个方面中,本文描述的方法还包括生成用于高通量测序和诊断的多核苷酸文库。在一个方面中,本文描述的方法还包括开发从患者或具有特定的共同属性的群组发现的抗体和/或TCR的人类来源的文库组。所公开的发明可以应用于多种不同类型的配对的可变序列,例如,T细胞受体链对和抗体免疫球蛋白链对,以及使用亲和-寡核苷酸缀合物的单细胞表征。例如,与细胞多核苷酸互补的多核苷酸,诸如重链和/或轻链,例如VH和/或VL,抗体链和/或α链和/或β链和/或γ链和/或δ链,例如Vα/Vβ和Vγ/VδT细胞受体(TCR)链(诸如来源于其框架部分的那些链)可以在容器形成期间被引入(或被包含在容器内)。具有容器条形码的多核苷酸还可以在容器形成期间被引入(或被包含在容器内)。这些容器条形码化多核苷酸可以携带简并条形码,使得含有容器条形码的每个细胞多核苷酸含有对应于与反应期间该条形码所在的容器的独特识别码。因此,在一些这样的实施方案中,具有相同的独特识别码的多个多核苷酸被认为源自同一容器,并且因此在一些方面中来自单个细胞。具有分子条形码的多个多核苷酸还可以在容器的形成期间被引入或包含在容器内。这些分子条形码化多核苷酸可以携带简并条形码,使得含有分子条形码的每个细胞多核苷酸分子含有对应于它们所来自的单个细胞多核苷酸分子的独特识别码。数百万个单个免疫细胞可以在乳液内裂解,并且细胞转录物,诸如VH和VL和/或Vα/Vβ和/或Vγ/Vδ链转录物,可以使用引物来逆转录或拷贝,随后用容器条形码和分子条形码加标签,并且PCR扩增条形码化多核苷酸。来自单个免疫细胞(例如,B细胞或T细胞)的每个VH和VL和/或Vα/Vβ链和/或Vγ/Vδ链可以与相同的容器条形码身份实际上彼此关联。
然后,VH和VL和/或Vα/Vβ链和/或Vγ/Vδ链可以从容器回收并且进行PCR富集,以便添加下一代测序(NGS)标签。可以使用高通量测序平台对文库测序,然后分析组库多样性、抗体频率、CDR3表征、体细胞高频突变系统发生分析等。正确匹配的VH和VL和/或Vα/Vβ对和/或Vγ/Vδ对的数据库可以通过使容器和分子条形码序列去卷积来生成。由于每个单个免疫细胞被分离在其各自的容器中,因此对于被观察到两次的每个容器条形码,被测序的转录物源自相同的乳液液滴,并且因此来自独特的单个细胞。对于观察到的每个不同的分子条形码,对于含有相同容器条形码的序列,被测序的转录物源自来自单个细胞的不同转录物分子。对于观察到的每个相同的分子条形码,对于含有相同容器条形码的序列,被测序的转录物源自来自单个细胞的相同转录物分子(例如,PCR复制物)。
与测序并行地,从容器回收的VH和VL和/或Vα/Vβ链和/或Vγ/Vδ链的文库可以被克隆到抗体表达载体中并且共转染以用于酵母展示筛选。与在开始时分裂生物样品相比,克隆该一致的(identical)文库汇合物(pool)是优选的方法,因为一些罕见的免疫细胞将只在一个或另一个测定中被捕获。人类来源的VH和VL和/或Vα和Vβ链和/或Vγ和Vδ链的文库不论正确或错误的配对匹配均可以表达,如经典展示测定一样。然后,可以针对一个或更多个抗原靶进行酵母展示,以富集潜在的抗体候选物。
可以对从展示技术诸如酵母展示得到的阳性候选抗体测序并查询匹配对的条形码数据库。每个酵母展示的VH和/或Vα链和/或Vγ链可以分别回溯匹配于其各自的VL或Vβ链或Vδ链,并且每个酵母展示的VL和/或Vβ链和/或Vδ链可以分别回溯匹配于其各自的VH或Vα链或Vγ链。这些正确配对的候选物可以在哺乳动物细胞系中基因合成并表达,并且针对感兴趣的靶进行功能性验证。这些候选物可以是完全人类抗体和/或TCR。
样品
在一些实施方案中,含有多核苷酸的任何样品可以在本文描述的方法中使用。含有细胞的任何样品通常可以在本文描述的方法中使用。例如,样品可以是来自受试者或来自来源于受试者的样品的含有RNA或DNA的生物样品。多核苷酸可以从生物样品提取,或者样品可以直接经历该方法而不提取或纯化多核苷酸。样品可以是提取的或分离的DNA或RNA。样品也可以是从生物样本提取的总RNA或DNA、cDNA文库、病毒或基因组DNA。在一个实施方案中,多核苷酸从含有多种其他组分,诸如蛋白质、脂质和非模板核酸的生物样品分离。核酸模板分子可以从获自动物、植物、细菌、真菌或任何其他细胞生物体的任何细胞材料获得。在某些实施方案中,多核苷酸从单个细胞获得。多核苷酸可以从生物体直接获得或从由生物体获得的生物样品获得。任何组织或体液样本可以用作在本发明中使用的核酸的来源。多核苷酸也可以从培养的细胞诸如原代细胞培养物或细胞系分离。从其获得模板核酸的细胞或组织可以被病毒或其他细胞内病原体感染。
在某些实施方案中,产生抗体或TCR的免疫细胞可以从受试者或宿主的血液或其他生物样品分离以鉴定具有潜在临床意义的病原体、肿瘤和/或疾病特异性抗体或TCR,该受试者或宿主诸如人类或其他动物,诸如已经被免疫或患有感染、癌症、自身免疫状况或任何其他疾病的人类或其他动物。例如,人类可以被诊断为患有疾病、表现出疾病的症状、未被诊断为患有疾病或未表现出疾病的症状。例如,人类可以是暴露于传染原(例如,病毒、细菌、寄生虫、朊病毒等)、抗原或疾病和/或可以针对其产生有用的抗体或TCR的人类。例如,动物可以是暴露于传染原(例如,病毒、细菌、寄生虫、朊病毒等)、抗原或疾病和/或可以针对其产生有用的抗体或TCR的动物。来自免疫的宿主的某些免疫细胞产生针对一种或更多种所讨论的靶抗原和/或一种或更多种未知抗原的抗体或TCR。在本发明中,可以通过任何合适的方法,诸如使用荧光激活细胞分选(FACS)、磁性激活细胞分选(MACS)、淘选或其他筛选方法,针对期望的免疫细胞对淋巴细胞集合体进行富集,以生成来自样品的多种免疫细胞,诸如免疫细胞文库,之后对抗体链测序、产生抗体,或产生表达文库。与仅提供表达不同抗体的很少免疫细胞的亚群,并且因此仅提供很少的天然存在的可变结构域组合的现有技术富集方法相比,本发明的免疫细胞文库含有表达不同抗体或TCR的至少2个亚群的单独的免疫细胞。例如,本发明的免疫细胞文库可以含有表达不同抗体或TCR的至少5个、10个、100个、250个、500个、750个、1000个、2500个、5000个、10000个、25000个、50000个、75000个、100000个、250000个、500000个、750000个、1000000个、2500000个、5000000个、7500000个或10000000个亚群的单独的免疫细胞。本发明的方法使免疫细胞回收最大化,并且提供了非常高的多样性。
T细胞可以从许多来源获得,包括外周血单核细胞、骨髓、胸腺、组织活检物、肿瘤、淋巴结组织、肠相关淋巴样组织、粘膜相关淋巴样组织、脾脏组织或任何其他淋巴样组织和肿瘤。T细胞可以从T细胞系以及从自体或同种异体来源获得。T细胞可以从单个个体或个体群体,例如,全部患有相同的疾病诸如癌症或感染性疾病的个体群体获得。在一些实施方案中,来自个体的循环血液的细胞通过清血术(apheresis)或白细胞分离术获得。清血术产物通常含有淋巴细胞,包括T细胞、单核细胞、粒细胞、B细胞、其他有核白细胞、红细胞和血小板。在一个实施方案中,可以洗涤通过清血术或白细胞分离术收集的细胞以去除血浆级分,并且将这些细胞置于合适的缓冲液或介质中以用于后续处理步骤。在本发明的一个实施方案中,用磷酸盐缓冲盐水(PBS)洗涤细胞。在可选择的实施方案中,洗涤溶液不含钙,并且可以不含镁或可以不含许多(如果不是全部的话)二价阳离子。如本领域普通技术人员将容易理解的,洗涤步骤可以通过本领域技术人员已知的方法来完成,诸如通过使用半自动化“流通”离心机。在洗涤之后,细胞可以重悬于多种生物相容的缓冲液,诸如例如无Ca++/Mg++的PBS中。可选择地,可以去除清血术样品中不需要的组分,并且将细胞直接重悬于培养基中。在其他实施方案中,通过裂解红细胞并通过经由PERCOLLTM梯度离心从外周血淋巴细胞分离T细胞。特定的T细胞亚群,诸如CD28+、CD4+、CD8+、CD45RA+和CD45RO+T细胞还可以通过阳性或阴性选择技术来分离。例如,CD3+、CD28+T细胞可以使用CD3/CD28缀合的磁珠(例如, M-450 CD3/CD28 T细胞扩增器)进行阳性选择。在一些实施方案中,通过阴性选择富集T细胞群体可以用针对对于阴性选择的细胞独特的表面标志物的抗体的组合来完成。一种这样的方法是经由阴性磁性免疫粘附或流式细胞术的细胞分选和/或选择,所述阴性磁性免疫粘附或流式细胞术使用针对存在于阴性选择的细胞上的细胞表面标志物的单克隆抗体的混合物。例如,为了通过阴性选择富集CD4+细胞,单克隆抗体混合物通常包括针对CD14、CD20、CD11b、CD16、HLA-DR和CD8的抗体。另一种制备用于刺激的T细胞的方法是在洗涤步骤之后冷冻这些细胞,该方法不需要单核细胞去除步骤。不希望受理论束缚,冷冻和后续的解冻步骤通过去除细胞群体中的粒细胞,以及在某种程度上去除单核细胞来提供更均匀的产物。在去除血浆和血小板的洗涤步骤之后,这些细胞可以悬浮在冷冻溶液中。虽然许多冷冻溶液和参数是本领域已知的并且将可用于这一环境中,但是一种方法包括使用含有20%DMSO和8%人血清白蛋白(HSA)的PBS或其他合适的细胞冷冻介质。其然后用介质以1:1稀释,使得DMSO和HSA的最终浓度分别为10%和4%。然后将细胞以每分钟1℃的速率冷冻至-80℃,并且在液氮储罐中以汽相储存。
在一些实施方案中,利用来自非免疫的人类或非人类供体的免疫细胞。动物的原始组库(抗原攻击之前的组库)向动物提供了可以以适度的亲和力(KA为约1x10-6M至1x10- 7M)与基本上任何非自身分子结合的抗体或TCR。抗体或TCR结合位点的序列多样性不在种系中直接被编码,而是以组合的方式从V基因区段组装。免疫触发任何免疫细胞产生VH-VL或Vα-Vβ或Vγ-Vδ组合,该组合与免疫原结合以增殖(克隆扩增)并分泌如上文提到的相应抗体。然而,使用来自未经免疫的受试者的脾细胞和/或免疫细胞或其他外周血淋巴细胞(PBL)可以提供对可能的抗体或TCR组库的更好呈现,并且还允许使用任何动物物种构建随后的B细胞或T细胞抗体或TCR文库。
在一些情况下,为了获得足够的核酸以用于测试,抽取至少0.001mL、0.005mL、0.01mL、0.05mL、0.1mL、0.5mL、1mL、2mL、3mL、4mL、5mL、10mL、20mL、25mL、30mL、35mL、40mL、45mL或50mL的血液体积。
在一些情况下,起始材料是外周血。外周血细胞可以针对特定的细胞类型(例如,单核细胞;红细胞;CD4+细胞;CD8+细胞;免疫细胞;T细胞,NK细胞等)来富集。外周血细胞还可以被选择性消耗特定的细胞类型(例如,单核细胞;红细胞;CD4+细胞;CD8+细胞;免疫细胞;T细胞,NK细胞等)。
在一些情况下,起始材料可以是组织样品,包括实体组织,其非限制性实例包括脑、肝、肺、肾、前列腺、卵巢、脾、淋巴结(包括扁桃体)、甲状腺、胰腺、心脏、骨骼肌、肠、喉、食道和胃。在其他情况下,起始材料可以是含有核酸的细胞、免疫细胞,并且特别地B细胞或T细胞。在一些情况下,起始材料可以是来自可以从中获得遗传物质的任何生物体的含有核酸的样品。在一些情况下,样品是流体,例如血液、唾液、淋巴或尿液。
样品可以从具有状况的受试者取得。在一些情况下,从中取得样品的受试者可以是患者,例如,癌症患者或疑似具有癌症的患者。受试者可以是哺乳动物,例如人类,并且可以是雄性或雌性。在一些情况下,雌性是妊娠的。样品可以是肿瘤活检物。活检可以由例如健康护理提供者进行,包括医师、医师助理、护士、兽医、牙医、按摩师、护理人员、皮肤科医师、肿瘤学家、胃肠病学家或外科医师。
在一些情况下,非核酸物质可以使用酶促处理(诸如蛋白酶消化)从起始材料去除。
在一些情况下,血液可以被收集到含有镁螯合剂(包括但不限于EDTA)的设备中,并且在4℃储存。任选地,可以添加钙螯合剂,包括但不限于EGTA。在另一种情况下,将细胞裂解抑制剂添加至血液,包括但不限于甲醛、甲醛衍生物、福尔马林、戊二醛、戊二醛衍生物、蛋白质交联剂、核酸交联剂、蛋白质和核酸交联剂、伯胺反应性交联剂、巯基反应性交联剂、巯基添加剂或二硫化物还原剂、碳水化合物反应性交联剂、羧基反应性交联剂、光反应性交联剂或可裂解交联剂。
在一些情况下,当提取的材料包含单链RNA、双链RNA或DNA-RNA杂交体时,这些分子可以使用本领域已知的技术转化为双链DNA。例如,可以采用逆转录酶以从RNA分子合成DNA。在一些情况下,RNA向DNA的转化可能需要预先的连接步骤,以将连接体片段连接至RNA,从而允许使用通用引物来启动逆转录。在其他情况下,mRNA分子的聚-A尾例如可以用于启动逆转录。在一些情况下,在转化为DNA后,可以使用本文详述的方法来进一步捕获、选择、加标签或分离期望的序列。
核酸分子包括脱氧核糖核酸(DNA)和/或核糖核酸(RNA)。核酸分子可以是合成的或来源于天然存在的来源。在一个实施方案中,核酸分子从含有多种其他组分,诸如蛋白质、脂质和非模板核酸的生物样品分离。核酸模板分子可以从获自动物、植物、细菌、真菌或任何其他细胞生物体的任何细胞材料获得。在某些实施方案中,核酸分子从单个细胞获得。用于在本发明中使用的生物样品包括病毒颗粒或制品。核酸分子可以从生物体直接获得,或从自生物体获得的生物样品获得,例如,从血液、尿液、脑脊液、精液、唾液、痰、粪便和组织获得。任何组织或体液样本可以用作在本发明中使用的核酸的来源。核酸分子也可以从培养的细胞诸如原代细胞培养物或细胞系分离。从其获得模板核酸的细胞或组织可以被病毒或其他细胞内病原体感染。
样品也可以是从生物样本提取的总RNA、cDNA文库、病毒或基因组DNA。在某些实施方案中,核酸分子与其他靶分子诸如蛋白质、酶、底物、抗体、结合剂、珠、小分子、肽或任何其他分子结合。通常,核酸可以通过多种技术从生物样品提取,诸如由Sambrook和Russell,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor,N.Y.(2001)描述的技术。核酸分子可以是单链、双链或具有单链区的双链(例如,茎结构和环结构)。
DNA提取方法是本领域熟知的。经典的DNA分离方案基于使用有机溶剂诸如苯酚和氯仿的混合物来提取,然后用乙醇沉淀(J.Sambrook等人,“Molecular Cloning:ALaboratory Manual,”1989,第2版,Cold Spring Harbour Laboratory Press:New York,N.Y.)。其他方法包括:盐析DNA提取(P.Sunnucks等人,Genetics,1996,144:747-756;S.M.Aljanabi等人,Nucl.Acids Res.1997,25:4692-4693)、三甲基溴化铵盐DNA提取(S.Gustincich等人,BioTechniques,1991,11:298-302)和硫氰酸胍DNA提取(J.B.W.Hammond等人,Biochemistry,1996,240:298-300)。用于从生物样品提取DNA的多种试剂盒是可商购的(例如,BD Biosciences Clontech(Palo Alto,CA):EpicentreTechnologies(Madison,WI);Gentra Systems,Inc.(Minneapolis,MN);MicroProbe Corp.(Bothell,WA);Organon Teknika(Durham,NC);和Qiagen Inc.(Valencia,CA))。
RNA提取方法也是本领域熟知的(例如,J.Sambrook等人,“Molecular Cloning:ALaboratory Manual”1989,211d Ed.,Cold Spring Harbour Laboratory Press:NewYork)并且用于从体液提取RNA的试剂盒是可商购的(例如,Ambion,Inc.(Austin,TX);Amersham Biosciences(Piscataway,NJ);BD Biosciences Clontech(Palo Alto,CA);BioRad Laboratories(Hercules,CA);Dynal Biotech Inc.(Lake Success,NY);Epicentre Technologies(Madison,WI);Gentra Systems,Inc.(Minneapolis,MN);GIBCOBRL(Gaithersburg,MD);Invitrogen Life Technologies(Carlsbad,CA);MicroProbeCorp.(Bothell,WA);Organon Teknika(Durham,NC);Promega,Inc.(Madison,WI);和Qiagen Inc.(Valencia,CA))。
一个或更多个样品可以来自一个或更多个来源。一个或更多个样品可以来自两个或更多个来源。一个或更多个样品可以来自一个或更多个受试者。一个或更多个样品可以来自两个或更多个受试者。一个或更多个样品可以来自相同的受试者。一个或更多个受试者可以来自相同的物种。一个或更多个受试者可以来自不同的物种。一个或更多个受试者可以是健康的。一个或更多个受试者可能受到疾病、紊乱或状况的影响。
在一些实施方案中,样品是流体,诸如血液、唾液、淋巴、尿液、脑脊液、精液、痰、粪便或组织匀浆。
样品可以从具有状况的受试者取得。在一些实施方案中,从中取得样品的受试者可以是患者,例如,癌症患者或疑似具有癌症的患者。受试者可以是哺乳动物,例如人类,并且可以是雄性或雌性。在一些实施方案中,雌性是妊娠的。样品可以是肿瘤活检物。活检可以由例如健康护理提供者进行,包括医师、医师助理、护士、兽医、牙医、按摩师、护理人员、皮肤科医师、肿瘤学家、胃肠病学家或外科医师。
在一些实施方案中,多核苷酸与其他靶分子诸如蛋白质、酶、底物、抗体、结合剂、珠、小分子、肽或任何其他分子结合。在一些实施方案中,多核苷酸不与固体支持体结合。核酸可以通过多种技术从生物样品提取(Sambrook等人,Molecular Cloning:A LaboratoryManual,Third Edition,Cold Spring Harbor,N.Y.(2001))。
在一些实施方案中,样品是唾液。在一些实施方案中,样品是全血。在一些实施方案中,为了获得足够量的多核苷酸以用于测试,抽取至少约0.001mL、0.005mL、0.01mL、0.05mL、0.1mL、0.5mL、1mL、2mL、3mL、4mL、5mL、10mL、20mL、25mL、30mL、35mL、40mL、45mL或50mL的血液体积。在一些实施方案中,血液可以被收集到含有镁螯合剂(包括但不限于EDTA)的设备中,并且在4℃储存。任选地,可以添加钙螯合剂,包括但不限于EGTA。
在一些实施方案中,将细胞裂解抑制剂添加至血液,包括但不限于甲醛、甲醛衍生物、福尔马林、戊二醛、戊二醛衍生物、蛋白质交联剂、核酸交联剂、蛋白质和核酸交联剂、伯胺反应性交联剂、巯基反应性交联剂、巯基添加剂或二硫化物还原剂、碳水化合物反应性交联剂、羧基反应性交联剂、光反应性交联剂或可裂解交联剂。在一些实施方案中,非核酸物质可以使用酶促处理(诸如蛋白酶消化)从起始材料去除。
多个样品可以包括至少2个、3个、4个、5个、10个、20个、30个、40个、50个、60个、70个、80个、90个或100个或更多个样品。多个样品可以包括至少约100个、200个、300个、400个、500个、600个、700个、800个、900个或1000个或更多个样品。多个样品可以包括至少约1000个、2000个、3000个、4000个、5000个、6000个、7000个、8000个样品、9000个或10,000个样品、或100,000个样品、或1,000,000个或更多个样品。多个样品可以包括至少约10,000个样品。
第一样品中的一个或更多个多核苷酸可以与第二样品中的一个或更多个多核苷酸不同。第一样品中的一个或更多个多核苷酸可以与多个样品中的一个或更多个多核苷酸不同。样品中的一个或更多个多核苷酸可以包含至少约80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性。在一些实施方案中,样品中的一个或更多个多核苷酸可以有少于约100个、90个、80个、70个、60个、50个、40个、30个、25个、20个、15个、10个、9个、8个、7个、6个、5个、4个、3个、2个或1个核苷酸或碱基对不同。多个样品的一个或更多个样品中的多个多核苷酸可以包含两个或更多个相同序列。多个样品的一个或更多个样品中的总多核苷酸的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%可以包含相同的序列。多个样品的一个或更多个样品中的多个多核苷酸可以包含至少两个不同的序列。多个样品的一个或更多个样品中的总多核苷酸的至少约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%可以包含至少两个不同的序列。在一些实施方案中,一个或更多个多核苷酸是彼此的变体。例如,一个或更多个多核苷酸可以含有单核苷酸多态性或其他类型的突变。在另一个实例中,一个或更多个多核苷酸是剪接变体。
第一样品可以包含一个或更多个细胞,并且第二样品可以包含一个或更多个细胞。第一样品的一个或更多个细胞与第二样品的一个或更多个细胞可以是相同的细胞类型。第一样品的一个或更多个细胞与多个样品的一个或更多个不同细胞可以是不同的细胞类型。
多个样品可以同时获得。多个样品可以在相同时间获得。多个样品可以顺序获得。多个样品可以在获得一个或更多个不同样品的数年过程中获得,例如100年、10年、5年、4年、3年、2年或1年。一个或更多个样品可以在获得一个或更多个不同样品的约一年内获得。一个或更多个样品可以在获得一个或更多个不同样品的12个月、11个月、10个月、9个月、8个月、7个月、6个月、4个月、3个月、2个月或1个月内获得。一个或更多个样品可以在获得一个或更多个不同样品的30天、28天、26天、24天、21天、20天、18天、17天、16天、15天、14天、13天、12天、11天、10天、9天、8天、7天、6天、5天、4天、3天、2天或1天内获得。一个或更多个样品可以在获得一个或更多个不同样品的约24小时、22小时、20小时、18小时、16小时、14小时、12小时、10小时、8小时、6小时、4小时、2小时或1小时内获得。一个或更多个样品可以在获得一个或更多个不同样品的约60秒、45秒、30秒、20秒、10秒、5秒、2秒或1秒内获得。一个或更多个样品可以在获得一个或更多个不同样品的少于一秒内获得。
样品的不同多核苷酸可以以不同浓度或量(例如,不同的分子数目)存在于样品中。例如,样品中一个多核苷酸的浓度或量可以大于另一个多核苷酸的浓度或量。在一些实施方案中,样品中至少一个多核苷酸的浓度或量是样品中至少一个其他多核苷酸的浓度或量的至少约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍、200倍、300倍、400倍、500倍、600倍、700倍、800倍、900倍、1000倍或更多倍大。在另一个实例中,样品中一个多核苷酸的浓度或量小于另一个多核苷酸的浓度或量。样品中至少一个多核苷酸的浓度或量可以是样品中至少一个其他多核苷酸的浓度或量的至少约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍、200倍、300倍、400倍、500倍、600倍、700倍、800倍、900倍、1000倍或更多倍小。
在一些实施方案中,两个或更多个样品可以含有不同量或浓度的多核苷酸。在一些实施方案中,一个样品中一个多核苷酸的浓度或量可以大于不同样品中相同多核苷酸的浓度或量。例如,血液样品可以比尿液样品含有更高量的特定多核苷酸。可选择地,单个样品可以被分成两个或更多个子样品。子样品可以含有不同量或浓度的相同多核苷酸。一个样品中至少一个多核苷酸的浓度或量可以是另一个样品中相同多核苷酸的浓度或量的至少约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍、200倍、300倍、400倍、500倍、600倍、700倍、800倍、900倍、1000倍或更多倍大。可选择地,一个样品中一个多核苷酸的浓度或量可以小于不同样品中相同多核苷酸的浓度或量。例如,一个样品中至少一个多核苷酸的浓度或量可以是另一个样品中相同多核苷酸的浓度或量的至少约1.5倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍、200倍、300倍、400倍、500倍、600倍、700倍、800倍、900倍、1000倍或更多倍小。
靶多核苷酸
在一些情况下,本文提供的方法涉及对靶多核苷酸分子,诸如来自细胞的多核苷酸分子、亲和-寡核苷酸缀合物的寡核苷酸或其扩增子的扩增和测序。在一些情况下,本文提供的方法涉及对靶多核苷酸分子的至少一个区域的扩增和测序。在一些情况下,本文提供的方法涉及对至少一个靶多核苷酸分子的扩增和测序。在一个方面中,靶多核苷酸是亲和-寡核苷酸缀合物的寡核苷酸。在一个方面中,靶多核苷酸是RNA。在一些实施方案中,靶RNA多核苷酸是mRNA。在一些实施方案中,靶RNA多核苷酸是聚腺苷酸化的。在一些实施方案中,RNA多核苷酸不是聚腺苷酸化的。在一些实施方案中,靶多核苷酸是DNA多核苷酸。例如,靶多核苷酸包括cDNA。DNA多核苷酸可以是基因组DNA。DNA多核苷酸可以包含外显子、内含子、非翻译区或其任何组合。
在一个方面中,靶多核苷酸是基因组核酸。来源于特定生物体的染色体中的遗传物质的DNA可以是基因组DNA。在一些实施方案中,靶多核苷酸包括包含由免疫细胞产生的抗体或TCR的可变区的序列。在一些实施方案中,靶多核苷酸包括包含由免疫细胞产生的抗体的重链可变区的序列。在一些实施方案中,靶多核苷酸包括包含由免疫细胞产生的抗体的轻链可变区的序列。在一些实施方案中,靶多核苷酸包括包含由免疫细胞产生的TCR的α链可变区的序列。在一些实施方案中,靶多核苷酸包括包含由免疫细胞产生的TCR的β链可变区的序列。在一些实施方案中,靶多核苷酸包括包含由免疫细胞产生的TCR的γ链可变区的序列。在一些实施方案中,靶多核苷酸包括包含由免疫细胞产生的TCR的δ链可变区的序列。例如,靶多核苷酸可以包括用于生成逆转录反应或引物延伸反应的产物的多核苷酸模板,并且还包括逆转录反应或引物延伸反应产物本身。例如,靶多核苷酸包括可以经历逆转录反应或引物延伸反应的感兴趣的多核苷酸。
在一些实施方案中,靶多核苷酸包括包含亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的AID的序列。在一些实施方案中,靶多核苷酸包括包含亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸的AMD的序列。例如,靶多核苷酸包括RNA或DNA。例如,靶多核苷酸包括合成的寡核苷酸。例如,靶多核苷酸包括含有AID和/或AMB的寡核苷酸。
靶多核苷酸可以从实质上任何来源获得,并且可以使用本领域已知的方法制备。例如,靶多核苷酸可以直接分离,而不使用本领域已知的方法扩增,该方法包括但不限于从生物体或细胞(例如免疫细胞)提取基因组DNA或mRNA的片段以获得靶多核苷酸。靶多核苷酸还可以涵盖通过逆转录-PCR从RNA(诸如mRNA)生成的cDNA。在一些情况下,靶多核苷酸是RNA分子。在一些情况下,靶多核苷酸是mRNA分子,或从mRNA分子产生的cDNA。在一些情况下,靶多核苷酸是来自单个免疫细胞的mRNA分子或从mRNA分子产生的cDNA分子。在一些情况下,靶多核苷酸是来自单独的免疫细胞的mRNA分子或从mRNA分子产生的cDNA分子。在一些情况下,靶多核苷酸是编码来自单个免疫细胞的抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单独的免疫细胞的重链抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单个免疫细胞的重链抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单独的免疫细胞的轻链抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单个免疫细胞的轻链抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单独的免疫细胞的抗体可变序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单个免疫细胞的可变抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单独的免疫细胞的可变轻链抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单个免疫细胞的可变轻链抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单独的免疫细胞的可变重链抗体序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单个免疫细胞的可变重链抗体序列的mRNA分子。在一些情况下,靶多核苷酸可以是无细胞核酸,例如DNA或RNA。在一些情况下,靶多核苷酸是编码来自单独的免疫细胞的可变α链、β链、γ链和/或δ链TCR序列的mRNA分子。在一些情况下,靶多核苷酸是编码来自单独的免疫细胞的VH和/或VLBCR序列的mRNA分子。
本文描述的方法可以用于由一个或更多个靶多核苷酸生成多核苷酸文库以用于测序。在一些实施方案中,文库可以从靶多核苷酸的两个或更多个区域生成。在一些实施方案中,文库可以从两个或更多个靶多核苷酸生成。在一些实施方案中,靶多核苷酸是基因组核酸或来源于染色体的DNA。在一些实施方案中,靶多核苷酸包括包含变体诸如多态性或突变的序列。在一些实施方案中,靶多核苷酸包括DNA并且不包括RNA。在一些实施方案中,靶多核苷酸包括RNA并且不包括DNA。在一些实施方案中,靶多核苷酸包括DNA和RNA。在一些实施方案中,靶多核苷酸是单链多核苷酸。在一些实施方案中,靶多核苷酸是双链多核苷酸。在一些实施方案中,靶多核苷酸是双链多核苷酸的单链。
靶多核苷酸可以合成或从任何生物样品获得,并且使用本领域已知的方法制备。在一些实施方案中,靶多核苷酸直接分离而无扩增。直接分离方法是本领域已知的。非限制性实例包括从生物样品、生物体或细胞提取基因组DNA或mRNA。在一些实施方案中,一个或更多个靶多核苷酸从生物样品纯化。在一些实施方案中,靶多核苷酸不从包含它的生物样品纯化。在一些实施方案中,靶多核苷酸从生物样品分离。在一些实施方案中,靶多核苷酸不从包含它的生物样品分离。在一些实施方案中,靶多核苷酸可以是无细胞核酸。在一些实施方案中,靶多核苷酸可以是片段化核酸。在一些实施方案中,靶多核苷酸可以是转录的核酸。在一些实施方案中,靶多核苷酸是修饰的多核苷酸。在一些实施方案中,靶多核苷酸是未修饰的多核苷酸。
在一些实施方案中,靶多核苷酸是来自亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸。在一些实施方案中,多个靶多核苷酸包含来自多个亲和-寡核苷酸缀合物或多个四聚体-寡核苷酸缀合物的多个寡核苷酸。在一些实施方案中,多个靶多核苷酸包含来自多个亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个或1000个或更多个寡核苷酸。在一些实施方案中,多个靶多核苷酸包含来自2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个或1000个或更多个亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的多个寡核苷酸。在一些实施方案中,多个靶多核苷酸包含来自2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个或1000个或更多个亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个或1000个或更多个寡核苷酸。
在一些实施方案中,靶多核苷酸包含AID序列。在一些实施方案中,多个靶多核苷酸包含2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个或1000个或更多个AID序列。在一些实施方案中,靶多核苷酸包含AMB序列。在一些实施方案中,多个靶多核苷酸包含至少10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、25,000个、30,000个、35,000个、40,000个、45,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1x106个、2x106个、3x106个、4x106个、5x106个、6x106个、7x106个、8x106个、9x106个、1x107个、2x107个、3x107个、4x107个、5x107个、6x107个、7x107个、8x107个、9x107个、1x108个、2x108个、3x108个、4x108个、5x108个、6x108个、7x108个、8x108个、9x108个、1x109个、2x109个、3x109个、4x109个、5x109个、6x109个、7x109个、8x109个、9x109个、1x1010个、2x1010个、3x1010个、4x1010个、5x1010个、6x1010个、7x1010个、8x1010个、9x1010个、1x1011个、2x1011个、3x1011个、4x1011个、5x1011个、6x1011个、7x1011个、8x1011个、9x1011个、1x1012个、2x1012个、3x1012个、4x1012个、5x1012个、6x1012个、7x1012个、8x1012个或9x1012个或更多个AMB序列。
在一些实施方案中,靶多核苷酸是来自单个细胞的多核苷酸。在一些实施方案中,靶多核苷酸来自单独的细胞。在一些实施方案中,靶多核苷酸是来自含有多个细胞的样品的多核苷酸。
在一些实施方案中,靶多核苷酸编码生物标志物序列。在一些实施方案中,靶多核苷酸编码两个或更多个生物标志物序列。在一些实施方案中,多个靶多核苷酸编码生物标志物序列。在一些实施方案中,多个靶多核苷酸编码两个或更多个生物标志物序列。在一些实施方案中,多个靶多核苷酸编码3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个或100个或更多个生物标志物序列。
在一些实施方案中,多个靶多核苷酸包含一组寡核苷酸序列。在一些实施方案中,多个靶多核苷酸包含一组免疫球蛋白序列。例如,一组免疫球蛋白序列可以是VH和/或VL序列。在一些实施方案中,多个靶多核苷酸包含一组TCR序列。在一些实施方案中,一组免疫球蛋白或TCR序列含有1个、2个、3个、4个、5个、6个、7个、8个、9个或10个免疫球蛋白序列或TCR序列。在一些实施方案中,多个靶多核苷酸包含一组BCR序列。例如,一组BCR序列可以是VH和/或VL序列。在一些实施方案中,一组免疫球蛋白、BCR或TCR序列含有至少约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、25,000个、30,000个、35,000个、40,000个、45,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1x106个、2x106个、3x106个、4x106个、5x106个、6x106个、7x106个、8x106个、9x106个、1x107个、2x107个、3x107个、4x107个、5x107个、6x107个、7x107个、8x107个、9x107个、1x108个、2x108个、3x108个、4x108个、5x108个、6x108个、7x108个、8x108个、9x108个、1x109个、2x109个、3x109个、4x109个、5x109个、6x109个、7x109个、8x109个、9x109个、1x1010个、2x1010个、3x1010个、4x1010个、5x1010个、6x1010个、7x1010个、8x1010个、9x1010个、1x1011个、2x1011个、3x1011个、4x1011个、5x1011个、6x1011个、7x1011个、8x1011个、9x1011个、1x1012个、2x1012个、3x1012个、4x1012个、5x1012个、6x1012个、7x1012个、8x1012个或9x1012个免疫球蛋白、BCR或TCR序列。在一些实施方案中,一组免疫球蛋白、BCR或TCR序列含有至多约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、25,000个、30,000个、35,000个、40,000个、45,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1x106个、2x106个、3x106个、4x106个、5x106个、6x106个、7x106个、8x106个、9x106个、1x107个、2x107个、3x107个、4x107个、5x107个、6x107个、7x107个、8x107个、9x107个、1x108个、2x108个、3x108个、4x108个、5x108个、6x108个、7x108个、8x108个、9x108个、1x109个、2x109个、3x109个、4x109个、5x109个、6x109个、7x109个、8x109个、9x109个、1x1010个、2x1010个、3x1010个、4x1010个、5x1010个、6x1010个、7x1010个、8x1010个、9x1010个、1x1011个、2x1011个、3x1011个、4x1011个、5x1011个、6x1011个、7x1011个、8x1011个、9x1011个、1x1012个、2x1012个、3x1012个、4x1012个、5x1012个、6x1012个、7x1012个、8x1012个或9x1012个免疫球蛋白、BCR或TCR序列。在一些实施方案中,一组免疫球蛋白、BCR或TCR序列含有约10-20个、10-30个、10-40个、10-30个、10-40个、10-50个、10-60个、10-70个、10-80个、10-90个、10-100个、50-60个、50-70个、50-80个、50-90个、50-100个、100-200个、100-300个、100-400个、100-300个、100-400个、100-500个、100-600个、100-700个、100-800个、100-900个、100-1000个、500-600个、500-700个、500-800个、500-900个、500-1000个、1000-2000个、1000-3000个、1000-4000个、1000-3000个、1000-4000个、1000-5000个、1000-6000个、1000-7000个、1000-8000个、1000-9000个、1000-10000个、5000-6000个、5000-7000个、5000-8000个、5000-9000个、5000-10000个、1-1x105个、1-2x105个、1-3x105个、1-4x105个、1-5x105个、1-6x105个、1-7x105个、1-8x105个、9x105个、1-1x106个、1-2x106个、1-3x106个、1-4x106个、1-5x106个、1-6x106个、1-7x106个、1-8x106个、9x106个、1x107个、1-2x107个、1-3x107个、1-4x107个、1-5x107个、1-6x107个、1-7x107个、1-8x107个、1-9x107个、1-1x108个、1-2x108个、1-3x108个、1-4x108个、1-5x108个、1-6x108个、1-7x108个、1-8x108个、1-9x108个、1-1x109个、1-2x109个、1-3x109个、1-4x109个、1-5x109个、1-6x109个、1-7x109个、1-8x109个、1-9x109个、1-1x1010个、1-2x1010个、1-3x1010个、1-4x1010个、1-5x1010个、1-6x1010个、1-7x1010个、1-8x1010个、1-9x1010个、1-1x1011个、1-2x1011个、1-3x1011个、1-4x1011个、1-5x1011个、1-6x1011个、1-7x1011个、1-8x1011个、1-9x1011个、1-1x1012个、1-2x1012个、1-3x1012个、1-4x1012个、1-5x1012个、1-6x1012个、1-7x1012个、1-8x1012个或1-9x1012个免疫球蛋白、BCR或TCR序列。
在一些实施方案中,靶多核苷酸的长度为约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个或20,000个碱基或碱基对。在一些实施方案中,靶多核苷酸的长度为至少约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个或20,000个碱基或碱基对。在一些实施方案中,靶多核苷酸的长度为至多约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个或20,000个碱基或碱基对。在一些实施方案中,靶多核苷酸的长度为约10-20个、10-30个、10-40个、10-30个、10-40个、10-50个、10-60个、10-70个、10-80个、10-90个、10-100个、50-60个、50-70个、50-80个、50-90个、50-100个、100-200个、100-300个、100-400个、100-300个、100-400个、100-500个、100-600个、100-700个、100-800个、100-900个、100-1000个、500-600个、500-700个、500-800个、500-900个、500-1000个、1000-2000个、1000-3000个、1000-4000个、1000-3000个、1000-4000个、1000-5000个、1000-6000个、1000-7000个、1000-8000个、1000-9000个、1000-10000个、5000-6000个、5000-7000个、5000-8000个、5000-9000个或5000-10000个碱基或碱基对。在一些实施方案中,靶多核苷酸或其片段的平均长度可以是小于约100个、200个、300个、400个、500个或800个碱基对,或小于约5个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、110个、120个、130个、140个、150个、160个、170个、180个、190个或200个核苷酸,或小于约1、2、5、10、20、30、40、50、60、70、80、90、100千碱基。在一些实施方案中,来自相对较短的模板(诸如含有靶多核苷酸的样品)的靶序列为约40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个或100个碱基。在某些实施方案中,使用含有与疾病或状况相关的序列或免疫球蛋白或TCR序列的数据库将测序数据与已知序列或预期序列比对。
在一些实施方案中,方法还包括确定第一细胞多核苷酸、第二细胞多核苷酸或两者的种系序列,其中第一细胞多核苷酸包含IgH或VH序列,并且其中第二细胞多核苷酸包含IgL或VL序列或其任何组合。在一些实施方案中,方法还包括确定IgL、IgH、VH、VL序列或其任何组合与种系的相应序列相比的变化。在一些实施方案中,方法还包括确定以下中的至少一项:独特IgH序列的总数;独特IgL序列的总数;独特的IgH和IgL序列的总数;独特的配对IgL和IgH序列的总数;IgH序列或IgL序列的频率;或IgH序列和IgL序列的组合相对于一个或更多个其他序列的频率。
在一些实施方案中,方法还包括确定第一细胞多核苷酸、第二细胞多核苷酸或两者的种系序列,其中第一细胞多核苷酸包含TCRα或Vα序列,并且其中第二细胞多核苷酸包含TCRβ或Vβ序列或其任何组合。在一些实施方案中,方法还包括确定TCRα、TCRβ、Vα、Vβ序列或其任何组合与种系的相应序列相比的变化。
在一些实施方案中,方法还包括确定以下中的至少一项:独特TCRα序列的总数;独特TCRβ序列的总数;独特的TCRα和TCRβ序列的总数;独特的配对TCRβ和TCRα序列的总数;TCRα序列或TCRβ序列的频率;或TCRα序列和TCRβ序列的组合相对于一个或更多个其他序列的频率。在一些实施方案中,方法还包括确定第一细胞多核苷酸、第二细胞多核苷酸或两者的种系序列,其中第一细胞多核苷酸包含TCRγ或Vγ序列,并且其中第二细胞多核苷酸包含TCRδ或Vδ序列或其任何组合。在一些实施方案中,方法还包括确定TCRγ、TCRδ、Vγ、Vδ序列或其任何组合与种系的相应序列相比的变化。在一些实施方案中,方法还包括确定以下中的至少一项:独特TCRγ序列的总数;独特TCRδ序列的总数;独特的TCRγ和TCRδ序列的总数;独特的配对TCRδ和TCRγ序列的总数;TCRγ序列或TCRδ序列的频率;或TCRγ序列和TCRδ序列的组合相对于一个或更多个其他序列的频率。在一些实施方案中,方法还包括确定以下中的至少一项:来自第一基因的序列的总数;来自第二基因的序列的总数;来自第一基因的独特序列的总数;来自第二基因的独特序列的总数;或来自第一基因的序列或来自第二基因的序列的频率。
在一些实施方案中,方法还包括基于单独配对的IgL和IgH序列、或TCRα和TCRβ序列、或TCRγ和TCRδ序列中的一对或更多对的总量以及相对于种系的变化来选择抗体或TCR。在一些实施方案中,方法还包括基于一个或更多个IgL或IgH序列、TCRα和TCRβ序列、或TCRγ和TCRδ序列以及相对于种系的变化来选择抗体或TCR。在一些实施方案中,方法还包括基于序列模式、变化分析、动力学或频率中的一个或更多个来选择抗体或TCR。在一些实施方案中,方法还包括基于频率选择抗体或TCR。
抗体、BCR和TCR的克隆和表达
如本文使用的“抗体表达文库”或“BCR表达文库”或“TCR表达文库”或“表达文库”可以指的是在核酸或蛋白质水平上的分子的集合(即,两个或更多个分子)。因此,该术语可以指的是编码多种抗体、BCR或TCR分子的表达载体的集合(即,在核酸水平上),或者可以指的是已经在适当的表达系统中表达后的抗体、BCR或TCR分子的集合(即,在蛋白质水平上)。可选择地,表达载体/表达文库可以被包含在可以表达它们的合适的宿主细胞内。在本发明的表达文库中编码或表达的抗体分子可以是任何适当的形式,例如,可以是完整的抗体、BCR或TCR分子,或者可以是抗体、BCR片段或TCR片段,例如,单链抗体(例如,scFv抗体)、Fv抗体、Fab’抗体、(Fab’)2片段、双抗体等。如“编码(“encoding”和“coding for)”特定酶的核酸序列或特定酶的DNA编码序列或“编码”特定酶的核苷酸序列中的术语“编码”,以及其他同义术语,指的是当置于适当的调节序列的控制下时转录并翻译为酶的DNA序列。“启动子序列”是能够结合细胞中的RNA聚合酶并启动下游(3'方向)编码序列的转录的DNA调节区。启动子是DNA序列的一部分。该序列区域在其3’末端具有起始密码子。启动子序列包含最小数目的碱基,以及启动以高于背景的可检测水平转录所必需的元件。然而,在RNA聚合酶与该序列结合并且转录在起始密码子处(具有启动子的3’末端)启动之后,转录以3’方向向下游进行。在启动子序列内将发现转录起始位点(通过用核酸酶S1映射方便地确定)以及负责RNA聚合酶的结合的蛋白结合结构域(共有序列)。
由本发明的抗体、BCR或TCR表达文库鉴定、衍生、选择或可获得的抗体、BCR或TCR分子形成本发明的又另外的方面。同样,这些抗体、BCR或TCR分子可以是蛋白质或编码抗体、BCR或TCR分子的核酸,核酸继而可以被掺入适当的表达载体中和/或被包含在合适的宿主细胞内。
cDNA集合体可以同与抗体或BCR基因的重链的恒定区杂交的多核苷酸以及与抗体、BCR或TCR基因的VH或Vα或Vγ链区域的5’末端杂交的多核苷酸一起经历PCR反应。cDNA集合体可以同与抗体、BCR或TCR基因的重链或α链或γ链的恒定区杂交的多核苷酸以及与包含抗体、BCR或TCR序列的条形码化多核苷酸的VH或Vα或Vγ链区域的5’末端5’的区域杂交的多核苷酸一起经历PCR反应。还可以设置PCR反应用于扩增例如κ和λ类别的VL或Vβ或Vδ链集合体。cDNA集合体可以同与抗体基因的轻链的恒定区杂交的多核苷酸以及与抗体、BCR或TCR基因的VL或Vβ或Vγ链区域的5’末端杂交的多核苷酸一起经历PCR反应。cDNA集合体可以同与抗体基因的轻链的恒定区杂交的多核苷酸以及与包含抗体、BCR或TCR序列的条形码化多核苷酸的VL或Vβ或Vγ链区域的5’末端5’的区域杂交的多核苷酸一起经历PCR反应。这样的寡核苷酸或引物可以基于已知且可公开获得的免疫球蛋白、BCR或TCR基因序列数据库信息来设计。
在一些实施方案中,VH和VL或Vα和Vβ或Vγ和Vδ序列可以从使用对重链或轻链基因,并且特别地对VH和VL或Vα和Vβ或Vγ和Vδ多核苷酸的末端区域之一或两者均无特异性的一个或更多个引物通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库方便地获得。在一些实施方案中,VH和VL序列可以从使用对容器条形码化多核苷酸的区域特异的引物通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库方便地获得。在一些实施方案中,VH和VL序列可以从使用C-基因家族特异性引物或C-基因特异性引物通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库方便地获得。在一些实施方案中,VH和VL序列可以从使用具有对容器条形码化多核苷酸的区域特异的第一引物和作为C-基因家族特异性引物或C-基因特异性引物的第二引物或多个第二引物的引物组通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库方便地获得。在一些实施方案中,VH和VL或Vα和Vβ或Vγ和Vδ序列可以从使用具有对容器条形码化多核苷酸的区域特异的第一引物和对通用序列特异的第二引物的引物组通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库方便地获得。
在一些实施方案中,一旦逆转录,产生的cDNA序列可以使用对免疫球蛋白基因或BCR基因,并且特别地对VH和VL或Vα和Vβ或Vγ和Vδ多核苷酸的末端区域之一或两者均特异的一个或更多个引物通过PCR来扩增。在一些实施方案中,VH和VL序列可以从使用V-基因家族特异性引物或V-基因特异性引物通过PCR扩增产生的VH和VL或Vα和Vβ或Vγ和Vδ序列的文库来获得(Nicholls等人,J.Immunol.Meth.,1993,165:81;W093/12227),或基于可获得的序列信息根据领域已知的标准方法来设计。(VH和VL或Vα和Vβ或Vγ和Vδ序列可以被连接,通常用介于中间的间隔区序列(例如,编码符合读框的柔性肽间隔区),形成编码单链抗体的盒)。对于表达免疫球蛋白的单个细胞,V区域序列可以方便地被克隆为cDNA或PCR扩增产物。任选地,在本文描述的方法中,并且特别地在提及的某些步骤之后(例如,在单细胞PCR后;在哺乳动物或其他细胞表面展示后,在FACS筛选后,等等),对VH和VL或Vα和Vβ或Vγ和Vδ区域测序。除其他原因外,测序可以用于验证多样性水平为可接受的水平。测序可以包括高通量测序、深度测序(其中从多个单独的样品对相同的基因测序,以鉴定序列中的差异)或两者的组合。
在一些实施方案中,不必要使用本文描述的方法在物理上连接天然的VH和VL或Vα和Vβ或Vγ和Vδ组合。在一些实施方案中,cDNA、条形码化多核苷酸或PCR扩增的条形码化cDNA未物理连接。在一些实施方案中,cDNA、条形码化多核苷酸或PCR扩增的条形码化cDNA未在相同的反应或容器中物理连接。
在一些实施方案中,除了cDNA引物之外,还使用针对VH或Vα或Vγ基因的5’末端的一个引物或多个引物和针对VL或Vβ或Vδ基因的5’末端的另一个引物或多个引物,将天然的VH和VL或Vα和Vβ或Vγ和Vδ组合物理连接。这些引物还含有额外序列的互补尾,以允许VH和VL或Vα和Vβ或Vγ和Vδ基因的自组装。在PCR扩增和连接后,得到混合产物,换句话说,混合可变区的机会最小,因为扩增和连接反应在每个细胞内进行。混合的风险还可以通过利用大体积试剂诸如地高辛标记的核苷酸来降低,以进一步确保V区域cDNA对不离开细胞区室并混合,而是停留在细胞内以用于PCR扩增和连接。扩增的序列通过互补末端序列的杂交来连接。在连接后,序列可以从细胞回收,以用于在本文描述的进一步方法步骤中使用。例如,如果需要的话,回收的DNA可以使用末端引物来PCR扩增,并且被克隆入载体中,该载体可以是如下文详述的质粒、噬菌体、粘粒、噬菌粒、病毒载体或其组合。适宜的限制酶位点可以被掺入杂交的序列中以促进克隆。这些载体还可以保存为连接的可变区的文库用于以后使用。
为了提供另外的VH和VL或Vα和Vβ或Vγ和Vδ组合,可以选择表达系统。例如,噬菌体表达系统允许重链序列和轻链序列的随机重组。其他合适的表达系统是本领域技术人员已知的。
应注意,在VH和VL或Vα和Vβ或Vγ和Vδ序列来源于非人类的情况下,在一些实施方案中,可以优选将这些序列与完全人类Fc嵌合。如本文使用的,“嵌合”指的是这样的免疫球蛋白、BCR或TCR:其中重链和轻链可变区或Vα和Vβ或Vγ和Vδ区不是人类起源的,并且其中重链和轻链的恒定区或Vα和Vβ或Vγ和Vδ链是人类起源的。这通过将可变结构域扩增并克隆到人类Fc中来实现。人类Fc可以是载体的一部分,或在单独的分子中,并且还可以使用Fc的文库。在优选的实施方案中,嵌合分子在哺乳动物细胞诸如CHO细胞中生长,用FACS筛选两次,以针对表达感兴趣的抗体的细胞来富集细胞群体。嵌合抗体、BCR或TCR通过测序然后功能性表征或直接功能性表征或动力学来表征。生长、筛选和表征详细描述如下。
重要的是要注意,上文描述的PCR反应是针对克隆IgG形式的抗体来描述的。这些是优选的,因为它们通常与更成熟的免疫应答相关,并且通常比IgM抗体呈现出更高的亲和力,从而使它们更理想地用于某些治疗应用和诊断应用。然而,明显地,可以设计多核苷酸,如果需要或适当的话,其将允许克隆一种或更多种其他形式的免疫球蛋白分子,例如IgM、IgA、IgE和IgD。
在已经鉴定了抗体、BCR或TCR,并且适当的细胞群体在适当的时间已经分离并任选地如上文描述的富集之后,抗体、BCR或TCR表达文库不需要立刻生成,这使得包含在细胞内的遗传物质可以保持完整,从而使得文库能够在以后的日期制备。因此,例如细胞、细胞裂解物或核酸,例如由其衍生的RNA或DNA可以通过适当的方法,例如,通过冷冻,来储存直到以后的日期,并且表达文库在需要时在以后的日期生成。
一旦生成了表达载体的文库,则编码的抗体分子可以在适当的表达系统中表达,并且使用本领域熟知和记载的适当技术来筛选。因此,上文定义的本发明的方法可以包括在适当的表达系统中表达表达载体的文库,并且针对具有期望性质的抗体筛选表达文库的另外的步骤。
如本文指示的,通过本公开内容的方法制备的、包括编码抗体、BCR或TCR序列的多核苷酸的多核苷酸可以包括但不限于,单独编码抗体、BCR或TCR片段的氨基酸序列的多核苷酸,整个抗体、BCR或TCR或其部分的非编码序列,抗体、BCR或TCR、片段或部分的编码序列,以及另外的序列,诸如至少一个信号前导或融合肽的编码序列,其具有或不具有上述的另外的编码序列,诸如至少一个内含子,以及另外的非编码序列,包括但不限于非编码5’和3’序列,诸如在转录、mRNA加工(包括剪接)和聚腺苷酸化信号(例如——核糖体结合和mRNA的稳定性)中起作用的转录的非翻译序列;编码另外的氨基酸的另外的编码序列,诸如提供另外的功能性的序列。因此,编码抗体的序列可以与标志物序列融合,诸如编码促进纯化包含抗体或TCR片段或部分的融合抗体或TCR的肽的序列。
然后初级PCR产物可以与新的多核苷酸组任选地经历次级PCR反应,该新的多核苷酸组与抗体、BCR或TCR可变结构域VH、VLκ和VLλ或Vα和Vβ或Vγ和Vδ的5’末端和3’端杂交(视情况取决于与新的多核苷酸组一起使用的初级PCR反应是否被设计为扩增重链或轻链抗体基因或Vα或VβTCR基因或Vγ或VδTCR基因的部分)。这些多核苷酸有利地包含对限定的一组限制酶特异的DNA序列(即,限制酶位点)以用于后续克隆。选择的限制酶必须被选择以便不在人类抗体、BCR或TCR V-基因区段内切割。这样的多核苷酸可以基于已知且可公开获得的免疫球蛋白或TCR基因序列和限制酶数据库信息来设计。然而,被包括的优选的限制酶位点为NcoI、Hind III、MluI和NotI。这样的次级PCR反应的产物是多种V-重、V-轻κ和V-轻λ抗体片段/结构域的组库。因此,这种类型的次级PCR反应通常在以下情况时进行:感兴趣的表达文库形式为scFv或Fv形式,其中仅存在抗体或TCR的VH和VL或Vα和Vβ或Vγ和Vδ结构域。
PCR产物还可以同与条形码化多核苷酸的5’末端和3’端杂交的新的引物组一起经历PCR反应。这些多核苷酸可以有利地包含对限定的一组限制酶特异的DNA序列(即,限制酶位点)以用于后续克隆。选择的限制酶必须被选择以便不在人类抗体或TCR V-基因区段内切割。这样的多核苷酸可以基于已知且可公开获得的免疫球蛋白、BCR或TCR基因序列和限制酶数据库信息来设计。然而,被包括的优选的限制酶位点为NcoI、Hind III、MluI和NotI。这样的次级PCR反应的产物是各种VH、VLκ和VLλ抗体片段/结构域或Vα和Vβ或Vγ和VδTCR片段/结构域的组库。
重链或轻链或Vα或Vβ链或Vγ或Vδ链Fv或Fab片段或者单链抗体、BCR或TCR也可以在该系统内使用。重链或轻链或Vα或Vβ链或Vγ或Vδ链可以被诱变,然后将互补链添加至溶液。然后允许两条链组合并形成功能性抗体片段。随机非特异性轻链或重链或Vα或Vβ链或Vγ或Vδ链序列的添加允许产生组合系统以生成多样成员的文库。
如本文定义的这样的克隆片段组库的文库形成了本发明的另外的方面:该克隆片段包含来源于免疫攻击的宿主的B淋巴细胞或T淋巴细胞的抗体、BCR或TCR基因的可变重链或Vα链或Vγ链区域或其片段,和/或可变轻链或Vβ链或Vδ链区域或其片段。包含克隆的可变区的这些文库可以任选地插入表达载体中以形成表达文库。
在一些实施方案中,可以设置PCR反应以便保持分离的免疫细胞群体中含有的各种抗体、BCR或TCR链的全部或部分恒定区。这在以下情况时是理想的:表达文库形式为Fab形式,其中重链或α链或γ链组分包含VH或Vα或Vγ和CH或Cα或Cγ结构域,并且轻链或Vβ链或Vδ链组分包含VL或Vβ或Vδ链和CL或Cβ或Cδ结构域。同样,包含抗体、BCR或TCR链的全部或部分恒定区的这样的克隆片段的文库形成了本发明的另外的方面。
这些核酸可以方便地包含除了本发明的多核苷酸之外的序列。例如,包含一个或更多个内切核酸酶限制位点的多克隆位点可以被插入核酸中,以帮助分离多核苷酸。同样,可翻译的序列可以被插入以帮助分离本发明的翻译的多核苷酸。例如,六聚组氨酸标志物序列提供了纯化本发明的蛋白质的方便的方式。本发明的核酸,除了编码序列之外,任选地是用于克隆和/或表达本发明的多核苷酸的载体、衔接子或连接体。
另外的序列可以添加至这样的克隆和/或表达序列,以优化它们在克隆和/或表达中的功能,以帮助多核苷酸的分离,或改善多核苷酸向细胞内的引入。克隆载体、表达载体、衔接子和连接体的使用是本领域熟知的。(参见,例如,Ausubel,同上;或Sambrook,同上)。
本文公开的文库可以用于多种应用。如本文使用的,文库包含多个分子。在一些实施方案中,文库包含多个多核苷酸。在一些实施方案中,文库包含多个引物。在一些实施方案中,文库包含来自一个或更多个多核苷酸、扩增子或扩增子集的多个序列读段。文库可以被储存并多次使用以生成用于分析的样品。一些应用包括,例如,对多态性进行基因分型,研究RNA加工,和选择克隆代表来根据本文提供的方法进行测序。可以生成包含多个多核苷酸的文库,诸如用于测序或扩增的引物或文库,其中多个多核苷酸包含至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、30,000个、40,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1,000,000个、50,000,000个、100,000,000个或更多个分子条形码或容器条形码。在一些实施方案中,多核苷酸的文库包含多个至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、30,000个、40,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1,000,000个、50,000,000个、100,000,000个或更多个独特的多核苷酸,其中每个独特的多核苷酸包含一个或更多个分子条形码和容器条形码。
条形码
分子条形码诸如抗原分子条形码包含对于单分子独特的信息,该单分子诸如亲和-寡核苷酸复合物或四聚体-寡核苷酸复合物的单个寡核苷酸或来自单个细胞或来自单个容器的多核苷酸分子。与来自不同的单个细胞或存在于不同的单个容器中的多核苷酸相比,容器条形码包含对于来自单个细胞或存在于单个容器中的多核苷酸独特的信息。在一些实施方案中,独特的信息包含独特的核苷酸序列。例如,分子条形码或容器条形码的序列可以通过确定包含分子条形码或容器条形码的的独特或随机核苷酸序列的身份和顺序来确定。在一些实施方案中,独特的信息不能用于识别靶多核苷酸的序列。例如,分子条形码可以被附接至一个靶多核苷酸,但该分子条形码不能用于确定其所附接的靶多核苷酸。在一些实施方案中,独特的信息不是与靶多核苷酸的序列的身份相关的已知序列。例如,容器条形码可以被附接至一个或更多个靶多核苷酸,但该容器条形码不能用于确定其附接的是一个或更多个靶多核苷酸中的哪一个。在一些实施方案中,独特的信息包含核苷酸的随机序列。在一些实施方案中,独特的信息包含多核苷酸上的核苷酸的一个或更多个独特序列。在一些实施方案中,独特的信息包含简并核苷酸序列或简并条形码。简并条形码可以包含可变核苷酸碱基组成或序列。例如,简并条形码可以是随机序列。在一些实施方案中,分子条形码或容器条形码的互补序列也是分子条形码或容器条形码序列。
条形码可以包含任何长度的核苷酸。例如,本文描述的任何条形码可以具有从2个至36个核苷酸、4个至36个核苷酸、或从6个至30个核苷酸、或从8个至20个核苷酸、2个至20个核苷酸、4个至20个核苷酸、或从6个至20个核苷酸范围内的长度。在某些方面中,组内条形码的解链温度彼此相差在10℃以内、彼此在5℃以内或彼此在2℃以内。在某些方面中,组内条形码的解链温度彼此相差不在10℃以内、彼此不在5℃以内或彼此不在2℃以内。在一些方面中,条形码是最小的交叉杂交组的成员。例如,这样的组中的每个成员的核苷酸序列可以不同于该组中每个其他成员的核苷酸序列,其差异足以使得在严格的杂交条件下成员不能与任何其他成员的互补物形成稳定的双链体。在一些实施方案中,最小的交叉杂交组的每个成员的核苷酸序列与每个其他成员的核苷酸序列有至少两个核苷酸不同。条形码技术在Winzeler等人.(1999)Science 285:901;Brenner(2000)Genome Biol.1:1Kumar等人.(2001)Nature Rev.2:302;Giaever等人.(2004)Proc.Natl.Acad.Sci.USA 101:793;Eason等人.(2004)Proc.Natl.Acad.Sci.USA 101:11046;和Brenner(2004)Genome Biol.5:240中描述。
例如,条形码可以包含至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个、100个、200个、500个或1000个核苷酸。例如,条形码可以包含至多约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个、100个、200个、500个或1000个核苷酸。在一些实施方案中,条形码具有特定的核苷酸长度。例如,条形码的长度可以是约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个、100个、200个、500个或1000个核苷酸。
在一些实施方案中,多个条形码中的每个条形码具有至少约2个核苷酸。例如,多个条形码中的每个条形码的长度可以是至少约2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个、100个、200个、500个或1000个核苷酸。在一些实施方案中,多个条形码中的每个条形码具有至多约1000个核苷酸。例如,多个条形码中的每个条形码的长度可以是至多约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、60个、70个、80个、90个、100个、200个、500个或1000个核苷酸。
分子条形码的数目可以超过将在多个容器中标记的分子的总数目。容器条形码的数目可以超过将在多个容器中标记的分子的总数目。例如,分子条形码或容器条形码的数目可以比将在多个容器中标记的分子的总数目大至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍或100倍。
不同分子条形码的数目可以超过将在多个容器中标记的分子的总数目。在一些实施方案中,不同分子条形码的数目比将在多个容器中标记的分子的总数目大至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍或100倍大。
单个容器中不同分子条形码的数目可以超过将在单个容器中标记的不同分子的数目。在一些实施方案中,单个容器中不同分子条形码的数目比将在单个容器中标记的不同分子的数目大至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍或100倍。
不同容器条形码的数目可以小于将在多个容器中标记的分子的总数目。在一些实施方案中,不同容器条形码的数目比将在多个容器中标记的分子的总数目小至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍或100倍。
来自单个容器中的容器条形码化多核苷酸分子的扩增产物分子的数目可以超过将在单个容器中标记的不同分子的数目。在一些实施方案中,来自单个容器中的容器条形码化多核苷酸分子的扩增产物分子的数目比将在单个容器中标记的不同分子的数目大至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍或100倍。
单个容器中容器条形码化多核苷酸分子的数目可以小于将在单个容器中标记的不同分子的数目。在一些实施方案中,单个容器中容器条形码化多核苷酸分子的数目小于将在单个容器中标记的不同分子的数目的至少约1倍、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍或100倍。
单个容器中容器条形码化多核苷酸分子的数目可以是一个分子。单个容器中未扩增的容器条形码化多核苷酸分子的数目可以是一个分子。
在一些实施方案中,至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%的不同分子条形码具有相同的浓度。在一些实施方案中,至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%的不同容器条形码具有相同的浓度。
在一些实施方案中,至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%的不同分子条形码具有不同的浓度。在一些实施方案中,至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%的不同容器条形码具有不同的浓度。
分子条形码或容器条形码的群体中的分子条形码或容器条形码可以具有至少10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多个不同的序列。例如,群体中的分子条形码或容器条形码可以具有至少2,000个、3,000个、4,000个、5,000个、6,000个、7,000个、8,000个、9,000个、10,000个、15,000个、20,000个、25,000个、30,000个、35,000个、40,000个、45,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1,000,000个或更多个不同的序列。因此,多个分子条形码或容器条形码可以用于从一个或更多个多核苷酸诸如靶多核苷酸生成至少10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多个不同的序列。例如,多个分子条形码或容器条形码可以用于从一个或更多个多核苷酸诸如靶多核苷酸生成至少2,000个、3,000个、4,000个、5,000个、6,000个、7,000个、8,000个、9,000个、10,000个、15,000个、20,000个、25,000个、30,000个、35,000个、40,000个、45,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1x106个、2x106个、3x106个、4x106个、5x106个、6x106个、7x106个、8x106个、9x106个、1x107个、2x107个、3x107个、4x107个、5x107个、6x107个、7x107个、8x107个、9x107个、1x108个、2x108个、3x108个、4x108个、5x108个、6x108个、7x108个、8x108个、9x108个、1x109个、2x109个、3x109个、4x109个、5x109个、6x109个、7x109个、8x109个、9x109个、1x1010个、2x1010个、3x1010个、4x1010个、5x1010个、6x1010个、7x1010个、8x1010个、9x1010个、1x1011个、2x1011个、3x1011个、4x1011个、5x1011个、6x1011个、7x1011个、8x1011个、9x1011个、1x1012个、2x1012个、3x1012个、4x1012个、5x1012个、6x1012个、7x1012个、8x1012个、9x1012个或更多个不同的序列。例如,多个分子条形码或容器条形码可以用于从至少约10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、15,000个、20,000个、25,000个、30,000个、35,000个、40,000个、45,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1x106个、2x106个、3x106个、4x106个、5x106个、6x106个、7x106个、8x106个、9x106个、1x107个、2x107个、3x107个、4x107个、5x107个、6x107个、7x107个、8x107个、9x107个、1x108个、2x108个、3x108个、4x108个、5x108个、6x108个、7x108个、8x108个、9x108个、1x109个、2x109个、3x109个、4x109个、5x109个、6x109个、7x109个、8x109个、9x109个、1x1010个、2x1010个、3x1010个、4x1010个、5x1010个、6x1010个、7x1010个、8x1010个、9x1010个、1x1011个、2x1011个、3x1011个、4x1011个、5x1011个、6x1011个、7x1011个、8x1011个、9x1011个、1x1012个、2x1012个、3x1012个、4x1012个、5x1012个、6x1012个、7x1012个、8x1012个、9x1012个或更多个靶多核苷酸生成至少约10个、15个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、15,000个、20,000个、25,000个、30,000个、35,000个、40,000个、45,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1x106个、2x106个、3x106个、4x106个、5x106个、6x106个、7x106个、8x106个、9x106个、1x107个、2x107个、3x107个、4x107个、5x107个、6x107个、7x107个、8x107个、9x107个、1x108个、2x108个、3x108个、4x108个、5x108个、6x108个、7x108个、8x108个、9x108个、1x109个、2x109个、3x109个、4x109个、5x109个、6x109个、7x109个、8x109个、9x109个、1x1010个、2x1010个、3x1010个、4x1010个、5x1010个、6x1010个、7x1010个、8x1010个、9x1010个、1x1011个、2x1011个、3x1011个、4x1011个、5x1011个、6x1011个、7x1011个、8x1011个、9x1011个、1x1012个、2x1012个、3x1012个、4x1012个、5x1012个、6x1012个、7x1012个、8x1012个、9x1012个或更多个不同的序列。
在一些实施方案中,一个或更多个分子条形码用于将序列分组或分箱。在一些实施方案中,一个或更多个分子条形码用于将序列分组或分箱,其中每个箱元中的序列含有相同的分子条形码。在一些实施方案中,一个或更多个分子条形码或容器条形码用于将序列分组或分箱,其中每个箱元中的序列包含扩增子集。在一些实施方案中,一个或更多个分子条形码用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中生成多个序列的多核苷酸来源于扩增反应中相同的多核苷酸分子。
在一些实施方案中,一个或更多个容器条形码用于将序列分组或分箱。在一些实施方案中,一个或更多个容器条形码用于将序列分组或分箱,其中每个箱元中的序列含有相同的容器条形码。在一些实施方案中,一个或更多个容器条形码用于将序列分组或分箱,其中每个箱元中的序列包含一个或更多个扩增子集。在一些实施方案中,一个或更多个容器条形码用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中生成多个序列的多核苷酸来源于来自单个容器或单个细胞的多核苷酸。
在一些实施方案中,一个或更多个AID序列用于将序列分组或分箱。在一些实施方案中,一个或更多个AID序列用于将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列。在一些实施方案中,一个或更多个AID序列用于将序列分组或分箱,其中每个箱元中的序列包含一个或更多个扩增子集。在一些实施方案中,一个或更多个AID序列用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中生成多个序列的多核苷酸来源于来自单个容器或单个细胞的多核苷酸。
在一些实施方案中,一个或更多个AMB序列用于将序列分组或分箱。在一些实施方案中,一个或更多个AMB序列用于将序列分组或分箱,其中每个箱元中的序列含有相同的AMB序列。在一些实施方案中,一个或更多个AMB序列用于将序列分组或分箱,其中每个箱元中的序列包含一个或更多个扩增子集。在一些实施方案中,一个或更多个AMB序列用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中生成多个序列的多核苷酸来源于来自单个容器或单个细胞的多核苷酸。
在一些实施方案中,一个或更多个AID序列和AMB序列用于将序列分组或分箱。在一些实施方案中,一个或更多个AID序列和AMB序列用于将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列。在一些实施方案中,一个或更多个AID序列和AMB序列用于将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列和不同的AMB序列。在一些实施方案中,一个或更多个AID序列和AMB序列用于将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列和相同的AMB序列。在一些实施方案中,一个或更多个AID序列和AMB序列用于将序列分组或分箱,其中每个箱元中的序列包含一个或更多个扩增子集。在一些实施方案中,一个或更多个AID序列和AMB序列用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中生成多个序列的多核苷酸来源于扩增反应中相同的多核苷酸以及来源于相同的单个细胞或容器。
在一些实施方案中,一个或更多个容器条形码和AMB序列用于将序列分组或分箱。在一些实施方案中,一个或更多个容器条形码和AMB序列用于将序列分组或分箱,其中每个箱元中的序列含有相同的容器条形码。在一些实施方案中,一个或更多个容器条形码和AMB序列用于将序列分组或分箱,其中每个箱元中的序列含有相同的容器条形码和不同的AMB序列。在一些实施方案中,一个或更多个容器条形码和AMB序列用于将序列分组或分箱,其中每个箱元中的序列含有相同的容器条形码和相同的AMB序列。在一些实施方案中,一个或更多个容器条形码和AMB序列用于将序列分组或分箱,其中每个箱元中的序列包含一个或更多个扩增子集。在一些实施方案中,一个或更多个容器条形码和AMB序列用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中生成多个序列的多核苷酸来源于扩增反应中相同的多核苷酸以及来源于相同的单个细胞或容器。
在一些实施方案中,一个或更多个AID序列和容器条形码用于将序列分组或分箱。在一些实施方案中,一个或更多个AID序列和容器条形码用于将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列。在一些实施方案中,一个或更多个AID序列和容器条形码用于将序列分组或分箱,其中每个箱元中的序列含有相同的AID序列和相同的容器条形码。在一些实施方案中,一个或更多个AID序列和容器条形码用于将序列分组或分箱,其中每个箱元中的序列包含一个或更多个扩增子集。在一些实施方案中,一个或更多个AID序列和容器条形码用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中生成多个序列的多核苷酸来源于扩增反应中相同的多核苷酸以及来源于相同的单个细胞或容器。
在一些实施方案中,一个或更多个分子条形码和容器条形码用于将序列分组或分箱。在一些实施方案中,一个或更多个分子条形码和容器条形码用于将序列分组或分箱,其中每个箱元中的序列含有相同的分子条形码和相同的容器条形码。在一些实施方案中,一个或更多个分子条形码和容器条形码用于将序列分组或分箱,其中每个箱元中的序列包含一个或更多个扩增子集。在一些实施方案中,一个或更多个分子条形码和容器条形码用于将序列分组或分箱,其中每个箱元中的序列包含多个序列,其中生成多个序列的多核苷酸来源于扩增反应中相同的多核苷酸以及来源于相同的单个细胞或容器。在一些实施方案中,一个或更多个分子条形码和容器条形码不用于比对序列。
在一些实施方案中,一个或更多个分子条形码不用于比对序列。在一些实施方案中,一个或更多个分子条形码用于比对序列。在一些实施方案中,一个或更多个分子条形码用于将序列分组或分箱,并且靶特异性区域用于比对序列。在一些实施方案中,一个或更多个容器条形码不用于比对序列。在一些实施方案中,一个或更多个容器条形码用于比对序列。在一些实施方案中,一个或更多个容器条形码用于将序列分组或分箱,并且靶特异性区域用于比对序列。在一些实施方案中,一个或更多个分子条形码和容器条形码用于比对序列。在一些实施方案中,一个或更多个分子条形码和容器条形码用于将序列分组或分箱,并且靶特异性区域用于比对序列。
在一些实施方案中,比对的序列含有相同的AID。在一些实施方案中,比对的序列含有相同的AMB。在一些实施方案中,比对的序列含有相同的AID和AMB。在一些实施方案中,比对的序列含有相同的AID和容器条形码。在一些实施方案中,比对的序列含有相同的AMB和容器条形码。在一些实施方案中,比对的序列含有相同的分子条形码。在一些实施方案中,比对的序列含有相同的容器条形码。在一些实施方案中,比对的序列含有相同的分子条形码和容器条形码。在一些实施方案中,一个或更多个分子条形码或容器条形码用于比对序列,其中比对的序列包含来自扩增子集的两个或更多个序列。在一些实施方案中,一个或更多个分子条形码或容器条形码用于比对序列,其中比对的序列包含多个序列,其中从中生成多个序列的多核苷酸来源于扩增反应中相同的多核苷酸分子。在一些实施方案中,一个或更多个分子条形码或容器条形码用于比对序列,其中比对的序列包含多个序列,其中从中生成多个序列的多核苷酸来源于单个细胞或单个容器。
液滴生成
将多个细胞的样品分成小反应体积,连同来自或来源于来自多个细胞的单独的细胞的多核苷酸的分子和容器条形码化,可以使得能够对序列诸如生物标志物序列的组库进行高通量测序。
将多个细胞的样品分成小反应体积,连同来自或来源于来自多个细胞的单独的细胞的多核苷酸的分子和容器条形码化,可以使得能够对序列(诸如代表一定百分比的生物体的转录物组的序列)的组库进行高通量测序。例如,序列组库可以包含多个序列,所述序列代表生物体的转录物组的至少约0.00001%、0.00005%、0.00010%、0.00050%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%、10%、15%、20%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%。
将免疫细胞的样品分成小反应体积,连同来自或来源于来自多个免疫细胞的单独的免疫细胞的多核苷酸的分子和容器条形码化,可以使得能够对重链和轻链序列的组库进行高通量测序。这些方法还可以允许在基于条形码化序列的测序后将重链和轻链配对。如本文描述的将样品分成小反应体积还可以使得能够使用减少的试剂量,从而降低分析的材料成本。
在一些情况下,逆转录反应和/或扩增反应(例如,PCR)在液滴中进行,诸如在液滴数字PCR中。在某些方面中,本发明提供了流体区室以包含全部或部分目标材料。在一些实施方案中,区室为液滴。当在整个本说明书中提及“液滴”时,除非另有指示,否则该术语与流体区室和流体分区可互换使用。除非另有指示,为了方便起见使用“液滴”,并且可以使用任何流体分区或区室。本文使用的液滴可以包括乳液组合物(或两种或更多种不混溶流体的混合物),诸如美国专利第7,622,280号中描述的。液滴可以通过WO/2010/036352中描述的装置生成。如本文使用的,术语乳液可以指的是不混溶液体(诸如油和水)的混合物。油相和/或油包水乳液允许水性液滴内反应混合物的区室化。乳液可以包含连续油相中的水性液滴。本文提供的乳液可以是水包油乳液,其中液滴是连续水相中的油液滴。本文提供的液滴被设计为防止区室间的混合,每个区室保护其内容物不蒸发并且不与其他区室的内容物聚结。
本文描述的混合物或乳液可以是稳定或不稳定的。乳液可以是相对稳定的,并且具有最小的聚结。当小的液滴合并以形成逐渐更大的液滴时发生聚结。在一些情况下,由液滴生成器生成的少于0.00001%、0.00005%、0.00010%、0.00050%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、2.5%、3%、3.5%、4%、4.5%、5%、6%、7%、8%、9%或10%的液滴与其他液滴聚结。乳液还可以具有有限的絮凝,这是分散相从悬浮液中以薄片形式生成的过程。
可以生成具有约、小于约、或大于约、或至少约0.001微米、0.01微米、0.05微米、0.1微米、1微米、5微米、10微米、20微米、30微米、40微米、50微米、60微米、70微米、80微米、100微米、120微米、130微米、140微米、150微米、160微米、180微米、200微米、300微米、400微米或500微米的平均直径的液滴。液滴可以具有约0.001微米至约500微米、约0.01微米至约500微米、约0.1微米至约500微米、约0.1微米至约100微米、约0.01微米至约100微米、或约1微米至约100微米的平均直径。使用微通道交叉流聚焦(microchannel cross-flowfocusing)或物理搅拌产生乳液液滴的微流体方法已知用于产生单分散或多分散乳液。液滴可以是单分散液滴。可以生成液滴以使得液滴的尺寸变化不超过液滴的平均尺寸的加或减5%。在一些情况下,生成液滴以使得液滴的尺寸变化不超过液滴的平均尺寸的加或减2%。液滴生成器可以从单个样品生成液滴群体,其中没有一个液滴的尺寸变化超过液滴总群体的平均尺寸的加或减约0.1%、0.5%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%或10%。
更高的机械稳定性对微流体操作和更高剪切的流体处理(例如,在微流体毛细管中或通过流体路径中的90度转角,诸如阀门时)可以是有用的。热处理前和热处理后的液滴或胶囊对于标准移液管操作和离心可以是机械稳定的。
液滴可以通过使油相流动穿过水性样品来形成。水相可以包含用于进行扩增反应的缓冲溶液和试剂,包括细胞、核苷酸、核苷酸类似物、分子条形码化多核苷酸、容器条形码化多核苷酸引物、模板核酸和酶,诸如DNA聚合酶、RNA聚合酶和/或逆转录酶。
水相可以包含具有或不具有固体表面诸如珠的用于进行扩增反应的缓冲溶液和试剂。缓冲溶液可以包含约、大于约或小于约1mM、5mM、10mM、15mM、20mM、30mM、50mM、100mM或200mM Tris。在一些情况下,氯化钾的浓度可以是约、大于约或小于约10mM、20mM、30mM、40mM、50mM、60mM、80mM、100mM或200mM。缓冲溶液可以包含约15mM Tris和50mM KCl。核苷酸可以包括脱氧核糖核苷酸三磷酸分子,包括dATP、dCTP、dGTP和dTTP,每种的浓度为约、大于约或小于约50μm、100μm、200μm、300μm、400μm、500μm、600μm或700μm。在一些情况下,dUTP在水相中被添加至约、大于约或小于约50μm、100μm、200μm、300μm、400μm、500μm、600μm或700μm、800μm、900μm或1000μm的浓度。在一些情况下,氯化镁(MgCl2)或乙酸镁以约、大于约或小于约1.0mM、2.0mM、3.0mM、4.0mM或5.0mM的浓度被添加至水相。MgCl2的浓度可以是约3.2mM。在一些情况下,使用乙酸镁或镁。在一些情况下,使用硫酸镁。
可以使用诸如BSA或来自牛皮肤的明胶的非特异性封闭剂,其中明胶或BSA以约0.1%w/v-0.9%w/v的浓度范围存在。其他可能的封闭剂可以包括β乳球蛋白、酪蛋白、奶粉或其他常见的封闭剂。在一些情况下,BSA和明胶的优选的浓度为约0.1%w/v。
水相中用于扩增的引物可以具有约、大于约或小于约0.05μm、0.1μm、0.2μm、0.3μm、0.4μm、0.5μm、0.6μm、0.7μm、0.8μm、0.9μm、1.0μm、1.2μm、1.5μm、1.7μm或2.0μm的浓度。水相中的引物浓度可以是约0.05μm至约2μm、约0.1μm至约1.0μm、约0.2μm至约1.0μm、约0.3μm至约1.0μm、约0.4μm至约1.0μm或约0.5μm至约1.0μm。引物的浓度可以是约0.5μm。PCR中对于靶核酸浓度适用的范围包括但不限于约1pg和约500ng之间。
在一些情况下,水相还可以包含添加剂,包括但不限于非特异性背景/封闭核酸(例如,鲑精DNA)、生物防腐剂(例如,叠氮化钠)、PCR增强剂(例如,甜菜碱、海藻糖等)和抑制剂(例如,RNA酶抑制剂)。其他添加剂可以包括,例如,二甲亚砜(DMSO)、甘油、甜菜碱(单)水合物(N,N,N-三甲基甘氨酸=[羧甲基]三甲基铵)、海藻糖、7-脱氮-2’-脱氧鸟苷三磷酸(dC7GTP或7-脱氮-2’-dGTP)、BSA(牛血清蛋白)、甲酰胺(formamide/methanamide)、四甲基氯化铵(TMAC)、其他四烷基铵衍生物(例如,四乙基氯化铵(TEA-Cl)和四丙基氯化铵(TPrA-Cl)、非离子型去污剂(例如,Triton X-100、吐温20、Nonidet P-40(NP-40))或PREXCEL-Q。在一些情况下,水相可以包含0种、1种、2种、3种、4种、5种、6种、7种、8种、9种或10种不同的添加剂。在其他情况下,水相可以包含至少0种、1种、2种、3种、4种、5种、6种、7种、8种、9种或10种不同的添加剂。
在一些情况下,非离子型环氧乙烷/环氧丙烷嵌段共聚物可以以约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%或1.0%的浓度添加至水相。常见的生物表面活性剂包括非离子型表面活性剂,诸如Pluronic F-68、Tetronics和Zonyl FSN。Pluronic F-68可以以约0.5%w/v的浓度存在。
在一些情况下,硫酸镁可以以相似浓度取代氯化镁。来自多个供应商的广泛的常见、商业PCR缓冲液可以取代缓冲溶液。
可以配制乳液以产生高度单分散的具有液体样界面膜的液滴,该液滴可以通过加热转化为具有固体样界面膜的微胶囊;这样的微胶囊可以表现为能够保持它们的内容物经过反应过程诸如PCR扩增的生物反应器。转化为微胶囊形式一旦加热即可以发生。例如,这样的转化可以在大于约50℃、60℃、70℃、80℃、90℃或95℃的温度发生。在一些情况下,使用热循环仪发生该加热。在加热过程期间,流体或矿物油覆盖物可以用于防止蒸发。在加热之前可以去除或可以不去除过量的连续相油。生物相容的胶囊可以在广泛的热和机械处理中抵抗聚结和/或絮凝。在转化后,胶囊可以储存在约、大于约或小于约3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、15℃、20℃、25℃、30℃、35℃或40℃。这些胶囊可以在生物医学应用中有用,诸如稳定、数字化封装大分子,特别地含有核酸或蛋白质或两者的混合物的水性生物流体;药物和疫苗递送;生物分子文库;临床成像应用和其他。
微胶囊可以含有一种或更多种多核苷酸,并且可以抵抗聚结,特别地在高温。因此,PCR扩增反应可以以非常高的密度(例如,每单位体积的反应数目)发生。在一些情况下,每ml可以发生大于100,000个、500,000个、1,000,000个、1,500,000个、2,000,000个、2,500,000个、5,000,000个或10,000,000个单独的反应。在一些情况下,反应在单个孔,例如微量滴定板的孔中发生,在反应体积之间没有相互混合。微胶囊还可以含有使逆转录、引物延伸和/或PCR反应能够发生所必需的其他组分,例如,引物、探针、dNTP、DNA或RNA聚合酶等。这些胶囊在广泛的热和机械处理中呈现出对聚结和絮凝的抗性。
在一些情况下,扩增步骤通过进行数字PCR,诸如基于微流体的数字PCR或液滴数字PCR来进行。
液滴可以使用微流体系统或装置生成。如本文使用的,“微-”前缀(例如,“微通道”或“微流体”)通常指的是具有小于约1mm,且在一些情况下小于约100微米(micron/micrometer)的宽度或直径的元件或物品。在一些情况下,元件或物品包括流体可以流动穿过的通道。此外,如本文使用的“微流体”指的是包含至少一个微型通道的装置、设备或系统。
微流体系统和装置已经在多个环境中描述,典型地是在微型化实验室(例如,临床)分析的环境中。还已经描述了其他用途。例如,国际专利申请公布号WO 01/89788;WO2006/040551;WO 2006/040554;WO 2004/002627;WO 2008/063227;WO 2004/091763;WO2005/021151;WO 2006/096571;WO 2007/089541;WO 2007/081385和WO 2008/063227。
液滴通常在第二载体流体中包含一定量的第一样品流体。本领域已知的用于形成液滴的任何技术可以与本发明的方法一起使用。示例性的方法包括使含有目标材料(例如,免疫细胞)的样品流体流流动,使得其与流动载体流体的两股相对流相交。载体流体与样品流体不混溶。样品流体与流动载体流体的两股相对流的相交导致将样品流体分隔为含有目标材料的单独的样品液滴。
载体流体可以是与样品流体不混溶的任何流体。示例性的载体流体是油。在某些实施方案中,载体流体包含表面活性剂。
相同的方法可以应用于创建含有其他试剂的单独的液滴,该其他试剂诸如用于扩增反应诸如聚合酶链式反应(PCR)、或非基于PCR的扩增反应诸如多链置换扩增、或本领域普通技术人员已知的其他方法的试剂。用于进行基于PCR的扩增反应的合适的试剂是本领域普通技术人员已知的,并且包括但不限于DNA聚合酶、正向和反向引物、脱氧核苷酸三磷酸(dNTP)和一种或更多种缓冲液。
在某些实施方案中,流体区室通过提供包含目标材料(例如,免疫细胞和/或固体支持体,诸如珠)的第一流体分区(例如,液滴)和第二流体(例如,作为流体流或在液滴内)来形成。合并第一流体和第二流体以形成液滴。合并可以通过将电场施加于两种流体来完成。在某些实施方案中,第二流体含有用于进行扩增反应,诸如聚合酶链式反应或扩增反应的试剂。
在某些方面中,本发明提供了制备独特条形码化重链和轻链抗体序列和/或α和β链TCR序列和/或γ和δ链TCR序列的文库的方法,该方法包括获得多个核酸构建体,其中每个构建体包含独特的N-聚体和功能性N-聚体。功能性N-聚体可以是随机N-聚体、PCR引物、通用引物、抗体、粘性末端或任何其他序列。方法可以包括制备M组N个数目的流体区室,每个区室含有独特构建体的一个或更多个拷贝。方法可以通过向组中的每个区室添加另外的构建体来创建具有更高复杂性的条形码文库,并且对每个组重复此步骤,以产生N×M个区室,每个区室含有独特的一对构建体。可以杂交或连接该对,以产生新的构建体。在条形码文库中的每个构建体中,每种独特的N-聚体可以适用于通过测序、探针杂交、其他方法或方法的组合来鉴定。
液滴文库
通常,液滴文库由在单个集合中合并在一起的许多文库元件组成。文库的复杂性可以从单个文库元件到1x1015个文库元件或更多不等。每个文库元件是固定浓度的一种或更多种给定的组分。元件可以是但不限于细胞、珠、氨基酸、蛋白质、多肽、核酸、多核苷酸或小分子化学化合物。元件可以含有标识符,诸如分子条形码或容器条形码或两者。
细胞文库元件可以包括但不限于杂交瘤、B细胞、T细胞、原代细胞、培养的细胞系、癌细胞、干细胞或任何其他细胞类型。细胞文库元件通过将一千至上万个数目的细胞封装在单独的液滴中来制备。封装的细胞的数目通常由来自细胞的数量密度和液滴体积的泊松统计给出。然而,在一些情况下,该数目偏离泊松统计,如Edd等人,Lab Chip,8(8):1262-1264,2008中描述的。细胞的离散性质允许用多个细胞变体诸如各自产生一种抗体或TCR的免疫细胞大量制备文库,所有都存在于单一的起始介质中,并且然后该介质分解为含有至多一个细胞的单独的液滴胶囊。然后裂解单独的液滴胶囊中的细胞,来自裂解的细胞的重链和轻链多核苷酸和/或α和β链多核苷酸和/或γ和δ链多核苷酸用分子条形码和容器条形码进行条形码化,并扩增,并且然后组合或合并以形成由重链和轻链和/或α和β链和/或γ和δ链文库元件组成的文库。
基于珠的文库元件含有一个或更多个珠,并且还可以含有其他试剂,诸如抗体、酶或其他蛋白质。在所有文库元件含有不同类型的珠但含有相同的周围介质的情况下,文库元件都可以从单一起始流体制备,或具有多个起始流体。在从变体的集合大量制备细胞文库的情况下,文库元件将从多个起始流体制备。当以多个细胞开始时,期望每个液滴恰好具有一个细胞,只有少量液滴含有超过一个细胞。在一些情况下,可以达到相对于泊松统计的变化以提供增强的液滴装载,使得存在更多个液滴,每个液滴恰好具有一个细胞,并且空的液滴或含有超过一个细胞的液滴的例外极少。
在一些实施方案中,当从多个容器条形码化多核苷酸开始时,期望每个液滴恰好具有一个容器条形码化多核苷酸,只有少量液滴含有超过一个容器条形码化多核苷酸。在一些情况下,可以达到相对于泊松统计的变化以提供增强的液滴装载,使得存在更多个液滴,每个液滴恰好具有一个容器条形码化多核苷酸,并且空的液滴或含有超过一个容器条形码化多核苷酸的液滴的例外极少。
液滴文库的实例是具有不同内容物的液滴的集合,该内容物的范围从珠、细胞、小分子、DNA、引物、抗体和条形码化多核苷酸。液滴的直径大小范围从约0.5微米至500微米,其相当于约1皮升至1纳升。然而,液滴可以小到5微米并且大到500微米。优选地,液滴的直径为小于100微米,约1微米至约100微米。最优选的直径大小为约20微米至40微米(10皮升至100皮升)。对液滴文库检查的优选的性质包括渗透压平衡、均匀大小和大小范围。
由本发明提供的液滴文库中包含的液滴优选地是大小均匀的。也就是说,当与相同文库中其他液滴的直径相比时,文库中任何液滴的直径的变化将小于5%、4%、3%、2%、1%或0.5%。文库中液滴的均匀大小对维持液滴的稳定性和完整性可能非常关键,并且可能还对文库中的液滴随后用于本文描述的各种生物和化学测定的用途非常重要。
本发明提供了包含不混溶流体内的多个水性液滴的液滴文库,其中每个液滴优选地是基本上大小均匀的,并且包含不同的文库元件。本发明提供了用于形成液滴文库的方法,该方法包括提供包含不同文库元件的单个水性流体,将每个文库元件封装到不混溶流体中的水性液滴内。
在某些实施方案中,将不同类型的元件(例如,细胞或珠)合并在相同介质中包含的单个来源中。在初始合并后,然后将元件封装在液滴中,以生成液滴的文库,其中具有不同类型的珠或细胞的每个液滴是不同的文库元件。稀释初始溶液使得能够进行封装过程。在一些实施方案中,形成的液滴将含有单个元件或将不含有任何物质,即为空的。在其他实施方案中,形成的液滴将含有文库元件的多个拷贝。封装的元件通常是某种类型的变体。在一个实例中,元件是血液样品的免疫细胞,并且封装每个免疫细胞以对免疫细胞中的核苷酸的抗体序列进行扩增和条形码化。
例如,在一种类型的乳液文库中,存在具有不同颗粒的文库元件,即不同介质中的细胞或条形码化多核苷酸,并且在合并之前封装。在一个实例中,在不同介质中包含指定数目的文库元件,即n个数目的不同细胞或条形码化多核苷酸。每个文库元件被单独地乳化并合并,在该点处,n个数目的合并的不同文库元件中的每一个组合并合并成单个集合体。产生的集合体含有多个油包水乳液液滴,每个含有不同类型的颗粒。
在一些实施方案中,形成的液滴将含有单个文库元件或将不含有任何物质,即为空的。在其他实施方案中,形成的液滴将含有文库元件的多个拷贝。珠的内容物遵循泊松分布,其中存在离散概率分布,其表达了如果若干事件以已知的平均率发生,且独立于自上一次事件以来的时间,则这些事件在固定的时间段内发生的概率。用于创建文库的油和表面活性剂防止了液滴之间文库内容物的交换。
引物
通常,在扩增反应中可以使用一对或更多对引物;引物对的一个引物可以是正向引物并且引物对的一个引物可以是反向引物。
在一些情况下,在扩增反应中可以使用第一对引物;第一对的一个引物可以是与第一靶多核苷酸分子的第一序列互补的正向引物,并且第一对的一个引物可以是可以与第一靶多核苷酸分子的第二序列互补的反向引物,且第一靶基因座可以位于第一序列和第二序列之间。在一些实施方案中,第一靶基因座包含VH或Vα或Vγ序列。在一些实施方案中,第一靶基因座包含AID序列和/或AMB序列。
在一些情况下,在扩增反应中可以使用第二对引物;第二对的一个引物可以是与第二靶多核苷酸分子的第一序列互补的正向引物,并且第二对的一个引物可以是与第二靶多核苷酸分子的第二序列互补的反向引物,且第二靶基因座可以位于第一序列和第二序列之间。在一些实施方案中,第二靶基因座包含VL或Vβ或Vδ序列。
在一些情况下,在扩增反应中可以使用第三对引物;第三对的一个引物可以是与第三靶多核苷酸分子的第一序列互补的正向引物,并且第三对的一个引物可以是与第三靶多核苷酸分子的第二序列互补的反向引物,且第三靶基因座可以位于第一序列和第二序列之间。在一些实施方案中,第三靶基因座包含条形码,诸如分子条形码或容器条形码。
正向引物和反向引物的长度可以取决于靶多核苷酸的序列和靶基因座。例如,可以优化正向引物和反向引物的长度和/或TM。在一些情况下,引物的长度可以是约、大于约或小于约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个或60个核苷酸。在一些情况下,引物的长度为约15个至约20个、约15个至约25个、约15个至约30个、约15个至约40个、约15个至约45个、约15个至约50个、约15个至约55个、约15个至约60个、约20个至约25个、约20个至约30个、约20个至约35个、约20个至约40个、约20个至约45个、约20个至约50个、约20个至约55个或约20个至约60个核苷酸。
在结合模板多核苷酸之前,引物可以是单链DNA。在一些情况下,引物最初包含双链序列。引物的适当长度可以取决于引物的预期用途,但可以在从约6个至约50个核苷酸,或从约15个至约35个核苷酸的范围内。短引物分子通常可能需要较低的温度以与模板形成足够稳定的杂交复合物。在一些实施方案中,引物不必反映模板核酸的准确序列,但可以足够互补以与模板杂交。在一些情况下,在与模板多核苷酸结合前,引物可以是部分双链的。具有双链序列的引物可以具有约、大于约或小于约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个碱基的发夹环。引物的双链部分可以是约、大于约、小于约、或至少约3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个碱基对。用于扩增给定靶序列的合适的引物的设计是本领域熟知的。
引物可以掺入另外的特征,该特征允许检测或固定引物,但不改变引物的基本性质(例如,作为DNA合成的起始点起作用)。例如,引物可以在5’末端含有另外的核酸序列,该序列不与靶核酸杂交,但其促进克隆或进一步扩增,或对扩增产物的测序。例如,另外的序列可以包含引物结合位点,诸如通用引物结合位点。与模板足够互补以杂交的引物区域在本文中可以被称为杂交区域。
在另一种情况下,本文描述的方法和组合物中采用的引物可以包含一个或更多个通用核苷。通用核苷的非限制性实例是5-硝基吲哚和肌苷,如美国申请公布第2009/0325169号和第2010/0167353号中描述的。
可以根据已知参数设计引物,用于避免二级结构和自身杂交。不同的引物对可以在另一个引物对的约相同的温度退火和解链,例如,在另一个引物对的1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃或10℃内。在一些情况下,最初使用大于1种、2种、3种、4种、5种、6种、7种、8种、9种、10种、15种、20种、25种、30种、35种、40种、45种、50种、100种、200种、500种、1000种、5000种、10,000种或更多种引物。这样的引物可以与本文描述的靶多核苷酸杂交。
引物可以通过多种方法制备,包括但不限于使用本领域熟知的方法克隆适当的序列和直接化学合成(Narang等人,Methods Enzymol.68:90(1979);Brown等人,MethodsEnzymol.68:109(1979))。引物还可以从商业来源获得。引物可以具有相同的解链温度。引物可以具有不相同的解链温度。引物的长度可以在5’末端或3’末端延伸或缩短,以产生具有期望的解链温度的引物。引物对的一个引物可以比另一个引物长。引物对中引物的3’退火长度可以不同。同样,可以设计每个引物对的退火位置,使得引物对的序列和长度产生期望的解链温度。用于确定小于25个碱基对的引物的解链温度的等式是Wallace规则(TM=2(A+T)+4(G+C))。计算机程序还可以用于设计引物。每个引物的TM(解链温度或退火温度)可以使用软件程序来计算。在任何扩增循环,包括但不限于循环1、2、3、4、5、循环6-10、循环10-15、循环15-20、循环20-25、循环25-30、循环30-35或循环35-40后,引物的退火温度可以重新计算并提高。在初始的扩增循环后,引物的5’一半可以从每个感兴趣的基因座掺入产物中;因此可以基于每个引物的5’一半和3’一半两者的序列重新计算TM
引物位点包括引物杂交的模板区域。在一些实施方案中,引物能够作为用于模板指导的核酸合成的起始点起作用。例如,当存在四种不同的核苷酸和聚合试剂或酶诸如DNA或RNA聚合酶或逆转录酶时,引物可以启动模板指导的核酸合成。引物对包含2个引物:具有与模板序列的5’末端杂交的5’上游区的第一引物,以及具有与模板序列的3’末端的互补物杂交的3’下游区的第二引物。引物组包含两个或更多个引物:具有与模板序列或多个模板序列的5’末端杂交的5’上游区的第一引物或第一多个引物,以及具有与模板序列或多个模板序列的3’末端的互补物杂交的3’下游区的第二引物或第二多个引物。在一些实施方案中,引物包含靶特异性序列。在一些实施方案中,引物包含样品条形码序列。在一些实施方案中,引物包含通用引发序列。在一些实施方案中,引物包含PCR引发序列。在一些实施方案中,引物包含用于启动多核苷酸扩增的PCR引发序列。(Dieffenbach,PCR Primer:ALaboratory Manual,第2版(Cold Spring Harbor Press,New York(2003))。通用引物结合位点或序列允许通用引物与多核苷酸和/或扩增子附接。通用引物是本领域熟知的,并且包括但不限于-47F(M13F)、alfaMF、AOX3’、AOX5’、BGHr、CMV-30、CMV-50、CVMf、LACrmt、lambdagt10F、lambda gt10R、lambda gt11F、lambda gt11R、M13rev、M13Forward(-20)、M13Reverse、male、p10SEQPpQE、pA-120、pet4、pGAP Forward、pGLRVpr3、pGLpr2R、pKLAC14、pQEFS、pQERS、pucU1、pucU2、reversA、seqIREStam、seqIRESzpet、seqori、seqPCR、seqpIRES-、seqpIRES+、seqpSecTag、seqpSecTag+、seqretro+PSI、SP6、T3-prom、T7-prom和T7-termInv。如本文使用的,附接可以指的是共价相互作用和非共价相互作用两者或之一。通用引物与通用引物结合位点的附接可以用于多核苷酸和/或扩增子的扩增、检测和/或测序。通用引物结合位点可以包含至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个或1000个核苷酸或碱基对。在另一个实例中,通用引物结合位点包含至少约1500个、2000个、2500个、3000个、3500个、4000个、4500个、5000个、5500个、6000个、6500个、7000个、7500个、8000个、8500个、9000个、9500个或10000个核苷酸或碱基对。在一些实施方案中,通用引物结合位点包含1-10个、10-20个、10-30个或10-100个核苷酸或碱基对。在一些实施方案中,通用引物结合位点包含约1-90个、1-80个、1-70个、1-60个、1-50个、1-40个、1-30个、1-20个、1-10个、2-90个、2-80个、2-70个、2-60个、2-50个、2-40个、2-30个、2-20个、2-10个、1-900个、1-800个、1-700个、1-600个、1-500个、1-400个、1-300个、1-200个、1-100个、2-900个、2-800个、2-700个、2-600个、2-500个、2-400个、2-300个、2-200个、2-100个、5-90个、5-80个、5-70个、5-60个、5-50个、5-40个、5-30个、5-20个、5-10个、10-90个、10-80个、10-70个、10-60个、10-50个、10-40个、10-30个、10-20个、10-10个、5-900个、5-800个、5-700个、5-600个、5-500个、5-400个、5-300个、5-200个、5-100个、10-900个、10-800个、10-700个、10-600个、10-500个、10-400个、10-300个、10-200个、10-100个、25-900个、25-800个、25-700个、25-600个、25-500个、25-400个、25-300个、25-200个、25-100个、100-1000个、100-900个、100-800个、100-700个、100-600个、100-500个、100-400个、100-300个、100-200个、200-1000个、200-900个、200-800个、200-700个、200-600个、200-500个、200-400个、200-300个、300-1000个、300-900个、300-800个、300-700个、300-600个、300-500个、300-400个、400-1000个、400-900个、400-800个、400-700个、400-600个、400-500个、500-1000个、500-900个、500-800个、500-700个、500-600个、600-1000个、600-900个、600-800个、600-700个、700-1000个、700-900个、700-800个、800-1000个、800-900个或900-1000个核苷酸或碱基对。
引物可以具有与其在合成引物延伸产物中的应用相匹配的长度。引物可以是长度为8个至200个核苷酸的多核苷酸。引物的长度可以取决于模板多核苷酸的序列和模板基因座。例如,可以优化引物或引物组的长度和/或解链温度(TM)。在一些情况下,引物的长度可以是约、大于约或小于约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个或60个核苷酸。在一些实施方案中,引物的长度为约8-100个核苷酸,例如10-75个、15-60个、15-40个、18-30个、20-40个、21-50个、22-45个、25-40个、7-9个、12-15个、15-20个、15-25个、15-30个、15-45个、15-50个、15-55个、15-60个、20-25个、20-30个、20-35个、20-45个、20-50个、20-55个或20-60个核苷酸的长度和之间的任何长度。在一些实施方案中,引物的长度为至多约10个、12个、15个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个或100个核苷酸。
通常,在指数扩增反应中可以使用一对或更多对引物;引物对的一个引物可以是正向引物并且引物对的一个引物可以是反向引物。在一些实施方案中,在指数扩增反应中可以使用第一对引物;第一对的一个引物可以是与第一模板多核苷酸分子的第一序列互补的正向引物,并且第一对的一个引物可以是可以与第一模板多核苷酸分子的第二序列互补的反向引物,且第一模板基因座可以位于第一序列和第二序列之间。在一些实施方案中,在扩增反应中可以使用第二对引物;第二对的一个引物可以是与第二靶多核苷酸分子的第一序列互补的正向引物,并且第二对的一个引物可以是与第二靶多核苷酸分子的第二序列互补的反向引物,且第二靶基因座可以位于第一序列和第二序列之间。在一些实施方案中,第二靶基因座包含可变轻链抗体序列。在一些方案中,在扩增反应中可以使用第三对引物;第三对的一个引物可以是与第三模板多核苷酸分子的第一序列互补的正向引物,并且第三对的一个引物可以是与第三模板多核苷酸分子的第二序列互补的反向引物,且第三模板基因座可以位于第一序列和第二序列之间。
一个或更多个引物可以退火至多个模板多核苷酸的至少一部分。一个或更多个引物可以退火至多个模板多核苷酸的3’末端和/或5’末端。一个或更多个引物可以退火至多个模板多核苷酸的内部区域。内部区域可以距多个模板多核苷酸的3’末端或5’末端至少约10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一个或更多个引物可以包含固定的引物组。一个或更多个引物可以包含至少一个或更多个定制引物。一个或更多个引物可以包含至少一个或更多个控制引物(control primer)。一个或更多个引物可以包含至少一个或更多个持家基因引物。一个或更多个引物可以包含通用引物。通用引物可以退火至通用引物结合位点。在一些实施方案中,一个或更多个定制引物退火至SBC、靶特异性区域、其互补物或其任何组合。一个或更多个引物可以包含通用引物。可以设计一个或更多个引物以扩增或进行引物延伸、逆转录、线性延伸、非指数扩增、指数扩增、PCR、或一个或更多个靶多核苷酸或模板多核苷酸的任何其他扩增方法。
靶特异性区域可以包含至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸或碱基对。在另一个实例中,靶特异性区域包含至少约1500个、2000个、2500个、3000个、3500个、4000个、4500个、5000个、5500个、6000个、6500个、7000个、7500个、8000个、8500个、9000个、9500个或10000个核苷酸或碱基对。在一些实施方案中,靶特异性区域包含约5-10个、10-15个、10-20个、10-30个、15-30个、10-75个、15-60个、15-40个、18-30个、20-40个、21-50个、22-45个、25-40个、7-9个、12-15个、15-20个、15-25个、15-30个、15-45个、15-50个、15-55个、15-60个、20-25个、20-30个、20-35个、20-45个、20-50个、20-55个、20-60个、2-900个、2-800个、2-700个、2-600个、2-500个、2-400个、2-300个、2-200个、2-100个、25-900个、25-800个、25-700个、25-600个、25-500个、25-400个、25-300个、25-200个、25-100个、100-1000个、100-900个、100-800个、100-700个、100-600个、100-500个、100-400个、100-300个、100-200个、200-1000个、200-900个、200-800个、200-700个、200-600个、200-500个、200-400个、200-300个、300-1000个、300-900个、300-800个、300-700个、300-600个、300-500个、300-400个、400-1000个、400-900个、400-800个、400-700个、400-600个、400-500个、500-1000个、500-900个、500-800个、500-700个、500-600个、600-1000个、600-900个、600-800个、600-700个、700-1000个、700-900个、700-800个、800-1000个、800-900个或900-1000个核苷酸或碱基对。
可以根据已知参数设计引物,用于避免二级结构和自身杂交。在一些实施方案中,不同的引物对可以在另一个引物对的约相同的温度退火和解链,例如,在另一个引物对的1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃或10℃内。在一些实施方案中,多个引物中的一个或更多个引物可以在与多个引物中的另一个引物约相同的温度退火和解链,例如,在1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃或10℃内。在一些实施方案中,多个引物中的一个或更多个引物可以在与多个引物中的另一个引物不同的温度退火和解链。
用于本文描述的方法的一个或更多个步骤的多个引物可以包括多个引物,其包含约、至多约或至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个、11,000个、12,000个、13,000个、14,000个、15,000个、16,000个、17,000个、18,000个、19,000个、20,000个、30,000个、40,000个、50,000个、60,000个、70,000个、80,000个、90,000个、100,000个、200,000个、300,000个、400,000个、500,000个、600,000个、700,000个、800,000个、900,000个、1,000,000个、50,000,000个、100,000,000个不同的引物。例如,多个引物中的每个引物可以包含不同的靶或模板特异性区域或序列。
逆转录
在一些情况下,靶多核苷酸通过逆转录从RNA制备。在一些情况下,靶多核苷酸通过引物延伸,诸如使用聚合酶从DNA制备。
本文描述的方法可以在偶联的逆转录-PCR(逆转录-PCR)中使用。例如,逆转录和PCR可以在两个不同的步骤中进行。首先,样品mRNA的cDNA拷贝可以使用多核苷酸dT引物、序列特异性引物、通用引物或本文描述的任何引物来合成。
逆转录和PCR可以在单个密闭容器反应中进行。例如,可以使用三种引物,一种用于逆转录,而两种用于PCR。用于逆转录的引物可以与PCR扩增子的位置的3’的mRNA结合。虽然不是必要的,但逆转录引物可以包含RNA残基或修饰的类似物,诸如2’-O-甲基RNA碱基,当其与mRNA杂交时将不形成RNA酶H的底物。
进行逆转录反应的温度取决于使用的逆转录酶。在一些情况下,使用热稳定的逆转录酶,并且逆转录反应在约37℃至约75℃、在约37℃至约50℃、在约37℃至约55℃、在约37℃至约60℃、在约55℃至约75℃、在约55℃至约60℃、在约37℃或在约60℃进行。在一些情况下,使用将3个或更多个非模板末端核苷酸转移到转录产物的末端的逆转录酶。
本文描述的逆转录反应和PCR反应可以在本领域已知的多种形式中进行,诸如在管、微量滴定板、微流体装置或优选地在液滴中进行。
逆转录反应可以在范围从5μL至100μL或10μL至20μL反应体积的体积内进行。在液滴中,反应体积可以在从1pL至100nL或10pL至1nL的范围内。在一些情况下,逆转录反应在具有约或小于1nL体积的液滴中进行。在一些情况下,PCR反应在具有范围从1pL至100nL,优选地10pL至1nL的反应体积的液滴中进行。在一些情况下,PCR反应在具有约或小于1nL体积的液滴中进行。在一些情况下,逆转录反应和PCR反应在具有范围从1pL至100nL或10pL至1nL的反应体积的相同液滴中进行。在一些情况下,逆转录反应和PCR反应在具有约或小于1nL的体积或约或小于1pL的体积的液滴中进行。在一些情况下,逆转录反应和PCR反应在不同的液滴中进行。在一些情况下,逆转录反应和PCR反应在多个液滴中进行,每个液滴具有范围从1pL至100nL或10pL至1nL的反应体积。在一些情况下,逆转录反应和PCR反应在多个液滴中进行,每个液滴具有约或小于1nL的体积。
在一些情况下,第一PCR反应在具有范围从1pL至100nL、优选地10pL至1nL的反应体积的第一液滴中进行,并且第二PCR反应在具有范围从1pL至100nL、优选地10pL至1nL的反应体积的第二液滴中进行。在一些情况下,第一PCR反应在具有约或小于1nL的体积的第一液滴中进行,并且第二PCR反应在具有约或小于1nL的体积的第二液滴中进行。
在一些情况下,第一PCR反应和第二PCR反应在多个液滴中进行,每个液滴具有范围从1pL至100nL或10pL至1nL的反应体积。在一些情况下,第一PCR反应和第二PCR反应在多个液滴中进行,每个液滴具有约或小于1nL的体积。
靶多核苷酸诸如RNA可以使用一种或更多种逆转录引物逆转录为cDNA。一种或更多种逆转录引物可以包含与RNA的区域诸如恒定区(例如,重链或轻链恒定区,或mRNA的聚A尾)互补的区域。在一些实施方案中,逆转录引物可以包括第一逆转录引物和第二逆转录引物,第一逆转录引物具有与第一RNA的恒定区互补的区域,第二逆转录引物具有与第二RNA的恒定区互补的区域。在一些实施方案中,逆转录引物可以包括第一逆转录引物和一个或更多个逆转录引物,第一逆转录引物具有与第一RNA的恒定区互补的区域,该一个或更多个逆转录引物分别具有与一个或更多个RNA的恒定区互补的区域。
在一些实施方案中,逆转录引物不包含条形码。
逆转录引物还可以包含不与RNA的区域互补的区域。在一些实施方案中,不与RNA的区域互补的区域是在与RNA互补的引物区域的5’。在一些实施方案中,不与RNA的区域互补的区域是在与RNA互补的引物区域的3’。在一些实施方案中,不与RNA的区域互补的区域是5’突出端区域。在一些实施方案中,不与RNA的区域互补的区域包含用于扩增和/或测序反应的引发位点。使用本文描述的一种或更多种引物,使用本领域已知的合适的试剂将RNA分子逆转录。
在进行RNA分子的逆转录反应后,产生的cDNA分子可以用分子条形码和容器条形码进行条形码化,并且通过一个或更多个PCR反应,诸如第一PCR反应和/或第二PCR反应来扩增。第一PCR反应和/或第二PCR反应可以利用一对引物或多个引物对。第一PCR反应和/或第二PCR反应可以利用多个正向/反向引物和反向引物。第一PCR反应和/或第二PCR反应可以利用多个正向/反向引物和正向引物。多个正向/反向引物的第一引物和/或第二引物可以是含有与cDNA分子或条形码化cDNA分子互补的区域的正向/反向引物。多个正向/反向引物的第一引物和/或第二引物可以是含有与条形码化cDNA分子互补的区域的正向/反向引物。
在一些实施方案中,多个正向/反向引物包括一个或更多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与cDNA或条形码化cDNA的V区段的一个或更多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与cDNA或条形码化cDNA的V区段的上游或下游区域互补的区域的正向/反向引物,以及包含与cDNA或条形码化cDNA的V区段的一个或更多个其他上游或下游区域互补的区域的一个或更多个其他正向/反向引物。例如,多个正向/反向引物包括包含与cDNA或条形码化cDNA的V区段的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与cDNA或条形码化cDNA的V区段的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与cDNA或条形码化cDNA的V区段的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与cDNA或条形码化cDNA的V区段的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与cDNA或条形码化cDNA的V区段的第三上游或下游区域互补的区域的第三正向/反向引物,等等。多个正向/反向引物中的引物可以用于退火至样品中的细胞,诸如免疫B细胞或T细胞表达的所有V区段的所有可能的上游或下游区域。
在一些实施方案中,多个正向/反向引物包括一个或更多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与cDNA或条形码化cDNA的C区段的一个或更多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与cDNA或条形码化cDNA的C区段的上游或下游区域互补的区域的正向/反向引物,以及包含与cDNA或条形码化cDNA的C区段的一个或更多个其他上游或下游区域互补的区域的一个或更多个其他正向/反向引物。例如,多个正向/反向引物包括包含与cDNA或条形码化cDNA的C区段的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与cDNA或条形码化cDNA的C区段的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与cDNA或条形码化cDNA的C区段的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与cDNA或条形码化cDNA的C区段的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与cDNA或条形码化cDNA的C区段的第三上游或下游区域互补的区域的第三正向/反向引物,等等。多个正向/反向引物中的引物可以用于退火至样品中的细胞,诸如免疫B细胞或T细胞表达的所有C区段的所有可能的上游或下游区域。
在一些实施方案中,多个正向/反向引物包括一个或更多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与条形码化cDNA的分子条形码的一个或更多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与条形码化cDNA的分子条形码的上游或下游区域互补的区域的正向/反向引物,以及包含与条形码化cDNA的分子条形码的一个或更多个其他上游或下游区域互补的区域的一个或更多个其他正向/反向引物。例如,多个正向/反向引物包括包含与条形码化cDNA的分子条形码的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与条形码化cDNA的分子条形码的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与条形码化cDNA的分子条形码的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与条形码化cDNA的分子条形码的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与条形码化cDNA的分子条形码的第三上游或下游区域互补的区域的第三正向/反向引物,等等。多个正向/反向引物可以用于退火至样品中的细胞,诸如免疫B细胞或T细胞表达的所有分子条形码的所有可能的上游或下游区域。
在一些实施方案中,多个正向/反向引物包括一个或更多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与条形码化cDNA的容器条形码的一个或更多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与条形码化cDNA的容器条形码的上游或下游区域互补的区域的正向/反向引物,以及包含与条形码化cDNA的容器条形码的一个或更多个其他上游或下游区域互补的区域的一个或更多个其他正向/反向引物。例如,多个正向/反向引物包括包含与条形码化cDNA的容器条形码的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与条形码化cDNA的容器条形码的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与条形码化cDNA的容器条形码的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与条形码化cDNA的容器条形码的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与条形码化cDNA的容器条形码的第三上游或下游区域互补的区域的第三正向/反向引物,等等。多个正向/反向引物中的引物可以用于退火至样品中的细胞,诸如免疫B细胞或T细胞表达的所有容器条形码的所有可能的上游或下游区域。
多个正向/反向引物中的正向/反向引物还包含不与RNA的区域互补的区域。在一些实施方案中,不与RNA的区域互补的区域是在与RNA互补的正向/反向引物的区域(即,V区段的上游或下游区域)的5’。在一些实施方案中,不与RNA的区域互补的区域是在与RNA互补的正向/反向引物区域的3’。在一些实施方案中,不与RNA的区域互补的区域是5’突出端区域。在一些实施方案中,不与RNA的区域互补的区域包含用于扩增和/或第二测序反应的引发位点。在一些实施方案中,不与RNA的区域互补的区域包含用于扩增和/或第三测序反应的引发位点。在一些实施方案中,不与RNA的区域互补的区域包含用于第二测序反应和第三测序反应的引发位点。在一些实施方案中,用于第二测序反应和第三测序反应的引发位点的序列是相同的。使用如本文描述的一个或更多个正向/反向引物和反向引物,使用本领域已知的合适的试剂扩增cDNA分子。在一些实施方案中,区域与RNA的区域,诸如恒定区或mRNA的聚A尾互补。
在一些实施方案中,多个正向/反向引物包括一个或更多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡合苷酸的容器条形码的一个或更多个上游或下游区域互补的区域。在一些实施方案中,多个正向/反向引物包括一个或更多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡合苷酸的AID的一个或更多个上游或下游区域互补的区域。在一些实施方案中,多个正向/反向引物包括一个或更多个正向/反向引物,其中多个正向/反向引物中的每个正向/反向引物包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡合苷酸的AMB的一个或更多个上游或下游区域互补的区域。例如,多个正向/反向引物包括包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡核苷酸的容器条形码、AID和/或AMB的上游或下游区域互补的区域的正向/反向引物,以及包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡核苷酸的容器条形码、AID和/或AMB的一个或更多个其他上游或下游区域互补的区域的一个或更多个其他正向/反向引物。例如,多个正向/反向引物包括包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡核苷酸的容器条形码、AID和/或AMB的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,以及包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡核苷酸的容器条形码、AID和/或AMB的第二上游或下游区域互补的区域的第二正向/反向引物。例如,多个正向/反向引物包括包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡核苷酸的容器条形码、AID和/或AMB的第一和/或第二上游或下游区域互补的区域的第一和/或第二正向/反向引物,包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡核苷酸的容器条形码、AID和/或AMB的第二上游或下游区域互补的区域的第二正向/反向引物,以及包含与亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的条形码化寡核苷酸的容器条形码、AID和/或AMB的第三上游或下游区域互补的区域的第三正向/反向引物,等等。
扩增
在将容器条形码添加至靶多核苷酸之后,可以扩增靶多核苷酸。例如,在将容器条形码添加至亲和-寡核苷酸缀合物或四聚体-寡核苷酸缀合物的寡核苷酸之后,可以扩增寡核苷酸。例如,在将容器条形码添加至细胞多核苷酸之后,可以扩增容器条形码化细胞多核苷酸。
扩增反应可以包含一种或更多种添加剂。在一些情况下,一种或更多种添加剂是二甲亚砜(DMSO)、甘油、甜菜碱(单)水合物(N,N,N-三甲基甘氨酸=[羧甲基]三甲基铵)、海藻糖、7-脱氮-2’-脱氧鸟苷三磷酸(dC7GTP或7-脱氮-2’-dGTP)、BSA(牛血清蛋白)、甲酰胺(formamide/methanamide)、四甲基氯化铵(TMAC)、其他四烷基铵衍生物(例如,四乙基氯化铵(TEA-Cl)和四丙基氯化铵(TPrA-Cl)、非离子型去污剂(例如,Triton X-100、吐温20、Nonidet P-40(NP-40))或PREXCEL-Q。在一些情况下,扩增反应包含0种、1种、2种、3种、4种、5种、6种、7种、8种、9种或10种不同的添加剂。在其他情况下,扩增反应包含至少0种、1种、2种、3种、4种、5种、6种、7种、8种、9种或10种不同的添加剂。
热循环反应可以对被包含在反应体积(例如,液滴)中的样品进行。液滴可以是多分散的或优选地单分散的,通过搅拌、超声处理或穿过T通道接合点以微流体方式或本领域熟知的其他手段生成。密度可以超过20,000个液滴/40ul(1nL液滴)、200,000个液滴/40ul(100pL液滴)。在热循环期间,液滴可以保持完整。在热循环期间,液滴可以以大于约10,000个液滴/μL、100,000个液滴/μL、200,000个液滴/μL、300,000个液滴/μL、400,000个液滴/μL、500,000个液滴/μL、600,000个液滴/μL、700,000个液滴/μL、800,000个液滴/μL、900,000个液滴/μL或1,000,000个液滴/μL的密度保持完整。在其他情况下,两个或更多个液滴在热循环期间不聚结。在其他情况下,大于100个或大于1,000个液滴在热循环期间不聚结。
可以使用催化引物延伸的任何DNA聚合酶,包括但不限于大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶1的Klenow片段、T7DNA聚合酶、T4DNA聚合酶、Taq聚合酶、Pfu DNA聚合酶、Vent DNA聚合酶、噬菌体29、REDTaqTM、基因组DNA聚合酶或测序酶。在一些情况下,使用热稳定的DNA聚合酶。还可以进行热启动PCR,其中在添加聚合酶之前将反应加热至95℃持续两分钟,或聚合酶可以保持无活性直到循环1中的第一加热步骤。热启动PCR可以用于使非特异性扩增最小化。可以使用任何数目的PCR循环来扩增DNA,例如约、大于约或小于约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个或45个循环。扩增循环的数目可以是约1-45、10-45、20-45、30-45、35-45、10-40、10-30、10-25、10-20、10-15、20-35、25-35、30-35或35-40。
靶核酸的扩增可以通过本领域已知的任何手段进行。靶核酸可以通过聚合酶链式反应(PCR)或等温DNA扩增来扩增。可以使用的PCR技术的实例包括但不限于定量PCR、定量荧光PCR(QF-PCR)、多重荧光PCR(MF-PCR)、实时PCR(逆转录-PCR)、单个细胞PCR、限制性片段长度多态性PCR(PCR-RFLP)、PCR-RFLP/逆转录-PCR-RFLP、热启动PCR、巢式PCR、原位群落PCR、原位滚环扩增(RCA)、数字PCR(dPCR)、液滴数字PCR(ddPCR)、桥式PCR、皮升PCR和乳液PCR。其他合适的扩增方法包括连接酶链式反应(LCR)、转录扩增、分子倒位探针(MIP)PCR、自我维持序列复制、靶多核苷酸序列的选择性扩增、共有序列引发的聚合酶链式反应(CP-PCR)、任意引发的聚合酶链式反应(AP-PCR)、简并多核苷酸引发的PCR(DOP-PCR)和基于核酸的序列扩增(NABSA)。本文可以使用的其他扩增方法包括美国专利第5,242,794号、第5,494,810号、第4,988,617号和第6,582,938号中描述的方法,以及包括Qβ复制酶介导的RNA扩增。扩增可以是等温扩增,例如,等温线性扩增。
在一些实施方案中,扩增不在固体支持体上发生。在一些实施方案中,扩增不在液滴中的固体支持体上发生。在一些实施方案中,当不在液滴中扩增时,扩增在固体支持体上发生。
测序
在进行本文描述的一个或更多个方法或方法步骤后,可以对生成的多核苷酸文库测序。
测序可以通过本领域已知的任何测序方法进行。在一些实施方案中,测序可以以高通量进行。合适的下一代测序技术包括454Life Sciences平台(Roche,Branford,CT)(Margulies等人,Nature,437,376-380(2005));lllumina的基因组分析仪、GoldenGate甲基化测定或Infinium甲基化测定,即,Infinium人类甲基化27K BeadArray或VeraCodeGoldenGate甲基化测定(Illumina,San Diego,CA;Bibkova等人,Genome Res.16,383-393(2006);和美国专利第6,306,597号、第7,598,035号、第7,232,656号),或DNA连接测序,SOLiD系统(Applied Biosystems/Life Technologies;美国专利第6,797,470号、第7,083,917号、第7,166,434号、第7,320,865号、第7,332,285号、第7,364,858号和第7,429,453号);或Helicos True单分子DNA测序技术(Harris等人,Science,320,106-109(2008);和美国专利第7,037,687号、第7,645,596号、第7,169,560号和第7,769,400号)、PacificBiosciences的单分子、实时(SMRTTm)技术和测序(Soni等人,Clin.Chem.53,1996-2001(2007))。这些系统允许对从样品分离的许多多核苷酸进行多重平行测序(Dear,BriefFunct.Genomic Proteomic,1(4),397-416(2003)和McCaughan等人,J.Pathol.,220,297-306(2010))。在一些实施方案中,通过染料修饰的探针的连接测序、焦磷酸测序或单分子测序对多核苷酸测序。确定多核苷酸序列可以通过如下测序方法进行,诸如HelioscopeTM单分子测序、纳米孔DNA测序、Lynx Therapeutics大规模平行签名测序(MPSS)、454焦磷酸测序、单分子实时(RNAP)测序、Illumina(Solexa)测序、SOLiD测序、Ion TorrentTM、离子半导体测序、单分子SMRTTM测序、群落测序、DNA纳米球测序和VisiGen Biotechnologies方法。可选择地,确定多核苷酸的序列可以使用测序平台,包括但不限于基因组分析仪IIx、HiSeq,以及Illumina提供的MiSeq,单分子实时(SMRTTM)技术,诸如Pacific Biosciences(California)提供的PacBio RS系统以及Solexa测序仪、真正单分子测序(tSMSTM)技术,诸如HelicosInc.(Cambridge,MA)提供的HeliScopeTM测序仪。测序可以包括MiSeq测序。测序可以包括HiSeq测序。在一些实施方案中,确定多核苷酸的序列包括配对末端测序、纳米孔测序、高通量测序、鸟枪法测序、染料终止子测序、多引物DNA测序、引物步移、Sanger双脱氧测序、Maxim-Gilbert测序、焦磷酸测序、真正单分子测序或其任何组合。可选择地,多核苷酸的序列可以通过电子显微术或化学敏感的场效应晶体管(chemFET)阵列来确定。
方法还可以包括对文库中的一个或更多个多核苷酸测序。方法还可以包括将文库中的一个或更多个多核苷酸序列、序列读段、扩增子序列或扩增子集序列彼此比对。
比对可以包括比较测试序列诸如序列读段与一个或更多个其他测试序列、参考序列或其组合。在一些实施方案中,比对可以用于从多个序列或比对的序列确定共有序列。在一些实施方案中,比对包括从各自具有相同的分子条形码或容器条形码的多个序列确定共有序列。在一些实施方案中,为了比较目的比对的序列的长度是参考序列的长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。对两个或更多个序列的实际比较可以通过熟知的方法,例如,使用数学算法来完成。这样的数学算法的非限制性实例在Karlin,S.和Altschul,S.,Proc.Natl.Acad.Sci.USA,90-5873-5877(1993)中描述。这样的算法被并入NBLAST和XBLAST程序(版本2.0)中,如Altschul,S.等人,Nucleic Acids Res.,25:3389-3402(1997)中描述的。当利用BLAST和Gapped BLAST程序时,可以使用相应程序(例如,NBLAST)的任何相关参数。例如,用于序列比较的参数可以设置为分数=100,字长=12,或可以变化(例如,W=5或W=20)。其他实例包括Myers和Miller,CABIOS(1989)的算法、ADVANCE、ADAM、BLAT和FASTA。在一些实施方案中,两个氨基酸序列之间的同一性百分比可以使用例如GCG软件包中的GAP程序(Accelrys,Cambridge,UK)来完成。
测序可以包括对多核苷酸的至少约10个、20个、30个、40个、50个、60个、70个、80个、90个、100个或更多个核苷酸或碱基对测序。在一些实施方案中,测序包括对多核苷酸的至少约200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多个核苷酸或碱基对测序。在其他情况下,测序包括对多核苷酸的至少约1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个或更多个核苷酸或碱基对测序。
测序可以包括每次运行至少约200个、300个、400个、500个、600个、700个、800个、900个、1000个或更多个测序读段。如本文使用的,序列读段包括从通过测序技术生成的序列或数据流确定的核苷酸序列。在一些实施方案中,测序包括每次运行对至少约1500个、2000个、3000个、4000个、5000个、6000个、7000个、8000个、9000个、10,000个或更多个测序读段测序。测序可以包括每次运行大于、小于或等于约1,000,000,000个测序读段。测序可以包括每次运行大于、小于或等于约200,000,000个读段。
本文公开的方法和试剂盒可以包含一种或更多种酶。酶的实例包括但不限于连接酶、逆转录酶、聚合酶和限制性核酸酶。
在一些实施方案中,衔接子与多核苷酸的附接包括使用一种或更多种连接酶。连接酶的实例包括但不限于DNA连接酶,诸如DNA连接酶I、DNA连接酶III、DNA连接酶IV和T4DNA连接酶,以及RNA连接酶,诸如T4RNA连接酶I和T4RNA连接酶II。
本文公开的方法和试剂盒还可以包括使用一种或更多种逆转录酶。在一些实施方案中,逆转录酶是HIV-1逆转录酶、M-MLV逆转录酶、AMV逆转录酶和端粒酶逆转录酶。在一些实施方案中,逆转录酶是M-MLV逆转录酶。
在一些实施方案中,本文公开的方法和试剂盒包括使用一种或更多种蛋白酶。
在一些实施方案中,本文公开的方法和试剂盒包括使用一种或更多种聚合酶。聚合酶的实例包括但不限于DNA聚合酶和RNA聚合酶。在一些实施方案中,DNA聚合酶是DNA聚合酶I、DNA聚合酶II、DNA聚合酶III全酶和DNA聚合酶IV。可商购的DNA聚合酶包括但不限于Bst 2.0DNA聚合酶、Bst 2.0WarmStartTM DNA聚合酶、Bst DNA聚合酶、硫化叶菌DNA聚合酶IV、Taq DNA聚合酶、9°NTMm DNA聚合酶、Deep VentRTM(exo-)DNA聚合酶、Deep VentRTM DNA聚合酶、Hemo KlenTaqTM Taq DNA聚合酶、 DNA聚合酶、 DNA聚合酶、Q5TM高保真DNA聚合酶、TherminatorTMγDNA聚合酶、TherminatorTMDNA聚合酶、TherminatorTM II DNA聚合酶、TherminatorTM III DNA聚合酶、 DNA聚合酶、(exo-)DNA聚合酶、Bsu DNA聚合酶、phi29DNA聚合酶、T4DNA聚合酶、T7DNA聚合酶、末端转移酶、 Taq聚合酶、KAPA Taq DNA聚合酶和KAPA Taq热启动DNA聚合酶。
在一些实施方案中,聚合酶是RNA聚合酶,诸如RNA聚合酶I、RNA聚合酶II、RNA聚合酶III、大肠杆菌聚(A)聚合酶、phi6RNA聚合酶(RdRP)、聚(U)聚合酶、SP6RNA聚合酶和T7RNA聚合酶。
另外的试剂
本文公开的方法和试剂盒可以包括使用一种或更多种试剂。试剂的实例包括但不限于PCR试剂、连接试剂、逆转录试剂、酶试剂、杂交试剂、样品制备试剂、亲和捕获试剂、固体支持体诸如珠,以及用于核酸纯化和/或分离的试剂。
在其他实施方案中,本文公开的方法、试剂盒和组合物可以包含支持体。在一些实施方案中,本文公开的方法、试剂盒和组合物不包含支持体。通常,固体支持体包含一种或更多种材料,该材料包含一个或更多个刚性表面或半刚性表面。在一些实施方案中,支持体是非固体支持体。支持体或基底可以包括膜、纸、塑料、涂层表面、平面、玻璃、载玻片、芯片或其任何组合。在一些实施方案中,支持体的一个或更多个表面基本上是平面,然而在一些实施方案中,可以期望其对于不同的化合物在物理上分隔合成区域,例如采用孔、凸起区域、针、蚀刻沟槽等。在一些实施方案中,固体支持体包括珠、树脂、凝胶、微球或其他几何构型。可选择地,固体支持体可以包括二氧化硅芯片、微粒、纳米颗粒、板和阵列。固体支持体可以包括使用在微孔中自组装的珠。例如,固体支持体包括Illumina的BeadArray技术。可选择地,固体支持体包括Abbott Molecular的Bead Array技术和Applied Microarray的FlexiPlexTM系统。在其他情况下,固体支持体是板。板的实例包括但不限于MSD多阵列板、MSD 板、微板、ProteOn微板、AlphaPlate、DELFIA板、IsoPlate和LumaPlate。在一些实施方案中,支持体可以包括多个珠。在一些实施方案中,支持体可以包括阵列。在一些实施方案中,支持体可以包括载玻片。适用于聚合物的方法、基底和技术(美国专利第5,744,305号、第5,143,854号、第5,242,974号、第5,252,743号、第5,324,633号、第5,384,261号、第5,405,783号、第5,424,186号、第5,451,683号、第5,482,867号、第5,491,074号、第5,527,681号、第5,550,215号、第5,571,639号、第5,578,832号、第5,593,839号、第5,599,695号、第5,624,711号、第5,631,734号、第5,795,716号、第5,831,070号、第5,837,832号、第5,856,101号、第5,858,659号、第5,936,324号、第5,968,740号、第5,974,164号、第5,981,185号、第5,981,956号、第6,025,601号、第6,033,860号、第6,040,193号、第6,090,555号、第6,136,269号、第6,269,846号和第6,428,752号;美国专利公布第20090149340号、第20080038559号、第20050074787号;以及PCT公布第WO 00/58516号、第WO 99/36760号和第WO 01/58593号)。多核苷酸与支持体的附接可以包括胺-硫醇交联、马来酰亚胺交联、N-羟基琥珀酰亚胺或N-羟基磺基琥珀酰亚胺、Zenon或SiteClick。将标记的核酸附接至支持体可以包括将生物素附接至多个多核苷酸,并且用链霉亲和素涂覆一个或更多个珠。在一些实施方案中,固体支持体是珠。珠的实例包括但不限于链霉亲和素珠、琼脂糖珠、磁珠、微珠、抗体缀合的珠(例如,抗免疫球蛋白微珠)、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、多核苷酸dT缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠和BcMagTM羧基封端磁珠。珠的直径可以是约5μm、10μm、20μm、25μm、30μm、35μm、40μm、45μm或50μm。固体支持体可以是阵列或微阵列。固体支持体可以包含离散的区域。固体支持体可以是阵列,例如可寻址阵列。
固体支持体可以包含实际上任何不溶性或固体材料,并且通常选择不溶于水的固体支持体组合物。例如,固体支持体可以包含以下各项或基本由以下各项组成:硅胶、玻璃(例如,可控孔玻璃(CPG))、尼龙、 纤维素、金属表面(例如,钢、金、银、铝、硅和铜)、磁性材料、塑料材料(例如,聚乙烯、聚丙烯、聚酰胺、聚酯、聚偏二氟乙烯(PVDF))等。根据实施方案使用的珠的实例可以包含允许珠与核酸分子相互作用的亲和部分。固相(例如,珠)可以包含结合对的成员(例如,亲和素、链霉亲和素或其衍生物)。例如,珠可以是链霉亲和素涂覆的珠,并且用于固定在珠上的核酸分子可以包含生物素部分。在一些情况下,每个多核苷酸分子可以包含两个亲和部分,诸如生物素,以进一步稳定多核苷酸。珠可以包含用于固定核酸的另外特征,或可以用于下游筛选或选择过程的另外特征。例如,珠可以包含亲和部分、荧光标记物或荧光猝灭剂。在一些情况下,珠可以是磁性的。在一些情况下,固体支持体是珠。珠的实例包括但不限于链霉亲和素珠、琼脂糖珠、磁珠、微珠、抗体缀合的珠(例如,抗免疫球蛋白微珠)、蛋白A缀合的珠、蛋白G缀合的珠、蛋白A/G缀合的珠、蛋白L缀合的珠、多核苷酸dT缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠和BcMagTM羧基封端磁珠。珠或颗粒可以是可膨胀的(例如,聚合物珠,诸如Wang树脂)或不可膨胀的(例如,CPG)。在一些实施方案中,固相基本上是亲水的。在一些实施方案中,固相(例如,珠)基本上是疏水的。在一些实施方案中,固相包含结合对的成员(例如,亲和素、链霉亲和素或其衍生物),并且基本上是疏水的或基本上是亲水的。在一些实施方案中,固相包含结合对的成员(例如,亲和素、链霉亲和素或其衍生物),并且具有每mg固体支持体大于约1350皮摩尔的游离捕获剂(例如,游离生物素)的结合能力。在一些实施方案中,包含结合对成员的固相的结合能力为每mg固体支持体大于800皮摩尔、900皮摩尔、1000皮摩尔、1100皮摩尔、1200皮摩尔、1250皮摩尔、1300皮摩尔、1350皮摩尔、1400皮摩尔、1450皮摩尔、1500皮摩尔、1600皮摩尔、1800皮摩尔、2000皮摩尔的游离捕获剂。适合于本发明的珠的其他实例是金胶体或珠,诸如聚苯乙烯珠或二氧化硅珠。可以使用基本上任何珠半径。珠的实例可以包括具有范围从150纳米至10微米的半径的珠。还可以使用其他大小。
本文公开的方法和试剂盒可以包括使用一种或更多种缓冲液。缓冲液的实例包括但不限于洗涤缓冲液、连接缓冲液、杂交缓冲液、扩增缓冲液和逆转录缓冲液。在一些实施方案中,杂交缓冲液是可商购的缓冲液,诸如TMAC Hyb溶液、SSPE杂交溶液和ECONOTM杂交缓冲液。本文公开的缓冲液可以包含一种或更多种去污剂。
本文公开的方法和试剂盒可以包括使用一种或更多种载体。载体可以增强或改善本文公开的一种或更多种反应(例如,连接反应、逆转录、扩增、杂交)的效率。载体可以降低或防止分子或其任何产物(例如,多核苷酸和/或扩增子)的非特异性损失。例如,载体可以降低多核苷酸通过吸附至表面的非特异性损失。载体可以降低多核苷酸对表面或基底(例如,器皿、Eppendorf管、移液管尖端)的亲和力。可选择地,载体可以提高多核苷酸对表面或基底(例如,珠、阵列、玻璃、载玻片、芯片)的亲和力。载体可以保护多核苷酸免于降解。例如,载体可以保护RNA分子不受核糖核酸酶的作用。可选择地,载体可以保护DNA分子不受DNA酶的作用。载体的实例包括但不限于多核苷酸诸如DNA和/或RNA,或多肽。DNA载体的实例包括质粒、载体、聚腺苷酸化DNA和DNA多核苷酸。RNA载体的实例包括聚腺苷酸化RNA、噬菌体RNA、噬菌体MS2RNA、大肠杆菌RNA、酵母RNA、酵母tRNA、哺乳动物RNA、哺乳动物tRNA、短聚腺苷酸化合成核糖核苷酸和RNA多核苷酸。RNA载体可以是聚腺苷酸化RNA。可选择地,RNA载体可以是非聚腺苷酸化RNA。在一些实施方案中,载体来自细菌、酵母或病毒。例如,载体可以是来源于细菌、酵母或病毒的多核苷酸或多肽。例如,载体是来自枯草芽孢杆菌(Bacillus subtilis)的蛋白质。在另一个实例中,载体是来自大肠杆菌(Escherichiacoli)的多核苷酸。可选择地,载体是来自哺乳动物(例如,人类、小鼠、山羊、大鼠、牛、绵羊、猪、狗或兔)、禽类、两栖动物或爬行动物的多核苷酸或肽。
本文公开的方法和试剂盒可以包括使用一种或更多种对照剂。对照剂可以包括对照多核苷酸、非活性酶、非特异性竞争剂。可选择地,对照剂包括亮杂交、亮探针对照、核酸模板、掺加对照、PCR扩增对照。PCR扩增对照可以是阳性对照。在其他情况下,PCR扩增对照是阴性对照。核酸模板对照可以是已知浓度。对照剂可以包含一种或更多种标记物。
掺加对照可以是添加至反应或样品的模板。例如,掺加模板可以被添加至扩增反应中。掺加模板可以在第一扩增循环后的任何时间被添加至扩增反应中。在一些实施方案中,掺加模板在循环数2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45或50后被添加至扩增反应中。掺加模板可以在最终扩增循环前的任何时间被添加至扩增反应中。掺加模板可以包含一个或更多个核苷酸或核酸碱基对。掺加模板可以包含DNA、RNA或其任何组合。掺加模板可以包含一种或更多种标记物。
本文公开了可以用于本文公开的方法和组合物、可以与其联合使用、可以用于为本文公开的方法和组合物做准备、或是本文公开的方法和组合物的产物的分子、材料、组合物和组分。应理解,当这些材料的组合、子集、相互作用、组等等被公开并且尽管多种个体组合和集合性组合的每一种以及这些分子和化合物的置换的具体参考未能被明确公开,每个都被本文具体包括和描述。例如,如果核苷酸或核酸被公开并讨论,并且讨论了可以对许多分子包括核苷酸或核酸做出的许多修饰,除非另有具体的相反指示,核苷酸或核酸以及可能的修饰形式的每一种组合和置换被具体地包括。该概念适用于本申请的所有方面,包括但不限于制备和使用所公开的方法和组合物的方法中的步骤。因此,如果存在可以被进行的多种另外的步骤,应理解,这些另外的步骤的每一个可以与所公开的方法的任何特定的实施方案或实施方案的组合一起进行,并且每个此类组合被具体地包括并且应当认为被公开。
尽管本文描述的一些实施方案已被本文示出并描述,这样的实施方案仅通过示例的方式提供。本领域技术人员现在将想到许多改变、变化和替代,而不偏离本文提供的公开内容。应该理解,在实践本文描述的方法中可以采用本文描述的实施方案的多种可选形式。
除非另外说明,否则本文使用的所有技术术语和科学术语具有与由本公开内容所属领域的普通技术人员通常理解的相同的含义。以下参考文献含有可以用于本文的方法和组合物的实施方案:The Merck Manual of Diagnosis and Therapy,第18版,由MerckResearch Laboratories出版,2006(ISBN 0-9119102);Benjamin Lewin,Genes IX,由Jones&Bartlett Publishing出版,2007(ISBN-13:9780763740634);Kendrew等人.(编著),The Encyclopedia of Mol.Biology,由Blackwell Science Ltd.出版,1994(ISBN 0-632-02182-9);和Robert A.Meyers(编著),Mol.Biology and Biotechnology:aComprehensive Desk Reference,由VCH Publishers,Inc.出版,1995(ISBN 1-56081-569-8)。
本公开内容的标准程序例如在Maniatis等人,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,USA(1982);Sambrook等人,Molecular Cloning:A Laboratory Manual(第2版),Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,USA(1989);Davis等人,Basic Methods inMolecular Biology,Elsevier Science Publishing,Inc.,New York,USA(1986);或Methods in Enzymology:Guide to Molecular Cloning Techniques Vol.152,S.L.Berger和A.R.Kimmerl(编著),Academic Press Inc.,San Diego,USA(1987));Current Protocols in Molecular Biology(CPMB)(Fred M.Ausubel,等人编著,JohnWiley and Sons,Inc.)、Current Protocols in Protein Science(CPPS)(JohnE.Coligan,等人编著,John Wiley and Sons,Inc.)、Current Protocols in Immunology(CPI)(John E.Coligan,等人编著.John Wiley and Sons,Inc.)、Current Protocols inCell Biology(CPCB)(Juan S.Bonifacino等人编著,John Wiley and Sons,Inc.)、R.IanFreshney的Culture of Animal Cells:A Manual of Basic Technique,出版商:Wiley-Liss;第5版(2005),以及Animal Cell Culture Methods(Methods in Cell Biology,Vol.57,Jennie P.Mather和David Barnes编,Academic Press,第1版,1998)中描述。
实施例
实施例1-T细胞群体中单个T淋巴细胞的免疫分型
本文描述的免疫表型分型方法通过分析CD4和CD8 mRNA二者以及人T淋巴细胞中的表面蛋白表达来验证(图1)。常规地,预期成熟T细胞是CD4亚型或CD8亚型。CD4亚型应同时表达CD4 mRNA和CD4蛋白质,而不应表达CD8 mRNA或CD8蛋白质。CD8亚型应同时表达CD8mRNA和CD8蛋白质,而不应表达CD4 mRNA或CD4蛋白质。
将30,000个T细胞与包含CD4抗原ID序列的CD4特异性抗体-寡核苷酸和包含CD8抗原ID序列的CD8特异性抗体-寡核苷酸两者一起孵育。还在单个细胞乳液实验中分析了T细胞的CD4、CD8和TCR mRNA含量。将T细胞受体α、T细胞受体β、CD4和CD8 mRNA逆转录为cDNA,并且通过聚合酶链式反应将液滴特异性条形码序列融合至cDNA和抗体缀合的寡核苷酸两者。将该DNA从乳液提取并且用下一代测序分析。
几乎所有的液滴-条形码(与单个细胞有关)均与CD4特异性抗原ID或CD8特异性抗原ID相关。发现mRNA和基于表面蛋白的分配之间基本上一致(图3)。
实施例2
免疫组库的测序在基础免疫学、自身免疫性、传染性疾病和肿瘤学中具有广泛的应用。尽管许多研究已经研究了循环血液中的BCR和TCR多样性,但对TIL的免疫受体存在日益增加的兴趣,该免疫受体的功能与癌症生长或消退高度相关,但可变且通常未表征。达到TIL的更好理解的关键步骤将是其BCR和TCR的回收和功能表征,因为这可以允许鉴定新的肿瘤相关抗原。迫切需要肿瘤抗原来开发癌症疫苗、了解检查点抑制剂的作用以及在实体瘤中推进嵌合抗原受体T细胞(CAR-T)疗法。然而,尽管数十年来在免疫测序方面的技术进展,但研究均未在不进行使所观察的组库受限并产生偏差的步骤——体外培养或细胞分选的情况下从异质样品诸如肿瘤回收到全长、天然配对的BCR(重链和轻链)和TCR(α链和β链)。由于原代未培养的免疫细胞可以含有比体外刺激的细胞少100倍的受体RNA,所以技术挑战特别大。为了允许对来自复杂异质样品的天然配对的BCR和TCR进行综合分析,开发了基于微流体乳液的方法以用于大量单个细胞的平行分离和DNA条形码化。在单独的~65皮升的乳液液滴中每小时分离多达一百万个细胞。细胞在液滴内裂解,靶mRNA用靶特异性引物来逆转录,并且两步法DNA条形码化过程将分子特异性条形码和液滴特异性条形码两者附接至cDNA。在随后的回收和下一代测序后,双重条形码化策略允许将序列读段簇集到其来源的分子和细胞两者中。这允许对错误和扩增偏差进行大量校正、在mRNA水平和细胞水平两者进行克隆计数、进行重链同种型确定,并且重要的是,同时以极高的通量回收BCR和TCR的全长、天然配对的V(D)J序列。
肿瘤浸润淋巴细胞(TIL)对于抗癌免疫应答是至关重要的,但由于其不可预测的丰度、表型和功能,对研究具有挑战性。本发明人开发了用于深度TIL表征的方法,而不需要细胞分选、刺激或培养。基于乳液的单个细胞条形码化方法从数百万个输入细胞中的淋巴细胞捕获天然配对的B细胞和T细胞受体(BCR和TCR)序列。与先前的方法相比,所回收的可变区是全长的,并且可以伴有另外的mRNA和蛋白质靶。在处理来自卵巢腺癌的400,000个未分选的细胞之前,用来自健康人类血液的3百万个B细胞和来自HIV患者的350,000个B细胞验证了该方法,回收来自超过11,000个TIL的配对的BCR和TCR。我们的结果代表了任何配对的BCR或TCR组库的最深采样,以及从乳液中的单个细胞同时进行RNA测序和蛋白质测量的首次演示。
实施例3-从健康血液样品大规模回收B细胞VHVL
首先开发了该技术,并且用通过阴性珠富集从健康志愿者的外周血分离的3百万个B细胞来评估配对能力和通量。将乳液分成六个单独的级分,将其并行处理并且在测序之前不再混合。乳液以每个液滴0.2个细胞装载,给出~90%被占据的液滴含有单个细胞的泊松期望值,这与乳液液滴的观察结果一致(图5A)。在乳液破裂和另外的文库处理步骤之后,用Illumina MiSeq进行配对末端325+300bp测序。为了处理测序数据,将液滴和分子条形码一起用于从每个原始mRNA分子收集PCR复制读段,并且确定每个mRNA的共有序列,仅保留由至少两个读段构建的mRNA序列。将正向读段和反向读段拼接以生成包含5’UTR、完整V(D)J序列和足以用于同种型确定的恒定区的全长产物。重排的免疫球蛋白重链和轻链序列用IMGT High-VQuest和/或IgBLAST注释。
产生的数据集含有324,988个与至少一个重链(VH)和一个轻链(VL)mRNA相缔合的液滴条形码,如通过重链簇集分析所估计的,存在229,869个不同的VH克隆谱系。由于该原始的集包括来自多细胞以及单细胞液滴的数据,因此来自单细胞液滴的数据通过过滤掉与非一致的重链或轻链V(D)J序列连接的液滴条形码来富集(图5B)。该步骤因典型的免疫组库的高度多样性而变得可能,其中来自两个随机细胞的VH或VL mRNA将几乎从不匹配。产生的富集数据集包含259,368个VHVL液滴条形码,并且含有182,745个VH克隆谱系,充分地代表迄今为止配对的免疫组库的最深采样。由于克隆相关细胞应该在其VHVL配对中示出一致性,因此通过鉴定克隆扩增的发生率直接估计VHVL配对的精确度。鉴定了2,604个VH克隆,其在超过一个乳液级分中以高置信度被观察到为克隆扩增的细胞。级分间VL序列与这些VH克隆配对的一致性非常高,并且指示96.1%的配对精确度,允许在259,368个VHVL对的整个过滤数据集中具有高置信度。交叉级分的VH和VL序列不变地与每个级分中的不同的液滴和分子条形码相关联,并且因此不代表文库交叉污染。该分析可能低估配对精确度,因为已知一些B细胞表达多个轻链。259,368个过滤的VHVL液滴条形码或“VHVL对”中的75.0%含有IgM和/或IgD(图5C),鉴于初始B细胞的典型IgM+IgD+表型,IgM和IgD如预期地经常一起观察到。还发现较低但相当大部分的IgA(18.3%)和IgG(6.6%)VHVL对。所有VH同种型与Igκ或Igλ以~3:2的比率配对。在182,745个VH克隆谱系中,克隆扩增以两种方式评估:与克隆相关的液滴条形码的数目和跨乳液级分的克隆的观察结果。在多个液滴条形码中观察到的克隆可以反映克隆扩增或多条形码液滴,鉴于条形码向液滴中的初始λ=1泊松分布,其预期在~37%的液滴中。然而,由>8个液滴条形码代表的任何克隆可能被真正扩增(单个液滴中的泊松概率为<10-6)。虽然在超过一个级分中观察到总体6.0%的克隆,但对于在超过8个液滴条形码中观察到的克隆(总体为0.7%),其中的99%在超过一个级分中观察到。100个最常见的克隆(各自30-137个液滴条形码,图5D)均在六个级分中的至少五个中观察到。因此,条形码计数和独立级分分析的组合允许在非扩展克隆的巨大背景中检测罕见的扩增谱系。然而值得注意的是,即使是最丰富的扩增克隆存在于不到千分之一的细胞,这例证了人类外周免疫组库的巨大多样性。
配对内每个VH和VL链的捕获mRNA的数目作为表达水平的估计值(图5E)。通常每个液滴条形码捕获小于10个重链(平均2.0个)和轻链(平均4.0个)mRNA,观察到每个细胞具有数十至数百个捕获的重链和轻链mRNA的液滴条形码的较小的群体,几乎完全来自表达IgG和IgA的细胞。有趣的是,配对内VH和VL突变的程度在每个同种型内(例如,IgG的VH与VL)和同种型之间(例如,IgG与IgM)强烈相关。此外,IgG和IgA对在其VH和VL链两者中几乎基本全部突变,而IgM和IgD对大部分示出很少的VH或VL突变。这些结果与B细胞激活导致IgM和IgD类别转换成IgG或IgA的机制、增加的免疫球蛋白表达和影响细胞中的重链基因座和轻链基因座两者的体细胞高频突变一致。除了高度突变的VH链倾向于与高度突变的VL链配对的这一观察以外,该方法能够从静息的人B细胞组库生成大量全长、天然配对的BCR。
实施例4-从HIV elite控制者回收已知的低频率VHVL
作为测定的配对灵敏度和准确度的进一步验证,处理样品,其中几个罕见(10,000个细胞中<1个细胞)的天然VHVL配对是已经公开已知的。获得来自HIV elite控制患者的外周B细胞,该患者的记忆细胞近年来已经为了得到展示HIV中和活性的抗体而被大量甄选。处理350,000个B细胞以生成总共38,620个过滤的VHVL对。有趣的是,该个体示出比先前的健康样品(图3A)或典型的健康外周B细胞组库更大的IgG比例。将来自该数据集的VH序列与来自该个体(包括PGT121)的所有报道的广谱中和抗体(bNAb)进行比较,并且发现八个接近或相同的VH序列,指示该bNAb家族代表小于0.03%的循环B细胞。至关重要的是,与这些重链配对的所有轻链属于预期的且类似罕见的bNAb谱系,其展示出与先前报道相同的Igλ-V3-21/J3重排和标志性三联密码子插入,这支持我们方法的高准确度和高灵敏度。此外,在来自该个体的所有已知和新生成的PGT121样VHVL对的系统发生树上(图3B),VH和VL树示出惊人相似的拓扑结构,配对的VH和VL序列占据镜样位置,这可能反映了共享系统发生史。本文发现的变体对很符合这个规则。有趣的是,两个公开的抗体PGT122和PGT123表现为例外;没有发现对这两种配对的支持,而是发现了PGT122VH:PGT123VL样配对和PGT123VH:PGT122VL样配对,对应于原始报告中的未验证的配对。合成了编码8个新型PGT样VHVL对的完整V(D)J区的DNA,将抗体表达为全长IgG并测试其中和多个HIV假毒株的能力(图6C)。抗体表达良好,并且均示出对病毒的强中和活性,证明我们的方法在从相关生物样品快速生成天然配对的功能性抗体变体方面的实用性。
实施例5-来自肿瘤浸润淋巴细胞的B细胞和T细胞受体对
在验证了乳液条形码化对配对受体的高通量回收之后,从肿瘤直接回收免疫受体。取得蛋白酶解离的切除的卵巢腺癌样品,并使400,000个未分选的细胞进入乳液中。对样品的单独等分试样的CD3/CD19染色表明材料中相当数目的浸润B细胞(~5%)和浸润T细胞(~20%)。乳液中的单个细胞分散与纯化的细胞相似,尽管可见一些有限的凝集,并且鉴于样品的细胞类型异质性,液滴内的细胞大小和形状的广泛变化如预期的(图7A)。
将靶向T细胞受体α和β链的恒定区的引物与先前使用的BCR引物一起使用,并且随后的测序和严格过滤回收了数千个与BCR或TCR产物连接的液滴条形码。为了评估单个细胞精确度,对液滴条形码内的四个靶基因座(VH、VL、Vα、Vβ)的所有可能组合进行计数(图7B)。绝大多数(97.9%)的具有超过一个靶链的液滴条形码包含生物学上预期的BCR VH +VL或TCRVα+Vβ的配对,其中仅2.1%含有混合的BCR-TCR组合。由于产物的条形码化相对于靶链是无偏倚的,因此该结果允许产生的6,056个BCR VHVL和5,217个TCR VαVβ对具有高置信度。BCR示出了与其他同种型相比明显的IgG优势(>80%)(图7C),尽管IgG和其他同种型全都存在(仅IgE<0.05%)。κ和λ轻链以与外周血数据集相似的比率存在。
与外周血类似,在BCR同种型和VH链和VL链两者的突变水平之间观察到相关性,其中IgG和IgA对示出比IgD和IgM更多的VH和VL突变,并且在每个同种型内的VH和VL之间示出突变的一般相关性(图7D)。有趣的是,尽管IgD、IgM和IgA对在肿瘤和外周血数据集之间示出非常相似的突变分布(图5F),但肿瘤IgG级分还含有相当大比例的在外周血中未观察到的较少突变序列或无突变序列。对于TCR和对于含有IgD的BCR,每个液滴条形码观察到的捕获mRNA的数目与来自外周血的BCR结果相似(图7E,每个液滴条形码通常<10)。形成鲜明对比的是,肿瘤来源的IgM、IgA和IgG对示出提高10倍至100倍的平均表达水平,其中数百或数千个靶mRNA被捕获在许多液滴条形码中。然后评估捕获的TIL-TCR和BCR组库的多样性(图7F)。在5,217个总TCR对中观察到2,423个不同的TCRβ克隆。七个克隆以>1%的频率存在,其中频率最高的克隆代表所有液滴条形码中的16.9%。在6,056个总BCR对中观察到1,518个不同的重链克隆,其中15个克隆的频率>1%但均未>5%。虽然这代表比健康的外周BCR组库(其中克隆均未以大于0.06%的频率存在)基本上更受限的多样性,但在肿瘤样品中存在如此多的类别转换的、突变的和高度表达的克隆证明需要深度和灵敏的采样方法以用于TIL表征。这些方法允许同时从B细胞和T细胞两者中快速找回大量的TIL免疫受体对,而无需事先分选或外源性地活化所限定的TIL群体。
实施例6-捕获感兴趣的另外的表型标志物
通过液滴条形码化的受体链配对潜在地允许捕获除了免疫受体之外的另外的靶。为了研究这种可能性,通过磁珠富集将健康T细胞分离为CD4+群体和CD8+群体,并且将每种类型的20,000个细胞输入至具有靶向TCRα和β链的引物以及CD4 mRNA和CD8 mRNA的单独的乳液运行中。在测序后,含有来自CD4+分离细胞的TCR Vα和Vβ(“TCR对”)的3,861个液滴条形码中的47.0%与CD4 mRNA相连接,而仅0.3%与CD8 mRNA相连接。相比之下,来自CD8+分离细胞的2,235个TCR对的50.6%与CD8 mRNA相关联,而仅0.6%与CD4 mRNA相关联。这证明与先前的报道相似,基于mRNA的途径用于细胞表型分型的特异性较高但灵敏度有限。相比之下,诸如细胞表面受体的蛋白质通常以远高于其编码mRNA的数目(每个细胞1,000-100,000个蛋白质)存在,这可能使得它们更容易检测以及可能与细胞表型更直接地相关。为了测量每个细胞上的靶蛋白水平,将定制的寡核苷酸DNA标记物与抗人CD4和CD8抗体缀合,并且将标记的抗体与未分离的CD4+和CD8+T细胞的混合物一起孵育,然后将30,000个细胞输入乳液中(图8A)。DNA标记物携带抗体特异性序列标签和分子条形码以及与扩增的液滴条形码互补的序列,允许乳液液滴条形码化和分子计数与针对mRNA类似地进行。同时靶向DNA标记物以及TCR、CD4和CD8 mRNA。在测序和过滤后,将3,682个液滴条形码鉴定为具有高置信度的TCR VαVβ对。与先前的实验一致,基于mRNA,可以将约一半(52%)的TCR对分配为CD4或CD8状态(图8B)。然而,基于蛋白质状态,可以将超过95%的液滴条形码分配为CD4或CD8,其中对于每个液滴的平均分子计数,CD4/8蛋白质(平均值20.5)明显高于CD4/8 mRNA(平均值1.0)。mRNA和蛋白质信号之间的一致性很高(图8C):96%的液滴给出mRNA判定和蛋白质判定是一致的。在一些罕见的情况下,检测到CD4蛋白质和CD8蛋白质两者,这可能是含有两个或更多个细胞的液滴的结果。乳液条形码化首次允许将单个细胞免疫受体与感兴趣的mRNA和蛋白质标志物直接连接,所有这些均以高通量进行。将该方法应用于具有扩增的免疫肿瘤相关标志物组诸如抗PD-1和抗CTLA-4的TIL是有理由的。
实施例7-人类样品
在个人基因组计划(Personal Genome Project)的批准下收集了用于健康组库验证的血液样品。用于HIV bNAb实验的PBMC从供体17获得,供体17是来自IAVI Protocol G群组的HIV-1感染供体。根据由卢旺达共和国国家伦理委员会(the Republic of RwandaNational Ethics Committee)、埃默里大学机构审查委员会(the Emory UniversityInstitutional Review Board)、赞比亚大学研究伦理委员会(the University of ZambiaResearch Ethics Committee)、查林十字研究伦理委员会(the Charing Cross ResearchEthics Committee)、UVRI科学与伦理委员会(the UVRI Science and EthicsCommittee)、新南威尔士大学研究伦理委员会(the University of New South WalesResearch Ethics Committee)、圣文森特医院和东悉尼地区卫生服务机构(St.Vincent’sHospital and Eastern Sydney Area Health Service)、肯雅塔国家医院伦理与研究委员会(Kenyatta National Hospital Ethics and Research Committee)、开普敦大学研究伦理委员会(University of Cape Town Research Ethics Committee)、国际机构审查委员会(the International Institutional Review Board)、玛希隆大学伦理委员会(theMahidol University Ethics Committee)、沃尔特里德陆军研究所(WRAIR)机构审查委员会(the Walter Reed Army Institute of Research(WRAIR)Institutional ReviewBoard)和象牙海岸“国家生命科学和健康伦理”委员会(CNESVS)(the Ivory Coast Comite“National d’Ethique des Sciences de la Vie et de la Sante”(CNESVS))批准的临床方案,在书面知情同意的情况下收集所有人类HIV样品。根据IRB批准的方案,在书面知情同意的情况下从Conversant Biologics获得来自单个供体的低温保存的、解离切除的卵巢腺癌。
实施例8-细胞制备
为了研究3百万个健康B细胞,将50mL血液抽取到具有肝素钠(BD)的VacutainerCPT细胞制备管中,以1800×g离心持续20min,在细胞制备缓冲液(补充有2%胎牛血清和2mM EDTA的1x PBS)中洗涤两次,使用200×g旋转以去除血小板,并且将产生的PBMC在RPMI-1640培养基(Life Technologies)+20%胎牛血清+10%DMSO中以-80℃低温保存,直到需要。在乳液生成之前,将PBMC解冻,在细胞制备缓冲液中洗涤两次并计数。根据制造商的说明书使用基于阴性选择的人类B细胞富集试剂盒(Stem Cell Technologies)来分离B细胞。使细胞通过20μm细胞过滤器并且在细胞制备缓冲液中稀释至6.2×106个细胞/mL(3百万个B细胞实验)或3.1×106个细胞/mL(PGT供体和卵巢肿瘤实验)。
实施例9-乳液中的免疫受体条形码化
乳液生成平台由三个通过单个空气压缩机驱动的Mitos P-泵(DolomiteMicrofluidics)组成,每个泵具有Mitos流速传感器,以允许两个水相和一个亲氟油连续相计算机控制地流入亲氟涂覆的石英白云石Small 2-Reagent芯片。一个水性入口通道含有所需密度的细胞以产生期望的细胞/液滴占据水平,而第二水性通道含有裂解和反应混合物,该混合物由AbPairTM反应缓冲液和寡核苷酸(www.abvitro.com/catalog AV2070-1S和AV2080-1S)、5单位/μL的基于MuMLV的逆转录酶(Thermo Scientific)以及0.1单位/μL的Herculase II PCR聚合酶组成。使用100μL Hamilton Microliter注射器以两次各~100μL的LR混合物的注射来过度装载100μL内径PEEK管样品环。使用100μL Hamilton Gastight注射器将~110μL细胞悬浮液装载到~100μL、0.2mm内径的FEP管环中。通过在来自芯片中两个油通道的油流动的同时使水相以相同流速聚焦流动喷射穿过2-Reagent芯片来形成乳液。将离开芯片出口通道的乳液滴入在冷却块(cold block)上的0.2mL PCR带管(Eppendorf)中,之后通过移液从管的底部去除过量的油,添加40μL覆盖溶液(25mM Na-EDTA,pH 8.0)并且将管转移至标准热循环仪以用于转录物加标签反应。在45min的逆转录(RT)步骤期间,将RNA在42℃用靶特异性RT引物逆转录,其中基于模板转换添加了含有随机化分子条形码的通用衔接子序列。在RT后,乳液经历40次热循环(每个循环:82℃持续10秒,65℃持续25秒)以进行液滴条形码模板的PCR扩增,该液滴条形码在初始裂解和反应混合物中被稀释至30,000cp/μL,在最终混合物中生成15,000cp/μL或每~65pl液滴~1cp的浓度。液滴条形码的一端包含Illumina读段2(“P7”)引物位点,而另一端匹配通用衔接子寡核苷酸的共同序列。因此,在PCR期间,模板转换的cDNA可以退火至扩增的液滴条形码链,并且通过重叠延伸被剪接以产生含有靶、分子条形码和液滴条形码序列的全长产物。
实施例10-乳液破裂、清理、下游PCR、合并和测序
在热循环之后,通过移液去除覆盖溶液,并且将40μL乳液破裂溶液(1:1Fc-40:全氟辛醇)与15μL裂解物澄清溶液(12.5μL Qiagen蛋白酶、2.5μL 0.5M Na-EDTA,pH 8.0)一起添加。在颠倒10次破坏乳液之后,将混合物在50℃孵育持续15分钟并且在95℃孵育持续3分钟以使蛋白酶灭活。在以15,000×g离心持续1min以分离水相之后,将回收的物质严格纯化以去除寡核苷酸、试剂和过量的液滴条形码PCR产物。由于全长产物因RT引物的5’生物素化而含有生物素,因此可以通过在链霉亲和素珠上清理而有效地将其与过量的液滴条形码PCR产物分离,从而使下游PCR重组伪迹(重叠延伸方法中的常见问题)最小化。首先使用AMPure XP珠(Agencourt),利用制造商的说明以1:1的比率纯化产物,然后使用链霉亲和素珠(New England Biolabs)同样利用制造商的说明进行清理,然后在95℃的去离子水中洗脱,随后用AMPure XP珠以1:1的比率进行第二次清理。然后将产物输入靶富集PCR,其中对B细胞或T细胞受体靶的恒定区特异的引物与对液滴条形码序列的通用末端特异的引物一起使用。根据制造商的说明,该反向引物还含有用于MiSeq仪器上的多重测序的六碱基索引条形码。因此,仅全长的、液滴条形码化的靶序列在该步骤中被扩增。首先使用Q5热启动聚合酶(New England Biolabs)在制造商推荐的条件(包括在反应开始时的2分钟98℃聚合酶活化步骤)下将所有靶一起扩增7个循环:98℃10秒;64℃20秒;72℃15秒。然后以1.5:1的珠:PCR的比率进行AMPure XP清理。然后使用与之前相同的热循环条件进行分别针对每个链(VH、VL、Vα、Vβ)的第二次七个循环,然后进行AMPure XP清理。然后进行具有相同热循环条件和5-15个循环(取决于通过qPCR判断的产率)的最终PCR以添加全长Illumina测序衔接子并生成足够的物质以用于TapeStation D1000(Agilent)定量。然后将文库合并并且在V3 2x300bp MiSeq平台(Illumina)上测序。
实施例11-对MiSeq平台的修改
BCR或TCR的完整可变V(D)J区的重建需要拼接两个配对末端Illumina读段。为了改善该过程,将2x 300bp试剂盒的正向读段延伸至325bp。由于免疫受体文库在恒定区引物位点具有有限的多样性,因此使用10%phiX掺加(spike-in)来减轻文库多样性有限的问题。
实施例12-读段的生物信息学处理的概述
使用围绕pRESTO包(0.4版)建立的定制流程来处理Illumina MiSeq读段,以生成来自每个液滴的mRNA分子的全长共有序列,用IgBLAST和/或IMGT/HighV-QUEST对其注释,并进一步比对、过滤并用定制脚本和Change-O包处理以生成统计数据。
实施例13-读段处理和注释、同种型分配。
原始读段处理、V(D)J注释和克隆分配利用pRESTO和Change-O包用定制流程进行。简言之,对原始Illumina配对末端325+300bp读段进行质量控制、引物修剪,并且经由引物位点的模糊匹配来鉴定液滴特异性条形码(DB)和分子特异性条形码(MB)。DB和MB一起独特地指定起源分子,并且该独特分子标识符(UMI)用于将来自相同分子的一致PCR复制读段(最少两个)分组以生成每个mRNA序列的共有序列。同种型特异性引发通过引物修剪的序列内的已知同种型特异性恒定区的模糊匹配来证实。V(D)J种系区段和重排结构使用IgBLAST来确定,并且在适当的情况下用IMGT/HighV-QUEST来证实,通过Change-O和定制脚本来解析。
如在Change-O中实施的,经由在具有匹配的IGHV基因、IGHJ基因和接合长度的功能性V(D)J序列组内的单联簇集来分配克隆。对于3百万个循环细胞数据集,将使用对称化转换/倒位模型的加权克隆内距离4.0用作克隆内的最近邻距离截止值。
实施例14-液滴免疫受体包含过滤和配对保真计算
可以用这种条形码化方法以以下两种方式评估从液滴回收B细胞序列的精确度:使用液滴内mRNA序列一致性,以及经由交叉级分配对一致性。在每个液滴内,每个基因座捕获多个mRNA;从一个细胞表达的V(D)J序列应该一致。使用多重比对的V(D)J区段的2%序列多样性(平均成对核苷酸差异pi55<0.02)的截止值来限定序列一致性,将每个液滴存在超过一个生产性VDJ和一个生产性VJ序列以生物信息学方式标记为推定的免疫受体包含或多细胞占据。针对每个等位基因排除的液滴构建重链和轻链共有序列,并且将其用于克隆限定和交叉级分配对分析。对于3百万个循环B细胞数据集,每个VH谱系与数据集中>20,000个轻链克隆中的一个(理想情况下)相关联。在具有VHVL对的259,368个免疫基因座排除的液滴中,10,870个VDJ重链基因座重排簇集存在于6个物理分离的乳液级分的至少两个中。这些簇集代表扩展的谱系或相同VJ外显子的独立但相似的重排。在VDJ重排与两个复制间一致的VJ重排配对的情况下,两个实验均独立地产生真阳性(对于2,604个具有更罕见重排的克隆,35,922个中有33,157个可能的成对比较)。因此,每个复制的精确度为96.1%(0.923^0.5)。
实施例15-HIV bNAb候选序列的发现
通过针对与已知bNAb HCDR3s、VDJ序列和使用tblastx、MUSCLE和PhyML从文献中选出的供体17谱系的相似性甄选我们的38,620个VHVL对来发现新的天然配对的HIV广谱中和抗体(BNAb),然后手动检查全V(D)J氨基酸序列的系统发生树以选择散布有已知bNAb序列的抗体候选物。
实施例16-HIV bNAb蛋白表达和纯化
合成抗体序列并将其克隆到先前描述的重链和轻链载体中。根据制造商的方案使用293fectin(Invitrogen)将重链和轻链质粒共转染(1:1比率)在293FreeStyle细胞中。在转染后四天收获抗体上清液并且通过蛋白-A亲和层析来纯化。在用于进一步测定之前,将纯化的抗体缓冲液交换成PBS。
实施例17-假病毒生产和中和测定
通过用HIV-1Env表达质粒和Env缺陷的基因组骨架质粒(pSG3ΔEnv)转染293T细胞来生成假病毒。转染后72hr收获假病毒用于中和测定。中和活性使用单轮复制假病毒测定和TZM-B1靶细胞来评估。简言之,将TZM-B1细胞接种在96孔平底板中。向该板添加假病毒,将其在37℃与抗体的连续稀释液一起预孵育持续1hr。一旦裂解并添加Bright-Glo荧光素酶底物(Promega),在感染后的72hr对荧光素酶报道基因表达进行定量。为了确定IC50值,剂量-响应曲线通过非线性回归来拟合。
实施例18-卵巢肿瘤靶链的鉴定
在乳液中从卵巢解离的肿瘤组织同时捕获BCR和TCR后,使用如先前描述的分子条形码和液滴条形码来过滤读段,但然后寻找四种可能的靶链类型(BCR VH、BCR VL、TCR Vα、TCR Vβ)中的每一种的存在。如果靶链由至少两个mRNA支持,每个mRNA有至少两个测序读段,则保留靶链。还分析了仅含有BCR VHVL对或TCR VαVβ对的所有液滴条形码。基于不同的CDR3氨基酸序列判定BCR重链和TCRβ链克隆。
实施例19-通过DNA标记的抗体染色在乳液中进行蛋白质检测
将单链的200bp DNA寡核苷酸设计为含有独特的5bp抗原ID序列,并且用5'氨基基团修饰(Integrated DNA Technologies)。根据制造商的方案,使用Thunder-Link试剂盒(Innova Biosciences)将小鼠单克隆抗人CD4(BioLegend,#300516)和CD8a(BioLegend,#301018)抗体与DNA寡核苷酸标签缀合。对于乳液前的细胞标记,将两百万个来自外周血的阴性选择的T细胞在400μL细胞缓冲液+2mM EDTA+0.05%叠氮化钠中稀释。将单链鲑精DNA添加至细胞,至最终浓度为200μg/mL,并且将细胞在室温旋转持续五分钟。将CD4和CD8aDNA标记的抗体(各自至最终浓度为5nM)的混合物添加至细胞并且在室温孵育持续30分钟。将细胞用细胞缓冲液+2mM EDTA+0.05%叠氮化钠+200μg/mL单链鲑精DNA洗涤三次。在进入乳液分析之前,将细胞重悬于细胞缓冲液+0.05%叠氮化钠中。将30,000个细胞用于乳液测序。
实施例20-四聚体-寡核苷酸缀合物染色
生成了包括四个MHC肽复合物的四聚体-寡核苷酸,每个复合物具有链霉亲和素核心和荧光团。每个四聚体寡核苷酸还包括如下文描述的用于定量的分子条形码和/或四聚体ID码。示例性的荧光标记的四聚体-寡核苷酸缀合物在图18中示出。
本文描述了一种用于确定两种不同的TCR的亲和力的示例性方法。将对MHC肽具有已知不同亲和力的两个T细胞群体与不同浓度的包含MHC肽四聚体(pMHC)的四聚体-寡核苷酸缀合物一起孵育。将未结合的四聚体-寡核苷酸洗掉,并且细胞进入乳液分析并对其测序。结合信号基于在四聚体-寡核苷酸缀合物的每个浓度,每个T细胞的四聚体-寡核苷酸缀合物的寡核苷酸的序列读段来计算(图19)。与更高浓度的四聚体-寡核苷酸缀合物一起孵育的T细胞预期示出更高的结合信号。在测定的可工作范围内,在相同浓度的四聚体-寡核苷酸缀合物,与具有对四聚体-寡核苷酸缀合物的MHC肽具有较低亲和力的TCR的T细胞相比,具有对四聚体-寡核苷酸缀合物的MHC肽具有较高亲和力的TCR的T细胞预期呈现出较高的结合信号。例如,在图19中在log[四聚体]-8和-4的浓度之间,TCR1的结合信号高于TCR2的结合信号,这指示在该测定中TCR1将预期对所使用的四聚体试剂具有更高的亲和力。
实施例21-四聚体-寡核苷酸缀合物染色与常规MHC-肽四聚体染色的比较
生成靶特异性T细胞以提供阳性对照,以用于测试如本文描述的示例性四聚体-寡核苷酸缀合物试剂的结合特异性。用于生成靶特异性T细胞的示例性方法大体由Ho等人,J.Immunol.Methods,310:1-2,40-52描述。简言之,树突细胞来源于从具有HLA-A02:01的正常人类供体获得的外周血单核细胞(PBMC)样品的粘附级分,通过在GM-CSF和IL-4的存在下培养超过两天,然后从第3天开始在促炎性细胞因子的存在下孵育以产生成熟树突细胞。在第4天,收获产生的成熟树突细胞,洗涤并用将用在MHC-肽四聚体(pMHC)中的期望的靶来源的肽脉冲化。在第5天,将来自正常人类供体的自体CD8+ T细胞与肽脉冲的树突细胞一起孵育。在第8天,测量培养物中的IFNγ作为含有抗原特异性T细胞的培养物的指标。选择来自反应性共培养物的细胞,并且用肽脉冲的树突细胞再刺激两次或三次,以富集抗原特异性T细胞。在一些实施方案中,这些抗原特异性T细胞通过细胞分选和/或限制稀释克隆从这样的富集群体中生成,基本上如Ho等人2006描述的。非靶特异性的CD8+ T细胞用作T细胞对照群体。
将靶特异性CD8+ T细胞和非特异性CD8+ T细胞对照群体与荧光标记的标准MHC-肽四聚体或各种递减浓度的荧光标记的四聚体-寡核苷酸缀合物一起孵育。在孵育后,对标准MHC-肽四聚体或四聚体-寡核苷酸缀合物染色阳性的细胞的存在通过流式细胞术鉴定。与非特异性CD8+ T细胞一起孵育的标准MHC-肽四聚体和四聚体-寡核苷酸缀合物两者示出很少或没有阳性染色(图21,上排流式细胞术图)。与靶特异性CD8+ T细胞一起孵育的标准MHC-肽四聚体示出强的双阳性MHC-肽四聚体+CD8+细胞群体(图21,下排,左侧流式细胞术图)。与靶特异性CD8+ T细胞一起孵育的四聚体-寡核苷酸缀合物示出强的双阳性四聚体-寡核苷酸缀合物+CD8+细胞群体,其中该双阳性群体随着四聚体-寡核苷酸缀合物浓度的降低而降低(图21,下排,右侧三个流式细胞术图)。这指示,与靶特异性T细胞结合的四聚体-寡核苷酸缀合物与标准MHC-肽四聚体相似,并且四聚体-寡核苷酸缀合物与靶特异性T细胞的结合是四聚体-寡核苷酸缀合物浓度依赖的。
实施例22-四聚体-寡核苷酸缀合物结合信号
通常如实施例21中描述的,靶特异性(结合TCR)或非特异性T细胞(非结合TCR)也用于评估每个细胞结合的四聚体-寡核苷酸缀合物计数。将非结合性TCR细胞群体和结合性TCR细胞群体与各种浓度的四聚体-寡核苷酸缀合物单独孵育,该四聚体-寡核苷酸缀合物包含被结合性TCR群体的TCR识别的MHC-肽四聚体以及至少一种独特的寡核苷酸序列(例如,分子条形码、四聚体ID码和/或抗原ID码)。将未结合的四聚体-寡核苷酸洗掉,并且细胞进入乳液分析并对其测序。结合信号基于在四聚体-寡核苷酸缀合物的每个浓度,每个四聚体的寡核苷酸的序列读段的数目来计算,其在图21中以图形形式表示。图21中示出的结果指示,四聚体-寡核苷酸缀合物能够以剂量依赖性方式特异性识别和结合原代靶T细胞上的TCR。

Claims (97)

1.一种选择T细胞受体(TCR)的方法,包括
(a)使多个pMHC-寡核苷酸缀合物分子与多个T细胞接触;
(b)将容器条形码化多核苷酸或其互补物附接至
(i)多个容器中的容器中的pMHC-寡核苷酸缀合物分子的寡核苷酸部分,和
(ii)来自所述容器中的多个T细胞中的单个T细胞的TCR多核苷酸;和
(c)对所述寡核苷酸部分或其互补物和所述TCR多核苷酸或其互补物测序,从而产生序列信息。
2.一种确定T细胞受体(TCR)的结合亲和力的方法,包括
(a)使多个pMHC-寡核苷酸缀合物分子与多个T细胞接触;
(b)对所述寡核苷酸部分或其互补物测序,从而产生序列信息;和
(c)基于所述序列信息确定TCR与pMHC寡核苷酸缀合物的结合亲和力。
3.一种选择T细胞受体(TCR)的方法,包括
(a)使多个pMHC-寡核苷酸缀合物分子与多个T细胞接触,其中所述pMHC-寡核苷酸缀合物分子包括检测部分;
(b)基于所述检测部分的检测,从(a)的所述多个T细胞获得富集的T细胞群体;
(c)从所富集的群体分离与pMHC-寡核苷酸缀合物分子结合的单个T细胞到多个容器中的第一容器中,
(d)将容器条形码化多核苷酸或其互补物附接至
(i)所述第一容器中的所述pMHC-寡核苷酸缀合物分子的寡核苷酸部分,和
(ii)来自所述第一容器中的所述单个T细胞的TCR多核苷酸;和
(e)对所述寡核苷酸部分或其互补物和所述TCR多核苷酸或其互补物测序,从而产生序列信息。
4.一种选择T细胞受体(TCR)的方法,包括
(a)使多个pMHC-寡核苷酸缀合物分子与多个T细胞接触,其中所述pMHC-寡核苷酸缀合物分子包括检测部分;
(b)基于所述检测部分的检测,从(a)的所述多个T细胞获得富集的T细胞群体;
(c)从所富集的群体分离与pMHC-寡核苷酸缀合物分子结合的单个T细胞到多个容器中的第一容器中,
(d)对所述寡核苷酸部分或其互补物和所述TCR多核苷酸或其互补物测序,从而产生序列信息;和
(e)基于所述序列信息确定由所述TCR多核苷酸编码的TCR与所述pMHC-寡核苷酸缀合物的结合亲和力。
5.如权利要求3或4所述的方法,其中所富集的T细胞群体包括占总T细胞的一定比率的与pMHC-寡核苷酸缀合物分子结合的T细胞,所述比率高于所述接触后与pMHC-寡核苷酸缀合物分子结合的T细胞占所述多个T细胞的总T细胞的比率。
6.一种选择T细胞受体(TCR)的方法,包括
(a)使第一多个pMHC-寡核苷酸缀合物分子以第一pMHC-寡核苷酸缀合物分子与细胞的比率与第一多个T细胞接触,
(b)使第二多个pMHC-寡核苷酸缀合物分子以低于所述第一pMHC-寡核苷酸缀合物分子与细胞的比率的第二pMHC-寡核苷酸缀合物分子与细胞的比率与第二多个T细胞接触,
(c)将第一容器条形码化多核苷酸或其互补物附接至
(i)多个容器中的第一容器中的pMHC-寡核苷酸缀合物分子的寡核苷酸部分,和
(ii)来自第一容器中的第一T细胞群体的单个T细胞的第一TCR多核苷酸,
(d)将第二容器条形码化多核苷酸或其互补物附接至
(i)所述多个容器中的第二容器中的pMHC-寡核苷酸缀合物分子的寡核苷酸部分,和
(ii)来自所述第二容器中的第二T细胞群体的单个T细胞的第二TCR多核苷酸;
(e)对所述第一容器中的所述pMHC-寡核苷酸缀合物分子的所述寡核苷酸部分或其互补物和所述第一TCR多核苷酸或其互补物测序,从而产生第一组序列信息,
(f)对所述第二容器中的所述pMHC-寡核苷酸缀合物分子的所述寡核苷酸部分或其互补物和所述第二TCR多核苷酸或其互补物测序,从而产生第二组序列信息;
(g)基于所述第一组序列信息确定由所述第一TCR多核苷酸编码的TCR与所述pMHC-寡核苷酸缀合物的第一结合信号,并且基于所述第二组序列信息确定由所述第二TCR多核苷酸编码的TCR与所述pMHC-寡核苷酸缀合物的第二结合信号,
其中所述第一TCR多核苷酸和所述第二TCR多核苷酸编码相同的TCR。
7.如权利要求1或3所述的方法,还包括基于所述序列信息确定由所述TCR多核苷酸编码的TCR与所述pMHC-寡核苷酸缀合物的结合亲和力。
8.如权利要求6所述的方法,还包括基于所述第一结合信号和所述第二结合信号确定由所述第一TCR多核苷酸和所述第二TCR多核苷酸编码的相同的TCR的结合亲和力。
9.如权利要求6所述的方法,其中所述第一多个的pMHC-寡核苷酸缀合物分子和所述第二多个的pMHC-寡核苷酸缀合物分子包含相同的肽。
10.如权利要求6或9所述的方法,其中所述第一多个的pMHC-寡核苷酸缀合物分子和所述第二多个的pMHC-寡核苷酸缀合物分子的的MHC包括相同的亚型。
11.一种选择T细胞受体(TCR)的方法,包括
(a)使多个pMHC-寡核苷酸缀合物分子与多个T细胞接触,
(b)
(i)将第一容器条形码化多核苷酸或其互补物附接至多个容器中的第一容器中的pMHC-寡核苷酸缀合物分子的寡核苷酸部分,
(ii)来自所述第一容器中的T细胞群体的第一单个T细胞的第一TCR多核苷酸,
(iii)将第二容器条形码化多核苷酸或其互补物附接至多个容器中的第二容器中的pMHC-寡核苷酸缀合物分子的寡核苷酸部分,和
(iv)来自所述第二容器中的T细胞群体的第二单个T细胞的TCR多核苷酸;
(c)
(i)对所述第一容器中的所述pMHC-寡核苷酸缀合物分子的所述寡核苷酸部分或其互补物和所述第一TCR多核苷酸或其互补物测序,从而产生第一组序列信息,所述第一组序列信息包括TCR多核苷酸容器条形码序列读段和寡核苷酸容器条形码序列读段,和
(ii)对所述第二容器中的所述pMHC-寡核苷酸缀合物分子的所述寡核苷酸部分或其互补物和所述第二TCR多核苷酸或其互补物测序,从而产生第二组序列信息,所述第二组序列信息包括TCR多核苷酸容器条形码序列读段和寡核苷酸容器条形码序列读段;
(d)比较由所述第一TCR多核苷酸编码的TCR的结合亲和力和由所述第二TCR多核苷酸编码的TCR的结合亲和力,其中由所述第一TCR多核苷酸编码的TCR的结合亲和力基于所述第一组序列信息确定,并且其中由所述第二TCR多核苷酸编码的TCR的结合亲和力基于所述第二组序列信息确定;和
(e)基于所述比较选择由所述第一TCR多核苷酸编码的TCR,其中所选择的由所述第一TCR多核苷酸编码的TCR具有比由所述第二TCR多核苷酸编码的TCR更强的结合亲和力。
12.如权利要求11所述的方法,其中所述第一单个T细胞来自患有疾病或状况的患者。
13.如权利要求12所述的方法,其中所述第二单个T细胞来自没有所述疾病或状况的患者。
14.如权利要求1或6-13中任一项所述的方法,其中所述pMHC-寡核苷酸缀合物分子包括检测部分。
15.如权利要求14所述的方法,其中获得所富集的T细胞群体是基于所述检测部分的检测。
16.如权利要求14或15所述的方法,其中所述检测部分包含荧光团。
17.如权利要求1-16中任一项所述的方法,其中所述第一容器中的容器条形码化多核苷酸或其互补物的容器条形码序列不同于所述多个容器中的第二容器中的容器条形码化多核苷酸或其扩增子的容器条形码序列。
18.如权利要求1-17中任一项所述的方法,其中所述序列信息包括TCR多核苷酸容器条形码序列读段和寡核苷酸容器条形码序列读段。
19.如权利要求1或6-18中任一项所述的方法,其中所述方法还包括在所述接触后获得富集的T细胞群体,所述富集的T细胞群体包含比在所述接触后所述多个T细胞中与pMHC-寡核苷酸缀合物分子结合的T细胞的百分比更高的与pMHC-寡核苷酸缀合物分子结合的T细胞的百分比。
20.如权利要求1-19中任一项所述的方法,其中所述方法还包括确定与单个细胞结合的pMHC-寡核苷酸缀合物分子的数目。
21.如权利要求1-20中任一项所述的方法,其中所述pMHC-寡核苷酸缀合物的所述寡核苷酸部分包括四聚体分子条形码(TMB)序列,所述四聚体分子条形码(TMB)序列对所述多个pMHC-寡核苷酸缀合物分子中的单个pMHC-寡核苷酸缀合物分子是独特的。
22.如权利要求21中任一项所述的方法,其中所述序列信息包括四聚体分子条形码序列读段。
23.如权利要求21或22所述的方法,其中与所述单个T细胞结合的pMHC-寡核苷酸缀合物分子的数目从所述序列信息确定。
24.如权利要求21-23中任一项所述的方法,其中与所述单个T细胞结合的pMHC-寡核苷酸缀合物分子的数目从所述四聚体分子条形码序列读段确定。
25.如权利要求21-24中任一项所述的方法,其中所述多个pMHC-寡核苷酸缀合物分子中的每个pMHC-寡核苷酸缀合物分子包含独特的TMB序列。
26.如权利要求1-25中任一项所述的方法,其中所述pMHC-寡核苷酸缀合物的所述pMHC部分包含所述pMHC的多聚体,任选地所述pMHC的四聚体。
27.如权利要求1-26中任一项所述的方法,其中所述MHC呈可溶形式。
28.如权利要求1-27中任一项所述的方法,其中所述pMHC-寡核苷酸缀合物的所述pMHC部分的肽包括合成肽。
29.如权利要求1-28中任一项所述的方法,其中所述pMHC部分与所述单个T细胞的T细胞受体(TCR)结合。
30.如权利要求1-29中任一项所述的方法,其中所述寡核苷酸部分包括四聚体识别序列(TID)。
31.如权利要求30所述的方法,其中所述TID被条形码化地加至所述pMHC-寡核苷酸缀合物的所述肽或所述pMHC部分。
32.如权利要求1-31中任一项所述的方法,其中所述容器条形码化多核苷酸来自所述容器中的模板容器条形码化多核苷酸。
33.如权利要求1-32中任一项所述的方法,其中所述方法还包括基于所述序列信息确定所述容器中的所述单个T细胞的特征。
34.如权利要求33所述的方法,其中所述序列信息包括所述四聚体识别(TID)序列或其互补物和/或包括具有所述TID序列的分子的拷贝数。
35.如权利要求1-34中任一项所述的方法,其中所述方法还包括在所述接触后洗涤所述多个T细胞。
36.如权利要求1或6-35中任一项所述的方法,其中所述方法还包括分离所述容器中的所述单个T细胞。
37.如权利要求36所述的方法,其中在所述分离之前,所述单个T细胞与所述pMHC-寡核苷酸缀合物结合。
38.如权利要求1-37中任一项所述的方法,其中所述方法还包括裂解所述单个T细胞。
39.如权利要求38所述的方法,其中所述裂解是在所述单个T细胞在所述容器中分离之后。
40.如权利要求1-39中任一项所述的方法,其中所述多个T细胞是多个未分选的T细胞。
41.如权利要求1-40中任一项所述的方法,其中所述多个容器中的第一容器中的容器条形码化多核苷酸或其互补物的容器条形码序列不同于所述多个容器中的第二容器中的容器条形码化多核苷酸或其互补物的容器条形码序列。
42.如权利要求1-41中任一项所述的方法,其中所述多个容器中的单个容器中的每个容器条形码化多核苷酸或其互补物的容器条形码序列包含相同的容器条形码序列。
43.如权利要求1-42中任一项所述的方法,其中所述多个容器中的任何单个容器中的每个容器条形码化多核苷酸或其互补物的容器条形码序列对于所述多个容器中的任何其他单个容器中的每个容器条形码化多核苷酸或其互补物的容器条形码序列是独特的。
44.如权利要求1-43中任一项所述的方法,其中将容器条形码化多核苷酸附接至寡核苷酸部分和将容器条形码化多核苷酸附接至来自所述单个T细胞的TCR多核苷酸同时进行。
45.如权利要求1-44中任一项所述的方法,其中所述方法还包括扩增所述寡核苷酸或其互补物。
46.如权利要求1-45中任一项所述的方法,其中所述方法还包括扩增所述TCR细胞多核苷酸或其互补物。
47.如权利要求46所述的方法,其中扩增所述寡核苷酸或其互补物和扩增所述TCR多核苷酸或其互补物同时进行。
48.如权利要求44-47中任一项所述的方法,其中所述细胞多核苷酸的容器条形码序列和所述寡核苷酸的容器条形码序列相同。
49.如权利要求1-48中任一项所述的方法,其中所述方法还包括合并来自所述多个容器中的两个或更多个容器的寡核苷酸、其扩增产物或其互补物。
50.如权利要求49所述的方法,其中所述方法还包括合并来自所述多个容器中的两个或更多个容器的寡核苷酸、其扩增产物或其互补物和TCR多核苷酸或其互补物。
51.如权利要求49或50所述的方法,其中所述合并在所述测序之前。
52.如权利要求1-51中任一项所述的方法,其中所述pMHC-寡核苷酸缀合物包含多个不同的pMHC-寡核苷酸缀合物。
53.如权利要求52所述的方法,其中所述多个pMHC-寡核苷酸缀合物中的每个pMHC-寡核苷酸缀合物包含独特的四聚体识别(TID)序列。
54.如权利要求1-53中任一项所述的方法,其中所述寡核苷酸包含融合序列,并且所述附接包括将所述容器条形码化多核苷酸附接至所述融合序列。
55.如权利要求1-54中任一项所述的方法,其中所述寡核苷酸包含引物结合序列。
56.如权利要求1-55中任一项所述的方法,其中所述寡核苷酸包含恒定序列。
57.如权利要求1-56中任一项所述的方法,其中所述方法还包括分析所述寡核苷酸序列读段的容器条形码序列。
58.如权利要求1-57中任一项所述的方法,其中所述方法还包括分析所述寡核苷酸序列读段的四聚体识别(TID)序列。
59.如权利要求1-58中任一项所述的方法,其中所述方法还包括分析所述寡核苷酸序列读段的四聚体分子条形码(TMB)序列。
60.如权利要求59所述的方法,其中所述分析包括确定一个或更多个容器条形码序列、一个或更多个TID序列、一个或更多个四聚体分子条形码(TMB)序列或其组合的频率。
61.如权利要求59或60所述的方法,其中所述分析包括比较。
62.如权利要求57-61中任一项所述的方法,其中所述方法还包括比较寡核苷酸序列读段的四聚体识别(TID)序列与寡核苷酸序列读段的四聚体分子条形码(TMB)序列。
63.如权利要求44-62中任一项所述的方法,其中所述方法还包括对所述TCR多核苷酸、其互补物、其扩增产物或它们的组合测序,从而产生TCR多核苷酸序列读段。
64.如权利要求63所述的方法,其中所述方法还包括比较寡核苷酸序列读段与所述TCR多核苷酸序列读段。
65.如权利要求63或64所述的方法,其中所述方法还包括比较寡核苷酸序列读段的容器条形码序列与所述TCR多核苷酸序列读段的容器条形码序列。
66.如权利要求63-65中任一项所述的方法,其中所述方法还包括比较所述TCR多核苷酸序列读段。
67.如权利要求63-66中任一项所述的方法,其中所述方法还包括分析所述TCR多核苷酸序列读段的容器条形码序列。
68.如权利要求63-67中任一项所述的方法,其中所述方法还包括分析所述TCR多核苷酸序列读段的分子条形码序列。
69.如权利要求63-68中任一项所述的方法,其中所述方法还包括基于所述分析或所述比较来确定细胞的特征。
70.如权利要求57-69中任一项所述的方法,其中所述方法还包括基于所述寡核苷酸序列读段选择TCR。
71.如权利要求63-70中任一项所述的方法,其中所述方法还包括基于所述TCR多核苷酸序列读段选择TCR。
72.如权利要求1-71中任一项所述的方法,其中附接至所述寡核苷酸的所述容器条形码化多核苷酸和附接至所述TCR多核苷酸的所述容器条形码化多核苷酸来自所述容器中的相同的模板容器条形码化多核苷酸。
73.如权利要求1-72中任一项所述的方法,其中附接至所述寡核苷酸的所述容器条形码化多核苷酸是模板容器条形码化多核苷酸的扩增产物。
74.如权利要求72或73所述的方法,其中附接至所述TCR多核苷酸的所述容器条形码化多核苷酸是所述模板容器条形码化多核苷酸的扩增产物。
75.如权利要求1-74中任一项所述的方法,其中所述容器包含固体支持体。
76.如权利要求1-74中任一项所述的方法,其中所述容器不包含固体支持体。
77.如权利要求1-76中任一项所述的方法,其中所述多个容器中的每个容器包含单个细胞。
78.如权利要求1-77中任一项所述的方法,其中所述容器是孔、乳液或液滴。
79.如权利要求1-78中任一项所述的方法,其中所述模板容器条形码化多核苷酸不与固体支持体结合。
80.如权利要求1-78中任一项所述的方法,其中所述模板容器条形码化多核苷酸与固体支持体结合。
81.如权利要求1-80中任一项所述的方法,其中所述方法还包括将多个分子条形码化多核苷酸中的分子条形码化多核苷酸的分子条形码序列附接至所述TCR多核苷酸,其中所述分子条形码序列被条形码化地加至单个TCR多核苷酸分子及其扩增产物。
82.如权利要求1-81中任一项所述的方法,其中所述附接包括将所述容器条形码化多核苷酸或其互补物连接至所述寡核苷酸。
83.如权利要求1-82中任一项所述的方法,其中所述附接包括用酶将所述容器条形码化多核苷酸或其互补物附接至所述寡核苷酸。
84.如权利要求1-83中任一项所述的方法,其中所述附接包括将所述容器条形码化多核苷酸或其互补物与所述寡核苷酸杂交。
85.如权利要求84所述的方法,其中所述附接还包括延伸所述寡核苷酸。
86.如权利要求1-85中任一项所述的方法,其中所述附接包括扩增模板容器条形码化多核苷酸。
87.如权利要求1-86中任一项所述的方法,其中所述寡核苷酸是双链的。
88.如权利要求1-86中任一项所述的方法,其中所述寡核苷酸是单链的。
89.如权利要求1-88中任一项所述的方法,其中所述寡核苷酸是DNA。
90.如权利要求1-88中任一项所述的方法,其中所述寡核苷酸是RNA。
91.如权利要求1-90中任一项所述的方法,其中所述细胞多核苷酸包含可变区序列。
92.如权利要求1-91中任一项所述的方法,其中所述方法还包括使含有可变区序列的天然TCR链序列配对。
93.如权利要求1-92中任一项所述的方法,其中所述TCR多核苷酸是DNA。
94.如权利要求1-93中任一项所述的方法,其中所述TCR多核苷酸是RNA。
95.如权利要求94所述的方法,其中所述RNA是mRNA。
96.一种组合物,所述组合物包含多个容器,其中所述多个容器中的容器包含
(a)来自包含多个T细胞的样品的单个T细胞,和
(b)容器条形码化多核苷酸,所述容器条形码化多核苷酸包含容器条形码序列,
其中所述容器还包含与所述单个T细胞的TCR结合的pMHC-寡核苷酸缀合物。
97.一种组合物,所述组合物包含多个容器,其中所述多个容器中的容器包含
(a)来自包含多个T细胞的样品的单个裂解的T细胞,和
(b)pMHC-寡核苷酸缀合物,所述pMHC-寡核苷酸缀合物包含与所述单个裂解的T细胞的TCR结合的pMHC部分;
其中所述pMHC-寡核苷酸缀合物的所述寡核苷酸部分包含容器条形码序列,并且其中来自所述单个裂解的T细胞的TCR多核苷酸包含相同的容器条形码序列。
CN201780072719.8A 2015-09-24 2017-01-12 亲和-寡核苷酸缀合物及其用途 Pending CN109996889A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562232209P 2015-09-24 2015-09-24
USPCT/US2016/053598 2016-09-24
PCT/US2016/053598 WO2017053905A1 (en) 2015-09-24 2016-09-24 Affinity-oligonucleotide conjugates and uses thereof
PCT/US2017/013274 WO2018057051A1 (en) 2016-09-24 2017-01-12 Affinity-oligonucleotide conjugates and uses thereof

Publications (1)

Publication Number Publication Date
CN109996889A true CN109996889A (zh) 2019-07-09

Family

ID=57121536

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201680068588.1A Active CN108291257B (zh) 2015-09-24 2016-09-24 亲和-寡核苷酸缀合物及其用途
CN201780072719.8A Pending CN109996889A (zh) 2015-09-24 2017-01-12 亲和-寡核苷酸缀合物及其用途

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201680068588.1A Active CN108291257B (zh) 2015-09-24 2016-09-24 亲和-寡核苷酸缀合物及其用途

Country Status (17)

Country Link
US (4) US11156611B2 (zh)
EP (3) EP3933047A1 (zh)
JP (2) JP6869233B2 (zh)
KR (2) KR20180085717A (zh)
CN (2) CN108291257B (zh)
AU (1) AU2016326737B2 (zh)
BR (1) BR112018005937A2 (zh)
CA (2) CA2999888C (zh)
ES (1) ES2928681T3 (zh)
IL (1) IL258248B (zh)
MX (3) MX2018003532A (zh)
MY (2) MY193806A (zh)
PH (2) PH12018500647A1 (zh)
RU (1) RU2763554C2 (zh)
SA (1) SA518391159B1 (zh)
SG (1) SG10201912906RA (zh)
WO (1) WO2017053905A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114555125A (zh) * 2019-10-25 2022-05-27 菲托尼尔斯股份有限公司 多核苷酸连接的生物缀合物及其制备和使用方法

Families Citing this family (88)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
GB2504240B (en) 2012-02-27 2015-05-27 Cellular Res Inc Compositions and kits for molecular counting of nucleic acids
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10400280B2 (en) 2012-08-14 2019-09-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20140155295A1 (en) 2012-08-14 2014-06-05 10X Technologies, Inc. Capsule array devices and methods of use
US10323279B2 (en) 2012-08-14 2019-06-18 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10273541B2 (en) 2012-08-14 2019-04-30 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10752949B2 (en) 2012-08-14 2020-08-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
US11591637B2 (en) 2012-08-14 2023-02-28 10X Genomics, Inc. Compositions and methods for sample processing
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US9701998B2 (en) 2012-12-14 2017-07-11 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10533221B2 (en) 2012-12-14 2020-01-14 10X Genomics, Inc. Methods and systems for processing polynucleotides
EP3567116A1 (en) 2012-12-14 2019-11-13 10X Genomics, Inc. Methods and systems for processing polynucleotides
WO2014124338A1 (en) 2013-02-08 2014-08-14 10X Technologies, Inc. Polynucleotide barcode generation
JP6545682B2 (ja) 2013-08-28 2019-07-17 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company 大規模並列単一細胞分析
WO2015157567A1 (en) 2014-04-10 2015-10-15 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
US11585806B2 (en) 2014-06-13 2023-02-21 Immudex Aps General detection and isolation of specific cells by binding of labeled molecules
MX2016016902A (es) 2014-06-26 2017-03-27 10X Genomics Inc Metodos para analizar acidos nucleicos de celulas individuales o poblaciones de celulas.
CN114807307A (zh) 2014-10-29 2022-07-29 10X 基因组学有限公司 用于靶核酸测序的方法和组合物
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
CN107427808B (zh) 2015-01-12 2020-10-23 10X基因组学有限公司 用于制备核酸测序文库的方法和系统以及用其制备的文库
US10697000B2 (en) 2015-02-24 2020-06-30 10X Genomics, Inc. Partition processing methods and systems
WO2016138148A1 (en) 2015-02-24 2016-09-01 10X Genomics, Inc. Methods for targeted nucleic acid sequence coverage
EP3262192B1 (en) 2015-02-27 2020-09-16 Becton, Dickinson and Company Spatially addressable molecular barcoding
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
US11390914B2 (en) 2015-04-23 2022-07-19 Becton, Dickinson And Company Methods and compositions for whole transcriptome amplification
CN108026524A (zh) 2015-09-11 2018-05-11 赛卢拉研究公司 用于核酸文库标准化的方法和组合物
EP3662930A1 (en) 2015-09-24 2020-06-10 AbVitro LLC Hiv antibody compositions and methods of use
BR112018005937A2 (pt) * 2015-09-24 2019-05-21 Abvitro Llc conjugados de oligonucleotídeo de afinidade e usos destes
ES2926495T3 (es) 2015-12-04 2022-10-26 10X Genomics Inc Métodos y composiciones para el análisis de ácidos nucleicos
WO2017197338A1 (en) 2016-05-13 2017-11-16 10X Genomics, Inc. Microfluidic systems and methods of use
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
KR102522023B1 (ko) * 2016-09-26 2023-04-17 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10011872B1 (en) 2016-12-22 2018-07-03 10X Genomics, Inc. Methods and systems for processing polynucleotides
US10815525B2 (en) 2016-12-22 2020-10-27 10X Genomics, Inc. Methods and systems for processing polynucleotides
GB201622222D0 (en) 2016-12-23 2017-02-08 Cs Genetics Ltd Reagents and methods for molecular barcoding of nucleic acids of single cells
CN117512066A (zh) 2017-01-30 2024-02-06 10X基因组学有限公司 用于基于微滴的单细胞条形编码的方法和系统
US11319583B2 (en) 2017-02-01 2022-05-03 Becton, Dickinson And Company Selective amplification using blocking oligonucleotides
WO2018174827A1 (en) 2017-03-24 2018-09-27 National University Of Singapore Methods for multiplex detection of molecules
WO2018203576A1 (ja) * 2017-05-02 2018-11-08 国立大学法人 東京大学 一細胞の非破壊的計測情報とゲノム関連情報とを一体的に検出する方法
JP6990456B2 (ja) * 2017-05-02 2022-01-12 国立大学法人 東京大学 細胞またはその由来物の動的変化のモニタリング方法およびそれを用いた細胞分類方法
JP7308187B2 (ja) * 2017-05-26 2023-07-13 アブビトロ リミテッド ライアビリティ カンパニー ハイスループットポリヌクレオチドライブラリーシーケンシングおよびトランスクリプトーム解析法
CN109526228B (zh) 2017-05-26 2022-11-25 10X基因组学有限公司 转座酶可接近性染色质的单细胞分析
US10400235B2 (en) 2017-05-26 2019-09-03 10X Genomics, Inc. Single cell analysis of transposase accessible chromatin
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
WO2019051335A1 (en) 2017-09-07 2019-03-14 Juno Therapeutics, Inc. METHODS OF IDENTIFYING CELLULAR CHARACTERISTICS RELATED TO RESPONSES ASSOCIATED WITH CELL THERAPY
WO2019099751A1 (en) 2017-11-15 2019-05-23 10X Genomics, Inc. Functionalized gel beads
EP3710594B1 (en) * 2017-11-16 2023-07-19 The Regents of The University of Colorado, A Body Corporate Methods to measure functional heterogeneity among single cells
US10829815B2 (en) 2017-11-17 2020-11-10 10X Genomics, Inc. Methods and systems for associating physical and genetic properties of biological particles
GB201801481D0 (en) * 2018-01-30 2018-03-14 Immunovia Ab Methods, conjugates and systems
EP3752832A1 (en) 2018-02-12 2020-12-23 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
EP3775271A1 (en) 2018-04-06 2021-02-17 10X Genomics, Inc. Systems and methods for quality control in single cell processing
CN112272710A (zh) 2018-05-03 2021-01-26 贝克顿迪金森公司 高通量多组学样品分析
CN112243461B (zh) 2018-05-03 2024-07-12 贝克顿迪金森公司 在相对的转录物末端进行分子条形码化
CA3099525A1 (en) * 2018-05-21 2019-11-28 The Regents Of The University Of California Single cell mapping and transcriptome analysis
WO2019236571A1 (en) * 2018-06-04 2019-12-12 Chan Zuckerberg Biohub, Inc. Compositions and methods involving non-natural aptamer libraries
WO2020072380A1 (en) 2018-10-01 2020-04-09 Cellular Research, Inc. Determining 5' transcript sequences
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
US20210395742A1 (en) * 2018-11-14 2021-12-23 University Of Hawaii Compositions and methods for the synthesis and identification of covalent aptamers
CN113195717A (zh) 2018-12-13 2021-07-30 贝克顿迪金森公司 单细胞全转录组分析中的选择性延伸
CN113302491A (zh) * 2018-12-18 2021-08-24 Mbl国际公司 pMHC占有率的链霉亲和素-寡核苷酸缀合物的组成
WO2020142724A1 (en) * 2019-01-04 2020-07-09 Cogen Immune Medicine, Inc. Peptide libraries and methods of use thereof
US11661631B2 (en) 2019-01-23 2023-05-30 Becton, Dickinson And Company Oligonucleotides associated with antibodies
JP6821230B2 (ja) * 2019-02-04 2021-01-27 国立大学法人愛媛大学 CARライブラリおよびscFvの製造方法
CN109979528B (zh) * 2019-03-28 2021-06-25 广州基迪奥生物科技有限公司 一种单细胞免疫组库测序数据的分析方法
US20200392589A1 (en) * 2019-04-02 2020-12-17 Mission Bio, Inc. Methods and systems for proteomic profiling and characterization
AU2020280104A1 (en) 2019-05-22 2022-01-20 Mission Bio, Inc. Method and apparatus for simultaneous targeted sequencing of DNA, RNA and protein
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
EP4013892A4 (en) * 2019-08-12 2023-09-20 Mission Bio, Inc. METHOD, SYSTEM AND APPARATUS FOR SIMULTANEOUS MULTI-OMIC DETECTION OF PROTEIN EXPRESSION, SINGLE NUCLEOTIDE VARIATIONS AND COPY NUMBER VARIATIONS IN THE SAME INDIVIDUAL CELLS
AU2020358975A1 (en) * 2019-10-03 2022-04-21 Regeneron Pharmaceuticals, Inc. High-throughput method to screen cognate T cell and epitope reactivities in primary human cells
JP2022550596A (ja) * 2019-10-05 2022-12-02 ミッション バイオ インコーポレイテッド シングルセルで同時に検出されるコピー数変動及び単一ヌクレオチド変動のための方法、システム、及び装置
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
CN111223532B (zh) * 2019-11-14 2023-06-20 腾讯科技(深圳)有限公司 确定目标化合物的反应物的方法、设备、装置、介质
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
JP2023518274A (ja) * 2020-03-18 2023-04-28 チャン ザッカーバーグ バイオハブ, インコーポレイテッド 単一細胞コンビナトリアルインデクシング式サイトメトリーシークエンシング(Single-Cell Combinatorial Indexed Cytometry Sequencing)
US11661625B2 (en) 2020-05-14 2023-05-30 Becton, Dickinson And Company Primers for immune repertoire profiling
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022076914A1 (en) * 2020-10-09 2022-04-14 10X Genomics, Inc. Methods and compositions for profiling immune repertoire
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
WO2022182672A1 (en) * 2021-02-23 2022-09-01 10X Genomics, Inc. Single cell glycan profiling
WO2022190733A1 (ja) * 2021-03-10 2022-09-15 ソニーグループ株式会社 生体粒子分析方法及び生体粒子分析用試薬キット
US11753677B2 (en) * 2021-11-10 2023-09-12 Encodia, Inc. Methods for barcoding macromolecules in individual cells
WO2023108000A1 (en) * 2021-12-07 2023-06-15 Fred Hutchinson Cancer Center Synthetic constructs and methods for processing antigen-specific cells
WO2023225201A1 (en) * 2022-05-20 2023-11-23 10X Genomics, Inc. Compositions and methods for characterizing t cell, or t cell-like, receptors from single cells
WO2024015378A1 (en) * 2022-07-13 2024-01-18 10X Genomics, Inc. Methods and systems for characterizing antigen-binding molecules expressed by immune cells

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014144495A1 (en) * 2013-03-15 2014-09-18 Abvitro, Inc. Single cell bar-coding for antibody discovery
WO2014145047A1 (en) * 2013-03-15 2014-09-18 Prognosys Biosciences, Inc. Methods for detecting peptide/mhc/tcr binding
WO2015185067A1 (en) * 2014-06-06 2015-12-10 Herlev Hospital Determining antigen recognition through barcoding of mhc multimers
WO2016100977A1 (en) * 2014-12-19 2016-06-23 The Broad Institute Inc. Methods for profiling the t-cel- receptor repertoire

Family Cites Families (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US5019384A (en) 1986-06-30 1991-05-28 Massachusetts Institute Of Technology Immunonodulating compositions and their use
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
DE68921982T4 (de) 1988-06-14 1996-04-25 Cetus Oncology Corp Kupplungsmittel und sterisch gehinderte, mit disulfid gebundene konjugate daraus.
US5168038A (en) 1988-06-17 1992-12-01 The Board Of Trustees Of The Leland Stanford Junior University In situ transcription in cells and tissues
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5242974A (en) 1991-11-22 1993-09-07 Affymax Technologies N.V. Polymer reversal on solid surfaces
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
DE3920358A1 (de) 1989-06-22 1991-01-17 Behringwerke Ag Bispezifische und oligospezifische, mono- und oligovalente antikoerperkonstrukte, ihre herstellung und verwendung
US5252743A (en) 1989-11-13 1993-10-12 Affymax Technologies N.V. Spatially-addressable immobilization of anti-ligands on surfaces
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5733523A (en) 1990-12-10 1998-03-31 Akzo Nobel N.V. Targeted delivery of a therapeutic entity using complementary oligonucleotides
JP3266311B2 (ja) 1991-05-02 2002-03-18 生化学工業株式会社 新規ポリペプチドおよびこれを用いる抗hiv剤
US5324633A (en) 1991-11-22 1994-06-28 Affymax Technologies N.V. Method and apparatus for measuring binding affinity
DE69233331T3 (de) 1991-11-22 2007-08-30 Affymetrix, Inc., Santa Clara Kombinatorische Strategien zur Polymersynthese
US5384261A (en) 1991-11-22 1995-01-24 Affymax Technologies N.V. Very large scale immobilized polymer synthesis using mechanically directed flow paths
US5550215A (en) 1991-11-22 1996-08-27 Holmes; Christopher P. Polymer reversal on solid surfaces
DK1136556T3 (da) 1991-11-25 2005-10-03 Enzon Inc Fremgangsmåde til fremstilling af multivalente antigen-bindende proteiner
CA2124967C (en) 1991-12-17 2008-04-08 Nils Lonberg Transgenic non-human animals capable of producing heterologous antibodies
US5491074A (en) 1993-04-01 1996-02-13 Affymax Technologies Nv Association peptides
US5837832A (en) 1993-06-25 1998-11-17 Affymetrix, Inc. Arrays of nucleic acid probes on biological chips
US5858659A (en) 1995-11-29 1999-01-12 Affymetrix, Inc. Polymorphism detection
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
US6090555A (en) 1997-12-11 2000-07-18 Affymetrix, Inc. Scanned image alignment systems and methods
US5631734A (en) 1994-02-10 1997-05-20 Affymetrix, Inc. Method and apparatus for detection of fluorescently labeled materials
US5578832A (en) 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
DE69503126T2 (de) 1994-05-05 1998-11-12 Beckman Instruments Inc Repetitive oligonukleotide matrix
US5571639A (en) 1994-05-24 1996-11-05 Affymax Technologies N.V. Computer-aided engineering system for design of sequence arrays and lithographic masks
US5795716A (en) 1994-10-21 1998-08-18 Chee; Mark S. Computer-aided visualization and analysis system for sequence evaluation
US5599695A (en) 1995-02-27 1997-02-04 Affymetrix, Inc. Printing molecular library arrays using deprotection agents solely in the vapor phase
US5635363A (en) 1995-02-28 1997-06-03 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for the detection, quantitation and purification of antigen-specific T cells
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5624711A (en) 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
SE504798C2 (sv) 1995-06-16 1997-04-28 Ulf Landegren Immunanalys och testkit med två reagens som kan tvärbindas om de adsorberats till analyten
US5968740A (en) 1995-07-24 1999-10-19 Affymetrix, Inc. Method of Identifying a Base in a Nucleic Acid
WO1997019193A2 (en) * 1995-11-21 1997-05-29 Yale University Unimolecular segment amplification and detection
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
WO1997043611A1 (en) 1996-05-16 1997-11-20 Affymetrix, Inc. Systems and methods for detection of labeled materials
EP1736554B1 (en) 1996-05-29 2013-10-09 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
ATE295427T1 (de) 1996-06-04 2005-05-15 Univ Utah Res Found Überwachung der hybridisierung während pcr
GB9703369D0 (en) 1997-02-18 1997-04-09 Lindqvist Bjorn H Process
US6620587B1 (en) 1997-05-28 2003-09-16 Discerna Limited Ribosome complexes as selection particles for in vitro display and evolution of proteins
WO1999023254A1 (en) 1997-10-31 1999-05-14 Affymetrix, Inc. Expression profiles in adult and fetal organs
US6269846B1 (en) 1998-01-13 2001-08-07 Genetic Microsystems, Inc. Depositing fluid specimens on substrates, resulting ordered arrays, techniques for deposition of arrays
US6428752B1 (en) 1998-05-14 2002-08-06 Affymetrix, Inc. Cleaning deposit devices that form microarrays and the like
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
US5936324A (en) 1998-03-30 1999-08-10 Genetic Microsystems Inc. Moving magnet scanner
CA2330673C (en) 1998-05-01 2009-05-26 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and dna molecules
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
EP1097935B1 (en) 1998-07-10 2003-12-03 Meiji Seika Kaisha Ltd. X-ray intercepting metal complexes of chlorin derivatives
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
CA2366459A1 (en) 1999-03-26 2000-10-05 Affymetrix, Inc. Universal arrays
US6582938B1 (en) 2001-05-11 2003-06-24 Affymetrix, Inc. Amplification of nucleic acids
US7306904B2 (en) 2000-02-18 2007-12-11 Olink Ab Methods and kits for proximity probing
US6686184B1 (en) 2000-05-25 2004-02-03 President And Fellows Of Harvard College Patterning of surfaces utilizing microfluidic stamps including three-dimensionally arrayed channel networks
US7902121B2 (en) 2001-07-02 2011-03-08 The Board Of Trustees Of The Leland Stanford Junior University MHC-antigen arrays for detection and characterization of immune responses
ATE290020T1 (de) 2001-08-31 2005-03-15 Avidex Ltd Löslicher t zell rezeptor
GB0127564D0 (en) 2001-11-16 2002-01-09 Medical Res Council Emulsion compositions
JP2006507921A (ja) 2002-06-28 2006-03-09 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ 流体分散のための方法および装置
US7569664B2 (en) 2002-10-09 2009-08-04 Immunocore Limited Single chain recombinant T cell receptors
US20060078893A1 (en) 2004-10-12 2006-04-13 Medical Research Council Compartmentalised combinatorial chemistry by microfluidic control
EP3616781A1 (en) 2003-04-10 2020-03-04 President and Fellows of Harvard College Formation and control of fluidic species
CN1842368B (zh) 2003-08-27 2014-05-28 哈佛大学 流体物种的电子控制
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US20050221339A1 (en) 2004-03-31 2005-10-06 Medical Research Council Harvard University Compartmentalised screening by microfluidic control
US7643818B2 (en) 2004-11-22 2010-01-05 Seven Networks, Inc. E-mail messaging to/from a mobile terminal
JP2008535644A (ja) 2005-03-04 2008-09-04 プレジデント・アンド・フエローズ・オブ・ハーバード・カレツジ 多重エマルジョンの形成のための方法および装置
US7745092B2 (en) 2005-09-13 2010-06-29 Affymetrix, Inc. Multiple step printing methods for microbarcodes
CA2636855C (en) 2006-01-11 2016-09-27 Raindance Technologies, Inc. Microfluidic devices and methods of use in the formation and control of nanoreactors
GB0600927D0 (en) * 2006-01-17 2006-02-22 Glaxosmithkline Biolog Sa Assay and materials therefor
US20070195127A1 (en) 2006-01-27 2007-08-23 President And Fellows Of Harvard College Fluidic droplet coalescence
GB0605584D0 (en) 2006-03-20 2006-04-26 Olink Ab Method for analyte detection using proximity probes
EP3031918B1 (en) 2006-05-11 2018-03-14 Raindance Technologies Inc. Microfluidic devices
WO2009014848A2 (en) 2007-06-25 2009-01-29 Affymetrix, Inc. Patterned microcodes
US8911948B2 (en) 2008-04-30 2014-12-16 Integrated Dna Technologies, Inc. RNase H-based assays utilizing modified RNA monomers
JP5539325B2 (ja) 2008-04-30 2014-07-02 インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド 修飾されたrna単量体を用いるrnアーゼhを基礎とするアッセイ
WO2010036352A1 (en) 2008-09-23 2010-04-01 Quantalife, Inc Droplet-based assay system
US10464987B2 (en) 2009-10-06 2019-11-05 Abbvie Inc. Human single-chain T cell receptors
WO2012048340A2 (en) * 2010-10-08 2012-04-12 President And Fellows Of Harvard College High-throughput immune sequencing
GB2497912B (en) * 2010-10-08 2014-06-04 Harvard College High-throughput single cell barcoding
WO2015006379A2 (en) * 2013-07-08 2015-01-15 The Trustees Of Columbia University In The City Of New York Selection of cells for elimination
JP6608368B2 (ja) * 2013-12-30 2019-11-20 アトレカ インコーポレイテッド 核酸バーコードを用いた単一細胞と関連づけられた核酸の分析方法
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
US11585806B2 (en) * 2014-06-13 2023-02-21 Immudex Aps General detection and isolation of specific cells by binding of labeled molecules
JP6672310B2 (ja) * 2014-09-15 2020-03-25 アブビトロ, エルエルシー ハイスループットヌクレオチドライブラリーシークエンシング
BR112018005937A2 (pt) * 2015-09-24 2019-05-21 Abvitro Llc conjugados de oligonucleotídeo de afinidade e usos destes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014144495A1 (en) * 2013-03-15 2014-09-18 Abvitro, Inc. Single cell bar-coding for antibody discovery
WO2014145047A1 (en) * 2013-03-15 2014-09-18 Prognosys Biosciences, Inc. Methods for detecting peptide/mhc/tcr binding
WO2015185067A1 (en) * 2014-06-06 2015-12-10 Herlev Hospital Determining antigen recognition through barcoding of mhc multimers
WO2016100977A1 (en) * 2014-12-19 2016-06-23 The Broad Institute Inc. Methods for profiling the t-cel- receptor repertoire

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FREEMAN LAN等: "《Droplet barcoding for massively parallel single-molecule deep sequencing》", 《NATURE COMMUNICATIONS》 *
KATSUYUKI SHIROGUCHI等: "《Digital RNA sequencing minimizes sequence-dependent bias and amplification noise with optimized single-molecule barcodes》", 《PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES USA》 *
PETER O KRUTZIK等: "《Fluorescent cell barcoding in flow cytometry allows high-throughput drug screening and signaling profiling》", 《NATURE METHODS》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114555125A (zh) * 2019-10-25 2022-05-27 菲托尼尔斯股份有限公司 多核苷酸连接的生物缀合物及其制备和使用方法

Also Published As

Publication number Publication date
BR112018005937A2 (pt) 2019-05-21
US11156611B2 (en) 2021-10-26
CN108291257A (zh) 2018-07-17
IL258248B (en) 2022-07-01
SG10201912906RA (en) 2020-02-27
ES2928681T3 (es) 2022-11-21
CN108291257B (zh) 2023-12-29
MX2022012937A (es) 2022-11-08
MX2019003272A (es) 2019-09-13
RU2018115247A (ru) 2019-10-24
RU2019112395A3 (zh) 2020-11-30
PH12018500647A1 (en) 2018-09-24
EP3353326B1 (en) 2022-08-24
RU2763554C2 (ru) 2021-12-30
US20200088725A1 (en) 2020-03-19
RU2018115247A3 (zh) 2020-02-19
EP3353326A1 (en) 2018-08-01
MY191035A (en) 2022-05-30
US10393743B2 (en) 2019-08-27
IL258248A (en) 2018-05-31
US20190025304A1 (en) 2019-01-24
WO2017053905A1 (en) 2017-03-30
US20170268056A1 (en) 2017-09-21
CA3037845A1 (en) 2018-03-29
KR20190052084A (ko) 2019-05-15
EP3516069A1 (en) 2019-07-31
JP6869233B2 (ja) 2021-05-12
EP3933047A1 (en) 2022-01-05
US20220065856A1 (en) 2022-03-03
SA518391159B1 (ar) 2022-02-22
KR20180085717A (ko) 2018-07-27
MX2018003532A (es) 2019-04-25
EP3516069B1 (en) 2023-10-11
MY193806A (en) 2022-10-27
PH12019500627A1 (en) 2019-08-05
RU2019112395A (ru) 2020-10-26
JP2018535652A (ja) 2018-12-06
AU2016326737A1 (en) 2018-04-12
CA2999888A1 (en) 2017-03-30
US11061030B2 (en) 2021-07-13
AU2016326737B2 (en) 2023-01-12
CA2999888C (en) 2024-04-09
JP7282121B2 (ja) 2023-05-26
JP2021118704A (ja) 2021-08-12

Similar Documents

Publication Publication Date Title
CN109996889A (zh) 亲和-寡核苷酸缀合物及其用途
US20210293812A1 (en) High throughput process for t cell receptor target identification of natively-paired t cell receptor sequences
ES2926722T3 (es) Secuenciación de alto rendimiento de biblioteca de polinucleótidos y análisis de transcriptoma
JP6929354B2 (ja) 親和性−オリゴヌクレオチドコンジュゲートおよびその使用
RU2778754C2 (ru) Конъюгаты аффинная часть-олигонуклеотид и их применения

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190709

WD01 Invention patent application deemed withdrawn after publication