CN110249060A - 用于免疫组库测序的组合物和方法 - Google Patents

用于免疫组库测序的组合物和方法 Download PDF

Info

Publication number
CN110249060A
CN110249060A CN201880006791.5A CN201880006791A CN110249060A CN 110249060 A CN110249060 A CN 110249060A CN 201880006791 A CN201880006791 A CN 201880006791A CN 110249060 A CN110249060 A CN 110249060A
Authority
CN
China
Prior art keywords
primer
gene
sequence
immunity receptor
primers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880006791.5A
Other languages
English (en)
Inventor
T·罗尼
G·洛曼
L·林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Inc
Life Technologies Corp
Original Assignee
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Inc filed Critical Life Technologies Inc
Publication of CN110249060A publication Critical patent/CN110249060A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/70503Immunoglobulin superfamily
    • C07K14/7051T-cell receptor (TcR)-CD3 complex
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开提供了用于确定和评估免疫组库的方法、组合物、试剂盒和系统。在一方面,靶特异性引物组提供了对T细胞受体和/或B细胞受体链序列的有效扩增,其具有相对于所述组库改进的测序精确度和分辨率。解析与免疫细胞受体相关的可变区以有效地描绘生物样品的克隆多样性和/或与生物样品的免疫细胞组库相关的差异。

Description

用于免疫组库测序的组合物和方法
相关申请的交叉引用
本申请要求2017年11月14日提交的美国临时申请62/586,099、2017年9月1日提交的美国临时申请62/533,736、2017年7月31日提交的美国临时申请62/539,409、2017年3月31日提交的美国临时申请62/480,227和2017年1月17日提交的美国临时申请62/447,348的优先权和权益。每个前述申请的内容通过引用完整并入本文。
背景技术
适应性免疫应答包括识别抗原的B细胞和T细胞的选择性应答。编码抗体(Ab,B细胞中)和T细胞受体(TCR,T细胞中)抗原受体的免疫球蛋白基因包含复杂基因座,其中由于各自变量(V)、多样性(D)和连接(J)基因区段的重组,以及随后的早期淋巴分化期间的体细胞超突变事件而产生广泛的受体多样性。对于每种受体的两个亚基链分别发生重组过程,随后的异二聚体配对产生更大的组合多样性。已经估计有助于人免疫受体组库的潜在组合和连接可能性的计算,可能性的数量大大超过个体中外周B或T细胞的总数。参见,例如,Davis和Bjorkman(1988)Nature 334:395-402;Arstila等,(1999)Science 286:958-961;van Dongen等,In:Leukemia,Henderson等(编辑)Philadelphia:WB Saunders Company,2002,第85–129页。
多年来已经进行了广泛的努力以便以高分辨率改进免疫组库的分析。用于特异性检测和监测淋巴细胞的扩增克隆的方法将为表征和分析正常和致病性免疫反应和应答提供重要机会。尽管付出了努力,但有效的高分辨率分析提供了挑战。诸如Sanger测序的低通量技术可提供分辨率,但仅限于提供广泛捕获整个免疫组库的有效手段。最近在下一代测序(NGS)方面取得的进展提供了捕获所有组库的途径,然而,由于众多相关序列的性质和该技术引起的序列错误的引入,已证明真实库的有效率的和有效的反映是困难的。因此,越来越多地寻求用于有效分析大量免疫细胞受体的新方法以更好地理解免疫细胞应答、增强诊断能力并设计新的治疗方法。因此,仍然需要能够解析高度可变的免疫细胞受体序列的复杂群体的改进的测序方法和工作流程。
发明内容
在本发明的一个方面,提供用于单流确定样品中的免疫组库的组合物。在一些实施方案中,所述组合物包含至少一组引物i)和ii),其中i)由针对免疫受体编码序列的大多数不同可变区的多个可变(V)基因引物组成;和ii)由针对相应免疫受体编码序列的相应靶恒定区的至少一部分的一个或多个恒定(C)基因引物组成。在一些实施方案中,所述组合物包含至少一组引物i)和ii),其中i)由针对免疫受体编码序列的大多数不同可变(V)基因的多个V基因引物组成;和ii)由针对相应靶免疫受体编码序列的大多数不同连接(J)基因的多个J基因引物组成。在一些实施方案中,用于分析样品中免疫组库的组合物包含至少一组引物i)和ii),其中i)由(a)多个V基因引物或(b)多个V基因引物组成,(a)多个V基因引物针对包含V基因内至少一部分框架区1(FR1)的至少一个免疫受体编码序列的大多数不同V基因,(b)多个V基因引物针对包含V基因内至少一部分框架区3(FR3)的至少一个免疫受体编码序列的大多数不同V基因;和ii)由(a)一个或多个C基因引物或(b)多个J基因引物组成,所述C基因引物针对所述至少一个免疫受体编码序列的C基因的至少一部分,所述J基因引物针对所述至少一个免疫受体编码序列的大多数不同J基因的至少一部分;其中针对相同靶免疫受体基因的编码序列的每组i)和ii)引物选自T细胞受体或抗体受体;并且其中针对相同靶免疫受体的每组i)和ii)引物配置成扩增靶免疫受体组库。
在一些实施方案中,V基因引物识别V基因内的框架区1(FR1)的至少一部分。在一些实施方案中,V基因引物识别V基因内的框架区2(FR2)的至少一部分。在一些实施方案中,V基因引物识别V基因内的框架区3(FR3)的至少一部分。每组i)和ii)引物针对选自T细胞受体和抗体受体的相同靶免疫受体序列,并配置成使得使用此类组合物产生的所得扩增子代表样品中各自受体的序列组库。在特定实施方案中,提供的组合物包括选自表2和表4的多种引物对试剂。在特定实施方案中,提供的组合物包括选自表3和表4的多种引物对试剂。在特定实施方案中,提供的组合物包括选自表2和表5的多种引物对试剂。在特定实施方案中,提供的组合物包括选自表3和表5的多种引物对试剂。在特定实施方案中,提供的组合物包括选自表4和表6或选自表5和表6的多种引物对试剂。在一些实施方案中,提供了包含本发明组合物的多重测定。在一些实施方案中,提供了包含本发明组合物的测试试剂盒。
在本发明的其他方面,提供了用于确定生物样品中的免疫组库活性的方法。此类方法包括从含有靶免疫受体序列的生物样品中进行多个靶表达序列的多重扩增。在一些实施方案中,扩增包括使用包含i)和ii)的至少一组引物接触包含多个目标靶序列的至少一部分样品,其中i)包含针对至少一个免疫受体编码序列的大多数不同可变区的多个V基因靶特异性引物,和ii)包含针对所述免疫受体编码序列的相应靶恒定区的至少一部分的一个或多个C基因靶特异性引物。在一些实施方案中,扩增包括使用包含i)和ii)的至少一组引物接触包含多个目标靶序列的至少一部分样品,其中i)包含针对至少一个免疫受体编码序列的大多数不同V基因的多个V基因靶特异性引物,和ii)包含针对相应靶免疫受体编码序列的大多数不同J基因的多个-J基因引物。每组引物i)和ii)针对相同靶免疫受体编码序列,其中每个靶免疫受体选自T细胞受体或抗体受体序列,并且使用每一个或多个组进行扩增产生扩增子序列,其代表目标样品中相应免疫受体的全部组库序列。在某些实施方案中,方法包括扩增样品中免疫受体组库的表达核酸序列,包括在扩增条件下在聚合酶存在下进行多重扩增反应,以产生包含具有可变、多样性、连接和恒定(VDJC)基因部分的一种或多种目标免疫受体或具有可变、连接和恒定的(VJC)基因部分的一种或多种目标免疫受体的多个扩增的靶表达序列。
在一些实施方案中,用于扩增样品中免疫受体组库的表达核酸序列的方法包括使用以下至少一组进行单一多重扩增反应以扩增表达的靶免疫受体核酸模板分子:
i)(a)多个V基因引物,其针对包含V基因内的框架区1(FR1)的至少一部分的至少一种免疫受体编码序列的大多数不同V基因,
(b)多个V基因引物,其针对包含V基因内的框架区2(FR2)的至少一部分的至少一种免疫受体编码序列的大多数不同V基因,或
(c)多个V基因引物,其针对包含V基因内的框架区3(FR3)的至少一部分的至少一种免疫受体编码序列的大多数不同V基因;和
ii)(a)一种或多种C基因引物,其针对至少一种免疫受体编码序列的C基因的至少一部分,或
(b)多个J基因引物,其针对至少一种免疫受体编码序列的大多数不同J基因的至少一部分;
其中每组i)和ii)引物针对选自T细胞受体基因或抗体受体基因的相同靶免疫受体基因的编码序列,并且其中使用至少一组i)和ii)引物进行扩增产生代表样品中的靶免疫受体组库的扩增子分子;从而产生包含靶免疫受体组库的免疫受体扩增子分子。
在某些实施方案中,免疫受体序列的V基因的第一框架区(FR1)的至少一部分至C基因的至少一部分包含在扩增的靶免疫受体序列内。在某些实施方案中,免疫受体序列的V基因的第二框架区(FR2)的至少一部分至C基因的至少一部分包含在扩增的靶免疫受体序列内。在某些实施方案中,免疫受体序列的V基因的第三框架区(FR3)的至少一部分至C基因的至少一部分包含在扩增的靶免疫受体序列内。在其他实施方案中,方法包括扩增样品中免疫受体组库的表达核酸序列,包括在扩增条件下在聚合酶存在下进行多重扩增反应,以产生包含具有可变、多样性和连接(VDJ)基因部分的一种或多种目标免疫受体或具有可变和连接(VJ)基因部分的一种或多种目标免疫受体的多个扩增的靶表达序列。在某些实施方案中,免疫受体序列的V基因的第一框架区(FR1)的至少一部分至连接(J)基因的至少一部分包含在扩增的靶免疫受体序列内。在某些实施方案中,免疫受体序列的V基因的第二框架区(FR2)的至少一部分至连接(J)基因的至少一部分包含在扩增的靶免疫受体序列内。在某些实施方案中,免疫受体序列的V基因的第三框架区(FR3)的至少一部分至连接(J)基因的至少一部分包含在扩增的靶免疫受体序列内。
本发明的方法还包括通过将衔接子序列引入扩增的靶序列的末端,使用扩增的靶免疫受体序列制备免疫受体组库文库。在一些实施方案中,衔接子修饰的免疫受体组库文库被克隆扩增。
该方法还包括检测样品中每种免疫受体的免疫组库的序列和/或多种靶免疫受体序列中每一种的表达,其中与第二样品或对照样品相比,组库序列和/或一种或多种靶免疫受体标记物的表达的水平的变化确定了样品中免疫组库活性的变化。在某些实施方案中,使用下一代序列分析进行免疫受体扩增子分子的测序以确定免疫受体扩增子的序列。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,比对和鉴定生产性读段(productive read)并校正错误以产生拯救的生产性读段并确定所得总生产性读段的序列,从而提供样品中免疫组库的序列。本文描述的提供的方法使用本文提供的本发明的组合物。在本发明的其他方面,提供了用于校正错误的特定分析方法,以便从本文提供的方法生成全面、有效的序列信息。
附图说明
图1是使用分步聚类相似CDR3核苷酸序列来去除PCR或测序衍生的错误的示例性工作流程图,步骤为:(A)基于相似性(cd-hit-est)非常快速的启发式聚类成组;(B)聚类被选为最常见的序列、随机挑选用于平局的代表;(C)合并读段入代表;(D)比较代表,并且如果在分配的汉明距离内,则合并聚类。
图2是通过使用Levenshtein距离比较均聚物塌陷的CDR3序列来消除残留插入/缺失(indel)错误的示例性工作流程图,步骤为:(A)塌缩均聚物并计算聚类代表之间的Levenshtein距离;(b)合并现在聚类在一起的读段,这些表示复杂的插入缺失错误;(C)向用户报告谱系。
图3A-3C描绘了使用本文提供的方法和组合物对来自10质粒库TRB文库的TCRβ(TRB)组库进行测序的分析概述。结果描述了约1700万原始读段深度的测序。图3A描绘了通过文库序列过程的样品的特征;图3B描绘了所得的读长度;和图3C描绘了读段的数量和读段质量的表征(生产性/拯救的生产性/非生产性/关闭靶-短)的结果。
图4A-4B描绘了使用三种不同方法比较来自用于测序的相同外周血单核细胞RNA样品的TCR V基因使用表征的相关图:单引物5'-RACE、目前提供的引物和工作流、以及BIOMED-2引物组。图4A描绘了比较用于样品制备的5'-RACE和BIOMED-2引物组的TCR V基因使用的相关图。图4B描绘了比较5'-RACE和目前提供的引物的TCR V基因使用的相关性图以及用于样品制备的工作流程。
图5描绘了比较来自六个肿瘤浸润淋巴细胞(TIL)样品的测序重复的图。六个样品来自在单个Ion Torrent S5 530TM芯片上测序的总共十个TIL样品。
图6是比较来自患有肺鳞状细胞癌的个体的外周血中的TCR克隆频率(x轴)和肿瘤中的TCR克隆频率(y轴)的图。TCRβ免疫组库的测序鉴定了外周血和肿瘤之间共享的219个TCR克隆和肿瘤特有的370个TCR克隆。
图7是比较10个对照质粒库的输入质粒(x轴)与观察到的V基因频率(y轴)的量的图。给定量的质粒中的每个符号代表库中的不同质粒。该图显示了测定的检测限和线性。
图8描绘了显示在等摩尔浓度大小的30个对照质粒的库中质粒检测的线性的图。菱形符号表示使用完整质粒的结果,虚线表示使用线性化质粒的结果。
图9描绘示出从等摩尔浓度的30个对照质粒与白细胞cDNA混合的库产生的TCRβ文库中质粒检测的线性的图。与质粒ID号相关的质粒如表12所示。
具体实施方式
我们开发了多重下一代测序工作流程,用于有效检测和分析样品中的免疫组库。提供的方法、组合物、系统和试剂盒在受试者中监测和分辨复杂免疫细胞中用于免疫细胞受体序列(例如T细胞受体(TCR)、B细胞受体(BCR或Ab)靶标)的高精度扩增和测序。在某些实施方案中,本公开提供了使用核酸扩增(例如聚合酶链反应(PCR))来富集免疫受体靶核酸的表达可变区用于后续测序的方法、组合物和系统。在某些实施方案中,本公开还提供了用于有效鉴定和去除扩增或测序衍生的错误的方法和系统,以提高读段指定准确度并降低假阳性率。具体地,本文描述的提供的方法可以改善核苷酸序列与基因组重组和高可变性相关的测序应用中的准确度和性能。在一些实施方案中,本文提供的方法、组合物、系统和试剂盒用于扩增和测序样品中表达的免疫受体的互补决定区。因此,本文提供了用于多重文库制备的多重免疫细胞受体表达组合物,与下一代测序技术和工作流程解决方案(例如,手动或自动化)结合使用,用于样品中免疫组库的有效检测和表征。
TCR或BCR的互补决定区(CDR)由经历V(D)J基因区段的重组的基因组DNA以及基因区段连接处的核苷酸的添加和/或缺失产生。由于VDJ重组的随机性质,通常情况是T或B细胞受体基因组DNA的重排将不能产生功能性受体,而是产生所谓的“非生产性”重排。通常,非生产性重排具有框外可变和连接编码区段,并导致过早终止密码子的存在和无关肽的合成。然而,由于许多生物学或生理学原因,非生产性TCR或BCR基因重排在基于cDNA的组库测序中通常是罕见的,所述原因例如:1)无义介导的衰变,其破坏含有过早终止密码子的mRNA,2)B和T细胞选择,其中只有具有功能性受体的B和T细胞存活,和3)等位基因排除,其中在任何给定的B或T细胞中仅表达单个重排的受体等位基因。
因此,在一些实施方案中,提供了用于扩增免疫细胞受体mRNA例如TCR和BCR mRNA的重组表达可变区的方法和组合物。在一些实施方案中,从生物样品中提取的RNA转化为cDNA。多重扩增用于富集TCR或BCR cDNA的一部分,其包括受体可变区的至少一部分。在一些实施方案中,扩增的cDNA包括靶受体的一个或多个互补决定区CDR1、CDR2和/或CDR3。在一些实施方案中,扩增的cDNA包括TCRβ的一个或多个互补决定区CDR1、CDR2和/或CDR3。
TCR和BCR序列也可能表现为扩增反应期间或测序过程中引入的错误的非生产性重排。例如,靶扩增或测序反应期间的插入或缺失(indel)错误可导致所得编码序列的阅读框中的移码。这种改变可能导致生产性重排的靶序列读段被解释为非生产性重排并从所鉴定的克隆型的组中丢弃。因此,在一些实施方案中,所提供的方法和系统包括用于从确定的免疫受体序列中鉴定和/或去除PCR或测序衍生的错误的方法。
如本文所用,“免疫细胞受体”和“免疫受体”可互换使用。
如本文所用,术语“互补决定区”和“CDR”是指T细胞受体或抗体的区域,其中分子补充抗原的构象,从而确定分子的特异性和与特定抗原的接触。在T细胞受体和抗体的可变区中,CDR散布有更保守的区域,称为框架区(FR)。T细胞受体和抗体的每个可变区含有3个CDR,称为CDR1、CDR2和CDR3,还含有4个框架子区,命名为FR1、FR2、FR3和FR4。
如本文所用,术语“框架”或“框架区”或“FR”是指除本文定义的CDR残基之外的可变区的残基。构成框架的有四个独立的框架子区:FR1、FR2、FR3和FR4。
本领域中对于受体分子(TCR或免疫球蛋白)内CDR和FR的确切位置的具体名称根据所采用的定义而变化。除非另外特别说明,否则本文使用IMGT名称来描述CDR和FR区域(参见Brochet等人(2008)Nucleic Acids Res.36:W503-508,在此特别引入作为参考)。作为CDR/FR氨基酸名称的一个实例,构成T细胞受体β的FR和CDR的残基已经通过IMGT表征如下:残基1-26(FR1)、27-38(CDR1)、39-55(FR2)、56-65(CDR2)、66-104(FR3)、105-117(CDR3)和118-128(FR4)。
用于描述所述区域的其他众所周知的标准名称包括在Kabat等人,(1991)Sequences of Proteins of Immunological Interest,5th Ed.Public Health Service,National Institutes of Health,Bethesda,Md.以及Chothia和Lesk(1987)J.Mol.Biol.196:901-917中发现的那些;在此特别引入作为参考。作为CDR命名的一个实例,构成六种免疫球蛋白CDR的残基已由Kabat表征如下:轻链可变区中的残基24-34(CDRL1)、50-56(CDRL2)和89-97(CDRL3),和重链可变区中的31-35(CDRH1)、50-65(CDRH2)和95-102(CDRH3);由Chothia表征如下:轻链可变区中残基26-32(CDRL1)、50-52(CDRL2)和91-96(CDRL3),和重链可变区中的26-32(CDRH1)、53-55(CDRH2)和96-101(CDRH3)。
本文所用的术语“T细胞受体”或“T细胞抗原受体”或“TCR”是指脊椎动物例如哺乳动物的抗原/MHC结合异二聚体蛋白质产物,TCR基因复合物,包括人TCRα、β、γ和δ链。例如,已经对人TCRβ基因座的完整序列进行了测序,参见例如Rowen等(1996)Science 272:1755-1762;已经对人TCRα基因座进行了测序和重新测序,参见,例如,Mackelprang等(2006)HumGenet。119:255-266;以及关于T细胞受体V基因片段家族的一般分析,参见例如Arden(1995)Immunogenetics 42:455-500;其中的每一篇都通过引用具体地并入本文中用于在出版物中提供和引用的序列信息。
如本文所用,术语“抗体”或“免疫球蛋白”或“B细胞受体”或“BCR”意指由通过二硫键相互连接的四条多肽链(两条重(H)链和两条轻(L)链)(λ或κ)组成的免疫球蛋白分子。抗体具有与其结合的已知特异性抗原。抗体的每条重链由重链可变区(本文中缩写为HCVR、HV或VH)和重链恒定区组成。重链恒定区由三个结构域CH1、CH2和CH3组成。每条轻链由轻链可变区(本文缩写为LCVR或VL或KV或LV以指定κ或λ轻链)和轻链恒定区组成。轻链恒定区由一个结构域CL组成。
TCR链CDR的多样性通过种系可变区(V)、多样性(D)和连接(J)基因区段的重组以及在TCR基因重排的过程中在每个基因区段连接处的核苷酸的独立添加和缺失而产生。例如,在编码TCRβ和TCRδ的核酸中,在V基因区段中发现CDR1和CDR2,并且CDR3包括一些V基因区段以及D和J基因区段。在编码TCRα和TCRγ的核酸中,在V基因区段中发现CDR1和CDR2,并且CDR3包括一些V基因区段以及J基因区段。在编码BCR重链的重排DNA中,在V基因区段中发现CDR1和CDR2,并且CDR3包括一些V基因区段以及D和J基因区段。在编码BCR轻链的重排DNA中,在V基因区段中发现CDR1和CDR2,并且CDR3包括一些V基因区段以及J基因区段。
在一些实施方案中,多重扩增反应用于扩增源自重排的TCR或BCR基因组DNA表达的mRNA的cDNA。在一些实施方案中,多重扩增反应用于从衍生自生物样品的cDNA扩增TCR或BCR CDR的至少一部分。在一些实施方案中,多重扩增反应用于从衍生自生物样品的cDNA扩增TCR或BCR的至少两个CDR。在一些实施方案中,多重扩增反应用于从衍生自生物样品的cDNA扩增TCR或BCR的至少三个CDR。在一些实施方案中,所得扩增子用于确定样品中表达的TCR或BCR CDR的核苷酸序列。在一些实施方案中,确定包含至少3个CDR的此类扩增子的核苷酸序列用于鉴定和表征新的TCR或BCR等位基因。在一些实施方案中,确定包含至少3个CDR的此类扩增子的核苷酸序列用于鉴定和表征新的TCR或BCR等位基因。
在多重扩增反应中,使用的每个引物组靶向相同的TCR或BCR区域,然而该组中的不同引物允许靶向基因的不同V(D)J基因重排。例如,用于扩增表达的TCRβ的引物组均设计成靶向来自TCRβmRNA的相同区域,但该组中的各个引物导致各种TCRβVDJ基因组合的扩增。在一些实施方案中,至少一个引物或引物组针对免疫受体基因的相对保守区域(例如,C基因的一部分),而另一个引物组包括针对相同基因的更可变区域(例如,V基因的一部分)的多种引物。在其他实施方案中,至少一个引物组包括针对免疫受体基因的至少一部分J基因区段的多种引物,而另一引物组包括针对相同基因的至少一部分V基因区段的多种引物。
在一些实施方案中,用设计用于产生扩增子的引物组进行多重扩增反应,所述扩增子包括靶免疫受体的表达的CDR1、CDR2和/或CDR3区。在一些实施方案中,使用:(i)一组引物,其中每个引物针对V基因的框架区FR1的至少一部分,和(ii)针对靶免疫受体的C基因的一部分的至少一个引物,进行多重扩增反应。在其他实施方案中,使用:(i)一组引物,其中每个引物针对V基因的框架区FR2的至少一部分,和(ii)针对靶免疫受体的C基因的一部分的至少一个引物,进行多重扩增反应。在其他实施方案中,使用:(i)一组引物,其中每个引物针对V基因的框架区FR3的至少一部分,和(ii)针对靶免疫受体的C基因的一部分的至少一个引物,进行多重扩增反应。在一些实施方案中,针对C基因的引物针对在C基因的5'末端的约200个核苷酸内的C基因编码序列。在一些实施方案中,针对C基因的引物针对在C基因的5'末端的约150个核苷酸内的C基因编码序列。在一些实施方案中,针对C基因的引物针对在C基因的5'末端的约100个核苷酸内的C基因编码序列。在一些实施方案中,针对C基因的引物针对在C基因的5'末端的约50个核苷酸内、约50-150个核苷酸内、约75-175个核苷酸内、或约100-200个核苷酸内的C基因编码序列。
在一些实施方案中,使用:(i)一组引物,其中每个引物针对V基因的框架区FR1的至少一部分,和(ii)一组引物,其中每个引物针对靶免疫受体的J基因的至少一部分,进行多重扩增反应。在其他实施方案中,使用:(i)一组引物,其中每个引物针对V基因的框架区FR2的至少一部分,和(ii)一组引物,其中每个引物针对靶免疫受体的J基因的至少一部分,进行多重扩增反应。在其他实施方案中,使用:(i)一组引物,其中每个引物针对V基因的框架区FR3的至少一部分,和(ii)一组引物,其中每个引物针对靶免疫受体的J基因的至少一部分,进行多重扩增反应。
在一些实施方案中,多重扩增反应用于扩增源自重排的TCR基因组DNA表达的mRNA的cDNA,包括重排的TCRβ、TCRα、TCRγ和TCRδ基因组DNA。在一些实施方案中,在多重扩增反应中从cDNA扩增TCR CDR的至少一部分,例如CDR3。在一些实施方案中,在多重扩增反应中从cDNA扩增TCR的至少两个CDR部分。在一些实施方案中,多重扩增反应用于至少扩增TCRcDNA的CDR1、CDR2和CDR3区。在一些实施方案中,所得扩增子用于确定表达的TCR CDR核苷酸序列。
在一些实施方案中,多重扩增反应使用:(i)一组引物,其中每个引物与V基因FR1区的至少一部分退火,和(ii)至少一个引物,其与恒定(C)基因的一部分退火以扩增TCRcDNA,使得所得的扩增子包括TCR mRNA的CDR1、CDR2和CDR3编码部分。在某些实施方案中,将针对FR1的引物组与一组至少两个针对C基因的引物组合以产生扩增子,所述扩增子至少包括TCR mRNA的CDR1、CDR2和CDR3编码部分。例如,表2中显示了对TCRβ(TRB)V基因FR1区特异的示例性引物,并且表4中显示了对TRB C基因特异的示例性引物。
在一些实施方案中,多重扩增反应使用:(i)一组引物,其中每个引物与V基因FR2区的至少一部分退火,和(ii)至少一个引物,其与C基因的一部分退火以扩增TCR cDNA,使得所得的扩增子包括TCR mRNA的CDR2和CDR3编码部分。在某些实施方案中,将这种针对FR2的引物组与至少两个针对C基因的引物组合以产生扩增子,所述扩增子包括TCR mRNA的CDR2和CDR3编码部分。示例性针对FR2的引物包括由欧洲学术实验室和研究医院的联盟开发和标准化的BIOMED-2引物(van Dongen等人(2003)Leukemia 17:2257-2327)并显示在表6中。表4中显示了对TRB C基因特异的示例性引物。
在一些实施方案中,多重扩增反应使用:(i)一组引物,其中每个引物与V基因FR3区的至少一部分退火,和(ii)至少一个引物,其与C基因的一部分退火以扩增TCR cDNA,使得所得的扩增子主要包括TCR mRNA的CDR3编码部分。在某些实施方案中,将这种针对FR3的引物组与至少两个针对C基因的引物组合以产生扩增子,所述扩增子具有TCR mRNA的CDR3编码部分。例如,表3中显示了对TCRβ(TRB)V基因FR3区特异的示例性引物,并且表4中显示了对TRB C基因特异的示例性引物。
在一些实施方案中,多重扩增反应使用:(i)一组引物,其中每个引物与V基因FR1区的至少一部分退火,和(ii)一组引物,其与J基因的一部分退火以扩增TCR cDNA,使得所得的扩增子包括TCR mRNA的CDR1、CDR2和CDR3编码部分。例如,表2中显示了对TCRβ(TRB)V基因FR1区特异的示例性引物,并且表5中显示了对TRB J基因特异的示例性引物。
在一些实施方案中,多重扩增反应使用:(i)一组引物,其中每个引物与V基因FR2区的至少一部分退火,和(ii)一组引物,其与J基因的一部分退火以扩增TCR cDNA,使得所得的扩增子包括TCR mRNA的CDR2和CDR3编码部分。例如,表6中显示了对TRBV基因FR2区特异的示例性引物,并且表5中显示了对TRB J基因特异的示例性引物。
在一些实施方案中,多重扩增反应使用:(i)一组引物,其中每个引物与V基因FR3区的至少一部分退火,和(ii)一组引物,其与J基因的一部分退火以扩增TCR cDNA,使得所得的扩增子主要包括TCR mRNA的CDR3编码部分。例如,表3中显示了对TRB V基因FR3区特异的示例性引物,并且表5中显示了对TRB J基因特异的示例性引物。
在一些实施方案中,提供了用于多重扩增表达的TCR或BCR可变区的至少一部分的组合物。在一些实施方案中,所述组合物包含针对选自TCRβ、TCRα、TCRγ、TCRδ、免疫球蛋白重链、免疫球蛋白轻链λ和免疫球蛋白轻链κ的重排靶免疫受体基因的的V基因框架区的一部分和恒定(C)基因的一部分的多组引物对试剂。在一些实施方案中,所述组合物包含针对选自TCRβ、TCRα、TCRγ、TCRδ、免疫球蛋白重链、免疫球蛋白轻链λ和免疫球蛋白轻链κ的重排靶免疫受体基因的的V基因框架区的一部分和J基因的一部分的多组引物对试剂。
用至少两种引物进行PCR扩增。对于本文提供的方法,使用一组引物,其足以扩增目标基因座处的可变序列的全部或限定部分,该基因座可包括任何或所有上述TCR和免疫球蛋白基因座。在一些实施方案中,可以使用本文概述的各种参数或标准来选择靶特异性引物组用于多重扩增。
在一些实施方案中,多重反应中使用的引物组被设计为在目标基因座处扩增至少50%的已知表达重排。在某些实施方案中,多重反应中使用的引物组被设计为在目标基因座处扩增至少75%、至少85%、至少90%、至少95%、至少97%、至少98%或更多的已知表达重排。例如,使用表2中的至少49个正向引物,每个引物针对来自不同TCRβV基因的FR1区域的一部分,与表4中的至少一个针对TCRβC基因的一部分的反向引物组合,将扩增已知表达的TCRβ重排的至少50%。又例如,使用表2中的64个正向引物,每个引物针对来自不同TCRβV基因的FR1区域的一部分,与表4中的两个反向引物(每个针对TCRβC基因的一部分)组合,将扩增所有的目前已知的表达的TCRβ重排。又例如,使用表3中的59个正向引物,每个引物针对来自不同TCRβV基因的FR3区域的一部分,与表4中的两个反向引物(每个针对TCRβC基因的一部分)组合,将扩增所有的目前已知的表达的TCRβ重排。又例如,使用表3中的59个正向引物,每个引物针对来自不同TCRβV基因的FR3区域的一部分,与表5中的16个反向引物(每个针对不同TCRβJ基因的一部分)组合,将扩增所有的目前已知的表达的TCRβ重排。在一些实施方案中,使用表3的59个正向引物(每个引物针对来自不同TCRβV基因的FR3区的一部分)与表5的14个反向引物(每个针对不同TCRβJ基因的一部分)组合,将扩增所有目前已知的表达的TCRβ重排。作为另一个例子,使用表2中的64个正向引物,每个引物针对来自不同TCRβV基因的FR1区域的一部分,与表5中的16个反向引物(每个针对不同TCRβJ基因的一部分)组合,将扩增所有的目前已知的表达的TCRβ重排。在其他实施方案中,使用表2中的64个正向引物,每个引物针对来自不同TCRβV基因的FR1区域的一部分,与表5中的14个反向引物(每个针对不同TCRβJ基因的一部分)组合,将扩增所有的目前已知的表达的TCRβ重排。
例如,这种多重扩增反应包括至少20、25、30、40、45、49,优选地50、55、60、65、70、75、80、85或90个反向引物,其中每个反向引物针对对应于一个或多个TCR V基因FR1区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR1区域的多个反向引物与至少1个正向引物组合,所述正向引物针对对应于相同TCR基因的恒定基因的至少一部分的序列。在一些实施方案中,针对TCR V基因FR1区域的多个反向引物与至少2个、至少3个、至少4个、至少5个或约2至约6个正向引物组合,每个正向引物针对对应于相同TCR基因的恒定基因的至少一部分的序列。在多重扩增反应的一些实施方案中,针对TCR V基因FR1的引物可以是正向引物,针对TCR C基因的引物可以是反向引物。因此,在一些实施方案中,多重扩增反应包括至少20、25、30、40、45、49,优选地50、55、60、65、70、75、80、85或90个正向引物,其中每个正向引物针对对应于一个或多个TCR V基因FR1区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR1区域的多个正向引物与至少1个反向引物组合,所述反向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在一些实施方案中,针对TCR V基因FR1区域的多个正向引物与至少2个、至少3个、至少4个、至少5个或约2至约6个反向引物组合,每个反向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在一些实施方案中,此类FR1和C基因扩增引物组可针对TCRβ基因序列。在一些优选的实施方案中,将针对不同TRB V基因FR1区域的约60至约70个正向引物与针对TRB C基因的一部分的2个反向引物组合。在一些优选的实施方案中,针对TRB V基因FR1区域的正向引物选自表2中列出的那些,针对TRB C基因的反向引物选自表4中列出的那些。在其他实施方案中,FR1和C基因扩增引物组可以针对TCRα、TCRγ、TCRδ、免疫球蛋白重链、免疫球蛋白轻链λ或免疫球蛋白轻链κ基因序列。
在一些实施方案中,多重扩增反应包括至少20、25、30、40、45、50、55、60、65、70、75、80、85或90个反向引物,其中每个反向引物针对对应于一个或多个TCR V基因FR2区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR2区域的多个反向引物与至少1个正向引物组合,所述反向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在一些实施方案中,针对TCR V基因FR2区域的多个反向引物与至少2个、至少3个、至少4个、至少5个或约2至约6个正向引物组合,每个正向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在多重扩增反应的一些实施方案中,针对TCR V基因FR2的引物可以是正向引物,针对TCR C基因的引物可以是反向引物。因此,在一些实施方案中,多重扩增反应包括至少20、25、30、40、45、50、55、60、65、70、75、80、85或90个反向引物,其中每个正向引物针对对应于一个或多个TCR V基因FR2区域的至少一部分的序列。在这样的实施方案中,针对TCRV基因FR2区域的多个正向引物与至少1个反向引物组合,所述反向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在一些实施方案中,针对TCR V基因FR2区域的多个正向引物与至少2个、至少3个、至少4个、至少5个或约2至约6个反向引物组合,每个反向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在一些实施方案中,此类FR2和C基因扩增引物组可针对TCRβ基因序列。在一些实施方案中,将针对不同TRBV基因FR2区域的约20至约30个正向引物与针对TRB C基因的一部分的2个反向引物组合。在一些优选的实施方案中,针对TRB V基因FR2区域的正向引物选自表6中列出的那些,针对TRB C基因的反向引物选自表4中列出的那些。在其他实施方案中,FR2和C基因扩增引物组可以针对TCRα、TCRγ、TCRδ、免疫球蛋白重链、免疫球蛋白轻链λ或免疫球蛋白轻链κ基因序列。
在一些实施方案中,多重扩增反应包括至少20、25、30、40、45,优选地50、55、60、65、70、75、80、85或90个反向引物,其中每个反向引物针对对应于一个或多个TCR V基因FR3区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR3区域的多个反向引物与至少1个正向引物组合,所述反向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在一些实施方案中,针对TCR V基因FR3区域的多个反向引物与至少2个、至少3个、至少4个、至少5个或约2至约6个正向引物组合,每个正向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在多重扩增反应的一些实施方案中,针对TCR V基因FR3的引物可以是正向引物,针对TCR C基因的引物可以是反向引物。因此,多重扩增反应包括至少20、25、30、40、45,优选地50、55、60、65、70、75、80、85或90个反向引物,其中每个正向引物针对对应于一个或多个TCR V基因FR3区域的至少一部分的序列。在这样的实施方案中,针对TCRV基因FR3区域的多个正向引物与至少1个反向引物组合,所述反向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在一些实施方案中,针对TCR V基因FR3区域的多个正向引物与至少2个、至少3个、至少4个、至少5个或约2至约6个反向引物组合,每个反向引物针对对应于相同TCR基因的C基因的至少一部分的序列。在一些实施方案中,此类FR3和C基因扩增引物组可针对TCRβ基因序列。在一些优选的实施方案中,将针对不同TRB V基因FR3区域的约55至约65个正向引物与针对TRB C基因的一部分的2个反向引物组合。在一些优选的实施方案中,针对TRB V基因FR3区域的正向引物选自表3中列出的那些,针对TRB C基因的反向引物选自表4中列出的那些。在其他实施方案中,FR3和C基因扩增引物组可以针对TCRα、TCRγ、TCRδ、免疫球蛋白重链、免疫球蛋白轻链λ和免疫球蛋白轻链κ基因序列。
在一些实施方案中,这种多重扩增反应包括至少20、25、30、40、45、49,优选地50、55、60、65、70、75、80、85或90个反向引物,其中每个反向引物针对对应于一个或多个TCR V基因FR1区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR1区域的多个反向引物与至少10、12、14、16、18、20或约15-约20个正向引物组合,所述正向引物针对对应于相同TCR基因的J基因的至少一部分的序列。在多重扩增反应的一些实施方案中,针对TCR V基因FR1的引物可以是正向引物,针对TCR J基因的引物可以是反向引物。因此,在一些实施方案中,多重扩增反应包括至少20、25、30、40、45、49,优选地50、55、60、65、70、75、80、85或90个正向引物,其中每个正向引物针对对应于一个或多个TCR V基因FR1区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR1区域的多个正向引物与至少10、12、14、16、18、20或约15-约20个反向引物组合,所述反向引物针对对应于相同TCR基因的J基因的至少一部分的序列。在一些实施方案中,此类FR1和J基因扩增引物组可针对TCRβ基因序列。在一些优选的实施方案中,将针对不同TRB V基因FR1区域的约60至约70个正向引物与针对不同TRB J基因的约15-约20个反向引物组合。在一些优选的实施方案中,将针对不同TRB V基因FR1区域的约60至约70个正向引物与针对不同TRB J基因的约12-约18个反向引物组合。在一些优选的实施方案中,针对TRB V基因FR1区域的正向引物选自表2中列出的那些,针对TRB J基因的反向引物选自表5中列出的那些。在其他实施方案中,FR1和J基因扩增引物组可以针对TCRα、TCRγ、TCRδ、免疫球蛋白重链、免疫球蛋白轻链λ或免疫球蛋白轻链κ基因序列。
在一些实施方案中,多重扩增反应包括至少20、25、30、40、45、50、55、60、65、70、75、80、85或90个反向引物,其中每个反向引物针对对应于一个或多个TCR V基因FR2区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR2区域的多个反向引物与至少10、12、14、16、18、20或约15-约20个正向引物组合,所述正向引物针对对应于相同TCR基因的J基因的至少一部分的序列。在多重扩增反应的一些实施方案中,针对TCR V基因FR2的引物可以是正向引物,针对TCR J基因的引物可以是反向引物。因此,在一些实施方案中,多重扩增反应包括至少20、25、30、40、45、50、55、60、65、70、75、80、85或90个正向引物,其中每个正向引物针对对应于一个或多个TCR V基因FR2区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR2区域的多个正向引物与至少10、12、14、16、18、20或约15-约20个反向引物组合,所述反向引物针对对应于相同TCR基因的J基因的至少一部分的序列。在一些实施方案中,此类FR2和J基因扩增引物组可针对TCRβ基因序列。在一些优选的实施方案中,将针对不同TRB V基因FR2区域的约20至约30个正向引物与针对不同TRB J基因的约15-约20个反向引物组合。在一些优选的实施方案中,将针对不同TRB V基因FR2区域的约20至约30个正向引物与针对不同TRB J基因的约12-约18个反向引物组合。在一些优选的实施方案中,针对TRB V基因FR2区域的正向引物选自表6中列出的那些,针对TRB J基因的反向引物选自表5中列出的那些。在其他实施方案中,FR2和J基因扩增引物组可以针对TCRα、TCRγ、TCRδ、免疫球蛋白重链、免疫球蛋白轻链λ或免疫球蛋白轻链κ基因序列。
在一些实施方案中,多重扩增反应包括至少20、25、30、40、45,优选地50、55、60、65、70、75、80、85或90个反向引物,其中每个反向引物针对对应于一个或多个TCR V基因FR3区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR3区域的多个反向引物与至少10、12、14、16、18、20或约15-约20个正向引物组合,所述正向引物针对对应于相同TCR基因的J基因的至少一部分的序列。在多重扩增反应的一些实施方案中,针对TCR V基因FR3的引物可以是正向引物,针对TCR J基因的引物可以是反向引物。因此,在一些实施方案中,多重扩增反应包括至少20、25、30、40、45,优选地50、55、60、65、70、75、80、85或90个正向引物,其中每个正向引物针对对应于一个或多个TCR V基因FR3区域的至少一部分的序列。在这样的实施方案中,针对TCR V基因FR3区域的多个正向引物与至少10、12、14、16、18、20或约15-约20个反向引物组合,所述反向引物针对对应于相同TCR基因的J基因的至少一部分的序列。在一些实施方案中,此类FR3和J基因扩增引物组可针对TCRβ基因序列。在一些优选的实施方案中,将针对不同TRB V基因FR3区域的约55至约65个正向引物与针对不同TRBJ基因的约15-约20个反向引物组合。在一些优选的实施方案中,将针对不同TRB V基因FR3区域的约55至约65个正向引物与针对不同TRB J基因的约12-约18个反向引物组合。在一些优选的实施方案中,针对TRB V基因FR3区域的正向引物选自表3中列出的那些,针对TRB J基因的反向引物选自表5中列出的那些。在其他实施方案中,FR3和J基因扩增引物组可以针对TCRα、TCRγ、TCRδ、免疫球蛋白重链、免疫球蛋白轻链λ和免疫球蛋白轻链κ基因序列。
在一些实施方案中,在多重扩增反应中正向引物的浓度约等于反向引物的浓度。在其他实施方案中,在多重扩增反应中正向引物的浓度约为反向引物的浓度的两倍。在其他实施方案中,在多重扩增反应中正向引物的浓度约为反向引物的浓度的一半。在一些实施方案中,靶向V基因FR区的每种引物的浓度为约5nM至约2000nM。在一些实施方案中,靶向V基因FR区的每种引物的浓度为约50nM至约800nM。在一些实施方案中,靶向V基因FR区的每种引物的浓度为约50nM至约400nM或约100nM至约500nM。在一些实施方案中,靶向V基因FR区的每种引物的浓度为约200nM、约400nM、约600nM或约800nM。在一些实施方案中,靶向V基因FR区的每种引物的浓度为约5nM、约10nM、约50nM、约100nM或约150nM。在一些实施方案中,靶向V基因FR区的每种引物的浓度为约1000nM、约1250nM、约1500nM、约1750nM或约2000nM。在一些实施方案中,靶向V基因FR区的每种引物的浓度为约50nM至约800nM。在一些实施方案中,靶向J基因的每种引物的浓度为约5nM至约2000nM。在一些实施方案中,靶向J基因的每种引物的浓度为约50nM至约800nM。在一些实施方案中,靶向J基因的每种引物的浓度为约50nM至约400nM或约100nM至约500nM。在一些实施方案中,靶向J基因的每种引物的浓度为约200nM、约400nM、约600nM或约800nM。在一些实施方案中,靶向J基因的每种引物的浓度为约5nM、约10nM、约50nM、约100nM或约150nM。在一些实施方案中,靶向J基因的每种引物的浓度为约1000nM、约1250nM、约1500nM、约1750nM或约2000nM。在一些实施方案中,靶向J基因的每种引物的浓度为约50nM至约800nM。在一些实施方案中,多重反应中每种正向和反向引物的浓度为约50nM、约100nM、约200nM或约400nM。在一些实施方案中,多重反应中每种正向和反向引物的浓度为约5nM至约2000nM。在一些实施方案中,多重反应中每种正向和反向引物的浓度为约50nM至约800nM。在一些实施方案中,多重反应中每种正向和反向引物的浓度为约50nM至约400nM或约100nM至约500nM。在一些实施方案中,多重反应中每种正向和反向引物的浓度为约600nM、约800nM、约1000nM、约1250nM、约1500nM、约1750nM或约2000nM。在一些实施方案中,多重反应中每种正向和反向引物的浓度为约5nM、约10nM、约150nM或50nM至约800nM。
在一些实施方案中,针对V基因FR和C基因靶的引物组合作为扩增引物对以扩增靶免疫受体cDNA序列并产生靶扩增子。通常,靶扩增子的长度将取决于哪个V基因引物组(例如,针对FR1、FR2或FR3的引物)与C基因引物配对。因此,在一些实施方案中,靶扩增子可以是约100个核苷酸(或碱基或碱基对)的长度至约600个核苷酸(或碱基或碱基对)的长度。在一些实施方案中,靶扩增子的长度可以为约80个核苷酸至约600个核苷酸。在一些实施方案中,靶扩增子的长度为约200至约600或约300至约600个核苷酸。在一些实施方案中,靶扩增子的长度为约80至约140、约90至约130、或约100至约120个核苷酸。在一些实施方案中,靶扩增子的长度为约250至约275、约250至约350、约300至约350、约310至约330、约325至约375、约300至约400、约350至约400、约350至约425、约350至约450、约380至约410、约375至约425、约400至约500、约425至约500、约450至约550、约500至约600、约400至约500、或约400至约600个核苷酸。在一些实施方案中,靶扩增子的长度为约80、约100、约120、约140、约200、约250、约275、约300、约320、约350、约375、约400、约425、约450、约500、约550或约600个核苷酸。在一些实施方案中,TCRβ扩增子的长度为约100、约80至约140、约90至约130、或约100至约120个核苷酸。在一些实施方案中,TCRβ扩增子的长度为约320、约300至约350、或约310至约330个核苷酸。在一些实施方案中,TCRβ扩增子的长度为约400、约375至约425、或约390至约410个核苷酸。
在一些实施方案中,针对V基因FR和J基因靶的引物组合作为扩增引物对以扩增靶免疫受体cDNA序列并产生靶扩增子。通常,靶扩增子的长度将取决于哪个V基因引物组(例如,针对FR1、FR2或FR3的引物)与J基因引物配对。因此,在一些实施方案中,靶扩增子的长度可以为约50个核苷酸至约350个核苷酸。在一些实施方案中,靶扩增子的长度为约50至约200、约70至约170、约200至约350、约250至约320、约270至约300、约225至约300、约250至约275、约200至约235、约200至约250、或约175至约275个核苷酸。在一些实施方案中,TCRβ扩增子的长度为约80、约60至约100、或约70至约90个核苷酸。在一些实施方案中,TCRβ扩增子,例如使用针对V基因FR3和J基因的引物对产生的那些,长度为约50至约200个核苷酸,优选地长度约60至约160、约65至约120、约70至约90个核苷酸、或约80个核苷酸。
在一些实施方案中,扩增引物可包括条形码序列,例如以区分或分离样品中的多个扩增的靶序列。在一些实施方案中,扩增引物可包括两个或更多个条形码序列,例如以区分或分离样品中的多个扩增的靶序列。在一些实施方案中,扩增引物可以包括标记序列,其可以帮助随后对所产生的扩增子进行编目、鉴定或测序。在一些实施方案中,通过包含在扩增引物中或通过连接衔接子将条形码序列或标记序列并入扩增的核苷酸序列中。引物可以进一步包含可用于后续测序例如焦磷酸测序的核苷酸。这些序列易于通过商业上可获得的软件程序或公司设计。
在一些实施方案中,使用不包括标记序列的靶向扩增引物进行多重扩增。在其他实施方案中,用扩增引物进行多重扩增,所述扩增引物各自包括靶向序列和标记序列,例如正向引物或引物组包括标记序列1,反向引物或引物组包括标记序列2。在其他实施方案中,用扩增引物进行多重扩增,其中一个引物或引物组包括靶向序列和标记序列,而另一个引物或引物组包括靶向序列但不包括标记序列,例如,比如,正向引物或引物组包括标记序列,反向引物或引物组不包括标记序列。
因此,在一些实施方案中,多个靶cDNA模板分子在单一多重扩增反应混合物中用TCR或BCR定向扩增引物扩增,其中正向和/或反向引物包括标记序列,并且所得扩增子在一端或两端包括靶TCR或BCR序列和标记序列。在一些实施方案中,正向和/或反向扩增引物或引物组还可以包括条形码,然后将一个或多个条形码包括在所得的扩增子中。
在一些实施方案中,多个靶cDNA模板分子在单一多重扩增反应混合物中用TCR或BCR定向扩增引物扩增,得到的扩增子仅含有TCR或BCR序列。在一些实施方案中,通过例如衔接子连接将标记序列添加到此类扩增子的末端。在一些实施方案中,通过例如衔接子连接将条形码序列添加到这种扩增子的一端或两端。
适合用作条形码和条形码文库的核苷酸序列是本领域已知的。包含条形码序列的衔接子和扩增引物和引物组是可商购的。含有条形码序列的寡核苷酸衔接子也是可商购的,包括例如IonXpressTM、IonCodeTM和Ion Select条形码衔接子(Thermo FisherScientific)。类似地,描述和本领域已知的另外和其他通用衔接子/引物序列(例如,Illumina通用衔接子/引物序列、PacBio通用衔接子/引物序列等)可以与本文提供的方法和组合物一起使用,并且使用相关分析平台对得到的扩增子进行测序。
在一些实施方案中,当对多重样品进行测序时,将两个或更多个条形码添加至扩增子。在一些实施方案中,在对多重样品进行测序之前,将至少两个条形码添加至扩增子,以降低源自条形码交叉污染或样品之间条形码渗透的人工结果(例如,免疫受体基因重排或克隆鉴定)的频率。在一些实施方案中,当跟踪免疫组库的低频克隆时,使用至少两个条形码来标记样品。在一些实施方案中,当使用测定法检测频率小于1:1,000的克隆时,将至少两个条形码添加至扩增子。在一些实施方案中,当使用测定法检测频率小于1:10,000的克隆时,将至少两个条形码添加至扩增子。在其他实施方案中,当使用测定法检测频率小于1:20,000、小于1:40,000、小于1:100,000、小于1:200,000、小于1:400,000、小于1:500,00、或小于1:1,000,000的克隆时,将至少两个条形码添加至扩增子。表征免疫组库的方法,其受益于每个克隆的高测序深度和/或在如此低的频率下检测克隆,包括但不限于监测经历过治疗的过度增殖性疾病的患者并且在治疗后测试最小残留疾病。
在一些实施方案中,选择或设计在本发明方法中使用的靶特异性引物(例如针对V基因FR1、FR2和FR3的引物、针对J基因的引物和针对C基因的引物)以满足以下标准中的任何一个或多个:(1)在引物序列内包含两个或更多个修饰的核苷酸,其中至少一个包括在引物的末端附近或末端处,并且其中至少一个包含在引物序列的中心核苷酸位置处或附近;(2)长度约15至约40个碱基;(3)Tm为约60℃以上至约70℃;(4)与目标样品中存在的非靶序列具有低交叉反应性;(5)至少前四个核苷酸的序列(从3'到5'方向)与同一反应中存在的任何其他引物内的任何序列不互补;(6)与任何其他产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。在一些实施方案中,选择或设计在所提供的方法中使用的靶特异性引物以满足上述标准中的任何2、3、4、5或6个。
在一些实施方案中,本发明方法中使用的靶特异性引物包括一个或多个具有可切割基团的修饰核苷酸。在一些实施方案中,本发明方法中使用的靶特异性引物包括两个或更多个具有可切割基团的修饰核苷酸。在一些实施方案中,靶特异性引物包括选自下述的具有可切割基团的至少一种修饰核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
在一些实施方案中,使用本文公开的扩增方法(和相关组合物、系统和试剂盒)的靶扩增子用于制备免疫受体组库文库。在一些实施方案中,免疫受体组库文库包括将衔接子序列引入靶扩增子序列的末端。在某些实施方案中,制备免疫受体组库文库的方法包括根据本文所述的任何多重扩增方法产生靶免疫受体扩增子分子,通过消化扩增子分子的引物序列内的修饰的核苷酸处理所述扩增子分子,并连接至少一个衔接子至至少一个处理的扩增子分子,从而产生包含靶免疫受体组库的衔接子连接的靶免疫受体扩增子分子文库。在一些实施方案中,制备所述文库的步骤在仅涉及添加步骤的单个反应容器中进行。在某些实施方案中,该方法还包括克隆扩增至少一个衔接子连接的靶扩增子分子的一部分。
在一些实施方案中,使用本文公开的方法(和相关组合物、系统和试剂盒)的靶扩增子与下游过程联接,例如但不限于文库制备和核酸测序。例如,可以使用桥式扩增、乳液PCR或等温扩增来扩增靶扩增子,以产生适合于核酸测序的多个克隆模板。在一些实施方案中,使用任何合适的DNA测序平台(例如任何下一代测序平台)对扩增子文库进行测序,包括半导体测序技术,例如Ion Torrent测序平台。在一些实施方案中,使用Ion Torrent S5520TM系统或Ion Torrent S5 530TM系统或Ion Torrent PGM 318TM系统对扩增子文库进行测序。在一些实施方案中,使用Ion Torrent S5 540TM系统对扩增子文库进行测序。
在一些实施方案中,使用本文公开的方法(和相关组合物和试剂盒)产生的免疫受体扩增子的测序产生长度为约200至约600个核苷酸的连续序列读段。在一些实施方案中,连续读段长度为约300至约400个核苷酸。在一些实施方案中,连续读段长度为约350至约450个核苷酸。在一些实施方案中,读段长度平均为约300个核苷酸、约350个核苷酸或约400个核苷酸。在一些实施方案中,连续读段长度为约250至约350个核苷酸、约275至约340或约295至约325个核苷酸。在一些实施方案中,读段长度平均长度为约270、约280、约290、约300或约325个核苷酸。在其他实施方案中,连续读段长度为约180至约300个核苷酸、约200至约290个核苷酸、约225至约280个核苷酸、或约230至约250个核苷酸。在一些实施方案中,读段长度平均为约200、约220、约230、约240或约250个核苷酸。在其他实施方案中,连续读段长度为约70至约200个核苷酸、约80至约150个核苷酸、约90至约140个核苷酸、或约100至约120个核苷酸长。在其他实施方案中,连续读段长度为约50至约170个核苷酸、约60至约160个核苷酸、约60至约120个核苷酸、约70至约100个核苷酸、约70至约90个核苷酸或约80个核苷酸长。在一些实施方案中,读段长度平均为约70、约80、约90、约100、约110或约120个核苷酸。在一些实施方案中,序列读段长度包括扩增子序列和条形码序列。在一些实施方案中,序列读段长度不包括条形码序列。
在一些实施方案中,扩增子引物和引物对是可以扩增核酸分子的特定区域的靶特异性序列。在一些实施方案中,靶特异性引物可以扩增表达的RNA或cDNA。在一些实施方案中,靶特异性引物可以扩增哺乳动物RNA,例如人RNA或由其制备的cDNA,或鼠NA或由其制备的cDNA。
在本文提供的方法和组合物中,例如用于确定、表征和/或跟踪生物样品中免疫组库的那些中,扩增靶序列所需的输入RNA的量将部分取决于样品中携带免疫受体的细胞(例如,T细胞或B细胞)的比例。例如,样品中较高比例的T细胞,例如富含T细胞的样品,允许使用较低量的输入RNA进行扩增。在一些实施方案中,用于扩增一种或多种靶序列的输入RNA的量可以是约0.05ng至约10μg。在一些实施方案中,用于一个或多个靶序列的多重扩增的输入RNA的量可以为约5ng至约2微克。在一些实施方案中,用于多重扩增一种或多种靶序列的RNA的量可以是约5ng至约1微克或约10ng至约1μg。在一些实施方案中,用于一个或多个免疫组库靶序列的多重扩增的RNA的量为约1.5微克、约2微克、约2.5微克、约3微克、约3.5微克、约4.0微克、约5微克、约6微克、约7微克、或约10微克。在一些实施方案中,用于多重扩增一种或多种免疫组库靶序列的RNA的量为约10ng、约25ng、约50ng、约100ng、约200ng、约250ng、约500ng、约750ng、或约1000ng。在一些实施方案中,用于多重扩增一种或多种免疫组库靶序列的RNA的量为约25ng至约500ng RNA或约50ng至约200ng RNA。在一些实施方案中,用于多重扩增一种或多种免疫组库靶序列的RNA的量为约0.05ng至约10ng RNA、约0.1ng至约5ng RNA、约0.2ng至约2ng RNA、或约0.5ng至约1ng RNA。在一些实施方案中,用于一种或多种免疫组库靶序列的多重扩增的RNA的量为约0.05ng、约0.1ng、约0.2ng、约0.5ng、约1.0ng、约2.0ng或约5.0ng。
如本文中所描述的,在多重扩增之前,通常在逆转录反应中使用逆转录酶,将来自生物样品的RNA转化成cDNA。在一些实施方案中,用输入RNA进行逆转录反应,并且将来自逆转录反应的一部分cDNA用于多重扩增反应。在一些实施方案中,将从输入RNA制备的基本上所有cDNA加入到多重扩增反应中。在其他实施方案中,将从输入RNA制备的cDNA的一部分,例如约80%、约75%、约66%、约50%、约33%或约25%加入多重扩增反应中。在其他实施方案中,将从输入RNA制备的cDNA的约15%、约10%、约8%、约6%或约5%加入多重扩增反应中。
在一些实施方案中,来自加入多重扩增反应的样品的cDNA的量可为约0.001ng至约5μg。在一些实施方案中,用于一个或多个免疫组库靶序列的多重扩增的cDNA的量可以为约0.01ng至约2微克。在一些实施方案中,用于多重扩增一种或多种靶序列的cRNA的量可以是约0.1ng至约1微克或约1ng至约0.5μg。在一些实施方案中,用于多重扩增一种或多种免疫组库靶序列的cRNA的量为约0.5ng、约1ng、约5ng、约10ng、约25ng、约50ng、约100ng、约200ng、约250ng、约500ng、约750ng、或约1000ng。在一些实施方案中,用于多重扩增一种或多种免疫组库靶序列的cDNA的量为约0.01ng至约10ng cDNA、约0.05ng至约5ng cDNA、约0.1ng至约2ng cDNA、或约0.01ng至约1ng cDNA。在一些实施方案中,用于多重扩增一种或多种免疫组库靶序列的cDNA的量为约0.005ng、约0.01ng、约0.05ng、约0.1ng、约0.2ng、约0.5ng、约1.0ng、约2.0ng、或约5.0ng。
在一些实施方案中,使用常规方法从生物样品中获得mRNA并将其转化为cDNA用于扩增目的。用于从生物样品中提取或分离核酸的方法和试剂是公知的并且可商购获得。在一些实施方案中,从生物样品中提取RNA通过本文所述的任何方法或本领域技术人员已知的方法进行,例如涉及蛋白酶K组织消化和基于醇的核酸沉淀的方法、用DNA酶处理以消化污染的DNA、和使用硅胶-膜技术的RNA纯化,或其任何组合。使用市售试剂盒从生物样品中提取RNA的示例性方法包括RecoverAllTM多样品RNA/DNA工作流程(Invitrogen)、RecoverAllTM总核酸分离试剂盒(Invitrogen)、RNA血液(Macherey-Nagel)、血液RNA系统、TRI ReagentTM(Invitrogen)、PureLinkTMRNA Micro Scale试剂盒(Invitrogen)、MagMAXTMFFPE DNA/RNA Ultra试剂盒(Applied Biosystems)、ZR RNAMicroPrepTM试剂盒(Zymo Research)、RNeasy Micro试剂盒(Qiagen)、和ReliaPrepTMRNATissue miniPrep系统(Promega)。
样品或生物样品,如本文所用,是指一种组合物,其来自包含或可能包含与免疫系统相关的细胞的个体。示例性生物样品包括但不限于组织(例如,淋巴结、器官组织、骨髓)、全血、滑液、脑脊髓液、肿瘤活组织检查和其他含有细胞的临床标本。样品可包括正常和/或患病细胞,并且是细针抽吸物、细针活组织检查、核心样品或其他样品。在一些实施方案中,生物样品可包括造血细胞、外周血单核细胞(PBMC)、T细胞、B细胞、肿瘤浸润淋巴细胞(“TIL”)或其他淋巴细胞。在一些实施方案中,样品可以是新鲜的(例如,未保存的)、冷冻的或福尔马林固定的石蜡包埋的组织(FFPE)。一些样品包含癌细胞,如癌、黑素瘤、肉瘤、淋巴瘤、骨髓瘤、白血病和类似物,所述癌细胞可以循环肿瘤细胞。
生物样品可以是组织或细胞类型的混合物、富含至少一种特定类别或类型细胞的细胞制剂、或特定类型或表型的分离的细胞群。在分析之前,可以通过离心、淘洗、密度梯度分离、单采血液成分术、亲和选择、淘选、FACS、用Hypaque离心等分离样品。用于分选、富集和分离特定细胞类型的方法是众所周知的,并且可以由普通技术人员容易地实施。在一些实施方案中,样品可以是富含T细胞的制剂,例如CD3+ T细胞。
在一个方面,所提供的方法和系统包括用于从确定的免疫受体序列中鉴定和/或去除PCR或测序衍生的错误的方法。
在一些实施方案中,错误校正策略包括以下步骤:
1)将测序的重排与可变、多样性和连接/恒定基因的参考数据库比对,以产生查询序列/参考序列对。许多比对程序可用于此目的,包括例如IgBLAST,一个来自NCBI的可自由使用的工具,以及定制计算机脚本。
2)考虑到用于测序的流程顺序,将参考和查询序列相互重新比对。流程顺序提供允许人们识别和纠正某些类型的错误比对的信息。
3)通过其特征序列基序识别CDR3区域的边界。
4)在对应于可变基因和连接/恒定基因(不包括CDR3区域)的重排的比对部分,在查询中相对于参考标识插入缺失并改变错配查询碱基位置以使其与参考一致。
5)对于CDR3区域,如果CDR3长度不是3的倍数(表示插入缺失错误):
(a)基于PHRED得分(表示为e),在CDR3中搜索具有最高概率的含有序列错误的均聚物延伸。
(b)基于PHRED得分(表示为t)获得整个CDR3区域的错误概率
(c)如果e/t大于确定的阈值,则通过将均聚物的长度增加或减少一个碱基来编辑均聚物,使得CDR3核苷酸长度是三的倍数。
(d)作为步骤a-c的替代方案,在CDR3中搜索最长的均聚物,并且如果均聚物的长度高于限定的阈值,则通过将均聚物的长度增加或减少一个碱基来编辑均聚物,使得CDR3核苷酸长度是三的倍数。
在一些实施方案中,提供了鉴定对于PCR和测序错误稳健的组库数据中的T细胞或B细胞克隆的方法。因此,以下描述了可以在这种方法中采用的步骤,以对PCR和测序错误稳健的方式鉴定T细胞或B细胞克隆。表1是用于从免疫受体测序数据中鉴定和去除PCR或测序衍生的错误的示例性工作流程图。该工作流程的示例性部分和实施方案也在图1-2中表示。
表1序列校正工作流程
对于一组源自mRNA的TCR或BCR序列,其中1)每个序列已被注释为有效的重排,无论是天然的还是在纠错后,如先前所述,和2)每个序列具有鉴定的V基因和CDR3核苷酸区域,在一些实施方案中,方法包括以下:
1)识别和排除嵌合序列。对于数据集中存在的每个独特的CDR3核苷酸序列,计算具有该CDR3核苷酸序列和任何可能的V基因的读段的数量。构成该CDR3核苷酸序列总读段少于10%的任何V基因-CDR3组合被标记为嵌合体并从下游分析中消除。例如,对于具有相同CDR3核苷酸序列的下述序列,例如,具有与CDR3nt序列AATTGGT配对的TRBV3和TRBV6的序列将被标记为嵌合。
V基因 CDR3nt 读段计数
TRBV2 AATTGGT 1000
TRBV3 AATTGGT 10
TRBV6 AATTGGT 3
2)识别并排除包含简单插入缺失错误的序列。对于数据集中的每次读段,获得该读段的CDR3序列的均聚物-塌陷表示。对于具有相同V基因和塌陷-CDR3组合的每组读段,计算每个未塌陷的CDR3核苷酸序列的出现次数。构成该读段集的总读段的<10%的任何未塌陷的CDR3序列被标记为具有简单的均聚物错误。作为实例,呈现三种不同的V基因-CDR3核苷酸序列,其在CDR3核苷酸序列的均聚物塌缩后是相同的。两个较不频繁的V基因-CDR3组合构成读段集的总读段的<10%,并且将被标记为包含简单的插入缺失错误。例如:
3)识别并排除单例读取。对于数据集中的每次读段,计算在数据集中找到精确读段序列的次数。在数据集中仅出现一次的读段将被标记为单例读段。
4)识别并排除截断的读段。对于数据集中的每次读段,确定读段是否具有注释的V基因FR1、CDR1、FR2、CDR2和FR3区域,如通过对IgBLAST参考V基因集的读段的IgBLAST比对所指示的。如果基于用于扩增的特定V基因引物预期区域,则将不具有上述区域的读段标记为截短的。
5)识别并排除缺乏双向支持的重新排列。对于数据集中的每次读段,获得读段的V基因和CDR3序列以及读段的链方向(正或负链)。对于数据集中的每个V基因-CDR3组合,计算具有该V基因-CDR3nt组合的正链和负链读段的数目。仅存在于一个方向的读段中的V基因-CDR3nt组合将被认为是假的。具有假V基因-CDR3nt组合的所有读段将被标记为缺乏双向支持。
6)对于未标记的基因,基于CDR3核苷酸相似性进行逐步聚类。基于读段的V基因同一性将序列分成组,排除等位基因信息(v基因组)。对于每组:
a.使用cd-hit-est和以下参数将每个组中的读段布置入聚类:
cd-hit-est-i vgene_groups.fa-o clustered_vgene_groups.cdhit-T 24-d 0-M 100000-B 0-r 0-g 1-S 0-U 2-uL.05-n 10–l 7
其中vgene_groups.fa是具有相同V基因的序列的CDR3核苷酸区域的fasta格式文件,而clustered_vgene_groups.cdhit是包含细分序列的输出。
b.为聚类中的每个序列分配相同的克隆ID,用于表示该子组的成员被认为代表相同的T细胞克隆或B细胞克隆。
c.选择每个聚类的代表性序列,使得代表性序列是出现最多次数的序列,或者在平局的情况下,是随机选择的。
d.将聚类中的所有其他读段合并到代表性序列中,使得代表性序列的读段数根据合并序列的读段数增加。
e.基于汉明距离将v基因组内的代表性序列相互比较。如果代表性序列在汉明距离1至丰度>50倍的代表性序列的范围内,则将该序列合并到更常见的代表性序列中。如果代表性序列在汉明距离2至丰度>10000倍的代表性序列的范围内,则将该序列合并到更常见的代表性序列中。
f.识别复杂的序列错误。均聚物-塌缩每个V基因组内的代表性序列,然后使用Levenshtein距离相互比较。如果代表性序列在Levenshtein距离1至丰度>50倍的代表性序列的范围内,则将该序列合并到更常见的代表性序列中。
g.识别CDR3错误注释错误。均聚物-塌缩每个V基因组内的代表性序列,然后对每个均聚物-塌缩序列进行成对比较。对于每对序列,确定一个序列是否是另一个序列的子集。如果是,如果更丰富的序列是>500倍更丰富,则将较不丰富的序列合并到更丰富的序列中。
7)向用户报告聚类代表。
在测试数据集上执行该工作流程的实例在实施例和图3和表7中给出。使用相同的数据集,将此工作流程的性能与三个学术软件包的性能进行比较:IMSEQ、MiXCR和RTCR。学术包报告了许多人工谱系,而在MiXCR的情况下,10个质粒CDR3序列中的3个被错误报告。如本文所证明的,目前提供的工作流程产生比其他包更少的克隆型,并且更接近文库中存在的克隆型的真实数量。目前提供的工作流程还提供最高的读段分配准确度。
在一些实施方案中,所提供的工作流程不限于在各个步骤中列出的频率比率,并且其他频率比率可以代替上面包括的代表性比率。例如,在一些实施方案中,基于汉明距离将v基因组内的代表性序列彼此进行比较可以使用不同于上述步骤(e)中列出的频率比。例如但不限于,如果代表性序列在与代表性序列的汉明距离2内,则可以使用1000、5000、20,000等的频率比。例如但不限于,如果代表性序列在与代表性序列的汉明距离1内,则可以使用20、100、200等的频率比。所提供的频率比代表将相似对的更丰富序列标记为正确序列的一般过程。
类似地,当比较工作流程中其他步骤的两个序列的频率时,例如步骤(1)、步骤(2)、步骤(6f)和步骤(6g),可以使用除了上述步骤中列出的频率比之外的频率比。
如本文所用,术语“均聚物-塌缩序列”旨在表示其中重复碱基塌缩成单个碱基代表的序列。例如,对于非塌缩序列AAAATTTTTATCCCCCCCCGGG(SEQ ID NO:522),均聚物-塌缩序列是ATATCG。
如本文所用,术语“克隆”、“克隆型”、“谱系”或“重排”旨在描述用于免疫受体诸如TCR或BCR的独特V基因核苷酸组合。例如,独特的V基因-CDR3核苷酸组合。
如本文所用,术语“生产性读段”是指TCR或BCR序列读段,其不具有终止密码子并具有框内可变基因和连接基因区段。在编码多肽时,生产性读段在生物学上是合理的。
如本文所用,“嵌合体”或嵌合序列“是指在靶扩增例如PCR期间由模板转换产生的人工序列。嵌合体通常作为移植到不相关的V基因上的CDR3序列存在,产生与数据集内的多个V基因相关的CDR3序列。嵌合序列通常远不如数据集中的真实序列丰富。
如本文所用,术语“插入缺失”是指核酸序列中一个或多个核苷酸碱基的插入和/或缺失。在核酸序列的编码区中,除非插入缺失的长度是3的倍数,否则当翻译序列时它将产生移码。如本文所用,“简单的插入缺失错误”是不改变序列的均聚物-塌缩表示的错误。如本文所用,“复杂的插入缺失错误”是改变序列的均聚物-塌缩表示的插入缺失测序错误,并且包括但不限于消除均聚物、将均聚物插入序列或产生阅读障碍型错误的错误。
如本文所用,“单列读段”是指其缺失校正的序列在数据集中仅出现一次的序列读段。通常,单列读段富含含有PCR或测序错误的读段。
如本文所用,“截短的读段”是指缺失注释的V基因区的免疫受体序列读段。例如,截短的读段包括但不限于缺失注释的TCR或BCR V基因FR1、CDR1、FR2、CDR2或FR3区域的序列读段。由于质量修整,这种读段通常缺少V基因序列的一部分。如果截断导致错误识别V基因,截断的读段可能会产生伪影。
在鉴定的V基因-CDR3序列(克隆型)的背景下,“双向支持”表示在至少一个映射到正链的读段中(从V基因进行到恒定基因)和至少一个映射到负链的读段(从恒定基因进行到V基因)中发现特定的V基因-CDR3序列。系统测序错误通常导致鉴定具有单向支持的V基因-CDR3序列。
对于已经根据预定的序列相似性阈值考虑由于PCR或测序误差的变化进行了分组的一组序列,“聚类代表”是被选择为最可能无错误的序列。这通常是最丰富的序列。
如本文所用,“IgBLAST注释错误”是指罕见事件,其中CDR3的边界被识别为处于不正确的相邻位置。这些事件通常在CDR3核苷酸序列的5'或3'末端添加三个碱基。
对于两个相等长度的序列,“汉明距离”是相应碱基不同的位置数。对于任何两个序列,“Levenshtein距离”或“编辑距离”是使一个序列成为另一个序列所需的单个碱基编辑的数量。
在其中针对J基因的引物用于扩增免疫受体序列的一些实施方案中,例如用针对V基因FR3区的引物和针对J基因的引物的多重扩增,来自该测定的原始序列读段在任何下游分析之前经历J基因序列推断过程。在该过程中,询问原始读取序列的开始和结束是否存在10-30个核苷酸的特征序列,其对应于在测序之前在用J引物扩增以及扩增子末端的任何后续操作或处理(例如消化)后预期存在的J基因序列的部分。特征核苷酸序列允许推断J引物的序列,以及由于每个J基因的序列已知而被靶向的J基因的剩余部分。为了完成J基因序列推断过程,将推断的J基因序列添加到原始读段中以产生扩展的读段,然后跨越整个J基因。然后扩展的读段包含整个J基因序列、CDR3区的完整序列和至少一部分V基因序列,其将在下游分析后报告。扩展读段中V基因序列的部分将取决于用于多重扩增的针对V基因的引物,例如针对FR3、FR2或FR1的引物。
使用V基因FR3和J基因引物扩增表达的免疫受体序列产生最小长度的扩增子(例如,长度为约60-100或约80个核苷酸),同时仍产生允许报告整个CDR3区域的数据。由于期望短的扩增子长度,在序列分析工作流程期间,长度<100个核苷酸的扩增子的读取不会作为低质量和/或脱靶产物被消除。然而,在原始读段中明确搜索预期的J基因序列允许消除由J基因引物衍生自脱靶扩增的扩增子。此外,这种短的扩增子长度改善了对高度降解的模板材料(例如衍生自FFPE样品的模板材料)的测定的性能。
在一些实施方案中,提供的方法包括测序免疫受体文库并对获得的序列数据进行错误鉴定和校正过程以产生拯救的生产性读段,并鉴定生产性和拯救的生产性序列读段。在一些实施方案中,提供的方法包括测序免疫受体文库并对获得的序列数据集进行错误鉴定和校正过程,鉴定生产性和拯救的生产性序列读段,并通过克隆型对序列读段进行分组以鉴定文库中的免疫受体克隆型。
在一些实施方案中,所提供的错误鉴定和校正工作流程用于鉴定和解析PCR或测序衍生的错误,其导致序列读段被鉴定为来自非生产性重排。在一些实施方案中,所提供的错误鉴定和校正工作流程应用于从测序平台产生的免疫受体序列数据,其中在产生序列数据时发生插入缺失或其他引起移码的错误。
在一些实施方案中,所提供的错误鉴定和校正工作流程应用于由Ion Torrent测序平台生成的序列数据。在一些实施方案中,所提供的错误鉴定和校正工作流程应用于由Roche 454 Life Sciences测序平台、PacBio测序平台和Oxford Nanopore测序平台产生的序列数据。
在一些实施方案中,提供的方法包括制备和形成多种免疫受体特异性扩增子。在一些实施方案中,该方法包括将多个V基因特异性引物和至少一个C基因特异性引物与cDNA分子杂交,延伸引物对的第一引物(例如,V基因特异性引物),使来自核酸分子的延伸的第一引物变性,将引物对的第二引物(例如,C基因特异性引物)与延伸的第一引物产物杂交,并延伸第二引物,消化靶特异性引物对以产生多个靶扩增子。在其他实施方案中,该方法包括将多个V基因特异性引物和多个J基因特异性引物与cDNA分子杂交,延伸引物对的第一引物(例如,V基因特异性引物),使来自核酸分子的延伸的第一引物变性,将引物对的第二引物(例如,J基因特异性引物)与延伸的第一引物产物杂交,并延伸第二引物,消化靶特异性引物对以产生多个靶扩增子。在一些实施方案中,在进行切口平移反应之前将衔接子连接至靶扩增子的末端,以产生适合于核酸测序的多个靶扩增子。在一些实施方案中,至少一个连接的衔接子包括至少一个条形码序列。在一些实施方案中,连接至靶扩增子末端的每个衔接子包括条形码序列。在一些实施方案中,可以使用桥式扩增、乳液PCR或等温扩增来扩增一个或多个靶扩增子,以产生适合于核酸测序的多个克隆模板。
在一些实施方案中,本公开内容提供了对靶扩增子进行测序和处理序列数据以鉴定在衍生cDNA的生物样品中表达的生产性免疫受体重排的方法。在使用针对J基因的引物扩增表达的免疫受体序列的实施方案中,处理序列数据包括推断用于扩增的J基因引物的核苷酸序列以及靶向的J基因的剩余部分,如本文所述。在一些实施方案中,处理序列数据包括执行提供的错误鉴定和校正步骤以产生拯救的生产序列。在一些实施方案中,使用所提供的错误鉴定和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA样品的测序读段的至少50%。在一些实施方案中,使用所提供的错误鉴定和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA样品的测序读段的至少60%、至少70%、至少80%、至少90%或至少95%。在一些实施方案中,使用所提供的错误鉴定和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA样品的测序读段的约50-60%、约60-70%、约70-80%、约80-90%、约50-80%、或约60-90%。在一些实施方案中,使用所提供的错误鉴定和校正工作流程可以导致生产性读段和拯救的生产性读段的组合平均为免疫受体cDNA样品的测序读段的约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%。
对于特定样品,当使用特定样品时,所提供的错误鉴定和校正工作流程可以导致生产性读段和拯救的生产性读段的组合小于免疫受体cDNA样品的测序读段的50%。这些样品包括,例如,其中RNA高度降解的那些,例如FFPE样品,以及其中靶免疫细胞的数量非常低的那些,例如具有非常低的T细胞计数的样品或来自经历严重的白细胞减少症的受试者的样品。因此,在一些实施方案中,使用所提供的错误鉴定和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA样品的测序读段的约30-50%、约40-50%、约30-40%、约40-60%、至少30%或至少40%。
在某些实施方案中,本发明的方法包括使用靶免疫受体引物组,其中引物针对相同靶免疫受体基因的序列。免疫受体选自T细胞受体和抗体受体。在一些实施方案中,T细胞受体是选自TCRα、TCRβ、TCRγ和TCRδ的T细胞受体。在一些实施方案中,免疫受体是选自重链α、重链δ、重链ε、重链γ、重链μ、轻链κ和轻链λ的抗体受体。
在某些实施方案中,提供了用于扩增样品中免疫受体组库的表达核酸序列的方法,包括使用以下至少组进行多重扩增反应以扩增具有恒定部分和可变部分的免疫受体核酸模板分子:i)多个V基因引物,其针对免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶恒定基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中使用每组进行扩增导致代表样品中相应免疫受体的整个组库的扩增子;从而产生包含免疫受体组库的免疫受体扩增子。在特定的实施方案中,i)的一个或多个V基因引物针对框架区的约80个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约50个核苷酸部分的序列。
在某些实施方案中,提供了用于扩增样品中免疫受体组库的表达核酸序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有恒定部分和可变部分的免疫受体核酸模板分子:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中使用每组进行扩增导致代表样品中相应免疫受体的整个组库的扩增子;从而产生包含免疫受体组库的免疫受体扩增子。在特定的实施方案中,i)的一个或多个V基因引物针对框架区的约80个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约50个核苷酸部分的序列。在一些实施方案中,i)的一个或多个V基因引物与模板分子的框架区1的至少一部分退火。在某些实施方案中,ii)的一种或多种C基因引物包含至少两种与模板分子的C基因部分的至少一部分退火的引物。在特定实施方案中,至少一组产生的扩增子包括免疫受体表达序列的互补决定区CDR1、CDR2和CDR3。在一些实施方案中,扩增子长度为约300至约600个核苷酸或长度为至少约350至约500个核苷酸。在一些实施方案中,方法中使用的核酸模板是通过逆转录从生物样品中提取的核酸分子产生的cDNA。
在某些实施方案中,提供了用于提供样品中免疫组库的序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有恒定部分和可变部分的免疫受体核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。然后进行所得免疫受体扩增子分子的测序,并由此确定免疫受体扩增子分子的序列,从而提供样品中免疫组库的序列。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,生产性读段和拯救的生产性读段的组合是免疫受体的测序读段的至少50%、至少60%、至少70%或至少75%。在另外的实施方案中,该方法还包括序列读取聚类和免疫受体克隆型报告。在一些实施方案中,将鉴定的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴定不存在该IMGT数据库的至少一种等位基因变体的序列。在一些实施方案中,平均序列读段长度为300至600个核苷酸,或350至550个核苷酸,或330至425个核苷酸,或约350至约425个核苷酸,这部分取决于在读段长度中包含任何条形码序列。在某些实施方案中,至少一组测序的扩增子包括免疫受体表达序列的互补决定区CDR1、CDR2和CDR3。
在特定实施方案中,提供的方法利用包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约70个核苷酸的FR1区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约50个核苷酸的FR1区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约90种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约50至约80种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约55至约75种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约60至约70种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含一种或多种C基因引物。在特定实施方案中,靶免疫受体引物组包含至少两个C基因引物,其中每个引物针对靶C基因内相同50个核苷酸区的至少一部分。
在具体的实施方案中,本发明的方法包括使用至少一组引物,其包含分别选自表2和4的V基因引物i)和C基因引物ii)。在其他某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89和181-184或选自SEQ ID NO:90-180和181-184的引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-155和181-182或选自SEQ ID NO:90-155和183-184的引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89和181-182或选自SEQ ID NO:1-89和183-184的引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180和181-182或选自SEQ ID NO:90-180和183-184的引物。在其他某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:1-64和183-184。在其他某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:1-64和181-182。在其他某些实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-153和181-182。在某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:90-92、95-155和181-182,或至少一组引物i)和ii)其包含引物SEQ ID NO:90-92、95-155和183-184。在其他某些实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-153和183-184。在其他某些实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-92、95-180和181-182。在其他某些实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-92、95-180和183-184。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQ ID NO:183-184的至少一个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ IDNO:181-182的至少一个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:183-184的至少一个引物。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:183-184的至少一个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:183-184的至少一个引物。
在某些实施方案中,提供了用于扩增样品中免疫受体组库的表达核酸序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有恒定部分和可变部分的免疫受体核酸模板分子:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中使用每组进行扩增导致代表样品中相应免疫受体的整个组库的扩增子;从而产生包含免疫受体组库的免疫受体扩增子。在特定的实施方案中,i)的一个或多个V基因引物针对框架区的约80个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约50个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约40至约60个核苷酸部分的序列。在一些实施方案中,i)的一个或多个V基因引物与模板分子的框架区3的至少一部分退火。在某些实施方案中,ii)的一种或多种C基因引物包含至少两种与模板分子的C基因的至少退火的引物。在特定实施方案中,至少一组产生的扩增子包括免疫受体表达序列的互补决定区CDR3。在一些实施方案中,扩增子长度为约80至约200个核苷酸、长度为约80至约140个核苷酸、长度为约90至约130个核苷酸或长度为至少约100至约120个核苷酸。在一些实施方案中,方法中使用的核酸模板是通过逆转录从生物样品中提取的核酸分子产生的cDNA。
在某些实施方案中,提供了用于提供样品中免疫组库的序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有恒定部分和可变部分的免疫受体核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。然后进行所得免疫受体扩增子分子的测序,并由此确定免疫受体扩增子分子的序列,从而提供样品中免疫组库的序列。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,生产性读段和拯救的生产性读段的组合是免疫受体的测序读段的至少50%、至少60%、至少70%或至少75%。在另外的实施方案中,该方法还包括序列读取聚类和免疫受体克隆型报告。在一些实施方案中,将鉴定的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴定不存在该IMGT数据库的至少一种等位基因变体的序列。在一些实施方案中,平均序列读段长度为80至185个核苷酸、115至200个核苷酸、90至130个核苷酸、或约100至约120个核苷酸,这部分取决于在读段长度中包含任何条形码序列。在某些实施方案中,至少一组测序的扩增子包括免疫受体表达序列的互补决定区CDR3。
在某些实施方案中,提供的方法利用包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约70个核苷酸的FR3区上的序列。在特定实施方案中,提供的方法利用包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约50个核苷酸的FR3区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约40至约60个核苷酸的FR3区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约80种不同的针对FR3的引物。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约50至约70种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约55至约65种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约58、59、60、61至约62种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含一种或多种C基因引物。在特定实施方案中,靶免疫受体引物组包含至少两个C基因引物,其中每个引物针对靶C基因内相同50个核苷酸区的至少一部分。
在具体的实施方案中,本发明的方法包括使用至少一组引物,其包含分别选自表3和4的V基因引物i)和C基因引物ii)。在其他某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和181-184或选自SEQ ID NO:249-312和181-184的引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和183-184或选自SEQ ID NO:185-248和181-182的引物。在其他某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:185-243和183-184。在其他某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:185-243和181-182。在其他某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312和181-182或选自SEQ ID NO:249-312和183-184的引物。在其他某些实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:249-307和181-182。在其他某些实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:249-307和183-184。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:183-184的至少一个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:183-184的至少一个引物。
在某些实施方案中,提供了用于扩增样品中免疫受体组库的表达核酸序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有恒定部分和V基因部分的免疫受体核酸模板分子:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区2(FR2)的至少一部分,和ii)一个或多个C基因引物,其针对相应免疫受体编码序列的至少一部分的C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中使用每组进行扩增导致代表样品中相应免疫受体的整个组库的扩增子;从而产生包含免疫受体组库的免疫受体扩增子。在特定的实施方案中,i)的一个或多个V基因引物针对框架区的约80个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约50个核苷酸部分的序列。在一些实施方案中,i)的一个或多个V基因引物与模板分子的FR2的至少一部分退火。在某些实施方案中,ii)的一种或多种C基因引物包含至少两种与模板分子的恒定部分C基因的至少退火的引物。在特定实施方案中,至少一组产生的扩增子包括免疫受体表达序列的互补决定区CDR2和CDR3。在其他实施方案中,扩增子长度为约180至约375个核苷酸、约200至约350个核苷酸、约225至约325个核苷酸、或长度约250至约300个核苷酸。在一些实施方案中,方法中使用的核酸模板是通过逆转录从生物样品中提取的核酸分子产生的cDNA。
在某些实施方案中,提供了用于提供样品中免疫组库的序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有恒定部分和可变部分的免疫受体核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。然后进行所得免疫受体扩增子分子的测序,并由此确定免疫受体扩增子分子的序列,从而提供样品中免疫组库的序列。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,生产性读段和拯救的生产性读段的组合是免疫受体的测序读段的至少40%、至少50%、至少60%、至少70%或至少75%。在另外的实施方案中,该方法还包括序列读取聚类和免疫受体克隆型报告。在一些实施方案中,将鉴定的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴定不存在该IMGT数据库的至少一种等位基因变体的序列。在一些实施方案中,平均序列读段长度为200至375个核苷酸、250至350个核苷酸、或约275至约350个核苷酸,这部分取决于在读段长度中包含任何条形码序列。在某些实施方案中,至少一组测序的扩增子包括免疫受体表达序列的互补决定区CDR2和CDR3。
在特定实施方案中,提供的方法利用包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约70个核苷酸的FR2区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约50个核苷酸的FR2区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约90种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约30至约60种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约20至约50种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约60至约70种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约20至约30种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含一种或多种C基因引物。在特定实施方案中,靶免疫受体引物组包含至少两个C基因引物,其中每个引物针对靶C基因内相同50个核苷酸区的至少一部分。
在具体的实施方案中,本发明的方法包括使用至少一组引物,其包含分别选自表6和4的V基因引物i)和C基因引物ii)。在某些其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和181-182的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和183-184的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQID NO:483-505和181-182。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:483-505和183-184。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:183-184的至少一个引物。
在某些实施方案中,提供了用于扩增样品中免疫受体组库的表达核酸序列的方法,包括使用以下至少组进行多重扩增反应以扩增具有J基因部分和V基因部分的免疫受体核酸模板分子:i)多个V基因引物,其针对免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中使用每组进行扩增导致代表样品中相应免疫受体的整个组库的扩增子;从而产生包含免疫受体组库的免疫受体扩增子。在特定的实施方案中,i)的一个或多个V基因引物针对框架区的约80个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约50个核苷酸部分的序列。在特定的实施方案中,ii)的一个或多个J基因引物针对J基因的约50个核苷酸部分的序列。在更特定的实施方案中,ii)的一个或多个J基因引物针对J基因的约30个核苷酸部分的序列。在某些实施方案中,ii)的一个或多个J基因引物针对完全在J基因内的序列。
在某些实施方案中,提供了用于扩增样品中免疫受体组库的表达核酸序列的方法,包括使用以下至少组进行多重扩增反应以扩增具有J基因部分和V基因部分的免疫受体核酸模板分子:i)多个V基因引物,其针对至少一种免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中使用每组进行扩增导致代表样品中相应免疫受体的整个组库的扩增子;从而产生包含免疫受体组库的免疫受体扩增子。在特定的实施方案中,i)的一个或多个V基因引物针对框架区的约80个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约50个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约40至约60个核苷酸部分的序列。在一些实施方案中,i)的一个或多个V基因引物与模板分子的框架区3的至少一部分退火。在某些实施方案中,ii)的多种J基因引物包含至少十种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少14种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少16种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少10至约20种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少12至18种与模板分子的J基因部分的至少一部分退火的引物。在特定实施方案中,至少一组产生的扩增子包括免疫受体表达序列的互补决定区CDR3。在一些实施方案中,扩增子长度为约60至约160个核苷酸、长度为约70至约100个核苷酸、长度为约70至约90个核苷酸、长度为至少约80至约90个核苷酸或长度为至少约80个核苷酸。在一些实施方案中,方法中使用的核酸模板是通过逆转录从生物样品中提取的核酸分子产生的cDNA。
在某些实施方案中,提供了用于提供样品中免疫组库的序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有J基因部分和V基因部分的免疫受体核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的多种J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。然后进行所得免疫受体扩增子分子的测序,并由此确定免疫受体扩增子分子的序列,从而提供样品中免疫组库的序列。在一些实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对,鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将推断的J基因序列加入序列读段以形成延伸的序列读段,将延伸的序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,生产性读段和拯救的生产性读段的组合是免疫受体的测序读段的至少50%、至少60%、至少70%或至少75%。在另外的实施方案中,该方法还包括序列读取聚类和免疫受体克隆型报告。在一些实施方案中,将鉴定的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴定不存在该IMGT数据库的至少一种等位基因变体的序列。在一些实施方案中,序列读段长度为约60至约185个核苷酸,这部分取决于在读段长度中包含任何条形码序列。在一些实施方案中,平均序列读段长度为70至90个核苷酸,或者为约75至约85个核苷酸,或者为约80个核苷酸。在某些实施方案中,至少一组测序的扩增子包括免疫受体表达序列的互补决定区CDR3。
在特定实施方案中,提供的方法利用包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约50个核苷酸的FR3区上的序列。在其他实施方案中,多个V基因引物中的一个或多个针对长度约70个核苷酸的FR3区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约40至约60个核苷酸的FR3区上的序列。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约80种不同的针对FR3的引物。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约50至约70种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约55至约65种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约58、59、60、61至约62种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含多种J基因引物。在一些实施方案中,靶免疫受体引物组包含至少十个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约10至约20个不同的J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含约12、13、14、15、16、17或18种不同的J基因引物。在具体实施方案中,靶免疫受体引物组包含约16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在具体实施方案中,靶免疫受体引物组包含约14个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。
在具体的实施方案中,本发明的方法包括使用至少一组引物,其包含分别选自表3和5的V基因引物i)和J基因引物ii)。在某些其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和313-397或选自SEQ ID NO:185-248和398-482的引物。在某些其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和313-329或选自SEQ ID NO:185-248和329-342的引物。在还其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和398-414或选自SEQ ID NO:185-248和414-427的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:185-243和313-328。在又其他实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:185-243和398-413。在某些其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312和313-397或选自SEQ ID NO:249-312和398-482的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ IDNO:249-312和313-329或选自SEQ ID NO:249-312和329-342的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312和398-414或选自SEQ ID NO:249-312和414-427的引物。在某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:249-312和398-413。在又其他实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:249-312和313-328。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ IDNO:185-248的至少50个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ IDNO:185-248的至少50个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在某些实施方案中,提供了用于扩增样品中免疫受体组库的表达核酸序列的方法,包括使用以下至少组进行多重扩增反应以扩增具有J基因部分和V基因部分的免疫受体核酸模板分子:i)多个V基因引物,其针对至少一种免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中使用每组进行扩增导致代表样品中相应免疫受体的整个组库的扩增子;从而产生包含免疫受体组库的免疫受体扩增子。在特定的实施方案中,i)的一个或多个V基因引物针对框架区的约80个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约50个核苷酸部分的序列。在一些实施方案中,i)的一个或多个V基因引物与模板分子的框架区1的至少一部分退火。在某些实施方案中,ii)的多种J基因引物包括至少十种与模板分子的J基因的至少退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少14种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少16种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少10至约20种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少12至18种与模板分子的J基因部分的至少一部分退火的引物。在特定实施方案中,至少一组产生的扩增子包括免疫受体表达序列的互补决定区CDR1、CDR2和CDR3。在其他实施方案中,扩增子长度为约220至约350个核苷酸、约225至约300个核苷酸、约250至约325个核苷酸、约250至约275个核苷酸、或长度约270至约300个核苷酸。在一些实施方案中,方法中使用的核酸模板是通过逆转录从生物样品中提取的核酸分子产生的cDNA。
在某些实施方案中,提供了用于提供样品中免疫组库的序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有J基因部分和V基因部分的免疫受体核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的多种J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。然后进行所得免疫受体扩增子分子的测序,并由此确定免疫受体扩增子分子的序列,从而提供样品中免疫组库的序列。在一些实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对,鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将推断的J基因序列加入序列读段以形成延伸的序列读段,将延伸的序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,生产性读段和拯救的生产性读段的组合是免疫受体的测序读段的至少50%、至少60%、至少70%或至少75%。在另外的实施方案中,该方法还包括序列读取聚类和免疫受体克隆型报告。在一些实施方案中,将鉴定的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴定不存在该IMGT数据库的至少一种等位基因变体的序列。在一些实施方案中,平均序列读段长度为200至350个核苷酸、225至325个核苷酸、250至300个核苷酸、270至300个核苷酸,或约295至约325个核苷酸,这部分取决于在读段长度中包含任何条形码序列。在某些实施方案中,至少一组测序的扩增子包括免疫受体表达序列的互补决定区CDR1、CDR2和CDR3。
在特定实施方案中,提供的方法利用包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约70个核苷酸的FR1区上的序列。在其他某些实施方案中,多个V基因引物中的一个或多个针对长度约80个核苷酸的FR1区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约50个核苷酸的FR1区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约90种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约50至约80种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约55至约75种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约60至约70种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含多种J基因引物。在一些实施方案中,靶免疫受体引物组包含至少十个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在特定实施方案中,靶免疫受体引物组包含至少16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约10至约20个不同的J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含约12、13、14、15、16、17或18种不同的J基因引物。在具体实施方案中,靶免疫受体引物组包含约16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在具体实施方案中,靶免疫受体引物组包含约14个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。
在具体的实施方案中,本发明的方法包括使用至少一组引物,其包含分别选自表2和5的V基因引物i)和J基因引物ii)。在某些其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89和313-397或选自SEQ ID NO:90-180和398-482的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89和398-482或选自SEQ ID NO:90-180和313-397的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-64和313-397或选自SEQ ID NO:1-64和398-482的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-64和313-329或选自SEQ ID NO:1-64和329-342的引物。在还其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-64和398-414或选自SEQ ID NO:1-64和414-427的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:1-64和313-328。在某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:1-64和398-413。在某些其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180和313-342或选自SEQ ID NO:90-180和398-427的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-155和313-342或选自SEQ ID NO:90-155和398-427的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-155和398-414或选自SEQ IDNO:90-155和414-427的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-155和313-329或选自SEQ ID NO:90-155和329-342的引物。在又其他实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQID NO:90-153和398-414。在又其他实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-153和313-328。在还其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-92、95-180和329-342或选自SEQID NO:90-92、95-180和313-329的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-92、95-180和398-414或选自SEQ ID NO:90-92、95-180和414-427的引物。在某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:90-92、95-180和398-413。在又其他实施方案中,本发明的方法包括使用i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-92、95-180和313-328。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在某些实施方案中,提供了用于扩增样品中免疫受体组库的表达核酸序列的方法,包括使用以下至少组进行多重扩增反应以扩增具有J基因部分和V基因部分的免疫受体核酸模板分子:i)多个V基因引物,其针对至少一种免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区2(FR2)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中使用每组进行扩增导致代表样品中相应免疫受体的整个组库的扩增子;从而产生包含免疫受体组库的免疫受体扩增子。在特定的实施方案中,i)的一个或多个V基因引物针对框架区的约80个核苷酸部分的序列。在更特定的实施方案中,i)的一个或多个V基因引物针对框架区的约50个核苷酸部分的序列。在一些实施方案中,i)的一个或多个V基因引物与模板分子的FR2的至少一部分退火。在某些实施方案中,ii)的多种J基因引物包括至少十种与模板分子的J基因的至少退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少14种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少16种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少10至约20种与模板分子的J基因部分的至少一部分退火的引物。在一些实施方案中,ii)的多种J基因引物包含至少12至18种与模板分子的J基因部分的至少一部分退火的引物。在特定实施方案中,至少一组产生的扩增子包括免疫受体基因序列的互补决定区CDR2和CDR3。在其他实施方案中,扩增子长度为约160至约270个核苷酸、约180至约250个核苷酸、或长度约195至约225个核苷酸。在一些实施方案中,方法中使用的核酸模板是通过逆转录从生物样品中提取的核酸分子产生的cDNA。
在某些实施方案中,提供了用于提供样品中免疫组库的序列的方法,包括使用以下至少一组进行多重扩增反应以扩增具有J基因部分和V基因部分的免疫受体核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的多种J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。然后进行所得免疫受体扩增子分子的测序,并由此确定免疫受体扩增子分子的序列,从而提供样品中免疫组库的序列。在一些实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对,鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将推断的J基因序列加入序列读段以形成延伸的序列读段,将延伸的序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在特定实施方案中,生产性读段和拯救的生产性读段的组合是免疫受体的测序读段的至少40%、至少50%、至少60%、至少70%或至少75%。在另外的实施方案中,该方法还包括序列读取聚类和免疫受体克隆型报告。在一些实施方案中,将鉴定的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴定不存在该IMGT数据库的至少一种等位基因变体的序列。在一些实施方案中,平均序列读段长度为160至300个核苷酸、180至280个核苷酸、200至260个核苷酸、或约225至约270个核苷酸,这部分取决于在读段长度中包含任何条形码序列。在某些实施方案中,至少一组测序的扩增子包括免疫受体表达序列的互补决定区CDR2和CDR3。
在特定实施方案中,提供的方法利用包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约70个核苷酸的FR2区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约50个核苷酸的FR2区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约90种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约30至约60种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约20至约50种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约60至约70种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约20至约30种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含多种J基因引物。在一些实施方案中,靶免疫受体引物组包含至少十个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在特定实施方案中,靶免疫受体引物组包含至少16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约10至约20个不同的J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含约12、13、14、15、16、17或18种不同的J基因引物。在具体实施方案中,靶免疫受体引物组包含约16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在具体实施方案中,靶免疫受体引物组包含约14个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。
在具体的实施方案中,本发明的方法包括使用至少一组引物,其包含分别选自表6和5的V基因引物i)和J基因引物ii)。在某些其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和313-397或选自SEQ ID NO:483-505和398-482的引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和313-342或选自SEQ ID NO:483-505和398-427的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和313-329或选自SEQ ID NO:483-505和329-342的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和398-414或选自SEQ IDNO:483-505和414-427的引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:483-505和313-328。在某些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含引物SEQ ID NO:483-505和398-413。
在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的方法包括使用至少一组引物i)和ii),其包含选自SEQ IDNO:483-505的至少20个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在某些实施方案中,本发明的方法包括使用选自造血细胞、淋巴细胞和肿瘤细胞的生物样品。在一些实施方案中,生物样品选自外周血单核细胞(PBMC)、T细胞、B细胞、循环肿瘤细胞和肿瘤浸润淋巴细胞(本文中称为“TILs”或“TIL”)。在一些实施方案中,生物样品包含经历离体活化和/或扩增的T细胞。
在一些实施方案中,提供了用于通过评估来自生物样品的表达的免疫受体RNA和重排的免疫受体基因组DNA(gDNA)来确定生物样品的免疫组库的方法、组合物和系统。可以使用本文提供的方法、组合物和系统评估样品的表达核酸序列。可以使用2017年9月1日提交的共同拥有的美国临时申请62/553,736中描述的方法、组合物和系统评估样品gDNA的重排免疫受体基因序列,该临时申请题为“用于免疫组库测序的组合物和方法”,其全部内容通过引用并入本文。在一些实施方案中,可以同时评估样品RNA和gDNA,并且在RNA逆转录以形成cDNA后,可以在相同的多重扩增反应中扩增cDNA和gDNA。在一些实施方案中,来自样品RNA和样品gDNA的cDNA可以在单独的反应中进行多重扩增。在一些实施方案中,来自样品RNA和样品gDNA的cDNA可以用平行引物库进行多重扩增。在一些实施方案中,针对相同的免疫受体的引物库用于评估来自样品的gDNA和RNA的免疫组库。在一些实施方案中,针对不同的免疫受体的引物库用于评估来自样品的gDNA和RNA的免疫组库。在一些实施方案中,多重扩增反应分别用来自样品RNA和样品gDNA的cDNA进行,以扩增来自样品的靶免疫受体分子,并对所得的免疫受体扩增子进行测序,从而提供生物样品的表达的免疫受体RNA和重排的免疫受体gDNA的序列。
在一些实施方案中,所提供的方法和组合物用于鉴定和/或表征受试者的免疫组库。在一些实施方案中,提供的方法和组合物用于鉴定和表征受试者免疫组库的新的或非经典的TCR或BCR等位基因。在一些实施方案中,将鉴定的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴定不存在该IMGT数据库的至少一种等位基因变体的序列。在一些实施方案中,使用例如克隆数支持、序列读段支持和/或具有等位基因变体的个体数量等标准,对IMGT数据库中缺失的鉴定的等位基因变体进行基于证据的过滤。可以将鉴定和报告为不存在于IMGT中的等位基因变体与包含免疫组库序列信息的其他数据库(例如NCBI NR数据库和Lym1K数据库)进行比较,以交叉验证报道的新的或非经典的TCR或BCR等位基因。例如,表征无记录或非经典的TRB多态性的存在可能有助于理解影响自身免疫疾病和对免疫疗法的反应的因素。因此,在一些实施方案中,提供方法和组合物以鉴定可预测或检测自身免疫疾病或免疫介导的不良事件的新的或非经典的TRBV基因等位基因多态性和等位基因变体。在其他实施方案中,提供了制备编码鉴定的新TRBV等位基因变体的重组核酸的方法。在一些实施方案中,提供了制备重组TRBV等位基因变体分子和制备表达其的重组细胞的方法。
在一些实施方案中,提供的方法和组合物用于鉴定和表征受试者免疫组库的新的或非经典的TCR或BCR等位基因。在一些实施方案中,可以在治疗性治疗例如治疗癌症或免疫病症之前和/或之后鉴定或表征患者的免疫组库。在一些实施方案中,免疫组库的鉴定或表征可用于评估治疗的效果或功效,改变治疗方案,以及优化治疗剂的选择。在一些实施方案中,免疫组库的鉴定或表征可用于评估患者对免疫疗法的反应,例如CAR(嵌合抗原受体)-T细胞疗法,癌症疫苗和/或其他基于免疫的治疗或其组合。在一些实施方案中,免疫组库的鉴定或表征可以指示患者对治疗剂的响应的可能性,或者可以指示患者对治疗剂没有响应的可能性。
在一些实施方案中,可以鉴定或表征患者的免疫组库以监测过度增殖性疾病的进展和/或治疗,包括在患者治疗后检测残留疾病,监测自身免疫疾病的进展和/或治疗,移植监测,以及监测抗原刺激的状况,包括在接种疫苗,暴露于细菌、真菌、寄生虫或病毒抗原,或被细菌、真菌、寄生虫或病毒感染之后。在一些实施方案中,免疫组库的鉴定或表征可用于评估患者对抗感染或抗炎疗法的反应。
在某些实施方案中,所提供的方法和组合物用于监测免疫组库克隆群体的变化,例如克隆扩展的变化、克隆收缩的变化、以及克隆或克隆群体的相对比率的变化。在一些实施方案中,所提供的方法和组合物用于监测响应于肿瘤生长的免疫组库克隆群体的变化(例如,克隆扩展、克隆收缩、相对比率的变化)。在一些实施方案中,所提供的方法和组合物用于监测响应于肿瘤治疗的免疫组库克隆群体的变化(例如,克隆扩展、克隆收缩、相对比率的变化)。在一些实施方案中,所提供的方法和组合物用于监测缓解期间的免疫组库克隆群体的变化(例如,克隆扩展、克隆收缩、相对比率的变化)。对于许多淋巴恶性肿瘤,克隆B细胞受体或T细胞受体序列可以用于特定癌症(例如,白血病)的恶性细胞的生物标志物并且用于监测残留疾病、肿瘤扩张、收缩和/或治疗反应。在某些实施方案中,可鉴定克隆B细胞受体或T细胞受体并进一步表征以证实治疗、生物标志物和/或诊断用途中的新用途。
在一些实施方案中,提供了用于鉴定和/表征受试者的样品中免疫组库克隆群体的方法和组合物,包括使用以下至少一组进行与所述样品或与从所述样品制备的cDNA的一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。该方法还包括对所得免疫受体扩增子分子进行测序,确定免疫受体扩增子分子的序列,以及从样品中鉴定靶免疫受体的一种或多种免疫组库克隆群。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行一种或多种多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行一种或多种多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区2(FR2)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。
在一些实施方案中,提供了用于鉴定和/表征受试者的样品中免疫组库克隆群体的方法和组合物,包括使用以下至少一组进行与所述样品或与从所述样品制备的cDNA的一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。该方法还包括对所得免疫受体扩增子分子进行测序,确定免疫受体扩增子分子的序列,以及从样品中鉴定靶免疫受体的一种或多种免疫组库克隆群。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将推断的J基因序列加入序列读段以形成延伸的序列读段,将延伸的序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区2(FR2)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。
在一些实施方案中,提供了用于监测受试者中免疫组库克隆群体的变化的方法和组合物,包括与受试者样品进行一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)一种或多种C基因引物,其针对免疫受体编码序列的相应靶C基因的至少一部分,对得到的免疫受体扩增子进行测序,从样品中鉴定靶免疫受体的免疫组库克隆群,并将鉴定的免疫组库克隆群与在不同时间从受试者获得的样品中已鉴定的免疫组库克隆群进行比较。在一些实施方案中,提供了用于监测受试者中免疫组库克隆群体的变化的方法和组合物,包括与受试者样品进行一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)多种J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,对得到的免疫受体扩增子进行测序,从样品中鉴定靶免疫受体的免疫组库克隆群,并将鉴定的免疫组库克隆群与在不同时间从受试者获得的样品中已鉴定的免疫组库克隆群进行比较。在各种实施方案中,在这些方法中进行的一种或多种多重扩增反应可以是单一多重扩增反应,或者可以是并行进行的两种或更多种多重扩增反应,例如用不同引物库进行的平行、高度多重扩增反应。用于监测免疫组库克隆群体变化的样品包括但不限于在诊断之前获得的样品,在诊断的任何阶段获得的样品,在缓解期间获得的样品,在治疗之前的任何时间获得的样品(治疗前样品),在治疗完成后的任何时间获得的样品(治疗后样品)和在治疗过程中获得的样品。
在某些实施方案中,提供了用于鉴定和/或表征患者的免疫组库以监测患者的过度增殖性疾病的进展和/或治疗的方法和组合物。在一些实施方案中,所提供的方法和组合物用于治疗后患者的最小残留疾病(MRD)监测。在一些实施方案中,所述方法和组合物用于鉴定和/或追踪B细胞谱系恶性肿瘤或T细胞谱系恶性肿瘤。在一些实施方案中,所述方法和组合物用于检测和/或监测诊断患有白血病或淋巴瘤的患者的MRD,包括但不限于急性淋巴细胞白血病、慢性髓性白血病、慢性淋巴细胞白血病、慢性髓性白血病、皮肤T细胞淋巴瘤、B细胞淋巴瘤、套细胞淋巴瘤和多发性骨髓瘤。在一些实施方案中,所述方法和组合物用于检测和/或监测诊断患有实体瘤的患者的MRD,所述实体瘤包括但不限于乳腺癌、肺癌、结肠直肠癌和神经母细胞瘤。在一些实施方案中,所述方法和组合物用于检测和/或监测癌症治疗后患者的MRD,癌症治疗包括但不限于骨髓移植、淋巴细胞输注、过继性T细胞疗法、其他基于细胞的免疫疗法和基于抗体的免疫疗法。
在一些实施方案中,提供了用于鉴定和/表征患者的免疫组库以监测患者的的过度增殖性疾病的进展和/或治疗的方法和组合物,包括使用以下至少一组引物进行与所述患者的样品或与从所述样品制备的cDNA的一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。该方法还包括对所得免疫受体扩增子分子进行测序,确定免疫受体扩增子分子的序列,以及从样品中鉴定靶免疫受体的免疫组库。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR3的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。
在一些实施方案中,提供了用于鉴定和/表征患者的免疫组库以监测患者的的过度增殖性疾病的进展和/或治疗的方法和组合物,包括使用以下至少一组引物进行与所述患者的样品或与从所述样品制备的cDNA的一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。该方法还包括对所得免疫受体扩增子分子进行测序,确定免疫受体扩增子分子的序列,以及从样品中鉴定靶免疫受体的免疫组库。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将推断的J基因序列加入序列读段以形成延伸的序列读段,将延伸的序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR1的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。
在一些实施方案中,提供了用于MRD监测患有过度增殖性疾病的患者的方法和组合物,包括与患者样品进行一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)一种或多种C基因引物,其针对免疫受体编码序列的相应靶C基因的至少一部分,对得到的免疫受体扩增子进行测序,鉴定靶免疫受体的免疫组库序列,并检测与所述增殖性疾病相关联的样品中免疫受体序列的存在或不存在。在一些实施方案中,提供了用于MRD监测患有过度增殖性疾病的患者的方法和组合物,包括与患者样品进行一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)多种J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,对得到的免疫受体扩增子进行测序,鉴定靶免疫受体的免疫组库序列,并检测与所述增殖性疾病相关联的样品中免疫受体序列的存在或不存在。在各种实施方案中,在这些方法中进行的一种或多种多重扩增反应可以是单一多重扩增反应,或者可以是并行进行的两种或更多种多重扩增反应,例如用不同引物库进行的平行、高度多重扩增反应。用于MRD监测的样品包括但不限于在缓解期间获得的样品,在完成治疗后的任何时间获得的样品(治疗后样品)和在治疗过程中获得的样品。
在某些实施方案中,提供了方法和组合物,用于响应于治疗鉴定和/或表征受试者的免疫组库。在一些实施方案中,所述方法和组合物用于在肿瘤治疗之前、期间和/或之后表征和/或监测肿瘤浸润淋巴细胞(TIL)的群体或克隆。在一些实施方案中,分析TIL的免疫受体组库提供肿瘤微环境和所述肿瘤微环境内T细胞扩张许可的表征和/或评估。例如,肿瘤内高度扩张的TIL克隆的缺乏,例如通过表征TCR组库的T细胞克隆大小的较高均匀性所指示的,可表明抑制性肿瘤微环境。另一方面,多个高度扩张的T细胞克隆和T细胞克隆大小的较低均匀性的鉴定可指示允许T细胞扩张的肿瘤微环境。在一些实施方案中,用于确定免疫组库的方法和组合物用于鉴定和/或跟踪治疗性T细胞群和B细胞群。在一些实施方案中,所提供的方法和组合物用于鉴定和/或监测患者治疗后基于细胞的疗法的持久性,包括但不限于工程化T细胞群的存在(例如持续存在),其包括但不限于CAR-T细胞群、TCR工程化T细胞群、持续CAR-T表达,施用的TIL群的存在(例如持续存在),过继性T细胞疗法后的TIL表达(例如持续表达)和/或异基因造血细胞移植之后的免疫重建。
在一些实施方案中,所提供的方法和组合物用于表征和/或监测在向患者施用基于细胞的疗法后存在于患者样品中的T细胞克隆或群体,所述基于细胞的疗法包括但不限于例如癌症疫苗细胞、CAR-T、TIL和/或其他基于工程T细胞的疗法。在一些实施方案中,所提供的方法和组合物用于在基于细胞的疗法后表征和/或监测患者样品中的免疫组库,以评估和/或监测患者对所施用的基于细胞的疗法的反应。用于基于细胞的治疗之后的这种表征和/或监测的样品包括但不限于来自患者的循环血细胞、循环肿瘤细胞、TIL、组织和肿瘤样品。
在一些实施方案中,提供了用于监测接受疗法的患者的基于T细胞的疗法的方法和组合物,包括与患者样品进行一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)一种或多种C基因引物,其针对免疫受体编码序列的相应靶C基因的至少一部分,对得到的免疫受体扩增子进行测序,鉴定靶免疫受体的免疫组库序列,并检测与所述基于T细胞的疗法相关联的样品中免疫受体序列的存在或不存在。在一些实施方案中,提供了用于监测接受疗法的患者的基于T细胞的疗法的方法和组合物,包括与患者样品进行一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)多种J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,对得到的免疫受体扩增子进行测序,鉴定靶免疫受体的免疫组库序列,并检测与所述基于T细胞的疗法相关联的样品中免疫受体序列的存在或不存在。
在一些实施方案中,提供了用于在施用基于T细胞的疗法后监测患者的反应的方法和组合物,包括与患者样品进行一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)一种或多种C基因引物,其针对免疫受体编码序列的相应靶C基因的至少一部分,对得到的免疫受体扩增子进行测序,鉴定靶免疫受体的免疫组库序列,并将鉴定的免疫组库与在不同时间从患者获得的样品中鉴定的免疫受体序列进行比较。在一些实施方案中,提供了用于在施用基于T细胞的疗法后监测患者的反应的方法和组合物,包括与患者样品进行一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)多种J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,对得到的免疫受体扩增子进行测序,鉴定靶免疫受体的免疫组库序列,并将鉴定的免疫组库与在不同时间从患者获得的样品中鉴定的免疫受体序列进行比较。适用于这种监测的基于T细胞的疗法包括但不限于CAR-T细胞、TCR工程化T细胞、TIL和其他富集的自体T细胞。在各种实施方案中,在这些方法中进行的一种或多种多重扩增反应可以是单一多重扩增反应,或者可以是并行进行的两种或更多种多重扩增反应,例如用不同引物库进行的平行、高度多重扩增反应。用于这种监测的样品包括但不限于在诊断之前获得的样品,在诊断的任何阶段获得的样品,在缓解期间获得的样品,在治疗之前的任何时间获得的样品(治疗前样品),在治疗完成后的任何时间获得的样品(治疗后样品)和在治疗过程中获得的样品。
在一些实施方案中,用于确定T细胞和/或B细胞受体组库的方法和组合物用于在治疗之前、期间和/或之后测量和/或评估免疫活性,所述治疗包括但不限于实体器官移植或骨髓移植。例如,T细胞受体β组库的多样性可用于测量造血干细胞移植治疗后的免疫活性和免疫细胞重建。此外,移植后时间点之间TRB组库的多样性变化率可用于修正患者治疗。
在一些实施方案中,提供了用于鉴定和/表征受试者响应治疗的免疫组库的方法和组合物,包括在开始治疗后从患者获得样品,使用以下至少一组进行与所述样品或与从所述样品制备的cDNA的一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。该方法还包括对所得免疫受体扩增子分子进行测序,确定免疫受体扩增子分子的序列,以及从样品中鉴定靶免疫受体的免疫组库。在一些实施方案中,所述方法还包括将来自治疗开始后获得的样品的鉴定的免疫组库与来自治疗前获得的患者样品的免疫组库进行比较。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR3的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。
在一些实施方案中,提供了用于鉴定和/表征受试者响应治疗的免疫组库的方法和组合物,包括在开始治疗后从患者获得样品,使用以下至少一组进行与所述样品或与从所述样品制备的cDNA的一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。该方法还包括对所得免疫受体扩增子分子进行测序,确定免疫受体扩增子分子的序列,以及从样品中鉴定靶免疫受体的免疫组库。在一些实施方案中,所述方法还包括将来自治疗开始后获得的样品的鉴定的免疫组库与来自治疗前获得的患者样品的免疫组库进行比较。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将推断的J基因序列加入序列读段以形成延伸的序列读段,将延伸的序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR1的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。
在一些实施方案中,提供了用于监测受试者响应于治疗的免疫组库的变化的方法和组合物,包括与受试者或患者样品进行一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)一种或多种C基因引物,其针对免疫受体编码序列的相应靶C基因的至少一部分,对得到的免疫受体扩增子进行测序,从样品中鉴定靶免疫受体的免疫组库序列,并将鉴定的免疫组库与在不同时间从受试者获得的样品中已鉴定的那些进行比较。在一些实施方案中,提供了用于监测受试者响应于治疗的免疫组库的变化的方法和组合物,包括与受试者或患者样品进行一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)多种J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,对得到的免疫受体扩增子进行测序,从样品中鉴定靶免疫受体的免疫组库序列,并将鉴定的免疫组库与在不同时间从受试者获得的样品中已鉴定的那些进行比较。在各种实施方案中,在这些方法中进行的一种或多种多重扩增反应可以是单一多重扩增反应,或者可以是并行进行的两种或更多种多重扩增反应,例如用不同引物库进行的平行、高度多重扩增反应。用于监测免疫组库变化的样品包括但不限于在诊断之前获得的样品,在诊断的任何阶段获得的样品,在缓解期间获得的样品,在治疗之前的任何时间获得的样品(治疗前样品),在治疗完成后的任何时间获得的样品(治疗后样品)和在治疗过程中获得的样品。
在某些实施方案中,所提供的方法和组合物用于表征和/或监测与免疫系统介导的不良事件相关的免疫组库,所述不良事件包括但不限于与炎性病症、自身免疫反应和/或自身免疫疾病或障碍相关的那些。在一些实施方案中,所提供的方法和组合物用于鉴定和/或监测与慢性自身免疫疾病或病症相关的T细胞和/或B细胞免疫组库,所述疾病或病症包括但不限于多发性硬化、I型糖尿病、嗜睡症、类风湿性关节炎、强直性脊柱炎、哮喘和SLE。在一些实施方案中,使用全身样品(例如血液样品)来确定具有自身免疫病症的个体的免疫组库。在一些实施方案中,使用局部样品,例如来自受影响的关节或肿胀区域的流体样品,确定具有自身免疫病症的个体的免疫组库。在一些实施方案中,将在局部或受影响区域样品中发现的免疫组库与在全身样品中发现的免疫组库进行比较,可以鉴定要去除的克隆T或B细胞群。
在一些实施方案中,提供了用于鉴定和/监测与患者的免疫系统介导的不良事件相关的免疫组库的方法和组合物,包括使用以下至少一组引物进行与所述患者的样品或与从所述样品制备的cDNA的一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。该方法还包括对所得免疫受体扩增子分子进行测序,确定免疫受体扩增子分子的序列,以及从样品中鉴定靶免疫受体的免疫组库。在一些实施方案中,该方法还包括将来自样品的鉴定的免疫组库与来自在不同时间获得的患者的样品的鉴定的免疫组库进行比较。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将初始序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR3的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的至少一部分的相应靶C基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。
在一些实施方案中,提供了用于鉴定和/监测与患者的免疫系统介导的不良事件相关的免疫组库的方法和组合物,包括使用以下至少一组引物进行与所述患者的样品或与从所述样品制备的cDNA的一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,从而产生免疫受体扩增子。该方法还包括对所得免疫受体扩增子分子进行测序,确定免疫受体扩增子分子的序列,以及从样品中鉴定靶免疫受体的免疫组库。在一些实施方案中,该方法还包括将来自样品的鉴定的免疫组库与来自在不同时间获得的患者的样品的鉴定的免疫组库进行比较。在特定实施方案中,确定免疫受体扩增子分子的序列包括获得初始序列读段,将推断的J基因序列加入序列读段以形成延伸的序列读段,将延伸的序列读段与参考序列比对并鉴定生产性读段,校正一个或多个插入缺失错误以产生拯救的生产性序列读段;并确定所得免疫受体分子的序列。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR1的至少一部分,和ii)多个J基因引物,其针对相应免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。在这种方法和组合物的其他实施方案中,使用以下至少一组引物进行所述多重扩增反应,所述至少一组引物包括i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)多个J基因引物,其针对相应免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体。
在一些实施方案中,提供了用于鉴定和/或监测与患者的免疫系统介导的不良事件的进展和/或治疗相关的免疫组库的方法和组合物,包括与患者样品进行一种或多种多重扩增反应以扩增具有恒定部分和可变部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1、FR2或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)一种或多种C基因引物,其针对免疫受体编码序列的相应靶C基因的至少一部分,对得到的免疫受体扩增子进行测序,鉴定样品的靶免疫受体的免疫组库序列,并将鉴定的免疫组库与在不同时间从患者获得的样品中鉴定的免疫组库进行比较。在一些实施方案中,提供了用于鉴定和/或监测与患者的免疫系统介导的不良事件的进展和/或治疗相关的免疫组库的方法和组合物,包括与患者样品进行一种或多种多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,其使用至少一组引物,所述至少一组引物针对包括V基因内的FR1或FR3的至少部分的至少一种免疫受体的编码序列的大多数不同的V基因,和ii)多种J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,对得到的免疫受体扩增子进行测序,鉴定样品的靶免疫受体的免疫组库序列,并将鉴定的免疫组库与在不同时间从患者获得的样品中鉴定的免疫组库进行比较。在各种实施方案中,在这些方法中进行的一种或多种多重扩增反应可以是单一多重扩增反应,或者可以是并行进行的两种或更多种多重扩增反应,例如用不同引物库进行的平行、高度多重扩增反应。用于监测与免疫系统介导的不良事件相关的免疫组库变化的样品包括但不限于在诊断之前获得的样品,在诊断的任何阶段获得的样品,在缓解期间获得的样品,在治疗之前的任何时间获得的样品(治疗前样品),在治疗完成后的任何时间获得的样品(治疗后样品)和在治疗过程中获得的样品。
在一些实施方案中,所提供的方法和组合物用于表征和/或监测与被动免疫相关的免疫组库,所述被动免疫包括自然获得的被动免疫和人工获得的被动免疫治疗。例如,所提供的方法和组合物可用于鉴定和/或监测保护性抗体,所述保护性抗体在将抗体介导的免疫力转移至受体后向受体提供被动免疫,包括但不限于怀孕期间从母体传递至胎儿或通过母乳喂养的婴儿或通过向接受者施用抗体传递的抗体介导的免疫力。在另一个实例中,所提供的方法和组合物可用于鉴定和/或监测与细胞介导的免疫力被动转移至接受者(例如将成熟的循环淋巴细胞施用于与供体组织相容的接受者)相关的B细胞和/或T细胞免疫组库。在一些实施方案中,所提供的方法和组合物用于监测接受者中被动免疫的持续时间。
在一些实施方案中,所提供的方法和组合物用于表征和/或监测与活性免疫或疫苗接种疗法相关的免疫组库。例如,在暴露于疫苗或感染因子后,所提供的方法和组合物可用于鉴定和/或监测可为暴露的个体提供主动免疫的保护性抗体或保护性克隆B细胞或T细胞群。在一些实施方案中,所提供的方法和组合物用于监测有助于暴露个体的免疫力的B或T细胞克隆的持续时间。在一些实施方案中,所提供的方法和组合物用于鉴定和/或监测与暴露于细菌、真菌、寄生虫或病毒抗原相关的B细胞和/或T细胞免疫组库。在一些实施方案中,所提供的方法和组合物用于鉴定和/或监测与细菌、真菌、寄生虫或病毒感染相关的B细胞和/或T细胞免疫组库。
在一些实施方案中,所提供的方法和组合物用于筛选或表征在体外生长和/或活化的淋巴细胞群,以用作免疫治疗剂或基于免疫治疗的方案。在一些实施方案中,所提供的方法和组合物用于筛选或表征在体外生长和/或活化的TIL群体或其他收获的T细胞群,例如,TIL或生长和/或活化以用于过继免疫疗法的其他收获的T细胞。在一些实施方案中,所提供的方法和组合物用于筛选或表征CAR-T群或体外生长和/或活化的其他工程化T细胞群,用于例如免疫疗法。
在一些实施方案中,所提供的方法和组合物用于通过在用于制造工程化T细胞制剂的离体工作流程期间监测免疫组库来评估细胞群,例如,用于质量控制或调节测试目的。
在一些实施方案中,如本文所述鉴定的新的或非经典的TCR或BCR等位基因的序列可用于产生重组TCR或BCR核酸或分子。例如,如本文所述,使用所提供的方法和组合物导致鉴定IMGT数据库中未发现的十五种TRB等位基因变体。这种新的或非经典的等位基因序列信息和扩增子可用于产生新的重组TRB等位基因变体和/或编码它们的核酸。
在一些实施方案中,所提供的方法和组合物用于筛选和/或生产重组抗体文库。提供的涉及鉴定BCR的组合物可用于快速评估重组抗体文库大小和组成以鉴定感兴趣的抗体。
在一些实施方案中,如本文提供的分析免疫受体库可以与分析免疫应答基因表达组合以提供肿瘤微环境的表征。在一些实施方案中,将肿瘤样品的免疫受体库谱与靶向免疫应答基因表达谱组合或相关联提供了对肿瘤微环境的更彻底的分析,并且可以建议或提供免疫疗法治疗的指导。
用于分析的合适细胞包括但不限于各种造血细胞、淋巴细胞和肿瘤细胞,例如外周血单核细胞(PBMC)、T细胞、B细胞、循环肿瘤细胞和肿瘤浸润淋巴细胞(TIL)。表达免疫球蛋白的淋巴细胞包括前B细胞、B细胞,例如记忆B细胞和浆细胞。表达T细胞受体的淋巴细胞包括胸腺细胞、NK细胞、前T细胞和T细胞,其中许多T细胞亚群是本领域已知的,例如Th1、Th2、Th17、CTL、Treg等。例如,在一些实施方案中,包含PBMC的样品可以用作TCR和/或抗体免疫组库分析的来源。样品可含有例如淋巴细胞、单核细胞和巨噬细胞以及抗体和其他生物成分。
免疫组库的分析对于涉及细胞增殖和抗原暴露的病症是有意义的,包括但不限于癌症的存在、暴露于癌抗原、暴露于来自感染因子的抗原、暴露于疫苗、暴露于过敏原、暴露于食物、移植物或植入物的存在、以及自身免疫活动或疾病的存在。与免疫缺陷相关的病症也有利于分析,包括先天性和后天性免疫缺陷综合征。
感兴趣的B细胞谱系恶性肿瘤包括但不限于多发性骨髓瘤;急性淋巴细胞白血病(ALL);复发/难治性B细胞ALL、慢性淋巴细胞白血病(CLL);弥漫性大B细胞淋巴瘤;粘膜相关淋巴组织淋巴瘤(MALT);小细胞淋巴细胞淋巴瘤;套细胞淋巴瘤(MCL);伯基特淋巴瘤;纵隔大B细胞淋巴瘤;巨球蛋白血症;淋巴结边缘区B细胞淋巴瘤(NMZL);脾边缘区淋巴瘤(SMZL);血管内大B细胞淋巴瘤;原发性积液淋巴瘤;淋巴瘤样肉芽肿等。非恶性B细胞过度增殖病症包括单克隆B细胞淋巴细胞增多症(MBL)。
感兴趣的T细胞谱系恶性肿瘤包括但不限于前体T细胞淋巴母细胞淋巴瘤;T细胞幼淋巴细胞白血病;T细胞颗粒淋巴细胞白血病;侵袭性NK细胞白血病;成人T细胞淋巴瘤/白血病(HTLV 1阳性);结外NK/T细胞淋巴瘤;肠病型T细胞淋巴瘤;肝脾γδT细胞淋巴瘤;皮下脂膜炎样T细胞淋巴瘤;蕈样真菌病/Sezary综合征;间变性大细胞淋巴瘤、T/null细胞;外周T细胞淋巴瘤;血管免疫母细胞性T细胞淋巴瘤;慢性淋巴细胞白血病(CLL);急性淋巴细胞白血病(ALL);幼淋巴细胞白血病;和毛细胞白血病。
感兴趣的其他恶性瘤包括但不限于急性髓样白血病、头颈癌、脑癌、乳癌、卵巢癌、子宫颈癌、结肠直肠癌、子宫内膜癌、胆囊癌、胃癌、膀胱癌、前列腺癌、睾丸癌、肝癌、肺癌、肾脏(肾细胞)癌、食道癌、胰脏癌、甲状腺癌、胆管癌、垂体肿瘤、威尔姆斯肿瘤(wilmstumor)、卡堡氏肉瘤(kaposi sarcoma)、骨肉瘤、胸腺癌、皮肤癌、心脏癌、口腔和咽喉癌症、神经母细胞瘤和非霍奇金式淋巴瘤(non-hodgkin lymphoma)。
神经炎性病症是有兴趣的,例如阿尔茨海默氏病、帕金森氏病、LouGehrig病等,以及脱髓鞘疾病,例如多发性硬化、慢性炎性脱髓鞘性多发性神经病等,以及炎性病症例如类风湿性关节炎。系统性红斑狼疮(SLE)是一种自身免疫疾病,其特征在于多克隆B细胞活化,其产生多种抗蛋白和非蛋白自身抗体(参见Kotzin等(1996)Cell 85:303-306)。这些自身抗体形成免疫复合物,其沉积在多个器官系统中,导致组织损伤。自身免疫成分可归因于动脉粥样硬化,其中候选自身抗原包括Hsp60、氧化的LDL和2-糖蛋白I(2GPI)。
用于本文所述方法的样品可以是从患有恶性肿瘤或过度增殖病症的受试者收集的样品,包括淋巴瘤、白血病和浆细胞瘤。淋巴瘤是淋巴细胞来源的固体肿瘤,并且最常见于淋巴组织中。因此,例如,来自包含这种淋巴瘤的淋巴结(例如扁桃体)的活组织检查将构成合适的活组织检查。可以在疾病进展和/或疾病治疗的一个或多个时间点从受试者或患者获得样品。
在一些实施方案中,本公开提供了使用具有可切割基团的引物对具有多个表达的免疫受体靶序列的cDNA样品进行靶特异性多重PCR的方法。
在某些实施方案中,待测序的文库和/或模板制剂使用自动化系统,例如IonChefTM系统,使用本文提供的组合物从核酸样品群自动制备。
如本文所用,术语“受试者”包括人、患者、个体、被评估的人等。
如本文所用,术语“包含(comprises/comprising)”、“包括(includes/including)”、“具有(has/having)”或其任何其它变化形式打算涵盖非排它性的包括。举例来说,包含一列特征的工艺、方法、物件或设备不一定仅限于那些特征,而是可包括没有明确列出或这类工艺、方法、物件或设备所固有的其它特征。另外,除非明确相反地陈述,否则“或”是指包括性的或而不是排它性的或。
如本文所用,“抗原”是指当被引入例如受试者体内时可刺激免疫应答的任何物质,例如产生识别抗原的抗体或T细胞受体。抗原包括分子,例如核酸、脂质、核糖核蛋白复合物、蛋白质复合物、蛋白质、多肽、肽和这些分子的天然存在的或合成的修饰,对所述分子可以产生涉及T和/或B淋巴细胞的免疫应答。关于自身免疫疾病,本文的抗原通常称为自身抗原。关于过敏性疾病,本文的抗原通常称为过敏原。自身抗原是由可以是免疫应答的靶标的生物体产生的任何分子,包括在生物体基因组内编码的肽、多肽和蛋白质以及这些肽、多肽和蛋白质的翻译后产生的修饰。此类分子还包括碳水化合物、脂质和由生物体产生的其他分子。抗原还包括疫苗抗原,其包括但不限于病原体抗原、癌症相关抗原、过敏原等。
如本文所用,“扩增(amplify)”、“扩增(amplifying)”或“扩增反应”及其衍生词是指复制或拷贝至少一部分核酸分子(称为模板核酸分子)到至少一种另外的核酸分子中的任何作用或过程。另外的核酸分子任选地包括与模板核酸分子的至少一些部分基本上相同或基本上互补的序列。模板核酸分子可以是单链或双链并且另一个核酸分子可以独立地是单链或双链。在一些实施方案中,扩增包括模板依赖性活体外酶催化反应,其用于制备核酸分子的至少某一部分的至少一个拷贝或制备与核酸分子的至少某一部分互补的核酸序列的至少一个拷贝。扩增任选地包括核酸分子的线性或指数复制。在一些实施方案中,使用等温条件进行这类扩增;在其它实施方案中,这类扩增可包括热循环。在一些实施方案中,扩增是多元扩增,其包括在单次扩增反应中同时扩增多个靶序列。至少一些靶序列可单次扩增反应中所包括的相同核酸分子或不同靶核酸分子上。在一些实施方案中,“扩增”包括单独或呈组合形式的基于DNA和RNA的核酸的至少某一部分的扩增。扩增反应可包括单链或双链核酸底物并且可进一步包括所属领域的一般技术人员已知的扩增方法中的任一种。在一些实施方案中,扩增反应包括聚合酶链反应(PCR)。
如本文中所使用,“扩增条件”和其派生词指适用于扩增一个或多个核酸序列的条件。这类扩增可以是线性或指数的。在一些实施方案中,扩增条件可包括等温条件或可包括热循环条件,或等温和热循环条件的组合。在一些实施方案中,适用于扩增一个或多个核酸序列的条件包括聚合酶链反应(PCR)条件。通常,扩增条件指足以扩增核酸(如一个或多个靶序列)或扩增接合到一个或多个衔接子的经扩增的靶序列(例如衔接子接合的经扩增的靶序列)的反应混合物。扩增条件包括用于扩增或用于核酸合成的催化剂,例如聚合酶;与待扩增的核酸具有一定程度的互补性的引物;以及核苷酸,诸如脱氧核糖核苷酸三磷酸酯(dNTP),以促进与核酸杂交之后引物的延伸。扩增条件需要引物与核酸的杂交或粘接,引物的延伸和变性步骤,其中经延伸的引物与经历扩增的核酸序列分离。通常但未必,扩增条件可包括热循环,在一些实施方案中,扩增条件包括多个循环,其中重复粘接、延伸和分离步骤。通常,扩增条件包括阳离子,如Mg2+或Mn2+(例如MgCl2等),并且还可以包括多种离子强度调节剂。
如本文中所使用,“靶序列”或“目标靶序列”和其派生词指可根据本发明扩增或合成的任何单链或双链核酸序列,包括怀疑或预期样品中存在的任何核酸序列。在一些实施方案中,在添加靶特异性引物或附接衔接子之前,靶序列以双链形式存在并且包括待扩增或合成的具体核苷酸序列的至少一部分或其补体。靶序列可包括可与适用于扩增或合成反应的引物在聚合酶延伸之前杂交的核酸。在一些实施方案中,所述术语指核酸序列。其序列一致性、核苷酸的次序或位置由本发明的方法中的一种或多种测定。
如本文中所定义,“样品”和其派生词以其最广泛含义使用并且包括任何怀疑包括目标的样品、培养物等。在一些实施方案中,样品包含cDNA、RNA、PNA、LNA、嵌合、杂交或多重形式的核酸。样品可包括任何含有一个或多个核酸的基于生物、临床、手术、农业、大气压或水生的样品。所述术语还包括任何经分离的核酸样品,例如表达RNA、新鲜冷冻或福尔马林(formalin)固定的石蜡包埋的核酸样品。
如本文中所使用,当关于两种或更多种组分使用时,“接触”和其派生词是指用于促进或实现参考组分的接近、靠近、混合物或共混而未必需要这类组分的物理接触的任何过程,并且包括含有所述参考组分中的任一种或多种的溶液的彼此混合。所提及的组分可以任何具体顺序或组合接触并且组分引述的具体顺序不具限制性。例如,“使A与B和C接触”包括其中A首先与B然后与C接触的实施方案,以及其中C与A然后与B接触的实施方案,以及其中A和C的混合物与B接触的实施方案,等等。此外,这种接触不一定要求接触过程的最终结果是包括所有提及组分的混合物,只要在接触过程中的某些时间点,所有提及组分同时存在或同时包含在同一混合物或溶液中。当待接触的一个或多个提及组分包括多个(例如,“使靶序列与多个靶特异性引物和聚合酶接触”)时,所述多个中的每个成员可以被视为接触过程的单个组分,使得接触可以包括多个中的任何一个或多个成员与多个中的任何其他成员和/或与任何其他提及组分以任何顺序或组合接触(例如,多个靶特异性引物中的一些但不是全部可以接触靶序列,然后是聚合酶,然后与多个靶特异性引物的其他成员接触)。
如本文中所使用,术语“引物”和其派生物指可与相关靶序列杂交的任何多核苷酸。在一些实施方案中,引物也可以用于激活核酸合成。典型地,引物充当底物,其上可由聚合酶聚合核苷酸;然而,在一些实施方案中,引物可变得并入合成的核酸链中并且提供另一引物可杂交的位点以激活与所合成的核酸分子互补的新股的合成。引物可包含核苷酸或其类似物的任何组合,其可任选地连接以形成任何适合长度的线形聚合物。在一些实施方案中,引物是单链寡核苷酸或多核苷酸。(在本发明中,术语“多核苷酸”和“寡核苷酸”在本文中可互换地使用并且未必指示两个核苷酸之间长度的任何差异)。在一些实施方案中,引物是单链,但其也可以是双链。引物任选地天然产生,如在纯化的限制消化中,或可以合成方式产生。在一些实施方案中,当暴露于扩增或合成条件时,引物充当用于扩增或合成的起始点;这类扩增或合成可以模板依赖性方式进行并且任选地形成与至少一部分靶序列互补的引物延伸产物。例示性扩增或合成条件可包括使引物与多核苷酸模板(例如包括靶序列的模板)、核苷酸和诱导剂(如聚合酶)在适合的温度和pH值下接触,以诱导靶特异性引物的末端上核苷酸的聚合。如果是双链,在用于制备引物延伸产物之前,引物可任选地经处理以分离其各股。在一些实施方案中,引物是寡脱氧核苷酸或寡核糖核苷酸。在一些实施方案中,引物可包括一个或多个核苷酸类似物。靶特异性引物的确切长度和/或组成(包括序列)可影响许多特性,包括熔融温度(Tm)、GC含量、次要结构的形成、重复核苷酸主结构、所预测的引物延伸产物的长度、跨越相关核酸分子的覆盖度的程度、单次扩增或合成反应中的引物数目、引物内是否存在核苷酸类似物或经修饰的核苷酸等。在一些实施方案中,引物可在扩增或合成反应内与相容的引物配对以形成由正向引物和反向引物组成的引物对。在一些实施方案中,引物对的正向引物包括基本上与核酸分子的一个股的至少一部分互补的序列,并且引物对中引物的反向引物包括基本上与所述股线的至少一部分一致的序列。在一些实施方案中,正向引物和反向引物能够与核酸双螺旋的相对股杂交。任选地,正向引物激活第一核酸链的合成,并且反向引物激活第二核酸链的合成,其中第一和第二股基本上彼此互补,或可杂交以形成双链核酸分子。在一些实施方案中,扩增或合成产物的一端由正向引物定义并且扩增或合成产物的另一端由反向引物定义。在一些实施方案中,当需要扩增或合成冗长引物延伸产物(如扩增外显子、编码区或基因)时,可产生若干引物对而非跨越所需长度以实现所述区域的足够扩增。在一些实施方案中,引物可包括一个或多个可裂解基团。在一些实施方案中,引物长度在约10到约60个核苷酸、约12到约50个核苷酸和约15到约40个核苷酸长度范围内。典型地,当在存在dNTP和聚合酶的情况下暴露于扩增条件时,引物能够与相应的靶序列杂交并且进行引物延伸。在一些实施方案中,引物在引物内的一个或多个位置包括一个或多个可裂解基团。
如本文中所使用,“靶特异性引物”和其派生物指单链或双链多核苷酸,通常是寡核苷酸,其包括至少一个与包括靶序列的核酸分子的至少一部分至少50%互补,通常至少75%互补或至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%或至少99%互补或一致的序列。在这类情况下,靶特异性引物和靶序列描述成彼此“相应”。在一些实施例中,靶特异性引物能够与其相应靶序列的至少一部分(或靶序列的补体)杂交;这类杂交可任选地在标准杂交条件下或在严格杂交条件下进行。在一些实施方案中,靶特异性引物不能与靶序列或其补体杂交,但能够与包括靶序列的核酸链的一部分或其补体杂交。在一些实施方案中,靶特异性引物包括至少一个与靶序列本身的至少一部分至少75%互补,通常至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%互补或更通常至少99%互补的序列;在其它实施例中,靶特异性引物包括至少一个与除靶序列以外的核酸分子的至少一部分至少75%互补,通常至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%互补或更通常至少99%互补的序列。在一些实施方案中,靶特异性引物基本上不与样品中的其它靶序列互补;任选地,靶特异性引物基本上不与样品中的其它核酸分子互补。在一些实施方案中,样品中不包括或对应于靶序列(或靶序列的补体)的核酸分子称为“非特异性”序列或“非特异性核酸”。在一些实施方案中,靶特异性引物经设计以包括基本上与其相应靶序列的至少一部分互补的核苷酸序列。在一些实施方案中,靶特异性引物与包括其相应靶序列的核酸分子的至少一部分至少95%互补或至少99%互补或一致(跨越其全部长度)。在一些实施方案中,靶特异性引物与其相应靶序列的至少一部分至少90%、至少95%互补、至少98%互补或至少99%互补或一致(跨越其全部长度)。在一些实施例中,正向靶特异性引物和反向靶特异性引物定义靶特异性引物对,其用于经由模板依赖性引物延伸来扩增靶序列。通常,靶特异性引物对中的每个引物包括至少一个与包括相应靶序列的核酸分子的至少一部分基本上互补,但与样品中的至少一个其它靶序列小于50%互补的序列。在一些实施例中,扩增在单次扩增反应中使用多个靶特异性引物对进行,其中每个引物对包括正向靶特异性引物和反向靶特异性引物,各自包括至少一个与样品中的相应靶序列基本上互补或基本上相同的序列,并且每个引物对具有不同的相应靶序列。在一些实施方案中,靶特异性引物在其3'端或其5'端与扩增反应中的任何其它靶特异性引物是基本上非互补性。在一些实施方案中,靶特异性引物可包括扩增反应中与其它靶特异性引物的最小交叉杂交。在一些实施方案中,靶特异性引物包括与扩增反应混合物中非特异性序列的最小交叉杂交。在一些实施方案中,靶特异性引物包括最小自身互补性。在一些实施方案中,靶特异性引物可包括位于3'端的一个或多个可裂解基团。在一些实施方案中,靶特异性引物可包括位于靶特异性引物的中心核苷酸附近或周围的一个或多个可裂解基团。在一些实施方案中,更多个靶特异性引物中的一个仅包括靶特异性引物的5'端处的非可裂解核苷酸。在一些实施方案中,任选地在相同扩增反应中,与一个或多个不同靶特异性引物相比,靶特异性引物包括引物的3'端或5'端处的最小核苷酸序列重叠。在一些实施方案中,单一反应混合物中的1、2、3、4、5、6、7、8、9、10种或更多种靶特异性引物包括以上实施例中的一个或多个。在一些实施方案中,单一反应混合物中基本上所有的多种靶特异性引物包括以上实施例中的一个或多个。
如本文中使用,“聚合酶”和其派生词指可催化核苷酸(包括其类似物)聚合成核酸链的任何酶。典型地但未必,这类核苷酸聚合可以模板依赖性方式进行。这类聚合酶可以包括(但不限于)天然存在的聚合酶和其任何子单元和截断、突变聚合酶、变异聚合酶、重组、融合或以其它方式工程改造的聚合酶、经化学修饰的聚合酶、合成分子或组件以及保留催化这类聚合的能力的任何类似物、衍生物或其片段。任选地,聚合酶是包含一个或多个突变的突变型聚合酶,所述突变涉及用其它氨基酸替换一个或多个氨基酸,来自聚合酶的一个或多个氨基酸的插入或缺失或两个或更多个聚合酶的部分的连接。典型地,聚合酶包含可以进行核苷酸结合和/或核苷酸聚合催化的一个或多个活性位点。一些例示性聚合酶包括(但不限于)DNA聚合酶和RNA聚合酶。如本文中所使用,术语“聚合酶”和其变化形式也指包含至少两个彼此连接的部分的融合蛋白,其中第一部分包含可以催化核苷酸聚合成核酸链的肽并且所述第一部分连接到包含第二多肽的第二部分。在一些实施方案中,第二多肽可以包括报导子酶或增强持续合成能力的结构域。任选地,聚合酶可具有5'外切核酸酶活性或末端转移酶活性。在一些实施方案中,聚合酶任选地再活化,例如通过使用热、化学物质或将新的量的聚合酶再添加到反应混合物中。在一些实施方案中,聚合酶可包括任选地再活化的热起始聚合酶或基于适体的聚合酶。
如本文中使用,术语“核苷酸”和其派生词包含任何可选择性结合于聚合酶或通过聚合酶聚合的化合物,包括(但不限于)任何天然存在的核苷酸或其类似物。典型地但未必,核苷酸与聚合酶的选择性结合后面是核苷酸通过聚合酶聚合成核酸链;然而偶尔,核苷酸可从聚合酶解离而不变得掺入到核酸链中。这类核苷酸不仅包括天然存在的核苷酸,而且包括可以与聚合酶选择性结合或可以通过聚合酶聚合的任何类似物(与其结构无关)。虽然天然存在的核苷酸典型地包含碱基、糖和磷酸酯部分,但本发明的核苷酸可以包括不具有这类部分中的任一个、一些或全部的化合物。在一些实施方案中,核苷酸可以任选地包括包含三个、四个、五个、六个、七个、八个、九个、十个或更多个磷原子的磷原子链。在一些实施方案中,磷链附接到糖环的任何碳,如5’碳。磷链可以用插入的O或S连接到糖。在一个实施方案中,链中的一个或多个磷原子可以是具有P和O的磷酸基的一部分。在另一个实施例中,链中的磷原子用插入的O、NH、S、亚甲基、经取代的亚甲基、亚乙基、经取代的亚乙基、CNH2、C(O)、C(CH2)、CH2CH2或C(OH)CH2R(其中R可以是4-吡啶或1-咪唑)连接在一起。在一个实施方案中,链中的磷原子具有含O、BH3或S的侧基。在磷链中,具有除O以外的侧基的磷原子可以是经取代的磷酸基。在磷链中,具有除O以外的插入原子的磷原子可以是经取代的磷酸基。核苷酸类似物的一些实例描述于美国专利第7,405,281号中。在一些实施方案中,核苷酸包含标记并且在本文中称为“经标记的核苷酸”;经标记的核苷酸的标记在本文中称为“核苷酸标记”。在一些实施方案中,标记是附着于末端磷酸基团即最远离糖的磷酸基团的荧光染料的形式。可以用于所公开的方法和组合物中的核苷酸的一些实例包括(但不限于)核糖核苷酸、脱氧核糖核苷酸、经修饰的核糖核苷酸、经修饰的脱氧核糖核苷酸、核糖核苷酸聚磷酸、脱氧核糖核苷酸聚磷酸、经修饰的核糖核苷酸聚磷酸、经修饰的脱氧核糖核苷酸聚磷酸、肽核苷酸、经修饰的肽核苷酸、金属核苷酸、膦酸核苷和经修饰的磷酸-糖主链核苷酸,前述化合物的类似物、衍生物或变异体等。在一些实施方案中,核苷酸可包含非氧部分(如硫基或硼烷部分)代替氧部分,所述氧部分桥连核苷酸的α磷酸酯与糖、或核苷酸的α与β磷酸酯、或核苷酸的β与γ磷酸酯、或核苷酸的任何其它两种磷酸酯之间、或其任何组合。“核苷酸5'-三磷酸”指在5'位置具有三磷酸酯基并且有时表示为“NTP”或“dNTP”和“ddNTP”以具体指出核糖的结构特征的核苷酸。三磷酸酯基可包括硫取代各种氧,例如α-硫基-核苷酸5'-三磷酸。关于核酸化学的综述,参见:Shabarova,Z.和Bogdanov,A.,《核酸的高级有机化学(Advanced Organic Chemistry of Nucleic Acids)》,VCH,New York,1994。
如本文中所使用,当关于既定引物使用时,术语“延伸”和其派生词包含涉及一个或多个核苷酸在现有核酸分子的末端上的聚合的既定聚合酶的任何体内或体外酶促活性特征。典型地但未必,这类引物延伸以模板依赖性方式进行;在模板依赖性延伸期间,通过既定碱基配对规则进行碱基的排序和选择,所述规则可包括沃森-克里克型碱基配对规则,或(并且尤其在涉及核苷酸类似物的延伸反应的情况下)通过一些其它类型的碱基配对范例进行。在一个非限制性实例中,延伸通过聚合酶经由核酸分子的3'OH端上核苷酸的聚合进行。
如本文所用,术语“部分”及其派生词,当用于提及给定的核酸分子例如引物或模板核酸分子时,在核酸分子的长度(包括核酸分子的部分或全部长度)内包含任何数目的连续核苷酸。
如本文所用,术语“同一性”和“相同的”及其派生词,当用于提及两个或更多个核酸序列时,是指两个或更多个序列(例如,核苷酸或多肽序列)的序列相似性。在两个或更多个同源序列的背景下,序列或其子序列的百分比同一性或同源性表示相同的所有单体单元(例如,核苷酸或氨基酸)的百分比(即,约70%同一性,优选75%、80%、85%、90%、95%、98%或99%同一性)。当比较并对齐以在比较窗口上进行最大对应,或者使用具有下述默认参数的BLAST或BLAST 2.0序列比较算法或通过手动对齐和目视检查测量的指定区域时,百分比同一性可以在整个指定区域上。当在氨基酸水平或核苷酸水平上具有至少85%的同一性时,序列被称为“基本相同”。优选地,同一性存在于长度为至少约25、50或100个残基的区域上,或者在至少一个比较序列的整个长度上。确定序列一致性百分比和序列相似性的典型算法的实例是BLAST算法和BLAST 2.0算法,其分别描述于Altschul等人Nuc.AcidsRes.25:3389-3402(1977)。其他方法包括Smith&Waterman,Adv.Appl.Math.2:482(1981)和Needleman&Wunsch,J.Mol.Biol.48:443(1970)等的算法。两个核酸序列基本相同的另一指示是两个分子或它们的互补序列在严格条件下彼此杂交。
如本文中所使用,术语“互补”和“补体”以及其派生词指可在反平行定向(如在杂交双螺旋中)的两个或更多个个别相应位置经历累积碱基配对的任何两个或更多个核酸序列(例如部分或全部模板核酸分子、靶序列及/或引物)。这类碱基配对可根据任何现有规则集合进行,例如根据沃森-克里克碱基配对规则(Watson-Crick base pairing rules)或根据一些其它碱基配对范例。任选地,第一与第二核酸序列之间可以存在“完全”或“总体”互补性,其中第一核酸序列中的每个核苷酸可以经历与第二核酸序列上的相应的反平行位置中的核苷酸的稳定化碱基配对相互作用。“部分”互补性描述一个核酸序列的至少20%但少于100%的残基与另一个核酸序列残基互补的核酸序列。在一些实施方案中,一个核酸序列的至少50%但少于100%的残基与另一个核酸序列中的残基互补。在一些实施方案中,一个核酸序列的至少70%、80%、90%、95%或98%但少于100%的残基与另一个核酸序列中的残基互补。当一个核酸序列的至少85%的残基与另一个核酸序列中的残基互补时,序列被称为“基本上互补”。在一些实施方案中,两个互补或基本上互补序列能够在标准或严格杂交条件下彼此杂交。“非互补”描述其中一个核酸序列的少于20%的残基与另一个核酸序列中的残基互补的核酸序列。当一个核酸序列的少于15%的残基与另一个核酸序列中的残基互补时,序列被称为“基本上非互补”。在一些实施方案中,两个非互补或基本上非互补序列无法在标准或严格杂交条件下彼此杂交。“错配”存在于不互补的两个相对核苷酸中的序列中的任何位置。互补核苷酸包括在生理条件下在DNA复制期间通过与彼此相对的DNA聚合酶有效并入的核苷酸。在典型实施方案中,在彼此位于反平行位置的核苷酸及/或多核苷酸的核碱基之间,互补核苷酸可彼此形成碱基对,如通过特异性沃森-克里克型氢键形成的A-T/U和G-C碱基对,或通过某种其它类型的碱基配对范例形成的碱基对。其它人工碱基对的互补性可以是基于其它类型的氢键和/或碱基的疏水性和/或碱基之间的形状互补性。
如本文所用,“扩增的靶序列”及其衍生物是指通过使用靶特异性引物和本文提供的方法扩增/扩增靶序列而产生的核酸序列。扩增的靶序列可以是关于靶序列相同的有义(在第二轮和随后的偶数轮扩增中产生的正链)或反义(即在第一轮和随后的奇数轮扩增期间产生的负链)。在一些实施方案中,扩增的靶序列与反应中另一扩增的靶序列的任何部分互补小于50%。在其他实施方案中,扩增的靶序列与反应中另一扩增的靶序列的任何部分互补大于50%、大于60%、大于70%、大于80%或大于90%。
如本文中所使用,术语“接合”和其派生词指用于将两个或更多个分子共价连接在一起(例如使两个或更多个核酸分子彼此共价连接)的动作或方法。在一些实施方案中,接合包括核酸的相邻核苷酸之间的结合口。在一些实施方案中,接合包括形成第一核酸分子的末端与第二核酸分子的末端之间的共价键。在一些实施方案中,例如其中待接合的核酸分子包括常规核苷酸残基的实施例,接合可包括形成一个核酸的5'磷酸基与第二核酸的3'羟基之间的共价键,从而形成经接合的核酸分子。在一些实施方案中,可使用任何用于在相邻核苷酸之间使5'磷酸与3'羟基接合或结合的方法。在例示性实施方案中,使用酶,如连接酶。出于本公开的目的,经扩增的靶序列可与衔接子接合以产生衔接子接合的经扩增的靶序列。
如本文中所使用,“连接酶”和其派生词指任何能够催化两个底物分子的接合的试剂。在一些实施方案中,连接酶包括能够催化核酸的相邻核苷酸之间的接口的接合的酶。在一些实施方案中,连接酶包括能够催化一个核酸分子的5'磷酸与另一个核酸分子的3'羟基之间形成共价键,从而形成经接合的核酸分子的酶。在一些实施方案中,连接酶是等温连接酶。在一些实施方案中,连接酶是热稳定连接酶。适合的连接酶可包括(但不限于)T4 DNA连接酶、T4 RNA连接酶以及大肠杆菌(E.coli)DNA连接酶。
如本文所用,“连接条件”及其衍生物是指适合于将两个分子彼此连接的条件。在一些实施方案中,连接条件适合于密封核酸之间的切口或间隙。如本文所定义,“切口”或“间隙”是指在核酸序列的内部核苷酸内缺少单核苷酸戊糖环的5'磷酸直接与相邻单核苷酸戊糖环的3'羟基结合的核酸分子。如本文所用,术语切口或间隙与本领域术语的使用一致。通常,切口或间隙在适当的温度和pH下在酶例如连接酶的存在下连接。在一些实施方案中,T4 DNA连接酶可在约70-72℃的温度在核酸之间加入切口。
如本文中所使用,“钝端连接”和其派生词指两个钝端双链核酸分子彼此连接。“钝端”指其中核酸分子的一个股的末端中的基本上所有核苷酸与同一个核酸分子的另一个股中的相对核苷酸碱基配对的双链核酸分子的末端。如果核酸分子具有包括长度超过两个核苷酸的单链部分的末端(本文中称为“悬垂物”),那么其不是钝端的。在一些实施方案中,核酸分子的末端不包括任何单链部分,使得末端的一个股中的每个核苷酸与同一个核酸分子的另一个股中的相对核苷酸碱基配对。在一些实施方案中,变成彼此接合的两个钝端核酸分子的末端不包括任何重叠、共有或互补序列。通常,钝端接合不包括使用其它寡核苷酸衔接子帮助双链经扩增的靶序列与双链衔接子的接合,如美国专利公布2010/0129874中所描述的补丁寡核苷酸。在一些实施方案中,钝端接合包括接口平移反应以密封在接合过程期间产生的接口。
如本文中所使用,术语“衔接子”或“衔接子和其补体”以及其派生词指任何与本发明的核酸分子接合的线形寡核苷酸。任选地,衔接子包括基本上不与样品内至少一个靶序列的3'端或5'端互补的核酸序列。在一些实施方案中,衔接子基本上不与样品中任何靶序列的3'端或5'端互补。在一些实施方案中,衔接子包括任何基本上不与经扩增的靶序列互补的单链或双链线形寡核苷酸。在一些实施方案中,衔接子基本上不与样品的至少一个、一些或全部核酸分子互补。在一些实施方案中,适合的衔接子长度在约10-100个核苷酸、约12-60个核苷酸和约15-50个核苷酸长度范围内。衔接子可包括核苷酸和/或核酸的任何组合。在一些方面中,衔接子可在一个或多个位置包括一个或多个可裂解基团。在另一个方面中,衔接子可包括与引物(例如通用引物)的至少一部分基本上一致或基本上互补的序列。通用扩增引物的结构和性质是本领域技术人员公知的,并且可以与所提供的方法和组合物结合使用以适应特定的分析平台(例如,如本文所述,通用P1和A引物已经在本领域描述并用于在Ion Torrent测序平台上测序)。类似地,描述和本领域已知的另外和其他通用衔接子/引物序列(例如,Illumina通用衔接子/引物序列、PacBio通用衔接子/引物序列等)可以与本文提供的方法和组合物一起使用。在一些实施方案中,衔接子可包括条码或标签以辅助下游编目、鉴别或测序。在一些实施方案中,当与经扩增的靶序列接合时,尤其在存在聚合酶和dNTP的情况下在适合的温度和pH值下,单链衔接子可充当用于扩增的底物。
在一些实施方案中,通过平末端连接将衔接子连接至多核苷酸。在其他实施方案中,通过衔接子和多核苷酸末端上的核苷酸突出端将衔接子连接至多核苷酸。对于突出端连接,如果要连接衔接子的多核苷酸(例如,扩增子)具有添加到相应链的3'和/或5'末端的互补突出端,则衔接子可以在相应链的3'和/或5'末端添加核苷酸突出端。例如,腺嘌呤核苷酸可以添加到末端修复的PCR产物的3'末端。具有由胸腺嘧啶核苷酸形成的突出端的衔接子然后可以与扩增子的A-突出端对接,并通过DNA连接酶如T4 DNA连接酶连接到扩增子上。
如本文所用,“再扩增(reamplifying或reamplification)”及其衍生物是指通过任何合适的扩增过程进一步扩增至少一部分扩增的核酸分子的任何过程(在一些实施方案中称为“二级”扩增或“再扩增”),从而产生再扩增的核酸分子。二级扩增不需要与产生扩增的核酸分子的原始扩增过程相同;也不需要再扩增的核酸分子与扩增的核酸分子完全相同或完全互补;所需要的只是再扩增的核酸分子包括至少一部分扩增的核酸分子或其互补物。例如,再扩增可涉及使用不同的扩增条件和/或不同的引物,包括与初级扩增不同的靶特异性引物。
如本文中所定义,“可裂解基团”指在并入核酸后可在适当条件下裂解的任何部分。举例来说,可将可裂解基团并入样品的引物、经扩增的序列、衔接子或核酸分子中。在例示性实施例中,靶特异性引物可包括可裂解基团,其变成并入经扩增的产物中并且接着在扩增之后裂解,从而从经扩增的产物移除一部分或所有靶特异性引物。可裂解基团可裂解或以其它方式通过任何可接受的手段从样品的靶特异性引物、经扩增的序列、衔接子或核酸分子移除。举例来说,可通过酶促、热学、光氧化或化学处理从样品的靶特异性引物、经扩增的序列、衔接子或核酸分子移除可裂解基团。在一个方面中,可裂解基团可包括非天然存在的核碱基。举例来说,寡脱氧核苷酸可包括一个或多个RNA核碱基,如可通过尿嘧啶糖基化酶移除的尿嘧啶。在一些实施方案中,可裂解基团可包括一个或多个经修饰的核碱基(如7-甲基鸟嘌呤、8-侧氧基-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶或5-甲基胞嘧啶)或一个或多个经修饰的核苷(即,7-甲基鸟苷、8-侧氧基-脱氧鸟苷、黄苷、肌苷、二氢尿苷或5-甲基胞啶)。可通过酶促、化学或热学手段从核酸移除经修饰的核碱基或核苷酸。在一个实施方案中,可裂解基团可包括在暴露于紫外光(即,溴脱氧尿苷)时,可在扩增(或合成)之后从引物移除的部分。在另一实施方案中,可裂解基团可包括甲基化胞嘧啶。通常,甲基化胞嘧啶可由引物裂解,例如在诱导扩增(或合成)之后、在亚硫酸氢钠处理时。在一些实施方案中,可裂解部分可包括限制位点。举例来说,引物或靶序列可包括对一种或多种限制酶具有特异性的核酸序列,并且在扩增(或合成)之后,引物或靶序列可用一种或多种限制酶处理使得移除可裂解基团。通常,可在一个或多个位置包括一个或多个可裂解基团以及样品的靶特异性引物、经扩增的序列、衔接子或核酸分子。
如本文所用,“裂解步骤”和其派生词是指可裂解基团从样品的靶特异性引物、经扩增的序列、衔接子或核酸分子裂解或以其它方式移除的任何过程。在一些实施方案中,裂解步骤可以涉及化学、热学、光氧化或消化过程。
如本文中所使用,术语“杂交”符合其在所属领域中的用途,并且指用于使两个核酸分子经历碱基配对相互作用的方法。当一个核酸分子的任何部分与另一个核酸分子的任何部分碱基配对时,两个核酸分子分子称为杂交;未必需要两个核酸分子跨越其全部各别长度杂交并且在一些实施方案中,至少一个核酸分子可包括不与另一个核酸分子杂交的部分。短语“在严格条件下杂交”和其派生词指可在存在高杂交温度和低离子强度的条件下进行靶特异性引物与靶序列的杂交的条件。在一个例示性实施例中,严格杂交条件包括在约60-68℃下含有约30mM硫酸镁、约300mM Tris-硫酸盐(pH 8.9)和约90mM硫酸铵的水性环境或其等效物。如本文中所使用,短语“标准杂交条件”和其派生词指可在存在低杂交温度和高离子强度的情况下进行引物与寡核苷酸(即,靶序列)的杂交的条件。在一个例示性实施例中,标准杂交条件包括在约50-55℃下含有约100mM硫酸镁、约500mM Tris-硫酸盐(pH8.9)和约200mM硫酸铵的水性环境或其等效物。
如本文所用,“GC含量”及其衍生物是指核酸分子的胞嘧啶和鸟嘌呤含量。本公开的靶特异性引物(或衔接子)的GC含量为85%或更低。更典型地,本公开的靶特异性引物或衔接子的GC含量为15-85%。
如本文中所使用,当关于核酸分子(例如靶序列或经扩增的靶序列)使用时,术语“末端”和其派生词可包括核酸分子的末端30个核苷酸、末端20和甚至更通常末端15个核苷酸。包含一连串相邻核苷酸的线形核酸分子通常包括至少两个末端。在一些实施方案中,核酸分子的一端可包括3’羟基或其等效物,并且称为“3’端”和其衍生物。任选地,3'端包括未连接到单核苷酸戊糖环的5'磷酸基的3'羟基。典型地,3'端包括经定位与包括未连接的3'羟基的核苷酸相邻的一个或多个5'连接的核苷酸,通常经定位与3'羟基相邻的30个核苷酸,通常末端20个并且甚至更通常末端15个核苷酸。一个或多个连接的核苷酸可表示成寡核苷酸中存在的核苷酸的百分比,或可以与未连接的3'羟基相邻的许多连接的核苷酸形式提供。举例来说,3'端可占寡核苷酸的核苷酸长度的小于50%。在一些实施方案中,3'末端不包括任何未连接的3'羟基,但可包括任何能够充当核苷酸通过引物延伸和/或核苷酸聚合进行的连接的位点的部分。在一些实施方案中,例如当参考靶特异性引物时,术语“3'端”可包括3'端处的末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少个核苷酸。在一些实施方案中,当参考靶特异性引物时,术语“3'端”可包括位于核苷酸位置10的核苷酸或更少的来自3'端的核苷酸。
如本文中所使用,“5'端”和其派生词指核酸分子(例如靶序列或经扩增的靶序列)的末端,其包括自由5'磷酸基或其等效物。在一些实施方案中,5'端包括未连接到相邻单核苷酸戊糖环的3'羟基的5'磷酸基。通常,5'端包括经定位与5'磷酸相邻的一个或多个连接的核苷酸,通常经定位与包括5'磷酸基的核苷酸相邻的30个核苷酸,通常末端20个并且甚至更通常末端15个核苷酸。一个或多个连接的核苷酸可表示成寡核苷酸中存在的核苷酸的百分比,或可以与5'磷酸相邻的许多连接的核苷酸形式提供。举例来说,5'端可小于寡核苷酸的核苷酸长度的50%。在另一个例示性实施例中,5'端可包括与包括末端5'磷酸的核苷酸相邻的约15个核苷酸。在一些实施方案中,5'端不包括任何未连接的5'磷酸基,但可包括任何能够充当与3'羟基或另一个核酸分子的3'端的连接位点的部分。在一些实施方案中,例如当参考靶特异性引物时,术语“5'端”可包括5'端处的末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少个核苷酸。在一些实施方案中,当参考靶特异性引物时,术语“5'端”可包括位于核苷酸位置10的核苷酸或更少的来自5'端的核苷酸。在一些实施方案中,靶特异性引物的5'端可仅包括非可裂解核苷酸,例如不含如本文中所披露的一个或多个可裂解基团的核苷酸,或可由所属领域的一般技术人员容易地测定的可裂解核苷酸。
如本文所用,“DNA条形码”和其派生词是指可充当用于区分或分离样品中多个经扩增的靶序列的‘钥匙’的衔接子内的独特短(6-14个核苷酸)核酸序列。出于本发明的目的,DNA条形码可以并入衔接子的核苷酸序列中。
如本文所用,短语“两轮靶特异性杂交”或“两轮靶特异性选择”及其衍生物是指相同靶序列经历两轮连续的基于杂交的靶特异性选择的任何过程,其中靶序列与靶特异性序列杂交。每轮基于杂交的靶特异性选择可以包括针对靶特异性序列的至少一些部分的多个靶特异性杂交。在一个示例性实施方案中,一轮靶特异性选择包括涉及靶序列的第一区域的第一靶特异性杂交和涉及靶序列的第二区域的第二靶特异性杂交。第一和第二区域可以相同或不同。在一些实施方案中,每轮基于杂交的靶特异性选择可包括使用两种靶特异性寡核苷酸(例如,正向靶特异性引物和反向靶特异性引物),使得每轮选择包括两个靶特异性杂交。
如本文所用,“可比较的最大最小解链温度”及其衍生词是指切割可切割基团后单个衔接子或靶特异性引物的每个核酸片段的解链温度(Tm)。比较由单个衔接子或靶特异性引物产生的每个核酸片段的杂交温度,以确定防止靶特异性引物或衔接子的任何核酸片段与靶序列杂交所需的最大最小温度。一旦知道最大杂交温度,就可以操作衔接子或靶特异性引物,例如通过沿着引物的长度移动可切割基团的位置,以获得相对于每个核酸片段的可比较的最大最小解链温度。
如本文所用,“仅添加”及其衍生词是指一系列步骤,其中将试剂和组分加入第一或单一反应混合物中。通常,该系列步骤不包括将反应混合物从第一容器移至第二容器以完成一系列步骤。仅添加过程不包括在含有反应混合物的容器外操作反应混合物。通常,仅添加过程适合自动化和高吞吐量。
如本文所用,“合成”及其衍生词是指涉及聚合酶的核苷酸聚合的反应,任选地以模板依赖性方式。聚合酶通过将核苷一磷酸从核苷三磷酸(NTP)、脱氧核苷三磷酸(dNTP)或双脱氧核苷三磷酸(ddNTP)转移至延伸的寡核苷酸链的3'羟基来合成寡核苷酸。出于本公开的目的,合成包括通过从脱氧核苷三磷酸转移核苷一磷酸来连续延伸杂交的衔接子或靶特异性引物。
如本文所用,“聚合条件”及其衍生词是指适合于核苷酸聚合的条件。在典型的实施方案中,这种核苷酸聚合由聚合酶催化。在一些实施方案中,聚合条件包括引物延伸的条件,任选地以模板依赖性方式,导致合成的核酸序列的产生。在一些实施方案中,聚合条件包括聚合酶链反应(PCR)。通常,聚合条件包括使用足以合成核酸的反应混合物,并包括聚合酶和核苷酸。聚合条件可包括使靶特异性引物与靶序列退火和在聚合酶存在下以模板依赖性方式延伸引物的条件。在一些实施方案中,使用热循环实施聚合条件。另外,聚合条件可包括多个循环,其中重复退火、延伸和分离两条核酸链的步骤。通常,聚合条件包括阳离子如MgCl2。一个或多个核苷酸的聚合以形成核酸链包括核苷酸通过磷酸二酯键彼此连接,然而,在特定核苷酸类似物的背景下,替代连接可能是可能的。
如本文所用,术语“核酸”是指天然核酸、人工核酸、其类似物或其组合,其包括多核苷酸和寡核苷酸。如本文所用,术语“多核苷酸”和“寡核苷酸”可互换使用,并且是指核苷酸的单链和双链聚合物,包括但不限于2'-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA),其通过核苷酸间磷酸二酯键接例如3'-5'和2'-5'、反向连接例如3'-3'和5'-5'、支链结构或类似物核酸连接。多核苷酸具有相关的抗衡离子,例如H+、NH4 +、三烷基铵、Mg2+、Na+等。寡核苷酸可完全由脱氧核糖核苷酸、完全由核糖核苷酸或其嵌合混合物组成。寡核苷酸可由核碱基和糖类似物组成。当它们在本领域中更常被称为寡核苷酸时,多核苷酸的大小通常在几个单体单元的范围内,例如5-40,当它们在本领域中更常被称为多核苷酸时,到数千个单体核苷酸单元;然而,为了本公开的目的,寡核苷酸和多核苷酸都可以具有任何合适的长度。除非另外指出,否则每当呈现寡核苷酸序列时,都应了解,核苷酸从左到右是按5'到3'的顺序并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,“T”表示胸苷,并且“U”表示脱氧尿苷。寡核苷酸被称为具有“5'末端”和“3'末端”,因为单核苷酸通常通过将5'磷酸或一个核苷酸的等同基团连接到(任选地通过磷酸二酯或其他合适的键)其相邻核苷酸的3'羟基或等同基团而反应形成寡核苷酸。
如本文所定义,术语“切口平移”及其派生词包括核酸链内的一个或多个切口或间隙易位至沿核酸链的新位置。在一些实施方案中,当双链衔接子与双链扩增的靶序列连接时,形成切口。在一个实例中,引物可在其5'末端包含磷酸基团,其可连接至双链扩增的靶序列,在衔接子和互补链中的扩增的靶序列之间留下切口。在一些实施方案中,切口平移导致切口移动到核酸链的3'末端。在一些实施方案中,移动切口可以包括在衔接子连接的扩增的靶序列上进行切口平移反应。在一些实施方案中,切口平移反应是偶联的5'至3'DNA聚合/降解反应,或偶联至5'至3'DNA聚合/链置换反应。在一些实施方案中,移动切口可包括在切口位点处进行DNA链延伸反应。在一些实施方案中,移动切口可包括在切口上进行单链外切核酸酶反应以形成衔接子连接的扩增的靶序列的单链部分,并在衔接子连接的扩增的单链靶序列上进行DNA链延伸反应至新位置。在一些实施方案中,在与连接位点相对的核酸链中形成切口。
如本文所用,术语“聚合酶链式反应”(“PCR”)是指K.B.Mullis美国专利4,683,195和4,683,202的方法,在此通过引用并入,其描述用于在不进行克隆或纯化的情况下增加基因组DNA的混合物中相关多核苷酸的片段的浓度的方法。这种用于扩增相关多核苷酸的过程由以下组成:将大量过量的两种寡核苷酸引物引入含有所需相关多核苷酸的DNA混合物,接着是在DNA聚合酶存在下热循环的精确序列。两种引物与相关双链多核苷酸的其相应股互补。为了实现扩增,使混合物变性,并且然后将引物粘接到相关多核苷酸分子内的其互补序列。在粘接之后,用聚合酶使引物延伸以形成一对新互补股。变性、引物粘接和聚合酶延伸的步骤可以重复多次(即,变性、粘接和延伸构成一个“循环”;可以存在众多“循环”)以获得所需相关多核苷酸的高浓度的扩增的片段。所需相关多核苷酸的扩增的片段(扩增子)的长度通过引物相对于彼此的相对位置测定,并且因此这一长度是可控制参数。借助于重复所述过程,所述方法被称为“聚合酶链反应”(在下文中“PCR”)。因为相关多核苷酸的所需扩增的片段变为混合物中的主要核酸序列(就浓度来说),所以其被称为“PCR扩增的”。如本文中所定义,包括多种靶核酸分子的样品内的靶核酸分子经由PCR而扩增。在上文所论述的方法的一个改进中,靶核酸分子使用多种不同引物对、在一些情况下一种或多种引物对/相关标靶核酸分子而PCR扩增,由此形成多重PCR反应。在本文提供的一些实施方案中,使用多个不同引物对进行多重PCR扩增,在典型情况下,每个靶核酸分子一个引物对。使用多重PCR,有可能同时从样品扩增多种相关核酸分子以形成经扩增的靶序列。还可能通过数种不同方法(例如,用生物分析仪或qPCR定量,用经标记的探针杂交;并入生物素化的引物,接着进行抗生物素蛋白-酶结合物检测;将经32P标记的脱氧核苷酸三磷酸酯(例如dCTP或dATP)并入到经扩增的靶序列中)检测扩增的靶序列。任何寡核苷酸序列可用适合的引物集合扩增,从而实现靶核酸分子从RNA、cDNA、福马林固定的链烷烃嵌入型DNA、细针穿刺活检(fine-needle biopsies)和多种其它来源的扩增。具体来说,由如本文中所披露的多重PCR过程产生的经扩增的靶序列本身是用于后续PCR扩增或多种下游分析或操作的有效底物。
如本文中所定义,“多重扩增”是指样品内的两种或更多种靶序列使用至少一种靶特异性引物的选择性并且非随机的扩增。在一些实施方案中,进行多重扩增,使得一些或全部靶序列在单一反应容器内扩增。既定多重扩增的“重数(plexy)”或“重(plex)”是指在所述单一多重扩增期间扩增的不同目标特异性序列的数目。在一些实施方案中,重数是约12重、24重、48重、74重、96重、120重、144重、168重、192重、216重、240重、264重、288重、312重、336重、360重、384重或398重。在一些实施方案中,高度多重扩增反应包括具有大于12重的重的反应。
在一些实施方案中,扩增的靶序列通过PCR形成。可以使用一种或多种DNA聚合酶完成靶特异性引物的延伸。在一个实施方案中,聚合酶是任何家族A DNA聚合酶(也称为polI家族)或任何家族B DNA聚合酶。在一些实施方案中,与非重组DNA聚合酶相比,DNA聚合酶是能够以更高的准确度和产率延伸靶特异性引物的重组形式。例如,聚合酶可包括高保真聚合酶或热稳定聚合酶。在一些实施方案中,靶特异性引物延伸的条件可包括“热启动”条件,例如热启动聚合酶,例如AmplitaqDNA聚合酶(Applied Biosciences)、Taq DNA聚合酶高保真(Invitrogen)或KOD热启动DNA聚合酶(EMDBiosciences)。“热启动”聚合酶包括热稳定聚合酶和一种或多种在环境温度下抑制DNA聚合酶和3'-5'核酸外切酶活性的抗体。在某些情况下,“热启动”条件可包括适体。
在一些实施方案中,聚合酶是一种酶,例如Taq聚合酶(来自水生栖热菌(Thermusaquaticus)),Tfi聚合酶(来自Thermus filiformis),Bst聚合酶(来自嗜热脂肪芽孢杆菌),Pfu聚合酶(来自激烈火球菌(Pyrococcus furiosus)),Tth聚合酶(来自嗜热菌(Thermus thermophilus)),Pow聚合酶(来自Pyrococcus woesei),Tli聚合酶(来自斜纹热球菌(Thermococcus litoralis)),Ultima聚合酶(来自海栖热袍菌(Thermotogamaritima)),KOD聚合酶(来自极端嗜热古生菌(Thermococcus kodakaraensis)),Pol I和II聚合酶(来自Pyrococcus abyssi)和Pab(来自Pyrococcus abyssi)。在一些实施方案中,DNA聚合酶可包括至少一种聚合酶,例如AmplitaqDNA聚合酶(AppliedBiosciences),DNA聚合酶的Stoffel片段(Roche),KOD聚合酶(EMDBiosciences),KOD热启动聚合酶(EMD Biosciences),Deep VentTMDNA聚合酶(New EnglandBiolabs),Phusion聚合酶(New England Biolabs),Klentaq1聚合酶(DNA PolymeraseTechnology,Inc),Klentaq Long Accuracy聚合酶(DNA Polymerase Technology,Inc),Omni KlenTaqTMDNA聚合酶(DNA Polymerase Technology,Inc),Omni KlenTaqTMLA DNA聚合酶(DNA Polymerase Technology,Inc),Taq DNA聚合酶(Invitrogen),HemoKlentaqTM(New England Biolabs),Taq DNA Polymerase High Fidelity(Invitrogen),Pfx(Invitrogen),AccuprimeTMPfx(Invitrogen),或AccuprimeTM Taq DNAPolymerase High Fidelity(Invitrogen)。
在一些实施例中,DNA聚合酶是热稳定的DNA聚合酶。在一些实施方案中,dNTP的混合物以随机或定义的顺序同时或顺序施用。在一些实施方案中,多重反应中存在的DNA聚合酶的量显著高于相应的单重PCR反应中使用的DNA聚合酶的量。如本文所定义,术语“显著更高”是指与相应的单重PCR反应相比,多重PCR反应中存在的DNA聚合酶浓度至少高3倍。
在一些实施方案中,扩增反应不包括扩增产物的环化,例如通过滚环扩增所公开的。
除非另外指出,否则本主题的实践可以采用在本领域的技能内的有机化学、分子生物学(包括重组技术)、细胞生物学和生物化学的常规技术和描述。这些常规技术包括但不限于合成多核苷酸的制备、聚合技术、聚合物颗粒的化学和物理分析、核酸文库的制备、核酸测序和分析等。合适技术的具体说明可以参看本文提供的实例使用。也可以使用其它等效的常规程序。这些常规技术和描述可以在标准实验室手册中找到,例如GenomeAnalysis:A Laboratory Manual Series(Vols.I-IV),PCR Primer:A LaboratoryManual,and Molecular Cloning:A Laboratory Manual(均来自Cold Spring HarborLaboratory Press),Hermanson,Bioconjugate Techniques,第二版(Academic Press,2008);Merkus,Particle Size Measurements(Springer,2009);Rubinstein and Colby,Polymer Physics(Oxford University Press,2003);等等。
根据各种示例性实施例,可以使用适当配置和/或编程的硬件和/或软件元件来进行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征。确定是否使用硬件和/或软件元件来实施实施方案可以基于任何数量的因素,如期望的计算速率、功率水平、耐热性、处理周期预算、输入数据速率、输出数据速率、存储器资源、数据总线速度等以及其它设计或性能限制。
硬件元件的实例可以包括通过以下各项通信耦合的处理器、微处理器、一个或多个输入装置和/或一个或多个输出装置(I/O)(或外围装置):本地接口电路、电路元件(例如晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑装置(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体装置、芯片、微芯片、芯片组等。本地接口可以包括例如一个或多个总线或其它有线或无线连接、控制器、缓冲器(高速缓存器)、驱动器、中继器和接收器等以允许硬件组件之间的适当通信。处理器是用于执行软件的硬件设备,尤其是储存在存储器中的软件。处理器可以是任何定制的或市售的处理器、中央处理单元(CPU)、与计算机相关联的若干处理器中的辅助处理器、基于半导体的微处理器(例如呈微芯片或芯片组的形式)、宏处理器、或用于执行软件指令的任何设备。处理器还可以表示分布式处理架构。I/O装置可以包括输入装置,例如键盘、鼠标、扫描仪、麦克风、触摸屏、用于各种医疗装置和/或实验室仪器的接口、条形码读段器、触笔、激光读段器、射频装置读段器等。此外,I/O装置还可以包括输出装置,例如打印机、条形码打印机、显示器等。最后,I/O装置可以进一步包括作为输入件和输出件进行通信的装置,例如调制器/解调器(调制解调器;用于访问另一个装置、系统或网络)、射频(RF)或其它收发器、电话接口、桥接器、路由器等。
软件的实例可以包括软件组件、程序、应用、计算机程序、应用程序、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、函数、方法、过程、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、单词、值、符号或其任何组合。存储器中的软件可以包括一个或多个单独的程序,所述程序可以包括用于实施逻辑函数的有序的可执行指令列表。存储器中的软件可以包括用于根据本教导内容识别数据流的系统和任何合适的定制或市售的操作系统(O/S),其可以控制其它计算机程序如系统的执行,并提供调度、输入输出控制、文件和数据管理、存储管理、通信控制等。
根据各种示例性实施例,可以使用可以存储指令或指令集的适当地配置和/或编程的非暂时性机器可读媒体或物件来进行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征,所述指令或指令集如果由机器执行,则可以使机器进行根据示例性实施例的方法和/或操作。这类机器可以包括例如任何合适的处理平台、计算平台、计算装置、处理装置、计算系统、处理系统、计算机、处理器、科学或实验室仪器等,并且可以使用硬件和/或软件的任何合适的组合来实施。机器可读媒体或物件可以包括例如任何合适类型的存储器单元、存储器装置、存储器物件、存储器媒体、存储装置、存储物件、存储媒体和/或存储单元,例如存储器、可移动媒体或不可移动媒体、可擦除媒体或不可擦除媒体、可写或可重写媒体、数字或模拟媒体、硬盘、软盘、只读存储器光盘(CD-ROM)、可刻录光盘(CD-R)、可重写光盘(CD-RW)、光盘、磁媒体、磁光媒体、可移动存储卡或磁盘、各种类型的数字多功能光盘(DVD)、磁带、磁带盒等,包括适用于计算机的任何媒体。存储器可以包括易失性存储器元件(例如随机存取存储器(RAM,如DRAM、SRAM、SDRAM等))和非易失性存储器元件(例如ROM、EPROM、EEROM、闪存器、硬盘驱动器、磁带、CDROM等)中的任一个或组合。此外,存储器可以并入电子、磁性、光学和/或其它类型的储存介质。存储器可以具有分布式架构,其中各种组件远离彼此定位,但仍然通过处理器访问。指令可以包括使用任何合适的高级的、低级的、面向对象的、可视的、编译的和/或解释的编程语言实施的任何合适类型的代码,如源代码、编译代码、解释代码、可执行代码、静态代码、动态代码、加密代码等。
根据各种示例性实施例,可以至少部分地使用分布式、群集、远程或云计算资源来进行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征。
根据各种示例性实施例,可以使用源程序、可执行程序(对象代码)、脚本或包含一组待进行指令的任何其它实体来进行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征。当源程序时,所述程序可以通过可以包括或不包括在存储器中的编译器、汇编器、解释器等翻译以便与O/S一起正确地操作。指令可以使用以下各项来书写:(a)具有数据类和方法类的面向对象的编程语言;或(b)具有例程、子例程和/或函数的过程编程语言,可以包括例如C、C++、Pascal、Basic、Fortran、Cobol、Perl、Java和Ada。
根据各种示例性实施方案,上述示例性实施方案中的一个或多个可以包括向使用者接口设备、计算机可读储存介质、本地计算机系统或远程计算机系统发送、显示、储存、打印或输出与可以通过这类示例性实施例生成、访问或使用的任何信息、信号、数据和/或中间结果或最终结果有关的信息。举例来说,这种发送、显示、储存、打印或输出的信息可以采用可搜索和/或可过滤的运行和报告、图片、表格、图表、图形、电子表格、相关性、序列和其组合列表的形式。
可以通过重复、添加或替换在一个或多个上述示例性实施方案中阐述的任何一般或具体描述的特征和/或组件和/或物质和/或步骤和/或操作条件来导出各种另外的示例性实施方案。此外,应该理解,只要步骤或动作的目的仍然可以实现,步骤的顺序或执行某些动作的顺序是不重要的,除非另外特别说明。此外,除非特别说明,否则可以同时进行两个或更多个步骤或动作,只要步骤或动作的目标仍然可实现。此外,除非另外特别说明,在上述示例性实施方案的一个中提到的任何一个或多个特征、组件、方面、步骤或其他特征可以被认为是上述示例性实施方案的任何另一个的潜在的可选特征、组件、方面、步骤或其他特征,只要上述示例性实施方案的该任何另一个的目的仍然是可实现的。
在某些实施方案中,本发明的组合物包括靶免疫受体引物组,其中引物针对相同靶免疫受体基因的序列。免疫受体选自T细胞受体和抗体受体。在一些实施方案中,T细胞受体是选自TCRα、TCRβ、TCRγ和TCRδ的T细胞受体。在一些实施方案中,免疫受体是选自重链α、重链δ、重链ε、重链γ、重链μ、轻链κ和轻链λ的抗体受体。
在一些实施方案中,本发明的组合物包含选择为具有本文中所概述的各种参数或标准的靶免疫受体引物组。在一些实施方案中,本发明的组合物包含多种靶特异性引物(例如,针对V基因FR1、FR2和FR3的引物,针对J基因的引物和针对C基因的引物),其长度约15个核苷酸至40个核苷酸,并且具有至少两个或更多个以下标准:可切割基团位于基本上所有多个引物的3'末端,可切割基团位于基本上所有多个引物的中心核苷酸邻近或附近,5'末端的基本上所有多个引物仅包括不可切割的核苷酸,与多个引物中基本上所有引物最小交叉杂交,与存在于样品的非特异性序列最小交叉杂交,最小自身互补性和最小核苷酸序列在多个引物中基本上所有引物的3'末端或5'末端重叠。在一些实施方案中,组合物可包含具有上述标准中的任何3、4、5、6或7条的引物。
在一些实施方案中,组合物包含多种靶特异性引物,其长度约15个核苷酸至40个核苷酸,具有两个或更多个以下标准:可切割基团位于基本上所有多个引物的中心核苷酸邻近或附近,5'末端的基本上所有多个引物仅包括不可切割的核苷酸,在包含可切割基团的引物的整个长度上基本上所有多个引物具有小于20%的核苷酸,至少一个引物在其整个长度上具有与样品中存在的靶序列互补的核酸序列,与多个引物中基本上所有引物最小交叉杂交,与存在于样品的非特异性序列最小交叉杂交,和最小核苷酸序列在多个引物中基本上所有引物的3'末端或5'末端重叠。在一些实施方案中,组合物可包含具有上述标准中的任何3、4、5、6或7条的引物。
在一些实施方案中,选择或设计在本发明组合物中使用的靶特异性引物(例如针对V基因FR1、FR2和FR3的引物、针对J基因的引物和针对C基因的引物)以满足以下标准中的任何一个或多个:(1)在引物序列内包含两个或更多个修饰的核苷酸,其中至少一个包括在引物的末端附近或末端处,并且其中至少一个包含在引物序列的中心核苷酸位置处或附近;(2)长度约15至约40个碱基;(3)Tm为约60℃以上至约70℃;(4)与样品中存在的非靶序列具有低交叉反应性;(5)至少前四个核苷酸的序列(从3'到5'方向)与组合物中存在的任何其他引物内的任何序列不互补;(6)与在任何其他用于以引物扩增的序列内的至少5个核苷酸的任何连续段不互补。在一些实施方案中,选择或设计在所提供的组合物中使用的靶特异性引物以满足上述标准中的任何2、3、4、5或6个。在一些实施方案中,两种或更多种修饰的核苷酸具有可切割基团。在一些实施方案中,所述多种靶特异性引物的每种包括选自下述的可切割基团的两种或多种修饰核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
在一些实施方案中,提供了用于分析样品中免疫组库的组合物,其包括以下的至少一组:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的相应靶C基因的至少一部分,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中针对相同靶免疫受体的每组i)和ii)引物配置为扩增靶免疫受体组库。在某些实施方案中,包含i)和ii)的单组引物包含在组合物中。在特定实施方案中,此类组包含针对包含T细胞受体的免疫受体的引物。在更具体的实施方案中,此类组包含针对TCRβ的引物。在其他实施方案中,此类组包含针对TCRα的引物。在还其他实施方案中,至少两组引物包含在组合物中,其中所述组针对TCRα和TCRβ。
在特定实施方案中,提供的组合物包括包含多个V基因引物的一个或多个的靶免疫受体引物组,所述多个V基因引物针对长度约70个核苷酸的FR1区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约50个核苷酸的FR1区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约90种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约50至约80种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约55至约75种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约60至约70种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含一种或多种C基因引物。在特定实施方案中,靶免疫受体引物组包含至少两个C基因引物,其中每个引物针对靶C基因内相同50个核苷酸区的至少一部分。
在具体的实施方案中,本发明的组合物包括至少一组引物,其包含分别选自表2和4的V基因引物i)和C基因引物ii)。在其他某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89和181-184或选自SEQ ID NO:90-180和181-184的引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:90-155和181-182或选自SEQ ID NO:90-155和183-184的引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89和181-182或选自SEQ ID NO:1-89和183-184的引物。在其他某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:1-64和183-184。在其他某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:1-64和181-182。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:90-92、95-155和181-182,或至少一组引物i)和ii)其包含引物SEQ ID NO:90-92、95-155和183-184。在其他某些实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-153和181-182。在其他某些实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-153和183-184。在其他某些实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-92和95-182。在其他某些实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-92、95-180和183-184。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:1-89的至少50个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的组合物包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQ ID NO:183-184的至少一个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:183-184的至少一个引物。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:90-180的至少50个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:183-184的至少一个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ IDNO:181-182的至少一个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:183-184的至少一个引物。
在一些实施方案中,提供了用于分析样品中免疫组库的组合物,其包括以下的至少一组:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的相应靶C基因的至少一部分,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中针对相同靶免疫受体的每组i)和ii)引物配置为扩增靶免疫受体组库。在某些实施方案中,包含i)和ii)的单组引物包含在组合物中。在特定实施方案中,此类组包含针对包含T细胞受体的免疫受体的引物。在更具体的实施方案中,此类组包含针对TCRβ的引物。在其他实施方案中,此类组包含针对TCRα的引物。在还其他实施方案中,至少两组引物包含在组合物中,其中所述组针对TCRα和TCRβ。
在某些实施方案中,提供的组合物包括包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约70个核苷酸的FR3区上的序列。在特定实施方案中,提供的组合物包括包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约50个核苷酸的FR3区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约40至约60个核苷酸的FR3区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约80种不同的针对FR3的引物。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约50至约70种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约55至约65种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约58、59、60、61至约62种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含一种或多种C基因引物。在特定实施方案中,靶免疫受体引物组包含至少两个C基因引物,其中每个引物针对靶C基因内相同50个核苷酸区的至少一部分。
在具体的实施方案中,本发明的组合物包括至少一组引物,其包含分别选自表3和4的V基因引物i)和C基因引物ii)。在某些其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和181-184或选自SEQ ID NO:249-312和181-184的引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和183-184或选自SEQ ID NO:185-248和181-182的引物。在其他某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:185-243和181-182。在其他某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:185-243和183-184。在其他某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:249-312和181-182或选自SEQ ID NO:249-312和183-184的引物。在其他某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:181-182和185-243。在其他某些实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:249-307和181-182。在其他某些实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:249-307和183-184。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:249-312的至少50个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的组合物包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:183-184的至少一个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的组合物包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:183-184的至少一个引物。
在一些实施方案中,提供了用于分析样品中免疫组库的组合物,其包括以下的至少一组:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)一个或多个C基因引物,其针对所述免疫受体编码序列的相应靶C基因的至少一部分,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中针对相同靶免疫受体的每组i)和ii)引物配置为扩增靶免疫受体组库。在某些实施方案中,包含i)和ii)的单组引物包含在组合物中。在特定实施方案中,此类组包含针对包含T细胞受体的免疫受体的引物。在更具体的实施方案中,此类组包含针对TCRβ的引物。在其他实施方案中,此类组包含针对TCRα的引物。在还其他实施方案中,至少两组引物包含在组合物中,其中所述组针对TCRα和TCRβ。
在特定实施方案中,提供的组合物包括包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约70个核苷酸的FR2区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约50个核苷酸的FR2区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约90种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约30至约60种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约20至约50种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约60至约70种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含约20至约30种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含一种或多种C基因引物。在特定实施方案中,靶免疫受体引物组包含至少两个C基因引物,其中每个引物针对靶C基因内相同50个核苷酸区的至少一部分。
在具体的实施方案中,本发明的组合物包括至少一组引物,其包含分别选自表6和4的V基因引物i)和C基因引物ii)。在某些其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和181-182的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和183-184的引物。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:483-505和181-182。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:483-505和183-184。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:483-505的至少20个引物和选自SEQ ID NO:181-182的至少一个引物。在其他实施方案中,本发明的组合物包括使用至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:183-184的至少一个引物。
在一些实施方案中,提供了用于分析样品中免疫组库的组合物,其包括以下的至少一组:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区3(FR3)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中针对相同靶免疫受体的每组i)和ii)引物配置为扩增靶免疫受体组库。在某些实施方案中,包含i)和ii)的单组引物包含在组合物中。在特定实施方案中,此类组包含针对包含T细胞受体的免疫受体的引物。在更具体的实施方案中,此类组包含针对TCRβ的引物。在其他实施方案中,此类组包含针对TCRα的引物。在还其他实施方案中,至少两组引物包含在组合物中,其中所述组针对TCRα和TCRβ。
在特定实施方案中,提供的组合物包括包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约50个核苷酸的FR3区上的序列。在其他实施方案中,多个V基因引物中的一个或多个针对长度约70个核苷酸的FR3区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约40至约60个核苷酸的FR3区上的序列。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约80种不同的针对FR3的引物。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约50至约70种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约55至约65种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约58、59、60、61至约62种不同的针对FR3的引物。在一些实施方案中,靶免疫受体引物组包含多种J基因引物。在一些实施方案中,靶免疫受体引物组包含至少10个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在某些实施方案中,靶免疫受体引物组包含至少10个J基因引物,其中每个引物针对靶J基因区域内相同50个核苷酸区域的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约10至约20个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约12至约18个J基因引物,其中每个引物针对靶多核苷酸内的J基因部分的至少一部分。在一些实施方案中,靶免疫受体引物组包含约12、13、14、15、16、17或18种不同的J基因引物。在具体实施方案中,靶免疫受体引物组包含约16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在具体实施方案中,靶免疫受体引物组包含约14个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。
在具体的实施方案中,本发明的组合物包括至少一组引物,其包含分别选自表3和5的V基因引物i)和C基因引物ii)。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和313-397或选自SEQ ID NO:185-248和398-482的引物。在其他某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和313-329或选自SEQ ID NO:185-248和313-342的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248和398-414或选自SEQ ID NO:185-248和414-427的引物。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:185-243和313-328。在仍其他实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:185-243和398-413。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:249-312和313-328或选自SEQ ID NO:249-312和398-413的引物。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:249-312和313-397或选自SEQ ID NO:249-312和398-482的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:249-312和313-329或选自SEQ ID NO:249-312和329-342的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:249-312和398-414或选自SEQ ID NO:249-312和414-427的引物。在实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:249-312和398-413。在其他实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ IDNO:249-312和313-328。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:249-312的至少50个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:249-312的至少50个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:249-312的至少50个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:185-248的至少50个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,提供了用于分析样品中免疫组库的组合物,其包括以下的至少一组:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的框架区1(FR1)的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中针对相同靶免疫受体的每组i)和ii)引物配置为扩增靶免疫受体组库。在某些实施方案中,包含i)和ii)的单组引物包含在组合物中。在特定实施方案中,此类组包含针对包含T细胞受体的免疫受体的引物。在更具体的实施方案中,此类组包含针对TCRβ的引物。在其他实施方案中,此类组包含针对TCRα的引物。在还其他实施方案中,至少两组引物包含在组合物中,其中所述组针对TCRα和TCRβ。
在特定实施方案中,提供的组合物包括包含多个V基因引物的一个或多个的靶免疫受体引物组,所述多个V基因引物针对长度约70个核苷酸的FR1区上的序列。在其他实施方案中,多个V基因引物中的一个或多个针对长度约80个核苷酸的FR1区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约50个核苷酸的FR1区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约90种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约50至约80种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约55至约75种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约60至约70种不同的针对FR1的引物。在一些实施方案中,靶免疫受体引物组包含多种J基因引物。在一些实施方案中,靶免疫受体引物组包含至少10个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在某些实施方案中,靶免疫受体引物组包含至少10个J基因引物,其中每个引物针对靶J基因区域内相同50个核苷酸区域的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约10至约20个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约12至约18个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含约12、13、14、15、16、17或18种不同的J基因引物。在具体实施方案中,靶免疫受体引物组包含约16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在具体实施方案中,靶免疫受体引物组包含约14个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。
在具体的实施方案中,本发明的组合物包括至少一组引物,其包含分别选自表2和5的V基因引物i)和C基因引物ii)。在某些其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89和313-397或选自SEQ ID NO:90-180和313-397的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:1-89和398-482或选自SEQ ID NO:90-180和398-482的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-64和398-482或选自SEQ ID NO:1-64和313-397的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-64和313-329或选自SEQ ID NO:1-64和329-342的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-64和398-414或选自SEQ ID NO:1-64和414-427的引物。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:1-64和313-328。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:1-64和398-413。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180和313-342或选自SEQ ID NO:90-180和398-427的引物。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-155和313-342或选自SEQ ID NO:90-155和398-427的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-155和398-414或选自SEQ ID NO:90-155和414-427的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-155和313-329或选自SEQ ID NO:90-155和329-342的引物。在仍其他实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-153和398-414。在仍其他实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-153和313-328。在仍其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-92、95-180和329-342或选自SEQ ID NO:90-92、95-180和313-329的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-92、95-180和398-414或选自SEQ ID NO:90-92、95-180和414-427的引物。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:90-92、95-180和313-328。在仍其他实施方案中,本发明的组合物包括i)和ii)的至少一组引物,其包含引物SEQ ID NO:90-92、95-180和303-318。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:1-89的至少50个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:1-89的至少50个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少50个引物和选自SEQID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:1-89的至少60个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:90-180的至少50个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:90-180的至少50个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少50个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:90-180的至少60个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,提供了用于分析样品中免疫组库的组合物,其包括以下的至少一组:i)多个V基因引物,其针对至少一个免疫受体编码序列的大多数不同V基因,所述免疫受体编码序列包含V基因内的FR2的至少一部分,和ii)多个J基因引物,其针对相应靶免疫受体编码序列的大多数不同的J基因,其中针对相同靶免疫受体序列的每组i)和ii)引物选自T细胞受体和抗体受体,并且其中针对相同靶免疫受体的每组i)和ii)引物配置为扩增靶免疫受体组库。在某些实施方案中,包含i)和ii)的单组引物包含在组合物中。在特定实施方案中,此类组包含针对包含T细胞受体的免疫受体的引物。在更具体的实施方案中,此类组包含针对TCRβ的引物。在其他实施方案中,此类组包含针对TCRα的引物。在还其他实施方案中,至少两组引物包含在组合物中,其中所述组针对TCRα和TCRβ。
在特定实施方案中,提供的组合物包括包含V基因引物的靶免疫受体引物组,其中多个V基因引物中的一个或多个针对长度约70个核苷酸的FR2区上的序列。在其他特定实施方案中,多个V基因引物中的一个或多个针对长度约50个核苷酸的FR2区上的序列。在某些实施方案中,靶免疫受体引物组包含V基因引物,其包含约45至约90种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约30至约60种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约20至约50种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含V基因引物,其包含约60至约70种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含约20至约30种不同的针对FR2的引物。在一些实施方案中,靶免疫受体引物组包含多种J基因引物。在一些实施方案中,靶免疫受体引物组包含至少10个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约10至约20个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含至少约12至约18个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在一些实施方案中,靶免疫受体引物组包含约12、13、14、15、16、17或18种不同的J基因引物。在具体实施方案中,靶免疫受体引物组包含约16个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。在具体实施方案中,靶免疫受体引物组包含约14个J基因引物,其中每个引物针对靶多核苷酸内的J基因的至少一部分。
在具体的实施方案中,本发明的组合物包括至少一组引物,其包含分别选自表6和5的V基因引物i)和C基因引物ii)。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和313-397或选自SEQ ID NO:483-505和398-482的引物。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:483-505和313-342或选自SEQ ID NO:483-505和398-427的引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和313-329或选自SEQ ID NO:483-505和329-342的引物。在某些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:483-505和398-414或选自SEQ ID NO:483-505和414-427的引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含引物SEQ ID NO:483-505和313-328或包含引物SEQ ID NO:483-505和398-413。
在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQID NO:483-505的至少20个引物和选自SEQ ID NO:313-397的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:398-482的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在一些实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:313-342的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。在其他实施方案中,本发明的组合物包括至少一组引物i)和ii),其包含选自SEQ ID NO:483-505的至少20个引物和选自SEQ ID NO:398-427的至少10个引物、至少12个引物、至少14个引物、至少16个引物、至少18个引物、至少20个引物。
在一些实施方案中,包括至少一种修饰的核苷酸的多种不同引物可用于单一扩增反应。例如,可以将包含修饰的核苷酸的多重引物添加到扩增反应混合物中,其中每个引物(或引物组)选择性地与核酸群体内的不同的重排的靶核酸分子杂交并促进其扩增。在一些实施方案中,靶特异性引物可包括至少一个尿嘧啶核苷酸。
在一些实施方案中,可以使用PCR和变性、引物退火和聚合酶延伸步骤的循环在设定温度下进行多重扩增持续设定的时间。在一些实施方案中,使用约12个循环至约30个循环来在多重扩增反应中产生扩增子文库。在一些实施方案中,使用13个循环、14个循环、15个循环、16个循环、17个循环、18个循环、19个循环、优选20个循环、23个循环或25个循环来在多重扩增反应中产生扩增子文库。在一些实施方案中,17-25个循环用于在多重扩增反应中产生扩增子文库。
在一些实施方案中,扩增反应在单个反应阶段内并行进行(例如,在单个孔或管内的相同扩增反应混合物内)。在一些情况下,扩增反应可以产生产物的混合物,包括预期的扩增子产物以及非预期的、不需要的非特异性扩增假象,例如引物-二聚体。扩增后,然后用任何合适的试剂处理反应,所述试剂将选择性地切割或以其他方式选择性破坏过量未掺入的引物和扩增假象内的修饰核苷酸的核苷酸键,而不切割或破坏规格扩增产物。例如,引物可包括含尿嘧啶的核碱基,其可使用UNG/UDG(任选地加热和/或碱)选择性裂解。在一些实施方案中,引物可包括含尿嘧啶的核苷酸,其可使用UNG和Fpg选择性裂解。在一些实施方案中,裂解处理包括暴露于氧化条件以选择性裂解二硫醇,用RNAse H处理以选择性裂解修饰的核苷酸,包括RNA特异性部分(例如核糖等)等。该切割处理可以有效地将原始扩增引物和非特异性扩增产物分裂成小核酸片段,每个核酸片段包含相对较少的核苷酸。此类片段通常不能在升高的温度下促进进一步扩增。通过本领域已知的各种扩增后净化程序(例如,离心柱、NaEtOH沉淀等),也可以相对容易地从反应池中除去这些片段。
在一些实施方案中,任选地处理修饰核苷酸的核苷酸键的切割或其他选择性破坏后的扩增产物,以产生在5'末端具有磷酸的扩增产物。在一些实施方案中,磷酸化处理包括酶促操作以产生5'磷酸化的扩增产物。在一个实施方案中,酶如聚合酶可用于产生5'磷酸化的扩增产物。例如,T4聚合酶可用于制备5'磷酸化扩增子产物。Klenow可以与一种或多种其他酶一起使用以产生具有5'磷酸的扩增产物。在一些实施方案中,本领域已知的其他酶可用于制备具有5'磷酸基团的扩增产物。例如,含有尿嘧啶核苷酸的扩增产物与酶UDG、Fpg和T4聚合酶的孵育可用于产生在5'末端具有磷酸的扩增产物。对于本领域技术人员显而易见的是,除了本文具体描述的那些之外的其他技术可用于产生磷酸化的扩增子。应当理解,应用于实践本文公开的方法、系统、试剂盒、组合物和装置而不诉诸过度实验的这些变化和修改被认为在本公开的范围内。
在一些实施方案中,掺入预期的(特异性)扩增产物中的引物,这些引物被类似地切割或破坏,导致在特定扩增产物内形成“粘性末端”(例如,5'或3'突出端)。这种“粘性末端”可以用几种方式解决。例如,如果要克隆特异性扩增产物,可以设计突出区域以补充引入克隆载体中的突出端,从而使得实现比平端连接更快速和有效的粘性末端连接。或者,可能需要修复突出端(与几种新一代测序方法一样)。这种修复可以通过仅使用仅由天然碱基组成的正向和反向扩增引物(例如,对应于A和P1引物)的二次扩增反应来完成。以这种方式,随后的几轮扩增重建双链模板,在引物破坏之前具有原始链的完整序列的扩增子的新生拷贝。或者,可以使用某些形式的填充和连接处理去除粘性末端,其中正向和反向引物与模板退火。然后可以使用聚合酶来延伸引物,然后可以使用连接酶,任选的热稳定连接酶来连接所得的核酸链。这显然也可以通过各种其他反应途径实现,例如循环延伸-连接等。在一些实施方案中,连接步骤可以使用一种或多种DNA连接酶进行。
在一些实施方案中,使用靶特异性引物对制备的扩增子文库可用于下游富集应用,例如乳液PCR、桥式PCR或等温扩增。在一些实施方案中,扩增子文库可用于富集应用和测序应用。例如,可以使用任何合适的DNA测序平台对扩增子文库进行测序,包括任何合适的下一代DNA测序平台。在一些实施方案中,可以使用Ion Torrent PGM测序仪或IonTorrent S5测序仪(Thermo Fisher Scientific)对扩增子文库进行测序。在一些实施方案中,PGM测序仪或S5测序仪可以与服务器耦合,所述服务器应用参数或软件以确定扩增的靶核酸分子的序列。在一些实施方案中,可以在不到24小时内制备、富集和测序扩增子文库。在一些实施方案中,扩增子文库可在约9小时内制备、富集和测序。
在一些实施方案中,用于产生扩增子文库的方法可包括:使用V基因特异性和C基因特异性引物扩增免疫受体基因的cDNA以产生扩增子;从输入的DNA和引物中纯化扩增子;磷酸化扩增子;将衔接子连接到磷酸化的扩增子上;纯化连接的扩增子;对扩增的扩增子进行切口平移;并纯化切口平移的扩增子以产生扩增子文库。在一些实施方案中,用于产生扩增子文库的方法可包括:使用V基因特异性和J基因特异性引物扩增免疫受体基因的cDNA以产生扩增子;从输入的DNA和引物中纯化扩增子;磷酸化扩增子;将衔接子连接到磷酸化的扩增子上;纯化连接的扩增子;对扩增的扩增子进行切口平移;并纯化切口平移的扩增子以产生扩增子文库。在一些实施方案中,可以在扩增重排免疫受体基因靶标以产生扩增子的步骤之后进行另外的扩增子文库操作。在一些实施方案中,可以以任何顺序进行另外的反应的任何组合,并且可以包括:纯化;磷酸化;连接衔接子;缺口平移;扩增和/或测序。在一些实施方案中,可以省略或可以重复这些反应中的任何一种。对于本领域技术人员来说显而易见的是,该方法可以重复或省略任何一个或多个上述步骤。对于本领域技术人员来说显而易见的是,可以修改步骤的顺序和组合以产生所需的扩增子文库,因此不限于所提供的示例性方法。
磷酸化的扩增子可以与衔接子连接以进行切口平移反应,随后的下游扩增(例如,模板制备),或用于附着到颗粒(例如珠子)或两者。例如,与磷酸化扩增子连接的衔接子可以与附着于颗粒的寡核苷酸捕获引物退火,并且可以进行引物延伸反应以产生附着于颗粒或表面的扩增子的互补拷贝,从而将扩增子连接到表面或颗粒上。衔接子可具有一个或多个扩增引物杂交位点、测序引物杂交位点、条形码序列及其组合。在一些实施方案中,通过本文公开的方法制备的扩增子可以与一个或多个Ion TorrentTM相容的衔接子连接以构建扩增子文库。通过这些方法产生的扩增子可以连接到一个或多个衔接子用于文库构建,以与下一代测序平台兼容。例如,通过本公开内容的教导产生的扩增子可以连接到IonAmpliSeqTM Library Kit 2.0或Ion AmpliSeqTM Library Kit Plus(Thermo FisherScientific)中提供的衔接子上。
在一些实施方案中,重排的免疫受体cDNA的扩增可以使用5x Ion AmpliSeqTMHiFi Master Mix进行。在一些实施方案中,5x Ion AmpliSeqTM HiFi Master Mix可包括甘油、dNTP和DNA聚合酶,例如PlatinumTM Taq DNA聚合酶高保真度。在一些实施方案中,5xIon AmpliSeqTMHiFi Master Mix可进一步包括以下中的至少一种:防腐剂、氯化镁、硫酸镁、三硫酸盐和/或硫酸铵。
在一些实施方案中,扩增子的磷酸化可以使用FuPa试剂进行。在一些实施方案中,FuPa试剂可包括DNA聚合酶、DNA连接酶、至少一种尿嘧啶裂解或修饰酶,和/或储存缓冲液。在一些实施方案中,FuPa试剂可进一步包括以下中的至少一种:防腐剂和/或去污剂。
在一些实施方案中,扩增子的磷酸化可以使用FuPa试剂进行。在一些实施方案中,FuPa试剂可包括DNA聚合酶、至少一种尿嘧啶裂解或修饰酶、抗体和/或储存缓冲液。在一些实施方案中,FuPa试剂可进一步包括以下中的至少一种:防腐剂和/或去污剂。在一些实施方案中,提供抗体以在环境温度下抑制DNA聚合酶和3'-5'核酸外切酶活性。
在一些实施方案中,通过本公开内容的教导产生的扩增子文库的产率足以用于各种下游应用,包括Ion ChefTM仪器和Ion S5TM测序系统(Thermo Fisher Scientific)。
对于本领域普通技术人员显而易见的是,用于克隆扩增的许多其他技术、平台或方法,例如野火PCR和桥扩增,可以与本公开的扩增的靶序列结合使用。还设想本领域普通技术人员在进一步改进或优化本文提供的条件时可以直接进行核酸测序(例如使用IIonPGMTM或Ion S5TM或Ion ProtonTM测序仪,Thermo Fisher Scientific)而不进行克隆扩增步骤。
在一些实施方案中,待克隆扩增的至少一个扩增的靶序列可以连接到载体或颗粒上。载体可由任何合适的材料构成,并具有任何合适的形状,包括例如平面、球状或颗粒。在一些实施方案中,载体是如美国公开申请20100304982中所述的支架聚合物颗粒,将其以全文引用的方式并入本文中。
在一些实施方案中,提供了试剂盒,用于在单一反应中扩增来自核酸分子群的多种免疫受体表达序列。在一些实施方案中,试剂盒包括含有一个或多个可切割基团的多个靶特异性引物对、一个或多个DNA聚合酶、dNTP的混合物和至少一种切割试剂。在一个实施方案中,可切割基团是8-氧代-脱氧鸟苷、脱氧尿苷或溴脱氧尿苷。在一些实施方案中,至少一种裂解试剂包括RNaseH、尿嘧啶DNA糖基化酶、Fpg或碱。在一个实施方案中,切割试剂是尿嘧啶DNA糖基化酶。在一些实施方案中,提供试剂盒以在单个反应室或容器中进行多重PCR。在一些实施方案中,试剂盒包括至少一种DNA聚合酶,其是热稳定DNA聚合酶。在一些实施方案中,与单个PCR反应相比,一种或多种DNA聚合酶的浓度以3倍过量存在。在一些实施方案中,每种靶特异性引物对的最终浓度以约5nM至约2000nM存在。在一些实施方案中,每种靶特异性引物对的最终浓度以约25nM至约50nM或约100nM至约800nM存在。在一些实施方案中,每种靶特异性引物对的最终浓度以约50nM至约400nM或约50nM至约200nM存在。在一些实施方案中,每种靶特异性引物对的最终浓度以约200nM至约400nM存在。在一些实施方案中,该试剂盒提供来自单个反应室中的核酸分子群的TCRβ、TCRα、TCRγ、TCRδ、免疫球蛋白重链γ、免疫球蛋白重链μ、免疫球蛋白重链α、免疫球蛋白重链δ、免疫球蛋白重链ε、免疫球蛋白轻链λ或免疫球蛋白轻链κ的免疫组库表达序列的扩增。在特定实施方案中,提供的试剂盒是测试试剂盒。在一些实施方案中,试剂盒还包含一种或多种衔接子、条形码和/或抗体。
表2
表3
表4
表5
表6
名称 序列 SEQ ID NO.
TRBV_F313 AACTATGTTTTGGTATCGTCA 483
TRBV_F314 CACGATGTTCTGGTACCGTCAGCA 484
TRBV_F315 CAGTGTGTCCTGGTACCAACAG 485
TRBV_F316 AACCCTTTATTGGTACCGACA 486
TRBV_F317 ATCCCTTTTTTGGTACCAACAG 487
TRBV_F318 AACCCTTTATTGGTATCAACAG 488
TRBV_F319 CGCTATGTATTGGTACAAGCA 489
TRBV_F320 CTCCCGTTTTCTGGTACAGACAGAC 500
TRBV_F321 CGCTATGTATTGGTATAAACAG 501
TRBV_F322 TTATGTTTACTGGTATCGTAAGAAGC 502
TRBV_F323 CAAAATGTACTGGTATCAACAA 503
TRBV_F324 ATACATGTACTGGTATCGACAAGAC 504
TRBV_F325 GGCCATGTACTGGTATAGACAAG 505
TRBV_F326 GTATATGTCCTGGTATCGACAAGA 506
TRBV_F327 TAACCTTTATTGGTATCGACGTGT 507
TRBV_F328 GGCCATGTACTGGTACCGACA 508
TRBV_F329 TCATGTTTACTGGTATCGGCAG 509
TRBV_F330 TTATGTTTATTGGTATCAACAGAATCA 510
TRBV_F331 CAACCTATACTGGTACCGACA 511
TRBV_F332 TACCCTTTACTGGTACCGGCAG 512
TRBV_F333 ATACTTCTATTGGTACAGACAAATCT 513
TRBV_F334 CACGGTCTACTGGTACCAGCA 514
TRBV_F335 CGTCATGTACTGGTACCAGCA 515
各种示例性实施方案的以下描述仅是示例性和说明性的,不应以任何方式解释为限制或限制性的。根据说明书和附图以及权利要求,本教导的其他实施方案、特征、目的和优点将显而易见。
尽管本说明书详细描述了某些示例性实施方案,但是其他实施方案也是可能的并且在本发明的范围内。考虑到说明书和附图以及权利要求书、说明书和附图中描述的教导的实践,变化和修改对于本领域技术人员来说是显而易见的。
实施例
提供的免疫组库组合物包括但不限于设计用于文库制备和表达的TCRβ序列测序的试剂。通常,从样品(例如血液样品、肿瘤样品(例如各种类型的新鲜、冷冻、FFPE))中提取的RNA被逆转录;产生文库,制备模板,例如使用IonChefTM或Ion OneTouchTM 2系统,然后使用下一代测序技术例如Ion S5TM、Ion PGMTM系统对制备的模板进行测序并用Ion TorrentSuiteTM软件进行序列分析。
实施例1
根据制造商的说明,使用RecoverAllTM总核酸分离试剂盒(Ambion,Inc.)从样品提取总RNA,然后例如使用QubitTM RNA HS测定试剂盒(Thermo Fisher)QubitTM RNA HS测定试剂盒(Thermo Fisher)进行量化,以量化RNA。根据制造商的说明,使用VILOTM cDNA合成试剂盒(Thermo Fisher),将总计100ng的总RNA逆转录至cDNA。将制备的cDNA用于多重聚合酶链反应以扩增TCRβV区序列。选自表2的正向和反向引物组用作扩增包含从FR1区到C区的序列的TCRβ序列的引物对。
在示例性反应中,多重引物组包括49种不同的TCRβV基因(TRBV)正向引物SEQ IDNO:105、108-153、163和177,以及2种不同的TCRβC基因(TRBC)反向引物SEQ ID NO:181和182。在其他反应中,49种不同TRBV正向引物的多重引物组包括SEQ ID NO:107、108-153、156和164,以及TRBC反向引物SEQ ID NO:181和182。在其他反应中,多重引物组包括64种不同的TRBV正向引物SEQ ID NOs:90-153和2种不同的TRBC反向引物SEQ ID NOs:181和182。在其他反应中,多重引物组包括64种不同的TRBV正向引物SEQ ID NO:90-92、95-155和2种不同的TRBC反向引物SEQ ID NO:181和182。设计一组64个TRBV正向引物以扩增RNA表达样品中的所有已知TCRβV区。
向96孔PCR板的单个孔中加入10微升制备的cDNA,1微升1μM TRBV正向引物库(含有64个引物),1微升1μM TRBC正向引物库(含有2个引物),和4个微升扩增反应混合物(5xAmpliSeq HiFi Master Mix),其可包括甘油、dNTP和Taq高保真DNA聚合酶(Invitrogen,目录号11304),用DNase/RNase游离水使最终体积为20微升。更典型地,多重扩增反应在反应中以200nM存在的每种引物进行。
将PCR板密封并装入热循环仪(VeritiTM 96孔热循环仪(Applied Biosystems))中,并在以下温度曲线下运行以产生扩增子文库。初始保持阶段在99℃下进行2分钟,然后进行约20-30个循环,在99℃下变性15秒,并在60℃下退火和延伸阶段4分钟。循环后,将扩增子文库保持在10℃直至进行。通常,使用约20个循环来产生扩增子文库。对于某些应用,可以使用多达30个循环。
在进行之前,将扩增样品短暂离心以收集内容物。向预扩增的扩增子文库(~20微升)中加入2微升FuPa试剂。将反应混合物密封,充分混合以确保均匀性和在50℃温育10分钟'55℃下10分钟,60℃下20分钟,然后在10℃保持达1小时。在进行之前,将样品短暂离心以收集内容物。
温育后,反应混合物直接进行连接步骤。这里,将现在含有磷酸化扩增子文库的反应混合物与2微升Ion XpressTM Barcode衔接子(每种5μM)(Thermo Fisher)、4微升Switch溶液(作为Ion XpressTM Plus Fragment Library Kit的组分出售,Thermo Fisher)和2微升的最后加入的DNA连接酶(作为Ion XpressTM Plus Fragment Library Kit的组分出售,Thermo Fisher)组合,然后按下面温育:22℃下30分钟,68℃10分钟,72℃下10分钟,然后在10℃保持达1小时。在进行之前,将样品短暂离心以收集内容物。
在温育步骤后,将30微升(1x样品体积)的室温XP珠(BeckmanCoulter,CA)加入到连接的DNA中,并彻底吸移混合物以使珠悬浮液与DNA混合。将混合物脉冲旋转并在室温下温育5分钟。样品经历另一次脉冲旋转并放置在磁架例如DynaMagTM-96侧磁体(Invitrogen,CA,部件号12331D)上两分钟。溶液澄清后,弃去上清液。在不从磁架移除管的情况下,将150微升新鲜制备的70%乙醇引入样品中,并在轻轻旋转磁架上的管的同时孵育。溶液澄清后,弃去上清液而不干扰沉淀。进行第二次乙醇洗涤,丢弃上清液,通过脉冲旋转管除去任何剩余的乙醇并小心地除去残留的乙醇,同时不干扰沉淀。将沉淀在室温下风干约5分钟。在50微升低TE缓冲液中从珠子上洗脱连接的DNA。
根据制造商的说明,使用具有400碱基对对照梯的Ion Library定量试剂盒(Ion Torrent,目录号4468802),通过qPCR对洗脱的文库进行定量。定量后,将文库稀释至50皮摩尔的浓度。
将连接的预扩增文库(~20微升)与50微升PCR SuperMix HighFidelity(Thermo Fisher,以Ion Fragment Library Kit的组分出售)和2微升LibraryAmplification Primer Mix(以Ion Fragment Library Kit的组分出售)组合。将溶液应用于96孔PCR板的单个孔中并密封。将板加载到热循环仪(PCR系统9700双96-孔热循环仪(Life Technologies,CA,部件号N8050200和4314445))中,并在以下温度曲线上运行以产生最终的扩增子文库:保持在在98℃下2分钟,然后进行5个循环,在98℃下变性15秒,并在64℃下退火和延伸阶段1分钟。循环后,将最终的扩增子文库保持在4℃直至进行下面概述的最终纯化步骤。
进行最终文库的两轮纯化。将25μL(0.5X样品体积)的AgencourtTM AMPureTM XP试剂加入到含有~50μL样品的每个板孔中。上下吸移珠子悬浮液以使珠子悬浮液与最终扩增子文库彻底混合。然后将样品脉冲旋转并在室温下温育5分钟。将含有最终扩增子文库的平板置于磁架例如DynaMagTM-侧磁体(Thermo Fisher)上5分钟以捕获珠子。一旦溶液澄清,小心转移上清液而不干扰珠粒。进行第二轮纯化,向每个含有样品的板孔中加入60微升(1.2X样品体积)的AgencourtTM AMPureTM XP试剂。将珠子悬浮液上下吸移以彻底混合珠子悬浮液并在室温下温育5分钟。将含有最终扩增子文库的平板置于磁架上3分钟以捕获珠子。在不从磁架上取下板的情况下,将150微升新制备的70%乙醇引入含有珠子的样品中。将样品温育30秒,同时在磁架上轻轻旋转管。溶液澄清后,弃去上清液而不干扰沉淀。进行第二次乙醇洗涤,弃去上清液。通过脉冲旋转管除去任何剩余的乙醇并小心地除去残留的乙醇,同时不干扰沉淀。将沉淀在室温下风干约5分钟。
一旦管干燥,将管从磁架上取下并加入50微升Low TE(Thermo Fisher),移液并涡旋以确保样品充分混合。将样品脉冲旋转并置于磁架上两分钟。在溶液澄清后,使用QubitTM荧光计和QubitTM dsDNA HS测定试剂盒根据制造商的说明分析含有最终扩增子文库的上清液,以定量文库并计算模板制备和测序的稀释因子。将文库稀释至约50pM用于模板制备或储存在1.5-mL Eppendorf LoBindTM管中用于长期储存。
根据制造商的说明,使用Ion OneTouchTM 2系统或Ion ChefTM仪器将等分试样的最终文库用于模板制备。
根据制造商的说明在Ion S5TM系统或Ion PGMTM系统上进行测序,并使用IonTorrent SuiteTM软件进行TCRβ基因序列分析。另外,生成的序列数据进一步受到本文提供的错误识别和删除程序的影响。
通常,使用白细胞RNA的TCRβ测定和如上所述进行的49种不同TRBV正向引物和2种不同TRBC反向引物的多重扩增引物组以及本文提供的错误鉴定和去除程序产生6-10M读段,其中45-55%是生产性的。
设计上述64种不同TRBV正向引物组以扩增RNA表达样品中的所有已知TCRβV区。通常,使用白细胞RNA的TCRβ测定和如上所述进行的64种不同TRBV正向引物和2种不同TRBC反向引物的多重扩增引物组以及本文提供的错误鉴定和去除程序产生15-20M读段,其中60-80%是生产性的。在多重扩增反应中使用大量V区引物导致TCRβ生产性读段的增加,从而提供样品的TCRβ组库的有效反映。
使用单引物5'-RACE方法从生物样品制备用于测序的RNA可能是由于最小引物偏差导致的免疫组库表征的最佳已知真实性。单引物5'-RACE还提供CDR 1、2、3的完整表征。
制备来自外周血液单核细胞(PBMC)样品的RNA,用于使用单个引物5'-RACE测序,本工作流程使用64个TRBV正向引物和2个TRBC反向引物组,以及BIOMED-2引物组。对通过这些方法中的每一种制备的扩增的cDNA进行测序,并测定TCRβV基因的使用。使用BIOMED-2引物组获得的TCRβV基因覆盖度与使用5'-RACE获得的TCRβV基因覆盖度的比较产生相关性结果,其范围为r≈0.75-0.80。比较而言,与5'-RACE相比时,使用当前工作流程获得的TCRβV基因覆盖率在重复中显示出非常高的相关性(r≈0.90-0.92)。见图4A和4B。目前的工作流程实现了约400个核苷酸的序列读段长度,并提供了V基因的CDR1、2和3区域的完整表征。
按照上述目前的工作流程,在单个Ion Torrent S5 530TM芯片上对10个取自非小细胞肺癌活检样本的新鲜冷冻肿瘤浸润淋巴细胞(TIL)样本进行测序。以重复进行的样品的测序实验导致鉴定的克隆之间的高度一致性(95.8%-99.6%),表明测序到足够的深度以反映样品中所有组库的充分表征。描绘来自十个样品中的六个的结果的相关性图显示在图5中。取决于样品类型,可在单个Ion Torrent S5 530TM芯片上对多达16个样品进行测序。当前的工作流程可用作高通量免疫组库分析方法,每个样品产生超过50,000个克隆(取决于样品类型),周转时间少于48小时。
实施例2
对在鳞状细胞癌个体的循环白细胞和TIL中发现的T细胞组库进行了表征和比较。从外周血白细胞(PBL)和从患有1B期肺鳞状细胞癌的个体获得的肿瘤活组织检查提取总RNA。对于每个样品,从100ng总RNA制备cDNA,使用具有64种不同TRBV正向引物和2种不同TRBC反向引物的引物组在多重反应中扩增cDNA(SEQ ID NOs:90-153和181-182),每种引物200nM,并如实施例1中所述进行测序。生成的序列数据受到本文提供的错误识别和删除程序的影响。
肿瘤活检测序揭示了589种独特的T细胞受体和具有少量优势克隆的寡克隆组库(Shannon多样性指数:6.78)。PBL测序揭示了45,305种独特的T细胞受体和多样化的多克隆组库,其中几乎没有高度扩增的T细胞(Shannon多样性指数:13.95)。约91.78%的外周血T细胞库是外周血独有的,约8.22%与肿瘤组库共享。因此,在该个体的TIL中发现外周血组库中约8%的T细胞。
T细胞组库测序结果显示,相对于PBL,一些T细胞克隆在肿瘤中富集。如图6所示,370个克隆是肿瘤独有的,在PBL中未发现,而肿瘤和PBL之间共有219个克隆。绝大多数(45,086)克隆是PBL独有的,在肿瘤中未发现。
实施例3
以下说明用于扩增免疫受体组库的替代方法,其结合使用恒定区的融合引物和可变区的一组引物。
将含有49种不同TRBV正向引物SEQ ID NO:108-153、162、172和179(参见表2)的引物组与2种不同的TRBC反向融合引物一起使用以扩增RNA样品中的TCRβV区。TRBC反向融合引物之一含有TRBC_R3(SEQ ID NO:183)引物序列,另一个含有表2中的TRBC_R4(SEQ IDNO:184)引物序列。每个融合引物还在5'末端含有条形码序列和A-键标记序列。提取RNA并如实施例1所述制备cDNA。向96孔PCR板的单个孔中加入10微升制备的cDNA,1微升1μMTRBV正向引物库(含有49个引物),1微升1μM TRBC反向引物库(含有2个融合引物),和4个微升扩增反应混合物(5x AmpliSeq HiFi Master Mix),其可包括甘油、dNTP和Taq高保真DNA聚合酶(Invitrogen,目录号11304),用DNase/RNase游离水使最终体积为20微升。
将PCR板密封并装入热循环仪中并如实施例1所述循环。在进行之前,将扩增样品短暂离心以收集内容物。向扩增的扩增子文库(~20微升)中加入2微升FuPa试剂。将反应混合物密封,充分混合以确保均匀性和在50℃温育10分钟'55℃下10分钟,60℃下20分钟,然后在10℃保持达1小时。在进行之前,将样品短暂离心以收集内容物。
温育后,将22微升的消化的扩增子文库与2微升P1衔接子(5μM)(Thermo Fisher)、4微升Switch溶液(作为Ion XpressTM Plus Fragment Library Kit的组分出售,ThermoFisher)和2微升的最后加入的DNA连接酶(作为Ion XpressTM Plus Fragment Library Kit的组分出售,Thermo Fisher)组合,然后按下面温育:22℃下30分钟,68℃10分钟,72℃下10分钟,然后在10℃保持达1小时。在进行之前,将样品短暂离心以收集内容物。
如实施例1中所述进行纯化、定量、模板制备和测序。对于该实施例,一个引物组使用融合引物,其在扩增后不经历衔接子连接,而另一个引物组使用在扩增后连接衔接子的引物。用这种引物组对Jurkat细胞和PBMC的总RNA进行TCRβ测定。获得约350-375个核苷酸的序列读段长度。使用本文提供的错误识别和去除程序,Jurkat样品的生产性读段>90%,PBMC样品的生产性读段>60%。通常,该融合引物工作流程测定的性能等同于使用实施例1中的49个TRBV引物组的工作流程的性能。
含有64种不同TRBV正向引物的引物组:SEQ ID NOs:90-153或SEQ ID NOs:90-92和95-155(参见表2)与2种不同的TRBC反向融合引物一起使用以扩增TCRβV RNA样品中的区域。TRBC反向融合引物之一含有TRBC_R3(SEQ ID NO:183)引物序列,另一个含有表2中的TRBC_R4(SEQ ID NO:184)引物序列。每个融合引物还在5'末端含有条形码序列和A-键标记序列。提取RNA,如实施例1所述制备cDNA。向96孔PCR板的单个孔中加入:10微升制备的cDNA,1微升1μMTRBV正向引物库(含有64个引物),1微升1μMTRBC反向引物库(含有2个融合引物),和4个微升扩增反应混合物(5x AmpliSeq HiFi Master Mix),其可包括甘油、dNTP和Taq高保真DNA聚合酶(Invitrogen,目录号11304),用DNase/RNase游离水使最终体积为20微升。
将PCR板密封并装入热循环仪中并如实施例1所述循环。在进行之前,将扩增样品短暂离心以收集内容物。向扩增的扩增子文库(~20微升)中加入2微升FuPa试剂。将反应混合物密封,充分混合以确保均匀性和在50℃温育10分钟'55℃下10分钟,60℃下20分钟,然后在10℃保持达1小时。在进行之前,将样品短暂离心以收集内容物。
温育后,将22微升的消化的扩增子文库与2微升P1衔接子(5μM)(Thermo Fisher)、4微升Switch溶液(作为Ion XpressTM Plus Fragment Library Kit的组分出售,ThermoFisher)和2微升的最后加入的DNA连接酶(作为Ion XpressTM Plus Fragment Library Kit的组分出售,Thermo Fisher)组合,然后按下面温育:22℃下30分钟,68℃10分钟,72℃下10分钟,然后在10℃保持达1小时。在进行之前,将样品短暂离心以收集内容物。
如实施例1中所述进行纯化、定量、模板制备和测序。序列数据集受到本文提供的错误识别和删除程序的影响。对于该实施例,一个引物组使用融合引物,其在扩增后不经历衔接子连接,而另一个引物组使用在扩增后连接衔接子的引物。用这种引物组对细胞(例如T细胞系和/或PBMC)的总RNA进行TCRβ测定。
实施例4
产生对照质粒文库以代表一组TCRβV基因并用于评估本文提供的测定和工作流程的性能。每个对照质粒含有来自淋巴瘤细胞系的单个T细胞克隆的TCRβcDNA。来自以下细胞系的TCRβcDNA包含在对照质粒文库中:JB6、CML-T1b、ARR、HPB-ALL、H-SB2、KE-37/SKW-3、K-T1a、SU-DHL-1、SUP-T3、TALL-104、TALL-1、MOLT 16/17、MT-1、Karpas 299、MOLT 3/4、HUT78/H9、RPMI 8402、Peer/Be13、CCRF-CEM、SUP-T1、HUT-102、MOLT 13、P12-Ichikawa、Jurkat、DND-41、K-T1b、PF-382、CML-T1a、DU.528和Karpas 45。关于示例性TCRβcDNA的序列,参见,例如,Sandberg等人(2007)Leukemia 21:230。分别扩增每个质粒并测序以确认单个克隆群体的检测。
为了评估测定和工作流程的检测限,使用10个合并的质粒或30个合并的质粒,在100ng白细胞cDNA的背景中以单一已知的输入浓度制备对照文库。质粒输入浓度范围为10pg至0.00001pg(相当于5M拷贝至约5拷贝)。
在用于测定之前,将对照质粒线性化(单独或大量)或保持完整。使用具有64种不同TRBV正向引物和2种不同TRBC反向引物的引物组在多重反应中扩增合并的文库(SEQ IDNOs:90-153和181-182),每种引物200nM,并如实施例1中所述进行测序。生成的序列数据受到本文提供的错误识别和删除程序的影响。
图7中显示了不同浓度的10种质粒库的示例性结果。通常,对照测定的检测限为10至50个拷贝的对照质粒,并且测定显示超过5-6个数量级的输入的线性度。类似地,使用不同浓度的30个质粒的库的检测限的测定导致检测到少至5个拷贝的质粒,并且在5个数量级上观察到测定线性度。在计数的T细胞群中也观察到克隆频率检测的强线性度。
如图8所示,在等摩尔浓度的30个质粒的库中进行测定,导致检测到的质粒频率在一个数量级内。此外,当10个质粒以相同浓度混合时,在所有质粒的任何单一浓度下观察到观察到的V基因(或质粒)频率仅有5倍的变异。
实施例5
以下是使用控制系统验证所提供方法的检查。对于该检查,从等摩尔浓度合并的10个质粒(如实施例4中所述)制备TCRβ文库。根据实施例1中描述的和本文提供的方法和组合物,用引物SEQID NOs:90-153和181-182以及每个200nM在多重反应中扩增文库,使用本文提供的方法和组合物,使用Ion Torrent测序系统测序至读段为17.3M的深度。
错误校正方法的比较。使用以下工作流程以及三个学术软件包分析测序数据集:IMSEQ(Kuchenbecker等人(2015)“IMSEQ--A Fast And Error Aware Approach ToImmunogenetic Sequence Analysis,”Bioinformatics 31:2963-2971),MiXCR(Bolotin等人(2015)“MiXCR:Software For Comprehensive Adaptive Immunity Profiling,”NatureMethods 12:380-381),以及RTCR(Gerritsen等人(2016)“RTCR:A Pipeline For CompleteAnd Accurate Recovery Of T Cell Repertoires From High Throughput SequencingData,”Bioinformatics 32:3098-3106)。除非另有说明,否则学术软件包以默认设置运行。
校正工作流程
1)鉴定和排除嵌合序列:对于数据集中存在的每个独特的CDR3核苷酸序列,计算具有该CDR3核苷酸序列和任何可能的可变基因的读段的数量。构成该CDR3核苷酸序列总读段少于10%的任何V基因-CDR3组合被标记为嵌合体并从下游分析中消除。
2)鉴定和排除包含简单插入缺失错误的序列:对于数据集中的每次读段,获得该读段的CDR3序列的均聚物-塌陷表示。对于具有相同V基因和塌陷-CDR3组合的每组读段,计算每个未塌陷的CDR3核苷酸序列的出现次数。构成该读段集的总读段的<10%的任何未塌陷的CDR3序列被标记为具有简单的均聚物错误。
3)鉴定和排除单列读段:对于数据集中的每次读段,计算在数据集中找到精确读段序列的次数。在数据集中仅出现一次的读段被标记为单例读段。
4)鉴定和排除截短的读段:对于数据集中的每次读段,确定读段是否具有注释的V基因FR1、CDR1、FR2、CDR2和FR3区域,如通过对IgBLAST参考V基因集的读段的IgBLAST比对所指示的。没有上述区域的读段被标记为是截短的。
5)鉴定和排除缺乏双向支撑的重排:对于数据集中的每次读段,获得读段的V基因和CDR3序列以及读段的链方向(正或负链)。对于数据集中的每个V基因-CDR3组合,计算具有该V基因-CDR3nt组合的正链和负链读段的数目。仅存在于一个方向的读段中的V基因-CDR3nt组合被认为是假的。具有假V基因-CDR3nt组合的所有读段被标记为缺乏双向支持。
6)对于未标记的基因,基于CDR3核苷酸相似性进行逐步聚类。基于读段的V基因同一性将序列分成组,排除等位基因信息(v基因组)。对于每组:
a.使用cd-hit-est和以下参数将每个组中的读段布置入聚类:
cd-hit-est-i vgene_groups.fa-o clustered_vgene_groups.cdhit-T 24-d 0-M100000-B 0-r 0-g 1-S 0-U 2-uL.05-n 10–l 7
其中vgene_groups.fa是具有相同V基因的序列的CDR3核苷酸区域的fasta格式文件,而clustered_vgene_groups.cdhit是包含细分序列的输出。
b.为聚类中的每个序列分配相同的克隆ID,用于表示该子组的成员被认为代表相同的T细胞克隆。
c.选择每个聚类的代表性序列,使得代表性序列是出现最多次数的序列,或者在平局的情况下,是随机选择的。
d.将聚类中的所有其他读段合并到代表性序列中,使得代表性序列的读段数根据合并序列的读段数增加。
e.基于汉明距离将v基因组内的代表性序列相互比较。如果代表性序列在汉明距离1至丰度>50倍的代表性序列的范围内,则将该序列合并到更常见的代表性序列中。如果代表性序列在汉明距离2至丰度>10000倍的代表性序列的范围内,则将该序列合并到更常见的代表性序列中。
f.鉴定复杂序列错误:均聚物-塌缩每个V基因组内的代表性序列,然后使用Levenshtein距离相互比较。如果代表性序列在Levenshtein距离1至丰度>50倍的代表性序列的范围内,则将该序列合并到更常见的代表性序列中。
g.鉴定CDR3错注释的错误:均聚物-塌缩每个V基因组内的代表性序列,然后对每个均聚物-塌缩序列进行成对比较。对于每对序列,确定一个序列是否是另一个序列的子集。如果是,如果更丰富的序列是>500倍更丰富,则将较不丰富的序列合并到更丰富的序列中。
7)向用户报告聚类代表。
10质粒库的测序分析的总结示于图3A-3C,使用上述错误识别和校正工作流程,包括读段长度和读段分类为生产性、拯救的生产性、非生产性和脱靶/短期。表7列出了测试数据集上此工作流程(校正工作流程)与MiXCR、IMSEQ和RTCR软件包的性能比较。所述校正工作流程运行时间可与表7中显示的示例不同,这取决于所分析的数据集。在缺乏测序和PCR错误的情况下,应该鉴定出了对应于10个质粒序列的10个克隆型。学术软件包MiXCR、IMSEQ和RTCR报告了许多人工谱系。在MiXCR的情况下,10个质粒CDR3序列中的3个被错误地报告(均聚物错误),尽管在表7中的准确度度量中不计算这些错误。使用参数-on运行IMSEQ以仅报告翻译的克隆型。由于使用了不完整的V基因参考文件,RTCR在两种情况下错误地识别了V基因。上述校正工作流程的性能产生了12种克隆型,远远少于其他软件包(至少一个数量级),并且更接近于文库中存在的克隆型的真实数量。因此,它提供了低得多的假阳性率。目前提供的工作流程还提供最高的读段分配准确度。
表7校正工作流程性能度量
实施例6
靶向基因表达和免疫组库分析的组合为肿瘤微环境研究和评估提供了益处和见解。如实施例1中所述,对来自19个具有非小细胞肺癌的个体的群组的肿瘤浸润淋巴细胞(TIL)样品分析T细胞组库。还使用OncomineTM免疫应答研究测定(目录号A32881,ThermoFisher Scientific)和Ion TorrentTM NGS平台根据制造说明书用来自TIL样品的RNA进行基因表达谱分析。然后将TIL T细胞组库特征与免疫应答基因表达谱相关联。肺癌样品中T细胞组库的分析揭示了在特定样品中检测到的克隆数量与T细胞特异性基因表达(例如,CD4、CD8、CXCL9、CCL7和MMP-6基因)之间的正相关性。T细胞克隆均匀度(即归一化的Shannon熵)与髓样特异性基因的表达和T细胞耗竭的标志物的相关性最强,并且与IFNG表达反相关。
实施例7
T细胞组库分析可用于监测治疗性T细胞的制备。从PBMC分离T细胞,使用GibcoTMCTSTM DynabeadsTM CD3/CD28磁珠和相关试剂和培养基(Thermo Fisher Scientific)根据制造说明书活化和扩增。在离体过程的不同时间点对T细胞的T细胞组库进行测序:分离前(PBMC)、分离后的T细胞、孵育第3天后的T细胞(去除珠子之前和之后)和10天孵育后的T细胞。示例性结果示出在表8中。在制造过程中对T细胞进行测序揭示了组库多样性的变化,其与体外扩增一致并且允许定量克隆扩张。
表8
实施例8
本文提供的方法和组合物提供T细胞受体β序列的重排CDR和框架区的长扩增子多重测序,因此可用于鉴定和表征新的T细胞受体等位基因。使用实施例1中描述的方法和组合物,使用64个TRBV(FR1)正向引物和2个TRBC反向引物对从接受黑素瘤治疗的85名高加索人受试者制备的cDNA进行多重扩增,并产生长度约330个核苷酸的扩增子。使用IonTorrent S5 530芯片对样品进行多重测序,产生每个样品约1.5M的原始读段。对测序数据进行本文提供的错误鉴定和去除程序,并上传至Ion Reporter进行克隆分型和鉴定或重排,其中包含IMGT数据库中不存在的V基因序列。将推定的新序列与从1000个基因组序列数据中回收的等位基因的Lym1k数据库中报道的序列以及在NCBI NR数据库中报告的序列进行比较。
该研究导致鉴定TRB V基因等位基因的15个非同义变体,其不存在于IMGT数据库中,这导致T细胞受体β基因的CDR或框架区的氨基酸改变。由于这些等位基因不存在于IMGT中,因此它们被称为非典型等位基因。结果和变体序列分别列于表9和10中。通常,发现单个个体对于IMGT数据库中不存在的变体是杂合的,尽管在该群组中的多个个体中存在两个这样的等位基因的情况。还发现了IMGT中不存在的9个新的V基因等位基因,其在Lymk1数据库中不存在,这可能是由于从短读段群体测序研究推断受体等位基因的挑战,并在NCBI NR数据库中不存在。在Lymk1数据库或NCBI NR数据库中发现IMGT中不存在的十五个变异等位基因中的六个的证据。使用FR1和C区域靶向引物的多重反应进行TRB测序非常适合研究T细胞受体多样性在自身免疫疾病中的作用以及免疫治疗期间免疫相关不良事件的出现。
表9
表10
实施例9
根据制造商的说明,用SuperScriptTM IV VILOTM Master Mix(Thermo FisherScientific)将来自外周血白细胞的总共50ng总RNA逆转录成cDNA。将一半体积的制备的cDNA(25ng cDNA)用于多重聚合酶链反应以扩增TCRβCDR3结构域序列。在一个多重PCR中,选自表3和4的正向和反向引物组用作在从V基因FR3区到TCRβcDNA的C基因扩增序列中的引物对。在其他多重PCR中,选自表3和5的正向和反向引物组用作在从V基因FR3区到TCRβcDNA的J基因扩增序列中的引物对。
在示例性V基因FR3-C扩增反应中,多重引物组包括59种不同的TCRβV基因(TRBV)正向引物SEQ ID NO:249-307,以及2种不同的TCRβC基因(TRBC)反向引物SEQ ID NO:181和182。在示例性V基因FR3-J扩增反应中,多重引物组包括59种不同的TRBV正向引物SEQ IDNO:249-307,以及16种不同的TCRβJ基因(TRBJ)反向引物SEQ ID NO:398-413。
向96孔PCR板的单个孔中加入5微升制备的cDNA(25ng),2微升2μM TRBV(FR3)正向引物库(含有59个引物),2微升2μM TRBC反向引物库(含有2个引物),4微升5X IonAmpliSeqTM HiFi Mix(扩增反应混合物),其可包括甘油、dNTP和Taq高保真DNA聚合酶(Invitrogen,目录号11304),和7微升DNase/RNase游离水,使最终体积为20微升。对于其他扩增反应,5微升制备的cDNA(25ng),2微升2μM TRBV(FR3)正向引物库(含有59个引物),2微升2μM TRBJ反向引物库(含有16个引物),4微升的5X Ion AmpliSeqTMHiFi Mix和7微升DNase/RNase游离水,使最终反应体积达到20微升。这些多重扩增反应在反应中以200nM存在的每种引物进行。
将PCR板密封,混合反应混合物,并装入热循环仪(例如VeritiTM 96孔热循环仪(Applied Biosystems))中,并在以下温度曲线下运行以产生扩增子文库。初始保持阶段在95℃下进行7分钟,然后在95℃下进行约20个循环的变性阶段30秒,在60℃下退火阶段45秒,并在72℃下延伸阶段45秒。循环后,进行最终延伸72℃10分钟,将扩增子文库保持在10℃直至进行。通常,使用约20个循环来产生扩增子文库。对于某些应用,可以使用多达30个循环。
在进行之前,将扩增样品短暂离心以收集内容物。向预扩增的扩增子文库(~20微升)中加入2微升FuPa试剂。将反应混合物密封,充分混合以确保均匀性和在50℃温育10分钟'55℃下10分钟,60℃下20分钟,然后在10℃保持达1小时。在进行之前,将样品短暂离心以收集内容物。
温育后,反应混合物直接进行连接步骤。这里,将现在含有磷酸化扩增子文库的反应混合物与2微升Ion XpressTM Barcode衔接子(每种5μM)(Thermo Fisher)、4微升Switch溶液(作为Ion AmpliSeqTM Library Kit Plus的组分出售,Thermo Fisher)和2微升的最后加入的DNA连接酶(作为Ion AmpliSeqTM Library Kit Plus的组分出售,Thermo Fisher)组合,然后按下面温育:22℃下30分钟,68℃下5分钟,72℃下5分钟,然后在10℃保持达24小时。在进行之前,将样品短暂离心以收集内容物。
在温育步骤后,将45微升(1.5x样品体积)的室温XP珠(BeckmanCoulter,CA)加入到连接的DNA中,并彻底吸移混合物以使珠悬浮液与DNA混合。将混合物在室温下温育5分钟,置于磁架例如DynaMagTM-96侧磁体(Invitrogen,部件号12331D)上2分钟。溶液澄清后,弃去上清液。在不从磁架移除板的情况下,将150微升新鲜制备的70%乙醇引入样品中,并在轻轻旋转磁架上的管的同时孵育。溶液澄清后,弃去上清液而不干扰沉淀。进行第二次乙醇洗涤,丢弃上清液,通过脉冲旋转管除去任何剩余的乙醇并小心地除去残留的乙醇,同时不干扰沉淀。将沉淀在室温下风干约5分钟。在50微升低TE缓冲液中从珠子上洗脱连接的DNA。
根据制造商的说明,使用Ion Library定量试剂盒(Ion Torrent,目录号4468802),通过qPCR对洗脱的文库进行定量。定量后,将文库稀释至约25皮摩尔的浓度。
根据制造商的说明,使用Ion ChefTM仪器将等分试样的最终文库用于模板制备和芯片加载。根据制造商的说明在Ion S5TM系统上使用Ion 530TM芯片进行测序,并使用IonTorrent SuiteTM软件进行TCRβ基因序列分析。使用J基因引物产生的序列进行J基因序列推断过程,包括将推断的J基因序列添加到序列读段中以产生扩展的序列读段,将扩展的序列读段与参考序列比对,并鉴定生产性读段,如本文所述。另外,所有生成的序列数据进一步受到本文提供的错误识别和删除程序的影响。
使用如上所述的PBMC RNA的TRB FR3-C和FR3-J测定的示例性结果显示在表11中。克隆归一化Shannon熵描述了样品中“均匀”克隆表示如何;越接近1.0,克隆群体的大小越均匀。在这方面,FR3-C和FR3-J组是相似的。
表11
实施例10
将白细胞cDNA与30个T细胞受体β对照质粒的库(在实施例4中描述)组合,并使用多重PCR制备TCRβ文库以扩增cDNA/质粒混合物中的TCRβCDR3结构域序列。在所述多重PCR中,选自表3和5的正向和反向引物组用作在从V基因FR3区到TCRβcDNA的J基因扩增序列中的引物对以及质粒库。在该示例性V基因FR3-J扩增反应中,多重引物组包括59种不同的TRBV正向引物SEQ ID NO:249-307,以及14种不同的TCRβJ基因(TRBJ)反向引物SEQ ID NO:414-427。
根据制造商的说明,用SuperScriptTM IV VILOTM Master Mix(Thermo FisherScientific)将来自外周血白细胞的总共50ng总RNA通过逆转录制成cDNA。将一半体积的制备的白细胞cDNA(25ng cDNA)与以等摩尔浓度(0.01pg/质粒)合并的30个TRB对照质粒组合。向96孔PCR板的单个孔中加入5微升制备的cDNA(25ng),2微升质粒库(0.01pg/质粒),4微升1μM引物混合物(TRBV-FR3正向引物和TRBJ反向引物,每个1μM),4微升5X IonAmpliSeqTM HiFi Mix(Invitrogen,目录号11304)和5微升DNase/RNase游离水,使最终反应体积达到20微升。多重扩增反应在反应中以200nM存在的每种引物进行。
将PCR板密封,混合反应混合物,并装入热循环仪(例如VeritiTM 96孔热循环仪(Applied Biosystems))中,并在以下温度曲线下运行以产生扩增子文库。初始保持阶段在99℃下进行2分钟,然后在98℃下进行约20个循环的变性阶段15秒,并在60℃下退火和延伸阶段4分钟。将扩增子文库保持在10℃直至进行。
在进行之前,将扩增样品短暂离心以收集内容物。如实施例9中所述进行扩增子消化、条形码连接和进一步制备、芯片上样和测序。使产生的序列进行J基因序列推断过程,包括将推断的J基因序列添加到序列读段中以产生扩展的序列读段,将扩展的序列读段与参考序列比对,并鉴定生产性读段,如本文所述。另外,所有生成的序列数据进一步受到本文提供的错误识别和删除程序的影响。
白细胞cDNA+质粒库测定产生>1.45M序列读段,其中约81%是生产性的,约8%是脱靶的,并且约11%是非生产性的。平均序列读段长度为92个核苷酸,平均CDR3长度为38个核苷酸长度。鉴定的TCRβ克隆数为23,075,包括由对照质粒贡献的30个。克隆归一化Shannon熵为0.544705。如图9和表12所示,对质粒库进行测定的性能导致检测到的质粒频率在所有30个质粒中仅有约3倍的变异。
表12

Claims (96)

1.一种扩增样品中免疫受体组库的表达核酸序列的方法,包括:
使用以下的至少一组进行单一多重扩增反应以扩增表达的靶免疫受体核酸模板分子:
i)(a)多个V基因引物,其针对包含V基因内的框架区1(FR1)的至少一部分的至少一种免疫受体编码序列的大多数不同V基因,
(b)多个V基因引物,其针对包含V基因内的框架区2(FR2)的至少一部分的至少一种免疫受体编码序列的大多数不同V基因,或
(c)多个V基因引物,其针对包含V基因内的框架区3(FR3)的至少一部分的至少一种免疫受体编码序列的大多数不同V基因;和
ii)(a)一种或多种C基因引物,其针对至少一种免疫受体编码序列的C基因的至少一部分,或
(b)多个J基因引物,其针对至少一种免疫受体编码序列的大多数不同J基因的至少一部分;
其中每组i)和ii)引物针对选自T细胞受体基因或抗体受体基因的相同靶免疫受体基因的编码序列,并且其中使用至少一组i)和ii)引物进行扩增产生代表所述样品中的所述靶免疫受体组库的扩增子分子;
从而产生包含所述靶免疫受体组库的免疫受体扩增子分子。
2.根据权利要求1所述的方法,其中所述多个V基因引物、所述多个J基因引物和/或所述一个或多个C基因引物中的每一个具有以下标准中的任何一个或多个:
(1)在引物序列内包含两个或多个修饰的核苷酸,其中至少一个包含在引物的末端附近或末端,并且其中至少一个包含在引物序列的中心核苷酸位置或其附近;
(2)长度约为15至40个碱基;
(3)Tm高于60℃至约70℃;
(4)与样品中存在的非靶序列的交叉反应性低;
(5)至少前四个核苷酸(从3'到5'方向)与同一反应中存在的任何其他引物内的任何序列不互补;和
(6)与任何其他产生的靶扩增子内的至少5个核苷酸的任何连续区段不互补。
3.根据权利要求1或权利要求2所述的方法,其中所述V基因引物、所述多个J基因引物和/或所述一个或多个C基因引物的每一个包括一个或多个可切割基团,优选地其位于(i)引物的末端附近或末端或(ii)引物的中心核苷酸邻近或附近。
4.根据权利要求1-3中任一项所述的方法,其中所述V基因引物、所述多个J基因引物和/或所述一个或多个C基因引物中的每一个包括具有选自下述的可切割基团的两种或多种修饰核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
5.根据权利要求1-4中任一项所述的方法,其中i)和ii)的所述至少一组是i)(a)和ii)(a),其中所述多个V基因引物与模板分子的FR1区域的至少一部分退火,并且其中所述一个或多个C基因引物包含至少两种与模板分子的C基因部分的至少一部分退火的引物。
6.根据权利要求5所述的方法,其中产生的免疫受体扩增子分子包括所述免疫受体表达序列的互补决定区CDR1、CDR2和CDR3。
7.根据权利要求5所述的方法,其中产生的免疫受体扩增子的长度为约300至约600个核苷酸。
8.根据权利要求5所述的方法,其中产生的免疫受体扩增子的长度为至少约350至约500个核苷酸。
9.根据权利要求5所述的方法,其中i)和ii)的所述至少一组选自表2和表4的引物。
10.根据权利要求5所述的方法,其中i)和ii)的所述至少一组包含选自SEQ ID NO:1-89和181-184或选自SEQ ID NO:90-180和181-184的引物。
11.根据权利要求5所述的方法,其中i)和ii)的所述至少一组包含选自SEQ ID NO:90-155和181-182或选自SEQ ID NO:90-155和183-184的引物。
12.根据权利要求1-4中任一项所述的方法,其中i)和ii)的所述至少一组是i)(a)和ii)(b),其中所述多个V基因引物与模板分子的FR1区域的至少一部分退火,并且其中所述多个J基因引物包含至少十种与模板分子的J基因部分的至少一部分退火的引物。
13.根据权利要求12所述的方法,其中产生的免疫受体扩增子分子包括所述免疫受体表达序列的互补决定区CDR1、CDR2和CDR3。
14.根据权利要求12所述的方法,其中产生的免疫受体扩增子的长度为约225至约300个核苷酸。
15.根据权利要求12所述的方法,其中产生的免疫受体扩增子的长度为约250至约275个核苷酸。
16.根据权利要求12所述的方法,其中i)和ii)的所述至少一组选自表2和表5的引物。
17.根据权利要求12所述的方法,其中i)和ii)的所述至少一组包含选自SEQ ID NO:1-89和313-397或选自SEQ ID NO:1-89和398-482的引物。
18.根据权利要求12所述的方法,其中i)和ii)的所述至少一组包含选自SEQ ID NO:90-180和313-397或选自SEQ ID NO:90-180和398-482的引物。
19.根据权利要求12所述的方法,其中i)和ii)的所述至少一组包含选自SEQ ID NO:90-155和313-397的引物或选自SEQ ID NO:90-155和398-482的引物。
20.根据权利要求1-4中任一项所述的方法,其中i)和ii)的所述至少一组是i)(c)和ii)(a),其中所述多个V基因引物与模板分子的FR3区域的至少一部分退火,并且其中所述一个或多个C基因引物包含至少两种与模板分子的C基因部分的至少一部分退火的引物。
21.根据权利要求20所述的方法,其中产生的免疫受体扩增子分子包括免疫受体表达序列的互补决定区CDR3。
22.根据权利要求20所述的方法,其中产生的免疫受体扩增子的长度为约80至约140个核苷酸。
23.根据权利要求20所述的方法,其中产生的免疫受体扩增子的长度为约100至约120个核苷酸。
24.根据权利要求20所述的方法,其中i)和ii)的所述至少一组选自表3和表4的引物。
25.根据权利要求20所述的方法,其中i)和ii)的所述至少一组选自SEQ ID NO:185-248和183-184或选自SEQ ID NO:185-248和181-182。
26.根据权利要求20所述的方法,其中i)和ii)的所述至少一组选自SEQ ID NO:249-312和181-182或选自SEQ ID NO:249-312和183-184。
27.根据权利要求1-4中任一项所述的方法,其中i)和ii)的所述至少一组是i)(c)和ii)(b),其中所述多个V基因引物与模板分子的FR3区域的至少一部分退火,并且其中所述多个J基因引物包含至少十种与模板分子的J基因部分的至少一部分退火的引物。
28.根据权利要求27所述的方法,其中产生的免疫受体扩增子分子包括免疫受体表达序列的互补决定区CDR3。
29.根据权利要求27所述的方法,其中所述扩增子的长度为约70至约100个核苷酸。
30.根据权利要求27所述的方法,其中所述扩增子的长度为约80至约90个核苷酸。
31.根据权利要求27所述的方法,其中i)和ii)的所述至少一组选自表3和表5的引物。
32.根据权利要求27所述的方法,其中i)和ii)的所述至少一组包含选自SEQ ID NO:185-248和313-397或选自SEQ ID NO:185-248和398-482的引物。
33.根据权利要求27所述的方法,其中i)和ii)的所述至少一组包含选自SEQ ID NO:249-312和398-482或选自SEQ ID NO:249-312和313-397的引物。
34.根据权利要求1-4中任一项所述的方法,其中i)和ii)的所述至少一组是i)(b)和ii)(b),其中所述多个V基因引物与模板分子的FR2区域的至少一部分退火,并且其中所述多个J基因引物包含至少十种与模板分子的J基因部分的至少一部分退火的引物。
35.根据权利要求34所述的方法,其中产生的免疫受体扩增子分子包括免疫受体表达序列的互补决定区CDR2和CDR3。
36.根据权利要求34所述的方法,其中i)和ii)的所述至少一组选自表6和表5的引物。
37.根据权利要求34所述的方法,其中i)和ii)的所述至少一组包含选自SEQ ID NO:483-505和313-397或选自SEQ ID NO:483-505和398-482的引物。
38.根据权利要求5-8和12-15中任一项所述的方法,其中所述多个V基因引物针对长度约为70个核苷酸的FR1区上的序列。
39.根据权利要求5-8和12-15中任一项所述的方法,其中所述多个V基因引物是约45至约90个不同的V基因引物。
40.根据权利要求5-8和12-15中任一项所述的方法,其中所述多个V基因引物是约60至约70个不同的V基因引物。
41.根据权利要求20-23和27-30中任一项所述的方法,其中所述多个V基因引物针对长度为约70个核苷酸的FR3区域上的序列。
42.根据权利要求20-23和27-30中任一项所述的方法,其中所述多个V基因引物是约45至约80个不同的V基因引物。
43.根据权利要求20-23和27-30中任一项所述的方法,其中所述多个V基因引物是约55至约65个不同的V基因引物。
44.根据权利要求5-8和20-23中任一项所述的方法,其中每个所述C基因引物针对靶C基因内相同50个核苷酸区的至少一部分。
45.根据权利要求12-15、27-30、34和35中任一项所述的方法,其中所述多个J基因引物是约10至约20个不同的J基因引物。
46.一种制备免疫受体组库文库的方法,包括:
i)产生权利要求1-45中任一项所述的靶免疫受体扩增子分子,并通过消化所述扩增子分子的引物序列内的修饰核苷酸处理所述扩增子分子;
ii)连接至少一个衔接子至至少一个处理的扩增子分子,从而产生包含所述靶免疫受体组库的衔接子连接的靶免疫受体扩增子分子的文库。
47.根据权利要求46所述的方法,其中制备所述文库的步骤在仅包括添加步骤的单个反应容器中进行。
48.根据权利要求46或47所述的方法,其中所述衔接子是单链或双链衔接子。
49.根据权利要求46-48中任一项所述的方法,其中所述衔接子包括条形码、标签或通用引物序列。
50.根据权利要求46-49中任一项所述的方法,其中所述连接包括将不同的衔接子连接到所述至少一种处理的扩增子分子的每个末端。
51.根据权利要求50所述的方法,其中所述两个不同衔接子的每一个包括不同的条形码序列。
52.根据权利要求46-51中任一项所述的方法,其中所述连接是通过平末端连接。
53.根据权利要求46-52中任一项所述的方法,其中所述方法还包括克隆扩增所述至少一个衔接子连接的靶免疫受体扩增子分子的一部分。
54.一种提供样品中免疫受体组库的序列的方法,包括:
i)对权利要求46-53中任一项所述的靶免疫受体组库文库进行测序;和
ii)确定所述免疫受体扩增子分子的序列,其中所述确定序列包括获得初始序列读段,将初始序列读段与参考序列比对,鉴定生产性读段,和校正一个或多个插入缺失错误以产生拯救的生产性序列读段;和
iii)报告表达的免疫受体分子的序列,从而提供样品中免疫受体组库的序列。
55.根据权利要求54所述的方法,其中当扩增反应中的引物组包括所述多个J基因引物时,ii)的确定序列还包括推断所述J基因引物和所述靶J基因的序列,并在所述比对之前将推断的J基因序列添加到所述初始序列读段中。
56.根据权利要求54或55所述的方法,还包括序列读段聚类和免疫受体克隆型报告。
57.根据权利要求54或55所述的方法,其中将表达的免疫受体分子的序列与IMGT数据库进行比较,并鉴定同期IMGT数据库缺失的至少一种等位基因变体的序列。
58.根据权利要求54或55所述的方法,其中生产性读段和拯救的生产性读段的组合是所述免疫受体扩增子的测序读段的至少50%。
59.根据权利要求54或55所述的方法,其中生产性读段和拯救的生产性读段的组合是所述免疫受体扩增子的测序读段的至少70%。
60.根据权利要求54或55所述的方法,其中生产性读段和拯救的生产性读段的组合具有300至400个核苷酸、100至120个核苷酸或70至90个核苷酸之间的平均序列读段长度。
61.根据前述权利要求中任一项所述的方法,其中所述核酸是通过逆转录从生物样品中提取的核酸分子产生的cDNA。
62.根据前述权利要求中任一项所述的方法,其中所述生物样品选自造血细胞、淋巴细胞和肿瘤细胞。
63.根据前述权利要求中任一项所述的方法,其中所述生物样品选自外周血单核细胞(PBMC)、T细胞、B细胞、循环肿瘤细胞和肿瘤浸润淋巴细胞(TIL)。
64.根据前述权利要求中任一项所述的方法,其中所述生物样品包含经历离体活化和/或扩增的T细胞。
65.根据前述权利要求中任一项所述的方法,其中所述靶免疫受体是选自TCRα、TCRβ、TCRγ和TCRδ的T细胞受体。
66.根据权利要求1-6、12、13、20、21、27、28、33、35和39-63中任一项所述的方法,其中所述靶免疫受体是选自重链α、重链δ、重链ε、重链γ、重链μ、轻链κ和轻链λ的抗体受体。
67.用于分析样品中免疫组库的组合物,其包含以下的至少一组:
i)(a)多个V基因引物,其针对包含V基因内的框架区1(FR1)的至少一部分的至少一种免疫受体编码序列的大多数不同V基因,或
(b)多个V基因引物,其针对包含V基因内的框架区3(FR3)的至少一部分的至少一种免疫受体编码序列的大多数不同V基因;和
ii)(a)一种或多种C基因引物,其针对至少一种免疫受体编码序列的C基因的至少一部分,或
(b)多个J基因引物,其针对至少一种免疫受体编码序列的大多数不同J基因的至少一部分;
其中每组i)和ii)引物针对选自T细胞受体或抗体受体的相同靶免疫受体基因的编码序列;和
其中针对所述相同靶免疫受体的每组i)和ii)引物配置成扩增所述靶免疫受体组库。
68.根据权利要求67所述的组合物,其中所述多个V基因引物、所述多个J基因引物和/或所述一个或多个C基因引物中的每一个具有以下标准中的任何一个或多个:
(1)在引物序列内包含两个或多个修饰的核苷酸,其中至少一个包含在引物的末端附近或末端,并且其中至少一个包含在引物序列的中心核苷酸位置或其附近;
(2)长度约为15至40个碱基;
(3)Tm高于60℃至约70℃;
(4)与样品中存在的非靶序列的交叉反应性低;
(5)至少前四个核苷酸(从3'到5'方向)与所述组合物中存在的任何其他引物内的任何序列不互补;和
(6)与用于用所述引物扩增的任何其他序列内的至少5个核苷酸的任何连续区段不互补。
69.根据权利要求67或权利要求68所述的组合物,其中所述V基因引物、所述多个J基因引物和/或所述一个或多个C基因引物的每一个包括一个或多个可切割基团,优选地其位于(i)引物的末端附近或末端或(ii)引物的中心核苷酸邻近或附近。
70.根据权利要求67-69中任一项所述的组合物,其中所述V基因引物、所述多个J基因引物和/或所述一个或多个C基因引物中的每一个包括具有选自下述的可切割基团的两种或多种修饰核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
71.根据权利要求67-70中任一项所述的组合物,其中所述靶免疫受体是选自TCRα、TCRβ、TCRγ和TCRδ的T细胞受体。
72.根据权利要求67-70中任一项所述的组合物,其中所述靶免疫受体是选自重链α、重链δ、重链ε、重链γ、重链μ、轻链κ和轻链λ的抗体受体。
73.根据权利要求67-72中任一项所述的组合物,其中i)和ii)中的至少一组是i)(a)和ii)(a)。
74.根据权利要求73所述的组合物,其中i)和ii)的所述至少一组选自表2和表4的引物。
75.根据权利要求73所述的组合物,其中i)和ii)的所述至少一组包含选自SEQ ID NO:1-89和181-184或选自SEQ ID NO:90-180和181-184的引物。
76.根据权利要求73所述的组合物,其中i)和ii)的所述至少一组包含选自SEQ ID NO:90-155和181-182或选自SEQ ID NO:90-155和183-184的引物。
77.根据权利要求67-72中任一项的组合物,其中i)和ii)中的至少一组是i)(a)和ii)(b)。
78.根据权利要求77所述的组合物,其中i)和ii)的所述至少一组选自表2和表5的引物。
79.根据权利要求77所述的组合物,其中i)和ii)的所述至少一组包含选自SEQ ID NO:1-89和313-397或选自SEQ ID NO:1-89和398-482的引物。
80.根据权利要求77所述的组合物,其中i)和ii)的所述至少一组包含选自SEQ ID NO:90-180和313-397或选自SEQ ID NO:90-180和398-482的引物。
81.根据权利要求77所述的组合物,其中i)和ii)的所述至少一组包含选自SEQ ID NO:90-155和313-397的引物或选自SEQ ID NO:90-155和398-482的引物。
82.根据权利要求67-72中任一项所述的组合物,其中i)和ii)中的至少一组是i)(b)和ii)(a)。
83.根据权利要求82所述的组合物,其中i)和ii)的所述至少一组选自表3和表4的引物。
84.根据权利要求82所述的组合物,其中i)和ii)的所述至少一组选自SEQ ID NO:185-248和181-184或选自SEQ ID NO:249-312和181-184。
85.根据权利要求67-72中任一项的组合物,其中i)和ii)中的至少一组是i)(b)和ii)(b)。
86.根据权利要求85所述的组合物,其中i)和ii)的所述至少一组选自表3和表5的引物。
87.根据权利要求85所述的组合物,其中i)和ii)的所述至少一组包含选自SEQ ID NO:185-248和313-397或选自SEQ ID NO:185-248和398-482的引物。
88.根据权利要求85所述的组合物,其中i)和ii)的所述至少一组包含选自SEQ ID NO:249-312和398-482或选自SEQ ID NO:249-312和313-397的引物。
89.根据权利要求73或77所述的组合物,其中所述多个V基因引物针对长度约为70个核苷酸的FR1区上的序列。
90.根据权利要求73-81中任一项所述的组合物,其中所述多个V基因引物是约45至约90个不同的V基因引物。
91.根据权利要求73-81中任一项所述的组合物,其中所述多个V基因引物是约60至约70个不同的V基因引物。
92.根据权利要求82或85所述的组合物,其中所述多个V基因引物针对长度为约70个核苷酸的FR3区域上的序列。
93.根据权利要求82-88中任一项所述的组合物,其中所述多个V基因引物是约45至约80个不同的V基因引物。
94.根据权利要求82-88中任一项所述的组合物,其中所述多个V基因引物是约55至约65个不同的V基因引物。
95.根据权利要求73或82所述的组合物,其中每个所述C基因引物针对靶C基因内相同50个核苷酸区的至少一部分。
96.根据权利要求67-72、77-81或85-88中任一项所述的组合物,其中所述多个J基因引物是约10至约20个不同的J基因引物。
CN201880006791.5A 2017-01-17 2018-01-17 用于免疫组库测序的组合物和方法 Pending CN110249060A (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201762447348P 2017-01-17 2017-01-17
US62/447,348 2017-01-17
US201762480227P 2017-03-31 2017-03-31
US62/480,227 2017-03-31
US201762539409P 2017-07-31 2017-07-31
US62/539,409 2017-07-31
US201762553736P 2017-09-01 2017-09-01
US62/553,736 2017-09-01
US201762586099P 2017-11-14 2017-11-14
US62/586,099 2017-11-14
PCT/US2018/014111 WO2018136562A2 (en) 2017-01-17 2018-01-17 Compositions and methods for immune repertoire sequencing

Publications (1)

Publication Number Publication Date
CN110249060A true CN110249060A (zh) 2019-09-17

Family

ID=61569394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880006791.5A Pending CN110249060A (zh) 2017-01-17 2018-01-17 用于免疫组库测序的组合物和方法

Country Status (4)

Country Link
US (2) US10920273B2 (zh)
EP (2) EP3571320B1 (zh)
CN (1) CN110249060A (zh)
WO (1) WO2018136562A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112654720A (zh) * 2018-07-18 2021-04-13 生命技术公司 用于免疫组库测序的组合物和方法
CN112834475A (zh) * 2020-06-09 2021-05-25 郑州轻工业大学 一种核酸适体及调节核酸适体信号强度的方法和应用
CN114480659A (zh) * 2022-04-01 2022-05-13 迈杰转化医学研究(苏州)有限公司 一种基于多重扩增测序测定微小残留病变水平的方法

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
CA2798758C (en) 2010-05-18 2019-05-07 Natera, Inc. Methods for non-invasive prenatal ploidy calling
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US11008609B2 (en) 2017-09-01 2021-05-18 Life Technologies Corporation Compositions and methods for immune repertoire sequencing
EP3768864B1 (en) * 2018-03-23 2023-07-26 Life Technologies Corporation Immune repertoire monitoring
WO2019195769A1 (en) * 2018-04-06 2019-10-10 The Brigham And Women's Hospital, Inc. Methods of diagnosing and treating aggressive cutaneous t-cell lymphomas
EP3802870A4 (en) * 2018-06-11 2022-03-23 Monoquant PTY LTD AMPLIFICATION METHOD AND PRIMER THEREFOR
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
US20220073983A1 (en) 2018-07-18 2022-03-10 Life Technologies Corporation Compositions and methods for immune repertoire sequencing
CN114026252A (zh) 2019-03-19 2022-02-08 欧罗克隆纳利蒂基金会 准确评估克隆免疫球蛋白(ig)/t细胞受体(tr)基因重組的手段和方法
US11610648B2 (en) 2019-04-18 2023-03-21 Life Technologies Corporation Methods for context based compression of genomic data for immuno-oncology biomarkers
CN110257476A (zh) * 2019-05-31 2019-09-20 南方医科大学南方医院 一种甄别样品间交叉反应的免疫组库高通量测序文库的构建方法
WO2020247263A1 (en) * 2019-06-06 2020-12-10 Natera, Inc. Methods for detecting immune cell dna and monitoring immune system
KR20220076453A (ko) * 2019-08-14 2022-06-08 아이리퍼트와, 인크. 올리고-dT 역전사된 RNA로부터 TCR 알파 및 베타 쇄 VDJ를 회수하는 프로브 포획 방법
KR20220130756A (ko) 2020-01-22 2022-09-27 라이프 테크놀로지스 코포레이션 자가면역 질환과 면역결핍 장애의 면역 레퍼토리 바이오마커
US20230310500A1 (en) * 2020-09-03 2023-10-05 Techno Craft Corporation Ltd. Use of Immune Killer Cell Against Circulating Tumor Cells in Solid Tumor Treatment
EP4244380A1 (en) 2020-11-16 2023-09-20 Life Technologies Corporation Compositions and methods for immune repertoire monitoring
EP4247976A1 (en) * 2020-11-17 2023-09-27 Life Technologies Corporation Compositions and methods for immune repertoire monitoring

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012027503A2 (en) * 2010-08-24 2012-03-01 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity
WO2014145992A1 (en) * 2013-03-15 2014-09-18 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
AU2003902299A0 (en) 2003-05-13 2003-05-29 Flinders Medical Centre A method of analysing a marker nucleic acid molecule
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
EP2062982A1 (fr) 2007-11-26 2009-05-27 ImmunID Procédé d'étude de la diversité combinatoire V(D)J
US8586310B2 (en) 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
GB2477439B (en) 2008-11-07 2012-02-15 Sequenta Inc Methods for correlating clonotypes with a disease in a patient
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
EP2566984B1 (en) 2010-05-07 2019-04-03 The Board of Trustees of the Leland Stanford Junior University Measurement and comparison of immune diversity by high-throughput sequencing
WO2012083069A2 (en) 2010-12-15 2012-06-21 The Board Of Trustees Of The Leland Stanford Junior University Measurement and monitoring of cell clonality
WO2012149438A1 (en) 2011-04-28 2012-11-01 Life Technologies Corporation Methods and compositions for multiplex pcr
US20130059738A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
CN105189779B (zh) 2012-10-01 2018-05-11 适应生物技术公司 通过适应性免疫受体多样性和克隆性表征进行的免疫能力评估
AU2015227054A1 (en) * 2014-03-05 2016-09-22 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US11098360B2 (en) 2016-06-01 2021-08-24 Roche Sequencing Solutions, Inc. Immuno-PETE

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012027503A2 (en) * 2010-08-24 2012-03-01 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity
WO2014145992A1 (en) * 2013-03-15 2014-09-18 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112654720A (zh) * 2018-07-18 2021-04-13 生命技术公司 用于免疫组库测序的组合物和方法
CN112834475A (zh) * 2020-06-09 2021-05-25 郑州轻工业大学 一种核酸适体及调节核酸适体信号强度的方法和应用
CN112834475B (zh) * 2020-06-09 2023-03-14 郑州轻工业大学 一种核酸适体及调节核酸适体信号强度的方法和应用
CN114480659A (zh) * 2022-04-01 2022-05-13 迈杰转化医学研究(苏州)有限公司 一种基于多重扩增测序测定微小残留病变水平的方法
CN114480659B (zh) * 2022-04-01 2022-07-12 迈杰转化医学研究(苏州)有限公司 一种基于多重扩增测序测定微小残留病变水平的方法

Also Published As

Publication number Publication date
US11970787B2 (en) 2024-04-30
WO2018136562A2 (en) 2018-07-26
US20180208984A1 (en) 2018-07-26
WO2018136562A3 (en) 2018-08-30
EP4050113A1 (en) 2022-08-31
EP3571320B1 (en) 2022-04-06
US10920273B2 (en) 2021-02-16
US20210164047A1 (en) 2021-06-03
EP3571320A2 (en) 2019-11-27

Similar Documents

Publication Publication Date Title
CN110249060A (zh) 用于免疫组库测序的组合物和方法
CN111344416A (zh) 用于免疫组库测序的组合物和方法
US20220251654A1 (en) Methods for detecting immune cell dna and monitoring immune system
US20210180118A1 (en) Methods of nucleic acid sample preparation for immune repertoire sequencing
CN109415764A (zh) 用于检测核酸突变的组合物和方法
CN107075730A (zh) 循环核酸的鉴定及用途
US20220002802A1 (en) Compositions and methods for immune repertoire sequencing
CN108138230A (zh) 用于捕获融合基因的锁核酸
CN104350161A (zh) 用于核酸分子中的敏感突变检测的组合物和方法
CN109890983A (zh) 用于评估免疫应答的组合物和方法
US20230055712A1 (en) Immune repertoire biomarkers in autoimmune disease and immunodeficiency disorders
US20220073983A1 (en) Compositions and methods for immune repertoire sequencing
US20230416810A1 (en) Compositions and methods for immune repertoire monitoring
WO2019183582A9 (en) Immune repertoire monitoring
US20230340602A1 (en) Compositions and methods for immune repertoire monitoring
US20230131285A1 (en) Immune repertoire biomarkers for prediction of treatment response in autoimmune disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination