CN107586832A - 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法 - Google Patents

用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法 Download PDF

Info

Publication number
CN107586832A
CN107586832A CN201710813227.1A CN201710813227A CN107586832A CN 107586832 A CN107586832 A CN 107586832A CN 201710813227 A CN201710813227 A CN 201710813227A CN 107586832 A CN107586832 A CN 107586832A
Authority
CN
China
Prior art keywords
sequence
template
oligonucleotide
oligonucleotides
amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710813227.1A
Other languages
English (en)
Other versions
CN107586832B (zh
Inventor
H·S·罗宾斯
C·S·卡尔森
R·J·利文斯顿
R·O·埃默森
A·谢伍德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adaptive Biotechnologies Corp
Original Assignee
Adaptive Biotechnologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adaptive Biotechnologies Corp filed Critical Adaptive Biotechnologies Corp
Publication of CN107586832A publication Critical patent/CN107586832A/zh
Application granted granted Critical
Publication of CN107586832B publication Critical patent/CN107586832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Abstract

本发明描述了用于使一组高度异质的寡核苷酸引物的DNA扩增效率标准化的组合物和方法,所述寡核苷酸引物通常可用于扩增一组异质的DNA模板,所述DNA模板含有编码T细胞受体(TCR)或免疫球蛋白(IG)的重排淋巴样细胞DNA。本发明所公开的实施例可用于克服在利用扩增引物亚组过程中的非期望的偏倚,所述非期望的偏倚导致对扩增产物进行多重高通量测序以定量样品中的独特TCR或Ig编码基因组时的不精确。本发明提供了供用作扩增引物组的校准用标准品的组合物,所述组合物包含基本上等摩尔量的多种多样性的模板寡核苷酸。本发明还提供了用于在扩增期间识别和修正偏倚引物效率的方法。

Description

用于测量和校准多重PCR反应中的扩增偏倚的组合物和方法
本申请是申请日为2013年5月8日和发明名称为“用于测量和校准多重PCR反应中的扩增偏倚的组合物和方法”的201380022986.6号发明专利申请的分案申请。
相关申请的交叉引用
本申请要求2012年11月14日提交的美国临时申请No.61/726,489和2012年5月8日提交的美国临时申请No.61/644,294的权益,所述申请的全部公开内容据此全文以引用方式并入以用于所有目的。
背景技术
技术领域
本公开整体涉及多重核酸扩增反应中的适应性免疫受体编码DNA(例如,编码T细胞受体(TCR)和免疫球蛋白(IG)的DNA)的定量高通量测序。具体地讲,本文所述的组合物和方法克服了适应性免疫受体编码序列的定量过程中的不期望失真,所述失真可由多重DNA扩增中的特异性寡核苷酸引物的过度利用和/或利用不足偏倚所造成。
相关领域的描述
适应性免疫系统采用若干策略生成T-和B-细胞抗原受体(即适应性免疫受体)的组库,其具有足够的多样性以识别众多的潜在病原体。T细胞识别与各种癌症或传染性生物体相关的众多抗原的能力由其T细胞抗原受体(TCR)赋予,所述受体是来自TCRA基因座的α(alpha)链与来自TCRB基因座的β(beta)链的异二聚体,或来自TCRG基因座的γ(gamma)链与来自TCRD基因座的δ(delta)链的异二聚体。构成这些链的蛋白质由DNA编码,所述DNA在淋巴样细胞中采用独特的重排机制以便生成极其多样的TCR。该多亚基免疫识别受体与CD3复合体相连并结合于由主要组织相容性复合体(MHC)类别I或MHC类别II蛋白质递呈在抗原递呈细胞(APC)表面上的肽。TCR结合于APC上的抗原肽是T细胞活化过程的中心事件,T细胞活化在免疫突触处T细胞与APC之间的接触点处发生。
每个TCR肽均含有可变互补决定区(CDR)以及骨架区(FR)和恒定区。αβT细胞的序列多样性主要由α和β链可变结构域的第三互补决定区(CDR3)环的氨基酸序列决定,所述多样性分别是β链基因座中的可变(Vβ)基因区段、多样性(Dβ)基因区段与连接(Jβ)基因区段之间重组以及α链基因座中的类似Vα基因区段与Jα基因区段之间重组的结果。TCRα和β链基因座中的多个此类基因区段的存在使得能够编码大量不同的CDR3序列。TCR基因重排过程期间Vβ-Dβ、Dβ-Jβ和Vα-Jα接合部处核苷酸的独立添加和缺失进一步增加了CDR3序列多样性。在这方面,免疫能力源于TCR的多样性。
γδTCR异二聚体与αβTCR不同之处在于其编码的受体与先天免疫系统紧密相互作用并以非HLA依赖性方式识别抗原。TCRγδ在发育早期表达,并具有特化的解剖分布、独特的病原体和小分子特异性,以及广谱的先天和适应性细胞相互作用。TCRγV和J区段表达的偏倚模式在个体发生早期建立。因此,成体组织中的多样TCRγ组库是在环境暴露于病原体和有毒分子造成的刺激之后大量外周扩增的结果。
免疫球蛋白(Ig或IG),本文也称为B细胞受体(BCR),是由B细胞表达的蛋白质,所述蛋白质由四条多肽链组成,即来自IGH基因座的两条重链(H链)以及来自IGK或IGL基因座的两条轻链(L链),从而形成H2L2结构。H和L链各自包含三个涉及抗原识别的互补决定区(CDR),以及骨架区和恒定结构域,这与TCR类似。Ig的H链最初使用IGM或IGD恒定区外显子表达为膜结合同工型,但在抗原识别后恒定区可类别转换为若干另外的同种型,包括IGG、IGE和IGA。与TCR一样,个体内的初始Ig的多样性主要由高变互补决定区(CDR)决定。与TCRB类似,H链的CDR3结构域由VH、DH和JH基因区段的组合连接所形成。Ig基因重排过程期间VH-DH、DH-JH和VH-JH接合部处核苷酸的独立添加和缺失进一步增加了高变结构域序列多样性。与TCR不同,在初始B细胞最初识别抗原后整个重排IG基因的体细胞高频突变(SHM)进一步提高了Ig序列多样性。SHM的过程不受限于CDR3,因此可将变化引入骨架区、CDR1和CDR2、以及体细胞重排的CDR3的生殖系序列中。
由于适应性免疫系统部分地通过表达独特TCR或BCR的细胞的克隆性扩增来起作用,准确测量每个T细胞或B细胞克隆的总丰度的变化对于理解适应性免疫应答的动态是重要的。例如,健康人体具有数百万独特的重排TCRβ链,每条链在健康个体的大致万亿T细胞中的数百至数千克隆T细胞中携带。利用高通量测序方面的进步,最近出现了分子免疫学的新领域以对巨大TCR和BCR组库进行谱图分析。用于对重排的适应性免疫受体基因序列测序并用于适应性免疫受体克隆型确定的组合物和方法在U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373和PCT/US2011/049012中有所描述,它们全部以引用方式并入本文。
到目前为止,已采用了若干不同策略来对编码适应性免疫受体的核酸以高通量方式定量地测序,并且这些策略的区别可在于例如用于扩增CDR3编码区的方法以及对基因组DNA(gDNA)或信使RNA(mRNA)测序的选择。
对mRNA测序是比对gDNA测序更可能简便的方法,因为mRNA剪接事件去除了J与C区段之间的内含子。这允许在C区使用通用3'PCR引物扩增具有不同V区和J区的适应性免疫受体(例如,TCR或Ig)。对于每种TCRβ而言,例如十三个J区段均小于60个碱基对(bp)长。因此,剪接事件导致编码TCRβ恒定区的相同多核苷酸序列(不论使用的是哪些V和J序列)在小于100bp重排VDJ接合部内。然后可使用与mRNA的多聚A尾互补的多聚dT引物、随机小引物(通常为六聚物或九聚物)或C区段特异性寡核苷酸,将剪接的mRNA逆转录为互补DNA(cDNA)。这应产生TCR cDNA的无偏文库(因为所有cDNA均用相同寡核苷酸引发,不论是多聚dT、随机六聚物,还是C区段特异性寡核苷酸),然后可对所述无偏文库测序以获得有关每种重排中使用的V和J区段以及CDR3特异性序列的信息。此类测序可使用单种、跨CDR3的长读段(“长读段”)技术,或者可替代地涉及使用片段库和较高通量较短序列读段进行的较长序列的鸟枪法拼接。
然而,基于mRNA测序来对表达特定重排TCR(或Ig)的样品中的细胞数量定量的尝试难以说明,因为每个细胞潜在地表达不同数量的TCR mRNA。例如,体外活化的T细胞每个细胞拥有的mRNA数量是静止期T细胞的10-100倍。到目前为止,有关不同功能状态的T细胞的TCR mRNA的相对量的信息非常有限,因此大量mRNA的定量不一定能准确测量携带每种克隆TCR重排的细胞的数量。
另一方面,大多数T细胞具有一个有效重排的TCRα和一个有效重排的TCRβ基因(或两个重排的TCRγ和TCRδ),并且大多数B细胞具有一个有效重排的Ig重链基因和一个有效重排的Ig轻链基因(IGK或IGL),因此样品中的编码TCR或BCR的基因组DNA的定量应分别与样品中的T或B细胞的数量直接关联。编码适应性免疫受体链中的任何一种或多种的多核苷酸的基因组测序有利地需要以等同效率扩增取自受试者淋巴样细胞的含DNA样品中存在的许多可能重排CDR3序列的所有序列,然后进行定量测序,使得可获得每个重排CDR3克隆型的相对丰度的定量量度。
然而,采用此类方法遇到了困难,因为使用多重PCR时不易对每个重排克隆实现等同的扩增和测序效率。例如,在TCRB处每个克隆采用54个可能的生殖系V区编码基因中的一个和13个可能的J区编码基因中的一个。V和J区段的DNA序列必需具有多样性,以生成多样性适应性免疫组库。该序列多样性使得不可能设计出将以等同亲和力退火至所有V区段(或J区段)的单个通用引物序列,并会产生复杂DNA样品,其中使用多重扩增和高通量测序同时定量多种分子物质的能力受到技术限制,而阻碍了所述样品中所含的多种不同序列的准确测定。
一种或多种因素可引起使测序数据输出与输入克隆型拷贝数之间的关联出现偏态的伪差,从而削弱了从基于TCRβ基因模板的高度多样集合的多重扩增的测序策略获得可靠定量数据的能力。这些伪差通常是多重扩增步骤过程中多样引物的不等同使用所引起。在使用多样扩增模板的多重反应中可出现随示差退火动力学而变的一种或多种寡核苷酸引物的此类偏倚利用,原因在于如下的一者或多者:模板和/或寡核苷酸引物的核苷酸碱基组成的差异、模板和/或引物长度的差异、所使用的具体聚合酶、扩增反应温度(例如,退火、延伸和/或变性温度)和/或其他因素(例如,Kanagawa,2003 J.Biosci.Bioeng.96:317(Kanagawa,2003年,《生物学与生物工程杂志》,第96卷,第317页);Day et al.,1996Hum.Mol.Genet.5:2039(Day等人,1996年,《人分子遗传学》,第5卷,第2039页);Oginoet al.,2002J.Mol.Diagnost.4:185(Ogino等人,2002年,《分子诊断学杂志》,第4卷,第185页);Barnard et al.,1998Biotechniques 25:684(Barnard等人,1998年,《生物技术》,第25卷,第684页);Aird et al.,2011 Genome Biol.12:R18(Aird等人,2011年,《基因组生物学》,第12卷,第R18页))。
很明显,仍然需要改善的组合物和方法,其将允许以避免偏态结果的方式准确定量复杂样品中的适应性免疫受体编码DNA序列多样性,所述偏态结果诸如单独序列失实的过高占比或过低占比,原因在于在用于复杂模板DNA群体的多重扩增的寡核苷酸引物组中扩增特异性模板过程中的偏倚。本发明所述的实施例解决了该需求并提供了其他相关优点。
发明内容
本发明公开了一种用于使寡核苷酸引物组的扩增效率标准化的组合物,所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,每种适应性免疫受体包含可变区和连接区,所述组合物包含多种模板寡核苷酸,所述模板寡核苷酸具有多种由如下通式表示的寡核苷酸序列:5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I],其中:(a)V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20个且不超过1000个连续核苷酸的多核苷酸,并且每种V多核苷酸包含独特的寡核苷酸序列;(b)J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15个且不超过600个连续核苷酸的多核苷酸,并且每种J多核苷酸包含独特的寡核苷酸序列;(c)U1要么不存在,要么包含选自如下的寡核苷酸序列:(i)第一通用接头寡核苷酸序列和(ii)连接至第一通用接头寡核苷酸序列并位于其5'端的第一测序平台特异性寡核苷酸序列;(d)U2要么不存在,要么包含选自如下的寡核苷酸序列:(i)第二通用接头寡核苷酸序列和(ii)连接至第二通用接头寡核苷酸序列并位于其5'端的第二测序平台特异性寡核苷酸序列;(e)B1、B2、B3和B4各自独立地要么不存在,要么各自包含具有3-25个连续核苷酸的条形码序列的寡核苷酸B,其中B1、B2、B3和B4各包含一寡核苷酸序列,所述寡核苷酸序列独特地识别作为成对组合的(i)(a)的独特V寡核苷酸序列和(ii)(b)的独特J寡核苷酸序列;(f)R要么不存在,要么包含限制性酶识别位点,所述限制性酶识别位点包含不存在于(a)-(e)中的寡核苷酸序列,并且其中:(g)所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列,以较大者为准,其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对每种独特V多核苷酸的模板寡核苷酸以及至少一种针对每种独特J多核苷酸的模板寡核苷酸。
在一个实施例中,a为1至受试者的哺乳动物基因组中V基因区段的最大数量的数。在另一个实施例中,b为1至受试者的哺乳动物基因组中J基因区段的最大数量的数。在其他实施例中,a为1或者b为1。
在一些实施例中,所述多种模板寡核苷酸包含至少(a×b)种独特的寡核苷酸序列,其中a是哺乳动物受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是哺乳动物受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对V区编码基因区段与J区编码基因区段的每种可能组合的模板寡核苷酸。在一个实施例中,J包含适应性免疫受体J区编码基因序列的恒定区。
在另一个实施例中,适应性免疫受体选自TCRB、TCRG、TCRA、TCRD、IGH、IGK和IGL。在一些实施例中,(a)的V多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体V区多肽。在其他实施例中,(b)的J多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体J区多肽。
在一些实施例中,终止密码子介于V与B2之间。
在一个实施例中,所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在。在另一个实施例中,所述多种模板寡核苷酸具有选自如下的多种由通式(I)表示的序列:(1)所述多种由通式(I)表示的寡核苷酸序列,其中V和J多核苷酸具有在图5a-5l中作为TCRB V/J组1、TCRB V/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRB V/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13的68组TCRB V和J SEQ ID NO中的至少一组中示出的TCRB V和J序列;(2)所述多种由通式(I)表示的寡核苷酸序列,其中V和J多核苷酸具有在图6a和6b中作为TCRG V/J组1、TCRG V/J组2、TCRG V/J组3、TCRG V/J组4和TCRG V/J组5的14组TCRG V和J SEQ IDNO中的至少一组中示出的TCRG V和J序列;(3)所述多种由通式(I)表示的寡核苷酸序列,其中V和J多核苷酸具有在图7a-7m中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9的127组IGH V和J SEQ IDNO中的至少一组中示出的IGH V和J序列;(4)如SEQ ID NO:3157-4014中所示的所述多种由通式(I)表示的寡核苷酸序列;(5)如SEQ ID NO:4015-4084中所示的所述多种由通式(I)表示的寡核苷酸序列;(6)如SEQ ID NO:4085-5200中所示的所述多种由通式(I)表示的寡核苷酸序列;(7)如SEQ ID NO:5579-5821中所示的所述多种由通式(I)表示的寡核苷酸序列;(8)如SEQ ID NO:5822-6066所示的所述多种由通式(I)表示的寡核苷酸序列;以及(9)如SEQ ID NO:6067-6191中所示的所述多种由通式(I)表示的寡核苷酸序列。
在一些实施例中,V是包含适应性免疫受体V区编码基因序列或其互补序列的至少30、60、90、120、150、180或210个连续核苷酸的多核苷酸。在另一个实施例中,V是包含适应性免疫受体V区编码基因序列或其互补序列的不超过900、800、700、600或500个连续核苷酸的多核苷酸。
在其他实施例中,J是包含适应性免疫受体J区编码基因序列或其互补序列的至少16-30、31-60、61-90、91-120或120-150个连续核苷酸的多核苷酸。在另一个实施例中,J是包含适应性免疫受体J区编码基因序列或其互补序列的不超过500、400、300或200个连续核苷酸的多核苷酸。
在一些实施例中,每种模板寡核苷酸的长度小于1000、900、800、700、600、500、400、300或200个核苷酸。
在其他实施例中,所述组合物包含能够扩增编码一种或多种适应性免疫受体的重排核酸分子的一组寡核苷酸引物,所述寡核苷酸引物组包含复数a'种独特的V区段寡核苷酸引物和复数b'种独特的J区段寡核苷酸引物。在一些实施例中,a'为1至哺乳动物基因组中V基因区段的最大数量的数,并且b'为1至哺乳动物基因组中J基因区段的最大数量的数。在一个实施例中,a’为a。在另一个实施例中,b’为b。
在又一个实施例中,寡核苷酸引物组中的每种V区段寡核苷酸引物和每种J区段寡核苷酸引物能够特异性杂交至所述多种模板寡核苷酸中的至少一种模板寡核苷酸。在其他实施例中,每种V区段寡核苷酸引物包含与至少一种适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。在另一个实施例中,每种J区段寡核苷酸引物包含与至少一种适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。
在其他实施例中,所述组合物包含至少一种具有每种V区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸,以及至少一种具有每种J区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸。
本发明包括用于测定一组寡核苷酸引物的成员间的非均一核酸扩增潜能的方法,所述一组寡核苷酸引物能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。所述方法包括用于如下目的步骤:(a)在多重PCR反应中扩增如本文所述的组合物以获得多种扩增的模板寡核苷酸;(b)对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率;以及(c)将每种所述模板寡核苷酸序列的出现频率与预期分布进行比较,其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能。
在一个实施例中,预定摩尔比是等摩尔的。在另一个实施例中,预期分布包括由所述寡核苷酸引物组扩增的所述模板寡核苷酸组的均一扩增水平。在又一个实施例中,每种扩增的模板核酸分子的长度小于1000、900、800、700、600、500、400、300、200、100、90、80或70个核苷酸。
所述方法包括这样的步骤,所述步骤包括:对于相对于预期分布呈现非均一扩增潜能的所述寡核苷酸引物组的每个成员,调节所述寡核苷酸扩增引物组中的所述寡核苷酸引物成员的相对占比。在一个实施例中,调节包括增加所述寡核苷酸引物组中的所述成员的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。在另一个实施例中,调节包括减小所述寡核苷酸引物组中的所述成员的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
在其他实施例中,所述寡核苷酸引物组不包括特异性杂交至V区假基因或孤独基因或者J区假基因或孤独基因的寡核苷酸引物。
所述方法还包括这样的步骤,所述步骤包括:对于相对于预期分布呈现非均一扩增潜能的所述寡核苷酸扩增引物组的每个成员,计算所扩增的模板核酸分子(所述成员促进其扩增)的成比例增加或减小的出现频率,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
本发明包括用于定量多种重排核酸分子的方法,所述重排核酸分子编码生物样品中的一种或多种适应性免疫受体,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,每种适应性免疫受体包含可变(V)区和连接(J)区,所述方法包括:(A)在多重聚合酶链式反应(PCR)中扩增重排核酸分子,所述反应包含:(1)来自包含哺乳动物受试者的淋巴样细胞的生物样品的重排核酸分子;(2)如本文所述的组合物,其中存在已知数量的具有独特寡核苷酸序列的所述多种模板寡核苷酸的每一者;(3)寡核苷酸扩增引物组,其能够扩增编码来自生物样品的一种或多种适应性免疫受体的重排核酸分子。
在一些实施例中,所述引物组包含:(a)基本上等摩尔量的多种V区段寡核苷酸引物,其各自独立地能够特异性杂交至至少一种编码适应性免疫受体V区多肽的多核苷酸或特异性杂交至其互补序列,其中每种V区段引物包含与至少一种功能性适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列,并且其中所述多种V区段引物特异性杂交至组合物中存在的基本上所有功能性适应性免疫受体V区编码基因区段,以及(b)基本上等摩尔量的多种J区段寡核苷酸引物,其各自独立地能够特异性杂交至至少一种编码适应性免疫受体J区多肽的多核苷酸或特异性杂交至其互补序列,其中每种J区段引物包含与至少一种功能性适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列,并且其中所述多种J区段引物特异性杂交至组合物中存在的基本上所有功能性适应性免疫受体J区编码基因区段。
在另一个实施例中,V区段寡核苷酸引物和J区段寡核苷酸引物能够在所述多重聚合酶链式反应(PCR)中促进如下的扩增:(i)组合物中的基本上所有模板寡核苷酸以产生大量扩增的模板寡核苷酸,所述大量扩增的模板核酸分子足以定量组合物中的模板寡核苷酸的多样性,以及(ii)生物样品中的基本上所有编码适应性免疫受体的重排核酸分子以产生大量扩增的重排DNA分子,所述大量扩增的重排核酸分子足以定量来自生物样品的DNA中的重排核酸分子的多样性。
在一个实施例中,所述多种扩增的模板寡核苷酸中和所述多种扩增的重排核酸分子中的每种扩增核酸分子的长度小于1000个核苷酸;(B)对所述扩增的模板寡核苷酸和所述扩增的重排核酸分子进行定量测序以定量(i)含有至少一种寡核苷酸条形码序列的扩增模板寡核苷酸的模板产物数量,以及(ii)缺少寡核苷酸条形码序列的扩增重排核酸分子的重排产物数量;(C)将(B)(i)的模板产物数量除以(A)(2)的具有独特寡核苷酸序列的所述多种模板寡核苷酸中的每一者的已知数量,来计算扩增因子;以及(D)将(B)(ii)的重排产物数量除以(C)中计算的扩增因子以定量样品中的独特适应性免疫受体编码重排核酸分子的数量。
在其他实施例中,样品中的独特适应性免疫受体编码重排核酸分子的定量数量是样品中的独特B细胞或独特T细胞基因组模板的数量。
本发明包括用于计算多重PCR测定法中的平均扩增因子的方法,所述方法包括:获得生物样品,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子;使所述样品与构成如本文所述的组合物的已知量的模板寡核苷酸接触;在多重PCR反应中扩增模板寡核苷酸和来自哺乳动物受试者的淋巴样细胞的重排核酸分子,以获得多种扩增的模板寡核苷酸和多种扩增的重排核酸分子;对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率;以及基于所述多种扩增的模板寡核苷酸的平均拷贝数和所述模板寡核苷酸的所述已知量,测定所述多重PCR反应的平均扩增因子。
所述方法还包括对来自哺乳动物受试者的淋巴样细胞的所述多种扩增的重排核酸分子进行测序,以对构成所述多种的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现次数;以及基于所述多重PCR反应的平均扩增因子和所述重排核酸分子的所述出现次数,测定所述样品中的淋巴样细胞的数量。
在其他实施例中,所述方法包括测定所述样品中的淋巴样细胞的数量,其包括生成所述扩增重排核酸序列每一者的出现次数的总和并将所述总和除以所述平均扩增因子。在一些实施例中,所述已知量是每种所述模板寡核苷酸一个拷贝。在一个实施例中,100≤a≤500。在另一个实施例中,100≤b≤500。
提供了用于修正多重PCR扩增反应中的扩增偏倚的方法以定量生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,所述方法包括:(a)使所述样品与本文所述的组合物接触以生成模板加标样品,其中所述模板和所述重排核酸分子包含对应的V和J区序列;(b)在多重PCR反应中扩增所述模板加标样品,以获得多种扩增的模板寡核苷酸和多种扩增的编码多种适应性免疫受体的重排核酸分子;(c)对所述多种扩增的模板寡核苷酸测序,以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率;(d)对编码一种或多种适应性免疫受体的所述多种扩增的重排核酸分子进行测序,以对构成所述多种的编码所述多种适应性免疫受体的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现频率;(e)将所述模板寡核苷酸序列的出现频率与预期分布进行比较,其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能;(f)生成由具有所述指示的非均一核酸扩增潜能的所述寡核苷酸扩增引物组的所述成员扩增的一组模板分子和重排核酸分子序列的一组修正值,其中所述修正值组修正所述多重PCR反应中的扩增偏倚;以及(g)任选地将所述修正值组应用于所述重排核酸分子序列的所述出现频率以修正所述多重PCR反应中的扩增偏倚。
本发明包括试剂盒,所述试剂盒包含:包含如下的试剂:包含如本文所述的多种模板寡核苷酸和一组寡核苷酸引物的组合物;用于测定能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子的所述寡核苷酸引物组的成员间的非均一核酸扩增潜能的使用说明,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。
在另一个实施例中,所述试剂盒包含用于修正具有非均一核酸扩增潜能的所述寡核苷酸引物组的一个或多个成员的使用说明。
在其他实施例中,所述试剂盒包含用于定量样品中独特适应性免疫受体编码重排核酸分子的数量的使用说明。
特别地,本发明涉及以下各项:
1.一种用于使寡核苷酸引物组的扩增效率标准化的组合物,所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,每种适应性免疫受体包含可变区和连接区,所述组合物包含:
多种模板寡核苷酸,其具有多种由如下通式表示的寡核苷酸序列:
5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I]
其中:
(a)V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20个且不超过1000个连续核苷酸的多核苷酸,并且每种V多核苷酸包含独特的寡核苷酸序列;
(b)J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15个且不超过600个连续核苷酸的多核苷酸,并且每种J多核苷酸包含独特的寡核苷酸序列;
(c)U1要么不存在,要么包含选自如下的寡核苷酸序列:(i)第一通用接头寡核苷酸序列和(ii)连接至第一通用接头寡核苷酸序列并位于其5'端的第一测序平台特异性寡核苷酸序列;
(d)U2要么不存在,要么包含选自如下的寡核苷酸序列:(i)第二通用接头寡核苷酸序列和(ii)连接至第二通用接头寡核苷酸序列并位于其5'端的第二测序平台特异性寡核苷酸序列;
(e)B1、B2、B3和B4各自独立地要么不存在,要么各自包含具有3-25个连续核苷酸的条形码序列的寡核苷酸B,其中B1、B2、B3和B4各包含一寡核苷酸序列,所述寡核苷酸序列独特地识别作为成对组合的(i)(a)的独特V寡核苷酸序列和(ii)(b)的独特J寡核苷酸序列;
(f)R要么不存在,要么包含具有不存在于(a)-(e)中的寡核苷酸序列的限制性酶识别位点,
并且其中:
(g)所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列,以较大者为准,其中a是所述受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是所述受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对每种独特V多核苷酸的模板寡核苷酸和至少一种针对每种独特J多核苷酸的模板寡核苷酸。
2.根据第1项所述的组合物,其中a的范围为1至所述受试者的哺乳动物基因组中V基因区段的最大数量的数。
3.根据第1或2项所述的组合物,其中b的范围为1至所述受试者的哺乳动物基因组中J基因区段的最大数量的数。
4.根据第1-3项中任一项所述的组合物,其中a为1或b为1。
5.根据第1项所述的组合物,其中所述多种模板寡核苷酸包含至少(a×b)种独特的寡核苷酸序列,其中a是所述哺乳动物受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是所述哺乳动物受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对V区编码基因区段与J区编码基因区段的每种可能组合的模板寡核苷酸。
6.根据第1-5项中任一项所述的组合物,其中J包含所述适应性免疫受体J区编码基因序列的恒定区。
7.根据第1-6项中任一项所述的组合物,其中所述适应性免疫受体选自TCRB、TCRG、TCRA、TCRD、IGH、IGK和IGL。
8.根据第1-7项中任一项所述的组合物,其中所述(a)的V多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体V区多肽。
9.根据第1-8项中任一项所述的组合物,其中所述(b)的J多核苷酸编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体J区多肽。
10.根据第1-9项中任一项所述的组合物,还包含V与B2之间的终止密码子。
11.根据第1-10项中任一项所述的组合物,其中所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在。
12.根据第1-11项中任一项所述的组合物,其中所述多种模板寡核苷酸具有选自如下的多种由通式(I)表示的序列:
(1)所述多种由通式(I)表示的寡核苷酸序列,其中所述V和J多核苷酸具有在图5a-5l中作为TCRB V/J组1、TCRB V/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRBV/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13的68组TCRB V和J SEQ ID NO中的至少一组中示出的TCRB V和J序列;
(2)所述多种由通式(I)表示的寡核苷酸序列,其中所述V和J多核苷酸具有在图6a和6b中作为TCRG V/J组1、TCRG V/J组2、TCRG V/J组3、TCRG V/J组4和TCRG V/J组5的14组TCRG V和J SEQ ID NO中的至少一组中示出的TCRG V和J序列;
(3)所述多种由通式(I)表示的寡核苷酸序列,其中所述V和J多核苷酸具有在图7a-7m中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9的127组IGH V和J SEQ ID NO中的至少一组中示出的IGH V和J序列;
(4)如SEQ ID NO:3157-4014中所示的所述多种由通式(I)表示的寡核苷酸序列;
(5)如SEQ ID NO:4015-4084中所示的所述多种由通式(I)表示的寡核苷酸序列;
(6)如SEQ ID NO:4085-5200中所示的所述多种由通式(I)表示的寡核苷酸序列;
(7)如SEQ ID NO:5579-5821中所示的所述多种由通式(I)表示的寡核苷酸序列;
(8)如SEQ ID NO:5822-6066中所示的所述多种由通式(I)表示的寡核苷酸序列;以及
(9)如SEQ ID NO:6067-6191中所示的所述多种由通式(I)表示的寡核苷酸序列。
13.根据第1-12项中任一项所述的组合物,其中V是包含所述适应性免疫受体V区编码基因序列或其互补序列的至少30、60、90、120、150、180或210个连续核苷酸的多核苷酸。
14.根据第1-13项中任一项所述的组合物,其中V是包含适应性免疫受体V区编码基因序列或其互补序列的不超过900、800、700、600或500个连续核苷酸的多核苷酸。
15.根据第1-14项中任一项所述的组合物,其中J是包含适应性免疫受体J区编码基因序列或其互补序列的至少16-30、31-60、61-90、91-120或120-150个连续核苷酸的多核苷酸。
16.根据第1-15项中任一项所述的组合物,其中J是包含适应性免疫受体J区编码基因序列或其互补序列的不超过500、400、300或200个连续核苷酸的多核苷酸。
17.根据第1-16项中任一项所述的组合物,其中每种模板寡核苷酸的长度小于1000、900、800、700、600、500、400、300或200个核苷酸。
18.根据第1-17项中任一项所述的组合物,还包含:能够扩增编码一种或多种适应性免疫受体的重排核酸分子的一组寡核苷酸引物,所述寡核苷酸引物组包含复数a'种独特的V区段寡核苷酸引物和复数b'种独特的J区段寡核苷酸引物。
19.根据第18项所述的组合物,其中a'的范围为1至所述哺乳动物基因组中V基因区段的最大数量的数,并且b'的范围为1至所述哺乳动物基因组中J基因区段的最大数量的数。
20.根据第19项所述的组合物,其中a’为a。
21.根据第19项所述的组合物,其中b’为b。
22.根据第18-21项中任一项所述的组合物,其中所述寡核苷酸引物组中的每种V区段寡核苷酸引物和每种J区段寡核苷酸引物能够特异性杂交至所述多种模板寡核苷酸中的至少一种模板寡核苷酸。
23.根据第18-22项中任一项所述的组合物,其中每种V区段寡核苷酸引物包含与至少一种适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。
24.根据第18-23项中任一项所述的组合物,其中每种J区段寡核苷酸引物包含与至少一种适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。
25.根据第18-24项中任一项所述的组合物,其中所述组合物包含至少一种具有每种V区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸,以及至少一种具有每种J区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸。
26.一种用于测定一组寡核苷酸引物的成员中的非均一核酸扩增潜能的方法,所述一组寡核苷酸引物能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,所述方法包括:
(a)在多重PCR反应中扩增根据第18-25项中任一项所述的组合物,以获得多种扩增的模板寡核苷酸;
(b)对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率;以及
(c)将每种所述模板寡核苷酸序列的出现频率与预期分布进行比较,其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能。
27.根据第26项所述的方法,其中所述预定摩尔比是等摩尔。
28.根据第27项所述的方法,其中所述预期分布包括由所述寡核苷酸引物组扩增的所述模板寡核苷酸组的均一扩增水平。
29.根据第26项所述的方法,其中每种扩增的模板核酸分子的长度小于1000、900、800、700、600、500、400、300、200、100、90、80或70个核苷酸。
30.根据第26-29项中任一项所述的方法,还包括:对于相对于所述预期分布呈现非均一扩增潜能的所述寡核苷酸引物组的每个成员,调节所述寡核苷酸扩增引物组中的所述寡核苷酸引物成员的相对占比。
31.根据第30项所述的方法,其中调节包括增加所述寡核苷酸引物组中的所述成员的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
32.根据第30项所述的方法,其中调节包括降低所述寡核苷酸引物组中的所述成员的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
33.根据第26-32项中任一项所述的方法,其中所述寡核苷酸引物组不包括特异性杂交至V区假基因或孤独基因或者杂交至J区假基因或孤独基因的寡核苷酸引物。
34.根据第26-33项中任一项所述的方法,还包括:对于相对于所述预期分布呈现非均一扩增潜能的所述寡核苷酸扩增引物组的每个成员,计算由所述成员促进其扩增的所述扩增的模板核酸分子的成比例增加或减小的出现频率,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
35.一种用于定量生物样品中的编码一种或多种适应性免疫受体的多种重排核酸分子的方法,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,每种适应性免疫受体包含可变(V)区和连接(J)区,所述方法包括:
(A)在多重聚合酶链式反应(PCR)中扩增重排核酸分子,所述反应包含:
(1)来自所述生物样品的重排核酸分子,所述生物样品包含所述哺乳动物受试者的淋巴样细胞,
(2)如第1-17项中任一项所述的组合物,其中存在已知数量的所述多种具有独特寡核苷酸序列的模板寡核苷酸中的每一种,
(3)寡核苷酸扩增引物组,所述寡核苷酸扩增引物组能够扩增来自所述生物样品的编码一种或多种适应性免疫受体的重排核酸分子,所述引物组包含:
(a)基本上等摩尔量的多种V区段寡核苷酸引物,所述引物各自独立地能够特异性杂交至编码适应性免疫受体V区多肽的至少一种多核苷酸或特异性杂交至其互补序列,其中每种V区段引物包含与至少一种功能性适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列,并且其中所述多种V区段引物特异性杂交至所述组合物中存在的基本上所有功能性适应性免疫受体V区编码基因区段,以及
(b)基本上等摩尔量的多种J区段寡核苷酸引物,所述引物各自独立地能够特异性杂交至编码适应性免疫受体J区多肽的至少一种多核苷酸或特异性杂交至其互补序列,其中每种J区段引物包含与至少一种功能性适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列,并且其中所述多种J区段引物特异性杂交至所述组合物中存在的基本上所有功能性适应性免疫受体J区编码基因区段,
其中所述V区段和J区段寡核苷酸引物能够在所述多重聚合酶链式反应(PCR)中促进:(i)所述组合物中的基本上所有模板寡核苷酸的扩增,以产生大量的扩增模板寡核苷酸,所述大量的扩增模板核酸分子足以定量所述组合物中的所述模板寡核苷酸的多样性,以及(ii)所述生物样品中的基本上所有编码适应性免疫受体的重排核酸分子的扩增,以产生大量的扩增重排DNA分子,所述大量的扩增重排核酸分子足以定量来自所述生物样品的所述DNA中的所述重排核酸分子的多样性,
并且其中所述多种扩增模板寡核苷酸中和所述多种扩增重排核酸分子中的每种扩增核酸分子的长度小于1000个核苷酸;
(B)对所述扩增模板寡核苷酸和所述扩增重排核酸分子进行定量测序以定量(i)含有至少一种寡核苷酸条形码序列的扩增模板寡核苷酸的模板产物数量,以及(ii)缺少寡核苷酸条形码序列的扩增重排核酸分子的重排产物数量;
(C)将(B)(i)的所述模板产物数量除以(A)(2)的所述多种具有独特寡核苷酸序列的模板寡核苷酸中的每一种的已知数量,来计算扩增系数;以及
(D)将(B)(ii)的所述重排产物数量除以(C)中计算的所述扩增系数以定量所述样品中的独特适应性免疫受体编码重排核酸分子的数量。
36.根据第35项所述的方法,其中所述样品中的独特适应性免疫受体编码重排核酸分子的所述定量数量是所述样品中的独特B细胞或独特T细胞基因组模板的数量。
37.一种用于计算多重PCR测定中的平均扩增系数的方法,包括:
获得生物样品,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子;
将所述样品与已知量的构成如第18-25项中任一项所述的组合物的模板寡核苷酸接触;
在多重PCR反应中扩增所述模板寡核苷酸和来自所述哺乳动物受试者的淋巴样细胞的所述重排核酸分子,以获得多种扩增的模板寡核苷酸和多种扩增的重排核酸分子;
对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率;以及
基于所述多种扩增的模板寡核苷酸的平均拷贝数和所述模板寡核苷酸的所述已知量,测定所述多重PCR反应的所述平均扩增系数。
38.根据第37项所述的方法,还包括:
对来自所述哺乳动物受试者的淋巴样细胞的所述多种扩增的重排核酸分子进行测序,以对构成所述多种的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现次数;以及
基于所述多重PCR反应的所述平均扩增系数和所述重排核酸分子的所述出现次数,测定所述样品中的淋巴样细胞的数量。
39.根据第38项所述的方法,其中测定所述样品中的淋巴样细胞的数量包括生成每种所述扩增重排核酸序列的所述出现次数的总和并将所述总和除以所述平均扩增系数。
40.根据第37项所述的方法,其中所述已知量是每种所述模板寡核苷酸一个拷贝。
41.根据第40项所述的方法,其中100≤a≤500。
42.根据第40项所述的方法,其中100≤b≤500。
43.一种用于修正多重PCR扩增反应中的扩增偏倚以定量生物样品中编码一种或多种适应性免疫受体的重排核酸分子的方法,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,所述方法包括:
(a)将所述样品与根据第18-25项中任一项所述的组合物接触,以生成模板加标样品,其中所述模板和所述重排核酸分子包含对应的V和J区序列;
(b)在多重PCR反应中扩增所述模板加标样品,以获得多种扩增的模板寡核苷酸和多种扩增的编码多种适应性免疫受体的重排核酸分子;
(c)对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡核苷酸测定(i)模板寡核苷酸序列和(ii)所述模板寡核苷酸序列的出现频率;
(d)对编码一种或多种适应性免疫受体的所述多种扩增重排核酸分子进行测序,以对构成所述多种的编码所述多种适应性免疫受体的每种独特重排核酸分子测定i)重排核酸分子序列和(ii)所述重排核酸分子序列的出现频率;
(e)将所述模板寡核苷酸序列的所述出现频率与预期分布进行比较,其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能;
(f)生成由具有所述指示的非均一核酸扩增潜能的所述寡核苷酸扩增引物组的所述成员扩增的一组模板分子和重排核酸分子序列的一组修正值,其中所述一组修正值修正所述多重PCR反应中的扩增偏倚;以及
(g)任选地将所述一组修正值应用于所述重排核酸分子序列的所述出现频率以修正所述多重PCR反应中的扩增偏倚。
44.一种试剂盒,包括:
试剂,所述试剂包含:如第18-25项中任一项所述的包含多种模板寡核苷酸和一组寡核苷酸引物的组合物;
测定所述寡核苷酸引物组的成员间的非均一核酸扩增潜能的操作指南,所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子。
45.根据第44项所述的试剂盒,还包括修正具有非均一核酸扩增潜能的所述寡核苷酸引物组的一个或多个成员的操作指南。
46.根据第44项所述的试剂盒,还包括定量所述样品中独特适应性免疫受体编码重排核酸分子的数量的操作指南。
在参考下列具体实施方式和附图后,本文所述的发明实施例的这些和其他方面将显而易见。本说明书中提及的和/或申请资料表中列出的所有美国专利、美国专利申请公布、美国专利申请、国外专利、国外专利申请和非专利出版物均全文以引用方式并入本文,就如同每一篇被单独地并入一样。可根据需要修改本发明的各方面和实施例以采用各种专利、申请和出版物的概念以提供另外的实施例。
附图说明
参照下列描述和附图,本发明的这些和其他特征、方面和优点将变得更好理解,其中:
图1示出了供用于使能够扩增编码适应性免疫受体(TCR或BCR)的重排DNA的寡核苷酸引物组的扩增效率标准化的示例性模板寡核苷酸的示意图。U1、U2为通用接头寡核苷酸;B1-4为条形码寡核苷酸;V为可变区寡核苷酸;J为连接区寡核苷酸;R为限制性酶识别位点;S为任选的终止密码子。
图2示出了使用等摩尔(未调节)的一组52种PCR引物(SEQ ID NO:1753-1804)从标准化寡核苷酸模板组合物(以SEQ ID NO:872-1560示出的等摩尔的一组模板)扩增并在Illumina HiSeqTM DNA测序仪上定量地测序的单独TCRB V基因区段序列的扩增后频率。不存在偏倚的频率计算为0.0188。
图3示出了使用TCRB V区特异性引物交叉扩增模板寡核苷酸后的定量测序结果。Y轴指示以来自相同引物组的其他引物的摩尔浓度的两倍(2X)存在于每个独立扩增反应中的单独扩增引物(SEQ ID NO:1753-1804),所述引物组用于扩增标准化寡核苷酸模板组合物(以SEQ ID NO:872-1560示出的等摩尔的一组模板);X轴未标记,但数据点以与Y轴相同的顺序提供,其中X轴代表由定量测序所识别的对应的扩增V基因模板。黑色方块指示在使用以相对于等摩尔浓度的所有其他引物的2X存在的相应引物时扩增水平没有变化;白色方块指示扩增的10倍增加;灰色方块指示0与10倍之间的扩增的中间程度(呈现灰度级梯度)。白色方块的对角线指示给定引物的2X浓度导致大多数引物的相应模板的扩增的约10倍增加。非对角白色方块指示某些引物能够对其退火和扩增的非对应模板。
图4示出了在调节引物利用偏倚之前使用等摩尔浓度的TCRB扩增引物组(SEQ IDNO:1753-1804)的所有成员(黑条,所有V区引物以等摩尔浓度存在)以及在调节多个单独引物浓度以补偿偏倚之后使用相同引物组(SEQ ID NO:1753-1804)(灰条,减小了高效引物的浓度并增加了低效引物的浓度,参见表6)从标准化寡核苷酸模板组合物(以SEQ ID NO:872-1560示出的等摩尔的一组模板)扩增的单独TCRB V基因区段序列的扩增后频率。通过在Illumina HiSeqTM DNA测序仪上定量测序来测定扩增后频率。
图5a-5l示出了供在包含多种由通式5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I]表示的寡核苷酸序列的模板组合物中使用的TCRB V/J组(68V+13J),其用于使寡核苷酸引物组的扩增效率标准化,所述寡核苷酸引物组能够扩增编码一种或多种人T细胞受体β(TCRB)链多肽的重排DNA。
图6a和6b示出了供在包含多种由通式5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I]表示的寡核苷酸序列的模板组合物中使用的TCRG V/J组(14V+5J),其用于使寡核苷酸引物组的扩增效率标准化,所述寡核苷酸引物组能够扩增编码一种或多种人T细胞受体γ(TCRG)链多肽的重排DNA。
图7a-7m示出了供在包含多种由通式5'-U1-B1-V-B2-R-B3-J-B4-U2-3'[I]表示的寡核苷酸序列的模板组合物中使用的IGH V/J组(127V+9J),其用于使寡核苷酸引物组的扩增效率标准化,所述寡核苷酸引物组能够扩增编码一种或多种人免疫球蛋白重(IGH)链多肽的重排DNA。
图8示出了如下的结果:计算添加到IGH序列的多重PCR扩增的模板组合物中的每个VJ对的扩增因子,然后取所有合成模板的扩增因子的平均值以估算所有合成模板分子的序列覆盖倍数。
图9示出了使用如本文所述的合成模板组合物和扩增因子估算的B细胞数量相对于用作天然DNA模板来源的B细胞的已知数量的图。
图10示出了1116种IGH VJ偏倚控制分子和243种IGH DJ偏倚控制分子中的每一者的PCR扩增前测序计数。
图11示出了针对相对扩增偏倚作图的合成TCRB VJ模板的TCRB引物迭代。
图12示出了针对相对扩增偏倚作图的合成IGH VJ模板的IGH引物迭代。
图13示出了V基因的27种合成IGH DJ模板的相对扩增偏倚。
图14a-d示出了55种合成TCRG VJ模板的TCRG引物迭代。在化学偏倚控制修正之前(图14a)、化学修正的第一次迭代(图14b)、化学修正的第二次迭代(图14c)和化学修正的最后迭代(图14d)测定TCRG VJ引物的相对扩增偏倚。
具体实施方式
在某些实施例中及如本文所述,本发明提供了组合物和方法,所述组合物和方法可用于对编码适应性免疫受体如免疫球蛋白(Ig)和/或T细胞受体(TCR)的重排基因的庞大且结构多样的群体进行可靠定量。这些重排基因可存在于含有来自受试者或生物源(包括人受试者)的淋巴样细胞的DNA的生物样品中。
如本文所用,“重排核酸分子”可包括从包含编码重排适应性免疫受体的序列的淋巴样细胞系直接或间接获得的任何基因组DNA、cDNA或mRNA。
本文公开了用于使复杂寡核苷酸引物组标准化和校准的出乎意料有利的方法,所述引物组用于多重核酸扩增反应,以由含有编码适应性免疫受体的重排基因的生物样品生成扩增重排DNA分子的群组,之后再对此类扩增的产物进行定量高通量测序。重排TCR和BCR(IG)编码DNA序列的多重扩增和高通量测序例如在如下文献中有所描述:Robins et al.,2009 Blood 114,4099(Robins等人,2009年,《血液》,第114卷,第4099页);Robins et al.,2010 Sci.Translat.Med.2:47ra64(Robins等人,2010年,《科学转化医学》,第2卷,第47ra64页);Robins et al.,2011 J.Immunol.Meth.doi:10.1016/j.jim.2011.09.001(Robins等人,2011年,《免疫法杂志》,doi:10.1016/j.jim.2011.09.001);Sherwood etal.2011 Sci.Translat.Med.3:90ra61(Sherwood等人,2011年,《科学转化医学》,第3卷,第90ra61页);U.S.A.N.13/217,126(美国公布No.2012/0058902)、U.S.A.N.12/794,507(美国公布No.2010/0330571)、WO/2010/151416、WO/2011/106738(PCT/US2011/026373)、WO2012/027503(PCT/US2011/049012)、U.S.A.N.61/550,311和U.S.A.N.61/569,118;因此这些公开内容以引用方式并入并且可进行修改以根据本文所述的实施例使用。
简而言之及根据非限制性理论,本发明的组合物和方法克服了在通过对多重核酸扩增产物测序来定量TCR和BCR基因多样性的当前方法中可出现的不准确性。为了适应生物样品中可存在的TCR和BCR基因模板序列的广泛多样性,多重扩增反应中使用的寡核苷酸引物组通常包含多种多样的序列长度和核苷酸组成(例如,GC含量)。因此,在给定的一组扩增反应条件下,不同引物退火至其同源模板序列并支持其同源模板序列的扩增的效率可明显不同,从而导致不同引物的非均一利用,从而不同扩增产物的相对定量占比中产生伪差偏倚。
例如,一些高效引物的相对过度利用导致某些扩增产物的过高占比,并且一些其他低效引物的相对过低利用导致某些其他扩增产物的过低占比。存在于含淋巴样细胞DNA的样品中的每种模板物质的相对量的定量测定(通过对扩增产物测序获得)可进而得出对于扩增前样品中的不同模板物质的实际相对占比而言失实的信息。在初步研究中,例如,观察到使用一组寡核苷酸引物的多重PCR未均一扩增TCRB V基因区段,所述寡核苷酸引物组被设计成能够从人淋巴样细胞DNA模板扩增每种可能的人TCRB可变(V)区基因的序列。相反,一些V基因区段被相对过度扩增(占总序列的约10%)并且其他V基因区段被相对过低扩增(占总序列的约4×10-3%);还可参见例如图2。
为了克服扩增引物亚群的此类偏倚利用的问题,本公开首次提供了用于使寡核苷酸引物组的成员的扩增效率标准化的模板组合物和方法,其中所述引物组能够扩增生物样品中编码多种适应性免疫受体(TCR或Ig)的重排DNA,所述生物样品包含来自淋巴样细胞的DNA。所述模板组合物包含多种如本文更详细描述的由通式(I)表示的多样性模板寡核苷酸:
5'-U1-B1-V-B2-R-B3-J-B4-U2-3' (I)
构成模板组合物的组成性模板寡核苷酸相对于单独模板寡核苷酸的核苷酸序列具有多样性。单独模板寡核苷酸从而可随大量可能的TCR或BCR可变(V)和连接(J)区多核苷酸间的显著序列变异,而彼此在核苷酸序列中大幅变化。单独模板寡核苷酸物质的序列也可随多样的多种模板内的特定模板中所包含的U1、U2、B(B1、B2、B3和B4)和R寡核苷酸的序列差异而彼此变化。
在某些实施例中,条形码寡核苷酸B(B1、B2、B3和B4)可独立地和任选地包含寡核苷酸条形码序列,其中所述条形码序列被选择为独特地识别特定的独特V寡核苷酸序列与特定的独特J寡核苷酸序列的特定成对组合。条形码寡核苷酸B1和B4及通用接头的相对定位有利地允许通过短序列读段和自动DNA测序仪(例如,Illumina HiSeqTM或Illumina或GeneAnalyzerTM-2,加利福尼亚州圣地亚哥的亿明达公司(Illumina Corp.,SanDiego,CA))上的末端配对测序进行给定独特模板寡核苷酸的扩增产物的快速鉴定和定量。具体地讲,这些和相关实施例允许存在于扩增产物中的V和J序列的特异性组合的快速高通量测定,从而表征可存在于引物组中的每种V特异性引物和每种J特异性引物的相对扩增效率,所述引物组能够扩增样品中的重排TCR或BCR编码DNA。可通过较长的序列读段(任选包括延伸至B2的序列读段)实现扩增产物的种类和/或数量的验证。
在使用中,所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在,其在某些优选实施例中包括制备物,其中所有寡核苷酸的摩尔浓度彼此相差1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25%以内。在如本文所提供的某些其他优选实施例中,当所有寡核苷酸的摩尔浓度彼此在一个数量级内时,模板寡核苷酸被认为以基本上等摩尔量存在,其包括制备物,其中任何给定的独特模板寡核苷酸物质可具有的最大摩尔浓度大于组合物中具有最低浓度的独特模板寡核苷酸物质所存在的摩尔浓度不超过1000、900、800、700、600、500、440、400、350、300、250、200、150、100、90、80、70、60、50、40或30%。
以类似的方式,本文所公开的某些实施例设想了用于扩增的寡核苷酸引物组,在所述引物组中,组分引物可以基本上等摩尔量提供。也如本文所述,根据某些其他实施例,可有意调节引物组中的一种或多种引物的浓度以便某些引物不以等摩尔量存在或不以基本上等摩尔量存在。
在优选实施例中本文所述的模板组合物可用作核酸扩增(例如,PCR)模板以表征寡核苷酸引物组,如复杂的可用于重排TCR或Ig基因的多重扩增的V区段和J区段寡核苷酸引物组,例如,如本文所提供的引物组,或如下文献中所述的任何引物组:Robins et al.,2009 Blood 114,4099(Robins等人,2009年,《血液》,第114卷,第4099页);Robins et al.,2010Sci.Translat.Med.2:47ra64(Robins等人,2010年,《科学转化医学》,第2卷,第47ra64页);Robins et al.,2011 J.Immunol.Meth.doi:10.1016/j.jim.2011.09.001(Robins等人,2011年,《免疫法杂志》,doi:10.1016/j.jim.2011.09.001);Sherwood et al.2011Sci.Translat.Med.3:90ra61(Sherwood等人,2011年,《科学转化医学》,第3卷,第90ra61页);U.S.A.N.13/217,126(美国公布No.2012/0058902)、U.S.A.N.12/794,507(美国公布No.2010/0330571)、WO/2010/151416、WO/2011/106738(PCT/US2011/026373)、WO2012/027503(PCT/US2011/049012)、U.S.A.N.61/550,311和U.S.A.N.61/569,118;等等。
优选地,用于使扩增效率标准化的模板组合物中的所有模板均为基本上相同长度的寡核苷酸,所述模板组合物在本文有所描述并且包含具有多样性序列和通式(I)通用结构的多种模板寡核苷酸。不希望受理论的束缚,一般认为在核酸扩增反应如聚合酶链式反应(PCR)中,模板DNA长度可通过影响引物与模板DNA分子之间的相互作用的动力学来影响寡核苷酸引物的扩增效率,引物可通过核苷酸碱基互补性经特异性核苷酸序列引导的杂交而退火至模板DNA分子。一般认为较长模板的操作效率低于相对较短的模板。在某些实施例中,本发明所公开的用于使寡核苷酸引物组的扩增效率标准化的模板组合物包含多种如本文所提供的由通式(I)表示的模板寡核苷酸,所述寡核苷酸引物组能够扩增编码多种TCR或BCR的重排DNA,其中所述模板寡核苷酸具有长度不超过1000、950、900、850、800、750、700、650、600、550、500、450、400、350、300、250、200、150或100个核苷酸(包括其间的所有整数值)的相同长度或基本上相同长度。
因此,为了使对多重扩增期间寡核苷酸引物利用的非期望偏倚的潜在贡献降低、消除或最小化,本文公开的优选实施例可采用多种模板寡核苷酸,其中具有序列多样性的多种模板寡核苷酸中的所有模板寡核苷酸具有基本上相同长度。当模板组合物中的所有(例如,100%)或大多数(例如,大于50%)此类寡核苷酸为各自具有完全相同数量的核苷酸的寡核苷酸,或其中模板组合物中的一种或多种模板寡核苷酸彼此长度差异不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90或100个核苷酸的情况下,多种模板寡核苷酸可具有基本上相同长度。根据本公开可以理解,即使在并非所有模板寡核苷酸具有完全相同长度的情况下,本文所述的组合物和方法仍然可用于测定以及任选用于修正一组寡核苷酸扩增引物各成员间的非均一核酸扩增潜能。
根据某些本发明所公开的实施例,(i)本发明所述的模板组合物的每种模板寡核苷酸以基本上等摩尔量提供,(ii)能够扩增编码多种适应性免疫受体的重排DNA的寡核苷酸引物组包含以基本上等摩尔量提供的多种V区段寡核苷酸引物,(iii)能够扩增编码多种适应性免疫受体的重排DNA的寡核苷酸引物组包含以基本上等摩尔量提供的多种J区段寡核苷酸引物,以及(iv)扩增随给定序列的起始模板的数量呈线性变化。
因此,可计算每种模板的扩增产物的预期产率并任意赋给100%的理论均一扩增水平值。在允许引物组在扩增反应中扩增模板寡核苷酸的序列之后,在不同扩增产物的相对比例间观察到的与基本等同的任何统计学显著偏差指示扩增期间存在引物利用的偏倚(即,不同效率)。换句话讲,所获得的不同扩增产物的相对量的定量差异指示并非引物组中的所有引物都以相当的效率扩增其各自的模板。某些实施例设想赋给高于和低于理论100%产率的容差范围,使得容差范围内的任何扩增水平值均可视为基本等同。
在某些此类实施例中,当产物产率全部处于相同数量级内(如,相差小于十倍)时,扩增产物产率的范围可视为基本上等同。在某些其他此类实施例中,当产物产率彼此相差不超过九倍、八倍、七倍、六倍、五倍、四倍或三倍时,扩增产物产率的范围可视为基本上等同。在某些其他实施例中,可视为处于可接受容差范围内的产物产率可比所计算的100%产率多或少多达1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、100或200%。
因为所述方法涉及使用已知技术测定每种扩增产物的核苷酸序列作为定量过程的一部分,因此可以鉴定负责扩增每种独特(如由序列所定义)产物的引物并且可相应调节(如,以统计学显著的方式增加或减少)其在引物组中的相对量。可相对于其他引物的浓度减少引物组中极其高效的引物的浓度,使得此类引物对本文所述模板组合物中的模板的特异性扩增的水平基本上等同于大多数引物所实现的扩增水平,所述大多数引物实现理论均一扩增水平,或实现处于可接受容差范围内的水平。可相对于其他引物的浓度增加引物组中低效的引物的浓度,使得此类引物对本文所述模板组合物中的模板的特异性扩增的水平基本上等同于大多数引物所实现的扩增水平,所述大多数引物实现理论均一扩增水平,或实现处于可接受容差范围内的水平。
因此及如本文所述,本发明从而提供了用于使被设计为扩增给定TCR或Ig链的完整组库的编码序列的寡核苷酸引物组的扩增效率标准化的模板组合物,用于测定此类引物组的成员间的非均一扩增效率(“非均一扩增潜能”)的方法,以及用于修正此类非均一扩增潜能的方法。通过提供本文所述的模板组合物作为可用来校准寡核苷酸引物组的标准品,并且在特定实施例中,在每种模板寡核苷酸以基本上等摩尔量存在使得可调节单独的引物浓度以产生结构多样的一系列扩增产物的基本上均一的扩增的情况下,本公开从而有利地克服了上述与单独引物效率偏倚相关的问题。
使用本文提供的组合物和方法,可将单独的引物鉴定为具有非均一扩增潜能,原因在于其促进非均一扩增,如相对于均一扩增水平而言特异性模板寡核苷酸的增加(如,以统计学显著的方式更大)或减少(如,以统计学显著的方式更低)扩增所证实的那样,尽管扩增反应中存在(i)彼此基本上等摩尔量的所有模板寡核苷酸、(ii)彼此基本上等摩尔量的所有V区段引物、以及(iii)彼此基本上等摩尔量的所有J区段引物。
然后可减少或增加此类引物的相对浓度以获得改良的完整引物组,其中所有引物不以相对于彼此基本上等摩尔量存在,以分别补偿相对于均一扩增水平增加或减少的扩增水平。然后可重新测试引物组其以均一扩增水平或在可接受容差范围内扩增本文所公开的模板组合物中的所有序列的能力。
可迭代地重复测试改良的引物组其扩增本文所公开的模板组合物的能力的过程直到所有产物均以均一扩增水平或在可接受容差范围内扩增为止,其中所有模板寡核苷酸均以彼此基本上等摩尔量提供。通过使用本文所公开的模板组合物的此类过程,可使寡核苷酸引物组的扩增效率标准化,其中所述引物组能够扩增生物样品中编码一种或多种适应性免疫受体的有效重排DNA,所述生物样品包含来自受试者淋巴样细胞的DNA。
此外或作为另外一种选择,根据本公开,可测定任何特定对的寡核苷酸扩增引物是否呈现非均一扩增潜能,如相对于大多数寡核苷酸扩增引物呈现的均一扩增水平所增加或减少的模板组合物扩增,然后可使用归一化调节因子分别计算每种此类扩增引物对所促进的扩增产物的成比例减少或增加的出现频率。本发明模板组合物从而在某些实施例中提供修正一组寡核苷酸扩增引物的成员间的非均一核酸扩增潜能的方法。
某些此类实施例可有利地允许对作为非均一扩增事件的结果所获得的数据进行修正、校准、标准化、归一化等。从而,本发明实施例允许对数据不准确性(如可由偏倚的寡核苷酸引物利用所引起)进行修正,而无需迭代地调节一种或多种扩增引物的浓度以及重复扩增本文所述的模板组合物的步骤。在可避免对扩增产物定量测序的步骤的重复的情况下,可从而获得有利的效率。然而,某些其他设想的实施例可采用此类迭代方法。
因此及如本文所述,本发明提供了用于使寡核苷酸引物组的扩增效率标准化的模板组合物,以及使用此类模板组合物测定寡核苷酸引物组的单独成员间的非均一核酸扩增潜能(如,偏倚)的方法。本文还描述了用于修正寡核苷酸引物组的各成员间的此类非均一核酸扩增潜能(如,偏倚)的方法。这些和相关实施例利用通过校准复杂寡核苷酸引物组所获得的之前未认识到的有益效果以使用具有本文所述特征的用于使扩增效率标准化的模板组合物补偿不期望的扩增偏倚,并且相对于之前所述的方法,可用于提高特异性克隆型TCR和/或Ig编码DNA序列可定量的准确性。
另外如上文指出及本文其他地方所述,在本公开之前,存在如下两者之间不令人满意且难以分辨的差异:(i)在含有来自受试者的淋巴样细胞DNA的生物样品中,具有独特序列的重排适应性免疫受体编码DNA模板的实际定量分布,以及(ii)在使用被设计用于扩增样品中的基本上所有有效重排适应性免疫受体基因的一组复杂的寡核苷酸扩增引物进行多重扩增后,此类模板的核酸扩增产物的相对占比。由于例如模板群体和扩增引物组两者的异质性,并且如本文所示,不同扩增引物的扩增效率的显著差异可为常见的,从而导致扩增反应后所获得和定量测序的扩增产物的相对比例呈明显偏态。
模板和引物
根据某些优选实施例,从而提供了用于使寡核苷酸引物组的扩增效率标准化的模板组合物,所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的重排DNA(其在某些实施例中可以指有效重排DNA,但在某些其他实施例中不必如此限制),所述生物样品包含来自受试者的淋巴样细胞的DNA,所述模板组合物包含多种由通式(I)表示的模板寡核苷酸:
5'-U1-B1-V-B2-R-B3-J-B4-U2-3' (I)
如本文所提供的。在某些优选实施例中,所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在,其在某些实施例中及如上文所指出,可以指模板寡核苷酸中的每一者均以等摩尔浓度存在或以摩尔浓度计与等摩尔偏差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、50、60、70、80、90、100或200%的摩尔浓度存在的组合物,并且在某些其他实施例中,可以指所有模板寡核苷酸均以彼此处于一个数量级内的摩尔浓度存在的组合物。所述多种模板可包含至少100、200、300、400、500、600、700、800、900、1000、1100或更多种分立的寡核苷酸物质(每一者均具有不同的核苷酸序列),包括其间的每个中间整数值。
本文所公开的模板组合物从而包含多种由如下通式表示的模板寡核苷酸:
5'-U1-B1-V-B2-R-B3-J-B4-U2-3' [I]
其中,简而言之及如本文其他地方更详细阐述,根据某些优选实施例:
V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20、30、60、90、120、150、180或210个且不超过1000、900、800、700、600或500个连续核苷酸的多核苷酸,并且在所述多种模板寡核苷酸序列的每一者中,V包含独特的寡核苷酸序列;
J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15-30、31-60、61-90、91-120或120-150个且不超过600、500、400、300或200个连续核苷酸的多核苷酸,并且在所述多种模板寡核苷酸序列的每一者中,J包含独特的寡核苷酸序列;
U1和U2要么各自不存在,要么各自包含独立地具有选自如下的序列的寡核苷酸:(i)通用接头寡核苷酸序列和(ii)连接至通用接头寡核苷酸序列并位于其5'端的测序平台特异性寡核苷酸序列;
B1、B2、B3和B4各自独立地要么不存在,要么各自包含寡核苷酸B,寡核苷酸B包含3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个连续核苷酸(包括其间的所有整数值)的寡核苷酸条形码序列,其中在所述多种模板寡核苷酸序列的每一者中,B包含一独特的寡核苷酸序列,所述独特的寡核苷酸序列独特地识别(i)模板寡核苷酸的独特V寡核苷酸序列和(ii)模板寡核苷酸的独特J寡核苷酸序列,或者识别作为成对组合的这二者;并且
R要么不存在,要么包含一限制性酶识别位点,所述限制性酶识别位点包含不存在于V、J、U1、U2、B1、B2、B3和B4中的寡核苷酸序列。
在一些实施例中,模板寡核苷酸组合物包含另外的非编码寡核苷酸或随机寡核苷酸。这些寡核苷酸可插入在通式I(5'-U1-B1-V-B2-R-B3-J-B4-U2-3')中的组分之间或之内的各个部分中,并且具有各种长度的大小。
在一个实施例中,a为1至受试者的哺乳动物基因组中V基因区段的最大数量的数。在另一个实施例中,b为1至受试者的哺乳动物基因组中J基因区段的最大数量的数。在其他实施例中,a为1或者b为1。在一些实施例中,a可在对于TCRA而言的1个V基因区段至54个V基因区段的范围内,对于TCRB而言的1-76个V基因区段的范围内,对于TCRG而言的1-15个V基因区段的范围内,对于TCRD而言的1-7个V基因区段的范围内,对于IGH而言的1-165个V基因区段的范围内,对于IGK而言的1-111个的范围内,或对于IGL而言的1-79个V基因区段的范围内。在其他实施例中,b可在对于TCRA而言的1个J个基因区段至61个J基因区段的范围内,对于TCRB而言的1-14个J基因区段的范围内,对于TCRG而言的1-5个J基因区段的范围内,对于TCRD而言的1-4个基因区段的范围内,对于IGH而言的1-9个J基因区段的范围内,对于IGK而言的1-5个J基因区段的范围内,或对于IGL而言的1-11个J基因区段的范围内。
下表列出了每个人适应性免疫受体基因座的V基因区段(a)和J基因区段(b)的数量,包括功能性V和J区段。
V区段* 功能性V区段** J区段* 功能性J区段**
TCRA 54 45 61 50
TCRB 76 48 14 13
TCRG 15 6 5 5
TCRD 7 7 4 4
IGH 165 51 9 6
IGK 111 44 5 5
IGL 79 33 11 7
*总共的可变和连接区段基因
**具有至少一个功能性等位基因的可变和连接区段基因
在一些实施例中,J多核苷酸包含适应性免疫受体J恒定区或其互补序列的至少15-30、31-60、61-90、91-120或120-150个并且不超过600、500、400、300或200个连续核苷酸。
在某些实施例中,所述多种模板寡核苷酸包含至少(a×b)种独特的寡核苷酸序列,其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对V区编码基因区段与J区编码基因区段的每种可能组合的模板寡核苷酸。
然而,本发明设想的发明并非旨在如此限制,使得在某些实施例中,可有利地使用明显更少数量的模板寡核苷酸。在a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量的这些和相关实施例中,构成所述多种模板寡核苷酸的独特寡核苷酸序列的最小数量可由a和b中的较大者决定,只要每种独特V多核苷酸序列和每种独特J多核苷酸序列存在于模板组合物中的至少一种模板寡核苷酸中即可。从而,根据某些相关实施例,模板组合物可包含针对每种独特V多核苷酸的至少一种模板寡核苷酸(例如,包括根据通式(I)的每种独特V多核苷酸的单种模板寡核苷酸),以及针对每种独特J多核苷酸的至少一种模板寡核苷酸(例如,包括根据通式(I)的每种独特J多核苷酸的单种模板寡核苷酸)。
在某些其他实施例中,模板组合物包含扩增引物组中的每种寡核苷酸扩增引物可退火至其上的至少一种模板寡核苷酸。
即,在某些实施例中,模板组合物包含至少一种具有每种V区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸,以及至少一种具有每种J区段寡核苷酸引物可与之特异性杂交的由通式(I)表示的寡核苷酸序列的模板寡核苷酸。
根据此类实施例,能够扩增编码一种或多种适应性免疫受体的重排DNA的寡核苷酸引物组包含复数a'种独特的V区段寡核苷酸引物和复数b'种独特的J区段寡核苷酸引物。所述复数a'种V区段寡核苷酸引物各自独立地能够退火或特异性杂交至至少一种编码适应性免疫受体V区多肽的多核苷酸或至其互补序列,其中每种V区段引物包含与至少一种适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。所述复数b'种J区段寡核苷酸引物各自独立地能够退火或特异性杂交至至少一种编码适应性免疫受体J区多肽的多核苷酸或至其互补序列,其中每种J区段引物包含与至少一种适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列。
在一些实施例中,a’与a相同(以上针对模板寡核苷酸所述)。在其他实施例中,b’与b相同(以上针对模板寡核苷酸所述)。
从而,在某些实施例中及还如本文其他地方所讨论,本发明模板组合物可与被设计用于扩增所有重排适应性免疫受体编码基因序列(包括未表达的那些基因序列)的扩增引物一起用于扩增反应,而在某些其他实施例中,模板组合物和扩增引物可被设计为使得不产生未表达的重排基因(例如,假基因、孤独基因)的扩增产物。因此应当理解,在某些实施例中,可有利地仅扩增重排适应性免疫受体编码基因的亚组,使得合适的扩增引物亚组可被设计且用于仅扩增所关注的那些重排V-J序列。相应地,在这些和相关实施例中,可使用本文所述的仅包含重排V-J重排序列的所关注亚组的模板组合物,只要所述模板组合物包含至少一种扩增引物组中的每种寡核苷酸扩增引物可退火至其上的模板寡核苷酸即可。模板组合物中的模板寡核苷酸的实际数量可从而随要使用的扩增引物组而在各设想的实施例间大幅变化。
例如,在某些相关实施例中,在模板组合物中,所述多种模板寡核苷酸可具有选自如下的多种由通式(I)表示的序列:(1)所述多种由通式(I)表示的寡核苷酸序列,其中多核苷酸V和J分别具有如图5a-5l中作为TCRB V/J组1、TCRB V/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRB V/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13示出的68组TCRB V和J SEQ ID NO中的至少一组中所示的TCRB V和J序列;(2)所述多种由通式(I)表示的寡核苷酸序列,其中多核苷酸V和J分别具有如图6中作为TCRG V/J组1、TCRG V/J组2、TCRG V/J组3、TCRG V/J组4和TCRGV/J组5示出的14组TCRG V和J SEQ ID NO中的至少一组中所示的TCRG V和J序列;以及(3)所述多种由通式(I)表示的寡核苷酸序列,其中多核苷酸V和J分别具有如图7中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9示出的127组IGH V和J SEQ ID NO中的至少一组中所示的IGH V和J序列。
在某些实施例中,V是编码适应性免疫受体V区或其互补序列的至少10-70个连续氨基酸的多核苷酸序列;J是编码适应性免疫受体J区或其互补序列的至少5-30个连续氨基酸的多核苷酸序列;U1和U2各自要么不存在,要么包含具有选自如下的核苷酸序列的寡核苷酸:(i)通用接头寡核苷酸序列和(ii)连接至通用接头寡核苷酸序列并位于其5'端的测序平台特异性寡核苷酸序列;B1、B2、B3和B4各自独立地要么不存在,要么各自包含寡核苷酸B,所述寡核苷酸B包含3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸的寡核苷酸条形码序列,其中在所述多种寡核苷酸序列的每一者中,B包含一独特的寡核苷酸序列,所述独特的寡核苷酸序列识别作为成对组合的(i)独特V寡核苷酸序列和(ii)独特J寡核苷酸序列;并且R要么不存在,要么包含一限制性酶识别位点,所述限制性酶识别位点包含不存在于V、J、U1、U2、B1、B2、B3和B4中的寡核苷酸序列。在某些优选实施例中,所述多种模板寡核苷酸包含至少a种或b种独特的寡核苷酸序列,其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含多种模板寡核苷酸,所述多种模板寡核苷酸包含至少a种或b种(以较大者为准)独特的模板寡核苷酸序列,前提条件是包括与每种V区编码基因区段对应的至少一种V多核苷酸和与每种J区编码基因区段对应的至少一种J多核苷酸。
大量适应性免疫受体可变(V)区和连接(J)区基因序列作为核苷酸和/或氨基酸序列是已知的,包括TCR和Ig基因座的非重排基因组DNA序列,以及此类基因座处的有效重排DNA序列及其编码的产物,并且还包括这些基因座处的假基因,并且还包括相关孤独基因。参见例如,U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373、PCT/US2011/049012。本领域已知的这些和其他序列可根据本公开用于将要包括在本发明提供的模板组合物中的模板寡核苷酸的设计和产生,其中所述模板组合物用于使寡核苷酸引物组的扩增效率标准化,以及用于能够扩增编码TCR或Ig多肽链的重排DNA的寡核苷酸引物组的设计和产生,所述重排DNA可存在于包含淋巴样细胞DNA的生物样品中。
在式(I)中,V是适应性免疫受体(例如,TCR或BCR)可变(V)区基因序列或其互补序列的至少30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400或450个且不超过1000、900、800、700、600或500个连续核苷酸的多核苷酸序列,并且在所述多种寡核苷酸序列的每一者中,V包含独特的寡核苷酸序列。人及其他物种的TCR和BCR V区基因的基因组序列是已知的并且可从公共数据库如Genbank获得;V区基因序列包含编码表达的重排TCR和BCR基因的产物的多核苷酸序列,并且还包含已在V区基因座中鉴定的假基因的多核苷酸序列。可掺入到本发明所公开的通式(I)模板中的多样性V多核苷酸序列在长度上、在核苷酸组成(例如,GC含量)上、以及在实际的线性多核苷酸序列上可宽泛变化,并且例如已知包括表现出特定序列多样性的“热点(hot spot)”或高变区。
通式(I)中的多核苷酸V(或其互补序列)包含TCR或BCR基因的特异性寡核苷酸引物组成员可特异性退火至其上的序列。能够扩增编码多种TCR或BCR的重排DNA的引物组在例如U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373或PCT/US2011/049012等中有所描述,或如本文所述可设计为包含可特异性杂交至特定TCR或BCR基因座(例如,TCRα、β、γ或δ、或IgHμ、γ、δ、α或ε、或IgLκ或λ)中的每种独特V基因和每种J基因的寡核苷酸序列。例如,以举例说明而非限制的方式,能够扩增编码一种或多种TCR或BCR的重排DNA的寡核苷酸引物扩增组的寡核苷酸引物可通常包含15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸或更多个的核苷酸序列,并且可特异性地退火至如本文所提供的V或J多核苷酸的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的互补序列。在某些实施例中,引物可包含至少19、20、21、22、23、24、25、26、27、28、29或30个核苷酸,并且在某个实施例中,引物可包含不超过15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个连续核苷酸的序列。如本文所公开,还明确设想了其他长度的引物和引物退火位点。
通式(I)中每种多核苷酸V的整个多核苷酸序列可唯一地由来自每种不同V基因的连续核苷酸组成,但不是必需的。例如并根据某些实施例,在本文所述的模板组合物中,每种式(I)的多核苷酸V仅需具有至少一个区域,所述至少一个区域包含存在于一种V基因中并且引物组中的单种V区引物可特异性退火至其上的独特V寡核苷酸序列。从而,式(I)的V多核苷酸可包含天然存在的V基因序列(包括V假基因序列)的全部或任何规定部分(例如,至少15、20、30、60、90、120、150、180或210个连续核苷酸,或其间的任何整数值),只要包括任何其他模板V多核苷酸中不含的至少一种独特V寡核苷酸序列区(引物退火位点)即可。
在某些实施例中可优选的是,存在于本文所述的模板组合物中的所述多种V多核苷酸具有模拟已知的天然存在V基因核苷酸序列的全长的长度,即使在特异性核苷酸序列在模板V区与任何天然存在的V基因之间有差别的情况下也是如此。本文所述的模板中的V区长度可与天然存在的V基因序列的长度相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20%。
式(I)中的V多核苷酸可从而在某些实施例中包含具有与典型V基因从其起始密码子到其CDR3编码区的长度相同或类似的长度的核苷酸序列,并且可以(但不是必需)包含编码CDR3区的核苷酸序列。CDR3编码核苷酸序列和序列长度可大幅变化并且已通过若干不同编号方案表征(例如,Lefranc,1999The Immunologist 7:132(Lefranc,1999年,《免疫学家》,第7卷,第132页);Kabat et al.,1991 In:Sequences of Proteins ofImmunological Interest,NIH Publication 91-3242(Kabat等人,1991年,载于:《具有免疫学重要性的蛋白质的序列》,NIH出版,第91-3242页);Chothia et al.,1987J.Mol.Biol.196:901(Chothia等人,1987年,《分子生物学杂志》,第196卷,第901页);Chothia et al.,1989 Nature 342:877(Chothia等人,1989年,《自然》,第342卷,第877页);Al-Lazikani et al.,1997 J.Mol.Biol.273:927(Al-Lazikani等人,1997年,《分子生物学杂志》,第273卷,第927页);还可参见例如,Rock et al.,1994 J.Exp.Med.179:323(Rock等人,1994年,《实验医学杂志》,第179卷,第323页);Saada et al.,2007Immunol.Cell Biol.85:323(Saada等人,2007年,《免疫学和细胞生物学》,第85卷,第323页))。
简而言之,CDR3区通常跨越从V区段中的高度保守的半胱氨酸残基(由三核苷酸密码子TGY编码;Y=T或C)延伸到TCR的J区段中的高度保守的苯丙氨酸残基(由TTY编码)或延伸到IGH中的高度保守的色氨酸(由TGG编码)的多肽部分。TCRB基因座中的超过90%的天然有效重排具有根据该标准介于24至54个核苷酸之间的CDR3编码长度,对应于介于9至17个编码的氨基酸之间。对于任何给定的TCR或BCR基因座,本发明所公开的合成模板寡核苷酸的CDR3长度可落在与95%的天然存在的重排相同的范围内。从而,例如,在用于使寡核苷酸引物组的扩增效率标准化的本文所述的模板组合物中,其中所述寡核苷酸引物组能够扩增编码多种TCRB多肽的重排DNA,V多核苷酸的CDR3编码区可具有24至54个核苷酸的长度,包括其间的每个整数。上述CDR3编码区的编号方案指示保守的半胱氨酸、苯丙氨酸和色氨酸密码子的位置,并且这些编号方案也可应用于假基因,其中编码这些保守的氨基酸的一个或多个密码子可被替换为编码不同氨基酸的密码子。对于不使用这些保守的氨基酸的假基因,可根据以上引用的既定CDR3序列位置编号方案中的一者相对于对应位置限定CDR3长度,在所述对应位置处将观察到保守的残基没有被置换。
在某些实施例中还可优选的是,存在于本文所述的模板组合物中的所述多种V多核苷酸具有模拟已知的天然存在V基因序列的全部核苷酸组成的核苷酸组成(例如,GC含量的百分比),即使在特异性核苷酸序列不同的情况下也是如此。此类模板V区核苷酸组成可与天然存在的V基因序列的核苷酸组成相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20%。任选地及根据某些实施例,本文所述的模板寡核苷酸的V多核苷酸在通式(I)中的V的3'端处或附近包含终止密码子。
在式(I)中,J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15-30、31-60、61-90、91-120或120-150个且不超过600、500、400、300或200个连续核苷酸的多核苷酸,并且在所述多种寡核苷酸序列的每一者中,J包含独特的寡核苷酸序列。
通式(I)中的多核苷酸J(或其互补序列)包含TCR或BCR基因特异性的寡核苷酸引物组成员可特异性退火至其上的序列。能够扩增编码多种TCR或BCR的重排DNA的引物组在例如U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373、或PCT/US2011/049012等中有所描述,或如本文所述可设计为包含可特异性杂交至特定TCR或BCR基因座(例如,TCRα、β、γ或δ、或IgHμ、γ、δ、α或ε、或IgLκ或λ)中的每种独特V基因和每种独特J基因的寡核苷酸序列。
通式(I)中每种多核苷酸J的整个多核苷酸序列可唯一地由来自每种不同J基因的连续核苷酸组成,但不是必需的。例如并根据某些实施例,在本文所述的模板组合物中,每种式(I)的多核苷酸J仅需具有至少一个区域,所述至少一个区域包含存在于一种J基因中并且引物组中的单种V区引物可特异性退火至其上的独特J寡核苷酸序列。从而,式(I)的V多核苷酸可包含天然存在的V基因序列(包括V假基因序列)的全部或任何规定部分(例如,至少15、20、30、60、90、120、150、180或210个连续核苷酸,或其间的任何整数值),只要包括任何其他模板J多核苷酸中不含的至少一种独特V寡核苷酸序列区(引物退火位点)即可。
在某些实施例中可优选的是,存在于本文所述的模板组合物中的所述多种J多核苷酸具有模拟已知的天然存在J基因核苷酸序列的全长的长度,即使在特异性核苷酸序列在模板J区与任何天然存在的J基因之间有差别的情况下也是如此。本文所述的模板中的J区长度可与天然存在的J基因序列的长度相差不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20%。
式(I)中的J多核苷酸可因此在某些实施例中包含具有与典型天然存在的J基因的长度相同或类似的长度的核苷酸序列,并且可包含(但不是必需的)编码CDR3区的核苷酸序列,如上文所讨论。
人及其他物种的TCR和BCR J区基因的基因组序列是已知的并且可从公共数据库如Genbank获得;J区基因序列包含编码表达的和未表达的重排TCR和BCR基因的产物的多核苷酸序列。可掺入到本发明所公开的通式(I)的模板中的多样性J多核苷酸序列在长度上、在核苷酸组成(例如,GC含量)上、以及在实际的线性多核苷酸序列上可宽泛变化。
技术人员可使用本领域中与每个TCR和Ig亚基的基因的V和J编码区的已公布基因序列相关的知识,基于本公开来选择用于构建本文所述的模板寡核苷酸和/或V区段和J区段寡核苷酸引物的本文所述的V和J序列的替代物。人适应性免疫受体序列的参考Genbank条目包括:TCRα:(TCRA/D):NC_000014.8(chr14:22090057..23021075);TCRβ:(TCRB):NC_000007.13(chr7:141998851..142510972);TCRγ:(TCRG):NC_000007.13(chr7:38279625..38407656);免疫球蛋白重链,IgH(IGH):NC_000014.8(chr14:106032614..107288051);免疫球蛋白轻链κ,IgLκ(IGK):NC_000002.11(chr2:89156874..90274235);以及免疫球蛋白轻链λ,IgLλ(IGL):NC_000022.10(chr22:22380474..23265085)。小鼠适应性免疫受体基因座序列的参考Genbank条目包括:TCRβ:(TCRB):NC_000072.5(chr6:40841295..41508370),以及免疫球蛋白重链,IgH(IGH):NC_000078.5(chr12:114496979..117248165)。
可进行模板和引物设计分析以及靶位点选择考虑,例如使用OLIGO引物分析软件和/或BLASTN 2.0.5算法软件(Altschul et al.,Nucleic Acids Res.1997,25(17):3389-402(Altschul等人,《核酸研究》,1997年,第25卷,第17期,第3389-3402页))或本领域可利用的其他类似程序进行。
因此,基于本公开及考虑到用于包含在本发明模板寡核苷酸中的这些已知的适应性免疫受体基因序列和寡核苷酸设计方法,本领域技术人员可设计多种V区特异性和J区特异性的多核苷酸序列,其各自独立地包含给定V和J基因分别特有的寡核苷酸序列。类似地,根据本公开及考虑到已知的适应性免疫受体序列,本领域技术人员还可设计引物组,所述引物组包含多种V区特异性和J区特异性的寡核苷酸引物,所述引物各自独立地能够退火至给定V和J基因分别特有的特异性序列,由此所述多种引物能够扩增给定适应性免疫受体编码基因座(例如,人TCR或IgH基因座)中的基本上所有V基因和基本上所有J基因。此类引物组允许在多重(例如,使用多种正向和反向引物对)PCR中生成第一端由重排V区编码基因区段编码并且第二端由J区编码基因区段编码的扩增产物。
通常及在某些实施例中,此类扩增产物可包含CDR3编码序列,但本发明并非旨在如此限制并设想了不包含CDR3编码序列的扩增产物。引物可被优选地设计用于产生扩增产物,所述扩增产物具有足够部分的如本文所述的V和J序列和/或V-J条形码(B)序列,使得通过对产物(扩增子)测序,可以基于每个基因区段特有的序列鉴定(i)特定V基因和(ii)特定J基因,在所述特定J基因附近V基因经历重排而产生功能性适应性免疫受体编码基因。通常及在优选实施例中,PCR扩增产物大小不会超过600个碱基对,这根据非限制理论将不包括来自非重排适应性免疫受体基因的扩增产物。在某些其他优选实施例中,扩增产物大小不会超过500、400、300、250、200、150、125、100、90、80、70、60、50、40、30或20个碱基对,如可有利地通过短序列读段提供序列不同的扩增子的快速、高通量定量。
在某些优选实施例中,所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列,以较大者为准,其中a是受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对每种独特V多核苷酸的模板寡核苷酸以及至少一种针对每种独特J多核苷酸的模板寡核苷酸。应当理解,因为模板寡核苷酸具有多种由通式(I)表示的寡核苷酸序列,其包含V多核苷酸并且也包含J多核苷酸,模板组合物可从而包含少于(a×b)种的独特寡核苷酸序列,但将包含至少a或b中较大个数的独特寡核苷酸序列。因此,所述组合物可提供每种独特V多核苷酸序列的至少一次出现和每种独特J多核苷酸序列的至少一次出现,其中在一些情况下特定独特V多核苷酸的至少一次出现将存在于其中可发现特定独特J多核苷酸的至少一次出现的相同模板寡核苷酸中。从而,例如,“每种独特V多核苷酸的至少一种模板寡核苷酸和每种独特J多核苷酸的至少一种模板寡核苷酸”在某些情况下可以指其中存在一种独特V多核苷酸和一种独特J多核苷酸的单一模板寡核苷酸。
还如本文其他地方所公开,在某些其他优选实施例中,模板组合物包含扩增引物组中的每种寡核苷酸扩增引物可退火至其上的至少一种模板寡核苷酸。因此,所述组合物可包含少于a或b种独特序列,例如,在扩增引物组可不包含针对每种可能的V和/或J序列的独特引物的情况下。
应当指出的是,某些实施例设想了用于使寡核苷酸引物组的扩增效率标准化的模板组合物,所述寡核苷酸引物组能够扩增生物样品中编码一种或多种适应性免疫受体的有效重排DNA,所述生物样品包含来自如本文提供的受试者的淋巴样细胞的DNA,其中模板组合物包含多种模板寡核苷酸,所述多种模板寡核苷酸具有多种如本文所述的由通式5'-U1-B1-V-B2-R-B3-J-B4-U2-3'(I)表示的寡核苷酸序列。根据这些和相关实施例及还如本文其他地方所述,能够扩增有效重排DNA的所述寡核苷酸扩增引物组可不包含特异性杂交至V区假基因或孤独基因或者J区假基因或孤独基因的任何寡核苷酸引物。因此,在此类实施例中,模板组合物将有利地不包含有通式(I)表示的模板寡核苷酸,其中独特V寡核苷酸序列和/或独特J寡核苷酸序列是V区假基因或孤独基因或者J区假基因或孤独基因分别特有的序列。
包含858种不同模板寡核苷酸的示例性TCRB模板组合物在序列表中以SEQ ID NO:3157-4014公开。包含871种不同模板寡核苷酸的另一个示例性TCRB模板组合物在序列表中以SEQ ID NO:1-871公开。包含689种不同模板寡核苷酸的另一个示例性TCRB模板组合物在序列表中以SEQ ID NO:872-1560公开。
包含70种不同模板寡核苷酸的示例性TCRG模板组合物在序列表中以SEQ ID NO:4015-4084公开。包含70种不同模板寡核苷酸的示例性TCRG模板组合物也在序列表中以SEQID NO:1561-1630公开。
包含1116种不同模板寡核苷酸的示例性IGH模板组合物在序列表中以SEQ ID NO:4085-5200公开。包含1116种不同模板寡核苷酸的示例性IGH模板组合物还在序列表中以SEQ ID NO:1805-2920公开。
本文还公开了供包含在具有多种由通式(I)表示的寡核苷酸序列的本文所述模板寡核苷酸中的V和J多核苷酸的示例性组。对于TCRB,所述多种模板寡核苷酸可具有多种由通式(I)表示的寡核苷酸序列,其中多核苷酸V和J分别具有如图5中作为TCRB V/J组1、TCRBV/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRB V/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13示出的68组TCRB V和J SEQ ID NO中的至少一组中所示的TCRB V和J序列。
对于TCRG,所述多种模板寡核苷酸可具有多种由通式(I)表示的寡核苷酸序列,其中多核苷酸V和J分别具有如图6中作为TCRG V/J组1、TCRG V/J组2、TCRG V/J组3、TCRG V/J组4和TCRG V/J组5示出的14组TCRG V和J SEQ ID NO中的至少一组中所示的TCRG V和J序列。
对于IGH,所述多种模板寡核苷酸可具有多种由通式(I)表示的寡核苷酸序列,其中多核苷酸V和J分别具有如图7中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9示出的127组IGH V和JSEQ ID NO中的至少一组中所示的IGH V和J序列。
引物
根据本公开,在包含多种V区段引物和多种J区段引物的寡核苷酸引物组中提供寡核苷酸引物,其中所述引物组能够扩增生物样品中编码适应性免疫受体的重排DNA,所述生物样品包含淋巴样细胞DNA。合适的引物组是本领域已知的并且在本文公开,例如,U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373、或PCT/US2011/049012等中的引物组;或表1中所示的那些。在某些实施例中,引物组被设计为包含多种V序列特异性引物,其对于样品中的每种独特V区基因(包括假基因)而言包含可特异性退火至独特V区序列的至少一种引物;以及对于样品中的每种独特J区基因而言可特异性退火至独特J区序列的至少一种引物。
根据已知的TCR和BCR基因组序列,可通过常规方法实现引物设计。因此,引物组优选能够扩增可由TCR或BCR基因座中的DNA重排所产生的每种可能的V-J组合。还如下文所述,某些实施例设想了这样的引物组,其中一种或多种V引物可能能够特异性退火至可由两种或更多种V区共用但并非所有V区共有的“独特”序列,和/或其中一种或多种J引物可能能够特异性退火至可由两种或更多种J区共用但并非所有J区共有的“独特”序列。
在特定实施例中,用于本文所述组合物和方法中的寡核苷酸引物可包含至少约15个核苷酸长的核酸或由其组成,所述核酸具有与靶V或J区段的15个核苷酸长的连续序列(即,编码V区或J区多肽的基因组多核苷酸的部分)相同的序列或与之互补。长引物,例如,具有与靶V或J区编码多核苷酸区段的连续序列相同的序列或与之互补的序列的约16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45或50个核苷酸长的那些引物,也可用于某些实施例。设想本发明所述的寡核苷酸引物的所有中间长度可用于本文。如技术人员将认识到的,引物可具有添加的额外序列(例如,可不与靶V或J区编码多核苷酸区段相同或互补的核苷酸),如限制性酶识别位点、用于测序的接头序列、条形码序列等等(参见,例如,本文表格和序列表中提供的引物序列)。因此,取决于具体应用或需要,引物的长度可更长,如长度为约55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95、100或更多个核苷酸或更长。
还设想用于某些实施例中的是与本文示出了其核苷酸序列的寡核苷酸引物(包括序列表中示出的那些)具有高度序列同一性的适应性免疫受体V区段或J区段寡核苷酸引物变体。从而,在这些和相关实施例中,适应性免疫受体V区段或J区段寡核苷酸引物变体可与本文所公开的适应性免疫受体V区段或J区段寡核苷酸引物序列具有实质的同一性,例如,使用本文所述的方法(例如,使用标准参数的BLAST分析)与参考多核苷酸序列如本文所公开的寡核苷酸引物序列相比,此类寡核苷酸引物变体可具有至少70%的序列同一性,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。本领域技术人员将认识到可通过考虑密码子简并性、阅读框定位等来适当地调节这些值以确定寡核苷酸引物变体退火至适应性免疫受体区段编码多核苷酸的相应能力。
通常,寡核苷酸引物变体将包含一个或多个置换、添加、缺失和/或插入,优选使得相对于本文具体示出的适应性免疫受体V区段或J区段寡核苷酸引物序列而言,变体寡核苷酸的退火能力不会大幅减弱。
表1以非限制性例子示出了能够扩增生物样品中编码TCRβ链(TCRB)的有效重排DNA的寡核苷酸引物组,所述生物样品包含来自受试者的淋巴样细胞的DNA。在该引物组中,J区段引物具有实质的序列同源性,因此可在不止一种靶J多核苷酸序列间充当交叉引物,但V区段引物被设计为特异性退火至V的CDR2区内的靶序列,因此是每个V区段特有的。然而,在紧密相关靶基因的家族内序列相同时的若干V引物情况下,存在例外(例如,在V区段的整个编码序列中V6-2和V6-3在核苷酸水平上是相同的,因此可具有单种引物TRB2V6-2/3)。
因此应当理解,在某些实施例中,可通过设计模板和/或引物以利用V和/或J序列中的某些已知相似点,而有利地减少模板组合物中的不同模板寡核苷酸的数量和/或引物组中的不同寡核苷酸引物的数量。从而,在这些和相关实施例中,如本文所述的“独特”寡核苷酸序列可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种不同模板寡核苷酸所共用的特异性V多核苷酸序列和/或1、2、3、4、5、6、7、8、9、10、11、12或13种不同模板寡核苷酸所共用的特异性J多核苷酸序列,其中此类模板在序列上的彼此差异是除了所述共用的V和/或J序列的差异。
根据某些本发明设想的实施例,可能有用的是降低(例如,以统计学显著的方式减小)模板扩增偏倚,如一组扩增引物的成员间的非均一核酸扩增潜能,所述非均一核酸扩增潜能可由仅对于所有天然存在的V和J基因的有限亚组而言不等同的引物效率(例如,不等同的引物利用)所引起。例如,在分析参与免疫应答(无论是如在疫苗中对特异性抗原的免疫应答,还是如在自体免疫疾病中对组织的免疫应答)的TCR或BCR免疫组库中,可仅关注有效的TCR或IG重排。在此类情况下,经济上可能有利的是,仅对促使TCR或BCR编码DNA有效重排的那些V和J区段引物的非均一核酸扩增潜能进行识别和修正,不必花费精力修正假基因和孤独基因(即,已复制到其他染色体上的TCR或BCR V区编码区段)的非均一扩增。
在人IGH基因座中,例如ImmunoGeneTics(IMGT)数据库(M.-P.LeFranc,UniversitéMontpellier,Montpellier,France(M.-P.LeFranc,蒙彼利埃大学,法国蒙彼利埃);www.imgt.org)注释了165种V区段基因,其中26种是位于其他染色体上的孤独基因并且139种处于染色体14的IGH基因座中。在IGH基因座内的139种V区段中,51种具有至少一个功能性等位基因,而6种是失去至少一个高度保守氨基酸残基的ORF(开放阅读框),并且81种是假基因。假基因可包含V区段,所述V区段含有V区段编码序列内的框内终止密码子、起始密码子与CDR3编码序列之间的移码、一个或多个重复元件插入以及关键区域如第一外显子或RSS的缺失。为了表征样品中的功能性IGH重排同时避免表征假基因和/或孤独基因的时间和费用,因此设想使用本文所述的合成模板寡核苷酸的亚组,其被设计为仅包含那些参与功能性重排的V区段以编码TCR或BCR,而不必合成或校准假基因序列特异性的扩增引物和模板寡核苷酸。从而获得尤其是对于时间和费用的有利效率。
表1.示例性寡核苷酸引物组(hsTCRB PCR引物)
在某些实施例中,如本文所述的V区段和J区段寡核苷酸引物被设计为包含核苷酸序列,使得在重排适应性免疫受体(TCR或Ig)基因的扩增产物的序列内存在足够的信息以独特地识别在重排适应性免疫受体基因座中产生扩增产物的特异性V和特异性J基因两者(例如,V基因重组信号序列(RSS)上游序列的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个碱基对,优选V基因重组信号序列(RSS)上游序列的至少约22、24、26、28、30、32、34、35、36、37、38、39或40个碱基对,并且在某些优选实施例中V基因重组信号序列(RSS)上游序列的大于40个碱基对,以及J基因RSS下游的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个碱基对,优选J基因RSS下游的至少约22、24、26、28或30个碱基对,并且在某些优选实施例中J基因RSS下游的大于30个碱基对)。
该特征与本领域所述的用于扩增TCR编码或Ig编码基因序列的寡核苷酸引物截然不同,后者主要依赖于仅用于检测存在或不存在V和J区段的适当大小产物的扩增反应(例如,PCR反应产物中存在特定大小的扩增子指示V或J区段存在,但无法提供所扩增PCR产物的序列,因此无法确认其身份,例如谱型分析的习惯作法)。
寡核苷酸(例如,引物)可通过任何合适的方法制备,包括按照诸如以下的方法直接化学合成:Narang et al.,1979,Meth.Enzymol.68:90-99(Narang等人,1979年,《酶学方法》,第68卷,第90-99页)的磷酸三酯法;Brown et al.,1979,Meth.Enzymol.68:109-151(Brown等人,1979年,《酶学方法》,第68卷,第109-151页)的磷酸二酯法;Beaucage et al.,1981,Tetrahedron Lett.22:1859-1862(Beaucage等人,1981年,《四面体快报》,第22卷,第1859-1862页)的二乙基亚磷酰胺法;以及美国专利No.4,458,066的固相载体法,所述文献各自以引用方式并入本文。寡核苷酸和修饰核苷酸的缀合物的合成方法的综述提供于Goodchild,1990,Bioconjugate Chemistry 1(3):165-187(Goodchild,1990年,《生物共轭化学》,第1卷,第3期,第165-187页),其以引用方式并入本文。
如本文所用,术语“引物”是指能够在合适条件下充当DNA合成起始点的寡核苷酸。此类条件包括这样的条件,其中在存在适当缓冲液中及合适温度下的四种不同的三磷酸核苷和延伸试剂(例如,DNA聚合酶或逆转录酶)的情况下引发与核酸链互补的引物延伸产物的合成。
引物优选为单链DNA。引物的适当长度取决于引物的预期应用,但通常在6至50个核苷酸的范围内,或在某些实施例中,在15-35个核苷酸的范围内。短引物分子通常需要更冷的温度以与模板形成足够稳定的杂交复合体。引物不需要反映模板核酸的准确序列,但必须具有充分互补性以与模板杂交。用于扩增给定靶序列的合适引物的设计是本领域熟知的并且在本文引用的文献中有所描述。
如本文所述,引物可掺入另外的特征,所述特征允许引物的检测或固定但不改变引物的充当DNA合成起始点的基本特性。例如,引物可在5'端含有另外的核酸序列,所述另外的序列不杂交至靶核酸,但有利于扩增产物的克隆、检测或测序。与要杂交的模板充分互补的引物区在本文是指杂交区。
如本文所用,如果当用于足够严格条件下的扩增反应时引物首先杂交至靶核酸,则引物对于靶序列是特异性的。通常,如果引物-靶标双链体稳定性大于引物与样品中存在的任何其他序列之间形成的双链体的稳定性,则引物对于靶序列是特异性的。本领域技术人员将认识到各种因素如盐条件以及引物的碱基组成和错配的位置会影响引物的特异性,并且在许多情况下将需要引物特异性的常规实验确认。可选择杂交条件,在所述杂交条件下,引物可仅与靶序列形成稳定双链体。从而,在适当严格的扩增条件下使用靶标特异性引物能够选择性扩增包含靶引物结合位点的那些靶序列。
在特定实施例中,用于本文所述方法中的引物包含至少约15个核苷酸长的核酸或由其组成,所述核酸具有与靶V或J区段的15个核苷酸长的连续序列相同的序列或与之互补。长引物,例如具有与靶V或J区段的连续序列相同的序列或与之互补的序列的约16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45或50个核苷酸长的那些引物,也可用于某些实施例。设想前述引物的所有中间长度可用于本文。如技术人员将认识到的,引物可具有添加的另外序列(例如,可不与靶V或J区段相同或互补的核苷酸),如限制性酶识别位点、用于测序的接头序列、条形码序列等等(参见,例如,本文和序列表中提供的引物序列)。因此,取决于具体应用或需要,引物的长度可更长,如长55、56、57、58、59、60、65、70、75个核苷酸或更长。例如,在一个实施例中,正向和反向引物均在5'端用与DNA测序仪相容的通用正向引物序列修饰。
还设想用于某些实施例中的是与本文示出了其核苷酸序列的寡核苷酸引物(包括序列表中示出的那些)具有高度序列同一性的适应性免疫受体V区段或J区段寡核苷酸引物变体。从而,在这些和相关实施例中,适应性免疫受体V区段或J区段寡核苷酸引物变体可与本文所公开的适应性免疫受体V区段或J区段寡核苷酸引物序列具有实质的同一性,例如,使用本文所述的方法(例如,使用标准参数的BLAST分析)与参考多核苷酸序列如本文所公开的寡核苷酸引物序列相比,此类寡核苷酸引物变体可具有至少70%的序列同一性,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。本领域技术人员将认识到可通过考虑密码子简并性、阅读框定位等来适当地调节这些值以确定寡核苷酸引物变体退火至适应性免疫受体区段编码多核苷酸的相应能力。
通常,寡核苷酸引物变体将包含一个或多个置换、添加、缺失和/或插入,优选使得相对于本文具体示出的适应性免疫受体V区段或J区段寡核苷酸引物序列而言,变体寡核苷酸的退火能力不会大幅减弱。还如本文其他地方指出的,在优选实施例中,适应性免疫受体V区段和J区段寡核苷酸引物被设计为能够扩增包含CDR3编码区的重排TCR或IGH序列。
根据本文设想的某些实施例,用于本公开的多重PCR方法的引物可被功能性阻断以防止非T或B细胞序列的非特异性引发。例如,引物可通过如美国专利申请公布US2010/0167353中所述的化学修饰来阻断。根据某些本文所公开的实施例,在本发明多重PCR反应中使用此类阻断的引物涉及可具有其中DNA复制(即,引物延伸)被阻断的失活构型和其中DNA复制继续进行的活化构型的引物。当引物为单链时或者当引物特异性杂交至所关注的靶DNA序列但引物延伸仍然被连接于引物3'端或其附近的化学部分阻断时,存在引物的失活构型。
当引物杂交至所关注的靶核酸序列并随后被RNA酶H或另一种切割剂作用而移除3'阻断基团从而允许酶(例如,DNA聚合酶)催化扩增反应中的引物延伸时,存在引物的活化构型。不希望受理论的束缚,据信此类引物的杂交的动力学类似于二级反应,因此是混合物中的T细胞或B细胞基因序列浓度的函数。阻断的引物通过如下要求而使非特异性反应最小化:杂交至靶标,然后在引物延伸可继续进行之前切割。如果引物错误杂交至与所需靶序列相关但差别在于具有导致碱基错配的一个或多个非互补性核苷酸的序列,则抑制引物的切割,特别是当存在位于切割位点处或其附近的错配时。提高扩增保真度的该策略减少了此类位置处错误引发的频率,从而增加了反应的特异性。如技术人员将认识到的,可优化反应条件,特别是允许每个循环中的杂交和延伸的RNA酶H浓度和时间,以使当引物正确杂交至其真正靶序列时引物的高效切割,与当引物和模板序列(引物可对其不完全退火)之间存在错配时引物的不良切割之间的切割效率的差异最大化。
如US2010/0167353所述,本领域已知多个可位于寡核苷酸(例如,引物)的3'端处或其附近的阻断基团以防止延伸。可通过如下方式在3'端核苷酸处对引物或其他寡核苷酸进行修饰以防止或抑制DNA合成的起始:例如添加3'脱氧核糖核苷酸残基(例如,cordycepin)、2',3'-双脱氧核糖核苷酸残基、非核苷酸键或烷二醇修饰(美国专利No.5,554,516)。Wilk等人(1990Nucleic Acids Res.18(8):2065(1990年,《核酸研究》,第18卷,第8期,第2065页))和Arnold等人(美国专利No.6,031,091)也已描述了可用于抑制或阻断引物延伸的烷二醇修饰。合适阻断基团的另外例子包括3'羟基取代(例如,3'-磷酸、3'-三磷酸或3'-磷酸与醇如3-羟丙基的二酯)、2'3'-环磷酸、末端RNA碱基的2'羟基取代(例如,磷酸或空间上大体积的基团如三异丙基甲硅烷基(TIPS)或叔丁基二甲基甲硅烷基(TBDMS))。Laikhter等人在系列号为11/686,894的美国专利申请中描述了在寡核苷酸的3'端取代的2'-烷基甲硅烷基如TIPS和TBDMS,所述专利申请以引用方式并入本文。大体积的取代基也可掺入在寡核苷酸的3'端残基的碱基上以阻断引物延伸。
在某些实施例中,寡核苷酸可包含位于用于抑制引物延伸的阻断基团的上游(例如,5'端)的切割域。作为例子,切割域可为RNA酶H切割域,或切割域可为包含单个RNA残基的RNA酶H2切割域,或寡核苷酸可包含用一个或多个替代核苷对RNA碱基的替换。另外的示例性切割域在US2010/0167353中有所描述。
从而,多重PCR体系可使用40、45、50、55、60、65、70、75、80、85或更多种正向引物,其中每种正向引物与单种功能性TCR或Ig V区段或者功能性TCR或Ig V区段的小家族,例如TCR Vβ区段互补(参见例如,如表1所示的TCRBV引物,SEQ ID NO:1644-1695),并且多重PCR体系可使用例如十三种反向引物,其各自对TCR或Ig J区段如TCR Jβ区段具有特异性(参见例如,表1中的TCRBJ引物,SEQ ID NO:1631-1643)。在另一个实施例中,多重PCR反应可使用各自对一种或多种功能性TCRγV区段具有特异性的四种正向引物和各自对一种或多种TCRγJ区段具有特异性的四种反向引物。在另一个实施例中,多重PCR反应可使用各自对一种或多种功能性V区段具有特异性的84种正向引物和各自对一种或多种J区段具有特异性的六种反向引物。
热循环条件可遵照本领域技术人员的方法。例如,在使用PCR ExpressTM热循环仪(英国阿什福德的Hybaid公司(Hybaid,Ashford,UK))时,可使用下列循环条件:95℃下15分钟循环1次,94℃下30秒、59℃下30秒和72℃下1分钟循环25至40次,然后72℃下10分钟循环一次。如技术人员将认识到的,可例如通过如下方式优化热循环条件:修改退火温度、退火时间、循环次数和延伸时间。如技术人员将认识到的,可优化引物和其他PCR试剂的用量以及PCR参数(例如,退火温度、延伸时间和循环次数)以实现所需的PCR扩增效率。
或者,在也在本文设想的某些相关实施例中,可使用“数字PCR”方法对样品中的靶基因组数定量,而无需标准曲线。在数字PCR中,在大量大于100个的微孔或液滴中进行单个样品的PCR反应,使得每个液滴扩增(例如,扩增产物的生成提供了微孔或液滴中存在至少一种模板分子的证据)或无法扩增(证明模板不存在于给定的微孔或液滴中)。通过简单地对阳性微孔的数量进行计数,可以直接对存在于输入样品中的靶基因组的数量进行计数。
数字PCR方法通常使用端点读数,而非在热循环反应的每次循环之后测量的常规定量PCR信号(参见例如,Pekin et al.,2011 Lab.Chip 11(13):2156(Pekin等人,2011年,《芯片实验室》,第11卷,第13期,第2156页);Zhong et al.,2011Lab.Chip 11(13):2167(Zhong等人,2011年,《芯片实验室》,第11卷,第13期,第2167页);Tewhey et al.,2009Nature Biotechnol.27:1025(Tewhey等人,2009年,《自然生物技术》,第27卷,第1025页);2010Nature Biotechnol.28:178(2010年,《自然生物技术》,第28卷,第178页);Vogelstein and Kinzler,1999Proc.Natl.Acad.Sci.USA 96:9236-41(Vogelstein和Kinzler,1999年,《美国国家科学院院刊》,第96卷,第9236-9241页);Pohl and Shih,2004Expert Rev.Mol.Diagn.4(1);41-7,2004(Pohl和Shih,2004年,《分子诊断学专家评论》,第4卷,第1期,第41-47页,2004年))。与传统PCR相比,dPCR具有下列优点:(1)不必依赖于参照品或标准品,(2)可通过增加PCR复制的总数来实现所需的准确度,(3)对抑制剂有很强耐受性,(4)能够分析复杂混合物,以及(5)提供对存在于样品中的拷贝数的线性响应,从而允许检测拷贝数的微小变化。因此,本文所述的组合物(例如,模板组合物和适应性免疫受体基因特异性寡核苷酸引物组)和方法中的任一者可适合用于此类数字PCR方法,例如ABI QuantStudioTM 12K Flex系统(加利福尼亚州卡尔斯巴德的生命技术公司(LifeTechnologies,Carlsbad,CA))、QX100TM Droplet DigitalTM PCR系统(加利福尼亚州赫拉克勒斯的伯乐公司(BioRad,Hercules,CA))、QuantaLifeTM数字PCR系统(加利福尼亚州赫拉克勒斯的伯乐公司(BioRad,Hercules,CA))或RainDanceTM微液滴数字PCR系统(马萨诸塞州列克星敦的雷恩丹斯技术公司(RainDance Technologies,Lexington,MA))。
接头
本文所述的由通式(I)表示的模板寡核苷酸也可在某些实施例中包含第一通用接头寡核苷酸序列(U1)和第二通用接头寡核苷酸序列(U2),或可缺少U1和U2中的任一者或两者。U1从而可要么不存在,要么包含具有选自如下的序列的寡核苷酸:(i)第一通用接头寡核苷酸序列和(ii)连接至第一通用接头寡核苷酸序列并位于其5'端的第一测序平台特异性寡核苷酸序列,并且U2可要么不存在,要么包含具有选自如下的序列的寡核苷酸:(i)第二通用接头寡核苷酸序列和(ii)连接至第二通用接头寡核苷酸序列并位于其5'端的第二测序平台特异性寡核苷酸序列。
U1和/或U2可例如包含通用接头寡核苷酸序列和/或测序平台特异性寡核苷酸序列,所述序列对所采用的单分子测序技术具有特异性,所述测序技术为例如:HiSeqTM或GeneAnalyzerTM-2(GA-2)系统(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,SanDiego,CA))或另一种合适的仪器、试剂和软件的测序套件。包括此类平台特异性接头序列的在内使得能使用核苷酸测序方法如HiSeqTM或GA2或等价方法,对包含多种不同的通式(I)模板寡核苷酸的本发明所述模板组合物进行直接定量测序。因此该特征有利地允许对模板组合物的定性和定量表征。
具体地讲,对模板组合物的所有组分直接测序的能力使得能验证所述多种模板寡核苷酸中的每种模板寡核苷酸以基本上等摩尔量存在。例如,可生成一组本发明所述的模板寡核苷酸,其在两端均具有通用接头序列,使得接头序列可用于在每种模板的每一端进一步掺入测序平台特异性寡核苷酸。
不希望受理论的束缚,可在少至变性、退火和延伸的两个循环中使用5'寡核苷酸(5'-平台序列-通用接头1序列-3')和3'寡核苷酸(5'-平台序列-通用接头2序列-3'),将平台特异性寡核苷酸添加到此类修饰的模板的末端,使得组分模板寡核苷酸中的每一者在模板组合物中的相对占比在数量上不会改变。独特的识别符序列(例如,条形码序列B,所述条形码序列B包含分别与单独的V和J区相关并从而识别它们的独特的V和B寡核苷酸序列,如本文所述)位于邻近接头序列的位置,从而允许在短序列读段中定量测序,以便按照存在的每种独特模板序列的相对量的标准来表征模板群体。
当此类直接定量测序指示一种或多种特定寡核苷酸在模板组合物的制备物中可能占比过高或占比过低时,可相应地进行模板组合物的调节以获得所有寡核苷酸均以基本上等摩尔量存在的模板组合物。然后,如在本发明所公开的用于测定和修正引物组成员间的非均一扩增潜能的方法中,可将所有寡核苷酸均以基本上等摩尔量存在的模板组合物用作扩增引物组的校准用标准品。
除了实例中所述和序列表中的示例性模板序列中所包括的接头序列(例如,在SEQID NO:1-1630的5'和3'端处)之外,熟悉本领域的技术人员在考虑本公开后,也可知道其他可用作通用接头序列的寡核苷酸序列,包括选择与存在于本文所述模板的其他部分中的序列不同的接头寡核苷酸序列。另外的接头序列的非限制性例子示于表2中并以SEQ ID NO:1710-1731示出。
表2.示例性的接头序列
条形码
如本文所述,某些实施例设想了将模板寡核苷酸序列设计成包含短签名序列(signature sequence),所述短签名序列允许明确识别模板序列及从而明确识别负责扩增该模板的至少一种引物,而不必对整个扩增产物测序。在本文所述的由通式(I)表示的模板寡核苷酸中,B1、B2、B3和B4各自独立地要么不存在,要么各自包含寡核苷酸B,所述寡核苷酸B包含3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000或更多个连续核苷酸(包括其间的所有整数值)的寡核苷酸条形码序列,其中在所述多种模板寡核苷酸序列的每一者中,B包含一独特的寡核苷酸序列,所述独特的寡核苷酸序列独特地识别作为成对组合的(i)模板寡核苷酸的独特V寡核苷酸序列和(ii)模板寡核苷酸的独特J寡核苷酸序列。
从而,例如,具有条形码识别符序列的模板寡核苷酸可允许相对短的扩增产物序列读段,如不超过1000、900、800、700、600、500、400、300、200、100、90、80、70、60、55、50、45、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4个或更少核苷酸的条形码序列读段,然后将该条形码序列信息与相关V和J序列进行匹配,所述V和J序列被掺入进具有作为模板设计一部分的条形码的模板中。按照该方法,可通过高通量平行测序对大量扩增产物同时进行部分测序,以识别复杂引物组中造成扩增偏倚的引物。
示例性条形码可包含独特识别模板中的每种V多核苷酸的5、6、7、8、9、10、11、12、13、14、15或16个核苷酸的第一条形码寡核苷酸,和独特识别模板中的每种J多核苷酸的5、6、7、8、9、10、11、12、13、14、15或16个核苷酸的第二条形码寡核苷酸,以提供长度分别为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31或32个核苷酸的条形码,但这些和相关实施例并非旨在如此限制。条形码寡核苷酸可包含任何长度的寡核苷酸序列,只要获得最小条形码长度使具有另外不同序列(例如,V和J序列)的两种或更多种模板寡核苷酸中不出现给定条形码序列即可。
从而,避免用于独特识别不同V-J序列配对的条形码间的此类冗余的最小条形码长度是X个核苷酸,其中4x大于因具有非同一序列而呈现差异化的不同模板物质的数量。例如,对于本文以SEQ ID NO:1-871示出的871种模板寡核苷酸的组,最小条形码长度将为五个核苷酸,这允许1024种(即,大于871种)不同的可能五核苷酸序列的理论总数。实际上,条形码寡核苷酸序列读段长度可仅受限于要采用的核苷酸测序仪器的序列读段长度极限。对于某些实施例,当进行比对以使条形码寡核苷酸序列中的特定位置处匹配的核苷酸数最大化时,将区分开模板寡核苷酸的单独物质的不同条形码寡核苷酸应具有至少两个核苷酸不匹配(例如,最小汉明距离(hamming distance)为2)。
在优选的实施例中,对于通式(I)的模板组合物内具有独特序列的每种不同模板寡核苷酸物质,B1、B2、B3和B4将是相同的。
技术人员将熟悉例如至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、70、80、90、100、200、300、300、500或更多个连续核苷酸(包括其间的任何整数值)的寡核苷酸条形码序列的设计、合成及掺入到较大寡核苷酸或多核苷酸构建体中。有关寡核苷酸条形码序列识别策略的设计与实现的非限制性例子,参见例如,de Carcer et al.,2011 Adv.Env.Microbiol.77:6310(de Carcer等人,2011年,《应用与环境微生物学》,第77卷,第6310页);Parameswaran et al.,2007Nucl.Ac.Res.35(19):330(Parameswaran等人,2007年,《核酸研究》,第35卷,第19期,第330页);Roh et al.,2010 Trends Biotechnol.28:291(Roh等人,2010年,《生物技术趋势》,第28卷,第291页)。
通常,将条形码放置在模板中其不能天然发现的位置处,即,条形码包含这样的核苷酸序列,其不同于可在靠近条形码所在位置的序列的附近发现的任何天然存在的寡核苷酸序列(例如,V和/或J序列)。根据本文所述的某些实施例,可包括此类条形码序列,作为本发明所公开的由通式(I)表示的模板寡核苷酸的元件B1、B2和/或B3。因此,本文所述的由通式(I)表示的模板寡核苷酸中的某些也可在某些实施例中包含条形码B1、B2和B3中的一者、两者或全部三者,而在某些其他实施例中,这些条形码中的一些或全部可不存在。在某些实施例中,所有条形码序列将具有相同或类似的GC含量(例如,GC含量相差不超过20%、或不超过19、18、17、16、15、14、13、12、11或10%)。
在根据某些本文所公开的实施例的模板组合物中,含条形码的元件B(例如,B1、B2、B3和/或B4)包含独特识别单种配对V-J组合的寡核苷酸序列。任选地及在某些实施例中,含条形码的元件B也可包含随机核苷酸,或至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30,、31、32、33、34、35、36、37、38、39、40、45、50、55、60、70、80、90、100、200、300、300、500或更多个连续核苷酸的随机多核苷酸序列,其位于独特识别每种特异性配对V-J组合的特异性条形码序列的上游和/或下游。当存在于特异性条形码序列的上游和下游时,随机核苷酸或随机多核苷酸序列彼此无关,即,它们可以(但不必)包含相同的核苷酸或相同的多核苷酸序列。
限制性酶位点
根据本文所公开的某些实施例,模板寡核苷酸可包含限制性内切核酸酶(RE)识别位点,其位于V与J序列之间并且不在模板寡核苷酸序列的其他地方出现。RE识别位点可任选地邻近识别V区序列的条形码位点。可出于多种目的任一者而包括RE位点,所述目的包括但不限于作为结构特征,可利用所述结构特征,通过将其与适当的限制性酶接触来选择性破坏模板。可能希望通过将本发明的模板寡核苷酸与合适的RE接触来选择性降解本发明的模板寡核苷酸,例如以便从其他组合物移除模板寡核苷酸,所述模板寡核苷酸可能已有意或意外引入到所述其他组合物中。或者,RE位点可有效用于对模板组合物中的模板寡核苷酸测序的过程,和/或用作模板寡核苷酸序列中的位置序列标记,而不论其是否被限制性酶切割。示例性RE位点是限制性酶Sal I所识别的寡核苷酸基序GTCGAC。大量另外的限制性酶及其各自的RE识别位点序列是本领域已知的并且可商购获得(例如,马萨诸塞州贝弗利的新英格兰生物实验室(New England Biolabs,Beverly,MA))。这些包括例如EcoRI(GAATTC)和SphI(GCATGC)。熟悉本领域的技术人员应当理解,多种此类RE识别位点中的任一者可掺入到本发明所公开的模板寡核苷酸的特定实施例中。
测序
可使用多种可用的高通量单分子测序仪器和系统中的任何一种进行测序。示例性测序系统包括边合成边测序系统,如亿明达基因组分析仪(Illumina Genome Analyzer)和相关仪器(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))、赫利克斯遗传分析系统(Helicos Genetic Analysis System)(马萨诸塞州剑桥的赫利克斯生物科学公司(Helicos BioSciences Corp.,Cambridge,MA))、太平洋生物科学PacBio RS(Pacific Biosciences PacBio RS)(加利福尼亚州门洛帕克的太平洋生物科学公司(Pacific Biosciences,Menlo Park,CA))或具有类似功能的其他系统。使用杂交至扩增的DNA分子内的限定区域的一组测序寡核苷酸来完成测序。测序寡核苷酸被设计成使得V和J编码基因区段可被基于本公开和根据可公开利用的数据库中出现的已知适应性免疫受体基因序列所生成的序列独特识别。参见例如,U.S.A.N.13/217,126、U.S.A.N.12/794,507、PCT/US2011/026373或PCT/US2011/049012。示例性TCRB J区测序引物示于表3中:
表3:TCRBJ测序引物
术语“基因”意指DNA涉及产生多肽链如TCR或Ig多肽的全部或一部分的区段(例如,含CDR3的多肽);其包含编码区之前和之后的区域“前导区和尾随区(trailer)”以及独立的编码区段(外显子)之间的间插序列(内含子),并且也可包含调控元件(例如,启动子、增强子、阻遏蛋白结合位点等),并且也可包含如本文所述的重组信号序列(RSS)。
本发明实施例的核酸(本文也称为多核苷酸)可为RNA的形式或DNA的形式,所述DNA包括cDNA、基因组DNA和合成DNA。DNA可为双链的或单链的,并且如果是单链的话,可为编码链或非编码(反义)链。根据本发明实施例使用的编码TCR或免疫球蛋白或其区域(例如,V区、D区段、J区、C区等)的编码序列可与本领域已知的任何给定TCR或免疫球蛋白基因区或多肽结构域(例如,V区结构域、CDR3结构域等)的编码序列相同,或者可为不同编码序列,由于遗传密码的冗余或简并性,所述不同编码序列编码相同TCR或免疫球蛋白区或多肽。
在某些实施例中,扩增J区编码基因区段可各自具有2、3、4、5、6、7、8、9、10或约15、20或更多个核苷酸的独特序列限定识别符标签,其位于相对于RSS位点的限定位置。例如,可在扩增TCRβCDR3编码区的Jβ区编码区段中在RSS位点下游的+11至+14的位置处使用四碱基标签。然而,这些和相关实施例不必如此限制并且还设想了其他相对短的核苷酸序列限定识别符标签,其可在J区编码基因区段中检测到并且基于其相对于RSS位点的位置限定。这些在不同适应性免疫受体编码基因座之间可有差别。
重组信号序列(RSS)由被12+/-1bp(“12-信号”)或23+/-1bp(“23-信号”)的间隔序列隔开的两条保守序列(七聚物5'-CACAGTG-3'和九聚物5'-ACAAAAACC-3')组成。已确定很多核苷酸位置对于重组是重要的,包括七聚物第一位和第二位处的CA二核苷酸,并且七聚物第三位处的C也显示出具有强烈偏好性,九聚物的第5、6、7位处的A核苷酸也是如此。(Ramsden等人,1994;Akamatsu等人,1994;Hesse等人,1989)。其他核苷酸的突变具有极小或不一致的效应。间隔序列虽然更可变化,但也对重组具有影响,并且单核苷酸替换显示出显著影响重组效率(Fanning等人,1996;Larijani等人,1999;Nadel等人,1998)。已描述了鉴别具有明显不同重组效率的RSS多核苷酸序列的标准(Ramsden等人,1994;Akamatsu等人,1994;Hesse等人,1989以及Cowell等人,1994)。因此,测序寡核苷酸可杂交至RSS位点下游位置+11至位置+14处的扩增J编码基因区段内的四碱基标签附近。例如,TCRB的测序寡核苷酸可被设计成退火至刚好在该“标签”下游观察到的共有核苷酸基序,使得序列读段开始的四个碱基将独特识别J编码基因区段(参见例如,WO/2012/027503)。
CDR3编码区(对于TCR,被定义为编码V区段的第二保守半胱氨酸与J区段的保守苯丙氨酸之间的TCR多肽的核苷酸)的平均长度为35+/-3个核苷酸。因此及在某些实施例中,使用V区段寡核苷酸引物与从特定TCR或IgH J区(例如,如本文所述的TCR Jβ、TCR Jγ或IgH JH)的J区段标签开始的J区段寡核苷酸引物进行的PCR扩增将几乎总是捕获50碱基对读段中的完整V-D-J接合部。IgH CDR3区(被定义为V区段中的保守半胱氨酸与J区段中的保守苯丙氨酸之间的核苷酸)的平均长度受约束程度不及TCRβ基因座处,但将通常在约10至约70个核苷酸之间。因此及在某些实施例中,使用V区段寡核苷酸引物与从IgH J区段标签开始的J区段寡核苷酸引物进行的PCR扩增将捕获100碱基对读段中的完整V-D-J接合部。
退火至错配模板序列并支持在其上的多核苷酸延伸的PCR引物被称为混杂引物(promiscuous primer)。在某些实施例中,TCR和Ig J区段反向PCR引物可被设计为使与测序寡核苷酸的重叠最小化,以便使多重PCR情况下的混杂引发最小化。在一个实施例中,TCR和Ig J区段反向引物可通过退火至共有剪接位点基序而锚定在3'端,同时与测序引物的重叠最小化。通常,可使用默认参数下的已知序列/引物设计与分析程序来选择TCR以及Ig V和J区段引物,以便在已知退火温度下在PCR中操作。
对于测序反应,示例性的IGHJ测序引物延伸三个核苷酸跨越保守的CAG序列,如WO/2012/027503中所述。
样品
可从中获得测试生物样品的受试者或生物源可为人或非人动物、或转基因的或克隆的或经组织工程改造(包括通过使用干细胞)的生物体。在本发明的某些优选实施例中,受试者或生物源可已知患有、或可疑似患有、或面临风险患有循环肿瘤或实体瘤或其他恶性病症、或自体免疫疾病、或炎性病症,并且在本发明的某些优选实施例中,受试者或生物源可已知没有此类疾病的风险或不存在此类疾病。
某些优选实施例设想了这样的受试者或生物源,其为人受试者,如已根据本领域公认的临床诊断标准诊断为患有癌症或存在形成或罹患癌症的风险的患者,所述临床诊断标准为例如美国马里兰州贝塞斯达的美国国家癌症研究所(U.S.National CancerInstitute(Bethesda,MD,USA))的那些标准或如下文献中所述:DeVita,Hellman,andRosenberg's Cancer:Principles and Practice of Oncology(2008,Lippincott,Williams and Wilkins,Philadelphia/Ovid,New York)(DeVita、Hellman和Rosenberg,《癌症:肿瘤学原理与实践》,2008年,Lippincott、Williams和Wilkins,费城/纽约州奥维德);Pizzo and Poplack,Principles and Practice of Pediatric Oncology(Fourthedition,2001,Lippincott,Williams and Wilkins,Philadelphia/Ovid,New York)(Pizzo和Poplack,《儿科肿瘤学的原理与实践》,第四版,2001年,Lippincott、Williams和Wilkins,费城/纽约州奥维德);以及Vogelstein and Kinzler,The Genetic Basis ofHuman Cancer(Second edition,2002,McGraw Hill Professional,New York)(Vogelstein和Kinzler,《人癌症的遗传基础》,第二版,2002年,麦格劳希尔专业出版,纽约);某些实施例设想了根据此类标准而已知没有患有、形成或罹患癌症的风险的人受试者。
某些其他实施例设想了非人受试者或生物源,例如非人灵长目动物如猕猴、黑猩猩、大猩猩、长尾黑颚猴、红毛猩猩、狒狒或其他非人灵长动物,包括本领域已知可作为临床前模型(包括实体瘤和/或其他癌症的临床前模型)的此类非人受试者。某些其他实施例设想了作为哺乳动物的非人受试者,例如,小鼠、大鼠、兔、猪、绵羊、马、牛、山羊、沙鼠、仓鼠、豚鼠或其他哺乳动物;许多此类哺乳动物可为本领域已知作为包括循环肿瘤或实体瘤和/或其他癌症的某些疾病或障碍的临床前模型的受试者(例如,Talmadge et al.,2007Am.J.Pathol.170:793(Talmadge等人,2007年,《美国病理学杂志》,第170卷,第793页);Kerbel,2003Canc.Biol.Therap.2(4Suppl 1):S134(Kerbel,2003年,《癌症生物学和疗法》,第2卷,第4期增刊1,第S134页);Man et al.,2007Canc.Met.Rev.26:737(Man等人,2007年,《癌症与转移综述》,第26卷,第737页);Cespedes et al.,2006Clin.Transl.Oncol.8:318(Cespedes等人,2006年,《临床与转化肿瘤学》,第8卷,第318页))。然而,实施例的范围并非旨在如此限制,使得还存在设想的其他实施例,其中受试者或生物源可为非哺乳类脊椎动物,例如另一种高等脊椎动物,或鸟类、两栖动物或爬行动物物种,或另一种受试者或生物源。
可通过如下方式提供生物样品:从受试者或生物源获得血样、活检标本、组织外植体、器官培养物、生物流体或者任何其他组织或细胞制备物。优选地,样品包含来自受试者或生物源的淋巴样细胞的DNA,以举例说明而非限制的方式,其可包含一个或多个TCR或BCR基因座处的重排DNA。在某些实施例中,可例如通过手术切除、穿刺活检或获得包含细胞混合物的测试生物样品的其他方式,从实体组织(例如,实体瘤)获得测试生物样品。
根据某些实施例,可能希望根据大量既定方法中的任何一种来分离淋巴样细胞(例如,T细胞和/或B细胞),其中分离的淋巴样细胞是已从淋巴样细胞天然存在于其中的组织、环境或周围移除或分离的那些淋巴样细胞。从而可从生物样品,如从多种组织和生物流体样品(包括骨髓、胸腺、淋巴腺、淋巴结、外周组织和血液)获得B细胞和T细胞,但外周血液最容易获得。可对任何外周组织取样以检测B和T细胞的存在,并从而设想用于本文所述的方法。可从中获得适应性免疫细胞的组织和生物流体包括但不限于皮肤、上皮组织、结肠、脾脏、粘膜分泌物、口腔粘膜、肠粘膜、阴道粘膜或阴道分泌物、宫颈组织、神经节、唾液、脑脊液(CSF)、骨髓、脐带血、血清、浆膜液、血浆、淋巴液、尿液、腹水、胸膜液、心包液、腹膜液、腹腔液、培养基、条件培养基或灌洗液。在某些实施例中,可从血浆分离置换法样品(apheresis sample)分离适应性免疫细胞。可通过静脉切开术从受试者获得外周血样品。通过本领域技术人员已知的技术,例如通过密度梯度分离来分离外周血单核细胞(PBMC)。在某些实施例中,使用全部PBMC进行分析。
对于核酸提取,可使用本领域已知的方法和/或可商购获得的试剂盒,例如通过使用血液DNA小提试剂盒从细胞提取总基因组DNA。单个单倍体基因组的近似质量为3pg。优选地,使用至少100,000至200,000个细胞进行分析,即来自二倍体T或B细胞的约0.6至1.2μg DNA。使用PBMC作为来源,可估计T细胞的数量为总细胞的约30%。也可估计B细胞的数量为PBMC制备物中总细胞的约30%。
Ig和TCR基因座含有许多不同可变(V)基因区段、多样性(D)基因区段和连接(J)基因区段,这些基因区段在早期淋巴分化期间经历重排过程。Ig以及TCR V、D和J基因区段序列是本领域已知的并且可在公共数据库如GENBANK中获得。V-D-J重排由重组酶复合体介导,其中RAG1和RAG2蛋白质通过如下方式起到关键作用:在位于V基因区段下游、D基因区段两侧和J基因区段上游的重组信号序列(RSS)处识别和切割DNA。不适当的RSS可减少或甚至完全防止重排。重组信号序列(RSS)包含被12+/-1bp(“12-信号”)或23+/-1bp(“23-信号”)的间隔序列隔开的两个共有序列(七聚物5'-CACAGTG-3'和九聚物5'-ACAAAAACC-3')。在V区段和D区段的3'端处,RSS序列是七聚物(CACAGTG)-间隔序列-九聚物(ACAAAAACC)。在J区段和D区段的5'端处,RSS序列是九聚物(GGTTTTTGT)-间隔序列-七聚物(CACTGTG),且在每种特异性基因区段的七聚物和九聚物序列中具有大量序列变异。
已确定很多核苷酸位置对于重组是重要的,包括七聚物第一位和第二位处的CA二核苷酸,并且七聚物第三位处的C也显示出具有强烈偏好性,九聚物的第5、6、7位处的A核苷酸也是如此。(Ramsden et.al 1994 Nucl.Ac.Res.22:1785(Ramsden等人,1994年,《核酸研究》,第22卷,第1785页);Akamatsu et.al.1994 J.Immunol.153:4520(Akamatsu等人,1994年,《免疫学杂志》,第153卷,第4520页);Hesse et.al.1989 Genes Dev.3:1053(Hesse等人,1989年,《基因与发育》,第3卷,第1053页))。其他核苷酸的突变具有极小或不一致的效应。间隔序列虽然更可变化,但也对重组具有影响,并且已显示单核苷酸替换可显著影响重组效率(Fanning et.al.1996 Cell.Immunol.Immumnopath.79:1(Fanning等人,1996年,《细胞免疫学与免疫病理学》,第79卷,第1页);Larijani et.al 1999 Nucl.Ac.Res.27:2304(Larijani等人,1999年,《核酸研究》,第27卷,第2304页);Nadel et.al.1998J.Immunol.161:6068(Nadel等人,1998年,《免疫学杂志》,第161卷,第6068页);Nadel etal.,1998 J.Exp.Med.187:1495(Nadel等人,1998年,《实验医学杂志》,第187卷,第1495页))。已描述了识别具有显著不同的重组效率的RSS多核苷酸序列的标准(Ramsden et.al1994 Nucl.Ac.Res.22:1785(Ramsden等人,1994年,《核酸研究》,第22卷,第1785页);Akamatsu et.al.1994 J.Immunol.153:4520(Akamatsu等人,1994年,《免疫学杂志》,第153卷,第4520页);Hesse et.al.1989 Genes Dev.3:1053(Hesse等人,1989年,《基因与发育》,第3卷,第1053页)以及Lee et al.,2003 PLoS 1(1):E1(Lee等人,2003年,公共科学图书馆,第1卷,第1期,第E1页))。
Ig重链(IgH)、TCRβ(TCRB)和TCRδ(TCRD)基因处的重排过程通常以D到J重排开始,接着是V到D-J重排,而在Igκ(IgK)、Igλ(IgL)、TCRα(TCRA)和TCRγ(TCRG)基因处出现直接V到J重排。重排基因区段之间的序列通常以环形删除产物的形式缺失,所述环形删除产物也称为TCR删除环(TREC)或B细胞受体删除环(BREC)。
V、D和J基因区段的许多不同组合代表所谓的组合组库,其据估计对于Ig分子为约2×106,对于TCRαβ为约3×106,对于TCRγδ分子为约5×103。在重排过程期间,在V、D和J基因区段的接合位点处,发生核苷酸的缺失和随机插入,从而产生高度多样的接合区,这些接合区对Ig和TCR分子的总组库具有显著贡献,估计为>1012种可能的氨基酸序列。
成熟B淋巴样细胞在生发中心通过体细胞高频突变(即,导致Ig分子亲和力成熟的过程)进行抗原识别后进一步扩充其Ig组库。体细胞高频突变过程集中于IgH和Ig轻链基因的V-(D-)J外显子,并且主要产生单核苷酸突变但有时也产生核苷酸的插入或缺失。体细胞突变的Ig基因通常也存在于成熟B细胞恶性肿瘤中。
在本文所述的某些实施例中,V区段和J区段引物可用于PCR反应以扩增测试生物样品中的重排TCR或BCR CDR3编码DNA区,其中每种功能性TCR或Ig V编码基因区段包含V基因重组信号序列(RSS)并且每种功能性TCR或Ig J编码基因区段包含J基因RSS。在这些和相关实施例中,每种扩增的重排DNA分子可包含(i)TCR或Ig V编码基因区段有义链的至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000(包括其间的所有整数值)或更多个连续核苷酸,其中至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多个连续核苷酸位于V基因RSS的5'端,和/或每种扩增的重排DNA分子可包含(ii)TCR或Ig J编码基因区段有义链的至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500(包括其间的所有整数值)或更多个连续核苷酸,其中至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500或更多个连续核苷酸位于J基因RSS的3'端。
扩增因子测定
除了使用用于使如本文所述的寡核苷酸扩增引物组的扩增效率标准化的本发明所公开的模板组合物之外,某些其他实施例还设想使用模板组合物来测定扩增因子,以便估计样品中的重排适应性免疫受体编码序列的数量。这些和相关实施例可能可用于对DNA样品中的适应性免疫受体编码序列的数量进行定量,所述DNA样品从淋巴样细胞获得,包括存在于细胞混合物中的淋巴样细胞,所述细胞混合物包含其中编码适应性免疫受体的DNA已经经历DNA重排的细胞,但样品也含有来自其中未发生此类重排的细胞(例如,非淋巴样细胞、未成熟细胞、间充质细胞、癌细胞等)的DNA。
可通过使用综合的V-J扩增引物组进行多重PCR,然后对扩增产物进行定量测序,来估计受试者中的给定类别的适应性免疫受体(例如,TCR或IG)的不同成员的总数。重排TCR和BCR(IG)编码DNA序列的多重扩增和高通量测序例如在如下文献中有所描述:Robinset al.,2009 Blood 114,4099(Robins等人,2009年,《血液》,第114卷,第4099页);Robinset al.,2010Sci.Translat.Med.2:47ra64(Robins等人,2010年,《科学转化医学》,第2卷,第47ra64页);Robins et al.,2011J.Immunol.Meth.doi:10.1016/j.jim.2011.09.001(Robins等人,2011年,《免疫法杂志》,doi:10.1016/j.jim.2011.09.001);Sherwood etal.2011Sci.Translat.Med.3:90ra61(Sherwood等人,2011年,《科学转化医学》,第3卷,第90ra61页);U.S.A.N.13/217,126(美国公布No.2012/0058902)、U.S.A.N.12/794,507(美国公布No.2010/0330571)、WO/2010/151416、WO/2011/106738(PCT/US2011/026373)、WO2012/027503(PCT/US2011/049012)、U.S.A.N.61/550,311和U.S.A.N.61/569,118。
该方法通常涉及从淋巴样细胞的亚群进行DNA取样,所述淋巴样细胞为例如存在于血样中的淋巴样细胞,已知血样还含有缺少重排TCR或IG编码DNA的有核细胞。本发明的组合物和方法可允许改善此类样品中的重排TCR和IG编码DNA分子数量的测定的准确性和精确性。如本文所述,例如,通过用本发明模板组合物对DNA样品加标,提供内部扩增模板标准品以用于评估存在于多重扩增引物组中的各种寡核苷酸引物的相对效率。通过如此评估以已知量添加至扩增反应中的本发明人工模板组合物的扩增产物,可测定寡核苷酸扩增引物组的扩增因子(例如,乘积因子、归一化因子、比例因子或几何因子等)并且可随后用于计算样品中的天然DNA模板的数量。
又如,这些和相关实施例允许通过从淋巴样细胞和非淋巴样细胞(包括持续性淋巴瘤或白血病细胞)的混合制备物获得的样品中的重排TCR或IG编码DNA的定量检测,对淋巴瘤或白血病的微小残留病(MRD)进行定量。先前方法以恶性细胞数量来测定MRD,所述恶性细胞可按照样品中的细胞总数的比例来检测。相比之下,本发明方法允许估计样品中具有重排TCR或IG编码DNA的细胞的总数,使得恶性细胞(例如,具有特定TCR或IG重排的那些,如克隆型)可按照此类重排细胞的比例而非按照所有细胞的比例来定量。作为非限制性理论,据信因为来自患有或疑似患有MRD的受试者的临床样品中的所有重排细胞的占比通常非常低,本发明方法将显著改善MRD可被检测到的灵敏度,包括通过提高信噪比来改善此类灵敏度。
因此某些实施例从而提供了用于定量生物样品中编码一种或多种适应性免疫受体的重排DNA分子的方法,所述生物样品包含来自受试者的淋巴样细胞的DNA,每种适应性免疫受体包含可变区和连接区。简而言之,所述方法包括如下步骤:
(A)在使用能够扩增给定适应性免疫受体的基本上所有V-J编码组合的本文所述寡核苷酸扩增引物组的多重扩增反应中,扩增来自样品的DNA以获得扩增产物,所述样品中已添加已知量的用于使扩增效率标准化的本文所述模板组合物;
(B)对(A)的扩增产物定量测序以定量(i)模板扩增产物,其为本文所述模板组合物的扩增产物并且将是可检测的,因为其含有至少一种条形码寡核苷酸序列;和(ii)样品中的重排适应性免疫受体编码DNA序列的扩增产物,其将是可检测的,因为其含有特异性V和J序列但缺少寡核苷酸条形码序列;
(C)基于步骤(B)中获得的定量信息计算扩增因子;以及
(D)使用(C)的扩增因子通过计算来测定样品中的独特适应性免疫受体编码DNA分子的数量。
不希望受理论的束缚,根据这些和相关方法,在多重扩增反应中取样的重排TCR或IG编码DNA分子的数量得以测量。为此,测定序列覆盖值,例如针对每种输入(模板)分子所测定的输出序列读段的数量,并在所存在的不同模板寡核苷酸的全部数量中对其进行平均,以获得平均序列覆盖值。通过将(i)针对给定序列获得的读段的数量除以(ii)平均序列覆盖值,可计算在扩增反应开始时作为模板存在的重排分子的数量。
从而,例如,为了计算序列覆盖值,将已知量的本发明所公开的模板组合物的一组合成分子添加到每个PCR扩增中,所述合成模板具有式(I)5'U-B1-V-B2-R-(B3)-J-B4-U 3'的基本结构,其中每个V为具有匹配TCR或IG V基因序列的序列的300碱基对区段,并且J为具有匹配TCR或IG J基因的序列的100碱基对区段。B2为独特的条形码寡核苷酸序列,其独特地识别每个VJ对并且也将合成DNA模板的扩增产物(其将含有条形码序列)与淋巴样DNA样品所贡献的天然存在的生物模板DNA分子的扩增产物(其将缺少条形码序列)区分开。在该例中,式(I)的B3不存在。在PCR扩增和测序后,对每种所测序的合成分子(即,包含条形码序列的扩增产物)的数量进行计数。然后基于用于对扩增反应加标的起始合成模板分子的已知数量,计算合成分子的序列覆盖率。
例如,可将5000个合成的含条形码的模板分子(1100种独特的合成模板寡核苷酸序列(代表每个可能的VJ对)每者具有4-5个拷贝)的库添加至扩增反应。如果扩增产物包含匹配合成模板分子的50,000条序列,则获得了10X的序列覆盖值并且扩增因子为10。为了估计从样品获得的DNA中的天然VDJ重排模板分子的数量,则将天然模板的扩增产物(即,缺少任何条形码序列的扩增产物)的数量除以扩增因子。由于在该例中5000个合成分子是代表每种VJ对的1100种分子的复杂库,为增加准确性,可单独计算每种VJ对的扩增因子。然后可在所有合成分子中对扩增因子进行平均(图8)。方法的准确性和稳健性示于图9中并且细节在以下实例5中描述。
在替代实施例中,所述替代实施例与本部分的上文和下文中所述的相同,但例外的是差异在于合成模板分子的总库的亚组的使用,其以导致对样品的添加为不超过1拷贝的不同模板分子的亚组至样品的方式使用。普通技术人员熟知的泊松统计方法的应用被用于基于库的已知特性(例如,不同序列的总数和模板分子的浓度)测定要添加的模板的量。例如,将200-500个模板分子添加至扩增反应,使得存在于库中的模板分子亚组中的每一者具有平均不超过一拷贝。
因此,在这些实施例中,所述方法包括:(A)在多重聚合酶链式反应(PCR)中扩增DNA,所述反应包含:(1)来自包含受试者淋巴样细胞的生物样品的DNA;(2)权利要求1的模板组合物,其中存在已知数量的具有独特寡核苷酸序列的所述多种模板寡核苷酸中的每一者;(3)能够扩增来自生物样品的DNA中编码一种或多种适应性免疫受体的重排DNA的寡核苷酸扩增引物组,所述引物组包含:(a)基本上等摩尔量的多种V区段寡核苷酸引物,其各自独立地能够特异性杂交至至少一种编码适应性免疫受体V区多肽的多核苷酸或特异性杂交至其互补序列,其中每种V区段引物包含与至少一种功能性适应性免疫受体V区编码基因区段互补的至少15个连续核苷酸的核苷酸序列,并且其中所述多种V区段引物特异性杂交至模板组合物中存在的基本上所有功能性适应性免疫受体V区编码基因区段,以及(b)基本上等摩尔量的多种J区段寡核苷酸引物,其各自独立地能够特异性杂交至至少一种编码适应性免疫受体J区多肽的多核苷酸或特异性杂交至其互补序列,其中每种J区段引物包含与至少一种功能性适应性免疫受体J区编码基因区段互补的至少15个连续核苷酸的核苷酸序列,并且其中所述多种J区段引物特异性杂交至模板组合物中存在的基本上所有功能性适应性免疫受体J区编码基因区段,其中V区段和J区段寡核苷酸引物能够在所述多重聚合酶链式反应(PCR)中促进如下的扩增:(i)模板组合物中的基本上所有模板寡核苷酸以产生大量的扩增模板DNA分子,所述大量的扩增模板DNA分子足以定量模板组合物中的模板寡核苷酸的多样性,以及(ii)生物样品中的编码适应性免疫受体的基本上所有重排DNA分子以产生大量的扩增重排DNA分子,所述大量的扩增重排DNA分子足以定量来自生物样品的DNA中的重排DNA分子的多样性,并且其中所述大量的扩增模板DNA分子中和所述大量的扩增重排DNA分子中的每一扩增DNA分子的长度小于1000、900、800、700、600、500、400、300、200、100、90、80或70个核苷酸。
(B)对所述扩增的模板DNA分子中的每一者和所述扩增的重排DNA分子中的每一者的所有或足够的部分进行定量测序以定量(i)包含至少一种寡核苷酸条形码序列的扩增模板DNA分子的模板产物数量,以及(ii)缺少寡核苷酸条形码序列的扩增重排DNA分子的重排产物数量;
(C)将(B)(i)的模板产物数量除以(A)(2)的具有独特寡核苷酸序列的所述多种模板寡核苷酸中的每一者的已知数量,来计算扩增因子;以及
(D)将(B)(ii)的重排产物数量除以(C)中计算的扩增因子以定量样品中的独特适应性免疫受体编码DNA分子。
所设想的实施例并非旨在受限于上述方法,使得技术人员根据本公开将理解可采用的变型形式。替代方法例如可不使用本文所述的合成模板组合物作为DNA样品的多重PCR扩增中的加标对照模板,所述DNA样品含有重排淋巴样细胞TCR和/或IG编码DNA以及非重排DNA。相反,根据一种此类替代形式,可向使用V和J扩增引物的扩增反应中添加已知的一组寡核苷酸扩增引物,所述寡核苷酸扩增引物可扩增不同的高度保守基因组序列区。这些基因组对照引物可扩增DNA样品中存在的每个基因组,而不论其是否含有重排TCR和/或IG编码序列,而V和J引物可仅从具有重排VDJ区的基因组扩增产物。这两种类别的扩增产物分子之间的比率允许估计样品中的B细胞基因组总数。
除非特别说明为相反的意思,否则本发明某些实施例的实施将采用微生物学、分子生物学、生物化学、分子遗传学、细胞生物学、病毒学和免疫学技术中的常规方法,所述技术属于本领域技术,并且以下出于举例说明目的而对其中若干技术进行了引用。此类技术在文献中进行了充分阐述。参见例如,Sambrook,et al.,Molecular Cloning:ALaboratory Manual(3rd Edition,2001)(Sambrook等人,《分子克隆实验指南》,第3版,2001年);Sambrook,et al.,Molecular Cloning:A Laboratory Manual(2nd Edition,1989)(Sambrook等人,《分子克隆实验指南》,第2版,1989年);Maniatis et al.,MolecularCloning:A Laboratory Manual(1982)(Maniatis等人,《分子克隆:实验指南》,1982年);Ausubel et al.,Current Protocols in Molecular Biology(John Wiley and Sons,updated July 2008)(Ausubel等人,《现代分子生物学实验技术》,约翰·威利父子出版公司,2008年7月更新);Short Protocols in Molecular Biology:A Compendium ofMethods from Current Protocols in Molecular Biology,Greene Pub.Associates andWiley-Interscience(《精编分子生物学实验指南:现代分子生物学实验技术方法汇编》,格林出版公司与威利国际科学公司);Glover,DNA Cloning:A Practical Approach,vol.I&II(IRL Press,Oxford Univ.Press USA,1985)(Glover,《DNA克隆:实用方法》,第I和II卷,IRL出版社,美国牛津大学出版社,1985年);Current Protocols in Immunology(Editedby:John E.Coligan,Ada M.Kruisbeek,David H.Margulies,Ethan M.Shevach,WarrenStrober 2001John Wiley&Sons,NY,NY)(《现代免疫学实验技术》,编辑:John E.Coligan、Ada M.Kruisbeek、David H.Margulies、Ethan M.Shevach、Warren Strober,2001年,约翰·威利父子出版公司,纽约州纽约市);Real-Time PCR:Current Technology andApplications,Edited by Julie Logan,Kirstin Edwards and Nick Saunders,2009,Caister Academic Press,Norfolk,UK(《实时PCR:现代技术与应用》,由Julie Logan、Kirstin Edwards和Nick Saunders编辑,2009年,Caister学术出版社,英国诺福克);Anand,Techniques for the Analysis of Complex Genomes,(Academic Press,NewYork,1992)(Anand,《分析复杂基因组的技术》,学术出版社,纽约,1992年);Guthrie andFink,Guide to Yeast Genetics and Molecular Biology(Academic Press,New York,1991)(Guthrie和Fink,《酵母遗传学与分子生物学指南》,学术出版社,纽约,1991年);Oligonucleotide Synthesis(N.Gait,Ed.,1984)(《寡核苷酸合成》,N.Gait编辑,1984年);Nucleic Acid Hybridization(B.Hames&S.Higgins,Eds.,1985)(《核酸杂交》,B.Hames和S.Higgins编辑,1985年);Transcription and Translation(B.Hames&S.Higgins,Eds.,1984)(《转录和翻译》,B.Hames和S.Higgins编辑,1984年);Animal Cell Culture(R.Freshney,Ed.,1986)(《动物细胞培养》,R.Freshney编辑,1986年);Perbal,APractical Guide to Molecular Cloning(1984)(Perbal,《分子克隆实用指南》,1984年);Next-Generation Genome Sequencing(Janitz,2008 Wiley-VCH)(《下一代基因组测序》,Janitz,2008年,威利-VCH出版公司);PCR Protocols(Methods in Molecular Biology)(Park,Ed.,3rd Edition,2010 Humana Press)(《PCR实验技术》(分子生物学方法),Park编辑,第3版,2010年,胡马纳出版社);Immobilized Cells And Enzymes(IRL Press,1986)(《固定化细胞和酶》,IRL出版社,1986年);论文Methods In Enzymology(Academic Press,Inc.,N.Y.)(《酶学方法》,学术出版社,纽约);Gene Transfer Vectors For MammalianCells(J.H.Miller and M.P.Calos eds.,1987,Cold Spring Harbor Laboratory)(《哺乳动物细胞的基因转移载体》,J.H.Miller和M.P.Calos编辑,1987年,冷泉港实验室);Harlowand Lane,Antibodies,(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1998)(Harlow和Lane,《抗体》,冷泉港实验室出版社,纽约冷泉港,1998年);Immunochemical Methods In Cell And Molecular Biology(Mayer and Walker,eds.,Academic Press,London,1987)(《细胞与分子生物学中的免疫化学方法》,Mayer和Walker编辑,学术出版社,伦敦,1987年);Handbook Of Experimental Immunology,Volumes I-IV(D.M.Weir and CC Blackwell,eds.,1986)(《实验免疫学手册》,第I-IV卷,D.M.Weir和CCBlackwell编辑,1986年);Riott,Essential Immunology,6th Edition,(BlackwellScientific Publications,Oxford,1988)(Riott,《基础免疫学》,第6版,布莱克威尔科学出版公司,牛津,1988年);Embryonic Stem Cells:Methods and Protocols(Methods inMolecular Biology)(Kurstad Turksen,Ed.,2002)(《胚胎干细胞:方法与实验技术》(分子生物学方法),Kurstad Turksen编辑,2002年);Embryonic Stem Cell Protocols:VolumeI:Isolation and Characterization(Methods in Molecular Biology)(KurstadTurksen,Ed.,2006)(《胚胎干细胞实验技术:第I卷:分离与表征》(分子生物学方法),Kurstad Turksen编辑,2006年);Embryonic Stem Cell Protocols:Volume II:Differentiation Models(Methods in Molecular Biology)(Kurstad Turksen,Ed.,2006)(《胚胎干细胞实验技术:第II卷:分化模式》(分子生物学方法),Kurstad Turksen编辑,2006年);Human Embryonic Stem Cell Protocols(Methods in Molecular Biology)(Kursad Turksen Ed.,2006)(《人胚胎干细胞实验技术》(分子生物学方法),KursadTurksen编辑,2006年);Mesenchymal Stem Cells:Methods and Protocols(Methods inMolecular Biology)(Darwin J.Prockop,Donald G.Phinney,and Bruce A.BunnellEds.,2008)(《间充质干细胞:方法与实验技术》(分子生物学方法),Darwin J.Prockop、Donald G.Phinney和Bruce A.Bunnell编辑,2008年);Hematopoietic Stem CellProtocols(Methods in Molecular Medicine)(Christopher A.Klug,and CraigT.Jordan Eds.,2001)(《造血干细胞实验技术》(分子生物学方法),Christopher A.Klug和Craig T.Jordan编辑,2001年);Hematopoietic Stem Cell Protocols(Methods inMolecular Biology)(Kevin D.Bunting Ed.,2008)(《造血干细胞实验技术》(分子生物学方法),Kevin D.Bunting编辑,2008年);Neural Stem Cells:Methods and Protocols(Methods in Molecular Biology)(Leslie P.Weiner Ed.,2008)(《神经干细胞:方法与实验技术》(分子生物学方法),Leslie P.Weiner编辑,2008年)。
除非提供了明确定义,否则结合本文所述的分子生物学、分析化学、合成有机化学和医药化学利用的命名,以及本文所述的分子生物学、分析化学、合成有机化学和医药化学的实验室程序和技术是本领域熟知和常用的那些。标准技术可用于重组技术、分子生物学、微生物学、化学合成、化学分析、药物制备、配制和递送、以及患者治疗。
除非上下文另外要求,否则在本说明书和权利要求书通篇中,词语“包含”及其变型形式诸如“包括”和“具有”应以开放式包含的意义解释,即解释为“包括但不限于”。所谓“由...组成”意指包括,并通常限于紧接短语“由...组成”的任何事物。所谓“基本上由...组成”意指包括该短语之后所列的任何元素,并且限于不妨碍或促成所列元素的公开内容中指定的活性或作用的其他元素。从而,短语“基本上由...组成”指示所列元素是所需的或强制性的,但是其他元素是不需要的并且可存在或可不存在,具体取决于其是否影响所列元素的活性或作用。
在本说明书和随附权利要求书中,单数形式“一个”、“一种”和“所述”包括复数引用,除非所述内容明确地另外指明。如本文所用,在特定实施例中,术语“约”或“大约”当在数值之前时指示所述数值加上或减去5%、6%、7%、8%或9%的范围。在其他实施例中,术语“约”或“大约”当在数值之前时指示所述数值加上或减去10%、11%、12%、13%或14%的范围。在其他实施例中,术语“约”或“大约”当在数值之前时指示所述数值加上或减去15%、16%、17%、18%、19%或20%的范围。
本说明书通篇对“一个实施例”或“实施例”或“一个方面”的提及意指结合实施例所述的特定特征、结构或特性包括在本发明的至少一个实施例中。从而,短语“在一个实施例中”或“在实施例中”在本说明书通篇的各个地方的出现不一定全部都指相同实施例。此外,特定特征、结构或特性可以任何合适的方式在一个或多个实施例中组合。
实例
实例1:用于校准扩增引物偏倚控制的模板寡核苷酸的设计
在该实例和以下实例中,采用标准分子生物学和生物化学材料及方法,包括在如下文献中所述的技术:例如,Sambrook,et al.,Molecular Cloning:A Laboratory Manual(3rd Edition,2001)(Sambrook等人,《分子克隆:实验指南》,第3版,2001年);Sambrook,etal.,Molecular Cloning:A Laboratory Manual(2nd Edition,1989)(Sambrook等人,《分子克隆:实验指南》,第2版,1989年);Maniatis et al.,Molecular Cloning:A LaboratoryManual(1982)(Maniatis等人,《分子克隆:实验指南》,1982年);Ausubel et al.,CurrentProtocols in Molecular Biology(John Wiley and Sons,updated July 2008)(Ausubel等人,《现代分子生物学实验技术》,约翰·威利父子出版公司,2008年7月更新);ShortProtocols in Molecular Biology:A Compendium of Methods from Current Protocolsin Molecular Biology,Greene Pub.Associates and Wiley-Interscience(《精编分子生物学实验指南:现代分子生物学实验技术方法汇编》,格林出版公司与威利国际科学公司);Glover,DNA Cloning:A Practical Approach,vol.I&II(IRL Press,Oxford Univ.PressUSA,1985)(Glover,《DNA克隆:实用方法》,第I和II卷,IRL出版社,美国牛津大学出版社,1985年);Anand,Techniques for the Analysis of Complex Genomes,(Academic Press,New York,1992)(Anand,《分析复杂基因组的技术》,学术出版社,纽约,1992年);Oligonucleotide Synthesis(N.Gait,Ed.,1984)(《寡核苷酸合成》,N.Gait编辑,1984年);Nucleic Acid Hybridization(B.Hames&S.Higgins,Eds.,1985)(《核酸杂交》,B.Hames和S.Higgins编辑,1985年);Transcription and Translation(B.Hames&S.Higgins,Eds.,1984)(《转录和翻译》,B.Hames和S.Higgins编辑,1984年);Perbal,A Practical Guide toMolecular Cloning(1984)(Perbal,《分子克隆实用指南》,1984年);Next-GenerationGenome Sequencing(Janitz,2008 Wiley-VCH)(《下一代基因组测序》,Janitz,2008年,威利-VCH出版公司);PCR Protocols(Methods in Molecular Biology)(Park,Ed.,3rdEdition,2010 Humana Press)(《PCR实验技术》(分子生物学方法),Park编辑,第3版,2010年,胡马纳出版社)。
一组双链DNA(dsDNA)模板寡核苷酸被设计为校准用标准品,所述校准用标准品用作模拟指定适应性免疫受体(TCR或BCR)基因座处的所有可能V/J组合的对照模板。对于每个人TCR和BCR基因座,由RSS 5'端的已知基因组V区段序列和RSS 3'端的已知基因组J区段列表编制成列表。为了易于理解,根据5'到3'取向为从左读到右的惯例给出dsDNA模板的编码链序列。
模板寡核苷酸的通用结构的示意图示于图1中。为了用于多重背景下的每种独特模板寡核苷酸身份的交叉验证,将不同的16bp条形码寡核苷酸(B)掺入到每种模板中,其中条形码的第一8bp独特识别模板的V区段多核苷酸,并且条形码的第二8bp独特识别J区段。将该条形码的拷贝掺入三次:将(B3)掺入在外部接头(U2)与J区段序列(J)之间,使得采用标准Illumina或Ion引物的短单端读段可揭示每种模板寡核苷酸的V和J序列的独特组合的身份;将(B2)掺入在V与J区段之间,使得标准测序策略(例如,Illumina GA-2或HiSeqTM)将捕获每种模板寡核苷酸中的V和J序列的独特组合;以及将(B3)掺入在V区段与其他外部接头(U1)之间,使得短成对端读段可确认每种模板寡核苷酸中的V和J序列的独特组合的身份,如果希望这样的话。
如图1所示,模板寡核苷酸序列以接头序列(U1)开始,所述接头序列(U1)能够在分子末端掺入测序平台特异性短寡核苷酸序列。在该例中,使用了Illumina NexteraTM接头,但应当指出的是基本上任何稳健PCR引物对都将同样有效。作为示例性接头,寡核苷酸序列GCCTTGCCAGCCCGCTCAG[SEQ ID NO:1746]附接在U1的V区段末端(图1),以保持与要加在标准Illumina寡核苷酸上的NexteraTM Illumina接头(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))(CAAGCAGAAGACGGCATACGAGATCGGTCTGCCTTGCCAGCCCGCTC AG)[SEQ ID NO:1747]的相容性,所述标准Illumina寡核苷酸与单端或成对端Illumina测序流通池相容。
U1的紧接下游(其3'端)是条形码寡核苷酸ACACACGTGACACTCT[SEQ ID NO:1748]的第一拷贝(B1)。接下来,将固定长度的V区段序列掺入到模板寡核苷酸中,使模板组中的所有模板以天然RSS之前的给定数量碱基结束,以便模拟V区段处缺失固定数量碱基的天然TCR或BCR基因重排。在该例中最初在RSS之前有零个碱基缺失。为了使这些序列的可识别性最大化,然后对所有V区段多核苷酸序列进行修剪以移除邻近RSS的部分密码子,使得残余V区段序列与起始密码子处于框内。多样性V区段序列是序列表中所示的示例性模板寡核苷酸组中示出的那些(例如,SEQ ID NO:1-871中的TCRB模板寡核苷酸组的式(I)序列内的一组TCRB V区段;SEQ ID NO:872-1560中的TCRB模板寡核苷酸组的式(I)序列内的不同组TCRB V区段;SEQ ID NO:1561-1630中的TCRG模板寡核苷酸组的式(I)序列内的一组TCRG V区段);单种示例性V多核苷酸如下:
TCTTATTTTCATAGGCTCCATGGATACTGGAATTACCCAGACACCAAAATACCTGGTCACAGCAATGGGGAGTAAAAGGACAATGAAACGTGAGCATCTGGGACATGATTCTATGTATTGGTACAGACAGAAAGCTAAGAAATCCCTGGAGTTCATGTTTTACTACAACTGTAAGGAATTCATTGAAAACAAGACTGTGCCAAATCACTTCACACCTGAATGCCCTGACAGCTCTCGCTTATACCTTCATGTGGTCGCACTGCAGCAAGAAGACTCAGCTGCGTATCTCTGCACCAGCAG[SEQ IDNO:1749]。
将终止密码子TGA框内掺入在每种模板寡核苷酸中的V多核苷酸序列的3'端,以确保模板寡核苷酸序列不会视为与它们污染生物样品的事件相关。在NDN正常情况下所处的V区段与J区段之间的终止密码子的下游,插入V/J识别符条形码序列B2(SEQ ID NO:1748)的第二拷贝。接下来,掺入Sal1限制性酶识别位点(R)序列GTCGAC;基于作为不天然存在于TCRB V或J区段基因组序列任何一者中的序列、赋予在需要时特异性破坏合成模板的能力、或用作识别合成序列的信息标记来选择该序列。B3位点在该形式的模板中为空。
将J多核苷酸(J)作为来自J基因区段的固定长度的序列(由天然RSS之后的固定碱基数测量)掺入以模拟天然重排,并且在本发明例子中延伸到J-C内含子。在该例中J区段缺失了零个碱基,但在其他模板寡核苷酸设计中,使用5bp的缺失以便为V-J接合部处的VJ条形码(B2)留出空间,同时使总J区段长度保持在天然范围内。示例性J多核苷酸是
ACTGAAGCTTTCTTTGGACAAGGCACCAGACTCACAGTTGTAGGTAAGACATTTTTCAGGTTCTTTTGCAGATCCGTCACAGGGAAAAGTGGGTCCACAG[SEQ ID NO:1750]。
J区段多核苷酸的下游是V/J条形码识别符寡核苷酸(SEQ ID NO:1748)的第三拷贝(B4)。示例性模板寡核苷酸序列即为以第二接头序列(U2)结束的序列,所述第二接头序列(U2)能够在分子末端掺入平台特异性序列。如上文所指出,NexteraTM相容性接头(CTGATGGCGCGAGGGAGGC)[SEQ ID NO:1751]在U2的J区段末端上使用,其与NexteraTMIllumina接头(AATGATACGGCGACCACCGAGATCTACACGCCTCCCTCGCGCCATCAG)[SEQ ID NO:1752]一起使用以允许添加在与单端或成对端流通池相容的标准Illumina测序寡核苷酸上。
制备根据本公开的示例性TCRB和TCRG模板寡核苷酸组,并且其具有以SEQ ID NO:1-1630示出的核苷酸序列。基于本文所公开的序列设计信息,由爱荷华州科拉尔维尔的集成DNA技术公司(Integrated DNA Technologies,Inc.(Coralville,IA))使用gBlocksTM基因区段(Gene Fragments)化学物质,定制合成具有以SEQ ID NO:1-871和1561-1630示出的序列的模板寡核苷酸组。通过实例2所述的PCR拼接方法生成具有以SEQ ID NO:872-1560示出的序列的模板寡核苷酸组。
TCRB模板寡核苷酸(SEQ ID NO:1-871)。使用人TCRB V和J多核苷酸序列设计一组871种如下由通式(I)表示的模板寡核苷酸(其中B3不存在):
5'-U1-B1-V-B2-R-(B3)-J-B4-U2-3'(I)。
每种模板寡核苷酸由495碱基对DNA分子组成。有义链序列以SEQ ID NO:1-871示出。
描绘该模板组的设计的示意图示于图1中。根据惯例,所述图表以5'到3'(左到右)方向描绘了寡核苷酸设计。“V区段”代表适应性免疫受体可变(V)区编码基因序列或其互补序列。“J区段”代表适应性免疫受体连接(J)区编码基因序列或其互补序列。U1和U2分别代表第一和第二通用接头寡核苷酸序列,其可任选还分别包含连接至第一和第二通用接头寡核苷酸序列并位于第一和第二通用接头寡核苷酸序列5'端的第一和第二测序平台特异性寡核苷酸序列。B1、B2和B4代表寡核苷酸条形码序列,其各自包含具有一独特寡核苷酸序列的寡核苷酸条形码序列,该独特寡核苷酸序列独特地识别作为成对组合的(i)独特的V区段序列和(ii)独特的J区段序列;在该实例中,B3不存在。
S代表在V的3'端可在框内或框外的任选终止密码子。R代表任选的限制性酶识别位点。在SEQ ID NO:1-871中,U1和U2接头包含如上文所述的19聚体(分别为SEQ ID NO:1746和1751)并且所有识别(V+J)的条形码(B)序列(B1,B2,B4)的长度为16个核苷酸;包含了终止密码子TGA和Sal1限制性酶识别位点(GTCGAC)。
TCRB模板寡核苷酸(SEQ ID NO:872-1560)。设计第二组689种模板寡核苷酸,其中根据通式(I),V和J分别包含人TCRB V和J多核苷酸序列,U1和U2独立地包含不同限制性酶识别位点(R1和R3),并且B1、B3和B4独立地不存在,从而获得通式(II):
R1-V-B2-R2-J-R3 (II)
其中B2为8核苷酸条形码识别符(例如,如表7中所示的条形码序列);R1、R2和R3分别为限制性酶识别位点EcoR1(GAATTC)、Sal1(GTCGAC)和Sph1(GCATGC);并且V和J分别为如本文所述的V区和J区多核苷酸。每种模板寡核苷酸由239碱基对DNA分子组成。有义链序列以SEQ ID NO:872-1560示出。
TCRG模板寡核苷酸(SEQ ID NO:1561-1630)。使用人TCRG V和J多核苷酸序列设计第三组的70种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由一495碱基对DNA分子组成。有义链序列以SEQ ID NO:1561-1630示出。TCRG模板的70-寡核苷酸组(SEQ ID NO:1561-1630)的细节具有代表性并且如下:
基于之前测定的基因组序列,人TCRG基因座显示出含有各自具有RSS序列的14个Vγ区段,因此被视为有能力重排。这14个Vγ区段包含已知能被表达的六个基因区段、被归类为具有开放阅读框的三个V区段以及五个V假基因。将Vγ基因区段连接至五个Jγ基因区段。为了包括14个V和5个J区段的所有可能V+J基因组合,设计代表所有可能VJ组合的70(5×14)种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-(B3)-J-B4-U2-3')(图1),从而包括九个部分,即19碱基对(bp)通用接头(U1);16bp核苷酸标签(B1),其独特识别V基因和J基因区段的每种成对组合;300bp的V基因特异性序列(V);3bp终止密码子(S);另一拷贝的16bp核苷酸标签(B2);所有分子共有的6bp接合部标签(R);不存在B3;100bp的J基因特异性序列(J);第三拷贝的16bp核苷酸标签(B4);以及19bp的通用接头序列(U2)。
使用寡核苷酸引物(表4;SEQ ID NO:1732-1745)单独地扩增70种模板(SEQ IDNO:1561-1630)中的每一者,所述寡核苷酸引物被设计为退火至通用接头序列(U1,U2)。
表4.TCRG扩增引物
使用LabChip GXTM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。如通过测序条形码B1所测定的,70种可能的V-J组合每一者的出现频率示于表5中。将70种扩增模板寡核苷酸制备物归一化为标准浓度,然后合并。
为验证所有70种模板寡核苷酸以基本上等摩尔浓度存在,使用Illumina HiSeqTM测序平台根据制造商推荐,对所述库测序。简而言之,为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中,设计了加尾引物,所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的Illumina NexteraTM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina HiSEQTM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的60bp测序,并通过评估每种16bp分子条形码标签(B1)的频率进行分析。
计算70种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约1.4%的所述组的每个成员,并且希望所有物质的阈值容差为加上或减去十倍频率(0.14-14%)。定量测序表明初始库内的70种接头修饰的模板寡核苷酸物质占比不均匀。
因此,进行单独模板寡核苷酸浓度的调节和定量测序步骤的重复,直到每种分子在阈值容差浓度(0.14-14%)内存在。
表5:预先扩增模板库中的每个TCRG VJ对(14个V×5个J)的扩增产物的相对占比 (所指示的V-J组合的出现次数)
Jseg的计数
B标签 TCRGJ TCRGJ2 TCRGJP TCRGJP1 TCRGJP2 #N/A 总计
TCRGV01 17 308 1315 741 822 44 3247
TCRGV02 630 781 2394 2009 122 65 6001
TCRGV03 250 166 2119 157 1105 51 3848
TCRGV04 777 37 2031 1490 1443 76 5854
TCRGV05 323 93 2571 716 150 63 3916
TCRGV05P 294 1161 2946 1552 530 111 6594
TCRGV06 164 1280 1809 401 23 40 3717
TCRGV07 16 234 1849 1697 93 78 3967
TCRGV08 2523 653 944 170 134 57 4481
TCRGV09 55 1004 2057 124 228 42 3510
TCRGV10 351 690 814 384 466 36 2741
TCRGV11 505 648 639 330 181 39 2342
TCRGVA 199 475 112 272 437 12 1507
TCRGVB 210 20 423 874 917 24 2468
#N/A 77 118 309 150 106 531 1291
总计 6391 7668 22332 11067 6757 1269 55484
实例2:TCRB V基因扩增偏倚的检测
该实例描述了如何通过如下方式组装通式(I)的689种人TCRB模板寡核苷酸的组:将各50-90个核苷酸的四种单链寡核苷酸拼接在一起产生模板组,所述模板组包含能够扩增人TCRB序列的一组寡核苷酸引物中的所有可能V-J组合的杂交靶标。然后使用所述组的模板寡核苷酸表征一组TCRB V和J扩增引物的相对扩增效率。
通过在标准PCR反应中将四种单链DNA引物“拼接”在一起,合成一组TCRB 689模板寡核苷酸,其含有代表人TCRB链的所有可能有效重排V和J组合的多核苷酸序列。简而言之,为每个TCRB V基因区段设计两种90bp片段(一种处于“正向”取向并且另一种处于“反向”),为每个TCRB J基因区段设计一种90bp片段(处于“反向”取向),并且50bp(正向)连接分子被设计为将V和J基因区段连接在一起。总计设计了52种V正向片段和52种V反向片段、13种J反向片段以及689种连接序列。与每种V基因区段对应的两种90bp片段(一种正向,一种反向)具有39bp的互补重叠序列。每种V反向片段的一端具有25bp的与50bp连接分子重叠的互补序列。每种连接序列中剩余的25bp是与J分子一端互补重叠的序列。所述分子被设计成使得互补序列彼此退火并形成双链DNA,Taq聚合酶可结合于所述双链DNA并酶促地延伸所述分子。
用以组装拼接分子的每个PCR反应使用QIAGEN多重PCR预混液(QIAGEN产品编号(part number)206145,加利福尼亚州瓦伦西亚的凯杰公司(Qiagen,Valencia,CA))、10%Q-溶液(Q-solution)(凯杰公司(QIAGEN))、以及四种单链寡核苷酸序列(两种TCRB V、一种TCRB J和一种连接序列,如上文所述)。两种外部分子(一种V正向片段和一种J反向片段)以各自均为1μM的终浓度添加,而两种内部分子(一种V反向片段和所述正向连接序列)各自以0.01μM的终浓度添加。热循环仪条件是:95℃下15分钟,接着是94℃下30秒、59℃下30秒和72℃下1分钟循环35次,然后72℃下10分钟循环1次。合成后,通过LabChip GXTM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量分子,并且使用Caliper LabChip GX软件计算每个所得条带的浓度(以ng/μl计)。
689种TCRB模板寡核苷酸的所得组的核苷酸序列以SEQ ID NO:872-1560示出。在SEQ ID NO:872-1560中,每种不同的V区序列为一8个核苷酸的独特条形码序列识别,如表7种所示。将所有689种模板归一化为25ng/μl的标准浓度,然后合并。所得库用于本文所述的TCRB测定,以检测689模板寡核苷酸组(SEQ ID NO:872-1560)的扩增过程中TCRB扩增引物的偏倚(非均匀)利用。
689种模板中的每一者以实验上尽可能接近等摩尔浓度存在于模板寡核苷酸库中,并将所述库用作TCRB扩增PCR反应的模板,所述PCR反应使用52种包含Illumina接头相容性序列的TCRB V区引物(SEQ ID NO:1753-1804,表6)的等摩尔混合物,和13种TCRB J区引物(SEQ ID NO:1631-1643,表1)的等摩尔混合物。使用如表1(SEQ ID NO:1631-1695)所示的52种TCRB VβF(正向)引物的等摩尔库(“VF库”)和13种TCRB JβR(反向)引物的等摩尔库(“JR库”)扩增689种模板的库的成员。以1.0μM VF库(每种独特的TCRB VβF引物22nM)、1.0μM JR库(每种独特的TCRB JβR引物77nM)、1μM QIAGEN多重PCR预混液(QIAGEN产品编号206145,加利福尼亚州瓦伦西亚的凯杰公司(Qiagen Corp.,Valencia,CA))、10%Q-溶液(凯杰公司(QIAGEN))和16ng/μL基因组DNA(gDNA)设置聚合酶链式反应(PCR)(各50μL)。在C100热循环仪(美国加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA,USA))中使用下列热循环条件:95℃下15分钟循环一次,94℃下30秒、59℃下30秒和72℃下一分钟循环25至40次,然后72℃下10分钟循环一次。为了对数百万的重排TCRβCDR3基因座进行取样,每文库进行12至20孔的PCR。如上文所指出的,V和J引物包含对应于Illumina测序用接头并与Illumina测序用接头相容的尾部。
在Illumina HiSeqTM测序仪上对扩增产物定量测序。使用从J分子开始的标准J测序引物(表3)对每种产物分子的60碱基对区进行测序。反应产物中的每种TCRB序列的出现频率示于图2中,从图中可明显看出并非所有TCRB序列已扩增到可比较的程度。
表6:TCRB扩增引物
表7:用于识别SEQ ID NO:872-1560中的TCRB V区的条形码序列
使用获得的用于生成如上所述的图2的数据,评估已被设计成退火至特异性V基因区段的每种扩增引物的交叉扩增能力(除基于退火序列互补性而特异性地为其设计引物的V基因区段之外的V基因区段扩增的能力)。制备52种独立的扩增引物库,其中每种引物库具有以等摩尔浓度合并的表6中的52种TCRB V区引物中的51种,并且第52种TCRB V区引物在所述库中以两倍于其他51种引物的摩尔浓度存在。制备单独的扩增引物库,使得针对52种V区引物中的每一者均存在一个库,在所述库中单种引物以两倍于其他引物的浓度存在,从而得到52种独特的引物库。随后设置52种单独的扩增反应,针对独特扩增引物库中的每一者设置一种,每种反应使用上述组的689种模板寡核苷酸(SEQ ID NO:872-1560)。模板寡核苷酸相对于彼此以等摩尔浓度存在。使用上述条件进行扩增和测序。结果示于图3中。
在图3中,黑色方块指示在使用以相对于等摩尔浓度的所有其他引物的2倍浓度存在的相应指示的TCRB V区特异性引物时扩增水平没有变化。白色方块指示扩增的10倍增加;灰色方块指示0与10倍之间的扩增的中间程度(呈现灰度级梯度)。对角线指示就受测试的大多数TCRB V区引物而言,给定引物的摩尔浓度加倍导致具有特异性退火靶序列的相应模板寡核苷酸的扩增的约10倍增加。非对角白色方块指示某些引物能够对其退火和扩增的非对应模板。
在一种或多种引物表现出显著大于或小于扩增潜能的可接受范围(例如,指定的均一扩增潜能范围)的扩增潜能的情况下,进行对单独的引物寡核苷酸浓度的进一步调节以及对模板扩增和定量测序步骤的重复,直到每种物质的产物分子均存在于所需的范围内,所述范围指示对扩增引物组内的引物间的非均一扩增潜能的修正。
因此,如表6中所指出的那样调节引物浓度,以便确定在图2和图3中明显看出的偏倚扩增结果是否能够通过分别增加或减少高效或低效扩增引物的相对存在而强烈降低。对于使用经调节引物组的多重PCR,V基因引物序列保持相同(在表6中报告的序列),然而,如果引物对其模板的扩增不足,则每种引物的相对浓度增加(图3);或如果引物对其模板的扩增过度,则每种引物的相对浓度减小(图3)。随后在PCR中使用扩增引物的经调节混合物以扩增模板组合物,所述模板组合物含有等摩尔量的用于生成图2和图3中的数据的所述689模板寡核苷酸组(SEQ ID NO:872-1560)。
如上所述执行扩增和定量测序,结果示于图4中,所述图将在所有扩增引物以等摩尔浓度存在时获得包含每种所指示的经扩增V区序列的产物的频率(黑条)与在将扩增引物的浓度调节至如表6中所指示的浓度之后获得的每种此类产物的频率(灰条)进行比较。
另外的hs-TCRB引物序列见于SEQ ID NO.6192-6264。
实例3:修正TCR扩增寡核苷酸引物组中的非均一扩增潜能(PCR偏倚)
设计多样的TCR扩增引物以扩增生物样品中的重排TCR V和J基因区段的每种可能组合,所述生物样品含有来自受试者的淋巴样细胞DNA。在多重PCR中使用含有等摩尔浓度的多样扩增引物的制备物以扩增多样模板组合物,所述组合物包含等摩尔浓度的根据式(I)的TCR特异性模板寡核苷酸,所述TCR特异性模板寡核苷酸具有至少一种代表TCR基因座的每种可能的V-J组合的模板。对扩增产物进行定量测序,并由独特识别每种V-J组合的每种16bp分子条形码序列(式(I)中的B)的出现频率获得每种独特V-J产物序列的出现频率。
对于TCRG,使用TCRG V-和J-特异性引物(SEQ ID NO:1732-1745,表4)扩增TCRG模板寡核苷酸(SEQ ID NO:1561-1630)。通过用五种J基因区段特异性引物的库单独地扩增八种TCRG V基因区段特异性引物中的每一者来识别分别成对的V引物的J引物独立性。在Illumina HiSeqTM测序平台上对扩增产物进行定量测序,并且独特识别特异性V-J组合的内部16bp条形码序列(B)的出现频率允许对每种V-J对进行定量。通过执行逆反应,即通过用八种V基因区段特异性引物的库单独地扩增五种TCRG J基因区段引物中的每一者,来识别分别成对的J引物的V引物独立性。
为了测试TCRG V引物或J引物是否交叉扩增(例如,基因区段特异性引物是否非特异性地扩增(例如)以测试被特异性设计为扩增TCRG V7区段的V引物是否能够扩增TCRG V6和TCRG V7V基因区段两者),生成了独立引物库,所述独立引物库含有等摩尔浓度的除了所述引物中一者之外的所有引物,并且随后将被省掉的引物以所有其他引物的两倍的摩尔浓度添加到所述库中。随后使用引物,使用分别在如本文所述通式(I)中的V和J多核苷酸中的TCRG V和J基因序列,对模板组合物进行扩增,所述模板组合物包含多种由通式(I)表示的模板寡核苷酸。定量测序揭示在单种扩增引物以引物库中所有其他引物的两倍浓度存在时在扩增产物间占比过高的任何一种或多种模板的种类。随后调节引物混合物以增加或减小一种或多种引物的相对浓度,从而获得在多轮迭代中处于可接受定量容差内的扩增频率。这样获得的经调节引物混合物被视为已进行了修正以降低引物组的成员间的非均一扩增潜能。
为了确定经修正的引物混合物在用于扩增来自受试者淋巴样细胞的生物样品中的重排TCR模板DNA时是否呈现无偏倚的扩增潜能,将如本文所述的人工模板组合物制备为所有VJ对以类似频率存在,且某些VJ对具有不同比率的相对占比。将每种类型的模板制备物作为扩增引物组的扩增模板单独测试,所述扩增引物组已进行了修正以降低引物组的某些成员间的非均一扩增潜能。对扩增产物的定量序列测定确定了特异性序列在模板制备物中的相对定量占比在特异性序列于扩增产物间的相对定量占比中得以反映。
作为上述迭代过程的替代,或除了其后是定量测序的此类迭代扩增步骤之外,还能够通过计算修正扩增偏倚。根据该计算方法,合成模板组合物中的模板寡核苷酸序列物质中的每一者的起始频率是已知的。通过定量测序来确定在PCR扩增后所获得的扩增产物间的寡核苷酸序列的这些物质中的每一者的频率。在PCR扩增之前模板寡核苷酸序列的相对频率与在PCR扩增之后它们的频率之间的差异为“PCR偏倚”。该差异为在扩增期间例如由于各种扩增引物间的扩增效率不同而引入的扩增偏倚。
如针对每种已知模板寡核苷酸序列所定量地测定,使用每种引物的PCR偏倚来计算扩增偏倚(归一化)因子,通过所述因子对观察到的每种扩增产物的频率进行修正以反映各自模板序列在模板组合物中的实际频率。如果使用本发明的模板组合物凭经验检测到扩增引物组的PCR偏倚在因子10以内,则在使用相同的扩增引物组对未知组合物DNA样品进行扩增时可通过计算修正所获得的扩增产物中的偏倚。由此获得了在对DNA样品中的模板物质进行定量过程中的改善准确性。
因为V和J引物凭经验进行测试并显示为独立的,所以可针对每种V物质并针对每种J物质推导出扩增偏倚因子,且每种VJ物质对的扩增因子是不必要的。因此,使用本发明的模板组合物导出针对每种V物质和J物质的扩增偏倚因子。通过本发明的方法,在PCR扩增之前模板组合物中的V和J基因序列的频率是已知的(或可基于对如所合成的模板组合物中的每种模板寡核苷酸物质的浓度的了解而计算)。在PCR扩增之后,使用定量测序来检测扩增产物中每种V和J基因区段序列的频率。对于每种序列,基因区段频率的差异为扩增偏倚:
初始频率/最终频率=扩增偏倚因子
针对每种V基因区段和每种J基因区段计算扩增偏倚因子。一旦计算出这些扩增因子,就可将其应用于V和J基因的起始频率对于其而言是未知的样品。
在混合的模板群体(如从包含来自淋巴样细胞的DNA的生物源获得的复杂DNA样品,假定所述淋巴样细胞包含重排的适应性免疫受体编码DNA;或另外包含来自缺乏此类重排的其他细胞的DNA的复杂DNA样品)中,在每种V和J基因区段的起始频率未知的情况下,可使用已使用本发明的模板组合物进行表征的引物组的所计算扩增因子来修正残余的PCR扩增偏倚。对于所测序扩增产物分子的每一物质,基于序列相似性确定分子所使用的V和J基因。要修正扩增偏倚,将对分子进行测序的次数乘以修正V扩增因子和J扩增因子两者。所得的序列计数为通过计算“归一化的”组。
实例4:生成另外的模板组合物
另外的模板组合物基本上根据上述方法设计和制备。
V和J多核苷酸。生成了TCRB V和J多核苷酸序列以包含在本文所述的多种模板寡核苷酸中,并且所述TCRB V和J多核苷酸序列分别在68组TCRB V和J SEQ ID NO的组中示出,如在图5a-5l中作为TCRB V/J组1、TCRB V/J组2、TCRB V/J组3、TCRB V/J组4、TCRB V/J组5、TCRB V/J组6、TCRB V/J组7、TCRB V/J组8、TCRB V/J组9、TCRB V/J组10、TCRB V/J组11、TCRB V/J组12和TCRB V/J组13所示出的。
生成了TCRG V和J多核苷酸序列以包含在本文所述的多种模板寡核苷酸中,并且所述TCRG V和J多核苷酸序列分别在14组TCRG V和J SEQ ID NO的组中示出,如在图6a-6b中作为TCRG V/J组1、TCRG V/J组2、TCRG V/J组3、TCRG V/J组4和TCRG V/J组5所示出的。
生成了IGH V和J多核苷酸序列以包含在本文所述的多种模板寡核苷酸中,并且所述IGH V和J多核苷酸序列分别在127组IGH V和J SEQ ID NO的组中示出,如在图7a-7m中作为IGH V/J组1、IGH V/J组2、IGH V/J组3、IGH V/J组4、IGH V/J组5、IGH V/J组6、IGH V/J组7、IGH V/J组8和IGH V/J组9所示出的。
模板组合物。制备模板组合物,用于使TCRB扩增引物组的扩增效率标准化。所述组合物包含具有多种由通式(I)表示的寡核苷酸序列的多种模板寡核苷酸。包含858种不同模板寡核苷酸的TCRB模板组合物在序列表中以SEQ ID NO:3157-4014公开。
制备模板组合物,用于使TCRG扩增引物组的扩增效率标准化。所述组合物包含具有多种由通式(I)表示的寡核苷酸序列的多种模板寡核苷酸。包含70种不同模板寡核苷酸的TCRG模板组合物在序列表中以SEQ ID NO:4015-4084公开。
制备模板组合物,用于使IGH扩增引物组的扩增效率标准化。所述组合物包含具有多种由通式(I)表示的寡核苷酸序列的多种模板寡核苷酸。包含1116种不同模板寡核苷酸的IGH模板组合物在序列表中以SEQ ID NO:4085-5200公开。包含一组1116种模板寡核苷酸的IGH模板组合物还在序列表中以SEQ ID NO:1805-2920公开。
实例5:使用模板组合物测定扩增因子
该实例描述了在含有B细胞和成纤维细胞DNA的DNA样品的多重PCR扩增中使用本发明所述的模板寡核苷酸组合物作为“加标”合成模板,来对编码多种IG分子的重排DNA分子进行定量。
生物模板DNA:使用八份生物样品作为模板DNA的来源,其中每份生物样品含有相同量300ng的总基因组DNA(gDNA),但(i)从B细胞提取的DNA与(ii)从人成纤维细胞提取的DNA的比例不同,所述人成纤维细胞为其中IG和TCR编码基因不重排的细胞类型。所述样品含有0、0.07、0.3、1、4、18、75或300ng B细胞gDNA,其中成纤维细胞gDNA是每种300ng gDNA制备物的余量。制备每种样品的四份重复样。
合成的模板DNA:向每个PCR反应(如下)添加来自寡核苷酸模板组合物的5000个分子(每种序列4-5个分子),所述寡核苷酸模板组合物包含1116种合成的IGH模板寡核苷酸分子(SEQ ID NO:4085-5200)的库。包含一组1116种模板寡核苷酸的IGH模板组合物还在序列表中作为SEQ ID NO:1805-2920公开。
PCR反应:PCR反应使用凯杰公司(QIAGEN)Multiplex PlusTM PCR预混液(凯杰公司产品编号206152,加利福尼亚州瓦伦西亚凯杰公司(Qiagen,Valencia,CA))、10%Q-溶液(凯杰公司)和300ng生物模板DNA(上文所述)。添加合并的扩增引物,使得最终反应具有2μM的聚集体正向引物浓度和2μM的聚集体反向引物浓度。正向引物(SEQ ID NO:5201-5286)包括86种引物,这些引物在3'端处具有退火至IGH V区段编码序列的一大约20bp的区段并且在5'端处具有一大约20bp的通用引物pGEXf。反向引物(SEQ ID NO:5287-5293)包括J区段特异性引物的聚集体,所述J区段特异性引物在3'端处具有退火至IGH J区段编码序列的一大约20bp的区段,并且通用引物pGEXr位于J引物的5'端处。在C100热循环仪(美国加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA,USA))中使用下列热循环条件:95℃下10分钟循环一次,94℃下30秒、63℃下30秒和72℃下一分钟循环30次,然后72℃下10分钟循环一次。每个反应一式四份地进行。
为了进行测序,在七个循环的PCR反应中将还包含8bp标签和6bp随机核苷酸组的Illumina接头(加利福利亚圣地亚哥的亿明达有限公司(Illumina Inc.,San Diego,CA))掺入到PCR反应产物的末端上。PCR试剂和条件如上所述,不同的是热循环条件,其为:95℃下5分钟,接着在95℃下30秒、68℃下90秒和72℃下30秒循环7次。在热循环之后,将反应保持在72℃下10分钟,并且引物为Illumina接头加尾引物(SEQ ID NO:5387-5578)。使用Illumina_PE_RD2引物在Illumina MiSEQTM测序仪上对样品测序。
结果:获得每份样品的序列数据,并且通过条形码寡核苷酸序列的存在来识别合成模板的扩增产物。对于每份样品,将模板产物的数量除以独特合成模板寡核苷酸序列的数量(1116),得出样品的扩增因子。随后将每份品的生物模板的扩增产物总数量除以所述扩增因子来计算起始扩增反应中重排生物模板分子(如,VDJ重组)的数量,作为对独特B细胞基因组模板数量的估算。将具有标准偏差的平均值针对基于B细胞输入的重排生物模板分子的已知数量绘图(图9)。在图9中,点代表平均扩增因子,条代表整个四份重复样的标准偏差。使用如本文所述计算的扩增因子来估算VJ重排IG编码分子的数量(作为B细胞数量的代用值)产生了与至少低至100个B细胞的输入的已知B细胞数量相符的测定值。所估算的扩增因子值与观察到的扩增因子高度相关(图9,R2=0.9988)。
实例6:IgH、IgL和IgK偏倚控制模板
IgH VJ模板寡核苷酸
在一个实施例中,生成并分析IgH VJ模板寡核苷酸。使用人的IgH V和J多核苷酸序列设计一组1134种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由495碱基对DNA分子组成。IgH模板的1134-寡核苷酸组的细节具有代表性并且如下。
基于之前测定的基因组序列,人IgH基因座显示含有各自具有RSS序列的126个Vh区段,因此被视为有能力重排。这些126个Vh区段包含已知能被表达的52个基因区段、被归类为具有开放阅读框的5个V区段、以及69个V假基因。将Vh基因区段连接至9个Jh基因区段。为了包括126个V和9个J区段的所有可能V+J基因组合,设计代表所有可能VJ组合的1134(9×126)种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-J-B4-U2-3')(图1),从而包括九个部分,即19碱基对(bp)通用接头(U1);16bp核苷酸标签(B1),其独特识别V基因和J基因区段的每种成对组合;300bp的V基因特异性序列(V);3bp终止密码子(S);另一拷贝的16bp核苷酸标签(B2);所有分子共有的6bp接合部标签(R);不存在B3;100bp的J基因特异性序列(J);第三拷贝的16bp核苷酸标签(B4);以及19bp的通用接头序列(U2)。两个V区段与另两个V区段的核苷酸相同,因此不对其进行排序。这将所包含区段的数量从1134减少至1116。包含1116种不同模板寡核苷酸的IGH模板组合物在序列表中以SEQ ID NO:4085-5200公开。
使用被设计成退火至通用接头序列(U1,U2)的寡核苷酸引物单独地扩增所述1116种模板中的每一者。这些寡核苷酸序列可以是任何通用引物。对于本申请,使用通用引物编码的Nextera。
表8:包括在偏倚控制模板中的通用引物序列
通用引物序列可退火至本文所公开的任何引物序列。下面示出了包含通用引物序列的PCR引物的例子:
表9:具有通用序列(黑体且带下划线)的示例性IGH PCR引物
使用LabChip GXTM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。将1116种扩增模板寡核苷酸制备物归一化为标准浓度,然后合并。为验证所有1116种模板寡核苷酸以基本上等摩尔浓度存在,使用Illumina MiSeqTM测序平台根据制造商推荐,对所述库测序。为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中,设计了加尾引物,所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的IlluminaTM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQTM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序,并通过评估每种16bp分子条形码标签(B1)的频率进行分析。计算1116种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.09%的所述组的每个成员,并且希望所有物质的阈值容差为加上或减去十倍频率(0.009%-0.9%)。定量测序表明初始库内的1116种接头修饰的模板寡核苷酸物质占比不均匀。
因此,进行单独模板寡核苷酸浓度的调节和定量测序步骤的重复,直到每种分子在阈值容差浓度(0.009–0.9%)内存在。
IgH DJ模板寡核苷酸
在另一个实施例中,生成并分析IgH DJ模板寡核苷酸。使用人的IgH D和J多核苷酸序列设计一组243种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由一382碱基对DNA分子组成。IgH DJ模板寡核苷酸序列以SEQ ID NO:5579-5821示出。IgH模板的243-寡核苷酸组的细节具有代表性并且如下。
基于先前测定的基因组序列,人的IgH基因座显示为含有27个Dh区段。将27个Dh基因区段连接至9个Jh基因区段。为了包括27个D和9个J区段的所有可能D+J基因组合,设计代表所有可能DJ组合的243(9×27)种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-J-B4-U2-3')(图1),从而包括九个部分,即19碱基对(bp)通用接头(U1);16bp核苷酸标签(B1),其独特识别D基因和J基因区段的每种成对组合。然而,对于这些分子,将300bp V基因特异性序列(V)替换为182bp的D基因特异性序列的区段。该区段包含外显子核苷酸区段和内含子核苷酸区段两者。与其他分子类似,这些分子包括一3碱基对(bp)终止密码子(S);另一拷贝的16bp核苷酸标签(B2);所有分子共有的6bp接合部标签(R);不存在B3;100bp的J基因特异性序列(J);第三拷贝的16bp核苷酸标签(B4);以及19bp通用接头序列(U2)。
使用被设计成退火至通用接头序列(U1,U2;参见表8)的寡核苷酸引物单独地扩增所述243种模板(SEQ ID NO:5579-5821)中的每一者。这些寡核苷酸序列可以是任何通用引物;对于本申请,使用通用引物编码的Nextera。
表10中示出了具有通用接头序列的PCR引物的例子。
表10:具有通用序列(黑体且带下划线)的示例性IgH DJ PCR引物
使用LabChip GXTM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。将243种扩增模板寡核苷酸制备物归一化为标准浓度,然后合并。
为验证所有243种模板寡核苷酸以基本上等摩尔浓度存在,使用Illumina MiSeqTM测序平台根据制造商推荐,对所述库测序。为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中,设计了加尾引物,所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的IlluminaTM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQTM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序,并通过评估每种16bp分子条形码标签(B1)的频率进行分析。
计算243种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.4%的所述组的每个成员,并且希望所有物质的阈值容差为加上或减去十倍频率(0.04%-4.0%)。定量测序表明初始库内的243种接头修饰的模板寡核苷酸物质占比不均匀。
因此,进行单独模板寡核苷酸浓度的调节和定量测序步骤的重复,直到每种分子在阈值容差浓度(0.04–4.0%)内存在。在归一化后,将该组与1116IgH VJ偏倚控制组组合,以获得1359种模板的库。
图10示出了1116种IGH VJ偏倚控制分子和243种IGH DJ偏倚控制分子中的每一者的PCR扩增前测序计数的结果。各偏倚控制分子均沿x轴。所述组包括1116种IGH VJ偏倚控制分子和243种IGH DJ偏倚控制分子,总共1359个gblock。Y轴为每个单独gblock的序列计数。该计算提供对组合物的每个VJ对的扩增前占比的定量。使用该数据估算PCR扩增前样品与PCR扩增后样品之间的频率变化,以计算引物所引入的扩增偏倚。
IgL VJ模板寡核苷酸
在另一个实施例中,生成并分析IgL VJ模板寡核苷酸。使用人的IgL V和J多核苷酸序列设计一组245种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由495碱基对DNA分子组成。IgL模板寡核苷酸以SEQ ID NO:5822-6066示出。IgL模板的245-寡核苷酸组的细节具有代表性并且如下。
基于之前测定的基因组序列,人IgL基因座显示出含有各自具有RSS序列的75个VL区段,因此被视为有能力重排。这些VL区段包括33个已知能被表达的基因区段、被归类为具有开放阅读框的5个V区段、以及37个V假基因。将VL基因区段连接至五个6JL基因区段。为了包括33个功能性V区段和6个J区段的所有可能的功能性且经表达的V+J基因组合,设计了代表所有可能的表达的VJ组合的204(6×33)种模板。此外,V假基因中的两个是可疑的;设计另外12(2×6)种VJ模板,得到总共216种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-J-B4-U2-3')(图1),从而包括九个部分,即19碱基对(bp)通用接头(U1);16bp核苷酸标签(B1),其独特识别V基因和J基因区段的每种成对组合;300bp的V基因特异性序列(V);3bp终止密码子(S);另一拷贝的16bp核苷酸标签(B2);所有分子共有的6bp接合部标签(R);不存在B3;100bp的J基因特异性序列(J);第三拷贝的16bp核苷酸标签(B4);以及19bp的通用接头序列(U2)。
使用被设计成退火至通用接头序列(U1,U2)的寡核苷酸引物单独地扩增所述216种模板中的每一者。这些寡核苷酸序列可以是任何通用引物;对于本申请,使用通用引物编码的Nextera。
使用LabChip GXTM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。将216种扩增模板寡核苷酸制备物归一化为标准浓度,然后合并。
为验证所有216种模板寡核苷酸以基本上等摩尔浓度存在,使用Illumina MiSeqTM测序平台根据制造商推荐,对所述库进行测序。为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中,设计了加尾引物,所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的IlluminaTM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQTM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序,并通过评估每种16bp分子条形码标签(B1)的频率进行分析。
计算216种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.46%的所述组的每个成员,并且希望所有物质的阈值容差为加上或减去十倍频率(0.046%-4.6%)。定量测序表明初始库内的216种接头修饰的模板寡核苷酸物质占比均匀。
IgK VJ模板寡核苷酸
在一个实施例中,生成并分析IgK VJ模板寡核苷酸。使用人的IgK V和J多核苷酸序列设计一组560种由通式(I)表示的模板寡核苷酸。每种模板寡核苷酸由495碱基对DNA分子组成。IgK模板寡核苷酸的例子见于SEQ ID NO:6067-6191。IgK模板的560-寡核苷酸组的细节具有代表性并且如下。
基于之前测定的基因组序列,人IgK基因座显示出含有各自具有RSS序列的112个Vk区段,因此被视为有能力重排。这些112个Vk区段包含已知能被表达的46个基因区段、被归类为具有开放阅读框的8个V区段、以及50个V假基因。对于该IgK,仅分析表达的IgK VJ重排。将归类为假基因的基因和开放阅读框排除在外。将Vk基因区段连接至五个Jk基因区段。这留下了230(46×5)种VJ基因重排。为了包括46个功能性V区段和5个J区段的所有可能的功能性V+J基因组合,设计了代表所有可能的VJ组合的230(5×46)种模板。每种模板符合通式(I)(5'-U1-B1-V-B2-R-J-B4-U2-3')(图1),从而包括九个部分,即19碱基对(bp)通用接头(U1);16bp核苷酸标签(B1),其独特识别V基因和J基因区段的每种成对组合;300bp的V基因特异性序列(V);3bp终止密码子(S);另一拷贝的16bp核苷酸标签(B2);所有分子共有的6bp接合部标签(R);不存在B3;100bp的J基因特异性序列(J);第三拷贝的16bp核苷酸标签(B4);以及19bp通用接头序列(U2)。
使用被设计成退火至通用接头序列(U1,U2)的寡核苷酸引物单独地扩增所述230种模板中的每一者。这些寡核苷酸序列可以是任何通用引物—对于本申请,使用通用引物编码的Nextera。
使用LabChip GXTM毛细管电泳系统(马萨诸塞州霍普金顿的卡利普生命科学公司(Caliper Life Sciences,Inc.,Hopkinton,MA)根据制造商使用说明来定量每种扩增模板寡核苷酸产物的所得浓度。将230种扩增模板寡核苷酸制备物归一化为标准浓度,然后合并。
为验证所有230种模板寡核苷酸以基本上等摩尔浓度存在,使用Illumina MiSeqTM测序平台根据制造商推荐,对所述库测序。简而言之,为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中,设计了加尾引物,所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的IlluminaTM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQTM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序,并通过评估每种16bp分子条形码标签(B1)的频率进行分析。
计算230种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.4%的所述组的每个成员,并且希望所有物质的阈值容差为加上或减去十倍频率(4.0%-0.04%)。定量测序表明初始库内的230种接头修饰的模板寡核苷酸物质占比均匀。
实例7:组合测定法
IgH DJ和IgH VJ组合测定法
在一些实施例中,期望对重排的IgH VDJ CDR3链和重排的IgH DJ链进行共同的扩增和测序。使用IgH DJ和IgH VJ模板生成模板库,以测试组合的IgH DJ和IgH VJ测定法。当合并时,最终库包括1116种VJ模板和243种DJ模板,得到总共1359种单独模板。包含1116种不同模板寡核苷酸的IgH VJ模板组合物在序列表中以SEQ ID NO:4085-5200公开。IgH DJ模板寡核苷酸序列以SEQ ID NO:5579-5821示出。
为验证所有1359种模板寡核苷酸以基本上等摩尔浓度存在,使用IlluminaMiSeqTM测序平台根据制造商推荐,对所述库测序。为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中,设计了加尾引物,所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的IlluminaTM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQTM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序,并通过评估每种16bp分子条形码标签(B1)的频率进行分析。
计算1359种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.073%的所述组的每个成员,并且希望所有物质的阈值容差为加上或减去十倍频率(0.73%-0.0073%)。定量测序表明初始库内的1359种接头修饰的模板寡核苷酸物质占比均匀。
IgL和IgK组合测定
在其他实施例中,期望对重排的IgL和IgK重排CDR3链进行共同扩增和测序。生成模板库以测试组合的IgL和IgK测定法(将IgL和IgK模板组合)。当合并时,最终库包括216种IgL模板和230种IgK模板,总计446种单独模板。IgL模板寡核苷酸以SEQ ID NO:5822-6066示出。
为验证所有446种模板寡核苷酸以基本上等摩尔浓度存在,使用Illumina MiSeqTM测序平台根据制造商推荐,对所述库测序。简而言之,为将平台特异性寡核苷酸序列掺入合并的模板寡核苷酸中,设计了加尾引物,所述加尾引物退火至通用引发位点(U1,U2)并且具有如5'端的IlluminaTM接头序列尾部。然后进行七个循环的PCR反应以将Illumina接头退火至模板寡核苷酸。然后使用XP微珠(加利福尼亚州富勒顿的贝克曼库尔特公司(Beckman Coulter,Inc.,Fullerton,CA))在由制造商所推荐的条件下纯化PCR反应产物混合物。使用Illumina MiSEQTM测序仪(加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.,San Diego,CA))对PCR反应产物开始的29bp测序,并通过评估每种16bp分子条形码标签(B1)的频率进行分析。
计算446种不同模板寡核苷酸的组的基本上等摩尔的制备物以使得含有大约0.22%的所述组的每个成员,并且希望所有物质的阈值容差为加上或减去十倍频率(2.2%-0.022%)。定量测序表明初始库内的446种接头修饰的模板寡核苷酸物质占比均匀。
实例8:修正IGH扩增寡核苷酸引物组中的非均一扩增潜能(PCR偏倚)
设计多样的IgH扩增引物来扩增生物样品中的重排IgH V和J基因区段的每种可能的组合,所述生物样品含有来自受试者的淋巴样细胞DNA。在多重PCR中使用含有等摩尔浓度的多样扩增引物的制备物以扩增多样模板组合物,所述组合物包含等摩尔浓度的根据式(I)的IgH特异性模板寡核苷酸,所述IgH特异性模板寡核苷酸具有至少一种代表IgH基因座的每种可能的V-J组合的模板。对扩增产物进行定量测序,并由独特识别每种V-J组合的每种16bp分子条形码序列(式(I)中的B)的出现频率获得每种独特V-J产物序列的出现频率。
将多重PCR反应设计成扩增IgH基因座的所有可能的V和J基因重排,如通过IMGT合作所标注。参见Yousfi Monod M,Giudicelli V,Chaume D,Lefranc.MP.IMGT/JunctionAnalysis:the first tool for the analysis of the immunoglobulin and Tcell receptor complex V-J and V-D-J JUNCTIONs.Bioinformatics.2004;20(suppl1):i379-i385(Yousfi Monod M、Giudicelli V、Chaume D、Lefranc.MP,“IMGT/结合部分析:对免疫球蛋白和T细胞受体的复杂V-J和V-D-J接合部进行分析的第一工具”,《生物信息学》,2004年,第20卷(增刊1),第i379-i385页)。基因座包括126个独特的V基因;52个功能基因、缺乏对功能关键的氨基酸的6个推定的开放阅读框和69个假基因;以及9个J基因、6个功能基因和3个假基因。对于一些V区段,用于引物退火的靶序列是相同的,从而允许用86种独特正向引物扩增所有126个V区段。相似地,7种独特反向引物退火至所有9个J基因。使用86种V正向引物(VF;对于V基因具有特异性)的等摩尔库和7种J反向引物(JR;对于J基因具有特异性)的等摩尔库扩增1116种模板的库,作为偏倚评估的基线。
以2.0μM VF、2.0μM JR库(集成DNA技术公司(Integrated DNA Technologies))、1μM QIAGEN Multiplex Plus PCR预混液(加利福尼亚州瓦伦西亚的凯杰公司(QIAGEN,Valencia,CA))、10%Q-溶液(凯杰公司(QIAGEN))和来自我们的合成IgH组库混合物的200,000个靶分子设置聚合酶链式反应(PCR)(各25μL)。在C100热循环仪(加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA))中使用下列热循环条件:95℃下6分钟循环一次,95℃下30秒、64℃下120秒和72℃下90秒循环31次,然后72℃下3分钟循环一次。对于所有实验,将每种PCR条件重复三次。
在初始的偏倚评估后,进行实验以限定所有单独的引物扩增特性。为了测定VF和JR引物的特异性,制备含有单种VF引物与所有JR引物的86种混合物,以及含有单种JR引物与所有VF引物的7种混合物。使用这些引物组来扩增合成模板,并对所得文库进行测序,以便测量每种引物就靶标V或J基因区段而言的特异性,以及以便识别非靶标引发的情况。在所有其他等摩尔引物的环境中使用2倍和4倍浓度的每个单独的VF或JF的库(如,2x倍IgHV1-01+所有其他等摩尔VF和JR引物)执行滴定实验,以估算使引物浓度与观察到的模板频率相关的比例因子。
引物混合物优化
使用通过滴定引物(每次一种)导出的比例因子,开发出替代引物混合物,其中引物以不均匀的浓度组合以将扩增偏倚降至最低。随后使用改进的引物混合物来扩增模板库并测量残余扩增偏倚。重复迭代进行该过程,从而基于被该引物扩增的模板在上一轮的结果中是占比过高还是占比过低而适当地降低或增加每种引物浓度。在该迭代过程的每个阶段,通过计算动态范围(最大偏倚/最小偏倚)以及平方和(SS,基于log(偏倚)值计算)的量度来测定扩增偏倚的总程度,并且迭代进行调节引物浓度的过程,直到在迭代之间存在最低限度的改善。为了由等摩尔模板输入评估最终优化引物混合物的稳健性以及偏差的比例因子,我们使用IgH参考模板的高度不均匀混合物来测定对测序输出的影响。最终混合物显著优于等摩尔混合物。
实例9:修正TCRB扩增寡核苷酸引物组中的非均一扩增潜能(PCR偏倚)
设计多样的TCRB扩增引物来扩增生物样品中的重排TCRB V和J基因区段的每种可能的组合,所述生物样品含有来自受试者的淋巴样细胞DNA。在多重PCR中使用含有等摩尔浓度的多样扩增引物的制备物以扩增多样模板组合物,所述组合物包含等摩尔浓度的根据式(I)的TCRB特异性模板寡核苷酸,所述特异性模板寡核苷酸具有至少一个代表TCRB基因座的每种可能的V-J组合的模板。对扩增产物进行定量测序,并由独特识别每种V-J组合的每种16bp分子条形码序列(式(I)中的B)的出现频率获得每种独特V-J产物序列的出现频率。
将多重PCR反应设计成扩增TCRB基因座的所有可能V和J基因重排,如通过IMGT合作所标注。参见Yousfi Monod M,Giudicelli V,Chaume D,Lefranc.MP.IMGT/JunctionAnalysis:the first tool for the analysis of the immunoglobulin and Tcell receptor complex V-J and V-D-J JUNCTIONs.Bioinformatics.2004;20(suppl1):i379-i385(Yousfi Monod M、Giudicelli V、Chaume D、Lefranc.MP,“IMGT/结合部分析:对免疫球蛋白和T细胞受体的复杂V-J和V-D-J接合部进行分析的第一工具”,《生物信息学》,2004年,第20卷(增刊1),第i379-i385页)。基因座包括67个独特的V基因。对于一些V区段,用于引物退火的靶序列是相同的,从而允许我们用60种独特正向引物扩增所有67个V区段。对于J基因座而言,13种独特的反向引物退火至13个J基因。使用60种V正向引物(VF;对于V基因具有特异性)的等摩尔库和13种J反向引物(JR;对于J基因具有特异性)的等摩尔库扩增868种模板的库,作为偏倚评估的基线。以3.0μM VF、3.0μM JR库(集成DNA技术公司(Integrated DNA Technologies))、1μM QIAGEN Multiplex Plus PCR预混液(加利福尼亚州瓦伦西亚的凯杰公司(QIAGEN,Valencia,CA))、10%Q-溶液(凯杰公司(QIAGEN))和来自我们的合成TCRB组库混合物的200,000个靶分子设置聚合酶链式反应(PCR)(各25μL)。在C100热循环仪(加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA))中使用下列热循环条件:95℃下5分钟循环一次,95℃下30秒、62℃下90秒和72℃下90秒循环31次,然后72℃下3分钟循环一次。对于所有实验,将每种PCR条件重复三次。
在初始的偏倚评估后,进行实验以限定所有单独的引物扩增特性。为了测定我们的VF和JR引物的特异性,制备含有单种VF引物与所有JR引物的60种混合物,以及含有单种JR引物与所有VF引物的13种混合物。使用这些引物组来扩增合成模板,并对所得文库进行测序,以便测量每种引物就靶标V或J基因区段而言的特异性,以及以便识别非靶标引发的情况。在所有其他等摩尔引物的环境中使用2倍和4倍浓度的每个单独的VF或JF的库(如,2x倍IgHV1-01+所有其他等摩尔VF和JR引物)执行滴定实验,以使我们能够估算使引物浓度与观察到的模板频率相关的比例因子。
引物混合物优化
使用通过滴定引物(每次一种)导出的比例因子,开发出替代引物混合物,其中引物以不均匀的浓度组合以将扩增偏倚降至最低。随后使用改进的引物混合物来扩增模板库并测量残余扩增偏倚。迭代进行该过程,从而基于被该引物扩增的模板在上一轮的结果中是占比过高还是占比过低而适当地降低或增加每种引物浓度。在该迭代过程的每个阶段,通过计算动态范围(最大偏倚/最小偏倚)以及平方和(SS,基于log(偏倚)值计算)的量度来测定扩增偏倚的总程度,并且迭代进行调节引物浓度的过程,直到在迭代之间存在最低限度的改善。最终混合物显著优于引物的等摩尔混合物。
图11示出了针对相对扩增偏倚作图的合成TCRB VJ模板的TCRB引物迭代。在化学偏倚控制修正之前(等摩尔引物(黑色))、化学修正后(优化引物(深灰色))以及化学和计算修正后(在计算调节之后(浅灰色))测定858种合成TCRB VJ模板的相对扩增偏倚。等摩尔引物的动态范围为264,四分位距为0.841,并且log(偏倚)的平方和为132。优化引物的动态范围为147,四分位距为0.581,并且log(偏倚)的平方和为50.7。修正引物(在计算调节之后)的动态范围为90.8,四分位距为0.248,并且log(偏倚)的平方和为12.8。
实例10:修正组合的IGH VJ和DJ扩增寡核苷酸引物组中的非均一扩增潜能(PCR偏 倚)
设计多样的IgH扩增引物来扩增生物样品中的重排IgH V和J基因区段以及IgH D和J基因区段的每种可能的组合,所述生物样品含有来自受试者的淋巴样细胞DNA。在多重PCR中使用含有等摩尔浓度的多样扩增引物的制备物以扩增多样模板组合物,所述组合物包含等摩尔浓度的根据式(I)的IgH特异性模板寡核苷酸,所述IgH特异性模板寡核苷酸具有至少一种代表IgH基因座的每种可能的V-J组合以及IgH基因座的每种可能D-J组合的模板。对扩增产物进行定量测序,并由独特识别每种V-J和D-J组合的每种16bp分子条形码序列(式(I)中的B)的出现频率获得每种独特V-J和D-J产物序列的出现频率。
将多重PCR反应设计成扩增IgH基因座的所有可能V和J基因重排以及D和J基因重排,如通过IMGT合作所标注。基因座包括126个独特V基因;52个功能基因、缺乏对功能关键的氨基酸的6个推定的开放阅读框和69个假基因;以及9个J基因、6个功能和3个假基因。基因座还包括27个独特D基因。对于一些V区段,用于引物退火的靶序列是相同的,从而允许用86种独特正向引物扩增所有126个V区段。相似地,7种独特反向引物退火至所有9个J基因。对于D-J测定而言,引物被设计成退火至重排的–DJ杆。在B细胞发育期间,两个等位基因均经历D与J基因区段之间的重排,从而产生两个–DJ杆。–DJ杆包括J基因、一个N区和D基因。在DJ重排后,两个等位基因中的一个即V基因与–DJ杆一起重排,以编码CDR3基因区(VnDnJ)。为了扩增–DJ杆,将27种独特引物设计成退火至D基因外显子的内含子区域上游中的每个特异性D基因。这些区段虽然存在于–DJ杆中,但在V至-DJ重组后被切除。然而,未对J引物进行重新设计;DJ测定使用与VJ测定相同的J引物。
使用86种V正向引物(VF;对于V基因具有特异性)、27种D正向引物(DF;对于D基因具有特异性)的优化(混合物2-1)库和7种J反向引物(JR;对于J基因具有特异性)的等摩尔库扩增1359种模板的库,作为偏倚评估的基线。以1.0μM VF、1.0μM DF、2.0μM JR库(集成DNA技术公司(Integrated DNA Technologies))、1X QIAGEN Multiplex Plus PCR预混液(加利福尼亚州瓦伦西亚的凯杰公司(QIAGEN,Valencia,CA))、10%Q-溶液(凯杰公司(QIAGEN))和来自我们的合成IgH VJ和DJ组库混合物的200,000个靶分子设置聚合酶链式反应(PCR)(各25μL)。在C100热循环仪(加利福尼亚州赫拉克勒斯的伯乐实验室公司(Bio-Rad Laboratories,Hercules,CA))中使用下列热循环条件:95℃下6分钟循环一次,95℃下30秒、64℃下120秒和72℃下90秒循环31次,然后72℃下3分钟循环一次。对于所有实验,将每种PCR条件重复三次。
在初始的偏倚评估后,进行实验以限定所有单独的引物扩增特性。为了测定我们的DF和JR引物的特异性,制备含有单种DF引物与所有JR引物以及此前识别的优化VF库的27种混合物,以及含有单种JR引物与所有VF和DF引物的7种混合物。使用这些引物组来扩增合成模板,并对所得文库进行测序,以便测量每种引物就靶标V、D或J基因区段而言的特异性,以及以便识别非靶标引发的情况。
在所有其他引物—包括VF引物的优化混合物的环境内使用2倍和4倍浓度的每种单独的DF或JF的库(如,2x倍IgHD2-08+所有其他等摩尔DF、最佳VF的混合物,和JR引物)执行滴定实验,以使我们能够估算使引物浓度与观察到的模板频率相关的比例因子。
引物混合物优化
使用交叉扩增测试,DF引物被识别为发生交叉扩增。移除DF引物中的12种,从而导致最终库具有15种DF引物。使用通过滴定引物(每次一种)导出的比例因子,开发出替代引物混合物,其中引物以不均匀的浓度组合以将扩增偏倚降至最低。随后使用改进的引物混合物来扩增模板库并测量残余扩增偏倚。迭代进行该过程,从而基于被该引物扩增的模板在上一轮的结果中是占比过高还是占比过低而适当地降低或增加每种引物浓度。在该迭代过程的每个阶段,通过计算动态范围(最大偏倚/最小偏倚)以及平方和(SS,基于log(偏倚)值计算)的量度来测定扩增偏倚的总程度,并且迭代进行调节引物浓度的过程,直到在迭代之间存在最低限度的改善。最终的引物混合物具有比等摩尔引物混合物显著低的引物偏倚。
图12示出了针对相对扩增偏倚作图的合成IGH VJ模板的IGH引物迭代。在化学偏倚控制修正之前(等摩尔引物(黑色))、化学修正后(优化引物(深灰色))以及化学和计算修正后(在计算算计计算调节之后(浅灰色))测定1116种合成IGH VJ模板的相对扩增偏倚。等摩尔引物的动态范围为1130,四分位距为0.991,并且log(偏倚)的平方和为233。优化引物的动态范围为129,四分位距为0.732,并且log(偏倚)的平方和为88.2。计算调节之后的引物的动态范围为76.9,四分位距为0.545,并且log(偏倚)的平方和为37.9。
图13示出了V基因的27种合成IGH DJ模板的相对扩增偏倚。V基因区段的相对扩增偏倚在三次引物迭代中示出:1)在化学偏倚控制修正之前(黑色),2)化学修正的第一次迭代(白色),以及3)化学修正的第二次迭代后(浅灰色)。
实例11:TCRG VJ引物迭代
在其他实施例中,测试TCRG VJ引物在多次引物迭代中的相对扩增偏倚。图14a-d示出了55种合成TCRG VJ模板的TCRG引物迭代。在化学偏倚控制修正(图14a)、化学修正的第一次迭代(图14b)、化学修正的第二次迭代(图14c)和化学修正的最后迭代(图14d)之前测定TCRG VJ引物的相对扩增偏倚。
实例12:替代性的偏倚控制和加标方法
在其他实施例中,可使用替代方法来测定扩增偏倚。所述方法的两个主要目标如下:(1)消除BCR或TCR基因的多重PCR扩增中的扩增偏倚,和(2)估算起始模板中的B或T细胞分数。
所述方法包括从一组细胞开始,所述细胞包含从包含B和/或T细胞的样品提取的DNA或cDNA(mRNA)。在包含细胞的样品中,使用本领域中的标准方法提取DNA。
将提取的DNA分为多份,并放入不同的PCR孔中。在一些实施例中,使用一个孔的全容量,或可以使用数千个孔。在一个实施例中,针对PCR使用188个孔(两个96孔板)。每个孔中的TCR或BCR模板的数量应当稀少,使得在同一个孔中很难具有来自同一克隆型的多种分子。
所述方法随后包括使用同一组多重引物分别在每个孔中对DNA进行扩增。可使用本文所述的多组引物。如上所述,将条编码方法应用于每个孔中具有相同条形码序列的扩增分子。例如,每个孔获得其自身的条形码。
随后在高通量测序机器上对所述分子测序,所述测序机具有足量的扩增BCR或TCR序列,以通过序列识别所使用的V和J链,以及条形码序列。
每个孔具有平均拷贝数。由于每种克隆型在孔中出现一次,所以该模板相对于平均值的量是该V-J组合的偏倚。由于V和J偏倚是独立的,所以不必使用每种V-J组合来测定偏倚。随后使用这些相对偏倚来要么重新设计扩增严重不足或扩增严重过度的引物,要么对引物浓度进行滴定以增大或减小扩增。整个过程使用新的一批引物重复,并迭代以继续减小偏倚。
在任何迭代循环之后,可应用一组计算因子(相对扩增因子)来消除偏倚。可通过引物变化和/或计算修正来减小偏倚。
所述方法包括由类似的测定计算有核细胞的分数。对于每个孔,识别每种克隆型,并针对每个克隆确定测序读段的数量。在一些实施例中,模板的数量无需稀少。通过如上所述的偏倚控制因子修正每个克隆的读段计数。
生成经修正读段计数的柱状图,并且该图具有主要模式(扩增因子)。该模式通过检测(基于对第一大峰的识别)、或通过傅里叶变换或其他已知方法来识别。
将每个孔中的经修正读段的总数量除以该孔的扩增因子。这是处于所述孔中的TCR或BCR基因组模板的估算数量。来自样品的BCR或TCR的总数量为来自所有孔的数量的总和。在PCR之前测量每个孔中的基因组总数量。这可通过纳米微滴(nanodrop)或用于定量DNA的其他已知方法来完成。将DNA的测得重量除以双链基因组的重量(例如,在人体中为约6.2皮克)。
样品中的B细胞或T细胞的分数是将样品中BCR或TCR的总数量除以添加至反应的双链DNA分子的总数量。结果需要细微的修正,因为一小部分T细胞的两个等位基因均发生了重排。该修正因子对于αβT细胞为大约15%,对于B细胞为大约10%。对于γδT细胞,几乎全部细胞的两个等位基因均发生了重排,使得修正因子为2。
这些另外的方法可测定BCR或TCR基因的多重PCR扩增中的扩增偏倚,并用于估算起始模板中的B或T细胞的分数。
可将上文所述的各种实施例组合,以提供另外的实施例。本说明书中提及的和/或申请资料表中列出的所有美国专利、美国专利申请公布、美国专利申请、国外专利、国外专利申请和非专利出版物均全文以引用方式并入本文。如果有必要,可修改实施例的各方面以采用各种专利、申请和出版物的概念,从而提供另外的实施例。
可根据以上具体实施方式对实施例进行这些和其他更改。一般来讲,在以下权利要求书中,所用的术语不应解释为将权利要求限制于本说明书和权利要求书中所公开的具体实施例,而应解释为包括所有可能的实施例,连同此类权利要求赋予其权利的等同物的整个范围。因此,权利要求书不受本公开限制。
非正式的序列表
hs-IgH-DJ的偏倚控制序列(243种序列)
hs-IGL的偏倚控制序列
hs-IgK的偏倚控制序列
hs-TCRB-P10的引物序列
hs-IGH-D的引物序列
IGK和IGL的引物序列

Claims (15)

1.一种用于测定一组寡核苷酸引物的成员中的非均一核酸扩增潜能的方法,所述一组寡核苷酸引物能够扩增生物样品中编码一种或多种适应性免疫受体的重排核酸分子,所述生物样品包含来自哺乳动物受试者的淋巴样细胞的重排核酸分子,所述方法包括:
(a)在多重PCR反应中使用所述寡核苷酸引物组扩增包含多种模板寡核苷酸的组合物,以获得多种扩增的模板寡核苷酸,其中各模板寡核苷酸沿5’-3’方向包含:
(i)包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20个且不超过1000个连续核苷酸的V寡核苷酸序列,并且每种V寡核苷酸包含独特的V区寡核苷酸序列,和
(ii)包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15个且不超过600个连续核苷酸的J寡核苷酸序列,并且每种J寡核苷酸序列包含独特的J区寡核苷酸序列;
和其中各模板寡核苷酸进一步包含一个或多个随机寡核苷酸序列;
且其中所述多种模板寡核苷酸包含至少a种或至少b种独特寡核苷酸序列,以较大者为准,其中a是所述受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是所述受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对每种独特V区寡核苷酸的模板寡核苷酸和至少一种针对每种独特J区核苷酸的模板寡核苷酸;
(b)对所述多种扩增的模板寡核苷酸进行测序,以对构成所述多种的每种独特模板寡核苷酸测定
(i)模板寡核苷酸序列,和
(ii)所述模板寡核苷酸序列的出现频率;以及
(c)将每种所述模板寡核苷酸序列的出现频率与预期分布进行比较,其中所述预期分布基于构成所述组合物的所述多种模板寡核苷酸的预定摩尔比,并且其中所述模板寡核苷酸序列的所述出现频率与所述预期分布之间的偏差指示所述寡核苷酸扩增引物组的成员间的非均一核酸扩增潜能。
2.根据权利要求1所述的方法,其中所述预定摩尔比是等摩尔。
3.根据权利要求1所述的方法,其中所述预期分布包括由所述寡核苷酸引物组扩增的所述多种模板寡核苷酸组的均一扩增水平。
4.根据权利要求1-3中任一项所述的方法,还包括对于相对于所述预期分布呈现非均一扩增潜能的所述寡核苷酸引物组的每个成员,调节所述寡核苷酸扩增引物组中的所述寡核苷酸引物成员的相对占比。
5.根据权利要求4所述的方法,其中调节:(a)包括增加所述寡核苷酸引物组中的所述成员的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能;或(b)降低所述寡核苷酸引物组中的所述成员的相对占比,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
6.根据权利要求1-5中任一项所述的方法,还包括对于相对于所述预期分布呈现非均一扩增潜能的所述寡核苷酸扩增引物组的每个成员,计算所述扩增的模板核酸分子的成比例增加或减小的出现频率,从而修正所述寡核苷酸引物组的成员间的非均一核酸扩增潜能。
7.根据权利要求1-6中任一项所述的方法,其中每种扩增的模板核酸分子的长度小于1000、900、800、700、600、500、400、300、200、100、90、80或70个核苷酸。
8.根据权利要求1-7中任一项所述的方法,其中所述寡核苷酸引物组不包括特异性杂交至V区假基因或孤独基因或者杂交至J区假基因或孤独基因的寡核苷酸引物。
9.根据权利要求1-8中任一项所述的方法,其中所述多种模板寡核苷酸各自包含如下通式的寡核苷酸序列:
5'-U1-B1-V-B2-R-B3-J-B4-U2-3' [I]
其中:
(a)V是包含适应性免疫受体可变(V)区编码基因序列或其互补序列的至少20个且不超过1000个连续核苷酸的寡核苷酸序列,并且每种V包含独特的V区寡核苷酸序列;
(b)J是包含适应性免疫受体连接(J)区编码基因序列或其互补序列的至少15个且不超过600个连续核苷酸的寡核苷酸序列,并且每种J包含独特的J区寡核苷酸序列;
(c)U1要么不存在,要么包含选自如下的寡核苷酸序列:(i)第一通用接头寡核苷酸序列和(ii)连接至第一通用接头寡核苷酸序列并位于其5'端的第一测序平台特异性寡核苷酸序列;
(d)U2要么不存在,要么包含选自如下的寡核苷酸序列:(i)第二通用接头寡核苷酸序列和(ii)连接至第二通用接头寡核苷酸序列并位于其5'端的第二测序平台特异性寡核苷酸序列;
(e)B1、B2、B3和B4中的至少一个存在,且B1、B2、B3和B4各包含寡核苷酸,所述寡核苷酸包含具有3-25个连续核苷酸的条形码序列,其独特地识别作为成对组合的(i)(a)的独特V区寡核苷酸序列和(ii)(b)的独特J区寡核苷酸序列;
(f)R要么不存在,要么包含具有不存在于(a)-(e)中的寡核苷酸序列的限制性酶识别位点;及
(g)一个或多个随机寡核苷酸序列位于通式I的组分之间或之内。
10.根据权利要求9所述的组合物,其中每个模板寡核苷酸还包含V与B2之间的终止密码子序列。
11.根据权利要求1-10中任一项所述的方法,其中:
(a)a的范围为1至所述受试者的哺乳动物基因组中V基因区段的最大数量的数;
(b)b的范围为1至所述受试者的哺乳动物基因组中J基因区段的最大数量的数;或
(c)所述多种模板寡核苷酸包含至少(a×b)种独特的寡核苷酸序列,其中a是所述哺乳动物受试者中的独特适应性免疫受体V区编码基因区段的数量并且b是所述哺乳动物受试者中的独特适应性免疫受体J区编码基因区段的数量,并且所述组合物包含至少一种针对V区编码基因区段和J区编码基因区段的每种可能组合的模板寡核苷酸。
12.根据权利要求1-11中任一项所述的方法,其中:
(a)所述J寡核苷酸序列包含所述适应性免疫受体J区编码基因序列的恒定区;
(b)所述V寡核苷酸序列包含所述适应性免疫受体V区编码基因序列或其互补序列的至少30个连续核苷酸;
(c)所述V寡核苷酸序列包含适应性免疫受体V区编码基因序列或其互补序列的不超过900、800、700、600或500个连续核苷酸;
(d)所述J寡核苷酸序列包含适应性免疫受体J区编码基因序列或其互补序列的至少16个连续核苷酸的多核苷酸;或
(e)所述J寡核苷酸序列包含适应性免疫受体J区编码基因序列或其互补序列的不超过500个连续核苷酸。
13.根据权利要求1-12中任一项所述的方法,其中所述一种或多种适应性免疫受体选自TCRB、TCRG、TCRA、TCRD、IGH、IGK和IGL。
14.根据权利要求1-13中任一项所述的方法,其中:(a)所述V寡核苷酸序列编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体V区多肽;或(b)所述J寡核苷酸序列编码TCRB、TCRG、TCRA、TCRD、IGH、IGK或IGL受体J区多肽。
15.根据权利要求1-14中任一项所述的方法,其中每种模板寡核苷酸的长度小于1000、900、800、700、600、500、400、300或200个核苷酸。
CN201710813227.1A 2012-05-08 2013-05-08 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法 Active CN107586832B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261644294P 2012-05-08 2012-05-08
US61/644,294 2012-05-08
US201261726489P 2012-11-14 2012-11-14
US61/726,489 2012-11-14
CN201380022986.6A CN104520440B (zh) 2012-05-08 2013-05-08 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380022986.6A Division CN104520440B (zh) 2012-05-08 2013-05-08 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法

Publications (2)

Publication Number Publication Date
CN107586832A true CN107586832A (zh) 2018-01-16
CN107586832B CN107586832B (zh) 2021-03-30

Family

ID=48444646

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201710813227.1A Active CN107586832B (zh) 2012-05-08 2013-05-08 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法
CN201380022986.6A Active CN104520440B (zh) 2012-05-08 2013-05-08 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201380022986.6A Active CN104520440B (zh) 2012-05-08 2013-05-08 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法

Country Status (21)

Country Link
US (4) US9150905B2 (zh)
EP (2) EP3091089B1 (zh)
JP (2) JP5756247B1 (zh)
KR (1) KR101621643B1 (zh)
CN (2) CN107586832B (zh)
AU (2) AU2013259544B9 (zh)
BR (1) BR112014027309A2 (zh)
CA (1) CA2872468C (zh)
CY (1) CY1117899T1 (zh)
DK (1) DK2831276T3 (zh)
ES (2) ES2711156T3 (zh)
HK (1) HK1206789A1 (zh)
HU (1) HUE029357T2 (zh)
IL (1) IL235417A0 (zh)
MX (1) MX354329B (zh)
PL (1) PL2831276T3 (zh)
PT (1) PT2831276T (zh)
RU (1) RU2631797C2 (zh)
SG (2) SG10201507700VA (zh)
UA (1) UA115783C2 (zh)
WO (1) WO2013169957A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111850016A (zh) * 2020-07-06 2020-10-30 深圳泛因医学有限公司 免疫组库标准物质序列及其设计方法和应用

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
EP4335932A2 (en) 2008-11-07 2024-03-13 Adaptive Biotechnologies Corporation Methods of monitoring conditions by sequence analysis
PT2387627E (pt) 2009-01-15 2016-06-03 Adaptive Biotechnologies Corp Determinação do perfil de imunidade adaptativa e métodos de geração de anticorpos monoclonais
EP3409792B1 (en) 2009-06-25 2023-09-20 Fred Hutchinson Cancer Center Method of measuring adaptive immunity
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
US9279159B2 (en) 2011-10-21 2016-03-08 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
AU2012347460B2 (en) 2011-12-09 2017-05-25 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
ES2663234T3 (es) 2012-02-27 2018-04-11 Cellular Research, Inc Composiciones y kits para recuento molecular
JP6302847B2 (ja) 2012-03-05 2018-03-28 アダプティヴ バイオテクノロジーズ コーポレーション 頻度が一致したサブユニットからの、対をなす免疫受容体鎖の決定
CN107586832B (zh) 2012-05-08 2021-03-30 适应生物技术公司 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法
CA2886647A1 (en) 2012-10-01 2014-04-10 Adaptive Biotechnologies Corporation Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
EP3842542A1 (en) 2013-08-28 2021-06-30 Becton, Dickinson and Company Massively parallel single cell analysis
JP6164759B2 (ja) 2013-11-21 2017-07-19 Repertoire Genesis株式会社 T細胞受容体およびb細胞受容体レパトアの解析システムならびにその治療および診断への利用
EP3114240B1 (en) 2014-03-05 2019-07-24 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
JP2017511151A (ja) * 2014-03-14 2017-04-20 イムノコア リミテッド Tcrライブラリ
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
ES2777529T3 (es) * 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
CN105331680B (zh) * 2014-08-15 2018-09-14 深圳华大基因科技有限公司 确定可变区扩增引物是否存在偏向性的方法和装置及其应用
EP3212790B1 (en) 2014-10-29 2020-03-25 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
EP3498866A1 (en) 2014-11-25 2019-06-19 Adaptive Biotechnologies Corp. Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
US11047008B2 (en) 2015-02-24 2021-06-29 Adaptive Biotechnologies Corporation Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
WO2016138496A1 (en) 2015-02-27 2016-09-01 Cellular Research, Inc. Spatially addressable molecular barcoding
WO2016160844A2 (en) 2015-03-30 2016-10-06 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
WO2016161273A1 (en) 2015-04-01 2016-10-06 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target
EP3286326A1 (en) 2015-04-23 2018-02-28 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US11124823B2 (en) 2015-06-01 2021-09-21 Becton, Dickinson And Company Methods for RNA quantification
CN108026524A (zh) 2015-09-11 2018-05-11 赛卢拉研究公司 用于核酸文库标准化的方法和组合物
GB201516272D0 (en) 2015-09-15 2015-10-28 Adaptimmune Ltd And Immunocore Ltd TCR Libraries
GB201516277D0 (en) 2015-09-15 2015-10-28 Adaptimmune Ltd And Immunocore Ltd TCR libraries
CN109072288A (zh) * 2016-05-02 2018-12-21 赛卢拉研究公司 精确的分子条形编码
EP3452618A4 (en) 2016-05-06 2019-12-11 Regents of the University of Minnesota ANALYTICAL STANDARDS AND METHOD FOR USE THEREOF
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
CN106047857B (zh) * 2016-06-01 2020-04-03 苏州金唯智生物科技有限公司 一种发掘特异性功能抗体的方法
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
SG11201901733PA (en) 2016-09-26 2019-04-29 Cellular Res Inc Measurement of protein expression using reagents with barcoded oligonucleotide sequences
CN107955831A (zh) * 2016-10-13 2018-04-24 深圳华大基因研究院 用于淋巴细胞定量检测的标记物和淋巴细胞定量检测方法
ES2870639T3 (es) 2016-10-24 2021-10-27 Geneinfosec Inc Ocultación de información presente en los ácidos nucleicos
EP3577232A1 (en) 2017-02-01 2019-12-11 Cellular Research, Inc. Selective amplification using blocking oligonucleotides
AU2018281745B2 (en) 2017-06-05 2022-05-19 Becton, Dickinson And Company Sample indexing for single cells
CN109136346A (zh) * 2017-06-16 2019-01-04 深圳华大基因股份有限公司 一种提高免疫组库多重pcr建库质量的方法及其应用
CN107312863A (zh) * 2017-08-08 2017-11-03 深圳华大基因研究院 利用数字PCR鉴定B淋巴细胞的Ig基因分布的方法
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
CN111492068A (zh) 2017-12-19 2020-08-04 贝克顿迪金森公司 与寡核苷酸相关联的颗粒
WO2019161031A1 (en) * 2018-02-15 2019-08-22 Papgene, Inc. Barcoded molecular standards
US11365409B2 (en) 2018-05-03 2022-06-21 Becton, Dickinson And Company Molecular barcoding on opposite transcript ends
ES2945191T3 (es) 2018-05-03 2023-06-29 Becton Dickinson Co Análisis de muestras multiómicas de alto rendimiento
CN112805389A (zh) 2018-10-01 2021-05-14 贝克顿迪金森公司 确定5’转录物序列
WO2020097315A1 (en) 2018-11-08 2020-05-14 Cellular Research, Inc. Whole transcriptome analysis of single cells using random priming
WO2020123384A1 (en) 2018-12-13 2020-06-18 Cellular Research, Inc. Selective extension in single cell whole transcriptome analysis
WO2020150356A1 (en) 2019-01-16 2020-07-23 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
EP3914728B1 (en) 2019-01-23 2023-04-05 Becton, Dickinson and Company Oligonucleotides associated with antibodies
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
CN111139286B (zh) * 2019-11-07 2023-11-21 南方医科大学南方医院 一种bcr高通量测序文库的构建方法
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
US11365411B2 (en) 2020-01-21 2022-06-21 Microsoft Technology Licensing, Llc Efficient random access to DNA-encoded data
CN115605614A (zh) 2020-05-14 2023-01-13 贝克顿迪金森公司(Us) 用于免疫组库谱分析的引物
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
EP4247967A1 (en) 2020-11-20 2023-09-27 Becton, Dickinson and Company Profiling of highly expressed and lowly expressed proteins
CN112322716B (zh) * 2020-11-25 2021-07-30 深圳泛因医学有限公司 基于tcr/bcr高通量测序的特定淋巴细胞含量分析方法及装置
US20230407387A1 (en) * 2022-06-17 2023-12-21 Insitro, Inc. In situ sequencing of rna transcripts with non-uniform 5 prime ends
WO2024064736A1 (en) * 2022-09-20 2024-03-28 New England Biolabs, Inc. Methods for characterizing an immune response repertoire
CN115976221B (zh) * 2023-03-21 2023-05-23 迈杰转化医学研究(苏州)有限公司 一种用于bcr或tcr重排定量检测的内掺参考物及其制备方法和应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101292044A (zh) * 2005-08-12 2008-10-22 新加坡科技研究局 寡核苷酸设计和/或核酸检测的方法和/或装置
WO2010053587A2 (en) * 2008-11-07 2010-05-14 Mlc Dx Incorporated Methods of monitoring conditions by sequence analysis
WO2010151416A1 (en) * 2009-06-25 2010-12-29 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity

Family Cites Families (378)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3270960A (en) 1964-09-11 1966-09-06 Sperry Rand Corp Fluid sensor
US3773919A (en) 1969-10-23 1973-11-20 Du Pont Polylactide-drug mixtures
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
DE3211263A1 (de) 1981-03-31 1983-01-27 Otsuka Pharmaceutical Co. Ltd., Tokyo Human-interferon verwandte peptide, antigene und antikoerper, sowie verfahren zu deren herstellung
DE3238353A1 (de) 1982-10-15 1984-04-19 Max Planck Gesellschaft zur Förderung der Wissenschaften e.V., 3400 Göttingen Verfahren zur simultanen quantitativen bestimmung der blutzellen und reagenz hierfuer
US5189147A (en) 1984-06-13 1993-02-23 Massachusetts Institute Of Technology Meterodimeric T lymphocyte receptor antibody
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
DE3541033A1 (de) 1985-11-19 1987-05-21 Boehringer Mannheim Gmbh Verfahren zur quantifizierung von zellpopulationen bzw. subpopulationen sowie hierfuer geeignetes reagenz
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US5149625A (en) 1987-08-11 1992-09-22 President And Fellows Of Harvard College Multiplex analysis of DNA
US4942124A (en) 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
US5667967A (en) 1990-05-01 1997-09-16 The Board Of Trustees Of The Leland Stanford Junior University T-cell receptor varible transcripts as disease related markers
US6031091A (en) 1987-09-21 2000-02-29 Gen-Probe Incorporated Non-nucleotide linking reagents for nucleotide probes
US5506126A (en) 1988-02-25 1996-04-09 The General Hospital Corporation Rapid immunoselection cloning method
US5168038A (en) 1988-06-17 1992-12-01 The Board Of Trustees Of The Leland Stanford Junior University In situ transcription in cells and tissues
US5296351A (en) 1988-10-20 1994-03-22 Alexander A. Morley Method for diagnosis of monoclonality in leukaemia and lymphoma
US5075217A (en) 1989-04-21 1991-12-24 Marshfield Clinic Length polymorphisms in (dC-dA)n ·(dG-dT)n sequences
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5231012A (en) 1989-06-28 1993-07-27 Schering Corporation Nucleic acids encoding cytokine synthesis inhibitory factor (interleukin-10)
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5336598A (en) 1989-11-15 1994-08-09 National Jewish Center For Immunology And Respiratory Medicine Method for diagnosing a superantigen caused pathologial condition via assay of T-cells
US5298396A (en) 1989-11-15 1994-03-29 National Jewish Center For Immunology And Respiratory Medicine Method for identifying T cells disease involved in autoimmune disease
US6054034A (en) 1990-02-28 2000-04-25 Aclara Biosciences, Inc. Acrylic microchannels and their use in electrophoretic applications
US5126022A (en) 1990-02-28 1992-06-30 Soane Tecnologies, Inc. Method and device for moving molecules by the application of a plurality of electrical fields
GB9015198D0 (en) 1990-07-10 1990-08-29 Brien Caroline J O Binding substance
US6916605B1 (en) 1990-07-10 2005-07-12 Medical Research Council Methods for producing members of specific binding pairs
WO1992002551A1 (en) 1990-08-02 1992-02-20 B.R. Centre Limited Methods for the production of proteins with a desired function
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
IE76732B1 (en) 1990-08-07 1997-11-05 Becton Dickinson Co One step test for absolute counts
US5699798A (en) 1990-08-10 1997-12-23 University Of Washington Method for optically imaging solid tumor tissue
US5635354A (en) 1991-01-09 1997-06-03 Institut National De La Sante Et De La Recherche Medicale (Inserm) Method for describing the repertoires of antibodies (Ab) and of T-cell receptors (TcR) of an individual's immune system
US5364759B2 (en) 1991-01-31 1999-07-20 Baylor College Medicine Dna typing with short tandem repeat polymorphisms and identification of polymorphic short tandem repeats
WO1992013950A2 (fr) 1991-02-12 1992-08-20 Roussel-Uclaf SEQUENCES NUCLEOTIDIQUES CODANT POUR DES REGIONS VARIABLES DE CHAINES β DES RECEPTEURS DES LYMPHOCYTES T HUMAINS, SEGMENTS PEPTIDIQUES CORRESPONDANTS ET LES APPLICATIONS DIAGNOSTIQUES ET THERAPEUTIQUES
JP3080178B2 (ja) 1991-02-18 2000-08-21 東洋紡績株式会社 核酸配列の増幅方法およびそのための試薬キット
US6091000A (en) 1991-03-15 2000-07-18 Duke University SCID mouse engrafted with human synovium tissue
JP3266311B2 (ja) 1991-05-02 2002-03-18 生化学工業株式会社 新規ポリペプチドおよびこれを用いる抗hiv剤
US20040018489A1 (en) 1991-09-09 2004-01-29 Ma Wupo Detection of RNA
US5674679A (en) 1991-09-27 1997-10-07 Amersham Life Science, Inc. DNA cycle sequencing
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5256542A (en) 1992-03-09 1993-10-26 Tanox Biosystems, Inc. Selecting low frequency antigen-specific single B lymphocytes with correction for background noise
US5213960A (en) 1992-03-09 1993-05-25 Tanox Biosystems, Inc. Methods for selecting low frequency antigen-specific single B lymphocytes
US5837447A (en) 1992-04-15 1998-11-17 Blood Center Research Foundation, Inc., The Monitoring an immune response by analysis of amplified immunoglobulin or T-cell-receptor nucleic acid
US5498392A (en) 1992-05-01 1996-03-12 Trustees Of The University Of Pennsylvania Mesoscale polynucleotide amplification device and method
US5587128A (en) 1992-05-01 1996-12-24 The Trustees Of The University Of Pennsylvania Mesoscale polynucleotide amplification devices
WO1993022461A1 (en) 1992-05-06 1993-11-11 Gen-Probe Incorporated Nucleic acid sequence amplification method, composition and kit
US5981176A (en) 1992-06-17 1999-11-09 City Of Hope Method of detecting and discriminating between nucleic acid sequences
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
CA2177988A1 (en) 1993-12-03 1995-06-08 Kazuo Higuchi Expression vector for preparing an anti-body-variable-region library
JPH10504181A (ja) 1994-04-18 1998-04-28 ニューヨーク ソサエティ フォー ザ リリーフ オブ ザ ラプチャード アンド クリップルド メインティニング ザ ホスピタル フォー スペシャル サージェリー 保存されたt細胞レセプター配列
US6001229A (en) 1994-08-01 1999-12-14 Lockheed Martin Energy Systems, Inc. Apparatus and method for performing microfluidic manipulations for chemical analysis
US6090592A (en) 1994-08-03 2000-07-18 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid on supports
FR2724182B1 (fr) 1994-09-02 1996-12-13 Pasteur Institut Obtention d'un anticorps monoclonal recombinant a partir d'un anticorps monoclonal humain anti-rhesus d, sa production en cellules d'insecte, et ses utilisations
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5776737A (en) 1994-12-22 1998-07-07 Visible Genetics Inc. Method and composition for internal identification of samples
US6919434B1 (en) 1995-02-20 2005-07-19 Sankyo Co., Ltd. Monoclonal antibodies that bind OCIF
US5698396A (en) 1995-06-07 1997-12-16 Ludwig Institute For Cancer Research Method for identifying auto-immunoreactive substances from a subject
WO1997013868A1 (en) 1995-10-11 1997-04-17 Leonard Adleman Large scale dna sequencing by position sensitive hybridization
WO1997013877A1 (en) 1995-10-12 1997-04-17 Lynx Therapeutics, Inc. Measurement of gene expression profiles in toxicity determination
US5742598A (en) 1995-10-19 1998-04-21 International Business Machines Corp. Network for efficiently locating resources and routing service requests received from individual node connections
US6087096A (en) 1995-11-13 2000-07-11 Dau; Peter C. Method of intrafamily fragment analysis of the T cell receptor α and β chain CDR3 regions
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
KR19990087749A (ko) 1996-03-13 1999-12-27 시오노 요시히코 류마티스성 관절염에 특이적인 인간 티 세포 클론
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
US6300065B1 (en) 1996-05-31 2001-10-09 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
US6699658B1 (en) 1996-05-31 2004-03-02 Board Of Trustees Of The University Of Illinois Yeast cell surface display of proteins and uses thereof
AU736742B2 (en) 1996-06-03 2001-08-02 Governors Of The University Of Alberta, The Methods for detection of rearranged DNA
DE69733282T2 (de) 1996-06-04 2006-01-19 University Of Utah Research Foundation, Salt Lake City Überwachung der Hybridisierung während PCR
AU3878697A (en) 1996-06-20 1998-02-02 Cornell Research Foundation Inc. Identification of abnormalities in the expression of t and cell antigen receptors as indicators of disease diagnosis, prognosis and therapeutic predictors
US6074827A (en) 1996-07-30 2000-06-13 Aclara Biosciences, Inc. Microfluidic method for nucleic acid purification and processing
JP4117031B2 (ja) 1996-09-06 2008-07-09 オーソ―マクニール・フアーマシユーチカル・インコーポレーテツド 抗原特異的t細胞の精製
US6255071B1 (en) 1996-09-20 2001-07-03 Cold Spring Harbor Laboratory Mammalian viral vectors and their uses
WO1998015644A2 (en) 1996-09-27 1998-04-16 The Chinese University Of Hong Kong Parallel polynucleotide sequencing method
US6207371B1 (en) 1996-10-04 2001-03-27 Lexicon Genetics Incorporated Indexed library of cells containing genomic modifications and methods of making and utilizing the same
US6136566A (en) 1996-10-04 2000-10-24 Lexicon Graphics Incorporated Indexed library of cells containing genomic modifications and methods of making and utilizing the same
US6228589B1 (en) 1996-10-11 2001-05-08 Lynx Therapeutics, Inc. Measurement of gene expression profiles in toxicity determination
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
EP1591541B1 (en) 1997-04-01 2012-02-15 Illumina Cambridge Limited Method of nucleic acid sequencing
US6143496A (en) 1997-04-17 2000-11-07 Cytonix Corporation Method of sampling, amplifying and quantifying segment of nucleic acid, polymerase chain reaction assembly having nanoliter-sized sample chambers, and method of filling assembly
ATE358177T1 (de) 1997-07-07 2007-04-15 Medical Res Council Ein in vitro sortierverfahren
US7572582B2 (en) 1997-09-12 2009-08-11 Exiqon A/S Oligonucleotide analogues
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
CA2306126A1 (en) 1997-10-15 1999-04-22 Aclara Biosciences, Inc. Laminate microstructure device and method for making same
CA2307177C (en) 1997-10-23 2004-06-29 Exact Laboratories, Inc. Methods for detecting contamination in molecular diagnostics using pcr
US7351578B2 (en) 1999-12-10 2008-04-01 Invitrogen Corp. Use of multiple recombination sites with unique specificity in recombinational cloning
US6210910B1 (en) 1998-03-02 2001-04-03 Trustees Of Tufts College Optical fiber biosensor array comprising cell populations confined to microcavities
JP4262799B2 (ja) 1998-04-16 2009-05-13 平田機工株式会社 生タイヤ供給方法
DE19833738A1 (de) 1998-07-27 2000-02-03 Michael Giesing Verfahren zur Isolierung von Krebszellen aus zellhaltigen Körperflüssigkeiten sowie Sets zur Durchführung dieses Verfahrens
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
DE19844931C1 (de) 1998-09-30 2000-06-15 Stefan Seeger Verfahren zur DNS- oder RNS-Sequenzierung
US6541608B1 (en) 1999-02-23 2003-04-01 Baylor College Of Medicine T cell receptor Vβ-Dβ-Jβ sequence and methods for its detection
US6307024B1 (en) 1999-03-09 2001-10-23 Zymogenetics, Inc. Cytokine zalpha11 Ligand
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
CN1371416B (zh) 1999-08-24 2012-10-10 梅达里克斯公司 人ctla-4抗体及其应用
US20040209314A1 (en) 1999-09-06 2004-10-21 Institut National De La Sante Et De La Recherche Medicale France Means for detection and purification of CD8+ T lymphocyte populations specific to peptides presented in the context of HLA
US6235483B1 (en) 2000-01-31 2001-05-22 Agilent Technologies, Inc. Methods and kits for indirect labeling of nucleic acids
US20040121364A1 (en) 2000-02-07 2004-06-24 Mark Chee Multiplex nucleic acid reactions
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
AU2001253088A1 (en) 2000-03-31 2001-10-15 University Of Southern California Epigenetic sequences for esophageal adenocarcinoma
AUPQ687600A0 (en) 2000-04-13 2000-05-11 Flinders Technologies Pty Ltd A method of detection
US20030207300A1 (en) 2000-04-28 2003-11-06 Matray Tracy J. Multiplex analytical platform using molecular tags
US6596492B2 (en) 2000-07-11 2003-07-22 Colorado State University Research Foundation PCR materials and methods useful to detect canine and feline lymphoid malignancies
US7567870B1 (en) 2000-07-31 2009-07-28 Institute For Systems Biology Multiparameter analysis for predictive medicine
AU8470301A (en) * 2000-08-03 2002-02-18 Wim-Van Schooten Production of humanized antibodies in transgenic animals
US6939451B2 (en) 2000-09-19 2005-09-06 Aclara Biosciences, Inc. Microfluidic chip having integrated electrodes
CA2426824A1 (en) 2000-10-24 2002-07-25 The Board Of Trustees Of The Leland Stanford Junior University Direct multiplex characterization of genomic dna
US6778724B2 (en) 2000-11-28 2004-08-17 The Regents Of The University Of California Optical switching and sorting of biological samples and microparticles transported in a micro-fluidic device, including integrated bio-chip devices
US6947748B2 (en) 2000-12-15 2005-09-20 Adaptix, Inc. OFDMA with adaptive subcarrier-cluster configuration and selective loading
EP2365062B1 (en) 2001-02-20 2016-11-23 University Of Georgia Research Foundation, Inc. Rapid production of monoclonal antibodies
US6969597B2 (en) 2001-02-21 2005-11-29 Clontech Laboratories, Inc. Nucleic acids encoding non aggregating fluorescent proteins and methods for using the same
US7265208B2 (en) 2001-05-01 2007-09-04 The Regents Of The University Of California Fusion molecules and treatment of IgE-mediated allergic diseases
AU2002308331A1 (en) 2001-05-24 2002-12-03 Guard Inc. Methods for selecting and producing animals having a predicted level of immune response
US20050260570A1 (en) 2001-05-29 2005-11-24 Mao Jen-I Sequencing by proxy
US7026121B1 (en) 2001-06-08 2006-04-11 Expression Diagnostics, Inc. Methods and compositions for diagnosing and monitoring transplant rejection
US6720144B1 (en) 2001-06-21 2004-04-13 Quest Diagnostics Detection of clonal T-cell receptor-γ gene rearrangement by PCR/temporal temperature gradient gel electrophoresis (TTGE)
WO2003008624A2 (en) 2001-07-15 2003-01-30 Keck Graduate Institute Nucleic acid amplification using nicking agents
WO2003020983A1 (en) 2001-08-30 2003-03-13 Virginia Commonwealth University Allele specific pcr for genotyping
US7432084B2 (en) 2001-08-31 2008-10-07 Rosetta Inpharmatics Llc Methods for preparing nucleic acid samples
IL160359A0 (en) 2001-08-31 2004-07-25 Avidex Ltd Soluble t cell receptor
AU2002341752B2 (en) 2001-09-19 2008-04-03 Alexion Pharmaceuticals, Inc. Engineered templates and their use in single primer amplification
EP1451340B1 (en) 2001-11-09 2014-01-08 Life Technologies Corporation Identification, monitoring and treatment of disease and characterization of biological condition using gene expression profiles
GB2382137A (en) 2001-11-20 2003-05-21 Mats Gullberg Nucleic acid enrichment
GB0128153D0 (en) 2001-11-23 2002-01-16 Bayer Ag Profiling of the immune gene repertoire
WO2003052101A1 (en) 2001-12-14 2003-06-26 Rosetta Inpharmatics, Inc. Sample tracking using molecular barcodes
GB0130267D0 (en) 2001-12-19 2002-02-06 Neutec Pharma Plc Focussed antibody technology
AU2003207528A1 (en) 2002-01-09 2003-07-30 Maxx Genetech Co. Ltd Method of detecting t-cell proliferation for diagnosis of diseases by gene array
AUPS028002A0 (en) 2002-02-01 2002-02-28 Ausman Engineering And Associates Pty Ltd A bearing assembly
US7323306B2 (en) 2002-04-01 2008-01-29 Brookhaven Science Associates, Llc Genome signature tags
US7157274B2 (en) 2002-06-24 2007-01-02 Cytonome, Inc. Method and apparatus for sorting particles
AU2003299503A1 (en) 2002-05-16 2004-06-15 Vanderbilt University Method for predicting autoimmune diseases
US20060259248A1 (en) 2002-07-01 2006-11-16 Institut Pasteur System, method, device, and computer program product for extraction, gathering, manipulation, and analysis of peak data from an automated sequencer
WO2004005465A2 (en) 2002-07-03 2004-01-15 Institute For Scientific Research, Inc. Compositions and methods for the detection of human t cell receptor variable family gene expression
WO2004006951A1 (en) 2002-07-12 2004-01-22 The Johns Hopkins University Reagents and methods for engaging unique clonotypic lymphocyte receptors
US7476519B2 (en) 2002-07-19 2009-01-13 Joseph Monforte Strategies for gene expression analysis
US7157228B2 (en) 2002-09-09 2007-01-02 Bioarray Solutions Ltd. Genetic analysis and authentication
US7459273B2 (en) 2002-10-04 2008-12-02 Affymetrix, Inc. Methods for genotyping selected polymorphism
EP1597557A4 (en) 2002-10-11 2008-06-11 Univ California METHOD FOR DIAGNOSING AND PROGNOSING MULTIPLE SCLEROSIS
DE60334471D1 (de) 2002-10-11 2010-11-18 Univ Erasmus Primer für nukleinsäureamplifikation in pcr-basierten klonalitätsstudien
WO2004044209A1 (en) 2002-11-13 2004-05-27 Monoquant Pty Ltd A method of detection
EP2365331B1 (en) 2002-11-14 2015-11-04 Valneva Method to clone a single antigen-specfic lymphocyte.
WO2004053104A2 (en) 2002-12-11 2004-06-24 Coley Pharmaceutical Group, Inc. 5’ cpg nucleic acids and methods of use
WO2004063706A2 (en) 2003-01-08 2004-07-29 Maxx Genetech Co., Ltd. Method of detecting over-expression of t-cell receptor genes by real-time pcr
WO2004070007A2 (en) 2003-01-29 2004-08-19 454 Corporation Method for preparing single-stranded dna libraries
GB0304068D0 (en) 2003-02-22 2003-03-26 Avidex Ltd Substances
US20070042349A1 (en) 2003-04-24 2007-02-22 Ogle Brenda M Methods for assessing biologic diversity
AU2003902299A0 (en) 2003-05-13 2003-05-29 Flinders Medical Centre A method of analysing a marker nucleic acid molecule
WO2005020784A2 (en) 2003-05-23 2005-03-10 Mount Sinai School Of Medicine Of New York University Surrogate cell gene expression signatures for evaluating the physical state of a subject
US20050010030A1 (en) 2003-07-02 2005-01-13 Zang Jingwu Z. T cell receptor CDR3 sequence and methods for detecting and treating rheumatoid arthritis
US8048627B2 (en) 2003-07-05 2011-11-01 The Johns Hopkins University Method and compositions for detection and enumeration of genetic variations
TW200510723A (en) 2003-07-15 2005-03-16 Bioarray Solutions Ltd Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis
US20060228350A1 (en) 2003-08-18 2006-10-12 Medimmune, Inc. Framework-shuffling of antibodies
US20050048498A1 (en) 2003-08-29 2005-03-03 Applera Corporation Compositions, methods, and kits for assembling probes
WO2005026686A2 (en) 2003-09-09 2005-03-24 Compass Genetics, Llc Multiplexed analytical platform
TWI333977B (en) 2003-09-18 2010-12-01 Symphogen As Method for linking sequences of interest
FR2863274B1 (fr) 2003-12-05 2012-11-16 Commissariat Energie Atomique Procede d'evaluation quantitative d'un rearrangement ou d'une recombinaison genetique ciblee d'un individu et ses applications.
WO2005053603A2 (en) 2003-12-08 2005-06-16 Yeda Research And Development Co. Ltd. Antigen receptor variable region typing
EP1704251A1 (en) 2003-12-15 2006-09-27 Institut Pasteur Repertoire determination of a lymphocyte b population
EP1544308B1 (en) 2003-12-15 2009-01-28 Institut Pasteur Repertoire determination of a lymphocyte B population
US20080166718A1 (en) 2003-12-15 2008-07-10 Institut Pasteur Repertoire determination of a lymphocyte B population
WO2006019407A2 (en) 2004-02-18 2006-02-23 The Trustees Of Boston University Method for detecting and quantifying rare mutations/polymorphisms
US20060046258A1 (en) 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
WO2005084134A2 (en) 2004-03-04 2005-09-15 Dena Leshkowitz Quantifying and profiling antibody and t cell receptor gene expression
JP4480423B2 (ja) 2004-03-08 2010-06-16 独立行政法人科学技術振興機構 免疫細胞クローンの拡大の有無の判定方法
DE102004016437A1 (de) 2004-04-04 2005-10-20 Oligene Gmbh Verfahren zur Erkennung von Signaturen in komplexen Genexpressionsprofilen
US20050250147A1 (en) 2004-05-10 2005-11-10 Macevicz Stephen C Digital profiling of polynucleotide populations
JP2007536939A (ja) 2004-05-14 2007-12-20 アモークス インコーポレーティッド 免疫細胞バイオセンサーおよびその使用方法
EP1598429A1 (en) 2004-05-19 2005-11-23 Amplion Ltd. Detection of amplicon contamination during PCR exhibiting two different annealing temperatures
GB0412973D0 (en) 2004-06-10 2004-07-14 Celltech R&D Ltd Identification of antibody producing cells
US20060020397A1 (en) 2004-07-21 2006-01-26 Kermani Bahram G Methods for nucleic acid and polypeptide similarity search employing content addressable memories
CN101087890A (zh) 2004-07-26 2007-12-12 帕拉列勒生物科学公司 多个基因组的同时分析
US7820382B2 (en) 2004-08-03 2010-10-26 Bauer A Robert Method for the early detection of breast cancer, lung cancer, pancreatic cancer and colon polyps, growths and cancers as well as other gastrointestinal disease conditions and the preoperative and postoperative monitoring of transplanted organs from the donor and in the recipient and their associated conditions related and unrelated to the organ transplantation
US20060094018A1 (en) 2004-08-03 2006-05-04 Bauer A R Jr Discovery and a method for the early detection of pancreatic cancer and other disease conditions
RU2398777C2 (ru) 2004-08-05 2010-09-10 Дженентек, Инк. ГУМАНИЗИРОВАННЫЕ АНТАГОНИСТЫ, НАПРАВЛЕННЫЕ ПРОТИВ c-met
WO2006031221A1 (en) 2004-09-13 2006-03-23 Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Compositions comprising t cell receptors and methods of use thereof
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
AU2005302425A1 (en) 2004-10-29 2006-05-11 Benaroya Research Institute At Virginia Mason Methods of generating antigen-specific CD4+CD25+ regulatory T cells, compositions and methods of use
US7966988B2 (en) 2005-01-11 2011-06-28 Exxonmobil Research And Engineering Company Method for controlling soot induced lubricant viscosity increase
US8029783B2 (en) 2005-02-02 2011-10-04 Genentech, Inc. DR5 antibodies and articles of manufacture containing same
FR2881436B1 (fr) 2005-02-03 2007-04-27 Commissariat Energie Atomique Procede de determination de la diversite des lymphocytes t dans un echantillon biologique
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US20080280774A1 (en) 2005-02-16 2008-11-13 Wyeth Methods and Systems for Diagnosis, Prognosis and Selection of Treatment of Leukemia
US7537894B2 (en) 2005-03-02 2009-05-26 The University Of Chicago Methods and kits for monitoring Barrett's metaplasia
US20060216737A1 (en) 2005-03-10 2006-09-28 John Bodeau Methods for multiplex amplification
EP1856293A2 (en) 2005-03-16 2007-11-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
JP2008538496A (ja) 2005-04-12 2008-10-30 454 ライフ サイエンシーズ コーポレイション ウルトラディープ配列決定を用いて配列変異体を決定するための方法
WO2006116155A2 (en) 2005-04-21 2006-11-02 The Regents Of The University Of California A method for diagnosis and prognosis of multiple sclerosis subtypes
US20060263789A1 (en) 2005-05-19 2006-11-23 Robert Kincaid Unique identifiers for indicating properties associated with entities to which they are attached, and methods for using
US7208795B2 (en) 2005-05-24 2007-04-24 Atmel Corporation Low-cost, low-voltage single-layer polycrystalline EEPROM memory cell integration into BiCMOS technology
US8426146B2 (en) 2005-06-03 2013-04-23 University of Pittsburgh—of the Commonwealth System of Higher Education Multiparameteric method for assessing immune system status
WO2006138257A2 (en) 2005-06-15 2006-12-28 Callida Genomics, Inc. Single molecule arrays for genetic and chemical analysis
WO2007008759A2 (en) 2005-07-07 2007-01-18 Hematologics, Inc. Methods for detecting and confirming minimal disease in a cancer patient
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
GB0521521D0 (en) 2005-10-21 2005-11-30 Medical Res Council Diagnostic methods and kits
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20070105165A1 (en) 2005-11-04 2007-05-10 Charles Goolsby Composite profiles of cell antigens and target signal transduction proteins for analysis and clinical management of hematologic cancers
US7375211B2 (en) 2005-11-18 2008-05-20 Kou Zhong C Method for detection and quantification of T-cell receptor Vβ repertoire
US8137936B2 (en) 2005-11-29 2012-03-20 Macevicz Stephen C Selected amplification of polynucleotides
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
US7544473B2 (en) 2006-01-23 2009-06-09 Population Genetics Technologies Ltd. Nucleic acid analysis using sequence tokens
SG170028A1 (en) 2006-02-24 2011-04-29 Callida Genomics Inc High throughput genome sequencing on dna arrays
WO2007101441A1 (en) 2006-03-06 2007-09-13 Symphogen A/S Recombinant polyclonal antibody for treatment of respiratory syncytial virus infections
ES2546848T3 (es) 2006-03-10 2015-09-29 Epigenomics Ag Un método para identificar una muestra biológica para el análisis de la metilación
ES2545264T3 (es) 2006-04-04 2015-09-09 Keygene N.V. Detección de alto rendimiento de marcadores moleculares basada en fragmentos de restricción
EP2021460A4 (en) 2006-05-11 2010-11-17 Univ Maryland Biotech Inst GENERAL PROCEDURE FOR GENERATING HUMAN ANTIBODY REACTIONS IN VITRO
WO2007136518A2 (en) 2006-05-17 2007-11-29 Torrey Pines Institute For Molecular Studies Treatment of autoimmune disorders
JP5409354B2 (ja) 2006-05-25 2014-02-05 インスティチュート フォー アドバンスド スタディ 配列モチーフを同定するための方法、およびその応用
US7833716B2 (en) 2006-06-06 2010-11-16 Gen-Probe Incorporated Tagged oligonucleotides and their use in nucleic acid amplification methods
CN101915957B (zh) 2006-06-12 2012-12-12 加利福尼亚太平洋生物科学公司 实施分析反应的基材
EP2589668A1 (en) 2006-06-14 2013-05-08 Verinata Health, Inc Rare cell analysis using sample splitting and DNA tags
US20100027896A1 (en) 2006-06-28 2010-02-04 Amir Geva Automated application interaction using a virtual operator
AU2007269408A1 (en) 2006-06-30 2008-01-10 Applied Biosystems, Llc. Reversible terminator nucleotides and methods of use
WO2008108803A2 (en) 2006-07-13 2008-09-12 Amaox, Ltd. Immune cell biosensors and methods of using same
US8394590B2 (en) 2006-08-02 2013-03-12 California Institute Of Technology Capture agents and related methods and systems for detecting and/or sorting targets
US20080274904A1 (en) 2006-08-10 2008-11-06 Niall Anthony Gormley Method of target enrichment
WO2008026927A2 (en) 2006-08-30 2008-03-06 Academisch Medisch Centrum Process for displaying t- and b-cell receptor repertoires
US8088379B2 (en) 2006-09-26 2012-01-03 The United States Of America As Represented By The Department Of Health And Human Services Modified T cell receptors and related materials and methods
US20100035764A1 (en) 2006-09-26 2010-02-11 St. Jude Children's Research Hospital Methods and compositions for monitoring t cell receptor diversity
JP5026047B2 (ja) 2006-10-18 2012-09-12 株式会社膠原病研究所 自己免疫疾患の発症に関わる自己応答性t細胞またはt細胞受容体の同定方法、およびその利用
US8148067B2 (en) 2006-11-09 2012-04-03 Xdx, Inc. Methods for diagnosing and monitoring the status of systemic lupus erythematosus
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US7862999B2 (en) 2007-01-17 2011-01-04 Affymetrix, Inc. Multiplex targeted amplification using flap nuclease
EP2121983A2 (en) 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
ES2369946T3 (es) 2007-03-01 2011-12-09 Symphogen A/S Procedimiento para clonación de anticuerpos análogos.
WO2008147879A1 (en) 2007-05-22 2008-12-04 Ryan Golhar Automated method and device for dna isolation, sequence determination, and identification
EP2164985A4 (en) 2007-06-01 2014-05-14 454 Life Sciences Corp SYSTEM AND METHOD FOR IDENTIFYING INDIVIDUAL SAMPLES FROM A MULTIPLEX MIXTURE
US8454906B2 (en) 2007-07-24 2013-06-04 The Regents Of The University Of California Microfabricated droplet generator for single molecule/cell genetic analysis in engineered monodispersed emulsions
EP2183388A4 (en) 2007-07-26 2010-09-08 Pacific Biosciences California SEQUENCING MOLECULAR REDUNDANT
ITRM20070429A1 (it) 2007-08-06 2009-02-07 Uni Cattolica Del Sacro Cuor E Mezzi per la diagnosi la prevenzione e la cura dell'artrite reumatoide.
US20090042737A1 (en) 2007-08-09 2009-02-12 Katz Andrew S Methods and Devices for Correlated, Multi-Parameter Single Cell Measurements and Recovery of Remnant Biological Material
US8268564B2 (en) 2007-09-26 2012-09-18 President And Fellows Of Harvard College Methods and applications for stitched DNA barcodes
WO2009045898A2 (en) 2007-09-28 2009-04-09 Mayo Foundation For Medical Education And Research Assessing t cell repertoires
US7960116B2 (en) 2007-09-28 2011-06-14 Pacific Biosciences Of California, Inc. Nucleic acid sequencing methods and systems
JP5730576B2 (ja) 2007-11-07 2015-06-10 ジェネンテック, インコーポレイテッド 抗cd40抗体による治療に対するb細胞リンパ腫の応答性を評価するための方法及び組成物
EP2060637A1 (en) 2007-11-14 2009-05-20 Koninklijke Philips Electronics N.V. Means and methods for detection of nucleic acids
WO2009070767A2 (en) 2007-11-28 2009-06-04 Whitehead Institute For Biomedical Research Systemic instigation systems to study tumor growth or metastasis
EP2062982A1 (fr) * 2007-11-26 2009-05-27 ImmunID Procédé d'étude de la diversité combinatoire V(D)J
CN101225441B (zh) 2007-12-05 2010-12-01 浙江大学 一种检测克隆特异性t淋巴细胞tcr bv cdr3基因组成的方法
US20100021894A1 (en) 2007-12-20 2010-01-28 Northwestern University Nanoparticle-Based Colorimetric Detection Of Cysteine
US8621502B2 (en) 2007-12-21 2013-12-31 Microsoft Corporation Obtaining user reactions to video
US7767400B2 (en) 2008-02-03 2010-08-03 Helicos Biosciences Corporation Paired-end reads in sequencing by synthesis
US8211673B2 (en) 2008-02-04 2012-07-03 Life Technologies Corporation Composition and method for sequencing nucleic acid
EP2088432A1 (en) 2008-02-11 2009-08-12 MorphoSys AG Methods for identification of an antibody or a target
EP2088205A1 (en) 2008-02-11 2009-08-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) PSMB10: A diagnosis marker and therapeutic target of chronic rejection.
JP2011517283A (ja) 2008-02-28 2011-06-02 ジ・オハイオ・ステイト・ユニバーシティ・リサーチ・ファウンデイション 前立腺関連障害の予後診断及び治療のためのマイクロrnaに基づく方法及び組成物
AU2009219203B2 (en) 2008-02-28 2014-04-03 The Ohio State University Research Foundation MicroRNA signatures associated with cytogenetics and prognosis in acute myeloid leukemia (AML) and uses thereof
US20090226975A1 (en) 2008-03-10 2009-09-10 Illumina, Inc. Constant cluster seeding
TW200938840A (en) 2008-03-12 2009-09-16 Emo Biomedicine Corp A method for in vitro study of immune modulation using pig blood cell
EP2100970B1 (en) 2008-03-13 2017-05-10 National Institute of Immunology Ig genes specific oligonucleotides and uses thereof
CN104862383B (zh) 2008-03-28 2019-05-28 加利福尼亚太平洋生物科学股份有限公司 用于核酸测序的组合物和方法
ATE530497T1 (de) 2008-03-31 2011-11-15 Sony Deutschland Gmbh Verfahren zur herstellung einer membran mit konischer pore
AU2009244634B2 (en) 2008-04-16 2014-12-18 iRepertoire, Inc. Method for evaluating and comparing immunorepertoires
US8911948B2 (en) 2008-04-30 2014-12-16 Integrated Dna Technologies, Inc. RNase H-based assays utilizing modified RNA monomers
CN102171569A (zh) 2008-05-09 2011-08-31 杜克大学 检测和治疗癌症的自身抗体
US9068181B2 (en) 2008-05-23 2015-06-30 The General Hospital Corporation Microfluidic droplet encapsulation
DE102008025656B4 (de) 2008-05-28 2016-07-28 Genxpro Gmbh Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
CN102112624A (zh) 2008-05-30 2011-06-29 麻省理工学院 用于对细胞进行空间分割以及筛选的组合物以及方法
WO2009151628A2 (en) 2008-06-12 2009-12-17 Gov't Of The Usa, As Represented By The Secretary, Department Of Health Human Services Monitoring tcr-b to determine hiv therapy and disease progression
NZ590341A (en) 2008-06-25 2012-07-27 Baylor Res Inst Blood transcriptional signature of mycobacterium tuberculosis infection
CA2769002C (en) 2008-07-24 2018-05-08 The Board Of Regents Of The University Of Texas System Vh4 codon signature for multiple sclerosis
ES2752025T3 (es) 2008-07-25 2020-04-02 Wagner Richard W Métodos de cribado de proteínas
US8586310B2 (en) 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
CN102405402A (zh) 2008-09-23 2012-04-04 阔达生命有限公司 基于液滴的测定系统
US9156010B2 (en) 2008-09-23 2015-10-13 Bio-Rad Laboratories, Inc. Droplet-based assay system
US8699361B2 (en) 2008-09-30 2014-04-15 Qualcomm Incorporated Out-of-synchronization handling method and apparatus
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
US8691510B2 (en) 2008-11-07 2014-04-08 Sequenta, Inc. Sequence analysis of complex amplicons
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9394567B2 (en) 2008-11-07 2016-07-19 Adaptive Biotechnologies Corporation Detection and quantification of sample contamination in immune repertoire analysis
US20140234835A1 (en) 2008-11-07 2014-08-21 Sequenta, Inc. Rare clonotypes and uses thereof
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US20110105343A1 (en) 2008-11-21 2011-05-05 Emory University Systems Biology Approach Predicts Immunogenicity of Vaccines
US8367330B2 (en) 2008-12-22 2013-02-05 Quest Diagnostics Investments Incorporated Methods for detecting TCR-gamma gene rearrangement
BRPI0923806A2 (pt) 2008-12-30 2015-07-14 Centocor Ortho Biotech Inc Marcadores séricos para previsão da resposta clínica a anticorpos anti-tnfa em pacientes com espondilite anquilosante
PT2387627E (pt) 2009-01-15 2016-06-03 Adaptive Biotechnologies Corp Determinação do perfil de imunidade adaptativa e métodos de geração de anticorpos monoclonais
JP2012515533A (ja) 2009-01-20 2012-07-12 ザ ボード オブ トラスティーズ オブ ザ リーランド スタンフォード ジュニア ユニバーシティ 診断、予後診断、および創薬ターゲットの同定のための単細胞遺伝子発現の方法
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
WO2011008502A2 (en) 2009-06-29 2011-01-20 California Institute Of Technology Isolation of unknown rearranged t-cell receptors from single cells
SG177688A1 (en) 2009-07-17 2012-03-29 Univ Brown Detection of short rna sequences
US8586359B2 (en) 2009-07-28 2013-11-19 Promising Furture, LLC Compositions and methods of preparing alloreactive cytotoxic T cells
WO2011035870A1 (en) 2009-09-22 2011-03-31 Roche Diagnostics Gmbh Determination of kir haplotypes associated with disease
GB0917094D0 (en) 2009-09-29 2009-11-11 Ucl Biomedica Plc T-cell receptor
US9043160B1 (en) 2009-11-09 2015-05-26 Sequenta, Inc. Method of determining clonotypes and clonotype profiles
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US8545248B2 (en) 2010-01-07 2013-10-01 Life Technologies Corporation System to control fluid flow based on a leak detected by a sensor
KR101323827B1 (ko) 2010-01-08 2013-10-31 키스트 유럽 에프게엠베하 강직성척추염 진단용 프라이머 및 이를 이용한 강직성 척추염 진단 방법
GB201000375D0 (en) 2010-01-09 2010-02-24 Univ Cardiff T Cell clonotypes
WO2011106738A2 (en) 2010-02-25 2011-09-01 Fred Hutchinson Cancer Research Center Use of tcr clonotypes as biomarkers for disease
EP2367000A1 (en) 2010-03-04 2011-09-21 Charité Universitätsmedizin Berlin High throughput analysis of T-cell receptor repertoires
SG10201503534RA (en) 2010-05-06 2015-06-29 Sequenta Inc Monitoring health and disease status using clonotype profiles
WO2011140433A2 (en) 2010-05-07 2011-11-10 The Board Of Trustees Of The Leland Stanford Junior University Measurement and comparison of immune diversity by high-throughput sequencing
US20130123120A1 (en) 2010-05-18 2013-05-16 Natera, Inc. Highly Multiplex PCR Methods and Compositions
WO2011156707A2 (en) 2010-06-11 2011-12-15 Life Technologies Corporation Alternative nucleotide flows in sequencing-by-synthesis methods
CA2802111A1 (en) 2010-07-23 2012-01-26 Esoterix Genetic Laboratories, Llc Identification of differentially represented fetal or maternal genomic regions and uses thereof
EP2601521B1 (en) 2010-08-06 2018-05-02 Ludwig-Maximilians-Universität München Identification of t cell target antigens
WO2012027503A2 (en) 2010-08-24 2012-03-01 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity
US9586997B2 (en) 2010-09-20 2017-03-07 Biontech Cell & Gene Therapies Gmbh Antigen-specific T cell receptors and T cell epitopes
ES2523140T3 (es) 2010-09-21 2014-11-21 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
EP2622103B2 (en) 2010-09-30 2022-11-16 Bio-Rad Laboratories, Inc. Sandwich assays in droplets
DK2625295T3 (da) 2010-10-08 2019-06-11 Harvard College High-throughput-immunsekvensering
EP3561159B1 (en) 2010-10-08 2023-09-20 President and Fellows of Harvard College High-throughput single cell barcoding
EP2633069B1 (en) 2010-10-26 2015-07-01 Illumina, Inc. Sequencing methods
AU2011323107B2 (en) 2010-11-05 2015-09-10 Illumina, Inc. Linking sequence reads using paired code tags
WO2012083069A2 (en) 2010-12-15 2012-06-21 The Board Of Trustees Of The Leland Stanford Junior University Measurement and monitoring of cell clonality
EP2652155B1 (en) 2010-12-16 2016-11-16 Gigagen, Inc. Methods for massively parallel analysis of nucleic acids in single cells
US9594870B2 (en) 2010-12-29 2017-03-14 Life Technologies Corporation Time-warped background signal for sequencing-by-synthesis operations
US10146906B2 (en) 2010-12-30 2018-12-04 Life Technologies Corporation Models for analyzing data from sequencing-by-synthesis operations
EP3736281A1 (en) 2011-02-18 2020-11-11 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
CN108220297A (zh) 2011-03-09 2018-06-29 细胞信号科技公司 用于生成单克隆抗体的方法和试剂
US8759036B2 (en) 2011-03-21 2014-06-24 Affymetrix, Inc. Methods for synthesizing pools of probes
EP3907299A1 (en) 2011-04-15 2021-11-10 The Johns Hopkins University Safe sequencing system
SI3418380T1 (sl) 2011-04-28 2022-10-28 The Board Of Trustees Of The Leland Stanford Junior University Identifikacija polinukleotidov, povezanih z vzorcem
SI3473267T1 (sl) 2011-05-24 2022-01-31 BioNTech SE Individualizirana cepiva za rak
US9834766B2 (en) 2011-09-02 2017-12-05 Atreca, Inc. DNA barcodes for multiplexed sequencing
US20140356339A1 (en) 2011-09-09 2014-12-04 Sequenta Inc. Sequence-based measures of immune response
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
US20140256592A1 (en) 2011-10-11 2014-09-11 Sequenta, Inc. Determining responsiveness of autoimmune patients to dmard treatment
US9279159B2 (en) 2011-10-21 2016-03-08 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
US20130137108A1 (en) 2011-10-25 2013-05-30 Anubhav Tripathi Magnetic bead separation apparatus and method
WO2013066726A1 (en) 2011-11-04 2013-05-10 Sequenta, Inc. T-cell receptor clonotypes shared among ankylosing spondylitis patients
US20140336059A1 (en) 2011-12-05 2014-11-13 Sequenta, Inc. Clonotypes as biometric specimen tags
AU2012347460B2 (en) * 2011-12-09 2017-05-25 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
WO2013086462A1 (en) 2011-12-09 2013-06-13 Sequenta, Inc. Method of measuring immune activation
US20150031553A1 (en) 2011-12-13 2015-01-29 Sequenta, Inc. Method of measuring immune activation
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
WO2013096480A2 (en) 2011-12-20 2013-06-27 Sequenta, Inc. Monitoring transformation of follicular lymphoma to diffuse large b-cell lymphoma by immune repertoire analysis
WO2013112655A1 (en) 2012-01-24 2013-08-01 Gigagen, Inc. Method for correction of bias in multiplexed amplification
ES2679107T3 (es) 2012-02-09 2018-08-22 Memed Diagnostics Ltd. Distintivos y determinantes para diagnosticar infecciones y métodos para usarlos
EP2814959B1 (en) 2012-02-17 2018-01-17 Fred Hutchinson Cancer Research Center Compositions and methods for accurately identifying mutations
EP2820174B1 (en) 2012-02-27 2019-12-25 The University of North Carolina at Chapel Hill Methods and uses for molecular tags
WO2013131074A1 (en) 2012-03-02 2013-09-06 Diogenix, Inc. Methods and reagents for evaluating autoimmune disease and determining antibody repertoire
JP6302847B2 (ja) 2012-03-05 2018-03-28 アダプティヴ バイオテクノロジーズ コーポレーション 頻度が一致したサブユニットからの、対をなす免疫受容体鎖の決定
WO2013134302A1 (en) 2012-03-05 2013-09-12 Sequenta, Inc. Monitoring immune responsiveness to cancer vaccination
US20150038346A1 (en) 2012-03-05 2015-02-05 Sequenta, Inc. Monitoring immune responsiveness to cancer vaccination
US9862995B2 (en) 2012-03-13 2018-01-09 Abhijit Ajit Patel Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
CN104395481A (zh) 2012-04-13 2015-03-04 赛昆塔公司 免疫组库分析中样品污染的检测和定量
WO2013158936A1 (en) 2012-04-20 2013-10-24 Sequenta, Inc Monitoring immunoglobulin heavy chain evolution in b-cell acute lymphoblastic leukemia
US10081807B2 (en) 2012-04-24 2018-09-25 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
CN107586832B (zh) 2012-05-08 2021-03-30 适应生物技术公司 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法
US20150247201A1 (en) 2012-05-31 2015-09-03 Malek Faham Predicting relapse of chronic lymphocytic leukemia patients treated by allogeneic stem cell transplantation
US20130324422A1 (en) 2012-06-04 2013-12-05 Sequenta, Inc. Detecting disease-correlated clonotypes from fixed samples
CN104520443A (zh) 2012-06-11 2015-04-15 赛昆塔公司 使用序列标签的序列确定方法
WO2013188831A1 (en) 2012-06-15 2013-12-19 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
WO2013192570A1 (en) 2012-06-21 2013-12-27 Gigagen, Inc. System and methods for genetic analysis of mixed cell populations
AU2013293240A1 (en) 2012-07-24 2015-03-05 Adaptive Biotechnologies Corp. Single cell analysis using sequence tags
EP2882870A4 (en) 2012-08-10 2016-03-16 Sequenta Inc HIGHLY SENSITIVE DETECTION OF MUTATIONS BY SEQUENCE TAGS
US20140065629A1 (en) 2012-08-29 2014-03-06 Israel Barken Methods of treating diseases
DE112013004650T5 (de) 2012-09-24 2015-06-18 Cb Biotechnologies, Inc. Multiplexpyrosequenzierung unter Verwendung nichtinterferierender, rauschbeendender Polynukleotididentifikationstags
JP2015534806A (ja) 2012-10-19 2015-12-07 シーケンタ・インコーポレイテッド 末梢血試料によるびまん性大細胞型b細胞性リンパ腫のモニタリング関連出願の相互参照本出願は、2012年10月19日出願の米国特許仮出願第61/716,270号の利益を主張するものであり、当該出願は参照により本明細書にその全体が組み込まれる。
JP2015535178A (ja) 2012-10-19 2015-12-10 シーケンタ・インコーポレイテッド 末梢血における形質細胞増殖障害のクロノタイプのモニタリング
CA2888524A1 (en) 2012-10-22 2014-05-01 Sequenta, Inc. Monitoring mantle cell lymphoma clonotypes in peripheral blood after immunotransplant
JP6513035B2 (ja) 2013-02-22 2019-05-15 アダプティヴ バイオテクノロジーズ コーポレーション 希少クロノタイプおよびその用途
US20140255944A1 (en) 2013-03-08 2014-09-11 Sequenta, Inc. Monitoring treatment-resistant clones in lymphoid and myeloid neoplasms by relative levels of evolved clonotypes
US20140255929A1 (en) 2013-03-11 2014-09-11 Sequenta, Inc. Mosaic tags for labeling templates in large-scale amplifications
KR20150132479A (ko) 2013-03-15 2015-11-25 어댑티브 바이오테크놀로지스 코포레이션 복합 유전자 세트에서의 독특하게 태그되고 재배열된 적응 면역 수용체 유전자
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
WO2015013461A2 (en) 2013-07-26 2015-01-29 Sequenta, Inc. Cancer vaccination with antigen evolution
US20160258025A1 (en) 2013-10-18 2016-09-08 The Regents Of The University Of California Predicting patient responsiveness to immune checkpoint inhibitors
EP3092318A4 (en) 2014-01-10 2017-08-16 Adaptive Biotechnologies Corp. Methods for defining and predicting immune response to allograft
US20150218656A1 (en) 2014-02-03 2015-08-06 Adaptive Biotechnologies Corp. Methods for detection and diagnosis of a lymphoid malignancy using high throughput sequencing
EP3114240B1 (en) 2014-03-05 2019-07-24 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
ES2777529T3 (es) 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
EP3212790B1 (en) 2014-10-29 2020-03-25 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
US11047008B2 (en) 2015-02-24 2021-06-29 Adaptive Biotechnologies Corporation Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
WO2016161273A1 (en) 2015-04-01 2016-10-06 Adaptive Biotechnologies Corp. Method of identifying human compatible t cell receptors specific for an antigenic target

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101292044A (zh) * 2005-08-12 2008-10-22 新加坡科技研究局 寡核苷酸设计和/或核酸检测的方法和/或装置
WO2010053587A2 (en) * 2008-11-07 2010-05-14 Mlc Dx Incorporated Methods of monitoring conditions by sequence analysis
WO2010151416A1 (en) * 2009-06-25 2010-12-29 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
H.S.TOBINS ET AL: "Comprehensive assessment of T-cell receptor-chain diversity in T cells", 《BLOOD》 *
REISCHL U ET AL: "QUANTITATIVE PCR A SURVEY OF THE PRESENT TECHNOLOGY", 《MOLECULAR BIOTECHNOLOGY》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111850016A (zh) * 2020-07-06 2020-10-30 深圳泛因医学有限公司 免疫组库标准物质序列及其设计方法和应用

Also Published As

Publication number Publication date
PL2831276T3 (pl) 2016-10-31
CN107586832B (zh) 2021-03-30
ES2711156T3 (es) 2019-04-30
ES2582554T3 (es) 2016-09-13
MX354329B (es) 2018-02-27
WO2013169957A8 (en) 2014-04-03
US20160319340A1 (en) 2016-11-03
US20150017652A1 (en) 2015-01-15
UA115783C2 (uk) 2017-12-26
KR101621643B1 (ko) 2016-05-16
EP2831276A1 (en) 2015-02-04
CY1117899T1 (el) 2017-05-17
JP2015523057A (ja) 2015-08-13
US20190203281A1 (en) 2019-07-04
SG10201507700VA (en) 2015-10-29
HK1206789A1 (zh) 2016-01-15
AU2013259544B2 (en) 2017-09-14
RU2631797C2 (ru) 2017-09-26
CA2872468A1 (en) 2013-11-14
AU2017272256B1 (en) 2018-01-04
CA2872468C (en) 2020-10-27
EP2831276B1 (en) 2016-04-20
MX2014013443A (es) 2015-05-11
JP6385889B2 (ja) 2018-09-05
JP2015171372A (ja) 2015-10-01
JP5756247B1 (ja) 2015-07-29
EP3091089A1 (en) 2016-11-09
US10894977B2 (en) 2021-01-19
WO2013169957A1 (en) 2013-11-14
RU2014143942A (ru) 2016-05-27
IL235417A0 (en) 2014-12-31
DK2831276T3 (da) 2016-08-01
US20150203897A1 (en) 2015-07-23
HUE029357T2 (en) 2017-02-28
SG11201407107VA (en) 2014-11-27
AU2013259544A1 (en) 2014-11-20
US10214770B2 (en) 2019-02-26
US9371558B2 (en) 2016-06-21
PT2831276T (pt) 2016-07-26
EP3091089B1 (en) 2019-01-23
CN104520440B (zh) 2017-10-03
AU2013259544B9 (en) 2017-09-28
KR20140139620A (ko) 2014-12-05
CN104520440A (zh) 2015-04-15
US9150905B2 (en) 2015-10-06
BR112014027309A2 (pt) 2017-07-11

Similar Documents

Publication Publication Date Title
CN104520440B (zh) 用于测量和校准多重pcr反应中的扩增偏倚的组合物和方法
EP3212790B1 (en) Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
EP3132059B1 (en) Quantification of adaptive immune cell genomes in a complex mixture of cells
US9809813B2 (en) Method of measuring adaptive immunity
US10246701B2 (en) Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
EP3114240B1 (en) Methods using randomer-containing synthetic molecules
US20150299785A1 (en) Method of measuring adaptive immunity
US20220002802A1 (en) Compositions and methods for immune repertoire sequencing
US20220073983A1 (en) Compositions and methods for immune repertoire sequencing
US20230340602A1 (en) Compositions and methods for immune repertoire monitoring

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant