CN115335535A - 自身免疫疾病和免疫缺陷病症中的免疫组库生物标志物 - Google Patents
自身免疫疾病和免疫缺陷病症中的免疫组库生物标志物 Download PDFInfo
- Publication number
- CN115335535A CN115335535A CN202180014566.8A CN202180014566A CN115335535A CN 115335535 A CN115335535 A CN 115335535A CN 202180014566 A CN202180014566 A CN 202180014566A CN 115335535 A CN115335535 A CN 115335535A
- Authority
- CN
- China
- Prior art keywords
- gene
- primers
- target
- sequence
- bcr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本公开提供了用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的所述受试者对治疗的临床应答的方法和/或用于基于表征所述受试者的所述B细胞免疫组库来预测患有免疫缺陷(例如,白血病)的所述受试者的预后的方法。在一方面,这些方法提供了在治疗之前确定样本中B细胞受体组库的类别转换重组和/或体细胞超突变的频率,并基于测得的类别转换和/或体细胞超突变频率预测受试者的预后和/或对治疗的应答。在另一方面,这些方法提供了确定免疫受体类别转换和/或体细胞超突变频率,并基于根据测得的类别转换和/或体细胞超突变频率所得到的预后和/或对治疗的应答的预测来治疗受试者。
Description
相关申请
本申请案根据35 USC§119(e)要求2020年1月22日提交的美国临时申请第62/964,524号和2020年1月22日提交的美国临时申请第62/964,550号中的每一个的优先权和权益。前述申请案中的每一个的全部内容以全文引用的方式并入本文中。
序列表
本申请在此以引用的方式并入有与此同时提交的电子序列表材料。电子序列表中的材料以2021年1月21日创建的标题为“LT01523_ST25.txt”的文本(.txt)文档形式提交,其文件大小是185KB并且以全文引用的方式并入本文中。
技术领域
本发明涉及用于制备靶免疫组库核酸序列的文库的方法以及其组合物和用途。
背景技术
适应性免疫应答包含识别抗原的B细胞和T细胞的选择性应答。编码抗体(Ab,在B细胞中)和T细胞受体(TCR,在T细胞中)抗原受体的免疫球蛋白基因包含复合基因座,其中由于相应可变(V)、多样性(D)和连接(J)基因片段的重组,以及随后的在早期淋巴分化期间的体细胞超突变事件而产生广泛的受体多样性。每种受体的两个亚基链单独发生重组过程,并且随后,异二聚体配对产生仍更大的组合多样性。有助于人免疫受体组库的潜在组合可能性和连接可能性的计算已经估计,可能性的数量大大超过个体中外周B或T细胞的总数。参见,例如,Davis和Bjorkman(1988)《自然(Nature)》334:395-402;Arstila等人.(1999)《科学(Science)》286:958-961;van Dongen等人,《白血病(Leukemia)》,Henderson等人.(编辑)费城:WB桑德斯公司(Philadelphia:W.B.Saunders Company),2002,第85-129页。
多年来已经进行了广泛的努力以便以高分辨率改善对免疫组库的分析。用于特异性检测和监测淋巴细胞的扩增克隆的手段将为表征和分析正常免疫反应和应答和致病性免疫反应和应答提供重要机会。尽管付出了努力,但有效的高分辨率分析提供了挑战。如桑格(Sanger)测序等低通量技术可以提供分辨率,但仅限于提供广泛捕获整个免疫组库的有效手段。在下一代测序(NGS)方面取得的进展已经提供捕获组库的途径,然而,由于大量相关序列的性质和由所述技术引起的序列错误的引入,已经证明难以对真实组库进行高效和有效反映。正在开发能够解析高度可变的免疫细胞受体序列的复合群体的改善的测序方法和工作流程。仍需要有效分析大量免疫细胞受体组库的新方法,以更好地理解免疫细胞应答、增强诊断能力和处理能力并设计新的疗法。
发明内容
本文提供了用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的受试者对治疗的临床应答的方法。本文附加地提供了用于基于表征受试者的B细胞免疫组库来预测患有免疫缺陷的受试者的预后的方法。此类方法包含使用以下的至少一组执行单一多重扩增反应以扩增从受试者样本中获得的靶BCR核酸模板分子:
i)(a)针对包含V基因内的FR1的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,
(b)针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或
(c)针对包含V基因内的FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及
ii)针对至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物;
其中每组i)引物和ii)引物针对同一靶IgHBCR基因的编码序列,并且其中使用至少一组i)引物和ii)引物执行扩增产生代表样本中的靶BCR组库的扩增子分子;由此生成包含靶BCR组库的靶BCR扩增子分子。该方法还包含:对靶BCR扩增子分子执行测序并确定分子的序列,其中确定序列包括获得初始序列读段,将初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段;从所确定的靶BCR序列中鉴别BCR组库克隆群体;以及鉴别克隆中可变基因部分内的体细胞超突变(SHM)的频率。该方法还包括确定进行中的SHM频率,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;和/或确定进行中的类别转换重组(CSR)频率。在一些实施例中,在样本中的B细胞免疫受体克隆的同一可变谱系中鉴别出至少一种转换同种型和/或转换同种型的组合。在一些实施例中,所提供的方法接下来包含将患有自身免疫疾病或病症的受试者鉴别为可能的(i)对化学治疗的应答者,这发生在当SHM频率小于样本中非转换IgM/IgD表达性B细胞中的频率阈值,并且免疫组库由样本中高频率的转换同种型IgG、IgA或IgE表达性B细胞主导时,(ii)对化学治疗的无应答者,这发生在当SHM频率大于频率阈值,并且免疫组库由样本中高频率的非转换IgM/IgD表达性B细胞主导时,和/或(iii)对免疫治疗的应答者,这发生在当SHM频率大于频率阈值,并且免疫组库由样本中高频率的非转换IgM/IgD表达性B细胞主导时。在一些实施例中,所提供的方法接下来包含根据以下亚类对组库克隆进行分类:I类:无进行中的CSR或SHM,无V基因SHM;II类:无进行中的CSR或SHM,V基因SHM大于零,小于6%;III类:无进行中的CSR或SHM,V基因SHM大于约6%;IV类:进行中的CSR和/或SHM;以及基于B细胞免疫组库的亚分类鉴别患有免疫缺陷的受试者的预后:I类:最差预后;II类:不良预后;III类:良好预后和IV类:最好预后。
附加地提供了基于表征受试者的B细胞免疫组库来将具有自身免疫疾病或病症的症状的受试者诊断为患有慢性可变免疫缺陷病症的方法。在一些实施例中,此类方法包含使用以下的至少一组执行单一多重扩增反应以扩增从受试者样本中获得的靶BCR核酸模板分子:
i)(a)针对包含V基因内的FR1的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,
(b)针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或
(c)针对包含V基因内的FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及
ii)针对至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物;
其中每组i)引物和ii)引物针对同一靶IgH BCR基因的编码序列,并且其中使用至少一组i)引物和ii)引物执行扩增产生代表样本中的靶BCR组库的扩增子分子;由此生成包含靶BCR组库的靶BCR扩增子分子。该方法还包含:对靶BCR扩增子分子执行测序并确定分子的序列,其中确定序列包括获得初始序列读段,将初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段;从测序中鉴别BCR组库克隆群体以及鉴别免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列,以及确定样本中B细胞免疫受体克隆的类别转换重组频率。该方法还包含:当SHM频率小于转换同种型中的频率阈值、样本中类别转换重组(CSR)的频率小于频率阈值,并且免疫组库由样本中的非转换IgM/IgD表达性B细胞主导时,将受试者鉴别为患有原发性免疫缺陷病症,从而诊断受试者患有慢性可变免疫缺陷病症。
本文还提供了用于基于受试者的B细胞免疫组库治疗患有自身免疫疾病或病症或免疫缺陷的受试者的方法。在一些实施例中,此类方法包含使用以下的至少一组执行单一多重扩增反应以扩增从受试者样本中获得的靶BCR核酸模板分子:
i)(a)针对包含V基因内的FR1的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,
(b)针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或
(c)针对包含V基因内的FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及
ii)针对至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物;
其中每组i)引物和ii)引物针对同一靶IgH BCR基因的编码序列,并且其中使用至少一组i)引物和ii)引物执行扩增产生代表样本中的靶BCR组库的扩增子分子;由此生成包含靶BCR组库的靶BCR扩增子分子。该方法还包含:对靶BCR扩增子分子执行测序并确定分子的序列,其中确定序列包括获得初始序列读段,将初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段;从测序中鉴别BCR组库克隆群体以及从测序中鉴别免疫受体克隆以及鉴别免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平。该方法还包含确定进行中的SHM频率,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;和/或确定进行中的类别转换重组(CSR)频率,其中至少一种转换同种型或其组合在样本中B细胞免疫受体克隆的同一可变谱系中被鉴别。在一些实施例中,所提供的方法还包含用以下方法治疗患有自身免疫疾病或病症的受试者:(i)化学治疗,这发生在当SHM频率小于样本中非转换IgM/IgD表达性B细胞的频率阈值,并且免疫组库由样本中高频率的转换同种型IgG、IgA或IgE表达性B细胞主导时,和/或(ii)免疫治疗,这发生在当SHM频率大于频率阈值,并且免疫组库由样本中高频率的非转换IgM/IgD表达性B细胞主导时。在一些实施例中,所提供的方法还包含根据以下亚类对组库克隆进行分类:I类:无进行中的CSR或SHM,无V基因SHM;II类:无进行中的CSR或SHM,V基因SHM大于零,小于6%;III类:无进行中的CSR或SHM,V基因SHM大于约6%;IV类:进行中的CSR和/或SHM;以及基于B细胞免疫组库的亚分类治疗免疫缺陷受试者:I类:干细胞治疗,任选地添加化学治疗、放射治疗或DNA修复诱导剂中的任一种;II类:化学治疗、放射治疗或免疫治疗与任选的DNA修复诱导剂,III类:化学治疗或免疫治疗,以及IV类:标准化学治疗或免疫治疗。
附图说明
图1是用于使用对类似CDR3核苷酸序列进行的逐步聚类去除PCR或测序衍生的错误的示例性工作流程图,其中步骤为:(A)基于类似性(cd-hit-est)非常快速的启发式聚类成组;(B)将被选为最常见的序列、随机挑选以形成平局的代表聚类;(C)将读段合并到代表中;(D)比较代表,并且如果在所分配的汉明距离(hamming distance)内,则合并聚类。
图2是用于通过使用莱文斯坦距离(Levenshtein distance)比较均聚物塌缩的CDR3序列来去除残余插入/缺失(插入缺失(indel))错误的示例性工作流程图,其中步骤为:(A)使均聚物塌缩并计算聚类代表之间的莱文斯坦距离;(B)合并现在聚类在一起的读段,这些读段表示复合插入缺失错误;(C)向用户报告谱系。
图3是描绘了针对单独的BCR测定、在一个池中扩增的BCR和TCR测定以及在两个单独的池中扩增的BCR和TCR测定的读段数量和对读取质量的表征(生产性对脱靶或非生产性)的结果的图。
图4A-4B描绘了在组合测定中检测到的总克隆数(图4A)以及BCR克隆和TCR克隆的群体(按总数的百分比计)(图4B)。
图5A-5F是描绘了来自以下各种细胞或组织样本的RNA的IgH组库的序列读段长度的直方图:(图5A)PBL、(图5B)CD19+细胞、(图5C)扁桃体FFPE、(图5D)肺肿瘤FFPE、(图5E)骨髓、(图5F)正常脾以及(图5G)正常大脑。
图6描绘了使用示例性IgH V基因FR1-C基因引物组1-7在对PBL cDNA进行多重扩增后获得的序列读段长度。
图7A-7B条形图描绘了PBL样本内的从使用示例性IgH V基因FR1-C基因多重扩增反应进行测定获得的作为每个同种型的序列读段(图7A)和每个同种型检测到的克隆(图7B)的总同种型代表。
图8A-8B描绘了对于所有IgH同种型(图8A)和仅IgD的PBL样本(图8B)中的IgH V基因突变率的直方图。
图9描绘了来自样本的总生产性读段(每个图上的最右边的点)以及源自总生产性读段的8个下采样的数据集的IgH克隆分析结果。
图10描绘了示出在从等摩尔浓度的混合有白细胞cDNA的20个对照质粒的池中产生的IgH文库中质粒检测的线性的图。表15中示出了与质粒ID号相关的质粒。
图11A至11B描绘了来自用甲氨蝶呤治疗的类风湿性关节炎患者的样本的回顾性分析的IgH克隆分析结果。图11A描绘了在治疗过程中IGG、IGA和IGE表达性B细胞的频率;图11B描绘了应答者和无应答者中IGM和IGD表达性B细胞中体细胞超突变的频率。
图12描绘了来自淋巴瘤患者的样本中体细胞超重组(SHM)和类别转换重组(CSR)的回顾性分析的IgH克隆分析结果。还绘制了按2%或3%的V基因突变百分比进行的传统分类。
具体实施方式
甲氨蝶呤通常用作类风湿性关节炎的一线治疗,尽管只有一部分接受者经历了疾病症状的持久缓解。那些应答不佳的人可以选择接受替代治疗(例如TNF拮抗剂或B细胞耗竭剂,如利妥昔单抗;请参阅下面网站的扩展列表)。由于甲氨蝶呤活性的缓慢动力学(其中通常在治疗开始后4至6周观察到疾病减轻的最初迹象),因此评价应答需要延长的监测,在此期间个体可能继续受疾病症状折磨。此外,在最终恢复到治疗前患病状态之前,一部分个体可能会在几个月的持续时间内表现出暂时的症状缓解。因此,迫切需要预测对治疗(例如,甲氨蝶呤)的应答的生物标志物。此类生物标志物将减少鉴别有效治疗所需的时间,从而改善患者疗效并降低治疗成本。
B细胞体细胞超突变(SHM)和类别转换重组(CSR)是机械相关但不同的过程,需要精确靶向生成和修复单链和双链DNA断裂。不受理论束缚,我们假设在白血病(例如CLL)的背景下,进行中的SHM或CSR的存在可能揭示DNA损伤修复途径的功能,其与涉及DNA断裂生成的治疗策略(例如化学免疫治疗)潜在相关或抑制DNA修复机制(例如PARP抑制)。迄今为止,白血病(例如CLL)的预后完全依赖于IGHV区内SHM的量化。仍然迫切需要预测预后和/或对免疫缺陷病症的治疗的应答的生物标志物。此类生物标志物将减少鉴别有效治疗所需的时间,从而改善患者疗效并降低治疗成本。
我们已经开发了在接受治疗之前基于表征受试者的B细胞免疫组库来预测受试者的预后和/或对治疗的应答的方法。在一方面,本发明提供了通过在接受治疗之前鉴别受试者的B细胞免疫组库的体细胞超突变频率和类别转换重组频率来预测患有自身免疫疾病的受试者对治疗的临床应答的方法。在一方面,本发明提供了通过在接受治疗之前鉴别受试者的B细胞免疫组库的体细胞超突变频率和类别转换重组频率来预测患有免疫缺陷(例如,白血病)的受试者对治疗的临床应答的方法。
在一些实施例中,本文提供的用于在预测患有自身免疫疾病的受试者对治疗的临床应答性和/或治疗患有自身免疫疾病的受试者的方法中使用的方法、组合物和分析包含使用用于对受试者样本中的免疫受体序列(例如,T细胞受体(TCR)、B细胞受体(BCR或Ab)靶标)进行高精度扩增和测序的方法来鉴别来自受试者的治疗前样本中体细胞超重组(SHM)免疫受体亚类组的水平和频率。免疫受体测序数据用于鉴别免疫受体克隆和样本中免疫受体中具有体细胞超重组突变的所有克隆的频率,以及样本中转换和非转换亚类类型的频率作为受试者对治疗的临床应答的预测因子。在一些实施例中,以取决于样本中免疫受体克隆的转换和非转换同种型的SHM频率和水平的方式对受试者进行治疗。例如,在一些实施例中,受试者具有小于指定阈值(例如,8%)的IgM和/或IgD表达性B细胞的SHM频率并且免疫受体克隆频率由高频率的转换同种型IgG、IgA或IgE表达性B细胞主导表明受试者可能对化学治疗(例如,甲氨蝶呤)有应答并且是化学治疗(例如,甲氨蝶呤)的候选者,而受试者具有大于指定阈值(例如,8%)的IgM和/或IgD表达性B细胞的SHM频率并且免疫受体克隆频率由高频率的非转换IgM/IgD表达性B细胞主导表明受试者不太可能对化学治疗(例如,甲氨蝶呤)有应答并且不是化学治疗(例如,甲氨蝶呤)的候选者,并且更确切地说,此类受试者可能对免疫治疗和/或B细胞耗竭治疗更有应答,并且此类受试者可能优选地是免疫治疗和/或B细胞耗竭治疗的候选者。
在一些实施例中,本文提供的用于预测患有白血病疾病的受试者的预后和/或对治疗的临床应答性的方法、组合物和分析包含使用用于对免疫受体序列(例如,T细胞受体(TCR)、B细胞受体(BCR或Ab)靶标)进行高精度扩增和测序的方法来鉴别来自受试者的样本中体细胞超重组(SHM)和类别亚型重组(CSR)的水平和频率。免疫受体测序数据用于鉴别免疫受体克隆和样本中免疫受体中具有进行中的体细胞超重组突变(SHM)和/或类别亚型重组(CSR)的所有克隆的频率,以及样本中克隆的SHM频率作为受试者预后和/或对治疗的临床应答的预测因子。在一些实施例中,以取决于样本中免疫受体克隆中的进行中的SHM/CSR和SHM频率的方式预测受试者具有较差或良好的预后。在一些实施例中,根据所得的SHM/CSR谱对受试者进行分类,例如,I类:无进行中的CSR或SHM,无V基因SHM;II类:无进行中的CSR或SHM,V基因SHM大于零,小于6%;III类:无进行中的CSR或SHM,V基因SHM大于约6%;IV类:进行中的CSR和/或SHM。在某些实施例中,基于此类分类预测受试者具有特定预后,例如,I类:最差预后;II类:不良预后;III类:良好预后和IV类:最好预后。在一些实施例中,以取决于样本中免疫受体克隆中进行中的SHM/CSR和SHM频率的方式,替代地和/或附加地用治疗来治疗受试者,其任选地根据亚分类进行,例如,在一些实施例中,I类:可能是干细胞治疗的候选者,任选地添加化学治疗、放射治疗或DNA修复诱导剂中的任一种,II类:可能是化学治疗、放射治疗或免疫治疗与任选的DNA修复诱导剂的候选者,III类:可能是化学治疗或免疫治疗的候选者,以及IV类:可能是标准化学治疗或免疫治疗的候选者。
在本发明的附加实施例中,本文提供的用于在将具有自身免疫疾病或病症的症状的受试者诊断为患有慢性可变免疫缺陷病症的方法中使用的方法、组合物和分析包含使用用于对受试者样本中的免疫受体序列(例如,T细胞受体(TCR)、B细胞受体(BCR或Ab)靶标)进行高精度扩增和测序的方法来鉴别来自受试者的治疗前样本中体细胞超重组(SHM)免疫受体亚类组的水平和频率。免疫受体测序数据用于鉴别免疫受体克隆和样本中免疫受体中具有体细胞超重组突变的所有克隆的频率,以及样本中转换和非转换亚类类型的频率作为对原发性免疫缺陷病症的诊断。在一些实施例中,受试者的诊断取决于样本中免疫受体克隆的转换和非转换同种型的SHM频率和水平。例如,在一些实施例中,具有非常低水平和/或几乎可忽略水平的转换同种型IgG、IgA或IgE表达性B细胞并且IgM和/或IgD表达性B细胞的SHM频率小于指定阈值(例如,8%)的受试者被诊断为患有原发性免疫缺陷病症,例如慢性可变免疫缺陷病症。
在一些实施例中,所提供的方法包含使用V基因同一性和序列以及C基因同一性序列鉴别免疫受体克隆的SHM和Ig同种型和/或CSR。在一些实施例中,所提供的方法包含使用包含CDR3序列、CDR1和CDR3序列,或CDR2和CDR3序列或CDR1CDR2和CDR3序列以及C基因序列的序列分析免疫受体克隆。在一些实施例中,所提供的方法包含将BCR克隆鉴别为包含在核苷酸序列上类似或相同的BCR可变和C基因重排的那些。例如,彼此的一个或几个残基不同的BCR的很大一部分可能对抗原具有类似或相同的特异性,并且因此可以认为此类BCR是相关的。
在本发明的一个方面,提供了用于基于表征受试者的B细胞免疫组库来预测患有自身免疫病症的受试者对治疗的临床应答和/或患有免疫缺陷(例如,白血病)的受试者的预后的方法。所提供的方法包含执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子。在一些实施例中,所提供的方法包含多重扩增反应,其包含以下的至少一组:i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及ii)针对至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物。每组i)和ii)引物针对靶IgH BCR基因的编码序列,并且其中执行扩增产生代表样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子。在一些实施例中,所提供的方法还包含对靶免疫受体组库扩增子执行测序;从测序中鉴别免疫受体克隆以及鉴别免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;以及确定样本中B细胞免疫受体克隆的亚类以及样本中非转换IgM和/或IgD和转换IgG、IgA和/或IgE表达性细胞的频率。方法提供了将受试者鉴别为可能的(i)对化学治疗的应答者,这发生在当SHM频率小于样本中非转换IgM/IgD表达性B细胞中的频率阈值,并且免疫组库由样本中高频率的转换同种型IgG、IgA或IgE表达性B细胞主导时,(ii)对化学治疗的无应答者,这发生在当SHM频率大于频率阈值,并且免疫组库由样本中高频率的非转换IgM/IgD表达性B细胞主导时,和/或(iii)对免疫治疗的应答者,这发生在当SHM频率大于频率阈值,并且免疫组库由样本中高频率的非转换IgM/IgD表达性B细胞主导时。在一些实施例中,所提供的方法还包含对靶免疫受体组库扩增子执行测序;从测序中鉴别免疫受体克隆以及鉴别免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;以及进行中的SHM频率,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列,和/或进行中的类别转换重组(CSR)频率,其中在样本中的B细胞免疫受体克隆的同一可变谱系中鉴别出至少一种转换同种型和/或转换同种型的组合。方法提供了根据以下亚类对组库克隆进行分类:I类:无进行中的CSR或SHM,无V基因SHM;II类:无进行中的CSR或SHM,V基因SHM大于零,小于6%;III类:无进行中的CSR或SHM,V基因SHM大于约6%;IV类:进行中的CSR和/或SHM;以及基于B细胞免疫组库的亚分类鉴别受试者免疫缺陷预后:I类:最差预后,II类:不良预后,III类:良好预后,IV类:最好预后。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的受试者对治疗的临床应答的方法和/或用于基于表征受试者的B细胞免疫组库来预测患有免疫缺陷(例如,白血病)的受试者的预后的方法,多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:(1)在引物内包括两个或更多个修饰的核苷酸,其中至少一个包括在引物的末端附近或末端处,并且其中至少一个包括在引物的中心核苷酸位置处或其周围;(2)长度为约15到约40个碱基长;(3)Tm为高于60℃到约70℃;(4)与在样本中存在的非靶序列的交叉反应性低;(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的受试者对治疗的临床应答的方法和/或用于基于表征受试者的B细胞免疫组库来预测患有免疫缺陷(例如,白血病)的受试者的预后的方法,多个V基因引物和/或一个或多个C基因引物中的每一个包括一个或多个可切割基团,它们优选地位于(i)引物的末端附近或末端处,或(ii)引物的中心核苷酸附近或周围。在所提供的方法的一些实施例中,多个V基因引物和/或一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。在所提供的方法的一些实施例中,多个V基因引物与模板分子的FR1部分的至少一部分退火,并且其中一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少五个引物。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的受试者对治疗的临床应答的方法和/或用于基于表征受试者的B细胞免疫组库来预测患有免疫缺陷(例如,白血病)的受试者的预后的方法,所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。在特定实施例中,至少一组i)和ii)分别选自表3和表6至10的引物。在其它特定实施例中,至少一组i)和ii)选自表11的引物组。
在一些实施例中,提供了用于预测患有自身免疫疾病或病症的受试者对治疗的临床应答的方法和/或用于基于表征受试者的B细胞免疫组库来预测患有免疫缺陷(例如,白血病)的受试者的预后的方法,至少一组i)和ii)为i)(c)和ii)(a),其中多个V基因引物与模板分子的FR3部分的至少一部分退火,并且其中一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少五个引物。在特定实施例中,所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR3。在其它特定实施例中,至少一组i)和ii)分别选自表2和表6至10的引物。
在本文所提供的用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的受试者对治疗的临床应答的方法的特定实施例中,优选的SHM频率截止为8%。
在本文所提供的用于基于表征受试者的B细胞免疫组库来预测患有白血病的受试者的预后的方法的特定实施例中,III类的平均SHM频率约为2%。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的受试者对治疗的临床应答的方法和/或用于基于表征受试者的B细胞免疫组库来预测患有免疫缺陷(例如,白血病)的受试者的预后的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。在特定实施例中,通过连接添加至少一个衔接子。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的受试者对治疗的临床应答的方法和/或用于基于表征受试者的B细胞免疫组库来预测患有免疫缺陷(例如,白血病)的受试者的预后的方法,测序包括获得初始序列读段,将初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。在特定实施例中,生产性读段和拯救的生产性读段的组合是测序读段的至少509%。
在本发明的另一方面,提供了用于基于表征受试者的B细胞免疫组库来将具有自身免疫疾病或病症的症状的受试者诊断为患有慢性可变免疫缺陷病症的方法。所提供的方法包含执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子。在一些实施例中,所提供的方法包含多重扩增反应,其包含以下的至少一组:i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及ii)针对至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物。每组i)和ii)引物针对靶IgHBCR基因的编码序列,并且其中执行扩增产生代表样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子。所提供的方法还包含对靶免疫受体组库扩增子执行测序;从测序中鉴别免疫受体克隆以及鉴别免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;以及确定样本中B细胞免疫受体克隆的亚类以及样本中类别转换重组的频率。这些方法提供了:当SHM频率小于转换同种型中的频率阈值、样本中类别转换重组(CSR)的频率小于频率阈值,并且免疫组库由样本中的非转换IgM/IgD表达性B细胞主导时,将受试者鉴别为患有原发性免疫缺陷病症,从而诊断受试者患有慢性可变免疫缺陷病症。
在一些实施例中,提供了将具有自身免疫疾病或病症的症状的受试者诊断为患有慢性可变免疫缺陷病症的方法,多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:(1)在引物内包括两个或更多个修饰的核苷酸,其中至少一个包括在引物的末端附近或末端处,并且其中至少一个包括在引物的中心核苷酸位置处或其周围;(2)长度为约15到约40个碱基长;(3)Tm为高于60℃到约70℃;(4)与在样本中存在的非靶序列的交叉反应性低;(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
在所提供的将具有自身免疫疾病或病症的症状的受试者诊断为患有慢性可变免疫缺陷病症的方法的一些实施例中,多个V基因引物和/或一个或多个C基因引物中的每一个包括一个或多个可切割基团,它们优选地位于(i)引物的末端附近或末端处,或(ii)引物的中心核苷酸附近或周围。在所提供的方法的一些实施例中,多个V基因引物和/或一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。在所提供的方法的一些实施例中,多个V基因引物与模板分子的FR1部分的至少一部分退火,并且其中一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少五个引物。
在所提供的将具有自身免疫疾病或病症的症状的受试者诊断为患有慢性可变免疫缺陷病症的方法的一些实施例中,所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。在特定实施例中,至少一组i)和ii)分别选自表3和表6至10的引物。在其它特定实施例中,至少一组i)和ii)选自表11的引物组。
在所提供的方法的一些实施例中,至少一组i)和ii)为i)(c)和ii)(a),其中多个V基因引物与模板分子的FR3部分的至少一部分退火,并且其中一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少五个引物。在特定实施例中,所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR3。在其它特定实施例中,至少一组i)和ii)分别选自表2和表6至10的引物。
在一些实施例中,提供了将具有自身免疫疾病或病症的症状的受试者诊断为患有慢性可变免疫缺陷病症的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。在特定实施例中,通过连接添加至少一个衔接子。
在一些实施例中,提供了将具有自身免疫疾病或病症的症状的受试者诊断为患有慢性可变免疫缺陷病症的方法,测序包括获得初始序列读段,将初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。在特定实施例中,生产性读段和拯救的生产性读段的组合是测序读段的至少50%。
在本发明的另一方面,提供了用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法。所提供的方法包含执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子。在一些实施例中,所提供的方法包含多重扩增反应,其包含以下的至少一组:i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及ii)针对至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物。每组i)和ii)引物针对靶IgH BCR基因的编码序列,并且其中执行扩增产生代表样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子。所提供的方法还包含对靶免疫受体组库扩增子执行测序;从测序中鉴别免疫受体克隆以及鉴别免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;以及确定样本中B细胞免疫受体克隆的亚类以及样本中非转换IgM和/或IgD和转换IgG、IgA和/或IgE表达性细胞的频率。这些方法提供了用以下方法治疗受试者:(i)化学治疗,这发生在当SHM频率小于样本中非转换IgM/IgD表达性B细胞的频率阈值,并且免疫组库由样本中高频率的转换同种型IgG、IgA或IgE表达性B细胞主导时,(ii)免疫治疗,这发生在当SHM频率大于频率阈值,并且免疫组库由样本中高频率的非转换IgM/IgD表达性B细胞主导时。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法,多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:(1)在引物内包括两个或更多个修饰的核苷酸,其中至少一个包括在引物的末端附近或末端处,并且其中至少一个包括在引物的中心核苷酸位置处或其周围;(2)长度为约15到约40个碱基长;(3)Tm为高于60℃到约70℃;(4)与在样本中存在的非靶序列的交叉反应性低;(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
在所提供的用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法的一些实施例中,多个V基因引物和/或一个或多个C基因引物中的每一个包括一个或多个可切割基团,它们优选地位于(i)引物的末端附近或末端处,或(ii)引物的中心核苷酸附近或周围。在所提供的方法的一些实施例中,多个V基因引物和/或一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。在所提供的方法的一些实施例中,多个V基因引物与模板分子的FR1部分的至少一部分退火,并且其中一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少五个引物。
在所提供的用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法的一些实施例中,所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。在特定实施例中,至少一组i)和ii)分别选自表3和表6至10的引物。在其它特定实施例中,至少一组i)和ii)选自表11的引物组。
在所提供的用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法的一些实施例中,至少一组i)和ii)为i)(c)和ii)(a),其中多个V基因引物与模板分子的FR3部分的至少一部分退火,并且其中一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少五个引物。在特定实施例中,所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR3。在其它特定实施例中,至少一组i)和ii)分别选自表2和表6至10的引物。
在本文所提供的用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法的特定实施例中,优选的SHM频率截止为8%。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。在特定实施例中,通过连接添加至少一个衔接子。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法,测序包括获得初始序列读段,将初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。在特定实施例中,生产性读段和拯救的生产性读段的组合是测序读段的至少50%。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法,受试者患有类风湿性关节炎。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法,免疫治疗包含检查点阻断剂或B细胞耗竭剂。
在一些实施例中,提供了用于基于表征受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的受试者的方法,化学治疗包含甲氨蝶呤。
在本发明的另一方面,提供了用于基于表征受试者的B细胞免疫组库来治疗患有免疫缺陷(例如,白血病)的受试者的方法。所提供的方法包含执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子。在一些实施例中,所提供的方法包含多重扩增反应,其包含以下的至少一组:i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及ii)针对至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物。每组i)和ii)引物针对靶IgH BCR基因的编码序列,并且其中执行扩增产生代表样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子。所提供的方法还包含对靶免疫受体组库扩增子执行测序;从测序中鉴别免疫受体克隆以及鉴别免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;以及进行中的SHM频率,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列,和/或进行中的类别转换重组(CSR)频率,其中在样本中的B细胞免疫受体克隆的同一可变谱系中鉴别出至少一种转换同种型和/或转换同种型的组合。这些方法提供根据以下亚类对组库克隆进行分类:I类:无进行中的CSR或SHM,无V基因SHM;II类:无进行中的CSR或SHM,V基因SHM大于零,小于6%;III类:无进行中的CSR或SHM,V基因SHM大于约6%;IV类:进行中的CSR和/或SHM;以及基于B细胞免疫组库的亚分类治疗受试者:I类:干细胞治疗,任选地添加化学治疗、放射治疗或DNA修复诱导剂中的任一种;II类:化学治疗、放射治疗或免疫治疗与任选的DNA修复诱导剂,III类:化学治疗或免疫治疗,以及IV类:标准化学治疗或免疫治疗。
在一些实施例中,提供了用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法,多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:(1)在引物内包括两个或更多个修饰的核苷酸,其中至少一个包括在引物的末端附近或末端处,并且其中至少一个包括在引物的中心核苷酸位置处或其周围;(2)长度为约15到约40个碱基长;(3)Tm为高于60℃到约70℃;(4)与在样本中存在的非靶序列的交叉反应性低;(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
在所提供的用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法的一些实施例中,多个V基因引物和/或一个或多个C基因引物中的每一个包括一个或多个可切割基团,它们优选地位于(i)引物的末端附近或末端处,或(ii)引物的中心核苷酸附近或周围。在所提供的方法的一些实施例中,多个V基因引物和/或一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。在所提供的方法的一些实施例中,多个V基因引物与模板分子的FR1部分的至少一部分退火,并且其中一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少五个引物。
在所提供的用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法的一些实施例中,所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。在特定实施例中,至少一组i)和ii)分别选自表3和表6至10的引物。在其它特定实施例中,至少一组i)和ii)选自表11的引物组。
在所提供的用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法的一些实施例中,至少一组i)和ii)为i)(c)和ii)(a),其中多个V基因引物与模板分子的FR3部分的至少一部分退火,并且其中一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少五个引物。在特定实施例中,所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR3。在其它特定实施例中,至少一组i)和ii)分别选自表2和表6至10的引物。
在本文所提供的用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法的特定实施例中,III类的平均SHM频率约为2%。
在一些实施例中,提供了用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。在特定实施例中,通过连接添加至少一个衔接子。
在一些实施例中,提供了用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法,测序包括获得初始序列读段,将初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。在特定实施例中,生产性读段和拯救的生产性读段的组合是测序读段的至少50%。
在所提供的用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法的一些实施例中,受试者患有慢性淋巴细胞白血病。
在所提供的用于基于受试者的B细胞免疫组库来治疗患有白血病的受试者的方法的一些实施例中,免疫治疗包含靶向生物剂或B细胞耗竭剂。
在一些实施例中,多重下一代测序工作流程用于结合所提供的方法来有效检测和分析样本中的免疫组库。所提供的方法利用工作流程、组合物、系统和试剂盒在监测和解析受试者的细胞组库时用于对免疫细胞受体序列(例如,T细胞受体(TCR)、B细胞受体(BCR或Ab)靶标)进行高准确度地扩增和测序。靶免疫细胞受体基因已经进行VDJ或VJ基因片段的重排(或重组),所述基因片段取决于特定受体基因(例如,IgH、IgK、TCR β或TCR α)。在某些实施例中,本公开提供了使用如聚合酶链反应(PCR)等核酸扩增来富集免疫受体靶核酸的表达可变区以进行后续测序的工作流程、组合物和系统的使用方法。在某些实施例中,本公开提供了利用使用如PCR等核酸扩增来富集来自gDNA的重排的靶免疫细胞受体基因序列以进行后续测序的工作流程、组合物和系统的方法。在某些实施例中,本公开还提供了使用用于有效鉴别和去除扩增或测序衍生的错误以改善读段分配准确度并降低假阳性率的工作流程和系统的方法。具体地,本文描述的所提供的方法可以改善在核苷酸序列与基因组重组和高可变相关的测序应用中的准确度和性能。在一些实施例中,本文提供的方法、组合物、系统和试剂盒用于对样本中的表达的免疫受体的互补决定区(CDR)进行扩增和测序。在一些实施例中,本文提供的方法、组合物、系统和试剂盒用于对样本中的重排的免疫细胞受体gDNA的CDR进行扩增和测序。因此,与本文提供的方法结合,用于多重文库制备的多重免疫细胞受体表达组合物和针对免疫细胞受体基因的组合物,与下一代测序技术和工作流程解决方案(例如,手动或自动化)结合使用,可以用于有效检测和表征样本中的免疫组库。
TCR或BCR的CDR由进行V(D)J基因片段的重组以及在基因片段连接处的核苷酸的添加和/或缺失的基因组DNA产生。V(D)J基因片段的重组和后续超突变事件导致表达的免疫细胞受体的广泛多样性。由于V(D)J重组的随机性质,通常情况是T或B细胞受体基因组DNA的重排将不能产生功能性受体,而是产生所谓的“非生产性”重排。通常,非生产性重排具有框外可变和连接编码片段并导致过早终止密码子的存在和无关肽的合成。然而,处于如下等许多生物学或生理学原因,在基于cDNA的组库测序中非生产性TCR或BCR基因重排通常是罕见的:1)无义介导的衰变,其破坏含有过早终止密码子的mRNA,2)B和T细胞选择,其中只有具有功能性受体的B细胞和T细胞存活,并且3)等位基因排斥,其中在任何给定的B或T细胞中仅表达单个重排的受体等位基因。
因此,在一些实施例中,本文提供的方法和组合物用于扩增免疫细胞受体mRNA(例如BCR和/或TCR mRNA)的重组表达的可变区。在一些实施例中,从生物样本中提取的RNA转化为cDNA。多重扩增用于使包括受体的可变区的至少一部分的BCR或TCR cDNA的一部分富集。在一些实施例中,扩增的cDNA包括靶受体的一个或多个互补决定区CDR1、CDR2和/或CDR3。在一些实施例中,扩增的cDNA包括免疫球蛋白重链(IgH)的一个或多个互补决定区CDR1、CDR2和/或CDR3。
TCR序列和BCR序列还可以表现为在扩增反应期间或在测序过程期间引入的错误的非生产性重排。例如,在靶扩增或测序反应期间的插入或缺失(插入缺失)错误可以导致所得编码序列的读框中的移码。此类改变可以导致生产性重排的靶序列读段被解释为非生产性重排并从所鉴别的克隆型的组中丢弃。因此,在一些实施例中,本文提供的方法和系统包括用于从确定的免疫受体序列中鉴别和/或去除PCR或测序衍生的错误的方法。
在一些实施例中,所提供的方法和组合物用于扩增免疫细胞受体gDNA(例如,重排的BCR和/或TCR基因DNA)的重排可变区。多重扩增用于使包括受体的可变区的至少一部分的重排的BCR或TCR gDNA的一部分富集。在一些实施例中,扩增的gDNA包括靶受体的一个或多个互补决定区CDR1、CDR2和/或CDR3。在一些实施例中,扩增的gDNA包括IgH的一个或多个互补决定区CDR1、CDR2和/或CDR3。在一些实施例中,扩增的gDNA主要包括靶受体的CDR3,例如IgH的CDR3。
本文所用的“免疫细胞受体”和“免疫受体”可互换使用。
本文所用的术语“互补决定区”和“CDR”是指T细胞受体或抗体(免疫球蛋白)的区,其中分子补充抗原的构象,由此测定分子的特异性和与特定抗原的接触。在T细胞受体和抗体的可变区中,CDR散布有更保守的被称为框架区(FR)的区。T细胞受体和抗体的每个可变区含有3个CDR,命名为CDR1、CDR2和CDR3,还含有4个框架子区,命名为FR1、FR2、FR3和FR4。
如本文所用,术语“框架”或“框架区”或“FR”是指除本文定义的CDR残基之外的可变区的残基。构成框架的有四个独立的框架子区:FR1、FR2、FR3和FR4。
在所属领域中对于在受体分子(TCR或免疫球蛋白)内CDR和FR的确切位置的特定名称根据所采用的定义而变化。除非另外特别说明,否则本文使用IMGT名称来描述CDR和FR区(参见Brochet等人(2008)《核酸研究(Nucleic Acids Res.)》36:W503-508,特别以引用方式并入本文)。作为CDR/FR氨基酸名称的一个实例,构成T细胞受体β的FR和CDR的残基已经通过IMGT表征如下:残基1-26(FR1)、27-38(CDR1)、39-55(FR2)、56-65(CDR2)、66-104(FR3)、105-117(CDR3)和118-128(FR4)。
用于描述所述区的其它众所周知的标准名称包括存在于Kabat等人,(1991)《具有免疫学重要性的蛋白序列(Sequences of Proteins of Immunological Interest)》,第5版.马里兰州贝塞斯达的美国国家卫生研究院公共卫生服务部(Public Health Service,National Institutes of Health,Bethesda,Md.)中以及Chothia和Lesk 1987,《分子生物学期刊(J.Mol.Biol.)》196:901-917)中的那些文献,所述文献通过引用明确并入本文。作为CDR名称的一个实例,组成六种免疫球蛋白CDR的残基已经由Kabat表征如下:轻链可变区中的残基24-34(CDRL1)、50-56(CDRL2)和89-97(CDRL3)以及重链可变区中的31-35(CDRH1)、50-65(CDRH2)和95-102(CDRH3);并且由Chothia表征如下:轻链可变区中的残基26-32(CDRL1)、50-52(CDRL2)和91-96(CDRL3)以及重链可变区中的26-32(CDRH1)、53-55(CDRH2)和96-101(CDRH3)。
本文所用的术语“T细胞受体”或“T细胞抗原受体”或“TCR”是指脊椎动物例如哺乳动物的抗原/MHC结合异二聚体蛋白质产物、TCR基因复合体,包括人TCR α链、β链、γ链和δ链。例如,已经对人TCR β基因座的完整序列进行了测序,参见例如Rowen等(1996)Science272:1755-1762;已经对人TCR α基因座进行了测序和重新测序,参见,例如,Mackelprang等(2006)Hum Genet。119:255-266;以及关于T细胞受体V基因片段家族的一般分析,参见例如Arden(1995)Immunogenetics 42:455-500;其中的每一篇都通过引用具体地并入本文中用于在出版物中提供和引用的序列信息。
如本文所用,术语“抗体”或“免疫球蛋白”或“B细胞受体”或“BCR”意指由通过二硫键相互连接的四条多肽链(两条重(H)链和两条轻(L)链)(λ或κ)组成的免疫球蛋白分子。抗体具有与其结合的已知特异性抗原。抗体的每条重链包含重链可变区(本文中缩写为HCVR、HV或VH)和重链恒定区。重链恒定区包含三个结构域,CH1、CH2以及CH3。每条轻链包含轻链可变区(本文缩写为LCVR或VL或KV或LV以指定κ或λ轻链)和轻链恒定区。轻链恒定区包含一个结构域CL。重链决定了免疫球蛋白所属的类别或同种型。例如,在哺乳动物中,五个主要的免疫球蛋白同种型是IgA、IgD、IgG、IgE和IgM,并且所述免疫球蛋白同种型分别根据其含有的α、δ、ε、γ或μ重链进行分类。
如所提到的,TCR和BCR链CDR的多样性通过种系可变(V)、多样性(D)和连接(J)基因片段的重组以及在TCR和BCR基因重排的过程期间在基因片段连接中的每个基因片段连接处的核苷酸的独立添加和缺失产生。在编码BCR重链的重排核酸中,在V基因片段中发现CDR1和CDR2,并且CDR3包括V基因片段以及D和J基因片段中的一些基因片段。在编码BCR轻链的重排核酸中,在V基因片段中发现CDR1和CDR2,并且CDR3包括V基因片段和J基因片段中的一些基因片段。例如在编码TCR β和TCR δ的重排核酸中,在V基因片段中发现CDR1和CDR2,并且CDR3包括V基因片段以及D和J基因片段中的一些基因片段。在编码TCR α和TCRγ的重排核酸中,在V基因片区段中发现CDR1和CDR2,并且CDR3包括V基因片段和J基因片段中的一些基因片段。
在一些实施例中,多重扩增反应用于扩增源自从重排的BCR和/或TCR基因组DNA表达的mRNA的cDNA。在一些实施例中,多重扩增反应用于从源自生物样本的cDNA扩增BCR和/或TCR CDR的至少一部分。在一些实施例中,多重扩增反应用于从源自生物样本的cDNA扩增BCR和/或TCR的至少两个CDR。在一些实施例中,多重扩增反应用于从源自生物样本的cDNA扩增BCR和/或TCR的至少三个CDR。在一些实施例中,所得扩增子用于测定样本中表达的BCR和/或TCR CDR的核苷酸序列。在一些实施例中,测定包含至少3个CDR的此类扩增子的核苷酸序列用于鉴别和表征新颖的BCR和/或TCR等位基因。
在一些实施例中,多重扩增反应用于扩增已经进行V(D)J重排的BCR和/或TCR基因组DNA。在一些实施例中,多重扩增反应用于从源自生物样本的gDNA扩增包含BCR和/或TCRCDR的至少一部分的一个或多个核酸分子。在一些实施例中,多重扩增反应用于从源自生物样本的gDNA扩增包含BCR和/或TCR的至少两个CDR的一个或多个核酸分子。在一些实施例中,多重扩增反应用于从源自生物样本的gDNA扩增包含BCR和/或TCR的至少三个CDR的核酸分子。在一些实施例中,所得扩增子用于测定样本中的重排的BCR和/或TCR CDR的核苷酸序列。在一些实施例中,测定至少包含CDR3的此类扩增子的核苷酸序列用于鉴别和表征新颖的BCR和/或TCR等位基因。
在多重扩增反应的一些实施例中,使用的每个引物组靶向同一BCR或TCR区,然而所述组中的不同引物允许靶向基因的不同V(D)J基因重排。例如,用于扩增表达的IgH或重排的IgH gDNA的引物组全部设计成靶向分别来自IgH mRNA或IgH gDNA的一个或多个相同的区,但所述组中的单独的引物导致各种IgH VDJ基因组合的扩增。在一些实施例中,至少一个引物或引物组针对免疫受体基因的相对保守区(例如,C基因的一部分),并且另一个引物组包括针对同一基因的更可变区(例如,V基因的一部分)的各种引物。在其它实施例中,至少一个引物组包括针对免疫受体基因的J基因片段的至少一部分的各种引物,并且另一个引物组包括针对同一基因的V基因片段的至少一部分的各种引物。
在一些实施例中,多重扩增反应用于扩增源自从包括重排的IgH、IgK和IgL基因组DNA的重排的BCR基因组DNA表达的mRNA的cDNA。在一些实施例中,在多重扩增反应中从cDNA扩增BCRCDR的至少一部分,例如CDR3。在一些实施例中,在多重扩增反应中从cDNA扩增BCR的至少两个CDR部分。在某些实施例中,多重扩增反应用于至少扩增BCRcDNA的CDR1区、CDR2区和CDR3区。在一些实施例中,所得扩增子用于测定表达的BCRCDR核苷酸序列。在一些实施例中,所得扩增子用于测定表达的BCRCDR核苷酸序列和所述序列的Ig同种型。在一些实施例中,所得扩增子用于测定表达的IgH CDR核苷酸序列和Ig同种型以及Ig亚同种型。
在一些实施例中,多重扩增反应用于扩增重排的BCR基因组DNA,包括重排的IgH、IgK和IgL基因组DNA。在一些实施例中,在多重扩增反应中从gDNA扩增BCRCDR的至少一部分,例如CDR3。在一些实施例中,在多重扩增反应中从gDNA扩增BCR的至少两个CDR部分。在某些实施例中,多重扩增反应用于至少扩增重排BCRgDNA的CDR1区、CDR2区和CDR3区。在一些实施例中,所得扩增子用于测定重排的BCRCDR核苷酸序列。在一些实施例中,所得扩增子用于测定重排的BCRCDR核苷酸序列和所述序列的Ig同种型。
在一些实施例中,用设计用于产生扩增子的引物组执行多重扩增反应,所述扩增子包括靶免疫受体mRNA的表达的CDR1区、CDR2区和/或CDR3区。在一些实施例中,使用以下执行多重扩增反应:(i)每个引物针对V基因的框架区FR1的至少一部分的一组引物以及(ii)针对靶免疫受体的至少一个C基因的一部分的至少一个引物。在其它实施例中,使用以下执行多重扩增反应:(i)每个引物针对V基因的框架区FR2的至少一部分的一组引物以及(ii)针对靶免疫受体的至少一个C基因的一部分的至少一个引物。在其它实施例中,使用以下执行多重扩增反应:(i)每个引物针对V基因的框架区FR3的至少一部分的一组引物以及(ii)针对靶免疫受体的至少一个C基因的一部分的至少一个引物。在一些实施例中,用设计成产生包括靶mRNA的一种或多种表达的IgH同种型的扩增子的引物组执行多重扩增反应,并且使用以下执行此类反应:(i)上述FR1引物组、FR2引物组或FR3引物组之一和(ii)每个引物针对IgA、IgD、IgE、IgG和/或IgM的至少一个C基因的一部分的一组引物。在一些实施例中,一个或多个针对C基因的引物是所述一个或多个C基因的5′末端的约200个核苷酸内的针对C基因的编码序列。在一些实施例中,一个或多个针对C基因的引物是所述一个或多个C基因的5′末端的约150个核苷酸内的针对C基因的编码序列。在一些实施例中,一个或多个针对C基因的引物是所述一个或多个C基因的5′末端的约100个核苷酸内的针对C基因的编码序列。在一些实施例中,一个或多个针对C基因的引物是所述一个或多个C基因的5′末端的约50个核苷酸内、约50到约150个核苷酸内、约75到约175个核苷酸内、或约100到约200个核苷酸内的针对C基因的编码序列。在一些实施例中,一个或多个针对C基因的引物针对不仅区分同种型而且还允许测定亚同种型的针对C基因的基因编码测序。例如,在一些实施例中,一个或多个针对C基因的引物在扩增子中产生恒定区的足够部分,从而可以基于所测定的序列数据测定亚同种型。在一些实施例中,一个或多个针对C基因的引物包括针对允许鉴别IgG1亚同种型、IgG2亚同种型、IgG3亚同种型、IgG4亚同种型、IgA1亚同种型和IgA2亚同种型的IgG和/或IgAC基因编码序列的引物。
在一些实施例中,多重扩增反应使用(i)其中的每一个都与V基因FR1区的至少一部分退火的一组引物和(ii)与恒定(C)基因的一部分退火的至少一个引物以扩增BCRcDNA,使得所得扩增子包括BCRmRNA的CDR1编码部分、CDR2编码部分和CDR3编码部分。在某些实施例中,将针对FR1的引物组与一组至少两个针对C基因的引物组合以产生至少包括BCRmRNA的CDR1编码部分、CDR2编码部分和CDR3编码部分的扩增子。在一些实施例中,将针对IgHFR1的引物组与针对两个不同IgH同种型的编码部分的一组至少两个C基因引物组合以产生至少包括IgH mRNA的CDR1编码部分、CDR2编码部分和CDR3编码部分的扩增子。在一些实施例中,将针对IgH FR1的引物组与针对不同IgH同种型的编码部分的至少三个、至少四个或至少五个引物组合。例如,表3中示出了对IgH V基因FR1区特异的示例性引物,并且表6-10中示出了对IgH C基因特异的示例性引物。
在一些实施例中,多重扩增反应使用(i)其中的每一个都与V基因FR2区的至少一部分退火的一组引物和(ii)与C基因的一部分退火的至少一个引物以扩增BCRcDNA,使得所得扩增子包括BCRmRNA的CDR2编码部分和CDR3编码部分。在某些实施例中,将此类针对FR2的引物组与至少两个针对C基因的引物组合以产生包括BCRmRNA的CDR2编码部分和CDR3编码部分的扩增子。在一些实施例中,将针对IgH FR2的引物组与针对两个不同IgH同种型的编码部分的一组至少两个C基因引物组合以产生具有IgH mRNA的CDR2和CDR3编码部分的扩增子。在一些实施例中,将针对IgH FR2的引物组与针对不同IgH同种型的编码部分的至少三个、至少四个或至少五个C基因引物组合。示例性针对FR2的引物包括由欧洲学术实验室和研究医院的联盟开发和标准化并在表4中示出的BIOMED-2引物(van Dongen等人.(2003)《白血病》17:2257-2327)。表6-10中示出对IgH C基因特异的示例性引物。
在一些实施例中,多重扩增反应使用(i)其中的每一个都与V基因FR3区的至少一部分退火的一组引物和(ii)与C基因的一部分退火的至少一个引物以扩增BCRcDNA,使得所得扩增子主要包括BCRmRNA的CDR3编码部分。在某些实施例中,将此类针对FR3的引物组与至少两个针对C基因的引物组合以产生具有BCRmRNA的CDR3编码部分的扩增子。在一些实施例中,将针对IgH FR3的引物组与针对两个不同IgH同种型的编码部分的一组至少两个C基因引物组合以产生具有IgH mRNA的CDR3编码部分的扩增子。在一些实施例中,将针对IgHFR3的引物组与针对不同IgH同种型的编码部分的至少三个、至少四个或至少五个C基因引物组合。例如,表2中示出了对IgH V基因FR3区特异的示例性引物,并且表6-10中示出了对IgH C基因特异的示例性引物。
在一些实施例中,用设计用于产生扩增子的引物组执行多重扩增反应,所述扩增子包括靶免疫受体mRNA或重排的gDNA的CDR1区、CDR2区和/或CDR3区。在一些实施例中,使用以下执行多重扩增反应:(i)每个引物针对V基因的框架区FR1的至少一部分的一组引物以及(ii)每个引物针对靶免疫受体的J基因的至少一部分的一组引物。在其它实施例中,使用以下执行多重扩增反应:(i)每个引物针对V基因的框架区FR2的至少一部分的一组引物以及(ii)每个引物针对靶免疫受体的J基因的至少一部分的一组引物。在其它实施例中,使用以下执行多重扩增反应:(i)每个引物针对V基因的框架区FR3的至少一部分的一组引物以及(ii)每个引物针对靶免疫受体的J基因的至少一部分的一组引物。
在一些实施例中,多重扩增反应使用(i)其中的每一个都与V基因FR1区的至少一部分退火的一组引物和(ii)与J基因的一部分退火的一组引物以扩增BCR核酸,使得所得扩增子包括BCRmRNA或重排的gDNA的CDR1编码部分、CDR2编码部分和CDR3编码部分。例如,表3中示出了对IgH V基因FR1区特异的示例性引物,并且表5中示出了对IgH J基因特异的示例性引物。
在一些实施例中,多重扩增反应使用(i)其中的每一个均与V基因FR2区的至少一部分退火的一组引物和(ii)与J基因的一部分退火的一组引物以扩增BCR核酸,使得所得扩增子包括BCRmRNA或重排的gDNA的CDR2编码部分和CDR3编码部分。例如,表4中示出了对IgHV基因FR2区特异的示例性引物,并且表5中示出了对IgH J基因特异的示例性引物。
在一些实施例中,多重扩增反应使用(i)其中的每一个都与V基因FR3区的至少一部分退火的一组引物和(ii)与J基因的一部分退火的一组引物以扩增BCR核酸,使得所得扩增子主要包括BCRmRNA或重排的gDNA的CDR3编码部分。例如,表2中示出了对IgH V基因FR3区特异的示例性引物,并且表5中示出了对IgH J基因特异的示例性引物。
在一些实施例中,提供了用于对表达的BCR可变区的至少一部分进行多重扩增的组合物。在一些实施例中,组合物包含针对选自由以下组成的组的重排靶免疫受体基因的V基因框架区的一部分和恒定(C)基因的一部分的多组引物对试剂:免疫球蛋白重链(IgH)、免疫球蛋白轻链λ(IgL)和免疫球蛋白轻链κ(IgK)。在一些实施例中,组合物包含针对选自由IgH、IgL和IgK组成的组的重排靶免疫受体基因的V基因框架区的一部分和J基因的一部分的多组引物对试剂。
在一些实施例中,组合物包含(i)针对重排的IgH基因的IgH V基因框架区的一部分和IgH C基因的一部分的多组引物对试剂和(ii)针对重排的TCR β基因的TCR βV基因框架区的一部分和TCR βC基因的一部分的多组引物对试剂。在一些实施例中,组合物包含(i)针对重排的IgH基因的IgH V基因框架区的一部分和IgH J基因的一部分的多组引物对试剂和(ii)针对重排的TCR β基因的TCR βJ基因框架区的一部分和TCRV基因的一部分的多组引物对试剂。
用至少两个引物执行通过PCR的扩增。对于本文提供的方法,使用足以在所关注的基因座处扩增可变序列的全部或限定部分的一组引物,所述基因座可以包括上述TCR和免疫球蛋白基因座中的任何或全部TCR和免疫球蛋白基因座。在一些实施例中,可以使用本文概述的各种参数或标准来选择靶特异性引物组以进行多重扩增。
在一些实施例中,在多重反应中使用的引物组被设计成在所关注的基因座处扩增至少50%的已知表达的重排或gDNA重排。在某些实施例中,在多重反应中使用的引物组被设计成在所关注的基因座处扩增至少75%、至少85%、至少90%、至少95%、至少97%、至少98%或更多的已知表达的重排或gDNA重排。又例如,使用表3的27个正向引物(每个引物针对来自不同IgHV基因的FR1区的一部分)与表6-10的至少一个反向引物(每个引物针对不同IgH C基因的一部分)组合将为给定同种型扩增目前已知的表达的IgH重排中的所有重排。又例如,使用表2的68个正向引物(每个引物针对来自不同IgH V基因的FR3区的一部分)与表6-10的至少一个反向引物(每个引物针对不同IgH C基因的一部分)组合将为给定同种型扩增目前已知的表达的IgH重排中的所有重排。又例如,使用表2的68个正向引物(每个引物针对来自不同IgH V基因的FR3区的一部分)与表5的4个反向引物(每个引物针对不同IgH J基因的一部分)组合将扩增目前已知的表达的IgH重排或gDNAIgH重排中的所有重排。又例如,使用表3的27个正向引物(每个引物针对来自不同IgH V基因的FR1区的一部分)与表5的4个反向引物(每个引物针对不同IgH J基因的一部分)组合将扩增目前已知的表达的IgH重排或gDNAIgH重排中的所有重排。
例如,此类多重扩增反应至少包括15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个或90个,优选地22个、23个、24个、25个、26个、27个、28个、29个、30个、34个、38个、42个、46个、50个、54个、58个或62个反向引物,其中每个反向引物针对对应于一个或多个BCRV基因FR1区的至少一部分的序列。在此类实施例中,针对BCRV基因FR1区的所述多个反向引物与针对对应于同一BCR基因的恒定基因的至少一部分的序列的至少1个正向引物组合。在一些实施例中,针对BCRV基因FR1区的所述多个反向引物与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10、至少11、至少12、至少15、或约2到约7、约5到约20、约5到约15或约7到约12个正向引物组合,每个引物都针对对应于同一BCR基因的恒定基因的至少一个基因的至少一部分的序列。在多重扩增反应的一些实施例中,针对BCRV基因FR1的引物可以是正向引物,并且一个或多个针对BCRC基因的引物可以是一个或多个反向引物。因此,在一些实施例中,多重扩增反应至少包括15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个或90个,优选地22个、23个、24个、25个、26个、27个、28个、29个、30个、34个、38个、42个、46个、50个、54个、58个或62个正向引物,其中每个正向引物针对对应于一个或多个BCRV基因FR1区的至少一部分的序列。在此类实施例中,针对BCRV基因FR1区的所述多个正向引物与针对对应于同一BCR基因的C基因的至少一部分的序列的至少1个反向引物组合。在一些实施例中,针对BCRV基因FR1区的所述多个正向引物与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10、至少11、至少12、至少15、或约2到约7、约5到约20、约5到约15或约7到约12个反向引物组合,每个引物都针对对应于同一BCR基因的C基因的至少一个基因的至少一部分的序列。在一些实施例中,此类FR1和C基因扩增引物组可以针对IgH基因序列。在一些优选实施例中,将针对不同IgH V基因FR1区的约22到约35个反向引物与针对IgH C基因的一部分的约2到约8个正向引物组合。在其它优选实施例中,将针对不同IgH V基因FR1区的约22到约35个反向引物与针对IgH C基因的一部分的约5到约15个正向引物组合。在其它优选实施例中,将针对不同IgH V基因FR1区的约48到约60个反向引物与针对IgH C基因的一部分的约5到约15个正向引物组合。在一些优选实施例中,将针对不同IgH V基因FR1区的约22到约35个正向引物与针对IgH C基因的一部分的约2到约8个反向引物组合。在其它优选实施例中,将针对不同IgH V基因FR1区的约22到约35个正向引物与针对IgH C基因的一部分的约5到约15个反向引物组合。在又其它优选实施例中,将针对不同IgH V基因FR1区的约48到约60个正向引物与针对IgH C基因的一部分的约5到约15个反向引物组合。在一些优选实施例中,针对IgH V基因FR1区的正向引物选自表3中列出的那些正向引物,并且针对IgH C基因的反向引物选自表6-10中列出的那些反向引物。在其它实施例中,FR1和C基因扩增引物组可以针对Ig轻链λ、Ig轻链κ、TCR α、TCR γ、TCR δ或TCRβ基因序列。
在一些实施例中,多重扩增反应至少包括5个、10个、15个、20个、25个、30个、40个、50个、60个、70个、80个或90个反向引物,其中每个反向引物针对对应于一个或多个BCRV基因FR2区的至少一部分的序列。在此类实施例中,针对BCRV基因FR2区的所述多个反向引物与针对对应于同一BCR基因的C基因的至少一部分的序列的至少1个正向引物组合。在一些实施例中,针对BCRV基因FR2区的所述多个反向引物与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10、至少11、至少12、至少15、或约2到约7、约5到约20、约5到约15或约7到约12个正向引物组合,每个引物都针对对应于同一BCR基因的C基因的至少一个基因的至少一部分的序列。在多重扩增反应的一些实施例中,针对BCRV基因FR2的引物可以是正向引物,并且一个或多个针对BCRC基因的引物可以是一个或多个反向引物。因此,在一些实施例中,多重扩增反应至少包括5个、10个、15个、20个、25个、30个、40个、50个、60个、70个、80个或90个正向引物,其中每个正向引物针对对应于一个或多个BCRV基因FR2区的至少一部分的序列。在此类实施例中,针对BCRV基因FR2区的所述多个正向引物与针对对应于同一BCR基因的C基因的至少一部分的序列的至少1个反向引物组合。在一些实施例中,针对BCRV基因FR2区的所述多个正向引物与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10、至少11、至少12、至少15、或约2到约7、约5到约20、约5到约15或约7到约12个反向引物组合,每个引物都针对对应于同一BCR基因的C基因的至少一个基因的至少一部分的序列。在一些实施例中,此类FR2和C基因扩增引物组可以针对IgH基因序列。在一些实施例中,将针对不同IgH V基因FR2区的约5到约15个反向引物与针对IgH C基因的一部分的约2到约8个正向引物组合。在一些实施例中,将针对不同IgH V基因FR2区的约5到约15个反向引物与针对IgH C基因的一部分的约5到约15个正向引物组合。在一些实施例中,将针对不同IgHV基因FR2区的约5到约15个正向引物与针对IgH C基因的一部分的约2到约8个反向引物组合。在一些实施例中,将针对不同IgH V基因FR2区的约5到约15个正向引物与针对IgH C基因的一部分的约5到约15个反向引物组合。在一些优选实施例中,针对IgHV基因FR2区的正向引物选自表4中列出的那些正向引物,并且针对IgH C基因的反向引物选自表6-10中列出的那些反向引物。在其它实施例中,FR2和C基因扩增引物组可以针对Ig轻链λ、Ig轻链κ、TCR α、TCR γ、TCR δ或TCR β基因序列。
在一些实施例中,多重扩增反应至少包括20个、25个、30个、40个、45个,优选地50个、55个、60个、65个、70个、75个、80个、85个或90个反向引物,其中每个反向引物针对对应于一个或多个BCRV基因FR3区的至少一部分的序列。在此类实施例中,针对BCRV基因FR3区的所述多个反向引物与针对对应于同一BCR基因的C基因的至少一部分的序列的至少1个正向引物组合。在一些实施例中,针对BCRV基因FR3区的所述多个反向引物与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10、至少11、至少12、至少15、或约2到约7、约5到约20、约5到约15或约7到约12个正向引物组合,每个引物都针对对应于同一BCR基因的C基因的至少一个基因的至少一部分的序列。在多重扩增反应的一些实施例中,针对BCRV基因FR3的引物可以是正向引物,并且一个或多个针对BCRC基因的引物可以是一个或多个反向引物。因此,在一些实施例中,多重扩增反应至少包括20个、25个、30个、40个、45个,优选地50个、55个、60个、65个、70个、75个、80个、85个或90个反向引物,其中每个正向引物针对对应于一个或多个BCRV基因FR3区的至少一部分的序列。在此类实施例中,针对BCRV基因FR3区的所述多个正向引物与针对对应于同一BCR基因的C基因的至少一部分的序列的至少1个反向引物组合。在一些实施例中,针对BCRV基因FR3区的所述多个正向引物与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10、至少11、至少12、至少15、或约2到约7、约5到约20、约5到约15或约7到约12个反向引物组合,每个引物都针对对应于同一BCR基因的C基因的至少一个基因的至少一部分的序列。在一些实施例中,此类FR3和C基因扩增引物组可以针对IgH基因序列。在一些优选实施例中,将针对不同IgH V基因FR3区的约62到约75个反向引物与针对IgH C基因的一部分的约2到约8个正向引物组合。在其它优选实施例中,将针对不同IgH V基因FR3区的约62到约75个反向引物与针对IgH C基因的一部分的约5到约15个正向引物组合。在一些优选实施例中,将针对不同IgH V基因FR3区的约62到约75个正向引物与针对IgH C基因的一部分的约2到约8个反向引物组合。在其它优选实施例中,将针对不同IgHV基因FR3区的约62到约75个正向引物与针对IgH C基因的一部分的约5到约15个反向引物组合。在一些优选实施例中,针对IgH V基因FR3区的正向引物选自表2中列出的那些正向引物,并且针对IgH C基因的反向引物选自表6-10中列出的那些反向引物。在其它实施例中,FR3和C基因扩增引物组可以针对Ig轻链λ、Ig轻链κ、TCR α、TCR γ、TCR δ和TCR β基因序列。
在一些实施例中,此类多重扩增反应至少包括15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个或90个,优选地22个、23个、24个、25个、26个、27个、28个、29个、30个、34个、38个、42个、46个、50个、54个、58个或62个反向引物,其中每个反向引物针对对应于一个或多个BCRV基因FR1区的至少一部分的序列。在此类实施例中,针对BCRV基因FR1区的所述多个反向引物与针对对应于同一BCR基因的J基因的至少一部分的序列的至少2个、3个、4个、5个、6个、8个或约3-6个正向引物组合。在多重扩增反应的一些实施例中,针对BCRV基因FR1的引物可以是正向引物,并且针对BCRJ基因的引物可以是反向引物。因此,在一些实施例中,多重扩增反应至少包括15个、20个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个或90个,优选地22个、23个、24个、25个、26个、27个、28个、29个、30个、34个、38个、42个、46个、50个、54个、58个或62个正向引物,其中每个正向引物针对对应于一个或多个BCRV基因FR1区的至少一部分的序列。在此类实施例中,针对BCRV基因FR1区的所述多个正向引物与针对对应于同一BCR基因的J基因的至少一部分的序列的至少2个、3个、4个、5个、6个、8个或约3-6个反向引物组合。在一些实施例中,此类FR1和J基因扩增引物组可以针对IgH基因序列。在一些优选实施例中,将针对不同IgH V基因FR1区的约22到约35个反向引物与针对不同IgH J基因的约3到约6个正向引物组合。在一些优选实施例中,将针对不同IgH V基因FR1区的约22到约35个正向引物与针对不同IgH J基因的约3到约6个反向引物组合。在一些优选实施例中,针对IgH V基因FR1区的正向引物选自表3中列出的那些正向引物,并且针对IgH J基因的反向引物选自表5中列出的那些反向引物。在其它实施例中,FR1和J基因扩增引物组可以针对Ig轻链λ、Ig轻链κ、TCRα、TCR γ、TCR δ或TCR β基因序列。
在一些实施例中,多重扩增反应至少包括5个、10个、15个、20个、25个、30个、40个、50个、60个、70个、80个或90个反向引物,其中每个反向引物针对对应于一个或多个BCRV基因FR2区的至少一部分的序列。在此类实施例中,针对BCRV基因FR2区的所述多个反向引物与针对对应于同一BCR基因的J基因的至少一部分的序列的至少2个、3个、4个、5个、6个、8个或约3-6个正向引物组合。在多重扩增反应的一些实施例中,针对BCRV基因FR2的引物可以是正向引物,并且针对BCRJ基因的引物可以是反向引物。因此,在一些实施例中,多重扩增反应至少包括5个、10个、15个、20个、25个、30个、40个、50个、60个、70个、80个或90个正向引物,其中每个正向引物针对对应于一个或多个BCRV基因FR2区的至少一部分的序列。在此类实施例中,针对BCRV基因FR2区的所述多个正向引物与针对对应于同一BCR基因的J基因的至少一部分的序列的至少2个、3个、4个、5个、6个、8个或约3-6个反向引物组合。在一些实施例中,此类FR2和J基因扩增引物组可以针对IgH基因序列。在一些优选实施例中,将针对不同IgH V基因FR2区的约5到约15个反向引物与针对不同IgH J基因的约3到约6个正向引物组合。在一些优选实施例中,将针对不同IgHV基因FR2区的约5到约15个正向引物与针对不同IgH J基因的约3到约6个反向引物组合。在一些优选实施例中,针对IgHV基因FR2区的正向引物选自表4中列出的那些正向引物,并且针对IgH J基因的反向引物选自表5中列出的那些反向引物。在其它实施例中,FR2和J基因扩增引物组可以针对Ig轻链λ、Ig轻链κ、TCRα、TCR γ、TCR δ或TCR β基因序列。
在一些实施例中,多重扩增反应至少包括20个、25个、30个、40个、45个,优选地50个、55个、60个、65个、70个、75个、80个、85个或90个反向引物,其中每个反向引物针对对应于一个或多个BCRV基因FR3区的至少一部分的序列。在此类实施例中,针对BCRV基因FR3区的所述多个反向引物与针对对应于同一BCR基因的J基因的至少一部分的序列的至少2个、3个、4个、5个、6个、8个或约3-6个正向引物组合。在多重扩增反应的一些实施例中,针对BCRV基因FR3的引物可以是正向引物,并且针对BCRJ基因的引物可以是反向引物。因此,在一些实施例中,多重扩增反应至少包括20个、25个、30个、40个、45个,优选地50个、55个、60个、65个、70个、75个、80个、85个或90个正向引物,其中每个正向引物针对对应于一个或多个BCRV基因FR3区的至少一部分的序列。在此类实施例中,针对BCRV基因FR3区的所述多个正向引物与针对对应于同一BCR基因的J基因的至少一部分的序列的至少2个、3个、4个、5个、6个、8个或约3-6个反向引物组合。在一些实施例中,此类FR3和J基因扩增引物组可以针对IgH基因序列。在一些优选实施例中,将针对不同IgH V基因FR3区的约62到约75个反向引物与针对不同IgH J基因的约3到约6个正向引物组合。在一些优选实施例中,将针对不同IgH V基因FR3区的约62到约75个正向引物与针对不同IgH J基因的约3到约6个反向引物组合。在一些优选实施例中,针对IgH V基因FR3区的正向引物选自表2中列出的那些正向引物,并且针对IgH J基因的反向引物选自表5中列出的那些反向引物。在其它实施例中,FR3和J基因扩增引物组可以针对Ig轻链λ、Ig轻链κ、TCR α、TCR γ、TCR δ和TCR β基因序列。
在一些实施例中,在多重扩增反应中正向引物的浓度约等于反向引物的浓度。在其它实施例中,在多重扩增反应中正向引物的浓度约为反向引物的浓度的两倍。在其它实施例中,在多重扩增反应中正向引物的浓度约为反向引物的浓度的一半。在一些实施例中,靶向V基因FR区的引物中的每个引物的浓度为约5nM到约2000nM。在一些实施例中,靶向V基因FR区的引物中的每个引物的浓度为约50nM到约800nM。在一些实施例中,靶向V基因FR区的引物中的每个引物的浓度为约50nM到约400nM或约100nM到约500nM。在一些实施例中,靶向V基因FR区的引物中的每个引物的浓度为约200nM、约400nM、约600nM或约800nM。在一些实施例中,靶向V基因FR区的引物中的每个引物的浓度为约5nM、约10nM、约50nM、约100nM或约150nM。在一些实施例中,靶向V基因FR区的引物中的每个引物的浓度为约1000nM、约1250nM、约1500nM、约1750nM或约2000nM。在一些实施例中,靶向V基因FR区的引物中的每个引物的浓度为约50nM到约800nM。在一些实施例中,靶向J基因的引物中的每个引物的浓度为约5nM到约2000nM。在一些实施例中,靶向J基因的引物中的每个引物的浓度为约50nM到约800nM。在一些实施例中,靶向J基因的引物中的每个引物的浓度为约50nM到约400nM或约100nM到约500nM。在一些实施例中,靶向J基因的引物中的每个引物的浓度为约200nM、约400nM、约600nM或约800nM。在一些实施例中,靶向J基因的引物中的每个引物的浓度为约5nM、约10nM、约50nM、约100nM或约150nM。在一些实施例中,靶向J基因的引物中的每个引物的浓度为约1000nM、约1250nM、约1500nM、约1750nM或约2000nM。在一些实施例中,靶向J基因的引物中的每个引物的浓度为约50nM到约800nM。在一些实施例中,靶向C基因的引物中的每个引物的浓度为约5nM到约2000nM。在一些实施例中,靶向C基因的引物中的每个引物的浓度为约50nM到约800nM。在一些实施例中,靶向C基因的引物中的每个引物的浓度为约50nM到约400nM或约100nM到约500nM。在一些实施例中,靶向C基因的引物中的每个引物的浓度为约200nM、约400nM、约600nM或约800nM。在一些实施例中,靶向C基因的引物中的每个引物的浓度为约5nM、约10nM、约50nM、约100nM或约150nM。在一些实施例中,靶向C基因的引物中的每个引物的浓度为约1000nM、约1250nM、约1500nM、约1750nM或约2000nM。在一些实施例中,靶向C基因的引物中的每个引物的浓度为约50nM到约800nM。在一些实施例中,在多重反应中每个正向和反向引物的浓度为约50nM、约100nM、约200nM或约400nM。在一些实施例中,在多重反应中每个正向和反向引物的浓度为约5nM到约2000nM。在一些实施例中,在多重反应中每个正向和反向引物的浓度为约50nM到约800nM。在一些实施例中,在多重反应中每个正向和反向引物的浓度为约50nM到约400nM或约100nM到约500nM。在一些实施例中,在多重反应中每个正向和反向引物的浓度为约600nM、约800nM、约1000nM、约1250nM、约1500nM、约1750nM或约2000nM。在一些实施例中,在多重反应中每个正向和反向引物的浓度为约5nM、约10nM、约150nM或50nM到约800nM。
在一些实施例中,V基因FR和针对C基因靶标的引物以扩增引物对的形式组合,以扩增靶免疫受体cDNA序列并产生靶扩增子。通常,靶扩增子的长度将取决于哪个V基因引物组(例如,FR1、FR2或针对FR3的引物)与一个或多个C基因引物配对。因此,在一些实施例中,靶扩增子的长度可以在约100个核苷酸(或碱基或碱基对)到约600个核苷酸(或碱基或碱基对)的范围内。在一些实施例中,靶扩增子的长度可以在约80个核苷酸到约600个核苷酸的范围内。在一些实施例中,靶扩增子的长度为约200到约600或约300到约600个核苷酸。在一些实施例中,靶扩增子的长度为约80到约140、约90到约130、或约100到约120个核苷酸。在一些实施例中,靶扩增子的长度为约250到约275、约250到约350、约300到约350、约310到约330、约325到约375、约300到约400、约350到约400、约350到约425、约350到约450、约380到约410、约375到约425、约400到约500、约425到约500、约450到约550、约500到约600、约400到约500、或约400到约600个核苷酸。在一些实施例中,靶扩增子的长度为约80、约100、约120、约140、约200、约250、约275、约300、约320、约350、约375、约400、约425、约450、约500、约550或约600个核苷酸。在一些实施例中,IgH扩增子的长度为约100、约80到约140、约90到约130或约100到约120个核苷酸。在一些实施例中,IgH扩增子的长度为约320、约300到约350或约310到约330个核苷酸。在一些实施例中,IgH扩增子的长度为约400、约375到约425或约390到约410个核苷酸。
在一些实施例中,V基因FR和针对J基因靶标的引物以扩增引物对的形式组合,以扩增靶免疫受体cDNA或重排gDNA序列并产生靶扩增子。通常,靶扩增子的长度将取决于哪个V基因引物组(例如,FR1、FR2或针对FR3的引物)与J基因引物配对。因此,在一些实施例中,靶扩增子的长度可以在约50个核苷酸到约350个核苷酸的范围内。在一些实施例中,靶扩增子的长度为约50到约200、约70到约170、约200到约350、约250到约320、约270到约300、约225到约300、约250到约275、约200到约235、约200到约250、或约175到约275个核苷酸。在一些实施例中,IgH扩增子的长度为约80、约60到约100或约70到约90个核苷酸。在一些实施例中,如使用V基因FR3和针对J基因的引物对产生的那些扩增子等IgH扩增子的长度为约50到约200个核苷酸,优选地长度为约60到约160、约65到约120、约90到约120、约70到约90个核苷酸、或约80个核苷酸。在一些实施例中,产生此类长度很短的扩增子使所提供的方法和组合物有效地检测和分析来自高度降解的gDNA模板材料(如源自FFPE样本或无细胞DNA(cfDNA)的模板材料)的免疫组库。
在一些实施例中,扩增引物可以包括条形码序列,例如以区分或分离样本中的多个扩增的靶序列。在一些实施例中,扩增引物可以包括两个或更多个条形码序列,例如以区分或分离在样本中的多个扩增的靶序列。在一些实施例中,扩增引物可以包括标记序列,其可帮助随后对所生成的扩增子进行编目、鉴别或测序。在一些实施例中,通过包含在扩增引物中或通过衔接子的连接将条形码序列或标记序列并入扩增的核苷酸序列中。引物可以还包含可用于后续测序例如焦磷酸测序的核苷酸。此类序列易于通过商业上可获得的软件程序或公司设计。
在一些实施例中,使用不包括标记序列的靶向扩增引物进行多重扩增。在其它实施例中,用扩增引物进行多重扩增,所述扩增引物各自包括靶向序列和标记序列,例如正向引物或引物组包括标记序列1,而反向引物或引物组包括标记序列2。在仍其它实施例中,用扩增引物执行多重扩增,其中一个引物或引物组包括针对靶标的序列和标记序列,并且另一个引物或引物组包括针对靶标的序列但不包括标记序列,例如,正向引物或引物组包括标记序列,并且反向引物或引物组不包括标记序列。
因此,在一些实施例中,多个靶cDNA或gDNA模板分子在单一多重扩增反应混合物中用针对BCR和/或TCR的扩增引物扩增,其中正向和/或反向引物包括标记序列,并且所得扩增子在一端或两端包括靶BCR和/或TCR序列和标记序列。在一些实施例中,正向和/或反向扩增引物或引物组还可以包括条形码,并且然后将一个或多个条形码包括在所得扩增子中。
在一些实施例中,多个靶cDNA或gDNA模板分子在单一多重扩增反应混合物中用针对BCR和/或TCR的扩增引物扩增,并且所得扩增子仅含有BCR和/或TCR序列。在一些实施例中,通过例如衔接子连接将标记序列添加到此类扩增子的末端中。在一些实施例中,通过例如衔接子连接将条形码序列添加到这类扩增子的一端或两端。
适合用作条形码和条形码文库的核苷酸序列是本领域已知的。包括条形码序列的衔接子和扩增引物和引物组为可商购的。含有条形码序列的寡核苷酸衔接子也是可商购的,包括例如IonXpressTM、IonCodeTM和离子选择(Ion Select)条形码衔接子(赛默飞世尔科技公司(Thermo Fisher Scientific))。类似地,描述和所属领域已知的另外和其它通用衔接子/引物序列(例如,Illumina通用衔接子/引物序列、PacBio通用衔接子/引物序列等)可与本文提供的方法和组合物一起使用,并且使用相关分析平台对所得扩增子进行测序。
在一些实施例中,当对多重样本进行测序时,将两个或更多个条形码添加到扩增子。在一些实施例中,在对多重样本进行测序之前,将至少两个条形码添加到扩增子,以降低源自条形码交叉污染或在样本之间条形码渗透的人工结果(例如,免疫受体基因重排或克隆鉴别)的频率。在一些实施例中,当跟踪免疫组库的低频克隆时,使用至少两个条形码来标记样本。在一些实施例中,当使用测定法检测频率小于1∶1,000的克隆时,将至少两个条形码添加到扩增子。在一些实施例中,当使用测定法检测频率小于1∶10,000的克隆时,将至少两个条形码添加到扩增子。在其它实施例中,当使用测定法检测频率小于1∶20,000、小于1∶40,000、小于1∶100,000、小于1∶200,000、小于1∶400,000、小于1∶500,00、或小于1∶1,000,000的克隆时,将至少两个条形码添加到扩增子。用于表征免疫组库的受益于每个克隆的高测序深度和/或在如此低的频率下进行的克隆检测的方法包括但不限于监测患有过度增殖性疾病的患者进行治疗以及在治疗后测试最小残留疾病。
在一些实施例中,选择或设计在本发明的方法中使用的靶特异性引物(例如,V基因FR1、FR2和针对FR3的引物、针对J基因的引物和针对C基因的引物)以满足以下标准中的任何一个或多个标准:(1)在所述引物序列内包括两个或更多个经修饰的核苷酸,所述核苷酸中的至少一个核苷酸包括在所述引物的末端附近或末端处,并且所述核苷酸中的至少一个核苷酸包括在所述引物序列的中心核苷酸位置处或中心核苷酸位置周围;(2)长度为约15到约40个碱基长;(3)Tm为高于60℃到约70℃;(4)与在所关注样本中存在的非靶序列的交叉反应性低;(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;并且(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。在一些实施例中,选择或设计在所提供的方法中使用的靶特异性引物以满足上述标准中的任何2个、3个、4个、5个或6个。
在一些实施例中,在本发明方法中使用的靶特异性引物包括一个或多个具有可切割基团的修饰的核苷酸。在一些实施例中,在本发明方法中使用的靶特异性引物包括两个或更多个具有可切割基团的修饰的核苷酸。在一些实施例中,靶特异性引物包含选自以下的具有可切割基团的至少一种修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
在一些实施例中,使用本文公开的扩增方法(和相关组合物、系统和试剂盒)的靶扩增子用于制备免疫受体组库文库。在一些实施例中,免疫受体组库文库包括将衔接子序列引入到靶扩增子序列的末端。在某些实施例中,用于制备免疫受体组库文库的方法包括根据本文所述的任何多重扩增方法生成靶免疫受体扩增子分子,通过消化处于扩增子分子的引物序列内的修饰的核苷酸来处理扩增子分子,并将至少一个衔接子连接到至少一个经过处理的扩增子分子,从而产生包含靶免疫受体组库的衔接子连接的靶免疫受体扩增子分子文库。在一些实施例中,制备文库的步骤在仅涉及添加步骤的单个反应容器中进行。在某些实施例中,方法还包括克隆扩增至少一个衔接子连接的靶扩增子分子的一部分。
在一些实施例中,使用本文公开的方法(和相关组合物、系统和试剂盒)的靶扩增子与下游过程联接,如但不限于文库制备和核酸测序。例如,可以使用桥式扩增、乳液PCR或等温扩增来扩增靶扩增子,以产生适合于核酸测序的多个克隆模板。在一些实施例中,使用任何合适的DNA测序平台对扩增子文库进行测序,所述测序平台如任何下一代测序平台,包括半导体测序技术,如离子激流(IonTorrent)测序平台。在一些实施例中,使用IonGeneStudio S5 540TM系统或Ion GeneStudio S5 520TM系统或Ion GeneStudio S5 530TM系统或Ion PGM 318TM系统对扩增子文库进行测序。
在一些实施例中,对使用本文公开的方法(和相关组合物和试剂盒)产生的免疫受体扩增子进行的测序产生长度为约200到约600个核苷酸的连续序列读段。在一些实施例中,连续读段长度为约300至约400个核苷酸。在一些实施例中,连续读段长度为约350至约450个核苷酸。在一些实施例中,读段长度平均为约300个核苷酸、约350个核苷酸或约400个核苷酸。在一些实施例中,连续读段长度为约250至约350个核苷酸、约275至约340或约295至约325个核苷酸。在一些实施例中,读段长度平均长度为约270、约280、约290、约300或约325个核苷酸。在其它实施例中,连续读段长度为约180到约300个核苷酸、约200到约290个核苷酸、约225到约280个核苷酸,或约230到约250个核苷酸。在一些实施例中,读段长度平均为约200、约220、约230、约240或约250个核苷酸。在其它实施例中,连续读段长度为约70至约200个核苷酸、约80至约150个核苷酸、约90至约140个核苷酸、或约100至约120个核苷酸长。在其它实施例中,连续读段长度为约50至约170个核苷酸、约60至约160个核苷酸、约60至约120个核苷酸、约70至约100个核苷酸、约70至约90个核苷酸或约80个核苷酸长。在一些实施例中,读段长度平均为约70、约80、约90、约100、约110或约120个核苷酸。在一些实施例中,序列读段长度包括扩增子序列和条形码序列。在一些实施例中,序列读段长度不包括条形码序列。
在一些实施例中,扩增子引物和引物对是可以扩增核酸分子的特定区的靶特异性序列。在一些实施例中,靶特异性引物可以扩增表达的RNA或cDNA。在一些实施例中,靶特异性引物可以扩增哺乳动物RNA,如人RNA或由其制备的cDNA,或鼠RNA或由其制备的cDNA。在一些实施例中,靶特异性引物可以扩增DNA,如gDNA。在一些实施例中,靶特异性引物可以扩增哺乳动物DNA,如人DNA或鼠DNA。
在本文提供的方法和组合物,例如用于测定、表征和/或跟踪生物样本中的免疫组库的那些方法和组合物中,扩增靶序列所需的输入RNA或gDNA的量将部分取决于样本中带有免疫受体的细胞(例如,T细胞或B细胞)的级分。例如,如富集B细胞的样本等样本中较高级分的B细胞允许使用较低量的输入RNA或gDNA以进行扩增。在一些实施例中,用于扩增一个或多个靶序列的输入RNA的量可以为约0.05ng到约10微克。在一些实施例中,用于一个或多个靶序列的多重扩增的输入RNA的量可以为约5ng至约2微克。在一些实施例中,用于多重扩增一个或多个靶序列的RNA的量可以是约5ng至约1微克或约10ng至约1微克。在一些实施例中,用于一个或多个免疫组库靶序列的多重扩增的RNA的量为约1.5微克、约2微克、约2.5微克、约3微克、约3.5微克、约4.0微克、约5微克、约6微克、约7微克、或约10微克。在一些实施例中,用于多重扩增一种或多种免疫组库靶序列的RNA的量为约10ng、约25ng、约50ng、约100ng、约200ng、约250ng、约500ng、约750ng、或约1000ng。在一些实施例中,用于多重扩增一种或多种免疫组库靶序列的RNA的量为约25ng至约500ng RNA或约50ng至约200ng RNA。在一些实施例中,用于多重扩增一种或多种免疫组库靶序列的RNA的量为约0.05ng至约10ng RNA、约0.1ng至约5ng RNA、约0.2ng至约2ng RNA、或约0.5ng至约1ng RNA。在一些实施例中,用于对一种或多种免疫组库靶序列进行多重扩增的RNA的量为约0.05ng、约0.1ng、约0.2ng、约0.5ng、约1.0ng、约2.0ng或约5.0ng。
如本文中所描述的,在多重扩增之前,通常在逆转录反应中使用逆转录酶,将来自生物样本的RNA转化成cDNA。在一些实施例中,用输入RNA执行逆转录反应,并且将来自逆转录反应的cDNA的一部分用于多重扩增反应中。在一些实施例中,将从输入RNA制备的基本上所有cDNA加入到多重扩增反应中。在其它实施例中,将从输入RNA制备的cDNA的一部分,如约80%、约75%、约66%、约50%、约33%或约25%添加到多重扩增反应中。在其它实施例中,将从输入RNA制备的cDNA的约15%、约10%、约8%、约6%或约5%加入多重扩增反应中。
在一些实施例中,来自样本的添加到多重扩增反应中的cDNA的量可以为约0.001ng到约5微克。在一些实施例中,用于一个或多个免疫组库靶序列的多重扩增的cDNA的量可以为约0.01ng至约2微克。在一些实施例中,用于多重扩增一个或多个靶序列的cDNA的量可以是约0.1ng至约1微克或约1ng至约0.5微克。在一些实施例中,用于多重扩增一种或多种免疫组库靶序列的cDNA的量为约0.5ng、约1ng、约5ng、约10ng、约25ng、约50ng、约100ng、约200ng、约250ng、约500ng、约750ng、或约1000ng。在一些实施例中,用于多重扩增一种或多种免疫组库靶序列的cDNA的量为约0.01ng至约10ng cDNA、约0.05ng至约5ngcDNA、约0.1ng至约2ng cDNA、或约0.01ng至约1ng cDNA。在一些实施例中,用于多重扩增一种或多种免疫组库靶序列的cDNA的量为约0.005ng、约0.01ng、约0.05ng、约0.1ng、约0.2ng、约0.5ng、约1.0ng、约2.0ng、或约5.0ng。
在一些实施例中,使用常规方法从生物样本中获得mRNA并将其转化为cDNA用于扩增目的。用于从生物样本提取或分离核酸的方法和试剂为众所周知的并且可商购获得。在一些实施例中,通过本文描述的或本领域的技术人员以其它方式已知的任何方法执行从生物样本中提取RNA,所述方法例如涉及蛋白酶K组织消化和基于醇的核酸沉淀、用DNAse处理以消化污染的DNA以及使用硅胶膜技进行的RNA纯化或其任何组合。用于从生物样本中提取RNA的示例性方法使用可商购的试剂盒,包括RecoverAllTM多样本RNA/DNA工作流程(英杰公司(Invitrogen))、RecoverAllTM总核酸分离试剂盒(英杰公司)、RNA血液(马歇雷-纳格尔公司(Macherey-Nagel))、血液RNA系统、TRI ReagentTM(英杰公司)、PureLinkTMRNA微观尺度试剂盒(英杰公司)、MagMAXTMFFPE DNA/RNA超试剂盒(应用生物系统公司(Applied Biosystems))、ZR RNAMicroPrepTM试剂盒(兹莫研究公司(ZymoResearch))、RNeasy微试剂盒(凯杰公司(Qiagen))以及ReliaPrepTMRNA组织小量制备系统(普洛麦格公司(Promega))。
在一些实施例中,用于扩增一个或多个靶序列的输入gDNA的量可以为约0.1ng到约10微克。在一些实施例中,扩增一个或多个靶序列所需的gDNA的量可为约0.5ng到约5微克。在一些实施例中,扩增一个或多个靶序列所需的gDNA的量可为约1ng到约1微克或约10ng到约1微克。在一些实施例中,扩增一个或多个免疫组库靶序列所需的gDNA的量为约10ng到约500ng、约25ng到约400ng或约50ng到约200ng。在一些实施例中,扩增一个或多个靶序列所需的gDNA的量为约0.5ng、约1ng、约5ng、约10ng、约20ng、约50ng、约100ng或约200ng。在一些实施例中,扩增一个或多个免疫组库靶序列所需的gDNA的量为约1微克、约2微克、约3微克、约4.0微克或约5微克。
在一些实施例中,使用常规方法从生物样本获得gDNA。用于从生物样本提取或分离核酸的方法和试剂为众所周知的并且可商购获得。在一些实施例中,从生物样本提取DNA通过本文所述的任何方法或所属领域技术人员另外已知的方法进行,例如涉及蛋白酶K组织消化和基于醇的核酸沉淀的方法、用RNAse处理以消化污染的RNA、和使用硅胶-膜技术的DNA纯化,或其任何组合。用于从生物样本提取DNA的示例性方法使用市售试剂盒,包括IonAmpliSeqTM Direct FFPEDNA试剂盒、MagMAXTM FFPE DNA/RNA Ultra试剂盒、TRI ReagentTM(英杰(Invitrogen)、PureLinkTM Genomic DNA迷你试剂盒(英杰)、RecoverAllTM总核酸分离试剂盒(英杰)、MagMAXTM DNA多样本试剂盒(英杰)和博诚公司(BioChain InstituteInc.)的DNA提取试剂盒(例如FFPE组织DNA提取试剂盒、基因组DNA提取试剂盒、血液和血清DNA分离试剂盒)。
本文所用的样本或生物样本是指来自含有或可能含有与免疫系统相关的细胞的个体的组合物。示例性生物样本包括但不限于组织(例如,淋巴结、器官组织、骨髓)、全血、滑液、脑脊髓液、肿瘤活组织检查和其它含有细胞的临床标本。样本可以包括正常细胞和/或患病细胞,并且为细针抽吸、细针活检、芯样本或其它样本。在一些实施例中,生物样本可以包含造血细胞、外周血单核细胞(PBMC)、T细胞、B细胞、肿瘤浸润淋巴细胞(“TIL”)或其它淋巴细胞。在一些实施例中,样本可以是新鲜的(例如,未保存的)、冷冻的或福尔马林固定石蜡包埋的组织(FFPE)。一些样本包含癌细胞,如癌、黑素瘤、肉瘤、淋巴瘤、骨髓瘤、白血病等,并且癌细胞可以是循环肿瘤细胞。在一些实施例中,生物样本包含如例如在血液或血浆中发现的cfDNA。
生物样本可以是组织或细胞类型的混合物、富集至少一种特定类别或细胞类型的细胞制剂或特定类型或表型的分离的细胞群。在分析之前,可通过离心、淘洗、密度梯度分离、单采血液成分术、亲和选择、淘选、FACS、用Hypaque离心等分离样本。用于分选、富集和分离特定细胞类型的方法是众所周知的,并且可以由普通技术人员容易地执行。在一些实施例中,样本可以是富集B细胞的制剂。
在一些实施例中,所提供的方法和系统包括用于分析免疫组库受体cDNA或gDNA序列数据和用于从测定的免疫受体序列中鉴别和/或去除一个或多个PCR或测序衍生的错误的方法。
在一些实施例中,纠错策略包括以下步骤:
1)将经过测序的重排与可变、多样性和连接/恒定基因的参考数据库比对,以产生查询序列/参考序列对。许多比对程序可用于此目的,包括例如IgBLAST,一个来自NCBI的可自由使用的工具,以及定制计算机脚本。
2)考虑到用于测序的流程顺序,将参考和查询序列相互重新比对。流程顺序提供允许人们鉴别和校正某些类型的错误比对的信息。
3)通过其特征序列基序鉴别CDR3区的边界。
4)在对应于可变基因和连接/恒定基因(不包括CDR3区)的重排的比对部分,在查询中相对于参考标识插入缺失并改变错配查询碱基位置以使其与参考一致。
5)对于CDR3区,如果CDR3长度不是三的倍数(表示插入缺失错误):
(a)基于PHRED得分(表示为e),在CDR3中搜索具有最高概率的含有序列错误的均聚物延伸。
(b)基于PHRED得分(表示为t)获得整个CDR3区的错误概率
(c)如果e/t大于确定的阈值,则通过将均聚物的长度增加或减少一个碱基来编辑均聚物,使得CDR3核苷酸长度是三的倍数。
(d)作为步骤a-c的替代方案,在CDR3中搜索最长的均聚物,并且如果均聚物的长度高于限定的阈值,则通过将均聚物的长度增加或减少一个碱基来编辑均聚物,使得CDR3核苷酸长度是三的倍数。
在一些实施例中,提供了用于在对PCR和测序错误来说是稳健的组库数据中鉴别B细胞和/或T细胞克隆的方法。因此,以下描述了可以用于此类方法以便以对PCR和测序错误来说是稳健的方式鉴别B细胞和/或T细胞克隆的步骤。表1是用于从免疫受体测序数据中鉴别和去除PCR或测序衍生的错误的示例性工作流程图。此工作流程的示例性部分和实施例也在图1-2中表示。
表1:序列校正工作流程
对于一组源自mRNA或gDNA的TCR或BCR序列,其中1)每个序列已经被注释为生产性重排,无论是天然的还是在纠错后,如先前所述,和2)每个序列具有鉴别的V基因和CDR3核苷酸区,在一些实施例中,方法包括以下:
1)鉴别并排除嵌合序列。对于数据集中存在的每个独特的CDR3核苷酸序列,计算具有该CDR3核苷酸序列和任何可能的V基因的读段的数量。构成该CDR3核苷酸序列总读段少于10%的任何V基因-CDR3组合被标记为嵌合体并从下游分析中消除。例如,对于具有相同CDR3核苷酸序列的下述序列,例如,具有与CDR3nt序列AATTGGT配对的TRBV3和TRBV6的序列将被标记为嵌合。
V基因 | CDR3nt | 读段计数 |
TRBV2 | AATTGGT | 1000 |
TRBV3 | AATTGGT | 10 |
TRBV6 | AATTGGT | 3 |
2)鉴别并排除含有简单插入缺失错误的序列。对于数据集中的每次读段,获得该读段的CDR3序列的均聚物-塌陷表示。对于具有相同V基因和塌陷-CDR3组合的每组读段,计算每个未塌陷的CDR3核苷酸序列的出现次数。构成该读段集的总读段的<10%的任何未塌陷的CDR3序列被标记为具有简单的均聚物错误。作为实例,呈现三种不同的V基因-CDR3核苷酸序列,其在CDR3核苷酸序列的均聚物塌缩后是相同的。两个较不频繁的V基因-CDR3组合构成读段集的总读段的<10%,并且将被标记为包含简单的插入缺失错误。例如:
V基因 | CDR3nt | 均聚物塌缩的CDR3nt | 读段计数 |
TRBV2 | AATTGGT | ATGT | 1000 |
TRBV2 | AAATGGT | ATGT | 10 |
TRBV2 | AAAATTTGGT(SEQ ID NO:602) | ATGT | 3 |
3)鉴别并排除单例读段。对于数据集中的每次读段,记录在数据集中找到精确读段序列的次数。在数据集中仅出现一次的读段将被标记为单例读段。
4)鉴别并排除截断的读段。对于数据集中的每次读段,确定读段是否具有注释的V基因FR1、CDR1、FR2、CDR2和FR3区,如通过对IgBLAST参考V基因集的读段的IgBLAST比对所指示的。如果基于用于扩增的特定V基因引物预期区,则将不具有上述区的读段标记为截短的。
5)鉴别并排除缺乏双向支持的重新排列。对于数据集中的每次读段,获得读段的V基因和CDR3序列以及读段的链方向(正或负链)。对于数据集中的每个V基因-CDR3组合,计算具有该V基因-CDR3nt组合的正链和负链读段的数目。仅存在于一个方向的读段中的V基因-CDR3nt组合将被认为是假的。具有假V基因-CDR3nt组合的所有读段将被标记为缺乏双向支持。
6)对于未标记的基因,基于CDR3核苷酸类似性进行逐步聚类。基于读段的V基因同一性将序列分成组,排除等位基因信息(v基因组)。对于每组:
a.使用cd-hit-est和以下参数将每组中的读段布置到聚类中:
cd-hit-est -i vgene_groups.fa -o clustered_vgene_groups.cdhit -T 24 -d 0 -M 100000 -B 0 -r 0 -g 1 -S 0 -U 2 -uL.05 -n 10 J 7。(可免费获得的软件程序cd-hit-est将核苷酸数据集聚类为满足用户定义的类似性阈值的聚类)。(有关cd-hit-est的代码和说明,参见https://github.com/weizhongli/cdhit/wiki/3.-User%27s-Guide#CDHITEST)。
其中vgene_groups.fa是具有同一V基因的序列的CDR3核苷酸区的fasta格式文件,并且clustered_vgene_groups.cdhit是含有细分序列的输出。
b.为聚类中的每个序列分配相同的克隆ID,用于表示该子组的成员被认为代表相同的T细胞克隆或B细胞克隆。
c.选择每个聚类的代表性序列,使得代表性序列为出现最多次数的序列,或在平局的情况下,为随机选择的。
d.将聚类中的所有其它读段合并到代表性序列中,使得代表性序列的读段数根据合并序列的读段数增加。
e.基于汉明距离将在v基因组内的代表性序列相互比较。如果代表性序列与>50倍更丰富的代表性序列在汉明距离1内,则将所述序列合并到更常见的代表性序列中。如果代表性序列与>10000倍更丰富的代表性序列在汉明距离2内,则将所述序列合并到更常见的代表性序列中。
f.鉴别复合序列错误。对每个V基因组内的代表性序列进行均聚物-塌缩,然后使用莱文斯坦距离相互比较。如果代表性序列与>50倍更丰富的代表性序列在1莱文斯坦距离内,则将所述序列合并到更常见的代表性序列中。
g.鉴别CDR3错误注释错误。对每个V基因组内的代表性序列进行均聚物-塌缩,然后对每个均聚物-塌缩的序列执行成对比较。对于每对序列,测定一个序列是否是另一个序列的子集。如果是,如果更丰富的序列为>500倍更丰富,则将较不丰富的序列合并到更丰富的序列中。
7)向用户报告聚类代表。
在一些实施例中,以上工作流程的步骤6基于V基因同一性(不包含等位基因信息)和CDR3核苷酸长度将重排序列分成组。在其它实施例中,J基因同一性和/或同种型同一性也用作分组标准的一部分。因此,在一些实施例中,上述工作流程的步骤6包括以下步骤:
a.使用cd-hit-est和以下参数将每组中的读段布置到聚类中:
cd-hit-est -i vgene_groups.fa -o clustered_vgene_groups.cdhit -T 24 -l 9 -d 0 -M 100000 -B 0 -r 0 -g 1 -S 15 -U 2 -uL.05 -n 9。
其中vgene_groups.fa是VDJ重排的已测序部分的fasta格式文件。
在一些实施例中,VDJ的完整序列被考虑用于聚类,因为体细胞超突变可以发生在整个VDJ区。
b.为聚类中的每个序列分配相同的克隆ID,所述克隆ID用于表示子组的成员被认为代表相同的T细胞克隆或B细胞克隆。
c.为每个聚类选择代表性序列,使得代表性序列是出现最多次数的序列,或在平局的情况下是随机选择的。
d.将聚类中的所有其它读段合并到代表性序列中,使得根据合并序列的读段数增加代表性序列的读段数。
e.基于汉明距离将在v基因组内的代表性序列相互比较。如果代表性序列与>50倍更丰富的代表性序列在汉明距离1内,则将所述序列合并到更常见的代表性序列中。如果代表性序列与>10000倍更丰富的代表性序列在汉明距离2内,则将所述序列合并到更常见的代表性序列中。在一些实施例中,>50/3和>10000/3的倍数阈值等用于分别合并汉明距离为1或2的序列。当比较整个VDJ区的序列而不是仅CDR3区的序列时,降低倍数阈值可能有用,因为较长的序列更有可能积累扩增和/或测序错误。
f.鉴别复合序列错误。对每个V基因组内的代表性序列进行均聚物-塌缩,然后使用莱文斯坦距离相互比较。如果代表性序列与>50倍更丰富的代表性序列在1莱文斯坦距离内,则将所述序列合并到更常见的代表性序列中。
g.鉴别CDR3误注释错误。对每个V基因组内的代表性序列进行均聚物-塌缩,然后对每个均聚物-塌缩的序列执行成对比较。对于每对序列,测定一个序列是否是另一个序列的子集。如果是,如果更丰富的序列为>500倍更丰富,则将较不丰富的序列合并到更丰富的序列中。
在一些实施例中,所提供的工作流程不限于在各个步骤中列出的频率比率阈值,并且其它频率比率可以代替以上包括的代表性频率比率。频率比率是指较常见的代表性序列的丰度值与较不常见的代表性序列的丰度值之比。频率比率阈值给出了将较不常见的代表性序列合并到较常见的代表性序列中的阈值。例如,在一些实施例中,基于汉明距离将在v基因组内的代表性序列相互比较可以使用除了以上步骤(e)中列出的那些频率比率阈值之外的频率比率阈值。例如但不限于,如果一个代表性序列与一个代表性序列在汉明距离2内,则可以使用1000、5000、20,000等频率比率阈值。例如但不限于,如果一个代表性序列与一个代表性序列在汉明距离1内,则可以使用20、100、200等频率比率阈值。所提供的频率比率阈值代表将类似对的更丰富的序列标记为正确序列的一般过程。
类似地,当对在工作流程中其它步骤(例如步骤(1)、步骤(2)、步骤(6f)和步骤(6g))的两个序列的频率进行比较时,可以使用除了上述步骤中列出的频率比率阈值之外的频率比率阈值。
本文所用的术语“均聚物-塌缩的序列”旨在表示其中重复碱基塌缩成单个碱基代表的序列。作为实例,对于非塌缩序列AAAATTTTTATCCCCCCCCGGG(SEQ ID NO:603),均聚物-塌缩的序列为ATATCG。
本文所用的术语“克隆”、“克隆型”、“谱系”或“重排”旨在描述用于如TCR或BCR等免疫受体的独特的V基因核苷酸组合。例如,独特的V基因-CDR3核苷酸组合。
本文所用的术语“生产性读段”是指不具有终止密码子并具有框内可变基因片段和连接基因片段的TCR或BCR序列读段。在编码多肽时,生产性读段在生物学上是合理的。
如本文所用,“嵌合体”或“嵌合序列”是指在靶扩增例如PCR期间由模板转换产生的人工序列。嵌合体通常作为移植到不相关的V基因上的CDR3序列存在,产生与数据集内的多个V基因相关的CDR3序列。嵌合序列通常远不如数据集中的真实序列丰富。
如本文所用,术语“插入缺失”是指核酸序列中一个或多个核苷酸碱基的插入和/或缺失。在核酸序列的编码区中,除非插入缺失的长度为3的倍数,否则当翻译序列时它将产生移码。如本文所用,“简单的插入缺失错误”为不改变序列的均聚物-塌缩表示的错误。如本文所用,“复合插入缺失错误”为改变序列的均聚物-塌缩表示的插入缺失测序错误,并且包括但不限于消除均聚物、将均聚物插入序列或产生阅读障碍型错误的错误。
如本文所用,“单例读段”是指其缺失校正的序列在数据集中仅出现一次的序列读段。通常,单列读段富集含有PCR或测序错误的读段。
如本文所用,“截短的读段”是指缺失注释的V基因区的免疫受体序列读段。例如,截短的读段包括但不限于缺失注释的TCR或BCRV基因FR1、CDR1、FR2、CDR2或FR3区的序列读段。由于质量修整,此类读段通常缺少V基因序列的一部分。如果截断导致错误鉴别V基因,截断的读段可能会产生伪影。
在鉴别的V基因-CDR3序列(克隆型)的背景下,“双向支持”表示在至少一个映射到正链的读段中(从V基因进行到恒定基因)和至少一个映射到负链的读段(从恒定基因进行到V基因)中发现特定的V基因-CDR3序列。系统性测序错误通常导致鉴别具有单向支持的V基因-CDR3序列。
对于已经根据预定的序列类似性阈值考虑由于PCR或测序误差的变化进行了分组的一组序列,“聚类代表”是被选择为最可能无错误的序列。这通常为最丰富的序列。
如本文所用,“IgBLAST注释错误”是指罕见事件,其中CDR3的边界被鉴别为处于不正确的相邻位置。这些事件通常对CDR3核苷酸序列的5′或3′端添加三个碱基。
对于两个等长的序列,“汉明距离”是对应碱基或氨基酸不同的位置数。对于任何两个序列,“莱文斯坦距离”或“编辑距离”是使一个核苷酸或氨基酸序列成为另一个核苷酸或氨基酸序列所需的单个碱基或氨基酸编辑的数量。
在其中针对J基因的引物用于扩增免疫受体序列的一些实施例(例如用针对V基因FR3区的引物和针对J基因的引物进行的多重扩增)中,从测定衍生的原始序列读段在任何下游分析之前进行J基因序列推断过程。在该过程中,询问原始读取序列的开始和结束是否存在10-30个核苷酸的特征序列,其对应于在测序之前在用J引物扩增以及扩增子末端的任何后续操作或处理(例如,消化)后预期存在的J基因序列的部分。特征核苷酸序列允许推断J引物的序列,以及由于每个J基因的序列已知而被靶向的J基因的剩余部分。为了完成J基因序列推断过程,将推断的J基因序列添加到原始读段中以产生延伸的读段,然后跨越整个J基因。然后扩展的读段包含整个J基因序列、CDR3区的完整序列和至少一部分V基因序列,其将在下游分析后报告。扩展读段中的V基因序列的部分将取决于用于多重扩增的针对V基因的引物,例如FR3、FR2或针对FR1的引物。
使用V基因FR3和J基因引物扩增表达的免疫受体序列或重排的免疫受体gDNA序列产生最小长度的扩增子(例如,长度为约60-100或约80个核苷酸),同时仍产生允许报告整个CDR3区的数据。由于预期很短的扩增子长度,在序列分析工作流程期间,长度为<100个核苷酸的扩增子的读段不作为低质量和/或脱靶产物而被消除。然而,在原始读段中明确搜索预期的J基因序列允许消除从通过J基因引物进行的脱靶扩增衍生的扩增子。另外,这种短扩增子长度改善了对高度降解的模板材料(例如源自FFPE或cfDNA样本的模板材料)进行测定的性能。
在一些实施例中,所提供的方法包含对免疫受体文库进行测序并使获得的序列数据经受错误鉴别和校正过程以产生拯救的生产性读段,以及鉴别生产性序列读段和拯救的生产性序列读段。在一些实施例中,所提供的方法包含对免疫受体文库进行测序并使获得的序列数据集经受错误鉴别和校正过程,鉴别生产性序列读段和拯救的生产性序列读段,以及通过克隆型对序列读段进行分组以鉴别文库中的免疫受体克隆型。
在一些实施例中,所提供的方法包含对重排的免疫受体DNA文库进行测序并对于V基因部分,使获得的序列数据经受错误鉴别和校正过程以产生拯救的生产性读段,以及鉴别生产性序列读段、拯救的生产性序列读段和非生产性序列读段。在一些实施例中,所提供的方法包含测序重排的免疫受体DNA文库并且对于V基因部分对获得的序列数据集进行错误鉴别和校正过程,鉴别生产性、拯救的生产性和非生产性的序列读段,并通过克隆型对序列读段进行分组以鉴别在文库中的免疫受体克隆型。在一些实施例中,单独报告重排的免疫受体DNA的生产性序列读段和非生产性序列读段两者。
在一些实施例中,所提供的错误鉴别和校正工作流程用于鉴别和解析导致序列读段被鉴别为来自非生产性重排的PCR或测序衍生的错误。在一些实施例中,所提供的错误鉴别和校正工作流程应用于从测序平台产生的免疫受体序列数据,其中在产生序列数据时发生插入缺失或其它引起移码的错误。
在一些实施例中,提供的错误鉴别和校正工作流程应用于由Ion Torrent测序平台生成的序列数据。在一些实施例中,所提供的错误鉴别和校正工作流程应用于由罗氏454生命科学(Roche 454 Life Sciences)测序平台、太平洋生物科学公司测序平台和牛津纳米孔(Oxford Nanopore)测序平台产生的序列数据。
在一些实施例中,BCR组库分析工作流程包括鉴别样本中的克隆谱系的另外的最后步骤。克隆谱系代表源自共同的VDJ重排但由于体细胞超突变和/或类别转换重组而不同的一组B细胞克隆(例如,被鉴别为具有独特的VDJ序列)。通常假设克隆谱系的成员可以比不同克隆谱系的成员更可能靶向同一抗原。
在一些实施例中,克隆谱系鉴别的过程包括使用鉴别(例如,如本文所述)的一组BCR克隆(例如,IgH克隆)以执行以下:
1.将克隆序列分成几组,其中组成员共有同一可变基因(不包含等位基因信息),同一CDR3核苷酸长度和同一连接基因(不包含等位基因信息)。在一些实施例中,可以省略上述J基因标准。
2.基于克隆序列的CDR3核苷酸类似性,将每组中的克隆序列排列成聚类。CDR3的核苷酸类似性的阈值为约0.70到约0.99。在一些实施例中,CDR3的核苷酸类似性的阈值介于约0.80与约0.99之间。在一些实施例中,CDR3的核苷酸类似性的阈值介于约0.80与约0.90之间。在某些实施例中,CDR3的核苷酸类似性的阈值为约0.80、0.81、0.82、0.83、0.84、0.85、0.86、0.87、0.88、0.89、0.90、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98或0.99。
a.在一些实施例中,使用如下所述的cd-hit-est执行聚类:
cd-hit-est -i vgene_groups.fa -o clustered_vgene_groups.cdhit -T 24 -l 9 -d 0 -M 100000 -B 0 -r 0 -g 1 -S 0 -c.85 -n 5,其中vgene_groups.fa由一组内每个克隆的一组CDR3核苷酸序列组成。同一聚类内的克隆被视为同一克隆谱系的成员。
b.在一些情况下,体细胞超突变可能足够广泛,以至于所描述的聚类标准可能不会对所有克隆谱系成员进行分组。对于此类情况,在一些实施例中,执行另外的步骤以合并在(a)中鉴别的聚类。另外的步骤由以下组成:在克隆谱系之间的可变基因中搜索共有的体细胞超突变衍生的突变的实例,然后如果共有突变的级分和/或数量高于某个阈值,则合并克隆谱系。如上所述,通过将可变基因序列与IMGT数据库中最匹配的可变基因序列进行比较来鉴别可变基因突变。在一些实施例中,共有突变数量的阈值为2或更大。在一些实施例中,共有突变数量的阈值为3或更大。在其它实施例中,共有突变数量的阈值为4、5、6、7、8、9、10或更大。在一些实施例中,共有突变的级分为约0.15到约0.95。在一些实施例中,共有突变的级分为约0.75或约0.85。在其它实施例中,共有突变的级分为约0.15、0.2、0.25、0.3、0.35、0.4、0.5、0.6、0.7、0.8、0.9或0.95。
在一些情况下,可以鉴别出IMGT数据库中未表达的可变基因等位基因。在此类情况下,与IMGT数据库进行的比对将指示并非源自体细胞超突变的不匹配。为了避免由此类未注释的基因变体引起的噪声,在一些实施例中,在(b)之前执行初始步骤,其中鉴别样本中的所有推定的新颖可变基因等位基因,注意与参考不同的每个位置。在一些实施例中,然后在(b)中描述的分析中,此类位置不在考虑范围之内。例如,Gadala-Maria等人.(2015)《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》112:E862-E870和PCT申请出版物第WO2018/136562号已经描述用于从免疫组库测序数据中鉴别新颖等位基因的方法。
在这种克隆谱系鉴别过程结束时,已经将每个克隆分配到克隆谱系。可以使用克隆谱系作为分析单位来计算BCR组库的特征,如多样性、均匀度和收敛。在一些实施例中,计算并向用户报告克隆谱系特征,如属于谱系的克隆数、那些克隆的同种型、谱系中克隆的最大和最小频率、谱系中最大和最小可变基因体细胞超突变等。
在不存在体细胞超突变的情况下,可以以氨基酸序列相同或功能相同但核苷酸序列不同的克隆的频率的形式计算BCR收敛。这些代表独立进行VDJ重组并通常假定已响应于常见抗原而增殖的克隆。但是,体细胞超突变可以产生不代表独立进行VDJ重组的B细胞的不同的VDJ序列。为了解决这种情况,使用了收敛的定义,所述定义考虑了克隆谱系鉴别。出于此目的,“BCR收敛”被定义为B细胞克隆的频率,所述B细胞克隆是如上所述的不同克隆谱系的成员,但氨基酸序列类似或相同。在一些实施例中,如果两个IGH重排被分配到单独的克隆谱系但是具有相同的可变基因(不包含等位基因信息)和相同或类似的CDR3氨基酸序列,则所述重排被认为是收敛的。在测序覆盖IGH链的所有三个CDR结构域的其它实施例中,如果两个IGH重排被分配到单独的克隆谱系但是具有相同的可变基因(不包含等位基因信息)和相同或类似的CDR1、2和3氨基酸序列,则所述重排可以被认为是收敛的。在一些实施例中,类似的CDR氨基酸序列在汉明或莱文斯坦编辑距离l内。在其它实施例中,类似的CDR氨基酸序列在汉明或莱文斯坦编辑距离2内。
因此,在一些实施例中,通过搜索具有相同的可变基因和在汉明或莱文斯坦编辑距离l或2内的CDR氨基酸序列的BCR克隆来鉴别功能上等效的B细胞。在一些实施例中,程序cd-hit可以用于鉴别具有类似但功能上等效的氨基酸序列的克隆。(有关程序cd-hit的代码和信息,参见https://github.com/weizhongli/cdhit/wiki/3.-User%27s-Guide)在一些实施例中,使用以下命令运行cd-hit:
cd-hit -i vgene_groups.fa -o clustered_vgene_groups.cdhit -T 24 -l 5-d 0 -M 100000 -B 0 -g 1 -S 1 -U 1 -n 5,其中vgene_groups.fa由具有相同可变基因的克隆的一组CDR3氨基酸序列组成。同一聚类内的克隆被认为是功能上等效的。
在一些实施例中,参数-S的值可以为0、1、2或3。在一些实施例中,参数-U的值可以为0、1、2或3。
在一些实施例中,vgene_groups.fa由具有相同可变基因的克隆的一组CDR1、2和3氨基酸序列组成。在一些实施例中,vgene_groups.fa由具有相同可变基因和相同CDR3长度两方面的一组克隆组成。
在一些实施例中,所提供的序列分析工作流程包括下采样分析。对于免疫组库测序和后续分析,使用下采样分析可以帮助例如消除由于跨测定的测序深度的差异引起的可变。例如,用于与RNA或cDNA测序和分析工作流程一起使用的示例性下采样分析对数据应用以下程序:a)从生产性+拯救的生产性读段的总组开始,除去序列读段随机直到若干读段深度之一;以及b)使用此读段子集执行所有下游计算(例如,次级组库特征的克隆型和计算,所述次级组库特征包括但不限于均匀度、收敛、多样性、检测到的克隆数和身份以及克隆谱系)。
在一些实施例中,下采样分析鉴别将特定样本测序到饱和的点,例如另外的读段不鉴别另外的克隆或谱系或将另外的多样性添加到检测到的组库中的点。在一些实施例中,下采样允许在使用类似样本类型进行的测定间或之间对测序深度进行精化或多重化。
在一些实施例中,通过所提供的测定方法和组合物检测的一组可变基因等位基因可以用于重新鉴别人类群体内的单倍型组。在特定实施例中,所提供的包括使用多个V基因特异性引物和至少一个C基因特异性引物以扩增IgH CDR1、2和3核苷酸序列的测定方法和组合物可以用于鉴别受试者的BCR组库的IgH单倍型。例如,在一些实施例中,所提供的方法和组合物可以用于鉴别受试者的BCR组库的IgH单倍型,所述方法和组合物使用包含选自表3的多个V基因FR1引物和选自表6-10的至少一个C基因引物的至少一组引物。用于鉴别TCR单倍型组的方法于2019年3月22日提交的PCT申请第PCT/US2019/023731号中进行了描述,所述申请的全部内容通过引用并入本文,并且可以类似地与本文提供的方法和组合物结合使用以鉴别IgH单倍型组。在一些实施例中,通过对IgH CDR1、2和3个核苷酸序列进行扩增和测序而检测的一组可变基因等位基因可以用于将样本分配到若干先前存在的单倍型组之一,作为用于预测在免疫治疗之后的自身免疫疾病或不良事件的风险的较大程序的一部分。在用于预测在免疫治疗之后的自身免疫疾病或不良事件的风险的程序中,用于将样本分配到单倍型组的方法也在于2019年3月22日提交并通过引用并入本文中的PCT申请第PCT/US2019/023731号中描述,并且类似地可以与本文提供的方法和组合物结合使用以将样本分配到IgH单倍型组,例如以预测此类风险。在一些实施例中,使用所提供的测定方法和组合物获得的IgH CDR1、2、3序列数据可以用于推断阶段性IgH基因座单倍型(例如,Kidd等人.(2012)《免疫学杂志(J.Immunol.)》188(3):1333-1340)。
在一些实施例中,所提供的方法包含制备和形成多个免疫受体特异性扩增子。在一些实施例中,所述方法包含:将多个V基因特异性引物和至少一个C基因特异性引物与cDNA分子杂交;延伸引物对的第一引物(例如,V基因特异性引物);使来自cDNA分子的延伸的第一引物变性;将引物对的第二引物(例如,C基因特异性引物)与延伸的第一引物产物杂交并延伸第二引物;消化靶特异性引物对以产生多个靶扩增子。在其它实施例中,所述方法包含:将多个V基因基因特异性引物和多个J基因特异性引物与cDNA分子杂交;延伸引物对的第一引物(例如,V基因特异性引物);使来自cDNA分子的延伸的第一引物变性;将引物对的第二引物(例如,J基因特异性引物)与延伸的第一引物产物杂交并延伸第二引物;消化靶特异性引物对以产生多个靶扩增子。在一些实施例中,在执行切口平移反应之前将衔接子连接到靶扩增子的末端,以生成适于核酸测序的多个靶扩增子。在一些实施例中,连接的衔接子中的至少一个衔接子包括至少一个条形码序列。在一些实施例中,连接到靶扩增子的末端的每个衔接子包括条形码序列。在一些实施例中,可以使用桥式扩增、乳液PCR或等温扩增来扩增所述一个或多个靶扩增子,以产生适于核酸测序的多个克隆模板。
在一些实施例中,所提供的方法包含制备和形成多个免疫受体特异性扩增子。在一些实施例中,方法包含将多个V基因基因特异性引物和多个J基因特异性引物与gDNA分子杂交,延伸引物对的第一引物(例如,V基因特异性引物),使来自gDNA分子的延伸的第一引物变性,将引物对的第二引物(例如,J基因特异性引物)与延伸的第一引物产物杂交,并延伸第二引物,消化靶特异性引物对以生成多个靶扩增子。在一些实施例中,在执行切口平移反应之前将衔接子连接到靶扩增子的末端,以生成适于核酸测序的多个靶扩增子。在一些实施例中,连接的衔接子中的至少一个衔接子包括至少一个条形码序列。在一些实施例中,连接到靶扩增子的末端的每个衔接子包括条形码序列。在一些实施例中,可以使用桥式扩增或乳液PCR扩增一种或多种靶扩增子以产生适于核酸测序的多个克隆模板。
在一些实施例中,本公开提供了用于对靶扩增子进行测序并处理序列数据以鉴别在cDNA所源自的生物样本中表达的生产性免疫受体重排的方法。在一些实施例中,本公开提供了用于对靶扩增子进行测序并处理序列数据以鉴别来自生物样本的生产性免疫受体基因重排gDNA的方法。在其中使用针对J基因的引物扩增表达的免疫受体序列或重排的免疫受体gDNA序列的实施例中,处理序列数据包括用于扩增的J基因引物的核苷酸序列以及所靶向的J基因的剩余部分,如本文所描述。在一些实施例中,处理序列数据包括执行所提供的错误鉴别和校正步骤以产生拯救的生产性序列。在一些实施例中,使用所提供的错误鉴别和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA或gDNA样本的测序读段的至少50%。在一些实施例中,使用所提供的错误鉴别和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA或gDNA样本的测序读段的至少60%、至少70%、至少80%、至少90%或至少95%。在一些实施例中,使用所提供的错误鉴别和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA或gDNA样本的测序读段的约50-60%、约60-70%、约70-80%、约80-90%、约50-80%、或约60-90%。在一些实施例中,使用所提供的错误鉴别和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA或gDNA样本的测序读段的约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%。
在特定样本的情况下,所提供的错误鉴别和校正工作流程可以导致在使用特定样本时,生产性读段和拯救的生产性读段的组合小于免疫受体cDNA或gDNA样本的测序读段的50%。此类样本包括例如RNA或gDNA高度降解的那些样本(如FFPE样本和cfDNA样本),以及靶免疫细胞的数量非常低的那些样本,例如具有非常低的B细胞计数的样本或来自经历严重的白细胞减少症的受试者的样本。因此,在一些实施例中,使用所提供的错误鉴别和校正工作流程可以导致生产性读段和拯救的生产性读段的组合为免疫受体cDNA或gDNA样本的测序读段的约30-50%、约40-50%、约30-40%、约40-60%、至少30%或至少40%。
在某些实施例中,本发明的方法包含使用靶免疫受体引物组,其中引物针对相同靶免疫受体基因例如BCR(免疫球蛋白)基因和TCR基因的序列。在一些实施例中,免疫受体是选自由以下组成的组的抗体受体:重链α、重链δ、重链ε、重链γ、重链μ、轻链κ和轻链λ。在一些实施例中,T细胞受体是选自由以下组成的组的T细胞受体:TCR α、TCR β、TCR γ和TCRδ。在一些实施例中,本发明的方法包含使用靶免疫受体引物组,其中引物组中的至少一个引物组针对BCR的序列且另一个引物组针对TCR的序列,并且来自样本的BCR靶核酸和TCR靶核酸两者在单一多重扩增反应中扩增。
在某些实施例中,提供了用于扩增样本中的BCR组库的表达核酸序列的方法,所述方法包含使用以下的至少一组执行多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶恒定基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中使用每组执行扩增产生代表样本中相应免疫受体的整个组库的扩增子;由此产生包含BCR的组库的免疫受体扩增子。在特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约80个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约50个核苷酸部分的序列。
在某些实施例中,提供了用于扩增样本中的免疫受体组库的表达核酸序列的方法,所述方法包含使用以下的至少一组执行多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中使用每组执行扩增产生代表样本中相应免疫受体的整个组库的扩增子;由此产生包含BCR的组库的免疫受体扩增子。在特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约80个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约50个核苷酸部分的序列。在一些实施例中,i)的所述一个或多个多个V基因引物与模板分子的框架区1的至少一部分退火。在某些实施例中,ii)的一个或多个C基因引物包含与模板分子的C基因部分的至少一部分退火的至少两个引物。在一些实施例中,ii)的一个或多个C基因引物包含至少两个引物,所述至少两个引物中的每个引物与IgA、IgD、IgG、IgM或IgE模板分子的C基因的至少一部分退火。在一些实施例中,ii)的一个或多个C基因引物包含至少一个引物,所述至少一个引物分别针对IgA、IgD、IgG、IgM和IgE模板分子中的每个模板分子的C基因的一部分。在特定实施例中,至少一组产生的扩增子包括BCR表达序列的互补决定区CDR1、CDR2和CDR3。在一些实施例中,扩增子长度为约300到约600个核苷酸或长度为至少约350到约500个核苷酸。在一些实施例中,方法中使用的核酸模板是通过从逆转录从生物样本中提取的核酸分子而产生的cDNA。
在某些实施例中,提供了用于在样本中提供BCR组库的序列的方法,所述方法包含使用至少一组引物执行多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的一个或多个相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。然后执行对所得BCR扩增子分子进行的测序,并且由此测定的BCR扩增子分子的序列在样本中提供BCR组库的序列。在特定实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;将初始序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得BCR分子的序列。在特定实施例中,生产性读段和拯救的生产性读段的组合是BCR的测序读段的至少50%、至少60%、至少70%或至少75%。在另外的实施例中,所述方法还包含序列读段聚类和BCR克隆型报告。在一些实施例中,将鉴别的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴别所述IMGT数据库中不存在的至少一个等位基因变体的序列。在一些实施例中,平均序列读段长度介于300与600个核苷酸之间、或介于350与550个核苷酸之间、或介于330与425个核苷酸之间、或介于约350与约425个核苷酸之间,这部分地取决于在读段长度中包含任何条形码序列。在某些实施例中,至少一组测序的扩增子包括BCR表达序列的互补决定区CDR1、CDR2和CDR3。
在一些实施例中,所提供的方法利用包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR1区高出约70个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR1区高出约50个核苷酸的序列。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约18到约45个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约22到约35个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约25到约35个不同的针对FR1的引物。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约40到约65个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约48到约60个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含一个或多个C基因引物。在特定实施例中,靶免疫受体引物组包含至少5到约15个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在特定实施例中,靶免疫受体引物组包含至少2到约8个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在一些实施例中,靶BCR引物组包含针对不同Ig同种型分子,例如IgA、IgD、IgG、IgM和IgE的两个或更多个C基因引物。在一些实施例中,靶BCR引物组包含至少五个C基因引物,每个引物针对不同Ig同种型分子的C基因。
在特定实施例中,本发明的方法包含使用至少一组引物,所述至少一组引物包含分别选自表3和表6-10的V基因引物i)和C基因引物ii)。在某些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物分别包含选自表3的约15到约35个引物和选自表6-10的约5到约20个引物。在一些实施例中,所提供的方法包含使用至少一组引物,所述至少一组引物包含i)选自表3的约22到约35个引物,以及ii)选自表6-10中的每个表的一个或多个引物。在某些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物分别包含选自表3的约40到约65个引物和选自表6-10的约5到约20个引物。在一些实施例中,所提供的方法包含使用至少一组引物,所述至少一组引物包含i)选自表3的约48到约60个引物,以及ii)选自表6-10中的每个表的一个或多个引物。在其它某些实施例中,本发明的方法包含使用至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:137-283的引物和ii)选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的引物。在其它实施例中,所提供的方法包含使用至少一组引物,所述至少一组引物包含i)选自SEQID NO:284-430的引物和ii)选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的引物。在一些实施例中,本发明的方法包含使用至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:137-283的引物和ii)选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的引物或包含i)选自SEQ ID NO:284-430的引物和ii)选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的引物。
在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少20或至少25个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约15到约35个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的约5到约15个引物。在一些实施例中,所提供的方法包含使用至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:137-283的约22到约35个引物和ii)选自SEQ ID NO:448-459的至少一个引物、选自SEQ ID NO:472-479的至少一个引物、选自SEQ ID NO:488-513的至少一个引物、选自SEQ ID NO:540-551的至少一个引物和选自SEQ ID NO:564-582的至少一个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQIDNO:284-430的至少20或至少25个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约15到约35个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的约5到约15个引物。在一些实施例中,所提供的方法包含使用至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:284-430的约22到约35个引物和ii)选自SEQ ID NO:460-471的至少一个引物、选自480-487的至少一个引物、选自514-539的至少一个引物、选自552-563的至少一个引物和选自583-601的至少一个引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少20或至少25个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少20或至少25个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。
在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少40或至少50个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约40到约65个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的约5到约15个引物。在一些实施例中,所提供的方法包含使用至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:137-283的约48到约60个引物和ii)选自SEQ ID NO:448-459的至少一个引物、选自SEQ ID NO:472-479的至少一个引物、选自SEQ ID NO:488-513的至少一个引物、选自SEQ ID NO:540-551的至少一个引物和选自SEQ ID NO:564-582的至少一个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ IDNO:284-430的至少40或至少50个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约40到约65个引物和选自SEQ IDNO:460-471、480-487、514-539、552-563和583-601的约5到约15个引物。在一些实施例中,所提供的方法包含使用至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:284-430的约48到约60个引物和ii)选自SEQ ID NO:460-471的至少一个引物、选自480-487的至少一个引物、选自514-539的至少一个引物、选自552-563的至少一个引物和选自583-601的至少一个引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少40或至少50个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少40或至少50个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。
在某些实施例中,提供了用于扩增样本中的BCR组库的表达核酸序列的方法,所述方法包含使用以下的至少一组执行多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中使用每组执行扩增产生代表样本中相应免疫受体的整个组库的扩增子;由此产生包含BCR组库的免疫受体扩增子。在特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约80个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约50个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约40到约60个核苷酸部分的序列。在一些实施例中,i)的所述一个或多个多个V基因引物与模板分子的框架3区的至少一部分退火。在某些实施例中,ii)的一个或多个C基因引物包含与BCR模板分子的C基因的至少一部分退火的至少两个引物。在一些实施例中,ii)的一个或多个C基因引物包含至少两个引物,所述至少两个引物中的每个引物与IgA、IgD、IgG、IgM或IgE模板分子的C基因的至少一部分退火。在一些实施例中,ii)的一个或多个C基因引物包含至少一个引物,所述至少一个引物分别针对IgA、IgD、IgG、IgM和IgE模板分子中的每个模板分子的C基因的一部分。在特定实施例中,至少一组产生的扩增子包括BCR表达序列的互补决定区CDR3。在一些实施例中,扩增子的长度为约80到约200个核苷酸、长度为约80到约140个核苷酸、长度为约90到约130个核苷酸或长度为至少约100到约120个核苷酸。在一些实施例中,方法中使用的核酸模板是通过从逆转录从生物样本中提取的核酸分子而产生的cDNA。
在某些实施例中,提供了用于在样本中提供BCR组库的序列的方法,所述方法包含使用至少一组引物执行多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的一个或多个相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。然后执行对所得BCR扩增子分子进行的测序,并且由此测定的BCR扩增子分子的序列在样本中提供BCR的序列。在特定实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;将初始序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得BCR分子的序列。在特定实施例中,生产性读段和拯救的生产性读段的组合是BCR的测序读段的至少50%、至少60%、至少70%或至少75%。在另外的实施例中,所述方法还包含序列读段聚类和BCR克隆型报告。在一些实施例中,将鉴别的BCR组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴别所述IMGT数据库中不存在的至少一个等位基因变体的序列。在一些实施例中,平均序列读段长度介于80与185个核苷酸之间、介于115与200个核苷酸之间、介于90与130个核苷酸之间或介于约100与约120个核苷酸之间,这部分地取决于在读段长度中包含任何条形码序列。在某些实施例中,至少一组测序的扩增子包括BCR表达序列的互补决定区CDR3。
在某些实施例中,所提供的方法利用包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约70个核苷酸的序列。在特定实施例中,所提供的方法利用包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约50个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约40到约60个核苷酸的序列。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约50到约85个不同的针对FR3的引物。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约55到约80个不同的针对FR3的引物。在一些实施例中,靶免疫受体引物组包含V基因引物,所述V基因引物包含约62到约75个不同的针对FR3的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约65、66、67、68、69或70个不同的针对FR3的引物。在一些实施例中,靶BCR引物组包含一个或多个C基因引物。在特定实施例中,靶免疫受体引物组包含至少5到约15个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在特定实施例中,靶BCR引物组包含至少2到约8个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在一些实施例中,ii)的一个或多个C基因引物包含至少两个引物,所述至少两个引物中的每个引物与IgA、IgD、IgG、IgM或IgE模板分子的C基因的至少一部分退火。在一些实施例中,ii)的一个或多个C基因引物包含至少一个引物,所述至少一个引物分别针对IgA、IgD、IgG、IgM和IgE模板分子中的每个模板分子的C基因的一部分。
在特定实施例中,本发明的方法包含使用至少一组引物,所述至少一组引物包含分别选自表2和表6-10的V基因引物i)和C基因引物ii)。在某些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物分别包含选自表2的约55到约80个引物和选自表6-10的约5到约20个引物。在一些实施例中,所提供的方法包含使用至少一组引物,所述至少一组引物包含i)选自表2的约62到约75个引物,以及ii)选自表6-10中的每个表的一个或多个引物。在其它某些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68以及448-459、472-479、488-513、540-551和564-582或选自SEQ ID NO:69-136以及460-471、480-487、514-539、552-563和583-601的引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68以及460-471、480-487、514-539、552-563和583-601或选自SEQ ID NO:69-136以及448-459、472-479、488-513、540-551和564-582的引物。
在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQID NO:448-459、472-479、488-513、540-551和564-582的约5到约15个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQ ID NO:448-459的至少一个引物、选自SEQ ID NO:472-479的至少一个引物、选自SEQ ID NO:488-513的至少一个引物、选自SEQ ID NO:540-551的至少一个引物和选自SEQ ID NO:564-582的至少一个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的约5到约15个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:460-471的至少一个引物、选自SEQ ID NO:480-487的至少一个引物、选自SEQ ID NO:514-539的至少一个引物、选自SEQ ID NO:552-563的至少一个引物和选自SEQ ID NO:583-601的至少一个引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。
在某些实施例中,提供了用于扩增样本中的BCR组库的表达核酸序列的方法,所述方法包含使用以下的至少一组执行多重扩增反应以扩增具有恒定部分和V基因部分的BCR核酸模板分子:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对相应BCR编码序列的C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中使用每组执行扩增产生代表样本中相应免疫受体的整个组库的扩增子;由此产生包含BCR组库的扩增子。在特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约80个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约50个核苷酸部分的序列。在一些实施例中,i)的所述一个或多个多个V基因引物与BCR模板分子的FR2区的至少一部分退火。在某些实施例中,ii)的一个或多个C基因引物包含与BCR模板分子的恒定部分C基因的至少一部分退火的至少两个引物。在一些实施例中,ii)的一个或多个C基因引物包含至少两个引物,所述至少两个引物中的每个引物与IgA、IgD、IgG、IgM或IgE模板分子的C基因的至少一部分退火。在一些实施例中,ii)的一个或多个C基因引物包含至少一个引物,所述至少一个引物分别针对IgA、IgD、IgG、IgM和IgE模板分子中的每个模板分子的C基因的一部分。在特定实施例中,至少一组产生的扩增子包括BCR表达序列的互补决定区CDR2和CDR3。在一些实施例中,扩增子的长度为约180到约375个核苷酸、约200到约350个核苷酸、约225到约325个核苷酸或长度为约250到约300个核苷酸。在一些实施例中,方法中使用的核酸模板是通过从逆转录从生物样本中提取的核酸分子而产生的cDNA。
在某些实施例中,提供了用于在样本中提供BCR组库的序列的方法,所述方法包含使用至少一组引物执行多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。然后执行对所得BCR扩增子分子进行的测序,并且由此测定的BCR扩增子分子的序列在样本中提供BCR组库的序列。在特定实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;将初始序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得BCR分子的序列。在特定实施例中,生产性读段和拯救的生产性读段的组合是BCR的测序读段的至少40%、至少50%、至少60%、至少70%或至少75%。在另外的实施例中,所述方法还包含序列读段聚类和BCR克隆型报告。在一些实施例中,将鉴别的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴别所述IMGT数据库中不存在的至少一个等位基因变体的序列。在一些实施例中,平均序列读段长度介于约200与约375个核苷酸之间、介于约250与约350个核苷酸之间或介于约275与约350个核苷酸之间,这部分地取决于在读段长度中包含任何条形码序列。在某些实施例中,至少一组测序的扩增子包括BCR表达序列的互补决定区CDR2和CDR3。
在特定实施例中,所提供的方法利用包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR2区高出约70个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR2区高出约50个核苷酸的序列。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约4到约20个不同的针对FR2的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约5到约15个不同的针对FR2的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约5、6、7、8、9、10、11或12个不同的针对FR2的引物。在一些实施例中,靶BCR引物组包含一个或多个C基因引物。在特定实施例中,靶免疫受体引物组包含至少5到约15个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在特定实施例中,靶BCR引物组包含至少2到约8个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在一些实施例中,ii)的一个或多个C基因引物包含至少两个引物,所述至少两个引物中的每个引物与IgA、IgD、IgG、IgM或IgE模板分子的C基因的至少一部分退火。在一些实施例中,ii)的一个或多个C基因引物包含至少一个引物,所述至少一个引物分别针对IgA、IgD、IgG、IgM和IgE模板分子中的每个模板分子的C基因的一部分。
在特定实施例中,本发明的方法包含使用至少一组引物,所述至少一组引物包含分别选自表4和表6-10的V基因引物i)和C基因引物ii)。在某些其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437以及448-459、472-479、488-513、540-551和564-582的引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437以及460-471、480-487、514-539、552-563和583-601的引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQ IDNO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQID NO:431-437的至少5个引物和选自SEQ ID NO:448-459的至少一个引物、选自SEQ IDNO:472-479的至少一个引物、选自SEQ ID NO:488-513的至少一个引物、选自SEQ ID NO:540-551的至少一个引物和选自SEQ ID NO:564-582的至少一个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQ ID NO:460-471的至少一个引物、选自SEQ IDNO:480-487的至少一个引物、选自SEQ ID NO:514-539的至少一个引物、选自SEQ ID NO:552-563的至少一个引物和选自SEQ ID NO:583-601的至少一个引物。
在某些实施例中,提供了用于扩增样本中的BCR组库的表达核酸序列的方法,所述方法包含使用以下的至少一组执行多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区的至少一部分的BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶免疫受体编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中使用每组执行扩增产生代表样本中相应免疫受体的整个组库的扩增子;由此产生包含BCR的组库的扩增子。在特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约80个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约50个核苷酸部分的序列。在特定实施例中,ii)的所述一个或多个多个J基因引物针对高于J基因的约50个核苷酸部分的序列。在更特定实施例中,ii)的所述一个或多个多个J基因引物针对高于J基因的约30个核苷酸部分的序列。在某些实施例中,ii)的所述一个或多个多个J基因引物针对完全在J基因内的序列。
在某些实施例中,提供了用于扩增样本中的BCR组库的表达核酸序列的方法,所述方法包含使用以下的至少一组执行多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中使用每组执行扩增产生代表样本中相应免疫受体的整个组库的扩增子;由此产生包含BCR的组库的BCR扩增子。在特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约80个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约50个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约40到约60个核苷酸部分的序列。在一些实施例中,i)的所述一个或多个多个V基因引物与模板分子的框架3区的至少一部分退火。在某些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的至少两个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的至少2到约8个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的约4个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的约3到约6个引物。在特定实施例中,至少一组产生的扩增子包括BCR表达序列的互补决定区CDR3。在一些实施例中,扩增子的长度为约60到约160个核苷酸、长度为约70到约100个核苷酸、长度为约100到约120个核苷酸、长度为至少约70到约90个核苷酸、长度为约80到约90个核苷酸或长度为约80个核苷酸。在一些实施例中,方法中使用的核酸模板是通过从逆转录从生物样本中提取的核酸分子而产生的cDNA。
在某些实施例中,提供了用于在样本中提供BCR组库的序列的方法,所述方法包含使用至少一组引物执行多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶免疫受体编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。然后执行对所得BCR扩增子分子进行的测序,并且由此测定的免疫受体扩增子分子的序列在样本中提供BCR组库的序列。在一些实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;将初始序列读段与参考序列比对;鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得免疫受体分子的序列。在特定实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;向序列读段添加推断的J基因序列以产生延伸的序列读段;将延伸的序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得BCR分子的序列。在特定实施例中,生产性读段和拯救的生产性读段的组合是BCR的测序读段的至少50%、至少60%、至少70%或至少75%。在另外的实施例中,所述方法还包含序列读段聚类和BCR克隆型报告。在一些实施例中,将鉴别的BCR组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴别所述IMGT数据库中不存在的至少一个等位基因变体的序列。在一些实施例中,序列读段长度为约60到约185个核苷酸,这部分地取决于将任何条形码序列包含在读段长度中。在一些实施例中,平均序列读段长度介于90与120个核苷酸之间、介于70与90个核苷酸之间、或介于约75与约85个核苷酸之间或约80个核苷酸。在某些实施例中,至少一组测序的扩增子包括BCR表达序列的互补决定区CDR3。
在特定实施例中,所提供的方法利用包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约50个核苷酸的序列。在其它实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约70个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约40到约60个核苷酸的序列。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约50到约85个不同的针对FR3的引物。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约55到约80个不同的针对FR3的引物。在一些实施例中,靶免疫受体引物组包含V基因引物,所述V基因引物包含约62到约75个不同的针对FR3的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约65、66、67、68、69或70个不同的针对FR3的引物。在一些实施例中,靶BCR引物组包含多个J基因引物。在特定实施例中,靶BCR引物组包含至少两个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含2到约8个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约3到约6个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约2、3、4、5、6、7或8个不同的J基因引物。在一些实施例中,靶免疫受体引物组包含约4个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。
在特定实施例中,本发明的方法包含使用至少一组引物,所述至少一组引物包含分别选自表2和5的V基因引物i)和J基因引物ii)。在某些其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68和438-442或选自SEQ ID NO:69-136和443-447的引物。在某些其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68和443-447或选自SEQ ID NO:69-136和438-442的引物。
在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。
在某些实施例中,提供了用于扩增样本中的BCR组库的表达核酸序列的方法,所述方法包含使用以下的至少一组执行多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶免疫受体编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中使用每组执行扩增产生代表样本中相应免疫受体的整个组库的扩增子;由此产生包含BCR的组库的BCR扩增子。在特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约80个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约50个核苷酸部分的序列。在一些实施例中,i)的所述一个或多个多个V基因引物与模板分子的框架1区的至少一部分退火。在某些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的至少两个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的至少2到约8个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的约4个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的约3到约6个引物。在特定实施例中,至少一组产生的扩增子包括BCR表达序列的互补决定区CDR1、CDR2和CDR3。在一些实施例中,扩增子的长度为约220到约350个核苷酸、约225到约300个核苷酸、约250到约325个核苷酸、约250到约275个核苷酸或长度为约270到约300个核苷酸。在一些实施例中,方法中使用的核酸模板是通过从逆转录从生物样本中提取的核酸分子而产生的cDNA。
在某些实施例中,提供了用于在样本中提供BCR组库的序列的方法,所述方法包含使用至少一组引物执行多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶免疫受体编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。然后执行对所得免疫受体扩增子分子进行的测序,并且由此测定的BCR扩增子分子的序列在样本中提供BCR组库的序列。在一些实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;将初始序列读段与参考序列比对;鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得免疫受体分子的序列。在特定实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;向序列读段添加推断的J基因序列以产生延伸的序列读段;将延伸的序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得BCR分子的序列。在特定实施例中,生产性读段和拯救的生产性读段的组合是免疫受体的测序读段的至少50%、至少60%、至少70%或至少75%。在另外的实施例中,所述方法还包含序列读段聚类和BCR克隆型报告。在一些实施例中,将鉴别的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴别所述IMGT数据库中不存在的至少一个等位基因变体的序列。在一些实施例中,平均序列读段长度介于200与350个核苷酸之间、介于225与325个核苷酸之间、介于250与300个核苷酸之间、介于270与300个核苷酸之间或介于295与325个核苷酸之间,这部分地取决于在读段长度中包含任何条形码序列。在某些实施例中,至少一组测序的扩增子包括BCR表达序列的互补决定区CDR1、CDR2和CDR3。
在特定实施例中,所提供的方法利用包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR1区高出约70个核苷酸的序列。在其它某些实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR1区高出约80个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR1区高出约50个核苷酸的序列。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约18到约45个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约22到约35个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约25到约35个不同的针对FR1的引物。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约40到约65个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约48到约60个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含多个J基因引物。在特定实施例中,靶BCR引物组包含至少两个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含2到约8个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约3到约6个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约2、3、4、5、6、7或8个不同的J基因引物。在一些实施例中,靶免疫受体引物组包含约4个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。
在特定实施例中,本发明的方法包含使用至少一组引物,所述至少一组引物包含分别选自表3和5的V基因引物i)和J基因引物ii)。在某些其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283和438-442或选自SEQ ID NO:284-430和443-447的引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283和443-447或选自SEQID NO:284-430和438-442的引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少20或至少25个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约15到约35个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约22到约35个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少20或至少25个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约15到约35个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约22到约35个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少20或至少25个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少20或至少25个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。
在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少40或至少50个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约40到约65个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约48到约60个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少40或至少50个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约40到约65个引物和选自SEQID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约48到约60个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少40或至少50个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少40或至少50个引物和选自SEQID NO:438-442的至少2个引物、至少3个引物或至少4个引物。
在某些实施例中,提供了用于扩增样本中的BCR组库的表达核酸序列的方法,所述方法包含使用以下的至少一组执行多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区2(FR2)的至少一部分的BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶免疫受体编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中使用每组执行扩增产生代表样本中相应免疫受体的整个组库的扩增子;由此产生包含BCR的组库的免疫受体扩增子。在特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约80个核苷酸部分的序列。在更特定实施例中,i)的所述一个或多个多个V基因引物针对高于框架区的约50个核苷酸部分的序列。在一些实施例中,i)的所述一个或多个多个V基因引物与模板分子的FR2区的至少一部分退火。在某些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因的至少一部分退火的至少十个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的约14个引物。在一些实施例中,ii)的所述多个J基因引物与模板分子的J基因部分的至少一部分退火的至少两个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的至少2到约8个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的约4个引物。在一些实施例中,ii)的所述多个J基因引物包含与模板分子的J基因部分的至少一部分退火的约3到约6个引物。在特定实施例中,至少一组产生的扩增子包括BCR基因序列的互补决定区CDR2和CDR3。在一些实施例中,扩增子的长度为约160到约270个核苷酸、约180到约250个核苷酸或长度为约195到约225个核苷酸。在一些实施例中,方法中使用的核酸模板是通过从逆转录从生物样本中提取的核酸分子而产生的cDNA。
在某些实施例中,提供了用于在样本中提供BCR组库的序列的方法,所述方法包含使用至少一组引物执行多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶免疫受体编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。然后执行对所得免疫受体扩增子分子进行的测序,并且由此测定的BCR扩增子分子的序列在样本中提供BCR组库的序列。在一些实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;将初始序列读段与参考序列比对;鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得免疫受体分子的序列。在特定实施例中,测定BCR扩增子分子的序列包括:获得初始序列读段;向序列读段添加推断的J基因序列以产生延伸的序列读段;将延伸的序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得BCR分子的序列。在特定实施例中,生产性读段和拯救的生产性读段的组合是BCR的测序读段的至少40%、至少50%、至少60%、至少70%或至少75%。在另外的实施例中,所述方法还包含序列读段聚类和BCR克隆型报告。在一些实施例中,将鉴别的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴别所述IMGT数据库中不存在的至少一个等位基因变体的序列。在一些实施例中,平均序列读段长度介于160与300个核苷酸之间、介于180与280个核苷酸之间、介于200与260个核苷酸之间或介于225与270个核苷酸之间,这部分地取决于在读段长度中包含任何条形码序列。在某些实施例中,至少一组测序的扩增子包括BCR表达序列的互补决定区CDR2和CDR3。
在特定实施例中,所提供的方法利用包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR2区高出约70个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR2区高出约50个核苷酸的序列。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约4到约20个不同的针对FR2的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约5到约15个不同的针对FR2的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约5、6、7、8、9、10、11或12个不同的针对FR2的引物。在一些实施例中,靶BCR引物组包含多个J基因引物。在特定实施例中,靶BCR引物组包含至少两个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含2到约8个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约3到约6个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约2、3、4、5、6、7或8个不同的J基因引物。在一些实施例中,靶免疫受体引物组包含约4个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。
在特定实施例中,本发明的方法包含使用至少一组引物,所述至少一组引物包含分别选自表4和5的V基因引物i)和J基因引物ii)。在某些其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437和438-442或选自SEQ ID NO:431-437和443-447的引物。在一些实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在其它实施例中,本发明的方法包含使用至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。
在某些实施例中,本发明的方法包含使用选自由造血细胞、淋巴细胞和肿瘤细胞组成的组的生物样本。在一些实施例中,生物样本选自由以下组成的组:外周血单核细胞(PBMC)、T细胞、B细胞、循环肿瘤细胞和肿瘤浸润淋巴细胞(本文中称为“TILs”或“TIL”)。在一些实施例中,生物样本包含进行离体活化和/或扩增的B细胞。在一些实施例中,生物样本包含如例如在血液或血浆中发现的cfDNA。在一些实施例中,生物样本选自由以下组成的组:组织(例如,淋巴结、器官组织、骨髓)、全血、滑液、脑脊液、肿瘤活检和其它含有细胞的临床标本。
在一些实施例中,提供了用于通过评估来自生物样本的表达的免疫受体RNA和重排的免疫受体基因组DNA(gDNA)两者来测定生物样本的免疫组库的方法、组合物和系统。在一些实施例中,可以同时评估样本RNA和gDNA,并且在对RNA进行逆转录以形成cDNA之后,可以在相同的多重扩增反应中扩增cDNA和gDNA。在一些实施例中,来自样本RNA和样本gIDNA的cDNA可以在单独的反应中进行多重扩增。在一些实施例中,来自样本RNA和样本gDNA的cDNA可以用平行引物池进行多重扩增。在一些实施例中,使用针对相同的BCR的引物池评估来自样本的gDNA和RNA的BCR组库。在一些实施例中,使用针对不同的免疫受体的引物池评估来自样本的gDNA和RNA的免疫组库。在一些实施例中,用来自样本RNA和样本gDNA的cDNA单独执行多重扩增反应以扩增来自样本的相同或不同靶免疫受体分子,并且对所得免疫受体扩增子进行测序,由此提供生物样本的表达的免疫受体RNA和重排的免疫受体gDNA的序列。
在一些实施例中,使用针对不同的免疫受体的引物池评估来自样本的gDNA和/或RNA的免疫组库。在一些实施例中,用本文提供的一组IgH引物和例如如以下中描述的一组针对TCR β的引物来执行多重扩增反应:于2018年1月17日提交的PCT申请第PCT/US2018/014111号和于2018年8月31日提交的PCT申请第PCT/US2018/049259号,所述申请中的每个申请的全部内容通过引用并入本文,或作为OncomineTM TCR β-SR测定DNA、OncomineTM TCRβ-SR测定RNA和OncomineTM TCR β-LR测定(赛默飞世尔科技公司)可商购获得。使用单一多重扩增反应评估来自样本的BCR(例如,IgH)组库和TCR(例如,TCR β)组库两者的能力可用于节省时间和有限的生物样本并且适用于本文所述的方法中的许多方法,包括与过敏和自身免疫、疫苗研发和使用以及免疫肿瘤学有关的方法。例如,将B细胞组库分析与T细胞组库分析相结合可以用于改善在施用免疫治疗(如检查点阻断或检查点抑制剂免疫治疗)后对免疫组库变化的检测,这潜在地表示对免疫治疗的应答。而且,将B细胞组库分析与T细胞组库分析相结合可以用于改善对疫苗功效的评价。响应于免疫治疗或响应于疫苗施用的示例性免疫组库变化包括但不限于与治疗前均匀度值相比在治疗之后(例如但不限于在治疗后的第7-14天时)的T细胞均匀度和B细胞均匀度的降低以及与治疗前的值相比在一次或多次治疗后的IgG1表达性B细胞的代表的增加。
在一些实施例中,所提供的方法和组合物用于鉴别和/或表征受试者的免疫组库。在一些实施例中,所提供的方法和组合物用于鉴别和表征受试者的免疫组库的新颖或非典型的BCR等位基因。在一些实施例中,将鉴别的免疫组库的序列与IMGT数据库的同期或当前版本进行比较,并鉴别所述IMGT数据库中不存在的至少一个等位基因变体的序列。在一些实施例中,使用例如克隆数支持、序列读段支持和/或具有等位基因变体的个体数等标准,使IMGT数据库中不存在的所鉴别的等位基因变体经受基于证据的过滤。可以将IMGT中不存在的所鉴别和报告的等位基因变体与含有免疫组库序列信息的其它数据库如NCBI NR数据库和Lym1K数据库进行比较,以交叉验证报告的新颖或非经典的BCR等位基因。例如,表征无记录或非经典的IgH多态性的存在可能有助于理解影响自身免疫疾病、传染病和对免疫治疗的应答的因素。在一些实施例中,如本文所述的所鉴别的新颖或非经典的BCR等位基因的序列可以用于产生重组BCR核酸或分子。因此,在其它实施例中,提供了用于制备编码所鉴别的新颖IgH等位基因变体的重组核酸的方法。在一些实施例中,提供了用于制备重组IgH等位基因变体分子和用于制备表达所述分子的重组细胞的方法。
在一些实施例中,所提供的方法和组合物用于鉴别和表征受试者的免疫组库的新颖或非典型的BCR等位基因。在一些实施例中,可以在治疗性治疗例如对癌症或免疫病症的治疗之前和/或之后鉴别或表征患者的免疫组库。在一些实施例中,鉴别或表征免疫组库可以用于评估治疗的效果或功效,以修改治疗方案和/或优化对治疗剂的选择。在一些实施例中,鉴别或表征免疫组库可以用于评估患者对免疫治疗、癌症疫苗和/或其它基于免疫的治疗或其一种或多种组合的应答。在一些实施例中,鉴别或表征免疫组库可以指示患者对治疗剂做出应答的可能性或可以指示患者对治疗剂不做出应答的可能性。
在一些实施例中,可以鉴别或表征患者的BCR组库以监测过度增殖性疾病的进展和/或治疗(包括在患者治疗之后检测残留疾病)、监测自身免疫疾病的进展和/或治疗、移植监测并且监测抗原刺激的病状,包括在接种疫苗、暴露于细菌、真菌、寄生虫或病毒抗原或被细菌、真菌、寄生虫或病毒感染之后。在一些实施例中,鉴别或表征BCR组库可以用于评估患者对抗感染或抗炎治疗的应答。
在一些实施例中,提供了用于鉴别和/或表征来自受试者的样本中的免疫组库克隆群体的方法和组合物,所述方法和组合物包含用样本或从样本制备的cDNA执行一个或多个多重扩增反应以使用至少一组引物扩增具有恒定部分和可变部分的免疫组库核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对免疫受体编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。所述方法还包含:对所得BCR扩增子分子进行测序;测定BCR扩增子分子的序列;以及从样本中鉴别靶BCR的一个或多个免疫组库克隆群体。在特定实施例中,测定免疫受体扩增子分子的序列包括:获得初始序列读段;将初始序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得免疫受体分子的序列。在此类方法和组合物的其它实施例中,使用至少一组引物执行所述一个或多个多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。在此类方法和组合物的其它实施例中,使用至少一组引物执行所述一个或多个多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。
在一些实施例中,提供了用于鉴别和/或表征来自受试者的样本中的免疫组库克隆群体的方法和组合物,所述方法和组合物包含使用至少一组引物用样本或从样本制备的cDNA执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。所述方法还包含:对所得BCR扩增子分子进行测序;测定BCR扩增子分子的序列;以及从样本中鉴别靶BCR的一个或多个免疫组库克隆群体。在特定实施例中,测定免疫受体扩增子分子的序列包括:获得初始序列读段;向序列读段添加推断的J基因序列以产生延伸的序列读段;将延伸的序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得免疫受体分子的序列。在此类方法和组合物的其它实施例中,使用至少一组引物执行所述多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因引物,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因引物,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。
因此,在一些实施例中,所提供的方法、组合物和工作流程用于但不限于评估B细胞群的克隆性、多样性和丰富性。例如,克隆扩增可以鉴别对抗原攻击响应的B细胞,并且纵向分析可以用于评价疫苗接种的功效。在一些实施例中,所提供的方法、组合物和工作流程用于鉴别具有许多成员的克隆谱系。例如,具有许多成员的克隆谱系可以代表对慢性抗原刺激响应的B细胞。在一些实施例中,所提供的方法、组合物和工作流程用于鉴别抗原特异性B细胞。例如,跨已经暴露于相同抗原的个体组比价IgH组库可以揭示指示抗原特异性IgH链的共有IgH氨基酸基序。在一些实施例中,所提供的方法、组合物和工作流程用于评价克隆重叠。例如,克隆重叠分析可以揭示B细胞运输和B细胞群之间的发育关系。在一些实施例中,所提供的方法、组合物和工作流程用于测定包括在纵向分析中的优势克隆VDJ序列。在一些实施例中,所提供的方法、组合物和工作流程用于通过克隆谱系分析来鉴别恶性亚克隆。例如,对于一些B细胞恶性肿瘤(例如,滤泡性淋巴瘤),体细胞超突变进行中,从而导致具有不同但相关的IgH序列的恶性亚克隆的存在,所述恶性亚克隆可以用所提供的方法、组合物和工作流程来跟踪。
在一些实施例中,所提供的方法、组合物和工作流程用于评价克隆演化。例如,对克隆谱系的分析可以揭示对抗原结合很重要的同种型转换和IgH残基。在一些实施例中,所提供的方法、组合物和工作流程用于评价同种型丰度。例如,某些同种型的过度表达或未充分表达可能表明疾病或免疫缺陷,如但不限于响应于病毒感染的IgG1升高、过敏时的IgE升高以及同种型缺失或未充分表达可能表明原发性免疫缺陷。在一些实施例中,所提供的方法、组合物和工作流程用于量化体细胞超突变。例如,体细胞超突变的频率提供了对发生恶性转化的B细胞发育阶段的了解。
在一些实施例中,所提供的方法和组合物用于鉴别和/或表征BCR组库或克隆群体内的体细胞超突变(SHM)。在一些实施例中,所提供的方法和组合物用于鉴别和/或筛选罕见的BCR克隆或亚克隆,例如具有体细胞超突变的VDJ重排的那些BCR克隆或亚克隆。在一些实施例中,鉴别、量化和/或表征罕见的BCR克隆可以为给定的病状或治疗应答提供生物标志物。因此,在一些实施例中,本文提供的方法和组合物用于使用例如从回顾性或纵向受试者研究中获得的样本鉴别、筛选和/或表征作为生物标志物的BCR克隆。
在一些实施例中,用于鉴别和/或表征BCR克隆谱系和SHM的方法包含:使用至少一组引物和一个或多个C基因引物用受试者的样本执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分;对所得BCR扩增子进行测序;以及执行本文提供的VDJ序列分析以鉴别和/或量化来自样本的靶BCR的SMH和克隆谱系。在其它实施例中,用于鉴别和/或表征BCR克隆谱系和SHM的方法包含:使用至少一组引物和多个J基因引物用受试者的样本执行一个或多个多重扩增反应,以扩增具有J基因部分和可变部分的BCR核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因;对所得BCR扩增子进行测序;以及执行本文提供的VDJ序列分析以鉴别来自样本的靶BCR的SHM和克隆谱系。
在一些实施例中,所提供的方法和组合物用于鉴别、量化、表征和/或监测BCR组库或B细胞克隆谱系内的同种型(或亚同种型)类别或同种型类别转换。在一些实施例中,此类方法包含:使用至少一组引物和一个或多个C基因引物用受试者的样本执行一个或多个多重扩增反应,以扩增具有恒定部分和可变部分的IgH核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的大多数不同IgHV基因编码序列,所述一个或多个C基因引物针对IgH编码序列的C基因的至少一部分;对所得扩增子进行测序;执行本文提供的序列分析以鉴别样本的BCR组库或克隆谱系的一个或多个IgH同种型类别。在一些实施例中,引物组包含针对单一同种型例如IgE的C基因的至少一部分的一个或多个引物。在其它实施例中,引物组包含至少两个引物,每个引物针对两个不同同种型的C基因的至少一部分。在其它实施例中,引物组包含至少一种单独针对IgA、IgD、IgG、IgM和IgE同种型类型的C基因的至少一部分的引物。
在某些实施例中,所提供的方法和组合物用于监测BCR组库克隆群体和克隆谱系的变化,例如克隆扩增的变化、克隆收缩的变化、BCR组库内的克隆或克隆群体的相对比例的变化、克隆谱系的扩展或收缩的变化、组库内体细胞超突变和/或同种型类别转换的变化。在一些实施例中,所提供的方法和组合物用于监测响应于肿瘤生长的BCR组库克隆群体或克隆谱系的变化(例如,克隆群体或谱系扩增、克隆群体或谱系收缩、以相对比率的克隆群体或谱系变化、体细胞超突变和/或类别转换的变化)。在一些实施例中,所提供的方法和组合物用于监测响应于肿瘤治疗的BCR组库克隆群体的变化(例如,克隆群体或谱系扩增、克隆群体或谱系收缩、以相对比率的克隆群体或谱系变化、体细胞超突变和/或类别转换的变化)。在一些实施例中,所提供的方法和组合物用于监测在缓解期间的BCR组库克隆群体或克隆谱系的变化(例如,克隆群体或谱系扩增、克隆群体或谱系收缩、以相对比率的克隆群体或谱系变化、体细胞超突变和/或类别转换的变化)。对于许多淋巴恶性肿瘤,克隆B细胞受体序列可以用作特定癌症(例如,白血病)的恶性细胞的生物标志物并且用于监测残留疾病、肿瘤扩增、收缩和/或治疗应答。在某些实施例中,可以鉴别并进一步表征克隆B细胞受体以确认治疗、生物标志物和/或诊断用途中的新的实用性。
在一些实施例中,提供了用于监测受试者中的BCR克隆群体的变化的方法和组合物,所述方法和组合物包含:使用至少一组引物和ii)一个或多个C基因引物用受试者的样本执行一个或多个多重扩增反应,以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分;对所得BCR扩增子进行测序;鉴别来自样本的靶BCR的免疫组库克隆群体;以及将所鉴别的BCR组库克隆群体与在不同时间从受试者获得的样本中鉴别的那些克隆群体进行比较。在一些实施例中,提供了用于监测受试者中的BCR克隆群体的变化的方法和组合物,所述方法和组合物包含:使用至少一组引物和多个J基因引物用受试者的样本执行一个或多个多重扩增反应,以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因;对所得BCR扩增子进行测序;鉴别来自样本的靶BCR的免疫组库克隆群体;以及将所鉴别的免疫组库克隆群体与在不同时间从受试者获得的样本中鉴别的那些克隆群体进行比较。在各个实施例中,在此类方法中执行的所述一个或多个多重扩增反应可以是单一多重扩增反应或可以是并行执行的两个或更多个多重扩增反应,例如用不同的引物池执行的并行高度多重化的扩增反应。用于监测BCR组库克隆群体的变化的样本包括但不限于在诊断之前获得的样本、在诊断的任何阶段获得的样本、在缓解期间获得的样本、在治疗之前的任何时间获得的样本(治疗前的样本),在治疗完成后的任何时间获得的样本(治疗后的样本)和在治疗过程期间获得的样本。
在某些实施例中,提供了用于鉴别和/或表征患者的BCR组库以监测患者的过度增殖性疾病的进展和/或治疗的方法和组合物。在一些实施例中,所提供的方法和组合物用于患者治疗后的最小残留疾病(MRD)监测。在一些实施例中,所提供的方法和组合物允许对可用于MRD测量和用于鉴别罕见的BCR克隆的患者BCR组库进行深度测序。在一些实施例中,监测MRD包括评估BCR组库的体细胞超突变。在一些实施例中,方法和组合物用于鉴别和/或跟踪B细胞谱系恶性肿瘤或T细胞谱系恶性肿瘤。在一些实施例中,方法和组合物用于检测和/或监测诊断患有白血病或淋巴瘤的患者的MRD,包括但不限于急性淋巴细胞白血病、慢性髓性白血病、慢性淋巴细胞白血病、慢性髓性白血病、皮肤T细胞淋巴瘤、B细胞淋巴瘤、套细胞淋巴瘤和多发性骨髓瘤。在一些实施例中,方法和组合物用于检测和/或监测诊断患有实体瘤的患者的MRD,所述实体瘤包括但不限于乳腺癌、肺癌、结肠直肠癌和神经母细胞瘤。在一些实施例中,方法和组合物用于检测和/或监测在癌症治疗之后的患者的MRD,所述癌症治疗包括但不限于骨髓移植、淋巴细胞输注、过继性T细胞治疗、其它基于细胞的免疫治疗和基于抗体的免疫治疗。
在一些实施例中,提供了用于鉴别和/或表征患者的BCR组库以监测患者的过度增殖性疾病的进展和/或治疗的方法和组合物,所述方法和组合物包含:使用至少一组引物用来自患者的样本或从样本制备的cDNA执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。所述方法还包含:对所得BCR扩增子分子进行测序;测定BCR扩增子分子的序列;以及从样本中鉴别靶BCR的免疫组库。在特定实施例中,测定免疫受体扩增子分子的序列包括:获得初始序列读段;将初始序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得免疫受体分子的序列。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。
在一些实施例中,提供了用于鉴别和/或表征患者的BCR组库以监测患者的过度增殖性疾病的进展和/或治疗的方法和组合物,所述方法和组合物包含:使用至少一组引物用来自患者的样本或从样本制备的cDNA执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。所述方法还包含:对所得BCR扩增子分子进行测序;测定BCR扩增子分子的序列;以及从样本中鉴别靶BCR的免疫组库。具体地,确定免疫受体扩增子分子的序列的实施例包括:获得初始序列读段;向序列读段添加推断的J基因序列以产生延伸的序列读段;将延伸的序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得免疫受体分子的序列。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR1的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因引物,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因引物,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。
在一些实施例中,提供了用于对患有过度增殖性疾病的患者进行MRD监测的方法和组合物,所述方法和组合物包含:使用至少一组引物和ii)一个或多个C基因引物用患者的样本执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分;对所得BCR扩增子进行测序;鉴别靶BCR的免疫组库序列;以及检测与过度增殖性疾病相关的样本中一个或多个BCR序列的存在或不存在。在一些实施例中,提供了用于对患有过度增殖性疾病的患者进行MRD监测的方法和组合物,所述方法和组合物包含:使用至少一组引物和多个J基因引物用患者的样本执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的免疫组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因;对所得BCR扩增子进行测序;鉴别靶BCR的免疫组库序列;以及检测与过度增殖性疾病相关的样本中一个或多个免疫受体序列的存在或不存在。在各个实施例中,在此类方法中执行的所述一个或多个多重扩增反应可以是单一多重扩增反应或可以是并行执行的两个或更多个多重扩增反应,例如用不同的引物池执行的并行高度多重化的扩增反应。用于MRD监测的样本包括但不限于在缓解期间获得的样本,在完成治疗后的任何时间获得的样本(治疗后样本)和在治疗过程期间获得的样本。
在某些实施例中,提供了用于响应于治疗而鉴别和/或表征受试者的BCR组库的方法和组合物。在一些实施例中,方法和组合物用于在肿瘤治疗之前、期间和/或之后表征和/或监测肿瘤浸润淋巴细胞(TIL)的群体或克隆。在一些实施例中,分析TIL的免疫受体组库提供对肿瘤微环境的表征和/或评估。在一些实施例中,用于测定免疫组库的方法和组合物用于鉴别和/或跟踪一个或多个治疗性T细胞群和B细胞群。在一些实施例中,所提供的方法和组合物用于鉴别和/或监测在患者治疗后基于细胞的治疗的持久性,包括但不限于工程化T细胞群的存在(例如,持续存在),所述细胞群包括但不限于CAR-T细胞群、TCR工程化T细胞群、持续CAR-T表达,施用的TIL群体的存在(例如,持续存在),过继性T细胞治疗后的TIL表达(例如,持续表达)和/或同种异体造血细胞移植之后的免疫重建。
在一些实施例中,所提供的方法和组合物用于表征和/或监测在向患者施用基于细胞的治疗后存在于患者样本中的B细胞克隆或群体,所述基于细胞的治疗包括但不限于例如癌症疫苗细胞、CAR-T、TIL和/或其它工程化基于细胞的治疗。在一些实施例中,所提供的方法和组合物用于在基于细胞的治疗后表征和/或监测患者样本中的BCR组库,以便评估和/或监测患者对所施用的基于细胞的治疗的应答。用于在基于细胞的治疗后进行的此类表征和/或监测的样本包括但不限于来自患者的循环血细胞、循环肿瘤细胞、TIL、组织、cfDNA和一个或多个肿瘤样本。
在一些实施例中,提供了用于监测对接受此类治疗的患者进行的基于细胞的治疗的方法和组合物,所述方法和组合物包含:使用至少一组引物和ii)一个或多个C基因引物用患者的样本执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分;对所得BCR扩增子进行测序;鉴别靶BCR的免疫组库序列;以及检测与基于细胞的治疗相关的样本中一个或多个BCR序列的存在或不存在。在一些实施例中,提供了用于监测对接受此类治疗的患者进行的基于细胞的治疗的方法和组合物,所述方法和组合物包含:使用至少一组引物和多个J基因引物用患者的样本执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的BCR组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因;对所得BCR扩增子进行测序;鉴别靶BCR的免疫组库序列;以及检测与基于细胞的治疗相关的样本中一个或多个BCR序列的存在或不存在。
在一些实施例中,提供了用于在施用基于细胞的治疗后监测患者的应答的方法和组合物,所述方法和组合物包含:使用至少一组引物和ii)一个或多个C基因引物用受试者的样本执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的BCR组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分;对所得BCR扩增子进行测序;鉴别靶BCR的免疫组库序列;以及将所鉴别BCR组库与在不同时间从患者获得的样本中鉴别的一个或多个免疫受体序列进行比较。在一些实施例中,提供了用于在施用基于细胞的治疗后监测患者的应答的方法和组合物,所述方法和组合物包含:使用至少一组引物和多个J基因引物用患者的样本执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的BCR组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因;对所得BCR扩增子进行测序;鉴别靶BCR的免疫组库序列;以及将所鉴别BCR组库与在不同时间从患者获得的样本中鉴别的一个或多个免疫受体序列进行比较。适于此类监测的基于细胞的治疗包括但不限于CAR-T细胞、TCR工程化T细胞、TIL和其它富集的自体细胞。在各个实施例中,在此类方法中执行的所述一个或多个多重扩增反应可以是单一多重扩增反应或可以是并行执行的两个或更多个多重扩增反应,例如用不同的引物池执行的并行高度多重化的扩增反应。用于此类监测的样本包括但不限于在诊断之前获得的样本、在诊断的任何阶段获得的样本、在缓解期间获得的样本、在治疗之前的任何时间获得的样本(治疗前的样本),在治疗完成后的任何时间获得的样本(治疗后的样本)和在治疗过程期间获得的样本。
在一些实施例中,用于测定B细胞受体组库或B细胞和T细胞受体组库的方法和组合物用于在治疗之前、期间和/或之后测量和/或评估免疫能力,所述治疗包括但不限于实体器官移植或骨髓移植。
在某些实施例中,所提供的方法和组合物用于响应于治疗性治疗而鉴别和/或表征受试者的BCR组库,所述治疗包括但不限于免疫治疗、抗过敏治疗和抗感染剂治疗。因此,在一些实施例中,所提供的方法和组合物用于鉴别BCR组库或克隆谱系生物标志物或治疗应答的特征,所述治疗应答如对治疗性治疗的有利应答(例如,疫苗接种成功)或有害应答(例如,免疫系统介导的不良事件)。在一些实施例中,提供了用于响应于治疗而鉴别和/或表征的受试者的BCR组库的方法和组合物,所述方法和组合物包含:在开始治疗之后从受试者获得样本;使用至少一组引物用样本或从样本制备的cDNA执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。所述方法还包含:对所得BCR扩增子分子进行测序;测定BCR扩增子分子的序列;以及从样本中鉴别靶BCR的免疫组库。在一些实施例中,所述方法还包含将来自在治疗开始后获得的样本的所鉴别的BCR组库与来自在治疗前获得的患者样本的BCR组库进行比较。具体地,测定BCR扩增子分子的序列的实施例包括:获得初始序列读段;将初始序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得免疫受体分子的序列。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。
在一些实施例中,提供了用于响应于治疗而鉴别和/或表征的受试者的BCR组库的方法和组合物,所述方法和组合物包含:在开始治疗之后从受试者获得样本;使用至少一组引物用样本或从样本制备的cDNA执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,由此产生BCR扩增子分子。所述方法还包含:对所得BCR扩增子分子进行测序;测定BCR扩增子分子的序列;以及从样本中鉴别靶BCR的免疫组库。在一些实施例中,所述方法还包含将来自在治疗开始后获得的样本的所鉴别的BCR组库与来自在治疗前获得的患者样本的BCR组库进行比较。具体地,测定BCR扩增子分子的序列的实施例包括:获得初始序列读段;向序列读段添加推断的J基因序列以产生延伸的序列读段;将延伸的序列读段与参考序列比对并鉴别生产性读段;校正一个或多个插入缺失错误以产生拯救的生产性序列读段;以及测定所得BCR分子的序列。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR1的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因引物,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。在此类方法和组合物的其它实施例中,使用至少一组引物执行多重扩增反应,所述至少一组引物包含:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因,和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因引物,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组。
在一些实施例中,提供了用于响应于治疗而监测受试者的BCR组库的变化的方法和组合物,所述方法和组合物包含:使用至少一组引物和一个或多个C基因引物用受试者或患者的样本执行一个或多个多重扩增反应,以扩增具有恒定部分和可变部分的BCR核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分;对所得BCR扩增子进行测序;鉴别来自样本的靶BCR的免疫组库序列;以及将所鉴别的BCR组库与在不同时间从受试者获得的样本中鉴别的那些组库进行比较。在一些实施例中,提供了用于响应于治疗而监测受试者的BCR组库的变化的方法和组合物,所述方法和组合物包含:使用至少一组引物和多个J基因引物用受试者或患者的样本执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因;对所得BCR扩增子进行测序;鉴别来自样本的靶BCR的免疫组库序列;以及将所鉴别的BCR组库与在不同时间从受试者获得的样本中鉴别的组库进行比较。在各个实施例中,在此类方法中执行的所述一个或多个多重扩增反应可以是单一多重扩增反应或可以是并行执行的两个或更多个多重扩增反应,例如用不同的引物池执行的并行高度多重化的扩增反应。用于监测BCR组库变化的样本包括但不限于在诊断之前获得的样本、在诊断的任何阶段获得的样本、在缓解期间获得的样本、在治疗之前的任何时间获得的样本(治疗前的样本),在治疗完成后的任何时间获得的样本(治疗后的样本)和在治疗过程期间获得的样本。
在某些实施例中,所提供的方法和组合物用于表征和/或监测与一个或多个免疫系统介导的不良事件相关的BCR组库,所述不良事件包括但不限于与炎性病状、自身免疫性反应和/或自身免疫疾病或病症相关的那些不良事件。在一些实施例中,所提供的方法和组合物用于鉴别和/或监测与慢性自身免疫疾病或病症相关的B细胞免疫组库或B细胞和T细胞免疫组库,所述疾病或病症包括但不限于多发性硬化、I型糖尿病、嗜睡症、类风湿性关节炎、强直性脊柱炎、哮喘和SLE。在一些实施例中,使用如血液样本等全身性样本测定患有自身免疫性病状的个体的一个或多个免疫组库。在一些实施例中,使用如来自受影响关节或肿胀区的流体样本等局部样本来测定患有自身免疫性病状的个体的一个或多个免疫组库。在一些实施例中,将在局部或受影响区样本中发现的免疫组库与在全身性样本中发现的免疫组库进行比较可以鉴别所靶向的克隆T或B细胞群进行去除。
在一些实施例中,提供了用于鉴别和/或监测与患者的一个或多个免疫系统介导的不良事件的进展和/或治疗相关的BCR组库的方法和组合物,所述方法和组合物包含:使用至少一组引物和一个或多个C基因引物用受试者的样本执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的BCR组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分;对所得BCR扩增子进行测序;鉴别来自样本的靶BCR的免疫组库序列;以及将所鉴别BCR组库与在不同时间从患者获得的样本中鉴别的BCR组库进行比较。在一些实施例中,提供了用于鉴别和/或监测与患者的一个或多个免疫系统介导的不良事件的进展和/或治疗相关的BCR组库的方法和组合物,所述方法和组合物包含:使用至少一组引物和多个J基因引物用患者的样本执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的BCR核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因;对所得BCR扩增子进行测序;鉴别来自样本的靶免疫受体的BCR序列;以及将所鉴别BCR组库与在不同时间从患者获得的样本中鉴别的一个或多个BCR组库进行比较。在各个实施例中,在此类方法中执行的所述一个或多个多重扩增反应可以是单一多重扩增反应或可以是并行执行的两个或更多个多重扩增反应,例如用不同的引物池执行的并行高度多重化的扩增反应。用于监测与免疫系统介导的(一种或多种)不良事件相关联的免疫组库变化的样本包括但不限于在诊断之前获得的样本,在诊断的任何阶段获得的样本,在缓解期间获得的样本,在治疗之前的任何时间获得的样本(治疗前样本),在治疗完成后的任何时间获得的样本(治疗后样本)和在治疗过程中获得的样本。
在一些实施例中,所提供的方法和组合物用于表征和/或监测与被动免疫相关联的免疫组库,所述被动免疫包括自然获得的被动免疫力和人工获得的被动免疫治疗。例如,所提供的方法和组合物可用于鉴别和/或监测保护性抗体,所述保护性抗体在将抗体介导的免疫力转移到受体后向受体提供被动免疫力,包括但不限于怀孕期间从母体传递到胎儿或通过母乳喂养的婴儿或经由向接受者施用抗体传递的抗体介导的免疫力。在另一个实例中,所提供的方法和组合物可用于鉴别和/或监测与细胞介导的免疫力被动转移到接受者(如将成熟的循环淋巴细胞施用到与供体组织相容的接受者)相关联的B细胞和/或T细胞免疫组库。在一些实施例中,所提供的方法和组合物用于监测在接受者中被动免疫的持续时间。
在一些实施例中,所提供的方法和组合物用于表征和/或监测与主动免疫或疫苗接种治疗相关的免疫组库。例如,在暴露于疫苗或感染剂后,所提供的方法和组合物可以用于鉴别和/或监测可以为暴露的个体提供主动免疫的保护性抗体或保护性克隆B细胞群或克隆B细胞和T细胞群。在一些实施例中,所提供的方法和组合物用于监测有助于暴露个体的免疫的B细胞克隆或B细胞和T细胞克隆的持续时间。在一些实施例中,所提供的方法和组合物用于鉴别和/或监测与暴露于细菌、真菌、寄生虫或病毒抗原相关的B细胞和/或T细胞免疫组库。在一些实施例中,所提供的方法和组合物用于鉴别和/或监测与细菌、真菌、寄生虫或病毒感染相关的B细胞和/或T细胞免疫组库。因此,在一些实施例中,所提供的方法和组合物用于疫苗研发,包括但不限于出于质量或监管目的鉴别和/或表征对疫苗候选物的一个或多个应答,以及评估对疫苗的一个或多个应答。
在一些实施例中,提供了用于在暴露于疫苗或感染剂后监测BCR组库的变化的方法和组合物,所述方法和组合物包含:使用至少一组引物和一个或多个C基因引物用暴露的受试者的样本执行一个或多个多重扩增反应,以扩增具有恒定部分和可变部分的BCR组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分;对所得BCR扩增子进行测序;鉴别来自样本的靶BCR的免疫组库序列;以及将所鉴别的BCR组库与在不同时间从受试者获得的样本中(例如,在暴露之前或获得所测试的样本之后)鉴别的一个或多个BCR组库进行比较。在一些实施例中,提供了用于在暴露于疫苗或感染剂后监测BCR组库的变化的方法和组合物,所述方法和组合物包含:使用至少一组引物和多个J基因引物用暴露的受试者的样本执行一个或多个多重扩增反应以扩增具有J基因部分和V基因部分的BCR组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的至少一个BCR编码序列的大多数不同V基因,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因;对所得BCR扩增子进行测序;鉴别来自样本的靶免疫受体的BCR序列;以及将所鉴别BCR组库与在不同时间从患者获得的样本中鉴别的一个或多个BCR组库进行比较。在某些实施例中,提供了用于在暴露于疫苗或感染剂后监测BCR组库的变化的方法和组合物,所述方法和组合物包含:使用至少一组引物用从暴露的受试者的样本制备的cDNA执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的IgH核酸模板分子,所述至少一组引物包含:i)针对包括V基因内的FR1、FR2或FR3的至少一部分的大多数不同IgH V基因的多个V基因引物和针对IgH C基因的至少一部分的一个或多个C基因引物;对所得BCR扩增子进行测序;鉴别来自样本的包括组库同种型信息的表达的IgH组库序列;以及将所鉴别的IgH组库与在不同时间从受试者获得的样本中(例如,在暴露之前或获得所测试的样本之后)鉴别的一个或多个IgH组库进行比较。在一些实施例中,引物组包含针对单一同种型例如IgG的C基因的至少一部分的一个或多个引物。在其它实施例中,引物组包含至少两个引物,每个引物针对两个不同同种型的C基因的至少一部分。在其它实施例中,引物组包含至少一种单独针对IgA、IgD、IgG、IgM和IgE同种型类型的C基因的至少一部分的引物。因此,方法和组合物可以用于监测B细胞组库的变化(包括同种型类别转换)并评估受试者对疫苗暴露的应答。
在某些实施例中,提供了用于在暴露于诱导过敏反应或应答的过敏原或药剂后鉴别和/或表征受试者的IgE组库的方法和组合物,所述方法和组合物包含:使用至少一组引物和一个或多个C基因引物用暴露的受试者的样本执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的IgH组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的大多数不同IgH V基因,所述一个或多个C基因引物针对IgE基因编码序列的至少一部分;对所得IgH扩增子进行测序;鉴别来自样本的表达的IgE免疫组库序列。在一些实施例中,提供了用于在暴露于诱导过敏反应或应答的过敏原或药剂后监测受试者的IgE组库的变化的方法和组合物,所述方法和组合物包含:使用至少一组引物和一个或多个C基因引物用暴露的受试者的样本执行一个或多个多重扩增反应以扩增具有恒定部分和可变部分的IgH组库核酸模板分子,所述至少一组引物针对包含V基因内的FR1、FR2或FR3的至少一部分的大多数不同IgH V基因,所述一个或多个C基因引物针对IgE基因编码序列的至少一部分;对所得IgH扩增子进行测序;鉴别来自样本的表达的IgE免疫组库序列;以及将所鉴别的IgE组库与在不同时间从受试者获得的样本中(例如,在暴露之前或获得所测试的样本之后)鉴别的一个或多个IgE组库进行比较。在一些实施例中,此类方法和组合物的至少一个引物组包含针对如针对IgG、IgM、IgA和/或IgD引物等其它IgH同种型的至少一部分的另外的C基因引物。在其它实施例中,引物组包含至少一种单独针对IgA、IgD、IgG、IgM和IgE同种型类型的C基因的至少一部分的引物。因此,方法和组合物可以用于监测总BCR组库内的IgE组库的变化(包括同种型类别转换)并评估受试者对过敏原暴露的过敏反应或应答。在一些实施例中,此类方法和组合物用于测定和/或监测组库内的IgE表达性B细胞的同种型转换起点。
在一些实施例中,所提供的方法和组合物用于筛选或表征在体外生长和/或活化的用作免疫治疗剂或在基于免疫治疗的方案中使用的淋巴细胞群。在一些实施例中,所提供的方法和组合物用于筛选或表征在体外生长和/或活化的TIL群体或其它采集的B细胞群。在一些实施例中,测定BCR的IgH序列促进对抗原特异性B细胞进行的鉴别和产生。在一些实施例中,所提供的方法和组合物用于筛选或表征在体外生长和/或活化的例如用于免疫治疗或抗体产生的工程化B细胞群。在一些实施例中,所提供的方法和组合物用于例如出于质量控制或监管测试目的在用于制造工程化细胞制备的离体工作流程期间通过监测BCR组库来评估细胞群。
在一些实施例中,如本文所述的所鉴别的新颖或非经典的BCR等位基因的序列可以用于产生重组BCR核酸或分子。在一些实施例中,所提供的方法和组合物用于筛选和/或产生重组抗体文库。所提供的涉及鉴别BCR的组合物可以用于快速评价重组抗体文库大小和组合物以鉴别所关注的抗体。
在一些实施例中,分析如本文提供的免疫受体组库可以与分析免疫应答基因表达组合以提供对肿瘤微环境进行的表征。在一些实施例中,将肿瘤样本的BCR组库谱与靶向免疫应答基因表达谱组合或关联提供对肿瘤微环境的更彻底的分析并且可以建议或提供免疫治疗治疗的指导。
用于分析的合适的细胞包括但不限于各种造血细胞、淋巴细胞和肿瘤细胞,如外周血单核细胞(PBMC)、T细胞、B细胞、循环肿瘤细胞和肿瘤浸润淋巴细胞(TIL)。表达免疫球蛋白的淋巴细胞包括前B细胞、B细胞,例如记忆B细胞和浆细胞。表达T细胞受体的淋巴细胞包括胸腺细胞、NK细胞、前T细胞和T细胞,其中T细胞的许多亚群是本领域已知的,例如Th1、Th2、Th17、CTL、T reg等。例如,在一些实施例中,包含PBMC的样本可以用作抗体免疫组库分析的来源。样本可以含有例如淋巴细胞、单核细胞和巨噬细胞以及抗体和其它生物成分。
对BCR组库的分析对于涉及细胞增殖和抗原暴露的病状是有意义的,所述病状包括但不限于癌症的存在、暴露于癌抗原、暴露于来自感染剂的抗原、暴露于疫苗、暴露于过敏原、暴露于食物、移植物或植入物的存在以及自身免疫性活动或疾病的存在。与免疫缺陷相关的病状还对分析具有意义,所述病状包括先天性和后天性免疫缺陷综合征。
所关注的B细胞谱系恶性肿瘤包括但不限于多发性骨髓瘤;急性淋巴细胞白血病(ALL);复发/难治性B细胞ALL、慢性淋巴细胞白血病(CLL);弥漫性大B细胞淋巴瘤;粘膜相关淋巴组织淋巴瘤(MALT);小细胞淋巴细胞淋巴瘤;套细胞淋巴瘤(MCL);伯基特(Burkitt)淋巴瘤;纵隔大B细胞淋巴瘤;瓦尔登斯特伦巨球蛋白血症(macroglobulinemia);淋巴结边缘区B细胞淋巴瘤(NMZL);脾边缘区淋巴瘤(SMZL);血管内大B细胞淋巴瘤;原发性渗出性淋巴瘤;淋巴瘤样肉芽肿病等。非恶性B细胞过度增殖性病状包括单克隆B细胞淋巴细胞增多症(MBL)。
所关注的T细胞谱系恶性肿瘤包括但不限于前体T细胞淋巴母细胞淋巴瘤;T细胞幼淋巴细胞白血病;T细胞颗粒淋巴细胞白血病;侵袭性NK细胞白血病;成人T细胞淋巴瘤/白血病(HTLV 1-阳性);结外NK/T细胞淋巴瘤;肠病型T细胞淋巴瘤;肝脾型γδT细胞淋巴瘤;皮下脂膜炎样T细胞淋巴瘤;蕈样肉芽肿/Sezary综合征;间变性大细胞淋巴瘤、T/裸细胞;外周T细胞淋巴瘤;血管免疫母细胞性T细胞淋巴瘤;慢性淋巴细胞白血病(CLL);急性淋巴细胞白血病(ALL);幼淋巴细胞白血病;和毛细胞白血病。
所关注的其它恶性肿瘤包括但不限于急性髓性白血病、头颈癌、脑癌、乳腺癌、卵巢癌、宫颈癌、结肠直肠癌、子宫内膜癌、胆囊癌、胃癌、膀胱癌、前列腺癌、睾丸癌、肝癌、肺癌、肾(肾细胞)癌、食管癌、胰腺癌、甲状腺癌、胆管癌、垂体肿瘤、威耳姆氏瘤(wilmstumor)、卡波西肉瘤(kaposi sarcoma)、骨肉瘤、胸腺癌、皮肤癌、心脏癌、口腔和咽喉癌症、神经母细胞瘤和非霍奇金淋巴瘤(non-hodgkin lymphoma)。
神经炎性病症为目标,例如阿尔茨海默氏病、帕金森氏病、Lou Gehrig病等,以及脱髓鞘疾病,如多发性硬化、慢性炎性脱髓鞘性多发性神经病等,以及炎性病症如类风湿性关节炎。系统性红斑狼疮(SLE)为自身免疫疾病,其特征在于多克隆B细胞活化,其产生多种抗蛋白和非蛋白自身抗体(参见Kotzin等人(1996)《细胞(Cell)》85:303-306)。这些自身抗体形成免疫复合体,其沉积在多个器官系统中,导致组织损伤。自身免疫组分可归因于动脉粥样硬化,其中候选自身抗原包括Hsp60、氧化的LDL和2-糖蛋白I(2GPI)。
用于本文所述方法的样本可为从患有恶性肿瘤或过度增殖性病状的受试者收集的样本,包括淋巴瘤、白血病和浆细胞瘤。淋巴瘤为淋巴细胞来源的固体肿瘤,并且最常见于淋巴组织中。因此,例如,来自含有此类淋巴瘤的淋巴结(例如扁桃体)的活组织检查将构成合适的活组织检查。可以在疾病进展和/或疾病治疗的一个或多个时间点从受试者或患者获得样本。
在一些实施例中,本公开提供了使用具有可切割基团的引物对具有多个表达的免疫受体靶序列的cDNA样本进行靶特异性多重PCR的方法。
在某些实施例中,待测序的文库和/或模板制剂使用自动化系统,例如Ion ChefTM系统,使用本文提供的组合物从核酸样本群自动制备。
如本文所用,术语“受试者”包括人、患者、个体、被评定的人等。
如本文所用,术语“包含(comprises/comprising)”、“包括(includes/including)”、“具有(has/having)”或其任何其它变化形式打算涵盖非排它性的包括。例如,包含一系列特征的过程、方法、物品或设备并不一定仅限于那些特征,而是可以包括未明确列出的或为此类过程、方法、物品或设备所固有的其它特征。进一步地,除非明确相反地陈述,否则“或”是指包含性的或而不是排它性的或。
如本文所用,“抗原”是指当被引入例如受试者体内时可刺激免疫应答的任何物质,如产生鉴别抗原的抗体或T细胞受体。抗原包括分子,如核酸、脂质、核糖核蛋白复合体、蛋白质复合体、蛋白质、多肽、肽和此类分子的天然存在的或合成的修饰,对所述分子可产生涉及T和/或B淋巴细胞的免疫应答。关于自身免疫疾病,本文的抗原通常称为自身抗原。关于过敏性疾病,本文的抗原通常称为过敏原。自身抗为是由可为免疫应答的靶的生物体产生的任何分子,包括在生物体基因组内编码的肽、多肽和蛋白质以及这些肽、多肽和蛋白质的翻译后产生的修饰。此类分子还包括碳水化合物、脂质和由生物体产生的其它分子。抗原还包括疫苗抗原,其包括但不限于病原体抗原、癌症相关抗原、过敏原等。
如本文所用,“扩增(amplify/amplifying)”或“扩增反应”和其衍生词是指复制或拷贝至少一部分核酸分子(称为模板核酸分子)到至少一种另外的核酸分子中的任何作用或过程。另外的核酸分子任选地包括与模板核酸分子的至少一些部分基本上相同或基本上互补的序列。模板核酸分子可为单链或双链并且另一个核酸分子可独立地为单链或双链。在一些实施例中,扩增包括模板依赖性体外酶催化反应,其用于制备核酸分子的至少某一部分的至少一个拷贝或制备与核酸分子的至少某一部分互补的核酸序列的至少一个拷贝。扩增任选地包括核酸分子的线性或指数复制。在一些实施例中,使用等温条件进行此类扩增;在其它实施例中,此类扩增可以包括热循环。在一些实施例中,扩增为多重扩增,其包括在单个扩增反应中同时扩增多个靶序列。至少一些靶序列可以位于单个扩增反应中所包括的相同核酸分子或不同靶核酸分子上。在一些实施例中,“扩增”包括单独或呈组合形式的基于DNA和RNA的核酸的至少某一部分的扩增。扩增反应可以包括单链或双链核酸底物并且可以还包括本领域的普通技术人员已知的扩增方法中的任何扩增方法。在一些实施例中,扩增反应包括PCR。
本文所用的“扩增条件”及其衍生词是指适于扩增一个或多个核酸序列的条件。此类扩增可为线性或指数的。在一些实施例中,扩增条件可以包括等温条件或可替代地可以包括热循环条件或等温和热循环条件的组合。在一些实施例中,适于扩增一个或多个核酸序列的条件包括PCR条件。通常,扩增条件是指足以扩增如一个或多个靶序列的核酸或扩增连接到一个或多个衔接子的扩增的靶序列(例如,衔接子连接的扩增的靶序列)的反应混合物。扩增条件包括用于扩增或用于核酸合成的催化剂,例如聚合酶;与待扩增的核酸具有一定程度的互补的引物;以及核苷酸,如脱氧核糖核苷酸三磷酸酯(dNTP),以促进与核酸杂交之后引物的延伸。扩增条件需要引物与核酸的杂交或粘接,引物的延伸和变性步骤,其中延伸的引物与经历扩增的核酸序列分离。通常但未必,扩增条件可以包括热循环,在一些实施例中,扩增条件包括多个循环,其中重复粘接、延伸和分离步骤。通常,扩增条件包括阳离子,如Mg2+或Mn2+(例如MgCl2等),并且还可以包括多种离子强度调节剂。
如本文中所使用,“靶序列”或“目标靶序列”和其派生词指可根据本公开扩增或合成的任何单链或双链核酸序列,包括怀疑或预期样本中存在的任何核酸序列。在一些实施例中,在添加靶特异性引物或附接衔接子之前,靶序列以双链形式存在并且包括待扩增或合成的特定核苷酸序列的至少一部分或其补体。靶序列可以包括可与适用于扩增或合成反应的引物在聚合酶延伸之前杂交的核酸。在一些实施例中,所述术语指核酸序列,其序列一致性、核苷酸的次序或位置由本公开的方法中的一种或多种确定。
如本文中所定义,“样本”和其衍生词以其最广泛含义使用并且包括任何怀疑包括靶的标本、培养物等。在一些实施例中,样本包含cDNA、RNA、PNA、LNA、嵌合、杂交或多重形式的核酸。样本可以包括任何含有一个或多个核酸的基于生物、临床、手术、农业、大气压或水生的标本。所述术语还包括任何经分离的核酸样本,例如表达RNA、新鲜冷冻或福尔马林(formalin)固定石蜡包埋的核酸标本。
如本文中所使用,当关于两种或更多种组分使用时,“接触”和其派生词是指用于促进或实现参考组分的接近、靠近、混合物或共混而未必需要此类组分的物理接触的任何过程,并且包括含有所述参考组分中的任一种或多种的溶液的彼此混合。所提及的组分可以任何特定顺序或组合接触并且组分引述的特定顺序不具限制性。例如,“使A与B和C接触”涵盖其中A首先与B接触,然后与C接触的实施例,以及其中C与A接触,然后与B接触的实施例,以及其中A和C的混合物与B接触的实施例等。此外,此类接触不一定要求接触过程的最终结果是包括所有提及组分的混合物,只要在接触过程中的某些时间点,所有提及组分同时存在或同时包括在同一混合物或溶液中。当待接触的一个或多个提及组分包括多个(例如,“使靶序列与多个靶特异性引物和聚合酶接触”)时,所述多个中的每个成员可以被视为接触过程的单个组分,使得接触可以包括多个中的任何一个或多个成员与多个中的任何其它成员和/或与任何其它提及组分以任何顺序或组合接触(例如,多个靶特异性引物中的一些但不是全部可以接触靶序列,然后是聚合酶,然后与多个靶特异性引物的其它成员接触)。
如本文中所使用,术语“引物”和其派生物指可与相关靶序列杂交的任何多核苷酸。在一些实施例中,引物也可用于引发核酸合成。通常,引物充当底物,其上可由聚合酶聚合核苷酸;然而,在一些实施例中,引物可变得并入合成的核酸链中并且提供另一引物可杂交的位点以引发与所合成的核酸分子互补的新链的合成。引物可以包含核苷酸或其类似物的任何组合,其可任选地连接以形成任何适合长度的线性聚合物。在一些实施例中,引物为单链寡核苷酸或多核苷酸。(在本公开中,术语“多核苷酸”和“寡核苷酸”在本文中可互换地使用并且未必指示两个核苷酸之间长度的任何差异)。在一些实施例中,引物为单链,但其也可为双链。引物任选地天然产生,如在纯化的限制消化中,或可以合成方式产生。在一些实施例中,当暴露于扩增或合成条件时,引物充当用于扩增或合成的起始点;此类扩增或合成可以模板依赖性方式进行并且任选地形成与至少一部分靶序列互补的引物延伸产物。示例性扩增或合成条件可以包括使引物与多核苷酸模板(例如包括靶序列的模板)、核苷酸和诱导剂(如聚合酶)在适合的温度和pH值下接触,以诱导靶特异性引物的末端上核苷酸的聚合。如果为双链,那么在用于制备引物延伸产物之前,可任选地处理引物以分离其链。在一些实施例中,引物为寡脱氧核苷酸或寡核糖核苷酸。在一些实施例中,引物可以包括一个或多个核苷酸类似物。靶特异性引物的确切长度和/或组成(包括序列)可影响许多特性,包括熔融温度(Tm)、GC含量、次要结构的形成、重复核苷酸主结构、所预测的引物延伸产物的长度、跨越相关核酸分子的覆盖度的程度、单次扩增或合成反应中的引物数目、引物内是否存在核苷酸类似物或经修饰的核苷酸等。在一些实施例中,引物可在扩增或合成反应内与相容的引物配对以形成由正向引物和反向引物组成的引物对。在一些实施例中,引物对的正向引物包括基本上与核酸分子的一个链的至少一部分互补的序列,并且引物对引物的反向引物包括基本上与所述链的至少一部分一致的序列。在一些实施例中,正向引物和反向引物能够与核酸双螺旋的相对链杂交。任选地,正向引物引发第一核酸链的合成,并且反向引物引发第二核酸链的合成,其中第一和第二链基本上彼此互补,或可杂交以形成双链核酸分子。在一些实施例中,扩增或合成产物的一端由正向引物定义并且扩增或合成产物的另一端由反向引物定义。在一些实施例中,当需要扩增或合成冗长引物延伸产物(如扩增外显子、编码区或基因)时,可产生若干引物对而非跨越所需长度以实现所述区的足够扩增。在一些实施例中,引物可以包括一个或多个可切割基团。在一些实施例中,引物长度在约10到约60个核苷酸、约12到约50个核苷酸和约15到约40个核苷酸长度范围内。通常,当在存在dNTP和聚合酶的情况下暴露于扩增条件时,引物能够与对应的靶序列杂交并且进行引物延伸。在一些实施例中,引物在引物内的一个或多个位置包括一个或多个可切割基团。
如本文所用,“靶特异性引物”和其衍生词指单链或双链多核苷酸,通常为寡核苷酸,其包括至少一个与包括靶序列的核酸分子的至少一部分至少50%互补,通常至少75%互补或至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%或至少99%互补或一致的序列。在此类情况下,靶标特异性引物和靶序列描述成彼此“对应”。在一些实施例中,靶标特异性引物能够与其对应靶序列的至少一部分(或靶序列的补体)杂交;此类杂交可任选地在标准杂交条件下或在严格杂交条件下进行。在一些实施例中,靶特异性引物不能与靶序列或其补体杂交,但能够与包括靶序列的核酸链的一部分或其补体杂交。在一些实施例中,靶特异性引物包括至少一个与靶序列本身的至少一部分至少75%互补,通常至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%互补或更通常至少99%互补的序列;在其它实施例中,靶特异性引物包括至少一个与除靶序列以外的核酸分子的至少一部分至少75%互补,通常至少85%互补,更通常至少90%互补,更通常至少95%互补,更通常至少98%互补或更通常至少99%互补的序列。在一些实施例中,靶特异性引物基本上不与存在于样本中的其它靶序列互补;任选地,靶特异性引物基本上不与存在于样本中的其它核酸分子互补。在一些实施例中,存在于样本中的不包括或对应于靶序列(或靶序列的补体)的核酸分子称为“非特异性”序列或“非特异性核酸”。在一些实施例中,靶特异性引物被设计成包括基本上与其对应靶序列的至少一部分互补的核苷酸序列。在一些实施例中,靶特异性引物与包括其对应靶序列的核酸分子的至少一部分至少95%互补或至少99%互补或一致(跨越其全部长度)。在一些实施例中,靶特异性引物与其对应靶序列的至少一部分至少90%、至少95%互补、至少98%互补或至少99%互补或一致(跨越其全部长度)。在一些实施例中,正向靶特异性引物和反向靶特异性引物定义靶特异性引物对,其用于经由模板依赖性引物延伸来扩增靶序列。通常,靶特异性引物对的每个引物包括至少一个与包括对应靶序列的核酸分子的至少一部分基本上互补,但与在样本中的至少一个其它靶序列小于50%互补的序列。在一些实施例中,扩增在单次扩增反应中使用多个靶特异性引物对进行,其中每个引物对包括正向靶特异性引物和反向靶特异性引物,各自包括至少一个与在样本中的对应靶序列基本上互补或基本上相同的序列,并且每个引物对具有不同的对应靶序列。在一些实施例中,靶特异性引物在其3′端或其5′端与扩增反应中的任何其它靶特异性引物为基本上不互补的。在一些实施例中,靶特异性引物可以包括扩增反应中与其它靶特异性引物的最小交叉杂交。在一些实施例中,靶特异性引物包括在扩增反应混合物中与非特异性序列的最小交叉杂交。在一些实施例中,靶特异性引物包括最小自身互补。在一些实施例中,靶特异性引物可以包括位于3′端的一个或多个可切割基团。在一些实施例中,靶特异性引物可以包括位于靶特异性引物的中心核苷酸附近或周围的一个或多个可切割基团。在一些实施例中,更多个靶特异性引物之一仅包括在靶特异性引物的5′端处的不可裂解核苷酸。在一些实施例中,任选地在相同扩增反应中,与一个或多个不同靶特异性引物相比,靶特异性引物包括引物的3′端或5′端处的最小核苷酸序列重叠。在一些实施例中,在单一反应混合物中的1、2、3、4、5、6、7、8、9、10种或更多种靶特异性引物包括以上实施例中的一个或多个。在一些实施例中,在单一反应混合物中基本上所有的多种靶特异性引物包括以上实施例中的一个或多个。
如本文所用,“聚合酶”和其衍生词指可催化核苷酸(包括其类似物)聚合成核酸链的任何酶。通常但未必,此类核苷酸聚合可以模板依赖性方式进行。此类聚合酶可以包括但不限于天然存在的聚合酶和其任何子单元和截断、突变聚合酶、变异聚合酶、重组、融合或以其它方式工程化的聚合酶、化学修饰的聚合酶、合成分子或组件以及保留催化此类聚合的能力的任何类似物、衍生物或其片段。任选地,聚合酶为包含一个或多个突变的突变型聚合酶,所述突变涉及用其它氨基酸替换一个或多个氨基酸,来自聚合酶的一个或多个氨基酸的插入或缺失或两个或更多个聚合酶的部分的连接。通常,聚合酶包含可进行核苷酸结合和/或核苷酸聚合催化的一个或多个活性位点。一些示例性聚合酶包括但不限于DNA聚合酶和RNA聚合酶。如本文所使用的,术语“聚合酶”和其变化形式还指包含至少两个彼此连接的部分的融合蛋白质,其中第一部分包含可催化核苷酸聚合成核酸链的肽并且所述第一部分连接到包含第二多肽的第二部分。在一些实施例中,第二多肽可以包括报告基因酶或增强持续合成能力的结构域。任选地,聚合酶可具有5′外切核酸酶活性或末端转移酶活性。在一些实施例中,聚合酶任选地再活化,例如通过使用热、化学物质或将新的量的聚合酶再添加到反应混合物中。在一些实施例中,聚合酶可以包括任选地再活化的热起始聚合酶或基于适体的聚合酶。
如本文所用,术语“核苷酸”和其衍生词包含任何可选择性结合于聚合酶或通过聚合酶聚合的化合物,包括但不限于任何天然存在的核苷酸或其类似物。通常但未必,核苷酸与聚合酶的选择性结合后面是核苷酸通过聚合酶聚合成核酸链;然而偶尔,核苷酸可从聚合酶解离而不变得并入到核酸链中。此类核苷酸不仅包括天然存在的核苷酸,而且包括可与聚合酶选择性结合或可通过聚合酶聚合的任何类似物(与其结构无关)。虽然天然存在的核苷酸通常包含碱基、糖和磷酸酯部分,但本公开的核苷酸可以包括不具有此类部分中的任一个、一些或全部的化合物。在一些实施例中,核苷酸可任选地包括包含三个、四个、五个、六个、七个、八个、九个、十个或更多个磷原子的磷原子链。在一些实施例中,磷链连接到糖环的任何碳,如5′碳。可以用中间的O或S将磷链与糖连接。在一个实施例中,链中的一个或多个磷原子可以是具有P和O的磷酸基的一部分。在另一个实施例中,链中的磷原子用中间的O、NH、S、亚甲基、经取代亚甲基、亚乙基、经取代亚乙基、CNH2、C(O)、C(CH2)、CH2CH2、或C(OH)CH2R(其中R可以为4-吡啶或1-咪唑)连接在一起。在一个实施例中,链中的磷原子具有含O、BH3或S的侧基。在磷链中,具有除O之外的侧基的磷原子可以是经取代的磷酸基。在磷链中,具有除O之外的中间原子的磷原子可以是经取代的磷酸基。核苷酸类似物的一些实例描述于美国专利第7,405,281号中。在一些实施例中,核苷酸包含标记并且在本文中被称为“标记的核苷酸”;标记的核苷酸的标记在本文中被称为“核苷酸标记”。在一些实施例中,标记呈连接到末端磷酸基团,即距离糖最远的磷酸基团的荧光染料的形式。可以用于所公开的方法和组合物中的核苷酸的一些实例包括但不限于核糖核苷酸、脱氧核糖核苷酸、经修饰的核糖核苷酸、经修饰的脱氧核糖核苷酸、核糖核苷酸聚磷酸、脱氧核糖核苷酸聚磷酸、经修饰的核糖核苷酸聚磷酸、经修饰的脱氧核糖核苷酸聚磷酸、肽核苷酸、经修饰的肽核苷酸、金属核苷酸、膦酸核苷酸和经修饰的磷酸-糖主链核苷酸,前述化合物的类似物、衍生物或变体等。在一些实施例中,核苷酸可以包含非氧部分(如硫基或硼烷部分)代替氧部分,所述氧部分桥连核苷酸的α磷酸酯与糖,或核苷酸的α与β磷酸酯,或核苷酸的β与γ磷酸酯,或在核苷酸的任何其它两种磷酸酯之间,或其任何组合。“核苷酸5′-三磷酸”是指在5′位置具有三磷酸酯基并且有时表示为“NTP”或“dNTP”和“ddNTP”以特别指出核糖的结构特征的核苷酸。三磷酸酯基可以包括硫取代各种氧,例如α-硫基-核苷酸5′-三磷酸。关于核酸化学的综述,参见:Shabarova,Z.和Bogdanov,A.,《核酸的高级有机化学(Advanced OrganicChemistry of Nucleic Acids)》,德国化学学会出版社(VCH),纽约(New York),1994。
如本文所用,当关于既定引物使用时,术语“延伸”和其衍生词包含涉及一个或多个核苷酸在现有核酸分子的端上的聚合的既定聚合酶的任何体内或体外酶促活性特征。通常但未必,此类引物延伸以模板依赖性方式进行;在模板依赖性延伸期间,通过既定碱基配对规则进行碱基的排序和选择,所述规则可以包括沃森-克里克型碱基配对规则,或替代地(并且尤其在涉及核苷酸类似物的延伸反应的情况下)通过一些其它类型的碱基配对范例进行。在一个非限制性实例中,延伸通过聚合酶经由核酸分子的3′OH端上核苷酸的聚合进行。
如本文所用,术语“部分”和其衍生词,当用于提及给定的核酸分子例如引物或模板核酸分子时,在核酸分子的长度(包括核酸分子的部分或全部长度)内包含任何数目的连续核苷酸。
如本文所用,术语“同一性”和“相同的”和其衍生词,当用于提及两个或更多个核酸序列时,是指两个或更多个序列(例如,核苷酸或多肽序列)的序列类似性。在两种或更多种同源序列的情况下,序列或其子序列的一致性或同源性百分比指示相同(即,约70%一致性,优选地75%、80%、85%、90%、95%、98%或99%一致性)的全部单体单元(例如,核苷酸或氨基酸)的百分比。一致性百分比可在规定区内,当出于比较窗内的最大对应而比较和比对时,或在指定区内,如使用BLAST或BLAST 2.0序列比较算法用下文所描述的默认参数或通过手动比对和目视检查所测量。当氨基酸水平或核苷酸水平存在至少85%同一性时,序列被称为“基本上相同”。优选地,同一性存在于至少约25、50或100个残基长的区内或至少一个所比较的序列的整个长度上。用于确定序列同一性百分比和序列类似性的典型算法为BLAST和BLAST 2.0算法,其描述于Altschul等人,《核算研究(Nuc.Acids Res.)》25:3389-3402(1977)中。其它方法包括Smith和Waterman,《应用数学进展(Adv.Appl.Math.)》2:482(1981),以及Needleman和Wunsch《分子生物学期刊》48:443(1970)的算法等。两个核酸序列基本上相同的另一个指示是所述两个分子或其补体在严格杂交的条件下彼此杂交。
本文所用的术语“互补”和“补体”及其变体是指可以在反平行朝向中(如在杂交双链体中)的两个或更多个独立对应位置处进行累积碱基配对的任何两个或更多个核酸序列(例如,模板核酸分子、靶序列和/或引物的部分或整体)。此类碱基配对可根据任何现有规则集合进行,例如根据沃森-克里克碱基配对规则或根据一些其它碱基配对范例。任选地,在第一与第二核酸序列之间可存在“完全”或“总体”互补,其中在第一核酸序列中的每个核苷酸可进行与第二核酸序列上的对应的反平行位置中的核苷酸的稳定化碱基配对相互作用。“部分”互补描述一个核酸序列的至少20%但少于100%的残基与在另一个核酸序列中的残基互补的核酸序列。在一些实施例中,一个核酸序列的至少50%但少于100%的残基与在另一个核酸序列中的残基互补。在一些实施例中,一个核酸序列的至少70%、80%、90%、95%或98%但少于100%的残基与在另一个核酸序列中的残基互补。当一个核酸序列中的至少85%的残基与另一个核酸序列中的残基互补时,序列被称为“基本上互补”。在一些实施例中,两个互补或基本上互补序列能够在标准或严格杂交条件下彼此杂交。“不互补”描述其中一个核酸序列的少于20%的残基与在另一个核酸序列中的残基互补的核酸序列。当一个核酸序列中的少于15%的残基与在另一个核酸序列中的残基互补时,序列被称为“基本上不互补”。在一些实施例中,两个不互补或基本上不互补序列不能在标准或严格杂交条件下彼此杂交。“错配”存在于不互补的两个相对核苷酸中的序列中的任何位置。互补核苷酸包括在生理条件下在DNA复制期间通过与彼此相对的DNA聚合酶有效并入的核苷酸。在典型的实施例中,在彼此位于反平行位置的核苷酸和/或多核苷酸的核碱基之间,互补核苷酸可彼此形成碱基对,如通过特异性沃森-克里克型氢键形成的A-T/U和G-C碱基对,或通过某种其它类型的碱基配对范例形成的碱基对。其它人工碱基对的互补可为基于其它类型的氢键和/或碱基的疏水性和/或在碱基之间的形状互补。
如本文所用,“扩增的靶序列”和其衍生词是指通过使用靶特异性引物和本文提供的方法扩增/扩增靶序列而产生的核酸序列。扩增的目标序列相对于目标序列可为同义(第二轮和后续偶数轮扩增中产生的正链)或反义(即,在第一轮和后续奇数轮扩增期间产生的负链)中的任一种。在一些实施例中,扩增的靶序列与在反应中另一个扩增的靶序列的任何部分互补小于50%。在其它实施例中,扩增的靶序列与在反应中另一个扩增的靶序列的任何部分互补大于50%、大于60%、大于70%、大于80%或大于90%。
如本文所用,术语“连接(ligating/ligation)”和其衍生词指用于将两个或更多个分子共价连接在一起(例如使两个或更多个核酸分子彼此共价连接)的动作或方法。在一些实施例中,连接包括在核酸的相邻核苷酸之间的连接切口。在一些实施例中,连接包括形成在第一核酸分子的端与第二核酸分子的端之间的共价键。在一些实施例中,例如其中待连接的核酸分子包括常规核苷酸残基的实施例,连接可以包括形成在一个核酸的5′磷酸基和第二核酸的3′羟基之间的共价键,从而形成连接的核酸分子。在一些实施例中,可采用任何用于在相邻核苷酸之间使5′磷酸与3′羟基连接切口或结合的方法。在示例性实施例中,使用酶,如连接酶。出于本公开的目的,扩增的靶序列可以连接到衔接子以产生衔接子连接的扩增的靶序列。
如本文所使用的,“连接酶”及其派生词是指任何能够催化两个底物分子的连接的试剂。在一些实施例中,连接酶包括能够催化在核酸的相邻核苷酸之间的切口的连接的酶。在一些实施例中,连接酶包括能够催化在一个核酸分子的5′磷酸与另一个核酸分子的3′羟基之间形成共价键,从而形成连接的核酸分子的酶。在一些实施例中,连接酶为等温连接酶。在一些实施例中,连接酶为热稳定连接酶。适合的连接酶可以包括但不限于T4 DNA连接酶、T4 RNA连接酶和大肠杆菌(E.coli)DNA连接酶。
如本文所用,“连接条件”和其衍生词是指适合于将两个分子彼此连接的条件。在一些实施例中,连接条件适合于密封核酸之间的切口或间隙。如本文所定义,“切口”或“间隙”是指在核酸序列的内部核苷酸内缺少单核苷酸戊糖环的5′磷酸直接与相邻单核苷酸戊糖环的3′羟基结合的核酸分子。如本文所用,术语切口或间隙与所属领域术语的使用一致。通常,切口或间隙在适当的温度和pH下在酶例如连接酶的存在下连接。在一些实施例中,T4DNA连接酶可在约70℃-72℃的温度下在核酸之间连接切口。
如本文所用,“平末端连接”和其衍生词指两个平末端双链核酸分子彼此连接。“平末端”指其中核酸分子的一个链端中的基本上所有核苷酸与同一个核酸分子的另一个链中的相对核苷酸碱基配对的双链核酸分子的端。如果核酸分子具有包括长度大于两个核苷酸的单链部分的端(本文中称为“突出”),那么其不是平末端的。在一些实施例中,核酸分子的端不包括任何单链部分,使得端的一个链中的每个核苷酸与同一个核酸分子的另一个链中的相对核苷酸碱基配对。在一些实施例中,变成彼此连接的两个平末端核酸分子的端不包括任何重叠、共有或互补序列。通常,平末端连接不包含使用其它寡核苷酸衔接子帮助双链扩增的靶序列与双链衔接子的连接,如美国专利公开第2010/0129874号中所描述的补丁寡核苷酸。在一些实施例中,平末端连接包括接口平移反应以密封在连接过程期间产生的接口。
如本文中所使用,术语“衔接子”或“衔接子和其补体”以及其派生词指任何连接到本公开的核酸分子的线形寡核苷酸。任选地,衔接子包括基本上不与样本内至少一个靶序列的3′端或5′端互补的核酸序列。在一些实施例中,衔接子与样本中任何靶序列的3′端或5′端基本上不互补。在一些实施例中,衔接子包括与经扩增的靶序列基本上不互补的任何单链或双链线性寡核苷酸。在一些实施例中,衔接子与样本的至少一个、一些或全部核酸分子基本上不互补。在一些实施例中,合适的衔接子长度在长度为约10-100个核苷酸、约12-60个核苷酸和约15-50个核苷酸的范围内。衔接子可以包括核苷酸和/或核酸的任何组合。在一些实施例中,衔接子可以在一个或多个位置处包括一个或多个可切割基团。在另一个实施例中,衔接子可以包括与引物(例如通用引物)的至少一部分基本上相同或基本上互补的序列。通用扩增引物的结构和性质是本领域的技术人员公知的并且可以被实施为结合所提供的方法和组合物利用以适应具体分析平台(例如,如本文所述的通用P1引物和A引物已经在本领域中描述并用于在离子激流测序平台上进行测序)。类似地,描述和所属领域已知的另外和其它通用衔接子/引物序列(例如,Illumina通用衔接子/引物序列、PacBio通用衔接子/引物序列等)可与本文提供的方法和组合物一起使用。在一些实施例中,衔接子可包括条形码或标签以辅助下游编目、鉴别或测序。在一些实施例中,当与扩增的靶序列连接时,尤其在适合的温度和pH值下在聚合酶和dNTP存在下,单链衔接子可充当用于扩增的底物。
在一些实施例中,通过平末端连接将衔接子连接到多核苷酸。在其它实施例中,经由衔接子和多核苷酸端上的核苷酸突出将衔接子连接到多核苷酸。对于突出连接,如果待连接的衔接子的多核苷酸(例如,扩增子)具有添加到相应链的3′和/或5′端的互补突出,那么衔接子可在相应链的3′和/或5′端添加核苷酸突出。例如,腺嘌呤核苷酸可添加到端拯救的PCR产物的3′端。具有由胸腺嘧啶核苷酸形成的突出的衔接子然后可与扩增子的A-突出对接,并通过DNA连接酶如T4DNA连接酶连接到扩增子上。
如本文所用,“再扩增(reamplifying或reamplification)”和其衍生词是指经由任何适合的扩增过程进一步扩增至少一部分扩增的核酸分子的任何过程(在一些实施例中称为“二级”扩增或“再扩增”),从而产生再扩增的核酸分子。二级扩增不需要与产生扩增的核酸分子的原始扩增过程相同;也不需要再扩增的核酸分子与扩增的核酸分子完全相同或完全互补;所需要的只是再扩增的核酸分子包括至少一部分扩增的核酸分子或其补体。例如,再扩增可涉及使用不同的扩增条件和/或不同的引物,包括与初级扩增不同的靶特异性引物。
如本文中所定义,“可切割基团”指在并入核酸后可在适当条件下裂解的任何部分。例如,可以将可切割基团并入靶特异性引物、经扩增的序列、衔接子或样本的核酸分子中。在示例性实施例中,靶特异性引物可以包括可切割基团,其变成并入扩增的产物中并且随后在扩增之后切割,从而从经扩增的产物中移除一部分或所有靶特异性引物。可切割基团可切割或以其它方式通过任何可接受的手段从样本的靶特异性引物、经扩增的序列、衔接子或核酸分子中移除。例如,可以通过酶促、热学、光氧化或化学处理从样本的靶特异性引物、扩增序列、衔接子或核酸分子中去除可切割基团。在一个实施例中,可切割基团可以包括非天然存在的核碱基。例如,寡核糖核苷酸可以包括一个或多个RNA核碱基,如可以通过尿嘧啶糖基化酶去除的尿嘧啶。在一些实施例中,可切割基团可以包括一个或多个经修饰的核碱基(如7-甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶或5-甲基胞嘧啶)或一个或多个修饰的核苷(即,7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷或5-甲基胞啶)。可通过酶促、化学或热学手段从核酸中移除经修饰的核碱基或核苷酸。在一个实施例中,可切割基团可以包括在暴露于紫外光(即,溴脱氧尿苷)时,可在扩增(或合成)之后从引物中移除的部分。在另一个实施例中,可切割基团可以包括甲基化胞嘧啶。通常,甲基化胞嘧啶可由引物切割,例如在诱导扩增(或合成)之后、在亚硫酸氢钠处理时。在一些实施例中,可切割部分可以包括限制位点。例如,引物或靶序列可以包括对一种或多种限制酶具有特异性的核酸序列,并且在扩增(或合成)之后,引物或靶序列可用一种或多种限制酶处理使得可切割基团被移除。通常,可在一个或多个位置包括一个或多个可切割基团以及样本的靶特异性引物、扩增的序列、衔接子或核酸分子。
如本文所用,“裂解步骤”和其衍生词是指可切割基团从样本的靶特异性引物、扩增的序列、衔接子或核酸分子裂解或以其它方式去除的任何过程。在一些实施例中,裂解步骤可以涉及化学、热学、光氧化或消化过程。
如本文所用,术语“杂交”符合其在所属领域中的用途,并且指用于使两个核酸分子进行碱基配对相互作用的方法。当一个核酸分子的任何部分与另一个核酸分子的任何部分碱基配对时,两个核酸分子分子称为杂交;未必需要两个核酸分子跨越其全部相应长度杂交,并且在一些实施例中,至少一个核酸分子可以包括不与另一个核酸分子杂交的部分。短语“在严格条件下杂交”和其衍生词是指可在存在高杂交温度和低离子强度的条件下进行靶特异性引物与靶序列的杂交的条件。在一个示例性实施例中,严格杂交条件包括在约60℃-68℃下含有约30mM硫酸镁、约300mM Tris-硫酸盐(pH 8.9)和约90mM硫酸铵的水性环境或其等效物。如本文所用,短语“标准杂交条件”和其衍生词是指可在存在低杂交温度和高离子强度的情况下进行引物与寡核苷酸(即,靶序列)的杂交的条件。在一个示例性实施例中,标准杂交条件包括在约50℃-55℃下含有约100mM硫酸镁、约500mM Tris-硫酸盐(pH8.9)和约200mM硫酸铵的水性环境或其等效物。
如本文所用,“GC含量”和其衍生词是指核酸分子的胞嘧啶和鸟嘌呤含量。本公开的靶特异性引物(或衔接子)的GC含量为85%或更低。更通常,本公开的靶特异性引物或衔接子的GC含量为15%-85%。
如本文所用,当关于核酸分子(例如靶序列或扩增的靶序列)使用时,术语“端”和其衍生词可以包括核酸分子的末端30个核苷酸、末端20和甚至更通常末端15个核苷酸。包含一连串相邻核苷酸的线性核酸分子通常包括至少两个端。在一些实施例中,核酸分子的一端可以包括3′羟基或其等效物,并且称为“3′端”和其衍生物。任选地,3′端包括未连接到单核苷酸戊糖环的5′磷酸基的3′羟基。通常,3′端包括定位与包括未连接的3′羟基的核苷酸相邻的一个或多个5′连接的核苷酸,通常定位与3′羟基相邻的30个核苷酸,通常末端20个并且甚至更通常末端15个核苷酸。一个或多个连接的核苷酸可表示成寡核苷酸中存在的核苷酸的百分比,或可与未连接的3′羟基相邻的许多连接的核苷酸形式提供。例如,3′端可以包括寡核苷酸的核苷酸长度的小于50%。在一些实施例中,3′端不包括任何未连接的3′羟基,但可以包括任何能够充当核苷酸经由引物延伸和/或核苷酸聚合进行的连接的位点的部分。在一些实施例中,例如当参考靶特异性引物时,术语“3′端”可以包括在3′端处的末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少个核苷酸。在一些实施例中,当参考靶特异性引物时,术语“3′端”可以包括位于核苷酸位置10的核苷酸或更少的来自3′端的核苷酸。
如本文所用,“5′端”和其衍生词是指核酸分子(例如靶序列或扩增的靶序列)的端,其包括自由5′磷酸基或其等效物。在一些实施例中,5′端包括未连接到相邻单核苷酸戊糖环的3′羟基的5′磷酸基。通常,5′端包括定位与5′磷酸相邻的一个或多个连接的核苷酸,通常经定位与包括5′磷酸基的核苷酸相邻的30个核苷酸,通常末端20个并且甚至更通常末端15个核苷酸。一个或多个连接的核苷酸可表示为在寡核苷酸中存在的核苷酸的百分比,或可与5′磷酸相邻的许多连接的核苷酸形式提供。例如,5′端可小于寡核苷酸的核苷酸长度的50%。在另一个示例性实施例中,5′端可以包括与包括末端5′磷酸的核苷酸相邻的约15个核苷酸。在一些实施例中,5′端不包括任何未连接的5′磷酸基,但可以包括任何能够充当与3′羟基或另一个核酸分子的3′端的连接位点的部分。在一些实施例中,例如当参考靶特异性引物时,术语“5′端”可以包括5′端处的末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少个核苷酸。在一些实施例中,当参考靶特异性引物时,术语“5′端”可以包括定位在位置10处的核苷酸或更少的来自5′端的核苷酸。在一些实施例中,靶特异性引物的5′端可仅包括非可裂解核苷酸,例如不含有如本文中所公开的一个或多个可切割基团的核苷酸,或可由所属领域的一般技术人员容易地确定的可裂解核苷酸。
如本文所用,“DNA条形码”和其衍生词是指可充当用于区分或分离样本中多个扩增的靶序列的‘钥匙’的衔接子内的独特短(6-14个核苷酸)核酸序列。出于本公开的目的,DNA条形码可以并入衔接子的核苷酸序列中。
如本文所用,短语“两轮靶特异性杂交”或“两轮靶特异性选择”和其衍生词是指相同靶序列经历两轮连续的基于杂交的靶特异性选择的任何过程,其中靶序列与靶特异性序列杂交。每轮基于杂交的靶特异性选择可以包括针对靶特异性序列的至少一些部分的多个靶特异性杂交。在一个示例性实施例中,一轮靶特异性选择包括涉及靶序列的第一区的第一靶特异性杂交和涉及靶序列的第二区的第二靶特异性杂交。第一和第二区可相同或不同。在一些实施例中,每轮基于杂交的靶特异性选择可以包括使用两种靶特异性寡核苷酸(例如,正向靶特异性引物和反向靶特异性引物),使得每轮选择包括两个靶特异性杂交。
如本文所用,“可比较的最大最小解链温度”及其衍生词是指切割可切割基团后单个衔接子或靶特异性引物的每个核酸片段的解链温度(Tm)。比较由单个衔接子或靶特异性引物产生的每个核酸片段的杂交温度,以确定防止靶特异性引物或衔接子的任何核酸片段与靶序列杂交所需的最大最小温度。一旦知道最大杂交温度,就可操作衔接子或靶特异性引物,例如通过沿着引物的长度移动可切割基团的位置,以获得相对于每个核酸片段的可比较的最大最小解链温度。
如本文所用,“仅添加”和其衍生词是指一系列步骤,其中将试剂和组分添加到第一或单一反应混合物中。通常,以系列步骤不包含将反应混合物从第一容器移到第二容器以完成一系列步骤。仅添加过程不包含在含有反应混合物的容器外操作反应混合物。通常,仅添加过程适合自动化和高吞吐量。
如本文所用,“合成”和其衍生词是指涉及聚合酶的核苷酸聚合的反应,任选地以模板依赖性方式。聚合酶通过将核苷一磷酸从核苷三磷酸(NTP)、脱氧核苷三磷酸(dNTP)或双脱氧核苷三磷酸(ddNTP)转移至延伸的寡核苷酸链的3′羟基来合成寡核苷酸。出于本公开的目的,合成包括经由从脱氧核苷三磷酸转移核苷-磷酸来连续延伸杂交的衔接子或靶特异性引物。
如本文所用,“聚合条件”和其衍生词是指适合于核苷酸聚合的条件。在典型的实施例中,此类核苷酸聚合由聚合酶催化。在一些实施例中,聚合条件包括用于任选地以模板依赖性方式的引物延伸,从而导致产生合成核酸序列。在一些实施例中,聚合条件包括PCR。通常,聚合条件包括使用足以合成核酸并且包括聚合酶和核苷酸的反应混合物。聚合条件可以包括使靶特异性引物与靶序列粘接和在聚合酶存在下以模板依赖性方式延伸引物的条件。在一些实施例中,使用热循环实施聚合条件。另外,聚合条件可以包括多个循环,其中重复退火、延伸和分离两条核酸链的步骤。通常,聚合条件包括阳离子如MgCl2。一个或多个核苷酸的聚合以形成核酸链包括核苷酸通过磷酸二酯键彼此连接,然而,在特定核苷酸类似物的背景下,替代连接可能是可能的。
本文所用的术语“核酸”是指天然核酸、人工核酸、其类似物或其组合,包括多核苷酸和寡核苷酸。本文所用的术语“多核苷酸”和“寡核苷酸”可互换使用并且意指核苷酸的单链和双链聚合物,包括但不限于通过核苷酸间磷酸二酯键接例如3′-5′和2′-5′、反向连接例如3′-3′和5′-5′、支链结构或类似物核酸连接的2′-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA)。多核苷酸具有相关的抗衡离子,例如H+、NH4+、三烷基铵、Mg2+、Na+等。寡核苷酸可完全由脱氧核糖核苷酸、完全由核糖核苷酸或其嵌合混合物组成。寡核苷酸可以包含核碱基和糖类似物。当它们在所属领域中更常被称为寡核苷酸时,多核苷酸的大小通常在几个单体单元的范围内,例如5-40,当它们在所属领域中更常被称为多核苷酸时,到数千个单体核苷酸单元;然而,出于本公开的目的,寡核苷酸和多核苷酸两者都可具有任何合适的长度。除非另外指出,否则每当呈现寡核苷酸序列时,都应了解,核苷酸从左到右是按5′到3′的顺序并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,“T”表示胸苷,并且“U”表示脱氧尿苷。寡核苷酸被称为具有“5′端”和“3′端”,因为单核苷酸通常通过将5′磷酸或一个核苷酸的等同基团连接到(任选地通过磷酸二酯或其它合适的键)其相邻核苷酸的3′羟基或等同基团而反应形成寡核苷酸。
如本文所定义,术语“切口平移”和其衍生词包含核酸链内的一个或多个切口或间隙易位到沿核酸链的新位置。在一些实施例中,当双链衔接子与双链扩增的靶序列连接时,形成切口。在一个实例中,引物可在其5′端包括磷酸基团,其可连接到双链扩增的靶序列,在衔接子和互补链中的扩增的靶序列之间留下切口。在一些实施例中,切口平移导致切口移动到核酸链的3′端。在一些实施例中,移动切口可以包括在衔接子连接的扩增的靶序列上进行切口平移反应。在一些实施例中,切口平移反应是偶联的5′到3′DNA聚合/降解反应,或偶联到5′到3′DNA聚合/链置换反应。在一些实施例中,移动切口可以包括在切口位点处进行DNA链延伸反应。在一些实施例中,移动切口可以包括在切口上进行单链外切核酸酶反应以形成衔接子连接的扩增的靶序列的单链部分,并在衔接子连接的扩增的单链靶序列上进行DNA链延伸反应到新位置。在一些实施例中,在与连接位点相对的核酸链中形成切口。
本文所用的术语“聚合酶链式反应”(“PCR”)是指K.B.Mullis美国专利第4,683,195号和第4,683,202号的方法,在此以引用的方式并入,其描述用于在不进行克隆或纯化的情况下增加基因组RNA或cDNA的混合物中相关多核苷酸的片段的浓度的方法。这种用于扩增目标多核苷酸的过程由以下组成:将大量过量的两种寡核苷酸引物引入含有所需目标多核苷酸的DNA混合物,接着在DNA聚合酶存在下热循环的精确序列。两种引物与目标双链多核苷酸的其相应链互补。为了实现扩增,使混合物变性,并且接着使引物退火到目标多核苷酸分子内的其互补序列。在退火之后,用聚合酶使引物延伸以形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可重复多次(即,变性、退火和延伸构成一个“循环”;可存在许多“循环”)以获得高浓度的所需目标多核苷酸的经扩增的节段。所关注的期望多核苷酸的扩增片段(扩增子)的长度通过引物相对于彼此的相对位置测定,并且因此此长度为可控参数。借助于重复所述过程,所述方法被称为“PCR”。因为所关注的多核苷酸的期望扩增片段变成混合物中的主要核酸序列(在浓度方面),所以所述扩增片段被称为“PCR扩增的”。如本文中所定义,包括多种靶核酸分子的在样本内的靶核酸分子经由PCR扩增。在上文所论述的方法的一个改进中,靶核酸分子使用多种不同引物对、在一些情况下一种或多种引物对/目标标靶核酸分子PCR扩增,由此形成多重PCR反应。在本文提供的一些实施例中,使用多个不同引物对进行多重PCR扩增,在典型情况下,每个靶核酸分子一个引物对。使用多重PCR,有可能同时从样本扩增多种相关核酸分子以形成经扩增的靶序列。还可能通过若干种不同方法(例如,用生物分析仪或qPCR定量,用经标记的探针杂交;并入生物素化的引物,接着进行抗生物素蛋白-酶结合物检测;将经32P标记的脱氧核苷酸三磷酸酯(如dCTP或dATP)并入经扩增的靶序列中)检测经扩增的靶序列。任何寡核苷酸序列可用适当的引物集进行扩增,从而实现靶核酸分子从RNA、cDNA、福尔马林固定石蜡包埋DNA、细针穿刺活检(fine-needle biopsies)和多种其它来源的扩增。具体来说,由如本文中所公开的多重PCR过程产生的扩增的靶序列本身是用于后续PCR扩增或多种下游测定或操作的有效底物。
如本文中所定义,“多重扩增”是指使用至少一种靶特异性引物进行的样本内的两个或更多个靶序列的选择性和非随机扩增。在一些实施例中,进行多重扩增,使得一些或全部靶序列在单个反应容器内扩增。既定多重扩增的“重数(plexy)”或“重(plex)”是指在所述单一多重扩增期间扩增的不同靶特异性序列的数目。在一些实施例中,重数是约12重、24重、48重、74重、96重、120重、144重、168重、192重、216重、240重、264重、288重、312重、336重、360重、384重或398重。在一些实施例中,高度多重扩增反应包括具有大于12重的重的反应。
在一些实施例中,扩增的靶序列通过PCR形成。可用一种或多种DNA聚合酶完成靶特异性引物的延伸。在一个实施例中,聚合酶为任何家族A DNA聚合酶(也称为pol I家族)或任何家族B DNA聚合酶。在一些实施例中,与非重组DNA聚合酶相比,DNA聚合酶为能够以更高的准确度和产率延伸靶特异性引物的重组形式。例如,聚合酶可以包括高保真聚合酶或热稳定聚合酶。在一些实施例中,靶特异性引物延伸的条件可以包括“热启动”条件,例如热启动聚合酶,例如AmplitaqDNA聚合酶(Applied Biosciences)、Taq DNA聚合酶高保真(Invitrogen)或KOD热启动DNA聚合酶(EMD Biosciences)。“热启动”聚合酶包括热稳定聚合酶和一种或多种在环境温度下抑制DNA聚合酶和3′-5′核酸外切酶活性的抗体。在某些情况下,“热启动”条件可以包括适体。
在一些实施例中,聚合酶是一种酶,例如Taq聚合酶(来自水生栖热菌(Thermusaquaticus)),Tfi聚合酶(来自Thermus filiformis),Bst聚合酶(来自嗜热脂肪芽孢杆菌),Pfu聚合酶(来自激烈火球菌(Pyrococcus furiosus)),Tth聚合酶(来自嗜热菌(Thermus thermophilus)),Pow聚合酶(来自Pyrococcus woesei),Tli聚合酶(来自斜纹热球菌(Thermococcus litoralis)),Ultima聚合酶(来自海栖热袍菌(Thermotogamaritima)),KOD聚合酶(来自极端嗜热古生菌(Thermococcus kodakaraensis)),Pol I和II聚合酶(来自Pyrococcus abyssi)和Pab(来自Pyrococcus abyssi)。在一些实施例中,DNA聚合酶可以包括至少一种聚合酶,例如AmplitaqDNA聚合酶(AppliedBiosciences),DNA聚合酶的Stoffel片段(Roche),KOD聚合酶(EMDBiosciences),KOD热启动聚合酶(EMD Biosciences),Deep VentTMDNA聚合酶(New EnglandBiolabs),Phusion聚合酶(New England Biolabs),Klentaq1聚合酶(DNA PolymeraseTechnology,Inc),Klentaq Long Accuracy聚合酶(DNA Polymerase Technology,Inc),Omni KlenTaqTMDNA聚合酶(DNA Polymerase Technology,Inc),Omni KlenTaqTMLA DNA聚合酶(DNA Polymerase Technology,Inc),Taq DNA聚合酶(Invitrogen),HemoKlentaqTM(New England Biolabs),TaqDNAPolymerase High Fidelity(Invitrogen),Pfx(Invitrogen),AccuprimeTM Pfx(Invitrogen),或AccuprimeTMTaqDNAPolymerase High Fidelity(Invitrogen)。
在一些实施例中,DNA聚合酶是热稳定的DNA聚合酶。在一些实施例中,dNTP的混合物以随机或定义的顺序同时或顺序施用。在一些实施例中,多重反应中存在的DNA聚合酶的量显著高于对应的单重PCR反应中使用的DNA聚合酶的量。如本文所定义,术语“显著更高”是指与对应的单重PCR反应相比,多重PCR反应中存在的DNA聚合酶浓度至少高3倍。
在一些实施例中,扩增反应不包括扩增产物的环化,例如通过滚环扩增所公开的。
除非另外指出,否则本主题的实践可采用在所属领域的技能内的有机化学、分子生物学(包括重组技术)、细胞生物学和生物化学的常规技术和描述。此类常规技术包括但不限于合成多核苷酸的制备、聚合技术、聚合物粒子的化学和物理分析、核酸文库的制备、核酸测序和分析等。合适技术的具体说明可参考本文提供的实例使用。也可使用其它等效的常规程序。此类常规技术和描述可以在标准实验室手册中找到,如《基因组分析:实验室手册丛书(Genome Analysis:A Laboratory Manual Series)》(第I-IV卷),《PCR引物:实验室手册(PCR Primer:A Laboratory Manual)》,和《分子克隆:实验指南(MolecularCloning:A Laboratory Manual)》(均来自冷泉港实验室出版社(Cold Spring HarborLaboratory Press)),Hermanson,《生物结合技术(Bioconjugate Techniques)》,第二版(学术出版社(Academic Press),2008);Merkus,《粒度测量(Particle SizeMeasurements)》(Springer,2009);Rubinstein和Colby,《聚合物物理学(PolymerPhysics)》(牛津大学出版社,2003);等。
根据各种示例性实施例,可使用适当配置和/或编程的硬件和/或软件元件来进行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征。确定是否使用硬件和/或软件元件来实施实施例可基于任何数目的因素,例如期望的计算速率、功率水平、耐热性、处理周期预算、输入数据速率、输出数据速率、存储器资源、数据总线速度等,以及其它设计或性能限制。
硬件元件的实例可以包括通过以下以通信方式耦合的处理器、微处理器、一个或多个输入设备和/或一个或多个输出装置(I/O)(或外围设备):本地接口电路、电路元件(例如晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑装置(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体装置、芯片、微芯片、芯片集等。本地接口可以包括例如一个或多个总线或其它有线或无线连接、控制器、缓冲器(缓存器)、驱动器、中继器和接收器等,以允许硬件组件之间的适当通信。处理器为用于执行软件的硬件装置,尤其是储存在存储器中的软件。处理器可为任何定制的或市售的处理器、中央处理单元(CPU)、与计算机相关联的若干处理器中的辅助处理器、基于半导体的微处理器(例如呈微芯片或芯片组的形式)、宏处理器或用于执行软件指令的任何装置。处理器还可以表示分布式处理架构。I/O装置可以包括输入装置,例如键盘、鼠标、扫描仪、麦克风、触摸屏、用于各种医疗装置和/或实验室仪器的接口、条形码读取器、触笔、激光读取器、射频装置读取器等。此外,I/O装置还可以包括输出装置,例如打印机、条形码打印机、显示器等。最后,I/O装置可以还包括作为输入和输出两者进行通信的装置,例如调制器/解调器(调制解调器;用于访问另一个装置、系统或网络)、射频(RF)或其它收发器、电话接口、桥接器、路由器等。
软件的实例可以包括软件组件、程序、应用、计算机程序、应用程序、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、函数、方法、程序、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、字、值、符号或其任何组合。在存储器中的软件可以包括一个或多个独立程序,其可以包括用于执行逻辑功能的可执行指令的有序列表。在存储器中的软件可以包括用于鉴别根据本发明的教示内容的数据流的系统和任何合适的定制或可商购的操作系统(O/S),其可控制例如系统等其它计算机程序的执行,并且提供排程、输入-输出控制、文件和数据管理、存储器管理、通信控制等。
根据各个示例性实施例,可使用可存储指令或指令集的适当地配置和/或编程的非暂时性机器可读介质或物件来执行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征,所述指令或指令集如果由机器执行,那么可使机器执行根据示例性实施例的方法和/或操作。此类机器可以包括例如任何合适的处理平台、计算平台、计算装置、处理装置、计算系统、处理系统、计算机、处理器、科学或实验室仪器等,并且可使用硬件和/或软件的任何合适的组合来实施。机器可读介质或物件可以包括例如任何合适类型的存储器单元、存储器装置、存储器物件、存储器介质、存储装置、存储物件、存储介质和/或存储单元,例如存储器、可移动介质或不可移动介质、可擦除介质或不可擦除介质、可写或可重写介质、数字或模拟介质、硬盘、软盘、只读存储器光盘(CD-ROM)、可刻录光盘(CD-R)、可重写光盘(CD-RW)、光盘、磁性介质、磁光介质、可移动存储卡或盘、各种类型的数字多功能光盘(DVD)、磁带、磁带盒等,包括适用于计算机的任何介质。存储器可以包括易失性存储器元件(例如随机存取存储器(RAM,如DRAM、SRAM、SDRAM等))和非易失性存储器元件(例如ROM、EPROM、EEROM、闪存存储器、硬盘驱动器、磁带、CDROM等)中的任一个或组合。此外,存储器可并入电子、磁性、光学和/或其它类型的存储介质。存储器可以具有分布式结构,其中各种组件彼此远离地定位,但仍通过处理器接入。指令可以包括使用任何合适的高阶、低阶、面向对象、视觉、经编译和/或经解译的编程语言实施的任何合适类型的代码,例如源代码、经编译的代码、解译的代码、可执行码、静态代码、动态代码、加密的代码等。
根据各个示例性实施例,可至少部分地使用分布式、丛集、远程或云计算资源来执行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征。
根据各个示例性实施例,上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征可使用源程序、可执行程序(靶代码)、脚本或任何其它包含待执行的指令集的实体来执行或实施。当源程序时,所述程序可通过可以包括或不包括在存储器中的编译器、汇编器、解释器等翻译以便与O/S一起正确地操作。指令可使用以下书写:(a)具有数据类和方法类的面向对象的编程语言;或(b)具有例程、子例程和/或函数的过程编程语言,可以包括例如C、C++、Pascal、Basic、Fortran、Cobol、Perl、Java和Ada。
根据各种示例性实施例,上述示例性实施例中的一个或多个可以包括向使用者接口装置、计算机可读储存介质、本地计算机系统或远程计算机系统发送、显示、储存、打印或输出与可以通过此类示例性实施例生成、访问或使用的任何信息、信号、数据和/或中间结果或最终结果有关的信息。例如,此类发送、显示、储存、打印或输出的信息可采用可搜索和/或可过滤的运行和报告、图片、表格、图表、图形、电子表格、相关性、序列和其组合列表的形式。
可通过重复、添加或替换在一个或多个上述示例性实施例中阐述的任何一般或具体描述的特征和/或组件和/或物质和/或步骤和/或操作条件来导出各种另外的示例性实施例。进一步地,应该理解,除非另外特别说明,否则只要步骤或动作的目的仍然可实现,步骤的顺序或执行某些动作的顺序是不重要的。此外,除非特别说明,否则可同时进行两个或更多个步骤或动作,只要步骤或动作的目标仍然可实现。此外,除非另外特别说明,否则在上文讨论的示例性实施例之一中提到的任何一个或多个特征、组件、方面、步骤或其它特征可以被认为是上文讨论的示例性实施例的任何其它实施例的潜在任选的特征、组件、方面、步骤或其它特征,只要上文讨论的示例性实施例的任何此类其它实施例的目的仍然是可实现的。
在某些实施例中,本发明的组合物包含靶BCR引物组,其中引物针对相同靶BCR基因的序列。在一些实施例中,免疫受体是选自由以下组成的组的抗体受体:重链α、重链δ、重链ε、重链γ、重链μ、轻链κ和轻链λ。在一些实施例中,靶BCR引物组可以与针对选自由以下组成的组的TCR的引物组结合:TCR α,TCR β,TCR γ和TCR δ。
在一些实施例中,本发明的组合物包含被选择为具有本文所概述的各种参数或标准的靶BCR引物组。在一些实施例中,本发明的组合物包含长度为约15个核苷酸到约40个核苷酸并具有至少两个或更多个以下标准的多种靶特异性引物(例如,V基因FR1、FR2和针对FR3的引物,针对J基因的引物和针对C基因的引物):可切割基团定位于所述多个引物中的基本上所有引物的3′末端处、可切割基团定位于所述多个引物中的基本上所有引物的中心核苷酸附近或周围、所述多个引物中的基本上所有引物都位于仅包括不可切割的核苷酸的5′末端处、与所述多个引物中的基本上所有引物进行最小交叉杂交、与样本中存在的非特异性序列进行最小交叉杂交、最小自互补性以及最小核苷酸序列在所述多个引物中基本上所有引物的3′末端或5′末端处重叠。在一些实施例中,组合物可以包括具有上述标准的任何3、4、5、6或7条的引物。
在一些实施例中,组合物包含多种靶特异性引物,其长度约15个核苷酸至约40个核苷酸,具有两个或更多个以下标准:可切割基团位于基本上所有多个引物的中心核苷酸附近或周围,5′端的基本上所有多个引物仅包括不可裂解的核苷酸,在包括可切割基团的引物的整个长度上基本上所有多个引物具有小于20%的核苷酸,至少一个引物在其整个长度上具有与样本中存在的靶序列互补的核酸序列,与多个引物中基本上所有引物最小交叉杂交,与存在于样本的非特异性序列最小交叉杂交,和最小核苷酸序列在多个引物中基本上所有引物的3′端或5′端重叠。在一些实施例中,组合物可以包括具有上述标准的任何3、4、5、6或7条的引物。
在一些实施例中,选择或设计在本发明的组合物中使用的靶特异性引物(例如,V基因FR1、FR2和针对FR3的引物、针对J基因的引物和针对C基因的引物)以满足以下标准中的任何一个或多个标准:(1)在所述引物序列内包括两个或更多个经修饰的核苷酸,所述核苷酸中的至少一个核苷酸包括在所述引物的末端附近或末端处,并且所述核苷酸中的至少一个核苷酸包括在所述引物序列的中心核苷酸位置处或中心核苷酸位置周围;(2)长度为约15到约40个碱基长;(3)Tm为高于60℃到约70℃;(4)与在所述样本中存在的非靶序列的交叉反应性低;(5)至少前四个核苷酸(从3′到5′方向)与在所述组合物中存在的任何其它引物内的任何序列不互补;并且(6)与用于使用引物进行扩增所靶向的任何其它序列内的至少5个核苷酸的任何连续段不互补。在一些实施例中,选择或设计在所述组合物中使用的靶特异性引物以满足上述标准中的任何2个、3个、4个、5个或6个。在一些实施例中,所述两个或更多个经修饰的核苷酸具有可切割基团。在一些实施例中,所述多个靶特异性引物中的每个靶特异性引物包含选自以下的可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
在一些实施例中,提供了用于分析样本中的免疫组库的组合物,所述组合物包含以下的至少一组:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因;和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中针对所述同一靶BCR的每组i)引物和ii)引物被配置成扩增所述靶BCR组库。在某些实施例中,组合物中涵盖包含i)和ii)单个引物组。在更特定的实施例中,此类组包含针对IgH的引物。在又其它实施例中,组合物中涵盖至少两组引物,其中所述组针对IgH和TCR β。
在特定实施例中,所提供的组合物包括靶BCR引物组,所述引物组包含针对在FR1区的长度为约70个核苷酸的序列的多个V基因引物中的一个或多个基因引物。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR1区高出约50个核苷酸的序列。在某些实施例中,靶BCR引物组包含约18到约45个不同的针对FR1的引物的V基因引物。在一些实施例中,靶BCR引物组包含约22到约35个不同的针对FR1的引物的V基因引物。在一些实施例中,靶BCR引物组包含约25到约35个不同的针对FR1的引物的V基因引物。在某些实施例中,靶BCR引物组包含约40到约65个不同的针对FR1的引物的V基因引物。在一些实施例中,靶BCR引物组包含约48到约60个不同的针对FR1的引物的V基因引物。在一些实施例中,靶BCR引物组包含一个或多个C基因引物。在特定实施例中,靶BCR引物组包含至少5到约15个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在特定实施例中,靶BCR引物组包含至少2到约8个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在一些实施例中,靶BCR引物组包含针对不同Ig同种型分子,例如IgA、IgD、IgG、IgM和IgE的两个或更多个C基因引物。在一些实施例中,靶BCR引物组包含至少5个C基因引物,每个引物针对不同Ig同种型分子的C基因。
在特定实施例中,本发明的组合物包含至少一组引物,所述至少一组引物包含分别选自表3和表6-10的V基因引物i)和C基因引物ii)。在某些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物分别包含选自表3的约15到约35个引物和选自表6-10的约5到约20个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自表3的约22到约35个引物,以及ii)选自表6-10中的每个表的一个或多个引物。在某些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物分别包含选自表3的约40到约65个引物和选自表6-10中的每个表的约5到约20个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自表3的约48到约65个引物,以及ii)选自表6-10中的每个表的一个或多个引物。在其它某些实施例中,本发明的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:137-283的引物和ii)选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的引物。在其它实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQ IDNO:284-430的引物和ii)选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的引物。在一些实施例中,本发明的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:137-283的引物和ii)选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的引物或包含i)选自SEQ ID NO:284-430的引物和ii)选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的引物。
在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少20或至少25个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约15到约35个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的约5到约15个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQID NO:137-283的约22到约35个引物和ii)选自SEQ ID NO:448-459的至少一个引物、选自SEQ ID NO:472-479的至少一个引物、选自SEQ ID NO:488-513的至少一个引物、选自SEQID NO:540-551的至少一个引物和选自SEQ ID NO:564-582的至少一个引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少20或至少25个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约15到约35个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的约5到约15个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:284-430的约22到约35个引物和ii)选自SEQ ID NO:460-471的至少一个引物、选自SEQ ID NO:480-487的至少一个引物、选自SEQ ID NO:514-539的至少一个引物、选自SEQ ID NO:552-563的至少一个引物和选自SEQ ID NO:583-601的至少一个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少20或至少25个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少20或至少25个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。
在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少40或至少50个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约40到约65个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的约5到约15个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQID NO:137-283的约48到约60个引物和ii)选自SEQ ID NO:448-459的至少一个引物、选自SEQ ID NO:472-479的至少一个引物、选自SEQ ID NO:488-513的至少一个引物、选自SEQIDNO:540-551的至少一个引物和选自SEQ ID NO:564-582的至少一个引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少40或至少50个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约40到约65个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的约5到约15个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:284-430的约48到约60个引物和ii)选自SEQ ID NO:460-471的至少一个引物、选自SEQ ID NO:480-487的至少一个引物、选自SEQ ID NO:514-539的至少一个引物、选自SEQ ID NO:552-563的至少一个引物和选自SEQ ID NO:583-601的至少一个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少40或至少50个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少40或至少50个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。
在一些实施例中,提供了用于分析样本中的BCR组库的组合物,所述组合物包含以下的至少一组:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因;和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中针对所述同一靶免疫受体的每组i)引物和ii)引物被配置成扩增所述靶BCR组库。在某些实施例中,组合物中涵盖包含i)和ii)单个引物组。在更特定的实施例中,此类组包含针对IgH的引物。在又其它实施例中,组合物中涵盖至少两组引物,其中所述组针对IgH和TCR β。
在某些实施例中,所提供的组合物包括包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约70个核苷酸的序列。在特定实施例中,所提供的组合物包括包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约50个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约40到约60个核苷酸的序列。在某些实施例中,靶BCR引物组包含约50到约85个不同的针对FR3的引物的V基因引物。在某些实施例中,靶BCR引物组包含约55到约80个不同的针对FR3的引物的V基因引物。在一些实施例中,靶BCR引物组包含约62到约75个不同的针对FR3的引物的V基因引物。在一些实施例中,靶BCR引物组包含约65、66、67、68、69或70个不同的针对FR3的引物的V基因引物。在一些实施例中,靶BCR引物组包含一个或多个C基因引物。在特定实施例中,靶BCR引物组包含至少5到约15个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在特定实施例中,靶免疫受体引物组包含至少2到约8个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在一些实施例中,靶BCR引物组包含针对不同Ig同种型分子,例如IgA、IgD、IgG、IgM和IgE的两个或更多个C基因引物。在一些实施例中,靶BCR引物组包含至少5个C基因引物,每个引物针对不同Ig同种型分子的C基因。
在特定实施例中,本发明的组合物包含至少一组引物,所述至少一组引物包含分别选自表2和表6-10的V基因引物i)和C基因引物ii)。在某些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物分别包含选自表2的约55到约80个引物和选自表6-10的约5到约20个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自表2的约62到约75个引物,以及ii)选自表6-10中的每个表的一个或多个引物。在某些其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68以及448-459、472-479、488-513、540-551和564-582或选自SEQ ID NO:69-136以及460-471、480-487、514-539、552-563和583-601的引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ IDNO:1-68以及460-471、480-487、514-539、552-563和583-601或选自SEQ ID NO:69-136以及448-459、472-479、488-513、540-551和564-582的引物。
在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的约5到约15个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:1-68的至少60个引物和ii)选自SEQ ID NO:448-459的至少一个引物、选自SEQ ID NO:472-479的至少一个引物、选自SEQ ID NO:488-513的至少一个引物、选自SEQ ID NO:540-551的至少一个引物和选自SEQ ID NO:564-582的至少一个引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的约5到约15个引物。在一些实施例中,所提供的组合物包含至少一组引物,所述至少一组引物包含i)选自SEQ ID NO:69-136的至少60个引物和ii)选自SEQ ID NO:460-471的至少一个引物、选自SEQ ID NO:480-487的至少一个引物、选自SEQ ID NO:514-539的至少一个引物、选自SEQ ID NO:552-563的至少一个引物和选自SEQ ID NO:583-601的至少一个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQID NO:1-68的至少60个引物和选自SEQ ID NO:460-471、480-487、514-539、552-563和583-601的至少一个引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:448-459、472-479、488-513、540-551和564-582的至少一个引物。
在一些实施例中,提供了用于分析样本中的BCR组库的组合物,所述组合物包含以下的至少一组:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因;和ii)一个或多个C基因引物,所述一个或多个C基因引物针对BCR编码序列的相应靶C基因的至少一部分,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中针对所述同一靶免疫受体的每组i)引物和ii)引物被配置成扩增所述靶BCR组库。在某些实施例中,组合物中涵盖包含i)和ii)单个引物组。在更特定的实施例中,此类组包含针对IgH的引物。在又其它实施例中,组合物中涵盖至少两组引物,其中所述组针对IgH和TCR β。
在特定实施例中,所提供的组合物包括包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR2区高出约70个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR2区高出约50个核苷酸的序列。在某些实施例中,靶BCR引物组包含约5到约15个不同的针对FR2的引物的V基因引物。在一些实施例中,靶BCR引物组包含约5、6、7、8、9、10、11或12个不同的针对FR2的引物的V基因引物。在一些实施例中,靶BCR引物组包含一个或多个C基因引物。在特定实施例中,靶BCR引物组包含至少5到约15个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在特定实施例中,靶BCR引物组包含至少2到约8个C基因引物,其中每个基因引物针对靶C基因中的每个靶C基因内的50个相同核苷酸区的至少一部分。在一些实施例中,靶BCR引物组包含针对不同Ig同种型分子,例如IgA、IgD、IgG、IgM和IgE的两个或更多个C基因引物。在一些实施例中,靶BCR引物组包含至少5个C基因引物,每个引物针对不同Ig同种型分子的C基因。
在特定实施例中,本发明的组合物包含至少一组引物,所述至少一组引物包含分别选自表4和表6-10的V基因引物i)和C基因引物ii)。在某些其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437以及448-459、472-479、488-513、540-551和564-582的引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437以及460-471、480-487、514-539、552-563和583-601的引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQID NO:448、472、488、540、541、564和565的至少一个引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQ ID NO:460、480、514、552、553、583和584的至少一个引物。
在一些实施例中,提供了用于分析样本中的BCR组库的组合物,所述组合物包含以下的至少一组:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因;和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因的多个J基因引物,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中针对所述同一靶免疫受体的每组i)引物和ii)引物被配置成扩增所述靶BCR组库。在某些实施例中,组合物中涵盖包含i)和ii)单个引物组。在更特定的实施例中,此类组包含针对IgH的引物。在又其它实施例中,组合物中涵盖至少两组引物,其中所述组针对IgH和TCR β。
在特定实施例中,所提供的组合物包括包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约50个核苷酸的序列。在其它实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约70个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR3区高出约40到约60个核苷酸的序列。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约50到约85个不同的针对FR3的引物。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约55到约80个不同的针对FR3的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约62到约75个不同的针对FR3的引物。在一些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约65、66、67、68、69或70个不同的针对FR3的引物。在一些实施例中,靶BCR引物组包含多个J基因引物。在特定实施例中,靶BCR引物组包含至少2个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在某些实施例中,靶BCR引物组包含2到约8个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约3到约6个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约2、3、4、5、6、7或8个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约4个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因部分的至少一部分。
在特定实施例中,本发明的组合物包含至少一组引物,所述至少一组引物包含分别选自表2和5的V基因引物i)和J基因引物ii)。在某些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68和438-442或选自SEQ IDNO:69-136和443-447的引物。在其它某些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68和443-447或选自SEQ ID NO:69-136和438-442的引物。
在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:1-68的至少60个引物和选自SEQID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:69-136的至少60个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。
在一些实施例中,提供了用于分析样本中的BCR组库的组合物,所述组合物包含以下的至少一组:i)多个V基因引物,所述多个V基因引物针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因;和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中针对所述同一靶免疫受体的每组i)引物和ii)引物被配置成扩增所述靶BCR组库。在某些实施例中,组合物中涵盖包含i)和ii)单个引物组。在更特定的实施例中,此类组包含针对IgH的引物。在又其它实施例中,组合物中涵盖至少两组引物,其中所述组针对IgH和TCR β。
在特定实施例中,所提供的组合物包括靶BCR引物组,所述引物组包含针对在FR1区的长度为约70个核苷酸的序列的多个V基因引物中的一个或多个基因引物。在其它实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR1区高出约80个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR1区高出约50个核苷酸的序列。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约18到约45个不同的针对FR1的引物。在一些实施例中,靶BCR引物组包含约22到约35个不同的针对FR1的引物的V基因引物。在一些实施例中,靶BCR引物组包含约25到约35个不同的针对FR1的引物的V基因引物。在某些实施例中,靶BCR引物组包含约40到约65个不同的针对FR1的引物的V基因引物。在一些实施例中,靶BCR引物组包含约48到约60个不同的针对FR1的引物的V基因引物。在一些实施例中,靶BCR引物组包含多个J基因引物。在特定实施例中,靶BCR引物组包含至少2个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在某些实施例中,靶BCR引物组包含2到约8个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约3到约6个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约2、3、4、5、6、7或8个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约4个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因部分的至少一部分。
在特定实施例中,本发明的组合物包含至少一组引物,所述至少一组引物包含分别选自表3和5的V基因引物i)和J基因引物ii)。在某些其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283和438-442或选自SEQ ID NO:284-430和443-447的引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283和443-447或选自SEQ ID NO:284-430和438-442的引物。
在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少20个或至少25个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约15到约35个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约22到约35个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少20个或至少25个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约15到约35个引物和选自SEQ IDNO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约22到约35个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ IDNO:137-283的至少20个或至少25个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少20个或至少25个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。
在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的至少40个或至少50个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约40到约65个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:137-283的约48到约60个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少40个或至少50个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约40到约65个引物和选自SEQ IDNO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,所提供的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的约48到约60个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ IDNO:137-283的至少40个或至少50个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:284-430的至少40个或至少50个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。
在一些实施例中,提供了用于分析样本中的BCR组库的组合物,所述组合物包含以下的至少一组:i)多个V基因引物,所述多个V基因引物针对包含V基因内的FR2的至少一部分的至少一个BCR编码序列的大多数不同V基因;和ii)多个J基因引物,所述多个J基因引物针对相应靶BCR编码序列的大多数不同J基因,其中针对同一靶免疫受体序列的每组i)引物和ii)引物选自由IgH、IgL和IgK组成的组,并且其中针对所述同一靶免疫受体的每组i)引物和ii)引物被配置成扩增所述靶BCR组库。在某些实施例中,组合物中涵盖包含i)和ii)单个引物组。在更特定的实施例中,此类组包含针对IgH的引物。在又其它实施例中,组合物中涵盖至少两组引物,其中所述组针对IgH和TCR β。
在特定实施例中,所提供的组合物包括包含V基因引物的靶BCR引物组,其中多个V基因引物中的一个或多个V基因引物针对长度为比FR2区高出约70个核苷酸的序列。在其它特定实施例中,多个V基因引物中的一个或多个V基因引物针对长度为比FR2区高出约50个核苷酸的序列。在某些实施例中,靶BCR引物组包含V基因引物,所述V基因引物包含约5到约15个不同的针对FR2的引物。在一些实施例中,靶BCR引物组包含约5、6、7、8、9、10、11或12个不同的针对FR2的引物的V基因引物。在一些实施例中,靶BCR引物组包含多个J基因引物。在特定实施例中,靶BCR引物组包含至少2个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在某些实施例中,靶BCR引物组包含2到约8个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约3到约6个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约2、3、4、5、6、7或8个不同的J基因引物,其中每个基因引物针对靶多核苷酸内的J基因的至少一部分。在一些实施例中,靶BCR引物组包含约4个J基因引物,其中每个基因引物针对靶多核苷酸内的J基因部分的至少一部分。
在特定实施例中,本发明的组合物包含至少一组引物,所述至少一组引物包含分别选自表4和5的V基因引物i)和J基因引物ii)。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437和438-442或选自SEQID NO:431-437和443-447的引物。在一些实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQ ID NO:438-442的至少2个引物、至少3个引物或至少4个引物。在其它实施例中,本发明的组合物包含至少一组引物i)和ii),所述至少一组引物包含选自SEQ ID NO:431-437的至少5个引物和选自SEQ ID NO:443-447的至少2个引物、至少3个引物或至少4个引物。
在一些实施例中,包括至少一个经修饰的核苷酸的多个不同引物可以用于单一扩增反应。例如,可以将包括修饰的核苷酸的多重引物添加到扩增反应混合物中,其中每个引物(或引物组)选择性地与在核酸群体内的不同的重排的靶核酸分子杂交并促进其扩增。在一些实施例中,靶特异性引物可以包括至少一个尿嘧啶核苷酸。
在一些实施例中,可以使用PCR和变性、引物退火和聚合酶延伸步骤的循环在设定温度下进行多重扩增持续设定的时间。在一些实施例中,使用约12个循环至约30个循环来在多重扩增反应中产生扩增子文库。在一些实施例中,使用13个循环、14个循环、15个循环、16个循环、17个循环、18个循环、19个循环、优选地20个循环、23个循环或25个循环来在多重扩增反应中产生扩增子文库。在一些实施例中,17-25个循环用于在多重扩增反应中产生扩增子文库。
在一些实施例中,扩增反应在单个反应阶段内并行进行(例如,在单个孔或管内的相同扩增反应混合物内)。在一些情况下,扩增反应可生成产物的混合物,包括预期的扩增子产物以及非预期的、不需要的非特异性扩增伪影,如引物-二聚体两个方面。扩增后,然后用任何合适的试剂处理反应,所述试剂将选择性地裂解或以其它方式选择性破坏过量未掺入的引物和扩增伪影内的修饰核苷酸的核苷酸键,而不裂解或破坏规格扩增产物。例如,引物可以包括含尿嘧啶的核碱基,其可使用UNG/UDG(任选地加热和/或碱)选择性裂解。在一些实施例中,引物可以包括含尿嘧啶的核苷酸,其可使用UNG和Fpg选择性裂解。在一些实施例中,裂解处理包括暴露于氧化条件以选择性裂解二硫醇,用RNAse H处理以选择性裂解修饰的核苷酸,包括RNA特异性部分(例如核糖等)等。该切割处理可以有效地将原始扩增引物和非特异性扩增产物分裂成小核酸片段,每个核酸片段包括相对较少的核苷酸。此类片段通常不能在升高的温度下促进另外扩增。通过所属领域已知的各种扩增后净化程序(例如,离心柱、NaEtOH沉淀等),也可相对容易地从反应池中除去此类片段。
在一些实施例中,任选地处理修饰核苷酸的核苷酸键的裂解或其它选择性破坏后的扩增产物,以产生在5′端具有磷酸的扩增产物。在一些实施例中,磷酸化处理包括酶促操作以产生5′磷酸化的扩增产物。在一个实施例中,酶如聚合酶可用于产生5′磷酸化的扩增产物。例如,T4聚合酶可用于制备5′磷酸化扩增子产物。Klenow可与一种或多种其它酶一起使用以产生具有5′磷酸的扩增产物。在一些实施例中,所属领域已知的其它酶可用于制备具有5′磷酸基团的扩增产物。例如,含有尿嘧啶核苷酸的扩增产物与酶UDG、Fpg和T4聚合酶的孵育可用于产生在5′端具有磷酸的扩增产物。对于所属领域技术人员显而易见的是,除了本文具体描述的那些之外的其它技术可用于产生磷酸化的扩增子。应当理解,应用于实践本文公开的方法、系统、试剂盒、组合物和装置而不诉诸过度实验的此类变化和修改被认为在本公开的范围内。
在一些实施例中,并入预期的(特异性)扩增产物中的引物,这些引物被类似地裂解或破坏,导致在特定扩增产物内形成“粘性端”(例如,5′或3′突出)。此类“粘性端”可用几种方式解决。例如,如果要克隆特异性扩增产物,可设计突出区以补充引入克隆载体中的突出,从而使得实现比平末端连接更快速和有效的粘性端连接。替代地,可能需要拯救突出(与几种新一代测序方法一样)。此类拯救可通过仅使用仅由天然碱基组成的正向和反向扩增引物(例如,对应于A和P1引物)的二次扩增反应来完成。以此方式,随后的几轮扩增重建双链模板,在引物破坏之前具有原始链的完整序列的扩增子的新生拷贝。替代地,可使用某些形式的填充和连接处理去除粘性端,其中正向和反向引物与模板粘接。然后聚合酶可以用于延伸引物,并且然后连接酶(任选地,热稳定连接酶)可以用于连接所得核酸链。这显然也可以通过如循环延伸-连接等各种其它反应途径实现。在一些实施例中,可以使用一种或多种DNA连接酶执行连接步骤。
在一些实施例中,使用靶特异性引物对制备的扩增子文库可以用于下游富集应用,如乳液PCR、桥式PCR或等温扩增。在一些实施例中,扩增子文库可用于富集应用和测序应用。例如,可以使用包括任何合适的下一代DNA测序平台的任何合适的DNA测序平台对扩增子文库进行测序。在一些实施例中,可以使用Ion PGM测序仪或Ion GeneStudio S5测序仪(赛默飞世尔科技公司)对扩增子文库进行测序。在一些实施例中,PGM测序仪或S5测序仪可以耦接到应用参数或软件以测定扩增的靶核酸分子的序列的服务器。在一些实施例中,可以在不到24小时内对扩增子文库进行制备、富集和测序。在一些实施例中,扩增子文库可在约9小时内制备、富集和测序。
在一些实施例中,用于产生扩增子文库的方法可以包括:使用V基因特异性和C基因特异性引物扩增免疫受体基因的cDNA以产生扩增子;从输入的DNA和引物中纯化扩增子;磷酸化扩增子;将衔接子连接到磷酸化的扩增子;纯化连接的扩增子;对扩增的扩增子进行切口平移;并纯化切口平移的扩增子以产生扩增子文库。在一些实施例中,用于产生扩增子文库的方法可以包括:使用V基因特异性和J基因特异性引物扩增免疫受体基因的cDNA以产生扩增子;从输入的DNA和引物中纯化扩增子;磷酸化扩增子;将衔接子连接到磷酸化的扩增子;纯化连接的扩增子;对扩增的扩增子进行切口平移;并纯化切口平移的扩增子以产生扩增子文库。在一些实施例中,可以在扩增重排免疫受体基因靶标以产生扩增子的步骤之后进行另外的扩增子文库操作。在一些实施例中,可以任何顺序进行另外的反应的任何组合,并且可以包括:纯化;磷酸化;连接衔接子;缺口平移;扩增和/或测序。在一些实施例中,可省略或可重复这些反应中的任何一种。对于所属领域技术人员来说显而易见的是,方法可重复或省略任何一个或多个上述步骤。对于所属领域技术人员来说显而易见的是,可修改步骤的顺序和组合以生成所需的扩增子文库,因此不限于所提供的示例性方法。
磷酸化的扩增子可与衔接子连接以进行切口平移反应,随后的下游扩增(例如,模板制备),或用于附着到粒子(例如珠粒)或两者。例如,与磷酸化扩增子连接的衔接子可与附接到粒子的寡核苷酸捕获引物粘接,并且可进行引物延伸反应以生成附接到粒子或表面的扩增子的互补拷贝,从而将扩增子附接到表面或粒子。衔接子可具有一个或多个扩增引物杂交位点、测序引物杂交位点、条形码序列和其组合。在一些实施例中,通过本文公开的方法制备的扩增子可与一个或多个Ion TorrentTM相容的衔接子连接以构建扩增子文库。通过此类方法生成的扩增子可连接到一个或多个衔接子用于文库构建,以与下一代测序平台兼容。例如,通过本公开的教导产生的扩增子可以连接到在Ion AmpliSeqTM文库试剂盒2.0或Ion AmpliSeqTM文库试剂盒加(赛默飞世尔科技公司)中提供的衔接子。
在一些实施例中,对免疫受体cDNA或重排的gDNA进行的扩增可以使用5x IonAmpliSeqTM HiFi主混合物进行。在一些实施例中,5x Ion AmpliSeqTM HiFi主混合物可以包括甘油、dNTP和DNA聚合酶,如PlatinumTM Taq DNA聚合酶高保真。在一些实施例中,5xIon AmpliSeqTM HiFi主混合物可以还包括以下中的至少一种:防腐剂、氯化镁、硫酸镁、三硫酸盐和/或硫酸铵。
在一些实施例中,免疫受体重排的gDNA多重扩增反应还包括至少一种用于改进靶上扩增(on-target amplification)、扩增产量和/或生产性测序读段的百分比的PCR添加剂。在一些实施例中,所述至少一种PCR添加剂包括氯化钾或另外的dNTP(例如,dATP、dCTP、dGTP、dTTP)中的至少一种。在一些实施例中,作为PCR添加剂的dNTP为dNTP的等摩尔混合物。在一些实施例中,作为PCR添加剂的dNTP为dATP、dCTP、dGTP和dTTP的等摩尔混合物。在一些实施例中,将约0.2mM到约5.0mM dNTP添加到多重扩增反应。在一些实施例中,可以使用5x Ion AmpliSeqTM HiFi主混合物和反应混合物中的另外的约0.2mM到约5.0mM dNTP执行对重排的免疫受体gDNA进行的扩增。在一些实施例中,可在反应混合物中使用5x IonAmpliSeqTM HiFi主混合物和另外约0.5mM到约4mM、约0.5mM到约3mM、约0.5mM到约2.5mM、约0.5mM到约1.0mM、约0.75mM到约1.25mM、约1.0mM到约1.5mM、约1.0到约2.0mM、约2.0mM到约3.0mM、约1.25到约1.75mM、约1.3到约1.8mM、约1.4mM到约1.7mM,或约1.5到约2.0mM dNTP进行重排的免疫受体gDNA的扩增。在一些实施例中,可在反应混合物中使用5x IonAmpliSeqTM HiFi主混合物和另外约0.2mM、约0.4mM、约0.6mM、约0.8mM、约1.0mM、约1.2mM、约1.4mM、约1.6mM、约1.8mM、约2.0mM、约2.2mM、约2.4mM、约2.6mM、约2.8mM、约3.0mM、约3.5mM或约4.0mM dNTP进行重排的免疫受体gDNA的扩增。在一些实施例中,将约10mM到约200mM的氯化钾添加到多重扩增反应。在一些实施例中,可在反应混合物中使用5x ImAmpliSeqTM HiFi主混合物和另外约10mM到约200mM氯化钾进行重排的免疫受体gDNA的扩增。在一些实施例中,可在反应混合物中使用5x Ion AmpliSeqTM HiFi主混合物和另外约10mM到约60mM、约20mM到约70mM、约30mM到约80mM、约40mM到约90mM、约50mM到约100mM、约60mM到约120mM、约80mM到约140mM、约50mM到约150mM、约150mM到约200mM或约100mM到约200mM氯化钾进行重排的免疫受体gDNA的扩增。在一些实施例中,可在反应混合物中使用5xIon AmpliSeqTM HiFi主混合物和另外约10mM、约20mM、约30mM、约40mM、约50mM、约60mM、约70mM、约80mM、约90mM、约100mM、约120mM、约140mM、约150mM、约160mM、约180mM或约200mM氯化钾进行重排的免疫受体gDNA的扩增。
在一些实施例中,扩增子的磷酸化可使用FuPa试剂进行。在一些实施例中,FuPa试剂可以包括DNA聚合酶、DNA连接酶、至少一种尿嘧啶裂解或修饰酶,和/或储存缓冲液。在一些实施例中,FuPa试剂可以还包括以下中的至少一种:防腐剂和/或去污剂。
在一些实施例中,扩增子的磷酸化可使用FuPa试剂进行。在一些实施例中,FuPa试剂可以包括DNA聚合酶、至少一种尿嘧啶裂解或修饰酶、抗体和/或储存缓冲液。在一些实施例中,FuPa试剂可以还包括以下中的至少一种:防腐剂和/或去污剂。在一些实施例中,提供抗体以在环境温度下抑制DNA聚合酶和3′-5′核酸外切酶活性。
在一些实施例中,通过本公开内容的教导产生的扩增子文库的产率足以用于各种下游应用,包括Ion ChefTM仪器和Ion S5TM测序系统(赛默飞世尔科技)。
对于本领域的普通技术人员显而易见的是,用于克隆扩增的平台或方法,如野火(wildfire)PCR和桥式扩增可以结合本公开的扩增靶序列使用。还设想了本领域的普通技术人员在进一步精化或优化本文提供的条件时可以直接进行核酸测序(例如使用Ion PGMTM系统或Ion S5TM系统或Ion ProtonTM系统测序仪,赛默飞世尔科技公司)而不执行克隆扩增步骤。
在一些实施例中,待克隆扩增的扩增靶序列中的至少一个序列可以连接到载体或颗粒。载体可以包含任何合适的材料,并具有任何合适的形状,包括例如平面、球状或颗粒。在一些实施例中,载体是如美国公开申请第20100304982号中描述的支架聚合物颗粒,所述美国公开申请通过引用以其整体并入本文。
在一些实施例中,提供了用于在单一反应中扩增来自核酸分子群的多个免疫受体表达序列的试剂盒。在一些实施例中,试剂盒包括含有一个或多个可切割基团的多个靶特异性引物对、一个或多个DNA聚合酶、dNTP的混合物和至少一种切割试剂。在一个实施例中,可切割基团为8-氧代-脱氧鸟苷、脱氧尿苷或溴脱氧尿苷。在一些实施例中,至少一种裂解试剂包括RNaseH、尿嘧啶DNA糖基化酶、Fpg或碱。在一个实施例中,裂解试剂为尿嘧啶DNA糖基化酶。在一些实施例中,提供试剂盒以在单个反应室或容器中进行多重PCR。在一些实施例中,试剂盒包括至少一种DNA聚合酶,其为热稳定DNA聚合酶。在一些实施例中,与单个PCR反应相比,一种或多种DNA聚合酶的浓度以3倍过量存在。在一些实施例中,每种靶特异性引物对的最终浓度以约5nM到约2000nM存在。在一些实施例中,每种靶特异性引物对的最终浓度以约25nM到约50nM或约100nM到约800nM存在。在一些实施例中,每种靶特异性引物对的最终浓度以约50nM到约400nM或约50nM到约200nM存在。在一些实施例中,每种靶特异性引物对的最终浓度以约200nM或约400nM存在。在一些实施例中,该试剂盒提供来自单个反应室中的核酸分子群的TCR β、TCR α、TCR γ、TCR δ、免疫球蛋白重链γ、免疫球蛋白重链μ、免疫球蛋白重链α、免疫球蛋白重链δ、免疫球蛋白重链ε、免疫球蛋白轻链λ或免疫球蛋白轻链κ的免疫组库表达序列的扩增。在特定实施例中,提供的试剂盒味测试试剂盒。在一些实施例中,试剂盒还包含一个或多个衔接子、条形码和/或抗体。
表2——IgH V基因FR3
表3——IgH V基因FR1
表4——IgH V基因FR2
表5——IgH J基因
序列 | SEQ ID NO |
GAGGAGACGGTGACCGTG | 438 |
GAGACAGTGACCAGGGTGC | 439 |
GAGACGGTGACCATTGTCC | 440 |
TGAGGAGACGGTGACCAGG | 441 |
CCAGTGGCAGAGGAGTCCATTC | 442 |
GAGGAGACGGUGACCGUG | 443 |
GAGACAGUGACCAGGGUGC | 444 |
GAGACGGUGACCATTGUCC | 445 |
TGAGGAGACGGUGACCAGG | 446 |
CCAGUGGCAGAGGAGTCCATUC | 447 |
表6——IgH C基因A同种型
表7——IgH C基因D同种型
序列 | SEQ ID NO |
GACAGTCACGGACGTTGGG | 472 |
ACCACAGGGCTGTTATCCTTTGG | 473 |
ACCACAGGGCTGTTATCCTTTG | 474 |
CAGGACCACAGGGCTGTTATCCTT | 475 |
CAGGACCACAGGGCTGTTATCCT | 476 |
CCCATGTACCAGGTGACAGTCAC | 477 |
CCCATGTACCAGGTGACAGTCA | 478 |
CCCATGTACCAGGTGACAGTC | 479 |
GACAGUCACGGACGTUGGG | 480 |
ACCACAGGGCUGTTATCCTTUGG | 481 |
ACCACAGGGCUGTTATCCTTUG | 482 |
CAGGACCACAGGGCUGTTATCCUT | 483 |
CAGGACCACAGGGCUGTTAUCCT | 484 |
CCCATGUACCAGGTGACAGUCAC | 485 |
CCCATGUACCAGGTGACAGUCA | 486 |
CCCATGUACCAGGTGACAGUC | 487 |
表8——IgH C基因G同种型
表9——IgH C基因M同种型
序列 | SEQ ID NO |
GGAGAAAGTGATGGAGTCGGGA | 540 |
GGACAAAGTGATGGAGTCGGGA | 541 |
GTCCTGTGCGAGGCAGCCAAC | 542 |
GTCCTGTGCGAGGCAGCCAA | 543 |
AGGAAGTCCTGTGCGAGGCAGCCA | 544 |
AGGAAGTCCTGTGCGAGGCAGCC | 545 |
GTATTTCCAGGAGAAAGTGAT | 546 |
GTATTTCCAGGACAAAGTGAT | 547 |
TGTATTTCCAGGACAAAGTGA | 548 |
TGTATTTCCAGGAGAAAGTGA | 549 |
TGTATTTCCAGGACAAAGTG | 550 |
TGTATTTCCAGGAGAAAGTG | 551 |
GGAGAAAGUGATGGAGUCGGGA | 552 |
GGACAAAGUGATGGAGUCGGGA | 553 |
GUCCTGUGCGAGGCAGCCAAC | 554 |
GUCCTGUGCGAGGCAGCCAA | 555 |
AGGAAGUCCTGUGCGAGGCAGCCA | 556 |
AGGAAGUCCTGUGCGAGGCAGCC | 557 |
GTATTUCCAGGAGAAAGUGAT | 558 |
GTATTUCCAGGACAAAGUGAT | 559 |
TGTATTUCCAGGACAAAGUGA | 560 |
TGTATTUCCAGGAGAAAGUGA | 561 |
TGTATTUCCAGGACAAAGUG | 562 |
TGTATTUCCAGGAGAAAGUG | 563 |
表10——IgH C基因E同种型
对各种示例性实施例的以下描述仅是示例性和说明性的,并且不应以任何方式解释为有限或限制性的。根据说明书和附图以及权利要求,本教导的其它实施例、特征、目的和优点将显而易见。
尽管本说明书详细描述了某些示例性实施例,但是其它实施例也是可能的并且在本发明的范围内。考虑到说明书和附图以及权利要求书、说明书和附图中描述的教导的实践,变化和修改对于所属领域技术人员来说是显而易见的。
实例
所提供的免疫组库组合物包括但不限于设计用于文库制备和对表达的IgH序列和重排的基因组IgH序列进行测序的试剂。通常,对从样本(例如,血液样本、分选的细胞样本、正常组织样本、肿瘤样本(例如,各种类型的新鲜、冷冻、FFPE))中提取的RNA进行逆转录;从样本中提取gDNA;例如,使用Ion ChefTM或Ion OneTouchTM 2系统产生文库,制备模板,然后使用下一代测序技术,例如,Ion S5TM系统和Ion pGMTM系统对制备的模板进行测序,以及使用Ion ReporterTM软件执行序列分析。适于从生物样本中提取和/或分离RNA和基因组DNA的试剂盒可从例如赛默飞世尔科技公司和生物链研究所公司商购获得。
实例1
根据制造商的说明,用SuperScriptTM IV VILOTM主混合物(赛默飞世尔科技公司)将来自外周血白细胞的总RNA逆转录为cDNA。cDNA(25ng或50ng)用于多重PCR,以扩增IgH和/或TCR β CDR3结构域序列。在一个多重PCR中,选自表2和5的正向引物和反向引物的组用作在从V基因FR3区到IgH cDNA的J基因的序列进行扩增时的引物对。在另一个多重PCR中,在同一反应中扩增IgH和TCR β的FR3-J区时,将这些相同的IgH正向和反向FR3-J引物的组与来自OncomineTM TCR β-SR测定(RNA)的TCR βFR3-J引物组结合。在另一个多重PCR中,将OncomineTM TCR β-SR测定RNA(赛默飞世尔科技公司)用于扩增TCR β cDNA的FR3-J区的序列。在示例性IgH V基因FR3-J扩增反应中,所述多重引物组包括68个不同的IGHV正向引物SEQ ID NO:69-136和4个不同的IGHJ反向引物SEQ ID NO:443-446。
通常,多重扩增反应执行如下。向96孔PCR板的单个孔中加入10微升制备的cDNA(25ng或50ng)、4微升2μM正向和反向引物池、4微升5X Ion AmpliSeqTM HiFi混合物(可以包括甘油、dNTP和Taq高保真DNA聚合酶(英杰公司,目录号:11304)的扩增反应混合物)以及2微升DNase/RNase游离水以将最终反应体积调至20微升。以相同的方式制备IgH+TCR β(1个池)反应。根据制造商的说明执行OncomineTM TCR β-SR测定RNA。
将PCR板密封,使反应混合物混合并装载到热循环仪(例如,VeritiTM 96孔热循环仪(应用生物系统公司))中,并且在以下温度曲线下运行以产生扩增子文库。在95℃下执行初始保持阶段持续2分钟,然后在95℃下进行约20个循环的变性阶段持续15秒,在60℃下进行退火阶段持续45秒,并且在72℃下进行延伸阶段持续45秒。在循环后,在72℃下执行最终延伸持续10分钟,并且将扩增子文库保持在10℃下直到继续进行。通常,使用约20个循环来产生扩增子文库。对于一些应用,可以使用多达30个循环。
在继续进行之前,将扩增子样本短暂地离心以收集内容物。向扩增子文库(约20微升)中加入2微升的FuPa试剂。将反应混合物密封,彻底混合以确保均匀性并在50℃下温育10分钟,在55℃下温育10分钟,在60℃下温育20分钟,然后在10℃下保持长达1小时。在继续进行之前,将样本短暂地离心以收集内容物。
温育后,反应混合物直接进行到连接步骤。此处,现在将含有磷酸化扩增子文库的反应混合物与2微升离子选择条形码衔接子(每种5μM)(赛默飞世尔科技公司)、4微升AmpliSeq加转换溶液(作为Ion AmpliSeqTM文库试剂盒加的组分出售,赛默飞世尔科技公司)和最后添加的2微升DNA连接酶(作为Ion AmpliSeqTM文库试剂盒加的组分出售,赛默飞世尔科技公司),然后在以下情况下温育:22℃下持续30分钟、68℃下持续5分钟、72℃下持续5分钟,然后在10℃下保持长达1小时。在继续进行之前,将样本短暂地离心以收集内容物。
在温育步骤后,将45微升(1.5x样本体积)室温XP珠粒(贝克曼库尔特公司(Beckman Coulter))加入连接的DNA,并且使混合物彻底移液以使珠粒悬浮液与DNA混合。将混合物在室温下温育5分钟,置于如DynaMagTM-96侧磁体(英杰公司,部件号:12331D)等磁架上持续两分钟。在溶液澄清后,丢弃上清液。在不从磁架上去除板的情况下,将150微升新鲜制备的70%乙醇引入样本中,并温育同时轻轻旋转磁架上的管。在溶液澄清后,在不影响沉淀的情况下丢弃上清液。进行第二次乙醇洗涤,丢弃上清液,通过脉冲旋转管除去任何剩余的乙醇并小心地除去残留的乙醇,同时不干扰沉淀。将沉淀在室温下风干约5分钟。在50微升低TE缓冲液中从珠粒上洗脱连接的DNA。
根据制造商的说明,使用Ion ChefTM仪器将文库归一化为20pM,并且将最终文库用于模板制备和芯片装载。根据制造商的说明,使用Ion S5TM系统上的Ion 540TM芯片执行测序,并且使用Ion Torrent SuiteTM软件执行基因序列分析。由于序列是根据使用J基因引物产生的,因此所述序列经受J基因序列推断过程,所述推断过程涉及向序列读段添加推断的J基因序列以产生延伸的序列读段,将延伸的序列读段与参考序列比对,并鉴别生产性读段,如本文所述。另外,所生成的序列数据中的所有序列数据将进一步经受本文提供的错误鉴别和去除程序。
对12个文库进行测序导致每样本平均具有6M个读段。如图3所示,当单独执行IgH测定时,高达66%的总读段是生产性的。当将IgH(BCR)测定和TCR β(TCR)测定结合时,约12%的读段是生产性IgH读段,而约58%的读段是TCR β生产性读段。
检测到的B细胞克隆和T细胞克隆的总数与血液中的淋巴细胞的相对丰度成比例。如图4A所示,当单独进行IgH测定时,鉴别出约45,000个BCR克隆,并且当将IgH和TCR β引物组合时,鉴别出约30,000个BCR克隆。由于在测序之前对文库进行归一化,并且降低了BCR的读段深度,因此预期在两次测定之间检测到的BCR克隆数的这种差异。将BCR和TCR测定合并到一个池中相对于在两个单独的池中进行扩增时,克隆数的类似性表明合并的扩增反应中没有引物干扰。IgH(BCR)和TCR β(TCR)克隆的群体与外周血中B细胞和T细胞的相对丰度成比例(图4B)。T淋巴细胞和B淋巴细胞的相对比例可以分别在61-85%和7-23%的范围内(Palmer等人.(2006)上海启因生物科技有限公司(BMC Genomics)7:115)。
实例2
表2的IgH V基因FR3引物和表5的IgH J基因引物被设计为扩增目前已知的表达或gDNA人IgH重排中的所有重排。在多重PCR中,选自表2和5的正向引物和反向引物的池用作在从V基因FR3区到IgH cDNA的J基因的序列进行扩增时的引物对。在示例性IgH V基因FR3-J扩增反应中,多重引物组池包括正向引物SEQ ID NO:69-136和反向引物SEQ ID NO:443-446。对来自多种人细胞和组织样本的cDNA执行测定。
根据制造商的说明,用SuperScriptTM IV VILOTM主混合物(赛默飞世尔科技公司)将来自人类成人归一化外周血白细胞(来自生物链研究所公司)的总RNA逆转录为cDNA。向96孔PCR板的单个孔中加入10微升制备的cDNA(50ng)、4微升1μM正向和反向引物池、4微升5X Ion AmpliSeqTM HiFi混合物(赛默飞世尔科技公司)以及2微升DNase/RNase游离水以将最终反应体积调至20微升。将PCR板密封,使反应混合物混合并装载到热循环仪(例如,VeritiTM 96孔热循环仪(应用生物系统公司))中,并且在以下温度曲线下运行以产生扩增子文库。在95℃下执行初始保持阶段持续2分钟,然后在95℃下进行约20个循环的变性阶段持续15秒,在60℃下进行退火阶段持续45秒,并且在72℃下进行延伸阶段持续45秒。在循环后,在72℃下执行最终延伸持续10分钟,并且将扩增子文库保持在10℃下直到继续进行。通常,使用约20个循环来产生扩增子文库。对于一些应用(例如,或多或少的cDNA起始材料,FFPE来源的RNA等),可以减少(例如,-3)或增加(例如,+3、+6,最多30个循环)循环数。
在继续进行之前,将扩增子样本短暂地离心以收集内容物。向扩增子文库(约20微升)中加入2微升的FuPa试剂。将反应混合物密封,彻底混合以确保均匀性并在50℃下温育10分钟,在55℃下温育10分钟,在60℃下温育20分钟,然后在10℃下保持长达1小时。在继续进行到连接步骤之前,将样本短暂地离心以收集内容物。现在将含有磷酸化扩增子文库的反应混合物与2微升Ion TorrentTM双条形码衔接子(赛默飞世尔科技公司)、4微升AmpliSeq加转换溶液(作为Ion AmpliSeqTM文库试剂盒加的组分出售,赛默飞世尔科技公司)和最后添加的2微升DNA连接酶(作为Ion AmpliSeqTM文库试剂盒加的组分出售,赛默飞世尔科技公司),然后在以下情况下温育:22℃下持续30分钟、68℃下持续5分钟、72℃下持续5分钟,然后在10℃下保持长达1小时。在继续进行到文库纯化步骤之前,将样本短暂地离心以收集内容物。
在连接步骤温育后,将45微升(1.5x样本体积)室温XP珠粒(贝克曼库尔特公司(Beckman Coulter))加入连接的DNA,并且使混合物彻底移液以使珠粒悬浮液与DNA混合。将混合物在室温下温育5分钟,置于如DynaMagTM-96侧磁体(英杰公司,部件号:12331D)等磁架上持续两分钟。在溶液澄清后,丢弃上清液。在不从磁架去除板的情况下,将150微升新鲜制备的70%乙醇引入样本中,并保温同时轻轻旋转磁架上的管。在溶液澄清后,在不影响沉淀的情况下丢弃上清液。进行第二次乙醇洗涤,丢弃上清液,通过脉冲旋转管除去任何剩余的乙醇并小心地除去残留的乙醇,同时不干扰沉淀。将沉淀在室温下风干约5分钟。在50微升低TE缓冲液中从珠粒上洗脱连接的DNA。
根据制造商的说明,使用Ion ChefTM仪器将文库归一化为25pM,并且将最终文库用于模板制备和芯片装载。根据制造商的说明,使用Ion S5TM系统上的Ion 540TM芯片执行测序,并且使用Ion Torrent SuiteTM软件执行基因序列分析。由于序列是根据使用J基因引物产生的,因此所述序列经受J基因序列推断过程,所述推断过程涉及向序列读段添加推断的J基因序列以产生延伸的序列读段,将延伸的序列读段与参考序列比对,并鉴别生产性读段,如本文所述。另外,所生成的序列数据中的所有序列数据将进一步经受本文提供的错误鉴别和去除程序。
表11中示出了从将4个单独的外周血白细胞RNA的管用作起始样本进行IgH FR3-J测定的示例性结果。这些测定中的每个测定均产生2-3M个原始序列读段,其中约75%为生产性的。均匀度(也被称为克隆归一化香农熵)描述了样本中均匀的克隆表示如何;越接近1.O,克隆群体的大小就越均匀。
表11
从人细胞和组织样本(生物链研究所公司)获得总RNA,此类样本中通常存在的B细胞的量不同。RNA样本包括从分离的CD19+细胞、正常脾组织、外周血白细胞(PBL)、骨髓、正常脑组织、肺肿瘤组织(FFPE)、扁桃体(FFPE)和Jurkat细胞(T细胞系)中提取的样本。对于每个总RNA样本,如上所述,制备cDNA并使用包括SEQ ID NO:69-136和443-446的引物组进行多重扩增。从所得的扩增子制备文库,并如上所述对文库进行测序。表12中示出了各种样本的测定结果,并且图5A-5G描绘了针对PBL、CD19+细胞、扁桃体FFPE、肺肿瘤FFPE、骨髓、脾和脑RNA样本获得的读段长度直方图。除了来自Jurkat细胞和正常脑组织样本的结果外,这些测定中的每个测定导致约70-80%的序列读段为生产性IgH读段。Jurkat细胞RNA样本用作阴性对照物,因为所述样本是不表达IgH的T细胞系。
表12
实例3
表3的IgH V基因FR1引物和表6-10的IgH C基因引物被设计为扩增目前已知的表达的人IgH重排中的所有重排。使用选自表3的正向引物和选自表6-10的反向引物产生用于对V基因FR1区到IgH cDNA的C基因的序列进行扩增的各种引物组。引物组中的一些引物组包括针对IgH同种型IgA、IgD、IgG、IgM和IgE中的IgH同种型中的每个同种型的C基因的至少一个引物。表13中描述了示例性FR1-C引物组组,其中所述组中的每个引物的浓度为1微摩尔。
表13
如实例2所述,从PBL总RNA中制备cDNA。使用50ng PBL cDNA和表13的引物组执行多重扩增反应,从所得扩增子制备文库,并对文库进行测序,如实例2中所述。图6描绘了针对示例性引物组1-7获得的所得序列读段长度。表14中示出了来自这些引物组的示例性测定结果。
表14
在所提供的多重扩增和测序分析工作流程中,使用选自表6-10的一个或多个C基因引物进行的B细胞组库分析导致对所检测的IgH克隆序列进行同种型表征。使用包括针对同种型IgA、IgD、IgG、IgM和IgE中的每个同种型的C基因的至少一个引物的引物组,检测并表征样本中B细胞受体组库和克隆谱系的所有同种型。图7A-7B示出了来自如在IgH V基因FR1-C多重扩增反应(用25-50ng cDNA输入)和如上所述的测序分析中使用表13的引物组8检测到的PBL样本的示例性同种型使用结果。图7的条形图示出了PBL样本内的通过每同种型读段数(图7A)和每同种型克隆和谱系数(图7B)报告的总同种型表示的汇总。考虑到PBLRNA中IgA和IgG同种型的较高表达,预期获得的同种型表示(IgA和IgG比IgM、IgD和IgE的表示更高)。
本文提供的生物信息学工作流程鉴别克隆谱系的体细胞超突变并产生样本的体细胞超突变谱。例如,图8A-8B示出了来自在IgH V基因FR1-C多重扩增反应(用25-50ngcDNA输入)和如上所述的测序分析中使用表13的引物组8测定的PBL RNA样本的示例性SMH谱。图8A示出了样本的所有同种型的IgH V基因突变率的直方图,并且报告了没有SHM的克隆的预期群体和具有高达约15%的SHM的克隆的分布。图8B所示的SMH谱表示同种型IgD(即预期具有低SHM率的初始B细胞同种型)的IgH V基因突变。
本文提供的序列分析工作流程可以包括可以帮助例如由于跨测定的测序深度的差异而消除可变的下采样分析。对于此类下采样分析,在克隆分析之前将序列读段随机去除到固定的读段深度。对于此类分析,使用25-50ng cDNA输入和表13的引物组9以及如上所述的测序工作流程,在IgH V基因FR1-C多重扩增反应中对PBL RNA样本进行测定。使生成的序列数据经受本文提供的错误鉴别和去除步骤,并且鉴别样本的生产性读段(即,生产性读段和拯救的生产性读段)组。将整组生产性读段用作起始点并且然后随机选择固定数量的读段下采样到所选固定深度中的每个固定深度。执行下采样到以下固定深度:10K、50K、250K、500K、750K、1M、1.5M和2M读段。由于每个下采样分析都是从整组生产性读段开始的,因此较低下采样深度的读段不一定是较高下采样深度的读段的子集。利用下采样的数据集以及总生产性读段数据集中的每一个执行克隆分析。在将下采样应用于IgH序列读段之后,图9中示出了示例性克隆分析的结果。图9的曲线图描绘了下采样的数据集中的每个数据集和样本的总生产性读段(每个曲线图上的最右边的点)的检测到的克隆数和谱系数、克隆和谱系香农多样性以及克隆和谱系均匀度。下采样分析允许用户鉴别将特定样本测序到饱和的点,这意指另外的读段未鉴别另外的克隆或谱系或向所检测的组库添加另外的都阳性的点。例如,下采样允许用户在利用类似样本类型进行测定之间或在未来测定时对测序深度或多重化进行精化。
实例4
产生20个对照质粒的文库(表15)以代表一组各种IgH序列并用于评估本文提供的测定和工作流程的性能。每个对照质粒均含有来自11种慢性淋巴细胞白血病(CLL)之一或广泛中和的HIV-1抗体(bnAb)谱系的9个成员之一的IgH cDNA的VDJ区到C基因CH1结构域(约恒定基因的前300bp)(Liao等人.(2013)《自然》496:469-476)。对照质粒文库包括所有IgH同种型和CLL重排的代表,以最大化V基因多样性,包括种系和突变的重排。每个质粒的总IgH插入物长度为约650bp。对照质粒文库中的一些质粒设计有FR1区内的阻碍引物结合(质粒18)的核苷酸突变或具有同种型错误(质粒17和20)。对照文库还包括产生的具有框外非功能性受体序列的质粒(质粒19),所述序列将在序列分析工作流程中作为非生产性读段而被过滤掉。
表15
质粒ID | IgH VDJ-C插入物 | 插入物源 |
1 | KC575857.1_IGHV4-59*01_93.4_IGHG1*01 | bnAb |
2 | JX432218.1_IGHV3-9*01_96.3_IGHA1 | CLL |
3 | AF021964.1_IGHV3-30*18_91.6_IGHG1*01 | CLL |
4 | KC575856.1_IGHV4-59*01_92.8_IGHG3*01 | bnAb |
5 | JX432219.1_IGHV3-21*01_964.2_IGHA2*01 | CLL |
6 | AF021966.1_IGHV3-33*01_91.2_IGHG2*01 | CLL |
7 | KC575854.1_IGHV4-59*01_98.3_IGHD*01 | bnAb |
8 | KC575852.1_IGHV4-59*01_83.3_IGHA2*01 | bnAb |
9 | KC575849.1_IGHV4-59*01_91.4_IGHG2*01 | bnAb |
10 | JX432222.1_IGHV1-46*03_100_IGHG3*01 | CLL |
11 | KC575846.1_IGHV4-59*01_86.2_IGHE*01 | bnAb |
12 | AF021958.1_IGHV4-39*01_100_IGHM*01 | CLL |
13 | KC575862.1_IGHV4-59*01_96.9_IGHM*01 | bnAb |
14 | AF021967.1_IGHV1-18*01_100_IGHD*01 | CLL |
15 | KC575850.1_IGHV4-59*01_91.4_IGHG4*01 | bnAb |
16 | KC575846.1_IGHV4-59*01_86.2_IGHE*01 | bnAb |
17 | Z95484.1_IGHV3-48*03_89.5_IGHG4*01(同种型错误) | CLL |
18 | AF021956.1_IGHV1-3*01_89.2_IGHE*01(FR1突变) | CLL |
19 | JX432220.1_IGHV3-23*01_89.5_IGHA1(非功能) | CLL |
20 | JX432165.1_IGHV4-34*01_98.6_IGHM*01(同种型错误) | CLL |
为了评估测定和工作流程的检测限,在100ng白细胞cDNA的背景下使用单一已知的输入浓度的合并质粒来制备对照文库。质粒输入浓度在10pg到0.00001pg(相当于5M份拷贝到约5份拷贝)的范围内。在用于测定之前,将对照质粒线性化(单独或大量)或保持完整。使用表13的引物组8或引物组9,其中每个引物处于200nM处,在多重反应中对合并的文库进行扩增,并且如实例3所述执行扩增和测序。使所生成的序列数据经受本文所提供的错误鉴别和去除程序。
如图10所示,在1pM的等摩尔浓度下,对20个对照质粒的池进行测定的性能导致所检测的质粒频率在一个数量级内。在测定中未检测处设计有序列错误而不产生生产性序列读段的对照质粒17-20。
使用含有对照质粒2(JX432218.1_IGHV3-9*01_96.3_IGHA1)的IgH VDJ-C插入物的合成寡核苷酸用于评估检测限并表明测定和分析工作流程鉴别和检测所关注的单个克隆的频率的能力。以不同的浓度向25ng PBL总RNA样本加入对照合成寡核苷酸,并且使用与IgH V基因FR3-J多重引物组进行的多重反应并且执行如上文和实例2中所述的扩增、测序和分析来测定对照序列的克隆型频率,该多重引物组包括正向引物SEQ ID NO:69-136和反向引物SEQ ID NO:443-446,其中每个引物处于200nM。对照寡核苷酸输入量在0.1pg到0.00001pg的范围内。表16示出了复制品测定的克隆检测频率。
表16
对照寡核苷酸输入量 | 克隆检测频率复制品1 | 克隆检测频率复制品2 |
0.1pg | 0.517825 | 0.463189 |
0.01pg | 0.064037 | 0.053178 |
0.001pg | 0.005957 | 0.005111 |
0.0001pg | 0.000744 | 0.000590 |
0.00001pg | 0.000069 | 0.000049 |
在其它克隆型频率检测测定中,以0.1pg到0.0000001pg的输入量向50ng PBL总RNA、100ng PBL总RNA和100ng骨髓(BM)总RNA加入含有对照质粒2(JX432218.1_IGHV3-9*01_96.3_IGHA1)的IgH VDJ-C插入物的合成寡核苷酸。使用包括正向引物SEQ ID NO:69-136和反向引物SEQ ID NO:443-446的IgH V基因FR3-J多重引物组执行多重扩增反应,并且对所得扩增子执行测序和分析,如实例2所述。在DNA测定中,以0.1pg到0.0000001pg的输入量向1μg PBL gDNA添加合成寡核苷酸。使用包括正向引物SEQ ID NO:69-136和反向引物SEQ ID NO:443-446的多重引物组执行多重扩增反应,并且对所得扩增子执行测序和分析,如实例2所述。表17中示出了此类克隆频率测定的示例性检测限结果。IgH FR3-J测定能够利用仅使用100ng的输入PBL或骨髓RNA的单个文库以介于7.6 x 10-6与1.0 x 10-6之间的频率鉴别对照CLL序列。IgH FR3-J测定能够使用1μg的输入PBL gDNA以约5.2 x 10-6鉴别对照CLL序列。在使用一系列输入量的寡核苷酸的1μg骨髓gDNA的背景下执行相同的测定,并且使用Ion S5TM系统和Ion 540TM芯片将所得文库测序到10M个读段的目标深度。具有骨髓背景的IgH FR3-J DNA测定能够使用单个文库检测对照CLL序列的频率为10-5。
表17
对于使用IgH V基因FR1-C引物组进行的克隆型频率检测测定,以0.1pg to0.0000001pg的输入量向50ng骨髓(BM)总RNA加入含有对照质粒13(KC575862.1_IGHV4-59*01_96.9_IGHM*01)的IgH VDJ-C插入物的合成寡核苷酸。使用表13的多重引物组9执行多重扩增反应,并且对所得扩增子执行测序和分析,如实例2所述。表18中示出了此类克隆频率测定的示例性检测限结果。IgH FR1-C测定能够利用仅使用50ng的输入骨髓RNA的单个文库以介于1.1 x 10-1与8.7 x 10-5之间的频率鉴别对照bnAb序列。
表18
使用具有CLL衍生的插入物的对照质粒评价本文提供的测定和工作流程的对体细胞超突变(SHM)和种系和突变的CLL IgH克隆的同种型进行定量的能力。向PBL总RNA背景加入表15的所选质粒构建体。使用表13的多重引物组9执行多重扩增反应,并如实例2所述制备文库并对其进行测序,并分析序列,其中使用Ion S5TM系统和Ion 530TM芯片将文库测序到1.5M个读段的目标深度。表19中示出了此类SHM定量测定的示例性结果。表19示出了基于测定的输入的每个质粒的预期的SHM状态、SHM频率和同种型以及来自测定结果的每个质粒的观察的SHM状态、SHM频率和同种型。如图所示,测定准确地定量对照CLL组的SHM和同种型。
表19
检测限、克隆型频率检测以及SHM和同种型定量的此类结果证明所提供的测定和分析工作流程的鉴别和检测罕见的BCR克隆的能力。此能力非常适于纵向研究,在所述研究中跟踪特定克隆(或小组克隆)的频率。
实例5
研究队列:来自格拉斯哥大学用甲氨蝶呤治疗类风湿性关节炎的18名个体的样本。队列包括:6名完全应答者(根据CDAI评分指南,甲氨蝶呤治疗开始后疾病缓解至少12个月);6名部分应答者(在治疗开始后12个月内疾病缓解随后突然发作);6名无应答者(治疗后无疾病缓解)
在基线(第一次甲氨蝶呤施用的时间)、治疗后第6个月和第12个月时从外周血自细胞(PBL)中提取总RNA。使用来自外周血白细胞的25ng总RNA进行分析。常见的起始材料包括外周血白细胞/血沉棕黄层、全血或外周血单核细胞(PBMC)。
通过逆转录将RNA转化为cDNA,然后使用Oncomine IGH-LR测定对cDNA进行靶向扩增。在其它途径中,可以使用另一种文库制备和基于NGS的途径,该途径使得IGH的VDJ-C区的序列可以被使用。这里,将25ng总RNA转化而来的25ng cDNA用作文库制备的输入。在其它实施例中,10ng、50ng、100ng、200ng、300ng...2ug输入材料可以用于文库制备。
使用Ion Gene Studio S5对制备好的文库进行测序,测序到每个样本1.5M读段的目标,以用于NGS平台。通过Ion Reporter 5.12分析数据。在其它途径中,可以使用与文库生成兼容的替代NGS测序系统,然后进行分析。
分析测序数据以鉴别独特的IGH重排(即,克隆)包含针对每个克隆确定:
a.每个克隆的可变基因部分内的体细胞超突变(SHM)水平,其通过将可变基因的序列与常用公共参考数据库(例如IMGT)内的最匹配种系可变基因的序列进行比较来确定。常见的比对途径可用于此任务,如IgBLAST。
b.确定每个克隆的同种型同一性。
c.将每个克隆的频率计算为IGH重排总组的比例。
确定具有大于预定义阈值的V基因突变频率(SHM频率)的IgM和/或IgD表达性克隆的总频率。这里使用了8%的SHM阈值。在其它实例中,可以使用1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、约15%、约20%的阈值。在优选实例中,约2%、约4%、约6%或约8%的阈值可以定义最佳阈值范围。
在鉴别出高SHM IgD和/或IgM表达性B细胞后,确定样本中此类细胞的总频率。通过确定此类IgM或IgD表达性B细胞的总频率是大于还是小于预定义阈值来估计预测个体的应答状态。在一些实施例中,利用0.007的阈值。在其它实施例中,使用为约.001、约.002、约.003、约.004、约.005、约.006、约.007、约.008、约.009、约.01、约.02、约.03、约.04、约.05、约.06、约.07、约.08、约.09、约0.1或这些值附近的阈值。在一些实施例中:使用约.005、约.006、约.007、约.008、约.009、约.01的值。在一些实施例中,约.006、约.007、约.008的值是优选的。
在其它实例中,作为上述方法的替代方案,该方法可以包含:
a.确定具有大于预定义阈值的V基因突变频率的IgM或IgD表达性克隆的总数。在一些实例中,使用8%的阈值。在其它实例中,可以使用1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、约15%、约20%的阈值。在一些实例中,约2%、约4%、约6%、约8%或约10%的阈值可以定义最佳阈值范围。
b.将步骤a中的数字除以样本中检测到的IgM和IgD表达性B细胞克隆的总数。
c.通过确定步骤b的结果是大于还是小于预定义阈值来预测个体的应答状态。在一些实施例中,利用0.017的阈值。在其它实施例中,利用为约.008、约.009、约.010、约.011、约.012、约.013、约.014、约.015、约.016、约.017、约.018、约.019、约.020、约.021、约.022、约.023、约.024、约.025、约.03、约.04、约.05、约.06、约.07、约.08、约.09、约0.1或这些值附近的阈值。在一些实施例中:使用约.015、约.016、约.017、约.018、约.019、约.020的值。在一些实施例中,约.016、约.017、约.018的值是优选的。
在12个月的治疗过程中,甲氨蝶呤降低了IgG、IgA或IgE表达性B细胞的相对频率。对接受甲氨蝶呤治疗的个体的IGH组库的连续监测揭示,在12个月的治疗过程中,与IgM和IgD表达性B细胞相比,表达IgG、IgA或IgE的B细胞的频率逐渐降低。未经治疗的患有RA的个体往往具有高频率的IgG、IgA或IgE表达性B细胞。与表达IgM或IgD的B细胞相比,甲氨蝶呤似乎降低了表达转换同种型的B细胞的频率(p=.003,Wilcoxon)。见图11。甲氨蝶呤可能对表达IgM或IgD的致病性B细胞的频率影响很小。因此,在致病性B细胞大量表达IgM或IgD的情况下,治疗可能无法减少疾病。鉴于此类个体可能继续携带致病性B细胞,B细胞耗竭治疗(如利妥昔单抗)可能是优选的。
高度突变的IgM/IgD B细胞的频率可预测对甲氨蝶呤的应答。图11B:描绘了箱线图中的分析结果,其中将表达IgM或IgD的高度突变(>8%V基因突变)B细胞的频率指示为应答状态的函数。与无应答者相比,甲氨蝶呤的应答者具有低频率的高度突变IgM/IgD表达性B细胞。高度突变的IgM/IgD频率升高与对甲氨蝶呤的耐药性相关。
不受理论束缚,我们预测自身免疫疾病(例如,类风湿性关节炎)的检测,以及治疗应答的预测可能需要结合同种型背景对B细胞免疫组库体细胞超突变进行有效评价。模型的ROC曲线分析(AUC 0.847)采用高度突变的IgM/D的频率来预测应答,其证明了100%的敏感性和83%的特异性表现。该分析不依赖于CDR3特定氨基酸基序。
慢性可变免疫缺陷病症(CVID)是一种原发性免疫缺陷,通常源自影响B细胞成熟和同种型转换的种系编码突变。患有CVID的个体患上类风湿性关节炎(约15%的同时发生)和其它自身免疫病症的风险有所升高。
IGH-LR分析揭示了该研究队列内一名受试者的潜在CVID的特征。与健康供体相比,该样本证明了缺乏IgG,并且在较小程度上缺乏IgA表达性B细胞,并且IgG1表达性B细胞内的SHM减少。该结果支持IGH-LR测定在转化研究中评价原发性免疫缺陷病症以及自身免疫疾病和病症方面具有广泛的潜在效用。
实例6
我们应用IGH链测序数据的克隆谱系分析来评价68个CLL研究样本的队列中的CSR和SHM。我们在相当一部分样本子集中发现了进行中的CSR和SHM的证据。
针对IGH框架1区和同种型区(Oncomine IGH-LR测定;检测所有九种同种型)的多重引物用于对来自68名患有CLL的个体和4名患有脾边缘区淋巴瘤(SMZL)的个体25ng外周血总RNA进行IGH组库测序。克隆分型和克隆谱系分析由Ion Reporter执行。克隆谱系被定义为一组独特的重排,它们具有共享的可变和连接基因、相同的CDR3长度和85%的最小CDR3核苷酸类似性。进行中的CSR被定义为在同一谱系内存在IgM/IgD和至少一种转换同种型(IgG、IgA或IgE)或转换同种型的组合。进行中的SHM被定义为与其它克隆谱系成员相比,在VDJ区序列内存在不同的亚克隆。
68个病例中有11个证明了进行中的CSR或SHM的证据。在没有进行中的CSR或SHM的证据的57个病例中,可变基因突变分析揭示存在三个不同的子组,它们具有:i)无SHM,ii)中间SHM(平均2%突变)或iii)高SHM(>6%突变)。4个SMZL病例中有3个显示了进行中的CSR或SHM的证据。见图11。
结果表明了CLL内先前未被重视的异质性,并建议基于IGHV突变水平和进行中的SHM或CSR的存在的组合来将CLL细分为子组。见图11。附加研究可能会进一步描述将该细分用于预后和治疗目的。我们提议基于IGHV基因突变状态以及CLL克隆谱系是否显示出最近或进行中的类别转换重组(CSR)或体细胞超突变(SHM)的证据的组合来将CLL细分为四类。
进行中的CSR被定义为含有表达IgM/IgD和至少一种其它转换同种型(IgG、IgA或IgE)或转换同种型组合的成员的CLL克隆谱系。进行中的SHM被定义为与同一CLL谱系的其它成员相比,在VDJ区序列内存在不同的亚克隆。见图12。
进行中的SHM或CSR的证据可能表明功能性DNA错误修复机制,其与化学免疫治疗和使用引发DNA损伤或调制DNA修复机制活性的试剂(例如,PARP抑制剂)有关。
从历史上看,由于参与损伤修复的基因的数量和结构复杂性,评价DNA修复机制的功能一直具有挑战性。例如,ATM基因在损伤修复中起着至关重要的作用,并且在CLL中经常被禁用。此外,已显示ATM基因的失活会损害体外模型中的类别转换重组。(www.ncbi.nlm.nih.gov/pmc/articles/PMC2211853)然而,由于该基因的大尺寸和ATM基因修复途径的复杂性,ATM功能测试并未常规执行。
在将样本细分为“无进行中的CSR或SHM”或“进行中的CSR或SHM”后,基于IGHV突变频率执行进一步细分。这揭示了我们在“无进行中的CSR或SHM”类别内提出的三个CLL亚群的存在。最低限度地,我们假设每个子组可能具有不同的临床过程和药物敏感性曲线。以下是基于分析提出的CLL细分:
I类:假设具有最差预后。在具有DNA修复缺陷的CLL中富含,这些缺陷使化学免疫治疗对癌症无效。可能更适合PARP抑制剂治疗。
II类:不良预后。在具有DNA修复缺陷的CLL中富含。可能更适合PARP抑制剂治疗。
III类:良好预后。这组CLL具有高SHM水平,其与持续抗原刺激在疾病进展中的作用一致。假设可能表现为进展时间较长的顽性疾病。
IV类:最好预后。进行中的CSR或SHM揭示了功能性DNA修复机制,表明对化学免疫治疗的应答性有所提高。可能不太适合PARP抑制剂治疗。
当传统的2%和3%SHM截断分离i)突变CLL(MCLL),超过3%SHM并且此类个体被认为具有更好的预后,ii)2%至3%截断之间的不确定CLL(ICLL)并且此类个体被认为具有异质性疗效,以及iii)具有小于2%SHM的未突变CLL(UCLL),并且此类个体被认为具有不良预后;覆盖在四个提议的子组上。可以注意到2%至3%SHM子集由II组和IV组的混合物组成。假设II组具有一般不良预后,而假设IV组具有良好预后。具有>3%SHM的样本在III组和IV组中富含,假设它们具有最好预后。
Claims (85)
1.一种用于基于表征受试者的B细胞免疫组库来预测患有自身免疫疾病或病症的所述受试者对治疗的临床应答的方法,其包含:
a)执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子,
其中所述多重扩增反应包含以下的至少一组:
i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,
(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或
(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及
ii)针对所述至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物;
其中每组i)和ii)引物针对靶IgH BCR基因的编码序列,并且其中执行所述扩增产生代表所述样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子;
b)对靶免疫受体组库扩增子执行测序;
c)从所述测序中鉴别免疫受体克隆以及鉴别所述免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;
d)确定所述样本中B细胞免疫受体克隆的亚类以及所述样本中非转换IgM和/或IgD和转换IgG、IgA和/或IgE表达性细胞的频率;以及
e)将所述受试者鉴别为可能的(i)对化学治疗的应答者,这发生在当SHM频率小于所述样本中非转换IgM/IgD表达性B细胞中的频率阈值,并且所述免疫组库由所述样本中高频率的转换同种型IgG、IgA或IgE表达性B细胞主导时,(ii)对化学治疗的无应答者,这发生在当所述SHM频率大于频率阈值,并且所述免疫组库由所述样本中高频率的非转换IgM/IgD表达性B细胞主导时,和/或(iii)对免疫治疗的应答者,这发生在当所述SHM频率大于频率阈值,并且所述免疫组库由所述样本中高频率的非转换IgM/IgD表达性B细胞主导时。
2.根据权利要求1所述的方法,其中所述多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:
(1)在所述引物内包括两个或更多个经修饰的核苷酸,所述核苷酸中的至少一个核苷酸包括在所述引物的末端附近或末端处,并且所述核苷酸中的至少一个核苷酸包括在所述引物的中心核苷酸位置处或中心核苷酸位置周围;
(2)长度为约15到约40个碱基长;
(3)Tm为高于60℃到约70℃;
(4)与在所述样本中存在的非靶序列的交叉反应性低;
(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及
(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
3.根据权利要求1或权利要求2所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括一个或多个可切割基团,所述一个或多个可切割基团优选地位于(i)所述引物的所述末端附近或所述末端处,或(ii)所述引物的所述中心核苷酸附近或所述中心核苷酸周围。
4.根据权利要求1到3中任一项所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
5.根据权利要求1到4中任一项所述的方法,其中所述多个V基因引物与所述模板分子的FR1部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的C基因部分的至少一部分退火的至少五个引物。
6.根据权利要求5所述的方法,其中所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。
7.根据权利要求5所述的方法,其中至少一组i)和ii)分别选自表3和表6-10的引物。
8.根据权利要求5所述的方法,其中所述至少一组i)和ii)选自表11的引物组。
9.根据权利要求1到4中任一项所述的方法,其中所述至少一组i)和ii)为i)(c)和ii)(a),其中所述多个V基因引物与所述模板分子的FR3部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的所述C基因部分的至少一部分退火的至少五个引物。
10.根据权利要求9所述的方法,其中所述所生成的靶BCR扩增子分子包括所述靶BCR基因序列的互补决定区CDR3。
11.根据权利要求9所述的方法,其中所述至少一组i)和ii)分别选自表2和表6-10的引物。
12.根据权利要求1所述的方法,其中所述SHM频率截止为8%。
13.根据权利要求1所述的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。
14.根据权利要求13所述的方法,其中通过连接添加所述至少一个衔接子。
15.根据权利要求1所述的方法,其中所述测序包括获得初始序列读段,将所述初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。
16.根据权利要求15所述的方法,其中生产性读段和拯救的生产性读段的组合是测序读段的至少50%。
17.一种基于表征受试者的B细胞免疫组库来将具有自身免疫疾病或病症的症状的所述受试者诊断为患有慢性可变免疫缺陷病症的方法,其包含:
a)执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子,
其中所述多重扩增反应包含以下的至少一组:
i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,
(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或
(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及
ii)针对所述至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物;
其中每组i)和ii)引物针对靶IgH BCR基因的编码序列,并且其中执行所述扩增产生代表所述样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子;
b)对靶免疫受体组库扩增子执行测序;
c)从所述测序中鉴别免疫受体克隆以及鉴别所述免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;
d)确定所述样本中B细胞免疫受体克隆的类别转换重组频率;以及
e)当SHM频率小于转换同种型中的频率阈值、所述样本中类别转换重组(CSR)的频率小于频率阈值,并且所述免疫组库由所述样本中的非转换IgM/IgD表达性B细胞主导时,将所述受试者鉴别为患有原发性免疫缺陷病症,从而诊断所述受试者患有慢性可变免疫缺陷病症。
18.根据权利要求17所述的方法,其中所述多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:
(1)在所述引物内包括两个或更多个经修饰的核苷酸,所述核苷酸中的至少一个核苷酸包括在所述引物的末端附近或末端处,并且所述核苷酸中的至少一个核苷酸包括在所述引物的中心核苷酸位置处或中心核苷酸位置周围;
(2)长度为约15到约40个碱基长;
(3)Tm为高于60℃到约70℃;
(4)与在所述样本中存在的非靶序列的交叉反应性低;
(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及
(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
19.根据权利要求17或权利要求18所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括一个或多个可切割基团,所述一个或多个可切割基团优选地位于(i)所述引物的所述末端附近或所述末端处,或(ii)所述引物的所述中心核苷酸附近或所述中心核苷酸周围。
20.根据权利要求17到19中任一项所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
21.根据权利要求17到21中任一项所述的方法,其中所述多个V基因引物与所述模板分子的FR1部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的C基因部分的至少一部分退火的至少五个引物。
22.根据权利要求21所述的方法,其中所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。
23.根据权利要求21所述的方法,其中至少一组i)和ii)分别选自表3和表6-10的引物。
24.根据权利要求21所述的方法,其中所述至少一组i)和ii)选自表11的引物组。
25.根据权利要求17到20中任一项所述的方法,其中所述至少一组i)和ii)为i)(c)和ii)(a),其中所述多个V基因引物与所述模板分子的FR3部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的所述C基因部分的至少一部分退火的至少五个引物。
26.根据权利要求25所述的方法,其中所述所生成的靶BCR扩增子分子包括所述靶BCR基因序列的互补决定区CDR3。
27.根据权利要求25所述的方法,其中所述至少一组i)和ii)分别选自表2和表6-10的引物。
28.根据权利要求17所述的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。
29.根据权利要求28所述的方法,其中通过连接添加所述至少一个衔接子。
30.根据权利要求17所述的方法,其中所述测序包括获得初始序列读段,将所述初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。
31.根据权利要求30所述的方法,其中生产性读段和拯救的生产性读段的组合是测序读段的至少50%。
32.一种用于基于受试者的B细胞免疫组库来治疗患有自身免疫疾病或病症的所述受试者的方法,其包含:
a)执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子,
其中所述多重扩增反应包含以下的至少一组:
i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,
(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或
(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及
ii)针对所述至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物;
其中每组i)和ii)引物针对靶IgH BCR基因的编码序列,并且其中执行所述扩增产生代表所述样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子;
b)对靶免疫受体组库扩增子执行测序;
c)从所述测序中鉴别免疫受体克隆以及鉴别所述免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;
d)确定所述样本中B细胞免疫受体克隆的类别转换重组频率;以及
e)用以下方法治疗所述受试者:(i)化学治疗,这发生在当SHM频率小于所述样本中非转换IgM/IgD表达性B细胞中的频率阈值,并且所述免疫组库由所述样本中高频率的转换同种型IgG、IgA或IgE表达性B细胞主导时,(ii)免疫治疗,这发生在当所述SHM频率大于频率阈值,并且所述免疫组库由所述样本中高频率的非转换IgM/IgD表达性B细胞主导时。
33.根据权利要求32所述的方法,其中所述多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:
(1)在所述引物内包括两个或更多个经修饰的核苷酸,所述核苷酸中的至少一个核苷酸包括在所述引物的末端附近或末端处,并且所述核苷酸中的至少一个核苷酸包括在所述引物的中心核苷酸位置处或中心核苷酸位置周围;
(2)长度为约15到约40个碱基长;
(3)Tm为高于60℃到约70℃;
(4)与在所述样本中存在的非靶序列的交叉反应性低;
(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及
(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
34.根据权利要求32或权利要求33所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括一个或多个可切割基团,所述一个或多个可切割基团优选地位于(i)所述引物的所述末端附近或所述末端处,或(ii)所述引物的所述中心核苷酸附近或所述中心核苷酸周围。
35.根据权利要求32到34中任一项所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
36.根据权利要求32到35中任一项所述的方法,其中所述多个V基因引物与所述模板分子的FR1部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的C基因部分的至少一部分退火的至少五个引物。
37.根据权利要求36所述的方法,其中所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。
38.根据权利要求36所述的方法,其中至少一组i)和ii)分别选自表3和表6-10的引物。
39.根据权利要求36所述的方法,其中所述至少一组i)和ii)选自表11的引物组。
40.根据权利要求32到35中任一项所述的方法,其中所述至少一组i)和ii)为i)(c)和ii)(a),其中所述多个V基因引物与所述模板分子的FR3部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的所述C基因部分的至少一部分退火的至少五个引物。
41.根据权利要求40所述的方法,其中所述所生成的靶BCR扩增子分子包括所述靶BCR基因序列的互补决定区CDR3。
42.根据权利要求40所述的方法,其中所述至少一组i)和ii)分别选自表2和表6-10的引物。
43.根据权利要求32所述的方法,其中所述SHM频率截止为8%。
44.根据权利要求32所述的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。
45.根据权利要求44所述的方法,其中通过连接添加所述至少一个衔接子。
46.根据权利要求32所述的方法,其中所述测序包括获得初始序列读段,将所述初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。
47.根据权利要求46所述的方法,其中生产性读段和拯救的生产性读段的组合是测序读段的至少50%。
48.根据任一前述权利要求所述的方法,其中所述受试者患有类风湿性关节炎。
49.根据任一前述权利要求所述的方法,其中所述免疫治疗包含检查点阻断剂或B细胞耗竭剂。
50.根据任一前述权利要求所述的方法,其中所述化学治疗包含甲氨蝶呤。
51.一种基于表征受试者的B细胞免疫组库来预测患有白血病的所述受试者的预后的方法,其包含:
a)执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子,
其中所述多重扩增反应包含以下的至少一组:
i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,
(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或
(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及
ii)针对所述至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物;
其中每组i)和ii)引物针对靶IgH BCR基因的编码序列,并且其中执行所述扩增产生代表所述样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子;
b)对靶免疫受体组库扩增子执行测序;
c)从所述测序中鉴别免疫受体克隆以及鉴别所述免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的频率;
d)确定进行中的SHM频率,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;和/或进行中的类别转换重组(CSR)频率,其中至少一种转换同种型和/或其组合在所述样本中B细胞免疫受体克隆的同一可变谱系中被鉴别;
e)根据以下亚类对组库克隆进行分类:
I类:无进行中的CSR或SHM,无V基因SHM,
II类:无进行中的CSR或SHM,V基因SHM大于零,小于6%,
III类:无进行中的CSR或SHM,V基因SHM大于约6%,
IV类:进行中的CSR和/或SHM;以及
f)基于所述B细胞免疫组库的亚分类鉴别受试者预后:
I类:最差预后,
II类:不良预后,
III类:良好预后,
IV类:最好预后。
52.根据权利要求51所述的方法,其中所述多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:
(1)在所述引物内包括两个或更多个经修饰的核苷酸,所述核苷酸中的至少一个核苷酸包括在所述引物的末端附近或末端处,并且所述核苷酸中的至少一个核苷酸包括在所述引物的中心核苷酸位置处或中心核苷酸位置周围;
(2)长度为约15到约40个碱基长;
(3)Tm为高于60℃到约70℃;
(4)与在所述样本中存在的非靶序列的交叉反应性低;
(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及
(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
53.根据权利要求51或权利要求52所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括一个或多个可切割基团,所述一个或多个可切割基团优选地位于(i)所述引物的所述末端附近或所述末端处,或(ii)所述引物的所述中心核苷酸附近或所述中心核苷酸周围。
54.根据权利要求51到53中任一项所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
55.根据权利要求51到54中任一项所述的方法,其中所述多个V基因引物与所述模板分子的FR1部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的C基因部分的至少一部分退火的至少五个引物。
56.根据权利要求55所述的方法,其中所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。
57.根据权利要求55所述的方法,其中至少一组i)和ii)分别选自表3和表6-10的引物。
58.根据权利要求55所述的方法,其中所述至少一组i)和ii)选自表11的引物组。
59.根据权利要求51到54中任一项所述的方法,其中所述至少一组i)和ii)为i)(c)和ii)(a),其中所述多个V基因引物与所述模板分子的FR3部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的所述C基因部分的至少一部分退火的至少五个引物。
60.根据权利要求59所述的方法,其中所述所生成的靶BCR扩增子分子包括所述靶BCR基因序列的互补决定区CDR3。
61.根据权利要求59所述的方法,其中所述至少一组i)和ii)分别选自表2和表6-10的引物。
62.根据权利要求51所述的方法,其中III类的平均SHM频率为约2%。
63.根据权利要求51所述的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。
64.根据权利要求63所述的方法,其中通过连接添加所述至少一个衔接子。
65.根据权利要求51所述的方法,其中所述测序包括获得初始序列读段,将所述初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。
66.根据权利要求65所述的方法,其中生产性读段和拯救的生产性读段的组合是测序读段的至少50%。
67.一种用于基于受试者的B细胞免疫组库来治疗患有白血病的所述受试者的方法,其包含:
a)执行多重扩增反应以扩增源自受试者的生物样本的靶B细胞免疫受体核酸模板分子,
其中所述多重扩增反应包含以下的至少一组:
i)(a)针对包含V基因内的框架区1(FR1)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,
(b)针对包含V基因内的框架区2(FR2)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物,或
(c)针对包含V基因内的框架区3(FR3)的至少一部分的至少一个BCR编码序列的大多数不同V基因的多个V基因引物;以及
ii)针对所述至少一个BCR编码序列的C基因的至少一部分的一个或多个C基因引物;
其中每组i)和ii)引物针对靶IgH BCR基因的编码序列,并且其中执行所述扩增产生代表所述样本中的靶BCR组库的扩增子分子,从而生成包含靶免疫受体组库的靶B细胞免疫受体扩增子分子;
b)对靶免疫受体组库扩增子执行测序;
c)从所述测序中鉴别免疫受体克隆以及鉴别所述免疫受体克隆中可变基因部分内的体细胞超突变(SHM)的水平,
d)确定进行中的SHM频率,其中证明SHM的克隆谱系免疫受体克隆的VDJ区具有类似的核苷酸序列;和/或进行中的类别转换重组(CSR)频率,其中至少一种转换同种型和/或其组合在所述样本中B细胞免疫受体克隆的同一可变谱系中被鉴别;
e)根据以下亚类对组库克隆进行分类:
I类:无进行中的CSR或SHM,无V基因SHM,
II类:无进行中的CSR或SHM,V基因SHM大于零,小于6%,
III类:无进行中的CSR或SHM,V基因SHM大于约6%,
IV类:进行中的CSR和/或SHM;以及
f)基于所述B细胞免疫组库的亚分类治疗所述受试者:
I类:干细胞治疗,任选地添加任何化学治疗、放射治疗或DNA修复诱导剂中的任一种;
II类:化学治疗、放射治疗或免疫治疗与任选的DNA修复诱导剂,
III类:化学治疗或免疫治疗,以及
IV类:标准化学治疗或免疫治疗。
68.根据权利要求67所述的方法,其中所述多个V基因引物中的每一个,和/或多个C基因引物中的一个具有以下标准中的任何一个或多个:
(1)在所述引物内包括两个或更多个经修饰的核苷酸,所述核苷酸中的至少一个核苷酸包括在所述引物的末端附近或末端处,并且所述核苷酸中的至少一个核苷酸包括在所述引物的中心核苷酸位置处或中心核苷酸位置周围;
(2)长度为约15到约40个碱基长;
(3)Tm为高于60℃到约70℃;
(4)与在所述样本中存在的非靶序列的交叉反应性低;
(5)至少前四个核苷酸(从3′到5′方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及
(6)与在任何其它所产生的靶扩增子内的至少5个核苷酸的任何连续段不互补。
69.根据权利要求67或权利要求68所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括一个或多个可切割基团,所述一个或多个可切割基团优选地位于(i)所述引物的所述末端附近或所述末端处,或(ii)所述引物的所述中心核苷酸附近或所述中心核苷酸周围。
70.根据权利要求67到69中任一项所述的方法,其中所述多个V基因引物和/或所述一个或多个C基因引物中的每一个包括选自以下的具有可切割基团的两个或更多个经修饰的核苷酸:甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶、尿嘧啶、5-甲基胞嘧啶、胸腺嘧啶二聚体、7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷、溴脱氧尿苷、尿苷或5-甲基胞苷。
71.根据权利要求67到70中任一项所述的方法,其中所述多个V基因引物与所述模板分子的FR1部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的C基因部分的至少一部分退火的至少五个引物。
72.根据权利要求71所述的方法,其中所生成的靶BCR扩增子分子包括靶BCR基因序列的互补决定区CDR1、CDR2和CDR3。
73.根据权利要求71所述的方法,其中至少一组i)和ii)分别选自表3和表6-10的引物。
74.根据权利要求71所述的方法,其中所述至少一组i)和ii)选自表11的引物组。
75.根据权利要求67到70中任一项所述的方法,其中所述至少一组i)和ii)为i)(c)和ii)(a),其中所述多个V基因引物与所述模板分子的FR3部分的至少一部分退火,并且其中所述一个或多个C基因引物包含与所述模板分子的所述C基因部分的至少一部分退火的至少五个引物。
76.根据权利要求75所述的方法,其中所述所生成的靶BCR扩增子分子包括所述靶BCR基因序列的互补决定区CDR3。
77.根据权利要求75所述的方法,其中所述至少一组i)和ii)分别选自表2和表6-10的引物。
78.根据权利要求67所述的方法,其中所述SHM频率截止为8%。
79.根据权利要求67所述的方法,其还包含在步骤b)之前将至少一个衔接子添加至靶免疫受体扩增子分子中的至少一个中,从而产生衔接子修饰的靶免疫受体扩增子分子文库。
80.根据权利要求79所述的方法,其中通过连接添加所述至少一个衔接子。
81.根据权利要求67所述的方法,其中所述测序包括获得初始序列读段,将所述初始序列读段与参考序列进行比对,鉴别生产性读段以及校正一个或多个插入缺失错误以生成拯救的生产性序列读段。
82.根据权利要求81所述的方法,其中生产性读段和拯救的生产性读段的组合是测序读段的至少50%。
83.根据任一前述权利要求51到82所述的方法,其中所述受试者患有慢性淋巴细胞白血病。
84.根据任一前述权利要求51到83所述的方法,其中所述免疫治疗包含靶向生物剂或B细胞耗竭剂。
85.根据任一前述权利要求51到83所述的方法,其中所述化学治疗包含氟达拉滨。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062964524P | 2020-01-22 | 2020-01-22 | |
US202062964550P | 2020-01-22 | 2020-01-22 | |
US62/964,550 | 2020-01-22 | ||
US62/964,524 | 2020-01-22 | ||
PCT/US2021/070065 WO2021151114A1 (en) | 2020-01-22 | 2021-01-22 | Immune repertoire biomarkers in autoimmune disease and immunodeficiency disorders |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115335535A true CN115335535A (zh) | 2022-11-11 |
Family
ID=74592842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180014566.8A Pending CN115335535A (zh) | 2020-01-22 | 2021-01-22 | 自身免疫疾病和免疫缺陷病症中的免疫组库生物标志物 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230055712A1 (zh) |
EP (1) | EP4093887A1 (zh) |
JP (1) | JP2023511200A (zh) |
KR (1) | KR20220130756A (zh) |
CN (1) | CN115335535A (zh) |
WO (1) | WO2021151114A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4388315A1 (en) | 2021-08-18 | 2024-06-26 | Life Technologies Corporation | Immune repertoire biomarkers for prediction of treatment response in autoimmune disease |
WO2024064736A1 (en) * | 2022-09-20 | 2024-03-28 | New England Biolabs, Inc. | Methods for characterizing an immune response repertoire |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
US8586310B2 (en) | 2008-09-05 | 2013-11-19 | Washington University | Method for multiplexed nucleic acid patch polymerase chain reaction |
CA2751669C (en) * | 2009-02-20 | 2017-11-21 | F. Hoffmann-La Roche Ag | Method for obtaining immunoglobulin encoding nucleic acid |
US8574835B2 (en) | 2009-05-29 | 2013-11-05 | Life Technologies Corporation | Scaffolded nucleic acid polymer particles and methods of making and using |
US10920273B2 (en) * | 2017-01-17 | 2021-02-16 | Life Technologies Corporation | Compositions and methods for immune repertoire sequencing |
EP3768864B1 (en) * | 2018-03-23 | 2023-07-26 | Life Technologies Corporation | Immune repertoire monitoring |
-
2021
- 2021-01-22 KR KR1020227028666A patent/KR20220130756A/ko unknown
- 2021-01-22 JP JP2022544702A patent/JP2023511200A/ja active Pending
- 2021-01-22 CN CN202180014566.8A patent/CN115335535A/zh active Pending
- 2021-01-22 EP EP21705090.5A patent/EP4093887A1/en active Pending
- 2021-01-22 WO PCT/US2021/070065 patent/WO2021151114A1/en unknown
-
2022
- 2022-07-22 US US17/871,235 patent/US20230055712A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2021151114A1 (en) | 2021-07-29 |
EP4093887A1 (en) | 2022-11-30 |
US20230055712A1 (en) | 2023-02-23 |
JP2023511200A (ja) | 2023-03-16 |
KR20220130756A (ko) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111344416A (zh) | 用于免疫组库测序的组合物和方法 | |
AU2020213348B2 (en) | Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set | |
CN110191959B (zh) | 用于免疫组库测序的核酸样品制备方法 | |
US20220251654A1 (en) | Methods for detecting immune cell dna and monitoring immune system | |
US20230088159A1 (en) | Compositions and methods for assessing immune response | |
CN110249060A (zh) | 用于免疫组库测序的组合物和方法 | |
US20220002802A1 (en) | Compositions and methods for immune repertoire sequencing | |
EP4353830A2 (en) | Methods of nucleic acid sample preparation for analysis of cell-free dna | |
US20230055712A1 (en) | Immune repertoire biomarkers in autoimmune disease and immunodeficiency disorders | |
CN109937254A (zh) | 核酸样品制备方法 | |
US20220073983A1 (en) | Compositions and methods for immune repertoire sequencing | |
US20230416810A1 (en) | Compositions and methods for immune repertoire monitoring | |
EP3768864A1 (en) | Immune repertoire monitoring | |
US20220282305A1 (en) | Methods of nucleic acid sample preparation | |
US20230340602A1 (en) | Compositions and methods for immune repertoire monitoring | |
US20230131285A1 (en) | Immune repertoire biomarkers for prediction of treatment response in autoimmune disease |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |