CN103097888A - 利用克隆型谱监测健康和疾病状态 - Google Patents

利用克隆型谱监测健康和疾病状态 Download PDF

Info

Publication number
CN103097888A
CN103097888A CN2011800331422A CN201180033142A CN103097888A CN 103097888 A CN103097888 A CN 103097888A CN 2011800331422 A CN2011800331422 A CN 2011800331422A CN 201180033142 A CN201180033142 A CN 201180033142A CN 103097888 A CN103097888 A CN 103097888A
Authority
CN
China
Prior art keywords
clonotype
sample
disease
cell
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800331422A
Other languages
English (en)
Other versions
CN103097888B (zh
Inventor
马利克·法哈姆
托马斯·威利斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adaptive Biotechnologies Corp
Original Assignee
Mlc Dx Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44903937&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN103097888(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Mlc Dx Inc filed Critical Mlc Dx Inc
Publication of CN103097888A publication Critical patent/CN103097888A/zh
Application granted granted Critical
Publication of CN103097888B publication Critical patent/CN103097888B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • G01N33/5047Cells of the immune system
    • G01N33/505Cells of the immune system involving T-cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • G01N33/5047Cells of the immune system
    • G01N33/5052Cells of the immune system involving B-cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Physiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

需要改进的用于明确患有病状的患者的诊断和预后的方法,尤其是针对自身免疫性疾病和癌症,特别是淋巴肿瘤,如淋巴瘤和白血病。本文提供了利用DNA测序鉴定淋巴肿瘤、自身免疫性疾病和其他病状患者中的个性化或患者特异性生物标记物的方法。鉴定的生物标记物可以用来确定和/或监测患有相关淋巴病状或自身免疫性疾病或其他病状的受试者的疾病状态。特别是,本发明提供了用于监测经历克隆进化的淋巴肿瘤的灵敏方法,而不需要针对作为患者特异性生物标记物的进化的或突变的克隆开发替代试验。

Description

利用克隆型谱监测健康和疾病状态
技术领域
本发明一般地涉及通过分子测量来监测个体的健康和疾病状况,更具体地涉及通过利用高通量DNA测序测量免疫系统分子谱(profile)来监测个体的健康和疾病状况。
背景技术
适应性免疫系统,包括体液(或B细胞介导的)应答和细胞毒性(或T细胞介导的)应答,已经进化为可以攻击其各自靶标上的特异性分子特征。出现一次针对特异性靶标的应答就能给宿主提供“记忆”,使其能够在相同目标再次出现时产生更强的应答。任何蛋白质或多糖通常都可作为某些适应性免疫应答细胞亚群或其产物的靶标,这些适应性免疫应答细胞亚群或其产物能识别靶标上特异性分子特征或表位。
由于自身免疫疾病涉及到适应性免疫系统的某些成分对自身靶标的识别,因此已检查了适应性免疫系统的各方面,来帮助此类疾病的诊断和预后。使用标准免疫学技术,通过寻找循环自身抗体,已对体液免疫系统进行了研究。已针对多种疾病鉴定了自身抗体,如抗核抗体、抗dsDNA抗体及类风湿因子。这些抗体可能本身不具有病理性,它们在体内识别的靶标也不一定与在体外检测的靶标相同;但是,它们的水平的检测有助于诊断,并且在一些情况下具有一定的预后和治疗意义。
另一种研究自身免疫性疾病和淋巴疾病中的适应性免疫系统的方法是基于适应性免疫细胞多样性的分析。适应性免疫细胞的激活导致其克隆增殖。通常通过从血液RNA或DNA扩增编码抗原识别区的核酸序列的部分来获得这种克隆增殖的证据。例如,用于扩增具有T细胞受体β链(类似于抗体重链)的特定V区段的序列的PCR引物可以用于扩增连接到特定V区段的J区段或J和D区段。当存在多样化的细胞群时,本来应该扩增具有大小略微不同的扩增子分布的片段,但克隆增殖会导致特定大小的扩增子被富集,并因此在凝胶上显示为更强烈的条带。在被称为“谱型分析(spectratyping)”的技术中,每个V区段与J和D区段一起扩增,来评估这些扩增子中的任一种是否表现为克隆增殖。
谱型分析方法的一个问题是许多不同的序列可能具有相同的长度而因此无法区分。因此,只有显著的克隆增殖才能通过谱型分析识别。需要改进自身免疫性疾病和自身免疫性疾病状态以及免疫系统在其中发挥核心作用的其他疾病的诊断和辅助预后的方法。
尽管在免疫系统谱分析(profiling)中额外的特异性可能有利于更好地预测免疫系统对人类健康的影响,但是如果开发出方法,使得即使以前从未观察到那些特定序列也能鉴定出参与疾病过程的特定T细胞和B细胞,将具有更大的实用性。免疫系统的极大的多样性为其提供了可能有用的细胞的巨大储备,但同时也对尝试将这种组库(repertoire)用于预测性目的的研究人员提出了挑战。任意靶向于抗原的单一序列是可能参与给定个体的疾病过程和/或与之相关的广大序列中的一个。能确定给定个体的许多细胞中的哪些细胞参与疾病过程的方法将对人类健康具有很大价值。
免疫细胞谱分析在癌症的诊断和治疗中也具有实用性。癌症的治疗经常涉及评估对治疗的响应以及监测疾病的复发。监测响应和癌症复发的最常用的方法是放射照相评估及血液生物标记。例如,在包括结肠癌在内的多种疾病中常用CT扫描来监测癌症的复发。同样,蛋白质生物标记,如PSA和CEA,是用于追踪前列腺癌和结肠癌的血液生物标记。特定基因组重排形成了另一种用于追踪癌细胞的引人注意的靶标。例如,在绝大多数慢性髓性白血病(CML)患者中存在的BCR-ABL易位已成为评估疾病状态的分析物。用PCR技术测定白血病细胞中的特异性易位及其顺从性允许产生高度特异性和灵敏性的检验,该检验现在常规用于监测CML患者。
免疫细胞(或克隆型)谱分析可用于产生淋巴肿瘤的标记物。淋巴细胞谱系的癌症是一组多样化的临床疾病,这些疾病通常反映已转化为癌细胞的细胞的发育阶段。急性淋巴细胞性白血病(ALL)最常出现在未成熟的淋巴细胞中。另一方面,多发性骨髓瘤(MM)出现在已分化为产生抗体的浆细胞中。同样,不同类型的淋巴瘤通常反映了不同细胞发育阶段。这些疾病发生在不同的年龄群体中,具有不同的预后和死亡率,并可以采用不同的方案进行治疗。
这些疾病通常采用化疗、放疗和/或骨髓移植进行治疗。随后根据具体临床情况通过不同的方法监测疾病的复发。这些方法包括使用标准血细胞计数及形态观察对血液和/或骨髓进行评估,使用细胞表面标记物的流式细胞术(FCM),蛋白质电泳,以及分子技术,如PCR和FISH。此外,通常利用如CT和PET扫描的放射照相研究来监测某些淋巴癌的复发。这些方法具有侵袭性(骨髓)、高费用及辐射风险,和/或缺乏灵敏性。
在一部分淋巴肿瘤中,存在对癌细胞具有特异性的某些分子标记,可用PCR以灵敏方式检测。例如,BCR-ABL存在于一部分ALL患者中,并且可作为监测肿瘤复发的标记物。遗憾的是,大多数患者不存在这类可灵敏且特异地检测复发的标记物。FCM可用于检测最小残留疾病(MRD),其对预后用途是有用的。在这种使用多色流激活细胞分选(FACS)的技术中,可借助于癌细胞具有的特定细胞表面标记物来鉴定癌细胞。在专家操作下,该技术的灵敏度局限在<10-4(10,000个正常细胞中有1个癌细胞),并且在某一时间点出现的标记物稍后可能会消失。因此,FCM通常无法用于在血液样品中检测早期复发。
PCR提供了一种用于检测特定序列的灵敏性方法,且已将其用于检测癌细胞的B细胞受体(BCR)或T细胞受体(TCR)的特定重排。此技术利用了在针对不同淋巴细胞产生独特序列的不完美重组事件后产生了淋巴细胞中的B细胞受体或T细胞受体这一事实。例如,TCR是由TCRα链和TCRβ链组成的。TCRα是通过将多个不同V区中的一个连接到多个J区中的一个而重组生成的。同样,TCRβ是通过先后产生一个V、D和J区段的重组而生成的。在这两种情况下,重组通常不是完美的,而且一些碱基可能被从种系区段序列中删除,并且可能添加其他碱基(称为N碱基和P碱基)。V区段和J区段之间的序列被称为NDN区。
于是这些序列可作为这些淋巴细胞及其子代的标签。由于这些重组事件也发生在最终变为恶性的细胞中,所以B细胞受体和T细胞受体的独特序列可作为检测癌细胞的标签。标签序列是患者特异性的,而且实际上由于克隆进化,同一患者的标签序列也可能发生变化。为了从患者的白血病细胞中确定T细胞受体或B细胞受体的序列,使用通常白血病克隆高度富集的诊断白血病样品。例如,从诊断样品中扩增T细胞受体DNA和/或B细胞受体DNA,并将产物在凝胶上电泳,该凝胶可基于大小分离DNA(有时称为“谱型分析”);或者备选地,可进行异源双链体分析。观察到的大小分布的很大程度的偏移表示单克隆增殖,随后可以通过对偏移的分离峰处的样品进行测序对其进行证实。如果没有这种随后的测序,往往很难确定这种偏移是具有单克隆起源还是多克隆起源,例如Van Dongen等人的美国专利公开2006/0234234。
一旦确定了序列标签,就可以利用使用Taqman探针的实时PCR来监测该序列的水平。NDN区的长度一般不足以包括PCR引物以及检测用寡核苷酸。因此,通常使用与V区和J区互补的PCR引物以及包括白血病克隆的某些NDN碱基的Taqman探针。这些引物提供了一定的特异性,因为他们只扩增了整个组库中的一部分。Taqman探针的杂交提供了针对特定克隆型的特异性。因此该试验的灵敏度通常不像其中引物对(使用或不使用Taqman探针)提供特异性的典型PCR(例如,BCR-ABL)中那样好。已经表明,对于某些序列的灵敏度可以高达10-5,但由序列与NDN区的至少一部分互补的Taqman探针所提供的杂交特异性可能显著地变差。考虑到某些探针的低灵敏度,该试验可能对特定患者中的任何重排都无效。先前还提到了克隆进化问题,这进一步降低了检测低水平白血病的可能性。此外,该技术还要求产生患者特异性Taqman探针以及将用作标准的模板,因此比较繁琐。这些患者特异性标准需要在每次检测患者样品时使用。患者间灵敏度的不一致、繁琐性以及获得对试验的适当控制的辅助工作大大限制了该技术的应用。因此需要产生可用于监测淋巴肿瘤患者复发的标记物。在一些实施方案中,在此公开的本发明允许开发一组非常通用、灵敏且特异的标记物,以使用免疫细胞测序来管理淋巴癌患者。
如果有用于评估个体克隆型谱的可用的试验,该试验比现有技术更灵敏且更全面,并且通常不需要制备个体化试剂就可应用,则对于许多领域来说将是有利的,尤其包括自身免疫性癌症和淋巴癌领域。
发明内容
本发明涉及使用基于序列的免疫组库谱或克隆型谱来检测并监测疾病或非疾病状况的方法。本发明在许多实施方案和应用中得到例证,其中一些总结如下并贯穿于整个说明书中。
一方面,本发明涉及一种监测疾病的方法,该方法包括以下步骤:(a)通过从疾病相关组织中的淋巴细胞样品确定克隆型谱来鉴定一种或多种与疾病相关的患者特异性克隆型,该样品包含来自于疾病相关组织的克隆型的组库;(b)从外周血细胞样品确定克隆型谱以确定一种或多种与疾病相关的患者特异性克隆型的存在、不存在和/或水平,该外周血样品包含克隆型的组库;以及(c)重复步骤(b)以监测患者的疾病或病状。在一个实施方案中,鉴定步骤进一步包括从同一患者的非疾病相关组织的淋巴细胞样品确定克隆型谱,并比较该克隆型谱与来自所述疾病相关组织的克隆型谱,以鉴定所述一种或多种患者特异性克隆型。可监测的疾病包括但不限于淋巴增生性疾病、实体瘤、感染性疾病以及自身免疫性疾病。组库的大小可取决于具体应用而变化很大;但在一个实施方案中,组库有99%的可能性包括以0.01%或更高的频率存在的来自个体的样品中的每一种克隆型。在其他实施方案中,组库有99%的可能性包括以0.001%或更高的频率存在的来自个体的样品中的每一种克隆型,
另一方面,本发明涉及一种监测患者中的疾病的方法,该方法包括以下步骤:(a)确定来自患有疾病的个体的淋巴细胞样品的克隆型谱,以及来自同一个体的、基于与疾病相关的细胞表面标记而富集的淋巴细胞样品的克隆型谱,从而鉴定一种或多种与该疾病相关的患者特异性克隆型,其中每个样品包含富集的或非富集的淋巴细胞群的克隆型的组库;(b)确定来自外周血细胞样品的克隆型谱中一种或多种患者特异性克隆型中的每一种的水平,该样品具有确定的体积且包含其克隆型的组库;以及(c)重复步骤(b)以监测该患者的疾病或病状。
在上述方法的进一步的实施方案中,从外周血细胞样品中确定组库的相应步骤进一步包括包含任何以前未记录的克隆型作为一种或多种患者特异性克隆性,该以前未记录的克隆型是该一种或多种患者特异性克隆型的系统发生克隆型。只要疾病是淋巴增生性疾病,这些实施方案的一种或多种患者特异性克隆型可进一步包括额外的癌症相关突变和基因重排,诸如通过本发明的方法容易地鉴定的V区替换(下文将更充分地描述)。
在另一方面,本发明进一步提供了一种同时测定样品中的淋巴细胞数量和克隆型表达水平的方法,该方法包括以下步骤:(i)从个体中获得包含T细胞和/或B细胞的样品;(ii)对源自所述细胞的基因组DNA的空间分离的个体分子进行测序,这些空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型;(iii)对源自所述细胞的RNA的空间分离的个体分子进行测序,这些空间分离的个体分子包含与它们在样品的淋巴细胞中的表达水平相对应的许多克隆型;以及(iv)对于每种克隆型,通过比较从源自所述细胞的基因组DNA的分离的个体分子确定的数量和从源自所述细胞的RNA的分离的个体分子确定的数量,来确定该样品的淋巴细胞中的克隆型表达水平。
除其他优势外,本发明通过提供基于序列的、以更高灵敏度测定与疾病或健康状况相关的克隆型的方法,克服了现有技术中的一些缺陷。本发明进一步提供了此类可应用于任何患者而无需制备个体化的或患者特异性的试剂的通用型试验。这些进步在自身免疫性和淋巴癌领域中具有特别有用的应用。在后一领域中,本发明还提供了试验和监测方法,这些试验和监测方法不仅能检测和追踪极低水平的疾病相关克隆型,还能检测和追踪经过修饰从而将会逃过现有方法的检测的此类克隆型。后一特征极具价值,例如,在监测淋巴癌中的最小残留疾病中。
以上表述的本发明的这些方面以及其他方面,在所说明的许多实施方案和应用中得到例证,其中一些在附图中示出,并在随后的权利要求书部分进行描述。然而上述概述并非旨在描述所说明的本发明的每个实施方案或每个实施方式。
附图说明
本发明的新颖特征在随附的权利要求中具体阐述。通过参考以下对在其中利用到本发明原理的示例说明性实施方案加以阐述的详细描述和附图,获得对本发明的特征及优点的更好的理解,在附图中:
图1A是本发明的一种用于确定克隆型谱的方法的一个实施方案的流程图。
图1B图示了发生在由B细胞产生的免疫球蛋白中的体细胞突变的相对分布。
图2A-2B示出了用于扩增TCRβ基因的两阶段PCR方案。
图3A图示了使用图2A-2B的方案扩增的PCR产物,该PCR产物将要进行二次PCR,以添加用于基于Solexa的测序的桥接扩增和测序引物结合位点。图3B图示了确定图3A的PCR产物的核苷酸序列的一个实施方案的细节。图3C图示了确定图3A的PCR产物的核苷酸序列的另一实施方案的细节。
图4A图示了在一个反应中从一条IgH链产生三个测序模板的PCR方案。图4B-4C图示了在三个独立反应中从一条IgH链产生三个测序模板的PCR方案,之后将产生的扩增子组合在一起进行二次PCR以插入P5和P7引物结合位点。图4D图示了针对IgH链产生的序列阅读的位置。图4E图示了使用V区和J区的密码子结构来改善NDN区中的碱基判定。
图5示出了证实本发明的多重PCR的再现性的数据。
图6示出了证明本发明的多重PCR引入最小扩增偏差(bias)的数据。
图7A示出了使用Accuprime和对应于500ng RNA的cDNA作为输入模板,两个重复样品中每种克隆型的频率的log10值。
图7B描述了使用对应于500ng RNA的cDNA作为输入模板以及Accuprime(X轴)或高保真度Taq(Y轴),每种克隆型的频率的log10值。
图7C示出了使用对应于50ng RNA的cDNA作为输入模板以及Accuprime(X轴)或高保真度Taq(Y轴),每种克隆型的频率的log10值。
图8示出了来自样品的TCRβ分子的数量。图8A和8B示出了从基因组DNA扩增IgH的数据。
图9示出了表明根据本发明的多重扩增具有最小扩增偏差的数据。
图10示出了对比两个个体的克隆型的数据。
发明详述
本发明的一个方面利用新一代测序技术评估淋巴细胞群中TCR或BCR重排的水平。这些测序技术能够以合理的成本从样品中获得100万或更多的阅读。使用这些技术以特定的方式仍可检测到以1/1,000,000或更低频率存在的克隆型。从血液或骨髓DNA样品可以完成多重扩增,以扩增基因或转录本的特定部分的所有不同类型序列。例如,为了扩增IgH序列,与所有已知V区段及等位基因互补的数种引物可以和与所有J区段及等位基因互补的数种引物一同使用。图1A图示了这样一种方法的步骤,该方法用于采用一类DNA测序仪(例如Solexa合成测序法,如下所述)对样品的克隆型进行谱分析的实施方案。获得含有B细胞或T细胞的样品(100),之后提取DNA或RNA,并在反应中进行扩增(102),该反应优先扩增克隆型并为后续扩增和测序而连接末端序列。被扩增的克隆型的个体分子随机分布在固体表面(104),如玻璃表面上,该固体表面已配置为允许在原位进行第二次扩增以产生各个体分子的克隆群(或聚合酶克隆
(polonies))(106)。随后,例如,使用合成测序技术对各聚合酶克隆分子进行测序(108),之后将序列的类型和丰度制成表格以形成克隆型谱(110),或相应的组库谱。可在不同序列之间几乎没有扩增偏差地执行该方法。可以扩增来自TCRβ和IgH基因的RNA,在不同V引物的效率方面仅有很小的差异,从而验证了对DNA进行相同操作的可能性。该方案可以改善用于检测低水平TCR和/或BCR重排的实时读出的问题。
通过计数统计学(即,通过增加细胞和测序样品大小来增强灵敏度)以及等效扩增(即,具有不同序列的克隆型可在多重扩增反应如PCR中进行无显著偏差的扩增,如下文中所述)来确定灵敏度。由于灵敏度最终受计数统计学的限制,所以为了获得更高的灵敏度,可获得更多的细胞(即更大的样品)以及更多的测序阅读。当有足够的测序阅读时,灵敏度受样品中淋巴细胞数量的限制。相比之下,实时PCR测定的灵敏度受背景的限制。此外,可以通过对诊断用白血病样品或淋巴瘤样品进行测序来确定患者特异性克隆。一旦确定了克隆型,就可在后续时间点确定其在样品中的水平。在一些优选的实施方案中,不需要患者特异性探针或引物,或不需要利用患者特异性模板作为标准。而是在患者特异性克隆之后,为每个患者存储关于相关序列的数据,且同样的试验适用于所有患者。
一般来说,本发明的一些实施方案包括将核酸测序技术应用于监测适应性免疫细胞的组库从而对免疫系统进行谱分析的任务的方法。生成的免疫系统谱可用于疾病和病症的诊断,以及用于疾病和病症状态的诊断。本发明的免疫谱分析方法可用于监测疾病和病症以及评估对疾病和病症的治疗。适用于本发明的方法的疾病和病症包括自身免疫性疾病,包括系统性红斑狼疮(SLE)、多发性硬化症(MS)、类风湿关节炎(RA)和强直性脊柱炎(AS)。本发明的方法可用于移植排斥及免疫老化的诊断、监测和治疗。此外,本发明的免疫谱分析方法可用于诊断、监测和治疗与免疫系统相关的其他疾病,包括癌症和传染病。
对个体扩增分子进行测序可以区分不同序列,并因此具有检测克隆增殖中的定量变化的灵敏性。一般来说,在本发明的一个实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法。该方法可包括以下步骤,包括从受试者中分离样品、一轮或多轮核酸扩增、空间分离个体核酸以及对核酸进行测序。所述核酸可以是DNA或RNA。T细胞和/或B细胞中的重组DNA序列可称为克隆型。
一方面,提供了一种用于确定受试者或个体中的一种或多种相关克隆型的方法。另一方面,提供了一种用于开发可预测来自患病受试者的任意样品中的一种或多种相关克隆型的算法的方法。另一方面,提供了一种使用可预测来自受试者的任意样品中的一种或多种相关克隆型的算法来发现个体的一种或多种相关克隆型的方法。另一方面,提供了一种用于产生计算疾病活动性评分的算法的方法。另一方面,提供了一种用于监测个体的疾病状态的方法。
T细胞和B细胞组库的谱分析对于具有炎症性方面的疾病是有价值的。这种炎症通常是由自身免疫和/或超敏反应引起的。这些疾病包括心血管疾病、阿尔茨海默病和先兆子痫。炎症还与包括肥胖症和糖尿病在内的异常代谢状态相关。还存在其他炎症相关性疾病。在本发明的一个方面中,利用多个正向引物或多个反向引物,通过PCR扩增重组B细胞核酸的区段,以产生一组嵌套模板(参见图4A和图4B及其以下说明)。来自该组的模板可在表面上进一步扩增以形成独立的扩增子(例如通过使用cBot仪器(Illumina,San Diego,CA)的桥接PCR)。来自同一嵌套组的模板可通过在它们的共同末端产生的序列阅读彼此相互关联。嵌套组模板允许将错误率相对较高的测序化学用于分析比其他方式所允许的更长的序列,而同时在整个序列长度上保持高平均质量评分。即使V区经历体细胞超突变,嵌套组也能确保从V区获得至少一次序列阅读。在一个实施方案中,测序化学可用于分析高度可变的核酸,诸如IgH分子,其错误率不好于以下数据:0.2%的序列阅读在位置1-50含有至少一个错误;0.2-1.0%的序列阅读在位置51-75含有至少一个错误;0.5-1.5%的序列阅读在位置76-100含有至少一个错误;1-5%的序列阅读在位置101-125含有至少一个错误。在另一个实施方案中,对测序引物结合位点进行定位,以便在延伸时它们生成一系列序列阅读,其中除了最后一个以外,每个序列阅读与其紧邻的下游引物结合位点和/或序列阅读重叠,从与使用单个长模板产生单个长序列阅读相比,提供更高质量评分的连续序列覆盖。
I、本发明的进一步的方面及实施方案
本发明的其他方面及实施方案包括以下各项:提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,空间分离来自所述细胞的基因组DNA的个体分子,对所述空间分离的基因组DNA的个体分子进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,空间分离来自所述细胞的基因组DNA的个体分子,扩增所述基因组DNA的个体分子,对所述扩增的DNA进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,扩增来自所述细胞的基因组DNA,空间分离所述扩增的DNA的个体分子,对扩增的DNA的所述空间分离的个体分子进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,扩增来自所述细胞的基因组DNA,空间分离所述扩增的DNA的个体分子,再扩增所述扩增的DNA分子,对所述再扩增的DNA分子进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中重组的DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品,将来自所述细胞的RNA逆转录为cDNA,空间分离所述cDNA的个体分子,任选地再扩增所述空间分离的cDNA的个体分子,对所述cDNA和/或再扩增的cDNA进行测序,以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括:从受试者获得含有T细胞和/或B细胞的样品;空间分离所述样品中的个体细胞;对来自所述细胞的个体核酸分子进行测序;以及确定来自所述样品的不同序列的水平从而产生所述重组DNA序列谱。在一个实施方案中,所述扩增和/或再扩增包含PCR、多重PCR、TMA、NASBA或LAMP。在另一实施方案中,所述空间分离包括在固相支持体上以两个维度分离所述DNA或cDNA,在含有微团的溶液中以三个维度分离所述DNA或cDNA,或使用微反应室分离分子。在另一实施方案中,所述扩增和/或再扩增是通过含有亚克隆的DNA或cDNA的细菌的生长、DNA或cDNA在玻片上的扩增或DNA或cDNA在微珠上的扩增而实现的。在另一实施方案中,所述测序包括双脱氧测序。在另一实施方案中,所述测序包括利用可逆末端标记的核苷酸进行的合成测序。在另一实施方案中,所述测序包括对核苷酸掺入时的焦磷酸释放的检测。在另一实施方案中,所述测序包括与标记的寡核苷酸探针库的等位基因特异性杂交。在另一实施方案中,所述测序包括利用与标记的寡核苷酸探针库的等位基因特异性杂交及随后连接所述探针的合成测序。在另一实施方案中,所述测序包括实时监测聚合步骤中标记的核苷酸的掺入。在另一实施方案中,所述重组DNA序列包含T细胞受体基因和/或免疫球蛋白基因。在另一实施方案中,所述测序包括对免疫球蛋白和/或T细胞受体基因的全部克隆序列的亚群进行测序。在另一实施方案中,所述全部克隆序列的亚群包含免疫球蛋白或T细胞受体基因的V-D连接、D-J连接、免疫球蛋白或T细胞受体基因的全部可变区、抗原识别区或互补决定区3(CDR3)。在另一实施方案中,所述T细胞受体基因包含T细胞受体β基因。在另一实施方案中,所述免疫球蛋白基因包含免疫球蛋白重链基因。在另一实施方案中,所述扩增或再扩增包含多个与V区段互补的引物以及一个与C区段互补的引物。在另一实施方案中,所述扩增或再扩增包含多个与V区段互补的引物以及多个与C区段互补的引物。在另一实施方案中,所述多个与V区段互补的引物包含针对每个V区段的至少三个不同的引物,并且所述多个与C区段互补的引物包含至少1个、至少2个、至少3个、至少4个、至少5个或至少6个引物。在另一实施方案中,所述T细胞或B细胞是总T细胞和B细胞的亚群。在另一实施方案中,所述T细胞的亚群是CD4+、CD8+细胞或CD27高细胞。在另一实施方案中,所述样品包含至少10,000个、至少500,000个、至少750,000个或至少1,000,000个T细胞。在另一实施方案中,所述测序包括每运行一次有至少1000次阅读、每运行一次有至少10,000次阅读、每运行一次有至少100,000次阅读或每运行一次有至少1,000,000次阅读。在另一实施方案中,所述测序包括每次阅读产生约30bp、约40bp、约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约110bp或约120bp。在另一实施方案中,所述样品是当受试者处于自身免疫性疾病的爆发状态时采集的。在另一实施方案中,所述样品是从患有或疑似患有系统性红斑狼疮的受试者中采集的。另一方面,提供了一种用于确定受试者中的一种或多种相关克隆型的方法,该方法包括:通过对来自受试者的至少一种样品的空间分离的个体分子进行核酸测序,产生一种或多种克隆型谱,其中所述至少一种样品与疾病的第一状态相关,以及基于该一种或多种克隆型谱来确定该受试者中的一种或多种相关克隆型。在一个实施方案中,所述至少一种样品来自疾病累及的组织。在另一实施方案中,所述一种或多种相关克隆型的确定包括比较来自至少两种样品的克隆型谱。在另一实施方案中,所述疾病的第一状态是疾病的高峰状态。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态存在。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态不存在。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态很高。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态很低。在另一实施方案中,所述样品包含T细胞和/或B细胞。在另一实施方案中,所述T细胞和/或B细胞包含T细胞和/或B细胞的亚群。在另一实施方案中,通过与标记物相互作用而富集所述T细胞和/或B细胞的亚群。在另一个实施方案中,所述标记物是T细胞和/或B细胞的亚群上的细胞表面标记物。在另一实施方案中,所述T细胞和/或B细胞的亚群与在疾病中特异性存在的抗原相互作用。在另一实施方案中,所述疾病是系统性红斑狼疮或多发性硬化症。另一方面,提供了一种用于开发能够预测来自患病受试者的任意样品中的一种或多种相关克隆型的算法的方法,该方法包括:a)从一组样品产生多个克隆型谱,其中所述样品与该疾病相关,b)鉴定来自该组样品的一种或多种克隆型,c)使用在b)中鉴定的一种或多种克隆型的序列参数和/或功能数据来开发能够预测来自患病受试者的任意样品中的相关克隆型的算法。在一个实施方案中,该组样品取自一种或多种受疾病累及的组织。在另一实施方案中,所述一种或多种相关克隆型的鉴定包括比较来自至少两种样品的克隆型谱。在另一实施方案中,所述功能数据包括T细胞和/或B细胞表面上的标记物的结合能力,或T细胞和/或B细胞与抗原的相互作用。在另一实施方案中,所述序列参数包含核酸序列和预测的氨基酸序列。在另一实施方案中,所述样品来自处于疾病的高峰阶段的一个或多个个体。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态存在。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态处于高水平。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态处于低水平。在另一实施方案中,所述一种或多种相关克隆型在疾病的高峰状态不存在。在另一实施方案中,所述疾病是系统性红斑狼疮或多发性硬化症。在另一实施方案中,提供了一种用于发现个体的一种或多种相关克隆型的方法,该方法包括:将来自个体的样品的克隆型谱输入算法中,并使用该算法来确定该个体的一种或多种相关克隆型。在一个实施方案中,提供了一种能够预测来自患病受试者的任意样品中的一种或多种相关克隆型的算法,所述算法是通过以下步骤开发得到的:a)从一组样品产生多个克隆型谱,其中所述样品与所述疾病相关,b)鉴定来自该组样品的一种或多种相关克隆型,c)使用在b)中鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发能够预测患病受试者的任意样品中的相关克隆型的算法。在一个实施方案中,所述样品是在疾病的高峰状态时采集的。在另一实施方案中,所述样品取自受疾病累及的组织。另一方面,提供了一种用于产生计算疾病活动性评分的算法的方法,该方法包括:开发一种使用一组因素将相关克隆型的水平组合为疾病活动性评分的算法,比较该疾病活动性评分和关于疾病状态的临床数据,并优化所述因素以便最大化临床数据与疾病活动性评分之间的关系。在一个实施方案中,提供了用于监测个体的疾病状态的方法,该方法包括:a)确定来自个体的样品的克隆型谱,b)将来自a)的克隆型谱信息输入计算疾病活动性评分的算法中,其中所述算法是通过开发一种使用一组因素将相关克隆型的水平组合为疾病活动性评分的算法而产生的,比较该疾病活动性评分和关于疾病状态的临床数据,并优化所述因素以便最大化临床数据与疾病活动性评分之间的关系,以及c)使用计算疾病活动性评分的算法来产生能预测个体的疾病状态的评分。在另一实施方案中,用于监测个体的疾病状态的方法还包括确定个体中的一种或多种相关克隆型,以及将该一种或多种相关克隆型的信息输入算法中。在另一实施方案中,所述确定个体中的一种或多种相关克隆型包括:a)通过对来自受试者的至少一种样品的空间分离的个体分子进行核酸测序产生一种或多种克隆型谱,其中所述至少一种样品与疾病的第一状态相关,以及b)基于该一种或多种克隆型谱来确定受试者中的一种或多种相关克隆型。在另一实施方案中,所述确定个体中的一种或多种相关克隆型包括:a)将来自个体的样品的克隆型谱输入可预测一种或多种相关克隆型的算法中,其中所述可预测一种或多种相关克隆型的算法通过以下步骤开发得到:i)从一组样品产生多个克隆型谱,其中所述样品与疾病相关,ii)鉴定来自该组样品的一种或多种相关克隆型,iii)使用在ii)中鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发可预测来自患病受试者的任意样品中的相关克隆型的算法,以及c)使用可预测一种或多种相关克隆型的算法来确定该个体的一种或多种相关克隆型。在另一实施方案中,所述疾病是系统性红斑狼疮或多发性硬化症。在另一实施方案中,提供了一种确定一种或多种相关的T细胞或B细胞克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞的至少一个分子参数来富集来自该受试者的另一细胞样品,d)通过对来自受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集的样品和未富集的样品中发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,分子参数为细胞表面标记物。在另一个实施方案中,通过使用固相固定的亲和性标记物捕获细胞来实现富集。在另一实施方案中,所述固体表面是一组微珠。在另一实施方案中,固体表面是柱。在另一实施方案中,用荧光部分标记标记物。在另一实施方案中,通过采用荧光标记的流式细胞术来实现富集。在另一实施方案中,所述细胞是B淋巴细胞,并且通过使用与B细胞受体结合的抗原来实现富集。在另一实施方案中,通过其上固定有抗原的固体表面的捕获来实现富集。在另一实施方案中,所述抗原用于标记B淋巴细胞,并且通过使用该标记的流式细胞术来实现富集。在另一个实施方案中,所述细胞是T淋巴细胞,并且使用允许标记和用流式细胞术富集与特异性抗原反应的T细胞的方法来实现富集。在另一实施方案中,T细胞用细胞内细胞因子染色法进行标记。在另一实施方案中,T细胞用细胞因子捕获法进行标记。在另一实施方案中,分子参数是能够结合至少一种特异于病原体的抗原的B细胞受体。在另一实施方案中,分子参数是能够结合至少一种特异于病原体的抗原的T细胞受体。在另一实施方案中,所述样品取自在第一时间点暴露于病原体的患者。另一方面,提供了一种用于确定个体中与对病原体的免疫反应相关的一组克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与至少一种病原体抗原相结合的能力来富集来自该受试者的另一个细胞样品,d)通过对来自受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集样品和未富集样品中发生改变的克隆型来确定至少一种相关克隆型。另一方面,提供了一种用于确定个体中与对肿瘤的免疫反应相关的一组克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自该受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与存在于肿瘤中的至少一种自身抗原结合的能力来富集来自该受试者的另一细胞样品,d)通过对来自该受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,e)基于其在样品中的丰度已在富集样品和未富集样品之间发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,相关克隆型的水平用于评估个体患有肿瘤的风险。在另一实施方案中,已知所述抗原存在于已在该个体中出现的肿瘤中,并且所述相关克隆型用于评估肿瘤复发的风险。在另一实施方案中,已知所述抗原存在于其他个体的肿瘤中,并且所述相关克隆型用于评估在之前未检查出肿瘤的患者中癌症的风险。另一方面,提供了一种用于确定个体中的一组克隆型的方法,所述克隆型与针对因器官受损而释放到血流中的物质的免疫反应相关,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自该受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与至少一种存在于受损器官中的自身抗原结合的能力来富集来自该受试者的另一个细胞样品,d)通过对来自该受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集样品和未富集样品之间发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,相关克隆型的水平用于评估个体的器官损伤的风险。另一方面,提供了一种用于确定个体中与对治疗剂的免疫反应相关的一组克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自该受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与治疗剂中含有的至少一种抗原结合的能力来富集来自该受试者的另一个细胞样品,d)通过对来自该受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集样品和未富集样品之间发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,相关克隆型的水平用于评估个体对治疗剂表现出超敏反应的风险。另一方面,提供了一种用于确定个体中与对动脉斑块的免疫反应相关的一组克隆型的方法,该方法包括:a)将来自受试者的细胞样品分成至少两个样品,b)通过对来自该受试者的一个细胞样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,c)基于细胞与至少一种存在于动脉斑块中的抗原结合的能力来富集来自该受试者的另一细胞样品,d)通过对来自该受试者的富集样品的单独空间分离的分子进行核酸测序而产生一种或多种克隆型谱,以及e)基于其在样品中的丰度已在富集样品和未富集样品之间发生改变的克隆型来确定至少一种克隆型。在另一实施方案中,相关克隆型的水平用于评估个体患心血管疾病的风险。在另一实施方案中,相关克隆型的水平用于评估动脉斑块不稳定的风险。另一方面,描述了一种用于确定在淋巴肿瘤相关的细胞中发现的序列识别符的方法,该方法包括:a)从已知存在癌细胞的受影响的个体中获得细胞样品,b)通过对来自该样品中细胞的单独空间分离的分子进行核酸测序而产生一种或多种与至少一种免疫细胞基因组重排相关的克隆型谱,c)将与肿瘤相关的克隆型的序列确定为序列识别符。在另一实施方案中,样品来自患者的骨髓。在另一实施方案中,样品来自患者的血液。在另一实施方案中,样品来自实体淋巴瘤的活组织检查。在另一实施方案中,免疫细胞基因组重排是B细胞中IgH的VDJ重排。在另一实施方案中,免疫细胞基因组重排是B细胞中IgH的DJ重排。在另一实施方案中,免疫细胞基因组重排是B细胞中IgK的VJ重排。在另一实施方案中,免疫细胞基因组重排是B细胞中IgL的VJ重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRβ的VDJ重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRβ的DJ重排。在另一个实施方案中,免疫细胞基因组重排是T细胞中TCRα的VJ重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRλ的VJ重排。在另一个实施方案中,免疫细胞基因组重排是T细胞中TCRδ的VDJ重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRδ的VD重排。在另一实施方案中,免疫细胞基因组重排是T细胞中TCRδ的VD重排。在另一实施方案中,免疫细胞基因组重排是IgH的J区段易位到基因组的另一区域。在另一实施方案中,免疫细胞基因组重排是任意J区段易位到基因组的另一区域。在另一实施方案中,根据克隆型频率进行对肿瘤相关克隆型的鉴定。在另一实施方案中,根据克隆型频率对肿瘤相关克隆型进行鉴定。在另一实施方案中,通过检测交叉谱系重排进行对肿瘤相关克隆型的鉴定。在另一实施方案中,通过鉴定无功能重排进行对肿瘤相关克隆型的鉴定。在另一个实施方案中,通过将细胞克隆型与至少一种肿瘤相关分子标记物相关联进行对肿瘤相关克隆型的鉴定。另一方面,描述了一种确定个体中的循环淋巴瘤细胞水平的方法,所述个体的肿瘤已经与独特的序列识别符在涉及到的第一时间点相关联,该方法包括:a)从患者获得细胞样品,b)通过对来自该样品中的细胞的单独空间分离的分子进行核酸测序而产生一种或多种与至少一种免疫细胞基因组重排相关的克隆型谱,c)根据与序列识别符相关的克隆型水平确定肿瘤细胞的水平。另一方面,描述了一种用于确定个体中的循环淋巴瘤细胞水平的方法,所述个体的肿瘤已经与独特序列识别符在涉及到的第一时间点相关联,该方法包括:a)从患者获得细胞样品,b)基于至少一种分子标记物富集细胞,c)通过对来自该样品中的细胞的单独空间分离的分子进行核酸测序而产生一种或多种与至少一种免疫细胞基因组重排相关的克隆型谱,d)根据与序列识别符相关的克隆型水平确定肿瘤细胞的水平。在另一实施方案中,样品是血液样品。在另一实施方案中,样品是骨髓样品。在另一实施方案中,样品是淋巴样品。在另一实施方案中,样品是组织样品。在另一实施方案中,荧光标记细胞并用流式细胞术富集。在另一实施方案中,通过结合到固相支持体来富集细胞。在另一实施方案中,所述克隆型被定义为含有独特序列识别符的克隆型。在另一实施方案中,所述克隆型被确定为可能由序列识别符突变和重排得到的那些克隆型。在另一实施方案中,循环肿瘤细胞水平和/或循环肿瘤细胞水平的变化用于一算法中以产生与具有临床肿瘤复发的风险相关的评分。在另一实施方案中,循环肿瘤细胞水平和/或循环肿瘤细胞水平的变化用于作出治疗决定。
II、确定克隆型谱的方法
本发明的方法可用于产生来自受试者的样品中的重组DNA序列谱或克隆型谱。在一个实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从所述细胞中分离基因组DNA的个体分子,对分离的基因组DNA的个体分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。
在另一个实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从所述细胞中分离基因组DNA的个体分子,扩增基因组DNA的个体分子,对扩增的DNA进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。
在另一实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从细胞扩增基因组DNA,分离扩增的DNA的个体分子,对分离的扩增DNA的个体分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。
在另一实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从细胞扩增基因组DNA,分离扩增的DNA的个体分子,对扩增的DNA分子进行再扩增,对再扩增的DNA分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。
在另一实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从所述样品中分离RNA,逆转录来自所述细胞的RNA以形成cDNA,分离所述cDNA的个体分子,任选地再扩增所述cDNA,对所述分离的所述cDNA或再扩增DNA的个体分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。
在另一实施方案中,提供了一种用于确定T细胞和/或B细胞中的重组DNA序列谱的方法,该方法包括从受试者获得含有T细胞和/或B细胞的样品,从所述样品中分离RNA,对RNA个体分子进行测序,以及确定样品中不同序列的水平以产生所述重组DNA序列谱。
受试者及样品
本发明的方法可使用来自受试者或个体(例如,患者)的样品。受试者可以是患者,例如,患有自身免疫性疾病的患者。受试者可以是患有传染病或癌症(诸如白血病或淋巴瘤)的患者。受试者可以是哺乳动物,例如人类。受试者可以是雄性或雌性。受试者可以是婴儿、儿童或成年人。在一些实施方案中,受试者不再存活。在一些实施方案中,受试者是活着的。受试者可以是曾经暴露于生物武器的个体。
受试者还可以是非人类动物。所述非人类动物可以是家养宠物或农场动物。所述非人类动物可以是狗、猫、牛、马、羊或猪。所述非人类动物可以是克隆的动物。所述非人类动物可能涉及药物生产。
本发明的方法中所用的样品可包括,例如,来自受试者的体液,包括环绕胎儿的羊水、房水、胆汁、血液及血浆、耵聍(耳垢)、考珀液或射精前液、乳糜、食糜、女性喷射液、间隙液、淋巴、经血(menses)、母乳、黏液(包括鼻涕和痰)、胸膜液、脓液、唾液、皮脂(皮肤油)、精液、血清、汗液、泪液、尿液、阴道润滑液、呕吐物、水、粪便、包括环绕脑的脑脊液和脊髓在内的内部体液、环绕骨关节的滑液、细胞内液即细胞内的液体以及眼球中的液体玻璃体液。在一个实施方案中,样品是血液样品。血液样品可以为约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5或5.0mL。当受试者患有多发性硬化症时,样品可以是脑脊液(CSF);当受试者患有类风湿关节炎时,样品可以是滑液;当受试者患有系统性狼疮,样品可以是皮肤(或其他器官)活检组织。在一个实施方案中,可从最可能反映病理学的可获得的体液/组织鉴定克隆型,随后监测来自不同体液,例如,血液的克隆型的水平。样品还可包括在其中已经溶解了生物材料的溶剂。可在疾病不活动时对样品进行分析。可在疾病活动时对样品进行分析。可在疾病不活动时获得样品。可在疾病活动时获得样品。样品可由医疗服务人员,例如,内科医师、内科医师助理、护士、兽医、皮肤科医生、风湿科医生、牙医、医务辅助人员或外科医生来获得。样品可由研究技术员获得。样品可由受试者提供。样品可匿名提供。样品可通过邮寄提供。样品可由执法机构或调查员提供。可从受试者获得不只一种样品。
样品可以是活检组织,例如皮肤活检组织。所述活检组织可以来自,例如,脑、肝脏、肺、心脏、结肠、肾脏或骨髓。本领域技术人员所用的任何活检技术都可用于从受试者分离样品。例如,活检可以是开放性活检,其中采用全身麻醉。活检可以是闭合性活检,其中形成比开放性活检更小的切口。活检可以是中心活检或切开活检,其中切除组织的一部分。活检可以是切除活检,其中尝试切除整个病变。活检可以是细针抽吸活检,其中用针移除组织样品或液体样品。
样品可以从受试者遗留的身体物质获得。这种丢弃的物质可包括人类废弃物。丢弃的物质还可包括脱落的皮肤细胞、血液、牙齿或毛发。
样品可包括免疫细胞,例如,免疫细胞可包括T细胞和/或B细胞。T细胞(T淋巴细胞)包括,例如,表达T细胞受体的细胞。T细胞包括辅助型T细胞(效应型T细胞或Th细胞)、细胞毒性T细胞(CTL)、记忆T细胞和调节性T细胞。样品在一些应用(例如确定相关T细胞的校准试验)中可包括单个细胞,或更普遍地包括至少1,000个、至少10,000个、至少100,000个、至少250,000个、至少500,000个、至少750,000个或至少1,000,000个T细胞。
B细胞包括,例如,血浆B细胞、记忆B细胞、B 1细胞、B2细胞、边缘区B细胞以及滤泡B细胞。B细胞可表达免疫球蛋白(抗体,B细胞受体)。样品在一些应用(例如确定相关B细胞的校准试验)中可包括单个细胞,或更普遍地包括至少1,000个、至少10,000个、至少100,000个、至少250,000个、至少500,000个、至少750,000个、或至少1,000,000个B细胞。
样品可包括核酸,例如,DNA(例如,基因组DNA或线粒体DNA)或RNA(例如,信使RNA或微小RNA)。所述核酸可以是无细胞DNA或RNA,例如从循环系统提取的,Vlassov等人,Curr.Mol.Med.,10:142-165(2010);Swarup等人,FEBS Lett.,581:795-799(2007)。在本发明的方法中,来自受试者的可进行分析的RNA或DNA的量包括,例如,在一些应用(例如校准试验)中少至单个细胞,以及多达1千万个细胞或更多,相当于6pg-60μg的DNA,和约1pg-10μg的RNA。
如下文更充分地讨论的(“定义”部分),淋巴细胞样品足够大,使得基本上每个具有独特克隆型的T细胞或B细胞在其中都有代表,从而形成组库(本文中使用该术语)。在一个实施方案中,采集样品,该样品有99%的概率包含以0.001%或更高的频率存在的群体的每一种克隆型。在另一个实施方案中,采集样品,该有99%的概率包含以0.0001%或更高的频率存在的群体的每一种克隆型。在一个实施方案中,B细胞或T细胞样品包括至少50万个细胞,而在另一实施方案中,该样品包括至少100万个细胞。
每当取样材料来源(诸如,临床研究样品或类似样品)稀缺时,可通过非偏差技术,诸如全基因组扩增(WGA)和多重置换扩增(MDA)或类似技术来扩增来自材料的DNA,例如,Hawkins等人,Curr.Opin.Biotech.,13:65-67(2002);Dean等人,Genome Research,11:1095-1099(2001);Wang等人,Nucleic Acids Research,32:e76(2004);Hosono等人,Genome Research,13:954-964(2003)等等。
特别感兴趣的是血液样品,尤其是在监测诸如淋巴瘤、白血病等淋巴样肿瘤中,且血液样品可用常规技术获得,例如Innis等人编,PCR Protocols(Academic Press,1990)等。例如,可用常规技术,例如RosetteSep试剂盒(Stem Cell Technologies,Vancouver,加拿大),从血液样品中分离白细胞。血液样品的体积范围可为100μL-10mL;在一个方面,血液样品的体积范围是200或100μL-2mL。随后可用用于本发明方法的常规技术例如DNeasy血液和组织试剂盒(Qiagen,Valencia,CA)从该血液样品中提取DNA和/或RNA。任选地,白细胞的亚群,例如淋巴细胞,可用常规技术进一步分离,例如荧光激活细胞分选(FACS)(Becton Dickinson,San Jose,CA)、磁激活细胞分选(MACS)(Miltenyi Biotec,Auburn,CA)等。
在其他实施方案中,分析来自细胞亚群样品的核酸。可采用例如通过细胞表面标记分离细胞的方法。例如,可通过细胞分选流式细胞术、流式分选、荧光激活细胞分选(FACS)、基于微珠的分离诸如磁性细胞分选(MACS,例如,利用抗体包被的磁性颗粒)、基于大小的分离(如筛子、障碍物阵列或过滤器)、微流体装置分选、基于抗体的分离、沉降、亲和吸附、亲和提取或密度梯度离心来分离细胞。可通过激光捕获显微切割来纯化细胞。分选可以基于细胞大小、形态学或细胞内部标准记物或细胞外标记物进行。分离或分选肿瘤细胞的方法在以下文献中都有描述,例如,Nagrath S.等人(2007)Nature 450:1235-1239;美国专利号6008002、7232653和7332288;PCT公开号WO2008157220A1;以及美国专利申请号US20080138805A1和US20090186065;以及Rosenberg R.等人(2002)Cytometry 49:150-158,其中每一个都通过引用全文并入本文。
所述细胞亚群可以是T细胞和/或B细胞的亚群。所述T细胞的亚群可以是CD4+细胞、CD8+细胞或CD27细胞。用于标记和/或分离众多的T细胞和B细胞亚群的抗体混合物可从供应商处购得,如Quest Diagnostic(San Juan Capistrano,CA);Dako(丹麦)等。以下为疾病相关亚群可用的试剂盒的实例(其中列出了抗体的抗原特异性:B淋巴细胞性白血病/淋巴瘤前体(CD 19、CD79a(细胞质的)、CD20、CD 10、TDt、HLADR、CD34、IgM(细胞质的));弥漫性大B细胞淋巴瘤(CD20、CD 19、CD22、CD79a、CD30);滤泡性淋巴瘤(CD20、CD 10、CD 10、BCL2、BCL6);套细胞白血病(CD19、CD20、CD5、CD23-、BCL1);等等。
荧光激活细胞分选(FACS)利用光散射和荧光特性来分选细胞。使用例如与荧光染料偶联的核酸探针或抗体可赋予细胞荧光性质。细胞悬液可形成流动的液流。细胞流形成每滴含有大约一个细胞的液滴。在液流形成液滴之前,测量每个细胞的荧光特性。在荧光强度测量前,充电环上具有一种电荷,而当液滴从液流中分离时,在液滴上携带了相反的电荷。带电的液滴通过两个高电压偏转板,该高电压偏转板将液滴根据他们的电荷转至不同容器中。电荷可直接施加于液流,且分离的液滴保留了与液流相同符号的电荷。之后在液滴分离后液流回到中性。
直接或间接免疫荧光法可用于FACS中。在直接免疫荧光法中,抗体与免疫染料直接偶联。在间接免疫荧光法中,不标记第一抗体,而第二抗体与免疫染料偶联。
由于在每个个体的适应性免疫细胞的DNA以及与之相关的RNA转录本鉴定重组中,在本发明的方法中可对RNA或DNA二者之一进行测序。来自编码T细胞受体或免疫球蛋白分子的T细胞或B细胞重组序列或其一部分被称为克隆型。所述DNA或RNA可对应于T细胞受体(TCR)基因或编码抗体的免疫球蛋白(Ig)基因的序列。例如,所述DNA和RNA可对应于编码TCR的α、β、γ或δ链的序列。在大多数T细胞中,所述TCR是由α链和β链组成的异二聚体。TCRα链是通过VJ重组产生的,而β链受体是通过V(D)J重组产生的。对于TCRβ链而言,人类有48个V区段、2个D区段和13个J区段。在两个连接点中的每一个都可以删除多个碱基,而添加其他碱基(称为N核苷酸和P核苷酸)。在少数T细胞中,TCR由γ链和δ链组成。TCRγ链是通过VJ重组产生的,而TCRδ链是通过V(D)J重组产生的(Kenneth Murphy,Paul Travers和Mark Walport,Janeway′s Immunology第7版,Garland Science,2007,通过引用全文并入本文)。
在本发明方法中所分析的DNA或RNA可对应于编码具有恒定区(α、δ、ε、γ或μ)的重链免疫球蛋白(IgH)或具有恒定区λ或κ的轻链免疫球蛋白(IgK或IgL)的序列。每个抗体具有两个相同的轻链和两个相同的重链。每个链由恒定(C)区和可变区组成。对重链而言,可变区由可变(V)区段、多样性(D)区段和连接(J)区段组成。编码这些区段中每种类型的几个独特序列存在于基因组中。特定VDJ重组事件发生在B细胞发育期间,使该细胞产生特定重链。轻链的多样性以相似的方式产生,只是没有D区,所以只是VJ重组。体细胞突变经常发生在重组位点附近,导致多个核苷酸的添加或删除,进一步增加了由B细胞产生的重链和轻链的多样性。由B细胞产生的抗体的可能的多样性是不同重链和轻链的产物。重链和轻链的可变区有助于形成抗原识别(或结合)区或位点。可在出现针对某表位的特异性应答之后发生的体细胞超突变过程增加了这种多样性。
如上所述,根据本发明,可以选定引物以产生从淋巴细胞中提取的重组核酸亚群的扩增子。此类亚群在此可被称为“体细胞重排区”。体细胞重排区可包含来自发育中的或发育完全的淋巴细胞的核酸,其中发育中的淋巴细胞是免疫基因重排未完成从而未形成具有完整V(D)J区的分子的细胞。典型的不完全体细胞重排区包括不完全IgH分子(诸如,仅包含D-J区的分子)、不完全TCRδ分子(诸如,仅包含D-J区的分子)以及无活性的IgK(例如,包含Kde-V区)。在第一条染色体形成了有效重排的发育完全的免疫细胞中,也可以见到与第二条染色体相关的不完全重排。
控制样品量并估算细胞数
如下文在“克隆型”和“组库”的定义中进一步描述的,足够的细胞采样是解释组库数据的一个重要方面。例如,从1000个细胞开始,产生试验灵敏的最低频率,该频率与测序阅读数目无关。因此,本发明的一方面是开发对输入免疫受体分子的数量进行定量的方法。该方法已应用于TCR和IgH序列。在任何一种情况下,采用一组能扩增所有不同序列的引物。为了获得绝对拷贝数,与具有已知免疫受体拷贝数的标准物一起执行使用多重引物的实时PCR。与小鼠疫苗接种实施例相关的实时PCR数据的实例在图9中示出。这种实时PCR测量可从扩增反应开始进行,所述扩增反应随后被测序,或者可对同一样品的另一份进行这种实时PCR测量。至于DNA,重排免疫受体分子的绝对数可以很容易地转换为细胞数(2倍内,因为某些细胞将会评估特异性免疫受体的2个重排拷贝而其他细胞只评估1个)。至于cDNA,可对所测量的实时样品中重排分子的总数进行推断,以确定在同一样品的另一个扩增反应中使用的这些分子的总数。此外,可将该方法与确定RNA总量的方法相结合,从而假设特定的cDNA合成效率,确定单位量(假设1μg)的RNA中重排免疫受体分子的数量。如果测定cDNA的总量,则无需考虑cDNA合成的效率。如果细胞数也是已知的,则可计算每个细胞的重排免疫受体拷贝。如果细胞数是未知的,则可从总RNA估算细胞数,因为特定类型的细胞通常产生相似量的RNA。因此,从每1μg中重排免疫受体分子的拷贝,可以估算每个细胞中这些分子的数量。
与测序反应分开进行实时PCR的一个缺点是可能存在抑制效果,该抑制效果在实时PCR中与另一个反应中不同,因为可能使用不同的酶、输入DNA以及其他条件。针对测序而处理实时PCR产物可以改善该问题。然而,实时PCR的低拷贝数可能是因为拷贝数低或由于抑制效果或反应中其他欠佳的条件。
可以利用的另一方法是将已知量的序列已知的独特免疫受体重排分子,即,已知量的一种或多种内部标准,加入到未知量的样品的cDNA或基因组DNA中。将添加的已知序列与同一样品中的其余序列相比较,获得相对分子数,可以估算最初cDNA样品中重排免疫受体分子的数量(这种分子计数技术是众所周知的,例如,Brenner等人,美国专利号7,537,897,通过引用并入本文)。如果还采用了实时PCR校准,则添加的独特序列的测序数据可用于区分不同的可能性。DNA(或cDNA)中低拷贝数的重排免疫受体将会产生掺入序列(spikedsequence)与样品其余序列的分子数之间的高比例。另一方面,如果通过实时PCR所测的低拷贝数是因为反应的效率低,该比例则不会高。
一方面,本发明提供了用于在细胞水平上测量克隆型表达的方法。即,如上文所述,克隆型可用于淋巴细胞计数,因此,通过测量来源于基因组DNA的克隆型以及来源于RNA的相同克隆型,可以确定基于细胞的克隆型表达。一种用于同时测量样品中的淋巴细胞数和克隆型表达水平的方法可包括以下步骤:(a)从个体获得含有T细胞和/或B细胞的样品;(b)对来自所述细胞的基因组DNA的空间分离的个体分子进行测序,这些空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型;(c)对来源于所述细胞RNA的空间分离的个体分子进行测序,这些空间分离的个体分子包含与其在样品的淋巴细胞中的表达水平相对应的许多克隆型;以及(d)对于每种克隆型,通过比较从来源于所述细胞基因组DNA的分离的个体分子所确定的数量和从来源于所述细胞RNA的分离的个体分子所确定的数量,来确定在样品淋巴细胞中的克隆型表达水平。采用市售的试剂盒,诸如AllPrep DNA/RNA小型试剂盒(Qiagen GmbH,德国),可以很容易地从同一样品中提取基因组DNA和RNA。如上所述,在一个实施方案中,确定步骤还包括通过将已知量的内部标准加至所述基因组DNA来确定所述样品中淋巴细胞的所述数量。在另一实施方案中,例如其中样品是外周血,样品有确定的体积,使得能够确定所述淋巴细胞在所述样品中的浓度。通常,这一确定体积的范围是1mL-50mL,更通常是1mL-10mL。在另一实施方案中,将从来源于RNA的分离的个体分子确定的克隆型数量除以从来源于所述基因组DNA的分离的个体分子确定的克隆型的数量,比较来源于基因组DNA和RNA的相同克隆型的数量。通过使用标记,尤其是在样品制备过程中连接的寡核苷酸标签,可在同一测序运行中很容易地将该两组克隆型区分开来。对基于Solexa的测序而言,这些标记可与用于鉴定不同样品的标签合并,所述鉴定例如是通过将单个核苷酸加入标签中以指示DNA或RNA,或简单地使用额外的标签,使得每个患者样品都被两个标签标记,一个是针对基因组DNA部分,另一个是针对RNA部分。因此,对所述来源于所述RNA的空间分离的个体分子进行测序的步骤可包括用指示其RNA来源的第一标记物标记每个所述空间分离的个体分子;并且对所述来源于所述基因组DNA的空间分离的个体分子进行测序的步骤可包括用指示其基因组DNA来源的第二标记物标记每个所述空间分离的个体分子,以使第一标记物能与第二标记物区别开来。在一个实施方案中,此类标记物是通过测序鉴定的独特的寡核苷酸标签。
同样,本发明可用于同时(即,基于对单个样品的测量)提供淋巴细胞数和克隆性。这样的实施方案可通过以下步骤实施:(a)从个体获得含有T细胞和/或B细胞的样品;(b)对来源于所述细胞的核酸的空间分离的个体分子进行测序,这些空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型;(c)从空间分离的个体分子的数量来确定淋巴细胞的数量;(d)确定空间分离的个体分子的不同序列的丰度,从而生成克隆型谱以及基于此的克隆性的度量。来自淋巴细胞的核酸可以是基因组DNA和/或RNA;然而优选地,所述核酸是基因组DNA。与上述类似地,在一个实施方案中,确定所述数量的步骤还包括通过将已知量的内部标准加至所述基因组DNA来确定所述样品中淋巴细胞的所述数量。同样,当样品是外周血样品时,其有确定的体积,从而可以确定所述样品中所述淋巴细胞的浓度。在上述的一些实施方案中只采用B细胞,而在其他实施方案中只采用T细胞。
核酸群的扩增
如下文所述,可通过多种扩增技术产生目标核酸群的扩增子。在本发明的一个方面,用多重PCR来扩增核酸混合物的成员,特别是含有重组免疫分子诸如T细胞受体、B细胞受体或其部分的混合物。在以下通过引用并入本文的参考文献中可以找到进行此类免疫分子的多重PCR的指导:Morley的美国专利5,296,351;Gorski的美国专利5,837,447;Dau的美国专利6,087,096;Von Dongen等人的美国专利公开2006/0234234;欧洲专利公开EP 1544308B1;等等。上述参考文献描述了称为“谱型分析”的技术,该技术中通过多重PCR扩增免疫分子群,之后,例如,通过电泳将得到的扩增子的序列进行物理分离,以确定是否存在占优势的大小的类别。这一类别可能指示淋巴细胞的主要克隆群,后者又可指示疾病状态。在谱型分析中,重要的是选择具有很少或没有交叉反应性的引物(即,不会退火到其他引物的结合位点上的引物);否则,扩增子中会出现错误的大小类别表现形式。在本发明中,只要群体的核酸被一致地扩增,则引物的交叉反应性是可以允许的,因为在本发明中分析了所扩增的核酸的序列,而不只是它们的大小。如下文更充分描述的,在一方面,空间上分离个体核酸分子的步骤如下实现:使用各自具有不与靶序列互补的尾部的正向及反向引物对预选的体细胞重排区或其部分(即靶序列)进行初次多重扩增,从而产生第一扩增子,该第一扩增子的成员序列在各末端具有允许进一步操作的共同序列。例如,所述共同末端可包括引物结合位点用于连续扩增或用于个体分子在固体表面上的桥接扩增,该连续扩增仅使用一种正向引物及一种反向引物而不是使用多种正向引物和反向引物。此类共同末端可加到如上所述的单个扩增中,或可将它们加到两步程序中,从而避免与用长引物(例如,50-70个碱基或更长)混合物进行制备和运行质量控制有关的困难。在这样的两步法(下文将更充分地描述,并在图4A-4B中说明)中,如上所述进行初次扩增,不同之处是限制引物尾部的长度以仅在第一扩增子序列末端提供正向和反向引物结合位点。之后,使用特异于这些引物结合位点的二次扩增引物进行二次扩增,以将进一步的序列加至第二扩增子的末端。二次扩增引物具有不与靶序列互补的尾部,该尾部形成第二扩增子的末端,并可与第二扩增子的克隆型测序一起使用。在一个实施方案中,此添加的序列可包括用于产生测序阅读的引物结合位点,以及用于在固体表面上进行桥接PCR以产生空间分离的个体分子的克隆群的引物结合位点,例如,在使用基于Solexa的测序时。在后一种方法中,将来自第二扩增子的序列样品置于附着有能够退火到样品序列的互补寡核苷酸的固体表面,之后实施引物延伸、变性、退火的循环直至形成模板的克隆群。优选地,选定样品的大小以便(i)使其包括原样品中克隆型的有效表现形式,和(ii)使固体表面上克隆群的密度在允许对克隆型进行明确序列确定的范围内。
除了确保样品含有足够的细胞以代表原样品以外,通过多重PCR反应产生的扩增子能代表反应中的细胞也很重要。为了实现这一目的,应选定引物条件以便在反应中每个细胞的都发生扩增。
TCR或BCR序列或其部分可在多重反应中从核酸扩增出来,所述多重反应使用至少一种退火到C区的引物以及一种或多种能退火到一个或多个V区段的引物(如图2A-2B和图4A-4B所示,以及如下文更充分讨论的)。在多重反应中退火到V区段的引物数可为,例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80。在多重反应中退火到V区段的引物数可为,例如10-60、20-50、30-50、40-50、20-40、30-40或35-40。引物可退火到不同V区段。对于IgH基因,由于V区段中体细胞突变的可能性,可以使用能退火到各V区段的多种引物;例如每个V区段1、2、3、4或5个引物。在多重反应中退火到C区段的引物数可包括,例如,至少1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在多重反应中退火到C区段的引物数可为1-10、2-9、3-8、4-7、3-8或3-6。可如实施例3或实施例4所述发生TCR或免疫球蛋白基因的扩增。
要扩增的区域可包括全部克隆序列或克隆序列的亚群,包括免疫球蛋白或T细胞受体基因的V-D连接和D-J连接、免疫球蛋白或T细胞受体基因的全部可变区、抗原识别区或CDR,例如互补决定区3(CDR3)。
TCR或免疫球蛋白序列可用初次和二次扩增步骤进行扩增。每个不同的扩增步骤可包含不同的引物。不同引物可引入免疫基因序列中原来不存在的序列。例如,扩增过程可将新的引物结合位点加至靶序列的末端,以将多重扩增转换为单重扩增,或者扩增过程可将一种或多种标签加至扩增的TCR或免疫球蛋白序列的5’端和/或3’端(如图3A-3C所示)。标签可以是促进扩增的DNA的后续测序的序列。标签可以是促进扩增的序列结合到固相支持体上的序列。
其他扩增方法可不采用V区中的任何引物。而是可使用来自C区段的特异性引物,而在另一侧(5’)使用通用引物。可在cDNA合成中通过不同方法附加通用引物例如已有详细描述的链交换法。类似地,可在cDNA生成后通过包括连接在内的不同方法附加通用引物。
可用于本发明的方法中的扩增核酸的其他手段包括,例如,逆转录PCR、实时PCR、定量实时PCR、数字PCR (dPCR)、数字乳液PCR(dePCR)、克隆PCR、扩增片段长度多态性PCR(AFLP PCR)、等位基因特异性PCR、组装PCR、不对称PCR(其中对所选链使用大大过量的引物)、菌落PCR、解旋酶依赖型扩增(HDA)、热启动PCR、反向PCR(IPCR)、原位PCR、长PCR(DNA延伸大于约5千个碱基)、多重PCR、嵌套式PCR(使用一对以上的引物)、单细胞PCR、降落PCR、环介导等温PCR(LAMP)以及基于核酸序列的扩增(NASBA)。其他扩增方案包括:连接酶链反应、分支DNA扩增、滚环扩增、环到环扩增、SPIA扩增、通过捕获和连接的目标扩增(TACL)以及RACE扩增。
可通过使用逆转录将样品中的RNA信息转化为cDNA。根据常规方案,在逆转录反应中可使用polyA引物、随机引物和/或基因特异性引物。
扩增基因组DNA(或通过逆转录RNA扩增cDNA形式的核酸)之后,可分离个体核酸分子,任选地进行再扩增,然后进行单独测序。示例性的扩增方案可见于van Dongen等人,Leukemia,17:2257-2317(2003)或van Dongen等人美国专利公开2006/0234234,这些都通过引用并入本文。简单来说,示例性的方案如下:反应缓冲液:ABI缓冲液II或ABI Gold缓冲液(Life Technologies,San Diego,CA);最终反应体积为50L;100ng样品DNA;各10pmol的引物(需进行调整来平衡如下所述的扩增);终浓度为200μM的dNTPs;终浓度为1.5mM的MgCl2(需根据靶序列及聚合酶进行优化);Taq聚合酶(1-2U/管);循环条件:在95℃预活化7min;在60℃退火;循环时间:变性30s;退火30s;延伸30s。
在本发明的方法中,可用于扩增的聚合酶是市售的,包括,例如,Taq聚合酶、AccuPrime聚合酶或Pfu。可以基于是优选保真度还是效率,来选择要使用的聚合酶。
用于从合并物中分离核酸的方法包括在固体基质(例如,载玻片)上在两个维度上空间分离分子,在具有微团的溶液中在三个维度上空间分离分子(例如可以在将或不将分子固定在诸如微珠之类的固体表面上的情况下使用油乳剂来实现),或者使用例如在微流体或纳米流体芯片中的微反应室。可利用稀释来确保在给定体积、空间区域、微珠或反应室内平均存在一个分子。关于这些分离个体核酸分子的方法的指导可在以下文献中找到:Sambrook,Molecular Cloning:ALaboratory Manual(Cold Spring Harbor Laboratory Press,2001s);Shendure等人,Science,309:1728-1732(包括增补材料)(2005);美国专利6,300,070;Bentley等人,Nature,456:53-59(包括增补材料)(2008);美国专利7,323,305;Matsubara等人,Biosensors&Bioelectronics,20:1482-1490(2005);美国专利6,753,147;等等。
可在起始步骤中利用实时PCR、picogreen染色、纳米流电泳(如LabChip)或紫外吸收测量来判断可扩增材料的发挥功能的量。
用于核酸再扩增的方法包括用核酸转化的分离菌落的细菌生长、玻片上的扩增(例如,PCR集落(聚合酶克隆))以及微珠上的扩增(如在乳液PCR中)。可利用相同的方法扩增和再扩增核酸,或者可利用不同的方法扩增和再扩增核酸。
在某些实施方案中,亚克隆步骤包括通过扩增或连接步骤将通用引物连接到DNA或RNA上的步骤。之后该引物用于扩增克隆,并作为测序引物杂交的识别序列(例如,如图2A-2B和图4A-4B所示,以及如下文中更充分讨论的)。
在一个方面,进行多重扩增,以使起始群中序列的相对量与扩增群或扩增子中的相对量基本上相同。也就是说,在一个样品群的成员序列间进行最小扩增偏差的多重扩增。在一个实施方案中,如果扩增子中各相对量是其在起始样品中的数值的五倍以内,那么这些相对量基本上相同。在另一实施方案中,如果扩增子中各相对量是其在起始样品中的数值的两倍以内,那么这些相对量基本上相同。如下文更充分讨论的,PCR中的扩增偏差可以用常规技术检测并修正,以便可选择一组PCR引物用于预定的可提供任何样品的无偏差扩增的组库。
对于许多基于TCR或BCR序列的组库,多重扩增任选地使用所有V区段。对反应进行优化以试图使得扩增反应保持由不同V区段引物扩增的序列的相对丰度。一些引物是相关联的,并因此许多引物可能“串扰”,扩增与其不完全匹配的模板。优化条件,以便各模板可以相似的方式扩增,而不论是用那个引物扩增。换言之,如果有两个模板,那么经过1,000倍扩增后,两个模板可被扩增约1,000倍,并且对于其中一个模板,一半的扩增产物由于“串扰”而携带不同的引物也不要紧。在对测序数据的后续分析中,从分析中消除引物序列,因此在扩增时使用何种引物都没有关系,只要模板同等地得到扩增。
由于mRNA生成的cDNA群中每个模板的量是未知的,所以可使用克隆型的cDNA群的单重PCR产生一组标准物。对于TCRβ克隆型的组库执行该操作。34次该PCR(在单独的反应中,使用实施例3中的引物)的每一次的产物包括多种具有一个V引物的序列。对不同产物进行仔细定量以产生一组相同浓度的标准物。使用所有34种引物的合并物,并用此引物合并物和每种标准物序列作为模板进行34次实时PCR。理想地,不存在偏差,所有34种标准物显示同等的实时PCR扩增效率。这提示,即使串扰的存在使人们不清楚何种引物执行了该扩增,但每个序列都同等地得到扩增。这种优化与不论引入到扩增产物中的实际引物如何都具有同等扩增的目标是一致的。提高总引物合并物浓度显著地减低提高扩增效率可能导致的变化范围。此外,对于看起来可比平均值更高效扩增的模板,其完全匹配的引物在合并物中的浓度降低。相反地,对于无法高效扩增的模板,其完全匹配的引物的浓度升高。这种优化表明所有模板的扩增在平均扩增的两倍以内。
还可以通过进行两阶段扩增(如图2A-2B中所示)来避免扩增偏差,其中在第一阶段或初次阶段,利用尾部不与靶序列互补的引物进行少量扩增循环。该尾部包括被添加到初级扩增子序列末端的引物结合位点,以便这些位点在仅使用一个正向引物和一个反向引物的第二阶段扩增中使用,从而消除引起扩增偏差的主要原因。优选地,初次PCR将进行足够少的循环数(例如5-10)以最小化不同引物造成的差异扩增。二次扩增用一对引物完成,因此差异扩增的问题是最少的。1%的初次PCR直接进入二次PCR。两次扩增中使用的35个循环(相当于无100倍稀释步骤的约28个循环)足以显示稳健的扩增,而不论循环是否分解为如下循环:1个初次循环和34个二次循环,或25个初次循环和10个二次循环。尽管理想的是在初次PCR中只运行一次循环就可降低扩增偏差,但是还有其他考虑因素。其中一个方面是代表性。这在起始输入量不超过最终获得的阅读数时起作用。例如,如果获得1,000,000个阅读,并起始于1,000,000个输入分子,则从100,000个分子中仅取一个代表进行二次扩增会降低估算原样品中不同种类的相对丰度的精确度。两步之间的100倍的稀释意味着代表性降低,除非初次PCR扩增产生显著多于100个的分子。这表明可采用最少8个循环(256倍),但更适合的是10个循环(约1000倍)。该方法的备选方案是取多于1%的初次PCR进行二次PCR,但由于初次PCR所用的引物浓度高,可以利用高稀释倍数来确保这些引物不会干扰扩增并恶化序列间的扩增偏差。另一备选方案是增加纯化或酶促步骤,以消除来自初次PCR的引物,以允许其较少的稀释。在此实例中,初次PCR为10个循环,而二次PCR为25个循环。
多重PCR的重现性可用以下方式评估,正如实施例2的测试引物组所例证的。使用测试引物组,例如,合并的TCRβ引物和C引物(实施例2中的)以及一个作为模板的cDNA样品,进行两个初次PCR反应。利用实时PCR评估每个扩增的模板的相对丰度。用两种扩增产物的每一种作为模板,在每个反应中用C引物和一种V引物进行34种不同的实时PCR反应。图5中示出的数据表明,针对两种样品使用所有V引物通过实时PCR确定的相对丰度是高度可重复的,从而表明多重扩增是高度可重复的。以一个多重扩增产物为模板的每个实时PCR扩增的循环数(Ct值)在X轴上示出,而以第二多重扩增产物为模板的每个实时PCR扩增的循环数绘于Y轴上。
一组引物的扩增偏差量可用以下程序评估,该程序用实施例2中的引物组进行了例证。该测试引物组(如上)用于扩增作为模板的cDNA(例如,从由淋巴细胞中提取的mRNA获得的)。用实时PCR确定用34种不同引物中的每一种(与C区段引物一起)扩增的模板量,并将该量与使用相同引物扩增cDNA的量进行比较。由于即使扩增产物内部序列之间的相对丰度和cDNA相同也可能存在串扰,所以只有扩增的显著差异才可用该读出值检测出来。可通过合成引物集合来扩增大量起始cDNA序列的内部片段而测试这种可能性。例如,设计了12种寡核苷酸,当它们与C区段引物一起使用时,能够扩增上述V区段引物的内部序列。如果存在最小扩增偏差,那么这些内部序列的浓度在起始cDNA和扩增产物之间应当几乎没有变化。来自该实例的数据在图6中示出。其中采用cDNA样品作为模板,用合并的PCRβ引物和C引物(来自实施例2)进行多重扩增。利用C引物及下游内部引物对来自多重扩增的模板材料进行初次扩增。类似地,利用实时PCR评估cDNA中这些相同序列的相对丰度。如果多重扩增具有任何显著偏差,则扩增材料中的相对丰度将与cDNA中的相对丰度有很大的差异。如图6中可见,观察到高相关性,表明多重扩增中的最小扩增偏差。使用内部引物以及作为模板的cDNA和多重扩增产物进行的每个实时PCR扩增的循环数(Ct值)分别在X轴和Y轴上示出。
初次扩增可以由DNA或RNA(例如,转化为cDNA之后)进行。
核酸群测序
任何可用于核酸测序的高通量技术都可用于本发明的方法中。DNA测序技术包括利用标记的终止剂或引物和平板或毛细管凝胶分离的双脱氧测序反应(Sanger法)、利用标记的可逆终止核苷酸的合成测序、焦磷酸测序、454测序、等位基因与标记的寡核苷酸探针库的特异性杂交、利用等位基因与标记克隆库的特异性杂交随后进行连接的合成测序、在聚合步骤中对标记的核苷酸的加入的实时监测、聚合酶克隆测序以及SOLiD测序。最近通过利用聚合酶或连接酶的连续或单个延伸反应以及通过与探针库的单个或连续差异杂交证明了对分离的分子的测序。这些反应已对许多克隆序列并行进行,包括在超过1亿个序列的当前商业应用中并行展示。因此,这些测序方法可用于研究T细胞受体(TCR)和/或B细胞受体(BCR)的组库。在本发明的一个方面中,采用高通量测序方法,该方法包括在固体表面上空间分离个别分子的步骤,在该固体表面上对它们进行并行测序。此类固体表面可包括无孔表面(诸如在Solexa测序中,例如Bentley等人,Nature,456:53-59(2008)或全基因组测序,例如Drmanac等人,Science,327:78-81(2010)),可包括微珠结合的或颗粒结合的模板的阵列孔(诸如454测序,例如Margulies等人,Nature,437:376-380(2005)或IonTorrent测序,美国专利公开2010/0137143或2010/0304982)、微机械加工膜(诸如SMRT测序,例如Eid等人,Science,323:133-138(2009))或微珠阵列(如SOLiD测序或聚合酶克隆测序,例如Kim等人,Science,316:1481-1414(2007))。另一方面,这些方法包括将所分离的分子在固体表面上进行空间分离之前或之后,对它们进行扩增。在前的扩增可包括基于乳液的扩增,诸如乳液PCR扩增或滚环扩增。特别受关注的是基于Solexa的测序,其中个体模板分子在固体表面上进行空间分离,之后通过桥接PCR进行并行扩增,以形成单独的克隆群或簇,然后进行测序,如Bentley等人(如上文所引用)以及制造商的说明书(例如,TruSeqTM Sample Preparation Kit and Data Sheet,Illumina,Inc.,San Diego,CA,2010)中所述;并在以下通过引用并入本文的参考文献中有进一步的描述:美国专利6,090,592;6,300,070;7,115,400;以及EP0972081B1。在一个实施方案中,置于固体表面并在固体表面扩增的个体分子形成簇,该簇具有至少为105个簇/cm2的密度;或至少为5x105/cm2的密度;或至少为106个簇/cm2的密度。在一个实施方案中,采用具有相对较高的错误率的测序化学法。在这些实施方案中,由这些化学法产生的平均质量评分是序列阅读长度的单调下降函数。在一个实施方案中,这种下降相当于0.5%的序列阅读在位置1-75含有至少一个错误;1%的序列阅读在位置76-100含有至少一个错误;和2%的序列阅读在位置101-125含有至少一个错误。
一方面,对于来自个体的每个样品,在本发明方法中使用的测序技术每运行一次产生至少1000种克隆型的序列;另一方面,该技术每运行一次产生至少10,000种克隆型的序列;另一方面,该技术每运行一次产生至少100,000种克隆型的序列;另一方面,该技术每运行一次产生至少500,000种克隆型的序列;另一方面,该技术每运行一次产生至少1,000,000种克隆型的序列。又一方面,该技术每运行一次对于每个个体样品产生100,000至1,000,000种克隆型的序列。
本发明的方法中使用的测序技术每次阅读可产生约30bp、约40bp、约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约110bp、约120bp、约150bp、约200bp、约250bp、约300bp、约350bp、约400bp、约450bp、约500bp、约550bp或约600bp。
本发明的方法中使用的测序技术每次阅读可产生至少30、40、50、60、70、80、90、100、110、120、150、200、250、300、350、400、450、500、550或600bp。一方面,个体的基于序列的克隆型谱利用以下步骤获得:(a)从个体的T细胞和/或B细胞中获得核酸样品;(b)空间分离来源于该核酸样品的个体分子,所述个体分子含有嵌套组模板,每个模板由样品中的核酸产生且每个模板含有体细胞重排区或该重排区的一部分,每个嵌套组能产生多种序列阅读,每个阅读沿相同方向延伸,并且每个阅读从产生嵌套组的核酸上的不同位点开始;(c)对所述空间分离的个体分子进行测序;以及(d)确定来自核酸样品的核酸分子的不同序列的丰度以产生克隆型谱。在一个实施方案中,测序步骤包括针对每种嵌套组产生多种序列阅读。在另一实施方案中,每个体细胞重排区包含V区和J区,并且多种序列阅读中的每一种都从V区的不同位点开始,并在与其相关的J区方向延伸。在另一实施方案中,测序步骤包括对每个空间分离的个体分子进行双向测序,以产生至少一个正向序列阅读和至少一个反向序列阅读。对于后一个实施方案,至少一个正向序列阅读和至少一个反向序列阅读具有重叠区域,以便通过这些序列阅读间的反向互补关系来确定该重叠区的碱基。在又一个实施方案中,每个体细胞重排区包含V区和J区,并且测序步骤还包括从一个或多个正向序列阅读和至少一个反向序列阅读确定每个个体核酸分子的序列,该序列阅读从J区中的位点开始并在与其相关的V区方向延伸。在另一实施方案中,个体分子包含选自完整IgH分子、不完整IgH分子、完整IgK分子、完整IgK非活性分子、TCRβ分子、TCRγ分子、完整TCRδ分子和不完整TCRδ分子的核酸。在另一实施方案中,测序步骤包括产生具有单调下降的质量评分的序列阅读。对于后一个实施方案,单调下降的质量评分使得序列阅读具有不高于以下的错误率:0.2%的序列阅读在碱基位置1-50含有至少一个错误;0.2-1.0%的序列阅读在位置51-75含有至少一个错误;0.5-1.5%的序列阅读在位置76-100含有至少一个错误。
正如下文对组库的定义中所述,可对免疫球蛋白或T细胞受体基因的不同预定区进行测序。在一些实施方案中,可对可变区的全部序列进行测序,以鉴定并量化克隆型。
可对全部克隆序列的独特亚群进行测序。在一些实施方案中,对包含VD连接和JD连接的核苷酸进行测序,以独特地鉴定并量化克隆型。在其他实施方案中,可进行测序的片段是全部可变区。在又一实施方案中,对抗原识别区或互补决定区3(CDR3)进行测序。可扩增含有全部CDR3或全部可变区的片段,以允许对包含V、D和J区段的部分的CDR3进行测序。
在一个实施方案中,仅对CDR3进行扩增和测序。CDR3的扩增和测序可以通过使用对一个或多个V区段序列特异的引物(以及位于C区段中扩增子另一侧的一个或多个引物)完成。用于每个V区段的引物可用于扩增序列的全部组库的一个或多个扩增反应。随可在扩增或不扩增的情况下,混合并分离该序列的组库,并利用任何所述测序技术进行测序。当在单独试管中用各种V引物进行扩增时,由于PCR饱和度,可将携带不同V区段的分子数“标准化”。例如,如果一个特定V区段的一个或多个克隆增殖导致其代表性高于其他片段,这一信息可被清除或减少,因为针对每个片段的PCR反应可能被迫饱和或趋于饱和,。实时PCR可用于量化每种V区段存在多少。可对全部CDR3进行测序,或对CDR3序列亚群进行测序。
在一个实施方案中,仅对克隆型亚群进行分析。这可通过用该克隆型亚群特异性的引物(例如,V区段特异性的引物)进行扩增而完成。通过提供完全连通性的连续长阅读的测序,可鉴定独特的克隆型。在一些实施方案中,当存在数种感兴趣的序列时,仅跨越一个连接点的短阅读长度可产生对特定克隆型而言不是唯一的而是多种克隆型之间共享的简并标签。例如,跨越V/J连接点的测序可将所有具有相同V/J(无论D区段如何)的序列混在一起作为一种克隆型。例如,关于所有区段的完全连通性的信息使得可能具有相同V和J区段但与不同D区段相连的序列被区分开来。
从序列数据确定克隆型
在本发明的一个方面,可通过结合来自一个或多个序列阅读(如,沿着选定链的V(D)J区)的信息来确定克隆型的序列(包括但不限于来源于IgH、TCRα、TCRβ、TCRγ、TCRδ和/或IgLκ(IgK)的序列)。另一方面,通过结合来自多个序列阅读的信息来确定克隆型的序列。(如文中所用的“序列阅读”是通过测序技术产生的一系列数据,由该数据确定核苷酸的序列。通常,序列阅读是通过例如利用DNA聚合酶或DNA连接酶沿核酸模板延伸引物而得到的。通过记录与此延伸相关的诸如光学、化学(例如pH变化)或电信号等信号而产生数据。)该多种序列阅读可包括一个或多个沿着有义链的序列阅读(即“正向”序列阅读)以及一个或多个沿着其互补链的序列阅读(即“反向”序列阅读)。当沿着同一链产生多个序列阅读时,首先通过使用针对序列阅读的不同位置而选定的引物扩增样品分子来产生单独的模板。在图4A中阐述了此概念,其中采用引物(404、406和408)在单一反应中产生扩增子(分别是410、412和414)。此类扩增可在同一反应或单独的反应中进行。一方面,无论何时采用PCR,单独的扩增反应都用于产生单独的模板,该单独的模板转而合并在一起并用于产生沿着同一链的多个序列阅读。后一方法对于避免需要平衡引物浓度(和/或其他反应参数)以确保多个模板的均衡扩增(本文中有时称为“平衡扩增”或“无偏差扩增”)来说是优选的。图4B-4C中图示了在单独反应中模板的产生。其中含有IgH的样品(400)被分成三份(472、474和476),加入到使用J区引物(401)和V区引物(分别是404、406和408)的单独PCR中,以产生扩增子(分别是420、422和424)。后一种扩增子随后在使用P5和P7引物的二次PCR(480)中合并(478),以制备用于桥接PCR和在Illumina GA测序仪或类似仪器上进行测序的模板(482)。
本发明的序列阅读可能有很多不同的长度,这部分取决于所采用的测序技术。例如,对于某些技术,在实施过程中可能要有一些权衡,例如:(i)每个模板的序列阅读的数量和长度,和(ii)测序运行的成本和持续时间。在一个实施方案中,序列阅读在20到400个核苷酸的范围内;在另一实施方案中,序列阅读在30到200个核苷酸的范围内;在又一实施方案中,序列阅读在30到120个核苷酸的范围内。在一个实施方案中,为了确定每个克隆型的序列要产生1至4个序列阅读;在另一实施方案中,为了确定每个克隆型的序列要产生2至4个序列阅读;而在另一实施方案中,为了确定每个克隆型的序列要产生2至3个序列阅读。在上述实施方案中,所给出的数值不包括用于从不同个体鉴定样品的序列阅读。在下述实施方案中所用的各种序列阅读的长度还可基于试图由阅读捕获的信息而改变;例如,序列阅读的起始位点和长度可以设计成提供NDN区长度及其核苷酸序列;因此,选择跨越整个NDN区的序列阅读。在其他方面,一个或多个序列阅读包含D区和/或NDN区。
在本发明的另一方面,部分通过比对序列阅读与一个或者多个V区参考序列和一个或多个J区参考序列,部分通过确定碱基而无需比对参考序列(比如在高度可变的NDN区中),来确定克隆型的序列。多种比对算法可以应用于序列阅读和参考序列。例如,关于选择比对方法的指南可参见Batzoglou,Briefings in Bioinformatics,6:6-22(2005),通过引用将其并入。在一个方面,不论何时将V阅读或C阅读(将在下文详述)与V区和J区参考序列进行比对,都需要采用树搜索算法,例如,Cormen等人,Introduction to Algorithms,第三版(TheMIT Press,2009)。V区和J区参考序列的密码子结构可用于比对过程中,以消除测序错误和/或确定比对结果的置信水平,如下文更加充分地描述的。另一方面,至少一个正向阅读的末端和至少一个反向阅读的末端在重叠区(例如图3B中的308)内重叠,使得这两种阅读的碱基彼此是反向互补关系。因此,例如,如果重叠区中的正向阅读是“5’-acgttgc”,则与之处于反向互补关系的反向阅读在同一重叠区中为“5′-gcaacgt”。一方面,至少部分由此反向互补关系确定此重叠区内的碱基。也就是说,如果保持两个序列阅读间的反向互补关系,或与之相一致,那么预期重叠区内的碱基判定(或相关的质量评分)的概率会升高。一方面,由至少一个起始于其J区并且沿着与其相关的V区方向延伸的序列阅读(本文称为“C阅读”(304))和至少一个起始于其V区并且沿着与其相关的J区方向延伸的序列阅读(本文称为“V阅读”(306))确定TCRβ和IgH链(如图3B所示)的克隆型。如图3B所示,重叠区(308)可能包含或不包含NDN区(315)。重叠区(308)可以完全处于J区、完全处于NDN区、完全处于V区,或其可包含J区-NDN区边界或V区-NDN区边界,或这两个边界(如图3B所示)。通常,通过在合成测序反应中使用聚合酶延伸测序引物,如图3B中的(302)和(310)而产生这些序列阅读,例如,Metzger,Nature Reviews Genetics,11:31-46(2010);Fuller等人,Nature Biotechnology,27:1013-1023(2009)。预先确定引物(302)和(310)的结合位点,以便它们可提供序列阅读的最初比对和分析的起点或锚定点。在一个实施方案中,定位C阅读以使其包含TCRβ或IgH链的D区和/或NDN区,并包括邻近V区的一部分,例如如图3B和3C所示。一方面,可利用V区中V阅读和C阅读的重叠来将这两个阅读相互比对。在其他实施方案中,并不需要序列读数的这样的比对,例如对于TCRβ链,以使V阅读的长度可能仅足以鉴定克隆型的特定V区。后一方案在图3C中显示。序列阅读(330)用于鉴定V区,需要或不需要与另一序列阅读重叠,并且另一序列阅读(332)横贯NDN区并用于确定其序列。序列阅读(332)延伸到V区的部分(334)用于将序列阅读(332)的序列信息与序列阅读(330)的序列信息相结合以确定克隆型。对于某些测序方法,诸如逐个碱基的方法,如Solexa测序法,通过最小化分析中的测序循环数可降低测序运行时间和试剂成本。任选地,如图3B所示,产生具有样品标签(312)的扩增子(300)来区分来源于不同生物样品(如不同患者)的克隆型。可以通过将引物退火至引物结合区(316),并将其延伸(314)以生成跨过标签(312)的序列阅读来鉴定样品标签(312),从而解码样品标签(312)。
至少两个因素使得分析IgH链比分析TCRβ链更具有挑战性,这两个因素为:i)体细胞突变的存在使得定位或比对更加困难,以及ii)NDN区较大使得通常不可能将V区段的一部分定位到C阅读上。在本发明的一个方面,通过使用多个引物组产生V阅读可克服该问题,这些引物位于沿V区的不同位置,因此,优选地,这些引物结合位点不重叠并且分隔开来,而且至少一个引物结合位点邻近NDN区,例如在一个实施方案中,距V-NDN连接5至50个碱基,或者在另一实施方案中,距V-NDN连接10至50个碱基。多个引物组的冗余度使得因体细胞突变影响结合位点的而导致一个或两个引物失败从而无法检测克隆型的风险最小化。此外,至少一个邻近NDN区的引物结合位点的存在使得V阅读更有可能与C阅读重叠,并因此有效地延伸C阅读的长度。这允许产生跨越所有大小的NDN区并且还可以基本上定位位于NDN区两侧的整个V区和J区的连续序列。用于执行该方案的实施方案如图4A和4D所示。在图4A中,含有IgH链(400)的样品通过对每个链产生多个扩增子进行测序,通过单组J区引物(401)以及多组(显示的是3组)V区(402)引物(404,406,408)扩增链以产生多个嵌套扩增子(例如,410、412、416),所有扩增子都包含相同的NDN区并具有连续涵盖了V区(402)的较大部分(411、413、415)的不同长度。嵌套组中的成员可在测序后通过记录它们各自的NDN区、J区和/或C区的身份(或实质身份)而归类到一起,从而能够比序列阅读长度和/或序列质量有限的测序平台重建更长的V(D)J区段。在一个实施方案中,多个引物组可以为2到5个。在另一实施方案中,多个为2到3个;且又一实施方案中多个为3个。多个引物中引物的浓度和位置变化很大。V区引物浓度可以相同或不相同。在一个实施方案中,最接近NDN区的引物的浓度高于多个引物中其他引物,例如,以确保在所得的扩增子中出现含有NDN区的扩增子。一个或多个邻近NDN区(444)的引物(例如图4B中的435和437)可用于产生一个或多个序列阅读(例如434和436),与利用J区引物(432)产生的序列阅读(442)重叠,从而提高重叠区(440)碱基判定的质量。来自多个引物的序列阅读可与或不与邻近的下游引物结合位点和/或邻近的下游序列阅读重叠。在一个实施方案中,靠近NDN区(例如436和438)的序列阅读可用于鉴定与克隆型相关的特定V区。这样的多个引物降低了引物结合位点在免疫球蛋白发育过程中超突变而导致扩增不完全或扩增失败的可能性。它还提高了V区超突变引入的多样性在克隆型序列中被捕获的可能性。可执行二次PCR以制备用于测序的嵌套扩增子,例如,通过利用所示的P5(401)和P7(404、406、408)引物扩增以产生扩增子(420、422和424),这些扩增子可以作为单分子分布在固体表面上,其中通过桥接PCR或者类似的技术将它们进一步扩增。
如图4C所示,可通过利用侧翼J区和V区的密码子结构提高NDN区(尤其是IgH链的NDN区)的碱基判定。(如文中所用的“密码子结构”指的是TCR或BCR转录本区段或NDN区以外(例如V区、J区等)基因的天然阅读框的密码子。)扩增子(450)——图4B的扩增子的放大图——与C阅读(442)和上方的相邻V阅读(434)以及下方分别的V区(430)和J区(446)的密码子结构(452和454)的相对位置一起示出。根据本发明此方面,在通过与V和J参考序列进行常规比对而鉴定密码子结构(452和454)以后,使用序列阅读(434)和(442)从J区(446)到V区(430)以及按相反方向从V区(430)到J区(446)一次一个碱基地移动来判定(或鉴定)NDN区(456)中的碱基。在正常的生物学条件下,只有具有从V区穿过NDN区至J区的符合读框的密码子的重组TCR或IgH序列才表达为蛋白质。也就是说,在体细胞突变产生的变体中,只有J区和V区的密码框彼此符合读框并且穿过NDN区仍然符合读框的变体才会被表达。(这里由参考序列确定V和J区的正确读框)。如果基于一个或多个低质量的碱基判定来鉴定不符合读框的序列,那么相应的克隆型就会被标记以便重新评估或作为潜在的疾病相关异常。如果所鉴定的序列符合读框并且基于高质量的碱基判定,则相应克隆型已被正确判定的可信度较高。因此,一方面,本发明包括一种由双向序列阅读确定基于V(D)J的克隆型的方法,该方法包括以下步骤:(a)产生至少一个起始于J区并延伸至NDN区的J区序列阅读,以及起始于V区并向NDN区延伸的至少一个V区序列阅读,以使J区序列阅读与V区序列阅读在重叠区内重叠,并且J区和V区各自含有密码子结构;(b)确定延伸至NDN区的J区密码子结构是否与向NDN区延伸的V区密码子结构符合读框。在又一实施方案中,产生步骤包括产生起始于V区并延伸通过NDN区到达J区的至少一个V区序列阅读,以使J区序列阅读和V区序列阅读在重叠区内重叠。分析序列阅读。将序列阅读合并至克隆型。由序列阅读数据构建克隆型部分地取决于用于产生这些数据的测序方法,因为不同的方法具有不同的预期阅读长度和数据质量。在一种方法中,采用Solexa测序仪产生用于分析的序列阅读数据。在一个实施方案中,获得提供至少0.5-1.0×106个淋巴细胞的样品,以产生至少一百万个模板分子,在任选的扩增后该模板分子可以产生相应的一百万个或者更多的模板分子克隆群(或簇)。对于大多数的高通量测序方法,包括Soleax方法,这种在簇水平上的过采样是理想的,以便以大冗余度确定每一个模板序列以提高序列确定的准确度。对于基于Solexa的实施方案,优选地,每一个独立模板的序列确定10次或更多次。对于其他具有不同预期阅读长度和数据质量的测序方法,不同水平的冗余度可用于类似的序列确定准确度。本领域普通技术人员认识到上述参数,例如样品大小、冗余度等是与特定应用相关的设计选择。
如果测序技术没有错误,那么把给定样品的一组阅读还原为其独特的克隆型以及记录每一个克隆型的阅读数将会是琐碎的计算问题。但是,在存在测序错误的情况下,相对于正确克隆型序列每一个克隆型都被错误数量不同的阅读“云”围绕。这种错误的数量越多,围绕的云的密度越低,即云密度随着在序列空间中远离克隆型而降低。多种算法可用于将序列阅读转换成克隆型。一方面,序列阅读的合并取决于三个因素:针对两个感兴趣的克隆型中的每一个获得的序列数;它们之间不同的碱基数;以及在它们不一致的位点处的测序质量。根据预期错误率和错误的二项式分布来评估似然比。例如,对于两个克隆型,其中一个有150个阅读而另一个有2个阅读,它们之间在测序质量低的区域存在一个差异,它们很可能被合并,因为它们可能是由测序错误产生的。另一方面,对于两个克隆型,其中一个有100个序列阅读而另一个有50个阅读,它们之间有两个差异,它们不能被合并,因为它们被认为是不可能由于测序错误而产生的。在本发明的一个实施方案中,以下描述的算法可用于由序列阅读确定克隆型。围绕每种克隆型的阅读云都可以用二项式分布和单碱基错误概率的简单模型来模拟。后一种错误模型可通过定位V区段和J区段或者经由克隆型的自我一致性和收敛性自行找到克隆型算法而推测出来。构建模型,在X是该序列空间区域中唯一正确的克隆型的零模型下,用于计算具有序列阅读计数C2和E错误(相对于序列X)的给定“云”序列Y是具有完美阅读计数C 1的正确克隆型序列X的一部分的概率。根据参数C 1、C2和E作出是否将序列Y合并到克隆型X的决定。对于任意给定的C 1和E,需要预先计算出用于决定合并序列Y的C2的最大值。选择C2最大值,使得在Y是克隆型X的一部分的零假设下,在将具有错误E的所有可能的序列Y整合到序列X附近以后,不能合并Y的概率小于某个P值。P值控制算法的运行状态,并使得合并或多或少地得到允许。
如果由于序列Y的阅读计数值超过了合并到克隆型X的阈值C2而使序列Y不能合并到克隆型X,那么序列Y变成了用于形成另一个克隆型的候选序列。该算法还确保了“更靠近”该序列Y (被认为独立于X)的任何其他序列Y2、Y3等不会聚集于X。“靠近”的概念既包括关于Y和X的错误计数,还包括X和Y的绝对阅读计数,即,它以与上述用于围绕克隆型X的错误序列云的模型相同的方式进行模拟。这样,如果“云”序列正好“靠近”不只一个克隆型,则可以正确地归属于它们正确的克隆型。
该算法通过从具有最高阅读计数的序列X开始以从上至下的方式运行。此序列形成第一个克隆型。邻近的序列如果它们的计数低于预先计算的阈值(见上文)则合并到此克隆型,或者如果它们高于该阈值或“更接近”另一个未合并的序列则置之不理。在搜索了最大错误计数以内的所有的邻近序列之后,结束将阅读合并至克隆型X的过程。解读其阅读以及所有已经合并到其中的阅读,并将其从可用于产生其他克隆型的阅读列表中去除。随后下一个具有最高阅读计数的序列被移上来。如上,邻近的阅读合并到此克隆型,并且此过程一直持续到不再存在阅读计数超过给定阈值的序列,例如直到计数大于1的序列已经全部用来形成克隆型。
在上述算法的另一实施方案中,可再加入进一步的检验,用于确定是否将候选序列Y合并到现有的克隆型X中,该检验考虑了相关序列的序列阅读的质量评分。如果序列Y和X不同,则为序列Y确定平均质量评分(取所有具有序列Y的阅读的平均数)。若平均评分超过预定值,则此差异更可能指示不应被合并的真正不同的克隆型,如果平均评分低于该预定值,则序列Y更可能是由测序错误产生的,因此应该合并到X中。
序列树。上述将阅读合并到克隆型的算法依赖于从一些输入序列X中找到所有错误小于E的序列的有效方式。使用序列树可以解决此问题。这种序列树的实施方式具有某些不寻常的特征,因为树的节点不限于是DNA的单一碱基。这些节点可以有任意长的序列。这允许更有效地使用计算机存储器。
将给定样品的所有阅读放置到序列树中。每个叶节点指向与它相关联的阅读。它对应于通过从叶节点到根节点逆向穿过序列树得出的独特序列。将第一个序列放在具有一个根节点和一个叶节点的含有阅读的全部序列的简单的树中。接着将序列一个接一个地加入。对每一个加入的序列而言,或是在此阅读与现有的树之间的共同序列的最后一点上形成新的分支,或是如果该树已经含有此序列,则将此阅读加到现有的叶节点上。
在将所有的阅读放到序列树后,很容易将该树用于以下目的:1.最高阅读计数:根据阅读计数来分选叶节点可让我们找到具有最多阅读的叶节点(即序列)。2.找到相邻的叶片:对于任意序列,全部相对于该序列的错误小于X的通过该树的路径是可搜索的。一条路径起始于根部,这条路径分支成多个单独的路径沿着序列树行进。记录每条路径沿着序列树行进时的当前的错误计数。当错误计数超过所允许的错误最大值时,终止给定路径。这样,该树的大部分会尽可能早地得到修正。这是一种从任意给定序列中找到所有错误小于X的路径(即所有叶)的有效方式。
体细胞超突变。在一个实施方案中,如下确定已经历体细胞超突变的基于IgH的克隆型。体细胞突变被定义为与(相关区段,通常是V、J或C的)参考序列的相应碱基不同并且在统计学上显著量的阅读中存在的测序碱基。在一个实施方案中,C阅读可用于找到相对于已定位的J区段的体细胞突变,且同样V阅读用于V区段。只使用那些或是直接定位到J或V区段的或是在克隆型内延伸达NDN边界的C阅读和V阅读的片段。用这种方式可以避开NDN区,而且之前用于确定克隆型的相同“序列信息”不用于寻找突变(以防止错误地将那些实际上只是不同的重组NDN区归类为突变核苷酸)。对于每种区段类型,已定位的区段(主要的等位基因)用作支架,并且考虑在阅读定位阶段已经定位到此等位基因的所有阅读。针对体细胞突变,分析其中已定位了至少一个阅读的参考序列的每个位点。在一个实施方案中,接受非参考碱基作为有效突变的标准包括以下各项:1)至少N个阅读具有给定的突变碱基,2)至少一个给定的分数N/M阅读(其中M是在此碱基位置定位的阅读的总数),以及3)基于二项式分布的统计截止(statistical cut),在突变碱基处的N个阅读的平均评分Q以及具有非突变碱基的阅读数(M-N)。优选地,选定上述参数,使得每个克隆型的突变的错误发现率低1/1000,更优选地,低于1/10000。
系统发生克隆型(宗族(clan))。对于某些疾病,诸如癌症,包括淋巴细胞增生性疾病,一个淋巴细胞先祖可以产生多个相关的淋巴细胞子代,每个都拥有和/或表达略微不同的TCR或BCR,并因此由于持续的体细胞超突变或诸如碱基替换、异常重排等疾病相关体细胞突变而具有不同的克隆型。产生这些克隆型的细胞在此称为系统发生克隆,且一组这样的相关克隆在此称为“宗族”。类似地,系统发生克隆的克隆型称为系统发生克隆型,且一组系统发生克隆型可以称为克隆型的宗族。一方面,本发明的方法包括监测克隆型的宗族的频率(即,组成宗族的系统发生克隆型的频率的总和),而不是个体克隆型的频率。(“一种或多种患者特异性克隆型”的表述包含了宗族的概念)。可通过与亲本克隆型的相关性的一种或多种测量来鉴定系统发生克隆型。在一个实施方案中,如下文所详述,系统发生克隆型可根据同源性百分比归类到同一个宗族。在另一实施方案中,根据相同的V区、J区和/或NDN区的使用来鉴定系统发生克隆型。例如,宗族可用具有相同的J区和ND区但具有不同的V区(有时称为“VH替代”)的克隆型来定义;或者可用具有相同V和J区(通过碱基置换由其各自的参考序列相同地突变)但具有不同NDN区的克隆型来定义;或者可用已经经历了一个或多个1到10个碱基或1到5个碱基或1到3个碱基的插入和/或缺失以产生宗族成员的克隆型来定义。在另一实施方案中,如果克隆型满足以下标准则可归为同一个宗族:i)它们被定位到相同V和J参考区段,该定位发生在克隆型序列中相同的相对位置,以及ii)其NDN区基本上相同。提及宗族成员时所用的“基本上”是指允许在NDN区存在某些小的差异,因为此区域可能发生体细胞突变。优选地,在一个实施方案中,为了避免错误判定NDN区中的突变,碱基置换是否被接受作为癌症相关的突变直接取决于宗族NDN区的大小。例如,如果宗族NDN序列的长度为m个核苷酸或更长,例如9个核苷酸或更长时,若一种克隆型具有相对于该宗族NDN序列的一个碱基的差异作为癌症相关突变,那么一种方法可以接受该克隆型为宗族成员,否则将不接受;或者如果宗族NDN序列的长度为n个核苷酸或更长,例如20个核苷酸或更长,若一个克隆型具有相对于该宗族NDN序列的两个碱基的差异作为癌症相关突变,那么该方法可以接受该克隆型为宗族成员,否则将不接受。在另一实施方案中,可以使用以下标准确定宗族成员:(a)V阅读定位到相同V区,(b)C阅读定位到相同J区,(c)NDN区基本上相同(如上所述),以及(d)V-NDN边界与J-NDN边界之间的NDN区的位置相同(或者等同地,添加至D的下游碱基数与添加到D的上游碱基数相同)。如文中所用的术语“C阅读”可以指由退火到C区(在使用RNA样品的情况下)或者退火到J区(在使用DNA样品的情况下)的测序引物产生的阅读。如其他地方所述,这是因为C区与J区在转录后剪接过程中连接在一起。单个样品的系统发生克隆型可归入宗族,并且来自在不同时间获取的连续样品的宗族可以相互比较。尤其是在本发明的一个方面,对于从每个时间点的每个样品确定的克隆型,鉴定含有与诸如淋巴肿瘤的疾病相关的克隆型的宗族。将这组(或宗族)来自每个时间点的相关克隆型与紧接在前的样品的相关克隆型进行比较,以确定疾病状态,这种确定是通过例如确定在连续的宗族中特定克隆型的频率是升高还是降低,是否出现根据群体研究或数据库得知其为相关性的新相关克隆型,等等。所确定的状态可以是持续缓解、早期复发、进一步克隆进化的证据等等。
同种型使用。另一方面,本发明提供了包括同种型使用信息的克隆型谱。如图3B所示,无论何时从RNA确定基于IgH或TCRβ的克隆型,转录后剪接总会把C区和V区连接起来。一方面,用于产生C阅读(例如304)的测序引物退火到C区(307)中J区(309)连接处的预定引物结合位点(302)。如果选定引物结合位点(302)以使C阅读(304)包括C区(307)的一部分(305),则可确定C区(307)的身份,其转而确定合成的BCR的同种型。在一个实施方案中,选定引物结合位点(302)使得C阅读(304)包括C区(307)的至少6个核苷酸;在另一实施方案中,选定引物结合位点(302)使得C阅读(304)包括C区(307)的至少8个核苷酸。根据该实施方案确定的每个克隆型都包括其相应的C区部分(305)的序列信息,并从这种序列信息确定其相应的同种型。在本发明的一个方面,相关克隆型在最初确定时可具有第一同种型,但是在它们被监测期间会转换成另一种同种型。该实施方案能够通过记录之前未记录的、除了对应于不同同种型部分(305)的序列外与相关克隆型具有相同序列的克隆型来检测该转换。
预计PCR错误集中在PCR早期循环中发生突变的一些碱基中。预期测序错误分布在多个碱基中,这是完全随机的,因为错误可能存在一定的系统性偏差。假设某些碱基有较高的测序错误率,比如说5%(平均值的5倍)。鉴于这些假设,测序错误成为错误的主要类型。将PCR错误从高度相关的克隆型的发生中区分开来将在分析中起作用。考虑到确定存在两个或多个高度相关的克隆型的生物学显著性,可采用一种保守的方法来进行这些判定。考虑检测足够多的次要克隆型,以便以高置信度(比如说99.9%)确保存在不只一种克隆型。例如,对于每1,000,000个出现100个拷贝的克隆型,次要变体要检测14次或更多次以指定为独立克隆型。同样,对于每1,000,000个出现1000个拷贝的克隆型,次要变体要检测74次或更多次以指定为独立克隆型。可通过使用对每个测序的碱基获得的碱基质量评分来强化该算法。如果以上验证了质量评分与错误率之间的关系,则对于所有碱基不再采用保守的5%的错误率,而是可以利用质量评分决定判定独立的克隆型所需呈现的阅读数。可以使用所有阅读中特定碱基的中位质量评分,或更严格地,可基于每个阅读中特定碱基的质量评分计算存在错误的可能性,随后可结合这些可能性(假设是独立的)来估计该碱基的测序错误的可能数量。因此,对于具有不同质量评分的不同碱基,存在推翻测序错误假设的不同阈值。例如,对于每1,000,000个出现1,000个拷贝的克隆型,如果错误概率分别为0.01和0.05,当检测22次和74次时,将次要变体指定为独立的。
III.相关克隆型以及医学算法
本发明提供了用于鉴定其存在与否和/或水平与疾病状态相关的克隆型以及利用此信息作出诊断或预后决定的方法。一方面,在算法中向患者或医疗保健提供者呈现来自克隆型谱的信息,该信息可与诸如非TCR或非BCR基因的表达水平、生理状况等其他医学信息结合;即,一组一个或多个步骤,其中评估检测和/或检查的结果,以及(i)确定行动方案或作出关于健康或疾病状态的决定,或(ii)根据流程图或类似的决策结构作出一系列决定,从而导致行动方案或关于健康或疾病状态的决定。本发明的算法在形式上可能有很大不同。例如,如果某一克隆型或者克隆型亚组超过了克隆谱中的预定比值,或者其比例在监测之间以超过预定的速率增加,算法可能只是提示应该使用药物治疗患者。甚至更简单地,算法可能仅指示在疾病状态与一种或多种克隆型的水平和/或由一种或多种克隆型编码的TCR或BCR的功能之间存在正相关。除了来自一个和多个克隆谱的信息以外,更复杂的算法还可以包括患者生理信息。例如,在复杂疾病诸如某些自身免疫性疾病中,在算法中可结合克隆型谱信息和患者的其他数据,诸如之前的治疗过程、是否出现症状(例如,皮疹、关节炎症)或其强度、特定基因的表达等等。在本发明的一个方面,用于监测淋巴疾病的算法提供了一个预定的分数值,样品(如血液样品)克隆型谱中的克隆型(和/或进化上相关的克隆型)的比例高于此预定值则指示疾病复发或治疗抗性。所述算法可由TCR或BCR克隆性的常规度量组成,或包括TCR或BCR克隆性的常规度量。另一方面,用于监测自身免疫性疾病的算法提供了一个或多个预定的分数值,如果分别编码一种或多种预定抗原特异性的TCR或BCR的克隆型谱中克隆型的比例高于此预定值,则指示自身免疫爆发的发作。
A.相关克隆型与不相关克隆型
本发明的方法提供了区别a)相关克隆型(可以是那些水平与疾病相关的克隆型)与b)不相关克隆型(可以是那些水平与疾病不相关的克隆型)的手段。在一个实施方案中,相关克隆型可以显示与疾病的正相关或者负相关。在另一实施方案中,在疾病高峰状态存在而在疾病的非高峰状态不存在的克隆型可以是相关克隆型(与疾病正相关)。在另一实施方案中,在疾病高峰状态(或阶段)比疾病非高峰状态更丰富(即以更高的分子水平存在)的克隆型可以是相关克隆型(与疾病正相关)。在另一实施方案中,在疾病高峰状态不存在而在疾病非高峰状态存在的克隆型可以是相关克隆型(与疾病负相关)。在另一实施方案中,在疾病高峰状态不如在疾病非高峰状态时丰富的克隆型可以是相关克隆型(与疾病负相关)。在另一实施方案中,通过算法确定个体的相关克隆型。
B.利用校准试验而不使用群体研究发现相关克隆型和不相关克隆型
在本发明的一个实施方案中,可通过检查与疾病状态相关的某些样品中存在的克隆型来鉴定相关克隆型。该样品可以是处于疾病高峰状态的血液样品(例如,来自急性发作期的MS或狼疮患者的血液样品),或者可以来自受疾病累及或与疾病相关的组织,该组织富集与该个体的疾病(诸如炎症或肿瘤)相关的T细胞和B细胞。这些组织的实例可以是患有肾炎的狼疮患者的肾脏活检样品、MS患者爆发期的脑脊液(CSF)、类风湿关节炎患者的滑液或癌症患者的肿瘤样品。在所有这些实例中,这些组织很可能含有与疾病相关的有关T细胞和B细胞(虽然不一定是病原体)。值得注意的是,如果该方法用来鉴定与疾病相关的克隆型,那么这些克隆型只与在其样品中检测这些克隆型的个体相关。因此,为了使用该方法鉴定任意给定的患病个体中的相关克隆型,需要特定的校准试验。就是说,一方面,通过从取自直接受疾病累及或与疾病相关的组织(本文中有时称为“疾病相关组织”)的样品产生克隆型谱,来发现或确定相关克隆型。另一方面,此确定还包括,从取自不受疾病累及或与疾病无关的组织(本文中有时称为“非疾病相关组织”)的样品产生克隆型谱,然后比较前后两个克隆型谱,来将相关克隆型确定为那些处于高水平、低水平或功能上不同的克隆型,例如,编码特定抗原特异性的TCR或BCR。一方面,可通过鉴定如下克隆型进行这种确定,该克隆型在受累及的或疾病相关的组织的克隆型谱中出现的频率高于相同克隆型在未受累及的或非疾病相关的组织的克隆型谱中出现的频率。
在一个实施方案中,提供了一种用于确定受试者的一种或多种相关克隆型的方法。该方法包括以下步骤:a)通过对来自受试者的至少一个样品的空间分离的个体分子进行核苷酸测序,产生一个或多个克隆型谱,其中所述至少一个样品与疾病的第一状态相关,以及b)基于所述一个或多个克隆型谱,确定受试者中的一种或多种相关克隆型。
在一个实施方案中,至少一个样品来自受疾病累及的组织。在另一实施方案中,所述一种或多种相关克隆型的确定包括对来自至少两个样品的克隆型谱进行比较。在另一实施方案中,所述疾病的第一状态是疾病的高峰状态。在另一实施方案中,一种或多种相关克隆型在疾病的高峰状态存在。在另一实施方案中,一种或多种相关克隆型在疾病的高峰状态不存在。在另一实施方案中,一种或多种相关克隆型在疾病高峰状态处于高水平。在另一实施方案中,一种或多种相关克隆型在疾病高峰状态处于低水平。在另一实施方案中,样品包含T细胞和/或B细胞。在另一实施方案中,所述T细胞和/或B细胞包含T细胞和/或B细胞的亚群。在另一实施方案中,所述T细胞和/或B细胞的亚群通过与标记物的相互作用进行富集。在另一实施方案中,所述标记物是T细胞和/或B细胞的亚群的细胞表面标记物。在另一实施方案中,所述T细胞和/或B细胞的亚群与疾病中特异性存在的抗原相互作用。例如,对于淋巴增生性疾病,诸如淋巴瘤,可以通过如上建议的富集,从淋巴组织、从疾病引起的损伤(例如转移损伤)或者从间接受到疾病累及的组织获得校准样品。对于淋巴肿瘤,有很多可用的指南和可商业获得的试剂盒用于免疫分型和富集疾病相关的淋巴细胞,例如“U.S.-Canadian consensus recommendations on theimmunophenotypic analysis of haematologic neoplasia by flowcytometry,”Cytometry,30:214-263(1997);MultiMixTM AntibodyPanels for Immunophenotyping Leukemia and Lymphoma by FlowCytometry(Dako,Denmark);等等。淋巴组织包括淋巴结、脾、扁桃体、腺样体、胸腺等。
在一个实施方案中,所述疾病是自身免疫性疾病。在另一实施方案中,所述自身免疫性疾病是系统性红斑狼疮、多发性硬化症、类风湿关节炎或者强直性脊柱炎。
在一些实施方案中,通过检测在与疾病状态之外的状态相关的一些样品中存在的克隆型来鉴定相关克隆型。这些状态可包括暴露于非致病抗原,诸如针对本地花粉的亚症状变态反应。该实施方案可用于确定个体最近是否回到过含有此抗原的地方。这些状态包括暴露于与工业过程或生物恐怖制剂的制造或生产相关的抗原。
C.利用群体研究发现相关克隆型以及不相关克隆型
在一个实施方案中,提供了一种利用群体研究鉴定克隆型的方法。群体研究的使用允许将在已知疾病状态结果的患者中已经得到确认的关于相关克隆型的特定信息标准化,以使得可在未来所有的受试者中鉴定此类相关克隆型而无需进行校准试验。对一组特定相关克隆型的了解可用于提取关于在未来受试者中将相关的克隆型的可能属性(参数)的规律。该实施方案利用以下步骤实施:(a)对来自受疾病累及或者与疾病相关的组织的一组样品中的每一种产生克隆型谱;(b)确定相对于来自未受累及的组织的样品中的相同克隆型处于高水平或低水平的克隆型,或与来自未受累及的组织的样品中的克隆型在功能上不同的克隆型。一方面,如本文所用的关于克隆型的“功能上不同”是指由该克隆型编码的TCR或BCR与其他的相比是不同抗原、蛋白质或复合物特异性的。任选地,上述实施方案还可进一步包括开发一种用于根据上述步骤(a)和/或(b)中确定的克隆型的序列信息或根据功能数据预测任意样品中的相关克隆型的算法,即确定最近测定的克隆型编码对于特异于所观察疾病的抗原、蛋白质或复合物而言为特异性的TCR和BCR。
关于以上所述,可通过将在一个或多个初始检测中确定的克隆型(“确定的克隆型”)与通过群体研究、数据库等可以获得的已知与所述疾病相关的克隆型进行匹配,来鉴定一种或多种患者特异性克隆型。一方面,匹配所述克隆型包括找出由确定的克隆型编码的氨基酸序列和由已知的与疾病相关的克隆型或与后一克隆型基本上相同的变体所编码的氨基酸序列间的同一性。如此处所用的“基本上相同的变体”,一方面是指所比较或匹配的序列在核苷酸序列或氨基酸序列上至少80%相同,或至少90%相同。另一方面,基本上相同的变体是指相差5个或更少的碱基或氨基酸添加、删除和/或置换。另一方面,匹配所述克隆型包括找出确定的克隆型和已知与疾病相关的克隆型的核酸序列或与后一克隆型基本上相同的变体的核酸序列间的同一性。再一方面,匹配克隆型包括找出被确定的克隆型和已知与疾病相关的克隆型的核酸序列或与该疾病相关克隆型基本上相同的变体的核酸序列之间的同一性。
在一个实施方案中,本发明所涵盖的方法包括,在样品研究中,通过对免疫细胞组库进行测序来鉴定相关与不相关克隆型,所述样品来自不同时期的患者和任选的健康对照,以及在患者患有疾病的情况下,来自用临床数据表征的不同的(和已知的)病程阶段。疾病可以是,例如,自身免疫性疾病。其水平与这些不同阶段的疾病的指标相关的克隆型可用于开发一种算法,该算法用于预测所有个体中不同于那些与疾病无关的序列的、与疾病相关的较大组序列的身份。与校准试验的情况不同,相关序列不需要出现在此发现研究中,但可基于这些序列进行预测。例如,相关序列可以是TCR基因的DNA序列,它编码与发现研究中鉴定的克隆型的DNA序列相同的氨基酸序列。此外,可预测一种或多种相关克隆型的算法可以用于鉴定来自任何个体的样品中的克隆型,并且它绝不是给定个体独特的,因此,允许对新样品中的相关克隆型进行预测,而不需要预先知道该个体中存在的克隆型。
一方面,提供了一种用于开发预测来自患病受试者的任意样品中的一种或多种相关克隆型的算法的方法,该方法包括:a)从一组样品产生多个克隆型谱,其中该样品与疾病相关,b)从这组样品鉴定一种或多种相关克隆型,c)利用b)中鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发可预测来自患病受试者的任意样品中的相关克隆型的算法。
在一个实施方案中,这组样品可以取自一种或多种受疾病累及的组织。
在另一实施方案中,鉴定一种或多种相关克隆型包括比较来自至少两个样品的克隆型谱。在另一实施方案中,所述功能数据包括T细胞和/或B细胞中标记物的结合能力,或T细胞或B细胞与抗原的相互作用。在另一实施方案中,所述序列参数包含核酸序列和预测的氨基酸序列。在另一实施方案中,样品来自一个或多个处于疾病高峰阶段的个体。在另一实施方案中,所述一种或多种相关克隆型在疾病高峰状态存在。在另一实施方案中,所述一种或多种相关克隆型在疾病高峰状态处于高水平。在另一实施方案中,一种或多种相关克隆型在疾病高峰状态处于低水平。在另一实施方案中,一种或多种相关克隆型在疾病高峰状态不存在。
在一个实施方案中,所述疾病是自身免疫性疾病。在另一实施方案中,自身免疫性疾病是系统性红斑狼疮、多发性硬化症、类风湿关节炎或强直性脊柱炎。
另一方面,提供了一种用于发现个体的一种或多种相关克隆型的方法,该方法包括:a)将来自个体的样品的克隆型谱输入算法中,以及b)运用该算法来确定该个体的一种或多种相关克隆型。该算法可以是通过以下步骤开发的算法:a)从一组样品产生多个克隆型谱,其中该样品与疾病相关,b)从这组样品鉴定一种或多种相关克隆型,以及c)使用b)中所鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发可以预测来自患病受试者的任意样品中的相关克隆型的算法。
在一些实施方案中,相关克隆型是群体中存在的已鉴定的克隆型,该群体已暴露于与疾病状态之外的状态相关的抗原。该状态可包括暴露于非致病抗原,诸如针对当地花粉的亚症状变态反应。该实施方案可用于确定个体近期是否到过含有该抗原的地方。该状态可以包括暴露于与工业过程或生物恐怖制剂的制造或生产相关的抗原。
D.结合群体研究利用校准试验发现相关和不相关克隆型
在本发明的一个实施方案中,通过利用结合群体研究的校准试验来鉴定相关克隆型。在该实施方案中,群体研究并不产生能够在任意样品中预测克隆型的算法,而是允许开发一种算法,该算法用来预测来自受试者(已对其产生特定校准克隆型谱)的任何样品中的相关克隆型。这一实施方案的一个实例是开发一种算法,在临床爆发期首次进行血液检验用来校准该算法后的任何疾病阶段,该算法能够基于从血液样品检测的克隆型谱预测狼疮患者的相关克隆型。因此,在该实施方案中,可以通过以下步骤鉴定相关克隆型:(a)从来自与疾病相关的或受疾病累及的组织的一组样品产生克隆型谱,以根据水平和/或功能鉴定一组与该疾病相关的克隆型,以及鉴定这种水平和/或功能与疾病状态之间的关系;(b)确定来自该疾病第一状态的组织的样品的克隆型谱;(c)根据步骤(a)的关系确定相关克隆型。在另一实施方案中,可以通过以下步骤鉴定相关克隆型:(a)从来自与疾病相关的或受疾病累及的组织的一组样品产生克隆型谱,以根据水平和/或功能来鉴定一组与该疾病相关的克隆型,以及鉴定这种水平和/或功能与疾病状态之间的关系;(b)测定处于高峰期的相关疾病阶段或来自疾病累及的组织或处于功能表征阶段的新受试者的校准克隆型谱;(c)根据步骤(a)的关系确定相关克隆型。
在该实施方案中,本发明包括通过在样品研究中对免疫细胞组库进行测序来鉴定相关和不相关克隆型的方法,所述样品来自不同时期的患者和任选的健康对照,以及在患者患有疾病的情况下,来自用临床数据表征的不同(和已知的)病程阶段。在第一状态与在第二状态以不同频率(或水平)存在的克隆型随后用于开发一种算法,该算法用来预测在处于第一疾病状态的每个个体的组库中发现的哪个序列将在每个个体中与后续状态的疾病相关,该序列不同于那些在该个体中与疾病无关的序列。与单独进行校准试验的情况不同,相关序列可以是发现在疾病状态之间不同的所有序列的一个亚组。也可能未在校准样品中发现相关克隆型,但是如果它们在未来的样品中出现,则基于该算法会预测为相关的。作为一个例子,基于由群体研究产生的算法,与在校准样品中发现的克隆型编码相同氨基酸序列的克隆型可被预测为相关克隆型。不同于之前的实施方案,开发该算法用来基于校准克隆型谱预测相关克隆型,所述校准克隆型谱是在个体中产生的克隆型谱,该个体的相关克隆型将在疾病的特定状态被预测。在该实施方案中,直至测定出特定的校准克隆型谱,该算法才能用于产生特定个体中的相关克隆型。在特定受试者中测定该校准谱后,所有随后的相关克隆型都可基于该个体中克隆型谱的测定进行预测。
另一方面,提供了一种用于发现个体的一种或多种相关克隆型的方法,该方法包括:a)将来自该个体的样品的克隆型谱输入算法,以及b)利用该算法确定该个体的一种或多种相关克隆型。该算法可以是通过以下步骤开发的算法:a)从一组样品产生多种克隆型,其中所述样品与疾病相关,b)从该组样品鉴定一种或多种相关克隆型,以及c)使用步骤b)中所鉴定的一种或多种相关克隆型的序列参数和/或功能数据来开发可以预测来自患病受试者的任何样品中的相关克隆型的算法。在一个实施方案中,在疾病的高峰状态获取样品。在另一实施方案中,从受疾病累及的组织中获取样品。
在一些实施方案中,针对已暴露于与疾病状态以外的状态相关的抗原的群体中存在的克隆型,利用校准试验结合群体研究来确定相关和不相关克隆型。该状态可包括暴露于非致病抗原,诸如对当地花粉的亚症状变态反应。该实施方案可用于确定个体近期是否去过含有该抗原的地方。该状态可包括暴露于与工业过程或生物恐怖制剂的制造或生产相关的抗原。
E1.可用于预测相关克隆型的序列相关参数
为了进行群体研究,可以利用训练组通过检测各种能够区分相关克隆型与不相关克隆型的参数来理解相关克隆型的特征。这些参数包括所用的序列或特定的V、D和J区段。在一个实施方案中,显示特定V区段更可能与某些疾病相关,如果特定疾病的克隆型可能识别相关的表位,并因此可能具有序列相似性,则通常是这种情况。在又一实施方案中包括其他参数,这些参数包括所鉴定的体细胞超突变的程度、在发作高峰时的克隆型水平、以及当疾病相对不活动时的克隆型水平。能预测相关克隆型的其他参数包括但不限于:1)包括V或J区、组合VJ、DJ区内的短序列的序列基序;2)该克隆型的序列长度;3)该克隆型的水平,包括绝对水平(每百万分子的克隆数)或等级水平;4)氨基酸和核酸序列与其他克隆型的相似度:其他高度相关的克隆型的频率,包括那些具有沉默变化(编码相同氨基酸的核苷酸差异)的克隆型或那些具有保守氨基酸变化的克隆型;5)对于BCR,该克隆型中的体细胞突变的水平和/或与某些种系克隆型的差别在于体细胞突变的不同克隆型的数量;6)其相关蛋白质具有相似的三维结构的克隆型。
E2.编码抗原特异性抗体的克隆型数据库
该相关克隆型可编码对于一种或多种抗原的一种或多种表位而言为特异性的免疫球蛋白或TCR。因此,在本发明的一个方面,可通过将测得的克隆型与数据库项进行比较来确定相关克隆型,该数据库包含对于一种或多种选定的抗原来说基本上所有可能的克隆型(即,“抗原特异性克隆型数据库”)。可通过对淋巴细胞的抗体编码序列的选定区域进行测序来构建此类数据库,该淋巴细胞的抗体编码序列产生对于感兴趣的抗原或表位具有特异性的抗体,或者可通过使用在其表面上表达和展示抗体或其片段的噬菌体进行结合试验来构建此类数据库。后一过程易于执行,如Niro等人,Nucleic Acids Research,38(9):e110(2010)中所述。简单来说,一方面,所述方法包括以下步骤:(a)感兴趣的抗原,例如HCV核心蛋白,与固相支持体结合,(b)噬菌体编码的抗体库在抗体结合条件下暴露于抗原,以便一部分噬菌体编码的抗体结合到结合抗原上,而另一部分仍处于游离状态,以及(c)收集结合的噬菌体编码的抗体并对其测序,以创建相关克隆型的数据库项。利用如上所述的高通量DNA测序技术方便地对结合的噬菌体编码的抗体进行测序。在一个实施方案中,本方法的克隆型编码结合化合物的单链可变片段(scFv)。可以使用不同严格性的抗体结合条件。由结合的噬菌体确定的核酸序列可以制成表格,并输入到合适的抗原特异性克隆型数据库中。
F.改善相关克隆型测定的功能数据
又一实施方案将利用功能数据协助鉴定相关克隆型。例如,可通过标准方法例如FACS或MACS捕获在包含相关克隆型的细胞中富集的含有某些标记物的T细胞和/或B细胞。在另一实施方案中,该标记物是细胞表面标记物。在另一实施方案中,T细胞和/或B细胞对与病理学相关的抗原或对受累组织的反应性将是克隆型的病理学相关性的良好证据。
在另一实施方案中,可合成候选克隆型的序列,并置于完全TCR或BCR的环境中,以及评估相关反应性。或者,可将不同序列的扩增片段输入噬菌体、核糖体或RNA展示技术。可针对具有相关反应性的序列来选择这些技术。对选择之前和之后的测序结果的比较可鉴定那些具有反应性并因此可能是病理性的克隆。在另一实施方案中,特异性展示技术(例如噬菌体、核糖体或RNA展示)可以以阵列形式使用。携带来自TCR或BCR的个体序列(例如CDR3序列)的个体分子(或这些个体分子的扩增)可以排列为噬菌体、核糖体或RNA。然后可以研究特异性抗原,以鉴定编码与其结合的肽的序列。结合与疾病相关的肽的抗原可能是病理性的。
G.产生免疫负荷算法
算法可用于计算由相关克隆型和不相关克隆型的功能水平给出的免疫负荷、值或评分。所述免疫负荷可用来作出临床决定。使用实验(例如,包含来自处于疾病第一状态的受试者的样品和来自处于疾病第二状态的受试者的样品的实验)数据,可以开发一种将相关和不相关克隆型水平的信息结合成单一评分(免疫负荷)的算法。然后调整该算法的参数以最大化免疫负荷和临床数据间的相关性。例如,临床数据可以是疾病严重程度的临床度量(例如,MRI显示的多发性硬化症患者的病变程度)。因此,在一个实施方案中,可以通过以下步骤计算免疫负荷:(a)开发一种使用一组因素将相关克隆型水平结合成单一疾病活动性评分的算法;(b)将步骤(a)中产生的评分与关于疾病状态的临床数据进行比较;以及(c)优化这些因素从而最大化临床数据与疾病活动性评分之间的相关性。
产生免疫负荷算法中所用的相关克隆型可以利用如上所述的校准试验、群体研究或校准试验和群体研究来产生。
在结合相关克隆型中可以考虑的一些因素为相关克隆型的数量、它们的水平、它们的变化率(速度),以及速度的变化率(加速度)。其他需要评估的因素包括处于发作高峰期和非活动疾病状态的克隆型的水平。
在一个实施方案中,产生的免疫负荷与自身免疫性疾病相关。该负荷可称为自身免疫负荷。
一方面,提供了一种用于产生计算疾病活动性评分的算法的方法,该方法包括:a)开发一种使用一组因素将相关克隆型水平结合成疾病活动性评分的算法,b)将疾病活动性评分与关于疾病状态的临床数据进行比较,以及c)优化这些因素以便最大化临床数据和疾病活动性评分之间的相关性。
H.利用负荷算法监测疾病
1.在没有校准试验的情况下监测疾病
在本发明的一个实施方案中,利用群体研究来确定克隆型和免疫负荷算法。免疫负荷可以直接使用而不需要先对个体患者进行校准。当患者处于任何疾病状态时,该试验都可进行。该试验可用来基于上述开发的算法产生特异性相关克隆型和不相关克隆型。随后可使用在群体研究中产生的第二算法计算免疫负荷。之后可在临床上使用该评分。在一个实施方案中,可在不使用校准试验的情况下通过以下步骤进行监测试验:(a)在患者被监测时测定患者的克隆型;以及(b)利用由发现算法试验所预测的相关克隆型,以及来自监测试验的数据,利用监测算法产生反映患者疾病状态的评分。
另一方面,提供了一种用于监测个体的疾病状态的方法,该方法包括:a)确定来自受试者的样品的克隆型谱,b)将来自a)的克隆型谱信息输入算法,以及c)利用该算法产生预测个体的疾病状态的评分。该算法可以是通过以下步骤产生的算法:a)开发一种使用一组因素将相关克隆型水平结合成疾病活动性评分的算法,b)将疾病活动性评分与关于该疾病状态的临床数据进行比较,以及c)优化所述因素以便最大化临床数据和疾病活动性评分之间的相关性。
2.使用校准试验监测疾病
在本发明的一个实施方案中,使用校准试验或校准试验和群体研究的结合来确定相关克隆型和免疫负荷算法。免疫负荷可以通过首先进行校准试验而用于临床。当患者处于一种状态,该状态与在产生用于免疫负荷算法的相关克隆型和不相关克隆型的研究中使用的第一状态相似时,可以进行该试验。例如,如果免疫负荷算法是产生于自身免疫性疾病的爆发期,该状态可以是自身免疫性疾病的爆发期。然后该校准试验可用于产生将用于后续疾病监测试验的特异性相关克隆型和不相关克隆型。在对该患者治疗的晚些时候,对患者进行另一个试验,并且可使用发现研究中产生的算法以及在该患者的特异性校准试验中产生的克隆型水平列表来计算免疫负荷。之后该免疫负荷评分可在临床上使用。在一个实施方案中,使用校准试验的监测试验包括以下步骤:(a)检测处于疾病状态I的患者以确定克隆型谱;(b)随后(在患者将要被监测时)测定患者的克隆型;(c)利用监测算法,由来自校准试验的疾病状态I的克隆型谱和后期试验的信息来产生反映疾病状态的疾病评分。
另一方面,提供了一种用于监测个体的疾病状态的方法,该方法包括:a)确定来自受试者的样品的克隆型谱,b)将来自a)的克隆型谱信息输入算法,以及c)利用该算法产生预测该个体的疾病状态的评分。该算法可以是由以下步骤产生的算法:a)开发一种使用一组因素将相关克隆型水平结合成疾病活动性评分的算法,b)将疾病活动性评分与有关该疾病状态的临床数据相比较,以及c)优化该因素以便最大化临床数据和疾病活动性评分之间的相关性。在另一实施方案中,该方法可进一步包括通过本发明的任何方法来确定该个体中的一种或多种相关克隆型,以及将关于一种或多种相关克隆型的信息输入该算法。
在一个实施方案中,疾病是自身免疫性疾病。在另一实施方案中,该自身免疫性疾病是系统性红斑狼疮、多发性硬化症、类风湿关节炎或强直性脊柱炎。
3.与使用免疫负荷相关的其他因素
相同的免疫负荷对于不同患者可能意味着不同的情况。举例说明,需要考虑患者的整体临床情况。从试验的角度来看,在作临床决定时,除了免疫负荷的水平外,还可考虑速度(免疫负荷随时间的变化率)和加速度(速度随时间的变化率)。例如,如果自身免疫负荷评分正在上升(高速度),就可预测自身免疫性疾病的初期爆发。
可整合到负荷评分(例如,自身免疫负荷评分)中的其他试验包括,例如,红细胞沉降率(ESR)、C-反应蛋白(CRP)水平、抗dsDNA、其他自身抗体效价、补体水平、尿蛋白水平、尿蛋白/肌酐比值、肌酐水平、血尿素氮(BUN)水平、血小板水平、WBC计数、血细胞比容(Hct)、Hb、尿分析结果。与可整合的SLE相关的其他试验包括,例如,CD27水平、CD27++细胞水平、INF-响应性基因(Baechler,EC等人(2003)Proc.Natl.Acad.Sci.100:2610-2615)和趋化因子评分(Bauer JW等人(2009)Arthritis Rheum.60:3098-3107)。其他与狼疮不相关的试验包括,例如,促甲状腺激素(TSH)试验、三碘甲状腺原氨酸(T3)试验、甲状腺素(T4)试验、肝功能试验(LFT)、其他自身抗体、钙卫蛋白试验、乳铁蛋白试验和滑液分析。另外的试验可包括成像试验,包括,例如,MRI、CT-扫描、X-射线和超声波。
1.利用测序技术结合部分细胞富集,作为校准步骤的一部分来寻找相关克隆型
有几种技术可用于基于细胞标记物分离血液或组织中的细胞。这些技术包括固相分离,如微珠或柱体,其上固定有诸如抗体的特异性亲和试剂。液相分离可使用如流式细胞术等技术来实现,其中利用特异性结合选定的细胞标记物的标记试剂引导门控流装置,在该装置中,特异性荧光标记物可用于分离如此标记的细胞。白细胞去除术是另一种液相分离技术,可用于富集血液中的白细胞群,例如,Shelat,Am.J.Med.123:777-784(2010);美国专利5,846,928;等等,随后可利用细胞表面标记物进行进一步富集。
当对算法进行校准以预测相关克隆型和/或测定这些克隆型的水平以便确定疾病负荷时,对T细胞和/或B细胞的亚群进行谱分析有时将会是有利的。使用以上对于各种表面或内部标记物所述的方法可以完成。使用此类方法的一个挑战在于针对给定标记物的选择性永远不会完美这一事实。因此,富集不太可能产生纯的选定细胞群体。不分离细胞而实现细胞亚群富集的另一种方法是选择性地生长目标细胞亚群。例如,可在体外用抗原激活T细胞,并且可允许激活的细胞分裂从而数量增加,导致它们的富集。
在本发明的一个实施方案中,在针对至少一种细胞标记物富集前后,通过对空间分离的个体分子进行测序而产生T细胞群和/或B细胞群的克隆型谱。然后比较这两个谱以确定哪些克隆型在富集的和未富集的细胞群之间具有显著变化的频率,从而鉴定与携带为富集而选定的标记物的细胞相关的克隆型。在实现该鉴定中使用测序方法的优势是,由于在足够的测序深度下能够很好地测定克隆型频率,即使富集相对较差,也可以鉴定克隆型。这转而允许常规而廉价地使用多种富集方法,因为不需要为了达到纯度而设计昂贵的多重富集。
在一个实施方案中,在细胞富集前后对T细胞受体和B细胞受体的这种测序可作为校准算法的一部分,用以确定哪些克隆型是相关的。在该实施方案中,在针对与处于第一疾病状态的疾病相关的标记物富集前后,对细胞进行测序。该第一疾病状态的实例是:处于该疾病高峰状态的血液样品、受累及的组织样品、处于疾病高峰状态的受累及的组织样品,等等。这样从含有和不含细胞标记物的细胞部分获得克隆型,并且可以将其输入算法,随后用来确定该个体中的相关克隆型。
在另一实施方案中,不仅对第一疾病状态期间收集的样品进行富集,而且对来自同一个体的后续样品进行富集。这样,就能确定处于任何时间的细胞亚部分中的相关克隆型。
在另一实施方案中,细胞标记物与测序结合使用,不仅用来评估特异性相关克隆型的频率,而且用来评估它们的功能状态。在该实施方案中,细胞标记物提供超出相关克隆型的身份之外的信息,因为它们可改善根据相关克隆型的频率对疾病状态的预测。在利用特异性标记物富集的前后进行测序,确定了特异性克隆型的频率。此外,确定了含有这种特异性克隆型和其他细胞标记物的细胞的频率和分数。考虑这种情况,有两位患者,他们在含有与某些临床状态相关的克隆型的细胞中具有相同频率的这些克隆型,但具有不同频率的特定细胞标记物(例如,激活标记物)。这些患者尽管具有相同频率的相关克隆型,但可能具有不同的疾病活动性。
细胞标记物可以是细胞激活标记物。通常,可通过利用已知与疾病相关的T细胞和/或B细胞群体测定基因表达来确定标记物。这些标记物可以是细胞表面标记物或细胞内表达的标记物。
在本发明的一个实施方案中,富集表现出对已知与特定疾病相关的抗原具有亲和性的细胞。有多种方法可以进行该富集。
在另一实施方案中,感兴趣的细胞是与特定抗原相互作用的B细胞。在这种情况下,将会存在具有与该特定抗原结合的B细胞受体序列的B细胞。这些B细胞受体因此可用作细胞表面标记物,该细胞表面标记物可使用抗原特异性试剂进行富集。在一个实施方案中,其上固定有抗原的微珠或柱子可用于富集表达特异于该抗原的B细胞受体的细胞。在另一实施方案中,抗原为多聚体,例如四聚体,以便提高表达适当的B细胞受体的细胞的亲和力。在另一实施方案中,可用荧光标记的抗原试剂来标记这些细胞。然后可用基于荧光标记进行分选的流式细胞术来富集这些细胞。在流式细胞术方法中,该过程可与B细胞的其他标记物结合进行。在另一实施方案中,荧光抗原试剂为多聚体,以便提高表达适当的B细胞受体的细胞的亲和力。
本发明的一个方面是可以确定不同克隆型与特异性抗原相互作用的强度。通过抗原相互作用富集克隆型的程度提供了相互作用强度的度量。结果,代替传统的抗体“效价”水平,可以获得更详细的信息。具体来说,可以确定具有不同亲和力的不同克隆型的频率。在一个实施方案中,在富集中所用的抗原是单一分子种类。在另一实施方案中,抗原是与疾病相关的抗原的复杂混合物。该抗原可以是一种细胞类型或多种细胞类型的混合物。
在另一实施方案中,感兴趣的细胞是在MHC分子的环境中与特异性抗原相互作用的T细胞。在一个实施方案中,与MHC分子复合的肽用于捕获相关细胞。MHC-肽复合物的四聚体先前已经成功用于此目的。在另一实施方案中,将含有能够呈递抗原的细胞和T细胞的血液或相关组织与抗原一起温育,以允许将肽呈递给T细胞。之后可以根据某些激活特征来富集通过与这些抗原结合而激活的细胞。可利用潜在的任何激活特征,如细胞增殖、白细胞迁移、细胞毒性和/或激活标记物的表达。例如,激活的细胞增殖,并且能够使得它们分裂并富集。相似地,激活的细胞能够表达一些可用于捕获它们的标记物。这些标记物可以是表面标记物或某些内部标记物,如细胞因子,诸如INFγ、IL-2或IL-17。可使用不同的技术,诸如FACS或抗细胞表面标记物抗体包被的微珠,而轻易地捕获表达该表面标记物的细胞。还开发了捕获表达细胞内标记物(特别是细胞因子)的细胞的技术。一种技术被称为细胞内细胞因子染色。在该方法中,特异于讨论中的免疫过程的细胞因子在T细胞内被捕获,随后将T细胞通透化,从而允许使用荧光抗体标记这些特异性细胞因子。之后可以使用流式细胞术富集这些标记的细胞。另一种方法,细胞因子捕获,利用具有双重特异性的杂合抗体。一种特异性是针对所有T细胞(如MHC分子)中的一些通用标记物,而另一种是针对感兴趣的细胞因子,例如,INFr、IL-2或IL-17。通用特异性将抗体附着在所有T细胞的表面,然后用附着在相同细胞上的抗体捕获从T细胞释放出的细胞因子。然后,可以使用针对相关细胞因子的荧光抗体,从而允许用FACS捕获相关细胞。
本发明的一个方面是可以确定不同克隆型与特定抗原相互作用的强度。通过抗原相互作用富集克隆型的程度提供了该相互作用的强度的度量。因此,能够确定具有不同亲合力的不同克隆型的频率。
在一个实施方案中,在富集中所用的抗原是单一分子种类。在另一实施方案中,抗原是与疾病相关的抗原的复杂混合物。抗原的复杂混合物可以是一种细胞类型,或多种细胞类型的混合物。
J.用于检测潜在性感染复发的抗原富集
在传染病中,不仅经常检测病原体的存在或不存在,而且还经常检测和监测对该病原的免疫应答。因此,免疫系统针对特定病原体抗原而产生的抗体的检测是常规临床实践中的一种方法。然而,这种通过抗体测定的对特定病原体抗原的免疫应答不能够给出对该抗原的免疫应答的全面见解。检测的抗体可能是许多不同的B细胞克隆的产物,每个克隆表达略微不同的抗体,每个抗体可携带略微不同的关于该疾病状态的信息。此外,根本没有检测对这些抗原的T细胞应答。
使用本发明公开的方法可以非常全面地分析患者对病原性感染的免疫应答。在一个实施方案中,在疾病过程中的一个时间点使用B细胞富集可以全面地检测感染病原体的个体中的B细胞应答,以确定与响应于该感染的抗体相关的B细胞克隆型。为了实现此目的,可以通过使用在讨论的病原体中存在的抗原进行富集,来确定对病原体的免疫应答所涉及的B细胞。这些抗原可以是单一抗原种类、一组不同的抗原种类或来自病原体(包括来自病原体的整个细胞)的抗原的复杂混合物。然后将此类抗原固定在固体表面上或进行荧光标记,并且在抗原被荧光标记的情况下,使用基于微珠的结合方案、基于柱子的结合方案或流式细胞术方法进行富集。在富集前后,通过在两个维度上分离来自B细胞受体的个体DNA或RNA分子,并对个体分子进行测序,以形成BCR克隆型谱,从而对来自患者的细胞进行谱分析。然后在两个克隆型谱之间显示显著的频率偏移的克隆型序列被候选为负责针对一种或多种抗原的免疫应答的克隆型。可以任选地开发进一步的算法以完善关于哪些克隆型有可能与该特异性免疫应答相关的预测。这些算法可以使用序列参数,诸如频率、序列长度、氨基酸序列相似性、与其他类似克隆型序列(包括那些通过体细胞超突变产生的序列)的相似度,等等。
在一个优选的实施方案中,在一个校准时间点及时完成抗原捕获以鉴定相关的B细胞,并在随后的谱分析时间点上不进行抗原捕获,在这个时间点上无需富集而对所有B细胞进行谱分析。
在另一实施方案中,测定T细胞应答。为了实现该目的,通过使用在讨论的病原体中存在的抗原进行富集而确定在针对病原体的免疫应答中涉及到的T细胞。这些抗原可以是单一抗原种类、一组不同的抗原种类或来自病原体(包括来自病原体的整个细胞)的抗原的复杂混合物。在一个实施方案中,MHC-抗原复合物的四聚体用于荧光标记T细胞。在另一实施方案中,至少在第一时间点将此类抗原加入到患者的血液中,并进行温育,以使抗原性肽能够被该个体的抗原呈递细胞所呈递。在这两个实施方案中,在使用MHC-抗原复合物的四聚体、内部细胞因子染色方法或细胞因子捕获和FACS分选富集这些T细胞之前和之后,对来自血液样品的单独空间分离的RNA或DNA分子进行谱分析。在两个克隆型谱之间显示显著的频率偏移的T细胞克隆型序列随后被候选为负责针对一种或多种抗原的免疫应答的克隆型。可任选地开发进一步的算法以完善关于哪些克隆型可能与该特异性免疫应答相关的预测。这些算法可以使用序列参数,诸如频率、序列长度、氨基酸序列相似性、与其他类似的克隆型序列的相似度,等等。
在一个优选的实施方案中,在一个校准点及时完成抗原捕获以鉴定相关的B细胞,并在随后的谱分析时间点不进行抗原捕获,在这个时间点上无需富集而对所有B细胞进行谱分析。
IV.确定疾病状态
由于免疫系统对人类健康是如此重要,测定免疫应答的能力在医学中具有广泛的应用。本发明教导了当潜在的疾病状态由免疫系统介导时使用免疫系统理解潜在的疾病状态的能力。这使得一组非常有效的使用免疫谱的诊断和预后应用能够告知许多临床结果的风险,并允许医生更有效地进行干预。
A.免疫谱分析在自身免疫性疾病治疗中的应用
本发明的方法能够用于诊断和治疗受试者的自身免疫性疾病。自身免疫性疾病涉及适应性免疫细胞逃脱提供自身免疫性的正常过程,并且攻击身体组织上的一些靶标。自身免疫性疾病包括,例如,急性播散性脑脊髓炎、爱迪生氏病、强直性脊柱炎、抗磷脂抗体综合征、自身免疫性溶血性贫血、自身免疫性肝炎、自身免疫性内耳病、白塞氏病、大疱性类天疱疮、乳糜泻、查加斯病、慢性阻塞性肺病、皮肌炎、I型糖尿病、古德帕斯丘氏综合征、格雷夫斯氏病、格林-巴利综合征、桥本氏甲状腺炎、化脓性汗腺炎、特发性血小板减少性紫癜、间质性膀胱炎、多发性硬化症、重症肌无力、神经性肌强直、寻常型天疱疮、恶性贫血、多肌炎、原发性胆汁性肝硬化、类风湿关节炎、硬皮病、系统性红斑狼疮、舍格伦综合征以及血管炎综合征。这些自身免疫性疾病的阶段可以使用本发明的方法来诊断。可基于自身免疫性疾病的阶段向受试者建议治疗。
关于患有自身免疫性疾病或疑似患有自身免疫性疾病的受试者的临床信息,可以用于确定疾病状态(或AutoImm load(自身免疫负荷))。临床信息可以用于确定与疾病状态相关的克隆型谱的模式。临床信息可包括,例如,身高、体重、眼球颜色、年龄、性别、民族、血压、LDL胆固醇水平、HDL胆固醇水平、家族医学史以及分子标记物信息。
临床信息可包括一种或多种自身免疫性疾病的症状。对于自身免疫性肝炎,症状可以包括疲劳、肝肿大、黄疸、瘙痒、皮疹、关节痛、腹部不适、蛛状痣、恶心、呕吐、厌食、黑尿、浅色或灰色粪便。对于皮肌炎(DM),症状可包括皮疹(面部、颈部、肩部、上胸部、肘、膝盖、指关节和背部的斑块状、蓝紫色变色)伴有或先前有肌无力、吞咽困难、肌痛、疲劳、体重减轻和低热。对于格雷夫斯氏病,症状可以包括由于能量消耗增加而发生的体重减轻、食欲增加、心率和血压升高,以及震颤、神经质和出汗。对于桥本氏甲状腺炎,症状可以包括精神和躯体放缓、对寒冷更强的敏感性、体重增加、皮肤变粗糙、甲状腺肿大。对于混合性结缔组织病(MCTD),症状可以包括系统性红斑狼疮(SLE)、硬皮症和多肌炎的特征。对于大疱性类天疱疮(BP)症状可以包括轻微的瘙痒伤痕到严重的水疱和感染、口腔或食道大疱。对于天疱疮,症状可以包括皮肤和粘膜起疱。对于恶性贫血,症状可以包括呼吸短促、疲劳、脸色苍白、心跳过速、食欲不振、腹泻、手脚麻刺感和麻木、口腔溃疡和步态不稳。对于多肌炎(PM),症状可以包括肌无力、吞咽困难和肌痛。对于原发性胆汁性肝硬化(PBC),症状可以包括疲劳和瘙痒。对于硬皮病(系统性硬化症),症状可以包括手指或手部的肿胀和虚肿、皮肤增厚、手指皮肤溃疡、手部关节僵硬、疼痛、咽喉痛和腹泻。对于舍格伦综合征,症状可以包括眼睛和口干燥、颈部腺体肿胀、吞咽或讲话困难、味觉或嗅觉异常、口渴和舌头溃疡。对于系统性红斑狼疮(SLE),症状可以包括发热、体重减轻、脱发、口鼻疮、不适、疲劳、癫痫和精神病症状、与RA相似的关节炎症、鼻子和脸颊上有蝶形皮疹、手脚对冷有极度的敏感性。对于血管炎综合征,例如,韦格纳肉芽肿病、特发性新月性肾小球肾炎(ICGN)、微镜多关节炎(MPA)、肺肾综合征(PRS),症状可以包括疲劳、虚弱、发热、关节痛、腹痛、肾脏问题和神经问题。临床信息可以来自在一个或多个时间点上的一个或多个受试者。
临床信息可以包括关于患有自身免疫性疾病的受试者对于该受试者已接受的一种或多种治疗的应答的信息。
以下探讨了AutoImm Load对于特定自身免疫性疾病的临床应用。本发明的另一实施方案涉及免疫谱分析试验与其他已经用于检测这些疾病的疾病活动性的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可以用于计算AutoImm Load或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人来源或非人来源(例如,细菌)的。识别符或标记物可以通过包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法的技术来确定。
对于系统性红斑狼疮,标记物可以包括红细胞沉降率(ESR)的水平、C-反应蛋白(CRP)水平、抗-dsDNA、其他自身抗体效价、补体水平、尿蛋白水平、尿蛋白/肌酐比值、肌酐水平、血尿素氮(BUN)水平、血小板水平、白细胞计数、血细胞比容(Hct)、Hb和尿分析结果。其他例如与SLE相关的能够整合的检验包括,例如,CD27水平、CD27++细胞水平、INF-应答性基因和趋化因子评分。
1.系统性红斑狼疮(SLE)
本发明的方法可以用于确定系统性红斑狼疮(SLE或狼疮)的状态或阶段。SLE是一种严重的自身免疫病,常常折磨年轻成年人(女性占大多数)。它以炎性过程为特征,可以影响包括皮肤、关节、肾脏、肺、心脏和中枢神经系统在内的许多器官,经常会导致残疾,有时导致死亡。该疾病遵循一个非常不可预测的过程,其特点是爆发期后接着是静止的缓解期。然而,诊断为SLE的患者定期看风湿病医生并用多种强效药物进行治疗。这些药物包括类固醇,诸如强的松和其他免疫抑制剂诸如骁悉(Cellcept)(吗替麦考酚酯)。虽然这些药物可以降低器官损伤,但他们具有显著的副作用,包括感染和不孕的风险。某些症状(例如,疼痛和疲劳)的不可靠性和不可预知的疾病过程使得制订药物剂量很困难,从而导致对某些患者过度治疗,而对其他患者却治疗不足。因此,SLE的治疗对于临床医生是巨大的治疗挑战。
临床医生可使用许多标准方法评估SLE的活动性。疾病的状态可以通过观察该病的临床症状来测量。这些方法包括体征(例如,皮疹)和症状(例如,关节痛和疲劳)的评估,以及实验室结果(例如,尿蛋白/肌酐比值、抗-dsDNA抗体和血细胞计数)。然而,这些临床指标可能是疾病状态的滞后指示,患者也许仅仅在治疗的数周或数月后就有反应。此外,在一些情况下,很难精确地评估症状(例如,疼痛和疲劳)。其他炎症指标,例如抗-dsDNA抗体、补体水平(例如,C3)、C反应蛋白(CRP)和红细胞沉降率(ESR)通常缺乏特异性和/或灵敏性。侵入性方法诸如肾脏活检对于常规使用来说是不切实际的。因此,临床医生要对他们的患者进行相当频繁的检测,却没有针对疾病状态的完美测量值。在一些测量中,将临床症状和实验室评估整合起来,诸如系统性红斑狼疮疾病活动指数(SLEDAI)和医师整体评估(PGA)。在临床实践中这些测量并不是常规的,并且在一些临床情况下常常存在不足。
在本发明的一个实施方案中,鉴定了针对不同疾病状态代表不同免疫谱的克隆型。然后通过比较所鉴定的免疫谱与患者当前的免疫谱来跟踪该疾病的状态。该疾病可以是狼疮。该疾病状态可以是爆发期和非爆发期。该免疫谱可以用作爆发状态的早期指示。这可以推动治疗决定。
在实施例部分更详细地讨论了AutoImm Load在进行SLE治疗性干预中的应用的具体实例,以及确定AutoImm Load的具体的特定可行性研究。
在一方面,SLE相关的克隆型与自身抗原特异性抗体有关。因此,确定个体患有系统性红斑狼疮的可能性的方法包括以下步骤:(a)确定该个体的B细胞样品的克隆型谱,该样品包含其克隆型的组库;以及(b)将该克隆型谱的克隆型与抗原特异性克隆型数据库的克隆型进行比较,以确定克隆型匹配的水平,从而确定系统性红斑狼疮的可能性,该抗原特异性克隆型数据库包括对于一种或多种抗原特异性的人免疫球蛋白链的基本所有克隆型,所述一种或多种抗原选自:双链DNA、丙二醛、4-羟基壬烯醛、超氧化物歧化酶、硝基酪氨酸、心磷脂、核糖体P蛋白、磷脂、小核核糖核蛋白的核心蛋白(Smith抗原)、组蛋白、U1小核核糖核蛋白、I型拓扑异构酶、着丝粒蛋白质、SS-A核糖核蛋白、SS-B核糖核蛋白和组氨酸-tRNA连接酶。
2.多发性硬化症(MS)
本发明的方法也可以用于确定多发性硬化症(MS)的状态或阶段。MS是一种影响脑部和脊髓(中枢神经系统)的自身免疫性疾病。由于每次疾病发作的位置和严重程度可能不同,症状也不同。发作可持续数天、数周或数月。这些发作与症状减轻或无症状时期(缓解期)交替出现。疾病的再现(复发)是常见的。然而,该疾病可能持续恶化而无缓解期。
因为脑部或脊髓的任意部分的神经都可能受到损伤,多发性硬化症患者在身体的许多部位都有症状。肌肉症状包括,例如,失去平衡、麻木或某些部位感觉异常、由于肌肉痉挛而引发的疼痛、手臂或腿部疼痛、手臂或腿移动存在问题、行走问题、协调性和小动作存在问题、发音含糊或言语难以理解、一个或多个手臂或腿部的震颤、肌肉群不受控制的痉挛(肌肉痉挛)以及一个或多个手臂或腿部的无力。
眼部症状包括,例如,复视、眼睛不适、不受控制的眼球快速运动和视觉丧失(通常每次影响一只眼睛)。
其他脑部和神经症状包括,例如,注意力持续时间减少、判断力下降、记忆力下降、沮丧或感觉悲伤、头晕和平衡性问题、脸部疼痛、听力丧失以及疲劳。
肠和膀胱的症状包括,例如,便秘、开始排尿困难、尿频、漏便、尿急以及漏尿(失禁)。
目前没有已知的治愈多发性硬化症的方法。然而,存在可减缓该疾病的治疗方法。治疗的目的是为了控制症状以及帮助患者维持正常的生活质量。
用于减缓多发性硬化症进展的药物可包括,例如,帮助控制免疫系统的免疫调节剂,包括干扰素(Avonex、Betaseron或Rebif)、单克隆抗体(Tysabri)、醋酸格拉替雷(Copaxone)、米托蒽醌(Novantrone)、甲氨蝶呤、硫唑嘌呤(Imuran)、环磷酰胺(Cytoxan)和那他珠单抗(Tysabri)。类固醇可以被用来减低疾病发作的严重性。
用来控制症状的药物可包括,例如,缓解肌肉痉挛的药物,诸如力奥来素(Baclofen)、替扎尼定(Zanaflex)或苯二氮
Figure BDA00002699449300761
减少泌尿问题的胆碱能药物,用于情绪或行为症状的抗抑郁药,以及针对疲劳的金刚烷胺。
MS影响女性多于男性。该疾病最常开始于20岁到40岁之间,但是可以在任何年龄段内发现。MS是一种进行性疾病,意味着神经损伤(神经变性)随时间而恶化。MS恶化的速度因人而异。当身体的自身免疫细胞攻击神经系统时,发生炎症。炎症的反复发作可以发生在脑部和脊髓的任何部位。有MS家族史的人和那些生活在MS较高发病率的地理区域的人具有较高的患病风险。
MS的症状可能模拟了许多其他神经系统疾病的症状。该疾病可以通过排除其他病状来诊断。患有一种称为复发缓解型MS的人可能有至少两次被症状缓解期或无症状期隔开的疾病发作的历史。如果中枢神经系统的两个不同部分的功能在两个不同的时间发生减退(例如异常反射),医疗服务人员可能会怀疑是MS。神经学检查可能显示身体的一个区域或遍布身体的许多部位的神经功能减退。诊断多发性硬化症的试验包括,例如,脑脊液检验,包括CSF寡克隆带分析、头部MRI扫描、腰椎穿刺(脊椎穿刺)、神经功能研究(诱发电位检测)以及脊椎MRI。
如其他自身免疫性疾病一样,MS遵循具有急性爆发和缓解期的不可预测的过程。治疗方法的数量不断增长,但每个都具有从严重的(体重增加和抑郁)到危及生命(全血细胞减少和PML感染)的副作用,在不同患者间不同的效果,以及高昂的费用。同时,缺少对MS疾病活动性的高度准确的和特异性的常规检测,使得有效地实施治疗的挑战变得复杂。即使没有治疗,临床发作也可能被长时间的阶段(在疾病早期长达数年)分开。此外,可获得的药物降低复发的可能性,但不能完全阻止复发。因此,疾病的活动性是难以评估的,并因此,有一种不适当的疾病活动性的短期测量,能够用于通过测量复发次数或严重性的下降来检测具体的治疗方法是否对给定患者具有疗效。仅有的另一个可用于监测疾病活动性的检查是脑部MRI,用于跟踪损伤的状态,其借助于诸如钆的对比度增强剂来显示损伤状态。然而,这种成像仅仅提供了脑部损伤的综合显示,而缺少特异性和时间分辨率。考虑到花费、缺少特异性和过度造影剂暴露的危险,试图用MRI成像在短于一年的时间长度上跟踪疾病进程是不切实际的。因而,患者经常要以巨大的代价治疗很长时间,而没有任何能够帮助医生调整剂量和/或转换到其他治疗的有效反馈。
在本发明的一个实施方案中,鉴定不同疾病状态代表不同免疫谱的克隆型。然后通过将鉴定的免疫谱与患者当前的免疫谱相比较,从而跟踪疾病状态。疾病可以是MS。疾病状态可以是缓解期和活动期。该免疫谱可用作对缓解期或非缓解期的早期指示。这可以推动治疗决定。
3.类风湿关节炎(RA)
本发明方法能够用于测量类风湿关节炎患者的疾病状态。类风湿关节炎(RA)是一种慢性的、系统性的炎症性疾病,能够影响许多组织和器官,但主要攻击关节,产生炎症性滑膜炎,这种炎症性滑膜炎常常发展成关节软骨损坏以及关节强直。类风湿关节炎还能够在肺部、心包膜、胸膜和巩膜部位产生弥漫性炎症以及产生结节性病变,最常见于皮肤下的皮下组织。虽然类风湿关节炎的起因是未知的,但是自身免疫对它的慢性和进行性具有关键作用。
大约1%的世界人口患有类风湿关节炎,女性比男性高三倍。发病在40至50岁之间最频繁,但是任何年龄的人都可能会患病。它可能是一种致残的和令人痛苦的病状,其能够导致功能和活动性的基本丧失。RA主要是靠症状和体征进行诊断,但是也可以用血液检验(尤其是称作类风湿因子的检验)和X射线来诊断。通常由风湿病医生——关节和结缔组织疾病方面的专家来进行诊断和长期管理。
有各种治疗方法可供使用。非药理学治疗包括物理疗法、矫正器以及职业疗法。包括类固醇在内的镇痛药(止痛药)和抗炎药物可用于抑制症状,而缓解疾病的抗风湿药物(DMARD)可用于抑制或终止潜在的免疫过程和阻止长期损伤。如今,更新的一类生物制剂增加了治疗选择。
当在临床上怀疑RA时,可以进行免疫学研究,诸如检测类风湿因子(RF,一种特异性抗体)的存在。RF阴性并不能排除RA;相反,关节炎是所谓血清阴性的。大约15%的患者是这种情况。在患病的第一年内,一些个体的类风湿因子更可能呈现阴性,而随着时间转变为血清阳性状态。RF也可见于其他疾病(例如舍格伦综合征)和大约10%的健康人群,因此该试验并不十分特异。
由于这种低特异性,已经开发了新的血清学试验,该试验检测所谓的抗瓜氨酸蛋白抗体(ACPA)的存在。如同RF,这些试验仅在所有RA病例的一部分中(67%)是阳性的,但是如果未患RA则极少出现阳性,提供约95%的特异性。正如RF,有证据表明ACPA在许多病例中存在,甚至在临床疾病发病前。
对ACPA最常见的试验是抗CCP(环瓜氨酸肽)试验和抗MCV测定(抗突变的瓜氨酸波形蛋白的抗体)。最近,开发了一种用于早期检测RA的血清学即时检测(POCT)。该检测结合了对类风湿因子和抗MCV的检测,用于诊断类风湿关节炎,并且显示出72%的灵敏度和99.7%的特异性。
此外,可以进行多个其他的血液检验以允许检测关节炎的其他起因,诸如红斑狼疮。红细胞沉降率(ESR)、C反应蛋白、全血计数、肾功能、肝酶和其他免疫学检测(例如,抗核抗体/ANA)都在这个阶段进行。铁蛋白水平升高可以揭示血色素沉着病——一种模拟RA,或是斯提耳氏病的体征,斯提耳氏病是血清阴性的、通常在青少年中发生的类风湿病的变型。
术语“缓解疾病的抗风湿药物(DMARD)”最初是指影响诸如ESR和血红蛋白和自身抗体水平的生物学测量的药物,但是现在通常用于指可以降低对骨骼和软骨的损伤率的药物。已经发现DMARD既可以产生持久的症状缓解,也可以延缓或终止病情进展。这是非常重要的,因为这种损伤通常是不可逆的。抗炎药和镇痛药改善疼痛和僵硬,但不能阻止关节损伤或减慢疾病的进展。
在风湿病医生中逐步达成以下共识,对于关节的永久性损伤发生在疾病的极早期。过去,通常仅使用抗炎药来开始治疗,并在临床上以及使用X射线评估进展。如果有证据表明开始发生关节损伤,那么将开出更强力的DMARD。超声波和MRI是更加灵敏的关节成像方法,并且已经证明关节损伤发生在比之前想象的更早期以及更多的患者中。X射线检查正常的人常常可以通过超声波检测到X射线无法显示的病变。现在的目的是在损伤发生前进行治疗。
对于为什么早期启动DMARD有益于阻止结构性关节损伤可能有其他原因。从疾病的最早阶段开始,关节就被免疫系统的细胞所浸润,这些细胞以可包含多种正反馈回路(长期观察发现,单一皮质类固醇注射可以长期中止特定关节中的滑膜炎)的方式相互间发送信号。利用有效的DMARD(诸如甲氨蝶呤)尽可能早地打断该过程似乎可以在之后的数年改善RA的结果。长期来看,在症状发生后延缓治疗少至数月可能导致更糟的结果。因此,当患者对治疗的响应性最高并获益最多时,对建立对早期关节炎的最有效的治疗方法具有相当大的兴趣。
用于治疗关节炎的传统小分子质量药物包括,例如,化学合成的DMAED:硫唑嘌呤、环孢菌素(环孢菌素A)、D-青霉胺、金盐、羟氯喹、来氟米特、甲氨蝶呤(MTX)、米诺环素和柳氮磺胺吡啶(SSZ)。细胞毒性药物包括环磷酰胺。
最常见的副作用涉及肝脏和骨髓毒性(MTX、SSZ、来氟米特、硫唑嘌呤、金化合物、D-青霉胺)、肾毒性(环孢菌素A、肠胃外金盐、D-青霉胺)、肺炎(MTX)、变应性皮肤反应(金化合物、SSZ)、自身免疫性(D-青霉胺、SSZ、米诺环素)和感染(硫唑嘌呤、环孢菌素A)。羟氯喹可造成眼部毒性,虽然这是罕见的,并且由于羟氯喹不影响骨髓或肝脏,它常常被认为是具有最低毒性的DMARD。遗憾的是,羟氯喹不是非常有效的,且依靠其自身常常不足以控制症状。
生物制剂可以通过基因工程来生产,包括,例如,肿瘤坏死因子α(TNFα)阻断剂-依那西普(Enbrel)、英夫利昔单抗(Remicade)、阿达木单抗(Humira),白细胞介素1(IL-1)阻断剂-阿那白滞素(Kineret),抗B细胞单克隆抗体-利妥昔单抗(Rituxan),T细胞协同刺激阻断剂-阿巴西普(Orencia),白细胞介素6(IL-6)阻断剂-塔西单抗(抗-IL-6受体抗体)(RoActemra、Actemra)。
抗炎药包括,例如,皮质类固醇、非甾体抗炎药(NSAID,多数也作为镇痛药)。镇痛药包括,例如,扑热息痛(在美国和加拿大称为对乙酰氨基酚)、阿片制剂、地普喹酮和外用利多卡因。
治疗RA的挑战在于以下事实:该病是一种长期慢性病,可导致具有挑战性的残疾,存在的多种治疗方法中每一种都有明显的缺点。许多DMARD使得患者遭受显著的副作用,这些副作用包括严重感染、癌症或甚至自身免疫性疾病的风险增加。此外,生物来源的药物非常昂贵,而患者可能要经受频繁的注射。
对患者启动治疗的医生会面临许多可能的选择。一旦患者开始治疗则期望获取快速的反馈,以了解患者是否对在出现临床表现之前所选择的疗法有反应。成像技术是不灵敏且昂贵的,并且许多血液标记物(诸如CRP)缺少足够的灵敏性。允许内科医生快速确定疾病状态的试验可以允许他或她快速地将疗法调整为更加有效的疗法,从而使患者免于额外的关节损伤,并且更加有效地使用可利用的昂贵的疗法。
从开始治疗起没有经历过任何急性爆发的患者实际上可能仍然经历着临床上未表现的进行性关节炎症损伤。使医生可以从背景中区分该状态的试验将允许调整疗法以努力使患者更接近不经历进行性关节损伤的状态。
关于AutoImm Load如何能够用于处理RA患者的具体实例在本文件的实施例部分进一步详细描述。
在本发明的一个实施方案中,鉴定针对不同疾病状态代表不同免疫谱的克隆型。然后通过将已鉴定的免疫谱与患者当前的免疫谱进行比较,而跟踪该疾病状态。该疾病是RA。该疾病状态可以是,但是不限于严重炎症和基线时期。这些免疫谱用于推动治疗决定。
4.强直性脊柱炎
该方法能够用于检测强制性脊柱炎的疾病活动性。强直性脊柱炎(AS,来自希腊语强直,弯曲;椎骨,脊椎),之前被称为Bechterew病、Bechterew综合征以及Marie Strümpell病,脊椎关节炎的一种形式,是一种慢性炎症性关节炎和自身免疫性疾病。它主要影响脊柱中的关节和骨盆中的骶髂,最终导致脊柱融合。它是具有强烈遗传倾向的脊椎关节病的成员之一。完全融合导致脊柱的完全僵化,这是一种被称为竹节状脊柱的病状。
典型的患者是年轻男性,年龄在18至30岁之间,当首次出现该病的症状时,在脊柱的下半部或有时在整个脊柱会伴有慢性疼痛和僵硬,常常伴有从骶髂关节到一侧或另一侧臀部或大腿背部的疼痛。受影响的男性多于女性,约为3∶1的比例,通常患有该疾病的男性会经历比女性更加痛苦的过程。在40%的病例中,强直性脊柱炎与眼部的炎症(虹膜睫状体炎和葡萄膜炎)有关,导致发红、眼部疼痛、视力障碍、飞蚊症和畏光。另一种常见症状是全身疲劳,且有时还会恶心。可能会出现少见的主动脉炎、顶端肺纤维化和骶神经根鞘扩张。正如所有血清学阴性的脊柱关节病,可能会出现指甲翘起(甲剥离)。
没有用来诊断AS的直接试验。显示特征性脊柱变化和骶髂关节炎的脊柱临床检查和X射线研究是主要的诊断工具。X射线诊断的缺点是,在X射线证明在平片X射线上发生变化之前,AS的体征和症状通常已经存在了长达8-10年,这意味着在引入适当的疗法前延误了长达10年。早期诊断的选择是对骶髂关节进行断层摄影术和核磁共振成像,但是这些检查的可靠性仍然不清楚。斯考伯试验是在检查中进行的腰椎弯曲度的有用的临床测量。
在急性炎症期期间,AS患者有时会显示C反应蛋白(CRP)的血液浓度增加,以及红细胞沉降率(ESR)提高,但是也有许多AS患者的CRP和ESR率未提高,所以,正常的CRP和ESR结果并不总是与患者实际具有的炎症量相符合。有时,AS患者具有正常水平的结果,然而他们的体内却正经历着显著量的炎症。
强直性脊柱炎(AS,来自希腊语强直,弯曲;椎骨,脊椎),之前被称为Bechterew病、Bechterew综合征和Marie Strumpell病,脊椎关节炎的一种形式,是一种慢性炎症性关节炎和自身免疫性疾病。它主要影响脊柱中的关节和骨盆中的骶髂,最终导致脊柱融合。
它是具有强烈遗传倾向的脊椎关节病的成员之一。完全融合导致脊柱的完全僵化,这是一种被称为竹节状脊柱的病状。
有三种主要类型的药物用于治疗强直性脊柱炎:1)抗炎药,包括诸如布洛芬、苯基丁氮酮、吲哚美辛、萘普生的NSAID,和COX-2抑制剂,它们能够减轻炎症和疼痛。通过临床证据也证实了阿片类止痛药在缓解AS患者通常所经历的慢性疼痛方面是非常有效的,特别是在延时释放制剂中。2)DMARD,诸如环孢菌素、甲氨蝶呤、柳氮磺胺吡啶和皮质类固醇,用于通过免疫抑制来降低免疫系统响应;3)TNFα阻断剂(拮抗剂),诸如依那西普、英夫利昔单抗和阿达木单抗(也称为生物制剂),指示免疫抑制剂的治疗,并且如在其他自身免疫性疾病中一样是有效的免疫抑制剂。
已经证明TNFα阻断剂是最有希望的治疗剂,可以减缓大多数临床病例的AS进展,帮助许多患者获得其炎症和疼痛的显著减低,虽然不能消除。也已经证明了他们不仅在治疗关节炎方面,而且在治疗与AS有关的脊柱关节炎方面,都有高度有效。除了通常的高费用外,缺点是这些药物增加了感染风险的事实。由于这个原因,任何TNF-α阻断剂的方案都包括在开始治疗前对于结核的检测(如Mantoux或Heaf)。如果发生复发感染,甚至复发咽喉痛,则由于涉及免疫抑制可能需要暂停治疗。建议服用TNF药物的患者限制接触其他携带或可能携带病毒(如感冒病毒或流感病毒)或可能具有某种细菌或真菌感染的人。
AS影响产生在健康人群中非常常见的症状。例如,主诉严重背痛的患者不一定正经历AS爆发,而可能只是患有常规的背痛。在未对疾病状态进行非常精确的观察的情况下,迫使医生作出是否使用昂贵的具有潜在严重副作用的药物来治疗这些症状的决定。CRP和ESR并不提供对该疾病状态的非常准确的观察。同时,未经治疗的疾病的过程可能导致长期的脊髓损伤恶化。该事态导致了困难的临床挑战并采用显著的过度治疗。反映疾病活动性的客观测量的可用性对于AS患者的处理可能具有很大的帮助。
在本发明的一个实施方案中,鉴定针对不同疾病状态代表不同的免疫谱的克隆型。然后通过将已鉴定的免疫谱与患者当前的免疫谱相比较,来跟踪该疾病的状态。所述疾病是AS。所述疾病状态可以是,但不限于高炎症期和基线期。这些免疫谱用于推动治疗决定。
B.免疫谱分析在癌症检测中的应用
这些方法可用于测量癌症风险。在工业化世界,癌症已经成为死亡的首要原因。因此,亟需治疗癌症的方法。正在尝试许多癌症治疗方法,包括新的小分子药物的开发,以及靶向肿瘤的抗体。
已经提出的一组方法是免疫疗法。肿瘤监视是免疫系统细胞的功能之一。有几种被免疫系统识别的肿瘤抗原类别。第一个类别由肿瘤内的体细胞突变(点突变或易位)新产生的抗原组成。另一个类别由来自仅在不表达MHC分子的男性生殖细胞中表达的蛋白质的抗原组成。在许多肿瘤中基因表达的调节异常可能会允许这些抗原中的一些得到表达。第三个类别包括来自仅在特定组织中表达的蛋白质的抗原。第四个类别包括在肿瘤组织中明显过度表达的抗原。最后,第五个类别包括由异常的翻译后修饰产生的抗原。
肿瘤的一个特性是他们逃脱免疫系统的有效清除的能力。据认为,在肿瘤中获得的新的突变允许其从平衡相(此时肿瘤没有完全被消除但是其生长受到抑制)进入逃脱相,在逃脱相肿瘤生长而没有受到免疫系统的有效控制。肿瘤可以采用很多机制逃脱免疫系统。这些机制包括缺乏特异性抗原肽或能够激活T细胞的共刺激分子。其他机制包括肿瘤分泌抑制T细胞的因子和通过创建分隔肿瘤与淋巴细胞的物理屏障而产生肿瘤诱导的特殊部位。正在以多种方式研究和测试诱导免疫系统以更好地对抗肿瘤,作为治疗癌症的一种策略。一种方法是过继性T细胞疗法。该方法集中于通过分离那些浸润肿瘤和/或与特异性肿瘤抗原反应的细胞来鉴定靶向肿瘤抗原的T细胞。这些T细胞可以在提高他们的有效性的情况下,如使用IL-2和/或抗原呈递细胞,在体外进行生长。随后将扩增的细胞输注回患者血液中。另一种方法是使用含有肿瘤特异性TCR的逆转录病毒。这些逆转录病毒能够输注到患者的特定细胞中,该细胞随后分泌逆转录病毒,使其感染T细胞,该T细胞随后开始表达肿瘤特异性TCR。最后,一种普通的方法是使用疫苗接种。该治疗方法的前提是用一种或多种肿瘤抗原对患者的免疫将刺激免疫系统抗击肿瘤的能力。常常使用佐剂(如卡介苗(BCG))来完成免疫。正如预防由HPV-16和HPV-18诱发的宫颈癌的能力所证明的,这种方法已经在预防病毒诱发的癌症中获得成功。然而,这种方法却在其他肿瘤的治疗中不太成功。由于能够获得导致例如乳腺癌和宫颈癌死亡率降低的更好的早期检测方法,因癌症造成的死亡率发生了很大改善。肿瘤的可突变性使得他们的早期治疗比在晚期检测后的治疗更为有效。传统上,寻找肿瘤检测生物标志物通常包括寻找在肿瘤中高度表达而在正常组织中处于低水平或不存在的标志物。这已导致鉴定了许多肿瘤标志物,如PSA。癌症的早期检测的一个问题是,当生物标志物的检测最困难,即,肿瘤非常小时,出现癌症检测的最大值。因此,为了获得能够区别具有小肿瘤的患者与无肿瘤者的有效的癌症检测生物标志物,需要由于肿瘤和正常组织之间在大小上的很大差别而在肿瘤和正常组织之间具有巨大的表达差别。此外,标志物需要有效地“溢出”到血液或其他体液以允许使用非侵入性技术进行检测。
本发明教导了一种使用免疫细胞应答来检测癌症的新机理。从这方面来说,不是通过检测由肿瘤自身产生的标志物,而是通过检测肿瘤的免疫系统应答来实现癌症检测。具体来说,TCR和/或BCR谱能够了解关于身体是否对肿瘤产生了应答。这能够解决现有生物标志物的一些问题。首先,免疫应答是扩大的信号,更容易被检测到。其次,淋巴细胞有规律地通过血液,并因此相关的生物标志物可能会比传统的肿瘤生物标志物更容易地在外周血中存在并可检测到。最后,由正常组织产生的“背景”生物标志物材料的问题大大降低。T细胞和/或B细胞的极大多样性提供了一种具有高灵敏度和特异性的检测相关生物标志物的方式,特别是目前可以获得高通量DNA测序方法。基于免疫系统对癌症的应答来检测癌症的方法利用了免疫治疗的基础。然而,这两种应用的风险可能大有不同。利用对癌症的免疫应答进行检测不需要特定克隆型对治疗肿瘤有效,而是需要它与对肿瘤的免疫应答相关。
本发明的另一实施方案涉及将免疫谱分析试验与已经用于癌症检测的其他标志物相结合,以使得试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源(例如,细菌)的。识别符或标记物可通过一些技术来确定,该技术包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。
C.免疫谱分析在移植医学中的应用
这些方法可以用于检测移植器官的免疫排斥反应。器官移植已经成为医学不可或缺的一部分,在美国,每年进行超过25,000例实体器官(肾脏、肝脏、心脏、胰脏和肺)移植以及超过15,000例骨髓移植。它们通常是在三级护理中心进行的复杂的操作。为了将移植排斥反应的风险最小化,通常在患者有癌症和感染风险的较长时间内对患者进行免疫抑制。此外,许多移植物被急性排斥,或者在移植后数年才排斥。尽管存在这些问题,但是器官移植仍然是必要的治疗方式,因为对于器官衰竭的患者几乎没有其他备选方案。
实体器官移植排斥反应主要是由于适应性免疫系统对所移植的器官的应答而发生的。这是由于移植物中存在被宿主免疫系统识别的同种异体抗原。该排斥反应可能在三个不同的阶段发生。第一个是移植后数分钟内的超急性期,在该阶段预形成的抗体对移植物产生响应。第二个是在移植后前几周或数月内发生的急性排斥反应。最后一个是可能在移植数年后发生的慢性排斥反应。考虑到这些风险,已经采取护理以使供体和受体间的免疫原性差异最小化。例如,当供体和受体的ABO亚型相匹配并进行交叉配型试验(确定受体是否具有与供体的白细胞反应的抗体)时,超急性反应的风险大大降低。相似地,对主要组织相容性(MHC)进行仔细匹配以减少急性排斥反应。然而,考虑到MHC分子具有极高的多态性,很难找到完美的匹配。单卵双生具有完美的MHC匹配。相似地,预计有1/4的兄弟姐妹具有完美的MHC匹配。在每个临床试验中检测到相同等位基因的非亲缘个体通常由于在常规临床实践中未检测的其他多态性位点而存在差异。然而,即使是具有来自兄弟姐妹的完美MHC匹配,由于次要组织相容性抗原的存在仍具有显著的排斥反应的风险,并且急性排斥反应确实非常普遍地发生在一半以上的移植物中。
人们可能相像,对MHC基因座的更加积极的检测以及对次要组织相容性抗原的鉴定和匹配将会显著改善移植物排斥和可能的存活率。然而,事实是,可获得的供体器官数量有限使得这项任务不切实际,因为更积极的检测可能显著延误确定对每个患者合适的移植物。因此,在移植领域发生的许多进展是使用免疫抑制剂来预防和治疗排斥反应。目前有许多药物用于该目的,包括:硫唑嘌呤、皮质类固醇、环孢菌素、他克莫司、吗替麦考酚酸、西罗莫司、莫罗莫那-CD3、抗CD25单克隆抗体、抗CD20单克隆抗体以及钙依赖磷酸酶抑制剂。
骨髓移植最常用于白血病和淋巴瘤治疗。通常,接受者经历激进的放射和/或化学治疗方案以在移植前减少肿瘤负荷。来自供体的成熟T细胞可以在反向排斥中攻击某些宿主组织,这被称为移植物抗宿主病(GVHD)。这通常表现为疹、腹泻和肝病。仔细的MHC匹配能够改善但不能消除这一问题。一个解决方案是在体外从供体骨髓中排除最终引起GVHD的成熟T细胞。与此相关的一个问题是引起GVHD的同一现象可能通过移植物对抗白血病的效果(其中供体T细胞攻击剩余的癌细胞)担负骨髓移植的某些治疗效果。另外,供体T细胞的排除可能使患者具有免疫缺陷的风险。因此,当考虑这些方法时必须平衡风险与利益。因此通常用免疫抑制剂治疗患者以预防以及治疗GVHD。
目前的骨髓处理(对于实体器官移植更是如此)严重依赖于使用强免疫抑制剂的治疗。然而,考虑到这些药物具有重大的风险,它们的使用要同时平衡风险与利益。然而,考虑到不能很好地了解特定患者在特定时间的风险,用针对平均患者的平衡了风险与利益的剂量治疗患者。能够预测未来排斥事件的检测有助于帮助患者在他们需要的适当时间定制治疗方案。这可使得某些患者中使用的免疫抑制剂的量减少,同时改善排斥率和希望的移植物存活率。
本发明的另一个实施方案涉及免疫谱分析试验与其他已经用于检测移植排斥的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法或者用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源的(例如细菌的)。识别符或标记物可以通过多种技术来确定,包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。
D.免疫谱分析在感染治疗中的应用
这些方法在指导感染的治疗中具有实用性,尤其是当这些感染能够以活动和潜伏状态存在时。在过去一个世纪,用于治疗感染性疾病的抗生素的出现对于预期寿命作出了巨大的影响。在过去十年,分子诊断技术已经在感染性疾病的诊断和处置中具有快速增长的作用。通过核酸扩增提供的出色的灵敏度和特异性已经使这些技术能够应用到越来越多的应用中。许多应用用于诊断性评价传染原的存在或不存在。例如,经常通过采用核酸扩增技术的分子检测来进行对性传播疾病的检测。另一组应用涉及在已经诊断具有传染原的患者中评价感染的“载量”。其一个例子是在已经诊断为AIDS的患者中评价HIV病毒载量。这种检测可以帮助医生确定患者的疾病状态,并因此可以提供关于正在使用的治疗方案的有效性的指导。
有时这不仅有助于考虑感染原的水平,而且有助于考虑针对感染原的免疫应答。在临床实践中常规使用针对感染的免疫应答的一个例子是在乙型肝炎中。乙型肝炎检测的一个方面依赖于通过核酸扩增试验检测乙型肝炎抗原来检测传染原。此外,通常在常规临床实践中检测针对乙型肝炎的不同抗体的存在。抗-HBc IgM的存在通常发生在急性感染情况中,抗-HBc IgG的出现表明感染是慢性的。同样,抗-HBs抗体的出现表明感染被清除。
在本发明的一个实施方案中,评估针对感染的免疫应答,其价值基于分子检测的灵敏度和特异性。这对于其中传染原在机体中保持潜伏的慢性感染性疾病可能尤其有用。可以使用TCR和/或BCR谱来评估针对感染的免疫应答。可以使用测序来获得TCR和/或BCR谱,以允许以高灵敏度和特异性地检测特定的克隆型。为了确定与疾病相关的特定克隆型,设计了数种方法。
本发明的另一个实施方案涉及免疫谱分析试验与其他已用于检测传染原的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源的(例如,细菌的)。识别符或标记物可以通过多种技术来确定,包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。
E.免疫谱分析在治疗衰老患者中的应用
这些方法在监测老年人的免疫系统的状态中具有实用性。老年人经历免疫系统的下降,称为免疫衰老,这影响他们对感染作出应答和引起对疫苗的有效应答的能力(Weinberger等人,2008)。从老年人因肺炎导致的高死亡率(国家统计局,2005年)以及他们对医院获得性感染如艰难梭菌和甲氧西林抗性金黄色葡萄球菌的易感性(健康保护署,2008年)来看,这是很明显的。而且,免疫系统能力的下降被认为可以解释老年人中癌症比例的增加。此外,免疫衰老可以导致老年人的具有炎症过程的重要方面的其他主要疾病,如阿尔兹海默病和心脏病。预测哪些个体最具有这些致命结果的风险的能力对于老年病医生是有帮助的,因为他们可以据此作出关于疫苗接种、积极治疗感染和住院治疗的临床决定。
在免疫衰老中,先天性免疫和适应性免疫系统的许多方面都发生改变。T细胞丧失应答性,巨噬细胞具有降低的抗原呈递能力和改变的细胞因子分泌,自然杀伤细胞具有降低的毒性,滤泡树突状细胞不能有效地呈递抗原,而中性粒细胞丧失吞噬能力。幼稚T细胞和B细胞池更小,而记忆细胞和效应细胞池增加,导致T和B细胞组库的多样性降低,从而导致适应性免疫系统响应新抗原的能力下降。与巨细胞病毒(CMV)相关的T细胞组库尤其大大增加,可能占据总T细胞组库的几乎45%。已经注意到,在百岁老人中这种增加不太明显。
研究表明,免疫标记物可以预测老年人的生存期。已经表明B细胞组库的多样性程度至少在一个人群中可以预测老年人的生存期。即使表明TCR和BCR多样性的这些总体差异可以预测临床结果,但是这些标记物缺乏特异性。组库数据的更深入的分析可以提供显著更高的预测精度。例如,对CMV反应性的扩充可以与其他扩充具有不同的意义。
在本发明的一个实施方案中,可以从已跟踪临床病史数年的老年患者的纵向群组中收集来自外周血中发现的T细胞和B细胞的RNA。可以对这些群组的每一个,在他们的临床史的数个时间点扩增TCRα和TCRβ基因以及IgH、IgK和IgL基因。将生存期长的患者与生存期短的患者的谱进行比较。首先,可以获得多样性的总体测量。这不仅包括所鉴定的不同克隆型的数量,而且包括它们的多样性。例如,V、D、J区段使用在两组中是否相同?或者一组中它的使用是否更被限制?例如,两份样品可能具有相同数量的独立克隆型,但是其中一份样品的克隆型没有覆盖许多V区段。与克隆型分布于所有V区段中的其他样品相比,预期这种样品在新抗原应答中的多能性更低。
除了总体多样性,还确定是否可以基于一些序列参数来区分生存期长的患者中的扩充的克隆型与生存期短的患者中的克隆型。可以通过寻找对特定抗原具有响应的克隆型来补充这种方法。例如,考虑到可以获得的证据,CMV反应性克隆型的鉴定可能具有预测能力。可以从一组老人以及健康患者中捕获在发现研究中为CMV反应性的T细胞克隆型。可以研究这些克隆型的序列以确定将它们与其他克隆型区分开来的参数。使用这种CMV克隆型预测算法以及用上面所述的纵向群组,可以评估增加这种信息是否可以增加从不能长期生存的患者预测可以长期生存的患者的能力。
本发明的另一个实施方案涉及免疫谱分析试验与其他已经用于检测老年群体的健康的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法中或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源的(例如,细菌的)。可以通过多种技术确定识别符或标记,这些技术包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。
F.免疫谱分析在疫苗施用中的应用
这些方法在疫苗的施用中具有实用性。采用接种疫苗显著降低了多种生物体的感染率。流感在美国每年导致超过30,000例死亡,持续显著健康影响。因为毒株变异迅速,每年必须进行流感疫苗接种。该疾病的大部分严重的后遗症发生在老年人中。遗憾的是,老年人经常免疫衰老,这导致他们对疫苗接种的应答不足。
为了区别对疫苗接种有反应的患者与对疫苗接种没有反应的患者,需要进行研究。在这个群体中,对于具有已知的流感结果(即他们后来是否受到针对感染的保护)的接种流感疫苗的患者群组可获得疫苗接种之前和(在一个或多个设定时间)之后的血液样品。从这些样品可以获得TCR和/或BCR序列。确定每位患者在疫苗接种后富集的克隆型。然后将对疫苗接种有反应的患者中富集的克隆型与一组对照克隆型(例如,在同组患者中的其余的克隆型)进行比较,以便区别相关克隆型与其他克隆型。然后使用预测这些克隆型的算法来预测对疫苗接种没有反应的患者中的相关克隆型。没有反应的患者产生的克隆型可能与有反应但水平较低的那些患者相同。另外,无反应者可能产生一类独特的克隆型。在无反应者中鉴定出的相关克隆型的数量可以区分这两种可能性。
在另一个实施方案中,通过首先在疫苗接种后从个体获得淋巴细胞的样品,然后从该样品分离对疫苗具有反应性的淋巴细胞,来监测个体对疫苗接种的反应性。对于B细胞,使用来自疫苗或与之相关的抗原性物质作为附着到固体支持物如磁珠上的捕获部分,利用常规的亲和纯化很容易地进行这种分离。也可以采用常规的方法,例如,美国专利7,776,562;7,125,964;5,635,363或类似方法(通过引用并入本文)进行T细胞的分离。从分离的淋巴细胞样品产生克隆型谱以获得一组相关克隆型。在随后的时间点,从个体获得外周血样品并生成克隆型谱。监测在随后的样品中相关克隆型的频率变化率以确定个体对疫苗接种的反应性。可以用以下步骤实施这种监测对疫苗接种的反应性的方法:(a)在疫苗接种后从个体的外周血富集淋巴细胞样品以获得疫苗反应性淋巴细胞的样品;(b)从疫苗反应性淋巴细胞样品确定克隆型谱以鉴定一种或多种与疫苗应答相关的患者特异性克隆型;以及(c)从随后的一个或多个时间获得的外周血细胞样品确定克隆型谱中一种或多种患者特异性克隆型中的每一种的水平,以监测个体对于疫苗接种的反应性。在一个实施方案中,根据在随后测定的克隆型谱中一种或多种患者特异性克隆型的量或频率的增加而确定反应性。
用鉴定的相关克隆型,然后建立算法以产生用于预测免疫的可能性的评分。采用来自疫苗反应者和无反应者的谱的数据来产生这种算法。然后可以使用这种算法并使用从免疫后获得的样品预测的相关克隆型来预测下一位患者中免疫的可能性。通过应用另一种也已经在发现研究中产生的算法进行预测。可任选地通过来自预先校准的数据帮助(或取代)而将相关克隆型搜索限制在免疫后富集的那些克隆型。
本发明的另一个实施方案涉及免疫谱分析试验与其他已经用于检测对疫苗接种的反应的标记物的组合,以使试验具有更高的灵敏度和特异性。其他分子识别符或标记物可用于计算负荷算法或用于确定疾病状态。分子识别符可以包括核酸、蛋白质、碳水化合物和脂质,以及核酸或蛋白质的表达谱。分子识别符可以是人或非人来源的(例如,细菌的)。可以通过多种技术确定识别符或标记物,这些技术包括,例如,比较基因组杂交(CGH)、染色体微阵列分析(CMA)、表达谱分析、DNA微阵列、高密度寡核苷酸微阵列、全基因组RNA表达阵列、肽微阵列、酶联免疫吸附试验(ELISA)、基因组测序、拷贝数(CNV)分析、小核苷酸多态性(SNP)分析、免疫组织化学、原位杂交、荧光原位杂交(FISH)、PCR、Western印迹法、Southern印迹法、SDS-PAGE、凝胶电泳和Northern印迹法。
G.免疫谱分析在监测免疫超敏反应(变态反应)中的应用
适应性免疫系统已经进化为对与病原体相关的抗原有反应。在自身免疫性疾病的情况下,免疫系统有时可能具有错误的目标。在自身免疫性疾病中,免疫系统针对自身抗原,而在超敏反应中,产生对有害刺激如药物、灰尘和食物的反应。超敏反应非常常见,多达50%的美国人对环境刺激过敏,它是由机制引起的。超敏反应分为4种类型。I型超敏反应是速发型超敏反应,由IgE介导。II型往往是由于IgG抗体结合到细胞表面相关抗原上而导致的。例如,结合于细胞表面的无害药物在碰巧具有这些抗体的患者中可能使该细胞成为抗药物IgG的目标。III型是由抗原-抗体复合物在组织上沉积所引起的。例如,当抗原量很大导致产生不能被有效清除而是沉积在血管壁上的小免疫复合物时会发生这种情况。IV型超敏反应是由T细胞介导的迟发型超敏反应。I型和IV型对人体健康具有最大的影响。
在I型超敏反应中,患者通过产生针对无害抗原(变应原)的IgE抗体而变得对无害抗原(变应原)敏感。后来暴露于变应原诱导了IgE结合细胞如肥大细胞和嗜碱性粒细胞的活化。一旦活化,这些细胞通过分泌储存的化学物质以及合成细胞因子、白三烯和前列腺素而诱导炎症过程从而引起变态反应。变应原的剂量和进入途径决定了变态反应的程度,其范围可以从变应性鼻炎的症状到过敏症中危及生命的循环衰竭。通常,急性I型反应之后是另一个晚期,该晚期在许多产生的病理过程中起作用。T辅助细胞和其他炎症细胞的募集的晚期基本上是IV型超敏反应。一些I型变态反应包括季节性鼻炎结膜炎(枯草热)、食物过敏、药物诱发的过敏、特应性皮炎(湿疹)和哮喘。这些是非常常见的病状,其患病率不断上升,导致巨大的花费以及发病率和死亡率。例如,哮喘是一种影响美国人口的约7%的慢性疾病,其每年引起约4,000例死亡。这些疾病中的一些具有一些相关的问题。例如,特应性皮炎患者具有显著增加的患上哮喘的风险。食物过敏可以引起呕吐和腹泻,但也可以在相当数量的患者中导致过敏,在美国每年约有30,000例,导致约200例死亡。一些激活鼻中的粘膜下肥大细胞而引起变应性鼻炎症状的相同的变应原也可以激活下呼吸道中的肥大细胞,引起支气管收缩,这是典型的哮喘症状。一些IV型超敏性反应是接触性皮炎(例如,毒葛)、慢性鼻炎、慢性哮喘和乳糜泻。乳糜泻是由非IgE介导的食物过敏引起的慢性疾病。它是由针对谷蛋白(一种存在于小麦和其他食品中的组分)的变应性应答引起的小肠的疾病。超过95%的乳糜泻患者具有特定的MHC II类等位基因,HLA-DQ2。
超敏反应的治疗不同,但他们往往具有两个方面:急性治疗和慢性处置或预防。一些这样的病状可能是危及生命的(过敏反应和急性哮喘),需要立即就医。慢性处置通常涉及设法避免特定变应原。当可以清楚地确定变应原(例如,针对坚果的变态反应)时,这可能是有效的,但是当变应原广泛存在于环境中时,如对于花粉或灰尘,这可能是困难的。因此,对于一些这样的疾病(例如,哮喘和变应性鼻炎),通常采用药物进行慢性治疗。当患者再次暴露于该变应原时,最终检测治疗处置的有效性水平。因此,一些患者可能受到过度或不足的治疗。理想地,可以获得评价疾病活动性和患者发生超敏反应应答的容易程度的试验。这种试验允许根据个别患者的需要定制治疗。
H.淋巴肿瘤的检测
本发明的一个方面将采用下一代测序技术来评价淋巴细胞癌症中的特定TCR或BCR重排的水平。这些测序技术可以以合理的成本从100万或更多个空间分离的单独TCR或BCR分子获得序列阅读。使用这些技术仍然可以以特定的方式检测以1/1,000,000或更低频率存在的序列,因此允许以该水平检测与特定TCR或BCR重排相关的癌细胞。可以从血液或骨髓DNA进行为了特定基因而扩增所有不同类型的序列的多重扩增。例如,为了扩增IgH序列,可以使用与所有已知的V区段和等位基因互补的数条引物以及与所有J区段和等位基因互补的数条引物。重要的是,在不同的序列之间几乎不发生扩增偏差。我们已经表明,可以从RNA扩增TCRβ和IgH基因,不同的V引物的效率仅有很小差别,从而验证了从DNA扩增的可能性,从DNA扩增将允许甚至在TCR或BCR没有表达时评价癌细胞。
考虑不同克隆型的扩增中的任何偏差,通过计数单独地空间分离的分子的统计学来确定本发明的灵敏度。因此,可以预计,与为了同样目的开发的实时PCR试验相比,这种方法将提供更高的灵敏度,并且对于不同的肿瘤细胞TCR或BCR序列将具有更少的灵敏度差异。此外,为了获得更高的灵敏度,可以简单地获得更多的测序阅读。由于测序成本持续下降,我们预计在给定成本的灵敏度将继续改善。在有足够的测序阅读的情况下,灵敏度将受样品中的淋巴细胞数量的限制。相反情况下,非特异性扩增和任何探针的杂交所引起的背景限制了实时PCR检测的灵敏度。
为了使用本发明监测淋巴癌,可以通过对诊断的白血病或淋巴瘤样品进行测序来确定患者特异性克隆;即,通过从来自疾病相关组织(其中发现了富集状态的疾病反应性淋巴细胞)的样品产生克隆型谱来确定患者特异性克隆型。一旦确定了克隆型谱,可以通过与来自与疾病无关的组织的样品的克隆型谱相比较来确定疾病相关克隆型的水平。然后,在疾病进程中后续的时间点,在来自患者的样品的克隆型谱中确定疾病相关克隆型的水平。优选地,从便于获得的组织如外周血采集这类后续样品。可以使用血液样品中的细胞,或者,可以使用来自无细胞的血浆的DNA或RNA。不需要患者特异性的探针或者采用将被作为标准运行的患者特异性的模板,而这在目前的技术中是需要的。在本发明的这种实施方案中,在鉴定患者特异性克隆型之后可以获得完整序列组库,以及根据将获得的序列与储存的关于每位患者的有关序列的数据相匹配而信息地测定有关的相关克隆型。对于淋巴瘤,疾病相关组织可以包括淋巴组织、骨髓、外周血等。
癌症克隆型的鉴定。为了使用测序方法来监测癌症,定义每个个体中的癌症克隆型是关键。对于二次检测(对于诊断为淋巴肿瘤的患者的复发和预后应用),癌症克隆型的鉴定通常可能相当直接。例如,诊断时的白血病患者的血液或骨髓样品一般显示出癌症克隆型作为样品中最频繁的克隆型。在二次检测的其他情况下(例如,来自一些淋巴瘤样品的活检),癌症克隆可能不会以非常高的水平存在。可与多种抗原反应的其他克隆型(包括正在攻击癌症的那些克隆型)以更高的频率被发现。如果克隆型的水平本身不足以确定癌症克隆型,可以使用其他标准。可以使用下面描述的数种方法来鉴定癌症克隆型。
交叉谱系重排。一些类型的其他非常见重排在一些癌症中是常见的,因此可用于将它们与肿瘤相关联。例如,交叉谱系重排,像在B细胞中的T细胞受体(α、β、γ和/或δ)或者在T细胞中的B细胞受体(IgH、IgK和/或IgL)是常见的,尤其是在ALL中。交叉谱系重排的存在很可能支持克隆型的恶性来源。
用特定细胞类型的测序对交叉谱系重排进行的测序。可替代地,可以通过利用在细胞表面上存在某些抗原的标准方法(例如,磁珠和FACS)分离出一种类型的细胞。可以进行测序以评价交叉谱系重排的存在。例如,可以分离B细胞,并且可以对TRCβ进行测序。富集的特定TCRβ序列的存在是与癌症一致的。可以在富集之前和之后进行测序,从而允许测定未富集时的水平和富集的程度。
无活性的免疫受体。可用于区分恶性细胞和其他细胞的另一个特征是非恶性细胞需要具有有活性的免疫细胞受体。淋巴细胞在与抗原的反应中增殖,并可以达到高水平。因此,对于正常(非癌症)克隆型达到高水平依赖于有活性的免疫受体。在活检样品中鉴定出高水平的非功能序列不足以确定为癌症,因为,由于在包含功能性重排的细胞中第二种等位基因的非功能性重排,在功能性细胞中可以发现非功能性重排。使用RNA可以消除这一点的不确定性,因为肿瘤细胞可以继续表达非功能性重排,而这在正常细胞中不可能发生,但是通常更明确的方法是有用的。有可以区分癌症中的非功能性序列的额外特征。例如,一些未成熟的癌症,例如,ALL,通常只有IgH重排,而没有IgK或IgL重排。在不存在癌症的情况下,这种模式不可能达到高频率。可以使用以下技术评价这些非功能性重排。
在一系列稀释的样品中的统计连锁。物理连锁的替代方案是寻找如上所述的作图连锁。在这种情况下,仅仅检测一种基因(例如,IgH),问题是非功能性序列与什么连锁,即,在相同细胞中的IgH的其他等位基因的序列是什么。与第二种非功能性等位基因连锁的高频非功能性等位基因与由于癌症而达到的高频率相一致。
对特定细胞类型的测序。也可以通过捕获携带一种标记物的细胞并评价其他的序列而鉴定这种模式。例如,可以使用FCM来捕获IgK和IgL阴性的细胞。在FCM富集之前和之后对IgH进行测序可以鉴定在这个群体中富集的克隆。预期IgK和IgL阴性的细胞达不到高频率,它们的存在与未成熟的癌症如ALL是一致的。
失活性体细胞超突变。在其克隆型已经经历体细胞超突变的B细胞淋巴瘤中可以发现替代的模式。这些克隆中的一些可能具有克隆间变异,其中癌细胞包含在它们中具有不同的突变的数个克隆。一些获得的克隆可能具有失活性突变。对于正常抗原驱动的体细胞超突变,选择并扩增具有失活性体细胞超突变的克隆是不可能的。这些克隆的存在与癌症是一致的。
对携带肿瘤标志物的细胞组分测序。在肿瘤标志物已知的情况下,可以用这种标志物进行FCM来富集癌细胞。可以在富集之前和之后对免疫受体组库进行测序。富集的克隆型很可能与癌症克隆型相关联。例如,可以使用FACS来富集淋巴瘤细胞以分离携带与肿瘤相关的特定标志物(最方便的是表面标志物)的细胞。在富集之前和之后对BCR测序很容易鉴定富集的克隆型并且扩展至鉴定癌症克隆型。
或者,可以在DNA或RNA水平上评价标志物的关联。这可以通过数种方法来完成,包括上述连锁PCR或与连续稀释的细胞的统计学关联。定量这些标志物的连锁将使试验具有更好的表现,因为许多标志物在癌细胞中过表达,但在正常细胞中仍然以一定的水平存在。为了解释这一点,可以使用三种基因进行连锁PCR:免疫受体、肿瘤标志物和对照基因。免疫受体基因可以与其他两种基因中的任一种连锁,并且作为受体重排和肿瘤标志物之间连锁的结果的连锁分子的分数可以表明这种肿瘤标志物的表达水平。
易位的检测。除了作为已经变成癌细胞的细胞的标志物外,IgH通常还是淋巴肿瘤中的两种病理性易位配偶体之一。一个例子是使IgH的J区段紧密靠近周期蛋白D 1(CCND1)基因的t(l1:14),这导致其过表达。这种被称为BCL1-IgH的重排发生在多达60%-70%的套细胞淋巴瘤以及其他淋巴肿瘤(例如,20%的多发性骨髓瘤)中。另一个例子是使IgH的J区段紧密靠近BCL2的t(14:18),这导致其过表达。这种重排发生在最高达90%的滤泡性淋巴瘤和20%的大B细胞淋巴瘤中。通常通过细胞遗传学、Southern印迹法或FISH鉴定这些重排。PCR具有以非常高的灵敏度和特异性鉴定重排的潜能,如用于检测费城染色体的BCR-ABL所示。已经使用不同的PCR技术来评价与淋巴瘤相关的易位,最近引入的实时PCR(例如,对于BCL2-IgH)可能是最先进的。BCL1-IgH和BCL2-IgH有一些特征使得它们的检测的灵敏度和特异性比BCR-ABL的灵敏度和特异性更低。首先,与BCR-ABL对比,BCL1-IgH和BCL2-IgH不产生融合蛋白,并且没有产生可预测的分子结构的剪接事件。相反,断点可能跨越大区域。具有允许使用引物和约40%的BCL1-IgH的组合检测最高达88%的BCL2-IgH的常见断点。这导致漏掉了一些具有易位的患者。第二,这些重排可能存在于从不患癌症的正常个体中。例如,在超过约4%以>1/25K的频率携带BCL2-IgH的大部分的正常个体中已经发现了约10-5的水平的BLC2-IgH易位。BCL2-IgH的频率随着年龄的增加而变得更高。也假设不同的人可能具有不同的“背景”易位水平。这种易位在正常样品中的存在大概是由于如下事实:肿瘤发生是多步骤的过程,BCL2-IgH对于肿瘤来说不足以出现。这种低水平背景的存在限制了检测的灵敏度。
使用与所有J区段互补的J引物和与BCL1或BCL2易位断点的上游区域互补的引物进行扩增,并对扩增产物进行测序。这可以形成用于灵敏检测这些易位和它们出现在其中的癌细胞的方法。首先,单独分离的分子的深度测序(例如,100K或1百万个阅读)可以允许在其他基因座扩增的背景中从少量细胞中检测适当的序列。此外,在正常个体中的背景易位的问题可能改善实时PCR所遇到的问题。有证据表明,至少在一些情况下,背景易位不是克隆的,而是在相同的患者中反复出现。使用测序,可以区分不同的易位事件以获得独立的易位事件的频率。由于不同的易位的断点很可能是独特的,易位事件可以彼此区分。可替代地或此外,可以利用B或T细胞受体基因的易位进行连锁PCR以对易位提供独特的条形码。也可以如上所述使用一组稀释样品统计地进行连锁。系列监测易位水平以检测它们的频率增加的点可能有助于早期癌症检测以及复发的检测。在后一种情况下,可以从诊断的活检样品鉴定与患者相关的特定断点。通过测序而根据它们的断点区分易位从而区分背景和癌症的这种概念可以扩展到涉及IgH的其他易位(例如,t(8:14))或者淋巴肿瘤或其他癌症中的所有其他易位。
改变癌细胞水平和癌症的可能性。仅仅存在表明还有剩余肿瘤细胞的序列本身不能预测临床复发。例如,肿瘤细胞增殖能力和针对肿瘤的免疫应答之间的平衡来实现肿瘤水平的稳定状态。可以预计,除了克隆型的绝对水平,其变化率也可以为预测复发可能性提供信息。例如,考虑两位患者,他们各自具有X水平的各自的患者特异性癌症克隆型。如果在以前的试验中一位患者的水平一致性地为X,而另一位患者在以前的试验中的水平比X低得多,则第二位患者发生复发的可能性要高于第一位患者。
同样,可以使用与包含癌症相关克隆型的细胞的状态相关的其他数据来预测复发的可能性。例如,某些标记物(表面或非表面)的存在可以指示细胞的功能状态并因此指示复发的可能性。在捕获具有相关标记物的细胞之前和之后测序可以确定具有携带相关标记物的癌症克隆型的细胞的分数。同样,可以在RNA水平上评价与复发可能性相关的一些标记物(例如,一些与细胞生长相关的基因的表达)。这可以通过数种方法来完成,包括上述连锁PCR,或者通过细胞稀释统计学地完成。最后,肿瘤细胞中免疫受体特异性RNA的水平可能具有功能性后果以及与复发可能性有关联。可以通过进行可能与免疫受体重排或对照基因2连锁的对照基因1之间的连锁PCR来评价这种水平。两种产物的相对分数可以表示细胞中RNA的相对量。另一种方法包括将免疫受体重排的RNA水平和DNA水平进行比较。DNA中的癌症特异性克隆型的频率表明了癌症特异性克隆型的相对水平。然后可以从RNA评价相同克隆型的频率,并可以追踪RNA和DNA中的相对频率。这种相对频率的变化可以表明复发可能性的变化。
针对淋巴癌的免疫反应。除了监测癌症克隆型和其可能的后代,我们还可以评价针对肿瘤的免疫应答。我们可以鉴定很可能引起针对肿瘤的反应的克隆型。例如,在诊断性淋巴结活检的活检样品中富集的B或T细胞克隆型可以是针对肿瘤的免疫应答的结果。此外,可以进行功能测试来鉴定与一些肿瘤抗原相互作用的T细胞。肿瘤抗原可以是特定的抗原或者它可以是肿瘤细胞本身。例如,在用抗原或肿瘤细胞刺激之前和之后对TCR的测序可以借助于细胞在刺激之后的富集来鉴定相关的T细胞。这些T细胞在来自患者的后续血液样品中的水平可能有助于预测复发。例如,考虑上面提到的情况,其中已经稳定地检测了癌症克隆型的特定水平X。这可能是平衡肿瘤生长与针对肿瘤的免疫应答的结果。如果在某一时间点针对肿瘤的免疫应答降低,则可能预测肿瘤将复发。可以通过确定已经被确定为能够攻击肿瘤的T细胞克隆型的水平来定量针对肿瘤的免疫应答。
测序与其他细胞标记物的整合。可以通过如上所述对免疫受体重排的测序进行癌症特异性克隆型的检测。可以使用与癌细胞相关的标志物(表面或非表面)的存在来捕获细胞亚群,随后对该细胞亚群进行测序。使用标记物特异性捕获和在捕获之前和之后的测序的组合可以提供额外的信息。首先,这可以用来鉴定被富集并因此很可能是上述癌症特异性克隆型的克隆型。此外,对具有癌症特异性标记物的细胞测序可以导致更高的灵敏度。如果有完美的标记物,仅仅需要进行很少的阅读就能在数百万其他细胞中检测癌症特异性克隆型。大多数标记物不算完美,通过它们进行捕获产生了明显的背景(即,非癌细胞)。然而,通过这些标记物富集癌细胞,与不富集的情况下进行相同数量的测序阅读相比,在更少的测序阅读下具有相等的灵敏度,或者具有更好的灵敏度。例如,利用一百万个测序阅读,可以评价约一百万个用癌症特异性标记物捕获的细胞。这对应于在捕获前存在的更多的细胞,因此对应于更好的灵敏度。最后,标记物的使用可以提供与肿瘤生物学和预后相关的功能信息。不同样品的血液中可能存在一定水平的肿瘤细胞,但是细胞上的功能性标记物可以区分表明有高复发可能性的样品和预测有低复发可能性的样品。例如,可以在用相关标记物捕获之前和之后对样品进行测序,并可以评价具有特定标记物的克隆型序列的百分比。可以预测具有相同的癌症特异性克隆型总水平但是携带相关标记物的细胞的分数不同的两份样品具有不同的复发可能性。
系统发生克隆(宗族)的克隆进化和检测和其他癌症相关的突变
如上所述,在一个方面,本发明的方法监测一个家族的克隆型水平而不是个别克隆型的水平。这是因为克隆进化的现象,例如Campbell等人,Proc.Natl.Acad.Sci.,105:13081-13086(2008);Gerlinger等人,Br.J.Cancer,103:1139-1143(2010)。诊断样品中存在的克隆序列可能不会和随后的样品(如在疾病复发后采集的样品)中的序列保持完全相同。因此,如果追踪与诊断样品序列匹配的准确的克隆型序列,复发的检测可能失败。通过测序可以很容易地检测并鉴定这种进化的克隆。例如,通过V区替代(被称为VH替代)出现许多进化的克隆。实时PCR技术不能检测出这些类型的进化的克隆,因为引物针对错误的V区段。然而,考虑到D-J连接在进化的克隆中保持完整,在本发明中可以使用单独空间分离的分子的测序对D-J连接进行检测和鉴定。而且,诊断样品中这些相关克隆型以可观的频率存在增加了克隆型关联的可能性。同样,免疫受体序列中体细胞超突变的发生可能干扰实时PCR探针检测,但是应用于测序读出的适当的算法(如上所公开的)仍然可以识别进化克隆型。例如,可以识别V或J区段中的体细胞超突变。这通过将克隆型定位到最接近的种系V和J序列而实现。与种系序列的差异可以归因于体细胞超突变。因此,可以很容易地检测并鉴定通过V或J区段中的体细胞超突变而进化的克隆型。可以预测NDN区中的体细胞超突变。当剩余的D区段的长度足以被识别并定位时,可以容易地识别在其中的任何体细胞突变。在N+P碱基中(或者在不可定位的D区段中)的体细胞超突变不能肯定被识别,因为这些序列在可能不是癌克隆型后代的新重组的细胞中可能被修饰。然而,容易构建算法来鉴定具有因体细胞突变而导致的高可能性的碱基变化。例如,与原克隆型具有相同的V和J区段并且NDN区有1个碱基差异的克隆型很可能是体细胞重组的结果。如果在V和J区段中有其他体细胞超突变,这种可能性可能增加,因为这确定了这种特定克隆型为已经是体细胞超突变的对象的克隆型。因此,可以用数个参数来计算克隆型是原克隆型的体细胞超突变的结果的可能性:NDN区中差异的数量、NDN区的长度,以及V和/或J区段中其他体细胞超突变的存在。
克隆进化数据可以提供大量信息。例如,如果主要的克隆是已进化的克隆(以前不存在,因此以前未记录的克隆),那么这表明,肿瘤已经获得具有潜在的选择性优势的新的遗传变化。这并不是说免疫细胞受体中的特定变化是选择性优势的原因,而是说它们可以代表它的标记物。其克隆型已经进化的肿瘤可能与差异预后相关联。在本发明的一个方面,被用作疾病(如淋巴肿瘤,例如,白血病)的患者特异性生物标记物的一种或多种克隆型包括以前未记录的克隆型,该克隆型是被监测的一种或多种克隆型的体细胞突变体。在另一个方面,当任何以前未记录的克隆型与充当患者特异性生物标记物的现有克隆型或一组克隆型至少90%同源时,那么这种同源的克隆型与之前监测的克隆型组一起包括或被包括在该克隆型组中。也就是说,如果在淋巴肿瘤中鉴定了一种或多种患者特异性克隆型并将其用于定期监测疾病(例如,通过对侵入性更低地获得的血液样品进行测定),并且如果在一种这样的测定过程中,检测到是目前组的克隆型的体细胞突变的新的(以前未记录的)克隆型,那么将它增加到被监测的患者特异性克隆型的组中用于随后的测定。在一个实施方案中,如果这种以前未记录的克隆型与目前组的一个成员至少90%同源,那么将它增加到患者特异性的克隆型生物标记物的组中用于接下来对患者进行检测;也就是说,这种以前未记录的克隆型被纳入作为其来源的克隆型的目前组成员的宗族中(基于克隆型数据的上述分析)。在另一个实施方案中,如果以前未记录的克隆型与目前组的成员至少95%同源,则进行这种纳入。在另一个实施方案中,如果以前未记录的克隆型与目前组的成员至少98%同源,则进行这种纳入。
细胞也可能通过取代NDN区但保留V和V区段的过程以及它们积累的突变而进化。如果它们包含足够数量的突变而使得这些突变独立衍生的机会较小,可以通过鉴定共同的V和J区段来将这种细胞鉴定为以前未记录的癌克隆型。进一步的约束可能是NDN区与以前测序的克隆具有相似的大小。
足量细胞的评价
试验的灵敏度受限于产生在扩增反应中使用的核酸模板的细胞的数量。通常,每个细胞中存在约6pg DNA。因此,为了具有1/1000,000的灵敏度,需要使用约6μg DNA。然而,在外周血中,只有一部分细胞是B细胞,因此,来自外周血的约6μgDNA可能只有约100,000个B细胞。为了获得更高的灵敏度,可以使用更大量的DNA。一个问题可能是,由于使用更多的DNA,用DNA纯化的抑制剂的效果可能更大,并且可能看到样品与样品之间的差异。获得更纯的细胞群体可以改善这个问题。在临床情况下经常制备外周血单核细胞(PBMC)。来自PBMC的约6μgDNA可以具有约250,000-300,000个B细胞。也可以进行B细胞的特异性捕获以获得更多的B细胞/μg使用的DNA。
可以跟踪多于一种免疫受体重排以使灵敏度达到最大并改善克隆进化的问题。因此,如果跟踪3种重排,那么在它们之间分配可获得的细胞会降低对每种重排的分析的灵敏度。因此,以在分配之前扩增重排的所有3个基因座的方式扩增DNA(或RNA)可以缓解这个问题。以前已经采用了全基因组扩增方法,该方法在这里可用于在分配之前完成3个基因座的扩增。或者,可以采用在一个反应中对特定基因座进行扩增以实现相同的任务。在这种情况下,后来的分配并单独地扩增每种重排是任选的。当用来仅评价一种免疫受体重排时,在扩增特定免疫受体重排之前的全基因组扩增也可能是有用的。例如,体细胞超突变经常使IgH的评价复杂化,这使得通常希望使用多个引物组。在这种情况下,在使用不同引物组的不同反应之间分配输入核酸之前的全基因组扩增并不必然导致检测癌症特异性克隆型的灵敏度提高。在这种情况下,不同的(例如,3种)反应评价可获得的输入核酸的完整组库,因此没有全基因组扩增的优势(除了保留DNA用于其他探询)。然而,当在与引物互补的序列处发生体细胞超突变时,情况并不是这样。例如,如果只有一种代表癌特异性克隆型的DNA分子,那么它会参与三个反应中的一个。体细胞超突变阻止这种特定克隆型被扩增。另一方面,全基因组扩增防止上述情形发生,因为癌特异性序列的初始单分子被扩增,因此存在于所有3个管中。所以,即使在用于基因座扩增的输入模板中癌特异性克隆型的频率没有增加,它存在于所有3个管中的事实也是一个优势。除了全基因组扩增外,可以使用诸如长距离PCR等方法或使用来自所有3个引物组的引物进行基因座特异性扩增或进行初步扩增。
淋巴肿瘤的筛查。上述方法适用于初步诊断后患者的监测;然而,本发明也适用于癌症筛查。原发癌的筛查是降低死亡率的主要力量。淋巴肿瘤的早期检测可导致这些癌症的生存率大大提高。至少在急性和慢性淋巴细胞白血病中已经表明,在确诊之前数年可以检测到特定的癌症克隆型。也可能比使用目前的诊断方法更早地检测到淋巴瘤克隆型。利用本发明,通过如上所述对免疫细胞受体进行测序,可以进行用于筛查目的的癌症克隆型的检测(即,在原发肿瘤发生之前)。每位患者中的癌症克隆型可能是独特的,显然无法预先知道每位患者中被筛查的序列。然而,为了鉴定可能与癌症相关的克隆型,上面列出的许多方法可用于来自尚未诊断出癌症的患者的血液,它们的水平和这些水平的变化可用于评价患者发生临床癌症的风险。
淋巴肿瘤的类型。本发明的方法可以用于监测淋巴肿瘤,例如,淋巴瘤或白血病。成熟B细胞肿瘤可以包括,例如慢性淋巴细胞白血病/小淋巴细胞淋巴瘤、B细胞幼淋巴细胞白血病、淋巴浆细胞性淋巴瘤(如
Figure BDA00002699449301051
巨球蛋白血症)、脾边缘区淋巴瘤、浆细胞肿瘤(浆细胞骨髓瘤、浆细胞瘤、单克隆免疫球蛋白沉积疾病和重链病)、结外边缘区B细胞淋巴瘤(MALT淋巴瘤)、淋巴结边缘区B细胞淋巴瘤(NMZL)、滤泡性淋巴瘤、套细胞淋巴瘤、弥漫性大B细胞淋巴瘤、纵隔(胸腺)大B细胞淋巴瘤、血管内大B细胞淋巴瘤、原发性渗出性淋巴瘤和伯基特淋巴瘤/白血病。
成熟T细胞肿瘤可以包括,例如,T细胞幼淋巴细胞白血病、T细胞大颗粒淋巴细胞白血病、成人T细胞白血病/淋巴瘤、结外T细胞淋巴瘤(鼻型)、肠病变型T细胞淋巴瘤、肝脾T细胞淋巴瘤、蕈样真菌病/Sezary综合征、原发性皮肤CD30阳性T细胞淋巴组织增生性疾病、原发性皮肤间变性大细胞淋巴瘤、淋巴瘤样丘疹病、血管免疫母细胞性T细胞淋巴瘤、外周T细胞淋巴瘤(未指定的)或间变性大细胞淋巴瘤。本发明的方法可以用来监测急性白血病或慢性白血病。白血病可以是急性淋巴细胞白血病(ALL)(例如,前体B急性淋巴细胞白血病、前体T急性淋巴细胞白血病、伯基特白血病和急性双表型白血病);慢性淋巴细胞性白血病(CLL)(例如B细胞幼淋巴细胞白血病);急性髓性白血病(AML)(例如,急性早幼粒细胞白血病、急性髓母细胞白血病和急性巨核母细胞白血病);慢性髓细胞性白血病(CML)(例如,慢性单核细胞白血病);毛细胞白血病;T-细胞幼淋巴细胞白血病(T-PLL);或大颗粒淋巴细胞白血病。
I.癌症筛查
可以利用抗原特异性T和/或B细胞谱分析来了解临床状况的另一个例子是在癌症筛查中使用特定的癌症自身抗原。癌细胞经常产生抗原性的异常分子并引发免疫应答。为了评价患者继续发展癌症的可能性,可以直接在血液或体液中筛查这类分子。然而,已经证明这些方法的灵敏度是一个限制因素,因为当癌症处于早期阶段时(此时它们最可能是可治疗的且无症状的),这些抗原在血液或其他体液中以非常小的浓度存在。然而,这些抗原性分子可以引发免疫应答,尽管这种免疫应答可能不足以控制肿瘤的生长,但是作为检测早期癌症的一种方式,它的强度可能足以被检测到。已经检测了针对例如肺癌和乳腺癌细胞特异性的抗原的抗体,该抗体可以被用作使用抗原本身捕获并检测抗体以筛查这些癌症的方式(M.Nesterova等人.Biochimica et Biophysica Acta 2006:1762:398-403)。如上所述,这些试验缺乏区分不同的抗体克隆的能力,且漏过任何潜在的针对肿瘤抗原的T细胞免疫应答。可以使用上述方法来同时富集T细胞和/或B细胞,所述T细胞和/或B细胞表达结合已知存在于肿瘤细胞中的抗原的TCR或BCR。为了鉴定特定个体中可能是针对这些抗原的免疫应答的一部分的T细胞或B细胞,使用本文所述的本发明,可以在抗原特异性T/BCR富集之前和之后产生克隆型频率。
有数种可以在临床上实施本发明的方式。在第一个实施方案中,采集来自个体(要评价其发生危险性肿瘤的风险)的血液,并在富集结合特定组癌抗原的细胞之前和之后对完整的T和B细胞克隆型谱进行分析。这些抗原可以是单一抗原种类,一组抗原,或抗原的复杂混合物,或者可以是来自一种肿瘤或多种肿瘤混合的材料的完整混合物。这些抗原可以包括p53、c-myc、NY-ESO-1、BRCA1、BRCA2、HER2、MUC1、CAGE、Sox2、GBU4-5、膜联蛋白1、cox-2。除了包括核酸和氨基酸序列参数、长度、区段使用等其他参数外,根据频率在富集之前和之后的显著偏移,可以鉴定可能与针对这些抗原的免疫应答相关的克隆。基于这种类型的单一时间点测定,或者从至少第二时间点(其中这些克隆型的频率的变化被用来计算癌症的风险),可以确定发生癌症的风险。可以在第一时间点进行富集以鉴定相关抗原特异性克隆型,在不进行富集的后续时间点定量这些相关抗原特异性克隆型以计算风险评分。
也可使用群体研究来产生算法以便从抗原特异性富集预测相关克隆型。在该群体研究中,获得多于一个具有已知癌症风险的个体,并使用本发明的技术鉴定抗原特异性克隆型。使用该群体来产生一种算法,可以使用这种算法来预测在癌症风险未知的新个体中与疾病相关的抗原特异性克隆型。
J.药物不良反应
药物治疗的益处经常被它们的不良反应所制衡。大多数药物不良反应(ADR)基本上可预见的并且是剂量依赖性的。其他ADR是特应性的,其中许多是由免疫机制引起的。对这些ADR的数种的易感性与特定的HLA基因型相关。理想地,患者在得到药物之前知道他们易患ADR。最近,FDA在HIV药物阿巴卡韦的标签上增加了在开始治疗之前检测等位基因HLA-B*5701的建议,因为具有这种基因型的患者易发生药物超敏反应。在不可能告诉患者他们易患ADR的情况下,期望在出现任何症状前通过血液检验来检测ADR的迹象。有数种方法可以诊断免疫相关的ADR。有数种通过使患者暴露于药物而再现药物变态反应的体内方法(皮肤试验、皮内、斑片试验和药物激发试验)。体外方法包括评价嗜碱性细胞活化、药物特异性IgE和药物特异性淋巴细胞刺激试验。使用药物特异性淋巴细胞活化的不同形式来评价淋巴细胞活化的不同性质。其中包括淋巴细胞刺激、淋巴细胞迁移、淋巴细胞毒性和淋巴细胞转化试验。这些试验的一些变形包括评价活化标记物如CD69或释放的细胞因子的水平。通常,使用所有这些方法来诊断已经具有变态反应的患者,而不是预测超敏反应。额外的问题困扰着不同的技术。例如,一些体内试验在患者中具有一定的重度变应性应答的风险。嗜碱性细胞活化缺乏对相关抗原的特异性,药物特异性IgE仅仅与涉及IgE的那些变态反应类型(例如,溶血性贫血和过敏反应)相关。因此,需要一种能够在药物施用之前或症状出现之前预测ADR的方法。评价T和/或B细胞组库可以产生这种试验。可以使用一些体外方法来鉴定与药物相互作用的克隆型。例如,可以用特定药物进行淋巴细胞刺激试验以鉴定与药物相互作用的克隆型。
K.组织损伤检测
已经表明,在血液和体液和/或组织中使用分子标记物能够提供关于可能发生损伤的器官的重要信息,该信息可以帮助疾病诊断和指向治疗性干预。这种标记物的一个例子是作为心脏病诊断的一部分的血液中的蛋白质肌钙蛋白的检测。肌钙蛋白是对于心脏组织高度特异性的分子,其主要包含在心脏组织中的细胞内,对于心脏健康的个体,以非常低的水平存在于循环中。然而,当心脏病发生时,细胞死亡和凋亡导致该分子和其他分子溢出进入血流,其中使用ELISA试验的灵敏检测可以揭示明显与心脏病相关的升高的肌钙蛋白水平。
这种范例可以很容易地扩展到可能遭受类似损伤的其他组织,但是研究人员鉴定如下标记物的能力限制了这类技术,该标记物对于给定组织足够特异从而提供诊断上相关的信息,并且在组织损伤的早期足够丰富从而在可能导致器官损伤的疾病的过程中在临床上有用的时间提供信息。
已经表明,尽管在人细胞上存在的表面标记物不会导致免疫反应,但是当细胞内部包含的分子被释放进血流中时,它们可能是免疫原性的。如在检测癌症自身抗原的情况下,与在肌钙蛋白的情况下进行的该类型的直接抗原检测相比,通过检测可与这些抗原反应的免疫细胞可以更灵敏地间接检测这些与器官损伤相关的自身抗原。
因此,可以使用本发明来提供对个体中器官损伤水平的诊断性洞察。在本实施方案中,使用上述方法富集可与特定类型的人组织内发现的分子的特异性抗原反应的T和/或B细胞。可以使用T和/或B细胞克隆型频率在富集之前和之后的偏移来确定哪些克隆型可能与这些抗原反应。可以将这种方法与使用序列参数的序列算法相组合以确定这些富集的克隆型中哪些最可能与这些抗原反应。也可以使用涉及多于一个具有已知器官损伤的个体(其抗原特异性相关克隆型已经根据经验确定)的群体研究来确定算法,可以使用该算法通过在随后的个体中鉴定通常与这些相关克隆型相关的序列特征来优化这些预测。
可以至少在第一时间点进行抗原特异性克隆型关联以鉴定并预测相关克隆型。然后可以在进行或不进行抗原特异性富集的情况下分析在随后的时间点采样的血液或体液以测定这些相关克隆型的水平,该水平可以用来产生与该个体在该时间的特定器官损伤程度相关的器官损伤评分。可以使用这些克隆型的水平来建立这种评分,可以随着时间而变化的这些克隆型的水平也可以建立这种评分。
在本实施方案中可以使用针对特定组织的抗原。组织可以是:心、肺、肝、肠、胰、食道、胃、肾、神经、睾丸、卵巢、前列腺、胸腺、胎盘、子宫等。针对这些组织中的每一种的抗原可以是已知在这些组织中特异性表达的一组选择的基因产物。这些特异性表达的基因产物可以是考虑在这些器官和其他器官之间的差异基因表达的结果。该抗原可以是单一抗原、一组抗原或者材料的复杂混合物,该材料可以是且包括来自所述组织的完整细胞的材料。
L.暴露于本地抗原的鉴定
在本发明的一个实施方案中,使用所述方法来产生基于本地抗原的与具体地理位置相关的免疫谱的数据库。这些抗原可以是但不限于本地花粉。这些抗原可以具有季节性组分。一旦产生了地理位置相关的免疫谱,将受试者目前的免疫谱与该数据库进行比较。使用这种比较来确定受试者最近是否曾经暴露于本地抗原。在一个实施方案中,该方法用来测试受试者是否处在被怀疑的地区。在另一个实施方案中,该方法用来在没有预先怀疑受试者所处地区的情况下确定受试者可能去过的地方。因此,本发明用于确定个体暴露于一种或多种抗原的方法可以包括以下步骤:(a)从个体的B细胞和/或T细胞样品确定克隆型谱,该样品包含其克隆型的组库;和(b)比较该谱的克隆型与抗原特异性克隆型数据库的克隆型以确定克隆型匹配的水平,从而确定暴露于抗原的水平,抗原特异性克隆型数据库包括对于一种或多种抗原为特异性的人TCR和/或免疫球蛋白链的基本上所有的克隆型。在一个实施方案中,所述一种或多种抗原由病原体的抗原组成。在另一实施方案中,病原体是病毒。在另一个实施方案中,这种病毒是流感病毒、天花病毒、丙型肝炎病毒、冠状病毒、登革热病毒或慢病毒。在一个实施方案中,这种抗原特异性克隆型数据库由克隆型组成,该克隆型由人TCRβ和IgH链的基本上所有CDR3区组成。
M.暴露于生物恐怖相关抗原的鉴定
在本发明的一个实施方案中,使用所述方法来产生与抗原相关的免疫谱的数据库,该抗原可能与生物恐怖相关化合物的产生有关。这些抗原可以是但不限于能够被制成武器的病毒载体。一旦产生了免疫谱,将受试者目前的免疫谱与数据库进行比较。使用这种比较来确定受试者最近是否曾经暴露于生物恐怖相关化合物。在一个实施方案中,该方法用来测试受试者是否暴露于所怀疑的特定化合物。在另一个实施方案中,该方法用来在没有预先怀疑哪些化合物的情况下确定受试者是否可能已经暴露于一系列潜在的化合物。在一个实施方案中,在已经发现生物试剂之后产生将要检测的免疫谱。例如,由当局确定具有生物恐怖攻击嫌疑的个体。从嫌疑人获得样品,使用上述方法获得免疫谱。将这种免疫谱与包含许多样品谱的数据库进行统计学比较。样品谱包括代表某些生物恐怖相关抗原的免疫谱。样品谱包括代表某些抗原或抗原组合的免疫谱,该抗原只在该年的特定时间存在于特定地理位置。嫌疑人的免疫谱与这种数据库的比较提供了嫌疑人在特定时间范围内处在特定地理位置以及嫌疑人暴露于某些生物恐怖相关抗原的证据。该证据用来进一步指导调查并在诉讼中使用。
试剂盒
在本文所述方法的商业化中,用于扩增特定的体细胞重排区域或其部分的试剂盒是特别有用的。此类试剂盒可以用于进行单阶段或两阶段PCR(如上所述),该PCR用于扩增预先确定的体细胞重排区域或其部分,目的在于制备用于序列分析的克隆型的样品。试剂盒一般包括一种或多种试剂,例如,但不限于:核酸引物,其包装在容器中,例如,但不限于,小瓶、管或瓶中,在适合于商业分发的包装中,例如,但不限于,盒子、密封袋、泡罩包装或纸箱中。
包装通常包含标签或包装插页,其指明包装的试剂可用在从患者的组织样品产生克隆型谱的方法中。如本文所用,“包装材料”包括在用于试剂盒中试剂的分布的包装中使用的任何物品,包括但不限于容器、小瓶、管、瓶、袋、泡罩包装、标签、标记物、说明书和包装插页。这种试剂盒的一个例子包括对于在一个管中如上所述从自患者的T细胞或患者的外周血淋巴细胞或患者的骨髓提取的DNA或RNA扩增TCRβ序列所必要的试剂。这种试剂盒的一个例子包括对于在多个管中如上所述从自患者的B细胞或患者的外周血淋巴细胞或患者的骨髓提取的DNA或RNA扩增IgH序列所必要的试剂。在后者的例子中,必要的试剂包括用于如上所述产生巢式模板组的多组引物。通常,这种多组为2或3或4组。对于后者的例子中,在一个实施方案中,提供三组引物;更具体地,提供以下三组引物:第1组包括来自表5的正向引物和来自表8的反向引物;第2组包括来自表6的正向引物和来自表8的反向引物;第3组包括来自表7的正向引物和来自表8的反向引物。在另一个例子中,试剂盒包括上述的试剂,包括一个或多个PCR引物组和热稳定的DNA聚合酶如Taq聚合酶,以及如果从RNA扩增序列,则包括逆转录酶。引物的存在量可以使得如上所述产生患者样品中个体克隆型序列的平衡扩增。在本发明的一个方面中,提供引物的量以确保克隆型的平衡扩增。多重PCR反应的这种平衡是本领域普通技术人员公知的,包括但不限于,调整反应中引物的浓度和/或选择引物在感兴趣的区域中的位置和长度以增加或减少个体引物的退火速率。在一个实施方案中,选择引物的量以使在PCR中它们的浓度使得每条引物与其引物结合位点退火的速率基本上相同。在另一个实施方案中,选择引物的量以使得样品中每个序列被扩增的量在克隆型的随机样品的平均扩增量的2倍以内。在又一个实施方案中,这种随机样品含有至少100个克隆型。
热稳定的DNA聚合酶和转录酶可从多家制造商商业获得。试剂盒中的额外材料可以包括:合适的反应管或小瓶,障碍组合物,通常为蜡珠,任选地包括镁;用于PCR阶段的反应混合物(通常是浓缩的,例如2X、5X、10X或20X),包括必要的缓冲液和试剂如dNTPs;无核酸酶或无RNase的水;RNase抑制剂;一种或多种对照核酸(即,如内部标准),和/或任何额外的缓冲液、化合物、辅因子、离子组分、蛋白质和酶、聚合物和可用于多重PCR反应中的类似物。
以商业上可行的任何方式包装试剂盒中的组分。例如,可以将PCR引物和/或逆转录酶单独包装以助于配置试验的灵活性,或者一起包装以增加易用性以及减少污染。同样,可以单独或一起包装缓冲剂、盐和辅因子。该试剂盒也可以包括适用于从组织样品手动或自动提取核酸的试剂和机械组分。这些试剂对于本领域技术人员是已知的,通常是设计选择的问题。比如,在自动化过程的一个实施方案中,在试剂盒中提供的合适的裂解溶液中超声破坏组织。
实施例1
确定自身免疫性疾病的状态
从多发性硬化症发作高峰的患者采集脑脊液(CSF)和血液样品。从脑脊液和血液中分离CD4+细胞,通过PCR扩增T细胞受体β基因的CDR3。进一步扩增该扩增的片段以添加用于Solexa测序的桥接扩增引物结合位点和测序引物结合位点。对T细胞受体β基因的可变区进行测序以鉴定克隆型。用序列信息来产生患者的克隆型谱。
当患者处于多发性硬化症的相对非活动性状态时,采集另一份血液样品。重复如上相同的步骤以产生克隆型谱。病理性克隆型被确定为那些在发作高峰时较高而在非活动状态时明显下降的克隆型。从后一种状态的患者中采集另一份血液样品。此时,仅对T细胞受体β基因CDR3区的一部分进行扩增,然后测序。该亚组包含病理性克隆型。确定各种克隆型的水平以评价患者的疾病状态。
实施例2
TCRβ组库分析:扩增和测序策略
在该实施例中,分析TCRβ链。该分析包括扩增、测序并分析TCRβ序列。一条引物AGCGACCTCGGGTGGGAACA(SEQ ID NO:1)与Cβ1和Cβ2中的共有序列互补,有34条能够扩增所有48个V区段的V引物(表1)。Cβ1或Cβ2在从J/C连接起的第10和14位彼此不同。用于Cβ1和Cβ2的引物终止于16bp位置处,并且对于Cβ1或Cβ2没有偏好。
这34条V引物由Van Dongen等的美国专利公开2006/0234234(其通过引用并入本文)中公开的一组原始引物修饰而成。
表1
与不同的V家族互补的引物序列
Figure BDA00002699449301141
使用Illumina基因组分析仪对由上述引物产生的扩增子进行测序。如图2A-2B所示,对信使RNA转录本(200)进行两阶段扩增,第一阶段使用上述引物,第二阶段添加用于桥接扩增和测序的通用引物。如图2A所示,在一侧用20bp引物(202)进行初次PCR,该引物的3′末端距离J/C连接(204)为16个碱基,并且与Cβ1(203)和Cβ2的两个等位基因完全互补。在RNA转录本(200)的V区(206),提供了引物组(212),其包含与不同的V区序列互补的引物序列(在一个实施方案中为34条)。组(212)的引物还包含一个非互补性尾(214),该非互补性尾(214)产生具有对于P7引物(220)为特异性的引物结合位点(218)的扩增子(216)。在常规的多重PCR之后,形成扩增子(216),其包含mRNA转录本的J(D)V区(206、208和210)的高度多样化部分和用于二次扩增的通用引物结合位点(203和218),以添加样品标签(221)和引物(220和222),用于通过桥接PCR形成簇。在二次PCR中,在模板的同一侧上使用引物(图2B中的222,在本文中称为“C10-17-P5”),该引物在3′末端具有最接近于J/C连接的10个碱基的序列,随后是具有距离J/C连接的位置15-31的序列的17bp,随后是P5序列(224),P5序列(224)在Solexa测序中在通过桥接PCR形成簇的过程中起作用。(当C10-17-P5引物(222)与从第一PCR产生的模板退火时,在模板中产生4bp的环(位置11-14),因为引物与最接近于J/C连接的10个碱基以及距离J/C连接的位置15-31的碱基的序列杂交。位置11-14的环化消除了携带Cβ1或Cβ2的模板的差异扩增。然后使用与最接近于J/C连接的10个碱基以及距离J/C连接的位置15-31的碱基的序列相互补的引物(该引物被称为C′)进行测序。为了保证所有扩增的物质具有可以有效地用于簇形成中的完整末端,可以HPLC纯化C10-17-P5引物。)
在图2A中,在V引物(212)上的突出端的长度优选为14bp。用较短的突出端(214)帮助初次PCR。或者,为了二次PCR,在初次PCR中使用尽可能长的V引物中的突出端,因为二次PCR由该序列引发。研究了支持有效的二次PCR的突出端(214)的最小大小。制备突出端大小为10-30bp、步级为2bp的两个系列的V引物(用于两个不同的V区段)。使用适当的合成序列,用该系列中的每条引物进行第一PCR,并进行凝胶电泳以显示所有扩增产物。为了测定第二PCR扩增的效率,用来自不同的第一PCR反应的PCR产物作为模板并用Read2-tag1-P7和Read2-tag2-P7作为引物进行SYBR绿实时PCR。使用所有4个系列的实时数据出现了一致的情况(用两个不同V区段的2个初次PCR和用包含两个不同标签的不同引物的两个二次PCR)。在突出端大小在10和14bp之间时效率有改善。然而,突出端大于14bp时效率几乎没有或根本没有改善。当突出端小到14bp时,效率仍然很高,这是因为高浓度的引物允许14bp足以在比它们的解链温度高得多的温度下引发模板。同时特异性得以保持,因为模板不是所有cDNA,而是其中所有分子都具有14bp突出端的低复杂度PCR产物。
正如图2A中所示,初次PCR使用34条不同的V引物(212),这些引物与RNA模板(200)的V区(206)退火,并且在5′尾上包含相同的14bp。14bp是Illumina测序引物之一(称为Read 2引物)的部分序列。在同一侧上的第二扩增引物(220)包括P7序列、标签(221)和Read 2引物序列(223)(该引物被称为Read2_tagX_P7)。P7引物用于簇形成。Read 2引物及其互补物用于分别对V区段和标签进行测序。产生一组具有编号为1-96的标签的96条这样的引物(见下文)。为了保证所有扩增的物质都具有可以有效地用于簇形成中的完整末端,HPLC纯化这些引物。
如上所述,第二阶段引物C-10-17-P5(222,图2B)已经打断了与第一阶段PCR中产生的模板的同源性。已经验证了使用这种引物的扩增的效率。C-10-17-P5的一条替代引物,被称为CsegP5,具有与第一阶段C引物和携带P5的5′尾的完美同源性。通过进行实时PCR来比较使用C-10-17-P5和CsegP5在扩增第一阶段PCR模板中的效率。在数次重复中发现,与使用CsegP5引物的PCR相比,使用C-10-17-P5引物的PCR在效率上几乎没有或根本没有差异。
由图2A-2B所示的两阶段扩增产生的扩增子(300)具有图3A所示的Illumina测序仪通常使用的结构。与分子的最远部分退火的两条引物,Illumina引物P5(AATGATACGGCGACCACCGAG)(SEQ ID NO:36)和P7(CAAGCAGAAGACGGCATACGAGAT)(SEQ ID NO:37),用于分子的固相扩增(簇形成)。每个分子进行三次序列阅读。用C′引物进行100bp的第一次阅读,该引物具有适用于Illumina测序过程的解链温度。第二次阅读仅为6bp长,仅仅用于鉴定样品标签的目的。它是用Illumina标签引物(AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC)(SEQ IDNO:38)产生的。最后的阅读为Read 2引物——具有序列GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:39)的Illumina引物。使用该引物,以第一PCR V引物序列开始而产生V区段中的100bp阅读。
设计用于在同一测序道中区分不同的样品运行的一组6bp序列标签,其中每个标签与该组中所有其他标签有至少2个差异的不同。如果存在测序错误,这2个差异防止阅读被误分配给错误的样品。为了比较标签而进行的比对允许缺口,因此测序产生的一个缺失或插入错误也不会将阅读分配给错误的样品。选择标签的额外特征是限制单碱基运行(4个A或T,3个G或C)以及与Illumina引物无相似性。总共产生143个标签,使用其中的96个。
TCRβ测序。采用使用合并的寡核苷酸和作为模板的一个cDNA样品进行的六个多重扩增。用Accuprime进行每次扩增中的三个,另外三个用高保真Taq进行。用每种酶进行的两个扩增使用对应于500ng初始RNA的cDNA,用每种酶进行的一个扩增使用低10倍的cDNA。对于六个反应中的每一个,进行初次和二次PCR,并用Illumina平台和上述方案对扩增的材料进行测序。从每一侧获得100bp序列。使用下面所述的相同的概念进行数据的初步分析。
为了评价该试验的重复性,在重复实验中确定克隆型水平是否一致。如图5A-5C中所示,当使用相同的酶和起始输入cDNA量时,获得了高相关性(2次比较中的每次具有r2=0.944)。当使用不同的酶时,相关性变差(对于4种可能的组合的中位数相关性,r2=0.931),当使用这2种酶来扩增更小的输入cDNA(对应于只有50ng RNA)时,相关性仅仅适度降低(r2=0.924)。
在图5A-5C中,鉴定每份样品中的相同的序列。然后为了处理测序错误,用序列初步分析部分中所述的普通方法合并一些克隆型以形成更大的克隆型。然后,计算每份样品中克隆型的计数。克隆型的一部分(图中未显示)存在于一份样品中,但不存在于另一份中,这可能是由于算法将它们与一份样品而不是另一份中的另一种克隆型合并。然后,将样品中的克隆型的频率计算为其计数值除以从该样品获得的总阅读数。例如,如果对于具有1,000,000个阅读的样品中的克隆型观察到1000个计数,则其频率被计算为0.1%。图7A显示了使用Accuprime和使用作为输入模板的对应于500ng RNA的cDNA,两个重复样品中每种克隆型的频率的log10值。这些重复之间的相关性(r2)为0.944。图7B描述了使用作为输入模板的对应于500ng RNA的cDNA和Accuprime(X轴)或高保真Taq(Y轴),每种克隆型的频率的log10值。与这种组合有4个比较,中位数相关性r2=0.931。图中所示的一个具有r2=0.929。图7C显示了使用作为输入模板的对应于50ng RNA的cDNA和Accuprime(X轴)或高保真Taq(Y轴),每种克隆型的频率的log10值。观察到的相关性r2=0.924。
实施例3
IgH组库分析:扩增和测序策略
在本实施例中,使用3条引物来扩增IgH分子的V区。优选地,引物在避开CDR的区域中,CDR具有最高的体细胞突变频率。进行三个不同的扩增反应。在每个反应中,通过3条引物中的每一条扩增V区段中的每一个,并且全都使用相同的C区段引物。每个单独的反应中的引物距离V-D连接约相同的距离,而对于不同反应中的引物则为不同的距离,使得三个反应的引物沿V区段间隔开。假设V区段的最后位置为0,那么第一组引物(框架A)在约-255处具有3′末端,第二组(框架B)在约-160处具有3′末端,第三组(框架C)在约-30处具有3′末端。考虑到数个V区段之间的同源性,为了扩增全部48个V区段和许多已知的等位基因(如国际ImMunoGeneTics信息系统《http://imgt.cines.fr/》所定义的),在框架A、B和C中分别需要23、33和32条引物。引物列表显示在表2、3和4中。
表2
框架A引物
Figure BDA00002699449301191
表3
框架B引物
表4
框架C引物
在C区段侧,彼此具有一个碱基的差异的两个序列(GCCAGGGGGAAGACCGATGG(SEQ ID NO:128)和GCCAGGGGGAAGACGGATGG)(SEQ ID NO:129))覆盖了IgG的四个区段和多个已知等位基因。使用与用于TCRβ基因的PCR两个阶段类似的方案。
在V侧,在每个V引物上使用相同的5′14bp突出端。在二次PCR中,在V侧使用相同的Read2-tagX-P7引物。在C侧,使用与TCRβ扩增所用的类似的策略以避免在不同的IgG区段和它们的已知等位基因之间的变体。引物序列(AATGATACGGCGACCACCGAGATCTGGGAAGACGATGGGCCCTTGGTGGA)(SEQ ID NO:130)包括位置3-19和21-28的C区段的序列(它跳过在至少一种不同的IgG等位基因中具有一个不同的碱基的位置20)和用于P5的序列(其可用于如图4A所示的簇的形成)。
以cDNA为模板,使用对应于三个框架的三个引物合并物进行多重PCR。在初次和二次PCR之后,在琼脂糖凝胶上电泳产物。由三组合并物获得具有适当的相对大小的单一条带。
在一个实施方案中,将来自单一样品的三个不同的反应以等摩尔比混合并进行测序。如上所述,使用两条Illumina引物从两个方向进行测序。从每侧测序100bp。对于BCR的包含D+J区段的最大胚系序列要比TCR的长约30bp。因此,如果在连接处(N和P核苷酸)的核苷酸去除和添加的净结果对于IgH和TCRβ产生相似的分布,则在C区段之后平均90bp且最大120bp的序列足以到达V区段的3′。因此,在大多数情况下,来自C引物的序列足以到达V区段。从一个Illumina连接体的测序鉴定了所使用的V区段以及V区段中的体细胞超突变。根据该序列来自于三个扩增反应中的哪一个,对V区段的不同片段进行测序。可以从来源于不同扩增反应的不同阅读来比对BCR的完整序列。显示完整CDR3序列的从一端进行的测序反应极大地方便了不同阅读的精确比对。
实施例4
在SLE患者样品中的TCR和IgH组库分析
首先检测在患者中是否存在与疾病活动性相关的克隆型。其次,定义能够区分与疾病相关的克隆型和不相关的克隆型的一组序列特征和/或细胞表面标记物。第三,确定克隆型分析提供临床上有用的信息的程度,例如与短期(例如,3个月)结果的相关性。
1.与疾病相关的克隆型的存在
有两个主要任务:确定相关克隆型和由它们的水平确定疾病活动性。对于每位患者可以通过两个步骤在临床环境下进行这些任务:
1)可以进行校准试验来确定特定患者的相关克隆型的身份。这可以通过在发作高峰时(此时,相关克隆型水平可能达到其最高水平)对每位患者进行IgH和TCRβRNA(或者来自单细胞的连锁的TCRa-TCRβ序列)测序来实现。
2)可以进行监测试验来确定在校准试验后的时间点的相关克隆型的水平。这可以通过对IgH和TCRβRNA进行测序并确定已经在同一患者的校准样品中鉴定的特定相关克隆型的水平来实现。用相关克隆型的水平来计算在这些点的疾病活动性。
使用如上所述的扩增、测序和初步分析发展来评价患者样品。具体而言,评价具有一年的随访期并在该期间内连续采集血液样品的一组系统性红斑狼疮(SLE)患者。Johns Hopkins Medical School的MichelePetri博士每3个月观察一次这些患者,持续1年,对于所有患者的所有随访,可得到疾病活动性的临床度量,包括系统性红斑狼疮疾病活动指数(SLEDAI)、医师整体评价(PGA)以及多个实验室检测,包括C3(补体3)和抗-ds DNA水平。施用于患者的药物包括强的松、羟氯喹、NSAID、NSAID类型、乙酰水杨酸(ASA)剂量、波立维、利尿药、ACE-抑制剂或血管紧张素受体阻断剂(ARB)、Ca通道阻滞剂、Triam和甲泼尼龙琥珀酸酯。研究在随访期间具有至少一次疾病活动性显著变化的患者,该变化被定义为SLEDAI的3点变化和PGA的1点变化。总共有181位符合这些标准的患者(总共815份血液样品)。用上面所述的引物对来自所有这些血液样品的RNA进行多重PCR,以扩增包含IgH和TCRβ中的CDR3的序列。对所有扩增的材料进行测序(至一百万个阅读),并确定不同克隆型的丰度。
使用临床数据,测序,鉴定能够区分其水平与疾病活动性相关的克隆型和不相关的克隆型的特征。其次,开发了使用血液IgH和TCRβ谱确定疾病活动性的算法。
2.相关克隆型的特征的鉴定
预期与疾病相关的克隆型在疾病活动性高时增加。然而,不是所有在疾病高活动性时间点富集的克隆型都必然与疾病相关。例如,在特定的患者中,在高疾病活动点可能有10种富集的克隆型,但只有5种与疾病相关。为了鉴定这些相关克隆型,研究明显与疾病相关的一个亚组的克隆型和明显与疾病不相关的另一组。研究区分这两类克隆型的特征。
在这种实验设计中,在一年随访期间,所有患者都将具有至少一次疾病活动性的显著变化。分析每位患者在疾病活动性高峰时获得的IgH和TCR克隆型。选择具有最高水平克隆型的那些之间的相关克隆型和不相关克隆型的组。因此,第一步是定义处于高水平的克隆型。选择将要进行分析的克隆型的具体标准将包括克隆型的频率等级和克隆型的水平(每百万的克隆型阅读数)的组合,以及克隆型不属于低频率克隆型的分布的证据。
进一步分析来自每份患者样品的这组克隆型,被称为高流行克隆型(HPC)。评价这些克隆型中每一种的水平与临床测量的相关性。计算SLEDAI评分与克隆型水平的相关性。对于每位患者,有4-5个研究点可用于评价SLEDAI与每个HPC的水平的相关性。研究这些得到的相关性的分布。预期大多数HPC与SLEDAI具有低相关性。研究在高相关性端点处是否有超出预期随机产生的过量。例如,对于4个和5个数据点,预期约2.5%和约0.6%的相关性水平(r2)偶然>0.9。更高比例的r2>0.9的HPC表明存在与疾病相关的克隆型。除了将相关克隆型的数量与随机期望值进行比较外,还进行置换分析,其中计算来自一位患者的SLEDAI评分与来自另一位患者的个体HPC水平的相关性。从这种置换产生的相关性的分布可以用作“背景”相关性。(为了保证其有效性,证实在不同患者之间的SLEDAI之间几乎没有相关性)。在高相关性端点的过度相关性,例如r2>0.9,将表明存在与疾病相关的克隆型。挑取最高相关性的克隆型作为相关克隆型组。因为具有高于设定阈值的偶然相关性的HPC的数量是已知的(来自采用随机假设的计算或通过如上所述的置换分析),可以采用具有10%假发现率(即相关克隆型组的10%偶然相关)的方式设置定义相关克隆型的阈值。挑选一组与SLEDAI评分具有极低相关性的HPC。它们将作为不相关克隆型组。可以进一步分析这两组克隆型以鉴定可以区分它们的特征。可以在新的样品中寻找这些特征以鉴定这些样品中可能与疾病活动性相关的克隆型。然后可以继续分析这些克隆型的血液水平以确定疾病活动性。
在疾病活动性变化之前克隆型水平可能变化这一假设造成一种复杂情况。因此,通过试图研究仅与SLEDAI高度相关的HPC,可能排除早于SLEDAI而变化的临床上有用的克隆型。挑选另一组与修正SLEDAI(MSLEDAI)评分相关的克隆型。除了恰好在显著变化之前的那些以外,在所有研究点,MSLEDAI与SLEDAI是相同的。对于那些数据点,MSLEDAI评分是在该点和下一个研究点的SLEDAI评分的平均值。在SLEDAI之前变化的克隆型可能对MSLEDAI比对SLEDAI显示更好的相关性。计算与MSLEDAI具有高相关性的HPC比随机预期的或置换产生的预期值的过量能提供信息。
然后鉴定能够区分相关克隆型和不相关克隆型的特征。以同样的方式分析与SLEDAI或MSLEDAI相关的那些克隆型。在任一种情况下,目标是,对于这些组特性,正确地概括这种分类,从而能够鉴定下一组样品中的相关克隆型。预计每位患者都具有一组独特的相关克隆型,但是设计训练研究以产生从校准样品(在高疾病活动性时)预测相关克隆型的规则。可以检测两种一般类型的参数:从测序数据本身获得的参数,和可以使用额外实验的参数。额外的实验可以包括评价具有不同的细胞表面或其他标记物的不同细胞。以下是所研究的几种参数类型:1)序列基序:该基序可以是与相关克隆型有关的特定V或J区、组合VJ或DJ区中的短序列。2)克隆型的大小。3)水平:绝对水平(每百万的阅读数)或等级水平。4)与其他克隆型的相似性:其他高度相关的克隆型的存在,像具有沉默变化(编码相同氨基酸的核苷酸差异)的克隆型或具有保守氨基酸变化的克隆型。5)对于BCR,克隆型中的体细胞突变水平,和/或与某些种系克隆型的差别在于体细胞突变的独特克隆型的数量。
单独研究这些参数中的每一个与相关克隆型的关联。设定0.05(未对多重检测校正)的阈值以去除不可能帮助预测相关克隆型的因素。考虑到有多个参数,进行多个检测以随机产生多个阳性结果。然而,此步骤的主要目的是将参数过滤至更小的组。然后使用阳性参数组来产生用来分类两组克隆型的算法。采用使用不同算法来分类两组克隆型的机器学习算法。为了使过度拟合的风险最小化,使用交叉验证技术。使用这种算法,每个克隆型将得到对应于它是相关克隆型的可能性的评分。然后放置阈值,以便将其上面的克隆型分类为相关的,而将其下面的那些分类为不相关的。可以通过交叉验证技术估计分类的准确性;例如,将克隆型放置在相等组中,算法使用除了一组之外的所有克隆型。然后使用用剩余的克隆型获得的算法分类最后组(试验组)中的克隆型。将其迭代等于组数的次数,在每次迭代中,除一个之外的所有组都用于训练,一组被分类。可以从不同迭代中的不同分类的平均准确度估计算法的准确度。值得注意的是,在所有这些迭代中,确切的算法稍有不同。因此分类的准确度是估计值,因为它不是针对最终的算法,而是针对用除了一个之外的所有克隆型的训练数据产生的一组相关算法。
最终,对两个不同的相关克隆型组训练产生两种算法:一个与SLEDAI相关,另一个与MSLEDAI相关。即使在训练组中的克隆型是不同的,根据这些克隆型实际上是否来自两个独特的群体,所得到的算法可能有或可能没有很大不同。比较这些算法。此外,使用这些算法来鉴定最初不在训练组中的相关克隆型。比较在两个算法中鉴定的克隆型,如果在两个训练组中的初始克隆型来自相同的群体,鉴定的克隆型可能是非常相似的。除非算法的结果相当类似,同时进行两种算法来鉴定相关克隆型以测量狼疮疾病活动性。
其他实验方法可以与测序一起用于鉴定与疾病相关的克隆型。相关克隆型可能在具有一些表面或其他标记的细胞中富集。例如,具有高水平CD27的B细胞在活动性狼疮患者中是已知的,因此相关克隆型可能在细胞的CD27群体中富集。如果证实这是真实的,可以通过对具有高水平CD27的细胞进行富集而改善相关克隆型的预测。具体而言,可以对来自血液样品中所有B细胞以及来自具有高CD27的那些B细胞的IgH序列进行测序反应。预期相关克隆型在高CD27群体中比在所有血液样品中以更高的频率存在。
3.使用IgH和TCRβ谱来确定狼疮疾病活动性
以上部分描述了用于鉴定相关克隆型的特征的基于克隆型的分析。此外,对于该分析,仅仅使用所有HPC的一部分来清楚地指定克隆型为相关的或不相关的。本部分描述了在患者水平上旨在计算疾病活动性的度量的分析,被称为AutoImm(AI)评分。根据以上部分开发的算法用来在所有HPC中鉴定相关克隆型。确定这些相关HPC的水平。可以将相关克隆型的水平相对于TCR克隆型的总数以及预测与疾病不相关的HPC进行标准化。使用这些相关克隆型在不同的时间点的水平来计算在这些不同点的AI评分。
在具有多于一种相关克隆型的患者中,组合关于这些不同的克隆型的水平的信息。此外,整合来自IgH和TCRβ克隆型的数据。尝试用于进行组合的不同算法。例如,研究平均值、中位数、总和和最高的相关克隆型水平。克隆型水平可以是其简单的线性阅读数,其对数,或一些其他的转换。它可能是相关的克隆型和不相关的克隆型之间的差异。而且,可以利用加权平均数的方法。加权可以基于克隆型是相关的可能性。
为了评价哪种模型是最佳的,评价所有模型以鉴定在AI评分和SLEDAI评分之间产生最高相关性的模型。对于这种分析,在从所有患者的所有研究点获得的所有数据间进行SLEDAI和AI评分的相关。为了估计并减轻过度拟合的程度,使用交叉验证技术。测定的相关性水平反映了AI和SLEDAI评分之间的“横断式”关系。除了SLEDAI,还研究了与其他临床度量如C3和抗-ds DNA抗体水平以及对于具有肾脏表现的患者的尿蛋白/血清肌酐以及对于具有血液学累及的患者的血液计数的相关性。相关性可能是由于患者分类为高和低疾病活动性,并不一定是患者中与SLEDAI评分相关的AI的反映。为了证明这一点,进行“纵向”评价。
4.纵向分析
在纵向分析中,评价两个一般性问题:一个研究点的AI评分能够预测同一点的疾病活动性吗?一个研究点的AI评分能够预测后面的点(例如,3个月后的下一个研究点)的疾病活动性吗?
以两种方式评价同一研究点的AI和SLEDAI评分之间的关系。首先计算每位患者中AI和SLEDAI的相关性,然后计算平均和中位数患者相关性水平。如果上述横断分析中看到的相关性是由于对高和低疾病活动性患者的分类,而不是个体患者内的疾病活动性改变,那么在个体患者中的纵向相关性可能是低的。高中位数患者相关性水平提示AI的确反映个体患者水平的SLEDAI评分。除了AI和SLEDAI评分的相关性,还评价了AI与其他相关度量如C3和抗-ds DNA抗体水平以及对于具有肾脏表现的患者的尿蛋白/血清肌酐以及对于具有血液学累及的患者的血液计数的相关性。
证明AI评分测量个体患者中疾病活动性变化的能力的另一种方式是通过确定其在区分相同患者中高与低疾病活动性的状态方面的准确性。对于181位患者中的每一位,选择当SLEDAI为最高(高疾病活动性点,称为HDAP)和最低水平(低疾病活动性点,称为LDAP)时的两个研究点。比较所有HDAP的AI的分布和所有LDAP的AI的分布,并计算它们的不同的p-值。此外,评价每位患者中在HDAP时的AI比LDAP时更高的频率。如果AI不随着个体患者中疾病活动性而改变,那么预期在HDAP时的AI仅比在LDAP时的AI高50%倍。进行另一项分析,其中确定在HDAP时的AI以有意义的差别(即,高于可能的AI变化)高于在LDAP时的AI的倍数分数。为了测定AI的波动,使用来自所有患者的所有研究,并且可以计算在SLEDAI值的不同箱元(bins)中AI的标准偏差(和相对标准偏差。这将产生所有患者间的相对标准偏差(AI-RSDall),该值可能取决于或可能不取决于SLEDAI(即在不同的SLEDAI值时AI-RSDall可能是不同的)。可以计算HDAP时的AI比LDAP时的AI高出特定AI-RSDall数(例如,2)的患者的比例。可以有一些系统性偏差,其中在一些患者中计算的AI一致地高于(或低于)由SLEDA评分所期望的值。因此,AI-RSDall是患者中AI的内在波动以及对于具有相似SLEDAI的患者的AI的系统差异的组合。可以通过计算患者内具有相似SLEDAI值(<2点差别)的研究点间的AI评分的标准偏差(和相对标准偏差)而计算患者内的AI的内在波动。可以计算所有患者间相对标准偏差的中位数(AI-RSDpt-med)。可以评价其中在HDAP时的AI比在LDAP时的AI高特定AI-RSDpt-med数(例如,2)的患者的比例。
在证明在个体患者内AI的确随着SLEDAI波动之后,评价在下一个研究点——3个月后,AI是否可以预测SLEDAI。为了评价这一点,可以定量在时间0时的AI评分和在+3个月时间的SLEDAI评分之间的相关性水平。可以在患者水平上计算相关性,然后可以获得中位数患者相关性。证明AI在预测不久的将来的疾病活动性方面的能力的另一种方法是评价AI在预测未来3个月疾病活动性中的灵敏性和特异性。在临床上,可以将他们目前的管理做得很好的那些患者与不是如此的那些患者相区别。在特定时间的患者状态分为两类之一:差的控制(PC),包括在3个月内将具有高疾病活动性(SLEDAI>6个点)和/或爆发(SLEDAI增加3个点)的患者,和良好控制(GC),包括在3个月内将有低或中疾病活动性(SLEDAI<6)和/或疾病活动性显著降低(SLEDAI下降3个点)的患者。然后可评价分类灵敏性,并用不同的AI阈值获得特异性。可以提前3个月的时间产生描述AI在预测患者状态(PC或GC)方面的表现的ROC曲线。将通过这个测试得到的表现与包括SLEDAI、抗-ds DNA和C3水平在内的标准临床度量的表现相比较。
还分析评价AI在预测3个月后SLEDAI评分的变化方面的能力。使用来自所有患者的所有研究点的数据,可以绘制AI和SLEDAI评分之间的关系,从而鉴定如上所讨论的“横断式”相关性水平。这确定了在同样研究点的SLEDAI和AI之间的关系。这种关系符合允许根据AI评分预测SLEDAI评分(反之亦然)的方程。如果AI预测爆发,那么在一些研究点1时SLEDAI变化之前为在研究0时AI的变化。因此,如果爆发发生在研究点0和1之间,则在研究点0的AI评分(被称为Almeas)高于根据研究点0的SLEDAI预测的值(被称为Alexp)。另一方面,在研究点0和研究点1之间疾病活动性没有变化时,在研究点0的AI评分与根据研究点0的SLEDAI预测的值非常相似。可以通过将Almeas和Alexp的差除以Almeas来计算相对AI变化(Rel-AI-diff)。可以通过使用Rel-AI-diff的不同阈值评价AI在预测3个月后SLEDAI3的显著变化中的灵敏性和特异性。该阈值可以是双向的,因此,如果在特定研究点的Rel-AI-diff高于特定阈值,则预测爆发,同样地,如果它低于特定阈值的负数,则预测SLEDAI显著降低。另一方面,当在研究点的Rel-AI-diff在阈值和其负数之间时,预测疾病活动性没有显著变化。使用许多不同的Rel-AI-diff的阈值可以产生显示灵敏度和假阳性的权衡的ROC曲线。可以使用包括SLEDAI、抗-ds DNA和C3水平在内的标准临床度量产生类似的ROC曲线。
如果AI的波动在不同的SLEDAI值变化,则改善上面的分析。上面的部分描述了AI-RSDall和AI-RSDpt-med的计算并提到评价它们在不同的SLEDAI值是否改变。如果它们改变,则可以如上所述进行ROC分析,但不是使用不同的Rel-AI-diff阈值,而是使用不同的AI-RSDall和AI-RSDpt-med的阈值。将通过该测试得到的表现与包括SLEDAI、抗-ds DNA和C3水平在内的标准临床度量的表现相比较。
在上面的分析中,尝试根据点0的AI评分预测点1的SLEDAI。可能除了点0的绝对水平外,AI从点-1到0的变化可以提供信息以预测点1的SLEDAI。例如,考虑在研究点-1具有X-1的AI评分的患者,在点0时AI评分增加至明显高于X-1的新的值X0。与AI在研究点-1和0稳定于X0的患者相比,该患者可能具有在点1时爆发的更高的可能性。引入AI变化或速率的这种概念以产生修正AI(MAI)评分。为了产生在点0的MAI,需要在点-1和在点0的AI评分,因此,每位患者的一个数据点将不具有与之相关的MAI。优化将速率并入AI计算中以获得MAI的特定公式。可以通过3个月后MAI和SLEDAI的相关性的最大化而进行这种优化。使用交叉验证设计来评价并控制过度拟合的程度。可以对所有样品的数据点进行相关,但也可以在患者水平上进行,并且可以评价所有患者间的中位数相关性。后一种方法减轻了一些患者具有太低或太高的AI评分的系统性偏差的问题。使用MAI,可以进行相同类型的对于AI提到的ROC分析,以评价其预测3个月后的SLEDAI的能力。首先,类似于对于AI所述,可以进行分析来显示点0的MAI在区分点1的PC和GC状态方面的能力。此外,可以进行类似于对于AI所述用于评价在点0的MAI的能力的分析来预测点0和1之间的显著疾病活动性变化(SLEDAI的3点变化)。对于这后一种分析,可以使用不同的Rel-AI-diff、AI-RSDall或AI-RSDpt-med的阈值。将MAI的表现与AI的表现进行比较以确定添加速率因素是否有用。
所述研究的一种复杂情况是,在该研究的随访期间对于不同的患者改变治疗。这可能使预测疾病活动性变得复杂化。例如,考虑在点0具有相同的AI评分的两位患者,这些患者中的一位在相同时间的药物减少。这位患者在点1疾病活动性上升的可能性可能高于在点0没有改变药物的患者。这可能导致低估AI的表现。缓解该问题的一种方式是从研究中排除具有显著的药物变化的所有点。另一种是修正AI评分以包括患者是否具有药物改变并产生药物修正的AI。所以在上面的具有两位患者的例子中,具有药物改变的一位将具有更高的药物修正的AI。
5.与其他预测标记物的整合
可以使疾病活动性标记物的预测能力最大化。因此,测试了与其他标记物整合的TCR/BCR组库信息的预测能力。这些标记物包括在临床上使用的标准标记物,像抗-ds DNA和C3水平。它还将包括已发表的其他标记物。例如,当使用与所用的相同的一组患者时,已经显示一组趋化因子具有一定的预测能力。评价该组是否增加TCR和BCR组库的预测能力。第一步是用额外的度量整合AI评分以产生扩展的AI(EAI)评分。可以评价进行整合的不同方式,并且可以通过3个月后EAI和SLEDAI的相关性的最大化来对其进行优化。使用交叉验证设计来评价并控制过度拟合的程度。使用EAI,通过其区分GC和PC以及预测疾病活动性变化的能力来评价预测3个月后疾病活动性的能力。可以通过如上所述的ROC分析描述在测定疾病活动性和疾病活动性变化中的表现。
6.验证
被检测的变量的数量高于样品的数量。这可能适用于过度拟合,在开始时有希望的结果在以后的研究中不能得到验证。在训练中使用交叉验证方法来得到过度拟合程度的度量。然而,在以后的工作中涉及对一组独立样品的验证。这不是这个建议的一部分,但这种标记物可能在临床上适用。使用上面得到的数据,可以确定是否应当验证AI、MAI或EAI以及计算感兴趣的度量的特定方式。采用一种特定的算法进行验证。此外,指定一个或多个特定的端点。可以评价AI在区分3个月后GC和PC的能力中的灵敏度和特异性以评价AI预测疾病活动性的能力。在另一个例子中,可以评价AI用特定Rel-AI-diff阈值来预测3个月内的显著疾病活动性变化的灵敏度和特异性。
实施例5
测定SLE患者对药物治疗的响应
使用所提供的发明方法来测定SLE患者对药物治疗的响应。确定给予具有严重副作用的昂贵药物的SLE患者对该药物是否具有响应在患者护理中以及对于使这种护理的提供具有成本效益而言起作用。疾病活动性的许多临床指标对治疗的响应不准确,并且在最长达数个月的时间延迟之后。在该时间内,疾病可能进展,副作用可能增加治疗的复杂性。对药物响应的迅速了解将允许患者更迅速地转换到更有效的治疗。
在本实施例中,先前诊断为狼疮的一位35岁的非裔美国女性找到她的定期风湿病医生。每季一次地通过全面的临床评价(除了实验室检测外,还包括测定C3、抗-ds DNA抗体水平、血液计数和尿分析)来评价患者的疾病状态。在一次看医生期间,患者主诉皮肤损伤和疲劳,尿分析显示蛋白尿和/或细胞管型的迹象。风湿病医生将患者转至肾病医生进行肾脏活检来评价肾脏的炎症状态,并检查血清肌酐和24小时尿蛋白与肌酐比值来评价肾功能损伤的程度。肾脏活检显示弥漫性狼疮性肾炎的迹象,而尿蛋白与肌酐检验揭示了肾病综合征的迹象(尿蛋白与肌酐的比值为3.6)。基于此信息,给出急性狼疮性肾炎的诊断结果,患者开始药物治疗的过程。有数种可能的药物在此时可以选择。通常使用免疫调节剂如吗替麦考酚酯(Cellcept),尽管有时对严重的病例开出诸如氨甲喋呤、硫唑嘌呤(Imuran)、环磷酰胺(Cytoxan)的药物。有时也使用利妥昔单抗(Rituxan)作为第二或第三选择。为了抑制急性症状,通常使用这些药物之一联合全身性类固醇如强的松或甲泼尼龙。这里,开出每天150mg的吗替麦考酚酯以及60mg强的松。考虑到类固醇的许多副作用,包括骨质疏松症、高血糖症、体重增加以及其他长期的库欣氏症状的风险,如果临床情况允许,患者的强的松剂量在约6周内逐渐减少。
确定的第一个问题是患者对治疗是否有响应,以及作为结果,类固醇的剂量是否可以适当降低。因此,在此期间,跟踪患者的血清肌酐以及尿蛋白和肌酐以确保患者对药物有响应。可以进行频繁的肾脏活检来检测炎症损伤是否被逆转;然而,肾脏活检的常规使用会带来太大的风险,侵入性太大而不实用。目前用于评价炎症状态的基于血液的标记物在做出这种决定中的应用有限,因为它们与所依赖的潜在疾病没有很好地相关,不足以冒伴随高剂量类固醇的增加的副作用的风险。血清和尿功能标记物在检测炎症状态的改善中可能有一定的延迟,因此,在这些标记物显示明确的变化之前可以逐渐减少类固醇,因此延长了肾爆发期。在这些情况下,由更灵敏的标记物所显示的更慢的逐渐减少可以缩短爆发期,从而防止对肾组织的进一步损害。在类固醇降低至约10mg的维持剂量之后,患者可能显示持续升高的尿蛋白水平以及等于2的高尿蛋白与肌酐的比值,医生现在必须决定是否从Cellcept转换到另一种药物。支持这一点的争议是,有肾功能丧失的持续证据,但没有准确的炎症肾脏状态的度量,尽管已经进行了导致这些持续蛋白尿水平的一定水平的不可逆的肾脏损害,可能难以知道疾病本身是否处在缓解中。再者,现有的基于血液的标记物不能完美地提供信息,而进一步的肾脏活检是不实际的。准确的基于血液的疾病状态度量将极大地有助于该决定。
在这种情况下,AutoImm Load非常有助于通过单独地或与疾病活动性的其他标记物相组合地测定疾病活动性来评价对治疗的响应。用上面所述的研究开发用于AutoImm Load的算法。用校准试验来测量用于计算AutoImm Load的相关克隆型。使用在疾病活动性峰值时例如在治疗开始时来自患者的血液进行这种校准试验。使用血液或者使用所累及的组织(例如,肾脏活检或皮肤活检)进行校准试验。在后来评价对治疗的响应时,采集血液样品并与校准试验一起使用以测量AutoImm Load。据此作出治疗决定。如果相关克隆型源自群体研究,则不需要校准试验,在评价对治疗的响应时的血液检验足以测量AutoImm Load以便报告治疗决定。
实施例6
对于SLE患者逐渐减少或停止治疗的适当时间的确定
可以使用所提供的发明的方法来确定对于SLE患者逐渐减少或停止治疗的适当时间。除了疾病活动性的临床测量可能表现出的时间延迟,进一步的困难在于这些测量缺乏灵敏度。尽管如此,如果治疗过早地逐渐减少,亚临床疾病可以导致疾病的重新爆发。作为其结果,一般使用免疫抑制剂疗程一段时间,这段时间比对于平均患者而言确保平均患者的重新爆发风险处于低水平所需的时间要长得多,但是对于分布的末端来说可能仍然足够长。因此,在大多数患者中发生引起副作用和费用的明显的过度治疗,而在一些患者中发生治疗不足,引起可能可预防的重新爆发。可预测重新爆发风险的亚临床活动性的一种测量方法允许基于这种测量来逐渐减少治疗,而不是依靠有意的过度治疗。
在本实施例中,来自实施例7的患者在6个月的期间服用强的松和吗替麦考酚酯,尿蛋白与肌酐的比值回复到0.5的水平。该水平仍然高于在健康个体中预期的基线水平,但是不清楚是否该高水平是否是由于一些不可逆的肾脏损害造成的。炎症的其他临床度量是正常的,患者没有报告任何其他症状。同时,患者经历中等水平的恶心和体重增加,这可能是药物的副作用,该药物另外还具有严重的长期副作用。医生面临一个困难的决定:即担心逐渐减少Cellcept和/或类固醇可能太快(可能会导致更新的肾脏炎症和可能进一步长期不可逆的肾脏损害),又担心药物发生的不良反应。在不必进行肾脏活检的情况下对疾病状态的明确评价可以帮助医生作出这样的决定。通过导致再次发生相同的临床困境的类固醇的反复试验推荐减少类固醇的尝试。事实上,每次患者处于缓解期以及患者使用类固醇或免疫调节剂时,这个问题都会出现。
在这种情况下,AutoImm Load非常有助于通过单独地或与疾病活动性的其他标记物组合地测定疾病活动性来评价是否逐渐减少治疗。用上面所述的研究开发用于AutoImm Load的算法。用校准试验测量用于计算AutoImm Load的相关克隆型。使用在疾病活动性峰值时例如在治疗开始时来自患者的血液进行这种校准试验。可以使用血液或者使用所累及的组织(例如,肾脏活检或皮肤活检)进行校准试验。在后来评价疾病活动性水平时,可以采集血液样品并与校准试验一起使用以测量AutoImm Load。这用来作出治疗决定并且用来评价患者是否具有任何可检测的疾病活动性。如果相关克隆型源自群体研究,则不需要校准试验,并且在评价对治疗的响应时的血液检验足以测量AutoImm Load以便报告治疗决定。
实施例7
SLE患者中的爆发的预测
治疗SLE患者的一个挑战是以下事实所代表的挑战:在没有警告的情况下发生爆发,因此阻碍了医生预防性地处理该疾病的努力。在开始治疗患者之前等待爆发导致破坏性的临床症状可能涉及昂贵且不方便的住院治疗,并可能引起长期的器官损害,同时也需要本身具有副作用的激进的治疗干预。更加期望的范例是这样一种治疗范例:在亚临床期检测爆发,此时可以主动地施用治疗,从而减轻患者的巨大痛苦,导致不太昂贵的住院治疗,并最终使患者具有更好的长期预后。
来自实施例7的患者从上述急性爆发恢复,除了Plaquinil和低剂量的5mg强的松以外,逐渐减去对患者的所有治疗。尽管如此,该患者仍然处于具有另一种炎症发作的高风险。因此,该患者仍由风湿病医生的医护,该风湿病医生将继续跟踪患者的临床症状和实验室检验。遗憾的是,这些症状和检验没有对即将来临的爆发提供预警,直到患者实际上已经表现出爆发的临床症状,并且该情形反复发生。为了检测爆发的明确迹象(其可能在随后的1-3个月内达到临床可检测的阶段),可以在患者的常规临床评价中包括逐渐增加的亚临床活动性的高度特异性标记物。更早地开始治疗可以使爆发的严重性降低,并且可以允许在比目前的情况具有更少的长期器官损害或使用更少的类固醇的情况下来完成治疗。
在这种情况下,AutoImm Load非常有助于通过单独地或与疾病活动性的其他标记物组合地测定疾病活动性来评价初期爆发的可能性。可以使用这种评分本身或这种评分的增加速度(速率)或加速度来评价爆发进展的可能性。用上面所述的研究可以开发用于AutoImm Load的算法。用校准试验可以测量用于计算AutoImm Load的相关克隆型。可以使用在疾病活动性峰值时例如在治疗开始时来自患者的血液进行这种校准试验。可以使用血液或者使用所累及的组织(例如,肾脏活检或皮肤活检)进行校准试验。在后来评价对治疗的响应时,可以采集血液样品并与校准试验一起使用以测量AutoImm Load。可以据此作出治疗决定。如果相关克隆型源自群体研究,则不需要校准试验,并且在评价爆发风险时的血液检验足以测量AutoImm Load以便报告治疗决定。
实施例8
评价SLE患者的主观症状的客观度量
SLE影响许多器官并产生许多潜在的症状,包括在健康群体中非常常见的症状。例如,如果SLE患者主诉头痛,头痛可能是CNS狼疮的体征,或者可能是由于普通头痛。同样,如果SLE患者在一段时间主诉正在恶化的疲劳,正在恶化的疲劳可能是由于他们的疾病恶化,或者可能是由于抑郁或其他原因。反映疾病活动性的客观度量的可获得性在SLE患者的处置中可能有很大的帮助。
实施例7中的患者来看风湿病医生,主要主诉头痛、疲劳和难以集中注意力。患者的头痛是复发性的,用Motrin治疗仅仅短暂好转。患者的SLE另外也在良好的控制中。患者生活中有关的心理压力包括她正在经历离婚。当医生面对具有非SLE特异性的并且在一般群体中常见的症状的SLE患者时,他们难以判断。患者是患有CNS狼疮吗?还是她可能具有其症状的其他常见的原因,如抑郁症?目前的实验室检验缺乏区分这些可能性所依赖的灵敏度和特异性。可以常规地利用测定SLE疾病活动性的可靠检测来帮助区分这两种可能性。
在这种情况下,AutoImm Load非常有助于单独地或与疾病活动性的其他标记物组合地客观评价疾病活动性。用上面所述的研究开发用于AutoImm Load的算法。用校准试验测量用于计算AutoImm Load的相关克隆型。使用在疾病活动性峰值时例如在治疗开始时来自患者的血液进行这种校准试验。可以使用血液或者使用所累及的组织(例如,肾脏活检或皮肤活检)进行校准试验。在后来评价客观的疾病活动性时,可以采集血液样品并与校准试验一起使用以测量AutoImm Load。据此来作出治疗决定。如果相关克隆型源自群体研究,则不需要校准试验,并且在评价客观的疾病活动性时的血液检验足以测量AutoImm Load以便报告治疗决定。
实施例9
测定MS患者对药物治疗的响应
如上所述,MS治疗中的主要挑战之一是测定患者是否对药物治疗有响应以及响应程度如何。在进行性和晚期疾病期间,存在临床评价如展开残疾状态评分(EDSS),其测定由疾病导致的身体损伤的程度。然而,这些评价不能用于早期或复发性/恢复性疾病。可以使用复发前后的临床参数来评价疾病进展,但这些都是粗略且滞后的指标,因为患者在复发之间可能经过数年,在此期间,从临床评价只能收集到很少的证据。最后,可以使用脑成像如钆增强MRI来检查脑损伤。MS患者通常每年一次进行这种MRI。然而,这种图像缺乏特异性。而且,作为整合的脑损伤的度量,它们不是目前的疾病活动性的良好度量,而是反映了疾病的历史及其对大脑的影响。
尽管事实上目前对于MS的临床治疗范例是诊断为复发的缓解性疾病患者应当继续治疗以延缓进行性疾病的发作,但是越来越多的批准用于治疗MS的药物库使得生物反馈的缺乏越来越成为一个问题。上面显示的批准用于治疗MS的药物列表继续变长,因为在MS治疗方面的大量投资开始取得成果。这些药物的每一种都具有严重的副作用,并且施用起来非常昂贵,每年的治疗费用为30,000-5100,000美元。没有得到很好的处置的患者将很快地转变为进行性疾病,该疾病使人虚弱,并且导致昂贵的医疗护理干预,包括住院治疗和长期医护。因此,可以允许患者在治疗早期得到最佳的治疗。
临床实用性的例子
患者概况:一位30岁的具有单眼视觉损伤且疼痛的女性来到医院。对她进行神经学评价和腰椎穿刺以获得脑脊液,该脑脊液用来评价克隆T细胞是否存在。她也进行脑部MRI。基于这些检查,诊断为MS。给她开出每次注射Betaseron 250mcg,每隔一天自我皮下注射。在6个月后随访时,该患者主诉抑郁和体重增加。没有向医生报告进一步的神经学事件。现在,医生面临着临床窘境。医生应当维持已经施用的治疗吗?应当使用新的治疗吗?医生应当要求做发生费用并使患者经受额外造影剂暴露的MRI吗?医生应当等待,直到下一次安排的MRI显示新的损伤吗?医生应当等待来观察爆发是否复发吗?所有这些决定都将受益于对该疾病是否是活动性的明确测量。
在这种情况下,AutoImm Load非常有助于通过单独地或与疾病活动性的其他标记物组合地测定疾病活动性来评价对治疗的响应。用本文所述的研究开发用于AutoImm Load的算法。用校准试验测量用于计算AutoImm Load的相关克隆型。使用在疾病活动性峰值时例如在治疗开始时来自患者的血液进行这种校准试验。可以使用血液或者使用所累及的组织(例如,CSF)进行校准试验。在后来评价对治疗的响应时,可以采集血液样品并与校准试验一起使用以测量AutoImm Load。可以据此作出治疗决定。如果相关克隆型源自群体研究,则不需要校准试验,并且在评价对治疗的响应时的血液检验足以测量AutoImm Load以便报告治疗决定。
实施例10
MS爆发的预测
正如在所有自身免疫性疾病中一样,缓解爆发是治疗的主要目的。不仅爆发使患者衰弱并且治疗昂贵,而且越来越相信,每次爆发都导致长期的不可逆的疾病进展。可以使用数种疗法来控制初期的爆发,如静脉注射甲泼尼龙或口服强的松。这类药物具有显著的副作用,因此在没有活动性爆发的证据时不会开出。可以使用与随后的临床爆发相关的逐渐增加的亚临床活动性的度量来告知这类主动的爆发治疗,这些治疗可以导致更短的且损伤性更低的爆发。此外,对于具有非常重大且致命的副作用风险的爆发的降低,具有表现出高临床疗效的治疗。一种这样的药物是Tysabri,已经证明该药物既导致改善的临床结果又增加致死性脑部感染如PML的风险。这些风险已经将这种药物的价值降低到当其他药物显示不再能够控制进展时的最后一线治疗,并限制了这些药物作为长期治疗的价值。能够预测爆发状态何时处于初期的检测可以增加这些药物的实用性,因为它们可以以与类固醇相似的方式用来控制急性爆发期,同时使致命的副作用的风险最小化。
临床实用性的例子
来自实施例11的患者使用3年Betaseron,报告有持续1周的临床爆发。年末,患者的MRI显示显著的新病变(多个离散的大小不等的卵圆形垂直定向的T2W和FLAIR高信号病变(斑块),在T1W图像上出现同等的低信号而在T2W图像上出现高信号,累及双侧室周和皮质下白质区,包括胼胝体-中隔界面)。医生担心在接下来的12个月的进程中患者处于爆发的高风险。临床窘境就此出现。医生要等待进一步的临床症状再用额外的治疗进行干预吗?医生应当转换治疗吗?如果如此,应当使用另一类注射剂如Copaxone还是应当使用一类新的治疗如Tysabri?应当开出类固醇吗?能够监测亚临床疾病活动性并显示疾病何时增加以及何时可能产生爆发的试验可以用来帮助这些临床决定。
在这种情况下,AutoImm Load非常有助于通过单独地或与疾病活动性的其他标记物组合地测定疾病活动性来评价爆发的风险。用本发明中所述的研究可以开发用于AutoImm Load的算法。用校准试验可以测量用于计算AutoImm Load的相关克隆型。可以使用在疾病活动性峰值时例如在治疗开始时来自患者的血液进行这种校准试验。可以使用血液或者使用所累及的组织(例如,CSF)进行校准试验。在后来评价爆发的风险时,可以采集血液样品并与校准试验一起使用以测量AutoImm Load。可以据此作出治疗决定。如果相关克隆型源自群体研究,则不需要校准试验,并且在评价爆发风险时的血液检验足以测量AutoImm Load以便报告治疗决定。
实施例11
监测对于MS的治疗依从性
因为在疾病早期临床症状相对不频繁,患者和他或她的医生之间的互动不是很频繁。同时,规定的治疗对于患者来说既昂贵又不方便,包括可能引起疼痛反应和副作用的自我注射。结果,存在很大程度的对于治疗方案的不依从性,对于医生而言,治疗方案难以监控,因为患者和医生之间的互动不是常规的。可以测量亚临床疾病状态的试验将允许医生和患者常规地看到基础疾病控制得如何。在HIV患者中已经证明,这些方法在鼓励他们寻求有效的治疗方面是非常有效的。每季度进行的血液检验使医生能够看到患者并测量疾病的状态。
在这种情况下,AutoImm Load非常有助于通过单独地或者与疾病活动性的其他标记物组合地测量疾病活动性来评价治疗的依从性。用本文所述的研究开发用于AutoImm Load的算法。用校准试验测量用于计算AutoImm Load的相关克隆型。使用在疾病活动性峰值时例如在治疗开始时来自患者的血液进行这种校准试验。可以使用血液或者使用所累及的组织(例如,CSF)进行校准试验。在后来评价治疗的依从性时,采集血液样品并与校准试验一起使用以测量AutoImm Load。据此作出治疗决定并且更好地引导患者以达到更好的依从性。如果相关克隆型源自群体研究,则不需要校准试验,并且在评价治疗依从性时的血液检验足以测量AutoImm Load以便报告治疗决定。
实施例12
小鼠TCRβ和IgH序列的扩增
与针对人开发的方案类似地开发用于小鼠TCRβ和IgH的扩增和测序方案。应用使不同序列的扩增效率的差异最小化的类似方法以及使用尖峰(spikes)和上述5′RACE技术的类似验证技术。用所述用于人样品的类似方法确定cDNA的最小输入量。小鼠和人的扩增方案之间的一个区别在于,在小鼠中TCRβ的两个C区段在最靠近J/C连接的50bp内没有任何多态性。因此,在该方案中,用于第一阶段扩增的引物被置于位置25-50,用于第二阶段扩增的引物被置于位置1-25,而对于包含P5序列的后一种引物,该引物将具有5′尾。不同的序列将改善特异性,并且与对人采用的策略类似,除了对于多态性不需要“环出”任何碱基。
实施例13
小鼠序列数据的初步分析
用于小鼠数据分析的分析框架与上面所述的用于人数据的分析框架类似。一个区别在于小鼠样品测序的深度比人样品要浅。预计来自小鼠的血液样品为100μl。在100μl血液中有约100K个淋巴细胞,因此,测序至远高于100K的深度不会明显提高精度。因此,对于每份小鼠样品仅仅获得100K个阅读。即使对于小鼠的阅读数比人更小,但仍对小鼠总淋巴细胞和血液淋巴细胞的较大部分进行了采样。预计小鼠总淋巴细胞数比人的要小超过3个数量级。与用10ml人血液获得的采样(0.2%)相比,类似地100μl血液将提供小鼠血液中淋巴细胞的更好的采样(~10%)。
实施例14
在SLE模型中的IgH和TCR组库分析
用SLE的小鼠模型来研究TCR/BCR组库和疾病活动性之间的关系。小鼠模型是具有来自NZM2410的sle1和sle3基因座的B6。这些B6.sle1.sle3(BSS)小鼠以自发的方式发生了SLE样肾炎。研究三种类型的群组。对于所有研究点,获得血液BUN、肌酐、抗核自身抗体、尿蛋白和肌酐水平。确定从血液TCR/BCR组库产生的评分与肾病的这些测量指数是否很好地相关。第一群组与所述的收集纵向血液样品进行肾功能评价的人群组类似。具体而言,每月跟踪7只BSS小鼠,直到第8个月。结束时,处死这些小鼠,除了血液,还分析脾和肾组织。作为对照,以类似的方式评价5只B6小鼠。第二群组是横向的,其中在特定时间处死不同群组的动物,并在该时间分析脾、肾和血液样品。具体而言,每个月处死5只BSS小鼠,并分析血液、脾和肾。作为对照,以类似的方式评价两只B6对照小鼠。最后,在疾病发作之后用类固醇治疗第三群组,并在其后定期获得肾炎评价和血液样品。具体而言,在4个月大时,用类固醇治疗患有疾病的20只小鼠,然后在接下来的4个月中每两周一次采集血液进行TCR/BCR组库分析和肾功能评价。作为对照,用安慰剂治疗5只BSS小鼠并以类似的方式继续。从所有研究点(即,不同的时间点和对于相同时间点的不同组织)进行TCR和BCR组库分析。分析包括如上所述的2阶段PCR、测序过程以及原始数据分析。
实施例15
与小鼠SLE相关的克隆型的鉴定和动力学
首先,鉴定一组与肾功能相关的克隆型。可以使用尿蛋白/肌酐比、血清肌酐或BUN水平作为肾功能的度量。在第一和第三群组中,可以评价每种HPC克隆型的血液水平与这三个度量中的每一个的相关性。以类似于对人所述的方式,可以评价随机期望(或置换检验)与肾功能度量中的1个、2个或所有3个高度相关的克隆型的数量是否有很大的增加。考虑到随机期望,挑选相关性阈值,其中相关性水平在该阈值以上的克隆型仅仅10%被预期偶然具有观察到的相关性水平(10%假发现)。聚焦于这些克隆型,这组被定义为“相关克隆型”。
除了用来鉴定相关克隆型的这种统计方法,还可以通过富集肾组织中的特定克隆型的“功能性”方法来鉴定与疾病相关的克隆型。通过该功能性方法,可以在第2群组中鉴定一组可能与疾病相关的克隆型,它们被称为功能上鉴定的相关克隆型。可以评价相关克隆型的“统计”定义和“功能性”定义之间的重叠程度。第1和第3群组在最后的时间点收集肾脏样品。可以评价在这些肾脏样品中富集的克隆型是否存在于血液中,并且是否在与肾功能具有较高相关性的克隆型中。
然后可以评价(统计学和功能性鉴定的)相关克隆型的动力学。例如,使用来自第2群组的数据,在肾、血液和脾脏这三个组织中评价它们的水平上升和下降(如果有的话)的时间过程。
在统计学鉴定的相关克隆型中,借助它们与肾功能的相关性鉴定一个亚组的相关克隆型。可以在不知道肾功能数据的情况下鉴定相关克隆型。换言之,可以了解区分相关克隆型和与疾病无关的那些克隆型的特征。为了做到这一点,将一组与肾功能相关性较低的克隆型鉴定为对照的不相关克隆型。
与疾病相关的克隆型的特征。在鉴定两组克隆型(相关的和不相关的)后,寻找区分这两组的特征。用统计学和功能性鉴定的相关克隆型进行单独的和组合的分析。评价在人中研究的相同类型的特征,例如克隆型的水平、特定序列基序的存在以及其他相关克隆型的序列。如对于人研究所述,存在明显的过度拟合风险,因此,需要采用交叉验证技术或单独的训练和测试组。
小鼠实验的一种实用性是细胞的可获得性,这允许评价相关克隆型是否在细胞的特定亚型中富集。研究了相关克隆型是否在一些细胞亚型中富集;可以对全套淋巴细胞和富集了相关克隆型的特定亚型进行测序,这种富集标准可以用作区分相关克隆型和其他与疾病无关的克隆型的额外特征。为了知道富集了什么细胞亚型克隆型,采用了一对方法:假设驱动和无假设方法。第一种方法是在一组样品中尝试十二种候选T或B细胞表面标记物。例如,一种候选物是用于选择激活的T细胞的T细胞上的CD69。对于B细胞,研究已经显示在活动性SLE中CD27高细胞增加,因此,它是可能具有相关克隆型富集的细胞的标记物的良好候选物。在这些实验中的每一个中,通过FACS纯化特定的细胞亚型。然后,对于来自淋巴细胞的完整互补物的cDNA以及来自通过FACS从不同样品的集合中纯化的淋巴细胞的cDNA进行测序反应。评价与FACS纯化的亚组相比,两组相关和不相关的克隆型是否以不同的比例存在于淋巴细胞的完整互补物中。具有很大差异的标记物可用于鉴定定相关克隆型。除了序列参数,还使用具有这些标记物的细胞亚型中克隆型的富集来检测相关克隆型。
在无假设方法中,寻找在具有相关克隆型的细胞中与在其他细胞中差异表达的标记物。选择其中特定TCR克隆型与疾病明显相关的少数情况,并且选择其中克隆型高度富集的情况,它代表了大多数具有相同V区段的克隆型。使用针对特定V区段的抗体(针对所有V区段的抗体可以商业获得)进行FACS以选择高度富集携带相关克隆型的细胞的群体。可以从这些细胞制备RNA,并可以通过进行阵列实验研究所有基因的表达。作为对照,可以使用来自淋巴细胞的总RNA和/或来自FACS纯化的携带另一个无关V区段的细胞的RNA。可以寻找最大程度地区分从FACS纯化的V区段获得的具有相关克隆型的样品和对照的标记物。可以发现区分这两个群体的标记物,包括表面标记物(因为用表面蛋白质进行FACS容易得多)。如果从数只小鼠的样品中观察到一致的RNA标记物,则在蛋白质水平上得到验证。使用相同的样品,在FACS试验中使用针对标记物蛋白质的抗体来纯化携带该标记物蛋白质的细胞。可以检测多于一种标记物以增加验证其中之一的机会。对来自纯化的细胞的TCR和/或BCR进行测序。如果RNA结果保持在蛋白质水平上,那么相关克隆型在纯化的细胞亚组中应当是富集的。在验证了RNA结果仍然保持在蛋白质水平后,在其他样品中验证该结果。未经受阵列分析的样品用针对标记物蛋白质的抗体进行FACS分析。对纯化的细胞的TCR和/或BCR进行测序。评价相关克隆型是否在使用针对特异性标记物的抗体纯化的细胞中富集。这将验证标记物在相关克隆型的鉴定中的实用性。
实施例16
使用IgH和TCRβ组库来测量疾病活动性
可以应用上面所述的用于相关克隆型的算法来借助它们的序列和/或标记物在第1和第3群组的所有样品中确定相关克隆型。使用每位患者中的相关克隆型的水平,可以产生与肾功能度量相关的AI评分。如上所述,有过度拟合的风险,因此,需要采用交叉验证技术和/或单独的训练和测试组。可以以横向方式评价AI和肾功能度量的相关性(所有小鼠的所有研究点)。当肾功能改变时,也可以评价个体小鼠中AI评分是否改变的问题。可以通过以与人中描述的类似的方式比较相同动物中来自高和低肾功能的AI来评价这一点。
实施例17
监测结肠癌患者中的转移性复发
在可治疗阶段检测到的许多癌症仍然具有成为转移性肿瘤复发患者的进行性风险。这种复发往往在晚期以及不能治疗的阶段发现,对于患者可能是致命的。这种情况的一个例子是复发性结肠癌。尽管有越来越具激进的结肠癌筛查程序,但是结肠癌代表了美国最常见的恶性肿瘤之一。每年约150,000位患者在严重但仍可治疗的阶段(II期和III期)被诊断为结肠癌。通过肿瘤切除随后进行一个疗程的化疗而治疗这些患者。虽然这些治疗通常是有效的,但是这些患者仍然有很大的概率在治疗后的数年中发生原发肿瘤的转移性复发。例如,50%的III期患者在术后5年内将复发。这些复发可能是分离的(例如,在结肠或肝脏中)或多病灶性的。在任一情况下,但是尤其如果它们是分离的,在早期阶段检测到它们可能在使成功治疗(外科手术和/或化疗)的机会最大化中起作用。
目前在治疗后的监测中使用两种检查。使用腹部和胸部CT扫描来确定在这些图像上可以看到的肿瘤。通常,在治疗后的前5年,以6-12个月的间隔进行这些扫描。虽然这些扫描可以发现早期恶性肿瘤,但临床效果仍有争论。这些扫描的缺点包括它们使患者经受大量的辐射这一事实,辐射本身可以造成进一步的肿瘤和可观的费用。另一种基于血液的检验已经显示具有一定的价值:CEA检验。这种抗体检验测量血清中对一些结肠肿瘤具有特异性的蛋白质的水平。CEA检验的缺点是它缺乏灵敏度(<60%的CT扫描阳性患者为CEA检验阳性)。
在本发明的该实施方案中,从切除的原发肿瘤获得的淋巴细胞用于形成免疫谱,该免疫谱可用于增加针对早期癌症复发的基于血液的检验的灵敏度。可以对切除的肿瘤中发现的TCR(和/或BCR)进行扩增和测序。肿瘤样品中富集的克隆型很可能与针对肿瘤的免疫应答有关。可以通过随后对患者的血液采集来评价这些克隆型的水平。这些克隆型的水平的上升可以传递针对肿瘤复发的免疫应答的信号。在这种情况下,免疫应答的检测可能比肿瘤标记物物本身的检测更加灵敏。
用于使用校准试验检测癌症复发的发现研究。进行发现研究,以确定根据血液TCR(和/或BCR)的谱检测复发的可能性。该研究使用切除的肿瘤样品的样品以及具有已知结果的患者的随访血液样品。对来自所有这些样品的TCR(和/或BCR)进行测序。相关克隆型的候选物是存在于来自肿瘤样品的TCR(和/或BCR)数据中的那些。考虑到使用标准交叉验证技术在该训练研究中已知的结果,设计了一个模型,该模型根据不同的克隆型的水平产生评分(复发风险)。因此,通过测定切除的肿瘤中的克隆型(校准点)和后来在监测复发期间在同一患者的血液中发现的克隆型的数据,在新的患者中计算这种复发评分。该肿瘤数据的使用使得该分析中认定的血液中存在的克隆型数大大减少。
用于使用校准试验和群体研究检测癌症复发的发现研究。很可能不是肿瘤标本中富集的所有克隆型都与针对肿瘤的免疫应答有关。可能有一些淋巴细胞由于有利的炎症条件而在局部扩增。在本发明的另一个实施方案中,使用相同的样品进行发现研究,但是该研究用于鉴定能够区分“相关”克隆型和“不相关”克隆型的参数。这些参数可以包括:1)序列基序:基序可以是与相关克隆型有关的特定V或J区、组合VJ或在DJ区中的短序列;2)克隆型的大小;3)水平:绝对水平(每百万的阅读数)或等级水平;4)与其他克隆型的相似度:其他高度相关的克隆型的存在,如具有沉默改变(编码相同氨基酸的核苷酸差异)的克隆型或具有保守氨基酸改变的克隆型;5)对于BCR,克隆型中体细胞突变的水平和/或与一些种系克隆型的差别在于体细胞突变的独特克隆型的数量。6)携带特定标记物的细胞的存在。然后,本研究产生一种算法,该算法可以根据给定的肿瘤样品中存在的一组特定克隆型从血液预测哪些克隆型可能与癌症复发相关。然后,可以使用这些克隆型以上述相同的方式得到复发风险的评分。
用于使用群体研究检测癌症复发的发现研究。在本发明的另一个实施方案中,使用在切除的肿瘤中测定的克隆型产生模型,该模型可以预测在尚未看到的样品中的相关克隆型。该模型也可以用于以类似于以上所述的方式产生复发风险评分。在这个模型中,不需要测定从经历复发监测的新患者上切除的癌组织中的克隆型,而是可以通过简单测定给定的血液样品中的克隆型来评价复发风险。
用于使用群体研究检测原发性结肠癌的发现研究。作为扩展,用相同的方法实现原发性癌的检测。对于原发性癌,没有切除的肿瘤可用于富集相关克隆型。然而,即使在存在肿瘤切除数据的情况下,也需要使用额外的序列和其他参数来鉴定相关克隆型并产生癌症检测可能性的评分。因此,扩展开来,如果算法有足够的预测性,可以不需要来自切除的肿瘤的数据而由血液(或其他体液)检测癌症。在本发明的该实施方案中,在原发性癌症的诊断之前需要能够用来自患者的血液样品进行发现研究。以与上述方式类似的方式,可以鉴定参数(序列和其他),从而预测与针对肿瘤的免疫系统应答相关的克隆型。然后可以用该模型产生预测进展为结肠癌的风险的癌症风险评分。然后可以将该算法应用到新患者的血液样品以测定原发性结肠癌的风险。
实施例18
监测心脏移植患者的排斥反应
心脏移植是相对少见的手术,因为器官的供应非常有限。全世界每年进行3500例心脏移植。每个手术都非常昂贵,并且所用的器官是无价的。因此,非常主动地治疗接受这些器官的患者。为了在免疫抑制剂干预可能有效时测定针对捐献器官的免疫反应的状态,对患者进行定期心脏活检以测定器官的炎症。基于这些检测,可给予激进的免疫抑制剂疗程。这些程序具有数种限制。作为侵入性手术程序,它们对患者造成风险。此外,它们是昂贵的,只能以不频繁的间隔来进行。基于分析一组11种测试基因的表达的基于血液的检验(Allomap)已经表明在检测器官排斥反应中相当灵敏,但是缺乏足以用作活检的替代的灵敏度,反而用来决定何时进行活检。在本发明的一个实施方案中,TCR(和/或BCR)谱用于评价“排斥”的状态,并产生能够预测在特定时间范围内发生排斥的可能性的排斥风险评分。可以设想,可以进行发现研究以根据血液TCR(和/或BCR)谱确定排斥的可能性。这在临床上可以为正在使用的免疫抑制疗法提供信息。
使用群体研究的相关克隆型的发现。在本发明的该实施方案中,使用临床结果已知的一群移植后患者的血液样品。对来自所有这些样品的TCR(和/或BCR)进行测序,并用单独的克隆型与排斥结果的相关性区分相关克隆型与不相关克隆型。随后,得到区分这两类克隆型的参数。这些参数可以包括:1)序列基序:基序可以是与相关克隆型有关的特定V或J区、组合VJ或在DJ区中的短序列;2)克隆型的大小;3)水平:绝对水平(每百万的阅读数)或等级水平;4)与其他克隆型的相似度:其他高度相关的克隆型的存在,如具有沉默改变(编码相同氨基酸的核苷酸差异)的克隆型或具有保守氨基酸改变的克隆型;5)对于BCR,克隆型中体细胞突变的水平和/或与一些种系克隆型的差别在于体细胞突变的独特克隆型的数量。6)携带特定标记物的细胞的存在。如果研究样品具有移植物的活检样品,尤其是如果它处于活跃的排斥中,将获得定义相关克隆型和不相关克隆型的替代的或补充的方法。预期此时有相关克隆型的极大富集。如上所讨论地鉴定区分这些与其他克隆型的参数。
然后使用来自血液样品的谱数据来预测排斥的可能性。考虑到在该训练研究中的已知结果,可以设计一种使用标准交叉验证技术的模型,该模型根据不同克隆型的水平产生排斥风险评分。根据新血液样品中在特定点的TCR(和/或BCR)谱,可以产生与排斥可能性相关的排斥风险评分。
使用校准试验的相关克隆型的发现。在另一实施方案中,对于每位患者,使用校准试验执行鉴定相关克隆型的方法。这种方法涉及移植后采集的第一活检样品。移植后移植物的活检材料的存在提供了从活检样品分析TCR以确定由在该样品中普遍存在的那些所定义的相关克隆型的可能性。然后跟踪血液中的这组克隆型,并产生排斥可能性评分。通过与上述相似的发现研究来获得产生排斥风险评分的算法,该研究利用可获得的临床数据和相关克隆型的水平来产生近似于排斥可能性的排斥风险评分。
在本实施方案中,用来自移植后第一活检的材料进行特定的校准试验,但是可以使用血液样品来替代进一步的活检,可以使用其克隆型以及这种校准试验来测定排斥风险评分。
除了移植物活检,移植前的血液样品作为另一个校准点。在这种样品中普遍存在的克隆型不可能与排斥相关,而是代表患者已经接触的以前抗原的历史。因此,当考虑移植后血液样品时,可以在确定相关克隆型中减去移植前存在的克隆型。然后用这些克隆型产生排斥风险模型。
在本实施方案中,可以使用两个校准试验:一个在移植前,一个来自移植后的活检。然后可以使用这些校准以及源自血液检验的克隆型来测定排斥风险。
使用校准试验和群体研究的相关克隆型的发现。在另一实施方案中,通过上述方法的组合可以实现相关克隆型的鉴定。具体而言,可以通过使用群体研究产生预测相关克隆型的算法来实现这一点。此外,可以用移植物活检和/或移植前血液样品通过来自同一患者的校准数据来实现这一点。更优选的实施方案将采用两种方法:群体建立算法和个体校准来最准确地鉴定相关克隆型。然后用这些克隆型的水平产生排斥风险评分以通过使用群体研究作为训练组来预测排斥的可能性。
在本实施方案中,可以使用两个校准试验:一个在移植前,一个来自移植后的活检。然后可以使用这些校准以及源自血液检验的克隆型来测定排斥风险。
可以通过与相同的群体研究概念非常相似的方式进行GVHD的预测,以产生预测相关克隆型的算法。也可以从移植前的供体样品产生“阴性”校准。同时使用算法和校准的方法可能更能够预测相关克隆型。以上述方式使用群体研究可以根据相关克隆型的水平产生用于计算GVHD可能性评分的算法。然后,该算法可用于在下一组患者中预测GVHD的可能性。
实施例19
监测在用那他珠单抗治疗的MS患者中的PML感染
本发明的一个实施方案使用TCR和/或BCR谱来检测MS患者中的亚临床进行性多灶性脑白质病(PML)。PML是一种严重的、通常致命的疾病,其通过杀死合成髓磷脂的少突胶质细胞而引起通常迅速进展的脱髓鞘性疾病。它由JC病毒引起,该病毒在潜伏期存在于该群体的大多数中。在免疫抑制的群体的一部分(如AIDS)中,病毒被重新激活,导致发生这种严重疾病。此外,一些通过使用药物而被免疫抑制的患者,如移植后患者,也可以发生PML。一些具体药物已经与特定患者群体中PML的风险关联起来。例如,那他珠单抗(Tysabri)与多发性硬化症(MS)患者中的超过10例PML的发生有关,导致其退出市场一段时间。公认那他珠单抗比FDA批准用于多发性硬化症的其他药物更有效,但是对发生PML的担心限制了它的应用。一旦怀疑PML,就可以进行血浆去除术以降低药物在患者体内的浓度。MS和PML的症状之间的重叠有时会延误PML的检测。迫切需要亚临床PML的早期检测。
可以从来自其中一些患者发生PML的群体的血液样品中辨别这些克隆型。该群体可用于鉴定与后来的PML发生相关的克隆型。鉴于这些克隆型的可获得性,可以产生鉴定区分这些与其他克隆型的参数的算法。
使用群体研究的相关克隆型的发现。在这种情况下,产生预测与PML的出现相关的克隆型的算法。可以在一组被认为与疾病相关的克隆型上训练该算法。在本发明的该实施方案中,在发现研究中可以使用来自一群具有JC病毒潜在性感染的患者(其中一些继续发展为PML)的血液(或其他体液)样品。对来自所有这些样品的TCR(和/或BCR)进行测序,并利用单独的克隆型与传染原再活化结果的相关性来区分相关克隆型与不相关克隆型。可以鉴定区分这两类克隆型的参数。这些参数可以包括:1)序列基序:基序可以是与相关克隆型有关的特定V或J区、组合VJ或在DJ区中的短序列;2)克隆型的大小;3)水平:绝对水平(每百万的阅读数)或等级水平;4)与其他克隆型的相似度:其他高度相关的克隆型的存在,如具有沉默改变(编码相同氨基酸的核苷酸差异)的克隆型或具有保守氨基酸改变的克隆型;5)对于BCR,克隆型中体细胞突变的水平和/或与一些种系克隆型的差别在于体细胞突变的独特克隆型的数量。6)携带特定标记物的细胞的存在。从一组针对相同传染原发生免疫应答的患者获得定义相关和不相关克隆型的替代的或补充的方法。在这些患者中富集的克隆型(尤其是水平比免疫应答之前明显更高的那些)可以被视为相关的,并且可以鉴定区分它们和其他克隆型的参数。
类似地,从活动性PML患者的样品或者从鉴定响应JC病毒抗原的克隆型的体外研究中可以鉴定相关克隆型。对应的克隆型可能来源于一位或多位受试者,他们可能是健康的或者被传染原感染。这些克隆型可以被视为相关的,并且可以鉴定区分它们与其他克隆型的参数。
然后使用来自发现研究中的样品的谱数据来预测再活化的可能性。考虑到在该训练研究中的已知结果,可以使用标准交叉验证技术设计一种模型,该模型根据不同的克隆型的水平产生PML风险评分。所以,考虑到血液样品中在特定点的TCR(和/或BCR)谱,可以产生与再活化可能性相关的评分。现在,这种算法可以与来自新患者的数据一起使用以预测患者的相关克隆型以及产生关于再活化可能性的PML风险评分。
以非常相似的方式,可以研究其他感染相关的结果。例如,除了潜在性感染的再活化,还可以评价感染的清除。而且,考虑到TCR和/或BCR组库,能够评价对特定传染原具有免疫的可能性。
实施例20
监测潜在性感染的再活化
在另一个实施方案中,可以使用TCR和BCR谱分析来监测具有急性感染、随后的潜伏期和再活化的周期的感染。这类疾病的例子包括乙型肝炎和丙型肝炎以及疱疹病毒。在早期预测感染是期望的。
使用校准试验的相关克隆型的发现。在另一实施方案中,对于每位患者,可以使用校准试验执行鉴定相关克隆型的方法。在患者对传染原发生免疫应答时的以前的时间点来自同一患者的生物样品的存在可以用来鉴定相关克隆型。然后可以在血液中跟踪这组克隆型,并产生关于再活化可能性的再活化评分。通过与上述研究相似的发现研究获得产生该评分的算法,该研究利用可获得的临床数据和相关克隆型的计数来产生近似于再活化可能性的再活化评分。为了使用这种评分,在临床实践中从急性感染期的新患者中采集样品。可以使用该数据以及随后在潜伏期采集的样品来测定用于临床目的的再活化风险。
使用校准试验和群体研究的相关克隆型的发现。在另一实施方案中,通过上述方法的组合可以实现相关克隆型的鉴定。具体而言,可以通过使用群体研究产生预测相关克隆型的算法来实现这一点。从具有已知感染结果的患者和/或对传染原具有主动免疫应答的一组患者的群体研究中,和/或从鉴定与传染原具有反应性的克隆型的体外实验中,可以获得相关克隆型。此外,可以使用在针对相关传染原的主动免疫应答时的更旧的数据点,通过来自同一患者的校准数据来实现这一点。一个更优选的实施方案将采用群体建立的算法和个体校准这两种方法来最准确地鉴定相关克隆型。然后用这些克隆型的水平来产生再活化风险评分,以便通过使用群体研究作为训练组来预测再活化的可能性。为了使用该评分,对从急性感染期的门诊新患者中采集的样品进行谱分析。可以使用该数据以及随后在潜伏期采集的样品来测定用于临床目的的再活化风险。可以采用类似的结构来研究传染原的清除或针对它的免疫。
实施例21
监测免疫治疗期间的变应性应答
变应性鼻炎是困扰约11%的美国人口的常见病症。这一般是对花粉或灰尘的变态反应。消除暴露是困难的,并且涉及警惕性的努力。慢性鼻炎中使用的最常见的治疗是减充血剂、抗组胺药和鼻类固醇。在严重的情况下进行免疫治疗。免疫治疗的目标是对患者脱敏。首先用许多潜在的变应原进行攻击以鉴定患者与其反应的特定变应原。然后,在数月至数年的时间内向患者注射含量逐渐增加的变应原,直到达到维持剂量,然后继续治疗数年。通常,患者在3-6个月内可以感觉到症状的改善,但也可能晚至12-18个月,但是大部分患者不会从治疗中获益或者复发。缓慢的剂量增加的一个原因是,如果在患者被充分脱敏之前给予她/他高剂量的变应原,则有过敏的风险。
在本发明的一个实施方案中,利用TCR(和/或BCR)谱评价变应性鼻炎的疾病状态,并产生变态反应评分,该变态反应评分预测当患者暴露于相关的变应原时,她/他产生变应性应答的倾向如何。可以设想,可以进行发现研究以根据血液TCR(和/或BCR)谱来确定变应性应答的可能性。这可以用于定制免疫疗法治疗。可能的临床决定可以是在认为无效时停止治疗、继续注射方案或加速治疗以更快地达到维持剂量。
使用群体研究的相关克隆型的发现。在本发明的该实施方案中,可以使用临床结果已知的接受免疫疗法的一群变应性鼻炎患者的血液样品。可以对来自所有这些样品的TCR(和/或BCR)进行测序,并且可以利用单独的克隆型与变态反应结果的相关性来区分相关克隆型与不相关克隆型。随后,可以得到区分这两类克隆型的参数。这些参数可以包括:1)序列基序:基序可以是与相关克隆型有关的特定V或J区、组合VJ或在DJ区中的短序列;2)克隆型的大小;3)水平:绝对水平(每百万的阅读数)或等级水平;4)与其他克隆型的相似度:其他高度相关的克隆型的存在,如具有沉默改变(编码相同氨基酸的核苷酸差异)的克隆型或具有保守氨基酸改变的克隆型;5)对于BCR,克隆型中体细胞突变的水平和/或与一些种系克隆型的差别在于体细胞突变的独特克隆型的数量。6)携带特定标记物的细胞的存在。定义相关克隆型和不相关克隆型的替代的或补充的方法将使用来自特定变应原阳性患者的阳性变态反应检测材料的活检。在变应原注射部位,预期有相关克隆型的大量富集。可以如上所讨论地鉴定区分这些与其他克隆型的参数。
然后使用来自血液样品的谱数据来预测变态反应状态。考虑到在该训练研究中的已知结果,可以设计一种使用标准交叉验证技术的模型,该模型根据不同的克隆型的水平产生变态反应评分。考虑到新的血液样品中在特定点的TCR(和/或BCR)谱,可以产生变态反应评分以估计该患者倾向于发生变应性应答的程度。
使用校准试验的相关克隆型的发现。在另一实施方案中,对于每位患者,可以使用校准试验执行鉴定相关克隆型的方法。这种方法涉及从患者采集的来自具有阳性变应原应答的部位的活检样品。这可以来自初始的变态反应试验,进行该试验以确定患者对其发生应答的特定变应原或者来自任何进一步治疗注射的部位的样品。这可以进行多于一次以保证在有一些表位扩散的情况下仍能跟踪适当的克隆型。可以使用来自这些活检样品的TCR和/或BCR来鉴定由该样品中普遍存在的那些所定义的相关克隆型。然后可以在血液中跟踪这组克隆型,并产生关于变态反应应答可能性的评分。通过与上述研究相似的发现研究获得产生变态反应评分的算法,该研究利用可获得的临床数据和相关克隆型的水平来产生用于估计变态反应状态的变态反应评分。
使用校准试验和群体研究的相关克隆型的发现。在另一实施方案中,通过上述方法的组合可以实现相关克隆型的鉴定。具体而言,可以通过使用群体研究产生预测相关克隆型的算法来实现这一点。此外,可以使用来自具有阳性变应原应答的部位的活检,通过来自同一患者的校准数据来实现这一点。一种更优选的实施方案将采用群体建立的算法和个体校准这两种方法来最准确地鉴定相关克隆型。然后用这些克隆型的水平来产生变态反应评分,以通过使用群体研究作为训练组来预测变态反应的状态。
实施例22
从基因组DNA扩增IgH序列
在本实施例中,描述了从基因组DNA扩增IgH序列。这种扩增是有利的,因为(1)可以轻易地将基因组DNA中的克隆型水平转化为细胞数,和(2)在一些淋巴肿瘤中,对于相关的免疫受体重排,RNA可能不表达。
免疫受体重排的扩增对于淋巴肿瘤的检测是重要的。B细胞肿瘤比T细胞肿瘤更常见,而IgH是B细胞肿瘤中最常见的重排免疫受体。由于体细胞超突变,可以通过对每个V区段使用多条引物进行扩增来增加从基因组DNA扩增IgH的可靠性,尽管存在差异扩增的风险。在从基因组DNA的扩增中,使用与从cDNA扩增所用相同的V引物。在三个不同的反应(分别为表5-7)中通过3条引物(在V区段的3个独特区域中:A、B、和C)扩增每个V区段(见图4A)。
表5
用于反应A的人IgH V区段引物
(所有引物都在其5’末端添加有相同的14bp(AGATCGGAAGAGCA)(SEQ ID NO 165))
Figure BDA00002699449301561
表6
用于反应B的人IgH V区段引物
(所有引物都在其5’末端添加有相同的14 bp(AGATCGGAAGAGCA)(SEQ ID NO 165))
Figure BDA00002699449301571
表7
用于反应C的人IgH V区段引物
(所有引物都在其5’末端添加有相同的14bp(AGATCGGAAGAGCA)(SEQ ID NO 165))
从基因组DNA扩增IgH与从cDNA扩增有几点不同。C区段通过剪接连接于VDJ区,因此C区段的序列可以用于从cDNA扩增但不能用于从基因组DNA扩增。C区段的使用允许在第一和第二扩增中使用两条不同的引物,从而增加特异性。对于从基因组DNA扩增,我们选择使用与J序列互补的引物(表8)。
表8
人IgH J区段引物*
*使用的J区段引物。在5′的18bp是附加于与J区段互补的序列上的相同序列,以便允许第二阶段扩增。位置N表示为了获得被测序的簇中的多样性的一个随机位置。小写字母序列在内含子中,而序列的3′的大写字母序列在外显子中。斜体字母强调引物间不同的碱基。
这些引物跨越外显子-内含子边界,使用的四条引物扩增在IMGT数据库中所述的不同J区段和等位基因。第二阶段的引物没有任何与基因组序列互补的序列。
相对于与IgG恒定区互补的恒定区引物,使用J引物允许评价其他类别(IgM、IgD、IgA和IgE)。
在cDNA的情况下,需要选择是使用J引物还是使用恒定区引物。为了将克隆型的信息与其特定类别相关联,可以使用数种恒定区引物来扩增所有类型,并在进入J序列之前对一些恒定区测序。许多测序技术的测序阅读很短,因此难以做到这一点。市场上现有的平台之一(454Roche)具有较长的阅读,但它比其他平台具有更低的通量。随着这些技术进一步发展,这种选择成为可能。使用目前的短阅读(<100bp),我们关于基因组DNA试验的工作表明,可以使用J和C引发方法从cDNA进行扩增。我们可以使用J引物从cDNA进行扩增。然而,考虑到这些引物的外显子区段对于从cDNA特异性扩增来说可能太短,可以使用一组涵盖所有不同类别的恒定区引物(和我们已经证明在另一侧的V区段引物)进行可能的第一阶段PCR。然后,可以使用对于使用低复杂度模板的第二阶段PCR而言其长度足以具有高特异性的J引物进行第二阶段PCR。然后对产物进行测序。如上所述,与对于IgG所示的方案相比的缺点在于J序列中的体细胞突变可能抑制扩增。优点在于,即使没有完全确定关于每种克隆型的类别的信息,也可以评价所有不同的类别。可能地,可以进行类别特异性扩增IgG、IgM、IgD、IgA或IgE,并且与使用所有引物以及随后使用J引物获得的整体情况进行比较。例如,可以将从IgG扩增获得的克隆型谱与使用所有引物以及随后使用J引物获得的克隆型谱进行比较。其差异大概是由于J引物和其他类别的克隆型中的体细胞突变(这在使用IgG引物的反应中可以轻易地确定),然后可以对其进行定量。
在cDNA中使用J引物也可以直接比较cDNA和基因组DNA结果。这将在克隆型水平上提供表达水平信息,并且事实上可以具有功能相关性。本发明的一个方面在于,比较来自相同血液或其他生物样品的cDNA和基因组DNA的克隆型谱鉴定了具有不同频率的克隆型,它们指示每个细胞中通常高或低的表达。可以利用该功能信息来预测克隆型很可能与疾病相关或无关。此外,每个细胞中与疾病相关的克隆型的表达水平可用于确定疾病活动性或者疾病结果的可能性。例如,如果每个细胞中的克隆型表达水平(通过与基因组DNA克隆型谱分析进行比较而确定)不同,通过cDNA分析在两个个体中获得相同的相关克隆型水平可能仍然表明这两名患者具有不同的疾病活动性。
第二阶段PCR是用来附加扩增所需的序列。在第二阶段中所用的引物列于表9中。
表9
通用引物*
Figure BDA00002699449301611
*第三阶段是对于所有试验(例如,小鼠TCRβ与人IgH)任选的扩增阶段。这么做是为了保证与附着到流动池上的寡核苷酸杂交的末端序列的完整性。在所有试验(例如,小鼠TCRβ与人IgH)中使用通用的第二阶段引物。注意:在通用的第二阶段引物中使用N用来表示这样一个事实,即这些引物中的每一条都包含独特的6个碱基对的标签,从而允许随后鉴定样品。
使用上述引物和基本上相似的其他序列进行扩增是可能的。图8A-8B显示了此类扩增的例子,它们至少在20μl的输入基因组DNA中在50-2,000μg基因组DNA的范围内是成功的。
该试验需要容纳大动态范围的DNA。活检样品可能不具有大量材料,但是考虑到肿瘤很可能被大大地富集,因此不需要大量的初始材料。另一方面,1百万个细胞将具有约6μg基因组DNA。包含1百万个B细胞的PBMC很可能具有约20μg基因组DNA。为了能够评价1百万个B细胞,在3个PCR反应中的每一个中使用约6.6μg基因组DNA。值得注意的是,如果在与引物之一互补的序列中有体细胞突变,那么在本实施例中仅仅探询约660K个B细胞。如果该试验在50-10,000ng范围内工作,这是有用的。已经证明该试验在20μl中的50-20,000ng DNA的范围内工作。通过将反应放大至100μl,可以使用10μg DNA。
实施例23
监测急性淋巴细胞白血病(ALL)
最小残留疾病(MRD)对于儿童ALL的分层是重要的预后因素。通常在诱导治疗后几周在骨髓中检测MRD。白血病细胞的更灵敏的检测可以允许在血液中监测癌症复发。
使用评价血液中肿瘤克隆型水平的克隆型谱分析来灵敏地检测白血病细胞。
通过用高白血病载量探询样品来确认校准。白血病细胞通常以高频率存在于诊断样品(血液或骨髓)中。通常针对数种重排对诊断样品进行测序。
如果肿瘤是B细胞,则可以评价完全重排的IgH、部分D-J重排的IgH、IgK,包括Kde重排。
交叉谱系重排频繁发生,最频繁的是部分重排的(V-D)或(D-D)TCRβ。对于T细胞,TCRα和TCRβ发生频繁重排,TCRα频率相对低。对这些不同重排的克隆型组库进行测序确定了在肿瘤中存在的特定重排。然后可以监测特定序列的血液水平。
监测试验可能仅仅涉及相关的重排类型。例如,如果在诊断样品中鉴定的肿瘤重排是IgH和IgK,那么在随后的血液样品中对IgH和IgK进行扩增和测序。可以使用来自这些样品的最高达约1百万个B细胞的DNA来扩增IgH和IgK,并可以获得最高达约1百万或更多的测序阅读,这得到了1百万个B细胞中之1个的检测灵敏度,相当于1千万个白细胞中之1个的灵敏度。基于这种高灵敏度,在明显复发之前很可能明显地检测到白血病细胞。
已经描述了ALL中的克隆进化。这可能通过V替换或其他机制发生。为了检测进化,我们将鉴定与诊断样品中存在的那些相关的克隆型。例如,将鉴定具有相同的D-J连接但具有不同的V的克隆型。在诊断样品中以可观的频率存在这些有关克隆型增加了克隆型关联的可能性。跟踪多于一个重排(对于本实施例肿瘤为IgH和IgK)也可以改善这个问题。
对于预测复发,仅仅存在白血病细胞可能未必是足够的。对于结果已知的患者,使用纵向血液样品进行发现研究。我们将评价在这些样品中仅仅存在白血病克隆型是否足以预测一定时间后的复发。此外,我们将评价这些克隆型的频率的变化作为复发的预测。除了克隆型频率,白血病细胞上的标记物也可以指示复发。可以在富集具有相关标记物的细胞之前和之后进行测序。因此,确定克隆型的总频率。此外,确定具有相关标记物的这些细胞的分数,从而允许更精确地估计复发的风险。
根据以上所述,在一个方面,本发明提供了基于克隆型谱测定对MRD的检测。这类检测包括使用克隆型谱来(i)监测与疾病相关的患者特异性克隆型(包括进化的克隆)的存在和丰度,(ii)提供衍生出该克隆型的淋巴细胞的计数,以及(iii)提供克隆性的度量(即,克隆型谱如何“偏斜”到一个或几个克隆型的度量)。在一个方面,提供了同时给出(i)和(ii)的值的检测;另一方面,提供了从患者克隆型谱的一个测定同时给出所有三个量的检测。
实施例24
实体器官的移植物排斥的监测
实体器官移植物的排斥可通过两种不同的途径出现:直接和间接呈递。直接途径使用随移植物转移的供体抗原呈递细胞。在这种情况下,T细胞受体识别供体HLA。另一方面,间接途径在一定时间后发生。在这种情况下,通过受者HLA将供体肽呈递给T细胞。
可以使用移植的器官的活检样品来鉴定用于校准移植物排斥中的相关T(或B)细胞受体的相关序列。可以将所移植器官的活检中富集的克隆型与排斥时的血液进行比较以确定与排斥相关的克隆型。然后监测血液中这些克隆型的水平以预测排斥的状态。
还进行抗原特异性校准。为了鉴定与通过直接途径的排斥相关的克隆型,辐射供体淋巴细胞并与受者PBMC混合。激活能够识别供体淋巴细胞的受者PBMC。通过数种技术中的任一种分离这些活化的细胞。例如,通过细胞内细胞因子染色或细胞因子捕获技术借助细胞因子释放而分离这些细胞。不进行(或除了)分离,使细胞在体外复制。分离的(和/或复制的细胞)的序列与激活前序列的比较鉴定了与供体PBMC相互作用的克隆型。还在不加入抗原的情况下进行相同的T细胞激活程序并随后测序,以便减去不依赖于抗原激活的可能背景。然后监测移植物排斥相关克隆型的血液水平以评价直接途径的排斥活性。然后使用整体多样性的度量来监测通过直接途径的排斥的水平。
为了鉴定与通过间接途径的排斥相关的克隆型,供体抗原需要在受者HLA的环境中呈递。由于供体HLA通常是重要的抗原,供体HLA与受者抗原呈递细胞一起孵育,该受者抗原呈递细胞能够将来自供体HLA的肽在受者HLA的环境中呈递给受者T细胞。以类似于以上所述的方式,分离并复制这些细胞以鉴定在间接途径中与供体HLA相互作用的克隆型。或者,在不加入抗原的情况下进行相同的T细胞激活程序并随后测序,以便减去不依赖于抗原的激活的可能背景。或者,使用供体细胞而不只是HLA作为抗原的来源。以一种方式制备供体细胞,该方式使得受者抗原呈递细胞很容易在受者HLA的环境中呈递供体抗原。通过数种替代方法做到这一点,包括在添加到受者抗原呈递细胞之前使用数轮冷冻和解冻或者通过超声处理进行裂解。然后通过对上述分离的和/或复制的细胞进行测序来鉴定被受者HLA环境中的这些抗原所激活的克隆型。或者在不加入抗原的情况下进行相同的T细胞激活程序并随后测序,以便减去不依赖于抗原的激活的可能背景。一旦鉴定了这些克隆型,就监测它们的血液水平以评价间接途径的排斥活性。
实施例25
癌症复发
通过检测针对肿瘤的免疫应答而检测癌症复发。使用与肿瘤相关的T和B细胞克隆型的水平检测癌症复发。检测到相关T和B细胞的血液水平(或者在血液中获得的相关克隆型cDNA的频率)的增加,表明免疫系统识别了肿瘤复发。
也检测到这些水平的降低,表明肿瘤成功逃避了免疫系统并因此导致癌症复发。
检测到包含相关克隆型的细胞上细胞标记物变化,表明在相关克隆型的频率没有变化的情况下肿瘤复发。后一种情况可以反映肿瘤对免疫细胞的作用,使得它们无效或无反应性。
为了确定个体中的相关克隆型,使用原始肿瘤的样品以及在群体研究中开发的算法。或者,使用肿瘤特异性抗原来定义与肿瘤细胞相互作用的克隆型。例如,在这种富集之前和之后捕获与一些肿瘤特异性抗原相互作用的B或T细胞并测序,以确定与特定抗原相互作用的特定克隆型。
使用如上面所讨论的技术之类的技术(例如,四聚体结合、细胞内细胞因子染色或细胞因子捕获)进行体外实验以确定患者的样品中与特定肿瘤特异性抗原相互作用的特定克隆型。一旦定义了这些克隆型,就在其他血液样品中监测它们的水平。这些克隆型的水平的改变指示肿瘤复发。
用体外试验鉴定个体中的癌症相关克隆型,以确定与肿瘤相互作用的克隆型。采用冷冻和解冻的重复循环或超声处理来裂解肿瘤细胞。将这种制备物加入到自体的抗原呈递细胞(或包含抗原呈递细胞和T细胞的自体PBMC)。将混合物加入到自体T细胞,通过对分离的和/或复制的T细胞进行测序并与上述未富集的材料的序列进行比较来鉴定由抗原激活的克隆型。在不加入抗原的情况下进行相同的T细胞激活程序并随后测序,以便任选地减去不依赖于抗原的激活的可能背景。一旦确定了相关克隆型,就监测它们在血液中的水平以评价复发的可能性。
当癌症是能够呈递抗原的细胞发生的癌时,任选地可以不裂解肿瘤细胞,因为它们可以作为抗原呈递细胞。淋巴瘤,即一种在某些情况下也许能够呈递抗原的B细胞肿瘤,作为抗原呈递细胞起作用。任选地在体外激活肿瘤细胞以改善其抗原呈递能力。然后将这些肿瘤与自体T细胞(或PBMC)混合。在富集之前和之后对T细胞克隆型的测序鉴定了癌症相关的克隆型。然后监测血液中这些克隆型的水平以确定复发的风险。
对特定类型的细胞,例如具有特定表面标记物的细胞中的克隆型水平进行监测,以检测可能逃避免疫系统的癌细胞。所以对于具有相同水平的相关克隆型的两位患者,取决于在包含该克隆型的细胞中包含的标记物,一位患者的复发可能性可能比另一位患者更高。为了获得该信息,可以在用相关标记物富集细胞之前和之后进行测序。因此,可以测定具有特定标记物的克隆型细胞的总数以及分数和数量。
实施例26
丙型肝炎感染的监测
丙型肝炎的急性感染经常伴随免疫应答,该应答能够在约15%的病例中清除感染。已经显示清除感染的能力与某些HLA基因型相关。在大多数情况下,没有清除病毒,因而发生慢性感染。在这种慢性感染期间,病毒能够逃避免疫应答,其可能对大部分产生的肝损害负责。该疾病的最有效的治疗是干扰素。这种治疗至少部分通过激活免疫应答而杀死病毒。因此,在疾病过程中,在不同的状态下,免疫应答的监测是有帮助的。在急性期,评价免疫反应的程度可能有助于预测谁可能清除病毒。在慢性期,免疫应答水平的测定可以提供肝脏炎症程度的指示。最后,在干扰素治疗期间评价免疫应答可以提供治疗是否有效的早期指示。可以如上所述通过测序测定T和B细胞的组库来进行免疫应答的评价。
通过数种方法在每个个体中对与丙型肝炎相关的克隆型进行鉴定。丙型肝炎抗原用作单独的肽、肽的混合物、蛋白质或完整的病毒。根据与在其余细胞中的水平相比,克隆型在由抗原激活的细胞中富集的证据来鉴定与抗原相互作用的T细胞和/或B细胞。此外,在治疗过程中任选地对这些患者进行肝活检。这提供了用来鉴定丙型肝炎相关克隆型的额外的或替代的手段。与血液中相比在肝脏中更明显富集的克隆型可能至少在肝脏中的炎症过程方面是相关的。因此,在后来的点监测它们在血液中的水平以评价肝脏的炎症活性。最后,在一群患者中的发现研究可以指示一组与丙型肝炎相关的序列或基序。在这个群体研究中,借助相关克隆型与疾病或与肝活检中的富集的相关性来鉴定相关克隆型,并且发现区分这些克隆型与其他克隆型的算法。一些标准包括克隆型频率、等级、多个克隆型的序列相似性或序列基序以及一些细胞标记物的存在。
HLA分型用作分层方法。仅在特定HLA类型的情况下特定基序是预测性的。
病毒感染的细胞有时可以逃避免疫系统。因此,对特定类型的细胞,例如具有特定表面标记物的细胞中的克隆型水平进行监测。所以对于具有相同的相关克隆型水平的两位患者,取决于在包含该克隆型的细胞中包含的标记物,一位患者发生比另一位患者更剧烈的应答。例如,干扰素治疗的效果可能是克隆型细胞的定性以及定量变化。因此,获得克隆型的水平并定义他们是否具有特定的细胞标记物是重要的。为了获得该信息,在用特定标记物富集细胞之前和之后进行测序。因此,可以测定具有特定标记物的克隆型细胞的总数以及分数和数量。
实施例27
药物超敏反应
使用群体研究来鉴定与特定药物超敏反应相关的克隆型。在这些研究中,鉴定与ADR相关的克隆型,并根据不同标准,如频率、等级、治疗之前和之后的相对变化、多个克隆型的序列相似性、序列基序以及细胞标记物的存在,来鉴定区分它们和其他克隆型的特征。序列基序可以是HLA依赖性的,其中确定不同的基序与不同的相应HLA序列相关。
用于鉴定药物超敏反应相关克隆型的另一种方法是通过与抗原的相互作用。使用药物和/或其代谢产物来捕获与它相互作用的B细胞。类似地,最好在添加T细胞之前或在添加T细胞时,用自体抗原呈递细胞与药物或其代谢产物一起孵育。使用一些上面讨论的方法分离或复制激活的T细胞以获得抗原富集的细胞。然后对这些抗原富集的细胞进行测序,与未富集的细胞相比在这些细胞中富集的克隆型被鉴定为与药物相互作用相关。
还在不加入抗原的情况下进行相同的T细胞激活程序并随后测序,以便减去不依赖于药物抗原的激活的可能背景。
在给药之前或之后进行这种校准试验。在给药之前或之后采集血液样品,并使用克隆型水平的体内增加作为定义相关克隆型的额外标准。一旦鉴定了这些克隆型,就对其进行监测,以预测药物超敏反应的可能性。本发明仅仅利用药物的淋巴细胞激活来定义相关克隆型,并且可以通过测序监测后续样品中这些克隆型的血液水平,从而产生了灵敏且特异性的预测ADR的方法。使用的药物是小分子或生物剂,如抗体。类似地,如上所述用药物代谢物或代谢物的组合来鉴定与之相互作用的T细胞。通过化学合成产生或者从生物样品中纯化代谢物。例如,将药物引入生物体,并纯化药物代谢物以供在试验中使用。也通过用细胞在体外处理药物而获得代谢物。
对特定类型的细胞,例如具有特定表面标记物的细胞中的克隆型水平进行监测。与不存在激活标记物时相比,在引入药物之后在携带激活标记物的细胞中克隆型水平的增加更能说明药物超敏反应。为了获得该信息,在用特定标记物富集细胞之前和之后进行测序。因此,测定具有特定标记物的克隆型细胞的总数以及分数和数量。
在不给药的情况下预测ADR。在不将药物施用于患者的情况下,检测与药物相互作用的高水平克隆型或者可能发生对药物的强烈应答的序列基序的存在,以预测ADR。
鉴定具有特应性免疫相关ADR的药物的类似免疫应答特征。这些药物可能具有与该药物或其代谢产物相互作用的高频克隆型。在仅对少量患者施用之后鉴定可能具有免疫相关的ADR的药物。
通过在药物施用之后确定对药物(和/或其代谢产物)特异性的克隆型的增加,而检测引起ADR的药物的亚临床反应。
在少量患者中施用之后通过跟踪对应于ADR的克隆型的增加来鉴定可能具有免疫相关的ADR的药物。
实施例28
颈动脉血管病的危险分层方法
在患者中检测在斑块形成及稳定性中涉及的炎症。对血管炎症特异性的免疫应答用来指示斑块去稳定的风险。利用在ICA中的免疫反应中相关的特定抗原(包括修饰的或氧化的LDL和热休克蛋白)来鉴定与ICA中的免疫反应相关的特定克隆型。使用如上所述的相似的程序,鉴定与特定抗原相互作用的T或B细胞克隆型。监测所鉴定的克隆型的水平来评价ICA斑块去稳定的风险。
还用群体研究产生的算法来鉴定与ICA斑块去稳定相关的克隆型,该群体研究鉴定区分该相关克隆型和其他克隆型的特征。在群体研究中,借助这些相关克隆型与斑块去稳定的相关性或者根据它们在ICA斑块(例如由颈动脉内膜切除术获得的)中与在血液中相比的明显富集来鉴定这些相关克隆型。序列基序对于独特的相应HLA基因型可能是特异性的。然后用开发的算法来预测其他患者中ICA斑块去稳定相关的克隆型。
实施例29
EAE小鼠中的TCR组库分析
采用商业上获得的实验方案,例如Hooke Laboratories(Lawrence,MA),用肽139-151以及弗氏完全佐剂(CFA)处理10只SJL系小鼠。这些小鼠中的8只发生实验性自身免疫性脑炎(EAE)——多发性硬化症的小鼠模型,而其他两只没有。此外,仅用CFA处理2只同系小鼠。对于每只小鼠,在注射后的61天里每天获得疾病评分。评分范围为0至5。在注射前和之后特定天数获得血液样品。总体而言,从每只小鼠获得11份血液样品,在第62天或第63天处死小鼠,并获得脾、淋巴结和脊髓。将血液和组织立即分别保存在动物血液保护RNA试剂和RNAlater中。用Qiagen动物保护血液提取试剂盒从血液样品中提取RNA,机械匀浆组织样品,并用RNA Qiagen Plus小试剂盒制备RNA。用Vilo cDNA合成试剂盒(Life technologies)从每份样品产生cDNA。用表10中的引物从每份样品扩增TCRβ组库。
表10
小鼠V区段引物*
Figure BDA00002699449301701
*每条引物都在其5′末端添加有相同的14bp(AGATCGGAAGAGCA)(SE0 ID NO 165)。
用表7中的引物对每份样品进行第二次PCR。用一对引物扩增每份样品,该引物扩增完整的一套第一阶段PCR扩增子,但是也包括后来允许在序列数据混合物中鉴定单独的样品的单独的序列标签。用一对针对所有样品的引物(表7)进行第三次PCR。第三次PCR的目的是保证末端序列的完整性。PCR产物的结构如图2A-2B和图3A所示。在64组中合并这些PCR反应物,使得用第二阶段PCR中引入的独特标签之一为具有合并物的每份样品做索引。然后将来自这些合并物的分子变性,并通过与包含寡核苷酸的流动池杂交而将其在固体表面上以两个维度分开,该寡核苷酸与扩增产物的末端序列杂交。然后通过桥接扩增来扩增杂交的分子,从而在二维表面上形成簇,使得每个簇包含约1,000个分子,每个分子都是来自PCR合并物的单一分子的扩增结果。然后使用方法切割并释放这些分子中每一个的两条链之一,留下单链模板。然后将测序引物与该簇杂交。然后进行反复几轮测序,包括:引入每个核酸碱基的4种荧光标记的化学终止的核苷酸和聚合酶和缓冲液,使得对于与每个核苷酸互补的延伸产物的活性位置发生单核苷酸的掺入;洗涤步骤,用于测定哪些簇掺入哪种荧光染料的表面荧光扫描,裂解化学物质的引入,该裂解化学物质从掺入的碱基释放终止分子以及荧光标记以允许随后的循环;洗涤步骤。这些步骤重复约100次以显示每个簇的序列(阅读1)。然后通过变性去除合成的链。然后引入第二条引物,并重复测序过程以阅读6个碱基的标签。然后通过变性去除该合成的链。然后使最初的模板链与固定的表面引物回复杂交,该引物延伸以重新形成双链簇。在此时,裂解最初的链,导致从最初的单链簇的互补物形成簇。引入第三测序引物,它与该链杂交,重复测序约60个循环以便从扩增子的反向链获得序列(阅读2)。在基于标签序列分类后,获得的序列贡献每份样品约100,000-200,000次阅读。
首先将获得的序列定位到V和J区段的特定区域。具体而言,将阅读1的前27bp定位到不同的小鼠J区段的最后27bp。同样,将阅读2的初始序列定位到所用的引物的序列。当序列被定位到引物之一时,将引物之后的阅读2的序列定位到不同的小鼠V区段。由于期望阅读1到达V区段,我们还试图将其定位以确定框架和氨基酸序列。将阅读1的位置81-95定位到阅读2所定位的特定V区段的最3′端60bp。如果序列与J和V序列中的任一个不具有基本同一性,则将其去除。此外,在阅读1中延伸J和V定位。由于对每个簇定位特定的J和V,我们可以评价最初定位的序列之外的碱基是否与所定位的V和J的序列一致。当到达由非模板复制导致的碱基或D区段时,这些序列将不再一致。在最初定位的或延伸的区域中阅读序列和V或J序列之间的差异被认为是由于错误造成的并且进行“校正”。
对于位置28-80具有相同的序列的阅读被认为是克隆型。然后评价在序列上非常相似的克隆型看它们是否可能是独立的克隆型或者由于PCR和/或测序错误而被分离的克隆型。我们已经设计了一种算法,该算法引入了所考虑的两种克隆型的频率、它们之间的差异的数目以及在该位置发生错误的可能性,以便确定这两种克隆型是否被合并成一种克隆型。当这两种克隆型之一具有非常高的频率而另一种罕见时,在阅读的末端仅有一个碱基差异(通常具有更多的错误),于是,这两种克隆型可能是错误的结果,然后将它们合并。另一方面,具有类似的频率并且在它们之间具有三个差异的两种克隆型的存在表明,这两种克隆型是真正独立的,不进行合并。然后计算每种TCR克隆型的频率。
所有12只小鼠中存在一种共有克隆型。这种克隆型具有CFA反应性克隆型的特征。在注射之前或在第5天时,它在任何小鼠中都检测不到,但是在后来的时间点,它急剧增加至高频率。小鼠间和单一小鼠内的多个核苷酸序列编码这种克隆型的相同的氨基酸序列。总体而言,在排除了对于小鼠在少于3/10个时间点看到的克隆型之后(从所有小鼠中去除了时间点8,因为在几只小鼠中有异常的特征),在12只小鼠中获得了23个具有该氨基酸序列且具有10个独特核苷酸序列的克隆型的观察结果(其中19个以>10-4的平均频率存在)(对于19种高频率克隆型有8个独特的序列)(见表10)。此外,存在额外的相关克隆型(只有一个氨基酸差异),它们也具有在注射前低而在注射10天后高的相同的模式。这提供了CFA反应性克隆型的确凿的证据。
表11
对CFA有反应的小鼠TCRβ公共克隆型*
Figure BDA00002699449301731
Figure BDA00002699449301741
*log10平均频率描述了特定小鼠在所有10个时间点间的平均频率。
尽管此处显示和描述了本发明的优选实施方案,但是对于本领域技术人员而言很明显,这些实施方案仅仅以示例的方式提供。在不偏离本发明的情况下,对于本领域技术人员会想到众多的变化、改变和替换。可以理解,在实施本发明中可能采用此处所述的本发明实施方案的各种替代方案。下面的权利要求旨在定义本发明的范围,因此涵盖这些权利要求的范围内的方法和结构和它们的等同物。
通过观察其他小鼠中的TCR组库验证上面的实施例中所述的公有克隆型。具体而言,评价11只PLP处理的和3只假处理的小鼠中该克隆型的存在。在12/14只小鼠中存在该克隆型。此外,也反复看到在上面的实施例中提到的(具有一个氨基酸差异的)相关克隆型。对于具有一个氨基酸差异的克隆,有15个观察结果(在同一动物中或在不同的动物中的不同的核苷酸序列)。在接种之前在任何动物中没有看到该克隆型。频率的模式与在第一组动物中所看到的也非常相似。这验证了鉴定的公共克隆型对于大多数用弗氏佐剂处理的小鼠的确是共同的
使用所累及的组织帮助确定与疾病相关的克隆型。发现在上面的EAE模型中与疾病活动性相关的克隆型。然而,克隆型对于接种的佐剂方面或PLP肽是否是特异性的不是显而易见的。在假处理的样品中克隆型的存在或不存在是区分这两种可能性的方法。正如前面所公开的,可以使用所累及的组织确定与疾病相关的克隆型。在这种情况下,脊髓组织是可用的。从数据中筛选其在脊髓中的频率比在同时获得的其他三种样品(脾、淋巴结和血液)中的每一种中至少大3倍的克隆型。然后检查与疾病评分相关的克隆型。鉴定出现多于一次的克隆型。该克隆型的序列为LYCTCSALGGSSYEQYF(序列A)(SEQ ID NO:194)。在所有8只患病小鼠中寻找并鉴定该序列。用PLP治疗的两只小鼠并未发生疾病,在两只假处理的小鼠中没有检测到它。该克隆型在系列血液样品中的频率的模式在小鼠间不同。然而,在所有小鼠中,克隆型在接种之前是不存在的。此外,在除了一只之外的所有小鼠中,证明在脊髓中比在相同时间点的其他组织中有更高频率的模式。
考虑到过度拟合的风险,检查一组独立的小鼠以验证这些发现。在另外的小鼠中检查到序列A的存在。具体而言,在下列情况下检测到序列A的存在:在发生EAE的8只额外的PLP处理的小鼠中,在没有发生EAE的三只PLP处理的小鼠中,和在三只假处理的小鼠中。在11只PLP处理的小鼠中,该克隆型存在于八只小鼠中。没有该克隆型的三只中的两只没有发生疾病。在三只假处理的小鼠中没有发现该克隆型,在接种前的点在任一只PLP处理的小鼠中也没有发现该克隆型。此外,在所有动物中,证明在脊髓中比在同一时间点的其他组织中有更高频率的模式。在21只用PLP处理的动物的所有样品中(初始发现和后来的验证),18只具有克隆,但在接种之前都没有。此外,五只假处理的小鼠都不具有序列A。这提供了关于疾病特异性的公共EAE克隆型的有力证据。
与疾病相关并在脊髓中富集的额外克隆型似乎具有彼此非常相似的序列。这些半专有的克隆型是额外的疾病特异性克隆型。可以通过利用基序发现算法确定在脊髓中富集并且与疾病相关的克隆型之间共有的序列来更全面地鉴定它们。
实施例30
在IgH体克隆型谱分析中鉴定的体细胞超突变
用表5中所列的IgH V区段引物和同样在上面公开的与IgG恒定序列互补的引物进行三组扩增。来自7份正常样品、来自多发性硬化患者的7份样品和4份SLE样品的cDNA用作扩增的模板。在为每份样品引入独特标签的第二阶段PCR之后,在空间上分离产物并进行测序。
然后用上面公开的方法将序列定位到单个V和J区段并组装成克隆型。我们在这些样品中寻找可能是体细胞超突变的结果的频繁出现的高度相关克隆型的证据。表12中的数据显示了在一位多发性硬化患者中的明显的例子。在这个例子中,鉴定了12种独特的克隆型。这12种核苷酸克隆型编码3种高度相关的氨基酸序列。这些氨基酸序列中的两种具有非常高的频率(>1%),差异为一个保守的氨基酸(赖氨酸对精氨酸)。
表12
在多发性硬化患者中的相关克隆型的列表*
Figure BDA00002699449301771
*位置28-80的序列以氨基酸序列显示。频率列注明样品中克隆型的频率。例如,第二种克隆型占该样品中所有序列的2%以上。
实施例31
免疫谱分析的法医用途
T和/或B细胞受体的克隆型谱可以用于人和动物的鉴定。这些克隆型谱的巨大多样性为个体提供了非常独特的特征。图10的克隆型谱例证了这一点。在该实施例中,通过逆转录酶PCR由从两个不同个体的血液中提取的mRNA扩增TCRβ序列。与V区互补的引物列于表13中。第二阶段扩增引物与实施例2中的那些引物相同。对产物进行测序并且确定每种克隆型频率的频率。正如在图10中看到的,来自个体的绝大多数克隆型是不同的,一个个体(样品122)的克隆型几乎仅沿X轴分布,而另一个体(样品140)的克隆型几乎仅沿Y轴分布。只有约25种克隆型似乎是共有的,显示为离轴数据点。Warren等人,Genome Research,电子出版物(2011年2月24日)已经证实了克隆型使用在个体之间的这种差异。在本发明的一个方面,克隆型使用的这种差异提供了用于区分个体的方法,所述方法包括以下步骤:(a)获得第一样品的克隆型谱,(b)获得第二样品的克隆型谱,以及(c)通过测定克隆型使用的重叠程度确定第一样品和第二样品是否来自同一个体。
表13
人TCRβ V区段引物
Figure BDA00002699449301791
*所有引物都在其5’末端添加有相同的14 bp(AGATCGGAAGAGCA)(SEQ ID NO 165)。
在来自第一份样品(样品122)的血液中以>10-4的频率存在的342种克隆型中,仅有一种在第二个个体(样品140)中检测到。相反,在样品144中以>10-4的频率存在的505种克隆型中,有3种在样品122中检测到。作为针对检测的随机波动的对照,在相同的505种克隆型中,有504种克隆型存在于重复的扩增样品中。这证明了完整的克隆型谱作为可能非常特异性的识别符的潜能。当然,这些谱的性质是它们不总是稳定的,因为新的免疫反应将向该谱中加入新的克隆型。然而,这些过程不会非常迅速地改变这些谱。可以看到,尽管个别克隆型的精确频率会适时转变,但是以可测定频率存在的克隆型组可能远高于在第二个个体中所发现的。可开发算法来定义相同的克隆型的分数和数量,这对于确定两份标本是否来自同一个体是必要的。而且,因为与微卫星多样性相反,这种多样性可见于具有大量活性功能的基因中,所以可能在不需要来自被鉴定的供体样品的匹配样品的情况下提取可能相关的鉴定信息。从克隆型信息可以确定关于该个体的健康、他或她的接种史等的信息。
尽管已经通过数个具体实施方案示例描述了本发明,但本领域技术人员应当认识到,可以在不脱离本发明的精神和范围的情况下对其进行多种改变。除了上面讨论的那些,本发明还适用于多种传感器实施方案及与其他主题。
定义
除非在本文中另外明确定义,本文所使用的核酸化学、生物化学、遗传学和分子生物学的术语和符号都遵循本领域中的标准论文和文章,例如,Kornberg和Baker,DNA Replication,第二版(W.H.Freeman,New York,1992);Lehninger,Biochemistry,第二版(Worth Publishers,New York,1975);Strachan和Read,Human Molecular Genetics,第二版(Wiley-Liss,New York,1999);Abbas等人,Cellular and MolecularImmunology,第六版(Saunders,2007)。
“扩增子”是指多核苷酸扩增反应的产物;即,多核苷酸的克隆群体,其可以是单链或双链的,是从一种或多种起始序列复制的。所述一种或多种起始序列可以是相同序列的一个或多个拷贝,或者它们可以是不同序列的混合物。优选地,通过单一起始序列的扩增形成扩增子。可以通过多种扩增反应(其产物包括一种或多种起始或目标核酸的复制物)产生扩增子。在一个方面,产生扩增子的扩增反应是“模板驱动的”,因为反应物(无论是核苷酸或寡核苷酸)的碱基配对在产生反应产物所需的模板多核苷酸中具有互补物。在一个方面,模板驱动的反应是使用核酸聚合酶的引物延伸或使用核酸连接酶的寡核苷酸连接。此类反应包括但不限于在下列参考文献中公开的聚合酶链反应(PCR)、线性聚合酶反应、基于核酸序列的扩增(NASBA)、滚环扩增等:Mullis等人,美国专利4,683,195;4,965,188;4,683,202;4,800,159(PCR);Gelfand等人,美国专利5,210,015(使用″taqman″探针的实时PCR);Wittwer等人,美国专利6,174,670;Kacian等人,美国专利5,399,491(″NASBA″);Lizardi,美国专利5,854,033;Aono等人,日本专利公开JP4-262799(滚环扩增);等,这些文献通过引用并入本文。在一个方面,通过PCR产生本发明的扩增子。如果可以获得允许随着扩增反应的进行测量反应产物的检测化学,则扩增反应可以是“实时”扩增,例如,下面所述的″实时PCR″或Leone等人,Nucleic Acids Research,26:2150-2155(1998)和类似文献中所述的“实时NASBA”。如本文所用,术语“扩增”是指进行扩增反应。“反应混合物”是指包含进行反应所必需的所有反应物的溶液,其可以包括但不限于,在反应期间将pH维持在选定水平的缓冲剂、盐、辅因子、清除剂等。
如本文所用,“克隆性”是指组库的克隆型之间克隆型丰度的分布偏斜至一个或几个克隆型的程度的度量。大致上,克隆性是克隆型多样性的相反的度量。从描述可用于本发明的克隆性度量的物种-丰度关系的生态学可以获得许多度量或统计学数据,例如Pielou,AnIntroduction to Mathematical Ecology,(Wiley-Interscience,1969)中的第17和18章。在一个方面,本发明使用的克隆性度量是克隆型谱(即,检测到的独特克隆型的数量和它们的丰度)的函数,使得在测定克隆型谱后,可以从它计算克隆性以得到单个数字。一种克隆性度量是Simpson度量,这仅仅是两个随机绘制的克隆型将相同的概率。其他克隆性度量包括在Pielou(上面引用)中公开的基于信息的度量和McIntosh多样性指数。
“克隆型”是指编码T细胞受体(TCR)或B细胞受体(BCR)的T细胞或B细胞的重组核苷酸序列或其部分。在一个方面,个体的淋巴细胞群体的所有独特克隆型的集合是这种群体的组库,例如,Arstila等人,Science,286:958-961(1999);Yassai等人,Immunogenetics,61:493-502(2009);Kedzierska等人,Mol.Immunol.,45(3):607-618(2008);等。如本文所用,“克隆型谱”或“组库谱”是T细胞和/或B细胞的样品(如包含这类细胞的外周血样品)的克隆型的列表,其包括组库的基本上全部的克隆型和它们的相对丰度。“克隆型谱”、“组库谱”和“组库”在本文可以互换使用。(即,下面更充分讨论的术语“组库”是指从淋巴细胞的样品测定的组库)。在本发明的一个方面,克隆型包括免疫球蛋白重链(IgH)或TCRβ链的部分。在本发明的其他方面,克隆型可以基于其他重组分子,如免疫球蛋白轻链或TCRα链或其部分。
“互补决定区”(CDR)是指免疫球蛋白(即,抗体)或T细胞受体的区域,在该区域中该分子与抗原的构象互补,从而决定分子的特异性,并与特定的抗原接触。T细胞受体和免疫球蛋白各自具有三个CDR:CDR1和CDR2见于可变(V)结构域中,CDR3包括V的一部分、全部的差异(D)(仅重链)和连接(J)结构域,以及恒定(C)结构域的一部分。
“内部标准”是指为了允许绝对或相对定量样品中的目标多核苷酸而在同一扩增反应中作为一种或多种目标多核苷酸而扩增的核酸序列。内部标准可以是内源的或外源的。即,内部标准可以自然地存在于样品中,或者可以在扩增前将其加入样品中。在一个方面中,可以将多种外源的内部标准序列以一系列预先确定的浓度加入反应混合物中以提供校准,可以将其与目标扩增子比较以确定样品中其相应的目标多核苷酸的量。外源的内部标准的数量、序列、长度和其他特性的选择对于本领域普通技术人员来说是常规设计选择。优选地,内源的内部标准,在本文中也被称为“参照序列”,是对于样品自然的序列,其对应于表现出恒定的和不依赖于细胞周期的转录水平的被最低调控的基因,例如Selvey等人,Mol.Cell Probes,15:307-311(2001)。参照序列的例子包括但不限于来自以下基因的序列:GAPDH、β2-微球蛋白、18S核糖体RNA和β-肌动蛋白(见Selvey等人,上面引用的)。
“试剂盒”是指用于递送用于进行本发明方法的材料或试剂的任何递送系统。在反应试验的语境中,此类递送系统包括允许将反应试剂(例如,在适当的容器中的引物、酶等)和/或支持材料(例如缓冲液,用于进行测定的书面说明书等)从一个位置到另一个位置储存、转运或递送的系统。例如,试剂盒包括含有相关的反应试剂和/或支持材料的一个或多个容器(例如,盒子)。可以将这些内容物一起或单独地递送至预期的接受者。例如,第一容器可以包含供试验中使用的酶,而第二容器包含引物。
“淋巴肿瘤”是指可能是恶性的或非恶性的淋巴细胞的异常增殖。淋巴癌是一种恶性淋巴肿瘤。淋巴肿瘤是淋巴增生性疾病的结果或与淋巴增生性疾病相关,包括但不限于:滤泡性淋巴瘤、慢性淋巴细胞性白血病(CLL)、急性淋巴细胞性白血病(ALL)、毛细胞白血病、淋巴瘤、多发性骨髓瘤、移植后淋巴增生性疾病、套细胞淋巴瘤(MCL)、弥漫性大B细胞淋巴瘤(DLBCL)、T细胞淋巴瘤等等,例如Jaffe等人,Blood,112:4384-4399(2008);Swerdlow等人,WHO Classification ofTumours of Haematopoietic and Lymphoid Tissues(第4版)(IARC Press,2008)。
“微小残留疾病”是指治疗后剩余的癌细胞。该术语最常与淋巴瘤和白血病的治疗一起使用。
在参照序列和另一种序列(“比较序列”)的比较中使用的“百分比同源”,“百分比相同”或类似术语是指在两种序列之间的最佳比对中,比较序列在等于所示百分比的许多亚单位位置处与参照序列相同,对于多核苷酸比较而言亚单位是核苷酸,或者对于多肽比较而言亚单位是氨基酸。如本文所用,所比较的序列的“最佳比对”是使亚单位间的匹配最大化并且使构建比对中采用的缺口的数量最小化的比对。可以用商业上可获得的算法实现,如Needleman和Wunsch,J.Mol.Biol.,48:443-453(1970)所述的算法(Wisconsin序列分析包的″GAP″程序,Genetics Computer Group,Madison,WI)或类似算法,来确定同一性百分比。本领域中用于构建比对和计算同一性百分比或其他相似性度量的其他软件包包括基于Smith和Waterman,Advances in AppliedMathematics,2:482-489(1981)的算法的″BestFit″程序(Wisconsin序列分析包,Genetics Computer Group,Madison,Wl)。换言之,例如,为了获得具有与参照核苷酸序列至少95%相同的核苷酸序列的多核苷酸,参照序列中最高达5%的核苷酸可以被删除或者被置换为另一种核苷酸,或者可以将最高占参照序列中核苷酸总数的5%的多个核苷酸插入参照序列中。
“聚合酶链反应”或“PCR”是指用于通过DNA互补链的同时引物延伸而体外扩增特定DNA序列的反应。换言之,PCR是用于制备侧翼为引物结合位点的目标核酸的多个拷贝或复制物的反应,这种反应包括以下步骤的一个或多个重复:(□)变性目标核酸,(□)将引物退火至引物结合位点,以及(iii)在核苷三磷酸的存在下,由核酸聚合酶延伸该引物。通常,在热循环仪中通过针对每个步骤优化的不同温度循环该反应。特定温度、每个步骤的持续时间和步骤之间的变化速率取决于本领域普通技术人员公知的许多因素,例如以下参考文献中所例举的:McPherson等人编,PCR:A Practical Approach and PCR2:A PracticalApproach(IRL Press,Oxford,分别为1991年和1995年)。例如,在使用Taq DNA聚合酶的常规PCR中,双链目标核酸可以在>90℃的温度下变性,在50-75℃的温度下引物退火,而在72-78℃的温度下引物延伸。术语“PCR”包括该反应的衍生形式,包括但不限于:RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR等。反应体积范围为几百纳升,如200nL,至几百μL,例如200μL。“逆转录PCR”或“RT-PCR”是指逆转录反应之后的PCR,逆转录反应将目标RNA转化为互补单链DNA,然后将其扩增,例如,Tecott等人,美国专利5,168,038,该专利通过引用并入本文。“实时PCR”是指随着反应的进行监测反应产物即扩增子的量的PCR。实时PCR有许多形式,它们的不同主要在于用于监测反应产物的检测化学,例如Gelfand等人,美国专利5,210,015(″taqman″);Wittwer等人,美国专利6,174,670和6,569,627(嵌入染料);Tyagi等人,美国专利5,925,517(分子信标);上述专利通过引用并入本文。Mackay等人,Nucleic Acids Research,30:1292-1305(2002)(也通过引用并入本文)中综述了用于实时PCR的检测化学。“巢式PCR”是指一种两阶段PCR,其中第一PCR的扩增子变为使用一组新引物的第二PCR的样品,该新引物中的至少一种与第一扩增子的内部位置结合。如本文所用,关于巢式扩增反应的“初级引物”是指用于产生第一扩增子的引物,“次级引物”是指用于产生第二或巢式扩增子的一种或多种引物。“多重PCR”是指在同一反应混合物中同时进行多种目标序列(或单一目标序列和一种或多种参照序列)的PCR,例如Bernard等人,Anal.Biochem.,273:221-228(1999)(双色实时PCR)。通常,对于每个被扩增的序列采用不同的引物组。通常,在多重PCR中目标序列的数量为2-50,或2-40,或2-30个。“定量PCR”是指为测量样品或标本中一种或多种特定目标序列的丰度而设计的PCR。定量PCR包括此类目标序列的绝对定量和相对定量。使用可以与目标序列分开或一起测定的一种或多种参照序列或内部标准进行定量测量。参照序列对于样品或标本来说可以是内源的或外源的,而在后一种情况下,可以包含一种或多种竞争剂模板。典型的内源性参照序列包括以下基因的转录本区段:β-肌动蛋白、GAPDH、β2-微球蛋白、核糖体RNA等。用于定量PCR的技术是本领域普通技术人员公知的,如通过引用并入本文的下列参考文献所例举的:Freeman等人,Biotechniques,26:112-126(1999);Becker-Andre等人,Nucleic Acids Research,17:9437-9447(1989);Zimmerman等人,Biotechniques,21:268-279(1996);Diviacco等人,Gene,122:3013-3020(1992);Becker-Andre等人,Nucleic Acids Research,17:9437-9446(1989);等等。
“引物”是指与多核苷酸模板形成双链体时,能够作为核酸合成起始点起作用,并且沿模板从其3′末端延伸,从而形成延伸的双链体的天然的或合成的寡核苷酸。通常使用核酸聚合酶如DNA或RNA聚合酶进行引物的延伸。延伸过程中添加的核苷酸的序列取决于模板多核苷酸的序列。通常通过DNA聚合酶延伸引物。引物通常具有14-40个核苷酸或18-36个核苷酸的长度。引物用于许多核酸扩增反应,例如,使用单一引物的线性扩增反应,或采用两种或更多种引物的聚合酶链反应。关于针对特定应用选择引物的长度和序列的指导是本领域普通技术人员公知的,如通过引用并入本文的下列参考文献所证明的:Dieffenbach编,PCR Primer:A Laboratory Manual,第二版(Cold SpringHarbor Press,New York,2003)。
“质量评分”是指在特定序列位置的碱基指定是正确的概率的度量。针对特定情况,例如,针对由于不同的测序化学、检测系统、碱基判定算法等而判定的碱基来计算质量评分的多种方法是本领域普通技术人员公知的。通常,质量评分值与正确碱基判定的概率单调相关。例如,质量评分或Q为10可能意味着碱基被正确判定的机会为90%,Q为20可能意味着碱基被正确判定的机会为99%,等等。对于一些测序平台,尤其是使用合成测序化学的平台,平均质量评分作为序列阅读长度的函数而降低,使得在序列阅读开始时的质量评分高于在序列阅读结束时的质量评分,这种下降是由于诸如不完全延伸、正向延伸、模板损失、聚合酶损失、加帽失败、脱保护失败等现象。
“组库”,或“免疫组库”,是指在个体的淋巴细胞群体中分别编码T细胞受体(TCR)或B细胞受体(BCR)或其片段的一组独特的重组核苷酸序列,其中对于该群体的基本上所有淋巴细胞,该组的核苷酸序列与独特的淋巴细胞或它们的克隆亚群具有一一对应关系。在一个方面,从一种或多种组织样品如一种或多种血液样品中采集用来确定组库的淋巴细胞群体。组库的成员核苷酸序列在本文中被称为“克隆型”。在一个方面,组库的克隆型包括在TCR或BCR发育期间经历体细胞重组的T细胞或B细胞群体所共有的任何核酸区段,包括其正常或异常的(例如,与癌症相关的)前体分子,包括但不限于以下任何一种:免疫球蛋白重链(IgH)或其亚组(例如,IgH可变区、CDR3区,等等)、不完整的IgH分子、免疫球蛋白轻链或其亚组(例如,可变区、CDR区,等等)、T细胞受体α链或其亚组、T细胞受体β链或其亚组(例如,可变区、CDR3、V(D)J区,等等)、CDR(包括TCR或BCR中任一种的CDR1、CDR2和CDR3,或这些CDR的组合)、TCR或BCR中任一种的V(D)J区、IgH可变区的超突变区域,等等。在一个方面,选择定义组库的克隆型的核酸区段,使得它们的多样性(即,在该组中独特的核酸序列的数量)足够大,以便个体中基本上每个T细胞或B细胞或其克隆都携带该组库的独特的核酸序列。即,根据本发明,使用者可以选择编码TCR或BCR的重组核酸的特定区段或区域用于定义克隆型,所述特定区段或区域不反映T细胞或B细胞群体的完全多样性;然而,优选地定义克隆型使得它们反映衍生它们的T细胞和/或B细胞群体的多样性。即,优选地样品的每个不同的克隆具有不同的克隆型。(当然,在一些应用中,在一个克隆型谱中将有一种或多种特定克隆型的多个拷贝,如在来自白血病或淋巴瘤患者的样品的情况下)。在本发明的其他方面,对应于组库的淋巴细胞群体可以是循环B细胞,或者可以是循环T细胞,或者可以是上述群体中任一种的亚群,包括但不限于CD4+T细胞,或CD8+T细胞,或由细胞表面标记物定义的其他亚群,等等。可以通过从特定组织例如骨髓或淋巴结等中采集样品,或者通过基于一种或多种细胞表面标记物、大小、形态等从样品(如外周血)中分选或富集细胞,来获得这样的亚群。在另外其他方面,可以从疾病组织如肿瘤组织、被感染的组织等衍生对应于组库的淋巴细胞群体。在一个实施方案中,包含人TCR β链或其片段的组库包含范围为0.1x 106-1.8x 106或0.5x106-1.5x 106或0.8x 106-1.2x 106的许多独特的核苷酸序列。在一个实施方案中,包含人IgH链或其片段的组库包含范围为0.1x 106-1.8x 106或0.5x 106-1.5x 106或0.8x 106-1.2x 106的许多独特的核苷酸序列。在一个特定实施方案中,本发明的组库包含一组编码IgH链的V(D)J区的基本上所有区段的核苷酸序列。在一个方面,如本文所用的“基本上所有”是指每个区段具有0.001%或更高的相对丰度;或在另一个方面,如本文所用的“基本上所有”是指每个区段具有0.0001%或更高的相对丰度。在另一个特定实施方案中,本发明的组库包含一组编码TCRβ链的V(D)J区的基本上所有区段的核苷酸序列。在另一个实施方案中,本发明的组库包含一组具有25-200个核苷酸的长度并且包括TCRβ链的V、D和J区的区段的核苷酸序列。在另一个实施方案中,本发明的组库包含一组具有25-200个核苷酸的长度并且包括IgH链的V、D和J区的区段的核苷酸序列。在另一个实施方案中,本发明的组库包含基本上等于表达独特IgH链的淋巴细胞数量的许多独特的核苷酸序列。在另一个实施方案中,本发明的组库包含基本上等于表达独特TCRβ链的淋巴细胞数量的许多独特的核苷酸序列。在又一个实施方案中,“基本上等于”是指核苷酸序列的组库有99%的概率将包括编码IgH或TCRβ或其部分的核苷酸序列,所述核苷酸序列由个体的一群淋巴细胞中的每个淋巴细胞以0.001%或更高频率所携带或表达。在又一个实施方案中,“基本上等于”是指核苷酸序列的组库有99%的概率将包括编码IgH或TCRβ或其部分的核苷酸序列,所述核苷酸序列由每个淋巴细胞以0.0001%或更高的频率所携带或表达。上述两句中所述的克隆型组在本文中有时被称为代表IgH和/或TCRβ序列的“完全组库”。正如上面提到的,当测定或产生克隆型谱(或组库谱)时,获得足够大的淋巴细胞样品,使得这种克隆型谱为特定应用提供组库的合理地准确的代表。在一个方面,采用包含105-107个淋巴细胞的样品,尤其是当从1-10mL的外周血样品获得时。
“序列标签”(或“标签”)是指与多核苷酸或模板连接并用于在反应中鉴定和/或追踪该多核苷酸或模板的寡核苷酸。寡核苷酸标签可以附着于多核苷酸或模板的3′-或5′-末端,或者它可以插入该多核苷酸模板的内部以形成线性偶联物,该线性偶联物在本文中有时被称为“标记的多核苷酸”或“标记的模板”或“标签-多核苷酸偶联体”,等等。寡核苷酸标签的大小和组成可能变化很大;下列参考文献为选择适用于特定实施方案的寡核苷酸标签组提供了指导:Brenner,美国专利5,635,400;Brenner等人,Proc.Natl.Acad.Sci.,97:1665-1670(2000);Church等人,欧洲专利公开0303459;Shoemaker等人,Nature Genetics,14:450-456(1996);Morris等人,欧洲专利公开0799897A1;Wallace,美国专利5,981,179;等等。寡核苷酸标签的长度和组成可能变化很大,具体长度和/或组成的选择取决于数种因素,包括但不限于:如何使用标签产生读出,例如通过杂交反应或通过酶反应,如测序;它们是否被标记,例如,用荧光染料或类似物标记;明确地鉴定一组多核苷酸等所需要的可区分的寡核苷酸标签的数量;以及为了确保可靠的鉴定,例如,无交叉杂交或测序错误产生的错误鉴定,一组标签必须如何不同。在一个方面,寡核苷酸标签可以各自具有分别为2-36个核苷酸,或4-30个核苷酸,或8-20个核苷酸,或6-10个核苷酸的长度。在一个方面,使用标签组,其中一个组的每个寡核苷酸标签具有独特的核苷酸序列,该核苷酸序列与同一组的每个其他标签的核苷酸序列有至少两个碱基不同;在另一方面,使用标签组,其中一个组的每个标签的序列与同一组的每个其他标签的序列有至少三个碱基不同。
Figure IDA00002699449800011
Figure IDA00002699449800021
Figure IDA00002699449800031
Figure IDA00002699449800051
Figure IDA00002699449800061
Figure IDA00002699449800071
Figure IDA00002699449800081
Figure IDA00002699449800101
Figure IDA00002699449800111
Figure IDA00002699449800121
Figure IDA00002699449800131
Figure IDA00002699449800141
Figure IDA00002699449800161
Figure IDA00002699449800171
Figure IDA00002699449800181
Figure IDA00002699449800191
Figure IDA00002699449800201
Figure IDA00002699449800211
Figure IDA00002699449800221
Figure IDA00002699449800231
Figure IDA00002699449800241
Figure IDA00002699449800251
Figure IDA00002699449800261
Figure IDA00002699449800271
Figure IDA00002699449800291
Figure IDA00002699449800301
Figure IDA00002699449800311
Figure IDA00002699449800321
Figure IDA00002699449800331
Figure IDA00002699449800341
Figure IDA00002699449800351
Figure IDA00002699449800361

Claims (61)

1.一种监测患者中的疾病的方法,所述方法包括以下步骤:
(a)通过从疾病相关组织中的淋巴细胞样品确定克隆型谱来鉴定一种或多种与疾病相关的患者特异性克隆型,所述淋巴细胞样品包含来自所述疾病相关组织的克隆型的组库;和
(b)从外周血细胞样品确定克隆型谱来鉴定一种或多种与疾病相关的患者特异性克隆型的存在、不存在和/或水平,该外周血细胞样品包含克隆型的组库。
2.权利要求1的方法,进一步包括重复所述步骤(b)以监测患者中的疾病或病状的步骤。
3.权利要求1的方法,其中所述鉴定步骤进一步包括从同一患者中的非疾病相关组织中的淋巴细胞样品确定克隆型谱,并将该克隆型谱与来自所述疾病相关组织的克隆型谱进行比较,以鉴定所述一种或多种患者特异性克隆型。
4.权利要求3的方法,其中所述疾病相关组织是来自所述疾病的高峰状态的组织,并且其中所述非疾病相关组织是来自所述疾病的非高峰状态的组织。
5.权利要求4的方法,其中所述疾病是自身免疫性疾病。
6.权利要求5的方法,其中所述自身免疫性疾病是系统性红斑狼疮,所述疾病相关组织是肾、皮肤、外周血或骨髓;所述自身免疫性疾病是多发性硬化症,所述疾病相关组织是脑脊液;或者所述自身免疫性疾病是类风湿关节炎,所述疾病相关组织是滑液。
7.权利要求5的方法,进一步包括重复所述步骤(b)以监测患者中的疾病或病状的步骤。
8.权利要求1的方法,其中所述疾病是淋巴瘤,所述疾病相关组织是骨髓或淋巴组织;或者所述疾病是白血病,所述疾病相关组织是骨髓或外周血。
9.权利要求8的方法,进一步包括重复所述步骤(b)以监测患者中的疾病或病状的步骤。
10.权利要求8的方法,其中所述鉴定步骤进一步包括从同一患者中非疾病相关组织中的淋巴细胞样品确定克隆型谱,并将该克隆型谱与来自所述疾病相关组织的克隆型谱进行比较,以鉴定所述一种或多种患者特异性克隆型。
11.权利要求1的方法,其中所述鉴定步骤进一步包括从同一患者中非疾病相关组织中的淋巴细胞样品确定克隆型谱,并将该克隆型谱与来自所述疾病相关组织的克隆型谱进行比较,以鉴定所述一种或多种患者特异性克隆型。
12.权利要求11的方法,进一步包括重复所述步骤(b)以监测患者中的疾病或病状的步骤。
13.权利要求11的方法,其中根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的频率;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同程度的基于IgH的克隆型中的体细胞超突变;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的V区和J区使用频率;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同平均长度的NDN区;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的BCR和/或TCR表达水平;或者根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同数量的编码相同或相似蛋白质的克隆型,来鉴定所述一种或多种患者特异性克隆型。
14.权利要求13的方法,进一步包括重复所述步骤(b)以监测患者中的疾病或病症的步骤。
15.权利要求13的方法,其中根据在所述疾病相关组织中比在所述非疾病相关组织中具有更高的频率来鉴定所述一种或多种患者特异性克隆型。
16.权利要求13的方法,其中根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的V区和J区使用频率来鉴定所述一种或多种患者特异性克隆型。
17.权利要求13的方法,其中根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同平均长度的NDN区来鉴定所述一种或多种患者特异性克隆型。
18.权利要求13的方法,其中根据在所述疾病相关组织中与在所述非疾病相关组织中具有不同的BCR和/或TCR表达水平来鉴定所述一种或多种患者特异性克隆型。
19.权利要求1的方法,其中通过将确定的克隆型与已知与所述疾病相关的克隆型进行匹配,或者通过将V区和J区使用与已知与所述疾病相关的V区和J区使用的频率进行匹配,来鉴定所述一种或多种患者特异性克隆型。
20.权利要求19的方法,其中所述匹配包括发现由所述确定的克隆型所编码的氨基酸序列与由已知与所述疾病相关的克隆型或其基本上相同的变体所编码的氨基酸序列之间的同一性。
21.权利要求19的方法,其中所述匹配包括发现所述确定的克隆型与已知与所述疾病相关的克隆型或其基本上相同的变体的核酸序列之间的同一性。
22.权利要求19的方法,其中所述匹配包括发现所述确定的克隆型与已知与所述疾病相关的克隆型或其基本上相同的变体的核酸序列之间的同一性。
23.权利要求1的方法,其中所述组库中的每一个有99%的概率包括以0.01%或更高的频率存在的每种克隆型。
24.权利要求1的方法,其中所述组库中的每一个包括至少含104个克隆型的样品。
25.权利要求1的方法,其中所述组库中的每一个包括至少含105个克隆型的样品。
26.权利要求1的方法,其中所述疾病选自淋巴增生性疾病、实体瘤、感染性疾病和自身免疫性疾病。
27.权利要求26的方法,其中所述从所述血细胞样品确定所述组库的步骤进一步包括包含任何以前未记录的所述一种或多种患者特异性克隆型的系统发生克隆型作为所述一种或多种患者特异性克隆型。
28.权利要求26的方法,其中所述系统发生克隆型包括与所述一种或多种患者特异性克隆型中的任一种90%相同的以前未记录的克隆型。
29.权利要求26的方法,其中所述系统发生克隆型包括通过体细胞超突变与所述一种或多种患者特异性克隆型相关的以前未记录的克隆型。
30.权利要求26的方法,其中所述疾病是淋巴增生性疾病,并且其中所述系统发生克隆型包括通过体细胞重排与所述一种或多种患者特异性克隆型相关的以前未记录的克隆型。
31.权利要求30的方法,其中所述体细胞重排包括VH替代。
32.权利要求30的方法,其中所述体细胞重排包括与所述一种或多种患者特异性克隆型中的任一种具有相同突变的V区和J区但是与该患者特异性克隆型具有不同的NDN区的克隆型。
33.权利要求27的方法,其中所述鉴定步骤进一步包括从同一患者中非疾病相关组织中的淋巴细胞样品确定克隆型谱,并将该克隆型谱与来自所述疾病相关组织的克隆型谱进行比较,以鉴定所述一种或多种患者特异性克隆型。
34.权利要求27的方法,其中所述疾病是淋巴瘤或白血病,并且其中所述确定的步骤(b)进一步包括从来自所述外周血的所述样品的所述克隆型计算克隆性的度量。
35.一种监测患者中的疾病的方法,所述方法包括以下步骤:
(a)将来自患有疾病的个体的淋巴细胞样品的克隆型谱与来自同一个体的、基于与该疾病相关的细胞表面标记物富集的淋巴细胞样品的克隆型谱进行比较,以鉴定一种或多种与该疾病相关的患者特异性克隆型;和
(b)确定来自外周血细胞样品的克隆型谱中一种或多种患者特异性克隆型的每一种的水平,该样品包含其克隆型的组库。
36.权利要求35的方法,其中所述从所述血细胞样品确定所述组库的步骤包括将任何以前未记录的所述一种或多种患者特异性克隆型的系统发生克隆型作为所述一种或多种患者特异性克隆型。
37.权利要求35的方法,其中所述疾病是淋巴增生性疾病。
38.权利要求35的方法,其中所述方法进一步包括重复所述步骤(b)以监测所述疾病或病状的步骤,并且其中所述组库中的每一个有99%的概率包括以0.01%或更高的频率存在的每种克隆型。
39.权利要求35的方法,其中所述方法进一步包括重复所述步骤(b)以监测所述疾病或病状的步骤,并且其中所述组库中的每一个包括至少含104个克隆型的样品。
40.权利要求35的方法,其中所述疾病是自身免疫性疾病。
41.权利要求40的方法,其中所述从所述血细胞样品确定所述组库的步骤包括将任何以前未记录的所述一种或多种患者特异性克隆型的系统发生克隆型作为所述一种或多种患者特异性克隆型。
42.权利要求40的方法,其中所述方法进一步包括重复所述步骤(b)以监测所述疾病或病状的步骤,并且其中所述组库中的每一个有99%的概率包括以0.01%或更高的频率存在的每种克隆型。
43.权利要求40的方法,其中所述方法进一步包括重复所述步骤(b)以监测所述疾病或病状的步骤,并且其中所述组库中的每一个包括至少含104个克隆型的样品。
44.权利要求40的方法,其中所述自身免疫性疾病是系统性红斑狼疮。
45.一种同时测定样品中的淋巴细胞数量和克隆型表达水平的方法,所述方法包括以下步骤:
从个体获得包含T细胞和/或B细胞的样品;
对源自所述细胞的基因组DNA的在空间分离的个体分子进行测序,该空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型;
对源自所述细胞的RNA的空间分离的个体分子进行测序,该空间分离的个体分子包含与它们在样品的淋巴细胞中的表达水平相对应的许多克隆型;和
对于每种克隆型,通过将从源自所述细胞基因组DNA的分离的个体分子确定的数量与从源自所述细胞RNA的分离的个体分子确定的数量进行比较,来确定所述样品的淋巴细胞中的克隆型表达水平。
46.权利要求45的方法,其中所述确定步骤进一步包括通过将已知量的内部标准加至所述基因组DNA来确定所述样品中的所述淋巴细胞的数量。
47.权利要求45的方法,其中所述样品是具有确定体积的外周血样品,并且其中所述确定步骤包括确定所述样品中所述淋巴细胞的浓度。
48.权利要求45的方法,其中所述确定所述表达水平的步骤包括对于每个所述克隆型,将从源自所述RNA的所述分离的个体分子确定的所述克隆型数量除以从源自所述基因组DNA的所述分离的个体分子确定的所述克隆型数量。
49.权利要求45的方法,其中所述对源自所述RNA的所述空间分离的个体分子进行测序的步骤包括用指示其RNA来源的第一标记物标记每种所述空间分离的个体分子,并且其中所述对源自所述基因组DNA的所述空间分离的个体分子进行测序的步骤包括用指示其基因组DNA来源的第二标记物标记所述空间分离的个体分子,使得第一标记物与第二标记物可区别开。
50.权利要求45的方法,其中所述样品包含与所述数量的所述淋巴细胞相对应的所述数量的所述克隆型的组库,所述淋巴细胞包含克隆型的组库。
51.权利要求50的方法,其中所述样品包含B细胞。
52.权利要求50的方法,其中所述样品包含T细胞。
53.一种同时测定样品中的淋巴细胞数量和淋巴细胞克隆性的方法,所述方法包括以下步骤:
从个体获得包含T细胞和/或B细胞的样品;
对源自所述细胞的核酸的空间分离的个体分子进行测序,该空间分离的个体分子包含与样品中的许多淋巴细胞相对应的许多克隆型;
从空间分离的个体分子的数量确定淋巴细胞的数量;
确定所述空间分离的个体分子的不同序列的丰度,以基于其产生克隆型谱和克隆性的度量。
54.权利要求53的方法,其中所述确定所述数量的步骤进一步包括通过将已知量的内部标准加至所述基因组DNA来确定所述样品中的所述淋巴细胞的数量。
55.权利要求54的方法,其中所述样品是具有确定体积的外周血样品,并且其中所述确定所述数量的步骤包括确定所述样品中的所述淋巴细胞的浓度。
56.权利要求53的方法,其中所述样品包含与所述淋巴细胞的所述数量相对应的所述克隆型的所述数量的组库,所述淋巴细胞包含克隆型的组库。
57.权利要求56的方法,其中所述样品包含B细胞。
58.权利要求56的方法,其中所述样品包含T细胞。
59.权利要求53的方法,其中所述疾病是淋巴瘤,而所述疾病相关组织是骨髓或淋巴组织;或者其中所述疾病是白血病,而所述疾病相关组织是骨髓或外周血。
60.一种监测个体对疫苗接种的响应性的方法,所述方法包括以下步骤:
在接种疫苗后从个体的外周血富集淋巴细胞样品,以获得疫苗响应性淋巴细胞的样品;
从疫苗响应性淋巴细胞的样品确定克隆型谱,以鉴定与疫苗响应相关的一种或多种患者特异性克隆型;
从在一个或多个后续时间获得的外周血细胞样品确定克隆型谱中一种或多种患者特异性克隆型的各自的水平,以监测个体对疫苗接种的响应性。
61.一种监测患者中的淋巴增生性疾病的方法,所述方法包括以下步骤:
(a)通过从骨髓样品确定淋巴细胞的克隆型谱来鉴定一种或多种与淋巴增生性疾病相关的患者特异性克隆型,所述样品包含克隆型的组库;和
(b)在后续时间从骨髓或外周血细胞样品确定克隆型谱,以鉴定一种或多种与该疾病相关的患者特异性克隆型的存在、不存在和/或水平,这种后来的骨髓样品或外周血样品包括克隆型的组库。
CN201180033142.2A 2010-05-06 2011-05-04 利用克隆型谱监测健康和疾病状态 Active CN103097888B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US33217510P 2010-05-06 2010-05-06
US61/332,175 2010-05-06
US45574310P 2010-10-25 2010-10-25
US61/455,743 2010-10-25
US201161446822P 2011-02-25 2011-02-25
US61/446,822 2011-02-25
PCT/US2011/000791 WO2011139371A1 (en) 2010-05-06 2011-05-04 Monitoring health and disease status using clonotype profiles

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510054401.XA Division CN104673899A (zh) 2010-05-06 2011-05-04 利用克隆型谱监测健康和疾病状态

Publications (2)

Publication Number Publication Date
CN103097888A true CN103097888A (zh) 2013-05-08
CN103097888B CN103097888B (zh) 2016-03-09

Family

ID=44903937

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201510054401.XA Pending CN104673899A (zh) 2010-05-06 2011-05-04 利用克隆型谱监测健康和疾病状态
CN201180033142.2A Active CN103097888B (zh) 2010-05-06 2011-05-04 利用克隆型谱监测健康和疾病状态

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201510054401.XA Pending CN104673899A (zh) 2010-05-06 2011-05-04 利用克隆型谱监测健康和疾病状态

Country Status (9)

Country Link
EP (4) EP3144673B1 (zh)
JP (4) JP6085249B2 (zh)
CN (2) CN104673899A (zh)
AU (1) AU2011249041B2 (zh)
CA (1) CA2798431C (zh)
DK (2) DK2567226T3 (zh)
ES (2) ES2740802T3 (zh)
SG (2) SG10201503534RA (zh)
WO (2) WO2011139371A1 (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105452483A (zh) * 2013-03-15 2016-03-30 适应生物技术公司 复杂基因集合中的独特标记的重排适应性免疫受体基因
CN106103711A (zh) * 2013-11-21 2016-11-09 组库创世纪株式会社 T细胞受体和b细胞受体库分析系统及其在治疗和诊断中的应用
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
US10077478B2 (en) 2012-03-05 2018-09-18 Adaptive Biotechnologies Corp. Determining paired immune receptor chains from frequency matched subunits
US10077473B2 (en) 2013-07-01 2018-09-18 Adaptive Biotechnologies Corp. Method for genotyping clonotype profiles using sequence tags
US10150996B2 (en) 2012-10-19 2018-12-11 Adaptive Biotechnologies Corp. Quantification of adaptive immune cell genomes in a complex mixture of cells
US10214770B2 (en) 2012-05-08 2019-02-26 Adaptive Biotechnologies Corp. Compositions and method for measuring and calibrating amplification bias in multiplexed PCR reactions
US10221461B2 (en) 2012-10-01 2019-03-05 Adaptive Biotechnologies Corp. Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
US10323276B2 (en) 2009-01-15 2019-06-18 Adaptive Biotechnologies Corporation Adaptive immunity profiling and methods for generation of monoclonal antibodies
US10392663B2 (en) 2014-10-29 2019-08-27 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from a large number of samples
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
CN110462065A (zh) * 2016-11-02 2019-11-15 Ucl商业有限公司 检测肿瘤复发的方法
CN111808195A (zh) * 2020-06-30 2020-10-23 中国科学院心理研究所 抗n-甲基-d-天冬氨酸受体脑炎的b细胞抗体基因获取方法及其免疫组库研究
CN112292600A (zh) * 2018-06-15 2021-01-29 豪夫迈·罗氏有限公司 用于鉴定被表达在肿瘤浸润性淋巴细胞上的t细胞受体识别的抗原的系统
US11041202B2 (en) 2015-04-01 2021-06-22 Adaptive Biotechnologies Corporation Method of identifying human compatible T cell receptors specific for an antigenic target
US11047008B2 (en) 2015-02-24 2021-06-29 Adaptive Biotechnologies Corporation Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
US11066705B2 (en) 2014-11-25 2021-07-20 Adaptive Biotechnologies Corporation Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US8691510B2 (en) 2008-11-07 2014-04-08 Sequenta, Inc. Sequence analysis of complex amplicons
US9394567B2 (en) 2008-11-07 2016-07-19 Adaptive Biotechnologies Corporation Detection and quantification of sample contamination in immune repertoire analysis
GB2497007B (en) 2008-11-07 2013-08-07 Sequenta Inc Methods of monitoring disease conditions by analysis of the full repertoire of the V-D junction or D-J junction sequences of an individual
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US20100330571A1 (en) 2009-06-25 2010-12-30 Robins Harlan S Method of measuring adaptive immunity
US9043160B1 (en) 2009-11-09 2015-05-26 Sequenta, Inc. Method of determining clonotypes and clonotype profiles
WO2012083225A2 (en) 2010-12-16 2012-06-21 Gigagen, Inc. System and methods for massively parallel analysis of nycleic acids in single cells
KR20140024270A (ko) 2010-12-30 2014-02-28 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
JP2014503223A (ja) * 2011-01-14 2014-02-13 シービー バイオテクノロジーズ インコーポレイテッド 免疫多様性の評価方法およびその使用
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
CA2853088C (en) 2011-10-21 2018-03-13 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
EP3388535B1 (en) * 2011-12-09 2021-03-24 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
JP2015504661A (ja) * 2011-12-20 2015-02-16 シーケンタ インコーポレイテッド 免疫レパートリー解析による、濾胞性リンパ腫からびまん性大細胞型b細胞リンパ腫への形質転換のモニタリング
CA2869481A1 (en) * 2012-04-13 2013-10-17 Sequenta, Inc. Detection and quantitation of sample contamination in immune repertoire analysis
US20150247201A1 (en) * 2012-05-31 2015-09-03 Malek Faham Predicting relapse of chronic lymphocytic leukemia patients treated by allogeneic stem cell transplantation
JP2015519909A (ja) * 2012-06-15 2015-07-16 アダプティブ バイオテクノロジーズ コーポレイション 複合遺伝子セットにおける固有にタグ付加された再構成適応性免疫受容体遺伝子
JP2015524282A (ja) * 2012-08-10 2015-08-24 シーケンタ インコーポレイテッド 配列タグを用いた高感度突然変異検出
JP2015535178A (ja) * 2012-10-19 2015-12-10 シーケンタ・インコーポレイテッド 末梢血における形質細胞増殖障害のクロノタイプのモニタリング
JP2015532123A (ja) * 2012-10-22 2015-11-09 シーケンタ・インコーポレイテッド 免疫移植後の末梢血におけるマントル細胞リンパ腫のクローン型のモニタリング
PT2954070T (pt) * 2013-02-11 2020-06-22 Irepertoire Inc Método para avaliar um imunorrepertório
EP2959020B1 (en) * 2013-02-22 2019-09-18 Adaptive Biotechnologies Corporation Method to select rare clonotypes
GB2584364A (en) 2013-03-15 2020-12-02 Abvitro Llc Single cell bar-coding for antibody discovery
AU2015227054A1 (en) 2014-03-05 2016-09-22 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10202640B2 (en) 2014-05-07 2019-02-12 The Board Of Trustees Of The Leland Stanford Junior University Single cell analysis of T cells using high-throughput multiplex amplification and deep sequencing
EP3536786B1 (en) 2014-09-15 2021-06-30 AbVitro LLC High-throughput nucleotide library sequencing
US11959141B2 (en) 2014-12-05 2024-04-16 Foundation Medicine, Inc. Multigene analysis of tumor samples
US9422547B1 (en) 2015-06-09 2016-08-23 Gigagen, Inc. Recombinant fusion proteins and libraries from immune cell repertoires
CN106557536B (zh) * 2015-09-30 2021-12-21 松下知识产权经营株式会社 控制方法
US10130658B2 (en) * 2015-12-18 2018-11-20 Provectus Pharmatech, Inc. Method of ex vivo enhancement of immune cell activity for cancer immunotherapy with a small molecule ablative compound
CN107955831A (zh) * 2016-10-13 2018-04-24 深圳华大基因研究院 用于淋巴细胞定量检测的标记物和淋巴细胞定量检测方法
CA3040924A1 (en) * 2016-12-09 2018-06-14 Regeneron Pharmaceuticals, Inc. Systems and methods for sequencing t cell receptors and uses thereof
RU2674994C2 (ru) * 2016-12-29 2018-12-14 Федеральное государственное бюджетное учреждение науки институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук (ИБХ РАН) Способ определения маркеров наличия опухолевых т-лимфобластов
EP3676399B1 (en) 2017-09-01 2022-05-11 Life Technologies Corporation Compositions and methods for immune repertoire sequencing
CN111479830A (zh) * 2017-10-10 2020-07-31 国立大学法人广岛大学 使用铂talen的t细胞受体的完全取代技术
US11773152B2 (en) 2017-10-10 2023-10-03 Hiroshima University Technique for creating antigen-specific regulatory T cells (Treg) in which effector T cell (Teff) antigen receptors are used
WO2019196088A1 (en) * 2018-04-13 2019-10-17 Syz Cell Therapy Co. Methods of obtaining tumor-specific t cell receptors
CN109002689B (zh) * 2018-07-23 2020-10-09 西安交通大学医学院第一附属医院 T细胞数据处理方法及装置
WO2020102721A1 (en) * 2018-11-16 2020-05-22 Rapa Therapeutics, Llc Immune monitoring of neuro-inflammatory amyotrophic lateral sclerosis (als)
WO2020191365A1 (en) 2019-03-21 2020-09-24 Gigamune, Inc. Engineered cells expressing anti-viral t cell receptors and methods of use thereof
CN110988364A (zh) * 2019-12-31 2020-04-10 天津美瑞特医疗科技有限公司 一种应用流式细胞术检测移植后gvhd相关细胞因子的方法及检测试剂盒
CN111524548B (zh) * 2020-07-03 2020-10-23 至本医疗科技(上海)有限公司 用于检测igh重排的方法、计算设备和计算机存储介质
CA3214486A1 (en) 2021-03-24 2022-09-29 Genentech, Inc. Efficient tcr gene editing in t lymphocytes
CN113637741B (zh) * 2021-09-29 2023-12-01 成都二十三魔方生物科技有限公司 一种早发性白发遗传风险基因检测试剂盒、以及一种早发性白发遗传风险评估系统和方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6416948B1 (en) * 1996-06-03 2002-07-09 The Governors Of The University Of Alberta Methods for detection of rearranged DNA
CN1965089A (zh) * 2002-10-11 2007-05-16 鹿特丹伊拉兹马斯大学 用于基于pcr的克隆系研究的核酸扩增引物
US20070117134A1 (en) * 2005-11-18 2007-05-24 Kou Zhong C Method for detection and quantification of T-cell receptor Vbeta repertoire
CN101225441A (zh) * 2007-12-05 2008-07-23 浙江大学 一种检测克隆特异性t淋巴细胞tcr bv cdr3基因组成的方法

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4942124A (en) 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
US5168038A (en) 1988-06-17 1992-12-01 The Board Of Trustees Of The Leland Stanford Junior University In situ transcription in cells and tissues
US5296351A (en) 1988-10-20 1994-03-22 Alexander A. Morley Method for diagnosis of monoclonality in leukaemia and lymphoma
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
JP3080178B2 (ja) 1991-02-18 2000-08-21 東洋紡績株式会社 核酸配列の増幅方法およびそのための試薬キット
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5837447A (en) 1992-04-15 1998-11-17 Blood Center Research Foundation, Inc., The Monitoring an immune response by analysis of amplified immunoglobulin or T-cell-receptor nucleic acid
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
US6090592A (en) 1994-08-03 2000-07-18 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid on supports
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5635363A (en) 1995-02-28 1997-06-03 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for the detection, quantitation and purification of antigen-specific T cells
US6087096A (en) 1995-11-13 2000-07-11 Dau; Peter C. Method of intrafamily fragment analysis of the T cell receptor α and β chain CDR3 regions
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
KR19990087749A (ko) * 1996-03-13 1999-12-27 시오노 요시히코 류마티스성 관절염에 특이적인 인간 티 세포 클론
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
EP1179600B1 (en) 1996-06-04 2005-05-11 University Of Utah Research Foundation Monitoring hybridization during PCR
US5846928A (en) 1996-08-01 1998-12-08 Pasken Products Co., Ltd. Method for treating cancer patients
WO1998010284A1 (en) 1996-09-06 1998-03-12 Ortho Pharmaceutical Corporation Purification of antigen-specific t cells
GB9626815D0 (en) * 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
EP3034626A1 (en) 1997-04-01 2016-06-22 Illumina Cambridge Limited Method of nucleic acid sequencing
US6008002A (en) 1997-09-29 1999-12-28 Bodey; Bela Immunomagnetic detection and isolation of cancer cells
AU760560B2 (en) 1998-02-12 2003-05-15 Board Of Regents, The University Of Texas System Methods and reagents for the rapid and efficient isolation of circulating cancer cells
DE19833738A1 (de) 1998-07-27 2000-02-03 Michael Giesing Verfahren zur Isolierung von Krebszellen aus zellhaltigen Körperflüssigkeiten sowie Sets zur Durchführung dieses Verfahrens
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
EP1227321A1 (en) 2000-12-28 2002-07-31 Institut für Bioanalytik GmbH Reversible MHC multimer staining for functional purification of antigen-specific T cells
GB0128153D0 (en) 2001-11-23 2002-01-16 Bayer Ag Profiling of the immune gene repertoire
AU2004254552B2 (en) 2003-01-29 2008-04-24 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
AU2003902299A0 (en) 2003-05-13 2003-05-29 Flinders Medical Centre A method of analysing a marker nucleic acid molecule
EP1544308B1 (en) 2003-12-15 2009-01-28 Institut Pasteur Repertoire determination of a lymphocyte B population
CA2576702C (en) 2004-08-11 2016-10-04 Albert Einstein College Of Medicine Of Yeshiva University Isolation, gene expression, and chemotherapeutic resistance of motile cancer cells
US8426146B2 (en) * 2005-06-03 2013-04-23 University of Pittsburgh—of the Commonwealth System of Higher Education Multiparameteric method for assessing immune system status
US7993821B2 (en) 2005-08-11 2011-08-09 University Of Washington Methods and apparatus for the isolation and enrichment of circulating tumor cells
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
US11051733B2 (en) 2008-01-18 2021-07-06 Wake Forest University Health Sciences Isolating and purifying cells for therapy
EP2088205A1 (en) * 2008-02-11 2009-08-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) PSMB10: A diagnosis marker and therapeutic target of chronic rejection.
US20090226975A1 (en) * 2008-03-10 2009-09-10 Illumina, Inc. Constant cluster seeding
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
GB2497007B (en) 2008-11-07 2013-08-07 Sequenta Inc Methods of monitoring disease conditions by analysis of the full repertoire of the V-D junction or D-J junction sequences of an individual
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
WO2011106738A2 (en) 2010-02-25 2011-09-01 Fred Hutchinson Cancer Research Center Use of tcr clonotypes as biomarkers for disease

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6416948B1 (en) * 1996-06-03 2002-07-09 The Governors Of The University Of Alberta Methods for detection of rearranged DNA
CN1965089A (zh) * 2002-10-11 2007-05-16 鹿特丹伊拉兹马斯大学 用于基于pcr的克隆系研究的核酸扩增引物
US20070117134A1 (en) * 2005-11-18 2007-05-24 Kou Zhong C Method for detection and quantification of T-cell receptor Vbeta repertoire
CN101225441A (zh) * 2007-12-05 2008-07-23 浙江大学 一种检测克隆特异性t淋巴细胞tcr bv cdr3基因组成的方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10323276B2 (en) 2009-01-15 2019-06-18 Adaptive Biotechnologies Corporation Adaptive immunity profiling and methods for generation of monoclonal antibodies
US10077478B2 (en) 2012-03-05 2018-09-18 Adaptive Biotechnologies Corp. Determining paired immune receptor chains from frequency matched subunits
US10214770B2 (en) 2012-05-08 2019-02-26 Adaptive Biotechnologies Corp. Compositions and method for measuring and calibrating amplification bias in multiplexed PCR reactions
US10894977B2 (en) 2012-05-08 2021-01-19 Adaptive Biotechnologies Corporation Compositions and methods for measuring and calibrating amplification bias in multiplexed PCR reactions
US11180813B2 (en) 2012-10-01 2021-11-23 Adaptive Biotechnologies Corporation Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization
US10221461B2 (en) 2012-10-01 2019-03-05 Adaptive Biotechnologies Corp. Immunocompetence assessment by adaptive immune receptor diversity and clonality characterization
US10150996B2 (en) 2012-10-19 2018-12-11 Adaptive Biotechnologies Corp. Quantification of adaptive immune cell genomes in a complex mixture of cells
CN105452483A (zh) * 2013-03-15 2016-03-30 适应生物技术公司 复杂基因集合中的独特标记的重排适应性免疫受体基因
CN105452483B (zh) * 2013-03-15 2019-01-11 适应生物技术公司 复杂基因集合中的独特标记的重排适应性免疫受体基因
US10526650B2 (en) 2013-07-01 2020-01-07 Adaptive Biotechnologies Corporation Method for genotyping clonotype profiles using sequence tags
US10077473B2 (en) 2013-07-01 2018-09-18 Adaptive Biotechnologies Corp. Method for genotyping clonotype profiles using sequence tags
CN106103711A (zh) * 2013-11-21 2016-11-09 组库创世纪株式会社 T细胞受体和b细胞受体库分析系统及其在治疗和诊断中的应用
US10435745B2 (en) 2014-04-01 2019-10-08 Adaptive Biotechnologies Corp. Determining antigen-specific T-cells
US11261490B2 (en) 2014-04-01 2022-03-01 Adaptive Biotechnologies Corporation Determining antigen-specific T-cells
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
US10392663B2 (en) 2014-10-29 2019-08-27 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from a large number of samples
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
US11066705B2 (en) 2014-11-25 2021-07-20 Adaptive Biotechnologies Corporation Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
US11047008B2 (en) 2015-02-24 2021-06-29 Adaptive Biotechnologies Corporation Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
US11041202B2 (en) 2015-04-01 2021-06-22 Adaptive Biotechnologies Corporation Method of identifying human compatible T cell receptors specific for an antigenic target
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
CN110462065A (zh) * 2016-11-02 2019-11-15 Ucl商业有限公司 检测肿瘤复发的方法
CN110462065B (zh) * 2016-11-02 2023-10-13 Ucl商业有限公司 检测肿瘤复发的方法
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
CN112292600A (zh) * 2018-06-15 2021-01-29 豪夫迈·罗氏有限公司 用于鉴定被表达在肿瘤浸润性淋巴细胞上的t细胞受体识别的抗原的系统
CN111808195A (zh) * 2020-06-30 2020-10-23 中国科学院心理研究所 抗n-甲基-d-天冬氨酸受体脑炎的b细胞抗体基因获取方法及其免疫组库研究

Also Published As

Publication number Publication date
CA2798431A1 (en) 2011-11-10
CN104673899A (zh) 2015-06-03
DK3144673T3 (da) 2019-09-09
JP6533272B2 (ja) 2019-06-19
EP2567226A4 (en) 2013-08-28
EP2567226A1 (en) 2013-03-13
SG185128A1 (en) 2012-12-28
EP4219759A3 (en) 2023-09-06
WO2011139371A1 (en) 2011-11-10
EP3456847A1 (en) 2019-03-20
AU2011249041B2 (en) 2014-10-30
AU2011249041A1 (en) 2012-11-22
JP6246971B2 (ja) 2017-12-13
JP6085249B2 (ja) 2017-02-22
CN103097888B (zh) 2016-03-09
EP4219759A2 (en) 2023-08-02
DK2567226T3 (en) 2016-10-10
JP6158080B2 (ja) 2017-07-05
JP2013524849A (ja) 2013-06-20
WO2011139372A1 (en) 2011-11-10
EP3144673A1 (en) 2017-03-22
EP2567226B1 (en) 2016-08-10
JP2017205112A (ja) 2017-11-24
JP2018068300A (ja) 2018-05-10
SG10201503534RA (en) 2015-06-29
ES2740802T3 (es) 2020-02-06
JP2013524848A (ja) 2013-06-20
CA2798431C (en) 2018-10-23
EP3144673B1 (en) 2019-07-10
ES2593614T3 (es) 2016-12-12

Similar Documents

Publication Publication Date Title
CN103097888B (zh) 利用克隆型谱监测健康和疾病状态
US11021757B2 (en) Monitoring health and disease status using clonotype profiles
US10155992B2 (en) Monitoring health and disease status using clonotype profiles
US9512487B2 (en) Monitoring health and disease status using clonotype profiles
JP2017508457A (ja) T細胞バランス遺伝子発現、組成物およびその使用方法
AU2015200383A1 (en) Monitoring health and disease status using clonotype profiles

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160129

Address after: American California

Applicant after: Sequenta, Inc.

Address before: American California

Applicant before: Mlc Dx Inc.

C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160418

Address after: Washington State

Patentee after: ADAPTIVE BIOTECHNOLOGIES CORP

Address before: American California

Patentee before: Sequenta, Inc.