CN104271759B

CN104271759B - 作为疾病信号的同种型谱的检测

Info

Publication number: CN104271759B
Application number: CN201280055957.5A
Authority: CN
Inventors: M·U·赫钦斯; D·赛里格森
Original assignee: ImmuMetrix LLC
Current assignee: ImmuMetrix LLC
Priority date: 2011-09-22
Filing date: 2012-09-24
Publication date: 2018-01-16
Anticipated expiration: 2032-09-24
Also published as: JP6198736B2; AU2012312028A1; CA2848516C; JP2018007689A; US20130078633A1; CA2848516A1; CN104271759A; AU2012312028A8; EP2758550B1; JP2014527831A; WO2013044234A1; EP2758550A1

Abstract

本发明提供用于检测和定量包含多种不同细胞群的生物学样品中的免疫球蛋白同种型的非侵入性技术。采用测序技术执行该方法，以检测并例举异种生物学样品中的免疫球蛋白同种型谱。

Description

作为疾病信号的同种型谱的检测

相关申请

本申请根据35U.S.C.§119(e)的规定，要求2011年9月22日提交的美国临时申请号61/537,878的优先权，该申请内容通过引用全文纳入本文。

技术领域

本发明涉及核酸定量分析领域。更具体地，本发明提供用于检测和定量生物学样品中存在的免疫球蛋白同种型和产生作为疾病信号的特定同种型谱的非侵入性技术。

背景

免疫系统包括先天免疫系统和获得性免疫系统。先天免疫系统包括利用一般方法来识别外来病原体的细胞和机制。先天免疫中涉及的细胞包括中性白细胞、自然杀伤细胞、巨噬细胞、单核细胞、嗜碱细胞、嗜伊红细胞、肥大细胞和树突细胞。这些细胞进行吞噬作用，并释放杀灭入侵病原体的多种化学物质。此外，这些细胞还与先天免疫防御机制(包括补体级联和炎症)有关。最后，这些细胞中的一些参与在获得性免疫系统中起作用的抗原呈递过程。

获得性免疫系统经进化以攻击其靶标上的特定特征。针对特定靶标发生过某种应答，将为宿主提供关于其的“记忆”，导致其再次发生时引起更强的应答。通常，任何蛋白质或多糖都能成为所述获得性免疫应答细胞的一些亚组或其产物的靶标，所述亚组或其产物识别所述靶标上特定表位。将获得性免疫应答分为两类：体液免疫应答和细胞介导的免疫应答，B细胞和T细胞分别在这些应答中起着特定作用。

由于自体免疫疾病涉及获得性免疫系统的一些元件对自身靶标的识别，已验证获得性免疫系统的一些方面以协助诊断和预后。已采用标准免疫学技术，通过寻找循环自身抗体来研究体液免疫系统。已鉴定针对若干疾病的自身抗体，例如抗核抗体、抗dsDNA抗体和类风湿因子。这些抗体可能本身不是病理性的，并且其在身体中识别的靶标也不必然同于体外测试的靶标；但是，对其水平的检测协助诊断，并且在一些情况下具有一些预后和治疗指示。

研究自体免疫疾病中的获得性免疫系统的其它方法基于对获得性免疫细胞的多样性分析。获得性免疫细胞的激活导致其克隆扩张。该克隆扩张的证据通常通过从血液RNA或DNA扩增编码所述抗原识别区域的部分核酸序列来获得。例如，用以扩增具有T细胞受体中β链的特定V区段(类似于抗体重链)的序列的PCR引物被用于扩增连接至该特定V区段的J区段或J和D区段。当存在不同细胞群时，希望扩增具有扩增子大小略不同的分布的片段，但克隆扩张导致特定大小被富集，并因而导致凝胶上呈现更强的条带。在称作谱型分析的技术中，扩增带有J和D区段的各V区段，以评估这些扩增子中是否显示克隆扩张。

谱型分析法的一个问题是，多种不同序列可能具有相同长度并因此无法区分。因此，通过该技术仅能辨别明显的克隆扩张。需要用于自体免疫疾病和自体免疫疾病状态以及免疫系统起中心作用的其它疾病的诊断和预后协助的改进方法。免疫系统的广泛多样性使其具有潜在有用细胞的极大储备，但也显示出对于尝试采用该库以达推测目的的研究者的挑战。靶向抗原的任何单一序列均是可能涉及和/或关联指定个体中疾病过程的为数众多的序列之一。能够鉴定给定个体的多种细胞中有哪些涉及疾病过程的方法对人类健康而言将极具价值。

概述

本发明涉及用于监测免疫库和分析免疫系统概况的方法。与先前描述的明确需要特定免疫细胞群(例如，T细胞或B细胞)和对个体细胞和/或源自此类细胞的个体核酸分子的空间分离的方法不同，本发明方法采用异种细胞群及其衍生的异种核酸混合物来进行。

一方面，本发明提供测定全血样品中免疫球蛋白同种型的方法，所述方法通过如下方式进行：从获自对象的包含多种细胞类型的生物学样品分离多种核酸，并检测所述多种核酸中免疫球蛋白的恒定区特异的序列；由此测定免疫球蛋白同种型。

所述方法通常涉及如下步骤：从来自对象的包含多种不同细胞类型的生物学样品获得核酸，从所述生物学样品分离核酸，检测免疫球蛋白的一个或多个区域特异的序列，和测定序列的不同水平以产生免疫球蛋白同种型谱。

具有多种不同细胞类型的生物学样品包括但不限于：血液、血液成分、唾液、痰、尿、精液、阴道液体、脑脊髓液、粪、细胞和组织活检物。在优选实施方式中，所述样品是全血且样品小于100μL。

分离自此类生物学样品的核酸可以是DNA(例如，cDNA)或RNA。在某些实施方式中，经分离的核酸是总RNA。在某些实施方式中，经分离的核酸是由总RNA生成的cDNA。在一些实施方式中，采用免疫球蛋白的一个或多个区域(例如免疫球蛋白VDJ区和/或Ig恒定区)特异的多种引物扩增cDNA。

所述检测步骤可采用杂交捕获或测序技术进行。本发明方法中可用的测序技术的示例包括但不限于：合成测序技术，例如大规模平行测序、单分子测序、True单分子测序、焦磷酸测序等。可用于本发明方法的合适的测序平台包括但不限于：True单分子测序(tSMS^TM)技术，例如螺旋公司(Helicos Inc)提供的HeliScope^TM测序仪，单分子实时(SMRT^TM)技术，例如太平洋生物科学公司(Pacific Biosciences)提供的PacBio RSV F系统，大规模平行测序技术，例如牛米纳公司(niumina,Inc.)提供的HiSEQ^TM和MiSEQ^TM系统，氧化铝公司(Alumina,Inc.)提供的Solexa^TM测序仪，生命技术公司(Life Technologies,Inc.)提供的SOLiD^TM测序系统，和生命技术公司提供的Ion Torrent系统。

在具体实施方式中，本发明提供采用测序技术对直接来自外周全血或其成份衍生的核酸的免疫球蛋白同种型测序以分析免疫系统概况的方法。在其它具体实施方式中，通过对外周血单核细胞衍生的核酸直接测序获得免疫球蛋白同种型谱。如本文所用，术语“外周全血”指其中诸如血红细胞、血白细胞、血浆或血小板的组分未经去除的血液，而术语“外周血单核细胞”或“PBMC”指具有圆细胞核的血细胞混合物，且包括淋巴细胞、单核细胞和巨噬细胞。

通过本发明的方法产生的免疫系统的谱可用于诊断疾病和病症，和用于诊断疾病和病症的状态。本发明的方法可用于监测疾病和病症，和评估对疾病和病症的治疗。本发明方法可应用的疾病和病症包括自体免疫疾病，包括系统性红斑狼疮(SLE)、多发性硬化(MS)、类风湿性关节炎(RA)和强直性脊柱炎。本发明的方法还可应用于诊断、监测和治疗移植物排斥和免疫老化(immune aging)。此外，本发明的用于免疫概况分析的方法可用于诊断、监测和治疗于免疫系统相关的其它疾病，包括癌症和传染病。

附图简要说明

图1显示的饼图说明在三个不同测序运行中获得的三个样品(#1、#2和#3)的同种型分布图。

发明详述

本文所述的方法和材料应用测序技术用于分析获自对象的生物学样品中的免疫受体基因群和免疫球蛋白同种型分布。免疫受体基因群的测序提供特定和详细的分子表征以及对感兴趣的序列检测的高灵敏度，以协助疾病诊断和监测。

用于采用微芯片阵列(例如，ImmunArray)免疫库概况分析的方法或测序技术已经描述。

然而，此类基于序列的方法需要分离特定的免疫细胞(例如，T细胞或B细胞)群，并将此类细胞空间分离成个体细胞和/或源自此类细胞的个体核酸分子以形成克隆(参见，例如US2010/0151471)。相反，本发明提供的用于免疫球蛋白同种型谱分析的方法采用敏感的、高通量的测序技术对来自异种细胞群衍生的异种核酸混合物的免疫球蛋白同种型直接测序。在本发明之前，从未实现对异种细胞群及其衍生的异种核酸混合物的“噪音”或“背景”中的特定免疫球蛋白同种型进行检测和定量。具体而言，可测定很小样品大小(例如一滴血)的同种型。因此，本发明方法与常规方法的不同之处在于，本方法是非侵入性的，并且不需要受过训练的抽血医师从患者抽血。此外，与常规方法不同，本发明方法不需要血液分级分离。本发明方法通常涉及如下步骤：从对象获得外周全血样品，从所述外周全血样品或其分级分离部分(例如，外周血单核细胞)分离RNA，采用靶标特异性引物使所述经分离的RNA逆转录，以产生免疫球蛋白cDNA转录本，采用多重PCR技术扩增免疫球蛋白VDJ至Ig恒定区，对扩增子测序，以及分析序列数据。数据分析包括如下步骤：提取各同种型的Ig恒定区序列，并比较给定样品的全部Ig同种型序列的总数。

通过对源自外周血的细胞(例如，外周血细胞，或外周血单核细胞)制样来监测健康者和患病者的免疫库能够在免疫球蛋白同种型水平揭示疾病信号。通过比较通过对源自外周血的经扩增cDNA测序显示的各同种型的量，能够检测水平从而区分患病个体和健康个体。

对象

本发明方法采用来自对象或个体的生物学样品。对象可以是患者，例如，患有自体免疫疾病、传染病或癌症的患者，或移植受者。对象可以是人或非人哺乳动物。对象可以是任何年龄(例如，胎儿、婴儿、儿童或成人)的男性或女性对象。

样品

本发明方法采用的样品可包括，例如，来自对象的体液，包括围绕胎儿的羊水、水状体、胆汁、血液和血浆、耳垢(耳蜡)、考珀液或射精前分泌物、乳糜、食糜、女性喷射物、间质液、淋巴、经液、母乳、黏液(包括鼻涕和痰)、胸膜液、脓、唾液、皮脂(皮油)、精液、血清、汗液、泪液、尿、阴道分泌物、呕吐物、粪、体内液体包括围绕脑的脑脊髓液、围绕骨关节的滑液、胞内液(细胞内的液体)和玻璃状液(眼球内的液体)。

在一个实施方式中，所述样品是血液样品，例如外周全血样品或其分级分离部分。优选地，所述样品是未经分离分级的全血。

所述血液样品可以是约0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5或5.0mL。优选地，所述样品是100μL或更少。最优选地，所述样品是50μL或更少。

在某些实施方式中，所述样品是脑脊液(CSF)(例如，当对象患有多发性硬化时)、滑液(例如，当对象患有类风湿性关节炎时)，或皮肤(或其它器官)活检物(例如，当对象患有系统性红斑狼疮时)。

不希望受任何理论限制，免疫球蛋白同种型可由最可能反映病理学的可获得的体液/组织来鉴定，随后从不同体液(例如，血液)监测同种型水平和具体疾病的克隆型信号。

在疾病停止或发病时均可根据本发明方法分析样品，以协助鉴定与特定疾病相关联的克隆型信号。

所述样品可由健康护理提供者获得，例如，医师、医师助理、护士、兽医、皮肤学家、风湿病学家、牙医、军医或外科医生。所述样品可由研究技术人员获得。可从对象获得多于一个样品。

所述样品可以是活检物，例如，皮肤活检物。所述活检物可来自，例如，脑、肝、肺、心、结肠、肾或骨髓。可采用本领域技术人员所用的任何活检技术来从对象分离样品。例如，活检可以是开放式活检，其中采用全身麻醉。活检可以是封闭式活检，其中采取比开放式活检中规模较小的切割。所述活检可以是核心活检或切入式活检，其中移出组织的部分。所述活检可以是切除式活检，其中尝试移出完整损害。所述活检可以是细针吸活检，其中组织或液体样品用针移出。

所述样品可包括免疫细胞。所述免疫细胞可包括T细胞和/或IB-细胞。T细胞(T淋巴细胞)包括，例如，表达T细胞受体的细胞。T细胞包括辅助T细胞(效应物T细胞或Th细胞)、细胞毒T细胞(CTL)、记忆T细胞和调节性T细胞。在一些应用中(例如，用于确定相关T细胞的校准试验)，所述样品可包括单一细胞，或者更一般地包括至少1,000个、至少10,000个、至少100,000个、至少250,000个、至少500,000个、至少750,000个或至少1,000,000个T细胞。

B细胞包括，例如，血浆B细胞、记忆B细胞、Bl细胞、B2细胞、边缘区B细胞和滤泡B细胞。B细胞能表达免疫球蛋白(抗体、B细胞受体)。在一些应用中(例如，用于确定相关B细胞的校准试验)，所述样品可包括单一细胞，或者更一般地包括至少1,000个、至少10,000个、至少100,000个、至少250,000个、至少500,000个、至少750,000个或至少1,000,000个B细胞。

所述样品可包含核酸，例如，DNA(例如，染色体DNA或线粒体DNA)或RNA(例如，信使RNA或微小RNA)。所述核酸可以是无细胞DNA或RNA。本发明方法中，来自对象的可分析的RNA或DNA的量包括，例如，在一些应用(例如，校准试验)中，低至单一细胞，且多至1千万个细胞或更多，经转换即为6pg～60μg DNA，和约1pg～10μg RNA。

扩增反应

可采用聚合酶链式反应(PCR)来扩增细胞收集物中的有关区域。可采用转录介导的扩增(TMA)来从靶核酸产生RNA扩增子。可分开分析(例如，通过测序分析)来自各细胞的核酸，因为各细胞将携带其自身独特的免疫球蛋白同种型信息。

在一些实施方式中，采用多重PCR从异种核酸扩增免疫球蛋白序列的VDJ至Ig恒定区。

在一些实施方式中，在多重反应中采用退火至C区的至少一个引物和可退火至一个或多个V区段的一个或多个引物从异种核酸扩增免疫球蛋白序列。在多重反应中，退火至V区段的引物的数目可以是，例如，10～60、20～50、30～50、40～50、20～40、30～40或35～40。所述引物可退火至不同V区段。就IgH基因而言，因为V区段中可能的体细胞突变，可采用退火至各V区段的多重引物，例如，1、2、3、4或5个引物/V区段。在多重反应中，退火至V区段的引物的数目可包括，例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。多重反应中，退火至C区段的引物的数目可以是1～10、2～9、3～8、4～7、3～8或3～6。

在一些实施方式中，待扩增的区域包括全长克隆序列或克隆序列的子集，包括免疫球蛋白或T细胞受体基因的V-D接合处、D-J接合处，免疫球蛋白或T细胞受体基因的全长可变区、抗原识别区或CDR(例如，互补决定区3(CDR3))。

在一些实施方式中，采用一级和二级扩增步骤扩增免疫球蛋白序列。不同扩增步骤各自可包括不同引物。所述不同引物可引入免疫基因序列中原始不存在的序列。例如，扩增程序可添加一个或多个标签至经扩增免疫球蛋白序列的5′和/或3′端。所述标签可以是便于经扩增DNA的后续测序的序列。所述标签可以是便于使经扩增序列结合至固体支持物的序列。所述标签可以是便于鉴别经扩增免疫球蛋白序列的条形码或标记物。

用于扩增的其它方法可在V区内不采用任何引物。或者，可从C区段采用特异性引物，并在另一侧(5′)设置通用引物。可在通过不同方法(包括详细描述的链转换方法)的cDNA合成中附加通用引物。类似地，可在通过不同方法(包括连接)制备cDNA之后附加通用引物。

扩增可用于本发明方法的核酸的其它方法包括，例如，逆转录-PCR、实时PCR、定量实时PCR、数字PCR(dPCR)、数字乳液PCR(dePCR)、克隆PCR、扩增片段长度多态性PCR(AFLPPCR)、等位基因特异性PCR、组装PCR、不对称PCR(其中采用针对选定链的大幅过量的引物)、集落PCR、解旋酶依赖性扩增(HDA)、热启动PCR、反向PCR(IPCR)、原位PCR、长PCR(DNA延伸超过约5千碱基)、多重PCR、巢式PCR(采用多于一个引物对)、单细胞PCR、降落PCR、环介导的等温PCR(LAMP)和基于核酸序列的扩增(NASBA)。其它扩增方案包括：连接酶链式反应、分支DNA扩增、滚环扩增、环-环扩增、SPIA扩增、通过捕获和连接(TACL)扩增的靶标扩增，和RACE扩增。

可通过采用反转录，运用本领域普通技术人员熟知的技术，将样品中RNA的中信息转变成cDNA(参见，例如，Sambrook,Fritsch和Maniatis,MOLECULAR CLONING:ALABORATORY MANUAL(《分子克隆：实验室手册》)，第二版(1989))。可在反转录反应中采用多聚A引物、随机引物和/或基因特异性引物。

可用于本发明方法中的扩增的聚合酶包括，例如，Taq聚合酶、AccuPrime聚合酶或Pfu。可根据保真度和效率是否优选来选择待用的聚合酶。

在从基因组扩增DNA之后(或通过反转录RNA扩增cDNA形式的核酸之后)，直接对扩增子测序。

测序

本领域技术人员已知的用于对核酸测序的任何技术均可用于本发明方法。 DNA测序技术包括：采用经标记的终止子或引物以及平板或毛细管中的凝胶分离的经典双脱氧测序反应(桑格法)、采用可逆终止的经标记核苷酸的合成测序法、焦磷酸测序、454测序、针对经标记寡核苷酸探针文库的等位基因特异性杂交、采用针对经标记克隆文库的等位基因特异性杂交随后连接的合成测序法、在聚合步骤过程中对经标记的核苷酸掺入的实时监测，以及SOLiD测序。

在某些实施方式中，本发明方法中可用的测序技术产生至少100个读数/运行、至少200个读数/运行、至少300个读数/运行、至少400个读数/运行、至少500个读数/运行、至少600个读数/运行、至少700个读数/运行、至少800个读数/运行、至少900个读数/运行、至少1000个读数/运行、至少5,000个读数/运行、至少10,000个读数/运行、至少50,000个读数/运行、至少100,000个读数/运行、至少500,000个读数/运行、至少1,000,000个读数/运行、至少2,000,000个读数/运行、至少3,000,000个读数/运行、至少4,000,000读数读数/运行、至少5000,000读数/运行、至少6,000,000读数/运行、至少7,000,000读数/运行、至少8,000,000读数/运行、至少9,000,000个读数/运行或至少10,000,000读数/运行。

在一些实施方式中，测序读数/制样B细胞的数目应该是制样B细胞数目的至少2倍、制样B细胞数目的至少3倍、制样B细胞数目的至少5倍、制样B细胞数目的至少6倍、制样B细胞数目的至少7倍、制样B细胞数目的至少8倍、制样B细胞数目的至少9倍，或制样B细胞数目的至少10倍，但不限于5x(更少或更多均可以足够)。如此，例如1百万到1千万个读数/样品，等。测序深度允许使制样的B细胞精确平均化，便于误差校正并确保对于所述文库的测序已经饱和。

在某些实施方式中，本发明方法中可用的测序技术每次读数可产生约30bp、约40bp、约50bp、约60bp、约70bp、约80bp、约90bp、约100bp、约110bp、约120bp，每次读数约150bp、约200bp、约250bp、约300bp、约350bp、约400bp、约450bp、约500bp、约550bp、约600bp、约700bp、约800bp、约900bp或约1,000bp。例如，本发明方法所用的测序技术每次读数可产生至少30、40、50、60、70、80、90、100、110、120、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1,000。

True单分子测序

可用于本发明方法的测序技术包括，例如，Helicos True单分子测序(tSMS)(Harris T.D.等.(2008)Science320:106-109)。在tSMS技术中，将DNA样品切割成约100～200个核苷酸的链，然后向各DNA链的3′端添加多聚A序列。各链通过添加经荧光标记的腺嘌呤核苷酸来标记。然后使所述DNA链杂交至流动室，所述流动槽包含固定在流动室表面的数百万个寡T捕获位点。所述模板的密度可以是约1亿模板/cm²。然后，将所述流动室装载至仪器(例如，HeliScope^TM测序仪)中，并用激光照射所述流动室表面，揭示各模板的位置。CCD照相机可绘制所述流动室表面的模板位置。然后，切割并洗去所述模板荧光标记物。所述测序反应由引入DNA聚合酶和经荧光标记的核苷酸开始。所述寡T核酸作为引物。所述聚合酶以模板定向的方式将经标记的核苷酸纳入引物。去除所述聚合酶和未纳入的核苷酸。通过对所述流动室表面成像来检测已定向纳入经荧光标记的核苷酸的模板。成像后，切割步骤去除荧光标记物，并用其它经荧光标记的核苷酸重复该过程直至达到所需读数长度。采用各核苷酸添加步骤收集序列信息。

454测序

可用于本发明方法的DNA测序技术的另一个示例是454测序(罗氏(Roche))(Margulies,M等.2005,Nature,437,376-380)。454测序涉及两个步骤。第一步骤中，将DNA剪切成约300～800碱基对的片段，并使所述片段具有钝端。然后，使寡核苷酸衔接子连接至所述片段末端。所述衔接子起扩增和片段测序用引物的作用。可采用例如衔接子B(AdaptorB，其包含5′-生物素标签)使所述片段连接至DNA捕获珠(例如，链霉亲和素被覆的珠)。使连接至所述珠的片段在油-水乳液液滴中进行PCR扩增。所得结果是各珠上克隆扩张的DNA片段的多重拷贝。在第二步骤中，使所述珠在孔(皮升(pico-liter)级大小)中被捕获。在各DNA片段上平行进行焦磷酸测序。添加一个或多个核苷酸产生光信号，所述光信号由测序仪器内CCD照相机记录。所述信号强度与纳入的核苷酸数目成比例。

焦磷酸测序利用在添加核苷酸后释放的焦磷酸盐(PPi)。PPi在腺嘌呤5′磷酰硫酸存在下通过ATP硫酸化酶转变成ATP。荧光素酶利用ATP将荧光素转变成氧化萤光素，而该反应产生光，检测并分析所述光。

基因组测序仪FLX^TM

本发明方法中可用的DNA测序技术的另一个示例是基因组测序仪FLX系统(罗氏(Roche)/454)。所述基因组测序FLX系统(例如，GS FLX/FLX+，GS初级)提供多于1百万高质量读数/运行，且读数长度为400个碱基。这些系统是理想上适合于对全基因组和任何大小的转录组进行从头测序，对复合样品的宏基因组表征或重测序研究。

SOLiD^TM测序

本发明方法中可用的DNA测序技术的另一个示例是SOLiD技术(生命技术公司(Life Technologies,Inc.))。在SOLiD测序中，基因组DNA被剪切成片段，并且使衔接子连接至所述片段的5′和3′端以生成片段文库。或者，可通过如下方式引入内部衔接子：将衔接子连接至所述片段的5′和3′端，使所述片段环化，消化所述环化的片段以产生内部衔接子，并使衔接子连接至所得片段的5′和3′端以产生伴侣配对的文库。接着，在包含珠、引物、模板和PCR组分的微型反应器中制备克隆珠的群。PCR后，使所述模板变性，并且富集所述珠以分离带有延伸的模板的珠。对选定珠上的模板进行3′修饰，该修饰允许结合至载玻片。

可通过依次使部分随机寡核苷酸与中央确定碱基(或碱基对)杂交和连接来测定序列，所述中央确定碱基(或碱基对)通过特异性荧光团来鉴定。在记录颜色之后，所述连接的寡核苷酸被切割并去除，然后重复该过程。

Ion Torrent^TM测序

本发明方法中可用的DNA测序技术的另一个示例是IonTorrent系统(生命技术公司(Life Technologies,Inc.))。Ion Torrent采用高密度的微型机械加工的孔阵列以大规模平行的方式进行该生化过程。各孔含有不同的DNA模板。所述孔下是离子敏感层，且该层下是专有的离子(Ion)传感器。如果核苷酸(例如C)添加至DNA模板并且随后纳入DNA链，则氢离子将被释放。所述离子的电荷将改变溶液的pH，这可由专有的离子传感器来检测。测序仪将判定(call)碱基，直接将化学信息变成数字信息。然后，离子个人基因组仪器(IonPersonal Genome Machine)(PGM^TM)测序仪用一个接一个的核苷酸依次注满所述芯片。如果注入所述芯片的下一个核苷酸不匹配，则不会记录电压变化也不会判定碱基。如果在所述DNA链上有两个相同的碱基，则该电压会加倍，并且所述芯片会记录判定的两个相同碱基。由于这是直接检测(即没有扫描、照相机或光照的检测)，因此以秒记录各核苷酸纳入。

HiSeq^TM和MiSeq^TM测序

本发明方法中可用的测序技术的另一个示例包括来自亿明达公司(Illumina,Inc.)的HiSEQ^TM系统(例如，HiSEQ2000^TM和HiSEQIOOO^TM)和MiSEQ^TM系统。所述HiSEQ^TM系统基于针对数百万个片段的大规模平行测序，所述测序采用将随机片段化的基因组DNA连接至光学透明的平表面并固相扩增以生成含数百万个簇的高密度测序流动室，其各包含约1,000个模板拷贝/cm²。采用四色DNA 合成测序技术对这些模板测序。所述MiSEQ^TM系统采用TruSeq，亿明达(Illumina)公司的基于可逆终止子的合成测序。SOLEXA^TM测序

本发明方法中可用的测序技术的另一个示例是SOLEXA测序(亿明达)。SOLEXA测序是基于固体表面上的DNA扩增，采用折回(fold-back)PCR和锚定引物进行。使基因组DNA片段化，并且向所述片段的5′和3′端添加衔接子。使连接至流动室通道表面的DNA片段进行延伸和桥扩增。所述片段变成双链，并且使所述双链分子变性。多轮固相扩增，然后变性，可在流动室的各通道内产生相同模板的单链DNA分子的约1,000个拷贝的数百万个簇。采用引物、DNA聚合酶和经四种荧光团标记的，可逆终止的核苷酸来进行顺序测序。纳入核苷酸后，采用激光来激发所述荧光团，然后捕获图像，并记录第一个碱基的鉴定信息。将来自各纳入碱基的3′终止子和荧光团去除，并重复所述纳入、检测和鉴定步骤。

SMRT^TM测序

本发明方法可用的测序技术的另一个示例包括太平洋生物科学公司(PacificBiosciences)的单分子、实时(SMRT^TM)技术。在SMRT^TM中，使四种DNA碱基各自连接至四种不同的荧光染料之一。这些染料是磷连接的。单一DNA聚合酶用单一单链DNA模板分子固定在零模式波导(ZMW)的底部。ZMW是使单核苷酸的纳入能够被观察到的封闭结构，通过针对在所述ZMW内外快速(以微秒计)扩散的荧光核苷酸背景的DNA聚合酶来进行所述观察。需要数毫秒来将核苷酸纳入生长中的链。在该时程中，所述荧光标记物被激发并产生荧光信号，而所述荧光标签被切割掉。检测所述染料的对应荧光指示纳入了哪个碱基。重复所述过程。

纳米孔测序

本发明方法中可用的测序技术的另一个示例是纳米孔测序(Soni G V和MellerA.(2007)Clin Chem53:1996-2001)。纳米孔是直径在1纳米级别的小洞。将纳米孔浸入传导液并穿过该液体施加电压导致轻微电流，这归因于通过所述纳米孔的离子传导。流过的电流量对纳米孔的大小敏感。由于DNA分子穿过纳米孔，所述DNA分子上的各核苷酸不同程度地阻塞所述纳米孔。因此，DNA分子穿过纳米孔时通过纳米孔的电流变化代表对DNA测序的读数。

化学敏感性的场效应晶体管阵列测序本发明方法中可用的测序技术的另一个示例涉及采用化学敏感性的场效应晶体管(chemFET)阵列来对DNA测序 (例如，如美国专利申请公开号20090026082所述)。该技术的一个示例中，可将DNA分子置入反应室中，然后所述模板分子可杂交至与聚合酶结合的序列引物。可通过chemFET来基于电流变化检测所述测序引物3′端的新核苷酸链中一个或多个三磷酸的纳入。阵列可具有多个chemFET传感器。在另一个示例中，可使单一核酸连接至珠，然后可使该核酸在珠上扩增，并且可将个体珠转移至chemFET阵列上的个体反应室，各室具有chemFET传感器，从而所述核酸可被测序。

采用电子显微镜的测序

本发明方法中可用的测序技术的另一个示例涉及采用电子显微镜(MoudrianakisE.N.和Beer M.Proc Natl Acad Sci USA.1965年3月；53:564-71)。在该技术的一个示例中，个体DNA分子采用金属标记物标记，所述标记可采用电子显微镜区别。然后，将这些分子在平表面上拉伸并采用电子显微镜成像以检测序列。

本文所述测序技术中任一种均可用于本发明方法。

数字计数与分析

测序能够检测异种生物学样品中多种免疫球蛋白同种型的存在并对其定量。测序数据分析包括如下步骤：提取各同种型的Ig恒定区序列，并比较给定样品的全部Ig同种型序列的总数。高通量分析可采用一种或多种生物信息学工具来实现，例如ALLPATHS(能够从短读数产生高质量集合的全基因组鸟枪法)、Arachne(从全基因组鸟枪读数集合基因组序列的工具，常用于由克隆端测序获得的正向对和反相对)、BACCardl(用于验证基因组组装的图形工具，协助基因组完成和基因组间比较)、CCRaVAT和QuTie(能够在大规模病例对照和数量性状关联研究中分析稀有变体)、CNV-seq(采用高通量测序检测拷贝数变化的方法)、Elvira(用于高通量组装小基因组(例如，病毒)的一组工具/方法)、Glimmer(用于在微生物DNA，尤其是细菌、古细菌和病毒的基因组中寻找基因的系统)、gnumap(设计来精确比对获自下一代测序仪的序列数据的程序)、Goseq(供于进行基因语义学和基于测试RNA-seq数据(校正选择性偏差)的其它种类的文库)、ICAtools(可用于终等规模至大规模测序工程的一组程序)、LOCAS(用于组装二代生成测序技术的短读数的程序)、Maq(通过比对短读数和参比序列来建立集合)、MEME(基于基序的序列分析工具)、NGSView(通过图形界面允许数百万序列同时在台式计算机上的显像与操作)、OSLay(未完成组装的最优同线设计)、Perm(采用周期完整敏感空位种子的针对短测序读数的有效比对)、Projector(供于间隙闭合目的的自动化重叠群比对)、Qpalma(目标为使通过测序平台(例如亿明达、Solexa或454)产生的叠接读数对齐的对齐工具)、RazerS(采用敏感性对照的快速读取比对法)、SHARCGS(用于基因组测序的基于强健重叠群扩展的短读数组装器；设计用于从头组装25～40聚体输入片段和深序列覆盖度的DNA组装程序)、Tablet(下一代序列组装显像)和Velvet(供于极短读数的序列组装器)。

本发明的方法和应用

本文公开的方法用于有发展疾病或病症风险的对象、可能已被或可能未被诊断患有疾病或病症的对象，以及经历针对疾病或病症的处理和/或治疗的对象。本发明方法还可用于监测或选择用于患有疾病或病症的患者的治疗方案，并筛选先前未被诊断为患有疾病或病症的对象，例如具有所述疾病或病症的风险因素的对象。

优选地，本发明方法用于鉴定和/或诊断无疾病或病症症状的对象。"无……症状"指不显示传统症状。

本发明方法还可用于鉴定和/或诊断仅基于传统风险因素而言已有发展疾病或病症风险的对象。

患有疾病或病症的对象可通过测定对象来源样品中的同种型谱和量，然后与参比值比较来鉴定。

然后鉴定对象样品中同种型相对于参比值的变化。

参比值可相对于源自群体研究的数目或值，或相对于经历疾病或病症治疗的对象的起始样品，所述群体包括但不限于，患有相统计并或病症的对象、年龄范围相同或相似的对象、相同或相似种族组中的对象、有疾病或病症家族史的对象。此类参比值可源自群体的统计学分析和/或风险预测数据，由所述疾病或病症数学算法和计算指数获得。还可采用算法和统计学与结构分类的其它方法来构建并使用参比同种型谱指数。

在本发明的一个实施方式中，所述参比谱是源自不具有发展所述疾病或病症风险或具有发展所述疾病或病症的低风险的一个或多个对象的对照样品中的同种型谱。在本发明的另一个实施方式中，所述参比谱是源自没有疾病或病症症状和/或缺乏疾病或病症的传统风险因素的一个或多个对象的对照样品中的同种型谱。在另一个实施方式中，在此类测试之后的诊断相关的时间段中监测和/或定期重新测试此类对象(纵向研究)，以验证疾病或病症的持续不存在(疾病或无事件存活)。所述时间段可以是自最初测试日期起的1年、2～5年、5年、5～10年、10年或更多年，以确定参比值。此外，对正确存档(banked)的历史对象样品中的同种型谱的回顾性检测可用于建立这些参比值，因而缩短所需的研究时间。参比谱还可包含源自显示因处理和/或治疗疾病或病症而使所述疾病或病症风险因子改善的对象的同种型谱。参比谱还可包含源自通过已知侵入性或非侵入性技术确定患有疾病，或具有发展疾病或病症的高风险，或曾患有疾病或病症的对象的同种型谱。在另一个实施方式中，所述参比值是指数值或基线值。指数值或基线值是来自未患所述疾病的正常对象的复合样品。基线值还可包含源自已显示因处理或治疗而使风险因子改善的对象的样品中的同种型谱。在该实施方式中，为了与源自所述对象的样品作比较，对于对照样品的量进行类似计算并与指数值作比较。

疾病或病症的进展或疾病或病症治疗方案的有效性可通过随时间进行检测获自对象的样品中的同种型谱并比较经检测的同种型谱的量来监测。例如，第一样品能在对象接受治疗前获得，而一种或多种后续样品在对象治疗后或治疗中获得。如果同种型谱相对于参比值而言随时间而发生改变，那么认为所述疾病或病症是进展性的(或者，所述治疗不阻止进展)，反之，如果同种型随时间保持恒定(相对于参比群，或具有本文中所用含义的“恒定”)，那么所述疾病或病症是非进展性的。本发明内容中所用的术语“恒定”解释为包括随时间相对于参考值发生的变化。

此外，适于给予具体对象的治疗剂或预防剂可通过检测所述获自对象的样品中的同种型谱，使对象来源样品暴露至测试化合物来鉴定。因此，用于患有疾病或病症的对象，或具有发展疾病或病症的风险的对象的处理或治疗方案可基于获自所述对象的样品中的同种型谱及其与参比值的比较来选择。可平行评价两种或更多种处理或治疗方案来确定哪种处理或治疗方案将会最有效地用于对象以延迟所述疾病或病症发病或减缓所述疾病或病症的进展。

本发明还提供用于筛选疾病或病症相关的同种型谱变化的方法，所述方法通过如下方式进行：测定对象来源样品中的同种型谱，比较参比样品中的同种型谱，并鉴定所述对象样品中同种型谱相较于所述参比样品的变化。

如果所述参比样品(例如，对照样品)来自未患疾病或病症的对象，或如果所述参比样品反映相对于很有可能快速进展成疾病或病症的人的值，那么所述测试样品中与参比样品中的同种型谱的相似性指示所述治疗是有效的。然而，测试样品与参比样品中同种型谱的差异指示欠佳的临床结果或预后。

本文公开的风险因子的评估可采用标准临床方案来进行。可采用用于诊断、鉴定或治疗疾病或病症的任何已知的方法联合测定有效性。

本发明还提供用于治疗患有疾病或病症的一个或多个对象的方法，所述方法通过如下方式进行：测定来自一个或多个对象的样品中的同种型谱；并用一种或多种药物处理所述一个或多个对象直至所述同种型谱回复至在具有发展疾病或病症的低风险的一个或多个对象中检测到的基线值。

本发明还提供用于评价对象中发展疾病或病症的风险变化的方法，所述方法通过如下方式进行：在第一时间段对来自所述对象的第一样品进行同种型谱分析，在第二时间段测定来自所述对象的第二样品中的同种型谱，并比较在所述第一和第二时间段检测的同种型谱。

“正常同种型谱”指通常在未患疾病或病症的对象中发现的谱。此类正常对照水平和截止点可根据同种型谱是否单独使用或与所述疾病或病症的其它临床指示剂以公式形式合并成指数来使用而不同。或者，所述正常对照水平可以是来自先前测试对象的同种型谱数据库，所述先前测试对象在临床相关时间范围内没有发展疾病或病症。

本发明可用于连续或分类测量转变成疾病状态的风险，因此诊断并确定被确定为具有患病状态风险的对象类型的风险谱。在分类情况下，本发明方法可用于区分正常和疾病对象群组。在其它实施方式中，可利用本发明从而区分具有患病事件风险的对象和具有更快速进展成疾病事件的对象(或在较短可能时间范围进展成疾病事件的对象)，以及更缓慢进展成疾病事件(或需要更长时间范围进展成疾病事件)的对象，或区分患病对象和正常对象。

鉴定具有患疾病或病症风险的对象能够选择并起始不同治疗干预或处理方案，以延缓、减轻或阻止对象转变成疾病状态。同种型谱使疾病疗程能够被监控。在该方法中，可由经历治疗方案(例如，药物治疗)的对象提供生物学样品。必要时，可从处于治疗前、治疗中或治疗后的不同时间点的对象获得生物学样品。本发明还可用于筛选任何设定数目的患者或对象群。例如，健康维护组织、公共健康实体或学校健康计划可筛选对象组以鉴定如上述需要干预的那些对象或收集流行病学数据。保险公司(如健康、生命或残疾)可以在测定覆盖或定价或者存在可能干预的客户的过程中筛选申请人。在此类群体筛选中收集的数据，尤其是与任何临床进展成病症(如癌症或转移事件)紧密相关时，将在例如健康维护组织公共健康计划和保险公司的操作中具有价值。这种数据阵列或收集能存储于机器可读介质中，并且用于任何数目的健康相关数据管理系统以提供改善的健康护理服务、符合成本效益的健康护理、改进的保险经营等。参见，例如，美国专利申请号2002/0038227；美国专利申请号US2004/0122296；美国专利申请号US2004/0122297；和美国专利申请号5,018,067。如本文进一步详述，此类系统能利用直接来自内部数据存储或间接来自一种或多种数据存储点的数据。

机器可读存储介质能包含用机器可读数据或数据阵列编码的数据存储材料，其在采用编有应用所述数据的指令的机器时，能够用于多种目的，例如但不限于，随时间进行的或响应药物治疗的转移性疾病风险因子相关的对象信息。对有效量的本发明生物标志物的测量和/或由所述生物标志物得到的风险评价可在可编程计算机上执行的计算机程序中进行，包括但不限于，处理器、数据存储系统(包含易失性和非易失性记忆和/或存储元件)，至少一个输入设备和至少一个输出设备。程序码可用于输入数据以运行上述功能和产生输出信息。可根据本领域已知方法将输出信息用于一种或多种输出设备。计算机可以是例如个人计算机、微型计算机或传统设计的工作站。

可在高水平程序或面向对象的编程语言中执行各程序以与计算机系统交互。然而，必要时，可在汇编或机器语言中执行程序。语言可以是编译或解释语言。可将各所述计算机程序存储在由普通或特殊目的可编程计算机可读的存储介质或设备上(如ROM或磁盘或在本公开别处定义的其他种类)，以用于在所述存储介质或设备由计算机读取以运行本文所述程序时，配置或操作计算机。本发明的所述健康相关数据管理系统也可以认为是作为配置有计算机程序的计算机可读存储介质来执行，其中，所述设置存储介质配置成引起计算机以特殊和预定方式运行从而行使本文所述多种功能。

同种型谱经测定并与参比值(例如，已知疾病状态的对照对象或群体)或指数值或基线值比较。所述参比样品或指数值或基线值可获自或源自已经接受治疗的一个或多个对象，或可以获自或源自具有发展疾病或病症的低风险的一个或多个对象，或可以获自或源自已显示因接受治疗而有改善的对象。或者，所述参比样品或指数值或基线值可以获自或源自未接受治疗的一个或多个对象。例如，可从已接受针对疾病或病症的初始治疗和针对所述疾病或病症的后续治疗的对象收集样品以监控治疗的进展。参比值还可包含源自群体研究的风险预测算法或计算指数的值，例如本文公开的那些。

所述同种型谱可用于产生未患疾病或病症的对象或不具有患疾病或病症风险，且不预期会发展疾病或病症的对象的“参比同种型谱”。本文公开的决定子(DETERMINANTS)也可用于产生获自患有癌症的对象或具有疾病或病症风险的对象的“对象同种型谱”。可将所述对象同种型谱与参比同种型谱作比较，以诊断或鉴定具有发展疾病或病症风险的对象，以监控疾病进展，以及疾病进展的速率，并且监控治疗形式的有效性。本发明参比同种型谱和对象同种型谱可包含在机器可读介质中，例如但不限于，模拟磁带如VCR、CD-ROM、DVD-ROM、USB闪存可读的那些等。此类机器可读介质还可包含额外测试结果，例如但不限于对临床参数和传统实验室风险因子的检测结果。

或者或此外，所述机器可读介质还可包含对象信息，例如病史和任何相关的家族史。所述机器可读介质还可包含与其他疾病风险算法和如本文所述那些计算指数相关的信息。定义

“精确度”指检测或计算的量(测试报告值)与其真实(或真)值的一致程度。临床精确度涉及真实结果的比例(真阳性(TP)或真阴性(TN)对比错误分类结果(假阳性(FP)或假阴性(FN))，并且可以描述为灵敏度、特异度、阳性预测值(PPV)或阴性预测值(NPV)，或作为可能性、让步比及其它度量。

“基线谱数据集”是与所需生物学条件下(用于数学标准化目的)从生物学样品(或样品群或集)的评价所获得的基因表达组(Gene Expression Panel)(PrecisionProfile^TM)的组成相关联的值的集。所需生物学条件可以是，例如，在接触试剂之前或在未治疗疾病存在下或在无疾病时的对象(或对象群或集)的条件。或者或此外，所述所需生物学条件可以是对象的健康状况，或对象群或集的健康状况。或者或此外，所述所需生物学条件可以是与基于年龄组、性别、种族、地理位置、营养史、医疗条件、临床指示剂、药物、体育运动、体重和接触环境之一选定的对象的群或集相关联的条件。

“FN”是假阴性，就疾病状态测试而言指将疾病对象错误分类为非疾病或正常。

“FP”是假阳性，就疾病状态测试而言指将正常对象错误分类为患病。

“公式”，“算法”或“模型”是任何数学方程式、算法、分析或编程方法、统计学技术、或比较，其采用一个或多个连续或分类输入(本文称为“参数”)并计算输出值(有时称为“指数”或“指数值”)。“公式”的非限制性示例包括：与参比值或谱的比较、求和、比率和回归算子(例如系数或指数)，值的转化和标准化(包括但不限于，基于临床参数如性别、年龄或种族的那些标准化方法)，规则和指导方针，统计分类模型，和在历史群上训练的神经网络。在组(panel)和组合构建中，特别感兴趣的是结构和句法统计分类算法，和风险指数构建的方法，使用模式认知特性，包括但不限于，已建立的技术，例如交叉相关、主成分分析(PCA)、因素轴转、逻辑回归(LogReg)、线性判别分析(LDA)、，Eigengene线性判别分析(ELDA)、支持向量机(SVM)、随机森林法(RF)、递归分割树(RPART)以及其他相关的决策树分类技术(CART、LART、LARTree、FlexTree等)、质心收缩法(SC)、StepAIC、K-means、K-邻近法(kth-nearest)、增强法(Boosting)、决策树、神经网络、贝叶斯网络、支持向量机和隐马尔可夫模型等。其他技术可以用于存活和时间事件风险分析，包含本领域技术人员已知的Cox、威布尔(Weibull)、卡普兰-迈耶和格林伍德(Greenwood)模型。

这些技术中的许多可与基因表达组(Precision Profile^TM)选择技术(例如向前选择、向后选择或逐步选择)、给定大小的所有可能组的完全列举、遗传算法、表决和委员会法(voting and committee method)联用，或其可以自身在其自己的技术中包括生物标志物选择法。这些可与信息规则结合，例如赤池信息标准(AIC)或贝叶斯信息准则(BIC)，以确定附加生物标记和模型改良之间的平衡，和有助于使过拟合最小化。所得预测模型可以在其他临床研究中验证，或在最初训练的研究中交叉验证，使用诸如自举法(Bootstrap)、弃一法(LOO)和10倍交叉验证(10倍CV)等技术。在多个步骤中，可以根据本领域已知技术通过值排列估计错误发现率(FDR)。

“指数”是算术上或数学上衍生的数字特征，其经开发以协助简化或公开或启发多于较多复杂定量信息的分析。可通过对相同生物学条件下的多个对象或样品运用特定算法来确定疾病指数或群指数。

“阴性预测值”或“NPV”用TN/(TN+FN)或所有阴性试验结果的真阴性分数计算。这还受疾病流行和待测试群体的测试前概率的内在影响。

参见例如O'Marcaigh A S，Jacobson R M，“Estimating The Predictive ValueOf A Diagnostic Test，How To Prevent Misleading Or Confusing Results(估计诊断检测的预测值，如何预防误导或混淆结果)”，Clin.Ped.1993，32(8)：485491，其讨论测试(例如临床诊断测试)的特异度，灵敏度，阳性和阴性预测值。通常，对于使用连续诊断试验检测的二元疾病状态分类方法，灵敏度和特异度根据Pepe等，Limitations of the OddsRatio in Gauging the Performance of a Diagnostic，Prognostic，or ScreeningMarker(测量诊断，预后或筛选标记性能的让步比的局限)，Am.J.Epidemiol2004，159(9)：882-890，由接受者工作特征曲线(ROC)总结，并且由曲线下面积(AUC)或c-统计总结，这是能表示在只有单一值的完整检测(或分析)分割点上试验、分析或方法的灵敏度和特异度的指示物。也参见，例如Shultz，“Clinical Interpretation Of Laboratory Procedures(实验室方法的临床解释)，”收录于Teitz，Fundamentals of Clinical Chemistry(《临床化学基础》)第14章，Burtis和Ashwood编，第4版，1996，桑德斯出版公司(W.B.SaundersCompany)，192199页；和Zweig等，“ROC Curve Analysis:An Example Showing TheRelationships Among Serum Lipid And Apolipoprotein Concentrations InIdentifying Subjects With Coronory Artery Disease(ROC曲线分析：在鉴定冠状动脉疾病对象中显示血清脂质和阿朴脂蛋白浓度关系的示例)，”Clin.Chem.，1992，38(8)：1425-1428。使用似然函数，让步比，信息理论，预测值，校准(包括适合度)，和重新分类检测的替代方法根据Cook，“Use and Misuse of the Receiver Operating CharacteristicCurve in Risk Prediction(风险预测中接受者工作特征曲线的使用和误用)，”Circulation2007，115：928-935进行总结。

“阳性预测值”或“PPV”用TP/(TP+FP)或所有阳性试验结果的真阳性分数计算。这受疾病流行和待测试群体的测试前概率的内在影响。

本发明内容中的“风险”涉及事件在特定时间段中会发生的可能性，并且可指对象的“绝对”风险或“相对”风险。绝对风险可参考相关时间队列的测量后的实际观察来测量，或参考由随后的用于所述相关时间段的统计学验证历史队列发展的指数值来测量。相对风险指对象的绝对风险相比低风险队列的绝对风险的比率(跨群体区分(例如三分位、四分位、五分位或十分位等))，或与平均群体风险的比率(其可视临床风险因子如何评估而不同)。让步比，给定测试结果的阳性事件与阴性事件的比例，也常用(优势根据公式p/(l-p)，其中p是事件的可能性且(1-p)是无事件可能性)于无转换(no-conversion)。

本发明内容中"风险评价"或"风险的评价"涵盖对事件或疾病状态可能发生的可能性、优势或可能，和/或所述事件或由一种疾病状态转换成另一种(即，从正常状态转变成癌症或从癌症消除转变成癌症，或从出现原发性癌症转变成出现癌症转移)的发生率作出预测。风险评价还可包含对未来临床参数、传统实验室风险因子值或其它癌症结果指数的预测(以关于先前测量群的绝对形式或相对形式)。此类区分应用可能需要基因表达组(Precision Profile^TM)组合与个体化组的不同组成、数学算法和/或截止点，但可对各希望的应用的精确度和性能进行相同的前述测量。

“灵敏度”用TP/(TP+FN)或疾病对象的真阳性分数计算。

“特异度”用TN/(TN+FP)或非疾病或正常对象的真阴性分数计算。

“统计学上显著”指改变大于单独偶然发生可预期(可以是“假阳性”)。统计学显著性可用本领域已知的任何方法测定。常用的显著性量度包括p值，其表示至少极限值在给定数据点获得结果的概率，假定该数据点是单独偶然结果。p值为0.05或更小的结果通常被认为具有高度显著性，p值为0.10或更小的结果通常被认为具有统计学显著性。此类p值显著依赖于所进行研究的效力。

“TN”是真阴性，就疾病状态测试而言指正确分类非疾病或正常对象。

“TP”是真阳性，就疾病状态测试而言指正确分类疾病对象。

现在，本发明已以所述说明书方式描述，本领域技术人员应认识到可以多种实施方式实践本发明，而上文的说明书和下文的实施例旨在说明而非限制本发明的权利要求。

实施例

提供以下实施例，包括执行的实验和获得的结果，仅用于说明目的，并且不构成对本发明的限制。

实施例1：通过对扩增的cDNA测序获得的同种型结果

本发明部分基于同种型分布图，这是由发明人在关于一般患者对比接受流感疫苗的患者的研究中比较同种型分布数据而注意到的。较早的数据(未显示)显示从接受流感疫苗前的患者分离的初始(Naive)B细胞中有大量IgM。接种疫苗后，血浆B细胞显示IgG是丰度最大的同种型。

基于这个现象，设计了如下研究以分析一般患者对比SLE患者中的同种型分布图。

方法：简言之，PBMC经分离并储存在液氮下的DMSO中。样品经速融并在磷酸盐缓冲盐水中迅速洗涤，然后提取总RNA。总RNA采用靶标特异性引物反转录以产生免疫球蛋白cDNA转录本。采用多重PCR扩增免疫球蛋白VDJ～Ig恒定区。制备扩增子以供测序，并采用454测序法(罗氏(Roche))测序。数据分析包括如下步骤：提取各同种型的Ig恒定区序列，并与给定样品的全部Ig同种型序列的总数作比较。

在一般患者和SLE患者的同种型分布数据中，不进行细胞分选，然而结果显示一般患者的IgM呈优势(初始B细胞占优势，因为系统处于免疫监控模式)。就SLE患者而言，同样不进行细胞分选，但结果显示IgG呈优势，指示活化血浆B细胞的较高水平。结果示于图1(正常样品(#1)的IgM占优势，通常是初始B细胞)。获自SLE患者的样品#2和#3的IgG占优势，通常是响应环境胁迫的血浆B细胞。图1右侧分图中提供多次运行的平均水平和疾病类型。该结果与红肿过程中获取的SLE样品一致，例如，预期观察到许多B细胞转化成血浆B细胞以产生IgG。

IgM与IgG的比指示个体是否处于调查模式(survey mode)或正在引发免疫应答。SLE患者的信号显示IgG和IgA同种型增加，而IgM和IgD同种型相比一般对象而言有所减少。从这些PBMC观察到的IgM水平与文献关于健康成人报道的60％一致(参见下文参考文献)。

参考文献的引用

参考文献与对其它文本(例如，专利、专利申请、专利公开、期刊、书籍、报纸、网络内容)的引用贯穿该公开内容使用。全部此类文本出于所有目的通过引用其全文纳入本文。

等同形式

本发明体现在其他特定形式中，而不偏离其精神或基本特性。因此认为前述实施方式在所有方面是说明性的，而不对本文所述发明构成限制。因此由附加的权利要求而不是前面描述指示发明的范围，并且因此意味着包含与权利要求等同含义和范围之内的所有改变。

Claims

1.用于测定人对象衍生的生物学样品的免疫球蛋白同种型表达谱的试剂和/或装置在制备用于确定所述免疫球蛋白同种型表达谱是否指示疾病状态的产品中的应用，其特征在于，所述产品用于包括如下步骤的方法：

(a).扩增从所述生物学样品获得的多种RNA核酸，其中所述RNA包含Ig同种型的恒定区序列，以生成包含免疫球蛋白恒定区序列的扩增子，其中所述生物学样品包含含有至少10,000个B细胞的多种不同细胞类型；

(b).采用每轮生成至少10,000个序列读数的测序技术在大规模平行测序反应中对所述扩增子进行测序；

(c).通过提取具有各同种型特征的Ig恒定区序列来分析获自(b)的序列数据，并比较各同种型的同种型序列数量，由此测定所述免疫球蛋白同种型表达谱；和

(d).确定所述免疫球蛋白同种型表达谱是否具有疾病状态的特征；

所述疾病状态是系统性红斑狼疮即SLE；

相较于具有健康成人特征的免疫球蛋白同种型表达谱，具有患有SLE的对象特征的免疫球蛋白同种型表达谱中IgG和IgA同种型增加，且IgM和IgD同种型减少。

2.如权利要求1所述的应用，其特征在于，所述扩增包括在步骤(b)之前从所述RNA获得cDNA。

3.如权利要求1所述的应用，其特征在于，步骤(a)中的扩增包括多重扩增反应，所述多重扩增反应采用与Ig恒定区序列杂交的1-10个引物和与Ig可变区序列杂交的10-60个引物。

4.如权利要求1所述的应用，其特征在于，所述生物学样品是血液或其成分。

5.如权利要求4所述的应用，其特征在于，所述血液生物学样品的大小是100μL或更少。

6.如权利要求4或5所述的应用，其特征在于，所述血液是外周全血。

7.如权利要求4或5所述的应用，其特征在于，所述生物学样品是包含外周血单核细胞的血液成分。

8.如权利要求1所述的应用，其特征在于，所述大规模平行测序反应是合成测序反应。

9.如权利要求8所述的应用，其特征在于，所述合成测序反应包括单分子测序。

10.如权利要求1所述的应用，其特征在于，所述扩增子包含免疫球蛋白VDJ区。