CN106029095A - 评估神经疾病的方法 - Google Patents

评估神经疾病的方法 Download PDF

Info

Publication number
CN106029095A
CN106029095A CN201480075681.6A CN201480075681A CN106029095A CN 106029095 A CN106029095 A CN 106029095A CN 201480075681 A CN201480075681 A CN 201480075681A CN 106029095 A CN106029095 A CN 106029095A
Authority
CN
China
Prior art keywords
disease
patient
sample
multiple sclerosis
methods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480075681.6A
Other languages
English (en)
Inventor
L·鲍
D·W·比格伍德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Theo Nicks Ji Co
DIOGENIX Inc
Original Assignee
Theo Nicks Ji Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Theo Nicks Ji Co filed Critical Theo Nicks Ji Co
Publication of CN106029095A publication Critical patent/CN106029095A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • G01N2800/285Demyelinating diseases; Multipel sclerosis

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了评估患者的神经疾病的方法与系统。所述神经疾病可以是脱髓鞘病,例如多发性硬化症。本发明提供了评估患者的脱髓鞘病的便捷且非侵入性的基于遗传学的方法,包括诊断脱髓鞘病、作为诊断排除脱髓鞘病、确定与脱髓鞘病相关的疾病活动性的存在和监测脱髓鞘病的疾病过程或者治疗效果。

Description

评估神经疾病的方法
相关专利的交叉引用
本申请要求2013年12月20日提交的美国临时专利系列No.61/918,919的利益,其整体通过引用结合到本文中。
技术领域
本发明一般地涉及神经疾病以及识别患者遗传序列的突变谱而确定神经疾病(包括脱髓鞘病)存在与否的能力的领域。
背景技术
在神经免疫学保护下的疾病不只是原型的免疫介导的中枢神经系统(CNS)和外周神经系统(PNS)障碍,例如多发性硬化症和重症肌无力(Coyle,Front Neurol.,Vol.2:37,2011)。神经免疫障碍代表了一系列可影响中枢神经系统和外周神经系统两者的疾病。免疫介导的神经障碍包括多种疾病、障碍和综合征。实例包括因为对突触成分的免疫反应性引起的广泛疾病和副肿瘤疾病。事实上所有的主要神经病症现在被认为具有免疫/炎性成分。免疫学治疗策略正在很多疾病中进行测试,包括阿尔兹海默病、脑血管疾病、癫痫症和帕金森病。
免疫介导的神经疾病整体来说带来了很多巨大的挑战。个别来说,这些疾病的发病率极低,且因此,公众和很多内科医生对其的认识或者理解都很少。考虑到对神经疾病的认识或者理解的缺乏,其诊断也成为了挑战。由于这些疾病在没有前兆的情况下发生并快速进展,如有些患者几乎即时发生严重病态,这为精准诊疗增大了挑战性。因此,患者具有很少时间来做决定,且医生与研究者也很少有机会进行干预。
免疫介导的神经疾病在诊断上可能是巨大挑战。诊断的途径在不同医院及不同的实践小组之间经常是不一样的。这类疾病的精准诊断需要详细的临床评估和适当靶向的诊断测试,例如神经生理测试、神经成像、血液检查和有时脑脊液评估。对于患者。还没有用于确定免疫介导的神经疾病存在与否的单一诊断方法。
研究最多的免疫介导的神经疾病之一是多发性硬化症(MS)。多发性硬化症是一种影响中枢神经系统的疾病,且可能从相对良性到一定程度的失能到毁灭性的。在多发性硬化症中,包围神经细胞的髓鞘受损或者被破坏,从而影响神经元将电脉冲传导到大脑和从大脑传导电脉冲的能力且留下瘢痕组织(称为硬化)。这些受损区域也称为“斑块”或者“病灶”。
多发性硬化症的早期症状通常出现在20到40岁之间,并包括视力模糊或者复视、红绿色失真或甚至单眼的失明。多数的多发性硬化症患者经历四肢的肌无力及协调和平衡的困难。在严重的病例中,多发性硬化症可导致部分或者全身瘫痪。感觉异常(麻木、刺痛或者手脚麻木)、语言障碍、颤抖和眩晕是多发性硬化症的常见症状。几乎一半的多发性硬化症患者经历认知受损。
多发性硬化症的诊断很复杂,因为没有单一的检验可以确认为多发性硬化症的存在。诊断多发性硬化症的过程往往包括患者的病史、临床检查以及一种或多种实验室检验的标准,所有这三项对于排除造成症状的其它可能原因和/或对于收集足以诊断多发性硬化症的事实是必要的。
磁共振成像(MRI)是一种优选的测试方法。MRI可以检测可能由多发性硬化症在患者中枢神经系统组织中造成的斑块或者瘢痕。然而,异常MRI并不一定指示多发性硬化症,因为脑中的病灶可能与其它的疾病有关。另外,斑点也可能在健康个体中发现,尤其是在健康的老年人中。这些斑点叫做UBO,即未明亮物体(unidentified bright object),且不与进行中的疾病过程相关。还有,正常MRI也不能绝对排除多发性硬化症的存在。大约5%的基于其它的标准被确认具有多发性硬化症的个体没有可通过MRI检测的脑损伤。这些个体可在脊髓中具有损伤,或者可具有不能通过MRI检测的损伤。
尽管多发性硬化症的诊断可基于对症状、征兆和MRI结果的评估,也可以指定其它的测试,它们包括大脑皮质诱发电位、脑脊液和血液测试。例如,脑脊液通过腰椎穿刺取样,并检测其免疫系统蛋白水平以及叫做“寡克隆带”的抗体染色谱的存在。寡克隆带指示中枢神经系统中的免疫反应,且在90-95%的多发性硬化症患者的脊髓液中被发现。然而寡克隆带也与多发性硬化症之外的疾病相关,且因此仅仅寡克隆带的存在不是多发性硬化症确定性的。同样也没有多发性硬化症的确定性的血液测试,但是血液测试可排除各种神经病学症状的其它可能原因,例如莱姆病、胶原血管病、罕见的遗传疾病以及艾滋病。
一般地多发性硬化症的诊断需要:(1)至少两个髓鞘损失区域或者脱髓鞘病灶的客观证据,其“在时间和空间上分离”(在脑、脊髓或者视神经内的不同地点-在不同的时间点发生的病灶);以及(2)所有可以产生相似神经症状的其它疾病已经被客观地排除。在(1)和(2)没有都满足的时候,医生不能进行多发性硬化症的确定诊断。
当个人去看医生时,根据存在的临床问题,可进行上述的一个或者多个测试。有时候在几个月时间内进行几次测试来帮助收集必要信息。确定的多发性硬化症诊断必须符合McDonald诊断标准,其根据著名神经学家W.Ian McDonald命名的,他发起了社区支持的工作以更加快速和准确地进行多发性硬化症的诊断过程。
多发性硬化症具有一些明显的临床病程,被称为复发-缓解型多发性硬化症、继发-进展型多发性硬化症、进展-复发型多发性硬化症和原发-进展型多发性硬化症。复发-缓解型多发性硬化症特征在于明确限定的急性发作(复发),通常伴随完全或者部分恢复,且在发作之间没有疾病进展。继发-进展型多发性硬化症最初是复发-缓解型的,但是变成持续地以不同的速度进展,过程中有或者没有偶尔的复发。改善病情的药物治疗被认为对持续具有复发的患者提供益处。原发-进展型多发性硬化症特征可以在于的特点从很少或者没有缓解期的开始的疾病进展。进展-复发型多发性硬化症先生在于从开始的疾病进展,但是过程中有明显的急性复发。
因为免疫介导的神经疾病可存在相似的症状,因此本领域中需要不仅能诊断患者的免疫介导的神经疾病,而且可区分一种特定类型的神经疾病与另一种特定神经疾病的方法。需要在病程中尽可能早的准确诊断,使得可以指定有效的治疗方案。另外,对一种类型的神经疾病可能有效的治疗却可能加重或者加速另一类型的神经疾病的进展。因此,需要尽可能早检测神经疾病并提供用于区分神经疾病的不同形式的区分诊断的更精确方法。
发明内容
本发明部分地基于特定的遗传特征能可靠地预测患者中神经疾病的存在的发现。因此,本发明通过并型的方便且非侵入性的遗传测试的使用提供检测患者的神经疾病(包括脱髓鞘疾病,例如多发性硬化症)的方法。
在一个实施方式中,本发明提供了一种方法用于检测患者的神经疾病(包括免疫介导的神经疾病和/或者脱髓鞘疾病)的方法,包括确定患者样品的VH4基因序列中,在多个VH4密码子位置处的突变谱,其中该突变谱包含多个以下突变的频率或出现百分率:S31AL、G44W、H40Y、S28Y、Y58C、T57K、Y58E、Y32A、S62F、P40A、G35A、N60E、G27S、S62P、H53L、Y53P、V24G、G26R、W36S、L20R、K81L、Q39E、R73W、T73V、T17M、W36L、P41T、S65G;并且基于突变谱利用计算机执行的分类器算法将样品按照神经疾病存在与否进行分类。可以确定至少5个、至少10个或者至少15个突变的频率或者出现百分率。在一些实施方式中,确定至少20个或者至少25个突变的频率或者出现百分率。在某些实施方式中,确定所有的突变。在一些实施方式中,在选自密码子17、20、24、26、27、28、31A、32、35、36、39、40、41、44、53、57、58、60、62、65、73和81的一个、多个或者所有VH4密码子位置处确定突变。
在一些实施方式中,神经疾病是脱髓鞘疾病。在某些实施方式中,脱髓鞘疾病是多发性硬化症(MS)。
在一些实施方式中,所述的计算机执行的分类器算法可以是用与健康对照(例如没有诊断出神经疾病的人)相比的多发性硬化症患者中的突变频率或者百分率训练的分类器算法。在其它实施方式中,所述的计算机执行的分类器算法可以是用与患有其它神经疾病(例如其它免疫介导的神经疾病)的患者相比的多发性硬化症患者中的突变频率或者百分率训练的分类器算法。在某些实施方式中,所述的计算机执行的分类器是k-最邻近(KNN)算法。在此类实施方式中,k可以是至少4,至少5,至少6,至少7或者至少8。在其它的实施方式中,所述的计算机执行的分类器是一种最高得分对(TSP)算法。
在其它的实施方式中,本发明提供了一种检测患者的多发性硬化症的方法,包括确定患者样品的VH4基因中密码子17到81处的序列;计算选自S31AL、G44W、H40Y、S28Y、Y58C、T57K、Y58E、Y32A、S62F、P40A、G35A、N60E、G27S、S62P、H53L、Y53P、V24G、G26R、W36S、L20R、K81L、Q39E、R73W、T73V、T17M、W36L、P41T、S65G的至少5个突变的频率或者出现百分率;并通过k-最邻近(KNN)算法按照多发性硬化症的存在与否对样品进行分类。k可以是至少4,至少5,至少6,至少7或者至少8。在一些实施方式中,k-最邻近算法用多发性硬化症患者相对于健康对照和/或患有其它神经疾病的患者的突变频率或者百分率训练。
在本发明方法的某些实施方式中,所述分类步骤确定活动性疾病、疾病进展或者疾病复发。在其它的实施方式中,所述分类步骤确定疾病缓解或者疾病控制。在特定的实施方式中,所述疾病是脱髓鞘疾病,例如多发性硬化症。在有些实施方式中,所述分类步骤可以确认或者排除对特定类型的神经疾病的诊断。例如,所述分类步骤可以确认多发性硬化症或者排除多发性硬化症。
在再其它的实施方式中,本发明提供了一种检测患者的脱髓鞘疾病的方法,包括检测患者样品的VH4序列中位置16的IGVH4-34和位置34的IGHF4-4处的突变;和如果位置16的IGVH4-34的突变频率或者百分率比位置34的IGHF4-4高,那么患者分类为患有脱髓鞘疾病。在某些实施方式中,所述脱髓鞘疾病为多发性硬化症。
在本发明的方法中分析的患者样品可以是血液样品、脑脊液样品、尿液样品或者其部分。在一个实施方式中,所述患者样品为脑脊液。在另一个实施方林中,所述患者样品为血液样品。在有些实施方式中,所述样品可以从正在进行多发性硬化症治疗的患者或者患有临床孤立综合征的患者获得。
在本发明的方法的一些实施方式中,突变和突变谱可以通过核酸测序方法、定量聚合酶链反应(q-PCR)、杂交试验或者核酸内切酶分析检测。
在一些实施方式中,本发明的方法进一步包括根据一个或者多个分类算法的结果进行多数投票预测(majority voting prediction)。
本发明的目的是提供用于更加客观、确定和快速诊断的免疫介导的神经疾病(包括多发性硬化症)的便捷诊断测试。本发明的另一目的是提供监测免疫介导的神经疾病的进展、治疗适当性和/或治疗反应的诊断测试。
本发明的其它目的从本发明的以下描述会是明确的。
附图说明
图1:用最高得分对(TSP)算法选择的“IGHV4-34@16”和“IGHV4-4@34”的曲线图,其中每一个加号代表分类为患有其它神经疾病(OND)的患者,每一个圆圈代表分类为患有复发/缓解型多发性硬化症(RMMS)的患者。分类规则允许在“IGVH4-34@16”处的突变分数比“IGHF4-4@34”的突变分数高(高于对角线)或者相反的情况下确定患者患有复发/缓解型多发性硬化症(RMMS)的概率。
具体实施方式
本发明提供一种用于诊断患者的免疫介导神经疾病(IMND)的方便且非侵入性的基于遗传学的测试。发明者在抗体重链基因中鉴定了可以用来诊断神经疾病(包括脱髓鞘疾病,例如多发性硬化症(MS))的突变谱。
正常的免疫系统能够产生具有不同结合抗原能力的数百万抗体。这种多样性是由于构建免疫球蛋白分子的复杂性造成的。这些分子由配对的多肽链(重链和轻链)构成,每一条链包含恒定区和可变区。重链和轻链可变区的结构由免疫球蛋白V基因指定。重链可变区源自于称为VH、D和JH的三个基因片段。在人体中,有大约100种不同的VH片段,20多种D片段以及6种JH片段。轻链基因只有两种片段,VL和JL片段。抗体的多样性是VH/D/JH片段与叠加的VLJL组分的随机组合的结果,其上存在着几种作用机制包括连接多样性和体细胞突变。
种系VH基因可以基于前95~101个氨基酸的DNA核苷酸序列同性分为至少6个家族(VH1到VH6)。同一家族的成员通常具有小于或等于80%的序列同一性,而不同家族的成员同一性小于70%。这些家族的大小从一个VH6基因到预计超过45个VH3基因。另外,存在很多的假基因。染色体上VH基因座14q32.13.15的物理图谱已经接近完成。现在估计人类VH基因库由大约50个功能性VH片段及大约同等数量的假基因代表。基因的VH4家族包含9个不同的成员:4-04、4-28、4-30、4-31、4-34、4-39、4-59、4-61和4-B4。
本发明是部分地基于鉴别患者的VH4基因序列的某些密码子中与该患者中神经疾病的存在相关的突变。因此,在一个实施方式中,本发明提供了一种用于检测患者的神经疾病的方法,其包括确定患者样品的VH4基因序列中,在多个VH4密码子位置处的突变谱,和以该突变谱为基础利用计算机执行的分类器算法将样品按照神经疾病存在与否进行分类。在某些实施方式中,多个VH4密码子位置包括密码子17到81。例如,多个VH4密码子位置可以包括密码子17、20、24、26、27、28、31A、32、35、36、39、40、41、44、53、57、58、60、62、65、73和81中的一个或者多个。在一些实施方式中,所述突变谱从所有VH4密码子位置17、20、24、26、27、28、31A、32、35、36、39、40、41、44、53、57、58、60、62、65、73和81确定。
从多个密码子位置的VH4基因序列确定的突变谱包括选自S31AL、G44W、H40Y、S28Y、Y58C、T57K、Y58E、Y32A、S62F、P40A、G35A、N60E、G27S、S62P、H53L、Y53P、V24G、G26R、W36S、L20R、K81L、Q39E、R73W、T73V、T17M、W36L、P41T和S65G的多个突变的频率或者出现百分率。在一些实施方式中,S31AL突变包含密码子31A处导致表达亮氨酸而非原来的丝氨酸的突变。因此,在一些实施方式中,用于检测患者的神经疾病的方法包括确定患者样品中多个密码子(例如密码子17~81)处VH4基因的序列以鉴别相对于种系VH4序列的突变,并且计算选自S31AL、G44W、H40Y、S28Y、Y58C、T57K、Y58E、Y32A、S62F、P40A、G35A、N60E、G27S、S62P、H53L、Y53P、V24G、G26R、W36S、L20R、K81L、Q39E、R73W、T73V、T17M、W36L、P41T和S65G的2个或更多个突变的频率或者出现百分率。在某些实施方式中,突变谱包含这些特定突变中至少5个或者至少10个的频率或者出现百分率。在其它的实施方式中,突变谱包含这些特定突变中至少15个或者至少20个的频率或者出现百分率。在再其它的实施方式中,突变谱包含这些特定突变中至少25个的频率或者出现百分率。在一个特定的实施方式中,突变谱包含所有这些特定突变的频率或者出现百分率。
可以利用本发明的方法在患者样品中检测的神经疾病包括免疫介导的神经疾病(IMND)。免疫介导的神经疾病包括其中免疫系统的至少一个组分针对宿主中枢或外周神经系统中存在的宿主蛋白发生反应并造成疾病病理。免疫介导的神经疾病可包括,但不限于,脱髓鞘疾病、副肿瘤神经综合征、免疫介导的脑脊髓炎、免疫介导的自主神经病、重症肌无力、自身抗体相关的脑病和急性播散性脑脊髓炎。其它神经疾病最近被认为包括炎性成分。例如,阿尔茨海默病、帕金森病、脑血管病、癫痫和中枢神经系统感染现在特别地被认为涉及神经炎症(Coyle,Front Neurol.,Vol.2:37,2011)。
因此,通过本发明的方法评估的患者可以已知患有免疫介导的神经疾病,可以基于一个或多个免疫介导的神经疾病样症状或一个或多个免疫介导的神经疾病相关的临床检验的结果而怀疑患有免疫介导的神经疾病,或者可能正开始或正在接受免疫介导的神经疾病的治疗。在本发明的各个方面,本发明帮助诊断免疫介导的神经疾病或者作为诊断排除免疫介导的神经疾病、确定免疫介导的神经疾病的疾病活动性、或者监测免疫介导的神经疾病或者与免疫介导的神经疾病一致的脱髓鞘疾病的进展或者确定免疫介导的神经疾病治疗的效果。
在某些实施方式中,可以用本发明的方法检测或诊断的免疫介导的神经疾病是脱髓鞘疾病。脱髓鞘疾病包括,但不限于,多发性硬化症、德维克氏病(即视神经脊髓炎)、脑桥中央髓鞘溶解症、进行性多灶性白质脑病、脑白质营养不良、格林-巴利综合征、进行性炎症性神经病变、进行性神经性腓骨肌萎缩症、慢性炎症性脱髓鞘性多神经病和抗MAG外周神经病变。
在一些实施方式中,用于检测患者的脱髓鞘疾病的方法包括检测患者样品的VH4序列中,在某些IGVH4基因的特定密码子位置处的突变。例如,在一个实施方式中,用于检测患者的脱髓鞘疾病的方法包括检测患者样品的VH4序列中密码子位置16的IGVH4-34和密码子位置34的IGVH4-4处的突变,并且如果密码子位置16的IGVH4-34处的突变频率或者百分率比密码子位置34的IGVH4-4高,则将患者分类为患有脱髓鞘疾病。在一些实施方式中,脱髓鞘疾病为多发性硬化症。
在其它实施方式中,用于检测患者的多发性硬化症的方法包括确定患者样品的VH4基因中多个密码子(例如,密码子17~81)的序列,计算选自S31AL、G44W、H40Y、S28Y、Y58C、T57K、Y58E、Y32A、S62F、P40A、G35A、N60E、G27S、S62P、H53L、Y53P、V24G、G26R、W36S、L20R、K81L、Q39E、R73W、T73V、T17M、W36L、P41T和S65G的至少5个突变的频率或者出现百分率;和通过分类器算法如K-NN算法或者TSP算法按照多发性硬化症的存在与否对样品进行分类。在一些实施方式中,计算了这些特定突变中至少5个或者至少10个的频率或者出现百分率。在其它的实施方式中,计算了这些特定突变中至少15个或者至少20个的频率或者出现百分率。在再其它的实施方式中,计算了这些特定突变中至少25个的频率或者出现百分率。在一个特别的实施方式中,计算了所有这些特定突变的频率或者出现百分率。
在一些实施方式中,本文所述的方法用于检测或诊断呈现免疫介导的神经症状的患者的多发性硬化症。多发性硬化症是中枢神经系统(脑和脊髓)的最常见的疾病之一。其是与脱髓鞘或髓鞘损失相关的炎性病症。髓磷脂(神经绝缘的脂肪材料)作为绝缘体发挥作用以允许神经从一个点传输脉冲到另一个点。在多发性硬化症中,髓鞘的损失伴随着神经元将电脉冲传导到大脑和从大脑传出的能力的破坏,且这导致各种多发性硬化症的症状,如视觉、肌肉协调、力量、感觉、言语和吞咽、膀胱控制、性和认知功能的受损。其中髓鞘发生损失的斑块或病灶表现为硬化的、瘢痕样区域。这些瘢痕在不同时间和在大脑和脊髓的不同区域出现,因此术语“多发性”硬化症字面上就是指许多瘢痕。
在该方法的某些实施方式中,患者疑似患有多发性硬化症。例如,患者可能基于与多发性硬化症一致的神经和/或免疫学症状而疑似患有多发性硬化症。多发性硬化症的症状包括,例如,感官、运动、视觉或本体感觉系统改变,具有四肢中一个或多个的麻木或无力(通常一次在身体的一侧或身体的下半部分发生),视力的部分或完全丧失(通常一次在一只眼睛中和通过在眼球运动过程中出现疼痛),复视或视力模糊,在身体的麻木区域中的刺痛或疼痛,在某些头部动作时出现的电击感,颤抖,缺乏协调或不稳定步态,疲劳,头晕,肌肉僵硬或痉挛,口齿不清,瘫痪,膀胱、直肠和性功能的问题及相对于医疗标准的心理变化(如健忘或注意力难以集中)的至少一种。
在某些实施方式中,患者被诊断为患有多发性硬化症。一般地,常规的多发性硬化症诊断依赖于两个标准。首先,必须有间隔至少一个月的两次发作。发作,也称为恶化、爆发或复发,是一种或者多种多发性硬化症症状的突然出现或者恶化,其持续至少24小时。第二,必须存在中枢神经系统髓鞘的一个以上的损伤区域。髓鞘的损伤必须在多于一个时间点出现,并且不是由任何其它可导致脱髓鞘疾病或者类似神经症状的疾病引起。
在其它实施方式中,通过本文所述方法评估的患者对于寡克隆带的存在可以是阳性的。在这些和/或其它实施方式中,患者可具有多发性硬化症特征性的中枢神经系统病变,其可在磁共振图像(MRI)上观察到。磁共振成像是目前脑成像以检测由多发性硬化症造成的斑块或瘢痕的存在的优选方法。在另一个实施方式中,患者可表现出与脱髓鞘疾病一致的诱发电位(可以揭示中枢神经系统传导时间的延迟的电诊断研究)。在一些实施方式中,患者可能正在经历多发性硬化症的治疗,即接受例如,用β-干扰素、醋酸格拉替雷、米托蒽醌或那他珠单抗的治疗。
在本发明方法的一些实施方式中,患者患有临床孤立综合征(CIS)。患有临床孤立综合征的患者经历首段的神经症状,其持续至少24小时且由中枢神经系统中一个或多个部位的炎症和脱髓鞘引起。该段神经症状可以是单灶性的,其中患者出现单一的神经体征或症状。该段神经症状可以多灶性的,其中患者出现多于一种体征或症状。在本文中所述的方法的某些实施方式中,确定患有临床孤立综合征的患者发生多发性硬化症的可能性。在相关的实施方式中,所述方法确认或排除患有临床孤立综合征的患者的多发性硬化症诊断。
在本文所述方法提供的诊断或预测的基础上,可以执行、结束或者修改用于治疗免疫介导的神经紊乱的治疗方案。特别地,被诊断为患有多发性硬化症或者具有发生多发性硬化症的风险的患者可以开始治疗多发性硬化症的治疗方案。治疗的主要目的是在发作后恢复功能、防止新的发作和预防失能。MS的治疗方案包括,但不限于,免疫调节治疗(例如,β-干扰素)、醋酸格拉替雷(CopaxoneTM)、免疫抑制剂(例如,米托蒽醌)和那他珠单抗(商品名TysabriTM)。在多发性硬化症作为诊断被排除的情况下,患者不给予多发性硬化治疗。
适用于本发明方法的患者样品可以是血液样品(例如,全血样品、外周血单核细胞)、淋巴液样品、脑脊液样品(CSF)、尿液样品或上述任何样品的部分。在一些实施方式中,患者样品是血液样品。在其它实施方式中,患者样品是脑脊液。在再其它的实施方式中,患者样品是含有B细胞的液体或组织。
确定基因的核苷酸序列和检测突变的方法是本领域技术人员已知的。一些示例的方法在本文中描述并包括直接DNA测序、杂交分析、基于聚合酶链反应(PCR)的分析和核酸内切酶分析。
可以通过直接从个体中存在的基因的一个或者两个拷贝扩增包含特定位点(例如突变位点)的目标区域确定该位点的核苷酸(或核苷酸对)的身份,和通过常规方法确定扩增区域的序列。
目标区域可以使用任何寡核苷酸定向扩增方法进行扩增,包括但不限于各种PCR方法,如定量PCR和RT-PCR、连接酶链反应(LCR)和寡核苷酸连接分析(OLA)。在这类方法中可用作引物或探针的寡核苷酸应特异性地与包含一个或多个目标位点或与目标位点相邻的核酸区域杂交。其它已知的核酸扩增程序可用于扩增目标区域,包括基于转录的扩增系统和等温法。
目标区域中的一个或多个突变也可以在扩增之前或之后使用本领域中已知的几种基于杂交的方法之一进行测定。通常,等位基因特异性的寡核苷酸用于执行此类方法。等位基因特异性的寡核苷酸可以用作差异标记的探针对,其中该对的一个成员显示与目标序列的一个变体完全匹配,且另一个成员显示与不同变体完全匹配。在一些实施方式中,可以使用一组等位基因特异性的寡核苷酸或寡核苷酸对同时检测超过一个突变位点。
等位基因特异性的寡核苷酸与靶多核苷酸的杂交可以与溶液中的这两种实体进行,或这种杂交可以在寡核苷酸或者靶多核苷酸共价或非共价地固定于固体载体上时进行。连接可以通过,例如,抗体-抗原相互作用、多聚-L-赖氨酸、链霉亲和素或亲和素-生物素、盐桥、疏水相互作用、化学连接、紫外交联烘烤(UV cross-linkingbaking)等介导。等位基因特异性寡核苷酸可直接在固体载体上合成或在合成后连接到固体载体上。适用于本发明的检测方法中的固体载体包括由硅、玻璃、塑料、纸等制成的基质,其可以形成,例如,孔(如在96孔板中)、载片、薄片、膜、纤维、芯片、盘和珠。固体载体可以进行处理、涂覆或衍生化以利于等位基因特异性寡核苷酸或者靶核酸的固定。
个体基因中一个或多个突变位点的基因型也可以通过基因的一个或两个拷贝或者其片段与核酸阵列和亚阵列的杂交确定。阵列包含一组等位基因特异性的寡核苷酸,其代表待包括在基因型或单倍型中的各个突变位点。
多态性或突变的身份也可以使用错配检测技术确定,包括但不限于使用RNA探针(riboprobe)和识别核苷酸错配的蛋白质(例如大肠杆菌mutS蛋白)的核糖核酸酶保护法。或者,变体等位基因可以通过单链构象多态性(SSCP)分析(Orita等,1989;Humphries等,1996)或者变性梯度凝胶电泳(DGGE)(Wartell等,1990;Sheffield等,1989)鉴别。
聚合酶介导的引物延伸方法也可用于鉴别多态性或突变。包含多态性或突变的延伸引物可以通过质谱检测。另一种引物延伸方法是等位基因特异性PCR。在一些实施方式中,可以存在特定的核酸酶切割位点,且特定核苷酸序列的检测可以通过核酸切割的存在或不存在来确定。
设计为与对应于可变重链基因座、其变体和片段的核酸选择性杂交的引物对在允许选择性杂交的条件下与模板核酸链接触。根据所需的应用,可以选择只允许与引物序列完全互补的序列杂交的高严格性杂交条件。在其它实施方式中,杂交可以在降低的严格性下发生以允许包含与引物序列的一个或多个错配的核酸的扩增。一旦杂交,模板-引物复合体与促进模板依赖性的核酸合成的一种或多种酶接触。进行多轮扩增,也被称为“循环”,直到产生足够量的扩增产物。
扩增产物可被检测、分析或定量。在某些应用中,检测可以通过视觉手段进行。在某些应用中,检测可以包括通过化学发光、掺入的放射性标记或荧光标记的放射性闪烁成像或者甚至通过使用电和/或热脉冲信号的系统直接鉴定。
多种模板依赖性的方法可用于扩增在给定的模板样品中存在的寡核苷酸序列。已知的最好扩增方法之一是PCR,其是在文献中公知的技术。
引物延伸(其可作为独立的技术或结合其它方法(例如PCR)使用)需要标记的引物(通常长度20-50个核苷酸),其与基因5’端附近的区域互补。该引物允许与RNA退火,且逆转录酶用来合成RNA的互补cDNA直到它达到RNA的5’端。
在等温扩增法(其中限制性内切酶和连接酶用来实现在限制性位点的一条链中包含核苷酸5’-[α-硫基]三磷酸的靶分子的扩增)也可以用于本发明中的核酸扩增(Walker等,1992)。链置换扩增(SDA)法(在美国专利5916779中公开)是实现核酸的等温扩增的另一种方法,其包括多轮链置换和合成,即切口平移。
其它核酸扩增程序包括基于转录的扩增系统(TAS),包括基于核酸序列的扩增(NASBA)和3SR(Kwoh等,1989;PCT申请WO88110315,其整体通过引用结合到本文中)。欧洲专利申请329 822公开了一种包括循环地合成单链RNA(“ssRNA”)、ssDNA和双链DNA(dsDNA)的核酸扩增方法,其也可以根据本发明使用。PCT申请WO 89/06700(其整体通过引用结合到本文中)公开了一种基于启动子区域/引物序列与目标单链DNA(ssDNA)的杂交接着该序列的许多RNA拷贝的转录的核酸序列扩增方案。该方案不是循环的,即新的模板不从所得的RNA转录本产生。其它的扩增方法包括“RACE”和“单侧PCR”(Frohman,1990;Ohara等,1989)。
实时聚合酶链反应,也称为实时定量聚合酶链反应(qPCR)或动力学聚合酶链反应,是一种基于聚合酶链反应的技术,其用于扩增并同时量化目标DNA分子。它使得能够同时检测和定量DNA样品中的特定序列(作为绝对拷贝数或者针对通过加入DNA输入或另外的归一化基因标准化时的相对量)。两种常见的定量方法是使用可嵌入双链DNA的荧光染料及在与互补DNA杂交时发荧光的修饰DNA寡核苷酸探针。
经常地,实时聚合酶链反应结合逆转录聚合酶链反应以定量低丰度信使RNA(mRNA),使得研究人员能够定量特定的时间或者在特定细胞或组织类型中的相对基因表达。虽然实时定量聚合酶链反应通常作为RT-PCR销售,但它不应与也被称为RT-PCR的反转录聚合酶链反应混淆。
在一些实施方式中,扩增产物在分离或不分离的情况下可视化。典型的可视化方法包括用溴化乙锭对凝胶染色和在紫外灯下使条带可视化。或者,如果扩增产物用放射性或荧光定量标记的核苷酸整体地标记,分离的扩增产物可暴露于X射线胶片或在合适的激发光谱下可视化。
在一个实施方式中,在分离扩增产物后,将标记的核酸探针与扩增的标志物序列接触。该探针可与发色团偶联,但可以被放射性标记。在另一个实施方式中,探针与结合伴体偶联,如抗体或生物素,或携带可检测部分的另一结合伴体。
在一个实施方式中,检测是通过DNA印迹和与标记探针的杂交。涉及DNA印迹的技术是本领域技术人员公知的(参见Sambrook等人,2001)。其它可用于实施本发明的核酸检测方法公开于美国专利5,840,873、5,843,640、5,843,651、5,846,708、5,846,717、5,846,726、5,846,729、5,849,487、5,853,990、5,853,992、5,853,993、5,856,092、5,861,244、5,863,732、5,863,753、5,866,331、5,905,024、5,910,407、5,912,124、5,912,145、5,919,630、5,925,517、5,928,862、5,928,869、5,929,227、5,932,413和5,935,791,其每一种整体通过引用结合到本文中。
靶基因序列中的多态性或突变也可通过基于核酸内切酶的分析检测,如限制性片段长度多态性(RFLP)分析。检测多态性或突变的其它方法包括,但不限于,位点或区域的直接或间接测序,使用其中位点的相应等位基因建立或破坏限制性酶切位点的限制性内切酶,使用等位基因特异性的杂交探针,使用对于通过多态性或突变的不同等位基因编码的蛋白特异性的抗体,或者任何其它生物化学解释。
最常用的表征多态性或突变的方法是对侧邻和包含多态性或突变的遗传位点进行直接DNA测序。此种分析可以采用“双脱氧的链终止法”(也称为“桑格法”)(Sanger等,1975),或“化学降解法”(也称为“马克萨姆-吉尔伯特法”)(Maxam等,1977)完成。与基因组序列特异性的扩增技术如聚合酶链反应结合的测序可用于促进所需基因的恢复。下一代测序方法,包括大规模平行签名技术、焦磷酸测序、连接测序等,也可用于检测目标VH4基因序列中的突变。
本领域中已知的任何合适方法,如上面所述的那些,可用于实施本发明的方法以确定患者样品VH4基因序列中的突变谱或检测特定的突变。在一些实施方式中,突变谱或突变通过样品中VH4基因的核酸测序确定。在其它实施方式中,突变谱或突变通过杂交试验确定。在再其它的实施方式中,突变谱或突变通过定量PCR确定。仍在其它的实施方式中,突变谱或突变通过核酸内切酶分析测定。
在本发明方法的一些实施方式中,患者样品中确定的突变谱用计算机执行的分类器算法进行神经疾病(包括脱髓鞘疾病,如多发性硬化症)存在或不存在的评估。该算法可能需要基于样品中确定的突变谱和诊断有神经疾病(例如,MS)的患者中的突变谱与健康对照或者其它神经疾病患者中的突变谱之间的相关性对样品进行分类。例如,样品可以基于免疫介导神经疾病(例如多发性硬化症)患者相对于非免疫介导神经疾病群体(例如以健康对照的群体或者患有其它神经疾病例如多发性硬化症以外的其它神经疾病的群体)中多个特定突变的频率或者百分率来进行分类。用于将样品在两个或更多个种类或组之间分类的各种分类方案是已知的,且它们包括,但不限于:主成分分析法、朴素贝叶斯法、支持向量机法、最邻近法、决策树法、逻辑法、人工神经网络法、惩罚Logistic回归法和基于规则的方案。此外,多个模型的预测结果可以结合以产生整体预测。例如,“多数规则”或“多数表决”预测可以由朴素贝叶斯模型、支持向量机模型和最邻近模型的输出产生。
因此,可以构造分类算法或“类预测器(class predictor)”来分类样品。用于准备合适的类预测器的方法在R.Simon,Diagnostic andprognostic prediction using gene expression profiles inhigh-dimensional microarray data,British Journal of Cancer(2003)89,1599-1604中综述,其整体通过引用结合到本文中。
在本发明方法的一些实施方式中,计算机执行的分类器算法是k-最邻近算法。KNN是基于实例的学习的类型,其中函数只是局部地接近,且所有计算递延直至分类。KNN算法的输入由在特征空间中的k个最近实例组成。当KNN算法用于分类时,输出是类成员。对象通过其近邻的多数投票分类,使此对象被分配到其k个最接近近邻中最常见的类。当KNN算法用于回归时,输出是该对象的属性值。该值是其k个最接近近邻的值的平均。在本发明方法的某些实施方式中,k至少为4或至少为5。在其它实施方式中,k至少为6或至少为7。在特定的实施方式中,k至少为8。在本方法的一些实施方式中,k为6。在本方法的其它实施方式中,k为8。
对于分类和回归,近邻的贡献可以加权,使得较接近的近邻比较远的近邻对于该平均的贡献更多。权重方案可以包括对每个近邻给予1/d的权重,其中d是与该近邻的距离。近邻从类(对于KNN分类)或者对象属性值(对于KNN回归)已知的对象集获取。这一对象集可以被认为是该算法的训练集。然而,并不需要训练步骤。如果距离度量利用专门的算法如大间隔最近邻(Large Margin NearestNeighbor)或近邻元分析(Neighborhood components analysis)进行学习,可以提高KNN的分类精度。
在本发明方法的某些实施方式中,KNN算法利用免疫介导神经疾病患者相对于健康对照的突变频率或百分率进行训练。在本方法的其它实施方式中,KNN算法利用免疫介导神经疾病患者相对于其它免疫介导神经疾病患者的突变频率或百分率进行训练。在再其它的实施方式中,KNN算法利用多发性硬化症患者相对于健康对照和/或其它免疫介导神经疾病患者的突变频率或百分率进行训练。因此,在一些实施方式中,KNN分类器算法确定从患者样品的VH4基因确定的突变谱与来自多发性硬化症患者群体的突变谱相对于来自健康对照或者其它神经疾病患者的突变谱之间的相关性。该算法的训练集可以是具有特定病程如复发-缓解型MS、继发-进展型MS、进展-复发型MS和原发进展型MS的多发性硬化症患者的VH4突变谱。因此,在一些实施方式中,KNN算法的应用可以确定患者中多发性硬化症的病程。额外的人口统计学标准,如年龄、种族、性别、多发性硬化症治疗及临床表现和多发性硬化症病程可用作分类器算法中的因子。
在特定的实施方式中,KNN算法应用于数据集(如来自VH4基因的突变谱)以产生统计得到的决策,其指示来自患者测试样品的VH4基因突变谱是否与活动性神经疾病、疾病进展、疾病复发、疾病缓解或疾病控制相关。在这些和其它的实施方式中,患者可以正进行神经疾病如MS的治疗。在其它实施方式中,患者具有临床孤立综合征,且KNN算法的应用确认了多发性硬化症的诊断。在再其它实施方式中,患者具有临床孤立综合征,且KNN算法的应用排除多发性硬化症的诊断。
KNN分类器以其最基本的形式在所有特征具有等同价值的假设下运行。当不相关的和噪音特征影响邻域搜索达到与高度相关特征相同的程度时,该模型的准确性可能变差。特征加权的使用可以用于使用训练集来近似单个特征的最佳影响水平。相关特征可归因于高权重值,而不相关特征归因于接近于零的权重值。特征加权可用于提高分类精度以及用于舍弃低于特定阈值的权重的特征,从而提高了分类器的资源效率。
在一些实施方式中,用于KNN分类器算法的特征采用微阵列数据线性模型(limma)选择。Limma是用于从微阵列实验产生的数据的差异表达分析的程序包。该程序包设计用于分析同时涉及许多个RNA靶标之间的比较的复杂实验,而同时保留用于简单实验的合理简易性。该数据可以是对数比率,或有时是对数强度。经验贝叶斯法和其它收缩方法被用来获得跨基因的信息,从而使分析稳定,甚至对于具有少量的阵列的实验(Smyth,2004;Smyth等,2005)。Limma提供输入和标准给功能,其支持特别可用于线性建模方法的特征(Smyth,2005.Stats for Biol.Health.P.397-420)。
在其它实施方式中,用于KNN分类器算法的特征采用随机森林(RF)模型选择。RF是分类和回归的集成学习方法,其通过在训练时间构建多个决策树并输出作为由单个决策树输出的类模式的类来运行。RF可以用于对变量在回归或分类问题中的重要性分级。产生高值的特征被分级为比产生小变量的特征更重要。
在本发明方法的某些实施方式中,计算机执行的分类器算法是最高得分对(TSP)算法。TSP算法简单但仍强力的无参数分类器,其基于基因对的相对表达排序。TSP算法也可以用于特征选择。
本发明的方法可以进一步包括基于多个分类器算法的输出产生多数投票预测。例如,多数投票预测可以基于一个或多个具有不同k值的KNN算法的结果得出。在一个实施方式中,多数投票的预测基于k值为6的KNN算法和k值为8的KNN算法的结果得出。在其它实施方式中,多数投票预测可以基于KNN算法和TSP算法的结果得出。在再其它的实施方式中,多数投票预测可以基于三个或更多个算法的结果得出,如一个或多个KNN算法和TSP算法。在某些实施方式中,多数投票的预测基于将KNN算法应用于VH4基因突变谱的结果和将TSP算法应用于特定VH4基因(如VH4-34和VH4-4)的特定密码子处的突变频率或出现率的结果得出。
多数投票分类器通过产生大量的分类和分类到接收最大数量的投票或预测的类别而工作。多数投票分类器包括纠错输出编码(ECOC)、Boosting和Bagging。多数投票分类器对于每类产生基本上无偏的概率估计,并分类到最大或大多数。
本发明通过以下附加的实施例进一步说明,其不应该被解释为限制。本领域技术人员根据本分开应理解,对于公开的具体实施方式可以进行许多变化且仍获得相近或类似的结果而不脱离本发明的精神和范围。
本公开全文中引用的所有专利和非专利文件整体为所有目的通过引用结合到本文中。
实施例
实施例1:
四批70例患者血液样品可供研究。患者库包含32名复发/缓解型多发性硬化症(RRMS)患者,12名疑似RRMS患者和26名其它神经疾病(OND)患者。
二元分类器建立用于区分44名可能RRMS患者与26名OND患者。样本的大小可以通过纳入12个可能的RRMS患者而显著增大,其代价推测是包括少数错标患者的更高可能性。
从序列数据中得到两个不同的特征集。第一个是pSUB,个体置换事件(如“G44W”)的出现百分率。第二个是pVGENE,代表以IGVH4亚家族(如“IGHV4-34@16”)分层的特定位点处任何置换事件的出现百分率。
留一交叉验证法(LOOCV)用来评估性能。为了严格性,留出的样品对于特征选择和分类器训练过程两者总是设盲的。
对两种不同的建模方法进行尝试:KNN和TSP(German等,Stat.Appl.In Genetics and Molecular Biology,2004)。TSP具有内置的特征选择机制,而对于KNN我们需要调查几种特征选择算法。标准的学生t检验方法对这个数据集不太奏效。通过随机森林法(RF)选择的特征性能也不太好。相反,特征通过limma法(微阵列数据线性模型用户指南)选择。
KNN分类器
使用pSUB作为特征的两个KNN分类器达到最佳总体分类精度。使用pVGENE的KNN分类器效能较低。
表1.KNN分类器的LOOCV性能
表1括号里的数字指的是误分类的样品数。
两个最佳分类器给出了84%至85%的类似的整体精度,但灵敏度和特异性不同。前者的灵敏度和特异性之间的性能相当平衡。后者具有高灵敏度,但特异性较低。因此,分类器的选择应基于临床使用,宁可失之过宽。
当只关注RMMS患者时(即忽略12个可能的RMMS病例),灵敏度和总体精度都有少许提高。基于3个的一致将分析限制于患者没有提高精度,只是降低了样本大小。
留一交叉验证法后,整个数据集(所有70名患者)被用来选择28个特征。
表2.使用整个数据集选择的28个特征
特征 得分 特征 得分 特征 得分
S31AL -3.93583 G35A 2.626333 K81L -2.33819
G44W -3.15754 N60E -2.55535 Q39E -2.32855
H40Y -3.05594 G27S 2.454676 R73W -2.32506
S28Y -2.88278 S62P 2.450937 T73V 2.320096
Y58C -2.83797 H53L 2.435279 T17M -2.30636
T57K -2.80295 Y53P -2.42282 W36L -2.29227
Y58E -2.75978 V24G 2.375488 P41T 2.282717
Y32A -2.73716 G26R -2.35902 S65G 2.280096
S62F -2.68586 W36S -2.35806
P40A 2.654271 L20R 2.357037
TSP分类器
TSP选择了一对特征:“IGHV4-34@16”和“IGHV4-4@34”。总体LOOCV精度为84.1%。灵敏度为93.0%,和特异性为69.2%。
分类规则具有简单的解释且是直观的;当观察到的“IGHV4-34@16”处的突变分数大于“IGHV4-4@34”处的突变分数(高于对角线),患者很可能是RMMS,反之亦然(见图1)。
错误分类的患者
表3.三个分类器的错误分类的患者。由3位神经学家(3人诊 断)、2位神经学家(2人诊断)、1位神经学家(1人诊断)组成 的独立小组达成诊断一致。
使用通过多数投票的元分类器,70个训练样品中有10个预测误差。总体精度则为86%。
本实施例对于预测RRMS实现了高达86%的LOOCV精度。几方面的证据为数据中真实信号的存在提供了额外的可信度。第一,两个不同的特征集(pSUB和pVGENE,均源自序列数据)都给出了相当的预测精度。其次,选择的特征代表了RRMS血液样品中置换的富集和耗减(表2),与之前在RRMS脑脊液样品中观察到的仅置换的耗减相比。第三,基因亚家族在这些血液样品中比在脑脊液样品中均匀得多地呈现。事实上,超过90%的患者对于七个亚家族(IGHV4-31、IGHV4-30、IGHV4-61、IGHV4-34、IGHV4-39、IGHV4-4和IGHV4-59)中每一个具有观察到的至少十个序列。因此,缺失的数据不再是重要的问题。
应理解,所公开的发明不限于此处描述的特定方法、方案和材料,因此这些都可以变化。也应理解,此处所使用的术语仅为了描述特定的实施方式的目的,而不是意图限制本发明的范围,其仅由所附权利要求限制。本领域技术人员会认识到或者能够仅使用常规实验确定对于本文所描述的具体实施方式的许多等同方式。此类等同意图包括在以下权利要求中。
所有参考文献,它们在一定程度上提供对于本文给出的内容的示例性的、程序性的或其它细节,特别地通过引用结合到本文中。

Claims (30)

1.一种用于检测患者的神经疾病的方法,包括免疫介导神经疾病和/或脱髓鞘疾病,所述方法包括:
确定患者样品的VH4基因序列中在多个VH4密码子位置处的突变谱,其中所述突变谱包含多个下列突变的频率或者出现百分率:S31AL、G44W、H40Y、S28Y、Y58C、T57K、Y58E、Y32A、S62F、P40A、G35A、N60E、G27S、S62P、H53L、Y53P、V24G、G26R、W36S、L20R、K81L、Q39E、R73W、T73V、T17M、W36L、P41T、S65G;且
利用计算机执行的分类器算法将样品按照是否存在神经疾病进行分类。
2.如权利要求1中所述的方法,其中所述多个VH4密码子位置为密码子17、20、24、26、27、28、31A、32、35、36、39、40、41、44、53、57、58、60、62、65、73和81的一个、多个或者全部。
3.如权利要求1或2中所述的方法,其中所述神经疾病为多发性硬化症(MS)。
4.如权利要求1或2中所述的方法,其中所述患者患有临床孤立综合征,且所述分类步骤确认MS或者排除MS。
5.如权利要求1-4任一项中所述的方法,其中所述患者正在进行多发性硬化症的治疗,且所述分类步骤确定活动性疾病、疾病进展或者疾病复发;或者确定疾病缓解或者疾病控制。
6.如权利要求1-5任一项中所述的方法,其中所述样品为血液样品、脑脊液样品(CSF)、尿液样品或其中部分。
7.如权利要求6中所述的方法,其中所述样品为血液样品。
8.如权利要求1-7任一项中所述的方法,其中所述突变谱通过所述样品中VH4基因的核酸序列确定。
9.如权利要求1-7任一项中所述的方法,其中所述突变谱通过定量PCR或者核酸内切酶分析确定。
10.如权利要求1-9任一项中所述的方法,其中所述突变谱包含所述突变的至少5个、所述突变的至少10个、所述突变的至少15个、所述突变的至少20个、所述突变的至少25个或者所有所述突变的频率或者出现百分率。
11.如权利要求1-10任一项中所述的方法,其中所述计算机执行的分类算法为K最邻近算法。
12.如权利要求11中所述的方法,其中K为至少4、至少5、至少6、至少7或至少8。
13.如权利要求1-12任一项中所述的方法,其中所述分类器算法用多发性硬化症患者相对于健康对照和/或患有其它神经疾病的患者中所述突变的所述频率或百分率训练。
14.一种用于检测患者的多发性硬化症的方法,所述方法包括:
确定患者血液或者脑脊液样品的VH4基因中密码子17-81处的序列,计算选自以下的至少5个突变的频率或者出现百分率:
S31AL、G44W、H40Y、S28Y、Y58C、T57K、Y58E、Y32A、S62F、P40A、G35A、N60E、G27S、S62P、H53L、Y53P、V24G、G26R、W36S、L20R、K81L、Q39E、R73W、T73V、T17M、W36L、P41T、S65G;且
利用K最邻近算法按照是否存在多发性硬化症对样品进行分类。
15.如权利要求14中所述的方法,其中所有患者患有临床孤立综合征,且所述分类步骤确认多发性硬化症或者排除多发性硬化症。
16.如权利要求14中所述的方法,其中所述患者正在进行多发性硬化症的治疗,且所述分类步骤确定活动性疾病、疾病进展或者疾病复发;或者确定疾病缓解。
17.如权利要求14-16任一项中所述的方法,其中所述患者样品为血液样品。
18.如权利要求14-17任一项中所述的方法,其中所述VH4基因中密码子17-81处的序列通过核酸测序确定。
19.如权利要求14-18任一项中所述的方法,其中计算了所述突变的至少10个、所述突变的至少15个、所述突变的至少20个、所述突变的至少25个或者所有所述突变的频率或者出现百分率。
20.如权利要求14-19任一项中所述的方法,其中K为至少4、至少5、至少6、至少7或至少8。
21.如权利要求14-20任一项中所述的方法,其中所述K最邻近算法用多发性硬化症患者相对于健康对照和/或患有其它神经疾病的患者中所述突变的所述频率或者百分率来训练。
22.一种用于检测患者的脱髓鞘疾病的方法,所述方法包括检测患者样品的VH4基因序列中密码子位置16的IGVH4-34和密码子位置34的IGHF4-4处的突变;且如果密码子位置16的IGVH4-34的突变的频率或者百分率比密码子位置34的IGHF4-4高,则将所述患者分类为患有脱髓鞘疾病。
23.如权利要求22中所述的方法,其中所述脱髓鞘疾病为多发性硬化症(MS)。
24.如权利要求22或23中所述的方法,其中所述患者患有临床孤立综合征,且所述分类步骤确认或者排除多发性硬化症。
25.如权利要求22或23中所述的方法,其中所述患者正在进行多发性硬化症的治疗,且所述方法确定活动性疾病、疾病进展或者疾病复发,或者疾病缓解或疾病控制。
26.如权利要求22-25任一项中所述的方法,其中所述样品为血液样品、脑脊液样品(CSF)、尿液样品或其部分。
27.如权利要求26中所述的方法,其中所述样品为血液样品。
28.如权利要求22-27任一项中所述的方法,其中所述突变通过样品中VH4基因的核酸测序检测。
29.如权利要求22-27任一项中所述的方法,其中所述突变通过杂交实验、定量PCR或者核酸内切酶分析检测。
30.如权利要求1-21任一项中所述的方法,其中多数投票预测与权利要求22-29任一项中所述的方法一起进行。
CN201480075681.6A 2013-12-20 2014-12-19 评估神经疾病的方法 Pending CN106029095A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361918919P 2013-12-20 2013-12-20
US61/918,919 2013-12-20
PCT/US2014/071517 WO2015095712A1 (en) 2013-12-20 2014-12-19 Methods for evaluating neurological disease

Publications (1)

Publication Number Publication Date
CN106029095A true CN106029095A (zh) 2016-10-12

Family

ID=53403743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480075681.6A Pending CN106029095A (zh) 2013-12-20 2014-12-19 评估神经疾病的方法

Country Status (4)

Country Link
US (1) US20160340730A1 (zh)
EP (1) EP3082861A1 (zh)
CN (1) CN106029095A (zh)
WO (1) WO2015095712A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609588B (zh) * 2017-09-12 2020-08-18 大连大学 一种基于语音信号的帕金森患者updrs得分预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007035857A3 (en) * 2005-09-19 2007-06-21 Palingen Inc Treatment of b cell diseases using anti-germline antibody binding agents
WO2010011894A1 (en) * 2008-07-24 2010-01-28 The Board Of Regents Of The University Of Texas System Vh4 codon signature for multiple sclerosis
WO2010106812A1 (en) * 2009-03-19 2010-09-23 Chugai Seiyaku Kabushiki Kaisha Pharmaceutical formulation containing improved antibody molecules

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012275841A1 (en) * 2011-06-27 2014-01-16 The Jackson Laboratory Methods and compositions for treatment of cancer and autoimmune disease

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007035857A3 (en) * 2005-09-19 2007-06-21 Palingen Inc Treatment of b cell diseases using anti-germline antibody binding agents
WO2010011894A1 (en) * 2008-07-24 2010-01-28 The Board Of Regents Of The University Of Texas System Vh4 codon signature for multiple sclerosis
WO2010106812A1 (en) * 2009-03-19 2010-09-23 Chugai Seiyaku Kabushiki Kaisha Pharmaceutical formulation containing improved antibody molecules

Also Published As

Publication number Publication date
EP3082861A1 (en) 2016-10-26
US20160340730A1 (en) 2016-11-24
WO2015095712A1 (en) 2015-06-25

Similar Documents

Publication Publication Date Title
US20230295738A1 (en) Systems and methods for detection of residual disease
Jamuar et al. Clinical application of next-generation sequencing for Mendelian diseases
US20120310539A1 (en) Predicting gene variant pathogenicity
EP3692173B1 (en) Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
CN106103744A (zh) 用于预测脓毒症发作的设备、试剂盒和方法
CN105473743A (zh) 脓毒症生物标志物及其应用
US20210310067A1 (en) Methods and systems for monitoring organ health and disease
US20220112541A1 (en) Long non-coding rna gene expression signatures in disease monitoring and treatment
US20190228836A1 (en) Systems and methods for predicting genetic diseases
US20210340625A1 (en) tRNA-DERIVED FRAGMENTS AS BIOMARKERS FOR PARKINSON'S DISEASE
Campbell et al. Fusion of large-scale genomic knowledge and frequency data computationally prioritizes variants in epilepsy
She et al. Genetic testing in fetuses with isolated agenesis of the corpus callosum
US20180171406A1 (en) Identification of epigenetic biomarkers in the saliva of children with autism spectrum disorder
CN108460248B (zh) 一种基于Bionano平台检测长串联重复序列的方法
Zhang et al. Characterization of genetic networks associated with Alzheimer’s disease
EP3294933A1 (en) Systems and methods to predict autism before onset of behavioral symptoms and/or to diagnose autism
CN106029095A (zh) 评估神经疾病的方法
Lei et al. Identification of the key genes and pathways involved in B cells in primary Sjögren’s syndrome
JP2021521857A (ja) 多発性骨髄腫の分子分類およびその適用
US20230175064A1 (en) Methods and systems for monitoring organ health and disease
Vos et al. DNA methylation episignatures are sensitive and specific biomarkers for detection of patients with KAT6A/KAT6B variants
Seo et al. Pilot study of EVIDENCE: High diagnostic yield and clinical utility of whole exome sequencing using an automated interpretation system for patients with suspected genetic disorders
Li Developing machine learning and statistical methods for the analysis of genetics and genomics
RU2818052C2 (ru) Способы и системы мониторинга состояния здоровья и патологии органов
US20230408493A1 (en) Quantifying the response-specificity of mononuclear cells and therapeutic uses thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161012