CN106714556B - 用于测定自闭症谱系病症风险的方法和系统 - Google Patents

用于测定自闭症谱系病症风险的方法和系统 Download PDF

Info

Publication number
CN106714556B
CN106714556B CN201580028014.7A CN201580028014A CN106714556B CN 106714556 B CN106714556 B CN 106714556B CN 201580028014 A CN201580028014 A CN 201580028014A CN 106714556 B CN106714556 B CN 106714556B
Authority
CN
China
Prior art keywords
asd
metabolites
acid
metabolite
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580028014.7A
Other languages
English (en)
Other versions
CN106714556A (zh
Inventor
U·盖根穆勒
D·达米安
M·帕库拉
M·A·德普里斯托
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
American Holding Laboratories
Original Assignee
American Holding Laboratories
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US14/493,141 external-priority patent/US20150294081A1/en
Application filed by American Holding Laboratories filed Critical American Holding Laboratories
Priority to CN202110060437.4A priority Critical patent/CN113009122A/zh
Publication of CN106714556A publication Critical patent/CN106714556A/zh
Application granted granted Critical
Publication of CN106714556B publication Critical patent/CN106714556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/49Blood
    • G01N33/492Determining multiple analytes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/70Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving creatine or creatinine
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/82Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving vitamins or their receptors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2560/00Chemical aspects of mass spectrometric analysis of biological material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • G01N2800/2814Dementia; Cognitive disorders

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Ecology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)

Abstract

在某些实施方案中,本发明源自以下发现,即血液中代谢物水平的群体分布曲线的分析可用于帮助预测个体中自闭症谱系病症(ASD)的风险和/或区分ASD与非ASD发育迟缓(DD)。在某些方面,来自代谢物分布曲线中尾部效应存在、不存在和/或方向(上升或下降)的评估的信息被用于预测ASD的风险和/或区分ASD与DD。

Description

用于测定自闭症谱系病症风险的方法和系统
相关申请的交叉引用
本申请要求2015年2月27日提交的美国专利申请号14/633,558 的优先权;所述美国专利申请是于2014年9月22日提交的美国专利 申请号14/493,141的部分继续申请,其要求2014年4月11日提交的 美国临时专利申请No.61/978,773以及于2014年5月22日提交的美 国临时专利申请号62/002,169的优先权;其中每一个的内容通过引用 整体并入本文。
发明领域
本发明总的来说涉及对于自闭症谱系病症(ASD)和其他病症的风 险的预测。
背景
自闭症谱系病症(ASD)是普遍的发育病症,其特征在于互动社交相 互作用缺乏,语言困难,以及重复行为和限制性兴趣,通常在生命的 前3年期间表现。ASD的病因学知之甚少,但被认为是多因素的,遗 传和环境因素都会导致该疾病的发展。
数据显示,尽管父母开始怀疑他们的孩子患有ASD的平均年龄是 20个月,但是诊断的中位年龄达到54个月。从临床角度来看,一个 重要的挑战是尽可能早地确定儿童是否患有ASD,是否需要专家转诊 到自闭症治疗计划中。
概述
ASD的诊断通常由发育儿科医生和其他专家在使用在Diagnostic andStatistical Manual of Mental Disorders中阐述的标准仔细评 估儿童之后作出。可靠的诊断通常需要由包括发育儿科医生、神经病 学家、精神病学家、心理学家、言语和听力专家以及职业治疗师在内 的多个专家对受试者进行认真评估。此外,ASD诊断的中位年龄为54 个月,尽管父母怀疑ASD的平均年龄早至20个月这一事实。CDC(疾病 控制中心)观察到最终确诊为ASD的儿童中只有18%是在36个月前确 定的。
遗憾的是,患有尚未诊断的ASD的幼儿错过了在儿童发育的重要 窗口期间进行早期治疗干预的机会。需要有可靠地确定ASD风险的医 学诊断测试,以特别地更早鉴定年幼儿童,此时治疗干预可能更加有 效。
本发明的实施方案源于以下发现:对群体内和群体之间分析物(诸 如代谢物)测量值的分布曲线的分析提供了可用于建立或改进用于预 测病症或病况诸如ASD的风险的分类器的信息。特别地,血液中代谢 物水平的群体分布曲线的分析有助于预测受试者中自闭症谱系病症 (ASD)的风险。例如,血液中代谢物水平的群体分布曲线的分析可用于 区分受试者的自闭症谱系病症(ASD)与非ASD发育病症(诸如非因自闭 症谱系病症引起的发育迟缓(DD))。
区分两个组的生物标志物的统计分析通常假定两个群体的平均生 物标志物水平不同,并且围绕该平均值的变化归因于由高斯分布最好 表征的实验和/或群体变化。与此基线模型相反,本文观察到,对于一 些分析物,ASD中或有时DD中的分布最好被表征为其本身由多个子 分布组成,其中一个子分布与另一健康状态无法区分(例如,其中ASD 和DD分布未分化),另一子分布在少数受试者中远远偏离平均值,例 如,对于该群体,呈现组合分布的“尾部”。这种洞察导致与基线明 显不同的分析框架;已发现,对于某些分析物,通过例如建立不需要 内在高斯分布模型的排序,基于群体分布的顶部或底部来定义阈值, 可实现更好的结果。
因此,代谢物在本文中被描述为表现出“尾部富集”或“尾部” 效应,其中在该代谢物的代谢物水平的分布曲线的远端部分存在特定 群体(例如,ASD或DD)的样品的富集。由评估代谢物分布曲线中尾部 效应的存在、不存在和/或方向(上或下)得到的信息可用于预测ASD 的风险。已发现,对于特定代谢物,代谢物水平对应于分布曲线的顶 部或底部(例如,十分位),即在分布曲线的“尾部”内(无论是在“右 尾”还是“左尾”),高度地提示ASD的存在或不存在。
此外,发现当合并具有低程度重叠、共同信息的多种代谢物时, 风险预测得到改善。例如,对于ASD的评估,有一些特定的代谢物组 提供互补诊断/风险评估信息。也就是说,通过分析第一代谢物的水平 无法鉴定的ASD阳性个体(例如,第一代谢物的鉴定尾部内的个体)与 通过分析第二代谢物可鉴定的ASD阳性个体并不相同(或者可能存在 低的,非零度的重叠)。不希望受特定理论的束缚,该发现可能反映了 ASD本身的多面性质。
因此,在某些实施方案中,风险评估方法包括鉴定受试者是否落 入涉及多种代谢物的多重已鉴定的代谢物尾部的任一种中,例如,其 中不同代谢物尾部的预测物是至少部分不相连的,例如,它们具有低 的共同信息,因此引入具有低共同信息的多个代谢物时风险预测改善。 分类器具有预先确定水平的可预测性,例如,以AUC的形式-即对于分 类器,将假阳性率(1-特异性)相对于真阳性率(灵敏度)作图的ROC曲 线下面积-其中向分类器中添加表现尾效应、具有低共同信息的代谢物 时AUC增加。
在一些实施方案中,本发明源自以下发现:血液中代谢物水平的 某些阈值可用于帮助预测受试者中自闭症谱系病症(ASD)的风险。在某 些方面,从代谢物分布曲线中尾部效应的存在、不存在和/或方向(上 或下)的评估推导的代谢物的这些阈值被用于预测ASD的风险。在某些 方面,这些阈值可处在群体中代谢物水平分布的上端或下端。已发现, 对于特定代谢物,代谢物水平高于上阈值和/或低于下阈值高度提示 ASD的存在或不存在。
在一些实施方案中,这些代谢物的水平可用于将ASD与其它形式 的发育延迟(例如,非因自闭症谱系病症引起的发育迟缓(DD))区分开。
在一个方面,本发明涉及区分受试者的自闭症谱系病症(ASD)与非 ASD发育延迟(DD)的方法,所述方法包括:(i)测量获自所述受试者的 样品中多种代谢物中的第一代谢物的水平,先前已在具有ASD的第一 受试者群体中和具有非-ASD发育延迟(DD)的第二受试者群体中表征 了所述第一代谢物的群体分布,其中所述第一代谢物被预先测定为表 现出ASD尾部效应和/或DD尾部效应,每个尾部效应包括在相应(ASD 或DD)群体的成员中富集的相关右尾或左尾,其中第一代谢物表现出 具有右尾的ASD尾部效应,当该样品中第一代谢物的水平高于定义在 第一(ASD)群体成员中富集的右尾的预先确定上(最小)阈值时,该样品中第一代谢物的水平在ASD尾部内,而当第一代谢物表现出具有左 尾的ASD尾部效应时,当该样品中第一代谢物的水平低于定义在第一 (ASD)群体成员中富集的左尾的预先确定下(最大)阈值时,样品中第一 代谢物的水平在ASD尾部之内,并且,在第一代谢物表现出具有右尾 的DD尾部效应时,当样品中第一代谢物的水平高于定义在第二(DD) 群体成员中富集的右尾的预先确定上(最小)阈值时,样品中第一代谢 物的水平在DD尾部内,并且在第一代谢物表现出具有左尾的DD尾部 效应时,当样品中第一代谢物的水平低于定义在第二(DD)群体成员中 富集的左尾的预先确定下(最大)阈值时,样品中第一代谢物的水平在 DD尾部内;(ii)测量来自该样品的多种代谢物中的至少一种另外的代 谢物的水平,其中在第一群体和第二群体中事先表征了所述至少一种 另外的代谢物中的每一种的群体分布,被预先确定为表现出ASD尾部 效应和DD尾部效应中的至少一种,并且,对于所述至少一种另外的代 谢物中的每一种,根据步骤(i)鉴定样品中所述代谢物的水平是否在相 应的ASD尾部和/或DD尾部内;和(iii)基于所述样品处于在步骤(i) 和步骤(ii)中分析所述代谢物所鉴定的ASD尾部和/或所鉴定的DD尾 部,以预先确定水平的可预测性确定(a)受试者具有ASD而不是DD或 (b)受试者具有DD而不是ASD。
在某些实施方案中,第一代谢物被预先测定为表现具有相关的上 (最小)或下(最大)阈值的ASD尾部效应,所述阈值被预先测定为使得 满足该标准的未知分类的样品(先前未表征的样品)是ASD而不是DD 的几率不小于1.6:1,p<0.3。在某些实施方案中,所述几率不小于2:1, 或不小于2.5:1,或不小于2.75:1,或不小于3:1,或不小于3.5:1, 或不小于3.75:1,或不小于4:1。在任何前述内容中,p值(统计显著 性值)满足p<0.3,或p<0.25,或p<0.2,或者p<0.15,或p<0.1,或 p<0.05。
在某些实施方案中,第一代谢物被预先确定来显示具有相关的上 (最小)或下(最大)阈值的DD尾部效应,所述阈值被预先确定为使得满 足该标准的未知分类的样品(先前未表征的样品)是DD而不是ASD的几 率不小于1.6:1,p<0.3。在某些实施方案中,所述几率不小于2:1, 或不小于2.5:1,或不小于2.75:1,或不小于3:1,或不小于3.25:1, 或不小于3.5:1,或不小于3.75:1,或不小于4:1。在任何前述内容 中,p值(统计显著性值)满足p<0.3,或p<0.25,或p<0.2,或者p<0.15, 或p<0.1,或p<0.05。
在某些实施方案中,预先确定水平的可预测性对应于将假阳性率 (1-特异性)相对于真阳性率(灵敏度)绘制的接受者操作特征(ROC)曲 线具有至少0.70的AUC(曲线下面积)。
在某些实施方案中,一种或多种所述代谢物的预先确定上(最小) 阈值是从第85位至第95位百分位的百分位数(例如,约第90百分位 数,或约第85、第86、第87、第88、第89、第91、第92、第93、 第94或第95百分位数,四舍五入至最接近的百分位数),并且其中一 种或多种所述代谢物的预先确定的下(最大)阈值是从第10至第20百 分位数的百分位数(例如,约第15位百分位数,或约第10、第11、第 12、第13、第14、第16、第17、第18、第19或第20百分位数,四 舍五入至最接近的百分位数)。
在某些实施方案中,多种代谢物包括选自以下代谢物的至少两种 代谢物:5-羟基吲哚乙酸(5-hydroxyindoleacetate,5-HIAA)、1,5- 脱水葡糖醇(1,5-anhydroglucitol;1,5-AG)、3-(3-羟基苯基)丙酸 (3-(3-hydroxyphenyl)propionate)、3-羧基-4-甲基-5-丙基-2-呋喃 丙酸(3-carboxy-4-methyl-5-propyl-2-furanpropanoate,CMPF)、 3-吲哚氧基硫酸(3-indoxyl sulfate)、4-乙基苯基硫酸 (4-ethylphenyl sulfate)、8-羟基辛酸(8-hydroxyoctanoate)、γ -CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸(indoleacetate)、异戊酰甘 氨酸、乳酸(lactate)、N1-甲基-2-吡啶酮-5-甲酰胺、硫酸对甲酚 (p-cresolsulfate)、泛酸(维生素B5)、苯乙酰谷氨酰胺、哌可酸 (pipecolate)、黄嘌呤、羟基-百菌清、辛烯酰基肉碱和3-羟基马尿 酸(3-hydroxyhippurate)。
在某些实施方案中,多种代谢物包括选自以下代谢物的至少两种 代谢物:苯乙酰谷氨酰胺、黄嘌呤、辛烯酰基肉碱、硫酸对甲酚、异 戊酰甘氨酸、γ-CEHC、吲哚乙酸、哌可酸、1,5-脱水葡糖醇(1,5-AG)、 乳酸、3-(3-羟基苯基)丙酸、3-吲哚氧基硫酸、泛酸(维生素B5)和羟 基百菌清。
在某些实施方案中,多种代谢物包括选自以代谢物的至少3种代 谢物:苯乙酰谷氨酰胺、黄嘌呤、辛烯酰基肉碱、硫酸对甲酚、异戊 酰甘氨酸、γ-CEHC、吲哚乙酸、哌可酸、1,5-脱水葡糖醇(1,5-AG)、 乳酸、3-(3-羟基苯基)丙酸、3-吲哚氧基硫酸、泛酸(维生素B5)和羟 基百菌清。
在某些实施方案中,多种代谢物包含选自表6中所列的对中的至 少一对代谢物。
在某些实施方案中,多种代谢物包含选自表7中所列的三元组中 的至少一个三元组代谢物。
在某些实施方案中,多种代谢物包含至少一对代谢物,其被组合 在一起作为一组两种代谢物,提供至少0.62(例如,至少约0.63、0.64 或0.65)的AUC,其中AUC是针对仅基于所述两种代谢物的组的分类器, 将假阳性率(1-特异性)相对于真阳性率(灵敏度)绘制的ROC曲线下面 积。
在某些实施方案中,所述多种代谢物包含至少一个三元组代谢物, 其被组合在一起作为一组三种代谢物,提供至少0.66(例如,至少约 0.67或0.68)的AUC,其中AUC是针对仅基于所述三种代谢物的组的 分类器,将假阳性率(1-特异性)相对于真阳性率(灵敏度)绘制的ROC 曲线下面积。
在另一方面,本发明涉及确定受试者的自闭症谱系病症(ASD)风险 的方法,所述方法包括:(i)分析来自从所述受试者获得的样品的多种 代谢物的第一代谢物的水平,所述第一代谢物的群体分布事先在具有 已知分类的参照受试者群体中进行了表征,其中所述第一代谢物被预 先确定为表现出包含在ASD成员中富集的相关右尾或左尾的ASD尾部效应,以及其中第一代谢物表现出具有右尾的ASD尾部效应,当样品 中第一代谢物的水平高于限定在ASD群体成员中富集的右尾的预先确 定上(最小)阈值时,样品中第一代谢物的水平在ASD尾部内,并且其 中第一代谢物表现出具有左尾的ASD尾部效应,当样品中第一代谢物 的水平低于限定在ASD群体成员中富集的左尾的预衔测定下(最大)阈 值时,样品中第一代谢物的水平在ASD尾部内;(ii)测量来自样品的 多种代谢物中的至少一种另外的代谢物的水平,所述至少一种另外的 代谢物中的每一种的群体分布事先在参照群体中进行了表征,并且被 预先确定为表现出ASD尾部效应,以及对于所述至少一种另外的代谢 物中的每一种,根据步骤(i)鉴定样品中所述代谢物的水平是否在相应 的ASD尾部内;和(iii)基于样品位于针对步骤(i)和步骤(ii)中分析 的代谢物所鉴定的ASD尾,以预先确定的可预测水平测定受试者具有 ASD的风险。
在某些实施方案中,第一代谢物被预先确定为表现具有相关的上 (最小)或下(最大)阈值的ASD尾部效应,所述阈值被预先确定为使得 满足该标准的未知分类的样品(先前未表征的样品)是ASD而不是DD 的几率不小于1.6:1,p<0.3。在某些实施方案中,所述几率不小于2:1, 或不小于2.5:1,或不小于2.75:1,或不小于3:1,或不小于3.25:1, 或不小于3.5:1,或不小于3.75:1,或不小于4:1。在任何前述内容 中,p值(统计显著性值)满足p<0.3,或p<0.25,或p<0.2,或者p<0.15, 或p<0.1,或p<0.05。
在某些实施方案中,预先确定的可预测性水平对应于将假阳性率 (1-特异性)相对于真阳性率(灵敏度)绘制的接受者操作特征(ROC)曲 线具有至少0.70的AUC(曲线下面积)。
在某些实施方案中,多种代谢物包括选自以下代谢物的至少两种 代谢物:5-羟基吲哚乙酸(5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、3-(3- 羟基苯基)丙酸、3-羧基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚 氧基硫酸、4-乙基苯基硫酸、8-羟基辛酸、γ-CEHC、羟基异戊酰肉碱 (C5)、吲哚乙酸、异戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺、 硫酸对甲酚、泛酸(维生素B5)、苯乙酰谷氨酰胺、哌可酸、黄嘌呤、 羟基-百菌清、辛烯酰基肉碱和3-羟基马尿酸。
在另一方面,本发明涉及确定受试者的自闭症谱系病症(ASD)风险 的方法,包括:(i)分析从受试者获得的样品中的多种代谢物的水平, 所述多种代谢包括选自以下代谢物的至少两种代谢物:5-羟基吲哚乙 酸(5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸、3-羧 基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基苯基 硫酸、8-羟基辛酸、γ-CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸、异戊 酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺、硫酸对甲酚、泛酸(维 生素B5)、苯乙酰谷氨酰胺、哌可酸、黄嘌呤、羟基-百菌清、辛烯酰 基肉碱和3-羟基马尿酸;和(ii)基于所述多种代谢物的定量水平确定所述受试者具有ASD的风险。
在某些实施方案中,受试者的年龄不超过约54个月。在某些实施 方案中,受试者的年龄不超过约36个月。
在某些实施方案中,所述多种代谢物包括选自以下代谢物的至少 两种代谢物:苯乙酰谷氨酰胺、黄嘌呤、辛烯酰基肉碱、硫酸对甲酚、 异戊酰甘氨酸、γ-CEHC、吲哚乙酸、哌可酸、1,5-脱水葡糖醇(1,5-AG)、 乳酸、3-(3-羟基苯基)丙酸、3-吲哚氧基硫酸、泛酸(维生素B5)和羟 基百菌清。
在某些实施方案中,所述多种代谢物包括选自以下代谢物的至少 3种代谢物:苯乙酰谷氨酰胺、黄嘌呤、辛烯酰基肉碱、硫酸对甲酚、 异戊酰甘氨酸、γ-CEHC、吲哚乙酸、哌可酸、1,5-脱水葡糖醇(1,5-AG)、 乳酸、3-(3-羟基苯基)丙酸、3-吲哚氧基硫酸、泛酸(维生素B5)和羟 基百菌清。
在某些实施方案中,所述多种代谢物包含选自表6中所列的对中 的至少一对代谢物。
在某些实施方案中,所述多种代谢物包含选自表7中所列的三元 组的至少一个三元组的代谢物。
在某些实施方案中,所述多种代谢物包含至少一对代谢物,其被 组合在一起作为一组两种代谢物,提供至少0.62(例如,至少约0.63、 0.64或0.65)的AUC,其中AUC是仅基于这一组两种代谢物的分类器 将假阳性率(1-特异性)相对于真阳性率(灵敏度)绘制的ROC曲线下面 积。
在某些实施方案中,所述多种代谢物包含至少一种三元组的代谢 物,其被组合在一起作为一组三种代谢物,提供至少0.66(例如,至 少约0.67或0.68)的AUC,其中AUC是仅基于这一组三种代谢物的分 类器将假阳性率(1-特异性)相对于真阳性率(灵敏度)绘制的ROC曲线 下面积。
在某些实施方案中,所述样品是血浆样品。
在某些实施方案中,测量代谢物的水平包括进行质谱法。在某些 实施方案中,进行质谱法包括进行选自热解质谱法、傅立叶变换红外 光谱法、拉曼光谱法、气相色谱-质谱法、高压液相色谱法/质谱法 (HPLC/MS)、液相色谱(LC)-电喷雾质谱法、帽-LC-串联电喷雾质谱法 和超高效液相色谱/电喷雾电离串联质谱法。
在另一方面,本发明涉及区分受试者中自闭症的样品谱系病症 (ASD)与非ASD发育延迟(DD)的方法,包括:(i)分析获自受试者的样 品中的多种代谢物的水平,所述多种代谢物包含选自以下代谢物中的 至少两种代谢物:5-羟基吲哚乙酸(5-HIAA)、1,5-脱水葡糖醇 (1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5-丙基-2-呋喃丙酸 (CMPF)、3-吲哚氧基硫酸、4-乙基苯基硫酸、8-羟基辛酸、γ-CEHC、 羟基异戊酰肉碱(C5)、吲哚乙酸、异戊酰甘氨酸、乳酸、N1-甲基-2- 吡啶酮-5-甲酰胺、硫酸对甲酚、泛酸(维生素B5)、苯乙酰谷氨酰胺、 哌可酸、黄嘌呤、羟基-百菌清、辛烯酰基肉碱和3-羟基马尿酸,所 述多种代谢物的水平和/或群体分布已事先在参照群体上进行了表征; 和(ii)通过将来自受试者的样品的所述多种代谢物的水平与预先确定 的阈值(例如,从具有已知分类的样品的参照群体确定的阈值)进行比 较,以预先确定水平的可预测性确定(a)受试者具有ASD而不是DD或 (b)受试者具有DD而不是ASD。
在某些实施方案中,本发明提供了通过向不同代谢物分配权重以 反映它们在风险预测中的相应功能来分析代谢物的方法。在一些实施 方案中,可以从代谢物的生物学功能(例如,它们所属的途径)、其临 床效用或其来自统计学或流行病学分析的显著性推导出权重分配。
在某些实施方案中,本发明提供了使用不同技术测量代谢物的方 法,包括但不限于色谱测定、质谱测定、荧光测定法测定、电泳测定、 免疫亲和测定和免疫化学测定。
在某些实施方案中,本发明提供了用于确定受试者的自闭症谱系 病症(ASD)风险的方法,包括分析来自受试者的样品中多种代谢物的水 平;以及基于所述多种代谢物的定量水平,以预先确定的可预测水平 确定所述受试者是否具有ASD而不是非ASD发育病症。
在某些实施方案中,所述多种代谢物包括选自以下代谢物中的至 少一种代谢物:5-羟基吲哚乙酸(5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、 3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3- 吲哚氧基硫酸、4-乙基苯基硫酸、8-羟基辛酸、γ-CEHC、羟基异戊酰 肉碱(C5)、吲哚乙酸、异戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5- 甲酰胺、硫酸对甲酚、泛酸(维生素B5)、苯乙酰谷氨酰胺、哌可酸、 黄嘌呤、羟基-百菌清、辛烯酰基肉碱、3-羟基马尿酸及其组合。
在某些实施方案中,所述多种代谢物包括选自以下代谢物中的至 少两种代谢物:5-羟基吲哚乙酸(5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、 3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3- 吲哚氧基硫酸、4-乙基苯基硫酸、8-羟基辛酸、γ-CEHC、羟基异戊酰 肉碱(C5)、吲哚乙酸、异戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5- 甲酰胺、硫酸对甲酚、泛酸(维生素B5)、苯乙酰谷氨酰胺、哌可酸、 黄嘌呤、羟基-百菌清、辛烯酰基肉碱、3-羟基马尿酸及其组合。
在某些实施方案中,所述多种代谢物包括选自以下的至少3种, 至少4种,至少5种,至少6种,至少7种,至少8种,至少9种或 至少10种代谢物:5-羟基吲哚乙酸(5-HIAA)、1,5-脱水葡糖醇 (1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基苯基硫酸、8-羟基辛酸、γ-CEHC、 羟基异戊酰肉碱(C5)、吲哚乙酸、异戊酰甘氨酸、乳酸、N1-甲基-2- 吡啶酮-5-甲酰胺,硫酸对甲酚、泛酸(维生素B5)、苯乙酰谷氨酰胺、 哌可酸、黄嘌呤、羟基-百菌清、辛烯酰基肉碱、3-羟基马尿酸及其组合。
在某些实施方案中,所述多种代谢物包括另外的代谢物。在一些 实施方案中,所述多种代谢物包括多于21种代谢物。
在某些实施方案中,本发明提供了用于区分受试者的自闭症谱系 病症(ASD)与非ASD发育病症的方法,包括以下步骤:分析来自受试者 的样品中多种代谢物的水平,将代谢物的水平与其在一个参照群体中 的相应群体分布相比较,以及通过将来自受试者的样品的多种代谢物 的水平与先前表征的参照群体中所述多种代谢物的水平和/或群体分 布相比较,以预先确定的可预测性水平确定受试者是否患有ASD而不 是非ASD发育病症。
例如,在某些实施方案中,本发明提供了诊断标准,其包括可利 用具有如下AUC的ROC曲线预测受试者的ASD风险的至少一种代谢物: 至少0.60、至少0.65、至少0.70、至少0.75、至少0.80、至少0.85 或至少0.90的AUC。AUC是针对分类器将假阳性率(1-特异性)相对于 真阳性率(灵敏度)绘制的ROC曲线下的面积。
在某些实施方案中,用于分析的至少一种代谢物选自5-羟基吲哚 乙酸(5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸、 3-羧基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基 苯基硫酸、8-羟基辛酸、γ-CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸、 异戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺,硫酸对甲酚、泛 酸(维生素B5)、苯乙酰谷氨酰胺、哌可酸、黄嘌呤、羟基-百菌清、 辛烯酰基肉碱、3-羟基马尿酸及其组合。
在某些实施方案中,用于分析的所述至少一种代谢物包含选自以 下成员的至少两个或更多个(例如,1个、2个、3个、4个、5个、6 个、7个、8个、9个、10个、11个、12个、13个、14个、15个、 16个、17个、18个、19个、20个、21个)成员:5-羟基吲哚乙酸(5-HIAA)、 1,5-脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5- 丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基苯基硫酸、8-羟基 辛酸、γ-CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸、异戊酰甘氨酸、乳 酸、N1-甲基-2-吡啶酮-5-甲酰胺,硫酸对甲酚、泛酸(维生素B5)、 苯乙酰谷氨酰胺、哌可酸、黄嘌呤、羟基-百菌清、辛烯酰基肉碱和 3-羟基马尿酸,其中建立每种代谢物(例如,显示尾部效应的每种所述 代谢物)的非ASD人口分布曲线和ASD群体分布曲线。
在某些实施方案中,用于分析的代谢物选自γ-CEHC、黄嘌呤、硫 酸对甲酚、辛烯酰基肉碱、苯乙酰谷氨酰胺及其组合。
在某些实施方案中,用于分析的一种代谢物是γ-CEHC。
在某些实施方案中,用于分析的一种代谢物是黄嘌呤。
在某些实施方案中,用于分析的一种代谢物是硫酸对甲酚。
在某些实施方案中,用于分析的一种代谢物是辛烯酰基肉碱。
在某些实施方案中,用于分析的一种代谢物是苯乙酰谷氨酰胺。
在某些实施方案中,用于分析的一种代谢物是异戊酰基甘氨酸。
在某些实施方案中,用于分析的一种代谢物是哌可酸。
在某些实施方案中,用于分析的一种代谢物是吲哚乙酸。
在某些实施方案中,用于分析的一种代谢物是辛烯酰基肉碱。
在某些实施方案中,用于分析的一种代谢物是羟基百菌清。
在某些实施方案中,所述多种代谢物包含互补的至少第一代谢物 和第二代谢物(例如,第一和第二代谢物的ASD尾部样品基本上不重 叠),从而由代谢物提供的预测子部分不相连,并且具有的共同信息少。 在某些实施方案中,风险预测因引入共同信息少的多种代谢物而改善。
在某些实施方案中,所述多种代谢物包括两种代谢物,其中被组 合在一起作为一组两种代谢物的所述两种代谢物提供了至少0.62、 0.63、0.64或0.65的AUC。
在某些实施方案中,所述多种代谢物包括三种代谢物,其中被组 合在一起作为一组三种代谢物的所述三种代谢物提供了至少0.66、 0.67或0.68的AUC。
在某些实施方案中,本发明提供了通过分析两组事先定义的代谢 物的水平来区分受试者的自闭症谱系病症(ASD)与非ASD发育病症的 方法。在某些实施方案中,第一组代谢物代表与ASD密切相关的代谢 物,而第二组代谢物代表与对照病况(例如,DD)相关的代谢物。通过 分析来自受试者的样品的两组代谢物,受试者具有ASD而不是对照病 况的风险可通过本公开中描述的多种方法来确定。例如,这可以通过 比较第一组代谢物的聚集的ASD尾部效应与第二组代谢物的聚集的非 ASD尾部效应来实现。
在某些实施方案中,本发明提供了用于区分受试者的自闭症谱系 病症(ASD)与非ASD发育迟缓(DD)的方法,所述方法包括:(i)测量获 自受试者的样品中的多种代谢物的水平,其中所述多种代谢物包括选 自以下代谢物的至少两种代谢物:黄嘌呤、γ-CEHC、羟基-百菌清、 5-羟基吲哚乙酸(5-HIAA)、吲哚乙酸、硫酸对甲酚、1,5-脱水葡糖醇 (1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5-丙基-2-呋喃丙酸 (CMPF)、3-吲哚氧基硫酸、4-乙基苯基硫酸、羟基异戊酰肉毒碱(C5)、 异戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺、泛酸(维生素B5)、 苯乙酰谷氨酰胺、哌可酸、3-羟基马尿酸及其组合;和(ii)计算样品 中其水平等于或低于(a)如表9A中定义的指示ASD(ASD左尾效应)或(b) 如表9B中定义的指示DD(DD左尾效应)的预先确定阈值浓度的代谢物 数目;和/或(iii)计算样品中其水平等于或高于(a)如表9A中定义的 指示ASD(ASD左尾效应)或(b)如表9B中定义的指示DD(DD左尾效应) 的预先确定阈值浓度的代谢物数目;和(iv)基于步骤(ii)和/或(iii) 中获得的数目,确定受试者具有ASD或DD。
在某些实施方案中,本发明提供了用于确定受试者具有发生ASD 的风险或处于发生ASD的风险中的方法,所述方法包括:(i)测量获自 受试者的样品中的多种代谢物的水平,其中所述多种代谢物包括选自 以下代谢物的至少两种代谢物:黄嘌呤、γ-CEHC、羟基-百菌清、5- 羟基吲哚乙酸(5-HIAA)、吲哚乙酸、硫酸对甲酚、1,5-脱水葡糖醇 (1,5-AG)、3-羧基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基 硫酸、4-乙基苯基硫酸、羟基异戊酰肉碱(C5)、异戊酰甘氨酸、乳酸、 N1-甲基-2-吡啶酮-5-甲酰胺、泛酸(维生素B5)、苯乙酰谷氨酰胺、 哌可酸、3-羟基马尿酸及其组合;和(ii)检测以下中的两种或更多种: (a)黄嘌呤水平为182.7ng/ml或以上;(b)羟基-百菌清水平为20.3 ng/ml或以上;(c)5-羟基吲哚乙酸水平为28.5ng/ml或以上;(d)乳 酸水平为686600ng/ml或以上;(e)泛酸水平为63.3ng/ml或以上; (f)哌可酸水平为303.6ng/ml或以上;(g)γ-CEHC水平为32.0 ng/ml或以下;(h)吲哚乙酸水平为141.4ng/ml或以下;(i)硫酸 对甲酚水平为182.7ng/ml或以下;(j)1,5-脱水葡糖醇(1,5-AG)水 平为11910.3ng/ml或以下;(k)3-羧基-4-甲基-5-丙基-2-呋喃丙 酸(CMPF)水平为7.98ng/ml或以下;(l)3-吲哚氧基硫酸水平为256.7 ng/ml或以下;(m)4-乙基苯基硫酸水平为3.0ng/ml或以下;(n)羟 基异戊酰肉碱(C5)水平为12.9ng/ml或以下;(o)N1-甲基-2-吡啶酮 -5-甲酰胺水平为124.82ng/ml或以下;和(p)苯乙酰谷氨酰胺水平为166.4ng/ml或以下;和(iii)基于步骤(ii)中检测的代谢物水平, 确定受试者具有ASD或处于发生ASD的风险中。
在一些实施方案中,步骤(ii)中检测的代谢物水平是近似水平。
在一些实施方案中,本发明提供了将受试者诊断为患有自闭症谱 系病症(ASD)或处于发生该病症的风险中的方法,所述方法包括(i)测 定获自所述受试者的样品中一种或多种代谢物的水平;(ii)将所测定 的所述一种或多种代谢物的水平与所述一种或多种代谢物的预先确定 水平进行比较,所述预先确定水平指示了受试者具有ASD或处于发生 该病症的风险中;和(iii)基于所述一种或多种代谢物的测定水平与预 先确定水平之间的差异,将所述受试者诊断为具有ASD或处于发生该 病症的风险中;其中所述一种或多种代谢物选自5-羟基吲哚乙酸 (5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基 -4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基苯基硫 酸、8-羟基辛酸、γ-CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸、异戊酰 甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺、硫酸对甲酚、泛酸(维 生素B5)、对-苯乙酰谷氨酰胺、哌可酸、黄嘌呤,羟基-百菌清、辛 烯酰基肉碱和3-羟基马尿酸。
在一些实施方案中,本发明提供了诊断受试者为具有自闭症谱系 病症(ASD)或处于发生该病症的风险中的方法,所述方法包括(i)测定 获自所述受试者的样品中一种或多种代谢物的水平;(ii)将所测定的 所述一种或多种代谢物的水平与所述一种或多种代谢物的预先确定水 平进行比较,所述预先确定水平指示了受试者具有ASD或处于发生该 病症的风险中;和(iii)基于所述一种或多种代谢物的测定水平与预先 确定水平之间的差异,诊断所述受试者具有ASD或处于发生该病症的 风险中;其中所述一种或多种代谢物选自5-羟基吲哚乙酸(5-HIAA)、 1,5-脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5- 丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基苯基硫酸、8-羟基 辛酸、γ-CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸、异戊酰甘氨酸、乳 酸、N1-甲基-2-吡啶酮-5-甲酰胺、硫酸对甲酚、泛酸(维生素B5)、 苯乙酰谷氨酰胺、哌可酸、黄嘌呤、羟基-百菌清、辛烯酰基肉碱和 3-羟基马尿酸,条件是所述代谢物不是5-羟基吲哚乙酸(5-HIAA)、5- 脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5-丙基 -2-呋喃丙酸(CMPF)、3-吲哚硫酸、4-乙基苯基硫酸、8-羟基辛酸、γ -CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸、异戊酰甘氨酸、乳酸、N1- 甲基-2-吡啶酮-5-甲酰胺、硫酸对甲酚、泛酸(维生素B5)、苯乙酰谷 氨酰胺、哌可酸、黄嘌呤、羟基-百菌清、辛烯酰基肉碱或3-羟基马 尿酸。
在某些实施方案中,本发明提供了通过测量来自受试者的某些代 谢物的水平和遗传信息来确定受试者发生ASD风险的方法。在一些实 施方案中,遗传信息包括拷贝数变异(CNV)和/或脆性X(FXS)测试。
在另外的实施方式中,关于本发明的某些方面所描述的限制可以 应用于本发明的其它方面。例如,在一些实施方式中,从属于一个独 立权利要求的权利要求的限定可以应用于另一独立权利要求。
附图说明
图1举例说明两个群体(例如,ASD和DD)中的示例性代谢物的分 布,以及该代谢物在这两个群体之间的平均偏移。
图2举例说明示例性代谢物在两个群体(例如,ASD和DD)中的分 布,以及这种代谢物在这两个群体之间的尾部效应(例如,ASD分布具 有更密集的尾部)。
图3举例说明代谢物5-羟基吲哚乙酸在两个群体(例如,ASD和 DD)中的分布,其在这两个群体之间表现出统计上显著的平均偏移(t 检验;p<0.01)和统计学上显著的右尾效应('极限值'表示尾部效应, Fisher's检验;p=0.001)。
图4举例说明代谢物γ-CEHC在两个群体(例如,ASD和DD)中的 分布,其在这两个群体之间表现出统计上显著的左尾效应(“极限值” 表示尾部效应,Fisher's检验;p=0.008)
图5举例说明代谢物苯基乙酰谷氨酰胺在两个群体(例如,ASD和 DD)中的分布,其在这两个群体之间表现出统计上显著的平均偏移(t 检验;p=0.001)和统计学上显著的左和右尾效应(“极限值”表示尾效 应,Fisher's检验;p=0.0001)。所述分布在两个群体中表现为偏移 的高斯曲线。
图6举例说明两种示例性代谢物的相关性,证明了这两种代谢物 具有不同的尾部效应分布并且是互补的。
图7举例说明12种示例性代谢物在180名受试者中的尾部效应, 以及它们对ASD和DD的预测能力。
图8A举例说明使用示例性12种代谢物小组对180个样品的ASD 和非ASD尾部效应的曲线图,证明了来自ASD患者的样品显示出ASD 尾部效应的聚集。
图8B举例说明使用示例性12种代谢物小组对180个样品的ASD 和非ASD尾部效应的曲线图,以及对数据进行分元的示例性方法。
图8C举例说明使用示例性21种代谢物小组对180个样品的ASD 和非ASD尾部效应的曲线图,证明了来自ASD患者的样品显示出ASD 尾部效应的聚集。
图9举例说明示例性12种代谢物小组在所评估的代谢物数目增加 时,对ASD的可预测性增加。
图10A举例说明使用示例性12种代谢物小组的三分法对ASD的可 预测性的影响。
图10B举例说明在示例性21种代谢物小组的分析中三分法对ASD 的可预测性的影响。
图11A举例说明与用于分析示例性12种代谢物小组的非投票方法 相比,使用投票方法对ASD的可预测性的改进。
图11B举例说明与使用示例性21种代谢物小组的非投票方法相 比,使用投票方法对ASD的可预测性的改进。
图12举例说明使用示例性12种代谢物小组来实现ASD高可预测 性的验证过程。
图13A-13U举例说明21种示例性代谢物在ASD群体和非ASD群体 中的群体分布。
图14A-B举例说明通过从总共600种代谢物中包括和排除示例性 的12种代谢物小组、示例性的21种代谢物小组和一组84种候选代谢 物而产生的对ASD可预测性的影响,如通过尾部效应分析和平均偏移 分析评估的。(黑名单=排除,白名单=包括,mx_12=示例性12种代谢 物小组,mx_targeted 21=示例性21种代谢物小组, mx-all-candidates=84种候选代谢物,所有特征=600种代谢物的总 集)
图14C-D举例说明通过从总共600种代谢物中包括(白名单)和排 除(黑名单)示例性12种代谢物小组和示例性21种代谢物中小组产生 的对ASD可预测性的影响,如通过尾部效应分析和平均偏移分析、以 及通过比较逻辑回归与贝叶斯分析在两个样品组群(即,“圣诞节” ("Christmas")和复活节("Easter"))中评估的。(黑名单=排除, 白名单=包括,mx_12=示例性12种代谢物小组,mx_targeted 21=示例 性21种代谢物小组,mx-all-candidates=84种候选代谢物,所有特 征=600种代谢物的总集)
图15举例说明通过使用增加数目的选自示例性21种代谢物小组 的亚组的代谢物而对ASD的可预测性产生的影响。
图16A举例说明使用示例性12种代谢物小组将遗传信息添加至尾 部效应分析的效果,证明了将ASD与非ASD分开的功效提高。
图16B举例说明使用示例性21种代谢物小组将遗传信息添加至尾 部效应分析的效果,证明了将ASD与非ASD区分开的功效提高。
图17A-B举例说明通过比较尾部效应分析与平均偏移分析以及通 过比较逻辑回归与贝叶斯分析来说明通过从总数目代谢物中包含和排 除示例性21种代谢物小组对ASD可预测性产生的影响。(黑名单=排除, 白名单=包括,mx_12=示例性12种代谢物组,mx_targeted 21=示例性 21种代谢物小组,mx_all_candidates=84种候选代谢物,所有特征=600种代谢物的总集)
图18A-B通过比较尾部效应分析与平均偏移分析,以及通过在两 个群组(即,"Christmas"和"Easter")中使用逻辑回归来说明,通过从 总数目代谢物中包含和排除示例性21种代谢物小组对ASD可预测性产 生的影响。(黑名单=排除,白名单=包括,mx_12=示例性12种代谢物 组,mx_targeted 21=示例性21种代谢物小组,mx_all_candidates=84种候选代谢物,所有特征=600种代谢物的总集)
图19A-D举例说明通过使用"Christmas"组群,或"Easter"组群, 或组合两者,比较尾部效应分析与平均偏移分析,以及比较逻辑回归 与贝叶斯分析来说明,通过从总数目代谢物中包含和排除示例性的21 种代谢物小组对ASD可预测性产生的影响。(黑名单=排除,白名单= 包括,mx_12=示例性12种代谢物组,mx_targeted 21=示例性21种代 谢物小组,mx所有候选物=84种候选代谢物,所有特征=600种代谢物 的总集)
图20举例说明示例性21种代谢物小组的尾部效应分析用于预测 ASD的特异性和灵敏度的代表性曲线图。
图21举例说明评分系统,其中基于ASD和DD预测性代谢物的比 值比的log 2值的总和计算ASD或DD的风险得分。
定义
为了更容易地理解本发明,首先在下面定义某些术语。在整个说 明书中阐述了以下术语和其他术语的附加定义。
在本申请中,除非根据上下文另有说明,否则(i)术语“一个/种 (a)”可被理解为是指“至少一个”;(ii)术语“或”可以理解为是指 “和/或”;(iii)术语“包含”和“包括”可以被理解为包括详细例 举的组件或步骤,无论是由它们本身还是与一个或多个附加的组件或 步骤一起呈现;和(iv)术语“约”和“大约”可以被理解为允许如由 本领域普通技术人员所理解的标准变化;和(v)当提供范围时,包括端 点。
药剂:本文所用的术语“药剂”可以指任何化学类别的化合物或 实体,包括例如多肽、核酸、糖类、脂质,小分子、金属或其组合。
大约:如本文所使用的,术语“近似”、“大约”或“约”旨在 涵盖如本领域普通技术人员根据相关上下文所理解的正常统计变化。 在某些实施方案中,除非另有说明或从上下文中明显看出(除其中这样 的数字超过可能值的100%外),否则术语“近似”、“大约”或“约” 是指以任一方向(大于或小于)落在所述参照值的25%、20%、19%、 18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、 7%、6%、5%、4%、3%、2%、1%或更小)内的一系列值。
曲线下面积(AUC):分类器具有将假阳性率(1-特异性)相对于真实 阳性率(灵敏度)绘制的相关ROC曲线(受试者工作特征曲线)。ROC曲 线下面积(AUC)是分类器能够区分两个诊断组的程度的量度。与AUC 为0.5的随机分类器相比,完美分类器具有1.0的AUC。
与……相关联:如果一个事件或实体的存在、水平和/或形式与另 一个事件或实体的存在、水平和/或形式相关,则所述两个事件或实体 彼此“相关联”,如该术语在本文中所使用的。例如,如果特定实体 的存在、水平和/或形式与疾病、病症或病况的发病率和/或易感性相 关(例如,在整个相关群体中),则所述特定实体被认为与该特定疾病、 病症或病况相关。
自闭症谱系病症:如本文所用,术语“自闭谱系病症”被本领域 技术人员认为是指以有关自闭症“谱”的发育病症,其特征在于交互 社交缺陷、语言困难、重复行为和限制性兴趣中的一种或多种。自闭 症谱系病症已在DSM-V(2013年5月)中被描述为包括连续的症状的病 症,包括例如沟通障碍,诸如在交谈中不适当地响应,错读非语言交 互作用,难以建立适合年龄的友谊,过度依赖于常规,对他们的环境 变化高度敏感,和/或强烈关注不适当的项目。自闭症谱系病症另外地 已例如通过DSM-IV-TR表征为包括自闭症、阿斯伯格病症、Rett氏病 症、儿童崩解病症和未以其它方式说明的广泛性发育病症(包括非典型 自闭症)。在一些实施方案中,使用标准化测试仪器诸如问卷和观察时 间表来表征自闭症谱系病症(ASD)。例如,在一些实施方案中,ASD的 特征在于(i)满足自闭症诊断观察时间表(ADOS)中的关于沟通加社交 互动总计(Communication plus Social InteractionTotal)的截止 值的得分,以及满足自闭症诊断面试修订版(Autism DiagnosticInterview-Revised)(ADI-R)中的关于≤36个月时的社交互动、沟通、 行为模式和发育异常性的截止值的得分;和/或(ii)满足ADOS中关于 沟通和社交互动总计的ASD截止值的得分,以及满足在ADI-R中关于 ≤36个月时社会互动、沟通、行为模式和发育异常的截止值的得分, 以及(ii)(a)满足ADI-R中关于社交互动和沟通的截止值的得分,或 (ii)(b)满足ADI-R中关于社交互动或沟通的截止值和在关于社互动 或沟通截止值的2个点内(其不满足截止值)的得分,或(ii)(c)在 ADI-R中社交互动和沟通的截止值的1个点内的得分。
分类:如本文所用,“分类”是通过在已知类别内的收集的数据 点之间找到共同特征,然后使用数学方法或其他方法将数据点分配至 这些不同类别之一来学习将数据点分成不同类别的过程。在统计学中, 分类是基于包含其子群体已知的观测的训练数据集来鉴定新观测所属 的子群体(其中所述子群体的身份是未知的)的问题。因此,其要求是 基于对一个或多个测量、性状或特征等的定量信息,并且基于其中已 经建立先前确定的分组的训练组,将新的单独项目归到组中。分类有 很多应用。在一些情况下,其被用作数据挖掘过程,而在其他情况下, 进行更详细的统计建模。
分类器:如本文所用,“分类器”是用于执行数据分类的方法、 算法、计算机程序或系统。广泛使用的分类器的实例包括但不限于神 经网络(多层感知器)、逻辑回归、支持向量机、k-最近邻、高斯混合 模型、高斯朴素贝叶斯、决策树、偏最小二乘法行列式分析(partial-least-squares determinant analysis)(PSL-DA)、Fisher 线性判别、逻辑回归、朴素贝叶斯分类器、感知器、支持向量机、二 次分类器、Kernet估计、Boosting、神经网络、贝叶斯网络、隐马尔 科夫模型和学习矢量量化。
确定:本文描述的许多方法包括“确定”的步骤。通过阅读本说 明书,本领域普通技术人员将理解,这种“确定”可以利用或通过使 用本领域技术人员可用的各种技术中的任何技术来实现,所述技术包 括例如明确提及的特定技术。在一些实施方案中,确定涉及物理样品 的操作。在一些实施方案中,确定涉及对数据或信息的考虑和/或操作, 例如利用适于执行相关分析的计算机或其他处理单元。在一些实施方 案中,确定涉及从源接收相关信息和/或材料。在一些实施方案中,确 定包括将样品或实体的一个或多个特性与可比较的参照进行比较。
确定风险:如本文所用,确定风险包括计算或量化给定受试者具 有或不具有特定病况或病症的概率。在一些实施方案中,可完全或部 分基于确定的风险或风险得分(例如,比值比或范围)进行病症或疾病 (例如,自闭症谱系病症(ASD)或发育迟缓(DD))的阳性或阴性诊断。
发育迟缓:如本文所用,短语发育迟缓(DD)是指儿童发育的一个 或多个过程,包括例如身体发育、认知发展、沟通发展、社交或情感 发展或适应性发展的持续性或大或小延迟,所述延迟不是由自闭症谱 系病症造成的。即使具有ASD的个体可能被认为是发育迟缓的,但本 文使用的ASD的分类将被认为胜于DD的分类,因此ASD和DD的分类 是相互排斥的。换句话说,除非另有说明,否则DD的分类被视为指非 ASD的发育延迟。在一些实施方案中,DD的特征在于非自闭症(AU)和 非ASD,但是(i)在Mullen量表上的得分为69或更低,在Vineland 量表上得分为69或更低,以及在SCQ上的得分为14或更低,或(ii) 在Mullen或Vineland上的得分为69或更低,并且在另一评估(得分 77或更低)上的得分在截止值标准偏差的一半以内。
诊断信息:如本文所用,诊断性信息或用于诊断的信息是在确定 患者是否患有疾病或病症和/或将疾病或病症分类为表型类别或对疾 病或病况的预后,或对疾病或病况的治疗(一般治疗或任何特定治疗) 的可能反应具有重要性的任何类别中有用的任何信息。类似地,诊断 是指提供任何类型的诊断信息,包括但不限于受试者是否可能患有疾 病或病况(诸如,自闭症谱系病症)、在受试者中所表现的疾病或病况 的状态、分期或特征,与病症的性质或分类相关的信息,与预后相关 的信息和/或在选择适当治疗中有用的信息。治疗的选择可包括选择特 定的治疗剂或其它治疗方式,诸如行为治疗、饮食改变等,关于是否 放弃或进行治疗的选择,与给药方案相关的选择(例如,特定治疗剂或 治疗剂的组合的一个或多个剂量的频率或水平)等
标志物:如本文所用,标志物是指其存在或水平与特定疾病或病 况相关或具有相关性的药剂。可选择地或另外,在一些实施方案中, 特定标志物的存在或水平例如与特定信号传导途径的活性(或活性水 平)相关,所述信号传导途径可能是特定病症的特征。标志物可能在或 可能不在该疾病或病症中发挥病原学作用。标志物的存在或不存在的 统计显著性可以根据具体标志物而变化。在一些实施方案中,标志物 的检测是高度特异性的,因为其反映病症属于特定亚类的高概率。根 据本发明,有用的标志物不需要以100%的准确度区分特定亚类的病 症。
代谢物:如本文所用,术语代谢物是指在身体化学或物理过程中 产生的物质。术语“代谢物”包括代谢过程的任何化学或生物化学产 物,诸如通过生物分子的加工、裂解或消耗产生的任何化合物。这样 的分子的实例包括但不限于:酸和相关化合物;单、二和三羧酸类(饱 和、不饱和以及脂族和环状、芳基、烷芳基);醛酸类、酮酸类;内酯 形式;赤霉素;脱落酸;醇、多元醇、衍生物和相关化合物;乙醇、 苄醇、甲醇;丙二醇、甘油、植醇;肌醇、糠醇、薄荷醇;醛、酮、 醌、衍生物和相关化合物;乙醛、丁醛、苯甲醛、丙烯醛、糠醛、乙 二醛;丙酮、丁酮;蒽醌;碳水化合物;单糖、二糖、三糖;生物碱、 胺和其他碱;吡啶(包括烟酸、烟酰胺);嘧啶(包括胞嘧啶、胸腺嘧啶); 嘌呤(包括鸟嘌呤、腺嘌呤、黄嘌呤/次黄嘌呤、激动素);吡咯;喹啉 (包括异喹啉);吗啡喃、托烷、辛可宁类(cinchonans)、核苷酸、 寡核苷酸、衍生物和相关化合物;鸟苷、胞嘧啶、腺苷、胸苷、肌苷; 氨基酸、寡肽、衍生物和相关化合物;酯;酚类和相关化合物;杂环 化合物和衍生物;吡咯、四吡咯(类咕啉和卟吩/卟啉、w/w/o金属离 子);黄酮类;吲哚;脂质(包括脂肪酸和甘油三酯)、衍生物和相关化 合物;类胡萝卜素、八氢番茄红素和固醇、类异戊二烯类,包括萜烯; 和上述分子的修饰形式。在一些实施方案中,代谢物是内源性物质的 代谢的产物。在一些实施方案中,代谢物是外源物质的代谢的产物。 在一些实施方案中,代谢物是内源物质和外源物质的代谢的产物。如 本文所使用的,术语“代谢组”是指体液、细胞、组织、器官或生物 体中代谢物的化学分布或指纹。
代谢物分布曲线:如本文所用,代谢物分布曲线是由将代谢物水 平针对群体密度(例如,ASD或DD)作图的函数确定的概率分布曲线。 在一些实施例中,分布曲线是数据的标准曲线拟合。在一些实施方案 中,分布曲线是最小二乘多项式曲线拟合。在一些实施例中,分布曲 线是不对称的或非高斯的。在一些实施方案中,分布曲线仅仅是具有 相关诊断类别的病例对比代谢物值的曲线图(例如,“地块图”),其 中没有曲线拟合。
共同信息(mutual information):如本文所用,共同信息指的 是两个变量的共同依赖性的度量(即,知道一个变量降低了关于另一个 变量的不确定性的程度)。高的相互信息指示不确定性的大幅度减小; 低共同信息表示小的减少;两个随机变量之间的零共同信息意味着变 量是独立的。
非自闭症谱系病症(非ASD):如本文所用,非自闭症谱系病症(非 ASD)是指不是具有自闭症谱系病症的儿童或成人的分类。在一些实施 方案中,“非ASD”通常是发展中的受试者。在一些实施方案中,非 ASD群体由具有发育迟缓(DD)的受试者组成或包含具有发育迟缓(DD) 的受试者。在一些实施方案中,“非ASD”由DD和正常发展的受试者 组成或包含DD和正常发展的受试者。
患者:如本文所用,术语“患者”或“受试者”是指例如为了实 验、诊断、预防和/或治疗目的进行施用或可以施用测试或组合物的任 何生物体。在一些实施方案中,患者罹患或易患一种或多种病症或病 况。在一些实施方案中,患者显示障碍或病症的一种或多种症状。在 一些实施方案中,怀疑患者患有一种或多种障碍或病况。
可预测性:如本文所用,可预测性是指可以定性或定量地进行受 试者疾病状态的正确预测或预报的程度。完全可预测性意味着严格的 确定,但缺乏可预测性并不一定意味着缺乏确定。对可预测性的限制 可能是由诸如缺乏信息或过度复杂等因素造成的。
预后和预测信息:如本文所用,术语预后信息和预测信息可互换 使用,是指可用于指示疾病或病况过程的任何方面的任何信息,无论 存在还是不存在治疗。这样的信息可以包括但不限于患者的疾病被治 愈的可能性,患者疾病将对特定治疗反应的可能性(其中反应可以以多 种方式中的任一种定义)。预后和预测信息包括在诊断信息的广泛类别 中。
参照:术语“参照”在本文中通常用于描述针对其比较目标试剂、 个体、群体、样品、序列或数值的标准或对照试剂、个体、群体、样 品、序列或数值。在一些实施方案中,与目标试剂、个体、群体、样 品、序列或数值的测试或测定基本上同时地测试和/或测定参照试剂、 个体、群体、样品、序列或数值。在一些实施方案中,参照试剂、个 体、群体、样品、序列或数值是历史参照,其任选地体现在有形介质 中。通常,如本领域技术人员将理解的,在与用于测定或表征目标试 剂、个体、群体、样品、序列或数值的那些条件相当的条件下测定或 表征参照试剂、个体、群体、样品、序列或数值。
回归分析:如本文所用,“回归分析”包括用于对数个变量建模 和分析的任何技术,其中焦点在于因变量与一个或多个独立变量之间 的关系。更具体地,回归分析有助于理解当任何一个独立变量变化、 而其他独立变量保持固定时,因变量的典型值是如何变化的。最常见 地,回归分析估计在独立变量时因变量的条件性期望值-即当独立变量 保持固定时,因变量的平均值。较不常见的是,焦点在于给定独立变 量时,因变量的条件性分布的分位数或其他位置参数。在所有情况下, 估计目标是独立变量的函数,称为回归函数。在回归分析中,也有兴 趣表征回归函数周围的因变量变化,其可通过概率分布来描述。回归 分析广泛用于预测和预报,其中回归分析的使用与机器学习领域有实 质重叠。回归分析也用于理解哪些独立变量与因变量相关,以及探索 这些关系的形式。在有限的情况下,回归分析可用于推断独立变量与 因变量之间的因果关系。已经开发了用于进行回归分析的大量技术。 熟悉的方法诸如线性回归和普通最小二乘回归是参数化的,因为回归 函数是根据从数据估计的有限数量的未知参数来定义的。非参数回归 是指允许回归函数以指定的一组函数存在的技术,所述函数可以是无 限维的。
风险:如将从上下文理解的,疾病、病症或病况的“风险”是特 定个体将被诊断为患有或将发展疾病、病症或病况的可能性的程度。 在一些实施方案中,风险表示为百分比。在一些实施方案中,风险为 0%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%直至100%。在一些 实施方案中,风险表示为相对于与参照样品或参照样品组相关联的风 险的风险。在一些实施方案中,参照样品或参照样品组具有疾病、病 症或病况的已知风险。在一些实施方案中,参照样品或参照样品组来 自与特定个体相当的个体。在一些实施方案中,相对风险度为0、1、 2、3、4、5、6、7、8、9、10或更多。在一些实施方案中,相对风险 度可表示为相对风险度(RR)或比值比(Odds Ratio,OR)。
样品:如本文所用,术语“样品”通常是指如本文所述的获自或 源自目标来源的生物样品。在一些实施方案中,目标来源包括生物体, 诸如动物或人。在一些实施方案中,生物样品是或包含生物组织或流 体。在一些实施方案中,生物样品可以是或包含骨髓;血液;血浆; 血清;血细胞;腹水;组织或细针活检样品;含细胞的体液;自由漂 浮的核酸;痰液;唾液;尿;脑脊液液体、腹膜液、胸膜液、粪便、 淋巴液、妇科液、皮肤拭子、阴道拭子、口腔拭子、鼻拭子;诸如导 管灌洗液或支气管肺泡灌洗液等洗涤或灌洗液;吸出物;刮取物;骨 髓样本;组织活检样本;外科样本;粪便、其他体液、分泌物和/或排 泄物;和/或来自其的细胞等。在一些实施方案中,生物样品是或包含 从个体获得的细胞。在一些实施方案中,获得的细胞是或包含来自从 其获得样品的个体的细胞。在一些实施方案中,样品是通过任何适当的方式从目标来源直接获得的“初级样品”。例如,在一些实施方案 中,通过选自以下的方法获得初级生物样品:活组织检查(例如,细针 抽吸或组织活检)、手术、体液收集(例如,血液、淋巴、粪便等)等。 在一些实施方案中,如从上下文将清楚的,术语“样品”是指通过加工初级样品(例如,通过除去其中的一种或多种组分和/或通过将一种 或多种试剂添加至其中)获得的制剂。例如,使用半透膜进行过滤。这 种“加工的样品”可以包含例如从样品提取的核酸或蛋白质,或通过 使初级样品经受诸如mRNA的扩增或逆转录、某些组分的分离和/或纯 化等技术而获得的核酸或蛋白质。
受试者:“受试者”是指哺乳动物(例如人,在一些实施例中,包 括出生前人形式)。在一些实施方案中,受试者患有相关疾病、病症或 病况。在一些实施方案中,受试者对疾病,病症或病况敏感。在一些 实施方案中,受试者显示疾病、病症或病况的一种或多种症状或特征。 在一些实施方案中,受试者不显示疾病、病症或病况的任何症状或特 征。在一些实施方案中,受试者是具有对疾病、病症或病况的易感性 或风险特征的一个或多个特征的人。受试者可以是患者,其是指到医 疗提供者处进行疾病的诊断或治疗的人。在一些实施方案中,受试者 是被施予治疗的个体。
基本上:如本文所使用的,术语“基本上”是指表现出目标特征 或性质的总体或接近总体程度或水平的定性条件。生物领域的普通技 术人员将理解,生物和化学现象很少(如果有的话)达到完全和/或进行 至完全或实现或者避免绝对结果。因此,本文使用术语“基本上”来 涵盖许多生物和化学现象中固有的潜在缺乏完全性。
患有:“患有”疾病、障碍或病况的个体已经被诊断为患有和/ 或表现出或已表现出所述疾病、障碍或病况的一种或多种症状或特征。
易感于:对疾病、病症或病况“易感”的个体处于发展疾病、病 症或病况的风险中。在一些实施方案中,已知这样的个体具有与相关 疾病、病症和/或病况的发展的风险增加统计上相关的一种或多种易感 性因素。在一些实施方案中,易患疾病、病症或病况的个体不显示该 疾病、病症或病况的任何症状。在一些实施方案中,对疾病、病症或 病况敏感的个体未被或尚未被诊断为患有所述疾病、病症和/或病况。 在一些实施方案中,对疾病、病症或病况敏感的个体是已经暴露于与 所述疾病、病症或病况发展相关的条件下的个体。在一些实施方案中, 发展疾病、病症和/或病况的风险是基于群体的风险(例如,患有过敏 的个体的家族成员等)
尾部富集和尾部效应:如本文所用,术语“尾部富集”或“尾部 效应”是指代谢物(或其他分析物)显示的分类增强性质,所述代谢物 在代谢物水平的分布曲线的远端部分在来自特定群体的样品中具有相 对高浓度。“上尾部”或“右尾部”是指分布曲线的远端部分大于平 均值。“下尾部”或“左尾部”是指分布曲线的远端部分低于平均值。 在一些实施方案中,尾部由基于排名的预先确定阈值确定。例如,如 果样品对于某种代谢物的测量值高于对应于群体中该代谢物的从第 85至第95(例如,第90)百分位数的值,或者低于对应于群体中该代 谢物的从第10至第20(例如,第15)百分位数的值,则样品被指定为 在尾部内。
治疗剂:如本文所用,短语“治疗剂”是指当向受试者施用时具 有治疗效果和/或引起所需的生物学和/或药理学效应的任何试剂。在 一些实施方案中,如果药剂对于相关群体的施用与群体中期望的或有 益的治疗结果在统计上相关,则无论施用该药剂的特定受试者是否经 历所述期望的或有益的治疗结果,所述药剂被认为是治疗剂。
训练集(training set):如本文所用,“训练集”是在信息科学 的各个领域中用来发现潜在的预测关系的一组数据。训练集被用于人 工智能、机器学习、遗传编程、智能系统和统计。在所有这些领域中, 训练集具有相同的作用,并且通常与测试集结合使用。
测试集(test set):如本文所用,“测试集”是在信息科学的 各个领域中用来评估预测关系的强度和效用的一组数据。测试集可用 于人工智能、机器学习、遗传编程、智能系统和统计。在所有这些领 域中,测试集具有相同的作用。
治疗:如本文所用,术语“治疗”(也称为“医疗”或“医治”) 是指部分或完全缓解、改善、减轻、抑制、延迟特定疾病、病症和/ 或病况的一种或多种症状、特征和/或原因的发作,降低其严重度和/ 或降低其频率、发病率或严重度的物质或治疗(例如,行为治疗)的任何施用。这样的治疗可以是对未表现出相关疾病、病症和/或病况的体 征的受试者和/或仅表现出所述疾病、病症和/或病况的早期体征的受 试者进行的治疗。可选择地或另外,这样的治疗可以是对表现出相关 疾病、病症和/或病况的一种或多种确定的体征的受试者进行的治疗。 在一些实施方案中,治疗可以是对已被诊断为患有相关疾病、病症和/ 或病况的受试者进行的治疗。在一些实施方案中,治疗可以是对已知 具有与相关疾病、病症和/或病况发展的风险增加在统计上相关的一种 或多种易感性因子的受试者进行的治疗。
发明详述
本发明提供了用于基于样品(例如,血液样品或血浆样品)中代谢 物水平的特异性分析来确定受试者中自闭症谱系病症(ASD)的风险的 方法和系统。本发明的各个方面在以下部分中详细描述。部分和标题 的使用并不意味着限制本发明。每个部分可应用于本发明的任何方面。 在本申请中,除非另有说明,否则“或”的使用意味着“和/或”。
自闭症谱系病症
自闭症谱系病症(ASD)的临床诊断的标准已在Diagnostics and StatisticalManual of Mental Disorders,第5版(DSM-V,2013年 5月出版)中阐述。
另外ASD已例如通过DSM-IV-TR表征为包括自闭症、阿斯伯格病 症、Rett氏障碍、儿童崩解性障碍和未指定的广泛性发育障碍(包括 非典型性自闭症)。
在一些实施方案中,ASD的特征在于(i)满足ADOS中的关于沟通 加社交互动总计(Communication plus Social Interaction Total) 的截止值的得分,以及满足自闭症诊断面试修订版(Autism Diagnostic Interview-Revised)(ADI-R)中的关于≤36个月时的社交 互动、沟通、行为模式和发育异常性的截止值的得分;和/或(ii)满足 ADOS中关于沟通和社交互动总计的ASD截止值的得分,以及满足在 ADI-R中关于≤36个月时社会互动、沟通、行为模式和发育异常的截 止值的得分,以及(ii)(a)满足ADI-R中关于社交互动和沟通的截止值 的得分,或(ii)(b)满足ADI-R中关于社交互动或沟通的截止值和在关 于社互动或沟通截止值的2个点内(其不满足截止值)的得分,或 (ii)(c)在ADI-R中社交互动和沟通的截止值的1个点内的得分。
发育迟缓
发育迟缓是儿童发育的一个或多个过程,包括例如身体发育、认 知发展、沟通发展、社交或情感发展或适应性发展中或大或小的延迟, 所述延迟不是由ASD造成的。在一些实施方案中,DD的特征在于非自 闭症(AU)和非ASD,其(i)在Mullen量表上得分为69或更低,在 Vineland量表上得分为69或更低,在SCQ上得分为14或更低,或(ii) 在Mullen或Vineland上得分为69或更低,并且在另一评估上在截止 值的半个标准偏差以内(得分77或更低)。即使具有ASD的个体可以被 认为是发育迟缓的,但本文使用的ASD的分类将被认为优先于DD的分 类,从而ASD和DD的分类是相互排斥的。
ASD的风险评估
呈现受损的语言、行为或社会发展的症状的儿童通常可以被临床 医生看到(最常见地在初级保健环境中),但其不能确定该儿童是否患 有ASD或一些其他病况、病症或分类(例如,DD)。对儿童进行诊断, 特别是在大量语言发展之前的年龄进行诊断是很困难的,许多初级保 健医生没有能力或资源来对其患者进行鉴别诊断。例如,ASD可能不 容易与其他发育病症、病况或分类(例如DD)区分开。
评估受试者中ASD的风险(包括非ASD和DD的概率)以及区分ASD 与DD是有用的。ASD的风险评估为早期干预和治疗提供了机会。例如, 非专科医生可使用ASD风险评估来启动向专科医生的转诊。专科医生 可使用ASD风险评估来优先进行对患者的进一步评估。ASD风险的评 估还可用于在最终诊断之前建立临时诊断,在该时间期间可向高风险 儿童以及他或她的家人提供便利服务。
本文描述了用于确定受试者中ASD的风险的方法。在一些实施方 案中,确定ASD风险包括确定受试者具有ASD的机会是否大于约50%。 在一些实施方案中,确定ASD风险包括确定受试者具有ASD的机会大 于约60%、65%、70%、74%、80%、85%、90%、95%或98%。在 一些实施方案中,确定ASD风险包括确定受试者具有ASD。在一些实 施方案中,确定ASD风险包括确定受试者不具有ASD(即,非ASD)。
在一些实施方案中,本发明提供了用于区分受试者的ASD与非ASD 分类(例如,DD)的方法。在一些实施方案中,将ASD与非ASD分类/ 病况区分包括确定受试者具有ASD而不是非ASD分类的机会大于约 60%、65%、70%、74%、80%、85%、90%、95%或98%(即,具 有ASD而不具有非ASD分类的机会)。在一些实施方案中,非ASD分类 是DD。在一些实施例中,非ASD分类是“正常的”。
在一些实施方案中,本发明提供了用于确定受试者不具有ASD或 DD的方法。
分析方法
本文描述了用于评估ASD风险或区分ASD与其它非ASD发育病症 的方法。在一些实施方案中,风险评估是(至少部分地)基于来自受试 者的样品例如血液样品中代谢物的测量和表征。在一些实施方案中, 血浆样品来源于血液样品,并且分析血浆样品。
代谢物可以以多种方式检测,包括基于色谱和/或质谱法的测定、 荧光测定、电泳、免疫亲和、杂交、免疫化学、紫外光谱(UV)、荧光 分析、放射化学分析、近红外光谱(近IR)、核磁共振光谱(NMR)、光 散射分析(LS)和比浊法。
在一些实施方案中,通过单独的或与质谱联用的液相或气相色谱 或离子迁移率(电泳)或通过单独的质谱法分析代谢物。这样的方法已 被用于鉴定和定量生物分子,诸如细胞代谢物。(参见,例如Li等, 2000;Rowley等,2000;以及Kuster和Mann,1998)。质谱法可基 于例如四极离子阱或飞行时间质谱法,具有单、双或三重质荷比扫描 和/或过滤(MS、MS/MS或MS3),并在合适的电离方法诸如电喷雾电离、 大气压化学电离、大气压光电离、基质辅助激光解吸电离(MALDI)或表 面增强激光解吸电离(SELDI)之后进行。(参见,例如,国际专利申请 公开号WO 2004056456和WO 2004088309)。在一些实施方案中,代谢 物从生物样品中的第一分离可通过使用气相或液相色谱或离子迁移/ 电泳来实现。在一些实施方案中,质谱方法的电离可以通过电喷雾电 离、大气压化学电离或大气压光电离来实现。在一些实施例中,质谱 仪器包括四极,离子阱或飞行时间或傅里叶变换仪器。
在一些实施方案中,通过非靶向的超高性能液体或气相色谱/电喷 雾或大气压化学电离串联质谱平台(经优化用于生物系统的小分子补 体的鉴定和相对定量)在质量标度上分析代谢物。(参见,例如,Evans 等人,Anal.Chem。,2009,81,6656-6667)。
在一些实施方案中,代谢物与生物样品的第一分离可通过使用气 相或液相色谱或离子迁移/电泳来实现。在一些实施方案中,质谱方法 的电离可通过电喷雾电离、大气压化学电离或大气压光电离来实现。 在一些实施方案中,质谱仪器包括四极,离子阱或飞行时间或傅里叶 变换仪器。
在一些实施方案中,对含有目标代谢物的血液样品离心以将血浆 与其他血液成份分离。在某些实施方案中,内部标准是不必要的。在 一些实施方案中,将规定量的内标添加至血浆(其一部分)中,然后加 入甲醇以沉淀血浆成分诸如蛋白质。通过离心将沉淀与上清液分离, 并收获上清液。如果为了更精确的检测而增加目标代谢物的浓度,则 蒸发上清液,并将残余物溶解在适量的溶剂中。如果目标代谢物的浓 度不希望地高,则将上清液在合适的溶剂中稀释。将合适量的含有代 谢物的样品加载到用流动相A与流动相B的适当混合物平衡的液相色 谱柱上。在反相液相色谱的情况下,流动相A通常是具有或不具有少 量添加剂诸如甲酸的水,流动相B通常为甲醇或乙腈。将适当梯度的 流动相A和流动相B泵送通过柱,以通过保留时间或从柱洗脱的时间 来实现目标代谢物的分离。当代谢物从柱中洗脱时,它们被离子化并 被带入气相,并且通过质谱法检测和定量离子。通过对特定前体离子 和由前体离子产生的特定产物离子进行双重过滤来实现检测的特异 性。绝对定量可以通过将来自目标代谢物的离子计数针对给定代谢物 的已知量内标产生的离子计数标准化,以及通过将标准化离子计数与 使用已知量的纯代谢物和内标建立的校准曲线进行比较来获得。内标 通常是纯代谢物的稳定同位素标记形式或代谢物的结构类似物的纯形式。或者,可通过针对选定的内部参照值(例如,给定组中运行的所有 样品的代谢物水平的中位值)标准化来计算以任意单位表示的给定代 谢物的相对定量。
在一些实施方案中,通过免疫测定来测量一种或多种代谢物。
许多特异性免疫测定形式及其变体可用于代谢物的测量。(参见, 例如,E.Maggio,Enzyme-Immunoassay,(1980)(CRC Press,Inc., Boca Raton,Fla.);还参见美国专利号4,727,022“Methods for Modulating Ligand-Receptor Interactions andtheir Application”;美国专利号4,659,678“Immunoassay of Antigens”; 美国专利号4,376,110,“Immunometric Assays Using Monoclonal Antibodies”;美国专利号4,275,149,“Macromolecular Environment Control in Specific Receptor Assays”;美国专利号4,233,402, “Reagents and Method Employing Channeling”和美国专利号 4,230,767,“Heterogenous Specific Binding Assay Employing a Coenzyme as Label”)。可按照已知技术诸如被动结合将抗体缀合于 适合于诊断测定的固体载体(例如,珠子,诸如蛋白质A或蛋白质G 琼脂糖、微球体、平板、载玻片或由诸如胶乳或聚苯乙烯的材料形成 的孔)。同样,可按照已知技术将本文所述的抗体缀合于可检测标记或 基团,诸如放射性标记(例如,35S、125I、131I)、酶标记(例如,辣根过 氧化物酶、碱性磷酸酶)和荧光标记(例如,荧光素、Alexa、绿色荧光 蛋白)。
ASD风险的确定
在一些实施方案中,本发明的方法允许本领域技术人员至少部分 地基于测量获自受试者(其目前可能未表现出ASD和/或其他发育障碍 的体征或症状,但尽管如此仍然可能处于患有或发展ASD和/或其他发 育障碍的风险中)的样品中的代谢物水平来鉴定、诊断或以其他方式评 估所述受试者。
在某些实施方案中,可在测试样品中测量代谢物或其他分析物(例 如,蛋白质组或基因组信息)的水平,并将该水平与正常对照水平或与 具有不是ASD的发育障碍、病症或分类(例如,非ASD发育迟缓、DD) 的受试者中的水平进行比较。在一些实施方案中,术语“正常对照水 平”是指通常在未患ASD或不可能患有ASD或其他发育障碍的受试者 中发现的一种或多种代谢物或其他分析物或指数的水平。在一些实施 方案中,正常对照水平是范围或指数。在一些实施方案中,从先前测 试的受试者的数据库确定正常对照水平。一种或多种代谢物或其他分 析物的水平与正常对照水平相比的差异可以指示受试者具有ASD或处 于发展ASD的风险中。
相反,一种或多种代谢物的水平与一种或多种代谢物或其它分析 物的正常对照水平相比缺少差异能够指示所述受试者不具有ASD或处 于发展ASD的低风险。
在一些实施方案中,参照值是从已知其诊断的对照受试者或群体 (即,已被诊断为患有或被鉴定为患有ASD,或者经诊断不患有或被鉴 定为不患有ASD)获得的值。在一些实施方案中,参照值是指数值或基 线值,诸如本文所述的“正常对照水平”。在一些实施方案中,参照 样品或指数值或基线值取自或来源于已暴露于ASD治疗的一个或多个 受试者,或者可取自或来源于处于发展ASD的低风险的一个或多个受 试者,或者可取自或来源于因暴露于治疗而已显示ASD风险因子改善 的受试者。在一些实施方案中,参照样品或指数值或基线值取自或来 源于尚未暴露于ASD治疗的一个或多个受试者。在一些实施方案中, 从已经接受ASD的初始治疗和/或ASD的后续治疗以监测治疗进展的受 试者收集样品。在一些实施方案中,参照值已从来自ASD的群体研究 的风险预测算法或计算指数中导出。在一些实施方案中,参照值来自 具有除ASD外的疾病或病症(诸如另一种发育障碍,例如非ASD发育迟 缓(DD))的受试者或群体。
在一些实施方案中,通过本发明的方法测量的代谢物水平的差异 包括代谢物水平与正常对照水平、参照值、指数值或基线值相比有升 高或降低。在一些实施方案中,代谢物水平相对于来自正常对照群体、 一般群体或来自具有另一种疾病的群体的参照值有升高或降低指示 ASD的存在,ASD的进展,ASD的加重或者ASD或ASD症状的改善。在 一些实施方案中,代谢物水平相对于来自正常对照群体、一般群体或 来自具有另一种疾病的群体的参照值有升高或降低指示发展ASD或与 其相关的并发症的风险增加或降低。增加或减少可以指示ASD的一种 或多种治疗方案的成功,或者可以指示ASD风险因子的改善或消退。 增加或减少可以是例如参照值的至少5%,至少10%,至少15%,至 少20%,至少25%,至少30%,至少35%,至少40%,至少45%, 或至少50%。
在一些实施方案中,如本文所述的代谢物水平的差异是统计上显 著的差异。“统计学上显著的”是指大于预期仅仅随机发生的差异的 差异。可通过本领域已知的任何方法测定统计学显著性。例如,统计 学显著性可以通过p值来确定。p值是实验期间组之间偶然发生的差 异的概率度量。例如,p值为0.01意味着该结果偶然发生的概率为 1/100。p值越低,组之间的测量的差异就越不可能是偶然的。如果p 值等于或低于0.05,则认为差异是统计上显著的。在一些实施方案中, 统计上显著的p值等于或低于0.04、0.03、0.02、0.01、0.005或0.001。 在一些实施方案中,统计上显著的p值等于或低于0.30、0.25、0.20、 0.15或0.10(例如,在鉴定单一特定代谢物在包括其它代谢物的分类 器中使用时是否具有加成性的预测值的情况下)。在一些实施方案中, 通过t检验确定p值。在一些实施方案中,通过Fisher's检验获得p 值。在一些实施方案中,统计显著性通过分析组中几种代谢物的组合并与数学算法组合以实现统计上显著的风险预测来实现。
分类测试、测定或方法具有将假阳性率(1-特异性)相对于真阳性 率(灵敏度)绘制的相关ROC曲线(接受者操作特征曲线)。ROC曲线下 面积(AUC)是分类器能够区分两个诊断组的程度的量度。最大AUC是 1.0(完美测试),最小面积是0.5(例如,其中正常与疾病没有区分的 区域)。应当理解,当AUC接近1时,测试的准确度增加。
在一些实施方案中,高程度的风险预测准确度是其中AUC至少为 0.60的测试或测定。在一些实施方案中,高程度的风险预测准确度是 其中AUC为至少0.65,至少0.70,至少0.75,至少0.80,至少0.85, 至少0.90或至少0.95的测试或测定。
通过评估尾部效应预测ASD风险
在一些实施方案中,在群体间或群体之间(例如ASD群体与DD群 体之间)或与正常对照群体相比较来评估代谢物水平的平均差异。在一 些实施方案中,评估来自给定群体(即,ASD)的样品的代谢物在分布曲 线的尾部的富集。也就是说,确定与第二群体(例如,DD)相比,来自 指定群体(例如,ASD)的较大比例的样品是否存在于分布曲线的尾部 (即,“尾部效应”)。在一些实施例中,鉴定和利用平均差和尾部效 应。在一些实施例中,尾部由预先确定阈值确定。例如,如果样品对 于某种代谢物的测量值高于群体中对应于该代谢物第90位百分位数 (右尾或上尾)的数值,或者低于对应于第15位百分位数(左尾或下尾) 的数值,则其被指定为位于尾部中。在一些实施方案中,给定代谢物 的右(上)尾的阈值是对应于第80、第81、第82、第83、第84、第85、 第86、第87、第88、第89、第90、第91、第92、第93、第94、第 95、第96、第97、第98或第99百分位数的数值(例如,如果样品对 于给定代谢物的测量高于与该百分位数相关的值,则其被指定在右尾 中)。在一些实施方案中,给定代谢物的左(下)尾的阈值是对应于第 25、第24、第23、第22、第21、第20、第19、第18、第17、第16、 第15、第14、第13、第12、第11、第10、第9、第8、第7、第6、 第5、第4、第3、第2或第1百分位数的数值(例如,如果样品对于 给定代谢物的测量低于与该百分位数相关的数值,则其被指定在左尾 中)。显示的百分位数值包括小数值。
在一些实施方案中,从一个或多个群体的代谢物水平的曲线图中 产生分布曲线。在一些实施方案中,从单个参照群体(例如,一般群体) 产生分布曲线。在一些实施方案中,从两个群体,例如ASD群体和非 ASD群体(诸如DD)产生分布曲线。在一些实施方案中,从三个或更多 个群体(例如ASD群体、非ASD群体但具有另一种发育障碍/病症/分类 诸如DD,和健康例如无发育障碍的对照群体)产生分布曲线。来自每 个群体的代谢物分布曲线可用于进行不止一个风险评估(例如,诊断 ASD,诊断DD,区分ASD与DD)。本文所述的利用尾部效应的评估方法 可应用于两个以上的群体。
在一些实施方案中,多种代谢物及其分布被用于风险评估。在一 些实施方案中,使用两种或更多种代谢物的水平来预测ASD风险。在 一些实施方案中,至少两种代谢物选自表1中列出的代谢物。在一些 实施方案中,至少三种代谢物选自表1中列出的代谢物。在一些实施 方案中,4种、5种、6种、7种、8种、9种、10种、11种、12种、 13种、14种、15种、16种、17种、18种、19种、20种或21种选自 表1中所列代谢物的代谢物被用于预测ASD风险。
表1(表1A至1C)的进一步讨论参见下面的实施例部分。
表1A.具有预示ASDvs.DD的尾部效应的示例性21种代谢物小组
代谢物
3-(3-羟基苯基)丙酸
3-羧基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)
3-吲哚氧基硫酸
4-乙基苯基硫酸
5-羟基吲哚乙酸
8-羟基辛酸
γ-CEHC
羟基异戊酰肉碱(C5)
吲哚乙酸
异戊酰甘氨酸
乳酸
N1-甲基-2-吡啶酮-5-甲酰胺
硫酸对甲酚
泛酸(维生素B5)
苯乙酰谷氨酰胺
哌可酸
黄嘌呤
羟基-百菌清
辛烯酰基肉碱
3-羟基马尿酸
1,5-脱水葡糖醇(1,5-AG)
表1B.具有预示ASD的尾部富集的示例性代谢物
Figure BDA0001163272540000381
表1C.具有预示DD的尾部富集的示例性代谢物
Figure BDA0001163272540000382
在一些实施方案中,用于分析的至少两种代谢物选自苯乙酰谷氨 酰胺、黄嘌呤、辛烯酰肉碱、硫酸对甲酚、异戊酰甘氨酸、γ-CEHC、 吲哚乙酸、哌可酸、1,5-脱水葡糖醇(1,5-AG)、乳酸、3-(3-羟基苯基) 丙酸、3-吲哚氧基硫酸、泛酸(维生素B5)、羟基-百菌清及其组合。
在一些实施方案中,用于分析的至少三种代谢物选自苯乙酰谷氨 酰胺、黄嘌呤、辛烯酰基肉碱、硫酸对甲酚、异戊酰甘氨酸、γ-CEHC、 吲哚乙酸、哌可酸、1,5-脱水葡糖醇(1,5-AG)、乳酸、3-(3-羟基苯基) 丙酸、3-吲哚氧基硫酸、泛酸(维生素B5)、羟基-百菌清及其组合。
在一些实施方案中,关于特定组的代谢物缺乏尾部效应的信息被 用于风险评估。在一些实施方案中,确定尾部效应的缺乏以提供无效 结果(即,与负信息相反,是没有信息)。在一些实施方案中,尾部效 应的缺乏被确定为指示一种分类优于另一种分类(例如,相对于ASD, 更多地指示DD)。
在一些实施例中,分布曲线是不对称的或非高斯的。
在一些实施例中,分布曲线不遵循参数分布模式。
在一些实施例中,将来自平均差异(例如,平均偏移)的信息与用 于风险评估的尾部效应信息组合。在一些实施例中,来自平均差异的 信息被用于风险评估而不使用尾部效应信息。
在一些实施方案中,将代谢物的分析与其他类型的信息例如遗传 信息、人口统计学信息和/或行为评估组合以确定受试者患ASD或其他 疾病的风险。
在一些实施方案中,至少部分地基于从受试者获得的生物样品(例 如,血液、血浆、尿液、唾液、粪便)中某些代谢物的测量量进行ASD 风险评估,其中某些代谢物在本文中被发现表现出“尾部效应”。本 发明人已经发现,在与尾部效应相关的两个群体之间不一定具有统计 上显著的平均偏移。因此,尾部效应是不同于平均偏移的一个特定现 象。
在某些实施方案中,当代谢物被表征为下述时,该特定代谢物表 现出指示ASD群体而不是非ASD群体(例如DD群体)的右尾效应:
●为非ASD群体(例如DD群体)中的该代谢物建立非ASD群体 分布曲线,其中x轴表示第一代谢物的水平,y轴表示相应群体;
●为ASD群体中的该代谢物建立ASD群体分布曲线,其中x轴 表示第一代谢物的水平,y轴表示相应群体;以及
●该非ASD群体分布曲线和该ASD群体分布曲线的特征在于(A) 和(B)之一或两者:
○(A)(i)对于x>该代谢物的水平n的ASD群体分布曲线下面积 相比于(ii)对于x>该代谢物的水平n的非ASD群体分布曲线下面积的 比率大于150%(例如,>200%、>300%、>500%、>1000%等),从而 提供了用于区分具有>该代谢物水平n的样品的ASD分类与非ASD分类 的预测效用,和
○(B)如果其中n'是对应于用于产生分布曲线的组合非ASD和 ASD群体的顶部十分位数(或从约5%至约20%的任何截止值)的最小 阈值代谢物水平,那么对于代谢物水平至少为n'的未知样品(例如选 自具有相等数目的ASD和非ASD成员的群体的随机样品),样品为ASD 而不是非ASD的几率不小于1.6:1(例如,不小于2:1,不小于3:1, 不小于4:1,不小于5:1,不小于6:1,不小于7:1,不小于8:1,不 小于9:1或不小于10:1)(例如,其中p<0.3,p<0.2,p<0.1,p<0.05, p<0.03或p<0.01,例如,统计上显著的分类),从而提供了对该代谢 物的水平>n'的样品区分ASD分类与非ASD分类的预测效用。
在某些实施方案中,当代谢物被表征为下述时,该特定代谢物表 现出指示ASD而非非ASD群体(例如,DD群体)的左尾效应:
●为非ASD群体(例如,DD群体)中的该代谢物建立非ASD群体分 布曲线,其中x轴表示第一代谢物的水平,y轴表示相应群体;
●为ASD群体中的该代谢物建立ASD群体分布曲线,其中x轴表 示第一代谢物的水平,y轴表示相应群体;以及
●非ASD群体分布曲线和ASD群体分布曲线的特征在于(A)和(B) 之一或两者:
○(A)(i)对于x<该代谢物的水平m的ASD群体分布曲线下面积 相比于(ii)对于x<该代谢物的水平m的非ASD群体分布曲线下面积的 比率大于150%(例如,>200%、>300%、>500%、>1000%等),从而 提供了用于区分具有<该代谢物水平m的样品的ASD分类与非ASD分类 的预测效用,和
○(B)如果其中m'是对应于用于产生分布曲线的组合非ASD和 ASD群体的底部十分位数(或从约5%至约20%的任何截止值)的最大 阈值代谢物水平,那么对于具有低于m'的代谢物水平的未知样品(例 如选自具有相等数目的ASD和非ASD成员的群体的随机样品),样品为 ASD而不是非ASD的几率不小于1.6:1(例如,不小于2:1,不小于3:1, 不小于4:1,不小于5:1,不小于6:1,不小于7:1,不小于8:1,不 小于9:1或不小于10:1)(例如,其中p<0.3,p<0.2,p<0.1,p<0.05, p<0.03或p<0.01,例如,统计上显著的分类),从而提供了对该代谢 物的水平<m'的样品进行ASD分类与非ASD分类区分的预测效用。
在某些实施方案中,当代谢物被表征为下述时,该特定代谢物表 现出指示非ASD群体(例如DD群体)而不是ASD群体的右尾效应:
●为非ASD群体(例如DD群体)中的该代谢物建立非ASD群体 分布曲线,其中x轴表示第一代谢物的水平,y轴表示相应群体;
●为ASD群体中的该代谢物建立ASD群体分布曲线,其中x轴 表示第一代谢物的水平,y轴表示相应群体;以及
●该非ASD群体分布曲线和该ASD群体分布曲线的特征在于(A) 和(B)之一或两者:
○(A)(i)对于x>该代谢物的水平n的非ASD群体分布曲线下面 积相比于(ii)对于x>该代谢物的水平n的ASD群体分布曲线下面积的 比率大于150%(例如,>200%、>300%、>500%、>1000%等),从而 提供了用于区分具有>该代谢物水平n的样品的非ASD分类与ASD分类 的预测效用,和
○(B)如果其中n'是对应于用于产生分布曲线的组合非ASD和 ASD群体的顶部十分位数(或从约5%至约20%的任何截止值)的最小 阈值代谢物水平,那么对于代谢物水平至少为n'的未知样品(例如选 自具有相等数目的ASD和非ASD成员的群体的随机样品),样品为非 ASD而不是ASD的几率不小于1.6:1(例如,不小于2:1,不小于3:1, 不小于4:1,不小于5:1,不小于6:1,不小于7:1,不小于8:1,不 小于9:1或不小于10:1)(例如,其中p<0.3,p<0.2,p<0.1,p<0.05, p<0.03或p<0.01,例如,统计上显著的分类),从而提供了对该代谢 物的水平>n'的样品区分非ASD分类与ASD分类的预测效用。
在某些实施方案中,当代谢物被表征为下述时,该特定代谢物表 现出指示非ASD群体(例如,DD群体)而非ASD的左尾效应:
●为非ASD群体(例如,DD群体)中的该代谢物建立非ASD群体分 布曲线,其中x轴表示第一代谢物的水平,y轴表示相应群体;
●为ASD群体中的该代谢物建立ASD群体分布曲线,其中x轴表 示第一代谢物的水平,y轴表示相应群体;以及
●非ASD群体分布曲线和ASD群体分布曲线的特征在于(A)和(B) 之一或两者:
○(A)(i)对于x<该代谢物的水平m的非ASD群体分布曲线下面 积相比于(ii)对于x<该代谢物的水平m的ASD群体分布曲线下面积的 比率大于150%(例如,>200%、>300%、>500%、>1000%等),从而 提供了用于区分具有该代谢物<水平m的样品的非ASD分类与ASD分类 的预测效用,和
○(B)如果其中m'是对应于用于产生分布曲线的组合非ASD和 ASD群体的底部十分位数(或从约5%至约20%的任何截止值)的最大 阈值代谢物水平,那么对于具有低于m'的代谢物水平的未知样品(例 如选自具有相等数目的ASD和非ASD成员的群体的随机样品),样品为 非ASD而不是ASD的几率不小于1.6:1(例如,不小于2:1,不小于 3:1,不小于4:1,不小于5:1,不小于6:1,不小于7:1,不小于8:1, 不小于9:1或不小于10:1)(例如,其中p<0.3,p<0.2,p<0.1,p<0.05, p<0.03或p<0.01,例如,统计上显著的分类),从而提供了对所述代 谢物的水平<m'的样品进行非ASD分类与ASD分类区分的预测效用。
在某些实施方案中,使用展示尾部效应的多种代谢物进行风险评 估。已观察到,为了评估ASD,有一些特定的代谢物组(例如,两种或 更多种代谢物)可以提供互补诊断/风险评估信息。例如,可通过分析 第一代谢物(例如,在第一代谢物的已鉴定尾部内的个体)的水平而鉴 定的ASD阳性个体与可通过分析第二代谢物而鉴定的ASD阳性个体不 同(或者可能存在低的、非零度的重叠)。第一代谢物的尾部预测某些 ASD个体,而第二代谢物的尾部预测另一些ASD个体。不希望受特定 理论的束缚,该发现可能反映了ASD本身的多面性质。
因此,在某些实施方案中,风险评估方法包括鉴定受试者是否落 入涉及多种代谢物的多种已鉴定代谢物尾部中的任一种中,例如,当 不同代谢物尾部的预测物至少部分不相连时,例如,它们具有低的相 互信息,因此,当引入相互信息少的多个代谢物时,风险预测得到改 善。
在一些实施方案中,本发明提供了用于确定/诊断患有ASD或处于 ASD风险中的受试者的方法中的一种或多种结合成员,每种结合成员 能够特异性结合选自以下代谢物中的代谢物:5-羟基吲哚乙酸 (5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸酯、3-羧 基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基苯 基硫酸、8-羟基辛酸、γ-CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸、异 戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺、硫酸对甲酚、泛酸 (维生素B5)、苯乙酰谷氨酰胺、哌可酸、黄嘌呤、羟基-百菌清、辛 烯酰肉碱和3-羟基马尿酸。
在一些实施方案中,本发明提供了一种或多种结合成员用于诊断/ 测定患有ASD或处于患有ASD的风险中的受试者的用途,所述结合成 员能够特异性结合选自以下代谢物中的代谢物:5-羟基吲哚乙酸 (5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基 -4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基苯基 硫酸、8-羟基辛酸、γ-CEHC、羟基异戊酰肉碱(C5)、吲哚乙酸、异戊 酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺、硫酸对甲酚、泛酸(维 生素B5)、苯乙酰谷氨酰胺、哌可酸、黄嘌呤、羟基-百菌清、辛烯酰 基肉碱和3-羟基马尿酸。
结合成员可选自核酸分子、蛋白质、肽、抗体或其片段,其全部 能够结合特定代谢物。在某些实施方案中,结合成员可被标记以帮助 检测和测定结合的代谢物的水平。
本发明还提供被固定于固体载体的多个结合成员,其中所述多个 结合成员选自5-羟基吲哚乙酸(5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、 3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3- 吲哚氧基硫酸、4-乙基苯基硫酸、8-羟基辛酸、γ-CEHC、羟基异戊酰 肉碱(C5)、吲哚乙酸、异戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5- 甲酰胺、硫酸对甲酚、泛酸(维生素B5)、苯乙酰谷氨酰胺、哌可酸、 黄嘌呤、羟基-百菌清、辛烯酰肉碱和3-羟基马尿酸,其中所述多个 结合成员占所述固体载体上结合成员群体的至少20%、30%、40%、 50%、60%、70%、80%或90%。
在一些实施方案中,本发明提供用于实施本文所述方法的试剂盒, 特别是用于确定/诊断受试者患有ASD或处于患有ASD的风险中的试剂 盒。试剂盒允许使用者确定选自以下代谢物的一种或多种代谢物在处 于测试的样品中的存在情况、水平(升高或下降):5-羟基吲哚乙酸 (5-HIAA)、1,5-脱水葡糖醇(1,5-AG)、3-(3-羟基苯基)丙酸、3-羧基 -4-甲基-5-丙基-2-呋喃丙酸(CMPF)、3-吲哚氧基硫酸、4-乙基苯基硫 酸、8-羟基辛酸、γ-CEHC、羟基异戊酰基肉碱(5)、吲哚乙酸,异戊 酰甘氨酸,乳酸,N1-甲基-2-吡啶酮-5-甲酰胺,硫酸对甲酚,泛酸(维 生素B5),苯乙酰谷氨酰胺,哌可酸,黄嘌呤,羟基-百菌清,辛烯酰 肉碱和3-羟基马尿酸;所述试剂盒包含(a)具有多个结合成员的固体 载体,其中每个所述结合成员独立地特异于固定在其上的所述一种或 多种代谢物中的一种;(b)包含标记的显影剂;和任选地(c)一种或多 种选自洗涤溶液、稀释剂和缓冲剂中的组分。
实施例
受试者
从18个月至60个月的受试者收集血液样品,所述受试者被转到 19个发育评价中心用于评价除了孤立活动问题外的可能的发育障碍。 对所有受试者获得知情同意。从研究中排除了事先在专门进行儿科发 育评估的诊所诊断为ASD或者不能或不愿意完成研究程序的受试者。
受试者是登记在SynapDx自闭症谱系病症基因表达分析(STORY) 研究中的那些受试者。按照当前关于良好临床实践(GCP)的ICH指南和 适用的监管要求来进行STORY研究。GCP是用于设计、进行、记录和 报告涉及人受试者参与的研究的国际伦理和科学质量标准。遵守本标 准提供了公共保证:根据源于赫尔辛基宣言的原则,保护研究对象的 权利、安全和健康,并且临床研究数据是可信的。
图1至12中所示的结果基于来自STORY研究中的男性的180份血 液样品。样本集包括122个ASD样品和58个DD(非ASD)样品。ASD诊 断遵循DSM-V诊断标准。其他结果基于来自STORY研究中男性受试者 的299个血液样品的更广泛集合。较宽的样品组包括198个ASD样品 和101个DD样品。
对于所有测试,在EDTA管中收集约3mL血液样品,并通过离心 管来制备血浆。然后将血浆冷冻并运送至实验室进行分析。在实验室 进行样品的甲醇提取,并通过优化的超高效液相或气相色谱/串联质谱 (UHPLC/MS/MS或GC/MS/MS)法分析提取物(参见,例如,Anal.Chem., 2009,81,6656-6667)。
数据分析
对男性和女性受试者定量其血液样品中的代谢物。
分析样品的代谢物水平,并定量为针对在给定日对所有样品测量 的中值浓度标准化的任意单位的浓度。例如,大于1的单位是指大于 该日样品中值的代谢物的量,小于1的单位是指小于该中值的量。然 后进行交叉验证,其中样品被随机分成非重叠的训练/测试集,针对其 评估机器学习分类器的无偏性能。已经鉴定了21种代谢物,所述代谢 物单独地和共同地高度信息化预测ASD,特别是在男性受试者中。
实施例1:辨别代谢物水平信息
该实施例显示,可从样品分布中的尾部效应的鉴定和分析中辨别 用于ASD风险评估的有价值的信息,否则所述信息将被常规分析(例 如,基于平均偏移的分析)所遗漏。
一旦确定了代谢物水平,就有多种方式来实现用于风险评估的信 息,包括平均偏移和尾部效应。令人惊奇的是,发现平均偏移提供一 些但不是最优的预测信息。在图1中显示了示例性平均偏移。在该图 中,ASD分布偏移至非ASD分布(DD)的右侧。
除了常规均值偏移分析(mean shift analysis)以外,本发明人还 从样品中辨别出附加信息。对ASD和非ASD(此处为DD)样品绘制代谢 物分布曲线,并且发现对于测量的代谢物的亚组,来自ASD或DD群体 的样品富集在右(上)或左(低)尾部(即,尾部效应)。代表性尾部效应 示于图2中。值得注意的是,两个分布共享几乎相同的平均值(即,平 均偏移或均值偏移最小或没有)。因此,不能从平均偏移的常规分析中 辨别出代谢物的预测值。
代谢物可能表现出右(上)尾部效应或左(下)尾部效应,或两者。 代表性代谢物5-HIAA的ASD和非ASD(这里是DD)分布曲线显示在图3 中。观察到清楚的右尾效应,例如ASD分布在右尾部具有更大的AUC。 因此,证明了具有高水平的该代谢物的样品高度富集在ASD群体成员 中。使用该代谢物,平均偏移(由t检验值指示)和右尾(由“极限值” Fisher检验值指示)都是统计上显著的。
另一种说明性代谢物γ-CEHC的ASD和非ASD(此处为DD)分布曲 线示于图4中。观察到清楚的左尾效应,例如ASD分布在左尾中具有 更大的AUC。因此,证明了具有低水平的该代谢物的样品高度富集在 ASD群体成员中。对于该代谢物来说,平均偏移(由t检验值指示)不 是统计上显著的,而左尾是统计上显著的。
这些数据说明了尾部效应的鉴定和分析提供了通过常规平均偏移 分析不能获得的用于风险评估的附加信息。
实施例2:显示尾部效应的选定代谢物强烈预测ASD
本实施例说明了尾部效应用于预测ASD的评估。本发明人在从男 性受试者获得的样品中鉴定了许多代谢物的统计上显著的尾部效应。 尾部效应单独和总体地提供关于受试者属于哪个群体(即,ASD群体或 DD群体)的信息。表1显示了表现出具有高预测能力的ASD对比DD尾 部效应的21种代谢物的示例性小组。
表1B显示具有预测ASD的尾部效应的21种代谢物小组的代谢物。 指示了每个尾部效应的统计显著性(p值)以及其在分布曲线上的位置 (即,左尾效应或右尾效应)。大于1的比值比指示对于ASD的预测能 力。例如,5HIAA具有右尾,比值比为4.91,表明在STORY研究数据 集(其中ASD与DD样品的比率为2:1)中,对于每个DD样品有约10个 ASD样品在右尾中。通过bootstrap法估计置信区间。通过替换进行 重采样,从STORY数据生成了1000个单独的bootstrap。对于每个 bootstrap,确定尾部的位置和相应的比值比。从观察到的比值比的分 布计算90%置信区间。
基于这些标准,发现21种代谢物小组中的19种代谢物对于ASD 有预测性。
表1C显示具有预测DD的尾部效应的代谢物。指示了每个尾部效 应的统计显著性(p值)以及其在分布曲线上的位置(即,左尾效应或右 尾效应)。小于1的比值比指示DD的预测能力。基于这些标准,发现 21种代谢物小组中的8种代谢物预测DD。对于ASD,考虑到STORY研 究中DD与ASD样品的比率为1:2,类似地测定比值比和90%的置信区 间。
值得注意的是,某些代谢物表现出对ASD或DD有预测能力的单尾 效应(或左或右),而其它代谢物表现出左和右尾效应二者,它们一起 提供了针对ASD和DD的预测能力。例如,苯乙酰谷氨酰胺和对甲酚硫 酸显示左尾和右尾两种效应。
表1中所列的21种代谢物的尾部效应在图13A至13U的图中单个 地显示。对于每个图,显示了一种代谢物在ASD和DD两个群体中的分 布。每个图顶部的图例显示该代谢物的左尾和右尾的统计学显著性(通 过Fisher's检验产生的p值)。
一些代谢物,例如苯乙酰谷氨酰胺,显示平均变化和尾部效应。 如图5所示,苯乙酰谷氨酰胺显示统计上显著的平均偏移(t检验; p=0.001),并且在两个群体之间具有统计上显著的左和右尾效应(“极 限值”表示尾部效应,Fisher检验;p=0.0001)。分布在ASD与DD群 体之间表现为偏移的高斯曲线。
表2显示了用于基于ASD和非ASD群体中每种代谢物的潜在群体 分布而确定21种代谢物小组的尾部效应的阈值。示例性地,上阈值对 应于第90百分位数分布,而下阈值对应于第15百分位数分布。可通 过使用表2中的值与群体中代谢物的平均浓度来计算阈值的绝对测量 值(例如,ng/ml,nM等)。
表2.代谢物分布曲线的左尾(等于或低于第15位百分位数)和右 尾(等于或高于第90位百分位数)的阈值水平
Figure BDA0001163272540000481
实施例3:用多种代谢物预测ASD
可将由多种代谢物(例如,表1中列出的那些)提供的信息单独地 或作为一组用于辅助疾病风险预测。特别信息性的代谢物组包括彼此 不相关且具有低共线性(即低相互性)的成员。例如,图6显示了与γ -CEHC水平相比较的5HIAA水平,表明两种代谢物的信息性水平之间 缺乏相关性。例如,在5HIAA的尾部中鉴定的ASD个体(图3)通常与 在γ-CEHC的尾部中鉴定的ASD个体不相同。因此,代谢物5HIAA和 γ-CEHC被认为提供互补信息。富集了具有低共同性的代谢物的尾部 提供了互补性分类信息。
图7是一个图表,指示对于180个样品中的每一个,样品是否在 12种代谢物小组的每种代谢物的尾部内。在该示例性小组中,两种代 谢物(黄嘌呤和硫酸对甲酚)的尾部对于非ASD(例如DD)是预测性的, 而其他10种代谢物的尾部预测ASD。
当评估多种代谢物时,尾部效应加总计数的组合数量增加,并且 潜在的尾部效应加总计数增加。当测量未知样品时,可以绘制来自ASD 和来自非ASD群体的尾部效应加总计数的分布图,将所得分布用于确 定ASD与非ASD之间的合适分离。如图8A所示,可通过使用投票(例 如,分箱)方案进一步分析ASD和非ASD(此处为DD)样品,以进一步利 用由针对其观察到尾部效应的代谢物提供的互补信息。显示了总共12 种代谢物的数据。在一个具体方案中,对于给定样品,对样品落入ASD 预测性尾部内的代谢物数目进行求和,对样品落入非ASD(此处为DD) 的预测性尾部内的代谢物数目也求和。这两个值被作为x和y坐标绘 图(图8A)。值得注意的是,随着ASD富集代谢物的数量增加(在y轴 上较高)和随着非ASD富集代谢物的数量减少(在x轴上较低),在ASD 点中非ASD点的混合似乎更少,例如,这暗示ASD的假阳性诊断的可 能性较低。另一方面,随着ASD富集代谢物的数量减少(在y轴上较低) 和随着非ASD富集的代谢物的数量增加(在x轴上较高),在非ASD点 中ASD点的混合较少,例如这表明对DD的假阳性诊断的可能性较低。
将样品分成四个不同的箱,如图8B所示。顶部和右下方的箱子特 别显示清楚的分离,有利于ASD或DD风险评估。
在图8所示的四个箱中,对ASD最强烈预测的箱包括具有2个或 更多个ASD富集的特征以及0或1个非ASD富集的特征的样品。具有 1个ASD富集的特征和0或1个非ASD富集的特征的箱也预测ASD,尽 管不如上述箱强烈。具有1个或多个非ASD富集的特征和0个ASD富集的特征的箱强烈预测非ASD。在一些情况下,没有ASD富集的特征 也没有非ASD富集的特征的样品箱也可以提供预测信息。
在一个示例性投票方案中,对于给定的样品进行投票,例如,ASD 富集的代谢物获得点评分,非ASD富集的代谢物减去点评分。具有阳 性结果(例如,等于或大于1)的样品可以被认为是ASD(或具有显著的 ASD风险),具有阴性结果(等于或小于-1)的样品可以被认为是非 ASD(或具有显著的非ASD可能性)。具有零结果的样品可以被认为可能 是非ASD或ASD,这取决于样品中ASD相比于非ASD的分布,或者可 作为不确定或“无分类结果”样品返回。类似地,图8C显示了表1 中描述的21种代谢物小组的投票结果。
在另一个示例性评分系统(图21所示)中,针对每种代谢物,将 ASD和DD特征的比值比(the odds ratio)的log 2值(log2OR)求 和以计算ASD或DD的风险评分。
尾部效应信息可用于区分具有ASD或非ASD状况的受试者。同样, 尾部效应信息可用于预测受试者患另一疾病或病症(例如,DD)的风险。
例如,如图8A和8C所示的非ASD群体(例如,DD)的尾部效应分 布可用于建立该群体中给定数量的代谢物的平均尾部效应总和的参照 值。该平均值可用作参照而与来自未知受试者的样品的平均尾部效应 的总和进行比较,并且可用于评估受试者患ASD的风险,而不必获得 ASD和非ASD人群中代谢物的群体分布曲线。
还可将尾部效应信息,例如,如在上面的示例性投票方案或类似 方案中所描述的,与常规平均偏移信息和/或其他分类信息组合用于改 进的分类结果。
本文证明,ASD风险的可预测性可通过分析某些代谢物的组合来 提高。例如,图9-11和图13-14A-D说明了如何使用投票方案可增加 分类器的AUC并且改善预测能力。使用12种代谢物小组的亚组时,随 着亚组中代谢物的数目增加(从1到12),ASD预测能力增加(y轴)(图 9)。使用不同的分类器(即,逻辑回归、朴素贝叶斯或支持向量机 (support vectormachine,SVM))和不同特征的选择也影响AUC(图 9)。图10A显示使用12种代谢物小组对相同群体使用不同特征和分类 器的ASD风险三分法预测,而图10B显示使用21种代谢物小组的结果。 图11A和11B显示使用12种代谢物小组(图11A)和21种代谢物小组 (图11B)的投票方案中ASD风险预测的改善。这些分析表明,通过选 择目标代谢物并使用适当的统计工具,可以实现ASD风险评估的高度 可信度。例如,如图12所示,使用12种代谢物,按照上述方法获得 至少0.74的AUC。
实施例4:从代谢组学数据选择高影响代谢物
筛选来自ASD和DD受试者的样品用于检测约600种已知代谢物 (示于表3中)。从初始600种代谢物的组,鉴定出84种候选代谢物表 现出尾部效应。阐明样品中检测到的84种代谢物的亚组,在表4中列 出了其名称。基于高的个别代谢物AUC,从84种候选代谢物的组中选 择代谢物组(例如12和21种代谢物小组)。基于诸如与药物或年龄相 关性的因素,将某些候选代谢物从小组中排除。
表3:测定的600种代谢物的初始组中四百六十五(465)种阐明的 代谢物
Figure BDA0001163272540000511
Figure BDA0001163272540000521
Figure BDA0001163272540000531
Figure BDA0001163272540000541
Figure BDA0001163272540000551
Figure BDA0001163272540000561
表4:鉴定的显示尾部效应的候选代谢物
Figure BDA0001163272540000562
Figure BDA0001163272540000571
Figure BDA0001163272540000581
测试两组代谢物(由图7的代谢物组成的12种代谢物小组和由表 1的代谢物组成的21种代谢物小组)进行ASD风险预测。结果显示所 述12种和21种代谢物小组强烈有助于ASD的预测。包括和排除该12 种或21种代谢物小组的代谢物对ASD预测的影响的概述示于图14A-D 中。白名单表示使用仅来自12种或21种代谢物小组的数据的分类器 的AUC值,而黑名单表示不包括12种或21种代谢物组但是使用来自 84种候选代谢物的组或完全组的600种代谢物(所有候选物=84种候选 代谢物;所有特征=600种代谢物)的分类器的AUC值。进行平均偏移(上 图)和尾部分析(下图)。这些数据显示,ASD的预测性信息归因于所述12种或21种代谢物小组中的代谢物,无论是通过平均偏移还是通过 尾分析评估的。因此,观察到显示强尾部效应的代谢物(12种和21种 代谢物小组中的代谢物)预测ASD优先于DD的能力远远大于来自600 种代谢物小组的其它代谢物(其不显示强尾部效应)。
图14C-D扩展了来自图14A-B的结果,并且除了逻辑回归之外还 包括使用朴素贝叶斯分析的附加分析。另外,图14B还显示了分解成 不同样品组群(即,"Christmas"和"Easter")的结果。最左边的小组显 示AUC结果,其中分类器在192个样品上训练并且仅在Christmas组 群中交叉验证;中间左小组显示AUC结果,其中分类器在299个样品 上训练并在Christmas和Easter组群上交叉验证;中间右小组显示了 AUC结果,其中分类器仅在来自Easter组群的样品上进行训练并且仅 在Easter组群中交叉验证;最右边的小组显示AUC结果,其中分类器 在来自Christmas和Easter组群的样品上训练并且在Easter组群上 交叉验证。使用12种或21种代谢物小组中的代谢物(例如,表现出尾 部效应的代谢物)获得最高AUC。
根据添加到统计分析中的特征的数目,通过包括12种或21种代 谢物小组(白名单)以及过排除它们(黑名单)而显示AUC预测,图 17A-B、18A-B和19A-D进一步扩展了图14A-D的结果。顶部小组显示 了平均偏移分析的结果,而底部的那些小组显示尾部效应分析。在每 个单独的小组中,条块代表不同的代谢物小板,如下面的符号和图例 中所示。
描述了当评估总共21种代谢物的亚组时用于ASD风险预测的累积 AUC的示例性曲线图示于图15中。在该图中,x轴显示来自选自21 种代谢物的组的亚组中的代谢物的数量。y轴显示ASD的预测能力。 对于x轴上的每个数字,分析许多随机代谢物组合并绘制它们的AUC 值(点)。该曲线显示了由所使用的代谢物(选自21种代谢物的组)的数 量增加引起的AUC的增加。另一方面,该图证明甚至具有少量代谢物 (例如,3或5种)的亚组也显示高AUC。因此,某些代谢物似乎具有特 别重要的预测性尾部。
描述来自表1的21种代谢物中包含产生高AUC值的3、4、5、6 和7种代谢物的代表性亚组的示例性表格示于表5中。对于每个亚组 大小(3、4、5、6或7种),分析代谢物组的50个随机选择。例如, 对于来自21种代谢物小组的3种代谢物亚组,评估了3种代谢物亚组 的50个随机组合(总共1330个可能的排列中的组合)。显示了来自具 有最高AUC的50个随机组的组合。因此,含有少于21种代谢物的某 些代谢物组合产生高AUC值。代谢物诸如γ-CEHC、硫酸对甲酚、黄嘌 呤、苯乙酰谷氨酰胺、异戊酰甘氨酸、辛烯酰肉碱和羟基-百菌清出现 在产生高AUC值的多个亚组中,表明这些代谢物可能与患者的ASD状 态密切相关。因此,这些代谢物(单独地或彼此组合地)或其它代谢物 一起似乎特别可用于预测患者的ASD风险。
表5:代谢物的示例性亚组和ASD的预测
Figure BDA0001163272540000601
Figure BDA0001163272540000611
以成对组合方式评估来自表1的21种代谢物的双代谢物亚组对于 ASD的可预测性。具有robust AUC的代表性成对组合示于表6中。类 似地,以三元组合方式评估来自表1的21种代谢物的三种代谢物亚组 的对于ASD的可预测性。具有robust AUC的代表性三元组合示于表7 中。
表6.提供robust AUC的示例性代谢物对
Figure BDA0001163272540000612
Figure BDA0001163272540000621
表7.提供robust AUC的示例性代谢物三元组
Figure BDA0001163272540000622
Figure BDA0001163272540000631
实施例5:12种代谢物小组分类器的验证
基于图7所示的12种高信息性代谢物,将来自所测试的180个样 品(其中约三分之二是ASD)的数据用于产生分类器。在130个样品的 第二群组中测试该分类器区分ASD与非ASD区(此处,DD)的能力。该 方法提供了真实预测性能的无偏估计,对应于0.74的AUC。该过程的 示意图如图12所示。
实施例6:将遗传信息加入代谢物可以改善ASD风险预测
发现将遗传信息添加至代谢物信息中改善了某些组的ASD风险预 测。例如,将拷贝数变异(CNV)数据与代谢物信息组合显著降低了ASD 风险预测的置信区间,如图16A和16B所示。如图16A所示,添加遗 传信息进一步增强了ASD与非ASD组之间的分离。除了CNV以外,包 括但不限于脆性X(FXS)状态的其他遗传信息也可进一步有助于诊断 测试,其可以以提高的准确度和减少I型和/或II型错误来预测ASD 风险。如图16B所示,包括这样的附加信息(例如,“PathoCV”)增加 了ASD与DD组之间的分离,因此有助于区分这两种病症。
实施例7:从代谢物分析中出现的显著的生物学途径
代谢物信息的进一步分析揭示了表1中呈现的代谢物簇,其在不 同的生物学途径中起着显著的作用。例如,21种代谢物中的7种与肠 道微生物活性相关(33%),示于表8中。所有7种都是氨基酸代谢物。 7种中的6种是芳香族氨基酸的代谢物,并且具有苯环。
表8:涉及肠微生物活性的七种代谢物
Figure BDA0001163272540000632
Figure BDA0001163272540000641
如表1所示的与ASD强烈相关的代谢物的分析揭示了与某些生物 学途径的联系。例如,提供ASD的预测信息的特定代谢物提示II期生 物转化的削弱,削弱的代谢苯环的能力,肾脏的再吸收失调,肉碱代 谢的失调和大的中性氨基酸向脑中的转运的不平衡。生物途径信息可 被进一步用于改善ASD风险评估和/或探索ASD的病因和病理生理学。 此类信息也可用于开发治疗ASD的药物治疗剂。
实施例8:血液中代谢物浓度的阐明
对实施例2中描述的21种代谢物中的19种,通过质谱法测定血 浆样品中的绝对代谢物浓度。使用从含有已知量的代谢物的标准样品 产生的校准曲线计算血浆中的绝对代谢物浓度(ng/ml)。
表9A显示了预测ASD的17种代谢物。提供了尾部效应的方向(左 或右),用于确定尾部效应的存在的阈值(即,左尾效应为第15百分位 数,右尾效应为第90百分位数)和比值比(log 2)。正的比值比表明代 谢物的尾部效应预测ASD。
表9B显示预测DD的7种代谢物。提供了尾部效应的方向(左或 右),用于确定尾部效应的存在的阈值(即,左尾效应为第15百分位数, 右尾效应为第90百分位数)和比值比(log 2)。负的比值比表明代谢物 的尾部效应预测DD。
表9A.具有预测ASD的尾部富集的示例性代谢物
Figure BDA0001163272540000651
表9B.具有预示DD的尾部富集的示例性代谢物
Figure BDA0001163272540000661

Claims (14)

1.用于测定多种代谢物的水平的试剂在制备用于区分受试者中自闭症谱系病症即ASD与非ASD发育迟缓即DD的制剂中的用途,其中所述区分包括:
(i)采用所述试剂测量从受试者获得的样品中多种代谢物的水平,
其中所述多种代谢物包括至少两种选自下述的代谢物:黄嘌呤、γ-CEHC、羟基-百菌清、5-羟基吲哚乙酸、吲哚乙酸、硫酸对甲酚、1,5-脱水葡糖醇、3-(3-羟基苯基)丙酸、3-羧基-4-甲基-5-丙基-2-呋喃丙酸、3-吲哚氧基硫酸、4-乙基苯基硫酸、羟基异戊酰肉碱、异戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺、泛酸、苯基乙酰基谷氨酰胺、哌可酸、3-羟基马尿酸及其组合,并且其中所述多种代谢物包括黄嘌呤;
其中所述试剂是独立地选自下述的一种或多种结合成员:核酸分子、蛋白质或其片段,其中每种结合成员均能够与所述至少两种代谢物中的一种特异性结合;
(ii)计算样品中其水平等于或低于指示下述的预先确定阈值浓度的代谢物的数量:
(a)如下表中所定义的指示ASD的ASD左尾效应:
Figure FDA0002698425730000011
Figure FDA0002698425730000021
(b)如下表中所定义的指示DD的DD左尾效应:
Figure FDA0002698425730000022
和/或
(iii)计算样品中其水平等于或高于指示下述的预先确定阈值浓度的代谢物的数量:
(a)如下表中所定义的指示ASD的ASD右尾效应:
Figure FDA0002698425730000023
Figure FDA0002698425730000031
(b)如下表中所定义的指示DD的DD右尾效应:
Figure FDA0002698425730000032
(iv)基于在步骤(ii)和/或(iii)中获得的数目,确定受试者具有ASD或DD。
2.权利要求1所述的用途,其中所述多种代谢物包括黄嘌呤和苯乙酰谷氨酰胺。
3.权利要求1或2所述的用途,其中所述样品是血浆样品。
4.权利要求1所述的用途,其中通过质谱法测量所述代谢物水平。
5.权利要求1或2所述的用途,其中所述受试者年龄不超过54个月。
6.权利要求1或2所述的用途,其中所述受试者年龄不超过36个月。
7.用于测量多种代谢物的水平的试剂在制备用于确定受试者具有ASD或处于ASD的风险中的制剂中的用途,其中所述确定包括:
(i)采用所述试剂测量从所述受试者获得的样品中多种代谢物的水平,
其中所述多种代谢物包括至少两种选自以下的代谢物:黄嘌呤、γ-CEHC、羟基-百菌清、5-羟基吲哚乙酸、吲哚乙酸、硫酸对甲酚、1,5-脱水葡糖醇、3-羧基-4-甲基-5-丙基-2-呋喃丙酸、3-吲哚氧基硫酸、4-乙基苯基硫酸、羟基异戊酰肉碱、异戊酰甘氨酸、乳酸、N1-甲基-2-吡啶酮-5-甲酰胺、泛酸、苯基乙酰基谷氨酰胺、哌可酸、3-羟基马尿酸及其组合,其中所述多种代谢物包括黄嘌呤;
其中所述试剂是独立地选自下述的一种或多种结合成员:核酸分子、蛋白质或其片段,其中每种结合成员均能够与所述至少两种代谢物中的一种特异性结合;
(ii)检测以下中的两种或更多种:
(a)黄嘌呤水平为182.7ng/ml或以上;
(b)羟基-百菌清水平为20.3ng/ml或以上;
(c)5-羟基吲哚乙酸水平为28.5ng/ml或以上;
(d)乳酸水平为686600.0ng/ml或以上;
(e)泛酸水平为63.3ng/ml或以上;
(f)哌可酸水平为303.6ng/ml或以上;
(g)γ-CEHC水平为32.0ng/ml或以下;
(h)吲哚乙酸水平为141.4ng/ml或以下;
(i)硫酸对甲酚水平为1220.0ng/ml或以下;
(j)1,5-脱水葡糖醇水平为11910.3ng/ml或以下;
(k)3-羧基-4-甲基-5-丙基-2-呋喃丙酸水平为7.98ng/ml或以下;
(l)3-吲哚氧基硫酸水平为256.7ng/ml或以下;
(m)4-乙基苯基硫酸水平为3.0ng/ml或以下;
(n)羟基异戊酰肉碱水平为12.9ng/ml或以下;
(o)N1-甲基-2-吡啶酮-5-甲酰胺水平为124.82ng/ml或以下;和
(p)苯基乙酰基谷氨酰胺水平为166.4ng/ml或以下;
(iii)基于步骤(ii)中检测的代谢物水平,确定所述受试者患有ASD或处于ASD的风险中。
8.权利要求7所述的用途,其中所述多种代谢物包括黄嘌呤和苯乙酰谷氨酰胺。
9.根据权利要求7所述的用途,其中所述样品是血浆样品。
10.权利要求7所述的用途,其中所述代谢物水平通过质谱法测量。
11.权利要求7所述的用途,其中所述受试者年龄不超过54个月。
12.权利要求7所述的用途,其中所述受试者年龄不超过36个月。
13.权利要求1或7所述的用途,其中所述一种或多种结合成员独立地是肽。
14.权利要求1或7所述的用途,其中所述一种或多种结合成员独立地选自下述组中:抗体或其片段。
CN201580028014.7A 2014-04-11 2015-04-10 用于测定自闭症谱系病症风险的方法和系统 Active CN106714556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110060437.4A CN113009122A (zh) 2014-04-11 2015-04-10 用于测定自闭症谱系病症风险的方法和系统

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201461978773P 2014-04-11 2014-04-11
US61/978,773 2014-04-11
US201462002169P 2014-05-22 2014-05-22
US62/002,169 2014-05-22
US14/493,141 2014-09-22
US14/493,141 US20150294081A1 (en) 2014-04-11 2014-09-22 Methods and systems for determining autism spectrum disorder risk
US14/633,558 2015-02-27
US14/633,558 US9176113B1 (en) 2014-04-11 2015-02-27 Methods and systems for determining autism spectrum disorder risk
PCT/US2015/025247 WO2015157601A1 (en) 2014-04-11 2015-04-10 Methods and systems for determining autism spectrum disorder risk

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202110060437.4A Division CN113009122A (zh) 2014-04-11 2015-04-10 用于测定自闭症谱系病症风险的方法和系统

Publications (2)

Publication Number Publication Date
CN106714556A CN106714556A (zh) 2017-05-24
CN106714556B true CN106714556B (zh) 2021-01-26

Family

ID=54264902

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580028014.7A Active CN106714556B (zh) 2014-04-11 2015-04-10 用于测定自闭症谱系病症风险的方法和系统
CN202110060437.4A Pending CN113009122A (zh) 2014-04-11 2015-04-10 用于测定自闭症谱系病症风险的方法和系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110060437.4A Pending CN113009122A (zh) 2014-04-11 2015-04-10 用于测定自闭症谱系病症风险的方法和系统

Country Status (6)

Country Link
US (3) US9176113B1 (zh)
EP (2) EP3151665B1 (zh)
JP (4) JP6550124B2 (zh)
CN (2) CN106714556B (zh)
CA (3) CA3157221A1 (zh)
WO (1) WO2015157601A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015006160A2 (en) 2013-07-09 2015-01-15 Stemina Biomarker Discovery, Inc. Biomarkers of autism spectrum disorder
US20150294081A1 (en) 2014-04-11 2015-10-15 Synapdx Corporation Methods and systems for determining autism spectrum disorder risk
CN107427221B (zh) * 2015-01-09 2021-03-09 全球基因集团有限责任公司 用于诊断冠状动脉粥样硬化性疾病的基于血液的生物标志物
US10525020B2 (en) 2015-02-11 2020-01-07 Laboratory Corporation Of America Holdings Metabolic markers of attention deficit hyperactivity disorder
NZ776366A (en) 2015-05-22 2023-02-24 Univ Minnesota Methods for treating autism spectrum disorder and associated symptoms
WO2017197252A1 (en) * 2016-05-13 2017-11-16 Stemina Biomarker Discovery, Inc. Autism subsets
WO2018089794A1 (en) * 2016-11-11 2018-05-17 Arizona Board Of Regents On Behalf Of Arizona State University Methods and compositions for changing metabolite levels in a subject
EP3664823B1 (en) 2017-08-07 2024-06-05 Finch Therapeutics Holdings LLC Composition for use in preventing or treating an enterococcal blood stream infection
EP3756187A4 (en) * 2018-02-19 2021-12-08 The Regents of the University of Colorado, a body corporate OXOPIPERIDE INQUANTIZATION USING MASS SPECTROMETRY
JP2022517161A (ja) * 2018-09-11 2022-03-07 メタボロン,インコーポレイテッド マイクロバイオータ関連代謝物の検出および定量のための質量分析検定法
CN110487922B (zh) * 2018-12-17 2022-09-27 广西中烟工业有限责任公司 一种烟叶中苏糖酸和苏糖酸酯的gc-ms分析方法
CA3135587A1 (en) * 2019-04-05 2020-10-08 Arizona Board Of Regents On Behalf Of Arizona State University Diagnostic for maternal risk of having a child with autism spectrum disorder
US20220163538A1 (en) * 2019-04-05 2022-05-26 Arizona Board Of Regents On Behalf Of Arizona State University Metabolites as diagnostics for autism spectrum disorder in children with gastrointestinal symptoms
WO2020242744A1 (en) * 2019-05-31 2020-12-03 Metabolon, Inc. Mass spectrometry assay methods for detection of metabolites
CN112180005B (zh) * 2020-09-01 2022-10-04 上海市疾病预防控制中心 一种预测鉴定生物样本中酰基肉碱的方法及其应用
WO2022056646A1 (en) * 2020-09-21 2022-03-24 Molecular You Corporation Method of diagnosis and treatment of autism spectrum disorder
CN113539478B (zh) * 2021-06-24 2023-04-07 山西医科大学 基于代谢组学的深静脉血栓形成预测模型的建立方法
CN115938490B (zh) * 2023-03-07 2023-06-06 之江实验室 一种基于图表示学习算法的代谢物鉴定方法、系统和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001079837A1 (en) * 2000-04-12 2001-10-25 Repligen Corporation Methylxanthines in the diagnosis and treatment of autistic disorder
CN101802607A (zh) * 2007-07-26 2010-08-11 菲诺梅诺米发现公司 用于诊断、风险评价、和监测孤独症谱系病症的方法
CN102576022A (zh) * 2009-08-14 2012-07-11 加利福尼亚大学董事会 诊断和治疗自闭症的方法
CN104768560A (zh) * 2012-08-29 2015-07-08 加州理工学院 孤独症谱系障碍的诊断和治疗

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1178414A (en) 1978-02-08 1984-11-27 Toyo Boseki Kabushiki Kaisha (Trading Under The Name Of Toyobo Co., Ltd.) Packaging material having excellent seal packaging property
US4233402A (en) 1978-04-05 1980-11-11 Syva Company Reagents and method employing channeling
US4275149A (en) 1978-11-24 1981-06-23 Syva Company Macromolecular environment control in specific receptor assays
US4376110A (en) 1980-08-04 1983-03-08 Hybritech, Incorporated Immunometric assays using monoclonal antibodies
US4659678A (en) 1982-09-29 1987-04-21 Serono Diagnostics Limited Immunoassay of antigens
US4727022A (en) 1984-03-14 1988-02-23 Syntex (U.S.A.) Inc. Methods for modulating ligand-receptor interactions and their application
US5686311A (en) 1995-06-23 1997-11-11 The Children's Mercy Hospital Diagnosis of autism and treatment therefor
US20040121305A1 (en) 2002-12-18 2004-06-24 Wiegand Roger Charles Generation of efficacy, toxicity and disease signatures and methods of use thereof
JP2006526140A (ja) 2002-12-24 2006-11-16 バイオサイト インコーポレイテッド 鑑別診断のためのマーカーおよびその使用方法
WO2004088309A2 (en) 2003-03-28 2004-10-14 Cantata Laboratories, Inc. Methods for diagnosing urinary tract and prostatic disorders
GB0504096D0 (en) 2005-02-28 2005-04-06 Tipogen As Method
US7604948B2 (en) 2005-05-05 2009-10-20 The Regents Of The University Of California Biomarkers for diagnosing an autism spectrum disorder
US20080133141A1 (en) 2005-12-22 2008-06-05 Frost Stephen J Weighted Scoring Methods and Use Thereof in Screening
US20070255113A1 (en) 2006-05-01 2007-11-01 Grimes F R Methods and apparatus for identifying disease status using biomarkers
EP2052255A2 (en) 2006-08-18 2009-04-29 Huntington Medical Research Institutes Methods of determining levels of free amino acids and dipeptides and diagnosing alzheimer's diseases
US20120004854A1 (en) 2008-05-28 2012-01-05 Georgia Tech Research Corporation Metabolic biomarkers for ovarian cancer and methods of use thereof
WO2010045180A1 (en) * 2008-10-13 2010-04-22 Metabolon, Inc. Biomarkers for inflammatory bowel disease and methods using the same
GB0912685D0 (en) * 2009-07-22 2009-08-26 Imp Innovations Ltd Methods
US9547013B2 (en) 2010-04-29 2017-01-17 Wisconsin Alumni Research Foundation Molecule biomarkers of autism
WO2013134315A1 (en) * 2012-03-05 2013-09-12 Berg Pharma Llc Compositions and methods for diagnosis and treatment of pervasive developmental disorder
JP2015510756A (ja) 2012-03-09 2015-04-13 アンテグラージェン 自閉症のリスクを評価するため遺伝子型決定テスト
US20140045702A1 (en) * 2012-08-13 2014-02-13 Synapdx Corporation Systems and methods for distinguishing between autism spectrum disorders (asd) and non-asd development delay

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001079837A1 (en) * 2000-04-12 2001-10-25 Repligen Corporation Methylxanthines in the diagnosis and treatment of autistic disorder
CN101802607A (zh) * 2007-07-26 2010-08-11 菲诺梅诺米发现公司 用于诊断、风险评价、和监测孤独症谱系病症的方法
CN102576022A (zh) * 2009-08-14 2012-07-11 加利福尼亚大学董事会 诊断和治疗自闭症的方法
CN104768560A (zh) * 2012-08-29 2015-07-08 加州理工学院 孤独症谱系障碍的诊断和治疗

Also Published As

Publication number Publication date
CA2945528A1 (en) 2015-10-15
JP2023178345A (ja) 2023-12-14
CN106714556A (zh) 2017-05-24
CA3157221A1 (en) 2015-10-15
US20160091481A1 (en) 2016-03-31
WO2015157601A1 (en) 2015-10-15
EP3954991A2 (en) 2022-02-16
JP2021103177A (ja) 2021-07-15
US20150293072A1 (en) 2015-10-15
CN113009122A (zh) 2021-06-22
US20240019417A1 (en) 2024-01-18
JP6550124B2 (ja) 2019-07-24
EP3151665A4 (en) 2018-04-25
EP3151665B1 (en) 2021-03-10
JP2017510821A (ja) 2017-04-13
CA2945528C (en) 2019-03-12
EP3151665A1 (en) 2017-04-12
CA3030255A1 (en) 2015-10-15
JP2019200210A (ja) 2019-11-21
US9176113B1 (en) 2015-11-03
CA3030255C (en) 2022-07-05
EP3954991A3 (en) 2022-05-18

Similar Documents

Publication Publication Date Title
CN106714556B (zh) 用于测定自闭症谱系病症风险的方法和系统
US11674948B2 (en) Methods and systems for determining autism spectrum disorder risk
US11268966B2 (en) Biomarkers of autism spectrum disorder
Jain et al. The handbook of biomarkers
Anderson et al. Biomarkers in pharmacology and drug discovery
US8653006B2 (en) Metabolite biomarkers for the detection of esophageal cancer using NMR
Liang et al. Metabolomics of alcoholic liver disease: a clinical discovery study
CN111020020A (zh) 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法
Liang et al. Novel liquid chromatography-mass spectrometry for metabolite biomarkers of acute lung injury disease
CN114758719B (zh) 一种结直肠癌预测系统及其应用
CN115436633A (zh) 一种结直肠癌检测的生物标志物及其应用
US20240230622A9 (en) Methods and Systems for Determining Autism Spectrum Disorder Risk
CN111020021A (zh) 一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法
WO2019173671A1 (en) In vitro assay to predict cardiotoxicity
US20230402131A1 (en) Biomarker and diagnosis system for colorectal cancer detection
Smith et al. Maximizing Analytical Performance in Biomolecular Discovery with LC-MS: Focus on Psychiatric Disorders
CN116804676A (zh) 一种与哮喘相关的生物标志物及其应用
KR20230113742A (ko) 난소암의 검출 및 치료를 위한 방법
CN115219727A (zh) 与库欣综合征诊断相关的代谢物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant