CN104769132B - 肝脏相关的炎性疾病的基因标记 - Google Patents

肝脏相关的炎性疾病的基因标记 Download PDF

Info

Publication number
CN104769132B
CN104769132B CN201380054047.XA CN201380054047A CN104769132B CN 104769132 B CN104769132 B CN 104769132B CN 201380054047 A CN201380054047 A CN 201380054047A CN 104769132 B CN104769132 B CN 104769132B
Authority
CN
China
Prior art keywords
seq
gene
variation
abundance
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201380054047.XA
Other languages
English (en)
Other versions
CN104769132A (zh
Inventor
M·皮绍
P·兰波
S·埃利希
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute Of Agronomique
En Temu Biological Science Co Ltd
Original Assignee
National Institute Of Agronomique
En Temu Biological Science Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute Of Agronomique, En Temu Biological Science Co Ltd filed Critical National Institute Of Agronomique
Publication of CN104769132A publication Critical patent/CN104769132A/zh
Application granted granted Critical
Publication of CN104769132B publication Critical patent/CN104769132B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及在代谢和自身免疫性疾病中表征与肠道微生物群相关的炎症的领域。尤其是,涉及基因标记的鉴定,所述基因标记能用作预测炎症相关疾病或自身免疫性疾病的标记物,其中炎症相关疾病比如肝脏相关的代谢疾病,尤其是良性脂肪变性向其最严重形式(脂肪性肝炎和肝硬化)的演变,自身免疫性疾病尤其是炎性肠疾病(克罗恩病和溃疡性结肠炎)。因此,这些基因标记能够用作诊断、预后、药物研究分层、用于监测患者和用于指定适当治疗的手段。

Description

肝脏相关的炎性疾病的基因标记
技术领域
本发明涉及在代谢和自身免疫性疾病当中表征与肠道微生物群相关的炎症的领域。尤其是,涉及基因标记的鉴定,所述基因标记能用作预测炎症相关疾病或自身免疫性疾病的标记物,其中炎症相关疾病比如肝脏相关的代谢疾病,尤其是良性脂肪变性向其最严重形式(脂肪性肝炎和肝硬化)的演变,自身免疫性疾病尤其是炎性肠疾病(克罗恩病和溃疡性结肠炎)。因此,这些基因标记能够用作诊断、预后、药物研究分层、用于监测患者和用于指定适当治疗的手段。
背景技术
全身和局部炎症是许多疾病观察到的病理特征,特别是代谢性疾病和自身免疫性疾病。低度炎症是代谢性疾病和与之相关的共病如心脏病、中风和糖尿病的独立风险因素。炎症在时间上早于胰岛素抗性的检测,因此可能成为一个很好的糖尿病预测因子。慢性(持久低度)和急性(高度)炎症是自身免疫性疾病例如炎性肠疾病的一个重要特征。
代谢综合征也称为X综合征、X代谢综合征、心脏代谢综合征、胰岛素抗性综合征、CHAOS或者Reaven氏综合征。人们普遍认为它是以聚类(clustered)方式影响很多人的疾病的组合。综合征的症状和特征包括下列病症中的至少三个:II型糖尿病、减弱的葡萄糖耐量或者胰岛素抗性、高血压、中心性肥胖和减重困难、高胆固醇血症、混合型高脂血症和脂肪肝。基于生理学角度而言,胰岛素抗性似乎和该综合征有关。然而,胰岛素抗性可以按照很多不同的方式进行定义,包括减弱的葡萄糖代谢、不能抑制组织中的脂肪分解、蛋白合成缺陷、改变的细胞分化、异常的细胞周期控制或增值,所有这些都关系到与代谢综合征有关的肝脏和心血管疾病。
尽管某些细菌协会已经检验了这些病症,但仍未了解细菌微生物群在其发作中的作用。并且仍然需要用于诊断、治疗和预防病症的方法,所述病症如肥胖症、代谢综合征、胰岛素缺乏或者胰岛素抗性相关病症、葡萄糖不耐受、糖尿病、非酒精性脂肪肝(NAFL)、脂质代谢异常、动脉粥样硬化以及相关的疾病。
非酒精性脂肪性肝病NAFLD是代谢综合征的肝脏表现,以胰岛素抗性作为主要发病机制。非酒精性脂肪性肝病(NAFLD)代表了一系列的肝脏疾病,其涵盖肝脏组织中的单纯性脂肪浸润(脂肪变性)、不涉及过量饮酒的肝脏组织的脂肪和炎症(非酒精性脂肪性肝炎-NASH)和肝硬化、病毒性疾病(HCV、HBV)或者其它已明确的病因(自身免疫性疾病)。在西方国家它是慢性肝脏疾病的首要原因,患病率高达总人口的30%。关于NASH,研究报道估计的患病率是总人口的3%至5%。NAFLD与肥胖(在90%以上的肥胖患者中发现NAFLD)、2型糖尿病(在40%至70%的T2D患者中发现NAFLD)和血脂异常紧密相关。因此,NAFLD可被认为是代谢综合征的肝脏表现。
在NAFLD临床表现谱当中,单纯性脂肪变性尚未与肝脏相关的发病率相关联,但是NASH与增加>10倍的肝脏相关死亡风险和加倍的心血管风险有关。因此,仅次于HCV,NASH被认为是肝脏移植适应症的第二最常见病因,其占US移植名单(OPTN)中所登记患者的18%。
事实上,无论是NAFLD的患病率还是自然史,都表明它是引起肝脏疾病的非常常见的原因,它的亚型NASH可发展为肝硬化。这些观察强调了NAFLD在患者健康、健康相关的生活质量以及医疗卫生经济学方面的显著影响。
尽管患有NAFLD的大多数患者存在脂肪变性,但只有少数才发展为特征在于炎症和随后的纤维化、肝硬化以及肝细胞性肝癌的更晚期的疾病。研究表明,长期随访当中,约5.4%NASH患者发展成终末期肝脏疾病的严重并发症。这样的进展可能受到遗传和环境因素的影响,其中仅有一些得到了确认。已被识别的进展的独立风险因素是年龄>45岁、存在糖尿病(或胰岛素抗性的严重性)、肥胖(身体质量指数>30)和高血压。发生进展的患者通常出现在疾病自然过程的后期并且具有实质性的肝脏相关发病率(morbidity)。
因此,需要开发预后测试以评估这些患者肝脏相关发病率的风险,尤其是预测从良性脂肪肝进展为NASH和晚期肝脏疾病的风险。
目前认为肝脏活检是评估NAFLD严重程度特别是炎症和肝脏纤维化的最佳工具。然而,肝脏活检是一种侵入性的操作,在肝病专科操作以外它是不恰当的或者不实用的。此外,由于取样误差和观察者差异,它显示出解读误差的缺点(Adams L.A.&Feldstein A.E.,Journal of Digestive Diseases 2011)。因此,明显需要开发可靠的非侵入性筛选测试以有效区分已成为NASH的患者和只有脂肪变性的那些患者,以及区分进展风险低的患者和更具有进展性疾病的那些患者。
NAFLD往往无症状,并且通常首先作为常规血液测试时的偶然生化异常而被发现。然而,特征性的生化改变(例如,丙氨酸转氨酶比天冬氨酸转氨酶相对更大的上升)倾向于反转,并且丙氨酸转氨酶水平随着肝脏纤维化的进展而下跌。这意味着,甚至在具有相对正常的血液丙氨酸转氨酶水平的那些人当中,可能存在伴有晚期疾病的脂肪性肝炎。
已经提出了用于肝脏脂肪和炎症的非侵入性定量的几种其它方法,包括磁共振成像或者光谱和血液生物标记物盘(panel)。然而,支持其用在更广泛的临床实践中的证据仍然有限:肝脏的常规超声成像提供了肝脏脂肪含量的定量评估,但灵敏度是有限的,特别是当<33%的肝细胞脂肪变性时。而且,尽管它们为中等程度脂肪变性的检测提供了更高的灵敏度,用于脂质定量的磁共振技术往往是资源密集型的,并且还没有广泛用于常规临床使用。此外,肝脏脂肪含量趋于随着肝硬化的发展而降低,因此最终可能在晚期肝脏疾病的情况下漏诊了NASH。
因此,除了肝脏活检外,在常规操作中尚没有被广泛接受且可靠的方法可用于区分单纯性脂肪变性和脂肪性肝炎。结果,大多数NAFLD患者仍然不能得以确诊,并在初步护理水平上被进行处理以便控制他们基本(underlying)代谢因素(肥胖、糖尿病、胆固醇...)。进一步向NASH进展的患者在其疾病过程后期才被得以鉴定,并显示出显著的肝脏相关发病率。
因此,迫切需要,不仅仅是预测,而是鉴定患有NAFLD的患者,从而通过如下来改变患者管理:(a)提供更大的动力用于改变饮食和生活方式;(b)指导患有胰岛素抗性或者糖尿病的患者选药;以及(c)如果存在肝硬化则允许开始特定的监测策略。
迄今为止提出了几种治疗策略来处理NAFLD患者。然而,目前没有任何药物专门批准用于治疗肝脏炎症或者纤维化、NASH的主要临床特征,许多候选药物未能成功证明用于治疗NASH的显著功效(在组织学水平逆转已建立的炎症和纤维化)。新兴的策略认为有效的药物治疗应着重于NAFLD的初期发病来控制脂肪变性,并防止发展成炎性阶段。这种策略需要对NAFLD患者进行有效的分诊,从而能够针对向NASH进展的个体风险定制医疗护理。
因此,显然还需要开发一种筛选测试来诊断和临床上区分患有NAFLD的患者,用作初级和二级护理水平上的分诊测试。另外这种测试还应是非侵入性,并且在经济上可以接受的。
发明内容
本发明人鉴定了预测非酒精性脂肪性肝病(NAFLD)向其最严重形式(肝炎、肝硬化、肝癌)演变的特定基因标记。在患者粪便样本中评估这些基因标记是有利的。因此,这些基因标记被认为是肝脏相关代谢性疾病的诊断、预后和药物研究分层的第一个可靠且非侵入性的手段。它们也可用于监测由此诊断的患者以及给由此诊断的患者指定适当的治疗。
自身免疫性疾病源自身体对通常存在于身体中的物质和组织的不适当免疫反应。炎性肠疾病(IBD),如克罗恩病或者溃疡性结肠炎,是最常见的自身免疫性疾病。通过三种主要途径检测、分级和监测这些疾病:
-临床评估,主要是利用整合了患者数据以及患者自我报告问卷的综合得分;
-生物标记物,基于血液(即炎症标记物如CRP、或者血小板计数)或者排泄物(即钙卫蛋白(calprotectin));以及
-成像工具,包括带有或不带有组织学分析的内窥镜检验以及基于磁共振的检验(MRI或者MR肠动描记法)。
任何这些方法都弥补了对IBD中疾病活性监测和随后治疗方案的新工具的需求。由于这些疾病的复发性和多发性,IBD的严格控制,认为准确监测和治疗调整,目前是这种患者管理的关键。
仅监测临床症状对于评估疾病活性不够可靠。自我报告疾病活性低的患者在内窥镜检查期间经常出现肠道病变。生物标记物如排泄物钙卫蛋白是有用的,但不是特异性的,它们的增加和晚期急性发作(onset of the flare)的全身/粘膜炎症相关。内窥镜能够检测粘膜愈合,这认为是疾病缓解最强大和最可靠的标志(sign);然而,常规的重复内窥镜监测不可行,因为需要进行肠道准备和全身麻醉。新的成像工具如MRI被证明是有效的,但它昂贵、耗时且使用受限而不能常规使用。MR肠动描记法作为最有前途的方法,也涉及肠道准备和侵入性的结肠镜检查。
综上所述,患者和医疗服务提供者都在积极寻找能够评估疾病活性和监测患者护理的非侵入性工具。
此处,稳定的患者被定义为这样的患者,即其疾病活性持续数周是稳定的(“稳定状态”中的患者)。而不稳定的患者(或“不稳定状态”中的患者)是如下患者:
-在接下来的数周中他们的治疗被改变或者加强了,
-在接下来的数周中其血液测试显示活性升高,和/或
-其自我评估显示健康下降。
附图说明
图1公开了在NASH 1研究(A和D)、NASH 2研究(B和E)或者克罗恩病研究(C和F)群体中,根据他们的健康状况(单纯性脂肪变性(=NS)或者NASH-对于克罗恩病是稳定或者不稳定),簇1基因的重新分配。如在下面的实施例中所说明的,使用全局方法(A、B和C)或者阈值方法(D、E和F)。
图2公开了在NASH 1研究(A和D)、NASH 2研究(B和E)或者克罗恩病研究(C和F)群体中,根据他们的健康状况(单纯性脂肪变性(=NS)或者NASH-对于克罗恩病是稳定或者不稳定),簇31基因的重新分配。如在下面的实施例中所说明的,使用全局方法(A、B和C)或者阈值方法(D、E和F)。
图3公开了在NASH 1研究(A和D)、NASH 2研究(B和E)或者克罗恩病研究(C和F)群体中,根据他们的健康状况(单纯性脂肪变性(=NS)或者NASH-对于克罗恩病是稳定或者不稳定),簇19基因的重新分配。如在下面的实施例中所说明的,使用全局方法(A、B和C)或者阈值方法(D、E和F)。
图4公开了在NASH 1研究(A和C)或NASH 2研究(B和D)群体中,根据他们的健康状况(单纯性脂肪变性(=NS)或者NASH),簇11基因的重新分配。如在下面的实施例中所说明的,使用全局方法(A、B)或者阈值方法(C、D)。
图5公开了对于NASH 1群体(A)、NASH 2群体(B)或者克罗恩病群体(C)而言,1和31两个簇的基因低或者高的相对丰度(圈代表单纯性脂肪变性或克罗恩病稳定状态,而十字代表NASH或者克罗恩病不稳定状态)。
图6公开了对于NASH 1群体(A)、NASH 2群体(B)或者克罗恩病群体(C)而言,1和19两个簇的基因低或者高的相对丰度(圈代表单纯性脂肪变性或克罗恩病稳定状态,而十字代表NASH或者克罗恩病不稳定状态)。
图7公开了对于NASH 1群体(A)、NASH 2群体(B)或者克罗恩病群体(C)而言,19和31两个簇的基因低或者高的相对丰度(圈代表单纯性脂肪变性或克罗恩病稳定状态,而十字代表NASH或者克罗恩病不稳定状态)。
具体实施方式
定义
如此处所用,术语“炎性疾病”表示与促炎和抗炎细胞因子表达的系统性变化相关的代谢性疾病。C反应蛋白和脂肪细胞因子(即肿瘤坏死因子-α(TNF-α)、白细胞介素-6(IL-6)和脂连蛋白)经常作为与代谢性疾病相关的促炎和抗炎细胞因子而被观察到。C反应蛋白、排泄物钙卫蛋白和细胞因子(如肿瘤坏死因子-α(TNF-α)、白细胞介素-6(IL-6)、白细胞介素-8(IL8)经常作为与炎性肠疾病相关的促炎和抗炎细胞因子而被观察到。
在优选的实施方式中,所述炎性疾病选自:胰岛素抗性、高胆固醇血症、葡萄糖耐量降低、2型糖尿病、高血压、心血管疾病、炎性肠疾病、类风湿疾病和肝脏疾病。
“肝脏疾病”也被称为“肝病”。这是一个广义的术语,涵盖了导致肝脏不能履行其指定功能的所有潜在问题。更具体地说,在本申请中包括肝脏脂肪变性的所有不同阶段、非酒精性肝脏脂肪性肝炎、肝脏纤维化、肝硬化、肝脏衰竭和肝癌。
如此处所用,术语“非酒精性脂肪性肝病”(NAFLD)包括了无显著饮酒的个体中整个范围的脂肪性肝病,从脂肪肝到脂肪性肝炎和肝硬化。
“脂肪变性”也经常被称为“非酒精性脂肪肝”(NAFL)。它对应着存在肝脏的脂肪变性,但没有肝细胞气球样变性形式的肝细胞损伤证据或者没有纤维化的证据。以下它也被命名为“单纯性脂肪变性”。就医学角度来看,脂肪变性通过几种机制而发生。首先,脂肪组织的膨胀和炎症导致脂肪胰岛素抗性和脂肪分解增加,从而导致流入肝脏的游离脂肪酸增加。其次,肝脏的脂肪酸氧化受损以及诱导脂质氧化的蛋白(例如,脂联素)减少,导致脂肪在肝脏进一步积聚。第三,由高胰岛素血症驱动的肝脏重头合成的(de novo)脂肪生成增加以及碳水化合物的摄入增加提升了肝脏的脂肪含量。第四,VLDL(极低密度脂蛋白)的分泌受损加剧了这一过程。决定性的脂质氧化能力最终发生,导致反应性氧化物质(ROS)、肠源性信号(例如,细菌内毒素、短链脂肪酸)、炎性细胞因子的产生和脂肪因子的不平衡释放,然后这又导致了此病症向更严重的阶段(如脂肪性肝炎、纤维化和肝硬化)进展。
有趣的是,在NAFLD的自然史中,在3.5至11年的随访期间约60%的受试者其肝脏组织学参数没有发生变化,并且甚至有13%存在改善。另一方面,相同时期内,受试者中28%进展为如脂肪性肝炎、纤维化或者肝硬化的肝脏损伤(Angulo,N Engl J Med.2002Apr18;346(16):1221-31)。在胃肠病学和肝病学领域,这产生了“良性”和“恶性”这样的术语,被用于区分NAFLD的这些肝脏结局。
因此,在本申请中术语“良性脂肪变性”被用来指代这样的病症,在其中存在肝脏脂肪变性,但这种脂肪变性进展为脂肪性肝炎、纤维化或者肝硬化的风险极小(如果有的话)。换言之,如此处的含义,预测(或预后)患有“良性脂肪变性”的患者其肝脏组织学参数没有变化。
与此相反,在本申请中术语“炎性脂肪变性”被用来指代这样的病症,在其中存在肝脏脂肪变性,但这种脂肪变性具有进展为脂肪性肝炎、纤维化或者肝硬化的风险。换言之,如此处的含义,预测(或预后)患有“炎性脂肪变性”的患者在接下来的几个月或者几年当中将患有肝脏脂肪性肝炎、肝脏纤维化、肝硬化、肝脏衰竭或者肝癌。
无论纤维化存在与否,肝脏脂肪变性和伴有肝细胞损伤(气球样变性)的炎症存在时,被诊断为非酒精性脂肪性肝炎(NASH)。这一阶段可进展为肝硬化、肝脏衰竭以及极少情况下肝癌。如此处所用,术语“脂肪性肝炎”包括非酒精性脂肪性肝炎和酒精性脂肪性肝炎。
存在肝硬化、并具有当前的或之前的脂肪变性或者脂肪性肝炎的组织学证据时,诊断为NASH肝硬化,而存在肝硬化但是没有明显病因时诊断为隐源性(cryptogenic)肝硬化。患有隐源性肝硬化的患者具有大量代谢风险因素,如肥胖和代谢综合征。
肝脏脂肪变性和炎症存在并伴有纤维化时,诊断为NASH相关的纤维化。纤维化对应着修复或者反应过程中肝脏中形成过量的纤维结缔组织。“结疤(scarring)”指破坏基本的器官或者组织结构的融合纤维化。
肝硬化是慢性肝脏疾病的结果,其特征在于肝脏组织被导致肝脏功能丧失的纤维化、疤痕组织和再生结节(作为受损组织得以再生的过程中的结果而产生的块体)所替代。
肝脏衰竭指肝脏不能执行作为正常生理一部分的正常合成和代谢功能。公认两种形式,急性和慢性。“急性肝脏衰竭”被定义为肝细胞功能异常的迅速发展,特别是在不知道之前患上肝脏疾病的患者中的凝血功能障碍和精神状态改变(脑病),而“慢性肝脏衰竭”通常发生在肝硬化的情况下。
“肝癌”表示生长在肝脏表面或者里面的恶性肿瘤。肝癌不应与肝脏转移混淆,肝脏转移是源自身体其它器官的癌症并且迁移到肝脏。
此处术语“炎性肠疾病”尤其指克罗恩病和溃疡性结肠炎。
值得注意的是,炎性肠疾病或者风湿性疾病属于“自身免疫性疾病”。
如此处所用,“诊断”受试者中的疾病或者病症是指鉴定或检测所述受试者真正患有所述疾病或所述病症。与此相反,“预后”受试者中的疾病或者病症此处是指预测所述受试者将要患上所述疾病或病症。
尤其是,从而认为受试者中“诊断脂肪变性”是指鉴定或检测所述受试者患有单纯性脂肪变性(而不是NASH)。与此相反,受试者中“预后脂肪变性”是指所述受试者实际上患有良性脂肪变性,其将保持稳定。
更具体地,从而认为受试者中“诊断脂肪性肝炎”是指鉴定或检测所述受试者患有脂肪性肝炎(有或没有纤维化)。与此相反,受试者中“预后脂肪性肝炎”是指所述受试者有可能发展成脂肪性肝炎(有或者没有纤维化),例如因为其具有炎性脂肪变性。换言之,所述受试者具有患有脂肪性肝炎(有或者没有纤维化)的风险。
更具体地,从而认为受试者中“诊断纤维化”是指鉴定或检测所述受试者患有伴有纤维化的脂肪性肝炎。与此相反,受试者中“预后纤维化”是指所述受试者有可能发展为肝脏纤维化,例如因为其具有炎性脂肪变性或已建立的脂肪性肝炎。换言之,所述受试者具有患有纤维化的风险。
所谓“受试者具有患有某疾病的风险”,从而是指当受试者具有上述疾病或病症相关的基因丰度谱时,所述受试者具有大于50%,优选大于60%以及更优选大于75%的患有上述疾病或病症的风险。
如此处所用,术语“宏基因组(metagenome)”是指直接从受试者而不是从细胞培养物获得的基因组材料。因此,宏基因组是由微生物和宿主成分组成的。
如此处所用,术语“基因”广泛是指遗传信息单元。它由编码给定有机体的多肽或者RNA链的DNA或者RNA组成。更具体地,基因是基因组序列的可定位区域,其与调节区、转录区和/或其它功能性序列区相关联。本发明中所涉及的基因优选是“细菌基因”,即它们对应着细菌基因组中的可定位区域。
在本说明书的全部内容中,术语“基因标记”是指与测试样本中一个或者更多基因的量有关的一组信息。这个信息可能来自测试样本中基因拷贝或基因产物的量的鉴定。如此处所用,“本发明的基因标记”因此包括至少一个细菌基因的表达水平,优选至少两个细菌基因的表达水平,或者至少一个或两个细菌基因的丰度。
如此处所用,基因的“表达”是指来自基因的信息被用在功能基因产物合成中的过程。这些产物往往是蛋白,但在非蛋白编码基因中,例如核糖体RNA(rRNA)、转运RNA(tRNA)或者小核RNA(snRNA)基因,该产物也是功能性RNA。因此,可通过常规方法在蛋白水平确定相应的rRNA、tRNA、mRNA、snRNA和/或基因产物的存在来检测基因表达。
另一方面,“基因丰度”指测试基因的绝对或者相对量。基因的“绝对量”(或“绝对丰度”)指一定体积的测试样本中所述基因的拷贝总数,而基因的“相对量”(或“相对丰度”)指相对于基因总量的所述基因拷贝总数,或者相对于测试样本中存在的单个参考基因的量,或者优选参考基因的组合的量的所述基因拷贝总数。无处不在的基因,比如有机体存活所必需的基因例如DNA聚合酶,或者编码参与葡萄糖代谢的蛋白的基因,是宏基因组研究中良好的参考基因候选。
在本发明的方法中所用的“基因标记”因此包括或者由所测试的细菌基因的(绝对或者相对)丰度谱和/或表达谱组成。
所谓“丰度谱”,是指一组测试基因的绝对或者相对丰度。可以通过在DNA水平上例如通过定量PCR、测序或者核酸微阵列检测测试基因的拷贝数,来确定这种丰度。
所谓“表达谱”,是指一组测试基因的表达水平。可以通过例如在对应着测试基因的转录水平或者蛋白水平上检测基因产物的水平,来确定这些表达水平。
在本发明的上下文中,在分析的基因标记中如果将一个基因替换成另一个基因,而没有显著影响本发明方法的性能,则两个基因被认为是“等价的(equivalent)”。这种等价基因相互伴随地从样本中缺失,并且在它们所出现的样本中它们的丰度也按照相同的趋势和相同的比例相互伴随地发生变化。典型的情况是,当“基因A”和“基因B”相关时,意思是指“基因A”的表达水平或者丰度分别和“基因B”的表达水平在统计学意义上相关。在本发明的上下文中,这种相关性是正向的(意思是当“基因A”在患者中被上调时,那么“基因B”在相同的患者中也上调)。可以例如通过测量关联度如Pearson或Spearman相关系数,来确定这种相关性。或者,共变异数(covariance)可用于鉴定等价基因。
本领域技术人员预期两个基因的等价性是以下情况的结果,比如当两个基因属于相同的基因组时(Qin J,Li Y,Cai Z,Li S,Zhu J,Zhang F等人Nature,2012)、当两个基因属于两个相关联细菌的基因组时、或者当这两个基因的产物参与相同的代谢和/或者信号通路时(Abubucker S,Segata N,Goll J,Schubert AM,Izard J,等人PLoSComputBiol,2012)。
在本发明上下文中,“共变的(covariant)”基因与本发明中公开的代表性基因具有至少0.45、更优选0.5、并且甚至更优选0.6的最小Pearson相关性。
在优选的实施方式中,所述等价基因是属于相同细菌簇的共变基因。
如此处所用,“基因簇”或“簇”是指一系列的等价基因。本领域技术人员熟悉可以用来鉴定这些等价基因簇的方法(Qin J,Li Y,Cai Z,Li S,Zhu J,Zhang F等人Nature,2012)。所述簇可含有数百的细菌基因,优选如上定义的共变基因。简单起见,在本申请中针对每一个簇仅鉴定了这种共变基因中的五个。每一个簇中,和来自簇的大多数基因显著相关的基因(最小Pearson相关性>0.7)被指定为簇的代表性基因。这些代表性基因是例如SEQID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQID NO:91、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQID NO:146和SEQ ID NO:151。各簇中的所有其它基因“等价”于这些代表性基因。因此,簇含有一个代表性基因和数百的等价基因,它们所有都被视为是共变基因。
如此处所用,“等价基因标记”是包含除代表性基因以外的等价基因的基因标记,或是包含取代代表性基因的等价基因的基因标记,其中等价基因赋予本发明方法相同的性能。这些等价基因在上面已描述。在优选的实施方式中,等价基因标记含有属于两个不同簇的至少两个基因。在另一优选的实施方式中,等价基因标记含有仅属于一个簇的至少两个不同的基因。等价基因标记可含有代表性基因(SEQ ID NO:1、6、11、16等)及其等价基因的混合物、或者只有等价基因。它也可能含有簇的所有等价基因。或者,它可含有与簇的几个或所有等价基因相关的信号的算术或几何平均。
所谓“包含”意指基因标记可进一步包含任何其它基因,在其中特定的基因不显著影响本发明基因标记的基本特征(因此,和术语“基本上由...组成”的含义重叠)。相反,所谓“由...组成”意指所分析的基因标记中不存在其它基因。
“参考标记”是一种预定的基因标记,从一个或者几个已知患有炎症相关疾病的受试者的生物样本获得。在具体的实施方式中,用于与测试样本进行比较的参考标记获自受试者的生物样本,其中受试者已可靠且明确地诊断(例如,通过肝脏活检的方式)为患有炎性疾病,尤其是肝脏疾病如单纯性脂肪变性(“脂肪变性参考样本”)或者NASH(“NASH参考样本”),和/或获自已被诊断为患有NASH和纤维化的受试者的生物样本(“纤维化参考样本”),和/或获自已被诊断为克罗恩病且已知疾病活性的受试者的生物样本(“克罗恩病参考样本”)。因此,参考标记包含或者由在所述参考样本上已被确定的细菌基因的表达和/或丰度组成。优选地,这些信息获自足够数量的受试者,通常针对肝脏疾病的各个阶段(单纯性脂肪变性/NASH/纤维化)使用不同患者的96个样本,针对肝脏疾病的各个阶段使用另一组不同患者的145个样本,以及使用另一组不同疾病状态的118个克罗恩病患者样本。
将测试受试者的基因标记与参考标记进行“比较”,是指从测试受试者收集生物样本、提取其基因组物质RNA或者DNA、采用适当的方法、分别估计各基因的表达或相对丰度、以及将标记中各基因的表达和/或丰度分别与参考标记(并非优选)中相同基因的表达和/或丰度进行比较、或者使用基于参考样本或者标记经过校准的算法,将诊断或者预后结果附加至(affect...to)测试样本。在具体的实施方式中,根据所选择的算法,算法可给出一个值,然后将这个值与预定参考值比较(例如,通过逻辑回归)。这种比较需要如下面所述的数学和统计方法,以便提取出区别于参考标记的特征(例如,基因),其经过归纳总结后用于诊断或者预后目的。
如此处所用,术语“参考值”(或“对照值”)是指可用于鉴定与结果的类别(例如,单纯性脂肪变性、NASH或者NASH相关纤维化、稳定或者不稳定状态的克罗恩病活性)相关联的患者的特定值或者数据集。如前面所提到的,所述参考或者对照值获自被明确诊断为确定病理的患者或患者库(pool)的历史表达和/或丰度数据。这种参考或者对照值是预定值,其可以采取多种形式。它可以是单截断值,比如中位或者平均值。它可以是单个数字,等同地适用于每一个个体患者,或者它可以随着患者的特定亚群而变化。本领域技术人员采用任何上述计算模型能够轻易地确定这种参考值。
如此处所用,“用于确定基因标记的试剂”表示允许特异性地确定所述基因标记的试剂或者一组试剂,即专门用于特异性地确定基因标记之内所含基因的丰度和/或表达水平。例如,这些试剂可以是能够与包括在基因标记之内的mRNA、DNA或cDNA进行特异性杂交的核酸引物或者探针。或者,它们可以是抗体或者酶,其特异性识别包括在基因标记之内的基因所产生的蛋白。这种定义不包括用于确定任何基因的基因标记的通用试剂,如Taq聚合酶或者扩增缓冲液,尽管这种试剂也可被包含在根据本发明的试剂盒中。
在本发明上下文中,如果试剂展现出阈值水平的结合活性、和/或2)它和已知的相关分子没有显著的交叉反应,那么试剂(例如,探针、引物或者抗体)对于其靶标而言是“特异性的”或者“特异性识别”其靶标。本领域技术人员能够轻易地确定所述结合亲和性(affinity)。
发明详述
Flavell等人(Nature,2012)近期的研究结果在小鼠研究的基础上提供了炎性体、肠道微生物群和NAFLD之间关联性的证据。这些结果巩固了先前的公布,确立了肠道微生物群的生态失调加剧肝脏的脂肪变性并控制NAFLD的进展速度。
本发明人推测患者粪便中代表特定肠道微生物群的组成或改变(所谓的生态失调)的特定细菌基因的存在将成为有用的信息,并能够与肝脏相关代谢性疾病如NASH或者纤维化相关联。
Sokol等人(IBD,2009)的研究确立了肠道微生物群是炎性肠疾病(IBD)的病理核心。几个其它研究表明肠道微生物群失衡与IBD相关(相对于健康对照),并且还与疾病活性和疾病预后相关(Sokol 2008,Morgan 2012,Willing 2010)。
本发明人通过对收集自患者的一些粪便样本中细菌基因的宏基因组学基因丰度进行定量来进行分析,其中所述患者近期的肝脏活检是可获得的,或者患者的克罗恩病活性得以监测。
在代谢性脂肪性肝病中,在患有脂肪变性(N=29)或患有伴纤维化的脂肪性肝炎(N=33)或者不伴纤维化的脂肪性肝炎(N=34)的患者组之间进行宏基因组比较,促使其鉴定了用于区分这些患者的宏基因组标记。
随后在大量的经历了肝脏活检的患者粪便样本上验证这些区分性的基因标记,其中有些患者处于疾病的不同阶段。
在IBD中,在稳定的低活性疾病(N=20)或者不稳定疾病(N=98)的克罗恩病患者组之间进行宏基因组比较,促使其鉴定了用于区分这两类患者的宏基因组标记。
因此,鉴定了在NAFLD不同阶段之间以及在克罗恩病患者的不同疾病活性状态之间的丰度差异的一些基因。重要的是,这些基因的丰度可能与疾病未来的发展关联(例如,肝脏组织学上发展为改进或者恶化)。
更精确地说,已发现14个基因簇通常和良性脂肪变性或者克罗恩病的稳定状态相关,以及发现7个基因簇和更晚期的肝脏疾病(NASH、纤维化、肝硬化)相关。此外,发现8个基因簇和不伴有纤维化的NASH高度相关,以及发现2个基因簇和NASH相关的纤维化相关。因此,最小数目基因的一些组合被提出作为良性脂肪变性、或者伴有或不伴有纤维化的NASH或者克罗恩病活性的预测。
此外,发现4个基因簇(簇1、31、19和11)和良性脂肪变性高度相关,以及发现3个基因簇(簇1、31和19)和稳定的克罗恩病高度相关。
重要的是要注意,本发明的方法不仅允许诊断特定的炎性疾病阶段,还允许预后患有所述炎性疾病尤其是肝脏疾病或者克罗恩病的患者阳性或阴性的结果。
这可以作如下解释。在婴儿期获得肠道微生物群(0-3岁之间)。宿主的免疫系统在选择明确的核心微生物群时具有关键作用,核心微生物群对于每个个体而言(在其组成方面)是特异性的,并且随着时间保持稳定。随着时间以及整个生命期间所观察到的核心微生物群稳定性,独立于饮食结构的改变并且可反弹(即,医源性破坏后进行恢复)。鉴于这种稳定性和反弹性,核心微生物群的特征(组成、丰富程度、多样性)与明确的炎症诱导的代谢紊乱有关,并且存在于病理发作时和贯穿整个疾病的演变期间。因此,有可能通过在疾病进程的某个时间点简单地分析所述患者的肠道微生物群,从而预后脂肪肝是否会进展为晚期肝脏损伤如脂肪性肝炎、纤维化或者肝硬化,或者是否会在患者的整个生命期间保持良性。
重要的另一点是,肠道微生物群在控制肠道屏障功能特别是其透过性中具有关键作用。肠道微生物群组成的变化,导致肠道屏障功能改变、促进细菌移位(在血液中存在细菌及其成分)以及导致代谢性内毒素血症(在血液中存在内毒素),而这些开启了炎症的进展。因此,炎症诱导的紊乱如糖尿病、高血压、高胆固醇血症、炎性肠疾病和肝脏疾病,最初是受到受损肠道通透性的驱动,而受损肠道通透性是肠道微生物群的组成改变所触发的(Cani P.,Gut microbes,2012)。因此,目的在于诊断、监测或预测肝脏疾病演变的基于肠道微生物群分析的测试,也可能用于诊断、监测或预测任何其它炎症相关的紊乱(即,糖尿病、高血压、高胆固醇血症、炎性肠疾病和心血管疾病)。
第一方面,因此本发明涉及一种用于体外诊断或预后受试者中炎性疾病的方法,包括如下步骤:
a)从所述受试者的生物样本中确定包含或者由一个细菌基因优选至少两个细菌基因组成的基因标记,
b)将获得的基因标记与至少一个参考基因标记进行比较,
c)通过所述比较,确定所述受试者的表型。
这种方法优于现有技术的诊断或者预后方法,因为它是非侵入性的、经济上可接受的、且呈现高灵敏度和高特异性。
在一个实施方式中,本发明的方法也可用于预测患有炎性疾病的患者的结局。
在优选的实施方式中,所述炎性疾病选自:胰岛素抗性、高胆固醇血症、葡萄糖耐量降低、2型糖尿病、高血压、心血管疾病、炎性肠疾病和肝脏疾病。
在一个更优选的实施方式中,所述炎性疾病是炎性肠疾病(如克罗恩病)或者肝脏疾病(如良性脂肪变性、NASH或者NASH相关的纤维化)。
本发明的方法能够应用于任何受试者,无论是人还是动物。然而,在优选的实施方式中,其应用于人类患者,特别是患有超重、肥胖症、肝脏疾病、糖尿病(即,因任何代谢性疾病所致的)和/或炎性肠疾病的人类。
更一般地,在代谢性疾病中,本发明的方法用于监测这样的人类患者,即患者显示出水平升高的肝脏酶以及肝细胞损伤标记物,其中肝脏酶例如转氨酶、碱性磷酸酶、γ谷氨酰转移酶,其中肝细胞损伤标记物如CK18、α巨球蛋白、血小板体积、触珠蛋白、载脂蛋白A1和胆红素。在炎性肠疾病中,本发明的方法用于监测这样的人类患者,即患者显示出水平升高的炎症标记物以及炎症的排泄物标记物,其中炎症标记物如血小板计数、平均血小板体积、红细胞沉降率(ESR)、血清血小板生成素、血清促红细胞生成素、C反应蛋白和血清类粘蛋白(α1酸性糖蛋白)、TNFα、白细胞介素(特别是IL1、IL2、IL6、IL8、IL10、IL15),其中炎症的排泄物标记物如乳铁蛋白和钙卫蛋白。
如前面提到的,本发明人已鉴定了31个细菌基因簇,其在来自良性脂肪变性、NASH和/或NASH相关纤维化的患者粪便中,或者在来自稳定或不稳定状态克罗恩病患者的样本中,存在丰度的差异。这些细菌基因的簇显示于下表1中。认为细菌基因的每个簇代表一个细菌的实体,其包含共同存在/缺失并且按照相同比例(所谓的“共变基因”)的数百个细菌基因。简便起见,在本申请中针对各个簇的这些共变基因仅鉴定了5个。这五个基因和属于相同簇的所有基因被认为是“等价的”。
更精确地说,如下表1中所公开,
·簇1含有至少425个基因,这当中的五个基因是SEQ ID NO:1-5(最小Pearson相关性:0.64),
·簇2含有至少473个基因,这当中的五个基因是SEQ ID NO:6-10(最小Pearson相关性:0.72),
·簇3含有至少486个基因,这当中的五个基因是SEQ ID NO:11-15(最小Pearson相关性:0.72),
·簇4含有至少324个基因,这当中的五个基因是SEQ ID NO:16-20(最小Pearson相关性:0.7),
·簇5含有至少515个基因,这当中的五个基因是SEQ ID NO:21-25(最小Pearson相关性:0.86),
·簇6含有至少320个基因,这当中的五个基因是SEQ ID NO:26-30(最小Pearson相关性:0.66),
·簇7含有至少456个基因,这当中的五个基因是SEQ ID NO:31-35(最小Pearson相关性:0.7),
·簇8含有至少336个基因,这当中的五个基因是SEQ ID NO:36-40(最小Pearson相关性:72),
·簇9含有至少509个基因,这当中的五个基因是SEQ ID NO:41-45(最小Pearson相关性:0.8),
·簇10含有至少275个基因,这当中的五个基因是SEQ ID NO:46-50(最小Pearson相关性:0.86),
·簇11含有至少646个基因,这当中的五个基因是SEQ ID NO:51-55(最小Pearson相关性:0.74),
·簇12含有至少320个基因,这当中的五个基因是SEQ ID NO:56-60(最小Pearson相关性:0.86),
·簇13含有至少323个基因,这当中的五个基因是SEQ ID NO:61-65(最小Pearson相关性:0.7),
·簇14含有至少593个基因,这当中的五个基因是SEQ ID NO:66-70(最小Pearson相关性:0.7),
·簇15含有至少283个基因,这当中的五个基因是SEQ ID NO:71-75(最小Pearson相关性:0.74),
·簇16含有至少621个基因,这当中的五个基因是SEQ ID NO:76-80(最小Pearson相关性:0.76),
·簇17含有至少263个基因,这当中的五个基因是SEQ ID NO:81-85(最小Pearson相关性:0.82),
·簇18含有至少1039个基因,这当中的五个基因是SEQ ID NO:86-90(最小Pearson相关性:0.82),
·簇19含有至少1231个基因,这当中的五个基因是SEQ ID NO:91-95(最小Pearson相关性:0.74),
·簇20含有至少712个基因,这当中的五个基因是SEQ ID NO:96-100(最小Pearson相关性:0.8),
·簇21含有至少575个基因,这当中的五个基因是SEQ ID NO:101-105(最小Pearson相关性:0.88),
·簇22含有至少1232个基因,这当中的五个基因是SEQ ID NO:106-110(最小Pearson相关性:0.64),
·簇23含有至少298个基因,这当中的五个基因是SEQ ID NO:111-115(最小Pearson相关性:0.7),
·簇24含有至少785个基因,这当中的五个基因是SEQ ID NO:116-120(最小Pearson相关性:0.76),
·簇25含有至少780个基因,这当中的五个基因是SEQ ID NO:121-125(最小Pearson相关性:0.82),
·簇26含有至少491个基因,这当中的五个基因是SEQ ID NO:126-130(最小Pearson相关性:0.72),
·簇27含有至少827个基因,这当中的五个基因是SEQ ID NO:131-135(最小Pearson相关性:0.64),
·簇28含有至少531个基因,这当中的五个基因是SEQ ID NO:136-140(最小Pearson相关性:0.88),
·簇29含有至少289个基因,这当中的五个基因是SEQ ID NO:141-145(最小Pearson相关性:78),
·簇30含有至少320个基因,这当中的五个基因是SEQ ID NO:146-150(最小Pearson相关性:0.74),
·簇31含有至少299个基因,这当中的五个基因是SEQ ID NO:151-155(最小Pearson相关性:0.66)。
在每个簇中,和来自簇的大多数基因显著相关(Pearson相关性>0.7)的基因被指定为所述簇的代表性基因。这些代表性基因的序列是SEQ ID NO:1、SEQ ID NO:6、SEQ IDNO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ IDNO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ IDNO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQ ID NO:91、SEQ ID NO:96、SEQ IDNO:101、SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ ID NO:146和SEQ ID NO:151。
本发明人发现,当只有一个或两个上述簇中所选细菌基因的表达和/或丰度被直接或者间接地得以确定、并且与参考基因标记(见下面的实施例)进行比较时,本发明的方法是高度灵敏和特异性的。因此,使用含有代表性基因(例如,对于簇1是SEQ ID NO:1)或者含有任何其等价基因(例如,对于簇1是SEQ ID NO:2或3或4或5)的基因标记是等价的。在优选的实施方式中,基因标记含有属于相同簇的至少两个不同基因(或者如上文所定义的,“代表基因”和至少一个其“等价基因”、至少两个等价基因)。在另一优选的实施方式中,基因标记含有至少两个不同的基因,所述基因属于至少两个不同簇。
例如,本发明的方法能够使用SEQ ID NO:1和SEQ ID NO:6的基因标记、或者SEQID NO:2和SEQ ID NO:6的基因标记、或者SEQ ID NO:3和SEQ ID NO:6的基因标记、或者SEQID NO:3和SEQ ID NO:6的基因标记、或者SEQ ID NO:3和SEQ ID NO:7的基因标记、或者SEQID NO:1和SEQ ID NO:9的基因标记,等。
在优选的实施方式中,本发明方法中确定的基因标记包含或者由一个或者至少两个细菌基因、优选至少三个、优选至少四个、优选至少五个、优选至少六个、优选至少七个、优选至少八个、优选至少九个、优选至少十个、优选至少十一个、优选至少十二个、优选至少十三个、优选至少十四个、优选至少十五个、优选至少十六个、优选至少十七个、优选至少十八个、优选至少十九个、优选至少二十个、优选至少二十一个、优选至少二十二个、优选至少二十三个、优选至少二十四个、优选至少二十五个、优选至少二十六个、优选至少二十七个、优选至少二十八个、优选至少二十九个、优选至少三十个、优选至少三十一个细菌基因组成。
优选地,所述细菌基因属于上述限定的基因相同的簇或者属于不同的簇。
在甚至更优选的实施方式中,上述的细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ IDNO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQ ID NO:91、SEQ IDNO:96、SEQ ID NO:101、SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ ID NO:146和SEQ IDNO:151。或者,本发明方法中确定的基因标记包含或者由其等价基因标记组成。
在甚至更优选的实施方式中,上述的细菌基因选自:SEQ ID NO:1、SEQ ID NO:51、SEQ ID NO:91和SEQ ID NO:151,这些与肝脏和肠相关疾病的特定阶段高度相关。
换言之,本发明方法中确定的基因标记包含或由选自:SEQ ID NO:1、SEQ ID NO:51、SEQ ID NO:91和SEQ ID NO:151的细菌基因组成。
或者,本发明方法中确定的基因标记包含或由其等价基因标记组成。
在优选的实施方式中,所述“等价基因标记”对应着这样的基因标记,即在其中至少一个所谓的代表性基因被上述限定的其等价基因所取代,优选地所述等价基因是属于相同细菌实体的共变基因。
在更优选的实施方式中,SEQ ID NO:1的等价基因选自SEQ ID NO:2至5,SEQ IDNO:6的等价基因选自SEQ ID NO:7至10,SEQ ID NO:11的等价基因选自SEQ ID NO:12至15,SEQ ID NO:16的等价基因选自SEQ ID NO:17至20,SEQ ID NO:21的等价基因选自SEQ IDNO:22至25,SEQ ID NO:26的等价基因选自SEQ ID NO:27至30,SEQ ID NO:31的等价基因选自SEQ ID NO:32至35,SEQ ID NO:36的等价基因选自SEQ ID NO:37至40,SEQ ID NO:41的等价基因选自SEQ ID NO:42至45,SEQ ID NO:46的等价基因选自SEQ ID NO:47至50,SEQID NO:51的等价基因选自SEQ ID NO:52至55,SEQ ID NO:56的等价基因选自SEQ ID NO:57至60,SEQ ID NO:61的等价基因选自SEQ ID NO:62至65,SEQ ID NO:66的等价基因选自SEQID NO:67至70,SEQ ID NO:71的等价基因选自SEQ ID NO:72至75,SEQ ID NO:76的等价基因选自SEQ ID NO:77至80,SEQ ID NO:81的等价基因选自SEQ ID NO:82至85,SEQ ID NO:86的等价基因选自SEQ ID NO:87至90,SEQ ID NO:91的等价基因选自SEQ ID NO:92至95,SEQ ID NO:96的等价基因选自SEQ ID NO:97至100,SEQ ID NO:101的等价基因选自SEQ IDNO:102至105,SEQ ID NO:106的等价基因选自SEQ ID NO:107至110,SEQ ID NO:111的等价基因选自SEQ ID NO:112至115,SEQ ID NO:116的等价基因选自SEQ ID NO:117至120,SEQID NO:121的等价基因选自SEQ ID NO:122至125,SEQ ID NO:126的等价基因选自SEQ IDNO:127至130,SEQ ID NO:131的等价基因选自SEQ ID NO:132至135,SEQ ID NO:136的等价基因选自SEQ ID NO:137至140,SEQ ID NO:141的等价基因选自SEQ ID NO:142至145,SEQID NO:146的等价基因选自SEQ ID NO:147至150,SEQ ID NO:151的等价基因选自SEQ IDNO:152至155。
在一个具体的实施方式中,本发明的方法使用了包含或者由属于簇1的SEQ IDNO:1的细菌基因或者其等价基因(例如选自SEQ ID NO:2至5)组成的基因标记。换言之,本发明的方法使用了包含或者由序列是SEQ ID NO:1的细菌基因组成的基因标记、或者其等价基因标记。优选这种等价基因标记含有选自SEQ ID NO:2至5的一个或更多基因。优选地,根据本发明的方法,这种细菌基因用来预后或者诊断肝脏疾病或克罗恩病。
在一个具体的实施方式中,本发明的方法使用了包含或者由属于簇11的SEQ IDNO:51的细菌基因或者其等价基因(例如选自SEQ ID NO:52至55)组成的基因标记。换言之,本发明的方法使用了包含或者由序列是SEQ ID NO:51的细菌基因组成的基因标记、或者其等价基因标记。优选这种等价基因标记含有选自SEQ ID NO:52至55的一个或更多基因。优选地,根据本发明的方法,这种细菌基因用来预后或者诊断肝脏疾病。
在一个具体的实施方式中,本发明的方法使用了包含或者由属于簇19的SEQ IDNO:91的细菌基因或者其等价基因(例如选自SEQ ID NO:92至95)组成的基因标记。换言之,本发明的方法使用了包含或者由序列是SEQ ID NO:91的细菌基因组成的基因标记、或者其等价基因标记。优选这种等价基因标记含有选自SEQ ID NO:92至95的一个或更多基因。优选地,根据本发明的方法,这种细菌基因用来预后或者诊断肝脏疾病或克罗恩病。
在一个具体的实施方式中,本发明的方法使用了包含或者由属于簇31的SEQ IDNO:151的细菌基因或者其等价基因(例如选自SEQ ID NO:152至155)组成的基因标记。换言之,本发明的方法使用了包含或者由序列是SEQ ID NO:151的细菌基因组成的基因标记、或者其等价基因标记。优选这种等价基因标记含有选自SEQ ID NO:152至155的一个或更多基因。优选地,根据本发明的方法,这种细菌基因用来预后或者诊断肝脏疾病或克罗恩病。
值得注意的是,有可能在本发明方法的步骤a)中使用包含或者由发明人鉴定的各簇的至少一个基因组成的基因标记。尤其是,有可能在本发明方法中使用包含或者由发明人鉴定的所有所谓“代表性”基因、任选连同其等价物组成的基因标记。更具体地,有可能使用这样的基因标记,即把所有所谓的“代表性”基因连同其等价基因的信号纳入考虑之中。甚至更具体地,有可能使用这样的基因标记,即把与簇的几个或所有等价基因相关的信号的算术或几何平均值纳入考虑之中(实施例1b和2b)。
“生物样本”可以是取自受试者的任何样本,如血清样本、血浆样本、尿液样本、血液样本、粪便样本、淋巴样本、或者活检。这样的样本必须允许确定本发明的基因标记。
用于确定本发明方法中的基因标记的优选生物样本包括粪便样本和肠道活检(通过结肠镜的肠道活检的侵入性明显低于肝脏活检)。
在一个更优选的实施方式中,用于本发明方法中的生物样本是粪便样本。事实上,可通过从患者的完全无害收集获得这样的样本,因此允许非侵入性诊断炎性疾病,如肝脏疾病或者炎性肠疾病。例如通过使用Godon JJ等人,Appl.Environ.Microbiol.1997描述的提取规程从所述样本来提取DNA。无论如何,其它规程也可以使用,并且是公知的。值得注意的是,不需要在物理上将细菌DNA和宿主DNA分离用于后续的宏基因组分析。
按照本发明方法步骤(b)所述的,通过将获得的基因标记和至少一个参考标记进行比较,例如在某些克罗恩病患者或者患有肝脏疾病的患者中进行炎性疾病存在的确定。
优选地,通过对测量测试样本所得的基因信号采用算法,来进行测试受试者的基因标记和所述参考标记的比较,从而这种比较在他/她的丰度或表达谱的基础上允许诊断或者预测测试受试者的临床状态和演变。由本领域的技术人员使用统计模型或者机器学习技术来完成这种计算。PLS(偏最小二乘法)回归尤其适合在小量参考样本的情况下给出预测。还可以使用递归分区(Recursive Partitioning)、支持向量机(SVM)、线性回归或其衍生的方法(如缩写为GLM的广义线性模型,包括逻辑回归)、线性判别分析(LDA,包括对角线线性判别分析(DLDA))、对角二次判别分析(DQDA)、随机森林、k-NN(最近邻居法)或者PAM(微阵列的预测分析)算法。也可以使用Cox模型。采用各种类型距离的质心(centroid)模式也可使用。对于所研究群体并不均匀的情况下,即当若干个不同组基因参与、-或者支持、-或者导致了所述表型时,也可以考虑其它算法,例如所鉴定的变量的递归分区或者简单组合。
上面提到的参考样本通常用于选择和校准最佳统计算法,其中所述最佳统计算法最能够将患有各阶段炎性疾病如肝脏疾病或者炎性肠疾病的患者分离出来。最好的分离通常是这样的分离,即将尽可能少的分错类别的样本,并且最有机会在不同的数据集上同等地很好发挥作用。
对于二进制的结果例如良性/恶性的诊断,可以使用线性回归或者广义线性模型(简称为GLM),包括逻辑回归。线性回归基于线性回归函数的确定,其通式可以表示为:
f(X1,…,xN)=β01x1+…+βnxN
可以使用线性回归函数的其它代表(见下文)。
逻辑回归基于逻辑回归函数的确定:
其中Z通常被定义为
z=β01x1+…+βNxN
在上面线性或者回归函数中,X1至XN是标记中N个基因的表达或者丰度值,β0是截距,以及β1至βN是回归系数。
截距和回归系数的值是基于上述限定的一组参考样本确定的。当基于这些参考样本限定线性或者逻辑回归函数时,用户将良好或者不良的诊断(例如,分别是,单纯性脂肪变性或NASH、或者克罗恩病的稳定或者不稳定状态的诊断)或者预后与限定的值关联起来,那么特定的阈值(以下称为“参考值”)就得以确定了。根据和测试标记相关联的值是否低于或者高于参考值,然后能够将测试的基因标记划分为具有良好或者不良的诊断(例如,分别是,单纯性脂肪变性或NASH、或者克罗恩病的稳定或者不稳定状态的诊断)或者预后(良性或者炎性脂肪变性)。
除了逻辑回归以外的其它类型广义线性模型也可使用。这些方法是本领域技术人员所熟知的。
总之,基于一组参考样本(优选地,包括若干个良性脂肪变性相关的参考标记以及若干个NASH和NASH相关纤维化相关的参考标记)来校准算法(选自:线性回归或其衍生方法,比如广义线性模型(GLM,包括逻辑回归)、最近邻居法(k-NN)、决策树、支持向量机(SVM)、神经网络、线性判别分析(LDA)、随机森林、或微阵列的预测分析(PAM)),然后应用到测试样本。简单来说,基于患者标记中所有基因和来自参考标记的所有基因比较的情况如何,患者将被分为良好(或不良)诊断/预后。
科学上有兴趣去了解,基因标记中的单个基因在良好诊断/预后相对于不良诊断/预后的样本中是否被提高或降低了。对于每个单个基因,可通过使用学生t检验或者等价的方法,比较在良好诊断/预后组中的基因表达或者丰度水平与不良诊断/预后组中的基因表达或者丰度水平。然而,当标记包含几个不同的基因时,这种二元比较一般不用于诊断/预后。
在优选的实施方式中,本发明的方法允许确定受试者是否患有肝脏疾病,以及尤其是是否患有良性脂肪变性、NASH或者NASH相关的纤维化。
因此,在本发明涉及一种用于体外诊断和/或预后肝脏疾病的方法,包括如下步骤:
a)从受试者的生物样本中确定包含或者由一个细菌基因优选至少两个细菌基因组成的基因标记,
b)将获得的基因标记与至少一个参考基因标记进行比较,
c)通过所述比较,确定所述受试者的表型。
在优选的实施方式中,所述肝脏疾病选自:脂肪变性、非酒精性脂肪性肝炎、肝脏纤维化、肝硬化、肝脏衰竭和肝癌。
在优选的实施方式中,本发明的方法能够用于诊断或者预后肝脏疾病的特定阶段。
尤其是,本发明的方法能够用于良性脂肪变性的(良好)诊断或预后,或者用于脂肪性肝炎的(不良)诊断或者预后。
在本实施方式中,本发明的方法包括以下步骤:
a)从受试者的生物样本中确定包含或者由选自以下的一个或至少两个细菌基因组成的基因标记:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ IDNO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ IDNO:81、SEQ ID NO:86、SEQ ID NO:91、SEQ ID NO:96、SEQ ID NO:101,或其等价基因标记,
b)将获得的基因标记与至少一个参考标记进行比较,
c)通过所述比较,诊断所述受试者是否患有良性脂肪变性或脂肪性肝炎。
对于这样的诊断或者预后方法,良性脂肪变性被认为是一个阳性的(positive)结果,而脂肪性肝炎被认为是一个阴性的(negative)结果(认为患者患有或将患有脂肪性肝炎)。
本发明人已经明确表明,选自如下的一个或者更多细菌基因的组合:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ IDNO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQ IDNO:91、SEQ ID NO:96、SEQ ID NO:101,或其等价基因,能够有效区分患有脂肪性肝炎的受试者(即,伴有或不伴有纤维化的NASH)或更晚期肝脏疾病的受试者(肝硬化、肝癌)与患有良性脂肪变性的受试者(参见下文实施例1)。
更精确地说,他们已经证明,通过分析由这些细菌基因中的两个、三个、四个、五个、六个、七个、八个、九个、或者十个组成的基因标记,能够有效区分这些受试者。
因此,通过确定一个或者至少两个细菌基因,优选至少三个、优选至少四个、优选至少五个、优选至少六个、优选至少七个、优选至少八个、优选至少九个、优选至少十个、优选至少十一个、优选至少十二个、优选至少十三个、优选至少十四个、优选至少十五个、优选至少十六个、优选至少十七个、优选至少十八个、优选至少十九个、优选至少二十个、优选至少二十一个细菌基因的表达和/或丰度,能够诊断或者预后患有脂肪性肝炎的患者,其中细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQID NO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQID NO:86、SEQ ID NO:91、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ IDNO:141、SEQ ID NO:146、SEQ ID NO:151或选自等价标记的等价基因。
在优选的实施方式中,通过确定由四个代表性基因SEQ ID NO:1、SEQ ID NO:81、SEQ ID NO:56和SEQ ID NO:96组成的基因标记来诊断良性脂肪变性或者脂肪性肝炎,这已被证明是高度特异性的且相对灵敏的(AUC:0.83,sn:0.62;sp:0.9;PPV:0.72;NPV:0.85),或者是确定由九个代表性基因SEQ ID NO:1、SEQ ID NO:16、SEQ ID NO:41、SEQ ID NO:71、SEQ ID NO:81、SEQ ID NO:21、SEQ ID NO:46、SEQ ID NO:91和SEQ ID NO:96组成的基因标记来诊断良性脂肪变性或者脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.86,sn:0.66;sp:0.9;PPV:0.73;NPV:0.86),或者是确定由十个代表性基因SEQ ID NO:1、SEQID NO:6、SEQ ID NO:11、SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:41、SEQ ID NO:51、SEQID NO:61、SEQ ID NO:76和SEQ ID NO:96组成的基因标记来诊断良性脂肪变性或者脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.83,sn:0.59;sp:0.9;PPV:0.71;NPV:0.83)。
在另一优选实施方式中,通过确定由六个簇1、5、17、10、12和20的所有基因(见下文表1)组成的基因标记,来诊断良性脂肪变性或者脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.81,sn:0.48;sp:0.94;PPV:0.78;NPV:0.81),或者确定由十个簇2、5、8、12、13、15、16、17、18和21的所有基因组成的基因标记,来诊断良性脂肪变性或者脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.8,sn:0.52;sp:0.9;PPV:0.68;NPV:0.81)。
在另一优选实施方式中,通过确定由两个簇1和31的每一个中的至少一个基因(见下文表1中对应的靶序列)组成的基因标记,来诊断良性脂肪变性或者脂肪性肝炎,这已被证明是不灵敏的但非常特异性的(AUC:0.64,sn:0.29;sp:0.9;PPV:0.48;NPV:0.8),或者由四个簇1、16、13和14的每一个中的至少一个基因组成的基因标记,来诊断良性脂肪变性或者脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.76,sn:0.59;sp:0.87;PPV:0.65;NPV:0.83)或者由五个簇12、5、10、18和19的每一个中的至少一个基因组成的基因标记来诊断良性脂肪变性或者脂肪性肝炎(AUC:0.7,sn:0.41;sp:0.94;PPV:0.75;NPV:0.79),这已被证明是高度特异性的且灵敏的,或者由八个簇3、16、15、11、13、14、7和4的每一个中的至少一个基因组成的基因标记来诊断良性脂肪变性或者脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.73,sn:0.66;sp:0.84;PPV:0.63;NPV:0.85)。
在另一实施方式中,一旦受试者尤其通过上述步骤a)至c)被诊断为脂肪性肝炎,则本发明的方法能够用于诊断或者预后伴有纤维化的脂肪性肝炎的受试者。
在这个具体的实施方式中,本发明的方法进一步包括以下步骤:
d)在所述生物样本中确定包含或由一个或者至少两个细菌基因组成的基因标记,其中细菌基因选自:SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ ID NO:146、SEQ ID NO:151,或者其等价基因标记,
e)将步骤d)获得的基因标记与至少一个参考标记进行比较,
f)根据所述比较,确定所述受试者是否患有伴有纤维化的脂肪性肝炎。
对于这样的诊断或者预后方法,无纤维化的NASH被认为是“阳性”的结果,而更晚期的肝脏相关疾病(伴有纤维化的NASH)被认为是一个阴性的结果。
本发明人已明确表明,如步骤a)至c)所确定的,一旦发现受试者的基因标记与脂肪性肝炎相关,则一个或者更多细菌基因的组合能够有效区分患有“单纯性”脂肪性肝炎(即无纤维化)的受试者或纤维化相关脂肪性肝炎的受试者(参见下文实施例2),其中细菌基因选自:SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ ID NO:146、SEQ ID NO:151或者其等价基因。
在下面的实施例2中,他们还表明,通过分析由这些细菌基因中的两个、三个、四个、五个、六个、七个、或者八个组成的基因标记能够有效区分这些受试者。
因此,通过确定一个或者至少两个细菌基因,优选至少三个,优选至少四个,优选至少五个,优选至少六个,优选至少七个,优选至少八个,优选至少九个,优选至少十个细菌基因的表达和/或丰度,能够诊断或者预后患有纤维化相关脂肪性肝炎的患者,其中细菌基因选自:SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ ID NO:146、SEQ ID NO:151或者选自等价标记的等价基因。
在优选的实施方式中,通过确定由七个代表性基因:SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121;SEQ ID NO:131、SEQ ID NO:136和SEQ ID NO:151组成的基因标记,诊断纤维化相关的脂肪性肝炎,这已被证明是高度特异性且灵敏的(AUC:0.83,sn:0.76;sp:0.82;PPV:0.81;NPV:0.78),或确定由八个代表性基因:SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ IDNO:136和SEQ ID NO:151组成的基因标记诊断纤维化相关的脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.81,sn:0.82;sp:0.79;PPV:0.79;NPV:0.82)。
在另一优选的实施方式中,通过确定由六个簇22、23、25、27、28和31(见下面表1对应的靶序列)的所有基因组成的基因标记,诊断纤维化相关的脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.85,sn:0.74;sp:0.85;PPV:0.83;NPV:0.76),或者确定由七个簇22、23、24、25、27、28和31的所有基因组成的基因标记诊断纤维化相关的脂肪性肝炎,这已被证明是高度特异性的且灵敏的(AUC:0.85,sn:0.88;sp:0.7;PPV:0.75;NPV:0.85)。
在另一优选的实施方式中,本发明的方法能够用于诊断或者预后克罗恩病患者的特定状态。
尤其是,本发明的方法能够用于诊断或者预后处于稳定状态的克罗恩病患者,或者用于诊断或者预后处于不稳定状态的克罗恩病患者。
在本实施方式中,本发明的方法包括以下步骤:
a)从受试者的生物样本中确定包含或者由一个或至少两个细菌基因组成的基因标记,所述细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQID NO:81、SEQ ID NO:86、SEQ ID NO:91、SEQ ID NO:96、SEQ ID NO:101或其等价基因标记,
b)将获得的基因标记与至少一个参考标记进行比较,
c)通过所述比较,诊断所述受试者是否患有稳定或者不稳定状态的克罗恩病。
对于这样的诊断或者预后方法,“稳定状态的克罗恩病患者”或者“稳定的克罗恩病”被认为是一个阳性的结果,而“不稳定状态的克罗恩病患者”或者“不稳定的克罗恩病”被认为是一个阴性的结果。
本发明人已明确证明一个或更多细菌基因能够有效区分患有稳定克罗恩病或不稳定克罗恩病的受试者(参见如下实施例4),其中细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ IDNO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQ ID NO:91、SEQ IDNO:96、SEQ ID NO:101或者其等价基因。
在一个特别优选的实施方式中,通过确定由五个簇3、11、17、10和18的每一个中的至少一个基因(见下文表1中对应的靶序列)组成的基因标记,来预后或诊断克罗恩病,这已被证明是高度特异性的且灵敏的(AUC:0.73,sn:0.4;sp:0.99;PPV:0.89,NPV:0.89),或者确定由六个簇2、7、11、15、17和18的每一个中的至少一个基因组成的基因标记来预后或诊断克罗恩病,这已被证明是高度特异性的且灵敏的(AUC:0.74,sn:0.4;sp:0.99;PPV:0.89;NPV:0.89),或确定由六个簇3、11、13、15、17和18的每一个中的至少一个基因组成的基因标记来预后或诊断克罗恩病,这已被证明是高度特异性的且灵敏的(AUC:0.74,sn:0.4;sp:0.99;PPV:0.89;NPV:0.89),或者确定由七个簇3、11、12、14、16、17和18的每一个中的至少一个基因组成的基因标记来预后或诊断克罗恩病,这已被证明是高度特异性的且灵敏的(AUC:0.73,sn:0.4;sp:0.99;PPV:0.89;NPV:0.89)。
本领域技术人员通过任何已知的技术来确定基因标记。尤其是,在基因组和/或核酸和/或蛋白水平测量每个基因的表达或者丰度。在优选的实施方式中,通过测量每个基因的DNA拷贝量来确定基因标记。在另一实施方式中,通过测量每个基因产生的核酸转录物和/或蛋白的量来确定基因标记。
在优选的实施方式中,通过采用基于多核苷酸杂交、多核苷酸测序和/或蛋白质组学的基因丰度谱的方法确定步骤a)和d)中受试者的基因标记。
本领域技术人员通过任何已知的技术来测量每个基因的DNA拷贝量。在本领域已知的用于定量样本中DNA链的最常用方法包括Northern印迹和原位杂交(Parker&Barnes,Methods in Molecular Biology 106:247-283(1999))以及基于PCR的方法,例如定量聚合酶链反应(qPCR)(Held等人Genome Research 6:986-994(1996))。或者,可使用能够识别序列特异性双链体(包括DNA双链体或者DNA蛋白双链体)的抗体。对于基于测序的分析,有代表性的方法包括链终止法、鸟枪测序法、从头测序、下一代测序方法(包括大规模并行测序标记(MPSS)、聚合酶克隆测序、焦磷酸测序454、Illumina(Solexa)测序、SOLiD测序、离子半导体测序、DNA纳米球测序、Helioscope单分子测序、单分子实时(SMRT)测序、RNAP测序、纳米孔DNA测序、通过杂交的测序和微流控Sanger测序)。
本领域技术人员通过任何已知的技术来测量由基因产生的蛋白的量。尤其是,通过使用蛋白质微阵列、原位荧光杂交(FISH)或者本领域公知的任何技术进行测量。
在一个具体的实施方式中,通过测量所述细菌基因的相对丰度来确定本发明方法的步骤a)和d)的基因标记。如先前公开的,例如通过测量所述基因的拷贝总数和存在于测试样本中的细菌基因总量,并且得到这两个量之间的比,来评估基因的相对丰度。如下面实施例所示,使用高通量测序技术(下一代测序或者NGS)、在非冗余参考目录上绘制(mapping)/比对获得的短读取、以及对绘制到目录中单个参考序列上的读取数目进行计数,通过对提取自排泄物样本的DNA进行测序,能够测量基因拷贝数。所绘制的读取的数目相对于基因的长度进行归一化,以及基因计数相对于细菌基因的总量进行归一化,是数据归一化的两个优选选项。
在优选的实施方式中,本发明的诊断和/或预后方法能够用于为患有炎性疾病如肝脏疾病或者炎性肠疾病的受试者设计治疗。在本实施方式中,本发明的方法包括为受试者设计治疗的附加步骤,所述治疗适于(通过本发明的方法)已被诊断的特定病理。
尤其是,能够使用本发明的方法用于测试在患有炎性疾病如肝脏疾病或者克罗恩病的受试者中的治疗效果。
例如,如果本发明的诊断方法能够鉴定患有2型糖尿病的受试者,则适当的治疗可以是选自如下的药物治疗:抗糖尿病药,如(但不限于)二甲双胍、双胍、噻唑烷、磺酰脲、美格列奈、α葡萄糖苷酶抑制剂、肠促胰岛素模拟剂(包括胰高血糖素样肽类似物和激动剂、抑胃肽类似物、二肽基肽酶4抑制剂、胰淀素类似物)、TGR5激活剂、GPR119配体、葡糖激酶激活剂、锌转运蛋白的激动剂、IL1β抑制剂、硫氧还蛋白相互作用蛋白的抑制剂;以及生活方式干预,如不同热量限制强度和常量营养成分(低碳水化合物、低脂肪、饱和脂肪饮食)的广谱饮食;以及肥胖症治疗学的手术程序,包括束胃带、胆肠旁路术、和胃旁路术、袖状胃切除手术。
例如,如果本发明的诊断方法能够鉴定患有良性脂肪变性的受试者,则适当的治疗可以是选自如下的药物治疗:抗糖尿病药,如(但不限于)二甲双胍、双胍、噻唑烷、磺酰脲、美格列奈、α葡萄糖苷酶抑制剂、肠促胰岛素模拟剂(包括胰高血糖素样肽类似物和激动剂、抑胃肽类似物、二肽基肽酶4抑制剂、胰淀素类似物)、TGR5激活剂、GPR119配体、葡糖激酶激活剂、锌转运蛋白的激动剂、IL1β抑制剂、硫氧还蛋白相互作用蛋白的抑制剂、肠道脂肪酶抑制剂;以及外周大麻素受体阻断剂或者激动剂,以及抗氧化剂如(但不限于)己酮可可碱维生素E和维生素D,以及半胱天冬酶抑制剂、PDE4选择性抑制剂、胆汁酸及其衍生物(熊去氧胆酸(UDCA)、FXR和RXR激动剂)以及多不饱和脂肪酸例如但不限于ω-3脂肪酸和共轭ω-3脂肪酸,以及生活方式干预,如不同热量限制强度和常量营养成分(低碳水化合物、低脂肪、饱和脂肪饮食)的广谱饮食;以及肥胖症治疗学的手术程序,包括(但不限于)束胃带、胆肠旁路术、胃旁路术、和袖状胃切除手术。
例如,如果本发明的诊断方法能够鉴定患有NASH相关纤维化的受试者,则适当的治疗可以是选自如下的药物治疗:抗糖尿病药,如(但不限于)二甲双胍、双胍、噻唑烷、磺酰脲、美格列奈、α葡萄糖苷酶抑制剂、肠促胰岛素模拟剂(包括胰高血糖素样肽类似物和激动剂、抑胃肽类似物、二肽基肽酶4抑制剂、胰淀素类似物)、TGR5激活剂、GPR119配体、葡糖激酶激活剂、锌转运蛋白的激动剂、IL1β抑制剂、硫氧还蛋白相互作用蛋白的抑制剂、肠道脂肪酶抑制剂;以及外周大麻素受体阻断剂或者激动剂,以及抗氧化剂如(但不限于)己酮可可碱维生素E和维生素D,以及半胱天冬酶抑制剂、PDE4选择性抑制剂、胆汁酸及其衍生物(熊去氧胆酸(UDCA)、FXR和RXR激动剂)以及多不饱和脂肪酸例如(但不限于)ω-3脂肪酸和共轭ω-3脂肪酸,抗纤维化药物例如(但不限于)秋水仙碱、干扰素γ、ARB、PPAR配体、吡非尼酮;以及生活方式干预,如(但不限于)不同热量限制强度和常量营养成分(低碳水化合物、低脂肪、饱和脂肪饮食)的广谱饮食;以及肥胖症治疗学的手术程序,包括(但不限于)束胃带、胆肠旁路术、胃旁路术、和袖状胃切除手术。
例如,如果本发明的诊断方法能够鉴定患有不伴有纤维化的NASH的受试者,则适当的治疗可以是选自如下的药理治疗:抗糖尿病药,如(但不限于)二甲双胍、双胍、噻唑烷、磺酰脲、美格列奈、α葡萄糖苷酶抑制剂、肠促胰岛素模拟剂(包括胰高血糖素样肽类似物和激动剂、抑胃肽类似物、二肽基肽酶4抑制剂、胰淀素类似物)、TGR5激活剂、GPR119配体、葡糖激酶激活剂、锌转运蛋白的激动剂、IL1β抑制剂、硫氧还蛋白相互作用蛋白的抑制剂、肠道脂肪酶抑制剂;以及外周大麻素受体阻断剂或者激动剂,以及抗氧化剂如(但不限于)己酮可可碱维生素E和维生素D,以及半胱天冬酶抑制剂、PDE4选择性抑制剂、胆汁酸及其衍生物(熊去氧胆酸(UDCA)、FXR和RXR激动剂)以及多不饱和脂肪酸例如(但不限于)ω-3脂肪酸和共轭ω-3脂肪酸,抗纤维化药物例如(但不限于)秋水仙碱、干扰素γ、ARB、PPAR配体、吡非尼酮;以及生活方式干预,如(但不限于)不同热量限制强度和常量营养成分(低碳水化合物、低脂肪、饱和脂肪饮食)的广谱饮食;以及肥胖症治疗学的手术程序,包括(但不限于)束胃带、胆肠旁路术、胃旁路术、和袖状胃切除手术。
例如,如果本发明的诊断方法能够鉴定患有炎性肠疾病的受试者的状态,则适当的治疗可以是选自如下的药物治疗:硫唑嘌呤、美沙拉嗪、阿贝西普、阿达木单抗、阿那白滞素、赛妥珠单抗、依那西普、戈利木单抗、英夫利昔单抗、利妥昔单抗、托珠单抗、那他珠单抗、皮质类固醇、环孢菌素、甲氨蝶呤、他克莫司、抗JAK(托法替尼)、抗整联素(维多珠单抗、rhuMAbβ7、MAdCAM-1拮抗剂)、或者抗IL12/IL23(优特克单抗、ABT874)。
更优选地,在本实施方式中,本发明包括用于治疗患有炎性疾病的受试者的方法,包括以下步骤:
i)根据本发明的方法,诊断和/或者预后受试者中的炎性疾病,如2型糖尿病、高胆固醇血症、高血压、炎性肠疾病(如克罗恩病)或肝脏疾病,
以及
ii)用适当的治疗来治疗所述受试者,所述适当的治疗选自一旦被诊断为所述炎性疾病而被执业医师(practitioner)所典型采用的那些治疗。
优选地,所述适当的治疗可以选自:抗糖尿病药,如(但不限于)二甲双胍、双胍、噻唑烷、磺酰脲、美格列奈、α葡萄糖苷酶抑制剂、肠促胰岛素模拟剂(包括胰高血糖素样肽类似物和激动剂、抑胃肽类似物、二肽基肽酶4抑制剂、胰淀素类似物)、TGR5激活剂、GPR119配体、葡糖激酶激活剂、锌转运蛋白的激动剂、IL1β抑制剂、硫氧还蛋白相互作用蛋白的抑制剂、肠道脂肪酶抑制剂;以及外周大麻素受体阻断剂或者激动剂,以及抗氧化剂如(但不限于)己酮可可碱维生素E和维生素D,以及半胱天冬酶抑制剂、PDE4选择性抑制剂、胆汁酸及其衍生物(熊去氧胆酸(UDCA)、FXR和RXR激动剂)以及多不饱和脂肪酸例如(但不限于)ω-3脂肪酸和共轭ω-3脂肪酸,抗纤维化药物例如(但不限于)秋水仙碱、干扰素γ、ARB、PPAR配体、吡非尼酮。
甚至更优选地,本发明包括一种用于管理患有炎性疾病的受试者的方法,包括以下步骤:
i)根据本发明的方法,诊断和/或者预后受试者中的炎性疾病,如2型糖尿病、高胆固醇血症、高血压、炎性肠疾病(如克罗恩病)或肝脏疾病,
以及
ii)用适当的治疗来照顾所述受试者,所述适当的治疗选自一旦被诊断为所述炎性疾病而被执业医师所典型采用的那些治疗。
在此具体实施方式中,优选地所述适当的治疗是生活方式干预,例如不同热量限制强度和常量营养成分(低碳水化合物、低脂肪、饱和脂肪饮食)的饮食;和/或肥胖症治疗学的手术程序,包括(但不限于)束胃带、胆肠旁路术、胃旁路术、和袖状胃切除手术。
在优选的实施方式中,本发明包括用于治疗患有肝脏疾病的受试者的方法,包括以下步骤:
i)根据本发明的方法,诊断和/或预后受试者中的良性脂肪变性、脂肪性肝炎、或者纤维化相关脂肪性肝炎,
以及
ii)用适当的治疗来治疗所述受试者,所述适当的治疗选自一旦被诊断为所述肝脏疾病的阶段而被执业医师所典型采用的那些治疗。
优选地,所述适当的治疗可以选自:抗糖尿病药,如(但不限于)二甲双胍、双胍、噻唑烷、磺酰脲、美格列奈、α葡萄糖苷酶抑制剂、肠促胰岛素模拟剂(包括胰高血糖素样肽类似物和激动剂、抑胃肽类似物、二肽基肽酶4抑制剂、胰淀素类似物)、TGR5激活剂、GPR119配体、葡糖激酶激活剂、锌转运蛋白的激动剂、IL1β抑制剂、硫氧还蛋白相互作用蛋白的抑制剂、肠道脂肪酶抑制剂;以及外周大麻素受体阻断剂或者激动剂,以及抗氧化剂如(但不限于)己酮可可碱维生素E和维生素D,以及半胱天冬酶抑制剂、PDE4选择性抑制剂、胆汁酸及其衍生物(熊去氧胆酸(UDCA)、FXR和RXR激动剂)以及多不饱和脂肪酸例如(但不限于)ω-3脂肪酸和共轭ω-3脂肪酸,抗纤维化药物例如(但不限于)秋水仙碱、干扰素γ、ARB、PPAR配体、吡非尼酮。
甚至更优选地,本发明包括一种用于管理患有肝脏疾病的受试者的方法,包括以下步骤:
i)根据本发明的方法,诊断和/或者预后受试者中的良性脂肪变性、脂肪性肝炎、或者纤维化相关脂肪性肝炎,
以及
ii)用适当的治疗来照顾所述受试者,所述适当的治疗选自一旦被诊断为所述肝脏疾病的阶段而被执业医师所典型采用的那些治疗。
在此具体实施方式中,优选地所述适当的治疗是生活方式干预,例如不同热量限制强度和常量营养成分(低碳水化合物、低脂肪、饱和脂肪饮食)的饮食;和/或肥胖症治疗学的手术程序,包括(但不限于)束胃带、胆肠旁路术、胃旁路术、和袖状胃切除手术。
在优选的实施方式中,本发明包括用于治疗患有炎性肠疾病如克罗恩病的受试者的方法,包括以下步骤:
i)根据本发明的方法,诊断和/或者预后受试者中患有炎性肠疾病的患者状态,
以及
ii)用适当的治疗来治疗所述受试者,所述适当的治疗选自一旦被诊断为所述炎性肠疾病的状态而被执业医师所典型采用的那些治疗。
例如,如果克罗恩病患者被诊断为不稳定状态,适当的治疗可以是选自如下的药物治疗:硫唑嘌呤、美沙拉嗪、阿贝西普、阿达木单抗、阿那白滞素、赛妥珠单抗、依那西普、戈利木单抗、英夫利昔单抗、利妥昔单抗、托珠单抗、那他珠单抗、皮质类固醇、环孢菌素、甲氨蝶呤、他克莫司、抗JAK(托法替尼)、抗整联素(维多珠单抗、rhuMAbβ7、MAdCAM-1拮抗剂)、或者抗IL12/IL23(优特克单抗、ABT874)。
另一方面,本发明还涉及一种根据本发明的方法用于体外诊断和/或预后炎性疾病如肝脏疾病或克罗恩病的试剂盒,其包含至少一种用于确定基因标记或者其等价基因标记的试剂,所述基因标记包含至少一个或两个细菌基因,所述细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQ IDNO:91、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ IDNO:146、SEQ ID NO:151。
所述试剂盒可包含其它试剂(例如,引物、探针或者抗体),其中其它试剂特异于一个或更多参考基因的其它基因或基因产物。参考基因此处是指,在不同的细菌之间具有普遍的表达和/或丰度水平的基因,可用于将标记中的基因水平归一化。所述试剂盒还可含有用于确定存在或者不存在炎性疾病例如肝脏疾病或者炎性肠疾病的说明书。
有利的是,如果试剂盒意图用于诊断或预后良性脂肪变性,则包含在本发明试剂盒中的试剂特异于SEQ ID NO:1、SEQ ID NO:81、SEQ ID NO:56和SEQ ID NO:96;特异于SEQID NO:1、SEQ ID NO:16、SEQ ID NO:41、SEQ ID NO:71、SEQ ID NO:81、SEQ ID NO:21、SEQID NO:46、SEQ ID NO:91和SEQ ID NO:96;特异于SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:41、SEQ ID NO:51、SEQ ID NO:61、SEQ IDNO:76和SEQ ID NO:96;特异于六个簇1、5、17、10、12和20的所有基因;或者特异于十个簇2、5、8、12、13、15、16、17、18和21的所有基因。
更有利的是,这些试剂特异于SEQ ID NO:1、SEQ ID NO:91、SEQ ID NO:51和/或SEQ ID NO:151。
有利的是,如果试剂盒意图用于诊断或预后纤维化相关脂肪性肝炎,则包含在本发明试剂盒中的试剂特异于:SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121;SEQ ID NO:131、SEQ ID NO:136和SEQ ID NO:151;特异于SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136和SEQ ID NO:151;特异于六个簇22、23、25、27、28和31的所有基因;或者特异于七个簇22、23、24、25、27、28和31的所有基因。
在优选的实施方式中,本发明的试剂盒专门用于体外诊断和/或预后炎性疾病如肝脏疾病或者炎性肠疾病。所谓“专门”,是指本发明试剂盒中的试剂基本上由用于确定包括在基因标记中的特定基因的丰度和/或表达水平的试剂所组成,任选地包括一个或更多持家基因,因此除基因标记中提及的那些基因和持家基因以外,含有尽可能少的用于确定基因的表达和/或丰度的试剂。
另一方面,因此本发明涉及一种用于体外诊断或预后受试者中炎性疾病的方法,所述方法使用上述限定的本发明试剂盒,在优选实施方式中,所述方法包括如下步骤:
a)从所述受试者的生物样本中确定包含或者由一个细菌基因优选至少两个细菌基因组成的基因标记,从而使用上述限定的本发明试剂盒,
b)将获得的基因标记与至少一个参考基因标记进行比较,
c)通过所述比较,确定所述受试者的表型。
在优选的实施方式中,在上述限定的条件下,所述方法允许确定受试者是否患有或者将患有肝脏疾病,以及尤其是良性脂肪变性、NASH或者NASH相关的纤维化。
在另一优选的实施方式中,在上述限定的条件下,所述方法允许确定受试者是否患有稳态或者不稳定状态的克罗恩病。
此外,用于确定存在或者不存在克罗恩病/肝脏疾病表型的说明书优选包括至少一个参考标记,或者至少一个用于获得参考标记的参考样本。在优选的实施方式中,至少一个参考标记获自脂肪变性参考样本。或者,至少一个参考标记获自NASH参考样本。或者,至少一个参考标记获自纤维化参考样本。或者,至少一个参考标记获自克罗恩病稳定态的参考样本。或者,至少一个参考标记获自克罗恩病不稳定态的参考样本。更优选,通过和上述这些参考标记进行比较来实现克罗恩病/肝脏疾病诊断的确定。
另一方面,本发明还涉及一种核酸微阵列,其包含或者由特异于一个或至少两个细菌基因的核酸组成,所述细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQ ID NO:91、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ IDNO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ ID NO:146、SEQ ID NO:151或者其等价基因。
更有利的是,这些微阵列包含或者由特异于至少一个细菌基因的核酸组成,所述细菌基因选自:SEQ ID NO:1、SEQ ID NO:91、SEQ ID NO:51和SEQ ID NO:151。
甚至更有利的是,这些微阵列包含或者由特异于簇1和31的每一个中的至少一个基因,簇1、16、13和14的每一个中的至少一个基因,或簇3、16、13、15、16、11、14、7和4的每一个中的至少一个基因的核酸组成(见下文表1对应的靶序列)。例如它们可用来预后或者诊断患有肝脏疾病的患者中的肝脏疾病。
甚至更有利的是,这些微阵列包含或者由特异于簇3、11、17和10的每一个中的至少一个基因,簇2、7、11、15、17和18的每一个中的至少一个基因,或簇3、11、13、15、17和18的每一个中的至少一个基因,或者簇3、11、12、14、17和18的每一个中的至少一个基因的核酸组成(见下文表1对应的靶序列)。例如它们可用来预后或者诊断患有克罗恩病的患者中的克罗恩病的演变。
根据本发明,“核酸微阵列”由附着至基质上的不同核酸探针组成,其可以是微芯片、玻片或者微球大小的珠。微芯片可由聚合物、塑料、树脂、多糖、二氧化硅或者二氧化硅基材料、碳、金属、无机玻璃、或者硝化纤维素构成。探针可以是核酸,例如cDNA(“cDNA微阵列”)或者寡核苷酸(“寡聚核苷酸微阵列”),并且所述寡核苷酸约25至约60个碱基对或更短的长度。
在优选的实施方式中,本发明的核酸微阵列是寡核苷酸微阵列,其载有充当特异性探针的能够特异性杂交至一个或者至少两个细菌基因的寡核苷酸,其中细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ IDNO:86、SEQ ID NO:91、SEQ ID NO:96、SEQ ID NO:101、SEQ ID NO:106、SEQ ID NO:111、SEQID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ ID NO:146、SEQ ID NO:151。优选地,寡核苷酸长度为约50个碱基。
应当知晓,本发明的核酸微阵列包含特异于上述限定的等价基因标记的微阵列。
有利的是,如果所述核酸微阵列意图用于诊断或者预后良性脂肪变性,则所述核酸微阵列包含或者由至少特异于SEQ ID NO:1、SEQ ID NO:81、SEQ ID NO:56和SEQ ID NO:96的核酸组成;特异于SEQ ID NO:1、SEQ ID NO:16、SEQ ID NO:41、SEQ ID NO:71、SEQ IDNO:81、SEQ ID NO:21、SEQ ID NO:46、SEQ ID NO:91和SEQ ID NO:96的核酸组成;特异于SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:21、SEQ ID NO:31、SEQ ID NO:41、SEQ ID NO:51、SEQ ID NO:61、SEQ ID NO:76和SEQ ID NO:96的核酸组成;特异于六个簇1、5、17、10、12和20的所有基因的核酸组成;或者特异于十个簇2、5、8、12、13、15、16、17、18和21的所有基因的核酸组成。
更有利的是,所述核酸微阵列包含或者由特异于选自:SEQ ID NO:1、SEQ ID NO:91、SEQ ID NO:51和SEQ ID NO:151的至少一个细菌基因的核酸组成。
甚至更有利的是,所述核酸微阵列包含或者由特异于簇1和31的每一个中的至少一个基因,簇1、16、13和14的每一个中的至少一个基因,或簇3、16、13、15、16、11、14、7和4的每一个中的至少一个基因的核酸组成(见下文表1对应的靶序列)。例如它们可用来预后或者诊断患有肝脏疾病的患者中的肝脏疾病。
甚至更有利的是,所述核酸微阵列包含或者由特异于簇3、11、17和10的每一个中的至少一个基因,簇2、7、11、15、17和18的每一个中的至少一个基因,或簇3、11、13、15、17和18的每一个中的至少一个基因,或者簇3、11、12、14、17和18的每一个中的至少一个基因的核酸组成(见下文表1对应的靶序列)。例如它们可用来预后或者诊断患有克罗恩病的患者中的克罗恩病的演变。
有利的是,如果所述微阵列意图用于诊断或者预后纤维化相关脂肪性肝炎,则所述微阵列包含或者由至少特异于SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ IDNO:121;SEQ ID NO:131、SEQ ID NO:136和SEQ ID NO:151的核酸组成;特异于SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQID NO:136和SEQ ID NO:151的核酸组成;特异于六个簇22、23、25、27、28和31的所有基因的核酸组成;或特异于七个簇22、23、24、25、27、28和31的所有基因的核酸组成。
所述核酸微阵列可以包含特异于额外的基因以及任选一个或者更多参考基因的额外核酸,但优选最多由500、400、300、200个,优选100、90、80、70个,更优选60、50、45、40、35、30、25、20、15、10个,或者甚至更少(例如9、8、7、6、5、4、3、2或1个)的不同核酸组成。
为了确定靶核酸样本的基因标记,所述样本被标记,在杂交条件中与本发明的核酸微阵列接触,这导致靶核酸之间形成复合物,其中所述靶核酸和附着至微阵列表面的探针序列是互补的。然后检测核酸微阵列上存在的标记杂交复合物。本领域技术人员可以使用微阵列杂交技术的许多变换形式。
使用本领域中已知的任何微阵列寡核苷酸设计方法,基于每个基因的基因组序列,可以设计特异于SEQ ID NO:1至155中任意基因的合适微阵列寡核苷酸。尤其是,可以使用针对微阵列寡核苷酸设计而开发的任何可用软件,如例如OligoArray软件(可在http://berry.engin.umich.edu/oligoarray/上获得)、GoArrays软件(可在http://www.isima.fr/bioinfo/goarrays/上获得)、Array Designer软件(可在http://www.premierbiosoft.com/dnamicroarray/index.html上获得)、Primer3软件(可在http://frodo.wi.mit.edu/primer3/primer3_code.html上获得)、或Promide软件(可在http://oligos.molgen.mpg.de/上获得)。
另一方面,因此本发明涉及一种用于体外诊断或者预后受试者中的炎性疾病的方法,所述方法使用上述限定的本发明微阵列。在优选的实施方式中,所述方法包括以下步骤:
a)从所述受试者的生物样本中确定包含或者由一个细菌基因优选至少两个细菌基因组成的基因标记,从而使用上述限定的本发明微阵列,
b)将获得的基因标记与至少一个参考基因标记进行比较,
c)通过所述比较,确定所述受试者的表型。
在优选的实施方式中,在上述限定的条件下,所述方法允许确定受试者是否患有或者将患有肝脏疾病或炎性肠疾病,尤其是良性脂肪变性、NASH或者NASH相关的纤维化。
实施例
材料与方法
1.利用共变原则,采用聚类(clustering)的方法。将两步的分层聚类绘图法(hierarchical graph clustering)应用到来自MetaHIT集团的435个样本,并将其绘至330万的基因目录上。
在第一步,使用MetaProf软件,利用来自435个样本的丰度谱,在所有330万个基因之间计算出所有非冗余成对Spearman相关性。
在不到20分钟之内,在French Curie超级计算机的288个核上计算了5.4*1012个不同的相关性。起始阈值rho=0.5用来给基因分簇。当簇的规模大于10,000基因时,通过增加相关性阈值0.01对合成基因(composing gene)进行反复的再分簇(re-cluster),直到其最终的规模小于或者等于10,000。使用可增加的(inflatable)离散阈值,第一步允许穷尽且确定性地探索聚类问题。
在第二步,规模大于1,000个基因并且在至少两个样本中基因有非空丰度信号的簇,进行另一分区的程序。这种方法包括采用DAPC算法的参数分区方法。为了评估一组基因中簇的最佳数目(即k),用3pam2函数来估计最佳轮廓宽度3(silhouette width3)。然后,在R编程环境中使用3adegenet2文库来应用DAPC方法。包括至少90%总变异的主成分(pricipalcomponent)最小数目用于将基因分簇。第二步允许把所有基因分成亚单元,这对应于所鉴定的簇。
2.鉴定感兴趣的基因簇
通过对簇中基因丰度取平均值获得预定基因簇的相对丰度。只使用多于500个项目的簇,因为它对应着已知细菌的最小规模。使用Kolmogorov-Smirnov和Wilcoxon非参数检验,相对于表型(良性脂肪变性相对于NASH或NASH+纤维化、或NASH相对于NASH+纤维化)检验基因簇的对数转换丰度谱。选择通过这项检验(p值阈值:0.05)的簇。根据原始簇的要素(elements),使用分层聚类将它们分成亚簇,以便富集要素高度相关的簇。使用Kolmogorov-Smirnov和Wilcoxon检验来检验含有多于250个要素的亚簇。只选择最显著通过检验的亚簇。
3.将这些方法应用至获自肝脏患者的102个排泄物样本上,所有患者都有能获得的近期(<4年)活检。
表1
重要的是,表1指示了如下之间的对应关系:
-簇的编号和所附列表中的靶序列,
-内部参考编码(下文也称为“mgs”)和簇的编号。
结果的统计分析
实施例1:良性脂肪变性的诊断
如下定义和计算了真和假阳性结果、NPV、PPV、特异性和灵敏度:
·PPV(阳性预测值)=TP/(TP+FP)
·NPV(阴性预测值)=TN/(TN+FN)
·特异性=TN/(TN+FP)
·灵敏度=TP/(TP+FN)
·ER=错误率
a)来自2、3、4、5、6、7、8、9、10基因簇的基因的组合(k)用于诊断良性脂肪变性(仅考虑每个簇的代表性基因)
粗体显示的组合给出最显著的结果。
b)2、3、4、5、6、7、8、9、10个基因的组合(k)用于诊断良性脂肪变性(考虑表1以及每个簇的列表中公开的5个等价基因)
粗体显示的组合给出最显著的结果。
c)采用簇1至21的所有代表性基因,得到:
·AUC:0.84
·灵敏度(良性脂肪变性的鉴定):0.45
·特异性:0.94
·PPV:0.76
·NPV:0.80
·错误率:0.21
d)采用簇1至21的5个等价和代表性基因,得到:
·AUC:0.80
·灵敏度(良性脂肪变性的鉴定):0.38
·特异性:0.93
·PPV:0.69
·NPV:0.78
·错误率:0.24
e)根据所使用的算法类型,有必要从检验所提供的连续分数变量中确定用于确定二元检验结果的阈值。确定这个阈值是为了符合性能要求。例如,对于建立高度特异或者敏感的检验是重要的。曲线下面积(AUC)是指覆盖所有阈值的可能值的分类器(classifier)/检验性能的量度。AUC越高,检验性能就越好。
针对阈值的不同值,采用簇1至21所有代表性基因的检验性能:
实施例2:NASH+纤维化的诊断
如下定义和计算了真和假阳性结果、NPV、PPV、特异性和灵敏度:
·PPV(阳性预测值)=TP/(TP+FP)
·NPV(阴性预测值)=TN/(TN+FN)
·特异性=TN/(TN+FP)
·灵敏度=TP/(TP+FN)
·ER=错误率
a)2、3、4、5、6、7、8和9的组合(k)用于诊断NASH和伴有纤维化的NASH(仅考虑每个簇的代表性基因)
b)2、3、4、5、6、7、8和9个基因的组合(k)用于诊断NASH和伴有纤维化的NASH(考虑表1中公开的每个簇的5个等价基因)
c)采用簇1至10的所有代表性基因,得到:
·AUC:0.66
·灵敏度(NASH+纤维化的鉴定):0.61
·特异性:0.82
·PPV:0.77
·NPV:0.68
·错误率:0.28
d)采用簇1至10的5个等价和代表性基因,得到:
·AUC:0.67
·灵敏度(NASH+纤维化的鉴定):0.52
·特异性:0.82
·PPV:0.74
·NPV:0.64
·错误率:0.33
e)针对阈值的不同值,采用簇1至10所有代表性基因的检验性能:
实施例3:使用两种方法验证结果(阈值/全局)
3.1.材料和方法
先前已经公开了“全局法”(使用非参数检验的分布比较-通常显著性的截断值为0.05)。
“阈值法”
已经报道过肠道微生物群的几个主要编排(arrangement)。M,Raes J,PelletierE等人在他们Nature,2011的文章中报道有三种这样的编排。它们反映了能够执行其生存和宿主关键功能(例如能源收获和代谢物的处理)的细菌的不同组合。例如,已知这些编排中的一种,肠道1型(enterotype 1),主要通过发酵从碳水化合物和蛋白质获得能量。这些肠道型描绘了(shape)寄宿在肠道中的微生物,以及因此不同物种的存在/不存在/丰度。针对表型所感兴趣的标记物可取决于微生物群的这种编排。
为了鉴定这些标记物,我们寻找仅仅在部分样本中所看出的趋势,而不是如通常所进行的在所有的样本中的趋势。我们使用二项式分布以便估计通过基因相对丰度所限定的亚组中的样本是否针对一种表型而得以富集。卡方检验用于另一富集评估。
统计
统计学家常用卡方检验研究两类变量之间的关联。一旦否认不存在独立性的检验,能够使用各种方法估计两个变量之间的关联强度,如此处所报告的Tschuprow’s T。如果Tschuprow’s T为0,则变量之间没有关联,而如果为1,则该关联是完美的。
NASH1组的患者(“NASH1患者”)
2011年11月至2012年1月已进行了单中心横断面研究来确定96个成人受试者的粪便样本中的宏基因型(metagenotype),所述受试者在入选前具有肝脏活检。排除标准是:之前6周内的抗生素治疗、在过去的两周中经常摄入益生菌、之前6个月内的大肠镜检查、之前的肠道(肥胖症治疗性的)手术、饮酒>20g/d(w)/30g/d(m)、肝脏疾病的明确病因(病毒性、自身免疫性、遗传性、毒性、药物诱导的)。每个受试者收到试剂盒(FecotainerTM+AnaeroGenTM)在家里收集自己的粪便以及的参加费。粪便保持在4℃,并在36小时内运输。
NASH2组的患者(“NASH2患者”)
采用和NASH1患者相同的入选标准召集NASH2患者。召集延伸到几个新的中心(亚眠、昂热、伯尔尼、波尔多、尼斯和巴黎的其它中心)来补充来自原中心的召集。根据实际的原因,收集方法略加修改:仅收集一份粪便样本,以及运输时在环境温度中保存在固定溶液中。
患有克罗恩病的患者(“克罗恩病患者”)
在巴黎的圣路易斯和圣安东尼医院召集19位患者。每个患者收集几份样本,共收集118个样本。
克罗恩病随时间的演变且患者状态在每个采样点会发生变化。用于描述每个样本疾病状态的所选标准与随着时间的稳定性相关。
采样的时刻,患者被认为是稳定的,如果:
·患者估计其处于良好的健康状况(Harvey Bradshaw指数严格低于4),
·患者具有低的钙卫蛋白(严格低于150),
·患者没有被要求强化治疗:
○引入抗TNF治疗,
○引入免疫抑制剂或者增加免疫抑制剂的剂量,
○引入抗生素,或
○引入可的松,和
·患者未服用任何抗生素。
如果患者至少在以后两个采样时间是稳定的,则患者随时间是“稳定的”。使用这种方法将样本分为两组:一组样本收集自随时间稳定的患者,一组样本收集自其状态发生演变的患者。
3.2.结果
3.2.1.对于NASH1、NASH2和克罗恩病患者,高度感兴趣的是mgs 10764_1_2(SEQID NO:1-5和簇1)
全局法:
全局法的结果公开于图1A、1B和1C上(括号之间表示可获得其信息的患者的数目)。
全局统计(中位数/分布的比较-通常显著性截断值设定为0.05):
-Wilcoxon检验:
○NASH1:0.00056
○NASH2:0.015
○克罗恩病:0.034
-Kolmogorov-Smirnov检验:
○NASH1:0.011
○NASH2:0.013
○克罗恩病:0.05
阈值法:
使用自动程序来确定区分低和高丰度的阈值,已获得图1D)、E)和F)(括号之间表示可获得其信息的患者的数目)。
N.B.-相对丰度是log10转化的
-“-10”是未检测到mgs时引入的人工值
下表显示NASH状态相对于低/高mgs相对丰度:
10764_1_2低/高相对于NASH状态(NASH1)
单纯性脂肪变性 NASH
26 39
3 28
10764_1_2低/高相对于NASH状态(NASH2)
单纯性脂肪变性 NASH
25 47
9 64
10764_1_2低/高相对于稳定性(克罗恩病)
稳定 不稳定
15 41
5 57
卡方检验的结果(具有低mgs丰度的表型和具有高mgs丰度的表型的比较-值越低,两个分区之间的差异越大,富集越强-通常显著性截断值设为0.05):
-NASH1:0.0053(系数Tschuprow:0.28)
-NASH2:0.0028(系数Tschuprow:0.25)
-克罗恩病:0.014(系数Tschuprow:0.23)
N.B.通常的度量(metrics)(错误率、特异性、灵敏度)此处不适用,因为标准只适用于一种表型状态,即预测一部分群体的NASH/不稳定性。可以计算阳性预测值或者阴性预测值(但高度依赖于之前的患病状态)。
与其它变量关联:
-基因丰富性(定义为以11M的读取深度测序时,检测到的平均基因数目)
○Wilcoxon检验NASH1(96个样本):1.37e-5
○Wilcoxon检验NASH2(137个样本):4.4e-6
○Wilcoxon检验克罗恩病(83个样本):5.3e-7
-糖尿病(确诊的或者空腹血糖>6.1mmol/L)
○卡方检验NASH1(96个样本):0.0013(系数Tschuprow:0.33)
○卡方检验NASH2(145个样本):0.0061(系数Tschuprow:0.23)
-二甲双胍
二甲双胍是已知改变肠道微生物群的抗糖尿病治疗
卡方检验NASH2(145个样本):0.00026(系数Tschuprow:0.30)
N.B.现在,我不知道该如何处理这些相互关联的因素
-腰围/身高比
○Wilcoxon检验NASH1(94个样本):0.0069
○Wilcoxon检验NASH2(137个样本):0.085
结论:
在其中mgs 10764_1_2不丰富的样本往往趋向于不太健康,也就是说在NASH群体(NASH1,NASH2)中患者更容易患有疾病的晚期状态,即NASH而不是单纯性脂肪变性,以及在克罗恩病中,患者更容易不稳定。
3.2.2.对于NASH1、NASH2和克罗恩病患者,高度感兴趣的是mgs 9828_3_1(SEQ IDNO:151-155-簇31)
全局法:
全局法的结果公开于图2A、2B和2C上(括号之间表示可获得其信息的患者的数目)。
全局统计(中位数/分布的比较-通常显著性截断值设为0.05):
-Wilcoxon检验:
○NASH1:0.014
○NASH2:0.064
○克罗恩病:0.052
-Kolmogorov-Smirnov检验:
○NASH1:0.032
○NASH2:0.023
○克罗恩病:0.14
阈值法:
使用自动程序来确定区分低和高丰度的阈值,已获得图2D)、2E)和2F)(括号之间表示可获得其信息的患者的数目)。
N.B.
-相对丰度是log10转化的
-“-10”是未检测到mgs时引入的人工值
下表显示NASH状态相对于低/高mgs相对丰度:
9828_3_1低/高相对于NASH状态(NASH1)
单纯性脂肪变性 NASH
24 34
5 33
9828_3_1低/高相对于NASH状态(NASH2)
单纯性脂肪变性 NASH
26 64
8 47
9828_3_1低/高相对于稳定性(克罗恩病)
稳定 不稳定
17 56
3 42
卡方检验的结果(具有低mgs丰度的表型和具有高mgs丰度的表型的比较-值越低,富集越强-通常显著性截断值设为0.05):
-NASH1:0.0066(系数Tschuprow:0.28)
-NASH2:0.076
-克罗恩病:0.037(系数Tschuprow:0.19)
N.B.通常的度量(错误率、特异性、灵敏度)此处不适用,因为标准只适用于一种表型状态,即预测一部分群体的NASH/不稳定性。可以计算阳性预测值、alt.阴性预测值(但高度依赖于之前的患病状态)。
与其它变量关联:
-基因丰富性(定义为以11M的读取深度测序时,检测到的平均基因数目)
○Wilcoxon检验NASH1(96个样本):0.0004
○Wilcoxon检验NASH2(137个样本):2.3e-6
○Wilcoxon检验克罗恩病(83个样本):1.3e-7
-糖尿病(确诊的或者空腹血糖>6.1mmol/L)
○卡方检验NASH1(96个样本):0.48
○卡方检验NASH2(145个样本):0.0086(系数Tschuprow:0.22)
-二甲双胍
二甲双胍是已知改变肠道微生物群的抗糖尿病治疗
○卡方检验NASH2(145个样本):0.0026(系数Tschuprow:0.25)
-腰围/身高比
○卡方检验NASH1(94个样本):0.26
○卡方检验NASH2(137个样本):0.042(系数Tschuprow:0.17)
-HOMA(<=3.5)
○卡方检验NASH1(80个样本):0.048(系数Tschuprow:0.21)
○卡方检验NASH2(137个样本):0.019(系数Tschuprow:0.20)
-高甘油三酯血症(<=1.7mmol/L或者特殊治疗)
○卡方检验NASH1(96个样本):0.11
○卡方检验NASH2(145个样本):0.044
结论:
在其中mgs 9828_3_1不丰富的样本往往不太健康,也就是说在NASH群体(NASH1,NASH2)中患者更容易患有疾病的晚期状态,即NASH而不是单纯性脂肪变性,以及在克罗恩病中,患者更容易不稳定。
3.2.3.对于NASH1、NASH2和克罗恩病患者,高度感兴趣的是mgs 6069_2_2(SEQ IDNO:91-95-簇19)
全局法
全局法的结果公开于图3A、3B和3C上(括号之间表示可获得其信息的患者的数目)。
全局统计(中位数/分布的比较-通常显著性截断值设为0.05):
-Wilcoxon检验:
○NASH1:0.048
○NASH2:0.082
○克罗恩病:0.070
-Kolmogorov-Smirnov检验:
○NASH1:0.020
○NASH2:0.056
○克罗恩病:0.49
阈值法:
使用自动程序来确定区分低和高丰度的阈值,已获得图3D、E和F(括号之间表示可获得其信息的患者的数目)。
N.B.
-相对丰度是log10转化的
-“-10”是未检测到mgs时引入的人工值
下表显示NASH状态相对于低/高mgs相对丰度:
9828_3_1低/高相对于NASH状态(NASH1)
单纯性脂肪变性 NASH
11 48
18 19
9828_3_1低/高相对于NASH状态(NASH2)
单纯性脂肪变性 NASH
12 65
22 46
9828_3_1低/高相对于稳定性(克罗恩病)
稳定 不稳定
0 20
20 78
卡方检验的结果(具有低mgs丰度的表型和具有高mgs丰度的表型的比较-值越低,富集越强-通常显著性截断值设为0.05):
-NASH1:0.0039(系数Tschuprow:0.29)
-NASH2:0.029(系数Tschuprow:0.18)
-克罗恩病:0.059
N.B.通常的度量(错误率、特异性、灵敏度)此处不适用,因为标准只适用于一种表型状态,即预测一部分群体的NASH/不稳定性。可以计算阳性预测值、alt.阴性预测值(但高度依赖于之前的患病状态)。
与其它变量关联:
-糖尿病(确诊的或者空腹血糖>6.1mmol/L)
○卡方检验NASH1(96个样本):0.015(系数Tschuprow:0.25)
○卡方检验NASH2(145个样本):0.00073(系数Tschuprow:0.28)
-二甲双胍
二甲双胍是已知改变肠道微生物群的抗糖尿病治疗
○卡方检验NASH2(145个样本):0.00040(系数Tschuprow:0.29)
-HOMA(<=3.5)
○卡方检验NASH1(80个样本):0.026(系数Tschuprow:0.23)
○卡方检验NASH2(137个样本):0.33
-高甘油三酯血症(<=1.7mmol/L或者特殊治疗)
○卡方检验NASH1(96个样本):0.66
○卡方检验NASH2(145个样本):0.0019(系数Tschuprow:0.19)
结论:
在其中mgs 6069_2_2丰富的样本往往不太健康,也就是说在NASH群体(NASH1,NASH2)中患者更容易患有疾病的晚期状态,即NASH而不是单纯性脂肪变性,以及在克罗恩病中,患者更容易不稳定。
3.2.4.高度感兴趣的三个mgs提供不同的信息
为了比较感兴趣的三个mgs,我们尝试两种方法:
1.检查低和高相对丰度之间的差异
(对于两个mgs如果在高/低相对丰度之间没有联系,即如果每个mgs提供的信息是互补的而不是冗余的,则chisq检验应是显著的),
2.关于感兴趣的表型,检查低和高相对丰度之间的差异(NASH群体中的NASH或者克罗恩病群体中的稳定性)
采用低/高相对丰度阈值:
-NASH1
○比较10764_1_2(行)/9828_3_1(列)
卡方p-值=0.0061
48 22
12 20
○比较9828_3_1(行)/6069_2_2(列)
卡方p-值=029
34 26
29 13
○比较10764_1_2(行)/6069_2_2(列)
卡方p-值=0.45
41 29
22 10
-NASH2
○比较10764_1_2(行)/9828_3_1(列)
卡方p-值=8.26e-8
64 12
31 45
○比较9828_3_1(行)/6069_2_2(列)
卡方p-值=040
47 48
33 24
○比较10764_1_2(行)/6069_2_2(列)
卡方p-值=00058
31 45
49 27
-克罗恩病
○比较10764_1_2(行)/9828_3_1(列)
卡方p-值=0.00020
46 11
28 33
○比较9828_3_1(行)/6069_2_2(列)
卡方p-值=1
13 61
8 36
○比较10764_1_2(行)/6069_2_2(列)
卡方p-值=0.025
5 52
16 45
采用低/高相对丰度阈值+感兴趣的表型:
-10764_1_2x 9828_3_1
○NASH1(单纯性脂肪变性的数目/NASH的数目)
10764_1_2低 10764_1_2高
9828_3高 2/10 22/25
9828_3低 1/17 4/15
○NASH2(单纯性脂肪变性的数目/NASH的数目)
10764_1_2低 10764_1_2高
9828_3高 5/24 21/40
9828_3低 6/39 2/8
○克罗恩病(稳定的数目/不稳定的数目)
10764_1_2低 10764_1_2高
9828_3高 5/22 12/34
9828_3低 0/34 3/8
在图5A至5C中再现这些结果(圈代表单纯性脂肪变性或者克罗恩病稳定状态,而十字代表NASH或者克罗恩病不稳定状态)。
-10764_21_2x 6069_2_2
○NASH1(单纯性脂肪变性的数目/NASH的数目)
10764_1_2低 10764_1_2高
6069_2_2高 1/22 10/26
6069_2_2低 2/6 16/13
○NASH2(单纯性脂肪变性的数目/NASH的数目)
10764_1_2低 10764_1_2高
6069_2_2高 4/42 8/22
6069_2_2低 6/20 16/27
○克罗恩病(稳定的数目/不稳定的数目)
10764_1_2低 10764_1_2高
6069_2_2高 0/16 0/4
6069_2_2低 7/41 13/37
在图6A至6C中再现这些结果(圈代表单纯性脂肪变性或者克罗恩病稳定状态,而十字代表NASH或者克罗恩病不稳定状态)。
-9828_3x 6069_2_2
○NASH1(单纯性脂肪变性的数目/NASH的数目)
9828_3低 9828_3高
6069_2_2高 2/24 9/24
6069_2_2低 3/8 15/11
○NASH2(单纯性脂肪变性的数目/NASH的数目)
9828_3低 9828_3高
6069_2_2高 4/28 8/26
6069_2_2低 4/18 18/29
○克罗恩病(稳定的数目/不稳定的数目)
9828_3低 9828_3高
6069_2_2高 0/7 1/12
6069_2_2低 3/34 16/45
在图7A至7C中再现这些结果(圈代表单纯性脂肪变性或者克罗恩病稳定状态,而十字代表NASH或者克罗恩病不稳定状态)。
3.2.5.高度感兴趣的三个mgs各自独立的预测疾病
针对每个感兴趣的mgs确定阈值,从而患者样本可以被分成含有低(或者高)mgs相对丰度样本的感兴趣的子集,以及含有其它样本(使用二项式分布来评估不同阈值时的富集概率)的另一个子集。
结果提供在下表2中:
阳性和阴性预测值(PPV和NPV)估计检验为阳性时产生的良好预测数目。在这种情况下,当mgs的相对丰度是高于(或低于)预定阈值时,PPV或者NPV估计良好预测数目的比率。PPV或者NPV越高,所选样本的子集越大,预测因子越有用。
有趣的是,在具有一种表型(对于NASH群体:良性或者NASH,对于克罗恩病:稳定或者不稳定)的患者中富集感兴趣的子集,在这种情况下mgs的相对丰度能够用于鉴定具有特定表型的患者(注意,其它患者样本可能与任何状态没有关联)。
3.2.6.中度感兴趣的mgs 6063_6_3(SEQ ID NO:51-55+簇11)(NASH1+NASH2)
对于这种mgs的全局法结果公开于图4和4B上(括号之间表示可获得其信息的患者的数目)。
全局趋势
全局统计(中位数/分布的比较-通常显著性截断值设为0.05):
-Wilcoxon检验:
○NASH1:0.02
○NASH2:0.21
○克罗恩病:0.83
-Kolmogorov-Smirnov检验:
○NASH1:0.048
○NASH2:0.23
○克罗恩病:0.97
阈值法:
使用自动程序来确定区分低和高丰度的阈值,已获得图4C和D(括号之间表示可获得其信息的患者的数目)。
N.B.
-相对丰度是log10转化的
-“-10”是未检测到mgs时引入的人工值
下表显示NASH状态相对于低/高mgs相对丰度:
6063_6低/高相对于NASH状态(NASH1)
单纯性脂肪变性 NASH
21 30
8 37
6063_6低/高相对于NASH状态(NASH2)
单纯性脂肪变性 NASH
33 85
1 26
卡方检验的结果(具有低mgs丰度的表型和具有高mgs丰度的表型的比较-值越低,两个分区之间的差异越大,富集越强-通常显著性截断值设为0.05):
-NASH1:0.023(系数Tschuprow:0.23)
-NASH2:0.015(系数Tschuprow:0.20)
N.B.通常的度量(错误率、特异性、灵敏度)此处不适用,因为标准只适用于一种表型状态,即预测一部分群体的NASH/不稳定性。可以计算阳性预测值、或者阴性预测值(但高度依赖于之前的患病状态)。
与其它变量关联:
-基因丰富性(定义为以11M的读取深度测序时,检测到的平均基因数目)
○Wilcoxon检验NASH1(96个样本):1.37e-5
○Wilcoxon检验NASH2(137个样本):4.4e-6
○Wilcoxon检验克罗恩病(83个样本):5.3e-7
-腰围/身高比
○Wilcoxon检验NASH1(94个样本):0.0069
○Wilcoxon检验NASH2(137个样本):0.085
结论
在其中mgs 6063_6不丰富的样本往往不太健康,也就是说在NASH群体(NASH1,NASH2)中患者更容易患有疾病的晚期状态,即NASH而不是单纯性脂肪变性。
实施例4:对于克罗恩病高度感兴趣的组合
对克罗恩病群体的20个稳定和98个不稳定患者进行了研究。
按照上述公开的计算该值,考虑每个簇的所有等价基因。
下表中涉及的mgs数目与对应表1中公开的簇相关。
这些结果表明,对于克罗恩病而言下列组合是高度感兴趣的:
-簇3+簇17+簇11+簇10+簇18
-簇17+簇11+簇15+簇2+簇7+簇18
-簇3+簇17+簇11+簇15+簇13+簇18
-簇3+簇17+簇16+簇11+簇14+簇18+簇12
评论
这些实施例说明了在检验实施/算法的实施例中所鉴定的基因簇的区分潜力。通过随机抽样程序生成组合,并且仅报道AUC超过0.7的结果。
少至两个基因簇的简单组合提供了显著预测能力(AUC>0.7)。组合的簇越多,检验性能越好。可使用其它更复杂的算法改善检验性能。
使用所鉴定的基因簇,通过调整所组合的基因簇数目和所用阈值,可以调节检验使其具有各种水平的复杂性和各种性能结果,例如对于具有任何表型的患者而言(良性脂肪变性或者NASH或者NASH+纤维化)具有高检测能力的检验,或者具有良好且平衡性能的平衡检验。
为了基于所鉴定的基因簇的发展检验,考虑了两个选项:在其中只使用簇的代表性基因的一个选项,在其中使用簇的5个最相关基因的算术平均值的另一个选项。这两种方法产生具有类似性能的检验,其使得能够进行检验的各种实际实施。如果用高度精确的检测方法评价基因丰度,那么每个簇一个基因就足够了。相反,如果检测方法缺乏精确性,可用各簇的基因组合来评价簇的丰度并补偿检测方法的低精确性。

Claims (32)

1.一种用于在受试者粪便样本中体外诊断和/或预后炎性疾病的试剂盒,所述炎性疾病选自良性脂肪变性、非酒精性脂肪性肝炎、NASH肝脏纤维化和克罗恩病,所述试剂盒包含用于确定至少两个细菌基因的表达水平或丰度的核酸引物或探针,所述细菌基因选自:SEQID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQID NO:91、SEQ ID NO:96、SEQ ID NO:101和至少一个其共变基因,其中SEQ ID NO:1的共变基因选自SEQ ID NO:2至5,SEQ ID NO:6的共变基因选自SEQ ID NO:7至10,SEQ ID NO:11的共变基因选自SEQ ID NO:12至15,SEQ ID NO:16的共变基因选自SEQ ID NO:17至20,SEQID NO:21的共变基因选自SEQ ID NO:22至25,SEQ ID NO:26的共变基因选自SEQ ID NO:27至30,SEQ ID NO:31的共变基因选自SEQ ID NO:32至35,SEQ ID NO:36的共变基因选自SEQID NO:37至40,SEQ ID NO:41的共变基因选自SEQ ID NO:42至45,SEQ ID NO:46的共变基因选自SEQ ID NO:47至50,SEQ ID NO:51的共变基因选自SEQ ID NO:52至55,SEQ ID NO:56的共变基因选自SEQ ID NO:57至60,SEQ ID NO:61的共变基因选自SEQ ID NO:62至65,SEQ ID NO:66的共变基因选自SEQ ID NO:67至70,SEQ ID NO:71的共变基因选自SEQ IDNO:72至75,SEQ ID NO:76的共变基因选自SEQ ID NO:77至80,SEQ ID NO:81的共变基因选自SEQ ID NO:82至85,SEQ ID NO:86的共变基因选自SEQ ID NO:87至90,SEQ ID NO:91的共变基因选自SEQ ID NO:92至95,SEQ ID NO:96的共变基因选自SEQ ID NO:97至100,SEQID NO:101的共变基因选自SEQ ID NO:102至105。
2.根据权利要求1所述的试剂盒,其中所述试剂盒由确定至少两个选自权利要求1所定义的所述细菌基因的表达水平或丰度的核酸引物或探针组成。
3.一种用于在受试者粪便样本中体外诊断和/或预后炎性疾病的核酸微阵列,所述炎性疾病选自良性脂肪变性、非酒精性脂肪性肝炎、NASH肝脏纤维化和克罗恩病,所述核酸微阵列包含特异于至少两个细菌基因的核酸,所述细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ IDNO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ ID NO:86、SEQ ID NO:91、SEQ IDNO:96、SEQ ID NO:101、SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQ ID NO:146、SEQ IDNO:151和其属于相同细菌簇的共变基因,其中SEQ ID NO:1的共变基因选自SEQ ID NO:2至5,SEQ ID NO:6的共变基因选自SEQ ID NO:7至10,SEQ ID NO:11的共变基因选自SEQ IDNO:12至15,SEQ ID NO:16的共变基因选自SEQ ID NO:17至20,SEQ ID NO:21的共变基因选自SEQ ID NO:22至25,SEQ ID NO:26的共变基因选自SEQ ID NO:27至30,SEQ ID NO:31的共变基因选自SEQ ID NO:32至35,SEQ ID NO:36的共变基因选自SEQ ID NO:37至40,SEQID NO:41的共变基因选自SEQ ID NO:42至45,SEQ ID NO:46的共变基因选自SEQ ID NO:47至50,SEQ ID NO:51的共变基因选自SEQ ID NO:52至55,SEQ ID NO:56的共变基因选自SEQID NO:57至60,SEQ ID NO:61的共变基因选自SEQ ID NO:62至65,SEQ ID NO:66的共变基因选自SEQ ID NO:67至70,SEQ ID NO:71的共变基因选自SEQ ID NO:72至75,SEQ ID NO:76的共变基因选自SEQ ID NO:77至80,SEQ ID NO:81的共变基因选自SEQ ID NO:82至85,SEQ ID NO:86的共变基因选自SEQ ID NO:87至90,SEQ ID NO:91的共变基因选自SEQ IDNO:92至95,SEQ ID NO:96的共变基因选自SEQ ID NO:97至100,SEQ ID NO:101的共变基因选自SEQ ID NO:102至105,SEQ ID NO:106的共变基因选自SEQ ID NO:107至110,SEQ IDNO:111的共变基因选自SEQ ID NO:112至115,SEQ ID NO:116的共变基因选自SEQ ID NO:117至120,SEQ ID NO:121的共变基因选自SEQ ID NO:122至125,SEQ ID NO:126的共变基因选自SEQ ID NO:127至130,SEQ ID NO:131的共变基因选自SEQ ID NO:132至135,SEQ IDNO:136的共变基因选自SEQ ID NO:137至140,SEQ ID NO:141的共变基因选自SEQ ID NO:142至145,SEQ ID NO:146的共变基因选自SEQ ID NO:147至150,SEQ ID NO:151的共变基因选自SEQ ID NO:152至155。
4.根据权利要求3所述的核酸微阵列,其由特异于至少两个选自权利要求3所定义的细菌基因的核酸组成。
5.用于测量至少两个细菌基因的表达水平或丰度的核酸引物或探针在制备用于在受试者粪便样本中诊断和/或预后炎性疾病的试剂盒中的用途,其中所述炎性疾病选自良性脂肪变性、非酒精性脂肪性肝炎、NASH肝脏纤维化和克罗恩病,和其中所述细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ ID NO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ IDNO:86、SEQ ID NO:91、SEQ ID NO:96、SEQ ID NO:101和至少一个其共变基因,其中SEQ IDNO:1的共变基因选自SEQ ID NO:2至5,SEQ ID NO:6的共变基因选自SEQ ID NO:7至10,SEQID NO:11的共变基因选自SEQ ID NO:12至15,SEQ ID NO:16的共变基因选自SEQ ID NO:17至20,SEQ ID NO:21的共变基因选自SEQ ID NO:22至25,SEQ ID NO:26的共变基因选自SEQID NO:27至30,SEQ ID NO:31的共变基因选自SEQ ID NO:32至35,SEQ ID NO:36的共变基因选自SEQ ID NO:37至40,SEQ ID NO:41的共变基因选自SEQ ID NO:42至45,SEQ ID NO:46的共变基因选自SEQ ID NO:47至50,SEQ ID NO:51的共变基因选自SEQ ID NO:52至55,SEQ ID NO:56的共变基因选自SEQ ID NO:57至60,SEQ ID NO:61的共变基因选自SEQ IDNO:62至65,SEQ ID NO:66的共变基因选自SEQ ID NO:67至70,SEQ ID NO:71的共变基因选自SEQ ID NO:72至75,SEQ ID NO:76的共变基因选自SEQ ID NO:77至80,SEQ ID NO:81的共变基因选自SEQ ID NO:82至85,SEQ ID NO:86的共变基因选自SEQ ID NO:87至90,SEQID NO:91的共变基因选自SEQ ID NO:92至95,SEQ ID NO:96的共变基因选自SEQ ID NO:97至100,SEQ ID NO:101的共变基因选自SEQ ID NO:102至105。
6.根据权利要求5所述的用途,其中诊断和/或预后所述炎性疾病包括如下步骤:
a)从所述受试者的粪便样本中确定至少两个选自权利要求5所定义的细菌基因的表达水平或丰度,
b)将获得的细菌基因的表达水平或丰度与至少一个参考表达水平或丰度进行比较,其中所述参考表达水平或丰度是在参考样本上已被确定的相同细菌基因的表达水平或丰度,
c)通过所述比较,确定所述受试者的表型。
7.用于测量至少两个选自以下步骤a)所示的细菌基因和至少两个选自以下步骤d)所示的细菌基因的表达水平或丰度的核酸引物或探针在制备用于在被诊断为患有非酒精性脂肪性肝炎的受试者粪便样本中诊断或预后纤维化的试剂盒中的用途,所述诊断或预后包括以下步骤:
a)从所述受试者的粪便样本中确定至少两个细菌基因的表达水平或丰度,所述细菌基因选自:SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ ID NO:16、SEQ ID NO:21、SEQ IDNO:26、SEQ ID NO:31、SEQ ID NO:36、SEQ ID NO:41、SEQ ID NO:46、SEQ ID NO:51、SEQ IDNO:56、SEQ ID NO:61、SEQ ID NO:66、SEQ ID NO:71、SEQ ID NO:76、SEQ ID NO:81、SEQ IDNO:86、SEQ ID NO:91、SEQ ID NO:96、SEQ ID NO:101和至少一个其共变基因,其中SEQ IDNO:1的共变基因选自SEQ ID NO:2至5,SEQ ID NO:6的共变基因选自SEQ ID NO:7至10,SEQID NO:11的共变基因选自SEQ ID NO:12至15,SEQ ID NO:16的共变基因选自SEQ ID NO:17至20,SEQ ID NO:21的共变基因选自SEQ ID NO:22至25,SEQ ID NO:26的共变基因选自SEQID NO:27至30,SEQ ID NO:31的共变基因选自SEQ ID NO:32至35,SEQ ID NO:36的共变基因选自SEQ ID NO:37至40,SEQ ID NO:41的共变基因选自SEQ ID NO:42至45,SEQ ID NO:46的共变基因选自SEQ ID NO:47至50,SEQ ID NO:51的共变基因选自SEQ ID NO:52至55,SEQ ID NO:56的共变基因选自SEQ ID NO:57至60,SEQ ID NO:61的共变基因选自SEQ IDNO:62至65,SEQ ID NO:66的共变基因选自SEQ ID NO:67至70,SEQ ID NO:71的共变基因选自SEQ ID NO:72至75,SEQ ID NO:76的共变基因选自SEQ ID NO:77至80,SEQ ID NO:81的共变基因选自SEQ ID NO:82至85,SEQ ID NO:86的共变基因选自SEQ ID NO:87至90,SEQID NO:91的共变基因选自SEQ ID NO:92至95,SEQ ID NO:96的共变基因选自SEQ ID NO:97至100,SEQ ID NO:101的共变基因选自SEQ ID NO:102至105,
b)将获得的细菌基因的表达水平或丰度与至少一个参考表达水平或丰度进行比较,其中所述参考表达水平或丰度是在参考样本上已被确定的相同细菌基因的表达水平或丰度,
c)通过所述比较,诊断所述受试者是否患有良性脂肪变性或非酒精性脂肪性肝炎,
d)如果所述受试者被诊断患有NASH,从所述受试者的粪便样本中确定含至少两个细菌基因的表达水平或丰度,所述细菌基因选自:SEQ ID NO:106、SEQ ID NO:111、SEQ ID NO:116、SEQ ID NO:121、SEQ ID NO:126、SEQ ID NO:131、SEQ ID NO:136、SEQ ID NO:141、SEQID NO:146、SEQ ID NO:151和至少一个其共变基因,其中SEQ ID NO:106的共变基因选自SEQ ID NO:107至110,SEQ ID NO:111的共变基因选自SEQ ID NO:112至115,SEQ ID NO:116的共变基因选自SEQ ID NO:117至120,SEQ ID NO:121的共变基因选自SEQ ID NO:122至125,SEQ ID NO:126的共变基因选自SEQ ID NO:127至130,SEQ ID NO:131的共变基因选自SEQ ID NO:132至135,SEQ ID NO:136的共变基因选自SEQ ID NO:137至140,SEQ ID NO:141的共变基因选自SEQ ID NO:142至145,SEQ ID NO:146的共变基因选自SEQ ID NO:147至150,SEQ ID NO:151的共变基因选自SEQ ID NO:152至155,
e)将步骤d)获得的细菌基因的表达水平或丰度与至少一个参考表达水平或丰度进行比较,其中所述参考表达水平或丰度是在参考样本上已被确定的相同细菌基因的基因表达水平或丰度,
f)通过所述比较,确定所述受试者是否患有伴有纤维化的非酒精性脂肪性肝炎。
8.根据权利要求5至7任一项所述的用途,其中试剂盒用于给患有所述炎性疾病的受试者设计治疗。
9.根据权利要求5至7任一项所述的用途,其中试剂盒用于预测所述炎性疾病的结果。
10.根据权利要求5至7任一项所述的用途,其中所述受试者是人类患者。
11.根据权利要求5至7任一项所述的用途,其中通过测量所述样本中所述至少两个细菌基因的相对丰度确定所述细菌基因的丰度。
12.根据权利要求5至7任一项所述的用途,其中通过采用基于多核苷酸杂交、多核苷酸测序和/或蛋白质组学的基因丰度谱的方法确定所述细菌基因的表达水平或丰度。
13.用于测量SEQ ID NO:1的细菌基因或至少一个其共变基因的表达水平或丰度的核酸引物或探针在制备用于在受试者粪便样本中诊断和/或预后炎性疾病的试剂盒的用途,所述炎性疾病选自良性脂肪变性、非酒精性脂肪性肝炎和克罗恩病,其中SEQ ID NO:1的共变基因选自SEQ ID NO:2至5。
14.根据权利要求13所述的用途,其中所述试剂盒由测量SEQ ID NO:1的细菌基因或至少一个所述共变基因的表达水平或丰度的核酸引物或探针组成。
15.根据权利要求13所述的用途,其中诊断和/或预后所述受试者中所述炎性疾病包括如下步骤:
a)从所述受试者的粪便样本中确定SEQ ID NO:1的细菌基因或者至少一个所述共变基因的表达水平或丰度,
b)将获得的表达水平或丰度与至少一个参考表达水平或丰度进行比较,其中所述参考表达水平或丰度是在参考样本上已被确定的相同细菌基因的表达水平或丰度,
c)通过所述比较,确定所述受试者的表型。
16.根据权利要求15所述的用途,其中步骤a)由确定SEQ ID NO:1至SEQ ID NO:5的细菌基因的表达水平或丰度组成。
17.用于测量SEQ ID NO:91的细菌基因或者至少一个其共变基因的表达水平或丰度的核酸引物或探针在制备用于在受试者粪便样本中诊断和/或预后炎性疾病的试剂盒的用途,所述炎性疾病选自良性脂肪变性、非酒精性脂肪性肝炎和克罗恩病,其中SEQ ID NO:91的共变基因选自SEQ ID NO:92至95。
18.根据权利要求17所述的用途,其中所述试剂盒由测量SEQ ID NO:91的细菌基因或至少一个所述共变基因的表达水平或丰度的核酸引物或探针组成。
19.根据权利要求17所述的用途,其中诊断和/或预后所述受试者中所述炎性疾病包括如下步骤:
a)从所述受试者的粪便样本中确定SEQ ID NO:91的细菌基因或至少一个所述共变基因的表达水平或丰度,
b)将获得的表达水平或丰度与至少一个参考表达水平或丰度进行比较,其中所述参考表达水平或丰度是在参考样本上已被确定的相同细菌基因的表达水平或丰度,
c)通过所述比较,确定所述受试者的表型。
20.根据权利要求19所述的用途,其中步骤a)由确定SEQ ID NO:91至SEQ ID NO:95的细菌基因的表达水平或丰度组成。
21.用于测量SEQ ID NO:151的细菌基因或至少一个其共变基因的表达水平或丰度的核酸引物或探针在制备用于在受试者粪便样本中诊断和/或预后克罗恩病的试剂盒中的用途,其中SEQ ID NO:151的共变基因选自SEQ ID NO:152至155。
22.根据权利要求21所述的用途,其中所述试剂盒由测量SEQ ID NO:151的细菌基因或至少一个所述共变基因的表达水平或丰度的核酸引物或探针组成。
23.根据权利要求21所述的用途,其中诊断和/或预后所述受试者中所述克罗恩病包括如下步骤:
a)从所述受试者的粪便样本中确定SEQ ID NO:151的细菌基因或至少一个所述共变基因的表达水平或丰度,
b)将获得的表达水平或丰度与至少一个参考表达水平或丰度进行比较,其中所述参考表达水平或丰度是在参考样本上已被确定的相同细菌基因的表达水平或丰度,
c)通过所述比较,确定所述受试者的表型。
24.根据权利要求23所述的用途,其中步骤a)由确定SEQ ID NO:151至SEQ ID NO:155的细菌基因的表达水平或丰度组成。
25.用于测量SEQ ID NO:51的细菌基因或至少一个其共变基因的表达水平或丰度的核酸引物或探针在制备用于在受试者粪便样本中诊断和/或预后炎性疾病的试剂盒中的用途,所述炎性疾病选自良性脂肪变性和非酒精性脂肪性肝炎,其中SEQ ID NO:51的共变基因选自SEQ ID NO:52至55。
26.根据权利要求25所述的用途,其中所述试剂盒由测量SEQ ID NO:51的细菌基因或至少一个所述共变基因的表达水平或丰度的核酸引物或探针组成。
27.根据权利要求25所述的用途,其中诊断和/或预后受试者中炎性疾病包括如下步骤:
a)从所述受试者的粪便样本中确定SEQ ID NO:51的细菌基因或至少一个所述共变基因的表达水平或丰度,
b)将获得的表达水平或丰度与至少一个参考表达水平或丰度进行比较,其中所述参考表达水平或丰度是在参考样本上已被确定的相同细菌基因的基因表达水平或丰度,
c)通过所述比较,确定所述受试者的表型。
28.根据权利要求27所述的用途,其中步骤a)由确定SEQ ID NO:51至SEQ ID NO:55的细菌基因的表达水平或丰度组成。
29.根据权利要求13至28任一项所述的用途,其中所述受试者是人类患者。
30.根据权利要求13至28任一项所述的用途,其中通过测量所述样本中所述细菌基因的相对丰度确定所述基因的丰度。
31.根据权利要求13至28任一项所述的用途,其中通过采用基于多核苷酸杂交、多核苷酸测序和/或蛋白质组学的基因丰度谱的方法确定所述基因的表达水平或丰度。
32.根据权利要求6、15-16、19-20、23-24和27-28中任一项所述的用途,其中所述参考样本是获自可靠且明确地诊断为患有良性脂肪变性、非酒精性脂肪性肝炎、NASH肝脏纤维化和克罗恩病的受试者的粪便样本。
CN201380054047.XA 2012-10-17 2013-10-17 肝脏相关的炎性疾病的基因标记 Expired - Fee Related CN104769132B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP12306286.1 2012-10-17
EP12306286 2012-10-17
PCT/EP2013/071793 WO2014060555A1 (en) 2012-10-17 2013-10-17 Gene signatures of inflammatory disorders that relate to the liver

Publications (2)

Publication Number Publication Date
CN104769132A CN104769132A (zh) 2015-07-08
CN104769132B true CN104769132B (zh) 2018-05-08

Family

ID=47148686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380054047.XA Expired - Fee Related CN104769132B (zh) 2012-10-17 2013-10-17 肝脏相关的炎性疾病的基因标记

Country Status (14)

Country Link
US (2) US10036074B2 (zh)
EP (1) EP2909334B1 (zh)
JP (2) JP6752016B2 (zh)
CN (1) CN104769132B (zh)
AU (2) AU2013333882B2 (zh)
BR (1) BR112015008621A2 (zh)
CA (1) CA2886748A1 (zh)
DK (1) DK2909334T3 (zh)
ES (1) ES2821383T3 (zh)
IL (1) IL238025B (zh)
IN (1) IN2015DN03796A (zh)
MX (1) MX2015004844A (zh)
NZ (1) NZ707035A (zh)
WO (1) WO2014060555A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10039777B2 (en) 2012-03-20 2018-08-07 Neuro-Lm Sas Methods and pharmaceutical compositions of the treatment of autistic syndrome disorders
EP4249053A3 (en) 2016-03-04 2024-06-19 The Regents of The University of California Microbial consortium and uses thereof
JP2019517783A (ja) * 2016-04-20 2019-06-27 ヒューマン ロンジヴィティ,インコーポレイテッド 肝疾患を検出するためのマイクロバイオーム(microbiome)プロファイルの使用
CA3024272A1 (en) * 2016-05-11 2017-11-16 University Of Southern California Fasting mimicking diet (fmd) as an immunoregulatory treatment for gastrointestinal autoimmune/inflammatory diseases.
US11284640B2 (en) 2017-02-14 2022-03-29 University Of Southern California Fasting mimicking diet
EP3606325A4 (en) 2017-04-03 2021-01-20 Gusto Global, LLC RATIONAL DESIGN OF BIOTHERAPEUTICS BASED ON MICROBES
CN107271674B (zh) * 2017-06-13 2019-05-07 首都医科大学附属北京地坛医院 一种用于脂肪性肝炎检测的靶标志物gp73及检测应用方法
EP3773645A4 (en) 2018-04-10 2021-11-24 Siolta Therapeutics, Inc. MICROBIAL CONSORTIA
CN108504739A (zh) * 2018-05-15 2018-09-07 浙江大学 一种用于肝癌早期诊断的生物标志物及其应用
EP3899015A1 (en) * 2018-12-19 2021-10-27 Astrazeneca AB Biomarker of pnpla3 expression
JP2022523564A (ja) 2019-03-04 2022-04-25 アイオーカレンツ, インコーポレイテッド 機械学習を使用するデータ圧縮および通信
CA3153884A1 (en) 2019-10-07 2021-04-15 Nikole KIMES Therapeutic pharmaceutical compositions
CN111884792B (zh) * 2020-06-30 2021-07-09 深圳市永达电子信息股份有限公司 基于忆阻器混沌序列的本征态网络电路信号制备系统和方法
US11688507B2 (en) 2020-12-29 2023-06-27 Kpn Innovations, Llc. Systems and methods for generating a metabolic dysfunction nourishment program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101671640A (zh) * 2001-01-30 2010-03-17 雀巢制品公司 双歧杆菌的基因组
WO2011107481A3 (en) * 2010-03-01 2012-05-31 Institut National De La Recherche Agronomique Method of diagnostic of inflammatory bowel diseases

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) * 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US6610836B1 (en) * 1999-01-29 2003-08-26 Genome Therapeutics Corporation Nucleic acid amino acid sequences relating to Klebsiella pneumoniae for diagnostics and therapeutics
JP4852211B2 (ja) * 2000-03-21 2012-01-11 メルク アンド カンパニー インコーポレイテッド 原核生物における必須遺伝子の同定
WO2003053220A2 (en) * 2001-12-17 2003-07-03 Corixa Corporation Compositions and methods for the therapy and diagnosis of inflammatory bowel disease
US8119365B2 (en) * 2002-01-23 2012-02-21 Wisconsin Alumni Research Foundation Insertion sequence-free bacteria
WO2004092365A1 (ja) * 2003-04-13 2004-10-28 Kyushu Tlo Company Limited 肝障害関連遺伝子群の抽出選択法およびそれを用いた肝障害もしくは肝機能評価・診断方法
US7860656B2 (en) * 2005-02-03 2010-12-28 Assistance Publique-Hopitaux De Paris (Ap-Hp) Diagnosis method of hepatic steatosis using biochemical markers
SI2351772T1 (sl) * 2005-02-18 2016-11-30 Glaxosmithkline Biologicals Sa Proteini in nukleinske kisline iz Escherichia coli povezane z meningitisom/sepso
FR2893136A1 (fr) * 2005-11-10 2007-05-11 Sanofi Aventis Sa Procedes de diagnostic de maladies hepatiques et de criblage de molecules pour le traitement de ces maladies
US20110165568A1 (en) * 2009-12-31 2011-07-07 Life Technologies Corporation Sequences of e.coli 055:h7 genome
JP5757032B2 (ja) * 2010-04-05 2015-07-29 学校法人東京医科大学 miRNAを利用した慢性肝疾患の線維化の検査方法
JP2012125215A (ja) * 2010-12-17 2012-07-05 Osaka City Univ 肝線維症の存在及び/又は肝線維症の重症度の判定方法、判定マーカー、判定用キット、肝線維症の治療の効果予測方法、効果予測マーカー、並びに効果予測用キット
WO2012105590A1 (ja) * 2011-02-01 2012-08-09 アステラス製薬株式会社 非アルコール性脂肪肝炎の鑑別マーカー及び当該マーカーを指標とした非アルコール性脂肪肝炎の診断方法
WO2012159023A2 (en) * 2011-05-19 2012-11-22 Virginia Commonwealth University Gut microflora as biomarkers for the prognosis of cirrhosis and brain dysfunction
EP2763540A4 (en) 2011-09-09 2015-04-22 Univ Yale COMPOSITIONS AND METHODS FOR EVALUATION AND TREATMENT OF DISEASES AND INFLAMMATORY DISORDERS
US20140377278A1 (en) * 2012-01-10 2014-12-25 Yale University Compositions and Methods for Assessing and Treating Inflammatory Diseases and Disorders
ES2683826T3 (es) 2012-10-17 2018-09-28 Institute National De La Recherche Agronomique Determinación de la diversidad bacteriana intestinal reducida
US20150284779A1 (en) 2012-10-17 2015-10-08 Institut National De La Recherche Agronomique Determination of a tendency to gain weight
MX2015004809A (es) 2012-10-17 2015-11-16 Agronomique Inst Nat Rech Pronostico del impacto de la dieta sobre las co-morbilidades relacionadas con la obesidad.
US9459650B2 (en) 2014-03-17 2016-10-04 Qualcomm Incorporated Clock pulse generator for multi-phase signaling

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101671640A (zh) * 2001-01-30 2010-03-17 雀巢制品公司 双歧杆菌的基因组
WO2011107481A3 (en) * 2010-03-01 2012-05-31 Institut National De La Recherche Agronomique Method of diagnostic of inflammatory bowel diseases

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Antibiotics protect against fructose-induced hepatic lipid accumulation in mice_ Role of endotoxin";Ina Bergheim et al.;《Journal of Hepatology》;20080601;第48卷(第6期);第983-992页 *

Also Published As

Publication number Publication date
US20180251819A1 (en) 2018-09-06
JP2015535177A (ja) 2015-12-10
ES2821383T3 (es) 2021-04-26
BR112015008621A2 (pt) 2018-08-28
IL238025B (en) 2020-05-31
AU2013333882B2 (en) 2019-05-16
MX2015004844A (es) 2015-11-16
IL238025A0 (en) 2015-05-31
DK2909334T3 (da) 2020-09-28
US10036074B2 (en) 2018-07-31
IN2015DN03796A (zh) 2015-10-02
JP2019092522A (ja) 2019-06-20
EP2909334A1 (en) 2015-08-26
NZ707035A (en) 2018-11-30
JP6752016B2 (ja) 2020-09-09
AU2019210666A1 (en) 2019-08-22
WO2014060555A1 (en) 2014-04-24
US20160068890A1 (en) 2016-03-10
CN104769132A (zh) 2015-07-08
CA2886748A1 (en) 2014-04-24
EP2909334B1 (en) 2020-06-24
US10626471B2 (en) 2020-04-21
AU2013333882A1 (en) 2015-05-07

Similar Documents

Publication Publication Date Title
CN104769132B (zh) 肝脏相关的炎性疾病的基因标记
CA2777800C (en) Biomarkers and methods for measuring and monitoring inflammatory disease activity
Gasparetto et al. Transcription and DNA methylation patterns of blood-derived CD8+ T cells are associated with age and inflammatory bowel disease but do not predict prognosis
US20150211053A1 (en) Biomarkers for diabetes and usages thereof
Walker et al. A common variant in PNPLA3 is associated with age at diagnosis of NAFLD in patients from a multi-ethnic biobank
Vinberg et al. Remitted affective disorders and high familial risk of affective disorders associate with aberrant intestinal microbiota
Zhang et al. Molecular diagnosis and classification of inflammatory bowel disease
CN105378739A (zh) 鉴定有发生2型糖尿病风险的人
JP2005502345A (ja) 炎症性疾患を罹患した患者の薬物感受性を予測する方法
Costello et al. Genes, environments, and developmental research: methods for a multi-site study of early substance abuse
US10227651B2 (en) Gene expression based biomarker system for irritable bowel syndrome (IBS) diagnosis
Ananthakrishnan Precision medicine in inflammatory bowel diseases
CN113999922B (zh) 急性腹泻标志微生物及其应用
CN116042866A (zh) 用于评估二型糖尿病患者粪菌移植疗效的微生物标志物及其应用
Zhan et al. Predicting pediatric Crohn's disease based on six mRNA-constructed risk signature using comprehensive bioinformatic approaches
CN109072278A (zh) 分离的核酸及应用
Liu et al. Early prediction of liver disease using conventional risk factors and gut microbiome-augmented gradient boosting 2
Hou et al. Whole Blood–based Transcriptional Risk Score for Nonobese Type 2 Diabetes Predicts Dynamic Changes in Glucose Metabolism
Jayawardana et al. Pathogenesis and precision medicine in inflammatory bowel
Kim et al. Regulatory Variants on the Leukocyte Immunoglobulin-Like Receptor Gene Cluster are Associated with Crohn’s Disease and Interact with Regulatory Variants for TAP2
Li et al. Ultra-multiplex PCR technique to guide treatment of Aspergillus-infected aortic valve prostheses
KR20220040657A (ko) 크론병 환자에서 상부위장관 침범 진단을 위한 정보 제공 방법
CN114381492A (zh) 肌痛性脑脊髓炎标志微生物及其应用
CN114317718A (zh) 类风湿性关节炎标志ko及其应用
Rodriguez et al. Proposal summaries

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180508

CF01 Termination of patent right due to non-payment of annual fee