CN105473738B - 结直肠癌生物标志物 - Google Patents

结直肠癌生物标志物 Download PDF

Info

Publication number
CN105473738B
CN105473738B CN201480044482.9A CN201480044482A CN105473738B CN 105473738 B CN105473738 B CN 105473738B CN 201480044482 A CN201480044482 A CN 201480044482A CN 105473738 B CN105473738 B CN 105473738B
Authority
CN
China
Prior art keywords
gene
crc
marker
colorectal cancer
species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480044482.9A
Other languages
English (en)
Other versions
CN105473738A (zh
Inventor
冯强
张东亚
覃友文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Shenzhen BGI Life Science Research Institute
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201480044482.9A priority Critical patent/CN105473738B/zh
Priority claimed from PCT/CN2014/083663 external-priority patent/WO2015018307A1/en
Publication of CN105473738A publication Critical patent/CN105473738A/zh
Application granted granted Critical
Publication of CN105473738B publication Critical patent/CN105473738B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及用于预测微生物群相关疾病特别是结肠直肠癌(CRC)的风险的生物标志物和方法。

Description

结直肠癌生物标志物
相关申请的交叉引用
本专利申请要求于2013年8月6日提交PCT专利申请(申请号PCT/CN2013/080872)的优先权,通过引用并入此处。
技术领域
本发明涉及用于预测与微生物群有关疾病的风险的生物标志物及方法。特别地,本发明涉及用于预测结直肠癌(CRC)的风险的生物标志物和方法。
背景技术
在西方国家,结直肠癌(CRC)是第三大常见癌症,也是第二大致死的癌症(Schetter AJ,Harris CRC(2011)Alterations of microRNAs contribute to coloncarcinogenesis.Semin Oncol 38:734–742,通过引用并入此处)。在全世界范围内,每年都有很多人被诊断出患有CRC,也有很多患者死于此病。尽管现有的治疗手段(包括手术、放射疗法、化学疗法)对CRC具有显著的临床治疗价值,然而,手术后癌症的复发和转移使得这些治疗手段不能成功治愈结直肠癌。因此,对CRC早期的诊断不仅可以降低死亡率,还可以减少手术治疗的费用。
现在诊断CRC的手段,如可屈性乙状结肠镜检查和结肠镜检查是侵入式检查,被检查的患者在受检过程中可能会感觉不舒服甚至厌恶。
CRC的发展是受遗传、生理和环境因素影响的多因素过程。对于环境因素,生活方式特别是饮食摄入可能会影响到CRC发生的风险。西方饮食含有丰富的动物脂肪但是缺乏纤维,其通常与CRC的风险增加有关。因此,据推测饮食和CRC之间的关联可能是饮食对结肠微生物群和细菌代谢的影响,从而使得这两者均是疾病病因学中的相关因素(McGarr SE,Ridlon JM,Hylemon PB(2005).Diet,anaerobic bacterial metabolism,and coloncancer.J Clin Gastroenterol.39:98–109;Hatakka K,Holma R,El-Nezami H,Suomalainen T,Kuisma M,Saxelin M,Poussa T,H,Korpela R(2008).Theinfluence of Lactobacillus rhamnosus LC705together with Propionibacteriumfreudenreichii ssp.shermanii JS on potentially carcinogenic bacterialactivity in human colon.Int J Food Microbiol.128:406–410,通过引用并入此处)。
肠道微生物群和免疫系统之间的相互作用在肠道内外的很多疾病中发挥重要作用(Cho,I.&Blaser,M.J.The human microbiome:at the interface of health anddisease.Nature Rev.Genet.13,260–270(2012),通过引用并入此处)。粪便DNA的肠道微生物群分析具有作为非侵入式检测方法的潜力,用来寻找特异性生物标志物,而这些标志物可以作为CRC患者早期诊断的筛选工具,从而延长寿命,提高生活质量。
随着分子生物学的发展及其在微生物生态型和环境微生物学中的应用,一种新出现的宏基因组学(环境基因组学或生态基因组学)领域已快速发展。宏观基因组学包括提取总的群落DNA、构建基因组文库以及利用与功能基因组学相似的策略分析文库,其提供了强力的工具来研究复杂生长环境中的未培养微生物。在近些年,宏观基因组学已应用于许多环境样品,如海洋、土壤、河流、热井、温泉以及人胃肠道、鼻通道、口腔、皮肤和泌尿生殖道,在许多领域包括医学、替代能源、环境补救、生物技术、农业和生物防御中显示显著的价值。为了研究CRC,本发明人在宏观基因组学领域进行了分析。
发明概述
本发明公开的实施例旨在至少在某种程度上解决现有技术中存在的至少一个问题。
本发明是基于本发明人的以下发现作出的:
评估和表征肠道微生物群已经成为研究人类疾病(包括在所有癌症类型中最常见的致死癌症之一的结直肠癌(CRC))的一个主要领域。为了分析CRC患者的肠道微生物群,本发明人基于对128个中国人的肠道微生物DNA的深度鸟枪法测序,执行了宏基因组关联研究(MGWAS)(Qin,J.et al.A metagenome-wide association study of gut microbiota intype 2diabetes.Nature 490,55–60(2012),通过引用并入此处)的方案。发明人鉴定并验证了140,455个与CRC关联的基因标志物。为了开发利用肠道微生物群进行CRC鉴别的潜在能力,发明人基于通过最小冗余-最大关联(mRMR)特征选择方法定义为最优基因集的31个基因标志物,开发了疾病分类系统。为了基于这些31个肠道微生物群基因标志物直观地评估CRC疾病的风险,发明人计算了健康指数。发明人的数据为表征与CRC风险有关的肠道宏基因组提供了具有洞察力的见解,也为以后研究肠道宏基因组在其他相关疾病的病理生理学中的作用提供了一个范例,同时还揭示了基于肠道微生物群的方法在评估处于这样的疾病风险的个体中的潜在用途。
据信肠道微生物群的基因标志物对于增加癌症的早期检测具有重要的价值,原因如下:首先,本发明的标志物相对于传统癌症标志物更特异、更灵敏。其次,采用粪便进行分析的结果准确、安全、便宜并且患者较易服从。粪便样品是方便运输的。与需要肠道准备的结肠镜检查相比,基于聚合酶链式反应(PCR)的分析方法是无创的和舒适的,所以人们将更容易参与指定的筛选程序。第三,本发明的标志物还可作为治疗监测癌症患者的工具,以检测对治疗的反应。
附图说明
下面结合附图说明,本发明公开的各个方面及其优势将变得显而易见,从而更容易被理解。
图1示出了本研究中所有微生物基因的P值关联统计量的分布。CRC P值分布的关联分析鉴定了在较低P值下强关联标志物不成比例地表达过度,其中在零假设下,大部分基因符合预期的P值分布。这表明,显著的标志物可能代表真实而不是虚假的关联。
图2示出了利用最小冗余-最大关联(mRMR)方法鉴定出从对照区分结直肠癌病例的31个基因标志物。利用mRMR方法进行递增式查找,得到连续数目的子集。对于每个子集,利用留一交叉验证法(LOOCV)评估线性判别分类器的错误率。错误率最低的最优子集包含31个基因标志物。
图3示出了发现CRC关联的肠道微生物基因标志物。一起示出了对来自此研究的CRC患者及对照个体计算的CRC指数,对来自先前对II型糖尿病、炎症性肠病的研究的患者和对照个体计算的CRC指数。盒子代表了第一四分位数和第三四分位数之间的四分位距,盒子内部的线代表中位数。表6列出的经计算的肠道健康指数与群体中CRC患者的比率具有良好的相关性。CRC患者微生物群组的CRC指数与其余受试者的显著不同(***P<0.001)。
图4示出了对来自中国人第一群体的31个基因标志物的CRC指数进行ROC分析,曲线下面积为0.9932,表明31个基因标志物具有出色的鉴别潜力。
图5示出了从实施例2中的另外的中国人群体(包括19个CRC患者和16个非CRC对照)样品中计算得到的CRC指数。盒子代表了第一四分位数和第三四分位数(分别为第25和第75百分位数)之间的四分位距(IQR),盒子内部的线代表中位数,点代表每个样品的肠道健康指数。正方形代表病例组(CRC),三角形代表对照组(非CRC),带*的三角形代表被诊断为CRC患者的非CRC个体。
图6示出了在结直肠癌中与肠道微生态失调有关的物种。使用三种不同方法(MLG、mOTU和IMG数据库)一致地鉴定两种CRC关联的微生物物种和一个对照关联的微生物物种的差别相对丰度。
图7示出了莫氏细小杆菌(Solobacterium moorei)和胃消化链球菌(Peptostreptococcus stomatis)在CRC患者微生物群组中的富集情况。
图8示出了利用随机森林方法和三种不同物种注释方法得到的CRC特异性物种标志物选择的受试者工作特征曲线(ROC)。(A)利用IMG 400版本对高质量测序序列进行注释得到的IMG物种;(B)利用已发表的方法得到的mOTU物种;(C)利用MLG方法聚类的所有显著基因和利用IMG 400版本注释得到的物种。
图9示出了利用三种物种注释方法(MLG、IMG和mOTU)得到的在疾病第二阶段及以后各阶段富集的三种物种的阶段特异性丰度。
图10示出了在结直肠癌中与肠道微生态失调有关的物种。在CRC的不同阶段中,一种在对照微生物群组中富集的细菌物种和三种在CRC关联的微生物群组中富集的细菌物种的相对丰度(利用三种不同的物种注释方法)。
图11示出了利用宏基因组方法和定量聚合酶链式反应(qPCR)方法对两个基因标志物进行的定量之间的相关性。
图12示出了利用2个基因评估中国人第二群体的CRC指数。(A)基于2个基因标志物的CRC指数鉴别CRC和对照微生物群组;(B)ROC分析结果显示了利用CRC指数进行鉴别的边际潜力,曲线下面积为0.73。
图13示出了对与CRC关联强健的基因标志物进行验证的结果。在第二群体(由51个病例和113个健康对照组成)中测量三个基因标志物的qPCR丰度(对数值取log10,丰度为0的以-8进行作图)。其中,两个基因(m1704941:来自F.nucleatum的丁酰辅酶A脱氢酶;m482585:来自未知微生物的RNA引导DNA聚合酶)是随机选择的,另外一个(m1696299:来自P.micra的RNA聚合酶β亚基,rpoB)是定向选择的。(A)基于这三个基因计算得到的CRC指数可以清楚地鉴别CRC微生物群组和对照微生物群组;(B)对CRC指数利用0.84的受试者工作特征(ROC)曲线下面积(AUC)进行分类;(C)相对于对照和第一阶段微生物群组,P.micra物种特异性基因rpoB从CRC第二阶段和第三阶段开始显示相对较高的出现率和丰度(P=2.15x10-15)。
发明详述
本文所用的术语具有本发明相关领域的普通技术人员所通常理解的含义。术语如“一个”、“一种”和“所述”不旨在仅指单数的实体,而是包括可用于说明特定实施例的一般类别。本文的术语用于描述本发明的具体实施例,但它们的使用并不限定本发明,除非在权利要求中指出。
本发明的一方面提供了一种获取用于预测微生物群相关异常状态的风险的基因标志物集的方法,包括:
a)利用宏基因组关联研究(MGWAS)策略经由以下步骤鉴定异常相关的基因标志物:
i)从具有异常状态(异常)和不具有异常状态(对照)的受试者群体中的每个受试者收集样品;
ii)提取各个样品的DNA,并对于各个样品构建DNA文库,随后利用高通量测序来获取测序序列;
iii)将测序序列定位到基因集上,并基于定位结果获得基因谱;
iv)对基因谱进行Wilcoxon轶和检验,以鉴定异常和对照之间宏基因组基因含量的差别;
b)利用最小冗余-最大关联(mRMR)方法对在步骤a)中鉴定的所有异常相关的基因标志物进行排序,并从其获得有序的标志物集;
c)对于每个有序的标志物集,利用留一交叉验证方法(LOOCV)评估线性鉴别分类器的错误率,选取错误率最低的最优基因标志物集用作预测异常状态风险的基因标志物集。
本发明的又一方面提供了一种诊断受试者是否具有微生物群相关异常状态或者是否具有形成微生物群相关异常状态的风险的方法,包括:
1)收集受试者的样品j并提取样品的DNA;
2)构建DNA文库,并测序以获取测序序列;
3)将测序序列定位到基因集上,并基于定位结果获得基因谱;
4)测定基因标志物集中每个基因标志物的基因相对丰度,其中基因标志物集利用如上所述的方法获得;
5)利用下列公式计算样品j的指数:
Aij是样品j中标志物i的相对丰度,其中i表示所述基因标志物集的每一个基因标志物;
N是所选择的与疾病有关的生物标志物中所有在异常中富集的标志物的子集;
M是所选择的与疾病有关的生物标志物中所有在对照中富集的标志物的子集;
|N|和|M|分别是这两个子集中生物标志物的数目(大小);
其中当指数大于临界值时,表明受试者具有异常状态或者具有形成异常状态的风险。
在一个实施方案中,在本发明的提供的方法中,所述宏基因组关联研究(MGWAS)策略进一步包括评估错误发现率(FDR)。在一个实施方案中,所述基因集是针对相关微生物群构建的非冗余基因集。在一个实施方案中,所述与微生物群有关的异常状态是与环境微生物群,如土壤微生物群,海洋微生物群,或河流微生物群有关的异常状态。在另一个实施方案中,所述与微生物群有关的异常状态是与动物体或人体如胃肠道、鼻通道、口腔、皮肤或泌尿生殖道中的微生物群有关的疾病,其中所述样品是粪便样品、鼻腔刮取物、口腔刮取物,皮肤刮取物或阴道刮取物。在优选的实施方案中,所述与微生物群有关的异常状态是选自结直肠癌、溃疡性结肠炎、克罗恩氏病、肠易激综合征(IBS)、肠憩室病、痔疮、肛裂和大便失禁的结肠直肠病。在最优选的实施方案中,所述与微生物群有关的异常状态是结直肠癌(CRC)。
在一个实施方案中,所述测序步骤是通过第二代测序法或第三代测序法进行的,优选通过选自Hiseq2000、SOLID、454和单分子测序中的至少一种装置进行。
在另一个实施方案中,所述临界值是通过受试者工作特征(ROC)的方法获得的,其中所述临界值是当AUC(曲线下面积)达到最大值时对应的值。
本发明的又一方面提供了一种诊断受试者是否患有结直肠癌或者是否具有形成结直肠癌的风险的方法,包括:
1)收集受试者的粪便样品j并提取样品的DNA;
2)构建DNA文库,并测序以获取测序序列;
3)将测序序列定位到人肠道基因集上,并基于定位结果获得基因谱;
4)测定SEQ ID NOs:1-31所示的每个标志物的基因相对丰度;和
5)利用下列公式计算样品j的指数:
Aij是样品j中标志物i的相对丰度,其中i表示SEQ ID NOs:1-31所示的每一个基因标志物;
N是所有在患者中富集的标志物的子集并且M是所有在对照中富集的标志物的子集;
其中,在CRC中富集的标志物的子集和在对照中富集的标志物的子集示于表1中;
|N|和|M|分别是这两个子集中生物标志物的数目(大小);
其中当指数大于临界值时,表明受试者具有结直肠癌或者具有形成结直肠癌的风险。
在一个实施方案中,所述临界值是通过受试者工作特征(ROC)方法获得的,其中所述临界值是当曲线下面积(AUC)达到最大值时对应的值。在一个优选的实施方案中,所述临界值为-0.0575。
本发明的又一方面提供了用于预测受试者中结直肠癌(CRC)风险的基因标志物集,所述基因标志物集由SEQ ID NOs:1-31所示的基因组成。
本发明的又一方面提供了一种用于测定由SEQ ID NOs:1-31所示的基因组成的基因标志物集的试剂盒,其包含根据SEQ ID NOs:1-31所示的基因设计的用于PCR扩增的引物。
本发明的又一方面提供了一种用于测定由SEQ ID NOs:1-31所示的基因组成的基因标志物集的试剂盒,其包含根据SEQ ID NOs:1-31所示的基因设计的一种或多种探针。
本发明的又一方面提供了由SEQ ID NOs:1-31所示的基因组成的基因标志物集用于预测受试者中结直肠癌(CRC)风险的用途。
本发明的又一方面提供了由SEQ ID NOs:1-31所示的基因组成的基因标志物集用于制备预测受试者中结直肠癌(CRC)风险的试剂盒的用途。
下面将结合非限制性实施例对本发明进行进一步说明。除非另有说明,份数和百分比以重量计,温度以摄氏度表示。本领域技术人员将理解,下列实施例虽然指出了本发明的优选实施方案,但仅以举例说明的方式给出,所用试剂均可以通过商业途径得到。
一般方法
I.检测生物标志物的方法(利用宏基因组关联研究策略检测生物标志物)
为了定义CRC相关的宏基因组标志物,发明人采用了宏基因组关联研究(MGWAS)策略(Qin,J.et al.A metagenome-wide association study of gut microbiota in type2diabetes.Nature 490,55–60(2012),通过引用并入此处)进行分析。发明人采用基于测序的分析方法对样品中的肠道微生物群进行了定量分析。平均而言,在相似性应≥90%的要求下,发明人能够将双末端测序序列唯一地定位到更新的基因集上。为了标准化测序覆盖度,发明人采用相对丰度代替原始测序序列计数来对肠道微生物基因进行定量。然而,与GWAS亚群校正不同的是,发明人利用该方法分析微生物丰度,而不是基因型。利用Wilcoxon秩和检验对基因谱进行调整,从而鉴定出在CRC患者和对照中不同的宏基因组基因含量。结果显示,与零假设的期望分布相比,一组微生物基因的实质富集具有非常小的P值,表明这些基因是真正的与CRC关联的肠道微生物基因。
本发明人接下来对分析中的错误发现率(FDR)进行控制,并从与FDR相一致的基因中定义CRC关联基因标志物。
II.从生物标志物中筛选31个最优基因标志物的方法(最小冗余-最大关联(mRMR)特征选择法流程)
为了确定一个最优的基因标记物集,发明人利用最小冗余-最大关联(mRMR)(详细请参考Peng,H.,Long,F.&Ding,C.Feature selection based on mutual information:criteria of max-dependency,max-relevance,and min-redundancy.IEEE TransPattern Anal Mach Intell27,1226-1238,doi:10.1109/TPAMI.2005.159(2005),通过引用并入此处)特征选择方法从与CRC关联的所有基因标志物中进行筛选。发明人用R软件中的“sideChannelAttack”工具包进行递增式查找,共得到128个有序的标志物集。对于每个有序的标志物集,利用留一交叉验证方法(LOOCV)评估线性鉴别分类器的错误率。选取错误率最低的作为最优标志物集。在本发明中,发明人从140455个与CRC关联的基因标志物中进行特征筛选。由于没有对所有基因进行mRMR分析的计算能力,发明人构建了统计上非冗余的基因集。首先,发明人将140455个与CRC关联的基因标志物中彼此高度相关(Kendall相关性>0.9)的基因进行预分组。然后,发明人选取组中最长的基因作为代表基因,由于基因越长越容易进行功能注释,因此,在进行定位程序时将抓取更多的测序序列。这构建了15836个显著基因的非冗余基因集。随后,发明人对15836个显著基因进行mRMR特征筛选,从而确定出与结直肠癌强关联的31个基因标志物的最优集,用于结直肠癌鉴别,其列于表1中。
表1:31个最优基因标志物的富集信息
III肠道健康指数(CRC指数)
为了开发利用肠道微生物群进行疾病鉴别的潜力,发明人基于确定的基因标志物开发了疾病分类系统。为了利用这些肠道微生物基因标志物对患病风险进行直观地评估,发明人计算了肠道健康指数(CRC指数)。
为了评估肠道宏基因组对CRC的作用,发明人基于上述31个肠道宏基因组标志物定义和计算了每个个体的肠道健康指数。对于每个个体样品,利用下面公式计算样品j的肠道健康指数Ij
Aij是样品j中基因标志物i的相对丰度。
N是所选择的与异常状态有关的生物标志物中所有在患者中富集的标志物的子集(即所选的31个肠道宏基因组标志物中所有在CRC中富集的标志物的子集)。
M是所选择的与异常状态有关的生物标志物中所有在对照中富集的标志物的子集(即所选的31个肠道宏基因组标志物中所有在对照中富集的标志物的子集)。
|N|和|M|分别是这两个集中生物标志物的数目(大小)。
IV受试者工作特征(ROC)分析
基于宏基因组标志物,发明人利用受试者工作特征(ROC)分析评价结直肠癌分类的的性能。基于上述31个肠道宏基因组标志物,发明人计算每个样品的CRC指数,然后利用R软件的“Daim”工具包绘制ROC曲线。
V疾病分类器系统
利用MGWAS策略鉴定出生物标志物后,基于用来对疾病和健康进行分类的生物标志物应当是最强、冗余度最低的原则,发明人利用最小冗余-最大关联(mRMR)对生物标志物进行排序,并得到有序的标志物集(其大小可与生物标志物总量相同)。对于每个有序的标志物集,利用留一交叉验证方法(LOOCV)评估分类器的错误率。选取错误率最低的作为最优基因标志物集(在一些实施方案中,发明人选取了31个生物标志物)。
最后,为了利用这些肠道微生物基因标志物对患病风险进行直观地评估,发明人计算了肠道健康指数。健康指数越大,患病风险越高;健康指数越小,患病风险越低。基于一个大群体,发明人能够建立最优的健康指数临界值。如果测试样品的健康指数大于该临界值,则该受试者患病风险较高;而如果测试样品的健康指数小于该临界值,则该受试者较健康,患病风险较小。其中所述最优的健康指数临界值可由ROC方法在曲线下面积(AUC)达到最大值时来确定。
实施例1从128个中国人个体中鉴定出31个生物标志物并利用肠道健康指数评价 他们患结直肠癌的风险
1.1样品收集及DNA提取
来自128个受试者(第一群体)包括74位结直肠患者和54位健康对照受试者(表2)的粪便样品收集自香港威尔斯亲王医院,均获得知情同意。为了满足本研究,参与个体在采集粪便样品前需要满足以下条件:1)最少三个月内没有服用抗生素或其他药物,没有特别饮食(如糖尿病患者专用餐、素食等),生活作息正常(没有额外压力);2)最少三个月内没有任何医学干预;3)没有结直肠手术史,没有患过任何癌症,没有患过任何肠道炎症或者感染性疾病。受试者在进行结肠镜检查之前,于家中将粪便样品收集到标准容器中,并立即置于家用冰箱中。冷冻样品用绝缘的聚苯乙烯泡沫容器运送至香港威尔斯亲王医院,并立即置于-80℃冰箱备用。
取粪便样品于冰上解冻,根据制造商的说明,用DNA QiagenQIAamp粪便迷你试剂盒提取DNA。提取物用无DNA酶的RNA酶处理,以消除RNA污染。利用NanoDrop分光光度计、Qubit荧光计(使用Quant-iTTMdsDNA BR分析试剂盒)和凝胶电泳对DNA进行定量分析。
表2第一群体结直肠癌病例和对照的基线特征
参数 对照(n=54) 病例(n=74)
年龄 61.76 66.04
性别(男:女) 33:21 48:26
BMI 23.47 23.9
eGFR 72.24 74.15
DM(%) 16(29.6%) 29(39.2%)
肠型(1:2:3) 26:22:6 37:31:6
疾病分期(1:2:3:4) n.a. 16:21:30:7
病灶位置(近侧的:远侧的) n.a. 13:61
BMI:体重指数;eGFR:表皮生长因子受体;DM:II型糖尿病
1.2DNA文库构建与测序
根据制造商提供的说明书,利用Illumina HiSeq 2000平台进行DNA文库构建。利用与其他地方描述的相同的流程进行簇生成、模板杂交、等温扩增、线性化、阻断变性以及与测序引物的杂交(Qin,J.et al.A metagenome-wide association study of gutmicrobiota in type 2diabetes.Nature 490,55–60(2012).通过引用并入此处)。
发明人针对每个样本构建具有插入长度为350bp的双末端(paired-end,PE)文库,通过高通量测序获得约3000万对PE测序序列,其长度为2x100bp。通过过滤原始数据中含’N’碱基的低质量序列、接头污染序列和人DNA污染序列,并同时修整测序序列的低质量末端碱基,从而得到高质量测序序列。共得到75100万条宏基因组测序序列(高质量测序序列)(平均每个个体586万条测序序列,见表3)。
1.3测序序列定位
发明人将高质量测序序列定位到已公开的利用欧洲和中国成年人建立起来的参考肠道基因集(Qin,J.et al.A metagenome-wide association study of gutmicrobiota in type 2diabetes.Nature 490,55–60(2012),通过引用并入此处)上(表3)(相似性>=90%),基于此,发明人利用Qin et al.2012(同上)中公开的T2D文献里记载的相同方法构建了基因谱。根据该文献构建的参考基因集,发明人构建了出现在所有128个样品中至少6个样品中的2110489(2.1M)个基因的子集。
表3宏基因组数据及定位到参考基因集总结。第四列是来自Wilcoxon秩和检验的P值结果。
参数 对照 病例 P值
平均原始测序序列 60162577 60496561 0.8082
去除低质量序列后 59423292(98.77%) 59715967(98.71%) 0.831
去除人测序序列后 59380535±7378751 58112890±10324458 0.419
定位率 66.82% 66.27% 0.252
1.4肠道微生物群基因谱影响因子分析
为了确保强壮地比较128个宏基因组的基因含量,发明人构建了出现在至少6个受试者中的2110489(2.1M)个基因的子集,并利用这些2100万个基因构建了128个基因丰度谱。发明人利用置换多元方差分析(PERMANOVA)方法评估不同特征对2.1M个基因的基因谱的影响,这些特征包括年龄、BMI,eGFR,TCHO,LDL,HDL,TG,性别,DM,CRC状态,吸烟情况以及病灶位置。发明人利用R中的“vegan”工具包进行分析,经过10000次置换,得到置换P值。发明人还利用R中的“p.adjust”工具包对多重检验进行校正,利用Benjamini-Hochberg方法得到每个基因的q值。
发明人对13个不同的变量进行了置换多元方差分析(PERMANOVA),发现只有CRC状态与这些基因谱显著相关(q=0.0028,表4),显示比第二最佳决定因素体重指数(q=0.15)更强的相关性。这些数据表明CRC患者微生物群组的基因组成发生了变化。
表4:利用微生物基因谱进行置换多元方差分析。该分析是为了检验临床参数及结直肠癌(CRC)状态是否对肠道微生物群具有显著的影响(q<0.05)。BMI:体重指数;DM:II型糖尿病;HDL:高密度脂蛋白;TG:甘油三脂;eGFR:表皮生长因子受体;TCHO:总胆固醇;LDL:低密度脂蛋白。
1.5利用MGWAS鉴定CRC关联基因
1.5.1鉴定结直肠癌关联基因
发明人利用宏基因组关联研究(MGWAS)来鉴定促成CRC中基因组成发生改变的基因。为了鉴定宏基因组特征谱与CRC的关联性,发明人利用双侧Wilcoxon秩和检验方法对2.1M(2110489)个基因谱进行分析。利用这种方法,发明人共得到140445个基因标志物,其在病例中富集或在对照中富集(p<0.01)(图1)。
1.5.2评估错误发现率(FDR)
为了评估错误发现率(FDR),发明人没有使用P值拒绝方法,而是使用了“q值”方法,该方法在以前的一个研究中提出(J.D.Storey,R.Tibshirani,Statisticalsignificance for genomewide studies.Proceedings of the National Academy ofSciences of the United States of America 100,9440(Aug 5,2003),通过引用并入此处)。在MGWAS中,统计假设检验是在大量的特征数据上进行的,这些特征数据来自140455个基因。分析得到的错误发现率(FDR)为11.03%。
1.6基于肠道微生物群的CRC分类系统
发明人利用最小冗余最大相关(mRMR)特征选择方法从与疾病关联的基因中鉴定CRC的潜在生物标志物。然而,由于该方法的计算过于复杂,不允许我们使用MGWAS对所有140455个基因进行分析,因此,发明人不得不减少候选基因的数目。首先,发明人选择更高统计学显著性(P<0.001;FDR=4.147%)的36872个基因的严格集。然后,发明人将彼此高度相关(Kendall的τ>0.9)的基因进行分组,选择每组中最长的基因,从而构建出包括15836个显著基因的统计学上非冗余的基因集。最后,发明人利用mRMR方法鉴定出与CRC状态强相关的31个基因的最优集(图2,表5)。基于这些标志物的相对丰度,发明人通过计算CRC指数,可以清楚地将CRC患者微生物群组与对照微生物群组区分开来(表6),也可以与先前两个研究中的II型糖尿病中国人(Qin等人(2012),同上)和炎症性肠病欧洲人(J.Qin et al.,Ahuman gut microbial gene catalogue established by metagenomicsequencing.Nature 464,59(Mar 4,2010),通过引用并入此处))的490个粪便微生物群组区分开来(图3,在这项研究中,患者和对照CRC指数的中位数分别是6.42和-5.48;所有五个比较的Wilcoxon秩和检验的q值均小于2.38×10-10,见表7)。利用CRC指数对74个CRC患者微生物群组和54个对照微生物群组进行分类,其ROC曲线的曲线下面积为0.9932(图4)。当临界值取-0.0575时,真阳性率(TPR)为1,假阳性率(FPR)为0.07407,表明这31个基因标志物可以用来准确分类CRC受试者。
表6.计算出的128个样品的肠道健康指数(CRC患者和非CRC的对照)
实施例2:31个生物标志物的验证
发明人利用另外一个新的独立的研究群体对CRC分类器的鉴别能力进行验证,该群体包括19个CRC患者和16个非CRC对照,同样来自于香港威尔斯亲王医院。
对于每一个样品,利用实施例1描述的方法进行DNA提取、DNA文库构建以及高通量测序。发明人利用Qin等人(2012,同上)描述的方法计算得到这些样品的基因丰度谱。从而得到SEQ ID NOs:1-31所示各个标志物的基因相对丰度。然后利用下列公式计算每个样品的指数:
Aij是样品j中标志物i的相对丰度,其中i表示SEQ ID NOs:1-31所示的每一个基因标志物;
N是所有在患者中富集的标志物的子集并且M是所有在对照中富集的标志物的子集;
其中在CRC中富集的标志物的子集和在对照中富集的标志物的子集示于表1中;
|N|和|M|分别是这两个子集中生物标志物的数目(大小),其中|N|为13,|M|为18。
表8示出了计算出的每个样品的指数;表9示出了代表性样品V30的基因相对丰度。
在该评估分析中,肠道健康指数最高的前19个样品均来自CRC患者,所有的CRC患者均被诊断为CRC个体(表8和图5)。只有一个非CRC的对照(图5,带*号三角形)被诊断为CRC患者。当临界值取-0.0575时,错误率为2.86%,表明这31个基因标志物可以准确地鉴别CRC个体。
表8.计算出的35个样品的肠道健康指数
表9.样品V30的基因相对丰度
由此,发明人利用最小冗余最大相关(mRMR)特征选择法基于140455个CRC关联的标志物鉴定并验证了31个标志物的集合。基于这31个肠道微生物基因标志物,发明人通过计算肠道健康指数来评估CRC疾病的风险。
实施例3:从128个中国个体中鉴定物种标志物
基于实施例1中所述第一群体128个微生物群组的测序序列,发明人检查了对照和CRC相关的微生物群组之间的分类学差异,从而鉴定促成生态失调的微生物类群。对于此,由于不同方法得到的支持证据会加强关联性,因此,发明人利用三种不同的方法对得到的分类谱进行分析。首先,发明人将宏基因组测序序列定位到IMG数据库(400版本)的4650个微生物基因组上并评估包含在这个数据库中的微生物物种(命名为IMG物种)的丰度。其次,发明人利用通用系统发生标志物基因评估种水平分子操作分类单元(mOTU)的丰度。第三,发明人将MGWAS鉴定出来的140455个基因整理成代表源自同一个基因组的基因簇的宏基因组连锁群(MLG),尽可能利用IMG数据库对MLG进行种水平的注释,基于这些物种注释信息将MLG进行分组,并随后评估这些物种(命名为MLG物种)的丰度。
3.1 IMG基因组物种注释
对于每个IMG基因组,根据IMG提供的NCBI分类标识,发明人利用NCBI分类转储文件在种水平和属水平上鉴定出对应的NCBI分类学分类。没有对应的NCBI物种名的基因组保留其原始的IMG名,其中不能分类的占到大多数。
3.2数据谱构建
3.2.1基因谱
发明人将高质量测序序列定位到利用欧洲和中国成人建立起来的已公开的参考肠道基因集的基因集(相似性>=90%)上,基于此,发明人利用Qin等人2012年发表的关于T2D的文献(同上)里记载的相同方法构建了基因谱。
3.2.2 mOTU谱
将干净测序序列(实施例1的高质量测序序列)比对至mOTU参考集(共79268条序列),使用默认的参数(S.Sunagawa et al.,Metagenomic species profiling usinguniversal phylogenetic marker genes.Nature methods 10,1196(Dec,2013),通过引用并入此处)。鉴定出549个种水平的mOTU,包括307个注释的物种和242个没有代表性基因组的mOTU连锁群,推测其为厚壁菌门(Firmicutes)和拟杆菌门(Bacteroidetes)。
3.2.3 IMG种和IMG属特征谱
从http://ftp.jgi-psf.org下载IMG v400参考数据库(V.M.Markowitz et al.,IMG:the Integrated Microbial Genomes database and comparative analysissystem.Nucleic acids research 40,D115(Jan,2012),通过引用并入此处),并从中提取细菌、古细菌和真菌序列。总共得到522093条序列,基于原始文件7个相同大小的块构建SOAP参考指数。利用SOAP校准器(R.Li et al.,SOAP2:an improved ultrafast tool forshort read alignment.Bioinformatics 25,1966(Aug 1,2009),通过引用并入此处)第2.22版将干净测序序列与参考进行比对,使用参数“-m 4 -s 32 –r 2 -n 100 -x 600 -v8 -c 0.9 -p 3”。然后,利用SOAP覆盖度软件计算每个基因组的测序序列覆盖度,利用基因组长度进行标准化,并进一步标准化至每个个体样品的相对丰度。仅基于唯一定位的测序序列生成特征谱。
3.3鉴定结直肠癌关联的MLG物种
基于鉴定出的与结直肠癌关联的140455个标志物基因谱,发明人利用先前Qin等人在2012年发表的II型糖尿病研究(同上)里描述的方法构建结直肠癌关联的MLG。将所有的基因对比到IMG数据库v400中的参考基因组以获取基因组水平的注释。如果大于50%的组成性基因被注释到一个基因组,则将MLG归属于该基因组,否则将其称为未分类。总共87个基因数目超过100个的MLG被选择为与结直肠癌相关联的MLG。基于这些基因组的物种注释将这些MLG分组,从而构建出MLG物种。
为了评估MLG物种的相对丰度,发明人首先去除丰度最高的5%基因和丰度最低的5%基因,然后评估MLG物种的基因的平均丰度。通过计算属于该物种的IMG基因组的丰度之和,从而评估IMG物种的相对丰度。
通过以上分析方法,发明人鉴定到30个IMG物种、21个mOTU以及86个MLG物种与CRC状态显著关联(Wilcoxon秩和检验,q<0.05;见表10,11)。其中,凸腹真杆菌(Eubacteriumventriosum)在所有三种方法中均在对照微生物群组中富集(Wilcoxon秩和检验-IMG:q=0.0414;mOTU:q=0.012757;MLG:q=5.446x10-4),而挑剔真杆菌(Eubacterium eligens)在两种方法中在对照微生物群组中富集(Wilcoxon秩和检验-IMG:q=0.069;MLG:q=0.00031)。另一方面,微小小单胞菌(Parvimonas micra)(q<1.80x10-5),胃消化链球菌(Peptostreptococcus stomatis)(q<1.80x10-5),莫氏细小杆菌(Solobacterium moorei)(q<0.004331)和具核梭杆菌动物亚种(Fusobacterium nucleatum)(q<0.004565)在所有三种方法中均在CRC患者微生物群组中富集(图6,图7)。其中,P.stomatis与口腔癌有关联,S.moorei与菌血症有关联。最近的16S rRNA测序研究已观察到,F.nucleatum在CRC肿瘤样品中具有显著的富集,且这种细菌已被显示具有粘合性、侵入性和促炎性性质。本发明的结果在具有不同的遗传和文化来源的新群体中证实了此关联性。然而,P.micra在CRC关联的微生物群组中的高度显著富集是新的发现,该菌属于专性厌氧菌,可以像F.nucleatum一样引起口腔感染。P.micra涉及牙周炎的病因学,并且其产生广谱蛋白水解酶,并使用蛋白胨和氨基酸作为能量来源。已知它还产生硫化氢,其促进肿瘤生长和结肠癌细胞的增殖。还需要更进一步的研究去证实P.micra是参与CRC的致病机理还是其富集是结肠和/或直肠中CRC相关变化的结果。尽管如此,它可表现出用作CRC非侵入式诊断的生物标志物的机会。
3.4物种标志物鉴定
为了评估这些分类学关联分析的预测功效,发明人利用随机森林系统学习法(D.Knights,E.K.Costello,R.Knight,Supervised classification of humanmicrobiota.FEMS microbiology reviews 35,343(Mar,2011),通过引用并入此处)鉴定三种不同方法得到的物种谱中的关键物种标志物。
3.4.1 MLG物种标志物鉴定
基于构建的基因数目超过100个的87个MLG,发明人采用Benjamini-Hochberg调整法对每一个MLG进行Wilcoxon秩和检验,筛选出86个MLG与CRC显著相关(q<0.05)。基于这86个结直肠癌相关的MLG物种,发明人采用R(2.10版)中的“randomForest 4.5-36”工具包来鉴定MLG物种标志物。首先,发明人根据“randomForest”方法得出的重要性对所有86个MLG物种进行排序。通过创建排名最高的MLG物种的递增子集,从包含1个物种开始至包含所有86个MLG物种结束,从而构建MLG标志物集。
对于每个MLG标志物集,发明人计算出其在128个中国人群体(第一群体)中的错误预测率。最后,选取错误预测率最低的MLG物种集作为MLG物种标志物。此外,发明人利用基于筛选出来的MLG物种标志物得到的疾病发生概率绘制ROC曲线。
3.4.2IMG物种标志物和mOTU物种标志物鉴定
基于IMG物种谱和mOTU物种谱,发明人同样采用Benjamini-Hochberg调整法进行Wilcoxon秩和检验,从而筛选出与CRC显著相关(q<0.05)的IMG物种和mOTU物种。接着,利用与筛选MLG物种标志物相同的方法,即采用随机森林法筛选IMG物种标志物和mOTU物种标志物。
此分析揭示,16个IMG物种、10个种水平mOTU和21个MLG物种对CRC状态具有较高的预测能力(表12、13),通过ROC分析得到其预测功效分别是0.86、0.90和0.94(图8)。微小小单胞菌(Parvimonas micra)在三种方法中都被鉴定为关键物种;具核梭杆菌动物亚种(Fusobacterium nucleatum)和莫氏细小杆菌(Solobacterium moorei)在其中两种方法中被鉴定为关键物种,这为它们与CRC状态的关联进一步提供了统计学支持。
3.5 MLG、IMG和mOTU物种的阶段富集分析
由于三种方法预测的与CRC状态关联的物种相一致,而且发明人记录了CRC患者的疾病阶段(表2),因此,发明人对物种谱进行了探索,以寻求鉴定早期CRC的特异性标记。发明人推测,这种努力可能揭示很难在全局分析中进行鉴定的阶段特异性关联。为了确定在CRC的四个阶段或健康对照中有哪些物种富集,发明人对基因数目超过100的MLG物种和q<0.05(采用Benjamini-Hochberg调整法的Wilcoxon秩和检验)的所有IMG物种和mOTU物种进行Kruskal检验,利用在CRC四个阶段和健康对照中最高的秩平均获得物种富集信息。发明人还利用成对Wilcoxon轶和检验对各组两两之间的显著性进行比较。
在中国人第一群体,有几个物种在不同的阶段显示显著不同的丰度。其中,相较于所有其它阶段和对照样品,发明人没有鉴定出在第一阶段富集的任何物种。相较于对照样品,胃消化链球菌(Peptostreptococcus stomatis),变黑普雷沃氏菌(Prevotellanigrescens)和共生梭菌(Clostridium symbiosum)在第二阶段以后富集,表明它们在CRC形成之后开始在结肠/直肠定殖(图9)。然而,相较于对照,具核梭杆菌动物亚种(Fusobacterium nucleatum),微小小单胞菌(Parvimonas micra),和莫氏细小杆菌(Solobacterium moorei)在所有四个阶段均有富集,在第二阶段丰度最高(图10),表明它们可能在CRC病因学和发病机制中发挥作用,也意味着它们可以作为早期CRC的潜在生物标志物。
实施例4利用qPCR对标志物进行验证
上述31个基因生物标志物是利用公认的昂贵的宏基因组深度测序方法得到的。将它们转为诊断用生物标志物需要可靠且简单便宜的测量方法,如定量PCR(基于TaqMan探针的qPCR)方法。利用Primer Express v3.0(Applied Biosystems,美国加利福尼亚州福斯特城)设计引物和探针。利用通用定量PCR预混液(Applied Biosystems),在ABI7500实时PCR系统上进行qPCR。通用的16S rDNA用作内参,基因标志物的丰度用相对于16S rDNA基因的相对水平表示。
为了进行验证,发明人选取两个在病例中富集的基因标志物(m482585和m1704941),并利用qPCR检测它们在100个样品(55个病例和45个对照)的子集中的丰度。结果发现,这两个基因各自在两种平台(宏基因组测序平台和qPCR平台)上的定量结果均显示强相关性(Spearman r=0.93–0.95,图11),表明用qPCR检测基因标志物的结果也是可靠的。
接下来,为了在以前未见过的样品中对标志物进行验证,发明人在来自独立中国人群体(第二群体)的164个粪便样品(51个病例,113个对照)中,采用qPCR检测上述两个基因的丰度。结果发现,这两个病例富集的基因标志物与CRC状态显著相关,显著水平为q=6.56x10-9(m1704941,来自F.nucleatum的丁酰辅酶A脱氢酶)和q=0.0011(m482585,来自一种未知微生物的RNA引导DNA聚合酶)。来自F.nucleatum的基因仅出现在113个对照微生物群组中的4个中,表明利用粪便样品开发CRC特异性诊断测试的潜在可能。基于两个病例富集的基因标志物的组合qPCR丰度得到的CRC指数将第二群体中的CRC样品与对照样品分开(Wilcoxon轶和检验,p=4.01x10-7;图12A)。然而,仅使用这两个基因的中等鉴别潜力(由0.73的ROC曲线下面积推断的;图12B),表明另外的生物标志物可改善CRC患者微生物群组的鉴别。
来自P.micra的另一个基因为rpoB基因(即m1696299,相似性为99.78%),该基因是一个高度保守的基因,编码RNA聚合酶β亚基,通常被用作系统进化分析的标志物(F.D.Ciccarelli et al.,Toward automatic reconstruction of a highly resolvedtree of life.Science 311,1283(Mar 3,2006),通过引用并入此处)。由于发明人采用几种策略,包括物种不可知策略,反复鉴定P.micra为一个新的检测CRC的生物标志物,因此,发明人利用上述方法在中国人第二群体中对该基因标志物进行了额外的qPCR分析,结果显示,该基因标志物在CRC患者微生物群组中显著富集(Wilcoxon轶和检验,P=2.15x10-15)。当发明人将该基因与qPCR验证过的两个基因结合时,来自这三个基因的CRC指数在中国人第二群体中清楚地将病例与对照样品分开(Wilcoxon秩和检验,P=5.76x10-13,图13A),并显示出良好的鉴别潜力,ROC曲线下面积改善至0.84(图13B)。从CRC第二阶段开始,来自P.micra的rpoB基因的丰度显著高于对照样品(图13C),这与物种丰度结果相一致,这也为其可以作为诊断早期CRC的非侵入生物标志物提供了更进一步的证据。
三个被选基因标志物所用引物和探针的序列信息
>1696299 正向引物 AAGAATGGAGAGAGTTGTTAGAGAAAGAA
反向引物 TTGTGATAATTGTGAAGAACCGAAGA
探针 AACTCAAGATCCAGACCTTGCTACGCCTCA
>1704941 正向引物 TTGTAAGTGCTGGTAAAGGGATTG
反向引物 CATTCCTACATAACGGTCAAGAGGTA
探针 AGCTTCTATTGGTTCTTCTCGTCCAGTGGC
>482585 正向引物 AATGGGAATGGAGCGGATTC
反向引物 CCTGCACCAGCTTATCGTCAA
探针 AAGCCTGCGGAACCACAGTTACCAGC
表7.CRC患者、T2D患者和IBD患者以及健康对照所估计的CRC指数
表10.与CRC相关的IMG物种和mOTU物种(q值<0.05)
表11.将数目超过100个基因的MLG分组后,当可获得时利用物种注释得到的86个MLG物种列表
表12.IMG物种标志物和mOTU物种标志物。利用随机森林方法从与CRC关联的物种中筛选出来的IMG物种标志物和mOTU物种标志物。物种标志物按照该方法得到的重要性顺序进行排列。
表13.利用随机森林方法从106个基因数目超过100的MLG中挑选出来的21个MLG物种标志物
尽管已示出和描述了说明性实施方案,但本领域技术人员将理解,上述实施方案不应当被理解为对本公开内容进行限制,并且可在不背离本公开内容的精神、原则和范围的情况下进行变化、替换和修改。

Claims (9)

1.一种用于预测受试者中结直肠癌(CRC)风险的基因标志物集,所述基因标志物集由SEQ ID NOs:1-31所示的基因组成。
2.一种用于测定权利要求1所述基因标志物集的试剂盒,其包含根据SEQ ID NOs:1-31所示的基因设计的用于PCR扩增的引物。
3.一种用于测定权利要求1所述基因标志物集的试剂盒,其包含根据SEQ ID NOs:1-31所示的基因设计的一种或多种探针。
4.权利要求1中定义的基因标志物集用于制备预测受试者中结直肠癌(CRC)风险的试剂盒的用途。
5.权利要求1中定义的基因标志物集用于筛选治疗或预防结直肠癌(CRC)的药物的用途。
6.测定SEQ ID NOs:1-31所示的标志物的基因相对丰度的试剂在制备用于诊断受试者是否患有结直肠癌或者是否具有形成结直肠癌的风险的制剂中的用途,所述诊断包括:
a)将粪便样品的DNA测序序列定位到人肠道基因集上,并基于定位结果获得基因谱;
b)测定SEQ ID NOs:1-31所示的每个标志物的基因相对丰度;和
c)利用下列公式计算样品j的指数:
Aij是样品j中标志物i的相对丰度,其中i表示SEQ ID NOs:1-31所示的每一个基因标志物;
N是所有在患者中富集的标志物的子集并且M是所有在对照中富集的标志物的子集;
其中,在结直肠癌中富集的标志物子集和在对照中富集的标志物子集示于表1中;
|N|和|M|分别是这两个子集中生物标志物的数目(大小);
其中当指数大于临界值时,表明受试者具有结直肠癌或者具有形成结直肠癌的风险。
7.如权利要求6所述的用途,其中所述临界值是通过受试者工作特征(ROC)方法获得的,其中所述临界值是当曲线下面积(AUC)达到最大值时对应的值。
8.如权利要求7所述的用途,其中所述临界值为-0.0575。
9.如权利要求6所述的用途,其中所述诊断还包括:
1)收集受试者的粪便样品j并提取样品的DNA;
2)构建DNA文库,并测序以获取测序序列。
CN201480044482.9A 2013-08-06 2014-08-05 结直肠癌生物标志物 Active CN105473738B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201480044482.9A CN105473738B (zh) 2013-08-06 2014-08-05 结直肠癌生物标志物

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN2013080872 2013-08-06
CNPCT/CN2013/080872 2013-08-06
CN201480044482.9A CN105473738B (zh) 2013-08-06 2014-08-05 结直肠癌生物标志物
PCT/CN2014/083663 WO2015018307A1 (en) 2013-08-06 2014-08-05 Biomarkers for colorectal cancer

Publications (2)

Publication Number Publication Date
CN105473738A CN105473738A (zh) 2016-04-06
CN105473738B true CN105473738B (zh) 2018-09-21

Family

ID=55610081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480044482.9A Active CN105473738B (zh) 2013-08-06 2014-08-05 结直肠癌生物标志物

Country Status (1)

Country Link
CN (1) CN105473738B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2661684T3 (es) * 2014-03-03 2018-04-03 Fundacio Institut D'investigació Biomèdica De Girona Dr. Josep Trueta Método para diagnosticar cáncer colorrectal a partir de una muestra de heces humanas mediante PCR cuantitativa
WO2016112488A1 (en) * 2015-01-13 2016-07-21 BGI Shenzhen Co.,Limited Biomarkers for colorectal cancer related diseases
CN107779505B (zh) 2016-08-25 2023-06-06 香港中文大学 结肠直肠癌的粪便细菌标志物
AR110378A1 (es) * 2016-12-15 2019-03-20 Univ College Cork National Univ Of Ireland Cork Métodos para determinar el estado del cáncer colorrectal en una persona
CN108070656B (zh) * 2017-11-13 2021-11-09 深圳华大因源医药科技有限公司 肺癌标志物及其应用
CN109273053B (zh) * 2018-09-27 2021-10-08 华中科技大学鄂州工业技术研究院 一种高通量测序的微生物数据处理方法
CN109762900B (zh) * 2019-01-14 2022-07-29 深圳微健康基因科技有限公司 结直肠癌标志物及其应用
CN109943636B (zh) * 2019-04-11 2020-01-24 上海宝藤生物医药科技股份有限公司 一种结直肠癌微生物标志物及其应用
CN110512015A (zh) * 2019-09-11 2019-11-29 苏州普瑞森基因科技有限公司 一种肠癌生物标志物组合物及其应用
CN110903999B (zh) * 2019-10-23 2021-11-23 上海市第十人民医院 一株人类肠道分离的具核梭杆菌动物亚种菌株及其应用
CN110903998B (zh) * 2019-10-23 2021-09-21 上海市第十人民医院 一株肠道分离的具核梭杆菌文氏亚种菌株及其应用
CN111205994B (zh) * 2019-10-23 2021-09-21 上海市第十人民医院 一株具核梭杆菌动物亚种菌株及其应用
CN112609015A (zh) * 2021-03-08 2021-04-06 天津奇云诺德生物医学有限公司 一种预测结直肠癌风险的微生物标志物及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A human gut microbial gene catalogue established by metagenomic sequencing;Junjie Qin等;《Nature》;20100304;第464卷;59-65 *
Ametagenome-wide association study of gut microbiota in type 2 diabetes;Junjie Qin等;《Nature》;20120926;第490卷;55-60及"补充信息" *
Metagenomic analysis of faecal microbiome as a tool towards targeted non-invasive biomarkers for colorectal cancer;Jun Yu等;《BMJ Journals》;20150925;全文 *

Also Published As

Publication number Publication date
CN105473738A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN105473738B (zh) 结直肠癌生物标志物
US20190367995A1 (en) Biomarkers for colorectal cancer
CN105368944B (zh) 可检测疾病的生物标志物及其用途
Narunsky-Haziza et al. Pan-cancer analyses reveal cancer-type-specific fungal ecologies and bacteriome interactions
Liu et al. Multi-kingdom microbiota analyses identify bacterial–fungal interactions and biomarkers of colorectal cancer across cohorts
CN105473739B (zh) 结直肠癌生物标志物
CN104540962B (zh) 糖尿病生物标志物及其应用
EP3245298B1 (en) Biomarkers for colorectal cancer related diseases
CN104603283B (zh) 确定异常状态相关生物标志物的方法及系统
CN109478231A (zh) 帮助区别良性和恶性放射线照相明显肺结节的方法和组合物
CN105219844B (zh) 一种筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型
CN107075446B (zh) 用于肥胖症相关疾病的生物标记物
CN105986031B (zh) 肿瘤易感62基因及其应用
CN105603101B (zh) 检测8个miRNA表达量的系统在制备诊断或辅助诊断肝细胞癌产品中的应用
CN107208132A (zh) 用于诊断胃肠胰神经内分泌瘤的组合物、方法和试剂盒
CN110283903A (zh) 用于诊断胰腺炎的肠道微生物菌群
CN112609015A (zh) 一种预测结直肠癌风险的微生物标志物及其应用
CN110382718A (zh) 用于指示具有特定特征的个体中的前列腺癌的存在或不存在的方法
Hong et al. Cell-free DNA methylation biomarker for the diagnosis of papillary thyroid carcinoma
WO2016049927A1 (en) Biomarkers for obesity related diseases
D’Adamo et al. Bacterial clade-specific analysis identifies distinct epithelial responses in inflammatory bowel disease
CN108064273A (zh) 结直肠癌相关疾病的生物标志物
CN114736970B (zh) 一种鉴别不同人群的方法
Liu et al. Tools and Resources Enabling Marker Gene–Based Microbiome Studies
WO2024072805A1 (en) Compositions, systems, and methods for detection of ovarian cancer

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1217218

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518083 11F-3, Beishan industrial complex, 146 Beishan Road, Yantian District, Shenzhen, Guangdong

Co-patentee after: Shenzhen Huada Academy of life science

Patentee after: BGI-Shenzhen Co., Ltd.

Address before: 518083 11F-3, Beishan industrial complex, 146 Beishan Road, Yantian District, Shenzhen, Guangdong

Co-patentee before: BGI-Shenzhen

Patentee before: BGI-Shenzhen Co., Ltd.