CN106126893A - 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法 - Google Patents
一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法 Download PDFInfo
- Publication number
- CN106126893A CN106126893A CN201610442551.2A CN201610442551A CN106126893A CN 106126893 A CN106126893 A CN 106126893A CN 201610442551 A CN201610442551 A CN 201610442551A CN 106126893 A CN106126893 A CN 106126893A
- Authority
- CN
- China
- Prior art keywords
- gene
- disease
- risk
- biological
- function related
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Genetics & Genomics (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,这一方法可应用于生物学、医学、药学的相关研究和应用领域。通过锁定流行病学调查发现的疾病发生的高危人群,检测他们在疾病发生前出现的表观遗传变化,通过基因功能网络分析,将疾病发生前出现的表观遗传变化与疾病发生的指标性基因变化联系起来,发现产生疾病风险的长期分子机制,给出针对群体的风险预警、针对个体的风险诊断和预防性干预提供指标和方法。本发明认为长期稳定的生物途径/生物功能改变会在相关基因的表观遗传上留下印记,通过分析表观遗传差异的协同作用,将可能发现慢性疾病发生的生物途径/生物功能水平上的机制。
Description
技术领域
本发明提出一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法及应用,这一方法可应用于生物学、医学、药学的相关研究和应用领域。包括但不限于,复杂慢性疾病的发病机理研究,针对群体或个体的疾病风险预警和预防/干预策略选择,以及为上述目的设计生产相关仪器和耗材。
背景技术
慢性病是指不构成传染、具有长期积累形成疾病形态损害的疾病的总称。一旦防治不及,会造成经济、生命等方面的危害。《中国疾病预防控制工作进展(2015年)报告》显示:慢性病综合防控工作力度虽然逐步加大,但防控形势依然严峻,脑血管病、恶性肿瘤等慢性病已成为主要死因,慢性病导致的死亡人数已占到全国总死亡的86.6%,此前为85%,而导致的疾病负担占总疾病负担的近70%。世界卫生组织调查显示:慢性病的发病原因60%取决于个人的生活方式,同时还与遗传、医疗条件、社会条件和气候等因素有关。尽管人们付出巨大的努力试图了解疾病的病因,然而导致这些慢性疾病的长期分子机制仍然难以捉摸,特别是对于导致这些疾病的外部因素和内部因素复杂相互作用的研究。
表观遗传是指在DNA序列不发生改变的情况下,生物的表型或基因表达发生了稳定的可遗传变化。表观遗传主要包括组蛋白共价修饰、DNA甲基化修饰、染色体重塑及非编码RNA等。在生命发生过程中,表观遗传现象起着极其重要的作用。例如:在形态发生过程中,一个全能干细胞分化形成多种多能干细胞并进一步分化形成各种完全分化的细胞,很大程度上是通过各种表观遗传来选择性的激活或抑制一些基因而完成的;表观遗传的分子机制可以通过DNA和组蛋白的共价修饰,以及包装DNA的蛋白起到作用。例如:DNA的甲基化修饰起到的关键作用包括基因印记及胚胎发育、染色体的结构维持、X染色体失活、转座因子抑制、分化和组织特异性基因表达、和一般基因的调控等。另外,随着细胞逐渐适应人体内部环境和外部环境的改变,表观遗传机制将会通过对基因表达的编程和再次编程过程将这些改变记录下来。有一些证据表明生物对于环境的长期适应可能会导致表观遗传的改变。因此,表观遗传影响深远,作用广泛。
表观遗传变化的检测方法是指随着人们越来越认识到表观遗传在基因表达调控方面的重要性,并开发出一系列检测表观遗传修饰的方法。近年来,表观遗传检测方法取得了较大进展。例如:DNA甲基化检测包括限制性内切酶酶切技术、重亚硫酸盐转换技术、免疫共沉淀技术、单分子实时测序技术、单分子纳米孔测序技术等,以及这些技术和高通量芯片技术的结合;组蛋白修饰检测还可以使用染色质免疫沉淀技术,及其与芯片技术和短序列测序技术的结合等。以上这些检测方法使得研究表观遗传的变化成为可能,本专利可以应用但不限于这些技术,来研究表观遗传变化。
基因功能关联网络分析是指依据不同基因的功能间的关联,把发生变化的基因和它们可能影响的基因关联在一起的一类方法。通过合适的基因功能网络分析,可以把现在发生的基因功能变化关联到将来这一变化可能产生的功能影响上。越来越多的对于模式生物以及人类的研究表明,基因不仅仅是单独的行使功能,而是通过多基因包括与其它相关的DNA、RNA以及相关的分子作用来发挥功能。而且表型上的改变也会引起另一个表型的改变。因此对于基因功能关联网络的研究对于基因发挥作用提供了新的帮助。
“基因集功能关联网络分析”是基因功能网络分析的其中一种有效的方法。基因集关联分析基于一个“匀质功能关联网络”,该网络是整合了多种类型的数据构建而成的,从多种角度描述了基因间的功能关联。这些数据类型包括:共表达数据、结构域相互作用、注释共享、系统发育谱相似,以及其他物种中的同源相互作用。基因集关联分析通过使用两种假设检验的计算方法来检验两个基因集是否存在功能关联。第一个检验检查分属两个基因集的基因之间的功能关联密度是否显著高于背景;第二个检验检查两个基因集之间的高密度功能关联是否只在生物学上正确的网络结构中能够被观察到,而在同样拓扑结构(同样的节点数,每个节点具有同样数目的邻居)的随机网络中无法观察到。
高疾病风险人群是指某些个人的特征或习惯,与慢性病的发生相关,具有高的发病风险。在流行病学调查和医学实践中,发现、理解这些人的分子水平的变化与疾病发生的关系,可能提供疾病发生分子机制的线索,提供疾病预警、个体化风险诊断、预防性干预的手段。例如:1990年,Barker提出“成年人疾病胎源说”,即成年的慢性疾病与胚胎及新生儿的早期发育相关。相比于出生后,胎儿的宫内阶段是一个独特并且敏感的时期,许多重要的发育都在此阶段发生。一个人的胎儿时期宫内状况是其最早的“生活形式”,可能在慢性疾病的形成中发挥重要的作用。现在,大量流行病学的证据都表明了出生时的一些因素(如:出生体重)与慢性疾病(如:葡萄糖不耐受、糖尿病、高血压、心血管疾病、智力发育迟滞、自闭症等)的关联。因此,出生低体重人群可以成为研究这些慢性病发病机制的目标人群。然而,这其中可以长期起作用并改变成年以后的疾病风险的分子机制仍不清楚。
发明内容
本发明建立了一套方法,通过锁定流行病学调查发现的疾病发生的高危人群,检测他们在疾病发生前出现的表观遗传变化,通过基因功能网络分析,将疾病发生前出现的表观遗传变化与疾病发生的指标性基因变化联系起来,可以发现产生疾病风险的长期分子机制,给出针对群体的风险预警、针对个体的风险诊断和预防性干预提供指标和方法。
本发明是通过以下技术方案来实现的:
本发明公开了一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,通过锁定流行病学调查发现的疾病发生的高危人群,检测他们在疾病发生前出现的表观遗传变化,通过基因功能网络分析,将疾病发生前出现的表观遗传变化与疾病发生的指标性基因变化联系起来,发现产生疾病风险的长期分子机制,给出针对群体的风险预警、针对个体的风险诊断和预防性干预提供指标和方法。
作为进一步地改进,本发明的具体步骤如下:
1)、找到高慢性疾病发病风险人群,或通过大样本收集和长期追踪获得慢性病发病者发病前的早期生物样本;
2)、分析高风险人群或发病人群早期样本与正常人群的表观遗传学差异,找到具有表观遗传差异的基因集合;
3)、在基因功能关联网络中分析差异基因集的功能协同,找到差异基因集所共同指向的生物途径/生物功能差异;
4)、依据分子机制提出疾病风险预警、风险诊断、预防性干预的手段,设计实验验证。
作为进一步地改进,本发明所述的步骤1)具体包括以下步骤:
1.1、收集慢性病的流行病学调查数据;
1.2、根据步骤1收集的数据,得到具有某些行为特征或生活习惯的人群有高发病风险,并将这些高发病风险人群作为研究的目标人群;
1.3、针对步骤1.2得到的目标人群,收集目标人群发病前的早期生物样本。
作为进一步地改进,本发明所述的步骤1.1是针对会引起慢性病发病的因素的流行病学调查,或是流行病学中的临床试验或观察性研究;所述的步骤1.2是以统计检验的P-value,Odds Ratio,Risk Ratio,Hazard Ratio,Absolute Risk,Attributable Risk等指标作为患病风险人群的判断依据;所述的步骤1.3是在发病前收集目标人群的脐带血或静脉血等可获得遗传信息的生物样本。
作为进一步地改进,本发明所述的步骤2)具体包括以下步骤:
2.1、对步骤1)得到的生物样本分组比较,将高发病风险人群的设为实验组,另取正常人群设为对照组;
2.2、通过表观遗传检测技术检测生物样本的表观遗传变化;
2.3、针对步骤2.2得到的表观遗传变化,用统计检验找出实验组和对照组差异的基因集合。
作为进一步地改进,本发明所述的步骤2.2中的表观遗传变化是DNA甲基化检测或组蛋白修饰检测或染色体重塑或非编码RNA,DNA甲基化检测是限制性内切酶酶切技术、重亚硫酸盐转换技术、免疫共沉淀技术、单分子实时测序技术、单分子纳米孔测序技术、以及以上与高通量芯片技术的结合中的任意一种;组蛋白修饰检测是使用染色质免疫沉淀技术,或与芯片技术和短序列测序技术的结合;所述的步骤2.3中,统计检验使用找出两组差异的参数检验或非参数检验。
作为进一步地改进,本发明所述的步骤3)具体包括以下步骤:
3.1、对步骤2)得到的差异基因集合,选择合适的基因功能关联网络;
3.2、在基因功能关联网络中,分析差异基因集的功能协同,找到差异基因集所共同指向的生物途径/生物功能差异。
步骤3.1,用于基因功能关联网络分析的网络数据是蛋白质相互作用网络或基因共表达网络或匀质基因功能关联网络;所述的步骤3.2,用与基因功能关联网络分析工具主要是基于网络预测基因功能或基于网络基因集合分析。
作为进一步地改进,本发明所述的步骤4)具体包括如下步骤:
4.1、依据步骤3)得到的生物途径/生物功能,从整体层面分析,找到一条或多条最主要的途径,即分子机制;
4.2、根据步骤4.1得到的分子机制提出可干预的疾病风险预警、风险诊断、预防性干预的手段;
4.3、设计实验验证该结果的正确性。
作为进一步地改进,本发明所述的步骤4.1,对找到的生物途径/生物功能,通过查阅文献,分析之间的相互联系,再编制网络,从整体层面分析,找到最基本的找到一条或多条最主要的途径;所述的步骤4.2,分子机制作为最基本的生物途径/生物功能,在疾病发生前检测出异常,用于对疾病的风险预警和风险诊断;或进行基于生物途径的药物干预,起到慢性病预防性干预的效果,所述的步骤4.3,设计实验对表观遗传差异的基因水平进行实验验证,对找到的分子机制水平验证,与现有文献相合性验证等验证该结果的正确性。
作为进一步地改进,通过本发明的方法对于低出生体重增加成年疾病风险的机制分析,发现干扰素-γ响应过敏是造成长期二型糖尿病风险升高的因素,可用于设计风险诊断方法和主动风险干预方法。
本发明的有益效果如下:
1)、一直以来,慢性病由于外部因素和内部因素的复杂相互作用,使得慢性病的长期分子机制的研究仍然难以捉摸。而生物在形态发生过程中或者对于环境的长期适应中,可能会导致表观遗传的改变,表观遗传影响深远,作用广泛。
本发明从表观遗传变化作为突破口研究慢性长期作用的分子机制,具有比平常的研究单个基因的突变有更科学的立足点。
2)、完成一个生物途径/生物功能需要很多生物大分子的协同,因此有很多不同种类的分子缺陷会产生类似的生物途径/生物功能改变。因此,同一慢性疾病即使具有类似的生物途径/生物功能发病机制,每个病患个体的病因在单个分子的水平上也可能有很大差别。通过在分子水平上研究大量病例很难找到统一的慢性疾病发病机制。
本发明认为长期稳定的生物途径/生物功能改变会在相关基因的表观遗传上留下印记,通过分析表观遗传差异的协同作用,将可能发现慢性疾病发生的生物途径/生物功能水平上的机制。
3)、通过基因功能关联网络找到的生物途径/生物功能,往往是多条或广泛的生物途径/生物功能,难以应用在对疾病的干预和诊断中。
本发明认为还需要通过分析生物途径/生物功能之间的相互联系,再编制网络,从整体层面分析,找到最基本的找到一条或多条最主要的途径。而分子机制作为最基本的生物途径/生物功能,在疾病发生前检测出异常,用于对疾病的风险预警和风险诊断;或进行基于生物途径的药物干预,起到慢性病预防性干预的效果。
4)、本发明将基于匀质基因功能关联网络的基因集功能关联分析方法(GSLA)用于分析表观遗传变化协同指向的生物途径/生物功能改变,并用具体实例显示了其有效性。
5)、本发明的具体应用,通过对于低出生体重增加成年疾病风险的机制分析,发现干扰素-γ响应过敏是造成长期二型糖尿病风险升高的因素,可以用于设计风险诊断方法(试剂)和主动风险干预方法。
具体实施方式
本发明提出:慢性疾病发生的最重要的原因是外部因素和内部因素复杂的相互作用。这一相互作用应理解为生物途径/生物功能水平的特异性:高疾病风险的人群在生物途径/生物功能的水平上与普通人群有所差异,导致对于外部因素和环境的响应不同,逐步诱发疾病。
这一理解产生两个推论:
一,完成一个生物途径/生物功能需要很多生物大分子的协同,因此有很多不同种类的分子缺陷会产生类似的生物途径/生物功能改变。因此,同一慢性疾病即使具有类似的生物途径/生物功能发病机制,每个病患个体的病因在单个分子的水平上也可能有很大差别。通过在分子水平上研究大量病例很难找到统一的慢性疾病发病机制。
二,长期稳定的生物途径/生物功能改变会在相关基因的表观遗传上留下印记,通过分析表观遗传差异的协同作用,将可能发现慢性疾病发生的生物途径/生物功能水平上的机制。
为实现从生物途径/生物功能角度解析慢性病发病机制的目标,本发明提出如下步骤:
1)、找到高慢性疾病发病风险人群,或通过大样本收集和长期追踪获得慢性病发病者发病前的早期生物样本。
2)、分析高风险人群或发病人群早期样本与正常人群的表观遗传学差异,找到具有表观遗传差异的基因集合。
3)、在基因功能关联网络中分析差异基因集的功能协同,找到差异基因集所共同指向的生物途径/生物功能差异。
4)、依据分子机制提出疾病风险预警、风险诊断、预防性干预的手段,设计实验验证。
步骤一具体包括以下步骤:
1.1、收集慢性病的流行病学调查数据。
1.2、根据步骤1收集的数据,得到具有某些行为特征或生活习惯的人群有高发病风险。并将这些高发病风险人群作为研究的目标人群。
1.3、针对步骤2得到的目标人群。收集目标人群发病前的早期生物样本。
流行病学是研究人群中疾病与健康状况分布及其影响因素,并研究防治疾病及促进健康的策略和措施的科学。根据流行病学调查可以发现某些个人的特征或习惯,与慢性病的发生相关,具有高的发病风险。流行病学可以应用于锁定所要研究的高疾病风险的人群。
针对步骤1.1,针对会引起慢性病发病的因素的流行病学调查。可以是流行病学中的临床试验或观察性研究。
针对步骤1.2,可以以统计检验的P-value,Odds Ratio,Risk Ratio,HazardRatio,Absolute Risk,Attributable Risk等指标作为患病风险人群的判断依据。针对步骤1.3,可以在发病前收集目标人群的脐带血或静脉血等可获得遗传信息的生物样本。
步骤二具体包括以下步骤:
2.1、对步骤一得到的生物样本分组比较,将高发病风险人群的设为实验组,另取正常人群设为对照组。
2.2、通过表观遗传检测技术检测生物样本的表观遗传变化。
2.3针对步骤2得到的表观遗传变化,用统计检验找出实验组和对照组差异的基因集合。
表观遗传变化,主要包括组蛋白共价修饰、DNA甲基化修饰、染色体重塑及非编码RNA等。可以由限制性内切酶酶切技术、重亚硫酸盐转换技术、免疫共沉淀技术等手段检测。
针对步骤2.2,表观遗传变化的检测中,表观遗传变化是DNA甲基化检测或者组蛋白修饰检测,DNA甲基化检测包括限制性内切酶酶切技术、重亚硫酸盐转换技术、免疫共沉淀技术、单分子实时测序技术、单分子纳米孔测序技术等,以及这些技术和高通量芯片技术的结合;组蛋白修饰检测还可以使用染色质免疫沉淀技术,及其与芯片技术和短序列测序技术的结合等。表观遗传变化,除了上述举例的DNA甲基化修饰和组蛋白共价修饰外,还包括染色体重塑及非编码RNA等,均可以以恰当的手段检测。
针对步骤2.3,统计检验可以使用找出两组差异的参数检验或非参数检验。可以使用不止一个统计检验互补,排除协变量等其他干扰因素,得到差异的基因集合。
步骤三具体包括以下步骤:
3.1、对步骤二得到的差异基因集合,选择合适的基因功能关联网络。
3.2、在基因功能关联网络中,分析差异基因集的功能协同,找到差异基因集所共同指向的生物途径/生物功能差异。
基因功能关联网络分析,指将功能相关的基因连接在一起,用于分析基因功能协同的网络数据集合,例如蛋白质相互作用网络,基因共表达网络、匀质基因功能关联网络等。通过合适的基因功能关联网络分析,可以把现在发生的基因功能变化关联到将来这一变化可能产生的功能影响上。
针对步骤3.1,可用于基因功能关联网络分析的网络数据包括,例如蛋白质相互作用网络,基因共表达网络、匀质基因功能关联网络等,具体如IntAct,BioGRID,HPRD,MINT和HIR等。
针对步骤3.2,可用与基因功能关联网络分析工具主要包括,基于网络预测基因功能和基于网络基因集合分析等,具体如GWAS,AEA,GSEA和GSLA等。
步骤四具体包括以下步骤:
4.1、依据步骤三得到的生物途径/生物功能,从整体层面分析,找到一条或多条最主要的途径(即:分子机制)
4.2、根据步骤4.1得到的分子机制提出可干预的疾病风险预警、风险诊断、预防性干预的手段。
4.3、设计实验验证该结果的正确性。
针对步骤4.1,可以对找到的生物途径/生物功能,通过查阅文献,分析之间的相互联系,再编制网络,从整体层面分析,找到最基本的找到一条或多条最主要的途径(即:分子机制)。
针对步骤4.2,分子机制作为最基本的生物途径/生物功能,可以在疾病发生前检测出异常,用于对疾病的风险预警和风险诊断;也可以进行基于生物途径的药物干预,起到慢性病预防性干预的效果。
针对步骤4.3,设计实验可以对表观遗传差异的基因水平进行实验验证;对找到的分子机制水平验证;与现有文献相合性验证等验证该结果的正确性。
下面通过具体实施例子对本发明的技术方案作进一步地说明:
实施例1:出生低体重导致成年慢性疾病风险的生物途径/生物功能机制
大量流行病学研究表明了出生体重偏轻(LBW)与葡萄糖不耐受、糖尿病、高血压、心血管疾病、智力发育迟滞、自闭症等成年疾病风险相关,然而这其中所涉及的分子机制尚不明确。
1)、找到高慢性疾病发病风险人群,获得慢性病发病者发病前的早期生物样本。
流行病学调查数据:
大量流行病学研究表明了出生体重偏轻(LBW)与葡萄糖不耐受、糖尿病、高血压、心血管疾病、智力发育迟滞、自闭症等成年疾病风险相关。
目标人群确定:
我们认为为了得出葡萄糖不耐受、糖尿病、高血压、心血管疾病、智力发育迟滞、自闭症等成年疾病发病的机制,需要研究的目标人群是出生低体重的人群。
生物样本获得:
在胎儿出生时立刻收集脐带血,分离得到脐带血单核细胞,并提取其DNA。
2)、分析高风险人群或发病人群早期样本与正常人群的表观遗传学差异,找到具有表观遗传差异的基因集合。
实验组和对照组设计:
我们设计研究四对同卵双胎样本。分别为两对男性和两对女性。其中有两对同卵双胎样本——一对男性和一对女性样本,表现出显著的出生体重不一致性(双胎出生时体重之差>20%);另外两对同卵双胎样本并未表现出明显的出生体重不一致(双胎出生时体重之差<5%)。同卵双胎的设计可以控制由于个体环境和基因型的差异造成的影响。同卵双胎的基因是相同的,具有相同的胎龄,并一同承受产妇的健康风险。同卵双胎的相互对照,可以减少所需研究样本的数量,找到真正由于出生体重的差异而导致的表观遗传的差异。
通过表观遗传检测技术检测生物样本的表观遗传变化:
对提取到的DNA样本,使用DNA甲基化免疫共沉淀测序技术,分析样本DNA的甲基化水平。
用统计检验找出实验组和对照组差异的基因集合:
我们利用同卵双胎的优势,通过两个互补的统计检验——假设检验Q1检查特定区域的甲基化水平是否在较轻的胎儿和较重的胎儿间存在组间差异;假设检验Q2检查特定区域的甲基化差异是否在出生体重有差异的双胎中大于在出生体重没有差异的双胎中。排除遗传背景差异基因——选取Q2检验的P值小于0.03的基因,同时满足与出生体重相关的启动子区域甲基化差异最显著的基因——Q1检验的P值最小的前50个基因(见附加数据:1.50个差异甲基化基因)。通过文献检索发现其中至少有18个基因已知与以上这些成年疾病风险有关联。并且,这其中许多基因同时与多种成年疾病风险相关联,这暗示了出生体重偏轻可能是一种可以导致复杂的健康状况的整体性风险因素。
3)、在基因功能关联网络中分析差异基因集的功能协同,找到差异基因集所共同指向的生物途径/生物功能差异。
选择合适的基因功能关联网络:
我们选择人类的匀质基因功能关联网络(HIR,http://www.cls.zju.edu.cn/hir/)
分析差异基因集的功能协同,找到差异基因集所共同指向的生物途径/生物功能差异:
进行基因功能关联网络分析,我们使用“基因集关联分析”工具(GSLA,网址:http://www.cls.zju.edu.cn/hir/faces/home.xhtm),从整体的角度得到与这些差异甲基化基因在功能上相关联的生物途径(见附加数据:2.差异甲基化基因功能相关的生物途径)。这10个生物途径可以归类为四个主题:“干扰素-γ介导的免疫反应”,“内分泌胰腺发育”,“神经发育”和“翻译调控”。而文献的证据证明其中“IFN-γ介导的免疫反应”生物主题与上文中提到的除了智力发育迟滞之外的所有LBW相关的成年疾病风险均有关。其他主题的生物途径同样也对应了已知的出生体重偏轻相关的生理特征。“内分泌胰腺发育”意味着胰岛的结构和功能发生了改变,这可以在LBW的动物模型中观察到。“神经发育”意味着学习能力减弱,这符合LBW群体在儿童期智力低下的风险增高这一现象。“翻译调控”意味着蛋白质合成改变,这与“低出生体重”这一表型本身相符。步骤二中阐述的18个已知与出生体重偏轻的疾病风险相关的差异甲基化的基因,其中有11个基因(附加数据表1加粗部分)与上述生物途径存在基因间的功能关联。
4)、依据分子机制提出疾病风险预警、风险诊断、预防性干预的手段,设计实验验证。
分子机制及风险预警指标的分析:
在得出的关联的生物途径中编制网络,得出“干扰素-γ介导的免疫反应过敏”这一生物途径已知与大部分出生低体重相关的成年疾病风险都有关联。其是一个疾病风险预警、风险诊断、预防性干预的指标。
设置实验验证:
在独立的单胎样本中,我们分别从三个水平:基础数据水平(差异基因的DNA甲基化情况和转录情况)、结论的分子机制水平(血清细胞因子水平)以及与目前文献的相合性水平进行验证。
1.基础数据水平DNA甲基化水平验证:我们共使用了12个单胎样本,这些样本按照相同怀孕周数胎儿体重分布生长曲线族群分成低体重组(体重小于10%)、正常体重组(体重介于10%-90%)、高体重组(体重大于90%),每组各两个男,两个女样本。收集胎儿分离得到脐带血单核细胞,并提取其DNA,使用靶向重亚硫酸盐测序的方法,对步骤三得出的11个差异甲基化基因启动子区域片段(DMPR)进行验证,得到11个DMPRs上每一个胞嘧啶位点的甲基化率,并计算出这些DMPRs的平均甲基化率。接着对这些样本进行聚类分析,结果发现:低/正常/高组样本自然地聚集在了一起。这一结果表明,在独立单胎样本中,我们所验证的区域的相对甲基化水平,能够反映出生体重差异。转录水平验证:我们共使用了60个单胎样本。这些样本按照常用标准分成低体重组、正常体重组。收集胎儿分离得到脐带血单核细胞,并提取其RNA,使用实时定量PCR测量,我们的结果发现11个差异甲基化的基因有8个(73%)表现出显著的表达变化(p<0.05,Mann-Whitney U test)。其中6个差异甲基化的基因(55%)表现出显著的表达量变化与甲基化变化负相关。
2.水平以及结论的分子机制水平。我们对32个样本使用ELISA的方法检测2种细胞因子(干扰素-γ和其下游因子IP10)的水平;同时使用10个样本测量免疫刺激后8种细胞因子的转录水平。结果发现:许多样本的干扰素-γ水平低于我们实验可测量的范围,因此无法对其进行比较。然而,我们确实发现IP-10水平在LBW胎儿中有显著的升高(p=0.0098,Mann-Whitney U test)。IP-10是干扰素-γ下游的一种趋化因子。它的升高表明,在LBW胎儿中干扰素-γ介导的免疫反应可能发生了基准水平的激活;另外,在免疫刺激后,使用实时定量PCR测量,我们观察到LBW样本中干扰素-γ和IP-10的转录水平显著升高(p<0.01,Mann-Whitney U test)。而其他细胞因子的应答反应未观察到不同体重组间的显著差异。
3.与目前文献的相合性
文献证明:我们找到的其中五个差异基因(RFX3,LEPR,GLIS3,MC3R和ZBTB20)在功能上与葡萄糖不耐受相关。
文献证明:我们找到的其中三个基因(LEPR、GLIS3和ZBTB20)的功能与二型糖尿病相关。
文献证明:我们找到的其中两个基因(LEPR和MC3R)的功能与高血压有关。
文献证明:我们找到的其中六个基因(RFX3、NRXN3、PDE4D、MYT1L和MAP2)在功能上与心血管疾病相关。
文献证明:我们找到的其中有五个基因(RFX3、NRXN3、PDE4D、MYT1L和MAP2)在功能上与智力发育迟滞相关。
文献证明:我们找到的其中有八个基因(PPP2R2B、RNF19A、NRXN3、NLGN4X、PDE4、MYT1L、ZBTB20和PLCB4)已知与自闭症有功能上的相关性。
文献证明:我们找到的其中有四个基因(RFX3、TRAF3IP2、BACH2和GLIS3)在功能上与一型糖尿病有关。
分别有文献证明:干扰素-γ过敏可以促使葡萄糖不耐受、一型糖尿病、高血压、心血管疾病和自闭症等疾病发生,同时可以预防一型糖尿病的发生,也可能与智力发育迟滞相关。
以上结果证明了本发明的正确性。干扰素-γ过敏可以从整体上解释LBW相关的健康风险的改变,这些健康风险基本上是慢性疾病。我们的研究增进了目前对慢性疾病病因学的了解,并且将以下三个受到广泛关注的方面联系起来:慢性疾病的病因说、表观遗传调控机制和免疫相关疾病。所发现的干扰素-γ响应过敏机制可以用于生产风险诊断试剂盒或生产定向主动干预疾病风险的药剂。
附加数据
1.50个差异甲基化基因
a 差异甲基化启动子片段的中心碱基位置
b +/-表示甲基化水平以出生体重偏高组为参照的改变方向
c GluIn:葡萄糖不耐受,T1Dia:一型糖尿病,T2Dia:二型糖尿病,Hten:高血压,CarD:心血管疾病,IntelD:智力发育迟滞,Auti:自闭症,Immu:免疫调节。
2.差异甲基化基因功能相关的生物途径
a 相互密度反应了DMGs和生物途径之间的功能联系的整体强度。
b P-value反映了功能相互作用的生物学显著性。
c 注释在该条生物途径中的DMGs称为重叠的DMGs。
d 与该条生物途径中包含的基因有相互作用的DMGs称为相互作用的DMGs。
以上所述的仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明核心技术特征的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,通过锁定流行病学调查发现的疾病发生的高危人群,检测他们在疾病发生前出现的表观遗传变化,通过基因功能网络分析,将疾病发生前出现的表观遗传变化与疾病发生的指标性基因变化联系起来,发现产生疾病风险的长期分子机制,给出针对群体的风险预警、针对个体的风险诊断和预防性干预提供指标和方法。
2.根据权利要求1所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,具体步骤如下:
1)、找到高慢性疾病发病风险人群,或通过大样本收集和长期追踪获得慢性病发病者发病前的早期生物样本;
2)、分析高风险人群或发病人群早期样本与正常人群的表观遗传学差异,找到具有表观遗传差异的基因集合;
3)、在基因功能关联网络中分析差异基因集的功能协同,找到差异基因集所共同指向的生物途径/生物功能差异;
4)、依据分子机制提出疾病风险预警、风险诊断、预防性干预的手段,设计实验验证。
3.根据权利要求2所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,所述的步骤1)具体包括以下步骤:
1.1、收集慢性病的流行病学调查数据;
1.2、根据步骤1收集的数据,得到具有某些行为特征或生活习惯的人群有高发病风险,并将这些高发病风险人群作为研究的目标人群;
1.3、针对步骤1.2得到的目标人群,收集目标人群发病前的早期生物样本。
4.根据权利要求3所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,所述的步骤1.1是针对会引起慢性病发病的因素的流行病学调查,或是流行病学中的临床试验或观察性研究;所述的步骤1.2是以统计检验的P-value,OddsRatio,Risk Ratio,Hazard Ratio,Absolute Risk,Attributable Risk等指标作为患病风险人群的判断依据;所述的步骤1.3是在发病前收集目标人群的脐带血或静脉血等可获得遗传信息的生物样本。
5.根据权利要求2或3或4所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,所述的步骤2)具体包括以下步骤:
2.1、对步骤1)得到的生物样本分组比较,将高发病风险人群的设为实验组,另取正常人群设为对照组;
2.2、通过表观遗传检测技术检测生物样本的表观遗传变化;
2.3、针对步骤2.2得到的表观遗传变化,用统计检验找出实验组和对照组差异的基因集合。
6.根据权利要求5所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,所述的步骤2.2中的表观遗传变化是DNA甲基化检测或组蛋白修饰检测或染色体重塑或非编码RNA,所述的DNA甲基化检测是限制性内切酶酶切技术、重亚硫酸盐转换技术、免疫共沉淀技术、单分子实时测序技术、单分子纳米孔测序技术、以及以上与高通量芯片技术的结合中的任意一种;所述的组蛋白修饰检测是使用染色质免疫沉淀技术,或与芯片技术和短序列测序技术的结合;所述的步骤2.3中,统计检验使用找出两组差异的参数检验或非参数检验。
7.根据权利要求2或6所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,所述的步骤3)具体包括以下步骤:
3.1、对步骤2)得到的差异基因集合,选择合适的基因功能关联网络;
3.2、在基因功能关联网络中,分析差异基因集的功能协同,找到差异基因集所共同指向的生物途径/生物功能差异。
所述步骤3.1,用于基因功能关联网络分析的网络数据是蛋白质相互作用网络或基因共表达网络或匀质基因功能关联网络;所述的步骤3.2,用与基因功能关联网络分析工具主要是基于网络预测基因功能或基于网络基因集合分析。
8.根据权利要求7所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,所述的步骤4)具体包括如下步骤:
4.1、依据步骤3)得到的生物途径/生物功能,从整体层面分析,找到一条或多条最主要的途径,即分子机制;
4.2、根据步骤4.1得到的分子机制提出可干预的疾病风险预警、风险诊断、预防性干预的手段;
4.3、设计实验验证该结果的正确性。
9.根据权利要求8所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,所述的步骤4.1,对找到的生物途径/生物功能,通过查阅文献,分析之间的相互联系,再编制网络,从整体层面分析,找到最基本的找到一条或多条最主要的途径;所述的步骤4.2,分子机制作为最基本的生物途径/生物功能,在疾病发生前检测出异常,用于对疾病的风险预警和风险诊断;或进行基于生物途径的药物干预,起到慢性病预防性干预的效果,所述的步骤4.3,设计实验对表观遗传差异的基因水平进行实验验证,对找到的分子机制水平验证,与现有文献相合性验证等验证该结果的正确性。
10.根据权利要求1或2或3或4或6或8或9所述的基于基因功能关联网络发现慢性病机制及其预警干预策略的方法,其特征在于,通过此方法对于低出生体重增加成年疾病风险的机制分析,发现干扰素-γ响应过敏是造成长期二型糖尿病风险升高的因素,可用于设计风险诊断方法和主动风险干预方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610442551.2A CN106126893B (zh) | 2016-06-17 | 2016-06-17 | 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610442551.2A CN106126893B (zh) | 2016-06-17 | 2016-06-17 | 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106126893A true CN106126893A (zh) | 2016-11-16 |
CN106126893B CN106126893B (zh) | 2018-12-21 |
Family
ID=57469862
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610442551.2A Active CN106126893B (zh) | 2016-06-17 | 2016-06-17 | 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106126893B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108461155A (zh) * | 2018-02-26 | 2018-08-28 | 玉溪市疾病预防控制中心 | 一种关于伤寒与副伤寒肠道传染病疫情的精准控制方法 |
CN109192316A (zh) * | 2018-07-02 | 2019-01-11 | 杭州师范大学 | 一种基于基因网络分析的疾病亚型预测系统 |
CN110379459A (zh) * | 2019-08-13 | 2019-10-25 | 杭州新范式生物医药科技有限公司 | 一种基于转录组时序动态变化和基因功能关联发现分子标志物的方法及系统 |
CN110428867A (zh) * | 2019-07-30 | 2019-11-08 | 中国科学院心理研究所 | 一种人类大脑基因时空表达模式在线分析系统及其方法 |
CN111128377A (zh) * | 2019-11-26 | 2020-05-08 | 泰康保险集团股份有限公司 | 健康管理预警方法、装置、电子设备、存储介质 |
CN111261243A (zh) * | 2020-01-10 | 2020-06-09 | 华南理工大学 | 一种基于相对熵指标检测复杂生物系统相变临界点的方法 |
TWI709904B (zh) * | 2019-11-26 | 2020-11-11 | 國立中央大學 | 訓練類神經網路以預測個體基因表現特徵的方法及系統 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102086473A (zh) * | 2010-05-12 | 2011-06-08 | 天津市泌尿外科研究所 | 人类多基因疾病关键基因的无向网络筛选方法 |
CN104156503A (zh) * | 2014-07-21 | 2014-11-19 | 金华市中心医院 | 一种基于基因芯片网络分析的疾病风险基因识别方法 |
-
2016
- 2016-06-17 CN CN201610442551.2A patent/CN106126893B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102086473A (zh) * | 2010-05-12 | 2011-06-08 | 天津市泌尿外科研究所 | 人类多基因疾病关键基因的无向网络筛选方法 |
CN104156503A (zh) * | 2014-07-21 | 2014-11-19 | 金华市中心医院 | 一种基于基因芯片网络分析的疾病风险基因识别方法 |
Non-Patent Citations (3)
Title |
---|
XI ZHOU ET AL.: "Human interactome resource and gene set linkage analysis for the functional interpretation of biologically meaningful gene sets", 《DATABASES AND ONTOLOGIES》 * |
田瑶: "生物组学时代的候选基因与慢性病关联研究初探", 《中国优秀硕士学位论文全文数据库 医药卫生科技辑》 * |
陈鹏程: "人类分子相互作用在线资源及多物种的基因集功能关联分析工具的建立", 《中国博士学位论文全文数据库 基础科学辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108461155B (zh) * | 2018-02-26 | 2021-09-17 | 云南省疾病预防控制中心 | 一种关于伤寒与副伤寒肠道传染病疫情的精准控制方法 |
CN108461155A (zh) * | 2018-02-26 | 2018-08-28 | 玉溪市疾病预防控制中心 | 一种关于伤寒与副伤寒肠道传染病疫情的精准控制方法 |
CN109192316B (zh) * | 2018-07-02 | 2021-09-07 | 杭州师范大学 | 一种基于基因网络分析的疾病亚型预测系统 |
CN109192316A (zh) * | 2018-07-02 | 2019-01-11 | 杭州师范大学 | 一种基于基因网络分析的疾病亚型预测系统 |
CN110428867A (zh) * | 2019-07-30 | 2019-11-08 | 中国科学院心理研究所 | 一种人类大脑基因时空表达模式在线分析系统及其方法 |
CN110428867B (zh) * | 2019-07-30 | 2021-09-17 | 中国科学院心理研究所 | 一种人类大脑基因时空表达模式在线分析系统及其方法 |
CN110379459B (zh) * | 2019-08-13 | 2021-06-29 | 杭州新范式生物医药科技有限公司 | 一种基于转录组时序动态变化和基因功能关联发现分子标志物的方法及系统 |
CN110379459A (zh) * | 2019-08-13 | 2019-10-25 | 杭州新范式生物医药科技有限公司 | 一种基于转录组时序动态变化和基因功能关联发现分子标志物的方法及系统 |
TWI709904B (zh) * | 2019-11-26 | 2020-11-11 | 國立中央大學 | 訓練類神經網路以預測個體基因表現特徵的方法及系統 |
CN111128377A (zh) * | 2019-11-26 | 2020-05-08 | 泰康保险集团股份有限公司 | 健康管理预警方法、装置、电子设备、存储介质 |
CN111128377B (zh) * | 2019-11-26 | 2023-08-22 | 泰康保险集团股份有限公司 | 健康管理预警方法、装置、电子设备、存储介质 |
CN111261243A (zh) * | 2020-01-10 | 2020-06-09 | 华南理工大学 | 一种基于相对熵指标检测复杂生物系统相变临界点的方法 |
CN111261243B (zh) * | 2020-01-10 | 2023-04-21 | 华南理工大学 | 一种基于相对熵指标检测复杂生物系统相变临界点的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106126893B (zh) | 2018-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106126893B (zh) | 一种基于基因功能关联网络发现慢性病机制及其预警干预策略的方法 | |
Chaijarasphong et al. | The shrimp microsporidian Enterocytozoon hepatopenaei (EHP): Biology, pathology, diagnostics and control | |
Klump et al. | Genetic and environmental influences on disordered eating: An adoption study. | |
Muratori et al. | DNA fragmentation in brighter sperm predicts male fertility independently from age and semen parameters | |
CN110100013A (zh) | 用于肿瘤检测的方法和系统 | |
CN105296590B (zh) | 大肠癌标志物及其应用 | |
Modesto-Lowe et al. | Attention-deficit/hyperactivity disorder: a shift toward resilience? | |
CN109642259A (zh) | 使用肿瘤教育的血小板的针对癌症的群智能增强的诊断和治疗选择 | |
Rondy et al. | Norovirus disease associated with excess mortality and use of statins: a retrospective cohort study of an outbreak following a pilgrimage to Lourdes | |
CN108601776A (zh) | 诊断和治疗行为障碍的方法 | |
Okada et al. | Common genetic factors for hematological traits in humans | |
García-Martín et al. | Multigene phylogeny of the order Physarales (Myxomycetes, Amoebozoa): shedding light on the dark-spored clade | |
CN115798586A (zh) | 基于多基因突变的vte风险评估模型、构建方法及应用 | |
Henderson | Childhood asthma phenotypes in the twenty-first century | |
Zachar | Real kinds but no true taxonomy | |
Porcher et al. | Two major spondylarthropathy phenotypes are distinguished by pattern analysis in multiplex families | |
CN109642256A (zh) | 作为用于情绪障碍测试的生物标志物的rna编辑 | |
Almanaseer et al. | An Approach to the Investigation of Thrombocytosis: Differentiating between Essential Thrombocythemia and Secondary Thrombocytosis | |
Bansal et al. | Advances in asthma genetics | |
Sarr et al. | In vivo and in vitro analysis of chloroquine resistance in Plasmodium falciparum isolates from Senegal | |
Couturier et al. | Single-cell RNA-seq reveals that glioblastoma recapitulates normal brain development | |
Kalmbach et al. | Signature morpho-electric, transcriptomic, and dendritic properties of extratelencephalic-projecting human layer 5 neocortical pyramidal neurons | |
CN110396538A (zh) | 偏头痛生物标志物及其用途 | |
CN108060220A (zh) | 弓形虫慢性感染雄性小鼠生殖系统靶标基因的鉴定及其在临床上的应用 | |
JP2011004743A (ja) | 関節リウマチ患者におけるインフリキシマブ薬効の有効性を判別する方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |