CN111341448A - 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 - Google Patents
一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 Download PDFInfo
- Publication number
- CN111341448A CN111341448A CN202010139836.5A CN202010139836A CN111341448A CN 111341448 A CN111341448 A CN 111341448A CN 202010139836 A CN202010139836 A CN 202010139836A CN 111341448 A CN111341448 A CN 111341448A
- Authority
- CN
- China
- Prior art keywords
- analysis
- metabolites
- mendelian
- citric acid
- metabolite
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000002207 metabolite Substances 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 title claims abstract description 74
- 201000010099 disease Diseases 0.000 title claims abstract description 55
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 55
- 230000000694 effects Effects 0.000 claims abstract description 43
- 239000008280 blood Substances 0.000 claims abstract description 41
- 210000004369 blood Anatomy 0.000 claims abstract description 41
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 238000011160 research Methods 0.000 claims abstract description 30
- 238000012216 screening Methods 0.000 claims abstract description 16
- 238000010206 sensitivity analysis Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims abstract description 8
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 claims description 178
- 235000015165 citric acid Nutrition 0.000 claims description 60
- 230000001737 promoting effect Effects 0.000 claims description 20
- 230000001364 causal effect Effects 0.000 claims description 14
- 230000004983 pleiotropic effect Effects 0.000 claims description 14
- 235000016709 nutrition Nutrition 0.000 claims description 12
- 239000012636 effector Substances 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 7
- 235000008733 Citrus aurantifolia Nutrition 0.000 claims description 5
- 244000248349 Citrus limon Species 0.000 claims description 5
- 235000005979 Citrus limon Nutrition 0.000 claims description 5
- 235000011941 Tilia x europaea Nutrition 0.000 claims description 5
- 239000004571 lime Substances 0.000 claims description 5
- 238000010197 meta-analysis Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 239000003596 drug target Substances 0.000 abstract description 3
- 235000021196 dietary intervention Nutrition 0.000 abstract 1
- 230000012010 growth Effects 0.000 description 13
- 210000000988 bone and bone Anatomy 0.000 description 12
- 230000002503 metabolic effect Effects 0.000 description 9
- 230000007614 genetic variation Effects 0.000 description 7
- 230000036541 health Effects 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000033228 biological regulation Effects 0.000 description 5
- 208000024172 Cardiovascular disease Diseases 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 229910052500 inorganic mineral Inorganic materials 0.000 description 4
- 239000011707 mineral Substances 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 208000012902 Nervous system disease Diseases 0.000 description 3
- 208000026106 cerebrovascular disease Diseases 0.000 description 3
- 235000005911 diet Nutrition 0.000 description 3
- 230000037213 diet Effects 0.000 description 3
- 235000015872 dietary supplement Nutrition 0.000 description 3
- 230000002526 effect on cardiovascular system Effects 0.000 description 3
- 239000013067 intermediate product Substances 0.000 description 3
- 230000004066 metabolic change Effects 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 208000020016 psychiatric disease Diseases 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 2
- 208000001132 Osteoporosis Diseases 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000003146 anticoagulant agent Substances 0.000 description 2
- 229940127219 anticoagulant drug Drugs 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 230000010478 bone regeneration Effects 0.000 description 2
- 230000008416 bone turnover Effects 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 230000009920 chelation Effects 0.000 description 2
- 235000020971 citrus fruits Nutrition 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000009982 effect on human Effects 0.000 description 2
- 235000013373 food additive Nutrition 0.000 description 2
- 239000002778 food additive Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 230000035764 nutrition Effects 0.000 description 2
- 230000011164 ossification Effects 0.000 description 2
- 230000009818 osteogenic differentiation Effects 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 230000002335 preservative effect Effects 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 235000014214 soft drink Nutrition 0.000 description 2
- 230000009469 supplementation Effects 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- PHIQHXFUZVPYII-ZCFIWIBFSA-O (R)-carnitinium Chemical compound C[N+](C)(C)C[C@H](O)CC(O)=O PHIQHXFUZVPYII-ZCFIWIBFSA-O 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 206010053759 Growth retardation Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 229960004203 carnitine Drugs 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 208000030172 endocrine system disease Diseases 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 231100000001 growth retardation Toxicity 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000008463 key metabolic pathway Effects 0.000 description 1
- -1 lemon Chemical compound 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 235000020660 omega-3 fatty acid Nutrition 0.000 description 1
- 235000020665 omega-6 fatty acid Nutrition 0.000 description 1
- 230000003950 pathogenic mechanism Effects 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Genetics & Genomics (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于孟德尔随机化分析预测复杂疾病及表型相关代谢物的方法,包括以下步骤:(1)血液代谢物全基因组关联研究数据的收集与整理;(2)工具变量的筛选与去多效性;(3)根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。本发明方法通过双样本孟德尔随机化分析,结合多种方法的筛选与判别,预测363个血液代谢物对复杂疾病及表型的影响,为后续针对血液代谢物寻找药物靶点与营养干预奠定了重要基础。
Description
技术领域
本发明涉及生命科学领域,具体涉及一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法。
背景技术
孟德尔随机化是一种流行病学研究方法,可以利用暴露因素相关的遗传变异作为工具变量来评估两个表型之间的因果关系,目前已广泛应用于疾病研究中。不同于全基因组关联研究,孟德尔随机化能有效筛选影响结果变量的“因果性”因素,而非传统的相关性研究,且以往的全基因组关联分析只报道了小部分与疾病/表型相关的遗传位点,统计效力受到群体样本量的限制。然而,大规模的全基因组关联研究可为我们提供丰富的遗传变异信息并用于双样本孟德尔随机化分析,能够系统的估计疾病或表型之间的因果关系,且有效地整合更多的遗传变异和更大的样本量,具有很强的统计能力,该方法的应用在疾病研究中已取得突破性的进展。
血液代谢物是人体代谢过程中的中间产物,它能够描述人体内外相互作用的结果,揭示环境和遗传因素对人体代谢作用的潜在机制。代谢调控是机体继基因转录和蛋白调控后的末端调控,因此基因与蛋白质的表达水平会在终末代谢物水平上进行放大,可灵敏系统地表征不同扰动因素对机体代谢轮廓的影响。目前针对复杂疾病与表型的代谢组学研究已发现多项代谢特征,但血浆代谢物水平检测稳定性较差,存在个体性差异交大及受环境因素干扰较大的问题。基于此,有研究者们将代谢物水平与个体基因型进行关联分析,找到与血液代谢物密切相关的遗传变异,为疾病与表型的代谢研究提供了更加丰富、稳定的资源,并能有效地应用于双样本孟德尔随机化研究中。
因此,利用双样本孟德尔随机化方法及血液代谢物的全基因组关联研究数据,能有效地鉴定出对复杂疾病及表型有促进或保护作用的血液代谢物,能发现潜在药物靶点与致病机制,为疾病研究带来新的契机。
发明内容
为了更加系统、稳定的对复杂疾病的代谢变化进行研究,本发明的目的在于提供一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,将遗传变异与血液代谢物及表型相结合,通过细致严谨的双样本孟德尔随机化分析与多项评估,从全局上预测疾病与表型特征性的具有“因果效应”的血液代谢物,可提供发现新的影响疾病与表型的代谢物与代谢变化,为后续针对关键代谢通路涉及药物靶点奠定了重要基础。
本发明还提供一种促进成人身高的营养品,即含有小分子化合物柠檬酸的营养品。
为了实现上述目的,本发明的技术方案是采用以下手段实现的:
一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,包括以下步骤:
S1:血液代谢物全基因组关联研究数据的收集与整理;
S2:对收集与整理的数据进行工具变量的筛选与去多效性;
S3:根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。
作为本发明的进一步改进,所述步骤S1具体包括:
S11:利用已有代谢物全基因组关联研究的相关文献收集研究数据;
S12:利用Meta分析对收集到的数据进行汇总;
S13:数据的格式整理,包括根据参考基因组信息矫正表型的效应碱基并进行效应值与其频率的换算,去除频率极低的SNP。
作为本发明的进一步改进,所述步骤S2具体包括:
S21:使用PLINK中的clump算法分别筛选与每一个血液代谢物在全基因组范围内显著相关并独立的SNPs;
S22:根据初步筛选得到的每个代谢物的特征性SNPs,在研究疾病或表型的全基因组关联研究数据中进行信息提取,得到其对结局变量的效应值与标准差并生成结局变量文件;
S23:根据得到的结局变量的SNPs,提取其对每个代谢物的效应值与标准差,生成暴露因素文件;
S24:对生成的结局变量文件与暴露因素文件进行匹配,通过Radial MR分析筛选具有水平多效性的SNPs,并在原有的输入文件中去除检测到的多效性SNP,得到最终的工具变量。
作为本发明的进一步改进,所述全基因组范围内显著相关是指相关因子p<1×10-5;
所述最终的工具变量中还去除工具变量小于3个的代谢物。
作为本发明的进一步改进,所述步骤S3具体包括:
S31:根据最终的暴露因素及结局变量文件,对每一个血液代谢物与疾病/表型的因果关系进行评估,具体涉及四种双样本孟德尔随机化方法:逆方差加权法、中值加权法、基于众数加权法以及MR-Egger回归法,并利用SIMEX对MR-Egger的统计值进行检验与矫正;
S32:计算IVW与MR-Egger两个方法的Q值与其对应的p值,并计算前者Q值与后者的Q值的差值,根据其在自由度为1时的p值选择MR估计的主要方法;
S33:通过留一法对每个代谢物的工具变量进行敏感性分析,确保在分析过程中没有主效SNP,如检测到主效SNP应去除后重新进行MR分析并观测结果;
S34:针对具有显著效应值的代谢物,进一步通过MR-Egger的截距与Presso分析再次对其进行多效性评估,确保最终得到的结果无水平多效性的干扰。
作为本发明的进一步改进,所述S32中,当p<0.05时以MR-Egger为主要方法,当p>0.05时以逆方差加权法作为主要方法,以多重矫正后的p值对结果显著性进行筛选。
一种促进成人身高的营养品,该营养品中含有柠檬酸。
该营养品适用于青春期开始后的人群。
所述柠檬酸选自工业柠檬酸、柠檬或酸橙。
与现有技术相比,本发明具有以下有点:
本发明提出的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,利用遗传变异作为中间变量对血液代谢物与复杂疾病及表型进行了细致严谨的因果评估,可显著提高发现影响疾病与表型代谢物的统计功效,为疾病代谢变化的表征提供了稳定可靠地结果。预测出的代谢物富含生物学功能,为进一步的生物学功能评价和靶向药物的开发奠定了重要基础。
本发明首先通过孟德尔随机化的方法系统的对血液代谢物与人体身高进行因果效应分析,有效地发现了对身高有正向促进作用的血液代谢物柠檬酸,并确定其发挥作用的生长阶段在青春期开始之后。利用相同的方法对柠檬酸的副作用进行评估,发现其对肿瘤、心脑血管疾病、精神类疾病、神经系统疾病等524种常见疾病无风险作用,进一步确定了柠檬酸可以成为促进身高的营养补充成分。
附图说明
图1为本发明提供的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
如图1所述,本发明一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,包括以下步骤:
S1:血液代谢物全基因组关联研究数据的收集与整理;
所述步骤S1具体包括:
S11:利用已公开发表的代谢物全基因组关联研究的相关文献收集研究数据;
S12:利用Meta分析对收集到的数据进行汇总;
S13:数据的格式整理,包括根据参考基因组信息矫正表型的效应碱基并进行效应值与其频率的换算、去除频率极低的SNP等。
S2:工具变量的筛选与去多效性;
所述步骤S2具体包括:
S21:工具变量的选择需要与暴露因素(血液代谢物)密切相关且与结局变量(所研究疾病)无关,因此首先使用PLINK中的clump算法分别筛选与每一个血液代谢物在全基因组范围内显著相关(p<1×10-5)并独立的SNPs。
S22:根据初步筛选得到的每个代谢物的特征性SNPs,在研究疾病或表型的全基因组关联研究数据中进行信息提取,得到其对结局变量的效应值与标准差并生成结局变量文件;
S23:根据得到的结局变量的SNPs,提取其对每个代谢物的效应值与标准差,生成暴露因素文件;
S24:对生成的结局变量文件与暴露因素文件进行匹配,通过Radial MR(径向孟德尔随机化)分析筛选具有水平多效性的SNPs,并在原有的输入文件中去除检测到的多效性SNP,得到最终的工具变量,并除去工具变量小于3个的代谢物以保证足够的遗传效力。
S3:根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。
所述步骤S3具体包括:
S31:根据最终的暴露因素及结局变量文件,对每一个血液代谢物与疾病/表型的因果关系进行评估,具体涉及四种双样本孟德尔随机化方法:逆方差加权法(Inverse-Variance Weighted),中值加权法(Weighted-median),基于众数加权法(Weighted mode)以及MR-Egger回归法(MR-Egger regression),并利用SIMEX对MR-Egger的统计值进行检验与矫正。
S32:计算IVW与MR-Egger两个方法的Q值与其对应的p值,并计算前者Q值(Q)与后者的Q值(Q’)的差值(Q-Q’),根据其在自由度为1时的p值选择MR估计的主要方法。其中,当p<0.05时以MR-Egger为主要方法,当p>0.05时以逆方差加权法作为主要方法,以多重矫正后的p值对结果显著性进行筛选。同时考虑四种方法效应值方向的一致性,以提高MR估计的准确性。
S33:通过留一法对每个代谢物的工具变量进行敏感性分析,确保在分析过程中没有主效SNP,如检测到主效SNP应去除后重新进行MR分析并观测结果。
S34:针对具有显著效应值的代谢物,进一步通过MR-Egger的截距与Presso分析再次对其进行多效性评估,确保最终得到的结果无水平多效性的干扰。
本发明所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,适用于任何一种复杂疾病与表型,例如各种癌症、内分泌疾病、心血管疾病、身高、肥胖等。
作为本发明的实施方式之一,本发明所述方法步骤S32中的显著结果进行筛选,其p值可根据具体需求选择不同校正方法及阈值,本领域技术人员可以根据实验情况自行选择p值阈值。
为了更好地说明本发明的用途和使用方法,以下结合具体实施例,对本发明作进一步的详细说明,但本发明并不受限于此。
实施例:
身高的发育会受到先天遗传和后天环境因素共同影响,其生长过程遵循婴儿期快速生长、在儿童期中期生长缓慢减弱及青春期高度生长突增的规律。先前的研究已经发现不同生长阶段的身高与环境因素,如饮食习惯、社会经济地位和健康之间有着密切关系,这表明人类身高的增加与人类生活方式的全面改善有关。如何科学有效地通过营养补充促进孩子的身高成为了父母关注的重要问题。
人体血液代谢物是人体代谢过程中的中间产物,它能够描述人体内外相互作用的结果,揭示环境和遗传因素对人体代谢作用的潜在机制。观察和回顾性研究表明,必需氨基酸和胆碱的缺乏会导致儿童发育不良。有研究者在身高增长较差的幼儿中进行了代谢组学分析,发现了几个与生长迟缓相关的代谢物,如ω-3和ω-6多不饱和脂肪酸。这些研究为代谢物与人体线性生长或身高之间的关系提供了证据,并提示从营养到身高的关系中涉及的生物学机制可以通过血液代谢物来表征,通过改变血液代谢物水平有望促进人体身高。然而,通过系统筛查寻找影响身高的代谢物并准确发现其作用时期还有待进一步发现。
本实施例以复杂表型身高为例,利用本发明的方法,进行促身高及抑制身高代谢物的预测,以下进行详细说明。
如图1所示,本发明提供一种基于双样本孟德尔随机化预测复杂疾病及表型相关代谢物的方法,包括以下步骤S1-S3。
S1:血液代谢物全基因组关联研究数据的收集与整理。
具体包括:血液代谢物的全基因组关联研究的数据来自两项Meta分析研究。一项是来自于奥格斯堡地区合作健康研究(KORA)和TwinsUK共7824名个体,包含了252种血液代谢物的GWAS研究,另一项包含了来自7个不同研究的7478名参与者的129种血液代谢物数据。这两项研究共有18个代谢物重复,我们使用样本量加权模型对这18种血液代谢物进行Meta分析,最终得到了363种代谢物的全基因组关联研究数据。
S2:工具变量的筛选与去多效性;
具体包括:利用千人基因组数据作为参考基因组数据挑选363个代谢物的独立显著遗传变异(r2 threshold=0.001,window size=1Mb)。在GIANT及UK Biobank数据库中下载并整理成人身高的GWAS数据分别作为发现集与验证集数据,同时收集与整理524种复杂疾病与表型的GWAS研究数据用于代谢物的副作用评估,并根据筛选的独立位点得到暴露因素文件与结局变量文件。通过Radial MR分析去除具有水平多效性的位点,得到每个代谢物最终的工具变量,并将去除工具变量小于三个的文件得到最终的MR输入文件。
S3:根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。
具体包括:利用四种不同的方法评估363个血液代谢物对成人身高的影响以GIANT身高研究作为发现集共鉴定出了7个对成人身高有因果效应的血液代谢物,以UK Biobank的身高研究作为验证数据进一步确定了其中四个代谢物对成人身高有显著作用,包括具有抑制作用的磷脂酰胆碱(β=-0.523,p=1.08×10-10)与肉毒碱(β=-0.097,p=1.38×10-10)以及具有促进作用的柠檬酸盐(β=0.625,p=7.37×10-5)及脂类衍生物1-arachidonoylglycerophosphocholine*(β=0.587,p=0.001)。MR-Egger的截距与Presso分析均显示这四个代谢物无多效性(p>0.05)且敏感性分析没有检测出主效SNP作为工具变量。
用相同的方法对柠檬酸盐及1-arachidonoylglycerophosphocholine*与524种身体常见疾病与相关表型之间的因果关系进行评估,发现其对肿瘤、心脑血管疾病、精神类疾病、神经系统疾病等常见疾病无风险作用。
进一步推断柠檬酸及1-arachidonoylglycerophosphocholine*可以成为促进身高的营养补充成分,进行相关营养保健品的研制。
对上述实施例分析如下:
首先基于大样本的363个血液代谢物与三个不同生长阶段身高的全基因组关联分析(Genome-wide Association Study,GWAS)研究数据进行两样本孟德尔随机化分析,系统筛查与身高相关的血液代谢物,发现了柠檬酸对成人身高有显著促进作用,但对初生婴儿尺寸和青春期初期的儿童身高没有显著作用,这表明提高血液中柠檬酸浓度在青春期开始后对人体身高发挥促进作用,并最终影响成人身高,而在妊娠期与青春期以前进行柠檬酸的补充对婴幼儿身高无显著作用。在此基础上,我们用同样的分析方法评价了柠檬酸对524种疾病的因果关系,判断柠檬酸是否会对身体产生其他副作用。分析结果显示柠檬酸没有增加其他疾病的风险,对人身体健康无显著毒副作用,表明了其安全性与稳定性,有望成为促进身高的营养成分。
柠檬酸是一种存在于人体血液、尿液和骨骼中的代谢因子。骨中含有大约2%的柠檬酸。已有研究发现,在层状结构的骨矿中,柠檬酸负离子在矿状血小板之间架起桥梁,表明柠檬酸在骨结构中起着重要作用。骨再生过程中的微环境因素研究中发现柠檬酸是一种骨促进因子,参与了成骨分化中的代谢调控。此外,一些观察性和前瞻性研究发现柠檬酸与骨转换、骨结构和强度的各种参数以及降低骨质疏松症的风险呈正相关。虽然目前还没有研究显示柠檬酸对身高的直接影响,但我们推测柠檬酸可能通过调节骨骼的形成而对人体身高产生间接影响。
柠檬酸是一种弱酸,分子式为C6H8O7,作为三羧酸循环的中间产物可由人体自身代谢活动中产生。柠檬酸也是常见的食品添加剂,可从饮食中获取。柠檬酸存在于柑橘类水果中,主要集中在柠檬和酸橙中,它可以占到水果干重的8%,是一种天然防腐剂,也被用来增加食物和软饮料的酸味,具有钙螯合作用,可作为抗凝血剂。基于柠檬酸的无毒副作用,与其在食品加工中的广泛应用,可将柠檬酸作为促身高营养成分加入营养保健品中,或对青春期后青少年生长发育过程中的饮食搭配进行指导。
工业添加的柠檬酸在室温下为无色半透明晶体或白色结晶性粉末,可适量添加在促进生长发育的营养品配方中,在青春期开始后进行补充摄入从而促进成人身高。此外,可在青春期开始后加大富含柠檬酸的食物的摄入,如柠檬、酸橙等。
基于本发明基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法得到的研究结论如下:
1)小分子代谢物柠檬酸促进成人体身高生长
基于363个血液代谢物与三个不同生长阶段身高的全基因组关联分析(Genome-wide Association Study,GWAS)研究数据进行两样本孟德尔随机化分析,发现柠檬酸对成人身高有促进作用。柠檬酸是一种存在于人体血液、尿液和骨骼中的代谢因子。骨中含有大约2%的柠檬酸。已有研究发现,在层状结构的骨矿中,柠檬酸负离子在矿状血小板之间架起桥梁,表明柠檬酸在骨结构中起着重要作用。骨再生过程中的微环境因素研究中发现柠檬酸是一种骨促进因子,参与了成骨分化中的代谢调控。此外,一些观察性和前瞻性研究发现柠檬酸与骨转换、骨结构和强度的各种参数以及降低骨质疏松症的风险呈正相关。虽然目前还没有研究显示柠檬酸对身高的直接影响,但我们推测柠檬酸可能通过调节骨骼的形成而对人体身高产生间接影响。
2)柠檬酸在青春期开始后对身高有显著促进作用,
柠檬酸对成人身高有显著促进作用,但对初生婴儿尺寸和青春期初期的儿童身高没有显著作用,这表明提高血液中柠檬酸浓度在青春期开始后对人体身高发挥促进作用,并最终影响成人身高,而在妊娠期与青春期以前进行柠檬酸的补充对婴幼儿身高无显著作用。
3)柠檬酸对身体健康无毒副作用
评估柠檬酸对肿瘤、心脑血管疾病、精神类疾病、神经系统疾病等524种恶性表型与疾病的因果关系,判断柠檬酸是否会对身体产生其他副作用。分析结果显示柠檬酸没有增加其他疾病的风险,对人身体健康无害。柠檬酸是一种弱酸,分子式为C6H8O7,作为三羧酸循环的中间产物可由人体自身代谢活动中产生。此外,柠檬酸也是常见的食品添加剂,可从饮食中获取。柠檬酸存在于柑橘类水果中,主要集中在柠檬和酸橙中,它可以占到水果干重的8%,是一种天然防腐剂,也被用来增加食物和软饮料的酸味,具有钙螯合作用,可作为抗凝血剂。
故,柠檬酸作为促进成人身高的小分子营养物质,可作为营养保健品添加成分在青春期开始后对人体身高产生促进作用。
综上所述,本实施例公开了一种可以促进成人身高的小分子血液代谢物,即一种小分子化合物柠檬酸。本发明通过研究发现柠檬酸能够促进生长发育并最终影响成人身高,且会在青春期开始之后发挥作用。同时对柠檬酸的副作用进行评估,发现其对524种常见疾病无风险作用,进一步确定了柠檬酸可以成为促进身高的营养补充成分,为相关营养品的研发提供了理论参考。
应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施例和许多应用对本领域技术人员来说都将是显而易见的。因此,本教导的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。出于全面之目的,所有文章和参考包括专利申请和公告的公开都通过参考结合在本文中。在前述权利要求中省略这里公开的主题的任何方面并不是为了放弃该主体内容,也不应该认为申请人没有将该主题考虑为所公开的发明主题的一部分。
Claims (9)
1.一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,包括以下步骤:
S1:血液代谢物全基因组关联研究数据的收集与整理;
S2:对收集与整理的数据进行工具变量的筛选与去多效性;
S3:根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。
2.根据权利要求1所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述步骤S1具体包括:
S11:利用已有代谢物全基因组关联研究的相关文献收集研究数据;
S12:利用Meta分析对收集到的数据进行汇总;
S13:数据的格式整理,包括根据参考基因组信息矫正表型的效应碱基并进行效应值与其频率的换算,去除频率极低的SNP。
3.根据权利要求1所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述步骤S2具体包括:
S21:使用PLINK中的clump算法分别筛选与每一个血液代谢物在全基因组范围内显著相关并独立的SNPs;
S22:根据初步筛选得到的每个代谢物的特征性SNPs,在研究疾病或表型的全基因组关联研究数据中进行信息提取,得到其对结局变量的效应值与标准差并生成结局变量文件;
S23:根据得到的结局变量的SNPs,提取其对每个代谢物的效应值与标准差,生成暴露因素文件;
S24:对生成的结局变量文件与暴露因素文件进行匹配,通过Radial MR分析筛选具有水平多效性的SNPs,并在原有的输入文件中去除检测到的多效性SNP,得到最终的工具变量。
4.根据权利要求3所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述全基因组范围内显著相关是指相关因子p<1×10-5;
所述最终的工具变量中还去除工具变量小于3个的代谢物。
5.根据权利要求1所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述步骤S3具体包括:
S31:根据最终的暴露因素及结局变量文件,对每一个血液代谢物与疾病/表型的因果关系进行评估,具体涉及四种双样本孟德尔随机化方法:逆方差加权法、中值加权法、基于众数加权法以及MR-Egger回归法,并利用SIMEX对MR-Egger的统计值进行检验与矫正;
S32:计算IVW与MR-Egger两个方法的Q值与其对应的p值,并计算前者Q值与后者的Q值的差值,根据其在自由度为1时的p值选择MR估计的主要方法;
S33:通过留一法对每个代谢物的工具变量进行敏感性分析,确保在分析过程中没有主效SNP,如检测到主效SNP应去除后重新进行MR分析并观测结果;
S34:针对具有显著效应值的代谢物,进一步通过MR-Egger的截距与Presso分析再次对其进行多效性评估,确保最终得到的结果无水平多效性的干扰。
6.根据权利要求5所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述S32中,当p<0.05时以MR-Egger为主要方法,当p>0.05时以逆方差加权法作为主要方法,以多重矫正后的p值对结果显著性进行筛选。
7.一种促进成人身高的营养品,其特征在于,该营养品中含有柠檬酸。
8.根据权利要求1所述的一种促进成人身高的营养品,其特征在于,该营养品适用于青春期开始后的人群。
9.根据权利要求1所述的一种促进成人身高的营养品,其特征在于,所述柠檬酸选自工业柠檬酸、柠檬或酸橙。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010139836.5A CN111341448B (zh) | 2020-03-03 | 2020-03-03 | 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010139836.5A CN111341448B (zh) | 2020-03-03 | 2020-03-03 | 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111341448A true CN111341448A (zh) | 2020-06-26 |
CN111341448B CN111341448B (zh) | 2023-12-19 |
Family
ID=71187184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010139836.5A Active CN111341448B (zh) | 2020-03-03 | 2020-03-03 | 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111341448B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112185464A (zh) * | 2020-09-29 | 2021-01-05 | 山东大学 | 一种基于孟德尔随机化的多性状全转录组关联分析方法、系统及其应用 |
CN112908478A (zh) * | 2021-02-18 | 2021-06-04 | 苏州大学 | 基于孟德尔随机化分析肠道菌群与肥胖关系的方法 |
CN113096816A (zh) * | 2021-03-18 | 2021-07-09 | 西安交通大学 | 脑疾病发病风险预测模型建立方法、系统、设备及存储介质 |
CN113113141A (zh) * | 2021-04-02 | 2021-07-13 | 北京果壳生物科技有限公司 | 一种基于孟德尔随机化评估微量营养素与精神类疾病因果关系的方法 |
CN114171110A (zh) * | 2021-10-20 | 2022-03-11 | 山东大学 | 一种基于联合似然的孟德尔随机化分析方法 |
CN116825208A (zh) * | 2023-06-06 | 2023-09-29 | 吉林大学 | 一种基于孟德尔随机化的多因素大规模数据整合分析方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100692319B1 (ko) * | 2006-02-20 | 2007-03-12 | 한국생명공학연구원 | 단백질 상호작용 네트워크 분석을 통한 새로운 질병관련유전자 선정방법 |
WO2008124187A1 (en) * | 2007-04-10 | 2008-10-16 | University Of Medicine And Dentistry Of Nj | Biochemical markers for disease states and genes for identification of biochemical defects |
US20120101736A1 (en) * | 2010-10-25 | 2012-04-26 | Dudley Joel T | Method and System for Computing and Integrating Genetic and Environmental Health Risks for a Personal Genome |
CN103119179A (zh) * | 2010-07-23 | 2013-05-22 | 哈佛大学校长及研究员协会 | 用于检测体液中的疾病或病症标记的方法 |
WO2015063376A1 (en) * | 2013-11-04 | 2015-05-07 | Medisapiens Oy | Method and system for estimating genomic health |
WO2016201272A1 (en) * | 2015-06-12 | 2016-12-15 | King Abdulaziz City For Science And Technology | Method of diagnosing patients with conditions caused by mendelian mutations |
CN109994185A (zh) * | 2019-04-08 | 2019-07-09 | 武汉百药联科科技有限公司 | 一种验证营养素是否适合个性化病人的方法 |
CN110349623A (zh) * | 2019-01-17 | 2019-10-18 | 哈尔滨工业大学 | 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 |
CN110610763A (zh) * | 2019-09-10 | 2019-12-24 | 陕西师范大学 | 基于katz模型的代谢物与疾病关联关系预测方法 |
-
2020
- 2020-03-03 CN CN202010139836.5A patent/CN111341448B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100692319B1 (ko) * | 2006-02-20 | 2007-03-12 | 한국생명공학연구원 | 단백질 상호작용 네트워크 분석을 통한 새로운 질병관련유전자 선정방법 |
WO2008124187A1 (en) * | 2007-04-10 | 2008-10-16 | University Of Medicine And Dentistry Of Nj | Biochemical markers for disease states and genes for identification of biochemical defects |
CN103119179A (zh) * | 2010-07-23 | 2013-05-22 | 哈佛大学校长及研究员协会 | 用于检测体液中的疾病或病症标记的方法 |
US20120101736A1 (en) * | 2010-10-25 | 2012-04-26 | Dudley Joel T | Method and System for Computing and Integrating Genetic and Environmental Health Risks for a Personal Genome |
WO2015063376A1 (en) * | 2013-11-04 | 2015-05-07 | Medisapiens Oy | Method and system for estimating genomic health |
WO2016201272A1 (en) * | 2015-06-12 | 2016-12-15 | King Abdulaziz City For Science And Technology | Method of diagnosing patients with conditions caused by mendelian mutations |
CN110349623A (zh) * | 2019-01-17 | 2019-10-18 | 哈尔滨工业大学 | 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 |
CN109994185A (zh) * | 2019-04-08 | 2019-07-09 | 武汉百药联科科技有限公司 | 一种验证营养素是否适合个性化病人的方法 |
CN110610763A (zh) * | 2019-09-10 | 2019-12-24 | 陕西师范大学 | 基于katz模型的代谢物与疾病关联关系预测方法 |
Non-Patent Citations (1)
Title |
---|
刘娅飞: "基于孟德尔随机化探索代谢综合征相关指标间因果关系的研究" * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112185464A (zh) * | 2020-09-29 | 2021-01-05 | 山东大学 | 一种基于孟德尔随机化的多性状全转录组关联分析方法、系统及其应用 |
CN112185464B (zh) * | 2020-09-29 | 2022-12-13 | 山东大学 | 一种基于孟德尔随机化的多性状全转录组关联分析方法、系统及其应用 |
CN112908478A (zh) * | 2021-02-18 | 2021-06-04 | 苏州大学 | 基于孟德尔随机化分析肠道菌群与肥胖关系的方法 |
CN113096816A (zh) * | 2021-03-18 | 2021-07-09 | 西安交通大学 | 脑疾病发病风险预测模型建立方法、系统、设备及存储介质 |
CN113096816B (zh) * | 2021-03-18 | 2023-06-13 | 西安交通大学 | 脑疾病发病风险预测模型建立方法、系统、设备及存储介质 |
CN113113141A (zh) * | 2021-04-02 | 2021-07-13 | 北京果壳生物科技有限公司 | 一种基于孟德尔随机化评估微量营养素与精神类疾病因果关系的方法 |
CN114171110A (zh) * | 2021-10-20 | 2022-03-11 | 山东大学 | 一种基于联合似然的孟德尔随机化分析方法 |
CN116825208A (zh) * | 2023-06-06 | 2023-09-29 | 吉林大学 | 一种基于孟德尔随机化的多因素大规模数据整合分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111341448B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111341448B (zh) | 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 | |
Taylor et al. | Consumption of fermented foods is associated with systematic differences in the gut microbiome and metabolome | |
Xu | Foodomics: A novel approach for food microbiology | |
Lacalle-Bergeron et al. | Chromatography hyphenated to high resolution mass spectrometry in untargeted metabolomics for investigation of food (bio) markers | |
Liu et al. | Western diet feeding influences gut microbiota profiles in apoE knockout mice | |
Favé et al. | Development and validation of a standardized protocol to monitor human dietary exposure by metabolite fingerprinting of urine samples | |
Hamany Djande et al. | Metabolomics: A tool for cultivar phenotyping and investigation of grain crops | |
Crow et al. | Co-expression in single-cell analysis: saving grace or original sin? | |
Granitto et al. | Modern data mining tools in descriptive sensory analysis: A case study with a Random forest approach | |
Hu et al. | Changes in the volatile components of candied kumquats in different processing methodologies with headspace–gas chromatography–ion mobility spectrometry | |
Cotillard et al. | A posteriori dietary patterns better explain variations of the gut microbiome than individual markers in the American Gut Project | |
CN105543369B (zh) | 精神障碍的生物标志物及其应用 | |
Hamza et al. | Proximate compositions evaluation and variability among cultivars of date palm (Phoenix dactylifera L.) in Nigeria | |
Roorkiwal et al. | Genome-wide association mapping of nutritional traits for designing superior chickpea varieties | |
Acar et al. | Forecasting chronic diseases using data fusion | |
Srivastava et al. | Nutrimetabolomics: Metabolomics in Nutrition Research | |
Arbeev et al. | Genetic model for longitudinal studies of aging, health, and longevity and its potential application to incomplete data | |
Swann et al. | Nutrimetabonomics: nutritional applications of metabolic profiling | |
Chi et al. | E-nose, E-tongue Combined with GC-IMS to Analyze the Influence of Key Additives during Processing on the Flavor of Infant Formula | |
Jiang et al. | Development of a flavor fingerprint using HS-GC-IMS for volatile compounds from steamed potatoes of different varieties | |
Sánchez et al. | Application of digital olfaction for table olive industry | |
McNairn et al. | Postprandial dried blood spot–based nutritional metabolomic analysis discriminates a high-fat, high-protein meat-based diet from a high carbohydrate vegan diet: a randomized controlled crossover trial | |
Wang et al. | Mutual Relations between Texture and Aroma of Cooked Rice—A Pilot Study | |
Naylor et al. | Towards a systems level analysis of health and nutrition | |
Peach et al. | Temporal metabolic response yields a dynamic biosignature of inflammation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |