CN111341448A - 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 - Google Patents

一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 Download PDF

Info

Publication number
CN111341448A
CN111341448A CN202010139836.5A CN202010139836A CN111341448A CN 111341448 A CN111341448 A CN 111341448A CN 202010139836 A CN202010139836 A CN 202010139836A CN 111341448 A CN111341448 A CN 111341448A
Authority
CN
China
Prior art keywords
analysis
metabolites
mendelian
citric acid
metabolite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010139836.5A
Other languages
English (en)
Other versions
CN111341448B (zh
Inventor
杨铁林
张堃
郭燕
吴昊
郭婧
丁景苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202010139836.5A priority Critical patent/CN111341448B/zh
Publication of CN111341448A publication Critical patent/CN111341448A/zh
Application granted granted Critical
Publication of CN111341448B publication Critical patent/CN111341448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于孟德尔随机化分析预测复杂疾病及表型相关代谢物的方法,包括以下步骤:(1)血液代谢物全基因组关联研究数据的收集与整理;(2)工具变量的筛选与去多效性;(3)根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。本发明方法通过双样本孟德尔随机化分析,结合多种方法的筛选与判别,预测363个血液代谢物对复杂疾病及表型的影响,为后续针对血液代谢物寻找药物靶点与营养干预奠定了重要基础。

Description

一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的 方法
技术领域
本发明涉及生命科学领域,具体涉及一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法。
背景技术
孟德尔随机化是一种流行病学研究方法,可以利用暴露因素相关的遗传变异作为工具变量来评估两个表型之间的因果关系,目前已广泛应用于疾病研究中。不同于全基因组关联研究,孟德尔随机化能有效筛选影响结果变量的“因果性”因素,而非传统的相关性研究,且以往的全基因组关联分析只报道了小部分与疾病/表型相关的遗传位点,统计效力受到群体样本量的限制。然而,大规模的全基因组关联研究可为我们提供丰富的遗传变异信息并用于双样本孟德尔随机化分析,能够系统的估计疾病或表型之间的因果关系,且有效地整合更多的遗传变异和更大的样本量,具有很强的统计能力,该方法的应用在疾病研究中已取得突破性的进展。
血液代谢物是人体代谢过程中的中间产物,它能够描述人体内外相互作用的结果,揭示环境和遗传因素对人体代谢作用的潜在机制。代谢调控是机体继基因转录和蛋白调控后的末端调控,因此基因与蛋白质的表达水平会在终末代谢物水平上进行放大,可灵敏系统地表征不同扰动因素对机体代谢轮廓的影响。目前针对复杂疾病与表型的代谢组学研究已发现多项代谢特征,但血浆代谢物水平检测稳定性较差,存在个体性差异交大及受环境因素干扰较大的问题。基于此,有研究者们将代谢物水平与个体基因型进行关联分析,找到与血液代谢物密切相关的遗传变异,为疾病与表型的代谢研究提供了更加丰富、稳定的资源,并能有效地应用于双样本孟德尔随机化研究中。
因此,利用双样本孟德尔随机化方法及血液代谢物的全基因组关联研究数据,能有效地鉴定出对复杂疾病及表型有促进或保护作用的血液代谢物,能发现潜在药物靶点与致病机制,为疾病研究带来新的契机。
发明内容
为了更加系统、稳定的对复杂疾病的代谢变化进行研究,本发明的目的在于提供一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,将遗传变异与血液代谢物及表型相结合,通过细致严谨的双样本孟德尔随机化分析与多项评估,从全局上预测疾病与表型特征性的具有“因果效应”的血液代谢物,可提供发现新的影响疾病与表型的代谢物与代谢变化,为后续针对关键代谢通路涉及药物靶点奠定了重要基础。
本发明还提供一种促进成人身高的营养品,即含有小分子化合物柠檬酸的营养品。
为了实现上述目的,本发明的技术方案是采用以下手段实现的:
一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,包括以下步骤:
S1:血液代谢物全基因组关联研究数据的收集与整理;
S2:对收集与整理的数据进行工具变量的筛选与去多效性;
S3:根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。
作为本发明的进一步改进,所述步骤S1具体包括:
S11:利用已有代谢物全基因组关联研究的相关文献收集研究数据;
S12:利用Meta分析对收集到的数据进行汇总;
S13:数据的格式整理,包括根据参考基因组信息矫正表型的效应碱基并进行效应值与其频率的换算,去除频率极低的SNP。
作为本发明的进一步改进,所述步骤S2具体包括:
S21:使用PLINK中的clump算法分别筛选与每一个血液代谢物在全基因组范围内显著相关并独立的SNPs;
S22:根据初步筛选得到的每个代谢物的特征性SNPs,在研究疾病或表型的全基因组关联研究数据中进行信息提取,得到其对结局变量的效应值与标准差并生成结局变量文件;
S23:根据得到的结局变量的SNPs,提取其对每个代谢物的效应值与标准差,生成暴露因素文件;
S24:对生成的结局变量文件与暴露因素文件进行匹配,通过Radial MR分析筛选具有水平多效性的SNPs,并在原有的输入文件中去除检测到的多效性SNP,得到最终的工具变量。
作为本发明的进一步改进,所述全基因组范围内显著相关是指相关因子p<1×10-5
所述最终的工具变量中还去除工具变量小于3个的代谢物。
作为本发明的进一步改进,所述步骤S3具体包括:
S31:根据最终的暴露因素及结局变量文件,对每一个血液代谢物与疾病/表型的因果关系进行评估,具体涉及四种双样本孟德尔随机化方法:逆方差加权法、中值加权法、基于众数加权法以及MR-Egger回归法,并利用SIMEX对MR-Egger的统计值进行检验与矫正;
S32:计算IVW与MR-Egger两个方法的Q值与其对应的p值,并计算前者Q值与后者的Q值的差值,根据其在自由度为1时的p值选择MR估计的主要方法;
S33:通过留一法对每个代谢物的工具变量进行敏感性分析,确保在分析过程中没有主效SNP,如检测到主效SNP应去除后重新进行MR分析并观测结果;
S34:针对具有显著效应值的代谢物,进一步通过MR-Egger的截距与Presso分析再次对其进行多效性评估,确保最终得到的结果无水平多效性的干扰。
作为本发明的进一步改进,所述S32中,当p<0.05时以MR-Egger为主要方法,当p>0.05时以逆方差加权法作为主要方法,以多重矫正后的p值对结果显著性进行筛选。
一种促进成人身高的营养品,该营养品中含有柠檬酸。
该营养品适用于青春期开始后的人群。
所述柠檬酸选自工业柠檬酸、柠檬或酸橙。
与现有技术相比,本发明具有以下有点:
本发明提出的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,利用遗传变异作为中间变量对血液代谢物与复杂疾病及表型进行了细致严谨的因果评估,可显著提高发现影响疾病与表型代谢物的统计功效,为疾病代谢变化的表征提供了稳定可靠地结果。预测出的代谢物富含生物学功能,为进一步的生物学功能评价和靶向药物的开发奠定了重要基础。
本发明首先通过孟德尔随机化的方法系统的对血液代谢物与人体身高进行因果效应分析,有效地发现了对身高有正向促进作用的血液代谢物柠檬酸,并确定其发挥作用的生长阶段在青春期开始之后。利用相同的方法对柠檬酸的副作用进行评估,发现其对肿瘤、心脑血管疾病、精神类疾病、神经系统疾病等524种常见疾病无风险作用,进一步确定了柠檬酸可以成为促进身高的营养补充成分。
附图说明
图1为本发明提供的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
如图1所述,本发明一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,包括以下步骤:
S1:血液代谢物全基因组关联研究数据的收集与整理;
所述步骤S1具体包括:
S11:利用已公开发表的代谢物全基因组关联研究的相关文献收集研究数据;
S12:利用Meta分析对收集到的数据进行汇总;
S13:数据的格式整理,包括根据参考基因组信息矫正表型的效应碱基并进行效应值与其频率的换算、去除频率极低的SNP等。
S2:工具变量的筛选与去多效性;
所述步骤S2具体包括:
S21:工具变量的选择需要与暴露因素(血液代谢物)密切相关且与结局变量(所研究疾病)无关,因此首先使用PLINK中的clump算法分别筛选与每一个血液代谢物在全基因组范围内显著相关(p<1×10-5)并独立的SNPs。
S22:根据初步筛选得到的每个代谢物的特征性SNPs,在研究疾病或表型的全基因组关联研究数据中进行信息提取,得到其对结局变量的效应值与标准差并生成结局变量文件;
S23:根据得到的结局变量的SNPs,提取其对每个代谢物的效应值与标准差,生成暴露因素文件;
S24:对生成的结局变量文件与暴露因素文件进行匹配,通过Radial MR(径向孟德尔随机化)分析筛选具有水平多效性的SNPs,并在原有的输入文件中去除检测到的多效性SNP,得到最终的工具变量,并除去工具变量小于3个的代谢物以保证足够的遗传效力。
S3:根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。
所述步骤S3具体包括:
S31:根据最终的暴露因素及结局变量文件,对每一个血液代谢物与疾病/表型的因果关系进行评估,具体涉及四种双样本孟德尔随机化方法:逆方差加权法(Inverse-Variance Weighted),中值加权法(Weighted-median),基于众数加权法(Weighted mode)以及MR-Egger回归法(MR-Egger regression),并利用SIMEX对MR-Egger的统计值进行检验与矫正。
S32:计算IVW与MR-Egger两个方法的Q值与其对应的p值,并计算前者Q值(Q)与后者的Q值(Q’)的差值(Q-Q’),根据其在自由度为1时的p值选择MR估计的主要方法。其中,当p<0.05时以MR-Egger为主要方法,当p>0.05时以逆方差加权法作为主要方法,以多重矫正后的p值对结果显著性进行筛选。同时考虑四种方法效应值方向的一致性,以提高MR估计的准确性。
S33:通过留一法对每个代谢物的工具变量进行敏感性分析,确保在分析过程中没有主效SNP,如检测到主效SNP应去除后重新进行MR分析并观测结果。
S34:针对具有显著效应值的代谢物,进一步通过MR-Egger的截距与Presso分析再次对其进行多效性评估,确保最终得到的结果无水平多效性的干扰。
本发明所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,适用于任何一种复杂疾病与表型,例如各种癌症、内分泌疾病、心血管疾病、身高、肥胖等。
作为本发明的实施方式之一,本发明所述方法步骤S32中的显著结果进行筛选,其p值可根据具体需求选择不同校正方法及阈值,本领域技术人员可以根据实验情况自行选择p值阈值。
为了更好地说明本发明的用途和使用方法,以下结合具体实施例,对本发明作进一步的详细说明,但本发明并不受限于此。
实施例:
身高的发育会受到先天遗传和后天环境因素共同影响,其生长过程遵循婴儿期快速生长、在儿童期中期生长缓慢减弱及青春期高度生长突增的规律。先前的研究已经发现不同生长阶段的身高与环境因素,如饮食习惯、社会经济地位和健康之间有着密切关系,这表明人类身高的增加与人类生活方式的全面改善有关。如何科学有效地通过营养补充促进孩子的身高成为了父母关注的重要问题。
人体血液代谢物是人体代谢过程中的中间产物,它能够描述人体内外相互作用的结果,揭示环境和遗传因素对人体代谢作用的潜在机制。观察和回顾性研究表明,必需氨基酸和胆碱的缺乏会导致儿童发育不良。有研究者在身高增长较差的幼儿中进行了代谢组学分析,发现了几个与生长迟缓相关的代谢物,如ω-3和ω-6多不饱和脂肪酸。这些研究为代谢物与人体线性生长或身高之间的关系提供了证据,并提示从营养到身高的关系中涉及的生物学机制可以通过血液代谢物来表征,通过改变血液代谢物水平有望促进人体身高。然而,通过系统筛查寻找影响身高的代谢物并准确发现其作用时期还有待进一步发现。
本实施例以复杂表型身高为例,利用本发明的方法,进行促身高及抑制身高代谢物的预测,以下进行详细说明。
如图1所示,本发明提供一种基于双样本孟德尔随机化预测复杂疾病及表型相关代谢物的方法,包括以下步骤S1-S3。
S1:血液代谢物全基因组关联研究数据的收集与整理。
具体包括:血液代谢物的全基因组关联研究的数据来自两项Meta分析研究。一项是来自于奥格斯堡地区合作健康研究(KORA)和TwinsUK共7824名个体,包含了252种血液代谢物的GWAS研究,另一项包含了来自7个不同研究的7478名参与者的129种血液代谢物数据。这两项研究共有18个代谢物重复,我们使用样本量加权模型对这18种血液代谢物进行Meta分析,最终得到了363种代谢物的全基因组关联研究数据。
S2:工具变量的筛选与去多效性;
具体包括:利用千人基因组数据作为参考基因组数据挑选363个代谢物的独立显著遗传变异(r2 threshold=0.001,window size=1Mb)。在GIANT及UK Biobank数据库中下载并整理成人身高的GWAS数据分别作为发现集与验证集数据,同时收集与整理524种复杂疾病与表型的GWAS研究数据用于代谢物的副作用评估,并根据筛选的独立位点得到暴露因素文件与结局变量文件。通过Radial MR分析去除具有水平多效性的位点,得到每个代谢物最终的工具变量,并将去除工具变量小于三个的文件得到最终的MR输入文件。
S3:根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。
具体包括:利用四种不同的方法评估363个血液代谢物对成人身高的影响以GIANT身高研究作为发现集共鉴定出了7个对成人身高有因果效应的血液代谢物,以UK Biobank的身高研究作为验证数据进一步确定了其中四个代谢物对成人身高有显著作用,包括具有抑制作用的磷脂酰胆碱(β=-0.523,p=1.08×10-10)与肉毒碱(β=-0.097,p=1.38×10-10)以及具有促进作用的柠檬酸盐(β=0.625,p=7.37×10-5)及脂类衍生物1-arachidonoylglycerophosphocholine*(β=0.587,p=0.001)。MR-Egger的截距与Presso分析均显示这四个代谢物无多效性(p>0.05)且敏感性分析没有检测出主效SNP作为工具变量。
用相同的方法对柠檬酸盐及1-arachidonoylglycerophosphocholine*与524种身体常见疾病与相关表型之间的因果关系进行评估,发现其对肿瘤、心脑血管疾病、精神类疾病、神经系统疾病等常见疾病无风险作用。
进一步推断柠檬酸及1-arachidonoylglycerophosphocholine*可以成为促进身高的营养补充成分,进行相关营养保健品的研制。
对上述实施例分析如下:
首先基于大样本的363个血液代谢物与三个不同生长阶段身高的全基因组关联分析(Genome-wide Association Study,GWAS)研究数据进行两样本孟德尔随机化分析,系统筛查与身高相关的血液代谢物,发现了柠檬酸对成人身高有显著促进作用,但对初生婴儿尺寸和青春期初期的儿童身高没有显著作用,这表明提高血液中柠檬酸浓度在青春期开始后对人体身高发挥促进作用,并最终影响成人身高,而在妊娠期与青春期以前进行柠檬酸的补充对婴幼儿身高无显著作用。在此基础上,我们用同样的分析方法评价了柠檬酸对524种疾病的因果关系,判断柠檬酸是否会对身体产生其他副作用。分析结果显示柠檬酸没有增加其他疾病的风险,对人身体健康无显著毒副作用,表明了其安全性与稳定性,有望成为促进身高的营养成分。
柠檬酸是一种存在于人体血液、尿液和骨骼中的代谢因子。骨中含有大约2%的柠檬酸。已有研究发现,在层状结构的骨矿中,柠檬酸负离子在矿状血小板之间架起桥梁,表明柠檬酸在骨结构中起着重要作用。骨再生过程中的微环境因素研究中发现柠檬酸是一种骨促进因子,参与了成骨分化中的代谢调控。此外,一些观察性和前瞻性研究发现柠檬酸与骨转换、骨结构和强度的各种参数以及降低骨质疏松症的风险呈正相关。虽然目前还没有研究显示柠檬酸对身高的直接影响,但我们推测柠檬酸可能通过调节骨骼的形成而对人体身高产生间接影响。
柠檬酸是一种弱酸,分子式为C6H8O7,作为三羧酸循环的中间产物可由人体自身代谢活动中产生。柠檬酸也是常见的食品添加剂,可从饮食中获取。柠檬酸存在于柑橘类水果中,主要集中在柠檬和酸橙中,它可以占到水果干重的8%,是一种天然防腐剂,也被用来增加食物和软饮料的酸味,具有钙螯合作用,可作为抗凝血剂。基于柠檬酸的无毒副作用,与其在食品加工中的广泛应用,可将柠檬酸作为促身高营养成分加入营养保健品中,或对青春期后青少年生长发育过程中的饮食搭配进行指导。
Figure BDA0002398689250000111
工业添加的柠檬酸在室温下为无色半透明晶体或白色结晶性粉末,可适量添加在促进生长发育的营养品配方中,在青春期开始后进行补充摄入从而促进成人身高。此外,可在青春期开始后加大富含柠檬酸的食物的摄入,如柠檬、酸橙等。
基于本发明基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法得到的研究结论如下:
1)小分子代谢物柠檬酸促进成人体身高生长
基于363个血液代谢物与三个不同生长阶段身高的全基因组关联分析(Genome-wide Association Study,GWAS)研究数据进行两样本孟德尔随机化分析,发现柠檬酸对成人身高有促进作用。柠檬酸是一种存在于人体血液、尿液和骨骼中的代谢因子。骨中含有大约2%的柠檬酸。已有研究发现,在层状结构的骨矿中,柠檬酸负离子在矿状血小板之间架起桥梁,表明柠檬酸在骨结构中起着重要作用。骨再生过程中的微环境因素研究中发现柠檬酸是一种骨促进因子,参与了成骨分化中的代谢调控。此外,一些观察性和前瞻性研究发现柠檬酸与骨转换、骨结构和强度的各种参数以及降低骨质疏松症的风险呈正相关。虽然目前还没有研究显示柠檬酸对身高的直接影响,但我们推测柠檬酸可能通过调节骨骼的形成而对人体身高产生间接影响。
2)柠檬酸在青春期开始后对身高有显著促进作用,
柠檬酸对成人身高有显著促进作用,但对初生婴儿尺寸和青春期初期的儿童身高没有显著作用,这表明提高血液中柠檬酸浓度在青春期开始后对人体身高发挥促进作用,并最终影响成人身高,而在妊娠期与青春期以前进行柠檬酸的补充对婴幼儿身高无显著作用。
3)柠檬酸对身体健康无毒副作用
评估柠檬酸对肿瘤、心脑血管疾病、精神类疾病、神经系统疾病等524种恶性表型与疾病的因果关系,判断柠檬酸是否会对身体产生其他副作用。分析结果显示柠檬酸没有增加其他疾病的风险,对人身体健康无害。柠檬酸是一种弱酸,分子式为C6H8O7,作为三羧酸循环的中间产物可由人体自身代谢活动中产生。此外,柠檬酸也是常见的食品添加剂,可从饮食中获取。柠檬酸存在于柑橘类水果中,主要集中在柠檬和酸橙中,它可以占到水果干重的8%,是一种天然防腐剂,也被用来增加食物和软饮料的酸味,具有钙螯合作用,可作为抗凝血剂。
故,柠檬酸作为促进成人身高的小分子营养物质,可作为营养保健品添加成分在青春期开始后对人体身高产生促进作用。
综上所述,本实施例公开了一种可以促进成人身高的小分子血液代谢物,即一种小分子化合物柠檬酸。本发明通过研究发现柠檬酸能够促进生长发育并最终影响成人身高,且会在青春期开始之后发挥作用。同时对柠檬酸的副作用进行评估,发现其对524种常见疾病无风险作用,进一步确定了柠檬酸可以成为促进身高的营养补充成分,为相关营养品的研发提供了理论参考。
应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施例和许多应用对本领域技术人员来说都将是显而易见的。因此,本教导的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。出于全面之目的,所有文章和参考包括专利申请和公告的公开都通过参考结合在本文中。在前述权利要求中省略这里公开的主题的任何方面并不是为了放弃该主体内容,也不应该认为申请人没有将该主题考虑为所公开的发明主题的一部分。

Claims (9)

1.一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,包括以下步骤:
S1:血液代谢物全基因组关联研究数据的收集与整理;
S2:对收集与整理的数据进行工具变量的筛选与去多效性;
S3:根据筛选的工具变量进行双样本孟德尔随机化分析,综合多种分析方法的效应值与敏感性分析的判定,得到与疾病或表型相关的代谢物。
2.根据权利要求1所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述步骤S1具体包括:
S11:利用已有代谢物全基因组关联研究的相关文献收集研究数据;
S12:利用Meta分析对收集到的数据进行汇总;
S13:数据的格式整理,包括根据参考基因组信息矫正表型的效应碱基并进行效应值与其频率的换算,去除频率极低的SNP。
3.根据权利要求1所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述步骤S2具体包括:
S21:使用PLINK中的clump算法分别筛选与每一个血液代谢物在全基因组范围内显著相关并独立的SNPs;
S22:根据初步筛选得到的每个代谢物的特征性SNPs,在研究疾病或表型的全基因组关联研究数据中进行信息提取,得到其对结局变量的效应值与标准差并生成结局变量文件;
S23:根据得到的结局变量的SNPs,提取其对每个代谢物的效应值与标准差,生成暴露因素文件;
S24:对生成的结局变量文件与暴露因素文件进行匹配,通过Radial MR分析筛选具有水平多效性的SNPs,并在原有的输入文件中去除检测到的多效性SNP,得到最终的工具变量。
4.根据权利要求3所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述全基因组范围内显著相关是指相关因子p<1×10-5
所述最终的工具变量中还去除工具变量小于3个的代谢物。
5.根据权利要求1所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述步骤S3具体包括:
S31:根据最终的暴露因素及结局变量文件,对每一个血液代谢物与疾病/表型的因果关系进行评估,具体涉及四种双样本孟德尔随机化方法:逆方差加权法、中值加权法、基于众数加权法以及MR-Egger回归法,并利用SIMEX对MR-Egger的统计值进行检验与矫正;
S32:计算IVW与MR-Egger两个方法的Q值与其对应的p值,并计算前者Q值与后者的Q值的差值,根据其在自由度为1时的p值选择MR估计的主要方法;
S33:通过留一法对每个代谢物的工具变量进行敏感性分析,确保在分析过程中没有主效SNP,如检测到主效SNP应去除后重新进行MR分析并观测结果;
S34:针对具有显著效应值的代谢物,进一步通过MR-Egger的截距与Presso分析再次对其进行多效性评估,确保最终得到的结果无水平多效性的干扰。
6.根据权利要求5所述的基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法,其特征在于,
所述S32中,当p<0.05时以MR-Egger为主要方法,当p>0.05时以逆方差加权法作为主要方法,以多重矫正后的p值对结果显著性进行筛选。
7.一种促进成人身高的营养品,其特征在于,该营养品中含有柠檬酸。
8.根据权利要求1所述的一种促进成人身高的营养品,其特征在于,该营养品适用于青春期开始后的人群。
9.根据权利要求1所述的一种促进成人身高的营养品,其特征在于,所述柠檬酸选自工业柠檬酸、柠檬或酸橙。
CN202010139836.5A 2020-03-03 2020-03-03 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 Active CN111341448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010139836.5A CN111341448B (zh) 2020-03-03 2020-03-03 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010139836.5A CN111341448B (zh) 2020-03-03 2020-03-03 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法

Publications (2)

Publication Number Publication Date
CN111341448A true CN111341448A (zh) 2020-06-26
CN111341448B CN111341448B (zh) 2023-12-19

Family

ID=71187184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010139836.5A Active CN111341448B (zh) 2020-03-03 2020-03-03 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法

Country Status (1)

Country Link
CN (1) CN111341448B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112185464A (zh) * 2020-09-29 2021-01-05 山东大学 一种基于孟德尔随机化的多性状全转录组关联分析方法、系统及其应用
CN112908478A (zh) * 2021-02-18 2021-06-04 苏州大学 基于孟德尔随机化分析肠道菌群与肥胖关系的方法
CN113096816A (zh) * 2021-03-18 2021-07-09 西安交通大学 脑疾病发病风险预测模型建立方法、系统、设备及存储介质
CN113113141A (zh) * 2021-04-02 2021-07-13 北京果壳生物科技有限公司 一种基于孟德尔随机化评估微量营养素与精神类疾病因果关系的方法
CN114171110A (zh) * 2021-10-20 2022-03-11 山东大学 一种基于联合似然的孟德尔随机化分析方法
CN116825208A (zh) * 2023-06-06 2023-09-29 吉林大学 一种基于孟德尔随机化的多因素大规模数据整合分析方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100692319B1 (ko) * 2006-02-20 2007-03-12 한국생명공학연구원 단백질 상호작용 네트워크 분석을 통한 새로운 질병관련유전자 선정방법
WO2008124187A1 (en) * 2007-04-10 2008-10-16 University Of Medicine And Dentistry Of Nj Biochemical markers for disease states and genes for identification of biochemical defects
US20120101736A1 (en) * 2010-10-25 2012-04-26 Dudley Joel T Method and System for Computing and Integrating Genetic and Environmental Health Risks for a Personal Genome
CN103119179A (zh) * 2010-07-23 2013-05-22 哈佛大学校长及研究员协会 用于检测体液中的疾病或病症标记的方法
WO2015063376A1 (en) * 2013-11-04 2015-05-07 Medisapiens Oy Method and system for estimating genomic health
WO2016201272A1 (en) * 2015-06-12 2016-12-15 King Abdulaziz City For Science And Technology Method of diagnosing patients with conditions caused by mendelian mutations
CN109994185A (zh) * 2019-04-08 2019-07-09 武汉百药联科科技有限公司 一种验证营养素是否适合个性化病人的方法
CN110349623A (zh) * 2019-01-17 2019-10-18 哈尔滨工业大学 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法
CN110610763A (zh) * 2019-09-10 2019-12-24 陕西师范大学 基于katz模型的代谢物与疾病关联关系预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100692319B1 (ko) * 2006-02-20 2007-03-12 한국생명공학연구원 단백질 상호작용 네트워크 분석을 통한 새로운 질병관련유전자 선정방법
WO2008124187A1 (en) * 2007-04-10 2008-10-16 University Of Medicine And Dentistry Of Nj Biochemical markers for disease states and genes for identification of biochemical defects
CN103119179A (zh) * 2010-07-23 2013-05-22 哈佛大学校长及研究员协会 用于检测体液中的疾病或病症标记的方法
US20120101736A1 (en) * 2010-10-25 2012-04-26 Dudley Joel T Method and System for Computing and Integrating Genetic and Environmental Health Risks for a Personal Genome
WO2015063376A1 (en) * 2013-11-04 2015-05-07 Medisapiens Oy Method and system for estimating genomic health
WO2016201272A1 (en) * 2015-06-12 2016-12-15 King Abdulaziz City For Science And Technology Method of diagnosing patients with conditions caused by mendelian mutations
CN110349623A (zh) * 2019-01-17 2019-10-18 哈尔滨工业大学 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法
CN109994185A (zh) * 2019-04-08 2019-07-09 武汉百药联科科技有限公司 一种验证营养素是否适合个性化病人的方法
CN110610763A (zh) * 2019-09-10 2019-12-24 陕西师范大学 基于katz模型的代谢物与疾病关联关系预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘娅飞: "基于孟德尔随机化探索代谢综合征相关指标间因果关系的研究" *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112185464A (zh) * 2020-09-29 2021-01-05 山东大学 一种基于孟德尔随机化的多性状全转录组关联分析方法、系统及其应用
CN112185464B (zh) * 2020-09-29 2022-12-13 山东大学 一种基于孟德尔随机化的多性状全转录组关联分析方法、系统及其应用
CN112908478A (zh) * 2021-02-18 2021-06-04 苏州大学 基于孟德尔随机化分析肠道菌群与肥胖关系的方法
CN113096816A (zh) * 2021-03-18 2021-07-09 西安交通大学 脑疾病发病风险预测模型建立方法、系统、设备及存储介质
CN113096816B (zh) * 2021-03-18 2023-06-13 西安交通大学 脑疾病发病风险预测模型建立方法、系统、设备及存储介质
CN113113141A (zh) * 2021-04-02 2021-07-13 北京果壳生物科技有限公司 一种基于孟德尔随机化评估微量营养素与精神类疾病因果关系的方法
CN114171110A (zh) * 2021-10-20 2022-03-11 山东大学 一种基于联合似然的孟德尔随机化分析方法
CN116825208A (zh) * 2023-06-06 2023-09-29 吉林大学 一种基于孟德尔随机化的多因素大规模数据整合分析方法

Also Published As

Publication number Publication date
CN111341448B (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
CN111341448B (zh) 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法
Taylor et al. Consumption of fermented foods is associated with systematic differences in the gut microbiome and metabolome
Xu Foodomics: A novel approach for food microbiology
Ren et al. Computational and statistical analysis of metabolomics data
Andersen et al. Untargeted metabolomics as a screening tool for estimating compliance to a dietary pattern
Cifuentes Food analysis: present, future, and foodomics
Claesson et al. Gut microbiota composition correlates with diet and health in the elderly
Favé et al. Development and validation of a standardized protocol to monitor human dietary exposure by metabolite fingerprinting of urine samples
Cho et al. Discovery of metabolite features for the modelling and analysis of high-resolution NMR spectra
Hu et al. Changes in the volatile components of candied kumquats in different processing methodologies with headspace–gas chromatography–ion mobility spectrometry
CN105543369B (zh) 精神障碍的生物标志物及其应用
Abreu et al. NMR metabolomics applied on the discrimination of variables influencing tomato (Solanum lycopersicum)
Ji et al. Recent advances and application of machine learning in food flavor prediction and regulation
Settachaimongkon et al. Metabolomics as an emerging strategy for the investigation of yogurt components
Kikuchi et al. NMR window of molecular complexity showing homeostasis in superorganisms
Swann et al. Nutrimetabonomics: nutritional applications of metabolic profiling
Roorkiwal et al. Genome-wide association mapping of nutritional traits for designing superior chickpea varieties
Acar et al. Forecasting chronic diseases using data fusion
Dukhi et al. Artificial intelligence approach for analyzing anaemia prevalence in children and adolescents in BRICS countries: a review
León et al. Foodomics applications
Castellano-Escuder et al. Assessing adherence to healthy dietary habits through the urinary food metabolome: results from a European two-center study
McNairn et al. Postprandial dried blood spot–based nutritional metabolomic analysis discriminates a high-fat, high-protein meat-based diet from a high carbohydrate vegan diet: a randomized controlled crossover trial
Xiaofei et al. 1H NMR‐based metabolic investigation of the effect of Lentinula edodes‐derived polysaccharides on aged mice
Zhao et al. Microbial community succession and its correlation with quality characteristics during gray sufu fermentation
CN111982972B (zh) 一种利用气味指纹图谱无创评价羊乳清蛋白抗衰老性能的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant