CN111180012A - 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 - Google Patents

一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 Download PDF

Info

Publication number
CN111180012A
CN111180012A CN201911377048.3A CN201911377048A CN111180012A CN 111180012 A CN111180012 A CN 111180012A CN 201911377048 A CN201911377048 A CN 201911377048A CN 111180012 A CN111180012 A CN 111180012A
Authority
CN
China
Prior art keywords
data
whole genome
gene
meta
beta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911377048.3A
Other languages
English (en)
Inventor
赵天意
臧天仪
胡杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201911377048.3A priority Critical patent/CN111180012A/zh
Publication of CN111180012A publication Critical patent/CN111180012A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明是一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法。所述方法采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。本发明可以极大地提高AD相关基因的识别速度,充分的利用现有的数据,提升了疾病相关基因识别的速度并节省了研发费用。计算结果可以筛选掉极大部分的基因,为后续的生物实验提供了有价值的研究范围。

Description

一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法
技术领域
本发明涉及基因识别技术领域,是一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法。
背景技术
目前,大多数学者采用开发相关试剂、构建生物实验等方法识别阿尔兹海默病(AD)相关的基因。而这些方法耗时极长、费用极高。近年来随着计算机技术的不断发展,测序技术的升级,已经存在大量计算机算法用于识别与疾病相关的基因。目前,使用全基因组关联分析(GWAS)寻找AD的风险基因是一种常用手段。这个世纪初,许多课题组都在识别AD的易感位点,但实际结果并不理想,不同课题组间所共同找到的易感基因只有sorl1。导致研究结果不一致的原因主要是由于实验样本的异质性、复杂的连锁不平衡模式、等位基因频率的差异以及样本量的大小。在过去的10年里,高通量测序技术的出现允许研究人员同时检测基因组上数以百万计的单核苷酸多态性位点(Single Nucleotide Polymorphisms,SNP)。一些大的机构和公司在高通量测序技术上的努力使得人们在近几年发现了许多新的AD的通路和易感基因。第一批将GWAS应用到AD中的研究者首先识别出了clu、picalm、cr1和bin1等4个易感基因位点。后来又有其他研究组通过更大样本量的GWAS分析找到了如cd33和epha1等易感基因位点,这些研究的实验样本都主要来自于欧洲人群。然而,GWAS仍然存在一定的局限性。例如,该策咯基于“常见疾病-常见变异”的假说,遗漏了可能在病因中起更重要作用的罕见变异(次要等位基因频率(minor allele frequency,MAF<0.005));所获得的关联SNP也不一定是真正的致病位点,而只是与真正致病位点呈LD关联的“标签”SNP,尤其是一些位于所谓的基因“荒漠区”的信号,对阐明遗传变异的生物学功能造成了很大的困难;GWAS通常根据统计学差异最明显的原则,分析单个位点的边际效应,而忽视了复杂性疾病存在的多基因的交互作用。因此,GWAS仍不能全面揭示复杂性疾病的遗传易感因素,它只是探索复杂性疾病遗传病因机制的一个重要环节,如何对GWAS易感位点进行深入挖掘并找出真正的致病位点,及探索这些非编码序列如何发挥生物学机制成为遗传学研究的又一个挑战。
研究发现,GWAS所发现的遗传易感位点约80%位于基因组的非编码区,提示其中的致病位点可能对基因表达存在调控功能。因此,本发明将表达数量性状位点定位(expression quantitative trait loci,eQTL)和甲基化数量性状基因座数据mQTL(methylation quantitative trait loci,eQTL)数据引入,结合GWAS数据,开发EB-SMR识别AD相关的基因。引入eQTL和mQTL数据是由于这两种数据可以体现SNP对基因表达的影响,而GWAS数据告知了哪些SNP与AD相关,整合这三种数据,便可知哪些SNP改变了基因表达而与AD相关。
发明内容
本发明为有效识别阿尔兹海默病相关的基因,本发明提供了一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,本发明提供了以下技术方案:
一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,包括以下步骤:
步骤1:采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;
步骤2:基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;
步骤3:基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,得到孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果;
步骤4:根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。
优选地,所述步骤1具体为:
采用经验贝叶斯元信息分析全基因组关联分析数据,全基因组关联分析数据包含SE和Beta值,SE值表示每个SNP的标准误差确定每个Beta值的权重,通过下式表示每个Beta值的权重:
Figure BDA0002341262090000021
其中,wi为每个Beta值的权重,SEi代表每个SNP的标准差,wi代表Beta值的权重.
通过下式表示元信息分析后的Beta值为:
Figure BDA0002341262090000022
其中,β为元信息分析后的Beta值,βi表示第i次实验的Beta估计值;
根据每个Beta的权重来计算元信息分析后的结果,通过下式表示元信息分析后的结果:
Figure BDA0002341262090000023
其中,SE为元信息分析后的结果。
优选地,所述步骤2具体为:
步骤2.1:根据元信息分析后的结果确定总体Z统计量,通过下式确定总体Z统计量:
Z=β/SE (4)
步骤2.2:将多个全基因组关联分析数据集汇总为一个数据集,采用经验贝叶斯整合整个基因组水平的所有Z统计值,令Z统计值服从方差是1的分布,确定有偏Z统计值,通过下式表示有偏Z统计值:
Figure BDA0002341262090000031
其中,
Figure BDA0002341262090000032
为有偏Z统计值,Zi为真实Z统计量,N为方差分布;
真实Z统计量Zi服从正态分布,通过下式表示
Figure BDA0002341262090000033
的正态分布、边缘分布和后验分布:
Figure BDA0002341262090000034
Figure BDA0002341262090000035
Figure BDA0002341262090000036
Figure BDA0002341262090000037
其中,式(6)至式(8)分别表示
Figure BDA0002341262090000038
的正态分布、边缘分布和后验分布,B为经验贝叶斯的正态分布参量,σ为正态分布的标准差,θ为正态分布的均值;
通过
Figure BDA0002341262090000039
的平均值估计正态分布的均值θ:
Figure BDA00023412620900000310
Figure BDA00023412620900000311
Figure BDA00023412620900000312
根据反卡方分布的性质:
Figure BDA00023412620900000313
Figure BDA00023412620900000314
通过经验贝叶斯估计确定B,因此,B的经验贝叶斯估计通过下式表示
Figure BDA00023412620900000315
其中,S为SNP序列,χ2为反卡方分布;
将式(15)带入式(8)中,完成了元信息分析,并修正整个基因组中每个SNP的统计值,通过下式表示修正后的真实Z的统计值
Figure BDA0002341262090000041
优选地,所述步骤3具体为:
步骤3.1:对孟德尔随机化进行改进,将y设置为表型,即输出变量,将x设置为基因的表达,即暴露因子,将z设置为基因突变,即工具因子;
bxy是x对于y的效果即基因的表达对于表型的影响,bzx是z对于x的效果即基因突变对于基因表达的影响,bzy是z对于y的效果即基因突变对于表型的影响,通过下式表示bxy
bxy=bzy/bzx (17)
通过bxy的基因表达对表型的影响并刨除混杂因素;
步骤3.2:计算eQTL数据集中SNP的Zscore,记为zzy,通过下式表示zzy
zzy=Bzy/SEe (18)
其中,Bzy为eQTL数据集中的Beta值,SEe为eQTL数据集中的标准差;
计算mQTL数据集中对应SNP的Zscore,记为zzx,通过下式表示zzx
zzx=Bzx/SEG (19)
其中,Bzx为mQTL数据集中的Beta值,SEG为GWAS数据集中的标准差。
优选地,所述步骤4具体为:
根据zzy和zzx计算统计量Tsmr,通过下式表示Tsmr
Figure BDA0002341262090000042
Tsmr服从自由度为1的卡方分布,对Tsmr进行卡方检验并求得得到基因识别概率结果P-value。
有益效果:
本发明可以极大地提高AD相关基因的识别速度,充分的利用现有的数据,是一种可靠、高效的疾病相关基因识别方法。提升了疾病相关基因识别的速度并节省了金钱。计算结果可以筛选掉极大部分的基因,为后续的生物实验提供了研究范围。
附图说明
图1是基于经验贝叶斯与改进孟德尔随机化融合的基因识别方法流程图;
图2是SMR方法流程图
图3是经验贝叶斯meta分析后的P值分布;
图4是原始GWAS、eQTL和mQTL数据SNP的p值;
图5是SMR整合后的GWAS&eQTL和GWAS&mQTL结果。
具体实施方式
以下结合具体实施例,对本发明进行了详细说明。
具体实施例一:
如图1所示,本发明提供一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,以阿尔兹海默病的全基因分析为例,具体包括以下步骤:
步骤1:采用经验贝叶斯元信息分析阿尔兹海默病的全基因组关联分析数据,得到分析结果;所述步骤1具体为:
采用经验贝叶斯元信息分析阿尔兹海默病的全基因组关联分析数据,阿尔兹海默病的全基因组关联分析数据包含SE和Beta值,SE值表示每个SNP的标准误差确定每个Beta值的权重,通过下式表示每个Beta值的权重:
Figure BDA0002341262090000051
其中,wi为每个Beta值的权重,SEi代表每个SNP的标准差,wi代表Beta值的权重.
通过下式表示元信息分析后的Beta值为:
Figure BDA0002341262090000052
其中,β为元信息分析后的Beta值,βi表示第i次实验的Beta估计值;
根据每个Beta的权重来计算元信息分析后的结果,通过下式表示元信息分析后的结果:
Figure BDA0002341262090000053
其中,SE为元信息分析后的结果。
步骤2:基于经验贝叶斯的综合层次元信息分析,修正阿尔兹海默病的全基因组中的每个SNP的统计值;所述步骤2具体为:
步骤2.1:根据元信息分析后的结果确定总体Z统计量,通过下式确定总体Z统计量.
Z=β/SE (4)
步骤2.2:将多个阿尔兹海默病的全基因组关联分析数据集汇总为一个数据集,采用经验贝叶斯整合整个基因组水平的所有Z统计值,令Z统计值服从方差是1的分布,确定有偏Z统计值,通过下式表示有偏Z统计值:
Figure BDA0002341262090000061
其中,
Figure BDA0002341262090000062
为有偏Z统计值,Zi为真实Z统计量;
真实Z统计量Zi服从正态分布,通过下式表示
Figure BDA0002341262090000063
的正态分布、边缘分布和后验分布:
Figure BDA0002341262090000064
Figure BDA0002341262090000065
Figure BDA0002341262090000066
Figure BDA0002341262090000067
其中,式(6)至式(8)分别表示
Figure BDA0002341262090000068
的正态分布、边缘分布和后验分布,B为经验贝叶斯的正态分布参量,σ为正态分布的标准差,θ为正态分布的均值;
通过
Figure BDA0002341262090000069
的平均值估计θ,
Figure BDA00023412620900000610
Figure BDA00023412620900000611
Figure BDA00023412620900000612
根据反卡方分布的性质:
Figure BDA00023412620900000613
Figure BDA00023412620900000614
通过经验贝叶斯EB估计确定B,因此,B的EB估计通过下式表示
Figure BDA00023412620900000615
其中,S为SNP序列,χ2为反卡方分布;
将式(15)带入式(8)中,完成了meta分析,并修正整个基因组中每个SNP的统计值,通过下式表示修正后的真实Z的统计值
Figure BDA0002341262090000071
步骤3:基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,得到孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果;
根据图2所示,所述步骤3具体为:
步骤3.1:对孟德尔随机化进行改进,将y设置为表型,即输出变量,将x设置为基因的表达,即暴露因子,将z设置为基因突变,即工具因子;
bxy是x对于y的效果即基因的表达对于表型的影响,bzx是z对于x的效果即基因突变对于基因表达的影响,bzy是z对于y的效果即基因突变对于表型的影响,通过下式表示bxy
bxy=bzy/bzx (17)
通过bxy的基因表达对表型的影响并刨除混杂因素;
步骤3.2:计算eQTL数据集中SNP的Zscore,记为zzy,通过下式表示zzy
zzy=Bzy/SEe (18)
Bzy为eQTL数据集中的Beta,SEe为eQTL数据集中的标准差;
计算mQTL数据集中对应SNP的Zscore,记为zzx,通过下式表示zzx
zzx=Bzx/SEG(19)
其中,Bzx为mQTL数据集中的Beta值,SEG为GWAS数据集中的标准差。
步骤4:根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。
所述步骤4具体为:
根据zzy和zzx计算统计量Tsmr,通过下式表示Tsmr
Figure BDA0002341262090000072
Tsmr服从自由度为1的卡方分布,对Tsmr进行卡方检验并求得得到阿尔兹海默病基因识别概率结果P-value,如图5所示SMR整合后的GWAS&eQTL和GWAS&mQTL结果。
根据图3经验贝叶斯meta分析后的P值分布,采用经验贝叶斯整合多组GWAS数据,并使用改进的孟德尔随机方法整合GWAS和eQTL、mQTL数据。
图4原始GWAS、eQTL和mQTL数据SNP的p值,首次将经验贝叶斯应用于GWAS meta分析中,首次将GWAS与eQTL和mQTL整合在一起发现新的知识。
识别出与AD相关P值很低的SNP,识别出的与AD相关的基因如下表1所示:
Figure BDA0002341262090000081
以上所述仅是一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法的优选实施方式,一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均属于本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。

Claims (5)

1.一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:包括以下步骤:
步骤1:采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;
步骤2:基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;
步骤3:基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,得到孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果;
步骤4:根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。
2.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤1具体为:
采用经验贝叶斯元信息分析全基因组关联分析数据,全基因组关联分析数据包含SE和Beta值,SE值表示每个SNP的标准误差确定每个Beta值的权重,通过下式表示每个Beta值的权重:
wi=1/SEi 2 (1)
其中,wi为每个Beta值的权重,SEi代表每个SNP的标准差,wi代表Beta值的权重.
通过下式表示元信息分析后的Beta值为:
Figure FDA0002341262080000011
其中,β为元信息分析后的Beta值,βi表示第i次实验的Beta估计值;
根据每个Beta的权重来计算元信息分析后的结果,通过下式表示元信息分析后的结果:
Figure FDA0002341262080000012
其中,SE为元信息分析后的结果。
3.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤2具体为:
步骤2.1:根据元信息分析后的结果确定总体Z统计量,通过下式确定总体Z统计量:
Z=β/SE (4)
步骤2.2:将多个全基因组关联分析数据集汇总为一个数据集,采用经验贝叶斯整合整个基因组水平的所有Z统计值,令Z统计值服从方差是1的分布,确定有偏Z统计值,通过下式表示有偏Z统计值:
Figure FDA0002341262080000013
其中,
Figure FDA0002341262080000021
为有偏Z统计值,Zi为真实Z统计量,N为方差分布;
真实Z统计量Zi服从正态分布,通过下式表示
Figure FDA0002341262080000022
的正态分布、边缘分布和后验分布:
Figure FDA0002341262080000023
Figure FDA0002341262080000024
Figure FDA0002341262080000025
Figure FDA0002341262080000026
其中,式(6)至式(8)分别表示
Figure FDA0002341262080000027
的正态分布、边缘分布和后验分布,B为经验贝叶斯的正态分布参量,σ为正态分布的标准差,θ为正态分布的均值;
通过
Figure FDA0002341262080000028
的平均值估计正态分布的均值θ:
Figure FDA0002341262080000029
Figure FDA00023412620800000210
Figure FDA00023412620800000211
根据反卡方分布的性质:
Figure FDA00023412620800000212
Figure FDA00023412620800000213
通过经验贝叶斯估计确定B,因此,B的经验贝叶斯估计通过下式表示
Figure FDA00023412620800000214
其中,S为SNP序列,χ2为反卡方分布;
将式(15)带入式(8)中,完成了元信息分析,并修正整个基因组中每个SNP的统计值,通过下式表示修正后的真实Z的统计值
Figure FDA00023412620800000215
4.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤3具体为:
步骤3.1:对孟德尔随机化进行改进,将y设置为表型,即输出变量,将x设置为基因的表达,即暴露因子,将z设置为基因突变,即工具因子;
bxy是x对于y的效果即基因的表达对于表型的影响,bzx是z对于x的效果即基因突变对于基因表达的影响,bzy是z对于y的效果即基因突变对于表型的影响,通过下式表示bxy
bxy=bzy/bzx (17)
通过bxy的基因表达对表型的影响并刨除混杂因素;
步骤3.2:计算eQTL数据集中SNP的Zscore,记为zzy,通过下式表示zzy
zzy=Bzy/SEe (18)
其中,Bzy为eQTL数据集中的Beta值,SEe为eQTL数据集中的标准差;
计算mQTL数据集中对应SNP的Zscore,记为zzx,通过下式表示zzx
zzx=Bzx/SEG (19)
其中,Bzx为mQTL数据集中的Beta值,SEG为GWAS数据集中的标准差。
5.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤4具体为:
根据zzy和zzx计算统计量Tsmr,通过下式表示Tsmr
Figure FDA0002341262080000031
Tsmr服从自由度为1的卡方分布,对Tsmr进行卡方检验并求得得到基因识别概率结果P-value。
CN201911377048.3A 2019-12-27 2019-12-27 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 Pending CN111180012A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911377048.3A CN111180012A (zh) 2019-12-27 2019-12-27 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911377048.3A CN111180012A (zh) 2019-12-27 2019-12-27 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法

Publications (1)

Publication Number Publication Date
CN111180012A true CN111180012A (zh) 2020-05-19

Family

ID=70658190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911377048.3A Pending CN111180012A (zh) 2019-12-27 2019-12-27 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法

Country Status (1)

Country Link
CN (1) CN111180012A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114171110A (zh) * 2021-10-20 2022-03-11 山东大学 一种基于联合似然的孟德尔随机化分析方法
CN116564410A (zh) * 2023-05-23 2023-08-08 浙江大学 一种预测突变位点顺式调控基因的方法、设备和介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003018986A (ja) * 2001-05-15 2003-01-21 Hitachi Ltd 遺伝子型シミュレーション方法
JP2010227079A (ja) * 2009-03-30 2010-10-14 National Institute For Environmental Studies 胎生プログラミングに対する影響を評価するための方法
US20110053829A1 (en) * 2009-09-03 2011-03-03 Curevac Gmbh Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids
WO2011153501A2 (en) * 2010-06-04 2011-12-08 Prometheus Laboratories Inc. Methods for improving inflammatory bowel disease diagnosis
CN103559423A (zh) * 2013-10-31 2014-02-05 深圳先进技术研究院 一种甲基化作用的预测方法、装置
WO2016088949A1 (ko) * 2014-12-05 2016-06-09 연세대학교 산학협력단 애기장대 유전자네트워크를 이용한 식물의 복합 형질 관련 유전자 예측 시스템
CN106636398A (zh) * 2016-12-21 2017-05-10 哈尔滨工业大学 一种改进的阿尔茨海默病发病风险预测方法
CN109448794A (zh) * 2018-10-31 2019-03-08 华中农业大学 一种基于遗传禁忌和贝叶斯网络的上位性位点挖掘方法
US20190233894A1 (en) * 2016-07-20 2019-08-01 Ecole Polytechnique Federale De Lausanne (Epfl) Methods of diagnosis alzheimer's disease
CN110349623A (zh) * 2019-01-17 2019-10-18 哈尔滨工业大学 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003018986A (ja) * 2001-05-15 2003-01-21 Hitachi Ltd 遺伝子型シミュレーション方法
JP2010227079A (ja) * 2009-03-30 2010-10-14 National Institute For Environmental Studies 胎生プログラミングに対する影響を評価するための方法
US20110053829A1 (en) * 2009-09-03 2011-03-03 Curevac Gmbh Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids
WO2011153501A2 (en) * 2010-06-04 2011-12-08 Prometheus Laboratories Inc. Methods for improving inflammatory bowel disease diagnosis
CN103559423A (zh) * 2013-10-31 2014-02-05 深圳先进技术研究院 一种甲基化作用的预测方法、装置
WO2016088949A1 (ko) * 2014-12-05 2016-06-09 연세대학교 산학협력단 애기장대 유전자네트워크를 이용한 식물의 복합 형질 관련 유전자 예측 시스템
US20190233894A1 (en) * 2016-07-20 2019-08-01 Ecole Polytechnique Federale De Lausanne (Epfl) Methods of diagnosis alzheimer's disease
CN106636398A (zh) * 2016-12-21 2017-05-10 哈尔滨工业大学 一种改进的阿尔茨海默病发病风险预测方法
CN109448794A (zh) * 2018-10-31 2019-03-08 华中农业大学 一种基于遗传禁忌和贝叶斯网络的上位性位点挖掘方法
CN110349623A (zh) * 2019-01-17 2019-10-18 哈尔滨工业大学 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHAO T,HU Y,ZANG T AND WANG Y: "Integrate GWAS, eQTL, and mQTL Data to Indentify Alzheimer"s Disease Related Genes", 《FRONTIERS IN GENETICS》 *
陈莉莉: "基于群体数据的基因定位关联分析方法研究与应用", 《中国博士论文全文数据库》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114171110A (zh) * 2021-10-20 2022-03-11 山东大学 一种基于联合似然的孟德尔随机化分析方法
CN114171110B (zh) * 2021-10-20 2022-12-20 山东大学 一种基于联合似然的孟德尔随机化分析方法
CN116564410A (zh) * 2023-05-23 2023-08-08 浙江大学 一种预测突变位点顺式调控基因的方法、设备和介质

Similar Documents

Publication Publication Date Title
US20220415435A1 (en) Methods and processes for non-invasive assessment of genetic variations
US10266893B2 (en) System and method for cleaning noisy genetic data and determining chromosome copy number
US20210054459A1 (en) System and method for cleaning noisy genetic data and determining chromosome copy number
Gompert et al. Detection of individual ploidy levels with genotyping‐by‐sequencing (GBS) analysis
US20200075126A1 (en) Methods and processes for non-invasive assessment of genetic variations
Browning et al. Haplotype phasing: existing methods and new developments
US7937225B2 (en) Systems, methods and software arrangements for detection of genome copy number variation
BR112016007401B1 (pt) Método para determinar a presença ou ausência de uma aneuploidia cromossômica em uma amostra
Hills et al. BAIT: Organizing genomes and mapping rearrangements in single cells
CN111180012A (zh) 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法
CN108137642A (zh) 分子质量保证方法在测序中的应用
Wood et al. Recommendations for accurate resolution of gene and isoform allele-specific expression in RNA-Seq data
Cartwright et al. A family-based probabilistic method for capturing de novo mutations from high-throughput short-read sequencing data
CN109461473B (zh) 胎儿游离dna浓度获取方法和装置
Weisburd et al. Insights from a genome-wide truth set of tandem repeat variation
CN116052766A (zh) 一种染色体纯合区域的检测方法、系统及电子设备
US20040219567A1 (en) Methods for global pattern discovery of genetic association in mapping genetic traits
Liu et al. The impact of missing and erroneous genotypes on tagging SNP selection and power of subsequent association tests
O'Dushlaine et al. Marked variation in predicted and observed variability of tandem repeat loci across the human genome
Zheng et al. A structural variation genotyping algorithm enhanced by CNV quantitative transfer
Alayoubi et al. Scanpro: robust proportion analysis for single cell resolution data
Flickinger Detecting and Correcting Contamination in Genetic Data.
Prodanov et al. A multilocus approach for accurate variant calling in low-copy repeats using whole-genome sequencing
CN117953966A (zh) 一种基于扩增捕获的小panel检测CNV的方法
Hedges Bioinformatics of Human Genetic Disease Studies

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200519

RJ01 Rejection of invention patent application after publication