CN111180012A - 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 - Google Patents
一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 Download PDFInfo
- Publication number
- CN111180012A CN111180012A CN201911377048.3A CN201911377048A CN111180012A CN 111180012 A CN111180012 A CN 111180012A CN 201911377048 A CN201911377048 A CN 201911377048A CN 111180012 A CN111180012 A CN 111180012A
- Authority
- CN
- China
- Prior art keywords
- data
- whole genome
- gene
- meta
- beta
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000004927 fusion Effects 0.000 title claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 238000012098 association analyses Methods 0.000 claims abstract description 21
- 238000002474 experimental method Methods 0.000 claims abstract description 6
- 230000014509 gene expression Effects 0.000 claims description 16
- 230000000694 effects Effects 0.000 claims description 10
- 230000010354 integration Effects 0.000 claims description 8
- 206010064571 Gene mutation Diseases 0.000 claims description 6
- 238000000546 chi-square test Methods 0.000 claims description 3
- 230000035772 mutation Effects 0.000 claims description 3
- 201000010099 disease Diseases 0.000 abstract description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 8
- 238000011160 research Methods 0.000 abstract description 4
- 238000004364 calculation method Methods 0.000 abstract description 2
- 238000010219 correlation analysis Methods 0.000 abstract 1
- 238000012827 research and development Methods 0.000 abstract 1
- 208000024827 Alzheimer disease Diseases 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 4
- 238000010197 meta-analysis Methods 0.000 description 4
- 230000001717 pathogenic effect Effects 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 2
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 101150095793 PICALM gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明是一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法。所述方法采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。本发明可以极大地提高AD相关基因的识别速度,充分的利用现有的数据,提升了疾病相关基因识别的速度并节省了研发费用。计算结果可以筛选掉极大部分的基因,为后续的生物实验提供了有价值的研究范围。
Description
技术领域
本发明涉及基因识别技术领域,是一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法。
背景技术
目前,大多数学者采用开发相关试剂、构建生物实验等方法识别阿尔兹海默病(AD)相关的基因。而这些方法耗时极长、费用极高。近年来随着计算机技术的不断发展,测序技术的升级,已经存在大量计算机算法用于识别与疾病相关的基因。目前,使用全基因组关联分析(GWAS)寻找AD的风险基因是一种常用手段。这个世纪初,许多课题组都在识别AD的易感位点,但实际结果并不理想,不同课题组间所共同找到的易感基因只有sorl1。导致研究结果不一致的原因主要是由于实验样本的异质性、复杂的连锁不平衡模式、等位基因频率的差异以及样本量的大小。在过去的10年里,高通量测序技术的出现允许研究人员同时检测基因组上数以百万计的单核苷酸多态性位点(Single Nucleotide Polymorphisms,SNP)。一些大的机构和公司在高通量测序技术上的努力使得人们在近几年发现了许多新的AD的通路和易感基因。第一批将GWAS应用到AD中的研究者首先识别出了clu、picalm、cr1和bin1等4个易感基因位点。后来又有其他研究组通过更大样本量的GWAS分析找到了如cd33和epha1等易感基因位点,这些研究的实验样本都主要来自于欧洲人群。然而,GWAS仍然存在一定的局限性。例如,该策咯基于“常见疾病-常见变异”的假说,遗漏了可能在病因中起更重要作用的罕见变异(次要等位基因频率(minor allele frequency,MAF<0.005));所获得的关联SNP也不一定是真正的致病位点,而只是与真正致病位点呈LD关联的“标签”SNP,尤其是一些位于所谓的基因“荒漠区”的信号,对阐明遗传变异的生物学功能造成了很大的困难;GWAS通常根据统计学差异最明显的原则,分析单个位点的边际效应,而忽视了复杂性疾病存在的多基因的交互作用。因此,GWAS仍不能全面揭示复杂性疾病的遗传易感因素,它只是探索复杂性疾病遗传病因机制的一个重要环节,如何对GWAS易感位点进行深入挖掘并找出真正的致病位点,及探索这些非编码序列如何发挥生物学机制成为遗传学研究的又一个挑战。
研究发现,GWAS所发现的遗传易感位点约80%位于基因组的非编码区,提示其中的致病位点可能对基因表达存在调控功能。因此,本发明将表达数量性状位点定位(expression quantitative trait loci,eQTL)和甲基化数量性状基因座数据mQTL(methylation quantitative trait loci,eQTL)数据引入,结合GWAS数据,开发EB-SMR识别AD相关的基因。引入eQTL和mQTL数据是由于这两种数据可以体现SNP对基因表达的影响,而GWAS数据告知了哪些SNP与AD相关,整合这三种数据,便可知哪些SNP改变了基因表达而与AD相关。
发明内容
本发明为有效识别阿尔兹海默病相关的基因,本发明提供了一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,本发明提供了以下技术方案:
一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,包括以下步骤:
步骤1:采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;
步骤2:基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;
步骤3:基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,得到孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果;
步骤4:根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。
优选地,所述步骤1具体为:
采用经验贝叶斯元信息分析全基因组关联分析数据,全基因组关联分析数据包含SE和Beta值,SE值表示每个SNP的标准误差确定每个Beta值的权重,通过下式表示每个Beta值的权重:
其中,wi为每个Beta值的权重,SEi代表每个SNP的标准差,wi代表Beta值的权重.
通过下式表示元信息分析后的Beta值为:
其中,β为元信息分析后的Beta值,βi表示第i次实验的Beta估计值;
根据每个Beta的权重来计算元信息分析后的结果,通过下式表示元信息分析后的结果:
其中,SE为元信息分析后的结果。
优选地,所述步骤2具体为:
步骤2.1:根据元信息分析后的结果确定总体Z统计量,通过下式确定总体Z统计量:
Z=β/SE (4)
步骤2.2:将多个全基因组关联分析数据集汇总为一个数据集,采用经验贝叶斯整合整个基因组水平的所有Z统计值,令Z统计值服从方差是1的分布,确定有偏Z统计值,通过下式表示有偏Z统计值:
根据反卡方分布的性质:
通过经验贝叶斯估计确定B,因此,B的经验贝叶斯估计通过下式表示
其中,S为SNP序列,χ2为反卡方分布;
将式(15)带入式(8)中,完成了元信息分析,并修正整个基因组中每个SNP的统计值,通过下式表示修正后的真实Z的统计值
优选地,所述步骤3具体为:
步骤3.1:对孟德尔随机化进行改进,将y设置为表型,即输出变量,将x设置为基因的表达,即暴露因子,将z设置为基因突变,即工具因子;
bxy是x对于y的效果即基因的表达对于表型的影响,bzx是z对于x的效果即基因突变对于基因表达的影响,bzy是z对于y的效果即基因突变对于表型的影响,通过下式表示bxy:
bxy=bzy/bzx (17)
通过bxy的基因表达对表型的影响并刨除混杂因素;
步骤3.2:计算eQTL数据集中SNP的Zscore,记为zzy,通过下式表示zzy:
zzy=Bzy/SEe (18)
其中,Bzy为eQTL数据集中的Beta值,SEe为eQTL数据集中的标准差;
计算mQTL数据集中对应SNP的Zscore,记为zzx,通过下式表示zzx:
zzx=Bzx/SEG (19)
其中,Bzx为mQTL数据集中的Beta值,SEG为GWAS数据集中的标准差。
优选地,所述步骤4具体为:
根据zzy和zzx计算统计量Tsmr,通过下式表示Tsmr:
Tsmr服从自由度为1的卡方分布,对Tsmr进行卡方检验并求得得到基因识别概率结果P-value。
有益效果:
本发明可以极大地提高AD相关基因的识别速度,充分的利用现有的数据,是一种可靠、高效的疾病相关基因识别方法。提升了疾病相关基因识别的速度并节省了金钱。计算结果可以筛选掉极大部分的基因,为后续的生物实验提供了研究范围。
附图说明
图1是基于经验贝叶斯与改进孟德尔随机化融合的基因识别方法流程图;
图2是SMR方法流程图
图3是经验贝叶斯meta分析后的P值分布;
图4是原始GWAS、eQTL和mQTL数据SNP的p值;
图5是SMR整合后的GWAS&eQTL和GWAS&mQTL结果。
具体实施方式
以下结合具体实施例,对本发明进行了详细说明。
具体实施例一:
如图1所示,本发明提供一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,以阿尔兹海默病的全基因分析为例,具体包括以下步骤:
步骤1:采用经验贝叶斯元信息分析阿尔兹海默病的全基因组关联分析数据,得到分析结果;所述步骤1具体为:
采用经验贝叶斯元信息分析阿尔兹海默病的全基因组关联分析数据,阿尔兹海默病的全基因组关联分析数据包含SE和Beta值,SE值表示每个SNP的标准误差确定每个Beta值的权重,通过下式表示每个Beta值的权重:
其中,wi为每个Beta值的权重,SEi代表每个SNP的标准差,wi代表Beta值的权重.
通过下式表示元信息分析后的Beta值为:
其中,β为元信息分析后的Beta值,βi表示第i次实验的Beta估计值;
根据每个Beta的权重来计算元信息分析后的结果,通过下式表示元信息分析后的结果:
其中,SE为元信息分析后的结果。
步骤2:基于经验贝叶斯的综合层次元信息分析,修正阿尔兹海默病的全基因组中的每个SNP的统计值;所述步骤2具体为:
步骤2.1:根据元信息分析后的结果确定总体Z统计量,通过下式确定总体Z统计量.
Z=β/SE (4)
步骤2.2:将多个阿尔兹海默病的全基因组关联分析数据集汇总为一个数据集,采用经验贝叶斯整合整个基因组水平的所有Z统计值,令Z统计值服从方差是1的分布,确定有偏Z统计值,通过下式表示有偏Z统计值:
根据反卡方分布的性质:
通过经验贝叶斯EB估计确定B,因此,B的EB估计通过下式表示
其中,S为SNP序列,χ2为反卡方分布;
将式(15)带入式(8)中,完成了meta分析,并修正整个基因组中每个SNP的统计值,通过下式表示修正后的真实Z的统计值
步骤3:基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,得到孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果;
根据图2所示,所述步骤3具体为:
步骤3.1:对孟德尔随机化进行改进,将y设置为表型,即输出变量,将x设置为基因的表达,即暴露因子,将z设置为基因突变,即工具因子;
bxy是x对于y的效果即基因的表达对于表型的影响,bzx是z对于x的效果即基因突变对于基因表达的影响,bzy是z对于y的效果即基因突变对于表型的影响,通过下式表示bxy:
bxy=bzy/bzx (17)
通过bxy的基因表达对表型的影响并刨除混杂因素;
步骤3.2:计算eQTL数据集中SNP的Zscore,记为zzy,通过下式表示zzy:
zzy=Bzy/SEe (18)
Bzy为eQTL数据集中的Beta,SEe为eQTL数据集中的标准差;
计算mQTL数据集中对应SNP的Zscore,记为zzx,通过下式表示zzx:
zzx=Bzx/SEG(19)
其中,Bzx为mQTL数据集中的Beta值,SEG为GWAS数据集中的标准差。
步骤4:根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。
所述步骤4具体为:
根据zzy和zzx计算统计量Tsmr,通过下式表示Tsmr:
Tsmr服从自由度为1的卡方分布,对Tsmr进行卡方检验并求得得到阿尔兹海默病基因识别概率结果P-value,如图5所示SMR整合后的GWAS&eQTL和GWAS&mQTL结果。
根据图3经验贝叶斯meta分析后的P值分布,采用经验贝叶斯整合多组GWAS数据,并使用改进的孟德尔随机方法整合GWAS和eQTL、mQTL数据。
图4原始GWAS、eQTL和mQTL数据SNP的p值,首次将经验贝叶斯应用于GWAS meta分析中,首次将GWAS与eQTL和mQTL整合在一起发现新的知识。
识别出与AD相关P值很低的SNP,识别出的与AD相关的基因如下表1所示:
以上所述仅是一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法的优选实施方式,一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均属于本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。
Claims (5)
1.一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:包括以下步骤:
步骤1:采用经验贝叶斯元信息分析全基因组关联分析数据,得到分析结果;
步骤2:基于经验贝叶斯的综合层次元信息分析,修正全基因组中的每个SNP的统计值;
步骤3:基于孟德尔随机化的全基因组关联分析数据分别与eQTL和mQTL数据整合,得到孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果;
步骤4:根据孟德尔随机化的全基因组关联分析数据与eQTL和mQTL数据整合结果的重叠部分,得到基因识别结果。
2.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤1具体为:
采用经验贝叶斯元信息分析全基因组关联分析数据,全基因组关联分析数据包含SE和Beta值,SE值表示每个SNP的标准误差确定每个Beta值的权重,通过下式表示每个Beta值的权重:
wi=1/SEi 2 (1)
其中,wi为每个Beta值的权重,SEi代表每个SNP的标准差,wi代表Beta值的权重.
通过下式表示元信息分析后的Beta值为:
其中,β为元信息分析后的Beta值,βi表示第i次实验的Beta估计值;
根据每个Beta的权重来计算元信息分析后的结果,通过下式表示元信息分析后的结果:
其中,SE为元信息分析后的结果。
3.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤2具体为:
步骤2.1:根据元信息分析后的结果确定总体Z统计量,通过下式确定总体Z统计量:
Z=β/SE (4)
步骤2.2:将多个全基因组关联分析数据集汇总为一个数据集,采用经验贝叶斯整合整个基因组水平的所有Z统计值,令Z统计值服从方差是1的分布,确定有偏Z统计值,通过下式表示有偏Z统计值:
根据反卡方分布的性质:
通过经验贝叶斯估计确定B,因此,B的经验贝叶斯估计通过下式表示
其中,S为SNP序列,χ2为反卡方分布;
将式(15)带入式(8)中,完成了元信息分析,并修正整个基因组中每个SNP的统计值,通过下式表示修正后的真实Z的统计值
4.根据权利要求1所述的一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法,其特征是:所述步骤3具体为:
步骤3.1:对孟德尔随机化进行改进,将y设置为表型,即输出变量,将x设置为基因的表达,即暴露因子,将z设置为基因突变,即工具因子;
bxy是x对于y的效果即基因的表达对于表型的影响,bzx是z对于x的效果即基因突变对于基因表达的影响,bzy是z对于y的效果即基因突变对于表型的影响,通过下式表示bxy:
bxy=bzy/bzx (17)
通过bxy的基因表达对表型的影响并刨除混杂因素;
步骤3.2:计算eQTL数据集中SNP的Zscore,记为zzy,通过下式表示zzy:
zzy=Bzy/SEe (18)
其中,Bzy为eQTL数据集中的Beta值,SEe为eQTL数据集中的标准差;
计算mQTL数据集中对应SNP的Zscore,记为zzx,通过下式表示zzx:
zzx=Bzx/SEG (19)
其中,Bzx为mQTL数据集中的Beta值,SEG为GWAS数据集中的标准差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911377048.3A CN111180012A (zh) | 2019-12-27 | 2019-12-27 | 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911377048.3A CN111180012A (zh) | 2019-12-27 | 2019-12-27 | 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111180012A true CN111180012A (zh) | 2020-05-19 |
Family
ID=70658190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911377048.3A Pending CN111180012A (zh) | 2019-12-27 | 2019-12-27 | 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111180012A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114171110A (zh) * | 2021-10-20 | 2022-03-11 | 山东大学 | 一种基于联合似然的孟德尔随机化分析方法 |
CN116564410A (zh) * | 2023-05-23 | 2023-08-08 | 浙江大学 | 一种预测突变位点顺式调控基因的方法、设备和介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003018986A (ja) * | 2001-05-15 | 2003-01-21 | Hitachi Ltd | 遺伝子型シミュレーション方法 |
JP2010227079A (ja) * | 2009-03-30 | 2010-10-14 | National Institute For Environmental Studies | 胎生プログラミングに対する影響を評価するための方法 |
US20110053829A1 (en) * | 2009-09-03 | 2011-03-03 | Curevac Gmbh | Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids |
WO2011153501A2 (en) * | 2010-06-04 | 2011-12-08 | Prometheus Laboratories Inc. | Methods for improving inflammatory bowel disease diagnosis |
CN103559423A (zh) * | 2013-10-31 | 2014-02-05 | 深圳先进技术研究院 | 一种甲基化作用的预测方法、装置 |
WO2016088949A1 (ko) * | 2014-12-05 | 2016-06-09 | 연세대학교 산학협력단 | 애기장대 유전자네트워크를 이용한 식물의 복합 형질 관련 유전자 예측 시스템 |
CN106636398A (zh) * | 2016-12-21 | 2017-05-10 | 哈尔滨工业大学 | 一种改进的阿尔茨海默病发病风险预测方法 |
CN109448794A (zh) * | 2018-10-31 | 2019-03-08 | 华中农业大学 | 一种基于遗传禁忌和贝叶斯网络的上位性位点挖掘方法 |
US20190233894A1 (en) * | 2016-07-20 | 2019-08-01 | Ecole Polytechnique Federale De Lausanne (Epfl) | Methods of diagnosis alzheimer's disease |
CN110349623A (zh) * | 2019-01-17 | 2019-10-18 | 哈尔滨工业大学 | 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 |
-
2019
- 2019-12-27 CN CN201911377048.3A patent/CN111180012A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003018986A (ja) * | 2001-05-15 | 2003-01-21 | Hitachi Ltd | 遺伝子型シミュレーション方法 |
JP2010227079A (ja) * | 2009-03-30 | 2010-10-14 | National Institute For Environmental Studies | 胎生プログラミングに対する影響を評価するための方法 |
US20110053829A1 (en) * | 2009-09-03 | 2011-03-03 | Curevac Gmbh | Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids |
WO2011153501A2 (en) * | 2010-06-04 | 2011-12-08 | Prometheus Laboratories Inc. | Methods for improving inflammatory bowel disease diagnosis |
CN103559423A (zh) * | 2013-10-31 | 2014-02-05 | 深圳先进技术研究院 | 一种甲基化作用的预测方法、装置 |
WO2016088949A1 (ko) * | 2014-12-05 | 2016-06-09 | 연세대학교 산학협력단 | 애기장대 유전자네트워크를 이용한 식물의 복합 형질 관련 유전자 예측 시스템 |
US20190233894A1 (en) * | 2016-07-20 | 2019-08-01 | Ecole Polytechnique Federale De Lausanne (Epfl) | Methods of diagnosis alzheimer's disease |
CN106636398A (zh) * | 2016-12-21 | 2017-05-10 | 哈尔滨工业大学 | 一种改进的阿尔茨海默病发病风险预测方法 |
CN109448794A (zh) * | 2018-10-31 | 2019-03-08 | 华中农业大学 | 一种基于遗传禁忌和贝叶斯网络的上位性位点挖掘方法 |
CN110349623A (zh) * | 2019-01-17 | 2019-10-18 | 哈尔滨工业大学 | 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 |
Non-Patent Citations (2)
Title |
---|
ZHAO T,HU Y,ZANG T AND WANG Y: "Integrate GWAS, eQTL, and mQTL Data to Indentify Alzheimer"s Disease Related Genes", 《FRONTIERS IN GENETICS》 * |
陈莉莉: "基于群体数据的基因定位关联分析方法研究与应用", 《中国博士论文全文数据库》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114171110A (zh) * | 2021-10-20 | 2022-03-11 | 山东大学 | 一种基于联合似然的孟德尔随机化分析方法 |
CN114171110B (zh) * | 2021-10-20 | 2022-12-20 | 山东大学 | 一种基于联合似然的孟德尔随机化分析方法 |
CN116564410A (zh) * | 2023-05-23 | 2023-08-08 | 浙江大学 | 一种预测突变位点顺式调控基因的方法、设备和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220415435A1 (en) | Methods and processes for non-invasive assessment of genetic variations | |
US10266893B2 (en) | System and method for cleaning noisy genetic data and determining chromosome copy number | |
US20210054459A1 (en) | System and method for cleaning noisy genetic data and determining chromosome copy number | |
Gompert et al. | Detection of individual ploidy levels with genotyping‐by‐sequencing (GBS) analysis | |
US20200075126A1 (en) | Methods and processes for non-invasive assessment of genetic variations | |
Browning et al. | Haplotype phasing: existing methods and new developments | |
US7937225B2 (en) | Systems, methods and software arrangements for detection of genome copy number variation | |
BR112016007401B1 (pt) | Método para determinar a presença ou ausência de uma aneuploidia cromossômica em uma amostra | |
Hills et al. | BAIT: Organizing genomes and mapping rearrangements in single cells | |
CN111180012A (zh) | 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 | |
CN108137642A (zh) | 分子质量保证方法在测序中的应用 | |
Wood et al. | Recommendations for accurate resolution of gene and isoform allele-specific expression in RNA-Seq data | |
Cartwright et al. | A family-based probabilistic method for capturing de novo mutations from high-throughput short-read sequencing data | |
CN109461473B (zh) | 胎儿游离dna浓度获取方法和装置 | |
Weisburd et al. | Insights from a genome-wide truth set of tandem repeat variation | |
CN116052766A (zh) | 一种染色体纯合区域的检测方法、系统及电子设备 | |
US20040219567A1 (en) | Methods for global pattern discovery of genetic association in mapping genetic traits | |
Liu et al. | The impact of missing and erroneous genotypes on tagging SNP selection and power of subsequent association tests | |
O'Dushlaine et al. | Marked variation in predicted and observed variability of tandem repeat loci across the human genome | |
Zheng et al. | A structural variation genotyping algorithm enhanced by CNV quantitative transfer | |
Alayoubi et al. | Scanpro: robust proportion analysis for single cell resolution data | |
Flickinger | Detecting and Correcting Contamination in Genetic Data. | |
Prodanov et al. | A multilocus approach for accurate variant calling in low-copy repeats using whole-genome sequencing | |
CN117953966A (zh) | 一种基于扩增捕获的小panel检测CNV的方法 | |
Hedges | Bioinformatics of Human Genetic Disease Studies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200519 |
|
RJ01 | Rejection of invention patent application after publication |