CN110349623A - 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 - Google Patents
基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 Download PDFInfo
- Publication number
- CN110349623A CN110349623A CN201910043414.5A CN201910043414A CN110349623A CN 110349623 A CN110349623 A CN 110349623A CN 201910043414 A CN201910043414 A CN 201910043414A CN 110349623 A CN110349623 A CN 110349623A
- Authority
- CN
- China
- Prior art keywords
- gene
- snp
- senile dementia
- selection method
- gwas
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 65
- 208000024827 Alzheimer disease Diseases 0.000 title claims abstract description 27
- 206010039966 Senile dementia Diseases 0.000 title claims abstract description 23
- 238000010187 selection method Methods 0.000 title claims abstract description 20
- 230000000694 effects Effects 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims abstract description 7
- 238000000546 chi-square test Methods 0.000 claims abstract description 4
- 230000014509 gene expression Effects 0.000 claims description 28
- 206010064571 Gene mutation Diseases 0.000 claims description 11
- 238000000034 method Methods 0.000 claims description 7
- 230000006872 improvement Effects 0.000 claims description 5
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 4
- 239000003814 drug Substances 0.000 abstract description 3
- 229940079593 drug Drugs 0.000 abstract description 3
- 230000003466 anti-cipated effect Effects 0.000 abstract description 2
- 238000003209 gene knockout Methods 0.000 abstract description 2
- 238000012827 research and development Methods 0.000 abstract description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 25
- 201000010099 disease Diseases 0.000 description 24
- 238000011160 research Methods 0.000 description 10
- 230000007246 mechanism Effects 0.000 description 8
- 230000032683 aging Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000001717 pathogenic effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 208000015122 neurodegenerative disease Diseases 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 230000004770 neurodegeneration Effects 0.000 description 4
- 208000021018 autosomal dominant inheritance Diseases 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 2
- 206010012289 Dementia Diseases 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 101150037123 APOE gene Proteins 0.000 description 1
- 108010078286 Ataxins Proteins 0.000 description 1
- 102000014461 Ataxins Human genes 0.000 description 1
- 102100027209 CD2-associated protein Human genes 0.000 description 1
- 102000056162 CELF1 Human genes 0.000 description 1
- 108700015925 CELF1 Proteins 0.000 description 1
- 101150107790 CELF1 gene Proteins 0.000 description 1
- 102100035605 Cas scaffolding protein family member 4 Human genes 0.000 description 1
- 206010008025 Cerebellar ataxia Diseases 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 108010055211 EphA1 Receptor Proteins 0.000 description 1
- 102100030322 Ephrin type-A receptor 1 Human genes 0.000 description 1
- 102100040684 Fermitin family homolog 2 Human genes 0.000 description 1
- 102000018899 Glutamate Receptors Human genes 0.000 description 1
- 108010027915 Glutamate Receptors Proteins 0.000 description 1
- 102100028640 HLA class II histocompatibility antigen, DR beta 5 chain Human genes 0.000 description 1
- 108010016996 HLA-DRB5 Chains Proteins 0.000 description 1
- 101000914499 Homo sapiens CD2-associated protein Proteins 0.000 description 1
- 101000947106 Homo sapiens Cas scaffolding protein family member 4 Proteins 0.000 description 1
- 101000892677 Homo sapiens Fermitin family homolog 2 Proteins 0.000 description 1
- 101000970561 Homo sapiens Myc box-dependent-interacting protein 1 Proteins 0.000 description 1
- 101000616502 Homo sapiens Phosphatidylinositol 3,4,5-trisphosphate 5-phosphatase 1 Proteins 0.000 description 1
- 101000583474 Homo sapiens Phosphatidylinositol-binding clathrin assembly protein Proteins 0.000 description 1
- 101000929663 Homo sapiens Phospholipid-transporting ATPase ABCA7 Proteins 0.000 description 1
- 101000878540 Homo sapiens Protein-tyrosine kinase 2-beta Proteins 0.000 description 1
- 101000773116 Homo sapiens Thioredoxin domain-containing protein 3 Proteins 0.000 description 1
- 101000795117 Homo sapiens Triggering receptor expressed on myeloid cells 2 Proteins 0.000 description 1
- 101000788823 Homo sapiens Zinc finger CW-type PWWP domain protein 1 Proteins 0.000 description 1
- 102000055120 MEF2 Transcription Factors Human genes 0.000 description 1
- 108010018650 MEF2 Transcription Factors Proteins 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 206010052641 Mitochondrial DNA mutation Diseases 0.000 description 1
- 102100021970 Myc box-dependent-interacting protein 1 Human genes 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 101150095793 PICALM gene Proteins 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 102100021797 Phosphatidylinositol 3,4,5-trisphosphate 5-phosphatase 1 Human genes 0.000 description 1
- 102100031014 Phosphatidylinositol-binding clathrin assembly protein Human genes 0.000 description 1
- 102100036620 Phospholipid-transporting ATPase ABCA7 Human genes 0.000 description 1
- 102000012412 Presenilin-1 Human genes 0.000 description 1
- 108010036933 Presenilin-1 Proteins 0.000 description 1
- 102000012419 Presenilin-2 Human genes 0.000 description 1
- 108010036908 Presenilin-2 Proteins 0.000 description 1
- 102100037787 Protein-tyrosine kinase 2-beta Human genes 0.000 description 1
- 108060009345 SORL1 Proteins 0.000 description 1
- 102100025639 Sortilin-related receptor Human genes 0.000 description 1
- 208000009415 Spinocerebellar Ataxias Diseases 0.000 description 1
- 102100030271 Thioredoxin domain-containing protein 3 Human genes 0.000 description 1
- 102100029678 Triggering receptor expressed on myeloid cells 2 Human genes 0.000 description 1
- 102100025363 Zinc finger CW-type PWWP domain protein 1 Human genes 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 101150036080 at gene Proteins 0.000 description 1
- 201000004562 autosomal dominant cerebellar ataxia Diseases 0.000 description 1
- 230000008335 axon cargo transport Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 101150030367 cls gene Proteins 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000005786 degenerative changes Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 208000013403 hyperactivity Diseases 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 125000003473 lipid group Chemical group 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000018343 nutrient deficiency Nutrition 0.000 description 1
- 238000009400 out breeding Methods 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 239000003642 reactive oxygen metabolite Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 208000002320 spinal muscular atrophy Diseases 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,属于阿尔茨海默病相关基因及位点筛选领域。本发明具体步骤为取GWAS数据为x、eQTL数据为y,SNP数据为z;得到x对于y的效果为bxy、z对于x的效果bzx、z对于y的效果为bzy;定义bxy为bxy=bzy/bzx;计算eQTL数据集中SNP的Z‑score;计算GWAS数据集中对应SNP的Z‑score;计算统计量Tsmr并服从自由度为1的卡方分布;对Tsmr进行卡方检验并求得P‑value;根据P‑value的大小进行筛选。本发明发现更多与AD相关的基因与位点,在做基因筛查的时候可以预知患病风险,对于基因靶向药物的研发也有极其重要的意义。在极端情况下,可以进行基因敲除手术使患者康复。
Description
技术领域
本发明涉及基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,属于老年痴呆病相关基因及位点筛选领域。
背景技术
衰老是生物界中普遍存在的规律,每个生物体都不可避免会经历衰老这一过程。衰老机理的研究是揭开衰老的本质和防治老年性疾病的一个重要环节。在衰老的过程中,阿兹海默症Alzheimer’s Disease,AD,即老年痴呆病)这一类神经退行性疾病扮演着相当重要的角色,诸多研究表明老年痴呆病等神经退行性疾病与衰老密切相关,它们之间存在着许多相互作用。神经退行性疾病(Degenerative diseases of the central nervoussystem,ND)是一组神经功能退行性改变为特征的疾病的总称,包括老年痴呆病、帕金森综合症(Parkinson’s Diseases,PD)、亨廷顿舞蹈病(Huntington’s Disease,HD)、不同类型脊髓小脑共济失调、肌萎缩侧索硬化症及脊髓肌萎缩症等。神经退行性疾病的发生是由多种不同原因导致的,包括神经元或神经胶质细胞的营养缺乏、轴突传递功能受损、谷氨酸受体活性过高、活性氧水平过高、代谢通路受损、线粒体能量产生减少、折叠错误的蛋白质形成增加或降解不充分、炎症过程、病毒感染、细胞核或线粒体DNA突变以及RNA或蛋白质的加工过程不正确所致的特殊蛋白质或脂质部分功能的损失或增加等因素。目前对神经退行性疾病的机理及治疗已进行了大量的研究,但至今尚无有效并且成熟的方法和药物来防止防治这类疾病。
约0.1%的患者具有常染色体显性遗传,且通常在65岁前便已发病,被称为早发型阿兹海默综合征。大多数家族性常染色体显性遗传主要出现在三个基因突变中:编码APP基因、编码早老素1和2基因。这些基因的突变多导致SP的重要组成多肽Aβ42的增加。这类基因中也有些突变会导致Aβ42的增加,从而降低了Aβ42的含量,进而起到了抑制AD的作用。但多数病人中并不存在这些常染色体显性遗传的基因突变,取而代之的是具有一定环境和基因多态性的风险基因,如ApoE基因中ε4等位基因的人群发病风险在杂合子可提高三倍,在纯合子中可提高15倍{Breitner,1999#48}。最近随着基因芯片和大数据的发展,通过GWAS分析已得到19个区域的基因均可提高发病风险,包括:CASS4、CELF1、FERMT2、HLA-DRB5、INPP5D、MEF2C、NME8、PTK2B、SORL1、ZCWPW1、SIC24A4、CLU、PICALM、CR1、BIN1、MS4A、ABCA7、EPHA1、CD2AP{Marioni,2018#49}。除此之外,也有学者认为TREM2与AD相关。
目前,GWAS被广泛的应用在各类神经疾病易感基因的识别中,事实上,使用GWAS分析寻找AD的风险基因仅仅是从10年前才开始的。这个世纪初,许多课题组都在识别AD的易感位点,但实际结果并不理想,不同课题组间所共同找到的易感基因只有sorl1。导致研究结果不一致的原因主要是由于实验样本的异质性、复杂的连锁不平衡模式、等位基因频率的差异以及样本量的大小。在过去的10年里,高通量测序技术的出现允许研究人员同时检测基因组上数以百万计的单核苷酸多态性位点(Single Nucleotide Polymorphisms,SNP)。一些大的机构和公司在高通量测序技术上的努力使得人们在近几年发现了许多新的AD的通路和易感基因。第一批将GWAS应用到AD中的研究者首先识别出了clu、picalm、cr1和bin1等4个易感基因位点。后来又有其他研究组通过更大样本量的GWAS分析找到了如cd33和epha1等易感基因位点,这些研究的实验样本都主要来自于欧洲人群。在上述的易感基因位点上,最显著的SNP的人口归因分数都在1%到8%之间,其优势比(odds ratio,OR值)的变化范围在1.16到1.20之间。
然而,GWAS仍然存在一定的局限性。例如,该策略基于“常见疾病-常见变异”的假说,遗漏了可能在病因中起更重要作用的罕见变异(次要等位基因频率(minor allelefrequency,MAF<0.005));所获得的关联SNP也不一定是真正的致病位点,而只是与真正致病位点呈LD关联的“标签”SNP,尤其是一些位于所谓的基因“荒漠区”的信号,对阐明遗传变异的生物学功能造成了很大的困难;GWAS通常根据统计学差异最明显的原则,分析单个位点的边际效应,而忽视了复杂性疾病存在的多基因的交互作用。因此,GWAS仍不能全面揭示复杂性疾病的遗传易感因素,它只是探索复杂性疾病遗传病因机制的一个重要环节,如何对GWAS易感位点进行深入挖掘并找出真正的致病位点,及探索这些非编码序列如何发挥生物学机制成为遗传学研究的又一个挑战。
表达数量性状位点定位(expression quantitative trait loci,eQTL),是以基因mRNA的表达水平作为数量性状,利用传统的QTL方法进行分析,定位调控目的基因表达的遗传位点。这种定位方法首先需要测量每个研究个体的基因型和基因表达水平两种数据,然后使用关联分析(远交群体)或连锁分析(家系或实验杂交群体)比较基因型与基因表达水平间的关联。研究发现,GWAS所发现的遗传易感位点约80%位于基因组的非编码区,提示其中的致病位点可能对基因表达存在调控功能。Nicolae等研究人员将常见复杂性疾病GWAS所发现的SNP和同一分型平台与其等位基因频率分布相匹配的其他随机抽样SNP两者进行比较发现,前者明显包含更多的eQTL。因此,大规模eQTL研究的一个重要作用便是能够在GWAS遗传易感区域内众多SNP位点中优先筛选出可能的致病位点,并且通过DNA多态性对生物性状的影响推测其可能的生物学机制。目前,己有相当多的研究将eQTL分析作为一种非常有效的工具来对GWAS结果进行深入解读,并且随着样本量逐渐增加,eQTL研究由于以往样本量偏小而造成的统计效能偏低问题也逐渐得改善,所发现的eQTL数目也在显著増加。
如何解释和利用数据成为GWAS研究中最为关键和富有挑战的环节。如何对GWAS得到的疾病关联位点进行功能注释并以此为出发点寻找到致病位点成为解释复杂疾病致病机理的关键问题,利用信息是对疾病关联位点进行注释并解释其作用机制的一条可行的捷径。eQTL是指将基因的表达水平作为数量性状进行分子标记连锁作图而得到的影响基因表达的位点。由于技术水平的限制,早期的eQTL研究只能测定少数几个基因的表达量,这些研究揭示了基因表达水平是由多个遗传位点共同控制的,而且并不一定会与每个位点相协同。随着基因芯片技术的应用,同时测量上万个基因的表达量成为可能,人们开始对全基因组的eQTL进行扫描。利用高通量的基因表达芯片和SNP芯片可以同时获得样本的全基因组水平的基因表达谱和SNP图谱,再经过统计学关联分析,可以得到大量影响基因表达的遗传位点。eQTL分析可以直接揭示SNP对基因表达的影响,有助于进一步阐明基因型如何影响细胞和机体水平的表型,再与GWAS得到的疾病关联的SNP想结合,对这些SNP进行功能分析,将对复杂疾病的机理研究起到重要推动作用。
本专利就是结合GWAS和eQTL两方面的数据,研究SNP与AD之间的相关性。通过GWAS我们可以获得大量的与AD相关的SNP,其中有部分非常显著,但也存在不太显著的部分,而在eQTL中不显著的SNP可能变得显著。因此,这些SNP到底是不是影响疾病的重要因素,以及他们是通过哪种方式作用到疾病上是我们的核心目标。
发明内容
本发明的目的是为了解决上述现有技术存在的问题,进而提供一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法。
本发明的目的是通过以下技术方案实现的:
一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,所述基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法具体步骤为:
步骤一:取GWAS数据为x、eQTL数据为y,SNP数据为z;
步骤二:得到z对于x的效果bzx、z对于y的效果为bzy;
步骤三:根据bxy=bzy/bzx得到x对y的效果bxy;
步骤四:计算eQTL数据集中SNP的Z统计量Z-score,记为zzy;
zzy=bzy/SE
bzy为GWAS数据集中的beta,其中,beta是数据集自带的参量,是基因与表达的回归参量;SE是方差;
步骤五:计算GWAS数据集中对应SNP的Z-score,记为zzx
zzx=bzx/SE
步骤六:计算统计量Tsmr
Tsmr服从自由度为1的卡方分布;
步骤七:对Tsmr进行卡方检验并求得P-value;
步骤八:根据P-value的大小筛选,P-value越小相关度越高。
本发明一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,所述步骤一中将y设置为表型即输出变量,将x设置为基因的表达即暴露因子,将z设置为基因突变即工具因子。
本发明一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,所述步骤二中bzx为基因突变对于基因表达的影响、bzy为基因突变对于表型的影响。
本发明一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,所述步骤三中bxy为基因表达对表型的影响并刨除了混杂因素。
本发明基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,发现更多与AD相关的基因与位点,在做基因筛查的时候可以预知患病风险,对于基因靶向药物的研发也有极其重要的意义;在极端情况下,可以进行基因敲除手术使患者康复。
附图说明
图1为本发明孟德尔随机化方法流程图。
图2为本发明基因重复次数柱形图。
具体实施方式
下面将结合附图对本发明做进一步的详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式,但本发明的保护范围不限于下述实施例。
实施例一:如图1所示,本实施例所涉及的基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法具体步骤为:
步骤一:取GWAS数据为x、eQTL数据为y,SNP数据为z;
步骤二:得到z对于x的效果bzx、z对于y的效果为bzy;
步骤三:根据bxy=bzy/bzx得到x对y的效果bxy;
步骤四:计算eQTL数据集中SNP的Z统计量Z-score,记为zzy;
zzy=bzy/SE
bzy为GWAS数据集中的beta,其中,beta是数据集自带的参量,是基因与表达的回归参量;SE是方差;
步骤五:计算GWAS数据集中对应SNP的Z-score,记为zzx
zzx=bzx/SE
步骤六:计算统计量Tsmr
Tsmr服从自由度为1的卡方分布;
步骤七:对Tsmr进行卡方检验并求得P-value;
步骤八:根据P-value的大小筛选,P-value越小相关度越高。
GWAS已经确定了数千种与各种性状和疾病相关的突变。然而,由于复杂的连锁效应和样本的统计误差,这些突变对疾病的机制和作用仍然未知。如果基因表达水平受突变影响,不同基因型个体的基因表达水平会有所不同,因此如果基因的表达水平影响疾病,那么不同的基因型会有不同的表型产生对疾病不同的影响。所以这个想法与孟德尔随机化(MR)非常相似,其中SNP可以作为工具变量来探索基因和疾病之间的关联。
eQTL是指染色体上特异性调节mRNA和蛋白质表达的区域。mRNA或蛋白质的表达水平与数量性状成比例。eQTL可分为顺式eQTL和trans-eQTL。顺式eQTL是位于基因的基因组区域,表明mRNA水平的变化可能是由基因本身的差异引起的;
trans-eQTL位于其他基因组区域,调控其他基因,控制基因mRNA的水平。
图1中test statistic将bxy、bzx、bzy转化为t的统计量,用于之后的计算使用,在t统计量的样本数较多时可以转化为z统计量。
实施例二:如图1所示,本实施例所涉及的一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,所述步骤一中将y设置为表型即输出变量,将x设置为基因的表达即暴露因子,将z设置为基因突变即工具因子。
实施例三:如图1所示,本实施例所涉及的一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,所述步骤二中bzx为基因突变对于基因表达的影响、bzy为基因突变对于表型的影响。
实施例四:如图1所示,本实施例所涉及的一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,所述步骤三中bxy为基因表达对表型的影响并刨除了混杂因素。
实施例五:如图1-2所示,本实施例所涉及的一种基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,进行实验验证,2组GWAS数据和5组eQTL数据,并得到了如下结果。正如我们在表1中所见,筛选出了27个与AD相关的SNP,它们属于7个基因。大多数这些基因都是重复选择的。然后,绘制如图2所示以显示被筛选的次数。
表1.AD相关SNP
以上所述,仅为本发明较佳的具体实施方式,这些具体实施方式都是基于本发明整体构思下的不同实现方式,而且本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (4)
1.基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,其特征在于,所述基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法具体步骤为:
步骤一:取GWAS数据为x、eQTL数据为y,SNP数据为z;
步骤二:得到z对于x的效果bzx、z对于y的效果为bzy;
步骤三:根据bxy=bzy/bzx得到x对y的效果bxy;
步骤四:计算eQTL数据集中SNP的Z统计量Z-score,记为zzy;
zzy=bzy/SE
bzy为GWAS数据集中的beta,其中,beta是数据集自带的参量,是基因与表达的回归参量;SE是方差;
步骤五:计算GWAS数据集中对应SNP的Z-score,记为zzx
zzx=bzx/SE
步骤六:计算统计量Tsmr
Tsmr服从自由度为1的卡方分布;
步骤七:对Tsmr进行卡方检验并求得P-value;
步骤八:根据P-value的大小筛选,P-value越小相关度越高。
2.根据权利要求1所述的基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,其特征在于,所述步骤一中将y设置为表型即输出变量,将x设置为基因的表达即暴露因子,将z设置为基因突变即工具因子。
3.根据权利要求1或2所述的基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,其特征在于,所述步骤二中bzx为基因突变对于基因表达的影响、bzy为基因突变对于表型的影响。
4.根据权利要求3所述的基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法,其特征在于,所述步骤三中bxy为基因表达对表型的影响并刨除了混杂因素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910043414.5A CN110349623A (zh) | 2019-01-17 | 2019-01-17 | 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910043414.5A CN110349623A (zh) | 2019-01-17 | 2019-01-17 | 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110349623A true CN110349623A (zh) | 2019-10-18 |
Family
ID=68174185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910043414.5A Pending CN110349623A (zh) | 2019-01-17 | 2019-01-17 | 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110349623A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111180012A (zh) * | 2019-12-27 | 2020-05-19 | 哈尔滨工业大学 | 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 |
CN111341448A (zh) * | 2020-03-03 | 2020-06-26 | 西安交通大学 | 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 |
CN113066530A (zh) * | 2021-03-31 | 2021-07-02 | 江苏省农业科学院 | 一种批量合并eQTL分析结果中存在连锁不平衡SNP的方法 |
CN114317713A (zh) * | 2021-12-30 | 2022-04-12 | 武汉康圣达医学检验所有限公司 | 一种阿尔兹海默症的基因诊断试剂盒及其应用 |
CN117476096A (zh) * | 2023-12-28 | 2024-01-30 | 四川大学华西医院 | 一种精神疾病生物标志物预测方法、系统和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009089273A1 (en) * | 2008-01-07 | 2009-07-16 | University Of Miami | Methods of identifying risk genes for diseases |
WO2012030983A2 (en) * | 2010-08-31 | 2012-03-08 | The Johns Hopkins University | Variability single nucleotide polymorphisms linking stochastic epigenetic variation and common disease |
CN103525899A (zh) * | 2012-07-02 | 2014-01-22 | 中国科学院上海生命科学研究院 | 2型糖尿病易感基因位点及检测方法和试剂盒 |
CN106636398A (zh) * | 2016-12-21 | 2017-05-10 | 哈尔滨工业大学 | 一种改进的阿尔茨海默病发病风险预测方法 |
EP3272878A1 (en) * | 2016-07-20 | 2018-01-24 | Ecole Polytechnique Federale de Lausanne (EPFL) | Methods of diagnosing and treatment of alzheimer's disease |
-
2019
- 2019-01-17 CN CN201910043414.5A patent/CN110349623A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009089273A1 (en) * | 2008-01-07 | 2009-07-16 | University Of Miami | Methods of identifying risk genes for diseases |
WO2012030983A2 (en) * | 2010-08-31 | 2012-03-08 | The Johns Hopkins University | Variability single nucleotide polymorphisms linking stochastic epigenetic variation and common disease |
CN103525899A (zh) * | 2012-07-02 | 2014-01-22 | 中国科学院上海生命科学研究院 | 2型糖尿病易感基因位点及检测方法和试剂盒 |
EP3272878A1 (en) * | 2016-07-20 | 2018-01-24 | Ecole Polytechnique Federale de Lausanne (EPFL) | Methods of diagnosing and treatment of alzheimer's disease |
CN106636398A (zh) * | 2016-12-21 | 2017-05-10 | 哈尔滨工业大学 | 一种改进的阿尔茨海默病发病风险预测方法 |
Non-Patent Citations (3)
Title |
---|
LI,HAIQUAN: "integrative genomics analysis unveil downstream biological effectors of disease-specific polymorphisms buried in intergenic regions", 《NPJ GENOMIC MEDICINE》 * |
张卓然: "利用eQTL构建基因-基因网络挖掘类风湿性关节炎风险基因", 《现代生物医学进展》 * |
王美琴等: "基于数据整合策略挖掘阿尔茨海默病易感基因", 《中国康复理论与实践》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111180012A (zh) * | 2019-12-27 | 2020-05-19 | 哈尔滨工业大学 | 一种基于经验贝叶斯与孟德尔随机化融合的基因识别方法 |
CN111341448A (zh) * | 2020-03-03 | 2020-06-26 | 西安交通大学 | 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 |
CN111341448B (zh) * | 2020-03-03 | 2023-12-19 | 西安交通大学 | 一种基于孟德尔随机化预测复杂疾病及表型相关代谢物的方法 |
CN113066530A (zh) * | 2021-03-31 | 2021-07-02 | 江苏省农业科学院 | 一种批量合并eQTL分析结果中存在连锁不平衡SNP的方法 |
CN113066530B (zh) * | 2021-03-31 | 2024-05-10 | 江苏省农业科学院 | 一种批量合并eQTL分析结果中存在连锁不平衡SNP的方法 |
CN114317713A (zh) * | 2021-12-30 | 2022-04-12 | 武汉康圣达医学检验所有限公司 | 一种阿尔兹海默症的基因诊断试剂盒及其应用 |
CN117476096A (zh) * | 2023-12-28 | 2024-01-30 | 四川大学华西医院 | 一种精神疾病生物标志物预测方法、系统和存储介质 |
CN117476096B (zh) * | 2023-12-28 | 2024-03-08 | 四川大学华西医院 | 一种精神疾病生物标志物预测方法、系统和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110349623A (zh) | 基于改进孟德尔随机化的老年痴呆病基因及位点筛选方法 | |
Hill et al. | Genome-wide analysis identifies molecular systems and 149 genetic loci associated with income | |
Peltonen et al. | Use of population isolates for mapping complex traits | |
Mackay | Quantitative trait loci in Drosophila | |
Nadeau et al. | The roads from phenotypic variation to gene discovery: mutagenesis versus QTLs | |
Voight et al. | The metabochip, a custom genotyping array for genetic studies of metabolic, cardiovascular, and anthropometric traits | |
König | Validation in genetic association studies | |
Drake et al. | Integrating genetic and gene expression data: application to cardiovascular and metabolic traits in mice | |
Roses et al. | Understanding the genetics of APOE and TOMM40 and role of mitochondrial structure and function in clinical pharmacology of Alzheimer's disease | |
Lan et al. | Dimension reduction for mapping mRNA abundance as quantitative traits | |
KR101460520B1 (ko) | 차세대 시퀀싱 데이터의 질병변이마커 검출 방법 | |
Escamilla et al. | Genetics of bipolar disorder | |
Fujito et al. | Positive selection on schizophrenia-associated ST8SIA2 gene in post-glacial Asia | |
Heidema et al. | Analysis of multiple SNPs in genetic association studies: comparison of three multi‐locus methods to prioritize and select SNPs | |
Dick et al. | Genetic strategies to detect genes involved in alcoholism and alcohol-related traits | |
de Coo et al. | Assessment of genotyping tools applied in genetic susceptibility studies of periodontal disease: A systematic review | |
CN112280863A (zh) | 一种靶向药阿帕替尼有效性的方法及试剂盒 | |
Mackay et al. | Pleiotropy, epistasis and the genetic architecture of quantitative traits | |
CN112195247A (zh) | 一种folfox药物方案有效性检测方法及试剂盒 | |
Fialkowski et al. | Multifactorial inheritance and complex diseases | |
Gamache et al. | Integrative single-nucleus multi-omics analysis prioritizes candidate cis and trans regulatory networks and their target genes in Alzheimer’s disease brains | |
Crasto et al. | Integrating genetic, functional genomic, and bioinformatics data in a systems biology approach to complex diseases: application to schizophrenia | |
Gordish-Dressman et al. | Statistical and methodological considerations in exercise genomics | |
Brookes et al. | An alternative method of SNP inclusion to develop a generalized polygenic risk score analysis across Alzheimer's disease cohorts | |
Hensman Moss | Identification of genetic factors underpinning phenotypic heterogeneity in Huntington's disease and other neurodegenerative disorders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191018 |