CN108334749B - 一种基于染色质调控环路检测复杂疾病上位性的方法及系统 - Google Patents
一种基于染色质调控环路检测复杂疾病上位性的方法及系统 Download PDFInfo
- Publication number
- CN108334749B CN108334749B CN201810119400.2A CN201810119400A CN108334749B CN 108334749 B CN108334749 B CN 108334749B CN 201810119400 A CN201810119400 A CN 201810119400A CN 108334749 B CN108334749 B CN 108334749B
- Authority
- CN
- China
- Prior art keywords
- enhancer
- chromatin
- interaction
- gene
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于染色质调控环路检测复杂疾病上位性的方法及系统:收集并整理与复杂疾病相关细胞系的染色质远程交互作用数据和染色质分割状态数据;利用上述数据建立染色质调控环路;计算调控环路内能影响复杂疾病表型的SNP相互作用。本发明利用染色质远程交互作用等数据建立基于基因相互作用的染色质调控环路,并依据染色质调控环路计算上位性,与现有技术相比,本发明不仅能够大幅度降低计算量,还能减少假阴性结果,从而快速、准确地探索与复杂疾病相关的SNP相互作用,为后续设计药物等提供了潜在靶标。
Description
技术领域
本发明涉及复杂疾病上位性检测技术领域,具体涉及一种基于染色质调控环路检测复杂疾病上位性的方法及系统。
背景技术
全基因组关联分析(Genome-wide Association Study,GWASs)是目前揭示复杂疾病/性状易感基因的有效研究方法。利用这种方法,现已有两千余篇论文发表在国际高水平杂志上,成功鉴定了以SNP(Single nucleotide polymorphism)标记的近万个复杂疾病易感位点。对于特定的复杂疾病,已报道的疾病易感位点累积起来解释的疾病遗传变异不到15%,尚有大量未知的遗传因素,即“丢失的遗传力”亟待挖掘。这是所有复杂疾病遗传学研究中面临的共同问题。利用全基因组关联分析寻找复杂疾病易感位点有一个重要限制,即GWASs主要研究与复杂疾病相关的单个SNP的作用,然而复杂疾病表型通常来自多个基因的共同作用或相互作用。在群体遗传学和数量遗传学中,这种非等位基因的非加性遗传效应常统称为上位性。其可进一步阐明多个基因间的相互作用对复杂疾病/性状表型的影响,特别是在海量GWASs数据产生的背景下,揭示复杂疾病的上位性变得尤为重要。其结果有助于揭示复杂疾病的发病机理、靶向药物的设计和研发、临床早期筛查、个体化防治等方面。
随着人类基因组单体型图计划(HapMap)和千人基因组计划的完成,已知的人类遗传性标记——SNP已经数以亿计。漫无目的的随机研究SNP位点之间的相互作用将消耗巨大的计算资源与时间,而且会产生许多假阴性结果。
近年来,越来越多的以染色体构象捕获为基础的衍生技术与高通量测序技术相结合,尤其是Hi-C和基于配对末端标签测序的染色质交互作用分析技术(chromatininteraction analysis with paired-end tag sequencing,ChIA-PET)的应用,不但揭示了染色质三维结构对染色质功能的重要性,同时提供了大量的染色质远程交互作用数据。目前尚未见到以这些染色质远程交互数据为筛选准则计算SNP之间的上位性的报道。
发明内容
本发明的目的在于提供一种基于染色质调控环路检测复杂疾病上位性的方法及系统,可用于探究影响复杂疾病表型的上位性,为后续设计药物等提供潜在的靶标。
为了实现上述目的,本发明采用了以下技术方案:
一种基于染色质调控环路检测复杂疾病上位性的方法,该检测复杂疾病上位性的方法包括以下步骤:
1)获取与复杂疾病相关细胞系的染色质远程交互作用数据以及该细胞系的染色质分割状态数据;
2)利用所述染色质分割状态数据内注释的增强子区域和所述染色质远程交互作用数据,筛选与染色质远程交互作用相关的基因/增强子-增强子相互作用区(相互作用区构成潜在的SNP相互作用区域,包括具有染色质远程交互作用的基因区域和增强子区域之间,以及增强子区域和增强子区域之间,以及与同一个基因区域均存在染色质远程交互作用的两个增强子区域之间),得到染色质调控环路;
3)计算染色质调控环路内影响复杂疾病表型的SNP相互作用。
所述基因/增强子-增强子相互作用区根据Hi-C相互作用确定。
情况一,所述检测复杂疾病上位性的方法还包括以下步骤:获取所述细胞系的基因-增强子调控数据,将根据该数据确定的基因/增强子-增强子相互作用区(相互作用区构成潜在的SNP相互作用区域,包括具有调控关系的基因和增强子之间,以及与同一个基因均存在调控关系的增强子和增强子之间)与所述染色质调控环路合并,然后计算影响复杂疾病表型的SNP相互作用。
情况二,所述检测复杂疾病上位性的方法还包括以下步骤:获取所述细胞系以及与复杂疾病相关组织的超级增强子数据,将根据该数据确定的基因/超级增强子-超级增强子相互作用区(相互作用区构成潜在的SNP相互作用区域,包括位于一定物理距离之内的基因和超级增强子之间,以及与同一个基因均相距一定物理距离之内的两个超级增强子之间)及超级增强子内部的相互作用区(相互作用区构成潜在的SNP相互作用区域,位于超级增强子内部)与所述染色质调控环路合并,然后计算影响复杂疾病表型的SNP相互作用。
情况三,所述检测复杂疾病上位性的方法还包括以下步骤:获取所述细胞系的基因-增强子调控数据和超级增强子数据,以及与复杂疾病相关组织的超级增强子数据,将根据基因-增强子调控数据确定的基因/增强子-增强子相互作用区、根据超级增强子数据确定的基因/超级增强子-超级增强子相互作用区及超级增强子内部的相互作用区与所述染色质调控环路合并,然后计算影响复杂疾病表型的SNP相互作用。
所述基因/超级增强子-超级增强子相互作用区按照基因与超级增强子在染色体上的物理距离阈值(例如,<100kb)确定。
所述基因选自基因组内任意已知基因所在染色体、起始位置和终止位置的蛋白编码基因。
所述步骤3)中,利用样本复杂疾病表型和候选SNP分型数据建立回归模型,根据回归模型从候选SNP中筛选符合显著性要求的SNP相互作用。
所述候选SNP选自样本基因组中同时符合下列条件的所有SNPs:
a)基因型分型率≥95%;
b)最小等位基因频率≥0.05;
c)哈迪温伯格平衡P值≥0.001;
d)任意SNP对的连锁不平衡满足r2≤0.5。
一种基于染色质调控环路检测复杂疾病上位性的系统,该系统包括数据收集与整理模块、染色质调控环路构建模块以及SNP相互作用计算模块;
根据上述步骤1),所述数据收集与整理模块获取与复杂疾病相关细胞系的染色质远程交互作用数据以及该细胞系的染色质分割状态数据;
根据上述步骤2),所述染色质调控环路构建模块利用所述染色质分割状态数据内注释的增强子区域和所述染色质远程交互作用数据,筛选与染色质远程交互作用相关的基因/增强子-增强子相互作用区,即染色质调控环路;
根据上述步骤3),所述SNP相互作用计算模块根据所述基因/增强子-增强子相互作用区计算影响复杂疾病表型的SNP相互作用。
优选的,所述系统还通过获取上述基因-增强子调控数据、上述超级增强子数据,并将根据其对应确定的基因/增强子-增强子相互作用区、基因/超级增强子-超级增强子相互作用区、超级增强子内部的相互作用区,作为上述染色质调控环路的补充,用于计算影响复杂疾病表型的SNP相互作用。
本发明的有益效果体现在:
本发明利用染色质远程交互作用数据建立基于任意目标基因相互作用的染色质调控环路,并依据染色质调控环路计算上位性,与已有技术相比,本发明不仅能够大幅度降低计算量(即缩小需要确定的SNP相互作用的候选SNPs数量),还能减少假阴性结果(计算量的降低使得显著性阈值适应性升高),从而可以用于快速、准确地探索与复杂疾病相关的SNP相互作用。
附图说明
图1为基于染色质调控环路检测复杂疾病上位性的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细说明。所述实施例仅用于解释本发明的内容。
基于已有染色质远程交互作用数据,基因-增强子调控数据以及超级增强子数据等,申请人定义了与目标基因相互作用的染色质调控环路,并发明了一种基于染色质调控环路检测复杂疾病上位性的方法。基本步骤如下:
P1:收集并整理与复杂疾病相关细胞系的染色质远程交互作用数据和相应的染色质分割状态数据、基因-增强子调控数据、超级增强子数据;
P2:利用上述数据建立与目标基因相互作用的染色质调控环路;
P3:利用建立的染色质调控环路,计算调控环路内能影响复杂疾病表型的SNP相互作用。在P3中,具体根据复杂疾病的类型计算SNP对的相互作用与复杂疾病的关联:对质量性状而言采用逻辑回归模型,对数量性状而言采用线性回归模型,其公式均如下:
Y~β+β1*SNP1+β2*SNP2+β3*SNP1×SNP2+e
对于两个拷贝的SNP2而言(SNP2=2),则:
Y~(β+2β2)+(β1+2β3)*SNP1+e
对于单拷贝的SNP2而言(SNP2=1),则:
Y~(β+β2)+(β1+β3)*SNP1+e
对于零拷贝的SNP2而言(SNP2=0),则:
Y~β+β1*SNP1+e
其中,Y为样本表型,β、β1、β2为三个待估计的参数,e为相互独立且服从同一正态分布的随机变量,拷贝根据SNP2在样本群体中的最小频率的等位基因确定。
以复杂疾病肥胖症为例,利用上述方法,检测与肥胖症相关的SNP相互作用,步骤如下(图1):
P1:收集并整理与肥胖症相关细胞系GM12878的染色质远程交互作用数据和对应细胞系的染色质分割状态数据、基因-增强子调控数据以及对应细胞系及肥胖症相关组织的超级增强子数据;
具体包括:
P11:利用GENCODE数据库中包含的人类基因组功能注释信息,筛选19,340个蛋白编码基因,并整理基因所在的染色体、起始位置和终止位置,该物理位置与其后涉及的物理位置均通过LiftOver转换为同一个版本,如hg19,之后将不再赘述;
P12:下载4D Genome和近期文章中公布的Hi-C数据,检索数据库和文章公布的Hi-C数据,筛选与所研究复杂疾病肥胖症相关细胞系GM12878的Hi-C数据,共计1,926,998组相互作用区域;利用表观基因组学路线图项目(Roadmap Epigenomics Program)公布的染色质分割状态数据,下载相应细胞系GM12878的HMM数据,并筛选注释为“7_Enh”的增强子区域,共计94,695个增强子区域;
P13:利用PreSTIGE算法(http://genetics.case.edu/prestige)预测或检索文章公布的基因-增强子调控数据,下载GM12878细胞系中的相应基因-增强子调控数据,共计32,012组相互作用数据;下载并整理Hnisz D在Cell杂志上公布超级增强子数据,并筛选与肥胖相关的GM12878、脂肪组织和脑组织相关的超级增强子。
P2:利用整理的GM12878的Hi-C数据和对应人类基因组蛋白编码基因信息、HMM数据,GM12878的基因-增强子调控数据、以及相关的超级增强子数据建立染色质调控环路,即潜在的相互作用区域,共计20,333,362对潜在相互作用区域。
具体的建立染色质调控环路的方式如下:
利用筛选的人类基因组蛋白编码基因信息和筛选的相应细胞系的增强子区域分别对染色质远程交互数据进行注释,并通过Hi-C数据确定潜在相互作用区域,包括:I.基因与对应Hi-C且注释为增强子区域;II.与同一基因具有Hi-C相互作用且注释为增强子的区域之间;III.染色质远程相互作用且均注释为增强子的区域之间(参见图1中a部分所示);
在进行上述注释时,满足的条件为:人类基因组蛋白编码基因与染色质相互作用区域(图1中a部分内的竖向灰度条,b\c中竖向灰度条无实际意义)部分或全部重叠;增强子区域位于染色质相互作用区域中。
此外,本实施例还利用筛选的人类基因组蛋白编码基因信息和筛选的相应细胞系基因-增强子调控信息确定潜在相互作用区域,包括:I.基因增强子区域与对应基因间相互作用;II.同一基因的共同增强子区域之间的相互作用。
此外,本实施例还利用筛选的人类基因组蛋白编码基因信息和筛选的相应超级增强子数据确定潜在相互作用区域,包括:I.基因及与其距离小于100kb的超级增强子间的相互作用;II.与同一基因距离小于100kb的超级增强子之间的相互作用;III.I或II中超级增强子内部的相互作用。
P3:利用美国国家生物技术信息中心基因型和表型数据库(dbGaP)下载两个肥胖群体(GENEVA(phs000091.v2.p1)和WHI(phs000386.v7.p3)的高加索人群)的SNP基因型数据,以及实验室前期积累的2,286例肥胖白人样本的SNP基因型数据(共计三组数据),检测与肥胖症相关的SNP相互作用,对上述基因型数据进行质量控制(图1中预处理)并剔除连锁不平衡的SNP对,对剩余16,643,227对SNP采用线性回归模型计算SNP的相互作用在三组数据中对肥胖的影响。
其中的预处理的步骤为:对复杂疾病的基因型数据进行处理,包括剔除:A.基因型分型率小于95%;B.最小等位基因频率小于0.05的SNPs;C.哈迪温伯格平衡P值小于0.001的SNPs;其后基于处理的基因型数据,参照建立的染色质调控环路,提取潜在相互作用区域内包含的SNPs;
其中的剔除连锁不平衡的SNP的步骤为:针对上述潜在相互作用区域内包含的SNPs的任意SNP对,计算SNP对的连锁不平衡并剔除r2>0.5的SNP对。
实验结果:针对肥胖症,将上述三个数据的结果进行荟萃(meta)分析后,本发明共发现2个与肥胖相关的SNP相互作用即rs6808450×rs9813534(P=4.15×10-9)和rs6808450×rs3773306(P=2.89×10-9)。对发现的与肥胖表型BMI相关的SNP互作对进行功能注释,发现在肥胖症相关的细胞系中rs6808450位于增强子区,而rs9813534与rs3773306分别位于CAND2和RPL32基因的强转录区。该结果说明rs6808450可能通过与rs9813534和rs3773306的相互作用,促进CAND2和RPL32基因的表达,进而影响肥胖症。在人前成脂细胞中,发现CADN2基因的表达在细胞分化过程中显著下调,说明该基因的确与肥胖症相关。
本发明在仅使用Hi-C数据和对应细胞系的染色质分割状态数据的情况下,也完成了对于肺癌的SNP相互作用分析。
总之,基于染色质调控环路检测复杂疾病上位性的方法是可行的。本发明的方法适用于各种复杂疾病,例如各种癌症、内分泌疾病、心血管疾病、代谢类疾病、免疫类疾病等,可为其后续设计药物和疾病检测提供潜在靶标。
Claims (10)
1.一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,该检测复杂疾病上位性的方法包括以下步骤:
1)获取与复杂疾病相关细胞系的染色质远程交互作用数据以及该细胞系的染色质分割状态数据;
2)利用所述染色质分割状态数据内注释的增强子区域和所述染色质远程交互作用数据,筛选与染色质远程交互作用相关的基因/增强子-增强子相互作用区,得到染色质调控环路;
3)计算染色质调控环路内影响复杂疾病表型的SNP相互作用。
2.根据权利要求1所述一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,所述基因/增强子-增强子相互作用区根据Hi-C相互作用确定。
3.根据权利要求1所述一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,所述检测复杂疾病上位性的方法还包括以下步骤:获取所述细胞系的基因-增强子调控数据,将根据该基因-增强子调控数据确定的基因/增强子-增强子相互作用区与所述染色质调控环路合并,然后计算影响复杂疾病表型的SNP相互作用。
4.根据权利要求1所述一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,所述检测复杂疾病上位性的方法还包括以下步骤:获取所述细胞系以及与复杂疾病相关组织的超级增强子数据,将根据该超级增强子数据确定的基因/超级增强子-超级增强子相互作用区及超级增强子内部的相互作用区与所述染色质调控环路合并,然后计算影响复杂疾病表型的SNP相互作用。
5.根据权利要求1所述一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,所述检测复杂疾病上位性的方法还包括以下步骤:获取所述细胞系的基因-增强子调控数据和超级增强子数据,以及与复杂疾病相关组织的超级增强子数据,将根据基因-增强子调控数据确定的基因/增强子-增强子相互作用区、根据超级增强子数据确定的基因/超级增强子-超级增强子相互作用区及超级增强子内部的相互作用区与所述染色质调控环路合并,然后计算影响复杂疾病表型的SNP相互作用。
6.根据权利要求4或5所述一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,所述基因/超级增强子-超级增强子相互作用区按照基因与超级增强子在染色体上的物理距离阈值确定。
7.根据权利要求1所述一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,所述基因选自基因组内任意已知基因所在染色体、起始位置和终止位置的蛋白编码基因。
8.根据权利要求1所述一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,所述步骤3)中,利用样本复杂疾病表型和候选SNP分型数据建立回归模型,根据回归模型从候选SNP中筛选符合显著性要求的SNP相互作用。
9.根据权利要求8所述一种基于染色质调控环路检测复杂疾病上位性的方法,其特征在于,所述候选SNP选自样本基因组中同时符合下列条件的所有SNPs:
a)基因型分型率≥95%;
b)最小等位基因频率≥0.05;
c)哈迪温伯格平衡P值≥0.001;
d)任意SNP对的连锁不平衡满足r2≤0.5。
10.一种基于染色质调控环路检测复杂疾病上位性的系统,其特征在于:包括数据收集与整理模块、染色质调控环路构建模块以及SNP相互作用计算模块;
所述数据收集与整理模块获取与复杂疾病相关细胞系的染色质远程交互作用数据以及该细胞系的染色质分割状态数据;
所述染色质调控环路构建模块利用所述染色质分割状态数据内注释的增强子区域和所述染色质远程交互作用数据,筛选与染色质远程交互作用相关的基因/增强子-增强子相互作用区;
所述SNP相互作用计算模块根据所述基因/增强子-增强子相互作用区计算影响复杂疾病表型的SNP相互作用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810119400.2A CN108334749B (zh) | 2018-02-06 | 2018-02-06 | 一种基于染色质调控环路检测复杂疾病上位性的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810119400.2A CN108334749B (zh) | 2018-02-06 | 2018-02-06 | 一种基于染色质调控环路检测复杂疾病上位性的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108334749A CN108334749A (zh) | 2018-07-27 |
CN108334749B true CN108334749B (zh) | 2020-07-28 |
Family
ID=62926937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810119400.2A Active CN108334749B (zh) | 2018-02-06 | 2018-02-06 | 一种基于染色质调控环路检测复杂疾病上位性的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108334749B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112289436B (zh) * | 2020-10-19 | 2024-03-19 | 浙江大学 | 一种基于表型距离信息构建罕见病地图及导航的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103646192A (zh) * | 2013-11-14 | 2014-03-19 | 漯河医学高等专科学校 | 增强子在全基因组相互作用研究方法 |
WO2014071279A2 (en) * | 2012-11-05 | 2014-05-08 | Genomic Health, Inc. | Gene fusions and alternatively spliced junctions associated with breast cancer |
CN107341366A (zh) * | 2017-07-19 | 2017-11-10 | 西安交通大学 | 一种利用机器学习预测复杂疾病易感位点的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11319591B2 (en) * | 2014-03-19 | 2022-05-03 | Whitehead Institute For Biomedical Research | Core transcriptional circuitry in human cells and methods of use thereof |
-
2018
- 2018-02-06 CN CN201810119400.2A patent/CN108334749B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014071279A2 (en) * | 2012-11-05 | 2014-05-08 | Genomic Health, Inc. | Gene fusions and alternatively spliced junctions associated with breast cancer |
CN103646192A (zh) * | 2013-11-14 | 2014-03-19 | 漯河医学高等专科学校 | 增强子在全基因组相互作用研究方法 |
CN107341366A (zh) * | 2017-07-19 | 2017-11-10 | 西安交通大学 | 一种利用机器学习预测复杂疾病易感位点的方法 |
Non-Patent Citations (3)
Title |
---|
《Modeling disease risk through analysis of Physical interactions between genetic variants within chromatin regulatory circuitry》;Olivia Corradin,et al.;《Nat Genet》;20170319;第1313-1320页 * |
《基因自调控环路的功能》;苑占江,等;《生物物理学报》;20100630;第26卷(第6期);第457-471页 * |
《基因调控网络的建模与学习研究》;刘辉;《中国博士学位论文全文数据库 基础科学辑》;20111015(第10期);第A006-37页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108334749A (zh) | 2018-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102662206B1 (ko) | 심층 학습 기반 비정상 스플라이싱 검출 | |
Ravinet et al. | Interpreting the genomic landscape of speciation: a road map for finding barriers to gene flow | |
Wong et al. | De novo human genome assemblies reveal spectrum of alternative haplotypes in diverse populations | |
Ichikawa et al. | Centromere evolution and CpG methylation during vertebrate speciation | |
Franchini et al. | quaddRAD: A new high‐multiplexing and PCR duplicate removal ddRAD protocol produces novel evolutionary insights in a nonradiating cichlid lineage | |
Browning et al. | Haplotype phasing: existing methods and new developments | |
Oldham et al. | Network methods for describing sample relationships in genomic datasets: application to Huntington’s disease | |
AU2013277997B2 (en) | Methods and processes for non-invasive assessment of genetic variations | |
US20200251183A1 (en) | Deep Learning-Based Framework for Identifying Sequence Patterns that Cause Sequence-Specific Errors (SSEs) | |
AU2019272065C1 (en) | Deep learning-based framework for identifying sequence patterns that cause sequence-specific errors (SSEs) | |
Divina et al. | Ab initio prediction of mutation-induced cryptic splice-site activation and exon skipping | |
JP2018186825A (ja) | 遺伝子の変動の非侵襲性評価のための方法および処理 | |
Zhang et al. | Chromosome-level genome assembly of golden pompano (Trachinotus ovatus) in the family Carangidae | |
Lee et al. | Principles and methods of in-silico prioritization of non-coding regulatory variants | |
CA2474982A1 (en) | Computer systems and methods for identifying genes and determining pathways associated with traits | |
WO2018112249A1 (en) | Methods and systems for determining paralogs | |
Zhang et al. | Bayesian analysis of genome-wide inflammatory bowel disease data sets reveals new risk loci | |
Kroon et al. | Detecting dispersed duplications in high-throughput sequencing data using a database-free approach | |
Liang et al. | m6A-Maize: Weakly supervised prediction of m6A-carrying transcripts and m6A-affecting mutations in maize (Zea mays) | |
CN108334749B (zh) | 一种基于染色质调控环路检测复杂疾病上位性的方法及系统 | |
Li et al. | Bioinformatics tools for discovery and functional analysis of single nucleotide polymorphisms | |
Tripathi et al. | Integrated analysis of dysregulated lncRNA expression in breast cancer cell identified by RNA-seq study | |
Yoo et al. | The genetic origin of short tail in endangered Korean dog, DongGyeongi | |
Dutta et al. | Novel aggregative trans-eqtl association analysis of known genetic variants detect trait-specific target gene-sets | |
Mafessoni et al. | A high-coverage Neandertal genome from Chagyrskaya Cave. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |