CN107256323A - 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统 - Google Patents

一种ⅱ型糖尿病风险评估模型的构建方法和构建系统 Download PDF

Info

Publication number
CN107256323A
CN107256323A CN201610801091.8A CN201610801091A CN107256323A CN 107256323 A CN107256323 A CN 107256323A CN 201610801091 A CN201610801091 A CN 201610801091A CN 107256323 A CN107256323 A CN 107256323A
Authority
CN
China
Prior art keywords
type
diabetes
snp site
risk
mrow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610801091.8A
Other languages
English (en)
Other versions
CN107256323B (zh
Inventor
万旗东
李庆辉
金刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cloud Health Gene Technology (shanghai) Co Ltd
Original Assignee
Cloud Health Gene Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cloud Health Gene Technology (shanghai) Co Ltd filed Critical Cloud Health Gene Technology (shanghai) Co Ltd
Priority to CN201610801091.8A priority Critical patent/CN107256323B/zh
Publication of CN107256323A publication Critical patent/CN107256323A/zh
Application granted granted Critical
Publication of CN107256323B publication Critical patent/CN107256323B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种Ⅱ型糖尿病风险评估模型的构建方法和构建系统,方法包括:(1)选取与Ⅱ型糖尿病相关联的SNP位点;(2)计算SNP位点的风险度即OR值;(3)计算SNP位点在东亚人群的频率;(4)计算Ⅱ型糖尿病的流行病学患病率;(5)根据贝叶斯算法和哈迪‑温伯格平衡原理,构建风险评估模型。本发明的模型通过计算人群风险等位基因数量的数学期望和OR值,结合Ⅱ型糖尿病的流行病学患病率,得到群体基于遗传的平均患病率和置信区间,提供了一种新的Ⅱ型糖尿病风险评估模型的构建方法,使Ⅱ型糖尿病的患病风险更接近于真实情况,结果更加科学、合理。本发明提高了高风险人群筛查的准确性,有望降低Ⅱ型糖尿病的发病率,为国家和社会节约大笔开支,利国利民。

Description

一种Ⅱ型糖尿病风险评估模型的构建方法和构建系统
技术领域
本发明属于多基因疾病的遗传风险评估领域,涉及一种Ⅱ型糖尿病风险评估模型的构建方法和构建系统,具体涉及一种基于贝叶斯算法和流行病学患病率构建而成的多基因疾病的风险评估模型的方法和系统。
背景技术
在我国糖尿病的患病人群中,Ⅱ型糖尿病占90.0%以上,1型糖尿病约占5.0%,城市妊娠糖尿病的患病率接近5.0%,其他类型糖尿病仅占约0.7%。表1显示了Ⅱ型糖尿病特点、症状和并发症:
表1Ⅱ型糖尿病特点、症状和并发症
Ⅱ型糖尿病的主要症状有高血糖、不同程度的胰岛素抵抗和胰岛素分泌功能受损。Ⅱ型糖尿病会给患者带来各种生活不便,例如口渴,无力,视力下降等。血液中过高的血糖浓度对血管和器官会造成伤害,引起各种并发症,对患者造成较大痛苦。其发病原因除了环境因素、生活方式因素、年龄因素等之外,还有基因因素。
近年来,研究发现了多种基因与Ⅱ型糖尿病相关。这些发现为基于个人基因组测序预测疾病风险提供了一种可能。目前,基于二代测序进行疾病风险预测的大致流程如下:首先,针对特定疾病建立基因和疾病风险的关系;其次,针对该疾病的风险基因信息建立疾病风险评估模型;最后,将个体基因序列信息输入到疾病风险评估模型中获得疾病风险。因此,疾病风险预测中的两个关键点是建立基因与疾病的关系和疾病风险评估模型。
常见的人类疾病的数据库有OMIM、HGMD、GWAS等。尽管这些数据库收集了大量的疾病相关基因,但是这些信息来源多样,包含着大量的噪音,不能直接用于疾病风险的预测,需要进行严格的过滤。常用的过滤手段如下:P值、OR值、频率、样本量、连锁不平衡等。所有的这些过滤手段,保证了疾病风险基因指示疾病风险的能力。确定了疾病风险基因之后,需要建立疾病风险预测模型。总体来说,疾病风险预测模型是在已经选定的疾病风险基因和疾病的状态之间建立某种函数关系。目前常用的疾病风险预测模型有2种算法:简单的GRS和加权的GRS。(1)简单的GRS:GRS=ΣSi(Si为相应SNPs的个数)。该算法认为每个风险等位基因的作用相等,只根据相关风险等位基因的个数来计算。Lv D等在“Genetic variationsin SEC16B,MC4R,MAP2K5and KCTD15were associated with childhood obesity andinteracted with dietary behaviors in chinese school-age population”文章中计算肥胖症的GRS时规定高风险等位基因的纯合子(有两个高风险等位基因)记为2分,杂合子记为1分,低风险等位基因的纯合子记为0分。(2)加权GRS:GRS=∑βiSi(i为第i个SNPs的权重,Si为第i个SNPs)。该算法认为每个风险等位基因对疾病的影响不同,通过给每个风险等位基因赋予一个相应的权重来显示不同SNPs对疾病的影响程度不同。这个权重通常为该SNPs的优势比的自然对数,常通过GWAS研究中的优势比取对数或相关回归模型中回归系数β得到。相对而言,加权GRS广泛被运用。Abdullah等在文章“Characterizing the geneticrisk for type 2diabetes in a malaysian multiethnic cohort”计算Ⅱ型糖尿病的GRS时将每个SNPs风险等位基因的个数和它的估测效应(系数)相乘然后求和。这2个模型在计算个体患病风险时都有一个重大缺陷,那就是没法计算基于遗传的人均患病风险,遗传的人均患病风险直接决定了风险等级划分,决定了高风险人群能否做到有效区分,这正是遗传风险评估模型的最大作用及其价值所在。
发明内容
本发明的目的在于克服现有技术存在的不足,提供了一种新的Ⅱ型糖尿病风险评估模型的构建方法,最大程度地解决了常见风险评估模型中所存在的上述问题,使Ⅱ型糖尿病的患病风险更接近于真实情况,结果更加科学、合理。
本发明是通过以下技术方案实现的:
一种Ⅱ型糖尿病风险评估模型的构建方法,其包括如下步骤:
(1)获取Ⅱ型糖尿病关联性SNP位点;
(2)计算Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度(OR值),并获取OR值≥1.08的SNP位点;
(3)计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群(即正常人群)的频率值,并获取频率值≥0.01的SNP位点作为过滤后的SNP位点;
(4)计算所有过滤后的SNP在中国个体(即中国人群中的某个个体)中的风险等位基因数量;
(5)计算中国人群的Ⅱ型糖尿病的流行病学患病率;
(6)根据贝叶斯算法和哈迪-温伯格平衡原理,构建该中国个体的风险评估模型。
其中,在步骤(1)中,的获取Ⅱ型糖尿病关联性SNP位点包括如下步骤:
步骤1-1:从T2D-GENES Consortium数据库、GoT2D Consortium数据库、DIAGRAMConsortium数据库中获取与Ⅱ型糖尿病相关联的SNP位点(即T2D Consortium位点),研究人群为东亚人群(即中国、日本、韩国、新加坡华裔);
从GWAS(Genome-wide association study,全基因组关联分析)研究的文献中获取与Ⅱ型糖尿病相关的SNP位点(即GWAS位点),其中显著性水平取0.000001,研究人群为东亚人群;
从候选基因(Candidate gene)研究的文献数据库获取与Ⅱ型糖尿病相关的SNP位点(即候选基因位点),其中显著性水平取0.05,研究人群为东亚人群。
步骤1-2:将T2D Consortium位点、GWAS位点和候选基因位点合并一起,去除重复的位点,并进行连锁分析,保留连锁不平衡(linkage disequilibrium)r2值(correlationcoefficient)<0.8的SNP位点作为Ⅱ型糖尿病关联性SNP位点。
在步骤(2)中,SNP位点的风险度即OR值(Odds ratio)的计算方法为:
获取GWAS研究的文献数据库和候选基因研究的文献数据库中的Ⅱ型糖尿病关联性SNP位点在东亚人群的OR值;或者,
合并东亚人群的样本数据信息,通过病例-对照研究的四格表方法计算Ⅱ型糖尿病关联性SNP位点在东亚人群的OR值。
在步骤(3)中,频率值的计算方法为:
采用GWAS研究的文献数据库和候选基因研究的文献数据中的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值;或者,
合并东亚人群的样本数据信息,计算OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
经过上述步骤所得到的过滤后的SNP位点为:rs10229583,rs10811661,rs10886471,rs10906115,rs10993738,rs1111875,rs11257655,rs11787792,rs12010175,rs13266634,rs1327796,rs1359790,rs1436953,rs1436955,rs1470579,rs1535500,rs163182,rs17584499,rs1801282,rs2028299,rs2237892,rs2237895,rs2237897,rs312457,rs3786897,rs391300,rs4430796,rs4712524,rs5219,rs5945326,rs6467136,rs6780569,rs7041847,rs7656416,rs7756992,rs7903146,rs791595。
在步骤(4)中,计算所有过滤后的SNP在中国个体中的风险等位基因数量为:每个SNP是由2个等位基因组成的基因型,根据自由组合,每个SNP的基因型组成有3种情况:
将含有2个正常等位基因的SNP视为该SNP的风险等位基因的数量为0;
将含有1个正常等位基因的SNP视为该SNP的风险等位基因的数量为1;
将含有0个正常等位基因的SNP视为该SNP的风险等位基因的数量为2。
所述的正常等位基因为不会引起患病(Ⅱ型糖尿病)风险增加的等位基因,风险等位基因为能够引起患病风险增加的等位基因。
在步骤(5)中,Ⅱ型糖尿病的流行病学患病率的计算方法为:
从卫计委的数据库或世界卫生组织的数据库中获取中国人群中的Ⅱ型糖尿病的流行病学患病率;或者,
根据GWAS研究的文献和候选基因研究的文献计算中国人群中的Ⅱ型糖尿病的流行病学患病率,其值为10.44%。
在步骤(6)中,根据贝叶斯算法和哈迪-温伯格平衡原理,构建风险评估模型为:中国个体的患病风险计算公式为:
其中:
P:中国个体的患病概率
D:Ⅱ型糖尿病
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病的流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
将Ⅱ型糖尿病的患病率r=10.44%,所有SNP位点的OR值、频率值代入公式,计算结果见表2:
表2Ⅱ型糖尿病风险等级和人群比例
风险等级 人群百分比 归一化OR值下限 归一化OR值上限 患病风险下限 患病风险上限
21.10% 0 0.657 0.00% 6.86%
73.30% 0.657 1.598 6.86% 16.68%
较高 4.40% 1.598 2.602 16.68% 27.16%
1.20% 2.602 Inf 27.16% Inf
由表2可知,通过本发明的模型,可以精准计算四种风险等级的人群分布和患病率大小,为Ⅱ型糖尿病的人群筛查和个体化预防提供坚实的科学支撑。
一种Ⅱ型糖尿病风险评估模型的构建系统,其包括:
SNP位点检索模块,从多个基因-疾病关联数据库中分别获取与Ⅱ型糖尿病相关的所有的SNP位点;
分析模块,整合所有的SNP位点并去除重复的SNP位点,对剩余的SNP位点进行连锁分析,获得连锁不平衡LD值<0.8的SNP位点作为Ⅱ型糖尿病关联性SNP位点;
风险度计算模块,根据东亚人群的样本数据库的风险度相关样本数据,通过病例-对照研究的四格表方法计算Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度即OR值,并获取OR值≥1.08的SNP位点;
频率值计算模块,根据东亚人群的样本数据库中的频率相关样本数据,计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值,并获得频率值≥0.01的SNP位点作为过滤后的SNP位点;
风险等位基因数量计算模块,计算所有过滤后的SNP在中国个体中的风险等位基因数量;
患病率获取模块,根据中国人群的疾病数据库中的疾病相关样本数据计算出中国人群的Ⅱ型糖尿病流行病学患病率;
模型构建模块,根据中国个体的患病风险计算公式构建Ⅱ型糖尿病风险评估模型;
上述的中国个体的患病风险计算公式为:
P:中国个体的患病概率;
D:Ⅱ型糖尿病;
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
一种Ⅱ型糖尿病风险评估模型的构建方法,其包括如下步骤:
采用SNP位点检索模块从多个基因-疾病关联数据库中分别获取与Ⅱ型糖尿病相关的所有的SNP位点;
采用分析模块整合所有的SNP位点并去除重复的SNP位点,对剩余的SNP位点进行连锁分析,获得连锁不平衡LD值<0.8的SNP位点作为Ⅱ型糖尿病关联性SNP位点;
采用风险度计算模块根据东亚人群的样本数据库的风险度相关样本数据,通过病例-对照研究的四格表方法计算Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度即OR值,并获取OR值≥1.08的SNP位点;
采用频率值计算模块根据东亚人群的样本数据库中的频率相关样本数据,计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值,并获得频率值≥0.01的SNP位点作为过滤后的SNP位点;
采用风险等位基因数量计算模块计算所有过滤后的SNP在中国个体中的风险等位基因数量;
采用患病率获取模块根据中国人群的疾病数据库中的疾病相关样本数据计算出中国人群的Ⅱ型糖尿病流行病学患病率;
采用模型构建模块根据中国个体的患病风险计算公式构建Ⅱ型糖尿病风险评估模型;
中国个体的患病风险计算公式为:
P:中国个体的患病概率;
D:Ⅱ型糖尿病;
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
本发明具有以下技术效果:
1、本发明基于贝叶斯算法和Ⅱ型糖尿病的流行病学统计原理,精准计算风险区间和患病风险,具有极大的理论价值和应用价值。
2、本发明的模型可用于中国人群Ⅱ型糖尿病的筛查工作,提高高风险人群筛查的准确性,降低Ⅱ型糖尿病的发病率,为国家和社会节约大笔开支,利国利民。
3、本发明的模型通过计算人群风险等位基因数量的数学期望和OR值,结合Ⅱ型糖尿病的流行病学患病率,得到群体基于遗传的平均患病率和置信区间,可以有效解决现有技术的计算方法所存在的问题。
附图说明
图1是本发明的一种Ⅱ型糖尿病风险评估模型的构建方法的工作流程图。
图2是中国人群Ⅱ型糖尿病的风险等级图。
具体实施方式
以下结合实施例对本发明作进一步的说明。
实施例1
如图1和图2所示,本实施例提供了与Ⅱ型糖尿病关联的基因SNP位点的获取方法,其包括如下步骤:
步骤1-1、通过T2D-GENES Consortium数据库、GoT2D Consortium数据库、DIAGRAMConsortium数据库获取与Ⅱ型糖尿病相关的SNP位点作为T2D Consortium位点,研究人群为东亚人群(中国、日本、韩国、新加坡华裔);
从GWAS研究的文献数据库中获取与Ⅱ型糖尿病相关的SNP位点作为GWAS位点,其中显著性水平取0.000001,研究人群为东亚人群(中国、日本、韩国、新加坡华裔);
从候选基因研究的文献数据库中获取与Ⅱ型糖尿病相关的SNP关点作为候选基因位点,其中显著性水平取0.05,研究人群为东亚人群(中国、日本、韩国、新加坡华裔)。
步骤1-2、将T2D Consortium位点、GWAS位点和候选基因位点合并一起,去除重复的SNP位点,并进行连锁分析,保留连锁不平衡(LD)的r2值<0.8的SNP位点作为Ⅱ型糖尿病关联性SNP位点。
实施例2
本实施例提供了Ⅱ型糖尿病相关的基因SNP频率值和OR值过滤的方法。
其中,OR值的计算方法为:
获取GWAS研究的文献数据库和候选基因研究的文献数据库中的Ⅱ型糖尿病关联性SNP位点在东亚人群的OR值;或者,
合并东亚人群的样本数据信息,通过病例-对照研究的四格表方法计算Ⅱ型糖尿病关联性SNP位点在东亚人群的OR值。
频率值的计算方法为:
采用GWAS研究的文献数据库和候选基因研究的文献数据中的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值;或者,
合并东亚人群的样本数据信息,计算OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值(即过滤掉OR值<1.08的SNP位点)。
实施例3
本实施例提供了Ⅱ型糖尿病的流行病学患病率的计算方法:通过文献(DiabetesCare 2015Jan;38(1):72-81)计算中国人群的Ⅱ型糖尿病患病率,其值为10.44%。
实施例4
本实施例提供了Ⅱ型糖尿病风险评估模型的构建方法,并计算某个中国个体的患病风险。
其中,Ⅱ型糖尿病风险评估模型的构建方法,其包括下列步骤:
(1)获取Ⅱ型糖尿病关联性SNP位点;
(2)计算Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度即OR值,并获取OR值≥1.08的SNP位点;
(3)计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群的频率值,并获取频率值≥0.01的SNP位点作为过滤后的SNP位点;
(4)计算所有过滤后的SNP在中国个体中的风险等位基因数量;
(5)计算中国人群的Ⅱ型糖尿病的流行病学患病率;
(6)根据贝叶斯算法和哈迪-温伯格平衡原理,构建风险评估模型。
其中,步骤(3)中的过滤后的SNP位点为:rs10229583,rs10811661,rs10886471,rs10906115,rs10993738,rs1111875,rs11257655,rs11787792,rs12010175,rs13266634,rs1327796,rs1359790,rs1436953,rs1436955,rs1470579,rs1535500,rs163182,rs17584499,rs1801282,rs2028299,rs2237892,rs2237895,rs2237897,rs312457,rs3786897,rs391300,rs4430796,rs4712524,rs5219,rs5945326,rs6467136,rs6780569,rs7041847,rs7656416,rs7756992,rs7903146,rs791595。
在步骤(4)中,计算所有过滤后的SNP在中国个体中的风险等位基因数量为:每个SNP是由2个等位基因组成的基因型,根据自由组合,每个SNP的基因型组成有3种情况:
将含有2个正常等位基因的SNP视为该SNP的风险等位基因的数量为0;
将含有1个正常等位基因的SNP视为该SNP的风险等位基因的数量为1;
将含有0个正常等位基因的SNP视为该SNP的风险等位基因的数量为2。
在步骤(6)中,根据贝叶斯算法和哈迪-温伯格平衡原理的构建风险评估模型:
中国个体的患病风险计算公式为:
其中:
P:中国个体的患病概率;
D:Ⅱ型糖尿病;
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病的流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
将某个中国个体的基因信息输入模型,可以计算得到患病风险和风险等级,结果见图2。
实施例5
本实施例提供了一种Ⅱ型糖尿病风险评估模型的构建系统,其包括:
SNP位点检索模块,从多个基因-疾病关联数据库中分别获取与Ⅱ型糖尿病相关的所有的SNP位点;
分析模块,整合所有的SNP位点并去除重复的SNP位点,对剩余的SNP位点进行连锁分析,获得连锁不平衡LD值<0.8的SNP位点作为Ⅱ型糖尿病关联性SNP位点;
风险度计算模块,根据东亚人群的样本数据库的风险度相关样本数据,通过病例-对照研究的四格表方法计算Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度即OR值,并获取OR值≥1.08的SNP位点;
频率值计算模块,根据东亚人群的样本数据库中的频率相关样本数据,计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值,并获得频率值≥0.01的SNP位点作为过滤后的SNP位点;
风险等位基因数量计算模块,计算所有过滤后的SNP在中国个体中的风险等位基因数量;
患病率获取模块,根据中国人群的疾病数据库中的疾病相关样本数据计算出中国人群的Ⅱ型糖尿病流行病学患病率;
模型构建模块,根据中国个体的患病风险计算公式构建Ⅱ型糖尿病风险评估模型;
中国个体的患病风险计算公式为:
P:中国个体的患病概率;
D:Ⅱ型糖尿病;
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
将某个中国个体的基因信息输入本实施例的构建系统所构建出的Ⅱ型糖尿病风险评估模型,可以计算得到该中国个体的患病风险和风险等级。
实施例6
本实施例提供一种Ⅱ型糖尿病风险评估模型的构建方法,其包括如下步骤:
采用SNP位点检索模块从多个基因-疾病关联数据库中分别获取与Ⅱ型糖尿病相关的所有的SNP位点;
采用分析模块整合所有的SNP位点并去除重复的SNP位点,对剩余的SNP位点进行连锁分析,获得连锁不平衡LD值<0.8的SNP位点作为Ⅱ型糖尿病关联性SNP位点;
采用风险度计算模块根据东亚人群的样本数据库的风险度相关样本数据,通过病例-对照研究的四格表方法计算Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度即OR值,并获取OR值≥1.08的SNP位点;
采用频率值计算模块根据东亚人群的样本数据库中的频率相关样本数据,计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值,并获得频率值≥0.01的SNP位点作为过滤后的SNP位点;
采用风险等位基因数量计算模块计算所有过滤后的SNP在中国个体中的风险等位基因数量;
采用患病率获取模块根据中国人群的疾病数据库中的疾病相关样本数据计算出中国人群的Ⅱ型糖尿病流行病学患病率;
采用模型构建模块根据中国个体的患病风险计算公式构建Ⅱ型糖尿病风险评估模型;
中国个体的患病风险计算公式为:
P:中国个体的患病概率;
D:Ⅱ型糖尿病;
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
将某个中国个体的基因信息输入本实施例的构建方法所构建出的Ⅱ型糖尿病风险评估模型,可以计算得到该中国个体的患病风险和风险等级。
以上详细描述了本发明的较佳具体实施例。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种Ⅱ型糖尿病风险评估模型的构建方法,其特征在于:包括下列步骤:
(1)获取Ⅱ型糖尿病关联性SNP位点;
(2)计算所述Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度即OR值,并获取OR值≥1.08的SNP位点;
(3)计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群的频率值,并获取频率值≥0.01的SNP位点作为过滤后的SNP位点;
(4)计算所有过滤后的SNP在中国个体中的风险等位基因数量;
(5)计算中国人群的Ⅱ型糖尿病的流行病学患病率;
(6)根据贝叶斯算法和哈迪-温伯格平衡原理,构建风险评估模型。
2.根据权利要求1所述的Ⅱ型糖尿病风险评估模型的构建方法,其特征在于:步骤(1)包括:
步骤1-1、从T2D-GENES Consortium数据库、GoT2D Consortium数据库和DIAGRAMConsortium数据库中获取与Ⅱ型糖尿病相关的SNP位点作为T2D Consortium位点,研究人群为东亚人群;
从GWAS研究的文献数据库中获取与Ⅱ型糖尿病相关的SNP位点作为GWAS位点,其中显著性水平取0.000001,研究人群为东亚人群;
从候选基因研究的文献数据库中获取与Ⅱ型糖尿病相关的SNP位点作为候选基因位点,其中显著性水平取0.05,研究人群为东亚人群;
步骤1-2、将T2D Consortium位点、GWAS位点和候选基因位点合并一起,去除重复的SNP位点,并进行连锁分析,保留连锁不平衡r2值<0.8的SNP位点作为所述Ⅱ型糖尿病关联性SNP位点。
3.根据权利要求1所述的Ⅱ型糖尿病风险评估模型的构建方法,其特征在于:在步骤(2)中,OR值的计算方法为:
获取GWAS研究的文献数据库和候选基因研究的文献数据库中的所述Ⅱ型糖尿病关联性SNP位点在东亚人群的OR值;或者,
合并东亚人群的样本数据信息,通过病例-对照研究的四格表方法计算所述Ⅱ型糖尿病关联性SNP位点在东亚人群的OR值。
4.根据权利要求1所述的Ⅱ型糖尿病风险评估模型的构建方法,其特征在于:在步骤(3)中,频率值的计算方法为:
采用GWAS研究的文献数据库和候选基因研究的文献数据中的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值;或者,
合并东亚人群的样本数据信息,计算OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
5.根据权利要求1所述的Ⅱ型糖尿病风险评估模型的构建方法,其特征在于:在步骤(4)中,计算所有过滤后的SNP在所述中国个体中的风险等位基因数量为:每个SNP是由2个等位基因组成的基因型,根据自由组合,每个SNP的基因型组成有3种情况:
将含有2个正常等位基因的SNP视为该SNP的风险等位基因的数量为0;
将含有1个正常等位基因的SNP视为该SNP的风险等位基因的数量为1;
将含有0个正常等位基因的SNP视为该SNP的风险等位基因的数量为2。
6.根据权利要求1所述的Ⅱ型糖尿病风险评估模型的构建方法,其特征在于,步骤(3)中所述的过滤后的SNP位点为:rs10229583,rs10811661,rs10886471,rs10906115,rs10993738,rs1111875,rs11257655,rs11787792,rs12010175,rs13266634,rs1327796,rs1359790,rs1436953,rs1436955,rs1470579,rs1535500,rs163182,rs17584499,rs1801282,rs2028299,rs2237892,rs2237895,rs2237897,rs312457,rs3786897,rs391300,rs4430796,rs4712524,rs5219,rs5945326,rs6467136,rs6780569,rs7041847,rs7656416,rs7756992,rs7903146,rs791595。
7.根据权利要求1所述的Ⅱ型糖尿病风险评估模型的构建方法,其特征在于,在步骤(4)中,所述流行病学患病率的计算方法为:
从卫计委的数据库或世界卫生组织的数据库中获取中国人群中的Ⅱ型糖尿病的流行病学患病率;或者,
根据GWAS研究的文献和候选基因研究的文献计算中国人群中的Ⅱ型糖尿病的流行病学患病率,其值为10.44%。
8.根据权利要求1所述的Ⅱ型糖尿病风险评估模型的构建方法,其特征在于:根据贝叶斯算法和哈迪-温伯格平衡原理的构建风险评估模型:
其中,所述中国个体的患病风险计算公式为
<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>|</mo> <mi>k</mi> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> <mi>k</mi> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> <mn>...</mn> <mi>k</mi> <mo>&amp;lsqb;</mo> <mi>N</mi> <mo>&amp;rsqb;</mo> <mo>)</mo> </mrow> <mo>=</mo> <mi>r</mi> <munderover> <mo>&amp;Pi;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msubsup> <mi>g</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow> </msubsup> <mo>/</mo> <msup> <mrow> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>&amp;rsqb;</mo> </mrow> <mn>2</mn> </msup> </mrow>
其中:
P:所述中国个体的患病概率;
D:Ⅱ型糖尿病;
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病的流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
9.一种Ⅱ型糖尿病风险评估模型的构建系统,其特征在于:包括:
SNP位点检索模块,从多个基因-疾病关联数据库中分别获取与Ⅱ型糖尿病相关的所有的SNP位点;
分析模块,整合所述所有的SNP位点并去除重复的SNP位点,对剩余的SNP位点进行连锁分析,获得连锁不平衡LD值<0.8的SNP位点作为Ⅱ型糖尿病关联性SNP位点;
风险度计算模块,根据东亚人群的样本数据库的风险度相关样本数据,通过病例-对照研究的四格表方法计算所述Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度即OR值,并获取OR值≥1.08的SNP位点;
频率值计算模块,根据东亚人群的样本数据库中的频率相关样本数据,计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值,并获得频率值≥0.01的SNP位点作为过滤后的SNP位点;
风险等位基因数量计算模块,计算所有过滤后的SNP在中国个体中的风险等位基因数量;
患病率获取模块,根据中国人群的疾病数据库中的疾病相关样本数据计算出中国人群的Ⅱ型糖尿病流行病学患病率;
模型构建模块,根据所述中国个体的患病风险计算公式构建Ⅱ型糖尿病风险评估模型;
所述中国个体的患病风险计算公式为:
<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>|</mo> <mi>k</mi> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> <mi>k</mi> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> <mn>...</mn> <mi>k</mi> <mo>&amp;lsqb;</mo> <mi>N</mi> <mo>&amp;rsqb;</mo> <mo>)</mo> </mrow> <mo>=</mo> <mi>r</mi> <munderover> <mo>&amp;Pi;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msubsup> <mi>g</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow> </msubsup> <mo>/</mo> <msup> <mrow> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>&amp;rsqb;</mo> </mrow> <mn>2</mn> </msup> </mrow>
P:所述中国个体的患病概率;
D:Ⅱ型糖尿病;
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
10.一种Ⅱ型糖尿病风险评估模型的构建方法,其特征在于:包括如下步骤:
采用SNP位点检索模块从多个基因-疾病关联数据库中分别获取与Ⅱ型糖尿病相关的所有的SNP位点;
采用分析模块整合所述所有的SNP位点并去除重复的SNP位点,对剩余的SNP位点进行连锁分析,获得连锁不平衡LD值<0.8的SNP位点作为Ⅱ型糖尿病关联性SNP位点;
采用风险度计算模块根据东亚人群的样本数据库的风险度相关样本数据,通过病例-对照研究的四格表方法计算所述Ⅱ型糖尿病关联性SNP位点在东亚人群中的风险度即OR值,并获取OR值≥1.08的SNP位点;
采用频率值计算模块根据东亚人群的样本数据库中的频率相关样本数据,计算所有的OR值≥1.08的SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值,并获得频率值≥0.01的SNP位点作为过滤后的SNP位点;
采用风险等位基因数量计算模块计算所有过滤后的SNP在中国个体中的风险等位基因数量;
采用患病率获取模块根据中国人群的疾病数据库中的疾病相关样本数据计算出中国人群的Ⅱ型糖尿病流行病学患病率;
采用模型构建模块根据所述中国个体的患病风险计算公式构建Ⅱ型糖尿病风险评估模型;
所述中国个体的患病风险计算公式为:
<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>D</mi> <mo>|</mo> <mi>k</mi> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>&amp;rsqb;</mo> <mi>k</mi> <mo>&amp;lsqb;</mo> <mn>2</mn> <mo>&amp;rsqb;</mo> <mn>...</mn> <mi>k</mi> <mo>&amp;lsqb;</mo> <mi>N</mi> <mo>&amp;rsqb;</mo> <mo>)</mo> </mrow> <mo>=</mo> <mi>r</mi> <munderover> <mo>&amp;Pi;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msubsup> <mi>g</mi> <mi>i</mi> <mrow> <mi>k</mi> <mo>&amp;lsqb;</mo> <mi>i</mi> <mo>&amp;rsqb;</mo> </mrow> </msubsup> <mo>/</mo> <msup> <mrow> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>g</mi> <mi>i</mi> </msub> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>&amp;rsqb;</mo> </mrow> <mn>2</mn> </msup> </mrow>
P:所述中国个体的患病概率;
D:Ⅱ型糖尿病;
k[i]:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因的数量;
r:中国人群的Ⅱ型糖尿病流行病学患病率;
π:乘积符号;
gi:每个过滤后的SNP位点的风险等位基因数量为1个时的OR值;
pi:在所有的过滤后的SNP位点中,第i个SNP位点的风险等位基因在没有获得Ⅱ型糖尿病的东亚人群中的频率值。
CN201610801091.8A 2016-09-05 2016-09-05 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统 Expired - Fee Related CN107256323B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610801091.8A CN107256323B (zh) 2016-09-05 2016-09-05 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610801091.8A CN107256323B (zh) 2016-09-05 2016-09-05 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统

Publications (2)

Publication Number Publication Date
CN107256323A true CN107256323A (zh) 2017-10-17
CN107256323B CN107256323B (zh) 2020-11-13

Family

ID=60027106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610801091.8A Expired - Fee Related CN107256323B (zh) 2016-09-05 2016-09-05 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统

Country Status (1)

Country Link
CN (1) CN107256323B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107955834A (zh) * 2017-12-05 2018-04-24 北京市计算中心 用于检测2型糖尿病易感基因的突变位点组合及其检测引物与应用
CN108172296A (zh) * 2018-01-23 2018-06-15 上海其明信息技术有限公司 一种数据库的建立方法和遗传疾病的风险预测方法
CN110070940A (zh) * 2019-03-11 2019-07-30 贡鸣 一种患病风险值确定方法、装置、电子设备及存储介质
CN110189829A (zh) * 2019-06-21 2019-08-30 深圳供电局有限公司 一种电力职业人群重大慢性病风险评估方法及系统
CN110527719A (zh) * 2019-08-27 2019-12-03 北京天平永达生物科技发展有限公司 一种建立妊娠糖尿病风险评估的早期筛查量表的方法
CN113393896A (zh) * 2021-06-11 2021-09-14 成都果壳医学科技有限公司 一种基于深度神经网络的i型糖尿病风险评估系统
CN117637037A (zh) * 2023-12-01 2024-03-01 广州中鑫基因医学科技有限公司 致病基因数据库的建立方法、数据库及风险预测系统
CN117649948A (zh) * 2024-01-29 2024-03-05 深圳市早知道科技有限公司 一种基于基因检测的微生物感染风险预测方法及系统
CN117649948B (zh) * 2024-01-29 2024-05-10 深圳市早知道科技有限公司 一种基于基因检测的微生物感染风险预测方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070059722A1 (en) * 2005-01-05 2007-03-15 Oy Jurilab Ltd Novel genes and markers associated to type 2 diabetes mellitus
CN101302563A (zh) * 2008-07-08 2008-11-12 上海中优医药高科技有限公司 一种多基因疾病遗传风险综合评估方法
CN101960019A (zh) * 2007-04-03 2011-01-26 国家科学研究中心 与肥胖症和/或ⅱ型糖尿病相关的fto基因多态性
CN102930135A (zh) * 2012-09-28 2013-02-13 西安时代基因健康科技有限公司 糖尿病及并发症的表征参数的获取方法
CN103154272A (zh) * 2010-08-25 2013-06-12 香港中文大学 利用遗传标志物和阵列预测糖尿病相关并发症风险的方法和试剂盒
CN103226667A (zh) * 2013-05-17 2013-07-31 西安时代基因健康科技有限公司 高血压及并发症的表征参数的获取方法
US20140067280A1 (en) * 2012-08-28 2014-03-06 Inova Health System Ancestral-Specific Reference Genomes And Uses Thereof
CN104573408A (zh) * 2013-10-18 2015-04-29 大江基因医学股份有限公司 单一核苷酸多型性疾病发生率预测系统
CN104866732A (zh) * 2014-02-21 2015-08-26 北京协力润华科技有限责任公司 基于单核苷酸多态性和逻辑回归模型计算肺癌发病率的方法及其应用
CN105069322A (zh) * 2015-07-24 2015-11-18 上海丰核信息科技有限公司 疾病易感风险预测方法及装置
CN105279369A (zh) * 2015-09-06 2016-01-27 苏州协云和创生物科技有限公司 一种基于二代测序的冠心病遗传风险评估方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070059722A1 (en) * 2005-01-05 2007-03-15 Oy Jurilab Ltd Novel genes and markers associated to type 2 diabetes mellitus
CN101960019A (zh) * 2007-04-03 2011-01-26 国家科学研究中心 与肥胖症和/或ⅱ型糖尿病相关的fto基因多态性
CN101302563A (zh) * 2008-07-08 2008-11-12 上海中优医药高科技有限公司 一种多基因疾病遗传风险综合评估方法
CN103154272A (zh) * 2010-08-25 2013-06-12 香港中文大学 利用遗传标志物和阵列预测糖尿病相关并发症风险的方法和试剂盒
US20140067280A1 (en) * 2012-08-28 2014-03-06 Inova Health System Ancestral-Specific Reference Genomes And Uses Thereof
CN102930135A (zh) * 2012-09-28 2013-02-13 西安时代基因健康科技有限公司 糖尿病及并发症的表征参数的获取方法
CN103226667A (zh) * 2013-05-17 2013-07-31 西安时代基因健康科技有限公司 高血压及并发症的表征参数的获取方法
CN104573408A (zh) * 2013-10-18 2015-04-29 大江基因医学股份有限公司 单一核苷酸多型性疾病发生率预测系统
CN104866732A (zh) * 2014-02-21 2015-08-26 北京协力润华科技有限责任公司 基于单核苷酸多态性和逻辑回归模型计算肺癌发病率的方法及其应用
CN105069322A (zh) * 2015-07-24 2015-11-18 上海丰核信息科技有限公司 疾病易感风险预测方法及装置
CN105279369A (zh) * 2015-09-06 2016-01-27 苏州协云和创生物科技有限公司 一种基于二代测序的冠心病遗传风险评估方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
牛大彦 等: "遗传风险评分在复杂疾病遗传学研究中的应用", 《遗传》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107955834A (zh) * 2017-12-05 2018-04-24 北京市计算中心 用于检测2型糖尿病易感基因的突变位点组合及其检测引物与应用
CN108172296A (zh) * 2018-01-23 2018-06-15 上海其明信息技术有限公司 一种数据库的建立方法和遗传疾病的风险预测方法
CN110070940A (zh) * 2019-03-11 2019-07-30 贡鸣 一种患病风险值确定方法、装置、电子设备及存储介质
CN110070940B (zh) * 2019-03-11 2021-06-08 贡鸣 一种患病风险值确定方法、装置、电子设备及存储介质
CN110189829A (zh) * 2019-06-21 2019-08-30 深圳供电局有限公司 一种电力职业人群重大慢性病风险评估方法及系统
CN110527719A (zh) * 2019-08-27 2019-12-03 北京天平永达生物科技发展有限公司 一种建立妊娠糖尿病风险评估的早期筛查量表的方法
CN110527719B (zh) * 2019-08-27 2023-06-09 北京天平永达生物科技发展有限公司 一种建立妊娠糖尿病风险评估的早期筛查量表的方法
CN113393896A (zh) * 2021-06-11 2021-09-14 成都果壳医学科技有限公司 一种基于深度神经网络的i型糖尿病风险评估系统
CN117637037A (zh) * 2023-12-01 2024-03-01 广州中鑫基因医学科技有限公司 致病基因数据库的建立方法、数据库及风险预测系统
CN117649948A (zh) * 2024-01-29 2024-03-05 深圳市早知道科技有限公司 一种基于基因检测的微生物感染风险预测方法及系统
CN117649948B (zh) * 2024-01-29 2024-05-10 深圳市早知道科技有限公司 一种基于基因检测的微生物感染风险预测方法及系统

Also Published As

Publication number Publication date
CN107256323B (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN107256323A (zh) 一种ⅱ型糖尿病风险评估模型的构建方法和构建系统
Tao et al. GA-SVM based feature selection and parameter optimization in hospitalization expense modeling
Trejo et al. Genetic nature or genetic nurture? Introducing social genetic parameters to quantify bias in polygenic score analyses
Shabalin et al. Merging two gene-expression studies via cross-platform normalization
Benjamini et al. Selective inference in complex research
Guerra et al. Meta-analysis and combining information in genetics and genomics
El Naqa et al. Radiogenomics and radiotherapy response modeling
WO2019169049A1 (en) Multimodal modeling systems and methods for predicting and managing dementia risk for individuals
CN106636398A (zh) 一种改进的阿尔茨海默病发病风险预测方法
US11735290B2 (en) Estimation of phenotypes using DNA, pedigree, and historical data
Pasaniuc et al. Analysis of Latino populations from GALA and MEC studies reveals genomic loci with biased local ancestry estimation
CN107025384A (zh) 一种复杂数据预测模型的构建方法
Zhang et al. Building up a robust risk mathematical platform to predict colorectal cancer
Lee et al. Gene–gene interaction analysis for the survival phenotype based on the Cox model
Bibi et al. Prediction of emergency department visits for respiratory symptoms using an artificial neural network
CN105279369A (zh) 一种基于二代测序的冠心病遗传风险评估方法
Xiao et al. A phylogeny-regularized sparse regression model for predictive modeling of microbial community data
Gopalan et al. Human genetic admixture through the lens of population genomics
Connolly et al. Evidence of assortative mating in autism spectrum disorder
Kianfar et al. GIS-based spatio-temporal analysis and modeling of COVID-19 incidence rates in Europe
König et al. Machine learning and data mining in complex genomic data—a review on the lessons learned in Genetic Analysis Workshop 19
Friedrichs et al. Filtering genetic variants and placing informative priors based on putative biological function
US20200381089A1 (en) System and method of data interpretation and providing recommendations to the user on the basis of his genetic data and data on the composition of gut microbiota
Pfeiffer et al. On combining family and case‐control studies
Oze et al. A personal breast cancer risk stratification model using common variants and environmental risk factors in japanese females

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201113

Termination date: 20210905

CF01 Termination of patent right due to non-payment of annual fee