CN102419791A - 人类常见病遗传风险评估方法 - Google Patents

人类常见病遗传风险评估方法 Download PDF

Info

Publication number
CN102419791A
CN102419791A CN2010102944936A CN201010294493A CN102419791A CN 102419791 A CN102419791 A CN 102419791A CN 2010102944936 A CN2010102944936 A CN 2010102944936A CN 201010294493 A CN201010294493 A CN 201010294493A CN 102419791 A CN102419791 A CN 102419791A
Authority
CN
China
Prior art keywords
database
risk
sample
data
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102944936A
Other languages
English (en)
Inventor
王一
王颖
金力
黄薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI SOUTH GENE TECHNOLOGY Co Ltd
Fudan University
Chinese National Human Genome Center at Shanghai
Shanghai Human Genome Research Center
Original Assignee
SHANGHAI SOUTH GENE TECHNOLOGY Co Ltd
Fudan University
Shanghai Human Genome Research Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI SOUTH GENE TECHNOLOGY Co Ltd, Fudan University, Shanghai Human Genome Research Center filed Critical SHANGHAI SOUTH GENE TECHNOLOGY Co Ltd
Priority to CN2010102944936A priority Critical patent/CN102419791A/zh
Publication of CN102419791A publication Critical patent/CN102419791A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种人类常见病遗传风险评估方法,建立一个较大的病例——正常人环境资料和遗传信息支持数据库,然后通过关联分析,找出与疾病关系比较密切的风险因子,再对待风险评估者,搜索数据库,找出与其最相似若干个样本。统计这些样本的患病概率。作为该人的患病风险概率。若其风险很大/很小,则作出患病/健康的预测。本发明不需要对疾病机理有所假设,特别适用于多因子复杂疾病;对风险的评估准确性高;可扩展性好,即随着样本库的增加,风险评估的准确性能持续提高;算法实现容易,速度快。

Description

人类常见病遗传风险评估方法
技术领域
本发明涉及一种涉及生物医药领域的方法,尤其是一种人类常见病遗传风险评估方法。
背景技术
目前对于疾病风险评估主要技术是逻辑回归Logistic Regression,缩写为LR。
LR的简要模型如下:
Figure 711930DEST_PATH_IMAGE001
其中p为个体患病概率,xi为各种风险因素,例如基因缺陷、不良生活习惯等。ai和b都是回归系数。该内容在以下参考文献中有详细描述:Hilbe, Joseph M. (2009). Logistic Regression Models. Chapman & Hall/CRC Press. ISBN 978-1-4200-7575-5。
在LR模型中,事实上假定了:
1. 各个风险因子互相独立;
2. 这些风险因子之间没有交互作用。
而现实的情况常常是:
1. 风险因子之间有相关性,例如所谓的“烟酒不分家”,吸烟的人更有可能饮酒;
2. 风险因子之间有交互作用,例如先天性过敏体质的人,在花粉刺激下会导致哮喘。而两个风险因子单独作用却不易导致哮喘。
因此,传统的LR模型无法很好的在现实条件下进行患病综合风险评估。
随着基因检测技术的进步与普及,如何利用检测到的个人基因信息结合环境暴露情况来评估特定疾病的患病风险已经成为人们关注的热点。现有的逻辑回归的方法并非为患病风险评估定制,无论应用的可行性与风险评估的准确性都无法满足实际需求。疾病风险评估有其自身的特点:疾病特别是复杂疾病牵涉到的因子很多,而且其结果不是个因子的简单累加,使得难以对其建模,从而使得逻辑回归方法效果欠佳。
发明内容
本发明所要解决的技术问题是提供一种人类常见病遗传风险评估方法,能够结合疾病风险评估这一特点,发展出一种能充分利用个人基因信息以及环境暴露情况,但又独立于对疾病机理假设的通用方法来评估患病风险。
为解决上述技术问题,本发明人类常见病遗传风险评估方法的技术方案是,包括如下步骤:
建立一个数据库,该数据库需要包含健康人与病人的流行病学资料,以及在若干遗传相关位点上的基因分型资料;
对于以上资料/变量,根据其与疾病的相关性排序,重要的变量列在前面;
对于一个待检测个体,首先获取其上述各个资料,作为风险评估的依据;
依据变量的重要程度进行数据库匹配:比较数据库中的某样本与待检测样本的第一个变量,如果匹配则继续比较第二个,第三个,直到无法匹配为止;选择数据库中与待检测样本最为匹配的前多个样本;根据这些最匹配的数据库样本中的患者比例估计待检测样本的患病概率,并用群体患病率校正数据库样本采集的偏差。
本发明通过上述方法,不需要对疾病机理有所假设,特别适用于多因子复杂疾病;对风险的评估准确性高;可扩展性好,即随着样本库的增加,风险评估的准确性能持续提高;算法实现容易,速度快。
附图说明
图1为本发明人类常见病遗传风险评估方法中数据库的示意图。
具体实施方式
 本发明公开了一种一种人类常见病遗传风险评估方法,结合图1所示,包括如下步骤:
建立一个数据库,该数据库需要包含健康人与病人的流行病学资料,以及在若干遗传相关位点上的基因分型资料;
对于以上资料/变量,根据其与疾病的相关性排序,重要的变量列在前面;
对于一个待检测个体,首先获取其上述各个资料,作为风险评估的依据;
依据变量的重要程度进行数据库匹配:比较数据库中的某样本与待检测样本的第一个变量,如果匹配则继续比较第二个,第三个,直到无法匹配为止;选择数据库中与待检测样本最为匹配的前多个样本;根据这些最匹配的数据库样本中的患者比例估计待检测样本的患病概率,并用群体患病率校正数据库样本采集的偏差。
本发明还包括不断扩大数据库的样本量以及变量数目。
本发明相对于现有的Logisitic Regression方法:
1. 本发明可以对任意多个风险因子的总体效应进行评估,而现有的LR方法只能做数个风险因子的总体效应评估;
2. 本发明在对待监测个体的鉴别率上,本方法显著的好于传统的LR方法。由于前一条原因,在比较两种方法评估效果的时候,无法使用多达上百个因子的实际数据,这里只展示一次模拟4个因子数据的结果: 
本方法 预测健康 预测患病 正确率
健康 370 130 74.0%
患病 51 449 89.8%
总计     81.9%
       
LR方法 预测健康 预测患病 正确率
健康 329 171 65.8%
患病 145 355 71.0%
总计     68.4%
3. 本发明的实际鉴定正确率依赖于其支持数据库,随着数据库质量和数量提高,鉴定正确率可以相应的不断提高。
 综上所述,本发明建立一个较大的病例——正常人环境资料和遗传信息支持数据库,然后通过关联分析,找出与疾病关系比较密切的风险因子,再对待风险评估者,搜索数据库,找出与其最相似若干个样本。统计这些样本的患病概率。作为该人的患病风险概率。若其风险很大/很小,则作出患病/健康的预测。本发明不需要对疾病机理有所假设,特别适用于多因子复杂疾病;对风险的评估准确性高;可扩展性好,即随着样本库的增加,风险评估的准确性能持续提高;算法实现容易,速度快。 

Claims (2)

1.一种人类常见病遗传风险评估方法,其特征在于,包括如下步骤:
建立一个数据库,该数据库需要包含健康人与病人的流行病学资料,以及在若干遗传相关位点上的基因分型资料;
对于以上资料/变量,根据其与疾病的相关性排序,重要的变量列在前面;
对于一个待检测个体,首先获取其上述各个资料,作为风险评估的依据;
依据变量的重要程度进行数据库匹配:比较数据库中的某样本与待检测样本的第一个变量,如果匹配则继续比较第二个,第三个,直到无法匹配为止;选择数据库中与待检测样本最为匹配的前多个样本;根据这些最匹配的数据库样本中的患者比例估计待检测样本的患病概率,并用群体患病率校正数据库样本采集的偏差。
2.根据权利要求1所述的人类常见病遗传风险评估方法,其特征在于,还包括不断扩大数据库的样本量以及变量数目。
CN2010102944936A 2010-09-28 2010-09-28 人类常见病遗传风险评估方法 Pending CN102419791A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102944936A CN102419791A (zh) 2010-09-28 2010-09-28 人类常见病遗传风险评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102944936A CN102419791A (zh) 2010-09-28 2010-09-28 人类常见病遗传风险评估方法

Publications (1)

Publication Number Publication Date
CN102419791A true CN102419791A (zh) 2012-04-18

Family

ID=45944202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102944936A Pending CN102419791A (zh) 2010-09-28 2010-09-28 人类常见病遗传风险评估方法

Country Status (1)

Country Link
CN (1) CN102419791A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020454A (zh) * 2012-12-15 2013-04-03 中国科学院深圳先进技术研究院 发病关键因素提取与疾病预警方法及系统
CN104462858A (zh) * 2014-12-30 2015-03-25 天津迈沃医药技术有限公司 基于多阶隐马尔可夫模型的健康预警方法
CN107229841A (zh) * 2017-05-24 2017-10-03 重庆金域医学检验所有限公司 一种基因变异评估方法及系统
CN107526931A (zh) * 2017-08-29 2017-12-29 北斗云谷(北京)科技有限公司 基于个性化因子的健康评估的方法
CN110364259A (zh) * 2019-05-30 2019-10-22 中国人民解放军总医院 一种高原疾病预测方法、系统、介质及电子设备
CN111091903A (zh) * 2019-12-12 2020-05-01 和宇健康科技股份有限公司 针对遗传疾病风险概率评估及阻断或改善方法推荐系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020454A (zh) * 2012-12-15 2013-04-03 中国科学院深圳先进技术研究院 发病关键因素提取与疾病预警方法及系统
CN104462858A (zh) * 2014-12-30 2015-03-25 天津迈沃医药技术有限公司 基于多阶隐马尔可夫模型的健康预警方法
CN107229841A (zh) * 2017-05-24 2017-10-03 重庆金域医学检验所有限公司 一种基因变异评估方法及系统
CN107229841B (zh) * 2017-05-24 2018-07-06 重庆金域医学检验所有限公司 一种基因变异评估方法及系统
CN107526931A (zh) * 2017-08-29 2017-12-29 北斗云谷(北京)科技有限公司 基于个性化因子的健康评估的方法
CN110364259A (zh) * 2019-05-30 2019-10-22 中国人民解放军总医院 一种高原疾病预测方法、系统、介质及电子设备
CN110364259B (zh) * 2019-05-30 2022-05-31 中国人民解放军总医院 一种高原疾病预测方法、系统、介质及电子设备
CN111091903A (zh) * 2019-12-12 2020-05-01 和宇健康科技股份有限公司 针对遗传疾病风险概率评估及阻断或改善方法推荐系统

Similar Documents

Publication Publication Date Title
Wang et al. Using street view data and machine learning to assess how perception of neighborhood safety influences urban residents’ mental health
Keuning et al. Mortality prediction models in the adult critically ill: A scoping review
Collins et al. Sample size considerations for the external validation of a multivariable prognostic model: a resampling study
Hendren et al. Early discharge and hospital readmission after colectomy for cancer
Anderson et al. Identifying clusters in Bayesian disease mapping
Xylinas et al. Accuracy of the EORTC risk tables and of the CUETO scoring model to predict outcomes in non-muscle-invasive urothelial carcinoma of the bladder
US20160063212A1 (en) System for Generating and Updating Treatment Guidelines and Estimating Effect Size of Treatment Steps
Comte et al. Species distribution modelling and imperfect detection: comparing occupancy versus consensus methods
Macomber et al. Centre volume and resource consumption in liver transplantation
Scandurra et al. Does climate finance reduce vulnerability in Small Island Developing States? An empirical investigation
Li et al. Application of a hybrid model in predicting the incidence of tuberculosis in a Chinese population
CN102419791A (zh) 人类常见病遗传风险评估方法
CN110993103A (zh) 疾病风险预测模型的建立方法和疾病保险产品的推荐方法
Kullgren et al. Financial incentives for completion of fecal occult blood tests among veterans: a 2-stage, pragmatic, cluster, randomized, controlled trial
Shih et al. Reliability of readmission rates as a hospital quality measure in cardiac surgery
Wang et al. A vision-based active learning convolutional neural network model for concrete surface crack detection
CN105654198B (zh) 具有最优阈值筛选的品牌广告效果优化的方法
Paulon et al. Joint modeling of recurrent events and survival: a Bayesian non-parametric approach
Aaron et al. Influence of country-level differences on COPD prevalence
Barcella et al. Variable selection in covariate dependent random partition models: an application to urinary tract infection
Subramanian et al. Personalized medicine for prevention: can risk stratified screening decrease colorectal cancer mortality at an acceptable cost?
Luque-Fernandez et al. Data-adaptive estimation for double-robust methods in population-based cancer epidemiology: risk differences for lung cancer mortality by emergency presentation
Wang et al. Mutual information based analysis for the distribution of financial contagion in stock markets
Mukherjee et al. Suicide disparities across metropolitan areas in the US: A comparative assessment of socio-environmental factors using a data-driven predictive approach
Ahmed et al. Tweets and votes: A four-country comparison of volumetric and sentiment analysis approaches

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120418