CN102419791A - 人类常见病遗传风险评估方法 - Google Patents
人类常见病遗传风险评估方法 Download PDFInfo
- Publication number
- CN102419791A CN102419791A CN2010102944936A CN201010294493A CN102419791A CN 102419791 A CN102419791 A CN 102419791A CN 2010102944936 A CN2010102944936 A CN 2010102944936A CN 201010294493 A CN201010294493 A CN 201010294493A CN 102419791 A CN102419791 A CN 102419791A
- Authority
- CN
- China
- Prior art keywords
- database
- risk
- sample
- data
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种人类常见病遗传风险评估方法,建立一个较大的病例——正常人环境资料和遗传信息支持数据库,然后通过关联分析,找出与疾病关系比较密切的风险因子,再对待风险评估者,搜索数据库,找出与其最相似若干个样本。统计这些样本的患病概率。作为该人的患病风险概率。若其风险很大/很小,则作出患病/健康的预测。本发明不需要对疾病机理有所假设,特别适用于多因子复杂疾病;对风险的评估准确性高;可扩展性好,即随着样本库的增加,风险评估的准确性能持续提高;算法实现容易,速度快。
Description
技术领域
本发明涉及一种涉及生物医药领域的方法,尤其是一种人类常见病遗传风险评估方法。
背景技术
目前对于疾病风险评估主要技术是逻辑回归Logistic Regression,缩写为LR。
LR的简要模型如下:
其中p为个体患病概率,xi为各种风险因素,例如基因缺陷、不良生活习惯等。ai和b都是回归系数。该内容在以下参考文献中有详细描述:Hilbe, Joseph M. (2009). Logistic Regression Models. Chapman & Hall/CRC Press. ISBN 978-1-4200-7575-5。
在LR模型中,事实上假定了:
1. 各个风险因子互相独立;
2. 这些风险因子之间没有交互作用。
而现实的情况常常是:
1. 风险因子之间有相关性,例如所谓的“烟酒不分家”,吸烟的人更有可能饮酒;
2. 风险因子之间有交互作用,例如先天性过敏体质的人,在花粉刺激下会导致哮喘。而两个风险因子单独作用却不易导致哮喘。
因此,传统的LR模型无法很好的在现实条件下进行患病综合风险评估。
随着基因检测技术的进步与普及,如何利用检测到的个人基因信息结合环境暴露情况来评估特定疾病的患病风险已经成为人们关注的热点。现有的逻辑回归的方法并非为患病风险评估定制,无论应用的可行性与风险评估的准确性都无法满足实际需求。疾病风险评估有其自身的特点:疾病特别是复杂疾病牵涉到的因子很多,而且其结果不是个因子的简单累加,使得难以对其建模,从而使得逻辑回归方法效果欠佳。
发明内容
本发明所要解决的技术问题是提供一种人类常见病遗传风险评估方法,能够结合疾病风险评估这一特点,发展出一种能充分利用个人基因信息以及环境暴露情况,但又独立于对疾病机理假设的通用方法来评估患病风险。
为解决上述技术问题,本发明人类常见病遗传风险评估方法的技术方案是,包括如下步骤:
建立一个数据库,该数据库需要包含健康人与病人的流行病学资料,以及在若干遗传相关位点上的基因分型资料;
对于以上资料/变量,根据其与疾病的相关性排序,重要的变量列在前面;
对于一个待检测个体,首先获取其上述各个资料,作为风险评估的依据;
依据变量的重要程度进行数据库匹配:比较数据库中的某样本与待检测样本的第一个变量,如果匹配则继续比较第二个,第三个,直到无法匹配为止;选择数据库中与待检测样本最为匹配的前多个样本;根据这些最匹配的数据库样本中的患者比例估计待检测样本的患病概率,并用群体患病率校正数据库样本采集的偏差。
本发明通过上述方法,不需要对疾病机理有所假设,特别适用于多因子复杂疾病;对风险的评估准确性高;可扩展性好,即随着样本库的增加,风险评估的准确性能持续提高;算法实现容易,速度快。
附图说明
图1为本发明人类常见病遗传风险评估方法中数据库的示意图。
具体实施方式
本发明公开了一种一种人类常见病遗传风险评估方法,结合图1所示,包括如下步骤:
建立一个数据库,该数据库需要包含健康人与病人的流行病学资料,以及在若干遗传相关位点上的基因分型资料;
对于以上资料/变量,根据其与疾病的相关性排序,重要的变量列在前面;
对于一个待检测个体,首先获取其上述各个资料,作为风险评估的依据;
依据变量的重要程度进行数据库匹配:比较数据库中的某样本与待检测样本的第一个变量,如果匹配则继续比较第二个,第三个,直到无法匹配为止;选择数据库中与待检测样本最为匹配的前多个样本;根据这些最匹配的数据库样本中的患者比例估计待检测样本的患病概率,并用群体患病率校正数据库样本采集的偏差。
本发明还包括不断扩大数据库的样本量以及变量数目。
本发明相对于现有的Logisitic Regression方法:
1. 本发明可以对任意多个风险因子的总体效应进行评估,而现有的LR方法只能做数个风险因子的总体效应评估;
2. 本发明在对待监测个体的鉴别率上,本方法显著的好于传统的LR方法。由于前一条原因,在比较两种方法评估效果的时候,无法使用多达上百个因子的实际数据,这里只展示一次模拟4个因子数据的结果:
本方法 | 预测健康 | 预测患病 | 正确率 |
健康 | 370 | 130 | 74.0% |
患病 | 51 | 449 | 89.8% |
总计 | 81.9% | ||
LR方法 | 预测健康 | 预测患病 | 正确率 |
健康 | 329 | 171 | 65.8% |
患病 | 145 | 355 | 71.0% |
总计 | 68.4% |
3. 本发明的实际鉴定正确率依赖于其支持数据库,随着数据库质量和数量提高,鉴定正确率可以相应的不断提高。
综上所述,本发明建立一个较大的病例——正常人环境资料和遗传信息支持数据库,然后通过关联分析,找出与疾病关系比较密切的风险因子,再对待风险评估者,搜索数据库,找出与其最相似若干个样本。统计这些样本的患病概率。作为该人的患病风险概率。若其风险很大/很小,则作出患病/健康的预测。本发明不需要对疾病机理有所假设,特别适用于多因子复杂疾病;对风险的评估准确性高;可扩展性好,即随着样本库的增加,风险评估的准确性能持续提高;算法实现容易,速度快。
Claims (2)
1.一种人类常见病遗传风险评估方法,其特征在于,包括如下步骤:
建立一个数据库,该数据库需要包含健康人与病人的流行病学资料,以及在若干遗传相关位点上的基因分型资料;
对于以上资料/变量,根据其与疾病的相关性排序,重要的变量列在前面;
对于一个待检测个体,首先获取其上述各个资料,作为风险评估的依据;
依据变量的重要程度进行数据库匹配:比较数据库中的某样本与待检测样本的第一个变量,如果匹配则继续比较第二个,第三个,直到无法匹配为止;选择数据库中与待检测样本最为匹配的前多个样本;根据这些最匹配的数据库样本中的患者比例估计待检测样本的患病概率,并用群体患病率校正数据库样本采集的偏差。
2.根据权利要求1所述的人类常见病遗传风险评估方法,其特征在于,还包括不断扩大数据库的样本量以及变量数目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102944936A CN102419791A (zh) | 2010-09-28 | 2010-09-28 | 人类常见病遗传风险评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102944936A CN102419791A (zh) | 2010-09-28 | 2010-09-28 | 人类常见病遗传风险评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102419791A true CN102419791A (zh) | 2012-04-18 |
Family
ID=45944202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102944936A Pending CN102419791A (zh) | 2010-09-28 | 2010-09-28 | 人类常见病遗传风险评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102419791A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020454A (zh) * | 2012-12-15 | 2013-04-03 | 中国科学院深圳先进技术研究院 | 发病关键因素提取与疾病预警方法及系统 |
CN104462858A (zh) * | 2014-12-30 | 2015-03-25 | 天津迈沃医药技术有限公司 | 基于多阶隐马尔可夫模型的健康预警方法 |
CN107229841A (zh) * | 2017-05-24 | 2017-10-03 | 重庆金域医学检验所有限公司 | 一种基因变异评估方法及系统 |
CN107526931A (zh) * | 2017-08-29 | 2017-12-29 | 北斗云谷(北京)科技有限公司 | 基于个性化因子的健康评估的方法 |
CN110364259A (zh) * | 2019-05-30 | 2019-10-22 | 中国人民解放军总医院 | 一种高原疾病预测方法、系统、介质及电子设备 |
CN111091903A (zh) * | 2019-12-12 | 2020-05-01 | 和宇健康科技股份有限公司 | 针对遗传疾病风险概率评估及阻断或改善方法推荐系统 |
-
2010
- 2010-09-28 CN CN2010102944936A patent/CN102419791A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103020454A (zh) * | 2012-12-15 | 2013-04-03 | 中国科学院深圳先进技术研究院 | 发病关键因素提取与疾病预警方法及系统 |
CN104462858A (zh) * | 2014-12-30 | 2015-03-25 | 天津迈沃医药技术有限公司 | 基于多阶隐马尔可夫模型的健康预警方法 |
CN107229841A (zh) * | 2017-05-24 | 2017-10-03 | 重庆金域医学检验所有限公司 | 一种基因变异评估方法及系统 |
CN107229841B (zh) * | 2017-05-24 | 2018-07-06 | 重庆金域医学检验所有限公司 | 一种基因变异评估方法及系统 |
CN107526931A (zh) * | 2017-08-29 | 2017-12-29 | 北斗云谷(北京)科技有限公司 | 基于个性化因子的健康评估的方法 |
CN110364259A (zh) * | 2019-05-30 | 2019-10-22 | 中国人民解放军总医院 | 一种高原疾病预测方法、系统、介质及电子设备 |
CN110364259B (zh) * | 2019-05-30 | 2022-05-31 | 中国人民解放军总医院 | 一种高原疾病预测方法、系统、介质及电子设备 |
CN111091903A (zh) * | 2019-12-12 | 2020-05-01 | 和宇健康科技股份有限公司 | 针对遗传疾病风险概率评估及阻断或改善方法推荐系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Using street view data and machine learning to assess how perception of neighborhood safety influences urban residents’ mental health | |
Keuning et al. | Mortality prediction models in the adult critically ill: A scoping review | |
Collins et al. | Sample size considerations for the external validation of a multivariable prognostic model: a resampling study | |
Hendren et al. | Early discharge and hospital readmission after colectomy for cancer | |
Anderson et al. | Identifying clusters in Bayesian disease mapping | |
Xylinas et al. | Accuracy of the EORTC risk tables and of the CUETO scoring model to predict outcomes in non-muscle-invasive urothelial carcinoma of the bladder | |
US20160063212A1 (en) | System for Generating and Updating Treatment Guidelines and Estimating Effect Size of Treatment Steps | |
Comte et al. | Species distribution modelling and imperfect detection: comparing occupancy versus consensus methods | |
Macomber et al. | Centre volume and resource consumption in liver transplantation | |
Scandurra et al. | Does climate finance reduce vulnerability in Small Island Developing States? An empirical investigation | |
Li et al. | Application of a hybrid model in predicting the incidence of tuberculosis in a Chinese population | |
CN102419791A (zh) | 人类常见病遗传风险评估方法 | |
CN110993103A (zh) | 疾病风险预测模型的建立方法和疾病保险产品的推荐方法 | |
Kullgren et al. | Financial incentives for completion of fecal occult blood tests among veterans: a 2-stage, pragmatic, cluster, randomized, controlled trial | |
Shih et al. | Reliability of readmission rates as a hospital quality measure in cardiac surgery | |
Wang et al. | A vision-based active learning convolutional neural network model for concrete surface crack detection | |
CN105654198B (zh) | 具有最优阈值筛选的品牌广告效果优化的方法 | |
Paulon et al. | Joint modeling of recurrent events and survival: a Bayesian non-parametric approach | |
Aaron et al. | Influence of country-level differences on COPD prevalence | |
Barcella et al. | Variable selection in covariate dependent random partition models: an application to urinary tract infection | |
Subramanian et al. | Personalized medicine for prevention: can risk stratified screening decrease colorectal cancer mortality at an acceptable cost? | |
Luque-Fernandez et al. | Data-adaptive estimation for double-robust methods in population-based cancer epidemiology: risk differences for lung cancer mortality by emergency presentation | |
Wang et al. | Mutual information based analysis for the distribution of financial contagion in stock markets | |
Mukherjee et al. | Suicide disparities across metropolitan areas in the US: A comparative assessment of socio-environmental factors using a data-driven predictive approach | |
Ahmed et al. | Tweets and votes: A four-country comparison of volumetric and sentiment analysis approaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120418 |