CN112086130B - 一种基于测序和数据分析的肥胖风险预测装置的预测方法 - Google Patents

一种基于测序和数据分析的肥胖风险预测装置的预测方法 Download PDF

Info

Publication number
CN112086130B
CN112086130B CN202010810113.3A CN202010810113A CN112086130B CN 112086130 B CN112086130 B CN 112086130B CN 202010810113 A CN202010810113 A CN 202010810113A CN 112086130 B CN112086130 B CN 112086130B
Authority
CN
China
Prior art keywords
model
data
obesity
value
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010810113.3A
Other languages
English (en)
Other versions
CN112086130A (zh
Inventor
李健
杨广霞
许瑶坤
况迎辉
刘安娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202010810113.3A priority Critical patent/CN112086130B/zh
Publication of CN112086130A publication Critical patent/CN112086130A/zh
Application granted granted Critical
Publication of CN112086130B publication Critical patent/CN112086130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

本发明公开了一种基于测序和数据分析的肥胖风险预测装置及其预测方法,包括以下步骤:对原始SNP样本数据的处理;创建初步模型,包括对肥胖进行分类和对身高体重进行回归性分析;创建位点评分模型,所述位点评分模型包括Logistic Regression模型、SVM模型、Decision Tree模型和Random Forest模型;利用数据库的数据对模型进行优化;对优化模型进行分析;引入集成学习的肥胖预测模型。本发明通过将机器学习和基因分析相结合,利用庞大的基因型与对应个体的生理信息数据库,实现对个体肥胖风险的预测以及生理信息异常风险进行评估。

Description

一种基于测序和数据分析的肥胖风险预测装置的预测方法
技术领域
本发明属于基因测序技术领域,特别涉及一种基于测序和数据分析的肥胖风险预测装置的预测方法。
背景技术
现有肥胖评估模型(体重指数、腰围臀围比)只将少数身体指标纳入评价体系,具有很大的缺陷。在小样本研究或个体应用中,由于BMI指数没有考虑到身体成分构成和肥胖的影响因素,其准确性必然存在问题。此外,BMI指数模型忽略了男女身体的差异,男女本身身体的差异在此模型中被忽视,就会导致因为性别问题而在肥胖预测中产生误判。这种类型的误判在女性尤其常见。根据有关研究显示,腰围腰臀比存在明显的性别差异,腰围和腰臀比皆按不同的性别采用不同的切点,两者用于评估人群肥胖发生率时差异较小。所以将腰围臀围比作为肥胖评估指标的准确度较低,会有一大批人群错过肥胖或代谢综合征的早期诊断和治疗。
发明内容
发明目的:针对上述问题,本发明提供一种基于测序和数据分析的肥胖风险预测装置的预测方法,通过将机器学习和基因分析相结合,利用庞大的基因型与对应个体的生理信息数据库,实现对个体肥胖风险的预测以及生理信息异常风险进行评估。
技术方案:本发明提出一种基于测序和数据分析的肥胖风险预测装置,包括数据处理单元、数据可视化单元、肥胖分类单元、基因位点预测单元和位点评分单元;
数据处理单元,用于对原始SNP样本数据进行处理;
数据可视化单元,用于对所有数据进行可视化处理,得到样本的身高、体重、腰围及BMI指数之间的关系;
肥胖分类单元,通过K-MEANS算法对肥胖进行分类,确定不同基因对不同肥胖类型的影响;
基因位点预测单元,通过浅层神经网络对基因位点信息、性别信息及身高体重进行回归性分析,预测基因位点对身高体重影响程度;
位点评分单元,基于集成学习模型,利用SNPs的信息和个体的生理信息对肥胖风险进行评估。
一种如上所述的基于测序和数据分析的肥胖风险预测装置的预测方法,其特征在于,包括如下步骤:
(1)对原始SNP样本数据进行处理;
(2)创建初步模型,包括对肥胖进行分类和对身高体重进行回归性分析;
(3)创建位点评分模型,所述位点评分模型包括Logistic Regression模型、SVM模型、Decision Tree模型和Random Forest模型;在机器学习任务中,将原始数据集分为三部分:训练集、验证集和测试集;
(4)利用数据库的数据对模型进行优化;
(5)对优化模型进行分析;
(6)引入集成学习的肥胖预测模型。
进一步的,所述步骤(1)中对原始SNP样本数据进行处理的具体步骤如下:
(1.1)将所有SNP信息文件转化为csv文件;
(1.2)进行数据清洗,去除不相关的位点信息数据和极端数据;
(1.3)将所有数据进行可视化处理。
进一步的,所述步骤(2)中创建初步模型的具体步骤如下:
(2.1)利用的是K-MEANS算法对肥胖进行分类;
(2.2)利用浅层神经网络对八个基因位点信息和性别信息与身高体重进行回归性分析,
z=wx+b
式中:z是线性层输出;w为模型参数;x为输入数据(基因位点信息和生理数据);b为偏置项。
y=激活函数(Z)
式中:Z为线性层输出;y是逻辑斯蒂层输出,值域[0,1]。
在逻辑回归过程中,由于梯度下降算法中每一次迭代的时候w参数的值是根据
w=w-学习率*导数
式中:w是模型参数;学习率为模型超参数。
进行设置得,其中学习率是手动设置的参数,这时候如果导数即斜率过小,会导致梯度下降的的步数也很小,影响效率;
ReLU激活函数定义为:
Figure GDA0003107376120000031
为了保证结果地准确性,引入损失函数对结果进行修正,损失函数采用的均方差函数(MSE):
Figure GDA0003107376120000032
式中:y是真值;y’是预测值。
进一步的,所述步骤(4)中利用数据库的数据对模型进行优化的具体步骤如下:
(4.1)引入基因与生理信息数据库;
(4.2)基因位点即SNPs优化;
(4.3)优化模型参数。
进一步的,所述步骤(5)中对优化模型进行分析的具体步骤如下:
(5.1)以Logistic Regression建立的模型进行分析,Logistic Regression的表达式是:
Figure GDA0003107376120000033
式中:w为模型参数;x为输入数据;b为偏置项。
(5.2)在训练完成之后提取w的值,根据系数给出各个特征的重要程度,并定义一个人肥胖的风险值R:
R=-(wx+b)
式中:R为肥胖风险值;w为模型参数;x为输入数据(基因位点信息和生理数据);b为偏置项。
在Logistic Regression这个模型中,R的值越靠近负无穷,表示这个人被判别为没有肥胖风险的可能性就越大,相反如果一个人的R值逐渐接近正无穷,表示这个人未来BMI偏大的可能性越大;
(5.3)在测试集上验证R值的准确性。
进一步的,所述步骤(6)中引入集成学习的肥胖预测模型的具体步骤如下:
(6.1)第一层分类器:利用SNPs的信息和测试者的生理信息分别构建多个弱分类器,采用的多种模型包括SVM、Logistic Regression及Random Forest,同时加入了新的模型Ada Boost和Gradient Boost,输出是对BMI分型的预测;
(6.2)第二层分类器:得到第一层的输出肥胖的分类即BMI Category之后,将其作为输入喂入第二层分类器XGBoost,第二层的作用是根据第一层分类器已经提取出来的特征对肥胖类型进行预测。
由于肥胖是一个多因素相关的问题,必须对大数据进行分析,找到所有与肥胖相关的因素。而通过肥胖评估模型,可以对肥胖进行预测,在肥胖问题未发生或者肥胖程度较低时采取相应的措施来预防肥胖问题的发生或避免其严重化发展,所以对肥胖的评估是极其重要的工作。
本发明采用上述技术方案,具有以下有益效果:
本发明通过将机器学习和基因相结合,利用庞大的基因型与对应个体的生理信息数据库,实现对个体肥胖风险的预测以及生理信息异常风险评估。
附图说明
图1为本发明的流程图;
图2为具体实施例中引入集成学习的肥胖预测模型图;
图3为本发明的结构示意图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,但是本发明要求保护的范围并不局限于此。
在本实施例中,提出一种基于测序和数据分析的肥胖风险预测的方法,如图1所示,本方法包括以下步骤:S1、对原始SNP样本数据的处理;S2、创建初步模型,包括对肥胖进行分类和对身高体重进行回归性分析;S3、创建位点评分模型,所述位点评分模型包括Logistic Regression模型、SVM模型、Decision Tree模型和Random Forest模型;S4、利用数据库的数据对模型进行优化;S5、对优化模型进行分析;S6、引入集成学习的肥胖预测模型。其中,本发明利用基因与生理信息数据建立机器学习和集成学习模型来预测肥胖风险;其中,为了防止模型过于复杂而引起的过拟合,需要对各个模型进行交叉验证。
在一些具体的实施例中,S1中对原始SNP样本数据进行处理,所述处理包括:由于数据包括.csv和.json格式,对所有数据进行统一格式处理,将所有SNP信息文件转化为csv文件;由于基因本身的特殊性,导致其数据量及其庞大,与研究内容无关的干扰数据非常多,需要进行数据清洗,去除不相关的位点信息数据和极端数据,同时需要填充部分缺失值;由于数据量庞大,为了构建初步的简单关系模型,将所有数据进行可视化处理,得到较为直观的数据关系。
在一些具体的实施例中,所述S2中创建初步模型包括:
S201、利用的是K-MEANS算法对肥胖进行分类,利用腰围和BMI分布图进行聚类,得到的结果用不同的颜色和标记进行可视化处理;
S202、利用浅层神经网络对八个基因位点信息和性别信息与身高体重进行回归性分析,
z=wx+b
式中:z是线性层输出;w为模型参数;x为输入数据(基因位点信息和生理数据);b为偏置项。
y=激活函数(Z)
式中:Z为线性层输出;y是逻辑斯蒂层输出,值域[0,1]。
在逻辑回归过程中,由于梯度下降算法中每一次迭代的时候w参数的值是根据
w=w-学习率*导数
式中:w是模型参数;学习率为模型超参数。
进行设置得,其中学习率是手动设置的参数,这时候如果导数(斜率)过小,会导致梯度下降的的步数也很小,影响效率;
ReLU激活函数定义为:
Figure GDA0003107376120000061
为了保证结果地准确性,引入损失函数对结果进行修正,损失函数采用的均方差函数(MSE):
Figure GDA0003107376120000062
式中:y是真值;y’是预测值。
在一些具体的实施例中,所述S3中在机器学习任务,首先会将原始数据集分为三部分:训练集、验证集和测试集;训练集用于训练模型,验证集用于模型的参数选择配置,测试集对于模型来说是未知数据,用于评估模型的泛化能力。
在一些具体的实施例中,所述S3中构建SVM模型采用的是非线性的处理方式,为了能使高维情况下的SVM能够更加简便地得到结果,选择RBF(径向基)核函数,将原空间映射到一个新的空间,使得所有样本点都线性可分。
在一些具体的实施例中,所述S3中构建Decision Tree模型的一般步骤包括:确定模型目标;确定训练集数据、验证集数据、目标变量、自变量,对数据进行必要的预处理;使用训练集进行决策树构建;使用测试集进行模型的验证;确定模型。其中最常用的算法有CART,CHAID,C5.0,C4.5等;另外,由于本发明使用的数据不是一个长期观察的动态数据,Decision Tree易于通过静态测试来对模型进行评测,可以测定模型可信度。
在一些具体的实施例中,所述S4中利用数据库的数据对模型进行优化,包括一下步骤:
S401、引入基因与生理信息数据库,获得测试者生理信息,包括:性别,身高,体重,腰围,甘油三脂,舒张压,收缩压,空腹血糖值,总胆固醇值;获取SNPs位点数据;
S402、基因位点(SNPs)优化,数据集按照BMI的值被划分成两个区域,经过筛选后获得16个与肥胖相关的位点;
S403、优化模型参数,数据重新输入四种机器学习模型,将训练集数据输入模型中,训练集和测试集的比率是9:1,这里用交叉验证来避免过拟合问题。
在一些具体的实施例中,所述S5中对优化模型进行分析,包括以下步骤:
S501、考虑到Logistic Regression在流行病的研究中是非常常用的模型,而且SVM在核函数非线性的情况下不能提取出特征的系数,这里以Logistic Regression建立的模型进行分析,Logistic Regression的表达式是:
Figure GDA0003107376120000071
式中:w为模型参数;x为输入数据(基因位点信息和生理数据);b为偏置项。
S502、在训练完成之后提取w出的值,根据系数给出各个特征的重要程度,并定义一个人肥胖的风险值R:
R=-(wx+b)
式中:R为肥胖风险值;w为模型参数;x为输入数据(基因位点信息和生理数据);b为偏置项。
在Logistic Regression这个模型中,R的值越靠近负□无穷,表示这个人被判别为没有肥胖风险的可能性就越大,相反如果一个人的R值逐渐接近正无穷,表示这个人未来BMI偏大的可能性越大;
S503、在测试集上验证R值的准确性。
由以上步骤可知,可以根据SNPs位点信息以预测一个人未来肥胖风险,并提取出了各个位点之间的相对重要性程度;其中表现最好的模型——Logistic Regression,其准确性也依然有很大的提高空间。实际上,肥胖是一个多因素导致的问题,并不是由单一的由基因决定,个体的生活环境、生活习惯等多方面因素都会影响其是否肥胖。在模型中加入测试者的生理征,包括年龄、性别、腰围、血糖、甘油三酯、收缩压、舒张压、胆固醇,来对风险预测的模型进行进一步优化。
在一些具体的实施例中,所述S6中引入集成学习的肥胖预测模型,如图2所示,包括以下步骤:
S601、第一层分类器:利用SNPs的信息和测试者的生理信息分别构建多个弱分类器,采用的多种模型包括SVM、Logistic Regression及Random Forest,同时加入了新的模型Ada Boost和Gradient Boost,输出是对BMI分型的预测;
S602、第二层分类器:得到第一层的输出肥胖的分类(BMI Category)之后,将其作为输入喂入第二层分类器XGBoost,第二层的作用是根据第一层分类器已经提取出来的特征对肥胖类型进行预测。
经过上述所有的建模与优化过程,构建了一个基于集成学习构成的算法模型,在第一层分类器中使用交叉验证的方法,对数据集进行了十次划分,分别进行了十次训练和验证,最终的准确度取十次预测准确度的平均值;再将第一层的预测结果作为第二层分类器的输入特征,对肥胖进行分类。
另,本发明基于集成学习的肥胖预测模型,创建辅助模型分析测试者营养素含量异常,由于数据的局限性,只讨论血糖和血脂的相关问题。做预测的主要依据是判别患者是否存在对某种营养素的处理障碍。数据集标注了异常和非异常的样本,在对数据进行特征工程的处理之后,把SNPs的数据喂入模型中分析结果。
此外,本发明还提出一种基于测序和数据分析的肥胖风险预测的装置,其特征在于,包括:
数据处理单元,该单元能够对原始SNP样本数据进行处理;
数据可视化单元,该单元将所有数据进行可视化处理,得到较为直观的样本的身高、体重、腰围及BMI指数之间的关系;
肥胖分类单元,该单元利用的是K-MEANS算法对肥胖进行分类,便于确定不同基因对不同肥胖类型的影响;
基因位点预测单元,该单元利用浅层神经网络对基因位点信息、性别信息及身高体重进行回归性分析,预测基因位点对身高体重影响程度;
位点评分单元,该单元能够基于集成学习模型,利用SNPs的信息和个体的生理信息对肥胖进行评估。

Claims (1)

1.一种基于测序和数据分析的肥胖风险预测装置的预测方法,其特征在于,基于测序和数据分析的肥胖风险预测装置包括数据处理单元、数据可视化单元、肥胖分类单元、基因位点预测单元和位点评分单元;
数据处理单元,用于对原始SNP样本数据进行处理;
数据可视化单元,用于对所有数据进行可视化处理,得到样本的身高、体重、腰围及BMI指数之间的关系;
肥胖分类单元,通过K-MEANS算法对肥胖进行分类,确定不同基因对不同肥胖类型的影响;
基因位点预测单元,通过浅层神经网络对基因位点信息、性别信息及身高体重进行回归性分析,预测基因位点对身高体重影响程度;
位点评分单元,基于集成学习模型,利用SNPs的信息和个体的生理信息对肥胖风险进行评估;
预测方法包括如下步骤:
(1)对原始SNP样本数据进行处理;其中对原始SNP样本数据进行处理的具体步骤如下:
(1.1)将所有SNP信息文件转化为csv文件;
(1.2)进行数据清洗,去除不相关的位点信息数据和极端数据;
(1.3)将所有数据进行可视化处理;
(2)创建初步模型,包括对肥胖进行分类和对身高体重进行回归性分析;其中创建初步模型的具体步骤如下:
(2.1)利用的是K-MEANS算法对肥胖进行分类;
(2.2)利用浅层神经网络对八个基因位点信息和性别信息与身高体重进行回归性分析,
z=wx+b
式中:z是线性层输出;w为模型参数;x为输入数据;b为偏置项;
y=激活函数(Z)
式中:Z为线性层输出;y是逻辑斯蒂层输出,值域[0,1];
在逻辑回归过程中,由于梯度下降算法中每一次迭代的时候w参数的值是根据
w=w-学习率*导数
进行设置得,其中学习率是手动设置的参数,这时候如果导数即斜率过小,会导致梯度下降的的步数也很小,影响效率;式中:w是模型参数;学习率为模型超参数;ReLU激活函数定义为:
Figure FDA0003107376110000021
为了保证结果地准确性,引入损失函数对结果进行修正,损失函数采用的均方差函数(MSE):
Figure FDA0003107376110000022
式中:y是真值;y’是预测值;
(3)创建位点评分模型,所述位点评分模型包括Logistic Regression模型、SVM模型、Decision Tree模型和Random Forest模型;在机器学习任务中,将原始数据集分为三部分:训练集、验证集和测试集;
(4)利用数据库的数据对模型进行优化;其中利用数据库的数据对模型进行优化的具体步骤如下:
(4.1)引入基因与生理信息数据库;获得测试者生理信息,包括:性别,身高,体重,腰围,甘油三脂,舒张压,收缩压,空腹血糖值,总胆固醇值;获取SNPs位点数据;
(4.2)基因位点即SNPs优化,数据集按照BMI的值被划分成两个区域,经过筛选后获得16个与肥胖相关的位点;
(4.3)优化模型参数,数据重新输入四种机器学习模型,将训练集数据输入模型中,训练集和测试集的比率是9:1;
(5)对优化模型进行分析;其中对优化模型进行分析的具体步骤如下:
(5.1)以Logistic Regression建立的模型进行分析,Logistic Regression的表达式是:
Figure FDA0003107376110000031
式中:w为模型参数;x为输入数据即基因位点信息和生理数据;b为偏置项;
(5.2)在训练完成之后提取w的值,根据系数给出各个特征的重要程度,并定义一个人肥胖的风险值R:
R=-(wx+b)
式中:R为肥胖风险值;w为模型参数;x为输入数据即基因位点信息和生理数据;b为偏置项;
在Logistic Regression这个模型中,R的值越靠近负无穷,表示这个人被判别为没有肥胖风险的可能性就越大,相反如果一个人的R值逐渐接近正无穷,表示这个人未来BMI偏大的可能性越大;
(5.3)在测试集上验证R值的准确性;
(6)引入集成学习的肥胖预测模型;其中引入集成学习的肥胖预测模型的具体步骤如下:
(6.1)第一层分类器:利用SNPs的信息和测试者的生理信息分别构建多个弱分类器,采用的多种模型包括SVM、Logistic Regression及Random Forest,同时加入了新的模型AdaBoost和Gradient Boost,输出是对BMI分型的预测;
(6.2)第二层分类器:得到第一层的输出肥胖的分类即BMI Category之后,将其作为输入喂入第二层分类器XGBoost,第二层的作用是根据第一层分类器已经提取出来的特征对肥胖类型进行预测。
CN202010810113.3A 2020-08-13 2020-08-13 一种基于测序和数据分析的肥胖风险预测装置的预测方法 Active CN112086130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010810113.3A CN112086130B (zh) 2020-08-13 2020-08-13 一种基于测序和数据分析的肥胖风险预测装置的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010810113.3A CN112086130B (zh) 2020-08-13 2020-08-13 一种基于测序和数据分析的肥胖风险预测装置的预测方法

Publications (2)

Publication Number Publication Date
CN112086130A CN112086130A (zh) 2020-12-15
CN112086130B true CN112086130B (zh) 2021-07-27

Family

ID=73728061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010810113.3A Active CN112086130B (zh) 2020-08-13 2020-08-13 一种基于测序和数据分析的肥胖风险预测装置的预测方法

Country Status (1)

Country Link
CN (1) CN112086130B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800899A (zh) * 2021-01-18 2021-05-14 苏州可数信息科技有限公司 一种基于图像识别算法的拍照测身材方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101960019A (zh) * 2007-04-03 2011-01-26 国家科学研究中心 与肥胖症和/或ⅱ型糖尿病相关的fto基因多态性
CN104830961A (zh) * 2014-02-12 2015-08-12 大江基因医学股份有限公司 用于活体外测定致肥胖风险的方法
CN107194209A (zh) * 2017-05-16 2017-09-22 天方创新(北京)信息技术有限公司 信息的推送方法及装置
CN107924384A (zh) * 2015-03-11 2018-04-17 阿雅斯迪公司 用于使用预测学习模型预测结果的系统和方法
CN108899086A (zh) * 2018-06-11 2018-11-27 浙江大学 一种基于机器学习通过血液样本诊断骨关节炎亚型的系统
CN109147949A (zh) * 2018-08-16 2019-01-04 辽宁大学 一种基于分类回归树来用于检测教师亚健康状态的方法
CN109326316A (zh) * 2018-09-18 2019-02-12 哈尔滨工业大学(深圳) 一种癌症相关SNP、基因、miRNA和蛋白质相互作用的多层网络模型构建方法和应用
CN110706822A (zh) * 2019-09-20 2020-01-17 上海派拉软件股份有限公司 基于逻辑回归模型和决策树模型的健康管理方法
US20200190568A1 (en) * 2018-12-10 2020-06-18 OneSkin Technologies, Inc. Methods for detecting the age of biological samples using methylation markers

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2555551A (en) * 2015-07-07 2018-05-02 Farsight Genome Systems Inc Methods and systems for sequencing-based variant detection
US20190259473A1 (en) * 2016-08-08 2019-08-22 Franz J. Och Identification of individuals by trait prediction from the genome
KR102024375B1 (ko) * 2016-12-30 2019-09-23 서울대학교 산학협력단 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법
CN107403072A (zh) * 2017-08-07 2017-11-28 北京工业大学 一种基于机器学习的2型糖尿病预测预警方法
CN107760783B (zh) * 2017-11-06 2021-01-29 福建医科大学附属协和医院 基于108个基因的胃癌腹膜转移预测模型及其应用
EP3857564A1 (en) * 2018-09-29 2021-08-04 F. Hoffmann-La Roche AG Multimodal machine learning based clinical predictor
CN109599182A (zh) * 2019-02-18 2019-04-09 湖南金特尔信息技术有限公司 一种基因靶向治疗方案推荐系统及相关系统
CN111508603A (zh) * 2019-11-26 2020-08-07 中国科学院苏州生物医学工程技术研究所 一种基于机器学习的出生缺陷预测及风险评估方法、系统及电子设备
CN111254194B (zh) * 2020-01-13 2021-09-07 东南大学 基于cfDNA的测序及数据分析的癌症相关生物标记及其在cfDNA样品分类中的应用
CN111488914B (zh) * 2020-03-17 2020-12-25 哈尔滨工业大学 一种基于多任务学习的阿尔茨海默症分类及预测系统
CN111508607B (zh) * 2020-04-13 2023-10-13 山东师范大学 一种基于bp神经网络的肥胖症预测系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101960019A (zh) * 2007-04-03 2011-01-26 国家科学研究中心 与肥胖症和/或ⅱ型糖尿病相关的fto基因多态性
CN104830961A (zh) * 2014-02-12 2015-08-12 大江基因医学股份有限公司 用于活体外测定致肥胖风险的方法
CN107924384A (zh) * 2015-03-11 2018-04-17 阿雅斯迪公司 用于使用预测学习模型预测结果的系统和方法
CN107194209A (zh) * 2017-05-16 2017-09-22 天方创新(北京)信息技术有限公司 信息的推送方法及装置
CN108899086A (zh) * 2018-06-11 2018-11-27 浙江大学 一种基于机器学习通过血液样本诊断骨关节炎亚型的系统
CN109147949A (zh) * 2018-08-16 2019-01-04 辽宁大学 一种基于分类回归树来用于检测教师亚健康状态的方法
CN109326316A (zh) * 2018-09-18 2019-02-12 哈尔滨工业大学(深圳) 一种癌症相关SNP、基因、miRNA和蛋白质相互作用的多层网络模型构建方法和应用
US20200190568A1 (en) * 2018-12-10 2020-06-18 OneSkin Technologies, Inc. Methods for detecting the age of biological samples using methylation markers
CN110706822A (zh) * 2019-09-20 2020-01-17 上海派拉软件股份有限公司 基于逻辑回归模型和决策树模型的健康管理方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A Novel Image Classification Method with CNN-XGBoost Model;Xudie Ren 等;《International Workshop on Digital Watermarking 2017》;20170626;第378-390页 *
Casimiro Aday Curbelo Montañez 等.Machine learning approaches for the prediction of obesity using publicly available genetic profiles.《2017 International Joint Conference on Neural Networks》.2017, *
Reinforced Negative Sampling over KnowledGraph for Recommendation;Xiang Wang 等;《WWW 20: Proceedings of The Web Conference 2020》;20200430;第99-109页 *
β2肾上腺素能受体基因多态性与原发性高血压的关系;朱敏 等;《江苏医药》;20091130;第35卷(第11期);第1281-1283页 *
基于XGBoost算法的2型糖尿病精准预测模型研究;张洪侠 等;《中国实验诊断学》;20180331;第22卷(第3期);第408-412页 *

Also Published As

Publication number Publication date
CN112086130A (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN111128380A (zh) 模拟医生诊断和精准干预策略的慢性病健康管理模型的构建方法及系统
CN112786203A (zh) 一种机器学习糖尿病视网膜病变发病风险预测方法及应用
CN111951975A (zh) 一种基于深度学习模型gpt-2的脓毒症早期预警方法
CN107301331A (zh) 一种基于基因芯片数据的疾病影响因素的挖掘方法
CN111105877A (zh) 基于深度置信网络的慢性病精确干预方法及系统
CN112086130B (zh) 一种基于测序和数据分析的肥胖风险预测装置的预测方法
CN116959725A (zh) 一种多模态数据融合的疾病风险预测方法
US20210158967A1 (en) Method of prediction of potential health risk
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及系统
CN116864139A (zh) 疾病风险评估方法、装置、计算机设备及可读存储介质
CN111128372A (zh) 基于rf-lr改进算法的疾病预测方法
Narasimharao et al. Performance Evaluation of a Remote Diabetes Healthcare Disease Prediction Framework Using Machine Learning Paradigm for e-health Services
US20090006055A1 (en) Automated Reduction of Biomarkers
WO2011119967A2 (en) System,method and computer-accessible medium for evaluating a maliganacy status in at-risk populations and during patient treatment management
Kavya et al. Heart Disease Prediction Using Logistic Regression
CN112365992A (zh) 一种基于nrs-lda的医疗体检数据识别分析方法
KR102485316B1 (ko) 딥러닝을 활용한 개인의 전체 유전체 데이터와 암 발생과의 연관성 예측에 관한 방법
Dewi et al. Original Research Article Improvement of support vector machine for predicting diabetes mellitus with machine learning approach
Kour et al. An Advance Approach for Diabetes Detection by Implementing Machine Learning Algorithms
Mittal et al. Automated Disease Prediction Using Machine Learning Technology
He et al. A cost sensitive and class-imbalance classification method based on neural network for disease diagnosis
CN113838519B (zh) 基于自适应基因交互正则化弹性网络模型的基因选择方法及系统
Ojha et al. Analyzing the Performance of the Machine Learning Algorithms for Stroke Detection
CN117219275A (zh) 一种儿童药物性肝损伤风险识别预测方法及系统
CN111028953B (zh) 一种对医学数据进行提示性标注的控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant