CN109036568A - 一种基于朴素贝叶斯算法的预测模型的建立方法 - Google Patents

一种基于朴素贝叶斯算法的预测模型的建立方法 Download PDF

Info

Publication number
CN109036568A
CN109036568A CN201811020809.5A CN201811020809A CN109036568A CN 109036568 A CN109036568 A CN 109036568A CN 201811020809 A CN201811020809 A CN 201811020809A CN 109036568 A CN109036568 A CN 109036568A
Authority
CN
China
Prior art keywords
probability
prediction
prediction model
feature
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811020809.5A
Other languages
English (en)
Inventor
王庚
石兴磊
高传贵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Group Co Ltd
Original Assignee
Inspur Software Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Group Co Ltd filed Critical Inspur Software Group Co Ltd
Priority to CN201811020809.5A priority Critical patent/CN109036568A/zh
Publication of CN109036568A publication Critical patent/CN109036568A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明特别涉及一种基于朴素贝叶斯算法的预测模型的建立方法。该基于朴素贝叶斯算法的预测模型的建立方法,收集与脑卒中相关的因素数据,并将定性数据转化为定量数据,利用皮尔森相关系数法计算各个特征与目标值的相关系数,将相关系数值定量转化为权重;将传统算法结合多项式及高斯模型分别处理离散和连续的特征数据,采用加权特征分析方法提升重要特征对预测结果的影响,进而得到高预测精确率的预测模型。该基于朴素贝叶斯算法的预测模型的建立方法,结合混合预测模型,特征加权方法和滑动界定因子,并综合考虑多个评价指标最终获得了高预测精确率的预测模型,能为医生明确诊断和治疗提供参考数据,对全民卫生事业的发展具有非常重要的意义。

Description

一种基于朴素贝叶斯算法的预测模型的建立方法
技术领域
本发明涉及机器学习算法技术领域,特别涉及一种基于朴素贝叶斯算法的预测模型的 建立方法。
背景技术
脑卒中是一种急性脑血管疾病,严重者可引起死亡。脑卒中疾病本身一直缺乏有效的 治疗手段,而且其有发病率高、致残率高、死亡率高、复发率高的“四高”特点。因此如何 能做到对疾病的及时预警与防治,为医生的明确诊断和治疗提供数据依据,对全民卫生事 业的发展具有非常重要的意义。
朴素贝叶斯模型是一种经典的监督学习机器学习算法,它基于贝叶斯公式提出,其本 身对于是否患病的二分类问题已经是一种快速、有效的分类算法。但是由于朴素贝叶斯针 对不同的特征类型有不同的最优实现模型,而且算法本身并没有考虑特征与目标结果的相 关性因素,因此算法本身还有改进的空间,另外其分类预测的效果很大程度上也直接受其 选择特征的影响。
针对上述问题,本发明将脑卒中患者的各项治病因素进行了综合分析,并选取了最适 合本发明的13项特征,在此基础上结合改进的算法模型,提出了一种基于朴素贝叶斯算 法的预测模型的建立方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于朴素贝叶斯算法的预测 模型的建立方法。
本发明是通过如下技术方案实现的:
一种基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:收集与脑卒中相关的 因素数据组成特征集合B,并对相关的数据进行预处理,将定性数据转化为定量数据,利 用皮尔森相关系数法计算各个特征与目标值的相关系数,将相关系数值定量转化为权重 wi;将传统算法结合多项式及高斯模型来分别处理离散和连续的特征数据,采用加权特征 分析方法提升重要特征对预测结果的影响;引入精确率precision,召回率recall,模型综 合评价指标F_measure以及ROC曲线来完成对预测模型的综合评估,进而得到高预测精确率的预测模型。
对离散的特征数据采用拉普拉斯修正对概率计算结果进行平滑处理,对于特征集合B 中任意特征b,它的取值个数为m,在计算特征b对脑卒中影响概率时,在分母上加m, 在分子上加1完成对计算结果平滑的修正;
根据性别及其类似的离散特征得到的预测概率公式表示为:
其中,P(B(j)=b(j)|A=ck)是条件概率的表示方法,其含义是在分类为ck的前提下,特 征b取值为b(j)时的概率,在条件上有先后顺序的要求;P(B(j)=b(j),A=ck)是经典概率的 表示方式,其含义是分类A取值为ck,同时特征b取值为b(j)的概率值。
根据BMI以及其类似的连续特征得到的预测概率公式表示为:
其中,σ是在ck分类下的标准差,u为均值,x为相应特征的具体值。。
采用加权特征分析方法提升重要特征对预测结果的影响;特征Bi的权重为wi,对所有 特征进行处理后特征的权重向量W表示为W=(w1;w2;w3;...;wi),通过权重向量 W可以直观的反映出各特征在模型预测中的重要程度,其中i为自然数;
基于经典的条件概率公式朴素贝叶斯算法的预测模型表示为:
其中,P(B|A)的原计算公式为在加入权重向量W之后调整为根据以上推论加权的朴素贝叶斯算法的预测模型表示为:
其中,B是特征集合,A为是否患脑卒中的分类;P(A|B)是在已知特征集合的情 况下判断是否患有脑卒中的条件概率,叫做后验概率;P(B)是先验概率,也叫做标准 化常量,是指通过事件发生次数对概率的主观判断;Pw(B|A)是已知是否患有脑卒中后 对应的特征集合的条件概率,叫做似然函数,似然函数是对某件事发生可能性的判断,与 条件概率正好相反,通过事件已经发生的概率推算事件可能性的概率;Pw(B|A)/P(B) 是调整因子,也被称作标准似然度,调整因子是似然函数与先验概率的比值,这个比值相 当于一个权重,用来调整后验概率的值,使后验概率更接近真实概率;P(A)是否患有 脑卒中的概率。
所述精确率precision是模型预测为脑卒中患者且正确的数量在模型预测为脑卒中患 者的数量中所占的比值,用P表示;所述召回率recall模型预测为脑卒中患者且正确的数 量在样本中标记为脑卒中患者的数量中所占的比值,用R表示;P与R的数值越趋近于1, 查准率或查全率就越高;当P与R数值出现矛盾时,和分别用P和R表示,通过模型综 合评价指标F_Measure作加权调和平均。
所述模型综合评价指标F_Measure表示为:
以特异度为横坐标,以灵敏度为纵坐标绘制ROC曲线;其中敏感度表示的是实验结果中预测为脑卒中患者且正确的人数占实际为脑卒中患者的人数的比值,特异度表示的是实际中并非脑卒中患者但预测为脑卒中患者占非脑卒中患者的比值;ROC曲线下面积 AUC(area under ROC curve)可以反映预测构建模型的质量情况,AUC越趋向于1表示 模型整体质量越高。
所述特征集合B中包括3项不可干预因素数据和10项可干预因素数据;其中3项不可干预因素数据分别为性别,年龄和家族遗传;10项可干预因素数据分别为血压,TC总 胆固醇指标,TG甘油三酯指标,LDL低密度脂蛋白指标,HDL高密度脂蛋白指标,运 动情况,身体指标BMI,吸烟情况,血糖情况和心律;
数据收集完成后对数据进行预处理,预处理包括对数据的清洗及标准化;数据的清洗 分别针对每一个特征列去除其中的异常数据;数据的标准化首先需要将定性数据转化为定 量数据,然后根据每个特征不同的划分依据来完成特征的二值化、多值化及哑编码的处理;
利用皮尔森相关系数法计算各个特征与目标值的相关系数,对于单个特征而言,相关 系数的绝对值越大,则代表这个特征对分类结果影响越大,利用这一特性对特征结果相关 度进行排名,将相关系数值定量转化为权重wi,进而在概率模型预测过程中进行干预从 而提升算法精度。
对特征集合B中的样本数据进行随机划分处理,并设定划分阈值为0.7,预测模型会 随机取样本总数的70%作为训练集来完成对脑卒中患病概率预测模型的训练,利用剩余 30%的样本数据作为测试集来验证模型预测结果的准确性。
在预测模型中设定滑动界定因子,滑动界定因子的值在[0,1]区间内自由设定,预测模 型计算得到的概率值当大于设定值时,则发出患病概率预警;在训练过程中调整滑动界定 因子的参数值,依据精确率precision,召回率recall,模型综合评价指标F_measure以及 ROC曲线的参考标准,完成对脑卒中患病概率预测模型的搭建。
本发明的有益效果是:该基于朴素贝叶斯算法的预测模型的建立方法,结合混合预测 模型,特征加权方法和滑动界定因子,并综合考虑多个评价指标最终获得了高预测精确率 的预测模型,能够为医生明确诊断和治疗提供参考数据,对全民卫生事业的发展具有非常 重要的意义。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实 施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本 发明,并不用于限定本发明。
该基于朴素贝叶斯算法的预测模型的建立方法,收集与脑卒中相关的因素数据组成特 征集合B,并对相关的数据进行预处理,将定性数据转化为定量数据,利用皮尔森相关系 数法计算各个特征与目标值的相关系数,将相关系数值定量转化为权重wi;将传统算法结合多项式及高斯模型来分别处理离散和连续的特征数据,采用加权特征分析方法提升重要特征对预测结果的影响;引入精确率precision,召回率recall,模型综合评价指标 F_measure以及ROC曲线来完成对预测模型的综合评估,进而得到高预测精确率的预测 模型。
(1)对离散的特征数据采用拉普拉斯修正对概率计算结果进行平滑处理,对于特征 集合B中任意特征b,它的取值个数为m,(结合本实施例表中高血压的标准化情况可以得出对高血压这个特征而言m=7),在计算特征b对脑卒中影响概率时,在分母上加m, 在分子上加1完成对计算结果平滑的修正;
根据性别及其类似的离散特征得到的预测概率公式表示为:
其中,P(B(j)=b(j)|A=ck)是条件概率的表示方法,其含义是在分类为ck的前提下,特 征b取值为b(j)时的概率,在条件上有先后顺序的要求;P(B(j)=b(j),A=ck)是经典概率的 表示方式,其含义是分类A取值为ck,同时特征b取值为b(j)的概率值;
(2)根据BMI以及其类似的连续特征得到的预测概率公式表示为:
其中,σ是在ck分类下的标准差,u为均值,x为相应特征的具体值。。
采用加权特征分析方法提升重要特征对预测结果的影响;特征Bi的权重为wi,对所有 特征进行处理后特征的权重向量W表示为W=(w1;w2;w3;...;wi),通过权重向量 W可以直观的反映出各特征在模型预测中的重要程度,其中i为自然数;
基于经典的条件概率公式朴素贝叶斯算法的预测模型表示为:
其中,P(B|A)的原计算公式为在加入权重向量W之后调整为根据以上推论加权的朴素贝叶斯算法的预测模型表示为:
其中,B是特征集合,A为是否患脑卒中的分类;P(A|B)是在已知特征集合的情 况下判断是否患有脑卒中的条件概率,叫做后验概率;P(B)是先验概率,也叫做标准 化常量,是指通过事件发生次数对概率的主观判断;Pw(B|A)是已知是否患有脑卒中后 对应的特征集合的条件概率,叫做似然函数,似然函数是对某件事发生可能性的判断,与 条件概率正好相反,通过事件已经发生的概率推算事件可能性的概率;Pw(B|A)/P(B) 是调整因子,也被称作标准似然度,调整因子是似然函数与先验概率的比值,这个比值相 当于一个权重,用来调整后验概率的值,使后验概率更接近真实概率;P(A)是否患有 脑卒中的概率。
引入精确率precision,召回率recall,模型综合评价指标F_measure以及ROC曲线来 完成对预测模型的综合评估;精确率precision是模型预测为脑卒中患者且正确的数量在 模型预测为脑卒中患者的数量中所占的比值,用P表示;召回率recall模型预测为脑卒中 患者且正确的数量在样本中标记为脑卒中患者的数量中所占的比值,用R表示;P与R 的数值越趋近于1,查准率或查全率就越高;当P与R数值出现矛盾时,和分别用P和R 表示,通过模型综合评价指标F_Measure作加权调和平均。
所述模型综合评价指标F_Measure表示为:
以特异度为横坐标,以灵敏度为纵坐标绘制ROC(receiver operatingcharacteristic curve,受试者工作特征曲线)曲线;其中敏感度表示的是实验结果中预测为脑卒中患者 且正确的人数占实际为脑卒中患者的人数的比值,特异度表示的是实际中并非脑卒中患者 但预测为脑卒中患者占非脑卒中患者的比值;ROC曲线下面积AUC(areaunder ROC curve)可以反映预测构建模型的质量情况,AUC越趋向于1表示模型整体质量越高。
所述特征集合B中包括3项不可干预因素数据和10项可干预因素数据;其中3项不可干预因素数据分别为性别,年龄和家族遗传;10项可干预因素数据分别为血压,TC总 胆固醇指标,TG甘油三酯指标,LDL低密度脂蛋白指标,HDL高密度脂蛋白指标,运 动情况,身体指标BMI,吸烟情况,血糖情况和心律;
数据收集完成后对数据进行预处理,预处理包括对数据的清洗及标准化;数据的清洗 分别针对每一个特征列去除其中的异常数据;数据的标准化首先需要将定性数据转化为定 量数据,然后根据每个特征不同的划分依据来完成特征的二值化、多值化及哑编码的处理;
以高血压的特征标准化内容为例说明如下:
类别 收缩压(mmHg) 舒张压(mmHg) 对应离散特征值
正常血压 <120 <80 S1
正常高值 120~139 80~89 S2
高血压 ≥140 ≥90 S3
1级高血压(轻度) 140~159 90~99 S4
2级高血压(中度) 160~179 100~199 S5
3级高血压(重度) ≥180 ≥110 S6
单纯收缩期高血压 ≥140 <90 S7
利用皮尔森相关系数法计算各个特征与目标值的相关系数,对于单个特征而言,相关 系数的绝对值越大,则代表这个特征对分类结果影响越大,利用这一特性对特征结果相关 度进行排名,将相关系数值定量转化为权重wi,进而在概率模型预测过程中进行干预从 而提升算法精度。
对特征集合B中的样本数据进行随机划分处理,并设定划分阈值为0.7,预测模型会 随机取样本总数的70%作为训练集来完成对脑卒中患病概率预测模型的训练,利用剩余 30%的样本数据作为测试集来验证模型预测结果的准确性。
在预测模型中设定滑动界定因子,滑动界定因子的值在[0,1]区间内自由设定,预测模 型计算得到的概率值当大于设定值时,则发出患病概率预警;在训练过程中调整滑动界定 因子的参数值,依据精确率precision,召回率recall,模型综合评价指标F_measure以及 ROC曲线的参考标准,完成对脑卒中患病概率预测模型的搭建。
另外还需要综合考虑预测脑卒中召回率的问题,滑动界定因子的值设定的越大,模型 预测精确率就越高,但相应的召回率就会越低。实施例给出推荐的滑动界定因子的值为 0.61。基于此值得到预测模型的精确率为79.83%,召回率为75.13%,F-Measure=0.786, 曲线下面积AUC=0.81。

Claims (10)

1.一种基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:收集与脑卒中相关的因素数据组成特征集合B,并对相关的数据进行预处理,将定性数据转化为定量数据,利用皮尔森相关系数法计算各个特征与目标值的相关系数,将相关系数值定量转化为权重wi;将传统算法结合多项式及高斯模型来分别处理离散和连续的特征数据,采用加权特征分析方法提升重要特征对预测结果的影响;引入精确率precision,召回率recall,模型综合评价指标F_measure以及ROC曲线来完成对预测模型的综合评估,进而得到高预测精确率的预测模型。
2.根据权利要求1所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:对离散的特征数据采用拉普拉斯修正对概率计算结果进行平滑处理,对于特征集合B中任意特征b,它的取值个数为m,在计算特征b对脑卒中影响概率时,在分母上加m,在分子上加1完成对计算结果平滑的修正;
根据性别及其类似的离散特征得到的预测概率公式表示为:
其中,P(B(j)=b(j)|A=ck)是条件概率的表示方法,其含义是在分类为ck的前提下,特征b取值为b(j)时的概率,在条件上有先后顺序的要求;P(B(j)=b(j),A=ck)是经典概率的表示方式,其含义是分类A取值为ck,同时特征b取值为b(j)的概率值。
3.根据权利要求1所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:根据BMI以及其类似的连续特征得到的预测概率公式表示为:
其中,σ是在ck分类下的标准差,u为均值,x为相应特征的具体值。
4.根据权利要求1所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:采用加权特征分析方法提升重要特征对预测结果的影响;特征Bi的权重为wi,对所有特征进行处理后特征的权重向量W表示为W=(w1;w2;w3;...;wi),通过权重向量W可以直观的反映出各特征在模型预测中的重要程度,其中i为自然数;基于经典的条件概率公式朴素贝叶斯算法的预测模型表示为:
其中,P(B|A)的原计算公式为在加入权重向量W之后调整为根据以上推论加权的朴素贝叶斯算法的预测模型表示为:
其中,B是特征集合,A为是否患脑卒中的分类;P(A|B)是在已知特征集合的情况下判断是否患有脑卒中的条件概率,叫做后验概率;P(B)是先验概率,也叫做标准化常量,是指通过事件发生次数对概率的主观判断;Pw(B|A)是已知是否患有脑卒中后对应的特征集合的条件概率,叫做似然函数,似然函数是对某件事发生可能性的判断,与条件概率正好相反,通过事件已经发生的概率推算事件可能性的概率;Pw(B|A)/P(B)是调整因子,也被称作标准似然度,调整因子是似然函数与先验概率的比值,这个比值相当于一个权重,用来调整后验概率的值,使后验概率更接近真实概率;P(A)是否患有脑卒中的概率。
5.根据权利要求1所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:所述精确率precision是模型预测为脑卒中患者且正确的数量在模型预测为脑卒中患者的数量中所占的比值,用P表示;所述召回率recall模型预测为脑卒中患者且正确的数量在样本中标记为脑卒中患者的数量中所占的比值,用R表示;P与R的数值越趋近于1,查准率或查全率就越高;当P与R数值出现矛盾时,和分别用P和R表示,通过模型综合评价指标F_Measure作加权调和平均。
6.根据权利要求5所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:所述模型综合评价指标F_Measure表示为:
7.根据权利要求1所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:以特异度为横坐标,以灵敏度为纵坐标绘制ROC曲线;其中敏感度表示的是实验结果中预测为脑卒中患者且正确的人数占实际为脑卒中患者的人数的比值,特异度表示的是实际中并非脑卒中患者但预测为脑卒中患者占非脑卒中患者的比值;ROC曲线下面积AUC可以反映预测构建模型的质量情况,AUC越趋向于1表示模型整体质量越高。
8.根据权利要求1、2或4中任意一项所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:所述特征集合B中包括3项不可干预因素数据和10项可干预因素数据;其中3项不可干预因素数据分别为性别,年龄和家族遗传;10项可干预因素数据分别为血压,TC总胆固醇指标,TG甘油三酯指标,LDL低密度脂蛋白指标,HDL高密度脂蛋白指标,运动情况,身体指标BMI,吸烟情况,血糖情况和心律;
数据收集完成后对数据进行预处理,预处理包括对数据的清洗及标准化;数据的清洗分别针对每一个特征列去除其中的异常数据;数据的标准化首先需要将定性数据转化为定量数据,然后根据每个特征不同的划分依据来完成特征的二值化、多值化及哑编码的处理;
利用皮尔森相关系数法计算各个特征与目标值的相关系数,对于单个特征而言,相关系数的绝对值越大,则代表这个特征对分类结果影响越大,利用这一特性对特征结果相关度进行排名,将相关系数值定量转化为权重wi,进而在概率模型预测过程中进行干预从而提升算法精度。
9.根据权利要求1所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:对特征集合B中的样本数据进行随机划分处理,并设定划分阈值为0.7,预测模型会随机取样本总数的70%作为训练集来完成对脑卒中患病概率预测模型的训练,利用剩余30%的样本数据作为测试集来验证模型预测结果的准确性。
10.根据权利要求1所述的基于朴素贝叶斯算法的预测模型的建立方法,其特征在于:在预测模型中设定滑动界定因子,滑动界定因子的值在[0,1]区间内自由设定,预测模型计算得到的概率值当大于设定值时,则发出患病概率预警;在训练过程中调整滑动界定因子的参数值,依据精确率precision,召回率recall,模型综合评价指标F_measure以及ROC曲线的参考标准,完成对脑卒中患病概率预测模型的搭建。
CN201811020809.5A 2018-09-03 2018-09-03 一种基于朴素贝叶斯算法的预测模型的建立方法 Pending CN109036568A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811020809.5A CN109036568A (zh) 2018-09-03 2018-09-03 一种基于朴素贝叶斯算法的预测模型的建立方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811020809.5A CN109036568A (zh) 2018-09-03 2018-09-03 一种基于朴素贝叶斯算法的预测模型的建立方法

Publications (1)

Publication Number Publication Date
CN109036568A true CN109036568A (zh) 2018-12-18

Family

ID=64622906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811020809.5A Pending CN109036568A (zh) 2018-09-03 2018-09-03 一种基于朴素贝叶斯算法的预测模型的建立方法

Country Status (1)

Country Link
CN (1) CN109036568A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222734A (zh) * 2019-05-17 2019-09-10 深圳先进技术研究院 贝叶斯网络学习方法、智能设备及存储装置
CN110555477A (zh) * 2019-08-30 2019-12-10 青岛海信网络科技股份有限公司 一种市政设施故障预测方法及装置
CN110970129A (zh) * 2019-12-23 2020-04-07 河南中医药大学 一种基于改进贝叶斯统计判断中医证候的方法
CN111028944A (zh) * 2019-12-16 2020-04-17 南昌大学第二附属医院 一种基于核主成分分析和多项式特征的脑血管病神经功能损伤程度预测模型
CN111184948A (zh) * 2020-01-09 2020-05-22 北京理工大学 基于血管靶向光动力疗法的鲜红斑痣处理方法及系统
CN111524600A (zh) * 2020-04-24 2020-08-11 中国地质大学(武汉) 基于neighbor2vec的肝癌术后复发风险预测系统
CN111524599A (zh) * 2020-04-24 2020-08-11 中国地质大学(武汉) 一种基于机器学习的新冠肺炎数据处理方法及预测系统
CN111653356A (zh) * 2020-04-20 2020-09-11 浙江大学 一种基于深度学习的新冠肺炎筛查方法及新冠肺炎筛查系统
CN111662983A (zh) * 2020-07-06 2020-09-15 北京吉因加科技有限公司 一种用于检测淋巴瘤基因变异的试剂盒及其应用
WO2020181907A1 (zh) * 2019-03-08 2020-09-17 阿里巴巴集团控股有限公司 决策优化方法及装置
CN111768205A (zh) * 2020-06-24 2020-10-13 中国工商银行股份有限公司 攻击交易识别方法及系统
CN112133434A (zh) * 2020-09-17 2020-12-25 吾征智能技术(北京)有限公司 基于饮食习惯的高血脂辅助诊断系统、设备、存储介质
CN112329804A (zh) * 2020-06-30 2021-02-05 中国石油大学(北京) 基于特征随机的朴素贝叶斯岩相分类集成学习方法及装置
CN112530575A (zh) * 2019-09-02 2021-03-19 佳能医疗系统株式会社 诊疗辅助装置
CN112561935A (zh) * 2020-12-26 2021-03-26 广东工业大学 一种阿尔兹海默症的识别方法、装置和设备
CN113705720A (zh) * 2021-09-08 2021-11-26 中国科学院国家天文台 机器学习中应用权重修正来减低加权训练偏差的方法
CN115148330A (zh) * 2022-05-24 2022-10-04 中国医学科学院北京协和医院 Pop治疗方案形成方法及系统
CN116665922A (zh) * 2023-07-31 2023-08-29 四川天府智链健康科技有限公司 一种医患通信方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
康琦等: "《机器学习中的不平衡分类方法》", 31 October 2017 *
张明卫等: "基于相关系数的加权朴素贝叶斯分类算法", 《东北大学学报(自然科学版)》 *
汤启友等: "基于朴素贝叶斯分类的睡眠诊断", 《科技风》 *
郭英明等: "基于斯皮尔曼系数的加权朴素贝叶斯分类算法研究", 《信息与电脑(理论版)》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020181907A1 (zh) * 2019-03-08 2020-09-17 阿里巴巴集团控股有限公司 决策优化方法及装置
CN110222734B (zh) * 2019-05-17 2021-11-23 深圳先进技术研究院 贝叶斯网络学习方法、智能设备及存储装置
CN110222734A (zh) * 2019-05-17 2019-09-10 深圳先进技术研究院 贝叶斯网络学习方法、智能设备及存储装置
CN110555477A (zh) * 2019-08-30 2019-12-10 青岛海信网络科技股份有限公司 一种市政设施故障预测方法及装置
CN112530575A (zh) * 2019-09-02 2021-03-19 佳能医疗系统株式会社 诊疗辅助装置
CN111028944A (zh) * 2019-12-16 2020-04-17 南昌大学第二附属医院 一种基于核主成分分析和多项式特征的脑血管病神经功能损伤程度预测模型
CN110970129A (zh) * 2019-12-23 2020-04-07 河南中医药大学 一种基于改进贝叶斯统计判断中医证候的方法
CN110970129B (zh) * 2019-12-23 2022-08-16 河南中医药大学 一种基于改进贝叶斯统计判断中医证候的方法
CN111184948B (zh) * 2020-01-09 2020-12-25 北京理工大学 基于血管靶向光动力疗法的鲜红斑痣处理方法及系统
CN111184948A (zh) * 2020-01-09 2020-05-22 北京理工大学 基于血管靶向光动力疗法的鲜红斑痣处理方法及系统
CN111653356A (zh) * 2020-04-20 2020-09-11 浙江大学 一种基于深度学习的新冠肺炎筛查方法及新冠肺炎筛查系统
CN111524600A (zh) * 2020-04-24 2020-08-11 中国地质大学(武汉) 基于neighbor2vec的肝癌术后复发风险预测系统
CN111524599A (zh) * 2020-04-24 2020-08-11 中国地质大学(武汉) 一种基于机器学习的新冠肺炎数据处理方法及预测系统
CN111768205A (zh) * 2020-06-24 2020-10-13 中国工商银行股份有限公司 攻击交易识别方法及系统
CN111768205B (zh) * 2020-06-24 2023-08-18 中国工商银行股份有限公司 攻击交易识别方法及系统
CN112329804A (zh) * 2020-06-30 2021-02-05 中国石油大学(北京) 基于特征随机的朴素贝叶斯岩相分类集成学习方法及装置
CN111662983B (zh) * 2020-07-06 2023-04-07 北京吉因加科技有限公司 一种用于检测淋巴瘤基因变异的试剂盒及其应用
CN111662983A (zh) * 2020-07-06 2020-09-15 北京吉因加科技有限公司 一种用于检测淋巴瘤基因变异的试剂盒及其应用
CN112133434A (zh) * 2020-09-17 2020-12-25 吾征智能技术(北京)有限公司 基于饮食习惯的高血脂辅助诊断系统、设备、存储介质
CN112561935A (zh) * 2020-12-26 2021-03-26 广东工业大学 一种阿尔兹海默症的识别方法、装置和设备
CN112561935B (zh) * 2020-12-26 2022-09-16 广东工业大学 一种大脑影像智能分类方法、装置和设备
CN113705720A (zh) * 2021-09-08 2021-11-26 中国科学院国家天文台 机器学习中应用权重修正来减低加权训练偏差的方法
CN113705720B (zh) * 2021-09-08 2024-05-14 中国科学院国家天文台 机器学习中应用权重修正来减低加权训练偏差的方法
CN115148330A (zh) * 2022-05-24 2022-10-04 中国医学科学院北京协和医院 Pop治疗方案形成方法及系统
CN115148330B (zh) * 2022-05-24 2023-07-25 中国医学科学院北京协和医院 Pop治疗方案形成方法及系统
CN116665922A (zh) * 2023-07-31 2023-08-29 四川天府智链健康科技有限公司 一种医患通信方法及系统

Similar Documents

Publication Publication Date Title
CN109036568A (zh) 一种基于朴素贝叶斯算法的预测模型的建立方法
CN107153774A (zh) 慢性病风险评估双曲线模型的构建及应用该模型的疾病预测系统
CN111105860B (zh) 面向慢性病康复的精准运动大数据智能预测、分析及优化系统
CN111524602A (zh) 一种老年人记忆及认知功能评估筛查预警系统
CN113362954A (zh) 一种老年患者术后感染并发症风险预警模型及其建立方法
CN109065113B (zh) 基于机器学习的人体减重方案推荐方法、系统及介质
JP6585869B1 (ja) 将来の骨量を予測する方法、情報処理装置、及びコンピュータプログラム
CN114464322A (zh) 女性盆底功能障碍性疾病风险预警模型及其构建方法和系统
CN113490987A (zh) 用于评估肌肉相关病症的方法
CN113903450A (zh) 一种2型糖尿病风险预测模型的构建系统
Soetanto et al. Hypertension drug suitability evaluation based on patient condition with improved profile matching
CN117012392A (zh) 高血压风险评估模型构建方法、膳食食疗及健康管理系统
CN108877943A (zh) 基于循证医学证据的ii型糖尿病风险评估模型
Zhang et al. A hybrid model for blood pressure prediction from a PPG signal based on MIV and GA-BP neural network
CN112768074A (zh) 一种基于人工智能的重疾风险预测方法及系统
CN116453641B (zh) 一种中医辅助分析信息的数据处理方法及系统
CN115517682B (zh) 基于胃肠电信号的认知功能障碍预测系统及构建方法
KR101255477B1 (ko) 사상체질 분류방법
CN117079810A (zh) 一种心血管疾病非计划再住院风险预测方法
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及系统
Xu et al. Prediction of Diabetes with its Symptoms Based on Machine Learning
Shojaee-Mend et al. Prediction of Diabetes Using Data Mining and Machine Learning Algorithms: A Cross-Sectional Study
CN116584962B (zh) 一种基于胃肠电信号的睡眠障碍预测系统及其构建方法
Rini et al. Effect of Genetic Algorithm on Prediction of Heart Disease Stadium using Fuzzy Hierarchical Model
CN110993109A (zh) 一种用于心血管功能无创健康评价方法的装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication