CN111341446B - 一种个性化体检套餐推荐方法 - Google Patents

一种个性化体检套餐推荐方法 Download PDF

Info

Publication number
CN111341446B
CN111341446B CN202010087026.XA CN202010087026A CN111341446B CN 111341446 B CN111341446 B CN 111341446B CN 202010087026 A CN202010087026 A CN 202010087026A CN 111341446 B CN111341446 B CN 111341446B
Authority
CN
China
Prior art keywords
physical examination
physical
package
items
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010087026.XA
Other languages
English (en)
Other versions
CN111341446A (zh
Inventor
温武少
王佳琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202010087026.XA priority Critical patent/CN111341446B/zh
Publication of CN111341446A publication Critical patent/CN111341446A/zh
Application granted granted Critical
Publication of CN111341446B publication Critical patent/CN111341446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Public Health (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及医疗和人工智能领域,为个性化体检套餐推荐的方法,与体检者高效互动,针对体检者的个人健康信息生成可执行的体检方案。具体包括:构建常见病与风险因素的键值对、问题库、常见病库、体检套餐最小集、体检套餐最大集以及体检者分类机制;依据体检者分类机制对体检者进行分类,获取体检者的个人健康信息和体检预算,根据体检预算形成针对体检者的体检套餐;依据常见病与风险因素的键值对将个人健康信息量化为体检者的疾病风险因子;根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,预测个人相关体检项目的异常概率,计算其实际成本;根据体检项目添加规则向体检套餐最小集添加体检项目,形成体检套餐并推荐给体检者。

Description

一种个性化体检套餐推荐方法
技术领域
本发明涉及医疗和人工智能领域,具体涉及一种个性化体检套餐推荐方法。
背景技术
随着人们生活质量的逐步提高,人民群众对于健康体检的需求也越来越多,健康体检也正在逐渐成为门诊体检之外的体检中心的主流业务。然而,现在大多数的体检机构都是针对年龄和性别制定体检套餐,然后由消费者进行选择,这种方式存在如下问题:A.这些套餐都是针对某个年龄段和性别人群常患疾病的集合,没有考虑患者自身一些个性化的风险因素;B.面对形形色色的套餐价目表,客户眼花缭乱,体检中心只考虑了客户的预算而没有根据客户的健康需求制定体检项目;C.体检机构数据库中的大量体检数据没有得到充分利用,为体检者推荐套餐时并未考虑体检者的历史体检信息,造成一些不必要的体检项目做了但疾病发现率不高。
发明内容
为了克服已有的体检套餐功能单一、个性化适用性较差的不足,本发明提供了一种专业可靠、个性化适用性良好的体检套餐推荐方法,与体检者高效互动,针对体检者的个人健康信息生成可执行的体检方案。
本发明解决上述技术问题所采用的技术方案是:个性化体检套餐推荐方法,包括以下步骤:
S1、构建常见病与风险因素的键值对、问题库、常见病库、体检套餐最小集、体检套餐最大集以及体检者分类机制;
S2、依据体检者分类机制对体检者进行分类;对每类体检者,获取体检者的个人健康信息和体检预算,根据体检预算形成针对体检者的体检套餐;
S3、依据常见病与风险因素的键值对,将个人健康信息量化为体检者的疾病风险因子;
S4、根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,预测个人相关体检项目的异常概率,并计算个人相关体检项目的实际成本;
S5、以体检套餐最小集为初始集合,形成当前体检集;根据体检项目添加规则向当前体检集自动添加体检项目,形成体检套餐并推荐给体检者。
在优选的实施例中,步骤S4根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,计算每个问题的疾病风险因子之和,将疾病风险因子之和超过设定阈值的问题抽取出来组成调查问卷;体检者对调查问卷中的每个问题进行打分,分值有一个最大值和最小值,分值越大则代表问题中的场景在日常生活中出现的频率越高,分值越小则代表问题中的场景在日常生活中出现的频率越低;根据体检者对调查问卷的回答,对涉及到的常见病进行累计积分;根据涉及到的常见病的累计积分、疾病风险因子和相关体检项目在常见病确诊中所占的权重计算个人相关体检项目的异常概率,并计算个人相关体检项目的实际成本。
在优选的实施例中,步骤S1所构建的体检者分类机制将体检者分为两类,第一类为数据库中没有历年体检数据的体检者,第二类为数据库中有历年体检数据的体检者;
在步骤S5中,对于第二类体检者的体检项目添加规则为:
1)根据体检者往年的体检数据,用LSTM算法,根据该体检者往年体检指标预测今年体检指标值,判断今年指标异常的概率,并根据指标异常的概率找到符合条件的体检项目直接添加进所有体检套餐中;
2)对数据库中的体检数据,将体检项目的结果离散化,用GSP算法进行序列关联规则挖掘,通过与当前体检者有相同或者相似体检项目异常变化情况的其他体检者的体检结果,来找到符合条件的体检项目并将该体检项目添加进所有体检套餐里;
3)对数据库中每一年的体检结果进行聚类,将与该体检者在同一类中的其他体检者的健康情况作为参考,来寻找符合条件的体检项目并将它们添加到所有体检套餐中。
在步骤S5中对于两类体检者共有的项目添加规则为:将当前套餐里的项目当做先导,体检套餐最大集中没有出现在当前套餐里的体检项目当做后继,进行关联规则挖掘,找到满足最小支持度和置信度的关联规则,获取规则后继的体检项目;如果将当前项目添加进体检套餐,目标的增大量超过了设定阈值,则将该体检项目添加进套餐,否则不添加。
与现有技术相比,本发明取得了如下有益效果:
1、在本发明个性化体检套餐推荐方法中,与体检者高效互动,针对体检者的个人健康信息生成可执行的体检方案;对不同的体检者可以个性化的提供体检套餐;而对于多次体检过的体检者,可以根据其历史体检数据推荐更为可靠的体检套餐。
2、通过本发明的体检套餐推荐方法,体检者可以在预算之内最大可能的发现潜在疾病;且在尽量给体检者提供更有效的体检套餐的同时,可以兼顾医院的收益。
3、本发明简单易用,与人工智能相结合,充分利用了各个体检中心数据库中的海量的体检数据,因而只需在使用初期进行少量的人工处理,后期几乎全部都为机器处理,减少了人工成本;适用性强,可以与各个体检中心对接,实现体检套餐的个性化推荐。
附图说明
图1为本发明一种个性化体检套餐推荐方法的框架图;
图2为本发明一种个性化体检套餐推荐方法的流程图;
图3为本发明一种个性化体检套餐推荐方法的推荐判断流程图;
图4为本发明个性化体检套餐推荐方法的另一种推荐判断流程图;
图5为所构建的常见病与风险因素键值对的示意图;
图6为所构建的问题库的示意图;
图7为常见病库的示意图。
具体实施方式
以下结合附图和实施例对本发明的原理和技术特征进行详细描述,所举实施例只用于解释本发明,并非用于限定本发明的范围,本发明的实施方式并不限于此。
体检项目是单个或多个体检指标的组合,体检套餐是多个体检项目的组合。体检套餐存在一个最小集,即所有人都要检查的项目,同时存在一个最大集,即所有的体检项目都包含在内。体检套餐推荐的过程是向体检套餐最小集中添加体检项目的过程。如图1-4所示,本发明个性化体检套餐推荐的方法,包括以下步骤:
S1、构建常见病与风险因素的键值对、问题库、常见病库、体检套餐最小集、体检套餐最大集以及体检者分类机制。
在步骤S1中,常见病与风险因素的键值对,指保存了常见病以及每种常见病的风险因素及其权重的键值对,比如冠心病的风险因素可能包括家族病史、吸烟、年龄、职业等,家族病史和吸烟的权重可能高于年龄和职业;问题库,指保存了不同常见病病症的日常描述问题的数据库,每个问题有一个与该描述相关的常见病的列表,比如问题“日常生活中是否有胸部不适”的常见疾病列表为冠心病、高血压;常见病库,指保存了各种常见病、每种常见病确诊所需项目及每个项目在确诊中所占的权重和每种常见病的平均治疗费用的数据库,比如高脂血症可以通过血脂组合、空腹血脂来确诊,血脂组合的权重要高于空腹血脂,高血脂症的平均治疗费用可能在700元人民币左右;体检套餐最小集,指所有体检者都需要检查的项目集合;体检套餐最大集,指体检中心所提供的所有体检项目集合;体检者分类机制:指依据某种原则将所有体检者分为不同类别的方法,例如根据数据库中有无体检者的历史体检数据将体检者分为两类,第一类为数据库中没有历年体检数据的体检者,第二类为数据库中有历年体检数据的体检者。
常见病与风险因素键值对如图5所示,其中ill1、ill2、ill3均为常见病,A、B、C、D为风险因素,w1、w2、w3、w4、w5、w6为风险因素所占的权重。问题库如图6所示,其中ill1、ill2、ill3、ill4、ill5为与问题描述相关的常见病。常见病库如图7所示,其中ill1、ill2为常见病,A、B、C为常见病确诊所需的体检项目,w1、w2、w3为不同体检项目在确诊某项疾病中所占的权重。
S2、依据体检者分类机制对体检者进行分类;对每类体检者,获取体检者的个人健康信息和体检预算,根据体检预算形成针对体检者的体检套餐。
本实施例中,依据步骤S1所构建的体检者分类机制将体检者分为两类,第一类为数据库中没有历年体检数据的体检者,第二类为数据库中有历年体检数据的体检者。对于两类体检者,进行个人健康信息收集,包括年龄、性别、职业、既往病史、家族病史、压力、个人历史体检记录、个人历史诊疗记录、生活习惯调查,如吸烟、喝酒、运动、饮食习惯等,还有身高、体重、腰围、血压的测量,并了解体检者的预算,根据预算形成针对体检者的体检套餐。
S3、依据常见病与风险因素的键值对,将个人健康信息量化为体检者的疾病风险因子RF。
疾病风险因子:促使或引起疾病发生的条件,描述了疾病发生的可能性,疾病风险因子越大,疾病越有可能发生。疾病风险因子∈[0,1],本实施例中疾病风险因子<=1。
如果体检者个人健康信息中存在某些风险因素,则对这些风险因素涉及到的常见疾病计算风险因子。在步骤S3中,根据体检者的个人健康信息,计算每种常见病的风险因子。常见疾病i的风险因子为:
Figure BDA0002382420310000041
其中,riskfactor(i)为常见疾病i的相关风险因素,w(t)为风险因素t在影响该常见病的风险因素中所占的权重。
对于某种常见疾病,它的疾病风险因子为体检者个人健康信息中存在的且与该疾病相关的风险因素在该疾病中所占的权重之和。体检者个人健康信息中涉及到的风险因素越多,风险因素权重越大,则疾病风险因子越大。
S4、根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,预测个人相关体检项目的异常概率,并计算个人相关体检项目的实际成本。
在步骤S4中根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,计算每个问题的疾病风险因子之和,将疾病风险因子之和超过设定阈值的问题抽取出来组成调查问卷。某个问题的疾病风险因子之和,指该问题的常见疾病列表里的疾病的风险因子之和。比如问题“日常生活中是否有胸部不适”的常见疾病列表为冠心病、高血压,体检者的冠心病的风险因子为RF1,心脏病的风险因子为RF2,问题“日常生活中是否有胸部不适”的疾病风险因子之和为RF1和RF2的和,如果这个值超过了设定阈值则将问题“日常生活中是否有胸部不适”添加进调查问卷。
体检者可以对调查问卷中的每个问题进行打分,分值有一个最大值MAX_Score和最小值MIN_Score,分值越大,则代表问题中的场景在日常生活中出现的频率越高,分值越小,则代表问题中的场景在日常生活中出现的频率越低。比如体检者可以用0-9的整数来描述问题中的场景在日常生活中出现的频率,如果体检者在日常生活中经常出现胸部不适的现象,可以用数字9来回答,如果体检者从没出现过胸部不适的现象,则可以用数字0来回答。
根据体检者对调查问卷的回答,对涉及到的常见病进行累计积分,得到常见病的累计积分。特殊情况:若体检者有该疾病的病史,但是该疾病的累计积分不超过设定阈值t1,则可以判断保持的不错,将该疾病的相关检查项目中权重超过设定阈值t2的体检项目标记为“检测而不必关联检测”。“检测而不必关联检测”是指该体检项目需要检测,但是不需要当做先导进行关联规则挖掘。关联规则是形如X→Y的蕴含式,其中X和Y分别称为关联规则的先导和后继。
根据涉及到的常见病的累计积分、风险因子和相关体检项目在常见病确诊中所占的权重计算体检项目异常的概率。体检项目i异常的概率P(i)计算公式如下:
Figure BDA0002382420310000051
DB_ill为常见病库,RF(ill)为疾病ill的风险因子,w(i)为体检项目在疾病ill确诊中所占的比重,integration(ill)为疾病ill的累计积分,N为调查问卷中题目的数量,MAX_Score为最大分值,MIN_Score为最小分值。当常见病的风险因子越高时或者疾病的累计积分越高时,体检者患该疾病的概率就越高;某种疾病的患病概率越高,体检项目在确诊该疾病中占的比重越大,则该体检项目越有可能异常。由于概率值应该处于0到1之间,所以需要对疾病的累计积分进行归一化处理,且在求和之后如果超过了1,则概率为1。
计算体检项目的成本cost:健康体检的成本主要包括人工成本、办公运行成本、材料成本等。人工成本主要包括医护人员的工资福利;办公运行成本主要包括日常办公用品成本、培训费用和仪器设备的修购费等;材料成本主要包括检验用试剂、针筒、棉球等。对于人工成本,单位时间内完成的体检项目越多,则平均人工成本越低。人工成本labor_cost与完成某个项目所需要的时间proj_needtime有关。
labor_cost∝proj_need_time
人工成本与完成某个项目所需要的时间成正比,完成某个项目所需要的时间越多,则在该项目上所投资的人力资源就越多,单位时间内所能接待的体检者就越少,人工成本就会增加。
对于办公运行成本office_cost,与完成某个项目所花费的时间和项目完成总数有关。
Figure BDA0002382420310000061
当项目完成总数没有超过设定阈值时,单位时间内完成的项目总数越多,项目完成总数越多,则办公运行成本越少;当项目完成总数超过设定阈值时,仪器设备的修购费会随着项目完成总数的增加而增大,所以此时办公运行成本与完成某个项目所花费时间和项目完成总数成正比。
对于材料成本material_cost,可以把一个体检项目分成几个步骤,体检套餐中所有的步骤组成一个步骤集合steps,这样就发现很多项目包含一些相同的步骤,对每一个步骤标记tag是否已经计算过它的成本,tag=0表示还没计算,tag=1表示已经计算过该步骤的成本。体检套餐有A、B两个体检项目,体检项目A的步骤包括α、β和γ,体检步骤B的步骤包括α和β,那步骤集合steps为α、β和γ。
体检套餐的成本即为套餐内所有项目所涉及的步骤的成本之和。某个项目的实际成本为:
cost_hospital(i)=labor_cost(i)+office_cost(i)+material_cost(i)
其中,material_cost(i)为某个体检项目的成本,labor_cost(i)为人工成本,office_cost(i)为办公运行成本。
每个体检中心都有自己的体检项目成本计算方法。以上成本计算示例只为帮助说明本专利的成本计算思想。
S5、根据体检项目添加规则向体检项目最小集中添加体检项目;依据规则完成项目添加,形成体检套餐并推荐给体检者。
在步骤S5中,对于第二类用户,体检项目添加规则为:
1)根据体检者往年的体检数据,用LSTM算法,根据该用户(即体检者)往年体检指标预测今年体检指标值,并判断今年指标异常的概率,并根据指标异常的概率算出体检项目异常的概率P1,如果P1超过了设定阈值t3,则将该项目添加进体检套餐里。项目异常概率为项目内所有指标异常概率的加权和。
2)对数据库中的体检数据,将体检项目的结果离散化为严重偏低、偏低、正常、偏高、严重偏高等多种状态,用GSP算法进行序列关联规则挖掘,可以通过与当前体检者有相同或者相似体检项目异常变化情况的其他体检者的体检结果,来计算该体检者当前每个体检项目异常的概率P2,如果P2超过了设定的阈值t4,则将该体检项目添加进体检套餐里。
P2(i)∝MAX(support(r)confidence(r))r∈R
R为获得的以i的异常状态为后继的关联规则集合,confidence(r)为规则r的置信度,support(r)为规则r的支持度。支持度越大,表示规则的前件和后继同时出现越频繁,置信度揭示了当前件出现时,后继有多大概率出现,如果置信度太低,则说明前件的出现与后继是否出现关系不大。
3)对数据库中每一年的体检结果进行聚类,将与该体检者在同一类中的其他体检者的健康情况作为参考,如果这些人确诊了某些疾病,则在常见病库DB_ill中获取这些疾病的相关体检项目,并将该体检者与其他体检者之间的类内距离distance和他们在同一类中的次数counts转化为项目异常的概率P3,如果项目异常的概率P3超过了设定的阈值t5,则将项目添加进体检套餐里。
如果disance越小则说明这两个用户(体检者)越相似,counts越大,则说明他们变化趋势越相似。
Figure BDA0002382420310000071
LSTM,长短期记忆,是一种时间循环神经网络,适合处理和预测时间序列中间隔和延迟非常长的重要事件,可以根据历年体检数据预测体检者今年的体检指标值;GSP,广义序列模式,采用冗余候选模式的剪除策略和哈希树来实现候选模式的快速访存,可以根据历年体检数据预测体检者体检项目异常的概率。
对于两类体检者共有的项目添加规则为:将当前套餐里的项目当做先导,体检套餐最大集中却没有出现在当前套餐里的体检项目当做后继,进行关联规则挖掘,找到满足最小支持度和置信度的关联规则,获取规则后继的体检项目。如果将当前项目添加进体检套餐,目标的增大量超过了设定的阈值,则将该体检项目添加进套餐,否则不添加。
本步骤实现的目标为:在用户给定预算和个人健康情况以及医院给定体检项目列表和费用、每一项的体检成本的基础上,向用户推荐多个个性化体检套餐供用户选择。我们对推荐的体检套餐有两个要求,最佳个人疾病发现X和最大医院收益Y,目标即为最佳个人疾病发现和最大医院收益的加权和。对于不同的套餐,有不同的价格,通过调节权重,实现对最佳
Figure BDA0002382420310000072
疾病发现和最大医院收益的不同侧重。套餐A:费用在体检者的预算之内,且更侧重于最佳疾病发现;套餐B:费用可以超过体检者的预算,且尽量在最佳疾病发现和最大医院收益之间保持平衡,即二者权重的差值较小,在设定阈值之间;套餐C:费用可以超过体检者的预算,且更侧重于最大医院收益。
最佳个人疾病发现考虑体检者患病种类和患病概率、疾病可预防的概率和疾病的治疗成本。最大医院收益考虑体检套餐中所有项目的价格和体检套餐的实际成本。
最佳个人疾病发现指常见病库中所有常见病的患病概率、可预防概率、治疗成本的乘积之和:
Figure BDA0002382420310000081
DB_ill为常见病库,ill为某种常见病,ill_prob(ill)为患某种常见病的概率,prevention(ill)为某种常见病可预防的概率,ill_cost(ill)为某种常见病治疗的成本。本发明希望通过体检发现一些潜在的疾病,在同样的花费内,发现越多的潜在疾病越好,同时也希望潜在的疾病是可预防的,如果无法人为干预其恶化进程,那发现了该疾病也没有意义,更进一步,通过体检及时预防的疾病的治疗成本越高,我们的体检和预防就越有意义。
最大医院收益指体检套餐的价格与体检套餐的实际成本的差值:
Figure BDA0002382420310000082
cost(i)=MIN(cost_hospital(i),cost_hospital(i|t1),cost_hospital(i|t2),…,cost_hospital(i|tn)),t1,t2,…tn∈T
T为体检套餐,price为某个体检项目的价格,cost为某个体检项目的成本,cost_hospital为某个体检项目的实际成本。
计算常见病的患病概率ill_prob:将当前体检套餐中的体检项目与常见病库中的体检项目进行对比,找到涉及到的相关常见病种。对每种涉及到的相关常见病,将体检套餐中存在的该常见病的确诊项目的异常概率的加权和作为它的发病概率,即:
Figure BDA0002382420310000083
items(ill)为疾病ill的确诊因素,T为体检套餐,P为某个体检项目异常的概率,w为该体检项目在确诊该疾病中所占的权重。对于某种常见病来说,检查的确诊因素越多,则越容易确诊;确诊因素中异常的项目越多,项目异常的概率越大,项目在确诊中所占的比例越大,则体检者患该病的概率越大。例如,如果当前体检套餐包含四个体检项目A、B、C、D,它们的异常概率分别为Pa、Pb、Pc和Pd,常见病库中涉及到这四个体检项目的疾病有两个,ill1和ill2。疾病ill1相关的体检项目为A、B、C,它们在确诊ill1时所占的权重分别为w_a1、w_b1、w_c1,疾病ill2相关的体检项目为A、D,它们在确诊ill2时所占的权重分别为w_a2、w_d2,则疾病ill1的患病概率为ill_prob(ill1)=Pa*w_a1+Pb*w_b1+Pc*w_c1,疾病ill2的患病概率为ill_prob(ill2)=Pa*w_a2+Pd*w_d2。
疾病可预防的概率,指不患该病的概率与该病风险因子的乘积:
prevention(ill)=RF(ill)*(1-ill_prob(ill))
疾病可预防,是指已经有了患病的可能而还没有确诊得病,通过改变日常生活中的不良习惯,即减少疾病风险因素来降低患病的概率。所以疾病可预防概率与疾病风险因子有关,疾病风险因子越大,则说明日常生活中有特别多该疾病的风险因素,那体检者只要改变一些不良习惯,减少该疾病的风险因素,就可能对该疾病的发生产生较大的影响。疾病可预防概率还与不患病的概率有关,因为患病概率越高,则可预防的概率就越小,如果已经确诊该疾病,即患病概率为1,那就不是预防疾病而是治疗了,那疾病可预防的概率为0。
治疗成本,指常见病库中预设的该疾病的平均治疗成本;体检套餐的价格,指体检套餐内所有项目的价格总和;体检套餐的实际成本,指人工成本、办公成本和材料成本之和。
停止向套餐内添加体检项目的条件为:1)对于对套餐费用有限制的套餐,当当前套餐费用等于或接近于预算的时候,停止添加项目;2)对于对套餐费用没有限制的套餐,当所有规则后继的项目都不能按照添加规则添加进体检套餐时,停止添加项目。
向体检者推荐三个体检套餐,体检者可以自由选择其中一个,并根据自己的需求向选中的套餐里添加体检项目或者手动删除套餐里的某些体检项目。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种个性化体检套餐推荐方法,其特征在于,包括以下步骤:
S1、构建常见疾病与风险因素的键值对、问题库、常见疾病库、体检套餐最小集、体检套餐最大集以及体检者分类机制;
S2、依据体检者分类机制对体检者进行分类;对每类体检者,获取体检者的个人健康信息和体检预算,根据体检预算形成针对体检者的体检套餐;
S3、依据常见疾病与风险因素的键值对,将个人健康信息量化为体检者的疾病风险因子;
S4、根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,预测个人相关体检项目的异常概率,并计算个人相关体检项目的实际成本;
S5、以体检套餐最小集为初始集合,形成当前体检集;根据体检项目添加规则向当前体检集自动添加体检项目,形成体检套餐并推荐给体检者;
在步骤S1中,常见疾病与风险因素的键值对,指保存了常见疾病以及每种常见疾病的风险因素及其权重的键值对;问题库,指保存了不同常见疾病病症的日常描述问题的数据库,每个问题有一个与该描述相关的常见疾病的列表;体检套餐最小集,指所有体检者都需要检查的项目集合;体检套餐最大集,指体检中心所提供的所有体检项目集合;
步骤S3中的疾病风险因子,指促使或引起疾病发生的条件,描述了疾病发生的可能性,风险因子越大,疾病越有可能发生,风险因子∈[0,1];
在步骤S3中,根据体检者的个人健康信息,计算每种常见疾病的风险因子;常见疾病ill的风险因子为:
Figure FDA0003860417370000011
其中,riskfactor(ill)为常见疾病ill的相关风险因素,ω(t)为风险因素t在影响该常见疾病的风险因素中所占的权重;
在步骤S4中,根据涉及到的常见疾病的累计积分、风险因子和相关体检项目在常见疾病确诊中所占的权重计算体检项目异常的概率;体检项目i异常的概率P(i)计算公式如下:
Figure FDA0003860417370000012
DB_ill为常见疾病库,RF(ill)为疾病ill的风险因子,ω(i)为体检项目在疾病ill确诊中所占的比重,integration(ill)为疾病ill的累计积分,N为调查问卷中题目的数量,MAX_Score为最大分值,MIN_Score为最小分值;
在步骤S4中根据体检者的疾病风险因子和问题库中每个问题的常见疾病列表,计算每个问题的疾病风险因子之和,将疾病风险因子之和超过设定阈值的问题抽取出来组成调查问卷;体检者对调查问卷中的每个问题进行打分,分值有一个最大值和最小值,分值越大则代表问题中的场景在日常生活中出现的频率越高,分值越小则代表问题中的场景在日常生活中出现的频率越低;根据体检者对调查问卷的回答,对涉及到的常见疾病进行累计积分;根据涉及到的常见疾病的累计积分、疾病风险因子和相关体检项目在常见疾病确诊中所占的权重计算个人相关体检项目的异常概率,并计算个人相关体检项目的实际成本。
2.根据权利要求1所述的个性化体检套餐推荐方法,其特征在于,在步骤S4中,若体检者有该疾病的病史,但是该疾病的累计积分不超过设定阈值,则将权重超过设定阈值的该疾病确诊所需的体检项目标记为“检测而不必关联检测”;“检测而不必关联检测”是指该体检项目需要检测,但是不需要当做先导进行关联规则挖掘;关联规则是X→Y的蕴含式,其中X和Y分别称为关联规则的先导和后继。
3.根据权利要求1所述的个性化体检套餐推荐方法,其特征在于,步骤S1所构建的体检者分类机制将体检者分为两类,第一类为数据库中没有历年体检数据的体检者,第二类为数据库中有历年体检数据的体检者;
在步骤S5中,对于第二类体检者的体检项目添加规则为:
1)根据体检者往年的体检数据,用LSTM算法,根据该体检者往年体检指标预测今年体检指标值,判断今年指标异常的概率,并根据指标异常的概率找到符合条件的体检项目直接添加进所有体检套餐中;
2)对数据库中的体检数据,将体检项目的结果离散化,用GSP算法进行序列关联规则挖掘,通过与当前体检者有相同或者相似体检项目异常变化情况的其他体检者的体检结果,来找到符合条件的体检项目并将该体检项目添加进所有体检套餐里;
3)对数据库中每一年的体检结果进行聚类,将与该体检者在同一类中的其他体检者的健康情况作为参考,来寻找符合条件的体检项目并将它们添加到所有体检套餐中。
4.根据权利要求1所述的个性化体检套餐推荐方法,其特征在于,步骤S1所构建的体检者分类机制将体检者分为两类,第一类为数据库中没有历年体检数据的体检者,第二类为数据库中有历年体检数据的体检者;
在步骤S5中对于两类体检者共有的项目添加规则为:将当前套餐里的项目当做先导,体检套餐最大集中没有出现在当前套餐里的体检项目当做后继,进行关联规则挖掘,找到满足最小支持度和置信度的关联规则,获取规则后继的体检项目;如果将当前项目添加进体检套餐,目标的增大量超过了设定阈值,则将该体检项目添加进套餐,否则不添加。
5.根据权利要求1所述的个性化体检套餐推荐方法,其特征在于,步骤S5停止向当前体检集内添加体检项目的条件为:1)对于对套餐费用有限制的套餐,当当前套餐费用等于或接近于预算的时候,停止添加体检项目;2)对于对套餐费用没有限制的套餐,当所有体检规则后继的项目都不能按照添加规则添加进当前套餐时,停止添加体检项目。
CN202010087026.XA 2020-02-11 2020-02-11 一种个性化体检套餐推荐方法 Active CN111341446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010087026.XA CN111341446B (zh) 2020-02-11 2020-02-11 一种个性化体检套餐推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010087026.XA CN111341446B (zh) 2020-02-11 2020-02-11 一种个性化体检套餐推荐方法

Publications (2)

Publication Number Publication Date
CN111341446A CN111341446A (zh) 2020-06-26
CN111341446B true CN111341446B (zh) 2022-11-29

Family

ID=71182148

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010087026.XA Active CN111341446B (zh) 2020-02-11 2020-02-11 一种个性化体检套餐推荐方法

Country Status (1)

Country Link
CN (1) CN111341446B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114068017A (zh) * 2020-07-29 2022-02-18 阿里健康信息技术有限公司 一种数据处理方法及其装置
CN113782195A (zh) * 2021-01-15 2021-12-10 北京京东拓先科技有限公司 一种体检套餐定制方法和装置
CN113779373A (zh) * 2021-01-18 2021-12-10 北京京东拓先科技有限公司 一种体检项目确定方法、装置、设备及存储介质
CN112908458B (zh) * 2021-03-29 2024-06-21 善诊(上海)信息技术有限公司 一种体检套餐生成系统、方法及计算机可读存储介质
CN113611405A (zh) * 2021-08-10 2021-11-05 平安科技(深圳)有限公司 一种体检项目推荐方法、装置、设备及介质
CN116864062B (zh) * 2023-09-04 2023-11-21 山东普瑞森医疗设备股份有限公司 一种基于互联网的健康体检报告数据分析管理系统
CN117577327B (zh) * 2023-12-04 2024-04-30 启康保(北京)健康科技有限公司 一种基于大数据的体检信息推荐系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046362A (zh) * 2015-07-24 2015-11-11 河南科技大学 一种基于关联规则挖掘的食品安全实时预测方法
CN105389713A (zh) * 2015-10-15 2016-03-09 南京大学 基于用户历史数据的移动流量套餐推荐算法
CN105469342A (zh) * 2015-11-19 2016-04-06 浙江工业大学 一种健康体检套餐的限额组合方法
CN107346376A (zh) * 2017-07-05 2017-11-14 刘浩 一种健康体检项目智能推荐的方法及系统
CN108805755A (zh) * 2018-07-04 2018-11-13 山东汇贸电子口岸有限公司 一种旅游套餐生成方法及装置
CN110428903A (zh) * 2019-08-02 2019-11-08 北京健紫科技有限公司 体检方案自动生成方法、装置、计算机设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046362A (zh) * 2015-07-24 2015-11-11 河南科技大学 一种基于关联规则挖掘的食品安全实时预测方法
CN105389713A (zh) * 2015-10-15 2016-03-09 南京大学 基于用户历史数据的移动流量套餐推荐算法
CN105469342A (zh) * 2015-11-19 2016-04-06 浙江工业大学 一种健康体检套餐的限额组合方法
CN107346376A (zh) * 2017-07-05 2017-11-14 刘浩 一种健康体检项目智能推荐的方法及系统
CN108805755A (zh) * 2018-07-04 2018-11-13 山东汇贸电子口岸有限公司 一种旅游套餐生成方法及装置
CN110428903A (zh) * 2019-08-02 2019-11-08 北京健紫科技有限公司 体检方案自动生成方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111341446A (zh) 2020-06-26

Similar Documents

Publication Publication Date Title
CN111341446B (zh) 一种个性化体检套餐推荐方法
Normand et al. Statistical and clinical aspects of hospital outcomes profiling
Rellstab et al. The kids are alright-labour market effects of unexpected parental hospitalisations in the Netherlands
Read et al. Measuring overall health: an evaluation of three important approaches
Larson et al. Further validation of an instrument to measure patient satisfaction with pharmacy services
Shafrin Operating on commission: analyzing how physician financial incentives affect surgery rates
CN107785057B (zh) 医疗数据处理方法、装置、存储介质和计算机设备
Knickman et al. Regional differences in hospital utilization: how much can be traced to population differences?
US11537888B2 (en) Systems and methods for predicting pain level
Artime Ríos et al. Genetic algorithm based on support vector machines for computer vision syndrome classification in health personnel
Guha et al. Sensitivity analysis of physical and mental health factors affecting Polycystic ovary syndrome in women
Reddy et al. KEDOP: Keratoconus early detection of progression using tomography images
KR102442873B1 (ko) 보험 설계를 위한 질환예측 서비스 시스템
CN118116528A (zh) 基于机器学习生成人格量表的系统
Jablensky Research methods in psychiatric epidemiology: an overview
DesHarnais Enrollment in and disenrollment from health maintenance organizations by Medicaid recipients
KR101255477B1 (ko) 사상체질 분류방법
Johnson et al. Household and medical provider reports on medical conditions: national medical expenditure survey, 1987
Schneider et al. The physician-patient relationship revisited: the patient’s view
Goodman et al. Emergency department frequent user subgroups: Development of an empirical, theory-grounded definition using population health data and machine learning.
Schlegelmilch et al. Choice and perceived quality of family practitioners in the United States and the United Kingdom
Campbell et al. The impact of paid leave: Evidence from temporary disability insurance in Rhode Island
Lyons et al. Reduction in clinical assessment time using computer algorithms
Gustian et al. Comparison of Classification Data Mining Models Predicting Heart Disease in Europe
Suh Evaluating the relationship between health plan characteristics and CMS quality scores

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant