发明内容
本发明提供了一种面向慢病患者的健康知识个性化推荐方法,能有效地指导慢病患者标签化、健康知识分类遴选与推荐等工作的进行,并能在计算机中实现一个便于拓展维护的慢病个性化健康知识推荐系统,同时在前期直接推广应用的基础上,通过对数据的验证与优化,提高患者的学习依从度,辅助特定应用场景下个性化推荐的迭代。
一种面向慢病患者的健康知识个性化推荐方法,包括:
步骤1,建立慢病患者特征分类标签集合,该患者特征分类标签集合包括表达健康领域的上层标签、与各上层标签相关联以表达具体健康特征的中层标签、以及对各中层标签进行细分且反应患者特征的下层标签;
步骤2,构建用户特征向量,用户特征向量中的每一位对应一个下层标签,依据患者的下层标签改写用户特征向量中对应位的值(下层标签若存在,则用户特征向量中相应位的值为1,否则,用户特征向量中相应位的值为0),得到相应的患者特征向量;
步骤3,建立知识特征分类标签集合,该知识特征分类标签集合包括:定义健康教育知识主题的知识上层标签、以及隶属于知识上层标签定义主题的知识下层标签;
步骤4,依据患者特征向量构建健康知识特征向量,健康知识特征向量中的对应位表达相应的知识下层标签;
步骤5,将患者特征向量与健康知识特征向量相乘,得到匹配度,依据匹配度推荐健康知识。
所述慢病患者特征分类标签集合基于病历记录数据建立,所述病历记录数据的来源包括管理慢病患者的基层社区医院以及家庭全科医生等,依据管理或随访过程中获取的病历记录数据,建立慢病患者特征分类标签集合。
所述慢病患者特征分类标签集合基于病历记录数据以及慢病管理指南和临床医学知识建立,所述慢病患者特征分类标签集合包含三个层次,分别为上层标签、中层标签、和下层标签,其中上层标签用于表达健康领域,上层标签的设立考虑与某种慢病相关的影响因素,也即医护工作人员对患者病历数据特征一定程度的抽象,例如:个人信息、生活习惯、检查检验、疾病症状、用药情况等,两种慢病中可能存在相同的上层标签。例如针对高血压患者,上层标签为:血压和个人特征;针对糖尿病患者,上层标签为:血糖和个人特征。
中层标签与上层标签相关联以表达具体的健康特征,例如针对血压这一标签,可以下设高血压、血压高值、低血压等与血压相关的具体健康特征,又如,针对个人特征,可以下设年龄、性别、体重等具体健康特征。
下层标签为中层标签的细分,将中层标签与患者病历数据建立直接规则关联,得到的表达结果作为下层标签。例如中层标签为高血压,依据血压的不同数值,划分为一级高血压、二级高血压、三级高血压,用户的血压值落在某一血压区间内,该血压区间对应的高血压等级,即为用户的下层标签。
上层标签、中层标签和下层标签表达不同层次的概念,具体的划分需要依据病历数据,管理指南,临床经验等进行,例如,上层标签为“个人信息”,中层标签为“职业”,下层标签为“工人”、“教师”、“军人”等。
所述知识特征分类标签集合包括知识上层标签和知识下层标签,其中知识上层标签采用关键词的形式为健康知识设立标签,知识下层标签与知识上层标签相关联,为与知识上层标签相关联的具体知识,例如,知识上层标签为高血压,知识下层标签可以为高血压、老年高血压和高血压常识,各知识下层标签之间可以有知识内容上的重叠。在知识特征分类标签集合的基础上,被集合内标签标注的健康知识,可以转为与患者特征向量长度相同,有对应关联关系的文本特征向量。
本发明中,知识特征分类标签集合建立在慢病患者特征分类标签集合的基础上,一般按照用户下层标签做反向映射,确定知识特征分类标签集合中的知识下层标签,通过对知识下层标签进行总结归纳得到知识上层标签进行管理。
双层的知识特征分类标签集合,结构更加简洁,便于管理,与所述慢病患者特征分类标签集合联动能充分辅助推荐方法的实现。
步骤4中,依据患者特征向量构建健康知识特征向量,具体为:患者特征向量包括若干位,每一位对应一个下层标签,健康知识特征向量与患者特征向量的位数相同,健康知识特征向量与患者特征向量中的相应位具有相对应的含义,若某一健康知识中包含与患者特征向量中下层标签相关的内容,则健康知识特征向量中与该下层标签对应的位的值为1,否则为0。
例如,下层标签包括一级高血压、二级高血压、三级高血压,患者特征向量的第一位对应一级高血压、第二位对应二级高血压、第三位对应三级高血压。若某一健康知识中包含与一级高血压相关的内容,则健康知识特征向量中的第一位的值为1,否则健康知识特征向量中的第一位的值为0,同理,若某一健康知识中包含与一级高血压、二级高血压、三级高血压相关的内容,则健康知识特征向量中的第一位、第二位和第三位的值均为1。
步骤5中计算得到的匹配度反映用户与知识之间的契合程度,将匹配度大于阈值的健康知识推荐给相应的用户。
本发明中推荐给患者的健康知识不限于匹配度最大的一个,而是将匹配度大于阈值的健康知识按照匹配度的大小依次推荐给用户。
本发明中对患者和用户两个词的含义不作严格区分,推荐对象可以是自身患病的患者,也可以为自身未患病的用户,依据两个词的使用位置做合理解释。
作为优选,步骤2还包括:根据慢病患者特征的危险等级、风险因素和重要程度,为上层标签和中层标签确定权重,患者特征向量中的第i位的值为Pi,则:
Pi=Ui×Mi×Wi
其中,Ui为上层标签权重;
Mi为中层标签权重;
Wi为表达患者特征向量中第i位的下层标签是否出现的值,若出现为1,否则为0。
上层标签和中层标签的权重根据病历记录数据以及慢病管理指南和临床医学知识进行设定,能够反应危险等级、风险因素和重要程度。
作为优选,步骤2还包括:根据患者的学习记录,利用如下公式计算患者特征向量的修正值:
Bi=b×F+a(n)
式中:Bi为患者特征向量中第i位的修正值;
F表示患者是否收藏或分享健康知识,是则为1,否则为0;
b为收藏分析系数;
a(n)表示自变量为阅读次数n的函数,一般为输出有上限的指数函数。
匹配度s的计算公式如下:
式中:Pi为患者特征向量中的第i位的值;
M为患者特征向量的长度,也即所有下层标签的个数;
Bi为患者特征向量中第i位的修正值;
Ki为健康知识特征向量中第i位的值。
本发明中通过整合用户的知识学习记录,发掘用户的潜在特征,以调整患者特征向量,提高推荐的准确度,以及患者管理的依从度。
学习记录的内容包括:学习知识的编号、开始学习的时间和时长、是否收藏等,每次学习过程单独作为一条记录。通过学习知识的编号可以获得对应的知识标签,学习的时长和频率反应用户的兴趣,点赞收藏直接反应用户的偏好。
将用户偏好的特征,以数值的形式赋予患者特征向量,即在向量层面上反应用户的偏好,以提高推荐的准确性。
本发明还提供了一种面向慢病患者的健康知识个性化推荐系统,包括:
慢病患者特征分类标签集合生成模块,用于建立慢病患者特征分类标签集合,该患者特征分类标签集合包括表达健康领域的上层标签、与各上层标签相关联以表达具体健康特征的中层标签、以及对各中层标签进行细分且反应患者特征的下层标签;
患者特征向量生成模块,用于构建用户特征向量,用户特征向量中的每一位对应一个下层标签,依据患者的下层标签改写用户特征向量中对应位的值,得到相应的患者特征向量;
知识特征分类标签集合生成模块,用于建立知识特征分类标签集合,该知识特征分类标签集合包括:定义健康教育知识主题的知识上层标签、以及隶属于知识上层标签定义主题的知识下层标签;
健康知识特征向量生成模块,用于依据患者特征向量构建健康知识特征向量,健康知识特征向量中的对应位表达相应的知识下层标签;
推荐模块,用于将患者特征向量与健康知识特征向量相乘,得到匹配度,依据匹配度推荐健康知识。
作为优选,患者特征向量生成模块包括:
权重计算模块:用于根据慢病患者特征的危险等级、风险因素和重要程度,为上层标签和中层标签确定权重,患者特征向量中的第i位的值为 Pi,则:
Pi=Ui×Mi×Wi
其中,Ui为上层标签权重;
Mi为中层标签权重;
Wi为表达患者特征向量中第i位的下层标签是否出现的值,若出现为1,否则为0。
作为优选,患者特征向量生成模块还包括:
修正模块:用于根据患者的学习记录,利用如下公式计算患者特征向量的修正值:
Bi=b×F+a(n)
式中:Bi为患者特征向量中第i位的修正值;
F表示患者是否收藏或分享健康知识,是则为1,否则为0;
b为收藏分析系数;
a(n)表示自变量为阅读次数n的函数。
作为优选,推荐模块包括:
匹配度计算模块:匹配度s的计算公式如下:
式中:Pi为患者特征向量中的第i位的值;
M为患者特征向量的长度,也即所有下层标签的个数;
Bi为患者特征向量中第i位的修正值;
Ki为健康知识特征向量中第i位的值。
本发明提供了一种面向慢病患者的健康知识个性化推荐方法,应用于移动医疗等领域,通过建立慢病患者特征分类标签集合与健康知识特征分类标签集合,能够有效地在计算机系统中实现患者、健康知识的标签化与向量化工作,最后根据匹配度是否超过阈值向患者推荐健康知识,对患者与健康知识标签化、个性化知识推荐与慢病自动教育等方面工作的实现有指导意义,并具有可行性,符合应用的需要。
在对慢病患者的教育过程中,一般的医护人员会基于自身的主观经验和慢病患者的客观特征,向慢性疾病患者等推荐健康知识,但此时存在几个问题,一是医护人员的主观经验难以描述,或者说缺少一个标准的模型或系统来直观反映医护人员的这个“个体经验系统”,将这样的主观经验应用在历时长的慢病管理看护工作中,可能会存在不确定性和认知缺陷,影响患者教育效果,同时无法有效地与本领域的工作人员进行交流改进;二是慢病患者的客观特征是基于其口述或以往病历中呈现的数据而得的,这个数据的处理过程也缺少直观的显示模型;三是这样的医师经验系统,很难通过信息技术实现或复制,或者不同的医护人员设计的系统可能缺乏有帮助的参考标准。
因此,本发明与现有技术相比,有益效果在于以下几个方面:
首先,提供了一种基于基层慢病病历数据的多层标签集合设计方法,该方法的优点在于:1、为医护人员客观分析患者数据、分类健康知识提供直观的系统设计依据;2、面向基层健康管理数据,可以提炼较多的通用标签与规则;3、通过简化的多层模型结构,便于医护人员掌握,也便于在计算机中实现并动态拓展;
其次,提出了患者标签与知识标签的向量转换方法,让两者能够建立关联,产生相互作用,以此得到健康知识与该患者当前特征的匹配程度,实现了一个完整而直观的知识推荐系统;
最后,通过患者的学习行为对推荐系统进行调整,发掘用户的潜在特征,以平衡依从度与患者教育的直接关系,构建了一个规则与数据协同驱动的系统,对于进行时间相对较长的慢病健康教育,更有利于提高其效果。
具体实施方式
下面结合具体的实施例对本发明的内容作进一步的说明。
为了便于让本领域的技术人员更好地理解本发明,以下将以高血压患者的血压相关知识的健康教育为实施例进行具体说明。
高血压是以体循环动脉血压增高为主要特征的慢性疾病,而体循环动脉血压包括收缩压与舒张压,一般高血压患者的收缩压≥140mmHg,舒张压≥90mmHg,长此以往可能影响心、脑、肾等器官的功能甚至产生器质性损害。因此,让慢病患者了解到高血压的危害,同时鼓励他们测量血压、了解血压、看懂血压,是高血压健康教育的重要工作。
采用本发明提供的健康知识个性化推荐方法对高血压患者进行健康知识推荐,如图5所示,包括如下步骤:
(1)审查某地基层卫生平台和家庭全科医生的随访记录,获取与高血压相关的病历记录,病历记录包括上级医院的高血压诊断结果、随访中产生的血压记录数据,同时还有患者的年龄、性别等等常见的个人信息数据。
(2)依据2014年发布的《中国高血压基层管理指南》的要求,要提高高血压知晓率、鼓励并推广家庭自测血压、干预其他危险因素等内容,而且特别要重视老年高血压患者的随访教育,由此设立两个上层标签:血压和个人特征,以配合随访数据提取高血压患者或血压异常人员的特征。
(3)为血压设立一个中层标签为:高血压,便于高血压相关知识对接,血压下的中层标签还可以包括血压高值、低血压等等;再通过图1所示的数据分析规则层,按内科学的心血管疾病危险分层知识,可得中层标签高血压的下层标签:一级高血压、二级高血压和三级高血压,该规则需要综合患者的年龄、并发症、一定时间内的血压测量情况和家庭病史等数据,在处理后可得到更为准确的高血压患者状态。
(4)为个人特征标签设计两个中层标签:年龄层与性别。对年龄层作简单的分层判断,可以得到患者的年龄层段是在少中青年还是老年;对性别进行判别,可以得到男性或女性两个下层标签。
(5)为了突出血压问题相对其他健康领域在慢病管理中的重要性,可以设领域系数Ui=2,在本发明的应用中,领域系数(也即上层标签权重)的一般范围为[1,2];高血压在血压领域中更为重要,因此设立其特征系数为Mi=15,在本发明的应用中,一般特征系数(也即中层标签权重)的取值范围在[1,20]。再设个体特征的领域系数为Ui=1,年龄层的特征系数为Mi=5,性别的特征系数为Mi=10;所以,假设本实施例中,有一个女性老年一级高血压患者被本系统打上了高血压标签,其患者基础向量为(1,0,0,0,0,0,0,1,0,1),则患者特征向量为(30,0,0, 0,0,0,0,5,0,10),具体参见图2。
(6)在患者特征标签的基础上,需要一类对应的知识特征分类标签作为教育推送匹配,因此在双层的知识特征分类标签集合中,设计一个知识上层标签:高血压,其知识下层标签为高血压、老年高血压、高血压常识、孕期高血压等等,通过图3所示的映射规则层,可以将被标上高血压的健康知识,转为与患者向量相同长度的健康知识特征向量。
如图4所示,以高血压常识与老年高血压为例,高血压标签针对高血压患者,因此健康知识特征向量为(1,1,1,0,0,0,0,0,0,0);老年高血压,针对的是有高血压特征的老年的患者,因此健康知识特征向量为(1,1,1,0,0,0,0,1,1,1);高血压常识的匹配患者是有高血压特征的全年龄段的患者,算是一种通识教育,因此健康知识特征向量为(1,1,1,1,1,1,1,1,1,1),表示对当前患者标签库中的所有特征匹配。
在本实施例中,本领域的技术人员应该意识到,知识特征分类标签集合中的知识下层标签,若是复合类型,例如高血压+常识,高血压+老年,可能就会出现与单标签不同的特征,而这一特征应在映射规则层中设计,此处不加拓展。
(7)在患者学习行为修正方面,在本实施例中将举一个简单的例子说明,例如,本实施例中的“老年女性高血压患者“,可能在家庭成员中,有个患有原发性高血压的青年男性患者,因此她对于与青年高血压的相关知识较为关注,也会主动了解一些男性高血压患者的知识,并会积极与该青年患者交流。因此,反映出的应用情况为该老年女性高血压患者也会阅读一些与青年、男性、高血压相关的知识,所以本发明中根据患者的这些学习行为进行修正,根据患者向量修正公式:
Bi=b×F+a(n)
其中,Bi表示患者特征标签集合中第i个下层标签所对应向量的修正值, F表示患者是否收藏或分析健康知识,收藏则为1,否则为0,b为收藏分享系数(根据经验进行设定);a(n)表示自变量为阅读次数n的函数,假设该患者没有收藏或分享行为,设计a(n)=0.05×2n,a(n)∈[0,0.8],若该患者阅读了青年、男性、高血压相关的知识共3次,则有Bi=a(3)=0.4,所以修正后的患者基础向量为:(1.4,0.4,0.4,0,0,0.4,0,1,0.4, 1),患者特征向量为(42,12,12,0,0,0,2,0,5,4,10)。
这里提到的青年、男性对应患者个人特征标签的下层标签,高血压对应高血压危险分层下的三个下层标签,以此进行患者特征向量的修正。这一规则关系与系统实际的应用有关,可以在逻辑上调节。
(8)最后,将修正后的患者特征向量与各个健康知识的特征向量相乘,根据匹配系数s计算公式:
式中:Pi为患者特征向量中的第i位的值;
M为患者特征向量的长度,也即所有下层标签的个数;
Bi为患者特征向量中第i位的修正值;
Ki为健康知识特征向量中第i位的值。
可得:s(本实例中的老年高血压患者,高血压)=66
s(本实例中的老年高血压患者,老年高血压)=85
s(本实例中的老年高血压患者,高血压常识)=87
相对于单标签的健康知识,老年高血压作为复合标签,由于推荐条件更为准确,因此在本实施例里,相对于高血压这一独立标签知识的匹配程度更高;而相对于老年高血压的有关知识,高血压常识由于也涉及到了该老年女性高血压患者的潜在学习需求,因此会有更高的匹配系数,相对会被优先被推荐。
在本发明的应用中,通常会为匹配系数确定一个阈值,以决定健康知识是否要推荐给患者,值得提出的是,在实际应用中,由于数据缺失等因素,患者特征向量通常比较稀疏,匹配系数可能不会很高,需要根据应用的情况调节。
以上以高血压患者为例介绍了本发明的具体实施细节,通过系统直观的设计实施流程,与最后量化的结果比较,体现了本发明的优势与应用意义。
如图6所示,实现本发明个性化推荐方法的系统具体包含如下几个模块:
(1)健康知识数据库和慢病患者数据库,两个数据库作为个性化推荐方法实现的基础。
(2)实现健康知识导入的知识导入模块,以及实现病历数据导入的数据导入模块;
(3)基于三层慢病患者特征分类标签集合的患者向量生成规则模块,以及基于双层知识特征标签的健康知识向量化模块。
(4)学习行为修正模块,在患者的初始化特征向量基础上,通过患者的学习行为修正,得到患者的最终特征向量;
(5)知识向量匹配运算与知识排序模块,该模块用于计算健康知识特征向量与患者特征向量的匹配系数,并进行知识与患者匹配度的排序;
(6)知识推荐执行或持久化模块,负责将筛选出的知识直接推荐给患者,或进行持久化存储,便于后续工作的查询或调用等。
本领域的普通技术人员将意识到,以上所述的实施例是为了帮助阅读本发明的读者更好地理解本发明的技术细节与实现原理,而本发明的保护范围不仅仅局限于这样的特别示例和实施例。本领域的普通技术人员可以根据本发明公开的技术思路与启示做出不脱离本发明实质的变形和组合,但这些变形和组合也在本发明的保护范围内。