CN111816276A - 患教教程推荐方法、装置、计算机设备和存储介质 - Google Patents

患教教程推荐方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111816276A
CN111816276A CN202010652661.8A CN202010652661A CN111816276A CN 111816276 A CN111816276 A CN 111816276A CN 202010652661 A CN202010652661 A CN 202010652661A CN 111816276 A CN111816276 A CN 111816276A
Authority
CN
China
Prior art keywords
user
group
course
teaching
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010652661.8A
Other languages
English (en)
Other versions
CN111816276B (zh
Inventor
廖希洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010652661.8A priority Critical patent/CN111816276B/zh
Priority to PCT/CN2020/118944 priority patent/WO2021139275A1/zh
Publication of CN111816276A publication Critical patent/CN111816276A/zh
Application granted granted Critical
Publication of CN111816276B publication Critical patent/CN111816276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据分析领域,提供了一种患教教程推荐方法、装置、计算机设备和存储介质,获取用户分组、患教教程分组以及各个用户分组对各个患教教程分组的感兴趣程度;根据感兴趣程度构建用户分组‑教程分组感兴趣程度矩阵,并采用组间效应模型进行分解,提取用户隐含因子、教程隐含因子、用户组间效应与教程组间效应;根据上述隐含因子与组间效应计算每个用户分组与各个患教教程分组的关联性,根据关联性对患教教程分组进行排序;根据排序,选择预设个数的患教教程分组对用户分组进行推荐。通过本申请提供的患教教程推荐方法、装置、计算机设备和存储介质,实现组对组的患教教程推荐。本申请方案可应用于智慧医疗领域中,以推进智慧城市的建设。

Description

患教教程推荐方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据分析的技术领域,特别涉及一种患教教程推荐方法、装置、计算机设备和存储介质。
背景技术
随着我国工业化、城镇化、人口老龄化进程不断加快,居民生活方式、生态环境、食品安全状况等对健康的影响逐步显现,慢性病发病、患病和死亡人数不断增多,群众慢性病疾病负担日益沉重。慢性病影响因素的综合性、复杂性决定了防治任务的长期性和艰巨性。为加强慢性病防治工作,降低疾病负担,提高居民健康期望寿命,努力全方向、全周期保障人民健康,国家在17年提出《中国防治慢性病中长期规划(2017—2025年)》,并提出八项策略措施,其中四条措施是加强健康教育、提升全民健康素质;促进慢性病早期发现,开展个性化健康干预;统筹社会资源,推动互联网创新成果应用;增强科技支撑。通过相关措施可以发现,不仅患者教育是重要的防治手段,而且基于科学支撑的个性化干预方式也是着重发展的策略措施。
随着移动互联网技术的快速发展,微博、微信等平台的自媒体出现了井喷势头。与娱乐大众不同,一些公众号关注于民生健康,旨在向用户推荐治疗、管理慢性疾病的患教教程。然而,与慢病治疗、管理相关的患教教程规模庞大,很难做到个性化定制。而每位用户的病情也有所不同,如何针对用户病情及喜好推荐合适的患教教程以管理、改善慢病成为了亟待解决的问题。
发明内容
本申请的主要目的为提供一种患教教程推荐方法、装置、计算机设备和存储介质,能实现依据用户偏好及病况对用户分组,依据患教教程主题对患教教程分组,实现组对组的患教教程推荐。
为实现上述目的,本申请提供了一种患教教程推荐方法,包括以下步骤:
获取用户分组、患教教程分组以及各个所述用户分组对各个所述患教教程分组的感兴趣程度;
根据所述感兴趣程度构建用户分组-教程分组感兴趣程度矩阵,采用组间效应模型分解所述用户分组-教程分组感兴趣程度矩阵,提取用户隐含因子、教程隐含因子、用户组间效应与教程组间效应;
根据所述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,根据r=(p+s)T(q+t)计算每个用户分组与各个所述患教教程分组的关联性,根据所述关联性对每个用户分组对应的所述患教教程分组进行排序;其中,p为所述用户隐含因子,q为所述教程隐含因子,s为所述用户组间效应,t为所述教程组间效应;
根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐。
进一步地,所述获取用户分组,患教教程分组,各个用户分组对各个患教教程分组的感兴趣程度的步骤之前,还包括:
获取多个患教教程,采用教程分类器对所述患教教程进行分类,得到多个患教教程分组;其中,所述教程分类器基于梯度提升树模型训练而成;
获取多个用户的用户信息;其中,所述用户信息包括年龄、性别、职业、病情、感兴趣的教程主题、体检数据;
根据所述用户信息对多个所述用户进行分组,得到多个用户分组,并计算每个所述用户分组的簇中心。
进一步地,所述根据所述用户信息对多个所述用户进行分组,得到多个用户分组,计算每个所述用户分组的簇中心的步骤之后,包括:
检测是否有新用户加入;
若有,获取所述新用户的用户信息,根据所述新用户的用户信息计算所述新用户与每个所述用户分组的簇中心的距离,根据所述距离将所述新用户分到距离最近的一个目标用户分组内,重新计算所述目标用户分组的簇中心。
进一步地,所述根据所述用户信息对多个所述用户进行分组,得到多个用户分组,计算每个所述用户分组的簇中心的步骤之后,包括:
检测各个所述用户分组中用户的用户信息是否发生变化;
若所述用户的用户信息发生变化,根据变化的用户信息计算所述用户与每个用户分组的簇中心的距离,根据所述距离对用户信息发生变化的用户重新进行分组,若该用户不属于原用户分组,计算新的用户分组的簇中心。
进一步地,所述根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐的步骤之后,包括:
获取所述用户分组中对所推荐的患教教程分组中的患教教程进行操作的第一目标用户组成第一目标用户分组;所述操作包括浏览、收藏、转发、评论;将所述用户分组中剩余第二目标用户组成第二目标用户分组;
采用公式M=ak1+bk2+ck3+dk4计算所述第一目标用户对其所操作的患教教程的兴趣值;其中a为浏览,b为收藏、c为转发、d为评论,所述k1、k2、k3、k4为对应预设权重,k1+k2+k3+k4=1;
将各个所述第二目标用户与各个所述第一目标用户两两配对组成用户对,计算每个用户对的相似度;
分别确定与各个所述第二目标用户的相似度最高的所述第一目标用户,作为相似度用户,将所述相似度用户的兴趣值最高的患教教程推荐给与该相似度用户配对的第二目标用户。
本申请还提供一种患教教程推荐装置,包括:
第一获取单元,用于获取用户分组、患教教程分组以及各个所述用户分组对各个所述患教教程分组的感兴趣程度;
提取单元,用于根据所述感兴趣程度构建用户分组-教程分组感兴趣程度矩阵,采用组间效应模型分解所述用户分组-教程分组感兴趣程度矩阵,提取用户隐含因子、教程隐含因子、用户组间效应与教程组间效应;
第一计算单元,用于根据所述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,根据r=(p+s)T(q+t)计算每个用户分组与各个所述患教教程分组的关联性,根据所述关联性对每个用户分组对应的所述患教教程分组进行排序;
第一推荐单元,用于根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐。
进一步地,所述患教教程推荐装置还包括:
第二获取单元,用于获取多个患教教程,采用教程分类器对所述患教教程进行分类,得到多个患教教程分组;其中,所述教程分类器基于梯度提升树模型训练而成;
第三获取单元,用于获取多个用户的用户信息;其中,所述用户信息包括年龄、性别、职业、病情、感兴趣的教程主题、体检数据;
分组单元,用于根据所述用户信息对多个所述用户进行分组,得到多个用户分组,并计算每个所述用户分组的簇中心。
进一步地,所述患教教程推荐装置还包括:
第一检测单元,用于检测是否有新用户加入;
第二计算单元,用于若有,获取所述新用户的用户信息,根据所述用户信息计算所述新用户与每个所述用户分组的簇中心的距离,根据所述距离将所述新用户分到距离最近的一个目标用户分组内,重新计算所述目标用户分组的簇中心。
进一步地,所述患教教程推荐装置还包括:
第二检测单元,用于检测各个所述用户分组中用户的用户信息是否发生变化;
第三计算单元,用于若所述用户的用户信息发生变化,根据变化的用户信息计算所述用户与每个用户分组的簇中心的距离,根据所述距离对用户信息发生变化的用户重新进行分组,若该用户不属于原用户分组,计算新的用户分组的簇中心。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请提供的患教教程推荐方法、装置、计算机设备和存储介质,通过用户分组对患教教程分组的感兴趣程度构建用户分组-教程分组感兴趣程度矩阵,再通过组间效应模型进行分解,提取出用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,根据上述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应计算各个用户分组与教程分组之间的关联性,最后根据该关联性向每个用户分组推荐与其关联性较高的患教教程分组,实现组对组之间的患教教程推荐。
附图说明
图1是本申请一实施例中患教教程推荐方法步骤示意图;
图2是本申请一实施例中患教教程推荐装置结构框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例提供了一种患教教程推荐方法,包括以下步骤:
步骤S1,获取用户分组、患教教程分组以及各个所述用户分组对各个所述患教教程分组的感兴趣程度;
步骤S2,根据所述感兴趣程度构建用户分组-教程分组感兴趣程度矩阵,采用组间效应模型分解所述用户分组-教程分组感兴趣程度矩阵,提取用户隐含因子、教程隐含因子、用户组间效应与教程组间效应;
步骤S3,根据所述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,根据r=(p+s)T(q+t)计算每个用户分组与各个所述患教教程分组的关联性,根据所述关联性对每个用户分组对应的所述患教教程分组进行排序;其中,p为所述用户隐含因子,q为所述教程隐含因子,s为所述用户组间效应,t为所述教程组间效应;
步骤S4,根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐。
本实施例中,如上述步骤S1所述,获取用户分组,患教教程分组,以及各个用户分组对患教教程分组的感兴趣程度,所述感兴趣程度代表用户是否想要了解该患教教程分组内的患教教程,感兴趣程度越高代表该用户分组想要了解的程度越高,感兴趣程度可以是每个用户分组对每个患教教程的感兴趣程度的打分,用户在浏览患教教程后可向用户推送相应的评分选择,让用户对已浏览的患教教程进行打分,也可以基于用户分组对患教教程分组的行为,如是否浏览、是否收藏、是否转发、是否评论等来确定,如用户分组对患教教程进行了浏览,根据浏览时间来确定是否浏览完成,若浏览时间很短,则表明用户对该患教教程不感兴趣。
如步骤S2所述,通过获取到的每个用户分组对患教教程分组的感兴趣程度构建一个用户分组-教程分组感兴趣程度矩阵,每个用户分组对患教教程分组的感兴趣程度可以是该用户分组对每个患教教程的打分,根据这个打分构建的用户分组-教程分组感兴趣程度矩阵,所述用户分组-教程分组感兴趣程度矩阵代表每个用户分组对每个患教教程分组的感兴趣程度,如m个用户分组,7个患教教程分组,每个用户分组对每个患教教程的感兴趣程度打分,这个分数构建的m*7矩阵就是用户分组-教程分组感兴趣程度矩阵。再采用组间效应模型分解所述用户分组-教程分组感兴趣程度矩阵,从中提取出用户隐含因子、教程隐含因子、用户组间效应与教程组间效应。所述组间效应模型可描述为rui=(pu+suv)T(qi+tji),其中,rui代表用户分组u对患教教程分组i的感兴趣程度,即用户分组-教程分组感兴趣程度矩阵,感兴趣程度可以是用户分组u对患教教程分组i的打分,也可以基于用户分组u对患教教程分组i的行为,即是否浏览、是否收藏、是否转发、是否评论等来确定,可以是用户分组内某一个用户对患教教程分组内的某一个患教教程的行为;pu代表用户分组u的用户隐含因子,qi代表患教教程分组i的教程隐含因子,suv代表用户分组u的用户组间效应,tji代表患教教程分组i的教程组间效应。具体的,用户分组-教程分组感兴趣程度矩阵可分解为两个小矩阵相乘,然后交替对两个小矩阵使用最小二乘法,算出这两个小矩阵,从而得到用户隐含因子、教程隐含因子、用户组间效应与教程组间效应。
如上述步骤S3和S4所述,根据所述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,采用r=(p+s)T(q+t)计算出用户分组-教程分组感兴趣程度矩阵缺失的值,从而得到每个用户分组与每个患教教程分组之间的关联性,根据所述关联性大小对患教教程分组进行排序,每个用户分组都有自己的患教教程分组排序,将每个用户分组与其对应的患教教程分组之间关联性高的预设个数的患教教程分组推荐给该组用户,实现组对组的推荐,提高推荐效率。本申请方案可应用于智慧医疗领域中,用户根据推荐的患教教程管理和改善自身慢性病,降低疾病负担,以推进智慧城市的建设。
在一实施例中,所述获取用户分组,患教教程分组,各个用户分组对各个患教教程分组的感兴趣程度的步骤S1之前,还包括:
步骤S1a,获取多个患教教程,采用教程分类器对所述患教教程进行分类,得到多个患教教程分组;其中,所述教程分类器基于梯度提升树模型训练而成;
步骤S1b,获取多个用户的用户信息;其中,所述用户信息包括年龄、性别、职业、病情、感兴趣的教程主题、体检数据;
步骤S1c,根据所述用户信息对多个所述用户进行分组,得到多个用户分组,并计算每个所述用户分组的簇中心。
本实施例中,如上述步骤S1a所述,获取多个患教教程,采用教程分类器对所述患教教程进行分类,对于分类完成的患教教程分组,当有新的患教教程加入时,采用教程分类器将其分类到原有的患教教程分组中。所述教程分类器基于梯度提升树模型训练而成,所述教程分类器可将多个患教教程分类为7个类别,分别为饮食、药物、运动、检测、风险控制、问题解决和健康调试,将患教教程分类到其中一个类别内。梯度提升树模型是将残差计算替换成了损失函数的梯度方向,将上一次的预测结果带入梯度中求出本轮的训练数据。训练梯度提升树模型时,对训练教程集中的训练患教教程进行分词、停用词过滤、文本向量化操作,训练教程集中的每个训练患教教程均有正确的类别,将经过上述操作的训练患教教程输入至初始的梯度提升树模型中进行迭代训练,使得输出结果为训练患教教程正确的类别,得到训练完成的教程分类器。具体的,当有新的患教教程加入时,也可对新的患教教程进行分类。
如上述步骤S1b所述,获取多个用户的用户信息,所述用户信息包括年龄、性别、职业、病情、感兴趣的教程主题、体检数据,用户的病情可以是血糖、胰岛素等指标。所述用户的用户信息可以是用户在关注公众号时,自己输入的,也可以是从外部源获取的用户的相关信息,比如,在你的系统(平台)上获取,通常都会有用户的手机号或者邮箱,通过这一标识数据,可以从外部,通过合作或者爬取到用户的相关人口属性数据,或其他更多的数据。目前很多平台都允许采用第三方的账号(主要是微信、QQ以及微博)登录,主要也是为了能够从第三方获取到一些基本的用户信息。通过用户信息对用户进行分组,兼顾用户的喜好和病情,将用户喜好或病情类似的分到同一组,对该组的所有用户推荐相同的患教分组,在一定程度上提高推荐效率。
如上述步骤S1c所述,根据所述用户信息对多个所述用户进行分组,得到多个用户分组,计算每个组的簇中心;本实施例中,所述用户信息中包含离散型便利和连续型变量,离散变量是指其数值只能用自然数或整数单位计算的,连续变量是指在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。对用户信息中的离散型变量做热编码处理使得离散型变量转换为数据型,再根据用户信息对用户进行分组,得到多个用户分组,并记录下每个用户分组的簇中心,对于用户分组的方式可采用K-means、K-中心点等聚类算法进行分组,下面以K-means算法为例,首先可采用手肘法确定最佳聚类数K,从多个用户中任意选择K个用户作为初始聚类中心;而对于剩下的其它用户,则根据用户与这些初始聚类中心的相似度(距离),分别将它们分配给与其最相似的聚类,即每个聚类中心所代表的组;然后再计算每个所获新聚类的聚类中心,即该聚类中所有用户的均值;不断重复这一过程直到标准测度函数(一般可采用均方差作为标准测度函数)开始收敛为止。聚类相似度是利用各聚类中对象的均值所获得一个"中心对象"(引力中心)来进行计算的;其中,同一聚类中的用户之间相似度较高;而不同聚类中的对象相似度较小。用户分组完成后,计算每个用户分组的簇中心,对于已经完成分组的用户,基于这些完成分组的用户,我们可通过取组中所有向量的均值来重新计算簇中心,计算用户分组的簇中心,便于后续对用户分组做进一步的处理,当需要使用用户分组的簇中心时,可直接使用,不用重复计算。
在一实施例中,所述根据所述用户信息对多个所述用户进行分组,得到多个用户分组,计算每个所述用户分组的簇中心的步骤S1c之后,包括:
步骤S1d,检测是否有新用户加入;
步骤S1e,若有,获取所述新用户的用户信息,根据所述新用户的用户信息计算所述新用户与每个所述用户分组的簇中心的距离,根据所述距离将所述新用户分到距离最近的一个目标用户分组内,重新计算所述目标用户分组的簇中心。
在本实施例中,如上述步骤S1d所述,所述新用户为未进行用户分组的用户,对于已经完成分组的用户,每个用户有生成相应的簇标签,同一用户分组的用户的簇标签相同,可通过检测用户是否有簇标签来判断该用户是否进行用户分组。
如上述步骤S1e所述,当有新用户加入时,获取所述新用户的用户信息,根据所述新用户的用户信息计算所述新用户与每个用户分组的簇中心的距离,所述距离可为欧氏距离、马氏距离、曼哈顿距离、切比雪夫距离、闵式距离等其中一种或多种,根据所述距离将所述新用户分组到距离最近的一个目标用户分组内,当所述新用户分组完成后,重新计算该目标用户分组的簇中心,以便再次有新的用户加入时进行分组。本实施例中,当有新用户加入时,新的用户会依据已有用户分组的簇中心判断其所属用户分组,不需要将所有用户再次分组,在从一定程度上解决冷启动问题。当有新用户加入时,用户分组分发生一定程度的变化,从而影响到用户分组-教程分组感兴趣程度矩阵,进而用户隐含因子、教程隐含因子、用户组间效应与教程组间效应也会发生相应的变化,能更加准确和实时的对用户分组内的用户进行推荐。
在一实施例中,所述根据所述用户信息对多个所述用户进行分组,得到多个用户分组,计算每个所述用户分组的簇中心的步骤S1c之后,包括:
步骤S1d1,检测各个所述用户分组中用户的用户信息是否发生变化;
步骤S1d2,若所述用户的用户信息发生变化,根据变化的用户信息计算所述用户与每个用户分组的簇中心的距离,根据所述距离对用户信息发生变化的用户重新进行分组,若该用户不属于原用户分组,计算新的用户分组的簇中心。
本实施例中,如上述步骤S1d1所述,在检测所述用户的用户信息是否发生变化时,所述用户的用户信息任意一项发生变化即为所述用户的用户信息发生变化。
如上述步骤S1d2所述,当所述用户的用户信息发生变化时,根据所述变化形成的新的用户信息计算该用户与每个用户分组的簇中心的距离,根据所述距离将该用户重新分组,将用户信息发生变化的用户重新分组到与每个用户分组的簇中心的距离最小的那个用户分组,当该用户不属于原用户分组时,由于该用户的加入形成新的用户分组,重新计算重新分组而形成的新的分组的簇中心。本实施例中,随着用户信息的改变相应的会影响用户分组,相应的用户分组的簇中心也会发生变动,重新计算簇中心便于后续有新用户的加入或其他用户的用户信息发生改变而重新进行用户分组。本实施例中,当已经完成分组的用户的用户信息发生改变,用户信息发生改变的用户会依据已有用户分组的簇中心去判断其所属用户分组,不需要将所有用户再次分组,在从一定程度上解决冷启动问题。
在一实施例中,所述根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐的步骤之后,包括:
步骤S5,获取所述用户分组中对所推荐的患教教程分组中的患教教程进行操作的第一目标用户组成第一目标用户分组;所述操作包括浏览、收藏、转发、评论;将所述用户分组中剩余第二目标用户组成第二目标用户分组;
步骤S6,采用公式M=ak1+bk2+ck3+dk4计算所述第一目标用户对其所操作的患教教程的兴趣值;其中a为浏览,b为收藏、c为转发、d为评论,所述k1、k2、k3、k4为对应预设权重,k1+k2+k3+k4=1;
步骤S7,将各个所述第二目标用户与各个所述第一目标用户两两配对组成用户对,计算每个用户对的相似度;
步骤S8,分别确定与各个所述第二目标用户的相似度最高的所述第一目标用户,作为相似度用户,将所述相似度用户的兴趣值最高的患教教程推荐给与该相似度用户配对的第二目标用户。
本实施例中,如上述步骤S5所述,每个用户分组都有其所对应推荐的患教教程分组,每个用户分组中包括多个用户,多个用户中存在着未对患教教程进行操作的用户,将所有对患教教程进行操作的用户作为第一目标用户组成第一目标用户分组,所有未对患教教程进行操作的用户作为第二目标用户组成第二目标用户分组。
如上述步骤S6所述,根据第一目标用户的操作计算第一目标用户对其所操作的患教教程的兴趣值,所述兴趣值通过四个方面来计算,兴趣值越高,该第一目标用户对该患教教程越喜爱。
如上述步骤S7所述,将各个所述第二目标用户与各个所述第一目标用户两两配对组成用户对。当有5个第二目标用户,5个第一目标用户时,可组成25个用户对,计算每个用户对的相似度,具体的,可采用余弦相似度、欧氏距离、皮尔逊相关系数等计算每个用户对的相似度。
如上述步骤S8所述,分别确定与各个所述第二目标用户的相似度最高的所述第一目标用户,作为第二目标用户的相似度用户,根据相似度用户的兴趣值,将相似度用户兴趣值最高的患教教程推荐给与该相似度用户配对的第二目标用户。本实施例中,在一个用户分组中,将组内对患教教程进行过操作的用户作为第一目标用户,未进行操作的用户作为第二目标用户,计算第一目标用户对其所操作的各个患教教程的兴趣值,根据第一目标用户与各个第二目标用户相似度确定各个第二目标用户的相似度用户,将相似度用户兴趣值最高的患教教程推荐给对应的第二目标用户。对患教教程进行过操作,表明第一目标用户对该患教教程的内容是明知的,很大程度上表明第一目标用户对其的兴趣程度,按照上述方法将患教教程推荐给第二目标用户,很大程度上会受到第二目标用户的喜爱,更有利于对还未对患教教程进行操作的第二目标用户进行个性化推荐。
参照图2,本申请一实施例还提供一种患教教程推荐装置,包括:
第一获取单元10,用于获取用户分组、患教教程分组以及各个所述用户分组对各个所述患教教程分组的感兴趣程度;
提取单元20,用于根据所述感兴趣程度构建用户分组-教程分组感兴趣程度矩阵,采用组间效应模型分解所述用户分组-教程分组感兴趣程度矩阵,提取用户隐含因子、教程隐含因子、用户组间效应与教程组间效应;
第一计算单元30,用于根据所述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,根据r=(p+s)T(q+t)计算每个用户分组与各个所述患教教程分组的关联性,根据所述关联性对每个用户分组对应的所述患教教程分组进行排序;
第一推荐单元40,用于根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐。
在一实施例中,所述患教教程推荐装置还包括:
第二获取单元,用于获取多个患教教程,采用教程分类器对所述患教教程进行分类,得到多个患教教程分组;其中,所述教程分类器基于梯度提升树模型训练而成;
第三获取单元,用于获取多个用户的用户信息;其中,所述用户信息包括年龄、性别、职业、病情、感兴趣的教程主题、体检数据;
分组单元,用于根据所述用户信息对多个所述用户进行分组,得到多个用户分组,并计算每个所述用户分组的簇中心。
在一实施例中,所述患教教程推荐装置还包括:
第一检测单元,用于检测是否有新用户加入;
第二计算单元,用于若有,获取所述新用户的用户信息,根据所述新用户的用户信息计算所述新用户与每个所述用户分组的簇中心的距离,根据所述距离将所述新用户分到距离最近的一个目标用户分组内,重新计算所述目标用户分组的簇中心。
在一实施例中,所述患教教程推荐装置还包括:
第二检测单元,用于检测各个所述用户分组中用户的用户信息是否发生变化;
第三计算单元,用于若所述用户的用户信息发生变化,根据变化的用户信息计算所述用户与每个用户分组的簇中心的距离,根据所述距离对用户信息发生变化的用户重新进行分组,若该用户不属于原用户分组,计算新的用户分组的簇中心。
在一实施例中,所述患教教程推荐装置还包括:
第四获取单元,用于获取所述用户分组中对所推荐的患教教程分组中的患教教程进行操作的第一目标用户组成第一目标用户分组;所述操作包括浏览、收藏、转发、评论;将所述用户分组中剩余第二目标用户组成第二目标用户分组;
第四计算单元,用于采用公式M=ak1+bk2+ck3+dk4计算所述第一目标用户对其所操作的患教教程的兴趣值;其中a为浏览,b为收藏、c为转发、d为评论,所述k1、k2、k3、k4为对应预设权重,k1+k2+k3+k4=1;
第五计算单元,用于将各个所述第二目标用户与各个所述第一目标用户两两配对组成用户对,计算每个用户对的相似度;
第二推荐单元,用于分别确定与各个所述第二目标用户的相似度最高的所述第一目标用户,作为相似度用户,将所述相似度用户的兴趣值最高的患教教程推荐给与该相似度用户配对的第二目标用户。
在本实施例中,上述各个单元的具体实现请参照上述方法实施例中所述,在此不再进行赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户信息数据、患教教程数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述方法实施例中的患教教程推荐方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中的患教教程推荐方法。
综上所述,为本申请实施例中提供的患教教程推荐方法、装置、计算机设备和存储介质,包括:获取用户分组、患教教程分组以及各个所述用户分组对各个所述患教教程分组的感兴趣程度;根据所述感兴趣程度构建用户分组-教程分组感兴趣程度矩阵,采用组间效应模型分解所述用户分组-教程分组感兴趣程度矩阵,提取用户隐含因子、教程隐含因子、用户组间效应与教程组间效应;根据所述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,根据r=(p+s)T(q+t)计算每个用户分组与各个所述患教教程分组的关联性,根据所述关联性对每个用户分组对应的所述患教教程分组进行排序;其中,p为所述用户隐含因子,q为所述教程隐含因子,s为所述用户组间效应,t为所述教程组间效应;根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐,实现组对组的患教教程推荐。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种患教教程推荐方法,其特征在于,包括以下步骤:
获取用户分组、患教教程分组以及各个所述用户分组对各个所述患教教程分组的感兴趣程度;
根据所述感兴趣程度构建用户分组-教程分组感兴趣程度矩阵,采用组间效应模型分解所述用户分组-教程分组感兴趣程度矩阵,提取用户隐含因子、教程隐含因子、用户组间效应与教程组间效应;
根据所述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,根据r=(p+s)T(q+t)计算每个用户分组与各个所述患教教程分组的关联性,根据所述关联性对每个用户分组对应的所述患教教程分组进行排序;其中,p为所述用户隐含因子,q为所述教程隐含因子,s为所述用户组间效应,t为所述教程组间效应;
根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐。
2.根据权利要求1所述的患教教程推荐方法,其特征在于,所述获取用户分组,患教教程分组,各个用户分组对各个患教教程分组的感兴趣程度的步骤之前,还包括:
获取多个患教教程,采用教程分类器对所述患教教程进行分类,得到多个患教教程分组;其中,所述教程分类器基于梯度提升树模型训练而成;
获取多个用户的用户信息;其中,所述用户信息包括年龄、性别、职业、病情、感兴趣的教程主题、体检数据;
根据所述用户信息对多个所述用户进行分组,得到多个用户分组,并计算每个所述用户分组的簇中心。
3.根据权利要求2所述的患教教程推荐方法,其特征在于,所述根据所述用户信息对多个所述用户进行分组,得到多个用户分组,计算每个所述用户分组的簇中心的步骤之后,包括:
检测是否有新用户加入;
若有,获取所述新用户的用户信息,根据所述新用户的用户信息计算所述新用户与每个所述用户分组的簇中心的距离,根据所述距离将所述新用户分到距离最近的一个目标用户分组内,重新计算所述目标用户分组的簇中心。
4.根据权利要求2所述的患教教程推荐方法,其特征在于,所述根据所述用户信息对多个所述用户进行分组,得到多个用户分组,计算每个所述用户分组的簇中心的步骤之后,包括:
检测各个所述用户分组中用户的用户信息是否发生变化;
若所述用户的用户信息发生变化,根据变化的用户信息计算所述用户与每个用户分组的簇中心的距离,根据所述距离对用户信息发生变化的用户重新进行分组,若该用户不属于原用户分组,计算新的用户分组的簇中心。
5.根据权利要求1所述的患教教程推荐方法,其特征在于,所述根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐的步骤之后,包括:
获取所述用户分组中对所推荐的患教教程分组中的患教教程进行操作的第一目标用户组成第一目标用户分组;所述操作包括浏览、收藏、转发、评论;将所述用户分组中剩余第二目标用户组成第二目标用户分组;
采用公式M=ak1+bk2+ck3+dk4计算所述第一目标用户对其所操作的患教教程的兴趣值;其中a为浏览,b为收藏、c为转发、d为评论,所述k1、k2、k3、k4为对应预设权重,k1+k2+k3+k4=1;
将各个所述第二目标用户与各个所述第一目标用户两两配对组成用户对,计算每个用户对的相似度;
分别确定与各个所述第二目标用户的相似度最高的所述第一目标用户,作为相似度用户,将所述相似度用户的兴趣值最高的患教教程推荐给与该相似度用户配对的第二目标用户。
6.一种患教教程推荐装置,其特征在于,包括:
第一获取单元,用于获取用户分组、患教教程分组以及各个所述用户分组对各个所述患教教程分组的感兴趣程度;
提取单元,用于根据所述感兴趣程度构建用户分组-教程分组感兴趣程度矩阵,采用组间效应模型分解所述用户分组-教程分组感兴趣程度矩阵,提取用户隐含因子、教程隐含因子、用户组间效应与教程组间效应;
第一计算单元,用于根据所述用户隐含因子、教程隐含因子、用户组间效应与教程组间效应,根据r=(p+s)T(q+t)计算每个用户分组与各个所述患教教程分组的关联性,根据所述关联性对每个用户分组对应的所述患教教程分组进行排序;
第一推荐单元,用于根据所述排序,选择预设个数的患教教程分组对每个用户分组进行推荐。
7.根据权利要求6所述的患教教程推荐装置,其特征在于,所述患教教程推荐装置还包括:
第二获取单元,用于获取多个患教教程,采用教程分类器对所述患教教程进行分类,得到多个患教教程分组;其中,所述教程分类器基于梯度提升树模型训练而成;
第三获取单元,用于获取多个用户的用户信息;其中,所述用户信息包括年龄、性别、职业、病情、感兴趣的教程主题、体检数据;
分组单元,用于根据所述用户信息对多个所述用户进行分组,得到多个用户分组,并计算每个所述用户分组的簇中心。
8.根据权利要求7所述的患教教程推荐装置,其特征在于,所述患教教程推荐装置还包括:
第一检测单元,用于检测是否有新用户加入;
第二计算单元,用于若有,获取所述新用户的用户信息,根据所述用户信息计算所述新用户与每个所述用户分组的簇中心的距离,根据所述距离将所述新用户分到距离最近的一个目标用户分组内,重新计算所述目标用户分组的簇中心。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN202010652661.8A 2020-07-08 2020-07-08 患教教程推荐方法、装置、计算机设备和存储介质 Active CN111816276B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010652661.8A CN111816276B (zh) 2020-07-08 2020-07-08 患教教程推荐方法、装置、计算机设备和存储介质
PCT/CN2020/118944 WO2021139275A1 (zh) 2020-07-08 2020-09-29 患教教程推荐方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010652661.8A CN111816276B (zh) 2020-07-08 2020-07-08 患教教程推荐方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111816276A true CN111816276A (zh) 2020-10-23
CN111816276B CN111816276B (zh) 2022-07-15

Family

ID=72842622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010652661.8A Active CN111816276B (zh) 2020-07-08 2020-07-08 患教教程推荐方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN111816276B (zh)
WO (1) WO2021139275A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113420261B (zh) * 2021-08-23 2021-11-09 平安科技(深圳)有限公司 基于归因分析的课程推荐方法、装置、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060282304A1 (en) * 2005-05-02 2006-12-14 Cnet Networks, Inc. System and method for an electronic product advisor
CN105868317A (zh) * 2016-03-25 2016-08-17 华中师范大学 一种数字教育资源推荐方法及系统
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN108897887A (zh) * 2018-07-10 2018-11-27 华南师范大学 一种基于知识图谱和用户相似度的教学资源推荐方法
CN109670087A (zh) * 2018-11-28 2019-04-23 平安科技(深圳)有限公司 课程智能推荐方法、装置、计算机设备和存储介质
CN111061946A (zh) * 2019-11-15 2020-04-24 汉海信息技术(上海)有限公司 场景化内容推荐方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130218907A1 (en) * 2012-02-21 2013-08-22 Microsoft Corporation Recommender system
CN104966125B (zh) * 2015-05-06 2018-07-24 同济大学 一种社交网络的物品评分及推荐方法
CN110610392A (zh) * 2018-06-14 2019-12-24 北京京东尚科信息技术有限公司 数据处理方法及系统、计算机系统和计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060282304A1 (en) * 2005-05-02 2006-12-14 Cnet Networks, Inc. System and method for an electronic product advisor
CN105868317A (zh) * 2016-03-25 2016-08-17 华中师范大学 一种数字教育资源推荐方法及系统
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN108897887A (zh) * 2018-07-10 2018-11-27 华南师范大学 一种基于知识图谱和用户相似度的教学资源推荐方法
CN109670087A (zh) * 2018-11-28 2019-04-23 平安科技(深圳)有限公司 课程智能推荐方法、装置、计算机设备和存储介质
CN111061946A (zh) * 2019-11-15 2020-04-24 汉海信息技术(上海)有限公司 场景化内容推荐方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姚敦红等: "三维有偏权值张量分解在授课推荐上的应用研究", 《电子科技大学学报》 *
李澎林等: "基于兴趣度与类型因子的高校图书推荐算法", 《浙江工业大学学报》 *

Also Published As

Publication number Publication date
WO2021139275A1 (zh) 2021-07-15
CN111816276B (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
CN111414393B (zh) 一种基于医学知识图谱的语义相似病例检索方法及设备
CN111260448B (zh) 基于人工智能的药品推荐方法及相关设备
KR102525599B1 (ko) 스트레스 관련 콘텐츠 제공 장치 및 방법
EP2997514A1 (en) Context-aware prediction in medical systems
CN106528676B (zh) 基于人工智能的实体语义检索处理方法及装置
Mi et al. Bagging and deep learning in optimal individualized treatment rules
EP3443486A1 (en) Query optimizer for combined structured and unstructured data records
WO2021151295A1 (zh) 患者治疗方案的确定方法、装置、计算机设备及介质
CN114207604A (zh) 使用针对性问题回答来提取科学测量背景的系统和方法
Gao Stability analysis of rock slope based on an abstraction ant colony clustering algorithm
Zhao et al. Modeling patient visit using electronic medical records for cost profile estimation
CN111696656A (zh) 一种互联网医疗平台的医生评价方法、装置
CN113380360B (zh) 一种基于多模态病历图的相似病历检索方法及系统
CN111816276B (zh) 患教教程推荐方法、装置、计算机设备和存储介质
CN113345564B (zh) 一种基于图神经网络的患者住院时长早期预测方法及装置
Bagwari et al. Cbir-dss: Business decision oriented content-based recommendation model for e-commerce
CN116910270A (zh) 多模态心理知识图谱构建方法、装置、设备及存储介质
Foote et al. A computational analysis of social media scholarship
JP6696270B2 (ja) 情報提供サーバ装置、プログラム及び情報提供方法
CN111125486B (zh) 一种基于多特征的微博用户属性分析方法
CN114218378A (zh) 一种基于知识图谱的内容推送方法、装置、设备及介质
CN113704617A (zh) 物品推荐方法、系统、电子设备及存储介质
Ratnaningsih et al. Comparative analysis of classification methods in determining non-active student characteristics in Indonesia Open University
CN111291829A (zh) 一种精选图片的自动确定方法和系统
Chahar et al. Mental Health At Work Prediction Using Neural Networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant