CN113643817A - 考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统 - Google Patents
考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统 Download PDFInfo
- Publication number
- CN113643817A CN113643817A CN202110765452.9A CN202110765452A CN113643817A CN 113643817 A CN113643817 A CN 113643817A CN 202110765452 A CN202110765452 A CN 202110765452A CN 113643817 A CN113643817 A CN 113643817A
- Authority
- CN
- China
- Prior art keywords
- case
- user
- similarity
- sim
- interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 133
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000007246 mechanism Effects 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 73
- 238000004364 calculation method Methods 0.000 claims description 49
- 238000000605 extraction Methods 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 238000012417 linear regression Methods 0.000 claims description 7
- 238000012482 interaction analysis Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 abstract description 28
- 238000013528 artificial neural network Methods 0.000 abstract description 9
- 238000001914 filtration Methods 0.000 abstract description 6
- 230000006399 behavior Effects 0.000 description 46
- 230000008569 process Effects 0.000 description 16
- 239000013598 vector Substances 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/604—Tools and structures for managing or administering access control systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2141—Access rights, e.g. capability lists, access control lists, access tables, access matrices
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Security & Cryptography (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Biomedical Technology (AREA)
- Public Health (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Automation & Control Theory (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Pathology (AREA)
- Molecular Biology (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统,涉及医疗数据处理技术领域。本发明通过对用户浏览案例的历史行为数据进行收集和预处理以及加密处理,然后采用相似度计算算法和融合了注意力机制的多层神经网络融合的协同过滤算法分别对显、隐性反馈数据进行处理,并利用差分隐私保护模型对数据处理结果进行加密,最后基于显、隐性反馈数据的处理结果,结合人机交互行为确定适合用户的个性化精准案例推荐列表。本技术方案在为用户精准推荐个性化案例的同时保护了用户和患者的个人隐私,综合性能优越。
Description
技术领域
本发明涉及医疗数据处理技术领域,具体涉及一种考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统。
背景技术
互联网的快速发展,产生了大量的数据和信息,人们也愈来愈依赖这些数据和信息。而大多数网络应用正是基于各种推荐系统与算法向人们推荐相关信息以满足不同用户的需求。例如在医疗健康领域,可基于人体的生理数据和病情特征,利用案例知识推荐系统从案例知识库中匹配出合适的治疗案例向该个体推荐,并参照该案例对个体进行治疗。
目前,在医疗健康领域,推荐算法的研究与应用主要面向的是患者,与医护人员关系较弱。一方面,在为医护人员推荐案例时,由于医护人员层次、能力参差不齐,偏好不同,以及缺乏必要的人机交互,导致现有技术无法为医护人员提供个性化案例知识推荐服务,存在精度不高、用户满意度低等问题;另一方面,案例推荐技术为了确保其推荐结果的准确性会向医生用户和患者收集各种数据信息,这些数据信息如果无法妥善保管,将存在隐私泄露的风险。
由此可见,现有技术中的医疗案例知识推荐技术无法在为医生用户精准推荐个性化案例的同时保护个人隐私。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统,解决了现有医疗案例知识推荐技术存在无法在为医生用户精准推荐个性化案例的同时保护个人隐私的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本发明首先提出了一种考虑隐性反馈和人机交互的医疗案例知识推荐方法,所述方法包括:
获取用户浏览案例的历史行为数据并进行预处理和加密处理;所述历史行为数据包括显性反馈数据和隐性反馈数据;
基于所述显性反馈数据获取用户的案例评分矩阵和不同案例间的相似度,基于所述隐性反馈数据利用融合了注意力机制的GMF和MLP的混合推荐模型获取用户-案例交互矩阵,以及对所述用户-案例交互矩阵和案例数据进行加密;
基于所述相似度、用户的案例评分矩阵,以及所述用户-案例交互矩阵获取初步推荐列表;
基于所述初步推荐列表,结合用户交互行为获取最终推荐列表。
优选的,所述方法还包括:在获取案例推荐列表时对用户身份和权限进行识别认证。
优选的,所述对所述用户-案例交互矩阵和案例数据进行加密包括:
采用基于随机响应的差分隐私保护模型对所述用户-案例交互矩阵进行保护。
优选的,所述获取不同案例间的相似度,包括:利用修正余弦相似度和皮尔森相似度分别计算不同案例间的相似度,再根据一定权重对两种相似度计算结果进行拟合获得最终的相似度,其中,
皮尔森相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
修正余弦相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
对皮尔森相似度和修正余弦相似度计算结果进行拟合可以计算不同案例间最终的相似度Simk(i,j),用公式表示如下:
Simk(i,j)=f(Simr(i,j),Simc(i,j))
其中,Simr(i,j)为案例i和案例j的皮尔森相似度;Simc(i,j)为案例i和案例j的修正余弦相似度。
优选的,所述方法还包括:在对皮尔森相似度和修正余弦相似度计算结果进行拟合之前,利用spss进行交互分析获得交互系数,然后根据交互系数的值确定拟合方式,
若交互系数大于0.05,使用一般线性回归方程对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)
其中,a0,a1,a2为常数;
若交互系数小于0.05,加入交互系数对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)+a3(Simr(i.j)Simc(i,j))
其中,a0,a1,a2为常数,a3为交互系数。
第二方面,本发明还提出了一种考虑隐性反馈和人机交互的医疗案例知识推荐系统,所述系统包括:
数据获取与预处理模块,用于获取用户浏览案例的历史行为数据并进行预处理和加密处理;所述历史行为数据包括显性反馈数据和隐性反馈数据;
数据特征提取与加密模块,用于基于所述显性反馈数据获取用户的案例评分矩阵和不同案例间的相似度,基于所述隐性反馈数据利用融合了注意力机制的GMF和MLP的混合推荐模型获取用户-案例交互矩阵,以及对所述用户-案例交互矩阵和案例数据进行加密;
初步推荐列表获取模块,用于基于所述相似度、用户的案例评分矩阵,以及所述用户-案例交互矩阵获取初步推荐列表;
最终推荐列表获取模块,用于基于所述初步推荐列表,结合用户交互行为获取最终推荐列表。
优选的,所述系统还包括:身份权限识别认证模块,用于在获取案例推荐列表时对用户身份和权限进行识别认证。
优选的,所述数据特征提取与加密模块对所述用户-案例交互矩阵和案例数据进行加密包括:
采用基于随机响应的差分隐私保护模型对所述用户-案例交互矩阵进行保护。
优选的,所述数据特征提取与加密模块中获取不同案例间的相似度,包括:利用修正余弦相似度和皮尔森相似度分别计算不同案例间的相似度,再根据一定权重对两种相似度计算结果进行拟合获得最终的相似度,其中
皮尔森相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
修正余弦相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
对皮尔森相似度和修正余弦相似度计算结果进行拟合可以计算不同案例间最终的相似度Simk(i,j),用公式表示如下:
Simk(i,j)=f(Simr(i,j),Simc(i,j))
其中,Simr(i,j)为案例i和案例j的皮尔森相似度;Simc(i,j)为案例i和案例j的修正余弦相似度。
优选的,所述数据特征提取与加密模块还包括:在对皮尔森相似度和修正余弦相似度计算结果进行拟合之前,利用spss进行交互分析获得交互系数,然后根据交互系数的值确定拟合方式,
若交互系数大于0.05,使用一般线性回归方程对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)
其中,a0,a1,a2为常数;
若交互系数小于0.05,加入交互系数对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)+a3(Simr(i.j)Simc(i,j))
其中,a0,a1,a2为常数,a3为交互系数。
(三)有益效果
本发明提供了一种考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统。与现有技术相比,具备以下有益效果:
1、本技术方案获取用户浏览案例的历史行为数据,包括显性反馈数据和隐性反馈数据,并对这些数据进行预处理和和加密处理,然后提取显、隐性反馈数据的特征以分别获得用户的案例评分矩阵和不同案例间的相似度,以及用户-案例交互矩阵,并对隐性数据特征的提取结果再次进行加密,然后基于相似度、用户的案例评分矩阵以及用户-案例交互矩阵获取初步推荐列表,再结合用户交互行为获取最终推荐列表。本技术方案在为医生用户推荐案例时,考虑了显、隐性反馈数据对于推荐结果准确性的影响,并采用相似度计算算法和多层神经网络融合的协同过滤算法分别对显隐性反馈数据进行处理,同时在后期案例推荐列表的生成过程中,加强了人机交互操作,将医生用户阅读案例时的感受与决策考虑进来,从而使推荐结果更加精准、灵活,满足了医生用户的个性化的需求;
2、本技术方案中利用融合了注意力机制的GMF和MLP的混合推荐模型对获取的隐性反馈型数据进行处理以获取用户-案例交互矩阵时,一方面,根据现实情况将医生用户关注案例的隐性行为细分为5种,另一方面,在GMF和MLP混合推荐模型中融合注意力层并改进相应的损失函数,这样可以考虑真实的医院案例推荐过程所产生的用户与案例的真实交互行为,并可以根据特征的重要程度自动为各个特征分配权重,使得最终的案例推荐结果更加准确;
3、本技术方案通过设置用户身份认证程序对预获取推荐列表的医生用户的身份进行识别和认证,采用DES算法和RSA算法的加密算法对案例中包含患者隐私的数据进行加密,以及采用基于随机响应的差分隐私保护模型对隐性反馈数据的特征提取结果进行加密,不仅保护了医生用户的个人隐私,也确保了案例推荐模型的个性化和专属性,同时还保护了患者的个人隐私。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中考虑隐性反馈和人机交互的医疗案例知识推荐方法的总体流程图;
图2为本发明实施例中对显性反馈型数据处理的流程图;
图3为本发明实施例中对隐性反馈数据进行处理的过程图;
图4为本发明实施例中为医生用户线上推荐案例的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统,解决了现有医疗案例知识推荐技术存在无法在为医生用户精准推荐个性化案例的同时保护个人隐私的问题,实现在为医生推荐案例时保护了医生用户和患者隐私的目的。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本技术方案通过对用户浏览案例的历史行为数据(包括显性反馈数据和隐性反馈数据)进行收集和预处理以及加密处理,然后采用相似度计算算法和融入了注意力机制的多层神经网络融合的协同过滤算法分别对显、隐性反馈数据进行处理,并利用差分隐私保护模型对数据处理结果进行加密,然后基于显、隐性反馈数据的处理结果,结合人机交互行为确定适合用户的个性化精准案例推荐列表。并且,在进行案例推荐的过程中,设置用户的身份认证,以保证用户的个性化案例推荐模型不被其它用户随意更改,再次加强了对医生用户的隐私性保护。本技术方案在为用户精准推荐个性化案例的同时保护了用户和患者的个人隐私,综合性能优越。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例1:
第一方面,参见图1,本发明首先提出了一种考虑隐性反馈和人机交互的医疗案例知识推荐方法,所述方法包括:
S1、获取用户浏览案例的历史行为数据并进行预处理和加密处理;所述历史行为数据包括显性反馈数据和隐性反馈数据;
S2、基于所述显性反馈数据获取用户的案例评分矩阵和不同案例间的相似度,基于所述隐性反馈数据利用融合了注意力机制的GMF和MLP的混合推荐模型获取用户-案例交互矩阵,以及对所述用户-案例交互矩阵和案例数据进行加密;
S3、基于所述相似度、用户的案例评分矩阵,以及所述用户-案例交互矩阵获取初步推荐列表;
S4、基于所述初步推荐列表,结合用户交互行为获取最终推荐列表。
可见,本技术方案获取用户浏览案例的历史行为数据,包括显性反馈数据和隐性反馈数据,并对这些数据进行预处理和和加密处理,然后提取显、隐性反馈数据的特征以分别获得用户的案例评分矩阵和不同案例间的相似度,以及用户-案例交互矩阵,并对隐性数据特征的提取结果再次进行加密,然后基于相似度、用户的案例评分矩阵以及用户-案例交互矩阵获取初步推荐列表,再结合用户交互行为获取最终推荐列表。本技术方案在为医生用户推荐案例时,考虑了显、隐性反馈数据对于推荐结果准确性的影响,并采用相似度计算算法和多层神经网络融合的协同过滤算法分别对显隐性反馈数据进行处理,同时在后期案例推荐列表的生成过程中,加强了人机交互操作,将医生用户阅读案例时的感受与决策考虑进来,从而使推荐结果更加精准、灵活,满足了医生用户的个性化的需求;本技术方案中利用融合了注意力机制的GMF和MLP的混合推荐模型对获取的隐性反馈型数据进行处理以获取用户-案例交互矩阵时,一方面,根据现实情况将医生用户关注案例的隐性行为细分为5种,另一方面,在GMF和MLP混合推荐模型中融合注意力层并改进相应的损失函数,这样可以考虑真实的医院案例推荐过程所产生的用户与案例的真实交互行为,并可以根据特征的重要程度自动为各个特征分配权重,使得最终的案例推荐结果更加准确;本技术方案通过设置用户身份认证程序对预获取推荐列表的医生用户的身份进行识别和认证,采用DES算法和RSA算法的加密算法对案例中包含患者隐私的数据进行加密,以及采用基于随机响应的差分隐私保护模型对隐性反馈数据的特征提取结果进行加密,不仅保护了医生用户的个人隐私,也确保了案例推荐模型的个性化和专属性,同时还保护了患者的个人隐私。
在本发明实施例中,为了对医生用户的个性化案例推荐模型进行保护,一种较佳的处理方式是,在实现考虑隐性反馈和人机交互的医疗案例知识推荐方法时,所述方法还包括:在获取案例推荐列表时对用户身份和权限进行识别认证。
其次,为了进一步增强对医生用户的个性化案例推荐模型进行保护,一种较佳的处理方式是,所述对所述用户-案例交互矩阵和案例数据进行加密包括:
采用基于随机响应的差分隐私保护模型对所述用户-案例交互矩阵进行保护。
实际中,为了更准确地获得用户浏览的不同案例之间的相似度,一种较佳的处理方式是,所述获取不同案例间的相似度时,包括:利用修正余弦相似度和皮尔森相似度分别计算不同案例间的相似度,再根据一定权重对两种相似度计算结果进行拟合获得最终的相似度,其中,
皮尔森相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
修正余弦相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
对皮尔森相似度和修正余弦相似度计算结果进行拟合可以计算不同案例间最终的相似度Simk(i,j),用公式表示如下:
Simk(i,j)=f(Simr(i,j),Simc(i,j))
其中,Simr(i,j)为案例i和案例j的皮尔森相似度;Simc(i,j)为案例i和案例j的修正余弦相似度。
进一步的,为了基于皮尔森相似度和修正余弦相似度获得最终的不同案例间的相似度,一种较佳的处理方式是,所述方法还包括:在对皮尔森相似度和修正余弦相似度计算结果进行拟合之前,利用spss进行交互分析获得交互系数,然后根据交互系数的值确定拟合方式,
若交互系数大于0.05,使用一般线性回归方程对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)
其中,a0,a1,a2为常数;
若交互系数小于0.05,加入交互系数对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)+a3(Simr(i.j)Simc(i,j))
其中,a0,a1,a2为常数,a3为交互系数。
下面结合对S1-S4每一步骤的具体解释,来详细说明本发明一个实施例的实现过程。
S1、获取医生用户浏览案例的各项历史行为数据并进行预处理以及加密处理;所述历史行为数据包括显性反馈数据和隐性反馈数据。
用户(主要是医生用户)对个体医疗健康案例进行浏览时,会产生大量浏览案例的历史行为数据,这些历史行为数据可分为显性反馈数据和隐性反馈数据。显性反馈型数据指表达含义明确,可直接反映出用户对于产品的喜好的数据,比如,用户对案例的打分、标记等行为均可作为显性反馈数据;隐性反馈型数据指用户间接反映出来的对于产品的喜好,此处指用户对所浏览案例的浏览行为,比如浏览、评价等。
通过网络抓取等形式可以获得大量用户浏览的历史行为数据,然后对这些历史行为数据进行预处理,预处理的过程包括:
读取用户的历史行为数据及案例评分结果。
对数据的缺失值、异常值以及重复记录进行处理。
将连续变量进行归一化处理。且保留每位医生浏览的数据不少于30条,每条数据记录时应包括医生ID、案例发布时间、案例的分数、浏览时间、浏览内容、浏览次数、同一条信息前后浏览时间间隔;
将离散数据进行向量化处理。对医生浏览数据序列使用One-Hot编码表示,即仅激活点击浏览的信息,然后记录每个用户相应的阅读时长,对用户浏览时长超过20秒以上,标记为1,小于20秒,则标记为0。参见表1和表2:
表1医生浏览信息统计表
案例1 | 案例2 | 案例3 | |
医生甲 | 1min | 30s | 15s |
医生乙 | 45s | 未查阅 | 70s |
按照独热编码,计算各案例的数值,得到该医生的向量。参见表2,表示医生甲和医生乙的词向量。
表2医生的向量
医生甲 | 1 | 1 | 0 |
医生乙 | 1 | 0 | 1 |
为了保护患者的隐私,采用DES算法和RSA算法对案例数据中包含患者秘密与隐私的相关数据进行加密。具体地:
将案例数据中包含患者秘密与隐私的个人信息(比如,患者的姓名)进行数据变形处理,而案例中其它信息不做加密处理,这样既保护了患者的个人隐私,又不影响案例的推荐价值。采用DES算法对数据集进行加密,并对DES算法用到的公钥实行RSA算法加密。将打包密文与加密后的公钥传输至用户,用户获取数据包后,对密钥密文实行RSA解密操作,得到能够解开DES算法加密时的私钥。其中,公钥负责加密保护诊疗后患者的个人诊疗记录。私钥负责解密,还原数据信息。个人私钥只能通过用户的指纹或者身份登陆获得。若其他用户想访问,需获得该医生的临时秘钥,同时医生可设置临时秘钥的有效时间及访问权限。
S2、基于所述显性反馈型数据获取用户的案例评分矩阵和不同案例间的相似度,基于所述隐性反馈型数据利用GMF和MLP的混合推荐模型获取用户-案例交互矩阵,以及对所述用户-案例交互矩阵和案例数据进行加密。
1)参见图2,为本发明实施例中对显性反馈型数据处理的流程图,对显性反馈型数据进行处理获取用户的案例评分矩阵和不同案例间的相似度,具体包括:
1.1)服务器通过跟踪不同医生的访问记录,根据医生对不同案例的打分情况,来获取医生的兴趣信息,并且设定评分原则,利用获取的兴趣信息建立每位医生的用户的案例评分矩阵。
根据用户的案例评分矩阵计算每个医生的平均评分、每个案例的评分用户数及每个案例的平均得分。每个医生的平均评分是指一个医生对于若干案例进行打分的分数的平均数;每个案例的评分用户数是指对于同一个案例进行打分的所有医生的人数;每个案例的平均得分是指所有医生对于同一个案例进行评分时所得到的平均数。
根据评分信息和计算结果确定共同评价用户数矩阵,以用于记录任意两个案例都有评分的共同用户数。
1.2)计算任意两个案例间的相似度。具体地,在计算相似度时,利用余弦相似度和皮尔森相似度分别进行计算,再根据一定权重对两种相似度计算结果进行匹配,从而获得最终的相似度。
皮尔森相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
修正余弦相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
利用皮尔森相似度和修正余弦相似度公式,可以计算基于显性反馈的相似度Simk(i,j),计算公式如下:
Simk(i,j)=f(Simr(i,j),Simc(i,j))
其中,Simr(i,j)为案例i和案例j的皮尔森相似度;Simc(i,j)为案例i和案例j的修正余弦相似度。
为了判断两个相似度之间是否存在调节效应,并根据是否存在调节效应来灵活选择不同回归方程进行相似度拟合,以使得最终的相似度拟合结果更加准确,在用f函数拟合相似度前先用spss进行交互分析,考虑两个相似度的交互作用,计算交互系数值。若交互系数大于0.05,则说明两相似度交互显著水平不明显,使用一般线性回归方程进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)
其中,a0,a1,a2为常数。
若交互系数小于0.05,则说明两相似度存在调节效应,加入交互系数进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)+a3(Simr(i.j)Simc(i,j))
其中,a0,a1,a2为常数,a3为交互系数。
通过对任意两个案例间的余弦相似度和皮尔森相似度分别进行计算,并对两个相似度按照实际情况分配权重,最终获得任意两个案例间的相似度并进行存储。
2)参见图3,对获取的隐性反馈数据利用融合了注意力机制的GMF和MLP的混合推荐模型进行处理以获取用户-案例交互矩阵时,建立个性化推荐算法模型对隐性反馈型数据进行处理,而NCF是在隐性反馈型数据基础上提出的基于神经网络的协同过滤的通用框架,从数据中学习交互函数,用来模拟用户和项目的潜在特征。
2.1)训练集的生成。训练集由正样本和负样本组成,并且每个正样本pos(yui)对应5个负样本。正样本为所有的有交互数据(u,i),对于每个正样本(u,i)生成5个负样本,具体的:
… … …
2.2)利用NCF通用框架将用户从隐性反馈型数据得到的用户-案例交互矩阵Y定义为:
yui=[yui1,yui2,yui3,yui4,yui5]T
其中,yui表示用户u-案例i交互矩阵Y中的元素,yuij值为1表示用户U与案例i存在某种交互行为;yuij值为0表示用户U与案例i不存在某种交互行为。用户U与案例i的交互行为具体为用户对案例的浏览行为,对案例的评论行为,对案例的转发行为,对案例的收藏行为,对案例表现出的不喜欢行为。具体地:
(yui1,yui2,yui3,yui4,yui5)=(浏览,评论,转发,收藏,不喜欢)
2.3)对隐性反馈数据的处理包括以下过程:
2.3.1)输入层。假设用户数为M,案例数为N,用户User(u)和案例Item(i)均被one-hot编码转化成稀疏向量。
例如:第i个用户的向量useri=[0,0,…,0,1,0,…,0],useri维度为1*M,useri[i]=1,useri[j]=0(i≠j);
第i个案例的向量itemi=[0,0,…,0,1,0,…,0],itemi维度为1*N,itemi[i]=1,itemi[j]=0(i≠j)。
2.3.2)嵌入层。把useri向量和itemi向量分别嵌入到一个较小维数的空间。具体的:令GMF,MLP的嵌入矩阵分别为:(PG,QG),(PM,QM),其中:
2.3.3)①GMF层
其中:relu(x)=max(0,x)
2.3.4)注意力层。将注意力机制引入到神经网络中,识别对预测结果有重要贡献的关键特征,并对其赋予较高的权重,相应的,不重要的特征赋予较低的权重,具体的,注意力层为:
2.3.5)输出层:
2.3.6)损失函数的计算:
2.4)为了保护医生用户个性化推荐模型的隐私,采用基于随机响应的差分隐私保护模型对医生用户个性化推荐模型进行加密保护。
将上述模型输出层输出的对于隐性反馈型数据的处理结果(即最终的用户-案例交互矩阵,也即医生用户的个性化推荐模型)采用基于随机响应的差分隐私保护模型进行保护,从而达到保护医生用户个性化推荐模型的目的。加入随机化模块,将差分隐私加入神经网络中,具体步骤如下:
将输出值转化合并为二进制字符串,并进行标准化;
对m个二进制字符串分别进行随机化,会产生m*ε隐私损失。在随机响应中,相邻输入的差为d,则灵敏度为d。对二进制字符串进行随机化,隐私损失为输入值ε。
其中,二进制字符串的长度L=(p+q+1),p代表整数部分的二进制位数,q代表小数部分的二进制位数,因此合并后的二进制字符串长度为L*s,s为卷积层输出的数目。两个连续输入的差别最多为L*s,因此,灵敏度为L*s,随机化概率为:
2.5)通过将上述借助GMF模型和MLP模型最后一层隐层进行拼接和组合,获取两模型对于隐性反馈型数据的处理结果,即获得最终的用户-案例交互矩阵,用以表示用户的偏好与习惯的个性化矩阵,并将该结果储存起来。
S3、基于所述相似度、所述用户的案例评分矩阵,以及所述用户-案例交互矩阵获取初步推荐列表。
参见图4,在向用户推送初步推荐列表时,包括以下过程:
针对每个案例,依据上述得到的相似度,由高到低排序,在得到的排序序列中选择相似度大于阈值的m个案例构成最近案例集,实现对案例的质量控制。其中阈值的默认值可根据医生长期阅读习惯个性化、动态化人为设定,并可根据实际情况进行手动更改。如果最终相似度大于阈值的案例数超过m个时,则由高至低选择m个。当向目标用户推荐案例时,首先依据上述得出的用户的案例评分矩阵,得到该用户已评分的案例与未评分的案例,对于已评分案例,如果分数高于k值(K值的默认值为人为设定,根据医生长期阅读习惯个性化动态变化,也可手动更改)且属于最近案例集,可以优先推荐此案例。通过以往的评分记录,计算出案例的最终得分,再综合不同案例的相似度得到每篇案例的的等级,可以细分为A级、B级,以及C级。其中,A级表示相似度高且案例评分高,值得所有用户群体阅读的案例;B级表示相似度高但案例评分低或者相似度低但案例评分高,值得某一特定用户群体阅读的案例;C级表示相似度低且案例评分低,不会自动推荐但用户可自行查阅的案例。
经过对案例的等级划分,再结合上述建立的GMF和MLP模型,得到的医生诊断的偏好习惯,综合相似度计算结果与神经网络深度学习结果,得到初步推荐列表。例如,在获取初步推荐列表时,用户可根据自己的需求,先得到相似案例检索,然后基于已有个性化推荐模型,筛选出符合自己个性化要求的案例。
S4、基于所述初步推荐列表,结合用户交互行为获取最终推荐列表。
参见图4,基于初步推荐列表结合医生用户的交互行为得到最终推荐列表。医生用户的几种交互行为和方式包括:
1)医生用户主动对初步推荐列表进行筛选。采集医生用户主动干预初步推荐列表的相关信息,比如:对初步推荐列表中不需要的案例进行剔除、筛选、排序,主动的回复对初步列表中案例的评论(主动回复了评论表示医生用户对这个案例有兴趣,初步推荐列表中会进行优先级的调整等;
2)识别并处理医生用户实时问诊时的语音、手势以及图像等多模态信息,根据这些交互信息对初步推荐列表进行调整。实时传输处理医生用户得到案例初步推荐列表服务后的感受和反馈的信息,节省处理大量病例信息以及问诊时手动操作的时间和精力,语音可以是对案例的检索或评价;手势可以是医生用户反馈对案例的满意程度和捕捉问诊时的偏好习惯;图像可以是医生实时上传分享的案例照片等。比如,语音由麦克风通过语音识别技术,提取关键词,获得医生用户和患者对案例的评价,然后基于这些评价对初步推荐列表进行调整;通过毫米波雷达技术采集用户正在进行的对案例满意程度进行的反馈动作,从而可以实现特定的指令对初步推荐列表进行调整;采用图像识别技术,识别医生实时上传的案例照片和图像,并对质量不佳的图像进行增强与重建,改善图像质量,进而干预初步推荐列表。
结合上述收集到的交互信息,可对初步推荐列表进行二次更新,得到具有医生偏好和行为习惯的个性化的最终推荐列表。
另外,由于每个医生用户都有自己的个人习惯偏好,而根据自己的个人习惯偏好获取的案例推荐列表才是最适合用户本身的。所以为了保证医生用户的案例推荐列表的专属性和隐私性,本实施例考虑隐性反馈和人机交互的医疗案例知识推荐方法还包括:
S5、在获取案例推荐列表时对用户身份和权限进行识别认证。
设置用户身份权限识别步骤,当医生用户再次问诊时,该医生用户只有通过了身份认证才能获取案例推荐列表,这样可以保证每个医生用户的案例推荐模型不会因为其他医生用户的随意数据输入而被篡改,案例推荐列表也不会随意被给医生用户意外的他人查看,加强了对医生用户个性化案例推荐模型以及个性化案例推荐列表的专属性、准确性以及隐私性的保护。具体的,身份权限识别步骤包括但不限于密码登录、指纹识别、面部识别、虹膜识别。例如,采用指纹识别对用户身份权限进行认证时,医生用户录入自己的指纹,即可获得符合本人个性化需要的推荐列表。
实施例2:
第二方面,本发明还提出了一种考虑隐性反馈和人机交互的医疗案例知识推荐系统,所述系统包括:
数据获取与预处理模块,用于获取用户浏览案例的历史行为数据并进行预处理和加密处理;所述历史行为数据包括显性反馈数据和隐性反馈数据;
数据特征提取与加密模块,用于基于所述显性反馈数据获取用户的案例评分矩阵和不同案例间的相似度,基于所述隐性反馈数据利用融合了注意力机制的GMF和MLP的混合推荐模型获取用户-案例交互矩阵,以及对所述用户-案例交互矩阵和案例数据进行加密;
初步推荐列表获取模块,用于基于所述相似度、用户的案例评分矩阵,以及所述用户-案例交互矩阵获取初步推荐列表;
最终推荐列表获取模块,用于基于所述初步推荐列表,结合用户交互行为获取最终推荐列表。
进一步的,所述系统还包括:身份权限识别认证模块,用于在获取案例推荐列表时对用户身份和权限进行识别认证。
进一步的,所述数据特征提取与加密模块对所述用户-案例交互矩阵和案例数据进行加密包括:
采用基于随机响应的差分隐私保护模型对所述用户-案例交互矩阵进行保护。
进一步的,所述数据特征提取与加密模块中获取不同案例间的相似度,包括:利用修正余弦相似度和皮尔森相似度分别计算不同案例间的相似度,再根据一定权重对两种相似度计算结果进行拟合获得最终的相似度,其中
皮尔森相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
修正余弦相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
对皮尔森相似度和修正余弦相似度计算结果进行拟合可以计算不同案例间最终的相似度Simk(i,j),用公式表示如下:
Simk(i,j)=f(Simr(i,j),Simc(i,j))
其中,Simr(i,j)为案例i和案例j的皮尔森相似度;Simc(i,j)为案例i和案例j的修正余弦相似度。
进一步的,所述数据特征提取与加密模块还包括:在对皮尔森相似度和修正余弦相似度计算结果进行拟合之前,利用spss进行交互分析获得交互系数,然后根据交互系数的值确定拟合方式,
若交互系数大于0.05,使用一般线性回归方程对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)
其中,a0,a1,a2为常数;
若交互系数小于0.05,加入交互系数对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)+a3(Simr(i.j)Simc(i,j))
其中,a0,a1,a2为常数,a3为交互系数。
可理解的是,本发明实施例提供的一种考虑隐性反馈和人机交互的医疗案例知识推荐系统与上述一种考虑隐性反馈和人机交互的医疗案例知识推荐方法相对应,其有关内容的解释、举例、有益效果等部分可以参考一种考虑隐性反馈和人机交互的医疗案例知识推荐方法中的相应内容,此处不再赘述
综上所述,与现有技术相比,具备以下有益效果:
1、本技术方案获取用户浏览案例的历史行为数据,包括显性反馈数据和隐性反馈数据,并对这些数据进行预处理和和加密处理,然后提取显、隐性反馈数据的特征以分别获得用户的案例评分矩阵和不同案例间的相似度,以及用户-案例交互矩阵,并对隐性数据特征的提取结果再次进行加密,然后基于相似度、用户的案例评分矩阵以及用户-案例交互矩阵获取初步推荐列表,再结合用户交互行为获取最终推荐列表。本技术方案在为医生用户推荐案例时,考虑了显、隐性反馈数据对于推荐结果准确性的影响,并采用相似度计算算法和多层神经网络融合的协同过滤算法分别对显隐性反馈数据进行处理,同时在后期案例推荐列表的生成过程中,加强了人机交互操作,将医生用户阅读案例时的感受与决策考虑进来,从而使推荐结果更加精准、灵活,满足了医生用户的个性化的需求;
2、本技术方案中利用融合了注意力机制的GMF和MLP的混合推荐模型对获取的隐性反馈型数据进行处理以获取用户-案例交互矩阵时,一方面,根据现实情况将医生用户关注案例的隐性行为细分为5种,另一方面,在GMF和MLP混合推荐模型中融合注意力层并改进相应的损失函数,这样可以考虑真实的医院案例推荐过程所产生的用户与案例的真实交互行为,并可以根据特征的重要程度自动为各个特征分配权重,使得最终的案例推荐结果更加准确;
3、本技术方案通过设置用户身份认证程序对预获取推荐列表的医生用户的身份进行识别和认证,采用DES算法和RSA算法的加密算法对案例中包含患者隐私的数据进行加密,以及采用基于随机响应的差分隐私保护模型对隐性反馈数据的特征提取结果进行加密,不仅保护了医生用户的个人隐私,也确保了案例推荐模型的个性化和专属性,同时还保护了患者的个人隐私。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种考虑隐性反馈和人机交互的医疗案例知识推荐方法,其特征在于,所述方法包括:
获取用户浏览案例的历史行为数据并进行预处理和加密处理;所述历史行为数据包括显性反馈数据和隐性反馈数据;
基于所述显性反馈数据获取用户的案例评分矩阵和不同案例间的相似度,基于所述隐性反馈数据利用融合了注意力机制的GMF和MLP的混合推荐模型获取用户-案例交互矩阵,以及对所述用户-案例交互矩阵和案例数据进行加密;
基于所述相似度、用户的案例评分矩阵,以及所述用户-案例交互矩阵获取初步推荐列表;
基于所述初步推荐列表,结合用户交互行为获取最终推荐列表。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:在获取案例推荐列表时对用户身份和权限进行识别认证。
3.如权利要求1所述的方法,其特征在于,所述对所述用户-案例交互矩阵和案例数据进行加密包括:
采用基于随机响应的差分隐私保护模型对所述用户-案例交互矩阵进行保护。
4.如权利要求1所述的方法,其特征在于,所述获取不同案例间的相似度,包括:利用修正余弦相似度和皮尔森相似度分别计算不同案例间的相似度,再根据一定权重对两种相似度计算结果进行拟合获得最终的相似度,其中,
皮尔森相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
修正余弦相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
对皮尔森相似度和修正余弦相似度计算结果进行拟合可以计算不同案例间最终的相似度Simk(i,j),用公式表示如下:
Simk(i,j)=f(Simr(i,j),Simc(i,j))
其中,Simr(i,j)为案例i和案例j的皮尔森相似度;Simc(i,j)为案例i和案例j的修正余弦相似度。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:在对皮尔森相似度和修正余弦相似度计算结果进行拟合之前,利用spss进行交互分析获得交互系数,然后根据交互系数的值确定拟合方式,
若交互系数大于0.05,使用一般线性回归方程对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)
其中,a0,a1,a2为常数;
若交互系数小于0.05,加入交互系数对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)+a3(Simr(i.j)Simc(i,j))
其中,a0,a1,a2为常数,a3为交互系数。
6.一种考虑隐性反馈和人机交互的医疗案例知识推荐系统,其特征在于,所述系统包括:
数据获取与预处理模块,用于获取用户浏览案例的历史行为数据并进行预处理和加密处理;所述历史行为数据包括显性反馈数据和隐性反馈数据;
数据特征提取与加密模块,用于基于所述显性反馈数据获取用户的案例评分矩阵和不同案例间的相似度,基于所述隐性反馈数据利用融合了注意力机制的GMF和MLP的混合推荐模型获取用户-案例交互矩阵,以及对所述用户-案例交互矩阵和案例数据进行加密;
初步推荐列表获取模块,用于基于所述相似度、用户的案例评分矩阵,以及所述用户-案例交互矩阵获取初步推荐列表;
最终推荐列表获取模块,用于基于所述初步推荐列表,结合用户交互行为获取最终推荐列表。
7.如权利要求6所述的系统,其特征在于,所述系统还包括:身份权限识别认证模块,用于在获取案例推荐列表时对用户身份和权限进行识别认证。
8.如权利要求6所述的系统,其特征在于,所述数据特征提取与加密模块对所述用户-案例交互矩阵和案例数据进行加密包括:
采用基于随机响应的差分隐私保护模型对所述用户-案例交互矩阵进行保护。
9.如权利要求6所述的系统,其特征在于,所述数据特征提取与加密模块中获取不同案例间的相似度,包括:利用修正余弦相似度和皮尔森相似度分别计算不同案例间的相似度,再根据一定权重对两种相似度计算结果进行拟合获得最终的相似度,其中
皮尔森相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
修正余弦相似度的计算公式如下:
其中,U表示对案例i和案例j都评分过的用户集合;
Ru,i表示用户U对案例i的评分;
Ru,j表示用户U对案例j的评分;
对皮尔森相似度和修正余弦相似度计算结果进行拟合可以计算不同案例间最终的相似度Simk(i,j),用公式表示如下:
Simk(i,j)=f(Simr(i,j),Simc(i,j))
其中,Simr(i,j)为案例i和案例j的皮尔森相似度;Simc(i,j)为案例i和案例j的修正余弦相似度。
10.如权利要求9所述的系统,其特征在于,所述数据特征提取与加密模块还包括:在对皮尔森相似度和修正余弦相似度计算结果进行拟合之前,利用spss进行交互分析获得交互系数,然后根据交互系数的值确定拟合方式,
若交互系数大于0.05,使用一般线性回归方程对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)
其中,a0,a1,a2为常数;
若交互系数小于0.05,加入交互系数对皮尔森相似度和修正余弦相似度计算结果进行拟合:
Simk(i,j)=a0+a1Simr(i,j)+a2Simc(i,j)+a3(Simr(i.j)Simc(i,j))
其中,a0,a1,a2为常数,a3为交互系数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021107145660 | 2021-06-25 | ||
CN202110714566 | 2021-06-25 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113643817A true CN113643817A (zh) | 2021-11-12 |
Family
ID=78416773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110765452.9A Pending CN113643817A (zh) | 2021-06-25 | 2021-07-06 | 考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113643817A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115345656A (zh) * | 2022-08-10 | 2022-11-15 | 江西省众灿互动科技股份有限公司 | 一种用于精细化营销的行为数据分析方法 |
CN116959657A (zh) * | 2023-09-18 | 2023-10-27 | 苏州绿华科技有限公司 | 一种医疗大数据安全管理系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745100A (zh) * | 2013-12-27 | 2014-04-23 | 浙江大学 | 一种基于项目的混合显性隐性反馈的协同过滤推荐算法 |
CN108647996A (zh) * | 2018-04-11 | 2018-10-12 | 中山大学 | 一种基于Spark的个性化推荐方法及系统 |
US20190362220A1 (en) * | 2018-05-25 | 2019-11-28 | Sap Se | Attentive neural collaborative filtering for modeling implicit feedback |
CN111127142A (zh) * | 2019-12-16 | 2020-05-08 | 东北大学秦皇岛分校 | 一种基于广义神经注意力的物品推荐方法 |
CN111582284A (zh) * | 2020-04-27 | 2020-08-25 | 中国科学院信息工程研究所 | 用于图像识别的隐私保护方法、装置和电子设备 |
CN112100642A (zh) * | 2020-11-13 | 2020-12-18 | 支付宝(杭州)信息技术有限公司 | 在分布式系统中保护隐私的模型训练方法及装置 |
CN112598462A (zh) * | 2020-12-19 | 2021-04-02 | 武汉大学 | 基于协同过滤和深度学习的个性化推荐方法及系统 |
-
2021
- 2021-07-06 CN CN202110765452.9A patent/CN113643817A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103745100A (zh) * | 2013-12-27 | 2014-04-23 | 浙江大学 | 一种基于项目的混合显性隐性反馈的协同过滤推荐算法 |
CN108647996A (zh) * | 2018-04-11 | 2018-10-12 | 中山大学 | 一种基于Spark的个性化推荐方法及系统 |
US20190362220A1 (en) * | 2018-05-25 | 2019-11-28 | Sap Se | Attentive neural collaborative filtering for modeling implicit feedback |
CN111127142A (zh) * | 2019-12-16 | 2020-05-08 | 东北大学秦皇岛分校 | 一种基于广义神经注意力的物品推荐方法 |
CN111582284A (zh) * | 2020-04-27 | 2020-08-25 | 中国科学院信息工程研究所 | 用于图像识别的隐私保护方法、装置和电子设备 |
CN112100642A (zh) * | 2020-11-13 | 2020-12-18 | 支付宝(杭州)信息技术有限公司 | 在分布式系统中保护隐私的模型训练方法及装置 |
CN112598462A (zh) * | 2020-12-19 | 2021-04-02 | 武汉大学 | 基于协同过滤和深度学习的个性化推荐方法及系统 |
Non-Patent Citations (2)
Title |
---|
YANLI GUO: "Recommended System: Attentive Neural Collaborative Filtering", 《DIGITAL OBJECT IDENTIFIER》, 1 July 2020 (2020-07-01) * |
张天龙;韩立新;: "基于全局与局部相融合的方面注意力推荐模型", 中国科技论文, no. 11, 15 November 2019 (2019-11-15) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115345656A (zh) * | 2022-08-10 | 2022-11-15 | 江西省众灿互动科技股份有限公司 | 一种用于精细化营销的行为数据分析方法 |
CN116959657A (zh) * | 2023-09-18 | 2023-10-27 | 苏州绿华科技有限公司 | 一种医疗大数据安全管理系统 |
CN116959657B (zh) * | 2023-09-18 | 2023-12-12 | 苏州绿华科技有限公司 | 一种医疗大数据安全管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bur et al. | Artificial intelligence for the otolaryngologist: a state of the art review | |
Pena et al. | Bias in multimodal AI: Testbed for fair automatic recruitment | |
McKee et al. | The second information revolution: digitalization brings opportunities and concerns for public health | |
Mohsin et al. | Real-time remote health monitoring systems using body sensor information and finger vein biometric verification: A multi-layer systematic review | |
Baig et al. | Security, privacy, and usability in continuous authentication: A survey | |
Hernández-Álvarez et al. | Privacy-preserving sensor-based continuous authentication and user profiling: a review | |
Psychoula et al. | A deep learning approach for privacy preservation in assisted living | |
US10937160B1 (en) | Dental images processed with artificial intelligence | |
JP2009513205A (ja) | 特に診断画像に使用する画像処理システム | |
CN113643817A (zh) | 考虑隐性反馈和人机交互的医疗案例知识推荐方法及系统 | |
Sudhinaraset et al. | Analysis of state-level immigrant policies and preterm births by race/ethnicity among women born in the US and women born outside the US | |
KR20210153878A (ko) | 건강 위험도 예측에 기반한 의료 콘텐츠 정보 서비스 제공장치 | |
Shopon et al. | Biometric system de-identification: Concepts, applications, and open problems | |
Rodriguez-Lozano et al. | Non-invasive forehead segmentation in thermographic imaging | |
O'Connell | My entire life is online: Informed consent, big data, and decolonial knowledge | |
KR20210153869A (ko) | 개인화된 건강검진 데이터 분석 기반 추천 영양소와 비추천 영양소 콘텐츠 정보 서비스 제공방법 | |
Howard | Investigating the relation of political orientation and vaccination outcomes: Identifying the roles of political ideology, party affiliation, and vaccine hesitancy | |
Flores et al. | Ethical considerations in the application of artificial intelligence to monitor social media for COVID-19 data | |
Manchaiah et al. | Online consumer reviews on hearing health care services: A textual analysis approach to examine psychologically meaningful language dimensions | |
Agrawal et al. | ElectroCardioGram (ECG)-based user authentication using deep learning algorithms | |
CN114743647A (zh) | 医疗数据处理方法、装置、设备及存储介质 | |
Ordun et al. | Intelligent sight and sound: a chronic cancer pain dataset | |
Vijayarajeswari et al. | An enhanced symptom clustering with profile based prescription suggestion in biomedical application | |
KR20210066251A (ko) | 입력 데이터 파싱 및 데이터베이스 처리를 지원하는 건강검진 데이터 처리 장치 | |
Brighi | The quality and veracity of digital data on health: from electronic health records to big data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |