CN117790003A - 一种问诊推荐方法、装置及计算机可读存储介质 - Google Patents
一种问诊推荐方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN117790003A CN117790003A CN202311824429.8A CN202311824429A CN117790003A CN 117790003 A CN117790003 A CN 117790003A CN 202311824429 A CN202311824429 A CN 202311824429A CN 117790003 A CN117790003 A CN 117790003A
- Authority
- CN
- China
- Prior art keywords
- recommendation
- user
- data
- consultation
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 230000007246 mechanism Effects 0.000 claims abstract description 60
- 230000036541 health Effects 0.000 claims description 54
- 238000012549 training Methods 0.000 claims description 41
- 238000004422 calculation algorithm Methods 0.000 claims description 39
- 230000015654 memory Effects 0.000 claims description 17
- 230000006399 behavior Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000008520 organization Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 239000008358 core component Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 239000000306 component Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种问诊推荐方法、装置及计算机可读存储介质,该方法包括:基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。该方法、装置及计算机可读存储介质能够解决现有技术中由于各个企业数据都是孤岛无法打通,导致无法利用各方数据为用户/患者提供精准的问诊推荐的问题。
Description
技术领域
本发明涉及医疗技术领域,尤其涉及一种问诊推荐方法、装置及计算机可读存储介质。
背景技术
随着医疗技术的不断发展,现在对患者进行精准问诊推荐的数据分布在各个公司的各个系统中,如:预约挂号平台的用户历史挂号、就诊、爽约数据,医生排班数据;医院HIS系统患者就诊、检验检查、处方、护理、手术等数据。目前,各个企业数据都是孤岛无法打通,同时如果一方把数据给到另外一方存在隐私泄漏的风险。因此,数据在各方存在扩展能力不足、管理难的问题,如何利用各方数据为用户/患者提供精准的问诊推荐也存在技术难度。
发明内容
本发明所要解决的技术问题是针对现有技术的上述不足,提供一种问诊推荐方法、装置及计算机可读存储介质,用以解决现有技术中由于各个企业数据都是孤岛无法打通,导致无法利用各方数据为用户/患者提供精准的问诊推荐的问题。
第一方面,本发明提供一种问诊推荐方法,应用于作为参与方的多个端/机构中的目标端/机构,所述方法包括:
基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;
接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;
基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。
进一步地,所述基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型,具体包括:
对本地健康医疗相关数据进行加密;
通过协调方将加密后的本地健康医疗相关数据与所述其他端/机构加密后的其他健康医疗相关数据实现加密数据ID匹配对齐;
将对齐后的健康医疗相关数据中的重叠样本作为训练数据训练本地问诊推荐模型;
将训练后的本地问诊推荐模型的模型参数上传到中心服务器,以使所述中心服务器基于联邦学习将接收到的多个端/机构的模型参数进行聚合,得到更新后的模型参数;
接收所述中心服务器发送的更新后的模型参数,并根据所述更新后的模型参数更新本地问诊推荐模型。
进一步地,所述对本地健康医疗相关数据进行加密之前,所述方法还包括:
获取所述本地健康医疗相关数据,所述本地健康医疗相关数据包括用户基本信息以及以下至少之一:通信行为、位置轨迹、线上行为、医疗健康行业标签、问诊业务数据、挂号业务数据。
进一步地,所述获取所述本地健康医疗相关数据之后,所述方法还包括:
对所述本地健康医疗相关数据进行预处理,所述预处理包括以下至少之一:数据特征清洗、缺失值填充、异常值处理、特征归一化。
进一步地,所述对本地健康医疗相关数据进行加密,具体包括:
采用隐私计算加密算法对所述本地健康医疗相关数据进行加密,其中,所述隐私计算加密算法为同态加密算法或RSA加密算法。
进一步地,所述基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,具体包括:
根据所述推荐请求向协调方发送推理信息,以使所述协调方将所述推理信息发送给所述多个端/机构中的至少一个端/机构,并接收所述至少一个端/机构基于自身本地问诊推荐模型返回的推理结果;
接收所述协调方合并所述推理结果后返回的所述问诊推荐信息;
输出所述问诊推荐信息。
进一步地,所述基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,具体包括:
将所述用户特征输入本地问诊推荐模型,得到所述问诊推荐信息。
第二方面,本发明提供一种问诊推荐装置,设置于作为参与方的多个端/机构中的目标端/机构,所述装置包括:
联合建模模块,用于基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;
请求接收模块,与所述联合建模模块连接,用于接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;
问诊推荐模块,与所述请求接收模块连接,用于基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。
第三方面,本发明提供一种问诊推荐装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现上述第一方面所述的问诊推荐方法。
第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的问诊推荐方法。
本发明提供的问诊推荐方法、装置及计算机可读存储介质。首先基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;然后接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;再基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。本发明在保护用户/患者数据隐私、各端/机构不泄露任务信息的基础上通过联邦学习跨域建模,使得数据可用不可见,最终通过联合建立的问诊推荐模型为用户/患者提供精准的问诊推荐,使用户/患者快速预约挂号到适合自身状况的医院科室,解决了现有技术中由于各个企业数据都是孤岛无法打通,导致无法利用各方数据为用户/患者提供精准的问诊推荐的问题。
附图说明
图1为本发明实施例1的一种问诊推荐方法的流程图;
图2为本发明实施例的问诊推荐系统架构示意图;
图3为本发明实施例的训练逻辑和推理逻辑的流程示意图;
图4为本发明实施例2的一种问诊推荐装置的结构示意图;
图5为本发明实施例3的一种问诊推荐装置的结构示意图。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面将结合附图对本发明实施方式作进一步地详细描述。
可以理解的是,此处描述的具体实施例和附图仅仅用于解释本发明,而非对本发明的限定。
可以理解的是,在不冲突的情况下,本发明中的各实施例及实施例中的各特征可相互组合。
可以理解的是,为便于描述,本发明的附图中仅示出了与本发明相关的部分,而与本发明无关的部分未在附图中示出。
可以理解的是,本发明的实施例中所涉及的每个单元、模块可仅对应一个实体结构,也可由多个实体结构组成,或者,多个单元、模块也可集成为一个实体结构。
可以理解的是,本发明的实施例中的术语“第一”、“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
可以理解的是,在不冲突的情况下,本发明的流程图和框图中所标注的功能、步骤可按照不同于附图中所标注的顺序发生。
可以理解的是,本发明的流程图和框图中,示出了按照本发明各实施例的系统、装置、设备、方法的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可代表一个单元、模块、程序段、代码,其包含用于实现规定的功能的可执行指令。而且,框图和流程图中的每个方框或方框的组合,可用实现规定的功能的基于硬件的系统实现,也可用硬件与计算机指令的组合来实现。
可以理解的是,本发明实施例中所涉及的单元、模块可通过软件的方式实现,也可通过硬件的方式来实现,例如单元、模块可位于处理器中。
实施例1:
本实施例提供一种问诊推荐方法,应用于作为参与方的多个端/机构中的目标端/机构,如图1所示,所述方法包括:
步骤S101:基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型。
在本实施例中,为了在保护数据隐私的同时又能打破数据孤岛,基于联邦学习技术建立问诊推荐模型,使得“数据不动,模型动”,各方数据都保留在本地,不泄露隐私也不违反法规。
可选地,所述基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型,具体包括:
对本地健康医疗相关数据进行加密;
通过协调方将加密后的本地健康医疗相关数据与所述其他端/机构加密后的其他健康医疗相关数据实现加密数据ID匹配对齐;
将对齐后的健康医疗相关数据中的重叠样本作为训练数据训练本地问诊推荐模型;
将训练后的本地问诊推荐模型的模型参数上传到中心服务器,以使所述中心服务器基于联邦学习将接收到的多个端/机构的模型参数进行聚合,得到更新后的模型参数;
接收所述中心服务器发送的更新后的模型参数,并根据所述更新后的模型参数更新本地问诊推荐模型。
在本实施例中,目标端/机构是作为参与方的多个端/机构中的任意一个端/机构,每个端/机构都具有本地健康医疗相关数据。
可选地,所述对本地健康医疗相关数据进行加密之前,所述方法还包括:
获取所述本地健康医疗相关数据,所述本地健康医疗相关数据包括用户基本信息以及以下至少之一:通信行为、位置轨迹、线上行为、医疗健康行业标签、问诊业务数据、挂号业务数据。
在本实施例中,不同的端/机构具有的本地健康医疗相关数据对应的字段会有所不同,比如A端/机构的本地健康医疗相关数据可以包括:个人属性、通信行为(短信、交流软件等信息分类标签化,例如交流问询的、相关情况表述的等)、位置轨迹、线上行为(互联网一些医疗相关线上操作,查看过一些网页信息、搜索引擎的操作或电商购买咨询的行为)、医疗健康行业标签(将用户的信息进行健康管理、医疗服务等)等。B端/机构的本地健康医疗相关数据可以包括:基础属性(年龄、注册时间)、问诊业务(次数、天数、时间、医院医生等)、挂号业务(次数、天数、时间等)等。其中,个人属性和基础属性字段信息均为用户基本信息。
可选地,所述获取所述本地健康医疗相关数据之后,所述方法还包括:
对所述本地健康医疗相关数据进行预处理,所述预处理包括以下至少之一:数据特征清洗、缺失值填充、异常值处理、特征归一化。
在本实施例中,为了提高模型推荐的准确性,在联合建模之前,各端/机构进行本地数据特征采集、数据特征清洗、缺失值填充、异常值处理与特征归一化等操作。
可选地,所述对本地健康医疗相关数据进行加密,具体包括:
采用隐私计算加密算法对所述本地健康医疗相关数据进行加密,其中,所述隐私计算加密算法为同态加密算法或RSA加密算法。
在本实施例中,同态加密算法允许在加密状态下进行计算,并且在解密后得到与在明文状态下进行相同计算的结果。这意味着即使数据是加密的,也可以进行计算并在解密后得到结果,从而不会暴露原始数据。RSA是一种非对称加密算法,它使用公钥和私钥进行加密和解密。
具体地,隐私计算加密算法优选采用RSA加密算法,利用RSA加密算法的双射特性,使得明文与密文一一对应,本RSA加解密算法的公钥与私钥是一一对应的,且可以互换。
在本实施例中,各端数据通过加密算法,在不交换数据的情况下仅对密文进行匹配运算来获取重叠样本ID,有保障各端数据隐私安全。整个加密数据匹配ID对齐过程制定加密样本ID对齐机制。加密数据匹配ID对齐需要找出参与各端/机构共有的训练样本ID,可以用样本唯一识别信息的哈希值作为ID的标识,各端/机构不能泄露其他样本ID给对方,采用加密对齐算法RSA1024+SHA256;加密对齐时间为一天数据,对齐平均耗时计算。
需要说明的是,加密对齐算法RSA1024+SHA256表示在加密过程中使用RSA算法的1024位密钥长度,并且使用SHA256算法来处理数据的哈希值。这种组合可以用于保护数据的安全性和完整性。
在本实施例中,在实现加密数据ID匹配对齐后,各端/机构分别在本地进行模型训练,将训练后的各分端模型参数上传到中心服务器,进行各端/机构的联合特征工程,进行联邦特征选择依赖于多端加密后的数据也需要在中心服务器进行数据整合与计算,以及进行联邦相关性分析、联邦WOE/IV转换、联邦特征分箱与联邦特征衍生等。
在本实施例中,中心服务器向各端/机构发送更新后的模型参数,以使各端/机构根据所述更新后的模型参数更新本地问诊推荐模型。
步骤S102:接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;
步骤S103:基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。
在本实施例中,基于联邦学习建立问诊推荐模型之后,即可为患者提供精准的问诊推荐的能力,在此能力过程中解决数据资源不充足、不完备,并解决了多端数据隐私安全、模型训练提升精准率的能力,使患者快速挂到适合的医院科室,精准的为患者提供问诊及就诊服务。
可选地,所述基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,具体包括:
根据所述推荐请求向协调方发送推理信息,以使所述协调方将所述推理信息发送给所述多个端/机构中的至少一个端/机构,并接收所述至少一个端/机构基于自身本地问诊推荐模型返回的推理结果;
接收所述协调方合并所述推理结果后返回的所述问诊推荐信息;
输出所述问诊推荐信息。
在本实施例中,用户特征也即用户基本信息,可以包括性别、年龄、职业、与用户自身相关部位的状态/症状表述信息等,用户登录app发送推理信息,传入用户特征,目标端/机构向协调方发送推理信息,协调方将所述推理信息发送给所述多个端/机构中的至少一个端/机构,并接收所述至少一个端/机构基于自身本地问诊推荐模型返回的推理结果,经协调方合并推理结果后,向目标端/机构返回问诊推荐信息(包括适合用户的挂号及就医信息),目标端/机构将该问诊推荐信息通过app向用户显示。
可选地,所述基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,具体包括:
将所述用户特征输入本地问诊推荐模型,得到所述问诊推荐信息。
在本实施例中,目标端/机构也可以直接通过本地问诊推荐模型向用户/患者返回问诊推荐信息。
需要说明的是,本实施例提供的一种问诊推荐方法应用于如图2所示的问诊推荐系统架构,该架构基于联邦学习,主要由信息分布式存储(图中未示出)、数据接入、基础能力、核心组件四部分组成。其中,各部分说明如下:
1)信息分布式存储部分负责对挂号平台、医疗机构等诊疗过程中产生的健康医疗相关数据进行存储和管理;
2)数据接入部分负责对各系统患者相关数据所存储的位置、归属人进行管理,主要包括Access Interface(访问接口)和Format Adapter(格式适配器),Access Interface是指用于与数据源进行交互的接口,包括读取、写入、查询等操作,通常用于实现数据的获取和处理,主要涉及HIVE、MySQL、Level DB、HBASE等工具或组件。Format Adapter用于将不同格式的数据转换为系统所需的格式,主要涉及Amazon S3、CSV、HDFS等。
3)基础能力部分包含联邦学习算法:Federated Machine Learning CoreComponent(联邦机器学习核心组件)、深度学习:Tensorflow/Pytorch、分布式计算:EggRoll/Spark、联邦网络:cross-Site Networking(跨站点网络)等;
4)核心组件部分包含训练任务管理、在线预测、可视化及监控。其中,训练任务管理涉及Flow DAG Parser(流程有向无环图解析器)、Lifecycle Manager(生命周期管理器)、Multi-Party Task Scheduler(多方任务调度器)等等,在线预测涉及Federatedinference(联邦推断)、Model Manager(模型管理器)、Version Control(版本控制)等等,可视化及监控涉及FL Visualization(联邦学习可视化)、Monitoring(监控)、Log Manager(日志管理器)等等。
需要说明的是,本实施例提供的一种问诊推荐方法旨在充分利用各端优势,例如:大数据优势,行业经验等,在严格遵守数据隐私法规下,建设成果将输出使用端/机构为用户/患者提供问诊功能推荐,以提高应用服务问诊推荐的精准性。其联邦学习的原理为:联邦学习在多方本地化部署的基础上,服务端(即中心服务器)、客户端(即作为参与方的各端/机构)及协调方通过网络互联进行联合建模,实现数据不出库、不共享数据,有效解决数据孤岛问题,主要包括:数据准备、加密对齐、联合训练、联合模型推理几个核心流程。
在一个具体的实施例中,该问诊推荐方法可以包括如下步骤:
步骤一:各端/机构进行本地数据准备,各端/机构进行本地数据特征采集、数据特征清洗、缺失值填充、异常值处理与特征归一化等操作,例如操作如下:
A端/机构数据准备:个人属性、通信行为(短信、交流软件等信息分类标签化,例如交流问询的、相关情况表述的等)、位置轨迹、线上行为(互联网一些医疗相关线上操作,查看过一些网页信息、搜索引擎的操作或电商购买咨询的行为)、医疗健康行业标签(将用户的信息进行健康管理、医疗服务等)等。
B端/机构数据准备:基础属性、近一周、近一月问诊和挂号次数、天数、医院、科室、医生、时间等。
中心服务器和各端/机构做相应本地数据与模型准备,在数据不出库的前提下,建立联邦学习模型架构,实现各端数据虚拟打通;例如,如下
A端/机构用户数据准备:准备XX个特征,包括,个人属性、医疗健康行业标签、通信行为、位置轨迹、线上行为等模型训练数据;
B端/机构用户数据准备:准备XX个特征,包括基础属性(年龄、注册时间)、问诊业务(次数、天数、时间、医院医生等)、挂号业务(次数、天数、时间等)等模型训练数据。
步骤二:对各端/机构数据实现加密数据ID匹配对齐,各端本地样本ID采样、ID哈希编码/解码、ISA加密/解密、ID隐秘匹配与ID明/秘交集等。各端数据通过加密算法,在不交换数据的情况下仅对密文进行匹配运算来获取重叠样本ID,有保障各端数据隐私安全。
(1)加密数据ID匹配对齐:整个加密数据匹配ID对齐过程制定加密样本ID对齐机制。加密匹配ID对齐需要找出参与各端/机构共有的训练样本ID,可以用样本唯一识别信息的哈希值作为ID的标识,各端/机构不能泄露其他样本ID给对方,采用加密对齐算法RSA1024+SHA256;加密对齐时间为一天数据,对齐平均耗时计算。需要说明的是,加密对齐算法RSA1024+SHA256表示在加密过程中使用RSA算法的1024位密钥长度,并且使用SHA256算法来处理数据的哈希值。这种组合可以用于保护数据的安全性和完整性。
(2)加密解决方案:针对A端/机构样本ID样本集合与B端/机构ID样本集合,c是A端/机构获得的公钥,d是B端/机构的拥有的私钥与公钥c对应;n是RSA加解密系统modulus。B端/机构需要生成公钥(n,c)和私钥(n,d)对,并将公钥(n,c)发送给A端。本方案利用RSA加密算法的双射特性,明文与密文一一对应,本RSA加解密算法的公钥与私钥是一一对应的,且可以互换。
(3)隐私计算加密算法:同态加密、哈希编码、RSA加密、差分隐私。其中,同态加密允许在加密状态下进行计算,并且在解密后得到与在明文状态下进行相同计算的结果;哈希编码是一种单向加密算法,它将任意长度的数据转换为固定长度的哈希值;RSA是一种非对称加密算法,它使用公钥和私钥进行加密和解密;差分隐私是一种隐私保护技术,旨在通过向数据添加噪声来防止对个体隐私的泄露,差分隐私的关键思想是通过引入适当的噪声来混淆数据,以保护个体数据的隐私。
步骤三:各端/机构利用本地数据/服务器训练本地模型,即各端/机构可以分别在本地进行模型训练,将训练后的各分端模型参数上传到中心服务器,进行各端/机构的联合特征工程,进行联邦特征选择依赖于多端加密后的数据也需要在中心服务器进行数据整合与计算,以及进行联邦相关性分析、联邦WOE/IV转换、联邦特征分箱与联邦特征衍生等。
步骤四:进行联邦学习训练包括数据拆分分组、参数同态加密、联邦逻辑回归、联邦Secure Boost与联邦DNN模型。其中,数据拆分分组是指根据本次模型训练目标对原始数据进行拆分分组。包括:个人属性、位置轨迹、线上行为、就诊情况(挂号、医生、科室、时间等)。参数同态加密是指在过程中使用同态加密算法。联邦逻辑回顾就是各端通过公私钥通过本地模型训练加密上传中心服务器,中心服务器解密加权平均聚合模型后发送各端更新收敛本地模型。联邦Secure Boost是进行同态运算实现联邦学习的安全树模型。各端/机构数据在不出库的情况下,通过联邦学习技术完成联合模型训练和推理,建立共享机器学习模型高维度数据参与训练,促进最终模型表现优越。使用抽取数据进行模型推理,各端模型输出潜在问诊用户数据、联邦学习模型输出对齐用户数据及模型,使用一段周期内实际每天问诊的用户,进行回测比对。采用python调用在线推理接口的方式,模拟应用服务端调用。
步骤五:进行联邦模型推进(即做模型推理,具有边做业务边训练的特点),包括ID加密查找、ID加密对比、掩码加密/解密、模型推理聚合、结果反馈/销毁等程序。其中,联邦学习的训练逻辑和推理逻辑如下:
训练逻辑:B端/机构根据业务需求发起训练,然后经协调方和A公司做数据对齐,完成后开始与B公司交换参数并训练模型。
推理逻辑:用户/患者使用问诊推荐应用服务时,发起推理请求(也即推荐请求),传入用户特征(即用户基本信息,可以包括性别、年龄、职业、与用户自身相关部位的状态/症状表述信息等),经协调方通知其中一端(本地数据或模型参与端)获取对应用户的特征,分别同步各自模型推理并合并结果,返回推荐结果,即输出适合用户的挂号及就医信息(科室、医院、专家)。
具体地,图3示出了训练逻辑和推理逻辑的流程示意图,如图3所示,协调方根据业务需求发起训练,然后经协调方与B端或各端做数据对齐,完成后开始与各端交换参数并训练模型。训练逻辑步骤如下:
①业务需求到训练节点:发起训练任务;
②两方训练节点:数据对齐;
③集成公司训练节点到协调方节点:通信及交换参数;
④协调方到移动训练节点:通信及交换参数;
⑤两方训练节点:完成训练并发布模型。
如图3所示,用户登录app时,发起推理(即发送推荐请求),传入用户特征,经协调方通知移动获取对应用户的特征,分别同步各自模型推理并合并结果,返回推荐结果。推进逻辑步骤如下:
①APP到推理节点:发起推理,并传参用户特征;
②推理节点到协调方节点:经协调方传递推理信息;
③协调方到推理节点:经协调方获取和传递推理信息;
④Redis到推理节点:获取移动推理数据;
⑤返回推荐结果:然后同步模型并进行模型推理,推理结束后,经协调方合并推理结果,并返回推荐结果。
需要说明的是,协调方是指整体统筹建立模型的端,将模型中需要的参数与基本结构与参与端告知协调。训练节点和推理节点指的是学习的两个环节。
步骤六:进行中心服务器初始化全局参数模型,通过继续训练将产出模型参数发送至输出服务端。重复上述模型训练步骤,直到整个训练过程收敛。
需要说明的是,联邦学习在问诊推荐场景,随着时间的延长,效果会逐渐扩大,优势逐渐明显。打造联邦患者问诊功能推荐模型,实现精准运营服务,基于当前服务端问诊业务效率的基础,采用联邦学习患者问诊推荐模型再提升一倍;最终根据用户/患者需求与行业需求定制训练模型种类与序次,患者问诊推荐、体检套餐推荐、医院推荐等方向。
本发明实施例提供的问诊推荐方法,首先基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;然后接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;再基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。本发明在保护用户/患者数据隐私、各端/机构不泄露任务信息的基础上通过联邦学习跨域建模,使得数据可用不可见,最终通过联合建立的问诊推荐模型为用户/患者提供精准的问诊推荐,使用户/患者快速预约挂号到适合自身状况的医院科室,解决了现有技术中由于各个企业数据都是孤岛无法打通,导致无法利用各方数据为用户/患者提供精准的问诊推荐的问题。
实施例2:
如图4所示,本实施例提供一种问诊推荐装置,设置于作为参与方的多个端/机构中的目标端/机构,所述装置包括:
联合建模模块11,用于基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;
请求接收模块12,与所述联合建模模块11连接,用于接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;
问诊推荐模块13,与所述请求接收模块12连接,用于基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。
可选地,所述联合建模模块11具体包括:
数据加密单元,用于对本地健康医疗相关数据进行加密;
数据对齐单元,用于通过协调方将加密后的本地健康医疗相关数据与所述其他端/机构加密后的其他健康医疗相关数据实现加密数据ID匹配对齐;
模型训练单元,用于将对齐后的健康医疗相关数据中的重叠样本作为训练数据训练本地问诊推荐模型;
参数上传单元,用于将训练后的本地问诊推荐模型的模型参数上传到中心服务器,以使所述中心服务器基于联邦学习将接收到的多个端/机构的模型参数进行聚合,得到更新后的模型参数;
模型更新单元,用于接收所述中心服务器发送的更新后的模型参数,并根据所述更新后的模型参数更新本地问诊推荐模型。
可选地,所述装置还包括:
相关数据获取模块,用于获取所述本地健康医疗相关数据,所述本地健康医疗相关数据包括用户基本信息以及以下至少之一:通信行为、位置轨迹、线上行为、医疗健康行业标签、问诊业务数据、挂号业务数据。
可选地,所述装置还包括:
预处理模块,用于对所述本地健康医疗相关数据进行预处理,所述预处理包括以下至少之一:数据特征清洗、缺失值填充、异常值处理、特征归一化。
可选地,所述数据加密单元具体用于:
采用隐私计算加密算法对所述本地健康医疗相关数据进行加密,其中,所述隐私计算加密算法为同态加密算法或RSA加密算法。
可选地,所述问诊推荐模块13包括:
推理信息发送单元,用于根据所述推荐请求向协调方发送推理信息,以使所述协调方将所述推理信息发送给所述多个端/机构中的至少一个端/机构,并接收所述至少一个端/机构基于自身本地问诊推荐模型返回的推理结果;
推理结果接收单元,用于接收所述协调方合并所述推理结果后返回的所述问诊推荐信息;
推荐信息输出单元,用于输出所述问诊推荐信息。
可选地,所述问诊推荐模块13具体用于:
将所述用户特征输入本地问诊推荐模型,得到所述问诊推荐信息。
实施例3:
参考图5,本实施例提供一种问诊推荐装置,包括存储器21和处理器22,存储器21中存储有计算机程序,处理器22被设置为运行所述计算机程序以执行实施例1中的问诊推荐方法。
其中,存储器21与处理器22连接,存储器21可采用闪存或只读存储器或其他存储器,处理器22可采用中央处理器或单片机。
实施例4:
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例1中的问诊推荐方法。
该计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、计算机程序模块或其他数据)的任何方法或技术中实施的易失性或非易失性、可移除或不可移除的介质。计算机可读存储介质包括但不限于RAM(Random Access Memory,随机存取存储器),ROM(Read-Only Memory,只读存储器),EEPROM(Electrically ErasableProgrammable read only memory,带电可擦可编程只读存储器)、闪存或其他存储器技术、CD-ROM(Compact Disc Read-Only Memory,光盘只读存储器),数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。
综上所述,本发明实施例提供的问诊推荐方法、装置及计算机可读存储介质,首先基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;然后接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;再基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。本发明在保护用户/患者数据隐私、各端/机构不泄露任务信息的基础上通过联邦学习跨域建模,使得数据可用不可见,最终通过联合建立的问诊推荐模型为用户/患者提供精准的问诊推荐,使用户/患者快速预约挂号到适合自身状况的医院科室,解决了现有技术中由于各个企业数据都是孤岛无法打通,导致无法利用各方数据为用户/患者提供精准的问诊推荐的问题。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (10)
1.一种问诊推荐方法,其特征在于,应用于作为参与方的多个端/机构中的目标端/机构,所述方法包括:
基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;
接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;
基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。
2.根据权利要求1所述的方法,其特征在于,所述基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型,具体包括:
对本地健康医疗相关数据进行加密;
通过协调方将加密后的本地健康医疗相关数据与所述其他端/机构加密后的其他健康医疗相关数据实现加密数据ID匹配对齐;
将对齐后的健康医疗相关数据中的重叠样本作为训练数据训练本地问诊推荐模型;
将训练后的本地问诊推荐模型的模型参数上传到中心服务器,以使所述中心服务器基于联邦学习将接收到的多个端/机构的模型参数进行聚合,得到更新后的模型参数;
接收所述中心服务器发送的更新后的模型参数,并根据所述更新后的模型参数更新本地问诊推荐模型。
3.根据权利要求2所述的方法,其特征在于,所述对本地健康医疗相关数据进行加密之前,所述方法还包括:
获取所述本地健康医疗相关数据,所述本地健康医疗相关数据包括用户基本信息以及以下至少之一:通信行为、位置轨迹、线上行为、医疗健康行业标签、问诊业务数据、挂号业务数据。
4.根据权利要求3所述的方法,其特征在于,所述获取所述本地健康医疗相关数据之后,所述方法还包括:
对所述本地健康医疗相关数据进行预处理,所述预处理包括以下至少之一:数据特征清洗、缺失值填充、异常值处理、特征归一化。
5.根据权利要求2所述的方法,其特征在于,所述对本地健康医疗相关数据进行加密,具体包括:
采用隐私计算加密算法对所述本地健康医疗相关数据进行加密,其中,所述隐私计算加密算法为同态加密算法或RSA加密算法。
6.根据权利要求2所述的方法,其特征在于,所述基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,具体包括:
根据所述推荐请求向协调方发送推理信息,以使所述协调方将所述推理信息发送给所述多个端/机构中的至少一个端/机构,并接收所述至少一个端/机构基于自身本地问诊推荐模型返回的推理结果;
接收所述协调方合并所述推理结果后返回的所述问诊推荐信息;
输出所述问诊推荐信息。
7.根据权利要求2所述的方法,其特征在于,所述基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,具体包括:
将所述用户特征输入本地问诊推荐模型,得到所述问诊推荐信息。
8.一种问诊推荐装置,其特征在于,设置于作为参与方的多个端/机构中的目标端/机构,所述装置包括:
联合建模模块,用于基于联邦学习经协调方和中心服务器与多个端/机构中的其他端/机构联合建立问诊推荐模型;
请求接收模块,与所述联合建模模块连接,用于接收用户/患者发起的推荐请求,所述推荐请求携带用户特征;
问诊推荐模块,与所述请求接收模块连接,用于基于所述问诊推荐模型向用户/患者输出所述用户特征对应的问诊推荐信息,以使用户/患者能够挂号到适合的医院科室。
9.一种问诊推荐装置,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以实现如权利要求1-7中任一项所述的问诊推荐方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的问诊推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311824429.8A CN117790003A (zh) | 2023-12-27 | 2023-12-27 | 一种问诊推荐方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311824429.8A CN117790003A (zh) | 2023-12-27 | 2023-12-27 | 一种问诊推荐方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117790003A true CN117790003A (zh) | 2024-03-29 |
Family
ID=90388883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311824429.8A Pending CN117790003A (zh) | 2023-12-27 | 2023-12-27 | 一种问诊推荐方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117790003A (zh) |
-
2023
- 2023-12-27 CN CN202311824429.8A patent/CN117790003A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A privacy-enhanced retrieval technology for the cloud-assisted internet of things | |
Alamri et al. | Blockchain for Internet of Things (IoT) research issues challenges & future directions: A review | |
CN113159327B (zh) | 基于联邦学习系统的模型训练方法、装置、电子设备 | |
CN113032840B (zh) | 一种数据处理方法、装置、设备及计算机可读存储介质 | |
ES2957843T3 (es) | Verificación de procesos de datos en una red de recursos informáticos | |
Bazel et al. | Blockchain technology in healthcare big data management: Benefits, applications and challenges | |
CN112270597A (zh) | 业务处理、信用评价模型训练方法、装置、设备及介质 | |
US11316691B2 (en) | Methods and systems for enhancing network privacy of multiple party documents on distributed ledger-based networks | |
CN111081337B (zh) | 一种协同任务预测方法及计算机可读存储介质 | |
CN110999200B (zh) | 一种用于评估监测函数以确定是否满足触发条件的方法及系统 | |
CN110545273B (zh) | 一种基于区块链应用的资源分配方法及系统 | |
WO2020199785A1 (zh) | 私有数据的处理方法、计算方法及所适用的设备 | |
CN115169576B (zh) | 基于联邦学习的模型训练方法、装置及电子设备 | |
CN109147918A (zh) | 预约匹配方法、装置、电子设备及计算机可读介质 | |
Singh et al. | Cloud-based patient health information exchange system using blockchain technology | |
Parthasarathy et al. | Secure distributed medical record storage using blockchain and emergency sharing using multi-party computation | |
CN112509654A (zh) | 一种基于区块链的医疗数据采集方法 | |
CN113851200A (zh) | 基于区块链的医疗数据共享方法及装置 | |
Nusrat et al. | Telemedicine system design using blockchain in Bangladesh | |
Pooja et al. | Electronic Health Records & Data Management using Hyperledger fabric in Blockchain | |
Munn et al. | Providing a scaffold for considering theoretical frameworks in evidence implementation projects: the JBI approach to evidence implementation | |
Imteaj et al. | Foundations of blockchain: theory and applications | |
CN117790003A (zh) | 一种问诊推荐方法、装置及计算机可读存储介质 | |
Pallivalappil et al. | Applications of Ensuring Security and Privacy Using Block Chain with IoT for Health Record | |
US20130103727A1 (en) | Accessible Information System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |