CN117238527A - 基于大数据的医疗信息管理方法及系统 - Google Patents
基于大数据的医疗信息管理方法及系统 Download PDFInfo
- Publication number
- CN117238527A CN117238527A CN202311509573.2A CN202311509573A CN117238527A CN 117238527 A CN117238527 A CN 117238527A CN 202311509573 A CN202311509573 A CN 202311509573A CN 117238527 A CN117238527 A CN 117238527A
- Authority
- CN
- China
- Prior art keywords
- label
- medical
- excavation
- target
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 37
- 238000009412 basement excavation Methods 0.000 claims abstract description 395
- 239000013604 expression vector Substances 0.000 claims abstract description 80
- 230000015654 memory Effects 0.000 claims abstract description 60
- 239000013598 vector Substances 0.000 claims description 244
- 238000012549 training Methods 0.000 claims description 129
- 238000005065 mining Methods 0.000 claims description 68
- 238000006243 chemical reaction Methods 0.000 claims description 67
- 230000010354 integration Effects 0.000 claims description 66
- 230000004927 fusion Effects 0.000 claims description 60
- 230000004913 activation Effects 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 37
- 230000006399 behavior Effects 0.000 claims description 33
- 230000009471 action Effects 0.000 claims description 32
- 238000013135 deep learning Methods 0.000 claims description 30
- 238000003745 diagnosis Methods 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 15
- 238000002372 labelling Methods 0.000 claims description 15
- 238000000556 factor analysis Methods 0.000 claims description 9
- 230000006403 short-term memory Effects 0.000 claims description 8
- 230000007787 long-term memory Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 abstract description 6
- 230000007246 mechanism Effects 0.000 abstract description 3
- 208000024891 symptom Diseases 0.000 description 60
- 239000003814 drug Substances 0.000 description 37
- 229940079593 drug Drugs 0.000 description 27
- 206010019233 Headaches Diseases 0.000 description 19
- 231100000869 headache Toxicity 0.000 description 19
- 230000008569 process Effects 0.000 description 14
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 7
- 229960001138 acetylsalicylic acid Drugs 0.000 description 7
- 201000010099 disease Diseases 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 4
- 206010011224 Cough Diseases 0.000 description 3
- 206010037660 Pyrexia Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 206010008479 Chest Pain Diseases 0.000 description 2
- 206010020772 Hypertension Diseases 0.000 description 2
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 206010022437 insomnia Diseases 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 206010000087 Abdominal pain upper Diseases 0.000 description 1
- 230000001754 anti-pyretic effect Effects 0.000 description 1
- 239000002221 antipyretic Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000005802 health problem Effects 0.000 description 1
- 230000000147 hypnotic effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请提供一种基于大数据的医疗信息管理方法及系统,通过长短期记忆网络和注意力机制,能有效地从医疗咨询对话中提取出有价值的特征,并生成显著性表示向量。这些显著性表示向量可以更准确地反映用户的就诊意图,从而提高预测的准确性。此外,可以依据预测出的用户就诊意图信息,推送对应的医疗内容信息给用户,提供个性化的医疗服务,满足不同用户的个性化需求。通过跨域代价参数进行网络参数更新,不仅可以学习和理解每一种医疗挖掘标签的医疗信息的特性,还能捕捉到不同医疗挖掘标签的医疗信息之间的相互关系,从而更准确地预测用户的就诊意图,提高网络的泛化能力和预测性能。
Description
技术领域
本申请涉及互联网医疗技术领域,具体而言,涉及一种基于大数据的医疗信息管理方法及系统。
背景技术
在现代医疗服务中,随着互联网技术的发展,越来越多的用户选择在线咨询医生、获取医疗信息。这产生了大量的医疗咨询对话行为数据,这些数据中蕴含着丰富的信息,如用户的健康状况、就诊意图等。然而,由于这些数据通常以自然语言文本的形式存在,其内部结构复杂,包含的信息难以被直接利用。
传统的方法通常依赖于人工规则或者简单的机器学习模型来处理这些数据,但这些方法往往无法准确地理解和提取出数据中的关键信息,尤其是在面对大规模、高维度的数据时,其性能更是难以满足需求。
因此,急需一种新的方法,能够有效地从医疗咨询对话行为数据中提取有价值的信息,并根据这些信息提供个性化的医疗服务。
发明内容
有鉴于此,本申请的目的在于提供一种基于大数据的医疗信息管理方法及系统。
依据本申请的第一方面,提供一种基于大数据的医疗信息管理方法,应用于医疗信息管理系统,所述方法包括:
从目标医疗服务应用的医疗页面操作大数据中获取目标医疗咨询对话行为数据;
将所述目标医疗咨询对话行为数据加载到目标医疗就诊意图预测网络中的多个医疗挖掘标签分别对应的目标长短期记忆网络进行特征提取,生成每个医疗挖掘标签对应的目标显著性表示向量;所述目标医疗就诊意图预测网络为依据跨域代价参数对基础长短期记忆网络中的基础标签兼容单元进行网络参数更新生成的,所述跨域代价参数表征目标标签兼容表示向量的关联度,所述目标标签兼容表示向量为任意两个医疗挖掘标签对应的基础标签兼容单元生成的标签兼容表示向量;
将所述每个医疗挖掘标签对应的目标显著性表示向量加载到所述每个医疗挖掘标签对应的目标意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第一标签就诊意图数据,并依据所述多个医疗挖掘标签分别对应的第一标签就诊意图数据,确定所述目标医疗咨询对话行为数据对应的目标就诊意图信息;
基于所述目标医疗咨询对话行为数据对应的目标就诊意图信息对对应的医疗服务用户推送对应的医疗内容信息。
在第一方面的一种可能的实施方式中,所述目标医疗就诊意图预测网络的训练步骤,包括:
获取第一训练样本数据序列;
将所述第一训练样本数据序列加载到初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的训练标签兼容表示向量;
依据目标医疗挖掘标签组合对应的训练标签兼容表示向量,确定所述目标医疗挖掘标签组合对应的跨域代价参数;所述目标医疗挖掘标签组合为所述多个医疗挖掘标签中的任意两个;
依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络。
在第一方面的一种可能的实施方式中,所述每个医疗挖掘标签对应的基础长短期记忆网络包括基础序列生成器和基础注意力学习集成子网络,所述基础注意力学习集成子网络包括第一权重分配器、第一激活函数层、基础标签兼容单元和第一集成单元;
所述将所述第一训练样本数据序列加载到初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的训练标签兼容表示向量,包括:
将所述第一训练样本数据序列加载到所述每个医疗挖掘标签对应的基础序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的样例序列表示信息;
将所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第一融合表示向量;
将所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第一训练表示向量;
将所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的基础标签兼容单元进行标签兼容转换,生成所述每个医疗挖掘标签对应的第一标签兼容表示向量;
将所述每个医疗挖掘标签对应的第一训练表示向量、所述每个医疗挖掘标签对应的第一标签兼容表示向量、所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一集成单元进行集成处理,生成所述每个医疗挖掘标签对应的第二训练表示向量;
所述方法还包括:
获取所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第一标注就诊意图数据;
将所述每个医疗挖掘标签对应的第二训练表示向量加载到所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第三标签就诊意图数据;
将所述第一训练样本数据序列加载到所述初始化深度学习网络中的基础重要性因子学习单元进行重要性因子分析,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的样例重要性因子信息;
依据所述样例重要性因子信息,对所述多个医疗挖掘标签分别对应的第三标签就诊意图数据进行加权融合,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第四标签就诊意图数据;
依据所述第四标签就诊意图数据和所述第一标注就诊意图数据,确定第一重要性因子代价参数;
所述依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络,包括:
依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述第一重要性因子代价参数,对所述基础重要性因子学习单元进行参数更新,生成所述目标医疗就诊意图预测网络。
在第一方面的一种可能的实施方式中,所述每个医疗挖掘标签对应的基础长短期记忆网络包括基础序列生成器和基础注意力学习集成子网络,所述基础注意力学习集成子网络包括第二权重分配器、第二激活函数层、基础标签兼容单元和第二集成单元,所述基础标签兼容单元包括第一基础标签兼容转换节点和第二基础标签兼容转换节点;
所述将所述第一训练样本数据序列加载到初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的训练标签兼容表示向量,包括:
将所述第一训练样本数据序列加载到所述每个医疗挖掘标签对应的基础序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的样例序列表示信息;
将所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第二融合表示向量;
将所述每个医疗挖掘标签对应的第二融合表示向量加载到所述每个医疗挖掘标签对应的第一基础标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第二标签兼容表示向量;
将所述每个医疗挖掘标签对应的第二标签兼容表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第三训练表示向量;
将所述每个医疗挖掘标签对应的第三训练表示向量加载到所述每个医疗挖掘标签对应的第二基础标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第三标签兼容表示向量;
将所述每个医疗挖掘标签对应的第三标签兼容表示向量、所述每个医疗挖掘标签对应的第二标签兼容表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二集成单元进行集成处理,生成所述每个医疗挖掘标签对应的第四训练表示向量。
在第一方面的一种可能的实施方式中,所述方法还包括:
获取所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第一标注就诊意图数据;
将所述每个医疗挖掘标签对应的第四训练表示向量加载到所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第五标签就诊意图数据;
将所述第一训练样本数据序列加载到所述初始化深度学习网络中的基础重要性因子学习单元进行重要性因子分析,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的样例重要性因子信息;
依据所述样例重要性因子信息,对所述多个医疗挖掘标签分别对应的第五标签就诊意图数据进行加权融合,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第六标签就诊意图数据;
依据所述第六标签就诊意图数据和所述第一标注就诊意图数据,确定第二重要性因子代价参数;
所述依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络,包括:
依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述第二重要性因子代价参数,对所述基础重要性因子学习单元进行参数更新,生成所述目标医疗就诊意图预测网络。
在第一方面的一种可能的实施方式中,所述方法还包括:
获取第二训练样本数据序列和所述第二训练样本数据序列中每个样例医疗咨询对话行为数据对应的第二标注就诊意图数据;
将所述第二训练样本数据序列加载到所述初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的第五训练表示向量;
将所述每个医疗挖掘标签对应的第五训练表示向量加载到所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第七标签就诊意图数据;
依据所述每个医疗挖掘标签对应的第七标签就诊意图数据和所述第二标注就诊意图数据,确定所述每个医疗挖掘标签对应的标签代价参数;
所述依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络,包括:
依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述每个医疗挖掘标签对应的标签代价参数,对所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基准网络结构进行参数更新,生成所述目标医疗就诊意图预测网络;所述每个医疗挖掘标签对应的基准网络结构为所述每个医疗挖掘标签对应的基础长短期记忆网络中除所述每个医疗挖掘标签对应的基础标签兼容单元以外的网络单元结构。
在第一方面的一种可能的实施方式中,所述方法还包括:
将所述目标医疗咨询对话行为数据加载到所述目标医疗就诊意图预测网络中的目标重要性因子学习单元进行重要性因子分析,生成目标重要性因子信息;
所述依据所述多个医疗挖掘标签分别对应的第一标签就诊意图数据,确定所述目标医疗咨询对话行为数据对应的目标就诊意图信息,包括:
依据所述目标重要性因子信息,对所述多个医疗挖掘标签分别对应的第一标签就诊意图数据进行加权融合,生成所述目标医疗咨询对话行为数据对应的第二标签就诊意图数据;
依据所述第二标签就诊意图数据,确定所述目标就诊意图信息。
在第一方面的一种可能的实施方式中,所述将所述目标医疗咨询对话行为数据加载到目标医疗就诊意图预测网络中的多个医疗挖掘标签分别对应的目标长短期记忆网络进行特征提取,生成每个医疗挖掘标签对应的目标显著性表示向量,包括:
将所述目标医疗咨询对话行为数据加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的目标序列向量信息;
将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标注意力集成子网络进行显著性特征表示,生成所述每个医疗挖掘标签对应的目标显著性表示向量。
在第一方面的一种可能的实施方式中,所述每个医疗挖掘标签对应的目标注意力集成子网络包括第三权重分配器、第三激活函数层、目标标签兼容转换节点和第三集成单元;
所述将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标注意力集成子网络进行显著性特征表示,生成所述每个医疗挖掘标签对应的目标显著性表示向量,包括:
将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第三权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第三融合表示向量;
将所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的第三激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第一标签表示向量;
将所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第四标签兼容表示向量;
将所述每个医疗挖掘标签对应的第四标签兼容表示向量、所述每个医疗挖掘标签对应的第一标签表示向量、所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的第三集成单元进行集成处理,生成所述每个医疗挖掘标签对应的目标显著性表示向量;
或者,所述每个医疗挖掘标签对应的目标注意力集成子网络包括第四权重分配器、第四激活函数层、目标标签兼容转换节点和第四集成单元,所述每个医疗挖掘标签对应的目标标签兼容转换节点包括第一目标标签兼容转换节点和第二目标标签兼容转换节点;
所述将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标注意力集成子网络进行显著性特征表示,生成所述每个医疗挖掘标签对应的目标显著性表示向量,包括:
将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第四融合表示向量;
将所述每个医疗挖掘标签对应的第四融合表示向量加载到所述每个医疗挖掘标签对应的第一目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第五标签兼容表示向量;
将所述每个医疗挖掘标签对应的第五标签兼容表示向量和所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第二标签表示向量;
将所述每个医疗挖掘标签对应的第二标签表示向量加载到所述每个医疗挖掘标签对应的第二目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第六标签兼容表示向量;
将所述每个医疗挖掘标签对应的第六标签兼容表示向量、所述每个医疗挖掘标签对应的第五标签兼容表示向量和所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四集成单元进行集成处理,生成所述每个医疗挖掘标签对应的目标显著性表示向量。
依据本申请的第二方面,提供一种医疗信息管理系统,所述医疗信息管理系统包括处理器以及可读存储介质,所述可读存储介质存储有程序,该程序被处理器执行时实现前述的基于大数据的医疗信息管理方法。
依据本申请的第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,在监测到所述计算机可执行指令被执行时,实现前述的基于大数据的医疗信息管理方法。
依据上述任意一个方面,本申请中,首先,从目标医疗服务应用的医疗页面操作大数据中获取目标医疗咨询对话行为数据。然后,将这些数据加载到目标医疗就诊意图预测网络中进行处理。该目标医疗就诊意图预测网络包含多个与医疗挖掘标签相对应的目标长短期记忆网络,它们可以提取出序列显著性特征并生成每个医疗挖掘标签对应的目标显著性表示向量。此外,目标医疗就诊意图预测网络是通过利用跨域代价参数对基础长短期记忆网络中的基础标签兼容单元进行网络参数更新而生成的。之后,将每个医疗挖掘标签对应的目标显著性表示向量加载到对应的目标意图预测子网络进行意图预测,生成每个医疗挖掘标签对应的第一标签就诊意图数据。根据这些数据,可以确定目标医疗咨询对话行为数据对应的目标就诊意图信息。最后,基于确定的目标就诊意图信息,可以向对应的医疗服务用户推送相应的医疗内容信息。这种方法能有效地理解和预测用户的就诊意图,从而为用户提供更精确、更个性化的医疗信息推送服务。
也即,本申请通过长短期记忆网络和注意力机制,能有效地从医疗咨询对话中提取出有价值的特征,并生成显著性表示向量。这些显著性表示向量可以更准确地反映用户的就诊意图,从而提高预测的准确性。此外,可以依据预测出的用户就诊意图信息,推送对应的医疗内容信息给用户,提供个性化的医疗服务,满足不同用户的个性化需求。通过跨域代价参数进行网络参数更新,不仅可以学习和理解每一种医疗挖掘标签的医疗信息的特性,还能捕捉到不同医疗挖掘标签的医疗信息之间的相互关系,从而更准确地预测用户的就诊意图,提高网络的泛化能力和预测性能。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以依据这些附图获得其它相关的附图。
图1本申请实施例所提供的基于大数据的医疗信息管理方法的流程示意图;
图2示出了本申请实施例所提供的用于实现上述的基于大数据的医疗信息管理方法的医疗信息管理系统的组件结构示意图;
附图标记:100-医疗信息管理系统;102-处理器;104-存储器;106-传输装置;108-控制器。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。依据本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排它的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1示出了本申请实施例提供的基于大数据的医疗信息管理方法的流程示意图,应当理解,在其它实施例中,本实施例的基于大数据的医疗信息管理方法其中部分步骤的顺序可以依据标注需要相互交换,或者其中的部分步骤也可以省略或删除。该基于大数据的医疗信息管理方法的详细步骤介绍如下。
步骤S110,从目标医疗服务应用的医疗页面操作大数据中获取目标医疗咨询对话行为数据。
本实施例中,目标医疗服务应用可以包含各种医疗相关的页面,如问诊、药品查询、健康资讯等。用户在使用这些功能时,他们的行为(例如他们点击的链接,他们查询的内容)会被记录并存储在大数据系统中。在本实施例中,将关注医疗咨询对话行为数据,这可能包括用户在进行在线问诊时与医生的对话内容,或者在搜索病症、药物信息时输入的关键字。
例如,目标医疗服务应用中有一部分是提供医疗咨询服务的功能,用户可以在这个目标医疗服务应用上与在线医生进行咨询,包括问诊、获取治疗建议等。这些对话都会被记录下来并存储在大数据系统中。
示例性地,用户可以通过应用与医生进行实时聊天,咨询他们的健康问题。在这种情况下,目标医疗咨询对话行为数据可能包括:用户与医生的聊天记录、用户在搜索栏输入的症状关键词、用户查看或点击的相关医疗信息等。
或者,在另一个场景中,"HealthApp"也许有一个症状自查功能,用户可以输入他们的症状,并获取可能的疾病诊断。在这种情况下,可以从用户输入的症状、用户选择的相关症状、用户查看的疾病信息等方面收集目标医疗咨询对话行为数据。
或者,还提供了药品查询服务,用户可以通过输入药名或相关症状来寻找合适的药品。这时,可以收集用户的搜索查询、用户点击的药品信息、用户对药品的评价等作为目标医疗咨询对话行为数据。
在这些场景中,所有的用户行为数据都可以通过应用的后台记录,并存储在大数据系统中,以供后续的分析和处理。
步骤S120,将所述目标医疗咨询对话行为数据加载到目标医疗就诊意图预测网络中的多个医疗挖掘标签分别对应的目标长短期记忆网络进行特征提取,生成每个医疗挖掘标签对应的目标显著性表示向量。
本实施例中,所述目标医疗就诊意图预测网络为依据跨域代价参数对基础长短期记忆网络中的基础标签兼容单元进行网络参数更新生成的,所述跨域代价参数表征目标标签兼容表示向量的关联度,所述目标标签兼容表示向量为任意两个医疗挖掘标签对应的基础标签兼容单元生成的标签兼容表示向量。
本实施例中,以上收集的医疗咨询对话行为数据被加载到预先构建好的医疗就诊意图预测网络中。这个医疗就诊意图预测网络设计了多个医疗挖掘标签,例如“症状”、“药品”、“疾病”等医疗挖掘标签。每个医疗挖掘标签都有对应的长短期记忆网络(LSTM),长短期记忆网络可以用于学习和表示序列数据的显著性特征,并生成每个医疗挖掘标签的目标显著性表示向量。同时,医疗就诊意图预测网络还可以依据跨域代价参数更新基础长短期记忆网络中的基础标签兼容单元,以优化网络参数。
示例性地,在加载医疗咨询对话行为数据到目标医疗就诊意图预测网络之前,首先需要定义多个医疗挖掘标签。这些医疗挖掘标签可以看作是从用户的医疗咨询对话中提取出来的各种信息的类别,例如“症状”、“药品”、“疾病”等。
每一个医疗挖掘标签都有一个对应的长短期记忆网络。例如,针对“症状”标签,可能有一个专门的LSTM来学习和理解与症状相关的语言模式和上下文关系。这个LSTM会读取所有包含症状信息的用户对话,然后通过学习这些序列数据生成一个显著性表示向量。这个显著性表示向量能够捕捉到与症状相关的重要特征,比如常见的症状描述、症状的严重程度等。
例如,显著性表示向量通常是一个包含多个数值的列表,这些数值代表了某种特定信息的重要性或特征。在医疗应用场景中,每一个数值可能对应一种具体的病症、药物或其他医疗相关概念的重要性。
例如,考虑到前面讨论的“症状”标签,其对应的长短期记忆网络(LSTM)可能生成一个如下的显著性表示向量:
[0.2,0.05,0.3,0.1,0.35]
在这个例子中,假设有5种不同的症状被考虑(比如头痛、发热、咳嗽、胸闷和失眠),向量中的每一个数值代表了相应症状在用户的咨询对话中的显著性或出现频率。例如,0.2可能表示头痛在对话中被频繁提及,而0.05则表示发热相对较少被提及。这样的显著性表示向量为后续的分析和预测提供了有价值的输入,使得后续能够理解和捕捉到用户的医疗需求和问题。
此外,还使用了跨域代价参数来优化目标医疗就诊意图预测网络的性能。这个跨域代价参数度量的是任意两个医疗挖掘标签对应的显著性表示向量的关联度。例如,如果用户在谈论一种药物时也经常提到一种特定的症状,那么“药品”和“症状”的标签就会有较高的关联度。跨域代价参数将这种关联度信息反馈给目标医疗就诊意图预测网络,指导目标医疗就诊意图预测网络更新基础长短期记忆网络中的基础标签兼容单元的参数,以便更好地捕捉和理解不同类型的医疗信息。
其中,跨域代价参数和标签兼容表示向量都是为了提升医疗就诊意图预测网络的性能和准确度。这两者的关系和作用,下面将通过一个具体的例子进行说明:
假设有两个医疗挖掘标签:“症状”和“药品”。对应的长短期记忆网络(LSTM)分别生成了两个标签兼容表示向量:
症状向量:[0.2,0.05,0.3,0.1,0.35] (代表头痛、发热、咳嗽、胸闷和失眠)
药品向量:[0.15,0.3,0.1,0.05,0.4] (代表阿司匹林、退热贴、止咳糖浆、心脏药物和安眠药)。
而跨域代价参数则是一个衡量这个标签兼容表示向量中不同元素(即不同症状和药物)之间关联度的参数。例如,如果发现用户经常在提到头痛时也会谈到阿司匹林,那么跨域代价参数就会调整网络的参数,使得“头痛”和“阿司匹林”在生成的兼容向量中有更高的权重或关联度。
通过这种方式,目标医疗就诊意图预测网络不仅可以学习和理解每一种医疗信息的特性,还能捕捉到不同类型医疗信息之间的相互关系,从而更准确地预测用户的就诊意图。
也即,本步骤是通过使用LSTM和跨域代价参数,从用户的医疗咨询对话中抽取和学习重要的医疗信息,并生成用于后续分析和预测的特征表示。
步骤S130,将所述每个医疗挖掘标签对应的目标显著性表示向量加载到所述每个医疗挖掘标签对应的目标意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第一标签就诊意图数据,并依据所述多个医疗挖掘标签分别对应的第一标签就诊意图数据,确定所述目标医疗咨询对话行为数据对应的目标就诊意图信息。
本实施例中,当得到各个医疗挖掘标签的目标显著性表示向量后,这些目标显著性表示向量会被加载到对应的目标意图预测子网络中。每个目标意图预测子网络会对这些目标显著性表示向量进行分析,并预测出与该医疗挖掘标签相对应的就诊意图数据。例如,对于“症状”标签,其意图预测子网络可能预测出用户可能有的疾病或需要进行哪种检查。根据所有医疗挖掘标签的预测结果,可以确定整个医疗咨询对话行为数据的目标就诊意图。
步骤S140,基于所述目标医疗咨询对话行为数据对应的目标就诊意图信息对对应的医疗服务用户推送对应的医疗内容信息。
在确定了用户的目标就诊意图信息后,可以基于这些目标就诊意图信息为用户推送相关的医疗内容。例如,如果推断出用户可能有高血压,那么就可以推送关于高血压的预防、管理和治疗的相关信息,帮助用户更好地理解和管理他们的健康状况。再例如,如果用户的就诊意图信息显示他们可能正在寻求关于头痛的治疗方法,可以推送与头痛相关的医疗文章、专家建议或者药品推荐等信息。再例如,如果用户的就诊意图信息表明他们可能正在寻找某种特定药品的替代品,可以推送与那种药品类似的其他药品的信息。再例如,如果用户的就诊意图信息表明他们可能想要知道更多关于某种疾病(比如糖尿病)的信息,可以推送包括疾病介绍、预防措施、治疗方法等内容的相关资讯。再例如,如果用户的就诊意图信息表明他们可能需要进行健康检查,可以推送附近的医疗机构提供的健康检查服务信息。
基于以上步骤,通过长短期记忆网络和注意力机制,能有效地从医疗咨询对话中提取出有价值的特征,并生成显著性表示向量。这些显著性表示向量可以更准确地反映用户的就诊意图,从而提高预测的准确性。此外,可以依据预测出的用户就诊意图信息,推送对应的医疗内容信息给用户,提供个性化的医疗服务,满足不同用户的个性化需求。通过跨域代价参数进行网络参数更新,不仅可以学习和理解每一种医疗挖掘标签的医疗信息的特性,还能捕捉到不同医疗挖掘标签的医疗信息之间的相互关系,从而更准确地预测用户的就诊意图,提高网络的泛化能力和预测性能。
在一种可能的实施方式中,所述目标医疗就诊意图预测网络的训练步骤,包括:
步骤S101,获取第一训练样本数据序列。
例如,在这个步骤中,可以从大数据系统中获取一批用于训练的样本数据。例如,可能会选取一些用户在目标医疗服务应用上与医生进行的问诊对话记录作为训练样本数据,从而构建所述第一训练样本数据序列。
步骤S102,将所述第一训练样本数据序列加载到初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的训练标签兼容表示向量。
接下来,可以将这些训练样本数据加载到初始化的深度学习网络中,由多个医疗挖掘标签(如“症状”和“药品”)对应的基础长短期记忆网络(LSTM)进行处理。每一个LSTM都会根据输入的训练样本数据生成一个训练标签兼容表示向量。比如,“症状”标签的LSTM可能会生成一个代表了各种症状出现频率的向量。
步骤S103,依据目标医疗挖掘标签组合对应的训练标签兼容表示向量,确定所述目标医疗挖掘标签组合对应的跨域代价参数。所述目标医疗挖掘标签组合为所述多个医疗挖掘标签中的任意两个。
例如,可以依据任意两个医疗挖掘标签组合对应的训练标签兼容表示向量,来确定这两个医疗挖掘标签的跨域代价参数。例如,可能会考虑“症状”和“药品”这两个医疗挖掘标签的组合,然后通过比较这两个医疗挖掘标签的训练标签兼容表示向量,计算出一个反映他们关联度的跨域代价参数。
示例性地,跨域代价参数可以使用余弦相似度,将两个向量视为空间中的两个点,通过计算这两个点之间的夹角的余弦值来确定它们的相似度。
给定两个向量A和B,它们的余弦相似度可以通过以下公式计算:
Cosine Similarity = A.B / (||A|| * ||B||)
其中,“.”表示点积运算,"||A||"和"||B||"分别表示向量A和B的模(长度)。
如果有两个医疗挖掘标签:“症状”和“药品”,对应的训练标签兼容表示向量分别为A和B,那么可以用上述公式计算出它们的余弦相似度,作为跨域代价参数。
需要注意的是,这只是一种可能的计算方法。在实际应用中,根据具体需求和数据特性,可能会选择其他的相似度度量或者设计更复杂的计算公式。
步骤S104,依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络。
例如,可以依据得到的跨域代价参数,对对应的基础标签兼容单元进行参数更新,生成目标医疗就诊意图预测网络。这一步的目标是使得目标医疗就诊意图预测网络能够更好地理解不同医疗信息之间的关系,并据此做出更准确的预测。例如,如果发现用户在谈论某种症状时经常也会提到某种药物,那么在更新目标医疗就诊意图预测网络的网络参数时,就会增加这两个医疗挖掘标签之间的关联性,使得目标医疗就诊意图预测网络在处理新的用户对话数据时能够注意到这种关系。
在一种可能的实施方式中,所述每个医疗挖掘标签对应的基础长短期记忆网络包括基础序列生成器和基础注意力学习集成子网络,所述基础注意力学习集成子网络包括第一权重分配器、第一激活函数层、基础标签兼容单元和第一集成单元。
下面详细介绍这些组成部分:
基础序列生成器:这是一个用于处理输入数据的网络结构,通常是一种循环神经网络(如LSTM或GRU)。它可以接受一串输入序列(例如用户的咨询对话记录),并生成一个序列向量信息,即每个元素都是对应的特征表示。
基础注意力学习集成子网络:这是一个专门设计用来对序列生成器产生的特征进行加权和整合的网络结构。它包含以下几个部分:
第一权重分配器:这是一个用于确定不同特征之间重要性的模块。根据每个特征的内容和上下文,第一权重分配器会为每个特征分配一个权重。
第一激活函数层:这是一个使用激活函数(如ReLU、sigmoid等)的网络层,它可以增加网络的非线性,从而提高网络的表达能力。
基础标签兼容单元:这是一个专门处理标签相关信息的网络模块。它可以将输入的特征表示转换为一个标签兼容表示向量,即这个向量反映了输入特征与某个特定标签(如“症状”或“药品”)的关联程度。
第一集成单元:这是一个用于整合所有生成的表示向量的网络模块。它会将所有输入的表示向量(包括从权重分配器、激活函数层和标签兼容单元得到的向量)融合在一起,生成一个最终的训练表示向量。
通过以上的处理,基础长短期记忆网络能够从原始的训练样本数据中提取出有价值的特征,并生成用于预测的训练表示向量。
步骤S102可以包括:
步骤S1021A,将所述第一训练样本数据序列加载到所述每个医疗挖掘标签对应的基础序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的样例序列表示信息。
例如,对于“症状”标签,首先将包含用户提及的所有症状的训练样本数据加载到“症状”标签对应的基础序列生成器中,生成一个代表各种症状出现频率的样例序列表示信息。
步骤S1022A,将所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第一融合表示向量。
然后,将这个样例序列表示信息输入到第一权重分配器中,它会根据每种症状的重要性或出现频率为其分配一个权重,然后将这些带有权重的症状信息融合在一起,生成第一融合表示向量。
步骤S1023A,将所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第一训练表示向量。
接着,将第一融合表示向量和样例序列表示信息输入到第一激活函数层,这一层通常使用某种非线性函数(如ReLU、sigmoid等)来增强模型的表达能力,生成第一训练表示向量。
步骤S1024A,将所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的基础标签兼容单元进行标签兼容转换,生成所述每个医疗挖掘标签对应的第一标签兼容表示向量。
然后,将第一融合表示向量和样例序列表示信息输入到基础标签兼容单元。这个基础标签兼容单元会对输入的第一融合表示向量和样例序列表示信息进行进一步处理,使得生成的第一标签兼容表示向量能够更好地反映出各种症状之间的关系,生成第一标签兼容表示向量。
步骤S1025A,将所述每个医疗挖掘标签对应的第一训练表示向量、所述每个医疗挖掘标签对应的第一标签兼容表示向量、所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一集成单元进行集成处理,生成所述每个医疗挖掘标签对应的第二训练表示向量。
最后,将所有生成的表示向量(包括第一训练表示向量、第一标签兼容表示向量、第一融合表示向量以及样例序列表示信息)输入到第一集成单元。这个第一集成单元会将这些表示向量融合在一起,生成第二训练表示向量。这个第二训练表示向量可以被视为是对原始训练样本数据的一个高级抽象,包含了丰富的特征信息,可以用于后续的意图预测任务。
在一种可能的实施方式中,所述方法还包括:
步骤A110,获取所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第一标注就诊意图数据。
例如,可能有一个由医生或专业人员标注的第一训练样本数据序列,其中包含用户的咨询对话记录以及他们的真实就诊意图(例如,“询问药品副作用”、“预约体检”等)。
步骤A120,将所述每个医疗挖掘标签对应的第二训练表示向量加载到所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第三标签就诊意图数据。
例如,可以将每个医疗挖掘标签对应的第二训练表示向量加载到初始化深度学习网络中的基础意图预测子网络。这个基础意图预测子网络会根据输入的训练表示向量预测出用户的就诊意图,并生成第三标签就诊意图数据。
步骤A130,将所述第一训练样本数据序列加载到所述初始化深度学习网络中的基础重要性因子学习单元进行重要性因子分析,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的样例重要性因子信息。
例如,接下来,可以将第一训练样本数据序列加载到基础重要性因子学习单元。这个基础重要性因子学习单元会分析每个样例医疗咨询对话行为数据的重要性因子,比如,某个特定的词汇或短语在决定就诊意图中的重要性,生成样例重要性因子信息。
步骤A140,依据所述样例重要性因子信息,对所述多个医疗挖掘标签分别对应的第三标签就诊意图数据进行加权融合,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第四标签就诊意图数据。
然后,可以依据样例重要性因子信息,对多个医疗挖掘标签对应的第三标签就诊意图数据进行加权融合,生成第四标签就诊意图数据。这个步骤可以确保在最终的预测结果中,那些重要性较高的因素会被赋予更大的权重。
步骤A150,依据所述第四标签就诊意图数据和所述第一标注就诊意图数据,确定第一重要性因子代价参数。
最后,可以依据第四标签就诊意图数据和第一标注就诊意图数据来确定第一重要性因子代价参数。具体来说,会比较网络的预测结果(第四标签就诊意图数据)与真实标注结果(第一标注就诊意图数据),计算出一个损失值,作为第一重要性因子代价参数。这个第一重要性因子代价参数反映了网络当前的预测性能,可以用于后续的网络优化。
通过以上五个步骤,不仅可以训练网络对用户的医疗咨询对话行为进行准确预测,还可以了解哪些因素在预测过程中起到了关键作用,从而有针对性地优化的预测模型。
由此,在步骤S104中,可以依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述第一重要性因子代价参数,对所述基础重要性因子学习单元进行参数更新,生成所述目标医疗就诊意图预测网络。
例如,首先,根据前面步骤计算出的跨域代价参数,对目标医疗挖掘标签组合(比如“症状”和“药品”)对应的基础标签兼容单元进行参数更新。
例如,如果发现用户在谈论头痛时也经常会提到阿司匹林,那么就可以增加这两个标签之间的关联性,使得在处理新的用户对话数据时能够注意到这种关系。具体来说,可能需要调整基础标签兼容单元中的某些权重或者偏置参数,以便它在接收到“头痛”和“阿司匹林”这两个输入时,能够生成更高的兼容向量值。
然后,还会根据第一重要性因子代价参数,对基础重要性因子学习单元进行参数更新。这个代价参数反映了网络当前的预测性能,通过优化这个代价参数,可以提升网络的预测准确度。
例如,如果发现网络在预测某些类型的就诊意图(比如“询问药品副作用”)时经常出错,那么就可以通过调整基础重要性因子学习单元中的参数,使得网络在处理这类问题时能够更加注重那些与“询问药品副作用”紧密相关的特征。
通过以上两步的参数更新,就生成了目标医疗就诊意图预测网络。这个网络经过了优化,不仅可以更好地理解各种医疗信息之间的关系,还能更准确地预测用户的就诊意图。
在一种可能的实施方式中,所述每个医疗挖掘标签对应的基础长短期记忆网络包括基础序列生成器和基础注意力学习集成子网络,所述基础注意力学习集成子网络包括第二权重分配器、第二激活函数层、基础标签兼容单元和第二集成单元,所述基础标签兼容单元包括第一基础标签兼容转换节点和第二基础标签兼容转换节点。
示例性地,基础长短期记忆网络(LSTM)包括两部分:基础序列生成器和基础注意力学习集成子网络。这些组件都有特定的作用,下面逐一解释:
基础序列生成器:这是一个用于处理输入数据的模块,通常采用循环神经网络(如LSTM或GRU)。它可以接收一串输入序列,并生成相应的序列向量信息。
基础注意力学习集成子网络:这是一个专门设计用来对序列生成器产生的特征进行加权和整合的模块。它包含以下几个部分:
第二权重分配器:这个部分的任务是为每个特征分配一个权重,以表示该特征在最终结果中的重要性。
第二激活函数层:这个部分通常使用某种非线性函数(如ReLU、sigmoid等),增加了网络的非线性,从而提高网络的表达能力。
基础标签兼容单元:这个部分包含两个节点,即第一基础标签兼容转换节点和第二基础标签兼容转换节点,它们将输入的特征表示转换为标签兼容表示向量,即这个向量反映了输入特征与某个特定标签(如“症状”或“药品”)的关联程度。
第二集成单元:这是一个用于整合所有生成的表示向量的模块,它将所有输入的表示向量融合在一起,生成一个最终的训练表示向量。
通过以上的处理,基础长短期记忆网络能够从原始的训练样本数据中提取出有价值的特征,并生成用于预测的训练表示向量。
也即,本实施例描述的是更深层次、更复杂的医疗挖掘标签对应的基础长短期记忆网络(LSTM)结构,以下是具体场景例子:
步骤S102可以包括:
步骤S1021B,将所述第一训练样本数据序列加载到所述每个医疗挖掘标签对应的基础序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的样例序列表示信息。
例如,“症状”标签的基础序列生成器可能会接收用户提到的所有症状信息,并将其转换为一个向量,每个元素都代表一个特定的症状出现的频率或重要性。
步骤S1022B,将所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第二融合表示向量。
然后,第二权重分配器会根据每个症状在咨询对话中的上下文和重要性,为每个症状分配一个权重,并生成一个融合了这些权重的第二融合表示向量。
步骤S1023B,将所述每个医疗挖掘标签对应的第二融合表示向量加载到所述每个医疗挖掘标签对应的第一基础标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第二标签兼容表示向量。
例如,第一基础标签兼容转换节点会将第二融合表示向量转换为第二标签兼容表示向量,这个第二标签兼容表示向量可以更好地反映各种症状之间的关系。
步骤S1024B,将所述每个医疗挖掘标签对应的第二标签兼容表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第三训练表示向量。
然后,第二激活函数层会接收第二标签兼容表示向量和样例序列表示信息,并通过非线性转换生成第三训练表示向量。
步骤S1025B,将所述每个医疗挖掘标签对应的第三训练表示向量加载到所述每个医疗挖掘标签对应的第二基础标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第三标签兼容表示向量。
然后,第二基础标签兼容转换节点将第三训练表示向量进行进一步的转换,生成第三标签兼容表示向量。
步骤S1026B,将所述每个医疗挖掘标签对应的第三标签兼容表示向量、所述每个医疗挖掘标签对应的第二标签兼容表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二集成单元进行集成处理,生成所述每个医疗挖掘标签对应的第四训练表示向量。
最后,第二集成单元会将第三标签兼容表示向量、第二标签兼容表示向量和样例序列表示信息进行集成处理,生成第四训练表示向量。
在这个过程中,每一步都在对输入的数据进行更深层次、更复杂的处理和转换,使得最后生成的训练表示向量能够更好地反映出原始数据中的特征和关系,从而提高模型的预测性能。
在一种可能的实施方式中,所述方法还包括:
步骤B110,获取所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第一标注就诊意图数据。
步骤B120,将所述每个医疗挖掘标签对应的第四训练表示向量加载到所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第五标签就诊意图数据。
步骤B130,将所述第一训练样本数据序列加载到所述初始化深度学习网络中的基础重要性因子学习单元进行重要性因子分析,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的样例重要性因子信息。
步骤B140,依据所述样例重要性因子信息,对所述多个医疗挖掘标签分别对应的第五标签就诊意图数据进行加权融合,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第六标签就诊意图数据。
步骤B150,依据所述第六标签就诊意图数据和所述第一标注就诊意图数据,确定第二重要性因子代价参数。
由此,在步骤S104中,可以依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述第二重要性因子代价参数,对所述基础重要性因子学习单元进行参数更新,生成所述目标医疗就诊意图预测网络。
例如,可能有一个由医生或专业人员标注的数据集,其中包含用户的咨询对话记录以及他们的真实就诊意图(例如,“询问药品副作用”、“预约体检”等)。
然后,将每个医疗挖掘标签对应的第四训练表示向量加载到初始化深度学习网络中的基础意图预测子网络。这个子网络会根据输入的训练表示向量预测出用户的就诊意图,并生成第五标签就诊意图数据。
接下来,将第一训练样本数据序列加载到基础重要性因子学习单元。这个单元会分析每个样例医疗咨询对话行为数据的重要性因子,比如,某个特定的词汇或短语在决定就诊意图中的重要性,生成样例重要性因子信息。
然后,会依据样例重要性因子信息,对多个医疗挖掘标签对应的第五标签就诊意图数据进行加权融合,生成第六标签就诊意图数据。这个步骤可以确保在最终的预测结果中,那些重要性较高的因素会被赋予更大的权重。
最后,会依据第六标签就诊意图数据和第一标注就诊意图数据来确定第二重要性因子代价参数。具体来说,会比较网络的预测结果(第六标签就诊意图数据)与真实标注结果(第一标注就诊意图数据),计算出一个损失值,作为第二重要性因子代价参数。这个参数反映了网络当前的预测性能,可以用于后续的网络优化。
最后,根据目标医疗挖掘标签组合对应的跨域代价参数,对基础标签兼容单元进行参数更新,同时也依据第二重要性因子代价参数,对基础重要性因子学习单元进行参数更新,最终生成优化后的目标医疗就诊意图预测网络。
这些步骤大致描述了一个完整的深度学习模型训练过程,包括数据输入、预测、损失计算和参数更新等环节。通过不断地迭代这个过程,可以逐步提高模型的预测性能。
在一种可能的实施方式中,所述方法还包括:
步骤C110,获取第二训练样本数据序列和所述第二训练样本数据序列中每个样例医疗咨询对话行为数据对应的第二标注就诊意图数据。
例如,这可能涉及到从医疗数据库中收集额外的患者咨询记录,同时获取相应的专业医生进行标注的就诊意图,如“咨询药物副作用”、“预约手术”等。
步骤C120,将所述第二训练样本数据序列加载到所述初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的第五训练表示向量。
在这一步,将新获取的第二训练样本数据序列加载到基础长短期记忆网络中。以"症状"标签为例,基础长短期记忆网络会学习并提取出与症状相关的重要特征,比如用户所描述的具体症状、症状的严重程度等,然后将这些特征转化为一个表示向量。
步骤C130,将所述每个医疗挖掘标签对应的第五训练表示向量加载到所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第七标签就诊意图数据。
此步骤中,上一步生成的第五训练表示向量会被加载到基础意图预测子网络中。基础意图预测子网络根据输入的第五训练表示向量预测用户的就诊意图,比如是咨询药物信息还是预约体检,并生成对应的就诊意图数据。
步骤C140,依据所述每个医疗挖掘标签对应的第七标签就诊意图数据和所述第二标注就诊意图数据,确定所述每个医疗挖掘标签对应的标签代价参数。
这里,将预测出的就诊意图数据(第七标签就诊意图数据)与真实的标注就诊意图数据(第二标注就诊意图数据)进行对比,计算出预测结果与真实情况之间的差异,这个差异即为标签代价参数。
由此,在步骤S104中,可以依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述每个医疗挖掘标签对应的标签代价参数,对所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基准网络结构进行参数更新,生成所述目标医疗就诊意图预测网络。所述每个医疗挖掘标签对应的基准网络结构为所述每个医疗挖掘标签对应的基础长短期记忆网络中除所述每个医疗挖掘标签对应的基础标签兼容单元以外的网络单元结构。
在这个步骤中,首先根据之前计算得到的跨域代价参数来更新基础标签兼容单元的参数,然后再根据新计算出的标签代价参数来更新初始化深度学习网络中的其他部分(即基准网络结构)。经过这一系列的参数更新,最终会得到一个优化后的、用于预测用户就诊意图的深度学习网络。
基础标签兼容单元负责将输入的特征表示转换为标签兼容表示向量,即这个标签兼容表示向量反映了输入特征与某个特定标签(如“症状”或“药品”)的关联程度。
每个医疗挖掘标签对应的标签代价参数反映了在预测每个医疗挖掘标签时的误差。例如,如果网络预测一个用户的症状是“头痛”,但实际的标注结果是“胃痛”,那么就会产生一个标签代价。
基准网络结构是指除基础标签兼容单元以外的网络结构,它可能包括各种类型的神经网络层,如卷积层、全连接层等。
在这个过程中,首先根据跨域代价参数来更新基础标签兼容单元的参数,然后再根据每个医疗挖掘标签对应的标签代价参数来更新基准网络结构的参数。通过这样的参数更新,可以逐步降低网络的预测误差,从而提高其预测性能。
在一种可能的实施方式中,本实施例可以将所述目标医疗咨询对话行为数据加载到所述目标医疗就诊意图预测网络中的目标重要性因子学习单元进行重要性因子分析,生成目标重要性因子信息。由此,在步骤S130中,可以依据所述目标重要性因子信息,对所述多个医疗挖掘标签分别对应的第一标签就诊意图数据进行加权融合,生成所述目标医疗咨询对话行为数据对应的第二标签就诊意图数据。然后,依据所述第二标签就诊意图数据,确定所述目标就诊意图信息。
例如,首先,将新收集的目标医疗咨询对话行为数据(例如,一个患者新提交的在线咨询请求)加载到目标医疗就诊意图预测网络中的目标重要性因子学习单元。该目标重要性因子学习单元会分析对话内容中各个部分的重要性,比如某个特定的词汇或短语在决定就诊意图中的重要性,生成目标重要性因子信息。
然后,根据之前的训练结果(即多个医疗挖掘标签分别对应的第一标签就诊意图数据),以及新计算出的目标重要性因子信息,对这些就诊意图数据进行加权融合。例如,如果重要性因子显示“头痛”这个词非常重要,那么在融合过程中,与“头痛”相关的意图(如“咨询关于头痛的药品”)可能会被赋予更大的权重。这样就得到了目标医疗咨询对话行为数据对应的第二标签就诊意图数据。
最后,依据第二标签就诊意图数据,确定出用户的目标就诊意图信息。例如,如果第二标签就诊意图数据中,“咨询关于头痛的药品”这个意图得到了最高的分数,那么就可以判断用户的目标就诊意图是“咨询关于头痛的药品”。
在一种可能的实施方式中,步骤S120可以包括:
步骤S121,将所述目标医疗咨询对话行为数据加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的目标序列向量信息。
步骤S122,将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标注意力集成子网络进行显著性特征表示,生成所述每个医疗挖掘标签对应的目标显著性表示向量。
例如,首先,将新收集的目标医疗咨询对话行为数据(例如,一个患者新提交的在线咨询请求)加载到每个医疗挖掘标签对应的目标长短期记忆网络中的目标序列生成器。例如,如果有一个“症状”标签,那么对应的目标序列生成器就会接收输入数据,然后提取出与“症状”相关的序列向量信息,如用户描述的具体症状、症状的严重程度等。
然后,将上一步得到的目标序列向量信息加载到每个医疗挖掘标签对应的目标长短期记忆网络中的目标注意力集成子网络。这个目标注意力集成子网络会分析每个序列向量的重要性,并据此生成一个目标显著性表示向量。比如,在“症状”标签对应的子网络中,如果序列向量信息显示“头痛”这个词出现了很多次,那么在生成目标显著性表示向量时,“头痛”可能会被赋予较大的权重。
以上步骤的主要目的是从新的咨询对话行为数据中提取出有价值的特征,并将这些特征转化为可用于进一步处理(如意图预测)的表示向量。
在一种可能的实施方式中,所述每个医疗挖掘标签对应的目标注意力集成子网络包括第三权重分配器、第三激活函数层、目标标签兼容转换节点和第三集成单元。
步骤S122可以包括:
步骤S1221A,将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第三权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第三融合表示向量。
步骤S1222A,将所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的第三激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第一标签表示向量。
步骤S1223A,将所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第四标签兼容表示向量。
步骤S1224A,将所述每个医疗挖掘标签对应的第四标签兼容表示向量、所述每个医疗挖掘标签对应的第一标签表示向量、所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的第三集成单元进行集成处理,生成所述每个医疗挖掘标签对应的目标显著性表示向量。
例如,首先将每个医疗挖掘标签对应的目标序列向量信息加载到第三权重分配器进行权重分配与融合。比如,如果“头痛”这个词在“症状”标签对应的序列向量信息中频繁出现,那么在生成第三融合表示向量时,“头痛”可能会被赋予较大的权重。
然后,将目标序列向量信息和第三融合表示向量加载到第三激活函数层进行激活处理。这个激活函数层可能包含ReLU、Sigmoid等激活函数,用于增加模型的非线性,并生成每个医疗挖掘标签对应的第一标签表示向量。
接着,将目标序列向量信息和第三融合表示向量加载到目标标签兼容转换节点进行标签兼容转换。这个转换节点将输入向量转化为与目标标签(如“症状”或“药品”)兼容的形式,并生成第四标签兼容表示向量。
最后,将第四标签兼容表示向量、第一标签表示向量、目标序列向量信息和第三融合表示向量加载到第三集成单元进行集成处理。这个集成单元可能会对各个输入向量进行加权求和、拼接等操作,最终生成每个医疗挖掘标签对应的目标显著性表示向量。
或者,所述每个医疗挖掘标签对应的目标注意力集成子网络包括第四权重分配器、第四激活函数层、目标标签兼容转换节点和第四集成单元,所述每个医疗挖掘标签对应的目标标签兼容转换节点包括第一目标标签兼容转换节点和第二目标标签兼容转换节点。
步骤S122可以包括:
步骤S1221B,将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第四融合表示向量。
步骤S1222B,将所述每个医疗挖掘标签对应的第四融合表示向量加载到所述每个医疗挖掘标签对应的第一目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第五标签兼容表示向量。
步骤S1223B,将所述每个医疗挖掘标签对应的第五标签兼容表示向量和所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第二标签表示向量。
步骤S1224B,将所述每个医疗挖掘标签对应的第二标签表示向量加载到所述每个医疗挖掘标签对应的第二目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第六标签兼容表示向量。
步骤S1225B,将所述每个医疗挖掘标签对应的第六标签兼容表示向量、所述每个医疗挖掘标签对应的第五标签兼容表示向量和所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四集成单元进行集成处理,生成所述每个医疗挖掘标签对应的目标显著性表示向量。
例如,首先将每个医疗挖掘标签对应的目标序列向量信息加载到第四权重分配器进行权重分配与融合。例如,如果在“药品”标签对应的序列向量信息中,“阿司匹林”这个词出现频率较高,那么在生成第四融合表示向量时,“阿司匹林”可能会被赋予更大的权重。
接着,将第四融合表示向量加载到第一目标标签兼容转换节点进行标签兼容转换。这个节点的作用是将输入的表示向量转化为与目标标签(如“药品”或“症状”)兼容的形式,并生成第五标签兼容表示向量。
然后,将第五标签兼容表示向量和目标序列向量信息加载到第四激活函数层进行激活处理。这个激活函数层可能包含ReLU、Sigmoid等激活函数,用于增加模型的非线性,并生成每个医疗挖掘标签对应的第二标签表示向量。
接下来,将第二标签表示向量加载到第二目标标签兼容转换节点进行标签兼容转换。这个节点的作用是进一步优化标签兼容表示向量,使其更好地反映目标标签的特性,生成第六标签兼容表示向量。
最后,将第六标签兼容表示向量、第五标签兼容表示向量和目标序列向量信息加载到第四集成单元进行集成处理。这个集成单元可能会对各个输入向量进行加权求和、拼接等操作,最终生成每个医疗挖掘标签对应的目标显著性表示向量。
进一步地,图2示出了一种用于实现本申请实施例所提供的方法的医疗信息管理系统100的硬件结构示意图。如图2所示,医疗信息管理系统100可以包括一个或多个处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106以及控制器108。本领域普通技术人员可以理解,图2所示的结构仅为示意,其并不对上述医疗信息管理系统100的结构造成限定。例如,医疗信息管理系统100还可包括比图2中所示更多或者更少的组件,或者具有与图2所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中上述的方法实施例对应的程序指令,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的一种基于大数据的医疗信息管理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其它非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至医疗信息管理系统100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括医疗信息管理系统100的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器,其可通过基站与其它网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频模块,其用于通过无线方式与互联网进行通讯。
需要说明的是:上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本申请实施例特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以依据不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本申请实施例中的各个实施例均依据递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于以上不同实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,上述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
Claims (10)
1.一种基于大数据的医疗信息管理方法,其特征在于,所述方法包括:
从目标医疗服务应用的医疗页面操作大数据中获取目标医疗咨询对话行为数据;
将所述目标医疗咨询对话行为数据加载到目标医疗就诊意图预测网络中的多个医疗挖掘标签分别对应的目标长短期记忆网络进行特征提取,生成每个医疗挖掘标签对应的目标显著性表示向量;所述目标医疗就诊意图预测网络为依据跨域代价参数对基础长短期记忆网络中的基础标签兼容单元进行网络参数更新生成的,所述跨域代价参数表征目标标签兼容表示向量的关联度,所述目标标签兼容表示向量为任意两个医疗挖掘标签对应的基础标签兼容单元生成的标签兼容表示向量;
将所述每个医疗挖掘标签对应的目标显著性表示向量加载到所述每个医疗挖掘标签对应的目标意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第一标签就诊意图数据,并依据所述多个医疗挖掘标签分别对应的第一标签就诊意图数据,确定所述目标医疗咨询对话行为数据对应的目标就诊意图信息;
基于所述目标医疗咨询对话行为数据对应的目标就诊意图信息对对应的医疗服务用户推送对应的医疗内容信息。
2.根据权利要求1所述的基于大数据的医疗信息管理方法,其特征在于,所述目标医疗就诊意图预测网络的训练步骤,包括:
获取第一训练样本数据序列;
将所述第一训练样本数据序列加载到初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的训练标签兼容表示向量;
依据目标医疗挖掘标签组合对应的训练标签兼容表示向量,确定所述目标医疗挖掘标签组合对应的跨域代价参数;所述目标医疗挖掘标签组合为所述多个医疗挖掘标签中的任意两个;
依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络。
3.根据权利要求2所述的基于大数据的医疗信息管理方法,其特征在于,所述每个医疗挖掘标签对应的基础长短期记忆网络包括基础序列生成器和基础注意力学习集成子网络,所述基础注意力学习集成子网络包括第一权重分配器、第一激活函数层、基础标签兼容单元和第一集成单元;
所述将所述第一训练样本数据序列加载到初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的训练标签兼容表示向量,包括:
将所述第一训练样本数据序列加载到所述每个医疗挖掘标签对应的基础序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的样例序列表示信息;
将所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第一融合表示向量;
将所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第一训练表示向量;
将所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的基础标签兼容单元进行标签兼容转换,生成所述每个医疗挖掘标签对应的第一标签兼容表示向量;
将所述每个医疗挖掘标签对应的第一训练表示向量、所述每个医疗挖掘标签对应的第一标签兼容表示向量、所述每个医疗挖掘标签对应的第一融合表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第一集成单元进行集成处理,生成所述每个医疗挖掘标签对应的第二训练表示向量;
所述方法还包括:
获取所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第一标注就诊意图数据;
将所述每个医疗挖掘标签对应的第二训练表示向量加载到所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第三标签就诊意图数据;
将所述第一训练样本数据序列加载到所述初始化深度学习网络中的基础重要性因子学习单元进行重要性因子分析,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的样例重要性因子信息;
依据所述样例重要性因子信息,对所述多个医疗挖掘标签分别对应的第三标签就诊意图数据进行加权融合,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第四标签就诊意图数据;
依据所述第四标签就诊意图数据和所述第一标注就诊意图数据,确定第一重要性因子代价参数;
所述依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络,包括:
依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述第一重要性因子代价参数,对所述基础重要性因子学习单元进行参数更新,生成所述目标医疗就诊意图预测网络。
4.根据权利要求2所述的基于大数据的医疗信息管理方法,其特征在于,所述每个医疗挖掘标签对应的基础长短期记忆网络包括基础序列生成器和基础注意力学习集成子网络,所述基础注意力学习集成子网络包括第二权重分配器、第二激活函数层、基础标签兼容单元和第二集成单元,所述基础标签兼容单元包括第一基础标签兼容转换节点和第二基础标签兼容转换节点;
所述将所述第一训练样本数据序列加载到初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的训练标签兼容表示向量,包括:
将所述第一训练样本数据序列加载到所述每个医疗挖掘标签对应的基础序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的样例序列表示信息;
将所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第二融合表示向量;
将所述每个医疗挖掘标签对应的第二融合表示向量加载到所述每个医疗挖掘标签对应的第一基础标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第二标签兼容表示向量;
将所述每个医疗挖掘标签对应的第二标签兼容表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第三训练表示向量;
将所述每个医疗挖掘标签对应的第三训练表示向量加载到所述每个医疗挖掘标签对应的第二基础标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第三标签兼容表示向量;
将所述每个医疗挖掘标签对应的第三标签兼容表示向量、所述每个医疗挖掘标签对应的第二标签兼容表示向量和所述每个医疗挖掘标签对应的样例序列表示信息加载到所述每个医疗挖掘标签对应的第二集成单元进行集成处理,生成所述每个医疗挖掘标签对应的第四训练表示向量。
5.根据权利要求4所述的基于大数据的医疗信息管理方法,其特征在于,所述方法还包括:
获取所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第一标注就诊意图数据;
将所述每个医疗挖掘标签对应的第四训练表示向量加载到所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第五标签就诊意图数据;
将所述第一训练样本数据序列加载到所述初始化深度学习网络中的基础重要性因子学习单元进行重要性因子分析,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的样例重要性因子信息;
依据所述样例重要性因子信息,对所述多个医疗挖掘标签分别对应的第五标签就诊意图数据进行加权融合,生成所述第一训练样本数据序列中每个样例医疗咨询对话行为数据对应的第六标签就诊意图数据;
依据所述第六标签就诊意图数据和所述第一标注就诊意图数据,确定第二重要性因子代价参数;
所述依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络,包括:
依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述第二重要性因子代价参数,对所述基础重要性因子学习单元进行参数更新,生成所述目标医疗就诊意图预测网络。
6.根据权利要求2所述的基于大数据的医疗信息管理方法,其特征在于,所述方法还包括:
获取第二训练样本数据序列和所述第二训练样本数据序列中每个样例医疗咨询对话行为数据对应的第二标注就诊意图数据;
将所述第二训练样本数据序列加载到所述初始化深度学习网络中的所述多个医疗挖掘标签分别对应的基础长短期记忆网络进行特征提取,生成所述每个医疗挖掘标签对应的第五训练表示向量;
将所述每个医疗挖掘标签对应的第五训练表示向量加载到所述每个医疗挖掘标签对应的基础意图预测子网络进行意图预测,生成所述每个医疗挖掘标签对应的第七标签就诊意图数据;
依据所述每个医疗挖掘标签对应的第七标签就诊意图数据和所述第二标注就诊意图数据,确定所述每个医疗挖掘标签对应的标签代价参数;
所述依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,生成所述目标医疗就诊意图预测网络,包括:
依据所述目标医疗挖掘标签组合对应的跨域代价参数,对所述目标医疗挖掘标签组合对应的基础标签兼容单元进行参数更新,并依据所述每个医疗挖掘标签对应的标签代价参数,对所述初始化深度学习网络中的所述每个医疗挖掘标签对应的基准网络结构进行参数更新,生成所述目标医疗就诊意图预测网络;所述每个医疗挖掘标签对应的基准网络结构为所述每个医疗挖掘标签对应的基础长短期记忆网络中除所述每个医疗挖掘标签对应的基础标签兼容单元以外的网络单元结构。
7.根据权利要求1所述的基于大数据的医疗信息管理方法,其特征在于,所述方法还包括:
将所述目标医疗咨询对话行为数据加载到所述目标医疗就诊意图预测网络中的目标重要性因子学习单元进行重要性因子分析,生成目标重要性因子信息;
所述依据所述多个医疗挖掘标签分别对应的第一标签就诊意图数据,确定所述目标医疗咨询对话行为数据对应的目标就诊意图信息,包括:
依据所述目标重要性因子信息,对所述多个医疗挖掘标签分别对应的第一标签就诊意图数据进行加权融合,生成所述目标医疗咨询对话行为数据对应的第二标签就诊意图数据;
依据所述第二标签就诊意图数据,确定所述目标就诊意图信息。
8.根据权利要求1所述的基于大数据的医疗信息管理方法,其特征在于,所述将所述目标医疗咨询对话行为数据加载到目标医疗就诊意图预测网络中的多个医疗挖掘标签分别对应的目标长短期记忆网络进行特征提取,生成每个医疗挖掘标签对应的目标显著性表示向量,包括:
将所述目标医疗咨询对话行为数据加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标序列生成器进行序列向量信息生成,生成所述每个医疗挖掘标签对应的目标序列向量信息;
将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标注意力集成子网络进行显著性特征表示,生成所述每个医疗挖掘标签对应的目标显著性表示向量。
9.根据权利要求8所述的基于大数据的医疗信息管理方法,其特征在于,所述每个医疗挖掘标签对应的目标注意力集成子网络包括第三权重分配器、第三激活函数层、目标标签兼容转换节点和第三集成单元;
所述将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标注意力集成子网络进行显著性特征表示,生成所述每个医疗挖掘标签对应的目标显著性表示向量,包括:
将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第三权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第三融合表示向量;
将所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的第三激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第一标签表示向量;
将所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第四标签兼容表示向量;
将所述每个医疗挖掘标签对应的第四标签兼容表示向量、所述每个医疗挖掘标签对应的第一标签表示向量、所述每个医疗挖掘标签对应的目标序列向量信息和所述每个医疗挖掘标签对应的第三融合表示向量加载到所述每个医疗挖掘标签对应的第三集成单元进行集成处理,生成所述每个医疗挖掘标签对应的目标显著性表示向量;
或者,所述每个医疗挖掘标签对应的目标注意力集成子网络包括第四权重分配器、第四激活函数层、目标标签兼容转换节点和第四集成单元,所述每个医疗挖掘标签对应的目标标签兼容转换节点包括第一目标标签兼容转换节点和第二目标标签兼容转换节点;
所述将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的目标长短期记忆网络中的目标注意力集成子网络进行显著性特征表示,生成所述每个医疗挖掘标签对应的目标显著性表示向量,包括:
将所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四权重分配器进行权重分配与融合,生成所述每个医疗挖掘标签对应的第四融合表示向量;
将所述每个医疗挖掘标签对应的第四融合表示向量加载到所述每个医疗挖掘标签对应的第一目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第五标签兼容表示向量;
将所述每个医疗挖掘标签对应的第五标签兼容表示向量和所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四激活函数层进行激活处理,生成所述每个医疗挖掘标签对应的第二标签表示向量;
将所述每个医疗挖掘标签对应的第二标签表示向量加载到所述每个医疗挖掘标签对应的第二目标标签兼容转换节点进行标签兼容转换,生成所述每个医疗挖掘标签对应的第六标签兼容表示向量;
将所述每个医疗挖掘标签对应的第六标签兼容表示向量、所述每个医疗挖掘标签对应的第五标签兼容表示向量和所述每个医疗挖掘标签对应的目标序列向量信息加载到所述每个医疗挖掘标签对应的第四集成单元进行集成处理,生成所述每个医疗挖掘标签对应的目标显著性表示向量。
10.一种基于大数据的医疗信息管理系统,其特征在于,所述医疗信息管理系统包括处理器以及可读存储介质,所述可读存储介质存储有程序,该程序被处理器执行时实现权利要求1-9任意一项所述的基于大数据的医疗信息管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311509573.2A CN117238527B (zh) | 2023-11-14 | 2023-11-14 | 基于大数据的医疗信息管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311509573.2A CN117238527B (zh) | 2023-11-14 | 2023-11-14 | 基于大数据的医疗信息管理方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117238527A true CN117238527A (zh) | 2023-12-15 |
CN117238527B CN117238527B (zh) | 2024-02-13 |
Family
ID=89089722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311509573.2A Active CN117238527B (zh) | 2023-11-14 | 2023-11-14 | 基于大数据的医疗信息管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117238527B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118467607A (zh) * | 2024-07-12 | 2024-08-09 | 成都乐超人科技有限公司 | 基于物联网的用户行为数据挖掘方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069631A (zh) * | 2019-04-08 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN110110059A (zh) * | 2019-05-20 | 2019-08-09 | 挂号网(杭州)科技有限公司 | 一种基于深度学习的医疗对话系统意图识别分类方法 |
CN111816301A (zh) * | 2020-07-07 | 2020-10-23 | 平安科技(深圳)有限公司 | 医疗问诊辅助方法、装置、电子设备及介质 |
CN112382387A (zh) * | 2020-04-19 | 2021-02-19 | 周玉娟 | 基于大数据的智慧医疗信息推送方法、装置及医疗云平台 |
CN114579723A (zh) * | 2022-03-02 | 2022-06-03 | 平安科技(深圳)有限公司 | 问诊方法和装置、电子设备及存储介质 |
CN114678137A (zh) * | 2022-03-21 | 2022-06-28 | 刘玉达 | 基于数字化医疗的大数据挖掘方法及服务器 |
EP4199002A1 (en) * | 2021-12-16 | 2023-06-21 | Koninklijke Philips N.V. | A computer implemented method and a system |
CN117038096A (zh) * | 2023-08-18 | 2023-11-10 | 南京航空航天大学 | 一种基于低资源医疗数据与知识挖掘的慢性疾病预测方法 |
-
2023
- 2023-11-14 CN CN202311509573.2A patent/CN117238527B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069631A (zh) * | 2019-04-08 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 一种文本处理方法、装置以及相关设备 |
CN110110059A (zh) * | 2019-05-20 | 2019-08-09 | 挂号网(杭州)科技有限公司 | 一种基于深度学习的医疗对话系统意图识别分类方法 |
CN112382387A (zh) * | 2020-04-19 | 2021-02-19 | 周玉娟 | 基于大数据的智慧医疗信息推送方法、装置及医疗云平台 |
CN111816301A (zh) * | 2020-07-07 | 2020-10-23 | 平安科技(深圳)有限公司 | 医疗问诊辅助方法、装置、电子设备及介质 |
EP4199002A1 (en) * | 2021-12-16 | 2023-06-21 | Koninklijke Philips N.V. | A computer implemented method and a system |
CN114579723A (zh) * | 2022-03-02 | 2022-06-03 | 平安科技(深圳)有限公司 | 问诊方法和装置、电子设备及存储介质 |
CN114678137A (zh) * | 2022-03-21 | 2022-06-28 | 刘玉达 | 基于数字化医疗的大数据挖掘方法及服务器 |
CN117038096A (zh) * | 2023-08-18 | 2023-11-10 | 南京航空航天大学 | 一种基于低资源医疗数据与知识挖掘的慢性疾病预测方法 |
Non-Patent Citations (1)
Title |
---|
姚智: "基于深度学习的医疗问答系统的开发", 《中国医疗设备》, vol. 34, no. 12, pages 88 - 91 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118467607A (zh) * | 2024-07-12 | 2024-08-09 | 成都乐超人科技有限公司 | 基于物联网的用户行为数据挖掘方法及系统 |
CN118467607B (zh) * | 2024-07-12 | 2024-09-27 | 成都乐超人科技有限公司 | 基于物联网的用户行为数据挖掘方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117238527B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Disease prediction via graph neural networks | |
US10847265B2 (en) | Systems and methods for responding to healthcare inquiries | |
EP3895178A1 (en) | System and method for providing health information | |
US8156062B2 (en) | Method for constructing database to deduce disease and providing U-health service using a subset of ontologies | |
US20200265953A1 (en) | Identifying Valid Medical Data for Facilitating Accurate Medical Diagnosis | |
US20100324927A1 (en) | Senior care navigation systems and methods for using the same | |
WO2016170368A1 (en) | Computer implemented method for determining clinical trial suitability or relevance | |
WO2022068160A1 (zh) | 基于人工智能的重症问诊数据识别方法、装置、设备及介质 | |
CN117238527B (zh) | 基于大数据的医疗信息管理方法及系统 | |
Oliveira et al. | Development and implementation of clinical guidelines: an artificial intelligence perspective | |
WO2023178971A1 (zh) | 就医的互联网挂号方法、装置、设备及存储介质 | |
WO2021151356A1 (zh) | 分诊数据处理方法、装置、计算机设备及存储介质 | |
CN111933306A (zh) | 医疗咨询系统及方法、存储介质及电子设备 | |
Ulieru | Internet-enabled soft computing holarchies for e-health applications-soft computing enhancing the internet and the internet enhancing soft computing | |
CN111429985B (zh) | 电子病历数据处理方法及系统 | |
Li | Knowledge-based problem solving: an approach to health assessment | |
Mavropoulos et al. | Smart integration of sensors, computer vision and knowledge representation for intelligent monitoring and verbal human-computer interaction | |
CN117912707A (zh) | 一种智能医疗助手的实现方法及相关装置 | |
Perera et al. | Data driven knowledge acquisition method for domain knowledge enrichment in the healthcare | |
Zaouga et al. | A decision support system for project risk management based on ontology learning | |
Teixeira et al. | Information usefulness as a strategy for action selection in health dialogues | |
Valls et al. | Information flow in graph neural networks: A clinical triage use case | |
Galitsky | LLM-Based Personalized Recommendations in Health | |
Shali et al. | Bots Using Natural Language Processing in Medical Sector | |
Ulman | An ontological framework for assisting people with disabilities in organisations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |