CN112017789B - 分诊数据处理方法、装置、设备及介质 - Google Patents

分诊数据处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN112017789B
CN112017789B CN202010940847.3A CN202010940847A CN112017789B CN 112017789 B CN112017789 B CN 112017789B CN 202010940847 A CN202010940847 A CN 202010940847A CN 112017789 B CN112017789 B CN 112017789B
Authority
CN
China
Prior art keywords
term
triage
diagnosis
short
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010940847.3A
Other languages
English (en)
Other versions
CN112017789A (zh
Inventor
赵惟
徐卓扬
左磊
赵婷婷
孙行智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010940847.3A priority Critical patent/CN112017789B/zh
Priority to PCT/CN2020/124220 priority patent/WO2021151327A1/zh
Publication of CN112017789A publication Critical patent/CN112017789A/zh
Application granted granted Critical
Publication of CN112017789B publication Critical patent/CN112017789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及数据处理领域,提供一种分诊数据处理方法、装置、设备及介质,所述方法包括:接收到包含患者的就诊数据的分诊请求;获取与患者标识码关联的历史就诊信息,将历史就诊信息和就诊数据确定为患者的待分诊数据;通过短期分诊知识模型对待分诊数据进行群体划分,得到患者群体结果和短期分诊结果;获取与患者群体结果相匹配的基于深度强化学习的长期分诊模型;通过长期分诊模型对就诊数据进行预测,得到长期分诊结果;根据短期分诊结果和长期分诊结果,确定患者的最终分诊结果并输出。本发明实现了快速地、准确地对患者进行自动分诊,节省了患者时间,提升了就诊准确率。本发明适用于智慧医疗等领域,可进一步推动智慧城市的建设。

Description

分诊数据处理方法、装置、设备及介质
技术领域
本发明涉及大数据的数据处理领域,尤其涉及一种分诊数据处理方法、装置、设备及介质。
背景技术
目前,患者去医院就诊时,首先需要去分诊台进行人工分诊,在该过程中患者需要消耗大量排队时间,而且对分诊台的服务人员的专业知识深度及广度上有较高的要求,如果服务人员给患者分诊错误,又需要重新进行分诊,大大浪费患者的时间,严重影响患者体验,因此,在现有技术上,患者进行人工分诊过程中耗时长、很难给出合理的就诊科室或者就诊医生,从而导致患者体验差,以及就诊准确率低。
发明内容
本发明提供一种分诊数据处理方法、装置、计算机设备及存储介质,实现了通过基于决策树的短期分诊知识模型和基于深度强化学习的长期分诊模型分别对患者的就诊数据进行识别,最终融合输出分诊结果,本发明适用于智慧医疗等领域,可进一步推动智慧城市的建设,能够实现快速地、准确地对患者进行自动分诊,节省了患者时间,提升了就诊准确率,提升了患者体验。
一种分诊数据处理方法,包括:
接收到包含患者的就诊数据的分诊请求;所述就诊数据包括患者标识码;
获取与所述患者标识码关联的历史就诊信息,将所述历史就诊信息和所述就诊数据确定为所述患者的待分诊数据;
将所述待分诊数据输入基于决策树的短期分诊知识模型中,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,得到患者群体结果和短期分诊结果;
获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型;
通过所述长期分诊模型对所述就诊数据进行预测,得到长期分诊结果;
根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出。
一种分诊数据处理装置,包括:
接收模块,用于接收到包含患者的就诊数据的分诊请求;所述就诊数据包括患者标识码;
获取模块,用于获取与所述患者标识码关联的历史就诊信息,将所述历史就诊信息和所述就诊数据确定为所述患者的待分诊数据;
划分模块,用于将所述待分诊数据输入基于决策树的短期分诊知识模型中,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,得到患者群体结果和短期分诊结果;
匹配模块,用于获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型;
预测模块,用于通过所述长期分诊模型对所述就诊数据进行预测,得到长期分诊结果;
输出模块,用于根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述分诊数据处理方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述分诊数据处理方法的步骤。
本发明提供的分诊数据处理方法、装置、计算机设备及存储介质,通过接收到包含患者的就诊数据的分诊请求;获取与所述就诊数据中的患者标识码关联的历史就诊信息,将所述历史就诊信息和所述就诊数据确定为所述患者的待分诊数据;将所述待分诊数据输入基于决策树的短期分诊知识模型中,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,得到患者群体结果和短期分诊结果;获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型;通过所述长期分诊模型对所述就诊数据进行预测,得到长期分诊结果;根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出,如此,实现了获取患者的历史就诊信息,通过基于决策树的短期分诊知识模型划分出与患者对应的患者群体和短期分诊结果,再通过患者群体匹配出基于深度强化学习的长期分诊模型,并预测出长期分诊结果,融合短期分诊结果和长期分诊结果确定出最终分诊结果,因此,实现了结合患者历史就诊信息提取患者特征,并通过基于决策树的短期分诊知识模型和基于深度强化学习的长期分诊模型分别对患者的就诊数据进行识别,最终融合输出分诊结果,能够实现快速地、准确地对患者进行自动分诊,节省了患者时间,提升了就诊准确率,提升了患者体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中分诊数据处理方法的应用环境示意图;
图2是本发明一实施例中分诊数据处理方法的流程图;
图3是本发明一实施例中分诊数据处理方法的步骤S30的流程图;
图4是本发明一实施例中分诊数据处理方法的步骤S302的流程图;
图5是本发明一实施例中分诊数据处理方法的步骤S303的流程图;
图6是本发明一实施例中分诊数据处理方法的步骤S40的流程图;
图7是本发明一实施例中分诊数据处理方法的步骤S403的流程图;
图8是本发明一实施例中分诊数据处理方法的步骤S60的流程图;
图9是本发明一实施例中分诊数据处理装置的原理框图;
图10是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的分诊数据处理方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种分诊数据处理方法,其技术方案主要包括以下步骤S10-S60:
S10,接收到包含患者的就诊数据的分诊请求;所述就诊数据包括患者标识码。
可理解地,患者在应用程序平台上确定输入完所述就诊数据之后,触发所述分诊请求,所述就诊数据为患者在所述应用程序平台上登录审核之后输入的当前就诊的信息,所述就诊数据可以通过患者在应用程序平台上进行文本输入后获得,也可以通过患者在应用程序平台对患者输入的语音进行转换成文本后确认获得,所述就诊数据包括所述患者标识码和患者基本信息,所述患者标识码为每个患者的唯一码,患者通过所述患者标识码登录所述应用程序平台,比如患者标识码为患者的身份证号码、社保号码等,所述患者基本信息包括患者的性别、年龄、工作职业等等个人基本信息。
S20,获取与所述患者标识码关联的历史就诊信息,将所述历史就诊信息和所述就诊数据确定为所述患者的待分诊数据。
可理解地,在应用程序平台上获取与所述患者标识码关联的所有所述历史就诊信息,所述历史就诊信息为患者在过去与就诊相关的信息,包括历史诊断结果、疾病史、用药史、检验检查结果(例如:健康年检检查)和风险预测结果等等,并将所述历史就诊信息和所述就诊数据一起标记为所述待分诊数据,其中,所述待分诊数据可以对所述历史就诊信息和所述就诊数据增加不同的权重进行区分,并且增强就诊数据,以便提高后续的分诊准确性。
S30,将所述待分诊数据输入基于决策树的短期分诊知识模型中,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,得到患者群体结果和短期分诊结果。
可理解地,将所述待分诊数据输入至所述短期分诊知识模型,所述短期分诊知识模型为训练完成的知识决策树模型,所述短期分诊知识模型的结构为基于决策树的树结构进行构建,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,所述群体划分为通过对所述待分诊数据进行分诊特征提取,并对提取的分诊特征进行决策,从根节点往下不断往下一层级的内部节点进行划分,直至出现不能再划分的叶节点的处理过程,该不能再划分的叶节点确定为与所述患者对应的所述短期分诊结果,所述短期分诊结果包括所述短期分诊知识模型输出的科室类别及其概率值,每个所述节点都与一个群体特征关联,所述节点包括根节点、内部节点和叶节点,每经过一个节点的划分就表明给患者划分出与患者相关的一个群体特征,将经过的所有所述节点关联的群体特征进行划分的结果进行汇总,从而确定出所述患者群体结果。
其中,所述分诊特征包括群体特征和症状特征,所述群体特征为患者表现的与患者群体类别相关的特征,所述患者群体为对患者的不同特征进行划分成不同的群体,比如根据患者的群体特征,比如年龄、患病频率、性别、潜在风险等特征,对患者群体划分成高龄多发易感男士人群、少儿成长突发女孩人群、中龄平稳抵御女士人群等等;所述症状特征为与医学上病症相关的特征,例如:皮肤特征、骨科特征、眼科特征、耳科特征、儿童流感特征、呼吸科特征等等。
在一实施例中,如图3所示,所述步骤S30之前,即所述将所述待分诊数据输入基于决策树的短期分诊知识模型中之前,包括:
S301,获取短期就诊样本集;其中,所述短期就诊样本集包括多个短期就诊样本,一个所述短期就诊样本与一个科室标签关联。
可理解地,所述短期就诊样本集为收集的所述短期就诊样本的集合,所述短期就诊样本为收集的患者的历史且已经完成分诊的就诊输入的数据,一个所述短期就诊样本与一个所述分诊标签关联,所述科室标签为在实际就诊中与其对应的所述短期就诊样本最后被确诊的科室,所述科室为医院中包含的各类科室。
S302,将所述短期就诊样本输入预设的知识决策树模型;所述知识决策树模型包括各节点特征参数。
可理解地,将所述短期就诊样本输入至预设的知识决策树模型,所述知识决策树模型为决策树结构的模型,所述知识决策树模型包含有决策树结构的多个节点,其中每个节点都含有节点特征参数,所述节点特征参数为在划分分类中选择特征的属性参数,例如:所述节点特征参数设置为大于50岁的属性参数,则对所述短期就诊样本进行划分,是否具备大于50岁的特征。
在一实施例中,如图4所示,所述步骤S302之前,即所述将所述短期就诊样本输入预设的知识决策树模型之前,包括:
S3021,获取临床指南知识。
可理解地,获取所述临床指南知识中的数据,所述临床指南知识为通过临床指南和专家共识梳理就诊规则汇总的数据。
S3022,根据所述临床指南知识,建立就诊知识图谱。
可理解地,将所述临床指南知识中的症状分类、症状名称、症状现象和科室分类作为所述就诊知识图谱中的实体,根据所述临床指南知识构建各实体之间的关系,按照知识图谱的自顶向下的模式层(实体-关系-实体)构建方法建立所述就诊知识图谱。
S3023,按照就诊知识图谱构建所述知识决策树模型。
可理解地,将建立的所述就诊知识图谱按照自顶而下的树状结构进行构建,将每个所述就诊知识图谱中的实体转换成是否具备该实体的分诊特征的节点,各实体间的关系则转换成决策的划分条件,从而构建出所述知识决策树模型。
本发明实现了通过获取临床指南知识,根据所述临床指南知识,建立就诊知识图谱;按照就诊知识图谱构建所述知识决策树模型,能够运用知识图谱的构建方式将临床指南知识构建出就诊知识图谱,并将该就诊知识图谱转换生成各节点,从而构建出知识决策树模型,简化了知识决策树的构建过程,缩短了构建时间,并提高了知识决策树模型的分类准确率性可靠性。
S303,通过所述知识决策树模型对所述短期就诊样本进行群体划分,得到样本群体结果和样本分诊结果。
可理解地,所述知识决策树模型对所述短期就诊样本进行群体划分,所述群体划分还包括通过对所述短期就诊样本进行分诊特征提取,并对提取的分诊特征进行决策,从根节点往下不断往下一层级的内部节点进行划分,直至出现不能再划分的叶节点的处理过程,该不能再划分的叶节点确定为与所述短期就诊样本对应的所述样本分诊结果,所述样本分诊结果为所述知识决策树模型输出的各科室类别及其概率值(也称为OR值,即逻辑回归系数对应的比数比),每个节点都与一个群体特征关联,所述节点包括根节点、内部节点和叶节点,每经过一个节点的划分就表明给所述短期就诊样本划分出一个群体特征,将经过的所有节点关联的群体特征进行划分的结果进行汇总,从而确定出所述样本群体结果。
在一实施例中,如图5所示,所述步骤S303中,即所述通过所述知识决策树模型对所述短期就诊样本进行特征决策,得到样本群体结果和样本分诊结果,包括:
S3031,通过决策树分类方法和递归分区方法,对所述短期就诊样本进行特征划分及决策,得到所述样本分诊结果和节点路径结果;所述节点路径结果为所述知识决策树模型对所述短期就诊样本进行决策经过的节点构成的路径;其中,每个所述节点都与一个群体特征关联。
可理解地,所述决策树分类方法为对所述短期就诊样本进行分类的树形结构,对所述短期就诊样本的某一特征进行特征选择,根据特征划分的结果,将所述短期就诊样本进行分配到其下一个内部节点(也可称为分支子节点);其中在自顶向下的过程中采用所述递归分区方法,所述递归分区方法为在每个待划分的节点建立一个模型,将所述短期就诊样本集划分出不同的子集,使得各子集间的分布差异是最大的,子集对应决策过程中的特征从而能够提高特征选择的有效性。
其中,所述特征划分为通过所述递归分区方法划分出的子集所选取的特征与所述短期就诊样本的特征进行匹配,从而划分出一个群体特征,所述决策为根据特征划分的结果分配到相应的下一个内部节点的过程,经过特征划分及决策的处理,所述短期就诊样本会在所述知识决策树模型中构成一条自顶向下的路径,得到所述节点路径结果,最后所述短期就诊样本抵达最底层的一个叶节点,该叶节点为与所述短期就诊样本对应的所述样本分诊结果。
S3032,获取与所述节点路径结果中的各节点关联的群体特征,将获取的所有所述群体特征确定为所述样本群体结果。
可理解地,获取所述节点路径结果中的各节点的子集的特征选择对应的群体特征,例如:短期就诊样本为“60岁XXX感觉腿脚无力,头晕”,经过年龄特征关联的节点进行特征划分时,将其60岁的特征与节点中的各子集对应的年龄特征进行匹配,划分出与高龄的年龄特征相匹配,则该高龄的年龄特征确定为该短期就诊样本的其中一个群体特征,标记为与该短期就诊样本对应的所述样本群体结果中的其中一个群体特征。
本发明实现了通过决策树分类方法和递归分区方法,对所述短期就诊样本进行特征划分及决策,得到所述样本分诊结果和节点路径结果;获取与所述节点路径结果中的各节点关联的群体特征,将获取的所有所述群体特征确定为所述样本群体结果,如此,实现了通过决策树方法和递归分区方法,得到样本分诊结果,并获取所有经过节点的群体特征,确定出样本群体结果,能够在决策树分类的过程中经一部细分出各明显的子集,提高了决策的准确性和有效性。
S304,根据所述样本分诊结果和所述科室标签,得到决策树损失值。
可理解地,通过所述知识决策树模型的损失函数,计算所述样本分诊结果和所述科室标签之间的所述决策树损失值,所述损失函数优选为正则化的极大似然函数。
S305,在所述决策树损失值未达到预设的决策树收敛条件时,调整所述知识决策树模型中的各节点特征参数,并触发通过所述知识决策树模型对所述短期就诊样本进行特征决策的步骤,直至所述决策树损失值达到所述决策树收敛条件时,将收敛之后的所述知识决策树模型记录为短期分诊知识模型。
可理解地,所述收敛条件可以为所述决策树损失值经过了1000次计算后值为很小且不会再下降的条件,即在所述决策树损失值经过1000次计算后值为很小且不会再下降时,停止训练,并将收敛之后的所述知识决策树模型记录为短期分诊知识模型;所述收敛条件也可以为所述决策树损失值小于设定阈值的条件,即在所述决策树损失值小于设定阈值时,停止训练,并将收敛之后的所述知识决策树模型记录为短期分诊知识模型,如此,在所述决策树损失值未达到预设的收敛条件时,不断调整所述知识决策树模型中的各节点特征参数,并触发通过所述知识决策树模型对所述短期就诊样本进行特征决策的步骤,可以不断向准确的分类靠拢,让识别的准确率越来越高。
S40,获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型。
可理解地,一个所述长期分诊模型都与一种群体类别关联,各所述长期分诊模型都是基于深度强化学习并通过与其关联的群体类别的历史类别样本进行学习后获得,能够让长期分诊模型更具针对性,根据所述患者群体结果确定出所述患者的患者群体类别,从而获取与所述患者的患者群体类别匹配的群体类别对应的所述长期分诊模型,所述长期分诊模型为结合神经网络和强化学习的深度强化学习(DQN,Deep Q Network)模型,将所述长期分诊模型作为智能体(Agent),就诊方案看做动作(Action),患者的就诊信息作为状态(State),模型通过试验的方式来学习一个优化策略,以最大化长期回报,即模型选择一个动作作用于环境,环境接受该动作后状态发生变化,同时产生一个回报(奖励或惩罚)作为强化信号反馈给模型;模型根据该强化信号优化选择动作的策略,优化方向是使长期预期回报最高;在优化后的策略下,模型再根据环境当前的状态选择下一个动作。
在一实施例中,如图6所示,所述步骤S40中,即所述获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型,包括:
S401,将所述患者群体结果输入患者群体分类模型。
可理解地,将所述患者群体结果输入所述患者群体份分类模型,所述患者群体分类模型为通过聚类算法进行训练完成的神经网络模型,所述患者群体分类模型实现了对收集的患者的群体特征进行分类的模型。
S402,通过所述患者群体分类模型对所有所述群体特征进行聚类处理,得到与所述患者群体结果对应的患者群体类别。
可理解地,所述聚类处理为运用K-means聚类算法对所述患者群体结果中的所有所述群体特征进行欧式计算,根据落入的聚类簇的范围,确定出所述患者群体类别,所述患者群体类别可以根据需求设定,比如患者群体类别分为高龄潜在风险人群、中龄风险人群等等。
S403,获取与所述患者群体类别匹配的所述长期分诊模型。
可理解地,通过Word2vec模型,计算该患者群体类别与各长期分诊模型关联的群体类别之间的相似度值,将与最大的相似度值对应的群体类别关联的长期分诊模型确定为与该患者群体类别匹配的所述长期分诊模型,所述患者群体类别的全集可以与所述群体类别的全集相同,也可以与所述群体类别的全集不同,通过相似度值的衡量匹配程度,可以增加长期分诊模型的灵活性,并提高了识别的准确性。
本发明实现了通过将所述患者群体结果输入患者群体分类模型;通过所述患者群体分类模型对所有所述群体特征进行聚类处理,得到与所述患者群体结果对应的患者群体类别;获取与所述患者群体类别匹配的所述长期分诊模型,如此,能够科学地选择合适的长期分诊模型,提高了分诊的准确性和可靠性,并增加了模型的灵活性。
在一实施例中,如图7所示,所述步骤S403之前,即所述获取与所述患者群体类别匹配的所述长期分诊模型之前,包括:
S4031,获取历史类别样本集;所述历史类别样本集包含多个与所述患者群体类别匹配的历史类别样本,一个所述历史类别样本与一个历史科室标签关联。
可理解地,所述历史类别样本集为所述历史类别样本的集合,所述历史类别样本为与所述患者群体类别匹配的患者对应的历史收集的就诊输入的数据,其中匹配方式可以为人工对患者进行患者群体类别的标记,将相同患者群体类别的患者确定为与所述患者群体类别匹配的患者,一个所述历史类别样本与一个历史科室标签关联,所述历史科室标签为在实际就诊中与其对应的所述历史类别样本最后被确诊的科室,所述科室为医院中包含的各类科室。
S4032,将所述历史类别样本输入含有初始参数的深度强化学习模型。
可理解地,将所述历史类别样本输入所述深度强化学习模型中,所述深度强化学习模型包括所述初始参数,所述初始参数可以根据需求设定,比如初始参数设置为零。
S4033,通过离线学习策略方式,所述深度强化学习模型对所述历史类别样本进行预测,得到回报结果。
可理解地,所述离线学习策略方式为利用已经收集的大量历史类别样本进行训练学习,从而不会出现未曾采用过的决策策略,通过所述深度强化学习模型对所述历史类别样本进行预测,所述预测为根据所述深度强化学习模型执行的各个动作对应的长期预期回报Q值对可选就诊方案(确定出各科室类别)进行排序,Q值越大表示此就诊方案预期回报值越大,在预期回报值最高时,则预测完毕,最终得出的就诊方案(预测出就诊的科室)即为所述回报结果。
S4034,根据所述回报结果和与所述历史类别样本关联的历史科室标签,确定网络损失值。
可理解地,通过所述深度强化学习模型的损失函数,计算所述回报结果和与所述历史类别样本关联的历史科室标签之间的所述网络损失值,所述损失函数优选为最小二乘法函数。
S4035,在所述网络损失值未达到预设的网络收敛条件时,调整所述深度强化学习模型中的初始参数,并触发通过离线学习策略方式,所述深度强化学习模型对所述历史类别样本进行预测的步骤,直至所述网络损失值达到所述网络收敛条件时,将收敛之后的所述深度强化学习模型记录为与所述患者群体类别匹配的所述长期分诊模型。
可理解地,所述网络收敛条件可以为所述网络损失值经过了2000次计算后值为很小且不会再下降的条件,即在所述网络损失值经过2000次计算后值为很小且不会再下降时,停止训练,并将收敛之后的所述深度强化学习模型记录为与所述患者群体类别匹配的所述长期分诊模型;所述网络收敛条件也可以为所述网络损失值小于网络设定阈值的条件,即在所述网络损失值小于网络设定阈值时,停止训练,并将收敛之后的所述深度强化学习模型记录为与所述患者群体类别匹配的所述长期分诊模型,如此,在所述网络损失值未达到预设的网络收敛条件时,不断调整所述深度强化学习模型中的初始参数,并触发通过离线学习策略方式,所述深度强化学习模型对所述历史类别样本进行预测的步骤,可以不断向准确的结果靠拢,让识别的准确率越来越高。如此,通过更具针对性的历史类别样本,以及通过离线学习策略方式能够让深度强化学习模型的准确率更高,而且有更强的泛化度及鲁棒性。
S50,通过所述长期分诊模型对所述就诊数据进行预测,得到长期分诊结果。
可理解地,通过所述长期分诊模型对所述就诊数据进行预测,所述预测还包括根据所述长期分诊模型针对所述就诊数据作为状态执行训练后的动作后得出的长期分诊结果(也即执行动作后得到的就诊方案),所述长期分诊结果为具有长期相同类别的患者进行学习后预测出的分诊结果,所述长期分诊结果包括所述长期分诊模型输出的科室类别及其Q值。
S60,根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出。
可理解地,通过将所述短期分诊结果中的各科室类别及其概率值和所述长期分诊结果中的各科室类别及其概率值进行加权处理,根据设定的权重参数进行计算得出各科室类别对应的综合分值,将综合分值最大的科室类别确定为所述患者的最终分诊结果,所述最终分诊结果还可以包含科室类别中某一特长的就诊医生等其他与分诊相关的结果数据,其中,通过权重参数拉开各科室类别对应的概率值的差距,让分类更加准确。
在一实施例中,如图8所示,所述步骤S60中,即所述根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出,包括:
S601,将所述短期分诊结果和所述长期分诊结果输入综合分诊模型。
可理解地,将所述短期分诊结果中的各科室类别及其概率值和所述长期分诊结果中的各科室类别及其概率值输入所述综合分支模型中。
S602,通过所述综合分诊模型中的综合评分函数,输出与各科室类别一一关联的多个综合分值,将综合分值最大的科室类别确定为所述患者的最终分诊结果。
可理解地,通过所述综合评分函数计算得出所述综合分值,将所有综合分值中最大的综合分值对应的科室类别确定为所述患者的最终分诊结果,所述综合评分函数为:
score(i)=OR(i)×w1+Q(i)×w2
其中,i为第i个科室类别,score(i)为第i个科室类别对应的综合分值,OR(i)为第i个科室类别对应的短期分诊结果的OR值,w1为OR值的权重;Q(i)为第i个科室类别对应的长期分诊结果的Q值;w2为Q值的权重。
本发明实现了通过接收到包含患者的就诊数据的分诊请求;获取与所述就诊数据中的患者标识码关联的历史就诊信息,将所述历史就诊信息和所述就诊数据确定为所述患者的待分诊数据;将所述待分诊数据输入基于决策树的短期分诊知识模型中,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,得到患者群体结果和短期分诊结果;获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型;通过所述长期分诊模型对所述就诊数据进行预测,得到长期分诊结果;根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出,如此,实现了获取患者的历史就诊信息,通过基于决策树的短期分诊知识模型划分出与患者对应的患者群体和短期分诊结果,再通过患者群体匹配出基于深度强化学习的长期分诊模型,并预测出长期分诊结果,融合短期分诊结果和长期分诊结果确定出最终分诊结果,因此,实现了结合患者历史就诊信息提取患者特征,并通过基于决策树的短期分诊知识模型和基于深度强化学习的长期分诊模型分别对患者的就诊数据进行识别,最终融合输出分诊结果,能够实现快速地、准确地对患者进行自动分诊,节省了患者时间,提升了就诊准确率,提升了患者体验。
在一实施例中,提供一种分诊数据处理装置,该分诊数据处理装置与上述实施例中分诊数据处理方法一一对应。如图9所示,该分诊数据处理装置包括接收模块11、获取模块12、划分模块13、匹配模块14、预测模块15和输出模块15。各功能模块详细说明如下:
接收模块11,用于接收到包含患者的就诊数据的分诊请求;所述就诊数据包括患者标识码;
获取模块12,用于获取与所述患者标识码关联的历史就诊信息,将所述历史就诊信息和所述就诊数据确定为所述患者的待分诊数据;
划分模块13,用于将所述待分诊数据输入基于决策树的短期分诊知识模型中,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,得到患者群体结果和短期分诊结果;
匹配模块14,用于获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型;
预测模块15,用于通过所述长期分诊模型对所述就诊数据进行预测,得到长期分诊结果;
输出模块16,用于根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出。
关于分诊数据处理装置的具体限定可以参见上文中对于分诊数据处理方法的限定,在此不再赘述。上述分诊数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种分诊数据处理方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中分诊数据处理方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中分诊数据处理方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (8)

1.一种分诊数据处理方法,其特征在于,包括:
接收到包含患者的就诊数据的分诊请求;所述就诊数据包括患者标识码;
获取与所述患者标识码关联的历史就诊信息,将所述历史就诊信息和所述就诊数据确定为所述患者的待分诊数据;
将所述待分诊数据输入基于决策树的短期分诊知识模型中,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,得到患者群体结果和短期分诊结果;
获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型;
通过所述长期分诊模型对所述就诊数据进行预测,得到长期分诊结果;
根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出;
所述将所述待分诊数据输入基于决策树的短期分诊知识模型中之前,包括:
获取短期就诊样本集;其中,所述短期就诊样本集包括多个短期就诊样本,一个所述短期就诊样本与一个科室标签关联;
将所述短期就诊样本输入预设的知识决策树模型;所述知识决策树模型包括各节点特征参数;
通过所述知识决策树模型对所述短期就诊样本进行群体划分,得到样本群体结果和样本分诊结果;
根据所述样本分诊结果和所述科室标签,得到决策树损失值;
在所述决策树损失值未达到预设的决策树收敛条件时,调整所述知识决策树模型中的各节点特征参数,并触发通过所述知识决策树模型对所述短期就诊样本进行群体划分的步骤,直至所述决策树损失值达到所述决策树收敛条件时,将收敛之后的所述知识决策树模型记录为短期分诊知识模型;
所述通过所述知识决策树模型对所述短期就诊样本进行群体划分,得到样本群体结果和样本分诊结果,包括:
通过决策树分类方法和递归分区方法,对所述短期就诊样本进行特征划分及决策,得到所述样本分诊结果和节点路径结果;所述节点路径结果为所述知识决策树模型对所述短期就诊样本进行决策经过的节点构成的路径;其中,每个所述节点都与一个群体特征关联;
获取与所述节点路径结果中的各节点关联的群体特征,将获取的所有所述群体特征确定为所述样本群体结果。
2.如权利要求1所述的分诊数据处理方法,其特征在于,所述将所述短期就诊样本输入预设的知识决策树模型之前,包括:
获取临床指南知识;
根据所述临床指南知识,建立就诊知识图谱;
按照就诊知识图谱构建所述知识决策树模型。
3.如权利要求1所述的分诊数据处理方法,其特征在于,所述获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型,包括:
将所述患者群体结果输入患者群体分类模型;
通过所述患者群体分类模型对所有群体特征进行聚类处理,得到与所述患者群体结果对应的患者群体类别;
获取与所述患者群体类别匹配的所述长期分诊模型。
4.如权利要求3所述的分诊数据处理方法,其特征在于,所述获取与所述患者群体类别匹配的所述长期分诊模型之前,包括:
获取历史类别样本集;所述历史类别样本集包含多个与所述患者群体类别匹配的历史类别样本,一个所述历史类别样本与一个历史科室标签关联;
将所述历史类别样本输入含有初始参数的深度强化学习模型;
通过离线学习策略方式,所述深度强化学习模型对所述历史类别样本进行预测,得到回报结果;
根据所述回报结果和与所述历史类别样本关联的历史科室标签,确定网络损失值;
在所述网络损失值未达到预设的网络收敛条件时,调整所述深度强化学习模型中的初始参数,并触发通过离线学习策略方式,所述深度强化学习模型对所述历史类别样本进行预测的步骤,直至所述网络损失值达到所述网络收敛条件时,将收敛之后的所述深度强化学习模型记录为与所述患者群体类别匹配的所述长期分诊模型。
5.如权利要求4所述的分诊数据处理方法,其特征在于,所述根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出,包括:
将所述短期分诊结果和所述长期分诊结果输入综合分诊模型;
通过所述综合分诊模型中的综合评分函数,输出与各科室类别一一关联的多个综合分值,将综合分值最大的科室类别确定为所述患者的最终分诊结果。
6.一种分诊数据处理装置,其特征在于,包括:
接收模块,用于接收到包含患者的就诊数据的分诊请求;所述就诊数据包括患者标识码;
获取模块,用于获取与所述患者标识码关联的历史就诊信息,将所述历史就诊信息和所述就诊数据确定为所述患者的待分诊数据;
划分模块,用于将所述待分诊数据输入基于决策树的短期分诊知识模型中,通过所述短期分诊知识模型对所述待分诊数据进行群体划分,得到患者群体结果和短期分诊结果;
匹配模块,用于获取与所述患者群体结果相匹配的基于深度强化学习的长期分诊模型;
预测模块,用于通过所述长期分诊模型对所述就诊数据进行预测,得到长期分诊结果;
输出模块,用于根据所述短期分诊结果和所述长期分诊结果,确定所述患者的最终分诊结果并输出;
所述划分模块还用于:
获取短期就诊样本集;其中,所述短期就诊样本集包括多个短期就诊样本,一个所述短期就诊样本与一个科室标签关联;
将所述短期就诊样本输入预设的知识决策树模型;所述知识决策树模型包括各节点特征参数;
通过所述知识决策树模型对所述短期就诊样本进行群体划分,得到样本群体结果和样本分诊结果;
根据所述样本分诊结果和所述科室标签,得到决策树损失值;
在所述决策树损失值未达到预设的决策树收敛条件时,调整所述知识决策树模型中的各节点特征参数,并触发通过所述知识决策树模型对所述短期就诊样本进行群体划分的步骤,直至所述决策树损失值达到所述决策树收敛条件时,将收敛之后的所述知识决策树模型记录为短期分诊知识模型;
所述通过所述知识决策树模型对所述短期就诊样本进行群体划分,得到样本群体结果和样本分诊结果,包括:
通过决策树分类方法和递归分区方法,对所述短期就诊样本进行特征划分及决策,得到所述样本分诊结果和节点路径结果;所述节点路径结果为所述知识决策树模型对所述短期就诊样本进行决策经过的节点构成的路径;其中,每个所述节点都与一个群体特征关联;
获取与所述节点路径结果中的各节点关联的群体特征,将获取的所有所述群体特征确定为所述样本群体结果。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述分诊数据处理方法。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述分诊数据处理方法。
CN202010940847.3A 2020-09-09 2020-09-09 分诊数据处理方法、装置、设备及介质 Active CN112017789B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010940847.3A CN112017789B (zh) 2020-09-09 2020-09-09 分诊数据处理方法、装置、设备及介质
PCT/CN2020/124220 WO2021151327A1 (zh) 2020-09-09 2020-10-28 分诊数据处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010940847.3A CN112017789B (zh) 2020-09-09 2020-09-09 分诊数据处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN112017789A CN112017789A (zh) 2020-12-01
CN112017789B true CN112017789B (zh) 2023-08-01

Family

ID=73522185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010940847.3A Active CN112017789B (zh) 2020-09-09 2020-09-09 分诊数据处理方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN112017789B (zh)
WO (1) WO2021151327A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112652386A (zh) * 2020-12-25 2021-04-13 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN116959653A (zh) * 2021-04-21 2023-10-27 广州医科大学附属第一医院 建立基于诊断时效的covid-19分诊系统的方法、该系统及分诊方法
CN113642854A (zh) * 2021-07-23 2021-11-12 重庆中烟工业有限责任公司 烟支单支克重预测方法、装置及计算机可读存储介质
CN113488125A (zh) * 2021-07-27 2021-10-08 心医国际数字医疗系统(大连)有限公司 信息处理方法、装置、电子设备及存储介质
CN114496231B (zh) * 2022-02-16 2024-03-26 平安科技(深圳)有限公司 基于知识图谱的体质识别方法、装置、设备和存储介质
CN117012374B (zh) * 2023-10-07 2024-01-26 之江实验室 一种融合事件图谱和深度强化学习的医疗随访系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809125A (zh) * 2014-01-24 2015-07-29 腾讯科技(深圳)有限公司 一种网页类别的识别方法和装置
CN109559822A (zh) * 2018-11-12 2019-04-02 平安科技(深圳)有限公司 智能初诊方法、装置、计算机设备及存储介质
CN110751996A (zh) * 2019-09-10 2020-02-04 浙江大学 基于递归分区计算的高血压用药推荐模型及其构建方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11004559B2 (en) * 2017-12-15 2021-05-11 International Business Machines Corporation Differential diagnosis mechanisms based on cognitive evaluation of medical images and patient data
CN111564206A (zh) * 2019-02-13 2020-08-21 东软医疗系统股份有限公司 一种分诊方法、装置、设备及介质
CN111477310A (zh) * 2020-03-04 2020-07-31 平安国际智慧城市科技股份有限公司 分诊数据处理方法、装置、计算机设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809125A (zh) * 2014-01-24 2015-07-29 腾讯科技(深圳)有限公司 一种网页类别的识别方法和装置
CN109559822A (zh) * 2018-11-12 2019-04-02 平安科技(深圳)有限公司 智能初诊方法、装置、计算机设备及存储介质
CN110751996A (zh) * 2019-09-10 2020-02-04 浙江大学 基于递归分区计算的高血压用药推荐模型及其构建方法

Also Published As

Publication number Publication date
WO2021151327A1 (zh) 2021-08-05
CN112017789A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN112017789B (zh) 分诊数据处理方法、装置、设备及介质
CN108986908B (zh) 问诊数据处理方法、装置、计算机设备和存储介质
US20200185102A1 (en) System and method for providing health information
Bashir et al. BagMOOV: A novel ensemble for heart disease prediction bootstrap aggregation with multi-objective optimized voting
WO2020181805A1 (zh) 糖尿病的预测方法及装置、存储介质、计算机设备
WO2020220545A1 (zh) 基于长短期记忆模型的疾病预测方法、装置和计算机设备
CN110929752B (zh) 基于知识驱动和数据驱动的分群方法及相关设备
CN112016318B (zh) 基于解释模型的分诊信息推荐方法、装置、设备及介质
WO2016201499A1 (en) Method and system for assessing mental state
CN112132624A (zh) 医疗理赔数据预测系统
CN116386869B (zh) 一种基于多变量的病情危重程度评估方法
CN112151141A (zh) 医疗数据处理方法、装置、计算机设备和存储介质
CN111667890A (zh) 基于人工智能的用药推荐方法、装置、设备及存储介质
US11710572B2 (en) Experience engine-method and apparatus of learning from similar patients
CN111415760B (zh) 医生推荐方法、系统、计算机设备及存储介质
CN112017742B (zh) 分诊数据处理方法、装置、计算机设备及存储介质
CN112287068A (zh) 基于人工智能的问诊对话数据处理方法及装置
CN112201359A (zh) 基于人工智能的重症问诊数据识别方法及装置
CN113689943A (zh) 基于人工智能的就诊医院推荐方法、装置、设备及介质
Azeez et al. Secondary triage classification using an ensemble random forest technique
CN114628001A (zh) 基于神经网络的处方推荐方法、系统、设备及存储介质
WO2023178970A1 (zh) 医疗数据处理方法、装置、设备及存储介质
WO2023050668A1 (zh) 基于因果推断的分群模型构建方法和医疗数据处理方法
CN115662595A (zh) 基于在线诊疗系统的用户信息管理方法及系统
CN114068036A (zh) 一种基于物联网感知的传染传播预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040584

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant