CN115331796A - 基于强化学习的病床资源配置优化方法、系统及终端 - Google Patents

基于强化学习的病床资源配置优化方法、系统及终端 Download PDF

Info

Publication number
CN115331796A
CN115331796A CN202211263783.3A CN202211263783A CN115331796A CN 115331796 A CN115331796 A CN 115331796A CN 202211263783 A CN202211263783 A CN 202211263783A CN 115331796 A CN115331796 A CN 115331796A
Authority
CN
China
Prior art keywords
sickbed
resource allocation
hospital
reward
time difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211263783.3A
Other languages
English (en)
Other versions
CN115331796B (zh
Inventor
张北
唐显恒
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Houli Information Technology Chengdu Co ltd
Original Assignee
Zhongke Houli Information Technology Chengdu Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Houli Information Technology Chengdu Co ltd filed Critical Zhongke Houli Information Technology Chengdu Co ltd
Priority to CN202211263783.3A priority Critical patent/CN115331796B/zh
Publication of CN115331796A publication Critical patent/CN115331796A/zh
Application granted granted Critical
Publication of CN115331796B publication Critical patent/CN115331796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于强化学习的病床资源配置优化方法、系统及终端,涉及资源配置优化技术领域,其技术方案要点是:获取多个科室的病床配置数据,并对单一科室的在院患者数进行时间差异分析,得到时间差异分布信息;结合病床配置数据和时间差异分布信息,模拟患者入出院过程建立智能体需要的状态空间、动作空间以及奖赏函数;智能体根据策略函数选择并执行当前状态对应的动作过程中,以最大化累计奖赏为目标,得到多个科室的病床资源配置优化策略。本发明采用机器强化学习(RL)的方法训练智能体,考虑不同科室疾病在时间分布上的差异情况,使得床资源配置优化策略更加符合实际情况,有效提高了病床资源配置优化的准确性与可靠性。

Description

基于强化学习的病床资源配置优化方法、系统及终端
技术领域
本发明涉及资源配置优化技术领域,更具体地说,它涉及基于强化学习的病床资源配置优化方法、系统及终端。
背景技术
医院病床数量决定了在院患者数量,闲置病床造成医疗资源浪费,因此病床优化配置是医院运营资源管理的重要需求。
目前,国内外对病床优化配置的方法多数基于预测,如ARMA模型、多项式回归拟合模型、基于排队论病床配置以及基于病床工作效率指标测算病床数区间。然而,这些预测方法变量相对单一,仅从宏观层面上给出病床配置方案,依然有资源不足或者浪费的现象。此外,病床的配置依赖于患者数量、住院天数、患者自身因素和疾病种类,不同科室的患者数量随着时间变化存在显著差异,而现有的病床优化配置技术忽略了不同科室疾病之间在时间分布上的差异,从而导致病床优化配置的准确度不高,容易使病床优化配置策略在短时间内出现频繁的大幅度调整。
因此,如何研究设计一种能够克服上述缺陷的基于强化学习的病床资源配置优化方法、系统及终端是我们目前急需解决的问题。
发明内容
为解决现有技术中的不足,本发明的目的是提供基于强化学习的病床资源配置优化方法、系统及终端,采用机器强化学习(RL)的方法模拟医疗环境训练智能体,并在构建状态空间和奖赏函数时,考虑不同科室疾病在时间分布上的差异情况,从而使得智能体依据策略函数寻找的病床资源配置优化策略更加符合实际情况,有效提高了病床资源配置优化的准确性与可靠性。
本发明的上述技术目的是通过以下技术方案得以实现的:
第一方面,提供了基于强化学习的病床资源配置优化方法,包括以下步骤:
获取多个科室的病床配置数据,并对单一科室的在院患者数进行时间差异分析,得到时间差异分布信息;
结合病床配置数据和时间差异分布信息,通过机器强化学习方法模拟患者入出院过程建立智能体需要的状态空间、动作空间以及奖赏函数;
智能体根据策略函数选择并执行当前状态对应的动作过程中,以最大化累计奖赏为目标,得到多个科室的病床资源配置优化策略。
进一步的,所述时间差异分布信息的获得过程具体为:
对在院患者数做滑动平均处理,得到标准配置数据;
动态设置两个相邻且均大于基础步长的第一步长和第二步长;
以第一步长与第二步长中的数据均值之差不小于标准差值为第一目标,对标准配置数据进行搜索分析,所有搜索确定的第一步长与第二步长所对应的时间段构成时间差异分布信息。
进一步的,以所有所述第一步长与第二步长中的数据均值之差波动性最大为第二目标确定唯一的时间差异分布信息。
进一步的,所述状态空间中的变量包括:患者科室类别、当前单一科室的在院患者数、当前单一科室的住院天数超长患者数、当前剩余未分配病床数、日期、是否节假日以及未入院患者数量。
进一步的,所述动作空间具体为:
若病床高于空置阈值或调整病床周转率时,则智能体不分配病床;
若病床不高于空置阈值,且病床周转率低于周转率阈值时,则智能体分配病床。
进一步的,所述以最大化累计奖赏为目标的计算公式具体为:
Figure DEST_PATH_IMAGE001
其中,
Figure 362429DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 212835DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值。
进一步的,所述以最大化累计奖赏为目标的计算公式具体为:
Figure DEST_PATH_IMAGE005
其中,
Figure 664545DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure 11213DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 2170DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值;
Figure 826906DEST_PATH_IMAGE006
表示时刻t+k+1所属步长
Figure DEST_PATH_IMAGE007
的数据均值;
Figure 398702DEST_PATH_IMAGE008
表示病床配置数据的数据均值。
进一步的,所述以最大化累计奖赏为目标的计算公式具体为:
Figure DEST_PATH_IMAGE009
其中,
Figure 214474DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure 911034DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 273882DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值;
Figure 106709DEST_PATH_IMAGE006
表示时刻t+k+1所属步长
Figure 28135DEST_PATH_IMAGE007
的数据均值;
Figure 211992DEST_PATH_IMAGE008
表示病床配置数据的数据均值。
第二方面,提供了基于强化学习的病床资源配置优化系统,包括:
数据处理模块,用于获取多个科室的病床配置数据,并对单一科室的在院患者数进行时间差异分析,得到时间差异分布信息;
模型构建模块,用于结合病床配置数据和时间差异分布信息,通过机器强化学习方法模拟患者入出院过程建立智能体需要的状态空间、动作空间以及奖赏函数;
配置优化模块,用于根据策略函数选择并执行当前状态对应的动作过程中,以最大化累计奖赏为目标,得到多个科室的病床资源配置优化策略。
第三方面,提供了一种计算机终端,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面中任意一项所述的基于强化学习的病床资源配置优化方法。
与现有技术相比,本发明具有以下有益效果:
1、本发明提供的基于强化学习的病床资源配置优化方法,通过历史数据模拟患者入出院场景,采用机器强化学习(RL)的方法训练智能体,并在构建状态空间和奖赏函数时,考虑不同科室疾病在时间分布上的差异情况,从而使得智能体依据策略函数寻找的病床资源配置优化策略更加符合实际情况,有效提高了病床资源配置优化的准确性与可靠性;
2、本发明采用机器强化学习(RL)的方法训练模型时,不仅考虑了各个科室的剩余未分配病床数和未入院患者数量,还考虑了患者科室类别、当前单一科室的在院患者数、当前单一科室的住院天数超长患者数、日期、是否节假日等因素,克服了因样本数据不足而导致病床资源配置优化的结果误差较大和稳定性较差的问题;
3、本发明采用动态步长对数据进行滑动分析,并以相邻步长的数据均值之差的标准差最大为目标确定时间差异分布信息,即使得时间差异分布更加明显,又降低了个别异常值对整体时间差异的影响;
4、本发明在求解最大化累计奖赏时,考虑了具体时刻的数据差异影响,对不同时间段的奖励衰减值进行适应性调整,进一步提高了病床资源配置优化策略的准确性与可靠性。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1是本发明实施例中的流程图;
图2是本发明实施例中的系统框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1:基于强化学习的病床资源配置优化方法,如图1所示,包括以下步骤:
S1:获取多个科室的病床配置数据,并对单一科室的在院患者数进行时间差异分析,得到时间差异分布信息;
S2:结合病床配置数据和时间差异分布信息,通过机器强化学习方法模拟患者入出院过程建立智能体需要的状态空间、动作空间以及奖赏函数;
S3:智能体根据策略函数选择并执行当前状态对应的动作过程中,以最大化累计奖赏为目标,得到多个科室的病床资源配置优化策略。
时间差异分布信息的获得过程具体为:对在院患者数做滑动平均处理,得到标准配置数据;动态设置两个相邻且均大于基础步长的第一步长和第二步长;以第一步长与第二步长中的数据均值之差不小于标准差值为第一目标,对标准配置数据进行搜索分析,所有搜索确定的第一步长与第二步长所对应的时间段构成时间差异分布信息。
此外,以所有第一步长与第二步长中的数据均值之差波动性最大为第二目标确定唯一的时间差异分布信息。
状态空间中的变量包括:患者科室类别、当前单一科室的在院患者数、当前单一科室的住院天数超长患者数、当前剩余未分配病床数、日期、是否节假日以及未入院患者数量。
具体的,患者类别T(心内科:1;骨科:2;胃肠外科:3)、当前心内科在院患者数
Figure 112952DEST_PATH_IMAGE010
、当前骨科在院患者数
Figure DEST_PATH_IMAGE011
、当前胃肠外科在院患者数
Figure 128181DEST_PATH_IMAGE012
、当前心内科住院天数超长患者数
Figure DEST_PATH_IMAGE013
、当前骨科住院天数超长患者数
Figure 20176DEST_PATH_IMAGE014
、当前胃肠外科住院天数超长患者数
Figure DEST_PATH_IMAGE015
、当前剩余未分配病床数
Figure 222488DEST_PATH_IMAGE016
、日期
Figure DEST_PATH_IMAGE017
、是否节假日
Figure 493850DEST_PATH_IMAGE018
、未入院患者数量
Figure DEST_PATH_IMAGE019
构建得到的状态空间
Figure 98006DEST_PATH_IMAGE020
如下:
Figure DEST_PATH_IMAGE021
例如,
Figure 659438DEST_PATH_IMAGE022
,表示当前心内科患者需要入院,心内科患者在院97例,骨科在院患者56例,胃肠外科在院患者83例,当前心内科住院天数超长患者3例,骨科住院天数超长患者5例,胃肠外科住院天数超长患者4例,当前剩余54张床位未分配,当前星期二,这个月预计未入院1105例。
动作空间具体为:若病床高于空置阈值或调整病床周转率时,则智能体不分配病床;若病床不高于空置阈值,且病床周转率低于周转率阈值时,则智能体分配病床。
具体的,动作空间的表达式如下:
Figure DEST_PATH_IMAGE023
其中,0表示无需分配病床;1表示分配病床。
智能体决策正确与否需要奖赏来评判,设置奖励需要符合常理。根据剩余病床数量、疑似住院天数超长病例数合理设置相应奖惩机制,基于T医院3个科室实际情况,设置奖赏函数如下:
Figure 850510DEST_PATH_IMAGE024
作为一种可选的实施方式,以最大化累计奖赏为目标的计算公式具体为:
Figure 93272DEST_PATH_IMAGE001
其中,
Figure 20777DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure 956372DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 336538DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值。
作为另一种可选的实施方式,以最大化累计奖赏为目标的计算公式具体为:
Figure 147106DEST_PATH_IMAGE005
其中,
Figure 194696DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure 301192DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 60332DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值;
Figure 176056DEST_PATH_IMAGE006
表示时刻t+k+1所属步长
Figure 101987DEST_PATH_IMAGE007
的数据均值;
Figure 644964DEST_PATH_IMAGE008
表示病床配置数据的数据均值。
作为其他可选的实施方式,以最大化累计奖赏为目标的计算公式具体为:
Figure 62038DEST_PATH_IMAGE009
其中,
Figure 482918DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure 973942DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 422241DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值;
Figure 264295DEST_PATH_IMAGE006
表示时刻t+k+1所属步长
Figure 456242DEST_PATH_IMAGE007
的数据均值;
Figure 801773DEST_PATH_IMAGE008
表示病床配置数据的数据均值。
通过对T医院3个科室进行对比分析,发现经本发明所提供的基于强化学习的病床资源配置优化方法处理后,病床配置量平均降低19%,住院天数超长患者数降低76%,病床使用率提升15.25%。
实施例2:基于强化学习的病床资源配置优化系统,如图2所示,包括数据处理模块、模型构建模块和配置优化模块。
其中,数据处理模块,用于获取多个科室的病床配置数据,并对单一科室的在院患者数进行时间差异分析,得到时间差异分布信息;模型构建模块,用于结合病床配置数据和时间差异分布信息,通过机器强化学习方法模拟患者入出院过程建立智能体需要的状态空间、动作空间以及奖赏函数;配置优化模块,用于根据策略函数选择并执行当前状态对应的动作过程中,以最大化累计奖赏为目标,得到多个科室的病床资源配置优化策略。
工作原理:本发明采用机器强化学习(RL)的方法训练智能体,并在构建状态空间和奖赏函数时,考虑不同科室疾病在时间分布上的差异情况,从而使得智能体依据策略函数寻找的病床资源配置优化策略更加符合实际情况,有效提高了病床资源配置优化的准确性与可靠性;此外,本发明不仅考虑了各个科室的剩余未分配病床数和未入院患者数量,还考虑了患者科室类别、当前单一科室的在院患者数、当前单一科室的住院天数超长患者数、日期、是否节假日等因素,克服了因样本数据不足而导致病床资源配置优化的结果误差较大和稳定性较差的问题;另外,本发明采用动态步长对数据进行滑动分析,并以相邻步长的数据均值之差的标准差最大为目标确定时间差异分布信息,即使得时间差异分布更加明显,又降低了个别异常值对整体时间差异的影响;最后,本发明在求解最大化累计奖赏时,考虑了具体时刻的数据差异影响,对不同时间段的奖励衰减值进行适应性调整,进一步提高了病床资源配置优化策略的准确性与可靠性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.基于强化学习的病床资源配置优化方法,其特征是,包括以下步骤:
获取多个科室的病床配置数据,并对单一科室的在院患者数进行时间差异分析,得到时间差异分布信息;
结合病床配置数据和时间差异分布信息,通过机器强化学习方法模拟患者入出院过程建立智能体需要的状态空间、动作空间以及奖赏函数;
智能体根据策略函数选择并执行当前状态对应的动作过程中,以最大化累计奖赏为目标,得到多个科室的病床资源配置优化策略。
2.根据权利要求1所述的基于强化学习的病床资源配置优化方法,其特征是,所述时间差异分布信息的获得过程具体为:
对在院患者数做滑动平均处理,得到标准配置数据;
动态设置两个相邻且均大于基础步长的第一步长和第二步长;
以第一步长与第二步长中的数据均值之差不小于标准差值为第一目标,对标准配置数据进行搜索分析,所有搜索确定的第一步长与第二步长所对应的时间段构成时间差异分布信息。
3.根据权利要求2所述的基于强化学习的病床资源配置优化方法,其特征是,以所有所述第一步长与第二步长中的数据均值之差波动性最大为第二目标确定唯一的时间差异分布信息。
4.根据权利要求1所述的基于强化学习的病床资源配置优化方法,其特征是,所述状态空间中的变量包括:患者科室类别、当前单一科室的在院患者数、当前单一科室的住院天数超长患者数、当前剩余未分配病床数、日期、是否节假日以及未入院患者数量。
5.根据权利要求1所述的基于强化学习的病床资源配置优化方法,其特征是,所述动作空间具体为:
若病床高于空置阈值或调整病床周转率时,则智能体不分配病床;
若病床不高于空置阈值,且病床周转率低于周转率阈值时,则智能体分配病床。
6.根据权利要求1所述的基于强化学习的病床资源配置优化方法,其特征是,所述以最大化累计奖赏为目标的计算公式具体为:
Figure 690931DEST_PATH_IMAGE001
其中,
Figure 947207DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure 251149DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 119748DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值。
7.根据权利要求1所述的基于强化学习的病床资源配置优化方法,其特征是,所述以最大化累计奖赏为目标的计算公式具体为:
Figure 592580DEST_PATH_IMAGE005
其中,
Figure 255643DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure 578039DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 489145DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值;
Figure 49439DEST_PATH_IMAGE006
表示时刻t+k+1所属步长
Figure 148982DEST_PATH_IMAGE007
的数据均值;
Figure 928981DEST_PATH_IMAGE008
表示病床配置数据的数据均值。
8.根据权利要求1所述的基于强化学习的病床资源配置优化方法,其特征是,所述以最大化累计奖赏为目标的计算公式具体为:
Figure 139383DEST_PATH_IMAGE009
其中,
Figure 819763DEST_PATH_IMAGE002
表示在时刻t所确定的累计奖赏;
Figure 588742DEST_PATH_IMAGE003
表示第k次动作的奖励衰减值;
Figure 151311DEST_PATH_IMAGE004
表示在时刻t+k+1的奖赏值;
Figure 899824DEST_PATH_IMAGE006
表示时刻t+k+1所属步长
Figure 201755DEST_PATH_IMAGE007
的数据均值;
Figure 111942DEST_PATH_IMAGE008
表示病床配置数据的数据均值。
9.基于强化学习的病床资源配置优化系统,其特征是,包括:
数据处理模块,用于获取多个科室的病床配置数据,并对单一科室的在院患者数进行时间差异分析,得到时间差异分布信息;
模型构建模块,用于结合病床配置数据和时间差异分布信息,通过机器强化学习方法模拟患者入出院过程建立智能体需要的状态空间、动作空间以及奖赏函数;
配置优化模块,用于根据策略函数选择并执行当前状态对应的动作过程中,以最大化累计奖赏为目标,得到多个科室的病床资源配置优化策略。
10.一种计算机终端,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现如权利要求1-8中任意一项所述的基于强化学习的病床资源配置优化方法。
CN202211263783.3A 2022-10-17 2022-10-17 基于强化学习的病床资源配置优化方法、系统及终端 Active CN115331796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211263783.3A CN115331796B (zh) 2022-10-17 2022-10-17 基于强化学习的病床资源配置优化方法、系统及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211263783.3A CN115331796B (zh) 2022-10-17 2022-10-17 基于强化学习的病床资源配置优化方法、系统及终端

Publications (2)

Publication Number Publication Date
CN115331796A true CN115331796A (zh) 2022-11-11
CN115331796B CN115331796B (zh) 2022-12-27

Family

ID=83913993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211263783.3A Active CN115331796B (zh) 2022-10-17 2022-10-17 基于强化学习的病床资源配置优化方法、系统及终端

Country Status (1)

Country Link
CN (1) CN115331796B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117995371A (zh) * 2024-04-02 2024-05-07 南通市第一老年病医院(上海大学附属南通医院、南通市第六人民医院、南通市肺科医院) 一种基于物联网的医院药物资源管理方法及系统

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0764914A2 (en) * 1995-09-21 1997-03-26 Children's Research Institute Method for allocating beds in a pediatric intensive care unit and for evaluating quality of care
JP2006048573A (ja) * 2004-08-09 2006-02-16 Fujitsu Ltd 病床割当て装置および病床割当てプログラム
US20180348716A1 (en) * 2017-05-30 2018-12-06 Xerox Corporation Non-markovian control with gated end-to-end memory policy networks
CN109445903A (zh) * 2018-09-12 2019-03-08 华南理工大学 基于QoS特征发现的云计算节能调度实现方法
CN109545348A (zh) * 2018-11-15 2019-03-29 华南理工大学 一种基于蚂蚁系统优化的医院床位安排方法
CN109952082A (zh) * 2016-08-19 2019-06-28 科瑞亚拓股份有限公司 用于动态压力损害风险评估和响应的系统、方法和计算机可读介质
CN110648049A (zh) * 2019-08-21 2020-01-03 北京大学 一种基于多智能体的资源分配方法与系统
US20200211692A1 (en) * 2018-12-31 2020-07-02 GE Precision Healthcare, LLC Facilitating artificial intelligence integration into systems using a distributed learning platform
CN112017768A (zh) * 2020-09-08 2020-12-01 深圳市觅拓物联信息技术有限公司 医院床位分配方法和分配系统
CN112639995A (zh) * 2018-08-23 2021-04-09 通用电气公司 用于优化患者安置的基于机器学习的多因素优先级框架
CN114420277A (zh) * 2022-01-25 2022-04-29 河海大学 一种基于改进Raft算法的区块链医院病床管理系统
JP7083476B1 (ja) * 2020-12-29 2022-06-13 北京▲郵▼▲電▼大学 ネットワークアクセスデバイスのリソース割り当て方法および装置
CN114626836A (zh) * 2022-05-17 2022-06-14 浙江大学 基于多智能体强化学习的急救后送决策系统及方法
WO2022171262A1 (en) * 2021-02-09 2022-08-18 Huawei Technologies Co., Ltd. Scheduling tasks for execution by a computer based on a reinforcement learning model
CN114999619A (zh) * 2022-06-14 2022-09-02 琼台师范学院 一种基于时滞分析的传染病床位动态量化方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0764914A2 (en) * 1995-09-21 1997-03-26 Children's Research Institute Method for allocating beds in a pediatric intensive care unit and for evaluating quality of care
JP2006048573A (ja) * 2004-08-09 2006-02-16 Fujitsu Ltd 病床割当て装置および病床割当てプログラム
CN109952082A (zh) * 2016-08-19 2019-06-28 科瑞亚拓股份有限公司 用于动态压力损害风险评估和响应的系统、方法和计算机可读介质
US20180348716A1 (en) * 2017-05-30 2018-12-06 Xerox Corporation Non-markovian control with gated end-to-end memory policy networks
CN112639995A (zh) * 2018-08-23 2021-04-09 通用电气公司 用于优化患者安置的基于机器学习的多因素优先级框架
CN109445903A (zh) * 2018-09-12 2019-03-08 华南理工大学 基于QoS特征发现的云计算节能调度实现方法
CN109545348A (zh) * 2018-11-15 2019-03-29 华南理工大学 一种基于蚂蚁系统优化的医院床位安排方法
US20200211692A1 (en) * 2018-12-31 2020-07-02 GE Precision Healthcare, LLC Facilitating artificial intelligence integration into systems using a distributed learning platform
CN110648049A (zh) * 2019-08-21 2020-01-03 北京大学 一种基于多智能体的资源分配方法与系统
CN112017768A (zh) * 2020-09-08 2020-12-01 深圳市觅拓物联信息技术有限公司 医院床位分配方法和分配系统
JP7083476B1 (ja) * 2020-12-29 2022-06-13 北京▲郵▼▲電▼大学 ネットワークアクセスデバイスのリソース割り当て方法および装置
WO2022171262A1 (en) * 2021-02-09 2022-08-18 Huawei Technologies Co., Ltd. Scheduling tasks for execution by a computer based on a reinforcement learning model
CN114420277A (zh) * 2022-01-25 2022-04-29 河海大学 一种基于改进Raft算法的区块链医院病床管理系统
CN114626836A (zh) * 2022-05-17 2022-06-14 浙江大学 基于多智能体强化学习的急救后送决策系统及方法
CN114999619A (zh) * 2022-06-14 2022-09-02 琼台师范学院 一种基于时滞分析的传染病床位动态量化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XIAOXIA LIU ETC.: "TLP-IDS: A Two-layer Intrusion Detection System", 《 2020 INTERNATIONAL SYMPOSIUM ON RELIABLE DISTRIBUTED SYSTEMS (SRDS)》 *
周厚桥: "以病人为中心的开放式、集成化HIS的建设", 《中国优秀硕士论文全文数据库》 *
赵聪 等: "基于多智能体深度强化学习的停车系统智能延时匹配方法", 《中国公路学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117995371A (zh) * 2024-04-02 2024-05-07 南通市第一老年病医院(上海大学附属南通医院、南通市第六人民医院、南通市肺科医院) 一种基于物联网的医院药物资源管理方法及系统

Also Published As

Publication number Publication date
CN115331796B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
Bruni et al. A stochastic programming approach for operating theatre scheduling under uncertainty
CN115331796B (zh) 基于强化学习的病床资源配置优化方法、系统及终端
DE60035774T2 (de) Arbitrierungsverfahren und systeme zur zugriffsarbitrierung auf einen speicher einer plattensteuerung
JP2012221508A (ja) 患者予後を予測するシステムおよびコンピュータ可読媒体
CN113792920B (zh) 一种面向单诊室的医院就诊顺序优化方法及装置
CN116257345B (zh) 深度学习任务调度方法及装置
Van Lent et al. Reducing the throughput time of the diagnostic track involving CT scanning with computer simulation
CN113835626B (zh) 一种确定磁盘可使用时长的方法及装置
CN112381446A (zh) 一种保持长期公平性的排班方法、系统、介质及电子设备
WO2023050668A1 (zh) 基于因果推断的分群模型构建方法和医疗数据处理方法
CN110399124A (zh) 一种代码生成方法、装置、设备及可读存储介质
Wang et al. Capacity and surgery partitioning: An approach for improving surgery scheduling in the inpatient surgical department
CN117766119A (zh) 一种医疗资源的调度方法及装置
Schultz et al. Variability based surgical scheduling: a simulation approach
US11169990B2 (en) Re-computing pre-computed search results
CN109994211B (zh) 一种基于ehr数据的慢性肾脏病恶化风险的建模方法
Wu et al. Hospital bed planning in a single department based on Monte Carlo Simulation and queuing theory
CN110986312B (zh) 一种确定分析空调制冷指数的方法及装置
JP2003526137A (ja) 職員配置を自動的に割り振るための方法および装置
CN111354052B (zh) 一种pet图像重建方法和系统
CN107785065B (zh) 用于调整呼吸机运行参数的方法及系统
CN111445988A (zh) 一种基于快速响应的医疗救援分配系统及方法
CN117133427B (zh) 一种医院智能挂号方法、系统、设备及存储介质
CN115359890B (zh) 基于迁移学习的单病种资源消耗分析方法、系统及终端
CN117555338B (zh) 基于K-means算法的多自动引导车协作停泊方法及自动引导车

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Optimization method, system, and terminal for hospital bed resource allocation based on reinforcement learning

Effective date of registration: 20230426

Granted publication date: 20221227

Pledgee: Bank of Chengdu science and technology branch of Limited by Share Ltd.

Pledgor: Zhongke Houli information technology (Chengdu) Co.,Ltd.

Registration number: Y2023510000115

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20221227

Pledgee: Bank of Chengdu science and technology branch of Limited by Share Ltd.

Pledgor: Zhongke Houli information technology (Chengdu) Co.,Ltd.

Registration number: Y2023510000115