CN109360625A - 用于互联网中短期用药咨询业务量的预测系统及预测方法 - Google Patents
用于互联网中短期用药咨询业务量的预测系统及预测方法 Download PDFInfo
- Publication number
- CN109360625A CN109360625A CN201811340151.6A CN201811340151A CN109360625A CN 109360625 A CN109360625 A CN 109360625A CN 201811340151 A CN201811340151 A CN 201811340151A CN 109360625 A CN109360625 A CN 109360625A
- Authority
- CN
- China
- Prior art keywords
- data
- predicted
- prediction
- time point
- portfolio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用于互联网中短期用药咨询业务量的预测系统及预测方法,该系统包括:数据采集单元,用于负责采集服务器上存储的历史业务量数据和在线医生数量;预测单元,用于接收所述数据采集单元提供的数据,调用预测模型进行模型训练,并获取预测结果数据;上传单元,用于将预测结果数据上传至服务器;预测方法包括:(1)非节假日使用LSTM预测方法进行预测,且对于节假日过后的非节假日数据要去除节假日数据进行预测;(2)节假日使用改进指数平滑方法进行预测;以达到可快速、准确的对未来一天乃至几天的医生进行合理排班,给出医生人力配置建议的目的。
Description
技术领域
本发明属于人工智能的技术领域,具体而言,涉及一种用于互联网中短期用药咨询业务量的预测系统及预测方法。
背景技术
微问诊终端机是在药店门店内设置的远程医疗服务终端,该微问诊终端机由触摸式一体机高清抓拍仪及摄像头、集成IP电话的通话设备构成,并提供获取国家执业药师医师资格证书且具备多年药店、医院从业经验的专业药师、医生团队进行远程药学医学服务。能够保障药店营业期间均有执业药师及医生在线实时坐诊,为老百姓提供远程审方服务及电子处方流转服务,同时解答用药及健康咨询服务。
随着微问诊终端机的增多,用药咨询业务量(简称:业务量)越来越多,在目前及累计有5382万人使用微问诊终端机进行了咨询开药、电子开方等业务。目前对于业务量的情况无法有效预测,业务繁忙的时候用户排队严重,当收到药店前端反馈的时候病情已变的严重,而业务空闲时间医生冗余较多,浪费人力资源和成本。
预测未来业务数据量的走势,为服务医生人数的安排提供参考数据,公司可以针对不同的业务量提前安排对应的医生,将每笔业务的接通等待时间控制在可接受范围内,使得在实时保证医生服务水平的前提条件下,实现公司人力资源的最优配置。因此,如何能准确预测业务量是一个重要且亟待解决的难题。
常用的预测方法很多,有经验法、时间序列预测法、指数平滑法、回归分析法、人工神经网络预测法、支持向量预测法等;其中,人工神经网络需要利用大量样本训练模型且训练速度较慢;ARIMA模型要求序列是平稳序列;经验法需要人力成本较高;指数平滑法和回归分析法较简单,但精度不高;时间序列预测法要求历史数据必须完整,不适用于有季节变动规律的业务量预测。总的来说,单一的预测方法都有其局限性,在数据量不庞大的条件下,由于业务量的随机性、季节性等特点,以及受气候、节假日,药店设备数量变化,在线医生数量等的影响,预测稳定性不够。
基于上述的问题,在发明专利CN 107862555A基于指数平滑的预测系统与方法中,提出了一种改进的指数平滑方法用于对未来一段时间的销售数据进行预测,但是光指数平滑预测的精度不高。
在论文基于LSTM和灰色模型集成的短期交通流预测中,提高了一种集成LSTM模型和GM模型的交通流预测方法,通过动态权值的方法,对两种预测结果进行加权,但是此种方式存在两个问题:一是节假日预测业务量高于实际业务量,二是节假日过后预测量普遍低于实际业务量的情况,无论怎样加权,其预测值仍然低于实际值。预测精度依然不高。
因此,有必要设计一种多模型融合的简单、高效、精确的业务预测模型。
发明内容
有鉴于此,为了解决现有技术存在的上述问题,本发明提供了一种用于互联网中短期用药咨询业务量的预测系统及预测方法以达到可快速、准确的对未来一天乃至几天的医生进行合理排班,给出医生人力配置建议的目的。
本发明所采用的技术方案为:一种用于互联网中短期用药咨询业务量的预测系统,该系统包括:
数据采集单元,用于负责采集服务器上存储的历史业务量数据和在线医生数量;
预测单元,用于接收所述数据采集单元提供的数据,调用预测模型进行模型训练,并获取预测结果数据;
上传单元,用于将预测结果数据上传至服务器。
本发明还公开了一种用于互联网中短期用药咨询业务量的预测方法,包括以下步骤:
(1)判断日期M的当前时间是否超过24点,若未超过,则输出日期M的预测结果数据;若超过,则将日期变更为M+1并进入步骤(2);
(2)获取日期M的业务量数据,并加载历史业务量数据,以得到前N天业务量数据;
(3)判断日期M+1是否为节假日,若为节假日,则进入步骤(4);若不为节假日,则进入步骤(6);
(4)采用改进指数平滑方法进行预测;
(5)输出日期M+1的预测结果数据;
(6)判断日期M是否为节假日,若为节假日,则进入步骤(7);若不为节假日,则进入步骤(8);
(7)去除步骤(2)中所述前N天业务量数据中节假日的业务量数据,并进入步骤(8);
(8)采用LSTM预测方法进行预测;
(9)输出日期M+1中各预测时间点的预测结果数据;
(10)对步骤(1)-步骤(9)循环运行。
进一步地,所述LSTM预测方法的具体步骤如下:
1)获取历史业务量数据,并将历史业务量数据切分为训练数据和验证数据;
2)建立LSTM神经网络预测模型,并将训练数据输入至LSTM神经网络预测模型中进行训练;
3)计算均方根误差(RMSE),调整参数,以获得RMSE的变化情况,若RMSE<T,则进入步骤4);若RMSE≥T,则进入返回至步骤2);其中,T为阀值;
4)采用滚动预测算法,预测未来各个时间点的业务量,以获取各预测时间点的预测结果数据。
进一步地,所述改进指数平滑方法的具体步骤如下:
a.获取数据:获取节假日的前N天中同一观察时间点的业务量数据作为训练样本;
b.确定S′0(i)的取值:S′0(i)表示训练样本的天数内第i个观察时间点的业务量数据一次指数平滑值的初值,令:S′0(i)的取值取为第一天的第i个观察时间点的业务量数据x1(i),公式如下:
S′0(i)=x1(i) (1)
c.通过三次指数平滑法计算得到各个观察时间点的一次指数平滑预测值、二次指数平滑预测值和三次指数平滑预测值;
d.加入在线医生检测因子;
e.计算待预测日期中各预测时间点的预测结果数据。
进一步地,所述步骤c的具体具体步骤如下:
c1:令:i=1,j=1,i表示一天中的第i个观察时间点,j表示平滑系数的第j个取值点,t表示第t天,t=1,2,...,m,m表示训练样本的训练天数;
c2:令令S′0(i,j)=S′0(i),分别计算一次指数平滑预测值、二次指数平滑预测值和三次指数平滑预测值;
其中,一次指数平滑法的预测模型:
S′t(i,j)=α(i,j)xt(i)+(1-α(i,j))S′t-1(i,j),t=1,2,...,m (2)
S′t(i,j)表示第t天的第i个观察时间点的第j个平滑系数业务量一次指数平滑预测值;α(i,j)表示第i个观察时间点的第j个平滑系数取值;xt(i)表示第t天第i个观察时间点的实际业务量;
二次指数平滑法的预测模型:
Ft(i,j)=at(i,j)+bt(i,j),t=1,2,...,m (3)
Ft(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量二次指数平滑预测值;
其中,at(i,j)=2S′t(i,j)-S″t(i,j),
S″t(i,j)=α(i,j)S′t(i,j)+(1-α(i,j))S″t-1(i,j),S″t(i,j)表示第t天第i个观察时间点第j个平滑系数业务量的二次指数平滑值;
三次指数平滑法的预测模型为:
Xt(i,j)=At(i,j)+Bt(i,j)+Ct(i,j),t=1,2,...,m (4)
其中:Xt(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量三次指数平滑预测值,
At(i,j)=3S′t(i,j)-3S″t(i,j)+S″′t(i,j),
S″′t(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量的三次指数平滑值;
c3:计算该α(i,j)下的三次指数平滑预测误差RMSE(i,j)
c4:令j=j+1,返回步骤c1,重复计算,求使得预测误差最小对应的α(i,j),记作αbest(i);
c5:根据上述公式(2)、(3)、(4)分别求得第i天的第i个观察时间点的一次指数平滑预测值S′t(i)、二次指数平滑预测值Ft(i)、三次指数平滑预测值Xt(i);
c6:令i=i+1,返回c1步,重复计算,直到所有观察时间点的平滑系数和一次指数平滑预测值S′t(i)、二次指数平滑预测值Ft(i)、三次指数平滑预测值Xt(i)都计算完成。
进一步地,所述步骤d中,根据公式(7)计算最终业务量预测值为yt(i);
yt(i)=θ(i)dt(i)+(1-θ(i))Xt(i) (7)
其中,dt(i)为第t天第i个观察时间点安排的在线医生数量,θ(i)为第i个观察时间点的在线医生数量加权因子,Xt(i)为第t天第i个观察时间点的业务量预测值。
进一步地,所述在线医生数量加权因子的计算方法如下:
d1:令i=1;
d2:θ(i)=0.0;
d3:根据公式(7)计算训练阶段每天第i个观察时间点的业务量预测值yt(i);
d4:根据公式(8)计算均方根误差:
d5:令θ(i)=θ(i)+0.1,重复步骤d1-d5,直到θ(i)=1;
d6:计算使得RMSE2(i)最小的θ(i),记作θbest(i),用θbest(i)作为公式(7)中的θ(i)。
进一步地,所述步骤e中计算待预测日期中各预测时间点的预测结果数据的具体步骤如下:
e1:计算待预测日期中各预测时间点的原始数据:
将待预测日期各预测时间点的原始数据设置为前一天、前两天、前一周、前一个月的加权,公式(9)如下:
xm+1(i)=w1(i)xm(i)+w2(i)xm-1(i)+w3(i)xm-2(i)+w4(i)xm-T+1″(i) (9)
其中,w1(i)+w2(i)+w3(i)+w4(i)=1,T为根据数据的周期性选定的;
e2:采用公式(2)、(3)、(4)中分别计算第m+1天第i个预测时间点的一次指数平滑预测值S′m+1(i)、二次指数平滑预测值Fm+1(i)、三次指数平滑预测值Xm+1(i);
e3:以此类推,重复步骤e1到e2,直到计算完所有预测时间点的三次指数平滑预测值Xm+1(i);
e4:根据公式(10)计算待预测一天各预测时间点的最终预测值;
ym+1(i)=θbest(i)dm+1(i)+(1-θbest(i))Xm+1(i) (10)。
本发明的有益效果为:
1.本发明所提供的用于互联网中短期用药咨询业务量的预测方法中,对于当天为节假日时,采用改进指数平滑方法进行计算当天的预测数据结果,而对于当天不是节假日,则采用LSTM预测方法进行预测进行计算当天的预测数据结果,并在计算时将节假日的数据去除,两种方法有效结合,可以解决对于历史数据不足无法进行大量训练的中短期预测问题,能够克服传统的预测方法中受业务量的随机性、季节性等特点,以及受气候、节假日,药店设备数量变化,导致预测稳定性不够的缺陷;同时,将节假日和非节假日的预测数据进行分开单独计算,能够在很大程度上提高预测数据结果的精度。
2.本发明所提供的用于互联网中短期用药咨询业务量的预测方法,可以经济合理地安排医生数量,对医生工作进行合理调度,保证业务咨询的稳定运行,避免用户排队严重造成的投诉或者医生空闲造成人力成本增加,提高经济效益和社会效益;用药咨询业务预测的结果,还可以用于确定设备增加方案,为市场推广提供信息参考和决策辅助。
附图说明
图1是本发明提供的用于互联网中短期用药咨询业务量的预测系统的系统结构框图;
图2是本发明提供的用于互联网中短期用药咨询业务量的预测方法的整体流程示意图;
图3是本发明提供的用于互联网中短期用药咨询业务量的预测方法中LSTM预测方法的流程示意图。
具体实施方式
为使对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
因此,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,在本实施例具体公开了一种用于互联网中短期用药咨询业务量的预测系统,该系统包括:
数据采集单元,用于负责采集服务器上存储的历史业务量数据和在线医生数量;数据采集单元主要负责采集存储于服务器上的历史业务量数据和在线医生数量;其采集过程,具体包括以下步骤:
1、采集数据以半小时为采集单位,则:一天共有48个业务数据;
2、对业务数据进行清洗,去掉业务量接近0的业务数据,即凌晨0点到7点30间的业务数据,再去掉晚上23点以后的业务数据,剩余30个业务数据;
3、将清洗后的业务数据存入Business.csv中;
4、实时采集前一天的实际业务数据并存入fetch_atual_busi中;
5、采集历史在线医生数量和未来一天各时间点的在线医生安排数据。
预测单元,用于接收所述数据采集单元提供的数据,调用预测模型进行模型训练,并获取预测结果数据;使用普通计算机,根据数据采集单元所提供的业务数据,调用预测模型进行预测,并整理获取预测结果数据。
上传单元,用于将预测结果数据上传至服务器。负责将预测单元所获取的预测结果数据并通过write_forecast_busi函数上传至服务器,调度人员通过调取服务器上存储的预测业务量数据对未来一天的医生进行合理调度。
如图2所示,在本发明还公开了一种用于互联网中短期用药咨询业务量的预测方法,非节假日使用LSTM预测方法进行预测,对于节假日过后的非节假日数据要去除节假日数据进行预测;而节假日采用改进指数平滑方法进行预测。
该方法具体包括以下步骤:
(1)判断日期M的当前时间是否超过24点,若未超过,则输出日期M的预测结果数据;若超过,则将日期变更为M+1并进入步骤(2);
(2)获取日期M的业务量数据,并加载历史业务量数据,以得到前N天业务量数据;
(3)判断日期M+1是否为节假日,若为节假日,则进入步骤(4);若不为节假日,则进入步骤(6);
(4)采用改进指数平滑方法进行预测;
(5)输出日期M+1的预测结果数据;
(6)判断日期M是否为节假日,若为节假日,则进入步骤(7);若不为节假日,则进入步骤(8);
(7)去除步骤(2)中所述前N天业务量数据中节假日的业务量数据,并进入步骤(8);
(8)采用LSTM预测方法进行预测;
(9)输出日期M+1中各预测时间点的预测结果数据;
(10)对步骤(1)-步骤(9)循环运行。
如图3所示,上述步骤(8)中所述LSTM预测方法的具体步骤如下:
1)获取历史业务量数据,并将历史业务量数据切分为训练数据和验证数据,在本实施例中,取N组业务数据,以第1到M组业务量数据作为输入,第M+1组业务量作为输出,作为第一组数据,第2到M+1组业务量数据作为输入,第M+2组业务量作为输出,依次类推,完成数据转换,共建立N-M组数据对,将其中一部分数据对作为训练样本,剩余的作为验证样本;
2)建立LSTM神经网络预测模型,并将训练数据输入至LSTM神经网络预测模型中进行训练;LSTM神经网络预测模型使用Keras封装好的库实现,使用Python代码实现基于Keras的LSTM单变量业务量预测;
3)计算均方根误差(RMSE),调整参数对LSTM模型进行优化,以获得RMSE的变化情况,若RMSE<T,则进入步骤4);若RMSE≥T,则进入返回至步骤2);其中,T为阀值;具体的:
其中,xt表示实际业务量,Xt表示预测业务量,m=30,表示一个预测周期,即一天的30个观察时刻,T根据经验确定,在本实施例中,取90。调整参数使得预测RMSE越小越好。
4)采用滚动预测算法,将预测出来的业务量加入历史数据,预测未来多个时间点的业务量,预测未来各个时间点的业务量,以获取各预测时间点的预测结果数据。使用SPSS数据分析器对步骤4)中各预测时间点的预测结果数据和各预测时间点的实际业务量进行配对样本T检验,以获取预测精度,其结果如表1所示:
N | Correlation | Sig. | |
Pair1实际业务量&预测业务量 | 30 | 0.987 | 0.000 |
表格中显示了实际业务量和预测业务量的相关系数和Sig参数。
相关系数|r|表明了实际业务量和预测业务量之间的关系密切程度。相关系数值的取值范围为[-1,+1]。|r|越接近1说明关联程度越高,一般当|r|高于0.75时,认为两组数据的线性相关性较强。从表格中可以看出相关系数为0.987,高于0.75,表明实际业务量和预测业务量之间具有高度相关性。同时,sig参数为0.000,当sig<0.05时,说明相关系数具有统计意义,实际业务量和预测业务量的相关性成立,从上表可以看出,预测精度较高。
举例一:
1.获取历史业务量数据
从2018年1月25日到2018年9月20日34周的数据共7140条业务数组,每天30条数据,N=7140,M=30。以第1到30条业务量数据作为输入,第31条业务量数据作为输出,作为第一组数据,第2到31条业务量数据作为输入,第32条业务量数据作为输出,依次类推,完成数据转换,共建立7110组数据对。
2.切分训练数据和验证数据
将67%的数据对作为训练样本,剩余的作为验证样本。
3.建立预测模型
LSTM模型的网络构成如下:
输入层:30个神经元;
第一隐层:LSTM结构单元,带有30个LSTM单元;
第二隐层:LSTM结构单元,带有30个LSTM单元;
输出层:1个神经元,代表下一个业务量。
epochs=4000,batch_size=180
4.滚动预测
采用滚动预测方式,将预测出来的1个业务量加入历史数据,预测下1个业务量,依次类推,预测想预测天数的业务量。
举例二:
1.获取历史业务量数据
从2018年1月25日到2018年9月20日34周的数据共7140条业务数组,每天30条数据,N=34,M=7。以第1到7天共210条业务量数据作为输入,第8天共30条业务量数据作为输出,作为第一组数据,第2到到8天共210条业务量数据作为输入,第9天共30条业务量数据作为输出,依次类推,完成数据转换,共建立27组数据对。
2.切分训练数据和验证数据;
将67%的数据对作为训练样本,剩余的作为验证样本。
3.建立预测模型
LSTM模型的网络构成如下:
输入层:210个神经元;
第一隐层:LSTM结构单元,带有50个LSTM单元;
第二隐层:LSTM结构单元,带有30个LSTM单元;
输出层:30个神经元,代表未来一天的业务量。
epochs=10000,batch_size=250
4.滚动预测
采用滚动预测方式,将预测出来的30个业务量加入历史数据,预测未来一天的30个业务量,依次类推,预测想预测天数的业务量。
所述步骤(4)中的改进指数平滑方法做业务量预测是分时段进行的,训练阶段叫观察时间点,预测阶段叫预测时间点,即根据过去m天中各观察时间点进行指数平滑预测,得到未来一天各预测时间点的预测值,其具体步骤如下:
a.获取数据:获取节假日的前N天中同一观察时间点的业务量数据作为训练样本;在本发明实施例中,将节假日前的31天各个观察时间点的业务量统计起来,去除节假日当天的异常数据,采用指数平滑法预测未来一天各个观察时间点的业务量,30个观察时间点,需要进行30次指数平滑运算预测,以11点为例,统计的2018年8月24日到2018年9月23日的业务量。
b.确定S′0(i)的取值:S′0(i)表示训练样本的天数内第i个观察时间点的业务量数据一次指数平滑值的初值,令:S′0(i)的取值取为第一天的第i个观察时间点的业务量数据x1(i),公式如下:
S′0(i)=x1(i) (1)
在本发明实施例中,以2018年8月24日到9月23日11时的时间为例进行说明,S′0=2975,i=1,2,...,30表示统计的业务量是一天中的30个观察时间点的业务量。
c.通过三次指数平滑法计算得到各个观察时间点的一次指数平滑预测值、二次指数平滑预测值和三次指数平滑预测值;对每天第i个观察时间点业务量,计算其二次指数平滑预测值和三次指数平滑预测值,计算得到使得均方根误差最小的平滑系数值作为第i个观察时间点的平滑系数,根据最佳平滑系数计算每天观察时间点的预测值。
d.加入在线医生检测因子;
e.计算待预测日期中各预测时间点的预测结果数据。
以下分别对步骤c、步骤d和步骤e进行详细说明:
(一)所述步骤c的具体具体步骤如下:
c1:令:i=1,j=1,i表示一天中的第i个观察时间点,j表示平滑系数的第j个取值点,t表示第t天,t=1,2,...,m,m表示训练样本的训练天数;在本发明实施例中,i的取值范围为[1,30],j的取值范围为[1,9],在本发明实施例中,m=31。
c2:令令S′0(i,j)=S′0(i),分别计算一次指数平滑预测值、二次指数平滑预测值和三次指数平滑预测值;
其中,一次指数平滑法的预测模型:
S′t(i,j)=α(i,j)xt(i)+(1-α(i,j))S′t-1(i,j),t=1,2,...,m (2)
S′t(i,j)表示第t天的第i个观察时间点的第j个平滑系数业务量一次指数平滑预测值;α(i,j)表示第i个观察时间点的第j个平滑系数取值;xt(i)表示第t天第i个观察时间点的实际业务量;
二次指数平滑法的预测模型:
Ft(i,j)=at(i,j)+bt(i,j),t=1,2,...,m (3)
Ft(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量二次指数平滑预测值;
其中,at(i,j)=2S′t(i,j)-S″t(i,j),
S″t(i,j)=α(i,j)S′t(i,j)+(1-α(i,j))S″t-1(i,j),S″t(i,j)表示第t天第i个观察时间点第j个平滑系数业务量的二次指数平滑值;
三次指数平滑法的预测模型为:
Xt(i,j)=At(i,j)+Bt(i,j)+Ct(i,j),t=1,2,...,m (4)
其中:Xt(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量三次指数平滑预测值,
At(i,j)=3S′t(i,j)-3S″t(i,j)+S″′t(i,j),
S″′t(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量的三次指数平滑值;
c3:计算该α(i,j)下的三次指数平滑预测误差RMSE(i,j)
c4:令j=j+1,返回步骤c1,重复计算,直到α(i,j)=0.9,求使得预测误差最小对应的α(i,j),记作αbest(i);
在本发明的实施例中,计算得到αbest(11)=0.4
c5:根据上述公式(2)、(3)、(4)分别求得第i天的第i个观察时间点的一次指数平滑预测值S′t(i)、二次指数平滑预测值Ft(i)、三次指数平滑预测值Xt(i);
c6:令i=i+1,返回c1步,重复计算,直到所有观察时间点的平滑系数和一次指数平滑预测值S′t(i)、二次指数平滑预测值Ft(i)、三次指数平滑预测值Xt(i)都计算完成。
(二)所述步骤d中,由于业务量数据受在线医生数量很大影响,需根据公式(7)计算最终业务量预测值为yt(i);
yt(i)=θ(i)dt(i)+(1-θ(i))Xt(i) (7)
其中,dt(i)为第t天第i个观察时间点安排的在线医生数量,θ(i)为第i个观察时间点的在线医生数量加权因子,Xt(i)为第t天第i个观察时间点的业务量预测值;所述在线医生数量加权因子θ(i)的计算方法如下:
d1:令i=1;
d2:θ(i)=0.0;
d3:根据公式(7)计算训练阶段每天第i个观察时间点的业务量预测值yt(i);
d4:根据公式(8)计算均方根误差:
d5:令θ(i)=θ(i)+0.1,重复步骤d1-d5,直到θ(i)=1;
d6:计算使得RMSE2(i)最小的θ(i),记作θbest(i),用θbest(i)作为公式(7)中的θ(i)进行计算。
(三)所述步骤e中计算待预测日期中各预测时间点的预测结果数据的具体步骤如下:
e1:计算待预测日期中各预测时间点的原始数据:
在预测的时间段中,是没有原始数据的。将待预测日期各预测时间点的原始数据设置为前一天、前两天、前一周、前一个月的加权,公式(9)如下:
xm+1(i)=w1(i)xm(i)+w2(i)xm-1(i)+w3(i)xm-2(i)+w4(i)xm-T+1″(i) (9)
其中,w1(i)+w2(i)+w3(i)+w4(i)=1,T为根据数据的周期性选定的;在本发明实施例中,取T=31,w1(i)=0.4,w2(i)=0.1,w3(i)=0.1,w4(i)=0.4。
e2:采用公式(2)、(3)、(4)中分别计算第m+1天第i个预测时间点的一次指数平滑预测值S′m+1(i)、二次指数平滑预测值Fm+1(i)、三次指数平滑预测值Xm+1(i);
e3:以此类推,重复步骤e1到e2,直到计算完所有预测时间点的三次指数平滑预测值Xm+1(i);
e4:根据公式(10)计算待预测一天各预测时间点的最终预测值;
ym+1(i)=θbest(i)dm+1(i)+(1-θbest(i))Xm+1(i) (10)。
使用SPSS数据分析器对9月24日用两种方法所获取的预测业务量和实际业务量进行配对样本T检验,结果如表2所示:
本发明在非节假日使用LSTM预测业务量,节假日使用改进的指数平滑预测方法预测业务量,两种方法有效结合,两种方法的相关系数分别为0.900和0.987,均高于0.75,表明实际业务量和预测业务量之间具有高度相关性。同时,sig参数均为0.000,当sig<0.05时,说明相关系数具有统计意义,可以解决对于历史数据不足无法进行大量训练的中短期预测问题。
本发明不局限于上述可选实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是落入本发明权利要求界定范围内的技术方案,均落在本发明的保护范围之内。
Claims (8)
1.一种用于互联网中短期用药咨询业务量的预测系统,其特征在于,该系统包括:
数据采集单元,用于负责采集服务器上存储的历史业务量数据和在线医生数量;
预测单元,用于接收所述数据采集单元提供的数据,调用预测模型进行模型训练,并获取预测结果数据;
上传单元,用于将预测结果数据上传至服务器。
2.一种用于互联网中短期用药咨询业务量的预测方法,其特征在于,该预测方法包括以下步骤:
(1)判断日期M的当前时间是否超过24点,若未超过,则输出日期M的预测结果数据;若超过,则将日期变更为M+1并进入步骤(2);
(2)获取日期M的业务量数据,并加载历史业务量数据,以得到前N天业务量数据;
(3)判断日期M+1是否为节假日,若为节假日,则进入步骤(4);若不为节假日,则进入步骤(6);
(4)采用改进指数平滑方法进行预测;
(5)输出日期M+1的预测结果数据;
(6)判断日期M是否为节假日,若为节假日,则进入步骤(7);若不为节假日,则进入步骤(8);
(7)去除步骤(2)中所述前N天业务量数据中节假日的业务量数据,并进入步骤(8);
(8)采用LSTM预测方法进行预测;
(9)输出日期M+1中各预测时间点的预测结果数据;
(10)对步骤(1)-步骤(9)循环运行。
3.根据权利要求2所述的用于互联网中短期用药咨询业务量的预测方法,其特征在于,所述LSTM预测方法的具体步骤如下:
1)获取历史业务量数据,并将历史业务量数据切分为训练数据和验证数据;
2)建立LSTM神经网络预测模型,并将训练数据输入至LSTM神经网络预测模型中进行模型训练;
3)计算均方根误差(RMSE),若RMSE<T,则进入步骤4);若RMSE≥T,调整参数,以获得RMSE的变化情况,返回至步骤2);其中,T为阀值;
4)采用滚动预测算法,预测未来各个时间点的业务量,以获取各预测时间点的预测结果数据。
4.根据权利要求2所述的用于互联网中短期用药咨询业务量的预测方法,其特征在于,所述改进指数平滑方法的具体步骤如下:
a.获取数据:获取节假日的前N天中同一观察时间点的业务量数据作为训练样本;
b.确定S′0(i)的取值:S′0(i)表示训练样本的天数内第i个观察时间点的业务量数据一次指数平滑值的初值,令:S′0(i)的取值取为第一天的第i个观察时间点的业务量数据x1(i),公式如下:
S′0(i)=x1(i) (1)
c.通过三次指数平滑法计算得到各个观察时间点的一次指数平滑预测值、二次指数平滑预测值和三次指数平滑预测值;
d.加入在线医生检测因子;
e.计算待预测日期中各预测时间点的预测结果数据。
5.根据权利要求4所述的用于互联网中短期用药咨询业务量的预测方法,其特征在于,所述步骤c的具体具体步骤如下:
c1:令:i=1,j=1,i表示一天中的第i个观察时间点,j表示平滑系数的第j个取值点,t表示第t天,t=1,2,...,m,m表示训练样本的训练天数;
c2:令令S′0(i,j)=S′0(i),分别计算一次指数平滑预测值、二次指数平滑预测值和三次指数平滑预测值;
其中,一次指数平滑法的预测模型:
S′t(i,j)=α(i,j)xt(i)+(1-α(i,j))S′t-1(i,j),t=1,2,...,m (2)
S′t(i,j)表示第t天的第i个观察时间点的第j个平滑系数业务量一次指数平滑预测值;α(i,j)表示第i个观察时间点的第j个平滑系数取值;xt(i)表示第t天第i个观察时间点的实际业务量;
二次指数平滑法的预测模型:
Ft(i,j)=at(i,j)+bt(i,j),t=1,2,...,m (3)
Ft(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量二次指数平滑预测值;
其中,at(i,j)=2S′t(i,j)-S″t(i,j),
S″t(i,j)=α(i,j)S′t(i,j)+(1-α(i,j))S″t-1(i,j),S″t(i,j)表示第t天第i个观察时间点第j个平滑系数业务量的二次指数平滑值;
三次指数平滑法的预测模型为:
Xt(i,j)=At(i,j)+Bt(i,j)+Ct(i,j),t=1,2,...,m (4)
其中:Xt(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量三次指数平滑预测值,
At(i,j)=3S′t(i,j)-3S″t(i,j)+S″′t(i,j),
S″′t(i,j)表示第t天的第i个观察时间点第j个平滑系数业务量的三次指数平滑值;
c3:计算该α(i,j)下的三次指数平滑预测误差RMSE(i,j)
c4:令j=j+1,返回步骤c1,重复计算,求使得预测误差最小对应的α(i,j),记作αbest(i);
c5:根据上述公式(2)、(3)、(4)分别求得第i天的第i个观察时间点的一次指数平滑预测值S′t(i)、二次指数平滑预测值Ft(i)、三次指数平滑预测值Xt(i);
c6:令i=i+1,返回c1步,重复计算,直到所有观察时间点的平滑系数和一次指数平滑预测值S′t(i)、二次指数平滑预测值Ft(i)、三次指数平滑预测值Xt(i)都计算完成。
6.根据权利要求5所述的用于互联网中短期用药咨询业务量的预测方法,其特征在于,所述步骤d中,根据公式(7)计算最终业务量预测值为yt(i);
yt(i)=θ(i)dt(i)+(1-θ(i))Xt(i) (7)
其中,dt(i)为第t天第i个观察时间点安排的在线医生数量,θ(i)为第i个观察时间点的在线医生数量加权因子,Xt(i)为第t天第i个观察时间点的业务量预测值。
7.根据权利要求6所述的用于互联网中短期用药咨询业务量的预测方法,其特征在于,所述在线医生数量加权因子的计算方法如下:
d1:令i=1;
d2:θ(i)=0.0;
d3:根据公式(7)计算训练阶段每天第i个观察时间点的业务量预测值yt(i);
d4:根据公式(8)计算均方根误差:
d5:令θ(i)=θ(i)+0.1,重复步骤d1-d5,直到θ(i)=1;
d6:计算使得RMSE2(i)最小的θ(i),记作θbest(i),用θbest(i)作为公式(7)中的θ(i)。
8.根据权利要求6所述的用于互联网中短期用药咨询业务量的预测方法,其特征在于,所述步骤e中计算待预测日期中各预测时间点的预测结果数据的具体步骤如下:
e1:计算待预测日期中各预测时间点的原始数据:
将待预测日期各预测时间点的原始数据设置为前一天、前两天、前一周、前一个月的加权,公式(9)如下:
xm+1(i)=w1(i)xm(i)+w2(i)xm-1(i)+w3(i)xm-2(i)+w4(i)xm-T+1″(i) (9)
其中,w1(i)+w2(i)+w3(i)+w4(i)=1,T为根据数据的周期性选定的;
e2:采用公式(2)、(3)、(4)中分别计算第m+1天第i个预测时间点的一次指数平滑预测值S′m+1(i)、二次指数平滑预测值Fm+1(i)、三次指数平滑预测值Xm+1(i);
e3:以此类推,重复步骤e1到e2,直到计算完所有预测时间点的三次指数平滑预测值Xm+1(i);
e4:根据公式(10)计算待预测一天各预测时间点的最终预测值;
ym+1(i)=θbest(i)dm+1(i)+(1-θbest(i))Xm+1(i) (10)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811340151.6A CN109360625B (zh) | 2018-11-12 | 2018-11-12 | 用于互联网中短期用药咨询业务量的预测系统及预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811340151.6A CN109360625B (zh) | 2018-11-12 | 2018-11-12 | 用于互联网中短期用药咨询业务量的预测系统及预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109360625A true CN109360625A (zh) | 2019-02-19 |
CN109360625B CN109360625B (zh) | 2021-11-23 |
Family
ID=65344972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811340151.6A Active CN109360625B (zh) | 2018-11-12 | 2018-11-12 | 用于互联网中短期用药咨询业务量的预测系统及预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109360625B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097958A (zh) * | 2019-04-23 | 2019-08-06 | 四川骏逸富顿科技有限公司 | 一种用于互联网医疗服务的医生智能调度排班方法及系统 |
CN110363567A (zh) * | 2019-05-31 | 2019-10-22 | 浙江口碑网络技术有限公司 | 餐品制作信息的确定方法、装置及设备 |
CN111798014A (zh) * | 2019-03-21 | 2020-10-20 | 安徽海汇金融投资集团有限公司 | 一种应收账款债权流转业务量预测方法及系统 |
CN112037932A (zh) * | 2020-09-09 | 2020-12-04 | 平安科技(深圳)有限公司 | 患者用药行为干预方法及装置、服务器、存储介质 |
CN112785057A (zh) * | 2021-01-21 | 2021-05-11 | 上海东普信息科技有限公司 | 基于指数平滑的件量预测方法、装置、设备及存储介质 |
CN112820414A (zh) * | 2021-01-29 | 2021-05-18 | 南威软件股份有限公司 | 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106326634A (zh) * | 2016-08-09 | 2017-01-11 | 浙江工业大学 | 一种基于深度信念网络的医院门诊量预测方法 |
US20180096107A1 (en) * | 2016-09-30 | 2018-04-05 | WINGS ICT Solutions Ltd. | System and method for personalized migraine prediction powered by machine learning |
CN108199928A (zh) * | 2018-02-01 | 2018-06-22 | 国网湖北省电力公司信息通信公司 | 一种多维电力通信网流量预测方法及系统 |
CN108364092A (zh) * | 2018-01-29 | 2018-08-03 | 西安理工大学 | 一种基于深度学习的餐饮业菜品销量预测方法 |
CN108492138A (zh) * | 2018-03-19 | 2018-09-04 | 平安科技(深圳)有限公司 | 产品购买预测方法、服务器及存储介质 |
CN108596399A (zh) * | 2018-05-04 | 2018-09-28 | 国家邮政局邮政业安全中心 | 快递业务量预测的方法、装置、电子设备及存储介质 |
CN108615092A (zh) * | 2018-04-26 | 2018-10-02 | 广东省广业科技集团有限公司 | 一种基于指数平滑模型的污水处理厂进水量预测的方法 |
-
2018
- 2018-11-12 CN CN201811340151.6A patent/CN109360625B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106326634A (zh) * | 2016-08-09 | 2017-01-11 | 浙江工业大学 | 一种基于深度信念网络的医院门诊量预测方法 |
US20180096107A1 (en) * | 2016-09-30 | 2018-04-05 | WINGS ICT Solutions Ltd. | System and method for personalized migraine prediction powered by machine learning |
CN108364092A (zh) * | 2018-01-29 | 2018-08-03 | 西安理工大学 | 一种基于深度学习的餐饮业菜品销量预测方法 |
CN108199928A (zh) * | 2018-02-01 | 2018-06-22 | 国网湖北省电力公司信息通信公司 | 一种多维电力通信网流量预测方法及系统 |
CN108492138A (zh) * | 2018-03-19 | 2018-09-04 | 平安科技(深圳)有限公司 | 产品购买预测方法、服务器及存储介质 |
CN108615092A (zh) * | 2018-04-26 | 2018-10-02 | 广东省广业科技集团有限公司 | 一种基于指数平滑模型的污水处理厂进水量预测的方法 |
CN108596399A (zh) * | 2018-05-04 | 2018-09-28 | 国家邮政局邮政业安全中心 | 快递业务量预测的方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
DONG, ZB 等: ""Short-term solar irradiance forecasting using exponential smoothing state space model"", 《ENERGY》 * |
刘香云: ""基于灰色关联度的道路交通事故组合预测方法研究"", 《中国优秀硕士学位论文全文数据库-工程科技Ⅱ辑》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798014A (zh) * | 2019-03-21 | 2020-10-20 | 安徽海汇金融投资集团有限公司 | 一种应收账款债权流转业务量预测方法及系统 |
CN111798014B (zh) * | 2019-03-21 | 2024-04-09 | 安徽海汇金融投资集团有限公司 | 一种应收账款债权流转业务量预测方法及系统 |
CN110097958A (zh) * | 2019-04-23 | 2019-08-06 | 四川骏逸富顿科技有限公司 | 一种用于互联网医疗服务的医生智能调度排班方法及系统 |
CN110363567A (zh) * | 2019-05-31 | 2019-10-22 | 浙江口碑网络技术有限公司 | 餐品制作信息的确定方法、装置及设备 |
CN110363567B (zh) * | 2019-05-31 | 2022-04-15 | 浙江口碑网络技术有限公司 | 餐品制作信息的确定方法、装置及设备 |
CN112037932A (zh) * | 2020-09-09 | 2020-12-04 | 平安科技(深圳)有限公司 | 患者用药行为干预方法及装置、服务器、存储介质 |
WO2021151329A1 (zh) * | 2020-09-09 | 2021-08-05 | 平安科技(深圳)有限公司 | 患者用药行为干预方法及装置、服务器、存储介质 |
CN112785057A (zh) * | 2021-01-21 | 2021-05-11 | 上海东普信息科技有限公司 | 基于指数平滑的件量预测方法、装置、设备及存储介质 |
CN112785057B (zh) * | 2021-01-21 | 2023-09-01 | 上海东普信息科技有限公司 | 基于指数平滑的件量预测方法、装置、设备及存储介质 |
CN112820414A (zh) * | 2021-01-29 | 2021-05-18 | 南威软件股份有限公司 | 基于改进的三次指数平滑模型及lstm模型在新冠疫情的预警方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109360625B (zh) | 2021-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109360625A (zh) | 用于互联网中短期用药咨询业务量的预测系统及预测方法 | |
Yousefi et al. | Chaotic genetic algorithm and Adaboost ensemble metamodeling approach for optimum resource planning in emergency departments | |
Chen et al. | Multi-criteria decision making with fuzzy linguistic preference relations | |
Olmstead et al. | Cost and cost-effectiveness of three strategies for training clinicians in motivational interviewing | |
CN107230113A (zh) | 一种多模型融合的房产评估方法 | |
CN108920324A (zh) | It设备存储容量趋势分析和预警的方法、系统及电子装置 | |
Yang et al. | The optimization of total laboratory automation by simulation of a pull-strategy | |
Trivedi et al. | The Impact of Artificial Intelligence Integration on Minimizing Patient Wait Time in Hospitals | |
Peykani et al. | Measuring productivity changes of hospitals in Tehran: the fuzzy Malmquist productivity index | |
CN110400184A (zh) | 用于生成信息的方法和装置 | |
Lin et al. | A comprehensive multi-objective mixed integer nonlinear programming model for an integrated elderly care service districting problem | |
Wen et al. | Modified honey bees mating optimization algorithm for multi-objective uncertain integrated process planning and scheduling problem | |
Zahiri et al. | An MCDA-DEA approach for mixed-model assembly line balancing problem under uncertainty | |
Tseng et al. | Hybrid evolutionary multi-objective algorithms for integrating assembly sequence planning and assembly line balancing | |
CN106485069A (zh) | 康复信息推送的方法及系统 | |
Alessandra et al. | Using simulation in hospital planning | |
Lu et al. | Adapted water wave optimization for integrated bank customer service representative scheduling | |
Pratyaksa et al. | Arima implementation to predict the amount of antiseptic medicine usage in veterinary hospital | |
CN109859087A (zh) | 一种应用城市超脑的智能社区软环境配置系统和方法 | |
CN114493027A (zh) | 一种基于马尔可夫模型的未来人才需求预测方法及系统 | |
Dean et al. | Mathematical modeling of pharmacy systems | |
Ghasemi et al. | A novel mathematical model to minimize the total cost of the hospital and COVID-19 outbreak concerning waiting time of patients using Jackson queueing networks, a case study | |
Hu et al. | Design of two-stage federal learning incentive mechanism under specific indicators | |
Spengler et al. | Artificial Intelligence and Fuzzy Logic in modern Human Resource Management | |
Zwier | Routing and appointment planning optimization for medication at home: A case study in Isala hospital |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |