CN114781678A - 基于预测模型的来电量预测方法、系统、终端及介质 - Google Patents
基于预测模型的来电量预测方法、系统、终端及介质 Download PDFInfo
- Publication number
- CN114781678A CN114781678A CN202111656319.6A CN202111656319A CN114781678A CN 114781678 A CN114781678 A CN 114781678A CN 202111656319 A CN202111656319 A CN 202111656319A CN 114781678 A CN114781678 A CN 114781678A
- Authority
- CN
- China
- Prior art keywords
- incoming call
- period
- data
- prediction model
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 16
- 230000005611 electricity Effects 0.000 claims abstract description 10
- 230000002354 daily effect Effects 0.000 claims description 36
- 230000001932 seasonal effect Effects 0.000 claims description 18
- 230000000875 corresponding effect Effects 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000005457 optimization Methods 0.000 claims description 10
- 238000004140 cleaning Methods 0.000 claims description 9
- 230000002596 correlated effect Effects 0.000 claims description 8
- 238000013519 translation Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 6
- 230000003203 everyday effect Effects 0.000 claims description 5
- 230000003442 weekly effect Effects 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000000737 periodic effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 101001072091 Homo sapiens ProSAAS Proteins 0.000 description 1
- 102100036366 ProSAAS Human genes 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- General Engineering & Computer Science (AREA)
- Fuzzy Systems (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供基于预测模型的来电量预测方法、系统、终端及介质,包括:采集待预测时段之前一段时间内的每日来电量历史数据;对待预测时段内及每日来电量历史数据全周期时段内的来电量显著日进行标注;以待预测时段为节点向前回溯若干周期,并从全周期内撷取对标于回溯期的对标时段;将对标时段内被标注的法定假日,以回溯期内的法定假日为基准,平移至回溯期内对应位置的法定假日,替换来电量数据;以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,训练用于对所述待预测时段进行每日来电量预测的预测模型。本发明提供时间间隔1至2个月的每日预测来电量,有较高准确度,平均偏差率小于5%,为联络中心每月排班提供可靠依据。
Description
技术领域
本申请涉及预测模型技术领域,特别是涉及基于预测模型的来电量预测方法、系统、终端及介质。
背景技术
随着对呼叫中心客服热线服务水平的要求不断提升,如何合理安排人力、提高热线接通率,成为呼叫中心当前面临的主要问题。对客服热线来电量的准确预测,则是呼叫中心合理排班的重要依据。
热线来电量是典型的时间序列数据,传统的时间序列数据预测方法,大都基于移动平均自回归模型,对短期数据预测效果较好,但对间隔较长的数据预测效果较差。呼叫中心大都是在每月初就需要完成下个月的人力安排,需要以下个月的来电量预测作为依据,但此时可使用的历史来电量数据仅截止到上个月底,预测数据与历史数据有1-2个月的时间间隔。
因此如何对客服热线的来电量进行1个月时间间隔以上的准确预测,对联络中心排班有重要影响,是业界希望得到解决的问题。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供基于预测模型的来电量预测方法、系统、终端及介质,用于解决现有技术中的时间序列数据预测方法对短期数据预测效果较好,但对间隔较长的数据预测效果较差等问题。
为实现上述目的及其他相关目的,本申请的第一方面提供一种基于预测模型的来电量预测方法,包括:采集待预测时段之前一段时间内的每日来电量历史数据;对所述待预测时段内及每日来电量历史数据全周期时段内的来电量显著日进行标注;所述来电量显著日包括法定假日和营销活动日;以所述待预测时段为节点向前回溯若干周期,并从所述全周期内撷取对标于回溯期的对标时段;将所述对标时段内被标注的法定假日,以所述回溯期内的法定假日为基准,平移至所述回溯期内对应位置的法定假日,并相应替换来电量数据;以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,训练用于对所述待预测时段进行每日来电量预测的预测模型;其中,所述预测模型与趋势项、季节项及节日项均呈正相关。
于本申请的第一方面的一些实施例中,还包括:对采集到的所述每日来电量历史数据进行清洗,以剔除突发事件所导致的异常单日来电量数据。
于本申请的第一方面的一些实施例中,所述预测模型的构建方式包括:以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,对修改后的每日来电量数据求自然对数,用最大后验概率估计拟合来电量预测模型参数。
于本申请的第一方面的一些实施例中,所述预测模型与趋势项、季节项及节日项均呈正相关,包括:所述预测模型所预测的每日来电量的自然对数由所述趋势项、季节项及节日项这3个因子相加得到。
于本申请的第一方面的一些实施例中,所述趋势项为分段线性模型,其通过设置历史数据中趋势产生变化的变化点进行分段;所述节日项是标注的所有来电量显著日对应的变化系数。
于本申请的第一方面的一些实施例中,所述季节项由年度项、季度项、月度项、星期项相加得到;所述年度项、季度项、月度项、星期项均由傅里叶级数建立周期模型。
于本申请的第一方面的一些实施例中,还包括:基于优化算法对所述预测模型的各项模型参数进行优化;所述优化算法包括L-BFGS优化算法。
于本申请的第一方面的一些实施例中,所述节日项是标注的所有来电量显著日对应的变化系数。
为实现上述目的及其他相关目的,本申请的第二方面提供一种基于预测模型的来电量预测系统,包括:采集模块,用于采集待预测时段之前一段时间内的每日来电量历史数据;标注模块,用于对所述待预测时段内及每日来电量历史数据全周期时段内的来电量显著日进行标注;平移模块,用于以所述待预测时段为节点向前回溯若干周期,并从所述全周期内撷取对标于回溯期的对标时段;将所述对标时段内被标注的法定假日,以所述回溯期内的法定假日为基准,平移至所述回溯期内对应位置的法定假日,并相应替换来电量数据;建模模块,用于以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,训练用于对所述待预测时段进行每日来电量预测的预测模型;其中,所述预测模型与趋势项、季节项及节日项均呈正相关。
为实现上述目的及其他相关目的,本申请的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于预测模型的来电量预测方法。
为实现上述目的及其他相关目的,本申请的第四方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述基于预测模型的来电量预测方法。
如上所述,本申请的基于预测模型的来电量预测方法、系统、终端及介质,具有以下有益效果:本发明构建了一个用于预测呼叫中心热线服务来电量的机器学习预测模型,同时考虑了来电量的增长趋势、周期性、国定假日、营销活动等显著特征,其中特别对法定假日调休的情况做了针对性处理。模型可以提供时间间隔1至2个月的每日预测来电量,有较高的准确度,平均偏差率小于5%,为联络中心每月排班提供了可靠依据。
附图说明
图1显示为本申请一实施例中基于预测模型的来电量预测方法的流程示意图。
图2显示为本申请一实施例中基于预测模型的来电量预测系统的结构示意图。
图3显示为本申请一实施例中电子终端的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,在下述描述中,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。应当进一步理解,此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
为了解决上述背景技术中的问题,本发明提出一种基于预测模型的来电量预测方法、系统、终端及存储介质,用于有效预测呼叫中心热线服务的来电量,考虑了来电量的增长趋势、周期性、国定假日、营销活动等显著特征,其中特别针对法定假日调休的情况做了针对性的处理。针对现有技术无法实现客服热线的来电量进行1个月时间间隔以上的准确预测,进而对联络中心排班产生影响的问题,本发明基于预测模型所提供的技术方案,可以提供时间间隔1至2个月的每日预测来电量,有较高的准确度,平均偏差率小于5%,为联络中心每月排班提供了可靠依据。
为了使本发明的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本发明实施例中的技术方案的进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定发明。
如图1所示,展示了本发明一实施例中基于预测模型的来电量预测方法的流程示意图。
应理解的是,本发明提供的来电量预测方法可应用于多种类型的硬件设备;例如可应用于ARM(Advanced RISC Machines)控制器、FPGA(Field Programmable Gate Array)控制器、SoC(System on Chip)控制器、DSP(Digital Signal Processing)控制器、或者MCU(Microcontroller Unit)控制器等;也可应用于台式电脑、笔记本电脑、平板电脑、智能手机、智能手环、智能手表、智能头盔等个人电脑;还可应用于服务器,所述服务器可以根据功能、负载等多种因素布置在一个或多个实体服务器上,也可以由分布的或集中的服务器集群构成,本实施例不做限定。
在本实施例中,所述基于预测模型的来电量预测方法主要包括步骤S11~S15,下文将结合具体的实施例对各步骤进行详细说明。
步骤S11:采集待预测时段之前一段时间内的每日来电量历史数据。
具体是指,选定需要预测的时间范围作为待预测时段,例如选取2022年1月至2022年2月时间段作为需要预测的时间范围,提取需要预测的时间范围之前2至3年时间范围内的每日来电历史数据。应理解的是,出于说明性目的而提供以上示例,并且以上示例及示例中的具体数字不应被理解成是限制性的。
在一些较为优选的实施方式中,对采集到的所述每日来电量历史数据进行清洗,旨在去除突发事件导致的异常单日来电量数据。本实施例可用的数据清洗工具包括但不限于Data Wrangler清洗工具、Google Refine清洗工具或佳数right data清洗工具。其中,Data Wrangler清洗工具是一种数据清洗和重排的工具,其格式适用于电子表格等应用程序;Google Refine清洗工具可导入导出多种格式的数据,例如标签或逗号分隔的文本文件、Excel、XML和JSON文件等;佳数right data清洗工具是以SAAS模式提供完整地址数据处理服务流程的网站,采用大数据与自然语言处理技术,为用户提供最精确的地址数据拆分补全、邮编查询、匹配去重等功能。需说明的是,本发明并不对数据清洗手段一一穷举,事实上,现有技术中的数据清洗方法都可应用于本发明的技术方案中。
步骤S12:对所述待预测时段内及每日来电量历史数据全周期时段内的来电量显著日进行标注;所述来电量显著日包括法定假日和营销活动日。应理解的是,所述全周期时段是指包含所有周期时段的事件范围,此处的周期时段通常可选用年作为单位,即一年为一个周期时段,若历史数据的时间跨度为3年,则全周期时段即为3年;周期时段当然也可以季度、半年、甚至周作为单位,本实施例不作限定。
值得说明的是,本实施例中涉及的来电量显著日是指与平时来电量相比特别高或特别低的日子,包括但不限于法定假日和/或营销活动日;法定假日例如有国庆假日、春节假日或元旦假日等,营销活动日例如有周年庆典日、购物节日等等。
在一些示例中,对所述待预测时段内及每日来电量历史数据的时段内的全部法定假日及紧邻的若干日进行标注。标注方式例如:春节前3天和春节后10天,分别表示为:春节-3、春节-2、春节-1、春节1、春节2、春节3、春节4、春节5、春节6、春节7、春节8、春节9、春节10。较为特殊的,法定假日前后的标注范围内(例如前后3天内)有其他正常的休息日,则不对正常的休息日进行标注,即仅标注法定假日及与其紧邻的工作日。另外,对于长假而言,需标注的工作日相应较多;对于短假期而言,需标注的工作日则相应较少。
在一些示例中,对所述待预测时段内及每日来电量历史数据的时段内的全部营销活动日进行标注。标注方式例如:开门红第一周、开门红第二周、周年庆一周等等。
步骤S13:以所述待预测时段为节点向前回溯若干周期,并从所述全周期内撷取对标于回溯期的对标时段;将所述对标时段内被标注的法定假日,以所述回溯期内的法定假日为基准,平移至所述回溯期内对应位置的法定假日,并相应替换来电量数据。
举例来说,以所述待预测时段向前追溯一年作为回溯期,以这一年内的所有国定假日为基准,将这一年之前所有标注过的法定假日及其前后的工作日,分别平移至这一年中对应法定假日及其前后的工作日在一星期中的位置相同的日期,通常以改变天数最少的方式进行平移,改变后的日期原有的来电量数据丢弃不用。再例如,也可以所述待预测时段向前追溯一个季度作为回溯期,以这个季度内的所有国定假日为基准,将上一年相同季度内所有标注过的法定假日按照本季度做平移并进行数据替代。
更具体而言,平移方式例如为:待预测时段内标注的清明-1、清明1、清明2、清明3、清明4,这5天分别为周五、周六、周日、周一、周二,上年度对应的有清明标注的5天分别为周六、周日、周一、周二、周三,则将上年度有清明标注的5天的日期分别提前一天,当日来电量数据以原先的清明期间来电量替代,历史数据中不再提供周三这天的话量数据。
步骤S14:以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,训练用于对所述待预测时段进行每日来电量预测的预测模型;其中,所述预测模型与趋势项、季节项及节日项均呈正相关。因此,在得到预测模型后,将待预测时段输入到预测模型中,就可以输出这段待预测时段的每日来电量预测数据。
具体来说,以平移处理后的历史数据作为训练集数据,对修改后的每日来电量数据求自然对数,用最大后验概率估计拟合来电量预测模型参数。所述最大后验概率估计MAP是Maximum a posteriori的缩写,估计方法根据经验数据获得对难以观察的量的点估计,其使用了一个增大的优化目标,这种方法将被估计量的先验分布融合到其中。
在本实施例中,所述预测模型与趋势项、季节项及节日项均呈正相关包括:所述预测模型所预测的每日来电量的自然对数由所述趋势项、季节项及节日项这3个因子相加得到。为便于描述,下文将趋势项简称为T(t),将季节项简称为S(t),将节日项简称为H(t)。
在一些示例中,趋势项T(t)为分段线性模型,需要设置历史数据中趋势产生变化的变化点,例如设置每年1月1日为趋势变化点。
在一些示例中,季节项S(t)由年度项、季度项、月度项、星期项相加得到,均由傅里叶级数建立周期模型。设L为周期天数、参数N起到低通滤波作用,t为时间,周期模型的公式如下:
其中,L为周期天数,参数N为低通滤波调节参数(通过将N设定为较低值来起到低通滤波调节作用),对于年度项而言,L=365.25,N=10;对于季度项而言,L=91.3125,N=6;对于月度项而言,L=30.4375,N=5;对于星期项而言,L=7,N=3;an、bn是通过拟合得到的最优系数。
在一些示例中,节日项H(t)为标注的所有来电量显著日(包括法定假日及其前后工作日、营销活动日等)对应的变化系数,例如标注的清明-1、清明1、清明2、清明3、清明4等,每个标注日都赋予各自的变化系数。
在一些示例中,可基于优化算法对所述预测模型的各项参数进行优化,即对于趋势项T(t),季节项S(t),节日项H(t)进行优化。举例来说,可基于L-BFGS优化算法来优化模型参数。所述L-BFGS优化算法是解无约束非线性规划问题最常用的方法,具有收敛速度快、内存开销小等优点,在机器学习各类算法中经常使用,其基本思想是:不再存储完整的矩阵Dk,而是存储计算过程中的向量序列{Si},{yi},需要矩阵Dk时,利用向量序列{Si},{yi}的计算来代替,而且向量序列{Si},{yi}也不是所有的都存储,而是固定存储最新的m个,因此每次计算矩阵Dk时,只需利用最新的m个{Si}和m个{yi},所以存储量由原来的O(N2)降为O(mN)。
如图2所示,展示了本发明一实施例中基于预测模型的来电量预测系统的结构示意图。本实施例中基于预测模型的来电量预测系统200包括:采集模块201、标注模块202、平移模块203及建模模块204。
所述采集模块201用于采集待预测时段之前一段时间内的每日来电量历史数据;所述标注模块202用于对所述待预测时段内及每日来电量历史数据全周期时段内的来电量显著日进行标注;平移模块203用于以所述待预测时段为节点向前回溯若干周期,并从所述全周期内撷取对标于回溯期的对标时段;将所述对标时段内被标注的法定假日,以所述回溯期内的法定假日为基准,平移至所述回溯期内对应位置的法定假日,并相应替换来电量数据;建模模块204用于以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,训练用于对所述待预测时段进行每日来电量预测的预测模型;其中,所述预测模型与趋势项、季节项及节日项均呈正相关。
需说明的是,本发明提供的基于预测模型的来电量预测系统,其实施方式与上文中的基于预测模型的来电量预测方法类似,故不再赘述。
应理解,以上系统的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,建模模块可以为单独设立的处理元件,也可以集成在上述系统的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述系统的存储器中,由上述系统的某一个处理元件调用并执行以上建模模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital signal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
如图3所示,展示了本发明提供的再一种电子终端的结构示意图。本实例提供的电子终端,包括:处理器31、存储器32、通信器33;存储器32通过系统总线与处理器31和通信器33连接并完成相互间的通信,存储器32用于存储计算机程序,通信器33用于和其他设备进行通信,处理器31用于运行计算机程序,使电子终端执行如上基于预测模型的来电量预测方法的各个步骤。
上述提到的系统总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于预测模型的来电量预测方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
于本申请提供的实施例中,所述计算机可读写存储介质可以包括只读存储器、随机存取存储器、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、U盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外,任何连接都可以适当地称为计算机可读介质。例如,如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(DSL)或者诸如红外线、无线电和微波之类的无线技术,从网站、服务器或其它远程源发送的,则所述同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而,应当理解的是,计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者其它暂时性介质,而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中,磁盘通常磁性地复制数据,而光盘则用激光来光学地复制数据。
综上所述,本申请提供基于预测模型的来电量预测方法、系统、终端及介质,构建了一个用于预测呼叫中心热线服务来电量的机器学习预测模型,同时考虑了来电量的增长趋势、周期性、国定假日、营销活动等显著特征,其中特别对法定假日调休的情况做了针对性处理。模型可以提供时间间隔1至2个月的每日预测来电量,有较高的准确度,平均偏差率小于5%,为联络中心每月排班提供了可靠依据。所以,本申请有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (10)
1.一种基于预测模型的来电量预测方法,其特征在于,包括:
采集待预测时段之前一段时间内的每日来电量历史数据;
对所述待预测时段内及每日来电量历史数据全周期时段内的来电量显著日进行标注;所述来电量显著日包括法定假日和营销活动日;
以所述待预测时段为节点向前回溯若干周期,并从所述全周期内撷取对标于回溯期的对标时段;将所述对标时段内被标注的法定假日,以所述回溯期内的法定假日为基准,平移至所述回溯期内对应位置的法定假日,并相应替换来电量数据;
以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,训练用于对所述待预测时段进行每日来电量预测的预测模型;其中,所述预测模型与趋势项、季节项及节日项均呈正相关。
2.根据权利要求1所述基于预测模型的来电量预测方法,其特征在于,还包括:对采集到的所述每日来电量历史数据进行清洗,以剔除突发事件所导致的异常单日来电量数据。
3.根据权利要求1所述基于预测模型的来电量预测方法,其特征在于,所述预测模型的构建方式包括以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,对修改后的每日来电量数据求自然对数,用最大后验概率估计拟合来电量预测模型参数。
4.根据权利要求1所述基于预测模型的来电量预测方法,其特征在于,所述预测模型与趋势项、季节项及节日项均呈正相关,包括:所述预测模型所预测的每日来电量的自然对数由所述趋势项、季节项及节日项这3个因子相加得到。
5.根据权利要求4所述基于预测模型的来电量预测方法,其特征在于,所述趋势项为分段线性模型,其通过设置历史数据中趋势产生变化的变化点进行分段;所述节日项是标注的所有来电量显著日对应的变化系数。
6.根据权利要求4所述基于预测模型的来电量预测方法,其特征在于,所述季节项由年度项、季度项、月度项、星期项相加得到;所述年度项、季度项、月度项、星期项均由傅里叶级数建立周期模型。
7.根据权利要求4所述基于预测模型的来电量预测方法,其特征在于,还包括:基于优化算法对所述预测模型的各项模型参数进行优化;所述优化算法包括L-BFGS优化算法。
8.一种基于预测模型的来电量预测系统,其特征在于,包括:
采集模块,用于采集待预测时段之前一段时间内的每日来电量历史数据;
标注模块,用于对所述待预测时段内及每日来电量历史数据全周期时段内的来电量显著日进行标注;
平移模块,用于以所述待预测时段为节点向前回溯若干周期,并从所述全周期内撷取对标于回溯期的对标时段;将所述对标时段内被标注的法定假日,以所述回溯期内的法定假日为基准,平移至所述回溯期内对应位置的法定假日,并相应替换来电量数据;
建模模块,用于以将历史数据中法定假日的每日来电量数据平移后的历史数据作为训练集数据,训练用于对所述待预测时段进行每日来电量预测的预测模型;其中,所述预测模型与趋势项、季节项及节日项均呈正相关。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述基于预测模型的来电量预测方法。
10.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求1至7中任一项所述基于预测模型的来电量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111656319.6A CN114781678B (zh) | 2021-12-30 | 2021-12-30 | 基于预测模型的来电量预测方法、系统、终端及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111656319.6A CN114781678B (zh) | 2021-12-30 | 2021-12-30 | 基于预测模型的来电量预测方法、系统、终端及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114781678A true CN114781678A (zh) | 2022-07-22 |
CN114781678B CN114781678B (zh) | 2022-12-16 |
Family
ID=82424172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111656319.6A Active CN114781678B (zh) | 2021-12-30 | 2021-12-30 | 基于预测模型的来电量预测方法、系统、终端及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114781678B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101052067A (zh) * | 2007-05-22 | 2007-10-10 | 杨苹 | 智能化话务预测方法 |
CN101541030A (zh) * | 2009-05-06 | 2009-09-23 | 华为技术有限公司 | 基于支持向量机的数据预测方法和设备 |
WO2011053275A1 (en) * | 2009-10-26 | 2011-05-05 | Hewlett-Packard Development Company, L.P. | Adjusting a point prediction that is part of the long-term product life cycle based forecast |
CN103297623A (zh) * | 2013-05-21 | 2013-09-11 | 杭州远传通信技术有限公司 | 话务预测方法及装置 |
CN104778532A (zh) * | 2015-03-12 | 2015-07-15 | 科大国创软件股份有限公司 | 智能呼叫中心管理系统及智能排班控制方法 |
CN108551533A (zh) * | 2018-03-09 | 2018-09-18 | 平安普惠企业管理有限公司 | 一种客服坐席的排班方法、存储介质和服务器 |
CN110580544A (zh) * | 2019-08-12 | 2019-12-17 | 浙江工业大学 | 一种基于周期性依赖的话务量预测方法 |
-
2021
- 2021-12-30 CN CN202111656319.6A patent/CN114781678B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101052067A (zh) * | 2007-05-22 | 2007-10-10 | 杨苹 | 智能化话务预测方法 |
CN101541030A (zh) * | 2009-05-06 | 2009-09-23 | 华为技术有限公司 | 基于支持向量机的数据预测方法和设备 |
WO2011053275A1 (en) * | 2009-10-26 | 2011-05-05 | Hewlett-Packard Development Company, L.P. | Adjusting a point prediction that is part of the long-term product life cycle based forecast |
CN103297623A (zh) * | 2013-05-21 | 2013-09-11 | 杭州远传通信技术有限公司 | 话务预测方法及装置 |
CN104778532A (zh) * | 2015-03-12 | 2015-07-15 | 科大国创软件股份有限公司 | 智能呼叫中心管理系统及智能排班控制方法 |
CN108551533A (zh) * | 2018-03-09 | 2018-09-18 | 平安普惠企业管理有限公司 | 一种客服坐席的排班方法、存储介质和服务器 |
CN110580544A (zh) * | 2019-08-12 | 2019-12-17 | 浙江工业大学 | 一种基于周期性依赖的话务量预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114781678B (zh) | 2022-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10248528B2 (en) | System monitoring method and apparatus | |
Al-Qahtani et al. | Multivariate k-nearest neighbour regression for time series data—A novel algorithm for forecasting UK electricity demand | |
Bunn et al. | Comparative models for electrical load forecasting | |
CN109712001A (zh) | 信息推荐方法、装置、计算机设备和存储介质 | |
CN112907064B (zh) | 基于自适应窗的电量预测方法、装置、存储介质及终端 | |
US20240146843A1 (en) | Adaptive campaign management and predictive customer engagement platform | |
CN108573348B (zh) | 金融指标分布式计算方法及其系统 | |
CN109582543A (zh) | 数据回溯方法和装置 | |
Dong et al. | Forecasting smart meter energy usage using distributed systems and machine learning | |
US20230032429A1 (en) | System and method for predicting customer propensities and optimizing related tasks thereof via machine learning | |
CN114416891A (zh) | 在知识图谱中进行数据处理的方法、系统、装置和介质 | |
CN114781678B (zh) | 基于预测模型的来电量预测方法、系统、终端及介质 | |
CN113657936A (zh) | 电力负荷预测方法及终端 | |
CN110120082B (zh) | 金融数据的图像处理方法、装置、设备及可读存储介质 | |
US20200136805A1 (en) | Block chain modification correlation | |
CN115455106B (zh) | 配用电运维的配电监测方法、服务平台、设备及存储介质 | |
US11875374B2 (en) | Automated auditing and recommendation systems and methods | |
CN114218335A (zh) | 数据处理方法及设备 | |
CN114511314A (zh) | 一种支付账户管理的方法、装置、计算机设备和存储介质 | |
CN114756722A (zh) | 一种多元数据集中管理控制系统及方法 | |
CN112448840B (zh) | 一种通信数据质量监控方法、装置、服务器及存储介质 | |
CN118395384B (zh) | 一种多维分解与智能融合的电力负荷预测方法及相关设备 | |
CN111179088A (zh) | 一种信息处理方法及装置 | |
CN117057456B (zh) | 基于分段样条回归-WaveNet两阶段电力负荷预测方法及装置 | |
US20240070160A1 (en) | Data processing method and electronic device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |