WO2020010710A1

WO2020010710A1 - 预测模型的生成方法、装置及计算机可读存储介质

Info

Publication number: WO2020010710A1
Application number: PCT/CN2018/107488
Authority: WO
Inventors: 李弦; 徐亮; 阮晓雯; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-07-13
Filing date: 2018-09-26
Publication date: 2020-01-16
Also published as: CN109243619B; CN109243619A

Abstract

本申请公开了一种预测模型的生成方法，该方法包括：确定目标区域和待预测的目标时间单元和预设周期；获取目标区域在目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；根据预设周期和预设阶数k，将流感样病例百分比数据序列在预设周期前后滞后0至k阶，获取2k+1个数据序列；计算2k+1个数据序列与流感样病例百分比数据序列的自相关系数，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；计算模型参数，根据模型参数和预测周期建立自回归积分滑动平均模型作为预测模型。本申请还提出一种预测模型的生成装置以及一种计算机可读存储介质。本申请提高了自回归积分滑动平均模型的预测精准度。

Description

预测模型的生成方法、装置及计算机可读存储介质

本申请基于巴黎公约申明享有2018年07月13日递交的申请号为201810768332.2、名称为“预测模型的生成方法、装置及计算机可读存储介质”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其涉及一种预测模型的生成方法、装置及计算机可读存储介质。

背景技术

对于流行性感冒的预测，目前流行病学用的较普遍的方法是采用自回归积分滑动平均模型预测流感样病例百分比。自回归积分滑动平均模型进行流感预测，一般是根据预测地区的历史流感样病例百分比数据的变化规律，为该地区设定一个固定不变的周期进行建模，比如一年或者半年。然而，固定的周期可能会忽略一些非周期性出现的因素的影响，例如每年的周数长短和节气变化的不同产生的影响，导致预测结果出现较大偏差。例如，不同年份长短不一样，有的年份有53周，如2013年，即年份的周期长短会发生变化。因此，如果使用固定的周期建模会导致模型的预测结果出现较大的偏差。

发明内容

本申请提供一种预测模型的生成方法、装置及计算机可读存储介质，其主要目的在于提高自回归积分滑动平均模型的预测精准度。

为实现上述目的，本申请还提供一种预测模型的生成方法，该方法包括：

确定目标区域和待预测的目标时间单元，并获取预设周期；

获取所述目标区域在所述目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；

根据所述预设周期和预设阶数k，将所述流感样病例百分比数据序列在所述预设周期前后分别滞后0至k阶，获取2k+1个数据序列；

分别计算所述2k+1个数据序列与所述流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；

根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型。

此外，为实现上述目的，本申请还提供一种预测模型的生成装置，该装置包括存储器和处理器，所述存储器中存储有可在所述处理器上运行的模型生成程序，所述模型生成程序被所述处理器执行时实现如下步骤：

确定目标区域和待预测的目标时间单元，并获取预设周期；

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有模型生成程序，所述模型生成程序可被一个或者多个处理器执行，以实现如下步骤：

确定目标区域和待预测的目标时间单元，并获取预设周期；

本申请提出的预测模型的生成方法、装置及计算机可读存储介质，确定目标区域和待预测的目标时间单元，并获取预设周期；获取目标区域在目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；根据预设周期和预设阶数k，将流感样病例百分比数据序列在预设周期前后分别滞后0至k阶，获取2k+1个数据序列；分别计算2k+1个数据序列与流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；根据确定了预测周期的流感样病例百分比序列计算模型参数，根据模型参数和预测周期建立自回归积分滑动平均模型作为预测模型。本申请在对目标时间单元的数据进行预测时，通过对该目标时间单元之前的数据序列滞后多个阶数后，计算序列之间的自相关系数，进而根据自相关系数确定一个适用于当前目标时间单元的预测周期，并使用该预测周期进行建模，提高了自回归积分滑动平均模型的预测精准度。

附图说明

图1为本申请一实施例提供的预测模型的生成方法的流程示意图；

图2为本申请一实施例提供的预测模型的生成装置的内部结构示意图；

图3为本申请一实施例提供的预测模型的生成装置中模型生成程序的模块示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供一种预测模型的生成方法。参照图1所示，为本申请一实施例提供的预测模型的生成方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，预测模型的生成方法包括：

步骤S10，确定目标区域和待预测的目标时间单元，并获取预设周期。

步骤S20，获取所述目标区域在所述目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列。

本实施例中的目标区域为要进行流感样病例百分比预测的某一地区，例如，某一城市或者某一省份等。此外，以周作为时间单元对本实施例的方案进行说明，假设要预测本周的流感样病例百分比，则以本周之前5年内每一周的历史流感样病例百分比数据序列构建ARIMA(Autoregressive Integrated Moving Average，自回归积分滑动平均)模型，即要对第261周的流感样病例百分比进行预测，则需要使用其之前的260周的流感样病例百分比数据构建ARIMA模型。随着时间的推移，目标时间单元会向前推移，而该目标时间单元的历史数据会发生变化，此外，由于每年周数长短和节气变化可能存在不同，导致这些历史数据实际呈现出的周期性会发生变化。在没有这些因素影响的情况下，通过对长时间内的流感样病例百分比数据序列的观测，可以看出数据是呈年周期性的，也就是周期为52周，但是在有上述因素影响的时候，周期会小于或者大于52周。因此，本实施例的方法中，在对预测周期进行动态调整之前，可以根据流感样病例百分比数据所呈现的周期性确定预设周期为52周，接下来以52周作为基准对预测周期进行调整。假设当前要预测2018年6月的第一周的流感样病例百分比，则需要获取2013年至2017年每一周的流感样病例百分比数据序列。在其他实施例中，历史数据中时间单元的数量由用户根据实际预测需求设置。

进一步地，为了提高建立的ARIMA模型的预测精准度，在获取到上述数据序列后，检测该数据序列是否为平稳序列，如果是，则继续执行后续步骤，如果否，则根据差分运算将该数据序列转换为平稳流感样病例百分比数据序列。具体地，检测所述流感样病例百分比数据序列是否为平稳序列的步骤包括：对所述流感样病例百分比数据进行单位根检验，以检测所述流感样病例百分比数据序列是否为平稳序列，其中，若检测到序列中有单位根，则判定序列为非平稳序列，否则，判定序列为平稳序列。

步骤S30，根据所述预设周期和预设阶数k，将所述流感样病例百分比数据序列在所述预设周期前后分别滞后0至k阶，获取2k+1个数据序列。

步骤S40，分别计算所述2k+1个数据序列与所述流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期。

本实施例中，预设阶数K为正整数，K优选地取值为2-6，以下以预设周期T ₀＝52，K＝2为例，获取流感样病例百分比数据序列在预设周期T ₀附近滞后K阶的数据序列，可以获取到2k+1个数据序列。假设2013年至2017年期间的历史数据构成的原始数据序列为[W1、W2、W3、……W260]，按照预设周期T ₀＝52提取到的原始数据序列L0＝[W1、W2、W3、……W206]，将该序列在预设周期前后分别滞后0至2阶，获取到如下5个序列：

L1为[W50、W51、W52、……W256]；

L2为[W52、W53、W54、……W257]；

L3为[W53、W54、W55、……W258]；

L4为[W54、W55、W56、……W259]；

L5为[W55、W56、W57、……W260]。

即在原始数据序列的基础上滞后50周得到数据序列L1，在原始数据序列的基础上滞后51周得到数据序列L2，在原始数据序列的基础上滞后52周得到数据序列L3，在原始数据序列的基础上滞后53周得到数据序列L4，在原始数据序列的基础上滞后54周得到数据序列L5。分别计算序列L1、L2、L3、L4、L5与序列L0之间的自相关系数。

在周期没有受到年份或者节气等因素的影响时，即预测周期为52周时，则第1周至第206周与第53周至258周的数据序列在较小的误差范围内是一样的，此时，L0与L3的自相关系数会最大。但是，如果数据序列在受到其他因素影响导致周期变化时，L0与L3的相关性就会比较弱，L0与其他数据序列的相关性变强，因此，通过上述计算得到的自相关系数，按照从L1至L5的顺序，确定第一个自相关系数大于预设阈值的序列，将该序列的滞后周数作为预测周期。例如，讲过计算得到L0与L4之间的自相关系数为L1至L5中第一个自相关系数大于预设阈值的序列，则确定当前的预测周期为53周。

步骤S50，根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型。

对确定了预测周期的平稳的流感ILI序列，分别求得其自相关系数和偏自相关系数，以确定模型中的AR参数和MA参数，即p、q和q的值，进而根据得到的上述参数和预测周期建立ARIMA模型。具体地，获取经过差分运算转换得到的平稳数据序列，将进行平稳序列转换时的差分运算的阶数作为ARIMA模型的参数d的值。对确定了预测周期的平稳数据序列分别求得其自相关系数和偏自相关系数，并绘制自相关图和偏自相关图，根据自相关图和偏自相关图判断偏自相关系数和自相关系数是拖尾还是截尾，并由此选择相应的ARIMA模型对平稳化处理后的数据序列进行拟合；对拟合的ARIMA模型进行参数估计，得到最佳的阶层p和阶数q，然后对模型进行有效性检验，以确定最终的预测模型。具体地，在指数平滑模型下，观察ARIMA模型的残差是否是平均值为0且方差为常数的正态分布，同时观察连续残差是否相关，若是，则判定模型通过校验。

在使用得到的ARIMA模型进行实时预测的过程中，通过滚动预测的方式对流感样病例百分比数据进行提前一周预测。随着时间的变化，针对不同的预测点的历史流感样病例百分比数据序列的周期可能会存在变化。因此，每次在提前一周进行预测时，需要根据本周之前的连续多周的流感样病例百分比数据确定新的预测周期，对模型进行动态更新，以提高自回归积分滑动平均模型的预测精准度。

本实施例提出的预测模型的生成方法，确定目标区域和待预测的目标时间单元，并获取预设周期；获取目标区域在目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；根据预设周期和预设阶数k，将流感样病例百分比数据序列在预设周期前后分别滞后0至k阶，获取2k+1个数据序列；分别计算2k+1个数据序列与流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；根据确定了预测周期的流感样病例百分比序列计算模型参数，根据模型参数和预测周期建立自回归积分滑动平均模型作为预测模型。本申请在对目标时间单元的数据进行预测时，通过对该目标时间单元之前的数据序列滞后多个阶数后，计算序列之间的自相关系数，进而根据自相关系数确定一个适用于当前目标时间单元的预测周期，并使用该预测周期进行建模，提高了自回归积分滑动平均模型的预测精准度。

本申请还提供一种预测模型的生成装置。参照图2所示，为本申请一实施例提供的预测模型的生成装置的内部结构示意图。

在本实施例中，预测模型的生成装置1可以是PC(Personal Computer，个人电脑)，也可以是智能手机、平板电脑、便携计算机等终端设备。该预测模型的生成装置1至少包括存储器11、处理器12，网络接口13，以及通信总线。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是预测模型的生成装置1的内部存储单元，例如该预测模型的生成装置1的硬盘。存储器11在另一些实施例中也可以是预测模型的生成装置1的外部存储设备，例如预测模型的生成装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器11还可以既包括预测模型的生成装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于预测模型的生成装置1的应用软件及各类数据，例如模型生成程序01的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行模型生成程序01等。

网络接口13可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该装置1与其他电子设备之间建立通信连接。

通信总线用于实现这些组件之间的连接通信。

可选地，该装置1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在预测模型的生成装置1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-13以及模型生成程序01的预测模型的生成装置1，本领域技术人员可以理解的是，图1示出的结构并不构成对预测模型的生成装置1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图2所示的装置1实施例中，存储器11中存储有模型生成程序01；处理器12执行存储器11中存储的模型生成程序01时实现如下步骤：

确定目标区域和待预测的目标时间单元，并获取预设周期。

获取所述目标区域在所述目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列。

根据所述预设周期和预设阶数k，将所述流感样病例百分比数据序列在所述预设周期前后分别滞后0至k阶，获取2k+1个数据序列。

分别计算所述2k+1个数据序列与所述流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期。

L1为[W50、W51、W52、……W256]；

L2为[W52、W53、W54、……W257]；

L3为[W53、W54、W55、……W258]；

L4为[W54、W55、W56、……W259]；

L5为[W55、W56、W57、……W260]。

在周期没有受到年份或者节气等因素的影响时，即预测周期为52周时，则第1周至第206周与第53周至258周的数据序列在较小的误差范围内是一样的，此时，L0与L3的自相关系数会最大。但是，如果数据序列在受到其他因素影响导致周期变化时，L0与L3的相关性就会比较弱，L0与其他数据序列的相关性变强，因此，通过上述计算得到的自相关系数，按照从L1至 L5的顺序，确定第一个自相关系数大于预设阈值的序列，将该序列的滞后周数作为预测周期。例如，讲过计算得到L0与L4之间的自相关系数为L1至L5中第一个自相关系数大于预设阈值的序列，则确定当前的预测周期为53周。

本实施例提出的预测模型的生成装置，确定目标区域和待预测的目标时间单元，并获取预设周期；获取目标区域在目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；根据预设周期和预设阶数k，将流感样病例百分比数据序列在预设周期前后分别滞后0至k阶，获取2k+1个数据序列；分别计算2k+1个数据序列与流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；根据确定了预测周期的流感样病例百分比序列计算模型参数，根据模型参数和预测周期建立自回归积分滑动平均模型作为预测模型。本申请在对目标时间单元的数据进行预测时，通过对该目标时间单元之前的数据序列滞后多个阶数后，计算序列之间的自相关系数，进而根据自相关系数确定一个适用于当前目标时间单元的预测周期，并使用该预测周期进行建模，提高了自回归积分滑动平均模型的预测精准度。

可选地，在其他的实施例中，模型生成程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行以完成本申请，本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述模型生成程序在预测模型的生成装置中的执行过程。

例如，参照图3所示，为本申请预测模型的生成装置一实施例中的模型生成程序的程序模块示意图，该实施例中，模型生成程序可以被分割为数据确定模块10、序列获取模块20、数据计算模块30和模型生成模块40，示例性地：

数据确定模块10用于：确定目标区域和待预测的目标时间单元，并获取预设周期；

以及，获取所述目标区域在所述目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；

序列获取模块20用于：根据所述预设周期和预设阶数k，将所述流感样病例百分比数据序列在所述预设周期前后分别滞后0至k阶，获取2k+1个数据序列；

数据计算模块30用于：分别计算所述2k+1个数据序列与所述流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；

模型生成模块40用于：根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型。

上述数据确定模块10、序列获取模块20、数据计算模块30和模型生成模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有模型生成程序，所述模型生成程序可被一个或多个处理器执行，以实现如下操作：

确定目标区域和待预测的目标时间单元，并获取预设周期；

根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型。本申请计算机可读存储介质具体实施方式与上述预测模型的生成装置和方法各实施例基本相同，在此不作累述。

需要说明的是，上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种预测模型的生成方法，其特征在于，所述方法包括：

确定目标区域和待预测的目标时间单元，并获取预设周期；

获取所述目标区域在所述目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；

根据所述预设周期和预设阶数k，将所述流感样病例百分比数据序列在所述预设周期前后分别滞后0至k阶，获取2k+1个数据序列；

分别计算所述2k+1个数据序列与所述流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；

根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型。
如权利要求1所述的预测模型的生成方法，其特征在于，所述获取所述目标区域的所述目标时间单元之前的连续多个时间单位内的流感样病例百分比数据序列的步骤之后，所述方法还包括步骤：

检测所述流感样病例百分比数据序列是否为平稳序列；

若是，则执行所述获取根据所述流感样病例百分比数据所呈现的周期性确定的预设周期的步骤；

若否，则根据差分运算将所述流感样病例百分比数据序列转换为平稳序列。
如权利要求2所述的预测模型的生成方法，其特征在于，所述检测所述流感样病例百分比数据序列是否为平稳序列的步骤包括：

对所述流感样病例百分比数据进行单位根检验，以检测所述流感样病例百分比数据序列是否为平稳序列，其中，若检测到序列中有单位根，则判定序列为非平稳序列，否则，判定序列为平稳序列。
如权利要求2所述的预测模型的生成方法，其特征在于，所述获取预设周期的步骤包括：

根据所述流感样病例百分比数据所呈现的周期性确定所述预设周期。
如权利要求2所述的预测模型的生成方法，其特征在于，所述根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型的步骤包括：

计算确定了预测周期的平稳流感样病例百分比数据序列的自相关系数和偏自相关系数，并绘制自相关图和偏自相关图；

根据所述自相关图和所述偏自相关图，判断计算的偏自相关系数和自相关系数是拖尾还是截尾，并根据判断结果选择自回归积分滑动平均模型对平稳流感样病例百分比数据序列进行拟合，以获取所述预测模型。
如权利要求3所述的预测模型的生成方法，其特征在于，所述根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型的步骤包括：

计算确定了预测周期的平稳流感样病例百分比数据序列的自相关系数和偏自相关系数，并绘制自相关图和偏自相关图；

根据所述自相关图和所述偏自相关图，判断计算的偏自相关系数和自相关系数是拖尾还是截尾，并根据判断结果选择自回归积分滑动平均模型对平稳流感样病例百分比数据序列进行拟合，以获取所述预测模型。
如权利要求4所述的预测模型的生成方法，其特征在于，所述根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型的步骤包括：

计算确定了预测周期的平稳流感样病例百分比数据序列的自相关系数和偏自相关系数，并绘制自相关图和偏自相关图；

根据所述自相关图和所述偏自相关图，判断计算的偏自相关系数和自相关系数是拖尾还是截尾，并根据判断结果选择自回归积分滑动平均模型对平稳流感样病例百分比数据序列进行拟合，以获取所述预测模型。
一种预测模型的生成装置，其特征在于，所述装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的模型生成程序，所述模型生成程序被所述处理器执行时实现如下步骤：

确定目标区域和待预测的目标时间单元，并获取预设周期；

获取所述目标区域在所述目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；

根据所述预设周期和预设阶数k，将所述流感样病例百分比数据序列在所述预设周期前后分别滞后0至k阶，获取2k+1个数据序列；

分别计算所述2k+1个数据序列与所述流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；

根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型。
如权利要求8所述的预测模型的生成装置，其特征在于，所述模型生成程序还可被所述处理器执行，以在所述获取所述目标区域的所述目标时间单元之前的连续多个时间单位内的流感样病例百分比数据序列的步骤之后，还实现如下步骤：

检测所述流感样病例百分比数据序列是否为平稳序列；

若是，则执行所述获取根据所述流感样病例百分比数据所呈现的周期性确定的预设周期的步骤；

若否，则根据差分运算将所述流感样病例百分比数据序列转换为平稳序列。
如权利要求9所述的预测模型的生成装置，其特征在于，所述检测所述流感样病例百分比数据序列是否为平稳序列的步骤包括：

对所述流感样病例百分比数据进行单位根检验，以检测所述流感样病例百分比数据序列是否为平稳序列，其中，若检测到序列中有单位根，则判定序列为非平稳序列，否则，判定序列为平稳序列。
如权利要求9所述的预测模型的生成装置，其特征在于，所述获取预设周期的步骤包括：

根据所述流感样病例百分比数据所呈现的周期性确定所述预设周期。
如权利要求9所述的预测模型的生成装置，其特征在于，所述根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型的步骤包括：

计算确定了预测周期的平稳流感样病例百分比数据序列的自相关系数和偏自相关系数，并绘制自相关图和偏自相关图；

根据所述自相关图和所述偏自相关图，判断计算的偏自相关系数和自相关系数是拖尾还是截尾，并根据判断结果选择自回归积分滑动平均模型对平稳流感样病例百分比数据序列进行拟合，以获取所述预测模型。
如权利要求10所述的预测模型的生成装置，其特征在于，所述根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型的步骤包括：

计算确定了预测周期的平稳流感样病例百分比数据序列的自相关系数和偏自相关系数，并绘制自相关图和偏自相关图；

根据所述自相关图和所述偏自相关图，判断计算的偏自相关系数和自相关系数是拖尾还是截尾，并根据判断结果选择自回归积分滑动平均模型对平稳流感样病例百分比数据序列进行拟合，以获取所述预测模型。
如权利要求11所述的预测模型的生成装置，其特征在于，所述根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型的步骤包括：

计算确定了预测周期的平稳流感样病例百分比数据序列的自相关系数和偏自相关系数，并绘制自相关图和偏自相关图；

根据所述自相关图和所述偏自相关图，判断计算的偏自相关系数和自相关系数是拖尾还是截尾，并根据判断结果选择自回归积分滑动平均模型对平稳流感样病例百分比数据序列进行拟合，以获取所述预测模型。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有模型生成程序，所述模型生成程序可被一个或者多个处理器执行，以实现如下步骤：

确定目标区域和待预测的目标时间单元，并获取预设周期；

获取所述目标区域在所述目标时间单元之前的连续多个时间单元的流感样病例百分比数据序列；

根据所述预设周期和预设阶数k，将所述流感样病例百分比数据序列在所述预设周期前后分别滞后0至k阶，获取2k+1个数据序列；

分别计算所述2k+1个数据序列与所述流感样病例百分比数据序列之间的自相关系数，并按照滞后顺序，根据第一个自相关系数大于预设阈值的数据序列确定预测周期；

根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型。
如权利要求15所述的计算机可读存储介质，其特征在于，所述模型生成程序还可被所述处理器执行，以在所述获取所述目标区域的所述目标时间单元之前的连续多个时间单位内的流感样病例百分比数据序列的步骤之后，还实现如下步骤：

检测所述流感样病例百分比数据序列是否为平稳序列；

若是，则执行所述获取根据所述流感样病例百分比数据所呈现的周期性确定的预设周期的步骤；

若否，则根据差分运算将所述流感样病例百分比数据序列转换为平稳序列。
如权利要求16所述的计算机可读存储介质，其特征在于，所述检测所述流感样病例百分比数据序列是否为平稳序列的步骤包括：

对所述流感样病例百分比数据进行单位根检验，以检测所述流感样病例百分比数据序列是否为平稳序列，其中，若检测到序列中有单位根，则判定序列为非平稳序列，否则，判定序列为平稳序列。
如权利要求16所述的计算机可读存储介质，其特征在于，所述获取预设周期的步骤包括：

根据所述流感样病例百分比数据所呈现的周期性确定所述预设周期。
如权利要求16所述的计算机可读存储介质，其特征在于，所述根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型的步骤包括：

计算确定了预测周期的平稳流感样病例百分比数据序列的自相关系数和偏自相关系数，并绘制自相关图和偏自相关图；

根据所述自相关图和所述偏自相关图，判断计算的偏自相关系数和自相关系数是拖尾还是截尾，并根据判断结果选择自回归积分滑动平均模型对平稳流感样病例百分比数据序列进行拟合，以获取所述预测模型。
如权利要求17所述的计算机可读存储介质，其特征在于，所述根据确定了预测周期的流感样病例百分比序列计算模型参数，根据所述模型参数和所述预测周期建立自回归积分滑动平均模型作为所述预测模型的步骤包括：

计算确定了预测周期的平稳流感样病例百分比数据序列的自相关系数和偏自相关系数，并绘制自相关图和偏自相关图；

根据所述自相关图和所述偏自相关图，判断计算的偏自相关系数和自相关系数是拖尾还是截尾，并根据判断结果选择自回归积分滑动平均模型对平稳流感样病例百分比数据序列进行拟合，以获取所述预测模型。