CN115440390B

CN115440390B - 一种传染病病例数量预测方法、系统、设备及存储介质

Info

Publication number: CN115440390B
Application number: CN202211394862.8A
Authority: CN
Inventors: 赵天龙; 袁晨迅; 李雪梅; 张彩明
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2022-11-09
Filing date: 2022-11-09
Publication date: 2023-03-24
Anticipated expiration: 2042-11-09
Also published as: CN115440390A

Abstract

本发明公开一种传染病病例数量预测方法、系统、设备及存储介质，涉及数据预测模型技术领域，包括：获取历史病例每日增长数据序列，并从中切分出子序列；对历史序列进行频率分解、增强、重构、残差连接后得到复合序列，对复合序列进行第一序列分解得到第一周期分量；对子序列进行第二序列分解得到第二周期分量和第一趋势分量，对第二周期分量进行频率分解、增强、重构和残差连接后，进行第三序列分解，将得到的第三周期分量与第一周期分量进行序列注意力匹配，得到与子序列对应周期相似的相关性序列，从而根据相关性序列进行未来序列的预测。在保留时序信息、提高信息利用率的同时降低注意力机制的时间复杂度。

Description

一种传染病病例数量预测方法、系统、设备及存储介质

技术领域

本发明涉及数据预测模型技术领域，特别是涉及一种传染病病例数量预测方法、系统、设备及存储介质。

背景技术

传染病流行趋势的变化是一个复杂的时间序列，且具有一定的周期性，虽然如循环神经网络、长短期记忆神经网络等模型已经广泛应用于传染病流行趋势的预测中，但是单一的机器学习或深度学习模型几乎很难捕捉其中更为有效的信息，目前现有一些使用机器学习方法的传染病时序预测模型中仍存在以下问题：

（1）现有预测模型对于具有一定周期性的病例数据并不契合，不能将包含周期-趋势两种特性的数据进行充分的分解，使得分解的周期分量中还存在着趋势成分，影响下游任务，目前仍缺乏对具有周期性病例数据预测模型的设计。

（2）现有预测模型采用的深度学习网络模型大多采用通用的网络结构，没有过多的关注数据的特性，缺乏有效的解释性，使得预测结果精度不高。

（3）使用注意力机制方法的预测模型时间复杂度较高，这是由于传统的注意力机制由于其二次复杂性，使得模型运行时间被迫延长，一方面增加了其对硬件的要求，另一方面使得其在实时预测任务中面临挑战；

另外，目前现有预测模型采用的自注意力机制更聚焦于时间维度的逐点点积，但是这种方式会破坏序列自身的时序性，降低了时序数据的信息利用率。

发明内容

为了解决上述问题，本发明提出了一种传染病病例数量预测方法、系统、设备及存储介质，采用频率增强方法，凸出有效频率分量在预测中的作用；采用序列注意力匹配以进行序列内的周期匹配，在保留时序信息、提高信息利用率的同时降低注意力机制的时间复杂度。

为了实现上述目的，本发明采用如下技术方案：

第一方面，本发明提供一种传染病病例数量预测方法，包括：

获取历史病例每日增长数据序列，并从历史病例每日增长数据序列中切分出靠近当前时间设定长度的子序列；

对历史病例每日增长数据序列进行频率分解，对得到的频率分量采用频率注意力机制进行增强，对增强后的频率分量进行重构，对重构后的频率分量与历史病例每日增长数据序列进行残差连接后得到复合序列，对复合序列进行第一序列分解得到第一周期分量；

对子序列进行第二序列分解得到第二周期分量和第一趋势分量，对第二周期分量进行频率分解、增强、重构和残差连接后，再次进行第三序列分解，将得到的第三周期分量与第一周期分量进行序列注意力匹配，得到与子序列对应周期相似的相关性序列；

将相关性序列与第三周期分量经残差连接后，依次进行第四序列分解和第五序列分解后得到输出周期分量，将第一趋势分量与第三序列分解、第四序列分解和第五序列分解后得到趋势分量依次进行残差连接后得到输出趋势分量，将输出周期分量和输出趋势分量拼接后作为传染病病例数量的预测结果。

作为可选择的实施方式，第一序列分解、第二序列分解、第三序列分解、第四序列分解和第五序列分解的过程都是一样的，则周期分量和趋势分量分别表示为：

其中，x _t为趋势分量，x _s为周期分量，AvgPool为平均池化，X _e为待分解的序列，Padding为对待序列分解的序列进行填充。

作为可选择的实施方式，经频率分解后得到高频分量X _j ^h和低频分量X _j ^l，并去除低频分量，保留高频分量：

其中，j是频率分解的层数；b _j(high)和b _j(low)是第j层的偏差向量；W _j(high)和W _j(low)均为权重矩阵，X是待频率分解的序列。

作为可选择的实施方式，对得到的频率分量采用频率注意力机制进行增强的过程包括：

对频率分量进行拼接后，进行二维卷积操作生成通道Q、K、V；

对通道Q和通道K进行放缩点积操作得到频率注意力分布e；所述放缩点积操作为对通道Q和通道K的单维度进行点积运算后进行放缩，放缩点积操作表示为：

，w为两个维度的张量尺寸；

频率注意力分布e通过softmax函数进行标准化后与通道V相乘得到注意力矩阵。

作为可选择的实施方式，将得到的第三周期分量与第一周期分量进行序列注意力匹配的过程包括：

将第三周期分量经线性映射得到查询序列；

将第一周期分量分别进行两次不同的线性映射得到键序列和值序列；

对查询序列和键序列进行序列注意力匹配，并将匹配起始位置定于查询序列的末端；

在键序列上滚动匹配查询序列时，通过待匹配的两个片段的置信度，判断相关性；

且匹配得到相关性序列后，从值序列的对应位置往后截取相同长度的序列用于预测。

作为可选择的实施方式，在截取序列时，当待预测的序列长度大于所能够截取的序列长度时，根据周期的重复性，将短周期历史序列进行周期延拓，通过拼接多个短周期历史序列进行预测。

作为可选择的实施方式，所述周期延拓为：对键序列前n补个零，对查询序列后补L个零，以使得两个序列长度相同，两个新序列分别以自身为周期进行前后延拓。

第二方面，本发明提供一种传染病病例数量预测系统，包括：

序列获取模块，被配置为获取历史病例每日增长数据序列，并从历史病例每日增长数据序列中切分出靠近当前时间设定长度的子序列；

历史序列处理模块，被配置为对历史病例每日增长数据序列进行频率分解，对得到的频率分量采用频率注意力机制进行增强，对增强后的频率分量进行重构，对重构后的频率分量与历史病例每日增长数据序列进行残差连接后得到复合序列，对复合序列进行第一序列分解得到第一周期分量；

相关序列匹配模块，被配置为对子序列进行第二序列分解得到第二周期分量和第一趋势分量，对第二周期分量进行频率分解、增强、重构和残差连接后，再次进行第三序列分解，将得到的第三周期分量与第一周期分量进行序列注意力匹配，得到与子序列对应周期相似的相关性序列；

序列预测模块，被配置为将相关性序列与第三周期分量经残差连接后，依次进行第四序列分解和第五序列分解后得到输出周期分量，将第一趋势分量与第三序列分解、第四序列分解和第五序列分解后得到趋势分量依次进行残差连接后得到输出趋势分量，将输出周期分量和输出趋势分量拼接后作为传染病病例数量的预测结果。

第三方面，本发明提供一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成第一方面所述的方法。

第四方面，本发明提供一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成第一方面所述的方法。

与现有技术相比，本发明的有益效果为：

本发明所提出的传染病病例数量预测方法，通过对分解后的高频分量采用频率注意力机制进行频率增强，以更加凸出有效频率分量在预测中的作用。

本发明所提出的传染病病例数量预测方法，采用的频率注意力机制相比于自注意力机制，其优势在于：自注意力机制聚焦于时间维度的逐点点积，破坏序列自身的时序性，降低了时序数据的信息利用率，而频率注意力机制仅对频率分量之间进行序列级的点积运算，保留时间维度的信息，且频率注意力机制的复杂度低于自注意力机制。

本发明所提出的传染病病例数量预测方法，采用序列注意力匹配机制，增强序列表达能力，相比于自注意力的逐点点积聚合形式，本发明将注意力机制作用于序列片段上，从而在保留时序信息、提高信息利用率的同时降低注意力机制的时间复杂度。

本发明所提出的传染病病例数量预测方法，在序列注意力匹配是提出基于互相关性的周期延拓方法，使得模型具有可解释性，在历史时间序列中寻找强相关性片段来对未来进行预测，显著降低了预测时间复杂度，降低预测误差。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明实施例1提供的传染病病例数量预测方法流程图；

图2为本发明实施例1提供的序列注意力匹配示意图；

图3为本发明实施例1提供的周期延拓示意图。

具体实施方式

下面结合附图与实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例1

如图1所示，本实施例提供一种传染病病例数量预测方法，具体包括如下步骤：

在本实施例中，获取历史病例每日增长数据序列X _C，并对X _C进行归一化处理后，得到归一化后的历史病例每日增长数据序列X _E：

（1）

其中，

为均值，

为标准差。

将归一化处理后的历史病例每日增长数据序列X _E按照7：3划分为训练集和测试集，并在训练集中切分出靠近当前时间设定长度的子序列X _D；可以理解为以最新时间为起点，往前倒推设定时间段，取该时间段的序列作为子序列。

在本实施例中，第一序列分解、第二序列分解、第三序列分解、第四序列分解和第五序列分解的过程都是一样的，都采用滑动平均的方法进行序列分解，序列分解后均得到周期分量和趋势分量；周期分量和趋势分量分别表示为：

（2）

（3）

在本实施例中，对历史病例每日增长数据序列进行的频率分解、增强和重构，与对第二周期分量进行的频率分解、增强和重构的过程原理是一样的；下面以对历史病例每日增长数据序列进行的频率分解、增强和重构为例，进行详细说明。

在本实施例中，采用最大重叠离散小波变换（Maximum Overlap DiscreteWavelet Transform，MODWT）对处理后的历史病例每日增长数据序列进行频率分解，得到高频分量X _j ^h和低频分量X _j ^l；

具体地，根据式（4）和式（5）进行多级频率分解，这种多级结构能在不同尺度下观察原始的数据序列，经分解后得到处理后的历史病例每日增长数据序列的高频分量X _j ^h和低频分量X _j ^l：

（4）

（5）

其中，j是频率分解的层数；b _j(high)和b _j(low)是第j层的偏差向量；X是待频率分解的序列；W _j(high)和W _j(low)均为权重矩阵，由小波滤波矩阵

和尺度滤波矩阵

初始化为小波系数

和尺度系数

。

在本实施例中，对于X _E=(x _t,x _t-1,…,x _t-L+1)，第j层MODWT的小波系数

和尺度系数

分别为：

（6）

（7）

其中，j是频率分解的层数，取值范围是

；K _j是第j层小波系数的长度，

，k是单位小波系数的长度，采用的是db2小波，k=4；

和

是第j层小波滤波器和尺度滤波器；N是时间序列的长度，N与滑动窗口长度T相等；l mod N指l除以N的余数。

需要指出的是，每个尺度的MODWT小波系数和尺度系数都与原始序列具有相同的长度。

为了更方便地将MODWT融合入深度网络进行训练，采用了与原始MODWT相等的矩阵表示形式，如式（8）所示：

（8）

其中，

是

的小波滤波矩阵，可通过对MODWT的小波滤波器进行处理得到，如式（9）所示：

（9）

其中，

为对

进行周期化处理得到；同理，尺度滤波矩阵

可通过将

替换为

得到。

在本实施例中，为了凸出对于预测更有作用的高频分量，将经频率分解得到的低频分量丢弃，原因是低频分量变换缓慢，可以视为长期趋势信息，这部分分量是在时域中难以去除的非周期成分；从而将分解P次得到的高频分量表示为

，采用频率注意力机制进行频率增强处理，使得各个高频分量在互相感知的基础上，对未来序列进行更好的表示。

具体地，将多个高频分量拼接得到

，然后对齐进行三个独立的二维卷积操作来生成

，如式（10）所示，其中卷积核尺寸设置为

，通道数为d；

（10）

不同于自注意力机制仅对通道Q和K的单维度做点积，本实施例的频率注意力机制在此基础上对高频分量的时序维度L同时进行点积运算，并且使用

进行放缩，其中

；频率注意力放缩点积操作表示为式（11）：

（11）

其中，w为两个维度的张量尺寸，e为频率注意力分布，

表示Q和K在两个维度对应元素相乘并求和。

频率注意力分布e通过softmax函数进行标准化，使得每个频率注意力的值和为1，使用式（12）将频率注意力分布e与V相乘得到注意力矩阵

：

（12）

与自注意力机制相比，频率注意力机制的优势有两点：

其一，自注意力机制聚焦于时间维度的逐点点积，这种方式破坏了序列自身的时序性，降低了时序数据的信息利用率；而频率注意力仅对频率分量之间进行序列级的点积运算，保留了时间维度的信息。

其二，注意力机制的复杂度为O(L ²)，而频率注意力的复杂度为

。由于分解次数P为常数且远小于输入的历史序列长度，因此频率注意力渐进为线性复杂度O(L)，相比于自注意力机制拥有更低的复杂度。

在本实施例中，将经频率增强后的高频分量进行重构，对重构后的频率分量与历史病例每日增长数据序列进行残差连接后得到复合序列；由于不同小波系数的长度之比为有理数，各个高频分量的周期之比也为有理数，因此，将各个高频分量进行叠加得到的复合序列也具有周期性；与原始序列相比，复合序列具有更明显的周期性，从而根据复合序列进行后续的序列内的周期匹配，其目的是从历史病例每日增长数据序列中发现当下的周期模式，并用其对未来序列进行预测。

在本实施例中，对复合序列进行第一序列分解后，将得到的趋势分量丢弃，只保留第一周期分量用于后续的处理。

在本实施例中，第三序列分解后得到第三周期分量和第二趋势分量；第四序列分解后得到第四周期分量和第三趋势分量；第五序列分解后得到输出周期分量和第四趋势分量；那么，第一趋势分量与第二趋势分量残差连接后，再与第三趋势分量残差连接，最后再与第四趋势分量残差连接，得到输出趋势分量。

在本实施例中，对复合序列进行第一序列分解后得到的第一周期分量进行数据增强处理，将增强后的第一周期分量与原第一周期分量进行残差连接后，进入后续的序列注意力匹配阶段。

在本实施例中，在第四序列分解得到第四周期分量后，对第四周期分量同样进行数据增强处理，将增强后的第四周期分量与原第四周期分量进行残差连接后，进入第五序列分解，第五序列分解后得到输出周期分量。

作为可选择的一种实施方式，数据增强处理采用常规的前馈神经网络实现即可。

在本实施例中，为了增强对序列的表达能力，采用序列注意力匹配方法，相比于自注意力的逐点点积聚合形式，该方法将注意力机制作用于序列片段上，从而在保留时序信息、提高信息利用率的同时降低注意力机制的时间复杂度。

下面以图2所示为例，对序列注意力匹配方法进行详细说明。

X _D表示靠近当前时间设定长度的子序列，将X _D归属于序列X _E中的某个周期长度为

的周期子序列X _T，因此，将X _D视为X _T中一段连续的相位片段，通过在序列X _E中匹配与子序列X _D对应周期相似的相位片段作为相关性序列，并基于周期的延拓性用对应的历史序列预测未来。

为了增强时间序列数据的表达能力，首先对X _D和X _E进行不同的线性映射，从而得到查询序列X _D ^Q、键序列X _E ^K和值序列X _E ^V，其中，X _D ^Q的长度为n，X _E ^K和X _E ^V的长度均为L，然后序列注意力匹配将被用来取代自注意力中的逐点匹配。

在本实施例中，将序列注意力匹配阶段分成三种情况，下面依次进行说明。

（1）查询序列X _D ^Q的部分项与键序列X _E ^K的匹配；

取靠近当前时间的查询序列X _D ^Q作为输入的原因是因为当前时间的序列对未来的影响更大；同理，在查询序列X _D ^Q中，越靠近当前时间的片段拥有更高的重要性，因此，将匹配的起始位置定于查询序列X _D ^Q的末端。

当时延为

时，查询序列X _D ^Q的后半段与键序列X _E ^K中对应相位片段进行相关性匹配，并计算置信度

。

（2）查询序列X _D ^Q与键序列X _E ^K的匹配；

随着时延

的缩小，匹配将向当前时间移动；当时延为

时，完整的查询序列X _D ^Q 将与键序列X _E ^K中对应相位的子序列进行相关性匹配，并计算置信度

；查询序列X _D ^Q的长度代表了能够影响未来序列的最近序列范围。

（3）查询序列X _D ^Q与自身的匹配；

上述两种情况描述的是查询序列X _D ^Q是键序列X _E ^K中某个长周期子序列X _T的片段，即

。

依靠查询序列X _D ^Q在键序列X _E ^K上定位相关相位片段，并基于后续历史序列进行预测，此时查询序列X _D ^Q仅充当索引作用。

当查询序列X _D ^Q自身包含短周期成分时，即

，意味着X _D依靠自身信息也可以预测未来序列；即当时延为

时，X _D的前段将与自身后段进行相关性匹配，并计算置信度

。

为了同时满足算法的需求以及计算的便捷性，本实施例提出使用线性互相关来计算X _D ^Q与X _E ^K上不同片段的置信度值。假设X _D ^Q的长度为n，X _E ^K的长度为m，将两个序列的有效线性互相关操作表示为式（13），其中

由式（14）计算得出：

（13）

（14）

互相关序列（置信度）的值说明了X _D ^Q与X _E ^K上某个周期子序列在部分相位上的匹配程度。置信度R的值越大，匹配程度越高，相关性越强；同时可以看出，在超出X _E ^K的索引范围时，X _E ^K通过补零的方式与X _D ^Q进行等效匹配。

在X _E ^K上滚动匹配X _D ^Q的同时，从X _E ^V上的对应位置往后截取相同长度的历史序列

作为对未来的预测；而当预测的未来序列长度大于后续的历史序列的长度时，根据周期的重复性，本实施例将短周期历史序列进行周期延拓，通过拼接多个短周期历史序列对未来序列进行预测。

根据序列周期性质，置信度R不仅代表了历史序列与当前匹配序列的相关性程度，同时从一定程度上反映了其后续历史序列与未来序列相关性程度。因此，通过延时

截取的历史序列

对未来序列进行预测时，需要考虑其对应的置信度

。最后，使用式（15）和式（16）预测未来序列X _P。

（15）

（16）

在减少时间复杂度方面，本实施例提出了上述算法中置信度R的高效计算方法，具体如下：

周期延拓的运行速度主要受到周期片段匹配的影响。进行滑动匹配的序列X _D ^Q和X _E ^K长度分别为n和L，根据上述算法描述，因此匹配的时间复杂度为O(nL)。当X _D ^Q的长度为固定值且不考虑历史序列的长度时，可以将其视为常数项，此时的时间复杂度变为O(L)。当输入的历史序列长度发生变化来适用不同类型数据时，X _D ^Q根据历史序列长度进行灵活调整可以从历史数据中获得更有效的周期信息，此时的时间复杂度在最坏的情况下变为O(L ²)。

为了在最坏情况下提高算法的运行效率，本实施例采用循环互相关对上述匹配算法进行优化。循环互相关是表征两组等长的周期性数据之间相似性的操作，其与线性互相关的区别也正由“等长”和“周期性”这两个特点产生。不同于线性互相关，循环互相关其数据补充方式并不是“补零”而是“周期延拓”；

如图3所示，对X _E ^K进行前补n个零得到序列

，对X _D ^Q进行后补L个零得到序列

，使得两个序列长度相同；随后，两个新序列分别以自身为周期进行前后延拓。

通过上述方式，

和

满足了循环互相关操作的条件，其周期延拓的数据补充方式也与线性互相关中“补零”等效。因此，可以将X _D ^Q和X _E ^K的线性互相关计算等效为序列

和

的循环互相关计算。

因为循环互相关可以同时等效为循环卷积，所以可以利用快速傅里叶变换，如式（17）和式（18）计算卷积来等效计算

和

的循环互相关；

（17）

（18）

其中，

，

，F为快速傅里叶变换（FFT），F ^-1为逆变换，i为虚数，t为时间，f为频率，

为共轭操作，

为频域，

为两个序列的间隔

的互相关值。

对于任意时延

，FFT可以通过一次计算求解所有时延的匹配置信度

。通过这种方式，互相关实现了

的复杂度。因此，基于周期延拓的方法时间复杂度最低为O(L)，最高为

，相比于传统注意力机制的二次复杂度有显著的提升。

为了更好的展示本实施例方法的效果，使用一些评价回归问题的指标进行结果的展示，分别是平均绝对误差(Mean absolute error，MAE)、均方误差（Mean Square Error，MSE），如式（19）和式（20）：

（19）

（20）

其中，y _t表示时间序列在时间t的实际值，

表示y _t的预测值，N是测试集长度。

实施例2

本实施例提供一种传染病病例数量预测系统，包括：

此处需要说明的是，上述模块对应于实施例1中所述的步骤，上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

在更多实施例中，还提供：

一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成实施例1中所述的方法。为了简洁，在此不再赘述。

应理解，本实施例中，处理器可以是中央处理单元CPU，处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC，现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如，存储器还可以存储设备类型的信息。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例1中所述的方法。

实施例1中的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本领域普通技术人员可以意识到，结合本实施例描述的各示例的单元即算法步骤，能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种传染病病例数量预测方法，其特征在于，包括：

对得到的频率分量采用频率注意力机制进行增强的过程包括：

，w为两个维度的张量尺寸；

频率注意力分布e通过softmax函数进行标准化后与通道V相乘得到注意力矩阵；

将得到的第三周期分量与第一周期分量进行序列注意力匹配的过程包括：

将第三周期分量经线性映射得到查询序列；

且匹配得到相关性序列后，从值序列的对应位置往后截取相同长度的序列用于预测；

2.如权利要求1所述的一种传染病病例数量预测方法，其特征在于，第一序列分解、第二序列分解、第三序列分解、第四序列分解和第五序列分解的过程都是一样的，则周期分量和趋势分量分别表示为：

3.如权利要求1所述的一种传染病病例数量预测方法，其特征在于，经频率分解后得到高频分量X _j ^h和低频分量X _j ^l，并去除低频分量，保留高频分量：

4.如权利要求1所述的一种传染病病例数量预测方法，其特征在于，在截取序列时，当待预测的序列长度大于所能够截取的序列长度时，根据周期的重复性，将短周期历史序列进行周期延拓，通过拼接多个短周期历史序列进行预测。

5.如权利要求4所述的一种传染病病例数量预测方法，其特征在于，所述周期延拓为：对键序列前补n个零，对查询序列后补L个零，以使得两个序列长度相同，两个新序列分别以自身为周期进行前后延拓。

6.一种传染病病例数量预测系统，其特征在于，包括：

，w为两个维度的张量尺寸；

将第三周期分量经线性映射得到查询序列；

7.一种电子设备，其特征在于，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成权利要求1-5任一项所述的方法。

8.一种计算机可读存储介质，其特征在于，用于存储计算机指令，所述计算机指令被处理器执行时，完成权利要求1-5任一项所述的方法。