CN116469132A

CN116469132A - 基于双流特征提取的跌倒检测方法、系统、设备及介质

Info

Publication number: CN116469132A
Application number: CN202310730824.3A
Authority: CN
Inventors: 李江娇; 于卫国; 王文春; 李彬; 王文学; 陈刚; 陈义波; 李博
Original assignee: Jinan Richnes Electronic Co ltd
Current assignee: Jinan Richnes Electronic Co ltd
Priority date: 2023-06-20
Filing date: 2023-06-20
Publication date: 2023-07-21
Anticipated expiration: 2043-06-20
Also published as: CN116469132B

Abstract

本发明公开一种基于双流特征提取的跌倒检测方法、系统、设备及介质，涉及图像处理与特定计算模型技术领域，包括：获取待检测图像；对待检测图像经多级残差处理后得到对应的多个卷积局部特征图，并对最后一级残差处理后得到的卷积局部特征图进行区域注意力特征提取，得到注意力局部特征图；对待检测图像进行分块并嵌入位置编码，对得到的图像块进行自编码和卷积操作后得到全局特征图；将卷积局部特征图和注意力局部特征图与全局特征图进行特征融合后，根据得到的融合特征图进行跌倒检测。设计了用于提取局部特征和全局特征的双流网络，以增强对跌倒事件的识别能力，提高正确率。

Description

基于双流特征提取的跌倒检测方法、系统、设备及介质

技术领域

本发明涉及图像处理与特定计算模型技术领域，特别是涉及一种基于双流特征提取的跌倒检测方法、系统、设备及介质。

背景技术

在深度学习中，现有的跌倒检测方法可以总结为三类：基于穿戴式传感器、基于环境和基于计算机视觉的跌倒检测系统。

基于穿戴式传感器的跌倒检测系统通常使用加速度计、陀螺仪等传感器获取数据，根据获取的速度、加速度等数据进行跌倒检测；但是穿戴式的传感器容易被遗忘，穿戴时间长容易导致不舒适，或有时因电量不足导致无法使用。

基于环境的跌倒检测系统通常使用雷达、红外、超声等非视觉传感器获取数据来进行跌倒检测；但是基于环境的传感器受外界的干扰较大，误检率较高。

基于计算机视觉的跌倒检测系统通常使用手机、摄像机等获取数据，根据获取的图像、视频等数据进行跌倒检测；但是现存的基于计算机视觉的跌倒检测方法误检率较高，正确率较低，特异性较差，提取全局特征的能力较差。

发明内容

为了解决上述问题，本发明提出了一种基于双流特征提取的跌倒检测方法、系统、设备及介质，设计了用于提取局部特征和全局特征的双流网络，以增强对跌倒事件的识别能力，提高正确率。

为了实现上述目的，本发明采用如下技术方案：

第一方面，本发明提供一种基于双流特征提取的跌倒检测方法，包括：

获取待检测图像；

对待检测图像经多级残差处理后得到对应的第一卷积局部特征图、第二卷积局部特征图和第三卷积局部特征图，并对最后一级残差处理后得到的第四卷积局部特征图进行区域注意力特征提取，得到注意力局部特征图；

其中，区域注意力特征提取的过程包括：对第四卷积局部特征图提取第一注意力矩阵，将第一注意力矩阵与第四卷积局部特征图经全局平均池化操作后得到的池化特征图做叉乘与重塑后，再与第四卷积局部特征图相加，得到注意力局部特征图；

对待检测图像进行分块并嵌入位置编码，对得到的图像块进行自编码和卷积操作后得到全局特征图；

其中，将图像块经线性变换后得到查询张量、键张量以及值张量，对键张量进行自编码操作后，与查询张量相乘得到第二注意力矩阵，第二注意力矩阵经卷积操作后与值张量相乘得到自注意力头输出，将自注意力头输出与原图像块相加后，再经归一化和多层感知机操作得到全局特征图；

将第一卷积局部特征图、第二卷积局部特征图、第三卷积局部特征图和注意力局部特征图与全局特征图进行特征融合后，根据得到的融合特征图进行跌倒检测。

作为可选择的实施方式，对待检测图像的多级残差处理的过程包括：对待检测图像先经过一个的卷积和一个最大池化操作后得到预处理子图，对预处理子图依次经四个前后连接的残差块进行残差处理，由此得到第一卷积局部特征图、第二卷积局部特征图、第三卷积局部特征图和第四卷积局部特征图，且第一卷积局部特征图、第二卷积局部特征图和第三卷积局部特征图用于特征融合，第四卷积局部特征图用于进行区域注意力特征提取。

作为可选择的实施方式，所述残差块由2个的卷积组成。

作为可选择的实施方式，提取第一注意力矩阵的过程包括：

将第四卷积局部特征图复制三份，分别得到第一特征图、第二特征图和第三特征图；

将第一特征图进行通道降维和重塑后，得到第一重塑特征图；

将第二特征图进行通道降维和全局平均池化操作后，得到第二池化特征图；

将第三特征图进行全局平均池化操作后，得到第三池化特征图；

将第一重塑特征图和第二池化特征图叉乘后得到第一注意力矩阵；且第一注意力矩阵与第三池化特征图做叉乘处理。

作为可选择的实施方式，对第二注意力矩阵经过的卷积后与值张量相乘。

作为可选择的实施方式，自编码操作为键张量矩阵中每个值与一个单位邻域的所有值进行编码操作。

作为可选择的实施方式，特征融合的过程包括：

（1）对待检测图像经多级残差处理后得到第一卷积局部特征图、第二卷积局部特征图/>和第三卷积局部特征图/>，对/>、/>和/>进行下采样，/>与下采样后的/>相加，/>与下采样后的/>相加，下采样后的/>与注意力局部特征图相加，相加后的输出均依次进行/>卷积和线性变换操作；

（2）所述全局特征图包括第一全局特征图、第二全局特征图/>、第三全局特征图/>和第四全局特征图/>，步骤（1）得到的第一线性变换输出与/>相加后再与/>相加；

（3）步骤（1）得到的第二线性变换输出与相加后再与/>和步骤（2）的输出相加；

（4）步骤（1）得到的第三线性变换输出与相加后再与/>和步骤（3）的输出相加，由此得到融合特征图。

第二方面，本发明提供一种基于双流特征提取的跌倒检测系统，包括：

获取模块，被配置为获取待检测图像；

局部特征提取模块，被配置对待检测图像经多级残差处理后得到对应的第一卷积局部特征图、第二卷积局部特征图和第三卷积局部特征图，并对最后一级残差处理后得到的第四卷积局部特征图进行区域注意力特征提取，得到注意力局部特征图；

全局特征提取模块，被配置为对待检测图像进行分块并嵌入位置编码，对得到的图像块进行自编码和卷积操作后得到全局特征图；

特征融合模块，被配置为将第一卷积局部特征图、第二卷积局部特征图、第三卷积局部特征图和注意力局部特征图与全局特征图进行特征融合后，根据得到的融合特征图进行跌倒检测。

第三方面，本发明提供一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成第一方面所述的方法。

第四方面，本发明提供一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成第一方面所述的方法。

与现有技术相比，本发明的有益效果为：

本发明提出一种基于双流特征提取的跌倒检测方法、系统、设备及介质，设计了用于提取局部特征和全局特征的双流网络，以增强对跌倒事件的识别能力，提高正确率；其中，双流网络的一个分支由卷积神经网络和区域注意力模块组成，用于提取局部特征；另一个分支由改进的Transformer模型组成，用于提取全局特征；最后，将局部特征和全局特征融合后用于分类，实现跌倒检测。相比现有的基于神经网络进行跌倒检测的方法，基于双流网络来分别提取局部特征和全局特征，其精度和准确率更高且应用性较强。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明实施例1提供的基于双流特征提取的跌倒检测方法流程图；

图2为本发明实施例1提供的基于卷积神经网络和区域注意力模块的分支结构示意图；

图3为本发明实施例1提供的区域注意力模块结构示意图；

图4为本发明实施例1提供的用于提取全局特征的分支结构示意图；

图5为本发明实施例1提供的改进的多头自注意力模块结构示意图；

图6为本发明实施例1提供的特征融合示意图。

具体实施方式

下面结合附图与实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例1

本实施例提供一种基于双流特征提取的跌倒检测方法，如图1所示，包括：

获取待检测图像；

在本实施例中，设计了用于提取局部特征和全局特征的双流网络，以增强对跌倒事件的识别能力，提高正确率。其中，双流网络的一个分支由卷积神经网络和区域注意力模块组成，用于提取局部特征；另一个分支由改进的Transformer模型组成，用于提取全局特征；最后，使用特征融合模块将局部特征和全局特征融合后用于分类，实现跌倒检测。

在本实施例中，获取的待检测图像的维度为/>，其中，H为高度，W为宽度，C为通道数；对待检测图像进行批归一化处理，加快网络收敛，归一化后的待检测图像为：

（1）

其中，为批量数据的均值，/>为批量数据的方差，/>是为防止分母出现零所增加的变量，/>和/>为模型学习参数，分别取1和0。

卷积神经网络的优势在于使用卷积核提取图像特征，使用池化操作去除冗余信息，减少特征映射的维数，综上可知，卷积神经网络更适合提取较小的特征和局部特征。因此，本实施例设计了一个基于卷积神经网络和区域注意力模块的分支，用于提取局部特征；如图2所示，先经过一个/>的卷积和一个最大池化，相当于进行预处理操作，得到预处理子图/>，如式（2）所示：

（2）

其中，表示/>的卷积操作，/>表示最大池化操作。

然后预处理子图依次经四个前后连接的残差块后，得到维度为/>的第四卷积局部特征图/>，其中，每个残差块包括2个/>的卷积，有效解决网络梯度消失的问题；/>、/>、/>分别为第四卷积局部特征图/>的高度、宽度和通道数；

具体地：预处理子图经第一残差块处理后，得到第一卷积局部特征图/>，如式（3）所示：

（3）

其中，表示两个/>的卷积操作。

同理，第一卷积局部特征图经第二残差块处理后，得到第二卷积局部特征图；第二卷积局部特征图/>经第三残差块处理后，得到第三卷积局部特征图/>；第三卷积局部特征图/>经第四残差块处理后，得到第四卷积局部特征图/>。

在本实施例中，第四卷积局部特征图被输入进区域注意力模块中，如图3所示，具体包括：

将第四卷积局部特征图复制三份，分别得到第一特征图B、第二特征图J和第三特征图D；

将第一特征图B进行通道降维后，维度变为，再经重塑后，得到维度为的第一重塑特征图/>；

将第二特征图J进行通道降维后，维度变为，在经全局平均池化操作后，得到维度为/>的第二池化特征图/>，S为步长；

将第三特征图D进行全局平均池化操作后，得到维度为的第三池化特征图；

将和/>叉乘后再经过softmax激活函数得到维度为/>的第一注意力矩阵/>：

（4）

其中，代表重塑操作，/>代表全局平均池化操作，/>代表矩阵叉乘操作，代表激活函数。

将与/>做叉乘并经重塑后，得到维度为/>的第二重塑特征图/>，/>与相加后，得到注意力局部特征图/>，如式（5）所示：

（5）

其中，代表矩阵相加操作。

Transformer模型的优势在于存在自注意力机制，能有效获得全局信息，并且多头可以将其映射到多个空间，使模型表达能力变强，突破了循环神经网络需循环执行，不能并行计算的限制。综上可知，Transformer模型更适合提取较大的特征和全部特征。

因此，本实施例设计了一个基于改进Transformer模型的分支，用于提取全局特征。如图4所示，将归一化后的待检测图像按照/>的大小进行分块，P为图像块的宽度，得到/>个图像块，每个图像块的维度为/>；再对每个图像块做线性变换，将维度压缩为/>，从而得到维度为/>的张量，同时，生成维度为/>的位置编码，与相同维度的/>的张量相加，以嵌入位置编码和分类标签，得到维度为/>的图像块/>。

经过归一化后得到归一化图像块/>，/>输入改进的多头自注意力模块中。原始的自注意力模块仅使用查询张量Q-键张量K来计算注意矩阵，这会导致忽略不同键之间的上下文信息。因此，本实施例在原始的自注意力模块中引入了自编码和卷积操作。

如图5所示，对经线性变换后得到查询张量Q、键张量K以及值张量V，对/>进行自编码操作，即键张量矩阵中的每个值与一个单位邻域的所有值进行编码操作得到键中间张量/>，然后/>和/>相乘得到第二注意力矩阵，第二注意力矩阵经过一个/>的卷积/>后与/>相乘，得到自注意力头输出/>，自注意力头输出/>与/>相加后，再经归一化和多层感知机操作，最后两部分相加得到一个全局特征图/>，具体如式（6）所示：

（6）

其中，为多头自注意力操作，/>为归一化操作，/>为多层感知机操作。

经过四个改进的Transformer模型的堆叠，完成对所有全局特征图（、/>、/>、/>）的提取。

本实施例将上述得到的第一卷积局部特征图、第二卷积局部特征图、第三卷积局部特征图和注意力局部特征图与4个全局特征图进行融合，弥补部分网络提取全局特征能力较差和部分网络提取局部特征能力较差的缺陷；

如图6所示，具体地：

（1）对、/>和/>进行下采样，/>与下采样后的/>相加，/>与下采样后的/>相加，下采样后的/>与/>相加，相加后的输出均依次进行/>卷积和线性变换操作；

（2）步骤（1）得到的第一线性变换输出与相加后再与/>相加；

（4）步骤（1）得到的第三线性变换输出与相加后再与/>和步骤（3）的输出相加；

（5）基于步骤（4）的输出完成跌倒和正常的二分类。

实施例2

本实施例提供一种基于双流特征提取的跌倒检测系统，包括：

获取模块，被配置为获取待检测图像；

此处需要说明的是，上述模块对应于实施例1中所述的步骤，上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例1所公开的内容。需要说明的是，上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

在更多实施例中，还提供：

一种电子设备，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成实施例1中所述的方法。为了简洁，在此不再赘述。

应理解，本实施例中，处理器可以是中央处理单元CPU，处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC，现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器，并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如，存储器还可以存储设备类型的信息。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时，完成实施例1中所述的方法。

实施例1中的方法可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本领域普通技术人员可以意识到，结合本实施例描述的各示例的单元即算法步骤，能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

1.一种基于双流特征提取的跌倒检测方法，其特征在于，包括：

获取待检测图像；

2.如权利要求1所述的一种基于双流特征提取的跌倒检测方法，其特征在于，对待检测图像的多级残差处理的过程包括：对待检测图像先经过一个的卷积和一个最大池化操作后得到预处理子图，对预处理子图依次经四个前后连接的残差块进行残差处理，由此得到第一卷积局部特征图、第二卷积局部特征图、第三卷积局部特征图和第四卷积局部特征图，且第一卷积局部特征图、第二卷积局部特征图和第三卷积局部特征图用于特征融合，第四卷积局部特征图用于进行区域注意力特征提取。

3.如权利要求2所述的一种基于双流特征提取的跌倒检测方法，其特征在于，所述残差块由2个的卷积组成。

4.如权利要求1所述的一种基于双流特征提取的跌倒检测方法，其特征在于，提取第一注意力矩阵的过程包括：

5.如权利要求1所述的一种基于双流特征提取的跌倒检测方法，其特征在于，对第二注意力矩阵经过的卷积后与值张量相乘。

6.如权利要求1所述的一种基于双流特征提取的跌倒检测方法，其特征在于，自编码操作为键张量矩阵中每个值与一个单位邻域的所有值进行编码操作。

7.如权利要求1所述的一种基于双流特征提取的跌倒检测方法，其特征在于，特征融合的过程包括：

（2）所述全局特征图包括第一全局特征图、第二全局特征图/>、第三全局特征图和第四全局特征图/>，步骤（1）得到的第一线性变换输出与/>相加后再与/>相加；

8.一种基于双流特征提取的跌倒检测系统，其特征在于，包括：

获取模块，被配置为获取待检测图像；

9.一种电子设备，其特征在于，包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令，所述计算机指令被处理器运行时，完成权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，用于存储计算机指令，所述计算机指令被处理器执行时，完成权利要求1-7任一项所述的方法。