CN114979302A

CN114979302A - 一种自适应的基于熵的快速工人动作图像传输方法及系统

Info

Publication number: CN114979302A
Application number: CN202210427667.4A
Authority: CN
Inventors: 向华; 欧健; 何黎霞
Original assignee: Yangtze University
Current assignee: Yangtze University
Priority date: 2022-04-22
Filing date: 2022-04-22
Publication date: 2022-08-30
Anticipated expiration: 2042-04-22
Also published as: CN114979302B

Abstract

本发明属于图像处理、信息论技术领域，公开了一种自适应的基于熵的快速工人动作图像传输方法及系统，所述自适应的基于熵的快速工人动作图像传输方法包括：分解图像，对工人动作进行识别分类；根据动作特性计算连续帧中的基于动作特性的信息熵大小；根据信息熵值的特性，识别出关键动作关键帧；根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取；传输关键动作帧类型信息。本发明提供的自适应的基于熵的快速工人动作图像传输方法，通过有效利用动作时空信息的连续性特点，使用信息熵为工具压缩了工人动作图像传输数据，为进一步快速工人动作识别提供了有效手段。

Description

一种自适应的基于熵的快速工人动作图像传输方法及系统

技术领域

本发明属于图像处理、信息论技术领域，尤其涉及一种自适应的基于熵的快速工人动作图像传输方法及系统。

背景技术

目前，计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。

在工业生产中，即时的快速运动图像分析应用中，图像传输并逐帧处理效率较低，出现效率低的原因有很多，其中一个最主要的原因是传输了大量冗余的信息，其次是没有足够利用连续帧的特性，所以对图像传输的减负成为了急需解决的问题。

通过上述分析，现有技术存在的问题及缺陷为：传统图像传输方法在工业应用时需求对硬件需求极高，并且硬件足够好也并不容易即时相应。该方法可以选取更有即时意义的祯并进行处理分析及传输，加快整体运行速度，使检测程序可以的在即时性工业场景应用并响应事件。

发明内容

针对现有技术存在的问题，本发明提供了一种自适应的基于熵的快速工人动作图像传输方法及系统，尤其涉及一种自适应的基于香农信息熵的快速工人动作图像数据传输方法及系统。

本发明是这样实现的，一种自适应的基于熵的快速工人动作图像传输方法，所述自适应的基于熵的快速工人动作图像传输方法包括以下步骤：

步骤一，分解图像，对工人动作进行识别分类；

步骤二，根据动作特性计算连续帧中的基于动作特性的信息熵大小；

步骤三，根据信息熵值的特性，识别出关键动作关键帧；

步骤四，根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取；

步骤五，传输关键动作帧类型信息。

进一步，所述步骤三中的识别出关键动作关键帧包括：

(1)计算每一个视频帧图像的信息熵，记为I_i；

(2)利用滑动窗口的思想，给定滑动窗口C的长度L，计算每个窗口C_i的平均信息熵大小

和窗口信息熵最大在帧

(3)信息熵关键帧的判别；比较视频图像的第一帧I₀与第一个窗口平均信息熵

的相似度S，若相似度S不小于给定的阈值τ，则将第C_i个滑动窗口中信息熵最大的帧图像作为当前窗口的关键帧，并将所述关键帧的作为新的关键帧，直至处理完所有的视频帧；反之，进入步骤(4)；

(4)相似度小于阈值的情况，若S＜τ，则选取第C_i个滑动窗口中信息熵最大的帧图像作为下一个滑动窗口的起始位置后，转步骤(3)。

进一步，所述步骤(2)中的计算公式如下所示：

其中，

表示第i滑动窗口的第j帧图像的信息熵。

进一步，所述步骤(3)中的相似度S的计算公式如下所示：

进一步，所述步骤四中的关键帧出现规律特性的提取包括：

(1)选取关键帧流；

(2)利用自注意力机制判断关键帧的注意力最集中的位置；

(3)判断关键帧图片关键位置上的信息；

(4)根据步骤(3)的信息总结特殊规律。

进一步，所述步骤五中的自传输关键动作帧类型信息压缩包括：

(1)根据传输图片的信息变化率确定一个自适应的阈值；

(2)信息之间信息熵差大于阈值的就加高信息传输的频率；

(3)信息熵差距比自适应阈值小的就压缩跳跃图片处理。

本发明的另一目的在于提供一种应用所述的自适应的基于熵的快速工人动作图像传输方法的自适应的基于熵的快速工人动作图像传输系统，所述自适应的基于熵的快速工人动作图像传输系统包括：

识别分类模块，用于分解图像，对工人动作进行识别分类；

信息熵计算模块，用于根据动作特性计算连续帧中的基于动作特性的信息熵大小；

关键帧识别模块，用于根据信息熵值的特性，识别出关键动作关键帧；

规律特性提取模块，用于根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取；

信息传输模块，用于传输关键动作帧类型信息。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：

分解图像，对工人动作进行识别分类；根据动作特性计算连续帧中的基于动作特性的信息熵大小；根据信息熵值的特性，识别出关键动作关键帧；

根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取；传输关键动作帧类型信息。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如下步骤：

本发明的另一目的在于提供一种信息数据处理终端，所述信息数据处理终端用于实现所述的自适应的基于熵的快速工人动作图像传输系统。

结合上述的技术方案和解决的技术问题，请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为：

第一、针对上述现有技术存在的技术问题以及解决该问题的难度，紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等，详细、深刻地分析本发明技术方案如何解决的技术问题，解决问题之后带来的一些具备创造性的技术效果。具体描述如下：

本发明提供的自适应的基于熵的快速工人动作图像传输方法，通过有效利用动作时空信息的连续性特点，使用信息熵为工具压缩了工人动作图像传输数据，为进一步快速工人动作识别提供了有效手段。

第二，把技术方案看做一个整体或者从产品的角度，本发明所要保护的技术方案具备的技术效果和优点，具体描述如下：在实时性高速运动场景图片分析传输中提供了精准且高效的技术手段，在低硬件配置情况下可以更好的取代跳帧等模糊化处理。信息熵和图片上下文环境更好的利用了图片的信息特点，完成了高效且精简的图片输送。

第三，作为本发明的权利要求的创造性辅助证据，还体现在以下几个重要方面：本发明的技术方案转化后的预期收益和商业价值为：在实时性高速运动分析中提供了更为高效和精准的图像处理和传输技术。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的自适应的基于熵的快速工人动作图像传输方法流程图。

图2是本发明实施例提供的自适应的基于熵的快速工人动作图像传输系统结构框图；

图中：1、识别分类模块；2、信息熵计算模块；3、关键帧识别模块；4、规律特性提取模块；5、信息传输模块。

图3是本发明实施例提供的识别出关键动作关键帧策略示意图。

图4是本发明实施例提供的关键帧提取规律特征的策略示意图。

图5是本发明实施例提供的根据信息熵压缩传输的策略示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现，该部分是对权利要求技术方案进行展开说明的解释说明实施例。

针对现有技术存在的问题，本发明提供了一种自适应的基于熵的快速工人动作图像传输方法及系统，下面结合附图对本发明作详细的描述。

如图1所示，本发明实施例提供的自适应的基于熵的快速工人动作图像传输方法包括以下步骤：

S101，分解图像，对工人动作进行识别分类；

S102，根据动作特性计算连续帧中的基于动作特性的信息熵大小；

S103，根据信息熵值的特性，识别出关键动作关键帧；

S104，根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取；

S105，传输关键动作帧类型信息。

如图2所示，本发明实施例提供的自适应的基于熵的快速工人动作图像传输系统包括：

识别分类模块1，用于分解图像，对工人动作进行识别分类；

信息熵计算模块2，用于根据动作特性计算连续帧中的基于动作特性的信息熵大小；

关键帧识别模块3，用于根据信息熵值的特性，识别出关键动作关键帧；

规律特性提取模块4，用于根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取；

信息传输模块5，用于传输关键动作帧类型信息。

本发明实施例提供的识别出关键动作关键帧策略示意图如图3所示。

本发明实施例提供的关键帧提取规律特征的策略示意图如图4所示。

本发明实施例提供的根据信息熵压缩传输的策略示意图如图5所示。

本发明公开了一种基于香农信息熵压缩工人动作图像数据的方法，涉及图像处理、信息论技术，方案要点是：

1)分解图像，对工人动作进行识别分类；

2)根据动作特性计算连续帧中的基于动作特性的信息熵大小；

3)根据信息熵值的特性，识别出关键动作关键帧；

4)根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取；

5)传输关键动作帧类型信息。该方法通过有效利用动作时空信息的连续性特点，使用信息熵为工具压缩了工人动作图像传输数据，为进一步快速工人动作识别提供了有效手段。

进一步的，所述步骤3)识别出关键动作关键帧具体步骤为：

A)计算每一个视频帧图像的信息熵，记为I_i；

B)利用滑动窗口的思想，给定滑动窗口C的长度L，计算每个窗口C_i的平均信息熵大小

和窗口信息熵最大在帧

它们的计算公式分别如(1)、(2)式所示：

其中，

表示第i滑动窗口的第j帧图像的信息熵。

C)信息熵关键帧的判别。比较视频图像的第一帧I₀与第一个窗口平均信息熵

的相似度S，其相似度S的计算公式如式(3)所示，若相似度S不小于给定的阈值τ，则把第C_i个滑动窗口中信息熵最大的帧图像作为当前窗口的关键帧，并把该关键帧的作为新的关键帧，直至处理完所有的视频帧；反之，进入步骤D。

D)相似度小于阈值的情况，即S＜τ。选取第C_i个滑动窗口中信息熵最大的帧图像作为下一个滑动窗口的起始位置，然后转步骤C。

进一步的，所述步骤4)关键帧出现规律特性的提取步骤为：

A)选取关键帧流；

B)如用自注意力机制判断关键帧的注意力最集中的位置；

C)判断关键帧图片关键位置上的信息；

D)根据上一步信息总结特殊规律。

进一步的，所述步骤5)自传输关键动作帧类型信息压缩：

A)根据传输图片的信息变化率确定一个自适应的阈值(例如5帧以内的平均信息熵的10％)；

B)信息之间信息熵差大于阈值的就加高信息传输的频率；

C)信息熵差距比自适应阈值小的就压缩跳跃图片处理。

二、应用实施例。为了证明本发明的技术方案的创造性和技术价值，该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。

精尖工业和医疗等高精度低容错行业中的操作监督及误操提醒。高速运动场景分析的即时性反馈结果，可以最大化利用视频流中的少量有效帧和有效操作，强化软件整体流程的即时性和作业的精准性。减少冗余的数据操作。利用信息熵为工具压缩了工人动作图像传输数据在精细的工业流程里加一道同样精准的文件处理和传输工艺，进一步为精准高效和即时性服务。

应当注意，本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。