CN114979302A - 一种自适应的基于熵的快速工人动作图像传输方法及系统 - Google Patents
一种自适应的基于熵的快速工人动作图像传输方法及系统 Download PDFInfo
- Publication number
- CN114979302A CN114979302A CN202210427667.4A CN202210427667A CN114979302A CN 114979302 A CN114979302 A CN 114979302A CN 202210427667 A CN202210427667 A CN 202210427667A CN 114979302 A CN114979302 A CN 114979302A
- Authority
- CN
- China
- Prior art keywords
- key
- information
- entropy
- action
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009471 action Effects 0.000 title claims abstract description 90
- 230000005540 biological transmission Effects 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000033001 locomotion Effects 0.000 claims abstract description 25
- 230000007246 mechanism Effects 0.000 claims abstract description 15
- 238000010801 machine learning Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000003044 adaptive effect Effects 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/16—Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明属于图像处理、信息论技术领域,公开了一种自适应的基于熵的快速工人动作图像传输方法及系统,所述自适应的基于熵的快速工人动作图像传输方法包括:分解图像,对工人动作进行识别分类;根据动作特性计算连续帧中的基于动作特性的信息熵大小;根据信息熵值的特性,识别出关键动作关键帧;根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;传输关键动作帧类型信息。本发明提供的自适应的基于熵的快速工人动作图像传输方法,通过有效利用动作时空信息的连续性特点,使用信息熵为工具压缩了工人动作图像传输数据,为进一步快速工人动作识别提供了有效手段。
Description
技术领域
本发明属于图像处理、信息论技术领域,尤其涉及一种自适应的基于熵的快速工人动作图像传输方法及系统。
背景技术
目前,计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
在工业生产中,即时的快速运动图像分析应用中,图像传输并逐帧处理效率较低,出现效率低的原因有很多,其中一个最主要的原因是传输了大量冗余的信息,其次是没有足够利用连续帧的特性,所以对图像传输的减负成为了急需解决的问题。
通过上述分析,现有技术存在的问题及缺陷为:传统图像传输方法在工业应用时需求对硬件需求极高,并且硬件足够好也并不容易即时相应。该方法可以选取更有即时意义的祯并进行处理分析及传输,加快整体运行速度,使检测程序可以的在即时性工业场景应用并响应事件。
发明内容
针对现有技术存在的问题,本发明提供了一种自适应的基于熵的快速工人动作图像传输方法及系统,尤其涉及一种自适应的基于香农信息熵的快速工人动作图像数据传输方法及系统。
本发明是这样实现的,一种自适应的基于熵的快速工人动作图像传输方法,所述自适应的基于熵的快速工人动作图像传输方法包括以下步骤:
步骤一,分解图像,对工人动作进行识别分类;
步骤二,根据动作特性计算连续帧中的基于动作特性的信息熵大小;
步骤三,根据信息熵值的特性,识别出关键动作关键帧;
步骤四,根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;
步骤五,传输关键动作帧类型信息。
进一步,所述步骤三中的识别出关键动作关键帧包括:
(1)计算每一个视频帧图像的信息熵,记为Ii;
(3)信息熵关键帧的判别;比较视频图像的第一帧I0与第一个窗口平均信息熵的相似度S,若相似度S不小于给定的阈值τ,则将第Ci个滑动窗口中信息熵最大的帧图像作为当前窗口的关键帧,并将所述关键帧的作为新的关键帧,直至处理完所有的视频帧;反之,进入步骤(4);
(4)相似度小于阈值的情况,若S<τ,则选取第Ci个滑动窗口中信息熵最大的帧图像作为下一个滑动窗口的起始位置后,转步骤(3)。
进一步,所述步骤(2)中的计算公式如下所示:
进一步,所述步骤(3)中的相似度S的计算公式如下所示:
进一步,所述步骤四中的关键帧出现规律特性的提取包括:
(1)选取关键帧流;
(2)利用自注意力机制判断关键帧的注意力最集中的位置;
(3)判断关键帧图片关键位置上的信息;
(4)根据步骤(3)的信息总结特殊规律。
进一步,所述步骤五中的自传输关键动作帧类型信息压缩包括:
(1)根据传输图片的信息变化率确定一个自适应的阈值;
(2)信息之间信息熵差大于阈值的就加高信息传输的频率;
(3)信息熵差距比自适应阈值小的就压缩跳跃图片处理。
本发明的另一目的在于提供一种应用所述的自适应的基于熵的快速工人动作图像传输方法的自适应的基于熵的快速工人动作图像传输系统,所述自适应的基于熵的快速工人动作图像传输系统包括:
识别分类模块,用于分解图像,对工人动作进行识别分类;
信息熵计算模块,用于根据动作特性计算连续帧中的基于动作特性的信息熵大小;
关键帧识别模块,用于根据信息熵值的特性,识别出关键动作关键帧;
规律特性提取模块,用于根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;
信息传输模块,用于传输关键动作帧类型信息。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
分解图像,对工人动作进行识别分类;根据动作特性计算连续帧中的基于动作特性的信息熵大小;根据信息熵值的特性,识别出关键动作关键帧;
根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;传输关键动作帧类型信息。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
分解图像,对工人动作进行识别分类;根据动作特性计算连续帧中的基于动作特性的信息熵大小;根据信息熵值的特性,识别出关键动作关键帧;
根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;传输关键动作帧类型信息。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的自适应的基于熵的快速工人动作图像传输系统。
结合上述的技术方案和解决的技术问题,请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为:
第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
本发明提供的自适应的基于熵的快速工人动作图像传输方法,通过有效利用动作时空信息的连续性特点,使用信息熵为工具压缩了工人动作图像传输数据,为进一步快速工人动作识别提供了有效手段。
第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:在实时性高速运动场景图片分析传输中提供了精准且高效的技术手段,在低硬件配置情况下可以更好的取代跳帧等模糊化处理。信息熵和图片上下文环境更好的利用了图片的信息特点,完成了高效且精简的图片输送。
第三,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:本发明的技术方案转化后的预期收益和商业价值为:在实时性高速运动分析中提供了更为高效和精准的图像处理和传输技术。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的自适应的基于熵的快速工人动作图像传输方法流程图。
图2是本发明实施例提供的自适应的基于熵的快速工人动作图像传输系统结构框图;
图中:1、识别分类模块;2、信息熵计算模块;3、关键帧识别模块;4、规律特性提取模块;5、信息传输模块。
图3是本发明实施例提供的识别出关键动作关键帧策略示意图。
图4是本发明实施例提供的关键帧提取规律特征的策略示意图。
图5是本发明实施例提供的根据信息熵压缩传输的策略示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现,该部分是对权利要求技术方案进行展开说明的解释说明实施例。
针对现有技术存在的问题,本发明提供了一种自适应的基于熵的快速工人动作图像传输方法及系统,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的自适应的基于熵的快速工人动作图像传输方法包括以下步骤:
S101,分解图像,对工人动作进行识别分类;
S102,根据动作特性计算连续帧中的基于动作特性的信息熵大小;
S103,根据信息熵值的特性,识别出关键动作关键帧;
S104,根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;
S105,传输关键动作帧类型信息。
如图2所示,本发明实施例提供的自适应的基于熵的快速工人动作图像传输系统包括:
识别分类模块1,用于分解图像,对工人动作进行识别分类;
信息熵计算模块2,用于根据动作特性计算连续帧中的基于动作特性的信息熵大小;
关键帧识别模块3,用于根据信息熵值的特性,识别出关键动作关键帧;
规律特性提取模块4,用于根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;
信息传输模块5,用于传输关键动作帧类型信息。
本发明实施例提供的识别出关键动作关键帧策略示意图如图3所示。
本发明实施例提供的关键帧提取规律特征的策略示意图如图4所示。
本发明实施例提供的根据信息熵压缩传输的策略示意图如图5所示。
本发明公开了一种基于香农信息熵压缩工人动作图像数据的方法,涉及图像处理、信息论技术,方案要点是:
1)分解图像,对工人动作进行识别分类;
2)根据动作特性计算连续帧中的基于动作特性的信息熵大小;
3)根据信息熵值的特性,识别出关键动作关键帧;
4)根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;
5)传输关键动作帧类型信息。该方法通过有效利用动作时空信息的连续性特点,使用信息熵为工具压缩了工人动作图像传输数据,为进一步快速工人动作识别提供了有效手段。
进一步的,所述步骤3)识别出关键动作关键帧具体步骤为:
A)计算每一个视频帧图像的信息熵,记为Ii;
C)信息熵关键帧的判别。比较视频图像的第一帧I0与第一个窗口平均信息熵的相似度S,其相似度S的计算公式如式(3)所示,若相似度S不小于给定的阈值τ,则把第Ci个滑动窗口中信息熵最大的帧图像作为当前窗口的关键帧,并把该关键帧的作为新的关键帧,直至处理完所有的视频帧;反之,进入步骤D。
D)相似度小于阈值的情况,即S<τ。选取第Ci个滑动窗口中信息熵最大的帧图像作为下一个滑动窗口的起始位置,然后转步骤C。
进一步的,所述步骤4)关键帧出现规律特性的提取步骤为:
A)选取关键帧流;
B)如用自注意力机制判断关键帧的注意力最集中的位置;
C)判断关键帧图片关键位置上的信息;
D)根据上一步信息总结特殊规律。
进一步的,所述步骤5)自传输关键动作帧类型信息压缩:
A)根据传输图片的信息变化率确定一个自适应的阈值(例如5帧以内的平均信息熵的10%);
B)信息之间信息熵差大于阈值的就加高信息传输的频率;
C)信息熵差距比自适应阈值小的就压缩跳跃图片处理。
二、应用实施例。为了证明本发明的技术方案的创造性和技术价值,该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。
精尖工业和医疗等高精度低容错行业中的操作监督及误操提醒。高速运动场景分析的即时性反馈结果,可以最大化利用视频流中的少量有效帧和有效操作,强化软件整体流程的即时性和作业的精准性。减少冗余的数据操作。利用信息熵为工具压缩了工人动作图像传输数据在精细的工业流程里加一道同样精准的文件处理和传输工艺,进一步为精准高效和即时性服务。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种自适应的基于熵的快速工人动作图像传输方法,其特征在于,所述自适应的基于熵的快速工人动作图像传输方法包括以下步骤:
步骤一,分解图像,对工人动作进行识别分类;
步骤二,根据动作特性计算连续帧中的基于动作特性的信息熵大小;
步骤三,根据信息熵值的特性,识别出关键动作关键帧;
步骤四,根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;
步骤五,传输关键动作帧类型信息。
2.如权利要求1所述的自适应的基于熵的快速工人动作图像传输方法,其特征在于,所述步骤三中的识别出关键动作关键帧包括:
(1)计算每一个视频帧图像的信息熵,记为Ii;
(3)信息熵关键帧的判别;比较视频图像的第一帧I0与第一个窗口平均信息熵的相似度S,若相似度S不小于给定的阈值τ,则将第Ci个滑动窗口中信息熵最大的帧图像作为当前窗口的关键帧,并将所述关键帧的作为新的关键帧,直至处理完所有的视频帧;反之,进入步骤(4);
(4)相似度小于阈值的情况,若S<τ,则选取第Ci个滑动窗口中信息熵最大的帧图像作为下一个滑动窗口的起始位置后,转步骤(3)。
5.如权利要求1所述的自适应的基于熵的快速工人动作图像传输方法,其特征在于,所述步骤四中的关键帧出现规律特性的提取包括:
(1)选取关键帧流;
(2)利用自注意力机制判断关键帧的注意力最集中的位置;
(3)判断关键帧图片关键位置上的信息;
(4)根据步骤(3)的信息总结特殊规律。
6.如权利要求1所述的自适应的基于熵的快速工人动作图像传输方法,其特征在于,所述步骤五中的自传输关键动作帧类型信息压缩包括:
(1)根据传输图片的信息变化率确定一个自适应的阈值;
(2)信息之间信息熵差大于阈值的就加高信息传输的频率;
(3)信息熵差距比自适应阈值小的就压缩跳跃图片处理。
7.一种应用如权利要求1~6任意一项所述的自适应的基于熵的快速工人动作图像传输方法的自适应的基于熵的快速工人动作图像传输系统,其特征在于,所述自适应的基于熵的快速工人动作图像传输系统包括:
识别分类模块,用于分解图像,对工人动作进行识别分类;
信息熵计算模块,用于根据动作特性计算连续帧中的基于动作特性的信息熵大小;
关键帧识别模块,用于根据信息熵值的特性,识别出关键动作关键帧;
规律特性提取模块,用于根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;
信息传输模块,用于传输关键动作帧类型信息。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
分解图像,对工人动作进行识别分类;根据动作特性计算连续帧中的基于动作特性的信息熵大小;根据信息熵值的特性,识别出关键动作关键帧;
根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;传输关键动作帧类型信息。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
分解图像,对工人动作进行识别分类;根据动作特性计算连续帧中的基于动作特性的信息熵大小;根据信息熵值的特性,识别出关键动作关键帧;
根据基于自注意力机制的机器学习模型完成关键帧出现规律特性的提取;传输关键动作帧类型信息。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求7所述的自适应的基于熵的快速工人动作图像传输系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210427667.4A CN114979302B (zh) | 2022-04-22 | 2022-04-22 | 一种自适应的基于熵的快速工人动作图像传输方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210427667.4A CN114979302B (zh) | 2022-04-22 | 2022-04-22 | 一种自适应的基于熵的快速工人动作图像传输方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114979302A true CN114979302A (zh) | 2022-08-30 |
CN114979302B CN114979302B (zh) | 2024-07-05 |
Family
ID=82979964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210427667.4A Active CN114979302B (zh) | 2022-04-22 | 2022-04-22 | 一种自适应的基于熵的快速工人动作图像传输方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114979302B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190107894A1 (en) * | 2017-10-07 | 2019-04-11 | Tata Consultancy Services Limited | System and method for deep learning based hand gesture recognition in first person view |
CN111310659A (zh) * | 2020-02-14 | 2020-06-19 | 福州大学 | 基于增进式图卷积神经网络的人体动作识别方法 |
CN111401177A (zh) * | 2020-03-09 | 2020-07-10 | 山东大学 | 基于自适应时空注意力机制的端到端行为识别方法及系统 |
CN112446342A (zh) * | 2020-12-07 | 2021-03-05 | 北京邮电大学 | 关键帧识别模型训练方法、识别方法及装置 |
CN113688765A (zh) * | 2021-08-31 | 2021-11-23 | 南京信息工程大学 | 一种基于注意力机制的自适应图卷积网络的动作识别方法 |
CN114140875A (zh) * | 2021-11-22 | 2022-03-04 | 长江大学 | 一种基于计算机视觉识别动作组合效率分析方法 |
US11270124B1 (en) * | 2020-11-16 | 2022-03-08 | Branded Entertainment Network, Inc. | Temporal bottleneck attention architecture for video action recognition |
-
2022
- 2022-04-22 CN CN202210427667.4A patent/CN114979302B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190107894A1 (en) * | 2017-10-07 | 2019-04-11 | Tata Consultancy Services Limited | System and method for deep learning based hand gesture recognition in first person view |
CN111310659A (zh) * | 2020-02-14 | 2020-06-19 | 福州大学 | 基于增进式图卷积神经网络的人体动作识别方法 |
CN111401177A (zh) * | 2020-03-09 | 2020-07-10 | 山东大学 | 基于自适应时空注意力机制的端到端行为识别方法及系统 |
US11270124B1 (en) * | 2020-11-16 | 2022-03-08 | Branded Entertainment Network, Inc. | Temporal bottleneck attention architecture for video action recognition |
CN112446342A (zh) * | 2020-12-07 | 2021-03-05 | 北京邮电大学 | 关键帧识别模型训练方法、识别方法及装置 |
CN113688765A (zh) * | 2021-08-31 | 2021-11-23 | 南京信息工程大学 | 一种基于注意力机制的自适应图卷积网络的动作识别方法 |
CN114140875A (zh) * | 2021-11-22 | 2022-03-04 | 长江大学 | 一种基于计算机视觉识别动作组合效率分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114979302B (zh) | 2024-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Generative neural networks for anomaly detection in crowded scenes | |
US10489634B2 (en) | Image processing | |
WO2021017291A1 (zh) | 基于Darkflow-DeepSort的多目标追踪检测方法、装置及存储介质 | |
CN110633610B (zh) | 一种基于yolo的学员状态检测方法 | |
EP3376469A1 (en) | Method and device for tracking location of human face, and electronic equipment | |
CN112464807A (zh) | 视频动作识别方法、装置、电子设备和存储介质 | |
US20190050996A1 (en) | Methods and apparatus to generate temporal representations for action recognition systems | |
CN109919032A (zh) | 一种基于动作预测的视频异常行为检测方法 | |
EP3923182A1 (en) | Method for identifying a video frame of interest in a video sequence, method for generating highlights, associated systems | |
CN111027507A (zh) | 基于视频数据识别的训练数据集生成方法及装置 | |
CN112884147B (zh) | 神经网络训练方法、图像处理方法、装置及电子设备 | |
CN114049581A (zh) | 一种基于动作片段排序的弱监督行为定位方法和装置 | |
CN102314591A (zh) | 静止前景物体的检测方法和设备 | |
JP4572175B2 (ja) | 非定常映像検出装置,非定常映像検出方法及びその方法を実装したプログラム | |
CN112949401A (zh) | 图像分析方法、装置、设备及计算机存储介质 | |
WO2024103682A1 (zh) | 基于视频分类的跌倒行为识别方法及电子设备 | |
CN114979302A (zh) | 一种自适应的基于熵的快速工人动作图像传输方法及系统 | |
Liu et al. | Extensions of principle component analysis with applications on vision based computing | |
KR101362768B1 (ko) | 객체 검출 방법 및 장치 | |
CN114782860A (zh) | 一种监控视频中暴力行为检测系统及方法 | |
CN112487927B (zh) | 一种基于物体关联注意力的室内场景识别实现方法及系统 | |
JP2024516642A (ja) | 行動検出方法、電子機器およびコンピュータ読み取り可能な記憶媒体 | |
CN114694209A (zh) | 视频处理方法、装置、电子设备及计算机存储介质 | |
CN115004245A (zh) | 目标检测方法、装置、电子设备和计算机存储介质 | |
Gavade et al. | Facial Expression Recognition in Videos by learning Spatio-Temporal Features with Deep Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |