CN112818936B - 一种连续手势的快速识别分类方法及系统 - Google Patents

一种连续手势的快速识别分类方法及系统 Download PDF

Info

Publication number
CN112818936B
CN112818936B CN202110229079.5A CN202110229079A CN112818936B CN 112818936 B CN112818936 B CN 112818936B CN 202110229079 A CN202110229079 A CN 202110229079A CN 112818936 B CN112818936 B CN 112818936B
Authority
CN
China
Prior art keywords
feature
fusion
execution unit
vector set
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110229079.5A
Other languages
English (en)
Other versions
CN112818936A (zh
Inventor
张旻晋
许达文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shihaixintu Microelectronics Co ltd
Original Assignee
Chengdu Shihaixintu Microelectronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shihaixintu Microelectronics Co ltd filed Critical Chengdu Shihaixintu Microelectronics Co ltd
Priority to CN202110229079.5A priority Critical patent/CN112818936B/zh
Publication of CN112818936A publication Critical patent/CN112818936A/zh
Application granted granted Critical
Publication of CN112818936B publication Critical patent/CN112818936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Multimedia (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种连续手势快速识别分类的方法及系统,包括以下步骤:采集连续手势的视频帧数据,所述视频帧数据包括多个不同的手势模型;对所述多个不同的手势模型分别进行初始特征提取,得到初始特征向量集,所述初始特征向量集包括多个不同的初始特征向量;对所述多个不同的初始特征向量分别进行单模特征映射,得到适用于特征融合的显著特征向量集,所述显著特征向量集包括多个不同的显著特征向量;对所述多个不同的显著特征向量进行特征融合,得到融合特征向量;对所述融合特征向量进行多模特征映射,生成逐帧的手势分类视频,从而实现对连续手势进行快速识别分类。

Description

一种连续手势的快速识别分类方法及系统
技术领域
本发明涉及图像快速识别技术领域,具体涉及一种连续手势的快速识别方法及系统。
背景技术
深度学习的发展使得电子设备具备语义感知能力,手势识别被广泛使用在各种领域,包括机器人,人机交互,手语识别等。大多数情况下可以使用简单的分类算法对单个手势进行实时识别分类,但是精度不高,无法满足实际应用需求。而采用复杂的网络结构进行高精度的连续手势识别,计算量非常大,难以达到实时性预测需求。
发明内容
本发明所要解决的技术问题是:对连续手势进行高精度识别分类时因计算量大,导致识别分类速度慢,难以达到实时性预测的问题;目的在于:提供一种连续手势的快速识别分类方法及系统,实现快速对连续手势进行高精度识别分类,从而达到实时性预测需求。
本发明通过下述技术方案实现:
一种连续手势的快速识别分类方法,包括:
步骤1:采集连续手势的视频帧数据,所述视频帧数据包括多个不同的手势模型;
步骤2:对所述多个不同的手势模型分别进行初始特征提取,得到初始特征向量集,所述初始特征向量集包括多个不同的初始特征向量;
步骤3:对所述多个不同的初始特征向量分别进行单模特征映射,得到适用于特征融合的显著特征向量集,所述显著特征向量集包括多个不同的显著特征向量;
步骤4:对所述多个不同的显著特征向量进行特征融合,得到融合特征向量;
步骤5:对所述融合特征向量进行多模特征映射,生成逐帧的手势分类视频。
本发明一种连续手势的快速识别分类方法的发明点在于:分步运用简单的图像处理技术,如特征提取、显著特征捕获、特征数据融合等,逐步完成从原始视频帧数据到特征数据,再到视频帧分类结果数据的快速且高精度处理,避免了直接运用复杂的网络结构对视频帧数据进行处理,从而减小了综合计算量,达到连续手势的快速实时识别分类的目的。
作为对本发明的进一步描述,步骤2中,初始特征提取的方法依次包括:卷积神经网络操作、一维卷积操作、扩张卷积操作、激活操作、一维卷积操作和dropout操作。
其中,卷积神经网络操作避免了对图像的复杂前期预处理,可以直接输入原始视频帧数据,能够有效降低反馈神经网络的复杂性,从而在初始特征提取阶段提升了对视频帧数据的处理速度;扩张卷积操作用于增加原始视频帧中多个不同手势模型的感受野,使初始特征向量具有更明显的特征,为后续的数据处理操作提供支持;drpout操作提升到了模型的泛化型,避免产生过拟合的现象,从而提高初始特征提取过程的精度。
作为对本发明的进一步描述,步骤3中,单模特征映射的方法包括一次一维卷积操作和多次扩张残差操作。其中,扩张残差操作的方法依次包括:扩张卷积操作、relu操作、一维卷积操作和dropout操作。
relu操作进一步提高了显著特征提取过程的效率。
作为对本发明的进一步描述,步骤4中,特征融合的方法为:
步骤4.1:针对所述显著特征向量集,选择出每个显著特征向量中适用于特征融合的显著特征单元,生成显著子特征向量集;
步骤4.2:对所述显著子特征向量集进行concat操作,得到显著特征数据链;
步骤4.3:对所述显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作,得到特征增强的融合特征向量。
其中,选择显著子特征向量目的在于提高显著特征数据的可靠度和准确度,可避免无用数据造成的数据冗杂,进一步提高效率;concat操作能够快速将多个显著子特征向量连接在一起;而全局平均池化操作能够淡化不同特征数据之间的相对位置的组合关系,是经过卷积神经网络的数据的准确度;矩阵乘法操作进一步提高运算速度。
作为对本发明的进一步描述,步骤5中,多模特征映射的方法为:
步骤5.1:对所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作和dropout操作,得到手势分类数据;
步骤5.2:对所述手势分类数据进行一次一维卷积操作,生成逐帧的手势分类视频。
一种连续手势的快速识别分类系统,包括:
数据接收模块:用于接收采集到的连续手势的视频帧数据;
初始特征提取模块,用于对视频帧数据进行初始特征提取,得到初始特征向量集;
单模特征映射模块,用于捕获初始特征向量集中多个不同的初始特征向量的显著特征,得到适用于特征融合的显著特征向量集;
特征融合模块,用于对显著特征向量集中多个不同的显著特征向量进行特征融合,得到融合特征向量;
多模特征映射模块,用于对融合特征向量进行计算,生成逐帧的手势分类视频。
作为对本发明的进一步描述,其中,
初始特征提取模块包括:卷积神经网络操作执行单元、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A;所述视频帧数据依次经过卷积神经网络操作执行单元A、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A处理后,得到初始特征向量集;
单模特征映射模块包括:一维卷积操作执行单元B和扩张残差操作执行单元,所述一维卷积操作执行单元B和扩张残差操作执行单元对初始特征向量集进行协同处理,得到显著特征向量集;
特征融合模块包括:特征选择单元,用于选择出每个显著特征向量中适用于特征融合的显著特征单元,生成显著子特征向量集;向量连接单元,用于将多个显著子特征向量连接在一起,得到显著特征数据链;特征增强单元,用于对显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作,得到特征增强的融合特征向量;
多模特征映射模块包括:扩张卷积操作执行单元B、激活操作执行单元B、一维卷积操作执行单元C和dropout操作执行单元B和PE阵列单元;所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作、dropout操作和一维卷积操作,得到逐帧的手势分类视频。
作为对本发明的进一步描述,扩张残差操作执行单元包括:PE阵列子单元、激活操作执行子单元和dropout操作执行子单元,用于和一维卷积操作执行单元B一起对初始特征向量集进行数据处理,得到显著特征向量集。
本发明与现有技术相比,具有如下的优点和有益效果:
1、本发明一种连续手势的快速识别分类方法,能够有效提高连续手势的识别分类效率,达到实时预测的目的;
2、本发明一种连续手势的快速识别分类方法,能在提升识别分类效率的同时也能提高识别分类的精度。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为实施例1的一种连续手势的快速识别分类方法示意图。
图2为实施例2的一种连续手势的快速识别分类系统结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例1:
大多数情况下,对单个手势进行识别分类时,可以使用简单的识别分类方法来快速实现。然而,使用简单的识别分类方法存在精度低的缺点,但采用复杂的网络结构进行高精度的连续手势识别分类,计算量非常大,难以达到实时性预测需求。为此,本实施例提出一种连续手势的快速识别分类方法,实现连续手势的快速、精确识别分类。
如图1为本实施例一种连续手势的快速识别分类方法示意图。如图1所示,该方法包括:
步骤1:利用传感器采集连续手势的视频帧数据。其中,视频帧数据包括多个不同的手势模型。传感器可以是但不限于摄像机、摄像头、激光雷达。
步骤2:对多个不同的手势模型分别进行初始特征提取,得到初始特征向量集。其中,
初始特征向量集包括多个不同的初始特征向量。在本步骤中,初始特征提取依次包括:卷积神经网络操作、一维卷积操作、扩张卷积操作、激活操作、一维卷积操作和dropout操作。其中,卷积神经网络操作可避免对图像的复杂前期预处理,可以直接输入原始视频帧数据,能够有效降低反馈神经网络的复杂性,从而在初始特征提取阶段提升了对视频帧数据的处理速度;扩张卷积操作用于增加原始视频帧中多个不同手势模型的感受野,使初始特征向量具有更明显的特征,为后续的数据处理操作提供支持;drpout操作提升到了模型的泛化型,避免产生过拟合的现象,从而提高初始特征提取过程的精度。
步骤3:对多个不同的初始特征向量分别进行单模特征映射,得到适用于特征融合的显著特征向量集。其中,显著特征向量集包括多个不同的显著特征向量。在本步骤中,单模特征映射的方法包括一次一维卷积操作和多次扩张残差操作。其中,扩张残差操作的方法依次包括:扩张卷积操作、relu操作、一维卷积操作和dropout操作。relu操作的目的是进一步提高显著特征提取过程的效率。
步骤4:对多个不同的显著特征向量进行特征融合,得到融合特征向量。在本步骤中,特征融合的方法为:
针对显著特征向量集,选择出每个显著特征向量中适用于特征融合的显著特征单元,生成显著子特征向量集;
对显著子特征向量集进行concat操作,得到显著特征数据链;
对显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作,得到特征增强的融合特征向量。
其中,选择显著子特征向量目的在于提高显著特征数据的可靠度和准确度,可避免无用数据造成的数据冗杂,进一步提高效率;concat操作能够快速将多个显著子特征向量连接在一起;而全局平均池化操作能够淡化不同特征数据之间的相对位置的组合关系,是经过卷积神经网络的数据的准确度;矩阵乘法操作进一步提高运算速度。
步骤5:对所述融合特征向量进行多模特征映射,生成逐帧的手势分类视频。在本步骤中,多模特征映射的方法具体为:
对所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作和dropout操作,得到手势分类数据;
对所述手势分类数据进行一次一维卷积操作,生成逐帧的手势分类视频。
实施例2:
图2为本实施例一种连续手势的快速识别分类系统结构框图。如图所示,该系统包括:
数据接收模块:用于接收采集到的连续手势的视频帧数据;
初始特征提取模块,用于对视频帧数据进行初始特征提取,得到初始特征向量集;
单模特征映射模块,用于捕获初始特征向量集中多个不同的初始特征向量的显著特征,得到适用于特征融合的显著特征向量集;
特征融合模块,用于对显著特征向量集中多个不同的显著特征向量进行特征融合,得到融合特征向量;
多模特征映射模块,用于对融合特征向量进行计算,生成逐帧的手势分类视频。
作为对本发明的进一步描述,其中,
初始特征提取模块包括:卷积神经网络操作执行单元、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A;所述视频帧数据依次经过卷积神经网络操作执行单元A、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A处理后,得到初始特征向量集;
单模特征映射模块包括:一维卷积操作执行单元B和扩张残差操作执行单元,所述一维卷积操作执行单元B和扩张残差操作执行单元对初始特征向量集进行协同处理,得到显著特征向量集;
特征融合模块包括:特征选择单元,用于选择出每个显著特征向量中适用于特征融合的显著特征单元,生成显著子特征向量集;向量连接单元,用于将多个显著子特征向量连接在一起,得到显著特征数据链;特征增强单元,用于对显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作,得到特征增强的融合特征向量;
多模特征映射模块包括:扩张卷积操作执行单元B、激活操作执行单元B、一维卷积操作执行单元C和dropout操作执行单元B和PE阵列单元;所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作、dropout操作和一维卷积操作,得到逐帧的手势分类视频。
作为对本发明的进一步描述,扩张残差操作执行单元包括:PE阵列子单元、激活操作执行子单元和dropout操作执行子单元,用于和一维卷积操作执行单元B一起对初始特征向量集进行数据处理,得到显著特征向量集。
当视频帧数据输入到初始特征提取模块中,通过PE阵列和加法树执行卷积操作,然后将初始特征提取模块输出的初始特征向量输入到单模特征映射模块中,在单模特征映射模块依次执行一维卷积操作和多个扩张残差操作,扩张残差操作包括依次执行扩张卷积操作、relu操作、一维卷积操作和dropout操作,接着将单模特征映射模块生成的显著特征向量作为集合输入特征融合模块,依次执行特显著子特征向量选择操作、全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作,最后将融合的特征向量输入到多模特征映射模块,依次执行多个扩张残差操作和一维卷积操作。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种连续手势的快速识别分类方法,其特征在于,包括以下步骤:
步骤1:采集连续手势的视频帧数据,所述视频帧数据包括多个不同的手势模型;
步骤2:对所述多个不同的手势模型分别进行初始特征提取,得到初始特征向量集,所述初始特征向量集包括多个不同的初始特征向量;
所述初始特征提取依次包括:卷积神经网络操作和一维卷积操作;
步骤3:对所述多个不同的初始特征向量分别进行单模特征映射,得到适用于特征融合的显著特征向量集,所述显著特征向量集包括多个不同的显著特征向量;
所述单模特征映射包括:一次一维卷积操作和多次扩张残差操作;
所述扩张残差操作包括:relu操作和一维卷积操作;
步骤4:对所述多个不同的显著特征向量进行特征融合,得到融合特征向量;所述特征融合包括:
步骤4.1:针对显著特征向量集,选择出每个显著特征向量中适用于特征融合的显著特征单元,生成显著子特征向量集;
步骤4.2:对显著子特征向量集进行concat操作,得到显著特征数据链;
步骤4.3:对显著特征数据链进行矩阵乘法操作、relu操作和sigmoid操作,得到特征增强的融合特征向量;
步骤5:对所述融合特征向量进行多模特征映射,生成逐帧的手势分类视频。
2.根据要求1所述的一种连续手势的快速识别分类方法,其特征在于,所述步骤2中,所述卷积神经网络操作和一维卷积操作之后,依次包括:扩张卷积操作、激活操作、一维卷积操作和dropout操作。
3.根据权利要求1所述的一种连续手势的快速识别分类方法,其特征在于,所述步骤3中,所述步骤所述relu操作之前,包括:扩张卷积操作;所述relu操作之后,依次包括:一维卷积操作和dropout操作。
4.根据权利要求1或2所述的一种连续手势的快速识别分类方法,其特征在于,所述步骤4.3还包括:全局平均池化操作。
5.根据权利要求4所述的一种连续手势的快速识别分类方法,其特征在于,所述多模特征映射的方法为:
步骤5.1:对所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作和dropout操作,得到手势分类数据;
步骤5.2:对所述手势分类数据进行一次一维卷积操作,生成逐帧的手势分类视频。
6.一种连续手势的快速识别分类系统,其特征在于,包括:
数据接收模块:用于接收采集到的连续手势的视频帧数据;
初始特征提取模块,用于对视频帧数据进行初始特征提取,得到初始特征向量集;
单模特征映射模块,用于捕获初始特征向量集中多个不同的初始特征向量的显著特征,得到适用于特征融合的显著特征向量集;
特征融合模块,用于对显著特征向量集中多个不同的显著特征向量进行特征融合,得到融合特征向量;
多模特征映射模块,用于对融合特征向量进行计算,生成逐帧的手势分类视频;
所述初始特征提取模块包括:
卷积神经网络操作执行单元、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A;所述视频帧数据依次经过卷积神经网络操作执行单元A、一维卷积操作执行单元A、扩张卷积操作执行单元A、激活操作执行单元A和dropout操作执行单元A处理后,得到初始特征向量集;
所述单模特征映射模块包括:
一维卷积操作执行单元B和扩张残差操作执行单元,所述一维卷积操作执行单元B和扩张残差操作执行单元对初始特征向量集进行协同处理,得到显著特征向量集;
所述特征融合模块包括:
特征选择单元,用于选择出每个显著特征向量中适用于特征融合的显著特征单元,生成显著子特征向量集;
向量连接单元,用于将多个显著子特征向量连接在一起,得到显著特征数据链;
特征增强单元,用于对显著特征数据链进行全局平均池化操作、矩阵乘法操作、relu操作、矩阵乘法操作和sigmoid操作,得到特征增强的融合特征向量;
所述多模特征映射模块包括:
扩张卷积操作执行单元B、激活操作执行单元B、一维卷积操作执行单元C和dropout操作执行单元B和PE阵列单元;所述融合特征向量依次进行扩张卷积操作、激活操作、一维卷积操作、dropout操作和一维卷积操作,得到逐帧的手势分类视频;
所述扩张残差操作执行单元包括:PE阵列子单元、激活操作执行子单元和dropout操作执行子单元,用于和一维卷积操作执行单元B一起对初始特征向量集进行数据处理,得到显著特征向量集。
CN202110229079.5A 2021-03-02 2021-03-02 一种连续手势的快速识别分类方法及系统 Active CN112818936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110229079.5A CN112818936B (zh) 2021-03-02 2021-03-02 一种连续手势的快速识别分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110229079.5A CN112818936B (zh) 2021-03-02 2021-03-02 一种连续手势的快速识别分类方法及系统

Publications (2)

Publication Number Publication Date
CN112818936A CN112818936A (zh) 2021-05-18
CN112818936B true CN112818936B (zh) 2022-12-09

Family

ID=75862650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110229079.5A Active CN112818936B (zh) 2021-03-02 2021-03-02 一种连续手势的快速识别分类方法及系统

Country Status (1)

Country Link
CN (1) CN112818936B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932500A (zh) * 2018-07-09 2018-12-04 广州智能装备研究院有限公司 一种基于深度神经网络的动态手势识别方法及系统
CN109271840A (zh) * 2018-07-25 2019-01-25 西安电子科技大学 一种视频手势分类方法
CN109961005A (zh) * 2019-01-28 2019-07-02 山东大学 一种基于二维卷积网络的动态手势识别方法及系统
CN110472506A (zh) * 2019-07-11 2019-11-19 广东工业大学 一种基于支持向量机和神经网络优化的手势识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10061389B2 (en) * 2014-06-03 2018-08-28 Beijing TransBorder Information Technology Co., Ltd. Gesture recognition system and gesture recognition method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932500A (zh) * 2018-07-09 2018-12-04 广州智能装备研究院有限公司 一种基于深度神经网络的动态手势识别方法及系统
CN109271840A (zh) * 2018-07-25 2019-01-25 西安电子科技大学 一种视频手势分类方法
CN109961005A (zh) * 2019-01-28 2019-07-02 山东大学 一种基于二维卷积网络的动态手势识别方法及系统
CN110472506A (zh) * 2019-07-11 2019-11-19 广东工业大学 一种基于支持向量机和神经网络优化的手势识别方法

Also Published As

Publication number Publication date
CN112818936A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
US11281945B1 (en) Multimodal dimensional emotion recognition method
Li et al. A deep learning-based hybrid framework for object detection and recognition in autonomous driving
CN110427867B (zh) 基于残差注意力机制的面部表情识别方法及系统
CN109740534B (zh) 图像处理方法、装置及处理设备
JP7425147B2 (ja) 画像処理方法、テキスト認識方法及び装置
JP7286013B2 (ja) ビデオコンテンツ認識方法、装置、プログラム及びコンピュータデバイス
CN110674741A (zh) 一种基于双通道特征融合的机器视觉中手势识别方法
EP4191471A1 (en) Sequence recognition method and apparatus, image processing device, and storage medium
CN112149694B (zh) 一种基于卷积神经网络池化模块的图像处理方法、系统、存储介质及终端
CN112926462B (zh) 训练方法、装置、动作识别方法、装置及电子设备
CN113536999A (zh) 人物情绪识别方法、系统、介质及电子设备
JP2022110132A (ja) 陳列シーン認識方法、モデルトレーニング方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US20230020965A1 (en) Method and apparatus for updating object recognition model
CN114359554A (zh) 一种基于多感受野上下文语义信息的图像语义分割方法
Benhamida et al. Traffic Signs Recognition in a mobile-based application using TensorFlow and Transfer Learning technics
CN117953581A (zh) 动作识别的方法、装置、电子设备及可读存储介质
CN111143544B (zh) 一种基于神经网络的柱形图信息提取方法及装置
CN112818936B (zh) 一种连续手势的快速识别分类方法及系统
CN111985549A (zh) 针对给定刚体目标进行部件自动定位识别的深度学习方法
CN117079305A (zh) 姿态估计方法、姿态估计装置以及计算机可读存储介质
US11227186B2 (en) Method and device for training image recognition model and related device
WO2020237674A1 (zh) 目标跟踪方法、目标跟踪装置和无人机
CN112016571A (zh) 一种基于注意力机制的特征提取方法、装置及电子设备
CN118673465B (zh) 一种开放词汇目标检测方法、系统、设备及介质
CN117011683A (zh) 多尺度包裹检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant