CN109117786A - 基于神经网络模型的数据处理方法、装置及可读存储介质 - Google Patents

基于神经网络模型的数据处理方法、装置及可读存储介质 Download PDF

Info

Publication number
CN109117786A
CN109117786A CN201810903056.6A CN201810903056A CN109117786A CN 109117786 A CN109117786 A CN 109117786A CN 201810903056 A CN201810903056 A CN 201810903056A CN 109117786 A CN109117786 A CN 109117786A
Authority
CN
China
Prior art keywords
training
neural network
network model
image data
gesture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810903056.6A
Other languages
English (en)
Other versions
CN109117786B (zh
Inventor
杨少雄
赵晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810903056.6A priority Critical patent/CN109117786B/zh
Publication of CN109117786A publication Critical patent/CN109117786A/zh
Application granted granted Critical
Publication of CN109117786B publication Critical patent/CN109117786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • G06V40/113Recognition of static hand signs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供的一种基于神经网络模型的数据处理方法、装置及可读存储介质,通过建立用于识别手势的待训练的神经网络模型;根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。

Description

基于神经网络模型的数据处理方法、装置及可读存储介质
技术领域
本发明涉及图像识别技术,尤其涉及一种基于神经网络模型的数据处理方法、装置及可读存储介质。
背景技术
手势识别广泛应用于大量应用领域中,例如,智能家电领域,监控领域等等。而利用神经网络模型对手势进行识别也成为热点技术。
一般来说,在识别之前,需要对神经网络模型进行有效训练,其中,训练数据的质量将影响着训练结果,从而影响着后续的手势识别结果。
因此,如何能够提高对用于手势识别的神经网络模型的训练质量,以使其能够更准确的识别出手势成为问题。
发明内容
针对上述提及现有的神经网络模型的训练质量不高,而影响手势识别的识别结构的准确性的问题,本申请提供了一种基于神经网络模型的数据处理方法、装置及可读存储介质。
一方面,本发明提供了一种基于神经网络模型的数据处理方法,包括:
建立用于识别手势的待训练的神经网络模型;
根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;
根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型,包括:
根据所述各训练子集的训练难度对所述各训练子集进行排序;
按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,包括:
根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的数据完整性与所述图像数据的训练难度负相关。
在其中一种可选的实施方式中,所述根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,包括:
根据预设的损失函数模型计算获得的各图像数据的损失值;
根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的损失值与所述图像数据的训练难度正相关。
另一方面,本发明提供了一种基于神经网络模型的数据处理方法,包括:
采集待识别手势数据;
采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用前述任一项所述的方法获得的。
再一方面,本发明提供了一种基于神经网络模型的数据处理装置,包括:
模型建立单元,用于建立用于识别手势的待训练的神经网络模型;
数据处理单元,用于根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;
模型训练单元,用于根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述模型训练单元,具体用于:
根据所述各训练子集的训练难度对所述各训练子集进行排序;
按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述数据处理单元,具体用于:
根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的数据完整性与所述图像数据的训练难度负相关。
在其中一种可选的实施方式中,所述数据处理单元,具体用于:
根据预设的损失函数模型计算获得的各图像数据的损失值;
根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的损失值与所述图像数据的训练难度正相关。
再一方面,本发明提供了一种基于神经网络模型的数据处理装置,包括:
采集单元,用于采集待识别手势数据;
识别单元,用于采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用权利要求1-4任一项所述的方法获得的。
再一方面,本发明提供了一种基于神经网络模型的数据处理装置,包括:存储器、与所述存储器连接的处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,
所述处理器运行所述计算机程序时执行如前任一项所述的方法。
最后一方面,本发明提供了一种可读存储介质,包括程序,当其在终端上运行时,使得终端执行如前任一项所述的方法。
本发明提供的一种基于神经网络模型的数据处理方法、装置及可读存储介质,通过建立用于识别手势的待训练的神经网络模型;根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
附图说明
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
图1为现有技术的网络架构示意图;
图2为本发明实施例一提供的一种基于神经网络模型的数据处理方法的流程示意图;
图3为本发明实施例二提供的一种基于神经网络模型的数据处理方法的流程示意图;
图4为本发明实施例三提供的一种基于神经网络模型的数据处理方法的流程示意图;
图5为本发明实施例四提供的一种基于神经网络模型的数据处理装置的结构示意图;
图6为本发明实施例五提供的一种基于神经网络模型的数据处理装置的硬件结构示意图。
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
手势识别广泛应用于大量应用领域中,举例来说,在智能家电领域中,很多智能设备都可通过手势对其开机关机等功能进行操控;在监控领域中可对监控对象的手势进行识别以获取监控信息等等。而神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景,其也被运用到的手势识别中。
在对手势识别之前,需要对构建的神经网络模型进行有效训练,其中,训练数据的质量将影响着训练结果,从而影响着后续的手势识别结果。
图1为现有技术的网络架构示意图,如图1所示,一般来说,在对神经网络模型进行有效训练之前,首先需要收集大量的训练数据,随后在将这些训练数据用于对神经网络模型的训练过程,直至得到完全收敛的训练完毕的神经网络模型。
但是,在现有技术中,这些大量的训练数据是无序的一次性的全部输入至待训练的神经网络模型中的。而由于训练数据的质量或难度的差异,采用一次把训练集均输入至待训练的神经网络模型中的方式,会使得训练后的神经网络模型的收敛仅能达到局部最优,而无法实现全局最优,训练结果受到影响。
也就是说,训练数据的质量将严重影响着神经网络模型的训练结果,从而影响着后续的手势识别结果。
针对上述提及的如何能够提高神经网络模型的训练质量的问题,本发明提供了一种基于神经网络模型的手势识别方法、装置及可读存储介质。需要说明的是,本申请提供的基于神经网络模型的手势识别方法、装置及可读存储介质可运用在广泛的需要进行手势识别的应用场景中,这些应用场景包括但不限制为:智能家电控制场景、监控中的手势识别场景等等。
图2为本发明实施例一提供的一种基于神经网络模型的数据处理方法的流程示意图。
如图2所示,该基于神经网络模型的数据处理方法包括:
步骤101、建立用于识别手势的待训练的神经网络模型。
步骤102、根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集。
步骤103、根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
需要说明的是,本发明提供的基于神经网络模型的数据处理方法的执行主体具体可为基于神经网络模型的数据处理装置,该基于神经网络模型的数据处理装置可通过硬件和/或软件的方式实现,其所采用的网络架构可为图1所示架构。一般可集成于云端服务器中,与存放有各类手势图像的数据服务器配合使用,此外,基于神经网络模型的数据处理装置所基于的服务器可与数据服务器为同一服务器,或者为隶属于同一服务器集群的不同服务器,本发明对此均不进行限制。
具体来说,本发明提供了一种基于神经网络模型的数据处理方法。首先,可建立以用户识别手势的待训练的神经网络模型,一般来说,该神经网络模型的类型包括但不限于卷积神经网络、长短期记忆神经网络、深度信念网络、生成对抗式网络、循环神经网络等等,本发明对神经网络模型的类型不进行限制,本领域技术人员可根据实际需求自行构建。
随后,在完成对神经网络模型的构建之后,本实施方式还将根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集。当然,在本实施方式中对用于对待训练的神经网络模型进行训练的图像数据的获取方式不进行限定,但是,无论是通过哪种方式获取的图像数据,在对待训练的神经网络模型进行训练之前,需要将对图像数据按照训练难度进行划分,以形成用于训练所述神经网络模型的训练集。具体来说,该训练集中可包括有多个训练子集,位于同一训练难度的图像数据将被划分至同一训练子集中,每一图像数据仅属于其中一个训练子集。进一步来说,图像数据的训练难度可采用多种方式确定,例如图像数据的完整性或图像数据的损失值等等。
当形成用于训练所述神经网络模型的训练集之后,可根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。具体来说,可首先根据各训练子集的训练难度对所述各训练子集进行排序,然后按照从易到难的顺序,将各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
通过将训练数据按照难度进行划分,并按照从易到难的顺序将各训练子集依次输入待训练的神经网络模型中,以对神经网络模型进行迭代训练,并使得训练后的神经网络模型的收敛实现全局最优,提高训练质量。
可选的,还可根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果。可知的是,在本实施方式中对待识别的图像数据的获取方式不进行限定。
本发明实施例一提供的一种基于神经网络模型的数据处理方法,通过建立用于识别手势的待训练的神经网络模型;根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
为了更好的描述基于神经网络模型的手势识别方法,在实施例一的基础上,图3为本发明实施例二提供的一种基于神经网络模型的数据处理方法的流程示意图。
如图3所示,该基于神经网络模型的数据处理方法包括:
步骤201、建立用于识别手势的待训练的神经网络模型。
步骤202、根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中,所述训练集中包括有按照数据完整性划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的数据完整性与所述图像数据的训练难度负相关。
步骤203、根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
具体来说,在实施例一的基础上,为了进一步描述本发明提供的基于神经网络模型的数据处理方法,本实施例二提供了一种基于神经网络模型的数据处理的具体实施方式。与实施例一类似的是,需要说明的是,本发明提供的基于神经网络模型的数据处理方法的执行主体具体可为基于神经网络模型的数据处理装置,该基于神经网络模型的数据处理装置可通过硬件和/或软件的方式实现。一般可集成于云端服务器中,与存放有各类手势图像的数据服务器配合使用,此外,基于神经网络模型的数据处理装置所基于的服务器可与数据服务器为同一服务器,或者为隶属于同一服务器集群的不同服务器,本发明对此均不进行限制。
具体来说,本发明提供了一种基于神经网络模型的数据处理方法。首先,可建立以用户识别手势的待训练的神经网络模型,一般来说,该神经网络模型的类型包括但不限于卷积神经网络、长短期记忆神经网络、深度信念网络、生成对抗式网络、循环神经网络等等,本发明对神经网络模型的类型不进行限制,本领域技术人员可根据实际需求自行构建。
与实施例一不同的是,本实施例二在在完成对神经网络模型的构建之后,本实施方式将根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,以形成用于训练所述神经网络模型的训练集。其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的数据完整性与所述图像数据的训练难度负相关。进一步来说,作为对手部的手势识别的神经网络模型进行训练的训练数据应为包括有手部形状或手部信息的图像,当某一图像中的手部形状不完整或手部信息不完整时,其用作对神经网络模型进行训练的训练难度将增大,即该图像对应的训练数据可被划分至难度大这一难度分类的训练数据集中。或者,当某一图像中的手部形状十分完整或手部信息十分完整时,其用作对神经网络模型进行训练的训练难度较小,即该图像对应的训练数据可被划分至难度小这一难度分类的训练数据集中。也就是说,图像数据中的手势信息的数据完整性与所述图像数据的训练难度负相关。
随后,可根据各训练子集的训练难度对所述各训练子集进行排序,然后按照从易到难的顺序,将各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。也就是说,可先将手势信息的数据完整性较高的训练子集输入至待训练的神经网络模型,最后在将将手势信息的数据完整性较低的训练子集输入至待训练的神经网络模型,从而提高神经网络模型的训练质量。
可选的,还可根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果。可知的是,在本实施方式中对待识别的图像数据的获取方式不进行限定。
本发明实施例二提供的一种基于神经网络模型的数据处理方法,通过建立用于识别手势的待训练的神经网络模型;根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中,所述训练集中包括有按照数据完整性划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的数据完整性与所述图像数据的训练难度负相关;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
为了更好的描述基于神经网络模型的数据处理方法,在实施例一的基础上,图4为本发明实施例三提供的一种基于神经网络模型的数据处理方法的流程示意图。
如图4所示,该手势识别方法包括:
步骤301、建立用于识别手势的待训练的神经网络模型。
步骤302、根据预设的损失函数模型计算获得的各图像数据的损失值;根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中,所述训练集中包括有按照损失值划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的损失值与所述图像数据的训练难度正相关。
步骤303、根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
具体来说,在实施例一的基础上,为了进一步描述本发明提供的基于神经网络模型的数据处理方法,本实施例三提供了一种基于神经网络模型的数据处理方法的具体实施方式。与实施例一类似的是,需要说明的是,本发明提供的基于神经网络模型的数据处理方法的执行主体具体可为基于神经网络模型的数据处理装置,该手势识别装置可通过硬件和/或软件的方式实现。一般可集成于云端服务器中,与存放有各类手势图像的数据服务器配合使用,此外,手势识别装置所基于的服务器可与数据服务器为同一服务器,或者为隶属于同一服务器集群的不同服务器,本发明对此均不进行限制。
具体来说,本发明提供了一种基于神经网络模型的数据处理方法。首先,可建立以用户识别手势的待训练的神经网络模型,一般来说,该神经网络模型的类型包括但不限于卷积神经网络、长短期记忆神经网络、深度信念网络、生成对抗式网络、循环神经网络等等,本发明对神经网络模型的类型不进行限制,本领域技术人员可根据实际需求自行构建。
与实施例一不同的是,本实施例三在在完成对神经网络模型的构建之后,本实施方式将根据预设的损失函数模型计算获得的各图像数据的损失值;根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集。其中,所述训练集中包括有按照损失值划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的损失值与所述图像数据的训练难度正相关。进一步来说,作为对手部的手势识别的神经网络模型进行训练的训练数据应为包括有手部形状或手部信息的图像,当某一图像中的数据噪音较大或噪点值较多时,其损失值将相应增大,其用作对神经网络模型进行训练的训练难度也将增大,即该图像对应的训练数据可被划分至难度大这一难度分类的训练数据集中。或者,当某一图像中的数据噪音较小或噪点值较晒时,其用作对神经网络模型进行训练的训练难度较小,即该图像对应的训练数据可被划分至难度小这一难度分类的训练数据集中。也就是说,图像数据的损失值与所述图像数据的训练难度正相关。
随后,可根据各训练子集的训练难度对所述各训练子集进行排序,然后按照从易到难的顺序,将各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。也就是说,可先将手势信息的数据完整性较高的训练子集输入至待训练的神经网络模型,最后在将将手势信息的数据完整性较低的训练子集输入至待训练的神经网络模型,从而提高神经网络模型的训练质量。
可选的,还可根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果。可知的是,在本实施方式中对待识别的图像数据的获取方式不进行限定。
本发明实施例三提供的一种基于神经网络模型的数据处理方法,通过建立用于识别手势的待训练的神经网络模型;根据预设的损失函数模型计算获得的各图像数据的损失值;根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中,所述训练集中包括有按照损失值划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的损失值与所述图像数据的训练难度正相关;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
图5为本发明实施例四提供的一种基于神经网络模型的数据处理装置的结构示意图,如图5所示,该基于神经网络模型的数据处理装置包括:
模型建立单元10,用于建立用于识别手势的待训练的神经网络模型;
数据处理单元20,用于根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;
模型训练单元30,用于根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述模型训练单元30,具体用于:根据所述各训练子集的训练难度对所述各训练子集进行排序;按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述数据处理单元20,具体用于:根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的数据完整性与所述图像数据的训练难度负相关。
在其中一种可选的实施方式中,所述数据处理单元20,具体用于:根据预设的损失函数模型计算获得的各图像数据的损失值;根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的损失值与所述图像数据的训练难度正相关。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程以及相应的有益效果,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例四提供的基于神经网络模型的数据处理装置,通过建立用于识别手势的待训练的神经网络模型;根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
图6为本发明实施例五提供的一种基于神经网络模型的数据处理装置的硬件结构示意图。如图6所示,该基于神经网络模型的数据处理装置包括:存储器41、处理器42及存储在存储器41上并可在处理器42上运行的计算机程序,处理器42运行计算机程序时执行上述任一实施例的方法。
本发明还提供了一种基于神经网络模型的数据处理方法,包括:
采集待识别手势数据;
采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用前述任一项所述的方法获得的。
本发明还提供了一种基于神经网络模型的数据处理装置,包括:
采集单元,用于采集待识别手势数据;
识别单元,用于采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用前述任一项所述的方法获得的。
本发明还提供一种可读存储介质,包括程序,当其在终端上运行时,使得终端执行上述任一实施例的方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (12)

1.一种基于神经网络模型的数据处理方法,其特征在于,包括:
建立用于识别手势的待训练的神经网络模型;
根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;
根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
2.根据权利要求1所述的基于神经网络模型的数据处理方法,其特征在于,所述根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型,包括:
根据所述各训练子集的训练难度对所述各训练子集进行排序;
按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
3.根据权利要求1或2所述的基于神经网络模型的数据处理方法法,其特征在于,所述根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,包括:
根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的数据完整性与所述图像数据的训练难度负相关。
4.根据权利要求1或2所述的基于神经网络模型的数据处理方法,其特征在于,所述根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,包括:
根据预设的损失函数模型计算获得的各图像数据的损失值;
根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的损失值与所述图像数据的训练难度正相关。
5.一种基于神经网络模型的数据处理方法,其特征在于,包括:
采集待识别手势数据;
采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用权利要求1-4任一项所述的方法获得的。
6.一种基于神经网络模型的数据处理装置,其特征在于,包括:
模型建立单元,用于建立用于识别手势的待训练的神经网络模型;
数据处理单元,用于根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;
模型训练单元,用于根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
7.根据权利要求6所述的基于神经网络模型的数据处理装置,其特征在于,所述模型训练单元,具体用于:
根据所述各训练子集的训练难度对所述各训练子集进行排序;
按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
8.根据权利要求6或7所述的基于神经网络模型的数据处理装置,其特征在于,所述数据处理单元,具体用于:
根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的数据完整性与所述图像数据的训练难度负相关。
9.根据权利要求6或7所述的基于神经网络模型的数据处理装置,其特征在于,所述数据处理单元,具体用于:
根据预设的损失函数模型计算获得的各图像数据的损失值;
根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的损失值与所述图像数据的训练难度正相关。
10.一种基于神经网络模型的数据处理装置,其特征在于,包括:
采集单元,用于采集待识别手势数据;
识别单元,用于采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用权利要求1-4任一项所述的方法获得的。
11.一种基于神经网络模型的数据处理装置,其特征在于,包括:存储器、与所述存储器连接的处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,
所述处理器运行所述计算机程序时执行权利要求1-5任一项所述的方法。
12.一种可读存储介质,其特征在于,包括程序,当其在终端上运行时,使得终端执行权利要求1-5任一项所述的方法。
CN201810903056.6A 2018-08-09 2018-08-09 基于神经网络模型的数据处理方法、装置及可读存储介质 Active CN109117786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810903056.6A CN109117786B (zh) 2018-08-09 2018-08-09 基于神经网络模型的数据处理方法、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810903056.6A CN109117786B (zh) 2018-08-09 2018-08-09 基于神经网络模型的数据处理方法、装置及可读存储介质

Publications (2)

Publication Number Publication Date
CN109117786A true CN109117786A (zh) 2019-01-01
CN109117786B CN109117786B (zh) 2021-11-30

Family

ID=64852912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810903056.6A Active CN109117786B (zh) 2018-08-09 2018-08-09 基于神经网络模型的数据处理方法、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN109117786B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255531A (zh) * 2021-05-31 2021-08-13 腾讯科技(深圳)有限公司 活体检测模型的处理方法、装置、计算机设备和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9202464B1 (en) * 2012-10-18 2015-12-01 Google Inc. Curriculum learning for speech recognition
CN106462801A (zh) * 2014-10-07 2017-02-22 谷歌公司 在分区训练数据上训练神经网络
CN106650786A (zh) * 2016-11-14 2017-05-10 沈阳工业大学 基于多列卷积神经网络模糊评判的图像识别方法
US20170270653A1 (en) * 2016-03-15 2017-09-21 International Business Machines Corporation Retinal image quality assessment, error identification and automatic quality correction
CN107346420A (zh) * 2017-06-19 2017-11-14 中国科学院信息工程研究所 一种基于深度学习的自然场景下文字检测定位方法
CN107609495A (zh) * 2017-08-31 2018-01-19 深圳市友信长丰科技有限公司 人脸识别算法的验证方法、装置、计算机设备和存储介质
CN107665351A (zh) * 2017-05-06 2018-02-06 北京航空航天大学 基于难样本挖掘的机场检测方法
CN107688391A (zh) * 2017-09-01 2018-02-13 广州大学 一种基于单目视觉的手势识别方法和装置
CN107808144A (zh) * 2017-11-10 2018-03-16 深圳市唯特视科技有限公司 一种基于视频时空关系进行自我监督嵌入姿态学习方法
CN107909053A (zh) * 2017-11-30 2018-04-13 济南浪潮高新科技投资发展有限公司 一种基于等级学习级联卷积神经网络的人脸检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9202464B1 (en) * 2012-10-18 2015-12-01 Google Inc. Curriculum learning for speech recognition
CN106462801A (zh) * 2014-10-07 2017-02-22 谷歌公司 在分区训练数据上训练神经网络
US20170270653A1 (en) * 2016-03-15 2017-09-21 International Business Machines Corporation Retinal image quality assessment, error identification and automatic quality correction
CN106650786A (zh) * 2016-11-14 2017-05-10 沈阳工业大学 基于多列卷积神经网络模糊评判的图像识别方法
CN107665351A (zh) * 2017-05-06 2018-02-06 北京航空航天大学 基于难样本挖掘的机场检测方法
CN107346420A (zh) * 2017-06-19 2017-11-14 中国科学院信息工程研究所 一种基于深度学习的自然场景下文字检测定位方法
CN107609495A (zh) * 2017-08-31 2018-01-19 深圳市友信长丰科技有限公司 人脸识别算法的验证方法、装置、计算机设备和存储介质
CN107688391A (zh) * 2017-09-01 2018-02-13 广州大学 一种基于单目视觉的手势识别方法和装置
CN107808144A (zh) * 2017-11-10 2018-03-16 深圳市唯特视科技有限公司 一种基于视频时空关系进行自我监督嵌入姿态学习方法
CN107909053A (zh) * 2017-11-30 2018-04-13 济南浪潮高新科技投资发展有限公司 一种基于等级学习级联卷积神经网络的人脸检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEN-WENYEN等: "A training sample sequence planning method for pattern recognition problems", 《AUTOMATICA》 *
邹国锋等: "自适应深度卷积神经网络模型构建方法", 《北京邮电大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255531A (zh) * 2021-05-31 2021-08-13 腾讯科技(深圳)有限公司 活体检测模型的处理方法、装置、计算机设备和存储介质
CN113255531B (zh) * 2021-05-31 2021-11-09 腾讯科技(深圳)有限公司 活体检测模型的处理方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN109117786B (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN106951468B (zh) 对话生成方法及装置
CN109117897A (zh) 基于卷积神经网络的图像处理方法、装置及可读存储介质
CN110852448A (zh) 一种基于多智能体强化学习的合作型智能体的学习方法
CN112801290B (zh) 一种多智能体深度强化学习方法、系统及应用
CN112215364B (zh) 一种基于强化学习的敌-友深度确定性策略方法及系统
CN109242001A (zh) 图像数据处理方法、装置及可读存储介质
CN106796533A (zh) 自适应地选择执行模式的系统和方法
CN110442700A (zh) 用于人机交互的人机多轮对话方法及系统、智能设备
CN107945210A (zh) 基于深度学习和环境自适应的目标跟踪算法
CN106503043A (zh) 一种用于智能机器人的交互数据处理方法
CN108960412A (zh) 图像识别方法、装置及计算机可读存储介质
CN112801019B (zh) 基于合成数据消除无监督车辆再识别偏差的方法及系统
CN109190504A (zh) 汽车图像数据的处理方法、装置及可读存储介质
CN110533184B (zh) 一种网络模型的训练方法及装置
CN114333062B (zh) 基于异构双网络和特征一致性的行人重识别模型训练方法
CN108898076A (zh) 一种视频行为时间轴定位及候选框提取的方法
Zhou et al. Tigan: Text-based interactive image generation and manipulation
CN109117786A (zh) 基于神经网络模型的数据处理方法、装置及可读存储介质
Gupta et al. Tackling occlusion in Siamese tracking with structured dropouts
CN111160170B (zh) 一种自学习的人体行为识别与异常检测方法
CN109101858A (zh) 动作识别方法及装置
CN111144497B (zh) 基于美学分析的多任务深度网络下的图像显著性预测方法
CN112733552A (zh) 机器翻译模型构建方法、装置以及设备
Huang et al. Improved action-decision network for visual tracking with meta-learning
CN111126617B (zh) 一种选择融合模型权重参数的方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant