CN109117786B - 基于神经网络模型的数据处理方法、装置及可读存储介质 - Google Patents
基于神经网络模型的数据处理方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN109117786B CN109117786B CN201810903056.6A CN201810903056A CN109117786B CN 109117786 B CN109117786 B CN 109117786B CN 201810903056 A CN201810903056 A CN 201810903056A CN 109117786 B CN109117786 B CN 109117786B
- Authority
- CN
- China
- Prior art keywords
- training
- neural network
- network model
- image data
- trained
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/113—Recognition of static hand signs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Image Analysis (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供的一种基于神经网络模型的数据处理方法、装置及可读存储介质,通过建立用于识别手势的待训练的神经网络模型;根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
Description
技术领域
本发明涉及图像识别技术,尤其涉及一种基于神经网络模型的数据处理方法、装置及可读存储介质。
背景技术
手势识别广泛应用于大量应用领域中,例如,智能家电领域,监控领域等等。而利用神经网络模型对手势进行识别也成为热点技术。
一般来说,在识别之前,需要对神经网络模型进行有效训练,其中,训练数据的质量将影响着训练结果,从而影响着后续的手势识别结果。
因此,如何能够提高对用于手势识别的神经网络模型的训练质量,以使其能够更准确的识别出手势成为问题。
发明内容
针对上述提及现有的神经网络模型的训练质量不高,而影响手势识别的识别结构的准确性的问题,本申请提供了一种基于神经网络模型的数据处理方法、装置及可读存储介质。
一方面,本发明提供了一种基于神经网络模型的数据处理方法,包括:
建立用于识别手势的待训练的神经网络模型;
根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;
根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型,包括:
根据所述各训练子集的训练难度对所述各训练子集进行排序;
按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,包括:
根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的数据完整性与所述图像数据的训练难度负相关。
在其中一种可选的实施方式中,所述根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,包括:
根据预设的损失函数模型计算获得的各图像数据的损失值;
根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的损失值与所述图像数据的训练难度正相关。
另一方面,本发明提供了一种基于神经网络模型的数据处理方法,包括:
采集待识别手势数据;
采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用前述的方法获得的。
再一方面,本发明提供了一种基于神经网络模型的数据处理装置,包括:
模型建立单元,用于建立用于识别手势的待训练的神经网络模型;
数据处理单元,用于根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;
模型训练单元,用于根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述模型训练单元,具体用于:
根据所述各训练子集的训练难度对所述各训练子集进行排序;
按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述数据处理单元,具体用于:
根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的数据完整性与所述图像数据的训练难度负相关。
在其中一种可选的实施方式中,所述数据处理单元,具体用于:
根据预设的损失函数模型计算获得的各图像数据的损失值;
根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的损失值与所述图像数据的训练难度正相关。
再一方面,本发明提供了一种基于神经网络模型的数据处理装置,包括:
采集单元,用于采集待识别手势数据;
识别单元,用于采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用基于神经网络模型的数据处理方法获得的。
再一方面,本发明提供了一种基于神经网络模型的数据处理装置,包括:存储器、与所述存储器连接的处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行如前所述的方法。
最后一方面,本发明提供了一种可读存储介质,包括程序,当其在终端上运行时,使得终端执行如前所述的方法。
本发明提供的一种基于神经网络模型的数据处理方法、装置及可读存储介质,通过建立用于识别手势的待训练的神经网络模型;根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
附图说明
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
图1为现有技术的网络架构示意图;
图2为本发明实施例一提供的一种基于神经网络模型的数据处理方法的流程示意图;
图3为本发明实施例二提供的一种基于神经网络模型的数据处理方法的流程示意图;
图4为本发明实施例三提供的一种基于神经网络模型的数据处理方法的流程示意图;
图5为本发明实施例四提供的一种基于神经网络模型的数据处理装置的结构示意图;
图6为本发明实施例五提供的一种基于神经网络模型的数据处理装置的硬件结构示意图。
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
手势识别广泛应用于大量应用领域中,举例来说,在智能家电领域中,很多智能设备都可通过手势对其开机关机等功能进行操控;在监控领域中可对监控对象的手势进行识别以获取监控信息等等。而神经网络在系统辨识、模式识别、智能控制等领域有着广泛而吸引人的前景,其也被运用到的手势识别中。
在对手势识别之前,需要对构建的神经网络模型进行有效训练,其中,训练数据的质量将影响着训练结果,从而影响着后续的手势识别结果。
图1为现有技术的网络架构示意图,如图1所示,一般来说,在对神经网络模型进行有效训练之前,首先需要收集大量的训练数据,随后在将这些训练数据用于对神经网络模型的训练过程,直至得到完全收敛的训练完毕的神经网络模型。
但是,在现有技术中,这些大量的训练数据是无序的一次性的全部输入至待训练的神经网络模型中的。而由于训练数据的质量或难度的差异,采用一次把训练集均输入至待训练的神经网络模型中的方式,会使得训练后的神经网络模型的收敛仅能达到局部最优,而无法实现全局最优,训练结果受到影响。
也就是说,训练数据的质量将严重影响着神经网络模型的训练结果,从而影响着后续的手势识别结果。
针对上述提及的如何能够提高神经网络模型的训练质量的问题,本发明提供了一种基于神经网络模型的手势识别方法、装置及可读存储介质。需要说明的是,本申请提供的基于神经网络模型的手势识别方法、装置及可读存储介质可运用在广泛的需要进行手势识别的应用场景中,这些应用场景包括但不限制为:智能家电控制场景、监控中的手势识别场景等等。
图2为本发明实施例一提供的一种基于神经网络模型的数据处理方法的流程示意图。
如图2所示,该基于神经网络模型的数据处理方法包括:
步骤101、建立用于识别手势的待训练的神经网络模型。
步骤102、根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集。
步骤103、根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
需要说明的是,本发明提供的基于神经网络模型的数据处理方法的执行主体具体可为基于神经网络模型的数据处理装置,该基于神经网络模型的数据处理装置可通过硬件和/或软件的方式实现,其所采用的网络架构可为图1所示架构。一般可集成于云端服务器中,与存放有各类手势图像的数据服务器配合使用,此外,基于神经网络模型的数据处理装置所基于的服务器可与数据服务器为同一服务器,或者为隶属于同一服务器集群的不同服务器,本发明对此均不进行限制。
具体来说,本发明提供了一种基于神经网络模型的数据处理方法。首先,可建立以用户识别手势的待训练的神经网络模型,一般来说,该神经网络模型的类型包括但不限于卷积神经网络、长短期记忆神经网络、深度信念网络、生成对抗式网络、循环神经网络等等,本发明对神经网络模型的类型不进行限制,本领域技术人员可根据实际需求自行构建。
随后,在完成对神经网络模型的构建之后,本实施方式还将根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集。当然,在本实施方式中对用于对待训练的神经网络模型进行训练的图像数据的获取方式不进行限定,但是,无论是通过哪种方式获取的图像数据,在对待训练的神经网络模型进行训练之前,需要将对图像数据按照训练难度进行划分,以形成用于训练所述神经网络模型的训练集。具体来说,该训练集中可包括有多个训练子集,位于同一训练难度的图像数据将被划分至同一训练子集中,每一图像数据仅属于其中一个训练子集。进一步来说,图像数据的训练难度可采用多种方式确定,例如图像数据的完整性或图像数据的损失值等等。
当形成用于训练所述神经网络模型的训练集之后,可根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。具体来说,可首先根据各训练子集的训练难度对所述各训练子集进行排序,然后按照从易到难的顺序,将各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
通过将训练数据按照难度进行划分,并按照从易到难的顺序将各训练子集依次输入待训练的神经网络模型中,以对神经网络模型进行迭代训练,并使得训练后的神经网络模型的收敛实现全局最优,提高训练质量。
可选的,还可根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果。可知的是,在本实施方式中对待识别的图像数据的获取方式不进行限定。
本发明实施例一提供的一种基于神经网络模型的数据处理方法,通过建立用于识别手势的待训练的神经网络模型;根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
为了更好的描述基于神经网络模型的手势识别方法,在实施例一的基础上,图3为本发明实施例二提供的一种基于神经网络模型的数据处理方法的流程示意图。
如图3所示,该基于神经网络模型的数据处理方法包括:
步骤201、建立用于识别手势的待训练的神经网络模型。
步骤202、根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中,所述训练集中包括有按照数据完整性划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的数据完整性与所述图像数据的训练难度负相关。
步骤203、根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
具体来说,在实施例一的基础上,为了进一步描述本发明提供的基于神经网络模型的数据处理方法,本实施例二提供了一种基于神经网络模型的数据处理的具体实施方式。与实施例一类似的是,需要说明的是,本发明提供的基于神经网络模型的数据处理方法的执行主体具体可为基于神经网络模型的数据处理装置,该基于神经网络模型的数据处理装置可通过硬件和/或软件的方式实现。一般可集成于云端服务器中,与存放有各类手势图像的数据服务器配合使用,此外,基于神经网络模型的数据处理装置所基于的服务器可与数据服务器为同一服务器,或者为隶属于同一服务器集群的不同服务器,本发明对此均不进行限制。
具体来说,本发明提供了一种基于神经网络模型的数据处理方法。首先,可建立以用户识别手势的待训练的神经网络模型,一般来说,该神经网络模型的类型包括但不限于卷积神经网络、长短期记忆神经网络、深度信念网络、生成对抗式网络、循环神经网络等等,本发明对神经网络模型的类型不进行限制,本领域技术人员可根据实际需求自行构建。
与实施例一不同的是,本实施例二在在完成对神经网络模型的构建之后,本实施方式将根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,以形成用于训练所述神经网络模型的训练集。其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的数据完整性与所述图像数据的训练难度负相关。进一步来说,作为对手部的手势识别的神经网络模型进行训练的训练数据应为包括有手部形状或手部信息的图像,当某一图像中的手部形状不完整或手部信息不完整时,其用作对神经网络模型进行训练的训练难度将增大,即该图像对应的训练数据可被划分至难度大这一难度分类的训练数据集中。或者,当某一图像中的手部形状十分完整或手部信息十分完整时,其用作对神经网络模型进行训练的训练难度较小,即该图像对应的训练数据可被划分至难度小这一难度分类的训练数据集中。也就是说,图像数据中的手势信息的数据完整性与所述图像数据的训练难度负相关。
随后,可根据各训练子集的训练难度对所述各训练子集进行排序,然后按照从易到难的顺序,将各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。也就是说,可先将手势信息的数据完整性较高的训练子集输入至待训练的神经网络模型,最后在将将手势信息的数据完整性较低的训练子集输入至待训练的神经网络模型,从而提高神经网络模型的训练质量。
可选的,还可根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果。可知的是,在本实施方式中对待识别的图像数据的获取方式不进行限定。
本发明实施例二提供的一种基于神经网络模型的数据处理方法,通过建立用于识别手势的待训练的神经网络模型;根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中,所述训练集中包括有按照数据完整性划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的数据完整性与所述图像数据的训练难度负相关;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
为了更好的描述基于神经网络模型的数据处理方法,在实施例一的基础上,图4为本发明实施例三提供的一种基于神经网络模型的数据处理方法的流程示意图。
如图4所示,该手势识别方法包括:
步骤301、建立用于识别手势的待训练的神经网络模型。
步骤302、根据预设的损失函数模型计算获得的各图像数据的损失值;根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中,所述训练集中包括有按照损失值划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的损失值与所述图像数据的训练难度正相关。
步骤303、根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
具体来说,在实施例一的基础上,为了进一步描述本发明提供的基于神经网络模型的数据处理方法,本实施例三提供了一种基于神经网络模型的数据处理方法的具体实施方式。与实施例一类似的是,需要说明的是,本发明提供的基于神经网络模型的数据处理方法的执行主体具体可为基于神经网络模型的数据处理装置,该手势识别装置可通过硬件和/或软件的方式实现。一般可集成于云端服务器中,与存放有各类手势图像的数据服务器配合使用,此外,手势识别装置所基于的服务器可与数据服务器为同一服务器,或者为隶属于同一服务器集群的不同服务器,本发明对此均不进行限制。
具体来说,本发明提供了一种基于神经网络模型的数据处理方法。首先,可建立以用户识别手势的待训练的神经网络模型,一般来说,该神经网络模型的类型包括但不限于卷积神经网络、长短期记忆神经网络、深度信念网络、生成对抗式网络、循环神经网络等等,本发明对神经网络模型的类型不进行限制,本领域技术人员可根据实际需求自行构建。
与实施例一不同的是,本实施例三在在完成对神经网络模型的构建之后,本实施方式将根据预设的损失函数模型计算获得的各图像数据的损失值;根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集。其中,所述训练集中包括有按照损失值划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的损失值与所述图像数据的训练难度正相关。进一步来说,作为对手部的手势识别的神经网络模型进行训练的训练数据应为包括有手部形状或手部信息的图像,当某一图像中的数据噪音较大或噪点值较多时,其损失值将相应增大,其用作对神经网络模型进行训练的训练难度也将增大,即该图像对应的训练数据可被划分至难度大这一难度分类的训练数据集中。或者,当某一图像中的数据噪音较小或噪点值较晒时,其用作对神经网络模型进行训练的训练难度较小,即该图像对应的训练数据可被划分至难度小这一难度分类的训练数据集中。也就是说,图像数据的损失值与所述图像数据的训练难度正相关。
随后,可根据各训练子集的训练难度对所述各训练子集进行排序,然后按照从易到难的顺序,将各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。也就是说,可先将手势信息的数据完整性较高的训练子集输入至待训练的神经网络模型,最后在将将手势信息的数据完整性较低的训练子集输入至待训练的神经网络模型,从而提高神经网络模型的训练质量。
可选的,还可根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果。可知的是,在本实施方式中对待识别的图像数据的获取方式不进行限定。
本发明实施例三提供的一种基于神经网络模型的数据处理方法,通过建立用于识别手势的待训练的神经网络模型;根据预设的损失函数模型计算获得的各图像数据的损失值;根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中,所述训练集中包括有按照损失值划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据的损失值与所述图像数据的训练难度正相关;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
图5为本发明实施例四提供的一种基于神经网络模型的数据处理装置的结构示意图,如图5所示,该基于神经网络模型的数据处理装置包括:
模型建立单元10,用于建立用于识别手势的待训练的神经网络模型;
数据处理单元20,用于根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;
模型训练单元30,用于根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述模型训练单元30,具体用于:根据所述各训练子集的训练难度对所述各训练子集进行排序;按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
在其中一种可选的实施方式中,所述数据处理单元20,具体用于:根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的数据完整性与所述图像数据的训练难度负相关。
在其中一种可选的实施方式中,所述数据处理单元20,具体用于:根据预设的损失函数模型计算获得的各图像数据的损失值;根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集,其中所述图像数据的损失值与所述图像数据的训练难度正相关。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程以及相应的有益效果,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例四提供的基于神经网络模型的数据处理装置,通过建立用于识别手势的待训练的神经网络模型;根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集;根据各训练子集对应的训练难度,对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;根据所述训练完毕的神经网络模型对采集获得的待识别的图像数据中的手势进行识别,获得手势识别结果,从而有效提高了的神经网络模型的训练质量,进而提高了对手势的识别准确率。
图6为本发明实施例五提供的一种基于神经网络模型的数据处理装置的硬件结构示意图。如图6所示,该基于神经网络模型的数据处理装置包括:存储器41、处理器42及存储在存储器41上并可在处理器42上运行的计算机程序,处理器42运行计算机程序时执行上述任一实施例的方法。
本发明还提供了一种基于神经网络模型的数据处理方法,包括:
采集待识别手势数据;
采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用前述所述的方法获得的。
本发明还提供了一种基于神经网络模型的数据处理装置,包括:
采集单元,用于采集待识别手势数据;
识别单元,用于采用训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果;其中,所述训练完毕的神经网络模型是利用前述所述的方法获得的。
本发明还提供一种可读存储介质,包括程序,当其在终端上运行时,使得终端执行上述任一实施例的方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于神经网络模型的数据处理方法,其特征在于,包括:
建立用于识别手势的待训练的神经网络模型;
根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据所属于的训练子集是基于其图像数据的完整性或图像数据的损失值确定的,所述图像数据的数据完整性与所述图像数据的训练难度负相关,所述图像数据的损失值与所述图像数据的训练难度正相关;
根据各训练子集对应的训练难度从易到难的顺序,依次对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;
采集待识别手势数据;
采用所述训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果。
2.根据权利要求1所述的基于神经网络模型的数据处理方法,其特征在于,所述根据各训练子集对应的训练难度从易到难的顺序,依次对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型,包括:
根据所述各训练子集的训练难度对所述各训练子集进行排序;
按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
3.根据权利要求1或2所述的基于神经网络模型的数据处理方法,其特征在于,所述根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,包括:
根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集。
4.根据权利要求1或2所述的基于神经网络模型的数据处理方法,其特征在于,所述根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,包括:
根据预设的损失函数模型计算获得的各图像数据的损失值;
根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集。
5.一种基于神经网络模型的数据处理装置,其特征在于,包括:
模型建立单元,用于建立用于识别手势的待训练的神经网络模型;
数据处理单元,用于根据获得的包括手势信息的图像数据,形成用于训练所述神经网络模型的训练集,其中,所述训练集中包括有按照训练难度划分的多个训练子集,各图像数据属于其中一个训练子集,所述图像数据所属于的训练子集是基于其图像数据的完整性或图像数据的损失值确定的,所述图像数据的数据完整性与所述图像数据的训练难度负相关,所述图像数据的损失值与所述图像数据的训练难度正相关;
模型训练单元,用于根据各训练子集对应的训练难度从易到难的顺序,依次对所述待训练的神经网络模型进行多次训练,获得用于识别手势的训练完毕的神经网络模型;
采集单元,用于采集待识别手势数据;
识别单元,用于采用所述训练完毕的神经网络模型对所述待识别手势数据进行识别处理,获得待识别手势数据的识别结果。
6.根据权利要求5所述的基于神经网络模型的数据处理装置,其特征在于,所述模型训练单元,具体用于:
根据所述各训练子集的训练难度对所述各训练子集进行排序;
按照从易到难的顺序,将所述各训练子集依次输入所述待训练的神经网络模型,以对所述神经网络模型进行迭代训练并获得所述训练完毕的神经网络模型。
7.根据权利要求5或6所述的基于神经网络模型的数据处理装置,其特征在于,所述数据处理单元,具体用于:
根据获得的各图像数据的数据完整性,确定所述各图像数据的训练难度和对应的训练子集。
8.根据权利要求5或6所述的基于神经网络模型的数据处理装置,其特征在于,所述数据处理单元,具体用于:
根据预设的损失函数模型计算获得的各图像数据的损失值;
根据所述各图像数据的损失值确定所述各图像数据的训练难度和对应的训练子集。
9.一种基于神经网络模型的数据处理装置,其特征在于,包括:存储器、与所述存储器连接的处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行权利要求1-4任一项所述的方法。
10.一种可读存储介质,其特征在于,包括程序,当其在终端上运行时,使得终端执行权利要求1-4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810903056.6A CN109117786B (zh) | 2018-08-09 | 2018-08-09 | 基于神经网络模型的数据处理方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810903056.6A CN109117786B (zh) | 2018-08-09 | 2018-08-09 | 基于神经网络模型的数据处理方法、装置及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109117786A CN109117786A (zh) | 2019-01-01 |
CN109117786B true CN109117786B (zh) | 2021-11-30 |
Family
ID=64852912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810903056.6A Active CN109117786B (zh) | 2018-08-09 | 2018-08-09 | 基于神经网络模型的数据处理方法、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109117786B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255531B (zh) * | 2021-05-31 | 2021-11-09 | 腾讯科技(深圳)有限公司 | 活体检测模型的处理方法、装置、计算机设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106462801A (zh) * | 2014-10-07 | 2017-02-22 | 谷歌公司 | 在分区训练数据上训练神经网络 |
CN106650786A (zh) * | 2016-11-14 | 2017-05-10 | 沈阳工业大学 | 基于多列卷积神经网络模糊评判的图像识别方法 |
CN107346420A (zh) * | 2017-06-19 | 2017-11-14 | 中国科学院信息工程研究所 | 一种基于深度学习的自然场景下文字检测定位方法 |
CN107609495A (zh) * | 2017-08-31 | 2018-01-19 | 深圳市友信长丰科技有限公司 | 人脸识别算法的验证方法、装置、计算机设备和存储介质 |
CN107688391A (zh) * | 2017-09-01 | 2018-02-13 | 广州大学 | 一种基于单目视觉的手势识别方法和装置 |
CN107909053A (zh) * | 2017-11-30 | 2018-04-13 | 济南浪潮高新科技投资发展有限公司 | 一种基于等级学习级联卷积神经网络的人脸检测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9202464B1 (en) * | 2012-10-18 | 2015-12-01 | Google Inc. | Curriculum learning for speech recognition |
US9779492B1 (en) * | 2016-03-15 | 2017-10-03 | International Business Machines Corporation | Retinal image quality assessment, error identification and automatic quality correction |
CN107665351B (zh) * | 2017-05-06 | 2022-07-26 | 北京航空航天大学 | 基于难样本挖掘的机场检测方法 |
CN107808144A (zh) * | 2017-11-10 | 2018-03-16 | 深圳市唯特视科技有限公司 | 一种基于视频时空关系进行自我监督嵌入姿态学习方法 |
-
2018
- 2018-08-09 CN CN201810903056.6A patent/CN109117786B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106462801A (zh) * | 2014-10-07 | 2017-02-22 | 谷歌公司 | 在分区训练数据上训练神经网络 |
CN106650786A (zh) * | 2016-11-14 | 2017-05-10 | 沈阳工业大学 | 基于多列卷积神经网络模糊评判的图像识别方法 |
CN107346420A (zh) * | 2017-06-19 | 2017-11-14 | 中国科学院信息工程研究所 | 一种基于深度学习的自然场景下文字检测定位方法 |
CN107609495A (zh) * | 2017-08-31 | 2018-01-19 | 深圳市友信长丰科技有限公司 | 人脸识别算法的验证方法、装置、计算机设备和存储介质 |
CN107688391A (zh) * | 2017-09-01 | 2018-02-13 | 广州大学 | 一种基于单目视觉的手势识别方法和装置 |
CN107909053A (zh) * | 2017-11-30 | 2018-04-13 | 济南浪潮高新科技投资发展有限公司 | 一种基于等级学习级联卷积神经网络的人脸检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109117786A (zh) | 2019-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304882B (zh) | 一种图像分类方法、装置及服务器、用户终端、存储介质 | |
US10796244B2 (en) | Method and apparatus for labeling training samples | |
CN112232293B (zh) | 图像处理模型训练、图像处理方法及相关设备 | |
Chen et al. | Part-activated deep reinforcement learning for action prediction | |
CN111414987B (zh) | 神经网络的训练方法、训练装置和电子设备 | |
CN109583594B (zh) | 深度学习训练方法、装置、设备及可读存储介质 | |
CN109102017B (zh) | 神经网络模型处理方法、装置、设备及可读存储介质 | |
CN105320945A (zh) | 图像分类的方法及装置 | |
Wang et al. | Tracking by joint local and global search: A target-aware attention-based approach | |
Sagayam et al. | A probabilistic model for state sequence analysis in hidden Markov model for hand gesture recognition | |
US20160098615A1 (en) | Apparatus and method for producing image processing filter | |
CN112036261A (zh) | 手势识别方法、装置、存储介质、电子装置 | |
CN113850300A (zh) | 训练分类模型的方法和装置 | |
CN110809768B (zh) | 数据清洗系统和方法 | |
CN108520263B (zh) | 一种全景图像的识别方法、系统及计算机存储介质 | |
CN111340233A (zh) | 机器学习模型的训练方法及装置、样本处理方法及装置 | |
CN109117786B (zh) | 基于神经网络模型的数据处理方法、装置及可读存储介质 | |
CN109190757B (zh) | 任务处理方法、装置、设备及计算机可读存储介质 | |
CN114037621A (zh) | 三维轨迹平滑处理方法、装置、设备及存储介质 | |
CN109101858B (zh) | 动作识别方法及装置 | |
CN117115595A (zh) | 姿态估计模型的训练方法、装置、电子设备及存储介质 | |
CN109063561B (zh) | 公式的识别计算方法和装置 | |
CN114255219B (zh) | 征象识别方法、装置、电子设备和存储介质 | |
CN110765898A (zh) | 一种图像中物体及其关键点的确定方法和装置 | |
CN116129417A (zh) | 一种基于低质量图像的数字仪表读数检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |