CN111539357B - 人体识别模型及其训练方法、系统、存储介质及设备 - Google Patents

人体识别模型及其训练方法、系统、存储介质及设备 Download PDF

Info

Publication number
CN111539357B
CN111539357B CN202010347345.XA CN202010347345A CN111539357B CN 111539357 B CN111539357 B CN 111539357B CN 202010347345 A CN202010347345 A CN 202010347345A CN 111539357 B CN111539357 B CN 111539357B
Authority
CN
China
Prior art keywords
human body
training
recognition model
rotation
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010347345.XA
Other languages
English (en)
Other versions
CN111539357A (zh
Inventor
董健
李帅
丁明旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruimo Intelligent Technology Shenzhen Co ltd
Original Assignee
Ruimo Intelligent Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruimo Intelligent Technology Shenzhen Co ltd filed Critical Ruimo Intelligent Technology Shenzhen Co ltd
Priority to CN202010347345.XA priority Critical patent/CN111539357B/zh
Publication of CN111539357A publication Critical patent/CN111539357A/zh
Application granted granted Critical
Publication of CN111539357B publication Critical patent/CN111539357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开人体识别模型及其训练方法、系统、存储介质及设备。该人体识别模型的训练方法包括:A、从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,并将其调整为预设大小;B、对调整后的训练样本图像进行翻转处理和旋转处理;C、从预置旋转范围内随机选取一旋转角度对步骤B得到的图像进行旋转;D、卷积神经网络对步骤C得到的图像进行相应于步骤B的旋转处理的逆向操作,获取图像中的人体特征;E、利用损失函数计算损失梯度;根据损失梯度更新卷积神经网络的参数;F、重复步骤B~E,直至损失函数收敛。通过本发明的人体识别模型的训练方法得到的人体识别模型能够对倒立、弯身等非人体直立情况下的人体识别具有更高的识别率。

Description

人体识别模型及其训练方法、系统、存储介质及设备
技术领域
本发明实施例涉及人体识别技术领域,尤其涉及一种人体识别模型及其训练方法、系统、存储介质及设备。
背景技术
人体识别在视频监控、视频/图像搜索、人体跟踪等领域具有广泛的应用。在视频监控中主要的研究为行人重识别,目前最有效的行人重识别算法是基于深度卷积神经网络的识别算法,但是现有技术中的行人重识别的算法只考虑人体直立情况下的人体识别,对于倒立、弯身等人体非直立姿态下的识别效果差,远远不能满足人体搜索、人体跟踪等需求。因此提供一种对人体非直立姿态仍具有高识别效率的人体识别模型是我们急需解决的技术问题。
发明内容
本发明提供一种人体识别模型及其训练方法、系统、存储介质及设备,以使通过该人体识别模型训练方法训练得到的人体识别模型能够对倒立、弯身等非人体直立姿态的人体识别具有更高的识别率。
第一方面,本发明提供了一种人体识别模型的训练方法,该人体识别模型的训练方法包括:
A、从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,将所述训练样本图像的大小调整为预设大小;
B、对调整后的训练样本图像进行翻转处理和旋转处理;
C、从预置旋转范围内随机选取一旋转角度对步骤B得到的图像进行旋转;
D、卷积神经网络对步骤C得到的图像进行相应于步骤B的旋转处理的逆向操作,通过横向取均值的方式获取图像中的人体特征;
E、利用损失函数计算所述人体特征的损失梯度,根据所述损失梯度更新卷积神经网络的参数;
F、重复步骤B~E,直至损失函数收敛,得到基于卷积神经网络的人体识别模型。
第二方面,本发明还提供了一种人体识别模型的训练系统,该人体识别模型的训练系统包括:
样本筛选模块,用于从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,将所述训练样本图像的大小调整为预设大小;
处理模块,用于对调整后的训练样本图像进行翻转处理和旋转处理;
旋转模块,用于从预置旋转范围内随机选取一旋转角度对处理模块得到的图像进行旋转;
逆向操作模块,用于对旋转模块得到的图像进行相应于处理模块的旋转处理的逆向操作;
特征提取模块,用于通过横向取均值的方式获取逆向操作模块得到的图像中的人体特征;
损失计算模块,用于利用损失函数计算所述人体特征的损失梯度;
参数更新模块,用于根据所述损失梯度更新卷积神经网络的参数。
第三方面,本发明还提供了一种人体识别模型,该人体识别模型通过上述一种人体识别模型的训练方法训练得到。
第四方面,本发明还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述一种人体识别模型的训练方法。
第五方面,本发明还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述一种人体识别模型的训练方法。
本发明提供的人体识别模型的训练方法通过对训练样本图像进行翻转处理和旋转处理,之后从预置旋转范围内随机选取一旋转角度对图像进行旋转,接着对图像进行相应的逆向操作,使得训练样本具有多样性,从而使得通过该训练方法得到的人体识别模型对非直立姿态的人体也能准确识别,从而实现更准确的人体识别,实现更准确的人体搜索及人体跟踪拍摄。
附图说明
图1是本发明实施例一中提供的一种人体识别模型的训练方法的方法流程图;
图2是本发明实施例二中的提供的一种人体识别模型的训练方法的方法流程图;
图3是本发明实施例三中的提供的一种人体识别模型的训练系统的结构框图。
图4是本发明实施例三中的提供的另一种人体识别模型的训练系统的结构框图。
图5是本发明实施例五中的提供的一种计算机设备的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种人体识别模型的训练方法的方法流程图,本实施例可适用于人体倒立、躺着、弯身等非直立情况,具有更高的识别能力,可以实现更准确的人体识别,从而实现更准确的人体搜索及人体跟踪拍摄。该人体识别模型的训练方法可以由计算机来执行,其具体包括如下步骤:
步骤S110、从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,将所述训练样本图像的大小调整为预设大小。
本发明所有实施例中预置站立状态的定义为:人体头部在图像中呈现的位置在臀部以上,且人体脚部在图像中呈现的位置在臀部以下的状态。从数据库中筛选出符合预置站立状态的训练图像,作为训练样本图像,可以使得训练数据样本更有针对性。
筛选之后,将训练样本图像的大小调整为预设大小,可以为预置大小的成方形(如192*98像素大小),也可以为预置大小的正方形(如192*192像素大小),调整的方式可以是直接调整图像大小(例如直接把256*128像素大小的图像调整为192*192像素大小的图像),也可以通过填充的方式调整图像大小(例如把256*128像素大小的图像以右边填充0的方式将图像填充为256*256像素大小的图像,再将其调整为192*192像素大小的图像)。
步骤S120、对调整后的训练样本图像进行翻转处理和旋转处理。
在现有人体搜索和人体跟踪中,人们并不一定都是站着或走着的,人们的姿态会多样性,例如人们在跳舞中的姿态就很复杂,对于一个舞者,现有技术对于其站立姿态能识别出来,倒立姿态、躺下姿态、下腰姿态等识别效果很差。本发明实施例对调整后的训练样本图像进行翻转处理和旋转转处理,可以使得训练样本图像具有多样性,使得人体识别模式针对各种人体姿态,无论站着、倒立、弯身、下腰还是躺着等姿势都具有较高的识别效率,而能识别出来的前提是:对于无论站着、倒立、弯身、下腰还是躺着等姿势,卷积神经网络得到的人体特征都是一样的,这就需要训练样本图像具有各种各样的姿势,通过人工采集具有各种各样人体姿态的图像成本太高且耗时。步骤S120通过翻转处理和旋转处理预置直立状态的人去站着、倒立、弯身、下腰还是躺着等姿势的图像效率更高,节约人力成本,而且样本多样性更丰富。
本实施例对调整后的每一幅训练样本图像都进行翻转处理和旋转处理,步骤S120具体为从调整后的训练样本图像选择一幅训练样本图像进行翻转处理和旋转处理,接着执行步骤S130~步骤S160,执行完步骤S160返回执行S120时,从调整后的训练样本图像选择另一幅训练样本图像进行翻转处理和旋转处理,接着执行步骤S130~步骤S160;以此类推,依次对所有调整后的训练样本图像执行步骤S120~步骤S160。
步骤S130、从预置旋转范围内随机选取一旋转角度对步骤S120得到的图像进行旋转。
从预置旋转范围中随机选取一旋转角度对步骤S120得到的图像进行微角度旋转,可以使人体姿态具有一定的倾斜度,进一步地增加样本的多样性,可以使人体识别模型对人体的倾斜姿态也能准确识别出来,因为对于站立状态的人,人体的姿态很多时候不是刚刚好是垂直于地面90°,会有一定的倾斜度,对步骤S120得到的图像旋转一微角度,可以提高人体识别模型对各种人体姿态的识别率。作为一优选的实施例,预置旋转范围为[0°,15°]。
步骤S140、卷积神经网络对步骤S130得到的图像进行相应于步骤S120的旋转处理的逆向操作,通过横向取均值的方式获取图像中的人体特征。
为了实现卷积神经网络对于各种人体姿态得到的人体特征是一样的格式标准,在获取图像的人体特征之前,需要对应的将图像逆向的旋转回来,因此卷积神经网络对步骤S130得到的图像进行相应于步骤S120的旋转处理的逆向操作。例如步骤S120中是对图像进行顺时针旋转90°的操作,那么该步骤中就需要对步骤S130得到的图像进行逆时针旋转90°的操作。
步骤S150、利用损失函数计算所述人体特征的损失梯度;根据所述损失梯度更新卷积神经网络的参数。
本实施例中,损失函数不限定于某种特定的函数,利用损失函数计算所述人体特征的损失梯度亦为现有技术,这里不再赘述。计算得到损失梯度之后,根据损失梯度更新卷积神经网络的参数。
步骤S160、判断所述损失函数是否已收敛,若是执行步骤S170;若否返回执行步骤S120。
根据损失梯度更新卷积神经网络的参数之后,判断损失函数是否已收敛,若已收敛,则执行步骤S170;若未收敛,说明卷积神经网络的参数还不是最优参数,需要继续更新,则返回执行步骤S120;重复步骤S120~步骤S160,以依次对所有的调整后的训练样本图像执行步骤S120~步骤S160,直至损失函数收敛,完成对人体识别模型的训练。
本实施例中,判断损失函数是否已收敛可通过判断损失梯度是否低于预置值或损失梯度不在变化来判断。
步骤S170,结束训练,得到基于卷积神经网络的人体识别模型。
若损失函数已收敛,说明卷积神经网络的参数已为最优参数,则结束训练,得到基于卷积神经网络的人体识别模型。
本实施例通过对训练样本图像进行翻转处理和旋转处理,之后从预置旋转范围内随机选取一旋转角度对图像进行旋转,接着对图像进行相应的逆向操作,省去了人工采样的复杂性,使得训练样本具有多样性,从而使得通过该训练方法得到的人体识别模型对非直立的人体也能准确识别,从而实现更准确的人体识别,实现更准确的人体搜索及人体跟踪拍摄。
实施例二
图2为本发明实施例二提供的一种人体识别模型的训练方法的方法流程图,本实施例可适用于人体倒立、躺着、弯身等非直立姿态,具有更高的识别能力,可以实现更准确的人体识别,从而实现更准确的人体搜索及人体跟踪拍摄。该人体识别模型的训练方法可以由计算机来执行,其具体包括如下步骤:
步骤S210、从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,将所述训练样本图像的大小调整为预设大小。
步骤S210可以参照本发明实施例一中的步骤S110,这里不再赘述。
步骤S220、对调整后的训练样本图像进行左右翻转或不左右翻转处理。
从左右翻转和不左右翻转中随机选取一种处理方式对调整后的训练样本图像进行处理,以增加样本的多样性。
本实施例对调整后的每一幅训练样本图像都进行翻转处理和旋转处理,步骤S220具体为从调整后的训练样本图像选择一幅训练样本图像进行翻转处理和旋转处理,接着执行步骤S230~步骤S280,执行完步骤S280返回执行S220时,从调整后的训练样本图像选择另一幅训练样本图像进行翻转处理和旋转处理,接着执行步骤S230~步骤S280;以此类推,依次对所有调整后的训练样本图像执行步骤S220~S280。
步骤S230、对步骤S220得到的图像进行顺时针旋转90°、顺时针旋转180°、顺时针旋转270°、或不旋转处理。
从顺时针旋转90°、顺时针旋转180°、顺时针旋转270°和不旋转处理中随机选取一种处理方式对翻转后的训练样本图像进行处理,进一步增加样本的多样性,使得人体识别模型对例如躺下和弯身姿态也能识别。步骤S220和步骤S230共定义了8中“翻转-旋转”组合处理方式,大大增加了样本的多样性。
步骤S240、从预置旋转范围内随机选取一旋转角度对步骤S230得到的图像进行旋转。
步骤S240可以参照本发明实施例一中的步骤S130,这里不再赘述。
步骤S250、对步骤S240得到的图像进行减均值处理。
对步骤S240得到的图像进行减均值处理,以去中心化。
步骤S260、卷积神经网络对步骤S250得到的图像进行相应于步骤S230的旋转处理的逆向操作,通过横向取均值的方式获取图像中的人体特征。
相对步骤S230中的顺时针旋转90°、顺时针旋转180°、顺时针旋转270°和不旋转处理对应的逆向操作分别为逆时针旋转90°、逆时针旋转180°、逆时针旋转270°和不旋转处理,不旋转相当于“顺时针旋转0度”,其逆向操作就是“逆时针旋转0度”就相当于“不旋转处理”。
步骤S270、利用损失函数计算所述人体特征的损失梯度;根据所述损失梯度更新卷积神经网络的参数。
在一些实施例中,所述利用损失函数计算所述人体特征的损失梯度包括:
将步骤S260得到的人体特征送入到损失函数中完成前向传播;
计算损失梯度,并向卷积神经网络完成反向传播。
完成反向传播之后,根据损失梯度更新卷积神经网络的参数,
步骤S280、判断所述损失函数是否已收敛,若是执行步骤S290;若否返回执行步骤S220。
根据损失梯度更新卷积神经网络的参数之后,判断损失函数是否已收敛,若已收敛,则执行步骤S290;若未收敛,说明卷积神经网络的参数还不是最优参数,需要继续更新,则返回执行步骤S220;重复步骤S220~步骤280,以依次对所有的调整后的训练样本图像执行步骤S220~步骤S280,直至损失函数收敛,完成对人体识别模型的训练。
步骤S290,结束训练,得到基于卷积神经网络的人体识别模型。;
步骤S280~步骤S290可参照实施例一中的步骤S160~步骤S170,这里不再赘述。
本实施例通过对训练样本图像进行8种“翻转-旋转”组合处理,省去了人工采样的复杂性,并且进一步提高了样本的多样性,从而使得通过该训练方法得到的人体识别模型对非直立姿态(倒立、弯身、下腰、躺着等姿态)的人体也能准确识别、具有旋转自适应性,从而实现更准确行的人体识别,实现更准确的人体搜索及人体跟踪拍摄。
实施例三
图3是本发明实施例三中的提供的一种人体识别模型的训练系统的结构框图。如图3所示,该人体识别模型的训练系统包括:
样本筛选模块100,用于从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,将所述训练样本图像的大小调整为预设大小。
处理模块200,用于对调整后的训练样本图像进行翻转处理和旋转处理。
旋转模块300,用于从预置旋转范围内随机选取一旋转角度对处理模块得到的图像进行旋转。
逆向操作模块400,用于对旋转模块300得到的图像进行相应于处理模块200的旋转处理的逆向操作。
特征提取模块500,用于通过横向取均值的方式获取逆向操作模块400得到的图像中的人体特征。
损失计算模块600,用于利用损失函数计算所述人体特征的损失梯度。
参数更新模块700,用于根据所述损失梯度更新卷积神经网络的参数。
在一些实施例中,如图4所示,处理模块200具体包括:
翻转单元201,用于对调整后的训练样本图像进行左右翻转或不左右翻转处理;
旋转单元202,用于对翻转单元201得到的图像进行顺时针旋转90°、顺时针旋转180°、顺时针旋转270°、或不旋转处理。
对应的,逆向操作模块400,具体用于对旋转模块300得到的图像进行相应于旋转单元202的逆时针旋转90°、逆时针旋转180°、逆时针旋转270°、或不旋转处理。
在一些实施例中,损失计算模块600具体用于:
将特征提取模块500得到的人体特征送入到损失函数中完成前向传播;
计算损失梯度,并向卷积神经网络完成反向传播。
在一些实施例中,如图4所示,所述人体识别模型的训练系统还包括减均值模块800,用于对逆向操作模块400得到的图像进行减均值处理。对应的,特征提取模块500,具体用于通过横向取均值的方式获取减均值模块800得到的图像中的人体特征。
本实施例通过对训练样本图像进行8种“翻转-旋转”组合处理,省去了人工采样的复杂性,并且进一步提高了样本的多样性,从而使得通过该训练方法得到的人体识别模型对非直立的人体也能准确识别、具有旋转自适应性,从而实现更准确的人体识别,实现更准确的人体搜索及人体跟踪拍摄。
需要说明的是,本发明实施例所提供的人体识别模型的训练系统可执行本发明任意实施例所提供的人体识别模型的训练方法,具备执行方法相应的功能模块和有益效果。
实施例四
本发明实施例四中的提供了一种人体识别模型,该人体识别模型可通过实施例一或二中所述的人体识别模型的训练方法训练得到,具体的训练方法请参考本发明实施例一和实施例二,这里不再赘述。
本发明提供的人体识别模型可应用于云台摄像机、监控摄像机等摄像终端上,对各种人体的直立、躺着、弯身和下腰等其他非直立姿态都具有较高的识别能力,能实现更准确的人体,从而实现更准确的人体搜索及人体跟踪拍摄。
实施例五
图五为本发明实施例五提供的一种计算机设备的结构示意图,如图5所示,该计算机设备包括处理器50、存储器51、输入装置52和输出装置53;计算机设备中处理器50的数量可以是一个或多个,图5中以一个处理器50为例;计算机设备中的处理器50、存储器51、输入装置52和输出装置53可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器51作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的人体识别模型的训练方法对应的程序指令/模块(例如,人体识别模型的训练系统的样本筛选模块100、处理模块200、旋转模块300、逆向操作模块400、特征提取模块500、损失计算模块600和参数更新模块700)。处理器50通过运行存储在存储器51中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的人体识别模型的训练方法。
存储器51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器51可进一步包括相对于处理器50远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实施例六
本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种人体识别模型的训练方法该方法包括:
A、从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,将所述训练样本图像的大小调整为预设大小;
B、对调整后的训练样本图像进行翻转处理和旋转处理;
C、从预置旋转范围内随机选取一旋转角度对步骤B得到的图像进行旋转;
D、卷积神经网络对步骤C得到的图像进行相应于步骤B的旋转处理的逆向操作,通过横向取均值的方式获取图像中的人体特征;
E、利用损失函数计算所述人体特征的损失梯度;根据所述损失梯度更新卷积神经网络的参数;
F、重复步骤B~E,直至损失函数收敛,得到基于卷积神经网络的人体识别模型。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的人体识别模型的训练方法中的相关操作.
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述搜索装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种人体识别模型的训练方法,其特征在于,所述人体识别模型的训练方法包括:
A、从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,将所述训练样本图像的大小调整为预设大小;
B、对调整后的训练样本图像进行翻转处理和旋转处理;
C、从预置旋转范围内随机选取一旋转角度对步骤B得到的图像进行旋转;
D、卷积神经网络对步骤C得到的图像进行相应于步骤B的旋转处理的逆向操作,通过横向取均值的方式获取图像中的人体特征;
E、利用损失函数计算所述人体特征的损失梯度;根据所述损失梯度更新卷积神经网络的参数;
F、重复步骤B~E,直至损失函数收敛,得到基于卷积神经网络的人体识别模型。
2.根据权利要求1所述的人体识别模型的训练方法,其特征在于,所述步骤B、对调整后的训练样本图像进行翻转处理和旋转处理包括:
B1、对调整后的训练样本图像进行左右翻转;
B2、对步骤B1得到的图像进行顺时针旋转90°、顺时针旋转180°、或顺时针旋转270°。
3.根据权利要求2所述的人体识别模型的训练方法,其特征在于,所述卷积神经网络对步骤C得到的图像进行相应于步骤B的旋转处理的逆向操作,具体包括:
卷积神经网络对步骤C得到的图像进行相应于步骤B2的逆时针旋转90°、逆时针旋转180°、或逆时针旋转270°。
4.根据权利要求1所述的人体识别模型的训练方法,其特征在于,所述利用损失函数计算所述人体特征的损失梯度包括:
将步骤D得到的人体特征送入到损失函数中完成前向传播;
计算损失梯度,并向卷积神经网络完成反向传播。
5.根据权利要求1所述的人体识别模型的训练方法,其特征在于,所述步骤D之前,还包括:对步骤C得到的图像进行减均值处理。
6.一种人体识别模型的训练系统,其特征在于,所述人体识别模型的训练系统包括:
样本筛选模块,用于从数据库中筛选符合预置站立状态的训练图像作为训练样本图像,将所述训练样本图像的大小调整为预设大小;
处理模块,用于对调整后的训练样本图像进行翻转处理和旋转处理;
旋转模块,用于从预置旋转范围内随机选取一旋转角度对处理模块得到的图像进行旋转;
逆向操作模块,用于对旋转模块得到的图像进行相应于处理模块的旋转处理的逆向操作;
特征提取模块,用于通过横向取均值的方式获取逆向操作模块得到的图像中的人体特征;
损失计算模块,用于利用损失函数计算所述人体特征的损失梯度;
参数更新模块,用于根据所述损失梯度更新卷积神经网络的参数。
7.根据权利要求6所述的人体识别模型的训练系统,其特征在于,所述处理模块包括:
翻转单元,用于对调整后的训练样本图像进行左右翻转;
旋转单元,用于对翻转单元得到的图像进行顺时针旋转90°、顺时针旋转180°、或顺时针旋转270°。
8.一种人体识别模型,其特征在于,所述人体识别模型通过如权利要求1~6任意一项所述的一种人体识别模型的训练方法训练得到。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~5任意一项所述的一种人体识别模型的训练方法。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~5任意一项所述的一种人体识别模型的训练方法。
CN202010347345.XA 2020-04-28 2020-04-28 人体识别模型及其训练方法、系统、存储介质及设备 Active CN111539357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010347345.XA CN111539357B (zh) 2020-04-28 2020-04-28 人体识别模型及其训练方法、系统、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010347345.XA CN111539357B (zh) 2020-04-28 2020-04-28 人体识别模型及其训练方法、系统、存储介质及设备

Publications (2)

Publication Number Publication Date
CN111539357A CN111539357A (zh) 2020-08-14
CN111539357B true CN111539357B (zh) 2024-01-23

Family

ID=71977333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010347345.XA Active CN111539357B (zh) 2020-04-28 2020-04-28 人体识别模型及其训练方法、系统、存储介质及设备

Country Status (1)

Country Link
CN (1) CN111539357B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128601B (zh) * 2021-04-22 2022-04-29 北京百度网讯科技有限公司 分类模型的训练方法和对图像进行分类的方法
CN116281479B (zh) * 2023-04-04 2023-10-17 南京枫火网络科技有限公司 一种基于物联网的电梯故障监测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069413A (zh) * 2015-07-27 2015-11-18 电子科技大学 一种基于深度卷积神经网络的人体姿势识别方法
CN109902603A (zh) * 2019-02-18 2019-06-18 苏州清研微视电子科技有限公司 基于红外图像的驾驶员身份识别认证方法和系统
CN109977781A (zh) * 2019-02-26 2019-07-05 上海上湖信息技术有限公司 人脸检测方法及装置、可读存储介质
CN110059522A (zh) * 2018-01-19 2019-07-26 北京市商汤科技开发有限公司 人体轮廓关键点检测方法、图像处理方法、装置及设备
CN110213605A (zh) * 2019-05-28 2019-09-06 广州华多网络科技有限公司 图像纠正方法、装置及设备
CN110245711A (zh) * 2019-06-18 2019-09-17 西安电子科技大学 基于角度旋转生成网络的sar目标识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008117333A (ja) * 2006-11-08 2008-05-22 Sony Corp 情報処理装置、情報処理方法、個人識別装置、個人識別装置における辞書データ生成・更新方法および辞書データ生成・更新プログラム
CN111183456A (zh) * 2017-10-03 2020-05-19 富士通株式会社 识别程序、识别方法以及识别装置
CN108734087B (zh) * 2018-03-29 2022-04-29 京东方科技集团股份有限公司 物体自动识别方法以及系统、购物设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069413A (zh) * 2015-07-27 2015-11-18 电子科技大学 一种基于深度卷积神经网络的人体姿势识别方法
CN110059522A (zh) * 2018-01-19 2019-07-26 北京市商汤科技开发有限公司 人体轮廓关键点检测方法、图像处理方法、装置及设备
CN109902603A (zh) * 2019-02-18 2019-06-18 苏州清研微视电子科技有限公司 基于红外图像的驾驶员身份识别认证方法和系统
CN109977781A (zh) * 2019-02-26 2019-07-05 上海上湖信息技术有限公司 人脸检测方法及装置、可读存储介质
CN110213605A (zh) * 2019-05-28 2019-09-06 广州华多网络科技有限公司 图像纠正方法、装置及设备
CN110245711A (zh) * 2019-06-18 2019-09-17 西安电子科技大学 基于角度旋转生成网络的sar目标识别方法

Also Published As

Publication number Publication date
CN111539357A (zh) 2020-08-14

Similar Documents

Publication Publication Date Title
KR101887558B1 (ko) 컨볼루션 신경망 모델의 트레이닝 방법 및 장치
CN106156730B (zh) 一种人脸图像的合成方法和装置
CN111539357B (zh) 人体识别模型及其训练方法、系统、存储介质及设备
US9471964B2 (en) Non-local mean-based video denoising method and apparatus
CN108898171B (zh) 图像识别处理方法、系统及计算机可读存储介质
CN110349082B (zh) 图像区域的裁剪方法和装置、存储介质及电子装置
EP3910507A1 (en) Method and apparatus for waking up screen
CN111815534A (zh) 实时皮肤妆容迁移方法、装置、电子设备和可读存储介质
CN111898683A (zh) 基于深度学习的图像分类方法、装置及计算机设备
CN109145809A (zh) 一种记谱处理方法和装置以及计算机可读存储介质
CN111967598A (zh) 神经网络压缩方法、装置、设备及计算机可读存储介质
CN111126254A (zh) 图像识别方法、装置、设备及存储介质
CN114285944B (zh) 视频彩铃生成方法、装置及电子设备
WO2024179446A1 (zh) 一种图像处理方法以及相关设备
CN115546379A (zh) 一种数据处理方法、装置和计算机设备
CN109993135B (zh) 一种基于增强现实的手势识别方法、系统及装置
CN117671792A (zh) 动态手势识别方法、装置、设备及存储介质
CN112418046B (zh) 一种基于云机器人的健身指导方法、存储介质及系统
CN107767326B (zh) 图像中对象变换处理方法、装置及计算设备
CN112232292A (zh) 应用于移动端的人脸检测方法及装置
CN109531578B (zh) 仿人机械手臂体感控制方法及装置
CN115035596B (zh) 行为检测的方法及装置、电子设备和存储介质
CN112766168B (zh) 一种人员摔倒检测方法、装置及电子设备
CN115408609A (zh) 泊车路线推荐方法、装置、电子设备和计算机可读介质
CN113177471A (zh) 动作检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant