CN112418135A - 人体行为识别方法、装置、计算机设备及可读存储介质 - Google Patents
人体行为识别方法、装置、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN112418135A CN112418135A CN202011388513.6A CN202011388513A CN112418135A CN 112418135 A CN112418135 A CN 112418135A CN 202011388513 A CN202011388513 A CN 202011388513A CN 112418135 A CN112418135 A CN 112418135A
- Authority
- CN
- China
- Prior art keywords
- human
- behavior
- human body
- key points
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000007405 data analysis Methods 0.000 claims abstract description 12
- 230000006399 behavior Effects 0.000 claims description 272
- 238000012545 processing Methods 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 29
- 238000010606 normalization Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 abstract description 22
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000012706 support-vector machine Methods 0.000 description 62
- 230000000694 effects Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 210000003423 ankle Anatomy 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000010923 batch production Methods 0.000 description 2
- 210000003127 knee Anatomy 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 210000000707 wrist Anatomy 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种人体行为识别方法、装置、计算机设备及可读存储介质,涉及行为分析技术领域。本申请通过获取待识别图像中目标人物的多个人体关键点各自的位置信息及置信度,而后对多个人体关键点各自的位置信息进行归一化处理,得到这多个人体关键点之间的相对位置关系,进而调用预存的SVM行为分类器对这多个人体关键点各自的置信度及这多个人体关键点之间的相对位置关系进行数据分析,得到该目标人物在待识别图像中对应的人体行为类别,由此通过将人体关键点的位置信息及置信度结合到人体行为类别识别过程中,提升人体行为识别精准度,并通过SVM分类器具有的运行高效性,提升人体行为识别效率。
Description
技术领域
本申请涉及行为分析技术领域,具体而言,涉及一种人体行为识别方法、装置、计算机设备及可读存储介质。
背景技术
随着硬件计算能力的提升和人工智能的兴起,计算机视觉技术的应用越发广泛,其中行为分析技术是当前计算机视觉技术的一项重要分支。行为分析技术能够对人体行为的具体种类进行识别,并相应地解析出人体行为在该行为分析技术所在应用领域中的具体意图,以便于有效提升电子设备服务效果。而对于行为分析技术来说,人体行为识别的具体效率及精准度,便是影响行为分析的最终效果的重要因素。
发明内容
有鉴于此,本申请的目的在于提供一种人体行为识别方法、装置、计算机设备及可读存储介质,能够在提升人体行为识别精准度的同时,提升人体行为识别效率。
为了实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请提供一种人体行为识别方法,所述方法包括:
获取待识别图像,并对所述待识别图像进行人体关键点检测,得到所述待识别图像中目标人物所对应的多个人体关键点各自的位置信息及置信度;
对所述目标人物所对应的多个人体关键点各自的位置信息进行归一化处理,得到所述目标人物所对应的多个人体关键点之间的相对位置关系;
调用预存的SVM行为分类器对所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系进行数据分析,得到所述目标人物在所述待识别图像中的人体行为类别。
在可选的实施方式中,所述SVM行为分类器对应有多个可识别行为类别,所述调用预存的SVM行为分类器对所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系进行数据分析,得到所述目标人物在所述待识别图像中的人体行为类别的步骤,包括:
根据所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系,调用所述SVM行为分类器计算所述目标人物被划分到各可识别行为类别下的概率值;
从计算出的各可识别行为类别的概率值中提取最大概率数值,并将所述最大概率数值与预设概率阈值进行比较;
若所述最大概率数值等于或大于所述预设概率阈值,则将所述最大概率数值所对应的可识别行为类别作为所述目标人物的人体行为类别。
在可选的实施方式中,所述方法还包括:
获取不同行为类别各自的样本行为数据集,其中所述样本行为数据集包括被划分到相同行为类别下的多个样本人物各自在对应样本图像中的多个人体关键点的位置信息及置信度,不同行为类别各自对应的样本人物数目相同;
对每个样本人物在对应样本图像中的多个人体关键点的位置信息进行归一化处理,得到所述样本人物在所述样本图像中的多个人体关键点之间的相对位置关系;
根据不同行为类别各自对应的多个样本人物在对应样本图像中的多个人体关键点的置信度以及所述多个人体关键点之间的相对位置关系,对初始SVM分类器进行模型训练,得到所述SVM行为分类器。
在可选的实施方式中,针对目标人物或样本人物,对该人物在对应图像中的多个人体关键点的位置信息进行归一化处理,得到所述多个人体关键点之间的相对位置关系的步骤,包括:
根据所述多个人体关键点各自在对应图像中的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
第二方面,本申请提供一种人体行为识别装置,所述装置包括:
人体检测模块,用于获取待识别图像,并对所述待识别图像进行人体关键点检测,得到所述待识别图像中目标人物所对应的多个人体关键点各自的位置信息及置信度;
归一化处理模块,用于对所述目标人物所对应的多个人体关键点各自的位置信息进行归一化处理,得到所述目标人物所对应的多个人体关键点之间的相对位置关系;
行为识别模块,用于调用预存的SVM行为分类器对所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系进行数据分析,得到所述目标人物在所述待识别图像中的人体行为类别。
在可选的实施方式中,所述SVM行为分类器对应有多个可识别行为类别,所述行为识别模块包括:
概率计算子模块,用于根据所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系,调用所述SVM行为分类器计算所述目标人物被划分到各可识别行为类别下的概率值;
概率比较子模块,用于从计算出的各可识别行为类别的概率值中提取最大概率数值,并将所述最大概率数值与预设概率阈值进行比较;
类别输出子模块,用于若所述最大概率数值等于或大于所述预设概率阈值,则将所述最大概率数值所对应的可识别行为类别作为所述目标人物的人体行为类别。
在可选的实施方式中,所述装置还包括:
样本获取模块,用于获取不同行为类别各自的样本行为数据集,其中所述样本行为数据集包括被划分到相同行为类别下的多个样本人物各自在对应样本图像中的多个人体关键点的位置信息及置信度,不同行为类别各自对应的样本人物数目相同;
所述归一化处理模块,还用于对每个样本人物在对应样本图像中的多个人体关键点的位置信息进行归一化处理,得到所述样本人物在所述样本图像中的多个人体关键点之间的相对位置关系;
分类器训练模块,用于根据不同行为类别各自对应的多个样本人物在对应样本图像中的多个人体关键点的置信度以及所述多个人体关键点之间的相对位置关系,对初始SVM分类器进行模型训练,得到所述SVM行为分类器。
在可选的实施方式中,所述归一化处理模块针对目标人物或样本人物,对该人物在对应图像中的多个人体关键点的位置信息进行归一化处理,得到所述多个人体关键点之间的相对位置关系的方式,包括:
根据所述多个人体关键点各自在对应图像中的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
第三方面,本申请提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序,以实现前述实施方式中任意一项所述的人体行为识别方法。
第四方面,本申请提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现前述实施方式中任意一项所述的人体行为识别方法。
本申请实施例的有益效果包括如下内容:
本申请通过获取待识别图像中目标人物的多个人体关键点各自的位置信息及置信度,而后对多个人体关键点各自的位置信息进行归一化处理,得到这多个人体关键点之间的相对位置关系,进而调用预存的SVM行为分类器对这多个人体关键点各自的置信度及这多个人体关键点之间的相对位置关系进行数据分析,得到该目标人物在待识别图像中对应的人体行为类别,由此通过将人体关键点的位置信息及置信度结合到人体行为类别识别过程中,提升人体行为识别精准度,并通过SVM分类器具有的运行高效性,提升人体行为识别效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的计算机设备的组成示意图;
图2为本申请实施例提供的人体行为识别方法的流程示意图之一;
图3为本申请实施例提供的同一人物所对应的多个人体关键点在人物图像中的位置信息示意表;
图4为图3所示的多个人体关键点之间的相对位置关系示意表;
图5为图2中的步骤S230包括的子步骤的流程示意图;
图6为本申请实施例提供的人体行为识别方法的流程示意图之二;
图7为本申请实施例提供的人体行为识别装置的组成示意图之一;
图8为图7中的行为识别模块的组成示意图;
图9为本申请实施例提供的人体行为识别装置的组成示意图之二。
图标:10-计算机设备;11-存储器;12-处理器;13-通信单元;100-人体行为识别装置;110-人体检测模块;120-归一化处理模块;130-行为识别模块;131-概率计算子模块;132-概率比较子模块;133-类别输出子模块;140-样本获取模块;150-分类器训练模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要理解的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
申请人通过辛苦调研发现,现有的人体行为识别方案通常采用两种思路实现,第一种思路是使用光流算法来预测行为发生的趋势,第二种思路则是利用卷积神经网络类进行人体行为识别。其中,第一种思路在实现时需要耗费大量时间提取光流,并且在具体识别过程中易受到环境中的噪声干扰,因此该思路在实际环境中受到较大的限制,一旦环境出现盖板,这种思路的识别效果就会急剧下降。而第二种思路在实现时需要收集庞大的样本图像数据进行模型训练,整个训练过程复杂,训练出的模型不易收敛且识别效率低下,训练出的模型通常需要进行模型裁剪等简化操作以便于模型落地部署,导致部署的模型的识别精度下降,同时当待识别图像与样本图像数据之间的场景差异度较高时,模型识别效果也将急剧下降,整体的鲁棒性较差。
在此情况下,为降低图像背景变化对人体行为识别效果的干扰,提升人体行为识别精准度,并同步提升人体行为识别效率,本申请实施例通过提供一种人体行为识别方法、装置、计算机设备及可读存储介质实现前述效果。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互结合。
请参照图1,图1是本申请实施例提供的计算机设备10的组成示意图。在本申请实施例中,所述计算机设备10能够有效降低待识别人物图像中的图像背景对人体行为识别过程的干扰,并对待识别人物图像中的人物行为进行快速且精准地识别。其中,所述计算机设备10可以是,但不限于,智能手机、平板电脑、个人计算机、服务器及具有图像采集功能的机器人等。
在本实施例中,所述计算机设备10可以包括存储器11、处理器12、通信单元13及人体行为识别装置100。其中,所述存储器11、所述处理器12及所述通信单元13各个元件相互之间接或间接地电性连接,以实现数据的传输或交互。例如,所述存储器11、所述处理器12及所述通信单元13这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
在本实施例中,所述存储器11可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,所述存储器11用于存储计算机程序,所述处理器12在接收到执行指令后,可相应地执行所述计算机程序。
其中,所述存储器11还用于存储SVM行为分类器,所述SVM行为分类器为SVM(Support Vector Machine,支持向量机)分类器基于人体关键点的相关信息训练得到的分类器模型,所述SVM行为分类器用于对人体行为类别进行识别。所述SVM行为分类器对应有多个可识别行为类别,所述可识别行为类别可以是,但不限于,端坐、站立、平躺、举手及蹲下等。其中,所述人体关键点的数目通常为18个,其包括对应人体的鼻子、脖子、右肩、右肘、右腕、左肩、左肘、左腕、右髋、右膝、右踝、左髋、左膝、左踝、左眼、右眼、左耳及右耳,而所述人体关键点的相关信息包括对应人体关键点在人物图像中的位置信息及置信度,所述置信度用于表示对应提取出的人体关键点在人物图像中的位置可靠性,所述位置信息可采用对应人体关键点在人物图像中的原图横纵坐标进行表示。
在本实施例中,所述处理器12可以是一种具有信号的处理能力的集成电路芯片。所述处理器12可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)及网络处理器(Network Processor,NP)、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件中的至少一种。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。
在本实施例中,所述通信单元13用于通过网络建立所述计算机设备10与其他电子设备之间的通信连接,并通过所述网络收发数据,其中所述网络包括有线通信网络及无线通信网络。例如,所述计算机设备10可通过所述通信单元13从其他电子设备处获取需要进行人体行为识别的待识别图像。
在本实施例中,所述人体行为识别装置100包括至少一个能够以软件或固件的形式存储于所述存储器11中或固化在所述计算机设备10的操作系统中的软件功能模块。所述处理器12可用于执行所述存储器11存储的可执行模块,例如所述人体行为识别装置100所包括的软件功能模块及计算机程序等。所述计算机设备10通过所述人体行为识别装置100降低待识别人物图像中的图像背景对人体行为识别过程的干扰,并对待识别人物图像中的人物行为进行快速且精准地识别,从而提升人体行为识别效果。
可以理解的是,图1所示的框图仅为所述计算机设备10的一种组成示意图,所述计算机设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
在本申请中,为确保所述计算机设备10能够对待识别图像进行精准且快速的人体行为识别操作,达到提升人体行为识别精准度及人体行为识别效率的效果,本申请实施例通过提供人体行为识别方法实现前述目的。下面对本申请提供的人体行为识别方法进行详细描述。
可选地,请参照图2,图2是本申请实施例提供的人体行为识别方法的流程示意图之一。在本申请实施例中,图2所示的人体行为识别方法的具体流程和具体步骤如下文所示。
步骤S210,获取待识别图像,并对待识别图像进行人体关键点检测,得到待识别图像中目标人物所对应的多个人体关键点各自的位置信息及置信度。
在本实施例中,所述待识别图像可由所述计算机设备10通过通信单元13从其他电子设备处获取,也可由所述计算机设备10额外包括的摄像头采集得到。所述计算机设备10在获取到待识别图像后,可采用人体姿态估计(Human Pose Estimation,HPE)算法对该待识别图像进行人体关键点检测,以将该待识别图像中的每个人物作为一个目标人物,并得到该目标人物所对应的多个人体关键点各自在该待识别图像中的位置信息,以及每个人体关键点在该待识别图像中对应的置信度。其中,所述目标人物所对应的每个人体关键点的位置信息可采用该人体关键点在所述待识别图像中的原图横纵坐标进行表示。在本实施例的一种实施方式中,所述计算机设备10可采用AlphaPose算法进行人体关键点检测。
步骤S220,对所述目标人物所对应的多个人体关键点各自的位置信息进行归一化处理,得到所述目标人物所对应的多个人体关键点之间的相对位置关系。
在本实施例中,所述计算机设备10在从一张人物图像中确定出某个人物所对应的多个人体关键点各自的位置信息后,会对该人物在对应图像中的多个人体关键点的位置信息进行归一化处理,得到该人物在对应图像中的多个人体关键点之间的相对位置关系,从而使该人物所对应的各人体关键点不被该人物在对应图像中的位置所影响,以便于维持后续人体行为识别过程的识别精准度。
其中,在本实施例的一种实施方式中,所述相对位置信息可以表达为对应图像中同一人物的各人体关键点相对于一个人体参照点的位置关系被归一化到0~1的区间范围内的具体坐标数值。其中,所述人体参照点可以是同一人物的各人体关键点中的任意一个;也可以是取各人体关键点的最小原图横坐标值及最小原图纵坐标值组合形成的坐标点,还可以是同一人物的各人体关键点之间的坐标平均点;所述坐标平均点的横坐标值即为对应的所有人体关键点的原图横坐标值之间的平均值,所述坐标平均点的纵坐标值即为对应的所有人体关键点的原图纵坐标值之间的平均值;具体的人体参照点可根据归一化处理需求进行配置。
此时,所述计算机设备10在对该人物在对应图像中的多个人体关键点的位置信息进行归一化处理,得到该人物在对应图像中的多个人体关键点之间的相对位置关系的步骤,可以包括:
根据所述多个人体关键点各自在对应图像中的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
在此过程中,所述多个人体关键点的最小外接矩形区域的区域高度与区域宽度可采用如下式子进行计算:
H=Ymax-Ymin,W=Xmax-Xmin
其中,H和W分别表示该人物的多个人体关键点所对应的最小外接矩形区域的区域高度及区域宽度,Ymax和Ymin分别表示该人物的多个人体关键点中最大原图纵坐标值及最小原图纵坐标值,Xmax和Xmin分别表示该人物的多个人体关键点中最大原图横坐标值及最小原图横坐标值。以图3为例,图3中的Ymax和Ymin分别为180及10,Xmax和Xmin分别为180及10,则图3所对应的最小外接矩形区域的区域高度及区域宽度均为170。
同时,针对某个人体关键点,可采用如下式子计算该人体关键点的归一化横坐标值及归一化纵坐标值:
Xni=(Xi-XT)/W,Yni=(Yi-YT)/H
其中,Xi用于表示该人物的第i个人体关键点的原图横坐标值,Yi用于表示该人物的第i个人体关键点的原图纵坐标值,Xni用于表示该人物的第i个人体关键点的归一化横坐标值,Yni用于表示该人物的第i个人体关键点的归一化纵坐标值,XT用于表示该人物的人体参照点的原图横坐标值,YT用于表示该人物的人体参照点的原图纵坐标值。以图3为例,可将该人物的最小原图横坐标值Xmin作为人体参照点的原图横坐标值XT,并将该人物的最小原图纵坐标值Ymin作为人体参照点的原图纵坐标值YT,进而通过上述式子计算得到图4所示的各人体关键点之间的相对位置关系内容。
由此,当所述计算机设备10从待识别图像中确定出某个目标人物所对应的多个人体关键点各自的位置信息后,会对该目标人物在该待识别图像中的多个人体关键点的位置信息进行归一化处理,得到该目标人物在该待识别图像中的多个人体关键点之间的相对位置关系。此时,所述对该目标人物在该待识别图像中的多个人体关键点的位置信息进行归一化处理,得到该目标人物在该待识别图像中的多个人体关键点之间的相对位置关系的步骤,可以包括:
根据该目标人物在该待识别图像中的多个人体关键点的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
步骤S230,调用预存的SVM行为分类器对多个人体关键点各自的置信度及多个人体关键点之间的相对位置关系进行数据分析,得到目标人物在待识别图像中的人体行为类别。
在本实施例中,所述SVM行为分类器为SVM分类器基于不同人物所对应的多个人体关键点的置信度及相对位置信息训练得到。该SVM行为分类器具有较好的容错性,能够解决高维问题,且运行速度快,无需庞大的训练数据量,从而得以通过该SVM行为分类器提升人体行为识别效率。同时,本申请通过提取人体关键点来表征对应人物的具体行为,无需受到人物图像中的背景噪声带来的干扰,能够更好地突出人体行为,进而通过将人体关键点的位置信息及置信度结合到人体行为类别识别过程中,降低图像背景变化对人体行为识别效果的干扰,提升人体行为识别精准度。
其中,SVM行为分类器由于引入了松弛变量,使其具备一定的容错性,可以忽略一些不合群的噪声点干扰,因此模型的泛化能力比较好,识别能力强。而该SVM行为分类器可以通过核函数(Kernel Function)将线性不可分的问题映射到高维空间,从而找到一个分隔平面,使问题变得线性可分和更易求解,因此SVM无需考虑样本维数,能处理高维的问题,拟合效果好。同时,该SVM行为分类器属于机器学习算法,不需要搭建复杂的神经网络结构,只需学习支持向量,基于少量的低维张量进行运算,因此训练和推断速度十分快,由此与神经网络需要庞大的数据进行训练才能得到鲁棒性较好的模型不同,该SVM行为分类器仅需提供少量的数据就能很好地拟合关系。因此,本申请中的SVM行为分类器通过对人体关键点特征(包括人物图像中某个人物所对应的多个人体关键点的置信度及相对位置信息)进行表征学习,降低了模型训练的复杂度和计算量,同时减少了训练所需的数据量,提高了模型的识别准确率和鲁棒性。
在本实施例中,当所述计算机设备10从待识别图像中确定出某个目标人物所对应的多个人体关键点各自的归一化横坐标值、归一化纵坐标值及置信度后,会将这多个人体关键点各自的归一化横坐标值、归一化纵坐标值及置信度作为同一目标人物的多维度特征,并将该多维度特征输入到所述SVM行为分类器中,由所述SVM行为分类器对该多维度特征进行数据分析,以确定该多维度特征所对应的人体行为是否属于所述SVM行为分类器所对应的多个可识别行为类别中的哪一个。
由此,本申请得以通过将人体关键点的位置信息及置信度结合到人体行为类别识别过程中,降低图像背景变化对人体行为识别效果的干扰,提升人体行为识别精准度,并通过SVM分类器具有的运行高效性,提升人体行为识别效率,从而提升人体行为识别效果。在本实施例的一种实施方式中,若同一人物对应有18个人体关键点,则该人物的多维度特征将为54维度特征,该54维度特征包括对应人物的18个人体关键点各自的归一化横坐标值、归一化纵坐标值及置信度。
在此过程中,请参照图5,图5是图2中的步骤S230包括的子步骤的流程示意图。在本实施例中,所述SVM行为分类器对应有多个可识别行为类别,所述步骤S230可以包括子步骤S231~子步骤S233。
子步骤S231,根据多个人体关键点各自的置信度及多个人体关键点之间的相对位置关系,调用SVM行为分类器计算目标人物被划分到各可识别行为类别下的概率值。
在本实施例中,当所述计算机设备10从待识别图像中确定出某个目标人物所对应的多个人体关键点各自的归一化横坐标值、归一化纵坐标值及置信度后,会将这多个人体关键点各自的归一化横坐标值、归一化纵坐标值及置信度作为同一目标人物的多维度特征,并将该多维度特征输入到所述SVM行为分类器中。由所述SVM行为分类器根据该目标人物的多维度特征计算该目标人物被划分到该SVM行为分类器所对应的每个可识别行为类别下的概率值。
子步骤S232,从计算出的各可识别行为类别的概率值中提取最大概率数值,并将最大概率数值与预设概率阈值进行比较。
在本实施例中,所述预设概率阈值用于校验所述SVM行为分类器的识别可靠性,而经所述SVM行为分类器计算出的目标人物被划分到不同可识别行为类别下的概率值中的最大概率值,用于表示该目标人物的人体行为被有效识别的最大可能性。所述计算机设备10通过将所述最大概率值与所述预设概率阈值进行比较的方式,确定该目标人物是否能够被有效识别。
其中,若所述最大概率数值小于所述预设概率阈值,则表明当前SVM行为分类器所涉及到的各可识别行为类别无法与该目标人物当前人体行为相匹配,当前SVM行为分类器无法对该目标人物当前人体行为进行有效识别;若所述最大概率数值大于或等于所述预设概率阈值,则表明当前SVM行为分类器能够对该目标人物当前人体行为进行有效识别。在本实施例的一种实施方式中,所述预设概率阈值的数值可以是,但不限于50%、55%及60%中的任意一种。
子步骤S233,若最大概率数值等于或大于预设概率阈值,则将最大概率数值所对应的可识别行为类别作为目标人物的人体行为类别。
在本实施例中,当计算出的目标人物被划分到不同可识别行为类别下的概率值中的最大概率值大于或等于所述预设概率阈值时,则表明该当前SVM行为分类器可以对该目标人物当前人体行为进行有效识别,此时即可将所述最大概率值所对应的可识别行为类别,作为所述目标人物在所述待识别图像中的人体行为类别。
由此,本申请得以通过执行上述子步骤S231~子步骤S233,利用SVM行为分类器对待识别图像中目标人物的多维度特征进行有效分析,以识别出该目标人物在待识别图像中最可能的人体行为类别,尽可能提升人体行为识别精准度。
同时,本申请通过执行上述步骤S210~步骤S230,将人体关键点的位置信息及置信度结合到人体行为类别识别过程中,降低图像背景变化对人体行为识别效果的干扰,提升人体行为识别精准度,并通过SVM分类器具有的运行高效性,提升人体行为识别效率,从而提升人体行为识别效果。
可选地,请参照图6,图6是本申请实施例提供的人体行为识别方法的流程示意图之二。在本申请实施例中,图6所示的人体行为识别方法与图2所示的人体行为识别方法相比,图6所示的人体行为识别方法还可以包括步骤S240~步骤S260,并可通过执行所述步骤S240~步骤S260的方式,利用较少的人体关键点特征样本数据便能完成对SVM行为分类器的训练操作,降低了模型训练的复杂度和计算量,同时减少了训练所需的数据量,提高了模型的识别准确率和鲁棒性。
步骤S240,获取不同行为类别各自的样本行为数据集,其中样本行为数据集包括被划分到相同行为类别下的多个样本人物各自在对应样本图像中的多个人体关键点的位置信息及置信度,不同行为类别各自对应的样本人物数目相同。
在本实施例中,同一样本行为数据集所对应的多个样本人物各自在对应样本图像中被标注为同一行为类别,不同样本行为数据集各自对应的样本人物数目相同,每个样本行为数据集对应一种行为类别。
在本实施例的一种实施方式中,针对每种行为类别,可通过选取N名样本采集对象,以n人为一批次,在N/n个批次的每个批次过程中采集相同行为类别的行为图像数据,其中每个批次对应采集行为图像数据的耗时相同,在每个批次过程中可要求样本采集对象有小幅度的动作变化(例如,身体倾斜和头部摆动等),但整体人体行为类别需保持一致,从而使最终得到不同行为类别各自的样本人物数目等于对应行为图像帧数乘以n的值。
而后,通过对每个行为图像帧进行人体关键点检测,确定该行为图像帧中每个样本人物所对应的多个人体关键点的位置信息及置信度,接着将同一行为类别所对应的各样本人物所对应的多个人体关键点的位置信息及置信度集成在一起,从而得到不同行为类别各自的样本行为数据集,使每个样本行为数据集包括被划分到相同行为类别下的多个样本人物各自在对应样本图像中的多个人体关键点的位置信息及置信度。
步骤S250,对每个样本人物在对应样本图像中的多个人体关键点的位置信息进行归一化处理,得到样本人物在样本图像中的多个人体关键点之间的相对位置关系。
在本实施例中,所述步骤S250的具体执行过程与上文中步骤S220的具体执行过程类似,因此所述步骤S250可以包括如下内容:
针对每个样本人物,根据该样本人物在对应样本图像中的多个人体关键点的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
其中,所述人体参照点可以是同一人物的各人体关键点中的任意一个;也可以是取各人体关键点的最小原图横坐标值及最小原图纵坐标值组合形成的坐标点,还可以是同一人物的各人体关键点之间的坐标平均点;所述坐标平均点的横坐标值即为对应的所有人体关键点的原图横坐标值之间的平均值,所述坐标平均点的纵坐标值即为对应的所有人体关键点的原图纵坐标值之间的平均值;具体的人体参照点可根据归一化处理需求进行配置。所述步骤S250的具体执行过程可参照上文对步骤S220的具体执行过程的详细描述,在此不再一一赘述。
步骤S260,根据不同行为类别各自对应的多个样本人物在对应样本图像中的多个人体关键点的置信度以及多个人体关键点之间的相对位置关系,对初始SVM分类器进行模型训练,得到SVM行为分类器。
在本实施例中,当得到不同行为类别各自对应的多个样本人物在对应样本图像中的多个人体关键点的置信度以及多个人体关键点之间的相对位置关系后,会将同一样本人物所对应的多个人体关键点的置信度、归一化横坐标值及归一化纵坐标值综合为该样本人物的多维度特征,而后将不同行为类别的多个样本人物各自的多维度特征作为SVM分类器的模型训练数据集,并将该SVM分类器的模型训练数据集输入到初始SVM分类器中进行模型训练,由该初始SVM分类器对不同行为类别各自对应的人体行为特征进行拟合学习,从而得到能够对模型训练数据集所涉及到的各行为类别进行有效识别的SVM行为分类器。
由此,本申请得以通过执行上述步骤S240~步骤S260,利用较少的人体关键点特征样本数据便能完成对SVM行为分类器的训练操作,降低了模型训练的复杂度和计算量,同时减少了训练所需的数据量,提高了模型的识别准确率和鲁棒性,确保训练出的SVM行为分类器能够在实际使用过程中具有良好的人体行为识别精准度及人体行为识别效率。
在本申请中,为确保所述计算机设备10能够通过所述人体行为识别装置100执行上述人体行为识别方法,本申请通过对所述人体行为识别装置100进行功能模块划分的方式实现前述功能。下面对本申请提供的人体行为识别装置100的具体组成进行相应描述。
可选地,请参照图7,图7是本申请实施例提供的人体行为识别装置100的组成示意图之一。在本申请实施例中,所述人体行为识别装置100可以包括人体检测模块110、归一化处理模块120及行为识别模块130。
人体检测模块110,用于获取待识别图像,并对待识别图像进行人体关键点检测,得到待识别图像中目标人物所对应的多个人体关键点各自的位置信息及置信度。
归一化处理模块120,用于对目标人物所对应的多个人体关键点各自的位置信息进行归一化处理,得到目标人物所对应的多个人体关键点之间的相对位置关系。
行为识别模块130,用于调用预存的SVM行为分类器对多个人体关键点各自的置信度及多个人体关键点之间的相对位置关系进行数据分析,得到目标人物在待识别图像中的人体行为类别。
可选地,请参照图8,图8是图7中的行为识别模块130的组成示意图。在本实施例中,所述行为识别模块130可以包括概率计算子模块131、概率比较子模块132及类别输出子模块133。
概率计算子模块131,用于根据多个人体关键点各自的置信度及多个人体关键点之间的相对位置关系,调用SVM行为分类器计算目标人物被划分到各可识别行为类别下的概率值。
概率比较子模块132,用于从计算出的各可识别行为类别的概率值中提取最大概率数值,并将最大概率数值与预设概率阈值进行比较。
类别输出子模块133,用于若最大概率数值等于或大于预设概率阈值,则将最大概率数值所对应的可识别行为类别作为目标人物的人体行为类别。
可选地,请参照图9,图9是本申请实施例提供的人体行为识别装置100的组成示意图之二。在本申请实施例中,所述人体行为识别装置100还可以包括样本获取模块140及分类器训练模块150。
样本获取模块140,用于获取不同行为类别各自的样本行为数据集,其中样本行为数据集包括被划分到相同行为类别下的多个样本人物各自在对应样本图像中的多个人体关键点的位置信息及置信度,不同行为类别各自对应的样本人物数目相同。
所述归一化处理模块120,还用于对每个样本人物在对应样本图像中的多个人体关键点的位置信息进行归一化处理,得到样本人物在样本图像中的多个人体关键点之间的相对位置关系。
分类器训练模块150,用于根据不同行为类别各自对应的多个样本人物在对应样本图像中的多个人体关键点的置信度以及多个人体关键点之间的相对位置关系,对初始SVM分类器进行模型训练,得到SVM行为分类器。
其中,所述归一化处理模块120针对目标人物或样本人物,对该人物在对应图像中的多个人体关键点的位置信息进行归一化处理,得到多个人体关键点之间的相对位置关系的方式,包括:
根据多个人体关键点各自在对应图像中的原图横纵坐标值,确定多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和人体参照点的原图横坐标值之间的差值,与区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和人体参照点的原图纵坐标值之间的差值,与区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
因此,所述归一化处理模块120对目标人物所对应的多个人体关键点各自的位置信息进行归一化处理,得到目标人物所对应的多个人体关键点之间的相对位置关系的方式,可以表达为如下内容:
根据该目标人物在该待识别图像中的多个人体关键点的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
而所述归一化处理模块120对每个样本人物在对应样本图像中的多个人体关键点的位置信息进行归一化处理,得到样本人物在样本图像中的多个人体关键点之间的相对位置关系的方式,可以表达为如下内容:
针对每个样本人物,根据该样本人物在对应样本图像中的多个人体关键点的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
其中,需要说明的是,本申请实施例所提供的人体行为识别装置100,其基本原理及产生的技术效果与前述的人体行为识别方法相同,为简要描述,本实施例部分未提及之处,可参考上述的针对人体行为识别方法的描述内容。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,在本申请提供的一种人体行为识别方法、装置、计算机设备及可读存储介质中,本申请通过获取待识别图像中目标人物的多个人体关键点各自的位置信息及置信度,而后对多个人体关键点各自的位置信息进行归一化处理,得到这多个人体关键点之间的相对位置关系,进而调用预存的SVM行为分类器对这多个人体关键点各自的置信度及这多个人体关键点之间的相对位置关系进行数据分析,得到该目标人物在待识别图像中对应的人体行为类别,由此通过将人体关键点的位置信息及置信度结合到人体行为类别识别过程中,提升人体行为识别精准度,并通过SVM分类器具有的运行高效性,提升人体行为识别效率。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应当以权利要求的保护范围为准。
Claims (10)
1.一种人体行为识别方法,其特征在于,所述方法包括:
获取待识别图像,并对所述待识别图像进行人体关键点检测,得到所述待识别图像中目标人物所对应的多个人体关键点各自的位置信息及置信度;
对所述目标人物所对应的多个人体关键点各自的位置信息进行归一化处理,得到所述目标人物所对应的多个人体关键点之间的相对位置关系;
调用预存的SVM行为分类器对所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系进行数据分析,得到所述目标人物在所述待识别图像中的人体行为类别。
2.根据权利要求1所述的方法,其特征在于,所述SVM行为分类器对应有多个可识别行为类别,所述调用预存的SVM行为分类器对所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系进行数据分析,得到所述目标人物在所述待识别图像中的人体行为类别的步骤,包括:
根据所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系,调用所述SVM行为分类器计算所述目标人物被划分到各可识别行为类别下的概率值;
从计算出的各可识别行为类别的概率值中提取最大概率数值,并将所述最大概率数值与预设概率阈值进行比较;
若所述最大概率数值等于或大于所述预设概率阈值,则将所述最大概率数值所对应的可识别行为类别作为所述目标人物的人体行为类别。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取不同行为类别各自的样本行为数据集,其中所述样本行为数据集包括被划分到相同行为类别下的多个样本人物各自在对应样本图像中的多个人体关键点的位置信息及置信度,不同行为类别各自对应的样本人物数目相同;
对每个样本人物在对应样本图像中的多个人体关键点的位置信息进行归一化处理,得到所述样本人物在所述样本图像中的多个人体关键点之间的相对位置关系;
根据不同行为类别各自对应的多个样本人物在对应样本图像中的多个人体关键点的置信度以及所述多个人体关键点之间的相对位置关系,对初始SVM分类器进行模型训练,得到所述SVM行为分类器。
4.根据权利要求1-3中任意一项所述的方法,其特征在于,针对目标人物或样本人物,对该人物在对应图像中的多个人体关键点的位置信息进行归一化处理,得到所述多个人体关键点之间的相对位置关系的步骤,包括:
根据所述多个人体关键点各自在对应图像中的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
5.一种人体行为识别装置,其特征在于,所述装置包括:
人体检测模块,用于获取待识别图像,并对所述待识别图像进行人体关键点检测,得到所述待识别图像中目标人物所对应的多个人体关键点各自的位置信息及置信度;
归一化处理模块,用于对所述目标人物所对应的多个人体关键点各自的位置信息进行归一化处理,得到所述目标人物所对应的多个人体关键点之间的相对位置关系;
行为识别模块,用于调用预存的SVM行为分类器对所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系进行数据分析,得到所述目标人物在所述待识别图像中的人体行为类别。
6.根据权利要求5所述的装置,其特征在于,所述SVM行为分类器对应有多个可识别行为类别,所述行为识别模块包括:
概率计算子模块,用于根据所述多个人体关键点各自的置信度及所述多个人体关键点之间的相对位置关系,调用所述SVM行为分类器计算所述目标人物被划分到各可识别行为类别下的概率值;
概率比较子模块,用于从计算出的各可识别行为类别的概率值中提取最大概率数值,并将所述最大概率数值与预设概率阈值进行比较;
类别输出子模块,用于若所述最大概率数值等于或大于所述预设概率阈值,则将所述最大概率数值所对应的可识别行为类别作为所述目标人物的人体行为类别。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
样本获取模块,用于获取不同行为类别各自的样本行为数据集,其中所述样本行为数据集包括被划分到相同行为类别下的多个样本人物各自在对应样本图像中的多个人体关键点的位置信息及置信度,不同行为类别各自对应的样本人物数目相同;
所述归一化处理模块,还用于对每个样本人物在对应样本图像中的多个人体关键点的位置信息进行归一化处理,得到所述样本人物在所述样本图像中的多个人体关键点之间的相对位置关系;
分类器训练模块,用于根据不同行为类别各自对应的多个样本人物在对应样本图像中的多个人体关键点的置信度以及所述多个人体关键点之间的相对位置关系,对初始SVM分类器进行模型训练,得到所述SVM行为分类器。
8.根据权利要求5-7中任意一项所述的装置,其特征在于,所述归一化处理模块针对目标人物或样本人物,对该人物在对应图像中的多个人体关键点的位置信息进行归一化处理,得到所述多个人体关键点之间的相对位置关系的方式,包括:
根据所述多个人体关键点各自在对应图像中的原图横纵坐标值,确定所述多个人体关键点的最小外接矩形区域的区域高度及区域宽度,以及对应人体参照点的原图横纵坐标值;
针对每个人体关键点,将该人体关键点的原图横坐标值和所述人体参照点的原图横坐标值之间的差值,与所述区域宽度进行除法运算,得到该人体关键点的归一化横坐标值;
针对每个人体关键点,将该人体关键点的原图纵坐标值和所述人体参照点的原图纵坐标值之间的差值,与所述区域高度进行除法运算,得到该人体关键点的归一化纵坐标值。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序,以实现权利要求1-4中任意一项所述的人体行为识别方法。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1-4中任意一项所述的人体行为识别方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011388513.6A CN112418135A (zh) | 2020-12-01 | 2020-12-01 | 人体行为识别方法、装置、计算机设备及可读存储介质 |
PCT/CN2021/131200 WO2022116829A1 (zh) | 2020-12-01 | 2021-11-17 | 人体行为识别方法、装置、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011388513.6A CN112418135A (zh) | 2020-12-01 | 2020-12-01 | 人体行为识别方法、装置、计算机设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112418135A true CN112418135A (zh) | 2021-02-26 |
Family
ID=74829517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011388513.6A Pending CN112418135A (zh) | 2020-12-01 | 2020-12-01 | 人体行为识别方法、装置、计算机设备及可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112418135A (zh) |
WO (1) | WO2022116829A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113194292A (zh) * | 2021-04-30 | 2021-07-30 | 招商局金融科技有限公司 | 智能设备的协调管理方法、装置、设备及存储介质 |
CN113673459A (zh) * | 2021-08-26 | 2021-11-19 | 中国科学院自动化研究所 | 基于视频的生产施工场所安全巡检方法、系统、设备 |
WO2022116829A1 (zh) * | 2020-12-01 | 2022-06-09 | 深圳市优必选科技股份有限公司 | 人体行为识别方法、装置、计算机设备及可读存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115115988A (zh) * | 2022-06-29 | 2022-09-27 | 中南大学 | 一种人员坠落风险检测方法、系统及存储介质 |
CN115601505B (zh) * | 2022-11-07 | 2023-03-14 | 广州趣丸网络科技有限公司 | 一种人体三维姿态还原方法、装置、电子设备及存储介质 |
CN116612298B (zh) * | 2023-07-18 | 2023-10-13 | 西华大学 | 一种基于局部关键点的行人特征掩膜生成方法 |
CN118116076B (zh) * | 2024-03-04 | 2024-09-03 | 重庆理工大学 | 一种基于人-物互动关系的行为识别方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052896A (zh) * | 2017-12-12 | 2018-05-18 | 广东省智能制造研究所 | 基于卷积神经网络与支持向量机的人体行为识别方法 |
CN110502986A (zh) * | 2019-07-12 | 2019-11-26 | 平安科技(深圳)有限公司 | 识别图像中人物位置方法、装置、计算机设备和存储介质 |
CN111639632A (zh) * | 2020-07-31 | 2020-09-08 | 南京浦和数据有限公司 | 一种基于支持向量机的地铁驾驶员动作序列识别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10769491B2 (en) * | 2017-09-01 | 2020-09-08 | Sri International | Machine learning system for generating classification data and part localization data for objects depicted in images |
CN108229355B (zh) * | 2017-12-22 | 2021-03-23 | 北京市商汤科技开发有限公司 | 行为识别方法和装置、电子设备、计算机存储介质 |
CN112418135A (zh) * | 2020-12-01 | 2021-02-26 | 深圳市优必选科技股份有限公司 | 人体行为识别方法、装置、计算机设备及可读存储介质 |
-
2020
- 2020-12-01 CN CN202011388513.6A patent/CN112418135A/zh active Pending
-
2021
- 2021-11-17 WO PCT/CN2021/131200 patent/WO2022116829A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052896A (zh) * | 2017-12-12 | 2018-05-18 | 广东省智能制造研究所 | 基于卷积神经网络与支持向量机的人体行为识别方法 |
CN110502986A (zh) * | 2019-07-12 | 2019-11-26 | 平安科技(深圳)有限公司 | 识别图像中人物位置方法、装置、计算机设备和存储介质 |
CN111639632A (zh) * | 2020-07-31 | 2020-09-08 | 南京浦和数据有限公司 | 一种基于支持向量机的地铁驾驶员动作序列识别方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022116829A1 (zh) * | 2020-12-01 | 2022-06-09 | 深圳市优必选科技股份有限公司 | 人体行为识别方法、装置、计算机设备及可读存储介质 |
CN113194292A (zh) * | 2021-04-30 | 2021-07-30 | 招商局金融科技有限公司 | 智能设备的协调管理方法、装置、设备及存储介质 |
CN113673459A (zh) * | 2021-08-26 | 2021-11-19 | 中国科学院自动化研究所 | 基于视频的生产施工场所安全巡检方法、系统、设备 |
CN113673459B (zh) * | 2021-08-26 | 2024-05-14 | 中国科学院自动化研究所 | 基于视频的生产施工场所安全巡检方法、系统、设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2022116829A1 (zh) | 2022-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112418135A (zh) | 人体行为识别方法、装置、计算机设备及可读存储介质 | |
US10635890B2 (en) | Facial recognition method and apparatus, electronic device, and storage medium | |
CN107633207B (zh) | Au特征识别方法、装置及存储介质 | |
US10318797B2 (en) | Image processing apparatus and image processing method | |
US10534957B2 (en) | Eyeball movement analysis method and device, and storage medium | |
US7912253B2 (en) | Object recognition method and apparatus therefor | |
US8792722B2 (en) | Hand gesture detection | |
US8750573B2 (en) | Hand gesture detection | |
CN111461165A (zh) | 图像识别方法、识别模型的训练方法及相关装置、设备 | |
KR20210100602A (ko) | 안면 이미지 기반의 리스크 인식 방법, 장치, 컴퓨터 디바이스 및 저장 매체 | |
CN113887487B (zh) | 一种基于CNN-Transformer的面部表情识别方法及装置 | |
CN110569731A (zh) | 一种人脸识别方法、装置及电子设备 | |
CN113449704B (zh) | 人脸识别模型训练方法、装置、电子设备及存储介质 | |
CN104598888B (zh) | 一种人脸性别的识别方法 | |
CN111222380B (zh) | 一种活体检测方法、装置、及其识别模型训练方法 | |
CN111694954B (zh) | 图像分类方法、装置和电子设备 | |
CN113269010B (zh) | 一种人脸活体检测模型的训练方法和相关装置 | |
Zhou et al. | Recognizing fall actions from videos using reconstruction error of variational autoencoder | |
CN112233102A (zh) | 图像样本集中噪声的识别方法、装置、设备及存储介质 | |
CN111860056B (zh) | 基于眨眼的活体检测方法、装置、可读存储介质及设备 | |
CN107886060A (zh) | 基于视频的行人自动检测与跟踪方法 | |
CN104598866B (zh) | 一种基于人脸的社交情商促进方法及系统 | |
CN115761807A (zh) | 一种基于深度学习的人体姿态识别方法及电子设备 | |
CN111723700B (zh) | 一种人脸识别方法、装置及电子设备 | |
CN113743275A (zh) | 一种微表情类型的确定方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210226 |
|
RJ01 | Rejection of invention patent application after publication |