CN110287787B - 图像识别方法、装置及计算机可读存储介质 - Google Patents
图像识别方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110287787B CN110287787B CN201910421928.XA CN201910421928A CN110287787B CN 110287787 B CN110287787 B CN 110287787B CN 201910421928 A CN201910421928 A CN 201910421928A CN 110287787 B CN110287787 B CN 110287787B
- Authority
- CN
- China
- Prior art keywords
- image
- head
- target
- user
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012706 support-vector machine Methods 0.000 claims abstract description 60
- 238000012544 monitoring process Methods 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 10
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 239000013598 vector Substances 0.000 description 32
- 238000012549 training Methods 0.000 description 18
- 238000012806 monitoring device Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 238000005286 illumination Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003014 reinforcing effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像识别方法,该方法包括:获取监控设备采集到的工作区视频;从工作区视频中提取包含用户的图像,图像包含用户的人体目标区域;根据头肩特征匹配模板确定人体目标区域中的人体头部区域;提取人体头部区域的方向梯度直方图特征以及颜色特征;将方向梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的人体头部区域是否包含头部目标;若是,将颜色特征输入至用于颜色分类的第二支持向量机模型,确定头部目标的颜色;若头部目标的颜色为非预设帽子颜色,确定用户未佩戴帽子。本发明还提出一种图像识别装置以及一种计算机可读存储介质。本发明可以对用户未佩戴帽子的违规行为进行识别,有利于提高监管效率。
Description
技术领域
本发明涉及图像识别技术领域,尤其涉及一种图像识别方法、装置及计算机可读存储介质。
背景技术
为了提高餐饮卫生质量,有关部门提倡商家餐饮实行“明厨亮灶”,“明厨亮灶”是指对餐饮企业员工的一种监督,通过监督可以直观地看到后厨员工的操作是否规范、卫生是否合格、是否出现一些违规操作。目前,在“明厨亮灶”的普及过程中,许多餐饮企业存在“视频不开放、开放不设防,透明不洁净、改造不到位”等问题,企业后厨从业人员的各项违规行为仍然难以杜绝。“明厨亮灶”每天都将产生海量的视频数据,但由于监管人员人力不足、时间精力有限,而无法对“明厨亮灶”产生的视频数据人工逐一核查,不能及时发现后厨从业人员是否佩戴工作帽,监管效率较低。
发明内容
本发明提供一种图像识别方法、装置及计算机可读存储介质,其主要目的在于实现对用户未佩戴帽子的违规行为进行识别,有利于提高监管效率。
为实现上述目的,本发明还提供一种图像识别方法,该方法包括:
获取监控设备采集到的工作区视频;
从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;
获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域;
提取所述人体头部区域的方向梯度直方图特征以及颜色特征;
将所述方向梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;
若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;
若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。
可选地,所述根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域包括:
将所述头肩特征匹配模板分别与所述人体目标区域的多个区域进行对齐;
将所述多个区域分别与所述头肩特征匹配模板进行匹配,通过预设评价函数计算所述多个区域与所述头肩特征匹配模板的多个匹配准确度;
从所述多个匹配准确度中选取匹配准确度最高的匹配准确度对应的区域为所述人体目标区域中的人体头部区域。
可选地,所述从所述工作区视频中提取包含用户的图像包括:
对所述工作区视频进行预处理,得到待识别视频;
获取所述待识别视频中的多帧图像,所述多帧图像中包含不存在所述用户的第一图像以及存在所述用户的第二图像;
基于所述第一图像的像素值建立单高斯分布的背景模型;
将所述第二图像中的像素值与所述背景模型进行匹配检验,得到所述第二图像中的所有背景像素点以及所有前景像素点;
确定所述第二图像中的所有前景像素点为所述包含用户的图像。
可选地,所述获取所述待识别视频中的多帧图像包括:
将所述待识别视频中目标图像的像素点由RGB分量转换为HIS分量;
计算转换后所述目标图像的像素点的平均亮度;
判断所述平均亮度是否小于预设亮度;
若所述平均亮度小于所述预设亮度,对所述待识别视频中的多帧图像进行亮度增强,获取亮度增强后的所述待识别视频中的多帧图像。
可选地,所述方法还包括:
若确定所述用户未佩戴帽子,将包含所述用户的图像发送至监管人员。
此外,为实现上述目的,本发明还提供一种图像识别装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的图像识别程序,所述图像识别程序被所述处理器执行时实现如下步骤:
获取监控设备采集到的工作区视频;
从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;
获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域;
提取所述人体头部区域的方向梯度直方图特征以及颜色特征;
将所述方向梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;
若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;
若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。
可选地,所述图像识别程序可被所述处理器执行,还实现如下步骤:
将所述头肩特征匹配模板分别与所述人体目标区域的多个区域进行对齐;
将所述多个区域分别与所述头肩特征匹配模板进行匹配,通过预设评价函数计算所述多个区域与所述头肩特征匹配模板的多个匹配准确度;
从所述多个匹配准确度中选取匹配准确度最高的匹配准确度对应的区域为所述人体目标区域中的人体头部区域。
可选地,所述图像识别程序可被所述处理器执行,还实现如下步骤:
对所述工作区视频进行预处理,得到待识别视频;
获取所述待识别视频中的多帧图像,所述多帧图像中包含不存在所述用户的第一图像以及存在所述用户的第二图像;
基于所述第一图像的像素值建立单高斯分布的背景模型;
将所述第二图像中的像素值与所述背景模型进行匹配检验,得到所述第二图像中的所有背景像素点以及所有前景像素点;
确定所述第二图像中的所有前景像素点为所述包含用户的图像。
可选地,所述图像识别程序可被所述处理器执行,还实现如下步骤:
将所述待识别视频中目标图像的像素点由RGB分量转换为HIS分量;
计算转换后所述目标图像的像素点的平均亮度;
判断所述平均亮度是否小于预设亮度;
若所述平均亮度小于所述预设亮度,对所述待识别视频中的多帧图像进行亮度增强,获取亮度增强后的所述待识别视频中的多帧图像。
可选地,所述图像识别程序可被所述处理器执行,还实现如下步骤:
若确定所述用户未佩戴帽子,将包含所述用户的图像发送至监管人员。此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有图像识别程序,所述图像识别程序可被一个或者多个处理器执行,以实现如上所述的图像识别方法的步骤。
本发明提出的图像识别方法、装置及计算机可读存储介质,获取监控设备采集到的工作区视频;从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域;提取所述人体头部区域的方向梯度直方图特征以及颜色特征;将所述梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。从而能够直接对监控设备采集到的工作区视频中用户是否佩戴帽子进行识别,无需监管人员一一查看视频进行监管,就能够快速的判断是否存在未佩戴帽子的违规行为,有利于提高监管效率。
附图说明
图1为本发明一实施例提供的图像识别方法的流程示意图;
图2为本发明一实施例提供的图像识别装置的内部结构示意图;
图3为本发明一实施例提供的图像识别装置中图像识别程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种图像识别方法。参照图1所示,为本发明一实施例提供的图像识别方法的流程示意图。该方法可以由一个电子装置执行。
在本实施例中,图像识别方法包括:
步骤S10,获取监控设备采集到的工作区视频。
本实施例中,所述监控设备为安装在厨房内的一个或多个摄像头,该一个或多个摄像头用于对厨房内工作人员工作行为是否违规进行监控。
一种可选实施例中,所述监控设备可以安装时或者安装后进行角度调整,从而监控设备的监控区域能够覆盖到整个工作区域。
一种可选实施例中,将监控设备与后端远程监控中心通过网络进行通信,通过监控设备连续采集工作区各个位置的视频,将获取到的视频数据流传输至远程监控中心,并对视频数据进行分析与处理以是被是否存在违规行为。
本实施中,获取到的工作区视频可以是一天内的多个时间段的视频,该视频包含多张连续的图像。
步骤S20,从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域。
在本实施例中,提取到的用户的图像可以是包括一个用户的图像或者是包括多个用户的图像。
所述用户是指在工作区域的工作人员,例如,厨师。
所述人体目标区域是指包含部分人体(如人体上部分)区域或者包含全部人体的区域。
一种可选实施例中,获取工作视频区中多张图像进行,通过人像识别算法对多张图像进行识别,确定多张图像中包含用户的图像,例如,K-Means聚类算法提取工作区视频中包含用户的图像。
可选的,在本发明另一实施例中,所述从所述工作区视频中提取包含用户的图像包括:
对所述工作区视频进行预处理,得到待识别视频;
获取所述待识别视频中的多帧图像,所述多帧图像中包含不存在所述用户的第一图像以及存在所述用户的第二图像;
基于所述第一图像的像素值建立单高斯分布的背景模型;
将所述第二图像中的像素值与所述背景模型进行匹配检验,得到所述第二图像中的所有背景像素点以及所有前景像素点;
确定所述第二图像中的所有前景像素点为所述包含用户的图像。
本实施例中,对工作区视频进行预处理包括从工作区视频中截取预设时间段内的视频片段。
在其他可选实施例中,对工作区视频进行预处理还可以包括提高所述工作区视频的清晰度等。
所述第一图像可以是一张图像或者是多张图像的集合,例如,第一图像为工作区视频中开始几帧无工作人员的图像。
所述第二图像可以是一张图像或者是多张图像的集合,例如第二图像为工作区域包含工作人员的图像。
基于第一图像的像素值建立单高斯分布的背景模型是指为第一图像中的像素点的分布建立了用单个高斯分布表示的模型。
具体是,假设第一图像中每个像素点的值服从高斯分布,则可以设某个图像点坐标为(x,y),它在t时刻的值为K(x,y,t),即满足:
其中,σ表示每个点的均值,d表示每个点的方差。
本实施例中,将所述第二图像中的像素值与所述背景模型进行匹配检验包括计算第二图像中每个点的像素值与背景模型分布均值的距离(即单高斯分布均值的距离),当某个像素点与背景模型分布均值的距离小于标准差的n(n可取2.5-3)倍时,确定该像素点为背景点,否则,确定该像素点为前景点。从而得到第二图像中所有的背景点的集合为所有背景像素点,以及第二图像中所有的前景点的集合为所有前景像素点。
一种可选实施例中,背景点取值为零,前景点取值为1,从而可以得到包含用户的图像的二值图像。
由于该第一图像为不存在用户的图像,第二图像为存在用户的图像,且用户在连续的视频中为动态的,因此,通过上述步骤可以快速准确的提取出包含用户的图像,该图像中包括用户的人体目标区域。
可选的,在本发明另一实施例中,所述获取所述待识别视频中的多帧图像包括:
将所述待识别视频中目标图像的像素点由RGB分量转换为HIS分量;
计算转换后所述目标图像的像素点的平均亮度;
判断所述平均亮度是否小于预设亮度;
若所述平均亮度小于所述预设亮度,对所述待识别视频中的多帧图像进行亮度增强,获取亮度增强后的所述待识别视频中的多帧图像。
所述目标图像可以为待识别视频中的任意一张图像(如待识别视频中第一张图像,或者待识别视频中最后一张图像,或者待识别视频中中间一张图像)。
在本实施例中,将目标图像中每个像素点由RGB分量转换为HIS分量。具体的,可以通过预设颜色模型转化公式进行转化。
在将目标图像的像素点转换之后,计算目标图像为HIS色彩模型时的平均亮度。
一种可选实施例中,预设亮度为是预先在监控设备监控的工作区采用夜间低光照的方法统计出的该工作区的平均亮度。
当目标图像的像素点的平均亮度低于预设亮度时,表明该目标图像的画面可能过暗,则通过图像增强算法对待识别视频中的多帧图像(如待识别视频中的每一张图像)进行亮度增强。
一种可选实施例中,采用抛物线函数进行亮度增强,具体是:对待识别视频中每帧图像执行以下操作:对未处理的图像进行灰度化,设W分量为亮度信息,λ为亮度增量,W1(x,y)=max(R1(x,y),G1(x,y),B1(x,y)),用抛物线函数对亮度进行非线性变换,λ=W2/W1,,更新图像像素的RGB值:R2=λR1,G2=λG1,B2=λB1。
本实施例中,通过亮度增强可以在整体上对图像进行增强,解决光照强度弱和对比度低的问题,并且能够根据光照分布情况区别对待光照情况不同的区域,达到提亮暗部,同时降低过于亮的区域的亮度,以期达到一种均衡增强的效果。
步骤S30,获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域。
本实施例中,所述头肩特征匹配模板可以为包含人体头肩特征的图像,例如,头肩特征匹配模板为“凸”字形的图像。
进而将该头肩特征匹配模板在人体目标区域中移动获取人体头部区域。
可选的,在本发明另一实施例中,所述根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域包括:
将所述头肩特征匹配模板分别与所述人体目标区域的多个区域进行对齐;
将所述多个区域分别与所述头肩特征匹配模板进行匹配,通过预设评价函数计算所述多个区域与所述头肩特征匹配模板的多个匹配准确度;
从所述多个匹配准确度中选取匹配准确度最高的匹配准确度对应的区域为所述人体目标区域中的人体头部区域。
在本实施例中,可以从某一相同坐标点将头肩特征匹配模板与人体目标区域进行对齐,将对齐的两图像(头肩特征匹配模板以及人体目标区域中与头肩特征匹配模板对齐的对齐区域)进行匹配,计算匹配准确度,然后将头肩特征匹配模板在该人体目标区域中不断移动,计算每次对齐时,对齐的两图像的匹配准确度,从而得到多个匹配准确度。
一种可选实施例中,在进行匹配时,分别计算头肩特征匹配模板以及人体目标区域中与头肩特征匹配模板对齐的对齐区域中非零像素的个数,如假设I(x,y)代表(x,y)位置的像素值,那么I(x,y)∈{0,1},若∑A,∑B表示两个对齐区域中非零像素的个数,则评价函数S为:
其中,评价函数中的Area(A)是由区域A中像素个数相加得到,S∈[0,1],并且若S<0,则确定S=0。
步骤S40,提取所述人体头部区域的方向梯度直方图特征以及颜色特征。
在本实施例中,所述方向梯度直方图(Histogram of Oriented Gradient,HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。方向梯度直方图使用到的一个重要特征就是梯度信息,为了利用这些梯度信息描述对象,方向梯度直方图定义了细胞单元(Cell)来将大的区域划分为多个小的区域,若干个细胞单元就组成了块(Block),在细胞单元中利用直方图统计所有像素的梯度的方向和大小信息,得到的信息形成特征向量,并在块中对特征向量进行归一化。一个到多个块就组成了扫描窗口,把块中归一化之后的特征向量链接起来,就得到了扫描窗口的特征向量。扫描窗口用来对待检测区域进行扫描,从而得到待检测区域的特征,然后利用特征匹配技术就可以对目标对象进行识别检测。在方向梯度直方图中,块与块之间是可以相互重叠的,这样重叠起来的块有利于充分得到检测窗口内的特征信息。
本实施例中,HOG特征通过计算和统计图像局部区域的梯度方向直方图来构成特征。
在本实施例中,使用Prewitt梯度算子对图像(即人体头部区域)进行扫描,从而计算出每个像素点的水平方向梯度大小H(x,y)以及垂直方向的梯度大小V(x,y)。所述梯度在几何意义上可以代表边缘的信息,在数学意义上,梯度就是求的一阶导数,在图像处理领域,梯度可以用梯度算子求得;所述梯度算子在图像中计算梯度采用的方式为卷积运算,其本质为把梯度算子的模板以事先确定的步长在检测窗口上移动,每移动一步,就计算出一个像素水平或垂直梯度的值。
本实施例中,计算人体头部区域中每个像素点(x,y)的梯度幅值G(x,y)和梯度方向σ(x,y),形成图像的梯度矩阵,其中:
在本实施例中,对颜色特征进行提取,可以采用将人体头部区域的像素的RGB分量转换HSI分量之后,对H即色调分量进行统计,H分量可取值的范围是0-360,把这个区间划分为127个统计区间然后对检测窗口中的每一个像素的H分量进行投票,投票的权重即色调对应的饱和度,即S分量,这样就可以对该区域的色彩分布特征得到统计,得到127维颜色特征向量。具体的:
(1)初始化特征向量V为0向量(共127个0):V=[0,0,…,0];
(2)将RGB转化为HIS;
(3)对H分量进行投票统计,得到
Vi=Vi+S
其中,百分号表示取模运算,ROUND表示向量取整。
(4)对特征向量V进行归一化,得到:
其中,ε是接近零的实数,从而避免分母为0。
方向梯度直方图(HOG)作为特征描述符有很多良好的特性,其是在局部区域进行计算,也就是在细胞单元上进行计算,这样HOG作为特征表达对图像进行处理时能够比较好的适应光照变化和形变的影响。
步骤S50,将所述梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标。
本实施例中,所述头部目标是指头部,或者包含头顶的头部区域,
支持向量机(Support Vector Machine,SVM)是一种二分类模型,其通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。
本发明通过支持向量机学习算法对特征向量进行分类,假设训练样本的数据集合为{(xi,yi)|xi∈Rn,yi∈R},其中,样本数据xi是n维空间的向量,这些向量描述了待分类数据的特征,被称为特征向量,yi代表样本数据的类别,根据yi的正负来将样本分为正样本和负样本,本发明中每一个样本的特征向量都可作为一个点,为把正负样本分开,假设在此空间存在一个超平面其中符号<>是向量的内积运算符,w是已知的向量,b是已知的实数,因此,其最优分类函数为:
其中sgn代表符号函数,符号函数判断自变量是否小于零,小于零则函数值为-1,大于等于零则函数值为1。
在一实施例中,可以通过以下步骤得到训练的第一支持向量机模型:
获取训练样本,通过所述训练样本训练预设支持向量机得到训练的支持向量机模型,其中,所述训练样本包括正样本和负样本,所述正样本为包含人体头部的图片,所述负样本为u包含人体头部的人物图片。
在训练时,提取正样本以及负样本的HOG特征,通过将正样本以及负样本输入至预先建立的SVM分类函数(即预设支持向量机或称为SVM分类器)对该SVM分类器进行训练,该SVM分类器包含未知参数,训练SVM分类器的过程即求解该SVM分类器中未知参数的过程,所得到的训练的支持向量机为包含未知参数的参数值的SVM分类函数。
由于获取到了人体头部区域,并不一定能够完全表明该区域有人体头部,因此,通过第一支持向量机进一步准确判断人体头部区域是否包含头部目标,提高识别的准确度。
支持向量机(SVM)可以很好的解决小样本下机器学习问题,且对于二分类问题具有很强的泛化性,经过训练所得到的结论准确度较高,因此,本实施例中,可以准确的识别到人体头部区域是否包含头部目标的图像。
步骤S60,若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色。
在本实施例中,可以通过上述类似方通过训练得到第二支持向量模型,训练的正样本包括戴帽子的图片以及不戴帽子的图片。
在本实施例中,通过第二支持向量机确定头部目标的颜色为预设帽子颜色还是非预设帽子颜色。
步骤S70,若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。
所述预设帽子颜色为根据监管而预先设定的帽子颜色,例如,预设帽子颜色为黑色。
在本实施例中,若用户未佩戴帽子,确定该用户为违规作业。
可选的,在本发明另一实施例中,所述方法还包括:
若确定所述用户未佩戴帽子,将包含所述用户的图像发送至监管人员。
在本实施例中,不直接判断人体目标区域中是否存在帽子,而是,先定位人体头部区域,进而对头部区域进行判断,可以提高判断的准确度(如虽然用户随身携带了帽子也会准确的识别出该用户并未戴帽子),避免了误判,提高了检测的准确度。
本发明提供一种图像识别方法,该方法包括:获取监控设备采集到的工作区视频;从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域;提取所述人体头部区域的方向梯度直方图特征以及颜色特征;将所述梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。从而能够直接对监控设备采集到的工作区视频中用户是否佩戴帽子进行识别,无需监管人员一一查看视频进行监管,就能够快速的判断是否存在未佩戴帽子的违规行为,有利于提高监管效率。
本发明还提供一种图像识别装置。参照图2所示,为本发明一实施例提供的图像识别装置的内部结构示意图。
在本实施例中,图像识别装置1可以是PC(Personal Computer,个人电脑),也可以是智能手机、平板电脑、便携计算机等终端设备。该图像识别装置1至少包括存储器11、处理器12,网络接口13以及通信总线14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是图像识别装置1的内部存储单元,例如该图像识别装置1的硬盘。存储器11在另一些实施例中也可以是图像识别装置1的外部存储设备,例如图像识别装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括图像识别装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于图像识别装置1的应用软件及各类数据,例如图像识别程序200的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行图像识别程序200等。
网络接口13可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该图像识别装置1与其他电子设备之间建立通信连接。
通信总线14用于实现这些组件之间的连接通信。
可选地,该图像识别装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在图像识别装置1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-14以及图像识别程序200的图像识别装置1,本领域技术人员可以理解的是,图2示出的结构并不构成对图像识别装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的图像识别装置1实施例中,存储器11中存储有图像识别程序200;处理器12执行存储器11中存储的图像识别程序200时实现如下步骤:
获取监控设备采集到的工作区视频。
本实施例中,所述监控设备为安装在厨房内的一个或多个摄像头,该一个或多个摄像头用于对厨房内工作人员工作行为是否违规进行监控。
一种可选实施例中,所述监控设备可以安装时或者安装后进行角度调整,从而监控设备的监控区域能够覆盖到整个工作区域。
一种可选实施例中,将监控设备与后端远程监控中心通过网络进行通信,通过监控设备连续采集工作区各个位置的视频,将获取到的视频数据流传输至远程监控中心,并对视频数据进行分析与处理以是被是否存在违规行为。
本实施中,获取到的工作区视频可以是一天内的多个时间段的视频,该视频包含多张连续的图像。
从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域。
在本实施例中,提取到的用户的图像可以是包括一个用户的图像或者是包括多个用户的图像。
所述用户是指在工作区域的工作人员,例如,厨师。
所述人体目标区域是指包含部分人体(如人体上部分)区域或者包含全部人体的区域。
一种可选实施例中,获取工作视频区中多张图像进行,通过人像识别算法对多张图像进行识别,确定多张图像中包含用户的图像,例如,K-Means聚类算法提取工作区视频中包含用户的图像。
可选的,在本发明另一实施例中,所述从所述工作区视频中提取包含用户的图像包括:
对所述工作区视频进行预处理,得到待识别视频;
获取所述待识别视频中的多帧图像,所述多帧图像中包含不存在所述用户的第一图像以及存在所述用户的第二图像;
基于所述第一图像的像素值建立单高斯分布的背景模型;
将所述第二图像中的像素值与所述背景模型进行匹配检验,得到所述第二图像中的所有背景像素点以及所有前景像素点;
确定所述第二图像中的所有前景像素点为所述包含用户的图像。
本实施例中,对工作区视频进行预处理包括从工作区视频中截取预设时间段内的视频片段。
在其他可选实施例中,对工作区视频进行预处理还可以包括提高所述工作区视频的清晰度等。
所述第一图像可以是一张图像或者是多张图像的集合,例如,第一图像为工作区视频中开始几帧无工作人员的图像。
所述第二图像可以是一张图像或者是多张图像的集合,例如第二图像为工作区域包含工作人员的图像。
基于第一图像的像素值建立单高斯分布的背景模型是指为第一图像中的像素点的分布建立了用单个高斯分布表示的模型。
具体是,假设第一图像中每个像素点的值服从高斯分布,则可以设某个图像点坐标为(x,y),它在t时刻的值为K(x,y,t),即满足:
其中,σ表示每个点的均值,d表示每个点的方差。
本实施例中,将所述第二图像中的像素值与所述背景模型进行匹配检验包括计算第二图像中每个点的像素值与背景模型分布均值的距离(即单高斯分布均值的距离),当某个像素点与背景模型分布均值的距离小于标准差的n(n可取2.5-3)倍时,确定该像素点为背景点,否则,确定该像素点为前景点。从而得到第二图像中所有的背景点的集合为所有背景像素点,以及第二图像中所有的前景点的集合为所有前景像素点。
一种可选实施例中,背景点取值为零,前景点取值为1,从而可以得到包含用户的图像的二值图像。
由于该第一图像为不存在用户的图像,第二图像为存在用户的图像,且用户在连续的视频中为动态的,因此,通过上述步骤可以快速准确的提取出包含用户的图像,该图像中包括用户的人体目标区域。
可选的,在本发明另一实施例中,所述获取所述待识别视频中的多帧图像包括:
将所述待识别视频中目标图像的像素点由RGB分量转换为HIS分量;
计算转换后所述目标图像的像素点的平均亮度;
判断所述平均亮度是否小于预设亮度;
若所述平均亮度小于所述预设亮度,对所述待识别视频中的多帧图像进行亮度增强,获取亮度增强后的所述待识别视频中的多帧图像。
所述目标图像可以为待识别视频中的任意一张图像(如待识别视频中第一张图像,或者待识别视频中最后一张图像,或者待识别视频中中间一张图像)。
在本实施例中,将目标图像中每个像素点由RGB分量转换为HIS分量。具体的,可以通过预设颜色模型转化公式进行转化。
在将目标图像的像素点转换之后,计算目标图像为HIS色彩模型时的平均亮度。
一种可选实施例中,预设亮度为是预先在监控设备监控的工作区采用夜间低光照的方法统计出的该工作区的平均亮度。
当目标图像的像素点的平均亮度低于预设亮度时,表明该目标图像的画面可能过暗,则通过图像增强算法对待识别视频中的多帧图像(如待识别视频中的每一张图像)进行亮度增强。
一种可选实施例中,采用抛物线函数进行亮度增强,具体是:对待识别视频中每帧图像执行以下操作:对未处理的图像进行灰度化,设W分量为亮度信息,λ为亮度增量,W1(x,y)=max(R1(x,y),G1(x,y),B1(x,y)),用抛物线函数对亮度进行非线性变换,λ=W2/W1,,更新图像像素的RGB值:R2=λR1,G2=λG1,B2=λB1。
本实施例中,通过亮度增强可以在整体上对图像进行增强,解决光照强度弱和对比度低的问题,并且能够根据光照分布情况区别对待光照情况不同的区域,达到提亮暗部,同时降低过于亮的区域的亮度,以期达到一种均衡增强的效果。
获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域。
本实施例中,所述头肩特征匹配模板可以为包含人体头肩特征的图像,例如,头肩特征匹配模板为“凸”字形的图像。
进而将该头肩特征匹配模板在人体目标区域中移动获取人体头部区域。
可选的,在本发明另一实施例中,所述根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域包括:
将所述头肩特征匹配模板分别与所述人体目标区域的多个区域进行对齐;
将所述多个区域分别与所述头肩特征匹配模板进行匹配,通过预设评价函数计算所述多个区域与所述头肩特征匹配模板的多个匹配准确度;
从所述多个匹配准确度中选取匹配准确度最高的匹配准确度对应的区域为所述人体目标区域中的人体头部区域。
在本实施例中,可以从某一相同坐标点将头肩特征匹配模板与人体目标区域进行对齐,将对齐的两图像(头肩特征匹配模板以及人体目标区域中与头肩特征匹配模板对齐的对齐区域)进行匹配,计算匹配准确度,然后将头肩特征匹配模板在该人体目标区域中不断移动,计算每次对齐时,对齐的两图像的匹配准确度,从而得到多个匹配准确度。
一种可选实施例中,在进行匹配时,分别计算头肩特征匹配模板以及人体目标区域中与头肩特征匹配模板对齐的对齐区域中非零像素的个数,如假设I(x,y)代表(x,y)位置的像素值,那么I(x,y)∈{0,1},若∑A,∑B表示两个对齐区域中非零像素的个数,则评价函数S为:
其中,评价函数中的Area(A)是由区域A中像素个数相加得到,S∈[0,1],并且若S<0,则确定S=0。
提取所述人体头部区域的方向梯度直方图特征以及颜色特征。
在本实施例中,所述方向梯度直方图(Histogram of Oriented Gradient,HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。方向梯度直方图使用到的一个重要特征就是梯度信息,为了利用这些梯度信息描述对象,方向梯度直方图定义了细胞单元(Cell)来将大的区域划分为多个小的区域,若干个细胞单元就组成了块(Block),在细胞单元中利用直方图统计所有像素的梯度的方向和大小信息,得到的信息形成特征向量,并在块中对特征向量进行归一化。一个到多个块就组成了扫描窗口,把块中归一化之后的特征向量链接起来,就得到了扫描窗口的特征向量。扫描窗口用来对待检测区域进行扫描,从而得到待检测区域的特征,然后利用特征匹配技术就可以对目标对象进行识别检测。在方向梯度直方图中,块与块之间是可以相互重叠的,这样重叠起来的块有利于充分得到检测窗口内的特征信息。
本实施例中,HOG特征通过计算和统计图像局部区域的梯度方向直方图来构成特征。
在本实施例中,使用Prewitt梯度算子对图像(即人体头部区域)进行扫描,从而计算出每个像素点的水平方向梯度大小H(x,y)以及垂直方向的梯度大小V(x,y)。所述梯度在几何意义上可以代表边缘的信息,在数学意义上,梯度就是求的一阶导数,在图像处理领域,梯度可以用梯度算子求得;所述梯度算子在图像中计算梯度采用的方式为卷积运算,其本质为把梯度算子的模板以事先确定的步长在检测窗口上移动,每移动一步,就计算出一个像素水平或垂直梯度的值。
本实施例中,计算人体头部区域中每个像素点(x,y)的梯度幅值G(x,y)和梯度方向σ(x,y),形成图像的梯度矩阵,其中:
在本实施例中,对颜色特征进行提取,可以采用将人体头部区域的像素的RGB分量转换HSI分量之后,对H即色调分量进行统计,H分量可取值的范围是0-360,把这个区间划分为127个统计区间然后对检测窗口中的每一个像素的H分量进行投票,投票的权重即色调对应的饱和度,即S分量,这样就可以对该区域的色彩分布特征得到统计,得到127维颜色特征向量。具体的:
(1)初始化特征向量V为0向量(共127个0):V=[0,0,…,0];
(2)将RGB转化为HIS;
(3)对H分量进行投票统计,得到
Vi=Vi+S
其中,百分号表示取模运算,ROUND表示向量取整。
(4)对特征向量V进行归一化,得到:
其中,ε是接近零的实数,从而避免分母为0。
方向梯度直方图(HOG)作为特征描述符有很多良好的特性,其是在局部区域进行计算,也就是在细胞单元上进行计算,这样HOG作为特征表达对图像进行处理时能够比较好的适应光照变化和形变的影响。
将所述梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标。
本实施例中,所述头部目标是指头部,或者包含头顶的头部区域,
支持向量机(Support Vector Machine,SVM)是一种二分类模型,其通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。
本发明通过支持向量机学习算法对特征向量进行分类,假设训练样本的数据集合为{(xi,yi)|xi∈Rn,yi∈R},其中,样本数据xi是n维空间的向量,这些向量描述了待分类数据的特征,被称为特征向量,yi代表样本数据的类别,根据yi的正负来将样本分为正样本和负样本,本发明中每一个样本的特征向量都可作为一个点,为把正负样本分开,假设在此空间存在一个超平面其中符号<>是向量的内积运算符,w是已知的向量,b是已知的实数,因此,其最优分类函数为:
其中sgn代表符号函数,符号函数判断自变量是否小于零,小于零则函数值为-1,大于等于零则函数值为1。
在一实施例中,可以通过以下步骤得到训练的第一支持向量机模型:
获取训练样本,通过所述训练样本训练预设支持向量机得到训练的支持向量机模型,其中,所述训练样本包括正样本和负样本,所述正样本为包含人体头部的图片,所述负样本为u包含人体头部的人物图片。
在训练时,提取正样本以及负样本的HOG特征,通过将正样本以及负样本输入至预先建立的SVM分类函数(即预设支持向量机或称为SVM分类器)对该SVM分类器进行训练,该SVM分类器包含未知参数,训练SVM分类器的过程即求解该SVM分类器中未知参数的过程,所得到的训练的支持向量机为包含未知参数的参数值的SVM分类函数。
由于获取到了人体头部区域,并不一定能够完全表明该区域有人体头部,因此,通过第一支持向量机进一步准确判断人体头部区域是否包含头部目标,提高识别的准确度。
支持向量机(SVM)可以很好的解决小样本下机器学习问题,且对于二分类问题具有很强的泛化性,经过训练所得到的结论准确度较高,因此,本实施例中,可以准确的识别到人体头部区域是否包含头部目标的图像。
若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色。
在本实施例中,可以通过上述类似方通过训练得到第二支持向量模型,训练的正样本包括戴帽子的图片以及不戴帽子的图片。
在本实施例中,通过第二支持向量机确定头部目标的颜色为预设帽子颜色还是非预设帽子颜色。
若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。
所述预设帽子颜色为根据监管而预先设定的帽子颜色,例如,预设帽子颜色为黑色。
在本实施例中,若用户未佩戴帽子,确定该用户为违规作业。
本发明提出的图像识别装置获取监控设备采集到的工作区视频;从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域;提取所述人体头部区域的方向梯度直方图特征以及颜色特征;将所述梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。从而能够直接对监控设备采集到的工作区视频中用户是否佩戴帽子进行识别,无需监管人员一一查看视频进行监管,就能够快速的判断是否存在未佩戴帽子的违规行为,有利于提高监管效率。
可选的,在本发明另一实施例中,处理器12执行存储器11中存储的图像识别程序200时还实现如下步骤:
若确定所述用户未佩戴帽子,将包含所述用户的图像发送至监管人员。
在本实施例中,不直接判断人体目标区域中是否存在帽子,而是,先定位人体头部区域,进而对头部区域进行判断,可以提高判断的准确度(如虽然用户随身携带了帽子也会准确的识别出该用户并未戴帽子),避免了误判,提高了检测的准确度。
可选地,在其他实施例中,图像识别程序200还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述图像识别程序在图像识别装置中的执行过程。
例如,参照图3所示,为本发明图像识别装置一实施例中的图像识别程序的程序模块示意图,该实施例中,图像识别程序200可以被分割为第一获取模块10、第一提取模块20、第二获取模块30、第二提取模块40、第一确定模块50、第二确定模块60和第三确定模块70,示例性地:
第一获取模块10用于:获取监控设备采集到的工作区视频;
第一提取模块20用于:从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;
第二获取30用于:获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域;
第二提取模块40用于:提取所述人体头部区域的方向梯度直方图特征以及颜色特征;
第一确定模块50用于:将所述方向梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;
第二确定模块60用于:若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;
第三确定模块70用于:若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。
上述第一获取模块10、第一提取模块20、第二获取模块30、第二提取模块40、第一确定模块50、第二确定模块60和第三确定模块70等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有图像识别程序,所述图像识别程序可被一个或多个处理器执行,以实现如下操作:
获取监控设备采集到的工作区视频;
从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;
获取头肩特征匹配模板,根据所述头肩特征匹配模板确定所述人体目标区域中的人体头部区域;
提取所述人体头部区域的方向梯度直方图特征以及颜色特征;
将所述方向梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;
若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;
若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。
本发明计算机可读存储介质具体实施方式与上述图像识别装置和方法各实施例基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种图像识别方法,其特征在于,所述方法包括:
获取监控设备采集到的工作区视频;
从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;
获取头肩特征匹配模板,将所述头肩特征匹配模板分别与所述人体目标区域的多个区域进行对齐;
将所述多个区域分别与所述头肩特征匹配模板进行匹配,通过预设评价函数计算所述多个区域与所述头肩特征匹配模板的多个匹配准确度,其中,所述预设评价函数为:
从所述多个匹配准确度中选取匹配准确度最高的匹配准确度对应的区域为所述人体目标区域中的人体头部区域;
提取所述人体头部区域的方向梯度直方图特征以及颜色特征;
将所述方向梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;
若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;
若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。
2.如权利要求1所述的图像识别方法,其特征在于,所述从所述工作区视频中提取包含用户的图像包括:
对所述工作区视频进行预处理,得到待识别视频;
获取所述待识别视频中的多帧图像,所述多帧图像中包含不存在所述用户的第一图像以及存在所述用户的第二图像;
基于所述第一图像的像素值建立单高斯分布的背景模型;
将所述第二图像中的像素值与所述背景模型进行匹配检验,得到所述第二图像中的所有背景像素点以及所有前景像素点;
确定所述第二图像中的所有前景像素点为所述包含用户的图像。
3.如权利要求2所述的图像识别方法,其特征在于,所述获取所述待识别视频中的多帧图像包括:
将所述待识别视频中目标图像的像素点由RGB分量转换为HIS分量;
计算转换后所述目标图像的像素点的平均亮度;
判断所述平均亮度是否小于预设亮度;
若所述平均亮度小于所述预设亮度,对所述待识别视频中的多帧图像进行亮度增强,获取亮度增强后的所述待识别视频中的多帧图像。
4.如权利要求1至3中任一项所述的图像识别方法,其特征在于,所述方法还包括:
若确定所述用户未佩戴帽子,将包含所述用户的图像发送至监管人员。
5.一种图像识别装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的图像识别程序,所述图像识别程序被所述处理器执行时实现如下步骤:
获取监控设备采集到的工作区视频;
从所述工作区视频中提取包含用户的图像,所述图像包含所述用户的人体目标区域;
获取头肩特征匹配模板,将所述头肩特征匹配模板分别与所述人体目标区域的多个区域进行对齐;
将所述多个区域分别与所述头肩特征匹配模板进行匹配,通过预设评价函数计算所述多个区域与所述头肩特征匹配模板的多个匹配准确度,其中,所述预设评价函数为:
从所述多个匹配准确度中选取匹配准确度最高的匹配准确度对应的区域为所述人体目标区域中的人体头部区域;
提取所述人体头部区域的方向梯度直方图特征以及颜色特征;
将所述方向梯度直方图特征输入至用于人体分类的第一支持向量机模型,确定识别到的所述人体头部区域是否包含头部目标;
若所述人体头部区域包含头部目标,将所述颜色特征输入至用于颜色分类的第二支持向量机模型,确定所述头部目标的颜色;
若所述头部目标的颜色为非预设帽子颜色,确定所述用户未佩戴帽子。
6.如权利要求5所述的图像识别装置,其特征在于,所述图像识别程序可被所述处理器执行,还实现如下步骤:
对所述工作区视频进行预处理,得到待识别视频;
获取所述待识别视频中的多帧图像,所述多帧图像中包含不存在所述用户的第一图像以及存在所述用户的第二图像;
基于所述第一图像的像素值建立单高斯分布的背景模型;
将所述第二图像中的像素值与所述背景模型进行匹配检验,得到所述第二图像中的所有背景像素点以及所有前景像素点;
确定所述第二图像中的所有前景像素点为所述包含用户的图像。
7.如权利要求6所述的图像识别装置,其特征在于,所述图像识别程序可被所述处理器执行,还实现如下步骤:
将所述待识别视频中目标图像的像素点由RGB分量转换为HIS分量;
计算转换后所述目标图像的像素点的平均亮度;
判断所述平均亮度是否小于预设亮度;
若所述平均亮度小于所述预设亮度,对所述待识别视频中的多帧图像进行亮度增强,获取亮度增强后的所述待识别视频中的多帧图像。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有图像识别程序,所述图像识别程序可被一个或者多个处理器执行,以实现如权利要求1至4中任一项所述的图像识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910421928.XA CN110287787B (zh) | 2019-05-21 | 2019-05-21 | 图像识别方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910421928.XA CN110287787B (zh) | 2019-05-21 | 2019-05-21 | 图像识别方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110287787A CN110287787A (zh) | 2019-09-27 |
CN110287787B true CN110287787B (zh) | 2022-05-06 |
Family
ID=68002693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910421928.XA Active CN110287787B (zh) | 2019-05-21 | 2019-05-21 | 图像识别方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110287787B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242156B (zh) * | 2019-11-13 | 2022-02-08 | 南通大学 | 一种用于微血管瘤病历图像的超平面近邻分类方法 |
CN110909689A (zh) * | 2019-11-26 | 2020-03-24 | 浪潮软件股份有限公司 | 一种厨房监控方法及系统 |
CN111191581B (zh) * | 2019-12-27 | 2024-04-12 | 深圳供电局有限公司 | 基于电力施工的安全帽检测方法、装置和计算机设备 |
CN111881787A (zh) * | 2020-07-13 | 2020-11-03 | 深圳力维智联技术有限公司 | 基于摄像头的门店违规经营行为识别方法及系统 |
CN111739016B (zh) * | 2020-07-20 | 2020-12-08 | 平安国际智慧城市科技股份有限公司 | 目标检测模型训练方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567998A (zh) * | 2012-01-06 | 2012-07-11 | 西安理工大学 | 基于双模板匹配和边缘细化的头肩序列图像分割方法 |
CN104063722A (zh) * | 2014-07-15 | 2014-09-24 | 国家电网公司 | 一种融合hog人体目标检测和svm分类器的安全帽识别方法 |
CN107016373A (zh) * | 2017-04-12 | 2017-08-04 | 广东工业大学 | 一种安全帽佩戴的检测方法及装置 |
CN107679524A (zh) * | 2017-10-31 | 2018-02-09 | 天津天地伟业信息系统集成有限公司 | 一种基于视频的安全帽佩戴情况的检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015045919A (ja) * | 2013-08-27 | 2015-03-12 | トヨタ自動車株式会社 | 画像認識方法及びロボット |
CN107909081B (zh) * | 2017-10-27 | 2022-04-08 | 东南大学 | 一种深度学习中图像数据集的快速获取和快速标定方法 |
-
2019
- 2019-05-21 CN CN201910421928.XA patent/CN110287787B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567998A (zh) * | 2012-01-06 | 2012-07-11 | 西安理工大学 | 基于双模板匹配和边缘细化的头肩序列图像分割方法 |
CN104063722A (zh) * | 2014-07-15 | 2014-09-24 | 国家电网公司 | 一种融合hog人体目标检测和svm分类器的安全帽识别方法 |
CN107016373A (zh) * | 2017-04-12 | 2017-08-04 | 广东工业大学 | 一种安全帽佩戴的检测方法及装置 |
CN107679524A (zh) * | 2017-10-31 | 2018-02-09 | 天津天地伟业信息系统集成有限公司 | 一种基于视频的安全帽佩戴情况的检测方法 |
Non-Patent Citations (1)
Title |
---|
"复杂背景下的头肩像检测与定位";何英昊;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20041215(第4期);正文第1页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110287787A (zh) | 2019-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287787B (zh) | 图像识别方法、装置及计算机可读存储介质 | |
US10635946B2 (en) | Eyeglass positioning method, apparatus and storage medium | |
CN109740478B (zh) | 车辆检测及识别方法、装置、计算机设备及可读存储介质 | |
US8792722B2 (en) | Hand gesture detection | |
US8750573B2 (en) | Hand gesture detection | |
Soltany et al. | Fast and accurate pupil positioning algorithm using circular Hough transform and gray projection | |
Yuan et al. | Robust traffic sign recognition based on color global and local oriented edge magnitude patterns | |
US10534957B2 (en) | Eyeball movement analysis method and device, and storage medium | |
CN109409355B (zh) | 一种新型变压器铭牌识别的方法及装置 | |
CN107909081B (zh) | 一种深度学习中图像数据集的快速获取和快速标定方法 | |
CN102704215B (zh) | 基于dst文件解析与机器视觉结合的绣布自动切割方法 | |
Elrefaei et al. | Automatic electricity meter reading based on image processing | |
CN108090511B (zh) | 图像分类方法、装置、电子设备及可读存储介质 | |
Abate et al. | BIRD: Watershed based iris detection for mobile devices | |
CN102332086A (zh) | 一种基于双阈值局部二进制模式的人脸识别方法 | |
CN110717497B (zh) | 图像相似度匹配方法、装置及计算机可读存储介质 | |
CN107103266B (zh) | 二维人脸欺诈检测分类器的训练及人脸欺诈检测方法 | |
CN103440035A (zh) | 一种三维空间中的手势识别系统及其识别方法 | |
CN113989944B (zh) | 操作动作识别方法、装置及存储介质 | |
CN110991434B (zh) | 自助终端证件识别方法及装置 | |
CN112085721A (zh) | 基于人工智能的水淹车定损方法、装置、设备及存储介质 | |
CN108830908A (zh) | 一种基于人工神经网络的魔方颜色识别方法 | |
CN110569716A (zh) | 一种货架图像翻拍检测方法 | |
CN113221812A (zh) | 人脸关键点检测模型的训练方法和人脸关键点检测方法 | |
Bala et al. | Image simulation for automatic license plate recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220923 Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000 Patentee after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd. Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000 Patentee before: Ping An International Smart City Technology Co.,Ltd. |