CN109146887B - 一种基于肤色模型和统计特征的手势分割方法 - Google Patents
一种基于肤色模型和统计特征的手势分割方法 Download PDFInfo
- Publication number
- CN109146887B CN109146887B CN201810690714.8A CN201810690714A CN109146887B CN 109146887 B CN109146887 B CN 109146887B CN 201810690714 A CN201810690714 A CN 201810690714A CN 109146887 B CN109146887 B CN 109146887B
- Authority
- CN
- China
- Prior art keywords
- pixel
- diff
- segmentation method
- foreground
- mean
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于肤色模型和统计特征的手势分割方法,包括以下步骤:(1)建立统计模型,将样本空间的样本图像从RGB颜色空间转换到HSV颜色空间和YCbCr,计算若干个通道的统计特征;(2)根据当前图像计算每个像素的平均值作为当前的背景模型,采用均值法区分当前帧每个像素为前景或背景;(3)获取当前图像的前景像素在通道中的色调值K(x,i,j),与对应通道中的统计特征比较判断为皮肤像素或非皮肤像素。该手势分割方法首先通过计算量简单、时间复杂度低的背景差分算法缩小手势区域,然后对剩下的感兴趣区域利用统计特征在HSV和YCbCr混合空间进行手势肤色分割,计算量少,分割精确。
Description
技术领域
本发明涉及手势识别技术领域,具体是一种基于肤色模型和统计特征的手势分割方法。
背景技术
手势识别系统依赖于计算机视觉在任意背景杂波的存在下识别手势,这些手势之后必须能唯一地发出控制信号给计算机或者其他设备。在过去的20年里,许多研究者已经尝试并在识别手势方面取得了这样或那样的成功。一些原始系统的缺点是它们在一般的计算能力下实时性很差和识别准确率不够高,且大多数的这些技术依靠模板匹配或形状描述符并且需要比实时更多的处理时间。此外,使用者被限于佩戴手套或标记来提高可靠性,并要求在相机预设的距离。这些限制条件很多,很影响人机交互的自然性,而且通常这些设备都比较昂贵,尽管基于手套或标记的手势识别通常准确率更高,也不大适合日常使用。而基于视觉的手势识别是利用了单个或者多个摄像头来采集一系列的手势图像,再运用手势识别算法识别手势。同之前基于手套或标记的手势识别相比,基于视觉的手势识别方法使得使用者以更自然、更直接地交互,很符合人类的交互习惯,加上目前基于计算机的手势识别技术的发展已较为成熟,不过基于计算机的视觉的便携性太差,在很多场景中并不适用。
在Android设备上研究手势识别技术有很好的现实意义,除了智能手机,很多电器都开始使用Android系统,比如电视盒子等等。如果能够通过手势识别技术与这些电器交互,将会很方便、很自然地操作。
手势分割方法是手势识别技术一个重要步骤,基于多种数学模型开发出了不同的手势分割方法,比如动态时间规整(DTW)、时延神经网络、有限状态机模板算法、最优估计、粒子滤波和CAMSHIFT算法等等,这些算法计算量大复杂,仅适用在性能较好的计算机中,安卓设备中使用具有很高的延迟。
发明内容
本发明针对上述存在的问题,提供了一种基于肤色模型和统计特征的手势分割方法,计算量少,分割精确。
本发明一种基于肤色模型和统计特征的手势分割方法,包括以下步骤:
(1)建立统计模型,将样本空间的样本图像从RGB颜色空间转换到HSV颜色空间和YCbCr,计算若干个通道的统计特征;
(2)根据当前图像计算每个像素的平均值作为当前的背景模型,采用均值法区分当前帧每个像素为前景或背景;
(3)获取当前图像的前景像素在通道中的色调值K(x,i,j),与对应通道中的统计特征比较判断为皮肤像素或非皮肤像素。
作为进一步的改进,所述统计特征包括H、Cb、Cr通道中像素的均值Mean和方差Var,皮肤像素的判断标准为:
若Mean(H)-Var(H)≤K(H,i,j)≤Mean(H)+Var(H)
且Mean(Cb)-Var(Cb)≤K(Cb,i,j)≤Mean(Cb)+Var(Cb)
且Mean(Cr)-Var(Cr)≤K(Cr,i,j)≤Mean(Cr)+Var(Cr)
则该前景像素为皮肤像素,否则为非皮肤像素。
作为进一步的改进,前景像素的判断标准为:将当前帧像素值I(x,y)减去背景模型中相同位置像素的均值M(x,y),得到的差值D(x,y),若|D(x,y)|小于设定阀值T,则该像素为前景,反之为背景。
作为进一步的改进,所述阀值T的计算方式如下:
T=Mdiff(x,y)+α×STDdif(x,y)
其中,α为常数;Mdiff(x,y),和STDdiff(x,y)分别为每个像素帧间差的平均值和标准差;
其中,其中It代表t时刻图像中(x,y)处的像素值;inter为常数,代表两帧之间的间隔,m为大于0的自然数。
作为进一步的改进,α=2。
作为进一步的改进,inter=3。
作为进一步的改进,M(x,y)>30+inter。
作为进一步的改进,所述均值法流程如下:
a、计算N帧图像的平均值并建立一个初始背景M(x,y),分别计算Mdiff(x,y)和STDdiff(x,y);
b、将当前帧减去M(x,y)得到差D(x,y),与阀值T比较检测前景和背景像素;
c、对M(x,y)、Mdiff(x,y)·和STDdiff(x,y)进行更新:
M′(x,y)=(1-β)×M(x,y)+β×I(x,y)
M′diff(x,y)=(1-β)×Mdiff(x,y)+β×|It(x,y)-It-inter(x,y)
STD′diff(x,y)=(1-β)×SIDdiff(x,y)+β×||It(x,y)-It-inter(x,y)-M′diff(x,y)
其中,0<β<1;
d、返回步骤b直至停止。
作为进一步的改进,所述β=0.5。
作为进一步的改进,所述N=20,图像每帧间隔时间为50ms。
本发明具有以下有益效果:该手势分割方法首先通过计算量简单、时间复杂度低的背景差分算法缩小手势区域,然后对剩下的感兴趣区域利用统计特征在HSV和YCbCr混合空间进行手势肤色分割。
具体实施方式
本实施例一种基于肤色模型和统计特征的手势分割方法,包括以下步骤:
(1)建立统计模型,将样本空间的样本图像从RGB颜色空间转换到HSV颜色空间和YCbCr,计算若干个通道的统计特征;
(2)根据当前图像计算每个像素的平均值作为当前的背景模型,采用均值法区分当前帧每个像素为前景或背景;
(3)获取当前图像的前景像素在通道中的色调值K(x,i,j),与对应通道中的统计特征比较判断为皮肤像素或非皮肤像素。
作为进一步的改进,所述统计特征包括H、Cb、Cr通道中像素的均值Mean和方差Var,皮肤像素的判断标准为:
若Mean(H)-Var(H)≤K(H,i,j)≤Mean(H)+Var(H)
且Mean(Cb)-Var(Cb)≤K(Cb,i,j)≤Mean(Cb)+Var(Cb)
且Mean(Cr)-Var(Cr)≤K(Cr,i,j)≤Mean(Cr)+Var(Cr)
则该前景像素为皮肤像素,否则为非皮肤像素。
作为进一步的改进,前景像素的判断标准为:将当前帧像素值I(x,y)减去背景模型中相同位置像素的均值M(x,y),得到的差值D(x,y),若∣D(x,y)∣小于设定阀值T,则该像素为前景,反之为背景。
作为进一步的改进,所述阀值T的计算方式如下:
T=Mdiff(x,y)+α×STDdiff(x,y)
其中,α为常数;Mdiff(x,y)·和STDdiff(x,y)分别为每个像素帧间差的平均值和标准差;
其中,其中It代表t时刻图像中(x,y)处的像素值;inter为常数,代表两帧之间的间隔,m为大于0的自然数。
作为进一步的改进,α=2。
作为进一步的改进,inter=3。
作为进一步的改进,M(x,y)>30+inter。
作为进一步的改进,所述均值法流程如下:
a、计算N帧图像的平均值并建立一个初始背景M(x,y),分别计算Mdiff(x,y)和STDdiff(x,y);
b、将当前帧减去M(x,y)得到差D(x,y),与阀值T比较检测前景和背景像素;
c、对M(x,y)、Mdiff(x,y)·和STDdiff(x,y)进行更新:
M′(x,y)=(1-β)×M(x,y)+β×I(x,y)
M′diff(x,y)=(1-β)×Mdiff(x,y)+β×|It(x,y)-It-inter(x,y)|
STD′diff(x,y)=(1-β)×SIDdiff(x,y)+β×||It(x,y)-It-inter(x,y)|-M′diff(x,y)|
其中,0<β<1;
d、返回步骤b直至停止。
作为进一步的改进,所述β=0.5。
作为进一步的改进,所述N=20,图像每帧间隔时间为50ms。
实施例中系统通过Android编程获取实验手机前置摄像头的分辨率,在不同的分辨率下测试,获取相应的分割时间,如下表所示:
分辨率 | 640x480 | 1280x720 | 1088x1088 | 1280x960 | 1440x1080 | 1920x1080 |
分割时间(ms) | 59 | 287 | 738 | 1076 | 1260 | 1532 |
在低分辨率下具有较快的反应速度,在低配置的安卓设备中具有很好的使用效果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于肤色模型和统计特征的手势分割方法,其特征在于,包括以下步骤:
(1)建立统计模型,将样本空间的样本图像从RGB颜色空间转换到HSV颜色空间和YCbCr,计算若干个通道的统计特征;
(2)根据当前图像计算每个像素的平均值作为当前的背景模型,采用均值法区分当前帧每个像素为前景或背景;
(3)获取当前图像的前景像素在通道中的色调值K(x,i,j),与对应通道中的统计特征比较判断为皮肤像素或非皮肤像素;
所述统计特征包括H、Cb、Cr
通道中像素的均值Mean和方差Var,皮肤像素的判断标准为:
若Mean(H)-Var(H)≤K(H,i,j)≤Mean(H)+Var(H)
且Mean(Cb)-Var(Cb)≤K(Cb,i,j)≤Mean(Cb)+Var(Cb)
且Mean(Cr)-Var(Cr)≤K(Cr,i,j)≤Mean(Cr)+Var(Cr)
则该前景像素为皮肤像素,否则为非皮肤像素。
2.根据权利要求1所述的手势分割方法,其特征在于,前景像素的判断标准为:将当前帧像素值I(x,y)减去背景模型中相同位置像素的均值M(x,y),得到的差值D(x,y),若∣D(x,y)∣小于设定阀值T,则该像素为前景,反之为背景。
4.根据权利要求3所述的手势分割方法,其特征在于,α=2。
5.根据权利要求3所述的手势分割方法,其特征在于,inter=3。
6.根据权利要求3或5所述的手势分割方法,其特征在于,M(x,y)>30+inter。
7.根据权利要求3所述的手势分割方法,其特征在于,所述均值法流程如下:
a、计算N帧图像的平均值并建立一个初始背景M(x,y),分别计算Mdiff(x,y)和STDdiff(x,y);
b、将当前帧减去M(x,y)得到差D(x,y),与阀值T比较检测前景和背景像素;
c、对M(x,y)、Mdiff(x,y)和STDdiff(x,y)进行更新:
M′(x,y)=(1-β)×M(x,y)+β×I(x,y)
M′diff(x,y)=(1-β)×Mdiff(x,y)+β×|It(x,y)-It-inter(x,y)|
STD′diff(x,y)=(1-β)×SIDdiff(x,y)+β×||It(x,y)-It-inter(x,y)|-M′diff(x,y)|
其中,0<β<1;
d、返回步骤b直至停止。
8.根据权利要求7所述的手势分割方法,其特征在于,所述β=0.5。
9.根据权利要求7所述的手势分割方法,其特征在于,所述N=20,图像每帧间隔时间为50ms。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810690714.8A CN109146887B (zh) | 2018-06-28 | 2018-06-28 | 一种基于肤色模型和统计特征的手势分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810690714.8A CN109146887B (zh) | 2018-06-28 | 2018-06-28 | 一种基于肤色模型和统计特征的手势分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109146887A CN109146887A (zh) | 2019-01-04 |
CN109146887B true CN109146887B (zh) | 2021-09-24 |
Family
ID=64802594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810690714.8A Active CN109146887B (zh) | 2018-06-28 | 2018-06-28 | 一种基于肤色模型和统计特征的手势分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109146887B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012061256A1 (en) * | 2010-11-01 | 2012-05-10 | Robert Bosch Gmbh | Robust video-based handwriting and gesture recognition for in-car applications |
WO2014031538A1 (en) * | 2012-08-20 | 2014-02-27 | Google Inc. | Background detection as an optimization for gesture recognition |
CN104050488A (zh) * | 2014-06-16 | 2014-09-17 | 西安工业大学 | 一种基于切换的卡尔曼滤波模型的手势识别方法 |
US8861847B2 (en) * | 2012-12-21 | 2014-10-14 | Intel Corporation | System and method for adaptive skin tone detection |
CN104318558A (zh) * | 2014-10-17 | 2015-01-28 | 浙江大学 | 复杂场景下基于多信息融合的手势分割方法 |
CN106909895A (zh) * | 2017-02-17 | 2017-06-30 | 华南理工大学 | 一种基于随机投影多核学习的手势识别方法 |
-
2018
- 2018-06-28 CN CN201810690714.8A patent/CN109146887B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012061256A1 (en) * | 2010-11-01 | 2012-05-10 | Robert Bosch Gmbh | Robust video-based handwriting and gesture recognition for in-car applications |
WO2014031538A1 (en) * | 2012-08-20 | 2014-02-27 | Google Inc. | Background detection as an optimization for gesture recognition |
US8861847B2 (en) * | 2012-12-21 | 2014-10-14 | Intel Corporation | System and method for adaptive skin tone detection |
CN104050488A (zh) * | 2014-06-16 | 2014-09-17 | 西安工业大学 | 一种基于切换的卡尔曼滤波模型的手势识别方法 |
CN104318558A (zh) * | 2014-10-17 | 2015-01-28 | 浙江大学 | 复杂场景下基于多信息融合的手势分割方法 |
CN106909895A (zh) * | 2017-02-17 | 2017-06-30 | 华南理工大学 | 一种基于随机投影多核学习的手势识别方法 |
Non-Patent Citations (1)
Title |
---|
基于YCbCr颜色空间手势分割;杨红玲等;《广西民族大学学报(自然科学版)》;20170831;第61-65页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109146887A (zh) | 2019-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20160154469A1 (en) | Mid-air gesture input method and apparatus | |
Premaratne et al. | Hand gesture tracking and recognition system using Lucas–Kanade algorithms for control of consumer electronics | |
WO2017084204A1 (zh) | 一种二维视频流中的人体骨骼点追踪方法及系统 | |
US8620024B2 (en) | System and method for dynamic gesture recognition using geometric classification | |
Qian et al. | A robust real-time face tracking algorithm | |
CN105740945B (zh) | 一种基于视频分析的人群计数方法 | |
CN104268583B (zh) | 基于颜色区域特征的行人重识别方法及系统 | |
Li et al. | Saliency model-based face segmentation and tracking in head-and-shoulder video sequences | |
CN102880865B (zh) | 基于肤色与形态特征的动态手势识别方法 | |
US20110299774A1 (en) | Method and system for detecting and tracking hands in an image | |
CN111144366A (zh) | 一种基于联合人脸质量评估的陌生人脸聚类方法 | |
CN103530599A (zh) | 一种真实人脸和图片人脸的区别方法和系统 | |
CN108197534A (zh) | 一种人头部姿态检测方法、电子设备及存储介质 | |
US8538079B2 (en) | Apparatus capable of detecting location of object contained in image data and detection method thereof | |
WO2022116829A1 (zh) | 人体行为识别方法、装置、计算机设备及可读存储介质 | |
CN109725721B (zh) | 用于裸眼3d显示系统的人眼定位方法及系统 | |
CN105718885B (zh) | 一种人脸特征点跟踪方法 | |
CN106909884B (zh) | 一种基于分层结构和可变形部分模型的手部区域检测方法和装置 | |
CN112712569B (zh) | 一种肤色检测方法、装置、移动终端和存储介质 | |
CN112487981A (zh) | 基于双路分割的ma-yolo动态手势快速识别方法 | |
CN108345867A (zh) | 面向智能家居场景的手势识别方法 | |
CN104866826A (zh) | 一种基于knn和像素比梯度特征的静态手语识别方法 | |
CN109146887B (zh) | 一种基于肤色模型和统计特征的手势分割方法 | |
CN110992426B (zh) | 姿势识别方法和装置、电子设备及存储介质 | |
Youlian et al. | Face detection method using template feature and skin color feature in rgb color space |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: No. 293, Zhongshan Avenue West, Tianhe District, Guangzhou, Guangdong 510000 Applicant after: GUANGDONG POLYTECHNIC NORMAL University Address before: 510665 No. 293, Zhongshan Avenue, Tianhe District, Guangdong, Guangzhou Applicant before: GUANGDONG POLYTECHNIC NORMAL University |
|
GR01 | Patent grant | ||
GR01 | Patent grant |