CN111290582A - 一种基于改进型直线检测的投影交互区域定位方法 - Google Patents

一种基于改进型直线检测的投影交互区域定位方法 Download PDF

Info

Publication number
CN111290582A
CN111290582A CN202010134990.3A CN202010134990A CN111290582A CN 111290582 A CN111290582 A CN 111290582A CN 202010134990 A CN202010134990 A CN 202010134990A CN 111290582 A CN111290582 A CN 111290582A
Authority
CN
China
Prior art keywords
image
projection
positioning
kernel
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010134990.3A
Other languages
English (en)
Other versions
CN111290582B (zh
Inventor
谢巍
潘春文
王缙
张浪文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202010134990.3A priority Critical patent/CN111290582B/zh
Publication of CN111290582A publication Critical patent/CN111290582A/zh
Application granted granted Critical
Publication of CN111290582B publication Critical patent/CN111290582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality

Abstract

本发明公开了一种基于改进型直线检测的投影交互区域定位方法,包括以下步骤:S1、图像采集,对图像进行灰度化处理,按不同权重对RGB三分量进行加权平均得到灰度图像;S2、利用高核拉普拉斯滤波对灰度化图像后进行卷积操作;S3、基于直方图的二值化,采用滑窗法,利用窗体内的直方图特征对每个像素进行去噪筛选;S4、使用霍夫直线检测算法对去噪后图像检测,并利用投影区域的特点筛选出四条边界线,由得到的四条边界线,实现投影区域定位。

Description

一种基于改进型直线检测的投影交互区域定位方法
技术领域
本发明涉及图像处理技术领域,具体为一种基于改进型直线检测的投影交互区域定位方法。
背景技术
人机交互技术是计算机科学的重要研究内容,交互方式也在不断的发展,从最初的鼠标键盘交互到触摸屏交互,到如今较为流行的VR交互,每次新的交互方式都会推动计算机科学的发展,也为使用者带来全新的交互体验。
投影交互是一种利用视觉传感器与投影仪组合形成的交互技术,该交互方式将交互场景投影至墙面或地面,使用者直接在交互平面实现人机交互,与触摸屏交互方式相比,该方式能以较低的成本实现大场景的交互,如今在游戏厅、家庭投影仪以及商场都能见到投影交互的身影。
投影交互的前提是获取投影交互区域的位置,只有正确定位了投影区域位置,才能准确建立起投影界面与计算机的映射关系。实际应用中,非固定的投影平面会使得投影区域位置变换,因此必须设计一种方法使得系统能自动且快速定位投影区域,而直线检测是最直接和常用的方式。标准Hough变换法(Standard Hough Transform)是目前使用最广泛的直线检测方法之一(Hough V,Paul C.Method and means for recognizing complexpatterns:U.S.Patent 3,069,654[P].1962-12-18.),但该方法依赖边缘检测算法的准确性(郑行家,钟宝江.图像直线段检测算法综述与测评[J].计算机工程与应用.2019.06)。在投影交互系统中,由于光线或设备等因素容易导致投影区域边界模糊,而采用如canny和sobel算子的直线检测算法表现效果并不佳。因此,本发明提出一个利用高核拉普拉斯滤波及滑窗法提取图像边缘的直线检测算法以解决投影区域边界模糊问题,并以此实现投影区域的定位。
发明内容
本发明的目的是为解决现有直线检测方法不能很好应用于投影交互区域定位的问题,提出一种基于改进型直线检测的投影交互区域定位方法。
本发明至少通过如下技术方案之一实现。
一种基于改进型直线检测的投影交互区域定位方法,包括以下步骤:
S1、图像采集,对图像进行灰度化处理,按不同权重对RGB三分量进行加权平均得到灰度图像;
S2、利用高核拉普拉斯滤波对灰度化图像后进行卷积操作;
S3、基于直方图的二值化,采用滑窗法,利用窗体内的直方图特征对每个像素进行去噪筛选;
S4、使用霍夫直线检测算法对去噪后图像检测,并利用投影区域的特点筛选出四条边界线,由得到的四条边界线,实现投影区域定位。
进一步地,所述灰度化处理如下:
图像采集为RGB三通道格式,各通道数值为0~255,由于人眼对绿色敏感度最高,蓝色最低,按以下公式得到灰度化图像:
Gray(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)
其中,i,j表示像素的位置,R,G,B分别代表彩色图像的三通道,Gray表示得到的灰度化图像。
进一步地,所述高核拉普拉斯滤波包括使用高核的拉普拉斯核对图像进行卷积,使用15×15大小的核进行滤波。
进一步地,步骤S3具体包括:
对高核拉普拉斯滤波后的图像进行滑窗处理,统计窗体内的像素的水平方向和垂直方向的直方图,根据直方图的分布将窗体中心像素值置0或255。
进一步地,步骤S4具体包括:
对二值化图像进行霍夫直线检测后,得到图像的主要直线,计算每条直线中点与图像中心的极坐标角度θl,θ∈[0,360],根据θl将直线分为上下左右四组,并在每组中筛选出离图像中心最近的直线作为投影区域的边界线,由得到的四条边界线,计算两两交点,实现投影区域定位
与现有技术相比,本发明具备以下优点:
1、所提出的边缘提取算法有效地解决了投影区域模糊边界问题;
2、本发明直接定位出投影区域的顶点坐标,便于坐标校正;
3、不依赖额外的设备。
附图说明
图1是本实施例的一种基于改进型直线检测的投影交互区域定位方法的流程图;
图2是本实施例的高核拉普拉斯滤波图像示例图;
图3是本实施例的自定义滑窗处理图像示例图;
图4是本实施例的最终效果图;
具体实施方式
下面结合附图对本发明作进一步详细说明。
直线检测原理:在图像中给出n个点,假设我们希望找到这些点中位于直线上的点组成的子集,一种可行的方法就是先寻找所有有每对点确定的直线,然后找到所有接近特定直线的点组成的子集。这个过程的问题涉及寻找
Figure BDA0002396269480000021
条直线,并且对每个点要与所有直线执行
Figure BDA0002396269480000022
次比较,这意味着巨大的计算量。在实际图像处理过程中,使用霍夫所提出的直线检测方法:源图像->灰度化图像->阈值二值化图像->霍夫变换直线检测。这种方法在图像背景简单,物体轮廓明显时有很好的效果。
但在本发明的投影图像和需要检测的投影区域如图2所示,投影内容本身复杂多变且在光线和摄像头精度的影响下,投影区域与墙体背景分界线比较模糊,该检测方案在中情况下就容易出现误检和漏检。因此提出如图1所示的一种基于改进型直线检测的投影交互区域定位方法,包括以下步骤:
S1、使用彩色单目摄像头采集图像,对图像进行灰度化处理,由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,按不同权重对RGB三分量进行加权平均得到较合理的灰度图像;
所述灰度化处理如下:
图像采集为RGB三通道格式,各通道数值为0~255,按以下公式得到灰度化图像:
Gray(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)
其中,i,j表示像素的位置,R,G,B分别代表彩色图像的三通道,Gray表示得到的灰度化图像。
S2、利用高核拉普拉斯滤波对灰度化图像后进行卷积操作,包括以下步骤:
1、高核拉普拉斯算子锐化滤波
二维函数f(x,y)的拉普拉斯算子为如下定义的二阶导数:
Figure BDA0002396269480000031
其中x表示图像水平方向坐标,y表示图像垂直方向坐标。
在离散空间如图像的空域中,拉式算子的计算可看作是核与图像的卷积。在图像处理领域中,拉普拉斯算子是图像空间的一种锐化滤波技术。拉式算子常用的核如下:
Figure BDA0002396269480000032
核的大小决定了对图像的锐化程度,由于拉普拉斯算子的二阶导数会导致噪声的增加,一般情况下所用的kenel大小都为3或5进行滤波,而在本发明所使用的kenel大小为15×15,高核拉式锐化后图像如图2所示。之所以使用高核的拉式算子进行滤波的原因是,虽然高核滤波带来了许多强噪声,且使得小物体的轮廓失真,但会进一步增强大物体与背景的区分度,运用合适的滤波方法,将会得到很好的效果。
S3、基于直方图的二值化,采用滑窗法,利用窗体内的直方图特征对每个像素进行去噪筛选;
上述锐化处理后,图像由于进行了高核的拉普拉斯变换,由二阶导数带来了非常多的噪声,基于直方图统计的滑窗滤波方法,只考虑获取横线以及竖线,包括以下步骤:
(1)定义水平方向滑窗窗口W(宽width为w,高height为h),选择w=3,h=50,对于图像Isrc,具体如表1的描述:
表1水平方向滑窗滤波算法
Figure BDA0002396269480000033
Figure BDA0002396269480000041
(2)定义垂直方向滑窗窗口W,选择w=50,h=3,具体如表2的描述:
表2垂直方向滑窗滤波算法
Figure BDA0002396269480000042
经过处理后的滤波图像Idst如图3所示,投影区域边界直线轮廓被很好地提取了出来。
S4、使用霍夫直线检测算法对去噪后图像检测,并利用投影区域的特点筛选出四条边界线,由得到的四条边界线,实现投影区域定位。
霍夫变换:考虑一个点(xi,yi)和一条直线的斜截式方程
yi=axi+b
其中,a表示直线斜率,b表示直线截距。
通过点(xi,yi)的直线有无数条,且对不同的a和b值,都满足这个等式yi=axi+b。然而,将等式写成
b=-axi+yi
的形式并参考ab平面将得到对于定点(xi,yi)的唯一直线方程。再有,在参数空间中,第2点(xj,yj)也有与之相关的一条直线,且这条直线与(xi,yi)相关的直线相交于(a′,b′)点。这里a′是斜率,b′是xy平面上包含点(xi,yi)和点(xj,yj)的直线的截距。对平面上的n个点,每个点都求其在ab平面的直线,并计算这些直线在ab平面上的交点,对于ab平面上的每个点(ai,bj),记录被直线穿过的个数cij
直线筛选与顶点计算如下:
上述步骤S3有效地将投影界面边界直线轮廓提取了出来,然而经霍夫直线检测后会得到许多重复的直线,因此需要进一步过滤这些直线,得到四条边界。方法如下:
(1)确定图像中心位置(xc,yc),计算每条直线相对于该中心的旋转角度,具体做法为:计算每条直线中点坐标(xl,yl),以(xc,yc)为极坐标中心,确定(xl,yl)的极坐标位置以求得角度θl(θ∈[0,360])。
(2)根据θl将直线分为四组:
Figure BDA0002396269480000051
这四组分别对应以(xc,yc)为中心的左(Left)、右(Buttom)、下(Right)、上(Top)四个方向的直线集合。在每个集合当中,选出与(xc,yc)距离最接近的直线。
(3)计算边界顶点。
根据所得的四条直线,求两两相加顶点,求得四个顶点:xt,xb,xl,xr。最终直线检测效果如图4所示,至此投影区域的定位结束。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种基于改进型直线检测的投影交互区域定位方法,其特征在于,包括以下步骤:
S1、图像采集,对图像进行灰度化处理,按不同权重对RGB三分量进行加权平均得到灰度图像;
S2、利用高核拉普拉斯滤波对灰度化图像后进行卷积操作;
S3、基于直方图的二值化,采用滑窗法,利用窗体内的直方图特征对每个像素进行去噪筛选;
S4、使用霍夫直线检测算法对去噪后图像检测,并利用投影区域的特点筛选出四条边界线,由得到的四条边界线,实现投影区域定位。
2.根据权利要求1所述的一种基于改进型直线检测的投影交互区域定位方法,其特征在于,所述灰度化处理如下:
图像采集为RGB三通道格式,各通道数值为0~255,由于人眼对绿色敏感度最高,蓝色最低,因此按以下公式得到灰度化图像:
Gray(i,j)=0.30R(i,j)+0.59G(i,j)+0.11B(i,j)
其中,i,j表示像素的位置,R,G,B分别代表彩色图像的三通道,Gray表示得到的灰度化图像。
3.根据权利要求1所述的一种基于改进型直线检测的投影交互区域定位方法,其特征在于,所述高核拉普拉斯滤波包括使用高核的拉普拉斯核对图像进行卷积,使用15×15大小的核进行滤波。
4.根据权利要求1所述的一种基于改进型直线检测的投影交互区域定位方法,其特征在于,步骤S3具体包括:
对高核拉普拉斯滤波后的图像进行滑窗处理,统计窗体内的像素的水平方向和垂直方向的直方图,根据直方图的分布将窗体中心像素值置0或255。
5.根据权利要求1所述的一种基于改进型直线检测的投影交互区域定位方法,其特征在于,步骤S4具体包括:
对二值化图像进行霍夫直线检测后,得到图像的主要直线,计算每条直线中点与图像中心的极坐标角度θl,θ∈[0,360],根据θl将直线分为上下左右四组,并在每组中筛选出离图像中心最近的直线作为投影区域的边界线,由得到的四条边界线,计算两两交点,实现投影区域定位。
CN202010134990.3A 2020-02-29 2020-02-29 一种基于改进型直线检测的投影交互区域定位方法 Active CN111290582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010134990.3A CN111290582B (zh) 2020-02-29 2020-02-29 一种基于改进型直线检测的投影交互区域定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010134990.3A CN111290582B (zh) 2020-02-29 2020-02-29 一种基于改进型直线检测的投影交互区域定位方法

Publications (2)

Publication Number Publication Date
CN111290582A true CN111290582A (zh) 2020-06-16
CN111290582B CN111290582B (zh) 2021-09-21

Family

ID=71021526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010134990.3A Active CN111290582B (zh) 2020-02-29 2020-02-29 一种基于改进型直线检测的投影交互区域定位方法

Country Status (1)

Country Link
CN (1) CN111290582B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449607A (zh) * 2021-06-07 2021-09-28 上海电机学院 一种试卷自适应分割控制方法
WO2022048617A1 (zh) * 2020-09-04 2022-03-10 深圳光峰科技股份有限公司 一种识别投影位置的方法、装置、系统和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793712A (zh) * 2014-02-19 2014-05-14 华中科技大学 一种基于边缘几何特征的图像识别方法及系统
CN107609451A (zh) * 2017-09-14 2018-01-19 斯坦德机器人(深圳)有限公司 一种基于二维码的高精度视觉定位方法及系统
CN107798703A (zh) * 2016-08-30 2018-03-13 成都理想境界科技有限公司 一种用于增强现实的实时图像叠加方法以及装置
JP2018055496A (ja) * 2016-09-29 2018-04-05 日本電産サンキョー株式会社 媒体認識装置および媒体認識方法
CN108074238A (zh) * 2017-12-29 2018-05-25 惠州市华星光电技术有限公司 基于霍夫变换及高斯拟合的面内mura检测方法及检测系统
CN108416787A (zh) * 2018-03-06 2018-08-17 昆山海克易邦光电科技有限公司 应用于机器视觉检测的工件直线边缘定位方法
CN108647634A (zh) * 2018-05-09 2018-10-12 深圳壹账通智能科技有限公司 图像边框查找方法、装置、计算机设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103793712A (zh) * 2014-02-19 2014-05-14 华中科技大学 一种基于边缘几何特征的图像识别方法及系统
CN107798703A (zh) * 2016-08-30 2018-03-13 成都理想境界科技有限公司 一种用于增强现实的实时图像叠加方法以及装置
JP2018055496A (ja) * 2016-09-29 2018-04-05 日本電産サンキョー株式会社 媒体認識装置および媒体認識方法
CN107609451A (zh) * 2017-09-14 2018-01-19 斯坦德机器人(深圳)有限公司 一种基于二维码的高精度视觉定位方法及系统
CN108074238A (zh) * 2017-12-29 2018-05-25 惠州市华星光电技术有限公司 基于霍夫变换及高斯拟合的面内mura检测方法及检测系统
CN108416787A (zh) * 2018-03-06 2018-08-17 昆山海克易邦光电科技有限公司 应用于机器视觉检测的工件直线边缘定位方法
CN108647634A (zh) * 2018-05-09 2018-10-12 深圳壹账通智能科技有限公司 图像边框查找方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022048617A1 (zh) * 2020-09-04 2022-03-10 深圳光峰科技股份有限公司 一种识别投影位置的方法、装置、系统和存储介质
CN113449607A (zh) * 2021-06-07 2021-09-28 上海电机学院 一种试卷自适应分割控制方法

Also Published As

Publication number Publication date
CN111290582B (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
US10592754B2 (en) Shadow removing method for color image and application
JP5542889B2 (ja) 画像処理装置
JP5699788B2 (ja) スクリーン領域検知方法及びシステム
CN110232389B (zh) 一种基于绿色作物特征提取不变性的立体视觉导航方法
CN112819772B (zh) 一种高精度快速图形检测识别方法
TWI435288B (zh) Image processing apparatus and method, and program product
CN107784669A (zh) 一种光斑提取及其质心确定的方法
CN104966285B (zh) 一种显著性区域的检测方法
CN110414385B (zh) 一种基于单应性变换和特征窗口的车道线检测方法及系统
CN114118144A (zh) 抗干扰的航空遥感图像阴影精准检测方法
CN111290582B (zh) 一种基于改进型直线检测的投影交互区域定位方法
CN104899888A (zh) 一种基于Legendre矩的图像亚像素边缘检测方法
CN107481267A (zh) 一种基于双目视觉的摄像投影交互系统及方法
CN110189347B (zh) 一种测量物体体积的方法及终端
CN111739031A (zh) 一种基于深度信息的作物冠层分割方法
CN104537632A (zh) 基于边缘提取的红外图像直方图增强方法
CN115661110B (zh) 一种透明工件识别与定位的方法
CN116596987A (zh) 一种基于双目视觉的工件三维尺寸高精度测量方法
CN114529715B (zh) 一种基于边缘提取的图像识别方法及系统
CN110633705A (zh) 一种低照度成像车牌识别方法及装置
CN115829943A (zh) 基于超像素分割的图像差异区域检测方法
CN113689365A (zh) 一种基于Azure Kinect的目标跟踪定位方法
CN107895353B (zh) 一种交互式的深度图纹理拷贝瑕疵去除方法
CN113516121A (zh) 一种多特征融合的非机动车车牌区域定位方法
CN111105394A (zh) 一种检测发光小球特征信息的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant