具体实施方式
图1为本发明的一种被动式及交互式实时影像辨识方法的系统示意结构图,如图所示,该系统包括有个人计算机10、影像投射装置11、影像区域11a、摄影机12、影像撷取卡13。
本发明提供一种被动式及交互式实时影像辨识方法,主要辨识对象种类可分为被动式与交互式两大类。其中,被动式与交互式的差异在于影像感应区域的位置。在被动式的辨识模块下,影像感应区域的位置固定;而在交互式的情形正好相反,感应区域会在影像投射装置投射影像区域范围内变动。
本发明所撷取的影像皆为8bits灰阶,其灰阶值范围在0~225之间。
其中,被动式实时影像辨识方法如下:
步骤一:以摄影机12撷取影像投射装置11投射到影像区域11a的影像作为基准参考影像。形成例如5×5的灰阶值矩阵,参照图1和图2。
步骤二:以摄影机12不断撷取影像投射装置11投射至影像区域11a的实时影像。形成例如5×5的灰阶值矩阵,参照图1和图3,检验是否有外物接触感应区域。
上述步骤一的基准参考影像(参照图2)与步骤二的实时影像(参照图3)的差异值可由式子(1)表示:
DIFF(x,y)=|REF(x,y)-NEW(x,y)| (1)
步骤三:将步骤一的基准参考影像的各灰阶值与步骤二的实时影像相对应的各灰阶值相减,即可得到剩余的影像灰阶值分布,如图4所示,非零区域表示有外物接触。
步骤四:经步骤三相减后的影像,通常会有噪声存在,可以通过式子(2)进行消除。
通过式子(2)的二值化方法消除杂点的影响,如图7所示;其中,T*为门限值,在8bits灰阶影像中,门限值的范围为0~255之间。而最佳门限值的决定方式可由统计的方式求得,其最佳门限值为波谷位置的灰阶值,如图5所示,通过决定T*的大小即可将影像分割成二个区间C1,C2,如图6所示,最佳门限值T*的条件为C1内的变异数加上C2内的变异数之和为最小。假设影像的大小为N=5×5,且8bits灰阶影像的灰阶值个数为I=256。则灰阶值为I的概率可表示为式子(3):
此处ni表示灰阶值i在影像中出现的次数,且i的范围为0≤i≤I-1,
根据概率原理可得知式子(4):
假设C1内的像素个数占的比率为式子(5):
而C2内的像素个数占的比率为式子(6):
这里亦满足W1+W2=1。
接下来,也可算出C1的期望值为式子(7):
而C2的期望值为式子(8):
利用式子(7)和式子(8)可求得C1和C2的变异数分别为式子(9)和(10):
则C1和C2的变异数和为式子(11):
接着,只要将0~255之间的数值代入式子(11)中,使式子(11)有最小值的数值就是最佳门限值T*。
步骤五:虽经步骤四的二值化后所残留的噪声已基本消除,但,移动物体会产生一些残破,此种现象将通过四连通屏蔽及其膨胀、侵蚀算法来加以去除,如图8所示。
膨胀的算法如下:当屏蔽Mb(i,j)=255时,便设定其四邻点位置的屏蔽如式子(12):
Mb(i,j-1)=Mb(i,j+1)=Mb(i-1,j)=Mb(i+1,j)=255 (12)
侵蚀的算法如下:当屏蔽时Mb(i,j)=0,便设定其四邻点位置的屏蔽如式子(13):
Mb(i,j-1)=Mb(i,j+1)=Mb(i-1,j)=Mb(i+1,j)=0 (13)
将上述的屏蔽与二值化后的影像通过回旋积分即可消除破碎的现象。
步骤六:接着,我们便可利用侧边屏蔽来取得移动物体的轮廓,此处,我们将采用影像轮廓运算屏蔽(Sobel)屏蔽来取得物体的轮廓,如图9所示。
将Sobel(影像轮廓运算屏蔽)屏蔽与实时影像作回旋积分,如式子(14)(15)所示:
Gx(x,y)=(NEW(x-1,y+1)+2×NEW(x,y+1)+NEW(x+1,y+1))-
(14)
(NEW(x-1,y-1)+2×NEW(x,y-1)+NEW(x+1,y-1))
Gy(i,j)=(NEW(x+1,y-1)+2×NEW(x+1,y)+NEW(x+1,y+1))-
(15)
(NEW(x-1,y-1)+2×NEW(x-1,y)+NEW(x-1,y+1))
利用式子(16)便可得到所撷取影像的边缘:
将上述的边缘影像进行二值化,如式子(17):
其中Te *为最佳门限值,求取最佳门限值的方法和先前相同;接着,将实时影像的二值化轮廓图E(x,y)与相减后的二值化影像BIN(x,y)进行交集的操作后,移动物体的外围轮廓即可求得。
步骤七:感应检测移动物体的外围轮廓边点的坐标是否接触到感应区域,并执行对应的动作。
步骤八:重复上述的所有步骤。
另一交互式实时影像辨识方法的主要步骤包括:影像相减、二值化、影像分割、感应区域图样特征撷取与感应区域图样辨识,其中,感应区域图样特征撷取是以离线方式事前取得,而感应区域图样辨识则是实时处理;由于感应区域在投射影像中为任意形状且可能会有旋转或平移的运动,所以,图样特征值不能受到旋转、平移或缩放效果的影响。此处所采用的图样特征值为待辨识图样的不变矩,不变矩不会受到平移、旋转、大小比例改变的影响。
交互式实时影像辨识方法如下:
步骤一:以摄影机12撷取影像投射装置11投射至影像区域11a的影像作为基准参考影像,如图1和图10所示。
步骤二:以摄影机12不断撷取影像投射装置11投射至影像区域11a的实时影像,如图11所示,其中,影像具有活动影像20,检验是否有外物接触活动感应区域21。
上述步骤一的基准参考影像(参照图10)与步骤二的实时影像(参照图11)的差异值可由式子(1)表示:
DIFF(x,y)=|REF(x,y)-NEW(x,y)| (1)
步骤三:将步骤一的基准参考影像(参照图10)的各灰阶值与步骤二的实时影像(参照图11)相应区域的各灰阶值相减,即得到剩余的影像灰阶值分布,通常会有噪声存在,即通过式子(2)进行二值化的方法消除杂点的影响(参照图12)
步骤四:经上述二值化后,白色部分(参照图12)即是影像中的活动影像20与活动感应区域21,可通过线段编码法将活动影像20与活动感应区域21分割出来(参照图14),该线段编码法是一种以线段储存的方法储存物体中每一点的数据(参照图13),在第1行检测到有一列分割影像,就把它视为第一个物体中的第一列,符号记下1-1,接着,在第2行检测到有两列,第一列因处于1-1的下方,所以记做1-2;而第二列为一新的物体,所以记做2-1,如此检测到第4行时发现,只有一列且位于物体1及物体2的下方,所以原先视为两个物体的影像原来为一物体,但,先记做1-4,等待全部影像扫描完成之后,再作合并的动作。
其中,每个物体储存的信息,包括有:面积区域、周长、物体特征、分割的影像大小、宽度以及物体的总数。
步骤五:当活动影像20与活动感应区域21被分割出之后,接着,就要计算每个物体的特征值,采用七个不变矩来表示物体的特征,其求解过程如下:
一个二值化影像b(m,n)的(k+l)阶矩定义为式子(18):
而,其中心矩的定义可表示为式子(19):
其中,
代表物体的质量中心。
接着,求得式子(19)的正规化中心矩可通过式子(20)得到:
接着,便可由正规化的第二阶矩与第三阶矩导出七个不变矩:
φ1=η2,0+η0,2
φ3=(η3,0-3η1,2)2+(3η2,1-η0,3)2
φ4=(η3,0+η1,2)2+(η2,1+η0,3)2
φ5=(η3,0-3η1,2)(η3,0+η1,2)[(η3,0+η1,2)2-3(η2,1+η0,3)2]
+(3η2,1-η0,3)(η2,1+η0,3)[3(η3,0+η1,2)2-(η2,1+η0,3)2]
φ6=(η2,0-η0,2)[(η3,0+η1,2)2-(η2,1+η0,3)2]
+4η1,1(η3,0+η1,2)(η2,1+η0,3)
φ7=(3η2,1-η0,3)(η3,0+η1,2)[(η3,0+η1,2)2-3(η2,1+η0,3)2]
+(3η1,2-η0,3)(η2,1+η0,3)[3(η3,0+η1,2)2-(η2,1+μ0,3)2]
步骤六:在实际图样辨识的过程中,由于每个类别中的图样极不可能有单一的特征向量值,而是一段范围内的值,且每个图样的特征质会落在该范围内的某个点并无法精确预知,甚至所谓的明确数值范围也未必可得知。对于这种具随机特性的问题,通过概率的概念来描述极为适合。在此处,实时图样辨识的部分,我们采用的是高斯图样类别的贝氏分类器来实时处理待辨识图像,其定义如式子(21):
其中,Dj为第j类图样的决策函数;x=[φ1…φ7]为第j类的特征向量;mj和Cj分别为第j类图样的平均特征向量与共变异数矩阵,当D值为最大时,便归为此第j类图样。当图样辨识完成后,也就决定了感应区域的位置;若影像中有多个活动感应区域21,也就有多个子参考影像,利用被动式实时影像辨识方法的步骤一到步骤八的技术即可判断外物是否接触到子参考影像。辨识的执行步骤可以整理如下:
1.将图形样板事先训练,计算各类别φ1…φ7,再计算各类别的mj及Cj,就可完成分类器的决策准则。
2.将摄影机12所撷取的影像经步骤四的方式分割成多个子影像,并计算每个子影像的Dj(x)。
3.比较出Dj(x)的大小,设法找出最大者为Dk(x),则此图形判定为第k类。
辨识处理后,即可将活动感应区域21准确的寻找出来(参照图15)。
步骤七:活动感应区域21是否有外物接触,并执行对应的动作。
步骤八:重复上述的所有步骤。
以上所述乃是本发明的较佳实施例,根据本发明的构想所作的改变,其产生的功能、作用仍未超出说明书与附图所涵盖的精神时,均应属本发明的保护范围之内。