CN112668379A

CN112668379A - 一种物件定位系统及方法

Info

Publication number: CN112668379A
Application number: CN201911191378.3A
Authority: CN
Inventors: 蔡展鹏; 李峥宇; 汉那斯克卢奇曼杰斯; 郭朕逢
Original assignee: Realtek Singapore Pte Ltd
Current assignee: Realtek Singapore Pte Ltd
Priority date: 2019-10-16
Filing date: 2019-11-28
Publication date: 2021-04-16
Also published as: TW202117667A; TWI729587B; US20210117683A1; US11188756B2

Abstract

本发明涉及一种物件定位系统，包括，物件侦测模组用以参考参考帧中的内容来侦测一当前帧中的物件，及物件定位模组用以根据图形段辨识该物件的位置。物件侦测模组包含差异模组用以计算参考帧与当前帧之间于同一位置的差异以产生差异帧，选定区块侦测模组用于根据预定最小差异值标识该差异帧的一选定区块，及图形段产生模组用以产生该当前帧的图形段。

Description

一种物件定位系统及方法

技术领域

本发明涉及影像辨识系统技术领域，特别地涉及一种物件定位系统及方法。

背景技术

用于侦测物件的影像辨识技术已广泛应用于各种设备，如监控摄像机、车辆安全装置和数字摄像机。这类技术预计将被广泛应用于通过追踪一个目标并确定该目标的行为类型来辨识可疑人员、收集行销信息或进行风险预测等。

移动目标定位和/或分类等影像辨识技术包括各种类型的深度卷积神经网路，然而这些类神经网路需要的计算量大，通常由远端资料中心的高性能服务器处理。这些影像辨识技术并未针对计算能力较低的物联网设备进行优化。

传统用于处理视频帧中的移动区域的方法计算量较大。为了减少由于光线和摄像设备的变化而引起的噪讯影响，可以对参考帧和当前帧的不同影像进行处理。对差分影像(经由像素差分技术处理的影像)进行处理，去除影像差分中孤立的片段，得到处理后的影像，对处理后的影像进行分割，将其分割成不同移动目标对应的不同分割段。但是该方法所需的计算量极大，因此，需要计算量较低的系统和方法来进行影像分割、定位和分类。

发明内容

针对现有技术中存在的技术问题，本发明提出了一种物件定位系统，包括物件侦测模组用以参考参考帧(reference frame)中的内容来侦测当前帧(current frame)中的物件，及物件定位模组用以根据图形段辨识物件的位置。物件侦测模组包括差异模组用以计算参考帧与当前帧之间于同一位置的差异以产生差异帧(difference frame)，选定区块侦测模组用于根据一预定最小差异值标识差异帧的一选定区块，及图形段产生模组用以产生当前帧的图形段，图形段是物件的一部分，并且由差异帧的选定区块与相邻的选定区块相互连接所定义，并用以在光栅扫描中为每一选定图形段分配图形段标签，其中图形段标签识别图形段，并且每个不相邻的图形段都具有不同的图形段标签。

根据跟发明的另一方面提出一种参考在视频帧中的参考帧在当前帧中定位物件的方法，方法包括侦测物件。侦测物件包括产生等于当前帧与参考帧之间的绝对差的差异帧，计算参考帧与当前帧之间同一位置的差异以产生差异帧，将差异帧中具有大于一最小差异值的区块标识为选定区块，及产生当前帧的图形段。图形段是物件的一部分，并且由差异帧的选定区块与相邻的选定区块相互连接所定义，其中图形段标签可识别图形段，并且每个不相邻的图形段都具有不同的图形段标签。

根据跟发明的另一方面提出一种通过光栅扫描产生图像的选定图形段的方法，包括根据第一预定亮度值将像素标识为选定像素，产生选定图形段，及在光栅扫描中为选定图形段的每一选定像素分配图形段标签。选定图形段是由图像的选定像素所定义，相邻选定像素之间相互连接。图形段标签标识选定图形段，并且每个不相邻的图形段标签不同。

附图说明

下面，将结合附图对本发明的优选实施方式进行进一步详细的说明，其中：

图1是实施例中物件定位系统的示意图。

图2是图1物件定位系统的物件侦测模组的示意图。

图3是图2像素差异模组产生的像素差异帧的示意图。

图4是图2图形段产生模组产生的索引帧的示意图。

图5是图2图形段产生模组产生的标签帧的示意图。

图6是图形段标签阵列和图形段标签区块计数阵列的示意图。

图7是图形段产生方法应用于具有文字的图像的示意图。

图8是通过光栅扫描产生的索引图像的示意图。

图9是图形段标签阵列和图形段标签像素计数阵列的示意图。

100 物件定位系统

110 物件侦测模组

120 物件定位模组

130 追踪模组

111 像素差异模组

112 选定区块侦测模组

113 图形段产生模组

114 候选区域模组

210 像素差异帧

211 移动区域

212 选定区块

213 图形段

214 候选区域

215、216 区块

310 索引帧

410 标签帧

710 背景像素

720 选定像素

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在以下的详细描述中，可以参看作为本申请一部分用来说明本申请的特定实施例的各个说明书附图。在附图中，相似的附图标记在不同图式中描述大体上类似的组件。本申请的各个特定实施例在以下进行了足够详细的描述，使得具备本领域相关知识和技术的普通技术人员能够实施本申请的技术方案。应当理解，还可以利用其它实施例或者对本申请的实施例进行结构、逻辑或者电性的改变。

图1是实施例中物件定位系统100的示意图。物件定位系统100中的模组可以通过硬件或软件来实现。物件定位系统100包括物件侦测模组110，物件定位模组120和追踪模组130。物件侦测模组110参考一参考帧(例如，参考帧)在视频帧序列的当前帧中侦测移动物件。物件定位模组120可辨识移动物件的位置。追踪模组130用于追踪移动物件的位置。此外，物件定位模组120还可包括有物件分类(Classification)功能，用以进行辨识物件的类型。

如图1所示，物件定位系统100接收多个视频帧(影像帧)的输入。多个视频帧包括当前帧和在当前帧之前的参考帧。另外，如物件尺寸大小以及物件的移动速率等附加参数也可以输入到物件定位系统100中。参考帧和当前帧之间的帧数可以由物件的移动速率和摄像设备的帧速率决定。物件定位模组120可以处理当前帧以取得关于物件位置和物件类型的信息。

图2是实施例中物件侦测模组110的示意图。图3是实施例中像素差异帧210的示意图。物件侦测模组110包括像素差异模组111，选定区块侦测模组112，图形段产生模组113和候选区域模组114。像素差异模组111用于计算参考帧和当前帧之间同一位置像素的像素值的差异以产生像素差异帧210。实现低计算量的优选方式是使用像素亮度的信息来计算像素差异，其他计算方法仍包含在本发明的范围内，本发明不限于此。选定区块侦测模组112用于识别当前帧的选定区块212(图3中有阴影的任一区块)。选定区块212在侦测帧与参考帧之间的相同位置处的像素值上具有预定的最小差异值。图形段产生模组113用于产生当前帧的图形段213(图3中所有阴影的区块的集合)。图形段213由当前帧的选定区块212所定义，当前帧的选定区块212与相邻的选定区块212彼此连接。候选区域模组114用于产生包含图形段的候选区域214。

物件侦测模组110可以定位包含移动物件的移动区域211。物件侦测模组110可以通过识别选定区块212并产生包围这些选定区块212的边界框来定位移动区域211。如图3所示，图形段213在移动区域211内。图3中像素差异帧210的区块是从当前帧分割而成。区块的大小和形状可以由当前帧中最小和最大之物件的尺寸来定义。例如，区块可以是尺寸为8x8、16x16或20x20的正方形。如果区块尺寸为8x8，则包含64个像素。如果区块尺寸为16x16，则包含256个像素。如果区块尺寸为20x20，则包含400个像素。另外，候选区域214可根据来自物件侦测模组110的位置资讯并由物件侦测模组110来定义。候选区域214包含物体的移动区域211或图形段213的所有选定区块。区块215是具有由照明或摄像装置引起的影像杂讯的区块，区块216是当前帧与参考帧之像素差低于预定最小差异值的区块。区块215和区块216不包括在移动区域211中，因此在本发明中不讨论。

图4是实施例中图形段产生模组113通过光栅扫描和索引分配产生的索引帧310的示意图。像素差异帧210可被输入到图形段产生模组113中。在光栅扫描中检查像素差异帧210的每个区块以标出选定区块。在实施例中，选定区块212被定义为当前帧与参考帧之间在相同位置的像素差大于或等于预定最小差异值的区块。另外，相邻区块被定义为一区块的左，上，左上和右上的区块。在索引帧310中，如果所扫描的区块为非选定区块，则对此区块分配索引值0。否则，如果此区块的所有相邻区块均为非选定区块，则对此区块分配索引值为数字最小的未使用值。若此区块有至少一相邻区块为选定区块，则对此区块分配的索引值为相邻选定区块中的最高索引值。

以下叙述请参考图5和图6。图5是实施例中标签帧410的示意图，标签帧410具有由图形段产生模组113分配给每个区块的图形段标签。图6是实施例中图形段标签阵列和图形段标签区块计数阵列的示意图。如图6所示，每个图形段索引是指向相应图形段标签的指标，而图形段标签可作为指向对应图形段标签区块计数阵列的指标。在光栅扫描期间，如果正在扫描的区块是选定区块，则将所有相邻选定区块的图形段标签的值更改为与选定区块的索引值相同的值。例如，将图形段标签值3分配给图形段标签阵列中索引为1、2和3的选定区块。

除此之外，在光栅扫描之前，图形段标签区块计数阵列被初始化为0。在光栅扫描期间，当为要扫描的区块分配一个图形段标签时，其对应的图形段标签区块计数即增加1。若要扫描的区块是选定区块，则其对应的图形段标签区块计数会增加，而增加的幅度为相邻选定区块的图形段标签区块计数值的总和，之后再将相邻选定区块的图形段标签区块计数值设为0。如图6所示，在本实施例中，索引0的图形段标签为0，包括524个区块。索引1和2的图形段标签为3，索引3的图形段标签也为3，包括52个区块。图形段标签区块计数可以使用在后续的影像处理模组。此外，标明图形段的尺寸可用于后续处理，例如删除由杂讯引起的小图形段或小于目标物件尺寸的图形段。

经过影像处理后可产生像素差异帧210的二位元遮罩(binary mask)。例如，遮罩值1(对应于图形段标签值3)标示选定区块，而其他区块具有遮罩值0(对应于图形段标签值0)。同样，如果像素差异帧210中有一个以上的图形段，则此方法将可让图形段产生模组113将不同的图形段标签分配给不相交的图形段。经过以上影像处理，物件侦测模组110会输出二位元遮罩至候选区域模组114及追踪模组130，并在其中进行进一步的影像处理，例如物件定位和分类以及物件追踪。二位元遮罩通过一次光栅扫描即可产生，缩短影像处理的时间。在一实施例中，系统可以在接收下一帧之前产生二位元遮罩。而只对候选区域进行影像处理可大幅降低计算量，使本方法可以实现于较低运算能力的设备。然而，本方法也可以应用在计算密集型处理方式来获得更好的定位和分类结果，例如深度卷积神经网络。

相同的图形段产生方法也可以应用于固定的图像。图7是实施例中图形段产生方法应用于具有文字的图像的示意图。在图形段产生之后，可以基于像素的像素值(例如：亮度)，将图像的像素区分为背景像素710和选定像素(文字)720，例如，若像素的亮度值低于预定的亮度值，则像素被区分为背景像素710。

图8是实施例中通过光栅扫描产生的索引图像示意图。通过图形段产生方法可将索引分配给每个像素。具有索引值3、4和10的像素属于文字“5”。其后，按光栅扫描的顺序检查图像的每个像素以标出选定像素。在一实施例中，选定像素可以被定义为具有低于第一预定亮度值的像素。在另一个实施例中，选定像素可以被定义为具有高于第二预定亮度值的像素。

相邻像素系定义为一像素的左，上，左上和右上的像素。若扫描的像素是非选定像素，对此像素分配索引值0，否则，若此像素的所有相邻像素都是非选定像素，对此像素分配索引值为数字最小的未使用值。对于具有至少一个相邻像素作为选定像素的像素，则对此像素分配索引值为相邻选定像素中所具有的最高索引值。

图9是实施例中图形段标签阵列和图形段标签像素计数阵列的示意图。在光栅扫描之前，图形段标签像素计数阵列被初始化为0。在光栅扫描期间，当为扫描的像素分配一图形段标签时，其对应的图形段标签像素计数可增加1。如果被扫描的像素是选定像素，则其对应的图形段标签像素计数将增加相邻选定像素的图形段标签像素计数值的总和，之后再将相邻选定像素的图形段标签像素计数值设为0。如图9所示，代表背景像素的索引0的图形段标签为0，索引0的图形段标签像素计数是762。在一实施例中，文字“4”包括103个像素，索引为1且图形段标签为1。文字“1”包括50个像素，索引为6且图形段标签为6。文字“5”包括134个像素，索引为3、4和10且图形段标签为10。文字“2”包括111个像素，索引为9且图形段标签为9。图形段标签像素计数可应用于后续的图像处理。另外，图形段的尺寸也可用于后续的影像处理，例如删除由杂讯引起的小图形段或小于目标文字大小的图形段。每个图形段可输入到物件定位模组120，并且各自被定位为“4”、“1”、“5”和“2”等文字物件。

综上所述，应用本发明实施例的图形段产生方法的物件定位系统可以有效地降低影像处理的计算复杂度。因此，物件定位系统和方法可被应用在具有计算能力不高的设备，例如物联网设备等，以进行影像辨识或其他影像处理。

上述实施例仅供说明本发明之用，而并非是对本发明的限制，有关技术领域的普通技术人员，在不脱离本发明范围的情况下，还可以做出各种变化和变型，因此，所有等同的技术方案也应属于本发明公开的范畴。

Claims

1.一种物件定位系统，包括：

一物件侦测模组，用以参考一参考帧中的内容来侦测一当前帧中的一物件，该物件侦测模组包括：

一差异模组，用以计算该参考帧与该当前帧之间于同一位置的差异以产生一差异帧；

一选定区块侦测模组，用于根据一预定最小差异值标识该差异帧的一选定区块；及

一图形段产生模组，用以产生该当前帧的一图形段，该图形段是该物件的一部分，并且由该差异帧的选定区块与相邻的选定区块相互连接所定义，并用以在光栅扫描中为每一选定图形段分配一图形段标签，其中该图形段标签识别该图形段，并且每个不相邻的图形段都具有不同的图形段标签；及

一物件定位模组，用以根据该图形段辨识该物件的位置。

2.如权利要求1所述的物件定位系统，其中该图形段产生模组另用以对该当前帧的每一区块分配一索引，并且计算具有相同图形段标签的选定区块的数量。

3.如权利要求2所述的物件定位系统，其中该图形段产生模组另用以为该差异帧产生一二位元遮罩(binary mask)。

4.如权利要求1所述的物件定位系统，该物件侦测模组另包括一候选区域(region ofproposal)模组，其中该候选区域模组用以产生包围该图形段的候选区域，以取得关于该物件的信息。

5.如权利要求1所述的物件定位系统，进一步包括：一追踪模组，耦合至该物件侦测模组，用以追踪该物件的位置。

6.如权利要求1所述的物件定位系统，其中该图形段是在该物件侦测模组接收到一下一帧(next frame)之前产生。

7.一种参考在一系列影像帧中的一参考帧在一当前帧中定位一物件的方法，该方法包括：

侦测一物件，包括：

产生等于该当前帧与该参考帧之间的绝对差的一差异帧；

计算该参考帧与该当前帧之间同一位置的差异以产生一差异帧；

将该差异帧中具有大于一最小差异值的区块标识为一选定区块；及

产生该当前帧的一图形段，该图形段是该物件的一部分，并且由该差异帧的选定区块与相邻的选定区块相互连接所定义，其中该图形段标签识别该图形段，并且每个不相邻的图形段都具有不同的图形段标签；及

根据该图形段辨识该物件的一位置。

8.如权利要求7所述的方法，进一步包括：追踪该物件的该位置。

9.如权利要求7所述的方法，其中侦测该物件进一步包括：

为该差异帧的每一区块分配索引；及

计算具有相同图形段标签的选定区块的数量。

10.如权利要求9所述的方法，其中侦测该物件另包括：

为该差异帧产生一二位元遮罩；及

产生包括用于取得该物件的资讯的该图形段的一候选区域。

11.一种通过一光栅扫描产生一图像的一选定图形段的方法，包括：

根据一第一预定亮度值将一像素标识为一选定像素，该像素具有一亮度值；

产生该选定图形段，该选定图形段系由该图像的选定像素所定义，相邻选定像素之间相互连接；及

在该光栅扫描中为该选定图形段的每一选定像素分配一图形段标签，其中该图形段标签标识选定图形段，并且每个不相邻的图形段标签系不同。

12.如权利要求11所述的方法，另包括计算具有相同图形段标签的该些选定像素的数量。

13.如权利要求11所述的方法，另包括为该图像产生一二位元遮罩。