CN113011225A

CN113011225A - 对象检测方法以及电子装置

Info

Publication number: CN113011225A
Application number: CN201911320398.6A
Authority: CN
Inventors: 杨朝勋; 詹尚伦; 陈世泽; 陈建豪
Original assignee: Realtek Semiconductor Corp
Current assignee: Realtek Semiconductor Corp
Priority date: 2019-12-19
Filing date: 2019-12-19
Publication date: 2021-06-22

Abstract

本发明提供一种对象检测方法以及电子装置，其中该对象检测方法包括：利用图像处理电路判断在图像中是否有动作发生以产生判断结果；依据该判断结果，选择性地利用特定边框来识别目标对象以产生识别结果，其中该特定边框代表该目标对象在先前图像中的位置；以及依据该识别结果，选择性地更新该特定边框的信息。

Description

对象检测方法以及电子装置

技术领域

本发明涉及对象检测，尤指一种对象检测方法以及电子装置。

背景技术

近年来对象检测(object detection)已经成为一个普遍被讨论的议题，而其目的在于检测特定对象在输入图像中的位置。目前有许多对象检测的方法都需要对整张输入图像进行扫描(例如采用滑动窗口(sliding window)搭配图像金字塔(image pyramid)等方法来进行扫描)，相当耗费运算成本。然而，当欲检测的对象具有移动的特性(例如人或车)，则可仅针对该输入图像中有动作(motion)的位置进行对象识别以大幅减少整体运算时间及成本。

然而当欲检测的对象停止移动时，会因为动作消失，导致画面中即使出现欲检测的对象，也无法被检测到。另外，在检测对象停止移动的过程中，可能会发生动作区域逐渐缩小的情况，造成截取到的信息不够完整而容易导致误判。因此，需要一种新颖的方法以及电子装置，以在没有副作用或较不会带来副作用的情况下提升对象检测的效能。

发明内容

本发明的目的在于提供一种对象检测(object detection)方法(尤指一种可应用于(applicable to)静态场景中的对象检测方法)以及电子装置，以基于动作(motion)信息的检测提升对象检测的效能。

本发明至少一个实施例提供一种对象检测方法。该对象检测方法包括：利用图像处理电路判断在图像中是否有动作发生以产生判断结果；依据该判断结果，选择性地利用特定边框(bounding box)来识别目标对象以产生识别结果，其中该特定边框代表该目标对象在先前图像中的位置；以及依据该识别结果，选择性地更新该特定边框的信息。

本发明至少一个实施例提供一种电子装置。该电子装置包含相机模块、存储装置、以及耦接至该相机模块以及该存储装置的图像处理电路。该相机模块可用来获取图像，而该存储装置可用来储存特定边框的信息以及背景模型，其中该特定边框代表目标对象在先前图像中的位置。另外，该图像处理电路可用来执行程序代码以对该图像进行对象检测，例如：该图像处理电路判断在该图像中是否有动作发生以产生判断结果；依据该判断结果，该图像处理电路选择性地利用该特定边框来识别该目标对象以产生识别结果；以及依据该识别结果，该图像处理电路选择性地更新该特定边框的信息。

本发明提供的对象检测方法以及电子装置，分别针对有动作以及没有动作的情况提供对应的边框调整机制，以确保在各种情况(例如对象移动中、对象逐渐静止、对象完全静止等情况)均能准确地判断目标对象是否出现在图像中。相较于相关技术，本发明的实施例不会大幅地增加额外成本，因此本发明能在没有副作用或较不会带来副作用的情况下提升对象检测的效能。

附图说明

图1为依据本发明实施例的电子装置的示意图。

图2为依据本发明实施例的一种对象检测方法的工作流程。

图3为依据本发明实施例的图像中的候选边框的示意图。

图4为依据本发明实施例的图像中的候选边框的示意图。

图5为依据本发明实施例的图像中的候选边框的示意图。

图6为依据本发明实施例的图像中的候选边框的示意图。

具体实施方式

图1为依据本发明实施例的电子装置10的示意图，其中电子装置10可包括相机模块120、存储装置140、以及耦接至相机模块120以及存储装置140的图像处理电路160。在本实施例中，相机模块120可用来获取图像IMG，而存储装置140可用来储存特定边框的信息以及背景模型，其中该特定边框代表目标对象(例如人或车)在先前图像中的位置。另外，图像处理电路160可用来执行程序代码160C以对图像IMG进行对象检测(例如检测该目标对象是否出现在图像IMG中)。具体来说，图像处理电路160可判断在图像IMG中是否有动作发生以产生判断结果，例如图像处理电路160可通过前后帧的图像差异(frame difference)或者建立背景模型的方式判断出图像IMG中有对象移动的区域。依据该判断结果，图像处理电路160可选择性地利用该特定边框来识别该目标对象以产生识别结果，例如，图像处理电路160可通过建立在程序代码160C中的一类神经网络模型对该区域进行该目标对象的识别，并且输出对应的信心值，其中该信心值与该区域内的对象为该目标对象的概率正相关(例如，该信心值越大，表示该区域内的对象为该目标对象的概率越高)，而当该信心值大于信心临界值，图像处理电路160即判断该目标对象出现在图像IMG(尤指该区域)中。依据该识别结果，图像处理电路160可选择性地更新该特定边框的信息(例如该特定边框的尺寸和/或位置)，以确保能利用该特定边框的最新信息对下一个图像进行该目标对象的识别。

图2为依据本发明实施例的一种对象检测方法的工作流程，其中该对象检测方法可应用于(applicable to)图1所示的电子装置10。若整体工作流程能得到相同或类似的结果，可以改变图2所示的工作流程中的一个或多个步骤的执行顺序，或者，可以增加、删除或修改该工作流程中的一个或多个步骤。

在步骤210中，图像处理电路160可通过相机模块120取得图像IMG。

在步骤220中，图像处理电路160可判断在图像300中是否有动作发生以产生判断结果。若是，流程进入步骤231；否则，流程进入步骤241。

在步骤231中，图像处理电路160可依据该动作在图像IMG中的位置获取至少一个候选边框。例如，当该目标对象的整体都在移动中，图像处理电路160可依据图像中发生动作的区域获取相对应的候选边框(例如图3所示的图像300中的边框BB₀)。又例如，该目标对象(例如人或车)在停止移动的过程中，该目标对象可能只有部分(partial)区域有动作发生，因此图像处理电路160可据此以产生相对应的一个或多个候选边框(例如图4所示的图像400中的边框BB₁、BB₂及BB₃)。为便于理解，以下说明均以图3所示的边框BB₀作为该特定边框的例子，尤其，作为信心值足够高(例如高于该信心临界值)的该特定边框的例子。

在步骤232中，图像处理电路160可利用所述至少一个候选边框来识别该目标对象，例如判断所述至少一个候选边框(例如边框BB₁、BB₂及BB₃)中的对象是否为该目标对象。若是，流程进入步骤233；否则，流程进入步骤234。

在步骤233中，图像处理电路160可判断所述至少一个候选边框的尺寸(例如边框BB₁、BB₂及BB₃的尺寸总和)是否大于该特定边框(例如边框BB₀)的尺寸，或所述至少一个候选边框(例如边框BB₁、BB₂及BB₃)相对于该特定边框(例如边框BB₀)的重叠率(Intersectionover Union,IoU)是否低于重叠率临界值。若是，流程进入步骤235；否则(例如，所述至少一个候选边框的尺寸小于该特定边框的尺寸且所述至少一个候选边框相对于该特定边框的重叠率大于该重叠率临界值时)，流程进入步骤234。重叠率(IoU)的计算方式如下：

IoU＝(A(BBOX_current∩BBOX_previous))/A(BBOX_previous)；

其中符号A()代表面积，BBOX_current与A(BBOX_current)分别代表当前动作检测获取到的所述至少一个候选边框(例如边框BB₁、BB₂及BB₃)所包围的区域与这个区域的面积(例如边框BB₁、BB₂及BB₃所包围的区域的面积/尺寸)，BBOX_previous与A(BBOX_previous)分别代表先前的候选边框诸如该特定边框(例如边框BB0)所包围的区域与这个区域的面积(例如边框BB₀所包围的区域的面积/尺寸)，而BBOX_current∩BBOX_previous与A(BBOX_current∩BBOX_previous)分别代表当前动作检测获取到的所述至少一个候选边框BBOX_current所包围的区域与先前的候选边框BBOX_previous所包围的区域(例如该特定边框诸如边框BB₀所包围的区域)的交集区域与该交集区域的面积，但本发明不限于此。

在步骤234中，图像处理电路160可避免更新该特定边框的信息。例如，当图像处理电路160在步骤232中判断出边框BB₁、BB₂及BB₃中的对象不是该目标对象时，或者当图像处理电路160在步骤233中判断边框BB₁、BB₂及BB₃的尺寸小于边框BB₀的尺寸且边框BB₁、BB₂及BB₃相对于边框BB₀的重叠率大于该重叠率临界值时，图像处理电路160可维持边框BB₀的信息，以获取该目标对象的完整信息，如图5所示。

在步骤235中，图像处理电路160可依据所述至少一个候选边框更新该特定边框的信息。

在步骤241中，图像处理电路160可利用该特定边框(例如边框BB₀)来识别该目标对象。

在步骤242中，图像处理电路160可调整该特定边框(例如边框BB₀)的尺寸以产生至少一个候选边框，以及利用所述至少一个候选边框来识别该目标对象以产生该识别结果。例如，图像处理电路160可基于边框BB₀的尺寸与位置将边框BB₀放大两倍、四倍及八倍以产生分别具有多个尺寸的多个候选边框(诸如图6所示的图像600中的边框BB_x2、BB_x4及BB_x8)，并且分别计算该多个候选边框的多个信心值，其中该多个信心值中任一信心值与对应于所述任一信心值的候选边框内的对象为该目标对象的概率正相关，例如，信心值越大，对应于这个信心值的候选边框内的对象为该目标对象的概率越高。需注意的是，以上多个不同的放大倍率的数目以及数值并不构成对本发明的限制，该多个不同的放大倍率的数目以及数值可以根据硬件资源的限制(例如运算能力)来设计。

在步骤243中，图像处理电路160可依据在该多个候选边框中信心值最大的候选边框来更新该特定边框的信息。在实际操作中，候选边框的尺寸与该目标对象的尺寸越接近，这个候选边框的信心值越高，因此，在图6所示的实施例中，图像处理电路160可依据边框BB_x8来更新该特定边框的信息。

在步骤250中，图像处理电路160可将以上流程所得到的结果(例如是否检测到该目标对象和/或最新的特定边框的信息)输出并储存至存储装置140中，例如将此结果回传至运行在图像处理电路160上的相关程序模块，但本发明不限于此。

另外，在步骤242以及步骤243中，图像处理电路160将一并产生具有该多个尺寸的多个候选边框再找出其中具有最大信心值的候选边框，但本发明不限于此。在某些实施例中，图像处理电路160可以顺序地将边框BB₀放大两倍、四倍及八倍，而当边框BB₀被放大至特定倍率的尺寸即找到局部最大(local maximum)信心值时(例如，当放大两倍所得到的信心值大于放大前得到的信心值且放大四倍所得到的信心值小于放大两倍所得到的信心值时，放大两倍所得到的信心值即为局部最大信心值)，图像处理电路160可以为了节省运算量而直接将该局部最大信心值当作全局最大(global maximum)信心值。

虽然动作检测大幅减少了传统对象检测方法所需的运算量，但是当被检测的对象逐渐停止移动或是静止不动时，相关技术所使用的动作检测方法可能会把该对象误认为是背景而造成误判。本发明所提供的对象检测方法以及电子装置10可分别针对有检测到动作以及没有检测到动作的情况下触发相对应的机制来寻找信心值最大的候选边框。

例如，在被检测的目标对象停止移动的过程中，这个目标对象可能仅在部分区域有动作发生，此时图像处理电路160可能会获取到尺寸较小的一个或多个候选边框，如图4所示。然而，由于该一个或多个候选边框的尺寸小于在处理先前图像时保留的候选边框(例如该特定边框)的尺寸，且两者重叠率超过重叠率临界值，因此图像处理电路160可直接保留该特定边框以确保能取得最多的信息，如图5所示。

又例如，在被检测的目标对象逐渐靠近电子装置10而造成该特定边框仅能获取到这个目标对象的部分区域，如图6所示的边框BB₀获取到的区域，图像处理电路160可对边框BB₀进行尺寸调整，以找到信心值最高的候选边框。

总结来说，本发明提供的对象检测方法以及电子装置，分别针对有动作以及没有动作的情况提供对应的边框调整机制，以确保在各种情况(例如对象移动中、对象逐渐静止、对象完全静止等情况)均能准确地判断目标对象是否出现在图像中，并且储存有至少一个可靠的候选边框以在对后续输入的图像进行对象检测时使用。相较于相关技术，本发明的实施例不会大幅地增加额外成本，因此本发明能在没有副作用或较不会带来副作用的情况下提升对象检测的效能。

以上所述仅为本发明之较佳实施例，凡依本发明申请专利范围所做的等同变化与修饰，皆应属本发明的涵盖范围。

附图标记说明：

10：电子装置

120：相机模块

140：存储装置

160：图像处理电路

160C：程序代码

IMG、300、400、600：图像

210、220、231、232、233、234、235、241、242、243、250：步骤

BB₀、BB₁、BB₂、BB₃、BB_x2、BB_x4、BB_x8：边框

Claims

1.一种对象检测方法，包括：

利用图像处理电路判断在图像中是否有动作发生以产生判断结果；

依据所述判断结果，选择性地利用特定边框来识别目标对象以产生识别结果，其中所述特定边框代表所述目标对象在先前图像中的位置；以及

依据所述识别结果，选择性地更新所述特定边框的信息。

2.如权利要求1所述的对象检测方法，还包括：

当所述判断结果指出在所述图像中没有动作发生时，利用所述特定边框来识别所述目标对象。

3.如权利要求2所述的对象检测方法，其中利用所述特定边框来识别所述目标对象的步骤包括：

调整所述特定边框的尺寸以产生至少一个候选边框；以及

利用所述至少一个候选边框来识别所述目标对象以产生所述识别结果。

4.如权利要求3所述的对象检测方法，其中，

调整所述特定边框的尺寸以产生所述至少一个候选边框的步骤包括产生分别具有多个尺寸的多个候选边框；以及

利用所述至少一个候选边框来识别所述目标对象以产生所述识别结果包括利用所述图像处理电路分别计算所述多个候选边框的多个信心值，其中所述多个信心值中的任一信心值与对应于所述任一信心值的候选边框内的对象为所述目标对象的概率正相关。

5.如权利要求4所述的对象检测方法，其中依据所述识别结果选择性地更新所述特定边框的信息的步骤包括：依据在所述多个候选边框中信心值最大的候选边框来更新所述特定边框的信息。

6.如权利要求1所述的对象检测方法，其中依据所述判断结果选择性地利用所述特定边框来识别所述目标对象以产生所述识别结果包括：

当所述判断结果指出在所述图像中有动作发生时，依据所述动作在所述图像中的位置获取至少一个候选边框，以及利用所述至少一个候选边框来识别所述目标对象以产生所述识别结果。

7.如权利要求6所述的对象检测方法，其中依据所述识别结果选择性地更新所述特定边框的信息包括：

当所述识别结果指出所述至少一个候选边框内的对象不是所述目标对象时，避免更新所述特定边框的信息。

8.如权利要求6所述的对象检测方法，其中依据所述识别结果选择性地更新所述特定边框的信息包括：

当所述识别结果指出所述至少一个候选边框内的对象是所述目标对象时，依据所述至少一个候选边框的尺寸或所述至少一个候选边框相对于所述特定边框的重叠率选择性地更新所述特定边框的信息。

9.如权利要求8所述的对象检测方法，其中依据所述识别结果选择性地更新所述特定边框的信息包括：

当所述至少一个候选边框的尺寸大于所述特定边框的尺寸或所述至少一个候选边框相对于所述特定边框的重叠率小于临界值时，依据所述至少一个候选边框更新所述特定边框的信息。

10.一种电子装置，包括：

相机模块，用来获取图像；

存储装置，用来储存特定边框的信息，其中所述特定边框代表目标对象在先前图像中的位置；以及

图像处理电路，耦接至所述相机模块以及所述存储装置，用来执行程序代码以对所述图像进行对象检测，其中：

所述图像处理电路判断在所述图像中是否有动作发生以产生判断结果；

依据所述判断结果，所述图像处理电路选择性地利用所述特定边框来识别所述目标对象以产生识别结果；以及

依据所述识别结果，所述图像处理电路选择性地更新所述特定边框的信息。