CN101079948B

CN101079948B - 影像主体位置检测方法

Info

Publication number: CN101079948B
Application number: CN200610084526A
Authority: CN
Inventors: 徐纬
Original assignee: Primax Electronics Ltd
Current assignee: Primax Electronics Ltd
Priority date: 2006-05-25
Filing date: 2006-05-25
Publication date: 2010-05-12
Anticipated expiration: 2026-05-25
Also published as: CN101079948A

Abstract

本发明揭示一种影像主体位置检测方法。该方法包含：将目标影像划分为多个影像区块；计算该多个影像区块所对应的多个清晰度值；以及分析该多个清晰度值，以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块。因此，本发明的方法能找出正确的主体位置，经过实验证实，即使影像模糊、影像亮度较低、影像背景较为复杂或主体不在中央的影像，本发明的方法大多都能找出正确的主体位置。此外，由于本发明的方法仅需执行简单的被动式影像分析，并不需要额外的部件，故不会增加硬件成本。另外，本发明的方法可设计成技术模块，导入各种不同的平台之中，以提供主体位置检测的服务给后端的应用。

Description

影像主体位置检测方法

技术领域

本发明涉及影像的主体位置检测，尤其涉及一种应用了清晰度计算的概念的影像主体位置检测方法。

背景技术

影像的主体位置检测(也就是说检测影像中主体(object)的所在位置)是一种应用极为广泛的技术，举例来说，其可应用于：1.保全监视系统(例如用来进行主体追踪、主体锁定或特征放大)、2.数码相机/数码摄影机(例如用来进行自动对焦(Auto focus)、自动曝光(Auto exposure)、或自动白平衡(Auto white balance))、3.辨识/检测系统(例如用来进行车牌辨识、机器人的物体辨识/导引)、4.国防工业(例如用来进行影像导弹追踪辅助)、5.研究(例如用来进行影像分析)。

一般而言，影像主体位置检测必须提供正确的主体位置检测结果给后端的应用，如此一来，后端的应用才有办法依据正确的主体位置来执行正确的操作(例如特征放大、调整白平衡等)。若影像主体位置检测的检测结果是错误的，则很可能会导致后端的应用产生错误的操作结果。

图1所示为现有技术利用影像主体位置检测来执行自动对焦的示意图。对于目标影像100而言，现有技术为比较目标影像100内的中检测区块110、左检测区块120、右检测区块130、上检测区块140以及下检测区块150的平均亮度，以判断这五个预设的检测区块中，哪一个是对应于目标影像100的主体位置的检测区块，并以所决定出的检测区块作为自动对焦的标的。然而，对于现有技术而言，其预设的检测区块的形状、大小与位置都是固定的，并不能可适性地变更预设的检测区块的形状、大小或位置。此外，现有技术所辨识出目标影像100的主体位置，一定是前述五个预设的检测区块的其中之一。若目标影像100的主体位置并未位于前述五个预设的检测区块中，则现有技术的主体位置检测将可能产生错误的检测结果。此外，若目标影像100中包含有一个以上不相邻的主体位置时，现有技术的主体位置检测却只能于前述五个预设的检测区块中，选择出其中之一作为目标影像100的主体位置，其并没有办法确实反应出目标影像100中包含有一个以上不相邻的主体位置的现象。举例来说，若同时在左检测区块120中的左侧以及在右检测区块130中的右侧各有一主体时，现有技术的作法将只能选择左侧检测区块120与右检测区块130的其中之一作为目标影像100的主体位置。如此的主体位置检测的结果不可能保证是正确的。此外，由于检测区块的形状、大小或位置都是固定的，当主体的形状特异时，现有技术也没有办法对主体的形状作更精确的辨识。

发明内容

因此，本发明的目的之一，在于提供一种能可适性地检测出影像的主体位置的影像主体位置检测方法。

本发明的实施例揭示一种影像主体位置检测方法.该方法包含：将目标影像划分为多个影像区块；计算该多个影像区块所对应的多个清晰度值；以及分析该多个清晰度值，以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块.

根据所述的方法，其中分析该多个清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含：将该多个清晰度值依照大小进行排序；计算该多个清晰度值所对应的清晰度值总和；从该多个影像区块中，选择出累加的清晰度值达到该清晰度值总和的预定百分比的影像区块，作为对应于该目标影像的主体位置的影像区块。

根据所述的方法，其中该预定百分比介于0％至60％之间。

根据所述的方法，其中该预定百分比为40％。

根据所述的方法，其中分析该多个清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含：从该多个影像区块中，选择出清晰度值落于该多个清晰度值的预定百分比区间内的影像区块，作为对应于该目标影像的主体位置的影像区块。

根据所述的方法，其中该预定百分比区间为该多个清晰度值的前百分之六十的区间的子区间。

根据所述的方法，其中该预定百分比区间为该多个清晰度值的前百分之四十的区间。

根据所述的方法，其中分析该多个清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含：将该多个清晰度值分别乘上所对应的加权因子以得出多个已加权清晰度值；以及分析该多个已加权清晰度值，以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块。

根据所述的方法，其中分析该多个已加权清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含：将该多个影像区块依照已加权清晰度值进行排序；计算该多个已加权清晰度值所对应的已加权清晰度值总和；从该多个影像区块中，选择出累加的已加权清晰度值达到该已加权清晰度值总和的预定百分比的影像区块，作为对应于该目标影像的主体位置的影像区块。

根据所述的方法，其中该预定百分比介于0％至60％之间。

根据所述的方法，其中该预定百分比为40％。

根据所述的方法，其中分析该多个已加权清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含：从该多个影像区块中，选择出已加权清晰度值落于该多个已加权清晰度值的预定百分比区间内的影像区块，作为对应于该目标影像的主体位置的影像区块。

根据所述的方法，其中该预定百分比区间为该多个已加权清晰度值的前百分之六十的区间的子区间。

根据所述的方法，其中该预定百分比区间为该多个已加权清晰度值的前百分之四十的区间。

从上述技术方案我们可以看出，本发明的方法能找出正确的主体位置，经过实验证实，即使影像模糊、影像亮度较低、影像背景较为复杂或主体不在中央的影像，本发明的方法大多都能找出正确的主体位置.此外，由于本发明的方法仅需执行简单的被动式影像分析，并不需要额外的部件，故不会增加硬件成本.另外，本发明的方法也可以设计成技术模块，导入各种不同的平台之中，以提供主体位置检测的服务给后端的应用.

附图说明

图1为现有技术利用影像主体位置检测来执行自动对焦的示意图。

图2为本发明的影像主体位置检测方法的实施例流程图。

具体实施方式

简单地说，本发明将清晰度(sharpness)的概念，应用于影像主体位置检测的技术之中。图2所示为本发明的影像主体位置检测方法的实施例流程图。本流程图中包含以下步骤：

步骤210：将目标影像划分为多个影像区块{IB_x，y|1＜＝x＜＝M，1＜＝y＜＝N}。此相当于将该目标影像沿着横轴划分成M等分，并沿着纵轴划分成N等分(如此一来，该目标影像将被划分为M×N个影像区块)，其中，M与N可分别等于12与8。

步骤220：计算该多个影像区块{IB_x，y|1＜＝x＜＝M，1＜＝y＜＝N}所对应的多个清晰度值{SV(x，y)|1＜＝x＜＝M，1＜＝y＜＝N}。举例来说，可以选择适当的清晰度函数(sharpness function)，作为本步骤计算各影像区块所对应的清晰度值的依据。一般而言，当影像区块中的高频成分较多(也就是说其中的像素值的变化较大)时，该影像区块所计算出的清晰度值也会较高。

步骤230：分析该多个清晰度值{SV(x，y)|1＜＝x＜＝M，1＜＝y＜＝N}，以从该多个影像区块{IB_x，y|1＜＝x＜＝M，1＜＝y＜＝N}中选择出对应于该目标影像的主体位置的影像区块。举例来说，经由实验可以证明影像的主体位置多半会落于清晰度较高的影像区块上，因此本步骤可以以该多个影像区块{IB_x，y|1＜＝x＜＝M，1＜＝y＜＝N}中，清晰度值落于该多个清晰度值{SV(x，y)|1＜＝x＜＝M，1＜＝y＜＝N}的预定百分比区间内的影像区块，作为对应于该目标影像的主体位置的影像区块。举例来说，在分析了2000张以上的影像之后，发现影像的主体位置多半会落于清晰度前40％的影像区块上，因此，本步骤可以使用前40％作为前述的预定百分比区间。当然，视不同的应用需求，前述的预定百分比区间也可以是前60％的百分比区间内的任一子区间(例如前5％、前10％、...、前60％)。

若在步骤210中将该目标影像划分为12×8个(共96个)影像区块，则步骤220相当于计算该96个影像区块的清晰度值，步骤230相当于将该96个影像区块的清晰度值进行大小排序，并选择清晰度值排名前40％的影像区块。由于清晰度值排名前40％的影像区块可以是散布于各处的影像区块，因此本发明的方法将更能可适性地提供主体的形状信息，此外，所选择出的10个影像区块也可以位于两个、三个、甚至多个不相邻的主体位置上(故更能确实地反映出影像的真实状况)。

此外，在步骤230中，也可以将该多个清晰度值依照大小进行排序(假设该多个清晰度值由大到小依序为SV_1、SV_2、SV_3、...、SV_K)，并计算该多个清晰度值所对应的清晰度值总和SV_SUM(换句话说，SV_SUM＝SV_1+SV_2+SV_3+...+SV_K)，再从该多个影像区块中，选择出累加的清晰度值达到该清晰度值总和SV_SUM的预定百分比(该预定百分比可以介于0％至60％之间，举例来说，该预定百分比可为40％)的影像区块，作为对应于该目标影像的主体位置的影像区块.更明确地说，步骤230中可以计算出满足以下式子的n值，再选定清晰度值SV_1、SV_2、SV_3、...、SV_n所对应的n个影像区块作为对应于该目标影像的主体位置的影像区块，

Σ_{i = 1}^{n - 1} SV_i < 0.4 \times SV_SUM \leq Σ_{i = 1}^{n} SV_i

此外，由于在大多数的时候影像的主体位置会位于影像偏中央的位置，故在步骤230中，还可更进一步将每一清晰度值SV(x，y)各乘上其相对的加权因子WF(x，y)以得出已加权的清晰度值WSV(x，y)，再依据得出的多个已加权清晰度值{WSV(x，y)|1＜＝x＜＝M，1＜＝y＜＝N}，来自这些影像区块中选择出对应于该目标影像的主体位置的影像区块。举例来说，可以以该多个影像区块{IB_x，y|1＜＝x＜＝M，1＜＝y＜＝N}中，已加权清晰度值落于该多个已加权清晰度值{WSV(x，y)|1＜＝x＜＝M，1＜＝y＜＝N}的预定百分比区间内的影像区块，作为对应于该目标影像的主体位置的影像区块。而此处可以使用前40％作为前述的预定百分比区间。当然，视不同的应用需求，前述的预定百分比区间也可以是前60％的该百分比区间内的任一子区间(例如前5％、前10％、...、前60％)。

当然，得出该多个已加权清晰度值{WSV(x，y)|1＜＝x＜＝M，1＜＝y＜＝N}之后，也可以将该多个已加权清晰度值依照大小进行排序，并计算该多个已加权清晰度值所对应的已加权清晰度值总和，再从该多个影像区块中，选择出累加的已加权清晰度值达到该已加权清晰度值总和的预定百分比(该预定百分比可以介于0％至60％之间，举例来说，该预定百分比可为40％)的影像区块，作为对应于该目标影像的主体位置的影像区块。

以下则举出加权因子WF(x，y)的一个例子：

WF(x，y)＝0.6，0＜x＜＝4 and 0＜y＜＝3

0.8，4＜x＜＝8 and 0＜y＜＝3

0.6，8＜x＜＝12 and 0＜y＜＝3

0.8，0＜x＜＝4 and 3＜y＜＝5

1.0，4＜x＜＝8 and 3＜y＜＝5

0.8，8＜x＜＝12 and 3＜y＜＝5

0.6，0＜x＜＝4 and 5＜y＜＝8

0.8，4＜x＜＝8 and 5＜y＜＝8

0.6，8＜x＜＝12 and 5＜y＜＝8

搜寻到该目标影像中的主体位置之后，即可将影像主体位置的相关信息传送提供给后端的应用。举例来说，若后端的应用是自动对焦，则在自动对焦的搜寻循环(search loop)中，可使用得出的主体位置作为对焦标的，并以能让主体位置有最佳对焦效果的设定值作为拍摄时的最佳设定值。

在互补式金属氧化物半导体(CMOS)影像传感器以及电荷耦合器件(CCD)影像传感器的平台上测试本发明所提出的方法，都有成功的测试结果.且经过超过2000张影像分析之后，可发现对于绝大部分(约98.06％)的测试影像而言，本发明的方法都能找出正确的主体位置.此外，经过实验证实，即使影像模糊、影像亮度较低、影像背景较为复杂或主体不在中央的影像，本发明的方法大多都能找出正确的主体位置.而由于本发明的方法仅需执行简单的被动式影像分析，并不需要额外的部件，故不会增加硬件成本.另外，也可以将本发明的方法设计成技术模块，导入各种不同的平台之中，以提供主体位置检测的服务给后端的应用.

以上所述仅为本发明的较佳实施例，凡依本发明权利要求的范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种影像主体位置检测方法，该方法包含：

将目标影像划分为多个影像区块；

计算该多个影像区块所对应的多个清晰度值；以及

分析该多个清晰度值，以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块；其中选择出对应于该目标影像的主体位置的影像区块的步骤包含：

将该多个清晰度值依照大小进行排序；

计算该多个清晰度值所对应的清晰度值总和；以及

从该多个影像区块中，选择出累加的清晰度值达到该清晰度值总和的预定百分比的影像区块，作为对应于该目标影像的主体位置的影像区块。

2.根据权利要求1所述的方法，其中该预定百分比介于0％至60％之间。

3.根据权利要求1所述的方法，其中该预定百分比为40％。

4.一种影像主体位置检测方法，该方法包含：

将目标影像划分为多个影像区块；

计算该多个影像区块所对应的多个清晰度值；以及

分析该多个清晰度值，以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块；

其中从该多个影像区块中，选择出清晰度值落于该多个清晰度值按由大到小排序的前预定百分比区间内的影像区块，作为对应于该目标影像的主体位置的影像区块。

5.根据权利要求4所述的方法，其中该预定百分比区间为该多个清晰度值由大到小排序的前百分之六十的区间的子区间。

6.根据权利要求4所述的方法，其中该预定百分比区间为该多个清晰度值由大到小排序的前百分之四十的区间。

7.一种影像主体位置检测方法，该方法包含：

将目标影像划分为多个影像区块；

计算该多个影像区块所对应的多个清晰度值；

将该多个清晰度值分别乘上所对应的加权因子以得出多个已加权清晰度值；以及

分析该多个已加权清晰度值，以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块；

其中选择出对应于该目标影像的主体位置的影像区块的步骤包含：

将该多个影像区块依照已加权清晰度值进行排序；

计算该多个已加权清晰度值所对应的已加权清晰度值总和；

从该多个影像区块中，选择出累加的已加权清晰度值达到该已加权清晰度值总和的预定百分比的影像区块，作为对应于该目标影像的主体位置的影像区块。

8.根据权利要求7所述的方法，其中该预定百分比介于0％至60％之间。

9.根据权利要求7所述的方法，其中该预定百分比为40％。

10.一种影像主体位置检测方法，该方法包含：

将目标影像划分为多个影像区块；

计算该多个影像区块所对应的多个清晰度值；将该多个清晰度值分别乘上所对应的加权因子以得出多个已加权清晰度值；以及

其中从该多个影像区块中，选择出已加权清晰度值落于该多个已加权清晰度值按由大到小排序的前预定百分比区间内的影像区块，作为对应于该目标影像的主体位置的影像区块。

11.根据权利要求10所述的方法，其中该预定百分比区间为该多个已加权清晰度值由大到小排序的前百分之六十的区间的子区间。

12.根据权利要求10所述的方法，其中该预定百分比区间为该多个已加权清晰度值由大到小排序的前百分之四十的区间。