CN101079948B - 影像主体位置检测方法 - Google Patents

影像主体位置检测方法 Download PDF

Info

Publication number
CN101079948B
CN101079948B CN200610084526A CN200610084526A CN101079948B CN 101079948 B CN101079948 B CN 101079948B CN 200610084526 A CN200610084526 A CN 200610084526A CN 200610084526 A CN200610084526 A CN 200610084526A CN 101079948 B CN101079948 B CN 101079948B
Authority
CN
China
Prior art keywords
image
definition values
body position
predetermined percentage
weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200610084526A
Other languages
English (en)
Other versions
CN101079948A (zh
Inventor
徐纬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Primax Electronics Ltd
Original Assignee
Primax Electronics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Primax Electronics Ltd filed Critical Primax Electronics Ltd
Priority to CN200610084526A priority Critical patent/CN101079948B/zh
Publication of CN101079948A publication Critical patent/CN101079948A/zh
Application granted granted Critical
Publication of CN101079948B publication Critical patent/CN101079948B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明揭示一种影像主体位置检测方法。该方法包含:将目标影像划分为多个影像区块;计算该多个影像区块所对应的多个清晰度值;以及分析该多个清晰度值,以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块。因此,本发明的方法能找出正确的主体位置,经过实验证实,即使影像模糊、影像亮度较低、影像背景较为复杂或主体不在中央的影像,本发明的方法大多都能找出正确的主体位置。此外,由于本发明的方法仅需执行简单的被动式影像分析,并不需要额外的部件,故不会增加硬件成本。另外,本发明的方法可设计成技术模块,导入各种不同的平台之中,以提供主体位置检测的服务给后端的应用。

Description

影像主体位置检测方法
技术领域
本发明涉及影像的主体位置检测,尤其涉及一种应用了清晰度计算的概念的影像主体位置检测方法。
背景技术
影像的主体位置检测(也就是说检测影像中主体(object)的所在位置)是一种应用极为广泛的技术,举例来说,其可应用于:1.保全监视系统(例如用来进行主体追踪、主体锁定或特征放大)、2.数码相机/数码摄影机(例如用来进行自动对焦(Auto focus)、自动曝光(Auto exposure)、或自动白平衡(Auto white balance))、3.辨识/检测系统(例如用来进行车牌辨识、机器人的物体辨识/导引)、4.国防工业(例如用来进行影像导弹追踪辅助)、5.研究(例如用来进行影像分析)。
一般而言,影像主体位置检测必须提供正确的主体位置检测结果给后端的应用,如此一来,后端的应用才有办法依据正确的主体位置来执行正确的操作(例如特征放大、调整白平衡等)。若影像主体位置检测的检测结果是错误的,则很可能会导致后端的应用产生错误的操作结果。
图1所示为现有技术利用影像主体位置检测来执行自动对焦的示意图。对于目标影像100而言,现有技术为比较目标影像100内的中检测区块110、左检测区块120、右检测区块130、上检测区块140以及下检测区块150的平均亮度,以判断这五个预设的检测区块中,哪一个是对应于目标影像100的主体位置的检测区块,并以所决定出的检测区块作为自动对焦的标的。然而,对于现有技术而言,其预设的检测区块的形状、大小与位置都是固定的,并不能可适性地变更预设的检测区块的形状、大小或位置。此外,现有技术所辨识出目标影像100的主体位置,一定是前述五个预设的检测区块的其中之一。若目标影像100的主体位置并未位于前述五个预设的检测区块中,则现有技术的主体位置检测将可能产生错误的检测结果。此外,若目标影像100中包含有一个以上不相邻的主体位置时,现有技术的主体位置检测却只能于前述五个预设的检测区块中,选择出其中之一作为目标影像100的主体位置,其并没有办法确实反应出目标影像100中包含有一个以上不相邻的主体位置的现象。举例来说,若同时在左检测区块120中的左侧以及在右检测区块130中的右侧各有一主体时,现有技术的作法将只能选择左侧检测区块120与右检测区块130的其中之一作为目标影像100的主体位置。如此的主体位置检测的结果不可能保证是正确的。此外,由于检测区块的形状、大小或位置都是固定的,当主体的形状特异时,现有技术也没有办法对主体的形状作更精确的辨识。
发明内容
因此,本发明的目的之一,在于提供一种能可适性地检测出影像的主体位置的影像主体位置检测方法。
本发明的实施例揭示一种影像主体位置检测方法.该方法包含:将目标影像划分为多个影像区块;计算该多个影像区块所对应的多个清晰度值;以及分析该多个清晰度值,以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块.
根据所述的方法,其中分析该多个清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含:将该多个清晰度值依照大小进行排序;计算该多个清晰度值所对应的清晰度值总和;从该多个影像区块中,选择出累加的清晰度值达到该清晰度值总和的预定百分比的影像区块,作为对应于该目标影像的主体位置的影像区块。
根据所述的方法,其中该预定百分比介于0%至60%之间。
根据所述的方法,其中该预定百分比为40%。
根据所述的方法,其中分析该多个清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含:从该多个影像区块中,选择出清晰度值落于该多个清晰度值的预定百分比区间内的影像区块,作为对应于该目标影像的主体位置的影像区块。
根据所述的方法,其中该预定百分比区间为该多个清晰度值的前百分之六十的区间的子区间。
根据所述的方法,其中该预定百分比区间为该多个清晰度值的前百分之四十的区间。
根据所述的方法,其中分析该多个清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含:将该多个清晰度值分别乘上所对应的加权因子以得出多个已加权清晰度值;以及分析该多个已加权清晰度值,以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块。
根据所述的方法,其中分析该多个已加权清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含:将该多个影像区块依照已加权清晰度值进行排序;计算该多个已加权清晰度值所对应的已加权清晰度值总和;从该多个影像区块中,选择出累加的已加权清晰度值达到该已加权清晰度值总和的预定百分比的影像区块,作为对应于该目标影像的主体位置的影像区块。
根据所述的方法,其中该预定百分比介于0%至60%之间。
根据所述的方法,其中该预定百分比为40%。
根据所述的方法,其中分析该多个已加权清晰度值以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块的步骤包含:从该多个影像区块中,选择出已加权清晰度值落于该多个已加权清晰度值的预定百分比区间内的影像区块,作为对应于该目标影像的主体位置的影像区块。
根据所述的方法,其中该预定百分比区间为该多个已加权清晰度值的前百分之六十的区间的子区间。
根据所述的方法,其中该预定百分比区间为该多个已加权清晰度值的前百分之四十的区间。
从上述技术方案我们可以看出,本发明的方法能找出正确的主体位置,经过实验证实,即使影像模糊、影像亮度较低、影像背景较为复杂或主体不在中央的影像,本发明的方法大多都能找出正确的主体位置.此外,由于本发明的方法仅需执行简单的被动式影像分析,并不需要额外的部件,故不会增加硬件成本.另外,本发明的方法也可以设计成技术模块,导入各种不同的平台之中,以提供主体位置检测的服务给后端的应用.
附图说明
图1为现有技术利用影像主体位置检测来执行自动对焦的示意图。
图2为本发明的影像主体位置检测方法的实施例流程图。
具体实施方式
简单地说,本发明将清晰度(sharpness)的概念,应用于影像主体位置检测的技术之中。图2所示为本发明的影像主体位置检测方法的实施例流程图。本流程图中包含以下步骤:
步骤210:将目标影像划分为多个影像区块{IBx,y|1<=x<=M,1<=y<=N}。此相当于将该目标影像沿着横轴划分成M等分,并沿着纵轴划分成N等分(如此一来,该目标影像将被划分为M×N个影像区块),其中,M与N可分别等于12与8。
步骤220:计算该多个影像区块{IBx,y|1<=x<=M,1<=y<=N}所对应的多个清晰度值{SV(x,y)|1<=x<=M,1<=y<=N}。举例来说,可以选择适当的清晰度函数(sharpness function),作为本步骤计算各影像区块所对应的清晰度值的依据。一般而言,当影像区块中的高频成分较多(也就是说其中的像素值的变化较大)时,该影像区块所计算出的清晰度值也会较高。
步骤230:分析该多个清晰度值{SV(x,y)|1<=x<=M,1<=y<=N},以从该多个影像区块{IBx,y|1<=x<=M,1<=y<=N}中选择出对应于该目标影像的主体位置的影像区块。举例来说,经由实验可以证明影像的主体位置多半会落于清晰度较高的影像区块上,因此本步骤可以以该多个影像区块{IBx,y|1<=x<=M,1<=y<=N}中,清晰度值落于该多个清晰度值{SV(x,y)|1<=x<=M,1<=y<=N}的预定百分比区间内的影像区块,作为对应于该目标影像的主体位置的影像区块。举例来说,在分析了2000张以上的影像之后,发现影像的主体位置多半会落于清晰度前40%的影像区块上,因此,本步骤可以使用前40%作为前述的预定百分比区间。当然,视不同的应用需求,前述的预定百分比区间也可以是前60%的百分比区间内的任一子区间(例如前5%、前10%、...、前60%)。
若在步骤210中将该目标影像划分为12×8个(共96个)影像区块,则步骤220相当于计算该96个影像区块的清晰度值,步骤230相当于将该96个影像区块的清晰度值进行大小排序,并选择清晰度值排名前40%的影像区块。由于清晰度值排名前40%的影像区块可以是散布于各处的影像区块,因此本发明的方法将更能可适性地提供主体的形状信息,此外,所选择出的10个影像区块也可以位于两个、三个、甚至多个不相邻的主体位置上(故更能确实地反映出影像的真实状况)。
此外,在步骤230中,也可以将该多个清晰度值依照大小进行排序(假设该多个清晰度值由大到小依序为SV_1、SV_2、SV_3、...、SV_K),并计算该多个清晰度值所对应的清晰度值总和SV_SUM(换句话说,SV_SUM=SV_1+SV_2+SV_3+...+SV_K),再从该多个影像区块中,选择出累加的清晰度值达到该清晰度值总和SV_SUM的预定百分比(该预定百分比可以介于0%至60%之间,举例来说,该预定百分比可为40%)的影像区块,作为对应于该目标影像的主体位置的影像区块.更明确地说,步骤230中可以计算出满足以下式子的n值,再选定清晰度值SV_1、SV_2、SV_3、...、SV_n所对应的n个影像区块作为对应于该目标影像的主体位置的影像区块,
&Sigma; i = 1 n - 1 SV _ i < 0.4 &times; SV _ SUM &le; &Sigma; i = 1 n SV _ i
此外,由于在大多数的时候影像的主体位置会位于影像偏中央的位置,故在步骤230中,还可更进一步将每一清晰度值SV(x,y)各乘上其相对的加权因子WF(x,y)以得出已加权的清晰度值WSV(x,y),再依据得出的多个已加权清晰度值{WSV(x,y)|1<=x<=M,1<=y<=N},来自这些影像区块中选择出对应于该目标影像的主体位置的影像区块。举例来说,可以以该多个影像区块{IBx,y|1<=x<=M,1<=y<=N}中,已加权清晰度值落于该多个已加权清晰度值{WSV(x,y)|1<=x<=M,1<=y<=N}的预定百分比区间内的影像区块,作为对应于该目标影像的主体位置的影像区块。而此处可以使用前40%作为前述的预定百分比区间。当然,视不同的应用需求,前述的预定百分比区间也可以是前60%的该百分比区间内的任一子区间(例如前5%、前10%、...、前60%)。
当然,得出该多个已加权清晰度值{WSV(x,y)|1<=x<=M,1<=y<=N}之后,也可以将该多个已加权清晰度值依照大小进行排序,并计算该多个已加权清晰度值所对应的已加权清晰度值总和,再从该多个影像区块中,选择出累加的已加权清晰度值达到该已加权清晰度值总和的预定百分比(该预定百分比可以介于0%至60%之间,举例来说,该预定百分比可为40%)的影像区块,作为对应于该目标影像的主体位置的影像区块。
以下则举出加权因子WF(x,y)的一个例子:
WF(x,y)=0.6,0<x<=4 and 0<y<=3
0.8,4<x<=8 and 0<y<=3
0.6,8<x<=12 and 0<y<=3
0.8,0<x<=4 and 3<y<=5
1.0,4<x<=8 and 3<y<=5
0.8,8<x<=12 and 3<y<=5
0.6,0<x<=4 and 5<y<=8
0.8,4<x<=8 and 5<y<=8
0.6,8<x<=12 and 5<y<=8
搜寻到该目标影像中的主体位置之后,即可将影像主体位置的相关信息传送提供给后端的应用。举例来说,若后端的应用是自动对焦,则在自动对焦的搜寻循环(search loop)中,可使用得出的主体位置作为对焦标的,并以能让主体位置有最佳对焦效果的设定值作为拍摄时的最佳设定值。
在互补式金属氧化物半导体(CMOS)影像传感器以及电荷耦合器件(CCD)影像传感器的平台上测试本发明所提出的方法,都有成功的测试结果.且经过超过2000张影像分析之后,可发现对于绝大部分(约98.06%)的测试影像而言,本发明的方法都能找出正确的主体位置.此外,经过实验证实,即使影像模糊、影像亮度较低、影像背景较为复杂或主体不在中央的影像,本发明的方法大多都能找出正确的主体位置.而由于本发明的方法仅需执行简单的被动式影像分析,并不需要额外的部件,故不会增加硬件成本.另外,也可以将本发明的方法设计成技术模块,导入各种不同的平台之中,以提供主体位置检测的服务给后端的应用.
以上所述仅为本发明的较佳实施例,凡依本发明权利要求的范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (12)

1.一种影像主体位置检测方法,该方法包含:
将目标影像划分为多个影像区块;
计算该多个影像区块所对应的多个清晰度值;以及
分析该多个清晰度值,以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块;其中选择出对应于该目标影像的主体位置的影像区块的步骤包含:
将该多个清晰度值依照大小进行排序;
计算该多个清晰度值所对应的清晰度值总和;以及
从该多个影像区块中,选择出累加的清晰度值达到该清晰度值总和的预定百分比的影像区块,作为对应于该目标影像的主体位置的影像区块。
2.根据权利要求1所述的方法,其中该预定百分比介于0%至60%之间。
3.根据权利要求1所述的方法,其中该预定百分比为40%。
4.一种影像主体位置检测方法,该方法包含:
将目标影像划分为多个影像区块;
计算该多个影像区块所对应的多个清晰度值;以及
分析该多个清晰度值,以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块;
其中从该多个影像区块中,选择出清晰度值落于该多个清晰度值按由大到小排序的前预定百分比区间内的影像区块,作为对应于该目标影像的主体位置的影像区块。
5.根据权利要求4所述的方法,其中该预定百分比区间为该多个清晰度值由大到小排序的前百分之六十的区间的子区间。
6.根据权利要求4所述的方法,其中该预定百分比区间为该多个清晰度值由大到小排序的前百分之四十的区间。
7.一种影像主体位置检测方法,该方法包含:
将目标影像划分为多个影像区块;
计算该多个影像区块所对应的多个清晰度值;
将该多个清晰度值分别乘上所对应的加权因子以得出多个已加权清晰度值;以及
分析该多个已加权清晰度值,以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块;
其中选择出对应于该目标影像的主体位置的影像区块的步骤包含:
将该多个影像区块依照已加权清晰度值进行排序;
计算该多个已加权清晰度值所对应的已加权清晰度值总和;
从该多个影像区块中,选择出累加的已加权清晰度值达到该已加权清晰度值总和的预定百分比的影像区块,作为对应于该目标影像的主体位置的影像区块。
8.根据权利要求7所述的方法,其中该预定百分比介于0%至60%之间。
9.根据权利要求7所述的方法,其中该预定百分比为40%。
10.一种影像主体位置检测方法,该方法包含:
将目标影像划分为多个影像区块;
计算该多个影像区块所对应的多个清晰度值;将该多个清晰度值分别乘上所对应的加权因子以得出多个已加权清晰度值;以及
分析该多个已加权清晰度值,以从该多个影像区块中选择出对应于该目标影像的主体位置的影像区块;
其中从该多个影像区块中,选择出已加权清晰度值落于该多个已加权清晰度值按由大到小排序的前预定百分比区间内的影像区块,作为对应于该目标影像的主体位置的影像区块。
11.根据权利要求10所述的方法,其中该预定百分比区间为该多个已加权清晰度值由大到小排序的前百分之六十的区间的子区间。
12.根据权利要求10所述的方法,其中该预定百分比区间为该多个已加权清晰度值由大到小排序的前百分之四十的区间。
CN200610084526A 2006-05-25 2006-05-25 影像主体位置检测方法 Expired - Fee Related CN101079948B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200610084526A CN101079948B (zh) 2006-05-25 2006-05-25 影像主体位置检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610084526A CN101079948B (zh) 2006-05-25 2006-05-25 影像主体位置检测方法

Publications (2)

Publication Number Publication Date
CN101079948A CN101079948A (zh) 2007-11-28
CN101079948B true CN101079948B (zh) 2010-05-12

Family

ID=38907161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610084526A Expired - Fee Related CN101079948B (zh) 2006-05-25 2006-05-25 影像主体位置检测方法

Country Status (1)

Country Link
CN (1) CN101079948B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106973219B (zh) 2017-02-21 2019-06-28 苏州科达科技股份有限公司 一种基于感兴趣区域的自动聚焦方法及装置
CN109151310A (zh) * 2018-09-03 2019-01-04 合肥智慧龙图腾知识产权股份有限公司 一种自动对焦拍摄方法、计算机设备及可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2488116Y (zh) * 2001-07-25 2002-04-24 力捷电脑股份有限公司 具有调焦装置的自动送纸器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2488116Y (zh) * 2001-07-25 2002-04-24 力捷电脑股份有限公司 具有调焦装置的自动送纸器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特開平6-98239A 1994.04.08

Also Published As

Publication number Publication date
CN101079948A (zh) 2007-11-28

Similar Documents

Publication Publication Date Title
CN100474891C (zh) 图像处理设备和图像处理方法
CN111523470A (zh) 特征融合块、卷积神经网络、行人重识别方法及相关设备
CN101512549B (zh) 数字图像采集装置中的实时人脸追踪
CN107203765B (zh) 敏感图像检测方法和装置
RU2589736C1 (ru) Способ обнаружения движущегося объекта
CN112232300B (zh) 全局遮挡自适应的行人训练/识别方法、系统、设备及介质
CN102163280A (zh) 一种基于置信度和多帧判决的目标识别跟踪转换方法
CN112529897B (zh) 一种图像检测方法、装置、计算机设备及存储介质
CN101079948B (zh) 影像主体位置检测方法
CN103632124B (zh) 条码的识别方法及装置
CN109345531B (zh) 一种基于图片识别用户拍摄距离的方法及系统
US9478041B2 (en) Moving object detection method
CN113286142B (zh) 一种基于人工智能的图像成像感光度预测方法及系统
CN112330619B (zh) 一种检测目标区域的方法、装置、设备及存储介质
CN117975133A (zh) 高光谱图像分类方法、系统、计算机程序产品
US20100027666A1 (en) Motion vector detecting apparatus, motion vector detecting method, and program
Bai et al. Multi-branch fully convolutional network for face detection
CN114155246B (zh) 一种基于可变形卷积的输电塔销钉缺陷检测方法
US20100239120A1 (en) Image object-location detection method
US10460212B1 (en) Binning digital images by source camera
CN112906525B (zh) 年龄识别方法、装置及电子设备
CN109035328A (zh) 一种图像指向性的识别方法、系统、装置和存储介质
CN117893894B (zh) 一种基于红外偏振图像的水下目标轻量化检测方法及装置
CN117893915B (zh) 基于改进的DeeplabV3+神经网络的遥感图像云检测方法
CN110398240B (zh) 一种基于电子围栏的位置判定方法、装置与电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100512

Termination date: 20160525

CF01 Termination of patent right due to non-payment of annual fee