CN112668379A - 一种物件定位系统及方法 - Google Patents

一种物件定位系统及方法 Download PDF

Info

Publication number
CN112668379A
CN112668379A CN201911191378.3A CN201911191378A CN112668379A CN 112668379 A CN112668379 A CN 112668379A CN 201911191378 A CN201911191378 A CN 201911191378A CN 112668379 A CN112668379 A CN 112668379A
Authority
CN
China
Prior art keywords
segment
frame
difference
graphics
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911191378.3A
Other languages
English (en)
Inventor
蔡展鹏
李峥宇
汉那斯克卢奇曼杰斯
郭朕逢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Realtek Singapore Pte Ltd
Original Assignee
Realtek Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Realtek Singapore Pte Ltd filed Critical Realtek Singapore Pte Ltd
Publication of CN112668379A publication Critical patent/CN112668379A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • G06T2207/10021Stereoscopic video; Stereoscopic image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种物件定位系统,包括,物件侦测模组用以参考参考帧中的内容来侦测一当前帧中的物件,及物件定位模组用以根据图形段辨识该物件的位置。物件侦测模组包含差异模组用以计算参考帧与当前帧之间于同一位置的差异以产生差异帧,选定区块侦测模组用于根据预定最小差异值标识该差异帧的一选定区块,及图形段产生模组用以产生该当前帧的图形段。

Description

一种物件定位系统及方法
技术领域
本发明涉及影像辨识系统技术领域,特别地涉及一种物件定位系统及方法。
背景技术
用于侦测物件的影像辨识技术已广泛应用于各种设备,如监控摄像机、车辆安全装置和数字摄像机。这类技术预计将被广泛应用于通过追踪一个目标并确定该目标的行为类型来辨识可疑人员、收集行销信息或进行风险预测等。
移动目标定位和/或分类等影像辨识技术包括各种类型的深度卷积神经网路,然而这些类神经网路需要的计算量大,通常由远端资料中心的高性能服务器处理。这些影像辨识技术并未针对计算能力较低的物联网设备进行优化。
传统用于处理视频帧中的移动区域的方法计算量较大。为了减少由于光线和摄像设备的变化而引起的噪讯影响,可以对参考帧和当前帧的不同影像进行处理。对差分影像(经由像素差分技术处理的影像)进行处理,去除影像差分中孤立的片段,得到处理后的影像,对处理后的影像进行分割,将其分割成不同移动目标对应的不同分割段。但是该方法所需的计算量极大,因此,需要计算量较低的系统和方法来进行影像分割、定位和分类。
发明内容
针对现有技术中存在的技术问题,本发明提出了一种物件定位系统,包括物件侦测模组用以参考参考帧(reference frame)中的内容来侦测当前帧(current frame)中的物件,及物件定位模组用以根据图形段辨识物件的位置。物件侦测模组包括差异模组用以计算参考帧与当前帧之间于同一位置的差异以产生差异帧(difference frame),选定区块侦测模组用于根据一预定最小差异值标识差异帧的一选定区块,及图形段产生模组用以产生当前帧的图形段,图形段是物件的一部分,并且由差异帧的选定区块与相邻的选定区块相互连接所定义,并用以在光栅扫描中为每一选定图形段分配图形段标签,其中图形段标签识别图形段,并且每个不相邻的图形段都具有不同的图形段标签。
根据跟发明的另一方面提出一种参考在视频帧中的参考帧在当前帧中定位物件的方法,方法包括侦测物件。侦测物件包括产生等于当前帧与参考帧之间的绝对差的差异帧,计算参考帧与当前帧之间同一位置的差异以产生差异帧,将差异帧中具有大于一最小差异值的区块标识为选定区块,及产生当前帧的图形段。图形段是物件的一部分,并且由差异帧的选定区块与相邻的选定区块相互连接所定义,其中图形段标签可识别图形段,并且每个不相邻的图形段都具有不同的图形段标签。
根据跟发明的另一方面提出一种通过光栅扫描产生图像的选定图形段的方法,包括根据第一预定亮度值将像素标识为选定像素,产生选定图形段,及在光栅扫描中为选定图形段的每一选定像素分配图形段标签。选定图形段是由图像的选定像素所定义,相邻选定像素之间相互连接。图形段标签标识选定图形段,并且每个不相邻的图形段标签不同。
附图说明
下面,将结合附图对本发明的优选实施方式进行进一步详细的说明,其中:
图1是实施例中物件定位系统的示意图。
图2是图1物件定位系统的物件侦测模组的示意图。
图3是图2像素差异模组产生的像素差异帧的示意图。
图4是图2图形段产生模组产生的索引帧的示意图。
图5是图2图形段产生模组产生的标签帧的示意图。
图6是图形段标签阵列和图形段标签区块计数阵列的示意图。
图7是图形段产生方法应用于具有文字的图像的示意图。
图8是通过光栅扫描产生的索引图像的示意图。
图9是图形段标签阵列和图形段标签像素计数阵列的示意图。
100 物件定位系统
110 物件侦测模组
120 物件定位模组
130 追踪模组
111 像素差异模组
112 选定区块侦测模组
113 图形段产生模组
114 候选区域模组
210 像素差异帧
211 移动区域
212 选定区块
213 图形段
214 候选区域
215、216 区块
310 索引帧
410 标签帧
710 背景像素
720 选定像素
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在以下的详细描述中,可以参看作为本申请一部分用来说明本申请的特定实施例的各个说明书附图。在附图中,相似的附图标记在不同图式中描述大体上类似的组件。本申请的各个特定实施例在以下进行了足够详细的描述,使得具备本领域相关知识和技术的普通技术人员能够实施本申请的技术方案。应当理解,还可以利用其它实施例或者对本申请的实施例进行结构、逻辑或者电性的改变。
图1是实施例中物件定位系统100的示意图。物件定位系统100中的模组可以通过硬件或软件来实现。物件定位系统100包括物件侦测模组110,物件定位模组120和追踪模组130。物件侦测模组110参考一参考帧(例如,参考帧)在视频帧序列的当前帧中侦测移动物件。物件定位模组120可辨识移动物件的位置。追踪模组130用于追踪移动物件的位置。此外,物件定位模组120还可包括有物件分类(Classification)功能,用以进行辨识物件的类型。
如图1所示,物件定位系统100接收多个视频帧(影像帧)的输入。多个视频帧包括当前帧和在当前帧之前的参考帧。另外,如物件尺寸大小以及物件的移动速率等附加参数也可以输入到物件定位系统100中。参考帧和当前帧之间的帧数可以由物件的移动速率和摄像设备的帧速率决定。物件定位模组120可以处理当前帧以取得关于物件位置和物件类型的信息。
图2是实施例中物件侦测模组110的示意图。图3是实施例中像素差异帧210的示意图。物件侦测模组110包括像素差异模组111,选定区块侦测模组112,图形段产生模组113和候选区域模组114。像素差异模组111用于计算参考帧和当前帧之间同一位置像素的像素值的差异以产生像素差异帧210。实现低计算量的优选方式是使用像素亮度的信息来计算像素差异,其他计算方法仍包含在本发明的范围内,本发明不限于此。选定区块侦测模组112用于识别当前帧的选定区块212(图3中有阴影的任一区块)。选定区块212在侦测帧与参考帧之间的相同位置处的像素值上具有预定的最小差异值。图形段产生模组113用于产生当前帧的图形段213(图3中所有阴影的区块的集合)。图形段213由当前帧的选定区块212所定义,当前帧的选定区块212与相邻的选定区块212彼此连接。候选区域模组114用于产生包含图形段的候选区域214。
物件侦测模组110可以定位包含移动物件的移动区域211。物件侦测模组110可以通过识别选定区块212并产生包围这些选定区块212的边界框来定位移动区域211。如图3所示,图形段213在移动区域211内。图3中像素差异帧210的区块是从当前帧分割而成。区块的大小和形状可以由当前帧中最小和最大之物件的尺寸来定义。例如,区块可以是尺寸为8x8、16x16或20x20的正方形。如果区块尺寸为8x8,则包含64个像素。如果区块尺寸为16x16,则包含256个像素。如果区块尺寸为20x20,则包含400个像素。另外,候选区域214可根据来自物件侦测模组110的位置资讯并由物件侦测模组110来定义。候选区域214包含物体的移动区域211或图形段213的所有选定区块。区块215是具有由照明或摄像装置引起的影像杂讯的区块,区块216是当前帧与参考帧之像素差低于预定最小差异值的区块。区块215和区块216不包括在移动区域211中,因此在本发明中不讨论。
图4是实施例中图形段产生模组113通过光栅扫描和索引分配产生的索引帧310的示意图。像素差异帧210可被输入到图形段产生模组113中。在光栅扫描中检查像素差异帧210的每个区块以标出选定区块。在实施例中,选定区块212被定义为当前帧与参考帧之间在相同位置的像素差大于或等于预定最小差异值的区块。另外,相邻区块被定义为一区块的左,上,左上和右上的区块。在索引帧310中,如果所扫描的区块为非选定区块,则对此区块分配索引值0。否则,如果此区块的所有相邻区块均为非选定区块,则对此区块分配索引值为数字最小的未使用值。若此区块有至少一相邻区块为选定区块,则对此区块分配的索引值为相邻选定区块中的最高索引值。
以下叙述请参考图5和图6。图5是实施例中标签帧410的示意图,标签帧410具有由图形段产生模组113分配给每个区块的图形段标签。图6是实施例中图形段标签阵列和图形段标签区块计数阵列的示意图。如图6所示,每个图形段索引是指向相应图形段标签的指标,而图形段标签可作为指向对应图形段标签区块计数阵列的指标。在光栅扫描期间,如果正在扫描的区块是选定区块,则将所有相邻选定区块的图形段标签的值更改为与选定区块的索引值相同的值。例如,将图形段标签值3分配给图形段标签阵列中索引为1、2和3的选定区块。
除此之外,在光栅扫描之前,图形段标签区块计数阵列被初始化为0。在光栅扫描期间,当为要扫描的区块分配一个图形段标签时,其对应的图形段标签区块计数即增加1。若要扫描的区块是选定区块,则其对应的图形段标签区块计数会增加,而增加的幅度为相邻选定区块的图形段标签区块计数值的总和,之后再将相邻选定区块的图形段标签区块计数值设为0。如图6所示,在本实施例中,索引0的图形段标签为0,包括524个区块。索引1和2的图形段标签为3,索引3的图形段标签也为3,包括52个区块。图形段标签区块计数可以使用在后续的影像处理模组。此外,标明图形段的尺寸可用于后续处理,例如删除由杂讯引起的小图形段或小于目标物件尺寸的图形段。
经过影像处理后可产生像素差异帧210的二位元遮罩(binary mask)。例如,遮罩值1(对应于图形段标签值3)标示选定区块,而其他区块具有遮罩值0(对应于图形段标签值0)。同样,如果像素差异帧210中有一个以上的图形段,则此方法将可让图形段产生模组113将不同的图形段标签分配给不相交的图形段。经过以上影像处理,物件侦测模组110会输出二位元遮罩至候选区域模组114及追踪模组130,并在其中进行进一步的影像处理,例如物件定位和分类以及物件追踪。二位元遮罩通过一次光栅扫描即可产生,缩短影像处理的时间。在一实施例中,系统可以在接收下一帧之前产生二位元遮罩。而只对候选区域进行影像处理可大幅降低计算量,使本方法可以实现于较低运算能力的设备。然而,本方法也可以应用在计算密集型处理方式来获得更好的定位和分类结果,例如深度卷积神经网络。
相同的图形段产生方法也可以应用于固定的图像。图7是实施例中图形段产生方法应用于具有文字的图像的示意图。在图形段产生之后,可以基于像素的像素值(例如:亮度),将图像的像素区分为背景像素710和选定像素(文字)720,例如,若像素的亮度值低于预定的亮度值,则像素被区分为背景像素710。
图8是实施例中通过光栅扫描产生的索引图像示意图。通过图形段产生方法可将索引分配给每个像素。具有索引值3、4和10的像素属于文字“5”。其后,按光栅扫描的顺序检查图像的每个像素以标出选定像素。在一实施例中,选定像素可以被定义为具有低于第一预定亮度值的像素。在另一个实施例中,选定像素可以被定义为具有高于第二预定亮度值的像素。
相邻像素系定义为一像素的左,上,左上和右上的像素。若扫描的像素是非选定像素,对此像素分配索引值0,否则,若此像素的所有相邻像素都是非选定像素,对此像素分配索引值为数字最小的未使用值。对于具有至少一个相邻像素作为选定像素的像素,则对此像素分配索引值为相邻选定像素中所具有的最高索引值。
图9是实施例中图形段标签阵列和图形段标签像素计数阵列的示意图。在光栅扫描之前,图形段标签像素计数阵列被初始化为0。在光栅扫描期间,当为扫描的像素分配一图形段标签时,其对应的图形段标签像素计数可增加1。如果被扫描的像素是选定像素,则其对应的图形段标签像素计数将增加相邻选定像素的图形段标签像素计数值的总和,之后再将相邻选定像素的图形段标签像素计数值设为0。如图9所示,代表背景像素的索引0的图形段标签为0,索引0的图形段标签像素计数是762。在一实施例中,文字“4”包括103个像素,索引为1且图形段标签为1。文字“1”包括50个像素,索引为6且图形段标签为6。文字“5”包括134个像素,索引为3、4和10且图形段标签为10。文字“2”包括111个像素,索引为9且图形段标签为9。图形段标签像素计数可应用于后续的图像处理。另外,图形段的尺寸也可用于后续的影像处理,例如删除由杂讯引起的小图形段或小于目标文字大小的图形段。每个图形段可输入到物件定位模组120,并且各自被定位为“4”、“1”、“5”和“2”等文字物件。
综上所述,应用本发明实施例的图形段产生方法的物件定位系统可以有效地降低影像处理的计算复杂度。因此,物件定位系统和方法可被应用在具有计算能力不高的设备,例如物联网设备等,以进行影像辨识或其他影像处理。
上述实施例仅供说明本发明之用,而并非是对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明范围的情况下,还可以做出各种变化和变型,因此,所有等同的技术方案也应属于本发明公开的范畴。

Claims (13)

1.一种物件定位系统,包括:
一物件侦测模组,用以参考一参考帧中的内容来侦测一当前帧中的一物件,该物件侦测模组包括:
一差异模组,用以计算该参考帧与该当前帧之间于同一位置的差异以产生一差异帧;
一选定区块侦测模组,用于根据一预定最小差异值标识该差异帧的一选定区块;及
一图形段产生模组,用以产生该当前帧的一图形段,该图形段是该物件的一部分,并且由该差异帧的选定区块与相邻的选定区块相互连接所定义,并用以在光栅扫描中为每一选定图形段分配一图形段标签,其中该图形段标签识别该图形段,并且每个不相邻的图形段都具有不同的图形段标签;及
一物件定位模组,用以根据该图形段辨识该物件的位置。
2.如权利要求1所述的物件定位系统,其中该图形段产生模组另用以对该当前帧的每一区块分配一索引,并且计算具有相同图形段标签的选定区块的数量。
3.如权利要求2所述的物件定位系统,其中该图形段产生模组另用以为该差异帧产生一二位元遮罩(binary mask)。
4.如权利要求1所述的物件定位系统,该物件侦测模组另包括一候选区域(region ofproposal)模组,其中该候选区域模组用以产生包围该图形段的候选区域,以取得关于该物件的信息。
5.如权利要求1所述的物件定位系统,进一步包括:一追踪模组,耦合至该物件侦测模组,用以追踪该物件的位置。
6.如权利要求1所述的物件定位系统,其中该图形段是在该物件侦测模组接收到一下一帧(next frame)之前产生。
7.一种参考在一系列影像帧中的一参考帧在一当前帧中定位一物件的方法,该方法包括:
侦测一物件,包括:
产生等于该当前帧与该参考帧之间的绝对差的一差异帧;
计算该参考帧与该当前帧之间同一位置的差异以产生一差异帧;
将该差异帧中具有大于一最小差异值的区块标识为一选定区块;及
产生该当前帧的一图形段,该图形段是该物件的一部分,并且由该差异帧的选定区块与相邻的选定区块相互连接所定义,其中该图形段标签识别该图形段,并且每个不相邻的图形段都具有不同的图形段标签;及
根据该图形段辨识该物件的一位置。
8.如权利要求7所述的方法,进一步包括:追踪该物件的该位置。
9.如权利要求7所述的方法,其中侦测该物件进一步包括:
为该差异帧的每一区块分配索引;及
计算具有相同图形段标签的选定区块的数量。
10.如权利要求9所述的方法,其中侦测该物件另包括:
为该差异帧产生一二位元遮罩;及
产生包括用于取得该物件的资讯的该图形段的一候选区域。
11.一种通过一光栅扫描产生一图像的一选定图形段的方法,包括:
根据一第一预定亮度值将一像素标识为一选定像素,该像素具有一亮度值;
产生该选定图形段,该选定图形段系由该图像的选定像素所定义,相邻选定像素之间相互连接;及
在该光栅扫描中为该选定图形段的每一选定像素分配一图形段标签,其中该图形段标签标识选定图形段,并且每个不相邻的图形段标签系不同。
12.如权利要求11所述的方法,另包括计算具有相同图形段标签的该些选定像素的数量。
13.如权利要求11所述的方法,另包括为该图像产生一二位元遮罩。
CN201911191378.3A 2019-10-16 2019-11-28 一种物件定位系统及方法 Pending CN112668379A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/655,212 2019-10-16
US16/655,212 US11188756B2 (en) 2019-10-16 2019-10-16 Object localization and classification system and method thereof

Publications (1)

Publication Number Publication Date
CN112668379A true CN112668379A (zh) 2021-04-16

Family

ID=75400721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911191378.3A Pending CN112668379A (zh) 2019-10-16 2019-11-28 一种物件定位系统及方法

Country Status (3)

Country Link
US (1) US11188756B2 (zh)
CN (1) CN112668379A (zh)
TW (1) TWI729587B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11188756B2 (en) * 2019-10-16 2021-11-30 Realtek Singapore Private Limited Object localization and classification system and method thereof
EP4042370A4 (en) * 2019-11-15 2024-01-10 L'oreal END-TO-END MERGE ENABLES SEGMENTATION OF VIDEO OBJECTS (VOS)
CN117372446A (zh) * 2022-06-30 2024-01-09 中兴通讯股份有限公司 一种图像处理方法、装置、存储介质及电子装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201530496A (zh) * 2014-01-23 2015-08-01 Nat Univ Chung Hsing 多重目標影像辨識與追蹤方法
CN109063659A (zh) * 2018-08-08 2018-12-21 北京佳讯飞鸿电气股份有限公司 运动目标的检测与跟踪方法和系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3593929B2 (ja) * 1999-09-03 2004-11-24 日本電気株式会社 動画像符号化方法及び動画像符号化装置
US7079579B2 (en) * 2000-07-13 2006-07-18 Samsung Electronics Co., Ltd. Block matching processor and method for block matching motion estimation in video compression
WO2005084036A1 (ja) * 2004-03-01 2005-09-09 Sony Corporation 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム
US7606303B2 (en) * 2004-09-28 2009-10-20 General Instrument Corporation Method and apparatus to detect anchor frames from digital video streams
TWI297471B (en) * 2005-05-20 2008-06-01 Novatek Microelectronics Corp Method for video content complexity estimation, scene change detection and video encoding
KR101200535B1 (ko) * 2006-01-12 2012-11-27 (주)휴맥스 매크로블록 기반의 조명 변화에 대한 적응적 움직임예측/보상 장치 및 방법
JP4649355B2 (ja) * 2006-03-27 2011-03-09 富士通株式会社 ブロックノイズ検出方法及び装置並びにブロックノイズ低減方法及び装置
US8077775B2 (en) * 2006-05-12 2011-12-13 Freescale Semiconductor, Inc. System and method of adaptive rate control for a video encoder
RU2395787C2 (ru) * 2008-05-19 2010-07-27 Государственный Научный Центр России "Государственное Научное Учреждение "Центральный Научно-Исследовательский И Опытно-Конструкторский Институт Робототехники И Технической Кибернетики"(Цнии Ртк) Способ обнаружения объектов
JP4697276B2 (ja) * 2008-07-30 2011-06-08 ソニー株式会社 動きベクトル検出装置、動きベクトル検出方法及びプログラム
US8254671B1 (en) * 2009-05-14 2012-08-28 Adobe Systems Incorporated System and method for shot boundary detection in video clips
US20160078289A1 (en) * 2014-09-16 2016-03-17 Foundation for Research and Technology - Hellas (FORTH) (acting through its Institute of Computer Gesture Recognition Apparatuses, Methods and Systems for Human-Machine Interaction
JP6961443B2 (ja) * 2017-09-29 2021-11-05 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CN108198208B (zh) * 2017-12-27 2021-08-24 浩云科技股份有限公司 一种基于目标跟踪的移动侦测方法
US11188756B2 (en) * 2019-10-16 2021-11-30 Realtek Singapore Private Limited Object localization and classification system and method thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201530496A (zh) * 2014-01-23 2015-08-01 Nat Univ Chung Hsing 多重目標影像辨識與追蹤方法
CN109063659A (zh) * 2018-08-08 2018-12-21 北京佳讯飞鸿电气股份有限公司 运动目标的检测与跟踪方法和系统

Also Published As

Publication number Publication date
TW202117667A (zh) 2021-05-01
TWI729587B (zh) 2021-06-01
US20210117683A1 (en) 2021-04-22
US11188756B2 (en) 2021-11-30

Similar Documents

Publication Publication Date Title
US9384556B2 (en) Image processor configured for efficient estimation and elimination of foreground information in images
US9547800B2 (en) System and a method for the detection of multiple number-plates of moving cars in a series of 2-D images
EP2956891B1 (en) Segmenting objects in multimedia data
CN112668379A (zh) 一种物件定位系统及方法
US20130329987A1 (en) Video segmentation method
US20200302135A1 (en) Method and apparatus for localization of one-dimensional barcodes
Rashedi et al. A hierarchical algorithm for vehicle license plate localization
Yoon et al. Best combination of binarization methods for license plate character segmentation
EP1605407A1 (en) Image processing device
CN112580383A (zh) 二维码识别方法、装置、电子设备及存储介质
Li et al. License plate detection using convolutional neural network
US20200394802A1 (en) Real-time object detection method for multiple camera images using frame segmentation and intelligent detection pool
CN111325073A (zh) 基于运动信息聚类的监控视频异常行为检测方法
Ghahremannezhad et al. Real-time hysteresis foreground detection in video captured by moving cameras
CN114255344A (zh) 安检图像切分方法、装置、电子设备及计算机可读介质
Depraz et al. Real-time object detection and tracking in omni-directional surveillance using GPU
Pote et al. An improved technique to detect text from scene videos
Kim et al. Detection of moving edges based on the concept of entropy and cross-entropy
Pal Improved background subtraction technique for detecting moving objects
Higashi et al. New feature for shadow detection by combination of two features robust to illumination changes
Huang et al. Detecting both superimposed and scene text with multiple languages and multiple alignments in video
Wu et al. Segmenting moving objects from a freely moving camera with an effective segmentation cue
Vargas et al. A license plate extraction algorithm based on edge statistics and region growing
Hu et al. Application of computational verb image processing to 1-D barcode localization
RU2676029C1 (ru) Способ идентификации объекта в видеопотоке

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination