CN110909825B - 使用概率模型在视觉数据中检测对象 - Google Patents
使用概率模型在视觉数据中检测对象 Download PDFInfo
- Publication number
- CN110909825B CN110909825B CN201911254619.4A CN201911254619A CN110909825B CN 110909825 B CN110909825 B CN 110909825B CN 201911254619 A CN201911254619 A CN 201911254619A CN 110909825 B CN110909825 B CN 110909825B
- Authority
- CN
- China
- Prior art keywords
- image
- model
- probability
- models
- readable medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000007 visual effect Effects 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 claims description 51
- 238000003860 storage Methods 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 12
- 238000013507 mapping Methods 0.000 claims description 7
- 238000012549 training Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000009826 distribution Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/757—Matching configurations of points or features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
- G06V20/653—Three-dimensional objects by matching three-dimensional models, e.g. conformal mapping of Riemann surfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
公开了使用概率模型在视觉数据中检测对象。提供基于将特定对象匹配到对象的表示的匹配程序的输出的概率模型,其中该概率模型使对象存在的概率与匹配特征的数目相关。该概率模型被用于检测特定对象是否存在于接收的视觉数据中。
Description
本申请是申请号为201280077632.7,申请日为2012年10月11日,题为“使用概率模型在视觉数据中检测对象”的中国发明专利申请的分案申请。
技术领域
本公开涉及对象识别领域,更具体地涉及对象识别领域中使用概率模型在视觉数据中检测对象。
背景技术
对象识别能够被执行以在图像中检测特定对象的存在。对象检测能够基于将图像中的特征与特定对象的表示的特征匹配,其中该表示能够是特定对象的模型。匹配程序可以在图像与对象的表示之间的匹配特征数目超过固定阈值的情况下指示特定对象在图像中。
发明内容
根据本公开的一方面,提供了一种用于在视觉数据中检测对象的系统,该系统可以包括:至少一个计算机,包含在所述至少一个计算机的至少一个处理器上运行的对象识别器;非瞬态计算机可读介质,存储图像和多个概率模型;以及计算机接口,经由该计算机接口从可通信地连接到系统的源接收图像;其中,对象识别器访问存储在非瞬态计算机可读介质中的多个概率模型以及存储在对象描述符数据库中的多个对象模型;其中,所述多个对象模型中的每个对象模型包含描述相应对象的点特征的描述符;其中,对象识别器被配置成:从图像提取点特征,以及针对存储在对象描述符数据库中的所述多个对象模型中的一个对象模型,执行包括以下步骤的处理。所述步骤包括:将从图像提取的点特征与该对象模型的相应对象的点特征进行比较,以标识在从图像提取的点特征与该对象模型的相应对象的点特征之间的点对应,使用几何一致性技术标识所述点对应的最大子集,利用所述多个概率模型中的至少一个概率模型来将所述最大子集中的点对应的数目映射到概率值,将概率值与概率阈值进行比较,至少部分地基于概率阈值,确定由该对象模型表示的特定对象是否存在于图像中,以及如果确定由该对象模型表示的特定对象不存在于图像中,则更新所述处理针对的对象模型。
附图说明
一些实施例参考下面附图来描述:
图1是依据一些实施方式的包含对象检测系统的示例布置的方块图;
图2是依据一些实施方式的对象识别程序的流程图;
图3是依据进一步实施方式的对象识别程序的流程图;
图4是依据一些实施方式的针对给定对象建立概率模型的过程的流程图;以及
图5是依据一些实施方式的可用在图3的对象识别程序中的几何一致程序的流程图。
具体实施方式
为了执行对象识别以在视觉数据(例如,图像、视频数据等)中检测对象的存在,对象识别程序能够从视觉数据中提取特征用于与对象的给定表示(例如模型)的相应特征比较。要在视觉数据中检测的对象的示例能够包含下面内容:照片、海报、产品包装(例如,盒子、瓶子、罐头等)、广告牌、建筑物、纪念碑、车辆、景观等等。
在视觉数据与对象的表示之间的匹配特征数目超过某一指定阈值的情况下,匹配被认为已经发生(换言之,对象被认为存在于视觉数据中)。对象的不同类型能够包含特征的不同数目,该特征可用于匹配到对象的相应表示。例如,对象的第一类型能够包含可用于匹配到对象的第一类型的表示的特征的第一数目,而对象的第二类型能够包含可用于匹配到对象的第二类型的表示的特征的第二、不同数目。
如果对象的这样类型不含有可用特征的足够数目以能够满足固定数目阈值,则针对匹配特征数目使用固定阈值来指示匹配特征数目是否指示成功匹配可以导致对象的一些类型被不可靠地检测。另一方面,针对匹配特征数目的固定阈值的使用可以在针对对象的其它类型执行对象识别时导致相对大的数目的误报(false positive),对象的其它类型可以包含用于匹配的更大数目的可用特征。
虽然可以可能针对对象的对应不同类型人工地调谐阈值,但是这样的人工调谐过程可能是劳力密集的并且可能易受人为误差的影响。
依据一些实施方式,取代针对匹配特征数目使用固定阈值,概率模型能够被用在对象识别程序中以确定对象是否存在于视觉数据中。在随后的讨论中,对在图像中确定对象的存在进行参考。然而,在其它实施方式中,使用概率模型的对象识别程序能够被应用以在其它类型的视觉数据(诸如视频数据等等)中确定对象的存在。
概率模型使概率与匹配特征数目相关。该概率是对象存在于图像中的概率。通过使用概率模型,取代针对匹配特征数目指定固定阈值,能够代替地指定概率阈值。概率阈值能够针对对象不同的类型是相同的。
通过使用概率模型,对象识别程序是否已经在图像中检测到对象的确定基于概率阈值。多个概率模型能够被提供给对象的相应不同类型。
在一些实施方式中,为了确定特定对象是否在图像中,对象识别程序能够使用概率模型(对应于特定对象)将图像与对应对象之间的匹配数目转换为概率值。概率值能够与概率阈值相比以确定指示特定对象在图像中的匹配是否存在。
在替代实施方式中,对象识别程序能够使用概率模型将概率阈值转换为对应数目阈值,其中数目阈值指示匹配特征数目,在该匹配特征数目以上对象被认为存在于图像中。然后,图像与对应对象之间的匹配数目能够与数目阈值相比以确定匹配是否存在。
在后面实施方式中,针对对象的每个类型,相应概率模型能够使概率阈值与对应数目阈值相关。针对对象的不同类型,相应概率模型能够使概率阈值与不同数目阈值相关。通过针对对象的不同类型基于概率模型提供不同数目阈值而不是相同固定数目阈值,能够实现针对对象的不同类型的更可靠对象识别。
在一些示例中,针对对象的不同类型的多个数目阈值能够被存储在查找表或其它查找数据结构中。在尝试确定特定对象是否在图像中时,查找表或其它查找数据结构能够被访问以检索要在对象识别程序中使用的对应数目阈值。
虽然对针对对象的不同类型的多个概率模型的使用进行参考,但是注意的是,在替代实施方式中,一个概率模型能够被用于对象的多个不同类型。这样的实施方式中的概率模型的输入将会包含对象的类型的指示,并且概率模型然后能够使用该类型指示以执行概率值与匹配特征数目之间的相应转换。
在一些实施方式中,能够从图像中提取用于与对象的表示(例如模型)比较的特征能够是点特征。点特征指代从给定图像补丁(其能够具有预定义尺寸,诸如16x16栅格或其它尺寸)中提取的元素(被称为“描述符”)。在图像内,能够提取许多点特征,其能够与对象的表示中的参考点特征相比。点特征的示例包含SIFT(尺度不变特征变换)特征、SURF(加速稳健特征)等等。在其它示例中,取代使用点特征,能够使用特征的其它类型,诸如线特征、块特征等等。
在随后的讨论中,假定点特征被提取用于在图像中执行对象识别。标识在图像中的点特征与对象的表示中的点特征之间的匹配被称为标识点对应。虽然在随后的讨论中对匹配点特征进行参考,但是注意的是,类似的技术在其它实施方式中能够被应用到匹配特征的其它类型。
图1图解依据一些实施方式的对象识别系统100,其包含对象识别器102。对象识别系统100能够包含计算机或计算机的分布式布置。对象识别器102能够被实行在一个或多个处理器104上。对象识别器102能够访问被存储在存储介质(或多个存储介质)108中的概率模型106用于执行对象识别程序以在图像110中检测对象的存在。
图像110也能够被存储在存储介质(或多个存储介质)108中。在一些示例中,图像110能够从远程资源被对象识别系统100接收。一个这样的远程资源能够是远程系统112,其经过网络114被耦合到对象识别系统100。对象识别系统100能够通过对象识别系统100中的网络接口115经过网络114进行通信。远程系统112能够包含捕获图像110的照相机。在替代实施方式中,照相机能够是对象识别系统100的部分。
概率模型106能够由概率模型生成器103产生,该概率模型生成器103能够被实行在对象识别系统100的(一个或多个)处理器104上。在其它示例中,概率模型生成器103能够被实行在与对象识别器102不同的系统中。在这样的后面示例中,由概率模型生成器103生成的概率模型106能够从在其中概率模型生成器103实行的系统被对象识别系统100接收。
对象描述符数据库116也能够被存储在对象识别系统的存储介质(多个存储介质)108中。可替代地,对象描述符数据库116能够被存储在对象识别系统100外面的存储子系统中。对象描述符数据库116含有各种不同对象的模型。每个对象模型含有对应对象的描述符(其描述点特征或其它类型的特征)。
对象识别器102能够从图像110中提取点特征,并且能够将提取的点特征与对象描述符数据库116中的对象模型的对应点特征相比以确定特定对象(从由对象模型表示的对象之中)是否存在于图像110中。
图2是依据一些实施方式的能够被对象识别器102执行的过程。该过程(在202处)提供概率模型106。提供概率模型106能够包含:(1)在对象识别系统100中通过概率模型生成器103生成概率模型106,或者(2)从另一个系统通过对象识别系统100接收概率模型106。
图2的过程(在204处)进一步使用概率模型106来检测特定对象是否在图像110中。对象识别器102能够确定图像110与对象描述符数据库116中的对象的相应模型之间的点对应数目。如上面指出的,点对应指代图像110的点特征与如由对象模型表示的对象的对应点特征之间的匹配。
在一些实施方式中,对象识别器102能够使用相应概率模型106将点对应数目映射到概率值,该概率值然后能够与概率阈值相比。在概率值超过预定概率阈值的情况下能够指示匹配(指示在图像110中检测到对应对象)。
在替代实施方式中,针对特定对象,相应概率模型能够被用来将预定概率阈值映射到相应数目阈值。数目阈值指定点对应数目,在该点对应数目以上指示对象与图像110的匹配。为了检测特定对象是否存在于图像110中,将图像110与特定对象的对象模型之间的点对应数目与由概率模型映射的数目阈值相比,并且在点对应数目超过数目阈值的情况下指示匹配。
在进一步实施方式中,概率模型能够引入关于照相机姿态的信息。在这样的实施方式中,概率值与点对应数目之间的映射能够取决于照相机与对象的相对姿态而不同。
图3是依据进一步实施方式的能够由对象识别器102执行的过程。对象识别器102(在302处)接收图像110。然后,对象识别器102(在304处)从图像中提取点特征。
针对对象描述符数据库116中的多个对象模型中的每个执行图3的下面任务。针对相应对象的模型i,(在306处)从图像110中提取的点特征被匹配到对象描述符数据库116中的模型i中的描述符。针对每个模型i,在306处执行的匹配标识一组点对应。
然后,对象识别器102(在308处)标识该组中的点对应的子集,其中子集中的点对应是与对象的给定视图相一致的那些点对应。可能存在对应于捕获图像110的照相机的多个可能相对姿态(姿态能够通过距离和角度定义)的对象的多个可能视图。
该组点对应包含针对相应不同视图的点对应是可能的。该组点对应可以含有失配,从而导致与相应不同视图相一致的点对应的不同子集。在一些实施方式中,在308处标识的子集是最大子集,其是具有与对象的给定视图相一致的点对应的最大数目的子集。该最大子集和相关联的给定视图也将提供相对于对象的照相机姿态(例如,距离和角度)。
点对应的最大子集的标识能够使用几何一致性程序。假如在306处基于将图像110匹配到对象描述符数据库116中的模型i来识别该组点对应,则几何一致性技术尝试选择与对象的单个视图相一致的点对应的最大子集。
在一些示例中,几何一致性技术能够是RANSAC(随机采样一致)技术。下面关于图5来讨论示例RANSAC技术。
然后,对象识别器102(在310处)针对由模型i表示的对象的类型使用相应概率模型106(图1)以确定由模型i表示的对象在图像110中是否已经被检测到。如上面指出的,存在做出该确定的几个替代的技术。在一些实施方式中,对象识别器102能够使用相应概率模型106以将在308处标识的最大子集中的点对应数目映射为概率值,该概率值然后能够与概率阈值相比。在概率值超过概率阈值的情况下能够指示匹配。
在替代实施方式中,针对模型i,相应概率模型106能够被用来将预定概率阈值映射到相应数目阈值(在其以上指示匹配的点对应数目)。对象识别器102能够将在308处标识的最大子集中的点对应数目与对于模型i的数目阈值相比以确定是否存在匹配。在一些情况下,给定的概率阈值可能通过概率模型不可映射到数目阈值。在这样的情况下,对象在指定置信度的情况下可以被视为不可检测。
如果对象识别器(在312处)确定图像110与由模型i表示的对象之间的匹配在310处被指示,则过程能够停止。如果匹配不被指示,则图3的过程能够通过更新i(在314处)进行到对象描述符数据库116中的下一个模型。
图4描绘依据一些实施方式的针对对象的特定类型(被称为“训练对象”)来建立概率模型106的示例过程。该过程例如能够被图1的概率模型生成器103执行。能够针对对象的多个不同类型中的每个来反复图4的过程以建立相应概率模型。
在替代实施方式中,取代针对对象的不同类型建立不同概率模型,能够产生一个概率模型,其中该概率模型能够针对对象的不同类型来执行概率值与点对应的相应数目之间的不同转换。
在图4的过程中,概率模型生成器103(在400处)接收训练对象。(在402处)提取训练对象的点特征,并且这样提取的特征被存储在对象描述符数据库116中的训练对象的模型中。
图4的过程也(在404处)生成训练对象的许多模拟视图。模拟视图是对应于照相机相对于训练对象的不同姿态的视图。例如,透视或仿射翘曲(warp)能够被采用来计算模拟视图。
(在406处)从训练对象的模拟视图中的每个提取点特征。针对每个模拟视图提取的特征然后(在408处)被匹配到对象描述符数据库116中的对象模型。在408处执行的匹配使用在图3中描绘的对象识别程序的修改形式,如下面进一步解释的。在408处的匹配的输出产生各种统计,所述各种统计(在410处)被获得。统计的相应收集通过模拟视图中的每个到对象描述符数据库116中的对象模型的匹配而被输出。如下面进一步讨论的,这样的统计能够包含平均值和方差值。
在408处执行的匹配基于训练对象存在(因为模拟视图是含有训练对象的不同视图的图像)的标注数据(ground truth)。因此,在410处获得的统计是针对匹配的统计。
此外,在图4的过程中提供分离的子流程,其中匹配关于参考图像(在参考图像的库412中含有)来执行,该参考图像已知不包含训练对象。图4的过程(在414处)从参考图像中的每个提取点特征。针对每个参考图像,(在416处)将提取的特征匹配到对象描述符数据库116中的相应对象模型。在416处执行的匹配使用在图3中描绘的对象识别程序的修改形式,如下面进一步解释的。
(在418处)获得基于在416处将相应参考图像匹配到对象模型而输出的多个统计的相应收集。在416处执行的匹配基于如下标注数据:应当不存在到对象描述符数据库116中的对应对象的匹配。因此,在418处获得的统计是针对不匹配的统计。如下面进一步讨论的,这样的统计能够包含平均值和方差值。
在410和418处获得的统计然后(在420处)被组合以针对训练对象建立概率模型(下面进一步讨论)。在一些实施方式中,概率模型能够被用来(在422处)从概率阈值确定数目阈值,其中数目阈值能够被用在图2或3的对象识别程序中。计算的数目阈值然后(在424处)被存储用于后面使用。
在其中图2或3的对象识别程序执行与概率阈值的比较的替代实施方式中,任务422和424能够被忽略,而任务410、418和420仍然被执行。
下面依据一些实施方式讨论在420处建立的示例概率模型。概率模型具有下面随机变量:M(对象描述符数据库116中的对象的标注数据指数)、O(对象描述符数据库116中的对象的经验指数)、以及N(观察到与对象相一致的内点(inlier)数目)。能够为M和N指定(一个或多个)预定义值以指示没有对象(这样的预定义值的示例能够是-1或某一其它值)。
内点能够指代图像的点特征与对象的模型的点特征之间的点对应。N能够表示这样的点对应的数目。更一般地说,内点能够指代图像的特征与对象模型的特征之间的任何对应(匹配)。
标注数据指数M是对象描述符数据库116中的、表示实际在图像中的对象的模型的标识符。经验指数O是对象描述符数据库116中的、表示对象识别程序相信该程序正看到的对象的模型的标识符。
在图3中在308处应用的几何一致性程序输出针对O和N的值。概率模型能够被表示为条件概率P(M=m|O=m,N=n),其中概率模型提供照相机实际正看到对象(M=m)的概率,给定测量O(=m)以及N(=n)。
应用贝叶斯定理两次,条件概率P(M=m|O=m,N=n)能够被导出如下:
通过对M忽略分母中的第一项并且简化,获得下面:
其中
W=P(N=n|O=m,M=m)·P(M=m)·P(O=m|M=m)+P(N=n|O=m,M≠m)·P(M≠m)·P(O=m|M≠m).。
用于导出条件概率P(M=m|O=m,N=n)的上面方程的每项下面被描述。
P(M=m)是针对对象m的先验概率。这在一些示例中能够被假定针对所有对象相同。先验概率P(M=m)表达在数据被接收之前关于对象m的概率的不确定性。
给定正确观察的对象m,P(N=n|M=m,O=m)是得到n个内点的概率。该概率能够从在图4中在410处获得的对象m的模拟视图的统计来估计。在一些示例中,高斯分布能够被假定具有由用于从对象的模拟视图进行正确检测的内点的经验平均数目估计的平均值。方差也能够以这种方式来估计。在其它示例中,方差能够被设定等于平均值。将方差设定等于平均值是可接受的,因为这是泊松分布的限制。
给定上面情况,概率P(N=n|M=m,O=m)被导出如下:
其中μ1(m)是用于对象m的正确匹配的内点的经验平均数目。在该示例中,μ1(m)连同对应的变量一起是在410处获得的统计。前面方程假定平均值等于方差。
P(O=m|M=m))是正确观察到对象m的概率。这能够从对象的模拟视图的统计(在410处获得)中估计。在一些示例中,概率能够仅是成功的检测的分数(换言之,模拟视图到相应对象模型的成功匹配数目与执行的总匹配数目的比率)。
P(M≠m)是针对对象m的先验概率P(M=m)的补数。更具体地,P(M≠m)=1-P(M=m)。
P(N=n|M≠m,O=m)是针对与对象m的错误匹配获得n个内点的概率;换言之,在对象m事实上不在图像中时的概率。这能够从通过将参考图像与针对对象m的对象模型匹配(在418处获得)的统计来估计。该过程能够使用与上面指出的相同高斯模型以导出下面:
其中μ2(m)是针对与对象m的错误匹配的内点的经验平均数目。在前面示例中,μ2(m)连同相关联的方差一起能够是在418处获得的统计。前面方程假定平均值等于方差。
根据上面情况,概率模型提供对象m在图像中的概率与内点数目n之间的映射。如上面解释的,该映射能够被用来将针对对象的内点数目转换成为要与概率阈值相比的概率值,该概率阈值能够针对所有对象是相同的。可替代地,通过应用逆向映射,概率阈值能够被转换成为内点计数阈值,所述内点计数阈值对于每个模型是不同的。
图5是根据一些实施方式的几何一致性程序的流程图。图5描绘RANSAC(随机采样一致)技术。如上面讨论的,几何一致性程序在图3的对象识别程序中在308处被执行用于将图像匹配到由对象描述符数据库116的模型表示的对象。
(在502处)得分Best_Score被初始化为零(或某一其它初始值)。(在504处)选择p个(其中p能够是三或某一其它值)点对应的随机样本。该样本然后被用来诸如通过使用三点姿态技术生成上至三个候选照相机姿态。在三点姿态技术中,三个几何点能够产生照相机的多个姿态。
对于每个候选照相机姿态,下面针对每个点对应来执行。注意的是,点对应与图像中的点特征和由对象描述符数据库116的模型表示的对象中的匹配点特征相关联。(在506处)对象中的点特征的位置使用候选照相机姿态来再投影。再投影有效地修改要与候选照相机姿态相一致的对象中的点特征的位置。
(在508处)然后计算对象中的再投影点特征与图像中的对应点特征的观察位置之间的距离,其中该距离被称为再投影误差。(在510处)将再投影误差与误差阈值相比。该过程将与在误差阈值以下的再投影误差相关联的点对应标识为内点。
针对在随机样本(其具有p个点对应)中的其它点对应中的每个来重复任务506、508和510。
过程接着(在512处)计数具有在误差阈值以下的再投影误差的点对应的数目。该计数的数目是得分。如果计数的得分大于当前最佳得分Best_Score,则Best_Score(在514处)被更新到计数的得分。而且,与最高计数的得分相关联的候选照相机姿态至此(在516处)被记录。
前面任务被重复直到停止的标准(在518处)被确定已经被满足,其中停止的标准能够是最佳得分Best_Score超过预定义阈值,或者重复的指定数目已经被执行。如果停止的标准不被满足,则任务504至518被反复,其中任务504将会选择p个点对应的另一个随机样本。
在停止的标准被满足之后,则最佳的照相机姿态连同表示内点数目的对应计数的得分一起被确定(如在516处记录的)。
如上面指出的,在408或416处执行的匹配使用在图3中描绘的对象识别程序的修改形式。在修改的对象识别程序中,在图3中在308处执行的几何一致性程序使用零(或某一其它低值)的误差阈值,这将会导致在图5中描述的过程中的内点的更大数目的检测。
上面描述的模块(包含图1的对象识别器102和概率模型生成器103)的机器可读指令被加载用于在一个或多个处理器(诸如图1中的104)上实行。处理器能够包含微处理器、微控制器、处理器模块或子系统、可编程集成电路、可编程门阵列、或另一个控制或计算装置。
数据和指令被存储在相应存储装置中,该相应存储装置被实施为一个或多个计算机可读或机器可读存储介质。存储介质包含不同形式的存储器,其包含半导体存储器装置诸如动态或静态随机存取存储器(DRAM或SRAM)、可擦除和可编程只读存储器(EPROM)、电可擦除和可编程只读存储器(EEPROM)和闪速存储器;磁盘诸如固定磁盘、软盘和可移动磁盘;包含磁带的其它磁介质;光学介质诸如光盘(CD)或数字视频光盘(DVD);或其它类型的存储装置。注意的是,上面讨论的指令能够被提供在一个计算机可读或机器可读存储介质上,或者可替代地,能够被提供在分布在可能具有多个节点的大系统中的多个计算机可读或机器可读存储介质上。这样的一个或多个计算机可读或机器可读存储介质被认为是物品(或制品)的部分。物品或制品能够指代任何制造的单个部件或多个部件。一个或多个存储介质能够位于运行机器可读指令的机器中,或者位于远程站点,机器可读指令能够从该远程站点经过网络被下载用于实行。
在前面描述中,许多细节被阐明来提供在本文中公开的主题的理解。然而,实施方式可以在没有这些细节中的一些或所有的情况下被实践。其它实施方式可以包含对上面讨论的细节的修改和变化。意在所附权利要求覆盖这样的修改和变化。
Claims (20)
1.一种用于在视觉数据中检测对象的系统,包括:
至少一个计算机,包含在所述至少一个计算机的至少一个处理器上运行的对象识别器;
非瞬态计算机可读介质,存储图像和多个概率模型;以及
计算机接口,经由该计算机接口从可通信地连接到系统的源接收图像;
其中,对象识别器访问存储在非瞬态计算机可读介质中的多个概率模型以及存储在对象描述符数据库中的多个对象模型,以及其中所述多个概率模型对应于不同的对象类型,并且其中每个概率模型与相应对象类型的对象存在于图像中的概率有关;
其中,所述多个对象模型中的每个对象模型包含描述相应对象的点特征的描述符;
其中,对象识别器被配置成:
从图像提取点特征,以及
针对存储在对象描述符数据库中的所述多个对象模型中的每个相应对象模型,执行包括以下步骤的处理:
将从图像提取的点特征与该相应对象模型的相应对象的点特征进行比较,以标识在从图像提取的点特征与该相应对象模型的相应对象的点特征之间的点对应,
使用几何一致性技术标识所述点对应的最大子集,
利用与对象类型之一对应的相应概率模型来将所述最大子集中的点对应的数目映射到概率值,
将概率值与针对该相应对象模型的概率阈值进行比较,
至少部分地基于概率阈值,确定由该相应对象模型表示的特定对象是否存在于图像中,以及
如果确定由该相应对象模型表示的特定对象不存在于图像中,则更新所述处理针对的相应对象模型。
2.根据权利要求1所述的系统,还包括:存储所述多个对象模型的对象描述符数据库。
3.根据权利要求1所述的系统,其中,对象描述符数据库驻存在系统外部的存储子系统上。
4.根据权利要求1所述的系统,还包括:被配置成产生所述多个概率模型的概率模型生成器。
5.根据权利要求1所述的系统,其中,计算机接口包括用于通过网络从远程系统接收所述多个概率模型的网络接口。
6.根据权利要求1所述的系统,其中,计算机接口包括网络接口,其中,经由该网络接口通过网络从源接收图像。
7.根据权利要求1所述的系统,其中,源包括捕获图像的相机。
8.一种对象检测方法,该方法包括:
从图像提取点特征,该提取是由在至少一个计算机处理器上运行的对象识别器执行的,其中对象识别器访问存储在非瞬态计算机可读介质中的多个概率模型以及存储在对象描述符数据库中的多个对象模型,其中所述多个对象模型中的每个对象模型包含描述相应对象的点特征的描述符,以及其中所述多个概率模型对应于不同的对象类型,并且其中每个概率模型与相应对象类型的对象存在于图像中的概率有关;以及
针对存储在对象描述符数据库中的所述多个对象模型中的每个相应对象模型,由对象识别器执行包括以下步骤的处理:
将从图像提取的点特征与该相应对象模型的相应对象的点特征进行比较,以标识在从图像提取的点特征与该相应对象模型的相应对象的点特征之间的点对应;
使用几何一致性技术标识所述点对应的最大子集;
利用与对象类型之一对应的相应概率模型来将所述最大子集中的点对应的数目映射到概率值;
将概率值与针对该相应对象模型的概率阈值进行比较;
至少部分地基于概率阈值,确定由该相应对象模型表示的特定对象是否存在于图像中;以及
如果确定由该相应对象模型表示的特定对象不存在于图像中,则更新所述处理针对的相应对象模型。
9.根据权利要求8所述的对象检测方法,其中,对象描述符数据库驻存在非瞬态计算机可读介质中。
10.根据权利要求8所述的对象检测方法,其中,对象描述符数据库驻存在非瞬态计算机可读介质外部的存储子系统上。
11.根据权利要求8所述的对象检测方法,还包括:由在所述至少一个计算机处理器上运行的概率模型生成器产生所述多个概率模型。
12.根据权利要求8所述的对象检测方法,还包括:通过网络从远程系统接收所述多个概率模型。
13.根据权利要求8所述的对象检测方法,还包括:通过网络从远程源接收图像。
14.根据权利要求8所述的对象检测方法,还包括:从捕获图像的相机接收图像。
15.一种非瞬态计算机可读介质,该非瞬态计算机可读介质存储指令和多个概率模型,所述指令能够由至少一个计算机处理器翻译以执行:
访问存储在对象描述符数据库中的多个对象模型,其中所述多个对象模型中的每个对象模型包含描述相应对象的点特征的描述符,以及其中所述多个概率模型对应于不同的对象类型,并且其中每个概率模型与相应对象类型的对象存在于图像中的概率有关;
从图像提取点特征;以及
针对存储在对象描述符数据库中的所述多个对象模型中的每个相应对象模型,执行包括以下步骤的处理:
将从图像提取的点特征与该相应对象模型的相应对象的点特征进行比较,以标识在从图像提取的点特征与该相应对象模型的相应对象的点特征之间的点对应;
使用几何一致性技术标识所述点对应的最大子集;
利用与对象类型之一对应的相应概率模型来将所述最大子集中的点对应的数目映射到概率值;
将概率值与针对该相应对象模型的概率阈值进行比较;
至少部分地基于概率阈值,确定由该相应对象模型表示的特定对象是否存在于图像中;以及
如果确定由该相应对象模型表示的特定对象不存在于图像中,则更新所述处理针对的相应对象模型。
16.根据权利要求15所述的非瞬态计算机可读介质,其中,对象描述符数据库驻存在非瞬态计算机可读介质中。
17.根据权利要求15所述的非瞬态计算机可读介质,其中,对象描述符数据库驻存在非瞬态计算机可读介质外部的存储子系统上。
18.根据权利要求15所述的非瞬态计算机可读介质,其中,所述指令还能够由所述至少一个计算机处理器翻译以产生所述多个概率模型。
19.根据权利要求15所述的非瞬态计算机可读介质,其中,所述指令还能够由所述至少一个计算机处理器翻译以通过网络从远程系统接收所述多个概率模型。
20.根据权利要求15所述的非瞬态计算机可读介质,其中,所述指令还能够由所述至少一个计算机处理器翻译以通过网络从远程源接收图像或者从捕获图像的相机接收图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911254619.4A CN110909825B (zh) | 2012-10-11 | 2012-10-11 | 使用概率模型在视觉数据中检测对象 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201280077632.7A CN105164700B (zh) | 2012-10-11 | 2012-10-11 | 使用概率模型在视觉数据中检测对象 |
CN201911254619.4A CN110909825B (zh) | 2012-10-11 | 2012-10-11 | 使用概率模型在视觉数据中检测对象 |
PCT/EP2012/070159 WO2014056537A1 (en) | 2012-10-11 | 2012-10-11 | Using a probabilistic model for detecting an object in visual data |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280077632.7A Division CN105164700B (zh) | 2012-10-11 | 2012-10-11 | 使用概率模型在视觉数据中检测对象 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110909825A CN110909825A (zh) | 2020-03-24 |
CN110909825B true CN110909825B (zh) | 2024-05-28 |
Family
ID=47177911
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911254619.4A Active CN110909825B (zh) | 2012-10-11 | 2012-10-11 | 使用概率模型在视觉数据中检测对象 |
CN201280077632.7A Active CN105164700B (zh) | 2012-10-11 | 2012-10-11 | 使用概率模型在视觉数据中检测对象 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280077632.7A Active CN105164700B (zh) | 2012-10-11 | 2012-10-11 | 使用概率模型在视觉数据中检测对象 |
Country Status (4)
Country | Link |
---|---|
US (6) | US9594942B2 (zh) |
EP (1) | EP2907082B1 (zh) |
CN (2) | CN110909825B (zh) |
WO (1) | WO2014056537A1 (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909825B (zh) | 2012-10-11 | 2024-05-28 | 开文公司 | 使用概率模型在视觉数据中检测对象 |
CN102957800B (zh) | 2012-11-12 | 2014-05-21 | 北京小米科技有限责任公司 | 一种移动终端待机方法及装置 |
US20140232748A1 (en) * | 2013-02-15 | 2014-08-21 | Samsung Electronics Co., Ltd. | Device, method and computer readable recording medium for operating the same |
US10296814B1 (en) * | 2013-06-27 | 2019-05-21 | Amazon Technologies, Inc. | Automated and periodic updating of item images data store |
US9904744B2 (en) | 2014-09-23 | 2018-02-27 | International Business Machines Corporation | Probabilistic simulation scenario design by using multiple conditional and nested probability distribution input functions |
WO2016153479A1 (en) * | 2015-03-23 | 2016-09-29 | Longsand Limited | Scan face of video feed |
US10169684B1 (en) | 2015-10-01 | 2019-01-01 | Intellivision Technologies Corp. | Methods and systems for recognizing objects based on one or more stored training images |
JP6348093B2 (ja) * | 2015-11-06 | 2018-06-27 | ファナック株式会社 | 入力データから検出対象物の像を検出する画像処理装置および方法 |
JP6528723B2 (ja) * | 2016-05-25 | 2019-06-12 | トヨタ自動車株式会社 | 物体認識装置、物体認識方法及びプログラム |
KR20180068578A (ko) | 2016-12-14 | 2018-06-22 | 삼성전자주식회사 | 복수의 센서를 이용하여 객체를 인식하는 전자 기기 및 방법 |
US20190035104A1 (en) * | 2017-07-25 | 2019-01-31 | Motionloft, Inc. | Object detection and tracking |
WO2019108250A1 (en) * | 2017-12-03 | 2019-06-06 | Facebook, Inc. | Optimizations for dynamic object instance detection, segmentation, and structure mapping |
US10586350B2 (en) | 2017-12-03 | 2020-03-10 | Facebook, Inc. | Optimizations for dynamic object instance detection, segmentation, and structure mapping |
US10796452B2 (en) | 2017-12-03 | 2020-10-06 | Facebook, Inc. | Optimizations for structure mapping and up-sampling |
US10665028B2 (en) * | 2018-06-04 | 2020-05-26 | Facebook, Inc. | Mobile persistent augmented-reality experiences |
US10521963B1 (en) * | 2018-06-08 | 2019-12-31 | Verizon Patent And Licensing Inc. | Methods and systems for representing a pre-modeled object within virtual reality data |
US10937150B2 (en) * | 2018-06-28 | 2021-03-02 | General Electric Company | Systems and methods of feature correspondence analysis |
JP7357676B2 (ja) * | 2018-11-15 | 2023-10-06 | マジック リープ, インコーポレイテッド | 自己改良ビジュアルオドメトリを実施するためのシステムおよび方法 |
CN111582305B (zh) * | 2020-03-26 | 2023-08-18 | 平安科技(深圳)有限公司 | 生物特征识别方法、装置、计算机设备及存储介质 |
DE102021201918A1 (de) * | 2020-10-07 | 2022-04-07 | Robert Bosch Gesellschaft mit beschränkter Haftung | Vorrichtung und Verfahren zum Steuern ein oder mehrerer Roboter |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101123090A (zh) * | 2006-08-11 | 2008-02-13 | 哈曼贝克自动系统股份有限公司 | 通过使用平方根折扣的统计语言的语音识别 |
CN101167086A (zh) * | 2005-05-31 | 2008-04-23 | 实物视频影像公司 | 用于安全应用的人体检测和跟踪 |
CN101341513A (zh) * | 2005-12-22 | 2009-01-07 | 皇家飞利浦电子股份有限公司 | 自动3-d对象检测 |
CN101939991A (zh) * | 2007-01-23 | 2011-01-05 | 欧几里得发现有限责任公司 | 用于处理图像数据的计算机方法和装置 |
CN102034274A (zh) * | 2010-12-10 | 2011-04-27 | 中国人民解放军国防科学技术大学 | 3d点云序列中帧与帧之间对应关系的计算方法 |
CN102110228A (zh) * | 2009-12-23 | 2011-06-29 | Metaio有限公司 | 确定在光学对象初始化追踪过程中使用的参考特征的方法以及对象初始化追踪方法 |
CN102216957A (zh) * | 2008-10-09 | 2011-10-12 | 埃西斯创新有限公司 | 图像中对象的视觉跟踪以及图像分割 |
CN102236798A (zh) * | 2011-08-01 | 2011-11-09 | 清华大学 | 一种图像匹配方法及其装置 |
CN102509308A (zh) * | 2011-08-18 | 2012-06-20 | 上海交通大学 | 基于混合动态纹理空时显著性检测的运动分割方法 |
Family Cites Families (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5850470A (en) * | 1995-08-30 | 1998-12-15 | Siemens Corporate Research, Inc. | Neural network for locating and recognizing a deformable object |
US5943435A (en) * | 1997-10-07 | 1999-08-24 | Eastman Kodak Company | Body part recognition in radiographic images |
US6618490B1 (en) * | 1999-09-16 | 2003-09-09 | Hewlett-Packard Development Company, L.P. | Method for efficiently registering object models in images via dynamic ordering of features |
US6597801B1 (en) * | 1999-09-16 | 2003-07-22 | Hewlett-Packard Development Company L.P. | Method for object registration via selection of models with dynamically ordered features |
US6741756B1 (en) * | 1999-09-30 | 2004-05-25 | Microsoft Corp. | System and method for estimating the orientation of an object |
JP2003514309A (ja) * | 1999-11-09 | 2003-04-15 | ザ・ビクトリア・ユニバーシテイ・オブ・マンチエスター | 物体の種類の識別、検証あるいは物体の画像合成 |
US7280697B2 (en) * | 2001-02-01 | 2007-10-09 | California Institute Of Technology | Unsupervised learning of object categories from cluttered images |
US6829384B2 (en) * | 2001-02-28 | 2004-12-07 | Carnegie Mellon University | Object finder for photographic images |
US6493620B2 (en) * | 2001-04-18 | 2002-12-10 | Eaton Corporation | Motor vehicle occupant detection system employing ellipse shape models and bayesian classification |
US7289662B2 (en) * | 2002-12-07 | 2007-10-30 | Hrl Laboratories, Llc | Method and apparatus for apparatus for generating three-dimensional models from uncalibrated views |
US6912298B1 (en) * | 2003-08-11 | 2005-06-28 | Adobe Systems Incorporation | Object detection using dynamic probability scans |
US7587064B2 (en) * | 2004-02-03 | 2009-09-08 | Hrl Laboratories, Llc | Active learning system for object fingerprinting |
US20050223031A1 (en) * | 2004-03-30 | 2005-10-06 | Andrew Zisserman | Method and apparatus for retrieving visual object categories from a database containing images |
WO2006002299A2 (en) * | 2004-06-22 | 2006-01-05 | Sarnoff Corporation | Method and apparatus for recognizing 3-d objects |
WO2006002320A2 (en) * | 2004-06-23 | 2006-01-05 | Strider Labs, Inc. | System and method for 3d object recognition using range and intensity |
US7848566B2 (en) * | 2004-10-22 | 2010-12-07 | Carnegie Mellon University | Object recognizer and detector for two-dimensional images using bayesian network based classifier |
US7548637B2 (en) * | 2005-04-07 | 2009-06-16 | The Board Of Trustees Of The University Of Illinois | Method for detecting objects in an image using pair-wise pixel discriminative features |
US7706603B2 (en) | 2005-04-19 | 2010-04-27 | Siemens Corporation | Fast object detection for augmented reality systems |
JP4691158B2 (ja) | 2005-06-16 | 2011-06-01 | ストライダー ラブス,インコーポレイテッド | 三次元クラスモデルを用いた二次元画像における認識システムおよび方法 |
US7545954B2 (en) * | 2005-08-22 | 2009-06-09 | General Electric Company | System for recognizing events |
US7865492B2 (en) * | 2005-09-28 | 2011-01-04 | Nokia Corporation | Semantic visual search engine |
US7519201B2 (en) * | 2005-10-28 | 2009-04-14 | Honda Motor Co., Ltd. | Detecting humans via their pose |
US7949186B2 (en) * | 2006-03-15 | 2011-05-24 | Massachusetts Institute Of Technology | Pyramid match kernel and related techniques |
US7840825B2 (en) | 2006-10-24 | 2010-11-23 | International Business Machines Corporation | Method for autonomous dynamic voltage and frequency scaling of microprocessors |
US20080112593A1 (en) * | 2006-11-03 | 2008-05-15 | Ratner Edward R | Automated method and apparatus for robust image object recognition and/or classification using multiple temporal views |
US20100104158A1 (en) * | 2006-12-21 | 2010-04-29 | Eli Shechtman | Method and apparatus for matching local self-similarities |
US7885794B2 (en) * | 2007-11-30 | 2011-02-08 | Xerox Corporation | Object comparison, retrieval, and categorization methods and apparatuses |
US8150098B2 (en) * | 2007-12-20 | 2012-04-03 | Eastman Kodak Company | Grouping images by location |
US8090212B1 (en) * | 2007-12-21 | 2012-01-03 | Zoran Corporation | Method, apparatus, and system for reducing blurring of an image using multiple filtered images |
KR100951890B1 (ko) * | 2008-01-25 | 2010-04-12 | 성균관대학교산학협력단 | 상황 모니터링을 적용한 실시간 물체 인식 및 자세 추정 방법 |
AU2008200966B2 (en) * | 2008-02-28 | 2012-03-15 | Canon Kabushiki Kaisha | Stationary object detection using multi-mode background modelling |
CN101251898B (zh) | 2008-03-25 | 2010-09-15 | 腾讯科技(深圳)有限公司 | 一种肤色检测方法及装置 |
US8995758B1 (en) * | 2008-06-20 | 2015-03-31 | Google Inc. | Classifying false positive descriptors |
CN101359372B (zh) * | 2008-09-26 | 2011-05-11 | 腾讯科技(深圳)有限公司 | 分类器的训练方法及装置、识别敏感图片的方法及装置 |
CN101765019B (zh) * | 2008-12-25 | 2012-07-18 | 北京大学 | 一种用于运动模糊和光照变化图像的立体匹配方法 |
SG172972A1 (en) | 2009-01-28 | 2011-08-29 | Bae Systems Plc | Detecting potential changed objects in images |
US20110235910A1 (en) * | 2009-06-30 | 2011-09-29 | Omri Soceanu | Method circuit and system for matching an object or person present within two or more images |
WO2011065952A1 (en) * | 2009-11-30 | 2011-06-03 | Hewlett-Packard Development Company, L.P. | Face recognition apparatus and methods |
WO2011069021A2 (en) * | 2009-12-02 | 2011-06-09 | Qualcomm Incorporated | Improving performance of image recognition algorithms by pruning features, image scaling, and spatially constrained feature matching |
US8306314B2 (en) * | 2009-12-28 | 2012-11-06 | Mitsubishi Electric Research Laboratories, Inc. | Method and system for determining poses of objects |
US20110208685A1 (en) * | 2010-02-25 | 2011-08-25 | Hariraam Varun Ganapathi | Motion Capture Using Intelligent Part Identification |
US8565538B2 (en) * | 2010-03-16 | 2013-10-22 | Honda Motor Co., Ltd. | Detecting and labeling places using runtime change-point detection |
AU2011244813B2 (en) * | 2010-04-21 | 2014-10-16 | Bae Systems Plc | Classification of range profiles |
ES2384928B1 (es) | 2010-06-25 | 2013-05-20 | Telefónica, S.A. | Método y sistema para la identificación rápida y robusta de productos específicos en imágenes. |
US8532399B2 (en) * | 2010-08-20 | 2013-09-10 | Xerox Corporation | Large scale image classification |
US20120045132A1 (en) * | 2010-08-23 | 2012-02-23 | Sony Corporation | Method and apparatus for localizing an object within an image |
EP2423873B1 (en) | 2010-08-25 | 2013-12-11 | Lakeside Labs GmbH | Apparatus and Method for Generating an Overview Image of a Plurality of Images Using a Reference Plane |
US8527445B2 (en) * | 2010-12-02 | 2013-09-03 | Pukoa Scientific, Llc | Apparatus, system, and method for object detection and identification |
KR101760258B1 (ko) * | 2010-12-21 | 2017-07-21 | 삼성전자주식회사 | 얼굴 인식 장치 및 그 방법 |
US9323337B2 (en) * | 2010-12-29 | 2016-04-26 | Thomson Licensing | System and method for gesture recognition |
JP5734460B2 (ja) * | 2011-01-25 | 2015-06-17 | テレコム・イタリア・エッセ・ピー・アー | 画像を比較するための方法およびシステム |
US8953888B2 (en) * | 2011-02-10 | 2015-02-10 | Microsoft Corporation | Detecting and localizing multiple objects in images using probabilistic inference |
US8942917B2 (en) * | 2011-02-14 | 2015-01-27 | Microsoft Corporation | Change invariant scene recognition by an agent |
US8594385B2 (en) * | 2011-04-19 | 2013-11-26 | Xerox Corporation | Predicting the aesthetic value of an image |
US8995775B2 (en) * | 2011-05-02 | 2015-03-31 | Facebook, Inc. | Reducing photo-tagging spam |
US9711182B2 (en) * | 2011-06-07 | 2017-07-18 | In Situ Media Corporation | System and method for identifying and altering images in a digital video |
GB201113633D0 (en) * | 2011-08-08 | 2011-09-21 | Vision Semantics Ltd | User-primed iterative discovery of object associations in distributed multi-source data |
US8533204B2 (en) * | 2011-09-02 | 2013-09-10 | Xerox Corporation | Text-based searching of image data |
US8824797B2 (en) * | 2011-10-03 | 2014-09-02 | Xerox Corporation | Graph-based segmentation integrating visible and NIR information |
US8866924B2 (en) * | 2011-10-28 | 2014-10-21 | Hewlett-Packard Development Company, L.P. | Local image feature descriptors according to circular distribution information |
US8768048B1 (en) * | 2011-11-18 | 2014-07-01 | Google Inc. | System and method for exploiting segment co-occurrence relationships to identify object location in images |
CN110909825B (zh) | 2012-10-11 | 2024-05-28 | 开文公司 | 使用概率模型在视觉数据中检测对象 |
US9665800B1 (en) * | 2012-10-21 | 2017-05-30 | Google Inc. | Rendering virtual views of three-dimensional (3D) objects |
WO2014086435A1 (en) * | 2012-12-07 | 2014-06-12 | Longsand Limited | Matching a feature of captured visual data |
CN105144193A (zh) * | 2013-03-26 | 2015-12-09 | 诺基亚技术有限公司 | 用于估计成像设备的姿态的方法和设备 |
US9424461B1 (en) * | 2013-06-27 | 2016-08-23 | Amazon Technologies, Inc. | Object recognition for three-dimensional bodies |
US20150095360A1 (en) * | 2013-09-27 | 2015-04-02 | Qualcomm Incorporated | Multiview pruning of feature database for object recognition system |
US10417552B2 (en) | 2014-03-25 | 2019-09-17 | Nanyang Technological University | Curiosity-based emotion modeling method and system for virtual companions |
US9977955B2 (en) * | 2014-06-19 | 2018-05-22 | Rakuten Kobo, Inc. | Method and system for identifying books on a bookshelf |
JP2018501556A (ja) * | 2014-11-27 | 2018-01-18 | ロングサンド リミテッド | 複数のバイナリサポートベクターマシンによるクラスの事後確率の計算 |
JP2017537398A (ja) * | 2014-12-02 | 2017-12-14 | ロングサンド リミテッド | 一組の構造化データタームからの非構造化検索クエリの生成 |
-
2012
- 2012-10-11 CN CN201911254619.4A patent/CN110909825B/zh active Active
- 2012-10-11 CN CN201280077632.7A patent/CN105164700B/zh active Active
- 2012-10-11 WO PCT/EP2012/070159 patent/WO2014056537A1/en active Application Filing
- 2012-10-11 US US14/434,056 patent/US9594942B2/en active Active
- 2012-10-11 EP EP12784483.5A patent/EP2907082B1/en active Active
-
2017
- 2017-01-31 US US15/420,515 patent/US9892339B2/en active Active
-
2018
- 2018-01-08 US US15/864,839 patent/US10417522B2/en active Active
-
2019
- 2019-08-06 US US16/532,702 patent/US10699158B2/en active Active
-
2020
- 2020-06-03 US US16/891,923 patent/US11341738B2/en active Active
-
2022
- 2022-05-10 US US17/741,211 patent/US20220277543A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101167086A (zh) * | 2005-05-31 | 2008-04-23 | 实物视频影像公司 | 用于安全应用的人体检测和跟踪 |
CN101341513A (zh) * | 2005-12-22 | 2009-01-07 | 皇家飞利浦电子股份有限公司 | 自动3-d对象检测 |
CN101123090A (zh) * | 2006-08-11 | 2008-02-13 | 哈曼贝克自动系统股份有限公司 | 通过使用平方根折扣的统计语言的语音识别 |
CN101939991A (zh) * | 2007-01-23 | 2011-01-05 | 欧几里得发现有限责任公司 | 用于处理图像数据的计算机方法和装置 |
CN102216957A (zh) * | 2008-10-09 | 2011-10-12 | 埃西斯创新有限公司 | 图像中对象的视觉跟踪以及图像分割 |
CN102110228A (zh) * | 2009-12-23 | 2011-06-29 | Metaio有限公司 | 确定在光学对象初始化追踪过程中使用的参考特征的方法以及对象初始化追踪方法 |
CN102034274A (zh) * | 2010-12-10 | 2011-04-27 | 中国人民解放军国防科学技术大学 | 3d点云序列中帧与帧之间对应关系的计算方法 |
CN102236798A (zh) * | 2011-08-01 | 2011-11-09 | 清华大学 | 一种图像匹配方法及其装置 |
CN102509308A (zh) * | 2011-08-18 | 2012-06-20 | 上海交通大学 | 基于混合动态纹理空时显著性检测的运动分割方法 |
Non-Patent Citations (3)
Title |
---|
D.G. Lowe 等.Local feature view clustering for 3D object recognition.《Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition》.2003,第682-688页. * |
胡正平 等.基于过渡滑动窗贝叶斯分析的视觉注意模型.《光电工程》.2012,第38卷(第9期),全文. * |
鹿文浩 等.基于部件的三维目标检测算法新进展.《自动化学报》.2012,第38卷(第4期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
US20190362181A1 (en) | 2019-11-28 |
CN105164700A (zh) | 2015-12-16 |
EP2907082A1 (en) | 2015-08-19 |
US11341738B2 (en) | 2022-05-24 |
US9594942B2 (en) | 2017-03-14 |
EP2907082B1 (en) | 2018-07-18 |
US9892339B2 (en) | 2018-02-13 |
US20200293817A1 (en) | 2020-09-17 |
US20180129907A1 (en) | 2018-05-10 |
US20150278579A1 (en) | 2015-10-01 |
CN105164700B (zh) | 2019-12-24 |
US10417522B2 (en) | 2019-09-17 |
WO2014056537A1 (en) | 2014-04-17 |
US20220277543A1 (en) | 2022-09-01 |
US10699158B2 (en) | 2020-06-30 |
US20170140242A1 (en) | 2017-05-18 |
CN110909825A (zh) | 2020-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909825B (zh) | 使用概率模型在视觉数据中检测对象 | |
US10936911B2 (en) | Logo detection | |
AU2014278408B2 (en) | Method for detecting a plurality of instances of an object | |
US8885923B2 (en) | Feature point selecting system, feature point selecting method and feature point selecting program | |
US11145080B2 (en) | Method and apparatus for three-dimensional object pose estimation, device and storage medium | |
JP5261501B2 (ja) | 不変の視覚場面及び物体の認識 | |
CN105934757B (zh) | 一种用于检测第一图像的关键点和第二图像的关键点之间的不正确关联关系的方法和装置 | |
EP2801054A1 (en) | Method and system for comparing images | |
Seib et al. | Object recognition using hough-transform clustering of surf features | |
CN108961164A (zh) | 基于几何不变量的图像配准拼接方法和装置及计算机设备 | |
CN109840529B (zh) | 一种基于局部敏感置信度评估的图像匹配方法 | |
JP2015007919A (ja) | 異なる視点の画像間で高精度な幾何検証を実現するプログラム、装置及び方法 | |
JP2004038980A (ja) | 画像を解析する方法、しきい値を生成する方法、該方法を実行するコンピュータプログラム、該プログラムを記憶するコンピュータ可読媒体および該方法を実行するように適応した装置 | |
CN112784691B (zh) | 一种目标检测模型训练方法、目标检测方法和装置 | |
Yang et al. | MAC: Maximal Cliques for 3D Registration | |
CN117853779A (zh) | 一种电力图像数据分类方法、系统、装置及存储介质 | |
Lee et al. | Efficient Recognition of Planar Object Using Intensity Based Matching Evaluation | |
CN116664883A (zh) | 一种基于卷积神经网络的货物图像识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |