CN105830095B - 用于选择增强现实标记的评级和建议 - Google Patents

用于选择增强现实标记的评级和建议 Download PDF

Info

Publication number
CN105830095B
CN105830095B CN201680000108.8A CN201680000108A CN105830095B CN 105830095 B CN105830095 B CN 105830095B CN 201680000108 A CN201680000108 A CN 201680000108A CN 105830095 B CN105830095 B CN 105830095B
Authority
CN
China
Prior art keywords
subgraph
score
image
formedness
well
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680000108.8A
Other languages
English (en)
Other versions
CN105830095A (zh
Inventor
罗家泳
周经伟
方来发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hong Kong Applied Science and Technology Research Institute ASTRI
Original Assignee
Hong Kong Applied Science and Technology Research Institute ASTRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hong Kong Applied Science and Technology Research Institute ASTRI filed Critical Hong Kong Applied Science and Technology Research Institute ASTRI
Publication of CN105830095A publication Critical patent/CN105830095A/zh
Application granted granted Critical
Publication of CN105830095B publication Critical patent/CN105830095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

对于具有标记数据库的增强现实(AR)内容创建系统,当用户请求该系统使用图像的第一子图像更新标记数据库时,该系统计算用于评级第一子图像的特征丰富度和其相对于标记数据库中的现有标记的独特性的合适性分数。当合适性分数小于阈值时,搜索图像的具有不小于阈值的合适性分数并完全包含第一子图像的第二子图像。随后,将第二子图像、其合适性分数及第一子图像的合适性分数基本上立即地呈送给用户,以提议用户在更新标记数据库时使用第二子图像而不是第一子图像作为新标记,以便增加新标记的特征丰富度或独特性。

Description

用于选择增强现实标记的评级和建议
技术领域
本发明涉及确定从图像选择的并且由增强现实(AR)内容创建系统的用户提议的子图像是否适于用作AR客户端应用中的标记,并且在用户提议的子图像不合适的情况下给用户建议更合适的子图像。
背景技术
AR是利用计算机生成的虚拟对象(例如文本、图像、声音等)增强的物理场景的实时视图。当前,大多数AR客户端应用使用实时视频图像。AR客户端应用数字地处理视频图像以给其添加一个或多个虚拟对象。在处理图像时,AR客户端应用将图像内容与存储在系统中的参考图像匹配。这个过程一般称为图像识别。如果图像的一部分被识别为特定的参考图像,则与这个参考图像关联的一个或多个虚拟对象被增强到图像上。参考图像也称为标记。AR客户端应用中的标记数据库专门用于存储标记。标记数据库中的标记由AR内容创建者或编辑者引入或提议。AR内容创建者通常选择图像的一部分(即,图像的子图像)并请求AR内容创建系统使用子图像作为标记。由于标记是为了用在图像识别中,因此,如果提议的子图像具有一些背景属性使得图像识别能够稳健且可靠地在被考虑的视频图像中检测到该提议的子图像并且毫无疑义地识别出该子图像,将会是有利的。如果AR内容创建者能够确定提议的子图像对于AR应用的合适性,将会是合意的。
尽管US2015/0161168、US2015/0161174、US8645370、US2007/0237426和US2011/0176724提供了不同的用于图像的分级方法,然而这些方法不涉及AR标记创建或标记合适性分级。US2015/0109337提供了一种用于评级图像对于AR的合适性或“可增强性”的方法。具体地,图像的可增强性基于图像的曝光量、图像捕获设备的运动、图像中的特征以及图像的模糊度。最终的评级输出被回馈给用户以指示图像在AR应用中的可增强性。虽然给出了可增强性建议,但是没有提供如何改进图像以便提高可增强性。因此,需要用户使用试错法来找出合适用于AR的图像。
本领域中存在对于评估用于AR标记创建的提议图像的合适性以及提供关于改进提议图像以提高合适性的技术的需要。有利地,优选的是:这种技术给用户提供实时反馈以使得对用于AR标记创建的合适标记的识别变得高效。
发明内容
本发明涉及一种AR内容创建系统,其包括用于存储标记的标记数据库以及至少作为用于在AR内容创建系统和用户之间通信的接口的用户设备。本发明的一个方面是为了提供一种用于在用户选择图像的第一子图像并在用户设备处请求AR内容创建系统使用第一子图像作为新标记时由AR内容创建系统使用新标记更新标记数据库的方法。
在所述方法中,计算第一子图像的合适性分数。任何测试图像的合适性分数用于对测试图像的特征丰富度和测试图像相对于已经存储在标记数据库中的现有标记的独特性评级,以使得合适性分数的值比第二测试图像高的第一测试图像比第二测试图像更适于作为新标记。
当第一子图像的合适性分数小于预定阈值时,在下述约束下执行搜索过程以搜索图像的第二子图像:(1)第二子图像具有不小于预定阈值的合适性分数的值以及(2)完全包含第一子图像。
在搜索过程中找到第二子图像之后,基本上立即地通过用户设备将第二子图像、其合适性分数及第一子图像的合适性分数呈送给用户。由此,通过提议用户在更新标记数据库时使用第二子图像而不是第一子图像作为新标记以便增加新标记的特征丰富度或独特性,实现了实时地为用户提供建议。
优选地,通过计算过程来计算任何测试图像的合适性分数,所述计算过程包括识别测试图像的特征点以及根据特征点生成测试图像的签名。所述计算过程还包括确定用于对测试图像的特征丰富度评级的特征丰富度分数以及确定用于对测试图像相对于已经存储在标记数据库中的现有标记的独特性评级的独特性分数。特征丰富度分数根据特征点的数量确定。独特性分数通过将测试图像的签名与现有标记的签名相比较而确定。通过SSUI=f(SFR,α)×f(SUNI,β)计算合适性分数,其中:SSUI为合适性分数;SFR是特征丰富度分数;SUNI是独特性分数;均为正的α和β分别为SFR和SUNI的权重因数;以及f(S,c)是S的单调递增函数。
搜索过程优选按照下述开始。基于封闭图像的第一部分的第一边界,通过向外扩张第一边界以给出第二边界以及形成候选子图像作为图像的由第二边界封闭的第二部分来生成待考虑成为第二子图像的候选子图像,其中所述第一部分被用作第一子图像。重复候选子图像的生成直到满足下列两个条件中的一个。第一,最后生成的候选子图像具有不小于预定阈值的合适性分数的值。所述最后生成的候选子图像成为第二子图像。第二,已经生成了预定数量的候选子图像但是候选子图像中没有一个具有不小于预定阈值的合适性分数的值。那么未找到第二子图像。
如由下文的实施方式所示意的,公开了本发明的其他方面。
附图说明
图1描绘了根据本发明示例性实施方式的更新标记数据库的流程图。
图2描绘了根据本发明的一种实施方式的用于示意任何测试图像的合适性分数的生成的流程图。
图3A描绘了用于生成第二边框矩形的第一边框矩形,所述第二边框矩形限定被考虑选择为第二子图像的候选子图像。
图3B通过例子示意了通过以第一边框矩形的中心作为锚水平地扩张第一边框矩形而形成第二边框矩形。
图3C通过例子示意了通过以第一边框矩形的中心作为锚垂直地扩张第一边框矩形而形成第二边框矩形。
图3D通过例子示意了通过以第一边框矩形的中心作为锚水平地并且垂直地扩张第一边框矩形而形成第二边框矩形。
图3E通过例子示意了通过以第一边框矩形的顶点作为锚扩张第一边框矩形而形成第二边框矩形。
图3F通过例子示意了通过以第一边框矩形的边作为锚扩张第一边框矩形而形成第二边框矩形。
图4描绘了根据本发明的一种实施方式的用于实施AR客户端应用和AR内容创建系统的移动计算设备。
图5描绘了根据本发明的一种实施方式的AR内容创建系统,所述AR内容创建系统包括用户设备、位于计算云中的标记数据库以及位于计算云中并且可以与用户设备和标记数据库通信的计算服务器。
具体实施方式
以下的定义在本文中用于说明书和随附的权利要求。“AR内容创建者”是从视频图像中选择标记的人员,其中标记被打算由AR客户端应用在图像识别中使用。当AR内容创建者与AR内容创建系统交互(例如将标记输入到系统中)时,AR内容创建者是AR内容创建系统的用户。“标记数据库”是用于存储标记的数据库。由于标记数据库主要用于图像识别,因此标记数据库的内容是能够在图像识别中帮助识别标记的任何数据。此外,当在视频图像中识别单个标记时,每个标记与一个或多个虚拟对象关联以借助该视频图像进行增强。因此,“用于存储标记的标记数据库”在此处表示包含下列项的数据库:(1)能够在图像识别中帮助识别标记的任何数据,例如标记的特征、签名、指纹、整个图像或其组合,以及(2)可选地,用于各个标记的一个或多个虚拟对象,或指向包含一个或多个虚拟对象的另一数据库的指针。选择哪些种类的数据以将其存储在用于标记的标记数据库中由本领域技术人员根据实际情况来确定。AR内容创建系统中的“用户设备”是至少作为AR内容创建系统及其用户之间的接口的设备。在最实用的情形中,用户设备通过包括用于执行计算和控制功能的一个或多个处理器、用于将可视信息显示给用户的显示器以及用于从用户接收输入的输入设备来实现。用户设备的例子包括启用了互联网的台式计算机和智能电话。“移动计算设备”是具有计算能力并且被配置成提供无线通信的便携式电子设备。例如,移动计算设备可以是智能电话或手持式平板电脑。除非另有说明,“云”在云计算或同义地在经由网络的分布式计算的意义上被解读和解释。“服务器”在计算的意义上被解释。服务器一般配备有用于执行程序指令的一个或多个处理器以及用于存储数据的一个或多个存储装置。服务器可以是单机计算服务器或云中的分布式服务器。图像的“子图像”是图像的被选择部分。子图像由图像上的(假想)边界来界定,其中边界封闭图像的被选择部分。
考虑中的AR内容创建系统至少包括用于存储标记的标记数据库以及至少作为用于AR内容创建系统及用户之间通信的接口的用户设备。
本发明的一个方面在于提供一种用于在用户选择图像的第一子图像并向AR内容创建系统做出使用第一子图像作为新标记的请求时由AR内容创建系统利用新标记更新标记数据库的方法。用户在用户设备处做出所述请求。第一子图像可以呈任何形状,例如矩形、多边形、圆形或椭圆形。
示例地,借助图1来示意所述方法,图1描绘了根据本发明的示例性实施方式的更新标记数据库的流程图。
在所述方法中,当用户做出前述请求时,计算第一子图像的合适性分数(步骤110)。任何测试图像的合适性分数用于评级:(1)测试图像的特征丰富度以及(2)测试图像相对于已经存储在标记数据库中的现有标记的独特性。测试图像中特征的充裕使得测试图像的图像识别较不容易出错,降低了在AR客户端应用中的最终图像识别过程中出现遗漏的可能性以及错误检测的可能性。如果测试图像与所有的现有标记相比足够特殊(即,充分不同),则AR客户端应用在测试图像的图像识别中不太会混淆。在本公开文本中,合适性分数被限定为与用于AR客户端应用的测试图像的合适性正相关。可见,合适性分数值比第二测试图像的合适性分数值高的第一测试图像比第二测试图像更适于作为新标记。显然,对本领域技术人员来说,等价地,合适性分数也可以限定为与合适性负相关。尽管本公开文本使用限定合适性分数的第一种情形来示意本发明,然而本发明涵盖这两种情形。
在应用本发明之前,为AR内容创建系统确定阈值以使得合适性分数低于阈值的测试图像被视为具有低质量并且不适于用作AR客户端应用中的标记。类似地,如果测试图像的合适性分数大于或等于该预定的阈值,则该测试图像被视为适于成为AR客户端应用中的标记。阈值由本领域技术人员根据实际情况确定。
在步骤114中,将第一子图像的合适性分数与阈值比较。如果该合适性分数大于或等于阈值,则用第一子图像作为新标记来更新标记数据库(步骤116)。否则,初始化搜索过程180。
搜索过程180用于搜索具有不小于阈值的合适性分数的第二子图像。如上所述,不合适性是由于特征丰富度和独特性中导致图像识别中的困难的问题。可见,给第一子图像结合足够特殊的附加特征是这些问题的一个解决方案。如果将图像的与第一子图像相邻的一部分添加到第一子图像,则有可能增加图像的最终子图像中的特征的数量,导致最终的合适性分数比第一子图像的合适性分数大。因此,搜索过程180在第二子图像完全包含第一子图像的约束下进行。
搜索过程180的一个示例性实现是执行步骤120、124、126和130。在步骤120中,生成待考虑作为第二子图像的候选子图像。候选子图像的生成基于封闭图像的第一部分的第一边界,其中第一部分被用作第一子图像。候选子图像通过向外扩张第一边界以给出第二边界并且通过形成候选子图像作为由第二边界封闭的图像的第二部分而生成。在生成候选子图像之后,计算该候选子图像的合适性分数。重复步骤120直到最后生成的候选子图像具有不小于阈值的合适性分数的值,或者直到已经生成了预定数量的候选子图像但是生成的候选子图像中没有一个具有不小于阈值的合适性分数的值。步骤120的重复的终止由步骤124和126控制。在步骤124中,将步骤120中生成的候选子图像的合适性分数与阈值相比较。如果该合适性分数不小于阈值,则最后生成的候选子图像成为第二子图像(在步骤130中)。否则,在步骤126中用前述的预定数量检查已经生成的候选子图像的数量。在已经生成的候选子图像的数量仍然小于该预定数量的情况下,步骤120被重复。
如果在步骤120中发现达到候选子图像的预定数量,则确定未找到第二子图像。采取由本领域技术人员根据实际情况确定的一个或多个其他合适动作(步骤128)。用户可以使用先前被测试图像中具有最高分数的一个,尽管其低于阈值,或使用一些其他标准来选择适当的图像。通过经由用户设备向用户呈送在已经生成的候选子图像中具有最高合适性分数的一个候选子图像,AR内容创建系统可以辅助用户。
当在步骤130中找到第二子图像之后,经由用户设备将第二子图像、其合适性分数和第一子图像的合适性分数呈送给用户(步骤140)。通过提议用户使用第二子图像而不是第一子图像作为在更新标记数据库时的新标记以增加新标记的特征丰富度或独特性,给用户提供建议。有利地,在搜索过程180中找到第二子图像之后,基本上立即地进行第二子图像、其合适性分数及第一子图像的合适性分数的呈送。这样,实现了为用户实时提供建议。
当在步骤140中将建议提供给用户之后,进行由本领域技术人员根据实际情况确定的其他后续动作(步骤150)。例如,AR内容创建系统请求用户同意使用第二子图像作为在更新标记数据库时的新标记。
图2是用于示意根据本发明的一种实施方式的任何测试图像的合适性分数的生成的流程图。
在步骤210中,识别测试图像的特征点。每一个特征点均是这样的一个点:其中该点和其邻域构成相对于图像中的其他点/像素的特殊性。通常,特征点是出现在测试图像中的角。因此,通过特征点的检测来辅助图像识别。US2015/0213325提供了用于识别特征点的技术的例子。
在步骤220中,根据在步骤210中识别的特征点生成测试图像的签名。在US2015/0227796中提供了生成签名的例子,其中基于图像的凸点(对应于特征点)而生成指纹(对应于签名)。
在步骤230中,确定用于评级测试图像的特征丰富度的特征丰富度分数。根据在步骤210中识别的特征点的数量来确定特征丰富度分数。特征丰富度分数是特征点的数量的单调递增函数。较多数量的特征点产生较高的特征丰富度分数。
在步骤240中,确定用于对测试图像相对于已经存储在标记数据库中的现有标记的独特性评级的独特性分数。通过将测试图像的签名与现有标记的签名相比较来确定独特性分数。如果测试图像的签名接近或类似于现有标记的签名中的任何一个,则独特性分数为低。低独特性分数指示在图像识别中AR内容创建系统容易混淆测试图像和已经存储在标记数据库中的标记中的至少一个,导致在执行AR时的图像识别错误。
最后,在步骤250中,通过SSUI=f(SFR,α)×f(SUNI,β)计算测试图像的合适性分数,其中:SSUI为合适性分数;SFR是特征丰富度分数;SUNI是独特性分数;α和β是非零正数,分别用作对于SFR和SUNI的权重因数;以及f(S,c)是分数S的单调递增函数。例如,函数f可以是f(S,c)=S+c或f(S,c)=Sc。可见,特征丰富度分数和独特性分数中的任一个为低导致合适性分数的低值,表明不适合成为新标记。对α和β的选择通常基于在评估测试图像作为新标记的合适性时特征丰富度和独特性的相对重要性。在特征丰富度和独特性被视为同等重要的特殊情形中,α=β。
在一种实施方式中,步骤120中的候选子图像的生成实现如下。无论第一子图像的第一边界的形状如何,存在在图像上界定第一边界的边框形状。例如,如果边框形状为矩形,则将该边框矩形扩张成包含之前的边框矩形的较大边框矩形使得第一边界成比例地扩张。这种成比例扩张之后的第一边界给出了限定生成的候选子图像的第二边界。在此后的说明中,为清楚起见,将前述的边框矩形命名为第一边框矩形,而将扩张后的最终边框矩形称为第二边框矩形。图3A描绘了用于生成第二边框矩形315的第一边框矩形310。第一边框矩形310具有四个顶点371-374,四条边376-379以及中心370。候选子图像由从第一边框矩形310扩张的第二边框矩形315限定。经由下述几何操作中的一种来向外扩张第一边框矩形310以产生第二边框矩形315。在下面描述的几何操作中,锚是点或线,其在将第一边框矩形310几何扩张到第二边框矩形315的过程中保持固定。
·如在图3B中示出的,以中心370作为几何操作的锚331,将第一边框矩形310水平地扩张,形成第二边框矩形321。
·如在图3C中示出的,以中心370作为几何操作的锚332,将第一边框矩形310垂直地扩张,形成第二边框矩形322。
·如在图3D中示出的,以中心370作为几何操作的锚333,将第一边框矩形310水平地且垂直地扩张,形成第二边框矩形323。
·如在图3E中示出的,以顶点374作为几何操作的锚334,将第一边框矩形310扩张,形成第二边框矩形324。其他三个顶点371-373中的任一个也可以是锚334。
·如在图3F中示出的,以边378作为几何操作的锚335,将第一边框矩形310扩张,形成第二边框矩形325。其他三条边376、377和379中的任一条也可以是锚335。
注意,上述的矩形边框形状用作一个例子,其仅用于示意的目的。可以使用其他形状来代替矩形边框形状。例如,可以使用圆形的边框形状。圆形的边框形状(即,圆)可以通过使用例如圆心或圆周上的点作为锚而被扩张。
在一个实用场景中,使用上文公开的方法的一种实施方式的AR内容创建系统实施在单机移动计算设备中。所述移动计算设备也作为用于与用户通信的用户接口。所述移动计算设备还用于AR客户端应用。图4描绘了用于实施AR内容创建系统的移动计算设备的例子。移动计算设备410包括用于显示从AR客户端应用发送的信息的显示器470、用于从用户接收输入的输入装置480(可以经由触摸传感器、键盘或诸如语音的一些其他手段接收输入)、用于安装标记数据库455的一个或多个存储装置450以及用于执行步骤110、114、116和搜索过程180并且用于在步骤140中指示显示器470显示建议的一个或多个处理器460。
在另一个实用场景中,采用上文公开的方法的实施方式的AR内容创建系统通过包括用户设备、标记数据库以及可以与用户设备和标记数据库通信的计算服务器而实施,其中标记数据库和计算服务器远离用户设备。用户设备可以是通过有线连接与计算服务器连接的台式计算机,或者可以是与计算服务器无线通信的移动计算设备。
图5描绘了配置成执行根据上文公开的方法的实施方式的过程的AR内容创建系统的又一种实用实施。AR内容创建系统500包括用户设备510、标记数据库540和可以与用户设备510和标记数据库540通信的计算服务器530。
用户设备510经由通信链路515连接到计算服务器530。在一种选择中,用户设备510是台式计算机。在另一种选择中,用户设备510是移动计算设备,从而通信链路515是无线链路。在两种选择中,使通信链路515过载都是不理想的。如将会很快证实的,图5中描述的AR内容创建系统被配置为避免这种过载问题。
计算服务器530和标记数据库540位于计算云520中。图像的本地副本存储在计算服务器530中。当用户选择图像的第一子图像并且通过用户设备510请求AR内容创建系统500使用第一子图像作为新标记时,第一子图像在图像上的坐标从用户设备510经由通信链路515被发送到计算服务器530,而没有必要将第一子图像发送到计算服务器530。计算服务器530随后基于接收的坐标和图像的本地副本而创建第一子图像的本地副本。可见,避免了由于将第一子图像传输到计算服务器530引起的通信链路515上的通信负载。当需要频繁地向AR内容创建系统500输入大量第一子图像以评估这些第一子图像的合适性时,这是特别有利的。由计算服务器530进行对任何测试图像的合适性分数的计算和用于搜索第二子图像的搜索过程180的执行。在计算服务器530处确定第二子图像之后,将第二子图像的坐标传输到用户设备510。随后,用户设备510能够重建第二子图像的本地副本,从而避免了由于将第二子图像传输到用户设备510而引起的通信链路515上的另一通信负载。
在不背离本发明的精神和基本特征的情况下,可以以其他特定形式实施本发明。因此,本实施方式应当在各个方面被视为是示意性的而非限制性的。本发明的范围由随附的权利要求而不是由前面的说明书限定,因此落入权利要求的意义和等价范围内的所有改变都应当被涵盖在本发明中。

Claims (10)

1.一种用于在增强现实(AR)内容创建系统中用新标记更新标记数据库的方法,当用户选择图像的第一子图像并且在用户设备处请求AR内容创建系统使用第一子图像作为新标记时进行所述更新,所述AR内容创建系统包括用于存储标记的标记数据库和至少作为用于AR内容创建系统和用户之间通信的接口的用户设备,所述方法包括:
计算第一子图像的合适性分数,其中任何测试图像的合适性分数用于对测试图像的特征丰富度和测试图像相对于已经存储在标记数据库中的现有标记的独特性评级,以使得合适性分数的值比第二测试图像高的第一测试图像比第二测试图像更适于作为新标记;
当第一子图像的合适性分数小于预定阈值时,在下述约束下执行搜索过程以搜索图像的第二子图像:第二子图像具有不小于预定阈值的合适性分数的值以及完全包含第一子图像;以及
在搜索过程中找到第二子图像之后立即通过用户设备将第二子图像、其合适性分数及第一子图像的合适性分数呈送给用户,以用于通过提议用户使用第二子图像而不是第一子图像作为更新标记数据库时的新标记以便增加新标记的特征丰富度或独特性,而实时地为用户提供建议。
2.根据权利要求1所述的方法,其中,通过计算过程来计算任何测试图像的合适性分数,所述计算过程包括:
识别测试图像的特征点;
根据特征点生成测试图像的签名;
确定用于对测试图像的特征丰富度评级的特征丰富度分数SFR,其中根据特征点的数量确定特征丰富度分数;
确定用于对测试图像相对于已经存储在标记数据库中的现有标记的独特性评级的独特性分数SUNI,其中通过将测试图像的签名与现有标记的签名相比较而确定独特性分数;以及
通过SSUI=f(SFR,α)×f(SUNI,β)计算合适性分数SSUI,其中:均为正数的α和β分别是SFR和SUNI的权重因数,并且f(S,c)是S的单调递增函数。
3.根据权利要求1所述的方法,其中,所述搜索过程包括:
基于封闭图像的第一部分的第一边界,通过向外扩张第一边界以给出第二边界以及形成候选子图像作为图像的由第二边界封闭的第二部分来生成待考虑成为第二子图像的候选子图像,其中所述第一部分被用作第一子图像,其中第一边界为任意形状;以及
重复候选子图像的生成直到:
(a)最后生成的候选子图像具有不小于预定阈值的合适性分数的值,借此所述最后生成的候选子图像成为第二子图像;或
(b)已经生成了预定数量的候选子图像,但是候选子图像中没有一个具有不小于预定阈值的合适性分数的值,从而未找到第二子图像。
4.根据权利要求3所述的方法,其中:
第一边界具有第一边框矩形,第一边框矩形界定了图像上的第一边界,第一边框矩形具有四个顶点、四条边以及中心;
将第一边框矩形扩张成包含第一边框矩形的第二边框矩形使得第一边界成比例地扩张,成比例扩张之后的第一边界给出第二边界;
通过以下几何操作中的一种来向外扩张第一边界以给出第二边界:
(a)以中心作为几何操作的锚,水平地或垂直地扩张或者水平且垂直地扩张第一边框矩形;
(b)以四个顶点中的一个作为几何操作的锚,扩张第一边框矩形;以及
(c)以四条边中的一条作为几何操作的锚,扩张第一边框矩形。
5.根据权利要求1所述的方法,还包括:
当确定未找到第二子图像时,通过用户设备向用户呈送在已经生成的候选子图像中具有最高合适性分数的一个候选子图像。
6.根据权利要求1所述的方法,还包括:
当第一子图像的合适性分数被确定为不小于预定阈值时,用第一子图像作为新标记更新标记数据库。
7.一种增强现实(AR)内容创建系统,包括:
用于存储标记的标记数据库;以及
用户设备,该用户设备至少作为用于AR内容创建系统和用户之间通信的接口;
其中AR内容创建系统配置成在用户选择图像的第一子图像并且在用户设备处请求AR内容创建系统使用第一子图像作为新标记时,执行用新标记更新标记数据库的过程,并且其中,根据权利要求1-6中的任一项所述的方法来布置标记数据库更新过程。
8.根据权利要求7所述的AR内容创建系统,其中:
用户设备是移动计算设备;
标记数据库安装在移动计算设备中;以及
任何测试图像的合适性分数的计算和用以搜索第二子图像的搜索过程的执行在移动计算设备处本地进行。
9.一种增强现实(AR)内容创建系统,包括:
用户设备,该用户设备至少作为用于AR内容创建系统和用户之间通信的接口;
用于存储标记的标记数据库,该标记数据库位于计算云中;以及
能够与用户设备和标记数据库通信的计算服务器,该计算服务器位于计算云中;
其中:
AR内容创建系统配置成用于在用户选择图像的第一子图像并且在用户设备处请求AR内容创建系统使用第一子图像作为新标记时,执行用新标记更新标记数据库的过程;
根据权利要求1-6中的任一项所述的方法来布置标记数据库更新过程;
图像的本地副本存储在计算服务器中;
用户设备配置成使得:当用户选择图像的第一子图像并且请求AR内容创建系统使用第一子图像作为新标记时,第一子图像在图像上的坐标被发送到计算服务器,而不会将第一子图像发送到计算服务器,从而允许计算服务器基于图像的本地副本获知第一子图像,同时避免了由于将第一子图像传输到计算服务器引起的通信负载;
任何测试图像的合适性分数的计算和用以搜索第二子图像的搜索过程的执行由计算服务器进行;以及
计算服务器还配置成将第二子图像的坐标传输到用户设备,而不将第二子图像发送到用户设备,从而允许用户设备获取第二子图像,同时避免了由于将第二子图像传输到用户设备引起的通信负载。
10.根据权利要求9所述的AR内容创建系统,其中,用户设备是配置成与计算服务器无线通信的移动计算设备。
CN201680000108.8A 2016-03-21 2016-03-21 用于选择增强现实标记的评级和建议 Active CN105830095B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/076826 WO2017161476A1 (en) 2016-03-21 2016-03-21 Rating and advising for selection of augmented reality markers

Publications (2)

Publication Number Publication Date
CN105830095A CN105830095A (zh) 2016-08-03
CN105830095B true CN105830095B (zh) 2019-03-01

Family

ID=56532315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680000108.8A Active CN105830095B (zh) 2016-03-21 2016-03-21 用于选择增强现实标记的评级和建议

Country Status (2)

Country Link
CN (1) CN105830095B (zh)
WO (1) WO2017161476A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102428921B1 (ko) * 2017-09-22 2022-08-04 삼성전자주식회사 Ar 서비스를 제공하는 방법 및 디바이스

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310099A (zh) * 2013-05-30 2013-09-18 佛山电视台南海分台 一种利用图像捕获和识别技术实现增强现实的方法和系统
CN105282393A (zh) * 2014-06-16 2016-01-27 柯尼卡美能达株式会社 在文档中插入标记的图像处理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013044983A1 (en) * 2011-09-30 2013-04-04 Layar B.V. Feedback to user for indicating augmentability of an image
WO2014144035A1 (en) * 2013-03-15 2014-09-18 Brian Adams Ballard Method and system for representing and interacting with augmented reality content
EP3063731B1 (en) * 2013-10-28 2020-03-04 Google LLC Image cache for replacing portions of images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310099A (zh) * 2013-05-30 2013-09-18 佛山电视台南海分台 一种利用图像捕获和识别技术实现增强现实的方法和系统
CN105282393A (zh) * 2014-06-16 2016-01-27 柯尼卡美能达株式会社 在文档中插入标记的图像处理装置

Also Published As

Publication number Publication date
CN105830095A (zh) 2016-08-03
WO2017161476A1 (en) 2017-09-28

Similar Documents

Publication Publication Date Title
KR102261061B1 (ko) 컨볼루션 신경망을 이용하여 poi 변화를 검출하기 위한 시스템 및 방법
EP3745339A1 (en) Method for implanting advertisements in video, and computer device
CN108304835A (zh) 文字检测方法和装置
KR101357260B1 (ko) 증강 현실 사용자 인터페이스 제공 장치 및 방법
CN106197445B (zh) 一种路线规划的方法及装置
US20150356763A1 (en) Method and apparatus for grouping and de-overlapping items in a user interface
US11842514B1 (en) Determining a pose of an object from rgb-d images
US10970874B2 (en) Method and apparatus for performing image feature matching using labeled keyframes in SLAM-based camera tracking
CN110163076A (zh) 一种图像数据处理方法和相关装置
CN107438853A (zh) 在上载之前区域描述文件的隐私过滤
EP2711890B1 (en) Information providing device, information providing method, information providing processing program, recording medium recording information providing processing program, and information providing system
CN110914870B (zh) 图像网络的注释生成
CN105589869B (zh) 一种地理信息系统注记的生成方法及装置
US11887224B2 (en) Method, apparatus, and computer program for completing painting of image, and method, apparatus, and computer program for training artificial neural network
CN110263209A (zh) 用于生成信息的方法和装置
CN110298281A (zh) 视频结构化方法、装置、电子设备及存储介质
CN110222641A (zh) 用于识别图像的方法和装置
CN110196917A (zh) 个性化logo版式定制方法、系统和存储介质
US10496694B2 (en) Rating and advising for selection of augmented reality markers
CN112215964A (zh) 基于ar的场景导览方法和设备
CN111382223B (zh) 电子地图的展示方法、终端和电子设备
JP2012185591A (ja) 画像処理装置、情報提供システム及びプログラム
CN105830095B (zh) 用于选择增强现实标记的评级和建议
CN114079801A (zh) 按需将元数据叠加到视频流上以进行智能视频分析
CN117422851A (zh) 虚拟换衣方法及其装置、电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant