CN107251049B - 基于语义指示检测移动装置的位置 - Google Patents

基于语义指示检测移动装置的位置 Download PDF

Info

Publication number
CN107251049B
CN107251049B CN201680010519.5A CN201680010519A CN107251049B CN 107251049 B CN107251049 B CN 107251049B CN 201680010519 A CN201680010519 A CN 201680010519A CN 107251049 B CN107251049 B CN 107251049B
Authority
CN
China
Prior art keywords
location
semantic features
features
mobile device
candidate locations
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680010519.5A
Other languages
English (en)
Other versions
CN107251049A (zh
Inventor
D.雷纳德
B.布伦奇利
D.科廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=55588627&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN107251049(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Google LLC filed Critical Google LLC
Publication of CN107251049A publication Critical patent/CN107251049A/zh
Application granted granted Critical
Publication of CN107251049B publication Critical patent/CN107251049B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Processing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)

Abstract

提供了使用语义指示来检测移动装置的位置的系统、和计算机实现的方法。所述方法包含使用一个或多个处理器接收由移动装置在一区域捕获的多个图像(210)。所述区域与一组候选位置(230‑270)相关联。使用所述一个或多个处理器,检测与所述多个图像(210)相关联的一个或多个特征指示。这些特征指示包含与所述区域相关的语义特征。将所述语义特征与该组候选位置的多个存储的位置特征(232‑272)进行比较。根据所述比较,从该组候选位置选择一位置,以识别所述移动装置的估计位置。

Description

基于语义指示检测移动装置的位置
相关申请的交叉引用
本申请是于2015年3月20日提交的美国专利申请No.14/664,099的继续申请,其公开内容通过引用并入本文。
背景技术
现代移动装置配备了基于位置的特征。这些装置使用来自全球定位服务(GPS)卫星的信号来识别位置、确定运动的方向、以及其他功能。通常,在GPS卫星信号较弱的位置(例如室内),GPS可能无法正常工作。为了提供室内导航,一些装置可以使用其他信息,例如无线网络信号(WiFi)、蓝牙信号、蜂窝、罗盘数据和加速度计数据,以及现有的楼层平面图和预先生成的数据库或测量指标。然而,在某些情况下,可能难以确定移动装置的位置,例如在高密度商户区域,在这些地方存在装置可位于其内部的大量的内部位置。
发明内容
本发明的各方面可以是有利的,其用于提供一种基于捕获的语义指示检测移动装置位置的计算机实现的方法。在一个示例中,所述方法包含,使用一个或多个处理器接收由移动装置在一区域捕获的多个图像,所述区域与一组候选位置相关联。所述一个或多个处理器还用于检测与所述多个图像相关联的一个或多个特征指示,所述特征指示包含与所述区域相关的语义特征,以及将所述语义特征与该组候选位置的多个存储的位置特征进行比较。根据所述比较,使用所述一个或多个处理器从该组候选位置选择一位置,以识别所述移动装置的估计位置。在一个示例中,与所述移动装置相关联的位置信息同与该组候选位置的多个存储的位置特征相关联的位置信息重叠。在一些示例中,所述比较还包含确定所述语义特征是否对应于所述组中的给定位置的存储的位置特征。这样的语义特征可以包含:食物图像的视觉特征(且所选择的位置与对应于所述食物图像的菜单相关联)、在所选择的位置的一个或多个对象的音频数据、与所选择的位置相关联的标识、一天中的时间(且所选择的位置与在一天中的该时间开放的商户相关联)、位于所选择的位置内的对象的纹理、与所述多个图像相关联的传感器数据(且所述传感器数据由所述移动装置捕获),等等。
本公开还提供一种存储指令的非暂时性计算机可读介质,所述指令在由一个或多个处理器执行时导致所述一个或多个处理器执行一种方法。该方法包含,接收由移动装置在一区域捕获的多个图像,所述区域与一组候选位置相关联,检测与所述多个图像相关联的一个或多个特征指示,所述特征指示包含与所述区域相关的语义特征,将所述语义特征与该组候选位置的多个存储的位置特征进行比较,以及根据所述比较,从该组候选位置选择一位置,以识别所述移动装置的估计位置。
本公开还涉及一种系统,其包括,存储一组候选位置的多个位置特征的存储器,以及与所述存储器通信的一个或多个处理器。所述一个或多个处理器配置为,接收由移动装置在一区域捕获的多个图像,所述区域与该组候选位置相关联,检测与所述多个图像相关联的一个或多个特征指示,所述特征指示包含与所述区域相关的语义特征,将所述语义特征与存储在存储器中的多个位置特征进行比较,以及根据所述比较从该组候选位置选择一位置,以识别所述移动装置的估计位置。
附图说明
图1是根据本公开的一些方面的图像捕获过程。
图2A是根据本公开的一些方面的包含多个候选位置的区域的图示。
图2B示出了根据本公开的一些方面的图像处理系统。
图3是根据本公开的一些方面的系统的示例。
图4是根据本公开的一些方面的系统的另一示例。
图5是根据本公开的一些方面的语义指示的示例。
图6是根据本公开的一些方面的语义指示的另一示例。
图7是根据本公开的一些方面的语义指示的又一示例。
图8是绘示了根据本公开的一些方面的方法的示例的流程图。
具体实施方式
本公开总体上涉及基于由装置捕获的某些语义指示来检测移动计算装置的位置的技术。本文所述的技术可以用于收集与某些区域相关联的语义指示以及其他类型的特质,并且推断区域内的特定位置,所述特定位置指示语义指示在哪里被收集。在一些实施例中,可以提供系统来分析图像像素、音频数据、以及来自静止和/或视频图像的其他捕获的信息,以便检测可以用于确定移动装置的位置的语义特征。
为了确定用户装置的位置,系统可以检测或以其他方式提取与由用户装置捕获的多个图像相关联的一个或多个特征指示。这些特征指示可以包含与特定区域处的某些位置相关的语义特征,例如购物中心内的商店的位置。将语义特征与已知在特定区域的范围内的一组候选位置的多个存储的位置特征进行比较。根据该比较,从特定区域的范围内的该组候选位置选择位置,以识别移动装置的估计位置。
在一个说明性示例中,用户装置可以通过使用在餐馆拍摄的食物图像来“登入”到社交网站。在该示例中,系统可以检测照片中食物的类型,以便确定用户装置是在该区域中的提供这种类型的食物的特定类型的餐馆中。响应于接收食物图像以及其他种类的特征指示,系统可以将这些特征指示同与存储在数据库中的不同的食物图像相关联的指示进行比较。例如,可以从各种餐馆的不同的食物菜单获取存储的食物图像。当检测到的指示与存储的指示之间的多个匹配特征满足预定阈值水平时,可以确定与特定位置的匹配。
转到第二示例,用户装置可以捕获位置内的视频。基于与视频中的各种对象的声音类型相关的检测到的特征指示,例如咖啡机的声音或嘈杂的音乐,系统可以估计该装置在特定的咖啡馆中。在一些实施例中,可以捕获时间戳,以指示拍摄视频的时间。基于该附加的语义信息,系统可以进一步确定该装置处于当时开放的特定咖啡馆中。
在其他示例中,系统可以检测其他种类的特征指示,以确定用户装置的位置,例如检测图像中的对象的纹理(texture),或者检测特定商户、学校/大学、或与特定位置相关联的其他类型的组织的标识。例如,纹理可以包含明亮的颜色或独特的颜色图案。此外,许多其他类型的特征指示可以与图像一起捕获(例如,通过与移动装置相关联的传感器),并用于进一步缩窄用户装置的位置。这样的其他特征指示的示例包含运动检测指示(例如,指示跳舞)、气压指示、湿度指示、辐射指示、等等。
对于本文所述的主题收集关于用户的信息或可以利用用户相关信息的情况,可以向用户提供控制程序或特征是否收集用户信息的机会(例如,关于用户的社交网络、社会行为或活动、专业、偏好或用户的当前位置的信息),或者控制是否和/或如何接收用户可能感兴趣的信息。此外,某些数据可以在存储或使用之前以一种或多种方式处理,以便消除个人身份信息。例如,可以对用户的身份进行处理,使得不能确定用户的个人身份信息,或者在获得位置信息(诸如城市、邮政编码或州级)的情况下,用户的当前和历史位置可以被一般化(generalized),使得不能确定用户的特定位置。可以向用户提供机会,以决定是否使用这样的信息(诸如图片和位置历史)并将其存储在用户装置和与该装置通信的服务器上并且控制如何使用所述信息(诸如图片和位置历史)并将其存储在用户装置和与该装置通信的服务器上。
当参考实施例的以下描述和附图来考虑时,将理解本公开的方面、特征和优点。不同附图中相同的附图标记可以标识相同或相似的元件。另外,以下描述不是限制性的;本技术的范围由所附权利要求和等同物限定。尽管根据示例性实施例的某些过程在图中示出为以线性方式发生,但是这不是要求,除非在本文中明确说明。不同的过程可以以不同的顺序或同时执行。除非另有说明,还可以添加或省略步骤。
图1是图像捕获过程100。例如,用户103可以激活与移动计算装置101(例如移动电话)相关联的相机,以在不同的位置拍摄图像。在这方面,移动计算装置101可以包含相机(未示出),以在某些位置拍摄图像105。典型的捕获的图像,例如图像105,可以包括当拍摄图像时存在于该位置处的对象的特征。例如,如图1所示,图像105包含与可能在特定的餐馆109拍摄的食物图像107相关联的特征。某些类型的元数据可以与食物图像107一起由移动计算装置101捕获。例如,该元数据可以包含来自传感器的数据,传感器例如是加速度计、陀螺仪、运动和音频传感器、或移动计算装置101的其他类型的传感器,并将其与捕获的图像存储在装置101的存储器中。
一旦相机已经捕获了图像信息(例如,图像和其他元数据),则该信息可以本地存储在移动计算装置101中,和/或被传输到服务器。在一些方面,用户103可以利用与移动计算装置101相关联的应用,来将图像上传到社交媒体网站或图像托管服务。在一些实施例中,用户可能必须安装应用程序和/或选择服务,以便获得本文所述的技术的益处。
应用可以下载到移动计算装置101上。例如,用户103可以选择从与在线服务器其相关联的服务器下载应用。移动计算装置101可以通过网络来传输对应用的请求,并且作为响应,从服务器接收应用。应用可以本地安装在移动计算装置101中。替代地,应用可以存储在服务器中,并且可以通过移动计算装置101访问,例如,经由移动网络浏览器。通过使用应用,用户103可以将图像信息保持为私密的、或者公开发布、或以其他方式在线共享图像。在一些实施例中,与图像信息相关联的语义指示可以用于估计相对靠近拍摄图像的位置的移动装置101的某一位置。
图2A是包含多个候选位置230-270的区域200的图示。在一些示例中,移动计算装置101可以包含地理定位特征(未示出),其可以指示在捕获图像210的特定时间出用户处于某一区域中。例如,用户可能在拍摄图像210之前的某个时间将他们的车停靠在区域200中。一旦识别初始位置,移动计算装置101可以存储该区域信息。例如,区域信息可以按照设定的时间间隔(例如,每30秒)或按用户需要存储。区域位置信息可以包含一个或多个数据字段,其包含例如全球坐标(例如,纬度/经度)的定位信息、以及指示装置101的用户处于该坐标处的时间的时间戳。
为了估计移动计算装置101在区域200中的实际位置,可以选择可能的候选位置230-270的若干块。例如,系统可以识别位于区域200中的多个候选位置。在该示例中,系统可以使用附加的信息,来提炼可行的候选位置的选择。例如,用户可以在预定范围(例如位置范围220)内选择候选位置的子集。在该示例中,当与这些候选位置相关联的发布图像210在位置范围220内时,系统可以将候选位置230-250选择为移动装置101的可能位置。这可以通过将用移动计算装置101存储的位置数据与候选位置230-270的坐标进行比较,看是否有任何重叠来确定。在这方面,预定范围可以以移动计算装置101可达的测量单位(例如英尺、米、英寸、英里等)来表达。
候选位置230-270的每个块可以同存储的位置特征232-272的、与在相应候选位置230-270处的对象相关的特定组相关联。在一些示例中,系统可以将来自发布的图像210的语义特征与存储的位置特征232-272进行比较,以便找到最接近的匹配候选位置。例如,当发布的图像210与存储的位置特征232-272之间的多个匹配语义特征满足预定的阈值水平时,可以确定与特定候选位置的匹配。下面将参考图2B讨论该系统的其他方面。
图2B示出了图像处理系统280,其用于接收多个图像210的,分析语义特征信息的意象并检测绘示在图像308中的特定位置。如图所示,系统300可以具有多个模块,以识别与图像210相关联的位置特征,并将这些特征与若干候选位置的存储的语义特征进行比较。例如,模块可以包含特征指示检测器282,以识别与输入图像相关联的位置特征,以及过滤器284,以将与一组候选位置相关联的特征与位置特征进行比较。在一些示例中,可以采用其他模块(未示出)。
模块可以采用不同的技术来分析图像。例如,位置特征检测器282可以包含用于分析绘示在图像中的对象的像素的软件。模块被示出为连接到一个或多个数据库218。该数据库可以存储位置相关联的语义特征,所述位置可以对应于捕获图像308的位置。这些模块可以以串行或并行的方式操作。系统300的另一模块286可以使用其他模块282和284的结果,例如,以检测与图像210相关联的位置。
图3是系统300的示例,其包含计算装置,以执行本公开的方面。如图所示,系统300绘示了各种计算装置,其可以单独地使用或在网络配置中使用。例如,该图示出了计算机网络395,其具有多个计算机310和320,以及其他类型的移动装置,比如来自图1的移动计算装置101、PDA 330、膝上型/上网本340和平板计算装置350。这些各种装置可以经由本地总线或直接连接318互连、和/或可以经由诸如LAN、WAN、因特网等通信网络39联接,且其可以是有线或无线的。
每个计算装置可以包含例如用户输入装置,比如键盘312和鼠标314和/或其他类型的输入装置,比如笔输入、操作杆、按钮、触摸屏等,以及显示器316,其可以包含例如CRT、LCD、等离子屏监视器、投影仪、等等。每个计算机310和320可以是个人计算机、应用服务器、等等。仅作为示例,计算机310可以是个人计算机,而计算机320可以是服务器。数据库(例如数据库288)可以由一个或多个服务器或者系统300的其他装置访问。
图4是系统400的另一示例,其可以如本文所述地用于基于捕获的语义指示来检测移动装置的位置。如图所示,系统400包含多个客户端装置,例如客户端装置101和410,其能够通过网络395与服务器420通信。服务器420可以包含一个或多个处理器422、存储器424、以及通常存在于通用计算机中的其他部件。
服务器420的存储器424可以存储可由处理器422访问的信息,其包含可由处理器422执行的指令426、以及数据428。存储器424可以是可操作以存储可由处理器422访问的信息的类型的存储器,其包含非暂时性计算机可读介质,或存储可借助于电子装置读取的数据的其他介质,例如硬盘驱动器、存储卡、只读存储器(“ROM”)、随机存取存储器(“RAM”)、数字通常盘(“DVD”)或其他光盘,以及其他可写和只读存储器。本文公开的主题可以包括前述的不同组合,由此指令426和数据428的不同部分被存储在不同类型的介质上。
尽管图4将处理器422和存储器424功能性地示出为在相同的块内,但处理器422和存储器424实际上可以包含多个处理器和存储器,其可以或可以不存储在相同的物理外壳内。例如,指令426和数据428中的一些可以存储在可移除的CD-ROM中,而其他的存储在只读计算机芯片中。指令和数据中的一些或全部可以存储在物理上远离处理器422但仍然可由其访问的位置。类似地,处理器422实际上可以包括处理器的集合,其可以或可以不并行地操作。
数据918可以根据指令426被处理器422获取、存储或修改。例如,尽管本公开不限于特定的数据结构,但数据428可以作为具有多个不同字段和记录、XML文档或平面文件的表、以关系数据库存储在计算机寄存器中。数据428还可以格式化为计算机可读格式,例如但不限于,二进制值、ASCII或Unicode。仅作为示例,数据912可以存储为以压缩或非压缩方式存储的像素组成的位图、或各种图像格式(例如,JPEG)、基于向量的格式(例如,SVG)、或用于绘制图形的计算机指令。此外,数据428可以包括足够的信息以识别相关联的信息,例如数字、描述性文本、专有代码、指针、对存储在其他存储器(包括网络位置)中的数据的引用、或者由函数使用以计算相关数据的信息。在该示例中,数据428包含用于存储与多个不同位置相关的位置信息429的数据库427。
数据库427可以存储与其他信息相关联的位置信息429,例如图像、语义特征、位置描述、等等。在这方面,随着信息(例如图像)从客户端装置被接收,可以返回位置信息,例如地理坐标、地图信息、或者商户、城市等的名称。尽管在图4中示出了服务器420内的数据库427,但是应当理解,服务器可以附加地或替代地远离服务器420定位。例如,服务器420可以访问各种位置中的多个数据库。在一些示例中,不同的数据库可以存储不同类似的信息。
服务器420可以位于网络395的一个节点,且能够与网络395的其他节点直接或间接地通信。例如,服务器420可以包含网络服务器,其能够经由网络395与客户端装置101和410通信,使得其使用网络395在客户端装置410的显示器413上向用户传输和显示信息。服务器420还可以包含多个计算机,例如,负载平衡服务器场,其与网络的不同节点交换信息,以便与客户端装置101和410接收、处理和传输数据。在这种情况下,客户端装置101和410通常仍将位于网络395的不同于包括服务器420的计算机的不同节点。
网络395和中间节点可以包含各种配置和协议,其包含包括因特网、万维网、内联网、虚拟专用网络、广域网、本地网络,使用一个或多个公司专有的通信协议的专用网络、以太网、WiFi(例如,802.11、802.11b,g,n或其他此类标准),HTTP、以及上述的各种组合。这样的通信可以通过能够向和从其他计算机传输数据的装置来促进,例如调制解调器(例如拨号、电缆或光纤)和无线接口。
尽管在按照上述传输或接收信息时获得了某些优点,但是本文公开的主题的其他方面并不限于信息传输的特定方式。例如,在一些方面,信息可以经由诸如磁盘、磁带或CDROM的介质来发送。此外,尽管一些功能被指示为在具有单个处理器的单个服务器上发生,但是可以通过多个服务器来实现各个方面,例如,通过网络395向客户端装置101和410通信信息。
每个客户端装置101和410均可以类似于服务器420来配置,具有一个或多个处理器412、存储器414、指令416、数据418、以及在个人计算机中通常可见的所有的内部部件。仅作为示例,客户端装置930可以包含中央处理单元(CPU)、显示装置413(例如,具有屏幕的监视器、投影仪、触摸屏、小型LCD屏幕、电视机、或者其他装置,例如可操作以显示由处理器412处理的信息的电气装置)、CD ROM、硬盘驱动器、用户输入装置939,例如键盘、鼠标、触摸屏或麦克风、扬声器、调制解调器和/或网络接口装置(电话、电缆或其他),以及用于将这些元件彼此连接的所有部件。
客户端装置410可以是计算装置。例如,客户端装置410可以是膝上型计算机、上网本、台式计算机和便携是个人计算机,例如支持无线的PDA、平板型PC、或者能够经由网络(比如互联网)获得信息的其他类型的计算装置。尽管本公开的方面总体上涉及单个客户端装置410,但客户端装置410可以实现为多个装置,其具有便携式和非便携式部件(例如,在具有用于收集位置信息的接口的机架安装式服务器上运行的软件)。
尽管客户端装置410可以包含全尺寸个人计算机,但本公开的主题也可以结合能够无线地交换数据的移动装置使用。例如,客户端装置410可以是支持无线的移动装置,例如智能电话、或支持互联网的蜂窝电话。在任一情况下,用户可以使用小型键盘、辅助键盘、触摸屏或其他用户输入装置来输入信息。在各个方面,本文所述的客户端装置和计算机可以包括能够处理指令、并向和从人及其他装置和计算机传输数据的装置。
传感器415可以包含各种传感器中的一种或多种。例如,温度计、气压计、运动检测器、热传感器、激光器、光传感器、辐射传感器、麦克风等,其可以单独使用或组合使用,以检测各种对象、信息或活动。作为一个示例,运动检测器可以检测特定速率和/或方向的运动,这表示人在行走。还可以检测相对(对于候选地理)低水平的湿度和温度(可以意味着使用空调),且可以通过麦克风检测特定分贝水平的音乐和/或人群噪声。综合起来,这样的信息可以表示客户端装置410处于室内购物中心。
图像捕获模块417可以是相机、摄像机或者能够捕获静止或运动图片的任何其他装置。
地理定位部件419可以用于确定装置410的地理位置。例如,定位部件可以包含GPS接收器,以确定装置的纬度、经度和/或高度位置。也可以使用其他定位系统来识别装置410的位置,例如基于激光的定位系统、惯性辅助GPS、或基于相机的定位。设备410的位置可以包括绝对地理位置,例如纬度,经度和高度,以及相对位置信息,诸如相对于其他客户端装置或其他对象的位置。装置410的位置可以包含绝对地理位置,例如经度、维度和高度,以及相对位置信息,例如相对于客户端装置或其他对象的位置。
客户端装置410和服务器420的指令416和426可以分别是由处理器直接执行(例如机器代码)或间接执行(例如脚本)的指令集。在这方面,术语“指令”和“程序”可以在本文互换地使用。指令416和426可以以目标代码格式存储,以便由处理器进行直接处理,或以其他计算机语言存储,包括根据需要来解释或预先编译的独立源代码模块的脚本或集合。下面更详细地解释指令的功能、方法和例程。
为了便于系统900的操作,以用于检测移动装置(例如客户端装置101和410)的位置,服务器910可以进一步包含特征指示检测器423,用于识别与图像相关联的位置特征;以及位置检测器,用于将这些识别的指示与存储在数据库429中的各种位置的语义特征进行比较。这些模块的功能可以存在于比所示的更少或更多数量的模块中,这些模块驻留在一个或多个可能在地理上分散的计算装置中。模块可以结合客户端装置101和410一起操作,它们可以从其接收在位置处捕获的图像、以及关于这些图像的其他语义信息。因此,可以使用图像和其他语义信息来确定客户端装置101和410的位置。
图5是语义指示500的示例。在该示例中,装置101可以在餐馆捕获食物的图像105。系统可以检测照片中的食物的类型,以便确定用户装置位于该区域中的提供这种类型食物的特定类型餐馆中。例如,系统可以将捕获的图像105与数据库427中存储的图像501进行比较。例如,存储的食物图像501可以从各种餐馆的不同食物菜单515获取,或可以由餐馆老板或顾客上传。存储的图像501可以各自与特定餐馆、餐馆的类型、菜单等相关联。存储图像501可以以任何方式进行分类,例如通过食物、餐馆等的类型。除了比较图像105和图像501之外,系统还可以将从计算装置101获取的特征指示(例如声音、颜色等)同与特定餐馆相关联的存储的特征指示进行比较。当图像105中的多个对象和从装置101接收到的多个检测的特征中的至少一个一预定的阈值水平匹配存储的图像或存储的特征中的对象匹配时,可以确定与特定位置的匹配。例如,存储的图像510可以与图像105最接近匹配,且因此可以确定与存储的图像块510相关联的位置是装置101的位置。这种匹配可以允许用户装置例如通过使用在餐馆拍摄的食物图像“登记”到社交网络。
图6是语义指示600的另一示例。在该示例中,用户装置101可以捕获位置内的视频602。基于与视频中的各种对象的声音类型相关的检测到的特征指示,例如咖啡机604的声音或嘈杂的音乐,系统可以估计装置101在特定的咖啡馆中。还可以针对数据库427中的图像501和其他语义特征612来分析视频602中的对象,例如标识608、表格、装饰、等等。在一些实施例中,可以捕获时间戳609,以指示拍摄视频的时间。基于该附加的语义信息,系统选择匹配610,并且基于所选择的匹配610来确定该装置位于当时开放的特定的咖啡馆。
图7是语义指示700的另一示例。在该示例中,系统可以检测其他种类的特征指示,以确定用户装置101的位置,例如图像中的对象的纹理、颜色、图案、架构、等等。例如,捕获的图像105可以包含具有特定的纹理、图案和/或颜色的地毯708,其可以是相对独特的。图像105中的壁702也可以具有特定的颜色或图案,并且在一些情况下可以包括同样独特的装饰704。例如,主要是特定颜色或颜色组合的检测到的装饰可以指示与特定位置相关联的特定商户、或学校/大学、或其他类型的组织。如上面的示例,时间戳706还可以用于匹配与在某些时段开放的机构相关联的存储的特征指示712。此外,可以与图像一起被捕获(例如,通过与移动装置相关联的传感器)的许多其他类型的特征指示,例如运动检测指示(例如,检测走动或进行其他类型的运动的人)、气压计、湿度和辐射指示等,可以匹配存储的特征指示712,以识别特定的数据集710,并进一步缩窄用户装置的位置。
为了更好地帮助理解上述一些方面的示例,现在参考图8,其为流程图800。如之前讨论的,以下操作不必按照下面描述的精确顺序执行。而是,如上所述,可以以不同的顺序或同时处理各种操作,并且可以添加或省略一些操作。
在块810中,可以接收由移动装置在与一组候选位置相关联的区域处捕获的一个或多个图像。例如,移动装置可以在多个不同的商户、地标或其他位置的范围内。移动装置可以捕获特定位置的或特定位置内的图像,并将图像发送到服务器或数据库,例如,通过将图像上传到网站。
在块820中,可以检测与多个图像相关联的一个或多个特征指示。这些特征指示可以包含与该区域相关的语义特征。例如,可以从图像检测指示,比如对象、颜色、纹理或架构。在捕获的图像是视频图像的示例中,特征指示还可以包含声音、运动、亮度变化等。在一些示例中,可以检测由其他传感器捕获的特征指示。例如,诸如湿度、温度、时间、辐射等标记可以由联接到装置101的一个或多个传感器捕获,并发送到服务器或数据库。
在块830中,语义特征可以与该组候选位置的多个存储的特征进行比较。例如,由移动装置接收的图像可以与存储的图像进行比较。可以在执行比较时分析图像内的元素,例如对象、颜色和纹理。此外,从移动装置接收到的其他特征,诸如声音、温度、运动等,可以同与特定位置相关联的存储的特征进行比较。在一个示例中,可以基于比较来计算可能的位置的分数。具有与移动装置接收到的特征相匹配的特征数目较多的位置可以分配较高的分数。在一些示例中,可以基于匹配特征对分数进行加权。例如,图像中的匹配对象可以比匹配声音接收更多的点。
在块840中,可以根据比较来从该组位置选择一位置。所选择的位置可以识别移动装置的估计位置。例如,可以基于比较来确定与接收到的图像和特征指示的最佳匹配。与最佳匹配相关联的位置可以被识别为移动装置的估计位置。可以根据最高分数或任何其他规定来选择最佳匹配。
当参考实施例的以下描述和附图来考虑时,将理解本公开的方面、特征和优点。不同附图中相同的附图标记可以标识相同或相似的元件。另外,以下描述不是限制性的;本技术的范围由所附权利要求和等同物限定。尽管根据示例性实施例的某些过程在图中示出为以线性方式发生,但是这不是要求,除非在本文中明确说明。不同的过程可以以不同的顺序或同时执行。除非另有说明,还可以添加或省略步骤。

Claims (20)

1.一种计算机实现的方法,包括:
使用一个或多个处理器接收由移动装置在一区域捕获的多个图像,所述区域与一组候选位置相关联;
使用所述一个或多个处理器检测与所述多个图像相关联的一个或多个特征指示,所述特征指示包含与所述区域相关的语义特征,所述语义特征的类型包括对象、颜色、纹理、声音、温度、运动中的至少两个;
使用所述一个或多个处理器将所述语义特征与该组候选位置的多个存储的位置特征进行比较;
至少基于匹配的语义特征的数目为该组候选位置中的一个或多个计算分数,其中,所述分数基于所述比较中使用的语义特征的类型被加权,使得对语义特征的不同类型分别进行不同地加权;
至少部分地基于所述比较和加权的分数,使用所述一个或多个处理器从该组候选位置选择一位置;以及
至少部分地基于所选择的位置,使用所述一个或多个处理器估计所述移动装置的位置。
2.如权利要求1所述的方法,还包括,将与所述移动装置相关联的位置信息同与该组候选位置的所述多个存储的位置特征相关联的位置信息进行比较。
3.如权利要求1所述的方法,其中所述比较还包括,确定所述语义特征是否对应于所述组中的给定位置的存储的位置特征。
4.如权利要求1所述的方法,其中所述语义特征包含食物图像的视觉特征,且所选择的位置与对应于所述食物图像的菜单相关联。
5.如权利要求1所述的方法,其中所述语义特征包含在所选择的位置的一个或多个对象的音频数据。
6.如权利要求1所述的方法,其中所述语义特征包含与所选择的位置相关联的标识。
7.如权利要求1所述的方法,其中所述语义特征包含一天中的时间,且所选择的位置与在一天中的该时间开放的商户相关联。
8.如权利要求1所述的方法,其中所述语义特征包含位于所选择的位置内的对象的纹理。
9.如权利要求1所述的方法,其中所述语义特征包含与所述多个图像相关联的传感器数据,且所述传感器数据由所述移动装置捕获。
10.一种存储指令的非暂时性计算机可读介质,所述指令在由一个或多个处理器执行时导致所述一个或多个处理器执行一方法,所述方法包括:
接收由移动装置在一区域捕获的多个图像,所述区域与一组候选位置相关联;
检测与所述多个图像相关联的一个或多个特征指示,所述特征指示包含与所述区域相关的语义特征,所述语义特征的类型包括对象、颜色、纹理、声音、温度、运动中的至少两个;
将所述语义特征与该组候选位置的多个存储的位置特征进行比较;
至少基于匹配的语义特征的数目为该组候选位置中的一个或多个计算分数,其中,所述分数基于所述比较中使用的语义特征的类型被加权,使得对语义特征的不同类型分别进行不同地加权;
至少部分地基于所述比较和加权的分数,从该组候选位置选择一位置;以及
至少部分地基于所选择的位置,估计所述移动装置的位置。
11.如权利要求10所述的非暂时性计算机可读介质,所述方法还包括,将与所述移动装置相关联的位置信息同与该组候选位置的多个存储的位置特征相关联的位置信息进行比较。
12.一种用于检测移动装置的位置的系统,包括:
存储一组候选位置的多个位置特征的存储器;以及
与所述存储器通信的一个或多个处理器,所述一个或多个处理器配置为:
接收由移动装置在一区域捕获的多个图像,所述区域与一组候选位置相关联;
检测与所述多个图像相关联的一个或多个特征指示,所述特征指示包含与所述区域相关的语义特征,所述语义特征的类型包括对象、颜色、纹理、声音、温度、运动中的至少两个;
将所述语义特征与存储在存储器中的多个位置特征进行比较;
至少基于匹配的语义特征的数目为该组候选位置中的一个或多个计算分数,其中,所述分数基于所述比较中使用的语义特征的类型被加权,使得对语义特征的不同类型分别进行不同地加权;
至少部分地基于所述比较和加权的分数,从该组候选位置选择一位置;以及
至少部分地基于所选择的位置,估计所述移动装置的位置。
13.如权利要求12所述的系统,其中所述一个或多个处理器还配置为将与所述移动装置相关联的位置信息同与该组候选位置的多个存储的位置特征相关联的位置信息进行比较。
14.如权利要求12所述的系统,其中所述比较还包括,确定所述语义特征是否对应于所述组中的给定位置的存储的位置特征。
15.如权利要求12所述的系统,其中所述语义特征包含食物图像的视觉特征,且所选择的位置与对应于所述食物图像的菜单相关联。
16.如权利要求12所述的系统,其中所述语义特征包含在所选择的位置的一个或多个对象的音频数据。
17.如权利要求12所述的系统,其中所述语义特征包含与所选择的位置相关联的标识。
18.如权利要求12所述的系统,其中所述语义特征包含一天中的时间,且所选择的位置与在一天中的该时间开放的商户相关联。
19.如权利要求12所述的系统,其中所述语义特征包含位于所选择的位置内的对象的纹理。
20.如权利要求12所述的系统,其中所述语义特征包含与所述多个图像相关联的传感器数据,且所述传感器数据由所述移动装置捕获。
CN201680010519.5A 2015-03-20 2016-03-10 基于语义指示检测移动装置的位置 Active CN107251049B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/664,099 2015-03-20
US14/664,099 US9524435B2 (en) 2015-03-20 2015-03-20 Detecting the location of a mobile device based on semantic indicators
PCT/US2016/021780 WO2016153805A1 (en) 2015-03-20 2016-03-10 Detecting the location of a mobile device based on semantic indicators

Publications (2)

Publication Number Publication Date
CN107251049A CN107251049A (zh) 2017-10-13
CN107251049B true CN107251049B (zh) 2020-12-08

Family

ID=55588627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680010519.5A Active CN107251049B (zh) 2015-03-20 2016-03-10 基于语义指示检测移动装置的位置

Country Status (5)

Country Link
US (2) US9524435B2 (zh)
CN (1) CN107251049B (zh)
DE (2) DE112016001304T5 (zh)
GB (1) GB2551288A (zh)
WO (1) WO2016153805A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6729486B2 (ja) * 2017-05-15 2020-07-22 京セラドキュメントソリューションズ株式会社 情報処理装置、情報処理プログラム及び情報処理方法
GB2568286B (en) * 2017-11-10 2020-06-10 Horiba Mira Ltd Method of computer vision based localisation and navigation and system for performing the same
US10546196B2 (en) 2017-12-20 2020-01-28 X Development Llc Semantic place recognition and localization
CN110110014B (zh) * 2017-12-26 2023-07-14 阿里巴巴集团控股有限公司 目标对象的位置信息的确定方法、服务器及用户客户端
US10769428B2 (en) * 2018-08-13 2020-09-08 Google Llc On-device image recognition
US11074351B2 (en) * 2018-08-21 2021-07-27 International Business Machines Corporation Location specific identity verification system
KR102629330B1 (ko) * 2018-11-28 2024-01-26 삼성전자주식회사 디스플레이 장치 및 이의 제어 방법
DE102018131000A1 (de) * 2018-12-05 2020-06-10 Lufthansa Technik Aktiengesellschaft Optisches Positionsbestimmungs- und Identifikationssystem
FR3106112B1 (fr) * 2020-01-13 2021-12-03 Continental Automotive Procédé et dispositif de prédiction adaptatif d’une caractéristique météo de surface d’un segment routier

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103424113A (zh) * 2013-08-01 2013-12-04 毛蔚青 移动终端基于图像识别技术的室内定位与导航方法
CN103761539A (zh) * 2014-01-20 2014-04-30 北京大学 一种基于环境特征物体的室内定位方法
CN103874193A (zh) * 2012-12-13 2014-06-18 中国电信股份有限公司 一种移动终端定位的方法及系统
CN104125536A (zh) * 2014-06-25 2014-10-29 重庆广建装饰股份有限公司 基于商品图片的室内定位方法
WO2015022020A1 (en) * 2013-08-13 2015-02-19 Logograb Limited Recognition process of an object in a query image

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150617B2 (en) * 2004-10-25 2012-04-03 A9.Com, Inc. System and method for displaying location-specific images on a mobile device
WO2007030026A1 (en) 2005-09-09 2007-03-15 Industrial Research Limited A 3d scene scanner and a position and orientation system
US8966389B2 (en) 2006-09-22 2015-02-24 Limelight Networks, Inc. Visual interface for identifying positions of interest within a sequentially ordered information encoding
US20090122144A1 (en) 2007-11-14 2009-05-14 Joel Pat Latham Method for detecting events at a secured location
WO2009149472A1 (en) 2008-06-06 2009-12-10 Spencer Marc D Enhanced zoom and pan for viewing digital images
JP2010016443A (ja) 2008-07-01 2010-01-21 Toshiba Corp 状況認識装置、状況認識方法、及び無線端末装置
US9195898B2 (en) * 2009-04-14 2015-11-24 Qualcomm Incorporated Systems and methods for image recognition using mobile devices
US8078623B2 (en) 2009-10-14 2011-12-13 Cyberlink Corp. Systems and methods for summarizing photos based on photo information and user preference
US8606293B2 (en) * 2010-10-05 2013-12-10 Qualcomm Incorporated Mobile device location estimation using environmental information
US9874454B2 (en) 2011-01-13 2018-01-23 Here Global B.V. Community-based data for mapping systems
US8660581B2 (en) 2011-02-23 2014-02-25 Digimarc Corporation Mobile device indoor navigation
US9366749B2 (en) * 2011-04-15 2016-06-14 Qualcomm Incorporated Device position estimates from motion and ambient light classifiers
US8938257B2 (en) 2011-08-19 2015-01-20 Qualcomm, Incorporated Logo detection for indoor positioning
KR101668784B1 (ko) * 2011-09-23 2016-10-24 퀄컴 인코포레이티드 근접 핑거프린트들을 통한 포지션 추정
US9513127B2 (en) 2011-12-22 2016-12-06 AppLabz, LLC Systems, methods, and apparatus for providing indoor navigation
US8379053B1 (en) 2012-01-24 2013-02-19 Google Inc. Identification of areas of interest on a web page
US20130328921A1 (en) 2012-06-08 2013-12-12 Ipinion, Inc. Utilizing Heat Maps to Represent Respondent Sentiments
US8744418B2 (en) 2012-08-31 2014-06-03 Analog Devices, Inc. Environment detection for mobile devices
WO2014074837A1 (en) * 2012-11-08 2014-05-15 Duke University Unsupervised indoor localization and heading directions estimation
US9020191B2 (en) * 2012-11-30 2015-04-28 Qualcomm Incorporated Image-based indoor position determination
US9367811B2 (en) * 2013-03-15 2016-06-14 Qualcomm Incorporated Context aware localization, mapping, and tracking
US9971320B2 (en) * 2014-07-03 2018-05-15 Google Llc Methods and systems for adaptive triggering of data collection

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103874193A (zh) * 2012-12-13 2014-06-18 中国电信股份有限公司 一种移动终端定位的方法及系统
CN103424113A (zh) * 2013-08-01 2013-12-04 毛蔚青 移动终端基于图像识别技术的室内定位与导航方法
WO2015022020A1 (en) * 2013-08-13 2015-02-19 Logograb Limited Recognition process of an object in a query image
CN103761539A (zh) * 2014-01-20 2014-04-30 北京大学 一种基于环境特征物体的室内定位方法
CN104125536A (zh) * 2014-06-25 2014-10-29 重庆广建装饰股份有限公司 基于商品图片的室内定位方法

Also Published As

Publication number Publication date
GB201713144D0 (en) 2017-09-27
DE202016006038U1 (de) 2016-12-15
WO2016153805A1 (en) 2016-09-29
CN107251049A (zh) 2017-10-13
GB2551288A (en) 2017-12-13
US9842272B2 (en) 2017-12-12
US20170061606A1 (en) 2017-03-02
US9524435B2 (en) 2016-12-20
DE112016001304T5 (de) 2018-01-11
US20160275350A1 (en) 2016-09-22

Similar Documents

Publication Publication Date Title
CN107251049B (zh) 基于语义指示检测移动装置的位置
US9721347B2 (en) 3D model updates using crowdsourced video
US9501832B1 (en) Using pose data and positioning information to locate online photos of a user
CA2837185C (en) Systems and methods for collecting and providing map images
US9743236B1 (en) Integrated geospatial activity reporting
US9983002B2 (en) Enhancing geolocation using barometric data to determine floors at a location
US9600932B2 (en) Three dimensional navigation among photos
AU2014248420B2 (en) Navigating through geolocated imagery spanning space and time
EP2592436A2 (en) Device positioning via device-sensed data evaluation
US20170017928A1 (en) Inferring physical meeting location
US20150025998A1 (en) Apparatus and method for recommending place
US9437004B2 (en) Surfacing notable changes occurring at locations over time
US9980098B2 (en) Feature selection for image based location determination
WO2015005990A1 (en) Crowdsourcing method to detect broken wifi indoor locationing model
WO2015069560A1 (en) Image based location determination
US20180014158A1 (en) Mobile Device Recommendation System and Method
EP3300020A1 (en) Image based location determination

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: American California

Applicant after: Google limited liability company

Address before: American California

Applicant before: Google Inc.

GR01 Patent grant
GR01 Patent grant