JP2021522614A - Digital supplemental association and search for visual search - Google Patents
Digital supplemental association and search for visual search Download PDFInfo
- Publication number
- JP2021522614A JP2021522614A JP2020570146A JP2020570146A JP2021522614A JP 2021522614 A JP2021522614 A JP 2021522614A JP 2020570146 A JP2020570146 A JP 2020570146A JP 2020570146 A JP2020570146 A JP 2020570146A JP 2021522614 A JP2021522614 A JP 2021522614A
- Authority
- JP
- Japan
- Prior art keywords
- digital
- image
- supplement
- computing device
- digital supplement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000153 supplemental effect Effects 0.000 title claims abstract description 66
- 230000000007 visual effect Effects 0.000 title abstract description 15
- 239000013589 supplement Substances 0.000 claims abstract description 403
- 238000000034 method Methods 0.000 claims abstract description 80
- 230000004044 response Effects 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 12
- 230000009193 crawling Effects 0.000 claims description 6
- 230000003190 augmentative effect Effects 0.000 claims description 4
- 230000009469 supplementation Effects 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 25
- 239000000047 product Substances 0.000 description 16
- 238000013528 artificial neural network Methods 0.000 description 11
- 230000004913 activation Effects 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 240000007320 Pinus strobus Species 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 210000000613 ear canal Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004424 eye movement Effects 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/41—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
Abstract
ビジュアルサーチのためのコンテンツの識別および検索のためのシステムおよび方法が提供される。例示的な方法は、デジタル補足を指定するデータを受信することを含む。当該データは、デジタル補足と、当該デジタル補足を画像コンテンツに関連付けるための補足アンカーとを識別できる。当該方法はまた、デジタル補足および補足アンカーを指定するデータ構造インスタンスを生成することと、当該データ構造インスタンスを生成した後に、データ構造インスタンスを複数の他のデータ構造インスタンスを含むデータベースに格納することに少なくとも基づいて、画像によるデジタル補足のトリガを有効化すること、とを含み得る。他のデータ構造インスタンスは各々、デジタル補足および1つまたは複数の補足アンカーを指定できる。 Systems and methods for identifying and searching content for visual search are provided. An exemplary method involves receiving data that specifies a digital supplement. The data can distinguish between digital supplements and supplemental anchors for associating the digital supplements with image content. The method also involves creating a data structure instance that specifies digital supplements and supplementary anchors, and after creating the data structure instance, storing the data structure instance in a database that contains multiple other data structure instances. It may include, at least based on, enabling the triggering of digital supplementation by images. Each other data structure instance can specify a digital supplement and one or more supplement anchors.
Description
関連出願の参照
本出願は、2018年6月21日に出願された「DIGITAL SUPPLEMENT ASSOCIATION AND RETRIEVAL FOR VISUAL SEARCH」と題する米国非仮特許出願第16/014,520号の継続出願であり、その優先権を主張するものであり、その開示は参照によりその全体が本明細書に組み込まれる。
Reference to Related Application This application is a continuation of US Non-Provisional Patent Application No. 16/014,520 entitled "DIGITAL SUPPLEMENT ASSOCIATION AND RETRIEVAL FOR VISUAL SEARCH" filed on June 21, 2018, and its priority It is a claim and its disclosure is incorporated herein by reference in its entirety.
背景
スマートフォンのようなモバイルコンピューティングデバイスは、多くの場合、カメラを含む。これらのカメラは、当該コンピューティングデバイスの周囲の環境におけるエンティティの画像を取得するために使用され得る。これらのエンティティに関連する様々なタイプのコンテンツまたは経験は、当該モバイルコンピューティングデバイスを介してユーザに利用可能であり得る。
Background Mobile computing devices such as smartphones often include cameras. These cameras can be used to capture images of entities in the environment surrounding the computing device. Various types of content or experience associated with these entities may be available to the user through the mobile computing device.
概要
本開示は、ビジュアルサーチのためのデジタル補足関連付けおよび検索のためのシステムおよび方法を説明する。たとえば、本明細書で説明されるシステムおよび技術は、ビジュアルサーチに応答する、拡張現実(AR)コンテンツまたは経験などのデジタル補足を提供するために使用され得る。ビジュアルサーチは、例えば、画像または画像内で識別されたエンティティに基づき得る。デジタル補足は、例えば、画像に関連付けられた情報または機能を提供することを含み得る。
Summary This disclosure describes a system and method for digital supplemental association and search for visual search. For example, the systems and techniques described herein can be used to provide digital supplements such as augmented reality (AR) content or experience in response to visual searches. The visual search may be based on, for example, an image or an entity identified within the image. Digital supplements may include, for example, providing information or functionality associated with an image.
一局面は、デジタル補足を指定するデータを受信することを含むコンピュータで実行される方法であり、当該データは、デジタル補足と、当該デジタル補足を画像コンテンツに関連付けるための補足アンカーとを識別する。当該方法はまた、デジタル補足および補足アンカーを指定するデータ構造インスタンスを生成することを含む。当該方法は、データ構造インスタンスを生成した後に、少なくともデータ構造インスタンスを複数の他のデータ構造インスタンスを含むデータベースに格納することに基づいて、画像によるデジタル補足のトリガを有効化することをさらに含む。他のデータ構造インスタンスの各々は、デジタル補足と、1つまたは複数の補足アンカーとを指定する。 One aspect is a method performed on a computer that involves receiving data that specifies a digital supplement, which identifies the digital supplement from a supplement anchor for associating the digital supplement with image content. The method also involves creating data structure instances that specify digital supplements and supplement anchors. The method further includes enabling the triggering of digital supplementation with images, based on creating the data structure instance and then storing at least the data structure instance in a database containing a plurality of other data structure instances. Each of the other data structure instances specifies a digital supplement and one or more supplement anchors.
別の局面は、少なくとも1つのプロセッサと、命令を記憶するメモリとを含むコンピューティングデバイスである。当該命令は、当該少なくとも1つのプロセッサによって実行されると、当該コンピューティングデバイスに、デジタル補足を指定するデータを受信させ、当該データは、デジタル補足と、当該デジタル補足を画像コンテンツに関連付けるための補足アンカーと、コンテキスト情報とを受信させる。当該命令はまた、当該コンピューティングデバイスに、デジタル補足と補足アンカーとコンテキスト情報とを指定するデータ構造インスタンスを生成させる。当該命令はさらに、当該コンピューティングデバイスに、データ構造インスタンスを生成した後に、当該データ構造インスタンスを複数の他のデータ構造インスタンスを含むデータベースに格納することに少なくとも基づいて、画像によるデジタル補足のトリガを有効化する。当該他のデータ構造インスタンスの各々は、デジタル補足と、1つまたは複数の補足アンカーとを指定する。 Another aspect is a computing device that includes at least one processor and memory that stores instructions. When executed by the at least one processor, the instruction causes the computing device to receive data specifying a digital supplement, which is a digital supplement and a supplement for associating the digital supplement with image content. Receive the anchor and the context information. The instruction also causes the computing device to generate a data structure instance that specifies digital supplements, supplemental anchors, and contextual information. The instruction also triggers a digital supplement with an image, at least based on creating a data structure instance on the computing device and then storing the data structure instance in a database containing multiple other data structure instances. Activate. Each of the other data structure instances specifies a digital supplement and one or more supplement anchors.
さらに別の局面は、コンピューティングデバイスから画像コンテンツクエリを受信することと、当該画像コンテンツクエリに基づいて補足アンカーを識別することとを含む、コンピュータで実行される方法である。当該方法はまた、識別された補足アンカーに基づいてデジタル補足の順序付けられたリストを生成することと、当該順序付けられたリストをクライアントコンピューティングデバイスに送信することとを含む。 Yet another aspect is a method performed on a computer that includes receiving an image content query from a computing device and identifying a supplemental anchor based on the image content query. The method also includes generating an ordered list of digital supplements based on the identified supplement anchors and sending the ordered list to client computing devices.
1つまたは複数の実施形態の詳細は、添付の図面および以下の説明に記載される。他の特徴は、当該説明および図面ならびに特許請求の範囲から明らかとなるであろう。 Details of one or more embodiments will be described in the accompanying drawings and the following description. Other features will become apparent from the description and drawings as well as the claims.
詳細な説明
本開示は、画像コンテンツに基づくデジタル補足の識別および提示を単純化する技術的改善を記載する。本明細書で説明される技術のある実施形態は、特定のタイプの画像コンテンツに関連のあるデジタル補足のインデックスを生成し、クライアントコンピューティングデバイスから受信された画像コンテンツクエリに応答してそれらのデジタル補足を提供する。このインデックスにより、ユーザは、世界中に配置されたネットワークアクセス可能なリソース(例えば、ウェブページ)によって提供される、関連のあるデジタル補足にアクセスできる。このことは、情報のより効率的な検索を可能にする機能的なデータ構造を提供し得る。
Detailed Description This disclosure describes technical improvements that simplify the identification and presentation of digital supplements based on image content. Certain embodiments of the techniques described herein generate indexes for digital supplements associated with a particular type of image content and digitally respond to image content queries received from client computing devices. Provide supplements. This index gives users access to relevant digital supplements provided by network-accessible resources (eg, web pages) located around the world. This may provide a functional data structure that allows for more efficient retrieval of information.
例えば、スマートフォンのようなクライアントコンピューティングデバイスは、エンティティのような、補足アンカーの画像を取得し得る。次いで、クライアントコンピューティングデバイスは、識別された補足アンカーに関連付けられるデジタル補足を検索するために、画像に基づく画像コンテンツクエリをサーバコンピューティングデバイスに送信し得る。ある実施形態では、補足アンカーは、クライアントコンピューティングデバイス周囲の物理的環境に基づき、デジタル補足は、物理的環境におけるユーザの経験を補足し得る仮想コンテンツである。 For example, a client computing device such as a smartphone may acquire an image of a supplementary anchor, such as an entity. The client computing device may then send an image-based image content query to the server computing device to search for the digital supplement associated with the identified supplement anchor. In certain embodiments, the supplemental anchor is based on the physical environment surrounding the client computing device, and the digital supplement is virtual content that can supplement the user's experience in the physical environment.
画像コンテンツクエリは、(例えば、識別された補足アンカーのインジケータのような)画像から決定される画像またはデータを含み得る。画像から決定されるデータの例は、例えば、光学的文字認識を使用して画像から抽出されるテキストである。画像から抽出されるデータの他の例は、当該画像、エンティティの識別子または説明、製品、または、当該画像で識別されるエンティティのタイプにある、バーコード、QR(登録商標)コード等を含む。 The image content query may include an image or data determined from the image (eg, such as an indicator of an identified supplemental anchor). An example of data determined from an image is, for example, text extracted from an image using optical character recognition. Other examples of data extracted from an image include a barcode, QR® code, etc. in the image, the identifier or description of the entity, the product, or the type of entity identified in the image.
エンティティ、製品、またはエンティティタイプは、たとえば、畳み込みニューラルネットワークシステムのようなニューラルネットワークシステムを使用して画像内で識別され得る。エンティティ、製品、またはエンティティタイプの識別子または説明は、エンティティ、製品、またはエンティティタイプに関連するデータベース内のレコードへのメタデータまたは参照を含み得る。エンティティの非限定的な例は、建物、技術の作品、製品、書籍、ポスター、写真、カタログ、サイン、文書(例えば、名刺、レシート、クーポン、カタログ)、人々、および身体部分を含む。 An entity, product, or entity type can be identified in an image using a neural network system, such as a convolutional neural network system. An identifier or description of an entity, product, or entity type can include metadata or references to records in the database associated with the entity, product, or entity type. Non-limiting examples of entities include buildings, works of technology, products, books, posters, photographs, catalogs, signs, documents (eg, business cards, receipts, coupons, catalogs), people, and body parts.
補足アンカーに関連付けられる様々なタイプのデジタル補足が利用可能であり得る。デジタル補足は、インターネット上で利用可能なウェブページのような、ネットワークアクセス可能なリソースによって提供され得る。画像コンテンツクエリに応答して、これらのデジタル補足の位置を特定して提供する方法が必要である。ある実施形態は、画像コンテンツクエリに応答する際に使用するエンティティに関連付けられたデジタル補足のインデックスを生成して維持する。インデックスは、例えば、ネットワークアクセス可能なリソースをクローリングして当該ネットワークアクセス可能なリソースがデジタル補足を含むかまたは提供するか否かを判断し、それらのデジタル補足に関連付けられる補足アンカーを決定することによって、追加され得る。 Supplements Various types of digital supplements associated with anchors may be available. Digital supplements may be provided by network-accessible resources, such as web pages available on the Internet. There is a need for a way to locate and provide these digital supplements in response to image content queries. One embodiment generates and maintains an index of digital supplements associated with the entity used in responding to image content queries. The index, for example, by crawling network-accessible resources to determine whether the network-accessible resource contains or provides digital supplements and determines the supplemental anchors associated with those digital supplements. , Can be added.
例えば、ネットワークアクセス可能なリソースは、デジタル補足が関連付けられる補足アンカー(例えば、テキスト、コード、エンティティ、またはエンティティの種類)を識別するメタデータを含み得る。メタデータは、ハイパーテキスト転送プロトコル(HTTP)要求に応答してネットワークアクセス可能なリソースによって含められ得る。メタデータは、XML(extensible markup language)、JavaScript Object Notation(JSON)、または他のフォーマットのような、様々なフォーマットで提供され得る。 For example, a network-accessible resource may contain metadata that identifies a supplemental anchor (eg, text, code, entity, or type of entity) with which a digital supplement is associated. Metadata can be included by network-accessible resources in response to Hypertext Transfer Protocol (HTTP) requests. Metadata can be provided in a variety of formats, such as XML (extensible markup language), JavaScript Object Notation (JSON), or other formats.
デジタル補足のためのメタデータは、以下のうちの1つまたは複数、すなわち、タイプインジケータ、アンカーインジケータ、名前、説明、コンテンツのスニペット(すなわち、コンテンツの一部分の抜粋またはプレビュー)、関連画像、デジタル補足へのURLのようなリンク、および、当該デジタル補足に関連付けられるアプリケーションの識別子、を含み得る。メタデータはまた、デジタル補足の発行者に関する情報を含み得る。たとえば、メタデータは、発行者名、発行者の説明、および、当該発行者に関連付けられる画像またはアイコンのうちの1つまたは複数を含み得る。ある実施形態では、メタデータは、デジタル補足を提供することに関連付けられるコンテキスト情報を含む。例えば、メタデータはまた、デジタル補足を提供すること又はデジタル捕捉にアクセスすることに関連付けられる条件(例えば、地理的条件、必要なアプリケーション)を含み得る。 Metadata for digital supplements can be one or more of the following: type indicators, anchor indicators, names, descriptions, content snippets (ie, excerpts or previews of parts of content), related images, digital supplements. It may include a link such as a URL to, and an application identifier associated with the digital supplement. Metadata may also include information about the publisher of digital supplements. For example, the metadata may include an issuer name, an issuer description, and one or more of the images or icons associated with that issuer. In certain embodiments, the metadata includes contextual information associated with providing digital supplements. For example, metadata may also include conditions associated with providing digital supplements or accessing digital captures (eg, geographic conditions, required applications).
識別されたデジタル補足は、メモリに記憶されるインデックスに追加され得る。少なくともある実施形態では、デジタル補足のための関連付けられた補足アンカーは、インデックスに対するキーとして使用される。デジタル補足はまた、様々なスコアに関連付けられ得る。例えば、デジタル補足は、当該デジタル補足または当該デジタル補足に関連付けられるネットワークアクセス可能なリソースを参照する他のリンクが(例えば、ネットワークアクセス可能なリソースをクローリングしている間に)どれだけ見つかったかと、それらのリンクを提供するネットワークアクセス可能なリソースの名声とに基づく名声スコアに関連付けられ得る。別の例として、デジタル補足は、特定のアンカーに対するデジタル補足(または関連付けられるネットワークアクセス可能なリソース)の関連性に対応する1つまたは複数の関連性スコアに関連付けられ得る。関連性スコアはまた、キーワードまたは主題に関連付けられ得る。関連性スコアは、デジタル補足の内容、ネットワークアクセス可能なリソースの内容、ネットワークアクセス可能なリソースにリンクするサイトの内容、およびネットワークアクセス可能なリソースへのリンクの内容(たとえばテキスト)のうちの1つまたは複数に基づいて決定され得る。 The identified digital supplement may be added to an index stored in memory. At least in certain embodiments, the associated supplement anchor for digital supplement is used as a key to the index. Digital supplements can also be associated with various scores. For example, a digital supplement is how many other links (eg, while crawling a network accessible resource) are found that refer to the digital supplement or the network accessible resource associated with the digital supplement. It can be associated with a fame score based on the fame of the network accessible resources that provide those links. As another example, a digital supplement can be associated with one or more relevance scores that correspond to the relevance of the digital supplement (or associated network accessible resource) to a particular anchor. Relevance scores can also be associated with keywords or themes. The relevance score is one of the content of the digital supplement, the content of the network-accessible resource, the content of the site that links to the network-accessible resource, and the content of the link to the network-accessible resource (for example, text). Or it can be determined on the basis of more than one.
図1は、例示的な実施形態に従うシステム100を示すブロック図である。システム100は、デジタル補足をエンティティまたはエンティティタイプに関連付けることができ、ビジュアルサーチに応答してデジタル補足を取り出すことができる。ビジュアルサーチは、画像コンテンツに基づく検索である。例えば、ビジュアルサーチは、画像コンテンツクエリに基づいて実行され得る。画像コンテンツクエリは、画像または他の画像コンテンツに基づくクエリである。例えば、画像コンテンツクエリは、画像を含み得る。ある実施形態では、画像コンテンツクエリは、画像に基づくテキストまたはデータを含み得る。例えば、テキストまたはデータは、画像内の1つまたは複数のエンティティを認識することによって生成され得る。一部の画像コンテンツクエリは、画像を含まない(例えば、画像コンテンツクエリは、画像から生成されたデータまたはテキストのみを含み得る)。ある実施形態では、システム100は、クライアントコンピューティングデバイス102と、検索サーバ152と、デジタル補足サーバ172とを含む。また、クライアントコンピューティングデバイス102、検索サーバ152、およびデジタル補足サーバ172が通信し得るネットワーク190も示されている。
FIG. 1 is a block diagram showing a
クライアントコンピューティングデバイス102は、プロセッサアセンブリ104、通信モジュール106、センサシステム110、およびメモリ120を含み得る。センサシステム110は、カメラアセンブリ112、慣性運動ユニット(IMU)114、および全地球測位システム(GPS)受信機116のような、様々なセンサを含み得る。センサシステム110の実施形態はまた、例えば、光センサ、音声センサ、画像センサ、距離および/または近接センサ、容量センサなどの接触センサ、タイマ、および/または、他のセンサ、および/または、センサの異なる組み合せを含む他のセンサを含み得る。ある実施形態では、クライアントコンピューティングデバイス102は、モバイルデバイス(たとえば、スマートフォン)である。
The
カメラアセンブリ112は、クライアントコンピューティングデバイス102の周りの物理的空間の画像または映像を取得する。カメラアセンブリ112は、1つまたは複数のカメラを含み得る。カメラアセンブリ112はまた、赤外線カメラを含み得る。カメラアセンブリ112で取得された画像は、アンカーを補足するために、および画像コンテンツクエリを形成するために識別するために、使用され得る。
The
ある実施形態では、カメラアセンブリ112によって取得された画像はまた、メモリ120または外部コンピューティングデバイスから受信された物理的空間の表現に基づいて、内部空間のような物理的空間内のクライアントコンピューティングデバイス102の位置および向きを決定するために使用され得る。ある実施形態では、物理的空間の表現は、当該物理的空間の視覚的特徴(例えば、現実空間の画像から抽出される特徴)を含み得る。当該表現はまた、それらの特徴に関連付けられて、物理的空間の1つまたは複数の画像に基づいて物理的空間内の位置および/または場所を決定するために視覚的位置決めシステムによって使用され得る位置決定データを含み得る。当該表現はまた、物理的空間内の少なくともいくつかの構造の三次元モデルを含み得る。ある実施形態では、当該表現は、物理的空間の3次元モデルを含まない。
In certain embodiments, the image acquired by the
IMU114は、クライアントコンピューティングデバイスの動作、動き、および/または加速度を検出し得る。IMU114は、たとえば、加速度計、ジャイロスコープ、磁力計、および他のそのようなセンサのような様々な異なるタイプのセンサを含み得る。クライアントコンピューティングデバイス102の向きは、IMU114またはGPS受信機116によって提供されるデータに基づいて検出および追跡され得る。
The IMU 114 may detect the movement, movement, and / or acceleration of the client computing device. The IMU 114 may include various different types of sensors such as accelerometers, gyroscopes, magnetometers, and other such sensors. The orientation of the
GPS受信機116は、GPS衛星によって発信される信号を受信し得る。信号は、衛星の時間および位置を含む。いくつかの(例えば、少なくとも4つの)衛星から信号を受信することに基づいて、GPS受信機116は、クライアントコンピューティングデバイス102のグローバル位置を決定し得る。
The GPS receiver 116 may receive signals transmitted by GPS satellites. The signal includes the time and position of the satellite. Based on receiving signals from several (eg, at least 4) satellites, the GPS receiver 116 may determine the global position of the
メモリ120は、アプリケーション122、他のアプリケーション140、およびデバイス測位システム142を含み得る。他のアプリケーション140は、クライアントコンピューティングデバイス102上で実行するためにインストールされるかまたはそうでなければ利用可能である任意の他のアプリケーションを含む。ある実施形態では、アプリケーション122は、他のアプリケーション140のうちの1つに、デジタル補足を提供させ得る。ある実施形態では、いくつかのデジタル補足は、他のアプリケーション140が、デジタル補足に関連付けられ又は当該デジタル補足を提供するために必要とされる特定のアプリケーションを含む場合にのみ、利用可能であり得る。
The memory 120 may include an application 122, another application 140, and a device positioning system 142. The other application 140 includes any other application that is installed or otherwise available to run on the
デバイス測位システム142は、クライアントコンピューティングデバイス102の位置を決定する。デバイス測位システム142は、クライアントコンピューティングデバイス102の位置および向きをグローバルにまたは物理的空間内で決定するために、センサシステム110を使用し得る。ある実施形態では、デバイス測位システム142は、たとえば、セルラー三角測量に基づいて、クライアントコンピューティングデバイス102の位置を決定する。
The device positioning system 142 determines the position of the
ある実施形態では、クライアントコンピューティングデバイス102は、カメラアセンブリ112によって取得された画像(またはそれらの画像から抽出される特徴)を、物理的空間の表現内の特徴の既知の配置と比較し、物理的空間内のクライアントコンピューティングデバイス102の6自由度の姿勢(たとえば、位置および向き)を決定する視覚的測位システムを含み得る。
In certain embodiments, the
アプリケーション122は、補足アンカー識別エンジン124、デジタル補足検索エンジン126、デジタル補足提示エンジン128、および、ユーザインターフェイスエンジン130を含み得る。アプリケーション122のある実施形態は、より少ない、追加の、または他の構成要素を含み得る。
Application 122 may include a supplementary anchor identification engine 124, a digital supplementary search engine 126, a digital supplementary presentation engine 128, and a
補足アンカー識別エンジン124は、例えば、カメラアセンブリ112で取得された画像に基づいて補足アンカーを識別する。ある実施形態では、補足アンカー識別エンジン124は、テキストを識別するために画像を分析する。当該テキストは、次いで、アンカーを識別するために使用され得る。例えば、テキストは、知識グラフ内のノードにマッピングされ得る。たとえば、テキストは、人、場所、製品、建物、アートワーク、映画、または他のタイプのエンティティのような、エンティティの名前として認識され得る。ある実施形態では、テキストは、特定のエンティティに一般に関連付けられるフレーズとして、または、特定のエンティティを記述するフレーズとして認識され得る。例えば、テキストは、次いで、当該特定のエンティティに関連付けられたアンカーとして認識され得る。
The supplementary anchor identification engine 124 identifies the supplementary anchor based on, for example, the image acquired by the
ある実施形態では、補足アンカー識別エンジン124は、画像内でバーコード、QRコード(登録商標)、または別のタイプのコードのような、1つまたは複数のコードを識別する。次いで、コードは、補足アンカーにマッピングされ得る。 In certain embodiments, the supplemental anchor identification engine 124 identifies one or more codes in the image, such as a barcode, QR code®, or another type of code. The code can then be mapped to a supplemental anchor.
補足アンカー識別エンジン124は、画像内の少なくともいくつかのタイプのエンティティを認識できる機械学習モジュールを含み得る。例えば、機械学習モジュールは、ニューラルネットワークシステムを含み得る。ニューラルネットワークは、機械学習に使用される計算モデルであり、重み付き接続を有する層に編成されたノードから構成される。ニューラルネットワークをトレーニングすることは、複数のトレーニング例を使用し、各例は入力および所望の出力であり、一連の反復ラウンドにわたって、ニューラルネットワークが所与の入力に対して所望の出力を提供する可能性を増加させる層間の接続の重み値を決定する。各トレーニングラウンドの間、当該重みは、誤った出力値に対処するように調整される。トレーニングされると、ニューラルネットワークは、提供された入力に基づいて出力を予測するために使用され得る。 Supplement The anchor identification engine 124 may include a machine learning module capable of recognizing at least some type of entity in the image. For example, a machine learning module may include a neural network system. A neural network is a computational model used for machine learning and consists of nodes organized in layers with weighted connections. Training a neural network uses multiple training examples, each of which is an input and a desired output, allowing the neural network to provide the desired output for a given input over a series of iterative rounds. Determine the weight value of the connection between layers that increases the sex. During each training round, the weights are adjusted to deal with incorrect output values. Once trained, neural networks can be used to predict outputs based on the inputs provided.
ある実施形態では、ニューラルネットワークシステムは、畳み込みニューラルネットワーク(CNN)を含む。畳み込みニューラルネットワーク(CNN)は、ニューラルネットワークの層のうちの少なくとも1つが畳み込み層であるニューラルネットワークである。畳み込み層は、前の層の値のサブセットにカーネル関数を適用することに基づいて層の値が計算される層である。ニューラルネットワークをトレーニングすることは、トレーニング例に基づいてカーネル関数の重みを調整することを含み得る。典型的には、同じカーネル関数が、畳み込み層における各値を計算するために使用され得る。したがって、畳み込み層をトレーニングしながら学習しなければならない重みは、ニューラルネットワークにおいて完全に接続された層(例えば、ある層内の各値が、前の層内の各値の独立して調整されて重み付けされた組み合わせとして計算される層)よりもはるかに少ない。畳み込み層の重みは通常より少ないため、畳み込み層をトレーニングすることおよび使用することは、同等の完全に接続された層よりも少ないメモリ、プロセッササイクル、および時間を必要とし得る。 In certain embodiments, the neural network system comprises a convolutional neural network (CNN). A convolutional neural network (CNN) is a neural network in which at least one of the layers of the neural network is a convolutional layer. A convolution layer is a layer in which the values of a layer are calculated based on applying kernel functions to a subset of the values of the previous layer. Training a neural network can include adjusting the weights of kernel functions based on training examples. Typically, the same kernel function can be used to calculate each value in the convolution layer. Therefore, the weights that must be learned while training the convolutional layer are such that each value in a fully connected layer in the neural network (eg, each value in one layer is independently adjusted for each value in the previous layer). Much less than layers calculated as weighted combinations). Because the convolution layer weighs less than usual, training and using the convolution layer can require less memory, processor cycles, and time than an equivalent fully connected layer.
補足アンカー識別エンジン124が画像内のエンティティまたはエンティティタイプを認識した後、エンティティまたはエンティティタイプのテキスト記述が生成され得る。加えて、エンティティまたはエンティティタイプは、補足アンカーにマッピングされ得る。ある実施形態では、補足アンカーは、1つまたは複数のデジタル補足に関連付けられる。 After the anchor identification engine 124 recognizes an entity or entity type in the image, a text description of the entity or entity type can be generated. In addition, entities or entity types can be mapped to supplemental anchors. In certain embodiments, the supplemental anchor is associated with one or more digital supplements.
ある実施形態では、補足アンカー識別エンジン124は、認識されたアンカーの信頼スコアを決定する。より高い信頼スコアは、より低い信頼スコアが決定された場合よりも、画像からのコンテンツ(例えば、画像、抽出されたテキスト、バーコード、QRコード(登録商標))が、決定されたアンカーに関連付けられる可能性が高いことを示し得る。 In certain embodiments, the supplemental anchor identification engine 124 determines the confidence score of the recognized anchor. A higher confidence score associates content from the image (eg, image, extracted text, barcode, QR code®) with the determined anchor than if a lower confidence score was determined. It can be shown that it is likely to be.
図1の例は、クライアントコンピューティングデバイス102上のアプリケーション122の構成要素として補足アンカー識別エンジン124を示すが、ある実施形態は、検索サーバ152上の補足アンカー識別エンジンを含む。例えば、クライアントコンピューティングデバイス102は、カメラアセンブリ112によって取得された画像を検索サーバ152に送信することができ、検索サーバ152は、画像内の補足アンカーを識別し得る。
The example of FIG. 1 shows the supplementary anchor identification engine 124 as a component of application 122 on the
ある実施形態では、補足アンカー識別エンジン124は、潜在的な補足アンカーを識別する。例えば、補足アンカー識別エンジン124は、画像内の様々なエンティティを識別(認識)し得る。次いで、認識されたエンティティの識別子は、検索サーバ152に送信されることができ、検索サーバ152は、エンティティのいずれかが任意の補足アンカーに関連付けられているかどうかを決定し得る。ある実施形態では、検索サーバ152は、識別されたエンティティが補足アンカーでない場合であっても、識別されたエンティティをコンテキスト情報として使用し得る。 In certain embodiments, the supplemental anchor identification engine 124 identifies potential supplementary anchors. For example, the supplemental anchor identification engine 124 may identify (recognize) various entities in the image. The identifier of the recognized entity can then be sent to the search server 152, which may determine if any of the entities are associated with any supplemental anchor. In certain embodiments, the search server 152 may use the identified entity as contextual information even if the identified entity is not a supplemental anchor.
デジタル補足検索エンジン126は、デジタル補足を検索する。例えば、デジタル補足検索エンジン126は、補足アンカー識別エンジン124によって識別された補足アンカーに関連付けられるデジタル補足を検索し得る。ある実施形態では、デジタル補足検索エンジン126は、検索サーバ152またはデジタル補足サーバ172からデジタル補足を検索する。 The digital supplement search engine 126 searches for digital supplements. For example, the digital supplement search engine 126 may search for the digital supplement associated with the supplement anchor identified by the supplement anchor identification engine 124. In certain embodiments, the digital supplement search engine 126 searches for digital supplements from search server 152 or digital supplement server 172.
例えば、補足アンカーが識別された後、デジタル補足検索エンジン126は、識別された補足アンカーに関連付けられる1つまたは複数のデジタル補足を検索し得る。デジタル補足検索エンジン126は、画像(または画像内の補足アンカーまたはエンティティの識別子)を含む画像コンテンツクエリを生成し得、その画像コンテンツクエリを検索サーバ152に送信し得る。画像コンテンツクエリはまた、クライアントコンピューティングデバイス102の位置のようなコンテキスト情報を含み得る。ある実施形態では、名前、画像、または説明のような、デジタル補足に関連するデータが取り出されて、(例えば、ユーザインターフェイスエンジン130によって)ユーザに提示される。複数のデジタル補足が提示される場合、ユーザは、ユーザインターフェイスエンジン130によって生成されたユーザインターフェイスを介して、デジタル補足のうちの1つを選択し得る。
For example, after the supplement anchor has been identified, the digital supplement search engine 126 may search for one or more digital supplements associated with the identified supplement anchor. The digital supplemental search engine 126 may generate an image content query containing an image (or an identifier of a supplementary anchor or entity within the image) and may send the image content query to the search server 152. The image content query may also include contextual information such as the location of the
デジタル補足提示エンジン128は、デジタル補足をクライアントコンピューティングデバイス102上に提示するか、または提示させる。ある実施形態では、デジタル補足提示エンジン128は、クライアントコンピューティングデバイスに他のアプリケーション140のうちの1つを開始させる。ある実施形態では、デジタル補足提示エンジン128は、情報またはコンテンツを表示させる。例えば、デジタル補足提示エンジン128は、ユーザインターフェイスエンジン130に、クライアントコンピューティングデバイス102によって表示されるデジタル補足からの情報またはコンテンツを含むユーザインターフェイスを生成させ得る。ある実施形態では、デジタル補足提示エンジン128は、デジタル補足検索エンジン126がデジタル補足を検索することによってトリガされる。次いで、デジタル補足提示エンジン128は、デジタル補足に関連付けられるコンテンツを表示するために、ディスプレイデバイス108をトリガし得る。ある実施形態では、デジタル補足提示エンジン128は、デジタル補足検索エンジン126がデジタル補足を検索する時とは異なる時にデジタル補足を表示させる。例えば、デジタル補足は、第1の時点で画像コンテンツクエリに応答して検索されてもよく、また、デジタル補足は、第2の時点で提示され得る。例えば、デジタル補足は、第1の時間(例えば、ユーザがカタログを見ている間、または店にいる間である)にカタログまたは店からの家財道具または家具の画像に基づく画像コンテンツクエリに応答して検索され得る。家財道具または家具のARコンテンツを含むデジタル補足は、第2の時間(例えば、ユーザが家財道具または家具が設置され得る部屋にいる間)に提示され得る。
The digital supplement presentation engine 128 presents or causes the digital supplement to be presented or presented on the
ユーザインターフェイスエンジン130は、ユーザインターフェイスを生成する。ユーザインターフェイスエンジン130はまた、クライアントコンピューティングデバイス102に、生成されたユーザインターフェイスを表示させることもできる。生成されたユーザインターフェイスは、例えば、デジタル補足からの情報またはコンテンツを表示し得る。ある実施形態では、ユーザインターフェイスエンジン130は、各々がデジタル補足に関連付けられる複数のユーザ作動可能な制御を含むユーザインターフェイスを生成する。例えば、ユーザは、(例えば、タッチスクリーン上のコントロールに触れること、マウスまたは別の入力装置を使用してコントロールをクリックすること、またはそうでなければコントロールを作動させることによって)、ユーザ作動可能な制御のうちの1つを作動させ得る。
The
検索サーバ152は、コンピューティングデバイスである。検索サーバ152は、画像コンテンツクエリのような検索要求に応答し得る。当該応答は、画像コンテンツクエリに潜在的に関連する1つまたは複数のデジタル補足を含み得る。ある実施形態では、検索サーバ152は、メモリ160と、プロセッサアセンブリ154と、通信モジュール156とを含む。メモリ160は、コンテンツクローラ162、デジタル補足検索エンジン164、および、デジタル補足データ記憶部166を含み得る。
The search server 152 is a computing device. The search server 152 can respond to a search request such as an image content query. The response may include one or more digital supplements that are potentially related to the image content query. In certain embodiments, the search server 152 includes memory 160, processor assembly 154, and communication module 156. The memory 160 may include a content crawler 162, a digital
コンテンツクローラ162は、デジタル補足を識別するためにネットワークアクセス可能なリソースをクローリングし得る。例えば、コンテンツクローラ162は、デジタル補足サーバ172によって提供されるウェブページのような、インターネットを介してアクセス可能なウェブページにアクセスし得る。ネットワークアクセス可能なリソースをクローリングすることは、ウェブサーバからリソースを要求することと、当該リソースの少なくとも一部分を分析することとを含み得る。デジタル補足は、デジタル補足に関する情報を提供するXMLまたはJSONデータのような、ネットワークアクセス可能なリソースによって提供されるメタデータに基づいて識別され得る。ある実施形態では、クローラは、以前にクロールされたネットワークアクセス可能なリソースからリンクを抽出することに基づいて、ネットワークアクセス可能なリソースを識別する。コンテンツクローラ162はまた、ユーザによって提出された入力の受信に基づいて、クロールすべきネットワークアクセス可能なリソースを識別し得る。例えば、ユーザは、ウェブフォームまたはアプリケーションプログラミングインターフェイス(API)を介して、デジタル補足を含むネットワークアクセス可能なリソースにURL(または他の情報)を提出し得る。ある実施形態では、コンテンツクローラ162は、識別されたデジタル補足のインデックスを生成する。コンテンツクローラ162はまた、関連性スコアまたは人気(名声)スコアのような、デジタル補足に関連付けられるスコアを生成し得る。 The content crawler 162 may crawl network accessible resources to identify digital supplements. For example, the content crawler 162 may access a web page accessible via the Internet, such as a web page provided by the digital supplement server 172. Crawling a network-accessible resource can include requesting a resource from a web server and analyzing at least a portion of that resource. Digital supplements can be identified based on metadata provided by network-accessible resources, such as XML or JSON data that provides information about digital supplements. In one embodiment, the crawler identifies network-accessible resources based on extracting links from previously crawled network-accessible resources. The content crawler 162 may also identify network accessible resources to crawl based on the receipt of input submitted by the user. For example, a user may submit a URL (or other information) to a network accessible resource, including digital supplements, via a web form or application programming interface (API). In certain embodiments, the content crawler 162 produces an index of identified digital supplements. Content crawlers 162 may also generate scores associated with digital supplements, such as relevance scores or popularity (fame) scores.
デジタル補足検索エンジン164は、検索クエリを受信し、1つまたは複数の潜在的に関連するデジタル補足を含み得る応答を生成する。例えば、デジタル補足検索エンジン164は、クライアントコンピューティングデバイス102から画像コンテンツクエリを受信し得る。画像コンテンツクエリは、画像を含み得る。デジタル補足検索エンジン164は、画像内の補足アンカーを識別し得、識別された補足アンカーに基づいて、関連付けられた、または潜在的に関連するデジタル補足を識別し得る。デジタル補足検索エンジン164は、デジタル補足または当該デジタル補足にアクセスするために使用され得る情報を含む応答をクライアントコンピューティングデバイス102に送信し得る。ある実施形態では、デジタル補足検索エンジン164は、複数のデジタル補足に関連付けられる情報を返し得る。例えば、デジタル補足のリストは、クエリに対する応答に含まれ得る。当該リストは、補足アンカーへの関連性、人気、またはデジタル補足の他の特性に基づいて、順序付けされ得る。
The digital
画像コンテンツクエリは、例えば、カメラアセンブリ112によって取得された画像、または、カメラアセンブリ112によって取得された画像に関連付けられるテキストもしくは他のデータを含み得る。画像コンテンツクエリはまた、クライアントコンピューティングデバイス102の位置またはクライアントコンピューティングデバイス102のユーザの識別子のような他の情報を含み得る。ある実施形態では、検索サーバ152は、(例えば、もし、ユーザが、当該ユーザの位置に関する情報をユーザのアカウントに関連付ける位置サービスをクライアントコンピューティングデバイス102上で有効にした場合)、ユーザ識別子からクライアントコンピューティングデバイス102の予想される位置を決定し得る。
The image content query may include, for example, the image captured by the
デジタル補足データ記憶部166は、デジタル補足に関する情報を記憶する。ある実施形態では、デジタル補足データ記憶部166は、デジタル補足のインデックスを含む。例えば、インデックスは、コンテンツクローラ162によって生成され得る。デジタル補足検索エンジン164は、検索クエリに応答するためにインデックスを使用し得る。
The digital supplement data storage unit 166 stores information related to the digital supplement. In certain embodiments, the digital supplemental data storage unit 166 includes a digital supplementary index. For example, the index can be generated by the content crawler 162. Digital
デジタル補足サーバ172は、コンピューティングデバイスである。デジタル補足サーバ172は、デジタル補足を提供する。ある実施形態では、デジタル補足サーバ172は、メモリ180と、プロセッサアセンブリ174と、通信モジュール176とを含む。メモリ180は、デジタル補足182およびメタデータ184を含み得る。ある実施形態では、メモリ180はまた、必ずしもデジタル補足ではないウェブページのような他のネットワークアクセス可能なリソースを含み得る。たとえば、メモリ180は、1つまたは複数のデジタル補足に関する詳細およびそれらのデジタル補足にアクセスする方法を提供するためのメタデータを含むウェブページを記憶し得る。さらに、メモリ180は、例えば、ウェブページおよびデジタル補足のようなネットワークアクセス可能なリソースを用いてHTTP要求のような要求に応答する、ウェブサーバのようなリソースサービス提供エンジンを含み得る。
The digital supplementary server 172 is a computing device. Digital supplement server 172 provides digital supplement. In certain embodiments, the digital supplement server 172 includes a memory 180, a processor assembly 174, and a
デジタル補足182は、ユーザの周囲の物理的環境において何かに対する補足として提供され得る任意の種類のコンテンツである。デジタル補足182はまた、(例えば、ユーザ周辺の以前の物理的環境の)格納された画像を補足できる任意のタイプのコンテンツを含み得る。例えば、デジタル補足は、画像、当該画像内で識別されるオブジェクトもしくは製品、または、場所のような補足アンカーに関連付けられ得る。デジタル補足182は、1つまたは複数の画像、オーディオコンテンツ、テキストデータ、映像、ゲーム、データファイル、アプリケーション、または構造化されたテキスト文書を含み得る。構造化されたテキスト文書の例は、ハイパーテキストマークアップ言語(HTML)文書、XML文書、および他の種類の構造化されたテキスト文書を含む。 Digital supplement 182 is any kind of content that can be provided as a supplement to something in the physical environment around the user. The digital supplement 182 may also include any type of content that can supplement the stored image (eg, in the previous physical environment around the user). For example, a digital supplement can be associated with a supplement anchor such as an image, an object or product identified within the image, or a location. The digital supplement 182 may include one or more images, audio content, text data, video, games, data files, applications, or structured text documents. Examples of structured text documents include hypertext markup language (HTML) documents, XML documents, and other types of structured text documents.
デジタル補足182は、アプリケーションを起動させることができ、そのアプリケーションに対するパラメータを定義し得る。デジタル補足182はまた、要求をサーバに送信させ(例えば、HTTP要求)、その要求に対するパラメータを定義し得る。ある実施形態では、デジタル補足182は、購入を完了するためのワークフローのような、活動を完了するためのワークフローとして開始する。例えば、デジタル補足182は、特定の商品をユーザのショッピングカートに追加し、クーポンコードを追加し、そして、購入確認ページを検索するサーバに、HTTP要求を送信し得る。 Digital Supplement 182 can launch an application and define parameters for that application. The digital supplement 182 can also send a request to a server (eg, an HTTP request) and define parameters for that request. In certain embodiments, the digital supplement 182 begins as a workflow for completing an activity, such as a workflow for completing a purchase. For example, Digital Supplement 182 may add a particular item to the user's shopping cart, add a coupon code, and send an HTTP request to a server that searches the purchase confirmation page.
メタデータ184は、デジタル補足を記述するデータである。メタデータ184は、デジタル補足サーバ172によって提供される又は他の場所に提供される、1つまたは複数のデジタル補足を記述し得る。デジタル補足のためのメタデータ184は、以下のうちの1つ以上を含み得る:タイプインジケータ、アンカーインジケータ、名前、説明、プレビュースニペットまたは抜粋、関連する画像、デジタル補足に対するURLのようなリンク、およびデジタル補足に関連付けられるアプリケーションの識別子。メタデータはまた、発行者名、発行者の説明、および発行者に関連付けられる画像またはアイコンのような、デジタル補足の発行者に関する情報を含み得る。ある実施形態では、メタデータはまた、デジタル補足に関するコンテキスト情報、またはデジタル補足を提供するために満足しなければならないコンテキスト情報を含む。例えば、メタデータは、デジタル補足にアクセスするために満たされなければならない条件(例えば、地理的条件、クライアントコンピューティングデバイス要件、必要なアプリケーション)を含み得る。例示的なコンテキスト情報は、位置、画像内で識別されるエンティティ、または画像内で識別される複数のエンティティ(例えば、いくつかのデジタル補足は、画像内で認識されるエンティティの組み合わせを必要とする場合がある)を含む。認識されたエンティティは、補足アンカーであり得る。ある実施形態では、認識されたエンティティは、アンカーを補足せず、代わりにコンテキスト情報を提供する。メタデータ184はまた、デジタル補足に関連付けられる補足アンカー(例えば、テキスト、コード、エンティティ、またはエンティティのタイプ)を含み得る。 Metadata 184 is data that describes a digital supplement. Metadata 184 may describe one or more digital supplements provided by the digital supplement server 172 or provided elsewhere. Metadata 184 for digital supplements may include one or more of the following: type indicators, anchor indicators, names, descriptions, preview snippets or excerpts, related images, links such as URLs to digital supplements, and The application identifier associated with the digital preview. Metadata may also include information about the publisher of the digital supplement, such as the publisher name, the publisher description, and the image or icon associated with the publisher. In certain embodiments, the metadata also includes contextual information about the digital supplement, or contextual information that must be satisfied in order to provide the digital supplement. For example, the metadata may include conditions that must be met in order to access digital supplements (eg, geographic conditions, client computing device requirements, required applications). Illustrative contextual information requires a combination of entities identified in the image, or entities identified in the image, or multiple entities identified in the image (eg, some digital supplements require a combination of entities recognized in the image. In some cases). The recognized entity can be a supplementary anchor. In some embodiments, the recognized entity does not supplement the anchor and instead provides contextual information. Metadata 184 may also include supplemental anchors (eg, text, code, entities, or types of entities) associated with digital supplements.
メタデータ184は、様々な形式で格納され得る。ある実施形態では、メタデータ184はデータベースに格納される。メタデータ184は、XMLファイル、JSONファイル、または他のフォーマットファイルとして格納され得る。ある実施形態では、デジタル補足サーバ172は、データベースからメタデータ184を取り出し、XML、JSONとしてメタデータ184をフォーマットし、またはそうでなければ、クライアントまたは検索サーバ152からの要求に対する応答を提供する。例えば、検索サーバ152は、デジタル補足データ記憶部166に記憶され、かつ、クライアントコンピューティングデバイス102からの検索要求に応答するために使用されるデータを生成するために、メタデータ184にアクセスし得る。
Metadata 184 can be stored in various formats. In certain embodiments, the metadata 184 is stored in a database. Metadata 184 can be stored as an XML file, JSON file, or other format file. In some embodiments, the digital supplement server 172 retrieves the metadata 184 from the database and formats the metadata 184 as XML, JSON, or otherwise provides a response to a request from the client or search server 152. For example, the search server 152 may access the metadata 184 to generate data stored in the digital supplementary data storage unit 166 and used to respond to search requests from the
通信モジュール106は、検索サーバ152またはデジタル補足サーバ172のような、他のコンピューティングデバイスと通信するための1つまたは複数のデバイスを含む。通信モジュール106は、ネットワーク190のような無線または有線ネットワークを介して通信し得る。検索サーバ152の通信モジュール156およびデジタル補足サーバ172の通信モジュール176は、通信モジュール106と同様であり得る。
Communication module 106 includes one or more devices for communicating with other computing devices, such as search server 152 or digital supplement server 172. The communication module 106 may communicate via a wireless or wired network such as network 190. The communication module 156 of the search server 152 and the
ディスプレイデバイス108は、例えば、LCD(液晶ディスプレイ)画面、LED(発光ダイオード)画面、OLED(有機発光ダイオード)画面、タッチ画面、または画像もしくは情報をユーザに表示するための任意の他の画面もしくはディスプレイを含み得る。ある実施形態では、ディスプレイデバイス108は、ユーザの目の一部に光を投影するように構成された光プロジェクタを含む。 The display device 108 may be, for example, an LCD (liquid crystal display) screen, an LED (light emitting diode) screen, an OLED (organic light emitting diode) screen, a touch screen, or any other screen or display for displaying an image or information to the user. May include. In certain embodiments, the display device 108 includes an optical projector configured to project light onto a portion of the user's eyes.
メモリ120は、1つまたは複数の非一時的コンピュータ読み取り可能な記憶媒体を含み得る。メモリ120は、取得された画像に基づいて画像コンテンツクエリを生成し、画像コンテンツクエリを送信し、当該画像コンテンツクエリに対する応答を受信し、画像コンテンツクエリに対する応答において識別されるデジタル補足を提示するために、のように、本明細書で説明される技術を実施するためにクライアントコンピューティングデバイス102によって使用可能な命令およびデータを記憶し得る。検索サーバ152のメモリ160およびデジタル補足サーバ172のメモリ180は、メモリ120と同様であり得、それぞれ、検索サーバ152およびデジタル補足サーバ172の技術を実施するために使用可能なデータ命令を記憶し得る。
Memory 120 may include one or more non-temporary computer-readable storage media. The memory 120 generates an image content query based on the acquired image, sends an image content query, receives a response to the image content query, and presents a digital supplement identified in the response to the image content query. , Such as, the instructions and data that can be used by the
プロセッサアセンブリ104は、ビジュアルサーチのためのデジタル補足関連付けおよび検索に関連付けられる様々なタスクを実行するために、メモリ120によって格納された命令のような、命令を実行可能な1つまたは複数のデバイスを含む。たとえば、プロセッサアセンブリ104は、中央処理ユニット(CPU)および/またはグラフィックプロセッサユニット(GPU)を含み得る。たとえば、GPUが存在する場合、ユーザインターフェイスの生成および表示、またはデジタル補足の部分の表示のような、いくつかの画像/ビデオレンダリングタスクは、CPUからGPUにオフロードされ得る。ある実施形態では、いくつかの画像認識タスクはまた、CPUからGPUにオフロードされ得る。
図1は示さないが、ある実施形態は、ヘッドマウンテッドディスプレイデバイス(HMD)を含む。HMDは、クライアントコンピューティングデバイス102とは別個のデバイスであってもよく、または、クライアントコンピューティングデバイス102は、HMDを含み得る。ある実施形態では、クライアントコンピューティングデバイス102は、ケーブルを介してHMDと通信する。例えば、クライアントコンピューティングデバイス102は、映像信号および/またはオーディオ信号をHMDに送信して、ユーザに表示することができ、HMDは、動き、位置、および/または、向き情報をクライアントコンピューティングデバイス102に送信し得る。
Although not shown in FIG. 1, certain embodiments include a head mounted display device (HMD). The HMD may be a device separate from the
クライアントコンピューティングデバイス102はまた、ワイヤレス通信プロトコルを使用してクライアントコンピューティングデバイス102と通信するコントローラのような、様々なユーザ入力構成要素(図示しない)を含み得る。ある実施形態では、クライアントコンピューティングデバイス102は、有線接続(例えば、ユニバーサルシリアルバス(USB)ケーブル)を介して、または無線通信プロトコル(例えば、任意のWiFiプロトコル、任意のBlueToothプロトコル、Zigbee(登録商標)など)を介して、HMD(図示しない)と通信し得る。ある実施形態では、クライアントコンピューティングデバイス102は、HMDの構成要素であり、HMDのハウジング内に収容され得る。
The
ネットワーク190は、インターネット、ローカルエリアネットワーク(LAN)、ワイヤレスローカルエリアネットワーク(WLAN)、および/または任意の他のネットワークであり得る。クライアントコンピューティングデバイス102は、例えば、オーディオ/映像信号を受信でき、これは、一例の例示的な実施形態では、デジタル補足の一部として、ネットワークを介して提供され得る。
The network 190 can be the Internet, a local area network (LAN), a wireless local area network (WLAN), and / or any other network. The
図2は、クライアントコンピューティングデバイス102の実施形態がデジタル補足にアクセスしている例示的な物理的空間200の三人称視点である。この例では、物理的空間200はオブジェクト222を含む。ここで、オブジェクト222は、物理的空間200の壁上のアートワークである。オブジェクト222は、クライアントコンピューティングデバイス102のカメラアセンブリ112の視野204内に含まれる。
FIG. 2 is a third person view of an exemplary
例示的なユーザインターフェイス画面206も示されている。ユーザインターフェイス画面206は、例えば、クライアントコンピューティングデバイス102のユーザインターフェイスエンジン130によって生成され得る。ユーザインターフェイス画面206は、画像表示パネル208およびデジタル補足選択パネル210を含む。画像表示パネル208は、画像を表示する。例えば、画像表示パネル208は、クライアントコンピューティングデバイス102のカメラアセンブリ112からのリアルタイムフィードに対応する画像を示し得る。ある実施形態では、画像表示パネル208は、以前に取得された画像またはクライアントコンピューティングデバイス102のメモリ120から取り出された画像を示す。
An exemplary
ある実施形態では、ユーザインターフェイス画面206は、クライアントコンピューティングデバイス102のディスプレイデバイス上でユーザに提示される。ある実施形態では、ユーザインターフェイス画面206は、物理的空間の画像(または、コンピューティングデバイスのカメラによって取得されている映像フィード)上にそのようにオーバーレイされ得る。加えて、ユーザインターフェイス画面206は、ユーザによって装着されたHMDを使用して、ユーザの視野にわたってARコンテンツとして表示され得る。
In certain embodiments, the
画像表示パネル208はまた、画像に関連する注釈またはユーザインターフェイス要素を含み得る。例えば、画像表示パネル208は、画像内のオブジェクト(例えば、オブジェクト222)が補足アンカーとして認識されたというインジケータを含み得る。当該インジケータは、識別された補足アンカーに関連付けられるデジタル補足に関する情報にアクセスまたは閲覧するための、ユーザ作動可能コントロールを含み得る。ある状況では、画像表示パネル208に表示される画像は、補足アンカーとして認識される複数のオブジェクトを含んでもよく、画像表示パネル208は、それらの補足アンカーを識別するために画像を重ねる複数の注釈を含み得る。
The
補足アンカーは、クライアントコンピューティングデバイス102の補足アンカー識別エンジンによって認識され得る。ある実施形態では、補足アンカーは、画像を検索サーバ152に送信することによって識別される。次いで、検索サーバ152は、画像を分析し、当該画像内の補足アンカーを識別し得る。ある実施形態では、検索サーバ152は、補足アンカーに関連付けられる位置(たとえば、画像座標)または任意の識別されたオブジェクトのディメンジョンのうちの1つまたは複数を、クライアントコンピューティングデバイス102に送信し得る。次いで、クライアントコンピューティングデバイス102は、画像内の補足アンカー(または関連付けられたオブジェクト)を識別する注釈を示すためにユーザインターフェイス画面を更新し得る。ある実施形態では、クライアントコンピューティングデバイス102は、カメラアセンブリ112によって取得された映像ストリーム(たとえば、順次に取得された画像シーケンス)内の補足アンカー(または関連付けられたオブジェクト)の位置を追跡し得る(例えば、補足アンカー識別エンジン124は、検索サーバ152によって識別された補足アンカーを追跡し得る)。
The supplementary anchor may be recognized by the supplementary anchor identification engine of the
デジタル補足選択パネル210は、提示のためのデジタル補足をユーザが選択することを可能にする。例えば、デジタル補足選択パネル210は、各々がデジタル補足に関連付けられるユーザ作動可能コントロールを含むメニューを含み得る。この例では、デジタル補足選択パネル210は、各々が関連付けられたデジタル補足に関する情報を含む、ユーザ作動可能コントロール212およびユーザ作動可能コントロール214を含む。例えば、当該ユーザ作動可能コントロールは、検索サーバ152から受信され得る、名前(またはタイトル)、簡単な説明、および当該デジタル補足に関連付けられた画像のうちの1つまたは複数を表示し得る。ユーザ作動可能コントロール212またはユーザ作動可能コントロール214が作動すると、関連付けられたデジタル補足のコンテンツがユーザに提示され得る。デジタル補足をユーザに提示することは、クライアントコンピューティングデバイス102に、当該デジタル補足からの画像、映像、テキスト、他のコンテンツ、またはそれらの組み合わせを含むユーザインターフェイス画面を表示させることを含み得る。ある実施形態では、デジタル補足コンテンツは、画像またはカメラフィード上で画像表示パネル208上にオーバーレイとして表示される。デジタル補足コンテンツは、三次元の拡張現実コンテンツであり得る。
The digital
ある実施形態では、デジタル補足を提示することは、クライアントコンピューティングデバイス102にインストールされているアプリケーション(例えば、他のアプリケーション140の1つ)を起動することを含む。デジタル補足を提示することはまた、当該デジタル補足に関連付けられるURLに要求を送信することを含み得る。当該要求は、画像内で識別される製品またはオブジェクトの識別子のような、デジタル補足に関連付けられたパラメータを含み得る。ある実施形態では、画像コンテンツクエリからの画像(または他のコンテンツ)は、当該要求とともにパラメータを渡される。画像はまた、デジタル補足サーバ172に関連付けられたAPIを介して提供され得る。ある実施形態では、クライアントコンピューティングデバイス102は、画像をデジタル補足サーバ172に送信する。ある実施形態では、検索サーバ152は、画像をデジタル補足サーバ172に送信し得る。例えば、ユーザがデジタル補足を選択することに応答して、クライアントコンピューティングデバイス102は、選択のインジケータを検索サーバ152に送信でき、次いで、検索サーバ152は、対応するデジタル補足サーバに画像を送信し得る。クライアントコンピューティングデバイス102はまた、デジタル補足サーバ172が画像にアクセスするために使用できる検索サーバ152上の場所にURLを送信し得る。有益なことに、これらの実施は、当該クライアントコンピューティングデバイスが送信する必要があるデータの量を削減し得る。
In certain embodiments, presenting a digital supplement comprises launching an application installed on the client computing device 102 (eg, one of the other applications 140). Presenting a digital supplement may also include sending a request to the URL associated with the digital supplement. The request may include parameters associated with the digital supplement, such as the identifier of the product or object identified in the image. In certain embodiments, the image (or other content) from the image content query is passed a parameter with the request. The image may also be provided via the API associated with the digital supplement server 172. In one embodiment, the
ユーザ作動可能コントロール212に関連付けられたデジタル補足は、美術館からの情報のようなオブジェクト222についての情報を表示させ得る。ユーザ作動可能コントロール214に関連付けられたデジタル補足は、美術館に関連する情報を表示させ得る。例えば、デジタル補足の提示は、美術館ツアー上の停止場所を完了したとして印をつけさせ、次の停止場所の情報を表示させ得る。
A digital supplement associated with the user-enabled
図3は、本明細書で説明される実施形態に従う、デジタル補足のトリガを有効化する例示的な方法300の図である。この方法300は、例えば、検索サーバ152のコンテンツクローラ162によって実行されて、ユーザが画像コンテンツクエリに基づいてデジタル補足にアクセスすることを可能にし得る。 FIG. 3 is a diagram of an exemplary method 300 for enabling a digital supplement trigger according to an embodiment described herein. The method 300 may be performed, for example, by the content crawler 162 of the search server 152 to allow the user to access the digital supplement based on the image content query.
動作302において、デジタル補足を指定するデータが受信される。当該データは、デジタル補足およびデジタル補足が提供されるべき状況を識別し得る。デジタル補足を指定するデータは、様々な方法で受信され得る。例えば、デジタル補足を指定するデータは、デジタル補足に関するメタデータを含むウェブページのようなネットワークアクセス可能なリソースから受信され得る。デジタル補足を指定するデータはまた、例えば、検索サーバ152によって提供されるAPIまたはフォームを介して受信され得る。デジタル補足を指定するデータはまた、メモリロケーションまたはデータストアから受信され得る。
In
デジタル補足に関するデータは、デジタル補足にアクセスするためにクライアントコンピューティングデバイスによって使用可能なアクセスデータを含み得る。例えば、アクセスデータは、デジタル補足のURLと、そのURLに渡されるパラメータとを含み得る。アクセスデータはまた、アプリケーションの識別子および当該アプリケーションのためのパラメータを含み得る。デジタル補足に関するデータはまた、デジタル補足に関する記述データを含み得る。当該記述データは、デジタル補足に関する情報をユーザに(例えば、ユーザがデジタル補足を選択し得るメニュー上で)提示するためにクライアントコンピューティングデバイスによって使用され得る。当該記述データは、たとえば、名前(またはタイトル)、説明、出版社の名前、および画像を含み得る。デジタル補足に関するデータはまた、補足アンカーの識別子を含み得る。 The data about the digital supplement may include access data that can be used by the client computing device to access the digital supplement. For example, the access data may include a digital supplement URL and parameters passed to that URL. Access data may also include the identifier of the application and the parameters for that application. Data on digital supplements may also include descriptive data on digital supplements. The descriptive data can be used by a client computing device to present information about digital supplements to the user (eg, on a menu where the user can select digital supplements). The descriptive data may include, for example, a name (or title), a description, a publisher's name, and an image. Data on digital supplements may also include the identifier of the supplement anchor.
動作304において、受信データに基づくデータ構造インスタンスが生成される。データ構造は、例えば、データベース内のレコードであり得る。データベースはリレーショナルデータベースであってもよく、データ構造インスタンスは、補足アンカーに関連付けられた1つまたは複数のレコードに(たとえば、外のキーを介して)リンクされ得る。
In
動作306において、データ構造インスタンスを生成した後、画像コンテンツクエリによるデジタル補足の検索が可能になる。例えば、データ構造インスタンスに関連付けられたデータベースフィールドは、デジタル補足検索エンジン164が、当該関連付けられたデジタル補足にアクセスして返すことができるように、アクティブに設定され得る。ある実施形態では、デジタル補足のトリガは、データベースのレコードを保存またはコミットすることを含み得る。ある実施形態では、デジタル補足の検索を可能にすることは、クライアントコンピューティングデバイスによるデジタル補足のトリガを有効化することを含む。例えば、インスタンスが生成された後、デジタル補足は、検索に応答してクライアントコンピューティングデバイスに戻され、クライアントコンピューティングデバイスによってアクティブにされ又は提示され得る。
In
図4は、本明細書で説明される実施形態に従う、デジタル補足のトリガを有効化する例示的な方法400の図である。この方法400は、例えば、検索サーバ152のコンテンツクローラ162によって実行されて、ユーザが画像コンテンツクエリに基づいてデジタル補足にアクセスすることを可能にし得る。 FIG. 4 is a diagram of an exemplary method 400 for enabling a digital supplement trigger, according to an embodiment described herein. The method 400 may be performed, for example, by the content crawler 162 of the search server 152 to allow the user to access the digital supplement based on the image content query.
動作402において、ネットワークアクセス可能なリソースが分析される。ある実施形態では、ネットワークアクセス可能なリソースは、たとえば、デジタル補足サーバ172によって提示されるウェブページである。ある実施形態では、一組のネットワークアクセス可能なリソースが分析される。当該一組のネットワークアクセス可能なリソースは、フォームまたはAPIを介した提出に基づいて生成され得る。ある実施形態では、当該一組のネットワークアクセス可能なリソースは、URLを識別するために他のネットワークアクセス可能なリソースをクローリングすることによって生成され得る。このクローリングプロセスは、再帰的に実行され得る。
In
動作404において、ネットワークアクセス可能なリソース内のデジタル補足に関連付けられるメタデータが識別される。ある実施形態では、ネットワークアクセス可能なリソースは、デジタル補足に関連付けられるメタデータのインジケータを含み得る。例えば、ネットワークアクセス可能なリソースは、メタデータを含むネットワークアクセス可能なリソースの一部分を識別するタグを含み得る。当該タグは、特定のタイプまたは属性を有するXMLタグであり得る。当該タグは、メタデータを含むJSONデータ構造を含むスクリプトタグのようなHTMLタグであり得る。
In
動作406において、メタデータに基づくデジタル補足データ構造インスタンスが生成される。動作406は、動作304と同様であり得る。
In
動作408において、画像コンテンツクエリが受信される。画像コンテンツクエリは、例えば、クライアントコンピューティングデバイス102のようなクライアントコンピューティングデバイスによって送信され得る。ある実施形態では、画像コンテンツクエリは画像を含む。画像コンテンツクエリはまた、画像を記述するテキストデータを含み得る。たとえば、テキストデータは、当該クライアントコンピューティングデバイスのカメラアセンブリによって取得された画像内の補足アンカーの識別子を含み得る。ある実施形態では、画像コンテンツクエリはまた、当該クライアントコンピューティングデバイスの位置またはクライアントコンピューティングデバイスに関連付けられたユーザアカウントの識別子のような、他の情報を含む。
In
動作410において、複数のデジタル補足データ構造インスタンスは、画像コンテンツクエリに基づいて識別される。ある実施形態では、補足アンカーは、画像コンテンツクエリで提供される画像内で識別される。次いで、補足アンカーは、関連付けられたデジタル補足についてインデックスまたはデータベースに問い合わせるために使用され得る。ある実施形態では、クエリとともに提供される他のデータは、クライアントコンピューティングデバイスの位置またはユーザアカウントに関連付けられた情報のような、デジタル補足も識別するために使用され得る。ある実施形態では、複数の補足アンカーは、関連付けられる補足アンカーを識別するために使用され得る。
In
動作412において、複数のデジタル補足データ構造インスタンスの順序付けが、決定される。当該順序付けは、デジタル補足に関連付けられる様々なスコア、または画像コンテンツクエリに対するデジタル補足の関連性に基づき得る。ある実施形態では、画像コンテンツクエリに対するデジタル補足の関連性に対応する関連性スコアは、複数のデジタル補足データ構造インスタンスを順序付けるために使用され得る
関連性スコアは、デジタル補足の内容、当該デジタル補足にリンクするネットワークアクセス可能なリソース(または、デジタル補足に関連付けられたネットワークアクセス可能なリソース)のコンテンツ、リンクテキスト、または、他のネットワークアクセス可能なリソース上のデジタル補足へのリンクの近くのコンテンツのうちの1つまたは複数のような、複数の因子から決定され得る。
In
スコアはまた、人気メトリックに基づき得る。名声メトリックは、人気メトリックの一例である。当該名声メトリックは、何個の他のネットワークリソースがデジタル補足にリンクするかと、それらの他のネットワークアクセス可能なリソースの名声スコアとの組み合わせに基づき得る。ある実施形態では、人気スコアは、デジタルリソースがどのくらい頻繁に選択されるか又は選択されたかに基づき得る。ある実施形態では、人気スコアは、デジタルリソースが画像コンテンツクエリのためにどのくらい頻繁に選択されるかに対応し得る。 Scores can also be obtained based on popularity metrics. The fame metric is an example of a popular metric. The fame metric may be based on a combination of how many other network resources link to the digital supplement and the fame scores of those other network accessible resources. In certain embodiments, the popularity score may be based on how often or how often digital resources are selected. In certain embodiments, the popularity score may correspond to how often digital resources are selected for image content queries.
スコアは、決定されてもよく、又は、データストアもしくはAPIから取り出され得る。ある実施形態では、APIは、デジタル補足のスコアを取り出すためにアクセスされる。例えば、スコアは、補足アンカーに基づく検索用語に関してデジタルリソースの関連性および/または人気を決定した検索エンジンから検索され得る。 Scores may be determined or may be retrieved from a data store or API. In certain embodiments, the API is accessed to retrieve the digital supplemental score. For example, scores can be searched by search engines that determine the relevance and / or popularity of digital resources with respect to search terms based on supplemental anchors.
複数のデジタル補足データ構造はまた、特定のユーザ(例えば、クライアントコンピューティングデバイスのユーザ)による使用頻度または当該特定のユーザによる最近の使用(recency)に基づいて順序付けされ得る。ある実施形態では、複数のデジタル補足データ構造は、ランダムに順序付けられる。 Multiple digital supplemental data structures may also be ordered based on frequency of use by a particular user (eg, a user of a client computing device) or recent recency by that particular user. In certain embodiments, the plurality of digital supplemental data structures are randomly ordered.
動作414において、画像コンテンツクエリは、複数のデジタル補足データ構造インスタンスに基づいて応答される。例えば、複数のデジタル補足データ構造インスタンスに関連付けられる情報は、動作412において決定された順序でクライアントコンピューティングデバイスに送信され得る。ある実施形態では、当該情報は、デジタル補足のユーザ選択を受信するように構成されたメニューまたは別のタイプのユーザインターフェイス内に示され得る記述データを含む。当該情報はまた、デジタル補足にアクセスまたは提示するためにクライアントコンピューティングデバイスによって使用され得るアクセスデータを含み得る。
In
図5は、本明細書で説明される実施形態に従う、デジタル補足を検索し提示する例示的な方法500の図である。この方法500は、画像コンテンツクエリに基づいてデジタル補足を識別して当該デジタル補足にアクセスするために、例えば、クライアントコンピューティングデバイス102のアプリケーション122によって実行され得る。
FIG. 5 is a diagram of an exemplary method 500 for retrieving and presenting digital supplements according to embodiments described herein. The method 500 may be performed, for example, by application 122 of the
動作502において、画像に基づく画像コンテンツクエリは、サーバコンピューティングデバイス(例えば、検索サーバ152)に送信される。例えば、画像は、クライアントコンピューティングデバイス102のカメラアセンブリ112で取得され得る。当該画像はまた、カメラアセンブリ112によって以前に取得された画像のような記憶された画像であり得る。ある実施形態では、画像コンテンツクエリは、画像のみを含む。ある実施形態では、画像コンテンツクエリは、追加情報を含む。たとえば、画像コンテンツクエリは、クライアントコンピューティングデバイス102の位置またはクライアントコンピューティングデバイス102のユーザに関連付けられたアカウントの識別子のような情報を含み得る。アプリケーション122はまた、(例えば、補足アンカー識別エンジン124を用いて)画像内のアンカーを識別し得る。画像コンテンツクエリは、識別されたアンカーの識別子(例えば、テキスト、数字、または他の種類の識別子)を含み得る。少なくともある実施形態では、画像コンテンツクエリは、画像を含まない。
In
ある実施形態では、画像コンテンツクエリをサーバに送信することは、APIを呼び出すことを含む。ある実施形態では、画像コンテンツクエリをサーバに送信することは、サーバによって提供されるAPIを呼び出すことを含む。ある実施形態では、画像コンテンツクエリをサーバに送信することは、HTTPプロトコルを使用して(例えば、GETリクエストまたはPOSTリクエストを提出して)フォームを提出することを含む。 In certain embodiments, sending an image content query to a server involves calling an API. In certain embodiments, sending an image content query to a server involves invoking an API provided by the server. In certain embodiments, sending an image content query to a server involves submitting a form using the HTTP protocol (eg, submitting a GET or POST request).
動作504において、デジタル補足を識別する画像コンテンツクエリに対する応答が受信される。当該応答は、検索サーバ152からネットワーク190を介して受信され得る。応答は、検索サーバ152によって画像コンテンツクエリに基づいて識別された1つまたは複数のデジタル補足を含み得る。例えば、応答は、デジタル補足に関連付けられたデータのアレイを含み得る。ある実施形態では、デジタル補足に関連付けられたデータは、ユーザが選択するためのデジタル補足オプションを提示するために使用され得る記述データを含み得る。例えば、記述データは、名前、短い説明、発行者名、および画像を含み得る。データはまた、URLを介した要求に含める当該URLおよびパラメータ、またはアプリケーション名および関連パラメータのようなアクセスデータを含み得る。当該データはまた、(例えば、補足アンカーが検索サーバ152によって識別される場合)画像コンテンツクエリで送信される画像における補足アンカーの位置、座標、または寸法を含み得る。
In
動作506では、デジタル補足に関連付けられる情報を含むユーザインターフェイス画面が表示される。ある実施形態では、ユーザインターフェイス画面は、(たとえば、提供された座標に基づいて)識別された補足アンカーをオーバーレイする注釈を含む。注釈は、識別された補足アンカーに関連付けられた画像内のオブジェクトに関する情報を提供し得る。当該注釈は、デジタル補足を提示または起動するように作動され得る、ユーザ作動可能コントロールを含み得る。ユーザインターフェイス画面はまた、動作504において受信された応答において識別される複数のデジタル補足から選択するために使用され得るデジタル補足選択パネルを含み得る。ある実施形態では、ユーザインターフェイス画面は、デジタル補足によって指定されたURLを開くウェブブラウザによって生成され得る。ユーザインターフェイス画面はまた、デジタル補足を提供するために起動される別のアプリケーションによって生成され得る。
In
図6は、本明細書で説明される実施形態に従う、画像に基づいてデジタル補足を識別および提示する例示的な方法600の図である。この方法600は、画像コンテンツクエリに基づいてデジタル補足を識別して当該デジタル補足にアクセスするために、例えば、クライアントコンピューティングデバイス102のアプリケーション122によって実行され得る。
FIG. 6 is a diagram of an exemplary method 600 for identifying and presenting digital supplements based on images, according to the embodiments described herein. The method 600 can be performed, for example, by application 122 on the
動作602において、画像が取得される。例えば、画像は、クライアントコンピューティングデバイス102のカメラアセンブリ112によって取得され得る。ある実施形態では、一連の画像(すなわち、映像)が、カメラアセンブリ112によって取得され得る。
In
動作604において、画像に基づく画像コンテンツクエリは、検索サーバ152のようなサーバコンピューティングデバイスに送信される。動作604は、動作502と同様であり得る。画像のシーケンスが取得される実施形態では、画像コンテンツクエリは、複数の画像または画像のシーケンスを含み得る。ある実施形態では、画像のシーケンスは、当該サーバコンピューティングデバイスにストリーミングされ得る。
In
動作606において、複数のデジタル補足を識別する画像コンテンツクエリに対する応答が受信される。動作606は、前述の動作504と同様であり得る。
In
動作608において、複数のデジタル補足から一つのデジタル補足を選択するためのユーザ作動可能コントロールを含むユーザインターフェイス画面が表示される。例えば、デジタル補足選択パネルが表示され得る。デジタル補足選択パネルは、応答において識別される複数のデジタル補足のうちの1つに各々が関連付けられる複数のユーザ作動可能コントロールを含み得る。デジタル補足選択は、サーバコンピューティングデバイスによって提供されるデジタル補足の順序付けまたはランキングに基づいて、ユーザ作動可能な制御を準備し得る。デジタル補足選択パネルは、ユーザが作動可能コントロールを垂直に、水平に、またはその他の方法で配置し得る。ユーザ作動可能コントロールは、ユーザがデジタル補足を選択するかどうかを決定する際に考慮できる、関連付けられたデジタル補足に関する情報に関連付けられるか、または当該情報を含み得る。例えば、表示される情報は、デジタル補足の名前、説明、画像、および発行者名のうちの1つまたは複数を含み得る。
At
動作610において、デジタル補足を選択するためのユーザ入力が受け取られる。ユーザ入力は、マウスまたは他のデバイスを用いたクリックであり得る。ユーザ入力はまた、スタイラスまたは指からのタッチ入力であり得る。ユーザ入力の別の例は、略タッチ入力(例えば、指またはポインティングデバイスを画面に近接して保持すること)である。ある実施形態では、ユーザ入力はまた、手のジェスチャ、頭の動き、目での動作、または発話入力を含み得る。
In
動作612において、情報は、選択されたデジタル補足に関連付けられたリソースに提供される。例えば、クライアントコンピューティングデバイスのユーザについての情報は、(情報を提供する許可が提供されている場合)デジタル補足を提供するサーバに送信され得る。情報はまた、デジタル補足を提供するアプリケーションに提供され得る。様々な種類の情報が提供され得る。例えば、情報は、ユーザ名、ユーザの嗜好、または場所のようなユーザ情報を含み得る。
In
情報はまた、画像または画像のシーケンスのような画像コンテンツクエリに関連付けられる情報を含み得る。情報はまた、画像内の1つまたは複数の補足アンカーの識別子および/または位置を含み得る。この情報は、デジタル補足をユーザに提供するために使用され得る。例えば、デジタル補足のARコンテンツは、画像に基づいて形成されて位置決めされ得る。 The information may also include information associated with an image content query, such as an image or sequence of images. The information may also include the identifier and / or position of one or more supplemental anchors in the image. This information can be used to provide digital supplements to users. For example, digital supplement AR content can be formed and positioned based on images.
情報は、クライアントコンピューティングデバイス102によって、デジタル補足に関連付けられるリソース(例えば、デジタル補足サーバ172)に直接送信され得る。ある実施形態では、情報は、検索サーバ152によって、デジタル補足に関連付けられているリソースに提供される(例えば、クライアントコンピューティングデバイスは、それほど多くのデータを送信する必要がない)。これらの実施のうちの少なくともいくつかでは、クライアントコンピューティングデバイス102は、選択されたデジタル補足を識別する選択情報を検索サーバ152に送信し得る。選択を受信し、ユーザが情報の共有を許可したことを確認すると、検索サーバ152は、デジタル補足を提供するリソースに情報を送信し得る。クライアントコンピューティングデバイス102はまた、情報を共有できるようにユーザに促し得る。ある実施形態では、検索サーバ152は、デジタル補足データ構造インスタンス(これは、デジタル補足に関連付けられるメタデータに基づくことができる)に基づいてリソースに送信する情報を決定し得る。
The information may be transmitted directly by the
動作614において、ユーザインターフェイスは、選択されたデジタル補足に基づいて更新される。動作614は、動作506と同様であり得る。
In
図7A〜7Cは、画像コンテンツ検索を行なってデジタル補足を表示するためにクライアントコンピューティングデバイス102の実施形態によって表示されるユーザインターフェイス画面の概略図である。図7Aには、ユーザインターフェイス画面700aが示されている。ユーザインターフェイス画面700aは、画像表示パネル708および情報パネル730を含む。この例では、画像表示パネル708は、(例えば、店内で見つけるかもしれない)ワインボトルで一杯の棚の画像を表示している。画像表示パネル708はまた、インジケータ740およびインジケータ742を含む。これらのインジケータの各々は、当該インジケータの下の画像に示されるワインボトルが補足アンカー(例えば、この場合、認識された製品として)として認識されていることを示す。インジケータ740およびインジケータ742は、ユーザ作動可能コントロールの例である。情報パネル730内では、「興味があるものをタップして下さい」という指示が提供される。
7A-7C are schematic views of a user interface screen displayed by an embodiment of the
図7Bでは、ユーザインターフェイス画面700bが、ユーザがインジケータ740を作動させた後に示される。作動後、デジタル補足からの注釈744が表示される。注釈744は、ユーザが購入するワインのボトルを選択するのに役立ち得る、ワインの格付けに関する情報を含む。
In FIG. 7B, the
図7Cでは、別のユーザインターフェイス画面700cは、ユーザがインジケータ740を作動させた後に示される。ユーザインターフェイス画面700cは、(例えば、注釈744の作動後、またはユーザが図7Bの情報パネル730上でスワイプアップする場合)、ユーザインターフェイス画面700bが表示されることの代わりに又はそれに加えて、示される。図7Cには、拡張された情報パネル732が示されている。拡張された情報パネル732は、図7Aおよび図7Bで取り上げられた情報パネル730よりも多くのユーザインターフェイス画面700cを占める。
In FIG. 7C, another
拡張情報パネル732は、デジタル補足選択パネル710およびデジタル補足コンテンツ表示パネル734を含む。デジタル補足選択パネル710は、ユーザ作動可能コントロール712と、ユーザ作動可能コントロール714と、(部分的にしか見えない)ユーザ作動可能コントロール716とを含む。ある実施形態では、ユーザがデジタル補足選択パネル710上でスワイプすると、追加のユーザ作動可能コントロールが表示され得る。デジタル補足選択パネル710のユーザ作動可能コントロールは、ランク付けされた順序で配列され得る。ユーザ作動可能コントロール712は、食事ペアリングのためのデジタル補足に関連付けられる。ユーザ作動可能コントロール712が作動すると、選択されたワインのための食べ物および食事のペアリング情報を表示するデジタル補足が表示され得る。ユーザ作動可能コントロール714は、写真を保存するデジタル補足に関連付けられている。作動すると、写真を保存するアプリケーションが作動させられて画像が提供され得る。追加の情報は、識別された補足アンカーのような写真と共に保存され得る。
The
デジタル補足コンテンツ表示パネル734は、デジタル補足からのコンテンツを表示し得る。デジタル補足コンテンツ表示パネル734は、デフォルトのデジタル補足を、または、識別された補足アンカーに関連付けられている最高ランクのデジタル補足を表示し得る。この例では、デジタル補足コンテンツ表示パネル734は、選択された補足アンカーに関連付けられている製品に関する製品情報を含む。この場合、ワイン名、レーティング、原産地、画像、およびコメントが提供される。
The digital supplement
図8A〜8Cは、画像コンテンツ検索を行なってデジタル補足を表示するためにクライアントコンピューティングデバイス102の実施形態によって表示されるユーザインターフェイス画面の概略図である。この例では、画像コンテンツ検索は、レシートの画像に基づく。
8A-8C are schematic views of a user interface screen displayed by an embodiment of the
図8Aには、ユーザインターフェイス画面800aが示されている。ユーザインターフェイス画面800aは、画像表示パネル808および情報パネル830を含む。この例では、画像表示パネル808は、レストランからのレシートの画像を表示している。画像表示パネル808はまた、インジケータ840と、インジケータ842と、注釈844と、ハイライトオーバーレイ846とを含む。この場合、インジケータ840は、文書として当該レシートに関連付けられており、インジケータ842は、当該レシートに名付けられた特定のレストランに関連付けられている。識別されたレシート文書および識別されたレストラン名は、両方とも補足アンカーの例である。
FIG. 8A shows the
注釈844は、先端計算器を提供するデジタル補足に関連付けられている。この例では、例示的な先端計算器が注釈844に含まれ、画像表示パネル808上の適切な位置に重ねられる。ある実施形態では、デジタル補足は、デフォルトによって選択されてもよく、適切な補足アンカーを識別すると表示され得る。ハイライトオーバーレイ846は、先端計算器のデジタル補足によって使用される情報を含むレシート文書の一部分上にオーバーレイされる。
Note 844 is associated with a digital supplement that provides an advanced calculator. In this example, an exemplary advanced calculator is included in annotation 844 and is superposed at the appropriate location on the
この例では、情報パネル830に表示される項目は、インジケータ840が作動されたかのように、文書としてのレシートに関連する。ある実施形態では、識別された補足アンカーは、たとえば、ユーザの過去の動作、同様の画像に対する他のユーザの動作、補足アンカーの信頼スコア、または、補足アンカーが関連する画像の部分の位置またはサイズに基づく、ユーザの可能性のある関連性または関心に基づいて、ランク付けされる。次いで、情報パネル830は、少なくともある実施形態では、最も高くランク付けされた補足アンカーに関連する項目を表示し得る。もし、代わりに、インジケータ842が作動された場合、情報パネル830は、特定のレストランに関する項目を含み得る。
In this example, the items displayed on the
ここで、情報パネル830は、デジタル補足選択パネル810を含む。当該デジタル補足パネルは、ユーザ作動可能コントロール812と、ユーザ作動可能コントロール814と、ユーザ作動可能コントロール816とを含む。この例では、ユーザ作動可能コントロール812は先端計算器のデジタル補足に関連付けられており、ユーザ作動可能コントロール814はチェック分割デジタル補足に関連付けられており、ユーザ作動可能コントロール816は経費報告デジタル補足に関連付けられている。例えば、ユーザ作動可能コントロール812が作動すると、先端計算器のパラメータを調整するためのユーザインターフェイスコントロールは、(例えば、パーセンテージを調整するために)表示され得る。
Here, the
図8Bでは、ユーザインターフェイス画面800bは、ユーザがユーザ作動可能コントロール814を作動させた後に示されている。作動後、ユーザが請求書をどのように分割するかを計算するのに役立つ項目を含む拡張情報パネル832が、示される。例えば、請求書を分割する人数は、それぞれが支払うべき額を決定するために入力され得る。
In FIG. 8B, the
図8Cでは、ユーザインターフェイス画面800cは、ユーザがユーザ作動可能コントロール816を作動させた後に示される。作動後、ユーザが経費報告書にレシートを記憶するのに役立つ項目を含む拡張情報パネル834が示される。例えば、ユーザは、レシートが関連付けられるべき経費報告(例えば、「シドニー旅行2018」)を選択できる。一度当該経費報告が選択されると、レシートの画像は経費報告提出または管理システムにアップロードされ得る。ある実施形態では、画像表示パネル808に表示される全画像がアップロードされる。ある実施形態では、画像の一部分がアップロードされる(例えば、画像は、レシートのみを含むようにトリミングされる)。
In FIG. 8C, the
図9Aおよび図9Bは、画像コンテンツ検索を行なってデジタル補足を表示するためにクライアントコンピューティングデバイス102の実施形態によって表示されるユーザインターフェイス画面の概略図である。この例では、画像コンテンツ検索は、顔の画像に基づく。
9A and 9B are schematic views of a user interface screen displayed by an embodiment of the
図9Aには、ユーザインターフェイス画面900aが示されている。ユーザインターフェイス画面900aは、画像表示パネル908および情報パネル930を含む。この例では、画像表示パネル908は、顔の画像を表示している。ここで、当該顔は、補足アンカーの一例である。情報パネル930は、画像(すなわち顔)内の補足アンカーについて識別されたデジタル補足のためのユーザ作動可能コントロール912を含む。ユーザ作動可能コントロール912は、眼鏡に結び付けるためのデジタル補足に関連付けられている。
FIG. 9A shows the
図9Bでは、ユーザインターフェイス画面900bは、ユーザがユーザ作動可能コントロール912を作動させた後に示される。作動後、ユーザが画像内の顔上の眼鏡を視覚的に試すのを助けるための項目を含む拡張情報パネル932が示される。ここでは、複数の眼鏡スタイルが表示されており、ユーザは試行するペアを選択できる。一対の眼鏡を選択すると、ARコンテンツ960は、画像表示パネル908に重ねられる。ここで、ARコンテンツ960は、選択された眼鏡に対応し、画像内の顔に合致する大きさである。ある実施形態では、眼鏡を試着するためのデジタル補足が選択されると、画像表示パネル908に示される画像は、デジタル補足を提供するサーバに送信され、それにより、当該画像は、ARコンテンツ960をどこに、かつ、どのように配置して、どのような大きさとするべきか、または、眼鏡を試着するように推奨すべきかを決定するために、分析され得る。
In FIG. 9B, the
図10A〜10Cは、画像コンテンツ検索を行なってデジタル補足を表示するためにクライアントコンピューティングデバイス102の実施形態によって表示されるユーザインターフェイス画面の概略図である。この例では、画像コンテンツ検索は、カタログ内の家具の画像に基づく。
10A-10C are schematic views of a user interface screen displayed by an embodiment of the
図10Aには、ユーザインターフェイス画面1000aが示されている。ユーザインターフェイス画面1000aは、画像表示パネル1008を含む。この例では、画像表示パネル1008は、家具カタログのページの一部の画像を表示している。画像表示パネルはまた、インジケータ1040と、インジケータ1042と、インジケータ1044とを含む。この例では、インジケータ1040はベッドに関連付けられており、インジケータ1042は装飾品に関連付けられており、インジケータ1044はラグに関連付けられている。カタログにおけるベッド、装飾品、およびラグの画像は、補足アンカーの例である。
FIG. 10A shows the user interface screen 1000a. The user interface screen 1000a includes an
図10Bでは、ユーザインターフェイス画面1000bは、(例えば、インジケータ1040が表示される場所またはその近くで画面に触れることによって)ユーザがインジケータ1040を選択した後に、示される。ユーザインターフェイス画面1000bは、デジタル補足選択パネル1010および情報パネル1030を含む。情報パネル1030は、選択されたインジケータに関連付けられている補足アンカーに関する情報(例えば、製品名、説明、画像)を含む。
In FIG. 10B, the
デジタル補足選択パネル1010は、ユーザ作動可能コントロール1012およびユーザ作動可能コントロール1014を含む。ユーザ作動可能コントロール1012は、家庭内ビューを提供するデジタル補足に関連付けられている。ユーザ作動可能コントロール1014は、別のデジタル補足(例えば、ソーシャルメディアサイトに投稿するためのデジタル補足)に関連付けられている。
The digital supplementary selection panel 1010 includes a user-
図10Cでは、ユーザインターフェイス画面1000cは、ユーザ作動可能コントロール1012の作動後に示される。ユーザインターフェイス画面1000cは、画像表示パネル1008と、デジタル補足選択パネル1010と、縮小情報パネル1032とを含む。縮小情報パネル1032は、作動されると、情報パネルをポップアップさせて表示させられ得るユーザ作動可能コントロールを含み得る。
In FIG. 10C, the user interface screen 1000c is shown after activation of the user
ここで、画像表示パネル1008は、部屋の画像を表示し、ARコンテンツ1060を含む。ARコンテンツ1060は、画像パネル上に重ねられたインジケータ1040に関連付けられているベッドの3Dモデルを含む。ユーザは、ベッドが室内にどのように適合するかを見るために、室内のARコンテンツ1060の位置を調節し得る。ある実施形態では、家庭内ビューのためのデジタル補足が選択されると、画像表示パネル1008に示される画像は、デジタル補足を提供するサーバに送信され、それにより、当該画像は、ARコンテンツ1060をどこに、かつ、どのように位置付けて、どのような大きさとするべきかを決定するために分析され得る。ある実施形態では、ARコンテンツ1060は、画像コンテンツクエリよりも後に提供され得る。
Here, the
図11A〜11Cは、店内で様々な画像コンテンツ検索を行うためにクライアントコンピューティングデバイス102の実施形態によって表示されるユーザインターフェイス画面の概略図である。この例では、画像コンテンツ検索は、店内で取得された商品の画像に基づく。
11A-11C are schematic views of a user interface screen displayed by an embodiment of the
図11Aには、ユーザインターフェイス画面1100aが示されている。ユーザインターフェイス画面1100aは、画像表示パネル1108および情報パネル1130を含む。この例では、画像表示パネル1108は、店内で撮影された画像を表示している。画像表示パネル1108はまた、花瓶に関連付けられているインジケータ1140を含む。画像表示パネル1108に表示される花瓶は、補足アンカーの一例である。情報パネル1130は、当該花瓶に関する商品情報および当該花瓶を購入するための機能性を含むデジタル補足を表示している。デジタル補足は、例えば、花瓶の購入を開始するワークフローを含み得る。この例において、当該デジタル補足は、画像コンテンツおよびクライアントコンピューティングデバイスの位置に基づいて識別され、それにより、画像が取得された店によって公開された(または店に関連付けられている)デジタル補足が識別され得、また、クライアントコンピューティングデバイスが店内にあるときに画像コンテンツクエリに対し、高ランキングの結果として提供され得る。ある実施形態では、もしクライアントコンピューティングデバイスの位置が変更された場合、同じ画像に対して異なるデジタル補足が提供されるであろう。
FIG. 11A shows the
図11Bには、ユーザインターフェイス画面1100bが示されている。ユーザインターフェイス画面1100bは、画像表示パネル1108および情報パネル1130を含む。この例では、画像表示パネル1108は、店内で取得された別の画像を表示している。画像表示パネル1108はまた、ラグに関連付けられているインジケータ1142を含む。画像表示パネル1108に表示されるラグは、補足アンカーの一例である。情報パネル1130は、ラグに関する製品情報およびサイズを選択してラグを購入するための機能性を含むデジタル補足を表示している。図11Aのように、当該デジタル補足は、画像コンテンツおよびクライアントコンピューティングデバイスの位置に基づいて識別される。
FIG. 11B shows the
図11Cには、ユーザインターフェイス画面1100cが示されている。ユーザインターフェイス画面1100cは、画像表示パネル1108および情報パネル1130を含む。この例では、画像表示パネル1108は、店内で取得された別の画像を表示している。画像表示パネル1108はまた、花瓶に関連付けられているインジケータ1144を含む。画像表示パネル1108に表示される花瓶は、補足アンカーの一例である。情報パネル1130は、花瓶に関する製品情報を含むデジタル補足を表示している。情報パネル1130はまた、クーポンインジケータ1132およびクーポンを引き換えるための機能性を含む。クーポンを引き換えることは、販売店に関連付けられているウェブサイトから割引価格で商品を購入することを含み得る。ある実施形態では、清算の間割引を確保するために使用され得るクーポンコードが提示される。図11Aおよび11Bと同様に、デジタル補足は、画像コンテンツおよびクライアントコンピューティングデバイスの位置に基づいて識別される。
FIG. 11C shows the user interface screen 1100c. The user interface screen 1100c includes an
図12A〜図12Cは、様々な画像コンテンツ検索中にクライアントコンピューティングデバイス102の実施形態によって表示されるユーザインターフェイス画面の概略図である。この例では、画像コンテンツ検索は、(例えば、映画館で取得されるかもしれない)映画ポスターの画像に基づく。
12A-12C are schematic views of a user interface screen displayed by an embodiment of the
図12Aには、ユーザインターフェイス画面1200aが示されている。ユーザインターフェイス画面1200aは、画像表示パネル1208を含む。この例では、画像表示パネル1208は、映画ポスターの画像を表示している。画像表示パネル1208はまた、画像内で識別された映画ポスターに関連付けられているインジケータ1240を含む。映画ポスターは、補足アンカーの一例である。インジケータ1240は、作動されるとデジタル補足またはデジタル補足を選択するためのメニューを表示する、ユーザ作動可能コントロールを含み得る。
FIG. 12A shows the user interface screen 1200a. The user interface screen 1200a includes an
図12Bには、ユーザインターフェイス画面1200bが示されている。画像表示パネル1208はまた、画像内で識別された映画ポスターに関連付けられているプレビューデジタル補足1242を含む。例えば、プレビューデジタル補足1242は、(図12Aの)インジケータ1240の作動後に示され得る。プレビューデジタル補足1242は、識別された映画ポスターに関連付けられている映画からの画像または映像を映画ポスターの画像の上に重ね合わせ得る。
FIG. 12B shows the
図12Cには、ユーザインターフェイス画面1200cが示されている。画像表示パネル1208は、格付けインジケータ1244および格付けインジケータ1246も含む。格付けインジケータ1244および格付けインジケータ1246は、映画ポスターを含む画像コンテンツクエリに応答して、1つまたは複数のデジタル補足によって生成され得る。デジタル補足は、例えば、映画ポスターに関連付けられている映画のために、格付け情報を画像内で重ね合わせ得る。格付けインジケータ1244および格付けインジケータ1246は、作動されると、格付けおよび関連付けられる映画に関する追加情報を示させるユーザ作動可能コントロールを含み得る。
FIG. 12C shows the
図13は、本明細書で説明される(例えば、クライアントコンピューティングデバイス102、検索サーバ152、およびデジタル補足サーバ172を実施するための)技術とともに使用され得る、コンピュータデバイス1300およびモバイルコンピュータデバイス1350の例を示す。コンピューティングデバイス1300は、プロセッサ1302と、メモリ1304と、記憶装置1306と、メモリ1304および高速拡張ポート1310に接続するための高速インターフェイス1308と、低速バス1314および記憶装置1306に接続するための低速インターフェイス1312とを含む。構成要素1302,1304,1306,1308,1310および1312の各々は、様々なバスを使用して相互接続されており、共通のマザーボードに、または必要に応じて他の方法で据え付けられ得る。プロセッサ1302は、高速インターフェイス1308に結合されたディスプレイ1316のような外部の入力/出力装置上にGUIのためのグラフィカル情報を表示するために、メモリ1304または記憶装置1306に格納された命令を含む、コンピューティングデバイス1300内での実行のための命令を処理できる。他の実施形態では、複数のプロセッサおよび/または複数のバスが、必要に応じて、複数のメモリおよびタイプのメモリとともに使用され得る。また、複数のコンピューティングデバイス1300が接続されてもよく、各デバイスは、(例えば、サーババンク、ブレードサーバのグループ、またはマルチプロセッサシステムとして)必要な動作の部分を提供する。
FIG. 13 is a
メモリ1304は、コンピューティングデバイス1300内の情報を記憶する。一実施形態では、メモリ1304は1つまたは複数の揮発性メモリユニットである。別の実施形態では、メモリ1304は、1つまたは複数の不揮発性メモリユニットである。メモリ1304はまた、磁気または光ディスクのような別の形態のコンピュータ読み取り可能な記憶媒体であり得る。
The
記憶装置1306は、コンピューティングデバイス1300のために大容量ストレージを提供し得る。一実施形態では、記憶装置1306は、フロッピー(登録商標)ディスク装置、ハードディスク装置、光学ディスク装置、またはテープ装置、フラッシュメモリもしくは他の同様のソリッドステートメモリ装置、またはストレージエリアネットワークもしくは他の構成内の装置を含むデバイスのアレイなどのコンピュータ読み取り可能な記憶媒体であり得るか、またはそれを含み得る。コンピュータプログラム製品は、情報担体で有形に具現化され得る。コンピュータプログラム製品はまた、実行されると、上述の方法のような1つまたは複数の方法を実行する命令を含み得る。情報担体は、メモリ1304、記憶装置1306、またはプロセッサ1302上のメモリのようなコンピュータ読み取り可能な記憶媒体または機械可読媒体である。
The
高速コントローラ1308は、コンピューティングデバイス1300のための帯域幅集約的動作を管理する一方、低速コントローラ1312は、より低い帯域幅集約的動作を管理する。このような機能の割り当ては、例示にすぎない。一実施形態では、高速コントローラ1308は、メモリ1304に、(例えば、グラフィックプロセッサ又はアクセラレータを介して)ディスプレイ1316に、および、様々な拡張カード(図示しない)を受け入れることができる高速拡張ポート1310に結合されている。この実施形態では、低速コントローラ1312は、記憶装置1306および低速拡張ポート1314に結合されている。様々な通信ポート(例えば、USB、ブルートゥース(登録商標)、イーサネット(登録商標)、ワイヤレスイーサネット(登録商標))を含み得る低速拡張ポートは、例えば、ネットワークアダプタを介して、キーボード、ポインティングデバイス、スキャナ、またはスイッチもしくはルータのようなネットワーキングデバイスのように、1つまたは複数の入力/出力装置に結合され得る。
The high-speed controller 1308 manages bandwidth-intensive operation for the
コンピューティングデバイス1300は、図に示されるように、いくつかの異なる形態で実施され得る。例えば、それは、標準サーバ1320として、またはそのようなサーバのグループにおいて複数回実施され得る。また、それは、ラックサーバシステム1324の一部として実施され得る。加えて、それは、ラップトップコンピュータ1322のようなパーソナルコンピュータとして実施され得る。代替的には、コンピューティングデバイス1300からの構成要素は、デバイス1350のようなモバイルデバイス(図示しない)内の他の構成要素と組み合わされ得る。そのようなデバイスの各々は、コンピューティングデバイス1300,1350のうちの1つまたは複数を含み得、また、システム全体は、互いに通信する複数のコンピューティングデバイス1300、1350から構成され得る。
The
コンピューティングデバイス1350は、構成要素のうち特に、プロセッサ1352、メモリ1364、ディスプレイ1354のような入力/出力装置、通信インターフェイス1366、およびトランシーバ1368を含む。デバイス1350はまた、追加のストレージを提供するために、マイクロドライブまたは他のデバイスのような記憶装置を備え得る。構成要素1350,1352,1364,1354,1366および1368の各々は、様々なバスを使用して相互接続されており、構成要素のいくつかは、共通のマザーボード上に、または必要に応じて他の方法で、据え付けられ得る。
The
プロセッサ1352は、メモリ1364に格納された命令を含む、コンピューティングデバイス1350内で命令を実行できる。当該プロセッサは、別個の複数のアナログおよびデジタルプロセッサを含むチップのチップセットとして実施され得る。当該プロセッサは、たとえば、ユーザインターフェイスの制御、デバイス1350によって実行されるアプリケーション、およびデバイス1350によるワイヤレス通信のような、デバイス1350の他の構成要素の協調を提供し得る。
プロセッサ1352は、ディスプレイ1354に結合された制御インターフェイス1358およびディスプレイインターフェイス1356を介してユーザと通信し得る。ディスプレイ1354は、例えば、TFT LCD(Thin-Film-Transistor Liquid Crystal display)、LED(Light Emitting Diode)、OLED(Organic Light Emitting Diode)ディスプレイ、または他の適切なディスプレイ技術であり得る。ディスプレイインターフェイス1356は、グラフィックおよび他の情報をユーザに提示するためにディスプレイ1354を駆動するための適切な回路を含み得る。制御インターフェイス1358は、ユーザからコマンドを受信し、それらを変換してプロセッサ1352に提出し得る。加えて、外部インターフェイス1362は、デバイス1350と他のデバイスとの近距離通信を可能にするために、プロセッサ1352と通信して提供され得る。外部インターフェイス1362は、たとえば、ある実施形態では有線通信のために、または、他の実施形態では無線通信のために準備し得、複数のインターフェイスも使用され得る。
メモリ1364は、コンピューティングデバイス1350内の情報を記憶する。メモリ1364は、1つまたは複数のコンピュータ読み取り可能な記憶媒体、1つまたは複数の揮発性メモリユニット、または1つまたは複数の不揮発性メモリユニットのうちの1つまたは複数として実施され得る。拡張メモリ1374はまた、例えば、SIMM(Single In-Line Memory Module)カードインターフェイスを含み得る拡張インターフェイス1372を介してデバイス1350に提供および接続され得る。そのような拡張メモリ1374は、デバイス1350のための追加の記憶空間を提供でき、または、デバイス1350のためのアプリケーションまたは他の情報を記憶し得る。具体的には、拡張メモリ1374は、上述のプロセスを実行または補足するための命令を含むことができ、また、セキュアな情報も含み得る。したがって、たとえば、拡張メモリ1374は、デバイス1350のためのセキュリティモジュールとして提供され得、また、デバイス1350の安全な使用を可能にする命令でプログラムされ得る。加えて、セキュアなアプリケーションは、SIMMカード上に識別情報をハッキング不能に置くことのように、追加の情報と共にSIMMカードを介して提供され得る。
当該メモリは、以下で説明されるように、たとえば、フラッシュメモリおよび/またはNVRAMメモリを含み得る。一実施形態では、コンピュータプログラム製品は、情報担体において有形に具現化される。コンピュータプログラム製品は、実行されると、上述の方法のような、1つまたは複数の方法を実行する命令を含む。情報担体は、例えばトランシーバ1368または外部インターフェイス1362を介して受信され得る、メモリ1364、拡張メモリ1374、またはプロセッサ1352上のメモリのようなコンピュータ読み取り可能な記憶媒体または機械読み取り可能な媒体である。
The memory may include, for example, flash memory and / or NVRAM memory as described below. In one embodiment, the computer program product is tangibly embodied in an information carrier. Computer program products, when executed, include instructions that perform one or more methods, such as those described above. The information carrier is a computer-readable or machine-readable medium, such as
デバイス1350は、必要に応じてデジタル信号処理回路を含み得る通信インターフェイス1366を介してワイヤレスで通信し得る。通信インターフェイス1366は、とりわけ、GSM(登録商標)ボイス呼、SMS、EMS、またはMMSメッセージング、CDMA、TDMA、PDC、WCDMA(登録商標)、CDMA2000、またはGPRSのような様々なモードまたはプロトコルの下で通信を提供し得る。そのような通信は、例えば、無線周波数トランシーバ1368を介して行われ得る。加えて、ブルートゥース、Wi−Fi、または他のそのようなトランシーバ(図示しない)を用いてのように、短距離通信が発生し得る。加えて、GPS(全地球測位システム)受信機モジュール1370は、デバイス1350上で実行するアプリケーションによって必要に応じて使用され得る、追加のナビゲーションおよび位置に関連付けられた無線データをデバイス1350に提供し得る。
The
デバイス1350はまた、ユーザから発話情報を受信し、それを使用可能なデジタル情報に変換し得る、音声コーデック1360を使用して、聴覚的に通信し得る。音声コーデック1360は、同様に、例えば、デバイス1350のハンドセット内のスピーカを介してのように、ユーザのための可聴音を生成し得る。そのような音は、音声電話からの音を含んでもよく、記録された音(例えば、音声メッセージ、音楽ファイルなど)を含んでもよく、デバイス1350上で動作するアプリケーションによって生成される音も含み得る。
The
コンピューティングデバイス1350は、図に示されるように、いくつかの異なる形態で実施され得る。例えば、それは、携帯電話1380として実施され得る。また、それは、スマートフォン1382、パーソナルデジタルアシスタント、または他の同様のモバイルデバイスの一部として実施され得る。
The
本明細書で説明されるシステムおよび技術の様々な実施形態は、デジタル電子回路、集積回路、特別に設計されたASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合せで実現され得る。これらの様々な実施は、ストレージシステム、少なくとも1つの入力デバイス、および少なくとも1つの出力デバイスからデータおよび命令を受信し、それらにデータおよび命令を送信するように結合された、専用のまたは汎用であり得る少なくとも1つのプログラム可能なプロセッサを含むプログラム可能なシステム上で実行可能な、および/または解釈可能な、1つまたは複数のコンピュータプログラムにおける実施を含み得る。 Various embodiments of the systems and techniques described herein include digital electronic circuits, integrated circuits, specially designed ASICs (application specific integrated circuits), computer hardware, firmware, software, and / or them. It can be realized by the combination of. These various implementations are dedicated or general purpose, combined to receive data and instructions from the storage system, at least one input device, and at least one output device and send the data and instructions to them. Obtaining may include implementation in one or more computer programs executable and / or interpretable on a programmable system that includes at least one programmable processor.
これらのコンピュータプログラム(また、プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとしても知られる)は、プログラム可能なプロセッサのための機械命令を含み、高水準手続きおよび/またはオブジェクト指向プログラミング言語で、および/またはアセンブリ/機械言語で実施され得る。本明細書で使用されるように、「機械読み取り可能な媒体」、「コンピュータ読み取り可能な記憶媒体」という用語は、機械読み取り可能な信号として機械命令を受信する機械読み取り可能な媒体を含む、機械命令および/またはデータをプログラム可能なプロセッサに提供するために使用される任意のコンピュータプログラム製品、装置、および/またはデバイス(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指す。用語「機械読み取り可能な信号」は、機械命令および/またはデータをプログラム可能なプロセッサに提供するために使用される任意の信号を指す。 These computer programs (also known as programs, software, software applications or code) include machine instructions for programmable processors, in high-level procedures and / or object-oriented programming languages, and / or assemblies. / Can be implemented in machine language. As used herein, the terms "machine-readable medium" and "computer-readable storage medium" include machine-readable media that receive machine instructions as machine-readable signals. Refers to any computer program product, device, and / or device (eg, magnetic disk, disk, memory, programmable logic device (PLD)) used to provide instructions and / or data to a programmable processor. The term "machine readable signal" refers to any signal used to provide machine instructions and / or data to a programmable processor.
ユーザとの対話を提供するために、本明細書で説明されるシステムおよび技術は、ユーザに情報を表示するためのディスプレイデバイス(LED(発光ダイオード)またはOLED(有機LED)またはLCD(液晶ディスプレイ)モニタ/スクリーン)と、ユーザがコンピュータに入力を与え得るキーボードおよびポインティングデバイス(例えば、マウスまたはトラックボール)と、を有するコンピュータ上で実施され得る。他の種類のデバイスもまた、ユーザとの相互作用を提供するために使用されることができ、例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であり得、また、ユーザからの入力は、音響入力、音声入力、または触覚入力を含む任意の形態で受信され得る。 To provide user interaction, the systems and techniques described herein are display devices (LEDs (Light Emitting Diodes) or OLEDs (Organic LEDs) or LCDs (Liquid Crystal Display)) for displaying information to the user. It can be performed on a computer having a monitor / screen) and a keyboard and pointing device (eg, mouse or trackball) from which the user can give input to the computer. Other types of devices can also be used to provide interaction with the user, eg, the feedback provided to the user is any form of sensory feedback (eg, visual feedback, auditory feedback, etc.). Or tactile feedback), and input from the user can be received in any form, including acoustic input, audio input, or tactile input.
本明細書で説明されるシステムおよび技術は、(たとえば、データサーバとしての)バックエンドコンポーネントを含む、または、(たとえば、アプリケーションサーバとしての)ミドルウェアコンポーネントを含む、または、フロントエンドコンポーネント(例えば、ユーザが本明細書に記載するシステムおよび技術の実施形態と相互作用し得るグラフィカルユーザインターフェイスまたはウェブブラウザを有するクライアントコンピュータ)を含む、または、そのようなバックエンド、ミドルウェア、もしくはフロントエンドコンポーネントの任意の組み合せを含む、コンピューティングシステムにおいて実施され得る。システムの構成要素は、デジタルデータ通信(例えば、通信ネットワーク)の任意の形態または媒体によって相互接続され得る。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイドエリアネットワーク(「WAN」)、およびインターネットを含む。 The systems and techniques described herein include a back-end component (eg, as a data server), or a middleware component (eg, as an application server), or a front-end component (eg, a user). Includes (a client computer with a graphical user interface or web browser capable of interacting with embodiments of the systems and techniques described herein), or any combination of such backend, middleware, or frontend components. Can be implemented in computing systems, including. The components of the system can be interconnected by any form or medium of digital data communication (eg, a communication network). Examples of communication networks include local area networks (“LAN”), wide area networks (“WAN”), and the Internet.
コンピューティングシステムは、クライアントおよびサーバを含み得る。クライアントおよびサーバは、一般に、互いに遠隔であり、典型的には、通信ネットワークを介して相互作用する。クライアントとサーバとの関係は、それぞれのコンピュータ上で実行されて互いにクライアント−サーバ関係を有するコンピュータプログラムによって生じる。 Computing systems can include clients and servers. Clients and servers are generally remote from each other and typically interact over a communication network. The client-server relationship arises from computer programs that run on their respective computers and have a client-server relationship with each other.
ある実施形態では、図13に示されるコンピューティングデバイスは、ARヘッドセット/HMDデバイス1390とインターフェイスして、挿入されたコンテンツを物理的空間内で視聴するための拡張環境を生成するためのセンサを含み得る。例えば、図13に示されるコンピューティングデバイス1350または他のコンピューティングデバイスに含まれる1つまたは複数のセンサは、ARヘッドセット1390に入力を与えることができ、または、一般にAR空間に入力を与え得る。センサは、タッチスクリーン、加速度計、ジャイロスコープ、圧力センサ、バイオメトリックセンサ、温度センサ、湿度センサ、および周囲光センサを含み得るが、これらに限定されない。コンピューティングデバイス1350は、センサを使用して、AR空間におけるコンピューティングデバイスの絶対位置および/または検出された回転を決定でき、そして、その絶対位置および/または検出された回転は、AR空間への入力として使用され得る。例えば、コンピューティングデバイス1350は、コントローラ、レーザポインタ、キーボード、武器のような仮想オブジェクトとしてAR空間に組み込まれ得る。AR空間に組み込まれるとき、ユーザによるコンピューティングデバイス/仮想オブジェクトの位置決めは、ユーザが、AR空間内において特定の方法で仮想オブジェクトを見るように、コンピューティングデバイスを位置決めすることを可能にし得る。例えば、仮想オブジェクトがレーザポインタを表す場合、ユーザは、コンピューティングデバイスが実際のレーザポインタであるかのように、当該コンピューティングデバイスを操作し得る。ユーザは、コンピューティングデバイスを左右に、上下に、円形に動かすことができ、レーザポインタを使用するのと同様に当該デバイスを使用できる。ある実施形態では、ユーザは、仮想レーザポインタを使用して、目標とする所を狙うことが得る。
In one embodiment, the computing device shown in FIG. 13 interfaces with an AR headset /
ある実施形態では、コンピューティングデバイス1350に含まれるか又はそれに結合される1つまたは複数の入力デバイスは、AR空間への入力として使用され得る。入力装置は、タッチスクリーン、キーボード、1つまたは複数のボタン、トラックパッド、タッチパッド、ポインティングデバイス、マウス、トラックボール、ジョイスティック、カメラ、マイクロフォン、入力機能を有するイヤホンまたは耳の穴に差し込むタイプのイヤホン(buds)、ゲームコントローラ、または他の接続可能な入力装置を含み得るが、これらに限定されない。コンピューティングデバイスがAR空間に組み込まれるとき、コンピューティングデバイス1350に含まれる入力デバイスと相互作用するユーザは、AR空間において特定のアクションを生じさせることができる。
In certain embodiments, one or more input devices included in or coupled to the
ある実施形態では、コンピューティングデバイス1350のタッチスクリーンは、AR空間内でタッチパッドとしてレンダリングされ得る。ユーザは、コンピューティングデバイス1350のタッチスクリーンと相互作用し得る。相互作用は、例えばARヘッドセット1390において、AR空間内でレンダリングされたタッチパッド上での動きとしてレンダリングされる。当該レンダリングされた動きは、AR空間内で仮想オブジェクトを制御できる。
In certain embodiments, the touch screen of the
ある実施形態では、コンピューティングデバイス1350に含まれる1つまたは複数の出力デバイスは、AR空間内でARヘッドセット1390のユーザに出力および/またはフィードバックを提供できる。出力および/またはフィードバックは、視覚的、触覚的、または音声であり得る。出力および/またはフィードバックは、振動、1つまたは複数のライトまたはストロボの点灯および消灯または点滅および/または発光、アラームを鳴動すること、チャイムを鳴らすこと、楽曲を演奏すること、および、オーディオファイルの演奏を含み得るが、これらに限定されない。出力デバイスは、振動モータ、振動コイル、圧電デバイス、静電デバイス、発光ダイオード(LED)、ストロボ、およびスピーカを含み得るが、これらに限定されない。
In certain embodiments, one or more output devices included in the
ある実施形態では、コンピューティングデバイス1350は、コンピュータによって生成される3D環境において別のオブジェクトとして現れ得る。ユーザによるコンピューティングデバイス1350との相互作用(例えば、回転すること、振ること、タッチスクリーンに触れること、タッチスクリーンを横切って指をスワイプすること)は、AR空間内におけるオブジェクトとの相互作用と解釈され得る。AR空間におけるレーザポインタの例において、コンピューティングデバイス1350は、コンピュータによって生成される3D環境における仮想レーザポインタとして現れる。ユーザがコンピューティングデバイス1350を操作すると、AR空間内のユーザは、レーザポインタの動きを見る。ユーザは、コンピューティングデバイス1350またはARヘッドセット1390上のAR環境におけるコンピューティングデバイス1350との相互作用からのフィードバックを受信する。コンピューティングデバイスとのユーザの相互作用は、制御可能なデバイスのためのAR環境において生成されるユーザインターフェイスとの相互作用に変換され得る。
In one embodiment, the
ある実施形態では、コンピューティングデバイス1350は、タッチスクリーンを含み得る。例えば、ユーザは、制御可能なデバイスのためのユーザインターフェイスと相互作用するためにタッチスクリーンと相互作用できる。例えば、タッチスクリーンは、制御可能なデバイスの特性を制御できるスライダのようなユーザインターフェイス要素を含み得る。
In certain embodiments, the
コンピューティングデバイス1300は、限定はしないが、ラップトップ、デスクトップ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピュータを含む、様々な形態のデジタルコンピュータおよびデバイスを表すことが意図される。コンピューティングデバイス1350は、携帯情報端末、携帯電話、スマートフォン、および他の同様のコンピューティングデバイスのようなモバイルデバイスの様々な形態を表すことが意図される。本明細書に示される構成要素、それらの接続および関係、ならびにそれらの機能は、例示的なものにすぎず、本明細書で説明され、および/または請求される発明の実施形態を限定することを意図していない。
いくつかの実施形態が説明された。しかしながら、本明細書の精神および範囲から逸脱することなく、様々な修正が行われ得ることが理解されるであろう。 Several embodiments have been described. However, it will be appreciated that various modifications can be made without departing from the spirit and scope of this specification.
加えて、図に示される論理フローは、望ましい結果を達成するために、示された特定の順序または逐次の順序を必要としない。加えて、他のステップが提供されてもよく、または、ステップが記載されたフローから排除されてもよく、他の構成要素が当該記載されたシステムに追加されてもよく、または、当該システムら除去され得る。したがって、他の実施形態は、以下の特許請求の範囲内である。 In addition, the logical flow shown in the figure does not require the specific order or sequential order shown to achieve the desired result. In addition, other steps may be provided, or the steps may be excluded from the described flow, other components may be added to the described system, or the systems, etc. Can be removed. Therefore, other embodiments are within the scope of the following claims.
説明される実施形態のいくつかの特徴が本明細書に記載されるように説明されたが、多くの修正、置換、変更、および均等物が当業者には想起されるであろう。したがって、添付の特許請求の範囲は、実施形態の範囲内に含まれるそのようなすべての修正および変更を網羅することを意図していることを理解されたい。それらは、限定ではなく例として提示されたにすぎず、形態および詳細の様々な変更が行われ得ることを理解されたい。本明細書で説明される装置および/または方法の任意の部分は、相互に排他的な組み合わせを除き、任意の組み合わせで組み合わせられ得る。本明細書で説明される実施形態は、説明された異なる実施形態の機能、構成要素、および/または特徴の様々な組み合せ、および/または、サブコンビネーションを含み得る。
Although some features of the embodiments described have been described herein, many modifications, substitutions, modifications, and equivalents will be recalled to those of skill in the art. Therefore, it should be understood that the appended claims are intended to cover all such modifications and modifications contained within the scope of the embodiment. It should be understood that they are presented as examples, not limitations, and that various changes in form and detail can be made. Any part of the apparatus and / or method described herein can be combined in any combination, except for mutually exclusive combinations. The embodiments described herein may include various combinations and / or subcombinations of the functions, components, and / or features of the different embodiments described.
Claims (51)
デジタル補足を指定するデータを受信することを備え、前記データは、デジタル補足と、前記デジタル補足を画像コンテンツに関連付けるための補足アンカーとを識別し、前記方法はさらに、
前記デジタル補足と前記補足アンカーとを指定するデータ構造インスタンスを生成することと、
前記データ構造インスタンスを生成した後に、少なくとも前記データ構造インスタンスを複数の他のデータ構造インスタンスを含むデータベースに格納することに基づいて、画像によるデジタル補足のトリガを有効化することを含み、前記複数の他のデータ構造インスタンスの各々は、デジタル補足および1つまたは複数の補足アンカーを指定する、方法。 It ’s a method that runs on a computer.
The data comprises receiving data specifying a digital supplement, which identifies the digital supplement and a supplement anchor for associating the digital supplement with the image content, the method further comprising.
Creating a data structure instance that specifies the digital supplement and the supplement anchor,
After generating the data structure instance, the plurality of said data structure instances include enabling the triggering of digital capture by an image based on at least storing the data structure instance in a database containing a plurality of other data structure instances. A method in which each of the other data structure instances specifies a digital supplement and one or more supplement anchors.
ウェブページを分析することと、
前記ウェブページ内で表現される前記デジタル補足に関連付けられたメタデータを識別することとを含む、請求項1に記載のコンピュータで実行される方法。 Receiving data that specifies the digital supplement is
Analyzing web pages and
The method performed on a computer according to claim 1, comprising identifying the metadata associated with the digital supplement represented within the web page.
前記ウェブページを分析する前に、前記ウェブページを含む複数のウェブページをクローリングすることをさらに含む、請求項2に記載のコンピュータで実行される方法。 Receiving data that specifies the digital supplement is
The method performed on a computer according to claim 2, further comprising crawling a plurality of web pages including the web page before analyzing the web page.
前記ウェブページを分析する前に、前記ウェブページの識別子を受信することをさらに含む、請求項2または請求項3に記載のコンピュータで実行される方法。 Receiving data that specifies the digital supplement is
The method performed on a computer according to claim 2 or 3, further comprising receiving an identifier of the web page before analyzing the web page.
画像を含む画像コンテンツクエリを受信することと、
前記画像が前記生成されたデータ構造インスタンスによって指定された前記補足アンカーに一致すると判定することと、
前記画像が前記補足アンカーに一致すると判断することに応答して、前記画像コンテンツクエリに応答して前記データ構造インスタンスからデジタル補足を提供することとをさらに含む、先行する請求項のいずれかに記載のコンピュータで実行される方法。 After enabling the digital supplement trigger
Receiving image content queries that include images and
Determining that the image matches the supplemental anchor specified by the generated data structure instance.
The preceding claim, further comprising providing digital supplements from the data structure instance in response to the image content query in response to determining that the image matches the supplement anchor. How it runs on your computer.
少なくとも1つのプロセッサと、
命令を格納しているメモリとを備え、前記命令は、少なくとも1つのプロセッサによって実行されると、前記コンピューティングデバイスに、
デジタル補足を指定するデータを受信させ、前記データは、前記デジタル補足と、前記デジタル補足を画像コンテンツに関連付けるための補足アンカーと、コンテキスト情報とを識別し、
前記デジタル補足と前記補足アンカーと前記コンテキスト情報とを指定するデータ構造インスタンスを生成させ、
前記データ構造インスタンスを生成した後に、少なくとも前記データ構造インスタンスを、複数の他のデータ構造インスタンスを含むデータベースに格納することに基づいて画像によるデジタル補足のトリガを有効化させ、前記複数の他のデータ構造インスタンスの各々は、デジタル補足および1つまたは複数の補足アンカーを指定する、コンピューティングデバイス。 It ’s a computing device,
With at least one processor
It comprises a memory for storing an instruction, and when the instruction is executed by at least one processor, the computing device receives the instruction.
The data specifying the digital supplement is received, and the data identifies the digital supplement, the supplement anchor for associating the digital supplement with the image content, and the context information.
Generate a data structure instance that specifies the digital supplement, the supplement anchor, and the context information.
After generating the data structure instance, enable the digital supplemental trigger with an image based on storing at least the data structure instance in a database containing a plurality of other data structure instances to enable the plurality of other data. Each of the structure instances is a computing device that specifies a digital supplement and one or more supplement anchors.
コンピューティングデバイスから画像コンテンツクエリを受信することと、
前記画像コンテンツクエリに基づいて補足アンカーを識別することと、
前記識別された補足アンカーに基づいて、デジタル補足の順序付けられたリストを生成することと、
順序付けられたリストをコンピューティングデバイスに送信することとを含む、コンピュータで実行される方法。 It ’s a method that runs on a computer.
Receiving image content queries from computing devices and
Identifying supplemental anchors based on the image content query
To generate an ordered list of digital supplements based on the identified supplement anchors,
A method performed on a computer, including sending an ordered list to a computing device.
少なくとも1つのプロセッサと、
命令を格納しているメモリとを備え、前記命令は、少なくとも1つのプロセッサによって実行されると、前記コンピューティングデバイスに、請求項1〜12または17〜23のいずれかに記載の方法を実行させる、コンピューティングデバイス。 It ’s a computing device,
With at least one processor
With memory for storing instructions, the instructions, when executed by at least one processor, cause the computing device to perform the method according to any one of claims 1-12 or 17-23. , Computing device.
デジタル補足を識別する画像コンテンツクエリに対する応答を受信することと、
前記デジタル補足に関連付けられた情報を含むユーザインターフェイスを表示させることとを含む、コンピュータで実行される方法。 Sending image content queries to server computing devices and
Receiving a response to an image content query that identifies a digital supplement and
A method performed on a computer, including displaying a user interface that includes information associated with the digital supplement.
少なくとも1つのプロセッサと、
命令を記憶しているメモリとを備え、前記命令は、前記少なくとも1つのプロセッサによって実行されると、前記コンピューティングデバイスに、
画像を取得させ、
前記画像に基づく画像コンテンツクエリを、サーバコンピューティングデバイスに送信させ、
デジタル補足を識別する、前記画像コンテンツクエリに対する応答を受信させ、
前記デジタル補足に関連付けられた情報を含むユーザインターフェイスを表示させる、コンピューティングデバイス。 It ’s a computing device,
With at least one processor
It comprises a memory that stores an instruction, and when the instruction is executed by the at least one processor, the computing device receives the instruction.
Get the image
An image content query based on the image is sent to the server computing device.
Receive a response to the image content query that identifies the digital supplement,
A computing device that displays a user interface that contains information associated with the digital supplement.
情報を前記デジタル補足サーバに送信させ、
前記デジタル補足サーバからデジタル補足コンテンツを受信させ、前記デジタル補足コンテンツは、前記送信された情報に基づいている、請求項39〜42のいずれかに記載のコンピューティングデバイス。 The digital supplement is associated with a digital supplement server, and when the instruction is executed by at least one processor, the computing device is further injured.
Send the information to the digital supplement server
The computing device according to any one of claims 39 to 42, wherein the digital supplementary content is received from the digital supplementary server, and the digital supplementary content is based on the transmitted information.
前記画像に基づく画像コンテンツクエリを検索サーバに送信することと、
デジタル補足サーバを識別する、画像コンテンツクエリに対する応答を受信することと、
前記画像を前記デジタル補足サーバに送信させることと、
前記デジタル補足サーバからデジタル補足コンテンツを受信することと、
前記デジタル補足コンテンツを表示させることとを含む、コンピュータで実行される方法。 To get an image and
Sending an image content query based on the image to the search server and
Receiving a response to an image content query that identifies the digital supplement server,
Sending the image to the digital supplement server and
Receiving digital supplementary content from the digital supplementary server and
A method performed on a computer, including displaying the digital supplementary content.
少なくとも1つのプロセッサと、
命令を記憶しているメモリとを備え、前記命令は、前記少なくとも1つのプロセッサによって実行されると、前記コンピューティングデバイスに、請求項27〜38または45〜48のいずれかに記載の方法を実行させる、コンピューティングデバイス。 It ’s a computing device,
With at least one processor
It comprises a memory storing instructions, and when the instructions are executed by the at least one processor, the computing device performs the method according to any of claims 27-38 or 45-48. Let the computing device.
A computer-readable storage medium containing an instruction that, when executed by one or more processors, causes the one or more processors to receive any of claims 27-38 or 45-48. A computer-readable storage medium that performs the method described in.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022077546A JP2022110057A (en) | 2018-06-21 | 2022-05-10 | Digital supplement association and retrieval for visual search |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/014,520 | 2018-06-21 | ||
US16/014,512 | 2018-06-21 | ||
US16/014,512 US10579230B2 (en) | 2018-06-21 | 2018-06-21 | Digital supplement association and retrieval for visual search |
US16/014,520 US10878037B2 (en) | 2018-06-21 | 2018-06-21 | Digital supplement association and retrieval for visual search |
PCT/US2019/036542 WO2019245801A1 (en) | 2018-06-21 | 2019-06-21 | Digital supplement association and retrieval for visual search |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022077546A Division JP2022110057A (en) | 2018-06-21 | 2022-05-10 | Digital supplement association and retrieval for visual search |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021522614A true JP2021522614A (en) | 2021-08-30 |
JP7393361B2 JP7393361B2 (en) | 2023-12-06 |
Family
ID=68983041
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020570146A Active JP7393361B2 (en) | 2018-06-21 | 2019-06-21 | Digital supplementary association and search for visual search |
JP2022077546A Pending JP2022110057A (en) | 2018-06-21 | 2022-05-10 | Digital supplement association and retrieval for visual search |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022077546A Pending JP2022110057A (en) | 2018-06-21 | 2022-05-10 | Digital supplement association and retrieval for visual search |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP3811238A1 (en) |
JP (2) | JP7393361B2 (en) |
KR (2) | KR20230003388A (en) |
CN (1) | CN112020712B (en) |
WO (1) | WO2019245801A1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112231385B (en) * | 2020-12-11 | 2021-06-01 | 湖南新云网科技有限公司 | Data collection method, device, equipment and storage medium |
US11983691B2 (en) * | 2022-07-27 | 2024-05-14 | Bank Of America Corporation | System and methods for detecting and implementing resource allocation in an electronic network based on non-contact instructions |
CN117708680B (en) * | 2024-02-06 | 2024-06-21 | 青岛海尔科技有限公司 | Method and device for improving accuracy of classification model, storage medium and electronic device |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009505288A (en) * | 2005-08-15 | 2009-02-05 | エブリックス・テクノロジーズ・インコーポレイテッド | Use information from images as search criteria for the Internet and other search engines |
JP2012155362A (en) * | 2011-01-21 | 2012-08-16 | Panasonic Corp | Information processing apparatus, augmented reality system, information processing method, and information processing program |
JP2015501982A (en) * | 2011-11-17 | 2015-01-19 | マイクロソフト コーポレーション | Automatic tag generation based on image content |
JP2016519377A (en) * | 2013-05-09 | 2016-06-30 | アマゾン・テクノロジーズ、インコーポレイテッド | Recognition interface for computing devices |
JP2017157193A (en) * | 2016-03-01 | 2017-09-07 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | Method of selecting image that matches with content based on metadata of image and content |
US20180165370A1 (en) * | 2015-06-16 | 2018-06-14 | My EyeSpy Pty Ltd | Methods and systems for object recognition |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101777064A (en) * | 2009-01-12 | 2010-07-14 | 鸿富锦精密工业(深圳)有限公司 | Image searching system and method |
US8429173B1 (en) * | 2009-04-20 | 2013-04-23 | Google Inc. | Method, system, and computer readable medium for identifying result images based on an image query |
JP4981109B2 (en) * | 2009-08-25 | 2012-07-18 | 東芝テック株式会社 | Virtual try-on device and program |
US9710491B2 (en) * | 2009-11-02 | 2017-07-18 | Microsoft Technology Licensing, Llc | Content-based image search |
US8811742B2 (en) * | 2009-12-02 | 2014-08-19 | Google Inc. | Identifying matching canonical documents consistent with visual query structural information |
US8903166B2 (en) * | 2010-01-20 | 2014-12-02 | Microsoft Corporation | Content-aware ranking for visual search |
US8489589B2 (en) * | 2010-02-05 | 2013-07-16 | Microsoft Corporation | Visual search reranking |
JP5280475B2 (en) * | 2010-03-31 | 2013-09-04 | 新日鉄住金ソリューションズ株式会社 | Information processing system, information processing method, and program |
US20130238467A1 (en) * | 2011-01-13 | 2013-09-12 | Rakuten, Inc. | Object display server, object display method, object display program, and computer-readable recording medium for storing the program |
US8543521B2 (en) * | 2011-03-30 | 2013-09-24 | Microsoft Corporation | Supervised re-ranking for visual search |
US9036925B2 (en) * | 2011-04-14 | 2015-05-19 | Qualcomm Incorporated | Robust feature matching for visual search |
CN103959284B (en) * | 2011-11-24 | 2017-11-24 | 微软技术许可有限责任公司 | Ranking again is carried out using confidence image pattern |
US8935246B2 (en) * | 2012-08-08 | 2015-01-13 | Google Inc. | Identifying textual terms in response to a visual query |
US20160117391A1 (en) * | 2013-05-16 | 2016-04-28 | Yandex Europe Ag | Presentation of ranked image query results to a client |
US20160224837A1 (en) * | 2013-10-25 | 2016-08-04 | Hyperlayer, Inc. | Method And System For Facial And Object Recognition Using Metadata Heuristic Search |
JP2015207258A (en) * | 2014-04-23 | 2015-11-19 | キヤノン株式会社 | Information output device, information output method, program, information provision device, information provision method, and program |
US9652543B2 (en) * | 2014-12-22 | 2017-05-16 | Microsoft Technology Licensing, Llc | Task-oriented presentation of auxiliary content to increase user interaction performance |
CN106156063B (en) * | 2015-03-30 | 2019-10-01 | 阿里巴巴集团控股有限公司 | Correlation technique and device for object picture search results ranking |
US20170161382A1 (en) * | 2015-12-08 | 2017-06-08 | Snapchat, Inc. | System to correlate video data and contextual data |
JP2017194848A (en) * | 2016-04-21 | 2017-10-26 | 大日本印刷株式会社 | Image recognition service system |
US10459970B2 (en) * | 2016-06-07 | 2019-10-29 | Baidu Usa Llc | Method and system for evaluating and ranking images with content based on similarity scores in response to a search query |
-
2019
- 2019-06-21 WO PCT/US2019/036542 patent/WO2019245801A1/en active Application Filing
- 2019-06-21 JP JP2020570146A patent/JP7393361B2/en active Active
- 2019-06-21 KR KR1020227044320A patent/KR20230003388A/en not_active Application Discontinuation
- 2019-06-21 CN CN201980022269.0A patent/CN112020712B/en active Active
- 2019-06-21 EP EP19735444.2A patent/EP3811238A1/en active Pending
- 2019-06-21 KR KR1020207031107A patent/KR20200136030A/en not_active IP Right Cessation
-
2022
- 2022-05-10 JP JP2022077546A patent/JP2022110057A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009505288A (en) * | 2005-08-15 | 2009-02-05 | エブリックス・テクノロジーズ・インコーポレイテッド | Use information from images as search criteria for the Internet and other search engines |
JP2012155362A (en) * | 2011-01-21 | 2012-08-16 | Panasonic Corp | Information processing apparatus, augmented reality system, information processing method, and information processing program |
JP2015501982A (en) * | 2011-11-17 | 2015-01-19 | マイクロソフト コーポレーション | Automatic tag generation based on image content |
JP2016519377A (en) * | 2013-05-09 | 2016-06-30 | アマゾン・テクノロジーズ、インコーポレイテッド | Recognition interface for computing devices |
US20180165370A1 (en) * | 2015-06-16 | 2018-06-14 | My EyeSpy Pty Ltd | Methods and systems for object recognition |
JP2017157193A (en) * | 2016-03-01 | 2017-09-07 | バイドゥ・ユーエスエイ・リミテッド・ライアビリティ・カンパニーBaidu USA LLC | Method of selecting image that matches with content based on metadata of image and content |
Also Published As
Publication number | Publication date |
---|---|
JP2022110057A (en) | 2022-07-28 |
KR20230003388A (en) | 2023-01-05 |
EP3811238A1 (en) | 2021-04-28 |
CN112020712A (en) | 2020-12-01 |
CN112020712B (en) | 2024-06-25 |
KR20200136030A (en) | 2020-12-04 |
JP7393361B2 (en) | 2023-12-06 |
WO2019245801A1 (en) | 2019-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11023106B2 (en) | Digital supplement association and retrieval for visual search | |
US12002169B2 (en) | System and method for selecting targets in an augmented reality environment | |
US11640431B2 (en) | Digital supplement association and retrieval for visual search | |
US11010445B2 (en) | Method and system for addressing the problem of discovering relevant services and applications that are available over the internet or other communications network | |
JP6220452B2 (en) | Object-based context menu control | |
US10540378B1 (en) | Visual search suggestions | |
JP2022110057A (en) | Digital supplement association and retrieval for visual search | |
US20220155940A1 (en) | Dynamic collection-based content presentation | |
EP3500955A1 (en) | Browse node creation using frequent pattern mining | |
WO2014024533A1 (en) | Information processing device and recording medium | |
WO2021173147A1 (en) | System and method for playback of augmented reality content triggered by image recognition | |
JP2021077394A (en) | Crowd assisted query system | |
US9529936B1 (en) | Search results using query hints | |
WO2017210610A1 (en) | Quick trace navigator | |
US10437902B1 (en) | Extracting product references from unstructured text | |
US12032633B2 (en) | Digital supplement association and retrieval for visual search | |
EP3239859A1 (en) | Method and system for addressing the problem of discovering relevant services and applications that are available over the internat or other communications network | |
US11810577B2 (en) | Dialogue management using lattice walking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201216 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201216 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20201216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210713 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211013 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220510 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220510 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220518 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220524 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20220729 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20220802 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220906 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20221011 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20221220 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230110 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230317 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230404 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230420 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231124 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7393361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |