JP6736145B2 - 拡張現実に基づく画像認識方法および装置 - Google Patents

拡張現実に基づく画像認識方法および装置 Download PDF

Info

Publication number
JP6736145B2
JP6736145B2 JP2019558338A JP2019558338A JP6736145B2 JP 6736145 B2 JP6736145 B2 JP 6736145B2 JP 2019558338 A JP2019558338 A JP 2019558338A JP 2019558338 A JP2019558338 A JP 2019558338A JP 6736145 B2 JP6736145 B2 JP 6736145B2
Authority
JP
Japan
Prior art keywords
picture feature
picture
library
samples
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019558338A
Other languages
English (en)
Other versions
JP2020507173A (ja
Inventor
リンチン・ワン
シャオドン・ゼン
ホン・ジャン
フェン・リン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2020507173A publication Critical patent/JP2020507173A/ja
Application granted granted Critical
Publication of JP6736145B2 publication Critical patent/JP6736145B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/131Protocols for games, networked simulations or virtual reality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/53Network services using third party service providers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Description

優先権主張
本出願は、2017年1月11日に出願された中国特許出願第201710018395.1号および2018年1月8日に出願された米国特許出願第15/864,572号の優先権を主張するものであり、それらの全体の内容が参照によってここに組み込まれる。
本出願は拡張現実の分野に関し、詳細には拡張現実に基づく画像認識方法および装置に関するものである。
拡張現実(AR)技術は、画像の位置および角度をリアルタイムで計算することにより、対応する写真、映像、および3Dモデルを画像に重ねて仮想世界と現実世界を融合させる技術である。ARクライアント端末は、ARクライアント端末にローカルに記憶されたピクチャ認識材料を使用することによりユーザのオフライン環境の画像をリアルタイムで認識し、対応するプレゼンテーションデータを、あらかじめ構成されたプレゼンテーション効果に従って、実際のシナリオで認識された特定のオフラインターゲットの位置に拡張されたやり方で表示する。しかしながら、AR技術が継続的に発展してARシーンがますます豊富になるので、ARクライアント端末の演算量も日ごとに増加する。大量の演算によって電力が急速に消費され、ARクライアント端末が異常に加熱する。したがって、ARクライアント端末の演算量を低減することは、この産業界における至急解決すべき課題の1つである。
本出願が提供する拡張現実に基づく画像認識方法は、拡張現実サーバ端末に適用されるものであり、
拡張現実クライアント端末によってアップロードされたユーザ情報を収集するステップと、
事前設定のピクチャ特徴サンプル(Picture Feature Sample)のライブラリからユーザ情報に関連したピクチャ特徴サンプルを選出するステップと、
選出されたピクチャ特徴サンプルに基づき、ユーザ情報に対応するピクチャ特徴サンプルのサブライブラリを生成して、拡張現実クライアント端末にプッシュし、これにより、拡張現実クライアント端末が、ユーザのオフライン環境における画像走査中に、走査された画像情報に対して、ピクチャ特徴サンプルのサブライブラリに基づき画像認識を遂行するステップとを含む。
本出願がさらに提供する、拡張現実に基づく画像認識装置は、拡張現実サーバ端末に適用されるものであり、
拡張現実クライアント端末によってアップロードされたユーザ情報を収集するように構成された収集モジュールと、
事前設定のピクチャ特徴サンプルのライブラリからユーザ情報に関連したピクチャ特徴サンプルを選出するように構成されたスクリーニングモジュールであって、ピクチャ特徴サンプルのライブラリがピクチャ特徴サンプルとユーザ情報の間の対応関係を含む、スクリーニングモジュールと、
選出されたピクチャ特徴サンプルに基づきユーザ情報に対応するピクチャ特徴サンプルのサブライブラリを生成して、拡張現実クライアント端末にプッシュし、これにより、拡張現実クライアント端末が、ユーザのオフライン環境における画像走査中に、走査された画像情報に対して、ピクチャ特徴サンプルのサブライブラリに基づき画像認識を遂行するように構成されたプッシュモジュールとを含む。
本出願では、拡張現実サーバ端末は、拡張現実クライアント端末によってアップロードされたユーザ情報を収集し、事前設定のピクチャ特徴サンプルのライブラリからユーザ情報に関連したピクチャ特徴サンプルを選出し、選出されたピクチャ特徴サンプルに基づき、ユーザ情報に対応するピクチャ特徴サンプルのサブライブラリを生成して、拡張現実クライアント端末にプッシュし、これにより、拡張現実クライアント端末が、ユーザのオフライン環境における画像走査中に、走査された画像情報に対して、ピクチャ特徴サンプルのサブライブラリに基づき画像認識を遂行する。拡張現実サーバ端末がユーザ情報に基づいてピクチャ特徴サンプルのライブラリをスクリーニングするので、拡張現実クライアント端末に対して拡張現実サーバ端末によってプッシュされるピクチャ認識材料の数、および拡張現実クライアント端末が画像認識を遂行するときに使用されるピクチャ認識材料の数が、かなり減少され得、したがって拡張現実クライアント端末の演算量が低減され、拡張現実クライアント端末の画像認識効率が改善する。
本出願の一実施形態による、拡張現実に基づく画像認識方法の処理の流れ図である。 本出願の一実施形態によるARサーバ端末の構成図である。 本出願の一実施形態による、拡張現実に基づく画像認識装置の論理ブロック図である。 本出願の一実施形態による、拡張現実に基づく画像認識装置を担持する拡張現実サーバ端末に包含されているハードウェアの構造図である。
従来の技術では、ユーザのオフライン環境において画像を走査するプロセスにおいて、ARクライアント端末は、通常、走査された画像情報に対して、あらかじめ構成されたピクチャ認識材料のライブラリを使用してリアルタイムで画像認識を遂行し得る。ピクチャ認識材料のライブラリは、オフラインターゲットの多数のピクチャサンプルから抽出されたピクチャ特徴サンプル(Picture Feature Sample)を含む。ユーザのオフライン環境から画像情報が走査された後に、ARクライアント端末は、ARエンジンに担持されている画像認識アルゴリズムを使用して、画像情報からピクチャ特徴を抽出し、次いで、抽出されたピクチャ特徴とピクチャ認識材料のライブラリにおけるピクチャ特徴サンプルの間の類似度を一つずつ計算して、走査された画像情報におけるオフラインターゲットを認識し得る。ARクライアント端末は、画像認識が完了した後に、認識されたオフラインターゲットの位置を実際のシナリオにおいてさらに計算し、次いで、あらかじめ構成されたプレゼンテーション効果に従って、対応するプレゼンテーションデータを拡張されたやり方で表示する。
現在、ARクライアント端末が画像認識の実行中に必要とするピクチャ認識材料のライブラリ、プレゼンテーションデータ、および対応するプレゼンテーション効果(たとえばアニメーション効果)は、一般的にはARサービスプラットフォームの中にあらかじめ構成されており、プレゼンテーションデータは、ピクチャ認識材料のライブラリにおけるそれぞれのオフラインターゲット用にあらかじめ構成されており、関連付けられたやり方で提示されなければならない。ARクライアント端末は、画像走査を開始する前に、ARサービスプラットフォームから、あらかじめ構成されたピクチャ認識材料のライブラリならびに対応するプレゼンテーションデータおよびプレゼンテーション効果をそっくりダウンロードしてローカルに保存する必要がある。
しかしながら、実際の用途では、ピクチャ認識材料のライブラリにあまりにも多くの材料があると、一方ではARクライアント端末のデータ記憶圧力が増すことになり、他方では、ARクライアント端末の画像認識中の演算量がかなり多くなり、したがって、ARクライアント端末の、急速な電力消費、異常加熱、および画像認識効率低下といった問題の原因となる。
このような事情に鑑みて、本出願は、ARクライアント端末によってアップロードされたユーザ情報に基づきピクチャ認識材料を柔軟に選出して、選出された材料をARクライアント端末にプッシュすることができるARサーバ端末を提供するものである。
ARサーバ端末は、ARクライアント端末によってアップロードされたユーザ情報を収集することにより、事前設定のピクチャ特徴サンプルのライブラリからユーザ情報に関連したピクチャ特徴サンプルを選出し、選出されたピクチャ特徴サンプルに基づき、ユーザ情報に対応するピクチャ特徴サンプルのサブライブラリを生成して、ARクライアント端末にプッシュし、これにより、ARクライアント端末が、ユーザのオフライン環境における画像走査中に、走査された画像情報に対して、ピクチャ特徴サンプルのサブライブラリに基づき画像認識を遂行する。
全体の解決策では、ARサーバ端末が、ユーザ情報に基づいてピクチャ特徴サンプルのライブラリをスクリーニングするので、ARクライアント端末に対してARサーバ端末によってプッシュされるピクチャ認識材料の数、およびARクライアント端末が画像認識を遂行するときに使用されるピクチャ認識材料の数が、かなり減少され得、したがってARクライアント端末の演算量が低減され、ARクライアント端末の画像認識効率が改善する。
本出願が、特定の実施形態を使用して、特定の用途のシナリオを参照しながら以下で説明される。
図1を参照すると、本出願の一実施形態による、拡張現実に基づく画像認識方法が示されている。この方法はARサーバ端末に適用されるものであり、以下のステップを含む。
ステップ101:拡張現実クライアント端末によってアップロードされたユーザ情報が収集される。
ステップ102:事前設定のピクチャ特徴サンプルのライブラリからユーザ情報に関連したピクチャ特徴サンプルが選出される。
ステップ103:選出されたピクチャ特徴サンプルに基づき、ユーザ情報に対応するピクチャ特徴サンプルのサブライブラリが生成されて、拡張現実クライアント端末にプッシュされ、これにより、ARクライアント端末が、ユーザのオフライン環境における画像走査中に、走査された画像情報に対して、ピクチャ特徴サンプルのサブライブラリに基づき画像認識を遂行する。
ARクライアント端末は、AR技術を基に開発された、またはAR機能を伴って組み込まれた、クライアント端末ソフトウェアを参照する。たとえば、ARクライアント端末は、ARサービス機能を伴って組み込まれたサードパーティの支払いAPPでよい。ARクライアント端末は、担持されている画像走査ツールを使用して、ユーザのオフライン環境における実際のシーンに対する画像走査を遂行して、走査されたオフラインターゲットに関する画像認識を開始してよい。さらに、ARクライアント端末は、ARクライアント端末のフロントエンドのARエンジンを使用することにより、認識されたオフラインターゲットに対応する、バックエンドARサーバ端末によってプッシュされたプレゼンテーションデータに対する可視化レンダリングを遂行する。ARクライアント端末は、実際のシーン(たとえば実際のシーンの画像)に対して、レンダリングされたプレゼンテーションデータを上に載せて融合させ、プレゼンテーションデータを、あらかじめ構成されたプレゼンテーション効果に従って、実際のシーンにおける認識されたオフラインターゲットに対応する位置に、拡張されたやり方で表示する。
プレゼンテーションデータは、一般に、認識されたオフラインターゲットに関連して提示される必要がある仮想データを含み得る。プレゼンテーション効果は、一般に、プレゼンテーションデータを実際のシーンにおいて提示するためのプレゼンテーション効果を含み得る。
たとえば、オフラインターゲットがオフライン商店のロゴピクチャである場合には、プレゼンテーションデータは、具体的には、たとえば商店の基本情報および割引き情報といったオフライン商店のロゴに関連して提示される必要のあるラベルデータである。プレゼンテーション効果は、たとえば自己定義されたアニメーション効果、動的プレゼンテーションテンプレート、プレゼンテーションテキストなど商店のロゴに関連してラベルデータが提示されるときに使用される、自己定義された特別なプレゼンテーション効果を特に含み得る。
ARサーバ端末は、ARクライアント端末にサービスを提供するサーバ、サーバクラスタ、またはサーバクラスタに基づき確立されたクラウドサービスプラットフォームを特に含み得る。たとえば、ARクライアント端末がARサービス機能を組み込まれたサードパーティの支払いAPPであるとき、ARサーバ端末は、ARサービス機能を組み込まれたサードパーティの支払いAPPに対して接続サービスを提供するクラウドサービスプラットフォームでよい。ARサーバ端末は、バックエンドARエンジンに基づき、ARクライアント端末によって走査された画像を認識し(もちろん、この画像認識プロセスはARクライアント端末によってフロントエンドのARエンジンを使用して完了されてもよい)、オフラインサービスに関係のある仮想データの内容を管理して、画像認識結果に基づき、認識されたオフラインターゲットに関係のある仮想データをARクライアント端末にプッシュしてよい。
事前設定のピクチャ特徴サンプルのライブラリは、前述のピクチャ認識材料のライブラリであり、一般に、オフラインターゲットの多数のサンプル画像から抽出されたピクチャ特徴サンプルを含む。
ユーザ情報は、ピクチャ特徴サンプルのライブラリをスクリーニングするためのスクリーニング寸法として使用され得るユーザデータを特に含み得る。
たとえば、示される実装形態の1つでは、ユーザ情報はユーザの位置を含み得る。そのような場合には、ARクライアント端末は、ARサーバ端末に対してユーザの位置をリアルタイムでアップロードしてよい。ARサーバ端末は、ARクライアント端末によってアップロードされたユーザの位置に基づき、ピクチャ特徴サンプルのライブラリから、ユーザまでの距離が特定の範囲の内部にあるピクチャ特徴サンプルを選出してよい。
別の例として、別の示される実装形態では、ユーザデータはさらにユーザの挙動ログでもよい。そのような場合には、ARサーバ端末は、ARクライアント端末によってアップロードされたユーザの挙動ログを収集し、収集されたユーザの挙動ログに対してビッグデータ分析を遂行して、ユーザの挙動の選好を判定してよい。次いで、ARサーバ端末は、ユーザの位置に基づいて選出されたピクチャ特徴サンプルのライブラリから、ユーザの挙動の選好を満たすピクチャ特徴サンプルをさらに選出する。
ピクチャ特徴サンプルのサブライブラリは、ユーザ情報に基づいて前述のピクチャ特徴サンプルのライブラリから選出されたいくつかのピクチャ特徴サンプルを使用してARサーバ端末によって生成されたピクチャ特徴サンプルのライブラリを指す。ピクチャ特徴サンプルのサブライブラリは、ピクチャ特徴サンプルのライブラリのサブセットであり、ユーザ情報に対応するものである。
たとえば、示される実装形態の1つでは、ユーザ情報はユーザの位置および挙動ログを含み得る。ARサーバ端末は、ユーザの位置に基づき、ピクチャ認識材料のライブラリから、ユーザの位置までの距離が特定の範囲の内部にあるピクチャ特徴サンプルを予備的に選出してよい。その一方で、ARサーバ端末は、ユーザの収集された挙動ログに対するビッグデータ分析をさらに遂行してユーザの挙動の選好を判定し、判定されたユーザの挙動の選好に基づき、これらの予備的に選出されたピクチャ特徴サンプルから、ユーザの挙動の選好を満たすピクチャ特徴サンプルをさらに選出してよい。次いで、ARサーバ端末は、さらに選出されたピクチャ特徴サンプルを使用して、ピクチャ特徴サンプルのサブライブラリを生成する。
ユーザ情報がユーザの位置および挙動ログを含む例を使用して、本出願の技術的解決策が、特定の実施形態を参照しながら以下で詳細に説明される。
ユーザ情報がユーザの位置および挙動ログであるというのは、本明細書における単なる例である。もちろん、実際の用途では、ユーザ情報は、ピクチャ特徴サンプルのライブラリをスクリーニングするためのスクリーニング寸法として使用され得る他のユーザデータをさらに含み得る。本出願では、詳細を一つずつ列挙することはない。
この実施形態では、初期状態において、ARサーバ端末は、担持されているデータ収集システムを使用することにより、ピクチャサンプルとピクチャサンプルに関連した位置とを積極的に収集して、ピクチャ認識材料のライブラリを生成し得る。
オペレータは、ARサーバ端末に担持されているバックエンド管理システムにログインすることにより、ピクチャ認識材料のライブラリにおけるピクチャ特徴サンプルについて、ピクチャ特徴サンプルに対応するオフラインターゲットに関連して提示される必要があるプレゼンテーションデータを構成してよく、プレゼンテーションデータに関するプレゼンテーション効果を構成してよい。その上に、オペレータは、ARサーバ端末に担持されているバックエンド管理システムにログインすることにより、構成されたプレゼンテーションデータおよびプレゼンテーション効果をさらに動的に修正して更新し得る。
ユーザがARクライアント端末を使用するとき、ARクライアント端末はユーザの位置および挙動ログを収集し、次いで、ARサーバ端末に対してそれらをリアルタイムでアップロードし得る。ARサーバ端末は、ARクライアント端末によってアップロードされたユーザの位置および挙動ログを収集して、ARクライアント端末によってアップロードされたユーザの情報および挙動ログに基づき、ピクチャ認識材料のライブラリにおけるピクチャ認識材料をより柔軟に管理し得る。
一方では、ARサーバ端末は、ARクライアント端末のために、クライアント端末によってアップロードされた位置に基づき、ユーザの位置までの距離が事前設定の閾値未満であるピクチャ特徴サンプルを、ピクチャ認識材料のライブラリから予備的に選出してよい。
他方では、ARサーバ端末は、担持されているクラウドコンピューティングシステムを使用することにより、収集された挙動ログに対するビッグデータ分析を遂行して、ユーザの挙動の選好を判定してよい。次いで、ARサーバ端末は、判定された挙動の選好に基づき、予備的に選出されたピクチャ特徴サンプルからユーザの挙動の選好を満たすピクチャ特徴サンプルをさらに選出して、ユーザに関するピクチャ特徴サンプルのサブライブラリを生成し、次いでピクチャ特徴サンプルのサブライブラリをARクライアント端末にプッシュする。
このやり方により、ARサーバ端末によってプッシュされるピクチャ認識材料の数が大幅に減少し、ARクライアント端末の画像認識中の演算量が減少して、ARクライアント端末の画像認識効率が改善され得る。
図2を参照して、図2は、この実施形態によるARサーバ端末の構成図である。
図2に示されるように、ARサーバ端末は、具体的にはARピクチャ認識材料に関する分散型設計ベースの管理プラットフォーム(以下では略して管理プラットフォームと称される)でよい。管理プラットフォームに担持されている機能ノードは、クラウドサービスインターフェース、WEBのバックエンド管理ポータル、分散記憶システム、バックエンド管理システム、データ収集システム、分散型検索システム、クラウドコンピューティングシステム、画像認識システム、ユーザデータ分析システム、材料スクリーニングシステム、コンテンツプッシュシステムなどを特に含み得る。
クラウドサービスインターフェースは、ARクライアント端末にサービスを提供するために管理プラットフォームによって使用されるサービスインターフェースである。ARクライアント端末は、サービスインターフェースにアクセスすることにより、管理プラットフォームからの対応するクラウドサービスを要求してよい。管理プラットフォームは、ARクライアント端末によって要求されたサービスデータを、サービスインターフェースを通じてARクライアント端末にさらに返してよい。
たとえば、クラウドサービスインターフェースは、具体的にはHTTPインターフェースでよい。ARクライアント端末は、対応するHTTPサービスリクエストを確立し、確立されたHTTPサービスリクエストを、HTTPインターフェースにアクセスすることによって管理プラットフォームに提出してよい。管理プラットフォームは、HTTPインターフェースに基づき、ARクライアント端末に対して対応するサービスデータをさらに返してよい。
WEBのバックエンド管理ポータルは、オペレータが、管理プラットフォームにおいてあらかじめ構成されているピクチャ認識材料のライブラリならびに関係のあるプレゼンテーションデータおよびプレゼンテーション効果に対する手動の介入または更新のために使用する管理ポータルである。オペレータは、管理プラットフォームにおけるコンテンツを管理するための一般的なWEBのやり方で、バックエンド管理システムにログインしてよい(たとえば、オペレータは、管理プラットフォームのポータルのURLアドレスにアクセスし、次いで管理アカウントおよびパスワードを入力して、バックエンド管理システムに遠隔でログインする)。
分散記憶システムは、全体の管理プラットフォームのデータの基礎(data basis)であり、ピクチャ認識材料のライブラリならびにピクチャ認識材料のライブラリにおけるピクチャ特徴サンプルに関してオペレータによってあらかじめ構成されているプレゼンテーションデータおよびプレゼンテーション効果などのデータを分散して記憶するのに使用される。分散記憶のやり方はデータの信頼性を保証することができる。したがって、分散記憶システムは、全体の管理プラットフォームの信頼性の基礎として役立ち得る。
バックエンド管理システムは、オペレータが管理プラットフォームを直接管理するために使用するユーザプラットフォームである。バックエンド管理システムは、オペレータに、様々な管理動作に対応する可視ユーザインターフェースを提供し得るものである。オペレータは、これらの可視ユーザインターフェースにおいて、たとえば、ピクチャ認識材料として役立つピクチャ特徴サンプルをピクチャ認識材料のライブラリに追加するステップ、ピクチャ認識材料として役立つピクチャ特徴サンプルをピクチャ認識材料のライブラリから削除するステップ、ピクチャ認識材料のライブラリにおけるピクチャ認識材料として役立つピクチャ特徴サンプルを更新するステップ、ARクライアント端末のために、認識されたオフラインターゲットおよびプレゼンテーション効果に関連して提示される必要があるプレゼンテーションデータをあらかじめ構成するステップ、実際の要求に応じて、構成されたプレゼンテーションデータおよびプレゼンテーション効果を動的に更新するステップ、などの対応する管理動作を遂行してよい。
もちろん、実際の用途では、オペレータは、バックエンド管理システムにログインして管理プラットフォームにおけるコンテンツを管理することに加えて、バックエンド管理システムを使用することにより管理プラットフォームにおける他のシステムにさらに介入してよい。
たとえば、オペレータは、クラウドコンピューティングシステムのデータ分析論理およびパラメータに対する手動の編集や介入が可能であり、ピクチャ認識材料のライブラリにおける、ピクチャ特徴サンプルに関連して記憶されたユーザ位置に対して、さらなる編集および調節などが可能である。
データ収集システムは、インターネットまたは接続されているサードパーティのサーバ端末から、管理プラットフォームが必要とする「材料(Material)」などのデータを積極的に収集するのに主として使用される。
従来の管理プラットフォームでは、ピクチャ認識材料は、一般にオペレータによって手動で入力されて編集される。したがって、データは不十分である。しかしながら、本出願では、管理プラットフォームが、データ収集システムを担持することにより、インターネットまたは接続されているサードパーティのサーバ端末からピクチャ認識材料を積極的に収集して、管理プラットフォームの分散記憶システムに記憶し得る。
その上に、データ収集システムは、ピクチャ認識材料を積極的に収集することに加えて、さらに、クラウドコンピューティングプラットホームによって遂行される後続のビッグデータ分析を容易にするために、ARクライアント端末によってアップロードされたユーザの挙動ログを積極的に収集してよい。
分散型検索システムは、主として、分散記憶システムに記憶されたデータを検索して照会するために使用される。管理プラットフォームは、多数のピクチャ認識材料と、ピクチャ認識材料に関連する位置、プレゼンテーションデータ、およびプレゼンテーション効果などのデータとを管理する必要がある。したがって、管理プラットフォームは、データの検索および照会の容易さのために、分散記憶システムに接続された分散型検索システムを担持し得る。管理プラットフォームにおける管理が必要なデータは、分散型検索システムを使用することにより検索されて照会され、したがってデータ管理の柔軟性および安定性が保証される。
クラウドコンピューティングシステムは、管理プラットフォームにおけるすべてのデータ演算を引き受けるように使用される。実際の用途では、クラウドコンピューティングシステムは、管理プラットフォームにおける分散記憶システム、ユーザデータ分析システム、材料スクリーニングシステム、および画像認識システムに対して別個に接続されて、分散記憶システム、ユーザデータ分析システム、材料スクリーニングシステム、および画像認識システムのすべてのデータ演算を引き受けることができ、したがって管理プラットフォームのデータ処理効率を改善する。
クラウドコンピューティングシステムに担持されているデータ分析論理は、バックエンド管理システムを使用することによりオペレータによって手動で設定されてよく、本出願では特に限定されない。
画像認識システムは、ARクライアント端末にクラウド画像認識サービスを提供するように使用される。画像認識システムはクラウドコンピューティングプラットホームに接続されてよく、クラウドコンピューティングプラットホームを使用することにより、ARクライアント端末によってアップロードされた画像データからピクチャ特徴を抽出し、抽出されたピクチャ特徴とピクチャ認識材料のライブラリにおけるピクチャ特徴サンプルの間の類似度を一つずつ計算して、画像データに関する画像認識を完了する。
ユーザデータ分析システムは、収集システムによって収集されたユーザの挙動ログに対するビッグデータ分析を遂行するように使用される。画像認識システムはクラウドコンピューティングプラットホームに接続されてよく、クラウドコンピューティングプラットホームに担持されているビッグデータ分析アルゴリズムを使用して、収集システムによって収集されたユーザの挙動ログに対してビッグデータ分析を遂行することにより、ユーザの挙動の選好を取得し得る。
クラウドコンピューティングプラットフォームに担持されているビッグデータ分析アルゴリズムは、バックエンド管理システムを使用することによりオペレータによって手動で設定されてもよく、本出願では特に限定されない。
材料スクリーニングシステムは、分散記憶システムに記憶されたピクチャ認識材料のライブラリから、ARクライアント端末によってアップロードされた、ユーザ情報に関連したピクチャ特徴サンプルを選出するのに使用される。材料スクリーニングシステムはクラウドコンピューティングプラットホームに接続されてよい。材料スクリーニングシステムは、クラウドコンピューティングプラットホームを使用することにより、ピクチャ認識材料のライブラリにおけるピクチャ特徴サンプルに関連した位置とユーザの位置の間の距離を別個に計算して、前述のピクチャ特徴サンプルのライブラリから、ユーザの位置までの距離が事前設定の閾値未満であるいくつかのピクチャ特徴サンプルを予備的に選出する。
材料スクリーニングシステムは、クラウドコンピューティングプラットホームを使用することにより、ユーザの収集された挙動ログに対するビッグデータ分析が遂行された後に、ユーザの挙動の選好を判定して、これらの予備的に選出されたピクチャ特徴サンプルからユーザの挙動の選好を満たすピクチャ特徴サンプルをさらに選出し、次いで、さらに選出されたピクチャ特徴サンプルに基づき、ピクチャ特徴サンプルのサブライブラリを生成する。
コンテンツプッシュシステムは、選出されたピクチャ特徴サンプルに基づき材料スクリーニングシステムによって生成されたピクチャ特徴サンプルのサブライブラリを、ARクライアント端末にプッシュするのに使用される。
ARクライアント端末がピクチャ特徴サンプルのサブライブラリにおける何らかのピクチャ特徴サンプルに対応するオフラインターゲットを成功裡に認識したとき、コンテンツプッシュシステムは、分散記憶システムにおいてピクチャ特徴サンプルに関連づけて記憶されるプレゼンテーションデータおよびプレゼンテーション効果をARクライアント端末にプッシュする。ARクライアント端末は、ARシーンにおいて認識されたオフラインターゲットに対応する位置に、プレゼンテーションデータを、プレゼンテーション効果に基づいて拡張されたやり方で表示する。
本出願の技術的解決策が、ピクチャ特徴サンプルのライブラリの生成、ピクチャ特徴サンプルのスクリーニング、および画像認識といった3つのステージを参照して、例として、図2に示された前述の機能ノードを使用しながら以下で詳細に説明される。
図2に示されたARサーバ端末のアーキテクチャは単なる例示であり、本出願を限定するように意図されたものではないことに留意されたい。もちろん、当業者なら、実際の用途では、図2に示された機能ノードを、実際の要件(たとえば複数の機能ノードを1つの機能ノードへと結合する)に従って機能的に組み込み得、または、図2に示された機能ノードを機能的にさらに細分し得る(たとえばいずれかの機能ノードを複数の機能ノードに細分し得る)。本出願では詳細を列挙することはない。
1) ピクチャ特徴サンプルのライブラリの生成
この実施形態では、オペレータは、バックエンド管理システムにログインすることにより、ピクチャ認識材料のライブラリに対して、対応するピクチャ特徴サンプルおよび関連する位置を手動で追加し得る。このやり方に加えて、管理プラットフォームは、担持されているデータ収集システムを使用して、積極的に、ピクチャサンプルおよびピクチャサンプルに関連した位置をさらに収集し得る。
示された一実装形態では、データ収集システムは、インターネット上の多くのオンラインサービスデータから、ピクチャサンプルおよびピクチャサンプルに関連した位置を、インターネットクローラなどのやり方で積極的に収集し得る。
別の示された実装形態では、データ収集システムは、多くのオンラインサービスデータからピクチャサンプルを積極的に収集することに加えて、さらに、ピクチャサンプルおよび位置を記憶している接続されたサードパーティのサーバ端末から、ピクチャサンプルおよびピクチャサンプルに関連した位置を直接収集し得る。たとえば、管理プラットフォームは、接続された提携先のサービスプラットフォームに記憶されているピクチャサンプルおよびピクチャサンプルに関連した位置をインポートし得る。
実際の用途では、管理プラットフォームは、上記で示された、ピクチャサンプルを収集する2つのやり方のいずれかを使用してよく、またはこれらを有機的に組み合わせ得ることに留意されたい。これは、本出願では特に限定されない。
この実施形態では、収集されたピクチャサンプルおよび関連する位置は、すべて分散記憶システムに記憶され得る。クラウドコンピューティングシステムは、担持されているピクチャ特徴抽出アルゴリズムを使用して、分散記憶システムに記憶されているピクチャサンプルからピクチャ特徴を抽出し、次いで、抽出されたピクチャ特徴およびピクチャサンプルに関連した位置に基づいて、分散記憶システムに、ピクチャ認識材料のライブラリを生成してよい。この場合、生成されたピクチャ認識材料のライブラリに記憶される情報は、ピクチャサンプルおよびピクチャサンプルに関連した位置に対応する抽出されたピクチャ特徴を含む。
オペレータは、ピクチャ認識材料のライブラリが生成された後に、WEBブラウザを使用して管理プラットフォームのポータルURLアドレスにアクセスし、次いで、管理プラットフォームのコンテンツを管理するために、管理アカウントおよびパスワードを入力して、バックエンド管理システムに遠隔でログインし得る。
オペレータは、バックエンド管理システムに対して成功裡にログインしたとき、バックエンド管理システムによって提供された可視ユーザインターフェースにおいて、ピクチャ認識材料のライブラリにおけるそれぞれのピクチャ特徴サンプルについて対応する管理動作を遂行して、ピクチャ特徴サンプルに対応するオフラインターゲットに関連して提示される必要のあるプレゼンテーションデータを構成し、プレゼンテーションデータに関するプレゼンテーション効果を構成してよい。
バックエンド管理システムは、オペレータが構成したプレゼンテーションデータおよびプレゼンテーション効果を取得して、検索を容易にするために、ピクチャ認識材料のライブラリにおける対応するピクチャ特徴サンプルに関連づけて記憶する。
加えて、オペレータは、バックエンド管理システムによって提供された可視ユーザインターフェースにおいて、構成されたプレゼンテーションデータおよびプレゼンテーション効果に対して対応する更新操作をさらに遂行して、これらを動的に更新してよい。バックエンド管理システムは、オペレータの更新操作に応答して、分散型検索システムを使用することにより、ピクチャ認識材料のライブラリに、対応するピクチャ特徴サンプルを照会して、オペレータによって再構成されたプレゼンテーションデータおよびプレゼンテーション効果に基づき、ピクチャ特徴サンプルに関連づけて記憶されている元のプレゼンテーションデータおよびプレゼンテーション効果を更新してよい。
このように、オペレータは、バックエンド管理システムにログインすることにより、いつでも、ピクチャ認識材料のライブラリにおけるピクチャ特徴サンプルに関連づけて記憶されているプレゼンテーションデータおよびプレゼンテーション効果を、実際の要件に従って動的に更新し得、したがって、プレゼンテーションデータおよびプレゼンテーション効果の管理の柔軟性が改善する。
2) ピクチャ特徴サンプルのスクリーニング
この実施形態では、ユーザがARクライアント端末を使用するとき、ARクライアント端末はユーザの位置および挙動ログを収集し、次いで、クラウドサービスインターフェースにアクセスして、収集されたユーザの位置および挙動ログを管理プラットフォームにリアルタイムでアップロードし得る。管理プラットフォームは、担持されているデータ収集システムを使用することにより、ARクライアント端末によってアップロードされたユーザの位置および挙動ログを収集して、ARクライアント端末によってアップロードされたユーザの情報および挙動ログに基づき、ピクチャ認識材料のライブラリにおけるピクチャ認識材料をより柔軟に管理し得る。
一方では、材料スクリーニングシステムはクラウドコンピューティングシステムに接続されてよく、クラウドコンピューティングシステムがすべてのデータスクリーニング演算を引き受ける。クラウドコンピューティングシステムは、ARクライアント端末によってアップロードされたユーザの位置とピクチャ認識材料のライブラリにおけるピクチャ特徴サンプルに関連した位置の間の距離を、リアルタイムで計算し得る。クラウドコンピューティングシステムが演算を完了した後に、材料スクリーニングシステムは、ユーザの位置までの距離が事前設定の閾値未満であるピクチャ特徴サンプルを予備的に選出してよい。この場合、ピクチャ認識材料のライブラリに対する予備スクリーニングは完了している。
たとえば、ピクチャ認識材料のライブラリが多数のオフライン商店のロゴから抽出されたピクチャ特徴サンプルを記憶しており、ユーザがARクライアント端末を使用してオフライン商店において毎日走査を遂行する用途のシナリオが、一例として使用される。ユーザがARクライアント端末を使用してオフライン商店のロゴを走査する前に、ARクライアント端末は、管理プラットフォームにユーザの位置をリアルタイムでアップロードしてよい。管理プラットフォームは、ユーザの位置に基づき、ピクチャ認識材料のライブラリからユーザの近くの特定の範囲内の小売商のロゴピクチャを選出して、ユーザに関するピクチャ特徴サンプルのサブライブラリを生成してよく、したがって、ARクライアント端末にプッシュする必要のあるロゴピクチャの数が減少する。
他方では、ユーザデータ分析システムはクラウドコンピューティングシステムに接続されてもよい。クラウドコンピューティングシステムはすべてのデータ分析演算を引き受ける。クラウドコンピューティングシステムは、担持されているビッグデータ分析アルゴリズムに基づき、データ収集システムによって収集されたユーザの挙動ログに対するビッグデータ分析を遂行して、ユーザの挙動の選好を判定し得る。
挙動の選好は、具体的には、ユーザによるARクライアント端末の日々の使用中に形成された特定の使用法の習慣または使用法のルールを指す。
たとえば、ピクチャ認識材料のライブラリが多数のオフライン商店のロゴから抽出されたピクチャ特徴サンプルを記憶しており、ユーザがARクライアント端末を使用してオフライン商店において毎日走査を遂行する前述の用途のシナリオが、引き続き一例として使用される。ARクライアント端末は、ユーザがオフライン商店を走査するごとに生成された関係のある挙動データをローカルに記録し、対応するログファイルを生成して、すべてのログファイルを管理プラットフォームにアップロードしてよい。管理プラットフォームは、クラウドコンピューティングプラットホームを使用することにより、収集されたログファイルに対するビッグデータ分析を遂行して、オフライン商店に関するユーザの選好をさらに分析し得る。たとえば、分析したとき、ユーザが、日常生活において、クーポンを提供するオフライン商店や低価格商品を売るオフライン商店を好むことが分かる。
管理プラットフォームが挙動ログに対するビッグデータ分析を用いてユーザの挙動の選好を判定した後に、材料スクリーニングシステムは、予備的に選出されたピクチャ特徴サンプルの数をさらに減少して、プッシュされるピクチャ認識材料の数を減少するために、予備的に選出されたピクチャ特徴サンプルから、ユーザの挙動の選好を満たすピクチャ特徴サンプルをさらに選出してよい。
たとえば、ピクチャ認識材料のライブラリが多数のオフライン商店のロゴから抽出されたピクチャ特徴サンプルを記憶しており、ユーザがARクライアント端末を使用してオフライン商店において毎日走査を遂行する前述の用途のシナリオが、引き続き一例として使用される。分析により、管理プラットフォームが、ユーザの日々の挙動の選好が「クーポンを提供するオフライン商店」および「低価格商品を売るオフライン商店」であると学習していると想定して、材料スクリーニングシステムは、これらの予備的に選出されたピクチャ特徴サンプルに対応するオフライン商店の関連情報にアクセスすることにより、ユーザにクーポンを提供することができるオフライン商店および低価格商品を売るオフライン商店をさらに探索してよい。次いで、材料スクリーニングシステムは、これらのオフライン商店に対応するピクチャ特徴サンプルをさらに選出する。
これらの予備的に選出されたピクチャ特徴サンプルからユーザの挙動の選好を満たすピクチャ特徴サンプルを選出したとき、管理プラットフォームは、これらの最後に選出されたピクチャ特徴サンプルに基づき、ユーザに関するピクチャ特徴サンプルのサブライブラリを生成し得る。次いで、管理プラットフォームは、生成されたピクチャ特徴サンプルのサブライブラリを、コンテンツプッシュシステムを使用してARクライアント端末にプッシュする。
材料スクリーニングシステムは、ピクチャ認識材料のライブラリにおけるピクチャ特徴サンプルをスクリーニングするとき、ユーザの位置に基づく予備的スクリーニングを遂行し、次いで、分析を通じて取得されたユーザ選好に基づくさらなるスクリーニングを遂行することに留意されたい。しかしながら、実際の用途では、材料スクリーニングシステムは、分析を通じて取得されたユーザ選好に基づくさらなるスクリーニングを遂行することなく、予備的スクリーニングの結果に基づき、ユーザに関するピクチャ特徴サンプルのサブライブラリを直接生成してもよい。本出願では詳細を説明することはない。
3) 画像認識
この実施形態では、ARクライアント端末は、管理プラットフォームによってプッシュされたピクチャ特徴サンプルのサブライブラリを受け取ったとき、ピクチャ特徴サンプルのサブライブラリをローカルにロードしてよい。ユーザがオフライン環境において画像を走査するためにARクライアント端末を使用するとき、ARクライアント端末は、フロントエンドのARエンジンに担持されている画像認識アルゴリズムに基づき、走査された画像情報からピクチャ特徴を抽出し、次いで、ピクチャ特徴とピクチャ特徴サンプルのサブライブラリにおけるピクチャ特徴サンプルの間の類似性の照合を一つずつ遂行して、走査された画像情報に対する画像認識を完了し得る。この実施形態では、画像認識における特定の演算プロセスが詳細に説明されることはない。当業者なら、本出願に記録された技術的解決策を実行するとき、従来の技術における記録を参照し得る。
この場合、管理プラットフォームによってプッシュされたピクチャ特徴サンプルのサブライブラリにおけるピクチャ特徴サンプルは、ユーザの位置および挙動の選好に基づいて洗練されたやり方で選出される。したがって、ARクライアント端末は、ユーザのオフライン環境から走査された画像データに対して画像認識を遂行するとき、管理プラットフォームにおいて生成されたピクチャ認識材料のライブラリにおけるすべてのピクチャ認識材料を連続的にあちこち移動する必要がなく、したがってARクライアント端末の画像認識効率が大幅に改善される。
もちろん、ARクライアント端末は、走査された画像情報に対してローカルで画像認識を遂行することに加えて、クラウドサーバ端末インターフェースにアクセスすることにより、走査された画像情報を管理プラットフォームにリアルタイムでさらにアップロードし得る。管理プラットフォームに担持されている画像認識システムは、ユーザのために選出されて生成されたピクチャ特徴サンプルのサブライブラリに基づき、走査された画像情報に対する画像認識を完了する。
この実施形態では、ピクチャ特徴サンプルのサブライブラリにおける何らかのピクチャ特徴サンプルに対応するオフラインターゲットが、上記に示された画像認識プロセスによって、走査された画像情報から最終的に認識されたとき、分散型検索システムは、分散記憶システムに、ピクチャ特徴サンプルに関連して記憶されているプレゼンテーションデータおよびプレゼンテーション効果を照会し、次いで、見つかったプレゼンテーションデータおよびプレゼンテーション効果を、コンテンツプッシュシステムを使用してARクライアント端末にプッシュし得る。
ARクライアント端末は、プッシュされたプレゼンテーションデータおよびプレゼンテーション効果を受け取った後、ARシーンにおいて認識されたオフラインターゲットに対応する位置に、プレゼンテーションデータを、プレゼンテーション効果に基づいて拡張されたやり方で表示してよい。
実際の用途では、ピクチャ特徴サンプルのサブライブラリにおけるピクチャ特徴サンプルに関連して記憶されているプレゼンテーションデータおよびプレゼンテーション効果も、コンテンツプッシュシステムが生成されたピクチャ特徴サンプルのサブライブラリをプッシュしている間に、コンテンツプッシュシステムによってARクライアント端末にプッシュされ得ることに留意されたい。すなわち、オペレータによって構成されたプレゼンテーションデータおよびプレゼンテーション効果は、生成されたピクチャ特徴サンプルのサブライブラリとともにARクライアント端末にプッシュされてよく、または画像認識が完成した後に別個にプッシュされてもよい。これは、本出願では特に限定されない。
前述の実施形態から、本出願は、ARクライアント端末によってアップロードされたユーザ情報に基づきARクライアント端末のためのピクチャ認識材料を柔軟に選出して、選出された材料をARクライアント端末にプッシュすることができるARサーバ端末を提供することが知られ得る。
ARサーバ端末は、ARクライアント端末によってアップロードされたユーザ情報を収集し、事前設定のピクチャ特徴サンプルのライブラリからユーザ情報に関連したピクチャ特徴サンプルを選出して、選出されたピクチャ特徴サンプルに基づき、ユーザ情報に対応するピクチャ特徴サンプルのサブライブラリを生成することができる。次いで、ARサーバ端末は、ピクチャ特徴サンプルのサブライブラリをARクライアント端末にプッシュし、これにより、ARクライアント端末が、ユーザのオフライン環境における画像走査中に、ピクチャ特徴サンプルのサブライブラリに基づき、走査された画像情報に対して画像認識を遂行する。
全体の解決策では、ARサーバ端末がユーザ情報に基づいてピクチャ特徴サンプルのライブラリをスクリーニングするため、ARクライアント端末に対してARサーバ端末によってプッシュされるピクチャ認識材料の数、およびARクライアント端末が画像認識を遂行するときに使用されるピクチャ認識材料の数が、かなり減少され得、したがってARクライアント端末の演算量が低減され、ARクライアント端末の画像認識効率が改善する。
本出願は、前述の方法の実施形態に対応する装置の実施形態をさらに提供するものである。
図3を参照して、本出願は拡張現実に基づく画像認識装置30を提供するものであり、この装置はARサーバ端末に適用される。図4を参照して、拡張現実に基づく画像認識装置30を担持するARサーバ端末に包含されているハードウェアアーキテクチャは、一般に、CPU、記憶装置、不揮発性記憶デバイス、ネットワークインターフェース、内部バスなどを含む。一例としてソフトウェアの実装形態を使用して、拡張現実に基づく画像認識装置30は、一般に、記憶装置にロードされたコンピュータプログラムをCPUが実行した後に形成される、ソフトウェアとハードウェア組み合わせた論理装置と解釈されてよい。装置30は、
拡張現実クライアント端末によってアップロードされたユーザ情報を収集するように構成された収集モジュール301と、
事前設定のピクチャ特徴サンプルのライブラリからユーザ情報に関連したピクチャ特徴サンプルを選出するように構成されたスクリーニングモジュール302と、
選出されたピクチャ特徴サンプルに基づきユーザ情報に対応するピクチャ特徴サンプルのサブライブラリを生成して、拡張現実クライアント端末にプッシュし、これにより、拡張現実クライアント端末が、ユーザのオフライン環境における画像走査中に、走査された画像情報に対して、ピクチャ特徴サンプルのサブライブラリに基づき画像認識を遂行するように構成されたプッシュモジュール303とを含む。
この実施形態では、ユーザ情報はユーザの位置を含み、
装置30は、
接続されているサードパーティのサーバ端末に記憶されたピクチャサンプルおよびピクチャサンプルに関連した位置を収集し、かつ/または、事前設定のデータ収集アルゴリズムに基づきオンラインサービスデータからピクチャサンプルおよびピクチャサンプルに関連した位置を収集するように構成された収集モジュール304(図3には示されていない)と、
収集されたピクチャサンプルからピクチャ特徴サンプルを抽出して、抽出されたピクチャ特徴サンプルおよびピクチャサンプルに関連した位置に基づきピクチャ特徴サンプルのライブラリをローカルで生成するように構成された生成モジュール305(図3には示されていない)とをさらに含む。
この実施形態では、装置は、
オペレータによってピクチャ特徴サンプルのライブラリにおけるピクチャ特徴サンプルのために構成されたプレゼンテーションデータおよびプレゼンテーションデータのために構成されたプレゼンテーション効果を取得するように構成された収集モジュール306(図3には示されていない)と、
取得されたプレゼンテーションデータおよびプレゼンテーション効果をピクチャ特徴サンプルのライブラリにおけるピクチャ特徴サンプルに関連づけて記憶し、オペレータの更新操作に応答してプレゼンテーションデータおよびプレゼンテーション効果を動的に更新するように構成された記憶モジュール307(図3には示されていない)とをさらに含む。
この実施形態では、装置30には、
拡張現実クライアント端末がアップロードした、走査された画像情報を受け取り、生成されたピクチャ特徴サンプルのサブライブラリに基づき、画像情報に対して画像認識を遂行するように構成された認識モジュール308(図3には示されていない)がさらに含まれる。
この実施形態では、プッシュモジュール303は、画像情報から、ピクチャ特徴サンプルのサブライブラリにおけるいずれかのピクチャ特徴サンプルに対応するオフラインターゲットが認識されたとき、ピクチャ特徴サンプルに関連したプレゼンテーションデータおよびプレゼンテーションデータに関連したプレゼンテーション効果を拡張現実クライアント端末にプッシュし、これにより、拡張現実クライアント端末が、拡張現実シーンにおけるオフラインターゲットに対応する位置に、プレゼンテーションデータを、プレゼンテーション効果に基づいて拡張されたやり方で表示するようにさらに構成されている。
この実施形態では、スクリーニングモジュール302は、
拡張現実クライアント端末によってアップロードされたユーザの位置と、ピクチャ特徴サンプルのライブラリにおけるピクチャ特徴サンプルに関連した位置の間の距離を計算して、
ピクチャ特徴サンプルのライブラリから、事前設定の閾値未満の距離を有するピクチャ特徴サンプルを選出するように構成されている。
この実施形態では、ユーザ情報はユーザの挙動ログをさらに含み、
スクリーニングモジュール302は、
収集されたユーザの挙動ログに対するビッグデータ分析を遂行してユーザの挙動の選好を判定し、
事前設定の閾値未満の距離を有するピクチャ特徴サンプルからユーザの挙動の選好を満たすピクチャ特徴サンプルをさらに選出するようにさらに構成されている。
装置の実施形態は、基本的に方法の実施形態に対応するものである。したがって、関係のある部分については、方法の実施形態の説明が参照されてよい。説明された装置の実施形態は単なる例示であり、個別の部分として説明されたユニットは、物理的に分離していても分離していなくてもよい。ユニットとして表示された部分は、物理装置であってもなくてもよく、すなわち、その部分は1個所に配置されてよく、または複数のネットワークユニット上に分散してもよい。本出願の解決策の目的を実施するために、いくつかまたはすべてのモジュールが、実際の要件に応じて選択され得る。当業者なら、創造的な努力をしなくても、本出願を理解しかつ実施し得る。
前述の実施形態において示された装置、モジュール、またはユニットは、コンピュータチップもしくはコンピュータエンティティ、または特定の機能を有する製品によって実施され得るものである。一般的な実装デバイスはコンピュータである。コンピュータの特定の形態は、パソコン、ラップトップコンピュータ、携帯電話、カメラ付き携帯電話、スマートフォン、携帯情報端末、メディアプレーヤ、ナビゲーションデバイス、電子メール送受デバイス、ゲーム機、タブレットコンピュータ、ウェアラブルデバイス、またはこれらのデバイスのうちのいくつかの組合せでよい。
当業者なら、本明細書を検討して、本明細書で開示された本発明を実施した後には、本出願の他の実装形態の解決策を容易に思いつくことができる。本出願は、本出願のあらゆる変形形態、用法、または改造を対象として含むように意図されている。これらの変形形態、用法、または改造は、本出願の一般的原理に従うものであり、本出願には開示されていない、当技術分野における周知の事実または従来の技術手段を含む。明細書および実施形態は単なる例示と見なされ、本出願の実際の範囲および精神は以下の特許請求の範囲によって指示される。
本出願は、上記で説明されて添付図面に示されたものと少しも違わない構造に限定されるものではなく、本出願の範囲から逸脱することなく様々な修正形態および変更形態が作製され得ることを理解されたい。本出願の範囲は、添付の特許請求の範囲によってのみ限定される。
上記で説明されたことは本出願の望ましい実施形態でしかなく、本出願を制限するようには意図されてはいない。本出願の精神および原理の範囲内でなされる、いかなる変更、等価な置換または改善も、本出願の保護範囲内に入るものとする。
30 画像認識装置、不揮発性記憶デバイス
301 収集モジュール
302 スクリーニングモジュール
303 プッシュモジュール
304 収集モジュール
305 生成モジュール
306 収集モジュール
307 更新モジュール
308 認識モジュール

Claims (10)

  1. 拡張現実に基づく画像認識のためのサーバ端末により実行される方法であって、
    拡張現実クライアント端末によってアップロードされたユーザ情報を収集するステップであって、前記ユーザの情報が前記ユーザの位置および挙動ログを含む、ステップと、
    事前設定のピクチャ特徴サンプルのライブラリから前記ユーザ情報に関連したピクチャ特徴サンプルを選出するステップであって、前記ピクチャ特徴サンプルは位置に関連付けられる、ステップと、
    前記選出されたピクチャ特徴サンプルに基づき前記ユーザ情報に対応するピクチャ特徴サンプルのサブライブラリを生成するステップであって、前記サブライブラリは、前記拡張現実クライアント端末が、走査された画像情報に対してオフライン環境において画像認識を遂行するためのものであり、該生成するステップが、
    前記拡張現実クライアント端末によってアップロードされた前記ユーザの前記位置と、前記ピクチャ特徴サンプルのライブラリにおける前記ピクチャ特徴サンプルに関連した前記位置の間の距離を計算するステップと、
    収集された前記ユーザの挙動ログに基づき、前記ユーザの挙動の選好を判定するステップと、
    前記ピクチャ特徴サンプルのライブラリから、事前設定の閾値未満の前記距離を有し、かつ前記ユーザの前記挙動の選好を満たすピクチャ特徴サンプルを選出するステップと
    を含む、生成するステップと、
    前記拡張現実クライアント端末に前記ピクチャ特徴サンプルのサブライブラリを送信するステップとを含む、方法。
  2. 記方法が、
    ードパーティのサーバ端末に記憶されたピクチャサンプル、および前記ピクチャサンプルに関連した位置を収集するステップ、および/または、
    ンラインサービスデータからピクチャサンプル、および前記ピクチャサンプルに関連した位置を収集するステップと、
    前記収集されたピクチャサンプルからピクチャ特徴サンプルを抽出するステップと、
    前記抽出されたピクチャ特徴サンプルおよび前記ピクチャサンプルに関連した前記位置に基づき前記ピクチャ特徴サンプルのライブラリをローカルで生成するステップとをさらに含む、請求項1に記載の方法。
  3. オペレータによって前記ピクチャ特徴サンプルのライブラリにおける前記ピクチャ特徴サンプルのために構成されたプレゼンテーションデータおよび前記プレゼンテーションデータのために構成されたプレゼンテーション効果を取得するステップと、
    前記取得されたプレゼンテーションデータおよびプレゼンテーション効果を、前記ピクチャ特徴サンプルのライブラリにおける前記ピクチャ特徴サンプルに関連づけて記憶するステップと、
    前記オペレータの更新操作に応答して前記プレゼンテーションデータおよび前記プレゼンテーション効果を動的に更新するステップとをさらに含む、請求項2に記載の方法。
  4. 前記拡張現実クライアント端末によってアップロードされた、前記走査された画像情報を受け取るステップと、
    前記生成されたピクチャ特徴サンプルのサブライブラリに基づき、前記画像情報に対して画像認識を遂行するステップとをさらに含む、請求項1に記載の方法。
  5. 前記画像情報から、前記ピクチャ特徴サンプルのサブライブラリにおけるいずれかのピクチャ特徴サンプルに対応するオフラインターゲットが認識されたとき、前記ピクチャ特徴サンプルに関連したプレゼンテーションデータおよび前記プレゼンテーションデータに関連したプレゼンテーション効果を前記拡張現実クライアント端末に送信するステップであって、前記拡張現実クライアント端末、拡張現実シーンにおける前記オフラインターゲットに対応する位置に、前記プレゼンテーションデータを、前記プレゼンテーション効果に基づいて拡張されたやり方で表示するステップをさらに含む、請求項1または4に記載の方法。
  6. 拡張現実に基づく画像認識のためのサーバ端末であって、
    拡張現実クライアント端末によってアップロードされたユーザ情報を収集するように構成された収集モジュールであって、前記ユーザの情報が前記ユーザの位置および挙動ログを含む、収集モジュールと、
    事前設定のピクチャ特徴サンプルのライブラリから前記ユーザ情報に関連したピクチャ特徴サンプルを選出するように構成されたスクリーニングモジュールであって、前記ピクチャ特徴サンプルは位置に関連付けられる、スクリーニングモジュールと、
    前記選出されたピクチャ特徴サンプルに基づき前記ユーザ情報に対応するピクチャ特徴サンプルのサブライブラリを生成するように構成されたモジュールであって、前記サブライブラリは、前記拡張現実クライアント端末が、走査された画像情報に対してオフライン環境において画像認識を遂行するためのものであり、
    前記拡張現実クライアント端末によってアップロードされた前記ユーザの前記位置と、前記ピクチャ特徴サンプルのライブラリにおける前記ピクチャ特徴サンプルに関連した前記位置の間の距離を計算することと、
    収集された前記ユーザの挙動ログに基づき、前記ユーザの挙動の選好を判定することと、
    前記ピクチャ特徴サンプルのライブラリから、事前設定の閾値未満の前記距離を有し、かつ前記ユーザの前記挙動の選好を満たすピクチャ特徴サンプルを選出することを行うようにさらに構成されている、前記サブライブラリを生成するためのモジュールと
    前記拡張現実クライアント端末に前記ピクチャ特徴サンプルのサブライブラリを送信するように構成されたモジュールと
    を備える、サーバ端末
  7. ードパーティのサーバ端末に記憶されたピクチャサンプルおよび前記ピクチャサンプルに関連した位置を収集すること、および/または、オンラインサービスデータからピクチャサンプルおよび前記ピクチャサンプルに関連した位置を収集することを行うように構成された収集モジュールと、
    前記収集されたピクチャサンプルからピクチャ特徴サンプルを抽出すること、および、前記抽出されたピクチャ特徴サンプルおよび前記ピクチャサンプルに関連した前記位置に基づき前記ピクチャ特徴サンプルのライブラリをローカルで生成することを行うように構成された生成モジュールと
    をさらに備える、請求項6に記載のサーバ端末
  8. オペレータによって前記ピクチャ特徴サンプルのライブラリにおける前記ピクチャ特徴サンプルのために構成されたプレゼンテーションデータおよび前記プレゼンテーションデータのために構成されたプレゼンテーション効果を取得するように構成された取得モジュールと、
    前記取得されたプレゼンテーションデータおよびプレゼンテーション効果を、前記ピクチャ特徴サンプルのライブラリにおける前記ピクチャ特徴サンプルに関連づけて記憶すること、および、前記オペレータの更新操作に応答して前記プレゼンテーションデータおよび前記プレゼンテーション効果を動的に更新することを行うに構成された記憶モジュールと
    をさらに備える、請求項7に記載のサーバ端末
  9. 前記拡張現実クライアント端末によってアップロードされた、前記走査された画像情報を受け取ること、および、前記生成されたピクチャ特徴サンプルのサブライブラリに基づき、前記画像情報に対して画像認識を遂行することを行うように構成された認識モジュールをさらに備える、請求項6に記載のサーバ端末
  10. 前記サブライブラリを送信するように構成されたジュールが、
    前記画像情報から、前記ピクチャ特徴サンプルのサブライブラリにおけるいずれかのピクチャ特徴サンプルに対応するオフラインターゲットが認識されたとき、前記ピクチャ特徴サンプルに関連したプレゼンテーションデータおよび前記プレゼンテーションデータに関連したプレゼンテーション効果を前記拡張現実クライアント端末に送信するように構成され、前記拡張現実クライアント端末が、拡張現実シーンにおける前記オフラインターゲットに対応する位置に、前記プレゼンテーションデータを、前記プレゼンテーション効果に基づいて拡張されたやり方で表示する、請求項6または9に記載のサーバ端末
JP2019558338A 2017-01-11 2018-01-11 拡張現実に基づく画像認識方法および装置 Active JP6736145B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201710018395.1A CN107038408A (zh) 2017-01-11 2017-01-11 基于增强现实的图像识别方法及装置
CN201710018395.1 2017-01-11
US15/864,572 2018-01-08
US15/864,572 US10614341B2 (en) 2017-01-11 2018-01-08 Image recognition based on augmented reality
PCT/US2018/013344 WO2018132590A1 (en) 2017-01-11 2018-01-11 Image recognition method and apparatus based on augmented reality

Publications (2)

Publication Number Publication Date
JP2020507173A JP2020507173A (ja) 2020-03-05
JP6736145B2 true JP6736145B2 (ja) 2020-08-05

Family

ID=59530481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019558338A Active JP6736145B2 (ja) 2017-01-11 2018-01-11 拡張現実に基づく画像認識方法および装置

Country Status (9)

Country Link
US (2) US10614341B2 (ja)
EP (1) EP3568805A4 (ja)
JP (1) JP6736145B2 (ja)
KR (1) KR102222087B1 (ja)
CN (1) CN107038408A (ja)
PH (1) PH12019501599A1 (ja)
SG (1) SG11201906315TA (ja)
TW (1) TWI691934B (ja)
WO (1) WO2018132590A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107038408A (zh) 2017-01-11 2017-08-11 阿里巴巴集团控股有限公司 基于增强现实的图像识别方法及装置
CN109062523B (zh) * 2018-06-14 2021-09-24 北京三快在线科技有限公司 增强现实数据的展示方法、装置、电子设备及存储介质
US10725629B2 (en) * 2018-06-25 2020-07-28 Google Llc Identifying and controlling smart devices
US11350264B2 (en) * 2018-07-25 2022-05-31 Samsung Electronics Co., Ltd. Method and apparatus for establishing device connection
CN109260705A (zh) * 2018-08-06 2019-01-25 光锐恒宇(北京)科技有限公司 游戏的实现方法、装置、智能终端和计算机可读存储介质
US11430216B2 (en) 2018-10-22 2022-08-30 Hewlett-Packard Development Company, L.P. Displaying data related to objects in images
EP3921803A4 (en) * 2019-02-04 2022-11-02 Beam Therapeutics, Inc. SYSTEMS AND PROCESSES FOR MIXED REALITY IMPLEMENTED IN LABORATORY AUTOMATION
CN110020981A (zh) * 2019-03-27 2019-07-16 阿里巴巴集团控股有限公司 一种图像信息处理方法、装置及电子设备
CN113923252B (zh) * 2021-09-30 2023-11-21 北京蜂巢世纪科技有限公司 图像显示装置、方法和系统

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7522163B2 (en) 2004-08-28 2009-04-21 David Holmes Method and apparatus for determining offsets of a part from a digital image
US7945099B2 (en) * 2005-05-09 2011-05-17 Like.Com System and method for use of images with recognition analysis
US20090237546A1 (en) * 2008-03-24 2009-09-24 Sony Ericsson Mobile Communications Ab Mobile Device with Image Recognition Processing Capability
US8190604B2 (en) * 2008-04-03 2012-05-29 Microsoft Corporation User intention modeling for interactive image retrieval
US8819172B2 (en) 2010-11-04 2014-08-26 Digimarc Corporation Smartphone-based methods and systems
US20110279445A1 (en) * 2010-05-16 2011-11-17 Nokia Corporation Method and apparatus for presenting location-based content
KR101746838B1 (ko) * 2010-06-14 2017-06-27 주식회사 비즈모델라인 진열대를 이용한 증강현실 운영 방법
JP2015062090A (ja) 2011-12-15 2015-04-02 日本電気株式会社 映像処理システム、映像処理方法、携帯端末用またはサーバ用の映像処理装置およびその制御方法と制御プログラム
US8654149B2 (en) 2011-12-20 2014-02-18 Honeywell International Inc. System and method for displaying enhanced vision and synthetic images
JP6168303B2 (ja) 2012-01-30 2017-07-26 日本電気株式会社 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム
US9678617B2 (en) 2013-01-14 2017-06-13 Patrick Soon-Shiong Shared real-time content editing activated by an image
US9338603B2 (en) 2013-09-30 2016-05-10 Qualcomm Incorporated Location based brand detection
JP2015090553A (ja) 2013-11-05 2015-05-11 株式会社ソニー・コンピュータエンタテインメント 端末装置、付加情報管理装置、および付加情報管理方法
JP6435779B2 (ja) 2014-10-30 2018-12-12 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN104834375A (zh) * 2015-05-05 2015-08-12 常州恐龙园股份有限公司 基于增强现实的游乐园指南系统
JP2017016466A (ja) 2015-07-02 2017-01-19 富士通株式会社 端末制御方法、画像生成方法、端末制御プログラム、及び端末
US20170103440A1 (en) * 2015-08-01 2017-04-13 Zhou Tian Xing Wearable augmented reality eyeglass communication device including mobile phone and mobile computing via virtual touch screen gesture control and neuron command
CN105243142A (zh) * 2015-10-10 2016-01-13 安徽尚舟电子科技有限公司 一种基于增强现实与可视计算的智能信息推送方法
CN105227448B (zh) * 2015-10-30 2019-09-17 Tcl集团股份有限公司 一种信息推送方法及系统
US10052170B2 (en) 2015-12-18 2018-08-21 MediLux Capitol Holdings, S.A.R.L. Mixed reality imaging system, apparatus and surgical suite
US20170352282A1 (en) 2016-06-03 2017-12-07 International Business Machines Corporation Image-based feedback for assembly instructions
CN107038408A (zh) 2017-01-11 2017-08-11 阿里巴巴集团控股有限公司 基于增强现实的图像识别方法及装置
US20190005724A1 (en) * 2017-06-30 2019-01-03 Microsoft Technology Licensing, Llc Presenting augmented reality display data in physical presentation environments
US10565764B2 (en) * 2018-04-09 2020-02-18 At&T Intellectual Property I, L.P. Collaborative augmented reality system
US20180350144A1 (en) * 2018-07-27 2018-12-06 Yogesh Rathod Generating, recording, simulating, displaying and sharing user related real world activities, actions, events, participations, transactions, status, experience, expressions, scenes, sharing, interactions with entities and associated plurality types of data in virtual world

Also Published As

Publication number Publication date
EP3568805A1 (en) 2019-11-20
US20200234077A1 (en) 2020-07-23
WO2018132590A1 (en) 2018-07-19
SG11201906315TA (en) 2019-08-27
TWI691934B (zh) 2020-04-21
JP2020507173A (ja) 2020-03-05
TW201826225A (zh) 2018-07-16
KR102222087B1 (ko) 2021-03-05
EP3568805A4 (en) 2020-01-15
US10762382B2 (en) 2020-09-01
US20180197043A1 (en) 2018-07-12
KR20190107069A (ko) 2019-09-18
PH12019501599A1 (en) 2020-02-24
CN107038408A (zh) 2017-08-11
US10614341B2 (en) 2020-04-07

Similar Documents

Publication Publication Date Title
JP6736145B2 (ja) 拡張現実に基づく画像認識方法および装置
US11017018B2 (en) Systems and methods of building and using an image catalog
WO2022116888A1 (zh) 一种视频数据处理方法、装置、设备以及介质
US11115724B2 (en) Visual hash tags via trending recognition activities, systems and methods
US10083357B2 (en) Image-based item location identification
KR101535579B1 (ko) 증강 현실 인터액션 구현 방법 및 시스템
US20180197220A1 (en) System and method of image-based product genre identification
US20190156395A1 (en) System and Method for Analyzing and Searching for Features Associated with Objects
US20170285922A1 (en) Systems and methods for creation and sharing of selectively animated digital photos
US20150169527A1 (en) Interacting method, apparatus and server based on image
CN104462468A (zh) 信息提供方法及装置
JP2009181468A (ja) 画像検索ログ収集システム、画像検索ログ収集方法、及びプログラム
CN113190757A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN111310049B (zh) 一种信息交互方法及相关设备
KR102592904B1 (ko) 영상 요약 장치 및 방법
CN104899306A (zh) 信息处理方法、信息显示方法及装置
CN108038760B (zh) 一种基于ar技术的商品展示控制系统
CN110084675A (zh) 一种线上商品销售方法、网络终端和具有存储功能的装置
CN116524088B (zh) 珠宝虚拟试戴方法、装置、计算机设备和存储介质
US20140358819A1 (en) Tying Objective Ratings To Online Items
CN106875464B (zh) 三维模型文件处理方法、上传方法及客户端
KR20200023095A (ko) 상품 정보 관리 방법 및 이를 지원하는 서비스 장치
CN114245174B (zh) 视频预览方法以及相关设备
US8997131B1 (en) Advertisements for recorded content
CN117035960A (zh) 数字藏品生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190904

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20191128

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200210

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200709

R150 Certificate of patent or registration of utility model

Ref document number: 6736145

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250