JP7364052B2 - 情報処理装置、制御方法及びプログラム - Google Patents
情報処理装置、制御方法及びプログラム Download PDFInfo
- Publication number
- JP7364052B2 JP7364052B2 JP2022514882A JP2022514882A JP7364052B2 JP 7364052 B2 JP7364052 B2 JP 7364052B2 JP 2022514882 A JP2022514882 A JP 2022514882A JP 2022514882 A JP2022514882 A JP 2022514882A JP 7364052 B2 JP7364052 B2 JP 7364052B2
- Authority
- JP
- Japan
- Prior art keywords
- label
- feature
- additional information
- feature point
- symmetry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 36
- 238000000034 method Methods 0.000 title claims description 25
- 238000003384 imaging method Methods 0.000 claims description 31
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 description 34
- 238000000605 extraction Methods 0.000 description 33
- 230000004048 modification Effects 0.000 description 19
- 238000012986 modification Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 16
- 238000001514 detection method Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 12
- 239000000284 extract Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000015654 memory Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 230000005484 gravity Effects 0.000 description 3
- 230000009182 swimming Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000002834 transmittance Methods 0.000 description 3
- 230000003936 working memory Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 210000005252 bulbus oculi Anatomy 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 210000001508 eye Anatomy 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/68—Analysis of geometric attributes of symmetry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Geometry (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Description
(1)概略構成
図1は、第1実施形態に係る表示装置1の概略構成図である。表示装置1は、ユーザが装着可能な装置であり、例えば眼鏡型に構成されたシースルー型であって、ユーザの頭部に装着可能に構成されている。そして、表示装置1は、スポーツ観戦や劇(コンサートを含む)の観賞などにおいて、実在する風景に視覚情報を重ねて表示することで、拡張現実(AR:Augmented Reality)を実現する。上記の視覚情報は、2次元又は3次元により表された仮想のオブジェクトであり、以後では、「仮想オブジェクト」とも呼ぶ。なお、表示装置1は、ユーザの片眼にのみ仮想オブジェクトを表示してもよく、両眼に対して仮想オブジェクトを表示してもよい。
図2は、制御部17の機能的な構成を示すブロック図である。図2に示すように、制御部17は、機能的には、撮像画像取得部40と、付加情報生成部41と、第2ラベル特徴抽出部42と、第1ラベル決定部43と、調整部44と、表示制御部45と、を有する。以下に説明するように、制御部17は、撮像画像Imから抽出した特徴点に対し、付加情報Iaに基づき、付加すべき第1ラベルを決定する。これにより、制御部17は、対称性を有する基準構造物Rtagに対しても正確な特徴抽出処理を行う。なお、図2では、データの授受が行われるブロック同士を実線(かつデータの授受が必須でないブロック同士を破線)により結んでいるが、データの授受が行われるブロックの組合せは図2に限定されない。後述する他の機能ブロックの図においても同様である。
次に、図2において説明した制御部17の処理について、基準構造物Rtagをテニスコートとした例を用いて具体例に説明する。
ここで、特徴抽出器及び特徴物推論器の学習について説明する。
図8は、第1実施形態において学習装置3が実行する処理概要を示すフローチャートの一例である。
次に、上述した第1実施形態に好適な変形例について説明する。以下の変形例は、任意に組み合わせてもよい。
表示装置1は、特徴点の位置と当該特徴点が属する第1ラベルとに関する情報を出力するように学習された特徴抽出器の出力と、付加情報Iaとに基づき、各特徴点への正確な第1ラベルの付与を行ってもよい。
特徴抽出の対象となる対称物は、スポーツやゲームなどのフィールド等の基準構造物Rtagに限定されず、また、対称性はn回対称に限らず、他の対称性を有してもよい。
表示装置1が実行する処理を、表示装置1と通信を行うサーバ装置が実行してもよい。
表示装置1が使用される位置が基準構造物Rtagに対して相対的に予め定まっている場合には、付加情報Iaは、予め記憶部14に記憶されてもよい。この場合、第1ラベル決定部43は、記憶部14から付加情報Iaを読み出すことで取得する。この場合、付加情報生成部41は存在しなくともよい。
表示装置1は、ユーザの頭部に装着可能に構成されたARデバイスに限定されない。これに代えて、表示装置1は、カメラと表示ディスプレイ(表示部)を有するスマートフォンなどの表示端末であってもよい。この場合、表示装置1は、図1の構成において、光源ユニット1に代えてディスプレイを有し、撮像部15が撮像した風景の画像に対して基準構造物Rtagの特徴抽出等を行う。そして、表示装置1は、基準構造物Rtagに対して何らかの情報を示した画像に相当する仮想オブジェクトを、上記の風景の画像に重畳してディスプレイに表示する。この場合であっても、表示装置1は、基準構造物Rtagの特徴抽出を的確に行い、仮想オブジェクトを適切な位置に表示させることができる。
図15は、第3実施形態における情報処理装置4の概略構成を示す。図14に示すように、情報処理装置4は、特徴点取得手段41Aと、ラベル決定手段43Aとを有する。情報処理装置4は、例えば、表示装置1の制御部17又はサーバ装置2の制御部27により実現される。
撮像部が撮像した撮像画像に基づき、対称性を有する対称物の特徴点の位置と、当該特徴点に固有の第1ラベルを前記対称性に基づき統合又は変更するように定義された第2ラベルとの組合せを取得する特徴点取得手段と、
前記対称性を破るための付加情報と、前記第2ラベルとに基づき、前記特徴点の各々に対して付すべき前記第1ラベルを決定するラベル決定手段と、
を有する情報処理装置。
前記対称物と前記撮像部との位置関係に応じた前記付加情報を生成する付加情報生成手段を有する、付記1に記載の情報処理装置。
前記付加情報生成手段は、前記撮像部の装着者の座席情報又は前記撮像部の位置を示す位置情報に基づき、前記位置関係を認識する、付記2に記載の情報処理装置。
前記撮像画像に基づき、前記付加情報を生成する付加情報生成手段を有する、付記1に記載の情報処理装置。
前記付加情報生成手段は、前記撮像画像における、前記対称物の周辺に存在する特徴物と前記対称物との位置関係に基づき、前記付加情報を生成する、付記4に記載の情報処理装置。
前記特徴点取得手段は、入力された画像から前記第2ラベルと前記特徴点の位置との組合せを出力するように学習された特徴抽出器に前記撮像画像を入力することで、前記第2ラベルと前記特徴点の位置との組合せを取得する、付記1~5のいずれか一項に記載の情報処理装置。
前記対称物が撮像された学習画像において正解となる特徴点の位置及び第1ラベルの組合せを示す正解データの当該第1ラベルを、前記対称性に基づき統合又は変更した第2ラベルに変換するラベル変換手段と、
前記学習画像と、前記第2ラベルを含む前記正解データとに基づき、前記特徴抽出器の学習を行う学習手段と、
を有する付記6に記載の情報処理装置。
前記学習画像に基づき、前記対称物の対称性を判定する対称性判定手段をさらに有する、付記7に記載の情報処理装置。
前記特徴点取得手段は、入力された画像から前記第1ラベルと前記特徴点の位置との組合せを抽出するように構成された特徴抽出器に前記撮像画像を入力することで、前記第1ラベルと前記特徴点の位置との組合せを取得後、前記第1ラベルを前記対称性に基づき前記第2ラベルに変換することで、前記第2ラベルと前記特徴点の位置との組合せを取得する、付記1~8のいずれか一項に記載の情報処理装置。
前記撮像部と、
前記第1ラベル毎の特徴点の位置に基づき、風景に重ねて、又は撮像部が当該風景を撮像した画像に重ねて仮想オブジェクトを表示する表示部と、
を有する表示装置である、付記1~9のいずれか一項に記載の情報処理装置。
前記撮像部を有し、風景に重ねて仮想オブジェクトを表示する表示装置に対し、前記仮想オブジェクトを表示するための表示信号を送信するサーバ装置である、付記1~10のいずれか一項に記載の情報処理装置。
コンピュータにより、
撮像部が撮像した撮像画像から、対称性を有する対称物の特徴点の位置と、当該特徴点に固有の第1ラベルを前記対称性に基づき統合又は変更するように定義された第2ラベルとの組合せを取得し、
前記対称性を破るための付加情報と、前記第2ラベルとに基づき、前記特徴点の各々に対して付すべき前記第1ラベルを決定する、
制御方法。
撮像部が撮像した撮像画像から、対称性を有する対称物の特徴点の位置と、当該特徴点に固有の第1ラベルを前記対称性に基づき統合又は変更するように定義された第2ラベルとの組合せを取得する特徴点取得手段と、
前記対称性を破るための付加情報と、前記第2ラベルとに基づき、前記特徴点の各々に対して付すべき前記第1ラベルを決定するラベル決定手段
としてコンピュータを機能させるプログラムを格納する記憶媒体。
2 サーバ装置
3 学習装置
4 情報処理装置
10 光源ユニット
11 光学素子
12 通信部
13 入力部
14 記憶部
15 撮像部
16 位置姿勢検出センサ
Claims (10)
- 撮像部が撮像した撮像画像に基づき、対称性を有する対称物の特徴点の位置と、当該特徴点に固有の第1ラベルを前記対称性に基づき統合又は変更するように定義された第2ラベルとの組合せを取得する特徴点取得手段と、
前記対称性を破るための付加情報と、前記第2ラベルとに基づき、前記特徴点の各々に対して付すべき前記第1ラベルを決定するラベル決定手段と、
を有する情報処理装置。 - 前記対称物と前記撮像部との位置関係に応じた前記付加情報を生成する付加情報生成手段を有する、請求項1に記載の情報処理装置。
- 前記付加情報生成手段は、前記撮像部の装着者の座席情報又は前記撮像部の位置を示す位置情報に基づき、前記位置関係を認識する、請求項2に記載の情報処理装置。
- 前記撮像画像に基づき、前記付加情報を生成する付加情報生成手段を有する、請求項1に記載の情報処理装置。
- 前記付加情報生成手段は、前記撮像画像における、前記対称物の周辺に存在する特徴物と前記対称物との位置関係に基づき、前記付加情報を生成する、請求項4に記載の情報処理装置。
- 前記特徴点取得手段は、入力された画像から前記第2ラベルと前記特徴点の位置との組合せを出力するように学習された特徴抽出器に前記撮像画像を入力することで、前記第2ラベルと前記特徴点の位置との組合せを取得する、請求項1~5のいずれか一項に記載の情報処理装置。
- 前記対称物が撮像された学習画像において正解となる特徴点の位置及び第1ラベルの組合せを示す正解データの当該第1ラベルを、前記対称性に基づき統合又は変更した第2ラベルに変換するラベル変換手段と、
前記学習画像と、前記第2ラベルを含む前記正解データとに基づき、前記特徴抽出器の学習を行う学習手段と、
を有する請求項6に記載の情報処理装置。 - 前記学習画像に基づき、前記対称物の対称性を判定する対称性判定手段をさらに有する、請求項7に記載の情報処理装置。
- コンピュータにより、
撮像部が撮像した撮像画像から、対称性を有する対称物の特徴点の位置と、当該特徴点に固有の第1ラベルを前記対称性に基づき統合又は変更するように定義された第2ラベルとの組合せを取得し、
前記対称性を破るための付加情報と、前記第2ラベルとに基づき、前記特徴点の各々に対して付すべき前記第1ラベルを決定する、
制御方法。 - 撮像部が撮像した撮像画像から、対称性を有する対称物の特徴点の位置と、当該特徴点に固有の第1ラベルを前記対称性に基づき統合又は変更するように定義された第2ラベルとの組合せを取得する特徴点取得手段と、
前記対称性を破るための付加情報と、前記第2ラベルとに基づき、前記特徴点の各々に対して付すべき前記第1ラベルを決定するラベル決定手段
としてコンピュータを機能させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/016311 WO2021210046A1 (ja) | 2020-04-13 | 2020-04-13 | 情報処理装置、制御方法及び記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021210046A1 JPWO2021210046A1 (ja) | 2021-10-21 |
JPWO2021210046A5 JPWO2021210046A5 (ja) | 2022-12-23 |
JP7364052B2 true JP7364052B2 (ja) | 2023-10-18 |
Family
ID=78084733
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022514882A Active JP7364052B2 (ja) | 2020-04-13 | 2020-04-13 | 情報処理装置、制御方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230186591A1 (ja) |
JP (1) | JP7364052B2 (ja) |
WO (1) | WO2021210046A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023119412A1 (ja) * | 2021-12-21 | 2023-06-29 | 日本電気株式会社 | 情報処理装置、制御方法及び記憶媒体 |
US12062201B2 (en) * | 2022-08-26 | 2024-08-13 | Adobe Inc. | Generating symmetrical repeat edits for images |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010104181A1 (ja) | 2009-03-13 | 2010-09-16 | 日本電気株式会社 | 特徴点生成システム、特徴点生成方法および特徴点生成プログラム |
JP2010272092A (ja) | 2009-05-25 | 2010-12-02 | Canon Inc | 画像検索装置およびその方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012038795A (ja) * | 2010-08-04 | 2012-02-23 | Nikon Corp | 検出条件最適化方法、プログラム作成方法、並びに露光装置及びマーク検出装置 |
-
2020
- 2020-04-13 US US17/916,823 patent/US20230186591A1/en active Pending
- 2020-04-13 WO PCT/JP2020/016311 patent/WO2021210046A1/ja active Application Filing
- 2020-04-13 JP JP2022514882A patent/JP7364052B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010104181A1 (ja) | 2009-03-13 | 2010-09-16 | 日本電気株式会社 | 特徴点生成システム、特徴点生成方法および特徴点生成プログラム |
JP2010272092A (ja) | 2009-05-25 | 2010-12-02 | Canon Inc | 画像検索装置およびその方法 |
Also Published As
Publication number | Publication date |
---|---|
US20230186591A1 (en) | 2023-06-15 |
JPWO2021210046A1 (ja) | 2021-10-21 |
WO2021210046A1 (ja) | 2021-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7494862B2 (ja) | 情報処理装置、制御方法及びプログラム | |
US20200193671A1 (en) | Techniques for rendering three-dimensional animated graphics from video | |
US10488659B2 (en) | Apparatus, systems and methods for providing motion tracking using a personal viewing device | |
US20170043252A1 (en) | Reconfiguring reality using a reality overlay device | |
CN109865289B (zh) | 一种基于增强现实技术的实景环境娱乐系统及其方法 | |
CN108519676A (zh) | 一种头戴式助视装置 | |
US20090237564A1 (en) | Interactive immersive virtual reality and simulation | |
JP7364052B2 (ja) | 情報処理装置、制御方法及びプログラム | |
CN108292040A (zh) | 优化头戴式显示器屏幕上的内容定位的方法 | |
CN106843460A (zh) | 基于多摄像头的多目标位置捕获定位系统及方法 | |
JP7405734B2 (ja) | 表示システム及びサーバ | |
CN107436608A (zh) | 用于无人机的控制装置及用于导游的系统 | |
US10665034B2 (en) | Imaging system, display apparatus and method of producing mixed-reality images | |
CN114730210A (zh) | 共享人工现实环境中的共同定位姿势估计 | |
CN106471523A (zh) | 使用红外成像的颜色标识 | |
CN114648625A (zh) | 显示系统、显示装置以及程序 | |
JP6811323B2 (ja) | 情報処理システム、プレイヤ側装置、制御方法、及びプログラム | |
WO2023119412A1 (ja) | 情報処理装置、制御方法及び記憶媒体 | |
WO2023281593A1 (ja) | 情報処理装置、制御方法及び記憶媒体 | |
US20220270363A1 (en) | Image processing apparatus, image processing method, and program | |
US20230021345A1 (en) | Information processing device, control method, and storage medium | |
WO2023281587A1 (ja) | 情報処理装置、制御方法及び記憶媒体 | |
WO2023281585A1 (ja) | 情報処理装置、制御方法及び記憶媒体 | |
US20230162388A1 (en) | Learning device, control method, and storage medium | |
KR102433085B1 (ko) | 가상 현실 게임용 중계 화면 생성 방법 및 이를 수행하는 가상 현실 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221005 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230905 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230918 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7364052 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |