WO2021130860A1

WO2021130860A1 - 情報処理装置、制御方法及び記憶媒体

Info

Publication number: WO2021130860A1
Application number: PCT/JP2019/050628
Authority: WO
Inventors: 康敬馬場崎; 茜有賀; 菊池　克
Original assignee: 日本電気株式会社
Priority date: 2019-12-24
Filing date: 2019-12-24
Publication date: 2021-07-01
Also published as: US12072496B2; JP7494862B2; JPWO2021130860A1; US20230011625A1

Abstract

情報処理装置４は、取得部４１Ａと、構造照合部４３Ａとを有する。取得部４１Ａは、風景に重ねて仮想オブジェクトを表示する表示装置の撮像部１５Ａが撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得する。構造照合部４３Ａは、対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データＤｓと、上述の複数の組合せとを照合することで、表示装置が基準とする座標系である第１座標系と、構造データＤｓにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する。

Description

情報処理装置、制御方法及び記憶媒体

　本発明は、拡張現実（ＡＲ：Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ）における空間把握に関する処理を行う情報処理装置、制御方法及び記憶媒体の技術分野に関する。

　拡張現実を提供する装置において、カメラで撮像した画像に基づき、ユーザが視認する風景に重ねて表示する画像（所謂ＡＲ画像）の表示位置を決定する技術が存在する。例えば、特許文献１には、物体の外観の特徴を表す特徴データを記憶し、撮像装置から得られる画像及び上記の特徴データに基づいて、実空間内に存在する物体の位置を表現する環境マップを構築し、環境マップを参照して実空間内で遂行すべき作業の一連の手順に関する説明を表示する画像処理装置が開示されている。

特開２０１１－１５９１６２号公報

　実世界をカメラ等により計測して環境マップを生成した場合には、認識対象以外の物体に関する情報がノイズとして環境マップに含まれることになる。そして、ノイズを含む環境マップと予め記憶した認識対象の特徴データとを照合して実世界空間とデバイスが基準とする空間との対応関係を認識する場合、膨大な計算量が必要となり、かつ、ノイズによるマッチング精度の低下が生じるという問題がある。

　本発明の目的は、上述した課題を鑑み、拡張現実における空間の対応関係の把握に必要な照合の精度向上及び計算量の低減を好適に実現することが可能な情報処理装置、制御方法及び記憶媒体を提供することを主な課題とする。

　情報処理装置の一の態様は、情報処理装置であって、風景に重ねて画像を表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得する取得部と、前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する構造照合部と、を有する。

　制御方法の一の態様は、情報処理装置が実行する制御方法であって、風景に重ねて画像を表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得し、前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する。

　記憶媒体の一の態様は、風景に重ねて画像を表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得する取得部と、前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する構造照合部としてコンピュータを機能させるプログラムを格納する記憶媒体である。

　本発明によれば、拡張現実において使用する座標系の変換に関する座標変換情報の生成に必要な照合の精度向上及び計算量の低減を好適に実現することができる。

第１実施形態に係る表示装置の概略構成図である。構造データのデータ構造の一例を示す。制御部の機能的な構成を示すブロック図である。パラメータ記憶部に記憶する識別器のパラメータを生成する学習装置の概略構成を示す。（Ａ）対象構造物としてテニスコートが撮像された撮像画像の例を示す。（Ｂ）対象構造物として競泳用プールが撮像された撮像画像の例を示す。構造特徴点情報を撮像画像上に明示した図である。デバイス座標系と構造座標系との関係を示す図である。デバイス座標系を座標変換する前後の状態を示す。第１実施形態において制御部が実行する仮想オブジェクトの表示処理に関する処理概要を示すフローチャートの一例である。キャリブレーション処理の詳細な処理手順を示すフローチャートの一例である。第２実施形態における表示システムの構成を示す。第２実施形態におけるサーバ装置のブロック図である。第２実施形態においてサーバ装置の制御部が実行する処理手順を示すフローチャートの一例である。第３実施形態における情報処理装置の概略構成を示す。

　以下、図面を参照しながら、情報処理装置、制御方法及び記憶媒体の実施形態について説明する。

　＜第１実施形態＞
　（１）概略構成
　図１は、第１実施形態に係る表示装置１の概略構成図である。表示装置１は、ユーザが装着可能な装置であり、例えば眼鏡型に構成されたシースルー型であって、ユーザの頭部に装着可能に構成されている。そして、表示装置１は、スポーツ観戦や劇（コンサートを含む）の観賞などにおいて、実在する風景に視覚情報を重ねて表示することで、拡張現実（ＡＲ：Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ）を実現する。上記の視覚情報は、２次元又は３次元により表された仮想のオブジェクトであり、以後では、「仮想オブジェクト」とも呼ぶ。なお、表示装置１は、ユーザの片眼にのみ仮想オブジェクトを表示してもよく、両眼に対して仮想オブジェクトを表示してもよい。

　本実施形態では、スポーツや劇などが行われる場（フィールド）となる静止構造物（「対象構造物」とも呼ぶ。）が存在するものとし、表示装置１は、ユーザがスポーツ観戦や劇の観賞を行う際に補助となる付加的な情報となる仮想オブジェクトを、対象構造物又はその周辺に重畳表示する。対象構造物は、例えば、スポーツ観戦において対象となるフィールド（例えばテニスコート、競泳用プール、スタジアム等）、又は、観劇において対象となるフィールド（例えば劇場、コンサートホール、多目的ホール、各種ステージ等）などが該当する。後述するように、対象構造物は、構造上の（即ち形状において特徴がある）特徴点（「構造特徴点」とも呼ぶ。）を複数有している。

　仮想オブジェクトは、例えば、テニスなどの場合には、テニスコート上方に表示する点数ボード、競泳の場合には、競泳中のプールにリアルタイム重畳表示する世界記録ライン、観劇などでステージ上に重畳表示するバーチャル出演者などを含む。

　表示装置１は、光源ユニット１０と、光学素子１１と、通信部１２と、入力部１３と、記憶部１４と、カメラ１５と、位置姿勢検出センサ１６と、制御部１７とを有する。

　光源ユニット１０は、レーザ光源やＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）光源などの光源を有しており、制御部１７から供給される駆動信号に基づき、光を射出する。光学素子１１は、所定の透過率を有し、外光の少なくとも一部を透過してユーザの眼球に入射させると共に、光源ユニット１０からの光の少なくとも一部を、ユーザの眼球に向けて反射する。これにより、表示装置１によって形成された仮想オブジェクトに対応する虚像が、風景と重なってユーザに視認されることとなる。なお、光学素子１１は、透過率と反射率とが概ね等しいハーフミラーであってもよく、透過率と反射率とが等しくないようなミラー（所謂ビームスプリッタ）であってもよい。

　通信部１２は、制御部１７の制御に基づき、外部装置とのデータの授受を行う。例えば、ユーザがスポーツ観戦や劇の観賞などに表示装置１を使用する場合には、通信部１２は、制御部１７の制御に基づき、興行者が管理するサーバ装置から表示装置１が表示すべき仮想オブジェクトに関する情報を受信する。

　入力部１３は、ユーザの操作に基づく入力信号を生成して制御部１７に送信する。入力部１３は、例えば、ユーザが表示装置１に対して指示を行うためのボタン、十字キー、音声入力装置等である。

　カメラ１５は、制御部１７の制御に基づき、表示装置１の前方を撮像した画像を生成し、生成した画像（「撮像画像Ｉｍ」とも呼ぶ。）を制御部１７に供給する。

　位置姿勢検出センサ１６は、表示装置１の位置及び姿勢（向き）を検出するセンサ（センサ群）であり、例えば、ＧＰＳ（Ｇｌｏｂａｌ　Ｐｏｓｉｔｉｏｎｉｎｇ　Ｓａｔｅｌｌｉｔｅ）受信機などの測位センサと、ジャイロセンサ、加速度センサ、ＩＭＵ（Ｉｎｅｒｔｉａｌ　Ｍｅａｓｕｒｅｍｅｎｔ　Ｕｎｉｔ）などの表示装置１の相対的な姿勢の変化を検出する姿勢検出センサとを含む。位置姿勢検出センサ１６は、生成した表示装置１の位置及び姿勢に関する検出信号を制御部１７へ供給する。後述するように、制御部１７は、位置姿勢検出センサ１６から供給される検出信号に基づき、表示装置１の起動時等からの位置及び姿勢の変化量を検出する。なお、制御部１７は、測位センサから表示装置１の位置を検出する代わりに、例えば、会場に設けられたビーコン端末や無線ＬＡＮ機器から受信する信号に基づき、表示装置１の位置を特定してもよい。他の例では、制御部１７は、ＡＲマーカを用いた公知の位置推定技術に基づき、表示装置１の位置を特定してもよい。これらの場合、位置姿勢検出センサ１６は、測位センサを含まなくともよい。

　制御部１７は、例えばＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）などのプロセッサ、プロセッサの作業メモリとして機能する揮発性メモリなどを有しており、表示装置１の全体的な制御を行う。

　例えば、制御部１７は、仮想オブジェクトの表示タイミングなどにおいて、撮像画像Ｉｍから認識される対象構造物の構造特徴点に基づき、実世界空間と表示装置１が認識する空間とを対応付けるためのキャリブレーション処理を行う。このキャリブレーション処理では、制御部１７は、表示装置１が基準とする３次元空間の座標系（「デバイス座標系」とも呼ぶ。）を、対象構造物を基準とした３次元空間の座標系（「構造座標系」とも呼ぶ。）に変換するための座標変換情報を生成する。キャリブレーション処理の詳細については後述する。そして、制御部１７は、上述の座標変換情報等に基づき、光源ユニット１０を駆動するための駆動信号を生成し、駆動信号を光源ユニット１０に供給することで光源ユニット１０に仮想オブジェクトを表示するための光（「表示光」とも呼ぶ。）を光学素子１１に射出させる。これにより、制御部１７は、仮想オブジェクトをユーザに視認させる。

　記憶部１４は、制御部１７が表示装置１の制御に必要な種々の情報を記憶する不揮発性メモリである。記憶部１４は、フラッシュメモリなどの着脱自在な記憶媒体を含んでもよい。また、記憶部１４には、制御部１７が実行するプログラムが記憶される。

　また、記憶部１４は、センサデータ記憶部２０と、パラメータ記憶部２１と、構造データ記憶部２２とを有する。

　センサデータ記憶部２０は、カメラ１５が生成する撮像画像Ｉｍと、当該撮像画像Ｉｍの生成時におけるデバイス座標系の設定時（例えば表示装置１の起動時）からの表示装置１の位置及び姿勢の変化量（「位置姿勢変化量Ａｐ」とも呼ぶ。）とを関連付けて記憶する。この場合、例えば、制御部１７は、デバイス座標系の設定時の位置及び姿勢を基準とする現在の位置及び姿勢の変化量を、位置姿勢検出センサ１６の検出信号に基づき常時算出する。そして、制御部１７は、カメラ１５が生成した撮像画像Ｉｍをセンサデータ記憶部２０に記憶する場合に、当該撮像画像Ｉｍの生成時に算出した位置姿勢変化量Ａｐを当該撮像画像Ｉｍに関連付けてセンサデータ記憶部２０に記憶する。制御部１７は、例えば、最新の所定時間分又は所定数分の撮像画像Ｉｍ及び位置姿勢変化量Ａｐの組合せをセンサデータ記憶部２０に記憶させる。センサデータ記憶部２０に記憶される情報は、キャリブレーション処理において使用される。

　パラメータ記憶部２１は、キャリブレーション処理において、対象構造物の構造特徴点の位置情報及び当該構造特徴点の分類情報を撮像画像Ｉｍから抽出する際に用いる識別器のパラメータを記憶する。上述の識別器は、例えば、撮像画像Ｉｍが入力された場合に、抽出対象となる構造特徴点の分類毎に構造特徴点の画像内の信頼度マップを出力するように学習された学習モデルである。信頼度マップは、構造特徴点の座標値ごとの信頼度を示す画像上のマップである。「座標値」は、ピクセル単位での画像内の位置を示す値であってもよく、サブピクセル単位での画像内の位置を示す値であってもよい。識別器の学習に用いる学習モデルは、ニューラルネットワークに基づく学習モデルであってもよく、サポートベクターマシーンなどの他の種類の学習モデルであってもよく、これらの組み合わせであってもよい。例えば、上述の学習モデルが畳み込みニューラルネットワークなどのニューラルネットワークである場合、パラメータ記憶部２１は、層構造、各層のニューロン構造、各層におけるフィルタ数及びフィルタサイズ、並びに各フィルタの各要素の重みなどの各種パラメータを記憶する。なお、識別器は、構造特徴点の信頼度マップを出力するものに限らず、構造特徴点の画像内の座標値を示す情報を出力する回帰型の識別器であってもよい。

　構造データ記憶部２２は、対象構造物の構造に関する構造データを記憶する。図２は、構造データのデータ構造の一例を示す。構造データは、サイズ情報と、登録特徴点情報とを有する。サイズ情報は、対象構造物のサイズに関する情報であり、例えば、テニスコートの場合には、縦及び横のコート幅の情報であり、劇場の場合には、ステージの幅（及び高さ）の情報である。なお、サイズ情報は、対象構造物の全体サイズに関する情報に限らず、後述するように、キャリブレーション処理において検出される構造特徴点間の距離を示す情報であればよい。

　登録特徴点情報は、対象構造物の構造特徴点に関する情報であり、予め計測した構造特徴点毎の個別の情報を含んでいる。ここでは、対象構造物がＮ個（Ｎは２以上の整数）の構造特徴点を有することから、登録特徴点情報は、これらのＮ個の構造特徴点に夫々対応する情報（第１構造特徴点情報～第Ｎ構造特徴点情報）を含んでいる。登録特徴点情報は、対象となる構造特徴点の分類を示すラベルと、対象となる構造特徴点の構造座標系での位置を示す登録位置情報とを少なくとも含んでいる。登録位置情報は、構造座標系により表された座標情報であり、例えばいずれかの構造特徴点の位置が原点となるように設定されている。登録特徴点情報は、キャリブレーション処理において、撮像画像Ｉｍから特定される構造特徴点の情報との照合において用いられる。

　その他、構造データは、構造座標系において原点とする構造特徴点を指定する情報及び構造座標系の３軸の各方向をそれぞれ指定する情報などが含まれてもよい。

　なお、図１に示す表示装置１の構成は一例であり、この構成に対して種々の変更を行ってもよい。例えば、表示装置１は、制御部１７の制御に基づき、音声を出力するスピーカをさらに備えてもよい。また、表示装置１は、ユーザの視線の位置に応じて仮想オブジェクトの表示有無や仮想オブジェクトの表示位置を変更するための視線検出用カメラを備えてもよい。さらに別の例では、記憶部１４は、センサデータ記憶部２０を有しなくともよい。この場合、制御部１７は、カメラ１５から即時に取得した撮像画像Ｉｍと、位置姿勢検出センサ１６の検出信号に基づき算出した位置姿勢変化量Ａｐとを用いて、キャリブレーション処理を行う。

　さらに別の例では、表示装置１は、位置姿勢検出センサ１６等による表示装置１の位置を検出しなくともよい。一般に、スポーツ観戦や劇等の観賞中では、ユーザが移動することは稀であり、かつ、表示装置１の姿勢変化に比べて表示装置１の位置の変化に対する仮想オブジェクトの表示への影響は小さい。以上を勘案し、位置姿勢検出センサ１６は、表示装置１の姿勢を検出するセンサから構成され、制御部１７は、デバイス座標系の設定時からの表示装置１の姿勢の変化量のみを、位置姿勢変化量Ａｐとして算出してもよい。

　（２）機能ブロック
　図３は、制御部１７の機能的な構成を示すブロック図である。図３に示すように、制御部１７は、機能的には、仮想オブジェクト取得部４０と、特徴点情報出力部４１と、特徴点出力部４２と、構造照合部４３と、反映部４４と、光源制御部４５と、を有する。

　仮想オブジェクト取得部４０は、仮想オブジェクトとして風景に重畳表示させる元となる仮想オブジェクトとその表示位置とを指定する情報（「指定表示情報Ｉｄ」とも呼ぶ。）を取得する。この仮想オブジェクトは、２次元の物体描画のための情報（２次元描画情報）であってもよく、３次元の物体描画のための情報（３次元描画情報）であってもよい。例えば、興行者が管理するサーバ装置と表示装置１が通信可能である場合には、仮想オブジェクト取得部４０は、サーバ装置から所定のタイミングによりプッシュ型配信又はプル型配信される配信情報を、指定表示情報Ｉｄとして取得する。この場合、指定表示情報Ｉｄには、仮想オブジェクトの他、表示位置を指定する情報（例えば構造座標系での座標値を示す情報）が含まれている。他の例では、仮想オブジェクトと表示位置とその表示条件との組み合わせを示す情報が記憶部１４に予め記憶されてもよい。この場合、仮想オブジェクト取得部４０は、記憶された上述の表示条件が満たされたと判断したときに、満たされた表示条件に対応する仮想オブジェクトと表示位置の組み合わせを指定表示情報Ｉｄとして取得する。

　特徴点情報出力部４１は、センサデータ記憶部２０から撮像画像Ｉｍを取得すると共に、パラメータ記憶部２１から抽出したパラメータに基づき識別器を構成し、当該識別器に撮像画像Ｉｍを入力することで、構造特徴点情報「ＩＦ」を生成する。この場合、特徴点情報出力部４１は、好適には、センサデータ記憶部２０から最新の撮像画像Ｉｍを取得するとよい。ここで、識別器は、撮像画像Ｉｍが入力された場合に、構造特徴点の分類毎に画像内の構造特徴点の位置に関する情報を、構造特徴点情報ＩＦとして出力するように学習された学習モデルである。

　特徴点出力部４２は、特徴点情報出力部４１が出力する構造特徴点情報ＩＦに基づき、撮像画像Ｉｍ内での各構造特徴点の位置（「構造特徴点位置Ｐｄ」とも呼ぶ。）と、当該各構造特徴点の分類を示すラベル（「ラベルＬｂ」とも呼ぶ。）との複数の組合せを、構造照合部４３に出力する。後述するように、特徴点出力部４２は、直線上に並んでいない少なくとも２組以上の構造特徴点位置Ｐｄ及びラベルＬｂの組合せを構造照合部４３に供給する。構造特徴点位置ＰｄとラベルＬｂとの複数の組合せは、本開示における「構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せ」の一例である。

　ここで、構造特徴点位置Ｐｄの決定方法について補足説明する。例えば、構造特徴点の分類毎の画像内の信頼度マップが構造特徴点情報ＩＦに含まれている場合には、特徴点出力部４２は、構造特徴点の分類毎に信頼度が最大となる座標値を構造特徴点位置Ｐｄとして定める。そして、特徴点出力部４２は、対象の分類を示すラベルＬｂと当該構造特徴点位置Ｐｄとを関連付けて構造照合部４３に出力する。なお、特徴点出力部４２は、ある分類に関する信頼度の最大値が予め定めた閾値未満である場合には、当該分類に対応するラベルＬｂ及び構造特徴点位置Ｐｄを構造照合部４３に出力しなくともよい。

　一方、構造特徴点の分類毎の画像内の座標値が構造特徴点情報ＩＦに含まれている場合には、特徴点出力部４２は、当該座標値を構造特徴点位置Ｐｄとして定め、対象の分類を示すラベルＬｂと関連付けて構造照合部４３に出力する。なお、構造特徴点情報ＩＦに含まれている座標値が画像サイズに依存しないように正規化された値である場合には、特徴点出力部４２は、構造特徴点情報ＩＦに含まれている座標値に撮像画像Ｉｍの画像サイズを乗じることで、構造特徴点位置Ｐｄを算出する。

　構造照合部４３は、構造データ記憶部２２から抽出した構造データと、特徴点出力部４２から供給される構造特徴点位置Ｐｄ及びラベルＬｂの複数の組合せとを照合することで、デバイス座標系から構造座標系に変換するために必要な座標変換情報「Iｃ」を生成する。この場合、構造照合部４３は、特徴抽出を行った撮像画像Ｉｍの生成時の位置姿勢変化量Ａｐと、対象構造物のサイズ情報とに基づき、各構造特徴点位置Ｐｄのデバイス座標系での位置を特定する。そして、構造照合部４３は、デバイス座標系での構造特徴点の検出位置と、構造データの登録位置情報が示す構造特徴点の位置とを、ラベル毎に対応付けて照合することで、座標変換情報Ｉｃを生成する。座標変換情報Ｉｃは、例えば、３次元空間同士の座標変換を行うために一般的に用いられる回転行列及び並進ベクトルの組み合わせである。なお、座標変換情報Ｉｃは、構造座標系をデバイス座標系へ変換する際に用いられる情報であることに限定されず、デバイス座標系を構造座標系へ変換する際に用いられる情報であってもよい。ここで、構造座標系からデバイス座標系へ変換するための回転行列及び並進ベクトルは、デバイス座標系から構造座標系へ変換するための回転行列（上述の回転行列の逆行列）及び並進ベクトル（符号反転した上述の並進ベクトル）に変換可能である。座標変換情報Ｉｃの生成方法の具体例については後述する。

　反映部４４は、構造照合部４３から供給される座標変換情報Ｉｃを、仮想オブジェクト取得部４０から供給される指定表示情報Ｉｄに反映させることで、光学素子１１上に投影させる仮想オブジェクトを示す表示信号「Ｓｄ」を生成する。この場合、反映部４４は、座標変換情報Ｉｃによりデバイス座標系を構造座標系と一致させた上で、指定表示情報Ｉｄに基づく表示信号Ｓｄを生成する。光源制御部４５は、反映部４４から供給される表示信号Ｓｄに基づき、光源ユニット１０の光源（例えばＲＧＢに対応する各光源）を駆動するための駆動タイミング及び光量などを指示する駆動信号を生成し、生成した駆動信号を光源ユニット１０へ供給する。

　なお、キャリブレーション完了後（即ち座標変換情報Ｉｃを算出後）の各処理（即ち反映部４４及び光源制御部４５の処理）の説明は一例であり、既存のＡＲ製品などにおいて適用される任意の方法により、仮想オブジェクトを所望の風景位置に重畳させる仮想オブジェクトを表示させてもよい。例えば、このような技術を開示する文献の例として、特開２０１５－１１６３３６号公報、特開２０１６－５２５７４１号公報などが存在する。これらの文献に示されるように、表示装置１は、ユーザの視線検出などを行い、仮想オブジェクトが適切に視認されるように制御を行う。

　なお、図３において説明した仮想オブジェクト取得部４０、特徴点情報出力部４１、特徴点出力部４２、構造照合部４３、反映部４４及び光源制御部４５の各構成要素は、例えば、制御部１７がプログラムを実行することによって実現できる。より具体的には、各構成要素は、記憶部１４に格納されたプログラムを、制御部１７が実行することによって実現され得る。また、必要なプログラムを任意の不揮発性記録媒体に記録しておき、必要に応じてインストールすることで、各構成要素を実現するようにしてもよい。なお、これらの各構成要素は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組み合わせ等により実現してもよい。また、これらの各構成要素は、例えばＦＰＧＡ（field-programmable gate array）又はマイコン等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、上記の各構成要素から構成されるプログラムを実現してもよい。このように、各構成要素は、プロセッサ以外のハードウェアにより実現されてもよい。以上のことは、後述する他の実施の形態においても同様である。

　（３）識別器の学習
　ここで、パラメータ記憶部２１に記憶する識別器のパラメータを生成するための学習について補足説明する。

　図４は、パラメータ記憶部２１に記憶する識別器のパラメータを生成する学習装置３の概略構成を示す。学習装置３は、学習データ記憶部２３を参照可能な装置であって、表示装置１であってもよく、表示装置１以外の任意の装置（例えばパーソナルコンピュータ等）であってもよい。学習装置３は、表示装置１がユーザに使用される前段階（表示装置１の製造段階等）において、学習データ記憶部２３を参照し、パラメータ記憶部２１に記憶する識別器のパラメータを生成するための学習を行う。

　学習データ記憶部２３には、対象構造物が撮像された学習用の画像（学習画像）と、当該学習画像における各構造特徴点の位置及びラベルを示す正解データとの組み合わせが複数組記憶されている。この場合、好適には、複数の場所に存在する各バリエーションの対象構造物（例えばテニスコートの場合には各サーフェスに対応したテニスコート）が撮像された学習画像が学習データ記憶部２３に記憶されているとよい。同様に、対象構造物を種々の撮像環境（例えば照明の有無や度合の異なる環境）において撮像した学習画像が学習データ記憶部２３に記憶されているとよい。このような学習画像を用いることにより、対象構造物のバリエーション及び撮像環境の変化に対して頑強な識別器を好適に学習することが可能となる。

　また、学習装置３は、機能的には、学習部３１と、フォーマット部３２とを有する。

　フォーマット部３２は、学習データ記憶部２３に記憶された正解データを、構造特徴点情報ＩＦと同様の形式に変更する。例えば、ラベル毎の構造特徴点に対する信頼度マップを出力するように識別器が学習される場合、フォーマット部３２は、正解データが示す構造特徴点の座標位置が最大値となる信頼度の正規分布を示す信頼度マップを生成する。また、ラベル毎の構造特徴点に対する座標値を出力するように識別器が学習される場合には、フォーマット部３２は、正解データが示す構造特徴点の座標位置を、画像サイズに依存しない０から１の値に正規化した座標値を有する２次元座標に変換する。

　学習部３１は、撮像画像Ｉｍと、フォーマット部３２により正解データを適切な形式に変換した情報とに基づき、学習モデル（識別器）の学習を行う。この場合、学習部３１は、例えば、学習画像が識別器に入力された場合に識別器が出力する情報と、フォーマット部３２から供給される正解情報との誤差（損失）が最小となるように、識別器のパラメータを決定する。損失を最小化するように上述のパラメータを決定するアルゴリズムは、勾配降下法や誤差逆伝播法などの機械学習において用いられる任意の学習アルゴリズムであってもよい。そして、学習部３１は、学習後の識別器のパラメータを、パラメータ記憶部２１に記憶する。

　表示装置１は、キャリブレーション処理において、上記のように学習された識別器のパラメータを用いることで、識別器を構成する。この場合、識別器は、各バリエーションの対象構造物及び種々の撮像環境に対応する学習データを用いて学習されていることにより、対象構造物のバリエーション及び撮像環境の変化によらず正確な構造特徴点情報ＩＦを好適に出力する。

　（４）構造特徴点情報の生成例
　次に、特徴点情報出力部４１が生成する構造特徴点情報ＩＦの具体例について説明する。

　図５（Ａ）及び図５（Ｂ）は、対象構造物が撮像された撮像画像Ｉｍの例を示す。図５（Ａ）に示す撮像画像Ｉｍには、対象構造物としてテニスコートが撮像されており、図５（Ｂ）に示す撮像画像Ｉｍには、対象構造物として競泳用プールが撮像されている。そして、図５（Ａ）に示す撮像画像Ｉｍには、合計１６個の構造特徴点「Ｐ１」～「Ｐ１６」が存在し、図５（Ｂ）に示す撮像画像Ｉｍには、合計９個の構造特徴点「Ｐ２０」～「Ｐ２９」が存在している。従って、図５（Ａ）に示す撮像画像Ｉｍをキャリブレーションに使用する場合には、特徴点情報出力部４１は、１６個の構造特徴点Ｐ１～Ｐ１６の夫々に対応する構造特徴点情報ＩＦを生成する。また、図５（Ｂ）に示す撮像画像Ｉｍをキャリブレーションに使用する場合には、構造照合部４３は、９個の構造特徴点Ｐ２０～Ｐ２８の各々に対応する構造特徴点情報ＩＦを生成する。なお、後述するように、特徴点情報出力部４１は、これらの全ての構造特徴点に対する構造特徴点情報ＩＦを生成する必要はなく、一直線上に並んでいない少なくとも３つの構造特徴点に対する構造特徴点情報ＩＦを生成すればよい。また、デバイス座標系（第１座標系）と構造座標系（第２座標系）の一軸が等価と仮定できれば、２つの構造特徴点のみで構造特徴点情報ＩＦを生成してもよい。例えば、デバイス座標系の鉛直軸と構造座標系の鉛直軸が同じであると仮定すると、対象構造物であるスポーツ競技フィールドの面は２点のみで決定することができる。一方、デバイス座標系（第１座標系）の軸と構造座標系（第２座標系）の軸とが夫々異なる場合には、上述したように、特徴点情報出力部４１は、一直線上に並んでいない少なくとも３つの構造特徴点に対する構造特徴点情報ＩＦを生成する。

　図６は、図５（Ａ）に示す撮像画像Ｉｍに基づき生成された構造特徴点情報ＩＦを撮像画像Ｉｍ上に明示した図である。ここでは、一例として、特徴点情報出力部４１は、構造特徴点情報ＩＦとして、構造特徴点の分類（ラベル）毎の構造特徴点の位置の信頼度マップを出力するものとする。図６は、説明便宜上、信頼度が０とならない主要な部分領域（ここでは３×３又は４×４の矩形領域）のみに対して信頼度マップを明示している。信頼度マップの各画素は、濃いほど信頼度が高いことを示すものとする。また、図６では、各構造特徴点の信頼度マップと共に、各信頼度マップが対応する構造特徴点のラベル「Ｌｂ１」～「Ｌｂ１６」を明示している。ラベルＬｂ１～Ｌｂ１６は、夫々、構造特徴点Ｐ１～Ｐ１６の分類に夫々対応している。なお、図６では、全ての構造特徴点の信頼度マップを１つの画像内に表示しているが、実際には、ラベル毎の信頼度マップが識別器から出力される。

　（５）座標変換情報の生成
　次に、構造照合部４３による座標変換情報Ｉｃの生成処理について説明する。構造照合部４３は、デバイス座標系での構造特徴点の位置と、構造座標系で表される構造データの構造特徴点の位置とをラベル毎に対応付けて照合することで、デバイス座標系を構造座標系に変換するのに必要な移動量及び回転量を示す座標変換情報Ｉｃを生成する。

　座標変換情報Ｉｃの生成処理について、図７及び図８を参照して具体的に説明する。図７は、デバイス座標系と構造座標系との関係を示す図である。

　デバイス座標系は、表示装置１が基準とする３次元座標系である。表示装置１は、例えば、起動時の表示装置１の位置及び姿勢を基準として、デバイス座標系を決定する。具体的には、表示装置１は、表示装置１の起動時のカメラ１５の撮像方向及び撮像画像Ｉｍの縦方向及び横方向を各軸とする３次元座標系、又は、表示装置１の起動時の表示装置１の姿勢に基づく他の任意の３次元座標系を、デバイス座標系と定める。

　また、構造座標系は、対象構造物を基準として設定された座標系であり、構造データにおいて採用されている座標系に相当する。図７は、一例として、図５（Ａ）及び図６に示すテニスコートの構造特徴点Ｐ１３を原点とし、テニスコートの長手方向及び短手方向及び垂直方向を軸とした構造座標系を設定した例を示している。図７の例では、構造座標系の３軸方向を、対象構造物であるテニスコートの長手方向、短手方向及び垂直方向に夫々対応させているが、これに代えて、緯度、経度、高度の方向を構造座標系の３軸方向として定めてもよい。

　ここで、まず、構造照合部４３は、特徴点出力部４２が出力する構造特徴点位置ＰｄとラベルＬｂの各組について、位置姿勢変化量Ａｐに基づき、デバイス座標系におけるベクトル（「構造特徴点ベクトル」とも呼ぶ。）を定める。図７は、図６に示すラベルＬｂ１に対応する構造特徴点ベクトル「Ｖ１」と、ラベルＬｂ４に対応する構造特徴点ベクトル「Ｖ４」と、ラベルＬｂ１６に対応する構造特徴点ベクトル「Ｖ１６」とを示している。

　ここで、構造特徴点ベクトルの設定方法について詳しく説明する。

　まず、説明便宜上、位置姿勢変化量Ａｐを考慮する前の（即ち位置姿勢変化量Ａｐが０である場合の）構造特徴点ベクトルについて検討する。一般に、撮像画像Ｉｍの画素位置ごとにカメラ１５からの当該画素が表示する被撮像位置の方向が異なる。よって、構造照合部４３は、撮像画像Ｉｍ内の画素位置を示す構造特徴点位置Ｐｄに基づき、構造特徴点ベクトルの方向を決定する。この場合、構造照合部４３は、例えば、画素位置毎に構造特徴点ベクトルの方向を定めたマップを記憶部１４に記憶しておき、当該マップを参照することで、各構造特徴点位置Ｐｄから構造特徴点ベクトルの方向を決定する。また、構造照合部４３は、構造特徴点ベクトルの原点をデバイス座標系の原点に定める。なお、構造特徴点ベクトルの長さについては規定しない。

　次に、位置姿勢変化量Ａｐを考慮した構造特徴点ベクトルの補正について検討する。構造照合部４３は、位置姿勢変化量Ａｐのうち表示装置１の姿勢の変化量に基づき、上述の構造特徴点ベクトルの方向を補正する。この場合、構造照合部４３は、例えば、表示装置１の姿勢の変化量と構造特徴点ベクトルの方向の補正量とを定めたマップを記憶部１４に記憶しておき、当該マップを参照することで、各構造特徴点位置Ｐｄの構造特徴点ベクトルの方向を補正する。また、構造照合部４３は、位置姿勢変化量Ａｐのうち表示装置１の位置の変化量に基づき、構造特徴点ベクトルを平行移動させる。

　そして、構造照合部４３は、特定した各構造特徴点ベクトルと、対象構造物のサイズ情報とに基づき、デバイス座標系における対象構造物の各構造特徴点の位置を特定する。図７の例では、構造照合部４３は、構造データのサイズ情報を参照し、対象構造物であるテニスコートの長手方向の幅「Ｌ１」（即ち構造特徴点Ｐ４及び構造特徴点Ｐ１６間の距離）及び短手方向の幅「Ｌ２」（即ち構造特徴点Ｐ１及び構造特徴点Ｐ４間の距離）を認識する。この場合、構造特徴点ベクトルＶ１、Ｖ４、Ｖ１６の各延長線上に構造特徴点Ｐ１、Ｐ４、Ｐ１６が夫々存在し、かつ、構造特徴点Ｐ１及び構造特徴点Ｐ４間の距離が幅Ｌ２、構造特徴点Ｐ４及び構造特徴点Ｐ１６間の距離が幅Ｌ１となる。よって、構造照合部４３は、このような条件を満たす構造特徴点Ｐ１、Ｐ４、Ｐ１６のデバイス座標系での座標値を算出する。

　図８は、図７に示すデバイス座標系を座標変換する前後の状態を示す。この場合、構造照合部４３は、検出した各構造特徴点に関するデバイス座標系での座標値と構造データに記録された構造座標系での座標値とに基づき、デバイス座標系を構造座標系に一致させるように座標変換する。そして、構造照合部４３は、この座標変換に必要なデバイス座標系から構造座標系への回転及並進に関する変換パラメータを座標変換情報Ｉｃとして算出する。図７の例では、構造照合部４３は、これらの構造特徴点Ｐ１、Ｐ４、Ｐ１６のデバイス座標系での座標値と、構造データに記録された構造座標系での座標値とが一致するように、デバイス座標系から構造座標系への回転及並進に関する変換パラメータを算出する。このように、構造照合部４３は、直線上に並ばない少なくとも３つの構造特徴点を基準として、座標変換情報Ｉｃを好適に生成することができる。また、第１座標系と第２座標系の一軸が等価と仮定すれば、少なくとも２つの構造特徴点を用いて座標変換情報Ｉｃを生成することができる。例えば、デバイス座標系の鉛直軸と構造座標系の鉛直軸が同じであると仮定すると、対象構造物であるスポーツ競技フィールドの面は２点のみで決定することができる。一方、デバイス座標系（第１座標系）の軸と構造座標系（第２座標系）の軸とが夫々異なる場合には、構造照合部４３は、上述したように、一直線上に並んでいない少なくとも３つの構造特徴点を基準として、座標変換情報Ｉｃを生成する。

　なお、図７及び図８の例では、構造照合部４３は、３つの構造特徴点に基づき、座標変換情報Ｉｃを生成したが、これに代えて、４つ以上の構造特徴点に基づき、座標変換情報Ｉｃを生成してもよい。この場合、構造照合部４３は、各構造特徴点から算出した構造特徴点ベクトルと、サイズ情報が示す各構造特徴点間の距離と、に基づき、最小二乗法などの回帰分析手法を適用することで、各構造特徴点ベクトル上の構造特徴点のデバイス座標系での座標値を算出する。また、構造照合部４３は、各構造特徴点のデバイス座標系での座標値と、構造データに記録された構造座標系での座標値とに基づき、最小二乗法等を用いることで、デバイス座標系から構造座標系への回転及並進に関する変換パラメータを算出する。

　ここで、好適には、構造照合部４３は、撮像画像Ｉｍから検出した構造特徴点の信頼度に基づき、座標変換情報Ｉｃの算出に用いるＮｒ個（Ｎｒは３以上の整数）の構造特徴点を選定してもよい。例えば、構造照合部４３は、特徴点情報出力部４１が算出した構造特徴点情報ＩＦを参照し、各構造特徴点の信頼度を取得する。例えば、特徴点情報出力部４１が用いる識別器が構造特徴点毎の信頼度マップを出力する場合には、構造特徴点毎の信頼度マップにおいて最大となる信頼度を、各構造特徴点の信頼度として認識する。そして、構造照合部４３は、信頼度が上位Ｎｒ個分の構造特徴点を用いて、座標変換情報Ｉｃを算出する。これにより、構造照合部４３は、信頼性が高い構造特徴点のみを用いて正確な座標変換情報Ｉｃを好適に算出することができる。

　他の例では、構造照合部４３は、画像の縁部分の画素ではレンズの歪みの影響を受けやすいことを勘案し、各構造特徴点の撮像画像Ｉｍ内の検出位置（即ち構造特徴点位置Ｐｄ）に応じ、座標変換情報Ｉｃの算出に用いる構造特徴点を選定してもよい。例えば、特徴点情報出力部４１は、レンズの歪みの影響が実質的に生じない撮像画像Ｉｍ内の領域の情報を予め記憶部１４等に記憶しておき、当該領域内において検出された構造特徴点を、座標変換情報Ｉｃの算出に用いる構造特徴点として選定する。この態様によっても、構造照合部４３は、レンズの歪みの影響が実質的に生じない構造特徴点の情報を用いて正確な座標変換情報Ｉｃを好適に算出することができる。

　なお、表示装置１は、１枚の撮像画像Ｉｍから座標変換情報Ｉｃの算出に用いる構造特徴点を３個以上検出できなかった場合には、複数の撮像画像Ｉｍから検出される構造特徴点に基づき、座標変換情報Ｉｃを算出してもよい。この場合であっても、構造照合部４３は、夫々の撮像画像Ｉｍで検出される構造特徴点に対する構造特徴点ベクトルを、各撮像画像Ｉｍの撮像時の位置姿勢変化量Ａｐを用いて補正する。これにより、構造照合部４３は、各撮像画像Ｉｍの撮像時の位置及び姿勢の変化の影響を受けることなく複数の撮像画像Ｉｍに基づき座標変換情報Ｉｃを好適に算出することができる。

　（６）処理フロー
　図９は、第１実施形態において制御部１７が実行する仮想オブジェクトの表示処理に関する処理概要を示すフローチャートの一例である。

　まず、制御部１７は、表示装置１の起動を検知する（ステップＳ１１）。この場合、制御部１７は、表示装置１の起動時の表示装置１の姿勢及び位置を基準としたデバイス座標系を設定する（ステップＳ１２）。その後、制御部１７は、カメラ１５が生成する撮像画像Ｉｍを取得すると共に、位置姿勢検出センサ１６が出力する検出信号に基づく位置姿勢変化量Ａｐを取得する（ステップＳ１３）。制御部１７は、ステップＳ１３で取得した撮像画像Ｉｍ及び位置姿勢変化量Ａｐの組合せを、センサデータ記憶部２０に記憶する。

　そして、制御部１７は、仮想オブジェクトの表示要求があるか否か判定する（ステップＳ１４）。例えば、仮想オブジェクト取得部４０は、興行者が管理する図示しないサーバ装置から仮想オブジェクトの表示を指示する配信情報を受信した場合に、仮想オブジェクトの表示要求があると判定する。そして、仮想オブジェクトの表示要求がない場合（ステップＳ１４；Ｎｏ）、引き続きステップＳ１３において撮像画像Ｉｍ及び位置姿勢変化量Ａｐの取得を行う。

　一方、仮想オブジェクトの表示要求があった場合（ステップＳ１４；Ｙｅｓ）、制御部１７は、伽リブレーション処理を実行する（ステップＳ１５）。このキャリブレーション処理の手順の詳細は図１０を参照して後述する。

　次に、制御部１７の反映部４４は、ステップＳ１５のキャリブレーション処理で得られた座標変換情報Ｉｃに基づき、表示要求において指定された仮想オブジェクト及び表示位置に対応する仮想オブジェクトを表示するための表示信号Ｓｄを生成する（ステップＳ１６）。なお、この場合、実際には、制御部１７は、種々の従来のＡＲ表示製品と同様、ユーザの視線方向及び位置姿勢変化量Ａｐ等を考慮してＡＲ座標系においてユーザが視認する空間を認識し、当該空間内において仮想オブジェクトが指定された位置で表示されるように表示信号Ｓｄを生成する。そして、制御部１７の光源制御部４５は、表示信号Ｓｄに基づき、光源ユニット１０の射出制御を行う（ステップＳ１７）。

　なお、図９に示すフローチャートの処理手順は一例であり、この処理手順に対し種々の変更を行うことができる。

　例えば、制御部１７は、ステップＳ１５のキャリブレーション処理を仮想オブジェクト表示要求がある度に実行しているが、これに限られない。これに代えて、制御部１７は、前回のキャリブレーション処理から所定時間以上経過した場合に限り、キャリブレーション処理を行ってもよい。このように、制御部１７は、キャリブレーション処理を、表示装置１の起動後少なくとも１度行えばよい。

　また、制御部１７は、表示装置１の起動時の表示装置１の位置及び姿勢を基準としてデバイス座標系を決定しているが、これに限られない。これに代えて、例えば、制御部１７は、表示装置１の起動後に最初に表示要求があったとき（即ち最初にキャリブレーション処理を実行したとき）の表示装置１の位置及び姿勢を基準として、デバイス座標系を決定してもよい。他の例では、制御部１７は、表示要求がある度に、当該表示要求時（即ちキャリブレーション処理実行時）の表示装置１の位置及び姿勢を基準としてデバイス座標系を再設定してもよい。この場合、後述する座標変換情報Ｉｃの生成処理には位置姿勢変化量Ａｐを使用する必要がない。

　図１０は、図９のステップＳ１５のキャリブレーション処理の詳細な処理手順を示すフローチャートの一例である。

　まず、制御部１７の特徴点情報出力部４１は、センサデータ記憶部２０等から取得する撮像画像Ｉｍに基づき、対象構造物の構造特徴点に関する構造特徴点情報ＩＦを出力する（ステップＳ２１）。この場合、特徴点情報出力部４１は、パラメータ記憶部２１から取得するパラメータに基づき識別器を構成し、当該識別器に撮像画像Ｉｍを入力することで構造特徴点情報ＩＦを取得する。そして、特徴点出力部４２は、特徴点情報出力部４１が出力する構造特徴点情報ＩＦに基づき、各構造特徴点の構造特徴点位置Ｐｄ及びラベルＬｂの組合せを出力する（ステップＳ２２）。

　次に、構造照合部４３は、図９のステップＳ１３で算出された位置姿勢変化量Ａｐと、構造データ記憶部２２が記憶する対象構造物のサイズ情報と、に基づき、デバイス座標系での各構造特徴点の検出位置を特定する（ステップＳ２３）。この場合、構造照合部４３は、図７及び図８を用いて説明したように、構造特徴点位置Ｐｄ及び位置姿勢変化量Ａｐに基づき特定される構造特徴点ベクトルと、構造特徴点間の距離とに基づき、デバイス座標系での各構造特徴点の検出位置を特定する。

　そして、構造照合部４３は、構造特徴点のラベル毎に、ステップＳ２３で特定した構造特徴点のデバイス座標系での検出位置と、構造データに含まれる登録位置情報が示す構造座標系の構造特徴点の位置と、を夫々対応付けて照合を行う（ステップＳ２４）。そして、構造照合部４３は、ラベル毎に照合した位置同士が一致するように、デバイス座標系から構造座標系へ変換するための座標変換情報Ｉｃを算出する（ステップＳ２５）。

　次に、第１実施形態の効果について補足説明する。

　表示装置１は、パラメータ記憶部２１を参照して構造特徴点情報ＩＦを出力するための識別器を構成する。この場合、種々の撮像環境及び対象構造物のバリエーションに対応した学習画像を用いて識別器を予め学習しておくことができるため、表示装置１は、撮像環境の変化及び対象構造物のバリエーションに対してロバストに構造特徴点情報ＩＦを生成することができる。

　また、表示装置１は、キャリブレーション処理において撮像画像Ｉｍから予め登録されている（即ち既にラベルが登録された）構造特徴点のみを抽出した情報を、構造データに登録された構造特徴点の情報と照合させる。これにより、座標変換情報Ｉｃを算出するための照合処理に要する計算量を大幅に削減し、かつ、撮像画像Ｉｍに含まれるノイズ（即ち対象構造物以外の特徴点）の抽出に起因した影響等を受けないロバストな座標変換情報Ｉｃの算出が可能となる。なお、座標変換情報Ｉｃを算出する際には、対象構造物の実スケールを加味するため、競技ルールに基づき予め定められた又は設計時等に既に計測された対象構造物の実スケールに関する情報を、サイズ情報として構造データに含めて予め記憶しておけばよい。

　＜第２実施形態＞
　図１１は、第２実施形態における表示システムの構成を示す。図１１に示すように、第２実施形態に係る表示システムは、表示装置１Ａと、サーバ装置２とを有する。第２実施形態では、キャリブレーション処理等を、表示装置１Ａの代わりにサーバ装置２が実行する点において、第１実施形態と異なる。以後では、第１実施形態と同様の構成要素については適宜同一符号を付し、その説明を省略する。

　表示装置１Ａは、サーバ装置２がキャリブレーション処理等を行うために必要な情報であるアップロード信号「Ｓ１」をサーバ装置２に送信する。この場合、アップロード信号Ｓ１には、例えば、カメラ１５が生成する撮像画像Ｉｍ及び位置姿勢検出センサ１６の出力に基づき検出される位置姿勢変化量Ａｐが含まれている。そして、表示装置１Ａは、サーバ装置２から送信される配信信号「Ｓ２」を受信した場合、配信信号Ｓ２に基づき、光源ユニット１０の光の射出制御を行うことで、仮想オブジェクトを表示する。例えば、配信信号Ｓ２は、第１実施形態の表示信号Ｓｄに相当する情報を含んでおり、表示装置１Ａは、配信信号Ｓ２の受信後、第１実施形態の光源制御部４５と同様の処理を行うことで、光源ユニット１０に仮想オブジェクトを表示するための光を射出させる。

　サーバ装置２は、例えば、興行者が管理するサーバ装置であり、表示装置１Ａから受信するアップロード信号Ｓ１に基づき、配信信号Ｓ２の生成及び表示装置１Ａへの配信信号Ｓ２の配信を行う。図１２は、サーバ装置２のブロック図である。サーバ装置２は、入力部２６と、制御部２７と、通信部２８と、記憶部２９とを有する。

　記憶部２９は、制御部２７がサーバ装置２の制御に必要な種々の情報を記憶する不揮発性メモリである。記憶部２９には、制御部２７が実行するプログラムが記憶される。記憶部２９は、センサデータ記憶部２０と、パラメータ記憶部２１と、構造データ記憶部２２とを有する。センサデータ記憶部２０には、制御部２７の制御に基づき、アップロード信号Ｓ１に含まれる撮像画像Ｉｍ及び位置姿勢変化量Ａｐが記憶される。なお、記憶部２９は、サーバ装置２に接続又は内蔵されたハードディスクなどの外部記憶装置であってもよく、フラッシュメモリなどの記憶媒体であってもよい。また、記憶部２９は、サーバ装置２とデータ通信を行うサーバ装置（即ち、他の装置から参照可能に情報を記憶する装置）であってもよい。また、この場合、記憶部２９は、複数のサーバ装置から構成され、センサデータ記憶部２０と、パラメータ記憶部２１と、構造データ記憶部２２とを分散して記憶してもよい。

　制御部２７は、例えばＣＰＵ、ＧＰＵなどのプロセッサ、作業メモリとして機能する揮発性メモリなどを有しており、サーバ装置２の全体的な制御を行う。制御部２７は、入力部２６へのユーザ入力等に基づき、仮想オブジェクトとして表示させる仮想オブジェクト及び表示位置の情報（即ち第１実施形態の指定表示情報Ｉｄに相当する情報）を生成する。さらに、制御部２７は、センサデータ記憶部２０、パラメータ記憶部２１、構造データ記憶部２２を参照することで、図１０に示されるキャリブレーション処理を実行し、配信信号Ｓ２を生成する。このように、制御部２７は、図３に示す仮想オブジェクト取得部４０、特徴点情報出力部４１、特徴点出力部４２、構造照合部４３、反映部４４に相当する機能を含む。

　図１３は、第２実施形態においてサーバ装置２の制御部２７が実行する処理手順を示すフローチャートの一例である。

　まず、制御部２７は、通信部２８を介し、撮像画像Ｉｍ及び位置姿勢変化量Ａｐなどを含むアップロード信号Ｓ１を表示装置１Ａから受信する（ステップＳ３１）。この場合、制御部２７は、アップロード信号Ｓ１に基づきセンサデータ記憶部２０に記憶させるデータを更新する。そして、制御部２７は、仮想オブジェクトの表示タイミングか否か判定する（ステップＳ３２）。そして、制御部２７は、表示タイミングではない場合（ステップＳ３２；Ｎｏ）、引き続きステップＳ３１においてアップロード信号Ｓ１を表示装置１Ａから受信する。

　一方、制御部２７は、表示タイミングである場合（ステップＳ３２；Ｙｅｓ）、ステップＳ３１で受信した最新のアップロード信号Ｓ１等に基づき、キャリブレーション処理を実行する。この場合、制御部２７は、図１０に示されるフローチャートを実行する。そして、制御部２７は、キャリブレーション処理で得られた座標変換情報Ｉｃに基づき、仮想オブジェクトを表示装置１Ａが表示するための配信信号Ｓ２を生成する（ステップＳ３４）。そして、制御部２７は、生成した配信信号Ｓ２を、通信部２８により表示装置１Ａに送信する（ステップＳ３５）。その後、配信信号Ｓ２を受信した表示装置１Ａは、配信信号Ｓ２に基づき光源ユニット１０を制御することで、仮想オブジェクトを表示する。

　以上のように、第２実施形態によっても、表示システムは、表示装置１Ａによる仮想オブジェクトの表示に必要な座標変換情報Ｉｃを的確に算出し、仮想オブジェクトを好適にユーザに視認させることができる。

　なお、第２実施形態において、キャリブレーション処理等をサーバ装置２が行う代わりに、表示装置１Ａが行ってもよい。この場合、表示装置１Ａは、サーバ装置２からキャリブレーション処理に必要な情報を適宜受信することで、図９及び図１０に示すフローチャートの処理を実行する。この態様であっても、表示システムは、表示装置１Ａのユーザに好適に仮想オブジェクトを視認させることができる。

　＜第３実施形態＞
　図１４は、第３実施形態における情報処理装置４の概略構成を示す。図１４に示すように、情報処理装置４は、取得部４１Ａと、構造照合部４３Ａとを有する。情報処理装置４は、例えば、第１実施形態における表示装置１の制御部１７又は第２実施形態におけるサーバ装置２の制御部２７により実現される。

　取得部４１Ａは、風景に重ねて仮想オブジェクトを表示する表示装置の撮像部１５Ａが撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得する。上述の表示装置は、例えば、第１実施形態の表示装置１又は第２実施形態の表示装置１Ａである。また、情報処理装置４と表示装置は同一装置であってもよい。「構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せ」は、例えば、第１実施形態又は第２実施形態における、複数の構造特徴点に対する構造特徴点位置ＰｄとラベルＬｂの複数の組合せに相当する。

　構造照合部４３Ａは、対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データ「Ｄｓ」と、上述の複数の組合せとを照合することで、表示装置が基準とする座標系である第１座標系と、構造データＤｓにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する。第１座標系は、例えば、第１実施形態及び第２実施形態におけるデバイス座標系に相当する。また、第２座標系は、例えば、第１実施形態及び第２実施形態における構造座標系に相当する。

　この態様によれば、情報処理装置４は、表示装置が基準とする座標系と構造データＤｓにおいて基準とする座標系との間の座標変換に関する座標変換情報を好適に生成することができる。

　なお、上述した各実施形態において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータであるプロセッサ等に供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　その他、上記の実施形態（変形例を含む、以下同じ）の一部又は全部は、以下の付記のようにも記載され得るが以下には限られない。

［付記１］
　風景に重ねて仮想オブジェクトを表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得する取得部と、
　前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する構造照合部と、
を有する情報処理装置。

［付記２］
　前記取得部は、前記対象構造物又は当該対象構造物と同一種類の対象構造物を撮像した複数の画像と、当該対象構造物の構造特徴点の各々の前記画像内の位置及び分類に関する正解データと、を用いて学習された識別器のパラメータに基づき前記識別器を構成し、当該識別器に前記撮像画像を入力することで、前記複数の組合せを取得する、付記１に記載の情報処理装置。「同一種類」は、用途が同一であればよい。例えば、テニスコートが対象物構造物の場合、サーフェスが異なる複数のテニスコートは、同一種類の対象構造物に該当する。

［付記３］
　前記識別器は、前記撮像画像から前記構造特徴点の分類毎の信頼度マップを出力し、
　前記取得部は、前記構造特徴点の分類毎に前記信頼度マップが示す信頼度が最大となる前記撮像画像内の位置に基づき、前記複数の組合せを決定する、付記２に記載の情報処理装置。

［付記４］
　前記識別器は、前記撮像画像から前記構造特徴点の分類毎の座標値を出力し、
　前記取得部は、前記構造特徴点の分類毎の座標値に基づき、前記複数の組合せを決定する、付記２に記載の情報処理装置。

［付記５］
　前記構造照合部は、前記第１座標系と前記第２座標系の一軸が等価な場合、少なくとも２つの構造特徴点に関する前記組合せと、前記構造データとを照合することで、前記座標変換情報を生成し、前記第１座標系の軸と前記第２座標系の軸とが夫々異なる場合、少なくとも３つの構造特徴点に関する前記組合せと、前記構造データとを照合することで、前記座標変換情報を生成する、付記１～４のいずれか一項に記載の情報処理装置。

［付記６］
　前記構造照合部は、前記取得部が取得する前記構造特徴点の位置情報の信頼度に基づき、前記構造データと照合する構造特徴点を選定する、付記５に記載の情報処理装置。

［付記７］
　前記構造照合部は、前記取得部が取得する前記構造特徴点の位置情報が示す前記撮像画像内の位置に基づき、前記前記構造データと照合する構造特徴点を選定する、付記５に記載の情報処理装置。

［付記８］
　前記構造照合部は、
　前記対象構造物のサイズ情報と、前記取得部が取得した前記構造特徴点の位置情報とに基づき特定される、前記第１座標系における前記構造特徴点の位置と、
　前記構造データが示す前記第２座標系における当該構造特徴点の位置と、を照合することで、前記座標変換情報を生成する、付記１～７のいずれか一項に記載の情報処理装置。

［付記９］
　前記構造照合部は、前記サイズ情報と、前記取得部が取得した前記構造特徴点の位置情報と、前記第１座標系が基準とする前記表示装置の位置姿勢に対する前記撮像画像の撮像時の前記表示装置の位置姿勢の変化量と、に基づき、前記第１座標系における前記構造特徴点の各々の位置を特定する、付記８に記載の情報処理装置。

［付記１０］
　前記情報処理装置は、前記表示装置であって、
　前記仮想オブジェクトを表示するための表示光を射出する光源ユニットと、
　前記表示光の少なくとも一部を反射することで、前記仮想オブジェクトを風景に重ねて観察者に視認させる光学素子と、
をさらに有する、付記１～９のいずれか一項に記載の情報処理装置。

［付記１１］
　前記情報処理装置は、前記表示装置と通信を行うサーバ装置であって、
　前記撮像画像を前記表示装置から受信し、かつ、前記座標変換情報に基づき生成した表示信号を、前記表示装置に送信する通信部をさらに有する、付記１～９のいずれか一項に記載の情報処理装置。

［付記１２］
　情報処理装置が実行する制御方法であって、
　風景に重ねて仮想オブジェクトを表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得し、
　前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する、制御方法。

［付記１３］
　風景に重ねて仮想オブジェクトを表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得する取得部と、
　前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する構造照合部
としてコンピュータを機能させるプログラムを格納する記憶媒体。

　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。

　１、１Ａ　表示装置
　２　サーバ装置
　３　学習装置
　４　情報処理装置
　１０　光源ユニット
　１１　光学素子
　１２　通信部
　１３　入力部
　１４　記憶部
　１５　カメラ
　１６　位置姿勢検出センサ
　２０　センサデータ記憶部
　２１　パラメータ記憶部
　２２　構造データ記憶部

Claims

　風景に重ねて仮想オブジェクトを表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得する取得部と、
　前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する構造照合部と、
を有する情報処理装置。
　前記取得部は、前記対象構造物又は当該対象構造物と同一種類の対象構造物を撮像した複数の画像と、当該対象構造物の構造特徴点の各々の前記画像内の位置及び分類に関する正解データと、を用いて学習された識別器のパラメータに基づき前記識別器を構成し、当該識別器に前記撮像画像を入力することで、前記複数の組合せを取得する、請求項１に記載の情報処理装置。
　前記識別器は、前記撮像画像から前記構造特徴点の分類毎の信頼度マップを出力し、
　前記取得部は、前記構造特徴点の分類毎に前記信頼度マップが示す信頼度が最大となる前記撮像画像内の位置に基づき、前記複数の組合せを決定する、請求項２に記載の情報処理装置。
　前記識別器は、前記撮像画像から前記構造特徴点の分類毎の座標値を出力し、
　前記取得部は、前記構造特徴点の分類毎の座標値に基づき、前記複数の組合せを決定する、請求項２に記載の情報処理装置。
　前記構造照合部は、前記第１座標系と前記第２座標系の一軸が等価な場合、少なくとも２つの構造特徴点に関する前記組合せと、前記構造データとを照合することで、前記座標変換情報を生成し、前記第１座標系の軸と前記第２座標系の軸とが夫々異なる場合、少なくとも３つの構造特徴点に関する前記組合せと、前記構造データとを照合することで、前記座標変換情報を生成する、請求項１～４のいずれか一項に記載の情報処理装置。
　前記構造照合部は、前記取得部が取得する前記構造特徴点の位置情報の信頼度に基づき、前記構造データと照合する構造特徴点を選定する、請求項５に記載の情報処理装置。
　前記構造照合部は、前記取得部が取得する前記構造特徴点の位置情報が示す前記撮像画像内の位置に基づき、前記構造データと照合する構造特徴点を選定する、請求項５に記載の情報処理装置。
　前記構造照合部は、
　前記対象構造物のサイズ情報と、前記取得部が取得した前記構造特徴点の位置情報とに基づき特定される、前記第１座標系における前記構造特徴点の位置と、
　前記構造データが示す前記第２座標系における当該構造特徴点の位置と、を照合することで、前記座標変換情報を生成する、請求項１～７のいずれか一項に記載の情報処理装置。
　前記構造照合部は、前記サイズ情報と、前記取得部が取得した前記構造特徴点の位置情報と、前記第１座標系が基準とする前記表示装置の位置姿勢に対する前記撮像画像の撮像時の前記表示装置の位置姿勢の変化量と、に基づき、前記第１座標系における前記構造特徴点の各々の位置を特定する、請求項８に記載の情報処理装置。
　前記情報処理装置は、前記表示装置であって、
　前記仮想オブジェクトを表示するための表示光を射出する光源ユニットと、
　前記表示光の少なくとも一部を反射することで、前記仮想オブジェクトを風景に重ねて観察者に視認させる光学素子と、
をさらに有する、請求項１～９のいずれか一項に記載の情報処理装置。
　前記情報処理装置は、前記表示装置と通信を行うサーバ装置であって、
　前記撮像画像を前記表示装置から受信し、かつ、前記座標変換情報に基づき生成した表示信号を、前記表示装置に送信する通信部をさらに有する、請求項１～９のいずれか一項に記載の情報処理装置。
　情報処理装置が実行する制御方法であって、
　風景に重ねて仮想オブジェクトを表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得し、
　前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する、制御方法。
　風景に重ねて仮想オブジェクトを表示する表示装置の撮像部が撮像した撮像画像から、対象構造物の構造的な特徴点である構造特徴点の分類情報及び当該構造特徴点の位置情報の複数の組合せを取得する取得部と、
　前記対象構造物の各構造特徴点の位置及び分類に関する情報を含む構造データと、前記複数の組合せとを照合することで、前記表示装置が基準とする座標系である第１座標系と、前記構造データにおいて用いられる座標系である第２座標系との間の座標変換に関する座標変換情報を生成する構造照合部
としてコンピュータを機能させるプログラムを格納する記憶媒体。