JP6429668B2 - 通信装置、画像処理装置、それらの制御方法、およびプログラム - Google Patents

通信装置、画像処理装置、それらの制御方法、およびプログラム Download PDF

Info

Publication number
JP6429668B2
JP6429668B2 JP2015031928A JP2015031928A JP6429668B2 JP 6429668 B2 JP6429668 B2 JP 6429668B2 JP 2015031928 A JP2015031928 A JP 2015031928A JP 2015031928 A JP2015031928 A JP 2015031928A JP 6429668 B2 JP6429668 B2 JP 6429668B2
Authority
JP
Japan
Prior art keywords
data
video
index
image processing
communication device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015031928A
Other languages
English (en)
Other versions
JP2016154302A5 (ja
JP2016154302A (ja
Inventor
裕彦 猪膝
裕彦 猪膝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015031928A priority Critical patent/JP6429668B2/ja
Publication of JP2016154302A publication Critical patent/JP2016154302A/ja
Publication of JP2016154302A5 publication Critical patent/JP2016154302A5/ja
Application granted granted Critical
Publication of JP6429668B2 publication Critical patent/JP6429668B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、複合現実システムにおける映像の伝送技術に関する。
近年、現実世界と仮想空間をリアルタイム且つシームレスに融合するMR(Mixed Reality: 複合現実)システムが利用されてきている。MRシステムを実現する方法の一つとして、ビデオシースルー方式がある。ビデオシースルー方式の一例として、HMD(Head Mounted Display)使用者がディスプレイにより観察する映像として、HMDに付属しているビデオカメラにより撮像されたHMD使用者の視界領域の撮像映像に、CG(Computer Graphics)を合成した映像を構築する技術がある。
撮像映像にCGを合成する処理は計算処理コストが大きいため、HMDはPCなどの外部の映像処理装置と接続し、一旦撮像映像を映像処理装置に送信し、映像処理装置は撮像映像にCGを合成し、HMDに送り返してもよい。このような場合に、HMD使用者は自由に動きながらMR空間を体験するために、HMDと映像処理装置とは無線伝送で通信することが望ましい。しかし、一般的に、無線通信は有線通信に比較して通信帯域が狭く、無線伝送上でのパケットロスによる遅延も発生しやすい。従って、HMD使用者がMR空間をリアルタイム且つ安定的に体験するためには、HMDは、撮像映像データを映像符号化技術により圧縮し、通信データ量を削減する必要がある。
一方で、撮像映像にCGを合成する映像処理装置においては、HMDの位置・姿勢を取得するためのキャリブレーションを行うために、受信した撮像映像からマーカー若しくは自然特徴により抽出された特徴点によって構成される指標を抽出する必要がある。この指標は、画像解析により抽出され、正確なキャリブレーションを行うためには、高精細な映像データが必要という背景がある。HMDにおいて実行される撮像映像データに対する映像符号化処理により撮像映像データが大幅に圧縮されてしまうと、映像処理装置は、十分に指標を抽出できず、その結果、必要十分な映像品質が得られないという問題がある。
そこで、利用可能な帯域が限られた環境で、映像処理装置が正確なキャリブレーションを行うことが可能で、HMD使用者がMR空間をリアルタイム且つ安定的に体験可能なMRシステムを実現することが望まれる。このようなMRシステムを実現するための一つの方法として、HMDが撮像映像データの中の重要度の低い領域と高い領域とを区別し、それぞれ割り当てるデータ量を変更する方法がある。例えば、キャリブレーションを行うための指標領域のように重要度の高い領域に関しては、圧縮率が低く設定される。
映像フレーム内で重要度の高低により符号化の圧縮率を変えることで送信データ量を削減する方法については、一般的に知られた技術である。例えば、特許文献1では、映像データのオブジェクト符号化方式におけるオブジェクト毎の位置関係や優先度に応じて符号化を行うか否か、又は符号化の圧縮率を変えることにより、低レート下での主観画質を向上させている。
特開2003−18591号公報
指標を正しく検出するために必要となる映像品質は、撮像画像における指標の大きさ、指標の撮像角度、撮像時のHMDの移動速度等の状況に応じて変わってくる。例えば撮像画像において映っている指標が大きい場合や、HMDが低速で移動している場合には、映像品質がさほど高くなくても指標検出ができることが考えられる。従って特許文献1の方法のように、重要度の高い指標領域の映像を毎回高品質で送信することは、HMDのようにバッテリー等で駆動する移動型の通信装置にとって、電力消費と周波数資源の効率的利用の観点から望ましくない。
本発明は、上記課題に鑑みてなされたものであり、HMD等の通信装置の電力消費を抑えつつ、当該通信装置の位置・姿勢の取得をより正確に行うことを目的とする。
上記目的を達成するための、本発明の一態様による通信装置は、以下の構成を有する。すなわち、画像処理装置と通信可能な通信装置であって、現実空間を撮像して映像データを生成する撮像手段と、前記撮像手段によって生成された前記映像データから、前記通信装置の位置・姿勢を特定するために使われる第1のータと第2のータを生成する生成手段と、前記第1のータを前記画像処理装置に送信する第1の送信手段と、前記画像処理装置における前記通信装置の位置・姿勢の特定結果に基づいて、前記第2のータを前記画像処理装置に送信する必要があるか否かを判定する判定手段と、前記判定手段による判定結果に基づいて、前記第2のータ前記画像処理装置に送信する第2の送信手段と、を有する。
本発明によれば、通信装置の電力消費を抑えつつ、当該通信装置の位置・姿勢の取得をより正確に行うことが可能となる。
MRシステムの構成図。 HMDの機能ブロック図(1)。 PCの機能ブロック図。 映像ブロック構成と映像品質を示す図。 基本映像と拡張映像の構成例を示す図。 全体動作を示すシーケンス図(1)。 全体動作を示すシーケンス図(2)。 基本映像のデータ構造の例を示す図。 拡張映像のデータ構造の例を示す図。 指標情報検出結果のデータ構造の例を示す図(1)。 HMDの全体処理のフローチャート。 HMDの拡張映像選択処理のフローチャート(1)。 PCの全体処理のフローチャート。 PCの指標情報検出処理のフローチャート。 通信フレームの構成図。 HMDの機能ブロック図(2)。 HMDの拡張映像選択処理のフローチャート(2)。 PCの機能ブロック図(2)。 指標情報検出結果のデータ構造の例を示す図(2)。 PCの拡指標情報検出処理のフローチャート(2)。 HMDの拡張映像選択処理のフローチャート(3)。
以下、添付の図面を参照して、本発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
[実施形態1]
図1は、実施形態1におけるMRシステムの構成例を示す図である。MRシステムは、使用者が装着するビデオシースルー型の頭部装着型の表示装置(以下、HMD)100、指標110〜115、画像処理装置であるPC105から構成される。HMD100とPC105は、互いに通信可能である。
指標を含む視界領域は、HMD100に付属する撮像装置により撮像され、撮像された映像は、映像データ130としてPC105へ伝送される。伝送方式として、例えばGigabit Ethernet、IEEE1394等の有線方式、IEEE802.11nやIEEE802.11ac等の無線方式が挙げられるが、これらに限定されない。
PC105は、受信した映像データ130に対し、画像解析により指標を検出し、HMD100の位置・姿勢を推定する画像処理装置である。指標は、例えば、それぞれが異なる色を有する円形状のマーカーによって構成されてもよいし、それぞれが異なる特徴を有する自然特徴等の特徴点によって構成されてもよい。また、指標として、ある程度の面積を有する四角形領域によって形成されるような四角形指標を用いることも可能である。指標は、撮像映像上における画像座標が検出可能であって、かついずれの指標であるかを示すパターンが識別可能であるような指標であれば、何れの形態であってもよい。
PC105は、指標を検出するにあたって、まず指標の形状を検出するための画像解析を行う。例えば、指標の外形が正方形であること、平板上の形であること、黒枠と白枠が所定の比率で構成されていること、等が条件として設定された場合、PC105は、当該条件と一致する画像領域を、指標の形状をしていると認識する。次に、PC105は、指標の形状をしていると認識された画像領域に関して、指標の識別パターンについての画像解析を行う。例えば、指標内部の識別パターンが2次元バーコードで構成されていれば、PC105は、パターンを一意に識別することができる。2次元バーコードには誤り検出コードを含めることにより、PC105は、対象となる指標に対して、正しくパターン認識が出来たか否かを判別し、位置・姿勢推定に使用できるかどうかを判定することが可能である。
位置・姿勢推定に用いられる指標は一個でもよいが、図1に示すように、複数の指標が同時に使用されてもよい。複数の指標が同時に使用される場合、各指標の位置関係が予め定義されれば、PC105は、複数の指標の位置関係から、各指標に対する視方向を算出することができる。PC105は、指標を複数使用したり、指標情報と映像中の特徴点の情報を組み合わせて使用したりすることで、より高い精度の位置・姿勢を推定することができる。
PC105は、HMD100の位置・姿勢を推定すると、推定した位置・姿勢に応じて映像データ130の上にCG135を合成し、CG合成映像140を生成する。PC105は、生成したCG合成映像140をHMD100に送信し、HMD100は、受信したCG合成映像140を表示する。
図2は、本実施形態におけるHMD100の機能ブロックの構成を示す図である。撮像部200は、HMD使用者が見ている現実空間映像を撮像する。映像圧縮部205は、撮像部200にて撮像された映像を、所定の符号化方式を用いて圧縮し、符号化データを生成する。本実施形態では、映像圧縮部205は、全体映像を複数のピクセルデータの集合である映像ブロック単位に分割し、各映像ブロックに対して符号化を行うことが可能である。映像ブロックの構成については図4を用いて詳述する。
映像圧縮部205は、各映像ブロックに対して基本品質の映像を生成するための基本映像データと、基本映像データと合成して高品質の映像を生成するための拡張映像データを生成可能な、スケーラブルな符号化方式を用いる。このような符号化方式として、例えば、Motion−JPEGやH.264/AVC等が挙げられるが、これら以外の方式でもよい。映像選択部210は、解析部220により取得した解析結果に基づいて、通信部215を介してPC宛てに送信する映像データを、各映像ブロックの基本映像データや拡張映像データの中から選定する。なお、基本映像データは本実施形態における第1の符号化データの一例であり、拡張映像データは本実施形態における第2の符号化データの一例である。
通信部215は、PC宛てに映像選択部210で選択された映像データを送信し、PCから指標情報検出結果と、CG合成映像を受信する。解析部220は、PCから受信した指標情報検出結果に含まれる指標検出状態、すなわち、指標形状検出数やパターン認識結果の成否を、解析する。表示部225は、PCから受信したCG合成映像を表示する。
なお、図2に示す各機能ブロックは、それぞれハードウェア又はソフトウェアによって構成される。ソフトウェアとして構成される場合には、各機能を実現するためのコンピュータプログラムが記憶部に記憶され、HMD100が備えるCPUが当該プログラムを実行することによって該機能が実現される。
図3は、PC105の機能ブロックの構成を示す図である。通信部300は、HMDから送信される基本映像データや拡張映像データを受信する。また、通信部300は、検出結果生成部320により生成された指標情報検出結果と、CG合成部330により生成されたCG合成映像を、HMDへ送信する。映像伸長部305は、HMDから受信した各映像ブロックの基本映像データを伸長して基本品質の映像を生成し、受信した拡張映像データを伸長する。映像合成部315は、伸長された各映像ブロックの基本映像データと拡張映像データとを合成して、高品質映像を生成する。
指標情報検出部310は、映像伸長部305により生成された基本品質の映像もしくは映像合成部315により生成された高品質映像を画像解析することにより、指標情報の検出を行う。指標情報検出部310は、指標形状検出部311、指標パターン判別部312、指標配置情報取得部313から構成される。指標形状検出部311は、画像解析処理により、映像内から指標の形状をした画像領域を検出する。指標形状の条件はシステムで予め決められており、例えば外形が正方形であること、平板上の形であること、黒枠と白枠が所定の比率で構成されていること、等である。このような条件に一致する画像領域は、指標の形状をしていると認識される。指標の形状をしていると認識された画像領域に関しては、指標配置情報取得部313により、全体映像における指標の配置が取得される。更に指標パターン判別部312は、画像解析処理により、指標の形状をしていると認識された画像領域に関して、指標の識別パターンを識別する。
検出結果生成部320は、指標情報検出部310により検出された内容をHMDに送信するためのデータとしてフォーマットする。位置・姿勢計測部325は、指標情報検出部310によりパターン検出された指標を用いてHMDの位置・姿勢を推定する。CG合成部330は、位置・姿勢計測部325により推定されたHMDの位置姿勢に基づいてCGを生成し、受信した映像データ上にCGを合成し、通信部300へCG合成映像データを渡す。
なお、図3に示す各機能ブロックは、それぞれハードウェア又はソフトウェアによって構成される。ソフトウェアとして構成される場合には、各機能を実現するためのコンピュータプログラムが記憶部に記憶され、PC105が備えるCPUが当該プログラムを実行することによって該機能が実現される。
図4は、映像のブロック構成と映像品質を示す図である。像400は、全体映像を複数のピクセルデータの集合である映像ブロック単位に分割するための分割パターンを示す。本例では、説明を簡単にするため、分割パターンは、縦と横をそれぞれ均等に3分割した映像ブロック構成となっているが、分割単位はこれに限定されるものではない。HMDは、各映像ブロックに対して、基本映像と拡張映像のデータを生成する。拡張映像データには、基本映像の高品質化に寄与する解像度を高めるための追加データ等が含まれる。
像405は、HMDの圧縮前の撮像映像を像400で定義した映像ブロックで分割した図である。各指標の配置は、所属する映像ブロックで識別されることが可能である。例えば、指標110は映像ブロック2に、指標114は映像ブロック4と5に跨って配置される。指標110や114のようにHMD使用者の正面を向いている指標であれば、正常な形状認識とパターン認識がされやすいが、指標112や113のように傾いている場合には、正常に形状認識はされても映像品質によってはパターン認識がされない可能性がある。圧縮前の撮像映像は、映像品質が最も良いので、圧縮前の撮像映像に基づく指標の形状検出と指標のパターン識別は、圧縮後の映像に基づく指標の形状検出と指標のパターン識別と比較して容易である。
像410は、圧縮率が低く、情報の消失が少ない映像の例を示している。圧縮による映像の品質劣化により、大部分の指標の形状検出は可能だが、一部の指標のパターン識別ができない状態にある。また、像415は、圧縮率が高く、情報の消失が多い映像の例を示している。像410と比較して更に映像の品質が劣化しているため、大部分の指標の形状検出ができない状態にある。
図5は、基本映像と拡張映像の構成例を示す図である。非圧縮映像500は、HMDで撮像された映像を示している。HMDは、この非圧縮映像500を、図4の像400に示すように映像ブロックごとに分割し圧縮処理を施す。その結果、映像ブロックごとに基本映像505と拡張映像のデータ510が生成される。拡張映像データには、基本映像の高品質化に寄与する解像度を高めるための追加データ等が含まれる。基本映像を伸長することで、基本品質の映像を取得可能であり、伸長した基本映像と拡張映像を合成することで、高品質の映像を取得可能である。本例では、圧縮した映像は基本映像と拡張映像の2つの層から構成されるが、これに限定されるものではなく、3つ以上の層から構成されるよう、HMDは圧縮処理を施しても良い。
図6は、本実施形態の全体処理の第一の例を示すHMDとPC間のシーケンス図である。図6のシーケンス図は、PCが基本映像を使用してHMDの位置姿勢を推定するにあたって、十分な数の指標が検出できた場合の映像フレーム一つ分の処理を示している。まず、HMDはS600にて、撮像した映像フレームを映像ブロック単位に分割し、各映像ブロックに対して基本映像と拡張映像を生成する。次にS605にて、HMDは、全映像ブロックの基本映像をPCへ送信する。PCはS610にて基本映像を受信し、伸長処理を行う。次にS615にて、PCは、伸長した基本品質の映像を用いて画像解析により指標情報検出処理を行う。指標情報検出処理については図14のフローチャートを用いて詳述する。
次にS620にて、PCは、指標情報検出結果をHMDへ送信する。HMDは、S625にて指標情報検出結果を受信し、その内容を解析する。この図の例では、HMDは、HMDの位置姿勢を推定するにあたって十分な数の指標が検出されたと判断している。PCは、HMDの位置姿勢を推定するにあたって十分な数の指標が検出されたことを認識した後、S630にて、指標情報を元にCGを生成し、受信した映像と合成してCG合成映像を生成する。なお、PCは、HMDの位置姿勢を推定するにあたって十分な数の指標が検出されたことを、PC自身による判定処理や、HMDからのメッセージや、HMDから一定時間内に拡張映像を受信しなかったこと等により認識することが可能である。次にS635にて、PCは、CG合成映像をHMDへ送信する。HMDは、S640にて、受信したCG合成映像を表示する。
図7は、本実施形態の全体処理の第二の例を示すHMDとPC間のシーケンス図である。図7のシーケンス図は、PCが基本映像を使用してHMDの位置姿勢を推定するにあたって、十分な数の指標が検出できなかった場合の映像フレーム一つ分の処理を示している。S700〜S725までの処理は、図6のS600〜S625までの処理と同内容である。
HMDはS725にて指標情報検出結果を受信し、その内容を解析する。この図の例では、HMDは、HMDの位置姿勢を推定するにあたって十分な数の指標が検出されなかったと判断し、拡張映像の追加伝送が必要であると判断している。そこで次にS730にて、HMDは、指標情報検出結果に基づいて追加伝送すべき拡張映像のブロックを選択し、S735にてPCへ送信する。拡張映像ブロックの選択処理については図12のフローチャートを用いて詳述する。PCは、S740にて、受信した拡張映像ブロックを伸長し、伸長した基本映像ブロックと合成して、高品質映像を生成する。次にS745にて、PCは、この高品質映像を用いて再度指標情報検出処理を行う。この図の例では、HMDの位置姿勢を推定するにあたって十分な数の指標が検出された場合を示している。続くS750〜S770までの処理は、図6のS620〜S640までの処理と同内容である。
図8は、本実施形態においてHMDが送信する基本映像のデータ構造の一例を示している。基本映像データ800は、映像ブロック1の基本映像データ805を含む、分割したブロック数分の基本映像データから構成されている。
図9は、本実施形態においてHMDが送信する拡張映像のデータ構造の一例を示している。本実施形態では、HMDが、PCにより生成された指標情報検出結果に基づいて送信すべき拡張映像を決定するため、すべての映像ブロックの拡張映像を含む必要はなく、一部の映像ブロックの拡張映像を含んでいても良い。ブロック番号905は、映像ブロックを識別する番号を示し、ブロック拡張映像データ910は、ブロック番号905で示される映像ブロック番号の拡張映像データを含んでいる。PCは、これらのブロック番号を識別することにより、各ブロックの基本映像と拡張映像を合成することができる。
図10は、PCの画像解析により生成する指標情報検出結果のデータ構造を示している。指標情報検出結果1000は、指標形状検出数(M)1005、指標パターン認識数(P)1010、M個の指標パターン判別フラグ1015、とM個の指標配置情報1020から構成される。指標形状検出数(M)1005は、PCの指標形状検出部により、少なくとも指標の形状をしていると認識された画像領域の数を示している。指標パターン認識数(P)1010は、PC側の指標パターン判別部312により、指標の形状をした画像領域のパターンが判別された結果、正常にパターンが認識できた指標の数を示している。例えば、指標内部の識別パターンが2次元バーコードで構成されていれば、指標パターン判別部312は、パターンを一意に識別することができる。2次元バーコードには誤り検出コードを含めることにより、PCは正しくパターン認識が出来たか否かを判別することが可能である。例えば、M=5,P=2の場合は、PCは5個の指標形状を検出できたが、識別パターンが認識できたのはそのうちの2つであることを示している。
指標パターン判別フラグ1015は、形状が検出できた1個目の指標のパターン判別結果を、OK(成功)/NG(失敗)の2状態で示している。指標配置情報1020は、形状が検出できた1個目の指標の全体映像における配置を示す情報である。例えば、図4のように全体映像を9つの映像ブロックに分割した場合に、9ビットのビットマップを使用して、指標配置情報1020は上位ビットから順番に所属映像ブロック番号を示すとする。この場合、指標115はブロック1とブロック4に跨っているので、指標配置情報1020は、0b100100000と表現できる。HMDは、これらの情報を使用して、追加映像の伝送が必要な場合に、必要な拡張映像ブロックを決定する。
以下、図11〜図15を用いて、本実施形態におけるHMDとPCの具体的な処理を説明する。図11は、HMDの制御方法の全体処理のフローチャートを示している。まずS1101にて、映像圧縮部205は、撮像した映像フレームを映像ブロック単位に分割し、各映像ブロックに対して基本映像と拡張映像を生成する。次に、S1105にて通信部215は、映像選択部210により選択された全映像ブロックの基本映像をPCへ送信する。次に、S1110にて、通信部215は、PCから送信される指標情報検出結果を待ち、受信する。
S1115にて、解析部220は、指標情報検出結果を解析し、指標のパターン認識数(P)が所定の閾値以上であるか、あるいは拡張映像の送信回数が上限に到達したかどうかを判定する。Pが所定の閾値以上である場合には、解析部220は、HMDの位置姿勢を推定するにあたって十分な数の指標が検出されたと判定し、処理はS1130へ分岐し、そうでない場合には、処理はS1120へ分岐する。また、MRシステムにおける映像伝送はリアルタイム性が要求されるため、通信帯域の制限から、図8のフレーム構成で示すように拡張映像の追加送信回数は予め決められている。そのため、送信回数が上限に到達した場合には、通信部215は、拡張映像の追加送信はこれ以上行わずに、処理はS1130へ分岐する。
S1120では、通信部215が追加の拡張映像を送信するにあたって、映像選択部210は、解析部220による指標情報検出結果の解析内容に従って、必要な映像ブロックを選択する。S1120の内容については図13を用いて詳述する。S1125では、通信部215は、選択された拡張映像をPCへ送信し、処理は再度S1110へ進む。S1130では、通信部215は、PCからCG合成映像を受信し、S1135にて、表示部225は、表示を行い、その後HMDの全体処理が終了する。
図12は、HMDの拡張映像選択処理(S1120)の詳細を示すフローチャートである。S1200にて、解析部220は、PCから受信した指標情報検出結果内の指標形状認識数(M)が所定の閾値を超えているかどうかを判定する。Mが所定の閾値を超えている場合には、解析部220は、形状検出はできているがパターン認識ができていない指標の所属する映像ブロックを特定可能と判断し、処理はS1210へ分岐し、そうでない場合は処理はS1205へ分岐する。S1210では、解析部220は、指標情報検出結果内のパターン判別フラグがNG(失敗)である指標の配置情報を取得し、S1215では、映像選択部210は、その配置情報で示される映像ブロックの拡張映像を選択する。S1205は、指標のパターン認識数(P)も指標形状認識数(M)もそれぞれ所定の閾値より低い状態であり、映像選択部210は、全映像ブロックの拡張映像、あるいは全映像ブロックからパターン判別の成功した指標の配置される映像ブロックを除いたすべての映像ブロックを選択する。
図13は、本実施形態におけるPCの制御方法の全体処理のフローチャートを示している。まずS1300にて、通信部300は、HMDから送信される全体の映像ブロックの基本映像を受信する。次にS1305にて、映像伸長部305は、受信した基本映像に伸長処理を施して基本品質の映像を生成する。次にS1310にて、指標情報検出部310は、基本品質の映像を用いて画像解析を行い、指標情報の検出処理を行う。続けて、検出結果生成部320は、指標情報検出結果を生成する。次に、S1315にて、通信部300は、S1310で生成された指標情報検出結果をHMDに送信する。
次に、S1320にて、指標情報検出部310は、指標情報の検出を行った結果、指標のパターン認識数(P)が所定の閾値以上であるか、あるいは拡張映像の送信回数が上限に到達したかどうかを判定する。Pが所定の閾値以上である場合には、指標情報検出部310は、HMDの位置姿勢を推定するにあたって十分な数の指標が検出されたと判定し、処理はS1340へ分岐し、そうでない場合には処理はS1325へ分岐する。拡張映像の送信回数が上限に到達した場合には、通信部300は、拡張映像の受信はこれ以上行わずに、処理はS1340へ分岐する。なお、S1320の判定処理は、このようにPC自身により行われてもよいし、HMDからのメッセージの有無や、HMDからの拡張映像の有無により行われてもよい。
S1325では、通信部300は、HMDが送信する拡張映像を受信し、S1330にて、映像伸長部305は、拡張映像に伸長処理を施す。次にS1335にて、映像合成部315は、S1305で伸長された基本映像と、S1330にて伸長された拡張映像を合成した合成データである高品質映像を生成する。次に、処理はS1310に戻り、指標情報検出部310は、高品質映像を用いて指標情報検出処理を再度実行する。S1340では、CG合成部330は、パターン認識の成功した指標情報を元にCGを生成し、HMDから受信した映像と合成する。最後にS1345で、通信部300は、CG合成映像をHMDに送信してPCの全体処理を終了する。
図14は、本実施形態におけるPCの指標情報検出処理(S1310)の詳細を示すフローチャートである。まずS1400にて、指標形状検出部311は、伸長された映像に対して画像解析を行い、指標の形状をした画像領域を検出し、指標配置情報取得部313は、該画像領域の配置情報を取得する。次にS1405にて、検出結果生成部320は、取得された情報を指標情報検出結果に格納する。より具体的には、形状が検出された指標の合計数は、図10の指標形状検出数(M)1005に、形状が検出された各指標の配置情報は、指標配置情報1020等に格納される。
次に、S1410にて、指標パターン判別部312は、S1400で形状検出された指標を一意に識別するパターン認識処理を行う。最後にS1415にて、検出結果生成部320は、パターン認識処理の結果を指標情報検出結果に格納する。より具体的には、パターン認識が成功した指標の合計数は、図10の指標パターン認識数(P)1010に、各指標のパターン認識結果は、指標パターン判別フラグ1015等に格納される。
図15は、本実施形態における通信フレームの一例の構成図を示している。撮像された各映像フレームは、HMDにより通信方式に適した形式にパケット化され、繰り返し周期で伝送される通信フレームを介して、PCへ送信される。MRシステムのように、リアルタイム性の要求されるシステムで遅延時間を保証するには、TDMA(Time Division Multiple Access:時分割多元接続)方式のように、予め割り当てられたタイムスロットを用いたアクセス方式が好適である。本例における通信フレームは、4つのタイムスロット(1500〜1503)から構成される。
タイムスロット1500では、HMDから所定の映像フレームの基本映像データが送信され、タイムスロット1501では、PCから1回目の指標情報検出結果が送信される。また、タイムスロット1502では、HMDから所定の映像フレームの拡張映像データが送信され、タイムスロット1503では、PCから2回目の指標情報検出結果が送信される。同様の通信フレームが、映像フレーム毎に送信される。なお、本例では、圧縮した映像は基本映像と拡張映像の2つの層から構成されるため、図15のような通信フレーム構成となるが、圧縮した映像が3つ以上の層から構成される場合は、全ての層についての映像が送信可能なように、通信フレームが構成される。
通信フレーム1510は、PCが基本映像のみを用いて位置姿勢を推定するにあたって十分な数の指標が検出された場合に、各タイムスロットで送信されるデータを示している。HMDは、タイムスロット1500で9つの映像ブロックから構成される基本映像を送信し、PCは、タイムスロット1501で基本映像を用いた指標検出結果を送信している。続くタイムスロット1502では、HMDは、先の基本映像を用いて十分な数の指標が検出できたため、追加の映像データを送信しない。また、それに伴い、PCもタイムスロット1503では指標検出結果のデータを送信しない。
通信フレーム1520は、PCが基本映像のみを用いて位置姿勢を推定するにあたって十分な数の指標が検出されず、追加送信すべき映像ブロックが特定できている場合に、各タイムスロットで送信されるデータを示している。HMDは、タイムスロット1500で9つの映像ブロックから構成される基本映像を送信し、PCは、タイムスロット1501で基本映像を用いた指標検出結果を送信している。続くタイムスロット1502では、HMDは、先の基本映像を用いて十分な数の指標が検出できなかったため、追加の映像ブロックの拡張映像データを送信する。例えば、基本映像が図4の像410に示すような映像品質で、PCは指標111と114の形状は検出できたが、パターン認識に失敗した場合に、指標111と114の配置される映像ブロックであるブロック4、5、9が選択される。PCは、タイムスロット1503で2回目の指標検出結果のデータを送信する。
通信フレーム1530は、PCが基本映像のみを用いて位置姿勢を推定するにあたって十分な数の指標が検出されず、追加送信すべき映像ブロックが特定できていない場合に、各タイムスロットで送信されるデータを示している。HMDは、タイムスロット1500でHMDは9つの映像ブロックから構成される基本映像を送信し、PCは、タイムスロット1501で基本映像を用いた指標検出結果を送信している。続くタイムスロット1502では、HMDは、先の基本映像を用いて十分な数の指標が検出できず、かつ追加送信すべき映像ブロックが特定できないため、全ての映像ブロックの拡張映像を送信している。HMDが通信フレーム1530を送信する場合として、例えば、基本映像が図4の像415に示すような映像品質で、映像の品質劣化が激しく、PCが指標の形状さえ認識できないような状況の場合が想定される。図15の例では、指標検出処理は最大2回行っているが、指標検出処理の試行回数はこれに限定されるものではなく、3回以上行ってもよい。
以上のように本実施形態では、HMDは、必要な場合にのみ指標検出に必要な高品質の映像データを送信することで、指標検出精度を保ちつつHMDのデータ送信時間を減らし電力消費を抑えることが可能となる。また、複数のHMD間で通信帯域を共有するような場合には、所定のHMDのデータ送信時間を減らすことで、他のHMDの送信時間に通信帯域を割り当てることができ、周波数資源を効率的に利用することが可能となる。
[実施形態2]
本実施形態では、HMDに簡易的な画像解析手段を追加することにより、PC側で指標の形状認識ができなかったときに、追加送信の必要な拡張映像を精度よく特定することのできる構成について記述する。
図16は、本実施形態におけるHMD100の機能ブロックの構成を示す図である。実施形態1における図2の機能ブロック構成と比較して、指標形状検出部230と指標配置情報取得部231が追加される。指標形状検出部230は、画像解析処理により、指標の形状をした画像領域を検出する。指標の形状をしていると認識された画像領域に関しては、指標配置情報取得部231により、全体映像における指標の配置が取得される。本実施形態では、これらの機能ブロックを使用することにより、HMD側でも圧縮前の高品質の撮像映像を使用して、指標の形状と配置を取得することが可能となる。
以下、図17を用いて、本実施形態におけるHMDの具体的な処理を説明する。図17は、本実施形態におけるHMDの全体処理のフローチャートを示している。まずS1700にて、指標形状検出部230と指標配置情報取得部231はそれぞれ、撮像部200により撮像された映像から指標の形状検出と配置情報の取得を行う。この処理は、図14に示した、PC側の処理S1400と同内容である。次に、S1701にて、映像圧縮部205は、映像フレームを映像ブロック単位に分割し、各映像ブロックに対して基本映像と拡張映像を生成する。次に、S1705にて、通信部215は、全映像ブロックの基本映像をPCへ送信する。次に、S1710にて、通信部215は、PCから送信される指標情報検出結果を待ち、受信する。
S1715にて、解析部220は、指標情報検出結果を解析し、指標のパターン認識数(P)が所定の閾値以上であるか、あるいは拡張映像の送信回数が上限に到達したかどうかを判定する。Pが所定の閾値以上である場合には、解析部220は、HMDの位置姿勢を推定するにあたって十分な数の指標が検出されたと判定し、処理はS1730へ分岐し、そうでない場合には、処理はS1720へ分岐する。送信回数が上限に到達した場合には、通信部215は、拡張映像の追加送信はこれ以上行わずに、処理はS1730へ分岐する。
S1720では、追加の拡張映像を送信するにあたって、映像選択部210は、S1700で取得した指標の形状検出と配置情報とPCから取得した指標情報検出結果を比較して、パターン認識ができていない指標が配置される映像ブロックを選択する。S1725では、通信部215は、S1720で選択された拡張映像をPCへ送信し、再度処理はS1710へ進む。S1730では、通信部215は、PCからCG合成映像を受信し、S1735にて、表示部225は、表示を行い、HMDの全体処理を終了する。
以上のようにして、PC側でたとえ指標の形状認識ができなかったとしても、HMD側で圧縮前の高品質の撮像映像を用いて指標の形状検出と配置情報の取得を行うことによって、形状認識のできなかった指標の位置をHMD側で特定することができる。その結果、実施形態1と比較して追加送信の必要な拡張映像を精度よく特定することができ、送信データを減らすことによってHMDの電力消費を更に抑えることが可能となる。
[実施形態3]
本実施形態では、複数の指標の位置関係がMRシステムで予め定義されていることを利用して、PCが、パターン検出が成功した指標に基づいて、形状認識の成功していない指標の映像フレーム内の配置を予測する構成について記述する。それにより、PC側で指標の形状認識ができなかったときに、追加送信の必要な拡張映像を精度よく特定することができる。
図18は、本実施形態におけるPC105の機能ブロックの構成を示す図である。実施形態1における図3の機能ブロック構成と比較して、パターン検出が成功した指標から、形状認識の成功していない指標の映像フレーム内の配置を予測する指標配置情報予測部314が追加される。
図19は、本実施形態におけるPCの画像解析により生成される指標情報検出結果のデータ構造を示している。実施形態1における図10の指標情報検出結果と比較し、1900には指標配置予測情報1025が追加される。指標配置予測情報1025には、指標の配置が予測される映像ブロック番号を示す情報が含まれる。例えば、図4のように全体映像を9つの映像ブロックに分割した場合に、9ビットのビットマップを使用して上位ビットから順番に所属映像ブロック番号を示したとする。指標配置予測情報1025に0b100101000という値が含まれる場合、映像ブロック1と4と6に指標の配置が予測されることを示す。
以下、図20〜図21を用いて、本実施形態におけるPCとHMDの具体的な処理を説明する。図20は本実施形態におけるPCの指標情報検出処理の詳細を示すフローチャートである。S2000〜S2010は図14のS1400〜1410の処理と同内容である。S2011では、指標配置情報予測部314は、パターン検出が成功した指標から、MRシステムで予め定義された複数指標の位置関係から形状認識の成功していない指標の配置を予測する。S2015では、検出結果生成部320は、取得された指標配置予測情報を指標情報検出結果に格納している。
図21は、本実施形態におけるHMDの拡張映像選択処理の詳細を示すフローチャートである。解析部220は、S2100にてPCから受信した指標情報検出結果内の指標形状認識数(M)が所定の閾値を超えているかどうかを判定する。Mが所定の閾値を超えている場合には、解析部220は、形状検出はできているがパターン認識ができていない指標の所属する映像ブロックを特定可能と判断し、処理はS2110へ分岐し、そうでない場合は、処理はS2105へ分岐する。S2110では、解析部220は、指標情報検出結果内のパターン判別フラグがNG(失敗)である指標の配置情報を取得し、S2115では、映像選択部210は、その配置情報で示される映像ブロックの拡張映像を選択する。
S2105は、指標のパターン認識数(P)も指標形状認識数(M)もそれぞれ所定の閾値より低い状態であり、映像選択部210は、指標情報検出結果内に指標配置予測情報が含まれるかどうかを判別する。含まれる場合には、S2106にて、映像選択部210は、指標配置予測情報で示される映像ブロックの拡張映像を選択する。指標配置予測情報が含まれない場合には、S2107にて、映像選択部210は、全映像ブロックの拡張映像、あるいは全映像ブロックからパターン判別の成功した指標の配置される映像ブロックを除いたすべての映像ブロックを選択する。
以上のようにして、PC側でたとえ指標の形状認識ができなかったとしても、PCの指標配置予測情報を使用することによって、形状認識のできなかった指標の位置をHMD側で特定することができる。その結果、実施形態1と比較して追加送信の必要な拡張映像を精度よく特定することができ、送信データを減らすことによってHMDの電力消費を更に抑えることが可能となる。
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100 HMD、 110〜115 指標、 105 PC、 130 映像データ、 135 CG、 140 CG合成映像、200 撮像部、 205 映像圧縮部、 210 映像選択部、 215 通信部、 220 解析部、 225 表示部、 300 通信部、 305 映像伸長部、310 指標情報検出部、 311 指標形状検出部、 312 指標パターン判別部、 313 指標配置情報取得部、 315 映像合成部、 320 検出結果生成部、 330 CG合成部

Claims (17)

  1. 画像処理装置と通信可能な通信装置であって、
    現実空間を撮像して映像データを生成する撮像手段と、
    前記撮像手段によって生成された前記映像データから、前記通信装置の位置・姿勢を特定するために使われる第1のータと第2のータを生成する生成手段と、
    前記第1のータを前記画像処理装置に送信する第1の送信手段と、
    前記画像処理装置における前記通信装置の位置・姿勢の特定結果に基づいて、前記第2のータを前記画像処理装置に送信する必要があるか否かを判定する判定手段と、
    前記判定手段による判定結果に基づいて、前記第2のータ前記画像処理装置に送信する第2の送信手段と、
    を有する通信装置。
  2. 前記判定手段により前記第2のータ送信する必要があると決定された場合に、前記第2の送信手段が送信する第2のータを選択する選択手段を更に有し、
    前記第2の送信手段は前記選択手段により選択された第2のータを前記画像処理装置に送信することを特徴とする請求項1に記載の通信装置。
  3. 前記生成手段は、前記通信装置の位置・姿勢を特定するための指標を含んだ前記第1のータを生成し、
    前記判定手段は、前記画像処理装置による前記指標の検出状態を解析して、前記第2のータ送信する必要があるか否かを判定することを特徴とする請求項2に記載の通信装置。
  4. 前記指標の検出状態には、前記指標の形状の検出数と前記指標のパターンの認識数が含まれることを特徴とする請求項3に記載の通信装置。
  5. 前記選択手段は、前記指標の形状の検出数と前記指標のパターンの認識数がそれぞれ所定の閾値より小さい場合に、前記第2のータの全てを選択することを特徴とする請求項4に記載の通信装置。
  6. 前記選択手段は、前記指標のパターンの認識数が所定の閾値より小さく、前記指標の形状の検出数が閾値以上である場合に、前記映像データの中の、前記指標のパターンの認識が失敗した指標を含むブロックにおける前記第2のータを選択することを特徴とする請求項4または5に記載の通信装置。
  7. 前記第1のータは、前記画像処理装置が基本品質の映像を生成するために必要な基本映像データであり、
    前記第2のータは、前記第1のータと合成されることにより高品質の映像を生成するために必要な拡張映像データであることを特徴とする請求項1から6のいずれか1項に記載の通信装置。
  8. 現実空間を撮像して映像データを生成する撮像手段有する通信装置と通信可能な画像処理装置であって、
    前記撮像手段によって生成された映像データに基づいて前記通信装置において生成された第1のータを受信する受信手段と、
    記第1のデータに基づいて、前記通信装置の位置・姿勢を特定する第1の特定手段と、
    前記第1の特定手段における特定結果を前記通信装置に通知する通知手段と、
    前記撮像手段によって生成された映像データに基づいて前記通信装置において生成された第2のデータを、前記通知手段による通知に応じて前記画像処理装置から受信した場合、当該第2のデータに基づいて、前記通信装置の位置・姿勢を特定する第2の特定手段と、
    を有することを特徴とする画像処理装置。
  9. 検出手段をさらに有し、
    記第1のータには、前記通信装置の位置・姿勢を特定するための指標が含まれ、
    前記検出手段は、記第1のデータから前記指標を検出することを特徴とする請求項8に記載の画像処理装置。
  10. 前記通知には、前記検出手段により検出された前記指標の検出状態まれることを特徴とする請求項9に記載の画像処理装置。
  11. 前記指標の検出状態には、前記指標の形状の検出数と前記指標のパターンの認識数が含まれることを特徴とする請求項10に記載の画像処理装置。
  12. 合成手段を更に有し、
    記通信装置から前記第2のータ受信した場合に、
    前記合成手段は、前記第1のデータと前記第2のデータとを合成して合成データを生成し、
    前記第2の特定手段は、前記合成データに基づいて前記通信装置の位置・姿勢を特定することを特徴とする請求項8から11のいずれか1項に記載の画像処理装置。
  13. 前記第1のータは、本品質の映像を取得するために必要な基本映像データであり、
    前記第2のータは、前記第1のータと合成されることにより高品質の映像を生成するために必要な拡張映像データであることを特徴とする請求項8から12のいずれか1項に記載の画像処理装置。
  14. 画像処理装置と通信可能な通信装置の制御方法であって、
    現実空間を撮像して映像データを生成する撮像工程と、
    前記撮像工程において生成された前記映像データから、前記通信装置の位置・姿勢を特定するために使われる第1のータと第2のータを生成する生成工程と、
    前記第1のータを前記画像処理装置に送信する第1の送信工程と、
    前記画像処理装置における前記通信装置の位置・姿勢の特定結果に基づいて、前記第2のータを前記画像処理装置に送信する必要があるか否かを判定する判定工程と、
    前記判定工程における判定結果に基づいて、前記第2のータ前記画像処理装置に送信する第2の送信工程と、
    を有する通信装置の制御方法。
  15. 現実空間を撮像して映像データを生成する撮像手段を有する通信装置と通信可能な画像処理装置の制御方法であって、
    前記撮像手段によって生成された映像データに基づいて前記通信装置において生成された第1のータを受信する受信工程と、
    記第1のデータに基づいて、前記通信装置の位置・姿勢を特定する第1の特定工程と、
    前記第1の特定工程における特定結果を前記通信装置に通知する通知工程と、
    前記撮像手段によって生成された映像データに基づいて前記通信装置において生成された第2のデータを、前記通知工程における通知に応じて前記画像処理装置から受信した場合、当該第2のデータに基づいて、前記通信装置の位置・姿勢を特定する第2の特定工程と、
    を有することを特徴とする画像処理装置の制御方法。
  16. 請求項1から7のいずれか1項に記載の通信装置の各手段としてコンピュータを機能させるためのプログラム。
  17. 請求項8から13のいずれか1項に記載の画像処理装置の各手段としてコンピュータを機能させるためのプログラム。
JP2015031928A 2015-02-20 2015-02-20 通信装置、画像処理装置、それらの制御方法、およびプログラム Active JP6429668B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015031928A JP6429668B2 (ja) 2015-02-20 2015-02-20 通信装置、画像処理装置、それらの制御方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015031928A JP6429668B2 (ja) 2015-02-20 2015-02-20 通信装置、画像処理装置、それらの制御方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2016154302A JP2016154302A (ja) 2016-08-25
JP2016154302A5 JP2016154302A5 (ja) 2018-03-29
JP6429668B2 true JP6429668B2 (ja) 2018-11-28

Family

ID=56761346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015031928A Active JP6429668B2 (ja) 2015-02-20 2015-02-20 通信装置、画像処理装置、それらの制御方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6429668B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6137910B2 (ja) * 2013-03-29 2017-05-31 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP6271888B2 (ja) * 2013-07-12 2018-01-31 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム

Also Published As

Publication number Publication date
JP2016154302A (ja) 2016-08-25

Similar Documents

Publication Publication Date Title
US9773333B2 (en) Information processing device, information processing method, and program
US11551408B2 (en) Three-dimensional model distribution method, three-dimensional model receiving method, three-dimensional model distribution device, and three-dimensional model receiving device
US20220174252A1 (en) Selective culling of multi-dimensional data sets
US11653065B2 (en) Content based stream splitting of video data
JP6263830B2 (ja) 圧縮ビデオデータにおいて複数の関心領域の指標を含めるための技術
EP3008695B1 (en) Robust tracking using point and line features
EP3515068A1 (en) A method and apparatus for encoding and decoding three-dimensional scenes in and from a data stream
CN110268711B (zh) 用于编码宽视图视频的球面旋转的方法及装置
EP3288271A1 (en) Method and apparatus for transmitting and receiving image data for virtual-reality streaming service
JP2017528947A (ja) パノラマ映像コンテンツの再生に使用するシステム及び方法
CN107945101B (zh) 图像处理方法和装置
JP2019537913A (ja) ストリーミングされたメタデータを用いたビデオフレームレート変換
US11394943B2 (en) Image processing apparatus and method, file generation apparatus and method, and program
US10535193B2 (en) Image processing apparatus, image synthesizing apparatus, image processing system, image processing method, and storage medium
EP3813024A1 (en) Image processing device and image processing method
TW202029742A (zh) 影像合成
US10504247B2 (en) Transmission apparatus, mixed reality system, transmission method, and program
JP6429668B2 (ja) 通信装置、画像処理装置、それらの制御方法、およびプログラム
JP2017207818A (ja) 画像処理装置、画像処理方法、プログラム
JP2012085350A (ja) 画像処理装置、画像処理方法、及びプログラム
JP2017010120A (ja) 情報処理装置、映像処理装置、およびそれらの制御方法、ならびに映像処理システム
JP6539122B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
JP2020145651A (ja) 情報処理装置、システム、情報処理方法及びプログラム
US20190052868A1 (en) Wide viewing angle video processing system, wide viewing angle video transmitting and reproducing method, and computer program therefor
JP7118913B2 (ja) 表示装置、表示方法及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180219

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180219

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181001

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181030

R151 Written notification of patent or utility model registration

Ref document number: 6429668

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151