JP6499993B2 - 情報処理装置、情報処理システム、および情報処理方法 - Google Patents

情報処理装置、情報処理システム、および情報処理方法 Download PDF

Info

Publication number
JP6499993B2
JP6499993B2 JP2016099908A JP2016099908A JP6499993B2 JP 6499993 B2 JP6499993 B2 JP 6499993B2 JP 2016099908 A JP2016099908 A JP 2016099908A JP 2016099908 A JP2016099908 A JP 2016099908A JP 6499993 B2 JP6499993 B2 JP 6499993B2
Authority
JP
Japan
Prior art keywords
data
missing
information
image
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016099908A
Other languages
English (en)
Other versions
JP2017208706A (ja
JP2017208706A5 (ja
Inventor
良雄 宮崎
良雄 宮崎
敦宣 辰巳
敦宣 辰巳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Priority to JP2016099908A priority Critical patent/JP6499993B2/ja
Priority to US16/300,275 priority patent/US10701184B2/en
Priority to PCT/JP2017/017926 priority patent/WO2017199859A1/ja
Publication of JP2017208706A publication Critical patent/JP2017208706A/ja
Publication of JP2017208706A5 publication Critical patent/JP2017208706A5/ja
Application granted granted Critical
Publication of JP6499993B2 publication Critical patent/JP6499993B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/75Indicating network or usage conditions on the user display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/131Protocols for games, networked simulations or virtual reality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • H04N13/117Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation the virtual viewpoint locations being selected by the viewers or determined by viewer tracking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/344Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • H04N19/166Feedback from the receiver or from the transmission channel concerning the amount of transmission errors, e.g. bit error rate [BER]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Processing (AREA)
  • Communication Control (AREA)

Description

本発明は、撮影画像を利用して情報処理を行う情報処理装置、情報処理システム、およびそれらでなされる情報処理方法に関する。
ユーザをビデオカメラで撮影し、その像を別の画像で置換してディスプレイに表示するゲームが知られている(例えば、特許文献1参照)。また、ビデオカメラで撮影された口や手の動きをアプリケーションの操作指示として受け取るユーザインターフェースシステムも知られている。このように、実世界を撮影しその動きに反応する仮想世界を表示させたり、何らかの情報処理を行ったりする技術は、小型の携帯端末からレジャー施設まで、その規模によらず幅広い分野で利用されている。
その一例として、ヘッドマウントディスプレイにパノラマ映像を表示し、ヘッドマウントディスプレイを装着したユーザが頭部を回転させると視線方向に応じたパノラマ画像が表示されるようにしたシステムも開発されている。ヘッドマウントディスプレイを利用することで、映像への没入感を高めたり、ゲームなどのアプリケーションの操作性を向上させたりすることができる。また、ヘッドマウントディスプレイを装着したユーザが物理的に移動することで、映像として表示された空間内を仮想的に歩き回ることのできるウォークスルーシステムも開発されている。
欧州特許出願公開第0999518号明細書
臨場感のある画像表現を実現したり、情報処理を高精度に行ったりするためには、撮影画像の解像度やフレームレートを高くすることが望ましい。一方、そのようにして扱うべきデータサイズが増えると、データ伝送や画像解析の負荷が増え、画像表示までに要する時間が増加する。その結果、実際の動きと表示にずれが生じるなどして、ユーザに違和感を与えることもあり得る。また伝送帯域を圧迫することによりデータの欠落が生じやすくなり、画像解析の精度がかえって悪化することもあり得る。
本発明はこうした課題に鑑みてなされたものであり、その目的は、撮影画像データの伝送および解析を伴う情報処理において、即時性を損なわずに良好な処理結果を取得できる技術を提供することにある。
上記課題を解決するために、本発明のある態様は情報処理装置に関する。この情報処理装置は、撮像装置と通信を確立し撮影画像のデータを取得する通信部と、通信の結果として欠落したデータと、撮影画像上の位置とを対応づけた欠落情報を生成する欠落情報生成部と、欠落情報を参照し、データが欠落した箇所を他と差別化して撮影画像の解析を行う画像解析部と、解析の結果に基づき出力データを生成して出力する出力データ生成部と、を備えることを特徴とする。
本発明の別の態様は情報処理システムに関する。この情報処理システムは、撮像装置を備えたヘッドマウントディスプレイと、ヘッドマウントディスプレイと通信を確立し、表示画像を生成してヘッドマウントディスプレイに表示させる情報処理装置と、を含み、情報処理装置は、ヘッドマウントディスプレイから撮影画像のデータを取得する通信部と、通信の結果として欠落したデータと、撮影画像上の位置とを対応づけた欠落情報を生成する欠落情報生成部と、欠落情報を参照し、データが欠落した箇所を他と差別化して撮影画像の解析を行う画像解析部と、解析の結果に基づき出力データを生成して出力する出力データ生成部と、を備えることを特徴とする。
本発明のさらに別の態様は情報処理方法に関する。この情報処理方法は情報処理装置が、撮像装置と通信を確立し撮影画像のデータを取得するステップと、通信の結果として欠落したデータと、撮影画像上の位置とを対応づけた欠落情報を生成するステップと、欠落情報を参照し、データが欠落した箇所を他と差別化して撮影画像の解析を行うステップと、解析の結果に基づき出力データを生成して表示装置に出力するステップと、を含むことを特徴とする。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、データ構造、記録媒体などの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、撮影画像データの伝送および解析を伴う情報処理において、即時性を損なわずに良好な処理結果を取得できる。
本実施の形態のヘッドマウントディスプレイの外観図である。 本実施の形態のヘッドマウントディスプレイの回路構成図である。 本実施の形態の情報処理システムの構成図である。 本実施の形態の情報処理装置の内部回路構成を示す図である。 本実施の形態におけるヘッドマウントディスプレイが、カメラが撮影した画像を送信する際のデータ構造を模式的に示す図である。 本実施の形態における情報処理装置がヘッドマウントディスプレイから受信した画像のデータ構造を模式的に示す図である。 本実施の形態の画像データ伝送において、再送処理に許容される時間に対するデータの欠落率を定性的に表す図である。 本実施の形態におけるヘッドマウントディスプレイの機能ブロックの構成を示す図である。 本実施の形態における情報処理装置の機能ブロックの構成を示す図である。 本実施の形態においてヘッドマウントディスプレイから情報処理装置へ送信されるパケットのデータ構造例を示す図である。 本実施の形態において情報処理装置の欠落情報生成部が生成する欠落情報のデータ構造を例示す図である。 本実施の形態において情報処理装置の欠落情報生成部が生成する欠落情報のデータ構造を例示す図である。 本実施の形態において態情報処理装置の欠落情報生成部が生成する欠落情報のデータ構造を例示す図である。 本実施の形態の画像データ伝送における許容時間と解析精度の関係を説明するための図である。 本実施の形態において、画像解析の精度によって、損失したパケットの再送許容時間を調整する機能を有する情報処理装置の機能ブロックの構成を示す図である。 本実施の形態において、損失したパケットの再送許容時間によって内部の処理条件を調整する機能を有するヘッドマウントディスプレイの機能ブロックの構成を示す図である。 本実施の形態において情報処理装置が撮影画像のデータに基づき出力データを生成する処理手順を示すフローチャートである。
本実施の形態では、撮影装置によって撮影された画像を用いて情報処理を行い、その結果を即時表示するシステムにおいて、伝送時にデータが欠落しても最大限のパフォーマンスを発揮できるようにする。この限りにおいて撮像装置や表示装置の形態は特に限定されないが、ここではカメラを備えたヘッドマウントディスプレイを例に説明する。ヘッドマウントディスプレイによって撮影された画像を利用して、それを装着したユーザの頭部の動きに対応するように視野が変化する画像を描画し表示させるのは、時間的な制約の厳しさの観点で好適な例である。ただし撮像装置と表示装置が別の筐体を有していても、本実施の形態を同様に適用できる。
図1は、本実施の形態におけるヘッドマウントディスプレイの外観形状の例を示している。この例においてヘッドマウントディスプレイ100は、出力機構部102および装着機構部104で構成される。装着機構部104は、ユーザが被ることにより頭部を一周し装置の固定を実現する装着バンド106を含む。装着バンド106はユーザの頭囲に合わせて長さの調節が可能な素材または構造とする。例えばゴムなどの弾性体としてもよいし、バックルや歯車などを利用してもよい。
出力機構部102は、ヘッドマウントディスプレイ100をユーザが装着した状態において両眼を覆うような形状の筐体108を含み、内部には装着時に目に正対するように表示パネルを備える。表示パネルは液晶パネルや有機ELパネルなどで実現する。筐体108内部にはさらに、ヘッドマウントディスプレイ100の装着時に表示パネルとユーザの目との間に位置し、広い視野で画像が視認されるようにする一対のレンズを備える。またヘッドマウントディスプレイ100はさらに、装着時にユーザの耳に対応する位置にスピーカーやイヤホンを備えてよい。
ヘッドマウントディスプレイ100は、出力機構部102の前面にカメラ110を備える。カメラ110はCCD(Charge Coupled Device)またはCMOS(Complementary Metal Oxide Semiconductor)等の撮像素子を備え、ヘッドマウントディスプレイ100を装着したユーザの顔の向きに対応する視野で、実空間を所定のフレームレートで撮影する。なおカメラ110はヘッドマウントディスプレイ100の前面に1つのみ設けられてもよいし、既知の間隔を有するように2つのカメラを左右に配置したステレオカメラとしてもよい。またカメラ110の配置は特に限定されない。
カメラ110が撮影した画像は、ヘッドマウントディスプレイ100における表示画像の少なくとも一部として使用できるほか、仮想世界の生成に必要な画像解析のための入力データとすることもできる。例えば撮影画像をそのまま表示画像とすれば、ユーザは目の前の実空間を直接見ているのと同じ状態となる。また、視野内にある机などの実物体上に滞留したり実物体とインタラクションしたりするオブジェクトを撮影画像上に描画して表示画像とすることにより、AR(Augmented Reality:拡張現実)を実現できる。
さらに、ヘッドマウントディスプレイ100を装着したユーザの頭部の位置や姿勢を撮影画像から特定し、それに対応するように視野を変化させて仮想世界を描画することによりVR(Virtual Reality:仮想現実)も実現できる。撮影画像からカメラの位置や姿勢を推定する技術には、v−SLAM(Visual Simultaneous Localization And Mapping)などの一般的な技術を適用できる。頭部の回転角や傾きは、ヘッドマウントディスプレイ100に内蔵または外付けされたモーションセンサによって計測してもよい。撮影画像の解析結果とモーションセンサの計測値を相補完的に利用してもよい。
図2は、ヘッドマウントディスプレイ100の回路構成を示している。制御部10は、画像信号、センサ信号などの信号や、命令やデータを処理して出力するメインプロセッサである。カメラ110は撮影画像のデータを制御部10に供給する。ディスプレイ30は液晶ディスプレイなどであり、制御部10から画像信号を受け取り表示する。
通信制御部40は、ネットワークアダプタ42またはアンテナ44を介して、有線または無線通信により、制御部10から入力されるデータを外部に送信する。通信制御部40は、また、ネットワークアダプタ42またはアンテナ44を介して、有線または無線通信により、外部からデータを受信し、制御部10に出力する。記憶部50は、制御部10が処理するデータやパラメータ、操作信号などを一時的に記憶する。
モーションセンサ64は、ヘッドマウントディスプレイ100の回転角や傾きなどの姿勢情報を検出する。モーションセンサ64は、ジャイロセンサ、加速度センサ、地磁気センサなどを適宜組み合わせて実現される。外部入出力端子インターフェース70は、USB(Universal Serial Bus)コントローラなどの周辺機器を接続するためのインターフェースである。外部メモリ72は、フラッシュメモリなどの外部メモリである。制御部10は、画像や音声データをディスプレイ30や図示しないヘッドホンに供給して出力させたり、通信制御部40に供給して外部に送信させたりすることができる。
図3は、本実施の形態に係る情報処理システムの構成図である。ヘッドマウントディスプレイ100は、図2のアンテナ44等を介して、Bluetooth(登録商標)プロトコルやIEEE802.11プロトコルなどの通信プロトコルにより情報処理装置200と通信を確立する。情報処理装置200は、さらにネットワークを介してサーバに接続されてもよい。その場合、サーバは、複数のユーザがネットワークを介して参加できるゲームなどのオンラインアプリケーションを情報処理装置200に提供してもよい。ヘッドマウントディスプレイ100は、情報処理装置200の代わりに、コンピュータや携帯端末に接続されてもよい。
情報処理装置200は基本的に、ヘッドマウントディスプレイ100のカメラ110が撮影した画像のデータを順次受信し、所定の処理を実施したうえ表示画像を生成してヘッドマウントディスプレイ100に送信する処理をフレームごとに繰り返す。これによりヘッドマウントディスプレイ100には、ユーザの顔の向きに応じた視野で、ARやVRなど様々な画像が表示される。なおこのような表示の最終目的は、ゲーム、仮想体験、動画鑑賞など様々に考えられる。
図4は情報処理装置200の内部回路構成を示している。情報処理装置200は、CPU(Central Processing Unit)222、GPU(Graphics Processing Unit)224、メインメモリ226を含む。これらの各部は、バス230を介して相互に接続されている。バス230にはさらに入出力インターフェース228が接続されている。
入出力インターフェース228には、USBやIEEE1394などの周辺機器インターフェースや有線又は無線LANなどのネットワークインターフェースからなる通信部232、ハードディスクドライブや不揮発性メモリなどの記憶部234、図示しない表示装置やスピーカーなどへ画像や音声のデータを出力する出力部236、図示しない入力装置などからデータを入力する入力部238、磁気ディスク、光ディスクまたは半導体メモリなどのリムーバブル記録媒体を駆動する記録媒体駆動部240が接続される。
CPU222は、記憶部234に記憶されているオペレーティングシステムを実行することにより情報処理装置200の全体を制御する。CPU222はまた、リムーバブル記録媒体から読み出されてメインメモリ226にロードされた、あるいは通信部232を介してダウンロードされた各種プログラムを実行する。GPU224は、ジオメトリエンジンの機能とレンダリングプロセッサの機能とを有し、CPU222からの描画命令に従って描画処理を行う。メインメモリ226はRAM(Random Access Memory)により構成され、処理に必要なプログラムやデータを記憶する。
図5は、ヘッドマウントディスプレイ100が、カメラ110が撮影した画像を送信する際のデータ構造を模式的に示している。カメラ110をステレオカメラで構成した場合、左視点の撮影画像80aと右視点の撮影画像80bとの対が所定のフレームレートで取得される。ヘッドマウントディスプレイ100は撮像素子の走査順に対応するように、画像の左上から順に、取得された画像データを所定の送信単位でパケット化して情報処理装置200に送信する。
同図は、左視点の撮影画像80aの左上からL1、L2、L3、・・・、右視点の撮影画像80bの左上からR1、R2、R3、・・・、なる送信単位でパケット化されることを表している。各送信単位のデータは、所定のフォーマットで圧縮符号化され、左視点の撮影画像80aのデータ、右視点の撮影画像80bのデータが交互に送出される。すなわち送信単位L1、R1、L2、R2、L3、R3、・・・・のデータが、この順にデータストリームとして送信される。
なお各送信単位を構成する画素の行数、列数は、採用する符号化方式との親和性を踏まえて決定する。また図示する例では簡単のため、送信単位の画像の面積および1パケットに含まれる符号化された画像のデータサイズを、どちらも均等に表しているが、可変長符号化方式を採用する場合、そのどちらかが不均等になってよい。
図6は、情報処理装置200がヘッドマウントディスプレイ100から受信した画像のデータ構造を模式的に示している。図5で説明したように、ヘッドマウントディスプレイ100からは、左視点の撮影画像、右視点の撮影画像のデータが、所定の送信単位で交互に送信される。したがって本来であれば、図の上段に示すように送信単位L1、R1、L2、R2、L3、R3、・・・・のデータが、この順にデータストリームとして取得される。
情報処理装置200は、このように順次送信されるデータを復号し、画像平面上の元の位置と対応づけるようにバッファメモリに展開していくことで、元の撮影画像、すなわち左視点の撮影画像82a、右視点の撮影画像82bを復元していく。ところが通信状況などによって、伝送中にパケットが失われることがある。同図では、送信単位R2、L3が伝送されていないことを網掛けで示している。このとき、復元された撮影画像82a、82bは当然、不完全なものとなる。
このような場合の対処方として従来、損失したパケットの再送を送信元に要求するARQ(Automatic repeat-request)の機能がある。ARQは誤り訂正手法の1つとして、RTP(Real-time Transport Protocol)やTCP(Transmission Control Protocol)などの通信プロトコルに実装される。この機能により、再送されたパケットを取得できれば、損失を含めた誤り訂正を確実に行える。一方で、再送要求信号の送信および該当データのパケット再送のために時間を消費することになる。また、そのようにしても再送されたパケットが再度、損失する可能性もある。
図7は、画像データを伝送する際、再送処理に許容される時間に対するデータの欠落率を定性的に表している。図示するように、許容時間が長いほど個々の再送処理に余裕が生じるうえ、同一データの複数回のパケット損失にも対応できる確率が増えるため、結果としてデータの欠落率が低くなる。一方、本実施の形態のように撮影画像を用いて何らかの情報処理を行ったうえ、実際の動きに対応するように動く画像を表示することを想定した場合、データ伝送に許容される時間は極めて短い。
そこで、許容時間を限定しても、その間に送信された画像データを最大限に活用して画像解析を適正に行えるようにする。具体的には、画像上でのデータの欠落箇所を明示することにより、画像解析やその後の情報処理で、該当箇所を他と区別して扱えるようにする。一般的に、ARQなどデータ伝送に係る処理は、互いの通信機構によって他の処理と独立に制御される。本実施の形態では、そのような伝送に係るパラメータを、ゲームなどのアプリケーションが実装する解析機能と有機的に結びつけることにより、データ伝送を含めた即時性と処理の精度とのバランスを良好にする。またそのようなしくみを利用して、処理精度の観点から許容時間を調整したり、許容時間によって定まるデータの欠落率に応じて処理のアルゴリズムを適切に切り替えたりすることもできる。
図8は、本実施の形態におけるヘッドマウントディスプレイ100の機能ブロックの構成を示している。同図および後述する図9に示す機能ブロックは、ハードウェア的には、図2や図4で示した各種機構で実現でき、ソフトウェア的には、記録媒体などからメモリにロードした、データ解析機能、画像処理機能などの諸機能を発揮するプログラムで実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。
ヘッドマウントディスプレイ100はカメラ110により撮影画像を取得するデータ取得部120、撮影画像を符号化する符号化部122、符号化したデータを一時格納するバッファ124、情報処理装置200とデータの送受信を行うインターフェースである通信部126、情報処理装置200からの再送要求を処理する再送制御部128、表示画像等を出力するデータ出力部130を含む。
データ取得部120は図2のカメラ110、制御部10などで構成され、視野空間を所定のフレームレートで撮影した画像のデータを取得する。カメラ110を図1に示したようにステレオカメラで構成した場合、撮影画像は、ヘッドマウントディスプレイ100を装着しているユーザの左眼、右眼に対応する視野を有する一対の視差画像となる。ただし本実施の形態をそれに限る主旨ではなく、単眼カメラにより一視点の動画を撮影してもよい。データ取得部120は、画素値を取得できた画素から順に、当該画素値を符号化部122に供給する。
符号化部122は制御部10などで構成され、データ取得部120が取得した撮影画像のデータを、JPEGなど所定の符号化方式により圧縮符号化する。バッファ124は記憶部50により構成され、圧縮符号化された撮影画像のデータを再送要求に備えて一時保存する。通信部126は、通信制御部40やアンテナ44などにより構成され、圧縮符号化された撮影画像のデータを、送信単位ごとにパケット化して情報処理装置200へ送信する。図5で示したように、撮像素子によってデータが取得できた順に符号化し、送信単位でパケット化して送信していくことにより、撮影画像を低レイテンシで伝送できる。
通信部126はまた、情報処理装置200がパケット損失を検出した際に発行した、当該パケットの再送要求を受信し、再送制御部128に通知する。再送制御部128は、再送要求において指定されたパケットに対応する送信単位のデータをバッファ124から読み出し、通信部126に供給する。通信部126が当該データを再度パケット化して送信することにより、損失パケットに対する再送処理が実現される。通信部126はさらに、情報処理装置200から送信された表示画像や出力音声のデータを受信し、データ出力部130に供給する。データ出力部130は制御部10やディスプレイ30などで構成され、表示画像の表示や音声出力を実施する。
図9は、本実施の形態における情報処理装置200の機能ブロックの構成を示している。情報処理装置200は、ヘッドマウントディスプレイ100とデータの送受信を行うインターフェースである通信部250、ヘッドマウントディスプレイ100から送信されたパケットを解析するパケット解析部252、損失したパケットの再送要求を生成する再送要求生成部254、送信された撮影画像のデータを一時格納するバッファ256、データ欠落の発生状況に係る情報を生成する欠落情報生成部258、撮影画像のデータを復号する復号部260、復号された撮影画像に対し所定の解析を行う画像解析部262、解析結果を用いて所定の情報処理を実施する情報処理部264、および、表示画像等、出力すべきデータを生成する出力データ生成部266を含む。
通信部250は、図4の通信部232およびCPU222などにより構成され、ヘッドマウントディスプレイ100から送信された、撮影画像のデータからなるパケットを受信する。また通信部250は、再送要求生成部254が生成したパケットの再送要求、および出力データ生成部266が生成した表示画像や出力音声のデータを、ヘッドマウントディスプレイ100に送信する。
パケット解析部252はCPU222などにより構成され、ヘッドマウントディスプレイ100から送信されたパケットを順次取得し、それを解析する。具体的には、パケットごとに付与される識別情報(以後、「パケットID」と呼ぶ)に基づき、データ伝送において損失したパケットを検出する。また、パケットIDなどを含むヘッダ情報とデータ本体とを分離し、後者を画像平面上の位置と対応づけてバッファ256に格納する。
パケットの損失が発生している場合、パケット解析部252は再送要求生成部254に、そのパケットIDを通知する。再送要求生成部254はCPU222などにより構成され、損失したパケットIDを含む再送要求を生成する。当該再送要求は通信部250を介してヘッドマウントディスプレイ100に送信される。図6の例では、「R2」や「L3」などの送信単位に対応するパケットを指定して再送要求が発行される。
再送要求生成部254は、損失したパケットが取得できるまで再送要求を繰り返してよいが、指定したパケットが取得できないまま所定の許容時間を経過したらタイムアウトと判定し、以後、そのパケットについての再送要求は行わない。そのため再送要求生成部254は、許容時間の設定値を内部のメモリに保持する。欠落情報生成部258はCPU222などにより構成され、上記許容時間が経過しても取得できなかったデータに係る情報(以後、「欠落情報」と呼ぶ)を生成する。
欠落情報は基本的に、画像上のどの位置でどの程度のデータ欠落が発生しているかを示す。欠落情報生成部258はそのため、欠落している送信単位のデータに係る情報をパケット解析部252から逐次取得し、許容時間満了のタイミングを再送要求生成部254から取得することで、最終的にデータが欠落した箇所を特定する。送信順が先の箇所ほど許容時間も早く満了するため、欠落情報は、対応する領域の処理開始と同期させて生成できる。生成された欠落情報は順次、復号部260に供給される。
復号部260はCPU222などにより構成され、バッファ256からデータ本体を順次、読み出し、復号していくことにより撮影画像を復元する。パケット解析部252、バッファ256、復号部260により、図6で示したようなデータの変遷が順次実現される。この際、欠落情報生成部258から取得した欠落情報において、欠落箇所とされている画素には、所定の無効データを代入する。復号部260は、復元した撮影画像のデータと欠落情報を対応づけて画像解析部262に供給する。
画像解析部262はCPU222などにより構成され、復号部260が復元した撮影画像のデータに対し所定の画像解析を施す。ここでなされる解析内容は、後段の情報処理の内容、撮影の目的、表示の内容などによって様々に考えられる。例えばユーザ頭部の位置および姿勢を取得するため、上述のv−SLAMを実施したり、被写体の実空間での位置を取得するため、左右の視差画像を用いてステレオマッチングを行いデプス画像を生成したりする。デプス画像とは、被写体のカメラからの距離を、撮影画像上の対応する像の画素値として表した画像であり、視差画像から対応点を抽出し、両者間の視差に基づき三角測量の原理で距離を算出することによって得られる。
あるいはデプス画像を用いて被写空間にある実物体の3次元モデリングを行う。実物体を、計算上の3次元空間におけるオブジェクトとしてモデル化することにより、仮想オブジェクトと実物体がインタラクションするARを実現できる。あるいは所定の形状や色を有する実物体の像をテンプレートマッチングにより検出したり、顔など細部の特徴に基づき人や物を認識したりしてもよい。
画像解析部262は、このような画像解析において欠落情報を参照し、パケット損失によりデータが欠落している箇所について、他の領域と処理内容を適宜差別化する。例えば、デプス画像生成のための対応点探索対象や物体検出のためのテンプレートマッチングの対象など、解析対象の領域から、データが欠落している箇所を除外する。または他と同様に解析したうえ、データが欠落している箇所についての結果を出力しないようにしたり、その箇所の精度が低い可能性があることを示す付加情報を生成したりしてもよい。
なおここで「データが欠落している箇所」とは、真にデータがない箇所でもよいし、画像平面を所定規則で分割したとき欠落率が所定のしきい値より高い領域などでもよい。いずれにしろ「データが欠落している箇所」を画像解析部262が認識し、解析処理自体、あるいは解析結果の利用形態を他と差別化できるようにすることにより、データの欠落による処理精度の悪化を最小限に抑えることができる。
すなわちデータが得られていないため低い精度で解析された領域が、その他の領域の解析結果と同様に扱われることにより、画像全体で処理の精度が下がってしまうのを防止できる。また、対応点探索などの解析対象から除外することにより、結果への反映が好ましくない余計な処理を削減できる。これらの対処を保障することにより、再送要求に対する許容時間を短くしても悪影響が抑えられ、精度と即時性の両立を図れる。
情報処理部264はCPU222などにより構成され、画像解析の結果を利用してゲームなど所定の情報処理を実施する。上述のとおり、その内容は特に限定されない。情報処理部264は、データ欠落により解析精度が低い可能性があるとして画像解析部262により示された箇所の解析結果を、他と差別化して扱ってもよい。例えばそのような箇所にエッジが含まれる被写体を計算対象から除外したり、そのような箇所にオブジェクトを描画しないようにしたりする。このようにすることで、一部領域の解析精度の悪化が他の処理に伝播しないようにしたり、ユーザの視線を別の箇所に誘導したりできる。
出力データ生成部266はCPU222、GPU224などにより構成され、情報処理部264による処理の結果、ヘッドマウントディスプレイ100に表示すべき画像や出力すべき音声のデータを生成する。例えばユーザの頭部の動きに応じて視野が変化する仮想世界を描画したり、当該仮想世界での音声データを生成したりする。生成したデータは通信部250を介してヘッドマウントディスプレイ100に順次、送信される。
図10は、本実施の形態においてヘッドマウントディスプレイ100から情報処理装置200へ送信されるパケットのデータ構造例を示している。図示するパケット90は、図5および図6の上段に示したパケット列のうちの1つを表しており、これにより撮影画像の送信単位1つ分のデータが送信される。パケット90はパケット情報部92および画像データ部94により構成される。パケット情報部92は、「パケットID」、「パケット長」、「送信時刻」、・・・などの、いわゆるヘッダ情報を含む。
「パケットID」は撮影画像の1フレームに対し生成される全パケットに一意に与えられる識別情報である。例えば、送信単位にラスタ順に与えた、「0」、「1」、「2」、・・・など昇順の番号でもよいし、画像平面における二次元の位置座標でもよい。あるいは、画像をメモリに展開した際の各送信単位の先頭アドレスなどでもよい。また図5、6に示したように、左視点、右視点の撮影画像を交互に送信する場合にはさらに、どちらの画像のパケットかを区別する識別子を付加する。
「パケット長」はこのパケット90のデータサイズである。「送信時刻」はヘッドマウントディスプレイ100から当該パケット90を送信した時刻を示すタイムスタンプである。パケット情報部92にはこのほか、採用する通信プロトコルによってそれ以外の情報を適宜含めてよい。
画像データ部94には、ヘッドマウントディスプレイ100の符号化部122が圧縮符号化した、撮影画像の送信単位のデータが格納される。パケット解析部252は、送信されたパケット90をパケット情報部92および画像データ部94に分割し、後者のデータを画像上の位置に対応づけてバッファ256に格納する。各データの画像上の位置は、パケットIDの付与規則に係る情報をヘッドマウントディスプレイ100と共有しておくことにより、パケットIDに基づき特定できる。したがってバッファ256には、損失せずに取得できたパケット内のデータが、画像上の位置と対応づけて格納される。
パケット解析部252はまた、パケット情報部92のパケットIDを、送信された順序に照らして確認していくことにより、パケットの損失を検出する。例えばパケットIDとして昇順の番号を付与する場合は、パケットの到着順とパケットIDを比較することにより抜けを検出できる。パケット解析部252は、このようにして検出した損失パケットのIDを再送要求生成部254に通知することで再送要求を生成させる。損失パケットの情報、あるいはそのデータの画像上の位置に係る最新情報は、欠落情報生成部258にも通知しておくことにより、許容時間の満了に伴い欠落情報が生成されるようにする。
図11は、情報処理装置200の欠落情報生成部258が生成する欠落情報のデータ構造を例示している。この例では、バッファ256に含まれる、画像データの記憶領域302のうち、損失したパケットに対応するデータを格納すべき領域のアドレスを直接示している。すなわち欠落情報300は、欠落箇所の「先頭アドレス」と「データ長」で構成される。欠落箇所は、1パケットで送信されるデータ、すなわち送信単位を最小粒度として認識される。そしてパケットが連続して失われると、欠落情報300における「データ長」の数値が大きくなる。
この例では、(先頭アドレス,データ長)の順に、(3001,1500)、(13501,3000)、(21001,1500)、・・・なるデータが欠落していることを示している。これを画像データの記憶領域302に表すと、網掛けされた部分、すなわち3001バイト〜4500バイトの1500バイト分、13501バイト〜16500バイトの3000バイト分、21001バイト〜26500バイトの1500バイト分、・・・といった箇所のデータが欠落していることがわかる。画像データの記憶領域302は画像平面と対応づけられるため、記憶領域のアドレスを示すことは、ひいては画像平面の対応箇所を指定していることになる。
仮に送信単位を1500バイトとすると、この例は、3パケット目、10および11パケット目、15パケット目が失われていることを意味する。欠落情報生成部258は、そのような損失パケットのIDから(先頭アドレス,データ長)のセットを導出することにより欠落情報300を生成する。そして当該欠落情報を参照し、復号部260が画素値として無効データを代入したり、画像解析部262が他と差別化して解析を行ったりする。
図12は、情報処理装置200の欠落情報生成部258が生成する欠落情報のデータ構造の別の例を示している。この例では、画像平面を分割してなるブロックごとにデータの欠落率を示している。具体的には欠落情報304は、ヘッダ情報306a、および欠落情報本体306bにより構成される。ヘッダ情報306aは、画像平面308を等分割してなるブロックの「行数」と「列数」、および画像の「総データ長」で構成される。
図示する例では、画像平面308を6行8列に分割している。また総データ長は1Mバイトである。画像平面の分割数は解析内容や撮影画像の特性などによって決定する。欠落情報本体306bは、「行」番号、「列」番号からなるブロックの座標と、各ブロックの「データ長」、およびデータの「欠落率」により構成される。行番号、列番号は画像平面308の各ブロックに示したように、それらの対で1つのブロックを表す。画像平面を6行8列に分割した場合、行番号は0から5、列番号は0から7の範囲となる。
ブロックのデータ長は、各ブロックに含まれる、圧縮符号化されたデータのサイズを表す。可変長符号化をした場合、図示するようにデータ長がブロックごとに異なる。欠落率は、ブロック内で欠落しているデータの割合を表す。例えば0行0列のブロックは、20000バイトのデータのうちの10%、すなわち2000バイトのデータが欠落していることが示されている。
図11で示した欠落情報は、データが欠落している部分のアドレスを直接、表すため、より細かい粒度で解析処理の差別化を行える一方で、断続的な欠落が増えるほどエントリー数が増加し欠落情報のデータサイズが大きくなる。図12の欠落情報304は、欠落の程度を所定面積の領域単位で捉えることにより、欠落情報のデータサイズを一定にできる。そのため、画像解析に低解像度画像を用いる場合など、細かい粒度での情報を重要視しない場合は同図のフォーマットが有利となる。
図13は、情報処理装置200の欠落情報生成部258が生成する欠落情報のデータ構造のさらに別の例を示している。この例は図12の場合と同様、画像データを分割してなるブロックごとにデータの欠落率を示しているが、ブロックの分割基準として、画像上の面積の代わりに符号化されたデータのサイズを固定としている。すなわち画像データの記憶領域314に示すように、記憶領域上でアドレスを均等分割していることになる。この場合も欠落情報310は、ヘッダ情報312a、および欠落情報本体312bにより構成される。
ヘッダ情報312aは、分割単位である1ブロックの「データ長」、そのように分割されてなる「ブロック数」、および画像の「総データ長」で構成される。図示する例では、240kバイトの画像データを10kバイトごとに分割した結果、記憶領域314が24個のブロックに分割されていることを示している。分割単位のデータ長は解析内容や撮影画像の特性などによって決定する。
欠落情報本体312bは、各ブロックの「先頭アドレス」と、各ブロックにおけるデータの「欠落率」により構成される。例えば先頭アドレスが「0」のブロックは、10kバイトのデータのうちの20%、すなわち2000バイトのデータが欠落していることが示されている。図11の場合と同様、画像データの記憶領域314は画像平面と対応づけられるため、記憶領域の各ブロックのデータ欠落率は、画像平面の対応する領域のデータ欠落率を示していることになる。
図12の場合と同様、この例でも、1つのパケットで送られる送信単位の粒度より大きい粒度で欠落の程度を表すため、欠落状況に関わらず欠落情報のサイズを固定にできる。また可変長符号化をした場合、分割単位をデータサイズで規定することにより、圧縮後のデータサイズが大きい領域ほど、1ブロックに対応する画像上の面積が小さくなる。したがって高周波数成分を含むなど画像構成が複雑な部分ほど、より細かい単位でデータ欠落の状況を解析処理に反映させることができる。
図11〜13で示した欠落情報は上述のとおり、それぞれに特性を有するため、撮影対象となる空間の構造、実施する画像解析の内容、それに用いる画像の解像度、解析に求められる精度、メモリ容量や処理性能などハードウェアの特性などに応じて、最適な形式を選択する。例えば顔認識などより細かい特徴を抽出する必要がある場合は、図11で示した形式で、被写空間にあるテーブルの面などを大まかにモデリングする場合は図12や図13で示した形式で、欠落情報を生成することが考えられる。
これまで述べた実施形態では、あらかじめ定められた許容時間において損失したパケットの再送要求を行い、そのようにしてもデータが得られなかった箇所について欠落情報を生成した。それを踏まえて画像解析を行うことにより、許容時間が限定的であってもベストエフォートとしての解析結果を取得するとともに、精度が低いと考えられる解析結果を他と区別して扱うことにより、解析結果全体に影響が及ぶのを防ぐことができる。ここで許容時間は、被写空間における動きと表示される画像の動きのずれが認識されないような時間が上限となる。
一方、図7に示したように、許容時間が短いほどデータの欠落率は増加するため、許容時間の短縮が解析精度の悪化を招くことにもなる。図14は、許容時間と解析精度の関係を説明するための図である。同図(a)はデータ欠落率の変化に対する解析精度の変化、(b)は図7と同様、再送要求に許容される時間の変化に対するデータ欠落率の変化を、それぞれ例示している。(a)に示す例では、データ欠落率がD1からD2に増加しても、解析精度の変化はA1からA2のように比較的小さい。解析精度がA2であっても後段の情報処理や表示に大きな影響を与えない場合、欠落率がD2であっても許容されることになる。
この場合、(b)に示すように、再送要求の許容時間をL1からL2に変更しても、情報処理には悪影響を及ぼさないといえる。このように許容時間を短縮できれば、表示の即時性を高めたり、その他の情報処理や伝送に、より多くのリソースを使ったりすることができる。そこでこのような関係を利用して、画像解析の精度の変化によって再送要求の許容時間を調整するしくみを設けてもよい。逆に、与えられた許容時間で画像解析のアルゴリズムを最適化してもよい。さらに、最適化した許容時間に応じてヘッドマウントディスプレイ100における符号化処理のパラメータを調整してもよい。
図15は、画像解析の精度によって、損失したパケットの再送許容時間を調整する機能を有する情報処理装置の機能ブロックの構成を示している。なお図9で示した情報処理装置200と同じ機能を有するブロックには同じ符号を付し、適宜、説明を省略する。情報処理装置200aは、図9の情報処理装置200と同様、通信部250、パケット解析部252、バッファ256、欠落情報生成部258、復号部260、情報処理部264、出力データ生成部266を含む。情報処理装置200aはさらに、再送要求生成部254a、画像解析部262a、処理条件調整部268を含む。
再送要求生成部254a、画像解析部262aの基本的な機能は、図9で示した情報処理装置200の再送要求生成部254、画像解析部262と同様である。ただし画像解析部262aは、自らが行った画像解析処理の精度を処理条件調整部268にフィードバックする。処理条件調整部268は当該処理の精度とデータの欠落情報とを対応づけたうえ、必要な精度が維持される範囲での欠落率を許容するように、許容時間の設定値を調整する。再送要求生成部254aはそのような許容時間の調整を受け付ける。
図14に示した例で、解析精度に許容される下限をA2とすると、処理条件調整部268は、精度がA2を下回らない欠落率の範囲内で、許容時間をL2の方向に下げていく。例えば、新たなフレームの受信タイミングで、許容時間の設定値を所定の刻み幅ΔLだけ下げ、当該許容時間内で再送要求を実施する。許容時間が減少することによりデータの欠落率は増加するが、そのようにして取得した新たなフレームの画像を解析したとき、精度がA2を下回らなければ、さらに許容時間を下げていく。精度がA2に到達するまでこれを繰り返すことにより、必要な精度を維持できる許容時間の最短値が得られる。
なおこのように徐々に許容時間を下げていき、精度が下限に達した時点での許容時間を設定値とする手法以外に、許容時間をある程度大きな範囲で変化させて許容時間と解析精度の関係を取得し、解析精度の下限に対応する許容時間を推定してもよい。いずれにしろこのような調整処理は、情報処理装置やヘッドマウントディスプレイの開発時や製造時のみならず、ユーザによるシステムの運用時にも行える。
すなわち適切な精度を維持できる最短の許容時間は、カメラの撮像素子の感度、カメラ内部でのデータ補正処理、符号化処理、通信環境、情報処理装置の処理性能などハードウェアに依存するほか、画像解析の内容、周囲の明るさ、撮影条件、被写空間における物の量や色などの状況にも依存する。これは、図14で示した各グラフがそれらの条件で変化するためである。したがって、様々なタイミングで許容時間を最適化することにより、処理精度への影響を最小限に、伝送環境を最適化できる。
例えばユーザが情報処理装置200aを用いて電子ゲームを実施する際、その初期段階においてバックグラウンドで許容時間を調整すれば、ゲームの内容と実際の運用環境に即した最適条件での処理を実現できる。なお「解析精度」は画像解析の正確性を表す何らかの指標であればよく、図14で示したように連続して得られるような数値でなくてもよい。
すなわち精度の観点から許容時間の是非を判定するための境界が設定できれば、その境界が数値で与えられなくてもよい。例えば、本来検出されるべき手などの実物体が検出されたか否か、といった2つの事象を「解析精度」としてもよい。この場合、これらの事象の変わり目が境界であり、当該実物体が検出される状態で最も短い許容時間を求めればよい。実際に設定する許容時間は、そのようにして取得された時間に所定のマージンを加算した値でもよい。画像解析がデプス画像の生成であれば、対応点が検出されたか否か、といった2つの事象でもよいし、対応点を検出したときの類似度の画像平均などの数値でもよい。
また、そのような解析精度を画像平面における分布として取得してもよい。このようにすると、解析精度がどこで悪化しているか、といった情報に応じて許容時間をよりきめ細かく調整できる。例えば、重要度の低い画像端で精度が下限を下回っても、より重要な画像中心、あるいは追跡対象が存在する領域などにおいて精度が維持されているのであれば、さらに許容時間を短縮する、といったことが可能になる。このようにして許容時間を最適化したら、それに応じてヘッドマウントディスプレイ100における各種処理の条件を調整するようにしてもよい。
図16は、損失したパケットの再送許容時間によって内部の処理条件を調整する機能を有するヘッドマウントディスプレイ100の機能ブロックの構成を示している。なお図8で示したヘッドマウントディスプレイ100と同じ機能を有するブロックには同じ符号を付し、適宜、説明を省略する。ヘッドマウントディスプレイ100aは、図8のヘッドマウントディスプレイ100と同様、データ取得部120、バッファ124、再送制御部128、データ出力部130を含む。ヘッドマウントディスプレイ100aはさらに、符号化部122a、通信部126a、および処理条件調整部132を含む。
符号化部122a、通信部126aの基本的な機能は、図8で示した符号化部122、通信部126と同様である。ただしこの例では、パケット再送の許容時間によって圧縮符号化に用いるパラメータを調整する。このため情報処理装置200の再送要求生成部254aは、処理条件調整部268によって最終的に決定された許容時間の情報をヘッドマウントディスプレイ100aに送信し、ヘッドマウントディスプレイ100aの通信部126aはそれを受信する。そして処理条件調整部132は、当該許容時間に応じて符号化パラメータを決定し、符号化部122aに設定する。
処理条件調整部132は例えば、圧縮率を調整する。定性的には、許容時間を長くしデータ欠落率を小さくしないと解析精度が得られないような不利な状況では、圧縮率を高くする。これによりサイズを小さくすれば、1フレームあたりに伝送されるパケット数が少なくなり、同じ損失率でも再送すべきパケット数を小さくできる。このような条件で再度、許容時間の調整を行えば、許容時間を小さくできる可能性もある。
逆に、許容時間を短くしても解析精度が得られる良好な状況では、圧縮率を低くすることにより画質の劣化を抑えられる。符号化方式自体を、圧縮率が小さく画質の劣化が少ないものに切り替えてもよい。これにより、ヘッドマウントディスプレイ100aにおける符号化のための処理の負荷を抑えられる。ヘッドマウントディスプレイ100aを有線による電源供給としない場合、処理負荷の軽減は消費電力低減による電池持続時間の向上にもつながる。
したがって、例えば周囲が明るく画像解析の精度が得られやすい、といった状況を、最適化された許容時間に基づき特定し、それに応じて圧縮率を調整することにより、画質の向上や電池消費の節約なども達成できる。処理条件調整部132は、許容時間と、符号化パラメータあるいは符号化方式とを対応づけた情報を内部のメモリに保持し、情報処理装置200aから送信された許容時間に対応して設定された処理条件を特定したうえ、符号化部122aに通知する。
符号化部122aは通知された条件で撮影画像の圧縮符号化を実施する。なお処理条件調整部132による調整対象は、符号化パラメータや符号化方式に限らない。例えばデータ取得部120が、撮影画像の原画像を段階的に縮小し、解像度の異なる撮影画像を生成するような機能をISP(Image Signal Processor)などに含む場合、処理条件調整部132は、そこで生成される画像の解像度、あるいは情報処理装置200に送信すべき画像の解像度を、調整された許容時間に応じて切り替えてもよい。
この場合、調整後の許容時間が長いほど、すなわち許容時間を長くしデータ欠落率を小さくしないと解析精度が得られないような状況であるほど、低解像度の画像データを送信することにより、1フレームあたりのパケット数を減らし、データの欠落率を抑えることができる。そして再度、許容時間の調整を行えば、許容時間を小さくできる可能性もある。
なお上述のとおり、周囲が明るいほど画像解析の精度が得られやすいことを利用し、情報処理装置200aにおける許容時間の調整に照度の計測値を利用してもよい。この場合、ヘッドマウントディスプレイ100に図示しない照度センサを設け、その計測値を情報処理装置200に送信する。情報処理装置200は、得られた照度が高いほど、許容時間を短縮する方向に調整する。上述のような解析精度に基づく調整と組み合わせ、多角的な観点から最適な許容時間を求めてもよい。
これまで述べた再送処理に対する許容時間は、従来、通信プロトコルにおいて設定され、アプリケーションとは独立していた。この設定を、アプリケーションによって導入される画像解析の精度に基づき調整できるようにすることで、ハードウェアの更新や撮影環境の変化に柔軟に対応できる伝送態様を提供できる。一方、逆方向のアプローチとして、通信プロトコルで設定された許容時間に応じて画像解析のアルゴリズムを切り替えるようにしてもよい。
つまり、図14の(b)において許容時間が与えられたとき、それに対応するデータの欠落率で十分な解析精度を示す(a)のグラフが得られるような解析アルゴリズムに切り替える。欠落率が低くても解析精度が得られるアルゴリズムとは、定性的には、処理の感度が低いアルゴリズムと考えられる。例えばエッジ検出のフィルタをSobelフィルタからPrewittフィルタ、Robertsフィルタ、と切り替えていくことにより、データ欠落部分の影響を抑え、許容時間が十分になくてもある程度の精度を維持することができる。逆に許容時間が比較的長い場合はデータの欠落率を低く抑えられるため、感度の高いアルゴリズムを用いることにより、より正確な結果を得ることができる。
この場合、情報処理装置200aの処理条件調整部268は、許容時間と解析アルゴリズムとを対応づけた情報を内部のメモリに保持し、再送要求生成部254aに設定された許容時間に対応するアルゴリズムを特定したうえ、画像解析部262aに通知する。画像解析部262aは通知されたアルゴリズムを用いて撮影画像を解析する。このようにすることで、通信プロトコルやハードウェアの仕様が変更されたりバージョンアップされたりしても、それによる影響が画像解析、ひいては情報処理や表示内容に及ばないようにすることができる。
なお解析アルゴリズムは、固定値として与えられた許容時間に対応させて切り替えるのみならず、環境等に応じて調整された許容時間に対応させることも考えられる。例えば上述のように照度を測定する機構を設けた場合、許容時間を照度に応じて調整し、調整された許容時間に対し適切なアルゴリズムを選択できる。
次に、以上述べた構成によって実現できる情報処理装置の動作を説明する。図17は、本実施の形態において情報処理装置が撮影画像のデータに基づき出力データを生成する処理手順を示すフローチャートである。なお同図は、図15で説明した許容時間の調整機能を含む情報処理装置200aの動作を示しているが、図9で示した調整機能を含まない情報処理装置200を想定した場合、S22、S24の処理が省略される。
まず、ユーザが情報処理装置200aやヘッドマウントディスプレイ100の電源を投入するなどして処理の開始を要求すると、ヘッドマウントディスプレイ100のカメラ110により撮影が開始される。情報処理装置200aの通信部250は、ヘッドマウントディスプレイ100から撮影画像の第1フレームのデータを含むパケットを取得する(S10)。データは上述のとおり送信単位で徐々に送られるため、S10の処理は実際には、後続の処理と並行して行われる。S16の再送要求や、S18の欠落情報生成処理も同様である。
パケット解析部252は、パケットを取得した順に、撮影画像のデータをバッファ256に格納していくとともに、パケットIDと送信順を比較するなどして損失したパケットを検出する(S12)。再送要求生成部254aは、パケット損失が検出されたタイミングで当該パケットの再送のための経過時間の計測を開始する。経過時間が再送の許容時間以内であれば(S14のY)、再送要求生成部254aは当該パケットの再送要求を生成し、通信部250を介してヘッドマウントディスプレイ100に送信する(S16)。損失したパケットについては許容時間を満了するまでS10、S12、S16の処理を繰り返す。
経過時間が許容時間を過ぎていたら再送要求は行わず(S14のN)、欠落情報生成部258が当該パケットに対応するデータが欠落している旨を示す欠落情報を生成する(S18)。復号部260および画像解析部262aは、当該欠落情報を参照しながら、画像中、データが欠落している箇所について他と区別して復号処理、解析処理を行う(S20)。具体的には、復号部260は撮影画像のデータをバッファ256から取得し復号していくとともに、データが欠落している箇所の画素値に無効データを代入する。
画像解析部262aは、データが欠落している箇所を解析対象や結果の出力対象から除外したり、その箇所に係る解析結果の精度が低い可能性がある旨を示す付加情報を生成したりする。なお欠落情報のフォーマットや画像解析の内容などによっては、復号部260および画像解析部262aのどちらかのみが、上述したようなデータ欠落への対処を行うようにしてもよい。
画像解析の結果、精度が所定の下限を上回っている場合(S22のN)、処理条件調整部268は再送処理の許容時間を短縮する方向に、再送要求生成部254aにおける設定を調整する(S24)。精度が所定の下限に達している場合は(S22のY)、許容時間の調整は行わない。なお、精度が最初から下限を下回っている場合は、許容時間を延長する方向に調整することで、解析精度を適正化してもよい。ただしこの場合は、撮影から表示までのレイテンシの観点で、許容時間の上限を別途定めておく必要がある。
情報処理部264は、画像解析の結果等を用いて情報処理を行い、出力データ生成部266がその結果を表示画像や音声などの出力データとして生成する(S26)。当該出力データは通信部250からヘッドマウントディスプレイ100に送信され、出力される。ユーザからの入力などにより処理を停止させる必要がなければ、撮影画像の後続フレームについてS10〜S26の処理を繰り返す(S28のN)。処理を停止させる必要が生じたら全ての処理を終える(S28のY)。
以上述べた本実施の形態によれば、撮影画像のデータを無線通信により取得し情報処理を行うシステムにおいて、取得できなかったデータと画像上の位置とを関連づけた欠落情報を生成する。そして画像解析や情報処理において、データが欠落している箇所を他と差別化して処理する。これにより、出力データを生成するまでの様々な処理において、データが欠落している箇所の処理結果が他の領域の結果と同様に扱われ、出力結果全体に悪影響が及ぶのを防ぐことができる。
また解析内容によっては、データの欠落部分を避けて処理する、といった方策が可能になるため、データが正常に得られている領域の解析精度を維持できるとともに、余計な処理を省くことにより処理の負荷を軽減できる。データ欠落に対しこれらの対策を施すことにより、データ伝送中のパケット損失に応じた再送要求に許容される時間を限定しても、処理の精度を極力維持することができる。結果として、処理結果の精度と出力の即時性のバランスを良好にできる。
また、画像解析の精度とパケットの再送要求に許容される時間との関係、という独特の知見に基づき、許容時間、解析アルゴリズム、符号化処理のパラメータ、などを調整する。例えば精度が得られることが保障される範囲内で許容時間を短縮する方向に調整することにより、結果への影響を少なく処理の高速化を実現できる。またそのようにして調整された許容時間は、解析精度の得られにくさといった撮影画像の特性を反映しているため、それを踏まえて伝送前の符号化処理を適正化することにより、撮影環境等に応じた最適な送信形態を実現できる。許容時間に応じて解析アルゴリズムを切り替えることも同様に、通信環境を含め与えられた環境に対して最もよい結果が得られる条件での処理が可能になる。
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
30 ディスプレイ、 40 通信制御部、 44 アンテナ、 100 ヘッドマウントディスプレイ、 110 カメラ、 120 データ取得部、 122 符号化部、 124 バッファ、 126 通信部、 128 再送制御部、 130 データ出力部、 132 処理条件調整部、 200 情報処理装置、 222 CPU、 224 GPU、 226 メインメモリ、 250 通信部、 252 パケット解析部、 254 再送要求生成部、 256 バッファ、 258 欠落情報生成部、 260 復号部、 262 画像解析部、 264 情報処理部、 266 出力データ生成部、 268 処理条件調整部。

Claims (10)

  1. 撮像装置と通信を確立し撮影画像のデータを取得する通信部と、
    通信の結果として欠落したデータと、撮影画像上の位置とを対応づけた欠落情報を生成する欠落情報生成部と、
    前記撮影画像を解析して被写空間に係る情報を取得する画像解析部と、
    前記解析の結果に基づき出力データを生成して出力する出力データ生成部と、
    を備え
    前記画像解析部は、前記欠落情報を参照し、前記撮影画像の平面のうちデータが欠落した箇所に対する解析処理を他の領域の解析処理と差別化することを特徴とする情報処理装置。
  2. 前記通信部が取得した符号化された撮影画像のデータを復号するとともに、前記欠落情報を参照し、データが欠落した箇所の画素値として無効データを代入する復号部をさらに備えたことを特徴とする請求項1に記載の情報処理装置。
  3. 前記欠落情報生成部は、画像データの記憶領域のうち、データが欠落している領域のアドレスおよびデータ長を、前記欠落情報に含めることを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記欠落情報生成部は、画像を所定の面積に分割してなるブロックごとに、データが欠落している割合を示した情報を、前記欠落情報に含めることを特徴とする請求項1または2に記載の情報処理装置。
  5. 前記欠落情報生成部は、画像データを所定のデータサイズに分割してなるブロックごとに、データが欠落している割合を示した情報を、前記欠落情報に含めることを特徴とする請求項1または2に記載の情報処理装置。
  6. 前記画像解析部は、前記欠落情報に基づき、データが欠落している箇所またはデータの欠落率が所定のしきい値より高い領域を、解析対象から除外することを特徴とする請求項1から5のいずれかに記載の情報処理装置。
  7. 前記画像解析部は、前記欠落情報に基づき、データが欠落している箇所またはデータの欠落率が所定のしきい値より高い領域について、解析精度が低い可能性がある旨の付加情報を生成することを特徴とする請求項1から5のいずれかに記載の情報処理装置。
  8. 撮像装置を備えたヘッドマウントディスプレイと、前記ヘッドマウントディスプレイと通信を確立し、表示画像を生成して前記ヘッドマウントディスプレイに表示させる情報処理装置と、を含み、
    前記情報処理装置は、
    前記ヘッドマウントディスプレイから撮影画像のデータを取得する通信部と、
    通信の結果として欠落したデータと、撮影画像上の位置とを対応づけた欠落情報を生成する欠落情報生成部と、
    前記撮影画像を解析して被写空間に係る情報を取得する画像解析部と、
    前記解析の結果に基づき出力データを生成して出力する出力データ生成部と、
    を備え
    前記画像解析部は、前記欠落情報を参照し、前記撮影画像の平面のうちデータが欠落した箇所に対する解析処理を他の領域の解析処理と差別化することを特徴とする情報処理システム。
  9. 撮像装置と通信を確立し撮影画像のデータを取得するステップと、
    通信の結果として欠落したデータと、撮影画像上の位置とを対応づけた欠落情報を生成するステップと、
    前記撮影画像を解析して被写空間に係る情報を取得するステップと、
    前記解析の結果に基づき出力データを生成して表示装置に出力するステップと、
    を含み、
    前記情報を取得するステップは、前記欠落情報を参照し、前記撮影画像の平面のうちデータが欠落した箇所に対する解析処理を他の領域の解析処理と差別化することを特徴とする情報処理装置による情報処理方法。
  10. 撮像装置と通信を確立し撮影画像のデータを取得する機能と、
    通信の結果として欠落したデータと、撮影画像上の位置とを対応づけた欠落情報を生成する機能と、
    前記撮影画像を解析して被写空間に係る情報を取得する機能と、
    前記解析の結果に基づき出力データを生成して表示装置に出力する機能と、
    をコンピュータに実現させ
    前記情報を取得する機能は、前記欠落情報を参照し、前記撮影画像の平面のうちデータが欠落した箇所に対する解析処理を他の領域の解析処理と差別化することを特徴とするコンピュータプログラム。
JP2016099908A 2016-05-18 2016-05-18 情報処理装置、情報処理システム、および情報処理方法 Active JP6499993B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016099908A JP6499993B2 (ja) 2016-05-18 2016-05-18 情報処理装置、情報処理システム、および情報処理方法
US16/300,275 US10701184B2 (en) 2016-05-18 2017-05-11 Information processing apparatus, information processing system, and information processing method
PCT/JP2017/017926 WO2017199859A1 (ja) 2016-05-18 2017-05-11 情報処理装置、情報処理システム、および情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016099908A JP6499993B2 (ja) 2016-05-18 2016-05-18 情報処理装置、情報処理システム、および情報処理方法

Publications (3)

Publication Number Publication Date
JP2017208706A JP2017208706A (ja) 2017-11-24
JP2017208706A5 JP2017208706A5 (ja) 2018-07-26
JP6499993B2 true JP6499993B2 (ja) 2019-04-10

Family

ID=60326388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016099908A Active JP6499993B2 (ja) 2016-05-18 2016-05-18 情報処理装置、情報処理システム、および情報処理方法

Country Status (3)

Country Link
US (1) US10701184B2 (ja)
JP (1) JP6499993B2 (ja)
WO (1) WO2017199859A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020203819A1 (ja) * 2019-03-29 2020-10-08 株式会社Ihi 遠隔操作装置
US11953809B2 (en) * 2019-06-11 2024-04-09 Sony Interactive Entertainment Inc. Camera support structure and head-mounted display
JP7496412B2 (ja) * 2020-03-30 2024-06-06 株式会社ソニー・インタラクティブエンタテインメント 画像表示システム、画像処理装置、画像表示方法、およびコンピュータプログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05126756A (ja) * 1991-10-31 1993-05-21 Nec Corp プリント基板パターン検査装置
JPH11150729A (ja) * 1997-11-18 1999-06-02 Mitsubishi Electric Corp データ処理装置
CA2295606A1 (en) 1998-05-19 1999-11-25 Sony Computer Entertainment Inc. Image processing apparatus and method, and providing medium
JP2000316837A (ja) * 1999-05-13 2000-11-21 Konica Corp 画像診断支援装置
JP4173897B2 (ja) * 2006-04-04 2008-10-29 日本電信電話株式会社 画像補正装置および画像補正方法
US8341504B2 (en) * 2010-03-11 2012-12-25 Microsoft Corporation Fast and reliable wireless communication
US20130091528A1 (en) * 2010-06-23 2013-04-11 Mitsubishi Electric Corporation Video reproduction system, receive terminal, home gateway device, and quality control system
ES2745739T3 (es) * 2010-09-20 2020-03-03 Qualcomm Inc Un entorno adaptable para realidad aumentada asistida por la nube
JP6022473B2 (ja) * 2010-12-10 2016-11-09 ドイッチェ テレコム アーゲー パケット損失可視性の連続的な推定値に基づく客観的映像品質評価のための方法および装置
US10514541B2 (en) * 2012-12-27 2019-12-24 Microsoft Technology Licensing, Llc Display update time reduction for a near-eye display
US9282133B2 (en) * 2013-12-12 2016-03-08 Ooma, Inc. Communicating control information within a real-time stream
US20160323062A1 (en) * 2015-05-01 2016-11-03 Ubitus Inc. Packet recovery in interactive real-time media protocol

Also Published As

Publication number Publication date
JP2017208706A (ja) 2017-11-24
US10701184B2 (en) 2020-06-30
WO2017199859A1 (ja) 2017-11-23
US20190149636A1 (en) 2019-05-16

Similar Documents

Publication Publication Date Title
WO2017199860A1 (ja) 情報処理装置、情報処理システム、撮像装置、ヘッドマウントディスプレイ、および情報処理方法
JP7408678B2 (ja) 画像処理方法およびヘッドマウントディスプレイデバイス
WO2017163720A1 (ja) 情報処理装置、情報処理システム、および情報処理方法
WO2017077918A1 (ja) 情報処理装置、情報処理システム、および情報処理方法
CN116896675A (zh) 用于使图像稳定化的电子装置及其操作方法
CN111819521A (zh) 信息处理装置、信息处理方法和程序
JP7248490B2 (ja) 情報処理装置、デバイスの位置および姿勢の推定方法
CN107071237A (zh) 图像记录系统、用户佩戴装置、摄像装置、图像处理装置以及图像记录方法
JP2019020333A (ja) 情報処理装置および位置情報取得方法
JP2020003898A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2019032599A (ja) 情報処理装置および位置情報取得方法
JP6499993B2 (ja) 情報処理装置、情報処理システム、および情報処理方法
JP6768933B2 (ja) 情報処理装置、情報処理システム、および画像処理方法
CN115701125B (zh) 图像防抖方法与电子设备
KR20190014959A (ko) 움직임 정보에 기반하여 동영상을 재생하기 위한 장치 및 그의 동작 방법
WO2020218182A1 (ja) 情報処理装置およびデバイス情報導出方法
JP2020167657A (ja) 画像処理装置、ヘッドマウントディスプレイ、および画像表示方法
WO2023157498A1 (ja) 情報処理装置、デバイス速度推定方法およびデバイス位置推定方法
WO2023153093A1 (ja) 情報処理装置および代表座標導出方法
JP2018160809A (ja) 画像処理装置、撮像システム、画像処理方法及びプログラム
US20240098243A1 (en) Predictive Perspective Correction
WO2024125379A1 (zh) 一种图像处理方法、头戴式显示设备及介质
WO2023157338A1 (ja) 情報処理装置およびデバイス位置推定方法
US20240340403A1 (en) Head mount display, information processing apparatus, and information processing method
JP2021004894A (ja) 情報処理装置および位置情報取得方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180611

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190318

R150 Certificate of patent or registration of utility model

Ref document number: 6499993

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250