JP2008227937A - 情報処理装置および情報処理方法 - Google Patents
情報処理装置および情報処理方法 Download PDFInfo
- Publication number
- JP2008227937A JP2008227937A JP2007063734A JP2007063734A JP2008227937A JP 2008227937 A JP2008227937 A JP 2008227937A JP 2007063734 A JP2007063734 A JP 2007063734A JP 2007063734 A JP2007063734 A JP 2007063734A JP 2008227937 A JP2008227937 A JP 2008227937A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- unit
- encoded data
- generation condition
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
【課題】演算負荷を低減させるとともに動画像をより円滑に再生することができる情報処理装置および情報処理方法を提供する。
【解決手段】端末装置2a〜2cは、それぞれの間で符号化データの生成条件を設定し、この生成条件に基づいて画像データを符号化して符号化データを作成し、他の端末装置2a〜2cから受信する、生成条件に基づいて符号化された符号化データを、当該生成条件に基づいて復号化する。これにより、特定ピクチャを確実に復号化することが可能となるため、結果として、演算負荷を低減させるとともに動画像をより円滑に再生することができる。
【選択図】 図1
【解決手段】端末装置2a〜2cは、それぞれの間で符号化データの生成条件を設定し、この生成条件に基づいて画像データを符号化して符号化データを作成し、他の端末装置2a〜2cから受信する、生成条件に基づいて符号化された符号化データを、当該生成条件に基づいて復号化する。これにより、特定ピクチャを確実に復号化することが可能となるため、結果として、演算負荷を低減させるとともに動画像をより円滑に再生することができる。
【選択図】 図1
Description
本発明は、動画圧縮技術に関するものであり、より詳しくは動画像のデータを符号化したり、符号化された動画像のデータを復号化したりする情報処理装置および情報処理方法に関するものである。
近年、例えばTV会議システムなど複数の端末装置間でそれぞれが撮影した動画像を相互に視聴可能なシステムが提案されている。このようなシステムにおいて、各端末装置は、自装置で撮影した動画像を他の端末装置に送信するとともに、他の端末装置から送られてきた複数の動画像を同一画面に表示する。これにより、各端末装置のユーザは、他の端末装置のユーザの動画像を見ながら会話等を行うことが可能となる。
このようなシステムでは、通信負荷を軽減するために、送受信する動画像に対して符号化が行われる。例えば、H.264またはMPEG−4と呼ばれる動画圧縮技術(例えば、非特許文献1参照。)を用いると、動画像は、空間的に符号化されるIピクチャ、および、他のピクチャを参照して符号化されるPピクチャまたはBピクチャから構成される複数の連続したピクチャからなる画像データ(以下、符号化データという)に符号化される。この符号化データは、受信側の端末装置で復号化されることにより、動画像として再生することが可能となる。
上記システムにおいて、動画像の符号化および符号化データの復号化は、各端末装置に実装されたソフトウェアにより行われる。このため、例えば3,4台程度の少数の端末装置による符号化データの送受信であれば端末装置の動作上の問題はないが、例えば10台程度など多数の端末装置による符号化データの送受信を行うとなると、各端末装置では同時に送られてくる多数の符号化データを同時に復号化しなければならないので、CPUにかかる負荷が増大し、結果として動画像が正常に再生されない場合があった。
このような事態を防ぐために、従来では、例えばIピクチャのみを復号化したり、フレームレートを変更するなど、端末装置における復号化処理にかかる負荷を低減させる方法が提案されている(例えば、特許文献1参照。)。
しかしながら、Iピクチャのみを復号化する方法は、動画像再生時のフレームレートが極端に低くなってしまうので、高画質な動画像を提供することが困難となる。これを解消するためにIピクチャの数を増やすと、低ビットレートな環境では復号した際の画質が低くなる。そこで、画質を向上させるためにビットレートを上げると、PピクチャやBピクチャと比較してIピクチャはデータ量が大きいので、ネットワーク帯域の多くを占有してしまい他の通信に影響が出てしまう可能性がある。
また、フレームレートを変更する方法は、フレームレートが高いときはよいものの、フレームレートが低いときには、円滑に動画像を再生することが困難となる。
このように、従来は、端末装置の演算負荷を低減させるとともに、動画像を円滑に再生することが困難であった。
そこで、本願発明は、演算負荷を低減させるとともに動画像をより円滑に再生することができる情報処理装置および情報処理方法を提供することを目的とする。
そこで、本願発明は、演算負荷を低減させるとともに動画像をより円滑に再生することができる情報処理装置および情報処理方法を提供することを目的とする。
上述したような課題を解決するために、本発明に係る情報処理装置は、他の装置との間で、符号化された連続する複数のピクチャを含む符号化データを送受信する情報処理装置であって、他の装置との間で、符号化データの生成条件を設定する設定手段と、当該生成条件に基づいて、画像データを符号化して符号化データを生成する符号化手段と、他の装置から受信する、生成条件に基づいて符号化された符号化データを、当該生成条件に基づいて復号化する復号化手段とを備えることを特徴とする。
上記情報処理装置において、生成条件は、復号化するピクチャを特定し、符号化手段は、生成条件に基づいて、生成する符号化データの各ピクチャが参照するピクチャを決定するようにしてもよい。
また、本発明に係る他の情報処理装置は、他の装置に対して、符号化された連続する複数のピクチャを含む符号化データを送信する情報処理装置であって、他の装置との間で、符号化データの生成条件を設定する設定手段と、生成条件に基づいて、画像データを符号化して符号化データを生成する符号化手段とを備えることを特徴とする。
また、本発明に係る他の情報処理装置は、他の装置から、符号化された連続する複数のピクチャを含む符号化データを受信する情報処理装置であって、他の装置との間で、符号化データの生成条件を設定する設定手段と、他の装置から受信する、生成条件に基づいて符号化された符号化データを、生成条件に基づいて復号化する復号化手段とを備えることを特徴とする。
また、本発明に係る情報処理方法は、他の装置との間で、符号化された連続する複数のピクチャを含む符号化データを送受信する情報処理方法であって、他の装置との間で、符号化データの生成条件を設定する設定ステップと、生成条件に基づいて、画像データを符号化して符号化データを生成する符号化ステップと、他の装置から受信する、生成条件に基づいて符号化された符号化データを、生成条件に基づいて復号化する復号化ステップとを有することを特徴とする。
本発明によれば、他の装置と符号化データの生成条件を設定し、この生成条件に基づいて画像データを符号化して符号化データを作成し、他の装置から受信する、生成条件に基づいて符号化された符号化データを、当該生成条件に基づいて復号化することにより、特定のピクチャを確実に復号化することが可能となるため、結果として、演算負荷を低減させるとともに動画像をより円滑に再生することができる。
以下、図面を参照して、本発明の実施の形態について詳細に説明する。なお、本実施の形態では、TV会議システムにおける端末装置に本発明を適用した場合を例に説明する。
[TV会議システムの構成]
図1に示すように、本実施の形態に係るTV会議システムは、サーバ1と、複数の端末装置2a〜2nとから構成され、それぞれはLAN(Local Area Network)やインターネット等からなる通信回線3により接続されている。なお、端末装置2a〜2nは、それぞれ同等の構成を有するので、便宜上、以下端末装置2と言う。
図1に示すように、本実施の形態に係るTV会議システムは、サーバ1と、複数の端末装置2a〜2nとから構成され、それぞれはLAN(Local Area Network)やインターネット等からなる通信回線3により接続されている。なお、端末装置2a〜2nは、それぞれ同等の構成を有するので、便宜上、以下端末装置2と言う。
(サーバの構成)
サーバ1は、TV会議システムを構成する端末装置2a〜2nの呼制御を行い、端末装置2間の通信を確立する。
サーバ1は、TV会議システムを構成する端末装置2a〜2nの呼制御を行い、端末装置2間の通信を確立する。
(端末装置の構成)
端末装置2は、TV会議システムを利用するユーザにより用いられる公知のコンピュータから構成される。この端末装置2は、図2に示すように、外部I/F部4と、操作入力部5と、画像処理部6と、音声処理部7と、記憶部8と、制御部9とから構成される。
端末装置2は、TV会議システムを利用するユーザにより用いられる公知のコンピュータから構成される。この端末装置2は、図2に示すように、外部I/F部4と、操作入力部5と、画像処理部6と、音声処理部7と、記憶部8と、制御部9とから構成される。
外部I/F部4は、通信回路からなり、通信回線3等を介して、サーバ1および他の端末装置2とデータ通信を行い、接続された各装置と各種データをやりとりする。
操作入力部5は、キーボードやマウス等からなり、ユーザの操作を検出して制御部9へ出力する。
画像処理部6は、画像処理回路からなり、カメラ6aにより取り込まれた動画像を制御部9に入力したり、制御部9から入力された動画像をモニタ6bから出力させたりするとともに、階調制御等を行う。
音声処理部7は、信号処理回路からなり、マイク7aから入力された音声を音声データに符号化して制御部9に出力したり、制御部9から入力された音声データを復号化してスピーカ7bから出力したりするとともに、音量制御やエコーキャンセラ等の機能を有する。
記憶部8は、メモリやハードディスクなどの記憶装置からなり、制御データ8a、生成条件8bおよびプログラム8cを格納する。ここで、制御データ8aは、端末装置2の制御に用いる情報である。また、生成条件8bは、交渉部14により生成される情報である。また、プログラム8cは、端末装置2の動作プログラムであり、予め記憶部8に格納される。なお、プログラム8cは、DVD(Digital Versatile Disk)やCD(Compact disk)等の記録媒体やネットワークを介して記憶部8に格納するようにしてもよい。
制御部9は、CPUなどのマイクロプロセッサとその周辺回路からなり、記憶部8からプログラム8cを読み込んで実行することにより、上記ハードウェアとプログラム8cを協働させ、符号化部11、復号化部12、TV会議部13および交渉部14を実現させる。
符号化部11は、H.264規格に基づいて、カメラ6aおよび画像処理部6により生成された連続する複数のフレーム(画像)を符号化して、連続する複数のピクチャ(符号化された画像)からなる符号化データを生成する。この符号化部11は、図3に示すように、符号化部11は、差分演算部111、DCT部112、量子化部113、逆量子化部114、IDCT部115、加算演算部116、デブロッキングフィルタ117、動き補償予測部118、フレームメモリ119、動き検出部120、イントラ予測部121、スイッチ122および符号化データ出力部123を備えている。このような符号化部11は、TV会議システムのように同時に複数の端末装置2と符号化データのやりとりを行う場合、生成する符号化データの種類毎に設けられる。なお、符号化部11による符号化処理動作の詳細については後述する。
復号化部12は、外部I/F部4を介して他の端末装置2から受信した符号化データを復号化して画像データを生成する。この復号化部12は、図4に示すように、選択部150、復号化部131、逆量子化部132、IDCT部133、加算演算部134、デブロッキングフィルタ135、フレームメモリ136、動き補償予測部137、イントラ予測部138およびスイッチ139を備えている。このような復号化部12は、TV会議システムのように同時に複数の端末装置2と符号化データのやりとりを行う場合、相手先の端末装置2毎に設けられる。なお、復号化部12による復号化処理動作の詳細については後述する。
TV会議部13は、通信回線3および外部I/F部4を介して他の端末装置2と符号化データおよび音声データをやりとりすることにより、TV会議システムを実現するものである。具体的には、まず、サーバ1の呼制御の結果、TV会議に使用される端末装置2の数量に応じて、復号化部12の数量を設定する。また、サーバ1の呼制御の結果や他の端末装置2との通信により取得した他の端末装置2の通信環境、プロトコル、性能等に関する情報に応じて、生成する符号化データの数量を設定し、この数量に応じて符号化部11の数量を設定する。また、符号化部11および音声処理部7に、生成された符号化データおよび音声データを、他の端末装置2それぞれに送信させる。また、音声処理部7に、他の端末装置2から受信した音声データをスピーカ7bから出力させる。また、復号化部12に、他の各端末装置2から受信した符号化データを復号化させ、画像処理部6に、復号化部12により生成された各フレームをモニタ6b上の所定の位置およびサイズで同時に表示させる。例えば、図5に示すように、発言しているユーザの端末装置2から動画像は、符号xで示すように画面の中央に大きく表示させ、他のユーザの端末装置2からの動画像は、符号yで示すように小さく表示させるようにしてもよい。このようにすることにより、他の端末装置2のユーザと、それぞれの動画像を見ながらそれぞれと会話を行うことができる。なお、発言者など何れの動画像を大きく表示させるかは、例えばTV会議の参加者の端末装置2から受信する音声データに基づいて判断することができる。
交渉部14は、他の端末装置2との間でやりとり、すなわちネゴシエーション動作を行い、送受信する符号化データの生成条件を設定する。ここで、生成条件とは、他の端末装置2と送受信する符号化データのピクチャの構成を特定する情報であり、必ず復号化が可能なピクチャ(以下、特定ピクチャという)の出現順に関する取り決めのことを意味する。このような生成条件は、端末装置2の通信環境、端末装置2自身や他の端末装置2の性能、TV会議への参加人数等に基づいて設定される。また、生成条件は、符号化データの送受信を行う相手の端末装置2毎に生成される。生成された生成条件は、記憶部8に生成条件8bとして格納される。この記憶部8に格納されれ生成条件8bに基づいて、符号化部11および復号化部12は、画像データの符号化および符号化データの復号化を行う。
[TV会議システムの動作]
次に、図6を参照して、本実施の形態に係るTV会議システムの全体の動作について説明する。
次に、図6を参照して、本実施の形態に係るTV会議システムの全体の動作について説明する。
端末装置2aと端末装置2bとがTV会議を行う場合、それぞれは、制御部9のTV会議部13により、サーバ1を介して互いの通信を確立した後、交渉部14により、ネゴシエーション動作を行う(ステップS1)。
本実施の形態においては、図7(a)に示すように、TV会議への参加人数に基づいて生成条件を設定する場合を例に説明する。一般に、モニタ6bに表示される各ユーザの動画像のサイズは、TV会議への参加人数の増加に伴って小さくなる。このため、参加人数が多数の場合には、符号化データを復号化する際にピクチャを間引く、すなわち特定ピクチャのみを復号化させたとしても、画質の低下による人間の目に対する影響は少ないものと考えられる。そこで、図7(a)に示すように、参加人数が1〜4人のときは3フレーム毎、5〜8人のときは5フレーム毎、9〜12人のときは7フレーム毎、13〜16人のときは9フレーム毎というように、TV会議への参加人数の増加に伴って特定ピクチャの出現頻度を低くする、言い換えると間引くピクチャの数量を増やすように生成条件を設定する。このように、TV会議への参加人数に応じて特定ピクチャの頻度を変更することにより、端末装置2の演算負荷を低減させることができる。また、演算負荷が低減されるので、動画像をより円滑に再生することができる。さらに、人間の目に対して、動画像がより円滑に再生されているように見せることができる。
なお、生成条件は、例えば図7(b)に示すように、相手の端末装置2の性能に基づいて設定するようにしてもよい。CPUの演算処理能力が低い、メモリの容量が少ないなど、端末装置2の性能が低い場合には、符号化データのデータ量が多いと、データ処理に時間がかかり、動画像が円滑に表示されない場合がある。そこで、図7(b)の場合、相手の端末装置2の性能が高いときは3フレーム毎、性能が中程度のときは6フレーム毎、低いときは9フレーム毎というように、相手の端末装置2の性能が低いほど特定ピクチャの出現頻度が低くする、言い換えると、間引くピクチャの数量が多くなるように生成条件を設定する。このように、相手の端末装置2の性能に応じて特定ピクチャの出現頻度を変更することにより、端末装置2の演算負荷を低減させることができる。また、演算負荷が低減されるので、動画像をより円滑に再生することもできる。
このような生成条件は、相手側の端末装置2毎に設定される。このとき、相手側の端末装置2に送信する符号化データを生成する際に用いる生成条件と、当該相手側の端末装置2から受信した符号化データを復号化する際に用いる生成条件とは、異なるようにしてもよい。これにより、自身および相手の端末装置2の性能や通信環境に応じた符号化データの送受信を行うことができる。
なお、生成条件は、複数の端末装置2に対して同一の生成条件を設定するようにしてもよい。例えば、相手側の端末装置2aと端末装置2bの性能が等しい場合、それぞれに対してその性能に対応する生成条件により生成した符号化データを送信するようにしてもよい。これにより、符号化部11の数量を増やさなくて良いので、端末装置2の演算負荷を低減させることができる。
生成条件が設定されると、端末装置2aと端末装置2bは、符号化部11により当該生成条件に基づいて画像データを符号化して符号化データを生成し、この符号化データの送受信を行う(ステップS2)。受信した符号化データは、復号化部12により復号化され、モニタ6bに動画像として表示される。これにより、端末装置2aと端末装置2bとの間のTV会議を行うことが可能となる。このような符号化処理動作および復号化処理動作の詳細については後述する。
なお、符号化データを生成する際、端末装置2a,2bの符号化部11は、生成条件に基づいて、特定ピクチャの復号化が必ず可能となるように、各フレームを符号化する。例えば、生成条件によりIピクチャのフレームを先頭に3フレーム毎に特定ピクチャが出現するように設定された場合、図8に示すような符号化データが生成される。なお、図8において、矩形の中に示す文字は各ピクチャの種類を表し、矢印は各ピクチャが参照する参照ピクチャを示している。例えば、符号bのピクチャは、Pピクチャであって、符号aのIピクチャを参照していることを意味する。このような図8に示す符号化データでは、先頭のIピクチャから3フレーム毎に出現する符号d,g,jのPピクチャは、それぞれ参照ピクチャが符号a,d,gのピクチャとなっている。したがって、この符号化データを受信した端末装置2により、生成条件に基づいて特定ピクチャ以外のピクチャが間引かれたとしても、特定ピクチャの参照ピクチャは間引かれないので、特定ピクチャを正常に復号化することができる。
また、符号化データを復号化する際、端末装置2a,2bの復号化部12は、装置の性能やTV会議の参加人数等に応じて、生成条件を用いて復号化するか否かを判断する。
例えば、装置の性能が低かったり、図5の符号yで示すように小さな画面に表示したりする場合、復号化部12は、生成条件に基づいて符号化データを復号化する。例えば、図8に示す符号化データのように、生成条件により3フレーム毎に特定ピクチャが出現するように設定された場合、端末装置2a,2bは、その特定ピクチャのみを復号化する。このとき、特定ピクチャは、図8に示すように、参照ピクチャが特定ピクチャであって必ず復号化されるため、正常に復号化することができる。
一方、装置の性能が高かったり、図5の符号xで示すように発言者の端末装置2からの動画像をモニタ6bに大きく表示したりする場合、復号化部12は、生成条件を用いずに、すなわちピクチャを間引かずに符号化データを復号化する。これにより、モニタ6bに高画質な動画像を再生することができる。
このような端末装置2a,2bにより行われているTV会議に端末装置2が参加したい場合、端末装置2は、制御部9のTV会議部13により、サーバ1を介して端末装置2a,2bに対してTV会議への参加を要請する旨を示す参加通知を送信する(ステップS3,S4)。
参加通知が送信されると、端末装置2a〜2cそれぞれの間で、ステップS2で説明したのと同等のネゴシエーション動作が行われる(ステップS5〜S7)。このネゴシエーション動作が行われると、端末装置2a〜2cは、ネゴシエーション動作により設定された生成条件に基づいて符号化データを生成し、これをそれぞれの間で送受信する(ステップS8〜S10)。
端末装置2a〜2cでは、他の端末装置2から受信した符号化データを、この符号化データの作成に用いた生成条件に基づいて、または生成条件を用いずに復号化して画像データを生成し、これを図5に示すようにモニタ6bに表示させることにより、端末装置2a〜2cによるTV会議が可能となる。
[符号化処理動作]
次に、図3を参照して符号化部11による符号化処理動作について説明する。この符号化は、イントラ予測符号化および動き補償予測符号化の2種類がある。これらは、生成条件に基づいてスイッチ122により切り替えがなされる。ここではまず始めにイントラ予測符号化について説明する。
次に、図3を参照して符号化部11による符号化処理動作について説明する。この符号化は、イントラ予測符号化および動き補償予測符号化の2種類がある。これらは、生成条件に基づいてスイッチ122により切り替えがなされる。ここではまず始めにイントラ予測符号化について説明する。
(イントラ予測符号化)
イントラ予測符号化とは、基本的には1枚のフレーム内において圧縮符号化を行うものである。具体的には、画像処理部6から入力されたフレームは、DCT部112に入力されて周波数変換されたのち、量子化部113で量子化され、符号化データ出力部123で可変長符号化が施される。これにより、Iピクチャが出力される。
イントラ予測符号化とは、基本的には1枚のフレーム内において圧縮符号化を行うものである。具体的には、画像処理部6から入力されたフレームは、DCT部112に入力されて周波数変換されたのち、量子化部113で量子化され、符号化データ出力部123で可変長符号化が施される。これにより、Iピクチャが出力される。
なお、量子化部113から出力される残差データは、逆量子化部114およびIDCT部115により逆量子化および逆周波数変換が順次施され、デブロッキングフィルタ117により符号化を行う際に生じたブロック歪を緩和するための処理が行われたのち、再構成画像データとしてフレームメモリ119に格納される。
(動き補償予測符号化)
動き補償予測符号化とは、基本的には他のフレーム(参照フレーム)からの変化を符号化するものである。具体的には、画像処理部6からフレームが入力されると、動き検出部120は、入力されたフレームとフレームメモリ119に格納された再構成画像データとに基づいて、動きベクトルを検出する。
動き補償予測符号化とは、基本的には他のフレーム(参照フレーム)からの変化を符号化するものである。具体的には、画像処理部6からフレームが入力されると、動き検出部120は、入力されたフレームとフレームメモリ119に格納された再構成画像データとに基づいて、動きベクトルを検出する。
このとき、動き検出部120は、交渉部14により設定された生成条件に基づいて再構成画像データを選択する。具体的には、符号化するフレームが、生成条件により必ず復号化が可能な特定ピクチャとして符号化するように設定されている場合、Iピクチャまたは端末装置2で必ず復号化されるフレームに相当する再構成画像データをフレームメモリ119から抽出する。例えば、図8において、符号b,c,e,f,h,i,k,lのピクチャに対応するフレームは、特定ピクチャとして符号化するように設定されていないので、適宜自由に設定した参照ピクチャに基づいて符号化される。一方、符号d,g,jのピクチャに対応するフレームは、特定ピクチャとして符号化するように設定されているので、Iピクチャまたは特定ピクチャを参照ピクチャとして符号化される。これにより、特定ピクチャが参照するピクチャは、Iピクチャまたは受信側の端末装置2で必ず復号化されるピクチャとなる。
動き補償予測部118は、動き検出部120により検出された動きベクトルと、生成条件により特定されるフレームメモリ119に格納された再構成画像データとに基づいて、予測画像データを生成する。差分演算部111は、入力されたフレームと予測画像データとの差分をとり、差分画像データを生成する。この差分画像データは、DCT部112に入力されて周波数変換されたのち、符号化データ出力部123で可変長符号化が施される。これにより、PピクチャやBピクチャが出力される。
なお、量子化部113から出力される残差データは、逆量子化部114およびIDCT部115により逆量子化および逆周波数変換が順次施され、加算演算部116により予測画像データが加算され、デブロッキングフィルタ117により符号化を行う際に生じたブロック歪を緩和するための処理が行われたのち、再構成画像データとしてフレームメモリ119に格納される。
上述したようなH.264規格に基づいて生成された符号化データは、一般にNALユニットと呼ばれる構成を有する。このNALユニットは、図9に示すように、NALヘッダとRBSP(Raw Byte Sequence Payload)とから構成される。NALヘッダは、固定ビットと、参照ピクチャかであるか否かを示すフラグからなるnal_ref_idoと、NALユニットの種類を示す識別子からなるnal_unit_typeとから構成される。また、RBAPは、圧縮データからなるスライスデータと、このスライスデータに関するヘッダ情報からなるスライスヘッダとから構成される。このスライスヘッダは、参照ピクチャが何れのピクチャであるかを識別することができる。
このように、本実施の形態によれば、生成条件に基づいて符号化データが生成されるので、受信側の端末装置2で当該生成条件に基づいて符号化データを復号化することにより、特定ピクチャ以外のピクチャを間引いた動画像を再生することが可能となる。
[復号化処理動作]
次に、図4を参照して復号化部12による符号化データの復号化処理動作について説明する。
次に、図4を参照して復号化部12による符号化データの復号化処理動作について説明する。
まず、入力された符号化データは、選択部150により、端末装置2の性能、TV会議の参加人数、発言者か否か等に応じて、ピクチャを間引いて復号化するか全てのピクチャを復号化するかが判断される。ピクチャを間引いて復号化を行う場合、選択部150の判別部152により生成条件に基づいて各ピクチャが判別され、この判別結果に基づいて出力部151により復号化されるピクチャ、すなわちIピクチャまたは特定ピクチャのみが選択的に出力される。一方、ピクチャを間引かずに復号化する場合、選択部150の出力部151により、受信した符号化データの全てのピクチャが出力される。このような選択部150によるピクチャの選択動作の詳細については後述する。
出力されたピクチャに対する復号化は、イントラ予測復号化および動き補償予測復号化の2種類がある。これらは、スイッチ139によって切り替えがなされる。ここではまず始めにイントラ予測復号化について説明する。
(イントラ予測復号化)
イントラ予測復号化は、Iピクチャのみから元のフレームを復元するものである。選択部150により選択されたIピクチャは、復号化部131により可変長変換され、逆量子化部132およびIDCT部133により逆量子化と逆周波数変換が順次施されたのち、デブロッキングフィルタ135により復号化を行う際に生じたブロック歪みが緩和され、フレームとして出力される。このフレームは、フレームメモリ136にも格納される。このようにIピクチャは、他のピクチャを参照することなく復号化される。
イントラ予測復号化は、Iピクチャのみから元のフレームを復元するものである。選択部150により選択されたIピクチャは、復号化部131により可変長変換され、逆量子化部132およびIDCT部133により逆量子化と逆周波数変換が順次施されたのち、デブロッキングフィルタ135により復号化を行う際に生じたブロック歪みが緩和され、フレームとして出力される。このフレームは、フレームメモリ136にも格納される。このようにIピクチャは、他のピクチャを参照することなく復号化される。
(動き補償予測復号化)
次に、動き補償予測復号化について説明する。この動き補償予測復号化は、参照ピクチャと動きベクトルから元のフレームを復元するものである。選択部150からピクチャが入力されると、このピクチャは、復号化部131により可変長変換され、逆量子化部132およびIDCT部133により逆量子化と逆周波数変換が順次施され、残差復号化データとして出力される。このとき、動き補償予測部137では、フレームメモリ136に格納されたフレームに基づいて予測画像データが生成される。上述したように生成された残差符号化データと予測画像データとは、加算演算部134により加算され、デブロッキングフィルタ135により復号化を行う際に生じたブロック歪みが緩和されることにより、フレームとして出力される。このフレームは、フレームメモリ136にも格納される。
次に、動き補償予測復号化について説明する。この動き補償予測復号化は、参照ピクチャと動きベクトルから元のフレームを復元するものである。選択部150からピクチャが入力されると、このピクチャは、復号化部131により可変長変換され、逆量子化部132およびIDCT部133により逆量子化と逆周波数変換が順次施され、残差復号化データとして出力される。このとき、動き補償予測部137では、フレームメモリ136に格納されたフレームに基づいて予測画像データが生成される。上述したように生成された残差符号化データと予測画像データとは、加算演算部134により加算され、デブロッキングフィルタ135により復号化を行う際に生じたブロック歪みが緩和されることにより、フレームとして出力される。このフレームは、フレームメモリ136にも格納される。
このように、本実施の形態によれば、生成条件に基づいて符号化データを復号化することにより、所定のピクチャを間引いた動画像を再生することが可能となり、結果として、演算負荷を低減させることができるとともに、動画像をより円滑に再生することができる。
[ピクチャ選択動作]
次に、図10を参照して、選択部150による復号化するピクチャの選択動作について説明する。
次に、図10を参照して、選択部150による復号化するピクチャの選択動作について説明する。
まず、選択部150は、符号化データを受信すると(ステップS11)、判別部152の復号化判別部152aにより、ピクチャを間引いて復号化するか、または、全てのピクチャを復号化するかを選択する(ステップS12)。
例えば、装置の性能が高かったり、TV会議の参加人数が少なかったり、図5の符号xで示すように発言者の端末装置2からの動画像をモニタ6bに大きく表示したりするような場合、復号化判別部152aは、全てのピクチャを復号化すると判定し(ステップS12:YES)、出力部151により受信した符号化データの全てのピクチャを復号化部131に出力させる(ステップS16)。これにより、復号化部12からは、符号化データの全てのピクチャが復号化された動画像が出力される。
一方、装置の性能が低かったり、TV会議の参加人数が多かったり、図5の符号yで示すように小さな画面に表示したりするような場合、復号化判定手段152aは、ピクチャを間引いて復号化すると判定し(ステップS12:NO)、Iピクチャ判別部152bにより、入力されたピクチャ(以下、「入力ピクチャ」という)がIピクチャであるか否かを判別させる(ステップS13)。この判別は、図6を参照して説明したNALユニットにおけるNALヘッダのnal_unit_typeを参照することにより行われる。
入力ピクチャがIピクチャである場合(ステップS13:YES)、Iピクチャ判別部152bは、その入力ピクチャを復号化するピクチャとして選択し、出力部151から出力させる(ステップS16)。その結果、本実施の形態では、Iピクチャは全て復号化される。
一例として、図8の符号化データの場合、符号aのピクチャがIピクチャである。したがって、Iピクチャ判別部152bは、符号aのピクチャを符号化するピクチャとして選択し、出力部151から出力させる。これにより、図11に示すように、符号aのピクチャに基づくフレームが生成される。なお、図11において、上段の矩形は図8に対応する符号化データの各ピクチャを、これらのピクチャと矢印でそれぞれ結ばれた下段の矩形は復号化部12から出力されるフレームを表しており、人の絵のフレームは復号すると選択されたピクチャに対応するフレーム、「×」が記されたフレームは破棄すると選択されたピクチャに対応するフレームを意味する。
一方、入力ピクチャがIピクチャではない場合(ステップS13:NO)、判別部152は、特定ピクチャ判別部152cにより入力ピクチャが特定ピクチャであるか否かを判別する(ステップS14)。特定ピクチャ判別部152cは、生成条件8bを参照して、入力ピクチャが特定ピクチャであるか否かを判別する。
入力ピクチャが特定ピクチャではない場合(ステップS14:NO)、特定ピクチャ判別部152cは、入力ピクチャを復号化するピクチャとして選択しない、すなわち破棄するピクチャとして選択し、出力部151から出力させない(ステップS15)。このように、本実施の形態では、特定ピクチャ以外のピクチャを破棄することにより、画質の低下を抑えながら、復号化するピクチャの数量を減少させることができるので、端末装置2の演算負荷を低減させることができる。
例えば、図8の符号化データは、3フレーム毎に特定ピクチャが出現するように設定されている。したがって、特定ピクチャ判別部152cは、符号b,c,e,f,h,i,k,lのピクチャを破棄するピクチャとして選択し、出力部151から出力させない。これにより、図11に示すように、符号b,c,e,f,h,i,k,lのピクチャに基づくフレームが生成されない。
入力ピクチャが特定ピクチャである場合(ステップS14:YES)、特定ピクチャ判別部152cは、入力ピクチャを復号化するピクチャとして選択し、出力部151から出力させる(ステップS16)。このように、本実施の形態では、特定ピクチャのみを復号化させることにより、復号化するピクチャの数量を減少させることができるので、端末装置2の演算負荷を低減させることができる。また、特定ピクチャは、参照ピクチャが破棄されないので、必ず復号化することが可能であるため、動画像の再生をより円滑に行うことができる。
例えば、図8に示す符号化データは、3フレーム毎に特定ピクチャが出現するように設定されている。したがって、特定ピクチャ判別部152cは、符号d,g,jのピクチャを復号化するピクチャとして選択し、出力部151から出力させる。これにより、図11に示すように、符号d,g,jのピクチャに基づくフレームが生成される。
なお、図12に示すように、Iピクチャが不規則に出現する場合、特定ピクチャ判別部152cは、Iピクチャの出現に基づいて特定ピクチャを検出するようにしてもよい。例えば、生成条件により3フレーム毎に特定ピクチャが出現するように設定された場合、図12に示すようにIピクチャの出現する度にピクチャをカウントし直す。このようにすることにより、Iピクチャと特定ピクチャを確実に復号化することができる。なお、図12において、上段の矩形は符号化データの各ピクチャを、これらのピクチャと矢印でそれぞれ結ばれた下段の矩形は復号化部12から出力されるフレームを表しており、「○」が記されたフレームは復号化すると選択されたピクチャに対応するフレームを意味する。
このような選択動作によって選択部150から出力されたピクチャは、復号化部131に入力されて復号化部12の各構成要素によって復号化されることにより、最終的にフレームとして出力される。
図11に示すような選択部150による選択結果が出力され、選択されたピクチャに対して復号化部12により復号化が行われると、復号化部12のフレームメモリ136には、図12(a)〜(d)に示すようにフレームが格納される。
すなわち、選択部150により、まず符号aのピクチャが復号化するピクチャとして選択されると、この符号aのピクチャは、復号化部12の他の構成要素により復号化され、図12(a)に示すように、フレームメモリ136に格納される。
次に、選択部150により符号dのピクチャが選択されると、この符号dのピクチャは、復号化部12の他の構成要素により復号化される。このとき、符号dのピクチャの参照ピクチャである符号aのピクチャのフレームは、図12(a)に示すようにフレームメモリ136に格納されているので、復号化部12は、フレームメモリ136を参照することにより、符号dのピクチャを復号化することが可能となる。このようにして生成された符号dのフレームは、図12(b)に示すように、符号aのフレームとともにフレームメモリ136に格納される。
同様に、選択部150により符号g,jのピクチャが選択されると、この符号g,jのピクチャは、フレームメモリ136を参照して復号化部12の他の構成要素により復号化され、図12(c)、(d)に示すように、フレームメモリ136に格納される。
復号化を行う際、参照ピクチャが破棄されていると、入力ピクチャを十分な品質で復号化することができない上に演算負荷が大きくなる。しかしながら、本実施の形態では、参照するピクチャが必ず復号化されるように生成条件が設定されており、上述したように、参照ピクチャのフレームが必ずフレームメモリ136に格納される。したがって、動画像をより円滑に再生することができるとともに、端末装置2の演算負荷を低減させることができる。
以上説明したように、本実施の形態によれば、他の端末装置2と符号化データの生成条件を設定し、この生成条件に基づいて画像データを符号化して符号化データを作成し、他の端末装置2から受信する、生成条件に基づいて符号化された符号化データを、当該生成条件に基づいて復号化することにより、特定ピクチャを確実に復号化することが可能となるため、結果として、演算負荷を低減させるとともに動画像をより円滑に再生することができる。
なお、本実施の形態では、Iピクチャ判別部152cを設けてIピクチャを判別するようにしたが、Iピクチャ判別部152cを設けないようにしてもよい。この場合、生成条件において、Iピクチャをも含めて特定ピクチャを設定するようにすればよい。
また、本実施の形態では、ネゴシエーション動作により生成条件を生成するようにしたが、ネゴシエーション動作を行わずに生成条件を生成するようにしてもよい。例えば、受信した符号化データを記憶部8に記憶し、この記憶された符号化データのデータ構成、すなわちピクチャの配列および参照ピクチャを解析することにより、特定ピクチャの出現順を検出し、これに基づいて生成条件を生成するようにしてもよい。このようにしても、特定ピクチャのみを確実に復号化することが可能となるため、結果として、演算負荷を低減させるとともに動画像をより円滑に再生することができる。
また、本実施の形態において、例えば図8,図11等に示したように符号化データがIピクチャとPピクチャとから構成されるものとして説明したが、符号化データがIピクチャ、PピクチャおよびBピクチャから構成されていてもよいことは言うまでもない。この場合、例えば、Bピクチャについても先に入力された所定のピクチャおよび参照ピクチャが復号化されているか否かに基づいて復号化するか否かを決定することにより、端末装置2の演算負荷を低減させるとともに、動画像をより円滑に再生することができる。
また、復号化部12から出力されるフレームに基づく動画像は、符号化データのピクチャ全てを復号化した画像データに基づく動画像のフレームレートと同じフレームレートで再生されるようにしてもよい。この場合、破棄されたピクチャに対応するフレームには、このフレームの前に正常に再生されたフレームを表示し続けるようにすればよい。これにより、動画像をより円滑に再生することができる。
本発明は、符号化されたデータを復号化する各種装置に適用することができる。
1…サーバ、2,2a,2b,2n…端末装置、3…通信回線、4…外部I/F部、5…操作入力部、6…画像処理部、6a…カメラ、6b…モニタ、7…音声処理部、7a…マイク、7b…スピーカ、8…記憶部、8a…制御データ、8b…生成条件、8c…プログラム、9…制御部、11…符号化部、12…復号化部、13…TV会議部、111…差分演算部、112…DCT部、113…量子化部、114…逆量子化部、115…IDCT部、116…加算演算部、117…デブロッキングフィルタ、118…動き補償予測部、119…フレームメモリ、120…動き検出部、121…イントラ予測部、122…スイッチ、123…符号化データ出力部、131…復号化部、132…逆量子化部、133…IDCT部、134…加算演算部、135…デブロッキングフィルタ、136…フレームメモリ、137…動き補償予測部、138…イントラ予測部、139…スイッチ、150…選択部、151…出力手段、152…判別部、152a…復号化判別部、152b…Iピクチャ判別部、152c…特定ピクチャ判別部。
Claims (5)
- 他の装置との間で、符号化された連続する複数のピクチャを含む符号化データを送受信する情報処理装置であって、
前記他の装置との間で符号化データの生成条件を設定する設定手段と、
当該生成条件に基づいて、画像データを符号化して符号化データを生成する符号化手段と、
前記他の装置から受信する、生成条件に基づいて符号化された符号化データを、当該生成条件に基づいて復号化する復号化手段と
を備えることを特徴とする情報処理装置。 - 前記生成条件は、復号化するピクチャを特定し、
前記符号化手段は、前記生成条件に基づいて、生成する符号化データの各ピクチャが参照するピクチャを決定する
ことを特徴とする請求項1記載の情報処理装置。 - 他の装置に対して、符号化された連続する複数のピクチャを含む符号化データを送信する情報処理装置であって、
前記他の装置との間で符号化データの生成条件を設定する設定手段と、
前記生成条件に基づいて、画像データを符号化して符号化データを生成する符号化手段と
を備えることを特徴とする情報処理装置。 - 他の装置から、符号化された連続する複数のピクチャを含む符号化データを受信する情報処理装置であって、
前記他の装置との間で符号化データの生成条件を設定する設定手段と、
前記他の装置から受信する、前記生成条件に基づいて符号化された符号化データを、前記生成条件に基づいて復号化する復号化手段と
を備えることを特徴とする情報処理装置。 - 他の装置との間で、符号化された連続する複数のピクチャを含む符号化データを送受信する情報処理方法であって、
前記他の装置との間で符号化データの生成条件を設定する設定ステップと、
当該生成条件に基づいて、画像データを符号化して符号化データを生成する符号化ステップと、
前記他の装置から受信する、生成条件に基づいて符号化された符号化データを、当該生成条件に基づいて復号化する復号化ステップと
を有することを特徴とする情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007063734A JP2008227937A (ja) | 2007-03-13 | 2007-03-13 | 情報処理装置および情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007063734A JP2008227937A (ja) | 2007-03-13 | 2007-03-13 | 情報処理装置および情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008227937A true JP2008227937A (ja) | 2008-09-25 |
Family
ID=39846010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007063734A Pending JP2008227937A (ja) | 2007-03-13 | 2007-03-13 | 情報処理装置および情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008227937A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11313301A (ja) * | 1998-02-27 | 1999-11-09 | Hitachi Ltd | 番組配信システム、番組配信装置、番組品質変換装置、及び番組受信装置 |
JP2003304538A (ja) * | 2002-04-11 | 2003-10-24 | Matsushita Electric Ind Co Ltd | 画像符号化装置、画像復号化装置及びそれらの方法 |
JP2006014242A (ja) * | 2004-06-29 | 2006-01-12 | Ntt Communications Kk | 双方向画像通信装置、その処理方法及びクライアント装置並びにプログラム |
-
2007
- 2007-03-13 JP JP2007063734A patent/JP2008227937A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11313301A (ja) * | 1998-02-27 | 1999-11-09 | Hitachi Ltd | 番組配信システム、番組配信装置、番組品質変換装置、及び番組受信装置 |
JP2003304538A (ja) * | 2002-04-11 | 2003-10-24 | Matsushita Electric Ind Co Ltd | 画像符号化装置、画像復号化装置及びそれらの方法 |
JP2006014242A (ja) * | 2004-06-29 | 2006-01-12 | Ntt Communications Kk | 双方向画像通信装置、その処理方法及びクライアント装置並びにプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018110430A (ja) | 画像処理装置および方法、記録媒体、並びに、プログラム | |
JP2005341571A (ja) | ワイドスクリーンディスプレイ用のビデオ通信画像を準備する方法及びシステム | |
US20210409685A1 (en) | Video encoding method, video decoding method, and related apparatuses | |
JP6179179B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US20220021872A1 (en) | Video encoding method and apparatus, video decoding method and apparatus, storage medium, and electronic device | |
US20220060691A1 (en) | Video encoding method, video decoding method, and related apparatuses | |
CN116018782A (zh) | 用于音频混合的方法和装置 | |
US11979577B2 (en) | Video encoding method, video decoding method, and related apparatuses | |
US8498331B2 (en) | Motion picture receiving device, motion picture transmitting device, motion picture decoding method, and motion picture encoding method | |
WO2021057686A1 (zh) | 视频解码方法和装置、视频编码方法和装置、存储介质及电子装置 | |
JPS62200994A (ja) | 動画通信システム | |
WO2002005558A1 (fr) | Terminal de communication multimedia | |
US11849127B2 (en) | Video encoding method, video decoding method, and related apparatuses | |
US20220078454A1 (en) | Video encoding method, video decoding method, and related apparatuses | |
CN116962613A (zh) | 数据传输方法及装置、计算机设备、存储介质 | |
JP2002290973A (ja) | マルチメディア通信装置 | |
JP2008227937A (ja) | 情報処理装置および情報処理方法 | |
JP4735558B2 (ja) | 情報処理装置および情報処理方法 | |
JP2005341347A (ja) | 多地点接続装置および方法 | |
JPH08294102A (ja) | 動画像通信会議システム及びその通信方法 | |
CN114071144A (zh) | 基于质量分级的视频编解码方法及设备 | |
JP2008211294A (ja) | 符号化装置および符号化方法 | |
JPH10145760A (ja) | 画像通信装置 | |
JPH0927950A (ja) | 映像スクランブル方法及び映像スクランブル装置 | |
CN116781900A (zh) | 编解码方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111220 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120220 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120321 |