JP2008199109A - 情報処理装置および情報処理方法 - Google Patents

情報処理装置および情報処理方法 Download PDF

Info

Publication number
JP2008199109A
JP2008199109A JP2007029460A JP2007029460A JP2008199109A JP 2008199109 A JP2008199109 A JP 2008199109A JP 2007029460 A JP2007029460 A JP 2007029460A JP 2007029460 A JP2007029460 A JP 2007029460A JP 2008199109 A JP2008199109 A JP 2008199109A
Authority
JP
Japan
Prior art keywords
picture
decoded
unit
output
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007029460A
Other languages
English (en)
Other versions
JP4735558B2 (ja
Inventor
Yukihiro Arato
幸広 荒戸
Tomofuku Koyano
智副 古屋野
Tomoko Aida
知子 相田
Koji Yamamiya
耕二 山宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Saxa Inc
Original Assignee
Saxa Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Saxa Inc filed Critical Saxa Inc
Priority to JP2007029460A priority Critical patent/JP4735558B2/ja
Publication of JP2008199109A publication Critical patent/JP2008199109A/ja
Application granted granted Critical
Publication of JP4735558B2 publication Critical patent/JP4735558B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】演算負荷を低減させるとともに動画像の画像を向上させることができる情報処理装置および情報処理方法を提供する。
【解決手段】入力ピクチャがIピクチャではない場合(ステップS2:NO)、入力ピクチャより先に入力されたピクチャが復号化されているか否かが判別され(ステップS3)、直前のピクチャが復号化されていると(ステップS3:YES)、入力ピクチャを復号化するピクチャとして選択されない、すなわち破棄するピクチャとして選択される(ステップS5)。これにより、復号化するピクチャの数量を減少させることができるので、端末装置の演算負荷を低減させることができる。
【選択図】 図7

Description

本発明は、動画圧縮技術に関するものであり、より詳しくは符号化された動画像のデータを復号化する情報処理装置および情報処理方法に関するものである。
近年、例えばTV会議システムなど複数の端末装置間でそれぞれが撮影した動画像を相互に視聴可能なシステムが提案されている。このようなシステムにおいて、各端末装置は、自装置で撮影した動画像を他の端末装置に送信するとともに、他の端末装置から送られてきた複数の動画像を同一画面に表示する。これにより、各端末装置のユーザは、他の端末装置のユーザの動画像を見ながら会話等を行うことが可能となる。
このようなシステムでは、通信負荷を軽減するために、送受信する動画像に対して符号化が行われる。例えば、H.264またはMPEG−4と呼ばれる動画圧縮技術(例えば、非特許文献1参照。)を用いると、動画像は、空間的に符号化されるIピクチャ、および、他のピクチャを参照して符号化されるPピクチャまたはBピクチャから構成される複数の連続したピクチャからなる画像データ(以下、符号化データという)に符号化される。この符号化データは、受信側の端末装置で復号化されることにより、動画像として再生することが可能となる。
上記システムにおいて、動画像の符号化および符号化データの復号化は、各端末装置に実装されたソフトウェアにより行われる。このため、例えば3,4台程度の少数の端末装置による符号化データの送受信であれば端末装置の動作上の問題はないが、例えば10台程度など多数の端末装置による符号化データの送受信を行うとなると、各端末装置では同時に送られてくる多数の符号化データを同時に復号化しなければならないので、CPUにかかる負荷が増大し、結果として動画像が正常に再生されない場合があった。
このような事態を防ぐために、従来では、例えばIピクチャのみを復号化したり、フレームレートを変更するなど、端末装置における復号化処理にかかる負荷を低減させる方法が提案されている(例えば、特許文献1参照。)。
特開平9−74548号公報 International Telecommunication Union、"ITU-T Recommendation H.264 Advanced video coding for generic audiovisual services"、[online]、[平成19年1月23日検索]、インターネット<http://www.itu.int/rec/T-REC-H.264/en>
しかしながら、Iピクチャのみを復号化する方法は、動画像再生時のフレームレートが極端に低くなってしまうので、高画質な動画像を提供するのが困難となる。これを解消するためにIピクチャの数を増やすと、低ビットレートな環境では復号した際の画質が低くなる。そこで画質を向上させようとすると、ビットレートを上げる必要があるが、PピクチャやBピクチャと比較してIピクチャはデータ量が大きいので、ネットワーク帯域の多くを占有してしまい他の通信に影響が出てしまう可能性がある。
また、フレームレートを変更する方法は、フレームレートが高いときはよいものの、フレームレートが低いときには、高画質な動画像を再生することが困難となる。
上述したように、従来は、端末装置の演算負荷を低減させるとともに、高画質の動画像を再生することが困難であった。
そこで、本願発明は、演算負荷を低減させるとともに動画像の画像を向上させることができる情報処理装置および情報処理方法を提供することを目的とする。
上述したような課題を解決するために、本発明に係る情報処理装置は、符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力しない選択手段と、この選択手段から出力されたピクチャを復号化する復号化手段とを備えることを特徴とする。
また、本発明に係る他の情報処理装置は、符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力せず、前記他のピクチャが復号化されていなければ、当該ピクチャが参照すべき参照ピクチャが復号化されているか否かを判別し、前記参照ピクチャが復号化されていれば当該ピクチャを出力し、前記参照ピクチャが復号化されていなければ当該ピクチャを出力しない選択手段と、この選択手段から出力されたピクチャを復号化する復号化手段とを備えたことを特徴とする。
また、本発明に係る情報処理方法は、符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力しない選択ステップと、この選択ステップにより出力されたピクチャを復号化する復号化ステップとを有することを特徴とする。
また、本発明に係る他の情報処理方法は、符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力せず、前記他のピクチャが復号化されていなければ、当該ピクチャが参照すべき参照ピクチャが復号化されているか否かを判別し、前記参照ピクチャが復号化されていれば当該ピクチャを出力し、前記参照ピクチャが復号化されていなければ当該ピクチャを出力しない選択ステップと、この選択ステップにより出力されたピクチャを復号化する復号化ステップとを有することを特徴とする。
本発明によれば、入力されたピクチャがIピクチャでない場合に当該ピクチャより先に入力された所定の他のピクチャが復号化されていると、当該ピクチャが復号化されないので、復号化に伴う演算負荷を低減させることができる。また、Iピクチャ以外のピクチャを復号化することも可能となるので、動画像の画質を向上させることができる。
以下、図面を参照して、本発明の実施の形態について詳細に説明する。なお、本実施の形態では、TV会議システムにおける端末装置に本発明を適用した場合を例に説明する。
[TV会議システムの構成]
図1に示すように、本実施の形態に係るTV会議システムは、サーバ1と、複数の端末装置2a〜2nとから構成され、それぞれはLAN(Local Area Network)やインターネット等からなる通信回線3により接続されている。なお、端末装置2a〜2nは、それぞれ同等の構成を有するので、便宜上、以下端末装置2と言う。
(サーバの構成)
サーバ1は、TV会議システムを構成する端末装置2a〜2nの呼制御を行い、端末装置2間の通信を確立する。
(端末装置の構成)
端末装置2は、TV会議システムを利用するユーザにより用いられる公知のコンピュータから構成される。この端末装置2は、図2に示すように、外部I/F部4と、操作入力部5と、画像処理部6と、音声処理部7と、記憶部8と、制御部9とから構成される。
外部I/F部4は、通信回路からなり、通信回線3等を介して、サーバ1および他の端末装置2とデータ通信を行い、接続された各装置と各種データをやりとりする。
操作入力部5は、キーボードやマウス等からなり、ユーザの操作を検出して制御部9へ出力する。
画像処理部6は、画像処理回路からなり、カメラ6aにより取り込まれた動画像を制御部9に入力したり、制御部9から入力された動画像をモニタ6bから出力させたりするとともに、階調制御等を行う。
音声処理部7は、信号処理回路からなり、マイク7aから入力された音声を音声データに符号化して制御部9に出力したり、制御部9から入力された音声データを復号化してスピーカ7bから出力したりするとともに、音量制御やエコーキャンセラ等の機能を有する。
記憶部8は、メモリやハードディスクなどの記憶装置からなり、制御データ8aおよびプログラム8bを格納する。ここで、制御データ8aは、端末装置2の制御に用いる情報である。また、プログラム8bは、端末装置2の動作プログラムであり、予め記憶部8に格納される。なお、プログラム8bは、DVD(Digital Versatile Disk)やCD(Compact disk)等の記録媒体やネットワークを介して記憶部8に格納するようにしてもよい。
制御部9は、CPUなどのマイクロプロセッサとその周辺回路からなり、記憶部8からプログラム8bを読み込んで実行することにより、上記ハードウェアとプログラム8bを協働させ、符号化手段11、復号化手段12およびTV会議手段13を実現させる。
符号化手段11は、H.264規格に基づいて、カメラ6aおよび画像処理部6により生成された連続する複数のフレーム(画像)を符号化して、連続する複数のピクチャ(符号化された画像)からなる符号化データを生成する。この符号化手段11は、図3に示すように、符号化手段11は、差分演算部111、DCT部112、量子化部113、逆量子化部114、IDCT部115、加算演算部116、デブロッキングフィルタ117、動き補償予測部118、フレームメモリ119、動き検出部120、イントラ予測部121、スイッチ122および符号化データ出力部123を備えている。このような構成を有する符号化手段11による画像符号化処理動作の詳細については後述する。
復号化手段12は、外部I/F部4を介して他の端末装置2から受信した符号化データを復号化して画像データを生成する。この復号化手段12は、図4に示すように、選択部150、復号化部131、逆量子化部132、IDCT部133、加算演算部134、デブロッキングフィルタ135、フレームメモリ136、動き補償予測部137、イントラ予測部138およびスイッチ139を備えている。このような復号化手段12は、TV会議システムのように同時に複数の端末装置2と符号化データのやりとりを行う場合、相手先の端末装置2毎に設けられる。なお、復号化手段12による復号化処理動作の詳細については後述する。
TV会議手段13は、通信回線3および外部I/F部4を介して他の端末装置2と符号化データおよび音声データをやりとりすることにより、TV会議システムを実現するものである。具体的には、まず、サーバ1の呼制御の結果、TV会議に使用される端末装置2の数量に応じて、復号化手段12の数量を設定する。また、符号化手段11により生成された符号化データおよび音声処理部7により生成された音声データを、他の端末装置2それぞれに送信させる。また、他の端末装置2から受信した音声データを、音声処理部7によりスピーカ7bから出力させる。また、他の各端末装置2から受信した符号化データを、それぞれ対応する復号化手段12により復号化させ、生成された各フレームを画像処理部6によりモニタ6b上の所定の位置およびサイズで同時に表示させる。例えば、図5に示すように、発言しているユーザの端末装置2から動画像は、符号xで示すように画面の中央に大きく表示させ、他のユーザの端末装置2からの動画像は、符号yで示すように小さく表示させるようにしてもよい。このようにすることにより、他の端末装置2のユーザと、それぞれの動画像を見ながらそれぞれと会話を行うことができる。
[符号化処理動作]
次に、図3を参照して符号化手段11による符号化処理動作について説明する。この符号化は、イントラ予測符号化および動き補償予測符号化の2種類がある。これらは、スイッチ122によって切り替えがなされる。ここではまず始めにイントラ予測符号化について説明する。
(イントラ予測符号化)
イントラ予測符号化とは、基本的には1枚のフレーム内において圧縮符号化を行うものである。具体的には、画像処理部6から入力されたフレームは、DCT部112に入力されて周波数変換されたのち、量子化部113で量子化され、符号化データ出力部123で可変長符号化が施される。これにより、Iピクチャが出力される。
なお、量子化部113から出力される残差データは、逆量子化部114およびIDCT部115により逆量子化および逆周波数変換が順次施され、デブロッキングフィルタ117により符号化を行う際に生じたブロック歪を緩和するための処理が行われたのち、再構成画像データとしてフレームメモリ119に格納される。
(動き補償予測符号化)
動き補償予測符号化とは、基本的には他のフレーム(参照フレーム)からの変化を符号化するものである。具体的には、画像処理部6からフレームが入力されると、動き検出部120は、入力されたフレームとフレームメモリ119に格納された再構成画像データとに基づいて、動きベクトルを検出する。動き補償予測部118は、動きベクトルとフレームメモリ119に格納された再構成画像データとに基づいて、予測画像データを生成する。差分演算部111は、入力されたフレームと予測画像データとの差分をとり、差分画像データを生成する。この差分画像データは、DCT部112に入力されて周波数変換されたのち、符号化データ出力部123で可変長符号化が施される。これにより、PピクチャやBピクチャが出力される。
なお、量子化部113から出力される残差データは、逆量子化部114およびIDCT部115により逆量子化および逆周波数変換が順次施され、加算演算部116により予測画像データが加算され、デブロッキングフィルタ117により符号化を行う際に生じたブロック歪を緩和するための処理が行われたのち、再構成画像データとしてフレームメモリ119に格納される。
上述したようなH.264規格に基づいて生成された符号化データは、一般にNALユニットと呼ばれる構成を有する。このNALユニットは、図6に示すように、NALヘッダとRBSP(Raw Byte Sequence Payload)とから構成される。NALヘッダは、固定ビットと、参照ピクチャかであるか否かを示すフラグからなるnal_ref_idoと、NALユニットの種類を示す識別子からなるnal_unit_typeとから構成される。また、RBAPは、圧縮データからなるスライスデータと、このスライスデータに関するヘッダ情報からなるスライスヘッダとから構成される。このスライスヘッダは、参照ピクチャが何れのピクチャであるかを識別することができる。
[復号化処理動作]
次に、図4を参照して復号化手段12による符号化データの復号化処理動作について説明する。
まず、入力された符号化データは、選択部150の判別手段152により所定の条件により各ピクチャが判別され、この判別結果に基づいて出力手段151により復号化されるピクチャのみが選択的に出力される。このような選択部150によるピクチャの選択動作の詳細については後述する。
選択されたピクチャに対する復号化は、イントラ予測復号化および動き補償予測復号化の2種類がある。これらは、スイッチ139によって切り替えがなされる。ここではまず始めにイントラ予測復号化について説明する。
(イントラ予測復号化)
イントラ予測復号化は、Iピクチャのみから元のフレームを復元するものである。選択部150により選択されたピクチャは、復号化部131により可変長変換され、逆量子化部132およびIDCT部133により逆量子化と逆周波数変換が順次施されたのち、デブロッキングフィルタ135により復号化を行う際に生じたブロック歪みが緩和され、フレームとして出力される。このフレームは、フレームメモリ136にも格納される。このようにIピクチャは、他のピクチャを参照することなく復号化される。
(動き補償予測復号化)
次に、動き補償予測復号化について説明する。この動き補償予測復号化は、参照ピクチャと動きベクトルから元のフレームを復元するものである。選択部150からピクチャが入力されると、このピクチャは、復号化部131により可変長変換され、逆量子化部132およびIDCT部133により逆量子化と逆周波数変換が順次施され、残差復号化データとして出力される。このとき、動き補償予測部137では、フレームメモリ136に格納されたフレームに基づいて予測画像データが生成される。上述したように生成された残差符号化データと予測画像データとは、加算演算部134により加算され、デブロッキングフィルタ135により復号化を行う際に生じたブロック歪みが緩和されることにより、フレームとして出力される。このフレームは、フレームメモリ136にも格納される。
[ピクチャ選択動作]
次に、図7〜図10を参照して、選択部150による復号化するピクチャの選択動作について説明する。
まず、選択部150は、符号化データが入力されると(ステップS1)、判別手段152により各ピクチャについて復号化するか否かを以下の手順で順次判別する。
判別手段152は、Iピクチャ判別手段152aにより、入力されたピクチャ(以下、「入力ピクチャ」という)がIピクチャであるか否かを判別する(ステップS2)。この判別は、図6を参照して説明したNALユニットにおけるNALヘッダのnal_unit_typeを参照することにより行われる。
入力ピクチャがIピクチャである場合(ステップS2:YES)、Iピクチャ判別手段152aは、その入力ピクチャを復号化するピクチャとして選択し、出力手段151から出力させる(ステップS6)。その結果、本実施の形態では、Iピクチャは全て復号化される。
一例として、図8に示す符号a〜lの連続するピクチャから構成される符号化データに対して、選択部150により行われる選択動作ついて説明する。なお、図8において、矩形の中に示す文字は各ピクチャの種類を表し、矢印は各ピクチャが参照する参照ピクチャを示している。例えば、符号bのピクチャは、Pピクチャであって、符号aのIピクチャを参照していることを意味する。
図8の符号化データの場合、符号aのピクチャと符号gのピクチャがIピクチャである。したがって、Iピクチャ判別手段152aは、符号aと符号gのピクチャを符号化するピクチャとして選択し、出力手段151から出力させる。これにより、図9に示すように、符号aと符号gのピクチャに基づくフレームが生成される。なお、図9において、上段の矩形は図8に対応する符号化データの各ピクチャを、これらのピクチャと矢印でそれぞれ結ばれた下段の矩形は復号化手段13から出力されるフレームを表しており、人の絵のフレームは復号すると選択されたピクチャに対応するフレーム、「×」が記されたフレームは破棄すると選択されたピクチャに対応するフレームを意味する。
一方、入力ピクチャがIピクチャではない場合(ステップS2:NO)、判別手段152は、所定ピクチャ判別手段152bにより入力ピクチャより前の所定の位置に存在するピクチャが復号化されているか否かを判別する(ステップS3)。所定ピクチャ判別手段152bは、フレームメモリ136を参照して、入力ピクチャより先に入力されたピクチャ(本実施の形態では直前に存在したピクチャ)が復号化されたか否かを判別する。
直前のピクチャが復号化されている場合(ステップS3:YES)、所定ピクチャ判別手段152bは、入力ピクチャを復号化するピクチャとして選択しない、すなわち破棄するピクチャとして選択し、出力手段151から出力させない(ステップS5)。このように直前のピクチャが復号化されているのであれば、当該ピクチャの直後のピクチャを破棄したとしても、人間の目には、その違いがほとんど感じられないものと考えられる。したがって、本実施の形態では、直前のピクチャが復号化されている場合、入力ピクチャを破棄することにより、画質の低下を抑えながら、復号化するピクチャの数量を減少させることができるので、端末装置2の演算負荷を低減させることができる。
例えば、図8の符号bや符号hのピクチャは、直前のピクチャ、すなわち符号aまたは符号gのピクチャが復号化されている。したがって、所定ピクチャ判別手段152bは、符号bと符号hのピクチャを破棄するピクチャとして選択し、出力手段151から出力させない。これにより、図9に示すように、符号bと符号hのピクチャに基づくフレームが生成されない。
直前のピクチャが復号化されていない場合(ステップS3:NO)、判別手段152は、参照ピクチャ判別手段152cにより入力ピクチャが参照しているピクチャ(以下、「参照ピクチャ」という)が復号化されているか否かを判別する(ステップS4)。上述したように、図6に示すNALユニットのRBSPのスライスヘッダには、入力ピクチャの参照ピクチャが何れのピクチャであるかを示す情報が含まれている。したがって、参照ピクチャ判別手段152cは、RBSPのスライスヘッダから入力ピクチャの参照ピクチャを特定し、フレームメモリ136から当該参照ピクチャを検索することにより、入力ピクチャの参照ピクチャが符号化されたか否かを判別する。
参照ピクチャが復号化されている場合(ステップS4:YES)、参照ピクチャ判別手段152cは、その入力ピクチャを復号化するピクチャとして選択し、出力手段151から出力させる(ステップS6)。一方、参照ピクチャが復号化されていない場合(ステップS4:NO)、参照ピクチャ判別手段152cは、入力ピクチャを復号化するピクチャとして選択しない、すなわち破棄するピクチャとして選択し、出力手段151から出力させない(ステップS5)。参照するピクチャが破棄されていると、入力ピクチャを十分な品質で復号化することができない上に、演算負荷が大きくなる。このため、本実施の形態では、参照するピクチャが破棄されている場合には、入力ピクチャを破棄することにより、端末装置2の演算負荷を低減させることができる。
例えば、図8に示す符号dのピクチャは、直前のピクチャが復号化されていないが、参照する符号aのピクチャが復号化されている。したがって、参照ピクチャ判別手段152cは、符号dのピクチャを復号化するピクチャとして選択し、出力手段151から出力させる。一方、符号cのピクチャは、直前のピクチャが復号化されていないとともに、参照するピクチャである符号bのピクチャが復号化されていない。したがって、参照ピクチャ判別手段152cは、符号cのピクチャを破棄するピクチャとして選択し、出力手段151から出力させない。これにより、図9に示すように、符号dのピクチャに基づくフレームが生成される一方、符号cのピクチャに基づくフレームが生成されない。
このような選択動作によって選択部150から出力されたピクチャは、復号化部131に入力されて復号化手段12の各構成要素によって復号化されることにより、最終的にフレームとして出力される。ここで、図8に示す復号化データに対する選択部150による選択結果をまとめると、図9および以下に示す通りとなる。
符号aのピクチャは、ステップS2によりIピクチャであると判別されるので、出力手段151から出力され、復号化される。
符号bのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
符号cのピクチャは、ステップS4により参照しているピクチャが復号化されていないと判別されるので、出力手段151から出力されない、すなわち破棄される。
符号dのピクチャは、ステップS4により参照しているピクチャが復号化されていると判別されるので、出力手段151から出力され、復号化される。
符号eのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
符号fのピクチャは、ステップS4により参照しているピクチャが復号化されていると判別されるので、出力手段151から出力され、復号化される。
符号gのピクチャは、ステップS2によりIピクチャであると判別されるので、復号化される。
符号hのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
符号iのピクチャは、ステップS4により参照しているピクチャが復号化されていると判別されるので、出力手段151から出力され、復号化される。
符号jのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
符号kのピクチャは、ステップS4により参照しているピクチャが復号化されていると判別されるので、出力手段151から出力され、復号化される。
符号lのピクチャは、ステップS3により直前のピクチャが復号化されていると判別されるので、出力手段151から出力されない、すなわち破棄される。
このように、符号a〜lで示すピクチャから構成される符号化データに対して選択部150により選択動作が行われると、符号a,d,f,g,i,kのピクチャのみが復号化される。これにより、復号化されるピクチャの数量が減少するので、端末装置2の演算負荷を低減させることができる。また、Iピクチャのみならず、符号d,f,i,kのPピクチャも復号化されるため、Iピクチャのみを復号化する場合よりも画質を向上させることができる。さらに、参照するピクチャが存在しない符号cが復号化されないので、画質の低下を防ぐことができるとともに、演算負荷を低減させることができる。
図9に示すような選択部150による選択結果が出力され、選択されたピクチャに対して復号化手段12により復号化が行われると、復号化手段12のフレームメモリ136には、図10(a)〜(f)に示すようにフレームが格納される。なお、図10において、符号gのフレームに対応するピクチャはIDR(Instantaneous Decoding Refresh)ピクチャであるものとする。
すなわち、図10(a)〜(c)に示すように、選択部150により符号a,d,fのピクチャが復号化するピクチャとして選択されると、復号化手段12の他の構成要素により各ピクチャが順次復号化され、対応するフレームがフレームメモリ136に格納される。
しかしながら、選択部150により符号gのピクチャが復号化するピクチャとして選択されると、その符号gのピクチャはIDR(Instantaneous Decoding Refresh)ピクチャであるため、フレームメモリ136から符号a,d,fのフレームがクリアされ、符号gのフレームのみが格納される。
次いで、選択部150により符号g,iのピクチャが復号化するピクチャとして選択されると、復号化手段12の他の構成要素により順次復号化され、対応するフレームが符号gのフレームとともにフレームメモリ136に格納される。
このように、選択部150により選択されたピクチャのみが復号化されるので、フレームメモリ136に格納するピクチャの数量を減らすことができる。これにより、復号化手段12、特にデブロッキングフィルタ135や動き補償予測部137の動作を低減させることが可能となり、結果として、端末装置2の演算負荷を低減させることができる。また、このようなフレームメモリ136を参照することにより、判別手段152の所定ピクチャ判別手段152bおよび参照ピクチャ判別手段152cの動作を実現することができる。
以上説明したように、本実施の形態によれば、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、当該他のピクチャが復号化されていれば当該ピクチャを出力しないことにより、復号化に伴う演算負荷を低減させることができる。また、Iピクチャ以外のピクチャを復号化することが可能となるので、結果として、画質を向上させることができる。
TV会議システムのように同時に複数の端末装置2と符号化データのやりとりを行う場合、復号化手段12は、通信相手となる端末装置2毎に設けられる。復号化手段12は、CPUがプログラム8bを読み込んで実行することにより実現されるものなので、相手先の端末装置2の数量が増えるのに伴って復号化手段12の数量も増えるため、CPUの演算負荷も増大することとなる。このため、本実施の形態では、受信した符号化データの中から選択部150により所定のピクチャのみを選択的に復号化させることにより、各復号化手段12の処理を減らすことが可能となり、結果として、端末装置2のCPUの演算負荷を低減させることができる。
なお、本実施の形態において、例えば図8,図9等に示したように符号化データがIピクチャとPピクチャとから構成されるものとして説明したが、符号化データがIピクチャ、PピクチャおよびBピクチャから構成されていてもよいことは言うまでもない。この場合、例えば、Bピクチャについても先に入力された所定のピクチャおよび参照ピクチャが復号化されているか否かに基づいて復号化するか否かを決定することにより、端末装置2の演算負荷を低減させるとともに、動画像の画質を向上させることができる。
また、本実施の形態において、所定ピクチャ判別手段152bは、入力ピクチャの直前のピクチャが復号化されているか否かを識別するようにしたが、識別するピクチャはこれに限定されず、例えば、所定数前のピクチャや所定数前から直前までのピクチャなど適宜自由に設定することができる。
また、図5において、符号xで示す表示面積が大きな動画像を再生する端末装置2からの符号データについては、全てのピクチャを復号化するようにしてもよい。復号化したフレームを大きな表示面積で表示させる符号化データと、復号化したフレームを小さな表示面積で表示させる符号化データとを、同じ条件で復号化するピクチャを選択すると、表示面積が大きい方が表示面積が小さい方よりも画質が低いと感じることがある。このため、表示面積が大きい符号化データについては、全てのピクチャを復号化させる。これにより、ユーザ体感品質を向上させることができる。このとき、表示面積が小さい符号化データについては、上述したような方法により、復号化させるピクチャを選択させる。これにより、端末装置2の演算負荷を低減させることができる。
また、復号化手段12から出力されるフレームに基づく動画像は、符号化データのピクチャ全てを復号化した画像データに基づく動画像のフレームレートと同じフレームレートで再生されるようにしてもよい。この場合、破棄されたピクチャに対応するフレームには、このフレームの前に正常に再生されたフレームを表示し続けるようにすればよい。これにより、動画像を円滑に再生することができる。
本発明は、符号化されたデータを復号化する各種装置に適用することができる。
本発明に係るTV会議システムの構成を示す模式的に示す図である。 端末装置の構成を示すブロック図である。 符号化手段の構成を示すブロック図である。 復号化手段の構成を示すブロック図である。 TV会議システムにおける端末装置のモニタの表示例を示す図である。 NALユニットの構成を模式的に示す図である。 復号化するピクチャの選択動作を示すフローチャートである。 復号化データの一例を模式的に示す図である。 図8の復号化データに対する復号化するピクチャの選択動作の結果を模式的に示す図である。 (a)〜(f)は、図9の選択結果により復号化されたピクチャを格納したフレームメモリの状態を模式的に示す図である。
符号の説明
1…サーバ、2,2a,2b,2n…端末装置、3…通信回線、4…外部I/F部、5…操作入力部、6…画像処理部、6a…カメラ、6b…モニタ、7…音声処理部、7a…マイク、7b…スピーカ、8…記憶部、8a…制御データ、8b…プログラム、9…制御部、11…符号化手段、12…復号化手段、13…TV会議手段、111…差分演算部、112…DCT部、113…量子化部、114…逆量子化部、115…IDCT部、116…加算演算部、117…デブロッキングフィルタ、118…動き補償予測部、119…フレームメモリ、120…動き検出部、121…イントラ予測部、122…スイッチ、123…符号化データ出力部、131…復号化部、132…逆量子化部、133…IDCT部、134…加算演算部、135…デブロッキングフィルタ、136…フレームメモリ、137…動き補償予測部、138…イントラ予測部、139…スイッチ、150…選択部、151…出力手段、152…判別手段、152a…Iピクチャ判別手段、152b…所定ピクチャ判別手段、152c…参照ピクチャ判別手段。

Claims (4)

  1. 符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力しない選択手段と、
    この選択手段から出力されたピクチャを復号化する復号化手段と
    を備えることを特徴とする情報処理装置。
  2. 符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力せず、前記他のピクチャが復号化されていなければ、当該ピクチャが参照すべき参照ピクチャが復号化されているか否かを判別し、前記参照ピクチャが復号化されていれば当該ピクチャを出力し、前記参照ピクチャが復号化されていなければ当該ピクチャを出力しない選択手段と、
    この選択手段から出力されたピクチャを復号化する復号化手段と
    を備えたことを特徴とする情報処理装置。
  3. 符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力しない選択ステップと、
    この選択ステップにより出力されたピクチャを復号化する復号化ステップと
    を有することを特徴とする情報処理方法。
  4. 符号化された連続する複数のピクチャを含む符号化データを入力とし、入力されたピクチャがIピクチャであるか否かを判別し、当該ピクチャがIピクチャである場合には当該ピクチャを出力する一方、当該ピクチャがIピクチャではない場合、当該ピクチャより先に入力された所定の他のピクチャが復号化されているか否かを判別し、前記他のピクチャが復号化されていれば当該ピクチャを出力せず、前記他のピクチャが復号化されていなければ、当該ピクチャが参照すべき参照ピクチャが復号化されているか否かを判別し、前記参照ピクチャが復号化されていれば当該ピクチャを出力し、前記参照ピクチャが復号化されていなければ当該ピクチャを出力しない選択ステップと、
    この選択ステップにより出力されたピクチャを復号化する復号化ステップと
    を有することを特徴とする情報処理方法。
JP2007029460A 2007-02-08 2007-02-08 情報処理装置および情報処理方法 Active JP4735558B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007029460A JP4735558B2 (ja) 2007-02-08 2007-02-08 情報処理装置および情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007029460A JP4735558B2 (ja) 2007-02-08 2007-02-08 情報処理装置および情報処理方法

Publications (2)

Publication Number Publication Date
JP2008199109A true JP2008199109A (ja) 2008-08-28
JP4735558B2 JP4735558B2 (ja) 2011-07-27

Family

ID=39757697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007029460A Active JP4735558B2 (ja) 2007-02-08 2007-02-08 情報処理装置および情報処理方法

Country Status (1)

Country Link
JP (1) JP4735558B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002218472A (ja) * 2001-01-23 2002-08-02 Victor Co Of Japan Ltd 可変画像レート復号化装置及び可変画像レート復号化方法
JP2002262295A (ja) * 2001-02-28 2002-09-13 Victor Co Of Japan Ltd 動画像復号装置及び動画像符号化装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002218472A (ja) * 2001-01-23 2002-08-02 Victor Co Of Japan Ltd 可変画像レート復号化装置及び可変画像レート復号化方法
JP2002262295A (ja) * 2001-02-28 2002-09-13 Victor Co Of Japan Ltd 動画像復号装置及び動画像符号化装置

Also Published As

Publication number Publication date
JP4735558B2 (ja) 2011-07-27

Similar Documents

Publication Publication Date Title
JP4755093B2 (ja) 画像符号化方法および画像符号化装置
JP4991699B2 (ja) ビデオ信号のスケーラブルなエンコーディング方法およびデコーディング方法
JP4560134B1 (ja) 動画像復号化方法および動画像復号化装置
US9414086B2 (en) Partial frame utilization in video codecs
US20020122491A1 (en) Video decoder architecture and method for using same
KR20060027779A (ko) 영상 블록의 시간상 및 공간상 상관관계를 이용한영상신호의 엔코딩 및 디코딩 방법과 장치
JP5137687B2 (ja) 復号装置及び復号方法、プログラム
EP4165830A1 (en) Method and apparatus for audio mixing
JP4284265B2 (ja) 動画像符号化装置、動画像符号化方法、動画像復号化装置および動画像復号化方法
JP2007266748A (ja) 符号化方法
JP2016184894A (ja) 動画像符号化装置、動画像符号化方法、動画像復号装置、及び動画像復号方法
JP4735558B2 (ja) 情報処理装置および情報処理方法
US8312499B2 (en) Tunneling information in compressed audio and/or video bit streams
JP2005341347A (ja) 多地点接続装置および方法
JP4909592B2 (ja) 動画像再生方法及び装置並びにプログラム
JP2008227937A (ja) 情報処理装置および情報処理方法
JP2008211294A (ja) 符号化装置および符号化方法
JPH07336681A (ja) 画像変換装置
JP5421739B2 (ja) 動画像符号化装置、動画像復号化装置、および、動画像符号化方法
JPH10145760A (ja) 画像通信装置
US20060072675A1 (en) Method for encoding and decoding video signals
JP2002118850A (ja) 動画像符号化方法、動画像復号化方法、動画像符号化装置および動画像復号化装置
JP2011176700A (ja) 画像符号化装置および画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110411

R150 Certificate of patent or registration of utility model

Ref document number: 4735558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140513

Year of fee payment: 3