WO2010150470A1

WO2010150470A1 - 動画像符号化方法、動画像符号化装置、プログラム、および集積回路

Info

Publication number: WO2010150470A1
Application number: PCT/JP2010/003812
Authority: WO
Inventors: 佐藤真一; 角野眞也
Original assignee: パナソニック株式会社
Priority date: 2009-06-23
Filing date: 2010-06-08
Publication date: 2010-12-29
Also published as: CN102138327A; CN102138327B; JP5479470B2; US20110164679A1; JPWO2010150470A1; US8559503B2

Abstract

　動画像符号化方法は、入力画像の符号化の困難さの程度に応じて、入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換ステップ（Ｓ１１）と、画像変換ステップで出力される符号化対象画像を符号化し、符号化ビットストリームを伝送路上に送出する動画像符号化ステップ（Ｓ１２）と、伝送路上に送出される符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定ステップ（Ｓ１３）と、ビットレート決定ステップで決定された符号化ビットレートに応じて符号化対象画像の解像度の上限値を決定し、符号化対象画像の解像度が前記上限値を上回らないように画像変換ステップでの変更を制御する解像度範囲選択ステップ（Ｓ１４）とを含む。

Description

動画像符号化方法、動画像符号化装置、プログラム、および集積回路

　本発明は、画像符号化方法および画像符号化装置に関し、特に、ＭＰＥＧ（Ｍｏｖｉｎｇ　Ｐｉｃｔｕｒｅ　Ｅｘｐｅｒｔｓ　Ｇｒｏｕｐ）－４　ＡＶＣ方式、すなわちＩＴＵ－Ｔ　Ｈ．２６４方式にて、目標とするビットレートに応じて解像度とフレームレートとを適応的に切り換える画像符号化方法および画像符号化装置に関する。

　近年、音声、画像およびその他の画素値を統合的に扱うマルチメディア時代を迎え、従来の情報メディア、つまり新聞、雑誌、テレビ、ラジオおよび電話等の、情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形あるいは、音声、特に画像等を同時に関連づけて表すことをいう。上記従来の情報メディアをマルチメディアの対象とするには、その情報をデジタル形式にして表すことが必須条件となる。

　ところが、上記各情報メディアの持つ情報量をデジタル情報量として見積もってみると、文字の場合１文字当たりの情報量は１～２バイトである。それに対し、音声の場合は、１秒当たり６４Ｋｂｉｔｓ（電話品質）、さらに動画像の場合については、１秒当たり１００Ｍｂｉｔｓ（現行テレビ受信品質）以上の情報量が必要となる。それ故、上記情報メディアでその膨大な情報をデジタル形式でそのまま扱うことは現実的ではない。例えば、テレビ電話は、６４Ｋｂｉｔ／ｓ～１．５Ｍｂｉｔ／ｓの伝送速度を持つサービス総合デジタル網（ＩＳＤＮ：Ｉｎｔｅｇｒａｔｅｄ　Ｓｅｒｖｉｃｅｓ　Ｄｉｇｉｔａｌ　Ｎｅｔｗｏｒｋ）によって実用化されている。しかし、テレビ・カメラの映像をそのままのデジタル情報量でＩＳＤＮにて送ることは不可能である。

　そこで、必要となってくるのが情報の圧縮技術である。例えば、テレビ電話の場合、ＩＴＵ－Ｔ（国際電気通信連合　電気通信標準化部門）によって勧告されたＨ．２６１あるいはＨ．２６３規格の動画圧縮技術が用いられている。また、ＭＰＥＧ－１規格の情報圧縮技術では、通常の音楽用ＣＤ（コンパクト・ディスク）に音声情報とともに画像情報を入れることも可能となる。

　ここで、ＭＰＥＧ（Ｍｏｖｉｎｇ　Ｐｉｃｔｕｒｅ　Ｅｘｐｅｒｔｓ　Ｇｒｏｕｐ）とは、ＩＳＯ／ＩＥＣ（国際標準化機構　国際電気標準会議）によって標準化された動画像信号圧縮の国際規格である。ＭＰＥＧ－１は、動画像信号を１．５Ｍｂｉｔ／ｓまで、つまりテレビ信号の情報を約１００分の１にまで圧縮する規格である。また、ＭＰＥＧ－１規格では、対象とする品質を中程度の品質、すなわち伝送速度が主として約１．５Ｍｂｉｔ／ｓで実現できる程度の品質としたことに基づいて、さらに高画質化の要求を満たすべくＭＰＥＧ－２が規格化された。ＭＰＥＧ－２では、動画像信号を２～１５Ｍｂｉｔ／ｓでＴＶ放送品質を実現する。

　さらに、現状では、ＭＰＥＧ－１、ＭＰＥＧ－２と標準化を進めてきた作業グループ（ＩＳＯ／ＩＥＣ　ＪＴＣ１／ＳＣ２９／ＷＧ１１）によって、ＭＰＥＧ－１、ＭＰＥＧ－２を上回る圧縮率を達成し、さらに物体単位で符号化、復号化、および操作を可能とし、マルチメディア時代に必要な新しい機能を実現するＭＰＥＧ－４が規格化された。ＭＰＥＧ－４は、ＭＰＥＧ－１、およびＭＰＥＧ－２を上回る圧縮率を達成し、さらに物体単位で符号化、復号化および操作を可能とする。

　このＭＰＥＧ－４では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、インタレース画像も含む高ビットレートの符号化方法も含む、より汎用的な符号化に拡張された。さらに、現在は、ＩＳＯ／ＩＥＣとＩＴＵ－Ｔとによって共同で、より高圧縮率の画像符号化方式として、ＭＰＥＧ－４　ＡＶＣ（ＩＴＵ－Ｔ　Ｈ．２６４）が規格化された。

　画像信号は、同じ時刻の画素の集合であるピクチャ（フレームまたはフィールドとも呼ばれる）が連続したものであると考えることができる。また、画素は、ピクチャ内での近傍画素との相関が強いことに基づいて、ピクチャ内の画素の相関を利用した圧縮が行われる。さらに、連続するピクチャ間では、画素の相関も強いことに基づいて、ピクチャ間の画素の相関を利用した圧縮も行われる。

　ここで、ピクチャ間の画素の相関とピクチャ内の画素の相関とを利用した圧縮をインター符号化と呼ぶ。そして、ピクチャ間の画素の相関を用いず、ピクチャ内の画素の相関のみを利用した圧縮をイントラ符号化と呼ぶ。このインター符号化は、ピクチャ間の相関を利用しているので、イントラ符号化よりも高い圧縮率を実現できる。

　また、ＭＰＥＧ－１、ＭＰＥＧ－２、ＭＰＥＧ－４、ＭＰＥＧ－４　ＡＶＣ（Ｈ．２６４）では、２次元の矩形領域の、画素の集合であるブロック（もしくは、複数のブロックをまとめた上位概念ブロックであるマクロブロック）を構成し、ブロック単位でイントラ符号化とインター符号化とを切り換えることができる。

　一方、近年は、ＡＤＳＬまたは光ファイバを用いた高速ネットワーク環境が普及している。これにより、一般家庭でも数Ｍｂｉｔ／ｓを越えるビットレートで送受信が可能となっている。さらに、今後数年で数十Ｍｂｉｔ／ｓでの送受信が可能になる見込みである。

　その結果、上記の画像符号化技術を用いることで、専用回線を用いた企業だけでなく、一般家庭でもＴＶ放送品質およびＨＤＴＶ放送品質のＴＶ電話およびＴＶ会議システムの導入が進むと予想される。

　さて、ＡＤＳＬまたは光ファイバを用いた高速ネットワークは、企業向けの高価な帯域保証型専用ネットワークではなく、複数のユーザが共同で使用する安価なベストエフォート型ネットワークである。ベストエフォート型ネットワークでは、各ユーザがその時刻に使用しているビットレートの和の上限値が決まっている。このため、使用するユーザ数が多い時刻はユーザあたりの使用可能なビットレートが低くなり、使用するユーザ数が少ない時刻はユーザあたりの使用可能なビットレートが高くなる。つまり、時刻によって使用可能なビットレートが大きく変換する特徴がある。

　また、動画像には、単一色のベタ画像（画面全てが同じ色で同じ明るさの画像）のように非常に圧縮が容易な画像がある。一方で、ホワイトノイズのように、画素間の相関が全くなく、非常に圧縮が困難な画像がある。このように、圧縮の容易さが大きく異なる動画像に対しても、大きな画質劣化がなく安定した画像符号化を行えることが重要である。

　従来の画像符号化装置においては、圧縮が困難な動画像を符号化する場合には、予め画像の解像度を低い解像度に変換して符号化する画素数を少なくしてから符号化している（特許文献１）。

　図２４は、従来の動画像符号化装置の説明図である。図２４の左側列は、これから符号化を行う符号化対象画像の画像サイズ（解像度）であり、実際に符号化されている解像度を示している。一方、図２４の右側列は、対応する符号化対象画像を復号した後に画像サイズを拡大し表示装置で表示される表示画像サイズを示している。

　ここで、符号化対象画像には、圧縮が比較的容易な画像と、比較的難しい画像とが存在する。圧縮が容易な動画像の場合（図２４の上段）は、符号化対象画像の解像度を変更せずに符号化し、さらに画像復号装置で復号して得られる表示画像をそのままの解像度で表示している。

　一方、圧縮が困難な動画像の場合は、符号化対象画像の画素数（解像度）を縦横それぞれ、３／４倍（図２４の中段）もしくは１／２倍（図２４の下段）に小さくし、少ない画素数（小さな解像度）の符号化対象画像を符号化する。さらに、画像復号装置で復号した表示画像は、縦横それぞれ４／３倍もしくは２倍に解像度を拡大し、もとの動画像と同じ画素数（解像度）で表示する。

　少ない画素数（解像度）で符号化することで、圧縮が困難な画像を符号化しても大幅な画質劣化となることを防止できる。しかしながら、表示の際に小さな画素数の画像を大きな画素数の画像に拡大しても、符号化されている画素数である少ない画素数で表現できる精細さ（緻密さ）以上を表現できないため、等倍のまま符号化した画像よりもぼけた画像になる。

　また、圧縮が困難な画像に対して、解像度を変更するだけでなく、符号化対象画像の単位時間あたりのフレーム数である動画像のフレームレート、およびブロック単位の符号化の量子化ステップを制御する方法がある。

　図２５は、解像度、フレームレート、および量子化ステップの動的変更を伴う従来の画像符号化装置を示すブロック図である。従来の画像符号化装置は、図２５に示されるように、解像度変更回路５０１と、フレームレート変更回路５０２と、動画像符号化回路５０３と、量子化ステップ制御回路５０６と、フレームレート制御回路５０７と、解像度設定回路５０８とを主に備える。

　解像度設定回路５０８は、特許文献１のように画像の圧縮の困難さに応じて符号化する解像度を決定し、符号化する画像の解像度を解像度信号Ｓ６４として解像度変更回路５０１に通知する。解像度変更回路５０１は、動画入力端子５００から所定の解像度で入力した動画信号Ｓ６０を解像度設定回路５０８から通知された解像度に変換する。

　フレームレート制御回路５０７は、符号化する画像のフレームレートをフレームレート信号Ｓ６７としてフレームレート変更回路５０２に通知する。フレームレート変更回路５０２は、解像度が変更された動画信号Ｓ６１のフレームレートをフレームレート制御回路５０７から通知されたフレームレートに変更する。

　量子化ステップ制御回路５０６は、動画像符号化回路５０３で量子化する量子化ステップを量子化ステップ信号Ｓ６６として動画像符号化回路５０３に通知する。動画像符号化回路５０３は、フレームレートが変更された動画信号Ｓ６２を量子化ステップ制御回路５０６から通知された量子化ステップで量子化して符号化し、ビットストリームＳ６３をビットストリーム出力端子５０４に出力する。

　量子化ステップ制御回路５０６では、目標とする符号化ビットレートと、動画像符号化回路５０３が出力したビットストリームＳ６３の符号量と、フレームレート信号Ｓ６４の値とに基づいて量子化ステップを決定する。また、フレームレート制御回路５０７は、量子化ステップ制御回路５０６で決定された量子化ステップ信号Ｓ６６の値に応じてフレームレートを決定する。

　このような構成において、解像度は、画像の圧縮の困難さに応じて解像度設定回路５０８によって決定される。また、解像度変更後の画像の、圧縮の困難さの程度が変化した場合には、フレームレートと量子化ステップとが動的に制御されて、目標のビットレートとなるよう動作する。

特開２００１－１６０９６９号公報

　しかしながら、上記の従来の構成では、入力画像の圧縮の困難さの程度が大きく変化した場合に、特に低ビットレートで画質が大幅に劣化する課題があった。

　圧縮が非常に容易な場合またはインター符号化を用いて符号化する静止画像の場合には、非常に低いビットレートで符号化できるため、解像度設定回路５０８で最大解像度とするよう解像度変更回路５０１に通知する。一方、低ビットレートでは少し圧縮が難しい画像（人物または物体が動く）になるだけで、量子化ステップが大きくなりボケまたはブロック歪みが発生する。また、フレーム間引きを大きくしてフレームレートを低下させたとしても、残りのフレーム間の相関が小さくなるのでフレーム間引きによる圧縮効果が小さくなる。その結果、極端なコマ送り状になるため、解像度を低くしなければ見苦しい映像となってしまうことがあった。

　圧縮の難しさの小さな変化（動きのわずかな変化）で頻繁に解像度を切り換えると、このような、ブロック歪またはコマ送り状になる画質劣化は防止できる。しかしながら、圧縮の難しさの小さな変化で頻繁に解像度を切り換えると、頻繁な解像度の切り換えに起因する、頻繁なボケ度合いの変化が、画質劣化として目立ってしまう。

　ベストエフォート型のインターネットでは、混雑してくると伝送可能なビットレートが時刻によって大きく変動する（数分の１のビットレートになる場合もある）。最近は、画像符号化装置でＴＶ会議またはＴＶ電話を行いつつ、ＰＣ（パーソナル・コンピュータ）で作業することも多い。

　接続中にＰＣから同じネットワーク経由でファイルをダウンロードしたり、サーバのファイルを閲覧・編集したりすると、画像符号化装置で使用可能なビットレートが急激に小さくなる。このようなＰＣ操作を中断した途端にビットレートが大きくなる等の急激な変化が起きる状況が多くなっている。

　このように、伝送可能なビットレートが変動する状況では、画像の内容に依存する圧縮の困難さ以外に、ビットレートにも連動して頻繁に解像度が切り替わることになり、見苦しい画質劣化となる。

　本発明は、このように従来の課題を解決するものであり、入力動画像の圧縮の困難さの程度、または目標とする符号化ビットレートが大きく変化しても、違和感のない画質で画像の符号化を可能にする動画像符号化方法を提供することを目的とする。

　本発明の一形態に係る動画像符号化方法は、入力画像を符号化して符号化ビットストリームを生成し、当該符号化ビットストリームを伝送路上に送出する。具体的には、前記入力画像の符号化の困難さの程度に応じて、前記入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換ステップと、前記画像変換ステップで出力される前記符号化対象画像を符号化して前記符号化ビットストリームを生成し、当該符号化ビットストリームを前記伝送路上に送出する動画像符号化ステップと、前記伝送路上に送出される前記符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定ステップと、前記ビットレート決定ステップで決定された前記符号化ビットレートに応じて前記符号化対象画像の解像度の上限値を決定し、前記符号化対象画像の解像度が前記上限値を上回らないように前記画像変換ステップでの変更を制御する解像度範囲選択ステップとを含む。

　上記構成によれば、入力画像の符号化の困難さの程度が急激に変化しても、解像度が大きく変更されることがない。特に、解像度が大きい状態で圧縮が困難な画像を低ビットレートで符号化することを防止できる。その結果、主観的な画質劣化を有効に防止することができる。

　さらに、前記解像度範囲選択ステップは、前記ビットレート決定ステップで決定された前記符号化ビットレートに応じて、前記符号化対象画像の解像度の下限値を決定し、前記符号化対象画像の解像度が前記下限値を下回らないように前記画像変換ステップでの変更を制御してもよい。

　また、前記解像度変換ステップでは、前記符号化対象画像の解像度を変更した後、所定の時間が経過するまで、および所定数の前記入力画像を処理するまでの少なくとも一方の条件を満たすまで、前記符号化対象画像の解像度を変更しないようにしてもよい。解像度変更直後の符号化対象画像は画面内予測を用いて符号化されるので、一時的に符号化効率が下がる。そこで、符号化効率が安定するのに要する所定の時間が経過するまで、および／または、所定数の入力画像（フレーム）を処理するまで、符号化対象画像の解像度を再び変更しないのが望ましい。

　また、前記符号化ビットレートは、送信機器と受信機器との間で実際に送受信できた符号化ビットストリーム量を計測して得られる前記伝送路の伝送可能ビットレートに基づいて決定してもよい。なお、実際に送受信できた符号量は、受信機器から送信機器に受信したデータ数、もしくは受信できなかったデータ数を通知することで取得できる。符号化ビットレートの決定方法は、これに限定されず、例えば、ユーザが指定した固定値としてもよい。

　さらに、該動画像符号化方法は、前記符号化ビットストリームが、前記ビットレート決定ステップで決定された前記符号化ビットレートで伝送可能な符号量となるような量子化ステップを算出し、算出した前記量子化ステップで前記動画像符号化ステップに前記符号化対象画像を量子化させる量子化ステップ算出ステップと、所定の時間内に前記量子化ステップ算出ステップで算出された前記量子化ステップの平均値である量子化ステップ平均値を算出する平均値算出ステップとを含んでもよい。同様に、前記画像変換ステップは、前記平均値算出ステップで算出された前記量子化ステップ平均値に基づいて前記入力画像の符号化の困難さの程度を判断し、前記符号化対象画像の解像度およびフレームレートを決定する画質決定ステップと、前記入力画像を前記画質決定ステップで決定された解像度に変更する解像度変更ステップと、前記入力画像を前記画質決定ステップで決定されたフレームレートに変更するフレームレート変更ステップとを含んでもよい。

　なお、「所定の時間内に算出された量子化ステップの平均値」とは、例えば、符号化対象画像の最初のフレームから現在までの平均値であってもよい。さらに、解像度を変更した後の所定期間は量子化ステップの値が不安定となるので、平均値の算出処理から除外してもよい。

　具体的には、前記画質決定ステップは、直前に決定された解像度より小さい第１の解像度および大きい第２の解像度の少なくとも一方を予め保持していてもよい。そして、前記平均値算出ステップで算出された前記量子化ステップ平均値が予め定めた第１の閾値より大きく、かつ保持している前記第１の解像度が前記下限値以上である場合に、前記解像度変更ステップに前記入力画像の解像度を前記第１の解像度に変更させ、前記平均値算出ステップで算出された前記量子化ステップ平均値が予め定めた第２の閾値より小さく、かつ保持している前記第２の解像度が前記上限値以下である場合に、前記解像度変更ステップに前記入力画像の解像度を前記第２の解像度に変更させてもよい。

　さらに、前記画質決定ステップは、直前に決定されたフレームレートより小さい第１のフレームレートおよび大きい第２のフレームレートの少なくとも一方を予め保持していてもよい。そして、前記解像度変更ステップで前記入力画像の解像度が前記第１の解像度に変更された場合に、前記フレームレート変更ステップに前記入力画像のフレームレートを前記第２のフレームレートに変更させ、前記解像度変更ステップで前記入力画像の解像度が前記第２の解像度に変更された場合に、前記フレームレート変更ステップに前記入力画像のフレームレートを前記第１のフレームレートに変更させてもよい。

　解像度は、フレームレートに比べて、符号化効率および画質への影響が大きい。そこで、解像度を小さくするのに合わせてフレームレートを大きくし、解像度を大きくするのに合わせてフレームレートを小さくすることにより、符号化効率および画質の急激な変動を抑制することができる。

　さらに、前記画質決定ステップは、直前に決定されたフレームレートより小さい第１のフレームレートおよび大きい第２のフレームレートの少なくとも一方を予め保持していてもよい。そして、前記平均値算出ステップで算出された前記量子化ステップ平均値が予め定めた第１の閾値より大きく、かつ保持している前記第１の解像度が前記下限値を下回る場合に、前記フレームレート変更ステップに前記入力画像のフレームレートを前記第１のフレームレートに変更させ、前記平均値算出ステップで算出された前記量子化ステップ平均値が予め定めた第２の閾値より小さく、かつ保持している前記第２の解像度が前記上限値を上回る場合に、前記フレームレート変更ステップに前記入力画像のフレームレートを前記第２のフレームレートに変更させてもよい。

　上記構成とすることにより、入力画像の困難さの程度を示す「量子化ステップの平均値」が変化した際に、上限値および下限値の範囲内で解像度を変更できると共に、解像度をこれ以上変更できない場合には、フレームレートを変更して調整することができる。

　なお、画像変換ステップにおいて「入力画像の符号化の困難さの程度」を判断するためのパラメータは、量子化ステップに限定されず、量子化ステップを導出するのに必要となる数値であれば、他の数値を使用してもよい。例えば、量子化パラメータを使用してもよい。または、量子化ステップは、周波数成分毎に異なる、複数の数値のセットである。そして、量子化ステップ算出ステップは、このセットを、倍率を変えて複数保持している（例えば、３２セット）。そこで、この倍率に相当する数値を「入力画像の符号化の困難さの程度」を判断するパラメータとして使用してもよい。

　本発明の一形態に係る動画像符号化装置は、入力画像を符号化して符号化ビットストリームを生成し、当該符号化ビットストリームを伝送路上に送出する。具体的には、前記入力画像の符号化の困難さの程度に応じて、前記入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換部と、前記画像変換部から出力される前記符号化対象画像を符号化して前記符号化ビットストリームを生成し、当該符号化ビットストリームを前記伝送路上に送出する動画像符号化部と、前記伝送路上に送出される前記符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定部と、前記ビットレート決定部で決定された前記符号化ビットレートに応じて前記符号化対象画像の解像度の上限値を決定し、前記符号化対象画像の解像度が前記上限値を上回らないように前記画像変換部を制御する解像度範囲選択部とを備える。

　本発明の一形態に係るプログラムは、コンピュータに、入力画像を符号化して符号化ビットストリームを生成させ、当該符号化ビットストリームを伝送路上に送出させる。具体的には、前記入力画像の符号化の困難さの程度に応じて、前記入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換ステップと、前記画像変換ステップで出力される前記符号化対象画像を符号化して前記符号化ビットストリームを生成し、当該符号化ビットストリームを前記伝送路上に送出する動画像符号化ステップと、前記伝送路上に送出される前記符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定ステップと、前記ビットレート決定ステップで決定された前記符号化ビットレートに応じて前記符号化対象画像の解像度の上限値を決定し、前記符号化対象画像の解像度が前記上限値を上回らないように前記画像変換ステップでの変更を制御する解像度範囲選択ステップとを、コンピュータに実行させる。

　本発明の一形態に係る集積回路は、入力画像を符号化して符号化ビットストリームを生成し、当該符号化ビットストリームを伝送路上に送出する。具体的には、前記入力画像の符号化の困難さの程度に応じて、前記入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換部と、前記画像変換部から出力される前記符号化対象画像を符号化して前記符号化ビットストリームを生成し、当該符号化ビットストリームを前記伝送路上に送出する動画像符号化部と、前記伝送路上に送出される前記符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定部と、前記ビットレート決定部で決定された前記符号化ビットレートに応じて前記符号化対象画像の解像度の上限値を決定し、前記符号化対象画像の解像度が前記上限値を上回らないように前記画像変換部を制御する解像度範囲選択部とを備える。

　なお、本発明は、動画像符号化方法または動画像符号化装置として実現できるだけでなく、これらの機能を実現する集積回路として実現したり、そのような機能をコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、ＣＤ－ＲＯＭ等の記録媒体およびインターネット等の伝送媒体を介して流通させることができるのは言うまでもない。

　本発明の動画像符号化方法および動画像符号化装置によれば、入力動画像の圧縮の困難さの程度、または目標とする符号化ビットレートが大きく変化しても、圧縮が容易な画像を低ビットレートで符号化した場合に大きな解像度で符号化することを防止できる。その結果、低ビットレートで解像度が頻繁に切り替わることに起因するボケなどの違和感が発生しない動画像符号化をすることができ、主観的な画質劣化を防止できる。

図１Ａは、実施の形態１に係る動画像符号化装置のブロック図である。図１Ｂは、実施の形態１に係る動画像符号化装置の最小構成を示すブロック図である。図１Ｃは、図１Ｂの動画像符号化装置の動作を示すフローチャートである。図２は、図１の解像度変更回路の詳細ブロック図である。図３は、解像度変更処理前の画像（ａ）と、解像度変更処理後の画像（ｂ）～（ｄ）との関係を示す図である。図４は、図１のフレームレート変更回路の詳細ブロック図である。図５は、フレームレート変更処理のタイムチャートである。図６は、図１の動画像符号化回路の詳細ブロック図である。図７は、図１の量子化ステップ制御回路の動作を示すフローチャートである。図８は、図１の量子化ステップ平均回路の動作を示すフローチャートである。図９は、図１の解像度範囲選択回路が保持しているビットレートと解像度範囲との関係を示す図である。図１０は、図１の解像度・フレームレート選択回路の動作を示すフローチャートである。図１１は、解像度・フレームレート選択回路で行われる状態遷移の一例を示す図である。図１２は、状態遷移の具体例を示す図である。図１３は、図１２の各状態における解像度、フレームレート、遷移条件、遷移先状態ＩＤを示す図である。図１４は、状態遷移の他の具体例を示す図である。図１５Ａは、記録媒体本体である磁気ディスクの物理フォーマットの例を示す図である。図１５Ｂは、磁気ディスクを保持するケースの正面図、断面図、および磁気ディスクを示す図である。図１５Ｃは、フレキシブルディスクに上記プログラムの記録再生を行うための構成を示す図である。図１６は、コンテンツ配信サービスを実現するコンテンツ供給システムの全体構成の一例を示す模式図である。図１７は、携帯電話の外観を示す図である。図１８は、携帯電話の構成例を示すブロック図である。図１９は、デジタル放送用システムの全体構成の一例を示す模式図である。図２０は、テレビの構成例を示すブロック図である。図２１は、光ディスクである記録メディアに情報の読み書きを行う情報再生記録部の構成例を示すブロック図である。図２２は、光ディスクである記録メディアの構造例を示す図である。図２３は、各実施の形態に係る画像符号化方法および画像復号方法を実現する集積回路の構成例を示すブロック図である。図２４は、従来の符号化対象画像と表示画像との関係を示す図である。図２５は、従来の動画像符号化装置のブロック図である。

　以下、本発明の具体的な内容について、実施の形態１～４を用いて説明する。

　（実施の形態１）
　図１Ａは、本発明の実施の形態１に係る動画像符号化装置１０の構成を示すブロック図である。

　動画像符号化装置１０は、解像度変更回路（解像度変更部）１０１と、フレームレート変更回路（フレームレート変更部）１０２と、動画像符号化回路（動画像符号化部）１０３と、ビットレート決定回路（ビットレート決定部）１０５と、量子化ステップ制御回路（量子化ステップ算出部）１０６と、量子化ステップ平均回路（平均値算出部）１０７と、解像度範囲選択回路（解像度範囲選択部）１０８と、解像度・フレームレート選択回路（画質決定部）１０９とを備える。そして、この動画像符号化装置１０は、動画信号Ｓ１０を動画入力端子１００から取得し、生成したビットストリームＳ１３をビットストリーム出力端子１０４から伝送路に送出する。

　解像度変更回路１０１は、動画入力端子１００から取得した動画信号Ｓ１０の解像度を、解像度選択信号Ｓ１８で通知された解像度に変更する。フレームレート変更回路１０２は、解像度が変更された動画信号Ｓ１１のフレームレートを、フレームレート選択信号Ｓ１９から通知されたフレームレートに変更する。

　なお、上記の解像度変更回路１０１およびフレームレート変更回路１０２と、後述する解像度・フレームレート選択回路１０９とで、入力画像（「動画信号Ｓ１０」に相当）を符号化対象画像（「動画信号Ｓ１２」に相当）に変換する画像変換部１１０を構成する。この画像変換部１１０は、入力画像の符号化の困難さの程度に応じて、入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する。

　動画像符号化回路１０３は、量子化ステップ信号Ｓ１６で通知される量子化ステップ（もしくは量子化パラメータ）と、解像度変更有無を示す解像度変更発生信号Ｓ２０とを取得し、フレームレートが変更された動画信号Ｓ１２を符号化してビットストリームＳ１３を生成する。なお、動画像符号化回路１０３で符号化に必要な画像の解像度の情報およびフレームレートの情報は、動画信号Ｓ１１または動画信号Ｓ１２に含まれているものとする。そして、動画像符号化回路１０３は、生成したビットストリームＳ１３を、ビットストリーム出力端子１０４を介して伝送路上に送出する。量子化ステップ制御回路１０６は、符号化ビットレート信号Ｓ１４と、フレームレート選択信号Ｓ１９と、ビットストリームＳ１３とを取得して量子化ステップを決定する。なお、量子化ステップ制御回路１０６は、ビットストリームＳ１３の代わりに、ビットストリームＳ１３のビット数を入力としてもよい。

　量子化ステップ平均回路１０７は、量子化ステップ信号Ｓ１６と、解像度変更発生信号Ｓ２０とを取得し、所定の時間内の同じ解像度での量子化ステップの平均値である量子化ステップ平均値を求める。量子化ステップ平均値の具体的な算出方法は特に限定されないが、例えば、指数加重移動平均演算によって算出することができる。

　ビットレート決定回路１０５は、動画像符号化回路１０３から出力されるビットストリームＳ１３の符号化ビットレートを決定する。符号化ビットレートの具体的な決定方法は、特に限定されないが、例えば、伝送路で伝送可能ビットレートに基づいて決定してもよい。または、ユーザが指定する符号化ビットレートの入力を受け付けてもよい。

　解像度範囲選択回路１０８は、符号化ビットレート信号Ｓ１４を取得し、符号化ビットレートから符号化対象画像の解像度の上限値と下限値とからなる解像度選択範囲を決定する。解像度・フレームレート選択回路１０９は、量子化ステップ平均値信号Ｓ１７と、解像度選択範囲信号Ｓ１５とを取得し、符号化対象画像の解像度およびフレームレートを決定する。そして、解像度・フレームレート選択回路１０９は、解像度選択信号Ｓ１８と、フレームレート選択信号Ｓ１９と、解像度変更発生信号Ｓ２０とを出力する。

　次に、図１Ｂおよび図１Ｃを参照して、実施の形態１に係る動画像符号化装置１０の最小構成を説明する。まず、動画像符号化装置１０は、図１Ｂに示されるように、画像変換部２０と、動画像符号化部３０と、ビットレート決定部４０と、解像度範囲選択部５０とを備える。この動画像符号化装置１０は、入力画像を符号化して符号化ビットストリームを生成し、当該符号化ビットストリームを伝送路上に送出する。なお、画像変換部２０は図１Ａの画像変換部１１０に、動画像符号化部３０は図１Ａの動画像符号化回路１０３、量子化ステップ制御回路１０６、および量子化ステップ平均回路１０７に、ビットレート決定部４０は図１Ａのビットレート決定回路１０５に、解像度範囲選択部５０は図１Ａの解像度範囲選択回路１０８に、それぞれ相当する。

　画像変換部１１０は、入力画像を取得し、取得した入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を生成し、生成した符号化対象画像を動画像符号化回路１０３に出力する（Ｓｔｅｐ１１）。なお、符号化対象画像の解像度およびフレームレートは、量子化ステップ平均回路１０７から取得した入力画像の符号化の困難さの程度と、解像度範囲選択回路１０８から取得した解像度の上限値とに基づいて決定される。

　動画像符号化回路１０３は、画像変換部１１０から符号化対象画像を取得し、取得した符号化対象画像を符号化して符号化ビットストリームを生成し、生成した符号化ビットストリームを伝送路上に送出する（Ｓｔｅｐ１２）。また、動画像符号化回路１０３、量子化ステップ制御回路１０６、および量子化ステップ平均回路１０７は、現時点までに符号化した符号化対象画像の符号化処理の結果に基づいて、次の入力画像の符号化の困難さの程度を推定して、画像変換部１１０に通知する。

　ビットレート決定回路１０５は、伝送路上に送出される符号化ビットストリームのビットレートである符号化ビットレートを決定し、決定した符号化ビットレートを解像度範囲選択回路１０８に通知する（Ｓｔｅｐ１３）。

　解像度範囲選択回路１０８は、ビットレート決定ステップで決定された符号化ビットレートに応じて符号化対象画像の解像度の上限値を決定し、決定した解像度の上限値を画像変換部１１０に通知することにより、符号化対象画像の解像度が上限値を上回らないように、画像変換部１１０での処理を制御する（Ｓｔｅｐ１４）。

　図２は、図１の解像度変更回路１０１のブロック構成を示す図である。また、図３の（ａ）～（ｂ）は、フレームメモリの画素位置に対応した書き込みアドレスと読み出しアドレスとを示した図である。

　解像度変更回路１０１は、図２に示されるように、水平方向ＬＰＦ回路３０１と、垂直方向ＬＰＦ回路３０２と、フレームメモリ３０３と、書き込み読み出し制御回路３０５とを備える。この解像度変更回路１０１は、動画入力端子３００から動画信号Ｓ１０を、解像度選択信号入力端子３０４から解像度選択信号Ｓ１８をそれぞれ取得し、動画信号Ｓ１０の解像度を変更した動画信号Ｓ１１を動画出力端子３０６に出力する。

　水平方向ＬＰＦ回路３０１は、動画信号Ｓ１０に水平方向のローパスフィルタ処理を適用して動画信号Ｓ３１を出力する。垂直方向ＬＰＦ回路３０２は、動画信号Ｓ３１に垂直方向のローパスフィルタ処理を適用して動画信号Ｓ３２を出力する。フレームメモリ３０３は、動画信号Ｓ３２を１フレーム分記憶する。書き込み読み出し制御回路３０５は、フレームメモリ３０３の書き込みおよび読み出しを制御する。

　水平方向ＬＰＦ回路３０１および垂直方向ＬＰＦ回路３０２は、入力画像の平均化処理を行うものであって、解像度選択信号入力端子３０４から入力した解像度選択信号Ｓ１８に応じてローパス特性を切り換える。具体的には、解像度の縮小率が大きなとき（小さな解像度の画像に変更するとき）は低周波数成分のみを通過させるべくローパスフィルタの通過域の帯域は狭く、解像度の縮小率が小さいとき（中程度の解像度の画像に変更するとき）は低中周波数成分を通過させるべくローパスフィルタの通過域の帯域を広くする。なおローパスフィルタ処理は、縮小処理によるダウンサンプリングで発生する折り返しノイズを抑圧するための処理である。

　動画入力端子３００から入力される動画信号Ｓ１０には、解像度選択信号Ｓ１８に応じて適正な通過域の水平方向および垂直方向のローパスフィルタ処理が施される。次に、ローパスフィルタ処理が施された動画信号Ｓ３２は、書き込み読み出し制御回路３０５によって、フレームメモリ３０３の書き込みアドレス位置に順次書き込まれる。

　図３の（ａ）は、動画信号Ｓ１０の一例である。画素はメモリ上に左から右に２次元上のアドレスに配置されており、水平方向に１行下のアドレスはＨだけアドレスが増加する。書き込み読み出し制御回路３０５は、解像度選択信号入力端子３０４から取得した解像度選択信号Ｓ１８の縮小率に応じて、縮小後の画像の書き込みアドレスおよび読み出しアドレスを制御する。図３の（ｂ）は、図３の（ａ）の画像を、水平方向の縮小率＝垂直方向の縮小率＝１（以下、単に「縮小率」と表記する）で出力する場合の動画信号Ｓ１０の該当画素の読み出しアドレスを示す図である。同様に、図３の（ｃ）は縮小率＝３／４で出力する場合の動画信号Ｓ１０の該当画素の読み出しアドレスを、図３の（ｄ）は縮小率＝１／２で出力する場合の動画信号Ｓ１０の該当画素の読み出しアドレスをそれぞれ示す図である。このように、動画信号Ｓ１０にローパスフィルタ処理を行った画素の該当位置の画素のみを抽出してフレームメモリ３０３に書き出すことにより、縮小後の画像を生成する。次に、書き込み読み出し制御回路３０５は、抽出したアドレスをフレームメモリ３０３から順次読み出し、動画信号Ｓ１１として動画出力端子３０６に出力する。

　図４は、図１のフレームレート変更回路１０２のブロック構成を示す図である。図５は、フレームレート変更回路１０２の動作を示すタイムチャートである。

　フレームレート変更回路１０２は、図４に示すように、解像度の変更された動画信号Ｓ１１が入力される動画入力端子２００と、フレームレート選択信号Ｓ１９が入力されるフレームレート選択信号入力端子２０１と、取得した動画信号Ｓ１１を記憶するフレームメモリ２０２と、フレームメモリ２０２の書き込みおよび読み出しを制御する書き込み読み出し制御回路２０３と、フレームレートを変更した動画信号Ｓ１２を出力する動画出力端子２０４とを備える。

　動画入力端子２００から入力される動画信号Ｓ１１は、フレームメモリ２０２に書き込まれる。具体的には、書き込み読み出し制御回路２０３は、図５に示されるタイムチャート（最上段）の書き込みフレーム番号に示す様にフレームメモリ２０２を書き込み制御し、動画信号Ｓ１１をフレームメモリに順次書き込む。

　次に、書き込み読み出し制御回路２０３は、フレームレート選択信号入力端子２０１から取得したフレームレート選択信号Ｓ１９に応じて、図５に示すタイムチャート（２段目～５段目）の読み出しフレーム番号に示す様に、フレームメモリ２０２からフレームを間引いて間欠的に読み出し、動画信号Ｓ１２として出力する。これによってフレームレートの変更を行うことができる。

　図６は、動画像符号化回路１０３の構成を示すブロック構成である。動画像符号化回路１０３は、図６に示すように、入力画像メモリ４０１と、差分演算回路４０２と、直交変換回路４０３と、量子化回路４０４と、可変長符号化回路４０５と、逆量子化回路４０８と、逆直交変換回路４０９と、加算演算回路４１０と、参照画像メモリ４１１と、動きベクトル検出回路４１２と、動き補償回路４１３と、面内予測回路４１４と、符号化モード選択制御回路４１５と、予測画像セレクター回路４１６とを備える。この動画像符号化回路１０３は、動画入力端子４００から動画信号Ｓ１２を、量子化ステップ入力端子４０７から量子化ステップ信号Ｓ１６を、解像度変更発生信号入力端子４１７から解像度変更発生信号Ｓ２０をそれぞれ取得し、ビットストリームＳ１３をビットストリーム出力端子４０６に出力する。

　入力画像メモリ４０１は、入力した動画信号Ｓ１２の画素順序を入れ替えてブロック単位の動画信号Ｓ４１に変換する。差分演算回路４０２は、ブロック分割された動画信号Ｓ４１と予測画像信号Ｓ４８との差分を演算し、差分信号Ｓ４２を出力する。

　直交変換回路４０３は、差分信号Ｓ４２を直交変換し、係数信号Ｓ４３を出力する。量子化回路４０４は、係数信号Ｓ４３を量子化ステップ信号Ｓ１６で量子化し、量子化値Ｓ４４を出力する。可変長符号化回路４０５は、量子化値Ｓ４４を可変長符号化する。

　逆量子化回路４０８は、量子化値Ｓ４４を量子化ステップ信号Ｓ１６で逆量子化し、逆量子化済み係数信号Ｓ４６を出力する。逆直交変換回路４０９は、逆量子化済み係数信号Ｓ４６を逆直交変換し、逆直交変換済み動画信号Ｓ４７を出力する。加算演算回路４１０は、逆直交変換済み動画信号Ｓ４７と予測画像信号Ｓ４８とを加算し、参照画像データＳ４９を生成する。参照画像メモリ４１１は、参照画像データＳ４９を一時記憶する。

　動きベクトル検出回路４１２は、参照画像メモリ４１１から読み出した参照画像データＳ５０とブロック分割された動画信号Ｓ４１とを比較し、ブロック分割された動画信号Ｓ４１の動きベクトルを検出し、動きベクトル信号Ｓ５２を出力する。動き補償回路４１３は、動きベクトル信号Ｓ５２に対応して参照画像メモリ４１１から参照画像データＳ５０を読み出し、読み出した参照画像データＳ５０を用いて動き補償を行い、生成した動き予測画像データＳ５１を出力する。

　面内予測回路４１４は、参照画像メモリ４１１から読み出した符号化対象ブロック近傍の画像データと、ブロック分割された動画信号Ｓ４１とを比較して面内予測を行い、面内予測画像データＳ５３を生成する。

　符号化モード選択制御回路４１５は、ブロック分割された動画信号Ｓ４１と、動き予測画像データＳ５１と、面内予測画像データＳ５３と、解像度変更発生信号Ｓ２０とを取得し、これらに基づいてモード選択信号Ｓ５４を出力する。解像度変更が発生していない場合、予測モードとして画面内予測および画面間予測のどちらが最適かを判定する。具体的な判定方法は特に限定されないが、例えば、ブロック分割された動画信号Ｓ４１および動き予測画像データＳ５１の差分絶対値和と、ブロック分割された動画信号Ｓ４１および面内予測画像データＳ５３の差分絶対値和とを比較する。そして、前者の値が小さい場合は画面間予測を選択し、後者の値が小さい場合は画面内予測を選択してもよい。一方、解像度変更が発生した、最初のフレームである場合は、必ず画面内予測を選択する。

　予測画像セレクター回路４１６は、モード選択信号Ｓ５４に従って、面内予測画像データＳ５３および動き予測画像データＳ５１のいずれか一方を選択し、予測画像信号Ｓ４８を出力する。

　これによれば、解像度の変更が発生していない場合は、入力した動画像信号のブロック毎に最適な予測モードが選択される。一方、解像度の変更が発生した、最初のフレームである場合は、画面内予測モードが選択される。そして、動画像符号化回路１０３は、ブロック分割された動画信号Ｓ４１とその予測画像信号Ｓ４８との差分信号Ｓ４２を直交変換し、得られた係数信号Ｓ４３を量子化ステップ入力端子４０７から入力した量子化ステップ信号Ｓ１６で量子化し、得られた量子化値Ｓ４４を可変長符号化してビットストリーム信号を出力する。発生符号量は、量子化ステップ信号Ｓ１６の値が大きい程少なくなり、逆に量子化ステップ信号Ｓ１６の値が小さい程多くなる。つまり、量子化ステップ信号Ｓ１６を用いて、発生符号量が制御されるのである。

　図７は、量子化ステップ制御回路１０６の動作を示すフローチャートである。

　量子化ステップ制御回路１０６は、まず始めに、入力されたフレームが符号化する最初のフレームであるかを判定する（Ｓｔｅｐ１００）。ストリームの最初のフレームでない場合（Ｓｔｅｐ１００でＮｏ）、量子化ステップ制御回路１０６は、Ｓｔｅｐ１０３～Ｓｔｅｐ１０６で決定した量子化ステップで当該フレームの符号化の終了を待つ（Ｓｔｅｐ１０２）。なお、フレームの符号化は動画像符号化回路１０３で行われるため、量子化ステップ制御回路１０６では当該フレームの符号化が終了するのを待つだけの動作になる。

　また、符号化する最初のフレームである場合（Ｓｔｅｐ１００でＹｅｓ）、量子化ステップ制御回路１０６は、累積差分符号量（ＴＢＤ）を０にリセットし、事前に決められた初期量子化ステップを現フレームの量子化ステップとする（Ｓｔｅｐ１０１）。そして、当該フレームの符号化が終了するのを待つ（Ｓｔｅｐ１０２）。

　次に、量子化ステップ制御回路１０６は、当該フレームの符号化が終了した時点で、取得した目標ビットレート（ＴＢＲ）とフレームレート（ＦＲ）とに基づいて、式１を用いて目標とする１フレーム当たりの平均符号量（ＡＦＢ）を求める（Ｓｔｅｐ１０３）。

　　ＡＦＢ＝ＴＢＲ／ＦＲ　　　　　　　　　（式１）
　次に、量子化ステップ制御回路１０６は、ビットストリームＳ１３の符号量をカウントする。そして、量子化ステップ制御回路１０６は、その結果得られた１フレームの発生符号量（ＦＢＴ）と１フレームの目標符号量（ＡＦＢ）とに基づいて、式２を用いて累積差分符号量（ＴＢＤ）を求める（Ｓｔｅｐ１０４）。

　　ＴＢＤ＋＝ＦＢＴ－ＡＦＢ　　　　　　　（式２）
　次に、量子化ステップ制御回路１０６は、１フレーム当たりの平均符号量（ＡＦＢ）と累積差分符号量（ＴＢＤ）とに基づいて、式３を用いて次のフレームの目標符号量（ＴＦＢ）を求める（Ｓｔｅｐ１０５）。

　　ＴＦＢ＝ＡＦＢ－ＴＢＤ　　　　　　　　　（式３）
　次に、量子化ステップ制御回路１０６は、現フレームの量子化ステップ（ＱＳ（ｎ－１））と、１フレームの発生符号量（ＦＢＴ）と、次のフレームの目標符号量（ＴＦＢ）とに基づいて、式４を用いて次のフレームの量子化ステップ（ＱＳ（ｎ））を求め、その値を出力する（Ｓｔｅｐ１０６）。

　　ＱＳ（ｎ）＝ＱＳ（ｎ－１）×ＦＢＴ／ＴＦＢ　　　　　（式４）
　そして、量子化ステップ制御回路１０６は、全フレームの符号化が終了したか否かを判定する（Ｓｔｅｐ１０７）。符号化すべきフレームが残っている場合（Ｓｔｅｐ１０７でＮｏ）、次フレームについて上記の処理（Ｓｔｅｐ１００～Ｓｔｅｐ１０６）を実行する。一方、全てのフレームの符号化が終了した場合（Ｓｔｅｐ１０７でＹｅｓ）、当該処理を終了する。つまり、上記の処理は、全フレームの符号化が終了するまで繰り返し実行される。

　上記の処理により、１フレームの符号化が終了した時点で発生した符号量（ＦＢＴ）と、平均符号量（ＡＦＢ）との差を累積差分符号量（ＴＢＤ）に加えた値は、現在のフレームの符号化が終了した時点での、発生符号の累積誤差である。そこで、量子化ステップ制御回路１０６は、次のフレームで累積差分符号量（ＴＢＤ）が０になる様に、次のフレームの目標符号量（ＴＦＢ）を求めている。

　目標符号量（ＴＦＢ）と実際の発生符号量（ＦＢＴ）とは一般に一致しないため、新たな誤差が発生するが、上記処理を繰り返すことで、発生符号量の平均値は目標とする１フレーム当たりの平均符号量と一致する様になる。つまり、上記処理で算出された量子化ステップを用いて符号化を行うことにより、目標ビットレート（ＴＢＲ）で伝送可能な符号化ビットストリームを得ることができる。

　図８は、量子化ステップ平均回路１０７の動作を示すフローチャートである。なお、図８では、指数加重移動平均演算を用いて量子化ステップ平均値を算出する例を示している。

　量子化ステップ平均回路１０７は、まず始めに、入力されたフレームが符号化する最初のフレームであるかを判定する（Ｓｔｅｐ２００）。ストリームの最初のフレームでない場合（Ｓｔｅｐ２００でＮｏ）、量子化ステップ平均回路１０７は、当該フレームの符号化が終了するのを待つ（Ｓｔｅｐ２０２）。なお、フレームの符号化は動画像符号化回路１０３で行われるため、量子化ステップ平均回路１０７では当該フレームの符号化が終了するのを待つだけの動作になる。

　一方、符号化する最初のフレームである場合（Ｓｔｅｐ２００でＹｅｓ）、量子化ステップ平均回路１０７は、量子化ステップ平均値を初期化し（Ｓｔｅｐ２０１）、当該フレームの符号化が終了するのを待つ（Ｓｔｅｐ２０２）。

　次に、量子化ステップ平均回路１０７は、符号化する最初のフレームから所定のフレーム数が経過したか（Ｓｔｅｐ２０３）、および解像度の変更が発生してから所定のフレーム数が経過したかを判定する（Ｓｔｅｐ２０４）。そして、２つの条件のどちらも成り立つ場合（Ｓｔｅｐ２０３、Ｓｔｅｐ２０４の両方でＹｅｓ）、量子化ステップ平均回路１０７は、現フレームの量子化ステップ値（ＱＳ（ｎ））と、前フレームの量子化ステップ平均値（ＱＳｅｍａ（ｎ－１））と、重み係数Ｗとに基づいて、式５を用いて現フレームの量子化ステップ平均値（ＱＳｅｍａ（ｎ））を求める（Ｓｔｅｐ２０５）。

　ＱＳｅｍａ（ｎ）＝Ｗ×ＱＳｅｍａ（ｎ－１）＋（１－Ｗ）×ＱＳ（ｎ）　（式５）
　式５における重み係数Ｗは、式６を用いて算出される定数である。この重み係数Ｗは、量子化ステップ平均値の変動の程度を制御するものであり、重み係数Ｗが大きい程変動しにくく、小さい程変動しやすくなる。なお、重み係数Ｗは、設計時等に指定される固定値であってもよいし、状況に応じて変更可能な可変値であってもよい。

　　Ｗ＝ｍ／２５６（ｍ＝０～２５５）　　　　　　　　　　　　（式６）
　また、２つの条件のうち、どちらか一つでも成り立たない場合（Ｓｔｅｐ２０３、Ｓｔｅｐ２０４の一方でＮｏ）は、量子化ステップ平均値（ＱＳｅｍａ）の演算は行わず、前回の量子化ステップ平均値（ＱＳｅｍａ）を保持する。

　そして、量子化ステップ平均回路１０７は、全フレームの符号化が終了したか否かを判定する（Ｓｔｅｐ２０６）。符号化すべきフレームが残っている場合（Ｓｔｅｐ２０６でＮｏ）、次フレームについて上記の処理（Ｓｔｅｐ２００～Ｓｔｅｐ２０５）を実行する。一方、全てのフレームの符号化が終了した場合（Ｓｔｅｐ２０６でＹｅｓ）、当該処理を終了する。つまり、上記の処理（Ｓｔｅｐ２００～Ｓｔｅｐ２０５）は、全フレームの符号化が終了するまで繰り返し実行される。

　図９は、解像度範囲選択回路１０８の動作を説明する参照テーブルである。解像度範囲選択回路１０８は、図９に示されるように、ビットレートと、符号化対象画像の解像度の下限値および上限値とを対応付けて保持している。図９に示される例では、閾値Ｒｔｈ０以上（「高ビットレート」と表記する）の場合、閾値Ｒｔｈ１以上、かつ閾値Ｒｔｈ０未満（「中ビットレート」と表記する）の場合、および閾値Ｒｔｈ１未満（「低ビットレート」と表記する）の場合のそれぞれについて、符号化対象画像の解像度の下限値および上限値が設定されている。

　そして、解像度範囲選択回路１０８は、ビットレート決定回路１０５から取得した符号化ビットレート信号Ｓ１４の値と、閾値Ｒｔｈ０および閾値Ｒｔｈ１とを比較する。そして、その結果に応じて、解像度範囲選択回路１０８は、符号化対象画像の解像度の上限値と下限値とからなる解像度選択範囲信号Ｓ１５を出力する。

　図１０は、解像度・フレームレート選択回路１０９の動作を示すフローチャートである。解像度・フレームレート選択回路１０９は、取得した量子化ステップ平均値信号Ｓ１７と、解像度選択範囲信号Ｓ１５とに基づいて、図１０のフローに従って符号化対象画像の解像度とフレームレートとを決定するものである。

　解像度・フレームレート選択回路１０９は、まず、入力された符号化対象フレームが最初のフレームであるか否かを判定する（Ｓｔｅｐ３００）。符号化対象フレームが最初のフレームでない場合（Ｓｔｅｐ３００でＮｏ）、解像度・フレームレート選択回路１０９は、現在設定されている解像度とフレームレートとで、当該フレームが符号化されるのを待つ（Ｓｔｅｐ３０２）。なお、フレームの符号化は動画像符号化回路１０３で行われるため、解像度・フレームレート選択回路１０９では当該フレームの符号化が終了するのを待つだけの動作になる。

　一方、符号化対象フレームが最初のフレームである場合（Ｓｔｅｐ３００でＹｅｓ）、解像度・フレームレート選択回路１０９は、状態ＩＤに事前に決められた初期状態ＩＤを設定する。さらに、初期状態ＩＤが示す解像度を解像度選択信号Ｓ１８として出力し、初期状態ＩＤが示すフレームレートをフレームレート選択信号Ｓ１９として出力する（Ｓｔｅｐ３０１）。そして、解像度・フレームレート選択回路１０９は、その解像度とフレームレートとで当該フレームの符号化が終了するのを待つ（Ｓｔｅｐ３０２）。

　フレームの符号化が終了した時点（Ｓｔｅｐ３０２でＹｅｓ）で、解像度・フレームレート選択回路１０９は、ストリームの最初から所定のフレーム数が経過したか（Ｓｔｅｐ３０３）、また解像度の変更が発生してから所定のフレーム数、および／または、所定の時間が経過したかを判定する（Ｓｔｅｐ３０４）。そして、この２つの条件のうちどちらか一つでも成り立たない場合（Ｓｔｅｐ３０３、Ｓｔｅｐ３０４の一方でＮｏ）、解像度・フレームレート選択回路１０９は、現状の状態ＩＤとそのＩＤの示す解像度およびフレームレートを変更せず保持する。一方、２つの条件のどちらも成り立つ場合（Ｓｔｅｐ３０３、Ｓｔｅｐ３０４の両方でＹｅｓ）は、次のフレームの符号化で使用する解像度とフレームレートとを決定する。

　解像度・フレームレート選択回路１０９は、入力画像の符号化の困難さの程度に応じて、符号化対象画像の解像度およびフレームレートを決定する。実施の形態１における「符号化の困難さの程度」は、量子化ステップ平均値信号Ｓ１７に基づいて判断される。すなわち、量子化ステップ平均値信号Ｓ１７が大きいほど符号化が困難であり、小さいほど符号化が容易であると判断される。また、符号化対象画像の解像度は、解像度選択範囲信号Ｓ１５に示される解像度の上限値および下限値の範囲内で選択される。具体的には、図１１に示されるような状態遷移図に従って決定する。

　図１１は、解像度およびフレームレートの組み合わせを一般化して示したものである。解像度およびフレームレートの組み合わせそれぞれには、状態ＩＤ（Ｓ_１１～Ｓ_４４）が割り当てられている。各状態ＩＤは、現在の状態ＩＤから他の状態ＩＤへ遷移するための遷移条件を保持している。なお、現在の状態ＩＤと他の状態ＩＤとは、上下方向に接する場合（解像度の変更）、左右方向に接する場合（フレームレートの変更）のみならず、斜め方向に接する場合（解像度およびフレームレートの変更）をも含んでもよい。また、必ずしも隣接する場合でなくてもよい。ただし、多く場合、これらの組み合わせのうち限られた組み合わせのみが用いられ、実際には遷移しない状態への遷移条件は、常に「偽（Ｆａｌｓｅ）」とされる。

　図１０、図１２、図１３、および図１４を参照して、状態遷移の具体例を説明する。

　図１２は、状態遷移の一例を示す図である。解像度・フレームレート選択回路１０９には、常にいずれかの状態ＩＤが設定されている。そして、現在の状態ＩＤから他の状態ＩＤへ遷移するための遷移条件としては、具体的には、量子化ステップ平均値信号Ｓ１７の閾値を保持している。

　図１３は、各状態ＩＤにおける解像度、フレームレート、遷移条件１、２、および状態遷移先１、２を示す表である。なお、図１３の例において、遷移条件１は量子化ステップ平均値信号Ｓ１７の上限値（ＱｐＵｔｈ）を指し、遷移条件２は量子化ステップ平均値信号Ｓ１７の下限値（ＱｐＬｔｈ）を指す。また、遷移条件１は解像度およびフレームレートのいずれか一方を小さくするための条件であり、遷移条件２は解像度およびフレームレートのいずれか一方を大きくするための条件である。なお、図１２および図１３の例では、現在の状態ＩＤから上下方向（解像度）および左右方向（フレームレート）に隣接する他の状態ＩＤにのみ遷移する。

　図１４は、状態遷移の他の例を示す図である。図１４の例では、図１２および図１３に示される遷移条件１、２に加えて、遷移条件３、４を満たした場合にも状態遷移が行われる。遷移条件３は遷移条件１の上限値（ＱｐＵｔｈ）より大きい第２の上限値（ＱｐＵｔｈ２）を指し、遷移条件４は遷移条件２の下限値（ＱｐＬｔｈ）より小さい第２の下限値（ＱｐＬｔｈ２）を指す。また、図１２と図１４とでは、同じ状態遷移であっても、遷移条件が異なる場合がある。

　まず、解像度・フレームレート選択回路１０９は、現在の状態ＩＤに対応する遷移条件１、遷移条件２、状態遷移先１、および状態遷移先２を読み出す（Ｓｔｅｐ３０５）。現在の状態ＩＤをＳ１１とすれば、図１３の１行目が読み出される。

　次に、解像度・フレームレート選択回路１０９は、量子化ステップ平均値信号Ｓ１７と遷移条件１とを比較する（Ｓｔｅｐ３０６）。また、状態遷移先１の解像度が解像度選択範囲内に含まれるか否かを判定する（Ｓｔｅｐ３０７）。

　量子化ステップ平均値＞遷移条件１であり（Ｓｔｅｐ３０６でＹｅｓ）、かつ状態遷移先１の解像度が解像度選択範囲内に含まれる場合（Ｓｔｅｐ３０７でＹｅｓ）、解像度・フレームレート選択回路１０９は、状態遷移表を検索して状態遷移先１の状態ＩＤが示す解像度の値を解像度選択信号Ｓ１８として出力し、フレームレートの値をフレームレート選択信号Ｓ１９として出力する（Ｓｔｅｐ３０８）。また、状態ＩＤを状態遷移先１の状態ＩＤに変更する（Ｓｔｅｐ３０９）。さらに、状態ＩＤの変更によって解像度の変更がある場合（Ｓｔｅｐ３２０でＹｅｓ）には解像度変更発生信号Ｓ２０を有効に設定し（Ｓｔｅｐ３２２）、解像度の変更がない場合（Ｓｔｅｐ３２０でＮｏ）には解像度変更発生信号Ｓ２０を無効に設定する（Ｓｔｅｐ３２１）。

　ここで、図１２および図１３を参照して、図１０のＳｔｅｐ３０６～Ｓｔｅｐ３０７の処理の具体例を説明する。なお、下記の説明における解像度選択範囲信号Ｓ１５は、高ビットレートの場合の解像度選択範囲を示しているものとする。

　例えば、現在の状態ＩＤがＳ_１１であった場合、遷移条件１が成立したときの状態遷移先１はＳ_２１である。ここで、Ｓ_２１の解像度は１２８０×７２０であり、高ビットレートの場合の解像度選択範囲内に含まれる（図９）。すなわち、Ｓ_１１からＳ_２１への状態の遷移が可能となる。

　一方、現在の状態ＩＤがＳ_２１であった場合、遷移条件１が成立したときの状態遷移先１はＳ_２２である。これは、Ｓ_２１における解像度が、高ビットレートにおける解像度の下限値に一致しており、解像度を小さくする余地がないからである。そこで、解像度の変更を伴わないＳ_２１からＳ_２２へと、状態を遷移することになる。

　なお、上記の例では、遷移条件１が成立した場合の状態遷移先が予め定められていたが、これに限ることなく、他の方法を用いることもできる。例えば、解像度を減少させる方向（図１２の下方向）に状態遷移しても解像度選択範囲の下限値を下回らない場合には、当該方向に状態遷移する。一方、下限値を下回る場合には、フレームレートを減少させる方向（図１２の右方向）に状態遷移するようにしてもよい。

　さらに、図１４を参照して、図１０のＳｔｅｐ３０６～Ｓｔｅｐ３０７の処理の他の具体例を説明する。なお、下記の説明における解像度選択範囲信号Ｓ１５は、高ビットレートの場合の解像度選択範囲を示しているものとする。

　例えば、現在の状態ＩＤがＳ_１２であった場合、遷移条件１が成立したときの状態遷移先１はＳ_２１である。すなわち、図１４の例では、解像度を小さくするのに合わせて、フレームレートを大きくしている点で、図１２の例と異なる。これは、解像度を小さくすることによって圧縮が容易になるため、フレームレートを少し大きくしても解像度が高い直前の状態と比べて画質が劣化しないためである。

　また、現在の状態ＩＤがＳ_２１であった場合、遷移条件１が成立したときの状態遷移先１はＳ_２２であり、図１２の例と共通する。しかし、フレームレートをさらに小さくするためには（すなわち、Ｓ_２２からＳ_２３への遷移）、遷移条件１より量子化ステップ平均値に関して条件の厳しい遷移条件３を満たさなければならない点で、図１２の例と異なる。これは、解像度を小さくする方がフレームレートを小さくするよりも画質劣化が目立たないので、小さい解像度であるＳ_３１に遷移しやすくするためである。

　すなわち、中ビットレートの場合は、遷移条件３よりも量子化ステップ平均値の条件が緩い遷移条件１に先に該当し、小さい解像度のＳ_３１に遷移する。一方、高ビットレートではＳ_３１の解像度が選択範囲外のため遷移条件１を満たさず、遷移条件３によってフレームレートが小さいＳ_２３に遷移する。

　一方、量子化ステップ平均値≦遷移条件１であった場合（Ｓｔｅｐ３０６でＮｏ）、解像度・フレームレート選択回路１０９は、量子化ステップ平均値信号Ｓ１７と遷移条件２とを比較する（Ｓｔｅｐ３１０）。また、状態遷移先２の解像度が解像度選択範囲内に含まれるか否かを判定する（Ｓｔｅｐ３１１）。

　量子化ステップ平均値＜遷移条件２であり（Ｓｔｅｐ３１０でＹｅｓ）、かつ状態遷移先２の解像度が解像度選択範囲内に含まれる場合（Ｓｔｅｐ３１１でＹｅｓ）、解像度・フレームレート選択回路１０９は、状態遷移表を検索して状態遷移先２の状態ＩＤが示す解像度の値を解像度選択信号Ｓ１８として出力し、フレームレートの値をフレームレート選択信号Ｓ１９として出力する（Ｓｔｅｐ３１２）。また、状態ＩＤを状態遷移先２の状態ＩＤに変更する（Ｓｔｅｐ３１３）。さらに、状態ＩＤの変更によって解像度の変更がある場合（Ｓｔｅｐ３２０でＹｅｓ）には解像度変更発生信号Ｓ２０を有効に設定し（Ｓｔｅｐ３２２）、解像度の変更がない場合（Ｓｔｅｐ３２０でＮｏ）は解像度変更発生信号を無効に設定する（Ｓｔｅｐ３２１）。

　次に、図１２および図１３を参照して、図１０のＳｔｅｐ３１０～Ｓｔｅｐ３１１の処理の具体例を説明する。なお、下記の説明における解像度選択範囲信号Ｓ１５は、中ビットレートの場合の解像度選択範囲を示しているものとする。

　例えば、現在の状態ＩＤがＳ_３２であった場合、遷移条件２が成立したときの状態遷移先２はＳ_２２である。ここで、Ｓ_２２の解像度は１２８０×７２０であり、中ビットレートの場合の解像度選択範囲内に含まれる（図９）。すなわち、Ｓ_３２からＳ_２２への状態遷移が可能となる。

　一方、現在の状態ＩＤがＳ_２２であった場合、遷移条件２が成立したときの状態遷移先２はＳ_２１である。これは、Ｓ_２２における解像度が、中ビットレートにおける解像度の上限値に一致しており、解像度を大きくする余地がないからである。そこで、解像度の変更を伴わないＳ_２２からＳ_２１へと状態を遷移することになる。

　なお、上記の例では、遷移条件２が成立した場合の状態遷移先が予め定められていたが、これに限ることなく、他の方法を用いることもできる。例えば、解像度を増大させる方向（図１２の上方向）に状態遷移しても解像度選択範囲の上限値を上回らない場合には、当該方向に状態遷移する。一方、上限値を上回る場合には、フレームレートを増大させる方向（図１２の左方向）に状態遷移するようにしてもよい。

　さらに、図１４を参照して、図１０のＳｔｅｐ３１０～Ｓｔｅｐ３１１の処理の他の具体例を説明する。なお、下記の説明における解像度選択範囲信号Ｓ１５は、中ビットレートの場合の解像度選択範囲を示しているものとする。

　例えば、現在の状態ＩＤがＳ_３１であった場合、遷移条件２が成立したときの状態遷移先２はＳ_２２である。すなわち、図１４の例では、解像度を大きくするのに合わせて、フレームレートを小さくしている点で、図１２の例と異なる。これは、解像度を大きくすることによって圧縮が急激に困難になるため、フレームレートを小さくして圧縮を少し容易にすることで急激に画質が悪くなる可能性を緩和するためである。

　また、現在の状態ＩＤがＳ_２２であった場合、遷移条件２が成立したときの状態遷移先１はＳ_２１であり、図１２の例と共通する。しかし、解像度との関係でフレームレートが大きくなりすぎる場合（例えば、Ｓ_４２からＳ_４１への遷移）、遷移条件２より量子化ステップ平均値の条件の厳しい遷移条件４を満たさなければならない。解像度を大きくする方がフレームレートを大きくするよりも画質向上効果が顕著なため、大きい解像度であるＳ_３３に遷移しやすくするためである。

　すなわち、低ビットレートの場合は、遷移条件４よりも量子化ステップ平均値の条件が緩い遷移条件２に先に該当し、大きい解像度のＳ_３３に遷移する。一方、図示していないが超低ビットレートでＳ_３３の解像度が選択範囲外で遷移条件２を満たさない場合は、遷移条件４を満たすとフレームレートが大きいＳ_４１に遷移する。

　さらに、遷移条件１および遷移条件２のいずれもが成立しない場合（Ｓｔｅｐ３１０でＮｏ）、解像度・フレームレート選択回路１０９は、現状の状態ＩＤが示す解像度の値を解像度選択信号Ｓ１８として出力し、フレームレートの値をフレームレート選択信号Ｓ１９として出力する。また、解像度の変更がないため、解像度変更発生信号Ｓ２０を無効に設定する。

　そして、解像度・フレームレート選択回路１０９は、全フレームの符号化が終了したか否かを判定する（Ｓｔｅｐ３２３）。符号化すべきフレームが残っている場合（Ｓｔｅｐ３２３でＮｏ）、次フレームについて上記の処理（Ｓｔｅｐ３００～Ｓｔｅｐ３２２）を実行する。一方、全てのフレームの符号化が終了した場合（Ｓｔｅｐ３２３でＹｅｓ）、当該処理を終了する。つまり、上記のＳｔｅｐ３００～Ｓｔｅｐ３２２までの処理は、全フレームの符号化が完了するまで繰り返し実行される。

　上記構成の動画像符号化装置１０は、動画入力端子１００に入力された動画信号Ｓ１０のうちの最初のフレームを符号化する場合に、解像度・フレームレート選択回路１０９に予め設定されている初期状態ＩＤが示す解像度を解像度選択信号Ｓ１８として出力し、初期状態ＩＤが示すフレームレートをフレームレート選択信号Ｓ１９として出力する。

　解像度変更回路１０１は、取得した動画信号Ｓ１０を解像度選択信号Ｓ１８で指定された解像度に変更し、動画信号Ｓ１１を出力する。フレームレート変更回路１０２は、動画信号Ｓ１１をフレームレート選択信号Ｓ１９で指定されたフレームレートに変更し、動画信号Ｓ１２を出力する。また、量子化ステップ制御回路１０６は、符号化するフレームが最初のフレームである場合、初期量子化ステップ値を量子化ステップ信号Ｓ１６として出力する。

　動画信号Ｓ１２は、動画像符号化回路１０３で符号化されて、ビットストリームＳ１３としてビットストリーム出力端子１０４に出力される。このとき、動画像符号化回路１０３は、符号化するフレームが最初のフレームである場合は、画面内予測モードを選択する。

　量子化ステップ制御回路１０６は、ストリームの最初のフレームの符号化を終了すると、当該フレームの発生符号量を知ることができる。そこで、量子化ステップ制御回路１０６は、符号化ビットレート信号Ｓ１４に含まれる目標ビットレート情報と、フレームレート選択信号Ｓ１９に含まれるフレームレート情報とから、次のフレームの量子化ステップ値を決定する。ここで、符号化ビットレート信号Ｓ１４に含まれる目標ビットレート情報は、利用者または機器の管理者が通信開始時に設定したビットレート、若しくは動画像符号化装置１０が符号化ビットストリームを実際に伝送路上に送出し、画像復号化装置から通知されたパケットロス率などから計算したネットワークで通信可能な最大ビットレートから求めた値であってもよい。

　次のフレームの量子化ステップ値は、量子化ステップ平均回路１０７に入力されるが、ストリームの最初から所定のフレーム数が経過するまでは、量子化ステップ平均値の演算と量子化ステップ平均値出力の更新を行わない。これは、ストリームの最初フレームは面内予測で符号化されるために、ストリームの最初以外で使用する、画面内予測と画面間予測とを適応的に用いた場合よりも発生符号量が大きくなる。そこで、量子化ステップ制御回路１０６が出力する量子化ステップ値が安定するまでに所定のフレーム数を処理する必要があるためである。

　また、同様の理由から、解像度・フレームレート選択回路１０９は、ストリームの最初から所定のフレーム数が経過するまでは、初期状態ＩＤが示す解像度を解像度選択信号Ｓ１８として出力し、初期状態ＩＤが示すフレームレートをフレームレート選択信号Ｓ１９として出力する。従って、最初から所定のフレーム数が経過するまでは、量子化ステップによる符号量調整のみが続行される。

　最初から所定のフレーム数が経過した後は、解像度・フレームレート選択回路１０９で、遷移条件１または遷移条件２と、量子化ステップ平均値信号Ｓ１７に含まれる量子化ステップ平均値との比較を行うことにより、状態遷移が可能となる。

　具体的には、遷移条件１よりも量子化ステップ平均値が大きく、かつ遷移先の解像度が解像度選択範囲内の場合にフレームレートが下がるか、または解像度が下がる方向の状態遷移が発生する。一方、遷移条件２よりも量子化ステップ平均値が小さく、かつ遷移先の解像度が解像度選択範囲内の場合にはフレームレートが上がるか、または解像度が上がる方向の状態遷移が発生する。

　解像度選択範囲は、解像度範囲選択回路１０８で符号化ビットレート値に応じて解像度の上限値と下限値とを決定したものである。高ビットレートの場合は高解像度範囲を、低ビットレートの場合は低解像度範囲を指定するものである。

　このように、状態遷移に解像度範囲の条件を付けることによって、動画信号の圧縮の困難さが大きく変動した場合でも、高ビットレートでありながら一時的に低解像度まで解像度が下がることがない。同様に、低ビットレートでありながら一時的に高解像度まで解像度が上がることがない。その結果、安定した解像度変更動作が可能になる。

　次に、解像度・フレームレート選択回路１０９の状態遷移に基づき解像度が変わる場合は、解像度変更発生信号Ｓ２０が有効となる。その結果、解像度が変換された最初の１フレームについて、動画像符号化回路１０３は、画面内予測モードを選択する。これは、解像度が変わることに基づいて、前フレームの参照が困難になることに起因する措置である。

　また、量子化ステップ平均回路１０７では、解像度の変更が発生してから所定のフレーム数、および／または、所定の時間が経過するまでは、量子化ステップ平均値の演算と量子化ステップ平均値出力の更新とを行わない。また、解像度・フレームレート選択回路１０９では、解像度の変更が発生してから所定のフレーム数、および／または、所定の時間が経過するまでは、状態遷移を禁止し、解像度変更が発生した直後の状態ＩＤを保持する。つまり、解像度の変換が発生した直後の解像度とフレームレートとが保持され、量子化ステップによる符号量制御のみが続行される。

　これは、ストリームの最初と同様、解像度が変わった直後の１フレームが画面内予測で符号化されるために、画面内予測と画面間予測とを適応的に用いた場合よりも発生符号量が大きくなる。その結果、量子化ステップ制御回路１０６が出力する量子化ステップ値が不安定となり、安定するまでに所定のフレーム数の処理を必要があるためである。

　実施の形態１に係る動画像符号化装置１０は、入力動画像の解像度を動的に変更する解像度変更回路１０１と、解像度変更回路１０１から出力される動画像のフレーム数を適応的に間引くフレームレート変更回路１０２と、フレームレート変更回路１０２から出力される動画像を符号化して要求される符号化ビットレートのビットストリームを生成する動画像符号化回路１０３とを備える。

　そして、動的な解像度変更処理は、符号化ビットレートに応じて複数の解像度の中から最大解像度と最小解像度を選択し、最大解像度から最小解像度までの、複数の解像度の中から解像度変更回路１０１の出力解像度を選択する。つまり、入力動画像の圧縮の困難さの程度、または目標とする符号化ビットレートが大きく変化したときに、符号化ビットレートに応じて解像度の最大解像度と最小解像度との制約の範囲内において、適正な解像度が選択される。

　その結果、ＰＣ画面の単純な映像の様に圧縮率が上がる場合に過大な解像度が選択されることがなく、一方でカメラがパン・チルトしたときの様に圧縮率が低下した場合に過小な解像度が選択されることがない。これにより、安定して適正範囲の解像度選択が実現でき、解像度が動的に安定して選択されることにより、違和感のない安定した画質を可能にする。

　（実施の形態２）
　また、本発明は、実施の形態１のように、動画像符号化装置１０および動画像符号化方法として実現できるだけではなく、実施の形態１の動画像符号化方法をコンピュータに実行させるためのプログラムとして実現してもよい。

　図１５Ａ～図１５Ｃは、上記実施の形態１の動画像符号化方法を格納したフレキシブルディスクＦＤを用いて、コンピュータシステムにより実施する場合の説明図である。

　図１５Ａは、記録媒体本体である磁気ディスクＭＤの物理フォーマットの例を示している。図１５Ｂは磁気ディスクＭＤを保持するケースＦの正面図、断面図、および磁気ディスクＭＤを示している。図１５Ｃは、フレキシブルディスクＦＤに上記プログラムの記録再生を行うための構成を示している。

　フレキシブルディスクＦＤは、記録媒体本体である磁気ディスクＭＤと、磁気ディスクＭＤを保持するケースＦとで構成される。磁気ディスクＭＤの表面には、同心円状に外周から内周に向かって複数のトラックＴｒが形成され、各トラックＴｒは角度方向に１６のセクタＳｅに分割されている。従って、上記プログラムを格納したフレキシブルディスクＦＤは、磁気ディスクＭＤ上に割り当てられた領域に、上記プログラムとしての動画像符号化方法が記録されている。

　また、上記プログラムをフレキシブルディスクＦＤに記録する場合は、コンピュータシステムＣｓから上記プログラムとしての動画像符号化方法をフレキシブルディスクドライブＦＤＤを介して書き込む。また、フレキシブルディスクＦＤ内のプログラムにより動画像符号化方法をコンピュータシステムＣｓ中に構築する場合は、フレキシブルディスクドライブＦＤＤによりプログラムをフレキシブルディスクＦＤから読み出し、コンピュータシステムＣｓに転送する。

　なお、上記説明では、記録媒体としてフレキシブルディスクＦＤを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ＩＣカード、ＲＯＭカセット等、プログラムを記録できるものであれば同様に実施することができる。

　また、本発明は、動画像符号化装置１０を構成する構成要素の一部または全部を、１個のシステムＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ）から構成してもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩである。

　また、各機能ブロックのうち、符号化の対象となるデータを格納する手段だけ１チップ化せずに別構成としてもよい。

（実施の形態３）
　上記実施の形態で示した画像符号化方法の構成を実現するためのプログラムを記憶メディアに記録することにより、上記実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ＩＣカード、半導体メモリ等、プログラムを記録できるものであればよい。

　さらにここで、上記実施の形態で示した画像符号化方法の応用例とそれを用いたシステムを説明する。

　図１６は、コンテンツ配信サービスを実現するコンテンツ供給システムｅｘ１００の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ｅｘ１０６～ｅｘ１１０が設置されている。

　このコンテンツ供給システムｅｘ１００は、インターネットｅｘ１０１にインターネットサービスプロバイダｅｘ１０２および電話網ｅｘ１０４、および、基地局ｅｘ１０６～ｅｘ１１０を介して、コンピュータｅｘ１１１、ＰＤＡ（Ｐｅｒｓｏｎａｌ　Ｄｉｇｉｔａｌ　Ａｓｓｉｓｔａｎｔ）ｅｘ１１２、カメラｅｘ１１３、携帯電話ｅｘ１１４、ゲーム機ｅｘ１１５などの各機器が接続される。

　しかし、コンテンツ供給システムｅｘ１００は図１６のような構成に限定されず、いずれかの要素を組み合わせて接続するようにしてもよい。また、固定無線局である基地局ｅｘ１０６～ｅｘ１１０を介さずに、各機器が電話網ｅｘ１０４に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。

　カメラｅｘ１１３はデジタルビデオカメラ等の動画撮影が可能な機器であり、カメラｅｘ１１６はデジタルカメラ等の静止画撮影、動画撮影が可能な機器である。また、携帯電話ｅｘ１１４は、ＧＳＭ（Ｇｌｏｂａｌ　Ｓｙｓｔｅｍ　ｆｏｒ　Ｍｏｂｉｌｅ　Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ）方式、ＣＤＭＡ（Ｃｏｄｅ　Ｄｉｖｉｓｉｏｎ　Ｍｕｌｔｉｐｌｅ　Ａｃｃｅｓｓ）方式、Ｗ－ＣＤＭＡ（Ｗｉｄｅｂａｎｄ－Ｃｏｄｅ　Ｄｉｖｉｓｉｏｎ　Ｍｕｌｔｉｐｌｅ　Ａｃｃｅｓｓ）方式、もしくはＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）方式、ＨＳＰＡ（Ｈｉｇｈ　Ｓｐｅｅｄ　Ｐａｃｋｅｔ　Ａｃｃｅｓｓ）の携帯電話、または、ＰＨＳ（Ｐｅｒｓｏｎａｌ　Ｈａｎｄｙｐｈｏｎｅ　Ｓｙｓｔｅｍ）等であり、いずれでも構わない。

　コンテンツ供給システムｅｘ１００では、カメラｅｘ１１３等が基地局ｅｘ１０９、電話網ｅｘ１０４を通じてストリーミングサーバｅｘ１０３に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラｅｘ１１３を用いて撮影するコンテンツ（例えば、音楽ライブの映像等）に対して上記実施の形態で説明したように符号化処理を行い、ストリーミングサーバｅｘ１０３に送信する。一方、ストリーミングサーバｅｘ１０３は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号することが可能な、コンピュータｅｘ１１１、ＰＤＡｅｘ１１２、カメラｅｘ１１３、携帯電話ｅｘ１１４、ゲーム機ｅｘ１１５等がある。配信されたデータを受信した各機器では、受信したデータを復号処理して再生する。

　なお、撮影したデータの符号化処理はカメラｅｘ１１３で行っても、データの送信処理をするストリーミングサーバｅｘ１０３で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号処理はクライアントで行っても、ストリーミングサーバｅｘ１０３で行ってもよいし、互いに分担して行ってもよい。また、カメラｅｘ１１３に限らず、カメラｅｘ１１６で撮影した静止画像および／または動画像データを、コンピュータｅｘ１１１を介してストリーミングサーバｅｘ１０３に送信してもよい。この場合の符号化処理はカメラｅｘ１１６、コンピュータｅｘ１１１、ストリーミングサーバｅｘ１０３のいずれで行ってもよいし、互いに分担して行ってもよい。

　また、これら符号化処理および復号処理は、一般的にコンピュータｅｘ１１１および各機器が有するＬＳＩ（Ｌａｒｇｅ　Ｓｃａｌｅ　Ｉｎｔｅｇｒａｔｉｏｎ）ｅｘ５００において処理する。ＬＳＩｅｘ５００は、ワンチップであっても複数チップからなる構成であってもよい。なお、画像符号化用および画像復号用のソフトウェアをコンピュータｅｘ１１１等で読み取り可能な何らかの記録メディア（ＣＤ－ＲＯＭ、フレキシブルディスク、ハードディスクなど）に組み込み、そのソフトウェアを用いて符号化処理および復号処理を行ってもよい。さらに、携帯電話ｅｘ１１４がカメラ付きである場合には、そのカメラで取得した動画像データを送信してもよい。このときの動画像データは携帯電話ｅｘ１１４が有するＬＳＩｅｘ５００で符号化処理されたデータである。

　また、ストリーミングサーバｅｘ１０３は複数のサーバまたは複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。

　以上のようにして、コンテンツ供給システムｅｘ１００では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムｅｘ１００では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号し、再生することができ、特別な権利または設備を有さないユーザでも個人放送を実現できる。

　このコンテンツ供給システムを構成する各機器の符号化には上記実施の形態で示した画像符号化方法を用いるようにすればよい。

　その一例として携帯電話ｅｘ１１４について説明する。

　図１７は、上記実施の形態で説明した画像符号化方法を用いた携帯電話ｅｘ１１４を示す図である。携帯電話ｅｘ１１４は、基地局ｅｘ１１０との間で電波を送受信するためのアンテナｅｘ６０１、ＣＣＤカメラ等の映像、静止画像を撮ることが可能なカメラ部ｅｘ６０３、カメラ部ｅｘ６０３で撮影した映像、アンテナｅｘ６０１で受信した映像等が復号されたデータを表示する液晶ディスプレイ等の表示部ｅｘ６０２、操作キーｅｘ６０４群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ｅｘ６０８、音声入力をするためのマイク等の音声入力部ｅｘ６０５、撮影した動画像もしくは静止画像のデータ、受信したメールのデータ、動画像のデータもしくは静止画像のデータ等、符号化されたデータまたは復号されたデータを保存するための記録メディアｅｘ６０７、携帯電話ｅｘ１１４に記録メディアｅｘ６０７を装着可能とするためのスロット部ｅｘ６０６を有している。記録メディアｅｘ６０７はＳＤカード等のプラスチックケース内に電気的に書き換えおよび消去が可能な不揮発性メモリであるＥＥＰＲＯＭの一種であるフラッシュメモリ素子を格納したものである。

　さらに、携帯電話ｅｘ１１４について図１８を用いて説明する。携帯電話ｅｘ１１４は表示部ｅｘ６０２および操作キーｅｘ６０４を備えた本体部の各部を統括的に制御するようになされた主制御部ｅｘ７１１に対して、電源回路部ｅｘ７１０、操作入力制御部ｅｘ７０４、画像符号化部ｅｘ７１２、カメラインターフェース部ｅｘ７０３、ＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ）制御部ｅｘ７０２、画像復号部ｅｘ７０９、多重分離部ｅｘ７０８、記録再生部ｅｘ７０７、変復調回路部ｅｘ７０６および音声処理部ｅｘ７０５が同期バスｅｘ７１３を介して互いに接続されている。

　電源回路部ｅｘ７１０は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付デジタル携帯電話ｅｘ１１４を動作可能な状態に起動する。

　携帯電話ｅｘ１１４は、ＣＰＵ、ＲＯＭおよびＲＡＭ等でなる主制御部ｅｘ７１１の制御に基づいて、音声通話モード時に音声入力部ｅｘ６０５で集音した音声信号を音声処理部ｅｘ７０５によってデジタル音声データに変換し、これを変復調回路部ｅｘ７０６でスペクトラム拡散処理し、送受信回路部ｅｘ７０１でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナｅｘ６０１を介して送信する。また携帯電話ｅｘ１１４は、音声通話モード時にアンテナｅｘ６０１で受信した受信データを増幅して周波数変換処理およびアナログデジタル変換処理を施し、変復調回路部ｅｘ７０６でスペクトラム逆拡散処理し、音声処理部ｅｘ７０５によってアナログ音声データに変換した後、音声出力部ｅｘ６０８を介してこれを出力する。

　さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーｅｘ６０４の操作によって入力された電子メールのテキストデータは操作入力制御部ｅｘ７０４を介して主制御部ｅｘ７１１に送出される。主制御部ｅｘ７１１は、テキストデータを変復調回路部ｅｘ７０６でスペクトラム拡散処理し、送受信回路部ｅｘ７０１でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナｅｘ６０１を介して基地局ｅｘ１１０へ送信する。

　データ通信モード時に画像データを送信する場合、カメラ部ｅｘ６０３で撮像された画像データを、カメラインターフェース部ｅｘ７０３を介して画像符号化部ｅｘ７１２に供給する。また、画像データを送信しない場合には、カメラ部ｅｘ６０３で撮像した画像データをカメラインターフェース部ｅｘ７０３およびＬＣＤ制御部ｅｘ７０２を介して表示部ｅｘ６０２に直接表示することも可能である。

　画像符号化部ｅｘ７１２は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部ｅｘ６０３から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ｅｘ７０８に送出する。また、このとき同時に携帯電話ｅｘ１１４は、カメラ部ｅｘ６０３で撮像中に音声入力部ｅｘ６０５で集音した音声を、音声処理部ｅｘ７０５を介してデジタルの音声データとして多重分離部ｅｘ７０８に送出する。

　多重分離部ｅｘ７０８は、画像符号化部ｅｘ７１２から供給された符号化画像データと音声処理部ｅｘ７０５から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ｅｘ７０６でスペクトラム拡散処理し、送受信回路部ｅｘ７０１でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナｅｘ６０１を介して送信する。

　データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナｅｘ６０１を介して基地局ｅｘ１１０から受信した受信データを変復調回路部ｅｘ７０６でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ｅｘ７０８に送出する。

　また、アンテナｅｘ６０１を介して受信された多重化データを復号するには、多重分離部ｅｘ７０８は、多重化データを分離することにより画像データのビットストリームと音声データのビットストリームとに分け、同期バスｅｘ７１３を介して当該符号化画像データを画像復号部ｅｘ７０９に供給すると共に当該音声データを音声処理部ｅｘ７０５に供給する。

　次に、画像復号部ｅｘ７０９は、画像復号装置を備えた構成であり、画像データのビットストリームを上記実施の形態で示した符号化方法に対応した復号方法で復号することにより再生動画像データを生成し、これを、ＬＣＤ制御部ｅｘ７０２を介して表示部ｅｘ６０２に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画像データが表示される。このとき同時に音声処理部ｅｘ７０５は、音声データをアナログ音声データに変換した後、これを音声出力部ｅｘ６０８に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる音声データが再生される。

　なお、上記システムの例に限られず、最近は衛星、地上波によるデジタル放送が話題となっており、図１９に示すようにデジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置を組み込むことができる。具体的には、放送局ｅｘ２０１では音声データ、映像データまたはそれらのデータが多重化されたビットストリームが電波を介して通信または放送衛星ｅｘ２０２に伝送される。これを受けた放送衛星ｅｘ２０２は、放送用の電波を発信し、衛星放送受信設備を持つ家庭のアンテナｅｘ２０４はこの電波を受信し、テレビ（受信機）ｅｘ３００またはセットトップボックス（ＳＴＢ）ｅｘ２１７などの装置はビットストリームを復号してこれを再生する。また、記録媒体であるＣＤおよびＤＶＤ等の記録メディアｅｘ２１５、ｅｘ２１６に記録した画像データと、音声データが多重化されたビットストリームを読み取り、復号するリーダ／レコーダｅｘ２１８にも画像復号装置を実装することが可能である。この場合、再生された映像信号はモニタｅｘ２１９に表示される。また、ケーブルテレビ用のケーブルｅｘ２０３または衛星／地上波放送のアンテナｅｘ２０４に接続されたセットトップボックスｅｘ２１７内に画像復号装置を実装し、これをテレビのモニタｅｘ２１９で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでもよい。また、アンテナｅｘ２０５を有する車ｅｘ２１０で、衛星ｅｘ２０２または基地局等から信号を受信し、車ｅｘ２１０が有するカーナビゲーションｅｘ２１１等の表示装置に動画像を再生することも可能である。

　また、ＤＶＤ、ＢＤ等の記録メディアｅｘ２１５に記録した音声データ、映像データまたはそれらのデータが多重化された符号化ビットストリームを読み取り復号する、または、記録メディアｅｘ２１５に、音声データ、映像データまたはそれらのデータを符号化し、多重化データとして記録するリーダ／レコーダｅｘ２１８にも上記実施の形態で示した画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタｅｘ２１９に表示される。また、符号化ビットストリームが記録された記録メディアｅｘ２１５により、他の装置およびシステム等は、映像信号を再生することができる。例えば、他の再生装置ｅｘ２１２は、符号化ビットストリームがコピーされた記録メディアｅｘ２１４を用いて、モニタｅｘ２１３に映像信号を再生することができる。

　また、ケーブルテレビ用のケーブルｅｘ２０３または衛星／地上波放送のアンテナｅｘ２０４に接続されたセットトップボックスｅｘ２１７内に画像復号装置を実装し、これをテレビのモニタｅｘ２１９で表示してもよい。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでもよい。

　図２０は、上記実施の形態で説明した画像符号化方法を用いたテレビ（受信機）ｅｘ３００を示す図である。テレビｅｘ３００は、上記放送を受信するアンテナｅｘ２０４またはケーブルｅｘ２０３等を介して映像情報のビットストリームを取得、または、出力するチューナｅｘ３０１と、受信した符号化データを復調する、または、生成された符号化データを外部に送信するために変調する変調／復調部ｅｘ３０２と、復調した映像データと音声データとを分離する、または、符号化された映像データと音声データとを多重化する多重／分離部ｅｘ３０３を備える。また、テレビｅｘ３００は、音声データ、映像データそれぞれを復号する、または、それぞれの情報を符号化する音声信号処理部ｅｘ３０４、映像信号処理部ｅｘ３０５を有する信号処理部ｅｘ３０６と、復号された音声信号を出力するスピーカｅｘ３０７、復号された映像信号を表示するディスプレイ等の表示部ｅｘ３０８を有する出力部ｅｘ３０９とを有する。さらに、テレビｅｘ３００は、ユーザ操作の入力を受け付ける操作入力部ｅｘ３１２等を有するインターフェース部ｅｘ３１７を有する。さらに、テレビｅｘ３００は、各部を統括的に制御する制御部ｅｘ３１０、各部に電力を供給する電源回路部ｅｘ３１１を有する。インターフェース部ｅｘ３１７は、操作入力部ｅｘ３１２以外に、リーダ／レコーダｅｘ２１８等の外部機器と接続されるブリッジｅｘ３１３、ＳＤカード等の記録メディアｅｘ２１６を装着可能とするためのスロット部ｅｘ３１４、ハードディスク等の外部記録メディアと接続するためのドライバｅｘ３１５、電話網と接続するモデムｅｘ３１６等を有していてもよい。なお記録メディアｅｘ２１６は、格納する不揮発性／揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビｅｘ３００の各部は同期バスを介して互いに接続されている。

　まず、テレビｅｘ３００がアンテナｅｘ２０４等により外部から取得したデータを復号し、再生する構成について説明する。テレビｅｘ３００は、リモートコントローラｅｘ２２０等からのユーザ操作を受け、ＣＰＵ等を有する制御部ｅｘ３１０の制御に基づいて、変調／復調部ｅｘ３０２で復調した映像データ、音声データを多重／分離部ｅｘ３０３で分離する。さらにテレビｅｘ３００は、分離した音声データを音声信号処理部ｅｘ３０４で復号し、分離した映像データを映像信号処理部ｅｘ３０５で上記実施の形態で説明した復号方法を用いて復号する。復号した音声信号、映像信号は、それぞれ出力部ｅｘ３０９から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファｅｘ３１８、ｅｘ３１９等に一旦これらの信号を蓄積するとよい。また、テレビｅｘ３００は、放送等からではなく、磁気／光ディスク、ＳＤカード等の記録メディアｅｘ２１５、ｅｘ２１６から符号化された符号化ビットストリームを読み出してもよい。次に、テレビｅｘ３００が音声信号および映像信号を符号化し、外部に送信または記録メディア等に書き込む構成について説明する。テレビｅｘ３００は、リモートコントローラｅｘ２２０等からのユーザ操作を受け、制御部ｅｘ３１０の制御に基づいて、音声信号処理部ｅｘ３０４で音声信号を符号化し、映像信号処理部ｅｘ３０５で映像信号を上記実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重／分離部ｅｘ３０３で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファｅｘ３２０、ｅｘ３２１等に一旦これらの信号を蓄積するとよい。なお、バッファｅｘ３１８～ｅｘ３２１は図示しているように複数備えていてもよいし、一つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調／復調部ｅｘ３０２と多重／分離部ｅｘ３０３との間等でもシステムのオーバフローおよびアンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。

　また、テレビｅｘ３００は、放送および記録メディア等から音声データおよび映像データを取得する以外に、マイクおよびカメラのＡＶ入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビｅｘ３００は、上記の符号化処理、多重化、および、外部出力ができる構成として説明したが、これらの全ての処理を行うことはできず、上記受信、復号処理、および、外部出力のうちいずれかのみが可能な構成であってもよい。

　また、リーダ／レコーダｅｘ２１８で記録メディアから符号化ビットストリームを読み出す、または、書き込む場合には、上記符号化処理はテレビｅｘ３００およびリーダ／レコーダｅｘ２１８のうちいずれかで行ってもよいし、テレビｅｘ３００とリーダ／レコーダｅｘ２１８とが互いに分担して行ってもよい。

　一例として、光ディスクからデータの読み込みまたは書き込みをする場合の情報再生／記録部ｅｘ４００の構成を図２１に示す。情報再生／記録部ｅｘ４００は、以下に説明する要素ｅｘ４０１～ｅｘ４０７を備える。光ヘッドｅｘ４０１は、光ディスクである記録メディアｅｘ２１５の記録面にレーザスポットを照射して情報を書き込み、記録メディアｅｘ２１５の記録面からの反射光を検出して情報を読み込む。変調記録部ｅｘ４０２は、光ヘッドｅｘ４０１に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ｅｘ４０３は、光ヘッドｅｘ４０１に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアｅｘ２１５に記録された信号成分を分離して復調し、必要な情報を再生する。バッファｅｘ４０４は、記録メディアｅｘ２１５に記録するための情報および記録メディアｅｘ２１５から再生した情報を一時的に保持する。ディスクモータｅｘ４０５は記録メディアｅｘ２１５を回転させる。サーボ制御部ｅｘ４０６は、ディスクモータｅｘ４０５の回転駆動を制御しながら光ヘッドｅｘ４０１を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ｅｘ４０７は、情報再生／記録部ｅｘ４００全体の制御を行う。上記の読み出しおよび書き込みの処理は、システム制御部ｅｘ４０７が、バッファｅｘ４０４に保持された各種情報を利用し、また必要に応じて新たな情報の生成および追加を行うと共に、変調記録部ｅｘ４０２、再生復調部ｅｘ４０３およびサーボ制御部ｅｘ４０６を協調動作させながら、光ヘッドｅｘ４０１を通して、情報の記録再生を行うことにより実現される。システム制御部ｅｘ４０７は、例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。

　以上では、光ヘッドｅｘ４０１はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。

　図２２に光ディスクである記録メディアｅｘ２１５の模式図を示す。記録メディアｅｘ２１５の記録面には案内溝（グルーブ）がスパイラル状に形成され、情報トラックｅｘ２３０には、予めグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックｅｘ２３１の位置を特定するための情報を含み、記録および再生を行う装置は、情報トラックｅｘ２３０を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアｅｘ２１５は、データ記録領域ｅｘ２３３、内周領域ｅｘ２３２、外周領域ｅｘ２３４を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ｅｘ２３３であり、データ記録領域ｅｘ２３３の内周または外周に配置されている内周領域ｅｘ２３２と外周領域ｅｘ２３４は、ユーザデータの記録以外の特定用途に用いられる。情報再生／記録部ｅｘ４００は、このような記録メディアｅｘ２１５のデータ記録領域ｅｘ２３３に対して、符号化された音声データ、映像データまたはそれらのデータを多重化した符号化データの読み書きを行う。

　以上では、１層のＤＶＤ、ＢＤ等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりするなど、多次元的な記録／再生を行う構造の光ディスクであってもよい。

　また、デジタル放送用システムｅｘ２００において、アンテナｅｘ２０５を有する車ｅｘ２１０で衛星ｅｘ２０２等からデータを受信し、車ｅｘ２１０が有するカーナビゲーションｅｘ２１１等の表示装置に動画像を再生することも可能である。なお、カーナビゲーションｅｘ２１１の構成は例えば図２０に示す構成のうち、ＧＰＳ受信部を加えた構成が考えられ、同様なことがコンピュータｅｘ１１１および携帯電話ｅｘ１１４等でも考えられる。また、上記携帯電話ｅｘ１１４等の端末は、テレビｅｘ３００と同様に、符号化器および復号器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号器のみの受信端末という３通りの実装形式が考えられる。

　このように、上記実施の形態で示した画像符号化方法を上述したいずれの機器およびシステムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。

　また、本発明は、上記実施の形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形または修正が可能である。

　（実施の形態４）
　上記各実施の形態で示した画像符号化方法および装置は、典型的には集積回路であるＬＳＩで実現される。一例として、図２３に１チップ化されたＬＳＩｅｘ５００の構成を示す。ＬＳＩｅｘ５００は、以下に説明する要素ｅｘ５０１～ｅｘ５０９を備え、各要素はバスｅｘ５１０を介して接続している。電源回路部ｅｘ５０５は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。

　例えば符号化処理を行う場合には、ＬＳＩｅｘ５００は、ＣＰＵｅｘ５０２、メモリコントローラｅｘ５０３およびストリームコントローラｅｘ５０４等を有する制御部ｅｘ５０１の制御に基づいて、ＡＶ　Ｉ／Ｏｅｘ５０９によりマイクｅｘ１１７およびカメラｅｘ１１３等からＡＶ信号の入力を受け付ける。入力されたＡＶ信号は、一旦ＳＤＲＡＭ等の外部のメモリｅｘ５１１に蓄積される。制御部ｅｘ５０１の制御に基づいて、蓄積したデータは、処理量および処理速度に応じて適宜複数回に分けるなどされ、信号処理部ｅｘ５０７に送られる。信号処理部ｅｘ５０７は、音声信号の符号化および／または映像信号の符号化を行う。ここで映像信号の符号化処理は、上記実施の形態で説明した符号化処理である。信号処理部ｅｘ５０７ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームＩ／Ｏｅｘ５０６から外部に出力する。この出力されたビットストリームは、基地局ｅｘ１０７に向けて送信されたり、または、記録メディアｅｘ２１５に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファｅｘ５０８にデータを蓄積するとよい。

　また、例えば復号処理を行う場合には、ＬＳＩｅｘ５００は、制御部ｅｘ５０１の制御に基づいて、ストリームＩ／Ｏｅｘ５０６によって基地局ｅｘ１０７を介して得た符号化データ、または、記録メディアｅｘ２１５から読み出して得た符号化データを一旦メモリｅｘ５１１等に蓄積する。制御部ｅｘ５０１の制御に基づいて、蓄積したデータは、処理量および処理速度に応じて適宜複数回に分けるなどされ信号処理部ｅｘ５０７に送られる。信号処理部ｅｘ５０７は、音声データの復号および／または映像データの復号を行う。さらに、場合により復号された音声信号と復号された映像信号を同期して再生できるようそれぞれの信号を一旦バッファｅｘ５０８等に蓄積するとよい。復号された出力信号は、メモリｅｘ５１１等を適宜介しながら、携帯電話ｅｘ１１４、ゲーム機ｅｘ１１５およびテレビｅｘ３００等の各出力部から出力される。

　なお、上記では、メモリｅｘ５１１がＬＳＩｅｘ５００の外部の構成として説明したが、ＬＳＩｅｘ５００の内部に含まれる構成であってもよい。バッファｅｘ５０８も一つに限ったものではなく、複数のバッファを備えていてもよい。また、ＬＳＩｅｘ５００は１チップ化されてもよいし、複数チップ化されてもよい。

　なお、ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

　また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ、または、ＬＳＩ内部の回路セルの接続および設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。

　さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。

　以上、本発明の画像符号化方法および画像符号化装置について、実施の形態１～４に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものあるいは、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。

　なお、実施の形態１の解像度範囲選択回路１０８で、最大解像度と最小解像度を設定するものとしたが、非常に圧縮が困難で非常に小さな解像度になる可能性のある画像を入力しないのであれば、最大解像度のみを設定してもよい。

　また、ビットレート決定回路１０５で導出したビットレートに応じて解像度範囲選択回路１０８で最大解像度と最小解像度を設定するものとしたが、これに限ることなく、ユーザが明示的にビットレートを設定し、ユーザが設定したビットレートに応じて解像度範囲選択回路１０８で最大解像度と最小解像度とを設定してもよい。

　この発明は、動画像を符号化して伝送路上に送出する動画像符号化装置および動画像符号化方法に有利に利用される。

　１０　　　　　　　　　　　　　　　　　　　　動画像符号化装置
　２０　　　　　　　　　　　　　　　　　　　　画像変換部
　３０　　　　　　　　　　　　　　　　　　　　動画像符号化部
　４０　　　　　　　　　　　　　　　　　　　　ビットレート決定部
　５０　　　　　　　　　　　　　　　　　　　　解像度範囲選択部
　１００，２００，３００，４００，５００　　　動画入力端子
　１０１，５０１　　　　　　　　　　　　　　　解像度変更回路
　１０２，５０２　　　　　　　　　　　　　　　フレームレート変更回路
　１０３，５０３　　　　　　　　　　　　　　　動画像符号化回路
　１０４，４０６，５０４　　　　　　　　　　ビットストリーム出力端子
　１０５　　　　　　　　　　　　　　　　　　　ビットレート決定回路
　１０６，５０６　　　　　　　　　　　　　　　量子化ステップ制御回路
　１０７　　　　　　　　　　　　　　　　　　　量子化ステップ平均回路
　１０８　　　　　　　　　　　　　　　　　　　解像度範囲選択回路
　１０９　　　　　　　　　　　　　　　解像度・フレームレート選択回路
　１１０　　　　　　　　　　　　　　　　　　　画像変換部
　２０１　　　　　　　　　　　　　　　フレームレート選択信号入力端子
　２０２，３０３　　　　　　　　　　　　　　　フレームメモリ
　２０３，３０５　　　　　　　　　　　　　　書き込み読み出し制御回路
　２０４，３０６　　　　　　　　　　　　　　　動画出力端子
　３０１　　　　　　　　　　　　　　　　　　　水平方向ＬＰＦ回路
　３０２　　　　　　　　　　　　　　　　　　　垂直方向ＬＰＦ回路
　３０４　　　　　　　　　　　　　　　　　　　解像度選択信号入力端子
　４０１　　　　　　　　　　　　　　　　　　　入力画像メモリ
　４０２　　　　　　　　　　　　　　　　　　　差分演算回路
　４０３　　　　　　　　　　　　　　　　　　　直交変換回路
　４０４　　　　　　　　　　　　　　　　　　　量子化回路
　４０５　　　　　　　　　　　　　　　　　　　可変長符号化回路
　４０７　　　　　　　　　　　　　　　　　　　量子化ステップ入力端子
　４０８　　　　　　　　　　　　　　　　　　　逆量子化回路
　４０９　　　　　　　　　　　　　　　　　　　逆直交変換回路
　４１０　　　　　　　　　　　　　　　　　　　加算演算回路
　４１１　　　　　　　　　　　　　　　　　　　参照画像メモリ
　４１２　　　　　　　　　　　　　　　　　　　動きベクトル検出回路
　４１３　　　　　　　　　　　　　　　　　　　動き補償回路
　４１４　　　　　　　　　　　　　　　　　　　面内予測回路
　４１５　　　　　　　　　　　　　　　　　　符号化モード選択制御回路
　４１６　　　　　　　　　　　　　　　　　　　予測画像セレクター回路
　４１７　　　　　　　　　　　　　　　　　解像度変更発生信号入力端子
　５０７　　　　　　　　　　　　　　　　　　　フレームレート制御回路
　５０８　　　　　　　　　　　　　　　　　　　解像度設定回路
　ｅｘ１００　コンテンツ供給システム
　ｅｘ１０１　インターネット
　ｅｘ１０２　インターネットサービスプロバイダ
　ｅｘ１０３　ストリーミングサーバ
　ｅｘ１０４　電話網
　ｅｘ１０６，ｅｘ１０７，ｅｘ１０８，ｅｘ１０９，ｅｘ１１０　基地局
　ｅｘ１１１　コンピュータ
　ｅｘ１１２　ＰＤＡ
　ｅｘ１１３，ｅｘ１１６　カメラ
　ｅｘ１１４　カメラ付デジタル携帯電話（携帯電話）
　ｅｘ１１５　ゲーム機
　ｅｘ１１７　マイク
　ｅｘ２００　デジタル放送用システム
　ｅｘ２０１　放送局
　ｅｘ２０２　放送衛星（衛星）
　ｅｘ２０３　ケーブル
　ｅｘ２０４，ｅｘ２０５，ｅｘ６０１　アンテナ
　ｅｘ２１０　車
　ｅｘ２１１　カーナビゲーション（カーナビ）
　ｅｘ２１２　再生装置
　ｅｘ２１３，ｅｘ２１９　モニタ
　ｅｘ２１４，ｅｘ２１５，ｅｘ２１６，ｅｘ６０７　記録メディア
　ｅｘ２１７　セットトップボックス（ＳＴＢ）
　ｅｘ２１８　リーダ／レコーダ
　ｅｘ２２０　リモートコントローラ
　ｅｘ２３０　情報トラック
　ｅｘ２３１　記録ブロック
　ｅｘ２３２　内周領域
　ｅｘ２３３　データ記録領域
　ｅｘ２３４　外周領域
　ｅｘ３００　テレビ
　ｅｘ３０１　チューナ
　ｅｘ３０２　変調／復調部
　ｅｘ３０３　多重／分離部
　ｅｘ３０４　音声信号処理部
　ｅｘ３０５　映像信号処理部
　ｅｘ３０６，ｅｘ５０７　信号処理部
　ｅｘ３０７　スピーカ
　ｅｘ３０８，ｅｘ６０２　表示部
　ｅｘ３０９　出力部
　ｅｘ３１０，ｅｘ５０１　制御部
　ｅｘ３１１，ｅｘ５０５，ｅｘ７１０　電源回路部
　ｅｘ３１２　操作入力部
　ｘ３１３　ブリッジ
　ｅｘ３１４，ｅｘ６０６　スロット部
　ｅｘ３１５　ドライバ
　ｅｘ３１６　モデム
　ｅｘ３１７　インターフェース部
　ｅｘ３１８，ｅｘ３１９，ｅｘ３２０，ｅｘ３２１，ｅｘ４０４，ｅｘ５０８　バッファ
　ｅｘ４００　情報再生／記録部
　ｅｘ４０１　光ヘッド
　ｅｘ４０２　変調記録部
　ｅｘ４０３　再生復調部
　ｅｘ４０５　ディスクモータ
　ｅｘ４０６　サーボ制御部
　ｅｘ４０７　システム制御部
　ｅｘ５００　ＬＳＩ
　ｅｘ５０２　ＣＰＵ
　ｅｘ５０３　メモリコントローラ
　ｅｘ５０４　ストリームコントローラ
　ｅｘ５０６　ストリームＩ／Ｏ
　ｅｘ５０９　ＡＶ　Ｉ／Ｏ
　ｅｘ５１０　バス
　ｅｘ６０３　カメラ部
　ｅｘ６０４　操作キー
　ｅｘ６０５　音声入力部
　ｅｘ６０８　音声出力部
　ｅｘ７０１　送受信回路部
　ｅｘ７０２　ＬＣＤ制御部
　ｅｘ７０３　カメラインターフェース部（カメラＩ／Ｆ部）
　ｅｘ７０４　操作入力制御部
　ｅｘ７０５　音声処理部
　ｅｘ７０６　変復調回路部
　ｅｘ７０７　記録再生部
　ｅｘ７０８　多重分離部
　ｅｘ７０９　画像復号部
　ｅｘ７１１　主制御部
　ｅｘ７１２　画像符号化部
　ｅｘ７１３　同期バス

Claims

　入力画像を符号化して符号化ビットストリームを生成し、当該符号化ビットストリームを伝送路上に送出する動画像符号化方法であって、
　前記入力画像の符号化の困難さの程度に応じて、前記入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換ステップと、
　前記画像変換ステップで出力される前記符号化対象画像を符号化して前記符号化ビットストリームを生成し、当該符号化ビットストリームを前記伝送路上に送出する動画像符号化ステップと、
　前記伝送路上に送出される前記符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定ステップと、
　前記ビットレート決定ステップで決定された前記符号化ビットレートに応じて前記符号化対象画像の解像度の上限値を決定し、前記符号化対象画像の解像度が前記上限値を上回らないように前記画像変換ステップでの変更を制御する解像度範囲選択ステップとを含む
　動画像符号化方法。
　前記解像度範囲選択ステップは、さらに、前記ビットレート決定ステップで決定された前記符号化ビットレートに応じて、前記符号化対象画像の解像度の下限値を決定し、前記符号化対象画像の解像度が前記下限値を下回らないように前記画像変換ステップでの変更を制御する
　請求項１に記載の動画像符号化方法。
　前記解像度変換ステップでは、前記符号化対象画像の解像度を変更した後、所定の時間が経過するまで、および所定数の前記入力画像を処理するまでの少なくとも一方の条件を満たすまで、前記符号化対象画像の解像度を変更しない
　請求項１または２に記載の動画像符号化方法。
　前記符号化ビットレートは、送信機器と受信機器との間で実際に送受信できた符号化ビットストリーム量を計測して得られる前記伝送路の伝送可能ビットレートに基づいて決定される
　請求項２または３に記載の動画像符号化方法。
　該動画像符号化方法は、さらに、
　前記符号化ビットストリームが、前記ビットレート決定ステップで決定された前記符号化ビットレートで伝送可能な符号量となるような量子化ステップを算出し、算出した前記量子化ステップで前記動画像符号化ステップに前記符号化対象画像を量子化させる量子化ステップ算出ステップと、
　所定の時間内に前記量子化ステップ算出ステップで算出された前記量子化ステップの平均値である量子化ステップ平均値を算出する平均値算出ステップとを含み、
　前記画像変換ステップは、
　前記平均値算出ステップで算出された前記量子化ステップ平均値に基づいて前記入力画像の符号化の困難さの程度を判断し、前記符号化対象画像の解像度およびフレームレートを決定する画質決定ステップと、
　前記入力画像を前記画質決定ステップで決定された解像度に変更する解像度変更ステップと、
　前記入力画像を前記画質決定ステップで決定されたフレームレートに変更するフレームレート変更ステップとを含む
　請求項２～４のいずれか１項に記載の動画像符号化方法。
　前記画質決定ステップは、直前に決定された解像度より小さい第１の解像度および大きい第２の解像度の少なくとも一方を予め保持し、
　前記平均値算出ステップで算出された前記量子化ステップ平均値が予め定めた第１の閾値より大きく、かつ保持している前記第１の解像度が前記下限値以上である場合に、前記解像度変更ステップに前記入力画像の解像度を前記第１の解像度に変更させ、
　前記平均値算出ステップで算出された前記量子化ステップ平均値が予め定めた第２の閾値より小さく、かつ保持している前記第２の解像度が前記上限値以下である場合に、前記解像度変更ステップに前記入力画像の解像度を前記第２の解像度に変更させる
　請求項５に記載の動画像符号化方法。
　前記画質決定ステップは、さらに、直前に決定されたフレームレートより小さい第１のフレームレートおよび大きい第２のフレームレートの少なくとも一方を予め保持し、
　前記解像度変更ステップで前記入力画像の解像度が前記第１の解像度に変更された場合に、前記フレームレート変更ステップに前記入力画像のフレームレートを前記第２のフレームレートに変更させ、
　前記解像度変更ステップで前記入力画像の解像度が前記第２の解像度に変更された場合に、前記フレームレート変更ステップに前記入力画像のフレームレートを前記第１のフレームレートに変更させる
　請求項５に記載の動画像符号化方法。
　前記画質決定ステップは、さらに、直前に決定されたフレームレートより小さい第１のフレームレートおよび大きい第２のフレームレートの少なくとも一方を予め保持し、
　前記平均値算出ステップで算出された前記量子化ステップ平均値が予め定めた第１の閾値より大きく、かつ保持している前記第１の解像度が前記下限値を下回る場合に、前記フレームレート変更ステップに前記入力画像のフレームレートを前記第１のフレームレートに変更させ、
　前記平均値算出ステップで算出された前記量子化ステップ平均値が予め定めた第２の閾値より小さく、かつ保持している前記第２の解像度が前記上限値を上回る場合に、前記フレームレート変更ステップに前記入力画像のフレームレートを前記第２のフレームレートに変更させる
　請求項６または７に記載の動画像符号化方法。
　入力画像を符号化して符号化ビットストリームを生成し、当該符号化ビットストリームを伝送路上に送出する動画像符号化装置であって、
　前記入力画像の符号化の困難さの程度に応じて、前記入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換部と、
　前記画像変換部から出力される前記符号化対象画像を符号化して前記符号化ビットストリームを生成し、当該符号化ビットストリームを前記伝送路上に送出する動画像符号化部と、
　前記伝送路上に送出される前記符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定部と、
　前記ビットレート決定部で決定された前記符号化ビットレートに応じて前記符号化対象画像の解像度の上限値を決定し、前記符号化対象画像の解像度が前記上限値を上回らないように前記画像変換部を制御する解像度範囲選択部とを備える
　動画像符号化装置。
　コンピュータに、入力画像を符号化して符号化ビットストリームを生成させ、当該符号化ビットストリームを伝送路上に送出させるプログラムであって、
　前記入力画像の符号化の困難さの程度に応じて、前記入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換ステップと、
　前記画像変換ステップで出力される前記符号化対象画像を符号化して前記符号化ビットストリームを生成し、当該符号化ビットストリームを前記伝送路上に送出する動画像符号化ステップと、
　前記伝送路上に送出される前記符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定ステップと、
　前記ビットレート決定ステップで決定された前記符号化ビットレートに応じて前記符号化対象画像の解像度の上限値を決定し、前記符号化対象画像の解像度が前記上限値を上回らないように前記画像変換ステップでの変更を制御する解像度範囲選択ステップとを、コンピュータに実行させる
　プログラム。
　入力画像を符号化して符号化ビットストリームを生成し、当該符号化ビットストリームを伝送路上に送出する集積回路であって、
　前記入力画像の符号化の困難さの程度に応じて、前記入力画像の解像度およびフレームレートの少なくとも一方を変更して符号化対象画像を出力する画像変換部と、
　前記画像変換部から出力される前記符号化対象画像を符号化して前記符号化ビットストリームを生成し、当該符号化ビットストリームを前記伝送路上に送出する動画像符号化部と、
　前記伝送路上に送出される前記符号化ビットストリームのビットレートである符号化ビットレートを決定するビットレート決定部と、
　前記ビットレート決定部で決定された前記符号化ビットレートに応じて前記符号化対象画像の解像度の上限値を決定し、前記符号化対象画像の解像度が前記上限値を上回らないように前記画像変換部を制御する解像度範囲選択部とを備える
　集積回路。