JP4341078B2

JP4341078B2 - 動画像情報の符号化装置

Info

Publication number: JP4341078B2
Application number: JP03047897A
Authority: JP
Inventors: 美樹男笹木; 健詞山本
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 1997-02-14
Filing date: 1997-02-14
Publication date: 2009-10-07
Anticipated expiration: 2017-02-14
Also published as: JPH10229558A

Description

【０００１】
【発明の属する技術分野】
本発明は、動画像情報を所定の伝送容量の範囲内で伝送可能となるように圧縮符号化する場合において動画像の動きを損なうことなく有効な符号化を行なうことができるようにした動画像情報の符号化装置に関する。
【０００２】
【発明が解決しようとする課題】
近年、情報通信端末のマルチメディア化が急速に進んでおり、電話においてもディジタルデータ伝送に基づく様々な付加価値を生み出していくことが、今後のビジネス展開において必須な条件となってきている。特に、自動車電話やＰＨＳ（Personal Handy-phone System ）においては既に従来の音声，文字情報のみならず、静止画像や動画像を伝送することが本格的に検討されつつあり、電話機のマルチメディア化は近い将来に当たり前のこととなることが予想される。
【０００３】
しかし、画像を伝送する場合に、何等処置を行わずそのまま伝送するのでは、約１６６Ｍｂｐｓ（mega bit per second ）に相当する膨大なＴＶ映像のデータ量であるから、自動車電話（９．６ｋｂｐｓ）やＰＨＳ（３２ｋｂｐｓ）や既存の電話回線の伝送レート（１０〜３０ｋｂｐｓ程度）程度の伝送容量では１フレームの画像データを送信するのに多大な時間を要してしまい、動画像の伝送には不適切である。
【０００４】
このようなことに対応して、従来のＴＶ会議やビデオＣＤに用いられている動画像圧縮技術が要求されるが、現行のＴＶ会議用規格であるＩＴＵ−Ｔ／Ｈ．２６１では、６４ｋｂｐｓ〜２Ｍｂｐｓ程度、ＩＳＯ／ＭＰＥＧ１では１．５Ｍｂｐｓ程度のものを対象としており、ここで対象としている６４ｋｂｐｓ以下の超低レート伝送には適用することができないものである。
【０００５】
一方、現在ＩＴＵ−Ｔで審議されているＨ．２６３は、６４Ｋｂｐｓ以下の伝送レートを対象としているが、この場合には有線系の伝送を対象とするものであり、移動体通信の無線系で発生するデータ伝送誤りのレベル（１０^−２〜１０^−３程度）に対する対策がなされていないものである。また、これらの規格におけるエンコーダは動き補償技術を用いるため、演算量が増大することになり、低コスト化の実現は困難なものである。
【０００６】
さらには、上述のような伝送容量の範囲内であっても、画像情報のみならず、同時に音声情報についても送信する場合には、画像情報の伝送容量についてはさらに制約を受けることになる。また、このような音声情報は、発生量の変動が大きくなることが予想されるので、伝送容量を割り当てる場合においても弾力的に変動させて有効に利用する必要がある。そして、音声情報の伝送容量が変動することは画像情報の伝送容量についてもこれに追随して変動することになるが、そのような状況の下でいかに動画像情報を有効に符号化して伝送するかということが課題となってくる。
【０００７】
本発明は、上記事情に鑑みてなされたもので、その目的は、伝送容量が制約されている範囲内で使用者にとって必要と思われる画像情報を効率的に選択符号化して良質な動画像情報を提供できるようにする画像情報の符号化装置を提供することにある。
【０００８】
【課題を解決するための手段】
請求項１の発明では、変化ブロック検出手段により、そのフレーム内の複数のブロックについてそれらの画像データが前フレームの該当するブロックの画像データとの変化量が所定レベル以上となる変化ブロックを検出し、その検出された変化ブロックについてのみ符号化処理手段により符号化を行なうので、限られた伝送容量の範囲内で変化が生じている領域についての情報を有効に伝送することができる。
【００１２】
さらに、符号化条件設定手段を設けているので、上述の変化ブロックについての符号化を行なう際に、変化ブロックの発生量や変化量等のデータに応じて符号化処理の条件を伝送容量の範囲内で変更して有用な情報を取捨選択してより良質な動画像を伝送することができるようになる。
【００２１】
そして、符号化条件設定手段は、符号化するフレームに対する符号化処理条件を前フレームの符号化処理を行なったときのデータ量から画像データの送信可能な容量を余裕度として検出し、その結果に基づいて符号化条件を設定するようになり、これにより、前フレームから連続する動画像の伝送に際して余裕度に応じた符号化条件を用いた効率的な符号化処理を行なうことができるようになる。
【００２２】
請求項２の発明では、符号化条件設定手段は、検出された変化ブロックの動き量を演算してその動き量に基づいて符号化条件を設定するので、動き量に応じて増大する情報発生量を符号化条件を適切に設定することにより全体のバランスを考慮して伝送容量の範囲内で効率的な符号化を行なって伝送信号を生成させることができるようになる。
【００２３】
請求項３の発明では、符号化条件設定手段は、検出された変化ブロックの色変化量を演算してその色変化量に基づいて符号化条件を設定するので、色変化量に応じて増大する情報発生量を符号化条件を適切に設定することにより全体のバランスを考慮して伝送容量の範囲内で効率的な符号化を行なって伝送信号を生成させることができるようになる。
【００２４】
請求項４の発明では、符号化条件設定手段は、変化ブロックの動き量および色変化量の両者を重み付けを行なって加算することにより総合変化量を求め、その総合変化量に基づいて符号化条件を設定するので、動き量を重視する場合と色変化量を重視する場合との間の比率を重み付け係数により適宜設定すれば、フレームの画像に則した適切な符号化条件を設定して効率的な符号化処理を行なわせることができるようになる。
【００２５】
請求項５の発明では、符号化条件設定手段は、変化ブロックの動き量を検出する際に、それら変化ブロックの重心位置を求めると共にその重心位置の前フレームに対する動きベクトルを求め、これに変化ブロックの総個数を乗じて動き量を求めるので、演算量を削減して簡略的に動き量を検出することができるようになる。
【００２６】
請求項６の発明では、符号化条件設定手段は、変化ブロックの動き量を検出する際に、それら各変化ブロックの前フレームに対する動きベクトルを求め、それらの総和を演算することにより得るので、正確な動き量を求めることができるようになる。
【００２７】
請求項７の発明では、上述の場合に、変化ブロックの動きベクトルを計算する際には、その変化ブロック内のすべての画素について演算対象とするのではなく、サンプリングされた画素のデータについて演算を行なうので、演算量を削減させることができる。
【００２９】
請求項８の発明では、符号化条件設定手段により、画像データ送信の余裕度，変化ブロックの動き量，色変化量あるいは総合変化量のいずれかまたはその組み合わせにより得られる値に応じて、次フレームにおける変化ブロック検出のためのしきい値や変化ブロックの符号化のための量子化スケールおよびフレームの変化判定のしきい値を設定するので、画像状態に応じて変化ブロックの検出レベルを適切に変更して変化ブロックの発生個数を制御して情報発生量を制御することができると共に、量子化スケールやフレームの変化判定のしきい値を変更して符号化処理を効率的に行なうことができるようになる。
【００４９】
【発明の実施の形態】
以下、本発明を音声情報および画像情報を同時に伝送するようにした無線系の通信装置に適用した場合の一実施例について図面を参照しながら説明する。
図１を参照して本実施例の構成について説明する。まず、送信機として機能する符号化器１において、撮像手段としてのカメラ２は使用者の上半身を撮影するもので、画像情報をＲＧＢアナログ信号として出力する。Ａ／Ｄ変換部３は、カメラ２から与えられるアナログ信号をデジタル信号に変換して出力する。ＲＧＢ／ＣＩＦ変換部４は、Ａ／Ｄ変換部３から与えられるＲＧＢデジタル信号をＣＩＦ（Common Intermediate Format；共通中間フォーマット）信号に変換して出力する。
【００５０】
二次元高速ＤＣＴ（離散コサイン変換）部５は、ＲＧＢ／ＣＩＦ変換部４からＣＩＦ信号が与えられると、変換処理すべきブロックに対して二次元直交変換の一つである二次元ＤＣＴ（Ｈ．２６１規定の二次元直交変換に対応している）処理してＤＣＴ係数の信号を出力する。また、変化ブロック検出手段としての変化領域抽出部６は、ＲＧＢ／ＣＩＦ変換部４からＣＩＦ信号が与えられるようになっており、そのＣＩＦ信号に基づいて後述するようにして変化ブロックを検出し、その結果に応じて二次元高速ＤＣＴ部５に対して二次元ＤＣＴ処理を行なうべき変化ブロックを指定する。
【００５１】
量子化部７は、符号化条件設定手段としての符号化制御部８により量子化スケールＱＳＣが設定されており、二次元高速ＤＣＴ部５から与えられるＤＣＴ係数の信号を設定されている量子化スケールＱＳＣで直線量子化変換あるいはデッドゾーン付量子化変換処理をして例えば９ビットの精度で量子化して出力する。有意係数属性制御部９は、符号化制御部８から与えられる条件にしたがって量子化部７から与えられる量子化されたＤＣＴ係数の信号に対して属性制御を行なって可変長符号化部１０に出力する。
【００５２】
可変長符号化部１０は、ＤＣＴ係数の信号に対して対応する可変長符号を割り当てて階層結合部１１を介して変換することによりシンタックスに基づくビットストリームを生成してバッファ１２に出力する。バッファ１２では、信号送信部１３に出力するデータの出力速度を制御すると共に、内部のデータ量を符号化制御部８に出力するようになっている。信号送信部１３は、ＲＳ２３２ｃ通信処理部１４およびデジタル携帯電話機１５から構成されており、バッファ１２から出力されるビットストリーム信号をデジタル携帯電話機１５を介して無線により伝送する。デジタル携帯電話機１５は、例えば９６００ｂｐｓ（bit per second）の伝送容量（伝送レート）に設定されており、音声信号と画像信号がこの伝送容量の範囲内で伝送されるようになっている。
【００５３】
次に、受信機として機能する復号化器１６の構成について説明する。信号受信部１７は、デジタル携帯電話機１８およびＲＳ２３２ｃ通信処理部１９から構成され、デジタル携帯電話機１８により受信したビットストリーム信号を入力バッファ２０で受け取るようになっている。パーザ２１は、バッファ２０に蓄積されるデータを取り込んでシンタックス解析を行ない可変長復号化部２２に出力する。可変長復号化部２２は、入力された信号の可変長符号を復号化して有意係数属性再生部２３を介して逆量子化部２４に出力する。
【００５４】
逆量子化部２４では再構成した量子化出力９ビットを１２ビットの信号に逆変換して出力する。さらに、二次元高速逆ＤＣＴ２５では二次元逆ＤＣＴ処理を行うことにより８ビットの画素データに戻す。復号化制御部２６では有意係数属性再生部２３にて復号化した符号化属性をもとにして逆量子化部２４の制御を行うようになっている。
【００５５】
ＣＩＦ／ＲＧＢ変換部２７では、８ビットの画素データをＣＩＦ形式からＲＧＢ信号に変換し、Ｄ／Ａ変換部２８を介してアナログ信号に変換して表示器２９に出力するようになっている。
【００５６】
なお、この復号化器１６の構成では、可変ＧＯＢパターンおよび画像データサイズの適応的変更の２つの機能を実行するように構成されているが、符号化器１側でこの機能を実施しない場合には、復号化器１６の構成を既存規格のものと同等のものを採用することができる。
【００５７】
次に本実施例の作用について、まず、全体の流れを図２ないし図６を参照して説明し、さらに詳細について図７以下を参照して説明する。なお、説明の都合上、次のように項目別に分けて述べる。（１）符号化処理の原理の概略説明、（２）符号化処理の全体の流れ（図２ないし図６参照）、（３）各部処理内容の詳細説明。
【００５８】
（１）符号化処理の原理の概略説明
通常、Ｈ．２６１やＭＰＥＧ規格ではフレーム間符号化が用いられ、そこでは空間領域のブロック画素値のフレーム間差分に対して二次元ＤＣＴ（二次元離散コサイン変換）が施される。したがって、復号時にはこの差分データを復号処理してフレーム間の累積を行うことにより、画像を再構成していくことになる。ところが、この方法ではデジタル無線通信路においてビット誤りが発生した場合に、Ｈ．２６１やＨ．２６３あるいはＭＰＥＧ規格のような複雑なシンタックスのプロトコルでは、各符号語の持つ値が全くもとの値とずれてしまう上に、時間方向に誤りが伝播してしまうことになる。
【００５９】
そこで、本実施例では、データ圧縮度は有線系で用いる一般的なフレーム間差分の符号化をする場合ほどには期待できないが、誤りがフレーム内で完結してしまうフレーム内符号化（イントラ符号化）のみをブロックベースで適用する構成を採用することにより無線系に強いものとしているのである。つまり、最初の１フレームについては全てのブロックについてフレーム内符号化であるイントラＤＣＴ符号化を実施し、２フレーム目以降の符号化処理においては、後述する変化ブロックの検出によって『変化あり』と判定されたブロックつまり変化ブロックのみについてイントラＤＣＴ符号化を行うのである。
【００６０】
なお、この方式では、フレーム間差分を符号化しないので、Ｈ２６１規格での動き補償差分を求めるループ演算が不要となる。したがって、これによって、動きベクトル検出処理および逆量子化処理のための構成が不要となると共に、ループフィルタおよび１フレーム分の画素データを記憶するための予測メモリが構成から不要になる。この結果、主要な演算内容としては、（ａ）二次元ＤＣＴ処理、（ｂ）量子化処理、（ｃ）可変長符号化処理、（ｄ）バッファ制御および（ｅ）変化ブロック検出処理だけとなり、この結果、パソコンのソフトウェアを用いた構成で、リアルタイムで動作可能な程度のレベルの機能ブロック構成とすることができるのである。
【００６１】
（２）符号化処理の全体の流れの説明（図２ないし図６）
符号化器１は、図２ないし図６に示す概略的な流れを示すフローチャートにしたがって次のようにして画像情報を符号化する。まず、符号化器１は、フレーム数を示す変数ＰＩＣをゼロにクリアし（ステップＳ１）、カメラ２によって撮影された画像情報を取り込んで（ステップＳ２）、Ａ／Ｄ変換部３においてデジタル信号に変換し（ステップＳ３）、この後、ＲＧＢ／ＣＩＦ変換部４においてＲＧＢ／ＣＩＦ変換を行う（ステップＳ４）。
【００６２】
続いて、符号化器１は、画像情報の状態観測のステップＳ５（図３参照），符号化状態と要求の判定のステップＳ６（図４参照），符号化パラメータ決定のステップＳ７（図５参照）および符号化演算処理のステップＳ８（図６参照）と順次実行し、フレーム番号ＬＰＩＣが所定の個数ＮＰＩＣに達するまで繰り返し実行する（ステップＳ９）。以下に、ステップＳ５ないしＳ９の内容について図３ないし図６を参照して説明する。
【００６３】
（Ａ）画像信号の状態観測（図３参照）
符号化器１は、画像情報の状態観測のステップＳ５に進むと、プログラム（図３参照）にしたがって、シーンの特徴に応じてＧＯＢパターンの設定を行う（ステップＡ１）。次に、符号化器１は、２フレーム目以降の場合は現在フレームの符号化計算を行う前に、前フレームでの計算結果に基づき、変化ブロック数を計算するために（ステップＡ３）、まず、画像１フレーム全体の色変化量，動き量，情報発生量のレベル判定を各々について行う（ステップＡ４〜６）。
【００６４】
なお、このようなレベル判定については別途に詳述する。また、シーンが変わってから第１番目のフレームについては強制的に全ブロックについてイントラＤＣＴ符号化を行うので、ステップＡ４〜Ａ６の処理については実施しないようになっている。
【００６５】
各フレームにおいてブロック間変化量の定義に基づいてＭＢＫ（マクロブロック）単位に輝度変化量，色変化量を計算し（ステップＡ１１，Ａ１２）、デフォルト値あるいは前フレームの計算で設定された変化判定しきい値を基にして変化ブロックの判定を行う（ステップＡ１３）。そして、変化ブロックでない場合には図６に示すステップＳ８の符号化演算処理のステップＤ８にジャンプし、変化ブロックと判定された場合には、変化ブロック数のカウンタをインクリメントしてこのプログラムを終了する。
【００６６】
（Ｂ）符号化状態と要求の判定（図４参照）
符号化器１のバッファ１２に溜め込まれた符号化ビットストリームのビット数（バッファ量ＢＦ）をチェックする（ステップＢ１）。次に、符号化器１は、使用者からのプロテクト要求の設定状態（ＯＮ／ＯＦＦ）を判定する（ステップＢ２）。また、ＡＶ比率に関する要求度Ｒａを相手端末と自己端末の要求値に基づいて判定する（ステップＢ３）。次に、音声信号の状態を検出して（ステップＢ４）、無音状態や突発的音声などの検出された音声信号の状態に応じて音声符号化レートＢＲＡを決定する（ステップＢ５）。次に、バッファ１２のバッファ量ＢＦと音声符号化レートＢＲＡの値からデータレート余裕度ＡＤＲと目標画像符号化レートＢＲＶ０を決定する（ステップＢ６）。
【００６７】
一方で、動き量ＳＭのレベル判定値ＬＭ，色変化量ＤＣのレベル判定値ＬＣ，情報発生量のレベル判定値ＬＩの各々から画像のフレーム間変化量の総合的なレベル判定値Ｌを計算し（ステップＢ７）、データレート余裕度ＡＤＲのレベル判定値ＬＡＤＲと総合的なレベル判定値Ｌとからテーブル（後述する表１参照）を参照して符号化パラメータの推奨値を計算する（ステップＢ８）。
【００６８】
（Ｃ）符号化パラメータ決定（図５参照）
次に、符号化パラメータの決定を行う。ここでは、音声符号化レートＢＲＡと目標画像符号化レートＢＲＶ０との値に基づいて、全体の伝送容量である符号化レートＢＲから画像符号化レートＢＲＶを演算する（ステップＣ１）。この場合、これらの値の間には、
ＢＲＡ＋ＢＲＶ≦ＢＲ
という関係が満たされることが条件となっており、この条件のもとに画像符号化レートＢＲＶの値が決定されるが、データレート余裕度ＡＤＲはバッファ量ＢＦを監視した後に決定される。したがって、データレート余裕度ＡＤＲの値に応じて画像符号化レートＢＲＶは若干修正を受けることになる。これは、例えば、バッファ量ＢＦが平均充足量ＢＦａよりも少なければ、その分だけデータレート余裕度ＡＤＲが大きくなるので、画像符号化レートＢＲＶを大きく設定することができるのである。
【００６９】
フレームレートと画像サイズは総合判定レベルＬとデータレート余裕度ＡＤＲおよび画像への要求度ＲＶからテーブル（表３参照）を参照して決定される（ステップＣ２，Ｃ３）。また、量子化スケールＱＳＣは前述のテーブルを参照して決定する（ステップＣ４）。
【００７０】
次に、画面全体の変化ブロック数の判定しきい値ＮＣＢ＿ＴＨはＤＣＴ有意係数の伝送個数を制御するが、これは前述の表１を参照して決定する（ステップＣ５）。変化ブロック判定しきい値ＤＴＨも同様に表１を参照して決定する（ステップＣ６）。また、ブロック間変化量計算のサンプリング密度はシステム全体のＣＰＵ負荷の現在値のレベル判定結果から決定する（ステップＣ７）。
【００７１】
（Ｄ）符号化演算（図６参照）
符号化演算は、上記した（Ａ）〜（Ｃ）で決定された符号化パラメータを基にしてＨ．２６１／２６３の方式で行う（ステップＤ１〜Ｄ１４）。なお、この実施例においては、変化ブロックのＭＢＫ属性を強制的にイントラ（フレーム内符号化）とする以外には特別な処理は含まれていない。すなわち、二次元ＤＣＴ処理，量子化処理，有意係数制御処理，可変長符号化処理を順次行い（ステップＤ３〜Ｄ６）、続いて、ＭＢＫ属性制御処理，ＭＢＫ属性符号化処理，ＧＯＢ属性符号化処理，ＰＩＣ属性符号化処理を順次行ない（ステップＤ８〜Ｄ１３），この後、ビットストリームの階層結合を行なう（ステップＤ１４）。
【００７２】
（３）各部処理内容の詳細説明
次に、上述した符号化処理の全体の流れの説明で取り上げた各部の処理内容について詳細に説明する。なお、説明の項目は次に示すとおりである。
【００７３】
［ａ］変化ブロックの検出
［ａ−１］ブロック間変化量の計算
［ａ−２］しきい値判定
［ｂ］符号化と通信状態の判定
［ｂ−１］データレートの余裕度
［ｂ−２］動き量の判定
［ｂ−３］色変化量の判定
［ｂ−４］情報発生量の判定
【００７４】
［ｃ］情報発生量削減のための制御
［ｃ−１］画面全体の変化量の判定と伝送係数の制御
［ｃ−２］符号化状態に基づく変化判定しきい値制御
［ｃ−３］領域に応じた制御
［ｄ］画像データサイズの適応的変更
［ｅ］音声データと画像データとの比率に対する要求度の抽出
［ｅ−１］連続制御
［ｅ−２］プロテクト機能
［ｅ−３］ＡＶ比率の制御に関する優先順序
［ｅ−４］モード制御
【００７５】
［ｆ］パラメータ制御
［ｆ−１］要求度に基づく符号化レートの決定
［ｆ−２］遠隔モニタリングモードの符号化パラメータの遠隔制御
［ｆ−３］システム全体のパラメータ制御
［ｇ］ブロック雑音の除去
［ｈ］可変ＧＯＢ構造と識別番号の伝送
【００７６】
［ａ］変化ブロックの検出
あるアドレスのマクロブロックが前フレームに対してどれだけ変化したかを以下のようにして判定する。
［ａ−１］ブロック間変化量の計算
（ア）ブロック間変化量
原画像として入力されたマクロブロック（以下ＭＢＫと称する）について、１フレーム前のＭＢＫとの間のフレーム間誤差分の絶対値和をＭＢＫ毎に演算する。ここで、ＭＢＫは６個のＢＬＫ（ブロック）からなるので、以下のように総変化量Ｅ（ｎ，ｍ），輝度変化量ＥＬ（ｎ，ｍ），色変化量ＥＣ（ｎ，ｍ）を定義することができる。
【００７７】
【数１】

【００７８】
ここで、
Ｅ（ｎ，ｍ）；第ｎフレームの第ｍ番目のＭＢＫについて前フレームとの間の総変化量を示す値
ＥＬ（ｎ，ｍ）；第ｎフレームの第ｍ番目のＭＢＫについて前フレームとの間の輝度変化量を示す値
ＥＣ（ｎ，ｍ）；第ｎフレームの第ｍ番目のＭＢＫについて前フレームとの間の色変化量を示す値
ＭＢ（ｎ，ｍ，ｋ）；第ｎフレームの第ｍ番目のＭＢＫの第ｋ番目のＢＬＫ
ｄ（ＢＬＫｉ，ＢＬＫｊ）；ＢＬＫｉとＢＬＫｊとの間の誤差関数。ここでは画素単位の差分の絶対値和を計算する。
【００７９】
ＢＬＫｉ；ｉ番目のブロック画素
α ；色情報の誤差の荷重係数
【００８０】
（イ）計算の簡略化
上述したｄ（ＢＬＫｉ，ＢＬＫｊ）の計算において、ブロック内画素のすべてについて差分を演算するのではなく、例えば、図７に示すように、サンプリングした画素についてのみ変化量計算の対象とすることができる。同図（ａ）はＢＬＫ内の全ての画素（８×８＝６４個）について計算を行なう場合を示し、同図（ｂ）はＢＬＫ内の画素を１個置きにサンプリングする（４×８＝３２個、全画素の１／２）場合を示し、同図（ｃ）はＢＬＫ内の画素を１列置き且つ１個置きにサンプリングする（４×４＝１６個、全画素の１／４）場合を示している。
【００８１】
（ウ）簡易動ベクトル検出
上述の（イ）と同様にして、ブロック内画素をサンプリングすることにより、ブロックマッチング法の演算量を削減できるので、動ベクトル検出の演算量も削減することができる。
【００８２】
（エ）変化量域・注視領域に限定した動き検出の実行
符号化対象領域を信号変化条件やモデル条件、注視条件の適用などにより特定領域に限定することができる場合には、その限定された領域内でのみ動き検出を実行することにより、演算量を削減することができる。
【００８３】
［ａ−２］しきい値判定
ここでは、あるしきい値ＤＴＨによってＥ（ｎ，ｍ）を判定し、例えば、以下のようにして前フレームに対して変化があったか否かを判定する。
【００８４】
case１）Ｅ（ｎ，ｍ）≧ＤＴＨのとき
→変化があったと判定し、イントラ符号化を開始する。
case２）Ｅ（ｎ，ｍ）＜ＤＴＨのとき
→変化はないと判定し、符号化を行わない。
【００８５】
上述の内容は、例えば、実験によると、データレートが９．６ｋｂｐｓの場合に、ＣＩＦ画像に対して、量子化スケールパラメータＱＳＣＡＬＥを２０（量子化ステップ＝４０）、変化検出しきい値ＤＴＨを２０００程度に設定することで比較的良好な準動画像伝送を行うことができる。
【００８６】
［ｂ］符号化と通信状態の判定
［ｂ−１］データレートの余裕度ＡＤＲ
（ア）定義
超低レート通信では、人物像など動く対象物を符号化する場合に通信データレート（伝送容量）に余裕が発生することはあまりないが、人物が不在の状態や遠隔モニタリングなどの場合には変化があまり発生しないことから、データレートに余裕ができることがある。このようなデータレート余裕度ＡＤＲを次式のように定義づけることにする。
【００８７】
ＡＤＲ＝（画像通信レート）−（前フレームの符号化情報量）
これは符号化器出力バッファ１２のバッファ量ＢＦの増減に対応したバッファ余裕度を検出することで代用することもできるものである。
【００８８】
（イ）画像通信レートの動的適用制御
画像通信レート（画像伝送容量）は後述するＡＶ比率の要求度と現在の音声通信データ量に応じて時々刻々と変化させることができる。したがって、音声通信データが少ないと判断したときは要求度で初期設定した通信レートを変更して画像通信レートを拡大させることができるモードを設定する。
【００８９】
（ウ）音声データの急増に対する迅速な対応
上記のような方法で音声通信レート（音声伝送容量）を縮小した場合、突発的な音声データ増大に迅速に対応するには、画像符号化器１の出力停止、画像符号化器出力バッファ１２の送出停止、ＡＶレート設定の初期値（要求度から決定した値）への復帰を実行する。音声データ増大の検出には、音声通信に支障のない最大遅延時間ＴＡｄｅｌａｙに対して十分小さい時間Ｔとしてインパルス雑音と十分識別が可能な程度の時間幅として設定し、その時間Ｔ内での音声信号の積分値ＩＡを計算してあるしきい値以上になったときに音声データの増大であると判定するようにしたものである。
【００９０】
（エ）動作フローチャートの説明
上述した（イ）および（ウ）での音声データ発生量の増減に対する画像データレートの適応制御では、図８に示すプログラムのフローチャートにしたがって制御を行なう。
【００９１】
まず、突発的な音声データの増大があるか否かを検出する（ステップＴ１，Ｔ２）。ここでは、上述したごとく、サンプリングの時間Ｔ内での音声信号の積分値ＩＡを計算して（ステップＴ１）、その積分値ＩＡがあるしきい値以上になったときに有意の変化が生じたとしてこれをもって音声データの増大であると判定する（ステップＴ２）。
【００９２】
次に、判定結果から音声データの増大が検出されない場合、つまり無音状態の場合には、音声符号化レートを低減して（ステップＴ５）、代わりに画像符号化レートを増大させる（ステップＴ６）。一方、突発的な音声データの増大が検出された場合には、画像符号化の演算を停止する（ステップＴ７）と共に画像データの送出を停止し（ステップＴ８）、適応制御をしていた音声符号化レート，画像符号化レート（ＡＶレート）を使用者の要求度に基づいて設定した初期値に戻す（ステップＴ９）。また、無音状態ではないが、突発的な音声データの増大でもない状態であるときには、音声符号化レートは変更せず従前の状態を保持するようになっている。
【００９３】
［ｂ−２］動き量の判定
動き量の判定については、次の２つの場合について総動き量を演算する方法について説明する。なお、動き検出を行なわない場合（ア）および動き検出を行なう場合（イ）の違いは、動き検出を行なう方が正確な動き量を判定できる反面、動き検出を行なうことによる演算量の大幅な増大となる点で、これらは、制御部を構成するＣＰＵの処理能力に応じて、リアルタイムで処理する場合の大きな負担とならない場合には動き検出を行なう方を採用することができる。
【００９４】
（ア）動き検出を行わない場合
変化ブロックの重心計算を行い、１フレーム前に対するその動きベクトルの大きさを重心動ベクトルｖｇとする。この重心動ベクトルｖｇを変化ブロック数ＮＣＢだけ乗じた値を総動き量ＳＭとする。これらは次式のように示される。
【００９５】
【数２】

【００９６】
ここで、
ＮＭＢ；フレーム内のＭＢＫ数
ＩＧ（ｎ）；第ｎフレームにおける対象領域重心座標の水平成分
ＪＧ（ｎ）；第ｎフレームにおける対象領域重心座標の垂直成分
【００９７】
（イ）動き検出を行う場合
フレーム内の全てのマクロブロックの前フレームに対する動きベクトルの大きさを計算し、得られた動きベクトルの大きさの総和を求めてこれを総動き量ＳＭとするもので、次式で示される。
【００９８】
【数３】

【００９９】
上述のようにして得られる総動き量ＳＭから、あらかじめ設定されている複数のしきい値を用いて複数段階のレベルに判定してレベル判定値ＬＭを得る。この動き量のレベル判定値ＬＭは後述する符号化制御において用いられるようになっている。
【０１００】
［ｂ−３］色変化量の判定
変化ブロック検出で演算した変化量のうちで、色ブロックのみについての変化量を画面全体で合計して、総色変化量ＤＣを演算する。これは次式のように示される。
【０１０１】
【数４】

【０１０２】
ここで、
ＤＣ（ｎ）；第ｎフレームの総色変化量
ＮＭＢＫ；１フレーム中のＭＢＫ個数（ＣＩＦ形式の画像では２２×１８＝３９６個である）
ＥＣ（ｎ，ｍ）；第ｎフレームの第ｍ番目のＭＢＫについて前フレームとの間の色変化量
このＤＣ（ｎ）をいくつかの設定しきい値によりレベル判定し、これをレベル判定値ＬＣとする。
【０１０３】
［ｂ−４］情報発生量の判定
１フレーム前の画面全体の情報発生量をいくつかの設定しきい値によりレベル判定する。この判定結果をレベル判定値ＬＩとする。ＬＩは以下の因果関係で定められる。
ＲＡ→［Ｒｖ，ＡＤＲ］→ＬＩ
これは、音声要求度Ｒａが設定されることによって、全体の符号化レートの容量に対して画像要求度Ｒｖが決まり、この画像要求度Ｒｖとデータレート余裕度ＡＤＲとの関係から許容される情報発生量のレベル判定値ＬＩが定められる。
【０１０４】
［ｃ］情報発生量削減のための制御
［ｃ−１］画面全体の変化量の判定と伝送係数の制御
上述したしきい値判定の結果として得られた変化ブロック個数に基づいて、画面全体の変化度を判定する。これを用いて、例えば、以下のようにＤＣＴ係数の伝送を制御する。
【０１０５】
case１）ＮＣＢ≧ＮＣＢ＿ＴＨ１のとき
→変化ブロックのＤＣＴ有意係数のうち、ＤＣ成分のみを伝送する
case２）ＮＣＢ＿ＴＨ１＞ＮＣＢ≧ＮＣＢ＿ＴＨ２のとき
→注視領域以外の変化ブロックはＤＣ成分のみ伝送する
case３）ＮＣＢ＿ＴＨ２＞ＮＣＢのとき
→変化ブロックの有意係数をすべて伝送する
【０１０６】
ただし、
ＮＣＢ；１画面における変化ブロック個数
ＮＣＢ＿ＴＨｉ（ｉ＝１，２，…）；判定しきい値（データレート余裕度や使用モードによって可変）
である。
【０１０７】
［ｃ−２］符号化状態に基づく変化判定しきい値制御
動き量判定レベルＬＭ、色変化量判定レベルＬＣ、情報発生量判定レベルＬＩ、データレート余裕度の判定レベルＬＡＤＲから変化領域判定しきい値ＤＴＨおよび量子化スケールＱＳＣを動的に決定する。すなわち、
［ＬＭ，ＬＣ，ＬＩ，ＬＡＤＲ］→［ＤＴＨ，ＱＳＣ，ＮＣＢ＿ＴＨ］
とする。この場合、各レベル判定値のうちＬＭ，ＬＣ，ＬＩについては、具体的には、例えば、次式を用いて、総合判定レベルＬを演算してその結果に基づいて決定を行なう。
【０１０８】
【数５】

【０１０９】
したがって、総合判定レベルＬとデータレート余裕度ＬＡＤＲとの組み合わせから、変化領域判定しきい値ＤＴＨ，量子化スケールＱＳＣ，画面全体の変化判定しきい値ＮＣＢ＿ＴＨを決定する。したがって、
［Ｌ，ＬＡＤＲ］→［ＤＴＨ，ＱＳＣ，ＮＣＢ＿ＴＨ］
を考えると、ＬおよびＬＡＤＲがそれぞれ０〜３の４段階の値をとる場合には、次の表１のような制御例を採用することができる。
【０１１０】
【表１】

【０１１１】
［ｃ−３］領域に応じた制御
（ア）領域の設定
▲１▼領域の自動設定
注視領域、動きや色のクラスタリング等の手法により複数個の領域を設定する。この手法についてはいくつかの方法が考えられるが、本実施例では採用していないので、その可能性を述べるのみにとどめてここでは言及しない。
【０１１２】
▲２▼マニュアル設定
たとえば、以下に示すような種々の設定方法があり、いずれか一方あるいは両方を採用して設定に用いることができる。
【０１１３】
i ）送信側でユーザがモニタ画像を見ながら送信するシーンについて設定する方法。
ii）受信側でユーザが受信画像を見ながら送信側のシーンについて設定する方法。
【０１１４】
（イ）複数個の領域の記述
上記で設定した複数個の領域をその重心と領域の幅により記述する。例えば、ライン方向に並行な矩形領域を記述する場合、以下の表２のようになる。ここではＣＩＦ形式のマクロブロックを単位として記述している。
【０１１５】
【表２】

【０１１６】
上述の場合に、領域のカテゴリに関しては、前述したようなマニュアル設定では人間の介在により決定することができる。また、自動設定に関してもいくつかの方法が考えられるが、ここでは省略する。
【０１１７】
（ウ）領域のモニタリング
▲１▼固定領域のモニタリング
領域の重心と大きさが決まれば、二次元の固定された窓としてモニタリングができる。この場合、この窓内の画像領域は優先的に情報量を割り当てることにより、高画質や更新速度の高い動画として再生させることができる。
【０１１８】
▲２▼動領域のトラッキング
最初に設定した領域重心と大きさを固定化するのではなく、自動設定に用いた手法やフレーム相関（例えば動き検出など）により、領域内に映った対象物の動きに基づいてトラッキングしていくことができる。これは、対象物や対象人物の三次元形状をモデル化して登録すると共にその動きについて推定されるものを予測するモデルベース三次元運動推定に用いた移動体領域抽出手法などによって実現できる。
【０１１９】
▲３▼領域情報の伝送
前述のように定義した領域情報（領域番号、重心、水平幅、垂直幅）とその領域内の画像情報のみを伝送することにより、必要な領域に絞った符号化処理を行なうことができ、効率的に情報発生量を削減することができる。
【０１２０】
▲４▼領域のプライオリティ
複数の領域を指定する場合には、情報量を割り当てる場合にプライオリティ（優先順位）をつける。ここで、領域番号は画像伝送上、重要と思われる領域から順番につける。ただし、背景の領域番号は０とする。プライオリティの変更については変更を示すフラグと変更情報のみを送る。変更情報は例えば、複数の領域に対応して順番を番号により設定して送る。
（３４２１）→この場合には、領域３を最優先、領域４を２番目、領域２を３番目、領域１を４番目に伝送することを示す。
【０１２１】
（エ）領域別しきい値設定
プライオリティに応じて変化判定しきい値ＤＴＨを自動設定する。例えば、ＤＴＨ０〜ＤＴＨ３の順番に、
［１０００，１５００，２０００，２５００］
のように設定する。あるいは個別に領域毎の変化判定しきい値ＤＴＨを設定することもできる。
【０１２２】
（オ）設定しきい値の適応的変更
画像内容の急激な変化（シーンチェンジ、移動物の出現／消失など）が終息し、画面全体の変化量が少なくなると、データレート余裕度ＡＤＲも高くなる。このとき、画質を向上させるためには以下のような方法が考えられる。
【０１２３】
▲１▼不変領域の変化判定しきい値ＤＴＨを下げる〈不変領域の更新〉
▲２▼画面全体の変化判定しきい値ＤＴＨを下げる〈画面全体の動き向上〉
▲３▼注視領域に対してのみ変化判定しきい値ＤＴＨを下げる〈注視部分の動き向上〉
特に、▲１▼は事前に変化判定しきい値ＤＴＨを上げ過ぎた場合におこる画像劣化現象への対処である。例えば、カメラの前に手をかざした場合、一度は画面全体が肌色に切換わるが、その後、手をのけても変化判定しきい値ＤＴＨを超えないブロックが存在するときには、壁等の背景に手の一部が不変領域として張付いたように残るという状況が発生する。
【０１２４】
また、▲２▼については、あまり下げ過ぎると、ほんのわずかな輝度のむらや色相変化により変化ブロックが急増するため、逆にフレームレートが低くなってしまうという現象が起きてしまう。
【０１２５】
一方、量子化スケールＱＳＣについては、次のような方法が考えられる。
▲１▼不変領域の量子化スケールＱＳＣを下げる〈不変領域の画質向上〉
▲２▼画面全体の量子化スケールＱＳＣを下げる〈画面全体の画質向上〉
▲３▼注視領域に対してのみ量子化スケールＱＳＣを下げる〈注視部分の画質向上〉
【０１２６】
図９は、以上の制御内容についての流れを示すフローチャートである。なお、ここで変化判定しきい値ＤＴＨ０〜ＤＴＨ３および量子化スケールＱＳＣ０〜ＱＳＣ３の設定条件は次のようになっている。
▲１▼データレート余裕度ＡＤＲ上昇の場合
ＤＴＨ０≧ＤＴＨ３≧ＤＴＨ２≧ＤＴＨ１
ＱＳＣ０≧ＱＳＣ３≧ＱＳＣ２≧ＱＳＣ１
▲２▼データレート余裕度ＡＤＲ上昇の場合
ＤＴＨ３≧ＤＴＨ２≧ＤＴＨ１≧ＤＴＨ０
ＱＳＣ３≧ＱＳＣ２≧ＱＳＣ１≧ＱＳＣ０
【０１２７】
符号化器１は、変化判定しきい値ＤＴＨおよび量子化スケールＱＳＣの初期値ＤＴＨ０，ＱＳＣ０が設定された状態で（ステップＰ１）、データレート余裕度ＡＤＲが変化したか否かを監視する（ステップＰ２）。そして、データレート余裕度ＡＤＲの値が変化した場合には、領域別適応化を行なわないときには（ステップＰ３）、前述したようにテーブル（表１）を参照して変化判定しきい値ＤＴＨおよび量子化スケールＱＳＣを変更設定する（ステップＰ４）。
【０１２８】
また、領域別適応化を行なう場合には、注視領域優先モードであるか否かを判定し（ステップＰ５）、「ＹＥＳ」の場合には注視領域の変化判定しきい値ＤＴＨをＤＴＨ１に変更設定し（ステップＰ６）、量子化スケールＱＳＣをＱＳＣ１に変更設定する（ステップＰ７）。
【０１２９】
そして、注視領域優先モードに設定されている場合には、注視領域の変化判定しきい値をＤＴＨ２に、不変表示領域の変化判定しきい値をＤＴＨ３に設定すると共に（ステップＰ８，Ｐ９）、注視領域の量子化スケールをＱＳＣ２に、不変表示領域の量子化スケールをＱＳＣ３に設定する（ステップＰ１０，Ｐ１１）。この後、変化判定しきい値の最低値ＤＴＨｍｉｎを超える有意変化ブロックが有るか否かに応じて（ステップＰ１２）、「ＹＥＳ」の場合には有意変化ブロックの変化判定しきい値をＤＴＨ２に設定し（ステップＰ１３）、そうでないときには終了する。
【０１３０】
［ｄ］画像データサイズの適応的変更
上述と同様に、動き量判定レベルＬＭ、色変化量判定レベルＬＣ、変化ブロック数ＮＣＢ、データレート余裕度ＡＤＲの判定レベルＬＡＤＲの総合的判定に加えて、画像要求度ＲＶのレベルＬＲＶ（後述する）も考慮して画像データサイズの適応的変更を行うことができる。
【０１３１】
ここで、画像データサイズは、通常のＣＩＦに加えて、ＱＣＩＦ、ＳＱＣＩＦについて設定可能な場合を想定している。そして、例えば、
［Ｌ，ＬＡＤＲ，ＬＲＶ］→［ＳＱＣＩＦ／ＱＣＩＦ／ＣＩＦ］
の参照テーブルを考える場合には、ＬおよびＬＡＤＲ，ＬＲＶが０〜３の４段階の値をとるとすると、次の表３のように制御内容を設定することができる。
【０１３２】
【表３】

【０１３３】
上述の画像データサイズの変更を行なう場合に、変更直後のフレームに対してイントラ符号化を行なったイントラフレームを介さずに、連続的にフレーム間のサイズ変更を行なうことができる。拡大変更と縮小変更の両者についてそれぞれ以下のように実現することができる。
【０１３４】
（ア）ＣＩＦ→ＱＣＩＦ
ＣＩＦ／ＱＣＩＦダウンサンプリングの駆動により、時刻ｔ（ｎ−１）のＣＩＦ符号化フレーム（フレームメモリに格納されている）をＱＣＩＦに変換する。このＱＣＩＦに対して時刻ｔ（ｎ）のＱＣＩＦベースのフレーム間符号化を行う。デコーダ側ではピクチャヘッダ中のＱＣＩＦ指示フラグにより、ダウンサンプリングを駆動する。
【０１３５】
（イ）ＱＣＩＦ→ＣＩＦ
ＱＣＩＦ／ＣＩＦ双一次補間フィルタの駆動により、時刻ｔ（ｎ−１）のＱＣＩＦ符号化フレーム（フレームメモリに格納されている）をＣＩＦに変換する。このＣＩＦに対して時刻ｔ（ｎ）のＣＩＦベースのフレーム間符号化を行う。デコーダ側ではピクチャヘッダ中のＣＩＦ指示フラグにより、補間フィルタを駆動する。なお、この補間フィルタについてはサイズ間の切換えを行なう場合に対応して推奨されているものがある。
【０１３６】
以上の方法により、イントラフレームを差し挟まなくともサイズ変更を実現することができるようになるので、符号化器１側で情報量を極端に増大させることなくフレームレートを維持することができるようになる。
【０１３７】
［ｅ］音声データと画像データとの比率に対する要求度の抽出
ヒューマンインターフェイスを簡略化するために、通信品質への要求を表現する場合において、必要な最低限の制御入力手段を以下に示す一次元尺度で考慮する。すなわち、音声比率に対する要求度Ｒａとして、
Ｒａｉｊ；端末ｉで設定する端末ｊの符号化器の音声比率への要求度
として示す。
【０１３８】
［ｅ−１］連続制御
図１０に示すように、音声（Ａ）と映像（Ｖ）との間の比率（ＡＶ比率）を指定するつまみ２９を表示装置２９の前面部に設ける。これは、使用者によってスライド操作することにより比率を設定可能に設けられるもので、今、つまみ２９ａの示す値Ｔが０から１まで変化するとき、
Ｒａｉｊ＝Ｔ；データ全体に占める音声データの割合
Ｒｖｉｊ＝１−Ｔ；データ全体に占める映像データの割合
となる。これにより、
▲１▼モード制御
▲２▼変化検出しきい値の変更（ＤＴＨ）
▲３▼量子化スケールの変更（ＱＳＣＡＬＥ）
を行う。
【０１３９】
［ｅ−２］プロテクト機能
通信におけるプライバシ保護のため、自分の端末（端末１）の伝送品質を相手端末（端末２）に操作させる際には必ず使用者の許可を必要とするようにプロテクト機能を設けている。具体的には、図１１にも示すように、モード設定用スイッチによるプロテクトＯＮ／ＯＦＦで実現する。通常の対話モードにおいては、プロテクトＯＦＦの場合は、種々の音声および画像パラメータについて手動で設定するマニュアルモードと次項に示すように自己端末（端末１）と相手端末（端末２）との両者の要求度に基づいて決定される自動設定モードがある。また、上述の趣旨から、プロテクトＯＮの場合は相手端末（端末２）から設定される要求を一切受け付けないようになっている。
【０１４０】
［ｅ−３］ＡＶ比率の制御に関する優先順序
上記プロテクト機能がＯＦＦされた場合には、１対１の通信の場合においては、Ｒａｉｊの定義から端末１において以下の２つの要求度が発生して競合することになる。
【０１４１】
Ｒａ１１；自分の端末（端末１）の音声符号化器に対する要求度
Ｒａ２１；相手の端末（端末２）から自分の端末１の音声符号化器に対して発生する要求度
上述の場合に、一般的には、背景情報についてユーザが持つ可制御性は音声情報よりも映像情報の方が低いと推察されるから、音声に比べて映像の方が自分の端末から送る際の可制御性を高める必要があると考えて次のような決定規則を設定する。
【０１４２】
ＲＡ１＝ｍａｘ［Ｒａ１１，Ｒａ２１］
ＲＡ１；端末ｉの音声符号化器に送る最終的な要求度
これは、コミュニケーションとしての電話機能を最低限満足するためには聞き手の音声品質に対する要求を満たすことが必須であることにも対応している。
【０１４３】
［ｅ−４］モード制御
被写体、用途などに応じたモード制御は、例えば、画像の付帯状況として使用環境や被写体あるいは用途などに応じて、符号化器１と復号化器１６との間であらかじめ取り決められた符号化条件を備えており、それら各モードに対応して付されるコードをビットストリームデータに付加することにより、発生する情報量を大幅に削減させることができる。
【０１４４】
ここで、設定可能なモードとしては、次のようなものが考えられている。例えば、使用環境に対応するモードとしては、屋内，屋外，あるいは自動車の中、さらには、それらの環境の中で固定モードか可動モードか等がある。また、被写体のモードとしては、人物，風景，静止物体あるいは図面，文字などのモードがあり、さらには人物のモードにおいては、頭部，上半身，全身あるいは複数人物などの様々なモードが考えられる。
【０１４５】
さらには、符号化制御に関するモードとしては、画像中心優先モード，対象領域優先モード，動き優先モード，準動画モード，静止画モード，モデルベース予測モードなどの様々なモードがあるが、ここではモードの例を概略的に述べるにとどめる。
【０１４６】
［ｆ］パラメータ制御
［ｆ−１］要求度に基づく符号化レートの決定
要求度に基づく符号化レートの決定画像要求度とデータレート余裕度とから符号化レートを決定する。すなわち、
［ＲＶ，ＡＤＲ］→［ＢＲＡ，ＢＲＶ］
ＢＲＡ；音声符号化レート
ＢＲＶ；画像符号化レート
この目標に基づき、量子化スケール（ＱＳＣＡＬＥ）と変化検出しきい値（ＤＴＨ）の２つを既に記載した方法で変化させることで画像データ量を調整し、ＡＶ比率を制御する。
【０１４７】
［ｆ−２］遠隔モニタリングモードの符号化パラメータの遠隔制御
前述した音声要求度を決定した場合と同様にして、符号化パラメータの各値を設定する際にも自己の端末に対する制御値を優先するようなプロテクト機能を設ける。
【０１４８】
このような遠隔モニタリングモードにおいては、前述したようなプロテクト機能をＯＮさせて実行することにより、次のような効果を得ることができる。すなわち、通常の遠隔モニタリングモードにおいては、プロテクト機能をＯＦＦにしている場合には、自己の端末（端末１）側で、相手端末（端末２）から送信される細かい符号化制御パラメータのセット（領域情報，量子化スケール，各種しきい値など）を受け取ることができるようになっているのに対して、プロテクト機能をＯＮに設定することによりこれらのパラメータセットの受付を却下することになり、パラメータの変更設定を禁止した状態つまり、同一条件で符号化を行なうように保持してモニタリングを継続することになる。
【０１４９】
［ｆ−３］システム全体のパラメータ制御
以上のパラメータ決定関係を総合すると図１２に表すことができる。すなわち、符号化パラメータの決定の要因として、画像により発生する情報量があり、これには動き量ＳＭ，色変化量ＤＣ，変化ブロック数ＮＢＣ，１フレーム前の情報発生量ＬＩ，バッファ量（データレート余裕度ＡＤＲ）などの要素があり、これらのレベルを判定した結果から画像関係の情報発生レベルを考慮し、一方で、音声に関する要求度Ｒａ，音声信号の発生状況などから画像情報の符号化レートＢＲＶが決まり、これによってそのときのフレームの符号化パラメータを対応づけて決定する。
【０１５０】
決定する符号化パラメータの要素としては、前述したように、画像符号化レートＢＲＶ，量子化スケールＱＳＣ，変化ブロック判定しきい値ＤＴＨ，画像データサイズＣＩＦ／ＱＣＩＦ／ＳＱＣＩＦ，ブロック間変化量のサンプリング密度ＳＤ，画面全体の変化判定ブロック数のしきい値ＮＣＢ＿ＴＨなどがある。
【０１５１】
そして、このようにして決定された符号化パラメータに基づいて符号化処理の演算が実行される。また、このような符号化の状態は常時観測されており、次回以降の符号化パラメータ決定に際して利用されるようになっている。
【０１５２】
［ｇ］ブロック雑音の除去
ブロック雑音の除去のために図１３のようにしてポストフィルタを用いる。これは、復号化器１６側において復号処理を行なって画像を再生する場合に、ブロック単位で再生を行なう際に、ＤＣＴ係数の送信レベルを制御することにより、隣接するブロック間での輝度や色信号の変動が雑音として悪影響を与えるのを除去あるいはその影響力を緩和するためのものである。
【０１５３】
実際には、例えば、図１３（ａ）のように再生されたＭＢＫ（マクロブロック）間のラインに沿ってポストフィルタを用いてＢＬＫ雑音除去処理を行なう。このＢＬＫ雑音除去処理では、同図（ｂ）に示すように、ＢＬＫ境界に沿って並ぶ画素のデータに対して、隣接する８個の画素のデータを利用して重み付けを行なって加算演算することにより変換して周囲の画素のデータとの中間的な画素データとなるように変換するものである。この場合においては、例えば、自己の画素データを４，隣接する画素データを２，斜めに隣接する画素データを１の割合で重み付けして加算することにより変換処理を施す。
【０１５４】
［ｈ］可変ＧＯＢ構造と識別番号の伝送
符号化器１および復号化器１６の両者に、あらかじめ定義した共通のＧＯＢパターンとそのＩＤコードを記憶しておき、符号化器１で用いたＧＯＢパターンのＩＤコードのみを画像圧縮データに付加して既存プロトコル（Ｈ．２６１やＨ．２６３あるいはＭＰＥＧ等）におけるユーザデータエリアなどを利用して伝送する。
【０１５５】
可変ＧＯＢパターンとしては、例えば、図１４および図１５に示すようなものが考えられる。すなわち、図１４（ａ），（ｂ）では一般的なＨ．２６１規格，Ｈ．２６３規格にしたがったＧＯＢパターンを示し、同図（ｃ），（ｄ）および図１５（ａ）では変形させたＧＯＢパターンを採用している。
【０１５６】
変形ＧＯＢ（その１）では、マクロブロックを４×４個まとめて１つのＧＯＢ単位を構成して画面に並べたパターンであり、変形ＧＯＢ（その２）では、画面中央にマクロブロックを４×８個配置すると共に、その外周に隣接するマクロブロックを順次ＧＯＢの単位として配置したものである。また、変形ＧＯＢ（その３）においては、所定のパターンに区切った変形ＧＯＢを配置している。図１５（ｂ）では、指定領域をＧＯＢとして設定しており、同図（ｃ），（ｄ）では、ＱＣＩＦ，ＳＱＣＩＦを埋込んで配置したＧＯＢパターンとしている。
【０１５７】
さて、このようにＧＯＢパターンを設定しておくことにより、復号化器１６は送られてきた圧縮ビットストリームをＧＯＢ単位で通常の画像復号プロトコルによって解凍した後に、ユーザデータエリアなどに格納されたＧＯＢパターンのＩＤコードをもとにＧＯＢパターンデータベースから該当するＧＯＢパターンを選択して、あらかじめ取り決められたＧＯＢ番号とＧＯＢ中のマクロブロック数に基づいて、復号したＧＯＢデータを配置する。この方式によって、例えば、従来の画像のように左上部分から右下に向かう水平スキャンによる画一的なＧＯＢ構造に比べて、画像内容に則したＧＯＢ間のプライオリティを付けることができるようになる。
【０１５８】
例えば、「変形ＧＯＢパターンその２」（図１４（ｄ）参照）では、画面中央の中心部分から先に伝送するので、伝送線路に誤りが混入して再送を繰り返すといった場合でも、重要な画像部分だけは統計的に少ない遅延時間で速く送ることができる。また、「変形ＧＯＢパターンその３」（図１５（ａ）参照）では、略人物正面像に近い形状でＧＯＢを区切ることができるようにしているので、ＧＯＢ単位での効率的な符号割り当てを可能にしている。
【０１５９】
また「ＱＣＩＦ埋込」（同図（ｃ）参照）では、伝送レート内の画像に割り当てる符号レートが少なくなっても重要部分を良好な画質で且つ動きのある画像として見たいという場合に対応して、中央のＱＣＩＦのみの符号化への移行を簡単に行なうことができるようになる。なお、複数指定領域をＧＯＢとする場合は、パターン識別番号のみでは不十分となるので、前述した［ｃ−３］の領域に応じた制御の項で述べた領域の記述と伝送方法を用いることが必要になる。
【０１６０】
ここで、指定領域外の背景画像部分をどのようにＧＯＢとして区分けするかという問題が生ずるが、このような場合に対応した規則を符号化器１と復号化器１６との両者の間で同じ内容として規定して記憶しておけば、特に新しい区分け情報を伝送する必要はなくなる。
【０１６１】
このような本実施例によれば、次のような効果を得ることができる。
すなわち、第１に、変化領域抽出部６により、そのフレーム内のマクロブロックのうちの変化ブロックを検出してその変化ブロックについてのみフレーム内符号化処理を行なうので、携帯電話機のような限られた伝送容量（例えば、９６００ｂｐｓ）の範囲内で変化が生じている領域についての情報を有効に伝送することができると共に、伝送誤りに強い画像再生を行なえて、無線系にも強い動画像伝送を行なえる。
【０１６２】
さらに、フレーム内符号化を行なうので、一般的な動画像圧縮の場合と異なり、前フレームに対する差分を演算したり動き補償差分符号化の演算ループなどの構成が不要となり、その分だけ演算処理量を大幅に削減することができて、例えば、パソコンなどの処理によっても十分に対応でき、携帯用情報端末を用いた画像伝送を行うことができるようになる。
【０１６３】
また、符号化条件設定手段としての符号化制御部８により、変化ブロックについての符号化を行なう際に、変化ブロックの発生量や変化量等のデータに応じて符号化処理の条件を伝送容量の範囲内で変更して必要な情報を取捨選択してより良質な動画像を伝送することができるようになる。
【０１６４】
第２に、符号化制御部８において、変化ブロックにより発生する情報発生量を、動き量，色変化量，変化ブロック個数，データレートの余裕度，音声符号化レートなどから符号化パラメータを決定するので、画像の変化に応じて弾力的に符号化条件の変更設定を行なうことができる。
【０１６５】
第３に、上述のように情報発生量およびデータレートの余裕度の変化に基づいて、符号化パラメータとして、画像符号化レート，量子化スケール，変化ブロック判定しきい値，画像データサイズ，ブロック間変化量計算のサンプリング密度あるいは画面全体の変化判定のブロック数のしきい値を変更設定するので、符号化処理に際して有効な符号化を行なうことができるようになる。
【０１６６】
第４に、音声情報を同時に伝送する場合に、その音声情報の発生状況に応じて画像情報の伝送容量を求めて、符号化条件を適応的に変更設定するので、限られた伝送容量の中で、画像情報を効率的に送信して使用者が必要とする領域を精度良く再生することができる。
【０１６７】
第５に、音声情報の突発的増大を検出して画像情報の送信を弾力的に制限するので、音声情報の送信を優先しながら、音声情報が少ないときに画像情報を精度良く送信することができるようになる。
【０１６８】
第６に、音声情報の符号化要求度を設定可能にしたので、画像情報に対して音声情報を優先しながら伝送容量の範囲で画像情報を有効に利用して送信することができるようになる。
【０１６９】
第７に、プロテクト機能を設けたので、外部からの符号化要求度設定に対してプライバシーの保護を図ることもできる。
【０１７０】
本発明は、上記実施例にのみ限定されるものではなく、次のように変形また拡張できる。
映像ソースとしては、カメラ２に限らず、ビデオ映像の画像情報を利用するものでも良い。
信号送信部および信号受信部で信号の授受を行なう媒体としてはデジタル携帯電話機に限らず、他の通信手段を用いても良いし、さらには無線系だけではなく有線系の通信経路に適用することもできる。
【０１７１】
音声情報と画像情報とを同時に送信する場合に限らず、画像情報のみの通信を行なう場合にも適用できる。
ＡＶ比率の設定用つまみはスライド式以外に、回転式のものでも良いし、デジタル的に設定するものでも良い。また、必要に応じて省いた構成とすることもできる。
【０１７２】
プロテクト機能は必要に応じて設ければ良い。
符号化レートを決定するための参照テーブルは、表１〜３以外に適宜設定することができる。
【０１７３】
可変ＧＯＢパターンの適応的変更や画像データサイズの適応的変更の制御については必要に応じて設けることができる。また、これらを使用しない場合には、復号化器の構成上において、既存の規格のものを適用することができる。
【０１７４】
９６００ｂｐｓの携帯電話機の場合を説明したが、Ｈ．２６３規格で対象とされている６４ｋｂｐｓ程度以下の伝送容量の場合にも同様に適用でき、動画像伝送に有効に利用することができる。
【図面の簡単な説明】
【図１】本発明の一実施例を示す全体のブロック構成図
【図２】全体の概略的動作を示すフローチャート
【図３】画像情報の状態観測動作を示すフローチャート
【図４】符号化状態と要求の判定動作を示すフローチャート
【図５】符号化パラメータ決定動作を示すフローチャート
【図６】符号化演算処理動作を示すフローチャート
【図７】画素のサンプリングパターンを示す説明図
【図８】音声データ量変動の検出動作を示すフローチャート
【図９】領域に応じたしきい値変更制御の動作を示すフローチャート
【図１０】ＡＶ比率を設定するつまみの部分を示す表示装置の正面図
【図１１】プロテクト機能の動作を示す作用説明図
【図１２】符号化パラメータ決定の総合的な関係を示すブロック図
【図１３】ポストフィルタの説明図
【図１４】可変ＧＯＢパターン（その１）
【図１５】可変ＧＯＢパターン（その２）
【符号の説明】
１は符号化器、２はカメラ（撮像手段）、３はＡ／Ｄ変換部、４はＲＧＢ／ＣＩＦ変換部、５は二次元高速ＤＣＴ部、６は変化領域抽出部（変化ブロック検出手段）、７は量子化部、８は符号化制御部（符号化条件設定手段）、９は有意係数属性制御部、１０は可変長符号化部、１１は階層結合部、１２はバッファ、１３は信号送信部、１４はＲＳ２３２ｃ通信処理部、１５はデジタル携帯電話機、１６は復号化器、１７は信号受信部、１８はデジタル携帯電話機、１９はＲＳ２３２ｃ通信処理部、２０はバッファ、２１はパーザ、２２は可変長復号化部、２３は有意係数属性再生部、２４は逆量子化部、２５は二次元高速逆ＤＣＴ部、２６は復号化制御部、２７はＣＩＦ／ＲＧＢ変換部、２８はＤ／Ａ変換部、２９は表示器、２９ａはＡＶ比率設定用のつまみである。

Claims

複数のブロックから構成される１フレームの画像データをそのブロック単位で符号化しながら圧縮する処理をすることにより所定の伝送容量の範囲内の伝送信号を生成する動画像情報の符号化装置において、
前記フレーム中の複数のブロックのうちで前フレームの画像データとの変化量が判定しきい値以上であるときにこれを変化ブロックとして検出する変化ブロック検出手段と、
送信可能な伝送容量の範囲内で前記フレームの画像データを符号化する際に、前記変化ブロック検出手段により検出された前記変化ブロックの情報量として得られる動き量、色変化量、変化ブロック数、１フレーム前の情報発生量、バッファ量の値に応じて符号化処理条件である画像符号化レート、量子化スケール、変化ブロック判定しきい値、画像データサイズ、ブロック間変化量計算のサンプリング密度、画面全体の変化判定ブロック数のしきい値を変更設定する符号化条件設定手段と、
この符号化条件設定手段により設定される符号化処理条件で前記変化ブロックのみをフレーム内符号化の符号化処理をして伝送信号を生成する符号化処理手段とを具備し、
前記符号化条件設定手段は、前記バッファ量から画像データ送信の余裕度を検出し、検出された前記余裕度に応じて符号化処理条件を設定し、音声信号の突発的増大があるときには、使用者により設定された要求度に基づいて設定した初期値の画像符号化レートに変更するように構成されていることを特徴とする動画像情報の符号化装置。
請求項１に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記フレーム内で変化ブロック検出手段により検出された変化ブロックについてその動き量を演算し、その結果に基づいて符号化処理条件を設定するように構成されていることを特徴とする動画像情報の符号化装置。
請求項１に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記フレーム内で変化ブロック検出手段により検出された変化ブロックについてその色変化量を演算し、その結果に基づいて符号化処理条件を設定するように構成されていることを特徴とする動画像情報の符号化装置。
請求項１に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記フレーム内で変化ブロック検出手段により検出された変化ブロックについてその動き量および色変化量を演算してそれらを所定の重み付を行なって加算した総合変化量に基づいて符号化処理条件を設定するように構成されていることを特徴とする動画像情報の符号化装置。
請求項２または４に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記動き量の演算において、前記検出された変化ブロックの重心位置を求めてその重心位置の前フレームに対する動きベクトルの大きさを得てこれに変化ブロックの総数を乗ずることにより求めることを特徴とする動画像情報の符号化装置。
請求項２または４に記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記動き量の演算において、前記フレーム内の全てのマクロブロックの前フレームに対する動きベクトルの大きさの総和を計算することにより求めることを特徴とする動画像情報の符号化装置。
請求項６記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記フレーム内の全てのマクロブロックの前フレームに対する動きベクトルを検出する際にそのブロックを構成する画素を所定条件でサンプリングすることにより演算するように構成されていることを特徴とする動画像情報の符号化装置。
請求項１、５〜７のいずれかに記載の動画像情報の符号化装置において、
前記符号化条件設定手段は、前記画像データ送信の余裕度，前記変化ブロックについて演算して得られた動き量や色変化量あるいは得られた前記動き量および前記色変化量に所定の重み付を行なって加算して得られた総合変化量または１フレーム前の画面全体の情報発生量のいずれかまたはその組み合わせにより得られる符号化処理条件の値に応じて、次回以降の符号化処理条件設定における前記変化ブロック判定しきい値，符号化のための量子化スケールおよび画面全体の変化判定ブロック数のしきい値を符号化処理条件として設定することを特徴とする動画像情報の符号化装置。