JP5007761B2 - 画像処理装置および方法、プログラム、並びに、記録媒体 - Google Patents

画像処理装置および方法、プログラム、並びに、記録媒体 Download PDF

Info

Publication number
JP5007761B2
JP5007761B2 JP2010157761A JP2010157761A JP5007761B2 JP 5007761 B2 JP5007761 B2 JP 5007761B2 JP 2010157761 A JP2010157761 A JP 2010157761A JP 2010157761 A JP2010157761 A JP 2010157761A JP 5007761 B2 JP5007761 B2 JP 5007761B2
Authority
JP
Japan
Prior art keywords
mode
intra prediction
prediction
prediction mode
slice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010157761A
Other languages
English (en)
Other versions
JP2010233263A (ja
Inventor
数史 佐藤
潤一 田中
イーウェン ズー
陽一 矢ヶ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010157761A priority Critical patent/JP5007761B2/ja
Publication of JP2010233263A publication Critical patent/JP2010233263A/ja
Application granted granted Critical
Publication of JP5007761B2 publication Critical patent/JP5007761B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像処理装置および方法、プログラム、並びに、記録媒体に関し、特に、より確実に符号量を所望の値以下に抑えることができるようにした画像処理装置および方法、プログラム、並びに、記録媒体に関する。
H.264/AVC(Advanced Video Coding)方式により画像を符号化するシステムにおいては、HRD(Hypothetical Reference Decoder、仮想参照デコーダ)バッファの容量、ネットワークの回線容量、システムレイヤの制約、ディスクドライブの読み出し性能などの条件により、1ピクチャあたりの符号量の上限値が設定される。符号量がその上限値を超えてしまうと、システムの動作に支障を来す恐れがあるため、従来、H.264/AVC方式により画像を符号化する符号化装置において、符号量を制御する方法が種々提案されている(例えば、特許文献1参照)。
特開2004−165894号公報
しかしながら、例えば、白色雑音を含む画像が入力された場合、従来のMPEG-2 TestModel5(TM5)に規定されるレート制御方法などに基づく制御では、符号量が上限値を超えてしまう可能性がある。
本発明は、このような状況に鑑みてなされたものであり、より確実に符号量を所望の値以下に抑えることができるようにするものである。
本発明の一側面の画像処理装置は、画像を符号化した場合に発生する発生符号量を予測する予測手段と、予測された前記発生符号量が所定の値を超える場合に、前記画像内のイントラ予測を用いて符号化される各ブロックに対して、同じ予測方向のイントラ予測モードが適用されるように制御し、前記画像内のインター予測を用いて符号化される各ブロックに適用される予測モードを、各ブロックの属するスライスのタイプに基づいて制御する予測モード制御手段と、適用された予測モードにより各ブロックを符号化する符号化手段とを備える。
前記予測モード制御手段には、予測された前記発生符号量が所定の値を超える場合に、イントラ予測を用いて符号化されるブロックに対して、DCモードが適用されるよう制御させることができる。
前記予測モード制御手段には、予測された前記発生符号量が所定の値を超える場合に、イントラ予測を用いて符号化されるブロックに対して、Intra16×16モードが適用されるように制御させることができる。
前記予測モード制御手段には、予測された前記発生符号量が所定の値を超える場合に、イントラ予測を用いて符号化されるブロックの大きさを、各ブロックの属するスライスのタイプに基づいて制御させることができる。
前記予測モード制御手段には、予測された前記発生符号量が所定の値を超える場合に、Iスライスに属するブロックのイントラ予測を16×16のブロックサイズにて行い、PスライスもしくはBスライスに属するブロックのイントラ予測を4×4、8×8、もしくは16×16のブロックサイズにて行なうように制御させることができる。
本発明の一側面の画像処理方法は、画像の符号化を行う画像処理装置が、前記画像を符号化した場合に発生する発生符号量を予測し、予測された前記発生符号量が所定の値を超える場合に、Bスライスに属するブロックに対して、イントラ予測モード、ダイレクトモードもしくはスキップモードのいずれかかが適用され、Pスライスに属するブロックに対して、イントラ予測モードもしくはスキップモードが適用されるとともに、イントラ予測を用いて符号化されるブロックに対して、同じ予測方向のイントラ予測モードが適用されるように制御し、適用された予測モードにより各ブロックを符号化するステップを含む。
本発明の一側面のプログラム、または、記録媒体に記録されているプログラムは、画像の符号化を行う画像処理装置が、前記画像を符号化した場合に発生する発生符号量を予測し、予測された前記発生符号量が所定の値を超える場合に、Bスライスに属するブロックに対して、イントラ予測モード、ダイレクトモードもしくはスキップモードのいずれかかが適用され、Pスライスに属するブロックに対して、イントラ予測モードもしくはスキップモードが適用されるとともに、イントラ予測を用いて符号化されるブロックに対して、同じ予測方向のイントラ予測モードが適用されるように制御し、適用された予測モードにより各ブロックを符号化するステップを含む処理をコンピュータに実行させる。
本発明の一側面においては、画像を符号化した場合に発生する発生符号量が予測され、予測された前記発生符号量が所定の値を超える場合に、Bスライスに属するブロックに対して、イントラ予測モード、ダイレクトモードもしくはスキップモードのいずれかかが適用され、Pスライスに属するブロックに対して、イントラ予測モードもしくはスキップモードが適用されるとともに、イントラ予測を用いて符号化されるブロックに対して、同じ予測方向のイントラ予測モードが適用されるように制御され、適用された予測モードにより各ブロックが符号化される。
本発明の一側面によれば、符号量が抑制される。また、本発明の一側面によれば、より確実に符号量を所望の値以下に抑えることができる。
本発明を適用した画像処理装置の一実施の形態を示すブロック図である。 図1の画像処理装置により実行される符号化処理を説明するためのフローチャートである。 図1の画像処理装置により実行される緊急モード対応処理を説明するためのフローチャートである。 パーソナルコンピュータの構成の例を示すブロック図である。
以下、図面を参照して、本発明の実施の形態について説明する。
図1は、本発明を適用した画像処理装置の一実施の形態の構成を示すブロック図である。
画像処理装置101は、入力された画像をH.264/AVC(Advanced Video Coding)方式により符号化し、符号化した画像を、例えば、後段の図示せぬ記録装置や伝送路などに出力する装置である。
画像処理装置101は、A/D(Analog/Digital)変換部111、画面並べ替えバッファ112、加算器113、直交変換部114、量子化部115、可逆符号化部116、蓄積バッファ117、レート制御部118、緊急モード制御部119、逆量子化部120、逆直交変換部121、加算器122、デブロッキングフィルタ123、フレームメモリ124、イントラ予測部125、動き予測・補償部126、および、モード判定部127を含むように構成される。また、緊急モード制御部119は、緊急モード判定部141および符号量制御部142を含むように構成される。
A/D変換部111は、外部から入力されたアナログの画像をデジタルの画像にA/D変換し、変換後のデジタルの画像(以下、適宜、原画像とも称する)を画面並べ替えバッファ112に供給する。
画面並べ替えバッファ112は、A/D変換部111から供給された原画像をGOP(Group Of Pictures)構造に基づいて並べ替え、順に、加算器113、イントラ予測部125、および、動き予測・補償部126に供給する。
加算器113は、マクロブロックごとに、原画像に対してイントラ予測(フレーム内予測)を用いて予測したイントラ予測画像、および、インター予測(フレーム間予測、動き補償予測)を用いて予測したインター予測画像のうちいずれか一方の予測画像を、モード判定部127から取得する。加算器113は、マクロブロックごとに、原画像とイントラ予測画像またはインター予測画像との差分を取り、差分を取ることに得られた予測誤差からなる差分画像を直交変換部114に供給する。
直交変換部114は、差分画像に対して、所定の大きさのブロックごとに離散コサイン変換またはカルーネン・レーベ変換等の直交変換を施し、これにより得られた変換係数を量子化部115に供給する。なお、直交変換部114は、図3を参照して後述するように、1ピクチャあたりの符号量が所定の上限値を超えそうである緊急モード時には、緊急モード部126の制御の基に、所定の周波数成分の変換係数の値を0に置き換える。
量子化部115は、レート制御部118により制御される量子化スケールを用いて、直交変換部114から供給された変換係数を量子化し、量子化した変換係数を可逆符号化部116および逆量子化部120に供給する。
可逆符号化部116は、イントラ予測に関する情報をイントラ予測部125から取得し、インター予測に関する情報を動き予測・補償部126から取得する。可逆符号変換部117は、量子化された変換係数、イントラ予測に関する情報、インター予測に関する情報などを所定の順序に配置し、配置したデータに対してCAVLC(Context-Adaptive Variable Length Coding)などの可変長符号化、または、CABAC(Context-Adaptive Binary Arithmetic Coding)などの算術符号化等の可逆符号化処理を施す。可逆符号化部116は、符号化したデータを蓄積バッファ117に供給して蓄積させる。
蓄積バッファ117は、可逆符号化部116から供給されたデータを、H.264/AVC方式で符号化された画像として、例えば、後段の図示せぬ記録装置や伝送路などに出力する。
レート制御部118は、蓄積バッファ117に記憶されている画像の符号量に基づいて、符号化する画像に割り当てられる時間当たりの符号量であるビットレートを制御する。
例えば、レート制御部118は、MPEG-2 TestModel5(TM5)に規定されるレート制御方式を用いて、量子化部115が量子化を行うときに変換係数を除算する値である量子化スケールの値を制御することによりビットレートを制御する。また、レート制御部118は、次に符号化する画像(ピクチャ)に割り当てられる符号量の見積もり値であるターゲットビットを算出し、算出したターゲットビットを示す情報を緊急モード制御部119に供給する。
緊急モード制御部119は、緊急モードに関わる処理を行う。
緊急モード制御部119を構成する要素のうち、緊急モード判定部141は、レート制御部118から取得したターゲットビットに基づいて、次に符号化される画像(ピクチャ)について、1ピクチャあたりの符号量が所定の上限値を超えそうであるか否かを判定する。緊急モード判定部141は、判定結果を示す情報を符号量制御部142に供給する。
なお、1ピクチャあたりの符号量の上限値は、例えば、HRDバッファの容量、ネットワークの回線容量、システムレイヤの制約、ディスクドライブの読み出し性能などの条件に基づいて設定される。また、この上限値を可変とし、条件の変化に応じて、値を変更するようにしてもよい。
符号量制御部142は、緊急モード判定部141により、1ピクチャあたりの符号量が所定の上限値を超えそうであると判定された場合、図3を参照して後述するように、レート制御部118とは異なる方式により、直交変換部114、イントラ予測部125、または、モード判定部127の処理を制御することにより、符号量を抑制するように、符号化を制御する。
逆量子化部120は、量子化部115から供給された変換係数を逆量子化して逆直交変換部121に供給する。
逆直交変換部121は、逆量子化部120から供給された変換係数に対して逆離散コサイン変換、逆カルーネン・レーベ変換等の逆直交変換を施す。これにより、差分画像が復号される。逆直交変換部121は、復号した差分画像を加算器122に供給する。
加算器122は、差分画像の生成に用いられたイントラ予測画像またはインター予測画像をモード判定部127から取得し、差分画像と取得したイントラ予測画像またはインター予測画像とを加算する。これにより、原画像が復号される。加算器122は、復号した画像(以下、適宜、復号画像と称する)をデブロッキングフィルタ123に供給する。
デブロッキングフィルタ123は、復号画像に対して、ブロック歪みを除去するデブロッキング処理を施す。デブロッキングフィルタ123は、デブロッキング処理を施した画像をフレームメモリ124に供給する。また、デブロッキングフィルタ123は、イントラ予測に用いる画像として、デブロッキング処理を施さない復号画像をそのままフレームメモリ124に供給する。
フレームメモリ124は、デブロッキングフィルタ123から供給された画像を、イントラ予測またはインター予測が行われる場合に参照される画像(以下、適宜、参照画像と称する)として記憶する。
イントラ予測部125は、マクロブロックごとに、フレームメモリ124に記憶されている同じフレーム内のマクロブロックに隣接する符号化済みの画素を用いて、原画像に対するイントラ予測画像を生成するイントラ予測を行う。なお、上述したように、イントラ予測には、デブロッキング処理を施す前の復号画像の画素が用いられる。
動き予測・補償部126は、マクロブロックごとに、フレームメモリ124に記憶されている他のフレームの参照画像を用いて、参照画像に対する原画像の動きベクトルを検出し、検出した動きベクトルを用いて参照画像に動き補償を施こすことにより、原画像に対するインター予測画像を生成するインター予測を行う。
モード判定部127は、例えば、Low Complexity Mode(高速モード)方式を用いて、各マクロブロックに適用する予測モードを判定する。
ここで、イントラ予測部125、動き予測・補償部126、および、モード判定部127の処理について、より具体的に説明する。
H.264/AVCの規格では、イントラ予測およびインター予測の方法として、それぞれ、複数の予測モードが規定されている。
具体的には、輝度信号のイントラ予測に関して、イントラ予測するブロックの単位として、4×4画素(Intra4x4モード)、8×8画素(Intra8x8モード、High Profileが適用されている場合のみ)、および、16×16画素(Intra16x16モード)の3種類が規定されている。また、Intra4x4モードおよびIntra8×8モードにおいては、画素値を予測する方向として、予測モード0乃至予測モード8の9種類が規定されており、Intra16x16モードにおいては、画素値を予測する方向として、予測モード0乃至予測モード3の4種類が規定されている。
また、色差信号のイントラ予測に関して、イントラ予測するブロックの単位として、8×8画素の1種類が規定されており、画素値を予測する方向として、予測モード0乃至予測モード3の4種類が規定されている。
さらに、インター予測に関して、インター予測を行うブロックの単位として、16×16画素、16×8画素、8×16画素、8×8画素、8×4画素、4×8画素、および、4×4画素の7種類が規定されている。また、B(Bi-directional Predictive)スライスに属するブロックのインター予測に関して、時間軸において前方向(過去側)のピクチャのみを参照する前方向予測モード、時間軸において後ろ方向(未来側)のピクチャのみを参照する後ろ方向予測モード、時間軸において前後両方のピクチャを参照する双方向予測モードなどが規定されている。
さらに、P(Predictive)スライスまたはBスライスに属するブロックのインター予測に関して、動きベクトルにより参照される参照画像のブロックの画素値をそのまま用いることにより、マクロブロックに関する情報の符号量を抑制するスキップモードが規定されている。また、Bスライスに属するブロックのインター予測に関して、符号化済みのブロックの動きベクトル用いて動きベクトルを予測するダイレクトモードが規定されている。
イントラ予測部125は、マクロブロックごとに、そのマクロブロックに適用可能な全てのイントラ予測の予測モード(以下、イントラ予測モードとも称する)について、以下の式(1)により、コスト値Cost(Mode)を算出する。
Cost(Mode)=SA(T)D+SA(T)D0 ・・・(1)
ここで、SA(T)Dは、原画像と予測画像との差分である予測誤差の絶対値和である。また、SA(T)D0は、SA(T)Dに与えられるオフセット値であり、動きベクトルなど、マクロブロックに付加されるヘッダ情報の伝送に供するデータ量である。
イントラ予測部125は、算出した全てのコスト値Cost(Mode)、すなわち、マクロブロックに適用可能な全てのイントラ予測モードに対するコスト値Cost(Mode)を示す情報をモード判定部127に供給する。
なお、イントラ予測部125は、図3を参照して後述するように、緊急モード時には、符号量制御部119の制御の基に、コスト値Cost(Mode)を算出する予測モードを制限し、各マクロブロックに適用されるイントラ予測モードを制限する。
動き予測・補償部126も、イントラ予測部125と同様に、マクロブロックごとに、そのマクロブロックに適用可能な全てのインター予測の予測モード(以下、インター予測モードとも称する)について、上述した式(1)により、コスト値Cost(Mode)を算出する。動き予測・補償部126は、算出した全てのコスト値Cost(Mode)、すなわち、マクロブロックに適用可能な全てのインター予測モードに対するコスト値Cost(Mode)を示す情報をモード判定部127に供給する。
モード判定部127は、イントラ予測部125または動き予測・補償部126から取得したコスト値Cost(Mode)に基づいて、画質と符号量の観点から、各マクロブロックに適用する予測モードを選択する。
なお、図3を参照して後述するように、モード判定部127は、緊急モード時には、符号量制御部119の制御の基に、各マクロブロックに適用する予測モードを制限する。
モード判定部127は、イントラ予測モードのうちの1つを選択した場合、選択したイントラ予測モードを示す情報をイントラ予測部125に供給する。イントラ予測部125は、選択されたイントラ予測モードに基づいて、イントラ予測画像を生成し、生成したイントラ予測画像をモード判定部127に供給する。また、イントラ予測部125は、イントラ予測を行ったマクロブロックのイントラ予測に関する情報として、選択された予測モードなどの情報を可逆符号化部116に供給する。
また、モード判定部127は、インター予測モードのうちの1つを選択した場合、選択したインター予測モードを示す情報を動き予測・補償部126に供給する。動き予測・補償部126は、選択されたインター予測モードに基づいて、動きベクトルの検出、および、インター予測画像の生成を行い、生成したインター予測画像をモード判定部127に供給する。また、動き予測・補償部126は、インター予測を行ったマクロブロックのインター予測に関する情報として、選択された予測モード、検出した動きベクトル、参照画像(ピクチャ)の番号などの情報を可逆符号化部116に供給する。
モード判定部127は、選択した予測モードに基づいて生成されたイントラ予測画像またはインター予測画像を、加算器113および加算器122に供給する。
次に、図2のフローチャートを参照して、図1の画像処理装置101により実行される符号化処理について説明する。なお、この処理は、例えば、外部から画像処理装置101への画像の入力が開始されたとき、開始される。
ステップS1において、画像処理装置101は、画像の符号化を開始する。すなわち、図1を参照して上述した動作を、画像処理装置101の各部が開始することにより、入力された画像のH.264/AVC方式による符号化が開始される。また、図3を参照して後述する緊急モード対応処理も開始される。
ステップS2において、画像処理装置101は、全ての画像を符号化したかを判定する。ステップS2において、外部から入力された全ての画像を符号化したと判定されるまで、画像の符号化が実行され、外部から入力された全ての画像を符号化したと判定された場合、符号化処理は終了する。
次に、図3のフローチャートを参照して、図2を参照して上述した符号化処理中に画像処理装置101により実行される緊急モード対応処理を説明する。
ステップS21において、レート制御部118は、次のピクチャのターゲットビットを算出する。具体的には、レート制御部118は、例えば、TM5に規定されるレート制御方式を用いて、蓄積バッファ117に記憶されている画像の符号量に基づいて、次のピクチャのターゲットビットを算出する。レート制御部118は、算出したターゲットビットを示す情報を緊急モード判定部141に供給する。
ステップS22において、緊急モード判定部141は、次のピクチャの符号量が上限値を超えそうであるか否かを判定する。緊急モード判定部141は、レート制御部118から取得したターゲットビットが所定の上限値を超える場合、次のピクチャの符号量が上限値を超えそうであると判定し、処理はステップS23に進む。
ステップS23において、符号量制御部142は、緊急モード時の動作を指令する。具体的には、緊急モード判定部141は、次のピクチャの符号量が上限値を超えそうであることを示す情報を符号量制御部142に供給する。符号量制御部142は、直交変換部114、イントラ予測部125、および、モード判定部127に、緊急モード時の動作を指令する。
ステップS24において、直交変換部114は、符号量制御部142の制御の基に、所定の周波数成分の変換係数の0への置き換えを開始する。
例えば、次のフレームのターゲットビットをT、1ピクチャあたりの符号量の上限値をΘとし、予め定められている1ピクチャあたりの符号量に関する閾値をTh1、Th2、Th3(ただし、Th1<Th2<Th3)とした場合、直交変換部114は、符号量制御部142の制御の基に、Th1<T−Θ<Th2であるとき、直流(DC)成分およびそれ以外の特定の周波数成分を除く、所定の周波数成分の変換係数の値を0に置き換え、Th2≦T−Θ<Th3であるとき、直流成分以外の周波数成分の変換係数の値を0に置き換え、Th3≧T−Θであるとき、直流成分を含む全ての周波数成分の変換係数の値を0に置き換える。すなわち、ターゲットビットTに基づいて、変換係数を0に置き換える周波数成分の範囲が変更される。より詳細には、ターゲットビットTが大きいほど、より符号量が抑制されるように、変換係数を0に置き換える周波数成分の範囲が大きくされる。
また、例えば、マクロブロックが属するスライスのタイプに基づいて、変換係数を0に置き換える周波数成分の範囲を変更するようにしてもよい。例えば、I(Intra)スライスに属するマクロブロックについては、直流成分を含む全ての周波数成分の変換係数の値を0に置き換え、PスライスまたはBスライスに属するマクロブロックについては、直流成分以外の周波数成分の変換係数の値を0に置き換えるようにしてもよい。すなわち、PまたはBスライスよりも符号量が多くなる傾向にあるIスライスに属するマクロブロックの方が、PまたはBスライスに属するマクロブロックよりも、より符号量が抑制されるように、変換係数を0に置き換える周波数成分の範囲が大きくされる。
このように、所定の周波数成分の変換係数が0に置き換えられることにより、符号量が抑制される。
なお、直交変換部114による、変換係数の0への置き換えは、後述するステップS28において、緊急モードが解除されるまで継続される。
ステップS25において、イントラ予測部125は、符号量制御部142の制御の基に、適用するイントラ予測モードを制限する。例えば、イントラ予測部125は、符号量制御部142の制御の基に、輝度信号のIntra4x4モード、Intra8x8モード(High Profileが適用されている場合のみ)、および、Intra16x16モード、並びに、色差信号のそれぞれについて、画素値を予測する方向を1種類に限定し、限定された予測方向に対するコスト値Cost(Mode)のみを算出し、その他の予測方向に対するコスト値Cost(Mode)の算出を停止する。これにより、イントラ予測モードにおいて、全て同じ予測方向の予測モードが適用されるようになり、その結果、各ブロックの予測モードの符号化が不要となるため、符号量を抑制することができる。
なお、この場合、DCモード(輝度信号においては予測モード2、および、色差信号においては予測モード0)に予測方向を統一することにより、他の予測モードに統一した場合と比較して、画像に不自然な方向性が現れることなく、画質の劣化を抑えることができる。
また、例えば、輝度信号については、発生する符号量が少ない、Intra16x16モードについてのみコスト値Cost(Mode)の算出を行うようにしてもよい。
さらに、例えば、マクロブロックが属するスライスのタイプに基づいて、適用する予測モードを制限するようにしてもよい。例えば、Iスライスに属するマクロブロックの輝度信号については、Intra16x16モードについてのみコスト値Cost(Mode)の算出を行い、PスライスまたはBスライスに属するマクロブロックの輝度信号については、Intra4x4モード、Intra8x8モード(High Profileの場合)、および、Intra16x16モードのそれぞれについて、コスト値Cost(Mode)の算出を行うようにしてもよい。すなわち、PまたはBスライスよりも符号量が多くなる傾向にあるIスライスに属するマクロブロックの方が、PまたはBスライスに属するマクロブロックよりも、より符号量が抑制されるように、イントラ予測を行う単位であるブロックが大きく設定される。
このように、イントラ予測における符号量が抑制されるように、各マクロブロックに適用されるイントラ予測モードが制限される。
なお、イントラ予測部125による、イントラ予測モードの制限は、後述するステップS28において、緊急モードが解除されるまで継続される。
ステップS26において、モード判定部127は、符号量制御部142の制御の基に、適用するインター予測モードを制限する。
例えば、モード判定部127は、符号量制御部142の制御の基に、Bスライスに属するマクロブロックについては、インター予測モードの選択肢をスキップモードおよびダイレクトモードに制限する。すなわち、Bスライスに属するマクロブロックに適用される予測モードが、ステップS25において限定されたイントラ予測モード、ダイレクトモード、および、スキップモードのうちいずれかに制限される。
また、例えば、モード判定部127は、符号量制御部142の制御の基に、Pスライスに属するマクロブロックについては、インター予測モードの選択肢をスキップモードに限定する。すなわち、Pスライスに属するマクロブロックに適用される予測モードが、ステップS25において限定されたイントラ予測モード、および、スキップモードのうちいずれかに制限される。
なお、Iスライスに属するマクロブロックについては、インター予測は行われないため、適用される予測モードは、ステップS25において限定されたイントラ予測モードに制限される。
モード判定部127は、コスト値Cost(Mode)に基づいて、制限された予測モードの中から、当該マクロブロックに適用する予測モードを選択する。
これにより、インター予測が選択された場合、その予測モードが、スキップモードまたはダイレクトモードとなるため、符号量が抑制される。
なお、PまたはBスライスに属するマクロブロックに対して、イントラ予測モードを選択肢に加えないようにしてもよい。これにより、Pスライスに属するマクロブロックについては、インター予測のスキップモードが適用され、Bスライスに属するマクロブロックについては、インター予測のダイレクトモードまたはスキップモードが適用されるようになり、より符号量を抑制することが可能となる。
なお、モード判定部127による、インター予測モードの制限は、後述するステップS28において、緊急モードが解除されるまで継続される。
その後、処理はステップS21に戻り、ステップS21以降の処理が実行される。
ステップS22において、次のピクチャの符号量が上限値を超えそうでないと判定された場合、処理はステップS27に進む。
ステップS27において、符号量制御部142は、緊急モード中であるか否かを判定する。緊急モード中であると判定された場合、処理はステップS28に進む。
ステップS28において、符号量制御部142は、緊急モードを解除する。具体的には、符号量制御部142は、直交変換部114、イントラ予測部125、および、モード判定部127に、緊急モードの解除を指令する。これにより、直交変換部114、イントラ予測部125、および、モード判定部127は、緊急モード時の動作を停止し、通常の動作を再開する。
その後、処理はステップS21に戻り、ステップS21以降の処理が実行される。
ステップS27において、緊急モード中でないと判定された場合、処理はステップS21に戻り、ステップS21以降の処理が実行される。
以上のように、1ピクチャあたりの符号量が所定の上限値を超えそうであると判定された場合、所定の周波数成分の変換係数の0への置き換え、適用するイントラ予測モードの制限、または、適用するインター予測モードの制限を行うことにより、より確実に符号量を上限値以下に抑えることができる。
また、所定の周波数成分の変換係数の0への置き換え、適用するイントラ予測モードの制限、および、適用するインター予測モードの制限は、緊急モード時にしか行われないため、不必要に画質が劣化することが防止される。
なお、以上の説明では、緊急モード時に、ステップS24乃至S26の処理を全て行う例を示したが、1つまたは2つのステップの処理のみを行うようにしてもよい。
また、ターゲットビットの値、マクロブロックが属するスライスの種類などに基づいて、上述したように、ステップS24乃至S26の各ステップ内において実行する処理の選択を行うだけではなく、ステップS24乃至S26のうち実際に実行するステップを選択するようにしてもよい。例えば、予め定められている1ピクチャあたりの符号量に関する閾値をTh11、Th12、Th13(ただし、Th11<Th12<Th13)とした場合、Th11<T−Θ<Th12であるとき、ステップS25において、イントラ予測モードをDCモードに制限するようにし、Th2≦T−Θ<Th3であるとき、ステップS25において、イントラ予測モードをIntra16x16モードに制限するようにし、Th3≧T−Θであるとき、ステップS24において、所定の周波数成分の変換係数を0に置き換えるようにしてもよい。
さらに、図3のステップS22の判定処理は、上述した例に限定されるものではなく、ターゲットビット以外の値に基づいて、判定処理を行うようにしてもよい。
なお、以上の説明では、H.264/AVC方式により符号化を行う例を示したが、本発明は、例えば、MPEG-4(Moving Picture Coding Experts Group phase4)など他の符号化方式により符号化を行う場合にも適用できる。
上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、プログラム記録媒体からインストールされる。
図4は、上述した一連の処理をプログラムにより実行するパーソナルコンピュータ300の構成の例を示すブロック図である。CPU(Central Processing Unit)301は、ROM(Read Only Memory)302、または記録部308に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)303には、CPU301が実行するプログラムやデータなどが適宜記憶される。これらのCPU301、ROM302、およびRAM303は、バス304により相互に接続されている。
CPU301にはまた、バス304を介して入出力インタフェース305が接続されている。入出力インタフェース305には、キーボード、マウス、マイクロホンなどよりなる入力部306、ディスプレイ、スピーカなどよりなる出力部307が接続されている。CPU301は、入力部306から入力される指令に対応して各種の処理を実行する。そして、CPU301は、処理の結果を出力部307に出力する。
入出力インタフェース305に接続されている記録部308は、例えばハードディスクからなり、CPU301が実行するプログラムや各種のデータを記憶する。通信部309は、インターネットやローカルエリアネットワークなどのネットワークを介して外部の装置と通信する。
また、通信部309を介してプログラムを取得し、記録部308に記憶してもよい。
入出力インタフェース305に接続されているドライブ310は、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア311が装着されたとき、それらを駆動し、そこに記録されているプログラムやデータなどを取得する。取得されたプログラムやデータは、必要に応じて記録部308に転送され、記憶される。
コンピュータにインストールされ、コンピュータによって実行可能な状態とされるプログラムを格納するプログラム記録媒体は、図4に示すように、磁気ディスク(フレキシブルディスクを含む)、光ディスク(CD-ROM(Compact Disc-Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク、もしくは半導体メモリなどよりなるパッケージメディアであるリムーバブルメディア311、または、プログラムが一時的もしくは永続的に格納されるROM302や、記録部308を構成するハードディスクなどにより構成される。プログラム記録媒体へのプログラムの格納は、必要に応じてルータ、モデムなどのインタフェースである通信部309を介して、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の通信媒体を利用して行われる。
なお、本明細書において、プログラム記録媒体に格納されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
さらに、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である
101 画像処理装置, 114 直交変換部, 115 量子化部, 118 レート制御部, 119 緊急モード制御部, 125 イントラ予測部, 126 動き予測・補償部, 127 モード判定部, 141 緊急モード判定部, 142 符号量制御部

Claims (8)

  1. 画像を符号化した場合に発生する発生符号量を予測する予測手段と、
    予測された前記発生符号量が所定の値を超える場合に、Bスライスに属するブロックに対して、イントラ予測モード、ダイレクトモードもしくはスキップモードのいずれかかが適用され、Pスライスに属するブロックに対して、イントラ予測モードもしくはスキップモードが適用され、イントラ予測を用いて符号化されるブロックに対して、同じ予測方向のイントラ予測モードが適用されるように制御する予測モード制御手段と、
    適用された予測モードにより各ブロックを符号化する符号化手段と
    を備える画像処理装置。
  2. 前記予測モード制御手段は、予測された前記発生符号量が所定の値を超える場合に、イントラ予測を用いて符号化されるブロックに対して、DCモードが適用されるように制御する
    請求項1に記載の画像処理装置。
  3. 前記予測モード制御手段は、予測された前記発生符号量が所定の値を超える場合に、イントラ予測を用いて符号化されるブロックに対して、Intra16×16モードが適用されるように制御する
    請求項1に記載の画像処理装置。
  4. 前記予測モード制御手段は、予測された前記発生符号量が所定の値を超える場合に、イントラ予測を用いて符号化されるブロックの大きさを、各ブロックの属するスライスのタイプに基づいて制御する
    請求項1に記載の画像処理装置。
  5. 前記予測モード制御手段は、予測された前記発生符号量が所定の値を超える場合に、Iスライスに属するブロックのイントラ予測を16×16のブロックサイズにて行い、PスライスもしくはBスライスに属するブロックのイントラ予測を4×4、8×8、もしくは16×16のブロックサイズにて行なうように制御する
    請求項4に記載の画像処理装置。
  6. 画像の符号化を行う画像処理装置が、
    前記画像を符号化した場合に発生する発生符号量を予測し、
    予測された前記発生符号量が所定の値を超える場合に、Bスライスに属するブロックに対して、イントラ予測モード、ダイレクトモードもしくはスキップモードのいずれかかが適用され、Pスライスに属するブロックに対して、イントラ予測モードもしくはスキップモードが適用されるとともに、イントラ予測を用いて符号化されるブロックに対して、同じ予測方向のイントラ予測モードが適用されるように制御し、
    適用された予測モードにより各ブロックを符号化する
    ステップを含む画像処理方法。
  7. 画像を符号化した場合に発生する発生符号量を予測し、
    予測された前記発生符号量が所定の値を超える場合に、Bスライスに属するブロックに対して、イントラ予測モード、ダイレクトモードもしくはスキップモードのいずれかかが適用され、Pスライスに属するブロックに対して、イントラ予測モードもしくはスキップモードが適用されるとともに、イントラ予測を用いて符号化されるブロックに対して、同じ予測方向のイントラ予測モードが適用されるように制御し、
    適用された予測モードにより各ブロックを符号化する
    ステップを含む処理をコンピュータに実行させるためのプログラム。
  8. 画像を符号化した場合に発生する発生符号量を予測し、
    予測された前記発生符号量が所定の値を超える場合に、Bスライスに属するブロックに対して、イントラ予測モード、ダイレクトモードもしくはスキップモードのいずれかかが適用され、Pスライスに属するブロックに対して、イントラ予測モードもしくはスキップモードが適用されるとともに、イントラ予測を用いて符号化されるブロックに対して、同じ予測方向のイントラ予測モードが適用されるように制御し、
    適用された予測モードにより各ブロックを符号化する
    ステップを含む処理をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2010157761A 2010-07-12 2010-07-12 画像処理装置および方法、プログラム、並びに、記録媒体 Expired - Fee Related JP5007761B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010157761A JP5007761B2 (ja) 2010-07-12 2010-07-12 画像処理装置および方法、プログラム、並びに、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010157761A JP5007761B2 (ja) 2010-07-12 2010-07-12 画像処理装置および方法、プログラム、並びに、記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006193672A Division JP2008022405A (ja) 2006-07-14 2006-07-14 画像処理装置および方法、並びに、プログラム

Publications (2)

Publication Number Publication Date
JP2010233263A JP2010233263A (ja) 2010-10-14
JP5007761B2 true JP5007761B2 (ja) 2012-08-22

Family

ID=43048577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010157761A Expired - Fee Related JP5007761B2 (ja) 2010-07-12 2010-07-12 画像処理装置および方法、プログラム、並びに、記録媒体

Country Status (1)

Country Link
JP (1) JP5007761B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130040414A (ko) * 2011-10-14 2013-04-24 주식회사 팬택 인트라 예측 모드에 따른 변환 및 역변환 방법과 이를 이용한 부호화 및 복호화 장치
WO2014005930A1 (en) 2012-07-04 2014-01-09 Thomson Licensing Spatial prediction with increased number of possible coding modes
US10015515B2 (en) 2013-06-21 2018-07-03 Qualcomm Incorporated Intra prediction from a predictive block
US10390076B2 (en) 2016-03-29 2019-08-20 Mitsubishi Electric Corporation Image receiving/reproducing device, image generating/transmitting device, display system, image receiving/reproducing method, image generating/transmitting method, and computer readable medium
WO2017183109A1 (ja) 2016-04-19 2017-10-26 三菱電機株式会社 画像処理装置、画像処理方法及び画像処理プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002010271A (ja) * 2000-04-20 2002-01-11 Matsushita Electric Ind Co Ltd ビデオ符号化装置
JP2003284075A (ja) * 2002-01-18 2003-10-03 Toshiba Corp 動画像符号化方法と装置及び復号化方法と装置
JP2003348588A (ja) * 2002-05-30 2003-12-05 Matsushita Electric Ind Co Ltd 動画像符号化装置と映像伝送システム
JP2004320437A (ja) * 2003-04-16 2004-11-11 Sony Corp データ処理装置、符号化装置およびそれらの方法
JP4130617B2 (ja) * 2003-09-04 2008-08-06 株式会社東芝 動画像符号化方法および動画像符号化装置
JP4515886B2 (ja) * 2003-10-28 2010-08-04 パナソニック株式会社 面内予測符号化方法
JP2005151017A (ja) * 2003-11-13 2005-06-09 Sharp Corp 画像符号化装置
JP4184249B2 (ja) * 2003-12-11 2008-11-19 シャープ株式会社 画像符号化装置
JP4763422B2 (ja) * 2004-12-03 2011-08-31 パナソニック株式会社 イントラ予測装置

Also Published As

Publication number Publication date
JP2010233263A (ja) 2010-10-14

Similar Documents

Publication Publication Date Title
KR101362590B1 (ko) 화상 처리 장치 및 방법
US8873633B2 (en) Method and apparatus for video encoding and decoding
KR101814259B1 (ko) 영상 부호화 장치, 영상 복호 장치, 영상 부호화 방법 및 영상 복호 방법
WO2011050641A1 (en) Video coding methods and video encoders and decoders with localized weighted prediction
KR101394209B1 (ko) 영상의 인트라 예측 부호화 방법
JP2007329693A (ja) 画像符号化装置、及び画像符号化方法
US20120027092A1 (en) Image processing device, system and method
KR20120079180A (ko) 동화상 복호화 방법 및 장치
KR20080096760A (ko) 부호화 장치, 부호화 방법 및 프로그램
JP2004297768A (ja) 映像信号符号化装置、および映像信号符号化方法
JP5007761B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
JP7343817B2 (ja) 符号化装置、符号化方法、及び符号化プログラム
KR101450645B1 (ko) 비디오 비트율 제어 방법 및 장치
JP5625512B2 (ja) 符号化装置、符号化方法、プログラム、および記録媒体
JP5100572B2 (ja) 符号化装置
JP2001128179A (ja) 動画像符号化装置および方法
KR100708182B1 (ko) 동영상 부호화기의 비트율 제어 장치 및 방법
JP2011091772A (ja) 画像符号化装置
JP5760950B2 (ja) 動画像再符号化装置、動画像再符号化方法及び動画像再符号化用コンピュータプログラム
JP2010035025A (ja) 符号化装置およびその方法
JP2004165894A (ja) 符号化器のビットレート制御方法
JP4561701B2 (ja) 動画像符号化装置
JP6016484B2 (ja) 符号化装置
KR20140129418A (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치
JP2005072846A (ja) 動画像符号化装置及び動画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100712

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120229

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120501

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120514

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150608

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees