JP4031455B2 - 画像符号化装置 - Google Patents

画像符号化装置 Download PDF

Info

Publication number
JP4031455B2
JP4031455B2 JP2004096763A JP2004096763A JP4031455B2 JP 4031455 B2 JP4031455 B2 JP 4031455B2 JP 2004096763 A JP2004096763 A JP 2004096763A JP 2004096763 A JP2004096763 A JP 2004096763A JP 4031455 B2 JP4031455 B2 JP 4031455B2
Authority
JP
Japan
Prior art keywords
encoding
coding
code amount
prediction
coding distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004096763A
Other languages
English (en)
Other versions
JP2005286645A (ja
Inventor
知也 児玉
淳 松村
昇 山口
達明 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004096763A priority Critical patent/JP4031455B2/ja
Priority to US11/062,625 priority patent/US7502517B2/en
Publication of JP2005286645A publication Critical patent/JP2005286645A/ja
Application granted granted Critical
Publication of JP4031455B2 publication Critical patent/JP4031455B2/ja
Priority to US12/234,741 priority patent/US8184716B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像に対して符号化を行う画像符号化装置、画像符号化方法および画像符号化プログラムに関するものである。
LSI技術およびコンピュータ技術の進化に伴い、MPEG−2/MPEG−4に代表される動画像符号化が広く普及してきている。MPEG−2は放送やDVDに応用されている。また、MPEG−4は携帯電話や携帯型のビデオビューアなどに応用されている。このように、動画像のディジタル化は現代欠かすことのできない技術として定着している。
画像符号化の処理は、動き補償、動き検出および離散コサイン変換などの処理を含んでいる。これらは、対象となる画像データに対して同じ処理を繰り返し行う繰り返し処理である。このような繰り返し処理には、SIMD(Single Instruction Multiple Data)が適している。SIMDは、汎用プロセッサの高機能化に伴い開発されたものである。これは、複数のデータに対して同じ処理を行う場合に、それらを同時にかつ高速に実行することができるという利点を有する。
SIMDを画像符号化に用いることにより処理の高速化を図る技術が知られている (例えば、非特許文献1参照)。非特許文献1によれば、Intel社Pentium(登録商標) 3プロセッサにおいてSIMD命令を使用した場合、SIMDを使わない従来法により970サイクル必要な離散コサイン変換を50サイクルで実行することができる。
この一方で、動画像符号化を高画質に行う技術が検討されている。動画像の符号化を高画質に行う方法として、レート歪最適化と呼ばれる手法が知られている。この手法は、動き検出や符号化モード判定に用いられるものである。
レート歪最適化の応用例としては、動き補償、DCT係数量子化時のスキャン方法、イントラフレーム符号化時の量子化係数特定、イントラ/インターモード判定などにレート歪最適化を利用するものが知られている(例えば、特許文献1参照)。
しかし、例えば、レート歪最適化におけるイントラ/インターモード判定においては、動画像を符号化することにより得られる発生符号量およびこれにより生ずる符号化歪みを利用する。従って、イントラ/インターモード判定を行うためには、実際にイントラモードおよびインターモードのそれぞれにおいて符号化処理を行う必要がある。しかし、符号化処理には長時間を要するため、計算コストが大きくなるという問題があった。
本発明は、上記に鑑みてなされたものであって、少ない演算量で、レート歪み最適化により、画像の品質を保ちつつ画像符号化を行うことのできる画像符号化装置、画像符号化方法および画像符号化プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、画像を複数のブロックに分割し、当該ブロックを単位として符号化を行う画像符号化装置であって、符号化の処理内容の異なる複数の符号化モードに対して予め定められた周波数変換および量子化を、前記ブロックに対して施す処理手段と、前記処理手段による量子化結果を用いて、符号化モードにおける予測符号量を算出する予測符号量算出手段と、前記予測符号量算出手段が算出した前記予測符号量と前記予測符号化歪み量算出手段によって算出された前記予測符号化歪み量との線形結合から、各符号化モードにおける符号化コストを算出する符号化コスト算出手段と、前記符号化コスト算出手段が各符号化モードに対して算出した前記符号化コストのうち最小となる最小符号化コストを選択する最小符号化コスト選択手段と、前記最小符号化コスト選択手段が選択した前記最小符号化コストに対応する前記符号化モードにおいて、前記ブロックを符号化する符号化手段と、前記予測符号量算出手段が前記予測符号量を算出するときに利用する符号量予測式を、各符号化モードに対応付けて複数保持する符号量予測式保持手段と、前記符号化手段が所定の符号化モードにおいて符号化した場合に実際に発生した実符号量に基づいて、前記符号量予測式保持手段が当該符号化モードに対応付けて保持する前記符号量予測式を修正する符号量予測式修正手段と、を備え、前記予測符号量算出手段は、前記符号量予測式保持手段に保持されている前記符号量予測式を利用して前記予測符号量を算出することを特徴とする。
本発明にかかる画像符号化装置は、実際に符号化処理を行うことなく、符号化コストを算出することができる。すなわち、符号化処理を行うことなく、符号化コストに基づく符号化モードの選択を行うことができる。したがって、少ない演算量で、画像の品質を保ちつつより適切な画像符号化を行うことができるという効果を奏する。
以下に、本発明にかかる画像符号化装置、画像符号化方法および画像符号化プログラムの実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
図1は、本実施の形態にかかるMPEG符号化装置100の全体構成を示すブロック図である。なお、本実施の形態にかかる符号化装置100は、ISO/IEC13818−2(MPEG−2 Video)に準拠した符号化処理を行う。
なお、符号化の処理は、これに限定されるものではなく、ISO/IEC14496−2(MPEG−4 Video)に準拠した符号化処理であってもよい。また、ISO/IEC14496−10(MPEG−4 AVC)に準拠した符号化処理であってもよい。
符号化装置100は、動き検出および動き補償器102、減算器103、離散コサイン変換器(DCT)104、量子化器105、量子化結果メモリ106と、剰余メモリ107と、コスト計算器108と、モード選択器109と、セレクタ110と、可変長符号化器(VLC)111、逆量子化器112、逆離散コサイン変換器(IDCT)113、画像保存メモリ114、減算器115、セレクタ116、加算器117、シーンチェンジ検出器118とを備えている。
なお、本実施の形態にかかるコスト計算器108は、特許請求の範囲に記載の予測符号量算出手段、符号化コスト算出手段、予測符号化歪み算出手段、予測式保持手段、予測式修正手段、および初期化手段を構成する。
本実施の形態にかかる符号化装置100は、複数のモードにおける符号化を行う。ここで、複数のモードとは、MPEG符号化の処理の内容の異なる複数のモードのことである。
MPEG符号化としては、イントラ符号化、前方向インター符号化、後方向インター符号化、双方向インター符号化など複数の処理がある。本実施の形態にかかる符号化装置100においては、イントラ符号化を行うイントラ符号化モード・前方向インター符号化・後方向インター符号化の3つのモードが設定可能である。なお、ISO/IEC13818−2勧告においては、インター符号化にフィールド単位で動き補償を行うケースとフレーム単位で動き補償を行うケースが存在し、またフィールド単位でDCTを行う場合とフレーム単位でDCTを行う場合がある。ここでは、説明の簡単化のために、これらをまとめて前方向インター符号化および後方向インター符号化としている。
符号化装置100の各部は、処理時に設定されている符号化モードに応じた処理を行う。これにより、各画像に適した符号化処理を施すことができる。
動き検出および動き補償器102は、外部から入力画像を取得し、取得した入力画像に対して動き検出および動き補償を行う。具体的には、前方向および後方向の動き検出および動き補償を行う。そして、その結果得られた2種類の残差信号がDCT104に送られる。
DCT104は、減算器103を介して動き検出および動き補償器102による処理の結果得られる残差信号を取得し、残差信号に対して周波数変換を行う。本実施の形態にかかるDCT104は、離散コサイン変換を行う。周波数変換は、離散コサイン変換に限定されるものではなく、他の変換方式であってもよい。ただし、直交変換であることが望ましい。DCT104はまた、イントラ符号化モードにおいては、入力画像信号を直接取得し、入力画像信号に対して離散コサイン変換を行う。
すなわち、全てのモードにおける画像信号(入力画像信号および残差信号)が順番にDCT104に入力される。そして、DCT104は、空間情報としての画像信号をMPEGで符号化される周波数情報であるDCT係数に変換する。
DCT104は、画像を8×8の矩形領域に分割したブロックと呼ばれる単位ごとに変換を行う。そして、DCT104は、変換処理によりDCT係数も8×8の合計64個のDCT係数を得る。
量子化器105は、DCT104によって得られたDCT係数を量子化する。そして、量子化結果を量子化結果メモリ106に格納する。さらに、量子化演算により得られた剰余を剰余メモリ107に格納する。
量子化器105は、各符号化モードに対する量子化マトリクスを保持している。そして、符号化モード毎に異なる量子化マトリクスを利用する。図2は、イントラ符号化モードにおいて量子化器105が利用する量子化マトリクスを示している。図3は、インター符号化モードにおいて量子化器105が利用する量子化マトリクスを示している。
なお、図2および図3は、いずれも初期状態における量子化マトリクスを示しているが、これらの量子化マトリクスは任意に設定可能なものである。
量子化器105は、具体的には次式を用いてDCT係数を量子化する。
Figure 0004031455
ここで、DCT(i,j)(i,j=0,1・・・,7)は、DCT係数である。QDCT(i,j)は、量子化後のDCT係数である。W(i,j)は、量子化マトリクスである。また、qscaleは量子化係数である。Round(x)は、xに最も近い整数を求める丸め処理を示す関数である。量子化係数は、適切なビットレートで符号化を行うべく外部において調整される値である。
また、量子化器105は、次式を用いて剰余を算出する。
Figure 0004031455
ここで、RES(i,j)は、量子化により発生する剰余である。
コスト計算器108は、量子化結果メモリ106に格納されている量子化結果に基づいて、各符号化モードにおける発生符号量の予測値である予測発生符号量を算出する。また、剰余メモリ107に格納されている剰余に基づいて各符号化モードにおける符号化歪みの予測値である予測符号化歪みを算出する。
コスト計算器108は、発生符号量の予測値を算出するときに用いる発生符号量予測式、および符号化歪みの予測値を算出するときに用いる符号化歪み予測式を保持している。発生符号量予測式および符号化歪み予測式は、それぞれ各符号化モードによって異なっている。コスト計算器108は、各符号化モードに対する発生符号量予測式および符号化歪み予測式を保持している。
そして、コスト計算器108は、各モードにおける発生符号量予測式を利用して、予測発生符号量を算出する。また、符号化歪み予測式を利用して、予測符号化歪みを算出する。
コスト計算器108は、さらに以上により算出した予測発生符号量と予測歪みの線形結合(D+λR)から符号化コストを算出する。なお、符号化コストの算出は、設定可能な総ての符号化モードに対して行う。
所定のマクロブロックを符号化した場合の発生符号量Rは、(式3)に示す発生符号量予測式を用いて算出される。
Figure 0004031455
ここでCrateおよびαrateは、ピクチャのコーディング中一定の値である。また、Cheaderは、該当モードで符号化する場合に必要なDCT係数以外の符号量である。DCT係数以外の符号量とは、モード情報、量子化スケール、動きベクトルを符号化するのに必要な符号量などである。
また、符号化歪みDは(式4)に示す符号化歪み予測式を用いて近似的に算出される。
Figure 0004031455
ここで、Cdist、αdistおよびβdistは、ピクチャのコーディング中一定の値である。
なお、予測発生符号量の算出および予測符号化歪みの算出においては、モード情報、量子化スケールおよび動きベクトル等の情報が必要となる。コスト計算器108は、これらの情報をテーブルルックアップなどの方法により得る。
ここで、マクロブロックとは、16×16画素の画像ブロック単位である。一般的な4:2:0カラー画像の場合、1個のマクロブロックは、6個のブロックを含んでいる。符号化装置100は、マクロブロック単位で符号化を行う。
図4は、MPEGにおけるマクロブロックのビットストリームの典型的な文法構成例を示している。マクロブロックのビットストリームは、符号化モードに関するモード情報、量子化スケール、動きベクトルおよび各ブロックのDCT係数等の情報を有している。
なお、図4に示すビットストリームは、一例であって、符号化モードおよび対象とする画像に応じて、その文法は異なっている。例えば、イントラ符号化においては、動きベクトルの情報を有さなくともよい。また、量子化スケールが直前のマクロブロックにおける量子化スケールと等しい場合には、当該マクロブロックのビットストリームは、量子化スケールの情報を有さなくともよい。また、インター符号化において全てのDCT係数が0であるブロックのビットストリームは、DCT係数にかかる情報を有さなくともよい。
モード選択器109は、コスト計算器108が各符号化モードに対して算出した符号化コストのうち最小の符号化コストを選択し、当該符号化コストに対応する符号化モードを選択する。モード選択器109はさらに、選択した符号化モードにおける量子化結果を量子化結果メモリ106から抽出し、VLC111および逆量子化器112に送る。
VLC111は、受け取った量子化結果を利用して可変長符号化(VLC)を行う。VLC111は、可変長符号化により得られたデータを逆量子化器112に送る。また、符号化の結果発生した実ビット数、すなわち実発生符号量をコスト計算器108に送る。
逆量子化器112およびIDCT113は、セレクタ110から取得したデータに対して、それぞれ逆量子化及び逆離散コサイン変換を行う。インター符号化モードにおいては、これらの処理により差分画像が生成される。また、イントラ符号化においては、これらの処理によりデコード画像が生成される。
一方、セレクタ116は、モード選択器109により選択されたモードにおいて動き補償された画像を選択し、加算器117に送る。
加算器117は、差分画像またはデコード画像をIDCT113から取得する。また、動き検出および動き補償器102によって動き補償された画像をセレクタ116から取得する。そして、差分画像等と動き補償された画像とを加算し、ローカルデコード画像を生成する。
減算器115は、このローカルデコード画像と、入力画像との差分を算出する。この差分値により実際の符号化歪みが求まる。減算器115は、得られた符号化歪みをコスト計算器108に送る。画像保存メモリ114は、加算器117から再生画像を取得し、取得した再生画像を保存する。
コスト計算器108はまた、VLC111から取得した実発生符号量と「Σ(|QDCT|)」とを対応付けて保持する。さらに、コスト計算器108を介して加算器117から取得した符号化歪みと「Σ(RES)」とを対応付けて保持する。
コスト計算器108は、1フレームにおける符号化が完了すると、先に対応付けて保持した発生ビット数と「Σ(|QDCT|)」との関係に基づいて、予測発生符号量Rを算出する関数(式3)を更新する。また、符号化歪みと「Σ(RES)」との関係に基づいて、符号化歪みDを算出する関数(式4)の係数を更新する。
具体的には、1フレームに対する符号化処理の結果得られた統計データの傾向に基づいて、符号化歪みを算出する。
図5は、実発生符号量と「Σ(|QDCT|)」との関係を示すグラフを示している。このように、1フレームに対する符号化が完了すると、符号化結果から実発生符号量と「Σ(|QDCT|)」との関係を示す統計データが得られる。この関係から、式3におけるCrateおよびαrateの値を決定することができる。このとき、例えば最小二乗法を利用してもよい。
図6は、実符号化歪みと「Σ(RES)」との関係を示すグラフを示している。この関係から、(式4)におけるCdist、αdistおよびβdistの値をそれぞれ決定することができる。
また、シーンチェンジ検出器118は、常に入力画像を監視し、シーンチェンジを検出する。コスト計算器108は、シーンチェンジを検出すると、その旨コスト計算器108に通知する。コスト計算器108は、シーンチェンジ検出器118がシーンチェンジを検出すると、既に保持している実発生符号量と「Σ(|QDCT|)」の関係、および実符号化歪み「Σ(RES)」との関係をすべて消去する。さらに、予測係数Crate、αrate、Cdist、αdist、およびβdistを初期値にリセットする。すなわち、発生符号量予測式および符号化歪み予測式を初期化する。
図7は、本実施の形態にかかる符号化装置100に特徴的な符号化モード選択処理を示すフローチャートである。
符号化装置100は、動画像に対してマクロブロック単位で符号化モード設定処理を行う(ステップS100)。次に、選択した符号化モードに応じた符号化処理を施す(ステップS102)。次に、符号化により得られた実発生符号量をコスト計算器108に保持させる(ステップS104)。また、符号化により得られた実符号化歪みをコスト計算器108に保持させる(ステップS106)。以上ステップS100〜ステップS106の処理を1フレームに対して繰り返す。
このように、各マクロブロック単位で符号化モード設定を行うので、各マクロブロックに対して適切なモードにおける符号化処理を施すことができる。
1フレームに対するステップS100〜ステップS103の処理が完了すると(ステップS108,Yes)、コスト計算器108は、これまでに蓄積した実発生符号量の統計データに基づいて、対応する符号化モードの発生符号量予測式を更新する(ステップS110)。また、これまでに蓄積した実符号化歪みの統計データに基づいて対応する符号化モードの符号化歪み予測式を更新する(ステップS112)。
このように、1フレームに対する符号化処理が完了する毎に、1フレームに対して得られた実測値に基づいて対応する符号化モードにおける発生符号量予測式および号化歪み予測式を更新する。すなわち、実測値を予測式にフィードバックする。したがって、コスト計算器108は、より実測値に近い予測発生符号量および予測符号化歪みを算出することができる。すなわち、より実測値に近い符号化コストを算出することができ、より適切な符号化モード選択を行うことができる。
なお、イントラ符号化モードにおける予測式の更新は、フローチャートを参照しつつ説明したように、1フレーム毎に行うが、インター符号化モードにおける予測式の更新は、インター符号化モードが存在しないI−ピクチャでは行わない。また、後方向インター符号化モードが存在しないP−ピクチャでは、後方向インター符号化に関する予測式の更新は行わない。
さらに、処理対象を次のフレームに移す(ステップS120,Yes、ステップS122)。ここで、シーンチェンジ検出器118がシーンチェンジ検出をすると、ステップS110において更新された発生符号量予測式を初期化する(ステップS126)。さらに、ステップS112において更新された符号化歪み予測式を初期化する(ステップS128)。
以上の処理を、動画像の総てのフレームに対して行うと(ステップS120,No)、符号化が完了する。
シーンチェンジがあると、それまでの画像とは、その特徴が異なる場合が多い。このため、これまでの統計データとは異なる傾向を示すことが予想される。そこで、本実施の形態にかかる符号化装置100においては、シーンチェンジが検出された場合には、発生符号量予測式および符号化歪み予測式を初期化することとする。
これにより、シーンチェンジがあった場合であっても、実測値に近い予測発生符号量および予測符号化歪みを算出することができる。したがって、より適切な符号化モードにおける符号化処理を施すことができる。
図8は、図7において説明した符号化モード設定ステップ(ステップS100)における詳細な処理を示すフローチャートである。
符号化モード設定ステップにおいては、イントラ符号化における符号化コストを算出する(ステップS200)。さらに、前方向インター符号化における符号化コストおよび後方向インター符号化における符号化コストを算出する(ステップS202、ステップS204)。
イントラ符号化による予測発生符号量およびインター符号化によける予測発生符号量をそれぞれRintraおよびRforwardおよびRbackwardとする。また、イントラ符号化による予測符号化歪みをDintra、前方向および後方向インター符号化によける予測符号化歪みをそれぞれDforwardおよびDbackwardとする。このとき、それぞれのモードのコスト関数Eintra、EforwardおよびEbackwardは次式で表される。
Figure 0004031455
次に、各符号化モードにおける符号化コストを比較する(ステップS204)。前方向インター符号化における符号化コストが他のモードにおける符号化コストに比べて小さい場合には(ステップS204,Yes)、前方向インター符号化モードに設定する(ステップS206)。後方向インター符号化における符号化コストが他のモードにおける符号化コストに比べて小さい場合には(ステップS208,Yes)、後方向インター符号化モードに設定する(ステップS210)。また、イントラ符号化における符号化コストが他のモードにおける符号化コストに比べて小さい場合には(ステップS208,No)、イントラ符号化モードに設定する(ステップS212)。
このように、本実施の形態にかかる符号化装置100は、符号化コストがより小さくなるような符号化モードに設定することにより、処理対象となるフレームにより適した符号化処理を施すことができる。
図9は、図8において示した符号化コスト算出ステップ(ステップS200,ステップS202)における詳細な処理を示すフローチャートである。
まず、DCT104は、該当する符号化モードにおいて符号化した場合のDCT係数を算出する(ステップS300)。次に、量子化器105は、算出したDCT係数の量子化を行い、量子化結果および剰余を算出する(ステップS302)。次に、コスト計算器108は、剰余メモリ107に保持されている量子化結果から予測発生符号量を算出する(ステップS304)。さらに、コスト計算器108に保持されている符号化歪みから予測符号化歪みを算出する(ステップS306)。そして、算出した予測発生符号量および予測符号化歪みから符号化コストを算出する(ステップS308)。
このように、各符号化モードにおいて、実際に逆符号化を行うことなく符号化コストを算出することができるので、処理量を減らすことができる。
符号化コストに基づいて符号化モードを選択する方法は、MPEG−4 Part10(AVC)|H.264におけるリファレンスエンコーダにも「レート歪み最適化」という手法として採用されている。ただし、当該リファレンスエンコーダでは、は量子化係数の関数として表されている。また、従来の方法においては、発生符号量および符号化歪みは総て実測値を使用している。
実測値を得るためには、各符号化モードにおいて実際に符号化処理を行わなければならない。このため、計算量が大きくなり、処理効率が低下するという問題があった。
具体的には、レート歪み最適化を用いない場合に比べ、レート歪み最適化に基づくモード判定を行った場合数倍の時間がかかることになる。MPEG−2において1つのマクロブロックを符号化するモードは、イントラ/インターの2種類に大別される。インター符号化はさらに前方フィールド動き補償、前方フレーム動き補償、双方向フィールド動き補償、双方向フレーム動き補償、後方フィールド動き補償、後方フレーム動き補償の6種類に分類される。
これら全てのモードにレート歪み最適化に基づくモード判定を導入すれば、処理時間は7倍に増大する。さらに、MPEG−4 Part10(AVC)|H.264では、イントラ符号化およびインター符号化とも大幅にモードが拡張されており、レート歪み最適化導入による計算コストの増大量は数十倍程度である。
このような膨大な処理をリアルタイムに処理するためには、数十倍の演算能力を持つプロセッサあるいは数十倍の回路規模をもつLSIが必要となる。従って、上述の計算量の増加は、より重要な問題となってくる。
これに対して、本実施の形態にかかる符号化装置100は、上述のように、実際に符号化処理を行うことなく、予測式を用いて算出した予測発生符号量および予測符号化歪みに基づいて符号化コストを算出するので、符号化処理に起因して演算量を増加させることなく、適切に符号化モードを決定することができる。
図10は、本実施の形態にかかる符号化装置100のハードウェア構成を示す図である。符号化装置100は、ハードウェア構成として、符号化装置100における符号化処理を実行する符号化プログラムなどが格納されているROM52と、ROM52内のプログラムに従って符号化装置100の各部を制御し、バッファリング時間変更処理等を実行するCPU51と、ワークエリアが形成され、符号化装置100の制御に必要な種々のデータを記憶するRAM53と、ネットワークに接続して通信を行う通信I/F57と、各部を接続するバス62とを備えている。
先に述べた符号化装置100における符号化プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フロッピー(R)ディスク(FD)、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。
この場合には、符号化プログラムは、符号化装置100において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、本実施例の符号化プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。
以上、本発明を実施の形態を用いて説明したが、上記実施の形態に多様な変更または改良を加えることができる。
以上のように、本発明にかかる画像符号化装置は、複数の符号化モードによる画像符号化処理に有用であり、特に、適切な符号化モードによる画像符号化処理に適している。
本実施の形態にかかるMPEG符号化装置100の全体構成を示すブロック図である。 イントラ符号化モードにおいて量子化器105が利用する量子化マトリクスを示す図である。 インター符号化モードにおいて量子化器105が利用する量子化マトリクスを示す図である。 MPEGにおけるマクロブロックのビットストリームの典型的な文法構成例を示す図である。 実発生符号量と「Σ(|QDCT|)」との関係を示すグラフを示す図である。 実符号化歪みと「Σ(RES)」との関係を示すグラフを示す図である。 本実施の形態にかかる符号化装置100に特徴的な符号化モード選択処理を示すフローチャートである。 図7において説明した符号化モード設定ステップ(ステップS100)における詳細な処理を示すフローチャートである。 図8において示した符号化コスト算出ステップ(ステップS200,ステップS202)における詳細な処理を示すフローチャートである。 本実施の形態にかかる符号化装置100のハードウェア構成を示す図である。
符号の説明
51 CPU
52 ROM
53 RAM
57 通信I/F
62 バス
100 符号化装置
102 補償器
103 減算器
105 量子化器
106 量子化結果メモリ
107 剰余メモリ
108 コスト計算器
109 モード選択器
110 セレクタ
112 逆量子化器
114 画像保存メモリ
115 減算器
116 セレクタ
117 加算器
118 シーンチェンジ検出器

Claims (4)

  1. 画像を複数のブロックに分割し、当該ブロックを単位として符号化を行う画像符号化装置であって、
    符号化の処理内容の異なる複数の符号化モードに対して予め定められた周波数変換および量子化を、前記ブロックに対して施す処理手段と、
    前記処理手段による量子化結果を用いて、符号化モードにおける予測符号量を算出する予測符号量算出手段と、
    前記処理手段による量子化により得られた剰余から、各符号化モードにおける予測符号化歪み量を算出する予測符号化歪み量算出手段と、
    前記予測符号量算出手段が算出した前記予測符号量と前記予測符号化歪み量算出手段によって算出された前記予測符号化歪み量との線形結合から、各符号化モードにおける符号化コストを算出する符号化コスト算出手段と、
    前記符号化コスト算出手段が各符号化モードに対して算出した前記符号化コストのうち最小となる最小符号化コストを選択する最小符号化コスト選択手段と、
    前記最小符号化コスト選択手段が選択した前記最小符号化コストに対応する前記符号化モードにおいて、前記ブロックを符号化する符号化手段と、
    前記予測符号量算出手段が前記予測符号量を算出するときに利用する符号量予測式を、各符号化モードに対応付けて複数保持する符号量予測式保持手段と、
    前記符号化手段が所定の符号化モードにおいて符号化した場合に実際に発生した実符号量に基づいて、前記符号量予測式保持手段が当該符号化モードに対応付けて保持する前記符号量予測式を修正する符号量予測式修正手段と、を備え、
    前記予測符号量算出手段は、前記符号量予測式保持手段に保持されている前記符号量予測式を利用して前記予測符号量を算出することを特徴とする画像符号化装置。
  2. 処理対象のフレームからシーンチェンジを検出するシーンチェンジ検出手段と、
    前記シーンチェンジ検出手段が前記シーンチェンジを検出した場合に、前記符号量予測式修正手段によって修正された符号量予測式を初期化する初期化手段と
    をさらに備え、
    前記予測符号量算出手段は、前記初期化手段が前記符号量予測式を初期化した場合に、初期化された符号量予測式を利用して前記予測符号量を算出することを特徴とする請求項1に記載の画像符号化装置。
  3. 前記予測符号化歪み量算出手段が前記予測符号化歪み量を算出するときに利用する符号化歪み量予測式を、各符号化モードに対応付けて保持する符号化歪み量予測式保持手段と、
    前記符号化手段が所定の符号化モードにおいて符号化した場合に実際に発生した実符号化歪み量に基づいて、前記符号化歪み量予測式保持手段が当該符号化モードに対応付けて保持する前記符号化歪み量予測式を修正する符号化歪み量予測式修正手段と
    をさらに備え、
    前記予測符号化歪み量算出手段は、前記符号化歪み量予測式保持手段に保持されている前記符号化歪み量予測式を利用して前記予測符号化歪み量を算出することを特徴とする請求項1に記載の画像符号化装置。
  4. 処理対象のフレームからシーンチェンジを検出するシーンチェンジ検出手段と、
    前記シーンチェンジ検出手段が前記シーンチェンジを検出した場合に、前記符号化歪み量予測式修正手段によって修正された符号化歪み量予測式を初期化する初期化手段と
    をさらに備え、
    前記予測符号化歪み算出手段は、前記初期化手段が前記符号化歪み量予測式を初期化した場合に、初期化された符号化歪み量予測式を利用して前記予測符号化歪み量を算出することを特徴とする請求項3に記載の画像符号化装置。
JP2004096763A 2004-03-29 2004-03-29 画像符号化装置 Expired - Fee Related JP4031455B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004096763A JP4031455B2 (ja) 2004-03-29 2004-03-29 画像符号化装置
US11/062,625 US7502517B2 (en) 2004-03-29 2005-02-23 Image coding apparatus including a coded quantity prediction expression retaining unit
US12/234,741 US8184716B2 (en) 2004-03-29 2008-09-22 Image coding apparatus, image coding method and image coding program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004096763A JP4031455B2 (ja) 2004-03-29 2004-03-29 画像符号化装置

Publications (2)

Publication Number Publication Date
JP2005286645A JP2005286645A (ja) 2005-10-13
JP4031455B2 true JP4031455B2 (ja) 2008-01-09

Family

ID=34989786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004096763A Expired - Fee Related JP4031455B2 (ja) 2004-03-29 2004-03-29 画像符号化装置

Country Status (2)

Country Link
US (2) US7502517B2 (ja)
JP (1) JP4031455B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4074868B2 (ja) * 2004-12-22 2008-04-16 株式会社東芝 画像符号化制御方法及びその装置
JP4146444B2 (ja) * 2005-03-16 2008-09-10 株式会社東芝 動画像符号化の方法及び装置
JP4709074B2 (ja) * 2006-06-09 2011-06-22 日本電信電話株式会社 動画像符号化方法,装置,そのプログラムおよびそのプログラムを記録した記録媒体
US8737485B2 (en) * 2007-01-31 2014-05-27 Sony Corporation Video coding mode selection system
JP4901772B2 (ja) * 2007-02-09 2012-03-21 パナソニック株式会社 動画像符号化方法及び動画像符号化装置
US20100278236A1 (en) * 2008-01-17 2010-11-04 Hua Yang Reduced video flicker
US8755515B1 (en) 2008-09-29 2014-06-17 Wai Wu Parallel signal processing system and method
JP5328629B2 (ja) * 2009-12-17 2013-10-30 株式会社メガチップス エンコーダおよび画像変換装置
US8995527B2 (en) * 2010-02-19 2015-03-31 Qualcomm Incorporated Block type signalling in video coding
GB2490092B (en) 2011-02-16 2018-04-11 Skype Processing audio signals
JP5741073B2 (ja) * 2011-03-03 2015-07-01 富士通株式会社 画像符号化装置、画像符号化方法、及び画像符号化プログラム
GB2492329B (en) 2011-06-24 2018-02-28 Skype Video coding
GB2492330B (en) 2011-06-24 2017-10-18 Skype Rate-Distortion Optimization with Encoding Mode Selection
GB2492163B (en) 2011-06-24 2018-05-02 Skype Video coding
GB2493777A (en) 2011-08-19 2013-02-20 Skype Image encoding mode selection based on error propagation distortion map
GB2495467B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495469B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2495468B (en) 2011-09-02 2017-12-13 Skype Video coding
GB2501115B (en) * 2012-04-13 2015-02-18 Canon Kk Methods for segmenting and encoding an image, and corresponding devices
CN105933718B (zh) * 2016-04-25 2019-04-05 北京奇艺世纪科技有限公司 一种编码单元的分割方法和装置
CN110049321B (zh) 2018-01-16 2022-09-06 腾讯科技(深圳)有限公司 视频编码方法、装置、设备及存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5506686A (en) * 1994-11-23 1996-04-09 Motorola, Inc. Method and device for determining bit allocation in a video compression system
US6026232A (en) * 1995-07-13 2000-02-15 Kabushiki Kaisha Toshiba Method and system to replace sections of an encoded video bitstream
JPH0955939A (ja) 1995-08-10 1997-02-25 Graphics Commun Lab:Kk 動画像圧縮方法および装置
JP3598159B2 (ja) 1995-12-11 2004-12-08 ソニー株式会社 情報信号伝送装置および情報信号伝送方法
US5850482A (en) * 1996-04-17 1998-12-15 Mcdonnell Douglas Corporation Error resilient method and apparatus for entropy coding
US6011868A (en) * 1997-04-04 2000-01-04 Hewlett-Packard Company Bitstream quality analyzer
US6249318B1 (en) * 1997-09-12 2001-06-19 8×8, Inc. Video coding/decoding arrangement and method therefor
EP1051853B1 (en) * 1998-01-26 2003-06-18 STMicroelectronics Asia Pacific Pte Ltd. One-pass variable bit rate moving pictures encoding
FR2782879B1 (fr) 1998-08-28 2000-11-03 Thomson Multimedia Sa Procede de compression d'images
US6356668B1 (en) * 1998-12-29 2002-03-12 Eastman Kodak Company Method for efficient rate control
EP1061750A3 (en) * 1999-06-18 2010-05-05 THOMSON multimedia Picture compression process, especially of the MPEG2 type
JP3871840B2 (ja) * 1999-12-24 2007-01-24 日本電気株式会社 圧縮動画像再符号化装置
EP1374429A4 (en) * 2001-03-05 2009-11-11 Intervideo Inc SYSTEMS AND METHOD FOR CODING AND DECODING REDUNDANT MOTION VECTORS IN COMPRESSED VIDEO BITSTRAMS
JP2003230149A (ja) 2002-02-05 2003-08-15 Mitsubishi Electric Corp 高圧縮符号化装置
AU2003280512A1 (en) * 2002-07-01 2004-01-19 E G Technology Inc. Efficient compression and transport of video over a network
US7440502B2 (en) * 2002-11-14 2008-10-21 Georgia Tech Research Corporation Signal processing system
US7194035B2 (en) * 2003-01-08 2007-03-20 Apple Computer, Inc. Method and apparatus for improved coding mode selection
US20040258147A1 (en) * 2003-06-23 2004-12-23 Tsu-Chang Lee Memory and array processor structure for multiple-dimensional signal processing
US9210441B2 (en) * 2003-06-25 2015-12-08 Thomson Licensing Fast mode-decision encoding for interframes
CN1934871B (zh) * 2003-08-25 2011-08-10 新加坡科技研究局 在视频编码中对帧间预测进行模式判定的方法和系统

Also Published As

Publication number Publication date
US7502517B2 (en) 2009-03-10
US20050213657A1 (en) 2005-09-29
US20090041122A1 (en) 2009-02-12
JP2005286645A (ja) 2005-10-13
US8184716B2 (en) 2012-05-22

Similar Documents

Publication Publication Date Title
JP4031455B2 (ja) 画像符号化装置
US7444026B2 (en) Image processing apparatus and method of motion vector detection in a moving picture, and recording medium used therewith
US8213505B2 (en) Encoding apparatus, encoding method, program for encoding method, and recording medium having program for encoding method recorded thereon
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP5173409B2 (ja) 符号化装置および符号化装置を備えた動画像記録システム
US20120106862A1 (en) Image processing device, method, and program
WO2011074197A1 (ja) 画像符号化装置、画像復号化装置、画像符号化方法、及び、画像復号化方法
JP2008507190A (ja) 動き補償方法
US20100020881A1 (en) Motion vector detecting device, motion vector detecting method, image encoding device, and program
JP2001145113A (ja) 画像情報変換装置及び方法
US8358860B2 (en) Motion vector detecting device, motion vector detecting method, image encoding device, and program
US8194740B2 (en) Apparatus and method for compression-encoding moving picture
JP2004241957A (ja) 画像処理装置および符号化装置とそれらの方法
JP2004215275A (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
JP2010183181A (ja) 画像処理装置、およびそれを搭載した撮像装置
US20060146932A1 (en) Method and apparatus for providing motion estimation with weight prediction
JP2009284058A (ja) 動画像符号化装置
WO2017082304A1 (ja) 情報圧縮装置、情報圧縮方法、記録媒体、及び、符号化装置
US20070297517A1 (en) Entropy encoding and decoding apparatuses, and entropy encoding and decoding methods
JP3963296B2 (ja) 動画像の伝送レート変換装置
JP4281667B2 (ja) 画像符号化装置
JP5171675B2 (ja) 画像処理装置、およびそれを搭載した撮像装置
JP2008182408A (ja) 動画像符号化装置及び方法
JP2009194474A (ja) 動画像符号化装置
JP4100067B2 (ja) 画像情報変換方法及び画像情報変換装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070424

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070717

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071018

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101026

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111026

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111026

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121026

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131026

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees