JP2006080925A - 動画符号化装置、動画符号化方法および動画符号化プログラム - Google Patents

動画符号化装置、動画符号化方法および動画符号化プログラム Download PDF

Info

Publication number
JP2006080925A
JP2006080925A JP2004263085A JP2004263085A JP2006080925A JP 2006080925 A JP2006080925 A JP 2006080925A JP 2004263085 A JP2004263085 A JP 2004263085A JP 2004263085 A JP2004263085 A JP 2004263085A JP 2006080925 A JP2006080925 A JP 2006080925A
Authority
JP
Japan
Prior art keywords
encoding
coding
mode
unit
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004263085A
Other languages
English (en)
Inventor
Akiyuki Tanizawa
昭行 谷沢
Wataru Asano
渉 浅野
Shinichiro Koto
晋一郎 古藤
Takeshi Nakajo
健 中條
Naomi Takeda
奈穂美 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004263085A priority Critical patent/JP2006080925A/ja
Priority to US11/176,755 priority patent/US20060050786A1/en
Publication of JP2006080925A publication Critical patent/JP2006080925A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】インタレース方式の動画像を符号化する場合において、符号化処理の負担を軽減しつつ、動画像に応じた適切な符号化モードを選択することができ、符号化効率の高い符号化を実現すること。
【解決手段】予測誤差信号に基づいて符号化処理に要する処理量を示す第1の符号化コストを符号化モードごとに求め、求めた第1の符号化コストに基づいて候補となる符号化モードを選択し、予測誤差信号に対して選択された符号化モードごとに符号化処理の一部の処理を施し、符号化モードごとの発生符号量を算出し、算出された発生符号量に基づいて第2の符号化コストを求め、求めた第2の符号化コストに基づいて符号化モードの候補の中から符号化モードを決定し、第2の符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する。
【選択図】 図5

Description

本発明は、入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置、動画符号化方法および動画符号化プログラムに関する。
動画符号化処理の技術として、複数の予測モードや複数のブロック形状を有する予測符号化を利用した、ITU−T Rec.H.264及びISO/IEC 14496−10(以下、「H.264」という)という国際標準が定められている。
このH.264で定められた動画符号化技術では、プログレッシブ画像及びインターレース画像などの入力画像の特性に応じてフレーム構造、フィールド構造、MBAFF構造、PICAFF構造、PIC/MBAFF構造などの符号化構造を規定し、符号化効率を向上させている。
MBAFF構造は、マクロブロックの対毎にフレームマクロブロック対とフィールドマクロブロック対を適応的に選択することができる符号化構造である。PICAFF構造は、ピクチャ毎にフレームピクチャとフィールドピクチャを適応的に切り替えることができる符号化構造である。PIC/MBAFF構造は、MBAFF構造とPICAFF構造を適応的に切り替えることができる符号化構造である。インターレース方式の動画像に対しては、これらの符号化構造を用いることで符号化効率を向上させることができる。
H.264では、複数のブロック形状及び複数の予測信号生成方式を用意しており、これら各ブロック形状及び各予測信号生成方式の組み合わせで定義される符号化モードの中から、画素ブロック毎に単一の符号化モードを選択し、選択した符号化モードで定義されたブロック形状および予測信号生成方式の符号化する方式が採用されている。
これらの動画像符号化方式では、符号化の際に、符号化効率の最もよい符号化モードを選択することが好ましく、この選択いかんによって再生される画像の品質が左右される。すなわち、符号化モードの最適な選択がなされなかった場合には、最適な選択がなされた場合と比較して、動画像を同一ビットレートで符号化した際の画質が悪化したり、また、同一の画質で再生するために必要な符号量が増加したりすることになる。したがって、画素ブロック毎に符号化モードの適切な選択を行うことが重要な課題となっており、従来技術として、このような符号化モードの選択に関する技術が開示されている。
すなわち、予測誤差が最小の符号化モードを選択する第1の従来技術(特許文献1参照)、予測誤差信号などから発生符号量を推定して、推定された発生符号量が最小となる符号化モードを選択する第2の従来技術(特許文献2参照)、各符号化モードについて、それぞれ実際に符号化処理を実行し、符号量が最小の符号化モードを選択する第3の従来技術(特許文献1、特許文献3参照)、各符号化モードごとに、実際に符号化処理を実行して符号量を算出すると共に、復号化された画像と原画像との誤差である符号化歪みを算出し、発生符号量と符号化歪みとに基づいて最適な符号化モードを選択する第4の従来技術(非特許文献1参照)が存在している。
また、入力画像の1フィールド間差分値と2フィールド間差分値とを求めて、1フィールド間差分値の方が小さいときはフレーム構造を選択し、2フィールド間差分値の方が小さい場合はフィールド構造を選択する第5の従来技術も知られている(特許文献4参照)。
特開2003−153280公報 特開平10−290464号公報 特開平9−322176号公報 特開2000−102017公報 Thomas Wiegand and Berand Girod,"Multi-frame motion compensated prediction for video transmission",Kluwer Academic Publishers 2001
しかしながら、第1の従来技術および第2の従来技術では、推測や予測に基づいて符号化モードを選択しているので、推測や予測が外れ、実際に符号化処理を実行しても選択された符号化モードが適切でない場合もあり、符号化効率が実際には低くなり、動画像の符号化の圧縮効率が低下する場合がある。
これに対し、第3の従来技術や第4の従来技術では、実際に符号化処理を実行して得られる符号量に基づいて符号化モードの選択を行っているので、符号化効率が高い符号化を行うことが可能となる。
しかしながら、第3の従来技術や第4の従来技術では、選択可能な符号化モード毎に、実際に符号化処理を実行するため、符号化効率が改善する反面、多数の符号化モードが存在する場合には、符号化に必要な演算量やハードウェア規模が過大となるという問題があり、その結果、エンコーダの生産コストが高くなってしまう。
また、第1〜4の従来技術は、いずれもマクロブロック内での符号化モードの選択に関するものであり、インターレース方式の動画像における符号化構造の選択(マクロブロック対におけるフレームフィールド判定)に適応した符号化モード選択を行うものではない。
一方、第5の従来技術では、インターレース方式の符号化構造の選択に関するものであるが、入力画像内の差分値を基準にしているため、フレーム間符号化ピクチャ、或いはフレーム間符号化スライスでフレーム間符号化が選択されたときに、符号化効率が著しく低下し動画像の圧縮効率が低下するという問題がある。
本発明は、上記に鑑みてなされたものであって、インタレース方式の動画像を符号化する場合において、符号化処理の負担を軽減しつつ、動画像に応じた適切な符号化モードを選択することができ、符号化効率の高い符号化を実現することができる動画符号化装置、動画符号化方法および動画符号化プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置であって、入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測信号生成手段と、前記予測信号生成手段によって生成された予測誤差信号に基づいて符号化処理に要する処理量を示す第1の符号化コストを前記符号化モードごとに求め、求めた前記第1の符号化コストに基づいて候補となる前記符号化モードを選択する候補モード選択手段と、前記予測信号生成手段によって生成された前記予測誤差信号に対して前記候補モード選択手段によって選択された前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手段と、前記仮符号化手段によって算出された前記発生符号量に基づいて第2の符号化コストを求め、求めた前記第2の符号化コストに基づいて前記符号化モードの候補の中から符号化モードを決定する符号化モード制御手段と、前記符号化モード制御手段により求めた前記第2の符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手段と、前記予測信号生成手段によって生成された前記予測誤差信号に対して、前記符号化構造判定手段によって決定された符号化構造で、前記符号化モード制御手段によって決定された前記符号化モードによる符号化処理を施す符号化処理手段と、を備えたことを特徴とする。
また、本発明は、入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置であって、入力された動画像から得られる入力画像の画像タイプに基づいて符号化処理を行う一または複数の符号化モードを選択する適応モード選択手段と、前記入力画像と参照画像から前記適応モード選択手段によって選択された符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手段と、前記予測手段によって生成された予測誤差信号に対して前記適応モード選択手段によって選択された前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手段と、前記仮符号化手段によって算出された前記発生符号量に基づいて符号化コストを求め、求めた前記符号化コストに基づいて前記適応モード選択手段によって選択された前記符号化モードの中から符号化モードを決定する符号化モード制御手段と、前記符号化モード制御手段により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手段と、前記予測手段によって生成された前記予測誤差信号に対して、前記符号化構造判定手段によって決定された符号化構造で、前記符号化モード制御手段によって決定された前記符号化モードによる符号化処理を施す符号化処理手段と、を備えたことを特徴とする。
また、本発明は、入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置であって、入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手段と、前記予測手段によって生成された予測誤差信号に基づいて符号化処理に要する処理量を示す符号化コストを前記符号化モードごとに求める符号化コスト算出手段と、前記符号化コスト算出手段によって求めた前記符号化コストに基づいて前記符号化モードを決定する符号化モード制御手段と、前記符号化モード制御手段により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手段と、前記予測手段によって生成された前記予測誤差信号に対して、前記符号化構造判定手段によって決定された符号化構造で、前記符号化モード制御手段によって決定された前記符号化モードによる符号化処理を施す符号化処理手段と、を備えたことを特徴とする。
また、本発明は、入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置であって、入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手段と、前記予測手段によって生成された前記予測誤差信号に対して前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手段と、前記仮符号化手段によって算出された前記発生符号量に基づいて符号化コストを求め、求めた前記第2の符号化コストに基づいて前記符号化モードを決定する符号化モード制御手段と、前記符号化モード制御手段により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手段と、前記予測手段によって生成された前記予測誤差信号に対して、前記符号化構造判定手段によって決定された符号化構造で、前記符号化モード制御手段によって決定された前記符号化モードによる符号化処理を施す符号化処理手段と、を備えたことを特徴とする。
また、本発明は、上記動画符号化装置に対応した動画符号化方法および動画符号化プログラムである。
本発明によれば、予測誤差信号に基づいて符号化処理に要する処理量を示す第1の符号化コストを符号化モードごとに求め、求めた第1の符号化コストに基づいて候補となる符号化モードを選択し、予測誤差信号に対して選択された符号化モードごとに符号化処理の一部の処理を施し、符号化モードごとの発生符号量を算出し、算出された発生符号量に基づいて第2の符号化コストを求め、求めた第2の符号化コストに基づいて符号化モードの候補の中から符号化モードを決定し、第2の符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定することで、インタレース方式の動画像を符号化する場合において、適切かつ正確に符号化効率の高い符号化を行うことができる符号化モードを選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、符号化処理の負担の増大を防止することができるいう効果を奏する。
また、本発明によれば、入力された動画像から得られる入力画像の画像タイプに基づいて符号化処理を行う一または複数の符号化モードを選択し、選択された符号化モードごとの予測信号に符号化処理の一部の処理を施し、符号化モードごとの発生符号量を算出し、算出された発生符号量に基づいて符号化コストを求め、求めた符号化コストに基づいて選択された符号化モードの中から符号化モードを決定し、符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定することで、インタレース方式の動画像を符号化する場合において、画像タイプに応じてより適切かつ正確に符号化効率の高い符号化を行うことができる符号化モードを選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、符号化処理の負担の増大を防止することができるいう効果を奏する。
また、本発明によれば、予測誤差信号に基づいて符号化処理に要する処理量を示す符号化コストを符号化モードごとに求め、求めた符号化コストに基づいて符号化モードを決定し、符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定することで、インタレース方式の動画像を符号化する場合において、適切かつ正確に符号化効率の高い符号化を行うことができる符号化モードを選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、符号化処理の負担の増大をより防止することができるいう効果を奏する。
また、本発明によれば、予測誤差信号に対して符号化モードごとに符号化処理の一部の処理を施し、前記化モードごとの発生符号量を算出し、算出された発生符号量に基づいて符号化コストを求め、求めた第2の符号化コストに基づいて符号化モードを決定し、求めた符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定することで、インタレース方式の動画像を符号化する場合において、適切かつ正確に符号化効率の高い符号化を行うことができる符号化モードを選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、符号化処理の負担の増大をより防止することができるいう効果を奏する。
以下に添付図面を参照して、この発明にかかる動画符号化装置、動画符号化方法および動画符号化プログラムの最良な実施の形態を詳細に説明する。
(実施の形態1)
実施の形態1にかかる動画符号化装置は、入力されたインタレース方式の画像信号から符号化モードごとに第1の符号化コストを求めて、この第1の符号化コストの小さい方から候補となる符号化モードを選択して、選択した符号化モードで画像信号に基づいた仮符号化を行って第2の符号化コストを求め、第2の符号化コストが最小となる符号化モードを採用してフレーム符号化構造かフィールド符号化構造かを選択して符号化処理を行うものである。
図1は、実施の形態1にかかる動画符号化装置100の機能的構成を示すブロック図である。本実施の形態の動画符号化装置100は、図1に示すように、符号化制御部101と、フレーム第1仮符号化部111と、フレーム第2仮符号化部112と、フィールド第1仮符号化部113と、フィールド第2仮符号化部114と、フレームフィールド判定部120と、第1切替え部121と、フレーム第1符号化部131と、フレーム第2符号化部132と、フィールド第1符号化部133と、フィールド第2符号化部134と、フレームフィールド判定部120と、フレームメモリとを主に備えた構成となっている。
符号化制御部101は、動画像の符号化モードの切替制御を行うものである。符号化モードは、画像の符号化処理の方式を定めたものであり、本実施の形態の動画符号化装置では、H.264の国際標準で定められた方式を採用している。符号化モードの具体的な例については後述する。また、符号化制御部101は、仮符号化を行うか符号化を行うかを判定して符号化フラグを設定する処理を行う。ここで、符号化制御部101は、仮符号化を行う場合には符号化フラグを0に設定し、符号化を行う場合には符号化フラグを1に設定する。具体的には、符号化制御部101は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113およびフィールド第2仮符号化部114に対しては符号化フラグを0に設定し、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133およびフィールド第2符号化部134に対しては符号化フラグを1に設定する。
本実施の形態の動画符号化装置100では、入力される符号化対象となる画像信号は、マクロブロック対に分割され、マクロブロック対ごとにフレーム第1仮符号化部111とフィールド第1仮符号化部113に入力され、フレーム符号化構造による仮符号化処理とフィールド符号化構造による仮符号化処理とが並列に実行される。
フレーム第1仮符号化部111は、入力されたマクロブロック対ごとの画像に対し、インタレース画像を構成するUpperマクロブロックの画像信号についてフレーム符号化構造の下で各符号化モードごとの符号化処理により予測信号および予測誤差信号を生成して第1符号化コストを求めて候補となる符号化モードを選択し、予測誤差信号について仮符号化を行って、符号化の処理量の目安となる値である第2符号化コストを算出し、第2符号化コストが最小となる符号化モードを候補となる符号化モードの中から決定するものである。ここで、仮符号化とは、予測誤差信号に対して直交変換、量子化を行った後、ハフマン符号化等を行うが、符号化データを生成しない処理をいう。
フレーム第2仮符号化部112は、入力されたマクロブロック対ごとの画像に対し、インタレース画像を構成するLowerマクロブロックの画像信号についてフレーム符号化構造の下で各符号化モードごとの符号化処理により予測信号および予測誤差信号を生成して第1符号化コストを求めて候補となる符号化モードを選択し、予測誤差信号について仮符号化を行って上記第2符号化コストを算出し、第2符号化コストが最小となる符号化モードを候補となる符号化モードの中から決定するものである。
フィールド第1仮符号化部113は、入力されたマクロブロック対ごとの画像に対し、インタレース画像を構成するTopマクロブロックの画像信号についてフィールド符号化構造の下で各符号化モードごとの符号化処理により予測信号および予測誤差信号を生成して第1符号化コストを求めて候補となる符号化モードを選択し、予測誤差信号について仮符号化を行って上記第2符号化コストを算出し、第2符号化コストが最小となる符号化モードを候補となる符号化モードの中から決定するものである。
フィールド第2仮符号化部114は、入力されたマクロブロック対ごとの画像に対し、インタレース画像を構成するBottomマクロブロックの画像信号についてフィールド符号化構造の下で各符号化モードごとの符号化処理により予測信号および予測誤差信号を生成して第1符号化コストを求めて候補となる符号化モードを選択し、予測誤差信号について仮符号化を行って上記第2符号化コストを算出し、第2符号化コストが最小となる符号化モードを候補となる符号化モードの中から決定するものである。
フレームフィールド判定部120は、フレーム符号化構造の画像の後述する第2符号化コストとフィールド符号化構造の画像の後述する第2符号化コストを算出して、コストが少ない方の符号化構造を決定するものである。より具体的には、フレームフィールド判定部120は、フレーム符号化構造のUpperマクロブロックの第2符号化コストとLowerマクロブロックの第2符号化コストの合計であるフレーム符号化コストを算出し、フィールド符号化構造のTopマクロブロックの第2符号化コストとBottomマクロブロックの第2符号化コストの合計であるフィールド符号化コストを算出し、フレーム符号化コストとフィールド符号化コストを比較して、符号化コストの小さい符号化構造を採用すると決定する処理を行う。
第1切替え部121は、フレームフィールド判定部120でフレーム符号化構造が決定された場合、第2フレーム仮符号化部112の出力をフレーム第1符号化部131に接続し、フレームフィールド判定部120でフィールド符号化構造が決定された場合、第2フィールド仮符号化部114の出力をフィールド第1符号化部131に接続するように、接続切り替えを行うものである。
フレーム第1符号化部131は、フレーム符号化構造の下、Upperマクロブロックの画像信号に対して決定された符号化モードの符号化処理を施すものである。
フレーム第2符号化部132は、フレーム符号化構造の下、Lowerマクロブロックの画像信号に対して決定された符号化モードの符号化処理を施すものである。
フィールド第1符号化部133は、フィールド符号化構造の下、Topマクロブロックの画像信号に対して決定された符号化モードの符号化処理を施すものである。
フィールド第2符号化部134は、フィールド符号化構造の下、Bottomマクロブロックの画像信号に対して決定された符号化モードの符号化処理を施すものである。
フレームメモリ140は、入力画像信号を符号化した信号から復号化処理を施して生成された参照画像を一時的に保持するものである。
符号化制御部101は、入力される動画像信号に対して符号化を行うか仮符号化を行うかを判断し、後述する第2切り替え部に切り替え指示を行い、また、各種符号化モードの切り替え処理を行うものである。
次に、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134について詳細に説明する。
図2は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134は、図2に示すように、第2切替え部201と、予測信号生成部202と、候補モード選択部203と、直交変換・量子化部204と、第3切替え部205と、符号量算出部206と、符号化モード制御部207と、逆直交変換・逆量子化部208と、予測復号化部209と、符号化処理部210とを主に備えている。
第2切替え部201は、符号化制御部101によって仮符号化処理を行うと判断された場合に、入力されるマクロブロックの画像信号を予測信号生成部202に出力し、符号化制御部101によって符号化処理を行うと判断された場合に、入力されるマクロブロックの画像信号を符号化処理部210に出力する処理を行うものである。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114(以下、「仮符号化部」という。)では、第2切り替え部201は、入力されるマクロブロックの画像信号を予測信号生成部202に出力するようになっている。また、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134(以下、「符号化部」)では、第2切り替え部201は、入力されるマクロブロックの画像信号と、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114で求めた直交変換係数及び予測誤差信号などの符号化情報を符号化処理部210に出力するようになっている。これにより、符号化処理部210により、入力されるマクロブロックの画像信号に対して仮符号化部で決定された符号化モードで符号化処理が行われるようになっている。
符号化制御部101では、予測信号生成部200が行うフレーム内符号化及びフレーム間予測符号化の符号化モードとして、マクロブロックのサイズ、予測信号生成方式等によって異なる複数の符号化モードが予め定められており、符号化モード制御部207によっていずれかの符号化モードが設定される。
予測信号生成部202は、符号化モード制御部207によって順次設定される符号化モードごとに、フレームメモリ140に一時的に保存された参照画像を用いて、符号化モードで定められた符号化処理方式により予測信号の生成を行い、また入力されたマクロブロックの画像信号と生成された予測信号の画素差分である予測誤差信号の生成を行うものである。設定された符号化モードがフレーム間予測符号化に関するモードである場合は、動き補償を行うため、予測信号生成部202は、動きベクトルの検出も併せて行う。
なお、予測信号生成部200では、対象のマクロブロックに対応する全ての符号化モードについて予測信号を生成する他、一部の符号化モードについてのみ予測信号を生成してもよい。
候補モード選択部203は、予測信号生成部202で生成された符号化モードごとの予測信号から符号化モードによる符号化処理量を示す第1符号化コストを算出し、第1符号化コストの小さい方からN個(N:整数)の値に対応する符号化モードを候補となる符号化モードとして選択するものである。
ここで、第1符号化コストは数1式により算出する。
Figure 2006080925
ここで、SADは、予測誤差信号のマクロブロック内画素累積値であり、λは定数である。OHは、現在の符号化モードを選択した場合のモード情報の予め定められた符号量であり、例えば動きベクトルの距離などが該当する。
候補モード選択部203は、以降の仮符号化ループ(直交変換・量子化部204→符号量算出部206→符号化モード制御部207)を通過する処理の数を削減する。すなわち、予測信号生成部202で予測された、マクロブロックの符号化モードが複数存在する場合に、符号量算出部206や直交変換・量子化部204等の処理負担が大きい処理を極力減少させるために、候補モード選択部203で、候補となる符号化モードを全符号化モードから選択している。
また第1符号化コストは、予測誤差信号から算出するため、直交変換・量子化部204や符号量算出部206における処理に比べて、非常に高速に実行することができる。従って、候補モード選択部203で符号化モードの候補を予測誤差信号が小さいモードに絞ることによって、フレーム符号化構造のマクロブロックとフィールド符号化構造のマクロブロックの判定を高速かつ適切に実現することができる。
直交変換・量子化部204は、候補となる符号化モードごとに、予測誤差信号に対して直交変換(例えば、離散コサイン変換、整数変換等)を行い、その変換係数を量子化し、量子化した直交変換係数と符号化モードの情報(あるいは、さらに動きベクトルの情報)を第3切り替え部205と逆直交変換・逆量子化部208に出力するものである。
第3切替え部205は、直交変換・量子化部204から出力された直交変換係数及び符号化モードの情報等を、符号量算出部206への出力と仮符号化部・符号化部外部への出力と符号化処理部210への出力とを切り替えるものである。
すなわち、仮符号化部では、符号化モードがまだ決定していない場合には、第3切り替え部205は、直交変換係数及び符号化モードの情報等を符号量算出部206へ出力するように切り替え、符号化モードが決定した場合には、第3切り替え部205は、直交変換係数及び符号化モードの情報等を仮符号化部・符号化部外部へ出力するように切り替える。また、仮符号化部では、候補モード選択部203によって候補となる符号化モードが1つしか選択されなかった場合(すなわち、N=1の場合)、直交変換係数及び符号化モードの情報等を符号化処理部210へ出力するように切り替える。
符号量算出部206は、第3切り替え部205から入力される直交変換係数や動きベクトルの情報を示す信号に対して一時的に符号化を行って符号化データの出力を行わずに(仮符号化)、発生符号量を計測するものである。ここで、本実施の形態では、ハフマン符号化または算術符号化に基づくエントロピー符号化がなされた場合の符号量を計測し、エントロピー符号化データの出力は行わない。
符号化モード制御部207は、候補モード選択部203における符号化モードを設定する処理を行う。候補モード選択部203では、符号化モード制御207によって設定された符号化モードを受けて予測信号生成部202から出力される予測誤差信号を制御する。
また、符号化モード制御部207は、符号量算出部204から出力される発生符号量から符号化の処理量の目安となる第2符号化コストを求めて、この第2符号化コストが最小となる符号化モードを、符号化処理として採用する符号化モードとして決定する。
より具体的には、符号化モード制御部207は、第3切り替え部205で出力が符号量算出部206に接続されている状態で、実行可能な一または複数の符号化モードの各々を候補モード選択部203に順次設定する。そして、符号化モード制御部207は、符号量算出部206で算出された符号化モードごとの発生符号量から符号化モードごとの第2符号化コストを算出し、最小の第2符号化コストとなる符号化モードを決定する。
すなわち、符号化対象のマクロブロックに対して、候補となる符号化モードの各々で実際に予測符号化及び発生符号量の計測(候補モード選択部203→直交変換・量子化部204→第3切り替え部205→符号量算出部206→符号化モード制御部207の順の処理)を実行し、各符号化モードごと求めた発生符号量に基づく第2符号化コストを比較し、最小値となる符号化モードを選択するようになっている。
逆直交変換・逆量子化部208は、直交変換・量子化部204によって量子化された直交変換係数を逆量子化して直交変換係数を復元する。また、逆直交変換・逆量子化部208は、復元した直交変換係数に対して逆直交変換処理(例えば、逆離散コサイン変換、逆整数変換等)を施し、予測誤差信号等を復元し、復元された予測誤差信号を予測復号化部209に出力する。
予測復号化部209は、予測誤差信号から予測信号を生成して、予測信号から画像を復元して復元した画像を参照画像としてフレームメモリ140に保存するものである。フレームメモリ140に保存された参照画像が、予測信号生成部202による予測信号、予測誤差信号の生成処理で参照される。
符号化処理部210は、仮符号化部で決定された符号化モードで、直交変換・量子化部204で得られた量子化された直交変換係数や符号化情報をエントロピー符号化し、符号化データを外部へ出力するものである。
次に、本実施の形態の動画符号化装置100において使用する符号化モードについて説明する。符号化モードは、国際標準であるH.264で定められているものであり、符号方式、マクロブロックサイズ、予測モード等の組み合わせで定められる。H.264では、符号方式としてフレーム内符号化(イントラ符号化)とフレーム間予測符号化(インター符号化)がある。そして、フレーム内符号化では、4×4、16×16のマクロブロックサイズが利用可能であり、4×4のサイズでは予測方向として9種類の予測モード、16×16のサイズでは予測方向が4種類の予測モードが存在する。
また、フレーム間予測符号化で使用可能なマクロブロックサイズは、16×16、16×8、8×16、8×8、8×4、4×8、4×4の7種類であり、各サイズのマクロブロックに対して、参照画像を1〜4フレーム前の画像を使用することができるようになっている。なお、本実施の形態では、1フレーム前のフレームを参照画像とする参照方式から4フレーム前のフレームを参照画像とする参照方式を予測モード0、1フレーム前のフレームを参照画像とする方式をそれぞれ予測モード0〜3とするが、かかる例に限定されるものではない。
符号化モードは、このような各符号化方式、各マクロブロックサイズ、各予測モードの組み合わせで定められる。図3は、符号化モードの例を示す説明図である。図3に示すように、符号化モードは、各符号化方式、各マクロブロックサイズ、各予測モードの組み合わせで定められ、各モードに対応してモード番号が対応付けられている。ここで、図3の例では単に予測モードとして示してあるが、H.264の国際標準の場合、フレーム内符号化の予測方式に対しては、予測モードとして上述した予測方向、フレーム内符号化の予測方式に対しては、予測モードとして上述した参照画像の参照方式が採用されることになる。なお、図3に示した符号化モードは一例を示したものであり、他の予測モードとして予測方式、参照方式の他のモードを追加、変更することが可能である。
次に、以上のように構成された本実施の形態にかかる動画符号化装置における動画符号化処理について説明する。図4は、動画符号化の全体処理の手順を示すフローチャートである。
本実施の形態の動画符号化装置100には、1フレームごとに動画像信号が入力されると(ステップS401)、入力された1フレームの画像信号はマクロブロックに分割され、インタレース画像を形成するマクロブロックの対毎に符号化処理が開始される(ステップS402)。このとき、マクロブロックの画像信号は、フレーム第1仮符号化部111とフィールド第1仮符号化部113に入力され、フレーム第1仮符号化部111とフレーム第2仮符号株112によるフレーム符号化構造の下での仮符号化処理と、フィールド第1仮符号化部113とフィールド第2仮符号株114によるフィールド符号構造の下での仮符号化処理が並列で実行される。
まず、フレーム第1仮符号化部111によって、入力されたマクロブロックの対のうちフレーム符号化構造でUpperマクロブロックに対する仮符号化処理が行われ(ステップS403)、次いで、フレーム第2仮符号化部112によって入力されたマクロブロックの対のうちフレーム符号化構造でLowerマクロブロックに対する仮符号化処理が行われる(ステップS404)。
ここで、フレーム第1仮符号化部111による仮符号化によりUpperマクロブロックに対する第2符号化コストが求められ、フレーム第2仮符号化部112による仮符号化によりLowerマクロブロックに対する第2符号化コストが求められる。フレーム第1仮符号化部111およびフレーム第2仮符号化部112における処理については後述する。
そして、フレームフィールド判定部120で、Upperマクロブロックに対する第2符号化コストとLowerマクロブロックに対する第2符号化コストを集計して(ステップS405)、集計したコストをフレーム符号化コストとする。
ステップS403〜S405の処理と並行して、フィールド第1仮符号化部113によって、入力されたマクロブロックの対のうちフィールド符号化構造でTopマクロブロックに対する仮符号化処理が行われ(ステップS406)、次いで、フィールド第2仮符号化部114によって入力されたマクロブロックの対のうちフィールド符号化構造でBottomマクロブロックに対する仮符号化処理が行われる(ステップS407)。
ここで、フィールド第1仮符号化部113による仮符号化によりTopマクロブロックに対する第2符号化コストが求められ、フィールド第2仮符号化部114による仮符号化によりBottomマクロブロックに対する第2符号化コストが求められる。フィールド第1仮符号化部113およびフィールド第2仮符号化部114における処理については後述する。
そして、フレームフィールド判定部120で、Topマクロブロックに対する第2符号化コストとBottonマクロブロックに対する第2符号化コストを集計して(ステップS408)、集計したコストをフィールド符号化コストとする。
次に、フレームフィールド判定部120は、フレーム符号化コストとフィールド符号化コストとを比較し、フィールド符号化コストがフレーム符号化コストより小さいか否かを判断する(ステップS409)。
そして、フィールド符号化コストがフレーム符号化コストより小さい場合には(ステップS409:Yes)、フレームフィールド判定部120は、符号化構造をフィールド符号化構造に決定し、第1切替え部121は出力端をフィールド第1符号化部133に切り替える。そして、フィールド第1符号化部133によって、インタレース画像を形成するマクロブロックの対のうちTopマクロブロックをフィールド符号化構造で符号化し(ステップS410)、次いで、フィールド第2符号化部134によって、Bottomマクロブロックをフィールド符号化構造で符号化し(ステップS411)、符号化データを出力する。
一方、ステップS409において、フレーム符号化コストがフィールド符号化コスト以上である場合には(ステップS409:No)、フレームフィールド判定部120は、符号化構造をフレーム符号化構造に決定し、第1切替え部121は出力端をフレーム第1符号化部131に切り替える。そして、フレーム第1符号化部131によって、インタレース画像を形成するマクロブロックの対のうちUpperマクロブロックをフレーム符号化構造で符号化し(ステップS412)、次いで、フレーム第2符号化部132によって、Lowerマクロブロックをフレーム符号化構造で符号化し(ステップS413)、符号化データを出力する。
このようなステップS403からS413までのマクロブロックに対する処理を、1フレームの全てのマクロブロックに対して実行し(ステップS414)、ステップS401からS414までの1フレームに対する処理を、全フレームに対して実行する(ステップS415)。
次に、ステップS403、S404、S406,S407における仮符号化処理およびステップS410、S410、S412、S413における符号化処理について詳細に説明する。図5は、仮符号化処理および符号化処理の手順を示すフローチャートである。
マクロブロックごとに動画像信号が入力されると、入力された画像はマクロブロック毎に符号化が開始される。まず、第2切り替え部201は、符号化制御部101で設定された符号化フラグの値が0か否かを参照することにより、仮符号化か否かを判断する(ステップS501)。
ここでは、まず、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114についての処理について説明する。フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114に画像信号が入力される場合には、仮符号化を行うため符号化フラグは0に設定されているので(ステップS501:Yes)、第2切り替え部201は、出力端を予測信号生成部102に切り替えて、入力されたマクロブロックの画像信号を予測信号生成部102に出力する。
予測信号生成部102では、入力されたマクロブロックの画像信号から当該マクロブロックに対して処理可能な全ての符号化モードにより符号化処理方式に従い予測信号を生成し、この予測信号と入力画像信号の画素差分である予測誤差信号を求める(ステップS502)。ここで、予測信号と予測誤差信号は、入力されたマクロブロックに対して処理可能な全ての符号化モードごとに生成される。
次に、候補モード選択部203は、予測信号生成部202によって生成された予測誤差信号から、入力されたマクロブロックに対して処理可能な全ての符号化モードごとに数1式を用いて第1符号化コストを算出する(ステップS503)。そして、候補モード選択部203は、算出された符号化モードごとの第1符号化コストの中から小さい値の順にN個の符号化モードを候補となる符号化モードとして選択する(ステップS504)。
次に、符号化モード制御部207は、符号化モードの番号を示すindexを、候補モード選択部203で選択された符号化モードの中で、第1符号化コストが最小の符号化モードのモード番号を設定することにより初期化し、更に最小コストを予め定められた任意の値である最大値で初期化する(ステップ505)。
次に、符号化モード制御207は、第3切り替え部205の出力が符号量算出206に接続される状態で、indexの値で示されるモード番号の符号化モードを符号化制御部101に設定する(ステップS506)。これにより、indexの値で示されるモード番号の符号化モードに対応する直交変換および量子化処理が直交変換・量子化部204によって行われる(ステップS507)。具体的には、直交変換・量子化部204によって予測誤差信号を直交変換して直交変換係数を量子化する。
一方、かかる処理を行う際に、予測誤差信号の量子化された直交変換係数は、逆直交変換・逆量子化部208に入力されて、逆量子化・逆直交変換が施されて予測誤差信号を再生し、予測復号化部209によりローカルデコード画像が生成され、フレームメモリ140に参照画像として一時的に保存される。かかる参照画像の生成は、候補となる符号化モードに対してのみ行われる。
そして、符号量算出部206によって、量子化された直交変換係数や動きベクトルの情報に対してハフマン符号化または算術符号化に基づくエントロピー符号化がなされた場合の発生符号量を算出する(ステップS508)。ただし、エントロピー符号化データの出力は行わない。
次に、符号化モード制御部207は、算出された発生符号量から第2符号化コストを求める(ステップS509)。本実施の形態において、第2符号化コストは、発生符号量そのものとしているが、これに限られるものではない。
そして、符号化モード制御部207は、算出された第2符号化コストが最小コストより小さいか否かを判断する(ステップS510)。そして、第2符号化コストが最小コストより小さい場合には(ステップS510:Yes)、符号化モード制御部207は、現在の第2符号化コストに対応する符号化モードを最適な符号化モードとして決定する(ステップS511)。そして、現在の第2符号化コストで最小コストを更新し、仮符号化の結果、すなわちindexで示されるモード番号に対応した符号化モードの符号化処理によって生成された符号化データをフレームメモリ140に保持しておく(ステップS512)。
次に、符号化モード制御部207は、候補となるN個の符号化モードに対して処理が終了したか否かを判断する(ステップS513)。そして、まだN個の符号化モードに対して処理が終了していない場合には(ステップS513:No)、候補として選択された符号化モードの中で、次に第1符号化コストの値が小さい符号化モードのモード番号でindexを更新し(ステップS516)、ステップS506からS512までの処理を繰り返し実行する。これにより、第2符号化コストが最小である符号化モードが決定されることになる。
一方、ステップS513において、候補となるN個の符号化モードに対して処理が終了している場合には(ステップS513:Yes)、第3切替え部205は符号化フラグが1か否かを調べることにより、符号化か否かを判断する(ステップS514)。そして、符号化フラグが1である場合(符号化の場合)には(ステップS514:Yes)、第3切替え部205は、出力端を符号化処理部210に接続するように切替え、符号化モード制御部207で決定された最適の符号化モードで符号化処理を行う(ステップS515)。これにより、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134のいずれかにより符号化処理がおこなわれる。
一方、ステップS514で、符号化フラグが0の場合には、第3切替え部205は、出力端を外部に接続するように切替え、処理を終了する。これにより、最適な符号かモードの第2符号化コストがフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114のいずれかに出力される。
ステップS501に戻り、符号化フラグが1の場合には(ステップS501:No)、ステップS502からS513までの第2符号化コストを求める処理を行わない。フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134では、符号化を行うため符号化フラグは1に設定されているので、ステップS501における判断では、Noに進むことになる。
このように本実施の形態にかかる動画符号化装置では、インタレース方式の動画像を符号化する場合において、複数の選択可能な符号化モードのそれぞれについて、入力された画像信号の予測誤差信号から求めた第1の符号化コストの少ない値を有する符号化モードを候補となる符号化モードと選択してモード数を削減し、選択された符号化モードに対して仮符号化処理を行って、符号化モードごとの符号化データの符号量から求めた第2符号化コストの最小の符号化モードを符号化処理を行う符号化モードとして決定しているので、適切かつ正確に符号化効率の高い符号化を行うことができ符号化モードを選択することができる。このため、マクロブロックの内容等に応じて好適な符号化モードの選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、実際に仮符号化処理を行う符号化モードの数を削減しているため、演算量を大幅に削減でき、符号化処理の負担の増大を防止することができる。
(実施の形態2)
実施の形態1にかかる動画符号化装置100では、符号化モード制御部で発生符号量そのものの値を第2符号化コストとし、第2符号化コストが最小となる符号化モードを符号化処理として使用する符号化モードと決定したが、この実施の形態2にかかる動画符号化装置100は、発生符号量と符号化歪みから第2符号化コストを求めて符号化モードを決定するものである。
本実施の形態にかかる動画符号化装置100の機能的構成は図1に示した実施の形態1の動画符号化装置と同様である。図6は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134は、図6に示すように、第2切替え部201と、予測信号生成部202と、候補モード選択部203と、直交変換・量子化部204と、第3切替え部205と、符号量算出部206と、符号化歪み計測部608と、符号化モード制御部607と、逆直交変換・逆量子化部208と、予測復号化部209と、符号化処理部210とを主に備えている。
ここで、第2切替え部201、予測信号生成部202、候補モード選択部203、直交変換・量子化部204、第3切替え部205、符号量算出部206、逆直交変換・逆量子化部208、予測復号化部209および符号化処理部210の機能および構成は実施の形態1と同様である。また、本実施の形態の動画符号化装置100において使用する符号化モードは、実施の形態1と同様である。
符号化歪み計測部608は、逆直交変換・逆量子化部208及び予測復号化部209により生成されフレームメモリ140に一時的に保存されている参照画像と符号化対象の入力画像(符号化前の原画像)の画像差分である符号化歪み(例えば、二乗誤差)を測定するものである。ここで、符号化歪みは、符号化モード制御部607によって設定される各符号化モードごとに算出される。すなわち、符号化モードごとに当該モードで処理され符号化された画像を復元した画像と入力画像との差分を表す符号化歪みが計測される。
符号化モード制御部607は、第3切り替え部205の出力端が符号量算出部206に接続されている状態において、実行可能な符号化モードのそれぞれを候補モード選択部203に順次設定し、符号化の処理量の目安となる第2符号化コストを求めて符号化処理として実行する符号化モードを決定するものである。具体的には、符号化モード制御部607は、各符号化モードで処理がなされた場合に符号量算出部206で算出された符号化モードごとの発生符号量と符号化歪み計測部608で算出された符号化モードごとの符号化歪みとを数値化して、数2式により両者を加算して第2符号化コストを求め、この第2符号化コストが最小値となる符号化モードを決定する。
Figure 2006080925
ここで、Dは符号化歪み、Rは発生符号量、λは定数である。
なお、本実施の形態では、第2符号化コストを発生符号量と符号化歪みとを加算した値としているが、発生符号量と符号化歪みに基づいた値であればこれに限られるものではなく、また、発生符号量と符号化歪みコストの数値化にあたって、発生符号量を重視するようにしてもよいし、符号化歪みを重視するようにしてもよいし、ユーザがいずれを重視するかを決定できるようにしてもよい。
次に、以上のように構成された本実施の形態にかかる動画符号化装置100における動画符号化処理について説明する。動画符号化の全体処理については実施の形態1と同様の手順(図4)で行われる。
かかる動画符号化の全体処理(図4)におけるステップS403、S404、S406、S407における仮符号化処理およびステップS410、S410、S412、S413における符号化処理について詳細に説明する。図7は、仮符号化処理および符号化処理の手順を示すフローチャートである。
マクロブロックごとに動画像信号が入力されると、入力された画像はマクロブロック毎に符号化が開始される。まず、第2切り替え部201は、符号化制御部101で設定された符号化フラグの値が0か否かを参照することにより、仮符号化か否かを判断する(ステップS701)。
ここでは、まず、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114についての処理について説明する。フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114に画像信号が入力される場合には、仮符号化を行うため符号化フラグは0に設定されているので(ステップS701:Yes)、第2切り替え部201は、出力端を予測信号生成部102に切り替えて、入力されたマクロブロックの画像信号を予測信号生成部102に出力する。
予測信号および予測誤差信号の生成から符号量算出までの処理(ステップS702〜S708)については実施の形態1の動画符号化装置100における処理(ステップS502〜S508)と同様に行われる。
ステップS707において直交変換・量子化部204によって予測誤差信号を直交変換して直交変換係数を量子化し、ステップS708において符号量算出部206によって、量子化された直交変換係数や動きベクトルの情報に対してハフマン符号化または算術符号化に基づくエントロピー符号化がなされた場合の発生符号量を算出する処理を行う際に、予測誤差信号の量子化された直交変換係数は、逆直交変換・逆量子化部208に入力されて、逆量子化・逆直交変換が施されて予測誤差信号を再生し、予測復号化部209により復号化画像であるローカルデコード画像が生成され、フレームメモリ140に参照画像として一時的に保存される(ステップS709)。かかる参照画像の生成は、候補となる符号化モードに対してのみ行われる。
次に、符号化歪み計測部608は、フレームメモリ140の参照画像と符号化対象の入力画像(符号化前の原画像)の画像差分である符号化歪みを測定する(ステップS710)。
次に、符号化モード制御部607は、ステップS708で算出された発生符号量とS709で測定された符号化歪みから数2式を使用して第2符号化コストを求める(ステップS711)。
そして、符号化モード制御部607は、算出された第2符号化コストが最小コストより小さいか否かを判断する(ステップS712)。そして、第2符号化コストが最小コストより小さい場合には(ステップS712:Yes)、符号化モード制御部607は、現在の第2符号化コストに対応する符号化モードを最適な符号化モードとして決定する(ステップS713)。そして、現在の第2符号化コストで最小コストを更新し、仮符号化の結果、すなわちindexで示されるモード番号に対応した符号化モードの符号化処理によって生成された符号化データをフレームメモリ140に保持しておく(ステップS714)。
以降は、実施の形態1と同様に、候補となるN個の符号化モードに対して上記ステップS706からS714までの処理を繰り返し実行することにより(ステップS715)、第2符号化コストが最小である符号化モードが決定されることになる。
候補となるN個の符号化モードに対して上記処理を実行して第2符号化コストが最小である符号化モードが決定されると、実施の形態1と同様に、第3切替え部205は符号化フラグが1か否かを調べることにより、符号化か否かを判断する(ステップS716)。そして、符号化フラグが1である場合(符号化の場合)には(ステップS716:Yes)、第3切替え部205は、出力端を符号化処理部210に接続するように切替え、符号化モード制御部207で決定された最適の符号化モードで符号化処理を行う(ステップS717)。これにより、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134のいずれかにより符号化処理がおこなわれる。
一方、ステップS716で、符号化フラグが0の場合には、第3切替え部205は、出力端を外部に接続するように切替え、処理を終了する。これにより、最適な符号かモードの第2符号化コストがフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114のいずれかに出力される。
ステップS701に戻り、符号化フラグが1の場合には(ステップS701:No)、ステップS702からS715までの第2符号化コストを求める処理を行わない。フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134では、符号化を行うため符号化フラグは1に設定されているので、ステップS701における判断では、Noに進むことになる。
このように実施の形態2にかかる動画符号化装置では、インタレース方式の動画像を符号化する場合において、複数の選択可能な符号化モードのそれぞれについて、入力された画像信号の予測誤差信号から求めた第1の符号化コストの少ない値を有する符号化モードを候補となる符号化モードと選択してモード数を削減し、選択された符号化モードに対して仮符号化処理を行って、符号化モードごとの符号化データの符号量と符号化歪みから求めた第2符号化コストの最小の符号化モードを符号化処理を行う符号化モードとして決定しているので、より適切かつ正確に符号化効率の高い符号化を行うことができ符号化モードを選択することができる。すなわち、発生符号量だけでなく第2入力画像から求めた予測誤差信号を復号化した参照画像と符号化処理を行う前の入力画像の画像差分である符号化歪みから第2符号化コストを求めて第2符号化コストが最小となる符号化モードに決定しているので、実際の符号化による影響をも符号化コードの決定に考慮することができ、より適切な符号化モードを決定して符号化効率を高くすることが可能となる。このため、マクロブロックの内容等に応じて好適な符号化モードの選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、実際に仮符号化処理を行う符号化モードの数を削減しているため、演算量を大幅に削減でき、符号化処理の負担の増大を防止することができる。
(実施の形態3)
実施の形態2にかかる動画符号化装置100では、入力されたマクロブロックの画像に対して全ての符号化モードの中から第1符号化コストが小さい値の符号化モード2を候補として選択していたが、この実施の形態3にかかる動画符号化装置100は、入力されたマクロブロックの画像に対して予め符号化モードを限定した上で、さらに限定された符号化モードの中から候補となる符号化モードを選択するものである。
本実施の形態にかかる動画符号化装置100の機能的構成は図1に示した実施の形態1の動画符号化装置と同様である。図8は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134は、図8に示すように、第2切替え部201と、モード限定部801と、予測信号生成部202と、候補モード選択部203と、直交変換・量子化部204と、第3切替え部205と、符号量算出部206と、符号化歪み計測部608と、符号化モード制御部807と、逆直交変換・逆量子化部208と、予測復号化部209と、符号化処理部210とを主に備えている。
ここで、予測信号生成部202、候補モード選択部203、直交変換・量子化部204、第3切替え部205、符号量算出部206、逆直交変換・逆量子化部208、予測復号化部209および符号化処理部210の機能および構成は実施の形態1と同様であり、符号化歪み計測部608の機能および構成は実施の形態2と同様である。また、本実施の形態の動画符号化装置100において使用する符号化モードは、実施の形態1と同様である。
モード限定部801は、仮符号化時に選択可能な全ての符号化モードの中から、実際に計算を行う符号化モードを限定するものである。限定する符号化モードは、モード限定情報に予め設定されている。
モード限定情報としては、例えば、入力された画像の画面サイズがSDサイズ以上の場合には、4×4ブロックのフレーム間予測符号化のモード等を限定する。このようなモード限定情報の場合、4×4ブロックのフレーム間予測符号化のモードは使用せず、16×16ブロックフレーム間予測符号化のモード等、4×4ブロックのフレーム間予測符号化以外のモードが使用されることになる。かかるモード限定情報は、仮符号化時に符号化制御部101に保持されている。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド仮第1符号化部113、フィールド仮第2符号化部114(以下、「仮符号化部」)では、第2切り替え部201は、入力されるマクロブロックの画像信号をモード限定部801に出力するようになっている。また、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134(以下、「符号化部」)では、第2切り替え部201は、入力されるマクロブロックの画像信号と、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114で求めた直交変換係数及び予測誤差信号などの符号化情報を符号化処理部210に出力するようになっている。これにより、符号化処理部210により、入力されるマクロブロックの画像信号に対して仮符号化部で決定された符号化モードで符号化処理が行われるようになっている。
符号化モード制御部807は、実施の形態2と同様に、第3切り替え部205の出力端が符号量算出部206に接続されている状態において、実行可能な符号化モードのそれぞれを候補モード選択部203に順次設定し、第2符号化コストを求めて符号化処理として実行する符号化モードを決定するものであるが、本実施の形態ではさらに、仮符号化処理時に、モード限定情報が符号化制御部101により設定されるようになっている。
また、符号化モード制御部807は、モード限定情報で設定された符号化モードについては予測信号を生成せず、仮符号化処理中に第1符号化コストや第2符号化コストは算出されないように制御を行う。すなわち、仮符号化部(フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114)では、第2切り替え部201の出力端は、モード限定部801を経由して予測信号生成部202へ接続されているが、モード限定部801によって限定されていないモードに対してのみ予測信号生成部202により予測信号の生成処理が行われ、第1符号化コスト、第2符号化コストの算出などの処理が実行されるように符号化モード制御部807によって制御される。
一方、符号化部(フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134)では、第2切り替え部201の出力端は、仮符号化時と同様にモード限定部801を経由して予測信号生成部202へと接続される。ここで、仮符号化時に限定されたモードに関しては、予測信号生成部202により予測信号の生成処理が行われ、第1符号化コスト、第2符号化コストの算出などの処理(候補モード選択部203→直交変換・量子化部204→符号量算出部206→符号化歪み測定部608→符号化モード制御部807の処理)が実行されるように符号化モード制御部807によって制御される。
仮符号化部で既に第2符号化コストが計算されている符号化モードに関しては、符号化モード制御部807にモード情報及び第2符号化コストが保持されているので予測信号の生成及び仮符号化処理は行われない。
符号化部による符号化処理時は、マクロブロックで選択可能なすべての仮符号化が行われることになり、符号化モード制御部807に保持されている第2符号化コストの中から最小値を有する符号化モードが決定され、決定された符号化モードで符号化処理が行われる。
仮符号化処理時にモード限定部801で生成されない予測信号は、符号化構造が決定した後に生成されることになるため、マクロブロック内の符号化効率の低下を伴わずに符号化処理を実現することができるようになっている。
次に、以上のように構成された本実施の形態にかかる動画符号化装置100における動画符号化処理について説明する。動画符号化の全体処理については実施の形態1と同様の手順(図4)で行われる。
かかる動画符号化の全体処理(図4)におけるステップS403、S404、S406、S407における仮符号化処理およびステップS410、S410、S412、S413における符号化処理について詳細に説明する。図9は、仮符号化処理および符号化処理の手順を示すフローチャートである。
マクロブロックごとに動画像信号が入力されると、入力された画像はマクロブロック毎に符号化が開始される。まず、第2切り替え部201は、符号化制御部101で設定された符号化フラグの値が0か否かを参照することにより、仮符号化か否かを判断する(ステップS901)。
ここでは、まず、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114についての処理について説明する。フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114に画像信号が入力される場合には、仮符号化を行うため符号化フラグは0に設定されているので(ステップS901:Yes)、第2切り替え部201は、出力端をモード限定部801に切り替えて、入力されたマクロブロックの画像信号をモード限定部801に出力する。
そして、モード限定部801によって符号化モード制御部807に設定されたモード限定情報に従って符号化モードの限定を行う(ステップS902)。例えば、上述のように、モード限定情報が、4×4ブロックのフレーム間予測符号化のモード等である。このようなモード限定情報の場合、4×4ブロックのフレーム間予測符号化のモードである場合には、4×4ブロックのフレーム間予測符号化の符号化モード以外の符号化モード、例えば16×16ブロックフレーム間予測符号化の符号化モード等に処理対象の符号化モードが限定されることになる。
次に、予測信号生成部202によって予測信号および予測誤差信号の生成が行われるが、かかる予測信号および予測誤差信号の生成以降の処理(ステップS903〜S918、S919)については実施の形態1の動画符号化装置100における処理(ステップS72〜S718)と同様に行われる。このため、候補モード選択部203では、モード限定部801によって限定された符号化モードの中から候補となる符号化モードが選択され、符号化モード制御部807によって第2符号化コストの最小値を有する符号化モードが決定されることになる。
このように実施の形態3にかかる動画符号化装置100は、入力されたマクロブロックの画像に対して予め符号化モードを限定した上で、さらに限定された符号化モードの中から候補となる符号化モードを選択し、その中から符号化モードを決定しているので、より適切かつ正確に符号化効率の高い符号化を行うことができ符号化モードを選択することができる。このため、マクロブロックの内容等に応じて好適な符号化モードの選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、実際に仮符号化処理を行う符号化モードの数を削減しているため、演算量を大幅に削減でき、符号化処理の負担の増大を防止することができる。
なお、本実施の形態の動画符号化装置100では、発生符号量と符号化歪みとから第2符号化コストを求めているが、実施の形態1の動画符号化装置のように、発生符号量そのものを第2符号化コストを求めるように構成してもよい。
(実施の形態4)
実施の形態1〜3にかかる動画符号化装置100は、候補モード選択部203によって第1符号化コストを求め、符号化モードの中からこの第1符号化コストの小さい方からから候補となる符号化モードを選択していたが、この実施の形態4にかかる動画符号化装置100は、入力されたマクロブロックの画像信号のスライスの画像タイプに基づいて処理対象の符号化モードに制限を与えるものである。
本実施の形態にかかる動画符号化装置100の機能的構成は図1に示した実施の形態1の動画符号化装置と同様である。図10は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134は、図10に示すように、第2切替え部201と、適応モード選択部1001と、予測部1002と、直交変換・量子化部204と、第3切替え部205と、符号量算出部206と、符号化歪み計測部608と、符号化モード制御部1007と、逆直交変換・逆量子化部208と、予測復号化部209と、符号化処理部210とを主に備えている。
ここで、第2切替え部201、直交変換・量子化部204、第3切替え部205、符号量算出部206、逆直交変換・逆量子化部208、予測復号化部209および符号化処理部210の機能および構成は実施の形態1と同様であり、符号化歪み計測部608の機能および構成は実施の形態2と同様である。また、本実施の形態の動画符号化装置100において使用する符号化モードは、実施の形態1と同様である。
本実施の形態の動画符号化装置100は、予測信号生成部と候補モード選択部の代わりに、適応モード選択部1001と予測部1002が設けられている点が実施の形態1〜3の動画符号化装置と異なっている。
適応モード選択部1001は、入力されたマクロブロックの画像のタイプに応じて符号化モードの選択を行うものである。ここで、画像のタイプは、I−ピクチャ(フレーム内符号化画像)、P−ピクチャ(フレーム間予測符号化画像)、B−ピクチャ(双方向予測符号化画像)である。本実施の形態では、かかる画像のタイプをスライスごとに判断して各タイプに対して符号化効率の高い符号化モードを選択する。
例えば、適応モード選択部1001は、入力された画像信号がI−スライスの場合には、図3に示す各符号化モードの中で、予測方式がフレーム内符号化であり、かつI−スライスの符号化効率の高い各ブロックサイズおよび各予測モードの符号化モードを選択する。例えば、ブロックサイズが16x16であり、さらに予測モードがDC予測モードである符号化モードを選択する。
また、適応モード選択部1001は、入力された画像信号がP−スライスの場合には、各符号化モードの中で予測方式がフレーム間予測符号化であり、かつP−スライスの符号化効率の高い各ブロックサイズおよび各予測モードの符号化モードを選択する。例えば、ブロックサイズが16x16であり、さらに予測モードがL0予測モードである符号化モードを選択する。
さらに、適応モード選択部1001は、入力された画像信号がB−スライスの場合には、各符号化モードの中で予測方式がフレーム間予測符号化であり、かつB−スライスの符号化効率の高い各ブロックサイズおよび各予測モードの符号化モードを選択する。
符号化処理の負担を考慮した場合、フレーム間予測符号化の予測方式ではスキップを選択することにより、予測処理を高速に行うことが可能であるが、符号化性能が低下する。これらの予測モードの選択は処理速度と符号化性能を加味して選択する。本実施の形態では、特定する符号化モードは、マクロブロックのサイズ及び用途を想定してスライスの画像タイプごとに予め定められている。
すなわち、適応モード選択部1001は、スライスの画像タイプに応じて選択する符号化モードを特定することにより、以降の処理負担の多い仮符号化の処理(予測部1002→直交変換・量子化部204→符号量算出部206→符号化歪み計測部608の処理ループ)の回数を削減し、高速なフレーム/フィールド判定を可能にしている。
なお、本実施の形態では、上述のように、スライスの画像タイプごとに選択する符号化モードを選択しているが、フレーム内符号化の予測方式はフレーム間予測符号化の予測方式と比較すると、動きベクトルの探索処理等が行われないため、高速演算することが可能である。このため、I−スライスは、予測方式がフレーム内符号化である符号化モードの中で入力されたマクロブロックのサイズに該当するすべての予測モードを対象とした符号化モードを選択するように構成しても良い。
予測部1002は、符号化モード制御部1007によって順次設定される符号化モードごとに、フレームメモリ140に一時的に保存された参照画像を用いて、符号化モードで定められた符号化処理方式により予測信号の生成を行い、また入力されたマクロブロックの画像信号と生成された予測信号の画素差分である予測誤差信号の生成を行うものである。設定された符号化モードがフレーム間予測符号化に関するモードである場合は、動き補償を行うため、予測信号生成部202は、動きベクトル検出処理も併せて行う。
なお、予測部1002では、対象のマクロブロックに対応する全ての符号化モードについて予測信号を生成する他、一部の符号化モードについてのみ予測信号を生成してもよい。
符号化モード制御部1007は、第3切り替え部205の出力端が符号量算出部206に接続されている状態において(仮符号化処理時)、適応モード選択部1001で選択された符号化モードのそれぞれを予測部1002に順次設定し、符号化コストを求めて符号化処理として実行する符号化モードを決定するものである。なお、符号化コストは、実施の形態2における第2符号化コストと同様に、符号量算出部206で算出された発生符号量と符号化歪み計測部608で計測された符号化歪みとを数2式のように加算したものであり、符号化の処理量の目安となる値である。
なお、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド仮第1符号化部113、フィールド仮第2符号化部114(以下、「仮符号化部」)では、第2切り替え部201は、入力されるマクロブロックの画像信号を適応モード選択部1001に出力するようになっている。また、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134(以下、「符号化部」)では、第2切り替え部201は、入力されるマクロブロックの画像信号と、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114で求めた直交変換係数及び予測誤差信号などの符号化情報を符号化処理部210に出力するようになっている。これにより、符号化処理部210により、入力されるマクロブロックの画像信号に対して仮符号化部で決定された符号化モードで符号化処理が行われるようになっている。
次に、以上のように構成された本実施の形態にかかる動画符号化装置100における動画符号化処理について説明する。動画符号化の全体処理については実施の形態1と同様の手順(図4)で行われる。
かかる動画符号化の全体処理(図4)におけるステップS403、S404、S406、S407における仮符号化処理およびステップS410、S410、S412、S413における符号化処理について詳細に説明する。図11は、仮符号化処理および符号化処理の手順を示すフローチャートである。
マクロブロックごとに動画像信号が入力されると、入力された画像はマクロブロック毎に符号化が開始される。まず、第2切り替え部201は、符号化制御部101で設定された符号化フラグの値が0か否かを参照することにより、仮符号化か否かを判断する(ステップS1101)。
ここでは、まず、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114についての処理について説明する。フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114に画像信号が入力される場合には、仮符号化を行うため符号化フラグは0に設定されているので(ステップS1101:Yes)、第2切り替え部201は、出力端を適応モード選択部1001に切り替えて、入力されたマクロブロックの画像信号を適応モード選択部1001に出力する。
そして、適応モード選択部1001は、入力されたマクロブロックの画像信号の画像タイプを調べ、I−スライスか否かを判断する(ステップS1102)。そして、I−スライスである場合には、適応モード選択部1001は、図3に示す符号化モードの中から予測方式がフレーム内符号化であり、かつI−スライスの符号効率が高い予め定められたブロックサイズおよび予測モード(例えば、ブロックサイズが16x16であり、かつ予測モードがDC予測モード)である符号化モードを特定モードとして選択する(ステップS1103)。
一方、ステップS1102において、入力されたマクロブロックの画像信号の画像タイプがI−スライス以外(P−スライスまたはB−スライス)である場合には、適応モード選択部1001は、図3に示す符号化モードの中から予測方式がフレーム間予測符号化で、かつP−スライスまたはB−スライスの符号効率が高いブロックサイズおよび予測モード(例えば、ブロックサイズが16x16であり、かつ予測モードがP0予測モード)である符号化モードを特定モードとして選択する(ステップS1104)。
そして、変数indexにステップS1103またはS1104で特定モードとして選択された符号化モードの数を設定し、その中で最小のモード番号の符号化モードを処理対象の特定モードとし、最小コストに予め定められた最大値を設定する(ステップS1105)。
次に、予測部1002によって処理対象の特定モードの符号化方式によって予測信号および予測誤差信号の生成が行われる(ステップS1106)。
次に、符号化モード制御部1007は、第3切り替え部205の出力が符号量算出206に接続された状態で、indexの値で示されるモード番号の符号化モードを符号化制御部101に設定し、これにより処理対象の特定モードである符号化モードに対応する直交変換および量子化処理が直交変換・量子化部204によって行われる(ステップS1107)。具体的には、直交変換・量子化部204によって予測誤差信号を直交変換して直交変換係数を量子化する。
そして、符号量算出部206によって、量子化された直交変換係数や動きベクトルの情報に対してハフマン符号化または算術符号化に基づくエントロピー符号化がなされた場合の発生符号量を算出する(ステップS1108)。ただし、エントロピー符号化データの出力は行わない。
ステップS1107において直交変換・量子化部204によって予測誤差信号を直交変換して直交変換係数を量子化し、ステップS1108において符号量算出部206によって、量子化された直交変換係数や動きベクトルの情報に対してハフマン符号化または算術符号化に基づくエントロピー符号化がなされた場合の発生符号量を算出する処理を行う際に、予測誤差信号の量子化された直交変換係数は、逆直交変換・逆量子化部208に入力されて、逆量子化・逆直交変換が施されて予測誤差信号を再生し、予測復号化部209により復号化画像であるローカルデコード画像が生成され、フレームメモリ140に参照画像として一時的に保存される(ステップS1109)。
次に、符号化歪み計測部608は、フレームメモリ140の参照画像と符号化対象の入力画像(符号化前の原画像)の画像差分である符号化歪みを測定する(ステップS1110)。
次に、符号化モード制御部1007は、ステップS1108で算出された発生符号量とS1109で測定された符号化歪みから数2式を使用して符号化コストを求める(ステップS1111)。
そして、符号化モード制御部1007は、算出された符号化コストが最小コストより小さいか否かを判断する(ステップS1112)。そして、符号化コストが最小コストより小さい場合には(ステップS1112:Yes)、符号化モード制御部1007は、現在の符号化コストに対応する特定モードである符号化モードを最適な符号化モードとして決定する(ステップS1113)。そして、現在の符号化コストで最小コストを更新し、仮符号化の結果、すなわち特定モードの符号化処理によって生成された符号化データをフレームメモリ140に保持しておく(ステップS1114)。
次に、符号化モード制御部1007は、特定モードとして選択されたすべての符号化モードに対して処理が終了したか否かを判断する(ステップS1115)。そして、まだすべての特定モードである符号化モードに対して処理が終了していない場合には(ステップS1115:No)、特定モードとして選択された次の符号化モードに対してステップS1106からS1114までの処理を繰り返し実行する。これにより、符号化コストが最小である符号化モードが決定されることになる。
一方、ステップS1115において、特定モードとして選択されたすべての符号化モードに対して処理が終了している場合には(ステップS1115:Yes)、第3切替え部205は符号化フラグが1か否かを調べることにより、符号化か否かを判断する(ステップS1116)。そして、符号化フラグが1である場合(符号化の場合)には(ステップS1116:Yes)、第3切替え部205は、出力端を符号化処理部210に接続するように切替え、符号化モード制御部1007で決定された最適の符号化モードで符号化処理を行う(ステップS1117)。これにより、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134のいずれかにより符号化処理がおこなわれる。
一方、ステップS1116で、符号化フラグが0の場合には、第3切替え部205は、出力端を外部に接続するように切替え、処理を終了する。これにより、最適な符号かモードの符号化コストがフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114のいずれかに出力される。
ステップS1101に戻り、符号化フラグが1の場合には(ステップS1101:No)、ステップS1102からS1115までの符号化コストを求める処理を行わない。フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134では、符号化を行うため符号化フラグは1に設定されているので、ステップS1101における判断では、Noに進むことになる。
このように本実施の形態にかかる動画符号化装置では、インタレース方式の動画像を符号化する場合において、複数の選択可能な符号化モードから入力されたマクロブロックの画像タイプに応じて符号化効率が高い符号化モードを選択してモード数を削減し、選択された符号化モードに対して仮符号化処理を行って、符号化モードごとの符号化データの符号量から求めた符号化コストの最小の符号化モードを符号化処理を行う符号化モードとして決定しているので、より適切かつ正確に符号化効率の高い符号化を行うことができ符号化モードを選択することができる。このため、マクロブロックの内容等に応じて好適な符号化モードの選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、実際に画像タイプに応じて仮符号化処理を行う符号化モードの数を削減しているため、演算量を大幅に削減でき、符号化処理の負担の増大を防止することができる。
さらに特定モードとして仮符号化で計算された符号化データを保持しているため、符号化処理では当該特定モードを仮符号化する必要がない。このため、フィールド/フレーム判定で選択された符号化構造の対応する特定モードに関しては、符号化装置による符号化処理において再計算を行わなくて済み、符号化処理の負担をより減少させることができる。
(実施の形態5)
実施の形態4にかかる動画符号化装置100は、入力されたマクロブロックの画像信号のスライスの画像タイプに基づいて処理対象の符号化モードに制限を与えるものであったが、この実施の形態5にかかる動画符号化装置は、さらにブロック形状(ブロックサイズ)に応じて処理対象の符号化モードに制限を与えるものである。
本実施の形態にかかる動画符号化装置100の機能的構成は図1に示した実施の形態1の動画符号化装置と同様である。図12は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134は、図12に示すように、第2切替え部201と、ブロック形状選択部1201と、適応モード選択部1001と、予測部1002と、直交変換・量子化部204と、第3切替え部205と、符号量算出部206と、符号化歪み計測部608と、符号化モード制御部1207と、逆直交変換・逆量子化部208と、予測復号化部209と、符号化処理部210とを主に備えている。
ここで、第2切替え部201、直交変換・量子化部204、第3切替え部205、適応モード選択部001と、符号量算出部206、符号化歪み計測部608、逆直交変換・逆量子化部208、予測復号化部209および符号化処理部210の機能および構成は実施の形態4と同様である。また、本実施の形態の動画符号化装置100において使用する符号化モードは、実施の形態1と同様である。
本実施の形態の動画符号化装置100は、ブロック形状選択部1201が設けられている点が実施の形態4の動画符号化装置と異なっている。
ブロック形状選択部1201は、仮符号化処理時に、選択可能な全ブロック形状の中から入力された画像信号の画像タイプとブロック選択情報とに基づいて実際に計算を行うブロック形状に対応する符号化モードを選択するものである。
ブロック選択情報は、符号化制御部101内に設定されており、予測方式と当該予測方式で選択可能なブロック形状(ブロックサイズ)を組み合わせた符号化モードを定めたものである。例えば、国際標準H.264に準拠している本実施の形態の動画符号化装置100のメインプロファイルでは、フレーム内符号化の予測方式で可能なブロック形状は16x16画素ブロックと4x4画素ブロックであり、それぞれ16x16画素ブロックで4通り、4x4画素ブロックで9通りの予測モードを選択可能である。また、フレーム間予測符号化の予測方式で可能なブロック形状は、16x16画素ブロック、16x8画素ブロック、8x16画素ブロック、8x8画素ブロック、8x4画素ブロック、4x8画素ブロック、4x4画素ブロックなどであり、ブロック形状と参照画像の予測モードが定められている。従って、ブロック選択情報としては、入力された画像信号の画像タイプがI−スライス(フレーム内符号化画像)の場合には、16x16画素ブロックと4x4画素ブロックのいずれかまたは両方を選択可能として、入力された画像信号の画像タイプがP−スライス(フレーム間予測符号化画像)またはB−スライス(双方向予測符号化画像)の場合には、16x16画素ブロック、16x8画素ブロック、8x16画素ブロック、8x8画素ブロック、8x4画素ブロック、4x8画素ブロック、4x4画素ブロックのいずれかまたはいずれかの組み合わせ若しくはすべてが選択可能として定められている。かかるブロック選択情報は、仮符号化時に、符号化モード制御部1207が符号化制御部101からブロック選択情報を受け取り、ブロック形状選択部1201に設定するようになっている。
適応モード選択部1001は、ブロック形状選択部1201で選択されたブロック形状に対応する符号化モードの中から実施の形態4と同様に符号化効率が高い符号化モードを選択する。このように、ブロック形状選択部1201によって、予めブロック形状に対応した符号化モードを選択し、そのブロック形状に対応した符号化モードの中から選択可能なモードを適応モード選択部215で選択することで、処理負担を考慮して、モード判定で計算するモードを選択することができ、大幅な処理量の削減が可能となる。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド仮第1符号化部113、フィールド仮第2符号化部114(以下、「仮符号化部」)では、第2切り替え部201は、入力されるマクロブロックの画像信号をブロック形状選択部1201に出力するようになっている。また、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134(以下、「符号化部」)では、第2切り替え部201は、入力されるマクロブロックの画像信号と、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114で求めた直交変換係数及び予測誤差信号などの符号化情報を符号化処理部210に出力するようになっている。これにより、符号化処理部210により、入力されるマクロブロックの画像信号に対して仮符号化部で決定された符号化モードで符号化処理が行われるようになっている。
符号化モード制御部1207は、実施の形態4と同様に、第3切り替え部205の出力端が符号量算出部206に接続されている状態において、実行可能な符号化モードのそれぞれを予測部1002に順次設定し、符号化コストを求めて符号化処理として実行する符号化モードを決定するものであるが、本実施の形態ではさらに、仮符号化処理時に、ブロック形状情報が符号化制御部101により設定されるようになっている。
また、符号化モード制御部1207は、ブロック形状選択部で選択されていないブロック形状に対応する符号化モードについては予測信号を生成せず、仮符号化処理中に符号化コストは算出されないように制御を行う。すなわち、仮符号化部(フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114)では、第2切り替え部201の出力端は、ブロック形状選択部1201を経由して予測部1002へ接続されているが、ブロック形状選択部1201によって選択されたブロック形状に対する符号化モードに対してのみ予測部1002により予測信号の生成処理が行われ、符号化コストの算出などの処理が実行されるように符号化モード制御部1207によって制御される。
一方、符号化部(フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134)では、第2切り替え部201の出力端は、仮符号化時と同様にブロック形状選択部1201を経由して予測部1002へと接続される。ここで、仮符号化時にブロック形状選択部1201で選択されていないモードに関しては、予測部1002により予測信号の生成処理が行われ、符号化コストの算出などの処理(予測部1002→直交変換・量子化部204→符号量算出部206→符号化歪み測定部608→符号化モード制御部1207の処理)が実行されるように符号化モード制御部1207によって制御される。
次に、以上のように構成された本実施の形態にかかる動画符号化装置100における動画符号化処理について説明する。動画符号化の全体処理については実施の形態1と同様の手順(図4)で行われる。
かかる動画符号化の全体処理(図4)におけるステップS403、S404、S406、S407における仮符号化処理およびステップS410、S410、S412、S413における符号化処理について詳細に説明する。図13は、仮符号化処理および符号化処理の手順を示すフローチャートである。
マクロブロックごとに動画像信号が入力されると、入力された画像はマクロブロック毎に符号化が開始される。まず、第2切り替え部201は、符号化制御部101で設定された符号化フラグの値が0か否かを参照することにより、仮符号化か否かを判断する(ステップS1301)。
ここでは、まず、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114についての処理について説明する。フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114に画像信号が入力される場合には、仮符号化を行うため符号化フラグは0に設定されているので(ステップS1301:Yes)、第2切り替え部201は、出力端をブロック形状選択部1201に切り替えて、入力されたマクロブロックの画像信号をブロック形状選択部1201に出力する。
次に、ブロック形状選択部1201によって、ブロック選択情報を参照してブロック形状を選択する(ステップS1302)。具体的には、入力された画像信号の画像タイプを調べ、I−スライスの場合には、16x16画素ブロックと4x4画素ブロックのいずれかまたは両方をブロック選択情報に従って選択される。また、入力された画像信号の画像タイプがP−スライスまたはB−スライスの場合には、16x16画素ブロック、16x8画素ブロック、8x16画素ブロック、8x8画素ブロック、8x4画素ブロック、4x8画素ブロック、4x4画素ブロックのいずれかまたはいずれかの組み合わせ若しくはすべてをブロック選択情報に従って選択する。
そして、適応モード選択部1001は、入力されたマクロブロックの画像信号の画像タイプを調べ、I−スライスか否かを判断する(ステップS1303)。そして、I−スライスである場合には、適応モード選択部1001は、図3に示す符号化モードの中から予測方式がフレーム内符号化であり、かつステップS1302で選択されたブロック形状であり、さらにI−スライスの符号効率が高い予め定められた予測モード(例えば、予測モードがDC予測モード)である符号化モードを特定モードとして選択する(ステップS1304)。
一方、ステップS1303において、入力されたマクロブロックの画像信号の画像タイプがI−スライス以外(P−スライスまたはB−スライス)である場合には、適応モード選択部1001は、図3に示す符号化モードの中から予測方式がフレーム間予測符号化で、かつステップS1302で選択されたブロック形状であり、さらにP−スライスまたはB−スライスの符号効率が高い予測モード(例えば、ブロックサイズが16x16であり、かつ予測モードがP0予測モード)である符号化モードを特定モードとして選択する(ステップS1305)。
これ以降の処理は、実施の形態4におけるステップS1105からS1117までの処理と同様に行われる。
このように本実施の形態にかかる動画符号化装置では、インタレース方式の動画像を符号化する場合において、複数の選択可能な符号化モードから入力された画像信号の画像タイプに応じてブロック形状を選択し、符号化モードの中から選択したブロック形状でかつ画像信号のスライスの画像タイプに応じて適応的に符号化モードを選択し、選択した符号化モードに対して仮符号化処理を行って、符号化モードごとの符号化データの符号量から求めた符号化コストの最小の符号化モードを符号化処理を行う符号化モードとして決定しているので、より適切かつ正確に符号化効率の高い符号化を行うことができ符号化モードを選択することができる。このため、マクロブロックの内容等に応じて好適な符号化モードの選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、実際に画像タイプに応じて仮符号化処理を行う符号化モードの数を削減しているため、演算量を大幅に削減でき、符号化処理の負担の増大を防止することができる。
(実施の形態6)
実施の形態4にかかる動画符号化装置100は、入力されたマクロブロックの画像信号のスライスの画像タイプに基づいて処理対象の符号化モードに制限を与えるものであったが、この実施の形態6にかかる動画符号化装置は、フレーム間予測符号化に関する符号化モードが選択された場合に、さらに動き探索精度を選択して選択された動き探索精度に応じた符号化モードを選択するものである。
本実施の形態にかかる動画符号化装置100の機能的構成は図1に示した実施の形態1の動画符号化装置と同様である。図14は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134は、図14に示すように、第2切替え部201と、動き探索精度選択部1401と、適応モード選択部1001と、予測部1002と、直交変換・量子化部204と、第3切替え部205と、符号量算出部206と、符号化歪み計測部608と、符号化モード制御部1407と、逆直交変換・逆量子化部208と、予測復号化部209と、符号化処理部210とを主に備えている。
ここで、第2切替え部201、直交変換・量子化部204、第3切替え部205、適応モード選択部001と、符号量算出部206、符号化歪み計測部608、逆直交変換・逆量子化部208、予測復号化部209および符号化処理部210の機能および構成は実施の形態4と同様である。また、本実施の形態の動画符号化装置100において使用する符号化モードは、実施の形態1と同様である。
本実施の形態の動画符号化装置100は、動き探索精度選択部1401が設けられている点が実施の形態4の動画符号化装置と異なっている。
動き探索精度選択部1401は、適応モード選択部1001によって選択された符号化モードがフレーム間予測符号化の符号化方式で有る場合に、符号化モード制御部1407から動き探索精度情報を受けとり、動き探索精度情報に従って動き探索精度を選択して選択された動き探索精度の予測モードを有する符号化モードを選択して予測部1002の動き探索処理を制御するものである。
すなわち、予測部1002では、フレーム内符号化およびフレーム間予測符号化の処理の他に、動きベクトル検出処理も行っているが、動きベクトル探索処理では、整数画素位置のベクトル探索の他に、さらにブロックの詳細な動きに対応するため、1/2画素位置のベクトル探索及び1/4画素位置など分数画素位置のベクトル探索を行っている。このような分数画素位置のベクトル探索処理は、符号化効率の向上に有効であるが、画像マッチング処理を行うための探索点が増加するため、処理負荷が過大となる。
このため、動き探索精度選択部1401は、適応モード選択部1001で選択された符号化モードの符号化方式がフレーム間予測符号化である場合には、動き探索精度を選択して選択された動き探索精度の予測モードを有する符号化モードをさらに選択し、予測部1002では、選択された符号化モードの動き探索精度で各マクロブロックに対応する参照画像に基づいて動きベクトル探索を行う。ここで、動き探索精度選択部1401によって選択されなかっら動き探索精度については、仮符号化処理などの計算は行われない。例えば、動き探索精度が整数画素のみの場合、予測部1002による予測信号生成処理では、整数精度の動き探索のみ行えば良く、これにより大幅な処理負担を軽減することができる。
動き探索精度情報は、画像サイズと整数画素位置、1/2画素位置、1/4画素位置などの動き探索精度とを予め対応づけたものであり、本実施の形態では、画像サイズが大きくなるほど、動き探索精度を粗くなるように対応付けている。これは、画像サイズが大きくなるにつれて、マクロブロック内の輝度変化量は緩やかになる傾向があり、相対的に動き探索精度は大きくしても符号化効率は低下しないからである。なお、本実施の形態では、画像サイズに応じて動き探索精度を定めているが、画像サイズに関係なく他の条件により動き探索精度が選択されるように動き探索精度情報を構成してもよい。
符号化モード制御部1407は、実施の形態4と同様に、第3切り替え部205の出力端が符号量算出部206に接続されている状態において、実行可能な符号化モードのそれぞれを予測部1002に順次設定し、符号化コストを求めて符号化処理として実行する符号化モードを決定するものであるが、本実施の形態ではさらに、仮符号化処理時に、動き探索精度情報が符号化制御部101により設定され、動き探索精度選択部1401に渡すようになっている。
また、符号化モード制御部1407は、動き探索精度選択部1401で選択されていない動き探索精度を有する符号化モードについては予測信号を生成せず、仮符号化処理中に符号化コストは算出されないように制御を行う。すなわち、仮符号化部(フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114)では、第2切り替え部201の出力端は、適応モード選択部1001、動き探索精度選択部1401を経由して予測部1002へ接続されているが、動き探索精度選択部1401によって選択された動き探索精度に対する符号化モードに対してのみ予測部1002により予測信号の生成処理が行われ、符号化コストの算出などの処理が実行されるように符号化モード制御部1207によって制御される。
一方、符号化部(フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134)では、第2切り替え部201の出力端は、仮符号化時と同様に、適応モード選択部1001、動き探索精度選択部1401を経由して予測部1002へと接続される。ここで、仮符号化時に動き探索精度選択部1401で選択されていないモードに関しては、予測部1002により予測信号の生成処理が行われ、符号化コストの算出などの処理(予測部1002→直交変換・量子化部204→符号量算出部206→符号化歪み測定部608→符号化モード制御部1207の処理)が実行されるように符号化モード制御部1207によって制御される。
次に、以上のように構成された本実施の形態にかかる動画符号化装置100における動画符号化処理について説明する。動画符号化の全体処理については実施の形態1と同様の手順(図4)で行われる。
かかる動画符号化の全体処理(図4)におけるステップS403、S404、S406、S407における仮符号化処理およびステップS410、S410、S412、S413における符号化処理について詳細に説明する。図15は、仮符号化処理および符号化処理の手順を示すフローチャートである。
マクロブロックごとに動画像信号が入力されると、入力された画像はマクロブロック毎に符号化が開始される。まず、第2切り替え部201は、符号化制御部101で設定された符号化フラグの値が0か否かを参照することにより、仮符号化か否かを判断する(ステップS1501)。
ここでは、まず、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114についての処理について説明する。フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114に画像信号が入力される場合には、仮符号化を行うため符号化フラグは0に設定されているので(ステップS1501:Yes)、第2切り替え部201は、出力端を適応モード選択部1001に切り替えて、入力されたマクロブロックの画像信号を適応モード選択部1001に出力する。
そして、適応モード選択部1001は、入力されたマクロブロックの画像信号の画像タイプを調べ、I−スライスか否かを判断する(ステップS1502)。そして、I−スライスである場合には、適応モード選択部1001は、図3に示す符号化モードの中から予測方式がフレーム内符号化であり、かつI−スライスの符号効率が高い予め定められたブロックサイズおよび予測モード(例えば、ブロックサイズが16x16であり、かつ予測モードがDC予測モード)である符号化モードを特定モードとして選択する(ステップS1503)。
一方、ステップS1102において、入力されたマクロブロックの画像信号の画像タイプがI−スライス以外(P−スライスまたはB−スライス)である場合には、適応モード選択部1001は、図3に示す符号化モードの中から予測方式がフレーム間予測符号化で、かつP−スライスまたはB−スライスの符号効率が高いブロックサイズおよび予測モード(例えば、ブロックサイズが16x16であり、かつ予測モードがP0予測モード)である符号化モードを特定モードとして選択する(ステップS1504)。
そして、動き探索精度選択部1401は、符号化モード制御部1407から動き探索精度情報を受け取り、画像サイズに応じた動き探索精度を選択して、選択された動き探索精度を予測モードとして有する符号化モードを、ステップS1504で選択した符号化モードの中から特定モードとして選択する(ステップS1505)。
次に、変数indexにステップS1503またはS1504で特定モードとして選択された符号化モードの数を設定し、その中で最小のモード番号の符号化モードを処理対象の特定モードとし、最小コストに予め定められた最大値を設定する(ステップS1506)。これ以降の処理は、実施の形態4におけるステップS1106からS1117までの処理と同様に行われる。
このように本実施の形態にかかる動画符号化装置では、インタレース方式の動画像を符号化する場合において、複数の選択可能な符号化モードから入力された符号化モードを選択し、フレーム間予測符号化に関する符号化モードが選択された場合に、さらに動き探索精度を選択して選択された動き探索精度に応じた符号化モードを選択し、選択した符号化モードに対して仮符号化処理を行って、符号化モードごとの符号化データの符号量から求めた符号化コストの最小の符号化モードを符号化処理を行う符号化モードとして決定しているので、より適切かつ正確に符号化効率の高い符号化を行うことができ符号化モードを選択することができる。このため、マクロブロックの内容等に応じて好適な符号化モードの選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、実際に画像タイプに応じて仮符号化処理を行う符号化モードの数を削減しているため、演算量を大幅に削減でき、符号化処理の負担の増大を防止することができる。
なお、本実施の形態にかかる動画符号化装置を、実施の形態5と同様のブロック形状選択部を更に設けて、入力画像の画像タイプに基づいて符号化処理の対象となるブロック形状を選択するように構成してもよい。
(実施の形態7)
実施の形態1〜3では、入力されたマクロブロックの画像信号に対して実行可能なすべての符号化モードの中から第1符号化コストを求め、第1符号化コストに基づいて候補となる符号化モードを選択し、選択された符号化モードの中から仮符号化を行って第2符号化コストを求めて第2符号化コストが最小となる符号化モードに決定していたが、この実施の形態7にかかる動画符号化装置は、候補となる符号化モードを求めて仮符号化を行わずに符号化コストのみで符号化処理を行う符号化モードを決定するものである。
本実施の形態にかかる動画符号化装置100の機能的構成は図1に示した実施の形態1の動画符号化装置と同様である。図16は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114の機能的構成を示すブロック図である。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114(以下、「仮符号化部」という。)は、図16に示すように、予測部1601と、符号化コスト算出部1602と、直交変換・量子化部1603と、第2切替え部1604と、符号化モード制御部1605と、逆直交変換・逆量子化部1606と、予測復号化部1607とを主に備えている。
予測部1601は、符号化モード制御部1605によって順次設定される符号化モードごとに、フレームメモリ140に一時的に保存された参照画像を用いて、符号化モードで定められた符号化処理方式により予測信号の生成を行い、また入力されたマクロブロックの画像信号と生成された予測信号の画素差分である予測誤差信号の生成を行うものである。設定された符号化モードがフレーム間予測符号化に関するモードである場合は、動き補償を行うため、予測部1601は、動きベクトル検出処理も併せて行う。
なお、予測部1601は、対象のマクロブロックに対応する全ての符号化モードについて予測信号を生成する他、一部の符号化モードについてのみ予測信号を生成してもよい。
符号化コスト算出部1602は、予測部1002で生成された符号化モードごとの予測信号から符号化モードによる符号化処理量を示す符号化コストを算出するものである。ここで、符号化コストは数3式により算出する。
Figure 2006080925
ここで、SADは、予測誤差信号のマクロブロック内画素累積値であり、λは定数である。OHは、現在の符号化モードを選択した場合のモード情報の予め定められた符号量であり、例えば動きベクトルの距離などが該当する。
このように符号化コストは予測誤差信号のみで計算することができ、後述する符号量算出処理に比べ、非常に高速に実行することができる。従って、複数の符号化モードの組み合わせの中から、予測誤差信号に基づいて符号化構造の選択を行うことにより、フレーム符号化構造のマクロブロックとフィールド符号化構造のマクロブロックのフレーム・フィールド判定を高速かつ適切に行うことが可能となる。
直交変換・量子化部1603は、符号化モードごとに、予測部1601で生成された予測誤差信号に対して直交変換(例えば、離散コサイン変換、整数変換等)を行い、その変換係数を量子化し、量子化した直交変換係数と符号化モードの情報(あるいは、さらに動きベクトルの情報)を第2切り替え部1604と逆直交変換・逆量子化部1606に出力するものである。
第2切替え部1604は、直交変換・量子化部1603から出力された直交変換係数及び符号化モードの情報等を、符号化モード制御部1605への出力と仮符号化部外部への出力とを切り替えるものである。すなわち、第2切替え部1604は、符号化制御部101によって制御されており、マクロブロックで選択可能な符号化モードが存在するときには、出力端は符号化モード制御部1605に接続される。これにより、マクロブロックで選択可能なすべての符号化モードの予測誤差信号及び符号化コストの算出が可能となる。
より具体的には、第2切替え部1604の出力端が符号化モード制御部1605に接続されているときには、符号化コスト算出部1602は以後の処理(直交変換・量子化部1603→符号化モード制御部1605の処理)で、符号化処理を伴わないため、処理負担を削減するようになっている。
符号化モード制御部1605は、予測部1601における符号化モードを設定する処理を行う。また、符号化モード制御部1605は、符号化コスト算出部1602で符号化モードごとに算出された符号化コストが最小となる符号化モードを、符号化処理として採用する符号化モードとして決定する。
より具体的には、符号化モード制御部1605は、第2切り替え部1604で出力が符号化モード制御部1605に接続されている状態で、実行可能な一または複数の符号化モードの各々を予測部1601に順次設定する。そして、符号化モード制御部1605は、符号化モードごとの符号化コストの中で最小の符号化コストとなる符号化モードを決定する。符号化モード制御部1605で符号化モードが決定した場合には、第2切り替え部1604の出力端は仮符号化部外部へと直接接続され、決定された符号化モードの量子化された変換係数及び符号化コスト、符号化コスト等の符号化情報が出力される。
逆直交変換・逆量子化部1606は、直交変換・量子化部1603によって量子化された直交変換係数を逆量子化して直交変換係数を復元する。また、逆直交変換・逆量子化部1606は、復元した直交変換係数に対して逆直交変換処理(例えば、逆離散コサイン変換、逆整数変換等)を施し、予測誤差信号等を復元し、復元された予測誤差信号を予測復号化部1607に出力する。
予測復号化部1607は、予測誤差信号から予測信号を生成して、予測信号から画像を復元して復元した画像を参照画像としてフレームメモリ140に保存するものである。フレームメモリ140に保存された参照画像が、予測部1601による予測信号、予測誤差信号の生成処理で参照される。
ここで、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134(以下、「符号化部」という。)の機能的構成は実施の形態1と同様である。なお、符号化部の構成を実施の形態2〜6の符号化部と同様に構成してもよい。
次に、以上のように構成された本実施の形態にかかる動画符号化装置100における動画符号化処理について説明する。動画符号化の全体処理については実施の形態1と同様の手順(図4)で行われる。
かかる動画符号化の全体処理(図4)におけるステップS403、S404、S406、S407における仮符号化処理およびステップS410、S410、S412、S413における符号化処理について詳細に説明する。図17は、仮符号化処理および符号化処理の手順を示すフローチャートである。
マクロブロックごとに動画像信号が入力されると、入力された画像はマクロブロック毎に符号化が開始される。まず、予測部1601により、入力されたマクロブロックの画像信号から当該マクロブロックに対して処理可能な全ての符号化モードにより符号化処理方式に従い予測信号を生成し、この予測信号と入力画像信号の画素差分である予測誤差信号を求める(ステップS1701)。ここで、予測信号と予測誤差信号は、入力されたマクロブロックに対して処理可能な全ての符号化モードごとに生成される。
次に符号化コスト算出部1602は、予測部1601によって生成された予測誤差信号から、入力されたマクロブロックに対して処理可能な全ての符号化モードごとに数3式を用いて符号化コストを算出する(ステップS1702)。そして、符号化コード制御部1605は、算出された符号化モードごとの第1符号化コストの中から最小値を有する符号化モードを符号化処理を行う符号化モードとして選択する(ステップS1703)。
次に、符号化モード制御部207は、選択された符号化モードの番号を示すindexに、符号化コストが最小の符号化モードのモード番号を設定し、indexの値で示されるモード番号の符号化モードを符号化制御部101に設定する(ステップS1704)。これにより、indexの値で示されるモード番号の符号化モードに対応する直交変換および量子化処理が直交変換・量子化部1603によって行われる(ステップS1705)。具体的には、直交変換・量子化部1603によって予測誤差信号を直交変換して直交変換係数を量子化する。
一方、かかる処理を行う際に、予測誤差信号の量子化された直交変換係数は、逆直交変換・逆量子化部1606に入力されて、逆量子化・逆直交変換が施されて予測誤差信号を再生し、予測復号化部1607によりローカルデコード画像が生成され、フレームメモリ140に参照画像として一時的に保存される。
次に、第2切替え部1604は符号化フラグが1か否かを調べることにより、符号化か否かを判断する(ステップS1706)。そして、符号化フラグが1である場合(符号化の場合)には(ステップS1706:Yes)、第2切替え部1604は、出力端を仮符号化部外部に接続するように切替え、符号化モード制御部1605で決定された最適の符号化モードで符号化処理を行う(ステップS1707)。これにより、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134のいずれかにより符号化処理がおこなわれる。
一方、ステップS1706で、符号化フラグが0の場合には、第2切替え部205は処理を終了する。
このように本実施の形態にかかる動画符号化装置では、インタレース方式の動画像を符号化する場合において、複数の選択可能な符号化モードのそれぞれについて、入力された画像信号の予測誤差信号から求めた符号化コストの最小値を有する符号化モードを符号化処理を行う符号化モードとして決定しているので、適切かつ正確に符号化効率の高い符号化を行うことができ符号化モードを選択することができる。このため、マクロブロックの内容等に応じて好適な符号化モードの選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、実際に仮符号化処理を行う符号化モードの数を削減しているため、演算量を大幅に削減でき、符号化処理の負担の増大を防止することができる。特に本実施の形態では、予測誤差信号から求めた符号化コストのみによって符号化モードを決定しているので、仮符号化の処理の負担をより一層軽減することができる。
(実施の形態8)
実施の形態7にかかる動画符号化装置は、予測誤差信号から求めた符号化コストのみで符号化処理を行う符号化モードを決定していたが、この実施の形態8にかかる動画符号化装置は、仮符号化を行って求めた発生符号量と符号化歪みとから符号化コストを求め、かかる符号化コストのみで符号化処理を行う符号化モードを決定するものである。
本実施の形態にかかる動画符号化装置100の機能的構成は図1に示した実施の形態1の動画符号化装置と同様である。図18は、フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。
フレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134は、図18に示すように、予測部1801と、直交変換・量子化部1803と、第2切替え部1804と、符号量算出部1805と、符号化歪み計測部1806と、符号化モード制御部1807と、逆直交変換・逆量子化部1808と、予測復号化部1809と、符号化処理部1810とを主に備えている。
予測部1801は、符号化モード制御部1807によって順次設定される符号化モードごとに、フレームメモリ140に一時的に保存された参照画像を用いて、符号化モードで定められた符号化処理方式により予測信号の生成を行い、また入力されたマクロブロックの画像信号と生成された予測信号の画素差分である予測誤差信号の生成を行うものである。設定された符号化モードがフレーム間予測符号化に関するモードである場合は、動き補償を行うため、予測部1701は、動きベクトル検出処理も併せて行う。
なお、予測部1801は、対象のマクロブロックに対応する全ての符号化モードについて予測信号を生成する他、一部の符号化モードについてのみ予測信号を生成してもよい。
直交変換・量子化部1803は、符号化モードごとに、予測部1801で生成された予測誤差信号に対して直交変換(例えば、離散コサイン変換、整数変換等)を行い、その変換係数を量子化し、量子化した直交変換係数と符号化モードの情報(あるいは、さらに動きベクトルの情報)を第2切り替え部1804と逆直交変換・逆量子化部1808に出力するものである。
第2切替え部1804は、直交変換・量子化部1803から出力された直交変換係数及び符号化モードの情報等を、符号量算出部1805への出力と符号化処理部1810への出力とを切り替えるものである。
符号量算出部1805は、第2切り替え部1804から入力される直交変換係数や動きベクトルの情報を示す信号に対して一時的に符号化を行って符号化データの出力を行わずに(仮符号化)、発生符号量を計測するものである。ここで、本実施の形態では、ハフマン符号化または算術符号化に基づくエントロピー符号化がなされた場合の符号量を計測し、エントロピー符号化データの出力は行わない。
符号化歪み計測部1806は、逆直交変換・逆量子化部1808及び予測復号化部1809により生成されフレームメモリ140に一時的に保存されている参照画像と符号化対象の入力画像(符号化前の原画像)の画像差分である符号化歪み(例えば、二乗誤差)を測定するものである。ここで、符号化歪みは、符号化モード制御部1708によって設定される各符号化モードごとに算出される。すなわち、符号化モードごとに当該符号化モードで処理され符号化された画像を復元した画像と入力画像との差分を表す符号化歪みが計測される。
符号化モード制御部1807は、第2切り替え部1804の出力端が符号量算出部105に接続されている状態において、符号化モードのそれぞれを予測部1801に順次設定し、符号化の処理量の目安となる符号化コストを求めて符号化処理として実行する符号化モードを決定するものである。具体的には、符号化モード制御部1807は、各符号化モードで処理がなされた場合に符号量算出部1805で算出された符号化モードごとの発生符号量と符号化歪み計測部1806で算出された符号化モードごとの符号化歪みとを数値化して、数4式により両者を加算して符号化コストを求め、この符号化コストが最小値となる符号化モードを決定する。
Figure 2006080925
ここで、Dは符号化歪み、Rは発生符号量、λは定数である。
なお、本実施の形態では、符号化コストを発生符号量と符号化歪みとを加算した値としているが、発生符号量と符号化歪みに基づいた値であればこれに限られるものではなく、また、発生符号量と符号化歪みコストの数値化にあたって、発生符号量を重視するようにしてもよいし、符号化歪みを重視するようにしてもよいし、ユーザがいずれを重視するかを決定できるようにしてもよい。
逆直交変換・逆量子化部1808は、直交変換・量子化部1803によって量子化された直交変換係数を逆量子化して直交変換係数を復元する。また、逆直交変換・逆量子化部1808は、復元した直交変換係数に対して逆直交変換処理(例えば、逆離散コサイン変換、逆整数変換等)を施し、予測誤差信号等を復元し、復元された予測誤差信号を予測復号化部1809に出力する。
予測復号化部1809は、予測誤差信号から予測信号を生成して、予測信号から画像を復元して復元した画像を参照画像としてフレームメモリ140に保存するものである。フレームメモリ140に保存された参照画像が、予測部1801による予測信号、予測誤差信号の生成処理および符号化歪み計測部1806による符号化歪み計測の際に参照される。
符号化処理部1810は、符号化モード制御部1807で決定された符号化モードで、直交変換・量子化部1803で得られた量子化された直交変換係数や符号化情報をエントロピー符号化し、符号化データを外部へ出力するものである。
次に、以上のように構成された本実施の形態にかかる動画符号化装置100における動画符号化処理について説明する。動画符号化の全体処理については実施の形態1と同様の手順(図4)で行われる。
かかる動画符号化の全体処理(図4)におけるステップS403、S404、S406、S407における仮符号化処理およびステップS410、S410、S412、S413における符号化処理について詳細に説明する。図19は、仮符号化処理および符号化処理の手順を示すフローチャートである。
マクロブロックごとに動画像信号が入力されると、入力された画像はマクロブロック毎に符号化が開始される。まず、予測部1801では、入力されたマクロブロックの画像信号から当該マクロブロックに対して処理可能な全ての符号化モードにより符号化処理方式に従い予測信号を生成し、この予測信号と入力画像信号の画素差分である予測誤差信号を求める(ステップS1901)。ここで、予測信号と予測誤差信号は、入力されたマクロブロックに対して処理可能な全ての符号化モードごとに生成される。
次に、符号化モード制御部1807は、符号化モードの番号を示すindexを0に設定し、更に最小コストを予め定められた任意の値である最大値で初期化する(ステップS1902)。
次に、符号化モード制御1807は、第2切り替え部1804の出力が符号量算出部1805に接続された状態で、indexの値で示されるモード番号の符号化モードを符号化制御部101に設定する(ステップS1903)。これにより、indexの値で示されるモード番号の符号化モードに対応する直交変換および量子化処理が直交変換・量子化部1803によって行われる(ステップS1904)。具体的には、直交変換・量子化部204によって予測誤差信号を直交変換して直交変換係数を量子化する。
そして、符号量算出部1805によって、量子化された直交変換係数や動きベクトルの情報に対してハフマン符号化または算術符号化に基づくエントロピー符号化がなされた場合の発生符号量を算出する(ステップS1905)。ただし、エントロピー符号化データの出力は行わない。
ステップS1904において直交変換・量子化部1803によって予測誤差信号を直交変換して直交変換係数を量子化し、ステップS1905において符号量算出部1805によって、発生符号量を算出する処理を行う際に、予測誤差信号の量子化された直交変換係数は、逆直交変換・逆量子化部1808に入力されて、逆量子化・逆直交変換が施されて予測誤差信号を再生し、予測復号化部1809により復号化画像であるローカルデコード画像が生成され、フレームメモリ140に参照画像として一時的に保存される(ステップS1906)。かかる参照画像の生成は、候補となる符号化モードに対してのみ行われる。
次に、符号化歪み計測部1806は、フレームメモリ140の参照画像と符号化対象の入力画像(符号化前の原画像)の画像差分である符号化歪みを測定する(ステップS1907)。
次に、符号化モード制御部1807は、ステップS1905で算出された発生符号量とS1907で測定された符号化歪みから数4式を使用して符号化コストを求める(ステップS1908)。
そして、符号化モード制御部1807は、算出された符号化コストが最小コストより小さいか否かを判断する(ステップS1909)。そして、符号化コストが最小コストより小さい場合には(ステップS1909:Yes)、符号化モード制御部1807は、現在の符号化コストに対応する符号化モードを最適な符号化モードとして決定する(ステップS1910)。そして、現在の符号化コストで最小コストを更新し、仮符号化の結果、すなわちindexで示されるモード番号に対応した符号化モードの符号化処理によって生成された符号化データをフレームメモリ140に保持しておく(ステップS1911)。
次に、符号化モード制御部1807は、すべての符号化モードに対して処理が終了したか否かを判断する(ステップS1912)。そして、まだ全ての符号化モードに対して処理が終了していない場合には(ステップS1912:No)、indexを1だげ増加して更新し(ステップS1915)、ステップS1903からS1911までの処理を繰り返し実行する。これにより、符号化コストが最小である符号化モードが決定されることになる。
一方、ステップS1912において、すべての符号化モードに対して処理が終了している場合には(ステップS1912:Yes)、第2切替え部1804は符号化フラグが1か否かを調べることにより、符号化か否かを判断する(ステップS1913)。そして、符号化フラグが1である場合(符号化の場合)には(ステップS51913:Yes)、第2切替え部1804は、出力端を符号化処理部1810に接続するように切替え、符号化モード制御部1807で決定された最適の符号化モードで符号化処理を行う(ステップS1914)。これにより、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134のいずれかにより符号化処理がおこなわれる。
一方、ステップS1913で、符号化フラグが0の場合には(ステップS1913:No)、処理を終了する。これにより、最適な符号かモードの符号化コストがフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114のいずれかに出力される。
このように本実施の形態にかかる動画符号化装置では、インタレース方式の動画像を符号化する場合において、複数の選択可能な符号化モードのそれぞれについて、仮符号化を行って求めた発生符号量と符号化歪みとから符号化コストを求め、かかる符号化コストの最小値を有する符号化モードを符号化処理を行う符号化モードとして決定しているので、適切かつ正確に符号化効率の高い符号化を行うことができ符号化モードを選択することができる。このため、マクロブロックの内容等に応じて好適な符号化モードの選択が可能となり、圧縮効率の高い適切な符号化を実現することができるとともに、実際に仮符号化処理を行う符号化モードの数を削減しているため、演算量を大幅に削減でき、符号化処理の負担の増大を防止することができる。特に本実施の形態では、発生符号量と符号化歪みとから求めた符号化コストのみによって符号化モードを決定しているので、仮符号化の処理の負担をより一層軽減することができる。
なお、本実施の形態の動画符号化装置では、符号化コストを発生符号量と符号化歪みとから求めているが、これに限られるものではなく、例えば、実施の形態1のように、符号化コストを発生符号量そのものとするように構成してもよい。
実施の形態1〜8にかかる動画符号化装置は、CPUなどの制御装置と、ROM(Read Only Memory)やRAMなどの記憶装置と、HDD、CDドライブ装置などの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボードやマウスなどの入力装置を備えており、通常のコンピュータを利用したハードウェア構成となっている。
実施の形態1〜8にかかる動画符号化装置で実行される動画符号化プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、実施の形態1〜8にかかる動画符号化装置で実行される動画符号化プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、本実施形態の〜装置で実行される〜プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
また、実施の形態1〜8にかかる動画符号化プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
実施の形態1〜8にかかる動画符号化装置で実行される動画符号化プログラムは、上述した各部(フレーム第1仮符号化部111と、フレーム第2仮符号化部112と、フィールド第1仮符号化部113と、フィールド第2仮符号化部114と、フレームフィールド判定部120と、第1切替え部121と、フレーム第1符号化部131と、フレーム第2符号化部132と、フィールド第1符号化部133と、フィールド第2符号化部134と、フレームフィールド判定部120および各部を構成する部分)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から動画符号化プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、フレーム第1仮符号化部111と、フレーム第2仮符号化部112と、フィールド第1仮符号化部113と、フィールド第2仮符号化部114と、フレームフィールド判定部120と、第1切替え部121と、フレーム第1符号化部131と、フレーム第2符号化部132と、フィールド第1符号化部133と、フィールド第2符号化部134と、フレームフィールド判定部120が主記憶装置上に生成されるようになっている。
なお、本発明は、上記実施の形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施の形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施の形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施の形態にわたる構成要素を適宜組み合わせても良い。
実施の形態1にかかる動画符号化装置100の機能的構成を示すブロック図である。 実施の形態1にかかるフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。 符号化モードの例を示す説明図である。 実施の形態1の動画符号化の全体処理の手順を示すフローチャートである。 実施の形態1の仮符号化処理および符号化処理の手順を示すフローチャートである。 実施の形態2のフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。 実施の形態2の仮符号化処理および符号化処理の手順を示すフローチャートである。 実施の形態3のフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。 実施の形態3の仮符号化処理および符号化処理の手順を示すフローチャートである。 実施の形態4のフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。 実施の形態4の仮符号化処理および符号化処理の手順を示すフローチャートである。 実施の形態5のフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。 実施の形態5の仮符号化処理および符号化処理の手順を示すフローチャートである。 実施の形態6のフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。 実施の形態6の仮符号化処理および符号化処理の手順を示すフローチャートである。 実施の形態7のフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114の機能的構成を示すブロック図である。 実施の形態7の仮符号化処理および符号化処理の手順を示すフローチャートである。 実施の形態8のフレーム第1仮符号化部111、フレーム第2仮符号化部112、フィールド第1仮符号化部113、フィールド第2仮符号化部114、フレーム第1符号化部131、フレーム第2符号化部132、フィールド第1符号化部133、フィールド第2符号化部134の機能的構成を示すブロック図である。 実施の形態8の仮符号化処理および符号化処理の手順を示すフローチャートである。
符号の説明
100 動画符号化装置
101 符号化制御部
111 フレーム第1仮符号化部
112 フレーム第2仮符号化部
113 フィールド第1仮符号化部
114 フィールド第2仮符号株
121 第1切替え部
131 フレーム第1符号化部
132 フレーム第2符号化部
133 フィールド第1符号化部
134 フィールド第2符号化部
140 フレームメモリ
201 第2切替え部
202 予測信号生成部
203 候補モード選択部
205 第3切替え部
207 符号化モード制御部
208 逆量子化部
209 予測復号化部
215 適応モード選択部
608 符号化歪み測定部
801 モード限定部
1001 適応モード選択部
1002 予測部
1007 符号化モード制御部
1207 符号化モード制御部
1401 動き探索精度選択部
1602 符号化コスト算出部
1604 第2切り替え部
1606 逆量子化部
1803 量子化部
1805 符号量算出部
1807 符号化モード制御部
1808 逆量子化部
1809 予測復号化部

Claims (27)

  1. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置であって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測信号生成手段と、
    前記予測信号生成手段によって生成された予測誤差信号に基づいて符号化処理に要する処理量を示す第1の符号化コストを前記符号化モードごとに求め、求めた前記第1の符号化コストに基づいて候補となる前記符号化モードを選択する候補モード選択手段と、
    前記予測信号生成手段によって生成された前記予測誤差信号に対して前記候補モード選択手段によって選択された前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手段と、
    前記仮符号化手段によって算出された前記発生符号量に基づいて第2の符号化コストを求め、求めた前記第2の符号化コストに基づいて前記符号化モードの候補の中から符号化モードを決定する符号化モード制御手段と、
    前記符号化モード制御手段により求めた前記第2の符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手段と、
    前記予測信号生成手段によって生成された前記予測誤差信号に対して、前記符号化構造判定手段によって決定された符号化構造で、前記符号化モード制御手段によって決定された前記符号化モードによる符号化処理を施す符号化処理手段と、
    を備えたことを特徴とする動画符号化装置。
  2. 前記入力画像と前記予測信号生成手段によって生成された前記予測誤差信号から復号化した参照画像との差分である符号化歪み情報を測定する符号化歪み計測手段を更に備え、
    前記符号化モード制御手段は、前記仮符号化手段によって算出された前記符号量と前記符号化歪み計測手段によって測定された前記符号化歪み情報とから前記第2の符号化コストを求め、求めた前記第2の符号化コストに基づいて符号化モードの候補の中から符号化モードを決定することを特徴とする請求項1に記載の動画符号化装置。
  3. 前記複数の符号化モードの中から前記入力画像の符号化構造に基づいて符号化モードを限定するモード限定手段を更に備え、
    前記候補モード選択手段は、前記限定された符号化モードごとに、前記予測誤差信号に基づいて符号化処理に要する処理量を示す第1の符号化コストを求め、前記限定された符号化モードの中から第1の符号化コストに基づいて符号化モードの候補を選択することを特徴とする請求項1または2に記載の動画符号化装置。
  4. 前記候補モード選択手段は、前記第1の符号化コストの小さい順に前記候補となる前記符号化モードを選択することを特徴とする請求項1〜3のいずれか一つに記載の動画符号化装置。
  5. 前記仮符号化手段は、前記予測信号生成手段によって生成された前記予測誤差信号に対して直交変換を行い、直交変換に関する直交変換係数の量子化を行う直交変換・量子化手段と、前記直交変換・量子化手段による量子化の結果から前記符号量を算出する符号量算出手段と、を備えたことを特徴とする請求項1〜4のいずれか一つに記載の動画符号化装置。
  6. 前記符号化モード制御手段は、前記候補モード選択手段によって選択された前記候補となる前記符号化モードの中から前記第2の符号化コストが最小となる符号化モードを決定することを特徴とする請求項1〜5のいずれか一つに記載の動画符号化装置。
  7. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置であって、
    入力された動画像から得られる入力画像の画像タイプに基づいて符号化処理を行う一または複数の符号化モードを選択する適応モード選択手段と、
    前記入力画像と参照画像から前記適応モード選択手段によって選択された符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手段と、
    前記予測手段によって生成された予測誤差信号に対して前記適応モード選択手段によって選択された前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手段と、
    前記仮符号化手段によって算出された前記発生符号量に基づいて符号化コストを求め、求めた前記符号化コストに基づいて前記適応モード選択手段によって選択された前記符号化モードの中から符号化モードを決定する符号化モード制御手段と、
    前記符号化モード制御手段により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手段と、
    前記予測手段によって生成された前記予測誤差信号に対して、前記符号化構造判定手段によって決定された符号化構造で、前記符号化モード制御手段によって決定された前記符号化モードによる符号化処理を施す符号化処理手段と、
    を備えたことを特徴とする動画符号化装置。
  8. 入力された動画像から得られる入力画像に基づいて符号化処理の対象となるブロック形状を選択し、選択されたブロック形状に対応した前記符号化モードを選択するブロック形状選択手段をさらに備え、
    前記適応モード選択手段は、前記入力画像の画像タイプに基づいて、前記ブロック形状選択手段により選択された前記符号化モードの中から符号化処理を行う一または複数の符号化モードを選択することを特徴とする請求項7に記載の動画符号化装置。
  9. 前記ブロック形状選択手段は、前記入力画像の画像タイプに基づいて符号化処理の対象となるブロック形状を選択し、選択されたブロック形状に対応した前記符号化モードを選択することを特徴とする請求項8に記載の動画符号化装置。
  10. 前記適応モード選択手段によって選択された前記符号化モードの符号化方式がフレーム間予測符号化である場合に、動きベクトル探索における画素位置の精度を示す動き探索精度を指定した前記符号化モードを符号化処理を行う一または複数の符号化モードを選択する動き探索精度選択手段
    をさらに備えたことを特徴とする請求項7〜9のいずれか一つに記載の動画符号化装置。
  11. 前記動き探索精度選択手段は、前記適応モード選択手段によって選択された前記符号化モードの符号化方式がフレーム間予測符号化である場合に、入力画像の画像タイプに基づいて前記動き探索精度を指定した前記符号化モードを符号化処理を行う一または複数の符号化モードを選択することを特徴とすることを特徴とする請求項10に記載の動画符号化装置。
  12. 前記符号化モード制御手段は、前記適応モード選択手段によって選択された前記符号化モードの中から前記符号化コストが最小となる符号化モードを決定することを特徴とする請求項7〜11のいずれか一つに記載の動画符号化装置。
  13. 前記仮符号化手段は、前記予測手段によって生成された前記予測誤差信号に対して直交変換を行い、直交変換に関する直交変換係数の量子化を行う直交変換・量子化手段と、前記直交変換・量子化手段による量子化の結果から前記符号量を算出する符号量算出手段と、を備えたことを特徴とする請求項7〜12のいずれか一つに記載の動画符号化装置。
  14. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置であって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手段と、
    前記予測手段によって生成された予測誤差信号に基づいて符号化処理に要する処理量を示す符号化コストを前記符号化モードごとに求める符号化コスト算出手段と、
    前記符号化コスト算出手段によって求めた前記符号化コストに基づいて前記符号化モードを決定する符号化モード制御手段と、
    前記符号化モード制御手段により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手段と、
    前記予測手段によって生成された前記予測誤差信号に対して、前記符号化構造判定手段によって決定された符号化構造で、前記符号化モード制御手段によって決定された前記符号化モードによる符号化処理を施す符号化処理手段と、
    を備えたことを特徴とする動画符号化装置。
  15. 前記符号化モード制御手段は、前記符号化モードの中から前記符号化コストが最小となる符号化モードを決定することを特徴とする請求項14に記載の動画符号化装置。
  16. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化装置であって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手段と、
    前記予測手段によって生成された前記予測誤差信号に対して前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手段と、
    前記仮符号化手段によって算出された前記発生符号量に基づいて符号化コストを求め、求めた前記第2の符号化コストに基づいて前記符号化モードを決定する符号化モード制御手段と、
    前記符号化モード制御手段により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手段と、
    前記予測手段によって生成された前記予測誤差信号に対して、前記符号化構造判定手段によって決定された符号化構造で、前記符号化モード制御手段によって決定された前記符号化モードによる符号化処理を施す符号化処理手段と、
    を備えたことを特徴とする動画符号化装置。
  17. 前記入力画像と前記予測手段によって生成された前記予測誤差信号から復号化した参照画像との差分である符号化歪み情報を測定する符号化歪み計測手段を更に備え、
    前記符号化モード制御手段は、前記仮符号化手段によって算出された前記符号量と前記符号化歪み計測手段によって測定された前記符号化歪み情報とから前記符号化コストを求め、求めた前記符号化コストに基づいて前記符号化モードを決定することを特徴とする請求項16に記載の動画符号化装置。
  18. 前記符号化モード制御手段は、前記符号化モードの中から前記符号化コストが最小となる符号化モードを決定することを特徴とする請求項14に記載の動画符号化装置。
  19. 前記仮符号化手段は、前記予測手段によって生成された前記予測誤差信号に対して直交変換を行い、直交変換に関する直交変換係数の量子化を行う直交変換・量子化手段と、前記直交変換・量子化手段による量子化の結果から前記符号量を算出する符号量算出手段と、を備えたことを特徴とする請求項16〜18のいずれか一つに記載の動画符号化装置。
  20. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化方法であって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測信号生成ステップと、
    前記予測信号生成ステップによって生成された予測誤差信号に基づいて符号化処理に要する処理量を示す第1の符号化コストを前記符号化モードごとに求め、求めた前記第1の符号化コストに基づいて候補となる前記符号化モードを選択する候補モード選択ステップと、
    前記予測信号生成ステップによって生成された前記予測誤差信号に対して前記候補モード選択ステップによって選択された前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化ステップと、
    前記仮符号化ステップによって算出された前記発生符号量に基づいて第2の符号化コストを求め、求めた前記第2の符号化コストに基づいて前記符号化モードの候補の中から符号化モードを決定する符号化モード制御ステップと、
    前記符号化モード制御ステップにより求めた前記第2の符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定ステップと、
    前記予測信号生成ステップによって生成された前記予測誤差信号に対して、前記符号化構造判定ステップによって決定された符号化構造で、前記符号化モード制御ステップによって決定された前記符号化モードによる符号化処理を施す符号化処理ステップと、
    を含むことを特徴とする動画符号化方法。
  21. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化方法であって、
    入力された動画像から得られる入力画像の画像タイプに基づいて符号化処理を行う一または複数の符号化モードを選択する適応モード選択ステップと、
    前記入力画像と参照画像から前記適応モード選択ステップによって選択された符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測ステップと、
    前記予測ステップによって生成された予測誤差信号に対して前記適応モード選択ステップによって選択された前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化ステップと、
    前記仮符号化ステップによって算出された前記発生符号量に基づいて符号化コストを求め、求めた前記符号化コストに基づいて前記適応モード選択ステップによって選択された前記符号化モードの中から符号化モードを決定する符号化モード制御ステップと、
    前記符号化モード制御ステップにより求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定ステップと、
    前記予測ステップによって生成された前記予測誤差信号に対して、前記符号化構造判定ステップによって決定された符号化構造で、前記符号化モード制御ステップによって決定された前記符号化モードによる符号化処理を施す符号化処理ステップと、
    を含むことを特徴とする動画符号化方法。
  22. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化方法であって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測ステップと、
    前記予測ステップによって生成された予測誤差信号に基づいて符号化処理に要する処理量を示す符号化コストを前記符号化モードごとに求める符号化コスト算出ステップと、
    前記符号化コスト算出ステップによって求めた前記符号化コストに基づいて前記符号化モードを決定する符号化モード制御ステップと、
    前記符号化モード制御ステップにより求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定ステップと、
    前記予測ステップによって生成された前記予測誤差信号に対して、前記符号化構造判定ステップによって決定された符号化構造で、前記符号化モード制御ステップによって決定された前記符号化モードによる符号化処理を施す符号化処理ステップと、
    を含むことを特徴とする動画符号化方法。
  23. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化方法であって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測ステップと、
    前記予測ステップによって生成された前記予測誤差信号に対して前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化ステップと、
    前記仮符号化ステップによって算出された前記発生符号量に基づいて符号化コストを求め、求めた前記第2の符号化コストに基づいて前記符号化モードを決定する符号化モード制御ステップと、
    前記符号化モード制御ステップにより求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定ステップと、
    前記予測ステップによって生成された前記予測誤差信号に対して、前記符号化構造判定ステップによって決定された符号化構造で、前記符号化モード制御ステップによって決定された前記符号化モードによる符号化処理を施す符号化処理ステップと、
    を含むことを特徴とする動画符号化方法。
  24. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化プログラムであって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測信号生成手順と、
    前記予測信号生成手順によって生成された予測誤差信号に基づいて符号化処理に要する処理量を示す第1の符号化コストを前記符号化モードごとに求め、求めた前記第1の符号化コストに基づいて候補となる前記符号化モードを選択する候補モード選択手順と、
    前記予測信号生成手順によって生成された前記予測誤差信号に対して前記候補モード選択手順によって選択された前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手順と、
    前記仮符号化手順によって算出された前記発生符号量に基づいて第2の符号化コストを求め、求めた前記第2の符号化コストに基づいて前記符号化モードの候補の中から符号化モードを決定する符号化モード制御手順と、
    前記符号化モード制御手順により求めた前記第2の符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手順と、
    前記予測信号生成手順によって生成された前記予測誤差信号に対して、前記符号化構造判定手順によって決定された符号化構造で、前記符号化モード制御手順によって決定された前記符号化モードによる符号化処理を施す符号化処理手順と、
    をコンピュータに実行させることを特徴とする動画符号化プログラム。
  25. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化プログラムであって、
    入力された動画像から得られる入力画像の画像タイプに基づいて符号化処理を行う一または複数の符号化モードを選択する適応モード選択手順と、
    前記入力画像と参照画像から前記適応モード選択手順によって選択された符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手順と、
    前記予測手順によって生成された予測誤差信号に対して前記適応モード選択手順によって選択された前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手順と、
    前記仮符号化手順によって算出された前記発生符号量に基づいて符号化コストを求め、求めた前記符号化コストに基づいて前記適応モード選択手順によって選択された前記符号化モードの中から符号化モードを決定する符号化モード制御手順と、
    前記符号化モード制御手順により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手順と、
    前記予測手順によって生成された前記予測誤差信号に対して、前記符号化構造判定手順によって決定された符号化構造で、前記符号化モード制御手順によって決定された前記符号化モードによる符号化処理を施す符号化処理手順と、
    をコンピュータに実行させることを特徴とする動画符号化プログラム。
  26. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化プログラムであって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手順と、
    前記予測手順によって生成された予測誤差信号に基づいて符号化処理に要する処理量を示す符号化コストを前記符号化モードごとに求める符号化コスト算出手順と、
    前記符号化コスト算出手順によって求めた前記符号化コストに基づいて前記符号化モードを決定する符号化モード制御手順と、
    前記符号化モード制御手順により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手順と、
    前記予測手順によって生成された前記予測誤差信号に対して、前記符号化構造判定手順によって決定された符号化構造で、前記符号化モード制御手順によって決定された前記符号化モードによる符号化処理を施す符号化処理手順と、
    をコンピュータに実行させることを特徴とする動画符号化プログラム。
  27. 入力されるインタレース方式の動画像に対して、異なる符号化処理方式を示す複数の符号化モードからいずれかの符号化モードを選択して符号化処理を施す動画符号化プログラムであって、
    入力された動画像から得られる入力画像と参照画像から前記符号化モードごとに予測信号を生成し、入力画像の信号と各予測信号の差分である予測誤差信号を符号化モードごとに生成する予測手順と、
    前記予測手順によって生成された前記予測誤差信号に対して前記符号化モードごとに符号化処理の一部の処理を施し、前記符号化モードごとの発生符号量を算出する仮符号化手順と、
    前記仮符号化手順によって算出された前記発生符号量に基づいて符号化コストを求め、求めた前記第2の符号化コストに基づいて前記符号化モードを決定する符号化モード制御手順と、
    前記符号化モード制御手順により求めた前記符号化コストに基づいてフレーム符号化構造とフィールド符号化構造とからいずれかの符号化構造を決定する符号化構造判定手順と、
    前記予測手順によって生成された前記予測誤差信号に対して、前記符号化構造判定手順によって決定された符号化構造で、前記符号化モード制御手順によって決定された前記符号化モードによる符号化処理を施す符号化処理手順と、
    をコンピュータに実行させることを特徴とする動画符号化プログラム。
JP2004263085A 2004-09-09 2004-09-09 動画符号化装置、動画符号化方法および動画符号化プログラム Pending JP2006080925A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004263085A JP2006080925A (ja) 2004-09-09 2004-09-09 動画符号化装置、動画符号化方法および動画符号化プログラム
US11/176,755 US20060050786A1 (en) 2004-09-09 2005-07-08 Moving picture coding apparatus and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004263085A JP2006080925A (ja) 2004-09-09 2004-09-09 動画符号化装置、動画符号化方法および動画符号化プログラム

Publications (1)

Publication Number Publication Date
JP2006080925A true JP2006080925A (ja) 2006-03-23

Family

ID=35996173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004263085A Pending JP2006080925A (ja) 2004-09-09 2004-09-09 動画符号化装置、動画符号化方法および動画符号化プログラム

Country Status (2)

Country Link
US (1) US20060050786A1 (ja)
JP (1) JP2006080925A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008141401A (ja) * 2006-11-30 2008-06-19 Matsushita Electric Ind Co Ltd 画像符号化装置
JP2008172546A (ja) * 2007-01-12 2008-07-24 Hitachi Ltd 画像符号化・復号化装置
JP2009542145A (ja) * 2006-06-30 2009-11-26 トムソン ライセンシング フレーム・モード又はフィールド・モードの符号化方法
JP2010520714A (ja) * 2007-03-02 2010-06-10 クゥアルコム・インコーポレイテッド 第2のパスのビデオ符号化における効率的なビデオブロックのモード変更
JP2011035677A (ja) * 2009-07-31 2011-02-17 Canon Inc 動画像符号化装置、動画像符号化方法及びコンピュータプログラム

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080788A1 (en) * 2003-04-17 2009-03-26 Droplet Technology, Inc. Multiple Technique Entropy Coding System And Method
KR100708118B1 (ko) * 2005-01-07 2007-04-16 삼성전자주식회사 복수개의 변형 곱셈 테이블을 이용한 동영상 부호화 및복호화 장치와 그 방법, 및 이를 구현하기 위한프로그램이 기록된 기록 매체
CN101848391B (zh) * 2005-09-26 2014-11-26 三菱电机株式会社 运动图像编码装置以及运动图像译码装置
KR100882949B1 (ko) * 2006-08-17 2009-02-10 한국전자통신연구원 화소 유사성에 따라 적응적인 이산 코사인 변환 계수스캐닝을 이용한 부호화/복호화 장치 및 그 방법
US20080137726A1 (en) * 2006-12-12 2008-06-12 General Instrument Corporation Method and Apparatus for Real-Time Video Encoding
CN101222641B (zh) * 2007-01-11 2011-08-24 华为技术有限公司 帧内预测编解码方法及其装置
US8514237B2 (en) * 2007-05-22 2013-08-20 International Business Machines Corporation Two dimensional memory caching apparatus for high definition video
US8270471B2 (en) * 2007-11-08 2012-09-18 Mediatek, Inc. Encoders and scheduling methods for macroblock-based adaptive frame/filed coding
US8432970B1 (en) * 2007-12-14 2013-04-30 Marvell International Ltd. Block type selection
US8670484B2 (en) * 2007-12-17 2014-03-11 General Instrument Corporation Method and apparatus for selecting a coding mode
US9729888B2 (en) 2009-09-10 2017-08-08 Dolby Laboratories Licensing Corporation Speedup techniques for rate distortion optimized quantization
CN107979757B (zh) * 2011-09-14 2021-12-21 三星电子株式会社 对视频进行解码的设备和对视频进行编码的设备
US9247196B1 (en) * 2012-08-30 2016-01-26 Ambarella, Inc. High efficiency video coding for video with interlaced and progressive content using lookahead
US9510022B2 (en) * 2012-12-12 2016-11-29 Intel Corporation Multi-layer approach for frame-missing concealment in a video decoder
MY194555A (en) * 2016-09-30 2022-12-01 Huawei Tech Co Ltd Method and Apparatus for Image Coding and Decoding Through Inter Prediction
JP6769302B2 (ja) * 2016-12-28 2020-10-14 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
EP3349451A1 (en) * 2017-01-11 2018-07-18 Thomson Licensing Method and apparatus for selecting a coding mode used for encoding/decoding a residual block

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963673A (en) * 1995-12-20 1999-10-05 Sanyo Electric Co., Ltd. Method and apparatus for adaptively selecting a coding mode for video encoding
JP4127818B2 (ja) * 2003-12-24 2008-07-30 株式会社東芝 動画像符号化方法及びその装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009542145A (ja) * 2006-06-30 2009-11-26 トムソン ライセンシング フレーム・モード又はフィールド・モードの符号化方法
JP2008141401A (ja) * 2006-11-30 2008-06-19 Matsushita Electric Ind Co Ltd 画像符号化装置
US8135060B2 (en) 2006-11-30 2012-03-13 Panasonic Corporation Picture coding apparatus
JP2008172546A (ja) * 2007-01-12 2008-07-24 Hitachi Ltd 画像符号化・復号化装置
JP2010520714A (ja) * 2007-03-02 2010-06-10 クゥアルコム・インコーポレイテッド 第2のパスのビデオ符号化における効率的なビデオブロックのモード変更
US8594187B2 (en) 2007-03-02 2013-11-26 Qualcomm Incorporated Efficient video block mode changes in second pass video coding
JP2011035677A (ja) * 2009-07-31 2011-02-17 Canon Inc 動画像符号化装置、動画像符号化方法及びコンピュータプログラム

Also Published As

Publication number Publication date
US20060050786A1 (en) 2006-03-09

Similar Documents

Publication Publication Date Title
JP2006080925A (ja) 動画符号化装置、動画符号化方法および動画符号化プログラム
JP6526292B2 (ja) 符号化装置、復号装置、符号化方法、復号方法、及びプログラム
US10390034B2 (en) Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
KR20210148059A (ko) 비디오 신호 처리 방법 및 장치
JP5490823B2 (ja) 画像の系列を表すストリームを復号化する方法、画像の系列を符号化する方法及び符号化データ構造
JP5310614B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
JP5321426B2 (ja) 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法
JPWO2009041215A1 (ja) 動画像符号化装置及び動画像復号装置
JP2007267414A (ja) フレーム内画像符号化方法及びその装置
CN109644278B (zh) 动态图像解码装置、动态图像解码方法、动态图像编码装置、动态图像编码方法以及计算机可读存储介质
JP2010028220A (ja) 動きベクトル検出装置、動きベクトル検出方法、画像符号化装置及びプログラム
JP2014143650A (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
JP4227067B2 (ja) 動画像符号化方法と装置及びプログラム
JP6962193B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
JP4227168B2 (ja) 動画像符号化方法及び装置
JP5194039B2 (ja) イントラ予測装置、符号化器、復号器、及びプログラム
JP4227188B2 (ja) 動画像復号化方法及び装置
JP4227162B2 (ja) 動画像符号化方法及び装置
JP4227166B2 (ja) 動画像符号化方法及び装置
JP4227165B2 (ja) 動画像復号化方法及び装置
JP4227167B2 (ja) 動画像復号化方法及び装置
JP4227164B2 (ja) 動画像符号化方法及び装置
JP4227163B2 (ja) 動画像復号化方法及び装置
JP2014068251A (ja) 画像評価処理装置及びプログラム、並びに、動画像符号化装置及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080707

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081125