JP5136470B2 - 動画像符号化装置及び動画像符号化方法 - Google Patents

動画像符号化装置及び動画像符号化方法 Download PDF

Info

Publication number
JP5136470B2
JP5136470B2 JP2009053913A JP2009053913A JP5136470B2 JP 5136470 B2 JP5136470 B2 JP 5136470B2 JP 2009053913 A JP2009053913 A JP 2009053913A JP 2009053913 A JP2009053913 A JP 2009053913A JP 5136470 B2 JP5136470 B2 JP 5136470B2
Authority
JP
Japan
Prior art keywords
picture
pictures
coding
inter
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009053913A
Other languages
English (en)
Other versions
JP2010212785A (ja
Inventor
秀誠 三好
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2009053913A priority Critical patent/JP5136470B2/ja
Priority to US12/717,400 priority patent/US9185420B2/en
Publication of JP2010212785A publication Critical patent/JP2010212785A/ja
Application granted granted Critical
Publication of JP5136470B2 publication Critical patent/JP5136470B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

ここに開示される実施形態は、特定の画像を周期的にイントラ符号化し、その他の画像をインター符号化する動画像符号化装置及び動画像符号化方法に関する。
動画像データは、一般に非常に大きなデータ量を有する。そのため、動画像データを扱う装置は、動画像データを他の装置へ送信しようとする場合、あるいは、動画像データを記憶装置に記憶しようとする場合、動画像データを圧縮する。特に、動画像データの圧縮に使用される符号化方法として、イントラ符号化方法とインター符号化方法がある。イントラ符号化方法は、符号化対象の1枚のピクチャ内に含まれる情報のみを用いてそのピクチャを符号化する方法であり、フレーム内符号化方法あるいはピクチャ内符号化方法とも呼ばれる。一方、インター符号化方法は、符号化対象のピクチャと、その前後のピクチャの情報を用いて、符号化対象のピクチャを符号化する方法である。具体的には、インター符号化方法では、符号化対象のピクチャが複数のブロックに分割される。そして、各ブロックに対して、前後の既に符号化されたピクチャを復号したピクチャから、最も類似している領域が選択され、各ブロックとその選択された類似領域との差分情報が求められる。その後、その差分情報と、各ブロックがその類似領域から移動している量を表す動きベクトル情報とが符号化される。そのため、インター符号化方法は、冗長な情報を取り除くことができるので、イントラ符号化方法の圧縮効率よりも高い圧縮効率を達成することができる。
これに対し、イントラ符号化方法は、一般に、符号化されたデータからピクチャを復号することにより得られたピクチャと原ピクチャとの誤差を小さくできる。そのため、圧縮符号化された動画像データを再現する装置は、イントラ符号化方法により符号化されたデータから、鮮鋭度の高いピクチャを復号することができる。一方、インター符号化方法は、上記のように、前後のピクチャとの差分情報及び動きベクトル情報のみを符号化する。そのため、何れかのピクチャを符号化する際に誤差が含まれると、そのピクチャ以降の他のピクチャにも、その誤差が伝播してしまう。そこで、符号化誤差の伝播を抑制するために、一定周期ごとに、動画像データに含まれた連続する複数のピクチャのうち、何れか一つのピクチャをイントラ符号化し、その他のピクチャをインター符号化する符号化方法が提案されている。このような符号化方法は、例えば、Moving Picture Experts Group phase 2(MPEG-2)、MPEG-4、あるいはH.264 MPEG-4 Advanced Video Coding(H.264 MPEG-4 AVC)などの規格で採用されている。なお、この一定周期で繰り返される、連続する複数のピクチャを含み、各ピクチャに対する符号化方法が規定された構造はGroup Of Pictures(GOP)と呼ばれる。また、以下では、GOPに含まれるピクチャのうち、イントラ符号化されるピクチャをIピクチャと表記する。さらに、時間的に前のピクチャの情報を用いてインター符号化されるピクチャをPピクチャと表記する。さらに、時間的に前のピクチャと後のピクチャの両方の情報を用いてインター符号化されるピクチャをBピクチャと表記する。なお、ピクチャは、フレームまたはフィールドである。フレームは、動画像データ中の一つの静止画像であり、一方、フィールドは、フレームから奇数行のデータあるいは偶数行のデータのみを取り出すことにより得られる静止画像である。そして、奇数行のデータのみを有するフィールド及び偶数行のデータのみを有するフィールドを、本明細書では、それぞれ、トップフィールド及びボトムフィールドと呼ぶ。
さて、デジタル放送システムのように、動画像データの配信に関してリアルタイム性に対する要求が高いシステムでは、固定ビットレート(Constant Bit Rate、CBR)符号化方法が採用される。このCBR符号化方法は、符号化された動画像データに対して、単位時間ごとに固定ビット長を割り当てる符号化方法である。ここで、GOPの先頭に位置するIピクチャは、他のPピクチャまたはBピクチャをインター符号化するための基準となる。しかし、イントラ符号化方法の圧縮効率は、インター符号化方法の圧縮効率よりも低い。そのため、Iピクチャの符号化誤差が出来るだけ少なくなるように、Iピクチャに対してより多くの情報量、すなわち符号化ビット数が割り当てられる必要がある。そして、Iピクチャに多数の符号化ビットが割り当てられると、CBR符号化方法では単位時間ごとのビット数が決まっているため、GOP内のPピクチャ及びBピクチャに割り当て可能な符号化ビット数が少なくなる。
特に、リアルタイム性に対する要求が高いシステムは、動画像データの符号化による遅延を抑制するために、符号化のために前後のピクチャの情報を必要とするBピクチャを使用しないことも多い。そして、最も圧縮効率の高いBピクチャがGOPに含まれなければ、必然的にPピクチャに割り当てられる符号化ビット数が不十分となる。そのため、このCBR符号化方法により符号化された動画像データから復号されたPピクチャの鮮鋭度が低下してしまう。一方、上記のように、Iピクチャには十分な符号化ビット数が割り当てられているため、復号されたIピクチャは高い鮮鋭度を持つ。このPピクチャとIピクチャの鮮鋭度の差により、復号された動画像データに対する観察者の主観的な画質は低くなる。
このような問題に対して、動画像データにおいて高画質のピクチャと低画質のピクチャが交互に並んでいれば、動画像データに対する観察者の主観的な画質は、低画質のピクチャの存在にもかかわらず良好であることが報告されている。
吹抜、「鋭/鈍繰返し画像の時空間信号処理による解明」、平成19年10月、PCSJ2007/IMPS2007、No.P3-03
しかし、動きのあるシーンに対応するGOPでは、着目するピクチャに対して、時間的に近いピクチャほど類似していることが多い。そのため、インター符号化方法は、インター符号化するための基準となる参照ピクチャとして、時間的に最も近いピクチャを用いることにより、符号化誤差を少なくできる。ところが、GOPの先頭から、高画質のピクチャと低画質のピクチャが交互に並ぶように動画像データがインター符号化された場合、着目するピクチャに対して時間的に最も近いピクチャは、符号化により画質が大きく劣化してしまっている可能性がある。そのため、符号化誤差が大きくなってしまうおそれがある。特に、GOPの後半部分に含まれるPピクチャは、符号化誤差の累積による画質劣化が著しくなるので、GOPの後半部分に含まれるPピクチャと、その直後のIピクチャの画質の差が非常に大きくなる。そのため、復号された動画像データでは、GOP単位で発生するフリッカーノイズが顕著になってしまう。
そこで、本明細書は、GOP単位で発生するフリッカーノイズを抑制することにより、復号された動画像データに対する観察者の主観的な画質を改善可能な動画像符号化装置及び動画像符号化方法を提供することを目的とする。
一つの実施形態によれば、動画像符号化装置が提供される。この動画像符号化装置は、動画像データを取得する信号取得部と、動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、その動画像データを符号化する処理部とを有する。そして処理部は、インター符号化されるピクチャの位置が、ピクチャの組の先頭を基準として、ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第1の位置に対応する場合、インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第1の所定量を加算した値となり、インター符号化されるピクチャの位置が所定位置より後であり、且つ、第1の位置と異なる第2の位置である場合、その符号化ビット数がその基準値から第2の所定量を減算した値となるように、量子化パラメータを決定する情報量制御機能と、ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいはピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成機能と、予測誤差信号を直交変換することにより、周波数信号を生成する直交変換機能と、量子化パラメータに従って、周波数信号を量子化する量子化機能と、量子化された周波数信号を可変長符号化する符号化機能とを実現する。
また他の実施形態によれば、動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、その動画像データを符号化する動画像符号化方法が提供される。この動画像符号化方法は、インター符号化されるピクチャの位置が、ピクチャの組の先頭を基準として、ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第1の位置に対応する場合、インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第1の所定量を加算した値となり、インター符号化されるピクチャの位置が所定位置より後であり、且つ、第1の位置と異なる第2の位置である場合、その符号化ビット数がその基準値から第2の所定量を減算した値となるように、量子化パラメータを決定し、ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいはピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成し、予測誤差信号を直交変換することにより、周波数信号を生成し、量子化パラメータに従って、周波数信号を量子化し、量子化された周波数信号を可変長符号化することを含む。
さらに他の実施形態によれば、動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、コンピュータにインター符号化またはイントラ符号化させることにより、その動画像データを符号化させる動画像符号化用コンピュータプログラムが提供される。このコンピュータプログラムは、インター符号化されるピクチャの位置が、ピクチャの組の先頭を基準として、ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第1の位置に対応する場合、インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第1の所定量を加算した値となり、インター符号化されるピクチャの位置が所定位置より後であり、且つ、第1の位置と異なる第2の位置である場合、その符号化ビット数がその基準値から第2の所定量を減算した値となるように、量子化パラメータを決定する情報量制御機能と、ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいはピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成機能と、予測誤差信号を直交変換することにより、周波数信号を生成する直交変換機能と、量子化パラメータに従って、周波数信号を量子化する量子化機能と、量子化された周波数信号を可変長符号化する符号化機能とをコンピュータに実行させる命令を有する。
さらに他の実施形態によれば、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、その動画像データを符号化する動画像符号化回路が提供される。この動画像符号化回路は、インター符号化されるピクチャの位置が、ピクチャの組の先頭を基準として、ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第1の位置に対応する場合、インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第1の所定量を加算した値となり、インター符号化されるピクチャの位置が所定位置より後であり、且つ、第1の位置と異なる第2の位置である場合、その符号化ビット数がその基準値から第2の所定量を減算した値となるように、量子化パラメータを決定する情報量制御回路と、ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいはピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成回路と、予測誤差信号を直交変換することにより、周波数信号を生成する直交変換回路と、情報量制御回路により決定された量子化パラメータに従って、周波数信号を量子化する量子化回路と、量子化回路により量子化された周波数信号を可変長符号化する符号化回路とを有する。
本明細書に開示された動画像符号化装置及び動画像符号化方法は、GOP単位で発生するフリッカーノイズを抑制することにより、復号された動画像データに対する観察者の主観的な画質を改善することができるという効果を奏する。
一つの実施形態に係る動画像符号化装置の概略構成図である。 動画像符号化装置の処理部の機能ブロック図である。 ピクチャ情報量制御部の機能ブロック図である。 (a)は、GOPに対応するシーンが静止シーンである場合における、ピクチャ情報量決定部により決定された量子化パラメータに基づいて、GOP内の各ピクチャに割り当てられる符号化ビット数を示すグラフである。(b)は、GOPに対応するシーンが動きのあるシーンである場合における、ピクチャ情報量決定部により決定された量子化パラメータに基づいて、GOP内の各ピクチャに割り当てられる符号化ビット数を示すグラフである。 一つの実施形態に係る動画像符号化装置の処理部上で実行されるコンピュータプログラムにより制御される、ピクチャ情報量制御部によるPピクチャに対する量子化パラメータ決定処理の動作フローチャートである。 一つの実施形態に係る動画像符号化装置の処理部上で実行されるコンピュータプログラムにより制御される、動画像データの符号化処理の動作フローチャートである。
以下、図を参照しつつ、一つの実施形態による、動画像符号化装置について説明する。
この動画像符号化装置は、動画像データを、GOP単位で一定のビット長となるように符号化する。そして、この動画像符号化装置は、GOP内の連続するPピクチャに対して割り当てるビット数を交互に増減することにより、画質劣化が少ないピクチャの間隔を短くすることで、GOPごとのビットレートを一定に保ったまま、観察者の主観的な画質の向上を図る。
なお、以下に説明する実施形態では、GOPにはIピクチャとPピクチャのみが含まれ、Bピクチャは使用されないものとする。また、符号化対象となる動画像データに含まれるピクチャは、インターレース方式により取得されるトップフィールドまたはボトムフィールドである。しかし、符号化対象となる動画像データに含まれるピクチャは、プログレッシブ方式により取得されるフレームであってもよい。
図1は、一つの実施形態による動画像符号化装置1の概略構成図である。図1に示すように、動画像符号化装置1は、信号取得部11と、記憶部12と、処理部13と、出力部14とを有する。
信号取得部11は、符号化対象となる動画像データを取得する。そのために、信号取得部11は、例えば、動画像データを生成するビデオカメラ2と動画像符号化装置1を接続するビデオ入力インターフェースを有する。あるいは、信号取得部11は、他の装置から通信ネットワーク(図示せず)を介して動画像データを取得するために、動画像符号化装置1を通信ネットワークに接続するための通信インターフェース及びその制御回路を有する。例えば、信号取得部11は、イーサネット(登録商標)などの通信規格に従った通信ネットワークまたはIntegrated Services Digital Network(総合ディジタル通信網サービス、ISDN)に接続するための通信インターフェース及びその制御回路を有する。あるいは、信号取得部11は、ユニバーサル・シリアルバス2(Universal Serial Bus 2、USB2)などの近距離通信用の規格に従った通信インターフェース及びその制御回路を有してもよい。
そして信号取得部11は、記憶部12及び処理部13と接続される。信号取得部11により取得された動画像データは、処理部13に渡される。
出力部14は、処理部13により生成された、符号化された動画像データを含むデータストリームを他の装置に出力する。そのために、出力部14は、例えば、そのデータストリームを所定の信号形式に変換して無線発信する送信機及びその送信機に接続されたアンテナを有する。あるいは、出力部14は、動画像符号化装置1を通信ネットワーク(図示せず)に接続するための通信インターフェース及びその制御回路を有してもよい。また、この場合には、信号取得部11と出力部14は、一体的に形成されてもよい。
記憶部12は、例えば、半導体メモリ、磁気ディスク装置、または光ディスク装置のうちの少なくとも何れか一つを有する。そして記憶部12は、動画像符号化装置1で使用されるコンピュータプログラム及び各種のデータを記憶する。また記憶部12は、信号取得部11を介して受信した動画像データ、あるいは処理部13により符号化された動画像データを記憶してもよい。
処理部13は、1個または複数個のプロセッサと、メモリと、その周辺回路を有する。そして処理部13は、信号取得部11を介して取得した動画像データを符号化することにより、その動画像データのデータ量を圧縮する。
図2は、動画像データを符号化するために実現される機能を示す処理部13の機能ブロック図である。図2に示されるように、処理部13は、予測誤差信号生成部21と、直交変換部22と、量子化部23と、符号化部24と、逆量子化部25と、逆直交変換部26と、復号画像生成部27と、復号画像記憶部28と、動きベクトル計算部29と、インター予測画像生成部30と、イントラ予測画像生成部31と、予測画像選択部32と、ピクチャ情報量制御部33とを有する。処理部13が有する、復号画像記憶部28以外の各部は、処理部13が有するプロセッサ上で実行されるコンピュータプログラムによって実装される機能モジュールである。また復号画像記憶部28は、処理部13が有するメモリとすることができる。あるいは、処理部13が有するこれらの各部は、それぞれ別個の演算回路あるいはそれら演算回路が集積された一つの集積回路として動画像符号化装置1に実装されてもよい。
予測誤差信号生成部21は、入力された動画像データのうち、符号化対象となる現在のピクチャを、所定数のピクセルを持つ複数のブロックに分割する。このブロックを、以下ではマクロブロックと呼ぶ。また、マクロブロックは、例えば、16×16個のピクセルを含む。
予測誤差信号生成部21は、それぞれのマクロブロックと、予測画像選択部32から供給された予測画像との差分演算を実行する。そして予測誤差信号生成部21は、その差分演算により得られたマクロブロック内の各ピクセルに対応する差分値を、予測誤差信号として生成する。
予測誤差信号生成部21は、生成された予測誤差信号を直交変換部22に渡す。
直交変換部22は、予測誤差信号生成部21から得た、各マクロブロックの予測誤差信号を直交変換処理することにより、予測誤差信号の水平方向の周波数成分及び垂直方向の周波数成分を表す周波数信号を求める。例えば、直交変換部22は、直交変換処理として、離散コサイン変換(Discrete Cosine Transform、DCT)を予測誤差信号に対して実行することにより、周波数信号として、マクロブロックごとのDCT係数の組を得る。
直交変換部22は、直交変換処理によって得られた周波数信号を量子化部23に供給する。
量子化部23は、直交変換部22から受け取った周波数信号を、ピクチャ情報量制御部33によって決定された量子化パラメータにしたがって量子化する。この量子化処理は、一定区間に含まれる信号値を一つの信号値で表す処理である。そしてその一定区間は、量子化幅と呼ばれる。例えば、量子化部23は、直交変換部22から受け取った周波数信号から、量子化幅に相当する所定数の下位ビットを切り捨てることにより、その周波数信号を量子化する。量子化幅は、量子化パラメータによって決定される。例えば、量子化部23は、量子化パラメータの値に対する量子化幅の値を表す関数にしたがって、使用される量子化幅を決定する。またその関数は、量子化パラメータの値に対する単調増加関数とすることができ、予め設定される。あるいは、水平方向及び垂直方向の周波数成分のそれぞれに対応する量子化幅を規定する量子化マトリクスが、予め複数準備され、記憶部12に記憶される。そして量子化部23は、量子化パラメータにしたがって、記憶部12に記憶されたそれら量子化マトリクスのうちの特定の量子化マトリクスを選択する。そして量子化部23は、選択された量子化マトリクスを参照して、周波数信号の各周波数成分に対する量子化幅を決定する。この場合も、量子化部23は、量子化パラメータの値が大きくなるほど、各周波数成分に対する量子化幅が大きい量子化マトリクスを選択する。
量子化部23は、量子化処理を実行することにより、周波数信号の各周波数成分を表すために使用されるビットの数を削減できるので、各マクロブロックに含まれる情報量を低減できる。量子化部23は、量子化された信号を符号化部24及び逆量子化部25に供給する。
符号化部24は、量子化部23から受け取った量子化された信号及び動きベクトル計算部29から受け取った動きベクトルを符号化することにより、データ量が圧縮された符号化信号を生成する。そのために、符号化部24は、例えば、その量子化信号に対して、生起確率が高い信号値ほど短くなる、可変長の符号語を割り当てる可変長符号化処理を実行する。なお、可変長符号化処理は、エントロピー符号化処理とも呼ばれる。例えば、符号化部24は、可変長符号化処理として、ハフマン符号化処理あるいは算術符号化処理を行うことができる。
符号化部24により生成された符号化信号に対して、処理部13は、所定の情報をヘッダ情報として付加することにより、符号化された動画像データを含むデータストリームを生成する。処理部13は、そのデータストリームを記憶部12に記憶するか、あるいはそのデータストリームを出力部14を介して他の機器へ出力する。
逆量子化部25は、量子化部23から受け取った量子化信号に、量子化パラメータにより決定された量子化幅に相当する所定数を乗算することにより逆量子化する。この逆量子化により、各マクロブロックの周波数信号、例えば、DCT係数の組が復元される。そして逆量子化部25は、得られた周波数信号を逆直交変換部26に供給する。
逆直交変換部26は、逆量子化部25から受け取った周波数信号を逆直交変換処理する。例えば、直交変換部22においてDCT処理が行われる場合、逆直交変換部26は、逆量子化部25から受け取った信号を逆DCTする。これら逆量子化部25及び逆直交変換部26により、符号化前の予測誤差信号と同程度の情報を有する予測誤差信号が再生される。そして逆直交変換部26は、再生された予測誤差信号を復号画像生成部27に供給する。
復号画像生成部27は、インター符号化されるPピクチャについて、インター予測画像生成部30で動き補償された予測画像の各ピクセル値に、そのピクセルに対応する、逆量子化部25及び逆直交変換部26により再生された予測誤差信号を加算する。一方、復号画像生成部27は、イントラ符号化されるIピクチャについて、イントラ予測画像生成部31で生成された予測画像の各ピクセル値に、そのピクセルに対応する、逆量子化部25及び逆直交変換部26により再生された予測誤差信号を加算する。これらの処理を各マクロブロックについて実行することにより、復号画像生成部27は、動画像データの現在のピクチャに対する予測ピクチャを得る。
復号画像生成部27は、得られた予測ピクチャを復号画像記憶部28に渡す。
復号画像記憶部28は、復号画像生成部27から渡された予測ピクチャを新たな参照ピクチャとして一時的に記憶する。そして復号画像記憶部28は、イントラ予測画像生成部31、インター予測画像生成部30及び動きベクトル計算部29にその参照ピクチャを供給する。なお、復号画像記憶部28は、予め定められた所定枚数分の参照ピクチャを記憶し、参照ピクチャの枚数がその所定枚数を超えると、古い参照ピクチャから順に破棄する。
動きベクトル計算部29は、入力された動画像データの現在のピクチャの各マクロブロックと、復号画像記憶部28から得られる既に符号化された参照ピクチャを用いて、動きベクトルを求める。動きベクトルは、ブロック単位で、現在のピクチャのマクロブロックと、そのマクロブロックに最も類似する参照ピクチャのブロックとの空間的な移動量を表す。動きベクトル計算部29は、例えば、現在のピクチャの着目するマクロブロックと、各参照ピクチャとのブロックマッチングを実行することにより、各参照ピクチャの各位置についてマクロブロックに対するコストCを求める。コストCは、例えば、次式により求められる。
Figure 0005136470
ここで、CPiは、マクロブロックに含まれるピクセルのピクセル値を表す。また、PPiは、ブロックマッチングされる参照ピクチャの対応ピクセルのピクセル値を表す。そしてMは、マクロブロックに含まれるピクセルの総数である。動きベクトル計算部29は、そのコストCが最小となる、参照ピクチャのブロックを決定する。動きベクトル計算部29は、着目するマクロブロックの水平方向の位置と、求めた参照ピクチャのブロックの水平方向の位置の差を、水平方向の移動量MVxとする。同様に、動きベクトル計算部29は、着目するマクロブロックの垂直方向の位置と、求めた参照ピクチャのブロックの垂直方向の位置の差を、垂直方向の移動量MVyとする。そして動きベクトル計算部29は、水平方向の移動量MVx、垂直方向の移動量MVy及び選択された参照ピクチャを表す識別情報を、それぞれ要素とするベクトルを動きベクトルとする。
なお、後述するように、GOPの後半では、トップフィールドに対して割り当てられる符号化ビット数が、ボトムフィールドに対して割り当てられる符号化ビット数よりも多くなる。この場合、動きベクトル計算部29は、動きベクトルを求めるために参照される参照ピクチャもトップフィールドのみに限定することが好ましい。これにより、画質劣化の少ない参照ピクチャに基づいて動きベクトルを求めることができるので、動画像符号化装置1は、GOP内で伝播する符号化誤差を低減できる。
動きベクトル計算部29は、現在のピクチャに含まれる各マクロブロックに対して、それぞれ動きベクトルを求める。そして動きベクトル計算部29は、求めた動きベクトルをインター予測画像生成部30及びピクチャ情報量制御部33に渡す。
インター予測画像生成部30は、復号画像記憶部28から得た参照ピクチャを、動きベクトル計算部29から提供される動きベクトルに基づいて動き補償することにより、動き補償されたブロック単位の予測画像を生成する。なお、動き補償は、動きベクトルで表された、マクロブロックとそれに対して最も類似する参照ピクチャのブロックの位置ずれ量を相殺するように、その最も類似する参照ピクチャのブロックの位置を移動する処理である。
イントラ予測画像生成部31は、動画像データの現在のピクチャのうちの着目するマクロブロックについて、その着目マクロブロックの左側または上側に隣接する、既に符号化されたマクロブロックに含まれるピクセル値から補間によって予測画像を生成する。
予測画像選択部32は、イントラ予測画像生成部31とインター予測画像生成部30から出力された予測画像のうちの一方の予測画像を選択する。予測画像選択部32は、現在のピクチャがIピクチャであれば、イントラ予測画像生成部31により生成された予測画像を選択し、一方、現在のピクチャがPピクチャであれば、インター予測画像生成部30により生成された予測画像を選択する。なお、予測画像選択部32は、現在のピクチャがGOPの先頭ピクチャであれば、現在のピクチャはIピクチャであると判定できる。予測画像選択部32は、選択された予測画像を予測誤差信号生成部21に供給する。
ピクチャ情報量制御部33は、量子化部23が符号化されるピクチャに対して割り当てる符号化ビット数を制御するための量子化パラメータを決定する。
図3は、ピクチャ情報量制御部33が有する機能を示す機能ブロック図である。図3に示されるように、ピクチャ情報量制御部33は、ピクチャ動き量算出部331と、動き判定部332と、ピクチャ情報量決定部333とを有する。
ピクチャ動き量算出部331は、現在のピクチャがPピクチャである場合、現在のピクチャが動きのあるシーンに対応するか否かを判定するための指標であるピクチャ動き量として、各マクロブロックの移動量の絶対値に関する統計量を算出する。そこで、ピクチャ動き量算出部331は、動きベクトル計算部29から受け取った、現在のピクチャの各マクロブロックに対応する動きベクトルの水平方向の移動量MVxの絶対値を累積加算することにより、累積水平移動量SMVx(=Σ|MVx|)を算出する。また、ピクチャ動き量算出部331は、現在のピクチャの各マクロブロックに対応する動きベクトルの垂直方向の移動量MVyの絶対値を累積加算することにより、累積垂直移動量SMVy(=Σ|MVy|)を算出する。なお、ピクチャ動き量算出部331は、各マクロブロックの水平方向の移動量MVx及び垂直方向の移動量MVyを、対応する参照ピクチャと現在のピクチャの時間差で割った値の絶対値を累積加算することにより、SMVx、SMVyを算出してもよい。この参照ピクチャと現在のピクチャの時間差は、参照ピクチャのGOP内の位置と現在のピクチャのGOP内の位置との差に相当する枚数として表される。
そしてピクチャ動き量算出部331は、累積水平移動量SMVx及び累積垂直移動量SMVyを、それぞれ現在のピクチャに含まれるマクロブロックの総数MBNで割ることにより、水平平均移動量AvMVx(=SMx/MBN)及び垂直平均移動量AvMVy(=SMy/MBN)を求める。最後に、ピクチャ動き量算出部331は、次式にしたがってピクチャ動き量PMVを算出する。
Figure 0005136470
ただし、α及びβは、それぞれ係数である。動画像符号化装置1が垂直方向の動きを検出したい場合、例えば、αは0、βは1に設定される。また、動画像符号化装置1が水平方向の動きを検出したい場合、例えば、αは1、βは0に設定される。
また、ピクチャ動き量算出部331は、ピクチャ動き量PMVを求めるために、現在のピクチャの各マクロブロックに対応する動きベクトルの水平方向の移動量MVxの絶対値の最頻値MMVx、及び垂直方向の移動量MVyの絶対値の最頻値MMVyをそれぞれ求めてもよい。そしてピクチャ動き量算出部331は、上記の(2)式におけるAvMVx、AvMVyを、その最頻値MMVx、MMVyで置換することにより、ピクチャ動き量PMVを算出してもよい。さらに、ピクチャ動き量算出部331は、ピクチャ動き量PMVを求めるために、現在のピクチャの各マクロブロックに対応する動きベクトルの水平方向の移動量MVxの絶対値の中央値CMVx、及び垂直方向の移動量MVyの絶対値の中央値CMVyをそれぞれ求めてもよい。そしてピクチャ動き量算出部331は、上記の(2)式におけるAvMVx、AvMVyを、その中央値CMVx、CMVyで置換することにより、ピクチャ動き量PMVを算出してもよい。
ピクチャ動き量算出部331は、算出されたピクチャ動き量PMVを動き判定部332に渡す。
動き判定部332は、ピクチャ動き量算出部331から受け取ったピクチャ動き量PMVを、所定の閾値Thmvと比較する。そして動き判定部332は、ピクチャ動き量PMVが閾値Thmvよりも大きい場合、現在のピクチャは、動きのあるシーンに対応するピクチャであると判定する。一方、動き判定部332は、ピクチャ動き量PMVが閾値Thmv以下であれば、現在のピクチャは、静止シーンに対応するピクチャであると判定する。なお、閾値Thmvは、検出したい動きの大きさに応じて設定される。例えば、上記の(2)式において、αとβのうちの何れか一方が1であり、他方が0である場合、閾値Thmvは1に設定される。
動き判定部332は、現在のピクチャが動きのあるシーンに対応するピクチャか否かの判定結果を示す動き判定情報を、ピクチャ情報量決定部333に通知する。
ピクチャ情報量決定部333は、動き判定部332から通知された動き判定情報及び現在のピクチャのGOP内の位置に基づいて、現在のピクチャに対する量子化パラメータの値を決定する。ここで、ピクチャ情報量決定部333は、動き判定情報が、現在のピクチャが静止シーンに対応するピクチャであることを示していれば、GOPに含まれる全てのPピクチャに対して同一の符号化ビット数が割り当てられるように量子化パラメータ値を決定する。一方、ピクチャ情報量決定部333は、動き判定情報が現在のピクチャが動きのあるシーンに対応するピクチャであることを示していれば、現在のピクチャのGOP内の位置または画質劣化度に応じて符号化ビット数が調整されるように量子化パラメータ値を決定する。特に、ピクチャ情報量決定部333は、現在のピクチャがトップフィールドであれば、割り当てられる符号化ビット数が多く、現在のピクチャがボトムフィールドであれば、割り当てられる符号化ビット数が少なくなるように量子化パラメータを決定する。
そこで、ピクチャ情報量決定部333は、例えば、MPEG-2の標準テストモデル5において採用されている方法に沿って、Iピクチャ、Pピクチャの基本目標情報量Ti、Tpを求める。さらにピクチャ情報量決定部333は、Pピクチャに対する補正情報量ΔTを求める。そして、ピクチャ情報量決定部333は、基本目標情報量Ti、Tp及びΔTに基づいて、目標情報量Tを算出する。そしてピクチャ情報量決定部333は、目標情報量Tの値に応じた量子化パラメータQi、Qpを求める。なお、MPEG-2の標準テストモデル5に関する量子化パラメータQi、Qpの算出方法に関しては、http://www.mpeg.org/MPEG/MSSG/tm5/Ch10/Ch10.htmlで特定されるURLを参照されたい。なお、ピクチャ情報量決定部333は、目標情報量Tの値が大きいほど、量子化パラメータQi、Qpの値が小さくなるような決定方法であれば、他の量子化パラメータの決定方法を採用してもよい。例えば、ピクチャ情報量決定部333は、特開2008−252562号公報に開示されているような、目標情報量と量子化パラメータの関係を表すレート歪関数を用いて量子化パラメータを決定してもよい。
具体的には、ピクチャ情報量決定部333は、先ず、現在のピクチャに対して推定される複雑度を計算する。各ピクチャに対する複雑度は、次式により算出される。
Figure 0005136470
ここで、Xiは、Iピクチャに対する複雑度であり、Xpは、Pピクチャに対する複雑度である。また、Si、Spは、それぞれ、既に符号化された直前のピクチャについて、符号化により発生したビット数である。また、Qi、Qpは、それぞれ、前のピクチャを符号化する際に使用された、全てのマクロブロックの量子化パラメータを平均することにより算出される平均量子化パラメータである。なお、Xi、Xpの初期値は例として以下のように設定される。
Xi = (160 * bitrate) / 115
Xp = (60 * bitrate) / 115
ただし、bitrateは、符号化に与えられた1秒あたりの情報量(bit/s)である。
次に、ピクチャ情報量決定部333は、算出された複雑度Xi、Xpに基づいて、次式に従って基本目標情報量Ti、Tpを算出する。
Figure 0005136470
ここで、Kp、Kbは定数であり、一般にKp=1.0, Kb=1.4に設定される。またRは、GOPに割り当て可能なビット数の残量である。Rは、各ピクチャの符号化が完了した後、次のように更新される。
R = R-Si またはR = R-Sp
なお、Si、Spは、それぞれ、既に符号化された直前のピクチャについて、符号化により発生したビット数である。また、GOPの最初のピクチャ、すなわち、Iピクチャを符号化する際に、ビット数の残量Rは、前のGOPについて計算されたビット数の残量Rpを用いて次のように更新される。
R = G + Rp
G = bitrate * N / picturerate
ただしNは、GOPに含まれるピクチャの枚数である。なお、動画像データの最初のGOPに対して、Rは0に設定される。さらに、picturerateは、符号化対象の動画像データにおいて、1秒間に走査されるフレームの枚数(Hz)である。
また(4)式において、Np、Nbは、それぞれ、符号化順序における、GOP内の符号化されていない残りPピクチャとBピクチャの枚数である。本実施形態では、GOPにはBピクチャが含まれていないので、Nb=0である。また、関数max(a,b)は、変数aとbのうちの大きい方の値を出力する関数である。
さらに、ピクチャ情報量決定部333は、GOP内で所定の位置よりも後にあるPピクチャに対して割り当てる符号化ビット数が交互に増減するように、補正情報量ΔTを用いて目標情報量を調整する。その所定の位置は、各ピクチャに対して均等に符号化ビット数が割り当てられた場合に、インター符号化による符号化誤差が観察者の主観的画質の劣化に及ぼす影響が許容範囲内に収まると想定される位置のうち、最も後ろ側の位置とすることが好ましい。これにより、ピクチャ情報量決定部333は、符号化ビット数が均等に割り当てられるGOPの前半部分では、現在のピクチャと時間的に最も近い参照ピクチャも一定以上の画質を有するので、インター符号化により発生する符号化誤差を最小限に抑制できる。一方、ピクチャ情報量決定部333は、符号化誤差がある程度以上増加したGOPの後半部分では、符号化誤差がそれ以上増加しないPピクチャを1枚おきに作成できる。
そのために、ピクチャ情報量決定部333は、GOP内の符号化されていないPピクチャの枚数Npを閾値ThNと比較することにより、現在のピクチャが、GOPの後半部分に含まれるか否か判定する。なお、閾値ThNは、上記の所定位置に対応する値、例えばN/2に設定される。そして符号化されていないPピクチャの枚数Npが閾値ThNよりも少ない場合、すなわち、現在のピクチャがGOPの後半部分に含まれる場合、ピクチャ情報量決定部333は補正情報量ΔTを算出する。そしてピクチャ情報量決定部333は、現在のピクチャがトップフィールドであれば、(4)式により算出された基本目標情報量Tpに補正情報量ΔTを加えた値を、現在のピクチャに対する目標情報量Tとする。一方、ピクチャ情報量決定部333は、現在のピクチャがボトムフィールドであれば、(4)式により算出された基本目標情報量Tpから補正情報量ΔTを引いた値を、現在のピクチャに対する目標情報量Tとする。
ただし、補正情報量ΔTは、例えば、次式により算出される。
Figure 0005136470
ここでkは係数である。kの値は、例えば、GOP内のPピクチャのうち、トップフィールドのPピクチャの画質が一定となるように設定されることが好ましい。さらに、kの値は、例えば、ボトムフィールドのPピクチャに対する符号化ビット数が、GOP内にBピクチャが含まれるとした場合に、そのBピクチャに割り当てられる符号化ビット数以上となるように設定されることが好ましい。なお、復号されたピクチャの画質は、例えば、復号画像記憶部28に記憶されている参照ピクチャとその参照ピクチャに対応する原ピクチャとからPeak Signal To Noise Rate(PSNR)を算出することにより評価される。
また、ボトムフィールドに割り当てられる符号化ビット数を、Bピクチャに割り当てられる符号化ビット数以上となるようにするためには、目標情報量TがBピクチャに対する基本目標情報量Tb以上となればよい。ここでBピクチャに対する基本目標情報量Tbは、次式で与えられる。
Figure 0005136470
ただし、この場合、Np、Nbは、GOPでは、Iピクチャの後、2枚のBピクチャと1枚のPピクチャが繰り返し配置されると仮定することにより決定される。またXbは、Xi、Xpと同様に、SbとQbの積で与えられる。Sbは、既に符号化された直前のピクチャについて、符号化により発生したビット数であり、Qbは、前のピクチャを符号化する際に使用された、全てのマクロブロックの量子化パラメータを平均することにより算出される平均量子化パラメータである。
また(5)式から明らかなように、補正情報量ΔTは、Npが少なくなるほど大きな値となる。すなわち、現在のピクチャがGOPの終端に近いほど、補正情報量ΔTは大きな値となる。したがって、ピクチャ情報量決定部333は、GOPの終端に近いトップフィールドほど、大きな符号化ビット数を割り当てることができる。
次に、ピクチャ情報量決定部333は、目標情報量Tに基づいて量子化パラメータを決定する。そのために、ピクチャ情報量決定部333は、j番目のマクロブロックを符号化する前の、適当な仮想バッファの充足度dij、dpjを算出する。その充足度dij、dpjは次式に従って計算される。
Figure 0005136470
ここで、Bj-1は、1番目から(j-1)番目までの全てのマクロブロックを符号化することにより生成されたビット数である。MBNは、ピクチャに含まれるマクロブロックの数である。また、di0、dp0は、充足度の初期値である。なお、特定のピクチャについて、最後のマクロブロックまで符号化したときの充足度diMBN、dpMBNは、次の同じタイプのピクチャに対する充足度の初期値di0、dp0となる。
最後に、ピクチャ情報量決定部333は、この充足度dij、dpjを用いて、次式により、j番目のマクロブロックに対する量子化パラメータを決定する。
Figure 0005136470
ただし、djは、現在のピクチャがIピクチャであればdij、現在のピクチャがPピクチャであればdpjである。
ピクチャ情報量決定部333は、求めた量子化パラメータを、量子化部23に渡す。
図4(a)は、GOPに対応するシーンが静止シーンである場合における、ピクチャ情報量決定部333により決定された量子化パラメータに基づいて、GOP内の各ピクチャに割り当てられる符号化ビット数を示すグラフである。また、図4(b)は、GOPに対応するシーンが動きのあるシーンである場合における、ピクチャ情報量決定部333により決定された量子化パラメータに基づいて、GOP内の各ピクチャに割り当てられる符号化ビット数を示すグラフである。
図4(a)及び(b)において、横軸は時間を表し、縦軸は情報量、すなわちピクチャに割り当てられる符号化ビット数を表す。また、図4(a)において、棒グラフ401及び402は、GOPの先頭に位置するIピクチャに割り当てられる符号化ビット数を表す。またその他の各棒グラフ403は、それぞれ一つのPピクチャに割り当てられる符号化ビット数を表す。同様に、図4(b)において、棒グラフ411及び412は、GOPの先頭に位置するIピクチャに割り当てられる符号化ビット数を表す。またその他の各棒グラフ413は、それぞれ一つのPピクチャに割り当てられる符号化ビット数を表す。さらに、各棒グラフの下に示された「T」、「B」は、それぞれ、その棒グラフに対応するピクチャがトップフィールドまたはボトムフィールドであることを表す。
図4(a)から分かるように、GOPが静止シーンに対応する場合、Iピクチャに割り当てられる符号化ビット数は、何れのPピクチャに割り当てられる符号化ビット数よりも多く、一方、各Pピクチャに割り当てられる符号化ビット数は一定となる。静止シーンでは、連続するPピクチャ間の誤差が小さいため、各Pピクチャを符号化するために必要な情報量は少なくてよい。そのため、各Pピクチャに対して均等に符号化ビット数を割り当てることにより、動画像符号化装置1は、全てのPピクチャの画質劣化を抑制できる。
一方、図4(b)から分かるように、GOPが動きのあるシーンに対応する場合、GOP内の後半部分では、Pピクチャに割り当てられる符号化ビット数が交互に増減する。そして特に、GOPの後端に近づくほど、トップフィールドのPピクチャに割り当てられる符号化ビット数が増加する。逆に、GOPの後端に近づくほど、ボトムフィールドのPピクチャに割り当てられる符号化ビット数が減少する。そのため、Iピクチャと同じフィールドであるPピクチャには、より多くの情報量が割り当てられるので、トップフィールドのPピクチャの画質劣化が抑制される。そのため、トップフィールドのPピクチャの画質と、次のGOPの先頭に位置するIピクチャの画質の差が小さくなるので、画像符号化装置1は、フリッカーの発生を抑制できる。なお、ボトムフィールドのPピクチャの画質は劣化してしまうが、上述したように、画質の良好なピクチャと画質がよくないピクチャが交互に並んでいれば、観察者の主観的な画質は劣化しない。
図5は、処理部13上で実行されるコンピュータプログラムにより制御される、処理部13のピクチャ情報量制御部33によるPピクチャに対する量子化パラメータ決定処理の動作フローチャートを示す。
まず、ピクチャ情報量制御部33のピクチャ動き量算出部331は、動きベクトル計算部29から受け取った、各マクロブロックの動きベクトルから、ピクチャ動き量PMVを算出する(ステップS101)。そしてピクチャ動き量算出部331は、ピクチャ動き量PMVをピクチャ情報量制御部33の動き判定部332に渡す。
次に、動き判定部332は、ピクチャ動き量算出部331から受け取ったピクチャ動き量PMVが所定の閾値Thmvよりも大きいか否か判定する(ステップS102)。ピクチャ動き量PMVが所定の閾値Thmv以下である場合(ステップS102−No)、動き判定部332は、現在のピクチャは静止シーンに対応するピクチャであると判定する。そして動き判定部332は、現在のピクチャが静止シーンに対応するピクチャであるとの判定結果を示す動き判定情報を、ピクチャ情報量制御部33のピクチャ情報量決定部333に通知する。
ピクチャ情報量決定部333は、上記の(3)式及び(4)式に従って、Pピクチャに対する基本目標情報量Tpを算出する。そしてピクチャ情報量決定部333は、算出した基本目標情報量Tpを目標情報量Tに設定する(ステップS109)。その後、処理部13は、制御をステップS110へ移行する。
一方、ステップS102において、ピクチャ動き量PMVが所定の閾値Thmvよりも大きい場合(ステップS102−Yes)、動き判定部332は、現在のピクチャは、動きのあるシーンに対応するピクチャであると判定する。そして動き判定部332は、現在のピクチャが動きのあるシーンに対応するピクチャであるとの判定結果を示す動き判定情報を、ピクチャ情報量決定部333に通知する。
ピクチャ情報量決定部333は、上記の(3)式及び(4)式に従って、Pピクチャに対する基本目標情報量Tpを算出する(ステップS103)。次に、ピクチャ情報量決定部333は、GOP内の符号化されていないPピクチャの枚数Npが閾値ThNよりも小さいか否か判定する(ステップS104)。そのPピクチャの枚数Npが閾値ThN以上である場合(ステップS104−No)、処理部13は、制御をステップS109へ移行する。一方、そのPピクチャの枚数Npが閾値ThNよりも小さい場合(ステップS104−Yes)、ピクチャ情報量決定部333は、上記の(5)式に従って、補正情報量ΔTを算出する(ステップS105)。
その後、ピクチャ情報量決定部333は、現在のピクチャのフィールドがIピクチャのフィールドと同一か否か判定する(ステップS106)。現在のピクチャのフィールドがIピクチャのフィールドと同一であれば(ステップS106−Yes)、ピクチャ情報量決定部333は、基本目標情報量Tpに補正情報量ΔTを加えた値を目標情報量Tとする(ステップS107)。なお、IピクチャはGOPの先頭に位置するので、現在のピクチャがトップフィールドであれば、現在のピクチャのフィールドとIピクチャのフィールドは同一となる。
一方、現在のピクチャのフィールドがIピクチャのフィールドと異なっていれば(ステップS106−No)、ピクチャ情報量決定部333は、基本目標情報量Tpから補正情報量ΔTを引いた値を目標情報量Tとする(ステップS108)。
ステップS107〜S109の何れかによって目標情報量Tが決定されると、ピクチャ情報量決定部333は、(7)式及び(8)式に従って、その目標情報量Tを用いて量子化パラメータを決定する(ステップS110)。ピクチャ情報量決定部333は、求められた量子化パラメータを量子化部23に渡す。
その後ピクチャ情報量制御部33は、Pピクチャに対する量子化パラメータの決定処理を終了する。
なお、Iピクチャに対する量子化パラメータについては、ピクチャ情報量制御部33は、上記の(3)式及び(4)式に従って基本目標情報量Tiを算出する。そしてピクチャ情報量制御部33は、(7)式及び(8)式に従って、その基本目標情報量Tiを用いて量子化パラメータを決定すればよい。
図6は、動画像符号化装置1の処理部13上で実行されるコンピュータプログラムにより制御される、動画像データの符号化処理の動作フローチャートを示す。なお、図6に示されたフローチャートは、1枚のピクチャの各マクロブロックに対する処理を表す。動画像符号化装置1は、符号化対象となる動画像データが連続している間、ピクチャごとに図6に示された符号化処理の手順を繰り返し実行する。
図6に示されるように、動画像符号化装置1が信号取得部11を介して動画像データを取得すると、処理部13は符号化処理を開始する。そして処理部13は、現在のピクチャがIピクチャであるか否か判定する(ステップS201)。現在のピクチャがIピクチャである場合(ステップS201−Yes)、処理部13のイントラ予測画像生成部31は、符号化対象となるマクロブロックに隣接する既に符号化されたマクロブロックから、予測画像を作成する(ステップS202)。イントラ予測画像生成部31は、作成された予測画像を処理部13の予測画像選択部32に渡す。そして、予測画像選択部32は、イントラ予測画像生成部31により作成された、隣接するマクロブロックに基づく予測画像を選択し、選択された予測画像を処理部13の予測誤差信号生成部21に渡す(ステップS203)。
一方、ステップS201において、現在のピクチャがPピクチャである場合(ステップS201−No)、処理部13の動きベクトル計算部29は、マクロブロックの動きベクトルを算出する(ステップS204)。動きベクトル計算部29は、上述したように、マクロブロックと復号画像記憶部28に記憶されている参照ピクチャとのブロックマッチングにより、動きベクトルを算出できる。なお、ステップS204の処理に関して、動きベクトル計算部29は、最初のマクロブロックについての符号化処理を実行する際に、現在のピクチャに含まれる全てのマクロブロックについて動きベクトルを算出する。これは、ステップS209における量子化パラメータの決定処理において、全てのマクロブロックの動きベクトルが使用されるためである。その代わりに、2番目以降のマクロブロックに関しては、処理部13は、ステップS204の処理を省略する。動きベクトル計算部29は、算出された動きベクトルを、処理部13のインター予測画像生成部30、ピクチャ情報量制御部33及び符号化部24にそれぞれ渡す。
次に、インター予測画像生成部30は、参照ピクチャを動きベクトルで動き補償することにより、予測画像を作成する(ステップS205)。インター予測画像生成部30は、作成された予測画像を予測画像選択部32に渡す。そして、予測画像選択部32は、インター予測画像生成部30により作成された、前のピクチャに基づく予測画像を選択し、選択された予測画像を予測誤差信号生成部21に渡す(ステップS206)。
ステップS205またはS206の後、予測誤差信号生成部21は、符号化対象のマクロブロックと予測画像との差分により、予測誤差信号を生成する(ステップS207)。そして予測誤差信号生成部21は、生成された予測誤差信号を処理部13の直交変換部22に渡す。直交変換部22は、受け取った予測誤差信号を直交変換処理することにより、周波数信号を算出する(ステップS208)。直交変換部22は、この周波数信号を処理部13の量子化部23に渡す。
一方、ピクチャ情報量制御部33は、動きベクトル計算部29から受け取った動きベクトルに基づいて、量子化パラメータを決定する(ステップS209)。ピクチャ情報量制御部33は、現在のピクチャがPピクチャである場合、図5のフローチャートに示された手順に従って、量子化パラメータを決定する。そしてピクチャ情報量制御部33は、量子化パラメータを量子化部23に渡す。
量子化部23は、ピクチャ情報量制御部33から受け取った量子化パラメータに従って、直交変換部22から受け取った周波数信号を量子化する(ステップS210)。そして量子化部23は、量子化された周波数信号を処理部13の符号化部24及び逆量子化部25に渡す。
符号化部24は、量子化された周波数信号を可変長符号化することにより、符号化対象であるマクロブロックについての符号化された信号を生成する(ステップS211)。そして符号化部24は、その符号化された信号を出力する。
一方、逆量子化部25は、量子化された周波数信号を逆量子化することにより、周波数信号を算出する(ステップS212)。そして逆量子化部25は、算出された周波数信号を処理部13の逆直交変換部26に渡す。逆直交変換部26は、逆量子化部25から受け取った周波数信号を逆直交変換することにより、符号化対象のマクロブロックについての予測誤差信号を再生する(ステップS213)。そして逆直交変換部26は、再生された予測誤差信号を処理部13の復号画像生成部27に渡す。復号画像生成部27は、予測誤差信号を算出する際に用いられた予測画像に、再生された予測誤差信号を加算することにより、ブロック単位で参照ピクチャを生成する(ステップS214)。復号画像生成部27は、その参照ピクチャを、処理部13の復号画像記憶部28に記憶する。
処理部13は、上記の処理を繰り返して、各ピクチャのマクロブロックごとに符号化された信号を生成する。そして処理部13は、所定のヘッダ情報をその符号化された信号に付すとともに、所定の形式に沿ってその符号化された信号を配列することにより、符号化された動画像データを含むデータストリームを作成する。
なお、動画像符号化装置1により符号化された動画像データは、例えば、H.264 MPEG-4 AVCに準拠するデータとすることができる。そのため、動画像符号化装置1により符号化された動画像データは、従来の動画像復号装置により復号することができる。
以上に説明してきたように、この動画像符号化装置は、GOP内の後半部に位置するPピクチャに対して割り当てられる符号化ビット数を、Iピクチャと同じフィールドのPピクチャに対して多く、Iピクチャと異なるフィールドのPピクチャに対して少なくする。これにより、この動画像符号化装置は、画質劣化が少ないPピクチャを1枚おきに作成できるので、GOP全体のビットレートを一定に保ったまま、観察者の主観的な画質を向上することができる。また、Pピクチャの画質劣化が比較的少ないGOPの前半部分では、予測誤差信号生成のために、トップフィールドとボトムフィールドのどちらを参照ピクチャとしても、誤差が小さくて済む。そのため、この動画像符号化装置は、GOP内の後半部に限定してそのような割り当て符号化ビット数を調整することにより、GOP内の前半部分で発生する誤差を抑制しつつ、符号化誤差が大きくなる後半部分では、それ以上画質が劣化することを防止できる。そのため、この動画像符号化装置は、Iピクチャと同じフィールドのPピクチャと、次のGOPの先頭に位置するIピクチャとの間で画質が急激に変化することを抑制できる。
したがって、この動画像符号化装置は、この動画像符号化装置により符号化された動画像データから復号された復号動画像データにおけるフリッカーの発生を抑制することができる。
なお、本発明は上記の実施形態に限定されるものではない。例えば、処理部は、図6に示したフローチャートにおける、ステップS209の処理と、ステップS202、S203若しくはステップS205、S206及びステップS207、S208の処理の順序を入れ替えてもよい。さらに、処理部は、図6に示したフローチャートにおける、ステップS211の処理と、ステップS212〜S214の処理の順序を入れ替えてもよい。
また、ピクチャ情報量制御部は、補正情報量ΔTを使用して目標情報量Tを増減するか否かの判定基準として、参照ピクチャとその参照ピクチャに対応する原ピクチャとから計算されるPSNRを用いてもよい。この場合、図5に示されたフローチャートのステップS104において、ピクチャ情報量制御部は、残りPピクチャの枚数Npを所定の閾値ThNと比較する代わりに、現在のピクチャの一つ前のピクチャについて求めたPSNRが所定の閾値Thpよりも低いか否かを判定する。そしてピクチャ情報量制御部は、PSNRがその閾値Thpよりも低い場合、ステップS105以降の処理を実行し、一方、PSNRがその閾値Thp以上である場合、ステップS109の処理を実行する。
なお、PSNRは、例えば、次式に従って算出される。
Figure 0005136470
ただし、Npixは、ピクチャに含まれる総ピクセル数である。またpiは、原ピクチャのi番目のピクセルのピクセル値を表す。一方、p'iは、原ピクチャに対応する、復号画像記憶部に記憶された参照ピクチャのi番目のピクセルのピクセル値を表す。
また、閾値Thpは、着目するGOP内の各ピクチャを観察者が動画像として見た時に、そのGOPのIピクチャの画質と比較して、Pピクチャの画質が劣化したことに気付かないPSNR値の最小値に設定されることが好ましい。例えば、閾値Thpは、着目するGOPのIピクチャについて算出されたPSNR値に、0.7あるいは0.8を乗じた値とすることができる。
さらに、ピクチャ情報量制御部は、補正情報量ΔTを一定としてもよい。例えば、ピクチャ情報量制御部は、(5)式において、符号化されていない残りPピクチャの枚数にかかわらず、Np=0として、補正情報量ΔTを求めてもよい。
また、ピクチャ情報量制御部は、動きのないシーンに対応するGOPについても、画質劣化が少ないPピクチャが1枚おきに並ぶように、量子化パラメータを決定してもよい。この場合、ピクチャ情報量制御部は、図5に示されたフローチャートのステップS101及びS102の処理を省略する。すなわち、ピクチャ情報量制御部は、ピクチャが動きのあるシーンに対応するピクチャか否かの判定結果によらず、目標情報量Tを決定してもよい。この場合には、ピクチャ動き量算出部及び動き判定部は省略されるので、ピクチャ情報量制御部は、量子化パラメータを算出するための演算量を少なくすることができる。
さらに、符号化ビット数が多く割り当てられるPピクチャの周期は、1枚おきに限定されない。ピクチャ情報量制御部は、観察者の主観的画質の低下が許容できる範囲で、符号化ビット数が多く割り当てられるPピクチャの周期を設定できる。例えば、ピクチャ情報量制御部は、連続する3枚のPピクチャのうちの1枚に対する目標情報量T1を大きくし、その他の2枚に対する目標情報量T2を小さくしてもよい。この場合、ピクチャ情報量制御部は、目標情報量T1を、Pピクチャに対する基本目標情報量Tpに、(5)式に基づいて求められた補正情報量ΔTを加算した値とする。一方、ピクチャ情報量制御部は、目標情報量T2を、Pピクチャに対する基本目標情報量Tpから(5)式に基づいて求められた補正情報量ΔTの1/2を引いた値とする。またピクチャ情報量制御部は、連続する3枚のPピクチャのうちの2枚に対する目標情報量T1を大きくし、その他の1枚に対する目標情報量T2を小さくしてもよい。この場合には、ピクチャ情報量制御部は、目標情報量T1を、基本目標情報量Tpに、(5)式に基づいて求められた補正情報量ΔTの1/2を加算した値とする。一方、ピクチャ情報量制御部は、目標情報量T2を、基本目標情報量Tpから(5)式に基づいて求められた補正情報量ΔTを引いた値とする。
このように、符号化ビット数が多く割り当てられるPピクチャの周期が1枚おきでない場合、ピクチャ情報量制御部は、図5に示されたフローチャートのステップS106では、現在のピクチャのGOP内の位置が、GOP内のピクチャの枚数よりも短い所定の周期に対応する位置か否か判定する。
また、符号化される動画像データに含まれる各ピクチャがフレームである場合も、ピクチャ情報量制御部は、図5に示されたフローチャートのステップS106では、現在のピクチャのGOP内の位置が、GOP内の上記の所定の周期に対応する位置か否か判定すればよい。そして現在のピクチャのGOP内の位置がその所定周期に対応する位置であれば、ピクチャ情報量制御部はステップS107の処理を実行する。一方、現在のピクチャのGOP内の位置がその所定周期に対応する位置でなければ、ピクチャ情報量制御部はステップS108の処理を実行する。
また、この画像符号化装置により符号化される動画像データのGOPは、Bピクチャを含んでいてもよい。例えば、GOPが連続する2枚のBピクチャと1枚のPピクチャを含むピクチャの組を複数有する場合には、ピクチャ情報量制御部は、何れか一方のBピクチャの目標情報量を所定量だけ低下させ、他方のBピクチャの目標情報量をその所定量だけ増加させてもよい。この場合、所定量は、例えば、(6)式により求められるBピクチャに対する基本目標情報量Tbの10%あるいは20%とすることができる。
この画像符号化装置は、様々な用途に利用される。例えば、この画像符号化装置は、ビデオカメラ、映像伝送装置、テレビ電話システム、コンピュータあるいは携帯電話機に組み込まれる。例えば、この画像符号化装置が映像伝送装置に組み込まれる場合、この動画像符号化装置により作成された、符号化された動画像データは、その処理部により、音声信号等、動画像データと同時に取得される他の信号とともに、所定の通信規格に従ったデータストリームに変換される。そして画像符号化装置を組み込んだ映像伝送装置は、そのデータストリームを、出力部に接続されたアンテナを介して、あるいは通信回線を介して、遠隔地に設置された動画像復号装置へ伝送する。
以上のように、当業者は、本発明の範囲内で、実施される形態に合わせて様々な変更を行うことができる。
1 動画像符号化装置
11 信号取得部
12 記憶部
13 処理部
14 出力部
21 予測誤差信号生成部
22 直交変換部
23 量子化部
24 符号化部
25 逆量子化部
26 逆直交変換部
27 復号画像生成部
28 復号画像記憶部
29 動きベクトル計算部
30 インター予測画像生成部
31 イントラ予測画像生成部
32 予測画像選択部
33 ピクチャ情報量制御部
331 ピクチャ動き量算出部
332 動き判定部
333 ピクチャ情報量決定部

Claims (9)

  1. 動画像データを取得する信号取得部と、
    前記動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、前記動画像データを符号化する処理部とを有し、
    前記処理部は、
    インター符号化されるピクチャの位置が、前記ピクチャの組の先頭を基準として、前記ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、前記ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第1の位置に対応する場合、前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第1の補正量を加算した値となり、前記インター符号化されるピクチャの位置が前記所定位置より後であり、且つ、前記第1の位置と異なる第2の位置である場合、前記符号化ビット数が前記基準値から第2の補正量を減算した値となるように、量子化パラメータを決定する情報量制御機能と、
    前記ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいは前記ピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成機能と、
    前記予測誤差信号を直交変換することにより、周波数信号を生成する直交変換機能と、
    前記量子化パラメータに従って、前記周波数信号を量子化する量子化機能と、
    前記量子化された前記周波数信号を可変長符号化する符号化機能と、
    を実現する、動画像符号化装置。
  2. 前記所定位置は、前記ピクチャの組の先頭位置に、前記ピクチャの組に含まれる、インター符号化されるピクチャの枚数の半分を加えた位置である、請求項1に記載の動画像符号化装置。
  3. 前記所定位置は、前記インター符号化されるピクチャの直前のピクチャについて、符号化による画質劣化度が、前記ピクチャの組に含まれるイントラ符号化されたピクチャの画質劣化度よりも所定度数低下した位置である、請求項1に記載の動画像符号化装置。
  4. 前記処理部は、前記情報量制御機能により、前記ピクチャの組の後端に近いほど、前記第1の位置にある前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が多くなるように前記第1の補正量を増加させ、前記ピクチャの組の後端に近いほど、前記第2の位置にある前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が少なくなるように前記第2の補正量を増加させる、請求項1〜3の何れか一項に記載の動画像符号化装置。
  5. 前記ピクチャの組は、前記連続するピクチャとしてトップフィールドとボトムフィールドを交互に含み、かつ、前記処理部は、前記情報量制御機能により、イントラ符号化されるピクチャのフィールドと同一のフィールドのピクチャが前記第1の位置に配置されるように、前記所定の周期を設定する、請求項1〜4の何れか一項に記載の動画像符号化装置。
  6. 前記処理部は、前記インター符号化されるピクチャの前記各ブロックについて、時間的に前後のピクチャの類似する領域からの移動量を求める動き検出機能をさらに実現し、
    前記処理部は、前記情報量制御機能により、前記各ブロックの移動量の統計値から前記インター符号化されるピクチャが対応するシーンが静止シーンであると判定した場合、前記第1の補正量及び前記第2の補正量をゼロに設定する、請求項1〜5の何れか一項に記載の動画像符号化装置。
  7. 動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、前記動画像データを符号化する動画像符号化方法であって、
    インター符号化されるピクチャの位置が、前記ピクチャの組の先頭を基準として、前記ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、前記ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第1の位置に対応する場合、前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第1の補正量を加算した値となり、前記インター符号化されるピクチャの位置が前記所定位置より後であり、且つ、前記第1の位置と異なる第2の位置である場合、前記符号化ビット数が前記基準値から第2の補正量を減算した値となるように、量子化パラメータを決定し、
    前記ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいは前記ピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成し、
    前記予測誤差信号を直交変換することにより、周波数信号を生成し、
    前記量子化パラメータに従って、前記周波数信号を量子化し、
    前記量子化された前記周波数信号を可変長符号化する、
    ことを含む動画像符号化方法。
  8. 動画像データに含まれる、ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、コンピュータにインター符号化またはイントラ符号化させることにより、前記動画像データを符号化させる動画像符号化用コンピュータプログラムであって、
    インター符号化されるピクチャの位置が、前記ピクチャの組の先頭を基準として、前記ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、前記ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第1の位置に対応する場合、前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第1の補正量を加算した値となり、前記インター符号化されるピクチャの位置が前記所定位置より後であり、且つ、前記第1の位置と異なる第2の位置である場合、前記符号化ビット数が前記基準値から第2の補正量を減算した値となるように、量子化パラメータを決定する情報量制御機能と、
    前記ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいは前記ピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成機能と、
    前記予測誤差信号を直交変換することにより、周波数信号を生成する直交変換機能と、
    前記量子化パラメータに従って、前記周波数信号を量子化する量子化機能と、
    前記量子化された前記周波数信号を可変長符号化する符号化機能と、
    をコンピュータに実行させる動画像符号化用コンピュータプログラム。
  9. ピクチャの組に含まれる複数の連続するピクチャのそれぞれを、インター符号化またはイントラ符号化することにより、該動画像データを符号化する動画像符号化回路であって、
    インター符号化されるピクチャの位置が、前記ピクチャの組の先頭を基準として、前記ピクチャの組に含まれる各ピクチャに対して均等に符号化ビット数を割り当てた場合にインター符号化による符号化誤差が許容範囲内に収まる所定位置より後であり、かつ、前記ピクチャの組に含まれるピクチャの枚数よりも短い所定の周期の第1の位置に対応する場合、前記インター符号化されるピクチャに対して割り当てられる符号化ビット数が、所定の基準値に対して第1の補正量を加算した値となり、前記インター符号化されるピクチャの位置が前記所定位置より後であり、且つ、前記第1の位置と異なる第2の位置である場合、前記符号化ビット数が前記基準値から第2の補正量を減算した値となるように、量子化パラメータを決定する情報量制御回路と、
    前記ピクチャの組に含まれる各ピクチャを複数のブロックに分割し、分割された各ブロックごとに、時間的に前後のピクチャの類似する領域、あるいは前記ピクチャ内の他のブロックとの誤差を表す予測誤差信号を生成する予測誤差信号生成回路と、
    前記予測誤差信号を直交変換することにより、周波数信号を生成する直交変換回路と、
    前記量子化パラメータに従って、前記周波数信号を量子化する量子化回路と、
    前記量子化された前記周波数信号を可変長符号化する符号化回路と、
    を有する動画像符号化回路。
JP2009053913A 2009-03-06 2009-03-06 動画像符号化装置及び動画像符号化方法 Active JP5136470B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009053913A JP5136470B2 (ja) 2009-03-06 2009-03-06 動画像符号化装置及び動画像符号化方法
US12/717,400 US9185420B2 (en) 2009-03-06 2010-03-04 Moving image coding apparatus and moving image coding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009053913A JP5136470B2 (ja) 2009-03-06 2009-03-06 動画像符号化装置及び動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2010212785A JP2010212785A (ja) 2010-09-24
JP5136470B2 true JP5136470B2 (ja) 2013-02-06

Family

ID=42678245

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009053913A Active JP5136470B2 (ja) 2009-03-06 2009-03-06 動画像符号化装置及び動画像符号化方法

Country Status (2)

Country Link
US (1) US9185420B2 (ja)
JP (1) JP5136470B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5741076B2 (ja) * 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
US9832460B2 (en) * 2011-03-09 2017-11-28 Canon Kabushiki Kaisha Image coding apparatus, method for coding image, program therefor, image decoding apparatus, method for decoding image, and program therefor
CN112004088B (zh) * 2020-08-06 2024-04-16 杭州当虹科技股份有限公司 一种适用于avs2编码器的cu级qp分配算法
CN113971751A (zh) * 2021-10-28 2022-01-25 北京百度网讯科技有限公司 训练特征提取模型、检测相似图像的方法和装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3937247B2 (ja) 1996-02-02 2007-06-27 ソニー株式会社 静止画像データ生成装置および静止画像データ生成方法
KR100215824B1 (ko) 1996-04-09 1999-08-16 구자홍 엠펙 디코더의 프레임 메모리 및 영상 데이타 디코딩방법
US6961375B1 (en) * 1997-02-06 2005-11-01 Sony Corporation Picture coding device and method, picture transmitting device and method and recording medium
GB2327317B (en) * 1997-07-11 2002-02-13 Ericsson Telefon Ab L M Access control and resourse reservation in a communications network
FR2872973A1 (fr) 2004-07-06 2006-01-13 Thomson Licensing Sa Procede ou dispositif de codage d'une sequence d'images sources
JP2006191253A (ja) * 2005-01-05 2006-07-20 Matsushita Electric Ind Co Ltd レート変換方法及びレート変換装置
JP2006229411A (ja) * 2005-02-16 2006-08-31 Matsushita Electric Ind Co Ltd 画像復号化装置及び画像復号化方法
JP4650173B2 (ja) * 2005-09-05 2011-03-16 ソニー株式会社 符号化装置、符号化方法、符号化方法のプログラム及び符号化方法のプログラムを記録した記録媒体
JP4794987B2 (ja) * 2005-11-09 2011-10-19 キヤノン株式会社 映像信号処理装置
CN101133649B (zh) * 2005-12-07 2010-08-25 索尼株式会社 编码装置、编码方法以及解码装置、解码方法
JP4449915B2 (ja) * 2006-02-08 2010-04-14 ソニー株式会社 符号化装置、符号化方法およびプログラム、並びに、記録媒体
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
JP2008283560A (ja) * 2007-05-11 2008-11-20 Canon Inc 画像処理装置およびその方法
JP4582141B2 (ja) * 2007-11-27 2010-11-17 カシオ計算機株式会社 符号量制御装置、符号量制御方法、符号量制御プログラム、動画記録装置
JP2009152895A (ja) * 2007-12-20 2009-07-09 Panasonic Corp 符号量制御方法および装置、符号量制御プログラム、カメラシステム

Also Published As

Publication number Publication date
JP2010212785A (ja) 2010-09-24
US9185420B2 (en) 2015-11-10
US20100226433A1 (en) 2010-09-09

Similar Documents

Publication Publication Date Title
JP4851741B2 (ja) ソース画像のシーケンスを符号化する方法及び装置
Wang et al. Rate-distortion optimization of rate control for H. 264 with adaptive initial quantization parameter determination
EP1745653B1 (en) Encoder with adaptive rate control for h.264
JP5400876B2 (ja) ビデオ符号化のための、スライス依存性に基づくレート制御モデル適合化
KR101177031B1 (ko) 인터-코딩에 사용된 기준 화상의 수를 최소화하기 위한 방법 및 장치
JP5152402B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP4344476B2 (ja) 3:2プルダウンビデオ情報を含むビデオ情報ストリームの適応エンコーディング速度制御を実行する方法および装置
EP1549074A1 (en) A bit-rate control method and device combined with rate-distortion optimization
JP2001169281A (ja) 動画像符号化装置、および動画像符号化方法
JP5640979B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
KR101282193B1 (ko) 칼만 필터와 fir 필터를 사용한 동영상 인코더에서의 비트율 제어 방법
JP5365805B2 (ja) 動画像変換装置、動画像変換方法、および動画像変換プログラム
KR101959490B1 (ko) 비디오 비트율 제어 방법 및 그 장치
JP5136470B2 (ja) 動画像符号化装置及び動画像符号化方法
KR101086724B1 (ko) 영상의 복잡도를 이용한 h.264/avc 부호화기의 양자화 파라미터 결정 방법 및 이를 구현하는 h.264/avc 부호화기
CN108989818A (zh) 一种图像编码参数调整方法及装置
JP5649296B2 (ja) 画像符号化装置
JP4130617B2 (ja) 動画像符号化方法および動画像符号化装置
JPH09294267A (ja) 画像圧縮符号化装置
KR101337410B1 (ko) 동영상 부호기의 대블록에 대한 비트율 제어 방법
JP2008153802A (ja) 動画像符号化装置及び動画像符号化プログラム
JP4762860B2 (ja) 動画像符号化装置
JP4243472B2 (ja) 画像符号化装置、画像符号化方法および画像符号化プログラム
JP4186544B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JP4292658B2 (ja) 画像情報変換装置及び画像情報変換方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120924

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121029

R150 Certificate of patent or registration of utility model

Ref document number: 5136470

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151122

Year of fee payment: 3