JP2006270436A - ビデオエンコーダ及びこれを用いた携帯無線端末装置 - Google Patents

ビデオエンコーダ及びこれを用いた携帯無線端末装置 Download PDF

Info

Publication number
JP2006270436A
JP2006270436A JP2005084776A JP2005084776A JP2006270436A JP 2006270436 A JP2006270436 A JP 2006270436A JP 2005084776 A JP2005084776 A JP 2005084776A JP 2005084776 A JP2005084776 A JP 2005084776A JP 2006270436 A JP2006270436 A JP 2006270436A
Authority
JP
Japan
Prior art keywords
image signal
search
motion vector
reference image
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005084776A
Other languages
English (en)
Other versions
JP4064973B2 (ja
Inventor
Yuji Kawashima
裕司 川島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005084776A priority Critical patent/JP4064973B2/ja
Priority to EP20050102422 priority patent/EP1705921A2/en
Priority to US11/089,649 priority patent/US7675974B2/en
Publication of JP2006270436A publication Critical patent/JP2006270436A/ja
Application granted granted Critical
Publication of JP4064973B2 publication Critical patent/JP4064973B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】H.264/AVCビデオエンコーダにおいて、少ない計算量によって動き補償予測を行う。
【解決手段】動き補償予測器(20)は、参照画像選択部(31)、探索中心設定部(32)と、探索範囲設定部(33)、動きベクトル探索部(34)、及び動画像信号中の対象ブロックに対して参照画像信号の選択、探索中心の設定、探索範囲の設定及び動きベクトルの探索を繰り返した結果求まる最適動きベクトルを用いて動き補償を行うことにより予測画像信号を生成する動き補償部(35)を有し、探索範囲設定部(34)は前回選択された参照画像信号上に設定された探索範囲内で探索された動きベクトルに依存する情報に従って、今回選択された参照画像信号上に探索範囲を設定する。
【選択図】 図2

Description

本発明は、ビデオエンコーダ及びこれを用いた携帯無線端末装置に関する。
動画像の圧縮符号化技術として代表的なMPEG方式では、動き補償予測(インター予測)、イントラ予測、離散コサイン変換(DCT)及び可変長符号化を組み合わせて符号化を行う。
一方、ITU-T Rec.H.264|ISO/IEC 14496-10 AVC(非特許文献1)に記載されているように、従来のMPEG方式より符号化効率を高めたH.264/AVCと呼ばれる動画像符号化規格が制定されている。H.264/AVCでは、動き補償予測において複数の参照画像について動きベクトルの探索を行い、その結果得られる最適動きベクトルを用いて動き補償を行う。さらに、非特許文献2にはH.264/AVCにおける符号化モードの選択法として、符号化歪と符号量が最適な組み合わせの符号化モードを選択する符号化歪−符号量最適法(rate-distortion optimization:RDO)が記載されている。
ITU-T Rec.H.264|ISO/IEC 14496-10 AVC Thomas Wiegand, Heiko Schwarz, Anthony Joch, Faouzi Kossentini, Senior Member, IEEE, and Gary K. Sullivan, Senior Member IEEE, "Rate-Constrained Coder Control and Comparison of Video Coding Standards" IEEE TRANSACTIONS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL.13, NO.7, JULY 2003
H.264/AVCでは、複数の参照画像からの選択が可能となったことで、符号化効率が向上する反面、最適な動きベクトルを探索するためのブロックマッチングの回数が参照画像数に比例して増大する。ブロックマッチングの回数が増えると、動き補償予測に必要な計算量が増える。従って、特に携帯無線端末装置のようなCPUパワーの小さい機器にビデオエンコーダを実装する場合、CPUに大きな負担を与えることになり、好ましくない。
本発明は、少ない計算量によって動き補償予測を行うことができる、H.264/AVCに適したビデオエンコーダ及びこれを用いた携帯無線端末装置を提供することを目的とする。
本発明の第1の観点によると、動画像信号を符号化するビデオエンコーダにおいて、複数フレームの参照画像信号から1フレームの参照画像信号を選択する手段と、選択された参照画像信号上に探索中心を設定する手段と、前記選択された参照画像信号上に前記探索中心を基準とする探索範囲を設定する手段と、前記探索範囲内でブロックマッチングを行って動きベクトルを探索する手段と、前記動画像信号中の各対象ブロックに対して、前記参照画像信号の選択、前記探索中心の設定、前記探索範囲の設定及び前記動きベクトルの探索を繰り返した結果求まる最適動きベクトルを用いて前記参照画像信号に対して動き補償を行うことにより予測画像信号を生成する手段、及び前記動画像信号の前記対象ブロックに対する前記予測画像信号の差分信号及びサイド情報を符号化する手段を具備し、
前記探索範囲を設定する手段は、前回選択された参照画像信号上に設定された探索範囲内で探索された動きベクトルに依存する情報に従って、今回選択された参照画像信号上に前記探索範囲を設定することを特徴とする。
前記探索範囲を設定する手段は、第1に前記動きベクトルを探索する手段が以下の数式を満たす全ての動きベクトル候補mについて前記動きベクトルを探索するように前記探索範囲を設定することを特徴とする。
R2(m)<R0−(SAD1−ΔESAD−SAD0)/λM
SAD2=SAD1−ΔESAD
ここで、R0,SAD0は現在探索されている動きベクトルMV0に対応する、前記サイド情報の発生符号量及びSADを表し、R2(m)は前記動きベクトル候補mにそれぞれ対応する、前記サイド情報の発生符号量を表し、SAD1は前記探索中心におけるSADを表し、SAD2は探索中の動きベクトルMV2に対応する、前記サイド情報の発生符号量を表し、ΔESADはSAD1に対するSAD2の減少量の期待値を表し、λMはラグランジェ乗数を表し、SADは前記動画像信号と前記参照画像信号との間の差分の絶対値和(sum of absolute difference)を表す。
前記探索範囲を設定する手段は、第2に前記動きベクトルを探索する手段が以下の数式を満たす全ての動きベクトル候補mについて前記動きベクトルを探索するように前記探索範囲を設定することを特徴とする。
R2(m)<R0−(SATD1−ΔESATD−SATD0)/λM
SATD2=SATD1−ΔESATD
ここで、R0,SATD0は現在探索されている動きベクトルMV0に対応する、前記サイド情報の発生符号量及びSATDを表し、R2(m)は前記動きベクトル候補mにそれぞれ対応する、前記サイド情報の発生符号量を表し、SATD1は前記探索中心におけるSATDを表し、SATD2は探索中の動きベクトルMV2に対応する、前記サイド情報の発生符号量を表し、ΔESATDはSATD1に対するSATD2の減少量の期待値を表し、λMはラグランジェ乗数を表し、SATDは前記動画像信号と前記参照画像信号との間の差分をアダマール変換した値の絶対値和(sum of absolute transformed difference)を表す。
前記探索範囲を設定する手段は、第3に前記参照画像信号を選択する手段の1回目の選択時には以下の数式を満たす全ての動きベクトル候補mについて前記動きベクトルを探索するように前記探索範囲を設定することを特徴とする。
R2(m)<R1−ΔESAD/λM
ここで、R1は前記探索中心における動きベクトルに対応する、前記サイド情報の発生符号量を表す。
前記探索中心を設定する手段は、第4に第1回目の設定時には前記探索中心をゼロ点ベクトル及び予測ベクトルの位置がそれぞれ指し示すブロックのうち、SADが最小となるブロックの位置に設定することを特徴とする。
一方、前記探索中心を設定する手段は、第i(i=2,3…)回目の設定時には前記探索中心を(a)ゼロ点ベクトル、(b)予測ベクトル、(c)第1回目の探索で得られた動きベクトルをスケーリングしたベクトル、がそれぞれ指し示すブロックのうち、SADが最小あるいは第1回目の設定時に得られるSADより小さくなるブロックの位置に設定することを特徴とする。
さらに、本発明によると上記ビデオエンコーダ、及び前記ビデオエンコーダにより前記動画像信号を符号化して得られる符号化ビットストリームを送信する送信手段を具備する携帯無線端末装置を提供する。
本発明によれば、動きベクトルの探索範囲を適切に設定できるため、動きベクトル探索のためのブロックマッチングの回数が大きく減少する。従って、複数フレームの参照画像を使用することによる符号化効率向上の効果を少ない計算量で得ることができる。
以下、図面を参照して本発明の実施形態を説明する。
図1は、本発明の第1の実施形態に係る動画像符号化装置を示している。動画像符号化装置には、この例では例えばフレーム単位で動画像信号101が入力される。動画像信号101は減算器11に入力され、減算器11により予測信号110との差分である予測誤差信号102が生成される。予測誤差信号102に対して直交変換/量子化ユニット12により直交変換及び量子化が施される。量子化された直交変換係数情報103は、エントロピー符号化器22に入力される。
量子化された直交変換係数情報103は、逆量子化/逆直交変換ユニット15により処理され、これによって予測誤差信号103に対応した信号104が生成される。逆量子化/逆直交変換ユニット15は直交変換/量子化ユニット12の処理と逆の処理である逆DCT及び逆量子化を行う。逆量子化/逆直交変換ユニットユニット15からの出力信号104は、加算器16においてモード選択スイッチ21からの予測信号110と加算され、これによって局部復号画像信号106が生成される。局部復号画像信号106は、参照画像メモリ18に参照画像信号として記憶される。参照画像メモリ18には、複数フレームの参照画像信号が順次記憶される。
参照画像メモリ18から読み出される参照画像信号は、デブロッキングフィルタ19によってフィルタリングされる。フィルタリング後の参照画像信号107は、動き補償予測器20に入力される。動き補償予測器20では、フィルタリング後の複数フレームの参照画像信号について動きベクトルの探索と、動きベクトルによる動き補償を行い、動きベクトル情報108とフレーム単位の動き補償予測信号109を生成する。動き補償予測器20については、後に詳しく説明する。
モード選択スイッチ21は、符号化制御部23から出力される符号化モード情報に従ってイントラ予測モード時にはイントラ予測信号105を選択し、動き補償予測モード(インター予測モード)時には動き補償予測信号109を選択する。モード選択スイッチ21によって選択された予測信号110は、減算器11に入力される。
エントロピー符号化器22では、直交変換/量子化ユニット12から出力される量子化された直交変換係数情報103、動き補償予測器20から出力される動きベクトル情報108及び予測モード情報111に対して例えば算術符号化のようなエントロピー符号化を施し、情報103,108及び111の各々に対応する可変長符号113を生成する。可変長符号113は、図示しない後段の多重化器にシンタックス用データとして与えられ、多重化されることにより符号化ビットストリームが生成される。符号化スケーリングは図示しない出力バッファにより平滑化された後、図示しない伝送系または蓄積系へ送出される。
符号化制御部23は、例えば動画像信号101のアクティビティや出力バッファのバッファ量をモニタし、バッファ量が一定となるように直交変換/量子化ユニット12及び逆量子化/逆直交変換ユニット15における量子化パラメータの制御とエントロピー符号化器22の制御及びモード選択スイッチ21の制御を行う。
動き補償予測器20では図2に示されるように、デブロッキングフィルタ19によるフィルタリング後の参照画像信号107によって与えられる参照画像信号セット121を入力とし、参照画像選択部31によって1フレームの参照画像信号122を選択する。次に、動き補償予測器20は選択された参照画像信号122に対して、探索中心設定部32、探索範囲設定部33及び動きベクトル探索部34を経た動きベクトル123の探索と、動きベクトル123を用いた動き補償部35よる動き補償を行い、動き補償予測信号109を生成する。
本実施形態における動きベクトル探索の概略は、以下の通りである。動画像信号101の1フレームに相当する図3(A)に示される原画像信号201中の現在符号化しようとしているブロックを対象ブロック202とする。対象ブロック202に対して、図3(B)に示されるように、選択された参照画像信号203を用意する。この参照画像203中に、例えば対象ブロック202に対応する位置(ゼロ点ベクトルの位置)204を探索中心とする探索範囲205を設定する。次に図3(C)に示されるように、探索範囲205内でブロックマッチングにより対象ブロック202に最も類似した参照ブロック206を求め、対象ブロック202と参照ブロック206との間のベクトルmを動きベクトルとする。図3(D)に示されるように、現在の対象ブロック202に隣接する複数の対象ブロックについて既に求められた動きベクトルから、公知の手法により予測ベクトルpを求め、動きベクトルmと予測ベクトルpとの間の差分ベクトルm−pおよび参照画像を指定するための参照インデックスrを動きベクトル情報108とする。
H.264/AVCにおける符号化モードの選択法として、符号化歪と符号量との組み合わせを最適にする符号化モードを選択するRate-Distortion 最適法(RDO法)が知られている。本実施形態では、動きベクトル探索処理にRDOを適用する。このとき動きベクトルmは、例えば以下の数式(1)に示すコストJを最小とするベクトルで与えられる。
J=SAD(m)+λM×R(m,p,r) (1)
ここで、SAD(m)は原画像信号201と参照画像信号203との間の差分絶対値和(sum of absolute difference)、λMはラグランジェ定数、R(m,p,r)は差分ベクトル及び参照インデックス(サイド情報)の符号量をそれぞれ表す。
次に、図4及び図5に示すフローチャートを参照して動きベクトル探索の具体的な手順について説明する。図4及び図5は、ある対象ブロックに対して

まず、複数のフレームから第1回目の動きベクトル探索に用いる第1参照画像信号を選択する(ステップS101)。第1参照画像信号の選択法は、特に限定されない。例えば符号化対象画像信号のフレームの直近のフレームから第1参照画像信号を選択してもよいし、対象ブロックの近傍のブロックを符号化するときの参照画像信号の選択状況に基づいて第1参照画像信号を選択してもよい。
次に、第1参照画像信号上に探索中心を設定する(ステップS102)。ここでの探索中心は、例えば第1参照画像信号上でゼロ点ベクトル及び予測ベクトルの位置がそれぞれ指し示すブロックのうち、コストJが最小(J=J00)となるブロックの位置に設定される。ステップS102で設定された探索中心を基準にして、例えば矩形状の探索範囲を設定する(ステップS103)。
ステップS103で設定された探索範囲内でブロックマッチングを行って第1回目の動きベクトル探索を行い、動きベクトルMV0を得る(ステップS104)。同時に、第1参照画像信号上で動きベクトルMV0が指し示す参照ブロックにおけるSAD=SAD0とサイド情報の符号量R0及びコストJ0を求める。コストJ0は、数式(1)にSAD0及びR0を代入することにより求まる。
次に、J0が十分に小さいかどうかを調べるために、J0を閾値Th0と比較する(ステップS105)。もし、J0が閾値Th0より小さければ、動きベクトル探索処理を終了し、ステップS104で探索された動きベクトルを最適動きベクトルとして動き補償に用いる。一方、J0が閾値Th0以上ならば、次に第i回目(i=2,3,…)の動きベクトル探索に用いる別の参照画像信号(第i参照画像信号)があるかどうかを調べる(ステップS106)。もし第i参照画像信号がなければ処理を終了し、ステップS104で探索された動きベクトルを最適動きベクトルとして動き補償に用いる。第i参照画像信号があれば第i参照画像信号を選択する(ステップS107)。第i参照画像信号は、符号化対象画像信号に時間的に近い複数フレームの参照画像信号から選択してもよいし、対象ブロックの近傍ブロックの動きベクトル探索時に参照されたフレームから選択してもよい。
次に、ステップS107で選択された第i参照画像信号上に探索中心を設定する(ステップS108)。ここでの探索中心は、例えば第i参照画像信号上で(a)ゼロ点ベクトル、(b)予測ベクトル、(c)ステップS104で得られた動きベクトルMV0をスケーリングしたベクトルがそれぞれ指し示すブロックのうち、コストJが最小あるいはJ0より小さくなるブロックの位置に設定される。動きベクトルMV0をスケーリングしたベクトルとは、MV0を第1参照画像信号のフレームと第i参照画像信号のフレームとの間の時間間隔によって比例配分したベクトルであり、公知のテレスコピックサーチで用いられるベクトルと同様である。
次に、ステップS108で設定された探索中心のブロックにおけるコストJ=J1と先にステップS104で求められたJ0との差を閾値Th1と比較する(ステップS109)。もし、J1−J0が閾値Th1以上ならば,ステップS105へ,一方、J1−J0が閾値Th1より小さければ、ステップS108で設定された探索中心を有する探索範囲を設定する(ステップS110)。この場合、探索範囲は数式(1)に示したコストJを考慮して設定する。具体的には、以下の数式(2)を満たす全ての動きベクトル候補mについて動きベクトルを探索するように探索範囲を設定する。
R2(m)<R0−(SAD1−ΔESAD−SAD0)/λM
SAD2=SAD1−ΔESAD (2)
ここで、R0,SAD0は現在探索されている動きベクトルMV0に対応する、前記サイド情報の発生符号量及びSADを表し、R2(m)は前記動きベクトル候補mにそれぞれ対応する、サイド情報の発生符号量を表し、SAD1は前記探索中心におけるSADを表し、SAD2は探索中の動きベクトルMV2に対応する、前記サイド情報の発生符号量を表し、ΔESADはSAD1に対するSAD2の減少量の期待値を表し、λMはラグランジェ乗数を表す。
こうして設定された探索範囲内でブロックマッチングを行って第i回目の動きベクトル探索を行い、動きベクトルMV2を得ると同時に、第i参照画像信号上で動きベクトルMV2が指し示す参照ブロックにおけるSAD=SAD2を求める(ステップS111)。
次に、J2がJ0より小さいかどうかを調べる(ステップS112)。もし、J2がJ0より小さければ、J2を新たなJ0とし(ステップS113)、ステップS105に戻る。J2がJ0以上ならば、ステップS105に戻る。
このように図5の例では、第2回目以降の動きベクトル探索において動きベクトルの探索範囲の絞り込みを行うため、動きベクトルの探索に必要なブロックマッチングの回数がさらに減少する。従って、動き補償予測に必要な計算量を削減することができる。
次に、図6を用いて第1回目の動きベクトル探索処理の別の例について説明する。図6は、図4に示すフローチャートを変更している。まず、複数のフレームから第1回目の動きベクトル探索に用いる第1参照画像信号を選択する(ステップS201)。第1参照画像信号の選択法は、特に限定されない。例えば符号化対象画像信号のフレームの直近のフレームから第1参照画像信号を選択してもよいし、対象ブロックの近傍のブロックを符号化するときの参照画像信号の選択状況に基づいて第1参照画像信号を選択してもよい。次に、第1参照画像信号上に探索中心を設定する(ステップS202)。ここでの探索中心は、例えば第1参照画像信号上でゼロ点ベクトル及び予測ベクトルの位置がそれぞれ指し示すブロックのうち、コストJが最小(J=J00)となるブロックの位置に設定される。これまでの処理は、図4のステップS101〜S102の処理と同様である。
次に、J00が十分に小さいかどうかを調べるために、J00を閾値Th0と比較する(ステップS203)。もしJ00が閾値Th0より小さければ、J00をJ0として図5のステップS105に移り、第i回目以降の動きベクトル探索を行う。一方、J00が閾値Th0より大きければ、第1参照画像信号上にステップS202で設定された探索中心を基準に探索範囲を設定する(ステップS205)。
ステップS205では、図5のステップS110と同様に、数式(2)を満たす全ての動きベクトル候補mについて動きベクトルを探索するように探索範囲を設定する。但し、この場合は数式(2)のR0,SAD0に、探索中心における動きベクトルMV0に対応する、サイド情報の発生符号量(R1)及びSAD(SAD1)を代入する。従って、数式(2)は以下のように変形される。
R2(m)<R1−ΔESAD/λM (3)
このように図6の例では、1回目の動きベクトル探索においても動きベクトルの探索範囲の絞り込みを行う。従って、動きベクトルの探索に必要なブロックマッチングの回数がさらに減少するため、計算量のさらなる削減を達成することができる。
以上の説明ではSADを用いたが、SADに代えて動画像信号と参照画像信号との間の差分をアダマール変換した値の絶対値和(sum of absolute transformed difference)(SATD)を用いてもよい。その場合、数式(2)に代えて以下の数式(4)を用いる。
R2(m)<R0−(SATD1−ΔESATD−SATD0)/λM
SATD2=SATD1−ΔESATD (4)
図7は、本発明の応用例である携帯電話機のような携帯無線端末装置を示している。受信時には、図示しないキャリア通信網に含まれる基地局から送信される無線周波数(RF)信号がアンテナ50により受信され、受信信号はデュプレクサ51を介して受信ユニット52に入力される。受信ユニット51は受信信号に対して増幅、周波数変換(ダウンコンバート)及びアナログ−ディジタル変換などの処理を施し、中間周波数(IF)信号を生成する。受信ベースバンド信号は、符号分割多元接続(code division multiple access:CDMA)コーデック54に入力され、直交復調及び逆拡散の処理を受けて受信データとされる。受信データは、受信されたRF信号が音声信号の場合は音声コーデック55によって所定の音声復号化方式に従って伸張処理され、さらにディジタル−アナログ変換により復号されてアナログ音声信号とされる。アナログ音声信号は電力増幅器586を介してスピーカ37に供給され、ここから音声として出力される。
一方、送信時にはユーザの発声音声がマイクロフォン58により音声信号として検出される。音声信号は前置増幅器59で増幅された後、音声コーデック55によりディジタル化され、かつ所定の音声符号化方式に従って圧縮処理されることによって、送信音声データとされる。送信音声データはCDMAコーデック54に入力され、拡散処理及び直交変調の処理を受ける。直交変調信号は送信ユニット33によりディジタル−アナログ変換、周波数変換(アップコンバート)を受けてRF信号に変換され、さらに電力増幅器により増幅された後、デュプレクサ51を介してアンテナ50に供給されることにより、電波として空間に放射され、前記基地局に向けて送信される。
中央演算処理装置(CPU)でなる制御ユニット60は、各部の制御及び種々の演算や映像・文字情報の処理を司る部分であり、ここにはCDMAコーデック54及び音声コーデック55の他、キー入力部61、ディスプレイ62、ビデオコーデック63及びカメラ(イメージングデバイス)64が接続されている。図示しないバッテリから制御ユニット60の制御下で各部に電源が供給される。
ビデオコーデック63は、H.264/AVCに準拠しており、図1あるいは図2に示したビデオデコーダと図示しないビデオデコーダを含む。ビデオエンコーダは、例えばカメラ44によって得られる動画像信号を符号化し、符号化ビットストリームを生成する。符号化ビットストリームは制御ユニット60の制御下でCDMAコーデック34に供給され、送信ユニット53、デュプレクサ51及びアンテナ50を介して前記基地局に向けて送信される。このときカメラ44によって得られる動画像信号を制御ユニット60により処理してディスプレイ62に供給することによって、撮影された画像をモニタすることもできる。
前記受信データが圧縮された動画像信号である場合、受信データはCDMAコーデック34により符号化ビットストリームとされ、ビデオデコーダに入力される。ビデオデコーダは、符号化ビットストリームを復号して動画像信号を生成する。ビデオデコーダにより生成される動画像信号は、制御ユニット60の制御下でディスプレイ62に供給されることによって画像として表示される。
ビデオエンコーダで必要な処理の一部(例えば予測モードの決定)や、ビデオデコーダで必要な処理の一部は、制御ユニット60のCPUにおいてソフトウェア処理で実現される。本発明の前記実施形態に従うビデオデコーダは、前述したように動きベクトルの探索に必要な計算量が大きく減少するため、ビデオデコーダ及び制御ユニット40の負担が軽減される。この結果、図7のような無線端末装置の小型化、低消費電力化に寄与することができる。
本発明の一実施形態に従うビデオエンコーダを示すブロック図 図1中の動き補償予測器の機能を表したブロック図 本発明の一実施形態における動きベクトル探索の概略を説明する図 本発明の一実施形態における第1回目の動きベクトル探索について説明するフローチャート 本発明の一実施形態における第i回目(i=2,3…)の動きベクトル探索について説明するフローチャート 本発明の一実施形態における第1回目の動きベクトル探索の他の例について説明するフローチャート 図1のビデオエンコーダを含む携帯無線端末装置の例を示すブロック図
符号の説明
11…減算器;
12…DCTユニット;
13…量子化器;
14…逆量子化器;
15…IDCTユニット;
16…加算器;
17…イントラ予測器;
18…参照画像メモリ;
19…デブロッキングフィルタ;
20…インター予測器;
21…予測画像信号切替スイッチ;
22…エントロピー符号化器;
23…符号化制御部;
31…参照画像選択部;
32…探索中心設定部;
33…探索範囲設定部;
34…動きベクトル探索部;
35…動き補償部

Claims (7)

  1. 動画像信号を符号化するビデオエンコーダにおいて、
    複数フレームの参照画像信号から1フレームの参照画像信号を選択する手段と、
    選択された参照画像信号上に探索中心を設定する手段と、
    前記選択された参照画像信号上に前記探索中心を基準とする探索範囲を設定する手段と、
    前記探索範囲内でブロックマッチングを行って動きベクトルを探索する手段と、
    前記動画像信号中の各対象ブロックに対して、前記参照画像信号の選択、前記探索中心の設定、前記探索範囲の設定及び前記動きベクトルの探索を繰り返した結果求まる最適動きベクトルを用いて前記参照画像信号に対して動き補償を行うことにより予測画像信号を生成する手段、及び
    前記動画像信号の前記対象ブロックに対する前記予測画像信号の差分信号及びサイド情報を符号化する手段を具備し、
    前記探索範囲を設定する手段は、前回選択された参照画像信号上に設定された探索範囲内で探索された動きベクトルに依存する情報に従って、今回選択された参照画像信号上に前記探索範囲を設定することを特徴とするビデオエンコーダ。
  2. 請求項1記載のビデオエンコーダにおいて、前記探索範囲を設定する手段は、前記動きベクトルを探索する手段が以下の数式を満たす全ての動きベクトル候補mについて前記動きベクトルを探索するように前記探索範囲を設定することを特徴とする。
    R2(m)<R0−(SAD1−ΔESAD−SAD0)/λM
    SAD2=SAD1−ΔESAD
    ここで、R0,SAD0は現在探索されている動きベクトルMV0に対応する、前記サイド情報の発生符号量及びSADを表し、R2(m)は前記動きベクトル候補mにそれぞれ対応する、サイド情報の発生符号量を表し、SAD1は前記探索中心におけるSADを表し、SAD2は探索中の動きベクトルMV2に対応する、前記サイド情報の発生符号量を表し、ΔESADはSAD1に対するSAD2の減少量の期待値を表し、λMはラグランジェ乗数を表し、SADは前記動画像信号と前記参照画像信号との間の差分の絶対値和(sum of absolute difference)を表す。
  3. 請求項1記載のビデオエンコーダにおいて、前記探索範囲を設定する手段は、前記動きベクトルを探索する手段が以下の数式を満たす全ての動きベクトル候補mについて前記動きベクトルを探索するように前記探索範囲を設定することを特徴とする。
    R2(m)<R0−(SATD1−ΔESATD−SATD0)/λM
    SATD2=SATD1−ΔESATD
    ここで、R0,SATD0は現在探索されている動きベクトルMV0に対応する、前記サイド情報の発生符号量及びSATDを表し、R2(m)は前記動きベクトル候補mにそれぞれ対応する、サイド情報の発生符号量を表し、SATD1は前記探索中心におけるSATDを表し、SATD2は探索中の動きベクトルMV2に対応する、前記サイド情報の発生符号量を表し、ΔESATDはSATD1に対するSATD2の減少量の期待値を表し、λMはラグランジェ乗数を表し、SATDは前記動画像信号と前記参照画像信号との間の差分をアダマール変換した値の絶対値和(sum of absolute transformed difference)を表す。
  4. 請求項2または3記載のビデオエンコーダにおいて、前記探索範囲を設定する手段は、前記参照画像信号を選択する手段の1回目の選択時には以下の数式を満たす全ての動きベクトル候補mについて前記動きベクトルを探索するように前記探索範囲を設定することを特徴とする。
    R2(m)<R1−ΔESAD/λM
    ここで、R1は前記探索中心における動きベクトルに対応する、前記サイド情報の発生符号量を表す。
  5. 請求項1記載のビデオエンコーダにおいて、前記探索中心を設定する手段は、第1回目の設定時には前記探索中心をゼロ点ベクトル及び予測ベクトルの位置がそれぞれ指し示すブロックのうち、以下の数式で示すコストJが最小となるブロックの位置に設定することを特徴とする。
    J=SAD(m)+λM×R(m)
    ここで、SAD(m)は前記動画像信号と参照画像信号との間の差分絶対値和(sum of absolute difference)、λMはラグランジェ定数、R(m)は前記サイド情報の符号量をそれぞれ表す。
  6. 請求項1記載のビデオエンコーダにおいて、前記探索中心を設定する手段は、第i(i=2,3…)回目の設定時には前記探索中心を(a)ゼロ点ベクトル、(b)予測ベクトル、(c)第1回目の探索で得られた動きベクトルをスケーリングしたベクトル、がそれぞれ指し示すブロックのうち、以下の数式で示すコストJが最小あるいは第1回目の設定時に得られるコストJより小さくなるブロックの位置に設定することを特徴とする。
    J=SAD(m)+λM×R(m)
    ここで、SAD(m)は前記動画像信号と参照画像信号との間の差分絶対値和(sum of absolute difference)、λMはラグランジェ定数、R(m)は前記サイド情報の符号量をそれぞれ表す。
  7. 請求項1乃至6のいずれか1項記載のビデオエンコーダ、及び
    前記ビデオエンコーダにより前記動画像信号を符号化して得られる符号化ビットストリームを送信する送信手段を具備する携帯無線端末装置。
JP2005084776A 2005-03-23 2005-03-23 ビデオエンコーダ及びこれを用いた携帯無線端末装置 Expired - Fee Related JP4064973B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005084776A JP4064973B2 (ja) 2005-03-23 2005-03-23 ビデオエンコーダ及びこれを用いた携帯無線端末装置
EP20050102422 EP1705921A2 (en) 2005-03-23 2005-03-24 Video encoder and portable radio terminal device using the video encoder
US11/089,649 US7675974B2 (en) 2005-03-23 2005-03-25 Video encoder and portable radio terminal device using the video encoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005084776A JP4064973B2 (ja) 2005-03-23 2005-03-23 ビデオエンコーダ及びこれを用いた携帯無線端末装置

Publications (2)

Publication Number Publication Date
JP2006270436A true JP2006270436A (ja) 2006-10-05
JP4064973B2 JP4064973B2 (ja) 2008-03-19

Family

ID=36589221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005084776A Expired - Fee Related JP4064973B2 (ja) 2005-03-23 2005-03-23 ビデオエンコーダ及びこれを用いた携帯無線端末装置

Country Status (3)

Country Link
US (1) US7675974B2 (ja)
EP (1) EP1705921A2 (ja)
JP (1) JP4064973B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010035730A1 (ja) * 2008-09-24 2010-04-01 ソニー株式会社 画像処理装置および方法
WO2010035733A1 (ja) * 2008-09-24 2010-04-01 ソニー株式会社 画像処理装置および方法

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7953152B1 (en) 2004-06-28 2011-05-31 Google Inc. Video compression and encoding method
KR100639995B1 (ko) * 2005-06-14 2006-10-31 한국전자통신연구원 블록 정합 기반의 고속 움직임 예측 장치 및 그 방법
US7804900B2 (en) * 2006-02-23 2010-09-28 Industrial Technology Research Institute Method for fast SATD estimation
CN101031088A (zh) * 2006-02-28 2007-09-05 展讯通信(上海)有限公司 一种用于视频编码器实现的快速十字运动估计方法
US20080043841A1 (en) * 2006-08-21 2008-02-21 Ching-Lung Su Method for video coding
US8358699B2 (en) * 2007-04-09 2013-01-22 Cavium, Inc. Method and system for selection of reference picture and mode decision
US8908765B2 (en) * 2007-11-15 2014-12-09 General Instrument Corporation Method and apparatus for performing motion estimation
US9641861B2 (en) * 2008-01-25 2017-05-02 Mediatek Inc. Method and integrated circuit for video processing
EP2101198B1 (en) 2008-03-11 2015-05-27 Services Pétroliers Schlumberger A downhole tool for determining formation properties
US8311111B2 (en) * 2008-09-11 2012-11-13 Google Inc. System and method for decoding using parallel processing
US8326075B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video encoding using adaptive loop filter
US8325796B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
US8781004B1 (en) 2011-04-07 2014-07-15 Google Inc. System and method for encoding video using variable loop filter
US9154799B2 (en) 2011-04-07 2015-10-06 Google Inc. Encoding and decoding motion via image segmentation
US8780996B2 (en) 2011-04-07 2014-07-15 Google, Inc. System and method for encoding and decoding video data
US8780971B1 (en) 2011-04-07 2014-07-15 Google, Inc. System and method of encoding using selectable loop filters
CN105187839A (zh) * 2011-05-31 2015-12-23 Jvc建伍株式会社 动图像解码装置、动图像解码方法、接收装置及接收方法
US8885706B2 (en) 2011-09-16 2014-11-11 Google Inc. Apparatus and methodology for a video codec system with noise reduction capability
US9100657B1 (en) 2011-12-07 2015-08-04 Google Inc. Encoding time management in parallel real-time video encoding
US9262670B2 (en) 2012-02-10 2016-02-16 Google Inc. Adaptive region of interest
US9131073B1 (en) 2012-03-02 2015-09-08 Google Inc. Motion estimation aided noise reduction
US9344729B1 (en) 2012-07-11 2016-05-17 Google Inc. Selective prediction signal filtering
US11425395B2 (en) 2013-08-20 2022-08-23 Google Llc Encoding and decoding using tiling
US9392272B1 (en) 2014-06-02 2016-07-12 Google Inc. Video coding using adaptive source variance based partitioning
US9578324B1 (en) 2014-06-27 2017-02-21 Google Inc. Video coding using statistical-based spatially differentiated partitioning
US10102613B2 (en) 2014-09-25 2018-10-16 Google Llc Frequency-domain denoising
US9794574B2 (en) 2016-01-11 2017-10-17 Google Inc. Adaptive tile data size coding for video and image compression
US10542258B2 (en) 2016-01-25 2020-01-21 Google Llc Tile copying for video compression

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08140101A (ja) 1994-11-11 1996-05-31 Kokusai Electric Co Ltd 動き検出方法及び動き検出装置及び画像送信装置
JPH09271028A (ja) 1996-04-03 1997-10-14 Nec Corp 動きベクトル検出回路
US5825930A (en) * 1997-03-05 1998-10-20 Samsung Electronics Co., Ltd. Motion estimating method
US6438254B1 (en) * 1999-03-17 2002-08-20 Matsushita Electric Industrial Co., Ltd. Motion vector detection method, motion vector detection apparatus, and data storage media
US7643559B2 (en) * 2001-09-14 2010-01-05 Ntt Docomo, Inc. Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program
JP2003284091A (ja) 2002-03-25 2003-10-03 Toshiba Corp 動画像符号化方法及び動画像符号化装置
JP3968712B2 (ja) * 2003-04-28 2007-08-29 ソニー株式会社 動き予測補償装置及びその方法
JP2005167976A (ja) * 2003-11-14 2005-06-23 Victor Co Of Japan Ltd 動きベクトル検出装置及び動きベクトル検出プログラム
KR100586882B1 (ko) * 2004-04-13 2006-06-08 삼성전자주식회사 모션 스케일러빌리티를 지원하는 코딩 방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010035730A1 (ja) * 2008-09-24 2010-04-01 ソニー株式会社 画像処理装置および方法
WO2010035733A1 (ja) * 2008-09-24 2010-04-01 ソニー株式会社 画像処理装置および方法

Also Published As

Publication number Publication date
US7675974B2 (en) 2010-03-09
JP4064973B2 (ja) 2008-03-19
US20060215758A1 (en) 2006-09-28
EP1705921A2 (en) 2006-09-27

Similar Documents

Publication Publication Date Title
JP4064973B2 (ja) ビデオエンコーダ及びこれを用いた携帯無線端末装置
US7688893B2 (en) Video encoder and portable radio terminal device
EP2679011B1 (en) Hierarchy of motion prediction video blocks
RU2498523C2 (ru) Быстрое принятие решения о дельте параметра квантования макроблока
US20080240242A1 (en) Method and system for motion vector predictions
JP4501631B2 (ja) 画像符号化装置及び方法、画像符号化装置のコンピュータ・プログラム、並びに携帯端末
KR102124961B1 (ko) 동화상 예측 부호화 장치, 동화상 예측 부호화 방법, 동화상 예측 부호화 프로그램, 동화상 예측 복호 장치, 동화상 예측 복호 방법 및 동화상 예측 복호 프로그램
US20070030894A1 (en) Method, device, and module for improved encoding mode control in video encoding
US20080008250A1 (en) Video encoder
CN101946515A (zh) Cabac译码器的二回合量化
JP2009542151A (ja) リソースに制約のある装置においてビデオエンコーディングのための高速インターモード判断を与える方法、装置及びコンピュータプログラム製品
KR20130051384A (ko) 스킵모드를 이용한 동영상 부호화 및 복호화 방법 및 장치
JP5333449B2 (ja) 画像処理装置および方法、プログラム、並びに、記録媒体
KR20110058702A (ko) 적응적 2차예측 기반 영상 부호화/복호화 방법, 장치 및 기록 매체
WO2019154424A1 (zh) 视频解码方法、视频解码器以及电子设备
JP4360093B2 (ja) 画像処理装置および符号化装置とそれらの方法
WO2010010943A1 (ja) 画像処理装置および方法
JP2011146980A (ja) 画像処理装置および方法
JP2005318296A (ja) 動画像符号化方法と装置及びプログラム
JP4349109B2 (ja) 画像データ処理装置、その方法、および、符号化装置
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
Chiu et al. Self-derivation of motion estimation techniques to improve video coding efficiency
JP4423968B2 (ja) 符号化装置
WO2012077530A1 (ja) 画像処理装置および方法
JP2014112940A (ja) 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071225

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071227

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140111

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees