JP2006339774A - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP2006339774A
JP2006339774A JP2005159080A JP2005159080A JP2006339774A JP 2006339774 A JP2006339774 A JP 2006339774A JP 2005159080 A JP2005159080 A JP 2005159080A JP 2005159080 A JP2005159080 A JP 2005159080A JP 2006339774 A JP2006339774 A JP 2006339774A
Authority
JP
Japan
Prior art keywords
picture
macroblock
upper limit
size
macroblock size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005159080A
Other languages
English (en)
Other versions
JP4510701B2 (ja
Inventor
Atsushi Matsumura
篤志 松村
Hitoshi Naito
整 内藤
Ryoichi Kawada
亮一 川田
Atsushi Koike
淳 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Research Inc
Original Assignee
KDDI R&D Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI R&D Laboratories Inc filed Critical KDDI R&D Laboratories Inc
Priority to JP2005159080A priority Critical patent/JP4510701B2/ja
Publication of JP2006339774A publication Critical patent/JP2006339774A/ja
Application granted granted Critical
Publication of JP4510701B2 publication Critical patent/JP4510701B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 MBサイズの上限を撤廃して、最大のMBサイズを適応的に決定できるようにする動画像符号化装置を提供する。
【解決手段】 符号化する当該ピクチャのマクロブロックサイズの上限を、当該ピクチャの直前のピクチャまたは当該ピクチャのマクロブロックの特徴量を基に最適に決定する手段を具備する。マクロブロックサイズを大、中、小の3個のカテゴリに分類し、大のカテゴリの使用割合Rがある第1の閾値Thより大きく、小のカテゴリの使用割合Rがある第2の閾値Thより小さい場合には、当該ピクチャのマクロブロックサイズの上限が増大するようにし、一方前記大のカテゴリの使用割合Rが前記第1の閾値Thより小さく、小のカテゴリの使用割合Rが前記第2の閾値Thより大きい場合には、当該ピクチャのマクロブロックサイズの上限が低減するようにする
【選択図】 図2

Description

本発明は動画像符号化装置に関し、特に動き予測に用いられるマクロブロックのサイズの上限を最適に決定して、符号化効率の向上を図るようにした動画像符号化装置に関する。
従来、動画像符号化における動き予測部の符号化効率を改善させるための方式として、動き予測に用いられるマクロブロックサイズ(以下、MBサイズと記す)を複数のMBサイズの中から任意に選択できるようにする方式が提案されている。例えば、標準符号化方式の1つであるH.264(下記の非特許文献1参照)では、MBサイズを16画素×16ライン、16画素×8ライン、8画素×16ライン、8画素×8ライン、8画素×4ライン、4画素×8ライン、4画素×4ラインの7種類の中から適応的に選択可能になっている。
ITU-T Rec.H.264|ISO/IEC 14496-10 AVC Joint Final Committee Draft of Joint Video Specification (2002-8-10)
しかしながら、上記の従来方式では、MBサイズの上限が固定値であったため、高精細動画像などの同一動き量とみなされる領域が大きい映像素材においては、最大のMBサイズを16画素×16ラインより大きくして符号化効率を改善することができるにかかわらず、該改善を行うことができず、符号化効率の低減を招いてしまうという課題があった。
本発明は、前記した課題に鑑みてなされたものであり、その目的は、MBサイズの上限を撤廃して、最大のMBサイズを適応的に決定できるようにすることにより、符号化効率の改善を図ることのできる動画像符号化装置を提供することにある。
前記した目的を達成するために、本発明は、動き予測を行って動画像を符号化する動画像符号化装置において、符号化する当該ピクチャのマクロブロックサイズの上限を、当該ピクチャの直前のピクチャまたは/および当該ピクチャのマクロブロックの特徴量を基に最適に決定する手段を具備し、動き予測を行う際のマクロブロックサイズの上限をピクチャまたはマクロブロック単位にて任意に選択可能とした点に特徴がある。
本発明によれば、動き予測を行う際のマクロブロックサイズの上限をピクチャまたはマクロブロック単位にて最適に選択できるので、動き予測部における符号化効率の向上を期待することができる。
以下に、図面を参照して、本発明を詳細に説明する。図1は、本発明の一実施形態の動画像符号化装置1の概略説明図である。
図示されているように、動画像符号化装置1は、本発明による最大MBサイズ決定手段2と符号化手段3とから構成されている。
図2は、本発明の第1の実施形態の前記最大MBサイズ決定手段2の機能を示すフローチャートである。まず、本実施形態では、符号化対象のピクチャ(以下、当該ピクチャ)の直前のピクチャにおいて用いられたMBサイズを以下の3つのカテゴリに分類した上で、各カテゴリの使用頻度の割合を算出する。ただし、直前ピクチャにおけるMBサイズの上限をN画素×Nラインとする。なお、この3つのカテゴリは一例であり、本発明はこれに限定されない。
カテゴリ1:N×N
カテゴリ2:N×N/2、N/2×N、N/2×N/2
カテゴリ3:N/2×N/4、N/4×N/2、N/4×N/4
この使用頻度の割合、例えばカテゴリ1の使用頻度の割合は、下記の式で求めることができる。
(カテゴリ1のMB数)/{(カテゴリ1のMB数)+(カテゴリ2のMB 数)+(カテゴリ3のMB数)}
そこで、図2のステップS1では、直前ピクチャにおける各カテゴリのMBサイズの使用頻度割合を取得する。
ステップS2では、カテゴリ1の使用頻度の割合Rがある閾値Thより大きくかつカテゴリ3の使用頻度の割合Rがある閾値Thより小さいかどうかの判断をする。この判断が肯定の場合にはカテゴリ1の使用頻度が大きいので、ステップS4に進んでN←2×Nとする。これにより、当該ピクチャのカテゴリ1〜3のMBサイズの1辺は2倍に拡大する。つまり、直前ピクチャの動き量が小さければ、MBサイズの上限は適応的に拡大される。なお、本実施形態では、説明を分かりやすくするために、N←2×Nとしたが、N←m×N(mは1以上の正数)としてもよい。以下でも同様である。
一方、ステップS2の判断が否定の時には、ステップS3に進んで、R<ThおよびR>Thが成立するか否かの判断がなされる。この判断が肯定の場合にはカテゴリ1の使用頻度が小さくカテゴリ3の使用頻度が大きいので、ステップS6に進んで、N←N/2と置かれる。これにより、当該ピクチャのカテゴリ1〜3のMBサイズの1辺は1/2倍に縮小される。つまり、直前ピクチャの動き量が大きければ、MBサイズの上限は適応的に縮小される。なお、本実施形態では、N←N/2としたが、N←N/m(mは1以上の正数)としてもよい。以下でも同様である。
さらに、ステップS3の判断が否定の時には、ステップS5に進んでN←Nとされ、当該ピクチャのMBサイズの上限は直前ピクチャのそれと同じに維持される。
以上のように、この実施形態によれば、直前ピクチャのMBサイズの使用頻度をもとに当該ピクチャのMBサイズの上限を決定することができる。
次に、本発明の第2の実施形態の最大MBサイズ決定手段2の機能を、図3のフローチャートおよび図4を参照して説明する。ここに、図4の符号10は当該ピクチャを示す。
ステップS11では、当該ピクチャ10におけるあるMB(x,y)を4分割したN/2×N/2サイズの分割マクロブロックm(2x,2y)、m(2x+1,2y)、m(2x,2y+1)、およびm(2x+1,2y+1)における各動ベクトルd(2x,2y)、d(2x+1,2y)、d(2x,2y+1)、およびd(2x+1,2y+1)を算出する。
ステップS12ではN×NサイズのMB(x,y)における動ベクトルd’(x,y)を算出する。ただし、前記(x,y)は、マクロブロック単位での座標を表し、前記分割マクロブロックm(2x,2y)、m(2x+1,2y)、m(2x,2y+1)、およびm(2x+1,2y+1)は、前記MB(x,y)に包含されることとする。
ステップS13では、下記の(1)式により、各マクロブロックMB(x,y)における動ベクトル差分の絶対値平均davgまたは分散を算出する。
Figure 2006339774
ここに、XおよびYは、ピクチャ1の水平方向および垂直方向の画素数を示す。
ステップS14では、前記動ベクトル差分の絶対値平均davgがある閾値Thより小さいかどうかの判断を行う。この判断が肯定の場合にはステップS15に進み、N←2×Nと置かれる。すなわち、動ベクトルの分散が小さいということは、動き量が小さいことを意味するので、MBサイズを拡大する。その後、再度前記ステップS11〜S14の処理を行う。
この処理の結果、ステップS14の判断が否定になると、ステップS16に進んで前記動ベクトル差分の絶対値平均davgがある閾値Thより大きいかどうかの判断を行う。ここに、Th<Thである。ステップS16の判断が肯定の場合にはステップS17に進んで、N←N/2と置かれる。すなわち、動ベクトルの分散が大きいということは、動き量が大きいことを意味するので、MBサイズを縮小する。そして、ステップS11に戻って再度前記の処理が繰り返される。
前記動ベクトル差分の絶対値平均davgが閾値Th以上、Th未満になるまで前記の処理を繰り返し、ステップS16の判断が否定になると、ステップS18に進み、その時のN×Nを当該ピクチャにおけるMBサイズの上限と定める。ステップS19では、全てのマクロブロックMBの処理が終了したか否かの判断がなされ、この判断が否定の場合にはステップS11に戻って次のマクロブロックMBに対する処理が行われる。そして、該ステップS19の判断が肯定になると、前記した一連の処理は終了する。
以上のように、この実施形態によれば、当該ピクチャの特徴量davgを用いて、MBサイズの上限を決定することができる。
次に、本発明の第3の実施形態の最大MBサイズ決定手段2の機能を説明する。この実施形態は、前記第1実施形態の処理と第2実施形態の処理を併用したものである。図5は該第3の実施形態を示すフローチャートである。このフローチャートのステップ番号は、図2及び図3の同番号のものと同一または同等であるので説明を省略する。
この第3の実施形態の特徴は、第1実施形態で求めたMBサイズを用いて第2実施形態の処理を行い、当該マクロブロックMBの上限のサイズを決定するようにした点である。
次に、本発明を利用した符号化処理の一連の流れを、図6のフローチャートにより説明する。
ステップS21では、ピクチャ番号を表す置き数nをn=1とする。ステップS22では、ピクチャnが入力される。ステップS23では、前記した本発明の処理により、当該ピクチャの最大MBサイズが決定される。この処理は、符号化の前処理として行われる。ステップS24では、MBタイプの選択とMBサイズが決定される。ステップS25では、動き予測およびフレーム内予測が行われる。ステップS26では、当該ピクチャと動き予測画像との差分が算出される。次いで、該差分がDCT変換される。ステップS27では、サイド情報およびDCT係数が符号化される。ステップS28では、全部のMBの符号化が終わったか否かの判定がなされ、まだ終わっていない場合には、ステップS24に戻って次のMBに対する処理が行われる。以上のようにして、当該ピクチャの全部のMBの符号化が完了すると、ステップS28の判定が肯定になる。
ステップS29では、全ピクチャの符号化が完了したか否かの判断がなされ、この判断が否定の時にはステップS30に進んで、nに1が加算され次のピクチャがステップS22で入力する。以降の処理は、前記と同様に行われ、ステップS29の判断が肯定になると、符号化処理は終了する。
なお、上記の説明では、ピクチャ単位でのMBサイズの上限の決定について述べたが、前記の説明における「ピクチャ」を1ないし複数のマクロブロックから構成される「Basic Unit」と置き換えることによって、本発明をマクロブロック単位でのMBサイズの上限決定にも適用することができる。
以上のように、本発明によれば、符号化するピクチャのMBサイズの上限をピクチャまたはマクロブロック毎に最適に決定することができるようになり、動き予測部における符号化効率の向上を期待することができるようになる。
本発明を含む動画像符号化装置の概略構成を示すブロック図である。 本発明の第1の実施形態の機能を説明するフローチャートである。 本発明の第2の実施形態の機能を説明するフローチャートである。 第2の実施形態の一部の処理の説明図である。 本発明の第3の実施形態の機能を説明するフローチャートである。 本発明を利用した符号化処理を示すフローチャートである。
符号の説明
1・・・動画像符号化装置、2・・・最大MBサイズ決定手段、3・・・符号化手段、10・・・当該ピクチャ。

Claims (6)

  1. 動き予測を行って動画像を符号化する動画像符号化装置において、
    符号化する当該ピクチャのマクロブロックサイズの上限を、当該ピクチャの直前のピクチャまたは当該ピクチャのマクロブロックの特徴量を基に最適に決定する手段を具備し、
    動き予測を行う際のマクロブロックサイズの上限をピクチャまたはマクロブロック単位にて任意に選択可能としたことを特徴とする動画像符号化装置。
  2. 請求項1に記載の動画像符号化装置において、
    前記特徴量は、符号化する当該ピクチャの直前のピクチャのマクロブロックサイズの使用割合であり、前記手段は該使用割合を基に、当該ピクチャのマクロブロックサイズの上限を決定することを特徴とする動画像符号化装置。
  3. 請求項2に記載の動画像符号化装置において、
    マクロブロックサイズを大、中、小のカテゴリに分類し、大のカテゴリの使用割合がある第1の閾値より大きく、小のカテゴリの使用割合がある第2の閾値より小さい場合には、当該ピクチャのマクロブロックサイズの上限が増大するようにし、一方前記大のカテゴリの使用割合が前記第1の閾値より小さく、小のカテゴリの使用割合が前記第2の閾値より大きい場合には、当該ピクチャのマクロブロックサイズの上限が低減するようにすることを特徴とする動画像符号化装置。
  4. 請求項1に記載の動画像符号化装置において、
    前記特徴量は、当該ピクチャのマクロブロックの動ベクトルの分散値であり、前記手段は該分散値を基に、当該ピクチャのマクロブロックサイズの上限を決定することを特徴とする動画像符号化装置。
  5. 請求項4に記載の動画像符号化装置において、
    当該ピクチャのマクロブロックの動ベクトルと該マクロブロックを分割した分割マクロブロックの動ベクトルを探索し、該マクロブロックの動ベクトルと、該分割マクロブロックの動ベクトルとの分散値を求め、該分散値が第1の閾値以下であれば当該ピクチャのマクロブロックサイズの上限が増大するようにし、一方該分散値が第2の閾値以上であれば当該ピクチャのマクロブロックサイズの上限が低減するようにすることを特徴とする動画像符号化装置。
  6. 動き予測を行って動画像を符号化する動画像符号化装置において、
    符号化する当該ピクチャのマクロブロックサイズの上限を、当該ピクチャの直前のピクチャおよび当該ピクチャのマクロブロックの特徴量を基に最適に決定する手段を具備し、
    動き予測を行う際のマクロブロックサイズの上限をピクチャまたはマクロブロック単位にて任意に選択可能としたことを特徴とする動画像符号化装置。
JP2005159080A 2005-05-31 2005-05-31 動画像符号化装置 Active JP4510701B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005159080A JP4510701B2 (ja) 2005-05-31 2005-05-31 動画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005159080A JP4510701B2 (ja) 2005-05-31 2005-05-31 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2006339774A true JP2006339774A (ja) 2006-12-14
JP4510701B2 JP4510701B2 (ja) 2010-07-28

Family

ID=37559970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005159080A Active JP4510701B2 (ja) 2005-05-31 2005-05-31 動画像符号化装置

Country Status (1)

Country Link
JP (1) JP4510701B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010239422A (ja) * 2009-03-31 2010-10-21 Kddi R & D Laboratories Inc 動画像符号化装置および復号装置
JP2013085280A (ja) * 2008-10-03 2013-05-09 Qualcomm Inc 大型マクロ・ブロックを用いたビデオ・コーディング
JP2014003523A (ja) * 2012-06-20 2014-01-09 Canon Inc 画像符号化装置およびその制御方法ならびにプログラム
CN106416254A (zh) * 2015-02-06 2017-02-15 微软技术许可有限责任公司 在媒体编码期间跳过评估阶段

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6473985A (en) * 1987-09-16 1989-03-20 Fujitsu Ltd Variable block size moving compensation system
JP2005101811A (ja) * 2003-09-24 2005-04-14 Kddi Corp 動きベクトル検出装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6473985A (en) * 1987-09-16 1989-03-20 Fujitsu Ltd Variable block size moving compensation system
JP2005101811A (ja) * 2003-09-24 2005-04-14 Kddi Corp 動きベクトル検出装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9788015B2 (en) 2008-10-03 2017-10-10 Velos Media, Llc Video coding with large macroblocks
JP2013085280A (ja) * 2008-10-03 2013-05-09 Qualcomm Inc 大型マクロ・ブロックを用いたビデオ・コーディング
US8948258B2 (en) 2008-10-03 2015-02-03 Qualcomm Incorporated Video coding with large macroblocks
US9930365B2 (en) 2008-10-03 2018-03-27 Velos Media, Llc Video coding with large macroblocks
US10225581B2 (en) 2008-10-03 2019-03-05 Velos Media, Llc Video coding with large macroblocks
US11039171B2 (en) 2008-10-03 2021-06-15 Velos Media, Llc Device and method for video decoding video blocks
US11758194B2 (en) 2008-10-03 2023-09-12 Qualcomm Incorporated Device and method for video decoding video blocks
US9014268B2 (en) 2009-03-31 2015-04-21 Kddi R&D Laboratories Inc. Video encoder and its decoder
JP2010239422A (ja) * 2009-03-31 2010-10-21 Kddi R & D Laboratories Inc 動画像符号化装置および復号装置
JP2014003523A (ja) * 2012-06-20 2014-01-09 Canon Inc 画像符号化装置およびその制御方法ならびにプログラム
CN106416254A (zh) * 2015-02-06 2017-02-15 微软技术许可有限责任公司 在媒体编码期间跳过评估阶段
CN106416254B (zh) * 2015-02-06 2019-08-02 微软技术许可有限责任公司 在媒体编码期间跳过评估阶段
US10924743B2 (en) 2015-02-06 2021-02-16 Microsoft Technology Licensing, Llc Skipping evaluation stages during media encoding

Also Published As

Publication number Publication date
JP4510701B2 (ja) 2010-07-28

Similar Documents

Publication Publication Date Title
US9979978B2 (en) Image encoding apparatus, method of image encoding, and recording medium, image decoding apparatus, method of image decoding, and recording medium
JP4357543B2 (ja) 画素のイントラ予測モードを推定する方法及びシステム
JP5756537B2 (ja) 適応型走査を用いる動画像復号化方法
JP5261376B2 (ja) 画像符号化装置および画像復号化装置
JP5672302B2 (ja) 動画像復号装置、動画像復号方法及び動画像符号化装置ならびに動画像符号化方法
JP2006157910A (ja) ブロッキング効果を除去するためのフィルタリング方法及びその装置
US11363267B2 (en) Encoding method and device, and decoding method and device
JP2007074725A (ja) 映像のイントラ予測符号化及び復号化方法、並びに装置
JP5133290B2 (ja) 動画像符号化装置および復号装置
CN1960495A (zh) 图像编码装置、方法及程序
JP2007243427A (ja) 符号化装置及び復号化装置
JP2008167449A (ja) 映像の符号化、復号化方法及び装置
JP2007096679A (ja) 動画像の符号化および復号化方法
JP7403245B2 (ja) 画像復号装置、画像復号方法
JP4510701B2 (ja) 動画像符号化装置
JP2008004984A (ja) 画像理装置および方法、プログラム、並びに記録媒体
WO2016004880A1 (en) Method and apparatus for performing wave-front parallel encoding procedure with constraint on one or both of coding mode and quantization parameter selection
JP2006246351A (ja) 画像符号化装置および画像復号化装置
JP4797999B2 (ja) 画像符号化・復号化装置
JP7403246B2 (ja) 画像復号装置、画像復号方法
US9219926B2 (en) Image encoding apparatus, image encoding method and program, image decoding apparatus, image decoding method and program
TW202025747A (zh) 圖像編碼裝置、圖像解碼裝置、其等之控制方法及程式
CN1503562A (zh) 图像数据的平滑处理器、平滑处理方法以及平滑处理程序
JP2006191287A (ja) 画像符号化装置、画像符号化方法および画像符号化プログラム
JP4008846B2 (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム及びそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091224

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100428

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100430

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4510701

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160514

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350