JP2010239422A - 動画像符号化装置および復号装置 - Google Patents

動画像符号化装置および復号装置 Download PDF

Info

Publication number
JP2010239422A
JP2010239422A JP2009085660A JP2009085660A JP2010239422A JP 2010239422 A JP2010239422 A JP 2010239422A JP 2009085660 A JP2009085660 A JP 2009085660A JP 2009085660 A JP2009085660 A JP 2009085660A JP 2010239422 A JP2010239422 A JP 2010239422A
Authority
JP
Japan
Prior art keywords
area
value
unit
size
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009085660A
Other languages
English (en)
Other versions
JP5133290B2 (ja
Inventor
Hitoshi Naito
整 内藤
Tomonobu Yoshino
知伸 吉野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Research Inc
Original Assignee
KDDI R&D Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI R&D Laboratories Inc filed Critical KDDI R&D Laboratories Inc
Priority to JP2009085660A priority Critical patent/JP5133290B2/ja
Priority to US12/727,278 priority patent/US9014268B2/en
Publication of JP2010239422A publication Critical patent/JP2010239422A/ja
Application granted granted Critical
Publication of JP5133290B2 publication Critical patent/JP5133290B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】MBサイズのエリア設定およびエリア毎のサイズを最適に決定して、超高精細映像の符号化効率の向上を図る。
【解決手段】局所復号画像aを周波数解析部31で周波数解析し、その結果に基づいてエリア設定部32は最大MBサイズが適用される画面内の局所的なエリアを設定する。エリア境界補正部33は、大局的な動き特性によりエリア境界の補正を行い、N値算出部34は近傍画面の符号化結果に基づいてエリア毎の最大MBサイズ(N×N)を決定する。前記エリア設定と前記N値算出は段階的に行われる。
【選択図】図2

Description

本発明は動画像符号化装置および復号装置に関し、特に動き予測に用いられるマクロブロックの区画およびサイズを最適に決定して、超高精細映像の符号化効率の向上を図るようにした動画像符号化装置および復号装置に関する。
従来、動画像符号化における動き予測部の符号化効率を改善させるための方式として、動き予測に用いられるMB(マクロブロック)サイズの上限を最適に決定する方式が、例えば下記の特許文献1、非特許文献1に記載されている。
特許文献1では、MBサイズを大、中、小の3つのカテゴリに分類することが提案され、過去の符号化結果における大まかなMBサイズの傾向を考慮しつつ、大のカテゴリの使用割合がある第1の閾値より大きく、小のカテゴリの使用割合がある第2の閾値より小さい場合には、当該ピクチャのMBサイズの上限が増大するようにし、一方、大のカテゴリの使用割合が第1の閾値より小さく、小のカテゴリの使用割合が第2の閾値より大きい場合には、当該ピクチャのMBサイズの上限が低減するようにしている。
また、非特許文献1では、符号化装置のレート制御で用いられる歪みレート曲線を用いて、歪みの小さいMBサイズを最大MBサイズとして採用することが開示されている。
特開2006−339774号公報
「超高精細映像の符号化効率改善を目的とした最大マクロブロックサイズ拡張型H.264 High Profile符号化方式」、映像情報メディア学会誌、Vol.61,No.5,pp.665-673(2007)
上記の従来技術によれば、当該画面に適用すべき最大MBサイズを、過去の画面の符号化結果におけるMBサイズの傾向を考慮に入れて大まかに決定できる。
しかしながら、超高精細映像の一つの特徴として、局所的素材特徴の変動が激しい点が知られている。このため、画面に一つの符号化特性を特徴づけることは困難な場合が多く、一画面に最大MBサイズにより限定される大、中、小のカテゴリを割り当てるのみでは、効果の高い符号化モードを十分に網羅できないことが起こり得る。
本発明は前記した従来技術の課題に鑑みてなされたものであり、その目的は、MBサイズのエリア設定およびエリア毎のサイズを最適に決定して、超高精細映像の符号化効率の向上を図るようにした動画像符号化装置および復号装置を提供することにある。
前記した目的を達成するために、本発明は、 画面内の符号化処理の動き補償予測の単位となるMBサイズの最大値を局所的に更新可能な動画像符号化装置において、最大MBサイズが適用される画面内の局所的なエリアを設定するエリア設定部と、該エリア設定部で設定されたエリア毎の最大MBサイズ(N×N)を決定するN値算出部とを具備し、前記エリア設定と前記N値算出を段階的に行うようにした点に特徴がある。
また、前記エリア設定部で設定されたエリアの境界を補正するエリア境界補正部をさらに具備し、大局的な動き特性を基にエリア境界の補正を行うようにした点に他の特徴がある。
また、前記N値算出部は、設定されたエリア毎の最大MBサイズ(N×N)の決定を、近傍符号化画像における当該エリアに対応するMB符号化モードの発生頻度、近傍符号化画像における当該エリアに対応するDCT係数のレート歪み特性、および当該画像における当該エリアの周波数スペクトラムの内の少なくとも一つを用いてN値を算出するようにした点に他の特徴がある。
さらに、画面内の復号処理の動き補償予測の単位となるMBサイズの最大値を局所的に更新可能な動画像復号装置において、最大MBサイズが適用される画面内の局所的なエリアを設定するエリア設定部と、該エリア設定部で設定されたエリア毎の最大MBサイズ(N×N)を決定するN値算出部とを具備し、前記エリア設定と前記N値算出を段階的に行うようにした点に他の特徴がある。
請求項1〜5の発明によれば、サイド情報を発生することなく画面内の最大MBサイズの更新制御を高精度に行うことができるようになる。また、請求項10〜14の発明によれば、請求項1〜5の符号化装置で符号化された動画像を、該符号化装置との整合性をもって復号することができるようになる。
また、請求項6〜9の発明によれば、サイド情報の増大を抑制しつつ、画面内の最大MBサイズの更新制御を高精度に行うことができるようになる。また、請求項15の発明によれば、請求項6〜9の符号化装置で符号化された動画像を、該符号化装置との整合性をもって復号することができるようになる。
本発明の符号化装置の一実施形態の概略の構成を示すブロック図である。 本発明の第1実施形態のブロック図である。 映像の最大MBサイズ(N値)とエリア分割の説明図である。 前記第1実施形態の動作を示すフローチャートである。 本発明の第2実施形態のブロック図である。 本発明の第3実施形態のブロック図である。 本発明の第4実施形態のブロック図である。 前記第4実施形態の更新情報符号化部の一具体例を示すブロック図である。 前記第4実施形態の動作を示すフローチャートである。 本発明の復号装置の一実施形態の概略の構成を示すブロック図である。 前記復号装置の更新情報復号部の一具体例を示すブロック図である。
以下に、本発明を図面を参照して詳細に説明する。図1は、本発明が適用される符号化装置の概略ブロック図である。
図において、画像入力部1に入力した画素データとしての入力画像は、動き検出部2と誤差信号生成部4に送られる。動き検出部2は、局所復号画像蓄積部11からの局所復号画像aを最大MBサイズ割当部21から提供されたMBサイズbに従って動き検出する。該動き検出部2で検出された動きベクトル(MV)は、予測画像生成部3に送られ、予測画像が生成される。また、該MVは第1のバッファメモリ8にも送られる。
誤差信号生成部4は、入力画像の画素データと予測画像の画素データとから誤差信号を求め、該誤差信号はDCT部5で直交変換される。直交変換された誤差信号は、量子化部6で量子化され、次いで可変長符号化部7で可変長符号化される。可変長符号化後のデータは第1のバッファメモリ8に一時蓄積されると共に局所復号部9に送られる。第1のバッファメモリ8に一時的に蓄積されたデータはレート制御部12で監視されると共に、多重化部12に送られ、後述する第2のバッファメモリ24からのサイド情報と多重化部12で多重化され、符号化データとして回線に出力される。
局部復号部9で復号された可変長符号化データは局所復号画像生成部10で予測画像生成部3からの予測画像と加算され、局所復号画像が生成される。この局所復号画像は、局所復号画像蓄積部11に一時的に蓄積される。また、レート制御部12は、第1のバッファメモリ8を監視し、該監視結果に基づいて最適な量子化パラメータを求め、該量子化パラメータを量子化部6に送って、量子化部6の量子化を制御する。また、該量子化パラメータは、最大MBサイズ割当部21にも送られる。
以上は、従来の符号化装置が具備する機能であるが、以下に本発明の要部である最大MBサイズ割当部21、更新情報決定部22、更新情報符号化部23および第2のバッファメモリ24の機能について説明する。なお、下記の第1〜3実施形態では、下記の説明から明らかになるように、最大MBサイズに関するN値(サイド情報)を復号装置側に送らなくても復号装置は符号化装置における符号化と同じ条件で復号できるので、N値(サイド情報)は復号装置に送られる必要がない。
図2は、前記最大MBサイズ割当部21の一実施形態を示すブロック図である。該最大MBサイズ割当部21は、前記局所復号画像蓄積部11からの局所復号画像aを周波数解析する周波数解析部31、該周波数解析に結果に基づいて最大MBサイズN(例えば、Nは2のべき乗)を設定するエリア設定部32、該エリアの境界を大局的動き特性c(例えば、カメラ等の画像撮影装置の操作に伴う動き)により補正するエリア境界補正部33、および近傍画面(例えば、時間的に一枚前の画面)の符号化結果c’に基づいて前記N値を算出するN値算出部34から構成されている。前記大局的動き特性cは、近傍画面の動きベクトルの統計的性質(例えば、前記MVのヒストグラム)を考慮して推定することができる。
前記周波数解析部31は、例えばFFTによる周波数スペクトラム分析が該当する。超高精細映像の一つの特徴として、局所的素材特徴の変動が激しい点が知られている。そこで、エリア設定部32は、映像の周波数解析結果から、一枚の映像を周波数の大きさ別のエリアにわけることができる。例えば、一枚の映像を矩形ブロックに分割した上で、ブロックごとの周波数成分をもとにグループ化し、周波数成分の類似するエリアを形成する。周波数の大きなエリアはテクスチャの精細度が高いエリアであるので小さな最大MBサイズを割り当て、逆に周波数の小さなエリアはテクスチャの精細度が低いエリアであるので大きな最大MBサイズを割り当てるようにする。これにより、例えば、図3(a)に示されているような、それぞれのエリアの最大MBサイズがN、N/2、N/4等に設定される。
ここで、例えば標準符号化方式の一つであるH.264では、MBサイズを16画素×16ライン、16画素×8ライン、8画素×16ライン、8画素×8ライン、8画素×4ライン、4画素×8ライン、4画素×4ラインの7種類の中から適応的に選択可能になっている。そこで、最大のMBサイズをN画素×Nラインとすると、次の3つのカテゴリ(図3(b)参照)に分類することができ、これらのカテゴリの中から適応的に選択可能である。
カテゴリ1:N×N
カテゴリ2:N×N/2、N/2×N、N/2×N/2
カテゴリ3:N/2×N/4、N/4×N/2、N/4×N/4
よって、図3(a)の各エリアでは、MBサイズ大、中、小に対応するカテゴリ1,2,3の中から適応的に選択可能である。例えば、最大MBサイズがN/2のエリアでは、MBサイズ大、中、小に対応する各カテゴリ1’(N/2)、2’(N/4)、3’(N/8)のMBサイズの中から適応的に選択可能である。
エリア境界補正部33では、第1のバッファメモリ8からの例えばMVを参照して、映像の大局的な動き特性、例えば撮影装置(カメラ)の操作に伴う動きを求め、該動き特性によりエリア境界の補正を行う。撮影装置が例えば左または右に動かされれば、該エリア境界も撮影装置の動きに従って補正される。
次に、N値算出部34では、例えば一枚前の映像(フレーム)の対応するエリア内の最大MBサイズを参照し、当該画像のエリアの最大MBサイズを算出する。この算出の仕方は前記特許文献1の方法を用いることができるので詳細な説明は省略するが、一枚前の映像の符号化結果のMBサイズにおいて、MBサイズ大のカテゴリの使用割合がある第1の閾値より大きく、MBサイズ小のカテゴリの使用割合がある第2の閾値より小さい場合(ここではANDを取っているが、いずれか一方の成立を条件としても良い)には、当該ピクチャのMBサイズの上限が増大するようにし、一方、MBサイズ大のカテゴリの使用割合が第3の閾値より小さく、MBサイズ小のカテゴリの使用割合が第4の閾値より大きい場合(ここではANDを取っているが、いずれか一方の成立を条件としても良い)には、当該ピクチャのMBサイズの上限が低減するようにする。つまり、近傍符号化フレームにおける当該エリアに対応するMB符号化モードの発生頻度に基づいて、エリア内の最大MBサイズ(N×N)を決定する。
次に、本実施形態の動作を図4を参照して説明する。ステップS1では、入力画像にシーンチェンジ等の大きな画面変化があったか否かの判断がなされる。この判断が肯定の場合にはステップS2に進んで、周波数解析部31は画面内の画像の周波数解析を行う。次いでステップS3に進んで、該周波数解析の結果に基づいて画面内のエリア設定(図3(b)参照)が行われる。続いてステップS4に進んで、該周波数解析の結果に基づいて最大MBサイズに相当するN値の算出がなされる。一般的に、高周波成分の大きいエリアはテクスチャの精細度が高いと考えられるのでN値は小さく、逆に高周波成分の小さいエリアはテクスチャの精細度が低いと考えられるのでN値は大きく算出される。前記ステップS1が否定の場合にはステップS2〜S4をスキップしてステップS5に進む。また、ステップS4の処理が終わった後にはステップS5に進む。
ステップS5では、画像の大局的な動きが予め定められた閾値TH1以上か否かの判断がなされ、TH1以上の場合にはステップS6に進んでエリア境界の補正が行われる。次いでステップS7に進んで、近傍画面(例えば、一枚前のフレーム)の画像の符号化結果を用いてN値の算出が行われる。なお、前記ステップS5の判断が否定の時には、ステップS6,S7をスキップする。以上のようにして求められたエリア毎のN値bは、前記動き検出部2に送られ、当該画像の動き検出に供される。
このように、本実施形態によれば、映像のエリア毎に最適なMBサイズを算出することができるので、超高精細映像のような局所的素材特徴の変動が激しい映像に対しても符号化効率の向上をはかることができるようになる。なお、この実施形態では、映像のエリア毎の最大MBサイズ(N)の情報(サイド情報)をデコーダに送らなくても、デコーダは自らの復号画像から符号化装置で求めたと同様の、映像のエリア毎の最大MBサイズ(N)を求めて復号できるから、サイド情報を復号側に送る必要がなく、この点からも符号化効率を向上することができる。
次に、本発明の第2実施形態を図5を参照して説明する。図5において、図2と同じ符号は同一または同等物を示す。この実施形態が前記第1実施形態と異なる所は、N値算出部34が、近傍画面の符号化結果c’と当該画面の符号化パラメータ(一具体例として、各エリアの量子化ステップサイズ)dとからN値を算出するようにした点である。なお、後者の当該画面の符号化パラメータdのみからN値を算出するようにしてもよい。例えば、近傍画面の符号化結果c’を参照し、画面の各エリアのDCT係数符号量をN値ごとに推定し、最小の符号量を与えるN値を参照して、当該画面の対応する各エリアの最大MBサイズを、2×N値にまたは1/2×N値に変えたり、または不変であったりすることができる。
この実施形態でも、映像のエリア毎の最大MBサイズ(N)の情報(サイド情報)をデコーダに送らなくても、デコーダは自らの復号画像から映像のエリア毎の最大MBサイズ(N)を求めて符号化の場合と同じ条件で復号できるから、サイド情報を復号側に送る必要がなく、この点からも符号化効率を向上することができる。
次に、本発明の第3実施形態を図6を参照して説明する。図6において、図2、図5と同じ符号は同一または同等物を示す。この第3実施形態が前記第1実施形態と異なる所は、N値算出部35が、第1実施形態のように近傍画像の符号化結果を参照することなく、周波数解析部31でなされた周波数解析結果(周波数スペクトラム)を基にN値を決定するようにした点にある。
この実施形態でも、映像のエリア毎の最大MBサイズ(N)の情報(サイド情報)をデコーダに送る必要はない。
次に、本発明の第4実施形態を図7を参照して説明する。図7において、図2、図5、図6と同じ符号は同一または同等物を示す。この実施形態が前記第3実施形態と異なる所は、N値算出部34で算出された各エリアの最大のN値(例えば、図3(a)のN、N/2、N/4)を最小符号化コスト算出部36に送り、該最小符号化コスト算出部36にて符号化コストが最小であると判断されたN値を各エリアのN値と決定するようにした点、および例えば第1実施形態のN値算出部34で求められたN値を予測値fとする点である。N値算出部35が、周波数解析部31による周波数解析結果(周波数スペクトラム)を基に各エリアのN値を決定する点は前記第3実施形態と同じである。
前記符号化コストが最小のN値b,eは、図1の動き検出部2に送られると共に、更新情報決定部22にサイド情報として送られる。また、前記予測値fは、図8の誤差信号生成器41に送られる。前記予測値fとしては、第1〜3実施形態のN値算出部34又は35のいずれかで求められたN値を予測値とすることができる。つまり、N値算出部34は、近傍符号化フレームにおける当該エリアに対応するMB符号化モードの発生頻度、近傍符号化フレームにおける当該エリアに対応するDCT係数のレート歪み特性、当該フレームにおける当該エリアの周波数スペクトラムの内の少なくとも一つを用いて予測値fとしてのN値を算出することができる。
図8は、サイド情報のデータ量低減方式を示し、更新情報決定部22は、エリア毎のN値が前画像のエリア毎のN値と変わっている場合には更新情報とし、変わっていない場合には更新情報としない。更新情報決定部22から出力された更新情報は更新情報符号化部23に送られる。該更新情報符号化部23は、誤差信号生成器41と符号化部42と符号化データ量判定部43と選択部44とからなる。符号化後のサイド情報は第2のバッファメモリに一時的に蓄積された後、多重化部12に送られ、前記第1のバッファメモリ8からの符号化画像と多重化される。そして、回線へ送出される。
次に、第4実施形態の動作を、図9のフローチャートを参照して説明する。図9のステップS1〜S5は図4のものと同じであるので説明を省略し、大局的な動きがあった後のステップS11から説明する。ステップS11では、画面内の周波数解析が行われ、ステップS12では、エリア境界補正部33にてエリア境界の補正が行われる。ステップS13では、N値算出部35で求められたN値が最小符号化コスト算出部36に送られ、最小符号化コストのN値が決定される。最小符号化コスト算出部36では、N値算出部35から受け取った各N値で符号化した場合に最小の符号化データ量となるN値を最小符号化コストのN値とする。このN値は符号化コストが最小のN値b,eとして、図1の動き検出部2に送られると共に、図8の更新情報決定部22に送られる。次に、ステップS14では、図7のN値算出部34にて、第1実施形態と同様の方法でN値が求められ、予測値fとされる。続いて、ステップS15では、更新情報決定部22から出力された最小符号化コストのN値と前記N値算出部34から出力された予測値fとしてのN値が誤差信号生成器41に入力され、該誤差信号生成器41から誤差信号が出力される。該誤差信号は符号化部42で符号化される。符号化後のデータは符号化データ量判定部43に送られる。そこで、ステップS16の判断がなされる。すなわち、符号化データ量が予め定められている閾値TH2以下であるか否かの判断がなされる。この判断が肯定の場合にはデータ量の低減が図れるからステップS17に進んで誤差情報の符号化データが第2のバッファメモリ24に出力される。一方、ステップS16の判断が否定の時にはステップS18に進んでコスト最小のN値は符号化されずにそのまま出力される。つまり、データ量の低減が図れる場合には、選択部44は符号化部42を選択し、低減が図れない場合には符号を生成せずに、予測値をそのまま使用する。
この実施形態によれば、N値の更新情報、つまりサイド情報を符号化して復号装置側に送ることができるので、最適なN値を確実に与えることができる。
次に、本発明の符号化装置に対応する復号装置の実施形態を図10を参照して説明する。図10は、復号装置の概略の構成を示すブロック図である。図1の符号化装置から出力された符号化データは図10の復号装置で受信され、画像の誤差信号は第1のバッファメモリ51に、またN値の更新情報であるサイド情報は第2のバッファメモリ62に格納される。
前記画像の誤差信号は、可変長復号部52に送られて量子化レベルまで可変長復号され、逆量子化部53に送られて逆量子化される。次いで、逆DCT部54に送られて逆DCTされ加算部55に送られる。加算部55は前記誤差信号に予測画像蓄積部57からの予測画像信号を加算し復号画像を作成し、復号画像蓄積部56に一時蓄積した後、映像出力として出力する。
前記最大MBサイズ割当部61の構成は、前記第1、2、3実施形態の符号化装置に対応する構成としては、図2、図5、図6と同じである。一方、前記第4実施形態の符号化装置に対応する構成としては、更新情報復号部63で復号されたサイド情報を受け取り、動き補償部58に渡すだけである。以下に、最大MBサイズ割当部61の構成及び/又は動作を、各実施形態対応で説明する。
前記第1実施形態の符号化装置で符号化されたデータを復号する場合には、最大MBサイズ割当部61は、復号画像蓄積部56からの復号画像を周波数解析し、その結果に基づいて画面内のエリア設定を行う。次いで、第1のバッファメモリ51から動きベクトルMVを得て大局的な動き特性からエリア境界の補正を行う。次いで、第1のバッファメモリ51からの近傍画面の符号化結果によりエリア毎のN値を算出する。このエリア毎のN値は動き補償部58に送られる。動き補償部58は、復号画像蓄積部56からの復号画像をN値のMBに分割し、かつ第1のバッファメモリ51からのMVにより動き補償した予測画像を生成して予測画像蓄積部57に一時的に蓄積される。該予測画像蓄積部57に蓄積された予測画像は前記加算部55に送られ逆DCT部54からの誤差信号を加算されて復号画像が生成されるのは前記した通りである。
次に、前記第2実施形態の符号化装置で符号化されたデータを復号する場合には、当該画面の符号化パラメータdに係るデータは第1のバッファメモリ51から得られるので、最大MBサイズ割当部61は、前記近傍画面の符号化結果と当該画面の符号化パラメータを用いてN値を算出する。以降の復号動作は、前記した通りである。
次に、前記第3実施形態の符号化装置で符号化されたデータを復号する場合には、最大MBサイズ割当部61は、復号画像蓄積部56からの復号画像を周波数解析し、その結果に基づいて画面内のエリアのN値を決定する。以降の復号動作は、前記した通りである。
以上のように、前記第1〜第3実施形態の符号化装置で符号化されたデータを復号する場合には、サイド情報が無くても復号することができる。
次に、前記第4実施形態の符号化装置で符号化されたデータを復号する場合について説明する。この場合には、画面内のエリア毎の最大MBサイズ(N)の決定を受信符号化データのサイド情報を復号して行う。
図8の更新情報符号化部23で符号化された最大MBサイズのN値の更新情報が図10の復号装置の第2のバッファメモリ62に一時的に蓄積される。該更新情報は更新情報復号部63に送られ復号される。この復号は、当該符号化データの復号によりN値の誤差信号を取得し、近傍符号化画像における当該エリアに対応するMB符号化モードの発生頻度、近傍符号化画像における当該エリアに対応するDCT係数のレート歪み特性および当該画像における当該エリアの周波数スペクトラムの内の少なくとも一つを用いて算出された予測値gを取得し、前記誤差信号に前記予測値gを加算することにより行われる。復号された更新情報すなわち最大MBサイズ(N値)は最大MBサイズ割当部61に送られ、エリア毎のN値として、最大MBサイズ割当部61から動き補償部58に送られる。図11は前記更新情報復号部63の一具体例を示す。
本発明の高能率映像符号化装置および復号装置は、HDTVや超高精細映像の圧縮伝送および伸張に用いることができる。
1・・・画像入力部、2・・・動き検出部、3・・・予測画像生成部、4・・・誤差信号生成部、5・・・DCT部、6・・・量子化部、7・・・可変長符号化部、8・・・第1のバッファメモリ、9・・・局部復号部、10・・・局所復号画像生成部、11・・・局所復号画像蓄積部、12・・・レート制御部、12・・・多重化部、21・・・最大MBサイズ割当部、22・・・更新情報決定部、23・・・更新情報符号化部、24・・・第2のバッファメモリ、31・・・周波数解析部、32・・・エリア設定部、33・・・エリア境界補正部、34、35・・・N値算出部、36・・・最小符号化コスト算出部、41・・・誤差信号生成器、42・・・符号化部、43・・・符号化データ量判定部、51・・・第1のバッファメモリ、52・・・可変長復号部、53・・・逆量子化部、54・・・逆DCT部、56・・・復号画像蓄積部、57・・・予測画像蓄積部、58・・・動き補償部、61・・・最大MBサイズ割当部、62・・・第2のバッファメモリ、63・・・更新情報復号部。

Claims (15)

  1. 画面内の符号化処理の動き補償予測の単位となるMBサイズの最大値を局所的に更新可能な動画像符号化装置において、
    最大MBサイズが適用される画面内の局所的なエリアを設定するエリア設定部と、
    該エリア設定部で設定されたエリア毎の最大MBサイズ(N×N)を決定するN値算出部とを具備し、
    前記エリア設定と前記N値算出を段階的に行うようにしたことを特徴とする動画像符号化装置。
  2. 前記エリア設定部は、前記エリアの設定を、時間的に近傍の符号化画像の局所的な周波数解析により行うことを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記エリア設定部で設定されたエリアの境界を補正するエリア境界補正部をさらに具備し、
    該エリア境界補正部は、大局的な動き特性を基にエリア境界の補正を行うことを特徴とする請求項1に記載の動画像符号化装置。
  4. 前記大局的な特性は、時間的に近傍の符号化済み画像における動きベクトルの統計的性質を考慮した推定により取得されることを特徴とする請求項3に記載の動画像符号化装置。
  5. 前記N値算出部は、設定されたエリア毎の最大MBサイズ(N×N)の決定を、近傍符号化画像における当該エリアに対応するMB符号化モードの発生頻度、近傍符号化画像における当該エリアに対応するDCT係数のレート歪み特性、および当該画像における当該エリアの周波数スペクトラムの内の少なくとも一つを用いてN値を算出することを特徴とする請求項1に記載の動画像符号化装置。
  6. 当該画面の符号化コストを最小にするN値を算出する手段をさらに具備し、前記N値算出部は、該手段で算出された当該画面の符号化コストを最小にするN値をN値と決定することを特徴とする請求項1または5に記載の動画像符号化装置。
  7. 前記N値は変化があった場合には更新情報とされ、該更新情報の符号化は、近傍符号化画像における当該エリアに対応するMB符号化モードの発生頻度、近傍符号化画像における当該エリアに対応するDCT係数のレート歪み特性および当該画像における当該エリアの周波数スペクトラムの内の少なくとも一つを用いて算出されたN値を予測値とする誤差信号に対して行われることを特徴とする請求項6に記載の動画像符号化装置。
  8. 前記更新情報の符号化は、該更新情報の符号量が予め定められた閾値を下回る場合のみに行われることを特徴とする請求項7に記載の動画像符号化装置。
  9. 前記N値に変化がなかった場合には更新情報とされないことを特徴とする請求項6に記載の動画像符号化装置。
  10. 画面内の復号処理の動き補償予測の単位となるMBサイズの最大値を局所的に更新可能な動画像復号装置において、
    最大MBサイズが適用される画面内の局所的なエリアを設定するエリア設定部と、
    該エリア設定部で設定されたエリア毎の最大MBサイズ(N×N)を決定するN値算出部とを具備し、
    前記エリア設定と前記N値算出を段階的に行うようにしたことを特徴とする動画像復号装置。
  11. 前記エリア設定部は、前記エリアの設定を、時間的に近傍の符号化画像の局所的な周波数解析により行うことを特徴とする請求項10に記載の動画像復号装置
  12. 前記エリア設定部で設定されたエリアの境界を補正するエリア境界補正部をさらに具備し、
    該エリア境界補正部は、大局的な動き特性を基にエリア境界の補正を行うことを特徴とする請求項10に記載の動画像復号装置。
  13. 前記大局的な特性は、時間的に近傍の符号化済み画像における動きベクトルの統計的性質を考慮した推定により取得されることを特徴とする請求項12に記載の動画像復号装置。
  14. 前記N値算出部は、設定されたエリア毎の最大MBサイズ(N×N)の決定を、近傍符号化画像における当該エリアに対応するMB符号化モードの発生頻度、近傍符号化画像における当該エリアに対応するDCT係数のレート歪み特性、および当該画像における当該エリアの周波数スペクトラムの内の少なくとも一つを用いてN値を算出することを特徴とする請求項10に記載の動画像復号装置。
  15. 画面内のエリア毎の最大MBサイズの決定を受信符号化データに基づいて行う手段を具備し、
    前記エリア毎のN値の決定は、当該符号化データの復号により誤差信号を取得し、近傍符号化画像における当該エリアに対応するMB符号化モードの発生頻度、近傍符号化画像における当該エリアに対応するDCT係数のレート歪み特性および当該画像における当該エリアの周波数スペクトラムの内の少なくとも一つを用いて算出された予測値を取得し、前記誤差信号に前記予測値を加算することにより行われることを特徴とする請求項10に記載の動画像復号装置。
JP2009085660A 2009-03-31 2009-03-31 動画像符号化装置および復号装置 Active JP5133290B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009085660A JP5133290B2 (ja) 2009-03-31 2009-03-31 動画像符号化装置および復号装置
US12/727,278 US9014268B2 (en) 2009-03-31 2010-03-19 Video encoder and its decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009085660A JP5133290B2 (ja) 2009-03-31 2009-03-31 動画像符号化装置および復号装置

Publications (2)

Publication Number Publication Date
JP2010239422A true JP2010239422A (ja) 2010-10-21
JP5133290B2 JP5133290B2 (ja) 2013-01-30

Family

ID=42784217

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009085660A Active JP5133290B2 (ja) 2009-03-31 2009-03-31 動画像符号化装置および復号装置

Country Status (2)

Country Link
US (1) US9014268B2 (ja)
JP (1) JP5133290B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014003523A (ja) * 2012-06-20 2014-01-09 Canon Inc 画像符号化装置およびその制御方法ならびにプログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2154898A3 (en) * 2008-08-12 2010-06-02 LG Electronics Inc. Method of processing a video signal
WO2010143853A2 (ko) 2009-06-07 2010-12-16 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 장치
US9635368B2 (en) 2009-06-07 2017-04-25 Lg Electronics Inc. Method and apparatus for decoding a video signal
EP2654302B1 (en) 2010-12-13 2019-09-04 Electronics and Telecommunications Research Institute Inter prediction method
WO2014190468A1 (en) 2013-05-27 2014-12-04 Microsoft Corporation Video encoder for images
WO2015139165A1 (en) 2014-03-17 2015-09-24 Microsoft Technology Licensing, Llc Encoder-side decisions for screen content encoding
CN106416254B (zh) * 2015-02-06 2019-08-02 微软技术许可有限责任公司 在媒体编码期间跳过评估阶段
US10136132B2 (en) 2015-07-21 2018-11-20 Microsoft Technology Licensing, Llc Adaptive skip or zero block detection combined with transform size decision
CN107071418B (zh) * 2017-05-05 2020-03-17 上海应用技术大学 一种基于决策树的hevc帧内编码单元快速划分方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07264594A (ja) * 1994-03-23 1995-10-13 Nippon Telegr & Teleph Corp <Ntt> 動画像の動き補償予測符号化方法
JP2006519565A (ja) * 2003-03-03 2006-08-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化
JP2006339774A (ja) * 2005-05-31 2006-12-14 Kddi R & D Laboratories Inc 動画像符号化装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1994018799A1 (en) * 1993-02-03 1994-08-18 Qualcomm Incorporated Interframe video encoding and decoding system
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
US6925125B2 (en) * 2002-01-09 2005-08-02 Hiroshi Akimoto Enhanced aperture problem solving method using displaced center quadtree adaptive partitioning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07264594A (ja) * 1994-03-23 1995-10-13 Nippon Telegr & Teleph Corp <Ntt> 動画像の動き補償予測符号化方法
JP2006519565A (ja) * 2003-03-03 2006-08-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化
JP2006339774A (ja) * 2005-05-31 2006-12-14 Kddi R & D Laboratories Inc 動画像符号化装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014003523A (ja) * 2012-06-20 2014-01-09 Canon Inc 画像符号化装置およびその制御方法ならびにプログラム

Also Published As

Publication number Publication date
US9014268B2 (en) 2015-04-21
JP5133290B2 (ja) 2013-01-30
US20100246684A1 (en) 2010-09-30

Similar Documents

Publication Publication Date Title
JP5133290B2 (ja) 動画像符号化装置および復号装置
TWI399097B (zh) 用於編碼視訊之系統及方法,以及電腦可讀取媒體
JP4529919B2 (ja) 適応量子化装置及び適応量子化プログラム
US9706203B2 (en) Low latency video encoder
JP5893002B2 (ja) ビデオ符号化におけるレート制御
US20100254450A1 (en) Video coding method, video decoding method, video coding apparatus, video decoding apparatus, and corresponding program and integrated circuit
JP6729170B2 (ja) 画像処理システム及び画像復号装置
JP2006157910A (ja) ブロッキング効果を除去するためのフィルタリング方法及びその装置
JP6149707B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、及び動画像撮影装置
JP2008219870A (ja) 動画像符号化方法及び動画像符号化装置
JP2006229411A (ja) 画像復号化装置及び画像復号化方法
JPWO2009084340A1 (ja) 動画像符号化装置、および、動画像復号装置
JP4532980B2 (ja) 動画像符号化装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP5649296B2 (ja) 画像符号化装置
JP4510701B2 (ja) 動画像符号化装置
JP2008252225A (ja) 動画像符号化装置及び方法
JP5295089B2 (ja) 画像符号化装置
JP2009231905A (ja) トランスコーダ
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
JPWO2007094329A1 (ja) 動画像処理装置、動画像処理方法、および動画像処理プログラム
JP4586340B2 (ja) 符号化装置、および、符号化方法、並びに、プログラム
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
JP2008311824A (ja) 画像符号化装置および画像符号化プログラム
JP2005303555A (ja) 動画像符号化装置および動画像符号化方法
US20130308702A1 (en) Motion picture encoding apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120704

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121017

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121107

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5133290

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350