JP2010268283A - 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法 - Google Patents

画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法 Download PDF

Info

Publication number
JP2010268283A
JP2010268283A JP2009118711A JP2009118711A JP2010268283A JP 2010268283 A JP2010268283 A JP 2010268283A JP 2009118711 A JP2009118711 A JP 2009118711A JP 2009118711 A JP2009118711 A JP 2009118711A JP 2010268283 A JP2010268283 A JP 2010268283A
Authority
JP
Japan
Prior art keywords
identification information
image
decoding
encoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009118711A
Other languages
English (en)
Inventor
Hiroo Ito
浩朗 伊藤
Muneaki Yamaguchi
宗明 山口
Tomokazu Murakami
智一 村上
Masashi Takahashi
昌史 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2009118711A priority Critical patent/JP2010268283A/ja
Publication of JP2010268283A publication Critical patent/JP2010268283A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】画像を任意の形状を単位とした複数領域に分割し、前記分割した領域を単位として予測を行う場合、領域情報を効率良く符号化すること。
【解決手段】画像符号化装置100は、入力画像を複数の領域に分割する領域分割部108と、分割された各領域を単位に入力画像を符号化する画像符号化部103と、各画素に対し分割されたどの領域に属するかを示す識別情報を生成して付与する識別情報生成部109と、識別情報を符号化する識別情報符号化部111とを備える。識別情報符号化部111は、符号化対象画像に付与した識別情報と、時系列的に過去または未来の符号化済み参照画像の識別情報から生成した予測識別情報とを差分化し、差分識別情報を符号化する。
【選択図】図1

Description

本発明は、高画質で符号化効率の良い画像符号化技術及び画像復号化技術に関する。
TV信号などの動画像データを高能率に符号化して記録あるいは伝送する手法としてMPEG(Moving Picture Experts Group)方式等の符号化方式が策定され、MPEG−1規格、MPEG−2規格、MPEG−4規格等として国際標準の符号化方式となっている。また、さらに圧縮率を向上させる方式として、H.264/AVC(Advanced Video Coding)規格等が定められている。MPEG符号化方式では1画面(1フレーム)をマクロブロック(16画素×16ライン)単位に分割して、それぞれのブロックについて画面内または画面間の相関を利用した予測符号化を行う。H.264/AVC方式では、マクロブロックをさらに16×8、8×16、8×8、8×4、4×8、4×4の小ブロックに分割するモードを有しており、MPEG−1、MPEG−2、MPEG−4と比べて符号化を行う際のブロックについて分割種別を増やすことにより予測精度を向上し、高い圧縮率を実現している。
さらに、画像を矩形以外の形状を有する複数の領域に分割して符号化する技術も提案されている。例えば特許文献1には、画像を画素単位で複数の領域に分割し、それぞれの領域に対して複数段階の画質を設定する手段を有することで、重要な部分の画質を維持したまま符号化効率を向上する手法が記載されている。
特開2001−333281号公報
画像には静止した領域と動きのある領域が1枚の画面内に混在する場合や、更には動きの異なる複数の領域が混在する場合がある。これらの動きの異なる領域が混在する画像を符号化する場合において、従来ではブロックの分割方法が矩形形状に限定されているため、ブロック内に動きの異なる複数の領域が混在した場合には精度よく予測を行うことができず、復号化後の画質が低くなる、あるいは画質改善のために符号量が多くなるという課題があった。
前記特許文献1に記載される技術によれば、矩形以外の形状を有する複数の領域に分割することが可能となる。その際、領域分割に関する情報を画像情報と共にエントロピー符号化することが記載されている。すなわち任意形状符号化においては、ブロック単位での符号化と比べて領域情報の符号量が新たに加算されるため、トータルの符号量を削減しにくいという点で課題を残している。
本発明は上記課題を鑑みてなされたものであり、その目的は、画像を任意の形状を単位とした複数領域に分割し、前記分割した領域を単位として予測を行う場合、領域情報を効率良く符号化することで、高画質で符号化効率の良い画像符号化技術及び画像復号化技術を提供することにある。
本発明は、入力画像を、複数の領域に分割して符号化する画像符号化装置であって、前記入力画像を、該入力画像を構成する複数の任意の形状の領域に分割する領域分割部と、前記分割された各領域を単位に前記入力画像を符号化する画像符号化部と、前記入力画像の各画素に対し、前記分割されたどの領域に属するかを示す識別情報を生成して付与する識別情報生成部と、前記識別情報を符号化する識別情報符号化部とを備え、該識別情報符号化部は、符号化対象画像に付与した識別情報と、時系列的に過去または未来の符号化済み参照画像の識別情報から生成した予測識別情報とを差分化し、差分識別情報を符号化する。
さらに前記識別情報符号化部により符号化された識別情報を復号化する識別情報復号化部を備え、該識別情報復号化部は、対象画素の識別情報を復号した結果が予め定めた識別情報の付与手順と合致しない場合、対象画素に隣接する画素の復号識別情報を用いて補正する。
本発明は、入力画像を複数の領域に分割して符号化する画像符号化方法であって、前記入力画像を、該入力画像を構成する複数の任意の形状の領域に分割する領域分割ステップと、前記入力画像の各画素に対し、前記分割されたどの領域に属するかを示す識別情報を生成して付与する識別情報生成ステップと、前記識別情報を符号化する識別情報符号化ステップと、前記分割された各領域を単位に前記入力画像を符号化する画像符号化ステップとを備え、前記識別情報符号化ステップは、符号化対象画像に付与した識別情報と、時系列的に過去または未来の符号化済み参照画像の識別情報から生成した予測識別情報とを差分化し、差分識別情報を符号化する。
本発明は、画像を複数の任意の形状の領域に分割して符号化された符号化データを復号化する画像復号化装置であって、前記分割された各領域を識別するために各画素に付与された識別情報を復号化する識別情報復号化部と、前記分割された各領域を単位に前記符号化データから画像を復号化する画像復号化部とを備え、前記識別情報復号化部は、前記符号化データを復号化して得られる差分識別情報と、時系列的に過去または未来の復号化済み参照画像の識別情報から生成した予測識別情報とを加算し、識別情報を生成する。
本発明は、画像を複数の任意の形状の領域に分割して符号化された符号化データを復号化する画像復号化方法において、前記分割された各領域を識別するために各画素に付与された識別情報を復号化する識別情報復号化ステップと、前記分割された各領域を単位に前記符号化データから画像を復号化する画像復号化ステップとを備え、前記識別情報復号化ステップは、前記符号化データを復号化して得られる差分識別情報と、時系列的に過去または未来の復号化済み参照画像の識別情報から生成した予測識別情報とを加算し、識別情報を生成する。
本発明によれば、高画質で符号化効率の良い画像符号化装置、画像復号化装置及びその方法を提供できる。
本発明の画像符号化装置の一実施例(実施例1)を示す構成ブロック図。 画像符号化部103および画像復号化部104の内部構成を示した図。 入力画像の領域分割の一例を示す図。 分割領域に対して識別情報を付与した一例を示す図。 識別情報の予測動作を説明する図。 エッジ強度を計算するために用いるフィルタ係数の例。 エッジ強度を算出するために参照する画素値。 識別情報の付与手順を説明した図。 本実施例における符号化処理手順を示すフローチャート。 本発明の画像復号化装置の一実施例(実施例2)を示す構成ブロック図。 画像復号化部202の内部構成を示した図。 本実施例における1フレームの復号化処理手順を示すフローチャート。 識別情報復号処理(S1203)の手順を更に詳細に示すフローチャート。 画像情報復号処理(S1204)の手順を更に詳細に示すフローチャート。 本発明の画像符号化装置の他の実施例(実施例3)を示す構成ブロック図。 識別情報の補正動作を説明する図。 本実施例における識別情報補正手順を示すフローチャート。 本発明の画像復号化装置の他の実施例(実施例4)を示す構成ブロック図。
以下、本発明の実施例を画像符号化装置と画像復号化装置に分けて説明する。
図1は、本発明の画像符号化装置の一実施例(実施例1)を示す構成ブロック図である。画像符号化装置100は、画像信号処理部121、識別情報処理部122、多重化部123を備える。画像信号処理部121は、領域抽出部101、減算器102、画像符号化部103、画像復号化部104、加算器105、メモリ部106、画像予測部107を有する。識別情報処理部122は、領域分割部108、識別情報生成部109、減算器110、識別情報符号化部111、識別情報復号化部112、加算器113、メモリ部114、識別情報予測部115を有する。
初めに、画像符号化装置100の概略動作について説明する。
画像信号処理部121において、領域抽出部101は、入力画像150の中から後述する復号識別情報159で指定される領域を抽出し、領域画像151を出力する。減算器102は、領域抽出部101で抽出した領域画像151と、後述する画像予測部107から出力される予測画像153との減算処理を行い、差分画像を生成する。画像符号化部103は、前記差分画像に対して符号化処理を行い、符号化画像データ152を生成する。符号化画像データ152は多重化部123に送られ、後述する符号化識別情報157および符号化予測情報161と多重化され、符号化ストリーム162として出力される。
画像復号化部104は、画像符号化部103から出力される符号化画像データ152を復号し、復号差分画像を生成する。加算器105は、前記復号差分画像と予測画像153を加算して復号画像154を生成し、メモリ部106に格納する。画像予測部107は、メモリ部106から読み出した参照画像155を基に次に符号化する領域画像151に対する予測画像153を生成し、前記減算器102に出力する。
識別情報処理部122において、領域分割部108は、入力画像150を画像の輪郭や動きに合わせ、任意の形状を単位とした複数個の領域に分割する。識別情報生成部109は、分割された各領域に対して識別情報156を付与する。減算器110は、識別情報生成部109から出力される識別情報156と後述する識別情報予測部115から出力される予測識別情報158との減算処理を行い、差分識別情報を生成する。識別情報符号化部111は、前記差分識別情報に対して符号化処理を行い符号化識別情報157を生成する。符号化識別情報157は、識別情報復号化部112に出力されるとともに、前記多重化部123へ送られ多重化される。
識別情報復号化部112は、符号化識別情報157を復号し復号差分識別情報を生成する。加算器113は、前記復号差分識別情報と予測識別情報158を加算して復号識別情報159を生成する。復号識別情報159は、メモリ部114および前記領域抽出部101と画像予測部107に出力される。識別情報予測部115は、メモリ部160から読み出した参照識別情報160に基づき、予測識別情報158および符号化予測情報161を生成する。予測識別情報158は、減算器110および加算器113に送られる。符号化予測情報161は、前記画像予測部107と多重化部123に出力される。
次に、各ブロックの処理動作を詳細に説明する。
(1)画像信号処理部121の動作。
領域抽出部101は、入力画像150の中から符号化対象とする領域として、識別情報処理部122からの復号識別情報159で指定される領域のみを抽出して減算器102に出力する。減算器102は、領域抽出部101より出力される領域画像151と画像予測部107より出力される予測画像との減算処理を行い、差分画像を出力する。画像符号化部103は、前記差分画像に対して符号化処理を行い符号化画像データ152を生成するものであり、画像復号化部104は画像符号化部103と逆の手順を行うことにより前記符号化画像データ152から復号差分画像を生成する。本処理において、画像符号化部103における画像符号化処理が可逆符号化であれば、画像復号化部104の処理結果は画像符号化部103への入力と同一となる。画像符号化部103における画像符号化処理が非可逆符号化の場合は、画像復号化部104の処理結果は画像符号化部103への入力と必ずしも同一とはならい。なお、可逆符号化処理は非可逆符号化と比べて一般に圧縮率が低いため、非可逆符号化処理を用いるのが好ましい。
図2は、画像符号化部103および画像復号化部104の内部構成を示した図である。
符号300は図1の画像符号化部103に相当する。周波数変換部301は、差分画像350を離散コサイン変換(Discrete Cosine Transform:DCT変換)等の周波数変換を行い、周波数変換データを出力する。量子化部302は、前記周波数変換データを量子化して量子化データ351を出力する。可変長符号化部303は、量子化データを可変長符号化して符号化画像データ352を出力する。また符号310は図1の画像復号化部104に相当する。逆量子化部311は、量子化部302から出力した量子化データ351を逆量子化し、逆周波数変換部312は、これを逆周波数変換して復号差分画像353を生成する。
符号化処理において、量子化部302での量子化幅を大きくすると量子化後のデータ量が少なくなり、すなわち圧縮率を上げることが可能となるが、量子化誤差が大きくなる。逆に、量子化部302での量子化幅を小さくすればすると量子化後のデータ量は多くなり、すなわち圧縮率は小さくなるが、量子化誤差を小さくすることが可能となる。
加算器105は、復号差分画像と予測画像153を加算して復号画像154を生成し、メモリ部106に格納する。メモリ部106に格納された復号画像154は、次の画像(フレーム)の画像情報を符号化する際の参照画像155とするために用いられる。
画像予測部107は、メモリ部106から読み出した参照画像155を基に、次に符号化する領域画像151に対する予測画像153を生成して出力する。予測画像153の生成方法として、従来の各MPEG方式においては、参照画像155の中から領域画像151に最も合致する領域を探索する手法が主として用いられている。これに対し本実施例においては、識別情報処理部122からの復号識別情報159と符号化予測情報161に基づき予測画像153を生成するものである。すなわち、復号識別情報159を用いて参照画像155の中から符号化対象の領域画像151に対応する領域を抽出し、更に符号化予測情報161を用いて動きを補正して予測画像153を生成するようにした。
(2)識別情報処理部122の動作。
領域分割部108は、入力画像150に対して、画像の輪郭や動きに合わせて任意の形状を単位とした複数個の領域に分割する。
図3は、入力画像の領域分割の一例を示す図である。(b)は符号化対象画像500を示し、図1における入力画像150に対応する。(a)は符号化対象画像500に対して時間軸上で過去あるいは未来の参照画像510を示し、符号化処理および復号化処理を終了してメモリ部106から読み出された参照画像155に対応する。この例では、(b)の画像500は(a)の画像510に対して、人物500aが右から左に、車500bが左から右に動いており、それ以外の領域は静止している。(c)は符号化対象画像500を領域分割し、4個の画像領域を生成した状態を示す。ここでは、人物領域501、車領域(左側)502、車領域(右側)503、背景領域504の4つの領域に分割している。
領域分割方法の一例として、画像内の各画素のエッジ強度により領域を分離する方法を説明する。具体的には、画像500の各画素におけるエッジ強度fを、水平エッジ強度f、垂直エッジ強度fから次の数式(1)により算出する。
Figure 2010268283
ここで、水平エッジ強度fと垂直エッジ強度fは以下のように算出する。
図6は、エッジ強度を計算するために用いるフィルタ係数の例で、ソーベルフィルタである。垂直方向フィルタは、垂直エッジ強度fを算出するために水平方向の画素値の差分を求める係数である。水平方向フィルタは、水平エッジ強度fを算出するために垂直方向の画素値の差分を求める係数である。また図7は、エッジ強度を算出するために参照する画素値を示す。Aは画素値で、i,jは画面左上端を原点とした時の水平、垂直座標を表す。画素A(i,j)が中心画素で、これに隣接する8個の画素を用いる。
これらを用いて、画素A(i,j)における垂直エッジ強度fと水平エッジ強度fは、数式(2)と数式(3)により算出する。
Figure 2010268283
Figure 2010268283
前記数式(1)で算出したエッジ強度fを予め定める閾値fthと比較し、f>fthの時はその画素をエッジ画素、f≦fthの時はその画素を平坦画素とする。以上の処理を画像500に含まれる全画素に対して実施した後、エッジ画素を境界とする閉領域を分割の単位とすることが可能である。本手法により、図3(b)の画像500は、図3(c)の各画像領域501〜504に分割される。
次に、領域分割方法の他の例として、動きベクトルの類似性を用いる方法を説明する。最初に、図3(b)の画像500中の画素Acurに対して、図3(a)の画像510内で値が最も近くなる画素Arefを探索する。画素Acurの座標を(xcur、ycur)、上記探索で求められた画素Arefの座標を(xref,yref)とした時、画像500から画像510に向かう画素Acurrの動きベクトルmv(Acurr)を次の数式(4)により算出する。
Figure 2010268283
画像500における全画素について上記の動きベクトルmvを算出した後、動きベクトルmvが類似する画素を同一領域として統合する。この方法では図3(b)の画像について時間的な動きの類似度に応じた領域分割を行うことが可能となる。
以上、領域分割方法として、エッジ強度の大きさを用いた分割方法と動きの類似度を用いた分割方法の例を説明したが、さらに上記これらを組み合わせた方法を用いることも可能である。これにより、入力画像を、画像の輪郭や動きに応じて複数の任意の形状の領域に分割することができる。
次に識別情報生成部109は、分割された各画像領域に対して識別情報を付与する。識別情報とは、画像内の各画素が、どの分割領域に属するかを示す情報である。
図4は、図3の分割領域に対して識別情報を付与した一例を示す図である。(b)は符号化対象画像500であり、人物領域501に識別情報Id=1、車領域(左側)502に識別情報Id=2、車領域(右側)503に識別情報Id=3、背景領域504に識別情報Id=0を付与している。また(a)は参照画像510であり、これについても車領域511に識別情報Id=1、人物領域512に識別情報Id=2、背景領域513に識別情報Id=0を付与している。参照画像510の識別情報は、参照識別情報とも呼ばれる。後述するように、識別情報Idは符号化対象画像ごとにスキャン順に付与するので、(a)と(b)の異なる画像(フレーム)の間では、同一の人物領域512,501であっても異なる識別情報Idが付与される場合がある。
図8は、識別情報Idの付与手順を説明した図である。(a)において、符号化対象画像800は入力画像150であり複数の画素801で構成される。識別情報生成部109は、画像800の全画素に矢印802に示す順番で識別情報を付与する。一例として、画像800は領域分割の結果、(b)に示すように領域811〜領域815の5つの領域に分離された場合を想定する。識別情報の付与ルールは、識別情報Idの初期値を0とし、(b)の各画素801に対して(a)の矢印802の順にスキャンし、新しい領域が検出される毎に識別情報Idを1だけインクリメントして付与する。その結果、(c)に示すように、各画素に対してどの領域に属するかを示す識別情報Id=0,1,2,3,4を付与することができる。このように識別情報Idは画面内のスキャン順に初期値0から付与されるので、符号化対象画像800が変化すれば同一形状であっても異なる識別情報Idが付与されることになる。
次に、識別情報予測部115の動作について説明する。識別情報予測部115は、図4(b)の符号化対象画像500の各分割領域501〜504について、図4(a)の参照画像510の中から領域の形状が最も合致する領域を予測して、予測した領域の識別情報を参照して予測識別情報158とする。ここでは、(b)の人物領域501について(a)の中から最も合致する領域を探す場合を説明する。
図5は、識別情報の予測動作を説明する図である。図5(a)は、図4(a)の参照画像510に対して2値化情報を割り当てたものであり、参照画像510を構成する3つの領域(511〜513)のいずれか1つの領域のみに2値化情報V=1を、それ以外の領域に対して2値化情報V=0を割り当てる。(a1)は領域511のみにV=1を、(a2)は領域512のみにV=1を、(a3)は領域513のみにV=1を割り当てた場合を示す。次に、図5(b)は、図4(b)の符号化対象画像500に対して2値化情報Vを割り当てたものであり、ここでは予測対象である人物領域501に対して2値化情報V=1を、それ以外の領域に対してV=0を割り当てた場合である。
符号化対象画像500のうち、予測対象であるV=1が割り当てられた領域501を含む矩形領域501’に着目し、参照画像(a1)、(a2)、(a3)の中から2値化情報Vの差分絶対値和が最も小さくなる領域を探索する。探索の結果、図5(c)のように、参照画像(a2)における領域512を含む矩形領域512’が差分絶対値和が最小となる領域として選択される。このとき識別情報予測部115は、矩形領域512’のうち、予測対象である領域501(V=1)に対応する領域512の識別情報を参照して、予測識別情報158とする。すなわち、図5(d)のように、領域512の識別情報Id=2をもって予測対象領域501の予測識別情報158とする。このような識別情報の予測動作により、異なる画像(フレーム)間で同一形状の領域に対して異なる識別情報が付与されたものを、共通の識別情報に変換することができる。
また、(c)に示すように、矩形領域501’を、(a2)画像上の同一座標位置に配置した矩形領域501”を基準とし、矩形領域501”の左上頂点から矩形領域512’の左上頂点へのベクトル550を求め、符号化予測情報161とする。このように、識別情報予測部115では、識別情報生成部109で生成した全ての領域に対して、参照画像の識別情報を用いて予測識別情報158と符号化予測情報161を生成し出力する。
次に、識別情報の符号化について説明する。
減算器110は、識別情報生成部109で生成した各領域の識別情報156と識別情報予測部115で生成した予測識別情報158との減算を行う。識別情報符号化部111は、前記減算結果に対して符号化処理を行い符号化識別情報157を生成する。識別情報復号化部112は、識別情報符号化部111と逆の手順を行うことにより、復号差分識別情報を生成する。ここで、識別情報符号化部111における符号化処理が可逆符号化であれば識別情報復号化部112の処理結果は識別情報符号化部111への入力と同一となるが、識別情報符号化部111における符号化処理が非可逆符号化の場合は識別除法復号化部112の処理結果は識別情報符号化部111への入力と必ずしも同一とはならない。加算器113は、識別情報復号化部112より出力される復号差分識別情報と予測識別情報158を加算して復号識別情報159を生成し、メモリ部114と領域抽出部101および画像予測部107に出力する。メモリ部114に格納された復号識別情報159は、次の画像(フレーム)の識別情報を符号化する際の参照識別情報160として用いられる。
このように本実施例では、識別情報生成部109で生成した各領域の識別情報156をそのまま用いるのではなく、識別情報予測部115で生成した予測識別情報158で差分値を求め、さらに識別情報符号化部111により、差分情報を符号化処理を行い符号化識別情報157を生成するものである。よって、符号化ストリーム162に加算される符号化識別情報157の符号量は大幅に削減され、符号化効率の良い画像符号化装置を実現することが可能となる。
図9は、本実施例における符号化処理手順を示すフローチャートである。まず、1フレーム内のすべての画素に対して以下の処理(ループ1)を行う(S901)。すなわち、入力画像のすべての画素に対して領域分割処理を行い、各領域に対して識別情報を付与する(S902)。以上の処理をフレーム内のすべての画素に対して実施する(S903)。
次に、1フレーム内のすべての領域に対して以下の処理(ループ2)を行う(S904)。識別情報符号化処理(S905)により、領域分割処理(S902)で生成した識別情報を符号化し、符号化識別情報を生成する。続いて、識別情報復号化処理(S906)により符号化識別情報を復号化する。次に、入力画像から各領域に対応する画像情報を抽出する(S907)。画像情報符号化処理(S908)は画像抽出処理(S907)で抽出した画像情報を符号化し、符号化画像データを生成する。画像情報復号化処理(S909)は符号化画像データを復号化する。符号化データ多重処理(S910)は、識別情報符号化処理(S905)で生成した符号化識別情報と、画像情報符号化処理(S908)で生成した符号化画像データを多重する。以上の処理をすべての領域に対して実施し(S911)、画像1フレーム分の符号化が終了する。
以上のように実施例1の画像符号化処理では、入力画像を任意の形状を単位とする複数の領域に分割し、前記分割した領域を単位として予測符号化を行うものである。その際、上記形状を識別するために識別情報を付与し、該識別情報についても前記分割領域と同様に予測符号化を行うものである。これにより予測誤差を削減し、高画質で符号化効率の良い画像符号化装置および画像符号化方法を提供することが可能となる。
図10は、本発明の画像復号化装置の一実施例(実施例2)を示す構成ブロック図である。画像復号化装置200は、分離部201、画像信号処理部221、識別情報処理部222を備える。画像信号処理部221は、画像復号化部202、領域抽出部203、加算器204、メモリ部205、画像予測部206を有する。識別情報処理部222は、識別情報復号化部207、加算器208、メモリ部209、識別情報予測部210を有する。
まず、画像復号化装置200の概略動作について説明する。
画像信号処理部221において、分離部201は、受信した符号化ストリーム250を符号化画像データ251、符号化予測情報252、符号化識別情報253に分離してそれぞれ出力する。画像復号化部202は、符号化画像データ251を復号し復号差分画像254を生成する。領域抽出部203は、復号差分画像254の中から後述する復号識別情報257で指定される領域を抽出し、復号差分領域画像を出力する。加算器204は、前記復号差分領域画像と後述する画像予測部206より出力する予測画像256を加算して、復号画像255を生成し出力する。また前記復号画像255は、メモリ部205にも格納される。画像予測部206は、メモリ部205から読み出した参照画像260により予測画像256を生成し、加算器204に出力する。
識別情報処理部222において、識別情報復号化部207は、符号化識別情報253を復号し復号差分識別情報を生成する。加算器208は、前記復号差分識別情報と後述する識別情報予測部210より出力する予測識別情報258を加算して、復号識別情報257を生成する。復号識別情報257は、メモリ部209および領域抽出部203と画像予測部206に出力される。識別情報予測部210は、メモリ部209より読み出した参照識別情報259から予測識別情報258を生成し、加算器208に出力する。
次に、各ブロックの処理動作を詳細に説明する。
(1)画像信号処理部221の動作。
画像復号化部202は前記図1(画像符号化装置)の画像復号化部104に対応し、また領域抽出部203、加算器204、メモリ部205、画像予測部206は、それぞれ図1の101、105、106、107に対応し、同様に動作する。
図11は、画像復号化部202の内部構成を示した図である。符号400は図10の画像復号化部202に相当する。可変長復号化部401は、符号化画像データ450を可変長復号化して量子化データとする。逆量子化部402は、量子化データを逆量子化し、逆周波数変換部403は、これを逆周波数変換して復号差分画像451を生成する。
領域抽出部203に関して、実施例1(図1)の領域抽出部101では、入力画像150から符号化対象領域151を抽出するため復号識別情報159を参照している。これに対し図10では、復号差分画像254から復号画像生成の対象領域を抽出するため復号識別情報257を参照している。また、画像予測部206に関して、実施例1(図1)の画像予測部107では、符号化予測情報161を識別情報予測部115より取得している。これに対し図10では、符号化予測情報252を分離部201より取得している点が異なる。
(2)識別情報処理部222の動作。
識別情報復号化部207は、実施例1(図1)の識別情報復号化部112に対応し、また加算器208、メモリ部209は、それぞれ実施例1(図1)の113、114と対応し、同様に動作する。識別情報予測部210は、メモリ部209から読み出した参照識別情報259の中から、符号化予測情報252に基づいて予測識別情報258を生成する。この動作は、実施例1の図5(c)において、画像510を参照画像260、ベクトル550を符号化予測情報252として、矩形512’における識別情報を抽出する処理と同等である。すなわち、実施例1における識別情報予測部115では図5(c)におけるベクトル550を算出する処理を行うものであるが、実施例2における識別情報予測部210では、ベクトル情報が符号化予測情報252として与えられるため、そのベクトル情報に基づいて矩形512’を抽出する点が異なる。
図12は、本実施例における1フレームの復号化処理手順を示すフローチャートである。まず、1フレーム内のすべての領域に対して、以下の処理を行う(S1201)。すなわち、入力した符号化ストリームに対して符号化データ分離処理(S1202)を行い、符号化ストリームから符号化識別情報と符号化画像データと符号化予測情報を分離する。次に、識別情報復号処理(S1203)により符号化識別情報を復号化する。続いて、画像情報復号処理(S1204)により符号化画像データを復号化する。以上の処理をフレーム内のすべての領域に対して実施し(S1205)、画像1フレーム分の復号化が終了する。
図13は、図12に示す識別情報復号処理(S1203)の手順を更に詳細に示すフローチャートである。まず、符号化データ分離処理(S1202)で分離した符号化予測情報を取得する(S1301)。次に、取得した符号化予測情報に対応する予測識別情報を生成する(S1302)。復号識別情報生成処理(S1303)では、符号化データ分離処理(S1202)から取得した符号化予測情報を復号して復号差分識別情報を生成し、予測識別情報生成処理(S1302)で生成した予測識別情報を加算して復号識別情報を生成し、識別情報の復号処理を終了する。
図14は、図12に示す画像情報復号処理(S1204)の手順を更に詳細に示すフローチャートである。まず、符号化データ分離処理(S1202)で分離した符号化予測情報を取得する(S1401)。次に、識別情報復号処理(S1203)で復号した復号識別情報を取得する(S1402)。予測画像生成処理(S1403)は、復号識別情報取得処理(S1402)で取得した識別情報に該当する領域を取得し、前記取得した領域を予測識別情報取得処理(S1401)で取得した符号化予測情報を用いて動き補償を行うことで予測画像を生成する。復号画像生成処理(S1404)は、符号化データ分離処理(S1202)から取得した符号化画像データを復号して復号差分画像を生成し、予測画像生成処理(S1403)で生成した予測画像を加算して復号画像を生成し、画像復号処理を終了する。
以上のように、実施例2の画像復号化装置は、任意の形状を単位として複数の領域に分割し、符号化された符号化ストリームに対して、符号化ストリームから前記任意形状の識別情報を復号し、前記領域を単位として画像を復号化するものである。これにより、画像符号化装置での符号化処理に忠実に対応した復号化処理を行うことができ、高画質の復号画像を得ることが可能となる。
図15は、本発明の画像符号化装置の他の実施例(実施例3)を示す構成ブロック図である。
本実施例の符号化装置1500は、実施例1(図1)に記載の符号化装置100の構成に対して、識別情報補正部1501を追加したことを特徴とする。図1と同一機能を実現するブロックについては同一符号を付与している。
前記実施例1(画像符号化装置)で述べたように、図1の画像符号化部103の処理が非可逆の場合には符号化画像データ152の符号量を削減することができるが、符号化データに符号化時の誤差が含まれるため、画像復号化部104から出力される復号差分画像は減算器102から出力される差分画像と必ずしも同一にならない。これは、図1の識別情報符号化部111についても同様に当てはまる。そこで本実施例では、図1の識別情報符号化部111にておいて非可逆符号化処理を適用した場合に、識別情報補正部1501により復号識別情報の値を補正する構成としている。以下では、識別情報補正部1501の動作を中心に説明する。
図16は、識別情報の補正動作を説明する図である。(a)は識別情報を付与した状態、(b)は識別情報を符号化しさらに復号化した状態、(c)は識別情報の誤りを補正した状態を示す。(a)の画像1600は、図15の入力画像150に対して識別情報生成部109により識別情報を付与した結果である。識別情報の付与手順は、実施例1に記載した図8のスキャン順に基づいている。(b)の画像1610は、(a)の識別情報を図15の識別情報符号化部111で符号化(非可逆符号化)した後、識別情報復号化部157で復号化し、加算器113から出力された結果を示している。本例では説明の簡略化のため、画像1610中の画素1614について誤りが発生し、符号化前の識別情報Id=1がId=4に変化している。
識別情報補正部1501は、加算器113から出力される識別情報(図16(b))について、符号化処理での識別情報付与手順に合致するかを否かを判定する。すなわち、画像1610中の画素1611から画素1614の直前となる画素1613までに対して、矢印1612に示す順序で付与された識別情報を抽出する。その結果、画素1611〜画素1613までに出現する識別情報Idは、0、1、2の3種類であることを知る。識別情報付与手順に従えば、次の画素1614については、画素1613までに出現済みのId=0、1、2のいずれかの識別情報か、あるいは画素1613までに付与された識別情報の中の最大値Id=2に対して1インクリメントした値Id=3のいずれかの識別情報しか取り得ないこととなる。従って、画素1614に付与されている識別情報Id=4は、識別情報付与手順に合致しないと判定する。
識別情報補正部1501は、加算器113から出力される復号識別情報が、符号化処理での識別情報付与手順と合致しないと判定した場合、図16(c)のように、画素1614の識別情報をId=4からId=1に補正して出力する。加算器113から出力される復号識別情報が、符号化処理での識別情報付与手順と合致すると判定した場合には、復号識別情報をそのまま出力する。
ここで、識別情報の補正値の決定方法の例について説明する。
図17は、本実施例における識別情報補正手順を示すフローチャートである。まず、補正対象となる画素を中心した隣接する周囲8画素の識別情報を取得する(S1701)。次に、取得した周辺識別情報の中で最頻度となる識別情報を取得する(S1702)。最頻度識別情報が1つしかない場合(S1703の判定結果がYESの時)は補正対象画素の識別情報を、前記最頻度識別情報で置換する(S1705)。一方、最頻度識別情報が複数存在する場合(S1703の判定結果がNOの時)は、前記複数の最頻度識別情報の中から最も小さい値を有する識別情報を取得し(S1704)、補正対象画素の識別情報を置換する(S1705)。
図16(b)の場合は、画素1614を中心した領域1615内の周辺識別情報が、識別情報Id=1となる画素数4個、Id=2となる画素数1個、Id=3となる画素数3個であり、Id=1が最頻度となる。よって、図16(c)のように、画素1614の識別情報をId=4からId=1に補正する。これにより、周辺画素の識別情報と整合性の良い識別情報に補正することができる。
前記実施例3では、画像符号化装置における識別情報の補正について説明した。本実施例では、画像復号化装置の復号処理において識別情報を補正するものである。
図18は、本発明の画像復号化装置の他の実施例(実施例4)を示す構成ブロック図である。本実施例の画像復号化装置1800は、実施例2(図10)に記載の復号化装置200の構成に対して、識別情報補正部1801を追加したことを特徴とする。図10と同一機能を実現するブロックについては同一符号を付与している。
本実施例における識別情報補正部1801は、画像符号化装置にて非可逆符号化処理を行った場合に発生した識別情報の誤りを補正することができる。その動作は、前記実施例3(図15)における識別情報補正部1501と同様であり、説明を省略する。
以上のように、本実施例の画像符号化装置および画像復号化装置は、任意の形状を単位として複数の領域に分割した符号化および復号化を行うものである。更に、前記任意形状の識別情報の符号化において非可逆符号化を適用した場合において、その復号識別情報を補正する機能を実現するものである。これにより符号化装置では、高画質で符号化効率の良い画像符号化を実現することが可能となり、画像符号化装置では、符号化処理に忠実に対応した復号化処理を行うことができ、高画質の復号画像を得ることが可能となる。
100,1500…画像符号化装置
101…領域抽出部
102…減算器
103…画像符号化部
104…画像復号化部
105…加算器
106…メモリ部
107…画像予測部
108…領域分割部
109…識別情報生成部
110…減算器
111…識別情報符号化部
112…識別情報復号化部
113…加算器
114…メモリ部
115…識別情報予測部
121…画像信号処理部
122…識別情報処理部
123…多重化部
200,1800…画像復号化装置
201…分離部
202…画像復号化部
203…領域抽出部
204…加算器
205…メモリ部
206…画像予測部
207…識別情報復号化部
208…加算器
209…メモリ部
210…識別情報予測部
1501…識別情報補正部
1801…識別情報補正部。

Claims (14)

  1. 入力画像を複数の領域に分割して符号化する画像符号化装置において、
    前記入力画像を、該入力画像を構成する複数の任意の形状の領域に分割する領域分割部と、
    前記分割された各領域を単位に前記入力画像を符号化する画像符号化部と、
    前記入力画像の各画素に対し、前記分割されたどの領域に属するかを示す識別情報を生成して付与する識別情報生成部と、
    前記識別情報を符号化する識別情報符号化部とを備え、
    該識別情報符号化部は、符号化対象画像に付与した識別情報と、時系列的に過去または未来の符号化済み参照画像の識別情報から生成した予測識別情報とを差分化し、差分識別情報を符号化することを特徴とする画像符号化装置。
  2. 請求項1に記載の画像符号化装置において、
    前記画像符号化部は、前記識別情報符号化部にて符号化した識別情報を復号化し、復号化した識別情報に基づいて符号化対象領域を決定することを特徴とする画像符号化装置。
  3. 請求項1に記載の画像符号化装置において、
    前記識別情報生成部は、画面内の全画素を予め定めた順序で探索した際に検出される領域の順に識別情報を付与することを特徴とする画像符号化装置。
  4. 請求項1乃至3のいずれか1項に記載の画像符号化装置において、
    前記識別情報符号化部により符号化された識別情報を復号化する識別情報復号化部を備え、
    該識別情報復号化部は、対象画素の識別情報を復号した結果が予め定めた識別情報の付与手順と合致しない場合、対象画素に隣接する画素の復号識別情報を用いて補正することを特徴とする画像符号化装置。
  5. 入力画像を複数の領域に分割して符号化する画像符号化方法において、
    前記入力画像を、該入力画像を構成する複数の任意の形状の領域に分割する領域分割ステップと、
    前記入力画像の各画素に対し、前記分割されたどの領域に属するかを示す識別情報を生成して付与する識別情報生成ステップと、
    前記識別情報を符号化する識別情報符号化ステップと、
    前記分割された各領域を単位に前記入力画像を符号化する画像符号化ステップとを備え、
    前記識別情報符号化ステップは、符号化対象画像に付与した識別情報と、時系列的に過去または未来の符号化済み参照画像の識別情報から生成した予測識別情報とを差分化し、差分識別情報を符号化することを特徴とする画像符号化方法。
  6. 請求項5に記載の画像符号化方法において、
    前記画像符号化ステップは、前記識別情報符号化ステップにて符号化した識別情報を復号化し、復号化した識別情報に基づいて符号化対象領域を決定することを特徴とする画像符号化方法。
  7. 請求項5に記載の画像符号化方法において、
    前記識別情報生成方法は、画面内の全画素を予め定めた順序で探索した際に検出される領域の順に識別情報を付与することを特徴とする画像符号化方法。
  8. 請求項5乃至7のいずれか1項に記載の画像符号化方法において、
    前記識別情報符号化ステップにより符号化された識別情報を復号化する識別情報復号化ステップを備え、
    該識別情報復号化ステップは、対象画素の識別情報を復号した結果が予め定めた識別情報の付与手順と合致しない場合、対象画素に隣接する画素の復号識別情報を用いて補正することを特徴とする画像符号化方法。
  9. 画像を複数の任意の形状の領域に分割して符号化された符号化データを復号化する画像復号化装置において、
    前記分割された各領域を識別するために各画素に付与された識別情報を復号化する識別情報復号化部と、
    前記分割された各領域を単位に前記符号化データから画像を復号化する画像復号化部とを備え、
    前記識別情報復号化部は、前記符号化データを復号化して得られる差分識別情報と、時系列的に過去または未来の復号化済み参照画像の識別情報から生成した予測識別情報とを加算し、識別情報を生成することを特徴とする画像復号化装置。
  10. 請求項9に記載の画像復号化装置において、
    前記画像復号化部は、前記識別情報復号化部にて復号化した復号識別情報に基づいて復号化対象領域を決定することを特徴とする画像復号化装置。
  11. 請求項9または10に記載の画像復号化装置において、
    前記識別情報復号化部は、対象画素の識別情報を復号した結果が予め定めた識別情報の付与手順と合致しない場合、対象画素に隣接する画素の復号識別情報を用いて補正することを特徴とする画像復号化装置。
  12. 画像を複数の任意の形状の領域に分割して符号化された符号化データを復号化する画像復号化方法において、
    前記分割された各領域を識別するために各画素に付与された識別情報を復号化する識別情報復号化ステップと、
    前記分割された各領域を単位に前記符号化データから画像を復号化する画像復号化ステップとを備え、
    前記識別情報復号化ステップは、前記符号化データを復号化して得られる差分識別情報と、時系列的に過去または未来の復号化済み参照画像の識別情報から生成した予測識別情報とを加算し、識別情報を生成することを特徴とする画像復号化方法。
  13. 請求項12に記載の画像復号化方法において、
    前記画像復号化ステップは、前記識別情報復号化ステップにて復号化した復号識別情報に基づいて復号化対象領域を決定することを特徴とする画像復号化方法。
  14. 請求項12または13に記載の画像復号化方法において、
    前記識別情報復号化ステップは、対象画素の識別情報を復号した結果が予め定めた識別情報の付与手順と合致しない場合、対象画素に隣接する画素の復号識別情報を用いて補正することを特徴とする画像復号化方法。
JP2009118711A 2009-05-15 2009-05-15 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法 Pending JP2010268283A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009118711A JP2010268283A (ja) 2009-05-15 2009-05-15 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009118711A JP2010268283A (ja) 2009-05-15 2009-05-15 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法

Publications (1)

Publication Number Publication Date
JP2010268283A true JP2010268283A (ja) 2010-11-25

Family

ID=43364889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009118711A Pending JP2010268283A (ja) 2009-05-15 2009-05-15 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法

Country Status (1)

Country Link
JP (1) JP2010268283A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018121432A1 (zh) * 2016-12-27 2018-07-05 华为技术有限公司 图像编解码方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018121432A1 (zh) * 2016-12-27 2018-07-05 华为技术有限公司 图像编解码方法及装置
US11134269B2 (en) 2016-12-27 2021-09-28 Huawei Technologies Co., Ltd. Image encoding method and apparatus and image decoding method and apparatus

Similar Documents

Publication Publication Date Title
KR102450443B1 (ko) 다중 참조 예측을 위한 움직임 벡터 개선
EP3783897A1 (en) Image motion compensation method and device
RU2683165C1 (ru) Внутреннее предсказание блочного копирования с асимметричными разделами и схемами поиска на стороне кодера, диапазоны поиска и подходы к разделению
JP6272948B2 (ja) 動き情報の復号化方法
CN106797477B (zh) 用于解码及编码视频数据的方法和设备
WO2018054269A1 (en) Method and apparatus for video coding using decoder side intra prediction derivation
KR100803611B1 (ko) 영상의 부호화, 복호화 방법 및 장치
RU2697929C1 (ru) Устройство декодирования изображения и способ декодирования изображения
TW201904299A (zh) 運動向量預測
KR101351709B1 (ko) 화상 복호 장치 및 화상 복호 방법
WO2010001916A1 (ja) 画像処理装置および方法
TWI621351B (zh) 影像預測解碼裝置、影像預測解碼方法及影像預測解碼程式
JP5367097B2 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
TW202025764A (zh) 動畫像編碼裝置和方法、動畫像解碼裝置和方法及媒體
WO2011099428A1 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
KR101552664B1 (ko) 화상 부호화 방법 및 장치, 화상 복호 방법 및 장치, 및 그 프로그램
CN114375578A (zh) 用于残差编码的图像解码方法及其设备
CN114793282B (zh) 带有比特分配的基于神经网络的视频压缩
JP7412343B2 (ja) 画像符号化装置、画像復号装置、及びプログラム
JP2010268283A (ja) 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法
KR20110134404A (ko) 화상 데이터의 블록을 예측하는 방법, 이 방법을 실행하는 복호 장치 및 부호화 장치
US20220078437A1 (en) Encoding apparatus and program
JP7449690B2 (ja) インター予測装置、画像符号化装置、画像復号装置、及びプログラム
WO2012153440A1 (ja) 予測ベクトル生成方法、予測ベクトル生成装置、予測ベクトル生成プログラム、画像符号化方法、画像符号化装置、画像符号化プログラム、画像復号方法、画像復号装置、及び画像復号プログラム
JP2023101834A (ja) 補正装置及びプログラム