JP2015103969A - 画像符号化装置及び画像符号化方法 - Google Patents

画像符号化装置及び画像符号化方法 Download PDF

Info

Publication number
JP2015103969A
JP2015103969A JP2013243204A JP2013243204A JP2015103969A JP 2015103969 A JP2015103969 A JP 2015103969A JP 2013243204 A JP2013243204 A JP 2013243204A JP 2013243204 A JP2013243204 A JP 2013243204A JP 2015103969 A JP2015103969 A JP 2015103969A
Authority
JP
Japan
Prior art keywords
image
plane
encoding
image feature
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013243204A
Other languages
English (en)
Other versions
JP2015103969A5 (ja
JP6265705B2 (ja
Inventor
小林 幸史
Yukifumi Kobayashi
幸史 小林
金子 唯史
Tadashi Kaneko
金子  唯史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013243204A priority Critical patent/JP6265705B2/ja
Publication of JP2015103969A publication Critical patent/JP2015103969A/ja
Publication of JP2015103969A5 publication Critical patent/JP2015103969A5/ja
Application granted granted Critical
Publication of JP6265705B2 publication Critical patent/JP6265705B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】RGBの画像を符号化する際に行う演算処理負荷を低減できるようにする。【解決手段】4:4:4フォーマットの画像を符号化する画像符号化装置であって、入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出手段と、前記画像特徴検出手段で検出された各プレーンの画像特徴に応じてプレーンを選択するプレーン選択手段と、前記4:4:4フォーマットの画像を符号化する際の参照画像を格納するための格納手段と、前記プレーン選択手段で選択されたプレーンの画像データと、前記格納手段に格納されている参照画像とを用いて符号化を行う符号化手段とを備える。【選択図】図1

Description

本発明は画像符号化装置及び画像符号化方法に関し、特に、赤(R)、緑(G)、青(B)の各色(RGB)の画像を符号化するために用いて好適な技術に関するものである。
現在、デジタルビデオカメラやハードディスクレコーダーなど、動画像を記録できるデジタル機器が普及している。これらのデジタル機器では、情報量の多い動画像を容量の制限されたフラッシュメモリやハードディスクといった記録メディアに効率的に記録するため、動画像データの圧縮符号化を行っている。
動画像圧縮符号化方式にはさまざまな方式が提案され、標準化されている。代表的な動画像圧縮符号化方式の一つにH.264符号化方式が挙げられる。H.264符号化方式は、ビデオカメラのハイビジョン記録方式であるAVCHDや、地上デジタル放送のワンセグ放送に採用されており、一般に広く普及している動画像圧縮符号化方式である。
このような符号化方式では、入力信号として主にYCbCr信号が用いられている。YCbCr信号は、RGB信号から輝度信号Yと2つの色差信号Cb、Crに色空間変換して得られた信号である。
色差信号Cb、Crは輝度信号Yより視認性が低いため、解像度を落としても視覚的な影響が少ないという特徴がある。そのため、色差信号をダウンサンプルさせることにより、情報量を抑えることが可能である。これらの情報量を抑えたフォーマットとしては、水平方向の色差信号の画素数を半減させたYCbCr 4:2:2フォーマットや、水平方向、垂直方向ともに画素数を半減させたYCbCr 4:2:0フォーマットなどがある。
画像符号化装置においては、これらのYCbCr 4:2:2フォーマットや、YCbCr 4:2:0フォーマットを用いることで、符号量を抑えたり、符号化時の様々な処理量を削減できたりするといったメリットが得られる。
一方、近年のディスプレイやビデオカメラの高解像度化、高諧調化に伴い、RGB信号を直接符号化し、より高品質な符号化画像を提供する符号化方式も規格化されている。RGB信号は、RGBの各プレーンで全て同一の画素数を有しており、RGB 4:4:4フォーマットとも呼ばれている。RGB 4:4:4フォーマットを符号化する符号化装置として、特許文献1、特許文献2のような技術が挙げられる。
RGB 4:4:4フォーマットを符号化する方式として、2つの方式が存在する。1つは、RGBの各プレーンで動きベクトルやイントラ予測モード、量子化値などをそれぞれ独立に制御できる符号化方式である。また、他の方式は、RGBの各プレーンに対して動きベクトル、イントラ予測モード、量子化値などをブロック単位で共通のものを用いる符号化方式である。
また、4:2:0画像信号や4:2:2画像信号の符号化処理と、4:4:4画像信号の符号化処理において、異なる処理の一つに、動き探索が挙げられる。
従来、4:2:0画像信号や4:2:2画像信号の符号化においては、一般に、輝度信号Yを用いて動き探索が行われていた。輝度信号Yは、被写体の輪郭や明暗のほとんどを表現でき、その網羅性は高いので、動き探索を行う信号として好適であった。
特開2010−110006号公報 特開2008−172599号公報
特許文献に記載の画像符号化装置においては、RGB 4:4:4フォーマットを符号化する際に、RGBの全プレーンを用いてイントラ予測モード選択の演算を行った場合、演算量が非常に膨大になってしまう。特に、RGBの各プレーンに対してブロック単位で共通のイントラ予測モードを一つ選択する符号化方式は、一つのイントラ予測モードを選択するのに、4:2:0或いは4:2:2フォーマットの輝度信号用のイントラ予測時の3倍もの演算量が必要となる。このため、演算処理負荷が非常に大きくなってしまう問題点があった。
一方、特許文献2に記載の4:4:4フォーマットの符号化装置においては、3プレーンのうち、一部の信号を用いて動き探索を行うか、あるいは全てのプレーンで動き探索を行って最適な動きベクトルを選択するようにしている。このため、以下のような課題が存在する。
全てのプレーンを用いて動き探索を行うと、動き探索にかかる処理量が3倍となり、処理サイクルやハード規模が増大する。また、参照画像メモリから読み出す参照画像データが3倍必要となり、メモリバスレートが増大する。そのため、高速なメモリバスを備える必要があり、消費電力が増加するという課題があった。
本発明は前述の問題点に鑑み、RGBの画像を符号化する際に行う演算処理負荷を低減できるようにすることを目的とする。
本発明の画像符号化装置は、4:4:4フォーマットの画像を符号化する画像符号化装置であって、入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出手段と、前記画像特徴検出手段で検出された各プレーンの画像特徴に応じてプレーンを選択するプレーン選択手段と、前記4:4:4フォーマットの画像を符号化する際の参照画像を格納するための格納手段と、前記プレーン選択手段で選択されたプレーンの画像データと、前記格納手段に格納されている参照画像とを用いて符号化を行う符号化手段とを備えることを特徴とする。
本発明によれば、RGBの画像を符号化する際に行う演算処理負荷を大幅に低減することができる。これにより、回路規模の増大を抑えながら、良好な符号化画像を得ることが可能となる。
第1の実施形態の画像符号化装置の構成例を示すブロック図である。 イントラ予測に用いられる参照画像用の画素を説明する図である。 イントラ4×4予測の予測モードを示す図である。 イントラ4×4予測の予測モードにおける予測画像の作成方法を説明する図である。 特徴検出を用いてプレーン選択を行った場合のイントラ予測への影響について説明する図である。 第2の実施形態の画像符号化装置の構成例を示すブロック図である。 第3の実施形態の画像符号化装置の構成例を示すブロック図である。 第4の実施形態の画像符号化装置の構成例を示すブロック図である。
以下、図面を参照しながら本発明の好適な実施の形態を説明する。
(第1の実施形態)
図1は、本実施形態に係る画像符号化装置の構成例を示すブロック図である。ここでは、赤(R)、緑(G)、青(B)の各色からなるRGB 4:4:4フォーマットをH.264符号化方式を用いて符号化を行う符号化装置の例を示している。また、本実施形態ではイントラ予測に関する説明を行うため、インター予測に関するブロック図、および説明は省略してある。
これから符号化が行われるRGB 4:4:4フォーマットの符号化画像は、フレームバッファ101に格納される。
特徴検出部102では、これから符号化が行われるマクロブロックをフレームバッファ101からRGB各プレーンごとに読み出し、各プレーンごとの画像の特徴検出を行い、その結果をプレーン選択部103に出力する。
画像の特徴は、例えばマクロブロックの画素のばらつきを示す分散値を算出することで検出することが可能となる。マクロブロックの画素値がP1〜P256である場合、画素の平均値Pmean、および画素の分散値varは以下の(1)、(2)式により算出することができる。
Figure 2015103969
プレーン選択部103では、特徴検出部102から送られてくるRGB各プレーンの画像特徴情報から、最もイントラ予測モード選択に適したプレーン選択を行う。選択したプレーン情報はイントラ予測部104に出力する。プレーン選択の方法としては様々なものが考えられるが、例えば画像特徴情報がマクロブロックの分散値である場合、最も分散値の高いプレーンをイントラ予測モード選択に使用するプレーンとして選択する。
なお、ここでは画像特徴情報としてマクロブロックの画素の分散値を用いたが、画像特徴情報はこれに限ったものではなく、例えばエッジ検出を行った結果を用いて、エッジ成分が最も大きいプレーンを選択してもよいし、周波数変換を行った値を用いてもよい。また、プレーン選択方法としてマクロブロックの画素の分散値の高いものを選択しているが、選択方法もこれに限ったものではなく、空間周波数の大きい画像特徴のプレーンを選択してもよい。
イントラ予測部104では、プレーン選択部103から送られてきたプレーン情報を用いて、フレームバッファ101に格納されている該当プレーンの符号化画像と、参照フレームバッファ113に格納されている該当プレーンの参照画像の読み出しを行う。そして、イントラ予測部104は、読み出されたプレーンの符号化画像と参照画像を用いてイントラ予測モード選択を行う。このようにすることで、RGBの3プレーンを用いてイントラ予測モード選択を行う場合と比較し、大幅に演算量を削減することができる。
H.264符号化方式のイントラ予測は、参照画像として符号化を行うマクロブロックの周辺の画素が用いられる。イントラ予測に用いられる参照画像用の画素を図2に示す。
イントラ予測モードにはイントラ4×4予測、イントラ8×8予測、イントラ16×16予測があり、それぞれ垂直予測モード、水平予測モード、DC予測モード等、複数の予測モードが存在する。ここでは、イントラ4×4予測モードを例に説明する。
符号化を行う4×4ブロックの画素a〜pに対して、周辺の画素A〜Mが予測画像用の画素として用いられる。画素A〜Dは、符号化を行う4×4ブロックの上方向に隣接する4画素であり、画素E〜Hは画素Dの右方向に続く4画素である。画素I〜Lは符号化を行う4×4ブロックの左方向に隣接する4画素であり、画素Mは画素Iの上の位置の画素である。この周辺の画素A〜Mは、原画像の画素、もしくは符号化が行われたローカルデコード画像の画素が用いられる。
イントラ予測モード選択時には、どちらの画素を用いることもできるが、直交変換部105に出力する符号化画像と予測画像との差分画像を生成するときには、予測画像生成用の参照画像としてローカルデコード画像を用いなければならない。この周辺の画素を用いて予測画像がどのように作られるかは、予測モードによって異なる。
図3に、イントラ4×4予測の予測モードを示す。
イントラ4×4予測には、予測モード0から予測モード8まで9つの予測モードが用意されている。それぞれの予測モードにおける予測画像の作成方法を図4に示す。
例えば、予測モード0は、垂直方向に隣接する画素A〜Dから予測画像を生成するモードである。符号化を行う4×4ブロックの画素a〜pに対して、1列目の画素a、e、i、mに対する予測画像は画素A、2列目の画素b、f、j、nに対する予測画像は画素Bということになる。また、3列目の画素c、g、k、oに対する予測画像は画素C、4列目の画素d、h、l、pに対する予測画像は画素Dということになる。
また、予測モード2はDC予測であり、式(3)で示される画素が画素a〜pの全てに対する予測画像となる。
(A+B+C+D+I+J+K+L+4)≫3・・・(3)
このように、各予測モードで生成された予測画像と符号化画像との間で減算を行い、画素差分データを生成する。この画素差分データを用いて、どのイントラ予測モードを用いて符号化を行うかを選択する。例えば、予測モード0から予測モード8のうちで、画素差分値の総和が最も小さいものをイントラ予測モードとして選択する。
特徴検出を用いてプレーン選択を行った場合のイントラ予測への影響について、図5を用いて説明する。これから符号化が行われるRGB 4:4:4:フォーマットのマクロブロック501があり、これをRプレーンに分けたものがマクロブロック502、Gプレーンに分けたものがマクロブロック503、Bプレーンに分けたものがマクロブロック504である。
ここで、Rプレーンのマクロブロック502、Gプレーンのマクロブロック503は画像の特徴として平坦であり、Bプレーンのマクロブロック504は画像の特徴として横方向に強い相関を持っているものとする。
Rプレーンのマクロブロック502、Gプレーンのマクロブロック503は画像の特徴として平坦であり、この場合マクロブロック内の分散値は小さい値となる。一方、Bプレーンのマクロブロック504は画像の特徴として横方向に強い相関があり、この場合マクロブロック内の分散値は大きい値となる。
Rプレーンのマクロブロック502とGプレーンのマクロブロック503は平坦なため、イントラ予測モードとしてどの予測モードを選択しても予測画像と符号化画像の画素差分値の違いが出にくく、イントラ予測モード選択への影響は少ない。
一方、Bプレーンのマクロブロック504は画像の特徴として横方向に相関が強いという特徴を持っている。この場合、縦方向からの予測モードでは予測画像と符号化画像の画素差分値は大きくなりやすいが、横方向からの予測モードでは予測画像と符号化画像の画素差分値は小さくなりやすくなる。すなわち、Bプレーンのマクロブロック504においては、イントラ予測モード選択の影響が大きくなる。
この場合、イントラ予測モード選択への影響が少ないRプレーンやGプレーンよりも、イントラ予測モード選択への影響が大きいBプレーンを用いてイントラ予測を行った方がイントラ予測モード選択の精度が高くなる。すなわち、画像の特徴として符号化を行うマクロブロックのRGB各プレーンごとの分散値を算出し、分散値の高いプレーンを用いてイントラ予測モード選択を行うことにより、イントラ予測モード選択の精度を保ちつつ、演算量を削減することができる。
イントラ予測部104では、決定したイントラ予測モードを用いて、RGB各プレーンごとにローカルデコード画像を用いて予測画像を生成し、予測画像と符号化画像との間で画素の差分をとり、その差分画像を直交変換部105に出力する。またローカルデコード画像作成用に、予測画像を動き補償部111に出力する。
直交変換部105では、送られてきた差分画像に対して直交変換(例えば離散コサイン変換)を行い、変換係数を生成し、量子化部106に出力する。
量子化部106では、送られてきた変換係数に対して、量子化制御部107が出力する量子化パラメータに従い、量子化を行う。量子化された変換係数はエントロピー符号化部108、ならびローカルデコード画像作成のため逆量子化部109に送られる。
エントロピー符号化部108では、量子化後の変換係数に対してジグザグスキャン、オルタネートスキャン等を行い、可変長符号化が行われる。これに対して、動きベクトルや量子化パラメータ、マクロブロック分割情報などの符号化方式情報を可変長符号化したものを付加し、符号化ストリームを生成する。また、符号化の際にマクロブロックごとの発生符号量を算出し、量子化制御部107に送る。
量子化制御部107では、量子化パラメータを決定する。エントロピー符号化部108から発生符号量を受け取り、目標とする符号量になるように量子化パラメータを決定し、量子化部106へ出力する。
逆量子化部109では、入力された量子化後の変換係数に対して逆量子化を行い、ローカルデコード用の変換係数を生成し、逆直交変換部110に出力する。
逆直交変換部110では、入力された変換係数に対して、前述の直交変換の逆変換(例えば逆離散コサイン変換)を行い、差分画像を生成する。差分画像は動き補償部111に出力される。
動き補償部111では、イントラ予測部104から送られてきたイントラ予測用の予測画像と、逆直交変換部110から送られてきた差分画像とを加算することにより、ローカルデコード用の画像データを生成する。生成された画像データはデブロッキングフィルタ部112に出力される。
デブロッキングフィルタ部112では、入力された画像データに対してデブロッキングフィルタをかける。デブロッキングフィルタ後の画像が、ローカルデコード画像として参照フレームバッファ113に格納される。
このようにして、符号化ストリーム、ローカルデコード画像が生成される。
以上のように、本実施形態においてはマクロブロックごとに画像の特徴検出を行う。そして、その特徴に基づいてRGBの3プレーンから一つのプレーンを選択し、選択したプレーンのみを用いてイントラ予測モードの決定を行うことで、イントラ予測モード選択の精度を落とすことなく演算量を大幅に削減することができる。
なお、本実施形態においては、画像フォーマットとしてRGB 4:4:4フォーマットを例に説明したが、本発明はこれに限ったものではなく、他の色空間であってもよい。
また、画像圧縮符号化方式としてH.264符号化方式を例に説明したが、符号化方式はこれに限ったものではなく、例えばH.265(HEVC)などのようにイントラ予測符号化を用いるものであれば、どのような画像圧縮符号化方式に適用してもよい。
(第2の実施形態)
本実施形態は、第1の実施形態と同様にイントラ予測を用いて符号化を行う画像符号化装置である。
図6は、本実施形態に係る画像符号化装置の構成例を示すブロック図である。ここでは、第1の実施形態と同じ構成については同じ符号を付して説明を省略し、第1の実施形態との差異についてのみ詳細に説明する。
第1の実施形態との違いは、符号化画像の特徴検出に加え、4:4:4フォーマットの持つ色空間の性質を鑑み、各プレーンの選択されやすさに重みを付けたプレーン選択を行うことである。
重み算出部601は、符号化画像の色空間情報を受け取り、色空間に応じた重み係数を算出する。この色空間情報とは、例えば符号化画像がRGB 4:4:4フォーマットであるとか、ITU−R BT.601のYCbCr 4:4:4フォーマットであるという情報である。ここでは、例として符号化画像がRGB 4:4:4フォーマットであるとする。
RGB信号の場合、各プレーンにおいて輝度信号Yとの相関度合いが異なる。一般に、色差信号Cb、Crよりも輝度信号Yの方が符号化劣化に対する視覚的な影響が大きいという特性があり、輝度信号Yとの相関が強いほど符号化劣化に対する視覚的な影響が大きくなる。この特性を考慮し、プレーン選択の際に各プレーンで重みづけをし、選択されやすさを変更する。
Rプレーンに対する重み係数をα、Gプレーンに対する重み係数をβ、Bプレーンに対する重み係数をγとし、重み算出部601ではこれらの値を算出する。これらの係数は、値が大きいほど該当するプレーンが選択されやすくなるものとする。RGB信号の場合、G>R>Bの順で輝度信号Yとの相関が強く、符号化劣化に対する視覚的な影響が大きくなるため、式(4)のような関係の係数を算出する。
β>α>γ…(4)
算出した重み係数α、β、γはプレーン選択部602に出力される。
プレーン選択部602では輝度信号の成分を多く含むものほど選択されやすくなる。
なお、ここではRGB 4:4:4フォーマットの画像が入力された場合の例を示したが、他の色空間の画像が入力された場合は、その色空間の特性に応じた異なる係数を算出することになる。例えば、入力画像がYCbCr 4:4:4フォーマットであり、Y信号のみでイントラ予測を行いたい場合などは、Y信号の重み係数を1にし、Cb、Cr信号の重み係数を0にする、ということも可能である。
プレーン選択部602では、特徴検出部102から画像特徴情報として分散値を受け取る。ここでは、Rプレーンの分散値をVAR_R、Gプレーンの分散値をVAR_G、Bプレーンの分散値をVAR_Bとする。また重み算出部601から重み係数α、β、γを受け取る。
この分散値に重み係数をかけたものが、プレーン選択の評価値となる。各プレーンの評価値をそれぞれestmR、estmG、estmBとし、式(5)に示す。
Figure 2015103969
プレーン選択部602はestmR、estmG、estmBを比較し、最も大きい評価値を持つプレーンを選択する。選択されたプレーン情報は、イントラ予測部104に出力され、第1の実施形態と同様の処理が行われる。
以上のように、色空間情報を用いてイントラ予測モード選択に用いるプレーン選択に重みをつけることで、視覚特性の影響を考慮した精度の高いイントラ予測モード選択を行うことができる。
(第3の実施形態)
第1の実施形態及び第2の実施形態は、イントラ予測を用いて符号化する画像符号化装置について述べた。本実施形態においては、動き探索を行うことにより符号化する画像符号化装置について説明する。
図7は、本実施形態に係る画像符号化装置の構成例を示すブロック図である。以下、本実施形態の画像符号化装置の構成例において、各ブロックの動作について説明する。なお、本実施形態の説明において4:4:4画像信号は色空間としてRGBを用いた例として説明するが、本発明はこれに限定されるものではなく他の色空間であってもよい。
画像入力部701に外部から入力されたRGB 4:4:4フォーマットの画像信号(以下RGB信号)はメモリインターフェース705を介し、メモリ704の入力画像格納領域に入力画像データとして格納される。メモリ704は、入力画像データを保持する入力画像メモリ、及び参照画像データを保持する参照画像メモリとして機能する。
メモリインターフェース705は、各ブロック(画像入力部701、動き探索部702、動き補償部703)からの読み書き要求を調停してメモリ704にデータの読み書き制御を行うインターフェースである。
メモリ704は、DRAM等のランダムアクセスメモリであり、入力画像データを格納する入力画像格納領域と、参照画像データを格納する参照画像格納領域を有している。
メモリ704の入力画像格納領域に格納された入力画像データはマクロブロック単位にメモリインターフェース705を介して読み出されて、画像特徴検出部711および動き探索部702に入力される。
画像特徴検出部711は、入力された入力画像データのRGB各プレーンの画像特徴をマクロブロック毎に検出して画像特徴情報をプレーン選択部712に出力する。画像特徴の検出は、例えばアクティビティを検出する。アクティビティは、ブロック内の画素値がブロック平均値からどれほど散らばっているかを示す分散によって求められる。また、画像特徴の検出はこれ以外にも、エッジ検出、周波数スペクトルなどを組み合わせてもよい。
プレーン選択部712は、各プレーンの画像特徴情報を比較して、最も動き探索に適したプレーンをマクロブロック毎に選択してプレーン選択情報として動き探索部702に出力する。画像特徴情報が、例えばアクティビティであれば最も高いアクティビティ値のプレーンを選択するようにしてもよい。
なお、本実施形態は、画像特徴検出部711の具体的な検出方法、プレーン選択部712の具体的な選択方法に限定されるものではない。
動き探索部702は、プレーン選択部712からのプレーン選択情報に基づいて、マクロブロック毎に予測モードの判定と動き探索を行う。動き探索のための入力画像データは、前述のようにRGB信号の全プレーンが入力されているが、このうちからプレーン選択情報に示されるプレーンを選択して用いる。一方、参照画像データはプレーン選択情報に示されるプレーンの画像データのみをメモリ704からメモリインターフェース705を介して読み出して用いる。
前述のようにして求めた予測モード情報および動きベクトル情報を、動き補償部703に出力する。
動き補償部703は、メモリ704に格納された入力画像データと、同じく格納された参照画像データを、メモリインターフェース705を介して読み出して、マクロブロック単位に動き補償予測処理と局部復号処理を行う。
動き補償部703における動き補償予測処理は、動き探索部702からの予測モード情報および動きベクトル情報を用いて参照画像データから予測画像データを生成し、入力画像データとの差分値を予測残差画像データとして直交変換部706に出力する。
動き補償部703における局部復号処理は、逆直交変換部709からの予測残差画像データと、メモリインターフェース705から入力される参照画像データを用いて、局部復号画像データを生成する。生成した局部復号画像データはメモリインターフェース705を介して、メモリ704の参照画像格納領域に格納される。
直交変換部706は、入力された予測残差画像データにDCT等の直交変換を施して変換係数データを量子化部707に出力する。
量子化部707は、変換係数データを量子化し、逆量子化部708及びエントロピー符号化部710に出力する。
逆量子化部708は、量子化部707で量子化された変換係数データを逆量子化し、逆直交変換部709に出力する。
逆直交変換部709は、逆量子化部708で逆量子化された変換係数データを逆直交変換し、局部復号に用いる予測残差画像データを動き補償部703に出力する。
エントロピー符号化部710は、量子化部707で量子化された変換係数データと、マクロブロック毎の予測モード、動きベクトルなどの符号化情報を、符号化方式で規定されたエントロピー符号化を施して、符号化データとして外部に出力する。エントロピー符号化部710から出力された符号化データは非図示の伝送媒体や記録媒体に出力される。
以上、説明したように、本実施形態においては、動き探索部702がメモリ704から読み出した入力画像データを用いて、各プレーンの画像特徴を検出し、最も動き探索に適したプレーンを選択するようにした。動き探索部702は選択されたプレーンの画像データのみを用いて動き探索を行うようにした。
これにより、動き探索の処理量を上げずに4:4:4画像信号の動き探索を精度よく行うことができる。また、動き探索部702がメモリ704から読み出す参照画像データは、選択されたプレーンのみを読み出すようにした。これにより、メモリからの画像データの読み出し量が抑えられる。
(第4の実施形態)
本実施形態は、第3の実施形態と同様に動き探索により符号化を行う画像符号化装置について説明する。
図8は、本実施形態に係る画像符号化装置の構成例を示すブロック図である。以下、本実施形態の画像符号化装置の構成例において、各ブロックの動作について説明する。なお、本実施形態の説明において4:4:4画像信号は色空間としてRGBを用いた例として説明するが、本発明はこれに限定されるものではなく他の色空間であってもよい。
図8において、画像入力部701、動き補償部703、メモリ704、メモリインターフェース705、直交変換部706、量子化部707、逆量子化部708、逆直交変換部709、エントロピー符号化部710は、図7で説明した各部に相当する。
第3の実施形態と第4の実施形態の相違点は、プレーン選択情報の生成方法にある。また、第4の実施形態においては、画像入力部701に外部から入力されたRGB4:4:4フォーマットの画像信号はメモリインターフェース705を介し、メモリ704の入力画像格納領域に入力画像データとして格納される。また、画像特徴検出部711にも出力される。
画像特徴検出部711は、入力された入力画像データのRGB各プレーンの画像特徴をマクロブロック毎に検出して画像特徴情報をプレーン選択部712に出力する。画像特徴の検出は、例えばアクティビティを検出する。アクティビティは、ブロック内の画素値がブロック平均値からどれほど散らばっているかを示す分散によって求められる。また、画像特徴の検出はこれ以外にも、エッジ検出、周波数スペクトルなどを組み合わせてもよい。
プレーン選択部712は、各プレーンの画像特徴情報を比較して、最も動き探索に適したプレーンをマクロブロック毎に選択してプレーン選択情報としてプレーン選択情報保持部801に出力する。画像特徴情報が、例えばアクティビティであれば最も高いアクティビティ値のプレーンを選択するようにしてもよい。
なお、本発明は画像特徴検出部711の具体的な検出方法、プレーン選択部712の具体的な選択方法に限定されるものではない。
プレーン選択情報保持部801は、マクロブロック毎のプレーン選択情報を複数ピクチャ分保持することが可能なメモリで構成されており、プレーン選択部712からのプレーン選択情報を一旦保持する。保持されたプレーン選択情報は、動き探索部702において該当するピクチャが処理されるタイミングで動き探索部702に出力される。
動き探索部702は、プレーン選択情報保持部801からのプレーン選択情報を基づいて、マクロブロック毎に予測モードの判定と動き探索を行う。動き探索のための入力画像データおよび参照画像データはプレーン選択情報に示されるプレーンの画像データのみをメモリ704からメモリインターフェース705を介して読み出して用いる。
このようにして求めた予測モード情報および動きベクトル情報を動き補償部703に出力する。
以上、説明したように、第4の実施形態においては、画像入力部701からの入力画像データを用いて、各プレーンの画像特徴を検出し、最も動き探索に適したプレーンを選択し、プレーン選択情報をプレーン選択情報保持部801に保持するようにした。また、動き探索部702は、選択されたプレーンの画像データのみを用いて動き探索を行うようにした。
これにより、動き探索の処理量を上げずに4:4:4画像信号の動き探索を精度よく行うことができる。また、動き探索部702がメモリ704から読み出す入力画像データおよび参照画像データは、選択されたプレーンのみを読み出すようにした。これによりメモリからの画像データの読み出し量が第3の実施形態よりもさらに抑えられる。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。即ち、前述した実施形態の機能を実現するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種のコンピュータ読み取り可能な記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
101 フレームバッファ
102 特徴検出部
103 プレーン選択部
104 イントラ予測部
105 直交変換部
106 量子化部
107 量子化制御部
108 エントロピー符号化部
109 逆量子化部
110 逆直交変換部
111 動き補償部
112 デブロッキングフィルタ部
113 参照フレームバッファ

Claims (23)

  1. 4:4:4フォーマットの画像を符号化する画像符号化装置であって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出手段と、
    前記画像特徴検出手段で検出された各プレーンの画像特徴に応じてプレーンを選択するプレーン選択手段と、
    前記4:4:4フォーマットの画像を符号化する際の参照画像を格納するための格納手段と、
    前記プレーン選択手段で選択されたプレーンの画像データと、前記格納手段に格納されている参照画像とを用いて符号化を行う符号化手段とを備えることを特徴とする画像符号化装置。
  2. 4:4:4フォーマットの画像を符号化する画像符号化装置であって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出手段と、
    前記画像特徴検出手段で検出された各プレーンの画像特徴に応じてプレーンを選択するプレーン選択手段と、
    イントラ予測を行うイントラ予測手段とを備え、
    前記プレーン選択手段で選択されたプレーンの画像データを用いてイントラ予測を行うことを特徴とする画像符号化装置。
  3. 前記プレーン選択手段は、符号化画像の色空間情報に応じて、各プレーンの選択されやすさを変更することを特徴とする請求項2に記載の画像符号化装置。
  4. 前記プレーン選択手段は、各プレーンにおいて輝度信号の成分を多く含むものを選択することを特徴とする請求項3に記載の画像符号化装置。
  5. 前記画像特徴検出手段で検出される画像特徴は、画像の分散値であることを特徴とする請求項1〜4の何れか1項に記載の画像符号化装置。
  6. 前記プレーン選択手段は、画像の分散値が最も高いプレーンを選択することを特徴とする請求項5に記載の画像符号化装置。
  7. 前記画像特徴検出手段で検出される画像特徴は、エッジの大きさを表す値であることを特徴とする請求項1〜6の何れか1項に記載の画像符号化装置。
  8. 前記プレーン選択手段は、エッジ成分が最も大きいプレーンを選択することを特徴とする請求項7に記載の画像符号化装置。
  9. 前記画像特徴検出手段で検出される画像特徴が空間周波数の大きさを表す値であることを特徴とする請求項1〜8の何れか1項に記載の画像符号化装置。
  10. 前記プレーン選択手段は、空間周波数が最も高いプレーンを選択することを特徴とする請求項1〜9の何れか1項に記載の画像符号化装置。
  11. 4:4:4フォーマットの画像を符号化する画像符号化装置であって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出手段と、
    前記画像特徴検出手段で検出された各プレーンの画像特徴に応じてプレーンを選択し、プレーン選択情報として出力するプレーン選択手段と、
    入力画像データを保持する入力画像メモリ手段と、
    参照画像データを保持する参照画像メモリ手段と、
    動き探索を行う動き探索手段と、を備え、
    前記動き探索手段は、前記プレーン選択手段で選択されたプレーンの画像データを用いて動き探索を行うことを特徴とする画像符号化装置。
  12. 前記画像特徴検出手段は、前記動き探索手段に入力される入力画像データの画像特徴を検出することを特徴とする請求項11に記載の画像符号化装置。
  13. 前記プレーン選択手段からのブロック毎の選択情報を複数ピクチャ分保持し、前記動き探索手段の動作に合わせて出力するプレーン選択情報保持手段をさらに備えることを特徴とする請求項11に記載の画像符号化装置。
  14. 前記画像特徴検出手段は、前記入力画像メモリ手段に入力される入力画像データの画像特徴を検出することを特徴とする請求項13に記載の画像符号化装置。
  15. 前記画像特徴検出手段で検出される画像特徴はアクティビティ値であることを特徴とする請求項11〜14の何れか1項に記載の画像符号化装置。
  16. 前記画像特徴検出手段で検出される画像特徴はエッジの大きさを表す値であることを特徴とする請求項11〜14の何れか1項に記載の画像符号化装置。
  17. 4:4:4フォーマットの画像を符号化する画像符号化方法であって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出工程と、
    前記画像特徴検出工程で検出された各プレーンの画像特徴に応じてプレーンを選択するプレーン選択工程と、
    前記4:4:4フォーマットの画像を符号化する際の参照画像を記録媒体に格納するための格納工程と、
    前記プレーン選択工程で選択されたプレーンの画像データと、前記記録媒体に格納されている参照画像とを用いて符号化を行う符号化工程とを備えることを特徴とする画像符号化方法。
  18. 4:4:4フォーマットの画像を符号化する画像符号化方法であって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出工程と、
    前記画像特徴検出工程で検出された各プレーンの画像特徴に応じてプレーンを選択するプレーン選択工程と、
    イントラ予測を行うイントラ予測工程とを備え、
    前記プレーン選択工程で選択されたプレーンの画像データを用いてイントラ予測を行うことを特徴とする画像符号化方法。
  19. 4:4:4フォーマットの画像を符号化する画像符号化方法であって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出工程と、
    前記画像特徴検出工程で検出された各プレーンの画像特徴に応じてプレーンを選択し、プレーン選択情報として出力するプレーン選択工程と、
    入力画像データを保持する入力画像メモリ工程と、
    参照画像データを保持する参照画像メモリ工程と、
    動き探索を行う動き探索工程と、を備え、
    前記動き探索工程は、前記プレーン選択工程で選択されたプレーンの画像データを用いて動き探索を行うことを特徴とする画像符号化方法。
  20. 4:4:4フォーマットの画像を符号化する画像符号化方法をコンピュータに実行させるプログラムであって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出工程と、
    前記画像特徴検出工程で検出された各プレーンの画像特徴に応じてプレーンを選択するプレーン選択工程と、
    前記4:4:4フォーマットの画像を符号化する際の参照画像を記録媒体に格納するための格納工程と、
    前記プレーン選択工程で選択されたプレーンの画像データと、前記記録媒体に格納されている参照画像とを用いて符号化を行う符号化工程とをコンピュータに実行させることを特徴とするプログラム。
  21. 4:4:4フォーマットの画像を符号化する画像符号化方法をコンピュータに実行させるプログラムであって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出工程と、
    前記画像特徴検出工程で検出された各プレーンの画像特徴に応じてプレーンを選択するプレーン選択工程と、
    イントラ予測を行うイントラ予測工程とをコンピュータに実行させ、
    前記プレーン選択工程で選択されたプレーンの画像データを用いてイントラ予測を行うことを特徴とするプログラム。
  22. 4:4:4フォーマットの画像を符号化する画像符号化方法をコンピュータに実行させるプログラムであって、
    入力画像データの各プレーンの画像特徴をブロック毎に検出する画像特徴検出工程と、
    前記画像特徴検出工程で検出された各プレーンの画像特徴に応じてプレーンを選択し、プレーン選択情報として出力するプレーン選択工程と、
    入力画像データを保持する入力画像メモリ工程と、
    参照画像データを保持する参照画像メモリ工程と、
    動き探索を行う動き探索工程とをコンピュータに実行させ、
    前記動き探索工程は、前記プレーン選択工程で選択されたプレーンの画像データを用いて動き探索を行うことを特徴とするプログラム。
  23. 請求項20〜22の何れか1項に記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2013243204A 2013-11-25 2013-11-25 画像符号化装置及び画像符号化方法 Expired - Fee Related JP6265705B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013243204A JP6265705B2 (ja) 2013-11-25 2013-11-25 画像符号化装置及び画像符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013243204A JP6265705B2 (ja) 2013-11-25 2013-11-25 画像符号化装置及び画像符号化方法

Publications (3)

Publication Number Publication Date
JP2015103969A true JP2015103969A (ja) 2015-06-04
JP2015103969A5 JP2015103969A5 (ja) 2017-01-12
JP6265705B2 JP6265705B2 (ja) 2018-01-24

Family

ID=53379349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013243204A Expired - Fee Related JP6265705B2 (ja) 2013-11-25 2013-11-25 画像符号化装置及び画像符号化方法

Country Status (1)

Country Link
JP (1) JP6265705B2 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006310941A (ja) * 2005-04-26 2006-11-09 Kddi Corp 画像符号化装置
WO2007010690A1 (ja) * 2005-07-22 2007-01-25 Mitsubishi Electric Corporation 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法、画像符号化プログラム、画像復号プログラム、ならびに画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体、画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2007081821A2 (en) * 2006-01-10 2007-07-19 Thomson Licensing Methods and apparatus for parallel implementations of 4:4:4 coding
JP2008172599A (ja) * 2007-01-12 2008-07-24 Mitsubishi Electric Corp 動画像符号化装置、動画像復号装置、動画像符号化方法、および動画像復号方法
WO2009001864A1 (ja) * 2007-06-28 2008-12-31 Mitsubishi Electric Corporation 画像符号化装置および画像復号装置
JP2010239423A (ja) * 2009-03-31 2010-10-21 Kddi R & D Laboratories Inc 撮影解像度予測型動画像符号化装置および復号装置
JP2012095101A (ja) * 2010-10-27 2012-05-17 Kddi Corp 色コンポーネント間予測型画像符号化装置および復号装置
JP2013106302A (ja) * 2011-11-16 2013-05-30 Kddi Corp 色コンポーネント間予測型画像符号化装置および復号装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006310941A (ja) * 2005-04-26 2006-11-09 Kddi Corp 画像符号化装置
WO2007010690A1 (ja) * 2005-07-22 2007-01-25 Mitsubishi Electric Corporation 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法、画像符号化プログラム、画像復号プログラム、ならびに画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体、画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体
WO2007081821A2 (en) * 2006-01-10 2007-07-19 Thomson Licensing Methods and apparatus for parallel implementations of 4:4:4 coding
JP2008172599A (ja) * 2007-01-12 2008-07-24 Mitsubishi Electric Corp 動画像符号化装置、動画像復号装置、動画像符号化方法、および動画像復号方法
WO2009001864A1 (ja) * 2007-06-28 2008-12-31 Mitsubishi Electric Corporation 画像符号化装置および画像復号装置
JP2010239423A (ja) * 2009-03-31 2010-10-21 Kddi R & D Laboratories Inc 撮影解像度予測型動画像符号化装置および復号装置
JP2012095101A (ja) * 2010-10-27 2012-05-17 Kddi Corp 色コンポーネント間予測型画像符号化装置および復号装置
JP2013106302A (ja) * 2011-11-16 2013-05-30 Kddi Corp 色コンポーネント間予測型画像符号化装置および復号装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
加藤晴久 他: "H.264のIntra予測残差に対する適応的チャネル間予測", 映像情報メディア学会誌, vol. 第64巻,第11号, JPN6017033527, 2010, pages 1711 - 1717, ISSN: 0003633554 *

Also Published As

Publication number Publication date
JP6265705B2 (ja) 2018-01-24

Similar Documents

Publication Publication Date Title
US9743088B2 (en) Video encoder and video encoding method
US9723316B2 (en) Image encoding device, image decoding device, image encoding method, image decoding method, and image prediction device
JP7239711B2 (ja) クロマブロック予測方法及び装置
JP5988577B2 (ja) 画像符号化装置、画像符号化方法及びプログラム
JP5158096B2 (ja) 符号化用データ生成装置、符号化用データ生成方法、復号装置および復号方法
US20150146776A1 (en) Video image encoding device, video image encoding method
US9319688B2 (en) Moving image encoding apparatus
US10034016B2 (en) Coding apparatus, computer system, coding method, and computer product
JP6137817B2 (ja) 画像符号化装置、画像符号化方法及びプログラム
JP2010098352A (ja) 画像情報符号化装置
JPWO2017203941A1 (ja) 画像処理装置、および画像処理方法、並びにプログラム
US20160057429A1 (en) Coding apparatus, method, computer product, and computer system
US9277213B2 (en) Video encoding device
JP6265705B2 (ja) 画像符号化装置及び画像符号化方法
JP6065090B2 (ja) 動画像復号装置、動画像復号方法、動画像復号プログラム
JP6317720B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム
JP6066583B2 (ja) 動画像符号化装置及び動画像符号化方法
JP6311821B2 (ja) 動画像処理装置及び動画像処理方法
JP6410513B2 (ja) 画像符号化装置及び方法
JP2016054514A (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム
JP5346871B2 (ja) 符号化装置、復号装置及びプログラム
JP2015005957A (ja) 画像符号化装置及び、画像符号化方法及びプログラム
US20140119448A1 (en) Moving image encoding apparatus, image capturing apparatus, and method of controlling moving image encoding apparatus
JP2018082250A (ja) 画像符号化装置及びその制御方法
JP2016165065A (ja) 画像用ノイズ低減装置、画像用符号化装置、及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161122

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171121

R151 Written notification of patent or utility model registration

Ref document number: 6265705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees