JP2005295074A - 画像符号化装置及びプログラム - Google Patents

画像符号化装置及びプログラム Download PDF

Info

Publication number
JP2005295074A
JP2005295074A JP2004105382A JP2004105382A JP2005295074A JP 2005295074 A JP2005295074 A JP 2005295074A JP 2004105382 A JP2004105382 A JP 2004105382A JP 2004105382 A JP2004105382 A JP 2004105382A JP 2005295074 A JP2005295074 A JP 2005295074A
Authority
JP
Japan
Prior art keywords
image
block
encoding target
search
motion compensation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004105382A
Other languages
English (en)
Inventor
Norimichi Hiwasa
憲道 日和佐
Kanji Sakate
寛治 坂手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2004105382A priority Critical patent/JP2005295074A/ja
Publication of JP2005295074A publication Critical patent/JP2005295074A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 符号化対象画像から求めた画像特性に基づいて動き補償探索における最適な探索ブロックの大きさを決定し、画像内の物体の動きに正確に追従した動きベクトルを得ることで画質劣化を防止することができる画像符号化装置を提供する。
【解決手段】 時間軸上に並んだ複数の画像より構成される符号化対象画像を入力し、符号化対象画像の視覚的な特性を示す画像特性パラメータを算出する画像特性演算部16と、画像特性パラメータで示される符号化対象画像の視覚的な特性に応じて動き補償探索を実行すべきサイズの画素ブロックを判定し、動き補償探索の探索ブロックとする探索ブロックサイズ判定部17と、探索ブロックサイズ判定部17により決定された探索ブロックで動き補償探索を実行する動き補償予測部13とを備える。
【選択図】 図1

Description

この発明は、例えばMPEG(Moving Picture image coding Experts Group)などの動き補償符号化を実行する画像符号化装置及びこれをコンピュータに実現させるプログラムに関するものである。
例えば、非特許文献1に開示される従来の画像符号化では、符号化が終了したフレームを復号して参照画像として符号化対象ブロックに最も近い予測画像を求める動き補償探索を実行する。このとき、フレーム動き補償予測であれば、入力した符号化対象画像フレーム内の16画素×16ラインの符号化対象ブロックと参照画像フレーム内の同一大きさのブロックとの間で画素値の差分絶対値和あるいは差分二乗和を演算し、動き補償予測における評価値とされる。また、フィールド動き補償予測である場合は、トップフィールド及びボトムフィールド内の16画素×8ラインのブロックでそれぞれ評価値の演算が行われる。このようにして求めた評価値が最小となるブロックが参照画像として符号化される。
テレビジョン学会誌,"画像情報工学と放送技術",Vol.49 No.4 1995
従来の画像符号化装置による動き補償予測では、一般的に符号化対象ブロックと参照画像の同一の大きさのブロックとの間で算出した画素値の差分絶対値和あるいは差分二乗和を動き補償予測における評価値としている。この場合、符号化対象ブロック内に物体の輪郭や細やかな模様などが存在すれば、上述のようにして求めた差分絶対値和や差分二乗和を使用した評価値によって精度良く物体の動きを追従した動きベクトルを得ることができる。
しかしながら、符号化対象ブロック内に物体の輪郭や細やかな模様などが存在せず、平坦な画像であると動きベクトルを求める基点となる部分が画像内になく、上記評価値で求められる動きベクトルが必ずしも物体の動きを正確に追従しない場合がある。この場合、直前の符号化対象ブロックの動きベクトルとの相関が低くなり、動きベクトルに費やされる情報量が増大することで極端な画質劣化を招くという課題があった。
この発明は上記のような課題を解決するためになされたもので、符号化対象画像から求めた画像特性に基づいて動き補償探索における最適な探索ブロックの大きさを決定し、画像内の物体の動きに正確に追従した動きベクトルを得ることで画質劣化を防止することができる画像符号化装置及びこれをコンピュータに実現させるプログラムを得ることを目的とする。
この発明に係る画像符号化装置は、時間軸上に並んだ複数の画像より構成される符号化対象画像を入力し、符号化対象画像の視覚的な特性を示す画像特性パラメータを算出する画像特性演算部と、画像特性パラメータで示される符号化対象画像の視覚的な特性に応じて動き補償探索を実行すべきサイズの画素ブロックを判定して、動き補償探索の探索ブロックとする探索ブロックサイズ判定部と、探索ブロックサイズ判定部により決定された探索ブロックで動き補償探索を実行する動き補償予測部とを備えるものである。
この発明によれば、時間軸上に並んだ複数の画像より構成される符号化対象画像を入力し、符号化対象画像の視覚的な特性を示す画像特性パラメータを算出する画像特性演算部と、画像特性パラメータで示される符号化対象画像の視覚的な特性に応じて動き補償探索を実行すべきサイズの画素ブロックを判定して、動き補償探索の探索ブロックとする探索ブロックサイズ判定部と、探索ブロックサイズ判定部により決定された探索ブロックで動き補償探索を実行する動き補償予測部とを備えるので、物体の動きを正確に追従した動きベクトルを得ることができ、動きベクトルに費やされる情報量も小さくなり、全体として画質を向上させることができるという効果がある。
なお、従来の画像符号化装置では、フレーム画像間で物体の動きが大きい場合にその動きを捕らえることができるように探索範囲を拡げて動き補償予測の効率が低下しないように構成したものが提案されている。
これに対して、本発明では、探索範囲内に参照画像として符号化対象ブロックに一番近い画像が存在して、物体の動きを捕らえるという観点においては十分な探索範囲であっても、差分絶対値和などの現在広く使用されている動き補償予測の評価値判定で正確に参照画像として最適な画像を選択することが困難な場合を解消するものである。
つまり、MPEG−2符号化方式において、例えば単一色で塗装された車体の表面部の画像では、複雑な画像成分がなく上記評価値にはそれほど大差が生じない。このため、車体表面の符号化対象ブロックに対して別の位置にある参照画像が選択される場合が多くある。この場合、符号化対象ブロックごとに向きも大きさも異なる動きベクトルを選択することになり、1つ前の符号化対象ブロックの動きベクトルとの差分が大きくなって、これに費やされる情報量も大きくなる。
そこで、本発明では、探索ブロックのサイズを、例えば車体の輪郭部分まで含むように拡大することで、車が実際に移動しているのと同じ動きベクトルを選択することができ、動きベクトルに費やされる情報量を少なく抑えることができ、符号化効率を向上させることができる。
実施の形態1.
図1は、この発明の実施の形態1による動画像符号化装置の構成を示すブロック図である。以降の説明ではMPEG−2による符号化を例に挙げるが、本発明は動き補償予測を行う符号化処理であればMPEG−2以外にも適用することができる。また、以降では、動き補償予測符号化としてフレーム動き補償予測を例に挙げて説明する。
実施の形態1による画像符号化装置は、メモリ1、減算器2、セレクタ3、DCT(Discrete Cosine Transform)演算器4、量子化器5、可変長符号化部6、バッファ7、逆量子化器8、逆DCT演算器9、フレーム加算器10、セレクタ11、イントラ/インター判定部12、動き補償予測部13、フレームメモリ14及び量子化制御部15からなる基本構成に加え、画像特性演算部16及び探索ブロックサイズ判定部17を備えている。本発明の画像符号化装置は、例えば汎用コンピュータなどを用いて、本発明に従う画像符号化プログラムを実行させることによって具現化することができる。
つまり、画像符号化プログラムをコンピュータに実行させてそのハードウェア構成を上記構成要素1〜17として機能させることにより、本発明の画像符号化装置による特徴的なデータ処理を実行することができる。なお、以下の説明において、本発明の画像符号化装置を具現化するコンピュータ自体の構成及びその基本的な機能については、当業者が当該分野の技術常識に基づいて容易に認識できるものであり、本発明の本質に直接関わるものでないので詳細な記載を省略する。
個々の構成要素の概要を説明すると、メモリ1は、装置内に入力された符号化対象であるディジタルビデオ信号を数フレーム分保持する。減算器2は、メモリ1から読み出されたディジタルビデオ信号とフレームメモリ14から読み出された参照画像とをフレーム間差分してセレクタ3に出力する。セレクタ3は、メモリ1及び減算器2のうちいずれからの信号をDCT演算器4に出力するかを選択する。
DCT演算器4は、セレクタ3からの出力信号を離散コサイン変換して量子化器5に出力する。量子化器5では、DCT演算器4によって離散コサイン変換された信号について量子化処理を実行し可変長符号化部6に出力する。可変長符号化部6は、量子化器5による量子化結果を可変長符号に変換する。バッファ7は、可変長符号化部6により可変長符号化されたビットストリームデータを一時的に保持し必要に応じて装置外部に出力する。
逆量子化器8は、量子化器5により量子化されたディジタル信号を逆量子化処理して逆DCT演算器9に出力する。逆DCT演算器9では、逆量子化器8から入力した信号を逆離散コサイン変換する。フレーム加算器10は、フレームメモリ14から読み出された参照画像と逆DCT演算器9からの出力信号とをフレーム間加算する。セレクタ11では、逆DCT演算器9及び加算器10のうちいずれからの出力信号をフレームメモリ14に出力すべきか選択する。
イントラ/インター判定部12は、メモリ1から符号化対象画像のフレームごとに読み出された符号化対象ブロックについてイントラ(フレーム内)符号化かインター(フレーム間)符号化かを判定する。動き補償予測部13は、メモリ1からの符号化対象ブロック及びフレームメモリ14からの参照画像を用いて動き補償予測を実行する。
フレームメモリ14は、動き補償予測のための参照画像(符号化対象画像において符号化を完了したフレーム画像)を保持する。量子化制御部15は、バッファ7のバッファ量などに応じて量子化部5による量子化処理を制御する。
画像特性演算部16は、装置内に入力された符号化対象であるディジタルビデオ信号の視覚的な画像特性を特定する画像特性パラメータを算出する。画像特性パラメータとしては、画像や画像の一部領域を構成する画素の輝度信号と2つの色差信号についてのそれぞれの平均値と分散値、これらのフレーム間の差分の絶対値和、水平方向周波数分布や垂直方向周波数分布などがある。
また、画像の視覚的な特性を示すパラメータは、符号化対象画像のフレーム内やフレーム間でのフレーム単位で求める以外に、符号化対象ブロック(MPEG−2ではマクロブロックと称す)単位、複数の符号化対象ブロック(マクロブロック)で構成される領域単位、あるいはフレーム画像をいくつかの領域に分割した領域単位で求められる。
探索ブロックサイズ判定部17は、画像特性演算部16が算出した画像特性パラメータに基づき、動き補償予測における最適な探索ブロックの大きさを判定する。また、探索ブロックサイズ判定部17は、上記判定結果に基づいて動き探索処理を実行するようにイントラ/インター判定部12及び動き補償予測部13を制御する。
なお、本発明における探索ブロックとは、動き補償予測の参照画像内での参照ブロックあるいは探索範囲を示すものではなく、符号化対象ブロックそのもの、あるいは符号化対象ブロックを内部に含み、符号化対象ブロック周囲の画素まで含めた拡大した符号化対象ブロックを意味している。また、この探索ブロックは、動き補償予測において動きベクトルを得るためだけに設定するものであり、DCT演算などの符号化を実行するブロックではない。
次に動作について説明する。
符号化対象となるディジタルビデオ信号は、本実施の形態1による画像符号化装置に入力されると、その内部のメモリ1に数フレーム分ずつ一時的に格納される。これに伴い、最初に符号化を行うための上記ビデオ信号のフレームが符号化対象ブロック(マクロブロック)単位でメモリ1から読み出され、減算器2、セレクタ3、イントラ/インター判定部12、動き補償予測部13及び画像特性演算部16にそれぞれ出力される。
動き補償予測部13では、メモリ1から符号化対象ブロック単位の入力画像とフレームメモリ14から読み出した参照画像とを用い、探索ブロックサイズ判定部17により判定された探索ブロックサイズで動き補償予測を行う。この動き補償予測では、符号化対象ブロックに最も近い参照画像内の参照ブロックが求められ、両ブロック内の画素の差分絶対値和あるいは差分二乗和が評価値として算出される。そして、メモリ1から入力した符号化対象ブロックについて参照画像の中から上記評価値が最小となる動きベクトルが求められる。
また、動き補償予測部13は、上述した動き補償予測結果をイントラ/インター判定部12に出力する。イントラ/インター判定部12では、動き補償予測部13からの動き補償予測結果に基づいて、当該符号化対象ブロックの符号化対象ピクチャがイントラ符号化であるかインター符号化であるかを判定する。例えば、符号化対象ピクチャがIピクチャであればイントラ符号化を選択する。この判定結果は、イントラ/インター判定部12から各セレクタ3,11に出力される。
セレクタ3は、イントラ/インター判定部12による判定結果に基づいて、減算器2及びメモリ1のうちのいずれかの入力を選択してDCT演算器4に出力する。ここで、減算器2では、参照画像をフレームメモリ14から読み出した参照画像とメモリ1からの符号化対象画像との差分を求める。この差分情報は、減算器2から符号化対象ブロック単位でセレクタ3に入力される。
ここで、イントラ/インター判定部12の判定結果がイントラ符号化であると、メモリ1からの符号化対象ブロックを選択してDCT演算器4に出力する。一方、インター符号化であると、セレクタ3は、減算器2からの差分情報を選択して符号化対象ブロック単位でDCT演算器4に出力する。
DCT演算器4では、セレクタ3からの符号化対象ブロック単位の画像データに対してDCTを実行し、そのDCT係数を量子化器5に出力する。量子化器5は、量子化制御部15により設定された量子化パラメータに従って、DCT演算器4からのDCT係数を量子化して可変長符号化部6及び逆量子化器8に出力する。
可変長符号化部6は、量子化器5から入力した量子化結果データを可変長符号に変換してバッファ7に保持する。バッファ7では、可変長符号化部6からの符号化データを一時的に蓄えた後、所定の転送レートのビットストリームとして外部に出力する。また、バッファ7におけるデータの占有量を示すバッファ量は、量子化制御部15によって読み出される。
また、逆量子化器8では、量子化器5から入力した量子化結果データ逆量子化処理が行われ、その結果が逆DCT演算器9に出力される。逆DCT演算器9は、逆量子化器8からのデータに対して逆DCT処理を実行する。この逆DCTされたデータは、逆DCT演算器9からフレーム加算器10及びセレクタ11に出力される。
セレクタ11では、フレームメモリ14に出力すべきデータとして、イントラ/インター判定部12からの判定結果に応じて、逆DCT演算器9からの出力データ、及び、フレーム加算器10により逆DCT演算器9からの出力データにフレームメモリ14の参照画像をフレーム加算された画像データのうちのいずれかを選択する。
例えば、イントラ/インター判定部12からの判定結果がイントラ符号化であれば、フレーム内符号化されて復号された画像データとして、逆DCT演算器9からの出力データが選択されてフレームメモリ14に格納される。一方、判定結果がインター符号化であれば、フレーム間符号化されて復号された画像データとして、フレーム加算器10からの画像データが選択されてフレームメモリ14に格納される。
フレームメモリ14に格納されたセレクタ11からの出力データは、次の符号化フレームの動き補償予測の参照画像として使用される。一方、量子化制御部15は、バッファ7から読み出したバッファ量に応じて量子化器5による量子化レートを制御する。これにより、バッファ7でデータがオーバーフローやアンダーフローを起こさないように調整される。
次に探索ブロックのサイズ判定処理を説明する。
先ず、画像特性演算部16が、メモリ1から減算器2やセレクタ3に読み出される符号化対象画像を入力してその画像解析を行う。このとき、画像特性演算部16は、符号化対象ブロック並びにこれと境界が接するM画素×Nライン(但し、M、Nは任意の正整数)の領域を構成する画素の輝度信号と2つの色差信号についてのそれぞれ平均値と分散値、フレーム間の差分の絶対値和、水平方向周波数分布や垂直方向周波数分布などを求める。これらの画像特性パラメータは、符号化対象画像についての視覚的な精細度を表す指標となる。
また、画像の視覚的な特性を示すパラメータは、符号化対象画像のフレーム内やフレーム間でのフレーム単位で求める以外に、符号化対象ブロック(マクロブロック)単位、複数の符号化対象ブロック(マクロブロック)で構成される領域単位、あるいはフレーム画像をいくつかの領域に分割した領域単位で求められる。このようにして求められた画像特性パラメータは、画像特性演算部16から探索ブロックサイズ判定部17に出力される。
探索ブロックサイズ判定部17では、画像特性演算部16からの画像特性パラメータに基づいて、符号化対象ブロック並びにこれと境界が接するM画素×Nラインの領域における画像の平坦度を判定する。なお、本発明での平坦度とは、画像中に物体の輪郭や模様などのエッジ部分がなく無地である度合を特定するもので、画像中の周波数成分分布などの画像特性パラメータから規定される。
上記判定処理にて符号化対象ブロックが平坦ではない画像であるという結果がでれば、探索ブロックサイズ判定部17は、符号化対象画像中に探索ブロックサイズを拡大する必要がないと判断する。これにより、探索ブロックサイズ判定部17は、符号化対象ブロックと同一サイズの探索ブロックで従来と同様に動き補償予測を行うようにイントラ/インター判定部12及び動き補償予測部13を制御する。
具体的には、探索ブロックサイズ判定部17が、符号化対象ブロックと同一サイズの画素ブロックをメモリ1から動き補償予測部13に転送するように制御する。動き補償予測部13では、探索ブロックサイズ判定部17による制御でメモリ1から転送されたサイズの画素ブロックにより動き探索を行う。これにより、イントラ/インター判定部12及び動き補償予測部13は、探索ブロックサイズ判定部17により指定された探索ブロックで動き探索し、符号化対象ブロックの動き補償予測を実行することになる。
例えば、MPEG−2符号化方式では、フレーム構造でフレーム内の16画素×16ラインの大きさのブロックに対して符号化を行う。つまり、上述したように、フレーム動き補償予測を行う場合、符号化を行うブロックと同一の16画素×16ライン領域で動き補償予測が実行される。
一方、符号化対象ブロックが平坦な画像であり、これと境界が接するM画素×Nラインの領域が平坦でないと判定されると、探索ブロックサイズ判定部17は、当該画像についての動き補償予測では拡大したサイズの探索ブロックが必要であると判断する。これにより、探索ブロックサイズ判定部17は、符号化対象ブロックを拡張したサイズの探索ブロックで動き補償予測を実行するようにイントラ/インター判定部12及び動き補償予測部13を制御する。
具体的には、探索ブロックサイズ判定部17が、符号化対象ブロックを拡張したサイズの画素ブロックをメモリ1から動き補償予測部13に転送するように制御する。動き補償予測部13では、探索ブロックサイズ判定部17による制御でメモリ1から転送されたサイズの画素ブロックにより動き探索を行う。これにより、イントラ/インター判定部12及び動き補償予測部13は、探索ブロックサイズ判定部17により指定された探索ブロックで動き探索し、符号化対象ブロックの動き補償予測を実行することになる。
図2は、実施の形態1の画像符号化装置による動き補償探索処理の概要を説明する図である。図において、フレーム画像20は符号化が終了したフレームの画像であり、フレーム画像30は現在符号化を行おうとしているフレームの画像である。つまり、フレーム画像20はフレーム画像30の動き補償予測のための参照フレームとなり、時間的にはフレーム画像20に連続した次のフレームがフレーム画像30である。
フレーム画像20において点線で示す自動車21が右方向に移動し、フレーム画像30において点線で示す自動車31になったものとする。なお、この自動車は、表面が単一色で塗装されるなどして複雑な画像成分がなく、表面部の画像は平坦であるものとする。フレーム画像30中の符号化対象ブロック32は自動車31の輪郭を含んでおり、符号化対象ブロック33は自動車31の輪郭から離れた表面部に位置し、輪郭を含んでいない。
上述した探索ブロックサイズ判定において、符号化対象ブロック32には自動車31の輪郭が存在するので、探索ブロックサイズ判定部17によって平坦な画像ではないと判定される。これに対して、符号化対象ブロック33は、自動車31の輪郭線付近に位置しているにもかかわらず、自動車31の輪郭を含んでいないために平坦な画像と判定され、その近隣の領域が平坦な画像ではないと判定される。
符号化対象ブロック32の符号化にあたり、画像特性演算部16は、図3に示すような符号化対象ブロック32並びにこれと境界が接する8個の16画素×16ラインの領域に対して画素の分散値あるいは水平方向や垂直方向の周波数成分分布の演算を行って画像特性パラメータを生成する。
このあと、探索ブロックサイズ判定部17は、画像特性演算部16が演算した画像特性パラメータが、例えば画素の分散値であれば、画像の平坦さを規定するために予め分散値に関して設定しておいた閾値より大きい場合、当該画像が平坦でないと判断する。また、画像特性パラメータが周波数成分分布であれば、高周波数領域を規定するために予め設定した周波数値よりも高い周波数領域において、画像の平坦さを規定するために予め周波数成分分布に関して設定しておいた閾値よりも大きい周波数成分が存在するとき、当該画像が平坦でないと判断する。
図2の例では、符号化対象ブロック32には自動車31の輪郭が存在するため、平坦ではない画像であると判定される。従って、このままの大きさ、すなわち16画素×16ラインの探索ブロックにより動き補償予測を行う。図中の参照ブロック22は、符号化対象ブロック32の動き補償探索の結果得られた参照ブロックであり、参照ブロック22の位置を示す動きベクトル35が求められる。
一方、符号化対象ブロック33においても同様に画像特性演算が行われる。つまり、探索ブロックサイズ判定部17は、画像特性演算部16が演算した画像特性パラメータが、例えば画素の分散値であれば、画像の平坦さを規定するために予め分散値に関して設定しておいた閾値より大きい場合、当該画像が平坦でないと判断する。また、画像特性パラメータが周波数成分分布であれば、高周波数領域を規定するために予め設定した周波数値よりも高い周波数領域において、画像の平坦さを規定するために予め周波数成分分布に関して設定しておいた閾値よりも大きい周波数成分が存在するとき、当該画像が平坦でないと判断する。
なお、上述した平坦度の判定処理において、平坦な画像と判定するときと平坦な画像ではないと判定するときの閾値は同一である必要はない。例えば、符号化対象ブロックによる画像特性パラメータに応じた閾値、これに接する16画素×16ライン領域からなるブロック群による画像特性パラメータに応じた閾値を求めて判定処理を実行するようにしてもよい。
符号化対象ブロック33は自動車31の輪郭を含まない側面の部分の画像であるため、画像特性演算部16によって平坦な画像であると判定される。しかしながら、符号化対象ブロック33の右側、上側、右上側に位置する16画素×16ラインのブロックには自動車31の輪郭が含まれる。このため、符号化対象ブロック32と同様に、各ブロックは平坦ではない画像と判定される。
このとき、探索ブロックサイズ判定部17は、図2に示すような32画素×32ラインまで拡張したブロックを探索ブロック34として判定する。つまり、符号化対象ブロック33と、自動車31の輪郭を含み平坦でないと判定された16画素×16ラインの各ブロックとを含めたサイズの領域を、符号化対象ブロック33及びその周辺領域の視覚的な特性を適切に示す探索ブロックとして選択する。
この探索ブロックサイズ判定部17による判定結果に応じて、動き補償予測部13は上記探索ブロック34にて動き補償探索を実行する。符号化対象ブロック33について32画素×32ラインの探索ブロック34を使用した動き補償探索の結果として、図2に示すような参照ブロック23及びその位置を示す動きベクトル36が得られる。
ちなみに、符号化対象ブロック33を16画素×16ラインのブロックのままで動き探索すると、符号化対象ブロックの周辺領域の画像特性が考慮されていないため、例えば参照ブロック24及びその動きベクトル37が得られる。
このように、符号化対象ブロック33において探索ブロックサイズを拡大しないで動き補償探索を行うと、参照ブロック24のような符号化対象ブロック33とは全く別の位置の画像ブロックが参照ブロックとして選択される可能性がある。
これに対して、符号化対象ブロック33と自動車31の輪郭を含み平坦でないと判定された16画素×16ラインの各ブロックとを含めたサイズの探索ブロック34を使用して動き補償探索を行うことで、自動車全体の動きと合致した位置のブロックを参照ブロックとして選択することができる。
以上のように、この実施の形態1では、複数のフレーム画像より構成される符号化対象動画像を入力し、フレーム画像ごとに抽出した符号化対象ブロックの視覚的な特性を示す画像特性パラメータを算出する画像特性演算部16と、画像特性パラメータで示される符号化対象ブロックの視覚的な特性に応じて動き補償探索を実行すべきサイズの画素ブロックを判定して、動き補償探索の探索ブロックとする探索ブロックサイズ判定部17と、探索ブロックサイズ判定部17により決定された探索ブロックで動き補償探索を実行する動き補償予測部13とを備えるので、符号化対象ブロックに物体の輪郭が存在しない場合においても、近隣の領域に輪郭が存在するときには、符号化対象ブロック自体によって動き補償探索を行うのでなく、輪郭部分まで含むように符号化対象ブロックを拡大した探索ブロックにより動き補償探索を行うことで、物体の動きを正確に追従した動きベクトルを得ることができる。また、このようにして求めた動きベクトルは周囲の符号化対象ブロックの動きベクトルとの相関も高いため、動きベクトルに費やされる情報量も小さくなり、全体として画質が向上する。
なお、上記実施の形態1では、フレーム構造におけるフレーム動き補償予測を例にして説明したが、フィールド構造におけるフィールド動き補償予測においても同様のことが可能である。さらに、フレーム構造におけるフィールド動き補償予測などの16画素×8ラインのブロックにおいても、探索ブロックを、例えば32画素×16ラインのブロックサイズに拡張すれば同様の処理が行え、同様の効果を得ることができる。
また、上記実施の形態1では、符号化対象画像の平坦度を基準として探索ブロックサイズを判定する処理を例として説明したが、画像中の物体の輪郭(エッジ)情報あるいは物体全体の輪郭情報を画像特性パラメータから特定し、指標化した値に応じて探索ブロックサイズ判定を行うようにしてもよい。この場合、16画素×16ラインの符号化対象ブロックが図2に示すような物体の内部に存在するものであると、当該物体全体を内部に含むまでサイズを拡大した探索ブロックにより動き補償予測を実行する。
実施の形態2.
この実施の形態2は、符号化対象ブロックの画面内の位置に応じて、探索ブロックにおける符号化対象ブロックの位置関係を適応的に設定するものである。
実施の形態2による画像符号化装置の基本的な構成は、上記実施の形態1の図1で示したものと同様であるが、実施の形態2による探索ブロックサイズ判定部17では、画像特性演算部16からの画像特性パラメータの解析結果に基づく探索ブロックサイズ判定処理に加え、符号化対象ブロックの画面内の位置に応じて探索ブロックにおける符号化対象ブロックの位置関係を適応的に設定する点で上記実施の形態1と異なる。
次に動作について説明する。
以降の説明ではMPEG−2による符号化を例に挙げるが、本発明は動き補償予測を行う符号化処理であればMPEG−2以外にも適用することができる。また、以降では、例えばフレーム構造におけるフレーム動き補償予測時に32画素×32ラインのブロックで動き補償予測を行うものとする。なお、本実施の形態による画像符号化装置の基本的な動作は上記実施の形態1と同様であるので、異なる点である探索ブロックサイズ判定部17による処理について主に説明する。
探索ブロックサイズ判定部17は、符号化フレームの水平方向の画素数、垂直方向のライン数が外部から設定されている、あるいは、1種類の符号化フレームの大きさに限定された装置の場合、内部にその情報を有しているものとする。
また、探索ブロックサイズ判定部17は、符号化フレーム内の符号化対象ブロックの個数をカウントするカウンタを有する。これにより、現在符号化を行っている符号化対象ブロックが符号化フレームの中で何番目のブロックであるかを上記カウンタのカウンタ値として保持する。
一方、符号化処理は、符号化対象ブロック単位で符号化フレーム画面内の左上から開始され、右方向へと進んでいき、右端に達すると垂直方向の次のブロック列の左側から右方向へ進んでいくように進められる。
これにより、探索ブロックサイズ判定部17は、符号化フレームの水平方向の画素数、垂直方向のライン数及び上記カウンタ値より、現在の符号化対象ブロックが画面内のどの位置に存在しているかを特定する。
このあと、探索ブロックサイズ判定部17は、符号化フレーム画面内で特定された位置に応じて32画素×32ラインのブロック内の符号化対象ブロック位置を決定し、このブロックを探索ブロックとして動き探索処理するように動き補償予測部13に通知する。
このようにして、符号化フレーム画面内の位置に応じて探索ブロックにおける符号化対象ブロックの位置関係が適応的に設定されることになる。
この位置情報に応じて、探索ブロックサイズ判定部17は、符号化フレーム画面内の符号化対象ブロック位置に応じた拡張を施したサイズの画素ブロックをメモリ1から動き補償予測部13に転送するように制御する。動き補償予測部13では、探索ブロックサイズ判定部17による制御でメモリ1から転送されたサイズの画素ブロックにより動き探索を行う。これにより、イントラ/インター判定部12及び動き補償予測部13は、探索ブロックサイズ判定部17により指定された探索ブロックで動き探索し、符号化対象ブロックの動き補償予測を実行することになる。
図4は符号化フレーム画像を符号化対象ブロックと共に示した図であり、図5は図4中のフレーム画像内の位置が異なる各符号化対象ブロックと探索ブロックとの関係を示す図である。図4では、符号化フレーム40内に符号化対象ブロック41〜49が存在する例を示している。これら符号化対象ブロック41〜49は、符号化フレーム40内の様々な位置にそれぞれ存在している。符号化対象ブロック41〜44,46〜49は符号化フレーム40による画面の隅や端部に位置し、符号化対象ブロック45は画面中央に位置している。
図5の例では、図4中の符号化フレーム40内の各位置における符号化対象ブロックとこれらの位置に応じた探索ブロックを示している。図において、斜線を施した16画素×16ラインのブロックが符号化対象ブロック41〜49であり、これら符号化対象ブロック41〜49をそれぞれ含む32画素×32ラインのサイズを有するブロックが探索ブロックである。
図示の例において、探索ブロックサイズ判定部17は、上述のようにして符号化フレーム画面内の符号化対象ブロックの位置を認識すると、画面外にはみ出さないように探索ブロックを設定する。例えば、符号化フレーム画面の端部に接しており、探索ブロックを単純に拡張して設定すると画面外にはみ出してしまうような符号化対象ブロック41〜44,46〜49については、図5(a)〜(d),(f)〜(i)にそれぞれ示すように符号化対象ブロックを画面内側に拡張させた画素ブロックを探索ブロックとして決定する。
一方、四方に単純に拡張しても画面の外側にはみ出さない位置にある符号化対象ブロック45については、図5(e)に示すように符号化対象ブロック45の周囲を8画素×8ラインのブロックで取り囲んだ画素ブロックを探索ブロックとして決定する。
なお、動き補償予測における動き探索を実行するにあたり、符号化フレーム画面内のほとんどにおいて平坦な画像でない限り、符号化対象ブロックと同一の16画素×16ラインのブロックよりも符号化対象ブロックを含む32画素×32ラインのブロックの方が物体の輪郭や模様を含む可能性が高い。従って、32画素×32ラインのブロックで動き補償探索を行う方が、物体の動きをより正確に追従でき、符号化効率を向上させることもできる。
また、フィールド構造におけるフィールド動き補償予測においても同様のことが可能である。さらに、フレーム構造におけるフィールド動き補償予測などの16画素×8ラインのブロックにおいても、探索ブロックを、例えば32画素×16ラインの画素ブロックに拡張すれば同様の処理が行え、同様の効果を得ることができる。
以上のように、この実施の形態2によれば、符号化対象ブロックの画面内の位置に応じて探索ブロックにおける符号化対象ブロックの位置関係を適応的に設定するので、符号化フレーム画面からはずれるような不適切な探索ブロックが選択されることを防止することができる。
実施の形態3.
この実施の形態3による画像符号化装置の基本的な構成は、上記実施の形態1の図1で示したものと同様である。上記実施の形態1と異なる点としては、実施の形態3による探索ブロックサイズ判定部17が、符号化対象ブロック(16画素×16ラインのブロック)を拡張したサイズの探索ブロックで動き補償予測部13に動き探索させるにあたり、符号化対象ブロックと同一サイズの探索ブロックで行う処理と同一の演算回数になるように探索ブロック内で演算を行うべき画素を間引く処理を実行する。
次に動作について説明する。
以降の説明ではMPEG−2による符号化を例に挙げるが、本発明は動き補償予測を行う符号化処理であればMPEG−2以外にも適用することができる。また、以降では、例えばフレーム構造におけるフレーム動き補償予測を行うものとする。なお、本実施の形態による画像符号化装置の基本的な動作は上記実施の形態1と同様であるので、異なる点である探索ブロックサイズ判定部17による処理について主に説明する。
探索ブロックサイズ判定部17は、上記実施の形態1や上記実施の形態2と同様な処理にて、符号化対象ブロックの画面内の位置に応じて探索ブロックにおける符号化対象ブロックの位置関係を適応的に設定し、例えば図6に示すような探索ブロックに適宜切り替えるものとする。
図示の例では、MPEG−2符号化方式で一般的に使用される16画素×16ラインの探索ブロック、16画素×32ライン、32画素×16ライン、32画素×32ラインの4種類のサイズの探索ブロック間で切り替える。なお、斜線を施した16画素×16ラインのブロックが符号化対象ブロックであり、この符号化対象ブロックを含む実線で示したブロックが探索ブロックである。16画素×16ラインの場合は、符号化対象ブロックと探索ブロックは同一のものである。
ここで、探索ブロックサイズ判定部17は、16画素×16ラインの探索ブロック以外のブロックを探索ブロックと判定する場合、16画素×16ラインの探索ブロックと同一の演算回数で処理されるように演算すべき画素を選別する。
図7〜9は、図6中の16画素×16ラインの探索ブロック以外の各探索ブロックで差分絶対値和などの演算処理を行うべき画素位置と当該演算を行わない画素位置とを示す図である。これらの図において、斜線を付した画素が演算を行う画素であり、白色の画素は演算を行わない画素である。
図7,8にそれぞれ示す16画素×32ライン及び32画素×16ラインの探索ブロックでは、2画素に1画素の割合で演算を行う例を示している。一方、図9に示す32画素×32ラインの探索ブロックは、16画素×16ラインのブロックの4倍の画素数を有するので、4画素に1画素の割合で演算を行う。16画素×16ラインの場合は、全ての画素すなわち256画素に対して演算を行うものとする。
上述したような演算を実行する画素の割合は、探索ブロックサイズ判定部17によって16画素×16ラインのブロックとのサイズ(画素数)の違いを考慮して演算すべき画素数が一致するように決定する。図7〜9に示す例では、演算を行う画素を間引くことにより、演算対象の画素数が全ての探索ブロックにおいて256画素となる。
また、演算しないものとして間引かれる画素位置は、図に示すように一定の間隔で間引く場合の他、画像特性パラメータにより特定される画像特性に応じて間引く方法も考えられる。例えば、画像特性パラメータにより画面内の物体の輪郭部分を構成する画素であると判定されれば、動き補償予測への影響を考慮して当該画素を間引かず、他の平坦な部分の画素を間引くようにする。
探索ブロックサイズ判定部17は、上述のようにして演算しない画素を特定した画素ブロックをメモリ1から動き補償予測部13に転送するように制御する。動き補償予測部13では、探索ブロックサイズ判定部17による制御でメモリ1から転送されたサイズで且つ演算しない画素位置が特定された画素ブロックにより動き探索を行う。これにより、イントラ/インター判定部12及び動き補償予測部13は、探索ブロックサイズ判定部17により指定された探索ブロックで動き探索し、符号化対象ブロックの動き補償予測を実行することになる。
なお、フィールド構造におけるフィールド動き補償予測においても同様のことが可能である。さらに、フレーム構造におけるフィールド動き補償予測などの16画素×8ラインのブロックにおいても上記と同様の切り替えならびに間引きを行うことができる。
以上のように、この実施の形態3によれば、サイズを拡張した探索ブロックにおいて演算を実行しない画素位置を規定するようにしたので、回路規模や演算処理時間を増加させることなく、16画素×16ラインの探索ブロックと同様の評価値を得ることができる。
また、物体の輪郭あるいは細かい模様が符号化対象ブロック内に含む、含まない、あるいは近隣の領域に存在する、存在しないなどの符号化対象ブロックの画像特性に応じて、探索ブロックサイズを変更するか、あるいは変更しないで演算の精度を優先するかの選択ができ、最適な動きベクトルを得ることができる。
この発明の実施の形態1による動画像符号化装置の構成を示すブロック図である。 実施の形態1の画像符号化装置による動き補償探索処理の概要を説明する図である。 画像特性パラメータを算出するための画像領域を示す図である。 符号化フレーム画像を符号化対象ブロックと共に示した図である。 図5は図4中のフレーム画像内の位置が異なる各符号化対象ブロックと探索ブロックとの関係を示す図である。 探索ブロックとして切り替える画素ブロック例を示す図である。 画素の演算の有無を区別した16画素×32ラインの探索ブロックを示す図である。 画素の演算の有無を区別した32画素×16ラインの探索ブロックを示す図である。 画素の演算の有無を区別した32画素×32ラインの探索ブロックを示す図である。
符号の説明
1 メモリ、2 減算器、3 セレクタ、4 DCT演算器、5 量子化器、6 可変長符号化部、7 バッファ、8 逆量子化器、9 逆DCT演算器、10 フレーム加算器、11 セレクタ、12 イントラ/インター判定部、13 動き補償予測部、14 フレームメモリ、15 量子化制御部、16 画像特性演算部、17 探索ブロックサイズ判定部。

Claims (9)

  1. 時間軸上に並んだ複数の画像より構成される符号化対象画像を入力し、上記符号化対象画像の視覚的な特性を示す画像特性パラメータを算出する画像特性演算部と、
    上記画像特性パラメータで示される上記符号化対象画像の視覚的な特性に応じて動き補償探索を実行すべきサイズの画素ブロックを判定して、動き補償探索の探索ブロックとする探索ブロックサイズ判定部と、
    上記探索ブロックサイズ判定部により決定された探索ブロックで動き補償探索を実行する動き補償予測部と
    を備えた画像符号化装置。
  2. 画像特性演算部は、符号化対象画像から抽出した符号化対象ブロックごとに画像特性パラメータを算出することを特徴とする請求項1記載の画像符号化装置。
  3. 画像特性演算部は、符号化対象画像から抽出した符号化対象ブロック及びこれと境界を接する画素領域ごとに画像特性パラメータを算出することを特徴とする請求項1記載の画像符号化装置。
  4. 画像特性演算部は、符号化対象画像から抽出した符号化対象ブロック及びこれと境界を接する画素領域ごとに画像特性パラメータを算出し、
    探索ブロックサイズ判定部は、上記画像特性パラメータから画像特性として上記符号化対象ブロック及びこれと境界を接する画素領域ごとに画像の平坦さを判定し、上記符号化対象ブロックと境界を接する画素領域が平坦でない画像であると、上記符号化対象ブロック及びこれと境界を接する画素領域を含む拡張したサイズの画素ブロックを探索ブロックとし、上記符号化対象ブロックが平坦でない画像であると、上記符号化対象ブロックと同一サイズの画素ブロックを探索ブロックとし、
    動き補償予測部は、上記探索ブロックにより動き補償探索を実行することを特徴とする請求項1記載の画像符号化装置。
  5. 画像特性演算部は、符号化対象画像から抽出した符号化対象ブロック及びこれと境界を接する画素領域ごとに画像特性パラメータとして画素値の分散値を算出し、
    探索ブロックサイズ判定部は、上記分散値を指標として平坦さを判定することを特徴とする請求項1記載の画像符号化装置。
  6. 画像特性演算部は、符号化対象画像から抽出した符号化対象ブロック及びこれと境界を接する画素領域ごとに画像特性パラメータとして画素の水平方向及び垂直方向の周波数成分の分布をそれぞれ算出し、
    探索ブロックサイズ判定部は、上記水平方向及び垂直方向の周波数成分の分布を指標として平坦さを判定することを特徴とする請求項1記載の画像符号化装置。
  7. 探索ブロックサイズ判定部は、符号化対象画像から抽出した符号化対象ブロックのサイズを拡張した画素ブロックを探索ブロックとすると、上記符号化対象ブロックと同一サイズの画素ブロックを探索ブロックとした場合と同一の演算回数となるように上記符号化対象ブロックのサイズを拡張してなる探索ブロックから演算対象となる画素を間引くことを特徴とする請求項1記載の画像符号化装置。
  8. 探索ブロックサイズ判定部は、画像特性パラメータから求めた符号化対象ブロックの視覚的な特性に応じて、上記符号化対象ブロックのサイズを拡張してなる探索ブロックから間引くべき画素を決定することを特徴とする請求項7記載の画像符号化装置。
  9. 時間軸上に並んだ複数の画像より構成される符号化対象画像を入力し、上記符号化対象画像の視覚的な特性を示す画像特性パラメータを算出する画像特性演算部、
    上記画像特性パラメータで示される上記符号化対象画像の視覚的な特性に応じて動き補償探索を実行すべきサイズの画素ブロックを判定して、動き補償探索の探索ブロックとする探索ブロックサイズ判定部、
    上記探索ブロックサイズ判定部により決定された探索ブロックで動き補償探索を実行する動き補償予測部
    としてコンピュータを機能させるプログラム。
JP2004105382A 2004-03-31 2004-03-31 画像符号化装置及びプログラム Pending JP2005295074A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004105382A JP2005295074A (ja) 2004-03-31 2004-03-31 画像符号化装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004105382A JP2005295074A (ja) 2004-03-31 2004-03-31 画像符号化装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2005295074A true JP2005295074A (ja) 2005-10-20

Family

ID=35327548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004105382A Pending JP2005295074A (ja) 2004-03-31 2004-03-31 画像符号化装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2005295074A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009110559A1 (ja) * 2008-03-07 2009-09-11 株式会社 東芝 動画像符号化/復号装置
JP2010259471A (ja) * 2009-04-30 2010-11-18 Aloka Co Ltd 超音波画像処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009110559A1 (ja) * 2008-03-07 2009-09-11 株式会社 東芝 動画像符号化/復号装置
JPWO2009110559A1 (ja) * 2008-03-07 2011-07-14 株式会社東芝 動画像符号化/復号装置
JP2010259471A (ja) * 2009-04-30 2010-11-18 Aloka Co Ltd 超音波画像処理装置

Similar Documents

Publication Publication Date Title
KR101565228B1 (ko) 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법, 화상 복호 방법 및 화상 예측 장치
TWI489878B (zh) 影像編碼方法、影像解碼方法、影像編碼裝置、影像解碼裝置及該等之程式
JP2008227670A (ja) 画像符号化装置
CN109889838B (zh) 一种基于roi区域的hevc快速编码方法
JP2011147130A (ja) 動き推定のための技術
JP3531532B2 (ja) 動画像符号化装置、及び方法
JP2013098713A (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
JP2005295074A (ja) 画像符号化装置及びプログラム
Lin et al. Improved parabolic prediction-based fractional search for H. 264/AVC video coding
JP2005303362A (ja) 画像符号化装置及びプログラム
HK1234556B (zh) 图像编码装置和方法、图像解码装置和方法以及记录介质
HK1232359B (zh) 图像编码装置和方法、图像解码装置和方法以及记录介质
HK1234555A (en) Image encoding device and method, image decoding device and method and storage medium
HK1234555A1 (en) Image encoding device and method, image decoding device and method and storage medium
HK1234554B (zh) 图像编码装置和方法、图像解码装置和方法以及记录介质
HK1234555B (zh) 图像编码装置和方法、图像解码装置和方法以及记录介质
HK1234556A (en) Image encoding device and method, image decoding device and method and storage medium
HK1234556A1 (en) Image encoding device and method, image decoding device and method and storage medium
HK1182244B (en) Motion-video encoding apparatus, motion-video decoding apparatus, motion-video encoding method, and motion-video decoding method
HK1224113B (zh) 图像编码装置和方法、以及图像译码装置和方法
HK1219593A1 (zh) 运动图像编码装置及方法、运动图像解码装置及方法
HK1225541B (zh) 图像编码装置和方法、以及图像译码装置和方法
HK1225203A1 (en) Motion-video encoding apparatus and method and motion-video decoding apparatus and method
HK1190257B (en) Image encoding apparatus, image decoding apparatus, image encoding method and image decoding method
HK1224114B (zh) 图像编码装置和方法、以及图像译码装置和方法