JP2011082801A - 画像処理装置および画像処理方法 - Google Patents
画像処理装置および画像処理方法 Download PDFInfo
- Publication number
- JP2011082801A JP2011082801A JP2009233394A JP2009233394A JP2011082801A JP 2011082801 A JP2011082801 A JP 2011082801A JP 2009233394 A JP2009233394 A JP 2009233394A JP 2009233394 A JP2009233394 A JP 2009233394A JP 2011082801 A JP2011082801 A JP 2011082801A
- Authority
- JP
- Japan
- Prior art keywords
- pixels
- unit
- edge information
- processing
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】画像の圧縮符号化に適したサイズを判定すること。
【解決手段】画像処理装置1は、抽出部2、判定部3および処理部4を備えている。a、b、c、d、eおよびfは整数であり、a<c<eおよびb<d<fであるとする。抽出部2は、原画の画素に基づいてエッジ情報を抽出する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件および第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する。処理部4は、判定部3により判定された処理の単位サイズで画像処理を行う。処理部4は、画像処理の結果を出力する。
【選択図】図1
【解決手段】画像処理装置1は、抽出部2、判定部3および処理部4を備えている。a、b、c、d、eおよびfは整数であり、a<c<eおよびb<d<fであるとする。抽出部2は、原画の画素に基づいてエッジ情報を抽出する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件および第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する。処理部4は、判定部3により判定された処理の単位サイズで画像処理を行う。処理部4は、画像処理の結果を出力する。
【選択図】図1
Description
この発明は、画像処理装置および画像処理方法に関する。
従来、画像をブロック化して圧縮符号化する画像処理技術が知られている。このような画像処理技術として、ブロック分割部が16×16サイズのマクロブロックを4×4サイズのブロックに分割し、エッジ検出部が分割生成された4×4サイズのブロックに対するエッジ検出を行い、ブロック結合部がエッジ検出により得られたエッジ情報と予測モード決定部で決定された予測モードに基づいて、4×4サイズのブロックを適宜結合してマクロブロックの分割形を決定するようにして、最適なマクロブロックの分割を行って画像を圧縮符号化できるようにする画像処理装置および画像処理方法が知られている(例えば、特許文献1参照。)。
しかしながら、従来の画像処理技術では、16×16サイズと8×8サイズとで、いずれが画像の圧縮符号化に適したサイズであるか、ということを判定することができない、という問題点がある。
画像の圧縮符号化に適したサイズを判定することができる画像処理装置および画像処理方法を提供することを目的とする。
a、b、c、d、eおよびfがいずれも整数であり、a<c<eおよびb<d<fであるとする。画像処理装置は、抽出部、判定部および処理部を備えている。抽出部は、原画の画素に基づいてエッジ情報を抽出する。判定部は、エッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定する。判定部は、エッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定する。判定部は、エッジ情報が第1の条件および第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する。処理部は、判定された処理の単位サイズで画像処理を行う。
この画像処理装置および画像処理方法によれば、画像の圧縮符号化に適したサイズを判定することができるという効果を奏する。
以下に添付図面を参照して、この画像処理装置および画像処理方法の好適な実施の形態を詳細に説明する。
(実施例1)
・画像処理装置の説明
図1は、実施例1にかかる画像処理装置を示すブロック図である。図1に示すように、画像処理装置1は、抽出部2、判定部3および処理部4を備えている。ここで、a、b、c、d、eおよびfは、いずれも整数であるとする。a<c<eであるとする。b<d<fであるとする。抽出部2は、原画の画素に基づいてエッジ情報を抽出する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件および第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する。処理部4は、判定部3により判定された処理の単位サイズで画像処理を行う。処理部4は、画像処理の結果を出力する。
・画像処理装置の説明
図1は、実施例1にかかる画像処理装置を示すブロック図である。図1に示すように、画像処理装置1は、抽出部2、判定部3および処理部4を備えている。ここで、a、b、c、d、eおよびfは、いずれも整数であるとする。a<c<eであるとする。b<d<fであるとする。抽出部2は、原画の画素に基づいてエッジ情報を抽出する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件および第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する。処理部4は、判定部3により判定された処理の単位サイズで画像処理を行う。処理部4は、画像処理の結果を出力する。
・画像処理方法の説明
図2は、実施例1にかかる画像処理方法を示すフローチャートである。図2に示すように、画像処理が開始されると、まず、画像処理装置1は、抽出部2により、原画の画素に基づいてエッジ情報を抽出する(ステップS1)。次いで、画像処理装置1は、判定部3により、処理の単位サイズを判定する(ステップS2)。この判定において、判定部3は、抽出部2により抽出されたエッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件および第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する。次いで、画像処理装置1は、処理部4により、処理の単位サイズで画像処理を行う(ステップS3)。そして、画像処理が終了となる。
図2は、実施例1にかかる画像処理方法を示すフローチャートである。図2に示すように、画像処理が開始されると、まず、画像処理装置1は、抽出部2により、原画の画素に基づいてエッジ情報を抽出する(ステップS1)。次いで、画像処理装置1は、判定部3により、処理の単位サイズを判定する(ステップS2)。この判定において、判定部3は、抽出部2により抽出されたエッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定する。判定部3は、抽出部2により抽出されたエッジ情報が第1の条件および第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する。次いで、画像処理装置1は、処理部4により、処理の単位サイズで画像処理を行う(ステップS3)。そして、画像処理が終了となる。
実施例1によれば、エッジ情報が第1の条件を満たす場合、処理の単位サイズはe画素×f画素と判定される。エッジ情報が第2の条件を満たす場合、処理の単位サイズはa画素×b画素と判定される。エッジ情報が第1の条件および第2の条件のいずれも満たさない場合、処理の単位サイズはc画素×d画素と判定される。従って、画像処理に適したサイズを判定することができる。例えば、画像の圧縮符号化に適したサイズを判定することができる。
(実施例2)
・H.264/AVC規格の説明
動画像符号化規格の一つに、H.264/AVC(Advanced Video Coding)がある。H.264/AVC規格は、ITU−T(International Telecommunication Union Telecommunication Standardization Sector、国際電気通信連合電気通信標準化部門)およびISO(International Organization for Standardization、国際標準化機構)/IEC(International Electrotechnical Commission、国際電気標準会議)により策定された規格である。
・H.264/AVC規格の説明
動画像符号化規格の一つに、H.264/AVC(Advanced Video Coding)がある。H.264/AVC規格は、ITU−T(International Telecommunication Union Telecommunication Standardization Sector、国際電気通信連合電気通信標準化部門)およびISO(International Organization for Standardization、国際標準化機構)/IEC(International Electrotechnical Commission、国際電気標準会議)により策定された規格である。
H.264/AVC規格では、画像処理装置は、動画データを構成する一枚一枚のフレーム(静止画)とフレームとの間の差分値や、フレーム内の差分値に基づいて、動画データを圧縮して符号化する。H.264/AVC規格では、各フレームは、16画素×16画素のサイズのマクロブロックを含む。H.264/AVC規格では、イントラ予測処理が行われる。イントラ予測処理では、一フレーム内において、あるマクロブロックに隣接する画素の情報に基づいて該マクロブロックの予測画素のデータが生成される。生成された予測画素に基づいて、画像の予測処理が行われる。イントラ予測処理におけるマクロブロックに対する処理のサイズには、例えば4画素×4画素、8画素×8画素および16画素×16画素の3種類がある。4画素×4画素でのイントラ予測処理および8画素×8画素でのイントラ予測処理には、それぞれ垂直、水平、平均および斜めなどの9種類の予測モードがある。16画素×16画素でのイントラ予測処理には、垂直、水平、平均および面の4種類の予測モードがある。
実施例1にかかる画像処理装置の一例として、例えばH.264/AVC規格に準拠した画像処理装置においてイントラ予測処理を行う装置が挙げられる。実施例2では、画像処理装置の一例として、このイントラ予測処理を行う装置について説明する。
・画像処理装置の説明
図3は、実施例2にかかる画像処理装置を示すブロック図である。図3に示すように、画像処理装置11は、入力された動画データを圧縮して符号化する。画像処理装置11は、差分器12、DCT(Discrete Cosine Transform)変換部13、量子化部14、逆量子化部15、逆DCT変換部16、加算器17、フレーム内予測部18、フレーム間予測部19、可変長符号化部20を有する。
図3は、実施例2にかかる画像処理装置を示すブロック図である。図3に示すように、画像処理装置11は、入力された動画データを圧縮して符号化する。画像処理装置11は、差分器12、DCT(Discrete Cosine Transform)変換部13、量子化部14、逆量子化部15、逆DCT変換部16、加算器17、フレーム内予測部18、フレーム間予測部19、可変長符号化部20を有する。
フレーム内予測部18は、イントラ予測処理(フレーム内予測処理)を行う。フレーム内予測部18は、イントラ予測処理を行う際に、マクロブロックごとに、処理の単位サイズとして例えば4画素×4画素、8画素×8画素および16画素×16画素の3種類のサイズの中から一つを選択する。フレーム内予測部18は、各マクロブロックを、選択したサイズの予測対象ブロックに分割し、予測対象ブロックごとに処理を行う。フレーム内予測部18は、予測対象ブロックの予測計算に用いる符号化済みの隣接ブロックの画素31から各予測モードでの予測画像を生成する。フレーム内予測部18は、生成した各予測モードでの予測画像と元の入力画像32との差分値を求め、各予測モードのコストを計算する。フレーム内予測部18は、コストが一番小さい予測モードを当該マクロブロックのベスト予測モードとして選択し、該ベストイントラ予測モード、該ベストイントラ予測モードのコストおよび該ベストイントラ予測モードの予測画素を判定部23へ出力する。フレーム内予測部18は、実施例1の画像処理装置1に相当する。
フレーム間予測部19は、フレーム間予測処理を行う。フレーム間予測処理において、フレーム間予測部19は、予測対象ブロックに対し、前方、後方、あるいはその両方のフレームから予測画像を生成する。フレーム間予測部19は、生成した予測画像と元の入力画像32との差分を求める。フレーム間予測部19は、入力画像32および参照画像33を入力し、予測画像ブロックの生成を行う。フレーム間予測部19は、動き検出部21および動き補償部22を有する。動き検出部21は、入力画像32および参照画像33の輝度データに基づいて動きベクトル34を算出する。動き補償部22は、算出した動きベクトル34および参照画像33に基づいて、補間演算された輝度と色差データを有する予測画素を算出する。動き補償部22は、算出したベストインタ予測モード、該ベストインタ予測モードのコストおよび該ベストインタ予測モードの予測画素を判定部23へ出力する。
判定部23は、フレーム間予測部19およびフレーム内予測部18から出力された予測画素のうち、予測誤差の小さい画像をマクロブロックの予測画像35として出力する。差分器12は、入力画像32とその予測結果である予測画像35との差分を計算する。差分器12は、計算した差分値を予測誤差36として出力する。ここで、予測画像35は、フレーム間予測処理において相前後するフレームのマクロブロックに基づいて、あるいはイントラ予測処理において同一フレームの隣接するマクロブロックに基づいて、生成された画像である。画像処理装置11は、各予測処理により生成された予測画像35と予測処理前の入力画像32との差分を符号化して出力する。差分が小さくなるほど画像の圧縮率が高くなる。DCT変換部13は、予測誤差36を離散コサイン変換により周波数領域に変換する。量子化部14は、変換したDCT係数値に対し、量子化ステップで除算した結果を整数値に丸める処理をする。可変長符号化部20は、整数値に丸め込まれたDCT係数値のうち、出現頻度の高い情報を短い符号で表現し、出現頻度の低い情報を長い符号で表現する。それによって、全体として出力ビット数が減る。可変長符号化部20は、符号化データ37を出力する。
逆量子化部15は、量子化部14により量子化された予測誤差を逆量子化する。逆量子化された予測誤差は、逆DCT変換部16により逆変換される。それによって、DCT係数値に変換される前の予測誤差38が得られる。加算器17は、フレーム内予測部18またはフレーム間予測部19により生成された予測画像35と、逆DCT変換部16により得られた予測誤差38とを加算する。加算器17は、加算により得られた画像39を出力する。画像39は、フィルタ部24に入力される。フィルタ部24は、デブロッキング・フィルタとも呼ばれ、画像39のブロックひずみを減少させる。フィルタ部24は、ブロックひずみ処理後の画像を復元画像40として出力する。復元画像40は、次のフレームを処理するときに、フレーム間予測部19によるフレーム間予測処理の参照画像として用いられる。
画像処理装置11では、入力画像32が入力されると、フレーム間予測部19によりフレーム間予測処理が実行される。また、フレーム内予測部18によりイントラ予測処理が実行される。判定部23は、フレーム間予測処理結果およびイントラ予測処理結果のうち最も入力画像32との差分値が小さい予測画像35を出力する。差分器12は、生成された予測画像35と入力画像32との差分を計算する。差分器12は、予測誤差36をDCT変換部13に出力する。予測誤差36は、DCT変換部13により変換され、量子化部14で量子化される。量子化された予測誤差は、可変長符号化部20により符号化される。符号化された予測誤差は、符号化データ37として出力される。また、量子化された予測誤差は、逆量子化部15により逆量子化される。逆量子化された予測誤差は、逆DCT変換部16により周波数領域から時間領域に変換される。加算器17は、時間領域に変換された予測誤差38と判定部23から出力された予測画像35とを加算する。加算器17は、予測処理前の画像39を生成する。以上のようにして画像処理装置11は、フレーム間予測処理とイントラ予測処理により動画データを圧縮することができる。
・フレーム内予測部の説明
図4は、実施例2にかかる画像処理装置のフレーム内予測部を示すブロック図である。図4に示すように、フレーム内予測部18は、エッジ抽出部51、サイズ判定部52および処理部53を備えている。エッジ抽出部51は、入力画像32の原画の画素にフィルタをかけて、エッジ情報を抽出する。エッジ情報を抽出する方法については後述する。サイズ判定部52は、エッジ抽出部51により抽出されたエッジ情報に基づいて、マクロブロックに対してイントラ予測処理を行う際の処理の単位サイズを判定する。処理の単位サイズとして、例えば4画素×4画素、8画素×8画素および16画素×16画素の中から一つが選択される。処理の単位サイズを判定する方法については後述する。
図4は、実施例2にかかる画像処理装置のフレーム内予測部を示すブロック図である。図4に示すように、フレーム内予測部18は、エッジ抽出部51、サイズ判定部52および処理部53を備えている。エッジ抽出部51は、入力画像32の原画の画素にフィルタをかけて、エッジ情報を抽出する。エッジ情報を抽出する方法については後述する。サイズ判定部52は、エッジ抽出部51により抽出されたエッジ情報に基づいて、マクロブロックに対してイントラ予測処理を行う際の処理の単位サイズを判定する。処理の単位サイズとして、例えば4画素×4画素、8画素×8画素および16画素×16画素の中から一つが選択される。処理の単位サイズを判定する方法については後述する。
処理部53は、各マクロブロックを、サイズ判定部52により判定されたサイズの予測対象ブロックに分割し、予測対象ブロックごとに処理を行う。サイズ判定部52により予め予測対象ブロックのサイズが選択されているので、処理部53は、その選択されたサイズの予測モードについて処理を行う。処理部53は、選択されなかったサイズの予測モードについては処理を行わない。例えば4画素×4画素のサイズが選択されている場合、処理部53は、4画素×4画素のサイズに用意されている9種類の予測モードについて処理を行う。例えば4画素×4画素のサイズが選択されている場合、処理部53は、8画素×8画素のサイズに用意されている9種類の予測モードおよび16画素×16画素のサイズに用意されている4種類の予測モードの処理を行わない。
処理部53は、予測画素生成部54、コスト計算部55およびモード判定部56を備えている。予測画素生成部54は、サイズ判定部52により判定されたサイズの予測対象ブロックに隣接する画素を利用して、該サイズの各予測モードでの予測画素を生成する。コスト計算部55は、予測画素生成部54により生成された各予測モードでの予測画素と原画の画素との差分値を求め、各予測モードのコストを計算する。モード判定部56は、各予測モードのコストを比較し、コストが一番小さい予測モードを当該マクロブロックのベスト予測モードとして選択する。処理部53は、処理結果として、ベスト予測モード、該ベスト予測モードのコストおよび該ベスト予測モードの予測画素を出力する。エッジ抽出部51は、実施例1の抽出部2に相当する。サイズ判定部52は、実施例1の判定部3に相当する。処理部53は、実施例1の処理部4に相当する。
・エッジ情報を抽出する方法の説明
エッジ抽出部51は、種々の空間フィルタや種々の周波数フィルタを用いてエッジ情報を抽出する。一例として、例えば(1)式で表される水平方向の空間エッジフィルタを用いることができる。例えば(2)式で表される垂直方向の空間エッジフィルタを用いることができる。
エッジ抽出部51は、種々の空間フィルタや種々の周波数フィルタを用いてエッジ情報を抽出する。一例として、例えば(1)式で表される水平方向の空間エッジフィルタを用いることができる。例えば(2)式で表される垂直方向の空間エッジフィルタを用いることができる。
図5は、実施例2にかかるエッジ情報を抽出する方法の説明図である。図5には、マクロブロックの一部が示されている。図5に示すように、マクロブロック61において、隣接する4個の原画の画素A62,B63,C64,D65に対して、1個の仮想的な画素66が設定される。エッジ抽出部51は、仮想的な画素66の水平エッジ強度STRHおよび垂直エッジ強度STRVを計算する。水平エッジ強度STRHは、隣接する4個の原画の画素A62,B63,C64,D65の値を用いて、例えば(3)式で表される。垂直エッジ強度STRVは、隣接する4個の原画の画素A62,B63,C64,D65の値を用いて、例えば(4)式で表される。
・処理の単位サイズを判定する方法の説明
(i)処理の単位サイズが16画素×16画素であることを判定する条件(第1の条件)
図6は、実施例2にかかる処理の単位サイズを判定する方法の説明図である。図6には、1個のマクロブロックの全体が示されている。図6に示すように、マクロブロック61のサイズが例えば16画素×16画素である場合には、1個のマクロブロック61に225個の仮想的な画素66,67が設定される。第1の条件は、1個のマクロブロック61内の全ての仮想的な画素66,67について、水平エッジ強度STRHおよび垂直エッジ強度STRVが第1の閾値以下である、ということである。この第1の条件を満たす場合、当該マクロブロック内には強いエッジが存在しないので、サイズ判定部52は、16画素×16画素のサイズを処理の単位サイズと判定する。第1の閾値については後述する。
(i)処理の単位サイズが16画素×16画素であることを判定する条件(第1の条件)
図6は、実施例2にかかる処理の単位サイズを判定する方法の説明図である。図6には、1個のマクロブロックの全体が示されている。図6に示すように、マクロブロック61のサイズが例えば16画素×16画素である場合には、1個のマクロブロック61に225個の仮想的な画素66,67が設定される。第1の条件は、1個のマクロブロック61内の全ての仮想的な画素66,67について、水平エッジ強度STRHおよび垂直エッジ強度STRVが第1の閾値以下である、ということである。この第1の条件を満たす場合、当該マクロブロック内には強いエッジが存在しないので、サイズ判定部52は、16画素×16画素のサイズを処理の単位サイズと判定する。第1の閾値については後述する。
(ii)処理の単位サイズが4画素×4画素であることを判定する条件(第2の条件)
図6に示すように、画素の並びにおいて横一列を行とし、縦一列を列として説明する。また、本明細書において、仮想的な画素66,67の第M行目の第N列目に位置する仮想的な画素PをP(M、N)と表し、仮想的な画素P(M、N)の水平エッジ強度をSTRH(M、N)と表し、仮想的な画素P(M、N)の垂直エッジ強度をSTRV(M、N)と表すことがある。
図6に示すように、画素の並びにおいて横一列を行とし、縦一列を列として説明する。また、本明細書において、仮想的な画素66,67の第M行目の第N列目に位置する仮想的な画素PをP(M、N)と表し、仮想的な画素P(M、N)の水平エッジ強度をSTRH(M、N)と表し、仮想的な画素P(M、N)の垂直エッジ強度をSTRV(M、N)と表すことがある。
サイズ判定部52は、まず、仮想的な画素66,67の各行について、行ごとに各仮想的な画素66,67の垂直エッジ強度STRVの合計値を求める。これによって、マクロブロック61のサイズが例えば16画素×16画素である場合、仮想的な画素66,67の第1行目から第15行目までの各行について、行のエッジ強度が得られる。各行について、行のエッジ強度ROWSUMI(I=1、2、・・・、15)は、例えば(5)式で表される。サイズ判定部52は、仮想的な画素66,67の各列について、列ごとに各仮想的な画素66,67の水平エッジ強度STRHの合計値を求める。これによって、マクロブロック61のサイズが例えば16画素×16画素である場合、仮想的な画素66,67の第1列目から第15列目までの各列について、列のエッジ強度が得られる。各列について、列のエッジ強度COLSUMI(I=1、2、・・・、15)は、例えば(6)式で表される。
サイズ判定部52は、仮想的な画素66,67の全ての行のうち、丁度中央となる行を除いた残りの各行について、行のエッジ強度を比較し、その中から行のエッジ強度の最大値ROWSUM_MAXを選択する。マクロブロック61のサイズが例えば16画素×16画素である場合、サイズ判定部52は、仮想的な画素66,67の第8行目(図6に●で示す画素の並び)を除いて、第1行目から第7行目までの各行および第9行目から第15行目までの各行を比較の対象とする。サイズ判定部52は、仮想的な画素66,67の全ての列のうち、丁度中央となる列を除いた残りの各列について、列のエッジ強度を比較し、その中から列のエッジ強度の最大値COLSUM_MAXを選択する。マクロブロック61のサイズが例えば16画素×16画素である場合、サイズ判定部52は、仮想的な画素66,67の第8列目(図6に●で示す画素の並び)を除いて、第1列目から第7列目までの各列および第9列目から第15列目までの各列を比較の対象とする。
第2の条件は、行のエッジ強度の最大値ROWSUM_MAXと仮想的な画素66,67の丁度中央となる行のエッジ強度との比率が第2の閾値以上であり、あるいは列のエッジ強度の最大値COLSUM_MAXと仮想的な画素66,67の丁度中央となる列のエッジ強度との比率が第2の閾値以上である、ということである。この第2の条件を満たす場合、当該マクロブロック内のある8画素×8画素サイズのブロック内に強いエッジがあるので、サイズ判定部52は、4画素×4画素のサイズを処理の単位サイズと判定する。第2の条件を満たさない場合には、8画素×8画素サイズのブロックにおいて境界のエッジが一番強いので、サイズ判定部52は、8画素×8画素のサイズを処理の単位サイズと判定する。第2の閾値については後述する。
・第1の閾値および第2の閾値の説明
第1の閾値および第2の閾値は、例えばH.264における量子化パラメータ(Quantization Parameter、QP)の経験関数である。H.264規格では、QPの有効範囲は0〜51である。本発明者が実験を行ったところ、動画圧縮率が低いときには、QPが小さく、予測対象ブロックのサイズとして小さいサイズが選択されることが多いという結果が得られた。また、動画圧縮率が高いときには、QPが大きく、予測対象ブロックのサイズとして大きいサイズが選択されることが多いという結果が得られた。図7に、第1の閾値および第2の閾値と動画圧縮率(QP)との定性的な関係を示す。図7において、縦軸は第1の閾値および第2の閾値の値であり、横軸は動画圧縮率(QP)である。図7に示すように、動画圧縮率(QP)が高くなると第1の閾値および第2の閾値が大きくなる。第2の閾値は、第1の閾値よりも大きい。第1の閾値および第2の閾値の具体的な数値は、例えば実験により求められる。
第1の閾値および第2の閾値は、例えばH.264における量子化パラメータ(Quantization Parameter、QP)の経験関数である。H.264規格では、QPの有効範囲は0〜51である。本発明者が実験を行ったところ、動画圧縮率が低いときには、QPが小さく、予測対象ブロックのサイズとして小さいサイズが選択されることが多いという結果が得られた。また、動画圧縮率が高いときには、QPが大きく、予測対象ブロックのサイズとして大きいサイズが選択されることが多いという結果が得られた。図7に、第1の閾値および第2の閾値と動画圧縮率(QP)との定性的な関係を示す。図7において、縦軸は第1の閾値および第2の閾値の値であり、横軸は動画圧縮率(QP)である。図7に示すように、動画圧縮率(QP)が高くなると第1の閾値および第2の閾値が大きくなる。第2の閾値は、第1の閾値よりも大きい。第1の閾値および第2の閾値の具体的な数値は、例えば実験により求められる。
図7によれば、動画圧縮率が低いときには、第1の閾値および第2の閾値がともに小さくなる。従って、前記第1の条件を満たす確率が低くなり、前記第2の条件を満たす確率が高くなる。つまり、サイズ判定部52により、処理の単位サイズが16画素×16画素のサイズであると判定される確率が低くなり、4画素×4画素のサイズであると判定される確率が高くなる。逆に、動画圧縮率が高いときには、第1の閾値および第2の閾値がともに大きくなる。従って、前記第1の条件を満たす確率が高くなり、前記第2の条件を満たす確率が低くなる。つまり、サイズ判定部52により、処理の単位サイズが16画素×16画素のサイズであると判定される確率が高くなり、4画素×4画素のサイズであると判定される確率が低くなる。
・画像処理方法の説明
図8〜図11は、実施例2にかかる画像処理方法を示すフローチャートである。図8に示すように、画像処理においてイントラ予測処理が開始されると、まず、フレーム内予測部18は、エッジ抽出部51により、原画の画素に基づいてマクロブロックごとにエッジ情報を抽出する(ステップS11)。次いで、フレーム内予測部18は、サイズ判定部52により、エッジ抽出部51により抽出されたエッジ情報に基づいて、前記第1の条件を満たすか否かを判定する(ステップS12)。第1の条件を満たす場合(ステップS12:Yes)、フレーム内予測部18は、処理部53により、図11に示す16画素×16画素のサイズで処理を行う(ステップS16)。第1の条件を満たさない場合(ステップS12:No)、フレーム内予測部18は、サイズ判定部52により、エッジ抽出部51により抽出されたエッジ情報に基づいて、前記第2の条件を満たすか否かを判定する(ステップS13)。
図8〜図11は、実施例2にかかる画像処理方法を示すフローチャートである。図8に示すように、画像処理においてイントラ予測処理が開始されると、まず、フレーム内予測部18は、エッジ抽出部51により、原画の画素に基づいてマクロブロックごとにエッジ情報を抽出する(ステップS11)。次いで、フレーム内予測部18は、サイズ判定部52により、エッジ抽出部51により抽出されたエッジ情報に基づいて、前記第1の条件を満たすか否かを判定する(ステップS12)。第1の条件を満たす場合(ステップS12:Yes)、フレーム内予測部18は、処理部53により、図11に示す16画素×16画素のサイズで処理を行う(ステップS16)。第1の条件を満たさない場合(ステップS12:No)、フレーム内予測部18は、サイズ判定部52により、エッジ抽出部51により抽出されたエッジ情報に基づいて、前記第2の条件を満たすか否かを判定する(ステップS13)。
第2の条件を満たす場合(ステップS13:Yes)、フレーム内予測部18は、処理部53により、図9に示す4画素×4画素のサイズで処理を行う(ステップS14)。第2の条件を満たさない場合(ステップS13:No)、フレーム内予測部18は、処理部53により、図10に示す8画素×8画素のサイズで処理を行う(ステップS15)。ステップS14、ステップS15またはステップS16での処理が終了すると、フレーム内予測部18は、処理結果として、ベスト予測モード、該ベスト予測モードのコストおよび該ベスト予測モードの予測画素を出力し(ステップS17)、イントラ予測処理を終了する。なお、ステップS13を先に行ってからステップS12を行ってもよい。
図9に示すように、4画素×4画素のサイズでの処理においては、マクロブロック61のサイズが例えば16画素×16画素である場合、まず、初期設定として、予測対象ブロックの番号BLKが0に設定される(ステップS21)。初期設定として、予測対象ブロックのコストの最小値COST_BLK_MINが最大値に設定される(ステップS22)。初期設定として、予測モードの番号MODEが0に設定される(ステップS23)。なお、ステップS21およびステップS23の順序は問わない。次いで、フレーム内予測部18は、予測画素生成部54により、予測画素を生成する(ステップS24)。次いで、フレーム内予測部18は、コスト計算部55により、予測画素と原画の画素との差分値を求め、コストを計算する。コスト計算部55の計算により新たに得られたコストの値がその時点でのコストの最小値COST_BLK_MINよりも小さい場合、フレーム内予測部18は、モード判定部56により、コストの最小値COST_BLK_MINを新たに得られたコストの値で更新する(ステップS25)。
そして、ステップS23に戻り、予測モードの番号MODEを1だけ進め、予測モードの番号MODEが9になるまで(ステップS23:Yes)、ステップS23からステップS25までを繰り返す。ステップS23で予測モードの番号MODEが9になったら(ステップS23:No)、ステップS21に戻り、予測対象ブロックの番号BLKを1だけ進める。例えば16画素×16画素のサイズのマクロブロックには4画素×4画素のサイズの予測対象ブロックが16個含まれているので、予測対象ブロックの番号BLKが16になるまで(ステップS21:Yes)、ステップS21からステップS25までを繰り返す。ステップS21で予測対象ブロックの番号BLKが16になったら(ステップS21:No)、図8のステップS17に戻り、処理結果を出力する。
図10に示すように、8画素×8画素のサイズでの処理は、上述した4画素×4画素のサイズでの処理と同様である(ステップS31〜ステップS35)。ただし、例えば16画素×16画素のサイズのマクロブロックには8画素×8画素のサイズの予測対象ブロックが4個含まれているので、予測対象ブロックの番号BLKが4になったら(ステップS31:No)、図8のステップS17に戻り、処理結果を出力する。
図11に示すように、16画素×16画素のサイズでの処理は、上述した4画素×4画素のサイズでの処理と同様である(ステップS41〜ステップS44)。ただし、例えば16画素×16画素のサイズのマクロブロックに含まれている16画素×16画素のサイズの予測対象ブロックの数は1個である。従って、上述した4画素×4画素のサイズでの処理におけるステップS21に相当する処理がない。また、予測モードの数が4個であるので、予測モードの番号MODEが4になったら(ステップS42:No)、図8のステップS17に戻り、処理結果を出力する。
・画質の評価結果
図12は、実施例2にかかる画質評価のシミュレーション結果を示す特性図である。図12において、縦軸は画質指標PSNR(Peak Signal−to−Noise Ratio)であり、横軸はビットレートである。〇のプロットは実施例2のシミュレーション結果であり、□のプロットは比較例のシミュレーション結果である。比較例では、予測対象ブロックのサイズを予め判定せずに、4画素×4画素、8画素×8画素および16画素×16画素の3種類のサイズの全ての予測モードについて予測画素と原画の画素との差分値を求め、各予測モードのコストを計算した。従って、比較例のフレーム内予測部には、実施例2のサイズ判定部52に相当するブロックがない。また、比較例のフレーム内予測部には、実施例2の処理部53に相当するブロックが4画素×4画素用、8画素×8画素用および16画素×16画素用として3個設けられている。図12に示すように、実施例2による画質は、比較例による画質と同等である。
図12は、実施例2にかかる画質評価のシミュレーション結果を示す特性図である。図12において、縦軸は画質指標PSNR(Peak Signal−to−Noise Ratio)であり、横軸はビットレートである。〇のプロットは実施例2のシミュレーション結果であり、□のプロットは比較例のシミュレーション結果である。比較例では、予測対象ブロックのサイズを予め判定せずに、4画素×4画素、8画素×8画素および16画素×16画素の3種類のサイズの全ての予測モードについて予測画素と原画の画素との差分値を求め、各予測モードのコストを計算した。従って、比較例のフレーム内予測部には、実施例2のサイズ判定部52に相当するブロックがない。また、比較例のフレーム内予測部には、実施例2の処理部53に相当するブロックが4画素×4画素用、8画素×8画素用および16画素×16画素用として3個設けられている。図12に示すように、実施例2による画質は、比較例による画質と同等である。
実施例2によれば、第1の条件を満たす場合、予測対象ブロックのサイズは16画素×16画素と判定される。第2の条件を満たす場合、予測対象ブロックのサイズは4画素×4画素と判定される。第1の条件および第2の条件のいずれも満たさない場合、予測対象ブロックのサイズは8画素×8画素と判定される。従って、イントラ予測処理に適した予測対象ブロックのサイズを予め判定することができる。その判定されたサイズの予測モードについて予測画素を生成してコストを計算すればよいので、上述した比較例と比べて、H.264規格におけるイントラ予測の演算量を大幅に削減することができる。例えば、予測対象ブロックのサイズが4画素×4画素または8画素×8画素である場合、4画素×4画素または8画素×8画素の予測モードの数が9個であるので、比較例と比べて、約59%(=(9+4)/(9+9+4)×100)の演算量を削減することができる。予測対象ブロックのサイズが16画素×16画素である場合、16画素×16画素の予測モードの数が4個であるので、比較例と比べて、約82%(=(9+9)/(9+9+4)×100)の演算量を削減することができる。また、上述した比較例の場合には予測画素を生成してコストを計算するブロックが3個必要であるが、実施例2では予測画素を生成してコストを計算するブロックが1個で済むので、比較例と比べて、回路面積を大幅に削減することができる。比較例の回路面積に対する実施例2の回路面積の削減率は、具体的な回路の構成によって異なるが、約50%〜66%程度の回路面積を削減することができる。
なお、本発明は、H.264規格におけるイントラ予測処理に限らず、複数の画素を含むマクロブロックに対して、該マクロブロックをさらに複数個に分割したブロックを対象として画像処理を行う画像処理装置および画像処理方法に適用することができる。
1,11 画像処理装置
2,51 抽出部
3,52 判定部
4,53 処理部
2,51 抽出部
3,52 判定部
4,53 処理部
Claims (5)
- a、b、c、d、eおよびfがいずれも整数であり、a<c<eおよびb<d<fであるとき、
原画の画素に基づいてエッジ情報を抽出する抽出部と、
該抽出部により抽出されたエッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定し、該エッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定し、該エッジ情報が該第1の条件および該第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する判定部と、
該判定部により判定された処理の単位サイズで画像処理を行う処理部と、
を備えることを特徴とする画像処理装置。 - 前記抽出部は、原画の隣接する4個の画素に対して1個の仮想的な画素を設定し、該原画の隣接する4個の画素の水平方向のエッジ情報および垂直方向のエッジ情報に基づいて、該仮想的な画素の水平方向のエッジ情報および垂直方向のエッジ情報を抽出することを特徴とする請求項1に記載の画像処理装置。
- e画素×f画素のブロックに含まれる全ての前記仮想的な画素の水平方向のエッジ情報および垂直方向のエッジ情報が第1の閾値以下であることを、前記第1の条件とすることを特徴とする請求項2に記載の画像処理装置。
- eがcの2倍であり、fがdの2倍であり、画素の並びにおいて横一列を行とし、縦一列を列とするとき、
前記抽出部は、各行について、一行に含まれる全ての前記仮想的な画素の垂直方向のエッジ情報の合計を求めて当該行のエッジ情報とし、各列について、一列に含まれる全ての前記仮想的な画素の水平方向のエッジ情報の合計を求めて当該列のエッジ情報とし、
第d行目を除く第1行目から第[f−1]行目までの各行について該行のエッジ情報のうちの最大値と第d行目の該行のエッジ情報との比率、または第c列目を除く第1列目から第[e−1]列目までの各列について該列のエッジ情報のうちの最大値と第c列目の該列のエッジ情報との比率、のいずれかが第2の閾値以上であることを、前記第2の条件とすることを特徴とする請求項2または3に記載の画像処理装置。 - a、b、c、d、eおよびfがいずれも整数であり、a<c<eおよびb<d<fであるとき、
原画の画素に基づいてエッジ情報を抽出する抽出ステップと、
該抽出ステップにより抽出されたエッジ情報が第1の条件を満たす場合にe画素×f画素を処理の単位サイズと判定し、該エッジ情報が第2の条件を満たす場合にa画素×b画素を処理の単位サイズと判定し、該エッジ情報が該第1の条件および該第2の条件のいずれも満たさない場合にc画素×d画素を処理の単位サイズと判定する判定ステップと、
該判定ステップにより判定された処理の単位サイズで画像処理を行う処理ステップと、
を含むことを特徴とする画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009233394A JP2011082801A (ja) | 2009-10-07 | 2009-10-07 | 画像処理装置および画像処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009233394A JP2011082801A (ja) | 2009-10-07 | 2009-10-07 | 画像処理装置および画像処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011082801A true JP2011082801A (ja) | 2011-04-21 |
Family
ID=44076395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009233394A Pending JP2011082801A (ja) | 2009-10-07 | 2009-10-07 | 画像処理装置および画像処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011082801A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2021117091A1 (ja) * | 2019-12-09 | 2021-06-17 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001285878A (ja) * | 2000-03-31 | 2001-10-12 | Toshiba Corp | 動画像解析方法及び装置 |
JP2008263660A (ja) * | 1997-04-24 | 2008-10-30 | Mitsubishi Electric Corp | 動画像復号装置 |
-
2009
- 2009-10-07 JP JP2009233394A patent/JP2011082801A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008263660A (ja) * | 1997-04-24 | 2008-10-30 | Mitsubishi Electric Corp | 動画像復号装置 |
JP2001285878A (ja) * | 2000-03-31 | 2001-10-12 | Toshiba Corp | 動画像解析方法及び装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2021117091A1 (ja) * | 2019-12-09 | 2021-06-17 | ||
WO2021117091A1 (ja) * | 2019-12-09 | 2021-06-17 | 日本電信電話株式会社 | 符号化方法、符号化装置、及びプログラム |
JP7364936B2 (ja) | 2019-12-09 | 2023-10-19 | 日本電信電話株式会社 | 符号化方法、符号化装置、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5905613B2 (ja) | 映像復号化装置 | |
JP5846675B2 (ja) | イントラ予測モード復号化方法及び装置 | |
KR101246294B1 (ko) | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 | |
JP5989841B2 (ja) | 映像復号化装置 | |
US11659174B2 (en) | Image encoding method/device, image decoding method/device and recording medium having bitstream stored therein | |
WO2009123033A1 (ja) | デブロッキングフィルタ処理装置、デブロッキングフィルタ処理方法 | |
KR101621854B1 (ko) | Tsm 율-왜곡 최적화 방법, 그를 이용한 인코딩 방법 및 장치, 그리고 영상 처리 장치 | |
KR101960470B1 (ko) | 오프라인 cabac을 지원하는 비디오 코딩 프로세스의 비트 예측 기반 비트 레이트 컨트롤 방법 및 그 장치 | |
US20220345703A1 (en) | Image encoding method/device, image decoding method/device and recording medium having bitstream stored therein | |
US8290041B2 (en) | Communication terminal | |
KR100949475B1 (ko) | 스캔 패턴 결정 장치 및 이를 이용한 영상 데이터 부호화방법과 그 장치, 그리고, 이를 이용한 영상 데이터 복호화방법과 그 장치 | |
KR20120010177A (ko) | 디블록킹 필터링 방법 및 장치 및 이를 이용한 부호화 및 복호화 방법과 장치 | |
WO2010137322A1 (ja) | 画像符号化装置、画像復号装置、画像符号化方法、および画像復号方法 | |
US20230122782A1 (en) | Image encoding apparatus, image encoding method, image decoding apparatus, image decoding method, and non-transitory computer-readable storage medium | |
JP2011082801A (ja) | 画像処理装置および画像処理方法 | |
KR20200073124A (ko) | 필터링 방법 및 영상 복호화 장치 | |
KR102550503B1 (ko) | 부호화 장치, 복호 장치, 및 프로그램 | |
WO2021045059A1 (ja) | 符号化装置、復号装置、及びプログラム | |
JP5814191B2 (ja) | デブロッキング処理方法、デブロッキング処理装置、プログラム、及び記録媒体 | |
JP6409400B2 (ja) | 映像符号化装置、方法及びプログラム | |
JP2006101397A (ja) | 動画像符号化装置及び動画像符号化プログラム | |
KR20160092816A (ko) | 비디오 부호화 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130226 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130625 |