JP6159139B2 - 画像処理装置、符号化装置、及びプログラム - Google Patents

画像処理装置、符号化装置、及びプログラム Download PDF

Info

Publication number
JP6159139B2
JP6159139B2 JP2013097917A JP2013097917A JP6159139B2 JP 6159139 B2 JP6159139 B2 JP 6159139B2 JP 2013097917 A JP2013097917 A JP 2013097917A JP 2013097917 A JP2013097917 A JP 2013097917A JP 6159139 B2 JP6159139 B2 JP 6159139B2
Authority
JP
Japan
Prior art keywords
unit
orthogonal transform
orthogonal
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013097917A
Other languages
English (en)
Other versions
JP2014220624A (ja
Inventor
市ヶ谷 敦郎
敦郎 市ヶ谷
境田 慎一
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2013097917A priority Critical patent/JP6159139B2/ja
Publication of JP2014220624A publication Critical patent/JP2014220624A/ja
Application granted granted Critical
Publication of JP6159139B2 publication Critical patent/JP6159139B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像の符号化における直交変換を適応的に選択する画像処理装置、符号化装置、及びプログラムに関する。
動画などのフレーム画像の画素値を直交変換し、直交変換係数で表すことが行われている。この直交変換係数に対して、必要に応じて量子化及びエントロピー符号化を施すことによって、画像品質をなるべく落とさずに、情報量が圧縮される。特に、この画像符号化技術は、映像符号化の分野で利用されている。
直交変換を利用する主たる目的は、画像の空間的な相関を排除し、少ない直交変換係数に映像信号の情報(エネルギ−)を集中させることにある。フレーム画像を小領域に分割し、例えば8×8画素のブロックごとに直交変換が施される。この符号化では、DC成分に近い領域に情報を集約できるDCT(離散コサイン変換:Discrete Cosine Transform)が最も広く用いられている。
入力された画像に対する最適な直交変換は、主成分分析によって無相関化された直交基底を設計して実現できる。しかしながら、現実的には入力信号に応じて実時間で直交基底を設計することは困難を伴う。主成分分析を利用した変換として、KL変換(KLT:Karhuen Loeve transform)が知られている。KL変換は、入力信号に対し最適な変換効率を与える。しかしながら、ハードウェア化が非常に困難であり、現在のところ符号化方式には採用されていない。
したがって、従来、画像を符号化する際には、事前に知られた入力信号の統計的な性質によって最適とされた直交変換を用いている。このため、画像符号化方式ごとに直交変換が予め定められている。
画像符号化技術で用いられる代表的な直交変換としては、上述のDCT以外に、DST(離散サイン変換)、DWT(離散ウェーブレット変換)、DFT(離散フーリエ変換)、DHT(アダマール変換)などが知られている。
なお、DCT及びDSTには、それぞれ、標準的なタイプが8通りずつある。DCTにおいて、最も一般的なタイプは、DCT−II(タイプ2)である。DCT−IIの逆変換は、DCT−IIIである。DCT−IとDCT−IVは、それ自身が逆変換になる。DCT及びDSTは、それぞれのタイプによって、異なる性質を持つ。
なお、これらの変換は、一般に直交変換と呼ばれている。しかしながら、インプリメントされる際に、整数精度の計算を採用したり、丸め誤差が発生したりするため、厳密な意味での直交性が担保されるわけではない。本明細書では、直交変換の語を用いて説明するが、このように厳密な意味での直交性が担保された変換のみを指す語ではない点に留意すべきである。
広く用いられている映像符号化として、MPEGが知られている。MPEG−2やH.264/AVC(Advance Video Coding)(例えば、非特許文献1参照)、HEVCなど、ほぼ全ての画像符号化技術では、入力信号を周波数領域に変換し、様々な処理を用いて、変換領域における信号容量の圧縮を実現している。
なお、映像符号化方式のHEVCにおいては、4×4画素のブロックにおけるイントラ符号化(intra-frame coding)(画面内符号化)では、DST―VII(タイプ7)の直交変換が用いられている。
したがって、HEVCイントラ符号化では、直交変換として、DCT−IIとDST―VIIの2つを利用している。一方、インター符号化では、残差信号が、イントラ符号化のような特徴的な傾向がないためDCT−IIのみを用いた符号化が用いられている。
なお、画面内符号化(イントラ符号化)は、画面内の空間的な信号予測を行って画像を符号化する。この技術は、画面内予測(イントラ予測)とも称す。また、画面間予測(インター符号化)は、異なるフレーム間で類似した領域を探索し、予測に用いて画像を符号化する。この技術は、動き補償予測(インター予測)とも称す。
上述のHEVCで採用されたDCT−IIとDST−VIIを選択的に切り換える方式では、事前の解析により外挿を用いたイントラ予測方式による信号の偏りを統計的に解析している。そして、イントラ予測モード毎に何れの直交変換を選択するかが、事前にテーブル上で決定されている(非特許文献3参照)。
また、そのほかの様々な直交変換(DST−II、DCT−III、DCT−IV、DCT−VIIなど)を適応的に用いることによって、更なる符号化効率の改善が望めることが報告されている(非特許文献2参照)。
しかしながら、実際に符号化する入力信号が、統計的に知られている傾向と異なる場合もあるため、予め定められた直交変換が、適切な直交変換ではない場合がある。
このような問題を解決するためには、RD(Rate-Distortion)最適化法などの手法により、例えば、以下に示すように、より適切な直交変換を選択することが可能である。しかしながら、用意されたそれぞれの直交変換を、完全にあるいは簡略化した手法で事前に圧縮信号になるまでの処理を行う必要がある。
図1は、2種類の直交変換を選択する場合の例を示している。入力信号102に対して、第1の直交変換部112により、第1の直交変換を行う。その後エントロピー符号化部114によって、エントロピー符号化を行う。この処理によって圧縮信号116が得られる。そして、入力信号102に対して、第2の直交変換部122は、第2の直交変換を行う。その後エントロピー符号化部124が、エントロピー符号化を行う。この処理によって圧縮信号126が得られる。
そして、圧縮信号116と圧縮信号126は、RD判定部130に入力される。RD判定部130は、情報量(Rate)及び歪み(Distortion)の両方を勘案して最適化する際に用いられるRD最適化法を用いて、何れの直交変換が適切かを判定する。なお、この場合、1種類の直交変換を用いる場合と比してほぼ2倍のリソースを必要とする(非特許文献4参照)。
大久保榮監修,「改訂三版 H.264/AVC 教科書」,インプレス R&D,p124,2009年1月1日 JCTVC−E027 CE−7:Summary report of core experiment on alternative transforms)(March 2011) A. Saxena and F. C. Fernandes, "Mode dependent DCT/DST for intra prediction in block-based image/video coding"18th IEEE International Conference on Image Processing, PP/ 1721-1724, 2011 市ヶ谷敦郎,杉藤泰子,境田慎一,"DCTとDSTを適応的に用いたインター符号化",映情学技報,vol.36, no.9 ME2012-59,PP.213-218,2012
上述のように、複数の直交変換のうち適切なものを選択する場合に、各々の直交変換を実行することは、処理能力の増大、消費電力の増大を招き、現実的ではない。このため、リアルタイム信号処理における実装を考慮した場合、最適な直交変換を高速に選択する技術が必要とされている。
そこで、本発明では、複数の直交変換から適切な直交変換を選択する際の処理効率を向上させる画像処理装置、符号化装置、及びプログラムを提供することを目的とする。
本発明の一態様における画像処理装置は、離散コサイン変換、及び離散サイン変換の2つの直交変換のうち、一方又は他方を選択して処理を行う画像処理装置であって、画像データを前記一方の直交変換によって変換して得られた直交変換係数の水平方向の奇数次と偶数次とのエネルギー比、及び/又は前記直交変換係数の垂直方向の奇数次と偶数次とのエネルギー比を用いた規則に従って分析する分析部と、前記分析部の分析結果に基づいて、前記一方又は前記他方を選択する選択部と、を有する。
本発明の一態様における画像処理装置は、第1の直交変換、及び1以上の他の直交変換のうち、何れか1つを選択して処理を行う画像処理装置であって、画像データを前記第1の直交変換によって変換して得られた第1の直交変換係数を、所定の規則に従って分析する分析部と、前記分析部の分析結果に基づいて、前記第1の直交変換、及び前記1以上の他の直交変換のうち、何れか1つを選択する選択部と、を有する画像処理装置であって、前記分析部は、前記1以上の他の直交変換の各々が有する所定の数の複数の基底画像の各々を前記第1の直交変換によって変換して得られた直交変換係数を蓄積した記憶部と、前記第1の直交変換係数と前記記憶部に記憶された前記複数の直交変換係数との類似度を算出する類似度算出部と、を含み、前記選択部は、前記類似度算出部によって得られた類似度のうち、最も高い類似度が、所定の閾値を越える場合、前記最も高い類似度に対応する、前記他の直交変換に、前記画像データを選択的に与えることによって、前記画像データが変換された直交変換係数を、前記画像データの符号化のために用い、前記最も高い類似度が、前記所定の閾値以下の場合、前記第1の直交変換係数を、前記画像データの符号化のために用いる。
また、上記何れかの画像処理装置を備える符号化装置が提供される。
また、本発明の他の実施態様におけるプログラムは、コンピュータを上記符号化装置として機能させる。
本発明によれば、複数の直交変換から適切な直交変換を選択して、画像処理を行う際の効率を向上させることができる。
従来技術における2種類の直交変換を選択する場合の例を示す図である。 DCT及びDSTの直交変換係数の例を示すグラフである。 実施例1の画像処理装置の構成の例を示すブロック図である。 DCT及びDSTの直交変換係数の水平成分の例を示す図である。 実施例1における画像処理の一例を示すフローチャートである。 実施例1の基本原理の例を説明する図である。 実施例2の画像処理装置の構成の例を示すブロック図である。 記憶部に記憶される直交変換係数比較用パターンを説明する図である。 実施例2における画像処理の一例を示すフローチャートである。 実施例3における画像処理装置の概略構成の一例を示すブロック図である。 実施例4における画像処理装置の概略構成の一例を示すブロック図である
まず、DCTとDSTを例にとって、異なる直交変換の関係の例を示す。DCT領域におけるエネルギー分布は、式(1)として求められる。例えば、DCT基底に直交する正弦波信号を入力とする場合を想定する、簡単のために入力信号を連続信号とし、正規化係数も省略する。また、一次元の信号を取り上げる。
Figure 0006159139
入力信号を式(2)とすると、
Figure 0006159139
式(1)は、式(3)のように表せる。
Figure 0006159139
この式(3)を用いて、以下の2つの場合についてDCTを計算する。
i)ui+1=uの場合
Figure 0006159139
ii)ui+1≠uの場合
ア)ui+u=2n−1の場合
Figure 0006159139
イ)ui+u=2nの場合
Figure 0006159139
したがって、式(4)、式(5)、式(6)より、正弦波信号の次数uiとDCT基底の次数uの和が偶数となる次数に、DCT係数のエネルギーが広く分布することが分かる。
図2は、正弦波信号(ui=1)を入力とした場合の、DCT係数とDST係数とを示している。図2(A)は、DCT係数を示しており、ui=1との和が偶数になるuの係数(u=1,3,5,7)に、絶対値の大きいスペクトルが分布している。なお、ここで、スペクトルとは、直交変換係数のことを意味する。
図2(B)は、DSTのスペクトルを示している。この場合には、自明ながらui=1だけにスペクトルが現れる。したがって、DST係数の3次以降の係数を除去したとしても、入力信号を再構成できる。
図2(A)に戻ると、この場合には、図2(B)とは異なり、DCT係数のスペクトル集中は低く、スペクトルは広く分布する。DCTは、DSTと相補的な性質を持つことが分かる。
以上の例からも分かるように、正弦波信号(ui=1)に対しては、DSTのほうが、DCTよりも、より少ないスペクトル成分に情報を集約でき、符号化効率の観点からは、より適切である。
[実施例1]
実施例1では、上述のDCTとDSTの2つの直交変換の性質を利用する。そして、何れの直交変換が適切な直交変換であるかを、簡便な方式で特定することができる。
<構成>
図3は、実施例1における画像処理装置300の一例を示すブロック図である。図3に示す例では、画像処理装置300は、第1の直交変換部320、分析部322、選択部330、第2の直交変換部340、第1のスイッチ328、及び第2のスイッチ329を有する。各部についての概略を以下に説明する。
第1の直交変換部320は、入力画像341を、第1の直交変換により変換する。なお、入力画像341は、原画像から予測された画像を差し引いた予測誤差信号であってもよい。変換する単位は、入力画像の一部分である32×32、16×16、8×8画素などのブロックに分割された単位である。第1の直交変換部320は、たとえば、DCTを実行する機能を有してもよい。
分析部322は、第1の直交変換部320で変換された第1の直交変換係数321を受け取る。分析部322の具体的処理については、図4を用いて後述する。
選択部330は、分析部322の分析結果321を受け取る。選択部330は、分析結果321に基づいて、第1のスイッチ328及び第2のスイッチ329に、選択指示信号327を与える。
選択指示信号327が、第1のスイッチ328に対して、入力画像341を第2の直交変換部340に与える信号である場合、第2の直交変換部340が、入力画像341に対して直交変換処理を実行する。そして、第2の直交変換部340は、第2の直交変換係数331を第2のスイッチ329に出力する。
以上のように、選択指示信号327によって、出力351には、第1の直交変換係数321又は第2の直交変換係数331が選択的に出力される。この場合、第1の直交変換係数が出力351に出力される場合には、第2の直交変換部340の処理が省略され得る。この場合には、リソースの節約がなされる。
<分析部322の説明>
次に、分析部322について説明する。例示として、第1の直交変換部320にDCT−II(以下、単にDCTと称する場合がある)を用い、第2の直交変換部340にDST−II(以下、単にDSTと称する場合がある)を用いた場合を想定する。なお、DSTは実装上の容易さからタイプ2としたが、他のタイプであってもよい。
DCTとDSTには、上述の式(4)、式(5)、式(6)の関係が存在する。すなわち、DSTの基底画像の1つをDCTで変換した直交変換係数は、偶数次、又は奇数次の一方だけにパワースペクトル生じ、他方のパワースペクトルが0になる。同様にDCTの基底画像の1つをDSTで変換した直交変換係数も、偶数次、又は奇数次の一方だけにスペクトルが生じ、他方のスペクトルが0になる。
図4は、DSTとDCTとの関係の例を示している。図4は、二次元の直交変換係数の水平方向の一列を取り出した図である。図4(A)と図4(B)は、それぞれ同じ画像をDCTとDSTで変換した場合のスペクトルの水平成分の1つを示した図である。色の濃さは、スペクトルの絶対値の大きさを表している。
図4(C)と図4(D)は、他の条件で、それぞれ同じ画像をDCTとDSTで変換した場合のスペクトルの水平成分の1つを示した図である。
信号の圧縮符号化方式では、直交変換において一般に低域にスペクトルが集中することを想定している。したがって、図4(A)又は図4(C)のような、スペクトルの拡散が発生する場合は、対象画像に対して、その直交変換(すなわちDCT)が適切に機能しないことを意味する。表現を変えて説明すれば、この場合には、DCTを利用しても、スペクトルが拡散しているために、その後の情報圧縮が十分に望めないことを意味する。
これに対して、図4(B)又は図4(D)のようなDSTによってスペクトル集中が得られる画像の場合には、DSTを用いることが適切であることを示している。
このような特徴から、DCTを用いた第1の直交変換部320において、図4(A)又は図4(C)に類似したスペクトルパターンが観察された場合には、DSTによる第2の直交変換部340を利用した方が、DCTよりもスペクトルの集中が望めることが容易に予想できる。このことは、DCTのスペクトルの特徴を調べることによって、DSTを試すことなく、DCT又はDSTの何れの直交変換が適切かを判定することができることを意味する。
<動作>
次に、実施例1における画像処理装置300の動作について説明する。図5は、実施例1における画像処理の一例を示すフローチャートである。
ステップS502で、第1の直交変換部320は、入力画像を第1の直交変換であるDCT−IIによって変換し、第1の直交変換係数321を得る。
ステップS504で、分析部322は、水平方向のパワースペクトル(又はスペクトルの絶対値)を、偶数次、及び奇数次毎に積算してもよい。
ステップS506で、分析部322は、ステップS504で得られた、水平方向の偶数次の積算と、水平方向の奇数次の積算との比を計算する。この場合の比の計算では、大きい値を分母に、小さい値を分子として計算し、比が、常に1以下の値として得られるようにする。
図6を用いて、ステップ4の計算の例を説明する。図6は、8×8画素のブロックをDCT−IIで直交変換した直交変換係数から得たパワースペクトル600を示している。説明を分かりやすくするために、パワースペクトル600は、列1〜列8、及び行A〜行Hの符号を用いて、各パワースペクトルの値を表現する。例えば、列1行Aの要素A1は、DCT−IIのDC成分のパワースペクトル値である。他の要素についても、それぞれの周波数領域のパワースペクトル値を表している。
上述のステップS504で、水平方向の偶数次のパワースペクトルの合計値をHevenとすれば、Hevenは、具体的に以下のように計算される。
Heven=A2+A4+A6+A8+B2+……..+H6+H8
また、ステップS504で、水平方向の奇数次のパワースペクトルの合計値をHoddとすれば、Hoddは、具体的に以下のように計算される。
Hodd=A1+A3+A5+A7+B1+……..+H5+H7
そして、HevenとHoddのうち、大きい値を分母として、比Hrateを以下のように計算する。
Hrate=Heven/Hodd (Heven<Hoddの場合)
図5に戻る。
ステップS508で、分析部322は、垂直方向のパワースペクトル(又はスペクトルの絶対値)を、偶数次、及び奇数次毎に積算する。
ステップS510で、分析部322は、ステップS508で得られた、垂直方向の偶数次の積算と、垂直方向の奇数次の積算との比を計算する。この場合の比の計算では、大きい値を分母に、小さい値を分子として計算し、比が、常に1以下の値として得られるようにする。
ステップS508及びステップS510を、図6を用いて同様に計算すると、以下のようになる。
垂直方向の偶数次のパワースペクトルの合計値をVevenとすれば、Vevenは、具体的に以下のように計算される。
Veven=B1+D1+F1+H1+B2+……..+F8+H8
また、ステップS508で、垂直方向の奇数次のパワースペクトルの合計値をVoddとすれば、Voddは、具体的に以下のように計算される。
Vodd=A1+C1+E1+G1+A2+……..+E8+G8
そして、VevenとVoddのうち、大きい値を分母として、比Vrateを以下のように計算する。
Vrate=Veven/Vodd (Heven<Hoddの場合)
図5に戻る。
ステップS512において、水平方向の比Hrateと垂直方向の比Vrateの平均値AVErateを計算してもよい。比の平均値AVErateは、以下のように計算できる。
AVErate=(Hrate+Vrate)/2
ステップS514で、選択部330は、比の平均値AVErateを所定の閾値と比較する。例えば、閾値として、0.5を採用した場合は、以下の判断を行ってもよい。
AVErate>0.5
AVErateは、大きい値であるほど、第1の直交変換のパワースペクトルの偶数次と奇数次の差が小さいことを意味する。この場合、DCTの方がDSTよりもより適切な直交変換である可能性が高くなることを意味する。
したがって、AVErate>0.5が成り立てば、DCTを採用することが適切であると判断してもよい。そして、AVErate>0.5が成り立たなければ、DSTを採用することが適切であると判断してもよい。
なお、ここで採用した閾値0.5は、例示に過ぎない。他の値であってもよい。また、上記の例では水平方向の比Hrateと素直垂直方向の比Vrateの両方を用いたが、これはいずれか一方を用いることでも構わない。
また、本実施例では簡単のために二次元直交変換を例に示すが、水平、垂直で異なる一次元直交変換を適用する符号化の場合はHrateとVrateそれぞれが閾値以上であるかによってそれぞれの直交変換を決定してもよい。
ステップS514で、判断結果が「はい」であれば、ステップS516に移る。判断結果が「いいえ」であれば、ステップS518に移る。
ステップS516で、選択部330は、第1の直交変換部320のDCTによって得られた直交変換係数を出力351に出力する。
ステップS518で、選択部330は、第2の直交変換部340に、入力画像341を与える。そして、第2の直交変換部340がDSTを用いて入力画像341を変換する。
ステップS520で、選択部330は、第2の直交変換部340で得られた直交変換係数を出力351に出力する。
以上、実施例1によれば、計算量を抑えつつ、DCTとDSTの何れの直交変換を行うことが好ましいかを判断できる。そして、計算量を抑えつつ、DCTとDSTのうち、適切な直交変換を利用して、直交変換係数を取得することができる。DCTが適切であると判断された場合には、DSTの計算を省略することができる。
[実施例2]
実施例2は、実施例1を、より一般化した例である。
<構成>
図7は、実施例2の画像処理装置700の構成のブロック図を示している。図3と同様の機能を有する構成要素については、同じ符号が付されている。重複を避けるため、同じ符号に係る構成要素の説明は省略する。
図7において、分析部322は、類似度算出部724と、記憶部726とを含んでもよい。また、図7の例では、第1の直交変換部320及び第2の直交変換部340に加えて、第3の直交変換部743を有している。このため、第3の直交変換部743が選択できるよう、第1のスイッチ328が変形されている。
第1の直交変換部320、第2の直交変換部340、及び第3の直交変換部743は、それぞれ、例えばDCT−II、DST−II、及びDST−VIIを採用していると仮定して以下の説明を行う。なお、実施例2は、これに限られるものではない。したがって、4個以上の直交変換部が存在していてもよい。
図8は、記憶部に記憶される直交変換係数比較用パターンを説明する図である。図8を用いて、実施例2の基本原理を説明する。
図8の第2の直交変換の基底画像820を取り上げて、記憶部に記憶される複数の直交変換係数比較用パターンを説明する。基底画像820は、合計64個の基底画像を持ち、それぞれの基底画像は、8×8画素とする。
この例では、第2の直交変換(DST−II)の4つの低域成分の基底画像を用いる。まず、基底画像821に対して第1の直交変換部320により、第1の直交変換(DCT−II)を施し、直交変換係数872を取得する。この直交変換係数872は、記憶部726に記憶されてもよい。同様に、他の3つの基底画像822、823、824についても、第1の直交変換を施して、それぞれ、直交変換係数871、874、873を取得し、記憶部726に記憶される。
この操作によって得られた、直交変換係数871〜874は、直交変換係数比較用パターンとして用いることができる。
同様に、第3の直交変換の基底の低域成分の基底画像831〜834にも、第1の直交変換が施される。その結果、直交変換係数881〜884が得られ、記憶部726に記憶される。直交変換係数881〜884は、直交変換係数比較用パターンとして用いることができる。
以上の処理は、実際の画像処理を行う前に、事前に実行されているものとする。したがって、記憶部726には、複数の直交変換係数比較用パターンが記憶されているものとする。
次に、直交変換係数比較用パターンの性質について説明する。例えば、第1の直交変換によって、入力画像が変換され、直交変換係数890が得られたとする。この直交変換係数890が、記憶部726に記憶された直交変換係数比較用パターン871と極めて類似したパターンである場合を想定する。類似度の計算には、相関値の計算を利用してもよい。
この場合には、入力画像341を第2の直交変換部340(DST−II)で変換した場合には、基底画像822に対応する直交変換係数の絶対値が高いスペクトルパターンが得られることとなる。この場合、第2の直交変換は、第1の直交変換よりも、スペクトルを集約できる可能性が高いことを示している。したがって、この場合には、第1の直交変換よりも第2の直交変換を用いることが望ましい。これによって、圧縮効率の向上が期待できる。
なお、この類似度の比較は、たとえば、直交変換係数比較用パターンと、実際の画像を第1の直交変換部320で得られた直交変換係数との相関値を計算してもよい。そして計算された相関値のうち一番相関が高い直交変換係数比較用パターンを探索してもよい。探索された直交変換係数比較用パターンに対応する相関値と所定の閾値を比較した結果を基に、第1の直交変換を用いるか、探索された直交変換比較用パターンに対応する直交変換を用いるか否かを決定してもよい。すなわち、一番高い相関値が所定の閾値を超える場合には、探索された直交変換比較用パターンに対応する直交変換を用いる。その相関値が所定の閾値以下の場合には、第1の直交変換を用いる。
また類似度の計算は、既存のSAD(Sum of absolute difference)、SSD(Sum of Squared difference)などの手法の何れを用いても良い。
なお、記憶部726にどの程度の数の直交変換係数比較用パターンを記憶させておくかは、用意する直交変換の数、類似度計算に要するリソースの量等を勘案して決定すればよい。
また、図7では、第2の直交変換の基底として、低域成分の基底を選択した。これは、低域に、パワースペクトルが集中するように直交変換が設計されている場合が多いからである。したがって、直交変換の性質に応じて、どの基底を基にして、直交変換係数比較用パターンを作成するかは、採用する直交変換の性質又は設計理念を勘案することが望ましい。
また、実施例2では、第1の直交変換部320を使用して、1つの基底画像から1つの直交変換係数比較用パターンを作成した。しかしながら、実施例2は、これに限られるものではなく、複数の基底画像を合成した画像を作り、第1の直交変換部320を使用して、1つの直交変換係数比較用パターンを作成してもよい。
<動作>
図9は、実施例2における画像処理の一例を示すフローチャートを示している。以下に、実施例2における画像処理装置の動作について説明する。
ステップS902で、第1の直交変換部320は、入力画像341に対して、第1の直交変換(DCT−II)を実行し、第1の直交変換係数321を取得する。
ステップS904で、類似度算出部724は、記憶部726から、直交変換比較用パターンのうちから1つを取り出す。
ステップS906で、類似度算出部724は、第1の直交変換係数321と読み出された直交変換比較用パターンとの類似度(例えば相関値)を計算する。
ステップS908で、記憶部726に記憶されたパターンの数だけ、ステップS904及びステップS906を繰り返す。
ステップS910で、選択部330は、最大の類似度(例えば相関値)を持つ直交変換比較用パターンを特定する。
ステップS912で、選択部330は、最大の類似度が、所定の閾値を越えるか否かを判断する。その判断が「いいえ」であれば、ステップS914に移る。その判断が「はい」であれば、ステップS916に移る。
ステップS914で、選択部は、第1の直交変換部で得られた直交変換係数を出力351に出力する。
ステップS916で、選択部は、選択された直交変換比較用パターンに対応する直交変換部(第2の直交変換部340、又は第3の直交変換部743のいずれか)を特定する。
選択部330は、第1のスイッチ328及び第2のスイッチ329を操作して、入力画像341を、特定された直交変換部に与える。特定された直交変換部は、入力画像341に特定された直交変換部の直交変換を施し、直交変換係数331を取得する。選択部330は、第2のスイッチ329に指示し、取得された直交変換係数331を出力351に出力させる。
以上、実施例2によって、計算量を抑えつつ、複数の直交変換をのうちから適切な直交変換により、直交変換係数を得ることができる。利用候補とされる直交変換が3つ以上であっても、最大で2つの直交変換を実行するだけでよい。第1の直交変換が適切と判断された場合には、直交変換は、1回だけ実行すればよい。
[実施例3]
実施例3では、実施例1における画像処理装置300,又は実施例2における画像処理装置700を直交変換部202に含む画像処理装置(画像符号化装置)について説明する。
<構成>
図10は、実施例3における画像処理装置20の概略構成の一例を示すブロック図である。図10に示す例では、画像処理装置20は、前処理部200と、予測誤差信号生成部201と、直交変換部202と、量子化部203と、エントロピー符号化部204と、逆量子化部205と、逆直交変換部206と、復号画像生成部207と、ループフィルタ部209と、復号画像記憶部210と、イントラ予測部211と、インター予測部212と、動きベクトル計算部213と、予測画像選択部215とを有する。各部についての概略を以下に説明する。
前処理部200は、ピクチャタイプに合わせてピクチャを並べ替え、ピクチャタイプ及びフレーム毎のフレーム画像等を順次出力する。また、前処理部200は、ブロック分割なども行い、ブロック分割の境界情報をループフィルタ部209に出力してもよい。
予測誤差信号生成部201は、入力された動画像データの符号化対象画像が、例えば32×32、16×16、8×8画素などのブロックに分割されたブロックデータを取得する。
予測誤差信号生成部201は、そのブロックデータと、予測画像選択部215から出力される予測画像のブロックデータとにより、予測誤差信号を生成する。予測誤差信号生成部201は、生成された予測誤差信号を直交変換部202に出力する。
直交変換部202は、実施例1における画像処理装置300、又は実施例2における画像処理装置700が含まれ得る。直交変換部202は、入力された予測誤差信号を直交変換処理する。直交変換部202は、変換された係数値を示す信号を量子化部203に出力する。加えて、選択された直交変換を示す選択信号をエントロピー符号化部及び逆直交変換部に送出する。
量子化部203は、直交変換部202からの出力信号を量子化する。量子化部203は、量子化することによって出力信号の符号量を低減し、この出力信号をエントロピー符号化部204及び逆量子化部205に出力する。量子化部203は、量子化パラメータのQP値をループフィルタ部209に出力してもよい。
エントロピー符号化部204は、量子化部203からの出力信号や、動きベクトル計算部213から出力された動きベクトル情報やループフィルタ部209からのフィルタ係数などをエントロピー符号化して出力する。
また、エントロピー符号化部204は、イントラ予測部211から取得したイントラ予測方向の差分値や、インター予測部212から取得した動きベクトルと予測ベクトルの差分値などをエントロピー符号化してもよい。
また、エントロピー符号化部204は、直交変換部202において使用された直交変換の情報250(直交変換の選択信号)を符号化して、選択した直交変換のインデックスとして復号装置側へ伝送する。エントロピー符号化とは、シンボルの出現頻度に応じて可変長の符号を割り当てる方式をいう。
逆量子化部205は、量子化部203からの出力信号を逆量子化してから逆直交変換部206に出力する。逆直交変換部206は、逆量子化部205からの出力信号を逆直交変換処理してから復号画像生成部207に出力する。逆直交変換部206は、入力された直交変換の選択信号を用いて逆直交変換の方法を選択する。これら逆量子化部205及び逆直交変換部206によって復号処理が行われることにより、符号化前の予測誤差信号と同程度の信号が得られる。
復号画像生成部207は、イントラ予測部211で画面内予測された画像或いはインター予測部212で動き補償された画像のブロックデータと、逆量子化部205及び逆直交変換部206により復号処理された予測誤差信号とを加算する。復号画像生成部207は、加算して生成した復号画像のブロックデータを、ループフィルタ部209に出力する。
ループフィルタ部209は、例えばALF(Adaptive Loop Filter)やデブロッキングフィルタである。ループフィルタ部209は、フィルタ処理結果を復号画像記憶部210に出力し、蓄積された1画像分のフィルタ処理結果を参照画像として記憶させる。
復号画像記憶部210は、入力した復号画像のブロックデータを新たな参照画像のデータとして記憶し、イントラ予測部211、インター予測部212及び動きベクトル計算部213に出力する。
イントラ予測部211は、符号化対象画像の処理対象ブロックに対して、既に符号化された参照画素から予測画像のブロックデータを生成する。イントラ予測部211は、複数の予測方向を用いて予測を行い、最適な予測方向を決定する。予測方向については、符号化済みブロックの予測方向との差分値をビットストリームに含めるために、差分値がエントロピー符号化部204に出力される。
インター予測部212は、復号画像記憶部210から取得した参照画像のデータを動きベクトル計算部213から提供される動きベクトルで動き補償する。これにより、動き補償された参照画像としてのブロックデータが生成される。動きベクトルについては、符号化済みブロックの動きベクトル(予測ベクトル)との差分値をビットストリームに含めるために、差分値がエントロピー符号化部204に出力される。
動きベクトル計算部213は、符号化対象画像におけるブロックデータと、復号画像記憶部210から取得する参照画像とを用いて、動きベクトルを求める。
動きベクトル計算部213は、求めた動きベクトルをインター予測部212に出力し、参照画像を示す情報を含む動きベクトル情報をエントロピー符号化部204に出力する。
イントラ予測部211とインター予測部212から出力されたブロックデータは、予測画像選択部215に入力される。
予測画像選択部215は、イントラ予測部211とインター予測部212から取得したブロックデータのうち、どちらか一方のブロックデータを予測画像として選択する。選択された予測画像は、予測誤差信号生成部201に出力される。
なお、イントラ予測部211とインター予測部212のいずれが使用されたかに依存して、直交変換部202において利用される複数の直交変換の候補を異ならせてもよい。
なお、図10に示す画像処理装置20の構成は一例であり、必要に応じて各構成を組み合わせたり、各構成を適宜変更したりしてもよい。
以上、実施例3によれば、画像符号化時に、直交変換の計算量を抑えつつ、複数の直交変換のうちから適切な直交変換により、直交変換係数を得ることができる。
[実施例4]
図11は、実施例4における画像処理装置40の概略構成の一例を示すブロック図である。図11に示す画像処理装置40は、上述した実施例1〜3で説明した画像処理をソフトウェアで実装した装置の一例である。
図11に示すように、画像処理装置40は、制御部401と、主記憶部402と、補助記憶部403と、ドライブ装置404と、ネットワークI/F部406と、入力部407と、表示部408とを有する。これら各構成は、バスを介して相互にデータ送受信可能に接続されている。
制御部401は、コンピュータの中で、各装置の制御やデータの演算、加工を行うCPU(Central Processing Unit)である。また、制御部401は、主記憶部402又は補助記憶部403に記憶された画像処理のプログラムを実行する演算装置である。制御部401は、入力部407や記憶装置からデータを受け取り、演算、加工した上で、表示部408や記憶装置などに出力する。
また、制御部401は、画像処理のプログラムを実行することで、実施例1〜3で説明した処理を実現することができる。
主記憶部402は、ROM(Read Only Memory)やRAM(Random Access Memory)などである。主記憶部402は、制御部401が実行する基本ソフトウェアであるOS(Operating System)やアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
補助記憶部403は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。
ドライブ装置404は、記録媒体405、例えばフレキシブルディスクからプログラムを読み出し、記憶部にインストールする。
また、記録媒体405に、所定のプログラムを格納し、この記録媒体405に格納されたプログラムはドライブ装置404を介して画像処理装置40にインストールされる。インストールされた所定のプログラムは、画像処理装置40により実行可能となる。
ネットワークI/F部406は、有線及び/又は無線回線などのデータ伝送路により構築されたLAN(Local Area Network)、WAN(Wide Area Network)などのネットワークを介して接続された通信機能を有する周辺機器と画像処理装置40とのインターフェースである。
入力部407は、カーソルキー、数字入力及び各種機能キー等を備えたキーボード、表示部408の表示画面上でキーの選択等を行うためのマウスやスライドパット等を有する。表示部408は、LCD(Liquid Crystal Display)等により構成され、制御部401から入力される表示データに応じた表示が行われる。
なお、図3の画像処理装置300及び図7の画像処理装置700の各部は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
また、図10に示す復号画像記憶部210は、例えば主記憶部402又は補助記憶部403により実現され、図10に示す復号画像記憶部210以外の構成は、例えば制御部401及びワークメモリとしての主記憶部402により実現されうる。
画像処理装置40で実行されるプログラムは、実施例1〜3で説明した各部を含むモジュール構成となっている。実際のハードウェアとしては、制御部401が補助記憶部403からプログラムを読み出して実行することにより上記各部のうち1又は複数の各部が主記憶部402上にロードされ、1又は複数の各部が主記憶部402上に生成されるようになっている。
このように、上述した実施例1〜3で説明した画像処理は、コンピュータに実行させるためのプログラムとして実現されてもよい。このプログラムをサーバ等からインストールしてコンピュータに実行させることで、実施例1〜3で説明した処理を実現することができる。
また、このプログラムを記録媒体405に記録し、このプログラムが記録された記録媒体405をコンピュータや携帯端末などの処理装置に読み取らせて、前述した画像処理を実現させることも可能である。
なお、記録媒体405は、CD−ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
また、上述した各実施例で説明した画像処理は、1つ又は複数の集積回路に実装されてもよい。なお、実施例4における画像処理装置40は、上記の通り、画像処理装置300、700、20の少なくとも1つの装置としての機能を有してもよい。
また、上述した各実施例における画像処理装置は、直交変換を選択して使用する符号化技術に対して適用可能であり、H.264/AVCやHEVCだけに限られるものではない。
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、上記変形例以外にも種々の変形及び変更が可能である。
320 第1の直交変換部
321 分析結果
322 分析部
327 選択指示信号
328 第1のスイッチ
329 第2のスイッチ
330 選択部
340 第2の直交変換部
341 入力画像
351 出力
724 類似度算出部
726 記憶部
743 第3の直交変換部

Claims (4)

  1. 離散コサイン変換、及び離散サイン変換の2つの直交変換のうち、一方又は他方を選択して処理を行う画像処理装置であって、
    画像データを前記一方の直交変換によって変換して得られた直交変換係数の水平方向の奇数次と偶数次とのエネルギー比、及び/又は前記直交変換係数の垂直方向の奇数次と偶数次とのエネルギー比を用いた規則に従って分析する分析部と、
    前記分析部の分析結果に基づいて、前記一方又は前記他方を選択する選択部と、
    を有する画像処理装置。
  2. 第1の直交変換、及び1以上の他の直交変換のうち、何れか1つを選択して処理を行う画像処理装置であって、
    画像データを前記第1の直交変換によって変換して得られた第1の直交変換係数を、所定の規則に従って分析する分析部と、
    前記分析部の分析結果に基づいて、前記第1の直交変換、及び前記1以上の他の直交変換のうち、何れか1つを選択する選択部と、
    を有する画像処理装置であって、
    前記分析部は、
    前記1以上の他の直交変換の各々が有する所定の数の複数の基底画像の各々を前記第1の直交変換によって変換して得られた直交変換係数を蓄積した記憶部と、
    前記第1の直交変換係数と前記記憶部に記憶された前記複数の直交変換係数との類似度を算出する類似度算出部と、
    を含み、
    前記選択部は、前記類似度算出部によって得られた類似度のうち、最も高い類似度が、所定の閾値を越える場合、前記最も高い類似度に対応する、前記他の直交変換に、前記画像データを選択的に与えることによって、前記画像データが変換された直交変換係数を、前記画像データの符号化のために用い、
    前記最も高い類似度が、前記所定の閾値以下の場合、前記第1の直交変換係数を、前記画像データの符号化のために用いる
    像処理装置。
  3. 請求項1または2に記載の画像処理装置を備える符号化装置。
  4. コンピュータを、請求項に記載の符号化装置として機能させるためのプログラム。
JP2013097917A 2013-05-07 2013-05-07 画像処理装置、符号化装置、及びプログラム Expired - Fee Related JP6159139B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013097917A JP6159139B2 (ja) 2013-05-07 2013-05-07 画像処理装置、符号化装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013097917A JP6159139B2 (ja) 2013-05-07 2013-05-07 画像処理装置、符号化装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2014220624A JP2014220624A (ja) 2014-11-20
JP6159139B2 true JP6159139B2 (ja) 2017-07-05

Family

ID=51938724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013097917A Expired - Fee Related JP6159139B2 (ja) 2013-05-07 2013-05-07 画像処理装置、符号化装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP6159139B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0522715A (ja) * 1991-07-12 1993-01-29 Sony Corp 画像符号化装置
KR960006761B1 (ko) * 1991-12-07 1996-05-23 삼성전자주식회사 변환방식의 적응적 선택에 의한 변환부호화 및 복호화방법
WO2008035842A1 (en) * 2006-09-20 2008-03-27 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding using alternative converter according to the correlation of residual signal
JP5302256B2 (ja) * 2010-03-05 2013-10-02 日本放送協会 符号化装置、復号装置及びプログラム
JP5377395B2 (ja) * 2010-04-02 2013-12-25 日本放送協会 符号化装置、復号装置及びプログラム
JP5674596B2 (ja) * 2011-08-24 2015-02-25 日本放送協会 画像符号化装置、画像復号装置、及びこれらのプログラム

Also Published As

Publication number Publication date
JP2014220624A (ja) 2014-11-20

Similar Documents

Publication Publication Date Title
RU2406255C2 (ru) Прогнозирование коэффициентов преобразования для сжатия изображения
JP6284954B2 (ja) イントラ予測のためのモード決定の簡略化
JP5027936B2 (ja) 適応スキャン順序付けのための方法、記録媒体、プログラム、及び処理装置。
RU2479938C2 (ru) Устройство обработки изображения, способ и программа
TWI469644B (zh) 使用辭典編碼視訊之方法
TWI665911B (zh) 用於調色盤模式寫碼之寫碼逃脫像素
JP5700970B2 (ja) 画像シーケンスを表す符号化データストリームの復号方法と画像シーケンスの符号化方法
EP2744210A1 (en) Adaptive transformation of residual blocks depending on the intra prediction mode
JP5908848B2 (ja) 変換選択を有するビデオ符号化および復号のための制約付きの変換を行う方法および装置
CN108141612A (zh) 用于编码和解码图像的装置和方法
KR20090087767A (ko) 영상의 인트라 예측 부호화 방법
KR20120117613A (ko) 동영상 부호화 장치 및 방법
KR101512643B1 (ko) 동영상 부호화 장치 및 이를 위한 영상 신호의 2차원 정렬 변환 장치 및 방법, 및 이를 위한 기록 매체
CN103154970A (zh) 视觉优化量化
JP6176044B2 (ja) ブロック構造決定回路および情報圧縮回路
JP6159139B2 (ja) 画像処理装置、符号化装置、及びプログラム
CN114025166A (zh) 视频压缩方法、电子设备及计算机可读存储介质
JP6564315B2 (ja) 符号化装置、復号装置、及びプログラム
JP5698629B2 (ja) 画像処理装置、フィルタ処理方法及びプログラム
JP5358485B2 (ja) 画像符号化装置
JP2006237765A (ja) 画像符号化装置
JP5690898B2 (ja) 画像復号化方法
JP6110724B2 (ja) 画像処理装置、符号化装置、及び符号化プログラム
JP6485045B2 (ja) インデックス演算装置、プログラム及び方法
JP6497100B2 (ja) 映像符号化装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170609

R150 Certificate of patent or registration of utility model

Ref document number: 6159139

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees