JP5063677B2 - 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体 - Google Patents

映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP5063677B2
JP5063677B2 JP2009500211A JP2009500211A JP5063677B2 JP 5063677 B2 JP5063677 B2 JP 5063677B2 JP 2009500211 A JP2009500211 A JP 2009500211A JP 2009500211 A JP2009500211 A JP 2009500211A JP 5063677 B2 JP5063677 B2 JP 5063677B2
Authority
JP
Japan
Prior art keywords
encoding
prediction
target block
reference pixel
intra prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009500211A
Other languages
English (en)
Other versions
JPWO2008102805A1 (ja
Inventor
翔平 松尾
誠之 高村
一人 上倉
由幸 八島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39710079&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5063677(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009500211A priority Critical patent/JP5063677B2/ja
Publication of JPWO2008102805A1 publication Critical patent/JPWO2008102805A1/ja
Application granted granted Critical
Publication of JP5063677B2 publication Critical patent/JP5063677B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Description

本発明は、映像を符号化する映像符号化方法およびその装置と、その映像符号化方法の実現に用いられる映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体と、その映像符号化方法により符号化されたデータを復号する映像復号方法およびその装置と、その映像復号方法の実現に用いられる映像復号プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体とに関する。
本願は、2007年2月23日に出願された特願2007−043190号に基づき優先権を主張し、その内容をここに援用する。
同一の画面内で予測を実行する画面内予測符号化は、異なる画面間で予測を実行する画面間予測符号化ほど大きな圧縮効率を達成できないため、圧縮効率の高い画面内予測符号化方式が望まれている。
空間次元で同一の画面内から予測を行う画面内予測は、映像符号化標準H.264/MPEG-4 AVCから取り入れられている(例えば、非特許文献1のpp.106-113参照)。
画面内予測はブロック単位で行われ、H.264/MPEG-4 AVCでは、輝度信号に対して3種類のブロックサイズ(4×4,8×8,16×16)が利用可能となっている。また、各ブロックサイズではそれぞれ複数の予測モードが選択可能である。
具体的に説明するならば、4×4のブロックサイズについては非特許文献1の第108頁の図5−3に、8×8のブロックサイズについては非特許文献1の第261頁の図11−6に記載されるように、9種類の予測モードが用意されている。ここで、予測モード2以外の8つの予測モードについては予測方向が存在する。また、16×16のブロックサイズについては、非特許文献1の第111頁の図5−8に記載されるように4種類の予測モードが用意されている。
一方、色差信号に対しては8×8のブロックサイズのみが利用可能であり、非特許文献1の第112頁の図5−9に記載されるように4種類の予測モードが用意されている。予測方向に関しては輝度信号に対する16×16ブロックの場合と同じであるが、予測モード番号と予測方向との対応付けが異なっている。
なお、これらの点については、下記の非特許文献2のpp.118-136にも詳しく説明されている。
これら各種ブロックサイズと予測モードにおいて、どの場合でも例外なく、画面内予測に用いる参照画素は、隣接するブロック上の符号化対象ブロックに最近傍の画素のみに限定されている。
図18に、具体的な例として、符号化対象ブロックが輝度信号の4×4ブロックで、垂直予測(予測モード0)の場合を示す。なお、以下では、特に断らない限り、輝度信号を前提として説明を行うことにする。
図18に示されるように、符号化対象ブロックの左上にあるブロックからX、上にあるブロックからA、B、C、D、右上にあるブロックからE、F、G、H、そして左にあるブロックからI、J、K、Lに示す画素の値が、画面内予測において使用可能である。
これらのうち、予測モード0の場合は、垂直方向の予測のため、Aの値をa,e,i,mに適用し、Bの値をb,f,j,nに適用し、Cの値をc,g,k,oに適用し、Dの値をd,h,l,pに適用する。
画面内予測において、ブロックの位置によっては、参照すべきブロックがない場合が存在する。その場合には128の値を代入するか、もしくは隣の画素の値を代入することで予測を可能としている。
例えば、画面の一番上の行に存在するブロックでは、XからHまでの9画素は常に参照することができないため、128という値を用いる。また、左上と上のブロックは存在するが、右上が存在しない場合には、Dの有する値をE、F、G、Hに代入する。
大久保榮、角野眞也、菊池義浩、鈴木輝彦: "改訂版H.264/AVC教科書", pp. 106-112, 259-262, 2006 ITU-T Study Group16-Question 6/16: "Draft new Corrigendum 1 to H.264 "Advanced video coding for generic audiovisual services"", pp. 118-136, 2005
従来の画面内予測では、予測に利用する参照画素は全て符号化対象ブロックに隣接する位置に存在するものに限定している。予測を行う際に、なるべく高い相関性を有する対象を利用すれば効果が上がるのは明らかなことであり、例えば、画面間予測では、一般に符号化対象フレームの直前のフレームを利用すれば効率が高い。
このことから、従来の画面内予測では、予測に利用する参照画素は全て符号化対象ブロックに隣接する位置に限定している。
しかしながら、画面間予測において、例外として、直前よりも前のフレームを参照した方が効率の高くなる場合がある。例えば、
・オクルージョン(例えば、カメラで見えていなかった部分)が発生し、直前フレームではうまく参照先が見つからない場合
・物体が周期運動していて、直前以外のフレームを参照した方のが予測誤差が小さくなる場合
などが挙げられる。
これと同様の概念が画面内予測にも考えられる。すなわち、一般的には、参照先の画素が符号化対象ブロックに最近傍の位置にあれば、空間相関性の観点から、相関性が最も高い(符号化対象ブロックに近ければ近いほど相関が高い)と考えられるため、予測誤差が小さくなると思われる。
しかしながら例外として、必ずしも符号化対象ブロックに近いほど予測誤差が小さくなるとは言い切れず、逆に大きくなる可能性がある。
例えば、
・オクルージョンや雑音が符号化対象ブロックの最近傍の位置に存在する場合
・縞模様などの周期的信号が表れる場合
・参照する画素は復号画像であるため、これから符号化が行われる符号化対象ブロックに接近するほど、重畳雑音が大きいので、符号化対象画素と参照画素との間の予測誤差が非常に大きい場合
などには逆に大きくなる可能性がある。
これから、このような場合にも従来技術に従っていると、画面内予測符号化を行うときに、予測誤差が大きくなって圧縮効率が上がらないという問題がある。
本発明はかかる事情に鑑みてなされたものであって、画面内予測の符号化の圧縮効率向上を実現する新たな映像符号化技術の提供を目的とする。
〔1〕本発明の映像符号化装置の構成
前述の目的を達成するために、本発明の映像符号化装置は、画面内予測を用いて映像を符号化するときにあって、(1)符号化対象ブロックから所定の距離範囲内にある画素を参照画素の候補として設定する設定手段と、(2)設定手段の設定した参照画素候補の中から符号化対象ブロックの画面内予測に用いる参照画素を符号化対象ブロックからの距離条件を変更しながら順次選択して、その選択した参照画素に基づいて予測信号を生成する生成手段と、(3)生成手段の生成した予測信号を用いて符号化対象ブロックを画面内予測符号化するときの符号化コストを算出する算出手段と、(4)算出手段の算出した各符号化コストに基づいて、符号化対象ブロックの画面内予測に用いる参照画素を最終的に決定する決定手段と、(5)決定手段の決定した参照画素の位置を示す情報を符号化する符号化手段とを備えるように構成する。
この構成を採るときに、設定手段は、量子化の大きさを示すパラメータ(量子化ステップサイズや量子化パラメータ)の値に応じて、量子化が粗くなる場合には、画像全体がぼけることで離れた画素を参照画素として用いても予測精度を上げることが期待できないことを考慮して、参照画素候補の設定に用いる距離範囲を小さく設定し、一方、量子化が細かくなる場合には、画像全体がシャープになることで離れた画素を参照画素として用いても予測精度を上げることが期待できることを考慮して、参照画素候補の設定に用いる距離範囲を大きく設定するというように、量子化の大きさを示すパラメータの値に応じて参照画素候補の設定に用いる距離範囲を変化させることがある。
また、予測信号を生成する場合に、選択した参照画素に対し、複数の予測モードに対応した予測方法を順次適用して各々の場合の予測信号を生成し、生成した各予測信号を用いて各々の前記符号化コストを算出するとともに、参照画素を決定させた符号化コストの算出に用いられた予測信号の予測モードを符号化するようにしても良い。
ここで、以上の各処理手段はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
〔2〕本発明の映像復号装置の構成
本発明の映像復号装置は、本発明の映像符号化装置の生成した符号化データを受けて、(1)符号化対象ブロックからどの位離れた位置にある参照画素を用いて符号化が行われたのかを示す参照元情報の符号化データを復号することで、その参照元情報を獲得する獲得手段と、(2)獲得手段の獲得した参照元情報に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた参照画素を取得する取得手段と、(3)取得手段の取得した参照画素に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた予測信号を復元して、それを用いて復号画像信号を生成する生成手段とを備えるように構成する。
ここで、以上の各処理手段はコンピュータプログラムでも実現できるものであり、このコンピュータプログラムは、適当なコンピュータ読み取り可能な記録媒体に記録して提供されたり、ネットワークを介して提供され、本発明を実施する際にインストールされてCPUなどの制御手段上で動作することにより本発明を実現することになる。
本発明によれば、従来の画面内予測では対応できなかったオクルージョンや雑音を含む画像や空間周波数の類似する信号が周期的に発生する映像などに対して、効率的な画面内予測を実行することが可能となり、圧縮効率を向上させることができるようになる。
本発明による処理の一例を示す図である。 本発明による処理の一例を示す図である。 本発明の画面内予測符号化装置の一実施形態例である。 上記実施形態例に関する参照画素の説明図である。 上記実施形態例の画面内予測符号化装置の実行するフローチャートである。 上記実施形態例に関する参照画素の説明図である。 上記実施形態例で実行する画面内予測例の説明図である。 上記実施形態例で実行可能な画面内予測例の説明図である。 上記実施形態例の画面内予測符号化装置の実行可能なフローチャートである。 図9のフローチャートに従う場合の画面内予測の説明図である。 上記実施形態例の画面内予測符号化装置の実行可能なフローチャートである。 本発明の一実施形態例である画面内予測符号化データ復号装置の構成を示す図である。 上記実施形態例の画面内予測符号化データ復号装置の実行するフローチャートである。 本発明の有効性を検証するために行った実験結果の説明図である。 同様に、本発明の有効性を検証するために行った実験結果の説明図である。 同様に、本発明の有効性を検証するために行った実験結果の説明図である。 同様に、本発明の有効性を検証するために行った実験結果の説明図である。 従来技術の説明図である。
符号の説明
1 画面内予測符号化装置
10 コスト計算ループ部
11 参照元情報符号化部
12 画面内符号化部
100 参照画素候補設定部
101 参照画素候補情報記憶部
102 参照元情報選択部
103 モード選択部
104 画面内予測部
105 コスト判定部
106 最小コスト保持部
107 最小コスト初期化部
108 ループ終了判定部
本発明の映像符号化装置では、符号化対象ブロックから所定の距離範囲内にある画素を参照画素の候補として設定すると、参照画素候補の中から符号化対象ブロックの画面内予測に用いる参照画素を符号化対象ブロックからの距離条件を変更しながら順次選択して、その選択した参照画素に基づいて予測信号を生成する。
例えば、符号化対象ブロックの上側に位置する1つの参照ラインを構成する画素の集合と、符号化対象ブロックの左側に位置する1つの参照ラインを構成する画素の集合と、その2つの参照ラインの交点に位置する画素とを参照画素として選択して、その選択した参照画素に基づいて予測信号を生成したり、その2つの参照ラインのいずれか一方を符号化対象ブロックの最近傍のラインに固定するとともに、他方のライン位置を可変とすることで参照画素を選択して、その選択した参照画素に基づいて予測信号を生成する。
そして、生成した各々の予測信号を用いて符号化対象ブロックを画面内予測符号化するときの符号化コストを算出して、それらの算出した符号化コストに基づいて、符号化対象ブロックの画面内予測に用いる参照画素を最終的に決定して、その決定した参照画素がどの位置にあるのかを示す情報を符号化する。
この本発明の映像符号化装置の生成する符号化データを受けて、このように構成される本発明の映像復号装置では、符号化対象ブロックからどの位離れた位置にある参照画素を用いて符号化が行われたのかを示す参照元情報の符号化データを復号することで、その参照元情報を獲得して、その獲得した参照元情報に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた参照画素を取得する。そして、その取得した参照画素に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた予測信号を復元して、それを用いて復号画像信号を生成する。
このように、本発明では、符号化対象ブロックに隣接する最近傍の位置の画素以外にも、所定の距離の範囲にある既に符号化済みの画素であれば、それらを全て使用可能とすることで、より予測誤差の少ない画面内予測を実現する。
これから、図1に示すことから分かるように、符号化対象ブロックに隣接する最近傍の画素に雑音やオクルージョンが含まれている場合にも、本発明によれば、距離が離れている位置から予測誤差を低減し得る画素を利用することで、画面内予測の効率向上を期待できる。ここで、図1では、垂直予測の予測モードを想定していて、実線が従来技術による予測を示し、破線が本発明を適用した予測を示す。
また、図2に示すことから分かるように、画像信号の特徴として、黒画素のラインと白画素のラインとが交互に現れるような場合にも、本発明によれば、距離が離れている位置から予測誤差を低減し得る画素を利用することで、画面内予測の効率向上を期待できる。
ここで、図2では、垂直予測の予測モードを想定していて、実線が従来技術による予測を示し、破線が本発明を適用した予測を示す。
以上説明したように、従来の画面内予測では、参照できる位置が符号化対象ブロックの最近傍に限定されていたために、予測誤差が大きくなる可能性があっても、それを回避することができなかった。
これに対して、本発明では、参照できる位置の範囲を広げることで、より予測誤差を低減できる画素を選択することが可能になり、その結果として、効率的な画面内予測を実現できるようになる。
以下、具体的な実施の形態に従って本発明を詳細に説明する。
図3に、本発明の一実施形態例である画面内予測符号化装置1の構成を図示する。
本発明の画面内予測符号化装置1は、図4に示すように、符号化対象ブロックの上側に存在する符号化済みの画素の行の集合を refline_x(0≦ refline_x<m)と定義するとともに、符号化対象ブロックの左側に存在する画素の列の集合を refline_y(0≦ refline_y<n)と定義して、この中から参照画素を取得して画面内予測を行うことで、従来技術であれば refline_x= refline_y=0に限定されていた状態から、より離れた位置にある画素を参照画像として画面内予測を行うことができるように処理するものである。
本発明の画面内予測符号化装置1は、この画面内予測を実現するために、 refline_xおよび refline_yのとり得る各値について、その値に従って定義される参照画素に基づいて画面内予測を行ってレート歪みコストを算出することを繰り返し行うことで、最小となるレート歪みコストを実現する参照画素を提供する refline_xおよび refline_yの値を決定するコスト計算ループ部10と、コスト計算ループ部10の決定した refline_xおよび refline_yの値を符号化する参照元情報符号化部11と、コスト計算ループ部10の決定した refline_xおよび refline_yの値を用いて予測信号を生成し、画面内符号化を行う画面内符号化部12とを備える。
そして、コスト計算ループ部10は、この処理を行うために、 refline_xおよび refline_yのとり得る値の範囲を設定する参照画素候補設定部100と、参照画素候補設定部100の設定した情報を記憶する参照画素候補情報記憶部101と、参照画素候補情報記憶部101の記憶する情報に基づいて、 refline_xおよび refline_yの値を参照元情報として選択する参照元情報選択部102と、画面内符号化の予測モードを選択するモード選択部103と、参照元情報選択部102の選択した参照元情報から定められる参照信号を用いて、モード選択部103の選択した予測モードの予測信号を生成する画面内予測部104と、画面内予測部104の生成した予測信号に基づいてレート歪みコストを算出して、最小コスト保持部106に保持されるこれまでに算出したレート歪みコストの最小値(最小コスト保持部106はその最小値を実現した参照元情報についても保持する)と比較し、今回算出した方が小さいときには、最小コスト保持部106に保持されるレート歪みコストの最小値を更新するコスト判定部105と、処理開始時に最小コスト保持部106に対して大きな値を示す初期値を設定する最小コスト初期化部107と、参照元情報と予測モードのループが終了したのか否かを判断して、終了していない場合には、参照元情報選択部102に対してループ処理の続行を指示し、終了した場合には、最小コスト保持106に保持されるレート歪みコストの最小値を実現した参照元情報を参照元情報符号化部11に渡すループ終了判定部108とを備える。
図5に、このように構成される本実施形態の画面内予測符号化装置1の実行するフローチャートの一例を図示する。
次に、このフローチャートに従って、画面内予測符号化装置1の実行する画面内予測符号化処理について詳細に説明する。
本実施形態の画面内予測符号化装置1は、図5のフローチャートの実行に先立って、図4に示すように、符号化対象ブロックの上に存在する符号化済みの画素の行の集合を refline_x(0≦ refline_x<m)と定義するとともに、左に存在する画素の列の集合を refline_y(0≦ refline_y<n)と定義する。ここで、それぞれ符号化対象ブロックに近い順に0,1,2・・・と番号付けする。
図4では、4×4ブロックを具体例にして、 refline_xおよび refline_yの定義例を示しており、m=n=4としている。
ここで、m=n=4に限るものではなく、また、m=nである必要もない。mとnの数を多くとれば、それだけ予測に用いる候補点が増加するので、予測誤差の低減(すなわち、符号化効率の向上)に結びつく。ただし、離れすぎると、逆に空間相関性が低くなるため、極端に大きな数字を用いるべきではない。また、 reflineの情報は符号化するため、この本数が増加すれば、参照元情報(参照画素が符号化対象ブロックからどれ位離れているのかを示す情報)のデータ量が増えることもある。
これらm、nの値については、後述する量子化パラメータなどの、量子化の大きさを示すパラメータの値に応じて設定するようにしても良い。
本実施形態の画面内予測符号化装置1は、 refline_xおよび refline_yの定義を行った後、図5のフローチャートに従って、画面内予測符号化処理を実行する場合には、まず最初に、ステップS101で、レート歪みコストJの最小値を格納する変数Jmin に対して、十分大きな値であるMAXcostを代入することで初期化する。
ここで、レート歪みコストJとしては、例えば、
J=SSD+λ×R
SSD:予測誤差の絶対値の2乗和
λ:ラグランジュ定数
R:符号化対象ブロックを、設定された予測モードで符号化した場合の発生情報量
を用いる。
この発生情報量Rについて説明するならば、映像符号化は、基本的には、予測、変換、量子化、エントロピー符号化という流れで処理を行う。
発生情報量Rは実際に符号化したときの符号量を示すので、今回の場合、本発明による予測手法で予測画像を生成して、原画像との差分を取り、その残差信号を整数精度DCT変換を用いて直交変換を施し、量子化を行い、その量子化した信号にエントロピー符号化を施して0と1のデータにする。このときの0と1の個数が発生情報量Rに相当する。
続いて、ステップS102で、 refline_yの位置を指定するループ1を開始し、初期値として、 refline_y=0を代入する。
続いて、ステップS103で、 refline_xの位置を指定するループ2を開始し、初期値として、 refline_x=0を代入する。
続いて、ステップS104で、 refline_x、 refline_yから一意に定まる参照画素を取得する。
図4の定義例で説明するならば、 refline_x、 refline_yから一意に定まるXからLまでの参照画素(X, A〜H, I〜L)を取得するのである。例えば、 refline_x=0、 refline_y=0の場合には、X=X00, A=A0,B=B0,・・・・ ,H=H0,I=I0,J=J0,K=K0,L=L0 を取得する。
ここで、 refline_x=0、 refline_y=0以外の場合におけるXは、 refline_xと refline_yとの交点に相当する位置の画素を参照する。例えば、図6に示す例で説明するならば、 refline_x=2、 refline_y=1であることから、X=X12とするのである(X02、X11、X10、X13、X22、X32は参照されない)。
続いて、ステップS105で、符号化対象ブロックが取る予測モードを指定するループ3を開始する。符号化対象ブロックは画像内に存在する位置において取り得る予測モードが異なってくるため、ここではψを符号化対象ブロックが取り得る全ての予測モードの集合と定義する。
初期値として、予測モード番号を格納する変数modeに対してi(iは取り得る予測モードで最も予測モード番号が小さい数値)を代入する。
続いて、ステップS106で、取得した参照画素とループ3で選択した予測モードとから予測信号を生成する。なお、予測信号の生成には従来の生成方法を用いる。
例えば、図6に示す例で説明するならば、 refline_x=2、 refline_y=1に従って参照画素を取得しているときに、ループ3で予測モード0を選択した場合には、図7に示すように、A2,B2,C2,D2 を使って垂直予測を行うことで符号化対象ブロックの予測信号を生成するのである。
続いて、ステップS107で、生成した予測信号からmode=iのレート歪みコストJi を求める。レート歪みコストの計算は前述した従来の計算方法を用いる。
続いて、ステップS108で、
i <Jmin
であるのか否かを判断することで、レート歪みコストJi がこれまでに得られたものの中で最小かどうかの判定を行う。
このステップS108の判定処理に従って、「Ji <Jmin 」という判定結果が得られた場合には、ステップS109に進んで、その際の予測モードiに従って変数best_modeの値を更新し、その際の refline_xに従って変数best_refline_xの値を更新し、その際の refline_yに従って変数best_refline_yの値を更新し、さらに、その際のJi に従って変数Jmin の値を更新する。
一方、ステップS108の判定処理に従って、「Ji <Jmin 」という判定結果が得られなかった場合には、ステップS109の処理を省略する。
以上のコスト計算処理を、ループ3で、取り得る全ての予測モードについて繰り返す。そして、このループ3が終わったら、 refline_xの値を1ずつ増やし、 refline_x<mの範囲内でループ2を繰り返す。そして、このループ2が終わったら、 refline_yの値を1ずつ増やし、 refline_y<nの範囲内でループ1を繰り返す。
この3種類のループ構造を実行することで、最小のレート歪みコストを実現するbest_mode、best_refline_x、best_refline_yが得られることになる。
これから、続いて、ステップS110で、参照元情報となるbest_refline_xおよびbest_refline_yを符号化するとともに、best_modeを符号化する。この符号化手法については算術符号化などの一般に用いられる方法を利用する。また、この符号化した情報についてはヘッダなどに挿入する。
続いて、ステップS111で、得られたbest_mode、best_refline_x、best_refline_yから予測信号を生成し、符号化対象ブロックを符号化する。
このようにして、本実施形態の画面内予測符号化装置1では、画面内予測を行うときに、従来技術であれば refline_x= refline_y=0に限定されていた状態から、より離れた位置にある画素の参照が可能となる。
これから、本実施形態の画面内予測符号化装置1によれば、従来の画面内予測では対応できなかったオクルージョンや雑音を含む画像や空間周波数の類似する信号が周期的に発生する画像などに対して、効率的な画面内予測を実行することが可能となることで圧縮効率を向上することができるようになる。
以上の説明では、4×4ブロックに対しての適用を具体例にして説明を行ったが、本発明は4×4ブロック以外のブロックに対してもそのまま適用できるものである。例えば、図8に示すように、8×8ブロックに対してもそのまま適用できる。また、輝度信号だけでなく、色差信号に対してもそのまま適用できるものである。
図9に、本実施形態の画面内予測符号化装置1の実行するフローチャートの他の一例を図示する。
このフローチャートを実行する場合には、本実施形態の画面内予測符号化装置1は、 refline_yの位置については固定にするという点が図5のフローチャートと異なっている。
すなわち、画面内予測符号化装置1は、図9のフローチャートに従って、画面内予測符号化処理を実行する場合には、まず最初に、ステップS201で、レート歪みコストJの最小値を格納する変数Jmin に対して、十分大きな値であるMAXcostを代入することで初期化し、続くステップS202で、 refline_yの値として固定の値を設定する。
続いて、ステップS203で、 refline_xの位置を指定するループ1を開始し、初期値として、 refline_x=0を代入する。続いて、ステップS204で、 refline_x、 refline_yから一意に定まる参照画素を取得する。
続いて、ステップS205で、符号化対象ブロックが取る予測モードを指定するループ2を開始し、初期値として、予測モード番号を格納する変数modeに対してi(iは取り得る予測モードで最も予測モード番号が小さい数値)を代入する。
続いて、ステップS206で、取得した参照画素とループ2で選択した予測モードとから予測信号を生成する。
続いて、ステップS207で、生成した予測信号からmode=iのレート歪みコストJi を求める。続いて、ステップS208で、「Ji <Jmin 」であるのか否かを判断することで、レート歪みコストJi がこれまでに得られたものの中で最小かどうかの判定を行う。
このステップS208の判定処理に従って、「Ji <Jmin 」という判定結果が得られた場合には、ステップS209に進んで、その際の予測モードiに従って変数best_modeの値を更新し、その際の refline_xに従って変数best_refline_xの値を更新し、さらに、その際のJi に従って変数Jmin の値を更新する。
一方、ステップS208の判定処理に従って、「Ji <Jmin 」という判定結果が得られなかった場合には、ステップS209の処理を省略する。
以上のコスト計算処理を、ループ2で、取り得る全ての予測モードについて繰り返す。そして、このループ2が終わったら、 refline_xの値を1ずつ増やし、 refline_x<mの範囲内でループ1を繰り返す。
この2種類のループ構造を実行することで、最小のレート歪みコストを実現するbest_mode、best_refline_xが得られることになる。
これから、続いて、ステップS210で、参照元情報となるbest_refline_xおよびrefline_yを符号化するとともに、best_modeを符号化する。
続いて、ステップS211で、得られたbest_mode、best_refline_xと、固定値に設定したrefline_yとから予測信号を生成し、符号化対象ブロックを符号化する。
このようにして、本実施形態の画面内予測符号化装置1は、図9のフローチャートに従って画面内予測符号化処理を実行する場合には、 refline_yの値を固定にして、 refline_xの参照ラインを動かすことにより、例えば、図10に示すような形で画面内予測を行うように処理するのである。
図9のフローチャートでは、 refline_yの値を固定にするようにしたが、 refline_xの値を固定にするようにしてもよい。この場合には、図11のフローチャートに従って画面内予測符号化処理を実行することになる。
図9や図11のフローチャートに従って画面内予測符号化処理を実行するようにすると、レート歪みコストJi を計算するループ数が減ることから、高速な処理が望まれる場合に有効なものとなる。
次に、本実施形態の画面内予測符号化装置1により生成された符号化データを復号する画面内予測符号化データ復号装置について説明する。
図12に、本実施形態の画面内予測符号化装置1により生成された符号化データを復号する本発明一実施形態例としての画面内予測符号化データ復号装置2の構成を図示する。
本実施形態の画面内予測符号化データ復号装置2は、画面内予測符号化装置1により生成された符号化データを復号する処理を行うために、入力した参照元情報および予測モード(best_mode)の符号化データを復号する復号部20と、復号した参照元情報および予測モードに基づいて予測信号を復元する予測信号復元部21と、入力した符号化データを復号することで残差信号を復号する残差信号復号部22と、予測信号復元部21の復元した予測信号と残差信号復号部22の復号した残差信号とに基づいて復号画像を生成する復号画像生成部23とを備える。
図13に、このように構成される本実施形態の画面内予測符号化データ復号装置2の実行するフローチャートの一例を図示する。
次に、このフローチャートに従って、画面内予測符号化データ復号装置2の実行する画面内予測符号化データの復号処理について詳細に説明する。
本実施形態の画面内予測符号化データ復号装置2は、図5のフローチャートに従って画面内予測符号化装置1により生成された符号化データを復号する場合には、図13のフローチャートに示すように、先ず最初に、ステップS401で、入力したbest_refline_xおよびbest_refline_yの符号化データを復号するとともに、入力したbest_modeの符号化データを復号する。
続いて、ステップS402で、復号したbest_refline_xおよびbest_refline_yの値に基づいて参照画素を取得する。
続いて、ステップS403で、取得した参照画素から、復号したbest_modeに従って予測信号を復元する。
続いて、ステップS404で、入力した符号化データから逆量子化、逆変換を行って残差信号を復号する。
続いて、ステップS405で、復元した予測信号と復号した残差信号とを足し合わせ、クリッピング処理を経て復号画像信号を生成する。
このようにして、本実施形態の画面内予測符号化データ復号装置2は、画面内予測符号化装置1により生成された符号化データを復号する処理を行うのである。
次に、本発明の有効性を検証するために行った実験結果について説明する。
図14において、例えば図10のように refline_x、 refline_yの片方を最近傍に固定して1つの画像を符号化した場合に、固定されなかった側のrefline_xもしくは refline_yがどれだけ選択されたのかについて、その選択確率分布を求めた実験結果を図示する。
ここで、画面サイズがCIFサイズ(352×288)の画像(ISO、ITU−Tなどの標準化で用いられる標準画像の1つであるBusの画像)を使い、量子化パラメータQP(量子化幅、すなわち量子化の粗さを示すパラメータ)を28とし、15枚のフレームについて実験を行った。
この実験では、1つの4×4ブロックにつき、選択される refline_xと refline_yの組み合わせを1つの事象とみなし、その個数を取得して、各組み合わせについて確率を算出している。括弧内の数値が確率を示す。1≦ refline_xで、かつ、1≦ refline_yの部分については処理を行わないため、非適用(N/A:Not Applicable) とした。
この実験結果から、約60%が従来の位置p0(すなわち、 refline_x=
refline_y=0)を参照しているが、残りの約40%はそれ以外の位置を参照していたことが明らかとなった。
すなわち、かなり大きな割合で、 refline_x= refline_y=0以外の参照画素を用いた方がよいということが検証できた。
図15および図16に、量子化パラメータQPの値を変化させた場合に、図14に示す選択確率がどのように推移するのかについて求めた実験結果を図示する。ただし、画像については、図14の実験で用いた画像とは別の画像(上記標準画像の1つであるMobileの画像)を用いた。
図15では、p( refline_x= refline_y=0)についての選択確率の推移を示し、図16では、p( refline_x=1,refline_y=0)と、p( refline_x=0,refline_y=1)と、p( refline_x=2,refline_y=0)と、p( refline_x=0,refline_y=2)と、p( refline_x=3,refline_y=0)と、p( refline_x=0,refline_y=3)についての選択確率の推移を示す。
この実験結果から、量子化パラメータQPの値が増加するとp0の参照確率が増加し、これに合わせて、p1〜p6の参照確率が減少することが明らかとなった。
これは、量子化パラメータQPの値が増加すると符号化結果の画像が粗くなりぼやけた感じとなるので、より離れた位置にある画素を参照画像として画面内予測を行っても、その効果が得られないことに、その理由があるものと考えられる。
この実験結果から、量子化パラメータQPの値が8から36の範囲にある場合には、概ね40から60%近くがp0以外を参照しているという事実が確認できた。これから、参照元情報の符号量を考慮しない場合には、確実にレート歪み特性が向上することを検証できた。
本発明では、参照元情報を符号化する必要がある。これから、その分の符号量の増加を見込んで、従来手法と本発明との符号化性能を比較する必要がある。
図17に、この点について行った実験結果を図示する。ここで、図中、横軸は発生符号量を示し、縦軸は画質を示す。また、図中に示すJMのカーブが従来手法の実験結果を示し、Proposedのカーブが参照元情報の符号量を加味しない場合の本発明を適用した実験結果を示し、Proposed+OHのカーブが参照元情報の符号量を加味した場合の本発明を適用した実験結果を示す。
この実験は、CIFサイズの3種類の画像(それぞれ上記標準画像であるBusの画像、Mobileの画像、Footballの画像)を使い、量子化パラメータQPの値を8から36まで4つ刻みで変化させ、各画像について15枚のフレームについて行い、各画像に対する結果を求めた。
なお、ここで求めた参照元情報の符号量については、図15および図16のように各符号化対象画像の選択確率分布から0次エントロピーをフレーム単位で測定して算出している。
図17の横軸は発生符号量を示し、縦軸は画質を示している。これから、左上角に向かうことほど好ましい状態を示している。
この実験結果からわかるように、参照元情報の符号化量を加味しない場合の本発明は常に従来手法よりも性能が良い。ただし、参照元情報の符号化量を加味した場合の本発明は、従来手法よりも劣化する場合と向上する場合がある。
符号化全体の情報量が増加する場合(すなわち、高ビットレート条件下)だと、本発明の効果が大きくなる。これは、参照元情報の符号量が占める割合が相対的に小さくなるためと考えられる。
以上の実験結果より、従来手法に比べて、本発明は高ビットレート条件下で、レート歪み特性の改善が得られることを検証できた。
なお、上記の標準画像は、http://media.xiph.org/video/derf/やhttp://trace.eas.asu.edu/yuv/index.htmlなどで入手可能である。
本発明によれば、従来の画面内予測では対応できなかったオクルージョンや雑音を含む画像や空間周波数の類似する信号が周期的に発生する映像などに対して、効率的な画面内予測を実行することが可能となり、圧縮効率を向上させることができるようになる。

Claims (17)

  1. 画面内予測を用いる映像符号化方法であって、
    符号化対象ブロックから所定の距離範囲内にある画素を参照画素の候補として設定するステップと、
    前記参照画素候補の中から符号化対象ブロックの画面内予測に用いる参照画素を符号化対象ブロックからの距離条件を変更しながら順次選択して、その選択した参照画素に基づいて予測信号を生成するステップと、
    前記生成した予測信号を用いて符号化対象ブロックを画面内予測符号化するときの符号化コストを算出するステップと、
    前記算出した各符号化コストに基づいて、符号化対象ブロックの画面内予測に用いる参照画素を最終的に決定するステップと、
    前記決定した参照画素の位置を示す情報を符号化するステップとを備え
    前記参照画素候補を設定するステップでは、量子化の大きさを示すパラメータの値に応じて前記参照画素候補の設定に用いる前記距離範囲を変化させることを、
    特徴とする映像符号化方法。
  2. 画面内予測を用いる映像符号化方法であって、
    符号化対象ブロックから所定の距離範囲内にある画素を参照画素の候補として設定するステップと、
    前記参照画素候補の中から符号化対象ブロックの画面内予測に用いる参照画素を符号化対象ブロックからの距離条件を変更しながら順次選択して、その選択した参照画素に基づいて予測信号を生成するステップと、
    前記生成した予測信号を用いて符号化対象ブロックを画面内予測符号化するときの符号化コストを算出するステップと、
    前記算出した各符号化コストに基づいて、符号化対象ブロックの画面内予測に用いる参照画素を最終的に決定するステップと、
    前記決定した参照画素の位置を示す情報を符号化するステップとを備え、
    前記予測信号を生成するステップでは、符号化対象ブロックの上側に位置する1つの参照ラインを構成する画素の集合と、符号化対象ブロックの左側に位置する1つの参照ラインを構成する画素の集合と、その2つの参照ラインの交点に位置する画素とを参照画素として選択して、その選択した参照画素に基づいて予測信号を生成することを、
    特徴とする映像符号化方法。
  3. 請求項2に記載の映像符号化方法において、
    前記予測信号を生成するステップでは、前記参照ラインのいずれか一方を符号化対象ブロックの最近傍のラインに固定するとともに、他方のライン位置を可変とすることで参照画素を選択して、その選択した参照画素に基づいて予測信号を生成することを、
    特徴とする映像符号化方法。
  4. 画面内予測を用いる映像符号化方法であって、
    符号化対象ブロックから所定の距離範囲内にある画素を参照画素の候補として設定するステップと、
    前記参照画素候補の中から符号化対象ブロックの画面内予測に用いる参照画素を符号化対象ブロックからの距離条件を変更しながら順次選択して、その選択した参照画素に基づいて予測信号を生成するステップと、
    前記生成した予測信号を用いて符号化対象ブロックを画面内予測符号化するときの符号化コストを算出するステップと、
    前記算出した各符号化コストに基づいて、符号化対象ブロックの画面内予測に用いる参照画素を最終的に決定するステップと、
    前記決定した参照画素の位置を示す情報を符号化するステップとを備え、
    前記予測信号を生成するステップでは、選択した参照画素に対し、複数の予測モードに対応した予測方法を順次適用して各々の場合の予測信号を生成し、
    前記符号化コストを算出するステップでは、前記生成した各予測信号を用いて各々の前記符号化コストを算出し、
    参照画素を決定させた符号化コストの算出に用いられた予測信号の予測モードを符号化するステップを更に備えることを、
    特徴とする映像符号化方法。
  5. 画面内予測を用いる映像復号方法であって、
    符号化対象ブロックからどの位離れた位置にある参照画素を用いて符号化が行われたのかを示す参照元情報の符号化データを復号することで、その参照元情報を獲得するステップと、
    前記獲得した参照元情報に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた参照画素を取得するステップと、
    前記取得した参照画素に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた予測信号を復元して、それを用いて復号画像信号を生成するステップとを備え
    前記参照画素は、前記符号化対象ブロックから量子化の大きさを示すパラメータの値に応じて設定された距離範囲内にある画素のうち、符号化コストに基づいて決定された画素であることを、
    特徴とする映像復号方法。
  6. 画面内予測を用いる映像符号化装置であって、
    符号化対象ブロックから所定の距離範囲内にある画素を参照画素の候補として設定する設定手段と、
    前記参照画素候補の中から符号化対象ブロックの画面内予測に用いる参照画素を符号化対象ブロックからの距離条件を変更しながら順次選択して、その選択した参照画素に基づいて予測信号を生成する手段と、
    前記生成した予測信号を用いて符号化対象ブロックを画面内予測符号化するときの符号化コストを算出する手段と、
    前記算出した各符号化コストに基づいて、符号化対象ブロックの画面内予測に用いる参照画素を最終的に決定する手段と、
    前記決定した参照画素の位置を示す情報を符号化する手段とを備え
    前記設定手段は、量子化の大きさを示すパラメータの値に応じて前記参照画素候補の設定に用いる前記距離範囲を変化させることを、
    特徴とする映像符号化装置。
  7. 画面内予測を用いる映像復号装置であって、
    符号化対象ブロックからどの位離れた位置にある参照画素を用いて符号化が行われたのかを示す参照元情報の符号化データを復号することで、その参照元情報を獲得する手段と、
    前記獲得した参照元情報に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた参照画素を取得する手段と、
    前記取得した参照画素に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた予測信号を復元して、それを用いて復号画像信号を生成する手段とを備え
    前記参照画素は、前記符号化対象ブロックから量子化の大きさを示すパラメータの値に応じて設定された距離範囲内にある画素のうち、符号化コストに基づいて決定された画素であることを、
    特徴とする映像復号装置。
  8. 画面内予測を用いる映像復号方法であって、
    符号化対象ブロックからどの位離れた位置にある参照画素を用いて符号化が行われたのかを示す参照元情報の符号化データを復号することで、その参照元情報を獲得するステップと、
    前記獲得した参照元情報に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた参照画素を取得するステップと、
    前記取得した参照画素に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた予測信号を復元して、それを用いて復号画像信号を生成するステップとを備え
    前記予測信号は、符号化対象ブロックの上側に位置する1つの参照ラインを構成する画素の集合と、符号化対象ブロックの左側に位置する1つの参照ラインを構成する画素の集合と、その2つの参照ラインの交点に位置する画素とを参照画素として選択して、その選択した参照画素に基づいて生成された信号であることを、
    特徴とする映像復号方法。
  9. 画面内予測を用いる映像符号化装置であって、
    符号化対象ブロックから所定の距離範囲内にある画素を参照画素の候補として設定する手段と、
    前記参照画素候補の中から符号化対象ブロックの画面内予測に用いる参照画素を符号化対象ブロックからの距離条件を変更しながら順次選択して、その選択した参照画素に基づいて予測信号を生成する手段と、
    前記生成した予測信号を用いて符号化対象ブロックを画面内予測符号化するときの符号化コストを算出する手段と、
    前記算出した各符号化コストに基づいて、符号化対象ブロックの画面内予測に用いる参照画素を最終的に決定する手段と、
    前記決定した参照画素の位置を示す情報を符号化する手段とを備え
    前記予測信号を生成する手段は、符号化対象ブロックの上側に位置する1つの参照ラインを構成する画素の集合と、符号化対象ブロックの左側に位置する1つの参照ラインを構成する画素の集合と、その2つの参照ラインの交点に位置する画素とを参照画素として選択して、その選択した参照画素に基づいて予測信号を生成することを、
    特徴とする映像符号化装置。
  10. 画面内予測を用いる映像復号装置であって、
    符号化対象ブロックからどの位離れた位置にある参照画素を用いて符号化が行われたのかを示す参照元情報の符号化データを復号することで、その参照元情報を獲得する手段と、
    前記獲得した参照元情報に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた参照画素を取得する手段と、
    前記取得した参照画素に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた予測信号を復元して、それを用いて復号画像信号を生成する手段とを備え
    前記予測信号は、符号化対象ブロックの上側に位置する1つの参照ラインを構成する画素の集合と、符号化対象ブロックの左側に位置する1つの参照ラインを構成する画素の集合と、その2つの参照ラインの交点に位置する画素とを参照画素として選択して、その選択した参照画素に基づいて生成された信号であることを、
    特徴とする映像復号装置。
  11. 画面内予測を用いる映像復号方法であって、
    符号化対象ブロックからどの位離れた位置にある参照画素を用いて符号化が行われたのかを示す参照元情報の符号化データを復号することで、その参照元情報を獲得するステップと、
    前記獲得した参照元情報に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた参照画素を取得するステップと、
    前記取得した参照画素に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた予測信号を復元して、それを用いて復号画像信号を生成するステップとを備え
    前記符号化において、
    選択した参照画素に対し、複数の予測モードに対応した予測方法を順次適用して各々の場合の予測信号を生成し、前記生成した各予測信号を用いて各々の前記符号化コストを算出し、参照画素を決定させた符号化コストの算出に用いられた予測信号の予測モードが符号化されていることを、
    特徴とする映像復号方法。
  12. 画面内予測を用いる映像符号化装置であって、
    符号化対象ブロックから所定の距離範囲内にある画素を参照画素の候補として設定する手段と、
    前記参照画素候補の中から符号化対象ブロックの画面内予測に用いる参照画素を符号化対象ブロックからの距離条件を変更しながら順次選択して、その選択した参照画素に基づいて予測信号を生成する手段と、
    前記生成した予測信号を用いて符号化対象ブロックを画面内予測符号化するときの符号化コストを算出する手段と、
    前記算出した各符号化コストに基づいて、符号化対象ブロックの画面内予測に用いる参照画素を最終的に決定する手段と、
    前記決定した参照画素の位置を示す情報を符号化する手段とを備え
    前記予測信号を生成する手段は、選択した参照画素に対し、複数の予測モードに対応した予測方法を順次適用して各々の場合の予測信号を生成し、
    前記符号化コストを算出する手段は、前記生成した各予測信号を用いて各々の前記符号化コストを算出し、
    参照画素を決定させた符号化コストの算出に用いられた予測信号の予測モードを符号化する手段を更に備えることを、
    特徴とする映像符号化装置。
  13. 画面内予測を用いる映像復号装置であって、
    符号化対象ブロックからどの位離れた位置にある参照画素を用いて符号化が行われたのかを示す参照元情報の符号化データを復号することで、その参照元情報を獲得する手段と、
    前記獲得した参照元情報に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた参照画素を取得する手段と、
    前記取得した参照画素に基づいて、符号化対象ブロックの画面内予測の符号化に用いられた予測信号を復元して、それを用いて復号画像信号を生成する手段とを備え
    前記符号化において、
    選択した参照画素に対し、複数の予測モードに対応した予測方法を順次適用して各々の場合の予測信号を生成し、前記生成した各予測信号を用いて各々の前記符号化コストを算出し、参照画素を決定させた符号化コストの算出に用いられた予測信号の予測モードが符号化されていることを、
    特徴とする映像復号装置。
  14. 請求項1〜4のいずれか1項に記載の映像符号化方法の実現に用いられる処理をコンピュータに実行させるための映像符号化プログラム。
  15. 請求項1〜4のいずれか1項に記載の映像符号化方法の実現に用いられる処理をコンピュータに実行させるための映像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
  16. 請求項5、8、11のいずれか1項に記載の映像復号方法の実現に用いられる処理をコンピュータに実行させるための映像復号プログラム。
  17. 請求項5、8、11のいずれか1項に記載の映像復号方法の実現に用いられる処理をコンピュータに実行させるための映像復号プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2009500211A 2007-02-23 2008-02-20 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体 Active JP5063677B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009500211A JP5063677B2 (ja) 2007-02-23 2008-02-20 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007043190 2007-02-23
JP2007043190 2007-02-23
JP2009500211A JP5063677B2 (ja) 2007-02-23 2008-02-20 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
PCT/JP2008/052859 WO2008102805A1 (ja) 2007-02-23 2008-02-20 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPWO2008102805A1 JPWO2008102805A1 (ja) 2010-05-27
JP5063677B2 true JP5063677B2 (ja) 2012-10-31

Family

ID=39710079

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009500211A Active JP5063677B2 (ja) 2007-02-23 2008-02-20 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体

Country Status (11)

Country Link
US (1) US8472522B2 (ja)
EP (1) EP2129135B1 (ja)
JP (1) JP5063677B2 (ja)
KR (1) KR101103699B1 (ja)
CN (1) CN101682774B (ja)
BR (1) BRPI0807912B1 (ja)
CA (1) CA2676709C (ja)
ES (1) ES2393226T3 (ja)
RU (1) RU2472305C2 (ja)
TW (1) TWI381739B (ja)
WO (1) WO2008102805A1 (ja)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103281542B (zh) 2007-06-29 2017-07-14 夏普株式会社 图像编码装置、图像编码方法、图像译码装置、图像译码方法
KR20090097689A (ko) * 2008-03-12 2009-09-16 삼성전자주식회사 영상의 인트라 예측 부호화/복호화 방법 및 장치
KR101379187B1 (ko) * 2008-06-23 2014-04-15 에스케이 텔레콤주식회사 블록 변환을 이용한 인트라 예측 방법 및 장치와 그를이용한 영상 부호화/복호화 방법 및 장치
JP5238523B2 (ja) * 2009-01-13 2013-07-17 株式会社日立国際電気 動画像符号化装置、動画像復号化装置、および、動画像復号化方法
JP5169978B2 (ja) * 2009-04-24 2013-03-27 ソニー株式会社 画像処理装置および方法
US20120219232A1 (en) * 2009-10-20 2012-08-30 Tomoyuki Yamamoto Image encoding apparatus, image decoding apparatus, and data structure of encoded data
JP5368631B2 (ja) 2010-04-08 2013-12-18 株式会社東芝 画像符号化方法、装置、及びプログラム
KR101798079B1 (ko) * 2010-05-10 2017-11-16 삼성전자주식회사 픽셀값의 차분을 이용하여 영상 프레임을 부호화하는 방법 및 이를 위한 장치
WO2012005520A2 (en) 2010-07-09 2012-01-12 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using block merging, and method and apparatus for decoding video by using block merging
KR101484281B1 (ko) * 2010-07-09 2015-01-21 삼성전자주식회사 블록 병합을 이용한 비디오 부호화 방법 및 그 장치, 블록 병합을 이용한 비디오 복호화 방법 및 그 장치
TWI463876B (zh) * 2011-05-17 2014-12-01 Alpha Imaging Technology Corp 影像壓縮方法
US9407917B2 (en) * 2011-06-30 2016-08-02 Samsung Electronics Co., Ltd. Video encoding method with bit depth adjustment for fixed-point conversion and apparatus therefor, and video decoding method and apparatus therefor
TWI574554B (zh) 2012-06-29 2017-03-11 Sony Corp 資訊處理設備及資訊處理方法
TW201406166A (zh) 2012-07-27 2014-02-01 Novatek Microelectronics Corp 視訊編碼方法與視訊編碼裝置
US9813709B2 (en) 2012-09-28 2017-11-07 Nippon Telegraph And Telephone Corporation Intra-prediction encoding method, intra-prediction decoding method, intra-prediction encoding apparatus, intra-prediction decoding apparatus, program therefor and recording medium having program recorded thereon
CN105659602B (zh) 2013-10-14 2019-10-08 微软技术许可有限责任公司 用于视频和图像编码的帧内块复制预测模式的编码器侧选项
KR102170169B1 (ko) 2013-10-14 2020-10-26 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 이미지 코딩 및 디코딩을 위한 인트라 블록 카피 예측 모드의 피쳐
US10469863B2 (en) 2014-01-03 2019-11-05 Microsoft Technology Licensing, Llc Block vector prediction in video and image coding/decoding
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
KR102413529B1 (ko) 2014-06-19 2022-06-24 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 통합된 인트라 블록 카피 및 인터 예측 모드
EP3180916A4 (en) * 2014-09-03 2018-02-28 MediaTek Inc. Method for color index coding using a generalized copy previous mode
CN105874795B (zh) 2014-09-30 2019-11-29 微软技术许可有限责任公司 在波前并行处理被启用时对图片内预测模式的规则
CN105898303A (zh) * 2015-12-24 2016-08-24 乐视云计算有限公司 码率控制方法及装置
KR101910873B1 (ko) * 2015-12-28 2018-10-23 연세대학교 산학협력단 예측 모드 맵을 이용한 비디오 코딩의 부호화 방법 및 복호화 방법
US10390021B2 (en) 2016-03-18 2019-08-20 Mediatek Inc. Method and apparatus of video coding
WO2017176030A1 (ko) * 2016-04-06 2017-10-12 주식회사 케이티 비디오 신호 처리 방법 및 장치
CN109076241B (zh) * 2016-05-04 2023-06-23 微软技术许可有限责任公司 利用样本值的非相邻参考线进行帧内图片预测
KR102410032B1 (ko) 2016-06-24 2022-06-16 주식회사 케이티 비디오 신호 처리 방법 및 장치
US11234015B2 (en) * 2016-06-24 2022-01-25 Kt Corporation Method and apparatus for processing video signal
CN116634139A (zh) 2016-08-03 2023-08-22 株式会社Kt 用于对视频进行编码和解码的方法和装置
JP6669622B2 (ja) * 2016-09-21 2020-03-18 Kddi株式会社 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
WO2018070267A1 (ja) * 2016-10-14 2018-04-19 ソニー株式会社 画像処理装置および画像処理方法
JP6917718B2 (ja) * 2017-01-27 2021-08-11 日本放送協会 予測装置、符号化装置、復号装置、及びプログラム
US10742975B2 (en) 2017-05-09 2020-08-11 Futurewei Technologies, Inc. Intra-prediction with multiple reference lines
CN117354497A (zh) 2017-07-06 2024-01-05 Lx 半导体科技有限公司 图像解码设备、图像编码设备、用于发送图像数据的设备
WO2019039806A1 (ko) * 2017-08-21 2019-02-28 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN109587491B (zh) 2017-09-28 2022-09-23 腾讯科技(深圳)有限公司 一种帧内预测方法、装置及存储介质
CN116405673A (zh) 2017-12-22 2023-07-07 数码士有限公司 视频信号处理方法和设备
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
US10432929B2 (en) 2018-02-12 2019-10-01 Tencent America LLC Method and apparatus for multiple line intra prediction in video compression
IL279503B1 (en) 2018-06-25 2024-05-01 Guangdong Oppo Mobile Telecommunications Corp Ltd Interior-frame and device prediction method
US10893285B2 (en) * 2018-06-29 2021-01-12 FG Innovation Company Limited Device and method for coding video data based on one or more reference lines
US10567752B2 (en) 2018-07-02 2020-02-18 Tencent America LLC Method and apparatus for intra prediction for non-square blocks in video compression
WO2020145735A1 (ko) * 2019-01-10 2020-07-16 엘지전자 주식회사 Mpm 리스트를 사용하는 인트라 예측 기반 영상 코딩 방법 및 장치
CN110267041B (zh) * 2019-06-28 2021-11-09 Oppo广东移动通信有限公司 图像编码方法、装置、电子设备和计算机可读存储介质
JP6865870B2 (ja) * 2020-02-26 2021-04-28 Kddi株式会社 動画像復号装置、動画像復号方法、動画像符号化装置、動画像符号化方法及びコンピュータ可読記録媒体
CN111818333B (zh) * 2020-06-16 2022-04-29 中国科学院深圳先进技术研究院 一种帧内预测方法、装置、终端及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030202588A1 (en) * 2002-04-29 2003-10-30 Divio, Inc. Intra-prediction using intra-macroblock motion compensation
WO2005107267A1 (ja) * 2004-04-28 2005-11-10 Hitachi, Ltd. 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1835762A3 (en) 1996-05-28 2007-10-03 Matsushita Electric Industrial Co., Ltd. decoding apparatus with intra prediction
FI116819B (fi) * 2000-01-21 2006-02-28 Nokia Corp Menetelmä kuvien lähettämiseksi ja kuvakooderi
KR100508798B1 (ko) * 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법
KR100750110B1 (ko) * 2003-04-22 2007-08-17 삼성전자주식회사 4×4인트라 휘도 예측 모드 결정방법 및 장치
JP4222618B2 (ja) 2003-06-04 2009-02-12 株式会社オリンピア 電子回路基板及び遊技機
CN1209928C (zh) * 2003-07-04 2005-07-06 清华大学 一种基于预测块组的采用帧内预测的帧内编码帧编码方法
CN1213614C (zh) * 2003-09-12 2005-08-03 浙江大学 视频编解码中帧内预测的方法和装置
JP4213646B2 (ja) 2003-12-26 2009-01-21 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。
JP4542447B2 (ja) * 2005-02-18 2010-09-15 株式会社日立製作所 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
JP2007043651A (ja) 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
JP5044415B2 (ja) 2005-11-30 2012-10-10 株式会社東芝 画像符号化/画像復号化方法及び画像符号化/画像復号化装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030202588A1 (en) * 2002-04-29 2003-10-30 Divio, Inc. Intra-prediction using intra-macroblock motion compensation
WO2005107267A1 (ja) * 2004-04-28 2005-11-10 Hitachi, Ltd. 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法

Also Published As

Publication number Publication date
KR20090110336A (ko) 2009-10-21
ES2393226T3 (es) 2012-12-19
US8472522B2 (en) 2013-06-25
KR101103699B1 (ko) 2012-01-11
WO2008102805A1 (ja) 2008-08-28
EP2129135B1 (en) 2012-08-15
US20100027655A1 (en) 2010-02-04
RU2009130805A (ru) 2011-02-20
CA2676709C (en) 2013-06-25
RU2472305C2 (ru) 2013-01-10
BRPI0807912B1 (pt) 2020-10-06
JPWO2008102805A1 (ja) 2010-05-27
EP2129135A1 (en) 2009-12-02
CN101682774A (zh) 2010-03-24
BRPI0807912A2 (pt) 2014-06-24
EP2129135A4 (en) 2010-08-25
TWI381739B (zh) 2013-01-01
CN101682774B (zh) 2013-07-24
CA2676709A1 (en) 2008-08-28
TW200841746A (en) 2008-10-16

Similar Documents

Publication Publication Date Title
JP5063677B2 (ja) 映像符号化方法及び復号方法、それらの装置、それらのプログラム並びにプログラムを記録した記録媒体
KR102292589B1 (ko) 영상 복호화 방법 및 장치
JP5846676B2 (ja) イントラ予測モード復号化方法及び装置
JP4987085B2 (ja) 画像符号化装置及び復号装置、画像符号化方法及び復号方法、それらのプログラム並びにプログラムを記録した記録媒体
JP2022087158A (ja) イントラ予測方法とそれを利用した符号化器及び復号化器
JP5360430B2 (ja) デブロッキングフィルタ処理装置、デブロッキングフィルタ処理方法
JP2005192232A (ja) 画像符号化システム、画像復号システム、及び画像を分割したブロックの画素値の予測方法
JP2010130558A (ja) 動画像符号化装置および動画像符号化方法
JP2007013298A (ja) 画像符号化装置
CN112075080A (zh) 帧内预测装置、图像编码装置、图像解码装置以及程序
JP2006295408A (ja) 画像符号化装置及び画像符号化プログラム
JP4958825B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム
CN112740691A (zh) 用于编码和解码表示至少一个图像的数据流的方法和设备
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
KR20140031974A (ko) 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치, 화상 부호화 프로그램 및 화상 복호 프로그램
WO2012111208A1 (ja) 動画像符号化装置
JP6917718B2 (ja) 予測装置、符号化装置、復号装置、及びプログラム
JP6874844B2 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラム
JP4406887B2 (ja) 動画像符号化装置及び動画像符号化方法
WO2020000487A1 (zh) 变换方法、反变换方法及装置
KR20140129419A (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치
JP2012054791A (ja) 符号化装置、復号装置及びプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120508

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120731

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120807

R151 Written notification of patent or utility model registration

Ref document number: 5063677

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350