JP2012175155A - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP2012175155A
JP2012175155A JP2011032057A JP2011032057A JP2012175155A JP 2012175155 A JP2012175155 A JP 2012175155A JP 2011032057 A JP2011032057 A JP 2011032057A JP 2011032057 A JP2011032057 A JP 2011032057A JP 2012175155 A JP2012175155 A JP 2012175155A
Authority
JP
Japan
Prior art keywords
prediction
image
pixel
error
intra
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011032057A
Other languages
English (en)
Other versions
JP5713719B2 (ja
Inventor
Tadakazu Kakudo
忠和 角戸
Masashi Takahashi
昌史 高橋
Nobuhiro Chihara
信博 知原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2011032057A priority Critical patent/JP5713719B2/ja
Priority to PCT/JP2011/076878 priority patent/WO2012111208A1/ja
Priority to US13/983,021 priority patent/US9438907B2/en
Publication of JP2012175155A publication Critical patent/JP2012175155A/ja
Application granted granted Critical
Publication of JP5713719B2 publication Critical patent/JP5713719B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】画面内予測における予測誤差の蓄積を抑える。
【解決手段】動画像符号化方式を用いて、画素ブロック毎に符号化処理を行う動画像符号化装置において、周辺画素の相関を利用して予測画像を生成する画面内予測処理を持ち、さらに画面内予測処理において、入力画像から疑似的に予測画像を生成する処理がある装置において、予測モードの決定の際に画面内予測処理の参照画素となる画素に対して重み付けを行い、予測モード決定する。重みを1以上に設定することで、次のブロックで参照画素となりうる画素の誤差が強調されるため、誤差が次ブロックに伝搬しやすい予測モードが選ばれにくくなる。
【選択図】図11

Description

本発明は、動画像符号化装置に関し、特に符号化側で画面内予測と画面間予測との選択を行う動画像符号化装置に関する。
高効率な動画像圧縮技術の最新規格としてH.264/AVC(以下、H.264)が知られる。H.264は,ITU-Tのビデオ符号化専門家グループ(VCEG)とISO/IECの動画像符号化専門家グループ(MPEG)が2001年12月に共同で設立したJVTによって開発された動画像符号化の国際標準規格である。ITU-Tでは勧告として、2003年5月に承認されている。ISO
/IEC JTCでは2003年にMPEG-4 Part 10
Advanced Video Coding (AVC) として標準化されている。また、色空間や画素階調に関する拡張作業も行われ、Fidelity Range Extension(FRExt)として2004年7月に最終標準案が作成されている。
H.264の主な特徴は以下の通りである。
・従来方式のMPEG-2やMPEG-4に比べて約2倍の符号化効率で同程度の画質を実現
・圧縮アルゴリズム:ピクチャ間予測、量子化、エントロピー符号を採用
・携帯電話等の低ビットレートからハイビジョンTV等の高ビットレートまで幅広く利用可能
このように、動画像符号化技術は様々な議論がなされており、現在次期規格としてH.265の標準化作業も進められている。
ここでH.264の技術的内容について説明する。
図1は、H.264を使用して符号化を行うエンコーダ1の一般的な構成図である。H.264では1つの画面内で予測画像を生成する画面内予測104と、複数の画面から予測画像を生成する画面間予測105が規定されている。所定の基準により画面内予測と画面間予測のどちらかを選択し、選択した予測画像と入力画像101との差分をとり、この差分データに対して、以降の直交変換102、量子化処理103を行い、量子化後のデータに対して符号化処理110を行う。
なお、画面間予測処理105において参照画像として用いられる再構成画像106は、量子化103の後のデータに対して、直交変換および量子化と逆の処理である逆量子化(109)および逆直交変換108の処理後、予測画像と加算したデータに、ブロックノイズを軽減させるデブロッキングのフィルタ処理107を行うことで生成する。デブロッキングフィルタについては、使用しない場合もある。H.264では差分画像のみを符号化し、伝送することにとって高い符号化効率を実現している。
エンコーダ1が行う予測処理として、画面間予測処理と画面内予測処理を以下に説明する。
図2は、画面間予測を説明する図である。複数の画面から予測画像を生成する画面間予測は、図2に示すように、予測対象の入力画像の予測対象ブロック201に対して、前後(t=-1、t=1時間)のピクチャの参照ブロック(200/202)から予測対象ブロックの動きベクトルを計算し、予測画像を生成する処理である。
図3は、画面内予測を説明する図である。画面内予測は、近接画素間の相関を利用して予測画像の生成する手法である。H.264の画面内予測処理では画面をm×n画素のスライス300と呼ばれる処理ブロックに分割し、さらにスライス内は16×16画素のマクロブロック301に分割する。画面内予測処理では、このマクロブロック301を基本処理単位とし、さらにそのマクロブロック301を4×4、8×8、16×16画素ブロック毎に予測画像を生成する。
図4に、4×4、8×8、16×16それぞれの場合における、画素ブロックの処理順序を示す。つまり、各画素ブロック内に示した数の昇順で処理される。
画面内予測処理では、予測対象ブロックの左、左上、上または右上にある画素を参照して予測画像を生成する。なぜならば、復号側においても同様に予測画像を生成するためには符号化済みの(復号側にとっては復号及び画像再構成済みの)画素を参照画素とする必要があるからである。例として4x4画素単位の画面内予測の予測画像生成に利用する参照画素を図5に示す。
図5中の予測対象ブロックに含まれるa〜pの16個の予測対象画素401に対して、A〜Mが予測に用いる参照画素400となる。H.264/AVCでは4×4画素のブロック単位(以下:4×4ブロック)、8×8画素のブロック単位(以下:8×8ブロック)、16×16画素のブロック単位(以下:16×16ブロック)で予測画像の生成を行うことが可能である。この時、参照画素から予測対象ブロックを生成する処理を規定した処理手法をモードと呼び、使用可能なモードとして、4x4ブロックと8x8ブロックで各9モード、16x16ブロックで4モードの計22モードが使用可能となっている。
図6に、一例として、4x4ブロックにて使用可能な9モードを示す。
このように、最新の動画像符号化規格であるH.264では、高効率の圧縮技術を実現するために様々な手法が用いられている。
図7はエンコーダ1が行う符号化処理のフローチャートである。ここでは予測処理として、画面内予測処理を用いる場合について述べる。符号化処理では、入力画像が入力されると、全ての予測モードについて再構成画像から予測対象ブロックの予測画像を生成し、入力画像との差分を計算し、差分絶対値和(以降、SAD:Sum of absolute differences)が最も小さくなるモードを、画面内予測としては最適な予測モードとして決定する(601)。SADは、例えば下記の式で定義される。なおΣiは、予測対象ブロック内の全ての画素を対象とする意味である。
Figure 2012175155
SADは評価尺度として一般的であるが、上式以外の評価値を用いてもよい。予測モードの決定手法については、規格に明記されておらず、設計に依存する箇所となっている。
次に、再構成画像608から決定した予測モードにて予測画像を生成し(605)、入力画像との差分画像を得る。その後、直交変換603、量子化604、逆量子化605、逆直交変換606を経て、再構成画像608を得る。その後、可変長符号化(CAVLC)/算術符号化(CABAC)などの手法によって、エントロピー符号化607を行い、ストリームが生成される。この時、再構成画像608を得るまでには、様々な処理が必要であり、処理時間が必要となる。
符号化処理を単純に高速化するためは、予測モードの決定601から符号化処理607までの処理をMB単位、2並列以上のパイプライン構成として並列処理する手法が一般的である。しかし、並列化処理を実施する場合、画面内予測処理の予測モードの決定601において、前述の通り再構成画像から予測画像を生成し、最も予測誤差(評価値)の小さくなるモードを決定しようとすると、再構成画像を得るまでに処理時間が必要となるため、高速化出来ない。
再構成画像(参照画像)を得るまでの時間を短縮する手段として、予測モードの決定601を行う際に、再構成画像を用いて予測画像を生成するのではなく、入力画像を用いて、疑似的に予測画像を生成し、予測モードを決定する手法が提案されている。(例えば、特許文献1参照。)
通常、入力画像から生成する予測画像と、再構成画像から生成する予測画像は、量子化誤差の影響により少なからず差異が生じるため、予測モードの決定が必ずしも最適に行われるとは限らない。そのため、特に低ビットレートではモード決定の失敗による予測誤差が蓄積し、画質が著しく低下する。
特許文献1の画像符号化装置では、原画像を使って擬似的にイントラ予測を行った後で予測誤差に対してアダマール変換、量子化及びそれらの逆演算を施し、量子化による劣化具合を調べて誤差伝播を軽減するモード選択方式を用いている。
特開2009−290498号公報 特開2006−270437号公報 特開2008−048065号公報 特開2009−081830号公報
特許文献1の画像符号化装置では、予測誤差に対するアダマール変換等の処理量が高いという問題がある。
本発明は、誤差伝播を軽減するモード選択を低処理量且つパイプライン化可能な処理で行うことで、高速処理が求められる用途においても、画質の著しい低下を防止できる動画像符号化装置を提供することを目的とする。
本発明に係る動画像符号化装置は、複数の画面内予測モードから1つを選んで画素ブロックを符号化する動画像符号化装置において、前記複数の画面内予測モードによる予測画像を、入力画像から疑似的に生成する擬似予測画像生成部と、擬似予測画像生成部が生成した複数の前記予測画像の予測誤差を、他の画素ブロックの画面内予測で参照画素となりうる画素の重み付けして計算し、該計算された複数の予測誤差に基づいて予測モードを決定する予測モード決定部と、を備えた。
上記の動画像符号化装置では、前記擬似予測画像生成部は、入力画像から量子化誤差を受けずに取得された画素を参照画素として、前記予測画像を生成するものであり、前記予測モード決定部は、前記参照画素となりうる画素に対し、前記参照画素となりうる画素以外の画素よりも大きな重みを与えて前記予測誤差を計算し、該計算された複数の予測誤差の内、最小の予測誤差に対応する予測モードを、画面内予測の中で最適な予測モードであると決定することを特徴とする。
上記の動画像符号化装置では、前記画素ブロックは入力画像を所定の順序で分割したものであり、前記量子化誤差を受けずに取得された画素は、入力画像から直接得られる画素或いは擬似予測画像生成部が生成した前記予測画像から直接得られる画素であり、前記参照画素となりうる画素は、前記順序において後ろの画素ブロックにおける画面内予測で参照されうる画素であって符号化する画素ブロックにおける最下辺または最右辺の画素であり、前記予測モード決定部は、符号化する画素ブロックのサイズまたは量子化パラメータに応じて、前記重みを変化させることを特徴とする。
本発明に係る動画像符号化方法は、複数の画面内予測モードから1つを選んで画素ブロックを符号化する動画像符号化方法であって、前記複数の画面内予測モードによる予測画像を、入力画像から疑似的に生成するステップと、擬似予測画像生成部が生成した複数の前記予測画像の予測誤差を、他の画素ブロックの画面内予測で参照画素となりうる画素の重み付けして計算し、該計算された複数の予測誤差に基づいて予測モードを決定するステップと、前記決定された予測モードにより、再構成画像から予測画像を生成するステップと、前記入力画像から、前記再構成画像から生成された予測画像を減算して差分画像を得るステップと、前記差分画像を直交変換して係数を得、該係数を量子化するステップと、前記量子化された係数を逆量子化し、逆直交変換し、前記再構成画像から生成された予測画像と加算して得られる画像に基づき、前記再構成画像を更新するステップと、を有する動画像符号化方法。
本発明によれば、画面内予測の誤差伝播を軽減することができる。
H.264を使用して符号化を行うエンコーダ1の一般的な構成図(従来) 画面間予測を説明する図(従来) 画面内予測を説明する図(従来) 画面内予測における画素ブロックの処理順序(従来) 4x4画素ブロックの画面内予測における、参照画素と予測対象画素の関係を示す図(従来) 4x4ブロックの画面内予測に使用可能な予測モード(9種類)を示す図(従来) エンコーダ1が行う符号化処理のフローチャート(従来) 画面内予測での予測誤差の伝播を説明する図 重み付けを行う画素(重み付け対象画素)の配置の一例を示す図 SADとSSAD(Step SAD)の概念図 実施例1に係るエンコーダのブロック図 再構成画像からの予測誤差(本予測誤差)で正規化した擬似予測誤差の分布を概念的に示す図
まず、本発明が対象とする予測誤差の伝播について説明する。
図8は、画面内予測での予測誤差の伝播を説明する図である。予測対象ブロック801または802では、それに隣接する参照画素800から予測画像を生成する。もし、参照画素800の誤差(予測誤差)が大きいと、それらから予測される予測対象ブロック801、802の予測誤差も大きくなる。つまり、参照画素の予測誤差が隣のブロックに伝搬する。さらにその値を次に隣接するブロックが参照すると、予測誤差の分布はさらに拡大する。
H.264の画面内予測には元々、最善の予測モード選択をし続けたとしても、符号化の進行に従って予測誤差が次第に大きくなる性質がある。更に擬似予測画像を使用した場合、誤った予測モード選択が予測誤差増加を加速させるので、結果的に画質の低下を招いていた。
本発明の実施形態では、予測誤差を評価する際に、次のブロックで参照画素となりうる画素に対し大きな重みを与えることで、予測誤差の伝搬を抑制し、予測モードの決定における評価の精度を向上させた。つまり、一度増大した予測誤差を小さくする(誤りのある参照画素から正しい予測をする)ことは困難なので、単に現在のブロックで予測誤差が最小なモードを選ぶのではなく、後続ブロックの予測誤差も考慮するようにして、予測誤差の増大する速度を抑えることを主眼としている。
図9は、重み付けを行う画素の一例を示す図であり、塗りつぶされた部分(ブロック中で、最下辺と最右辺の画素)が、重み付け対象画素である。4×4ブロックの場合、112個の重み付け対象画素903、8×8ブロックの場合で60個の重み付け対象画素904、16×16画素の場合で31個の重み付け対象画素905を定める。そして、前述の予測モード決定の評価値であるSADの計算時には、重み付け対象画素の誤差に一定の重み付けを行う。
SADに対して本例の重み付けを適用した場合の計算式を、SAD’として以下に示す。ここでδは重み係数(通常は1以上)であり、予測モード毎に任意に設定可能な値とする。
Figure 2012175155
なお、SADに代えて、量子化誤差の性質を考慮した段階状差分絶対値和(以降、SSAD : Step SAD)などを用いる場合があり、本例においても利用できる。
図10は、SADとSSADの概念図である。縦軸は、SAD,SSADそれぞれの値であり、SADは予測誤差が大きくなればSADも比例して大きくなる。一方SSADは予測誤差に応じて段階的に評価値が変化する評価値である。
図11は、本発明の実施例1に係るエンコーダのブロック図である。図11のエンコーダは、図1と同様にH.264に則り符号化を行うものであるが、画面内予測処理部1040の構成が異なる。
本例の画面内予測処理部1040は、擬似予測画像生成部1041と、予測モード決定部1042と、を備える。
擬似予測画像生成部1041は、H.264にて規定されているすべての画面内予測モードに対して、擬似的な予測画像を生成する。つまり、再構成画像ではなく入力画像101に基づいて予測する。ただし、各モードでの予測処理の計算方法は、H.264の規格に準拠した方法を用いるものとする。入力画像101に基づく予測とは、参照画素を常に入力画像101から取得する方法(再構成画像を単に入力画像で代替する方法)や、最初だけ入力画像101から取得し、それ以降は予測モード決定部1042で選択された予測モードによる擬似予測画像を保持しておき、そこから取得する方法等がある。
予測モード決定部1042は、本例の特徴部分であり、参照画素に重み付けして得られる評価値SAD’によって予測モードを決定する。つまり最小のSAD’を示す予測モードを選択する。SAD’の算出は数式2に示した通りであるが、重みδを固定値として設定するだけでなく、量子化パラメータや予測ブロックのサイズに応じて変更するとさらに効果的である。一般的に、量子化パラメータが大きいほど、或いは予測ブロックサイズが小さいほど重みδの値を大きく設定すると高い効果が得られる。例えば、予測モード決定部1042が、選択した予測モードについての本予測誤差を計算或いは逆直交変換部108から取得して、類似予測画像生成部1041から得ていたその予測モードの擬似予測誤差との比を計算し、その平均値を予測モード毎に保持しておき、重みδを適応更新してもよい。
予測画像生成部1043は、再構成画像106を用いて、決定した予測モードの予測画像を生成する。
以降の処理は一般的なエンコーダ処理と同様である。すなわち、入力画像と予測画像の差分を計算し、直交変換部102で直交変換して係数を得、量子化部103で該係数を量子化する。量子化された係数は符号化されるとともに、逆量子化部109で逆量子化され、逆直交変換部108で逆直交変換され、入力画像と差分を取るときに用いた予測画像と加算され、そうして得られた画像(画素ブロック)を適宜デブロックフィルタを施してつなぎ合わせることで、入力画像に近い画像(復号画像)を再構成する(再構成画像を更新する)。
このため、本例のエンコーダが生成したストリームは、一般的なH.264デコーダにて復号することができる。また、予測モード決定時には再構成画像を必要としないので、再構成画像が得られるのを待たずにモード決定を進めることができ、処理の並列化やパイプライン化が可能である。
ここで、擬似予測画像を用いた時の予測誤差の蓄積について再考する。これ以降、再構成画像からの予測による予測誤差を本予測誤差と呼び、入力画像に基づく擬似予測による予測誤差を擬似予測誤差と呼ぶ。
図12は、本予測誤差で正規化した擬似予測誤差の分布を概念的に示す図である。横軸は予測誤差(SAD値)、縦軸は発生確率であり、任意の画素ブロックにおける本予測誤差を50に正規化したときの、同画素ブロックの擬似予測誤差の分布が、同画素ブロックの何ブロック前から画面内予測(擬似予測)が続いてきたか(1回〜3回)に場合分けして示されている。本予測では量子化等で情報が失われた再構成画像から予測するのに対し、擬似予測では入力画像から予測し局所的相関性を高精度で利用できるので、相対的に予測誤差が小さく、予測誤差の蓄積も遅い。そのため、予測誤差の期待値は連続回数が多くなるほど小さくなるが、分布の幅は広がっていく。
そこで、擬似予測誤差に、予測モードに応じた適当な係数を乗じて、擬似予測誤差を本予測誤差に近づければ、本予測と異なるモードを選択する確率を減らせることが期待できる。異選択確率が小さくなれば、2回目以降の分布の幅も狭まる。一般に、画面内予測の誤差は参照画素から遠くなる、予測対象ブロック内で右下の方の画素ほど大きくなる傾向があり、参照画素が入力画像から劣化している本予測において更にその傾向が強いのであれば、擬似予測誤差を求めるブロック内で右下方ほど大きくなる重みを与えて、本予測誤差の特性に近づけることも考えられる。
常に本予測誤差に基づいて予測モード決定して得られる系列(以後、最善予測モード選択系列と呼ぶ)は、少なくともその予測対象ブロックにおいて予測誤差が最小になるものを都度選択しているので、最善に近い選択になっていると考えられる。擬似予測によるモード選択が、最善予測モード選択系列からできるだけ外れないようにするという方針は、1つの解決手段になりうる。
以上を踏まえて、本例のエンコーダの作用を説明する。重みδを1以上に設定することで、次のブロックで参照画素となりうる画素(次ブロック参照画素)の誤差が強調される。誤差強調によりSAD’が大きくなった予測モードは、再構成画像から予測しても次ブロック参照画素の予測誤差が大きくなると考えられる。SAD’が最小なモードを選ぶことで、そのブロックにおいて、誤差が次ブロックに伝搬しやすい予測モードが選ばれにくくなる。
次のブロックの画面内予測では、その前のブロックにおいて、誤差伝搬しにくいモードで選ばれているために、従来のモード選択に比べ予測誤差が小さくなることが期待できる。特に、画面間予測を用いずに画面内予測のみで符号化するスライスにおいて効果が大きい。
このように、本例の重みδには、擬似予測誤差を本予測誤差に近づける作用と、誤差が次ブロックに伝搬しやすい予測モードを選ばれにくくして、予測誤差の蓄積を小さくする作用の、2つの作用が考えられるが、本例の画質改善に寄与しているのは後者と考えられる。そのため場合によっては、重みδを用いない本予測よりも更に最善のモード選択系列が得られる可能性がある。この作用は、参照画素となりうる画素に大きな重みを与えたことによりもたらされるものであり、SADの他、SSD(Sum of Squared Difference)や、特許文献4に記載されたアクティビティ値(画面内予測コストを反映している)などの評価値を計算する際に用いることもできる。
また後者の作用は、本予測のモード選択、或いは画面内/画面間予測選択(特にマクロブロック毎に判断する場合)でも発揮される。画面内/画面間予測選択に適用する場合、例えば、画面間予測の予測誤差(動きベクトルの評価値MCOST)の計算においてもSADに代えてSAD‘を使用し、画面内/画面間予測の誤差を比較し、小さいほうの予測を選択する。重みδを大きくするほど画面内予測が選ばれにくくなるので、所望の画面内/画面間予測の比になるよう重みδを制御する。
本発明は、H.264規格に限らず、画面内予測を行う画像符号化方式全般に対して適用可能である。
101…入力画像、102…直交変換部、103…量子化部、104…画面内予測処理部、105…画面間予測処理部、106…再構成画像(メモリ)、107…フィルタ、108…逆直交変換部、109…逆量子化部、111…エントロピー符号化部、1041…擬似予測画像生成部、1042…予測モード決定部、1043…(本)予測画像生成部。

Claims (4)

  1. 複数の画面内予測モードから1つを選んで画素ブロックを符号化する動画像符号化装置において、
    前記複数の画面内予測モードによる予測画像を、入力画像から疑似的に生成する擬似予測画像生成部と、
    擬似予測画像生成部が生成した複数の前記予測画像の予測誤差を、他の画素ブロックの画面内予測で参照画素となりうる画素の重み付けして計算し、該計算された複数の予測誤差に基づいて予測モードを決定する予測モード決定部と、を備えたことを特徴とする動画像符号化装置。
  2. 前記擬似予測画像生成部は、入力画像から量子化誤差を受けずに取得された画素を参照画素として、前記予測画像を生成するものであり、
    前記予測モード決定部は、前記参照画素となりうる画素に対し、前記参照画素となりうる画素以外の画素よりも大きな重みを与えて前記予測誤差を計算し、該計算された複数の予測誤差の内、最小の予測誤差に対応する予測モードを、画面内予測の中で最適な予測モードであると決定することを特徴とする請求項1記載の動画像符号化装置。
  3. 前記画素ブロックは入力画像を所定の順序で分割したものであり、
    前記量子化誤差を受けずに取得された画素は、入力画像から直接得られる画素或いは擬似予測画像生成部が生成した前記予測画像から直接得られる画素であり、
    前記参照画素となりうる画素は、前記順序において後ろの画素ブロックにおける画面内予測で参照されうる画素であって符号化する画素ブロックにおける最下辺または最右辺の画素であり、
    前記予測モード決定部は、符号化する画素ブロックのサイズまたは量子化パラメータに応じて、前記重みを変化させることを特徴とする請求項2記載の動画像符号化装置。
  4. 複数の画面内予測モードから1つを選んで画素ブロックを符号化する動画像符号化方法であって、
    前記複数の画面内予測モードによる予測画像を、入力画像から疑似的に生成するステップと、
    擬似予測画像生成部が生成した複数の前記予測画像の予測誤差を、他の画素ブロックの画面内予測で参照画素となりうる画素の重み付けして計算し、該計算された複数の予測誤差に基づいて予測モードを決定するステップと、
    前記決定された予測モードにより、再構成画像から予測画像を生成するステップと、
    前記入力画像から、前記再構成画像から生成された予測画像を減算して差分画像を得るステップと、
    前記差分画像を直交変換して係数を得、該係数を量子化するステップと、
    前記量子化された係数を逆量子化し、逆直交変換し、前記再構成画像から生成された予測画像と加算して得られる画像に基づき、前記再構成画像を更新するステップと、を有する動画像符号化方法。
JP2011032057A 2011-02-17 2011-02-17 動画像符号化装置 Active JP5713719B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2011032057A JP5713719B2 (ja) 2011-02-17 2011-02-17 動画像符号化装置
PCT/JP2011/076878 WO2012111208A1 (ja) 2011-02-17 2011-11-22 動画像符号化装置
US13/983,021 US9438907B2 (en) 2011-02-17 2011-11-22 Motion picture encoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011032057A JP5713719B2 (ja) 2011-02-17 2011-02-17 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2012175155A true JP2012175155A (ja) 2012-09-10
JP5713719B2 JP5713719B2 (ja) 2015-05-07

Family

ID=46672158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011032057A Active JP5713719B2 (ja) 2011-02-17 2011-02-17 動画像符号化装置

Country Status (3)

Country Link
US (1) US9438907B2 (ja)
JP (1) JP5713719B2 (ja)
WO (1) WO2012111208A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5711789B2 (ja) * 2013-07-25 2015-05-07 日本電信電話株式会社 画像符号化方法、画像符号化装置及び画像符号化プログラム
FR3051309A1 (fr) * 2016-05-10 2017-11-17 Bcom Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'au moins une image

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006304102A (ja) * 2005-04-22 2006-11-02 Renesas Technology Corp 画像符号化ユニットと画像符号化方法
JP2008252346A (ja) * 2007-03-29 2008-10-16 Canon Inc 画像符号化装置及び画像符号化方法
JP2008283303A (ja) * 2007-05-08 2008-11-20 Canon Inc 画像符号化装置及び画像符号化方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4050754B2 (ja) 2005-03-23 2008-02-20 株式会社東芝 ビデオエンコーダ及び動画像信号の符号化方法
KR100678911B1 (ko) * 2005-07-21 2007-02-05 삼성전자주식회사 방향적 인트라 예측의 적용을 확장하여 비디오 신호를인코딩하고 디코딩하는 방법 및 장치
JP4690966B2 (ja) 2006-08-11 2011-06-01 株式会社東芝 動画像符号化装置
JP2009081830A (ja) 2007-09-05 2009-04-16 Panasonic Corp 動画像圧縮符号化における符号化処理方法及び符号化処理装置
US20090060039A1 (en) 2007-09-05 2009-03-05 Yasuharu Tanaka Method and apparatus for compression-encoding moving image
JP2009290498A (ja) 2008-05-29 2009-12-10 Renesas Technology Corp 画像符号化装置及び画像符号化方法
US8831099B2 (en) * 2008-12-17 2014-09-09 Nvidia Corporation Selecting a macroblock encoding mode by using raw data to compute intra cost
JP5219089B2 (ja) * 2009-04-30 2013-06-26 株式会社メガチップス 画像データの生成方法
WO2011019384A1 (en) * 2009-08-11 2011-02-17 Thomson Licensing Methods and apparatus for generalized weighted prediction

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006304102A (ja) * 2005-04-22 2006-11-02 Renesas Technology Corp 画像符号化ユニットと画像符号化方法
JP2008252346A (ja) * 2007-03-29 2008-10-16 Canon Inc 画像符号化装置及び画像符号化方法
JP2008283303A (ja) * 2007-05-08 2008-11-20 Canon Inc 画像符号化装置及び画像符号化方法

Also Published As

Publication number Publication date
JP5713719B2 (ja) 2015-05-07
US9438907B2 (en) 2016-09-06
US20130308702A1 (en) 2013-11-21
WO2012111208A1 (ja) 2012-08-23

Similar Documents

Publication Publication Date Title
CN109997361B (zh) 用于视频译码的低复杂度符号预测
US9936198B2 (en) Moving picture coding device, moving picture coding method, and moving picture coding program, and moving picture decoding device, moving picture decoding method, and moving picture decoding program
AU2015213340B2 (en) Video decoder, video encoder, video decoding method, and video encoding method
KR102046521B1 (ko) 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치
CN107623853B (zh) 视频编码和解码方法及非暂时性计算机可读存储介质
US9008173B2 (en) Image encoding and decoding apparatuses, image encoding and decoding methods, programs thereof, and recording media recorded with the programs
CN108235023B (zh) 用于编码和解码图像的方法、编码和解码设备
JP5277257B2 (ja) 動画像復号化方法および動画像符号化方法
US20170366807A1 (en) Coding of intra modes
KR20080069069A (ko) 인트라/인터 예측 방법 및 장치
US20180184116A1 (en) Apparatus for video encoding, apparatus for video decoding, and non-transitory computer-readable storage medium
JP2017069866A (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP5713719B2 (ja) 動画像符号化装置
AU2016228181A1 (en) Method for inducing a merge candidate block and device using same
JP5706291B2 (ja) 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置およびそれらのプログラム
JP2009049969A (ja) 動画像符号化装置及び方法並びに動画像復号化装置及び方法
KR20150105347A (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치
JP7332385B2 (ja) イントラ予測装置、画像符号化装置、画像復号装置、及びプログラム
JP2021129148A (ja) 予測装置、符号化装置、復号装置、及びプログラム
JP2018110313A (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
KR101802304B1 (ko) 하다마드 변환을 이용한 부호화 방법 및 이러한 방법을 사용하는 장치
KR20140129418A (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치
WO2011142221A1 (ja) 符号化装置、および、復号装置
WO2012141500A2 (ko) 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치
JP2016092494A (ja) 符号化装置、符号化方法、及び、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150310

R150 Certificate of patent or registration of utility model

Ref document number: 5713719

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250