JP2006180195A - 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム - Google Patents

動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム Download PDF

Info

Publication number
JP2006180195A
JP2006180195A JP2004371112A JP2004371112A JP2006180195A JP 2006180195 A JP2006180195 A JP 2006180195A JP 2004371112 A JP2004371112 A JP 2004371112A JP 2004371112 A JP2004371112 A JP 2004371112A JP 2006180195 A JP2006180195 A JP 2006180195A
Authority
JP
Japan
Prior art keywords
prediction
evaluation value
signal
intra
prediction mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004371112A
Other languages
English (en)
Other versions
JP4501675B2 (ja
Inventor
Kazuteru Watanabe
一輝 渡邊
Kazunori Ozawa
一範 小澤
Hiroaki Idei
洋明 出井
Kazuhiro Koyama
和広 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004371112A priority Critical patent/JP4501675B2/ja
Priority to US11/312,608 priority patent/US20060133489A1/en
Priority to EP20050090354 priority patent/EP1675404A3/en
Priority to KR20050126709A priority patent/KR100701478B1/ko
Priority to CN2005101322588A priority patent/CN1794816B/zh
Publication of JP2006180195A publication Critical patent/JP2006180195A/ja
Application granted granted Critical
Publication of JP4501675B2 publication Critical patent/JP4501675B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract


【課題】
フレーム内予測において符号化効率の高い評価尺度を用いたモード選択を高速に処理可能とする装置、方法の提供。
【解決手段】
予測信号生成器103から生成された予測信号と、動画像圧縮符号化装置に入力される動画像信号12との差分情報から、コスト値を生成するコスト計算機104と、コスト値を基に少なくとも2つの予測モードを選択してコスト計算機106へ出力する予備選択器105と、予備選択器105から出力された予測モードについて差分情報を周波数変換し、新たなコスト値を生成するコスト計算機106と、前記周波数変換した後のコスト値を基に最適な予測モードを選択する予測モード選択器107とを備えている。
【選択図】
図2

Description

本発明は動画像圧縮符号化技術に関し、特に、フレーム内予測のモードを複数種類の評価値で選択して符号化する動画像圧縮符号化方法と装置並びにプログラムに関する。
H.264/MPEG-4 Part 10(ISO/IEC 14496-10)(「H.264」という)(非特許文献1)において、フレーム内予測は輝度成分について、4x4ブロックと16x16ブロックが存在し、それぞれ9種類、4種類の予測モードがある。また、色差成分についても、8x8ブロックについて4種類の予測モードが存在する。
フレーム内予測の予測モードを選択する評価尺度として、H.264の標準化作業を行っているJVT(Joint Vide Team)の会合での寄書JVT-I049d0.doc(非特許文献2)では、
(a)動画像圧縮符号化システムに入力される動画像信号と、予測信号生成システムから出力される予測信号との差分情報のコスト値を生成するSAD(Sum of Absolute Difference)、および、
(b)すべてのモードに対して、前記差分情報をアダマール変換(Hadamard Transform)してコスト値を生成するSATD(Sum of Absolute Transformed Difference)
が提案されている。
JVTでの標準化活動の一環として開発されているH.264の参照ソフト(Joint Model: 以下、「JM」という)において、フレーム内予測モードの選択に、SADおよびSATDが採用されているが、予測モード選択時のコスト値はすべてSADもしくはSATDのいずれか一方で求められている。
なお、従来より、予測方式とブロックサイズを選択する技術が知られている(例えば特許文献1、2)。特許文献1には、各ブロックサイズのブロックについてそれぞれ異なる複数の予測方法による予測誤差が求められ、各予測誤差を第1の評価手段で評価することで当該ブロックに適した予測方法と予測誤差が適応的に選択され、第1の評価手段で得られた各ブロックサイズについての予測誤差を第2の評価手段で評価することで符号化に最適のブロックサイズが動画像の各部位ごとに適応的に選択される動画像予測符号化方式が開示されている。また特許文献2には、ブロックの大きさ情報及び予測方式の種類を受信側に伝送し、DCT演算結果を基に平坦部、変化の激しい部分を検出し、それぞれに応じてブロックサイズを大きくしたり小さくしたりし、画面の平坦部、変化の激しい部分に対して最適なブロックサイズを選択できるようにした動画像予測符号化方式が開示されている。さらに特許文献3には、画面の局部的な性質にあわせて予測方法を適応的に切替るため、全体として伝送効率を向上した動画像予測符号化方式が開示されている。さらに特許文献4には、画像データブロック毎に近似面を求め、近似面を特定する情報と、該近似面とブロックの差分値を符号化する第1の符号化手段と、ブロック毎に複数の予測方式から予測方式を選択し、選択した方式により符号化を行う第2の符号化手段と、ブロック毎に第1の符号化手段と第2の符号化手段の一方を選択する手段を備えた構成が開示されている。
しかしながら、特許文献1乃至3等に記載の技術では、フレーム内予測方式の評価尺度としてSADのみが用いられている。このため、SATDでフレーム内予測を行う場合と比べると符号化効率が著しく悪くなってしまう。
特許第2608909号公報 特許第2702139号公報 特許第2716703号公報 特開平9−9265号公報 H.264/MPEG-4 Part 10(ISO/IEC 14496-10) インターネット<URL:http://www.itu.int/rec/recommendation.asp?type=item&|ang=e&parent=T-REC-H.264-200305-I> JVT-I049d0.doc インターネット<ftp://standards.polycom.com/2003_09_SanDiego/>
上記した従来の動画像圧縮符号化方式は、下記記載の問題点を有している。
第1の問題点は、フレーム内予測方式について、入力信号と予測信号の差分情報(SAD)だけでモード選択を行うと、符号化効率が良くない、ということである。
その理由は、動画像圧縮符号化方式で符号化されたデータは、入力信号と予測信号の差分情報に対して周波数変換がされているので、該差分情報だけでは、符号化効率を評価する尺度として精度が悪いためである。
第2の問題点は、符号化効率を上げるために、差分情報に対して周波数変換を行いコスト計算を行うSATDの場合、最適なモードを選択するための処理量が極めて多い、ということである。
その理由は、フレーム内予測には複数の予測モードが複数のブロックサイズごとに存在するため、最適な予測モードを選択する場合、すべてのモードに対して前記差分情報を周波数変換した値を算出する必要があるためである。
したがって、本発明の目的は、フレーム内予測器の符号化効率を向上できる動画像圧縮符号化装置と方法並びにプログラムを提供することにある。
本発明の他の目的は、高速に処理ができるフレーム内予測器をもつ動画像圧縮符号化装置と方法並びにプログラムを提供することにある。
前記目的を達成する本発明は、概略、以下の構成とされる。
本発明の第1のアスペクトに係る動画像圧縮符号化装置は、フレーム内予測器が、予測モードを複数段探索するものであり、より具体的には、動画像圧縮符号化装置に入力される動画像信号と、フレーム内予測器で生成された予測信号との差分情報を基に第1の評価値を算出する手段と、前記第1の評価値を基に、複数の予測モードを予備選択する手段と、前記予備選択された複数の予測モードの差分情報を基に第2の評価値を算出する手段と、前記第2の評価値を基に、前記予備選択された複数の予測モードから、1つの予測モードを選択する手段と、を備える。
あるいは、本発明の別のアスペクトに係る動画像圧縮符号化装置は、複数のブロックサイズが存在する場合に、動画像圧縮符号化装置に入力される動画像信号と、フレーム内予測器で生成された予測信号との差分情報を基に第1の評価値を算出する手段と、前記第1の評価値を基に、複数の予測モードを予備選択する手段と、前記予備選択されたモードの差分情報を基に、第2の評価値を算出する手段と、前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択する手段と、前記第2の評価値から、最適なブロックサイズを選択する手段と、備える。
本発明の別のアスペクトに係る動画像圧縮符号化方法は、入力される動画像信号とフレーム内予測器で生成された予測信号との差分情報を基に第1の評価値を算出するステップと、
前記第1の評価値を基に、複数の予測モードを予備選択するステップと、
前記予備選択されたモードの差分情報を基に、第2の評価値を算出するステップと、
前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択するステップと、
を含む。
本発明の別のアスペクトに係るコンピュータプログラムは、動画像圧縮符号化装置を構成するコンピュータに、入力される動画像信号と、フレーム内予測器で生成された予測信号との差分情報を基に評価値を算出する処理と、前記第1の評価値を基に、複数の予測モードを予備選択する処理と、前記予備選択されたモードの差分情報を基に、第2の評価値を算出する処理と、前記第2の評価値を基に、前記予備選択された予測モードから、1つの予測モードを選択する処理と、を実行させるプログラムよりなる。
本発明によれば、モード選択をする際に、差分情報(SAD)のみでモードを選択する方法と比べて、符号化効率を大幅に向上させることができ、高速化を実現することができる。
本発明によれば、フレーム内予測器でモードを選択する際に、すべてのモードに対して差分情報を周波数変換する必要がないため、処理量を大幅に削減できると共に、性能的には、SATDに近い高性能を提供することができる。
上記した本発明についてさらに詳細に説述すべく添付図面を参照して以下に説明する。
本発明の一実施の形態に係るフレーム内予測装置は、フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号(13)を入力とし予測信号を生成する予測信号生成器(103)と、予測信号生成器(103)で生成された予測信号と、動画像圧縮符号化装置に入力される動画像信号との差分情報から、コスト値を生成するコスト計算機(104)と、フレーム内予測器のすべてのモードから差分情報のコスト値を基に少なくとも2つの予測モード(例えばコスト値の小さい上位2つ以上のモード)を選択してコスト計算機(106)へ出力する予備選択器(105)と、予備選択器(105)から出力された予測モードについて、差分情報を周波数変換し、新たなコスト値を生成するコスト計算機(106)と、前記周波数変換した後のコスト値を基に最適な予測モードを選択する予測モード選択器(107)とを備えた予測モード判定器(108)と、予測モード判定器(108)から出力された予測モード(115)に対応する予測信号を、予測信号メモリ(102)から読み込み、フレーム内予測の結果として出力する。
本発明の実施の形態において、複数のフレーム内予測器を備え、複数のブロックサイズが存在する場合に、前記フレーム内予測器でブロックサイズ毎に、予測モード判別法を変化させて、予測モードを選択し、さらに、ブロックサイズを選択する手段を備えた構成としてもよい。あるいは、フレーム内予測器でブロックサイズ毎に、複数の予測モード判別法のうちいずれか1つを用いて予測モードを選択し、ブロックサイズを選択する手段を備えた構成としてもよい。以下、実施例に即して説明する。
図1は、本発明の一実施例の構成を示す図である。図1を参照すると、動画像信号12はフレーム内予測器1と動きベクトル検出器2に入力される。動きベクトル検出器2で検出された動きベクトルと、フレームメモリ10の情報に基づき、動き補償を行う動き補償器3を備え、スイッチ11は、フレーム内予測器1と、動き補償器3の出力とを切り替える。減算器15で動画像信号12からスイッチ11の出力を減算した結果は、DIT器4でDIT(Discrete Integer Transform)変換され、量子化器5にて量子化され可変長符号器6にて可変長符号される。量子化器5の出力は逆量子化器7で逆量子化され逆DIT器8で逆DIT変換される。逆DIT器8の出力とスイッチ11の出力とは加算器16で加算され、加算結果が再構成信号13としてフレーム内予測器1とループ内フィルタ器9に供給され、ループ内フィルタ器9の出力はフレームメモリ10に格納される。
図2は、図1のフレーム内予測器1の詳細な構成を示す図である。フレーム内予測器1は、予測信号生成器103と、予測モード判定器108と、予測信号呼出装置109とを備えている。
予測信号生成器103は、再構成信号を入力とする複数のフィルタ101と、複数のフィルタ101からの予測信号110をそれぞれ入力する複数の予測信号メモリ102を備えている。
予測モード判定器108は、コスト計算機104と、予備選択器105と、コスト計算機106と、予測モード選択器107を備えている。
まず、予測信号生成器103の動作について説明する。図2において、フィルタ101は、再構成信号13に対して、それぞれ、フレーム内予測器に存在する複数種類の予測モードに基づいたフィルタ処理を行い、生成された予測信号110を予測信号メモリ102に格納する。
フレーム内予測の予測については、非特許文献1に記載の通り、当該ブロックの左に隣接するブロックにおける右端に位置する4もしくは16個の画素、当該ブロックの上や右上に隣接するブロックにおける下端の画素に位置する4もしくは16個の画素、および当該ブロックの左上に隣接するブロックの右下の端の1個の画素を用いて予測を行う。
フレーム内予測において、
・左に隣接するブロックの右端の画素を、当該ブロックの同じ高さの画素の予測信号とする予測モード、
・上に隣接するブロックの下端の画素を、当該ブロックの同じ列の画素の予測信号とする予測モード、
・予測で用いる画素の平均値を当該ブロックすべての予測信号とする予測モード、
・当該ブロックの位置に基づいて予測で用いる複数の画素値をフィルタ処理して予測信号を生成する予測モード、
等が用いられる。
予測信号メモリ102は、フィルタ101より出力された予測信号110を蓄積するための装置であり、予測信号110を予測モード判定器108のコスト計算機104、および、予測信号呼出装置109へ出力する。
再構成信号13は、フレーム内予測を行う該当ブロックを符号化する前に、符号化が終了している隣接ブロックの画像信号の一部である。
予測信号110は、再構成信号13に対して、予測モードにより異なるフィルタ101を用いて生成された信号、もしくは、再構成信号13と同じ値の信号である。
次に、予測モード判定器108の動作について説明する。
コスト計算機104は、予測信号110および動画像信号12の差分情報112を計算し、予備選択器105に、コスト値111を出力する。コスト計算機104は、例えば差分情報(block difference)112として、
Diff(i,j)=Original(i,j)-Prediction(i,j) …(1)
を算出する。ただし、Prediction(i,j)は予測信号110、Original(i,j)は動画像信号12である。
そして、コスト計算機104は、差分データDiff(i,j)の絶対値の和であるSAD(Sum of Absolute Difference)(次式(2)参照)をコスト値として出力する。
SAD=Σi,j|Diff(i,j)| …(2)
予備選択器105は、コスト値111の差分情報の少ない予測モードから少なくとも2つの予測モードを選択し、選択モード113をコスト計算機106へ出力する。
コスト計算機106は、予備選択器105から出力された、選択モード113に対応する差分情報112に対して、周波数変換をしたコスト値114を計算し、予測モード選択器107へ出力する。コスト計算機106は、差分データDiff(i,j)を、例えばアダマール変換(Hadamard Transform)等により周波数変換して得られるDiffT(i,j)の絶対値の和であるSATD(Sum of Absolute Transformed Difference)(次式(3)参照)を当該ブロックのコスト値114として算出する。
SATD=(Σi,j|DiffT(i,j)|)/2 …(3)
予測モード選択器107は、コスト計算機106によって出力されたコスト値114から最適な予測モード115を選択し、予測モード115とそのコスト値114を、フレーム内予測の結果として、出力する。
動画像信号12は、動画像圧縮符号化装置14の入力画像信号である。
予測信号呼出装置109は、予測モード判定器108から出力された予測モード115に対応する予測信号を、予測信号メモリ102から読み込み、フレーム内予測の結果として出力する。もしくは、予測信号呼出装置109は、図1のスイッチ11で、フレーム内予測が選ばれた場合に、予測モード判定器108から出力された予測モード115に対応する予測信号を、予測信号メモリ102から読み込んで、フレーム内予測の結果として出力する。
本実施例は、2段探索について説明したが、
・2段目の探索で複数のモードを選択し、DiffT(i,j)を図1の量子化器5によって量子化した値から、コスト値を求める、もしくは、
・DiffT(i,j)を図1の量子化器5によって量子化した値を、図1の可変長符号器6によって符号化した値からコスト値を求める、
という手段により、3段以上に拡張することが出来る。
次に、本発明の第2の実施例について、図3を参照して、詳細に説明する。図3は、フレーム内予測器1について、N個のブロックサイズが存在する場合にブロックサイズを選択する部分の構成を示している。図3を参照すると、ブロックサイズ選択部は、N個のブロックサイズに対応したフレーム内予測器201〜201と、ブロックサイズ判定器202と、予測信号・予測モードメモリ203と、を備えて構成されている。
ブロックサイズ判定器202は、ブロックサイズ毎に、フレーム内予測器201〜201から出力されるコスト値206の最も少ないブロックサイズ207を選択し、ブロックサイズ207とそのコスト値206を、予測信号・予測モードメモリ203へ出力する。
予測信号・予測モードメモリ203は、ブロックサイズ毎に、フレーム内予測器201〜201から出力される予測信号204と予測モード205を格納し、ブロックサイズ判定器202から出力されるブロックサイズ207に対応する予測信号204、予測モード205をフレーム内予測の結果として、コスト値206およびブロックサイズ207とともに出力する。フレーム内予測器201〜201の各々は、図2に示した構成(予測信号生成器103と予測モード判定器108と予測信号呼出装置109)よりなり、動作も同一であるため、説明を省略する。
次に、本発明の第3の実施例について、図4および図5を参照して詳細に説明する。図4は、フレーム内予測器1に、複数のブロックサイズが存在する場合に、ブロックサイズを選択する部分の構成を示している。本実施例では、ブロックサイズが3種類、予測モード判別法が3種類存在する場合について説明する。
ブロックサイズ選択部は、ブロックサイズ毎に、予測モードの判別法が異なるフレーム内予測器301、302、303と、ブロックサイズ判定器304と、予測信号・予測モードメモリ305を備えて構成されている。フレーム内予測器301、302、303の構成および動作について説明する。
フレーム内予測器301、302および303は、各々ブロックサイズ毎に、予測モード判定器が異なるフレーム内予測器(図2、図5および図6参照)を用いる。
図5に示すように、予測モード判定器407は、コスト計算機404と、予測モード選択器405と、コスト計算機406とを備えて構成されている。予測信号生成器403は、図2と同一である。
コスト計算機404は、動画像圧縮符号化装置14に入力される動画像信号12と、予測信号生成器403との差分情報411から、コスト値410を計算し(例えば上式(2)のSAD)、予測モード選択器405に出力する。
予測モード選択器405は、コスト値410から最適な予測モード412を選択し、コスト計算機406へ予測モード412とその差分情報を出力する。
コスト計算機406は、予測モード412の差分情報411を周波数変換し、コスト値413を計算して、フレーム内予測器の結果として、予測モード412とコスト値413(例えば上式(3)のSATD)を出力する。
また、図6に示す構成において、予測モード判定器427は、差分計算機424と、コスト計算機425と、予測モード選択器426とを備えて構成されている。
差分計算機424は、動画像圧縮符号化装置14に入力される動画像信号12と予測信号生成器423の出力(予測信号)との差分情報430を計算し(例えば上式(1)参照)、コスト計算機425に出力する。
コスト計算機425は、すべての予測モードの差分情報430(Diff(i,j))に対して周波数変換して(例えばアダマール変換して得られるDiffT(i,j))、コスト値431を計算し(例えば上式(3)のSATD)、予測モード選択器426に出力する。
予測モード選択器426は、コスト計算機425から出力されたコスト値431を基に最適な予測モード432を選択し、フレーム内予測器の結果として、最適な予測モード432とそのコスト値431を出力する。上記以外の構成および動作は、前記実施例2と同じであることから、その説明を省略する。
次に、本発明の第4の実施例について、図7を参照して説明する。図7は、フレーム内予測方式に複数のブロックサイズが存在する場合に、ブロックサイズを選択する部分の構成を示している。以下では、M=3個の予測モード判別法が存在し、かつブロックサイズが2種類存在する場合について説明する。
ブロックサイズ選択部分は、フレーム内予測器501、502、ブロックサイズ判定器503、および予測信号・予測モードメモリ504を備えて構成される。
フレーム内予測器501、502の構成を説明する。フレーム内予測器501および502は、図2もしくは図5、図6に示した構成のうちいずれかを用いることができる。上記以外の構成および動作は、前記第3の実施例と同じであるので説明を省略する。
次に、本発明の第5の実施例について、図8を参照して説明する。図8は、フレーム内予測方式に複数のブロックサイズが存在する場合に、ブロックサイズを選択する部分の構成を示している。本実施例では、予測モード選択数が2種類存在する場合について説明する。ブロックサイズ選択部分はブロックサイズ毎に予測モードの予備選択数が異なるフレーム内予測器601、602、ブロックサイズ判定器603、および予測信号・予測モードメモリ604を備えて構成されている。
フレーム内予測器601および602の構成について説明する。フレーム内予測器601、602は、図2又は図9のフレーム内予測器1を用いる。
図2と図9の構成の相違点は、予備選択器105および予備選択器625で選択される予測モードの予備選択数が相違している。これ以外の構成および動作は第2の実施例と同じである。
次に本発明の第6の実施例について、図10を参照して説明する。図10は、フレーム内予測器に複数のブロックサイズが存在する場合に、ブロックサイズを選択する部分の構成を示している。本実施例では、ブロックサイズが4種類存在する場合で、予測モード判別法が3種類存在し、そのうち、予備選択をする予測モード判別法において予備選択数が2種類存在する構成について説明する。ブロックサイズ選択部は、ブロックサイズ毎に、予測モードの予備選択数もしくは予測モード判別法が異なるフレーム内予測器701、702、703、704と、ブロックサイズ判定器705と、予測信号・予測モードメモリ706を備えて構成される。
フレーム内予測器701、702、703および704の構成について説明する。ブロックサイズの異なるフレーム内予測器701、702、703、704のうち2つは、図2と図9から構成される。図2と図9の違いは、予備選択数が異なることである。その他のブロックサイズのフレーム内予測器は、図5と図6から構成される。もしくは、その他のブロックサイズのフレーム内予測器は、図2、図5、図6、もしくは図8のいずれかのフレーム内予測器から構成される。上記以外の構成、および動作は、前記第3の実施例もしくは第4の実施例と同じため説明を省略する。
本実施例によれば、モード選択をする際に、差分情報(SAD)のみでモードを選択する方法と比べて符号化効率を大幅に向上させることができることである。
本実施例によれば、フレーム内予測器でモードを選択する際に、すべてのモードに対して差分情報を周波数変換する必要がないため、処理量を大幅に削減できると共に、性能的にはSATDに近い高性能を提供することができることである。
図11および図12は、輝度成分について、フレーム内予測器のブロックサイズが4x4と、16x16の2種類存在し、
4x4に9種類の予測モードが存在し、
16x16に4種類の予測モードが存在する場合における、本発明の作用効果を示すデータである。
図11は、符号化効率に関するデータ(横軸;ビット量、縦軸:SNR(信号対雑音比))を示しており、図12は、すべてのモードに対して差分情報を周波数変換してモード選択した演算量(SATD)に対する、横軸の各方法(SATD、実施例5、2、SAD)の演算量の削減率(縦軸)を示している。
各データは、実施例2と5、差分情報のみでモード選択をする方法(SAD)、すべてのモードに対して差分情報の周波数変換をしてモード選択をする方法(SATD)を示している。
本発明のうち、実施例2は、4x4ブロック、16x16ブロック共に予備選択数を2としており、実施例5に関しては4x4ブロックに対して、4つの予備選択をし、16x16ブロックに対しては2つの予備選択を行った。
図11より、実施例2、5は、同じビット量のストリームにおいて、SADに比べて高いSN比が得られており、符号化効率を向上させていることが分かる。実施例5については、SATDと同等の符号化効率が得られている。
実施例2については、SATDと比べてほぼ同等の符号化効率が得られる。
また、図12より、実施例2、5は、SATDに比べて高速化されていることが分かる。実施例5では20%程度、実施例2は35%程度の高速化が可能である。
以上本発明を上記実施例に即して説明したが、本発明は上記実施例の構成にのみ限定されるものでなく、本発明の範囲内で当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
本発明の一実施例の全体の装置構成を示す図である。 本発明の第1の実施例の構成を示す図である。 本発明の第2の実施例の構成を示す図である。 本発明の第3の実施例の構成を示す図である。 本発明の第3の実施例の構成の一部を示す図である。 本発明の第3の実施例の構成の一部を示す図である。 本発明の第4の実施例の構成を示す図である。 本発明の第5の実施例の構成を示す図である。 本発明の第5の実施例の構成を示す図である。 本発明の第6の実施例の構成を示す図である。 本発明の作用効果の一例を示す図である。 本発明の作用効果の他の例を示す図である。
符号の説明
1 フレーム内予測器
2 動きベクトル検出器
3 動き補償器
4 DIT(Discrete Integer Transform)器
5 量子化器
6 可変長符号器
7 逆量子化器
8 逆DIT器
9 ループ内フィルタ器
10 フレームメモリ
11 スイッチ
12 動画像信号(動画像圧縮符号化装置に入力される動画像信号)
13 再構成信号
14 動画像圧縮符号化装置
15 減算器
16 加算器
101 フィルタ
102 予測信号メモリ
103 予測信号生成器
104 コスト計算機
105 予備選択器
106 コスト計算機
107 予測モード選択器
108 予測モード判定器
109 予測信号呼出装置
110 予測信号
111 コスト値
112 差分情報
113 選択モード
114 コスト値
115 予測モード
201 フレーム内予測器
202 ブロックサイズ判定器
203 予測信号・予測モードメモリ
204 予測信号
205 予測モード
206 コスト値
207 ブロックサイズ
301 フレーム内予測器
302 フレーム内予測器
303 フレーム内予測器
304 ブロックサイズ判定器
305 予測信号・予測モードメモリ
306 予測信号/予測モード
307 コスト値
308 コスト値/ブロックサイズ
309 予測信号/予測モード/コスト値/ブロックサイズ
401 フィルタ
402 予測信号メモリ
403 予測信号生成器
404 コスト計算機
405 予測モード選択器
406 コスト計算機
407 予測モード判定器
408 予測信号呼出装置
409 予測信号
410 コスト値
411 差分情報
412 予測モード
413 コスト値
421 フィルタ
422 予測信号メモリ
423 予測信号生成器
424 差分計算機
425 コスト計算機
426 予測モード選択器
427 予測モード判定器
428 予測信号呼出装置
429 予測信号
430 差分情報
431 コスト値
432 予測モード
501 フレーム内予測器
502 フレーム内予測器
503 ブロックサイズ判定器
504 予測信号・予測モードメモリ
505 予測信号/予測モード
506 コスト値
507 コスト値/ブロックサイズ
508 予測信号/予測モード/コスト値/ブロックサイズ
601 フレーム内予測器
602 フレーム内予測器
603 ブロックサイズ判定器
604 予測信号・予測モードメモリ
605 予測信号/予測モード
606 コスト値
607 コスト値/ブロックサイズ
608 予測信号/予測モード/コスト値/ブロックサイズ
621 フィルタ
622 予測信号メモリ
623 予測信号生成器
624 コスト計算機
625 予備選択器
626 コスト計算機
627 予測モード選択器
628 予測モード判定器
629 予測信号呼出装置
630 予測信号
631 コスト値
632 差分情報
633 選択モード
634 コスト値
635 予測モード
701 フレーム内予測器
702 フレーム内予測器
703 フレーム内予測器
704 フレーム内予測器
705 ブロックサイズ判定器
706 予測信号・予測モードメモリ
707 予測信号/予測モード
708 コスト値
709 コスト値/ブロックサイズ
710 予測信号/予測モード/コスト値/ブロックサイズ

Claims (30)

  1. 動画像圧縮符号化装置に入力される動画像信号と、フレーム内予測器で生成された予測信号との差分情報を基に、第1の評価値を算出する手段と、
    前記第1の評価値を基に、複数の予測モードを予備選択する手段と、
    前記予備選択された複数の予測モードの差分情報を基に、第2の評価値を算出する手段と、
    前記第2の評価値を基に、前記予備選択された複数の予測モードから、1つの予測モードを選択する手段と、
    を含むフレーム内予測器を備えている、ことを特徴とする動画像圧縮符号化装置。
  2. 複数のブロックサイズが存在する場合に、動画像圧縮符号化装置に入力される動画像信号と、フレーム内予測器で生成された予測信号との差分情報を基に、第1の評価値を算出する手段と、
    前記第1の評価値を基に、複数の予測モードを予備選択する手段と、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出する手段と、
    前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択する手段と、
    前記第2の評価値から最適なブロックサイズを選択する手段と、
    を備えたことを特徴とする動画像圧縮符号化装置。
  3. フレーム内予測器において、複数のブロックサイズが存在する場合に、前記フレーム内予測器でブロックサイズ毎に、予測モード判別法を変化させて、予測モードを選択する手段と、
    ブロックサイズを選択する手段と、
    を備えた、ことを特徴とする動画像圧縮符号化装置。
  4. フレーム内予測器において、複数のブロックサイズが存在する場合に、前記フレーム内予測器でブロックサイズ毎に、複数の予測モード判別法のうちいずれか1つを用いて予測モードを選択する手段と、
    ブロックサイズを選択する手段と、
    を備えたことを特徴とする動画像圧縮符号化装置。
  5. 前記フレーム内予測器が、入力される動画像信号と、前記フレーム内予測器で生成した予測信号との差分情報を基に、第1の評価値を算出する手段と、
    前記第1の評価値を基に、複数の予測モードを予備選択する手段と、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出する手段と、
    前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択する手段と
    を備え、
    前記予備選択数がブロックサイズ毎に異なる、ことを特徴とする請求項3又は4記載の動画像圧縮符号化装置。
  6. 前記フレーム内予測器が、入力される動画像信号と、前記フレーム内予測器で生成した予測信号との差分情報を基に、第1の評価値を算出する手段と、
    前記第1の評価値を基に、複数の予測モードを予備選択する手段と、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出する手段と、
    前記第2の評価値を基に前記予備選択された予測モードから1つの予測モードを選択する手段と、
    を備え、
    前記フレーム内予測器での予備選択数がブロックサイズごとに異なる、ことを特徴とする請求項3又は4に記載の動画像圧縮符号化装置。
  7. 前記ブロックサイズを選択する手段は、ブロックサイズ毎に、複数の前記フレーム内予測器から出力される第2評価値に基づきブロックサイズを選択し、選択したブロックサイズとその評価値を、予測信号・予測モードメモリへ出力し、
    前記予測信号・予測モードメモリは、ブロックサイズ毎に、前記フレーム内予測器から出力される予測信号と予測モードを格納し、
    前記ブロックサイズを選択する手段から出力されるブロックサイズに対応する予測信号、予測モードをフレーム内予測の結果として、評価値およびブロックサイズとともに出力する、ことを特徴とする請求項5又は6に記載の動画像圧縮符号化装置。
  8. フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納する予測信号生成器と、
    前記予測信号生成器で生成された予測信号と、入力される動画像信号との差分情報から、第1の評価値を生成する第1のコスト計算機と、前記第1の評価値を基に少なくとも2つの予測モードを選択して第2のコスト計算機へ出力する予備選択器と、前記予備選択器から出力された予測モードについて差分情報を周波数変換して第2の評価値を生成する第2のコスト計算機と、前記第2の評価値を基に、最適な予測モードを選択する予測モード選択器とを備えた予測モード判定器と、
    前記予測モード判定器から出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力する予測信号呼出回路と、
    を含むフレーム内予測装置を備えている、ことを特徴とする動画像圧縮符号化装置。
  9. フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納する予測信号生成器と、
    入力される動画像信号と前記予測信号生成器の出力の差分情報から第1の評価値を計算し出力する第1のコスト計算機と、前記第1の評価値から最適な予測モードを選択し予測モードとその差分情報を出力する予測モード選択器と、前記予測モードの差分情報を周波数変換し、第2の評価値を計算して、フレーム内予測器の結果として、予測モードと評価値を出力する第2のコスト計算機と、を備えた予測モード判定器と、
    前記予測モード判定器から出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力する予測信号呼出回路と、
    を含むフレーム内予測装置を備えている、ことを特徴とする動画像圧縮符号化装置。
  10. フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納する予測信号生成器と、
    動画像信号と前記予測信号生成器の出力との差分情報を計算する差分計算機と、
    前記差分計算機から出力される予測モードの差分情報に対して、周波数変換し評価値を計算して出力するコスト計算機と、前記評価値から最適な予測モードを選択し予測モードとその差分情報を出力する予測モード選択器とを備えた予測モード判定器と、
    前記予測モード判定器から出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力する予測信号呼出回路と、
    を含むフレーム内予測装置を備えている、ことを特徴とする動画像圧縮符号化装置。
  11. 前記フレーム内予測装置の出力と、前記動画像信号から動きベクトルを検出し動き補償を行う手段の出力の一方を出力するスイッチと、
    前記動画像信号と前記スイッチの出力の減算結果を直交変換し量子化した信号に対して逆量子化、逆直交変換した信号と前記スイッチの出力の加算結果が前記再構成信号として前記フレーム内予測装置に供給される、ことを特徴とする請求項8乃至10のいずれか一に記載の動画像圧縮符号化装置。
  12. 入力される動画像信号とフレーム内予測器で生成された予測信号との差分情報を基に第1の評価値を算出するステップと、
    前記第1の評価値を基に、複数の予測モードを予備選択するステップと、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出するステップと、
    前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択するステップと、
    を含む、ことを特徴とする動画像圧縮符号化方法。
  13. 複数のブロックサイズが存在する場合に、入力される動画像信号とフレーム内予測器で生成された予測信号との差分情報を基に第1の評価値を算出するステップと、
    前記第1の評価値を基に、複数の予測モードを予備選択するステップと、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出するステップと
    前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択するステップと、
    前記第2の評価値から、最適なブロックサイズを選択するステップと、
    を含む、ことを特徴とする動画像圧縮符号化方法。
  14. フレーム内予測器において複数のブロックサイズが存在する場合に、前記フレーム内予測器でブロックサイズ毎に予測モード判別法を変化させて、予測モードを選択するステップと、
    ブロックサイズを選択するステップと、
    を含む、ことを特徴とする動画像圧縮符号化方法。
  15. フレーム内予測器において複数のブロックサイズが存在する場合に、前記フレーム内予測器でブロックサイズ毎に、複数の予測モード判別法のうちいずれか1つを用いて予測モードを選択するステップと、
    ブロックサイズを選択するステップと、
    を含む、ことを特徴とする動画像圧縮符号化方法。
  16. 前記フレーム内予測器の処理ステップとして、
    入力される動画像信号とフレーム内予測器で生成された予測信号との差分情報を基に、第1の評価値を算出するステップと、
    前記第1の評価値を基に、複数の予測モードを予備選択するステップと、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出するステップと、
    前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択するステップと、
    を含み、
    前記予備選択数がブロックサイズ毎に異なる、ことを特徴とする請求項14又は15記載の動画像圧縮符号化方法。
  17. 前記フレーム内予測器の処理ステップとして、
    入力される動画像信号とフレーム内予測器で生成された予測信号との差分情報を基に、第1の評価値を算出するステップと、
    前記第1の評価値を基に、複数の予測モードを予備選択するステップと、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出するステップと、
    前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択するステップと、
    を含み、フレーム内予測方式の予備選択数がブロックサイズごとに異なることを特徴とする請求項14又は15に記載の動画像圧縮符号化方法。
  18. 前記ブロックサイズを選択するステップは、
    ブロックサイズ毎に、複数の前記フレーム内予測器から出力される第2評価値に基づきブロックサイズを選択し、選択したブロックサイズとその評価値を、予測信号・予測モードメモリへ出力するステップと、
    前記予測信号・予測モードメモリは、ブロックサイズ毎に、前記フレーム内予測器から出力される予測信号と予測モードを格納するステップと、
    前記ブロックサイズを選択するステップで選択されるブロックサイズに対応する予測信号、予測モードをフレーム内予測の結果として、評価値およびブロックサイズとともに出力するステップと、
    を含む、ことを特徴とする請求項16又は17に記載の動画像圧縮符号化方法。
  19. 動画像圧縮符号化におけるフレーム内予測として、
    フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納するステップと、
    前記生成された予測信号と、入力される動画像信号との差分情報から、第1の評価値を生成するステップと、
    前記第1の評価値を基に少なくとも2つの予測モードを選択して出力するステップと、
    前記出力された予測モードについて差分情報を周波数変換して第2の評価値を生成するステップと、
    前記第2の評価値を基に、最適な予測モードを選択するステップと、
    前記出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力するステップと、
    を含む、ことを特徴とする動画像圧縮符号化方法。
  20. 動画像圧縮符号化におけるフレーム内予測として、
    フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納するステップと、
    入力される動画像信号と前記予測信号生成器の出力の差分情報から第1の評価値を計算し出力するステップと、
    前記第1の評価値から最適な予測モードを選択し予測モードとその差分情報を出力するステップと、
    前記予測モードの差分情報を周波数変換し、第2の評価値を計算して、フレーム内予測器の結果として、予測モードと評価値を出力するステップと、
    前記出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力するステップと、
    を含む、ことを特徴とする動画像圧縮符号化方法。
  21. 動画像圧縮符号化におけるフレーム内予測として、
    フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納するステップと、
    動画像信号と前記予測信号生成器の出力との差分情報を計算するステップと、
    前記予測モードの差分情報に対して、周波数変換し評価値を計算して出力するステップと、
    前記評価値から最適な予測モードを選択し予測モードとその差分情報を出力するステップと、
    前記出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力するステップと、
    を含む、ことを特徴とする動画像圧縮符号化方法。
  22. 動画像圧縮符号化装置を構成するコンピュータに、
    入力される動画像信号と、フレーム内予測器で生成された予測信号との差分情報を基に評価値を算出する処理と、
    前記第1の評価値を基に、複数の予測モードを予備選択する処理と、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出する処理と、
    前記第2の評価値を基に、前記予備選択された予測モードから、1つの予測モードを選択する処理と、
    を実行させるプログラム。
  23. 動画像圧縮符号化装置を構成するコンピュータに、
    複数のブロックサイズが存在する場合に、入力される動画像信号とフレーム内予測器で生成された予測信号との差分情報を基に、第1の評価値を算出する処理と、
    前記第1の評価値を基に、複数の予測モードを予備選択する処理と、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出する処理と、
    前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択する処理と、
    前記第2の評価値から、最適なブロックサイズを選択する処理と、
    を実行させるプログラム。
  24. 動画像圧縮符号化装置を構成するコンピュータに、
    フレーム内予測器で複数のブロックサイズが存在する場合に、前記フレーム内予測器でブロックサイズ毎に予測モード判別法を変化させて、予測モードを選択する処理と、
    ブロックサイズを選択する処理と、
    を実行させるプログラム。
  25. 動画像圧縮符号化装置を構成するコンピュータに、
    フレーム内予測器で複数のブロックサイズが存在する場合に、前記フレーム内予測器でブロックサイズ毎に、複数の予測モード判別法のうちいずれか1つを用いて予測モードを選択する処理と、
    ブロックサイズを選択する処理と、
    を実行させるプログラム。
  26. 請求項24又は25に記載のプログラムにおいて、前記動画像圧縮符号化装置を構成するコンピュータに、前記フレーム内予測器の処理として、
    入力される動画像信号とフレーム内予測器で生成された予測信号との差分情報を基に、第1の評価値を算出する処理と、
    前記第1の評価値を基に、複数の予測モードを予備選択する処理と、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出する処理と、
    前記第2の評価値を基に、前記予備選択された予測モードから1つの予測モードを選択し、前記予備選択数がブロックサイズ毎に異なる、処理と、
    を実行させるプログラム。
  27. 請求項24又は25に記載のプログラムにおいて、前記動画像圧縮符号化装置を構成するコンピュータに、
    入力される動画像信号とフレーム内予測器で生成された予測信号との差分情報を基に、第1の評価値を算出する処理であって、前記フレーム内予測器の予備選択数がブロックサイズごとに異なる処理と、
    前記第1の評価値を基に、複数の予測モードを予備選択する処理と、
    前記予備選択されたモードの差分情報を基に、第2の評価値を算出する処理と、
    前記第2の評価値を基に前記予備選択された予測モードから1つの予測モードを選択する処理と、
    を実行させるプログラム。
  28. 動画像圧縮符号化装置を構成するコンピュータに、
    フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納する処理と、
    前記生成された予測信号と、入力される動画像信号との差分情報から、第1の評価値を生成する処理と、
    前記第1の評価値を基に少なくとも2つの予測モードを選択して出力する処理と、
    前記出力された予測モードについて差分情報を周波数変換して第2の評価値を生成する処理と、
    前記第2の評価値を基に、最適な予測モードを選択する処理と、
    前記出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力する処理と、
    をフレーム内予測として実行させるプログラム。
  29. 動画像圧縮符号化装置を構成するコンピュータに、
    フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納する処理と、
    入力される動画像信号と前記予測信号生成器の出力の差分情報から第1の評価値を計算し出力する処理と、
    前記第1の評価値から最適な予測モードを選択し予測モードとその差分情報を出力する処理と、
    前記予測モードの差分情報を周波数変換し、第2の評価値を計算して、フレーム内予測器の結果として、予測モードと評価値を出力する処理と、
    前記出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力する処理と、
    をフレーム内予測として実行させるプログラム。
  30. 動画像圧縮符号化装置を構成するコンピュータに、
    フレーム内予測を行うブロックを符号化する前に符号化が終了している隣接ブロックの画像信号の一部である再構成信号を入力とし予測信号を生成出力し、前記予測信号を予測信号メモリに格納する処理と、
    動画像信号と前記予測信号生成器の出力との差分情報を計算する処理と、
    前記予測モードの差分情報に対して、周波数変換し評価値を計算して出力する処理と、
    前記評価値から最適な予測モードを選択し予測モードとその差分情報を出力する処理と、
    前記出力された予測モードに対応する予測信号を、前記予測信号メモリから読み込み、フレーム内予測の結果として出力する処理と、
    をフレーム内予測として実行させるプログラム。
JP2004371112A 2004-12-22 2004-12-22 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム Expired - Fee Related JP4501675B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004371112A JP4501675B2 (ja) 2004-12-22 2004-12-22 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム
US11/312,608 US20060133489A1 (en) 2004-12-22 2005-12-21 Moving picture compression encoding method, apparatus and program
EP20050090354 EP1675404A3 (en) 2004-12-22 2005-12-21 Efficient selection of intra coding modes
KR20050126709A KR100701478B1 (ko) 2004-12-22 2005-12-21 동화상 압축 부호화 방법과 동화상 압축 부호화 장치 및프로그램
CN2005101322588A CN1794816B (zh) 2004-12-22 2005-12-22 运动图像压缩编码方法、运动图像压缩编码装置以及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004371112A JP4501675B2 (ja) 2004-12-22 2004-12-22 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム

Publications (2)

Publication Number Publication Date
JP2006180195A true JP2006180195A (ja) 2006-07-06
JP4501675B2 JP4501675B2 (ja) 2010-07-14

Family

ID=36113847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004371112A Expired - Fee Related JP4501675B2 (ja) 2004-12-22 2004-12-22 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム

Country Status (5)

Country Link
US (1) US20060133489A1 (ja)
EP (1) EP1675404A3 (ja)
JP (1) JP4501675B2 (ja)
KR (1) KR100701478B1 (ja)
CN (1) CN1794816B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010283495A (ja) * 2009-06-03 2010-12-16 Fujitsu Ltd 動画像符号化装置及び動画像符号化方法
WO2012117900A1 (ja) * 2011-02-28 2012-09-07 株式会社メガチップス 符号化装置

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008124580A (ja) * 2006-11-08 2008-05-29 Matsushita Electric Ind Co Ltd 動きベクトル検出方法、動きベクトル検出装置、及び撮像システム
US8218636B2 (en) * 2006-11-21 2012-07-10 Vixs Systems, Inc. Motion refinement engine with a plurality of cost calculation methods for use in video encoding and methods for use therewith
CN101222641B (zh) * 2007-01-11 2011-08-24 华为技术有限公司 帧内预测编解码方法及其装置
KR100924640B1 (ko) * 2007-11-21 2009-11-02 한양대학교 산학협력단 영상 부호화에서 매크로블록의 인트라 모드 결정 방법
US20090154567A1 (en) * 2007-12-13 2009-06-18 Shaw-Min Lei In-loop fidelity enhancement for video compression
JP5064305B2 (ja) * 2008-06-05 2012-10-31 株式会社日立製作所 ビットレート変換装置及び変換方法
JP5544996B2 (ja) * 2010-04-09 2014-07-09 ソニー株式会社 画像処理装置および方法
JP2013179572A (ja) * 2012-02-08 2013-09-09 Canon Inc 画像符号化装置および画像符号化方法
CN102984545B (zh) * 2012-12-12 2016-01-20 北京视博云科技有限公司 一种视频类资源的编码方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05252511A (ja) * 1992-03-06 1993-09-28 Nippon Telegr & Teleph Corp <Ntt> 画像分配装置
JPH07288814A (ja) * 1994-04-20 1995-10-31 Oki Electric Ind Co Ltd 動きベクトル検出方法
JPH0884337A (ja) * 1994-09-02 1996-03-26 Texas Instr Inc <Ti> データ処理装置及びその方法
JPH08186823A (ja) * 1994-12-28 1996-07-16 Canon Inc 符号化装置及び方法
JPH08280019A (ja) * 1994-12-19 1996-10-22 Samsung Electron Co Ltd 適応的直交変換符号化装置
JP2608909B2 (ja) * 1988-01-28 1997-05-14 富士通株式会社 動画像の予測符号化方式
JP2003319394A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
US20040213348A1 (en) * 2003-04-22 2004-10-28 Samsung Electronics Co., Ltd. Apparatus and method for determining 4X4 intra luminance prediction mode

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0533195A2 (en) * 1991-09-20 1993-03-24 Sony Corporation Picture signal encoding and/or decoding apparatus
JP3689454B2 (ja) * 1995-06-22 2005-08-31 キヤノン株式会社 画像符号化装置及び方法
DE69631999T2 (de) * 1995-06-22 2004-09-02 Canon K.K. Bildverarbeitungsgerät und Verfahren
US6728775B1 (en) * 1997-03-17 2004-04-27 Microsoft Corporation Multiple multicasting of multimedia streams
JP4163618B2 (ja) * 2001-08-28 2008-10-08 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化伝送システム、動画像符号化伝送方法、これらに用いて好適な符号化装置、復号化装置、符号化方法、復号化方法及びプログラム
US7643559B2 (en) * 2001-09-14 2010-01-05 Ntt Docomo, Inc. Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program
EP1347649A1 (en) * 2002-03-18 2003-09-24 Lg Electronics Inc. B picture mode determining method and apparatus in video coding system
JP4120301B2 (ja) * 2002-04-25 2008-07-16 ソニー株式会社 画像処理装置およびその方法
MXPA05007453A (es) * 2003-01-10 2005-09-12 Thomson Licensing Sa Toma de decision en modo rapido para codificacion inter-estructura.
CN100372382C (zh) * 2003-03-24 2008-02-27 华为技术有限公司 一种视频图象编码方法
CN100411442C (zh) * 2003-03-24 2008-08-13 华为技术有限公司 一种视频图象编码方法
KR100510137B1 (ko) * 2003-04-30 2005-08-26 삼성전자주식회사 고속 움직임 추정을 위한 참조 픽쳐 및 블록 모드 결정방법, 그 장치, 블록 모드 결정 방법 및 그 장치
US7369707B2 (en) * 2003-10-28 2008-05-06 Matsushita Electric Industrial Co., Ltd. Intra-picture prediction coding method
EP1605706A2 (en) * 2004-06-09 2005-12-14 Broadcom Corporation Advanced video coding (AVC) intra prediction scheme
KR100677118B1 (ko) * 2004-06-11 2007-02-02 삼성전자주식회사 움직임 추정 방법 및 그 장치
US8311113B2 (en) * 2004-11-12 2012-11-13 Broadcom Corporation Method and system for using motion prediction to equalize video quality across intra-coded frames

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2608909B2 (ja) * 1988-01-28 1997-05-14 富士通株式会社 動画像の予測符号化方式
JPH05252511A (ja) * 1992-03-06 1993-09-28 Nippon Telegr & Teleph Corp <Ntt> 画像分配装置
JPH07288814A (ja) * 1994-04-20 1995-10-31 Oki Electric Ind Co Ltd 動きベクトル検出方法
JPH0884337A (ja) * 1994-09-02 1996-03-26 Texas Instr Inc <Ti> データ処理装置及びその方法
JPH08280019A (ja) * 1994-12-19 1996-10-22 Samsung Electron Co Ltd 適応的直交変換符号化装置
JPH08186823A (ja) * 1994-12-28 1996-07-16 Canon Inc 符号化装置及び方法
JP2003319394A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
US20040213348A1 (en) * 2003-04-22 2004-10-28 Samsung Electronics Co., Ltd. Apparatus and method for determining 4X4 intra luminance prediction mode

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010283495A (ja) * 2009-06-03 2010-12-16 Fujitsu Ltd 動画像符号化装置及び動画像符号化方法
US9106917B2 (en) 2009-06-03 2015-08-11 Fujitsu Limited Video encoding apparatus and video encoding method
WO2012117900A1 (ja) * 2011-02-28 2012-09-07 株式会社メガチップス 符号化装置
JP2012178768A (ja) * 2011-02-28 2012-09-13 Mega Chips Corp 符号化装置

Also Published As

Publication number Publication date
CN1794816B (zh) 2010-12-22
EP1675404A2 (en) 2006-06-28
US20060133489A1 (en) 2006-06-22
CN1794816A (zh) 2006-06-28
KR100701478B1 (ko) 2007-03-29
JP4501675B2 (ja) 2010-07-14
KR20060071894A (ko) 2006-06-27
EP1675404A3 (en) 2006-07-12

Similar Documents

Publication Publication Date Title
JP4501676B2 (ja) 動画像圧縮符号化方法と動画像圧縮符号化装置並びにプログラム
JP6605063B2 (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、および、動画像符号化方法
RU2715015C1 (ru) Устройство кодирования с предсказанием видео, способ кодирования с предсказанием видео, устройство декодирования с предсказанием видео и способ декодирования с предсказанием видео
KR100701478B1 (ko) 동화상 압축 부호화 방법과 동화상 압축 부호화 장치 및프로그램
US10511851B2 (en) Image encoding and decoding method with merge flag and motion vectors
KR101473278B1 (ko) 화상 예측 부호화 장치, 화상 예측 복호 장치, 화상 예측 부호화 방법, 화상 예측 복호 방법, 화상 예측 부호화 프로그램, 및 화상 예측 복호 프로그램
CN104320666B (zh) 图像处理设备和方法
JP5488612B2 (ja) 動画像符号化装置および動画像復号装置
US9516320B2 (en) Method of generating image data
TWI722842B (zh) 影像預測解碼方法
CN102415098B (zh) 图像处理设备和方法
CN101326550A (zh) 利用预测指导的抽取搜索的运动估计
JP2005318497A (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。
US8189667B2 (en) Moving picture encoding apparatus
JP2013115583A (ja) 動画像符号化装置及びその制御方法並びにプログラム
JP2004032355A (ja) 動画像符号化方法,動画像復号方法,動画像符号化装置および動画像復号装置
JP5598199B2 (ja) 動画像符号化装置
JP2006295734A (ja) 再符号化装置、再符号化方法、および再符号化用プログラム
JP4222274B2 (ja) 符号化モード選択装置及び符号化モード選択プログラム
JP5533885B2 (ja) 動画像符号化装置および動画像復号装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100330

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100412

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140430

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees