JPWO2005076630A1 - 復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム - Google Patents

復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム Download PDF

Info

Publication number
JPWO2005076630A1
JPWO2005076630A1 JP2005517634A JP2005517634A JPWO2005076630A1 JP WO2005076630 A1 JPWO2005076630 A1 JP WO2005076630A1 JP 2005517634 A JP2005517634 A JP 2005517634A JP 2005517634 A JP2005517634 A JP 2005517634A JP WO2005076630 A1 JPWO2005076630 A1 JP WO2005076630A1
Authority
JP
Japan
Prior art keywords
frame
motion vector
additional information
interpolation
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005517634A
Other languages
English (en)
Other versions
JP4685636B2 (ja
Inventor
寿郎 笹井
寿郎 笹井
近藤 敏志
敏志 近藤
角野 眞也
眞也 角野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2005517634A priority Critical patent/JP4685636B2/ja
Publication of JPWO2005076630A1 publication Critical patent/JPWO2005076630A1/ja
Application granted granted Critical
Publication of JP4685636B2 publication Critical patent/JP4685636B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Abstract

本発明では、符号化効率を向上させつつ高精度の補間フレームの生成を行うための復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムを提供することを課題とする。復号化装置12は、復号化部70と、動きベクトル検出部79と、補間フレーム生成部80とを備えている。復号化部70は、画像信号d210を構成する画像フレームと、画像フレーム間の動きベクトルである動きベクトルMV48に基づいて画像フレームを補間する補間フレームを生成するための付加情報d231とが符号化された符号化画像信号d211を復号化する。動きベクトル検出部79は、復号化された画像フレームd260間の動きベクトルである動きベクトルMV90を検出する。補間フレーム生成部80は、動きベクトルMV90と復号化された画像フレームd259と復号化された付加情報d252とに基づいて補間フレームを生成する。

Description

本発明は、復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム、特に、補間フレームの生成を行うための復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムに関する。
テレビ、パーソナルコンピュータ(PC)、携帯電話、あるいはその他の画像信号を表示する装置において、画像信号を構成する画像フレームを補間する補間フレームを生成し、生成された補間フレームを画像フレームに内挿して表示させる技術が知られている。この技術は、低フレームレートで伝送された画像信号を滑らかに表示すること、あるいは画像信号を低ビットレートで符号化し伝送することを目的として利用されている。
前者を目的とする技術として、画像フレーム間の動きベクトルを検出し、求められた動きベクトルを用いて補間フレームを生成する技術が知られている(例えば、特許文献1参照)。
より具体的には、画像フレーム間の動きベクトルを検出し、動きベクトルを検出した画像フレーム間の時間的距離と補間フレームの補間位置の時間的距離との比により検出された動きベクトルを内分あるいは外分する。こうして導出された動きベクトル(以下、補間用動きベクトルという)と画像フレームの画素値とを用いて、補間フレームを生成する。
ここで、補間フレームの精度を高めることを目的として、補間用動きベクトルを用いた補間の精度が低い部分については、補間フレームに対応する画像信号の画素値を伝送する技術についても知られている(例えば、特許文献2参照)。
後者を目的とする技術として、動き補償符号化という技術が知られている。動き補償符号化とは、画像フレームを構成する画像ブロックの動きベクトルを用いて行われる符号化である。例えば、動画像信号圧縮の国際規格であるMPEG(Moving Picture Experts Group)では、符号化に際して、画面内符号化と画面間符号化の2つの符号化方法が用いられる。画面内符号化は、画像フレームをそのフレーム内の情報だけで符号化する方法であり、この方法で符号化された画像フレームをIフレームと呼んでいる。画面間符号化とは、画像フレームをそのフレーム内の情報と他のフレームの情報との両方を用いて符号化する方法であり、この方法で符号化された画像フレームをPフレームまたはBフレームと呼んでいる。
すなわち、後者を目的とする動き補償符号化は、補間フレーム(Bフレーム)と補間フレームに対して時間的に双方向に位置する画像フレーム(IフレームまたはPフレーム)との動きベクトルと、動きベクトルにより動き補償された画像フレームと補間フレームとの残差情報とを補間フレームを生成するための情報として符号化する技術である。復号化側では、符号化画像信号と既に復号化された画像フレームとを用いて、補間フレームの生成を行う。
特開平7−177514号公報(第5図) 特許第2828096号公報
本技術分野においては、さらに符号化効率を向上させつつ高精度の補間フレームの生成を行うことが求められている。具体的には、上記した2つの技術において、前者では、さらに高精度な補間フレームを生成することが求められており、後者では、符号化効率を向上させることが求められている。
そこで、本発明では、符号化効率を向上させつつ高精度の補間フレームの生成を行うための復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムを提供することを課題とする。
請求項1に記載の復号化装置は、復号化手段と、動きベクトル検出手段と、補間フレーム生成手段とを備えている。復号化手段は、画像信号を構成する画像フレームと、画像フレーム間の動きベクトルである第1の動きベクトルに基づいて画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する。動きベクトル検出手段は、復号化された画像フレーム間の動きベクトルである第2の動きベクトルを検出する。補間フレーム生成手段は、第2の動きベクトルと復号化された画像フレームと復号化された付加情報とに基づいて補間フレームを生成する。
復号化手段は、符号化画像信号から画像フレームと付加情報とを復号化する。付加情報は、画像フレームを補間する補間フレームを生成するための情報であって、符号化前の画像フレームについて検出された第1の動きベクトルに基づいて補間フレームを生成するための情報である。動きベクトル検出手段は、例えばブロックマッチングなどにより復号化後の画像フレーム間の第2の動きベクトルを検出する。補間フレーム生成手段は、第2の動きベクトルを第1の動きベクトルとみなし、第2の動きベクトルと画像フレームと付加情報とに基づいて補間フレームを生成する。
ここで、第1の動きベクトルとは、補間フレームに対して時間的に前方および後方に位置する画像フレーム間について、一方向あるいは双方向に検出される動きベクトルだけでなく、補間フレームに対して時間的に前方あるいは後方に位置する複数の画像フレーム間について、一方向あるいは双方向に検出される動きベクトルであってもよい(以下、この欄において同じ)。また、フレームとは、順次走査画像におけるフレームであっても、飛び越し走査画像におけるフレームまたはフィールドであってもよい(以下、この欄において同じ)。さらに、画像フレームは、符号化される際に、画面内符号化されるものであっても、画面間符号化されるものであってもよい(以下、この欄において同じ)。
本発明の復号化装置では、補間フレームを生成するために特別に必要となる情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどが符号化画像信号に含まれていなくとも、符号化効率を向上させつつ高精度の補間フレームを生成することが可能となる。
請求項2に記載の復号化装置は、請求項1に記載の復号化装置であって、付加情報は、画像フレームに対する補間フレームの補間方式と、補間フレームと補間フレームに対応する画像フレームとの残差情報と、補間フレームの画像フレームに対して検出された動きベクトルと第1の動きベクトルに基づいて導出される補間フレームの画像フレームに対する動きベクトルとのベクトル差分と、第1の動きベクトルの検出に用いられた動き検出方式とのうち少なくともいずれかを含む。
補間方式は、例えば、補間フレームの生成に用いられる第1の動きベクトルの向き、補間フレームの生成に用いられる画像フレーム、および画像フレームに対する補間位置に関する情報などである(以下、この欄において同じ)。残差情報とは、例えば、補間フレームの画素値と補間フレームの生成に用いられる画像フレームの画素値との差分などである(以下、この欄において同じ)。ベクトル差分とは、第1の動きベクトルに基づいて補間フレームの動きベクトルを導出するための情報であり、例えば、動き検出により検出される補間フレームの動きベクトルと、第1の動きベクトルを内分あるいは外分して求められる補間フレームの動きベクトルとの差分などである(以下、この欄において同じ)。動き検出方式とは、例えば、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報である(以下、この欄において同じ)。動き検出のアルゴリズムに関する情報とは、例えば、全探索、間引き探索、OAT探索、Nステップ探索、階層型探索などと呼ばれる探索方法を指定する情報である。探索範囲に関する情報とは、例えば、ブロックマッチングを行う領域に関する情報である。サブペル精度に関する情報とは、例えば、ブロックマッチングを行う精度に関する情報である。評価関数に関する情報とは、例えば、ブロックマッチングにおける評価関数であるSAD(絶対差分和)やSSD(平方差分和)などを指定する情報である。
本発明の復号化装置では、以下のいずれかの効果を実現することが可能となる。すなわち、付加情報に補間方式、ベクトル差分、あるいは動き検出方式が含まれる場合には、補間フレームの動きベクトルがより正確に生成される。さらには、補間フレームがより正確に生成される。また、付加情報に残差情報が含まれる場合には、補間フレームの画素値がより正確に生成される。
請求項3に記載の復号化装置は、請求項2に記載の復号化装置であって、付加情報は、付加情報が含む情報の組み合わせを特定するためのプロファイル情報をさらに含んでいる。
プロファイル情報は、例えば、補間方式、残差情報、ベクトル差分、あるいは動き検出方式などの情報が付加情報に含まれているか否かに関する情報であり、それぞれの情報の組み合わせに対して割り当てられた番号などにより、付加情報が含む情報の組み合わせを特定する。
本発明の復号化装置では、付加情報が含む情報の組み合わせを確実に取得することが可能となる。このため、より正確に補間フレームを生成することが可能となる。
請求項4に記載の復号化装置は、請求項2または3に記載の復号化装置であって、動き検出方式は、動き検出のパラメータの組み合わせを特定するためのコード情報として含まれている。動きベクトル検出手段は、コード情報が特定する動き検出のパラメータに基づいて、第2の動きベクトルの検出を行う。
ここで、動き検出のパラメータとは、例えば、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報それぞれについての内容である。コード情報は、例えば、動き検出のパラメータの組み合わせに対して割り当てられた番号などにより、動き検出のパラメータの組み合わせを特定する。
動きベクトル検出手段は、取得されたコード情報により動き検出方式を特定し、特定された動き検出方式により第2の動きベクトルの検出を行う。
本発明の復号化装置では、動き検出方法がコード情報としてまとめられて符号化される。このため、符号化効率をより高めつつ高精度の補間フレームの生成が可能となる。
請求項5に記載の復号化装置は、請求項2〜4のいずれか1項に記載の復号化装置であって、動きベクトル検出手段は、付加情報が含む動き検出方式を実行できない場合には、付加情報が含む動き検出方式に応じて定められた所定の動き検出方式により第2の動きベクトルを検出する。
動きベクトル検出手段は、例えば、付加情報が含む動き検出方式が動きベクトル検出手段では実行できない動き検出のアルゴリズムを指定する場合、指定されたアルゴリズムに応じて定められた他のアルゴリズムにより動き検出を実行する。
本発明の復号化装置では、第1の動きベクトルの検出に用いられた動き検出方式を実行できない場合であっても、異なる動き検出方式を用いて第2の動きベクトルを検出することが可能となる。また、第1の動きベクトルの検出に用いられた動き検出方式とできるだけ近い特性の動き検出方式を用いることにより、第1の動きベクトルに近い動きベクトルを検出することが可能となる。
請求項6に記載の復号化装置は、請求項2〜5のいずれか1項に記載の復号化装置であって、付加情報は、補間フレーム毎に作成されている情報である。
本発明の復号化装置では、補間フレーム毎に付加情報が作成されている。このため、より高精度な補間フレームを生成することが可能となる。
請求項7に記載の復号化装置は、請求項2〜5のいずれか1項に記載の復号化装置であって、付加情報のうち、動き検出方式は、符号化画像信号のストリーム毎に作成されている情報である。
本発明の復号化装置では、動き検出方式はストリーム毎に作成されている。このため、より符号化効率を向上させることが可能となる。
請求項8に記載の復号化装置は、請求項1〜7のいずれか1項に記載の復号化装置であって、補間フレーム生成手段は、符号化画像信号に付加情報が含まれていない場合に、復号化した画像フレームに基づいて補間フレームの生成を行う。
補間フレーム生成手段では、画像信号を画面内符号化と画面間符号化とのみにより符号化した符号化画像信号が取得される場合、復号化した画像フレームを用いて、補間フレームの生成が行われる。補間フレームの生成は、例えば、画像フレーム間の動きベクトルを検出し補間フレームの動きベクトルを求め補間フレームを生成する方法や、画面間符号化された画像フレームの動きベクトルを用いて補間フレームの動きベクトルを求め補間フレームを生成する方法などにより行われる。
本発明の復号化装置では、付加情報を含まない符号化画像信号を取得した場合にも補間フレームを生成することが可能となる。すなわち、従来法との互換性が保たれている。
請求項9に記載の符号化装置は、第1の動きベクトル検出手段と、付加情報作成手段と、符号化手段とを備えている。第1の動きベクトル検出手段は、画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する。付加情報作成手段は、画像フレームを補間する補間フレームを第1の動きベクトルに基づいて生成するための付加情報を作成する。符号化手段は、画像フレームと付加情報とを符号化する。
第1の動きベクトル検出手段は、例えば、ブロックマッチングなどにより画像フレーム間の第1の動きベクトルを検出する。付加情報作成手段は、第1の動きベクトルに基づいて補間フレームを生成するための情報である付加情報を作成する。符号化手段は、画像フレームと付加情報とを符号化する。ここで、画像フレームの符号化は、画面内符号化あるいは画面間符号化などにより行われる。
本発明の符号化装置では、補間フレームを生成するために特別に符号化する情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどを符号化することなく、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
請求項10に記載の符号化装置は、請求項9に記載の符号化装置であって、付加情報は、画像フレームに対する補間フレームの補間方式と、補間フレームと補間フレームに対応する画像フレームとの残差情報と、補間フレームの画像フレームに対して検出された動きベクトルと第1の動きベクトルに基づいて導出される補間フレームの画像フレームに対する動きベクトルとのベクトル差分と、第1の動きベクトルの検出に用いられた動き検出方式とのうち少なくともいずれかを含む。
本発明の符号化装置により、以下のいずれかの効果が実現される。すなわち、付加情報に補間方式、ベクトル差分、あるいは動き検出方式が含まれる場合には、補間フレームの動きベクトルのより正確な生成が可能となる。さらには、補間フレームのより正確な生成が可能となる。また、付加情報に残差情報が含まれる場合には、補間フレームの画素値のより正確な生成が可能となる。
請求項11に記載の符号化装置は、請求項10に記載の符号化装置であって、付加情報は、付加情報が含む情報の組み合わせを特定するためのプロファイル情報をさらに含んでいる。
プロファイル情報は、例えば、補間方式、残差情報、ベクトル差分、あるいは動き検出方式などの情報が付加情報に含まれているか否かに関する情報であり、それぞれの情報の組み合わせに対して割り当てられた番号などにより、付加情報が含む情報の組み合わせを特定する。
本発明の符号化装置では、付加情報が含む情報の組み合わせを確実に符号化することが可能となる。このため、補間フレームのより正確な生成が可能となる。
請求項12に記載の符号化装置は、請求項10または11に記載の符号化装置であって、動き検出方式は、動き検出のパラメータの組み合わせを特定するためのコード情報として含まれている。
ここで、動き検出のパラメータとは、例えば、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報それぞれについての内容である。コード情報は、例えば、動き検出のパラメータの組み合わせに対して割り当てられた番号などにより、動き検出のパラメータの組み合わせを特定する。
本発明の符号化装置では、動き検出方法がコード情報としてまとめられて符号化される。このため、符号化効率のさらなる向上と高精度の補間フレームの生成とが可能となる。
請求項13に記載の符号化装置は、請求項10〜12のいずれか1項に記載の符号化装置であって、付加情報は、補間フレーム毎に作成される情報である。
本発明の符号化装置では、補間フレーム毎に付加情報が作成されている。このため、より高精度の補間フレームの生成が可能となる。
請求項14に記載の符号化装置は、請求項10〜12のいずれか1項に記載の符号化装置であって、動き検出方式は、画像信号のストリームのヘッダ情報として含まれている。
本発明の符号化装置では、動き検出方式はストリーム毎に作成されている。
請求項15に記載の符号化装置は、請求項11に記載の符号化装置であって、プロファイル情報は、画像信号のストリームのヘッダ情報として含まれている。
本発明の符号化装置では、プロファイル情報はストリーム毎に作成されている。
請求項16に記載の符号化装置は、請求項9〜15のいずれか1項に記載の符号化装置であって、符号化手段は、画像フレームに基づいて生成される補間フレームと補間フレームに対応する画像信号との残差が小さい場合には、付加情報の符号化を行わない。
符号化手段は、画像フレームに基づいて高精度の補間フレームの生成が行われる場合には、付加情報の符号化を行わない。補間フレームの生成は、例えば、画像フレーム間の動きベクトルを検出し補間フレームの動きベクトルを求め補間フレームを生成する方法や、画面間符号化される画像クレームの動きベクトルを用いて補間フレームの動きベクトルを求め補間フレームを生成する方法などにより行われる。
本発明の符号化装置では、符号化効率のさらなる向上と高精度の補間フレームの生成とが可能となる。
請求項17に記載の補間フレーム生成システムは、画像信号を構成する画像フレームを補間する補間フレームを生成する補間フレーム生成システムであって、第1の動きベクトル検出手段と、付加情報作成手段と、符号化手段と、復号化手段と、第2の動きベクトル検出手段と、補間フレーム生成手段とを備えている。第1の動きベクトル検出手段は、画像フレーム間の動きベクトルである第1の動きベクトルを検出する付加情報作成手段は、第1の動きベクトルに基づいて補間フレームを生成するための付加情報を作成する。符号化手段は、画像フレームと付加情報とを符号化する。復号化手段は、符号化された画像フレームと付加情報とを復号化する。第2の動きベクトル検出手段は、復号化された画像フレーム間の動きベクトルである第2の動きベクトルを検出する。補間フレーム生成手段は、第2の動きベクトルと復号化された画像フレームと復号化された付加情報とに基づいて補間フレームを生成する。
本発明の補間フレーム生成システムでは、補間フレームを生成するために特別に必要となる情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどが符号化されていなくとも、符号化効率を向上させつつ高精度の補間フレームを生成することが可能となる。
請求項18に記載の集積回路装置は、復号化部と、動きベクトル検出部と、補間フレーム生成部とを備えている。復号化部は、画像信号を構成する画像フレームと、画像フレーム間の動きベクトルである第1の動きベクトルに基づいて画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する。動きベクトル検出部は、復号化された画像フレーム間の動きベクトルである第2の動きベクトルを検出する。補間フレーム生成部は、第2の動きベクトルと復号化された画像フレームと復号化された付加情報とに基づいて補間フレームを生成する。
本発明の集積回路装置では、補間フレームを生成するために特別に必要となる情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどが符号化画像信号に含まれていなくとも、符号化効率を向上させつつ高精度の補間フレームを生成することが可能となる。
請求項19に記載の集積回路装置は、第1の動きベクトル検出部と、付加情報作成部と、符号化部とを備えている。第1の動きベクトル検出部は、画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する。付加情報作成部は、画像フレームを補間する補間フレームを第1の動きベクトルに基づいて生成するための付加情報を作成する。符号化部は、画像フレームと付加情報とを符号化する。
本発明の集積回路装置では、補間フレームを生成するために特別に符号化する情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどを符号化することなく、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
請求項20に記載の復号化プログラムは、復号化ステップと、動きベクトル検出ステップと、補間フレーム生成ステップとを備える復号化方法をコンピュータに行わせるための復号化プログラムである。復号化ステップは、画像信号を構成する画像フレームと、画像フレーム間の動きベクトルである第1の動きベクトルに基づいて画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する。動きベクトル検出ステップは、復号化された画像フレーム間の動きベクトルである第2の動きベクトルを検出する。補間フレーム生成ステップは、第2の動きベクトルと復号化された画像フレームと復号化された付加情報とに基づいて補間フレームを生成する。
本発明の復号化プログラムでは、補間フレームを生成するために特別に必要となる情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどが符号化画像信号に含まれていなくとも、符号化効率を向上させつつ高精度の補間フレームを生成することが可能となる。
請求項21に記載の符号化プログラムは、第1の動きベクトル検出ステップと、付加情報作成ステップと、符号化ステップとを備える符号化方法をコンピュータに行わせるための符号化プログラムである。第1の動きベクトル検出ステップは、画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する。付加情報作成ステップは、画像フレームを補間する補間フレームを第1の動きベクトルに基づいて生成するための付加情報を作成する。符号化ステップは、画像フレームと付加情報とを符号化する。
本発明の符号化プログラムでは、補間フレームを生成するために特別に符号化する情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどを符号化することなく、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
本発明により、符号化効率を向上させつつ高精度の補間フレームの生成を行うための復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムを提供することが可能となる。
補間フレーム生成システム10の概要を説明するブロック図 符号化装置11の構成について説明するブロック図 画像信号d210を構成する画像フレームについて説明する説明図 BフレームB42の符号化について説明する説明図 付加情報作成方法について説明するフローチャート 復号化装置12の構成について説明するブロック図 BフレームB42の復号化について説明する説明図 補間フレーム生成方法について説明するフローチャート 補間用動きベクトルの導出方法の変形例について説明する説明図 付加情報d21が含む動き検出方式のパラメータの組み合わせを特定するためのテーブル110 付加情報d231が含む情報の組み合わせを特定するためのテーブル115 付加情報d252が指定する動き検出のアルゴリズム120と、動きベクトル検出部79で実行される動き検出のアルゴリズム121との対応関係 コンテンツ供給システムの全体構成について説明するブロック図 本発明の補間フレーム作成装置を搭載する携帯電話の例 携帯電話の構成について説明するブロック図 ディジタル放送用システムの例
符号の説明
10 補間フレーム生成システム
11 符号化装置
12 復号化装置
17 動き補償部
18 付加情報作成部
30 フレームメモリ
31 動きベクトル検出部
70 復号化部
71 フレーム出力部
79 動きベクトル検出部
80 補間フレーム生成部
MV 動きベクトル
CMV 補間用動きベクトル
[第1実施形態]
〈補間フレーム生成システム10の構成〉
図1〜図12を用いて、本発明の第1実施形態としての補間フレーム生成システム、符号化装置および復号化装置について説明する。
図1は、補間フレーム生成システム10の概要を説明するブロック図である。補間フレーム生成システム10は、画像信号d210を入力とし符号化された符号化画像信号d211を出力とする符号化装置11と、符号化画像信号d211を入力とし復号化された復号化画像信号d212を出力とする復号化装置12とを備えている。符号化装置11は、画像信号d210を提供する提供者側に設置され、インターネットや電話回線などの通信網もしくは地上波放送、ケーブルテレビあるいは衛星放送などの放送網などを介して復号化装置12と接続されている。復号化装置12は、符号化画像信号d211を受信する受信者側に設置される。復号化装置12は、主にコンピュータ、携帯電話、PDA、デジタルテレビ、デジタルテレビのセットアップボックスあるいはカーナビゲーションシステムなどの画像を取り扱う機器において備えられる。
補間フレーム生成システム10は、画像信号d210をできるだけ低ビットレートで、すなわち符号化効率を向上させて伝送すること、および画像信号d210をできるだけ高画質で伝送することを目的とするシステムである。より具体的には、画像信号d210をフレーム毎に画面内符号化あるいは画面間符号化する際に、一部のフレーム(例えば、Bフレームなど)については、動きベクトルの伝送を行わない。これにより符号化効率を向上させるとともに、一部のフレーム(例えば、Bフレームなど)の復号化に必要な情報を付加情報として伝送し、復号化画像信号d212を高画質化する。
以下、図2〜図8を用いて、補間フレーム生成システム10に備えられる符号化装置11および復号化装置12について詳細な説明を加える。
〈符号化装置11〉
(符号化装置11の構成)
図2は、符号化装置11の構成について説明するブロック図である。符号化装置11は、画像信号d210を直交変換と量子化を含む方法で符号化し、符号化画像信号d211を出力する装置である。図2では、MPEGなどで用いられる画面内符号化あるいは画面間符号化により画像信号d210を符号化する場合の符号化装置11について説明している。
符号化装置11は、画像信号d210を動き補償符号化し符号化画像信号d211を出力する装置であって、符号化部16と、動き補償部17と、付加情報作成部18とを備えている。
符号化部16は、減算部20と、スイッチ21と、直交変換部22と、量子化部23と、可変長符号化部24と、逆量子化部25と、逆直交変換部26と、加算部27とを備えている。
減算部20は、画像信号d210を第1の入力、動き補償された画像信号d225を第2の入力とし、第1の入力と第2の入力との差分である減算信号d220を出力する。スイッチ21は、減算信号d220の出力先を切り換えるスイッチであり、直交変換部22あるいは付加情報作成部18に接続される。直交変換部22は、スイッチ21の出力である減算信号d220を入力とし、減算信号d220を直交変換したDCT係数d221を出力する。量子化部23は、DCT係数d221を入力とし、DCT係数d221を量子化した量子化DCT係数d222を出力とする。可変長符号化部24は、量子化DCT係数d222を第1の入力、付加情報作成部18の作成した付加情報d231を第2の入力とし、動き補償部17から取得される動きベクトルや符号化モードとあわせて可変長符号化した符号化画像信号d211を出力とする。逆量子化部25は、量子化DCT係数d222を入力とし、量子化DCT係数d222を逆量子化した逆量子化DCT係数d223を出力とする。逆直交変換部26は、逆量子化DCT係数d223を入力とし、逆量子化DCT係数d223を逆直交変換した逆直交変換信号d224を出力とする。加算部27は、逆直交変換信号d224を第1の入力、動き補償された画像信号d225を第2の入力とし、第1の入力と第2の入力とを加算した局所復号化信号d226を出力とする。
動き補償部17は、フレームメモリ30と、動きベクトル検出部31とを備えており、画像信号d210を第1の入力、局所復号化信号d226を第2の入力とし、動き補償された画像信号d225を第1の出力、検出された動きベクトルd228を第2の出力とする。
フレームメモリ30は、局所復号化信号d226を第1の入力、動きベクトル検出部31の検出した動きベクトルd228を第2の入力とし、動きベクトルd228で動き補償された動き補償された画像信号d225を第1の出力、フレームメモリ30に記憶された局所復号化信号d227を第2の出力とする。動きベクトル検出部31は、画像信号d210を第1の入力、フレームメモリ30に記憶された局所復号化信号d227を第2の入力とし、動きベクトルd228を出力とする。
付加情報作成部18は、スイッチ21の出力である減算信号d220を第1の入力、動きベクトルd228を第2の入力とし、付加情報d231を出力とする。
可変長符号化部24は、付加情報d231を、量子化DCT係数d222、動き補償部17から取得される動きベクトルや符号化モードなどとあわせて可変長符号化する。この時、付加情報d231が付加される場合には、可変長符号化される符号列に付加情報d231が付加されていることを示す判別情報が含められてもよい。
なお、上記した各部は、LSIなどの集積回路として、独立にあるいは一体的に構成されている。また、フレームメモリ30は、DRAM、SRAMなどの記憶装置である。
(符号化装置11の作用)
図3と図4とを用いて、画像信号d210を構成する画像フレーム(IフレームI41、BフレームB42,B43、PフレームP44(図3(a)参照))を符号化する場合の符号化装置11の動作について説明する。なお、本発明は、BフレームB42,B43を符号化する場合に特徴を有している。
《IフレームI41、PフレームP44の符号化》
IフレームI41を符号化する場合、減算部20は、減算処理を行わない。また、スイッチ21は、直交変換部22側を向く。これにより、画像信号d210を構成するIフレームI41は、直交変換部22により直交変換され、量子化部23により量子化され、可変長符号化部24により可変長符号化され、符号化画像信号d211として出力される。さらに、量子化されたIフレームI41は、ローカルデコードされフレームメモリ30に記憶される。
PフレームP44を符号化する場合について、図3(b)を用いて説明する。PフレームP44を符号化する場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41との動きベクトルMV46を検出する。さらに、検出された動きベクトルMV46により動き補償された画像信号d225を導出する。減算部20は、画像信号d210と動き補償された画像信号d225との減算処理を行い、減算信号d220を出力する。スイッチ21は、直交変換部22側を向く。これにより、減算信号d220は、直交変換部22により直交変換され、量子化部23により量子化され、可変長符号化部24により可変長符号化され、検出された動きベクトルMV46とともに符号化画像信号d211として出力される。さらに、量子化されたPフレームP44は、ローカルデコードされフレームメモリ30に記憶される。
《BフレームB42の符号化》
BフレームB42を符号化する場合について、図4を用いて説明する。なお、BフレームB43を符号化する場合については同様であり、説明を省略する。
(1)
BフレームB42を符号化する場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41とPフレームP44との動きベクトルを検出する(図4(a)参照)。より具体的には、BフレームB42のブロックb51の符号化に際して、ブロックb51と同じ位置にあるPフレームP44のブロックb53のブロックマッチングをIフレームI41に対して行う。これにより、IフレームI41のブロックb52に対する動きベクトルMV48が検出される。検出された動きベクトルMV48は、動きベクトル検出部31から動きベクトルd228として付加情報作成部18に出力される。同様の処理により、BフレームB42の全てのブロックについて動きベクトルが出力される。
フレームメモリ30は、検出された動きベクトルMV48を用いて、動き補償されたBフレームB42を生成する。より具体的には、画像信号d210におけるIフレームI41とPフレームP44との時間的距離に対する画像信号d210におけるIフレームI41とBフレームB42との時間的距離の割合で動きベクトルMV48を内分し、IフレームI41のブロックb54に対するブロックb51の補間用動きベクトルCMV49を導出する。また、画像信号d210におけるIフレームI41とPフレームP44との時間的距離に対する画像信号d210におけるPフレームP44とBフレームB42との時間的距離の割合で動きベクトルMV48を内分し、PフレームP44のブロックb55に対するブロックb51の補間用動きベクトルCMV50を導出する。さらに、動き補償されたBフレームB42におけるブロックb51に対応する画素値として、ブロックb54とブロックb55の画素値を平均した値が出力される。ブロックb54とブロックb55の画素値を平均した値は、フレームメモリ30から、動き補償された画像信号d225として出力される。同様の処理により、BフレームB42の全てのブロックについて動き補償された画素値が出力される。
減算部20は、画像信号d210と動き補償された画像信号d225とを減算処理し、減算信号d220を出力する。スイッチ21は、付加情報作成部18側を向き、減算信号d220は、付加情報作成部18に入力される。
付加情報作成部18は、入力された減算信号d220の大きさに応じて、付加情報d231の作成を行う。より具体的には、減算信号d220の大きさが[0]あるいは所定の閾値より小さい場合には、付加情報作成部18は、BフレームB42の補間方式と、動きベクトルMV48の動き検出方式とを付加情報d231として作成する。作成された付加情報d231は、可変長符号化部24において、PフレームP44についての量子化DCT係数d222の後に符号化される。
ここで、補間方式とは、BフレームB42の生成に用いられる動きベクトルMV48の向き、BフレームB42の生成に用いられるIフレームI41およびPフレームP44を特定する情報およびBフレームB42の補間位置に関する情報などである。
また、動き検出方式とは、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報である。動き検出のアルゴリズムに関する情報とは、全探索、間引き探索、OAT探索、Nステップ探索、階層型探索などと呼ばれる探索方法を指定する情報である。探索範囲に関する情報とは、ブロックマッチングを行う画素領域(±8画素、±16画素、±32画素、±64画素など)に関する情報である。サブペル精度に関する情報とは、ブロックマッチングを行う画素精度(整数画素単位、1/2画素単位、1/4画素単位、1/8画素単位など)に関する情報である。評価関数に関する情報とは、ブロックマッチングにおける評価関数であるSAD(絶対差分和)やSSD(平方差分和)などを指定する情報である。
(2)
一方、減算信号d220の大きさが所定の閾値より大きい場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41とPフレームP44とに対する画像信号d210におけるBフレームB42の動きベクトルを検出する(図4(b)参照)。より具体的には、画像信号d210におけるBフレームB42のブロックb51の符号化に際して、ブロックb51の双方向へのブロックマッチングを行い、IフレームI41のブロックb61に対する動きベクトルMV63とPフレームP44のブロックb62に対する動きベクトルMV64とが検出される。検出された動きベクトルMV63とMV64とは、動きベクトル検出部31から動きベクトルd228として付加情報作成部18に出力される。同様の処理により、BフレームB42の全てのブロックについて動きベクトルが出力される。
さらに、フレームメモリ30は、検出された動きベクトルMV63とMV64とを用いて動き補償されたBフレームB42を作成する。より具体的には、動き補償されたBフレームB42のブロックb51に対応する画素値として、ブロックb61とブロックb62の画素値を平均した値が出力される。ブロックb61とブロックb62の画素値を平均した値は、フレームメモリ30から、動き補償された画像信号d225として出力される。同様の処理により、BフレームB42の全てのブロックについて動き補償された画素値が出力される。
減算部20は、画像信号d210を構成するBフレームB42と動き補償された画像信号d225(動きベクトルMV63、MV64により動き補償されたBフレームB42)とを減算処理し、減算信号d220を出力する。スイッチ21は、付加情報作成部18側を向き、減算信号d220は、付加情報作成部18に入力される。
付加情報作成部18は、上記した補間方式と動き検出方式とに加えて、残差情報とベクトル差分とを付加情報d231として作成する。作成された付加情報d231は、可変長符号化部24において、PフレームP44についての量子化DCT係数d222の後に符号化される。
ここで、残差情報とは、減算信号d220の値である。また、ベクトル差分とは、動きベクトルMV48に基づいて、BフレームB42の動きベクトルMV63とMV64とを導出するための情報であり、具体的には、動きベクトルMV63と補間用動きベクトルCMV49とのベクトル差分および動きベクトルMV64と補間用動きベクトルCMV50とのベクトル差分のことである(図4(c)参照)。
(方法・プログラム)
図5に、符号化装置11における付加情報作成方法について説明するフローチャートを示す。なお、詳しい内容は、上記と同様であり、説明を省略する。また、この付加情報作成方法は、全てあるいは一部の動作をプログラムとして実行可能である。
画像信号d210におけるBフレームB42を符号化する場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41とPフレームP44との動きベクトルを検出する(ステップS401)。さらに、フレームメモリ30は、検出された動きベクトルを用いて、動き補償されたBフレームB42を作成する(ステップS402)。減算部20は、画像信号d210に含まれるBフレームB42と動き補償されたBフレームB42とを減算処理し減算信号d220を出力する(ステップS403)。
付加情報作成部18は、減算信号d220の大きさに応じて、付加情報d231の作成を行う。
減算信号d220の大きさが[0]あるいは所定の閾値より小さい場合には、付加情報作成部18は、BフレームB42の補間方式と、動きベクトルMV48の動き検出方式とを付加情報d231として作成する(ステップS404,S405)。
減算信号d220の大きさが所定の閾値より大きい場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41とPフレームP44とに対する画像信号d210におけるBフレームB42の動きベクトルを検出する(ステップS406)。フレームメモリ30は、検出された動きベクトルを用いて、動き補償されたBフレームB42を作成する(ステップS407)。減算部20は、画像信号d210に含まれるBフレームB42と動き補償されたBフレームB42とを減算処理し、減算信号d220を出力する(ステップS408)。
付加情報作成部18は、補間方式と動き検出方式とに加えて、残差情報とベクトル差分とを付加情報d231として作成する(ステップS409)。ここで、残差情報とは、ステップS408で出力された減算信号d220の値である。また、ベクトル差分とは、ステップS406で検出された動きベクトルと、ステップS401で検出された動きベクトルから作成された補間用動きベクトルとの差分である。
〈復号化装置12〉
(復号化装置12の構成)
図6は、復号化装置12の構成について説明するブロック図である。復号化装置12は、画像信号d210を直交変換と量子化を含む方法で符号化した符号化画像信号d211を復号化し、復号化画像信号d212を出力する装置である。復号化装置12は、復号化部70と、フレーム出力部71とを備えている。
復号化部70は、動き補償符号化された符号化画像信号d211を入力とし、画像フレームd258〜d260を第1〜第3の出力、付加情報d252を第4の出力とする。復号化部70は、可変長復号化部72と、逆量子化部73と、逆直交変換部74と、加算部75と、フレームメモリ76と、動き補償部77とを備えている。
可変長復号化部72は、符号化画像信号d211を第1の入力とし、符号化画像信号d211を復号化することにより、量子化DCT係数d250を第1の出力、復号化動きベクトルd251を第2の出力、付加情報d252を第3の出力とする。逆量子化部73は、量子化DCT係数d250を入力とし、量子化DCT係数d250を逆量子化した逆量子化DCT係数d253を出力とする。逆直交変換部74は、逆量子化DCT係数d253を入力とし、逆量子化DCT係数d253を逆直交変換した逆直交変換信号d254を出力とする。加算部75は、逆直交変換信号d254を第1の入力、動き補償された画像フレームd255を第2の入力とし、第1の入力と第2の入力とを加算した加算信号d256を出力とする。フレームメモリ76は、加算信号d256を入力とし、画像フレームd257〜d260を第1〜第4の出力とする。動き補償部77は、復号化動きベクトルd251を第1の入力、画像フレームd257を第2の入力とし、動き補償された画像フレームd255を出力とする。
フレーム出力部71は、画像フレームd258〜d260を第1〜第3の入力とし、付加情報を第4の入力とし、復号化画像信号d212を出力とする。フレーム出力部71は、動きベクトル検出部79と、補間フレーム生成部80と、スイッチ81とを備えている。
動きベクトル検出部79は、画像フレームd260を第1の入力、付加情報d252を第2の入力とし、画像フレームd260間に検出された動きベクトルd265を出力とする。補間フレーム生成部80は、画像フレームd259を第1の入力、動きベクトルd265を第2の入力、付加情報d252を第3の入力とし、補間フレームd268を出力とする。スイッチ81は、画像フレームd258を第1の入力、補間フレームd268を第2の入力とし、それぞれの入力を切り換えて復号化画像信号d212を出力する。
なお、上記した各部は、LSIなどの集積回路として、独立にあるいは一体的に構成されている。また、フレームメモリ76は、DRAM、SRAMなどの記憶装置である。
(復号化装置12の作用)
画像信号d210を構成する画像フレーム(IフレームI41、BフレームB42,B43、PフレームP44(図3(a)参照))が符号化された符号化画像信号d211を復号化する場合の復号化装置12の動作について説明する。なお、本発明は、BフレームB42,B43を復号化する場合に特徴を有している。
《IフレームI41、PフレームP44の復号化》
IフレームI41を復号化する場合、符号化画像信号d211は、可変長復号化部72により可変長復号化され、逆量子化部73により逆量子化され、逆直交変換部74により逆直交変換され、逆直交変換信号d254が出力される。また、加算部75は、加算処理を行わない。これにより、フレームメモリ76には、復号化されたIフレームI41が記憶される。スイッチ81は、IフレームI41を出力するタイミングでフレームメモリ76側を向く。これにより、IフレームI41が復号化画像信号d212として出力される。
PフレームP44を復号化する場合、符号化画像信号d211は、可変長復号化部72により可変長復号化され、逆量子化部73により逆量子化され、逆直交変換部74により逆直交変換され、逆直交変換信号d254が出力される。また、動き補償部77は、可変長復号化部72より取得された復号化動きベクトルd251と、フレームメモリ76に記憶されたIフレームI41とを用いて、動き補償された画像フレームd255(動き補償されたPフレームP44)を出力する。加算部75は、逆直交変換信号d254と動き補償された画像フレームd255とを加算する。これにより、フレームメモリ76には、復号化されたPフレームP44が記憶される。スイッチ81は、PフレームP44を出力するタイミングでフレームメモリ76側を向く。これにより、PフレームP44が復号化画像信号d212として出力される。
《BフレームB42の復号化》
BフレームB42を復号化する場合について、図7を用いて説明する。なお、BフレームB43を復号化する場合については同様であり、説明を省略する。
(1)
復号化部70は、符号化画像信号d211が付加情報d252を含んでいない場合には、従来のBフレームと同様の符号化が行われていると判断する。すなわち、符号化画像信号d211は、可変長復号化部72により可変長復号化され、逆量子化部73により逆量子化され、逆直交変換部74により逆直交変換され、逆直交変換信号d254が出力される。また、動き補償部77は、可変長復号化部72より取得された復号化動きベクトルd251とフレームメモリ76に記憶されたIフレームI41またはPフレームP44とを用いて、動き補償された画像フレームd255(動き補償されたBフレームB42)を出力する。加算部75は、逆直交変換信号d254と動き補償された画像フレームd255とを加算する。これにより、フレームメモリ76には、復号化されたBフレームB42が記憶される。スイッチ81は、BフレームB42を出力するタイミングでフレームメモリ76側を向く。これにより、BフレームB42が復号化画像信号d212として出力される。
(2)
一方、符号化画像信号d211が付加情報d252を含んでいる場合には、フレーム出力部71においてBフレームB42の生成が行われる。以下、具体的に説明する。
なお、符号化画像信号d211が付加情報d252を含んでいることは、付加情報d252の有無で判断してもよいが、可変長復号化される符号化画像信号d211が判別情報を含んでいるか否かで判断してもよい。ここで、判別情報とは、符号化画像信号d211に付加情報d231が付加されているか否かを示すものであり、例えば、フラグなどであっても良い。
(2−1)
動きベクトル検出部79は、付加情報d252が含む補間方式および動き検出方式を取得し、動きベクトルの検出を行う。
ここで、補間方式とは、BフレームB42の生成に用いられる動きベクトルの向き、BフレームB42の生成に用いられるIフレームI41およびPフレームP44を特定する情報およびBフレームB42の補間位置に関する情報などである。
また、動き検出方式とは、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報である。動き検出のアルゴリズムに関する情報とは、全探索、間引き探索、OAT探索、Nステップ探索、階層型探索などと呼ばれる探索方法を指定する情報である。探索範囲に関する情報とは、ブロックマッチングを行う領域に関する情報である。サブペル精度に関する情報とは、ブロックマッチングを行う精度に関する情報である。評価関数に関する情報とは、ブロックマッチングにおける評価関数であるSAD(絶対差分和)やSSD(平方差分和)などを指定する情報である。
図7(a)を用いて、動きベクトル検出部79の動作についてさらに詳しく説明する。BフレームB42のブロックb51を復号化する場合、動きベクトル検出部79は、補間方式が指定する画像フレーム間の動きベクトルであって、ブロックb51に対応する位置のブロックの動きベクトルを検出する。図7(a)は、補間方式として、BフレームB42の生成に用いられる動きベクトルは、PフレームP44からIフレームI41への動きベクトルである、という情報が含まれている場合に検出される動きベクトルMV90について示している。この場合、動きベクトル検出部79は、フレームメモリ76に記憶されているPフレームP44のブロックb53からIフレームI41のブロックb91への動きベクトルMV90を検出する。この際、動きベクトル検出部79は、付加情報d252が含む動き検出方式により動きベクトルMV90の検出を行う。
(2−2)
補間フレーム生成部80は、付加情報d252が含む補間方式、残差情報およびベクトル差分を取得し、BフレームB42の生成を行う。
ここで、残差情報とは、符号化装置11(図2参照)において、画像信号d210が含むBフレームB42と動き補償されたBフレームB42とを減算処理した減算信号d220の値である。ベクトル差分とは、具体的には、動きベクトルMV63と補間用動きベクトルCMV49とのベクトル差分および動きベクトルMV64と補間用動きベクトルCMV50とのベクトル差分のことである(図4(c)参照)。
図7(b)および(c)を用いて、補間フレーム生成部80の動作についてさらに詳しく説明する。補間フレーム生成部80は、動きベクトル検出部79が検出した動きベクトルMV90を補間方式が含むBフレームB42の補間位置により内分し、BフレームB42からIフレームI41への補間用動きベクトルCMV93と、BフレームB42からPフレームP44への補間用動きベクトルCMV95とを導出する(図7(b)参照)。
導出された補間用動きベクトルCMV93に対して、動きベクトルMV63と補間用動きベクトルCMV49とのベクトル差分を加算し、BフレームB42からIフレームI41への動きベクトルMV97が作成される(図7(c)参照)。また同様に、導出された補間用動きベクトルCMV95に対して、動きベクトルMV64と補間用動きベクトルCMV50とのベクトル差分を加算し、BフレームB42からPフレームP44への動きベクトルMV99が作成される(図7(c)参照)。
さらに、作成された動きベクトルMV97とMV99とを用いて、動き補償されたBフレームB42を作成する。より具体的には、動き補償されたBフレームB42のブロックb51に対応する画素値として、ブロックb51を動きベクトルMV97で移動させた先のブロックb101とブロックb51を動きベクトルMV99で移動させた先のブロックb103との画素値を平均した値が計算される。補間フレーム生成部80は、ブロックb101とブロックb103との画素値をフレームメモリ76からの出力である画像フレームd259により取得する。
さらに、補間フレーム生成部80は、付加情報d252が残差情報を含む場合、動き補償されたBフレームB42の値に残差情報の値を加算し、復号化されたBフレームB42を出力する。復号化されたBフレームB42は、補間フレームd268として補間フレーム生成部80から出力される。
スイッチ81は、BフレームB42を出力するタイミングで補間フレーム生成部80側を向く。これにより、BフレームB42が復号化画像信号d212として出力される。
(方法・プログラム)
図8に復号化装置12における補間フレーム生成方法について説明するフローチャートを示す。なお、詳しい内容は、上記と同様であり、説明を省略する。また、この補間フレーム生成方法は、全てあるいは一部の動作をプログラムとして実行可能である。
復号化部70は、符号化画像信号d211が付加情報d252を含まない場合、画面内符号化されたIフレーム、画面間符号化されたPフレームあるいはBフレームの復号化を行う(ステップS431、ステップS432)。
符号化画像信号d211が付加情報d252を含む場合、フレーム出力部71によるBフレームB42(図7(a)参照)の復号化が行われる(ステップS433〜S439)。
付加情報d252が含む補間方式および動き検出方式に基づいて、フレームメモリ76に記憶されている画像フレームについて動きベクトルが検出される(ステップS433)。また、付加情報d252が含む補間方式に基づいて、ステップS433で検出された動きベクトルから補間用動きベクトルが導出される(ステップS434)。補間フレーム生成部80は、付加情報d252がベクトル差分を含むか否かを判定し(ステップS435)、ベクトル差分を含む場合には、補間用動きベクトルに対してベクトル差分を加算して、BフレームB42からIフレームI41またはPフレームP44への動きベクトルを作成する(ステップS436)。ベクトル差分を含まない場合には、導出された補間用動きベクトルを作成された動きベクトルとみなす。
補間フレーム生成部80は、作成された動きベクトルを用いて、動き補償されたBフレームB42を作成する(ステップS437)。補間フレーム生成部80は、付加情報d252が残差情報を含むか否かを判定し(ステップS438)、残差情報を含む場合には、動き補償されたBフレームB42に対して残差情報を適用して(ステップS439)、復号化されたBフレームB42を出力する。残差情報を含まない場合には、ステップS437で作成された動き補償されたBフレームB42を復号化されたBフレームB42とみなす。
〈補間フレーム生成システム10の効果〉
(符号化装置11の効果)
《1》
本発明の符号化装置11では、BフレームB42を生成するために特別に符号化する情報は付加情報d231のみである。すなわち、BフレームB42について検出された動きベクトル(動きベクトルMV63,MV64(図4(b)参照))を符号化することなく、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
《2》
本発明の符号化装置11では、以下のいずれかの効果が実現される。すなわち、付加情報d231に補間方式、ベクトル差分、あるいは動き検出方式が含まれる場合には、BフレームB42の動きベクトルMV63,MV64のより正確な作成が可能となる。さらには、BフレームB42のより正確な生成が可能となる。また、付加情報d231に残差情報が含まれる場合には、BフレームB42の画素値のより正確な生成が可能となる。
《3》
本発明の符号化装置11では、付加情報d231が含む情報を必要に応じて変更可能である(図5(ステップS404)参照)。このためさらなる符号化効率の向上が可能となる。
《4》
本発明の符号化装置11では、付加情報d231は、Bフレーム毎に作成されている。このため、より高精度な補間フレームの生成が可能となる。
(復号化装置12の効果)
《1》
本発明の復号化装置12では、BフレームB42を生成するために特別に符号化する情報は付加情報d231のみである。すなわち、画像信号d210におけるBフレームB42について検出された動きベクトル(動きベクトルMV63,MV64(図4(b)参照))が符号化されていなくとも、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
《2》
本発明の復号化装置12では、以下のいずれかの効果が実現される。すなわち、付加情報d231に補間方式、ベクトル差分、あるいは動き検出方式が含まれる場合には、画像信号d210におけるBフレームB42の動きベクトルMV63,MV64がより正確に作成される。さらには、BフレームB42のより正確な生成が可能となる。また、付加情報d231に残差情報が含まれる場合には、BフレームB42の画素値のより正確な生成が可能となる。
《3》
本発明の復号化装置12では、付加情報d231を含まない符号化画像信号d211を取得した場合にもBフレームB42を生成することが可能となる(図8(ステップS431)参照)。すなわち、従来法との互換性が保たれている。
《4》
本発明の復号化装置12では、付加情報d231は、Bフレーム毎に作成されている。このため、より高精度な補間フレームの生成が可能となる。
(補間フレーム生成システム10の効果)
《1》
本発明の補間フレーム生成システム10では、BフレームB42を生成するために特別に符号化する情報は付加情報d231のみである。すなわち、BフレームB42について検出された動きベクトル(動きベクトルMV63,MV64(図4(b)参照))が符号化されていなくとも、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
より具体的に効果について説明する。補間フレーム生成システム10では、付加情報d231を用いて、符号化装置11の動きベクトル検出部31と、復号化装置12の動きベクトル検出部79とに同様の動き検出を実現させることが可能となる。これにより、動きベクトルMV48(図4参照)と動きベクトルMV90(図7参照)とを近似したベクトルとして検出することが可能となる。また、符号化および復号化の基準となる情報(動きベクトルMV48および動きベクトルMV90)について伝送することなく、この基準となる情報からの差分のみを伝送する。このため、符号化効率の向上が可能となる。さらに、従来と同程度に高精度な補間フレームの生成が可能となる。
〈変形例〉
本発明はかかる上記実施形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形又は修正が可能である。また、上記実施形態で述べた方法は、プログラムとしてコンピュータなどにより実現されることも可能である。
(動きベクトルについて)
《1》
上記実施形態では、BフレームB42に対して時間的に前方に位置するIフレームI41と、時間的に後方に位置するPフレームP44との間の動きベクトルMV48を検出すると説明した(図4参照)。ここで、BフレームB42の符号化のために検出される動きベクトルは、これに限定されるものでは無い。
例えば、IフレームI41からPフレームP44への動きベクトルが検出されていてもよい。また、BフレームB42に対して時間的に前方あるいは後方に位置する複数の画像フレーム間について動きベクトルが検出されていてもよい。また、動きベクトルの検出は、一方向のみでなく、双方向に検出されるものであってもよい。
また、これら複数の検出方法について、動きベクトルの検出精度を比較し、最も精度の高い方法を採用するとしてもよい。
さらに、図4に示したフレームの構成は一例であり、本発明の効果がこのフレームの構成に限定されるものではない。
例えば、IフレームI41は、Pフレームに置き換えられていてもよいし、PフレームP44は、Iフレームに置き換えられていてもよい。また、Bフレームの枚数も図4に示した枚数に限定されるものではない。
また、本発明の効果は、上記実施形態で説明したIフレームI41、PフレームP44の符号化の方法に限定されるものでは無い。例えば、IフレームI41は、あらかじめ決められたルールに従い、フレームメモリ30に作成された画素値の減算処理を行うことにより符号化されるものであっても良い。より具体的には、MPEG−4などで行われる様に、イントラ符号化では、フレーム内で予測画素を作成し、その画素値を減算し、その残差成分の符号化を行うものであってもよい。すなわち、本発明では、符号化済のフレームであれば、符号化方法に依存せず、IフレームI41、PフレームP44の代わりに用いられることが可能である。
また、同様に、本発明の効果は、上記実施形態で説明したIフレームI41、PフレームP44の復号化の方法に限定されるものでは無い。例えば、加算部75は、あらかじめ決められたルールに従い、フレームメモリ76に作成された画素値の加算処理を行うことにより、IフレームI41を復号化するものであっても良い。
《2》
上記実施形態では、ブロックb51に対する補間用動きベクトルCMV49,CMV50を導出するための動きベクトルMV48は、ブロックb51と同じ位置にあるPフレームP44のブロックb53について検出される動きベクトルであると説明した(図4参照)。ここで、動きベクトルの検出方法は、これに限定されるものでは無い。
例えば、ブロックb51に対する補間用動きベクトルを導出するための動きベクトルは、PフレームP44とIフレームI41との間に検出される動きベクトルのうち、ブロックb51を横切る動きベクトルとして求められてもよい。
さらにこの場合、ブロックb51を横切る複数の動きベクトルがある場合には、それらの動きベクトルにより動き補償されたBフレームB42のブロックb51に対応する画素値として、複数の動きベクトルを検出するのに用いられたブロックの画素値を単純平均あるいは加重平均した値としてもよい。
さらにこの場合、ブロックb51を横切る動きベクトルが無い場合には、ブロックb51の近傍のブロックの動きベクトルの平均値、もしくは線形補間の値、もしくは平滑化フィルタをかけた値、もしくは重みつきの平滑化フィルタをかけた値などの値としてもよい。
《3》
上記実施形態では、BフレームB42に対して双方向の補間用動きベクトルCMV49,CMV50が導出され、BフレームB42に対して双方向の動きベクトルMV63,MV64が検出され、それぞれのベクトル差分が算出されると説明した。ここで、BフレームB42のそれぞれのブロックについて検出される動きベクトルは、双方向のものに限定されない。
例えば、一方向のものであっても良いし、さらに多くの動きベクトルが検出されるものであってもよい。
《4》
上記実施形態では、ブロックb51に対する補間用動きベクトルCMV49,CMV50は、ブロックb51と同じ位置にあるPフレームP44のブロックb53について検出される動きベクトル、または、PフレームP44とIフレームI41との間に検出される動きベクトルのうち、ブロックb51を横切る動きベクトルにより算出される値であると説明した(図4参照)。ここで、補間用動きベクトルの導出方法は、これに限定されるものでは無い。
これについて、図9を用いて説明する。図9(a)は、図4のBフレームB42を符号化する場合の例である。画像信号d210におけるBフレームB42を符号化する場合、PフレームP44とIフレームI41との間に検出される動きベクトルにより算出される値から、BフレームB42上のブロックb511〜b519に対して、双方向のベクトルV511a〜V519a及び、V511b〜V519bが算出できる(図9(a)参照)。ここで、PフレームP44とIフレームI41との間に検出される動きベクトルからベクトルV511a〜V519a及び、V511b〜V519bを導出する方法は、上記実施形態で、補間用動きベクトルの導出方法として説明した方法と同様である。なお、図9において、V511b〜V519bについては、V511a〜V519aと同じ処理で行うため、説明は省略する。
さらに、それぞれのブロックについて導出されたベクトルを隣接ブロックについて導出されたベクトルを用いて平滑化処理などすることにより、それぞれのブロックについて補間用動きベクトルが導出される。例えば、ブロックb515に対する補間用動きベクトルCMV515a及びCMV515bは、周囲のブロックのベクトルであるV511a〜V519a及び、V511b〜V519bに対して、例えば、平滑化フィルタまたはメディアンフィルタまたは重みをつけた平滑化フィルタをかけることにより、算出される(図9(b)参照)。また、周囲のブロックの範囲は8近傍でなくてもよい。
なお、PフレームP44とIフレームI41との間に検出される動きベクトルを平滑化し、平滑化された動きベクトルを内分あるいは外分することにより補間用動きベクトルを算出しても同様の結果が得られる。
符号化装置11では、算出された補間用動きベクトルを用いて、上記実施形態で説明したベクトル差分、残差情報を計算し、付加情報として符号化する。
あるいは、ベクトル差分、残差情報は付加情報として符号化せず、補間方式あるいは平滑化方式などを付加情報として符号化する。
復号化装置12では、復号化したPフレームP44とIフレームI41とから、各ブロックに対する補間用動きベクトルを算出する。さらに、補間用動きベクトルと付加情報とを用いて、各ブロックの復号化を行う。
ここで、付加情報としてベクトル差分、残差情報が含まれていない場合には、補間用動きベクトルを各ブロックの動きベクトルとみなして補間フレームの各ブロックの復号化を行う。
以上の手順で導出された補間用動きベクトルは、例えば、付加情報として残差情報あるいはベクトル差分が伝送されない場合において、言い換えれば、低ビットレートの伝送において、復号化装置12で生成されるBフレームの画質向上に有効である。すなわち、復号化装置12で算出される各ブロックの補間用動きベクトルでは、隣接ブロックとの空間的な相関性が強められており、Bフレームの精度の向上、特にブロック歪みなどの削減に有効である。
《5》
上記実施形態では、BフレームB42のブロックb51の大きさについて、PフレームP44のブロックと同じ大きさとして説明した(図4参照)。ここで、ブロックb51の大きさは、これに限定されるものでは無い。
例えば、BフレームB42のブロックb51はPフレームP44のブロックの4分の1の大きさであってもよい。
これにより、詳細に動き補償することができるため、復号化装置12で生成されるBフレームの精度を向上させることができる。
(付加情報について)
《6》
符号化装置11で作成される付加情報d231は、デフォルトの付加情報をコード化して含むものであってもかまわない。これについて、図10と図11とを用いて説明する。
(6−1)
図10は、付加情報d231が含む動き検出方式のパラメータの組み合わせを特定するためのテーブル110である。テーブル110は、動き検出の探索範囲(±8画素、±16画素、±32画素、±64画素)、サブペル精度(整数画素単位、1/2画素単位、1/4画素単位、1/8画素単位)および評価関数(F1〜F4:F1〜F4は、SADあるいはSSDなどの評価関数を示す。)についてパラメータの組み合わせを複数格納しており、それぞれの組み合わせは、コード情報111により特定可能である。なお、符号化装置11と復号化装置12とは、共通のテーブル110を有している。
付加情報d231は、動きベクトル検出部31で実行された動き検出方式をコード情報111として含んでいる。コード情報111は、数ビットの情報として表現される。このため、付加情報d231の情報量は、さらに削減可能となる。
なお、動き検出方式に限らず、補間方式などについてもテーブル化されていてもよい。また、図10は、一例であり、本発明の効果がこの場合に限定されるものではない。
(6−2)
図11は、付加情報d231が含む情報の組み合わせを特定するためのテーブル115である。テーブル115は、付加情報d231が含む情報の組み合わせを複数のプロファイル情報116として有している。図11では、プロファイル情報116は、1〜4の番号により特定される。また、テーブル115中[○]は、その情報が含まれていることを示している。テーブル115中[×]は、その情報が含まれていないことを示している。なお、符号化装置11と復号化装置12とは、共通のテーブル110を有している。
復号化装置12では、テーブル115により、符号化画像信号d211から取得された付加情報d252が含む情報の組み合わせを認識可能となる。このため、復号化装置12は、付加情報d252が含む情報の一部を利用できない場合であっても、その情報が含まれているか否かを認識することにより確実にスキップすることが可能となる。また、付加情報d252が含む情報を確実に取得することが可能となる。このため、付加情報d252の内容を誤って認識することが防止可能となる。
なお、図11は、一例であり、本発明の効果がこの場合に限定されるものではない。
《7》
復号化装置12(図6参照)において、動きベクトル検出部79は、符号化画像信号d211から取得された付加情報d252が指定する動き検出方式を実行できない場合には、あらかじめ定めた他の動き検出方式により動きベクトルの検出を行ってもよい。
図12は、付加情報d252が指定する動き検出のアルゴリズム120と、動きベクトル検出部79で実行される動き検出のアルゴリズム121との対応関係について示している。
これにより、動きベクトル検出部79は、付加情報d252が指定する動き検出のアルゴリズム120を実行できない場合であっても、できるだけ近い動きベクトルを検出することができる他の動き検出のアルゴリズム121を実行する。
なお、図12は、対応関係の一例であり、本発明の効果がこの場合に限定されるものではない。
《8》
符号化装置11(図2参照)では、動き検出方式あるいは補間方式などの情報があらかじめ定めたデフォルトと一致する場合には、付加情報d231に含めないこととしてもよい。
この場合、復号化装置12(図6参照)では、動き検出方式あるいは補間方式などに相当する情報が付加情報d252に含まれない場合には、あらかじめ符号化装置11と共通に有するデフォルトの動き検出方式あるいは補間方式を用いて補間フレームの生成を行う。
また、符号化装置11(図2参照)では、画像フレームの画面間符号化の際に検出される動きベクトルが利用可能である場合には、動き検出方式を付加情報d231に含めないこととしても良い。
例えば、BフレームB42の符号化に際して検出される動きベクトルMV48(図4(a)参照)がすでにPフレームP44の符号化の際に検出されている場合、再度PフレームP44とIフレームI41との動きベクトルの検出を行わない。符号化装置11では、BフレームB42の符号化に際して、PフレームP44の符号化の際に検出された動きベクトルを利用する。
この場合、復号化装置12では、補間フレームの生成に際して、動きベクトル検出部79によるPフレームP44とIフレームI41との動きベクトルの検出を行わない。補間フレーム生成部80は、復号化部70から、PフレームP44の符号化の際に用いられた動きベクトル取得し、この動きベクトルを利用してBフレームB42の復号化を行う。
《9》
上記実施形態では、付加情報d231は、補間フレーム毎に作成されるとした。ここで、付加情報d231に含まれる情報のうちの一部は、画像信号d210のストリーム毎に含まれるものであってもよい。
例えば、動き検出方式や補間方式などは、画像信号d210のストリーム毎に含まれるものであってもよい。これにより、補間フレーム毎に動き検出方式や補間方式を付加する必要がなくなり、符号化効率が向上する。
また、付加情報d231の少なくとも一部は、画像信号d210のストリームヘッダとして含まれるものであっても良い。
《10》
上記実施形態では、付加情報作成部18は、入力された減算信号d220の大きさに応じて、付加情報d231の作成を行うとした。ここで、付加情報作成部18は、動きベクトル検出部31によるPフレームP44とIフレームI41との動きベクトルの検出結果に応じて、付加情報d231の作成を行ってもよい。
例えば、動きベクトル検出部31での動きベクトルが近傍の動きベクトルとの類似している、つまり大きく異ならない場合、付加情報を作成する。また、付加情報作成部18は、前記減算信号d220の大きさ及び動きベクトル検出部31での動きベクトルの近傍の動きベクトルと類似性に応じて、付加情報d231の作成を行ってもよい。
これにより、Bフレームの生成精度の向上を図ることができる。
《11》
上記実施形態では、残差情報を付加情報d231とする際に、減算信号d220を付加情報作成部18に入力するとした。ここで、残差情報を付加情報d231とする際に、減算信号d220を直行変換部22および量子化部23を用いて処理した量子化DCT係数d222を付加情報作成部18に入力してもよい。
この場合、付加情報d231の情報量を削減することが可能である。
また、これに対応して、復号化装置12においても、可変長復号化部72により出力される付加情報d252のうち、減算信号d220を直行変換部22および量子化部23を用いて処理した量子化DCT係数d222は、逆量子化部73および逆直行変換部74を用いて処理され、補間フレーム生成部80に出力されるものであってもよい。これにより、減算信号d220の値は、補間フレーム生成部80に与えられることとなる。
(復号化部70について)
《12》
上記実施形態では、復号化部70は、符号化画像信号d211が付加情報d252を含んでいない場合には、BフレームB42について従来のBフレームと同様の符号化が行われていると判断すると説明した(図8(ステップS431)参照)。ここで、復号化部70は、付加情報d252が含まれていない場合には、フレームメモリ76に記憶されている画像フレームを用いて補間フレームを生成するものであってもよい。
例えば、補間フレーム生成部80は、あらかじめ定めた方法により補間フレームの生成を行う。
ここで、あらかじめ定めた方法とは、例えば、フレームメモリ76に記憶されている画像フレーム間の動きベクトルを検出し、補間フレームの動きベクトルを求め、補間フレームを生成する方法や、符号化画像信号d211が含む画面間符号化された画像フレームの動きベクトルを用いて、補間フレームの動きベクトルを求め、補間フレームを生成する方法などである。
(符号化装置11および復号化装置12について)
《13》
符号化装置11(図2参照)および復号化装置12(図6参照)の各部は、それぞれ一体として存在していてもよいし、別体として存在していても良い。例えば、符号化装置11において、符号化部16と、動き補償部17と、付加情報作成部18などは、一体として備えられるものであっても、別々の装置として別体として備えられるものであってもよい。また、復号化装置12において、復号化部70とフレーム出力部71とは一体として備えられるものであっても、別々の装置として別体として備えられるものであってもよい。
《14》
符号化装置11(図2参照)および復号化装置12(図6参照)の各部は、それぞれフレーム単位での切換として説明した。ここで、切換の単位はブロック単位であってもよい。例えば、スイッチ21(図2参照)やスイッチ81(図6参照)の動作は、ブロック単位での判定で行っても良い。
この場合、図5で説明した付加情報作成方法および図8で説明した補間フレーム生成方法におけるBフレームについての処理は、ブロック単位で行われることとなる。
これにより、ブロック毎に適した符号化・復号化方法を選択することができるため、Bフレームの画質を向上させることができる。
また、上記実施形態および変形例で説明したそれぞれの内容は、ブロック単位、フレーム単位、ストリーム単位などで任意に組み合わせて用いられることが可能である。
また、ブロック単位で切換を行う場合、Bフレームの符号化では、付加情報を作成しない従来の符号化と、付加情報を作成する本発明の符号化とを切換るものであってもよい。
具体的には、スイッチ21(または、スイッチ21を制御する制御部(図示せず))は、Bフレームを構成するブロック毎に以下に示す符号化手法選択処理を行う。符号化手法選択処理は、入力されたブロックに対して、符号化手法の候補毎に、次の(式1)を計算する。
J=D+λ・R ・・・ (式1)
ここで、Jは、コスト、Dは、ひずみ、λは、所定の係数、Rは、符号量である。より詳しくは、Dは、それぞれの手法を用いて符号化した画像の復号化画像と、原画像との誤差を示す。Rは、それぞれの手法を用いて符号化した場合の符号量を示し、量子化DCT係数d222、動きベクトル、符号化モード、付加情報d231などを符号化する場合の符号量である。
符号化手法選択処理は、計算された(式1)の値Jを最小とする符号化手法の候補を選択する。
これにより、(式1)を最小とする符号化手法の候補がブロック毎に選択され、復号化の際のひずみを抑えつつ、符号量を低減するBフレームの符号化が実現できる。
なお、符号化手法の候補としては、従来の符号化手法や、上記実施形態で説明した符号化手法が用いられる。ここで、従来の符号化手法とは、例えば、Bフレームを構成するブロックの符号化手法として用いられる画面内符号化、片方向予測、双方向予測、ダイレクトモードなどといった手法である。
より具体的には、画面内符号化、片方向予測は、IフレームやPフレームの符号化として説明したのと同様に行われる。双方向予測では、動き補償部17(図2参照)は、既にローカルデコードされフレームメモリ30に記憶されているIフレームとPフレームとに対して、Bフレームの動きベクトルを検出する。さらに、フレームメモリ30は、検出された動きベクトルを用いて動き補償されたBフレームを作成する。さらに、減算部20は、画像信号d210を構成するBフレームと動き補償されたBフレームとを処理し、減算信号d220を出力する。また、ダイレクトモードでは、動き補償部17(図2参照)は、既にローカルデコードされフレームメモリ30に記憶されているPフレームにおいて、符号化対象となるBフレームのブロックと同じ位置にあるブロック(アンカーブロック)の動きベクトルを、Bフレームの位置でスケーリングし、BフレームのIフレームおよびPフレームに対する動きベクトルを算出する。さらに、フレームメモリ30は、検出された動きベクトルを用いて動き補償されたBフレームを作成する。さらに、減算部20は、画像信号d210を構成するBフレームと動き補償されたBフレームとを処理し、減算信号d220を出力する。
スイッチ21により、従来法がBフレームの符号化手法として選択された場合には、スイッチ21は、直交変換部22側を向き、減算信号d220は、直交変換部22に入力される。また、検出された動きベクトルは、可変長符号化部24に入力される。
このように、従来法と本発明の手法とをブロック毎に切換えることにより、より符号化効率が向上する。例えば、従来法としてはダイレクトモードで符号化することが望ましい場合において、そのダイレクトモードよりも符号化効率の高い本発明の手法を用いることが可能となる。
より具体的には、ダイレクトモードでは、符号化の対象となるBフレームに対する動きベクトルを求めず、例えば、Pフレームの動きベクトルを利用する。このように、ダイレクトモードでは、動きベクトルを符号化しないことにより、符号化効率を向上させている。この一方で、ダイレクトモードでは、Pフレームの動きベクトルを利用しているため、動き補償されたBフレームの精度が十分に得られず、残差情報が大きくなることがある。
しかし、本発明の手法を用いる場合、符号化の対象となるBフレームに対する動きベクトルが求められている。このため、動き補償されたBフレームの精度を十分に得ることが可能となる。さらに、求めた動きベクトルを符号化する必要なく、ダイレクトモードと同様に符号化効率を高めることが可能となっている。
また、このように符号化された符号化画像信号d211に対応して、スイッチ81(図6参照)をブロック単位で動作させることも可能である。
[第2実施形態]
本発明の第2実施形態として、上記で説明した補間フレーム生成システム、符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムの応用例とそれを用いたシステムを図13〜図16を用いて説明する。
図13は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
このコンテンツ供給システムex100は、例えば、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex107〜ex110を介して、コンピュータex111、PDA(personal digital assistant)ex112、カメラex113、携帯電話ex114、カメラ付きの携帯電話ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図13のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電話は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband−Code Division Multiple Access)方式、若しくはGSM(Global System for Mobile Communications)方式の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
また、ストリーミングサーバex103は、カメラex113から基地局ex109、電話網ex104を通じて接続されており、カメラex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラex116で撮影した動画データはコンピュータex111を介してストリーミングサーバex103に送信されてもよい。カメラex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラex116で行ってもコンピュータex111で行ってもどちらでもよい。また、符号化処理はコンピュータex111やカメラex116が有するLSIex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な記録媒体である何らかの蓄積メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込んでもよい。さらに、カメラ付きの携帯電話ex115で動画データを送信してもよい。このときの動画データは携帯電話ex115が有するLSIで符号化処理されたデータである。
このコンテンツ供給システムex100では、ユーザがカメラex113、カメラex116等で撮影しているコンテンツ(例えば、音楽ライブを撮影した映像等)を符号化処理してストリーミングサーバex103に送信する一方で、ストリーミングサーバex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等がある。このようにすることでコンテンツ供給システムex100は、符号化されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである。
コンテンツの符号化処理あるいは復号化処理に際して、上記実施形態で説明した補間フレーム生成システム、符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを用いてもよい。例えば、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等は、上記実施形態で示した符号化装置、復号化装置を備え、補間フレーム生成方法、補間フレーム生成プログラムを実現でき、全体として補間フレーム生成システムを構築するものであってよい。
一例として携帯電話について説明する。
図14は、上記実施形態の符号化装置および復号化装置を用いた携帯電話ex115を示す図である。携帯電話ex115は、基地局ex110との間で電波を送受信するためのアンテナex201、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex203、カメラ部ex203で撮影した映像、アンテナex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex202、操作キーex204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex208、音声入力をするためのマイク等の音声入力部ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディアex207、携帯電話ex115に記録メディアex207を装着可能とするためのスロット部ex206を有している。記録メディアex207はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex115について図15を用いて説明する。携帯電話ex115は表示部ex202および操作キーex204を備えた本体部の各部を統括的に制御するようになされた主制御部ex311に対して、電源回路部ex310、操作入力制御部ex304、画像符号化部ex312、カメラインターフェース部ex303、LCD(Liquid Crystal Display)制御部ex302、画像復号化部ex309、多重分離部ex308、記録再生部ex307、変復調回路部ex306および音声処理部ex305が同期バスex313を介して互いに接続されている。
電源回路部ex310は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話ex115を動作可能な状態に起動する。
携帯電話ex115は、CPU、ROMおよびRAM等でなる主制御部ex311の制御に基づいて、音声通話モード時に音声入力部ex205で集音した音声信号を音声処理部ex305によってディジタル音声データに変換し、これを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して送信する。また携帯電話ex115は、音声通話モード時にアンテナex201で受信した受信信号を増幅して周波数変換処理およびアナログディジタル変換処理を施し、変復調回路部ex306でスペクトラム逆拡散処理し、音声処理部ex305によってアナログ音声信号に変換した後、これを音声出力部ex208を介して出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex204の操作によって入力された電子メールのテキストデータは操作入力制御部ex304を介して主制御部ex311に送出される。主制御部ex311は、テキストデータを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex203で撮像された画像データをカメラインターフェース部ex303を介して画像符号化部ex312に供給する。また、画像データを送信しない場合には、カメラ部ex203で撮像した画像データをカメラインターフェース部ex303およびLCD制御部ex302を介して表示部ex202に直接表示することも可能である。
画像符号化部ex312は、カメラ部ex203から供給された画像データを圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex308に送出する。また、このとき同時に携帯電話ex115は、カメラ部ex203で撮像中に音声入力部ex205で集音した音声を音声処理部ex305を介してディジタルの音声データとして多重分離部ex308に送出する。
多重分離部ex308は、画像符号化部ex312から供給された符号化画像データと音声処理部ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex201を介して基地局ex110から受信した受信信号を変復調回路部ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex308に送出する。
また、アンテナex201を介して受信された多重化データを復号化するには、多重分離部ex308は、多重化データを分離することにより画像データの符号化ビットストリームと音声データの符号化ビットストリームとに分け、同期バスex313を介して当該符号化画像データを画像復号化部ex309に供給すると共に当該音声データを音声処理部ex305に供給する。
次に、画像復号化部ex309は、画像データの符号化ビットストリームを復号することにより再生動画像データを生成し、これをLCD制御部ex302を介して表示部ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex305は、音声データをアナログ音声信号に変換した後、これを音声出力部ex208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
以上の構成において、画像符号化部ex312は、上記実施形態の符号化装置を備え、画像復号化部ex309は、上記実施形態の復号化装置を備えている。この時、図2に示す符号化装置11と図6に示す復号化装置12とで共通する構成については同一のハードウェアを共用することとしてもよい。すなわち、フレームメモリ、動きベクトル検出部、逆量子化部、逆直交変換部などは、同一のハードウェアであっても良い。
なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図16に示すようにディジタル放送用システムにも上記実施形態で説明した補間フレーム生成システム、符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを組み込むことができる。具体的には、放送局ex409では映像情報の符号化ビットストリームが電波を介して通信または放送衛星ex410に伝送される。これを受けた放送衛星ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex406で受信し、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置により符号化ビットストリームを復号化してこれを再生する。ここで、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置が上記実施形態で説明した符号化装置、復号化装置を備えていてもよい。また、上記実施形態の補間フレーム生成方法を用いるものであってもよい。さらに、補間フレーム生成プログラムを備えていてもよい。また、記録媒体であるCDやDVD等の蓄積メディアex402に記録した符号化ビットストリームを読み取り、復号化する再生装置ex403にも上記実施形態で説明した符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを実装することが可能である。この場合、再生された映像信号はモニタex404に表示される。また、ケーブルテレビ用のケーブルex405または衛星/地上波放送のアンテナex406に接続されたセットトップボックスex407内に上記実施形態で説明した符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを実装し、これをテレビのモニタex408で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に上記実施形態で説明した符号化装置、復号化装置を組み込んでも良い。また、アンテナex411を有する車ex412で衛星ex410からまたは基地局ex107等から信号を受信し、車ex412が有するカーナビゲーションex413等の表示装置に動画を再生することも可能である。
更に、画像信号を符号化し、記録媒体に記録することもできる。具体例としては、DVDディスクex421に画像信号を記録するDVDレコーダや、ハードディスクに記録するディスクレコーダなどのレコーダex420がある。更にSDカードex422に記録することもできる。レコーダex420が上記実施形態の復号化装置を備えていれば、DVDディスクex421やSDカードex422に記録した画像信号を補間して再生し、モニタex408に表示することができる。
なお、カーナビゲーションex413の構成は例えば図15に示す構成のうち、カメラ部ex203とカメラインターフェース部ex303、画像符号化部ex312を除いた構成が考えられ、同様なことがコンピュータex111やテレビ(受信機)ex401等でも考えられる。
また、上記携帯電話ex114等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の3通りの実装形式が考えられる。
このように、上記実施形態で説明した補間フレーム生成システム、符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを上述したいずれの機器・システムに用いることは可能であり、上記実施形態で説明した効果を得ることができる。
また、上記実施形態で図を用いて説明した符号化装置、復号化装置において、各機能ブロックは、LSIなどの半導体装置により個別に1チップ化されても良いし、一部又は全部を含むように1チップ化されても良い。
具体的には、図2における各ブロックは、1チップ化されても良い。この際、フレームメモリ30は、別体として外部に接続されるものであっても良い。
また、図6における各ブロックは、1チップ化されても良い。この際、フレームメモリ76は、別体として外部に接続されるものであっても良い。また、復号化部70とフレーム出力部71とは、別対として構成されていても良い。このような構成においても、フレームメモリ76は、別体として復号化部70の外部に接続されるものであっても良い。
なお、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、上記実施形態で図を用いて説明した各機能ブロックの処理の一部又は全部は、プログラムにより実現されるものであってもよい。この場合、具体的な処理は、例えば、中央演算装置(CPU)により行われる。また、それぞれの処理を行うためのプログラムは、ハードディスク、ROMなどの記憶装置に格納されており、ROMにおいて、あるいはRAMに読み出されて実行される。
本発明の復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムは、符号化効率を向上させつつ高精度の補間フレームを生成を行うことが必要な復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムなどに適用することが可能である。
本発明は、復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム、特に、補間フレームの生成を行うための復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムに関する。
テレビ、パーソナルコンピュータ(PC)、携帯電話、あるいはその他の画像信号を表示する装置において、画像信号を構成する画像フレームを補間する補間フレームを生成し、生成された補間フレームを画像フレームに内挿して表示させる技術が知られている。この技術は、低フレームレートで伝送された画像信号を滑らかに表示すること、あるいは画像信号を低ビットレートで符号化し伝送することを目的として利用されている。
前者を目的とする技術として、画像フレーム間の動きベクトルを検出し、求められた動きベクトルを用いて補間フレームを生成する技術が知られている(例えば、特許文献1参照)。
より具体的には、画像フレーム間の動きベクトルを検出し、動きベクトルを検出した画像フレーム間の時間的距離と補間フレームの補間位置の時間的距離との比により検出された動きベクトルを内分あるいは外分する。こうして導出された動きベクトル(以下、補間用動きベクトルという)と画像フレームの画素値とを用いて、補間フレームを生成する。
ここで、補間フレームの精度を高めることを目的として、補間用動きベクトルを用いた補間の精度が低い部分については、補間フレームに対応する画像信号の画素値を伝送する技術についても知られている(例えば、特許文献2参照)。
後者を目的とする技術として、動き補償符号化という技術が知られている。動き補償符号化とは、画像フレームを構成する画像ブロックの動きベクトルを用いて行われる符号化である。例えば、動画像信号圧縮の国際規格であるMPEG(Moving Picture Experts Group)では、符号化に際して、画面内符号化と画面間符号化の2つの符号化方法が用いられる。画面内符号化は、画像フレームをそのフレーム内の情報だけで符号化する方法であり、この方法で符号化された画像フレームをIフレームと呼んでいる。画面間符号化とは、画像フレームをそのフレーム内の情報と他のフレームの情報との両方を用いて符号化する方法であり、この方法で符号化された画像フレームをPフレームまたはBフレームと呼んでいる。
すなわち、後者を目的とする動き補償符号化は、補間フレーム(Bフレーム)と補間フレームに対して時間的に双方向に位置する画像フレーム(IフレームまたはPフレーム)との動きベクトルと、動きベクトルにより動き補償された画像フレームと補間フレームとの残差情報とを補間フレームを生成するための情報として符号化する技術である。復号化側では、符号化画像信号と既に復号化された画像フレームとを用いて、補間フレームの生成を行う。
特開平7−177514号公報(第5図) 特許第2828096号公報
本技術分野においては、さらに符号化効率を向上させつつ高精度の補間フレームの生成を行うことが求められている。具体的には、上記した2つの技術において、前者では、さらに高精度な補間フレームを生成することが求められており、後者では、符号化効率を向上させることが求められている。
そこで、本発明では、符号化効率を向上させつつ高精度の補間フレームの生成を行うための復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムを提供することを課題とする。
請求項1に記載の復号化装置は、復号化手段と、動きベクトル検出手段と、補間フレーム生成手段とを備えている。復号化手段は、画像信号を構成する画像フレームと、画像フレーム間の動きベクトルである第1の動きベクトルに基づいて画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する。動きベクトル検出手段は、復号化された画像フレーム間の動きベクトルである第2の動きベクトルを検出する。補間フレーム生成手段は、第2の動きベクトルと復号化された画像フレームと復号化された付加情報とに基づいて補間フレームを生成する。
復号化手段は、符号化画像信号から画像フレームと付加情報とを復号化する。付加情報は、画像フレームを補間する補間フレームを生成するための情報であって、符号化前の画像フレームについて検出された第1の動きベクトルに基づいて補間フレームを生成するための情報である。動きベクトル検出手段は、例えばブロックマッチングなどにより復号化後の画像フレーム間の第2の動きベクトルを検出する。補間フレーム生成手段は、第2の動きベクトルを第1の動きベクトルとみなし、第2の動きベクトルと画像フレームと付加情報とに基づいて補間フレームを生成する。
ここで、第1の動きベクトルとは、補間フレームに対して時間的に前方および後方に位置する画像フレーム間について、一方向あるいは双方向に検出される動きベクトルだけでなく、補間フレームに対して時間的に前方あるいは後方に位置する複数の画像フレーム間について、一方向あるいは双方向に検出される動きベクトルであってもよい(以下、この欄において同じ)。また、フレームとは、順次走査画像におけるフレームであっても、飛び越し走査画像におけるフレームまたはフィールドであってもよい(以下、この欄において同じ)。さらに、画像フレームは、符号化される際に、画面内符号化されるものであっても、画面間符号化されるものであってもよい(以下、この欄において同じ)。
本発明の復号化装置では、補間フレームを生成するために特別に必要となる情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどが符号化画像信号に含まれていなくとも、符号化効率を向上させつつ高精度の補間フレームを生成することが可能となる。
請求項2に記載の復号化装置は、請求項1に記載の復号化装置であって、付加情報は、画像フレームに対する補間フレームの補間方式と、補間フレームと補間フレームに対応する画像フレームとの残差情報と、補間フレームの画像フレームに対して検出された動きベクトルと第1の動きベクトルに基づいて導出される補間フレームの画像フレームに対する動きベクトルとのベクトル差分と、第1の動きベクトルの検出に用いられた動き検出方式とのうち少なくともいずれかを含む。
補間方式は、例えば、補間フレームの生成に用いられる第1の動きベクトルの向き、補間フレームの生成に用いられる画像フレーム、および画像フレームに対する補間位置に関する情報などである(以下、この欄において同じ)。残差情報とは、例えば、補間フレームの画素値と補間フレームの生成に用いられる画像フレームの画素値との差分などである(以下、この欄において同じ)。ベクトル差分とは、第1の動きベクトルに基づいて補間フレームの動きベクトルを導出するための情報であり、例えば、動き検出により検出される補間フレームの動きベクトルと、第1の動きベクトルを内分あるいは外分して求められる補間フレームの動きベクトルとの差分などである(以下、この欄において同じ)。動き検出方式とは、例えば、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報である(以下、この欄において同じ)。動き検出のアルゴリズムに関する情報とは、例えば、全探索、間引き探索、OAT探索、Nステップ探索、階層型探索などと呼ばれる探索方法を指定する情報である。探索範囲に関する情報とは、例えば、ブロックマッチングを行う領域に関する情報である。サブペル精度に関する情報とは、例えば、ブロックマッチングを行う精度に関する情報である。評価関数に関する情報とは、例えば、ブロックマッチングにおける評価関数であるSAD(絶対差分和)やSSD(平方差分和)などを指定する情報である。
本発明の復号化装置では、以下のいずれかの効果を実現することが可能となる。すなわち、付加情報に補間方式、ベクトル差分、あるいは動き検出方式が含まれる場合には、補間フレームの動きベクトルがより正確に生成される。さらには、補間フレームがより正確に生成される。また、付加情報に残差情報が含まれる場合には、補間フレームの画素値がより正確に生成される。
請求項3に記載の復号化装置は、請求項2に記載の復号化装置であって、付加情報は、付加情報が含む情報の組み合わせを特定するためのプロファイル情報をさらに含んでいる。
プロファイル情報は、例えば、補間方式、残差情報、ベクトル差分、あるいは動き検出方式などの情報が付加情報に含まれているか否かに関する情報であり、それぞれの情報の組み合わせに対して割り当てられた番号などにより、付加情報が含む情報の組み合わせを特定する。
本発明の復号化装置では、付加情報が含む情報の組み合わせを確実に取得することが可能となる。このため、より正確に補間フレームを生成することが可能となる。
請求項4に記載の復号化装置は、請求項2または3に記載の復号化装置であって、動き検出方式は、動き検出のパラメータの組み合わせを特定するためのコード情報として含まれている。動きベクトル検出手段は、コード情報が特定する動き検出のパラメータに基づいて、第2の動きベクトルの検出を行う。
ここで、動き検出のパラメータとは、例えば、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報それぞれについての内容である。コード情報は、例えば、動き検出のパラメータの組み合わせに対して割り当てられた番号などにより、動き検出のパラメータの組み合わせを特定する。
動きベクトル検出手段は、取得されたコード情報により動き検出方式を特定し、特定された動き検出方式により第2の動きベクトルの検出を行う。
本発明の復号化装置では、動き検出方法がコード情報としてまとめられて符号化される。このため、符号化効率をより高めつつ高精度の補間フレームの生成が可能となる。
請求項5に記載の復号化装置は、請求項2〜4のいずれか1項に記載の復号化装置であって、動きベクトル検出手段は、付加情報が含む動き検出方式を実行できない場合には、付加情報が含む動き検出方式に応じて定められた所定の動き検出方式により第2の動きベクトルを検出する。
動きベクトル検出手段は、例えば、付加情報が含む動き検出方式が動きベクトル検出手段では実行できない動き検出のアルゴリズムを指定する場合、指定されたアルゴリズムに応じて定められた他のアルゴリズムにより動き検出を実行する。
本発明の復号化装置では、第1の動きベクトルの検出に用いられた動き検出方式を実行できない場合であっても、異なる動き検出方式を用いて第2の動きベクトルを検出することが可能となる。また、第1の動きベクトルの検出に用いられた動き検出方式とできるだけ近い特性の動き検出方式を用いることにより、第1の動きベクトルに近い動きベクトルを検出することが可能となる。
請求項6に記載の復号化装置は、請求項2〜5のいずれか1項に記載の復号化装置であって、付加情報は、補間フレーム毎に作成されている情報である。
本発明の復号化装置では、補間フレーム毎に付加情報が作成されている。このため、より高精度な補間フレームを生成することが可能となる。
請求項7に記載の復号化装置は、請求項2〜5のいずれか1項に記載の復号化装置であって、付加情報のうち、動き検出方式は、符号化画像信号のストリーム毎に作成されている情報である。
本発明の復号化装置では、動き検出方式はストリーム毎に作成されている。このため、より符号化効率を向上させることが可能となる。
請求項8に記載の復号化装置は、請求項1〜7のいずれか1項に記載の復号化装置であって、補間フレーム生成手段は、符号化画像信号に付加情報が含まれていない場合に、復号化した画像フレームに基づいて補間フレームの生成を行う。
補間フレーム生成手段では、画像信号を画面内符号化と画面間符号化とのみにより符号化した符号化画像信号が取得される場合、復号化した画像フレームを用いて、補間フレームの生成が行われる。補間フレームの生成は、例えば、画像フレーム間の動きベクトルを検出し補間フレームの動きベクトルを求め補間フレームを生成する方法や、画面間符号化された画像フレームの動きベクトルを用いて補間フレームの動きベクトルを求め補間フレームを生成する方法などにより行われる。
本発明の復号化装置では、付加情報を含まない符号化画像信号を取得した場合にも補間フレームを生成することが可能となる。すなわち、従来法との互換性が保たれている。
請求項9に記載の符号化装置は、第1の動きベクトル検出手段と、付加情報作成手段と、符号化手段とを備えている。第1の動きベクトル検出手段は、画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する。付加情報作成手段は、画像フレームを補間する補間フレームを第1の動きベクトルに基づいて生成するための付加情報を作成する。符号化手段は、画像フレームと付加情報とを符号化する。
第1の動きベクトル検出手段は、例えば、ブロックマッチングなどにより画像フレーム間の第1の動きベクトルを検出する。付加情報作成手段は、第1の動きベクトルに基づいて補間フレームを生成するための情報である付加情報を作成する。符号化手段は、画像フレームと付加情報とを符号化する。ここで、画像フレームの符号化は、画面内符号化あるいは画面間符号化などにより行われる。
本発明の符号化装置では、補間フレームを生成するために特別に符号化する情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどを符号化することなく、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
請求項10に記載の符号化装置は、請求項9に記載の符号化装置であって、付加情報は、画像フレームに対する補間フレームの補間方式と、補間フレームと補間フレームに対応する画像フレームとの残差情報と、補間フレームの画像フレームに対して検出された動きベクトルと第1の動きベクトルに基づいて導出される補間フレームの画像フレームに対する動きベクトルとのベクトル差分と、第1の動きベクトルの検出に用いられた動き検出方式とのうち少なくともいずれかを含む。
本発明の符号化装置により、以下のいずれかの効果が実現される。すなわち、付加情報に補間方式、ベクトル差分、あるいは動き検出方式が含まれる場合には、補間フレームの動きベクトルのより正確な生成が可能となる。さらには、補間フレームのより正確な生成が可能となる。また、付加情報に残差情報が含まれる場合には、補間フレームの画素値のより正確な生成が可能となる。
請求項11に記載の符号化装置は、請求項10に記載の符号化装置であって、付加情報は、付加情報が含む情報の組み合わせを特定するためのプロファイル情報をさらに含んでいる。
プロファイル情報は、例えば、補間方式、残差情報、ベクトル差分、あるいは動き検出方式などの情報が付加情報に含まれているか否かに関する情報であり、それぞれの情報の組み合わせに対して割り当てられた番号などにより、付加情報が含む情報の組み合わせを特定する。
本発明の符号化装置では、付加情報が含む情報の組み合わせを確実に符号化することが可能となる。このため、補間フレームのより正確な生成が可能となる。
請求項12に記載の符号化装置は、請求項10または11に記載の符号化装置であって、動き検出方式は、動き検出のパラメータの組み合わせを特定するためのコード情報として含まれている。
ここで、動き検出のパラメータとは、例えば、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報それぞれについての内容である。コード情報は、例えば、動き検出のパラメータの組み合わせに対して割り当てられた番号などにより、動き検出のパラメータの組み合わせを特定する。
本発明の符号化装置では、動き検出方法がコード情報としてまとめられて符号化される。このため、符号化効率のさらなる向上と高精度の補間フレームの生成とが可能となる。
請求項13に記載の符号化装置は、請求項10〜12のいずれか1項に記載の符号化装置であって、付加情報は、補間フレーム毎に作成される情報である。
本発明の符号化装置では、補間フレーム毎に付加情報が作成されている。このため、より高精度の補間フレームの生成が可能となる。
請求項14に記載の符号化装置は、請求項10〜12のいずれか1項に記載の符号化装置であって、動き検出方式は、画像信号のストリームのヘッダ情報として含まれている。
本発明の符号化装置では、動き検出方式はストリーム毎に作成されている。
請求項15に記載の符号化装置は、請求項11に記載の符号化装置であって、プロファイル情報は、画像信号のストリームのヘッダ情報として含まれている。
本発明の符号化装置では、プロファイル情報はストリーム毎に作成されている。
請求項16に記載の符号化装置は、請求項9〜15のいずれか1項に記載の符号化装置であって、符号化手段は、画像フレームに基づいて生成される補間フレームと補間フレームに対応する画像信号との残差が小さい場合には、付加情報の符号化を行わない。
符号化手段は、画像フレームに基づいて高精度の補間フレームの生成が行われる場合には、付加情報の符号化を行わない。補間フレームの生成は、例えば、画像フレーム間の動きベクトルを検出し補間フレームの動きベクトルを求め補間フレームを生成する方法や、画面間符号化される画像フレームの動きベクトルを用いて補間フレームの動きベクトルを求め補間フレームを生成する方法などにより行われる。
本発明の符号化装置では、符号化効率のさらなる向上と高精度の補間フレームの生成とが可能となる。
請求項17に記載の補間フレーム生成システムは、画像信号を構成する画像フレームを補間する補間フレームを生成する補間フレーム生成システムであって、第1の動きベクトル検出手段と、付加情報作成手段と、符号化手段と、復号化手段と、第2の動きベクトル検出手段と、補間フレーム生成手段とを備えている。第1の動きベクトル検出手段は、画像フレーム間の動きベクトルである第1の動きベクトルを検出する付加情報作成手段は、第1の動きベクトルに基づいて補間フレームを生成するための付加情報を作成する。符号化手段は、画像フレームと付加情報とを符号化する。復号化手段は、符号化された画像フレームと付加情報とを復号化する。第2の動きベクトル検出手段は、復号化された画像フレーム間の動きベクトルである第2の動きベクトルを検出する。補間フレーム生成手段は、第2の動きベクトルと復号化された画像フレームと復号化された付加情報とに基づいて補間フレームを生成する。
本発明の補間フレーム生成システムでは、補間フレームを生成するために特別に必要となる情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどが符号化されていなくとも、符号化効率を向上させつつ高精度の補間フレームを生成することが可能となる。
請求項18に記載の集積回路装置は、復号化部と、動きベクトル検出部と、補間フレーム生成部とを備えている。復号化部は、画像信号を構成する画像フレームと、画像フレーム間の動きベクトルである第1の動きベクトルに基づいて画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する。動きベクトル検出部は、復号化された画像フレーム間の動きベクトルである第2の動きベクトルを検出する。補間フレーム生成部は、第2の動きベクトルと復号化された画像フレームと復号化された付加情報とに基づいて補間フレームを生成する。
本発明の集積回路装置では、補間フレームを生成するために特別に必要となる情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどが符号化画像信号に含まれていなくとも、符号化効率を向上させつつ高精度の補間フレームを生成することが可能となる。
請求項19に記載の集積回路装置は、第1の動きベクトル検出部と、付加情報作成部と、符号化部とを備えている。第1の動きベクトル検出部は、画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する。付加情報作成部は、画像フレームを補間する補間フレームを第1の動きベクトルに基づいて生成するための付加情報を作成する。符号化部は、画像フレームと付加情報とを符号化する。
本発明の集積回路装置では、補間フレームを生成するために特別に符号化する情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどを符号化することなく、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
請求項20に記載の復号化プログラムは、復号化ステップと、動きベクトル検出ステップと、補間フレーム生成ステップとを備える復号化方法をコンピュータに行わせるための復号化プログラムである。復号化ステップは、画像信号を構成する画像フレームと、画像フレーム間の動きベクトルである第1の動きベクトルに基づいて画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する。動きベクトル検出ステップは、復号化された画像フレーム間の動きベクトルである第2の動きベクトルを検出する。補間フレーム生成ステップは、第2の動きベクトルと復号化された画像フレームと復号化された付加情報とに基づいて補間フレームを生成する。
本発明の復号化プログラムでは、補間フレームを生成するために特別に必要となる情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどが符号化画像信号に含まれていなくとも、符号化効率を向上させつつ高精度の補間フレームを生成することが可能となる。
請求項21に記載の符号化プログラムは、第1の動きベクトル検出ステップと、付加情報作成ステップと、符号化ステップとを備える符号化方法をコンピュータに行わせるための符号化プログラムである。第1の動きベクトル検出ステップは、画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する。付加情報作成ステップは、画像フレームを補間する補間フレームを第1の動きベクトルに基づいて生成するための付加情報を作成する。符号化ステップは、画像フレームと付加情報とを符号化する。
本発明の符号化プログラムでは、補間フレームを生成するために特別に符号化する情報は付加情報のみである。すなわち、補間フレームの動きベクトルなどを符号化することなく、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
本発明により、符号化効率を向上させつつ高精度の補間フレームの生成を行うための復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムを提供することが可能となる。
[第1実施形態]
〈補間フレーム生成システム10の構成〉
図1〜図12を用いて、本発明の第1実施形態としての補間フレーム生成システム、符号化装置および復号化装置について説明する。
図1は、補間フレーム生成システム10の概要を説明するブロック図である。補間フレーム生成システム10は、画像信号d210を入力とし符号化された符号化画像信号d211を出力とする符号化装置11と、符号化画像信号d211を入力とし復号化された復号化画像信号d212を出力とする復号化装置12とを備えている。符号化装置11は、画像信号d210を提供する提供者側に設置され、インターネットや電話回線などの通信網もしくは地上波放送、ケーブルテレビあるいは衛星放送などの放送網などを介して復号化装置12と接続されている。復号化装置12は、符号化画像信号d211を受信する受信者側に設置される。復号化装置12は、主にコンピュータ、携帯電話、PDA、デジタルテレビ、デジタルテレビのセットアップボックスあるいはカーナビゲーションシステムなどの画像を取り扱う機器において備えられる。
補間フレーム生成システム10は、画像信号d210をできるだけ低ビットレートで、すなわち符号化効率を向上させて伝送すること、および画像信号d210をできるだけ高画質で伝送することを目的とするシステムである。より具体的には、画像信号d210をフレーム毎に画面内符号化あるいは画面間符号化する際に、一部のフレーム(例えば、Bフレームなど)については、動きベクトルの伝送を行わない。これにより符号化効率を向上させるとともに、一部のフレーム(例えば、Bフレームなど)の復号化に必要な情報を付加情報として伝送し、復号化画像信号d212を高画質化する。
以下、図2〜図8を用いて、補間フレーム生成システム10に備えられる符号化装置11および復号化装置12について詳細な説明を加える。
〈符号化装置11〉
(符号化装置11の構成)
図2は、符号化装置11の構成について説明するブロック図である。符号化装置11は、画像信号d210を直交変換と量子化を含む方法で符号化し、符号化画像信号d211を出力する装置である。図2では、MPEGなどで用いられる画面内符号化あるいは画面間符号化により画像信号d210を符号化する場合の符号化装置11について説明している。
符号化装置11は、画像信号d210を動き補償符号化し符号化画像信号d211を出力する装置であって、符号化部16と、動き補償部17と、付加情報作成部18とを備えている。
符号化部16は、減算部20と、スイッチ21と、直交変換部22と、量子化部23と、可変長符号化部24と、逆量子化部25と、逆直交変換部26と、加算部27とを備えている。
減算部20は、画像信号d210を第1の入力、動き補償された画像信号d225を第2の入力とし、第1の入力と第2の入力との差分である減算信号d220を出力する。スイッチ21は、減算信号d220の出力先を切り換えるスイッチであり、直交変換部22あるいは付加情報作成部18に接続される。直交変換部22は、スイッチ21の出力である減算信号d220を入力とし、減算信号d220を直交変換したDCT係数d221を出力する。量子化部23は、DCT係数d221を入力とし、DCT係数d221を量子化した量子化DCT係数d222を出力とする。可変長符号化部24は、量子化DCT係数d222を第1の入力、付加情報作成部18の作成した付加情報d231を第2の入力とし、動き補償部17から取得される動きベクトルや符号化モードとあわせて可変長符号化した符号化画像信号d211を出力とする。逆量子化部25は、量子化DCT係数d222を入力とし、量子化DCT係数d222を逆量子化した逆量子化DCT係数d223を出力とする。逆直交変換部26は、逆量子化DCT係数d223を入力とし、逆量子化DCT係数d223を逆直交変換した逆直交変換信号d224を出力とする。加算部27は、逆直交変換信号d224を第1の入力、動き補償された画像信号d225を第2の入力とし、第1の入力と第2の入力とを加算した局所復号化信号d226を出力とする。
動き補償部17は、フレームメモリ30と、動きベクトル検出部31とを備えており、画像信号d210を第1の入力、局所復号化信号d226を第2の入力とし、動き補償された画像信号d225を第1の出力、検出された動きベクトルd228を第2の出力とする。
フレームメモリ30は、局所復号化信号d226を第1の入力、動きベクトル検出部31の検出した動きベクトルd228を第2の入力とし、動きベクトルd228で動き補償された動き補償された画像信号d225を第1の出力、フレームメモリ30に記憶された局所復号化信号d227を第2の出力とする。動きベクトル検出部31は、画像信号d210を第1の入力、フレームメモリ30に記憶された局所復号化信号d227を第2の入力とし、動きベクトルd228を出力とする。
付加情報作成部18は、スイッチ21の出力である減算信号d220を第1の入力、動きベクトルd228を第2の入力とし、付加情報d231を出力とする。
可変長符号化部24は、付加情報d231を、量子化DCT係数d222、動き補償部17から取得される動きベクトルや符号化モードなどとあわせて可変長符号化する。この時、付加情報d231が付加される場合には、可変長符号化される符号列に付加情報d231が付加されていることを示す判別情報が含められてもよい。
なお、上記した各部は、LSIなどの集積回路として、独立にあるいは一体的に構成されている。また、フレームメモリ30は、DRAM、SRAMなどの記憶装置である。
(符号化装置11の作用)
図3と図4とを用いて、画像信号d210を構成する画像フレーム(IフレームI41、BフレームB42,B43、PフレームP44(図3(a)参照))を符号化する場合の符号化装置11の動作について説明する。なお、本発明は、BフレームB42,B43を符号化する場合に特徴を有している。
《IフレームI41、PフレームP44の符号化》
IフレームI41を符号化する場合、減算部20は、減算処理を行わない。また、スイッチ21は、直交変換部22側を向く。これにより、画像信号d210を構成するIフレームI41は、直交変換部22により直交変換され、量子化部23により量子化され、可変長符号化部24により可変長符号化され、符号化画像信号d211として出力される。さらに、量子化されたIフレームI41は、ローカルデコードされフレームメモリ30に記憶される。
PフレームP44を符号化する場合について、図3(b)を用いて説明する。PフレームP44を符号化する場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41との動きベクトルMV46を検出する。さらに、検出された動きベクトルMV46により動き補償された画像信号d225を導出する。減算部20は、画像信号d210と動き補償された画像信号d225との減算処理を行い、減算信号d220を出力する。スイッチ21は、直交変換部22側を向く。これにより、減算信号d220は、直交変換部22により直交変換され、量子化部23により量子化され、可変長符号化部24により可変長符号化され、検出された動きベクトルMV46とともに符号化画像信号d211として出力される。さらに、量子化されたPフレームP44は、ローカルデコードされフレームメモリ30に記憶される。
《BフレームB42の符号化》
BフレームB42を符号化する場合について、図4を用いて説明する。なお、BフレームB43を符号化する場合については同様であり、説明を省略する。
(1)
BフレームB42を符号化する場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41とPフレームP44との動きベクトルを検出する(図4(a)参照)。より具体的には、BフレームB42のブロックb51の符号化に際して、ブロックb51と同じ位置にあるPフレームP44のブロックb53のブロックマッチングをIフレームI41に対して行う。これにより、IフレームI41のブロックb52に対する動きベクトルMV48が検出される。検出された動きベクトルMV48は、動きベクトル検出部31から動きベクトルd228として付加情報作成部18に出力される。同様の処理により、BフレームB42の全てのブロックについて動きベクトルが出力される。
フレームメモリ30は、検出された動きベクトルMV48を用いて、動き補償されたBフレームB42を生成する。より具体的には、画像信号d210におけるIフレームI41とPフレームP44との時間的距離に対する画像信号d210におけるIフレームI41とBフレームB42との時間的距離の割合で動きベクトルMV48を内分し、IフレームI41のブロックb54に対するブロックb51の補間用動きベクトルCMV49を導出する。また、画像信号d210におけるIフレームI41とPフレームP44との時間的距離に対する画像信号d210におけるPフレームP44とBフレームB42との時間的距離の割合で動きベクトルMV48を内分し、PフレームP44のブロックb55に対するブロックb51の補間用動きベクトルCMV50を導出する。さらに、動き補償されたBフレームB42におけるブロックb51に対応する画素値として、ブロックb54とブロックb55の画素値を平均した値が出力される。ブロックb54とブロックb55の画素値を平均した値は、フレームメモリ30から、動き補償された画像信号d225として出力される。同様の処理により、BフレームB42の全てのブロックについて動き補償された画素値が出力される。
減算部20は、画像信号d210と動き補償された画像信号d225とを減算処理し、減算信号d220を出力する。スイッチ21は、付加情報作成部18側を向き、減算信号d220は、付加情報作成部18に入力される。
付加情報作成部18は、入力された減算信号d220の大きさに応じて、付加情報d231の作成を行う。より具体的には、減算信号d220の大きさが[0]あるいは所定の閾値より小さい場合には、付加情報作成部18は、BフレームB42の補間方式と、動きベクトルMV48の動き検出方式とを付加情報d231として作成する。作成された付加情報d231は、可変長符号化部24において、PフレームP44についての量子化DCT係数d222の後に符号化される。
ここで、補間方式とは、BフレームB42の生成に用いられる動きベクトルMV48の向き、BフレームB42の生成に用いられるIフレームI41およびPフレームP44を特定する情報およびBフレームB42の補間位置に関する情報などである。
また、動き検出方式とは、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報である。動き検出のアルゴリズムに関する情報とは、全探索、間引き探索、OAT探索、Nステップ探索、階層型探索などと呼ばれる探索方法を指定する情報である。探索範囲に関する情報とは、ブロックマッチングを行う画素領域(±8画素、±16画素、±32画素、±64画素など)に関する情報である。サブペル精度に関する情報とは、ブロックマッチングを行う画素精度(整数画素単位、1/2画素単位、1/4画素単位、1/8画素単位など)に関する情報である。評価関数に関する情報とは、ブロックマッチングにおける評価関数であるSAD(絶対差分和)やSSD(平方差分和)などを指定する情報である。
(2)
一方、減算信号d220の大きさが所定の閾値より大きい場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41とPフレームP44とに対する画像信号d210におけるBフレームB42の動きベクトルを検出する(図4(b)参照)。より具体的には、画像信号d210におけるBフレームB42のブロックb51の符号化に際して、ブロックb51の双方向へのブロックマッチングを行い、IフレームI41のブロックb61に対する動きベクトルMV63とPフレームP44のブロックb62に対する動きベクトルMV64とが検出される。検出された動きベクトルMV63とMV64とは、動きベクトル検出部31から動きベクトルd228として付加情報作成部18に出力される。同様の処理により、BフレームB42の全てのブロックについて動きベクトルが出力される。
さらに、フレームメモリ30は、検出された動きベクトルMV63とMV64とを用いて動き補償されたBフレームB42を作成する。より具体的には、動き補償されたBフレームB42のブロックb51に対応する画素値として、ブロックb61とブロックb62の画素値を平均した値が出力される。ブロックb61とブロックb62の画素値を平均した値は、フレームメモリ30から、動き補償された画像信号d225として出力される。同様の処理により、BフレームB42の全てのブロックについて動き補償された画素値が出力される。
減算部20は、画像信号d210を構成するBフレームB42と動き補償された画像信号d225(動きベクトルMV63、MV64により動き補償されたBフレームB42)とを減算処理し、減算信号d220を出力する。スイッチ21は、付加情報作成部18側を向き、減算信号d220は、付加情報作成部18に入力される。
付加情報作成部18は、上記した補間方式と動き検出方式とに加えて、残差情報とベクトル差分とを付加情報d231として作成する。作成された付加情報d231は、可変長符号化部24において、PフレームP44についての量子化DCT係数d222の後に符号化される。
ここで、残差情報とは、減算信号d220の値である。また、ベクトル差分とは、動きベクトルMV48に基づいて、BフレームB42の動きベクトルMV63とMV64とを導出するための情報であり、具体的には、動きベクトルMV63と補間用動きベクトルCMV49とのベクトル差分および動きベクトルMV64と補間用動きベクトルCMV50とのベクトル差分のことである(図4(c)参照)。
(方法・プログラム)
図5に、符号化装置11における付加情報作成方法について説明するフローチャートを示す。なお、詳しい内容は、上記と同様であり、説明を省略する。また、この付加情報作成方法は、全てあるいは一部の動作をプログラムとして実行可能である。
画像信号d210におけるBフレームB42を符号化する場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41とPフレームP44との動きベクトルを検出する(ステップS401)。さらに、フレームメモリ30は、検出された動きベクトルを用いて、動き補償されたBフレームB42を作成する(ステップS402)。減算部20は、画像信号d210に含まれるBフレームB42と動き補償されたBフレームB42とを減算処理し減算信号d220を出力する(ステップS403)。
付加情報作成部18は、減算信号d220の大きさに応じて、付加情報d231の作成を行う。
減算信号d220の大きさが[0]あるいは所定の閾値より小さい場合には、付加情報作成部18は、BフレームB42の補間方式と、動きベクトルMV48の動き検出方式とを付加情報d231として作成する(ステップS404,S405)。
減算信号d220の大きさが所定の閾値より大きい場合、動き補償部17は、既にローカルデコードされフレームメモリ30に記憶されているIフレームI41とPフレームP44とに対する画像信号d210におけるBフレームB42の動きベクトルを検出する(ステップS406)。フレームメモリ30は、検出された動きベクトルを用いて、動き補償されたBフレームB42を作成する(ステップS407)。減算部20は、画像信号d210に含まれるBフレームB42と動き補償されたBフレームB42とを減算処理し、減算信号d220を出力する(ステップS408)。
付加情報作成部18は、補間方式と動き検出方式とに加えて、残差情報とベクトル差分とを付加情報d231として作成する(ステップS409)。ここで、残差情報とは、ステップS408で出力された減算信号d220の値である。また、ベクトル差分とは、ステップS406で検出された動きベクトルと、ステップS401で検出された動きベクトルから作成された補間用動きベクトルとの差分である。
〈復号化装置12〉
(復号化装置12の構成)
図6は、復号化装置12の構成について説明するブロック図である。復号化装置12は、画像信号d210を直交変換と量子化を含む方法で符号化した符号化画像信号d211を復号化し、復号化画像信号d212を出力する装置である。復号化装置12は、復号化部70と、フレーム出力部71とを備えている。
復号化部70は、動き補償符号化された符号化画像信号d211を入力とし、画像フレームd258〜d260を第1〜第3の出力、付加情報d252を第4の出力とする。復号化部70は、可変長復号化部72と、逆量子化部73と、逆直交変換部74と、加算部75と、フレームメモリ76と、動き補償部77とを備えている。
可変長復号化部72は、符号化画像信号d211を第1の入力とし、符号化画像信号d211を復号化することにより、量子化DCT係数d250を第1の出力、復号化動きベクトルd251を第2の出力、付加情報d252を第3の出力とする。逆量子化部73は、量子化DCT係数d250を入力とし、量子化DCT係数d250を逆量子化した逆量子化DCT係数d253を出力とする。逆直交変換部74は、逆量子化DCT係数d253を入力とし、逆量子化DCT係数d253を逆直交変換した逆直交変換信号d254を出力とする。加算部75は、逆直交変換信号d254を第1の入力、動き補償された画像フレームd255を第2の入力とし、第1の入力と第2の入力とを加算した加算信号d256を出力とする。フレームメモリ76は、加算信号d256を入力とし、画像フレームd257〜d260を第1〜第4の出力とする。動き補償部77は、復号化動きベクトルd251を第1の入力、画像フレームd257を第2の入力とし、動き補償された画像フレームd255を出力とする。
フレーム出力部71は、画像フレームd258〜d260を第1〜第3の入力とし、付加情報を第4の入力とし、復号化画像信号d212を出力とする。フレーム出力部71は、動きベクトル検出部79と、補間フレーム生成部80と、スイッチ81とを備えている。
動きベクトル検出部79は、画像フレームd260を第1の入力、付加情報d252を第2の入力とし、画像フレームd260間に検出された動きベクトルd265を出力とする。補間フレーム生成部80は、画像フレームd259を第1の入力、動きベクトルd265を第2の入力、付加情報d252を第3の入力とし、補間フレームd268を出力とする。スイッチ81は、画像フレームd258を第1の入力、補間フレームd268を第2の入力とし、それぞれの入力を切り換えて復号化画像信号d212を出力する。
なお、上記した各部は、LSIなどの集積回路として、独立にあるいは一体的に構成されている。また、フレームメモリ76は、DRAM、SRAMなどの記憶装置である。
(復号化装置12の作用)
画像信号d210を構成する画像フレーム(IフレームI41、BフレームB42,B43、PフレームP44(図3(a)参照))が符号化された符号化画像信号d211を復号化する場合の復号化装置12の動作について説明する。なお、本発明は、BフレームB42,B43を復号化する場合に特徴を有している。
《IフレームI41、PフレームP44の復号化》
IフレームI41を復号化する場合、符号化画像信号d211は、可変長復号化部72により可変長復号化され、逆量子化部73により逆量子化され、逆直交変換部74により逆直交変換され、逆直交変換信号d254が出力される。また、加算部75は、加算処理を行わない。これにより、フレームメモリ76には、復号化されたIフレームI41が記憶される。スイッチ81は、IフレームI41を出力するタイミングでフレームメモリ76側を向く。これにより、IフレームI41が復号化画像信号d212として出力される。
PフレームP44を復号化する場合、符号化画像信号d211は、可変長復号化部72により可変長復号化され、逆量子化部73により逆量子化され、逆直交変換部74により逆直交変換され、逆直交変換信号d254が出力される。また、動き補償部77は、可変長復号化部72より取得された復号化動きベクトルd251と、フレームメモリ76に記憶されたIフレームI41とを用いて、動き補償された画像フレームd255(動き補償されたPフレームP44)を出力する。加算部75は、逆直交変換信号d254と動き補償された画像フレームd255とを加算する。これにより、フレームメモリ76には、復号化されたPフレームP44が記憶される。スイッチ81は、PフレームP44を出力するタイミングでフレームメモリ76側を向く。これにより、PフレームP44が復号化画像信号d212として出力される。
《BフレームB42の復号化》
BフレームB42を復号化する場合について、図7を用いて説明する。なお、BフレームB43を復号化する場合については同様であり、説明を省略する。
(1)
復号化部70は、符号化画像信号d211が付加情報d252を含んでいない場合には、従来のBフレームと同様の符号化が行われていると判断する。すなわち、符号化画像信号d211は、可変長復号化部72により可変長復号化され、逆量子化部73により逆量子化され、逆直交変換部74により逆直交変換され、逆直交変換信号d254が出力される。また、動き補償部77は、可変長復号化部72より取得された復号化動きベクトルd251とフレームメモリ76に記憶されたIフレームI41またはPフレームP44とを用いて、動き補償された画像フレームd255(動き補償されたBフレームB42)を出力する。加算部75は、逆直交変換信号d254と動き補償された画像フレームd255とを加算する。これにより、フレームメモリ76には、復号化されたBフレームB42が記憶される。スイッチ81は、BフレームB42を出力するタイミングでフレームメモリ76側を向く。これにより、BフレームB42が復号化画像信号d212として出力される。
(2)
一方、符号化画像信号d211が付加情報d252を含んでいる場合には、フレーム出力部71においてBフレームB42の生成が行われる。以下、具体的に説明する。
なお、符号化画像信号d211が付加情報d252を含んでいることは、付加情報d252の有無で判断してもよいが、可変長復号化される符号化画像信号d211が判別情報を含んでいるか否かで判断してもよい。ここで、判別情報とは、符号化画像信号d211に付加情報d231が付加されているか否かを示すものであり、例えば、フラグなどで有ってもよい。
(2−1)
動きベクトル検出部79は、付加情報d252が含む補間方式および動き検出方式を取得し、動きベクトルの検出を行う。
ここで、補間方式とは、BフレームB42の生成に用いられる動きベクトルの向き、BフレームB42の生成に用いられるIフレームI41およびPフレームP44を特定する情報およびBフレームB42の補間位置に関する情報などである。
また、動き検出方式とは、動き検出のアルゴリズム、探索範囲、サブペル精度、評価関数などに関する情報である。動き検出のアルゴリズムに関する情報とは、全探索、間引き探索、OAT探索、Nステップ探索、階層型探索などと呼ばれる探索方法を指定する情報である。探索範囲に関する情報とは、ブロックマッチングを行う領域に関する情報である。サブペル精度に関する情報とは、ブロックマッチングを行う精度に関する情報である。評価関数に関する情報とは、ブロックマッチングにおける評価関数であるSAD(絶対差分和)やSSD(平方差分和)などを指定する情報である。
図7(a)を用いて、動きベクトル検出部79の動作についてさらに詳しく説明する。BフレームB42のブロックb51を復号化する場合、動きベクトル検出部79は、補間方式が指定する画像フレーム間の動きベクトルであって、ブロックb51に対応する位置のブロックの動きベクトルを検出する。図7(a)は、補間方式として、BフレームB42の生成に用いられる動きベクトルは、PフレームP44からIフレームI41への動きベクトルである、という情報が含まれている場合に検出される動きベクトルMV90について示している。この場合、動きベクトル検出部79は、フレームメモリ76に記憶されているPフレームP44のブロックb53からIフレームI41のブロックb91への動きベクトルMV90を検出する。この際、動きベクトル検出部79は、付加情報d252が含む動き検出方式により動きベクトルMV90の検出を行う。
(2−2)
補間フレーム生成部80は、付加情報d252が含む補間方式、残差情報およびベクトル差分を取得し、BフレームB42の生成を行う。
ここで、残差情報とは、符号化装置11(図2参照)において、画像信号d210が含むBフレームB42と動き補償されたBフレームB42とを減算処理した減算信号d220の値である。ベクトル差分とは、具体的には、動きベクトルMV63と補間用動きベクトルCMV49とのベクトル差分および動きベクトルMV64と補間用動きベクトルCMV50とのベクトル差分のことである(図4(c)参照)。
図7(b)および(c)を用いて、補間フレーム生成部80の動作についてさらに詳しく説明する。補間フレーム生成部80は、動きベクトル検出部79が検出した動きベクトルMV90を補間方式が含むBフレームB42の補間位置により内分し、BフレームB42からIフレームI41への補間用動きベクトルCMV93と、BフレームB42からPフレームP44への補間用動きベクトルCMV95とを導出する(図7(b)参照)。
導出された補間用動きベクトルCMV93に対して、動きベクトルMV63と補間用動きベクトルCMV49とのベクトル差分を加算し、BフレームB42からIフレームI41への動きベクトルMV97が作成される(図7(c)参照)。また同様に、導出された補間用動きベクトルCMV95に対して、動きベクトルMV64と補間用動きベクトルCMV50とのベクトル差分を加算し、BフレームB42からPフレームP44への動きベクトルMV99が作成される(図7(c)参照)。
さらに、作成された動きベクトルMV97とMV99とを用いて、動き補償されたBフレームB42を作成する。より具体的には、動き補償されたBフレームB42のブロックb51に対応する画素値として、ブロックb51を動きベクトルMV97で移動させた先のブロックb101とブロックb51を動きベクトルMV99で移動させた先のブロックb103との画素値を平均した値が計算される。補間フレーム生成部80は、ブロックb101とブロックb103との画素値をフレームメモリ76からの出力である画像フレームd259により取得する。
さらに、補間フレーム生成部80は、付加情報d252が残差情報を含む場合、動き補償されたBフレームB42の値に残差情報の値を加算し、復号化されたBフレームB42を出力する。復号化されたBフレームB42は、補間フレームd268として補間フレーム生成部80から出力される。
スイッチ81は、BフレームB42を出力するタイミングで補間フレーム生成部80側を向く。これにより、BフレームB42が復号化画像信号d212として出力される。
(方法・プログラム)
図8に復号化装置12における補間フレーム生成方法について説明するフローチャートを示す。なお、詳しい内容は、上記と同様であり、説明を省略する。また、この補間フレーム生成方法は、全てあるいは一部の動作をプログラムとして実行可能である。
復号化部70は、符号化画像信号d211が付加情報d252を含まない場合、画面内符号化されたIフレーム、画面間符号化されたPフレームあるいはBフレームの復号化を行う(ステップS431、ステップS432)。
符号化画像信号d211が付加情報d252を含む場合、フレーム出力部71によるBフレームB42(図7(a)参照)の復号化が行われる(ステップS433〜S439)。
付加情報d252が含む補間方式および動き検出方式に基づいて、フレームメモリ76に記憶されている画像フレームについて動きベクトルが検出される(ステップS433)。また、付加情報d252が含む補間方式に基づいて、ステップS433で検出された動きベクトルから補間用動きベクトルが導出される(ステップS434)。補間フレーム生成部80は、付加情報d252がベクトル差分を含むか否かを判定し(ステップS435)、ベクトル差分を含む場合には、補間用動きベクトルに対してベクトル差分を加算して、BフレームB42からIフレームI41またはPフレームP44への動きベクトルを作成する(ステップS436)。ベクトル差分を含まない場合には、導出された補間用動きベクトルを作成された動きベクトルとみなす。
補間フレーム生成部80は、作成された動きベクトルを用いて、動き補償されたBフレームB42を作成する(ステップS437)。補間フレーム生成部80は、付加情報d252が残差情報を含むか否かを判定し(ステップS438)、残差情報を含む場合には、動き補償されたBフレームB42に対して残差情報を適用して(ステップS439)、復号化されたBフレームB42を出力する。残差情報を含まない場合には、ステップS437で作成された動き補償されたBフレームB42を復号化されたBフレームB42とみなす。
〈補間フレーム生成システム10の効果〉
(符号化装置11の効果)
《1》
本発明の符号化装置11では、BフレームB42を生成するために特別に符号化する情報は付加情報d231のみである。すなわち、BフレームB42について検出された動きベクトル(動きベクトルMV63,MV64(図4(b)参照))を符号化することなく、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
《2》
本発明の符号化装置11では、以下のいずれかの効果が実現される。すなわち、付加情報d231に補間方式、ベクトル差分、あるいは動き検出方式が含まれる場合には、BフレームB42の動きベクトルMV63,MV64のより正確な作成が可能となる。さらには、BフレームB42のより正確な生成が可能となる。また、付加情報d231に残差情報が含まれる場合には、BフレームB42の画素値のより正確な生成が可能となる。
《3》
本発明の符号化装置11では、付加情報d231が含む情報を必要に応じて変更可能である(図5(ステップS404)参照)。このためさらなる符号化効率の向上が可能となる。
《4》
本発明の符号化装置11では、付加情報d231は、Bフレーム毎に作成されている。このため、より高精度な補間フレームの生成が可能となる。
(復号化装置12の効果)
《1》
本発明の復号化装置12では、BフレームB42を生成するために特別に符号化する情報は付加情報d231のみである。すなわち、画像信号d210におけるBフレームB42について検出された動きベクトル(動きベクトルMV63,MV64(図4(b)参照))が符号化されていなくとも、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
《2》
本発明の復号化装置12では、以下のいずれかの効果が実現される。すなわち、付加情報d231に補間方式、ベクトル差分、あるいは動き検出方式が含まれる場合には、画像信号d210におけるBフレームB42の動きベクトルMV63,MV64がより正確に作成される。さらには、BフレームB42のより正確な生成が可能となる。また、付加情報d231に残差情報が含まれる場合には、BフレームB42の画素値のより正確な生成が可能となる。
《3》
本発明の復号化装置12では、付加情報d231を含まない符号化画像信号d211を取得した場合にもBフレームB42を生成することが可能となる(図8(ステップS431)参照)。すなわち、従来法との互換性が保たれている。
《4》
本発明の復号化装置12では、付加情報d231は、Bフレーム毎に作成されている。このため、より高精度な補間フレームの生成が可能となる。
(補間フレーム生成システム10の効果)
《1》
本発明の補間フレーム生成システム10では、BフレームB42を生成するために特別に符号化する情報は付加情報d231のみである。すなわち、BフレームB42について検出された動きベクトル(動きベクトルMV63,MV64(図4(b)参照))が符号化されていなくとも、符号化効率の向上と高精度の補間フレームの生成とが可能となる。
より具体的に効果について説明する。補間フレーム生成システム10では、付加情報d231を用いて、符号化装置11の動きベクトル検出部31と、復号化装置12の動きベクトル検出部79とに同様の動き検出を実現させることが可能となる。これにより、動きベクトルMV48(図4参照)と動きベクトルMV90(図7参照)とを近似したベクトルとして検出することが可能となる。また、符号化および復号化の基準となる情報(動きベクトルMV48および動きベクトルMV90)について伝送することなく、この基準となる情報からの差分のみを伝送する。このため、符号化効率の向上が可能となる。さらに、従来と同程度に高精度な補間フレームの生成が可能となる。
〈変形例〉
本発明はかかる上記実施形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形又は修正が可能である。また、上記実施形態で述べた方法は、プログラムとしてコンピュータなどにより実現されることも可能である。
(動きベクトルについて)
《1》
上記実施形態では、BフレームB42に対して時間的に前方に位置するIフレームI41と、時間的に後方に位置するPフレームP44との間の動きベクトルMV48を検出すると説明した(図4参照)。ここで、BフレームB42の符号化のために検出される動きベクトルは、これに限定されるものでは無い。
例えば、IフレームI41からPフレームP44への動きベクトルが検出されていてもよい。また、BフレームB42に対して時間的に前方あるいは後方に位置する複数の画像フレーム間について動きベクトルが検出されていてもよい。また、動きベクトルの検出は、一方向のみでなく、双方向に検出されるものであってもよい。
また、これら複数の検出方法について、動きベクトルの検出精度を比較し、最も精度の高い方法を採用するとしてもよい。
さらに、図4に示したフレームの構成は一例であり、本発明の効果がこのフレームの構成に限定されるものではない。
例えば、IフレームI41は、Pフレームに置き換えられていてもよいし、PフレームP44は、Iフレームに置き換えられていてもよい。また、Bフレームの枚数も図4に示した枚数に限定されるものではない。
また、本発明の効果は、上記実施形態で説明したIフレームI41、PフレームP44の符号化の方法に限定されるものでは無い。例えば、IフレームI41は、あらかじめ決められたルールに従い、フレームメモリ30に作成された画素値の減算処理を行うことにより符号化されるものであっても良い。より具体的には、MPEG−4などで行われる様に、イントラ符号化では、フレーム内で予測画素を作成し、その画素値を減算し、その残差成分の符号化を行うものであってもよい。すなわち、本発明では、符号化済のフレームであれば、符号化方法に依存せず、IフレームI41、PフレームP44の代わりに用いられることが可能である。
また、同様に、本発明の効果は、上記実施形態で説明したIフレームI41、PフレームP44の復号化の方法に限定されるものでは無い。例えば、加算部75は、あらかじめ決められたルールに従い、フレームメモリ76に作成された画素値の加算処理を行うことにより、IフレームI41を復号化するものであっても良い。
《2》
上記実施形態では、ブロックb51に対する補間用動きベクトルCMV49,CMV50を導出するための動きベクトルMV48は、ブロックb51と同じ位置にあるPフレームP44のブロックb53について検出される動きベクトルであると説明した(図4参照)。ここで、動きベクトルの検出方法は、これに限定されるものでは無い。
例えば、ブロックb51に対する補間用動きベクトルを導出するための動きベクトルは、PフレームP44とIフレームI41との間に検出される動きベクトルのうち、ブロックb51を横切る動きベクトルとして求められてもよい。
さらにこの場合、ブロックb51を横切る複数の動きベクトルがある場合には、それらの動きベクトルにより動き補償されたBフレームB42のブロックb51に対応する画素値として、複数の動きベクトルを検出するのに用いられたブロックの画素値を単純平均あるいは加重平均した値としてもよい。
さらにこの場合、ブロックb51を横切る動きベクトルが無い場合には、ブロックb51の近傍のブロックの動きベクトルの平均値、もしくは線形補間の値、もしくは平滑化フィルタをかけた値、もしくは重みつきの平滑化フィルタをかけた値などの値としてもよい。
《3》
上記実施形態では、BフレームB42に対して双方向の補間用動きベクトルCMV49,CMV50が導出され、BフレームB42に対して双方向の動きベクトルMV63,MV64が検出され、それぞれのベクトル差分が算出されると説明した。ここで、BフレームB42のそれぞれのブロックについて検出される動きベクトルは、双方向のものに限定されない。
例えば、一方向のものであっても良いし、さらに多くの動きベクトルが検出されるものであってもよい。
《4》
上記実施形態では、ブロックb51に対する補間用動きベクトルCMV49,CMV50は、ブロックb51と同じ位置にあるPフレームP44のブロックb53について検出される動きベクトル、または、PフレームP44とIフレームI41との間に検出される動きベクトルのうち、ブロックb51を横切る動きベクトルにより算出される値であると説明した(図4参照)。ここで、補間用動きベクトルの導出方法は、これに限定されるものでは無い。
これについて、図9を用いて説明する。図9(a)は、図4のBフレームB42を符号化する場合の例である。画像信号d210におけるBフレームB42を符号化する場合、PフレームP44とIフレームI41との間に検出される動きベクトルにより算出される値から、BフレームB42上のブロックb511〜b519に対して、双方向のベクトルV511a〜V519a及び、V511b〜V519bが算出できる(図9(a)参照)。ここで、PフレームP44とIフレームI41との間に検出される動きベクトルからベクトルV511a〜V519a及び、V511b〜V519bを導出する方法は、上記実施形態で、補間用動きベクトルの導出方法として説明した方法と同様である。なお、図9において、V511b〜V519bについては、V511a〜V519aと同じ処理で行うため、説明は省略する。
さらに、それぞれのブロックについて導出されたベクトルを隣接ブロックについて導出されたベクトルを用いて平滑化処理などすることにより、それぞれのブロックについて補間用動きベクトルが導出される。例えば、ブロックb515に対する補間用動きベクトルCMV515a及びCMV515bは、周囲のブロックのベクトルであるV511a〜V519a及び、V511b〜V519bに対して、例えば、平滑化フィルタまたはメディアンフィルタまたは重みをつけた平滑化フィルタをかけることにより、算出される(図9(b)参照)。また、周囲のブロックの範囲は8近傍でなくてもよい。
なお、PフレームP44とIフレームI41との間に検出される動きベクトルを平滑化し、平滑化された動きベクトルを内分あるいは外分することにより補間用動きベクトルを算出しても同様の結果が得られる。
符号化装置11では、算出された補間用動きベクトルを用いて、上記実施形態で説明したベクトル差分、残差情報を計算し、付加情報として符号化する。
あるいは、ベクトル差分、残差情報は付加情報として符号化せず、補間方式あるいは平滑化方式などを付加情報として符号化する。
復号化装置12では、復号化したPフレームP44とIフレームI41とから、各ブロックに対する補間用動きベクトルを算出する。さらに、補間用動きベクトルと付加情報とを用いて、各ブロックの復号化を行う。
ここで、付加情報としてベクトル差分、残差情報が含まれていない場合には、補間用動きベクトルを各ブロックの動きベクトルとみなして補間フレームの各ブロックの復号化を行う。
以上の手順で導出された補間用動きベクトルは、例えば、付加情報として残差情報あるいはベクトル差分が伝送されない場合において、言い換えれば、低ビットレートの伝送において、復号化装置12で生成されるBフレームの画質向上に有効である。すなわち、復号化装置12で算出される各ブロックの補間用動きベクトルでは、隣接ブロックとの空間的な相関性が強められており、Bフレームの精度の向上、特にブロック歪みなどの削減に有効である。
《5》
上記実施形態では、BフレームB42のブロックb51の大きさについて、PフレームP44のブロックと同じ大きさとして説明した(図4参照)。ここで、ブロックb51の大きさは、これに限定されるものでは無い。
例えば、BフレームB42のブロックb51はPフレームP44のブロックの4分の1の大きさであってもよい。
これにより、詳細に動き補償することができるため、復号化装置12で生成されるBフレームの精度を向上させることができる。
(付加情報について)
《6》
符号化装置11で作成される付加情報d231は、デフォルトの付加情報をコード化して含むものであってもかまわない。これについて、図10と図11とを用いて説明する。
(6−1)
図10は、付加情報d231が含む動き検出方式のパラメータの組み合わせを特定するためのテーブル110である。テーブル110は、動き検出の探索範囲(±8画素、±16画素、±32画素、±64画素)、サブペル精度(整数画素単位、1/2画素単位、1/4画素単位、1/8画素単位)および評価関数(F1〜F4:F1〜F4は、SADあるいはSSDなどの評価関数を示す。)についてパラメータの組み合わせを複数格納しており、それぞれの組み合わせは、コード情報111により特定可能である。なお、符号化装置11と復号化装置12とは、共通のテーブル110を有している。
付加情報d231は、動きベクトル検出部31で実行された動き検出方式をコード情報111として含んでいる。コード情報111は、数ビットの情報として表現される。このため、付加情報d231の情報量は、さらに削減可能となる。
なお、動き検出方式に限らず、補間方式などについてもテーブル化されていてもよい。また、図10は、一例であり、本発明の効果がこの場合に限定されるものではない。
(6−2)
図11は、付加情報d231が含む情報の組み合わせを特定するためのテーブル115である。テーブル115は、付加情報d231が含む情報の組み合わせを複数のプロファイル情報116として有している。図11では、プロファイル情報116は、1〜4の番号により特定される。また、テーブル115中[○]は、その情報が含まれていることを示している。テーブル115中[×]は、その情報が含まれていないことを示している。なお、符号化装置11と復号化装置12とは、共通のテーブル110を有している。
復号化装置12では、テーブル115により、符号化画像信号d211から取得された付加情報d252が含む情報の組み合わせを認識可能となる。このため、復号化装置12は、付加情報d252が含む情報の一部を利用できない場合であっても、その情報が含まれているか否かを認識することにより確実にスキップすることが可能となる。また、付加情報d252が含む情報を確実に取得することが可能となる。このため、付加情報d252の内容を誤って認識することが防止可能となる。
なお、図11は、一例であり、本発明の効果がこの場合に限定されるものではない。
《7》
復号化装置12(図6参照)において、動きベクトル検出部79は、符号化画像信号d211から取得された付加情報d252が指定する動き検出方式を実行できない場合には、あらかじめ定めた他の動き検出方式により動きベクトルの検出を行ってもよい。
図12は、付加情報d252が指定する動き検出のアルゴリズム120と、動きベクトル検出部79で実行される動き検出のアルゴリズム121との対応関係について示している。
これにより、動きベクトル検出部79は、付加情報d252が指定する動き検出のアルゴリズム120を実行できない場合であっても、できるだけ近い動きベクトルを検出することができる他の動き検出のアルゴリズム121を実行する。
なお、図12は、対応関係の一例であり、本発明の効果がこの場合に限定されるものではない。
《8》
符号化装置11(図2参照)では、動き検出方式あるいは補間方式などの情報があらかじめ定めたデフォルトと一致する場合には、付加情報d231に含めないこととしてもよい。
この場合、復号化装置12(図6参照)では、動き検出方式あるいは補間方式などに相当する情報が付加情報d252に含まれない場合には、あらかじめ符号化装置11と共通に有するデフォルトの動き検出方式あるいは補間方式を用いて補間フレームの生成を行う。
また、符号化装置11(図2参照)では、画像フレームの画面間符号化の際に検出される動きベクトルが利用可能である場合には、動き検出方式を付加情報d231に含めないこととしても良い。
例えば、BフレームB42の符号化に際して検出される動きベクトルMV48(図4(a)参照)がすでにPフレームP44の符号化の際に検出されている場合、再度PフレームP44とIフレームI41との動きベクトルの検出を行わない。符号化装置11では、BフレームB42の符号化に際して、PフレームP44の符号化の際に検出された動きベクトルを利用する。
この場合、復号化装置12では、補間フレームの生成に際して、動きベクトル検出部79によるPフレームP44とIフレームI41との動きベクトルの検出を行わない。補間フレーム生成部80は、復号化部70から、PフレームP44の符号化の際に用いられた動きベクトル取得し、この動きベクトルを利用してBフレームB42の復号化を行う。
《9》
上記実施形態では、付加情報d231は、補間フレーム毎に作成されるとした。ここで、付加情報d231に含まれる情報のうちの一部は、画像信号d210のストリーム毎に含まれるものであってもよい。
例えば、動き検出方式や補間方式などは、画像信号d210のストリーム毎に含まれるものであってもよい。これにより、補間フレーム毎に動き検出方式や補間方式を付加する必要がなくなり、符号化効率が向上する。
また、付加情報d231の少なくとも一部は、画像信号d210のストリームヘッダとして含まれるものであっても良い。
《10》
上記実施形態では、付加情報作成部18は、入力された減算信号d220の大きさに応じて、付加情報d231の作成を行うとした。ここで、付加情報作成部18は、動きベクトル検出部31によるPフレームP44とIフレームI41との動きベクトルの検出結果に応じて、付加情報d231の作成を行ってもよい。
例えば、動きベクトル検出部31での動きベクトルが近傍の動きベクトルとの類似している、つまり大きく異ならない場合、付加情報を作成する。また、付加情報作成部18は、前記減算信号d220の大きさ及び動きベクトル検出部31での動きベクトルの近傍の動きベクトルと類似性に応じて、付加情報d231の作成を行ってもよい。
これにより、Bフレームの生成精度の向上を図ることができる。
《11》
上記実施形態では、残差情報を付加情報d231とする際に、減算信号d220を付加情報作成部18に入力するとした。ここで、残差情報を付加情報d231とする際に、減算信号d220を直行変換部22および量子化部23を用いて処理した量子化DCT係数d222を付加情報作成部18に入力してもよい。
この場合、付加情報d231の情報量を削減することが可能である。
また、これに対応して、復号化装置12においても、可変長復号化部72により出力される付加情報d252のうち、減算信号d220を直行変換部22および量子化部23を用いて処理した量子化DCT係数d222は、逆量子化部73および逆直行変換部74を用いて処理され、補間フレーム生成部80に出力されるものであってもよい。これにより、減算信号d220の値は、補間フレーム生成部80に与えられることとなる。
(復号化部70について)
《12》
上記実施形態では、復号化部70は、符号化画像信号d211が付加情報d252を含んでいない場合には、BフレームB42について従来のBフレームと同様の符号化が行われていると判断すると説明した(図8(ステップS431)参照)。ここで、復号化部70は、付加情報d252が含まれていない場合には、フレームメモリ76に記憶されている画像フレームを用いて補間フレームを生成するものであってもよい。
例えば、補間フレーム生成部80は、あらかじめ定めた方法により補間フレームの生成を行う。
ここで、あらかじめ定めた方法とは、例えば、フレームメモリ76に記憶されている画像フレーム間の動きベクトルを検出し、補間フレームの動きベクトルを求め、補間フレームを生成する方法や、符号化画像信号d211が含む画面間符号化された画像フレームの動きベクトルを用いて、補間フレームの動きベクトルを求め、補間フレームを生成する方法などである。
(符号化装置11および復号化装置12について)
《13》
符号化装置11(図2参照)および復号化装置12(図6参照)の各部は、それぞれ一体として存在していてもよいし、別体として存在していても良い。例えば、符号化装置11において、符号化部16と、動き補償部17と、付加情報作成部18などは、一体として備えられるものであっても、別々の装置として別体として備えられるものであってもよい。また、復号化装置12において、復号化部70とフレーム出力部71とは一体として備えられるものであっても、別々の装置として別体として備えられるものであってもよい。
《14》
符号化装置11(図2参照)および復号化装置12(図6参照)の各部は、それぞれフレーム単位での切換として説明した。ここで、切換の単位はブロック単位であってもよい。例えば、スイッチ21(図2参照)やスイッチ81(図6参照)の動作は、ブロック単位での判定で行っても良い。
この場合、図5で説明した付加情報作成方法および図8で説明した補間フレーム生成方法におけるBフレームについての処理は、ブロック単位で行われることとなる。
これにより、ブロック毎に適した符号化・復号化方法を選択することができるため、Bフレームの画質を向上させることができる。
また、上記実施形態および変形例で説明したそれぞれの内容は、ブロック単位、フレーム単位、ストリーム単位などで任意に組み合わせて用いられることが可能である。
また、ブロック単位で切換を行う場合、Bフレームの符号化では、付加情報を作成しない従来の符号化と、付加情報を作成する本発明の符号化とを切換るものであってもよい。
具体的には、スイッチ21(または、スイッチ21を制御する制御部(図示せず))は、Bフレームを構成するブロック毎に以下に示す符号化手法選択処理を行う。符号化手法選択処理は、入力されたブロックに対して、符号化手法の候補毎に、次の(式1)を計算する。
J=D+λ・R ・・・ (式1)
ここで、Jは、コスト、Dは、ひずみ、λは、所定の係数、Rは、符号量である。より詳しくは、Dは、それぞれの手法を用いて符号化した画像の復号化画像と、原画像との誤差を示す。Rは、それぞれの手法を用いて符号化した場合の符号量を示し、量子化DCT係数d222、動きベクトル、符号化モード、付加情報d231などを符号化する場合の符号量である。
符号化手法選択処理は、計算された(式1)の値Jを最小とする符号化手法の候補を選択する。
これにより、(式1)を最小とする符号化手法の候補がブロック毎に選択され、復号化の際のひずみを抑えつつ、符号量を低減するBフレームの符号化が実現できる。
なお、符号化手法の候補としては、従来の符号化手法や、上記実施形態で説明した符号化手法が用いられる。ここで、従来の符号化手法とは、例えば、Bフレームを構成するブロックの符号化手法として用いられる画面内符号化、片方向予測、双方向予測、ダイレクトモードなどといった手法である。
より具体的には、画面内符号化、片方向予測は、IフレームやPフレームの符号化として説明したのと同様に行われる。双方向予測では、動き補償部17(図2参照)は、既にローカルデコードされフレームメモリ30に記憶されているIフレームとPフレームとに対して、Bフレームの動きベクトルを検出する。さらに、フレームメモリ30は、検出された動きベクトルを用いて動き補償されたBフレームを作成する。さらに、減算部20は、画像信号d210を構成するBフレームと動き補償されたBフレームとを処理し、減算信号d220を出力する。また、ダイレクトモードでは、動き補償部17(図2参照)は、既にローカルデコードされフレームメモリ30に記憶されているPフレームにおいて、符号化対象となるBフレームのブロックと同じ位置にあるブロック(アンカーブロック)の動きベクトルを、Bフレームの位置でスケーリングし、BフレームのIフレームおよびPフレームに対する動きベクトルを算出する。さらに、フレームメモリ30は、検出された動きベクトルを用いて動き補償されたBフレームを作成する。さらに、減算部20は、画像信号d210を構成するBフレームと動き補償されたBフレームとを処理し、減算信号d220を出力する。
スイッチ21により、従来法がBフレームの符号化手法として選択された場合には、スイッチ21は、直交変換部22側を向き、減算信号d220は、直交変換部22に入力される。また、検出された動きベクトルは、可変長符号化部24に入力される。
このように、従来法と本発明の手法とをブロック毎に切換えることにより、より符号化効率が向上する。例えば、従来法としてはダイレクトモードで符号化することが望ましい場合において、そのダイレクトモードよりも符号化効率の高い本発明の手法を用いることが可能となる。
より具体的には、ダイレクトモードでは、符号化の対象となるBフレームに対する動きベクトルを求めず、例えば、Pフレームの動きベクトルを利用する。このように、ダイレクトモードでは、動きベクトルを符号化しないことにより、符号化効率を向上させている。この一方で、ダイレクトモードでは、Pフレームの動きベクトルを利用しているため、動き補償されたBフレームの精度が十分に得られず、残差情報が大きくなることがある。
しかし、本発明の手法を用いる場合、符号化の対象となるBフレームに対する動きベクトルが求められている。このため、動き補償されたBフレームの精度を十分に得ることが可能となる。さらに、求めた動きベクトルを符号化する必要なく、ダイレクトモードと同様に符号化効率を高めることが可能となっている。
また、このように符号化された符号化画像信号d211に対応して、スイッチ81(図6参照)をブロック単位で動作させることも可能である。
[第2実施形態]
本発明の第2実施形態として、上記で説明した補間フレーム生成システム、符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムの応用例とそれを用いたシステムを図13〜図16を用いて説明する。
図13は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
このコンテンツ供給システムex100は、例えば、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex107〜ex110を介して、コンピュータex111、PDA(personal digital assistant)ex112、カメラex113、携帯電話ex114、カメラ付きの携帯電話ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図13のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器である。また、携帯電話は、PDC(Personal Digital Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband-Code Division Multiple Access)方式、若しくはGSM(Global System for Mobile Communications)方式の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
また、ストリーミングサーバex103は、カメラex113から基地局ex109、電話網ex104を通じて接続されており、カメラex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラex116で撮影した動画データはコンピュータex111を介してストリーミングサーバex103に送信されてもよい。カメラex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラex116で行ってもコンピュータex111で行ってもどちらでもよい。また、符号化処理はコンピュータex111やカメラex116が有するLSIex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な記録媒体である何らかの蓄積メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込んでもよい。さらに、カメラ付きの携帯電話ex115で動画データを送信してもよい。このときの動画データは携帯電話ex115が有するLSIで符号化処理されたデータである。
このコンテンツ供給システムex100では、ユーザがカメラex113、カメラex116等で撮影しているコンテンツ(例えば、音楽ライブを撮影した映像等)を符号化処理してストリーミングサーバex103に送信する一方で、ストリーミングサーバex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等がある。このようにすることでコンテンツ供給システムex100は、符号化されたデータをクライアントにおいて受信して再生することができ、さらにクライアントにおいてリアルタイムで受信して復号化し、再生することにより、個人放送をも実現可能になるシステムである。
コンテンツの符号化処理あるいは復号化処理に際して、上記実施形態で説明した補間フレーム生成システム、符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを用いてもよい。例えば、コンピュータex111、PDAex112、カメラex113、携帯電話ex114等は、上記実施形態で示した符号化装置、復号化装置を備え、補間フレーム生成方法、補間フレーム生成プログラムを実現でき、全体として補間フレーム生成システムを構築するものであってよい。
一例として携帯電話について説明する。
図14は、上記実施形態の符号化装置および復号化装置を用いた携帯電話ex115を示す図である。携帯電話ex115は、基地局ex110との間で電波を送受信するためのアンテナex201、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex203、カメラ部ex203で撮影した映像、アンテナex201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex202、操作キーex204群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex208、音声入力をするためのマイク等の音声入力部ex205、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号化されたデータを保存するための記録メディアex207、携帯電話ex115に記録メディアex207を装着可能とするためのスロット部ex206を有している。記録メディアex207はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex115について図15を用いて説明する。携帯電話ex115は表示部ex202および操作キーex204を備えた本体部の各部を統括的に制御するようになされた主制御部ex311に対して、電源回路部ex310、操作入力制御部ex304、画像符号化部ex312、カメラインターフェース部ex303、LCD(Liquid Crystal Display)制御部ex302、画像復号化部ex309、多重分離部ex308、記録再生部ex307、変復調回路部ex306および音声処理部ex305が同期バスex313を介して互いに接続されている。
電源回路部ex310は、ユーザの操作により終話および電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話ex115を動作可能な状態に起動する。
携帯電話ex115は、CPU、ROMおよびRAM等でなる主制御部ex311の制御に基づいて、音声通話モード時に音声入力部ex205で集音した音声信号を音声処理部ex305によってディジタル音声データに変換し、これを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して送信する。また携帯電話ex115は、音声通話モード時にアンテナex201で受信した受信信号を増幅して周波数変換処理およびアナログディジタル変換処理を施し、変復調回路部ex306でスペクトラム逆拡散処理し、音声処理部ex305によってアナログ音声信号に変換した後、これを音声出力部ex208を介して出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex204の操作によって入力された電子メールのテキストデータは操作入力制御部ex304を介して主制御部ex311に送出される。主制御部ex311は、テキストデータを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex203で撮像された画像データをカメラインターフェース部ex303を介して画像符号化部ex312に供給する。また、画像データを送信しない場合には、カメラ部ex203で撮像した画像データをカメラインターフェース部ex303およびLCD制御部ex302を介して表示部ex202に直接表示することも可能である。
画像符号化部ex312は、カメラ部ex203から供給された画像データを圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex308に送出する。また、このとき同時に携帯電話ex115は、カメラ部ex203で撮像中に音声入力部ex205で集音した音声を音声処理部ex305を介してディジタルの音声データとして多重分離部ex308に送出する。
多重分離部ex308は、画像符号化部ex312から供給された符号化画像データと音声処理部ex305から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex306でスペクトラム拡散処理し、送受信回路部ex301でディジタルアナログ変換処理および周波数変換処理を施した後にアンテナex201を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex201を介して基地局ex110から受信した受信信号を変復調回路部ex306でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex308に送出する。
また、アンテナex201を介して受信された多重化データを復号化するには、多重分離部ex308は、多重化データを分離することにより画像データの符号化ビットストリームと音声データの符号化ビットストリームとに分け、同期バスex313を介して当該符号化画像データを画像復号化部ex309に供給すると共に当該音声データを音声処理部ex305に供給する。
次に、画像復号化部ex309は、画像データの符号化ビットストリームを復号することにより再生動画像データを生成し、これをLCD制御部ex302を介して表示部ex202に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex305は、音声データをアナログ音声信号に変換した後、これを音声出力部ex208に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
以上の構成において、画像符号化部ex312は、上記実施形態の符号化装置を備え、画像復号化部ex309は、上記実施形態の復号化装置を備えている。この時、図2に示す符号化装置11と図6に示す復号化装置12とで共通する構成については同一のハードウェアを共用することとしてもよい。すなわち、フレームメモリ、動きベクトル検出部、逆量子化部、逆直交変換部などは、同一のハードウェアであっても良い。
なお、上記システムの例に限られず、最近は衛星、地上波によるディジタル放送が話題となっており、図16に示すようにディジタル放送用システムにも上記実施形態で説明した補間フレーム生成システム、符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを組み込むことができる。具体的には、放送局ex409では映像情報の符号化ビットストリームが電波を介して通信または放送衛星ex410に伝送される。これを受けた放送衛星ex410は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex406で受信し、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置により符号化ビットストリームを復号化してこれを再生する。ここで、テレビ(受信機)ex401またはセットトップボックス(STB)ex407などの装置が上記実施形態で説明した符号化装置、復号化装置を備えていてもよい。また、上記実施形態の補間フレーム生成方法を用いるものであってもよい。さらに、補間フレーム生成プログラムを備えていてもよい。また、記録媒体であるCDやDVD等の蓄積メディアex402に記録した符号化ビットストリームを読み取り、復号化する再生装置ex403にも上記実施形態で説明した符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを実装することが可能である。この場合、再生された映像信号はモニタex404に表示される。また、ケーブルテレビ用のケーブルex405または衛星/地上波放送のアンテナex406に接続されたセットトップボックスex407内に上記実施形態で説明した符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを実装し、これをテレビのモニタex408で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に上記実施形態で説明した符号化装置、復号化装置を組み込んでも良い。また、アンテナex411を有する車ex412で衛星ex410からまたは基地局ex107等から信号を受信し、車ex412が有するカーナビゲーションex413等の表示装置に動画を再生することも可能である。
更に、画像信号を符号化し、記録媒体に記録することもできる。具体例としては、DVDディスクex421に画像信号を記録するDVDレコーダや、ハードディスクに記録するディスクレコーダなどのレコーダex420がある。更にSDカードex422に記録することもできる。レコーダex420が上記実施形態の復号化装置を備えていれば、DVDディスクex421やSDカードex422に記録した画像信号を補間して再生し、モニタex408に表示することができる。
なお、カーナビゲーションex413の構成は例えば図15に示す構成のうち、カメラ部ex203とカメラインターフェース部ex303、画像符号化部ex312を除いた構成が考えられ、同様なことがコンピュータex111やテレビ(受信機)ex401等でも考えられる。
また、上記携帯電話ex114等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の3通りの実装形式が考えられる。
このように、上記実施形態で説明した補間フレーム生成システム、符号化装置、復号化装置、補間フレーム生成方法、補間フレーム生成プログラムを上述したいずれの機器・システムに用いることは可能であり、上記実施形態で説明した効果を得ることができる。
また、上記実施形態で図を用いて説明した符号化装置、復号化装置において、各機能ブロックは、LSIなどの半導体装置により個別に1チップ化されても良いし、一部又は全部を含むように1チップ化されても良い。
具体的には、図2における各ブロックは、1チップ化されても良い。この際、フレームメモリ30は、別体として外部に接続されるものであっても良い。
また、図6における各ブロックは、1チップ化されても良い。この際、フレームメモリ76は、別体として外部に接続されるものであっても良い。また、復号化部70とフレーム出力部71とは、別対として構成されていても良い。このような構成においても、フレームメモリ76は、別体として復号化部70の外部に接続されるものであっても良い。
なお、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、上記実施形態で図を用いて説明した各機能ブロックの処理の一部又は全部は、プログラムにより実現されるものであってもよい。この場合、具体的な処理は、例えば、中央演算装置(CPU)により行われる。また、それぞれの処理を行うためのプログラムは、ハードディスク、ROMなどの記憶装置に格納されており、ROMにおいて、あるいはRAMに読み出されて実行される。
本発明の復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムは、符号化効率を向上させつつ高精度の補間フレームを生成を行うことが必要な復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラムなどに適用することが可能である。
補間フレーム生成システム10の概要を説明するブロック図 符号化装置11の構成について説明するブロック図 画像信号d210を構成する画像フレームについて説明する説明図 BフレームB42の符号化について説明する説明図 付加情報作成方法について説明するフローチャート 復号化装置12の構成について説明するブロック図 BフレームB42の復号化について説明する説明図 補間フレーム生成方法について説明するフローチャート 補間用動きベクトルの導出方法の変形例について説明する説明図 付加情報d21が含む動き検出方式のパラメータの組み合わせを特定するためのテーブル110 付加情報d231が含む情報の組み合わせを特定するためのテーブル115 付加情報d252が指定する動き検出のアルゴリズム120と、動きベクトル検出部79で実行される動き検出のアルゴリズム121との対応関係 コンテンツ供給システムの全体構成について説明するブロック図 本発明の補間フレーム作成装置を搭載する携帯電話の例 携帯電話の構成について説明するブロック図 ディジタル放送用システムの例
符号の説明
10 補間フレーム生成システム
11 符号化装置
12 復号化装置
17 動き補償部
18 付加情報作成部
30 フレームメモリ
31 動きベクトル検出部
70 復号化部
71 フレーム出力部
79 動きベクトル検出部
80 補間フレーム生成部
MV 動きベクトル
CMV 補間用動きベクトル

Claims (21)

  1. 画像信号を構成する画像フレームと、前記画像フレーム間の動きベクトルである第1の動きベクトルに基づいて前記画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する復号化手段と、
    復号化された前記画像フレーム間の動きベクトルである第2の動きベクトルを検出する動きベクトル検出手段と、
    前記第2の動きベクトルと復号化された前記画像フレームと復号化された前記付加情報とに基づいて補間フレームを生成する補間フレーム生成手段と、
    を備える復号化装置。
  2. 前記付加情報は、前記画像フレームに対する前記補間フレームの補間方式と、前記補間フレームと前記補間フレームに対応する画像フレームとの残差情報と、前記補間フレームの前記画像フレームに対して検出された動きベク卜ルと前記第1の動きベクトルに基づいて導出される前記補間フレームの前記画像フレームに対する動きベクトルとのベクトル差分と、前記第1の動きベクトルの検出に用いられた動き検出方式とのうち少なくともいずれかを含む、
    請求項1に記載の復号化装置。
  3. 前記付加情報は、前記付加情報が含む情報の組み合わせを特定するためのプロファイル情報をさらに含んでいる、
    請求項2に記載の復号化装置。
  4. 前記動き検出方式は、動き検出のパラメータの組み合わせを特定するためのコード情報として含まれており、
    前記動きベクトル検出手段は、前記コード情報が特定する前記動き検出のパラメータに基づいて、前記第2の動きベクトルの検出を行う、
    請求項2または3に記載の復号化装置。
  5. 前記動きベクトル検出手段は、前記付加情報が含む前記動き検出方式を実行できない場合には、前記付加情報が含む前記動き検出方式に応じて定められた所定の動き検出方式により前記第2の動きベクトルを検出する、
    請求項2〜4のいずれか1項に記載の復号化装置。
  6. 前記付加情報は、補間フレーム毎に作成されている情報である、
    請求項2〜5のいずれか1項に記載の復号化装置。
  7. 前記付加情報のうち、前記動き検出方式は、前記符号化画像信号のストリーム毎に作成されている情報である、
    請求項2〜5のいずれか1項に記載の復号化装置。
  8. 前記補間フレーム生成手段は、前記符号化画像信号に前記付加情報が含まれていない場合に、復号化した前記画像フレームに基づいて前記補間フレームの生成を行う、
    請求項1〜7のいずれか1項に記載の復号化装置。
  9. 画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する第1の動きベクトル検出手段と、
    前記画像フレームを補間する補間フレームを前記第1の動きベクトルに基づいて生成するための付加情報を作成する付加情報作成手段と、
    前記画像フレームと前記付加情報とを符号化する符号化手段と、
    を備える符号化装置
  10. 前記付加情報は、前記画像フレームに対する前記補間フレームの補間方式と、前記補間フレームと前記補間フレームに対応する画像フレームとの残差情報と、前記補間フレームの前記画像フレームに対して検出された動きベクトルと前記第1の動きベクトルに基づいて導出される前記補間フレームの前記画像フレームに対する動きベクトルとのベクトル差分と、前記第1の動きベクトルの検出に用いられた動き検出方式とのうち少なくともいずれかを含む、
    請求項9に記載の符号化装置。
  11. 前記付加情報は、前記付加情報が含む情報の組み合わせを特定するためのプロファイル情報をさらに含んでいる、
    請求項10に記載の符号化装置。
  12. 前記動き検出方式は、動き検出のパラメータの組み合わせを特定するためのコード情報として含まれている、
    請求項10または11に記載の符号化装置。
  13. 前記付加情報は、補間フレーム毎に作成される情報である、
    請求項10〜12のいずれか1項に記載の符号化装置。
  14. 前記動き検出方式は、前記画像信号のストリームのヘッダ情報として含まれている、
    請求項10〜12のいずれか1項に記載の符号化装置。
  15. 前記プロファイル情報は、前記画像信号のストリームのヘッダ情報として含まれている、
    請求項11に記載の符号化装置。
  16. 前記符号化手段は、前記画像フレームに基づいて生成される補間フレームと前記補間フレームに対応する前記画像信号との残差が小さい場合には、前記付加情報の符号化を行わない、
    請求項9〜15のいずれか1項に記載の符号化装置。
  17. 画像信号を構成する画像フレームを補間する補間フレームを生成する補間フレーム生成システムであって、
    前記画像フレーム間の動きベクトルである第1の動きベクトルを検出する第1の動きベクトル検出手段と、
    前記第1の動きベクトルに基づいて前記補間フレームを生成するための付加情報を作成する付加情報作成手段と、
    前記画像フレームと前記付加情報とを符号化する符号化手段と、
    前記符号化された前記画像フレームと前記付加情報とを復号化する復号化手段と、
    復号化された前記画像フレーム間の動きベクトルである第2の動きベクトルを検出する第2の動きベクトル検出手段と、
    前記第2の動きベクトルと復号化された前記画像フレームと復号化された前記付加情報とに基づいて補間フレームを生成する補間フレーム生成手段と、
    を備える補間フレーム生成システム。
  18. 画像信号を構成する画像フレームと、前記画像フレーム間の動きベクトルである第1の動きベクトルに基づいて前記画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する復号化部と、
    復号化された前記画像フレーム間の動きベクトルである第2の動きベクトルを検出する動きベクトル検出部と、
    前記第2の動きベクトルと復号化された前記画像フレームと復号化された前記付加情報とに基づいて補間フレームを生成する補間フレーム生成部と、
    を備える集積回路装置。
  19. 画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する第1の動きベクトル検出部と、
    前記画像フレームを補間する補間フレームを前記第1の動きベクトルに基づいて生成するための付加情報を作成する付加情報作成部と、
    前記画像フレームと前記付加情報とを符号化する符号化部と、
    を備える集積回路装置。
  20. 画像信号を構成する画像フレームと、前記画像フレーム間の動きベクトルである第1の動きベクトルに基づいて前記画像フレームを補間する補間フレームを生成するための付加情報とが符号化された符号化画像信号を復号化する復号化ステップと、
    復号化された前記画像フレーム間の動きベクトルである第2の動きベクトルを検出する動きベクトル検出ステップと、
    前記第2の動きベクトルと復号化された前記画像フレームと復号化された前記付加情報とに基づいて補間フレームを生成する補間フレーム生成ステップと、
    を備える復号化方法をコンピュータに行わせるための復号化プログラム。
  21. 画像信号を構成する画像フレーム間の動きベクトルである第1の動きベクトルを検出する第1の動きベクトル検出ステップと、
    前記画像フレームを補間する補間フレームを前記第1の動きベクトルに基づいて生成するための付加情報を作成する付加情報作成ステップと、
    前記画像フレームと前記付加情報とを符号化する符号化ステップと、
    を備える符号化方法をコンピュータに行わせるための符号化プログラム。
JP2005517634A 2004-02-03 2005-01-12 復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム Expired - Fee Related JP4685636B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005517634A JP4685636B2 (ja) 2004-02-03 2005-01-12 復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004026276 2004-02-03
JP2004026276 2004-02-03
JP2005517634A JP4685636B2 (ja) 2004-02-03 2005-01-12 復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム
PCT/JP2005/000250 WO2005076630A1 (ja) 2004-02-03 2005-01-12 復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム

Publications (2)

Publication Number Publication Date
JPWO2005076630A1 true JPWO2005076630A1 (ja) 2007-08-02
JP4685636B2 JP4685636B2 (ja) 2011-05-18

Family

ID=34835840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005517634A Expired - Fee Related JP4685636B2 (ja) 2004-02-03 2005-01-12 復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム

Country Status (4)

Country Link
US (1) US8160143B2 (ja)
EP (1) EP1715694A4 (ja)
JP (1) JP4685636B2 (ja)
WO (1) WO2005076630A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4755093B2 (ja) * 2005-02-01 2011-08-24 パナソニック株式会社 画像符号化方法および画像符号化装置
JP2006279573A (ja) * 2005-03-29 2006-10-12 Sanyo Electric Co Ltd 符号化装置と方法、ならびに復号装置と方法
JP4887727B2 (ja) 2005-10-20 2012-02-29 ソニー株式会社 画像信号処理装置、カメラシステム、および画像信号処理方法
JP4730183B2 (ja) * 2006-04-17 2011-07-20 株式会社日立製作所 映像表示装置
JP4518111B2 (ja) * 2007-07-13 2010-08-04 ソニー株式会社 映像処理装置、映像処理方法、及びプログラム
US20090028517A1 (en) * 2007-07-27 2009-01-29 The University Of Queensland Real-time near duplicate video clip detection method
US8848793B2 (en) * 2007-10-31 2014-09-30 Broadcom Corporation Method and system for video compression with integrated picture rate up-conversion
TWI389573B (zh) * 2007-12-06 2013-03-11 Mstar Semiconductor Inc 僅依據水平方向之影像區塊執行影像處理運作的影像處理方法及其相關裝置
US8204126B2 (en) * 2008-01-10 2012-06-19 Panasonic Corporation Video codec apparatus and method thereof
KR100939917B1 (ko) * 2008-03-07 2010-02-03 에스케이 텔레콤주식회사 움직임 예측을 통한 부호화 시스템 및 움직임 예측을 통한부호화 방법
JP5325638B2 (ja) * 2008-11-26 2013-10-23 日立コンシューマエレクトロニクス株式会社 画像復号化方法
US20100178038A1 (en) * 2009-01-12 2010-07-15 Mediatek Inc. Video player
US8471959B1 (en) * 2009-09-17 2013-06-25 Pixelworks, Inc. Multi-channel video frame interpolation
JP5378939B2 (ja) * 2009-10-02 2013-12-25 日立コンシューマエレクトロニクス株式会社 画像符号化方法、画像復号化方法、画像符号化装置、及び画像復号化装置、並びにプログラム
US20110176611A1 (en) * 2010-01-15 2011-07-21 Yu-Wen Huang Methods for decoder-side motion vector derivation
US9237355B2 (en) * 2010-02-19 2016-01-12 Qualcomm Incorporated Adaptive motion resolution for video coding
US10327008B2 (en) 2010-10-13 2019-06-18 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
CN115955576B (zh) * 2023-03-10 2023-06-09 深圳市泛联信息科技有限公司 视频数据访问方法、装置、存储节点及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05115061A (ja) * 1991-10-22 1993-05-07 Sony Corp 動きベクトル符号器および復号器
JPH07177519A (ja) * 1993-12-20 1995-07-14 Kyocera Corp 動きベクトル検出方法
JPH08256340A (ja) * 1989-09-27 1996-10-01 Sony Corp 映像信号伝送方法及び映像信号伝送装置
JPH1056645A (ja) * 1997-06-23 1998-02-24 Matsushita Electric Ind Co Ltd 画像信号符号化装置及び画像信号符号化方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177514A (ja) 1993-12-17 1995-07-14 Casio Comput Co Ltd 動画像圧縮装置
JPH0879703A (ja) * 1994-07-05 1996-03-22 Sony Corp 画像情報処理方法及び装置
US5796438A (en) * 1994-07-05 1998-08-18 Sony Corporation Methods and apparatus for interpolating picture information
JP3823370B2 (ja) * 1996-04-15 2006-09-20 ソニー株式会社 動画像符号化方法、復号方法及びその装置
JPH10233996A (ja) 1997-02-20 1998-09-02 Sony Corp 映像信号再生装置および映像信号再生方法
WO1999018720A1 (en) * 1997-10-03 1999-04-15 Sony Corporation Encoded stream splicing device and method, and an encoded stream generating device and method
JP4343411B2 (ja) 2000-08-28 2009-10-14 キヤノン株式会社 画像処理方法及び装置と再生方法とプログラム及び記憶媒体
EP2538667A3 (en) * 2000-02-09 2014-09-03 Canon Kabushiki Kaisha Method and apparatus for image processing which inhibits reproduction of parts of a recording

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08256340A (ja) * 1989-09-27 1996-10-01 Sony Corp 映像信号伝送方法及び映像信号伝送装置
JPH05115061A (ja) * 1991-10-22 1993-05-07 Sony Corp 動きベクトル符号器および復号器
JPH07177519A (ja) * 1993-12-20 1995-07-14 Kyocera Corp 動きベクトル検出方法
JPH1056645A (ja) * 1997-06-23 1998-02-24 Matsushita Electric Ind Co Ltd 画像信号符号化装置及び画像信号符号化方法

Also Published As

Publication number Publication date
EP1715694A4 (en) 2009-09-16
WO2005076630A1 (ja) 2005-08-18
EP1715694A1 (en) 2006-10-25
JP4685636B2 (ja) 2011-05-18
US20070127572A1 (en) 2007-06-07
US8160143B2 (en) 2012-04-17

Similar Documents

Publication Publication Date Title
JP4685636B2 (ja) 復号化装置、符号化装置、補間フレーム生成システム、集積回路装置、復号化プログラムおよび符号化プログラム
JP4722153B2 (ja) 画像復号化方法および画像復号化装置
KR100985366B1 (ko) 움직임 보상 방법, 화상 부호화 방법 및 화상 복호화 방법
KR100557911B1 (ko) 화상 부호화 방법 및 화상 복호화 방법
EP1788817A1 (en) Decoder, encoder, decoding method and encoding method
KR100956910B1 (ko) 움직임 벡터 도출 방법, 동화상 부호화 방법, 및 동화상복호화 방법
JP2008187734A (ja) フィルタリング強度決定方法
JP2007096709A (ja) 画像処理方法、画像符号化方法および画像復号方法
JP4313710B2 (ja) 画像符号化方法および画像復号化方法
JP4369318B2 (ja) 符号化モード決定装置、画像符号化装置、符号化モード決定方法、および符号化モード決定プログラム
JP4129374B2 (ja) 画像符号化方法および画像復号化方法
JP4641995B2 (ja) 画像符号化方法および画像符号化装置
JP4495013B2 (ja) 動画符号化装置
JP4580626B2 (ja) フィルタリング強度の決定方法、動画像符号化方法、および動画像復号化方法
JP3824268B2 (ja) 動きベクトル導出方法、および動きベクトル導出装置
JP2004215215A (ja) 動きベクトル検出方法
JP2005142986A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP2005341545A (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラムおよび動画像復号プログラム
JP4580901B2 (ja) フィルタリング強度の決定方法、動画像符号化方法、および動画像復号化方法
JP4503959B2 (ja) 画像符号化方法
JP4406239B2 (ja) 動き補償方法および動き補償装置
JP4580903B2 (ja) フィルタリング強度の決定方法、動画像符号化方法、および動画像復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110210

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees