JPWO2005122593A1 - 動画符号化方法および動画復号方法 - Google Patents
動画符号化方法および動画復号方法 Download PDFInfo
- Publication number
- JPWO2005122593A1 JPWO2005122593A1 JP2006514417A JP2006514417A JPWO2005122593A1 JP WO2005122593 A1 JPWO2005122593 A1 JP WO2005122593A1 JP 2006514417 A JP2006514417 A JP 2006514417A JP 2006514417 A JP2006514417 A JP 2006514417A JP WO2005122593 A1 JPWO2005122593 A1 JP WO2005122593A1
- Authority
- JP
- Japan
- Prior art keywords
- key frame
- image
- key
- frames
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/86—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/537—Motion estimation other than block-based
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明の目的は、この課題を解決する動画符号化および復号技術を提供することにある。
b) 第1、第2キーフレーム間の対応点情報をもとに第1キーフレームに含まれる画素を移動させることによって、仮想の第2キーフレームを生成するステップと、
c) 現実の第2キーフレームと仮想の第2キーフレームとの差分を圧縮符号化するステップと、
d) 第1キーフレーム、第1、第2キーフレーム間の対応点情報、および、現実の第2キーフレームと仮想の第2キーフレーム間で圧縮符号化された差分をこれらのキーフレーム間の符号化データとして出力するステップ。
k) 1以上の画像フレームを間に挟む第1、第2キーフレーム間の対応点情報、および第1キーフレームを取得するステップと、
l) 第1、第2キーフレーム間の対応点情報をもとに、第1キーフレームに含まれる画素を移動させることによって、仮想の第2キーフレームを生成するステップと、
m) 予め符号化側にて求められた現実の第2キーフレームと仮想の第2キーフレームとの差分の圧縮符号化データを取得するステップと、
o) 取得された差分の圧縮符号化データと前記仮想の第2キーフレームとから、改良された仮想の第2キーフレームを生成するステップと、
p) 第1、第2キーフレーム間の対応点情報をもとに、第1キーフレームと改良された仮想の第2キーフレーム間で補間計算をすることにより、これらのキーフレームの間に存在すべき中間フレームを生成するステップと、
q) 第1キーフレーム、生成された中間フレーム、改良された仮想の第2キーフレームをこれらのキーフレーム間の復号データとして出力するステップ。
[前提技術の実施の形態]
[1]要素技術の詳細
[1.1]イントロダクション
[1.2]特異点フィルタの階層
ただしここで、
とする。以降これら4つの画像を副画像(サブイメージ)と呼ぶ。minx≦t≦x+1、maxx≦t≦x+1をそれぞれα及びβと記述すると、副画像はそれぞれ以下のように記述できる。
P(m,0)=α(x)α(y)p(m+1,0)
P(m,1)=α(x)β(y)p(m+1,1)
P(m,2)=β(x)α(y)p(m+1,2)
P(m,3)=β(x)β(y)p(m+1,3)
[1.3]画像間の写像の計算
を考える(i=0,…,2m−1、j=0,…,2m−1)。ここでRの各辺(エッジ)の方向を以下のように定める。
は、以下の全単射条件を満たす必要がある。
1.四辺形f(m,s)(R)のエッジは互いに交差しない。
2.f(m,s)(R)のエッジの方向はRのそれらに等しい(図2の場合、時計回り)。
3.緩和条件として収縮写像(リトラクション:retractions)を許す。
[1.3.2]写像のエネルギー
[1.3.2.1]画素の輝度に関するコスト
ここで、V(p(m,s) (i,j))及びV(q(m,s) f(i,j))はそれぞれ画素p(m,s) (i,j)及びq(m,s) f(i,j)の輝度である。fのトータルのエネルギーC(m,s)は、マッチングを評価するひとつの評価式であり、つぎに示すC(m,s) (i,j)の合計で定義できる。
[1.3.2.2]滑らかな写像のための画素の位置に関するコスト
ただし、係数パラメータηは0以上の実数であり、また、
とする。ここで、
であり、i’<0およびj’<0に対してf(i’,j’)は0と決める。E0は(i,j)及びf(i,j)の距離で決まる。E0は画素があまりにも離れた画素へ写影されることを防ぐ。ただしE0は、後に別のエネルギー関数で置き換える。E1は写像の滑らかさを保証する。E1は、p(i,j)の変位とその隣接点の変位の間の隔たりを表す。以上の考察をもとに、マッチングを評価する別の評価式であるエネルギーDfは次式で定まる。
[1.3.3]多重解像度の導入による写像の決定
まず、
が成り立つとき、p(m−1,s) (i’,j’)、q(m−1,s) (i’,j’)をそれぞれp(m,s) (i,j)、q(m,s) (i,j)のparentと呼ぶことにする。[x]はxを越えない最大整数である。またp(m,s) (i,j)、q(m,s) (i,j)をそれぞれp(m−1,s) (i’,j’)、q(m−1,s) (i’,j’)のchildと呼ぶ。関数parent(i,j)は次式で定義される。
[1.4]最適なパラメータ値の自動決定
1.本来対応すべきではない画素どうしが、単に輝度が近いというだけで誤って対応づけられる。
2.その結果、画素どうしの対応関係がおかしくなり、写像がくずれはじめる。
3.その結果、式14においてD(m,s) fが急激に増加しようとする。
4.その結果、式14の値が急激に増加しようとするため、D(m,s) fの急激な増加を抑制するようf(m,s)が変化し、その結果C(m,s) fが増加する。
[1.4.1]λの動的決定
で示されるA個の画素が、
のエネルギーを持つより安定的な状態に変化する。ここでは仮に、これらの画素のエネルギーがすべてゼロになると近似している。この式はC(m,s) fの値が、
だけ変化することを示し、その結果、
が成立する。h(l)>0であるから、通常C(m,s) fは減少する。しかし、λが最適値を越えようとするとき、上述の現象、つまりC(m,s) fの増加が発生する。この現象を検出することにより、λの最適値を決定する。
なお、H(h>0)及びkを定数とするとき、
は定数になる。しかしλが最適値を越えると、上の値は急速に増加する。この現象を検出し、B0λ3/2+k/2/2mの値が異常値B0thresを越えるかどうかを検査し、λの最適値を決定することができる。同様に、B1λ3/2+k/2/2mの値が異常値B1thresを越えるかどうかを検査することにより、全単射の第3の条件を破る画素の増加率B1を確認する。ファクター2mを導入する理由は後述する。このシステムはこれら2つの閾値に敏感ではない。これらの閾値は、エネルギーC(m,s) fの観察では検出し損なった写像の過度の歪みを検出するために用いることができる。
[1.4.2]ヒストグラムh(l)
[1.4.3]ηの動的決定
[1.5]スーパーサンプリング
における輝度を持つf(m,s)が提供される。つまりスーパーサンプリングが行われる。実験では、f(m,s)は整数及び半整数値をとることが許され、
は、
によって与えられた。
[1.6]各画像の画素の輝度の正規化
[1.7]インプリメンテーション
あるp(i,j)について対応点qf(i,j)が決まれば、つぎにp(i,j+1)の対応点qf(i,j+1)が決められる。この際、qf(i,j+1)の位置は全単射条件を満たすために、qf(i,j)の位置によって制限される。したがって、先に対応点が決まる点ほどこのシステムでは優先度が高くなる。つねに(0,0)が最も優先される状態がつづくと、求められる最終の写像に余計な偏向が加わる。本前提技術ではこの状態を回避するために、f(m,s)を以下の方法で決めていく。
ただしここで、
である(ここでベクトルは三次元ベクトルとし、z軸は直交右手座標系において定義される)。もしWが負であれば、その候補についてはD(m,s) (k,l)にψを掛けることによってペナルティを与え、できるかぎり選択しないようにする。
[1.7.1]副写像の順序
[1.8]補間計算
である。ただし、
であり、κ,ρ≧0とする。最後に、前述の写像の自動計算プロセスにより、fを完全に決定する。
ここで、f(m,s)(i,j)がF(m)(i,j)に十分近いとき、つまりそれらの距離が、
以内であるとき、E2 (m,s) (i,j)が0になることに注意すべきである。そのように定義した理由は、各f(m,s)(i,j)がF(m)(i,j)に十分近い限り、終点画像において適切な位置に落ち着くよう、その値を自動的に決めたいためである。この理由により、正確な対応関係を詳細に特定する必要がなく、始点画像は終点画像にマッチするように自動的にマッピングされる。
[2]具体的な処理手順
[1]の各要素技術による処理の流れを説明する。
一方、同一レベル内における水平的参照も行われる。[1.3.3]の式20のごとく、f(m,3)はf(m,2)に、f(m,2)はf(m,1)に、f(m,1)はf(m,0)に、それぞれ類似するように決める。その理由は、特異点の種類が違っても、それらがもともと同じ始点画像と終点画像に含まれている以上、副写像がまったく異なるという状況は不自然だからである。式20からわかるように、副写像どうしが近いほどエネルギーは小さくなり、マッチングが良好とみなされる。
1.第1レベルの解像度で点xの左上点a、右上点b、左下点c、右下点dを求める。
5.4と同様の方法で対応点b’〜d’をプロットし、点a’〜d’で相続四辺形を作る。
なお、本前提技術について次のような変形技術も考えられる。
(1)前提技術では始点階層画像と終点階層画像の間でマッチングをとる際にパラメータの自動決定を行ったが、この方法は階層画像間ではなく、通常の2枚の画像間のマッチングをとる場合全般に利用できる。
(2)本前提技術では、総合評価式の値が最小になるよう写像を決めた後、総合評価式を構成するひとつの評価式であるC(m,s) fが極小になる点を検出してパラメータを決定した。しかし、こうした二段回処理の代わりに、状況によっては単に総合評価式の最小値が最小になるようにパラメータを決めても効果的である。その場合、例えばαE0+βE1を総合評価式とし、α+β=1なる拘束条件を設けて各評価式を平等に扱うなどの措置を講じてもよい。パラメータの自動決定の本質は、エネルギーが最小になるようにパラメータを決めていく点にあるからである。
(3)前提技術では各解像度レベルで4種類の特異点に関する4種類の副画像を生成した。しかし、当然4種類のうち1、2、3種類を選択的に用いてもよい。例えば、画像中に明るい点がひとつだけ存在する状態であれば、極大点に関するf(m,3)だけで階層画像を生成しても相応の効果が得られるはずである。その場合、同一レベルで異なる副写像は不要になるため、sに関する計算量が減る効果がある。
(4)本前提技術では特異点フィルタによってレベルがひとつ進むと画素が1/4になった。例えば3×3で1ブロックとし、その中で特異点を探す構成も可能であり、その場合、レベルがひとつ進むと画素は1/9になる。
(5)始点画像と終点画像がカラーの場合、それらをまず白黒画像に変換し、写像を計算する。その結果求められた写像を用いて始点のカラー画像を変換する。それ以外の方法として、RGBの各成分について副写像を計算してもよい。
[3]前提技術の改良点
[3.1]色情報を考慮に入れた特異点フィルタおよび副画像
エッジの大きさ、すなわち絶対値も計算に必要なため、以下のように表す。
ここでパラメータλ、ψおよびθは0以上の実数であり、本改良後の技術においては定数である。ここでこれらのパラメータを定数とできるのは、新たに導入されたRefinement Stageにより、パラメータに対する結果の安定性が向上したためである。また、エネルギーCEは副写像f(m,s)の種類sに関わらず、座標と解像度のレベルによって決定する値である。
その後、sをインクリメントし(S43)、sがtを超えていないことを確認し(S44)、次のターンのForward Stage(S41)に進む。その際前記E0を次のように置き換えてエネルギー最小化計算を行う。
[動画符号化と復号に関する実施の形態]
以上の前提技術を一部利用した動画処理の具体例を述べる。
[1]符号化装置の構成
[2]符号化処理
b) 第1、第2キーフレーム間の対応点情報(M0−4)をもとに、画素シフタによって第1キーフレーム(F0)に含まれる画素を移動させて仮想の第2キーフレーム(F4’)を生成するステップ。
c) 現実の第2キーフレーム(F4)と仮想の第2キーフレーム(F4’)との差分をNR機能付きDE(DE+NRと表記)で圧縮符号化するステップ。
d) 第1キーフレーム(F0)、第1、第2キーフレーム間の対応点情報(M0−4)、および、現実の第2キーフレームと仮想の第2キーフレーム間で圧縮符号化された差分(Δ4)をこれらのキーフレーム(F0、F4)間の符号化データとして出力するステップ。出力先は記録媒体、伝送媒体を問わない。実際には後述のj)で出力される情報と一体となり、動画符号化データとして記録媒体等に出力される。
e) 現実の第2キーフレーム(F4)と仮想の第2キーフレーム(F4’)間で圧縮符号化された差分(Δ4)をDDで復号するステップ。
f) 復号された差分と前記仮想の第2キーフレーム(F4’)とから、改良された仮想の第2キーフレーム(F4”)をDDで生成するステップ。
g) 1以上の画像フレーム(F5〜F7)を間に挟む第2、第3キーフレーム(F4、F8)間でCPFによってマッチングを計算し、第2、第3キーフレーム間の対応点情報(M4−8)を生成するステップ。
h) 第2、第3キーフレーム間の対応点情報(M4−8)をもとに、画素シフタによって、改良された仮想の第2キーフレーム(F4”)に含まれる画素を移動させることによって、仮想の第3キーフレーム(F8’)を生成するステップ。
i) 現実の第3キーフレーム(F8)と仮想の第3キーフレーム(F8’)との差分をDE+NRで圧縮符号化するステップ。
j) 第2、第3キーフレーム間の対応点情報(M4−8)、および現実の第3キーフレームと仮想の第3キーフレーム間で圧縮符号化された差分(Δ8)をこれらのキーフレーム(F4、F8)間の符号化データとして出力するステップ。出力先は一般にd)の出力先と同じである。
[3]復号装置の構成
符号化側にもましてシンプルな構成である。
DD: 符号化装置のDDと同じ。
INT: INTerpolator 補間プロセッサ。
[4]復号処理
復号は以下の手順で進む。
l) 第1、第2キーフレーム間の対応点情報(M0−4)をもとに、画像シフタによって第1キーフレーム(F0)に含まれる画素を移動させることによって、仮想の第2キーフレーム(F4’)を生成するステップ。
m) 予め符号化側にてl)同様の処理により、仮想の第2キーフレーム(F4’)が生成され、符号化側でこれと現実の第2キーフレーム(F4)との差分の圧縮符号化データ(Δ4)を生成しているため、これを取得するステップ。
o) 取得された差分の圧縮符号化データ(Δ4)をDDで復号し、仮想の第2キーフレーム(F4’)と加算して、改良された仮想の第2キーフレーム(F4’’)を生成するステップ。
p) 第1、第2キーフレーム間の対応点情報(M0−4)をもとに、INTによって、第1キーフレーム(F0)と改良された仮想の第2キーフレーム(F4”)間で補間計算をすることにより、これらのキーフレーム(F0、F4”)の間に存在すべき中間フレーム(F1”〜F3”)を生成するステップ。
q) 第1キーフレーム(F0)、生成された中間フレーム(F1”〜F3”)、改良された仮想の第2キーフレーム(F4”)をこれらのキーフレーム間の復号データとして表示装置等へ出力するステップ。
r) 1以上の画像フレーム(F5〜F7)を間に挟む第2、第3キーフレーム(F4、F8)間の対応点情報(M4−8)を取得するステップ。
s) 第2、第3キーフレーム間の対応点情報(M4−8)をもとに、画素シフタによって、改良された仮想の第2キーフレーム(F4”)に含まれる画素を移動させることによって、仮想の第3キーフレーム(F8’)を生成するステップ。
t) 予め符号化側にてs)同様の処理により、符号化側でも仮想の第3キーフレーム(F8’)が生成され、符号化側でこれと現実の第3キーフレーム(F8)との差分の圧縮符号化データ(Δ8)を生成しており、これを取得するステップ。
u) 取得された差分の圧縮符号化データ(Δ8)と仮想の第3キーフレーム(F8’)とから、DDによって、改良された仮想の第3キーフレーム(F8”)を生成するステップ。
v) 第2、第3キーフレーム間の対応点情報(M4−8)をもとに、INTによって、改良された仮想の第2キーフレーム(F4”)と改良された仮想の第3キーフレーム(F8”)間で補間計算をすることにより、これらのキーフレームの間に存在すべき中間フレーム(F5’〜F7’)を生成するステップ。
w) 改良された仮想の第2キーフレーム(F4”)、生成された中間フレーム(F5’〜F7’)、改良された仮想の第3キーフレーム(F8”)をこれらのキーフレーム(F4”、F8”)間の復号データとして表示装置などへ出力するステップ。
[5]本実施の形態によるメリット
[6]変形技術
本発明の他の実施形態は、図19の符号化装置に関する。ここでは、画像マッチングの正確性を示す尺度として画像のマッチングエネルギーを導入し、これをDE+NRにおけるノイズリダクション等に利用する。以下、適宜図19を用いて説明するが、特に言及しない構成、機能については第1実施形態と同様である。
本実施形態の符号化装置では、CPFが第1、第2のキーフレームのマッチングを計算する際に、併せて両フレーム間で対応しあう各画素のマッチングエネルギーを取得し、第1のキーフレーム(F0)上に各画素のマッチングエネルギーを記述したエネルギーマップを生成する。同様に、その他の隣接しあうキーフレーム間でもエネルギーマップを生成する。すなわち、エネルギーマップとは、キーフレーム間の対応点それぞれのマッチングエネルギーを、基本的には前のキーフレームの各画素に関して記述したデータである。なお、エネルギーマップは前後のキーフレームのうち、後のキーフレーム上に表しても良い。エネルギーマップは不図示の経路によりCPFからDE+NRに送られる。DE+NRでは、このエネルギーマップを利用してキーフレーム間のマッチングの良否を評価し、それに基づいて、仮想のキーフレームと現実のキーフレームの差分を適応的に圧縮符号化する。なお、DE+NRには、エネルギーマップの他、対応点情報ファイルも不図示の経路で送られている。
以上の処理を経て、圧縮部18は、現実の第2キーフレーム(F4)と仮想の第2キーフレーム(F4’)の圧縮符号化された差分(Δ4)を出力する。本実施形態による符号化装置によれば、現実のキーフレームと仮想のキーフレームの差分情報を、符号化画像をより原画像に忠実に、正確な復号を行うための重要性に応じて適応的に圧縮可能であり、復号の正確性を保ちつつ高い符号化効率が実現できる。重要性とは、もちろん、本実施形態でも第1実施形態に係るメリットを享受できる。
本実施形態の変形例として、マッチングエネルギーの大きい画素、中でも近傍の画素の対応傾向と著しく異なる対応傾向を示す画素はマッチングエラーを起こしている場合が多いと経験的に認められることから、マッチングエネルギーが周囲の画素と比べ大幅に異なる画素をマッチングエラーと評価し、これをノイズリダクションに導入することもできる。この場合、DE+NRは、第2キーフレーム(F4)の各画素のマッチングエネルギーを、例えば自身を中心とする9X9画素のブロック内の、他の画素のマッチングエネルギーの平均と比較する。比較の結果両者の差が所定のしきい値を超えている場合、そのような画素はマッチングエラーをおこしていると判定してもよい。
Claims (19)
- a) 1以上の画像フレームを間に挟む第1、第2キーフレーム間でマッチングを計算し、第1、第2キーフレーム間の対応点情報を生成するステップと、
b) 第1、第2キーフレーム間の対応点情報をもとに当該キーフレームに含まれる画素を移動させることによって、仮想の第2キーフレームを生成するステップと、
c) 現実の第2キーフレームと仮想の第2キーフレームとの差分を圧縮符号化するステップと、
d) 第1キーフレーム、第1、第2キーフレーム間の対応点情報、および、現実の第2キーフレームと仮想の第2キーフレーム間で圧縮符号化された差分をこれらのキーフレーム間の符号化データとして出力するステップと、
を備える動画符号化方法。 - 請求項1に記載の方法において、さらに、
e) 現実の第2キーフレームと仮想の第2キーフレーム間で圧縮符号化された差分を復号するステップと、
f) 復号された差分と前記仮想の第2キーフレームとから、改良された仮想の第2キーフレームを生成するステップと、
g) 1以上の画像フレームを間に挟む第2、第3キーフレーム間でマッチングを計算し、第2、第3キーフレーム間の対応点情報を生成するステップと、
h) 第2、第3キーフレーム間の対応点情報をもとに、改良された仮想の第2キーフレームに含まれる画素を移動させることによって、仮想の第3キーフレームを生成するステップと、
i)現実の第3キーフレームと仮想の第3キーフレームとの差分を圧縮符号化するステップと、
j)第2、第3キーフレーム間の対応点情報、および現実の第3キーフレームと仮想の第3キーフレーム間で圧縮符号化された差分をこれらのキーフレーム間の符号化データとして出力するステップと、
を備える動画符号化方法。 - 請求項2に記載の方法において、さらに後続のキーフレームについて、順次前記のe)からj)のステップを繰り返す動画符号化方法。
- 請求項3に記載の方法において、前記のe)からj)のステップを所定のグループ終了キーフレームに到達したときに終了し、当該グループ終了キーフレームの次のキーフレームを新たに第1キーフレームと見なして前記のa)以下の処理を繰り返す動画符号化方法。
- k) 1以上の画像フレームを間に挟む第1、第2キーフレーム間の対応点情報、および第1キーフレームを取得するステップと、
l) 第1、第2キーフレーム間の対応点情報をもとに第1キーフレームに含まれる画素を移動させることによって、仮想の第2キーフレームを生成するステップと、
m) 予め符号化側にて求められた現実の第2キーフレームと仮想の第2キーフレームとの差分の圧縮符号化データを取得するステップと、
o) 取得された差分の圧縮符号化データと前記仮想の第2キーフレームとから、改良された仮想の第2キーフレームを生成するステップと、
p) 第1、第2キーフレーム間の対応点情報をもとに、第1キーフレームと改良された仮想の第2キーフレーム間で補間計算をすることにより、これらのキーフレームの間に存在すべき中間フレームを生成するステップと、
q) 第1キーフレーム、生成された中間フレーム、改良された仮想の第2キーフレームをこれらのキーフレーム間の復号データとして出力するステップと、
を備える動画復号方法。 - 請求項5に記載の方法において、さらに、
r) 1以上の画像フレームを間に挟む第2、第3キーフレーム間の対応点情報を取得するステップと、
s) 第2、第3キーフレーム間の対応点情報をもとに、改良された仮想の第2キーフレームに含まれる画素を移動させることによって、仮想の第3キーフレームを生成するステップと、
t) 予め符号化側にて求められた現実の第3キーフレームと仮想の第3キーフレームとの差分の圧縮符号化データを取得するステップと、
u) 取得された差分の圧縮符号化データと前記仮想の第3キーフレームとから、改良された仮想の第3キーフレームを生成するステップと、
v) 第2、第3キーフレーム間の対応点情報をもとに、改良された仮想の第2キーフレームと改良された仮想の第3キーフレーム間で補間計算をすることにより、これらのキーフレームの間に存在すべき中間フレームを生成するステップと、
w) 改良された仮想の第2キーフレーム、生成された中間フレーム、改良された仮想の第3キーフレームをこれらのキーフレーム間の復号データとして出力するステップと、
を備える動画復号方法。 - 請求項6に記載の方法において、さらに後続のキーフレームについて、順次前記のr)からw)のステップを繰り返す動画復号方法。
- 請求項7に記載の方法において、前記のr)からw)のステップを所定のグループ終了キーフレームに到達したときに終了し、当該グループ終了キーフレームの次のキーフレームを新たに第1キーフレームと見なして前記のk)以下の処理を繰り返す動画復号方法。
- 請求項1に記載の方法をコンピュータに実行せしめることを特徴とするコンピュータプログラム。
- 請求項5に記載の方法をコンピュータに実行せしめることを特徴とするコンピュータプログラム。
- 前記a)のステップにおけるマッチングの正確さを評価するステップをさらに備え、
評価の結果に依存して、前記c)のステップにおける圧縮スキームを切り替えることを特徴とする請求項1から4のいずれかに記載の動画符号化方法。 - 前記現実の第2キーフレームと仮想の第2キーフレームとの差分のうち、前記評価するステップにおいて前記第1、第2キーフレーム間のマッチング精度が高いと判断された領域に対応する部分の圧縮率を高くすることを特徴とする請求項11に記載の動画符号化方法。
- 前記評価するステップでは、前記対応点情報を生成するステップにおいて相互に対応するとされた前記第1、第2キーフレーム間の各点のうち、対応傾向を示すパラメータが近接する点のものと比べて所定のしきい値以上に異なる点をマッチングエラーとして検出し、
前記現実の第2キーフレームと仮想の第2キーフレームとの差分のうち、マッチングエラーが検出された領域に対応する部分の圧縮率を高くすることを特徴とする請求項11に記載の動画符号化方法。 - 前記評価するステップでは、マッチングエネルギー値に着目してマッチングの正確さを評価することを特徴とする請求項11から13のいずれかに記載の動画符号化方法。
- 前記マッチングエネルギーは対応点の位置と画素値の双方に基づいて導出されることを特徴とする請求項14に記載の動画符号化方法。
- 前記第1、第2キーフレーム及び間に挟まれる画像フレームの全てについて隣り合う画像フレームどうしのマッチングをさらに計算するステップと、
前記計算するステップで得られる各画像間のマッチングエネルギーを計算して、各画像フレームのマッチングエネルギーに関するパラメータを取得するステップと、
前記パラメータを累積的に加算するステップと、
加算の結果が所定のしきい値を越える画像フレームを新たにキーフレームとして登録するステップと、
をさらに備えることを特徴とする請求項1から4、11から15のいずれかに記載の動画符号化方法。 - 前記第2キーフレーム以降の各画像フレームについても、隣り合う画像フレームどうしでマッチングを計算し、マッチングエネルギーに関するパラメータの累積的な加算値が前記しきい値を越えた場合はその直前の画像フレームを新たにキーフレームとして登録することを特徴とする請求項16に記載の動画符号化方法。
- 画像フレームの全てについて隣り合う画像どうしのマッチングをさらに計算するステップと、
前記計算するステップで得られる各画像フレーム間のマッチングエネルギーに基づいて各画像フレームのマッチングエネルギーに関するパラメータを取得するステップと、
前記パラメータが、所定のしきい値を越える画像フレームを前記グループ終了キーフレームとするステップと、
をさらに備えることを特徴とする請求項4に記載の動画符号化方法。 - 第1、第2画像フレーム間で、領域ベースの画像マッチングを計算し、そのマッチング結果を利用して、少なくとも第3画像フレームを符号化する方法であって、
画像マッチングの結果の良否を領域ごとに判定するステップと、
第3画像フレームの符号化プロセスにおいて、前記判定するステップにおいて判定された良否に基づき、領域ごとに量子化スキームを選択するステップと、
を備える動画符号化方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004175979 | 2004-06-14 | ||
JP2004175979 | 2004-06-14 | ||
PCT/JP2005/005941 WO2005122593A1 (ja) | 2004-06-14 | 2005-03-29 | 動画符号化方法および動画復号方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2005122593A1 true JPWO2005122593A1 (ja) | 2008-04-10 |
Family
ID=35503519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006514417A Pending JPWO2005122593A1 (ja) | 2004-06-14 | 2005-03-29 | 動画符号化方法および動画復号方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20070206672A1 (ja) |
EP (1) | EP1765020A4 (ja) |
JP (1) | JPWO2005122593A1 (ja) |
KR (1) | KR20070026515A (ja) |
CN (1) | CN1957616A (ja) |
TW (1) | TW200612756A (ja) |
WO (1) | WO2005122593A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007192919A (ja) * | 2006-01-17 | 2007-08-02 | Olympus Corp | 画像表示装置 |
JP2007288614A (ja) * | 2006-04-18 | 2007-11-01 | Monolith Co Ltd | 画像圧縮方法、画像圧縮装置、および動画符号化方法 |
US10027478B2 (en) * | 2007-10-09 | 2018-07-17 | International Business Machines Corporation | Differential key backup |
TWI424360B (zh) * | 2007-12-31 | 2014-01-21 | Altek Corp | Multi-directional face detection method |
US8300964B2 (en) * | 2008-08-07 | 2012-10-30 | Apteryx Inc. | System and method for preparing spatially related medical digital image data sets for image compression and storage prior to image reconstruction |
EP2330817B1 (en) * | 2008-09-04 | 2016-08-31 | Japan Science and Technology Agency | Video signal converting system |
WO2012042720A1 (ja) * | 2010-09-30 | 2012-04-05 | 三菱電機株式会社 | 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法 |
GB2520840A (en) * | 2010-10-01 | 2015-06-03 | Trust Battery Ireland Ltd | Detection of radio frequency emissions |
US9578333B2 (en) * | 2013-03-15 | 2017-02-21 | Qualcomm Incorporated | Method for decreasing the bit rate needed to transmit videos over a network by dropping video frames |
US10621446B2 (en) * | 2016-12-22 | 2020-04-14 | Texas Instruments Incorporated | Handling perspective magnification in optical flow processing |
CN115499666B (zh) * | 2022-11-18 | 2023-03-24 | 腾讯科技(深圳)有限公司 | 视频的压缩方法、解压缩方法、装置、设备和存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU657510B2 (en) * | 1991-05-24 | 1995-03-16 | Apple Inc. | Improved image encoding/decoding method and apparatus |
JPH0787482A (ja) * | 1993-09-17 | 1995-03-31 | Fujitsu Ltd | 画像データの符号化方法及び復元方法並びに装置 |
JP2947089B2 (ja) * | 1994-10-07 | 1999-09-13 | 日本電気株式会社 | 動画像復号方法および装置 |
JP3604864B2 (ja) * | 1997-04-25 | 2004-12-22 | シャープ株式会社 | 動画像符号化装置 |
JP3757088B2 (ja) * | 1999-10-26 | 2006-03-22 | 日本電気株式会社 | 動画像符号化装置および方法 |
US6567469B1 (en) * | 2000-03-23 | 2003-05-20 | Koninklijke Philips Electronics N.V. | Motion estimation algorithm suitable for H.261 videoconferencing applications |
US6842483B1 (en) * | 2000-09-11 | 2005-01-11 | The Hong Kong University Of Science And Technology | Device, method and digital video encoder for block-matching motion estimation |
JP3859989B2 (ja) * | 2000-10-30 | 2006-12-20 | 株式会社モノリス | 画像マッチング方法およびその方法を利用可能な画像処理方法と装置 |
JP4050472B2 (ja) * | 2001-02-06 | 2008-02-20 | 株式会社モノリス | 画像生成方法、装置およびシステム |
JP2003018602A (ja) * | 2001-04-24 | 2003-01-17 | Monolith Co Ltd | 画像データ符号化および復号のための方法および装置 |
-
2005
- 2005-03-29 WO PCT/JP2005/005941 patent/WO2005122593A1/ja not_active Application Discontinuation
- 2005-03-29 EP EP05727896A patent/EP1765020A4/en not_active Withdrawn
- 2005-03-29 KR KR1020067024383A patent/KR20070026515A/ko not_active Application Discontinuation
- 2005-03-29 JP JP2006514417A patent/JPWO2005122593A1/ja active Pending
- 2005-03-29 CN CNA2005800164195A patent/CN1957616A/zh active Pending
- 2005-03-29 US US11/547,289 patent/US20070206672A1/en not_active Abandoned
- 2005-03-31 TW TW094110394A patent/TW200612756A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
US20070206672A1 (en) | 2007-09-06 |
EP1765020A1 (en) | 2007-03-21 |
TW200612756A (en) | 2006-04-16 |
WO2005122593A1 (ja) | 2005-12-22 |
CN1957616A (zh) | 2007-05-02 |
KR20070026515A (ko) | 2007-03-08 |
EP1765020A4 (en) | 2010-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3889233B2 (ja) | 画像符号化方法と装置および画像復号方法と装置 | |
JPWO2005122593A1 (ja) | 動画符号化方法および動画復号方法 | |
JP2008252860A (ja) | 画像処理方法及び画像処理装置 | |
JP2008282377A (ja) | 画像処理方法および装置 | |
JP2008282376A (ja) | 画像処理方法および装置 | |
JP3877651B2 (ja) | 画像処理方法と装置 | |
US20030076881A1 (en) | Method and apparatus for coding and decoding image data | |
JP4157686B2 (ja) | 画像符号化および復号のための方法および装置 | |
JP4050472B2 (ja) | 画像生成方法、装置およびシステム | |
JP4039858B2 (ja) | 画像マッチング方法と装置、および画像符号化方法と装置 | |
JP2003037842A (ja) | 画像符号化方法、復号方法および画像符号化装置、復号装置 | |
JP2007122751A (ja) | 画像処理のための方法、装置、プログラム | |
JP2007288614A (ja) | 画像圧縮方法、画像圧縮装置、および動画符号化方法 | |
JP3839353B2 (ja) | 画像符号化方法と装置および画像復号方法および装置 | |
JP4524412B2 (ja) | 画像符号化方法、復号方法および画像符号化装置、復号装置 | |
JPWO2007069350A1 (ja) | 画像符号化および復号の方法と装置 | |
JPWO2007069320A1 (ja) | 動画符号化方法および動画復号方法 | |
JP3773417B2 (ja) | 画像データ符号化および復号のための方法および装置 | |
JP3827981B2 (ja) | 画像符号化方法と装置および画像復号方法と装置 | |
JP2003274399A (ja) | 画像符号化方法と装置、画像復号方法と装置 | |
JP2004048595A (ja) | 画像符号化方法および装置 | |
WO2007072543A1 (ja) | 動画符号化方法 | |
JP4220735B2 (ja) | 画像処理方法、及び画像処理装置 | |
JP2004048496A (ja) | 画像符号化方法および装置、画像復号方法および装置と、画像配信装置 | |
JP2007174690A (ja) | 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080613 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20080820 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20090608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090630 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091027 |