JP3764494B2 - 動画像分析合成装置 - Google Patents

動画像分析合成装置 Download PDF

Info

Publication number
JP3764494B2
JP3764494B2 JP26665093A JP26665093A JP3764494B2 JP 3764494 B2 JP3764494 B2 JP 3764494B2 JP 26665093 A JP26665093 A JP 26665093A JP 26665093 A JP26665093 A JP 26665093A JP 3764494 B2 JP3764494 B2 JP 3764494B2
Authority
JP
Japan
Prior art keywords
analysis
feature point
information
unit
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26665093A
Other languages
English (en)
Other versions
JPH07123409A (ja
Inventor
雅博 藤田
仁 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP26665093A priority Critical patent/JP3764494B2/ja
Publication of JPH07123409A publication Critical patent/JPH07123409A/ja
Application granted granted Critical
Publication of JP3764494B2 publication Critical patent/JP3764494B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、たとえば、画像記録、通信などの分野で利用される画像処理および符号化処理を行う装置とその方法に関するものであり、特に、効率のよい動画像データを符号し、さらに符号化した結果を復号することが可能な動画像分析合成装置に関する。
【0002】
【従来の技術】
効率のよい画像圧縮の方法は数多く考えられているが、依然として、画質、圧縮率をさらに高めなければならないという要請がある。
二次元静止画像に関しては、人間の視覚特性が輝度の急変するエッジに対して敏感であることを考慮して、そのエッジ部分を忠実に再現する試みがされている。しかしながら、動画像に関しては、まだそのような試みを行ったことは知られていない。
したがって、動画像に対しても効率の良い画像圧縮技術を開発することが望まれている。
【0003】
動画像処理においては、空間二次元信号を時間方向に並べることにより三次元時空間画像として見なすことができる。
人間の視覚特性はこの三次元時空間画像に対して通常の二次元空間におけるエッジ検出と並行して時間方向における動き検出も行なっている。特に動くエッジに対しては敏感な反応が視覚情報処理を司る神経細胞で観測されている。
したがって、二次元空間におけるエッジ検出が視覚にとって重要であったのと同様に時間方向における動くエッジも重要であることが示唆される。
従来の動き検出を用いた画像圧縮は、二次元空間における動き検出を何らかの方法で行なって、それを用いて時間方向に予測を行ない、その誤差の符号化を行っている。
【0004】
【発明が解決しようとする課題】
しかしながら、この方法では先に述べた動くエッジに注目してそこの情報を忠実に送るという技術ではないから、動画像に対して充分高い効率の符号化が達成されていない。
【0005】
したがって、本発明は、動画像に対して高画質で高い圧縮率を達成することが可能な画像圧縮技術とそれを用いた装置を提供することを目的とする。
つまり、本発明は、視覚的に遜色のない空間方向、時間方向への画像の拡大あるいは補間を行い、視覚的に遜色のない画質で高い圧縮率を達成できる動画像分析合成装置を提供することを目的とする。
さらに本発明は、上記高い圧縮率で符号化した画像データから元の画像データを復元できる装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
本発明によれば、次元平面と時間方向とで規定される三次元方向のスムージング関数であって、周波数空間の異なる帯域ごとに定義される複数のスムージング関数のうち、最も粗い解像度に相当する帯域のスムージング関数を元の画像データに畳み込んで前記元の画像データのDC成分を独立に分析し、前記元の画像データから前記分析したDC成分を減じてDC成分を含まない画像データを算出し、該DC成分を含まない画像データについて前記複数のスムージング関数を、それぞれ、前記三次元方向の各方向において1回偏微分した複数の第1分析フィルタ関数を畳み込んで、前記異なる帯域ごとに多重解像度分析を行う情報変化分析手段と、該情報変化分析手段で求めた前記DC成分を含まない画像データについて、前記複数のスムージング関数を、それぞれ、前記三次元方向の各方向において2回偏微分した複数の第2分析フィルタ関数を畳み込み、畳み込み結果が0となるゼロクロス点を求め、前記異なる帯域ごとに前記ゼロクロス点が発生した位置を検出する特徴点検出手段と、複数のフレームの各フレームごとに、前記特徴点検出手段で検出した前記ゼロクロス点の集合からなる該フレームに属するゼロクロス点を抽出し、該抽出したゼロクロス点の集合からなる曲線についてその曲率の極値を与える点を求め、前記複数のフレームのうち所定のフレームを基準フレームとし、該基準フレームにおける前記曲線の位置情報と、前記極値を与える点の集合のうち前記基準フレームとこれに続く各フレームとの間で対応する点を時間方向に連結した曲線の位置情報とを、前記異なる帯域ごとに符号化する特徴点符号化手段と、前記情報変化分析手段で求めた多重解像度分析結果について、前記極値を与える点における分析結果を、前記異なる帯域ごとに符号化する情報符号化手段とを備えることを特徴とする動画像分析合成装置が提供される。
好ましくは、動画像分析合成装置は、前記特徴点符号化手段の符号化結果と、前記情報符号化手段の符号化結果との冗長度をさらに圧縮し、または、量子化のためのビット割当を行なうため総合的に符号化する、総合符号化手段をさらに有する。
【0007】
また好ましくは、前記特徴点符号化手段は、前記ゼロクロス点について重複している点がある場合には1つにまとめてゼロクロス点の集合とする。
また好ましくは、前記特徴点符号化手段は、隣接するフレームにおける前記極値を与える点の距離が最小になるもの同士を連結する。
【0008】
また本発明によれば、前記情報符号化手段から出力されたデータについて、前記特徴点符号化手段における処理と逆の処理を行い前記特徴点検出手段で検出した結果と等価のデータを復号し、該復号したデータについて前記特徴点検出手段における処理と逆の処理を行い前記特徴点検出手段に入力された前記DC成分を含まない画像データを復号し、前記情報符号化手段の処理と逆の処理を行い前記情報変化分析手段から出力されたデータと等価の分析結果を復号する、情報再生手段と、該情報再生手段で復号した分析結果に基づいて補間と逆変換を反復して収束させて前記符号化前の元の画像データを復号する元画像再生手段とを有する、動画像分析合成装置が提供される。
【0009】
【実施例】
本発明は動画像を二次元画像平面と時間軸が構成する三次元空間に画像情報(輝度信号、色差信号など)が分布しているものと見なし、その動画像の変化を分析して、動画像の変化の特徴点における情報を用いて元の動画像を近似する。
この実施例では、その近似として三次元空間における動画像についての特徴点による曲面の検出と、曲面を構成するその特徴点における分析結果を用いて、上記曲面を構成する特徴点以外の曲面を構成すると予想される点の画像情報を補間する。
上記曲面を構成する特徴点の場所も情報であるのでこれも符号化しなければならないが、ここでは、曲面という幾何学的な構造をパラメトリックな関数表現で表し、そのパラメトリックな関数を分析して画像データの圧縮を行う。
【0010】
以下、図面を参照して本発明の実施例の動画像分析合成装置について詳述する。
説明を容易にするため、白黒の動画像がFフレームだけフレームメモリへ送られ、このFフレーム分の動画像をまとめて符号化することを考える。
図1は本実施例の動画像分析合成装置1のブロック図である。
この動画像分析合成装置(システム)1は分析部(動画像分析装置)10と合成部(動画像合成装置)20とを有する。分析部10と合成部20との間には信号伝送系、たとえば、磁気テープまたは磁気ディスクなどの磁気記録媒体、あるいは、通信システムにおける信号伝送系などが存在するが、図面においては省略している。
分析部10は、画像メモリ11、情報変化分析部12、特徴点検出部13、特徴点符号化部14、情報符号化部15および総合符号化部16を有する。
合成部20は、総合再生部21、情報再生部22および元画像再生部23を有する。
【0011】
まず、上述した構成部分の処理内容の概要を述べる。
画像メモリ11は入力された白黒動画像をFフレーム分を記録し、情報変化分析部12はその動画像の輝度変化の三次元方向の分析を行う。
特徴点検出部13は、情報変化分析部12における分析結果から特徴点の存在する場所を三次元空間上に点として表現する。
特徴点符号化部14は、特徴点検出部13の解析結果である特徴点の存在する場所を曲面として表現する。
情報符号化部15は、元の動画像を再生するための分析を、情報変化分析部12で分析した結果を参照して、特徴点符号化部14における上述の特徴点の存在する場所において実行し、その分析結果を総合符号化部16に送出する。
総合符号化部16は、特徴点符号化部14と情報符号化部15から送られてくる情報を総合して適切に符号化する。
【0012】
総合再生部21は、総合符号化部16において符号化された情報を、信号伝送系(図示せず)を介して受信して、その情報から特徴点符号化部14と情報符号化部15の出力情報を再生する。
情報再生部22は、特徴点の位置に関する再生結果を基に特徴点を三次元空間内に選び、情報符号化部15の分析結果に関する再生結果をその位置に配置する。
情報再生部22は、特徴点以外の場所における画像成分も補間処理することにより、元の動画像の視覚的に重要である三次元空間で輝度変化の激しい部分は忠実に、その他の部分はなだらかに近似する。
【0013】
さらに上述した各部の処理内容の詳細について述べる。
画像メモリ11
画像メモリ11は、カメラやビデオ装置などの画像信号出力装置(図示せず)からFフレーム分の動画像を順次連続して入力して記憶する。この入力画像データを元の画像データ(または、原画像データ、あるいは、初期画像データ)I0(x,y,t)として表す。パラメータxは(x−y)二次元平面における横(x軸)方向の位置、パラメータyは縦(y軸)方向の位置、パラメータtは時間経過を示す。記号Iは白黒画像の輝度(強度)を示す。記号Io は初期状態における(または元の画像の)輝度を示す。
この画像メモリ11に記憶された元の画像データI0 (x,y,t) は、x−y二次元平面として規定される画像平面(イメージ平面)と、時系列的な変化を時間(t)軸に置き換えた時間方向との三次元空間上に分布する情報として扱うことができる。
この画像メモリ11に記憶された三次元的な元の画像データI0 (x,y,t) は、情報変化分析部12において分析を行うために、画像メモリ11から読み出されて情報変化分析部12に出力される。
【0014】
情報変化分析部12
情報変化分析部12においては、画像メモリ11から読み出した元の画像データI0 (x,y,t) についての三次元的な変化を分析する。
具体的には、この三次元的な変化の分析として、情報変化分析部12は、異なる分析スケールを適用する多重解像度での三次元の各方向へ方向性のあるフィルタリング処理を行なう。
多重解像度とは、周波数空間において帯域特性の異なる複数のフィルタを用いて信号を帯域ごとに分割することを意味し、情報変化分析部12において、複数の分析スケールσj について、サフックス(インデックス)j=j1,j2,・・・,jJについて行なう。
情報変化分析部12はまず、画像メモリ11から読みだした元の画像データI 0 (x,y,t) DC成分を独立に分析する。窓関数あるいはスムージング関数を三次元ガウス関数として表されるG(x,y,t: σj ) とおくと、元の画像データI 0 (x,y,t) DC成分は、最も粗い解像度j=jJに相当する三次元スムージング関数G(x,y,t: σi ) によるフィルタリング処理結果に相当する。このことは、下記式1で表されるように、元の画像データI0 (x,y,t) に三次元スムージング関数G(x,y,t: σi ) を畳み込むことによって、元の画像データI 0 (x,y,t) DC成分が抽出されること意味している。
【0015】
【数1】
Figure 0003764494
【0016】
1つの記号*は1回の畳み込み演算を表す。式1には3個の*が存在するから、パラメータx,y,tについて3回、つまり、三次元の畳み込み演算が行われることを示している。
元の画像データI0 (x,y,t) から式1で表されるDC成分を減じたDC成分を含まない画像データI(x,y,t) は下記式で表される
【0017】
【数2】
Figure 0003764494
【0018】
以下、式2で表したDC成分を含まない画像データI(x,y,t) を単に、画像データとも呼ぶ。
このDC成分を含まない画像データI (x,y,t) は特徴点検出部13に出力される他、下記の演算に使用される。
情報変化分析部12は、式2で示されるDC成分を含まない画像データI(x,y,t) の変化を分析する。以下、情報変化分析部12の分析処理を述べる。
まず、情報変化分析部12は三次元スムージング関数G(x,y,t: σi ) を、x,y,tでそれぞれ偏微分した下記式3〜5で表される第1分析フィルタ関数を求める。
【0019】
【数3】
Figure 0003764494
【0020】
【数4】
Figure 0003764494
【0021】
【数5】
Figure 0003764494
【0022】
情報変化分析部12は、求めた第1分析フィルタ関数をそれぞれDC成分を含まない画像データI (x,y,t) に対して畳み込む。
その演算式を式6〜8に示す。
【0023】
【数6】
Figure 0003764494
【0024】
【数7】
Figure 0003764494
【0025】
【数8】
Figure 0003764494
【0026】
以上の演算を行うことにより、情報変化分析部12において、三次元方向x,y,tについてそれぞれDC成分を含まない画像データI (x,y,t) について多重解像度分析が行われたことになる。
なお、たとえば、式6に示したx方向における第1畳み込み演算結果W x (x,y,t: σ j ) はスムージング関数G (x,y,t: σ i ) を1回偏微分した関数(第1分析フィルタ関数)をDC成分を含まない画像データI (x,y,t) に畳み込んだ結果を示し、後述する式12に示すx方向における第2畳み込み演算結果W xx (x,y,t: σ j ) はスムージング関数G (x,y,t: σ i ) を2回偏微分した関数(第2分析フィルタ関数)をDC成分を含まない画像データI (x,y,t) に畳み込んだ結果を示す。
上記得られた多重解像度分析結果は情報符号化部15で用いられる。
【0027】
特徴点検出部13
特徴点検出部13は式6〜8に示した情報変化分析部12の分析結果(多重解像度分析結果)の極値、つまり、極大値または極小値の場所(位置または点)を求める。
その具体的な処理について述べると、特徴点検出部13は、式6〜式8の結果について、x,y,t方向それぞれにもう一度同じ方向に微分して、微分した結果についてゼロクロス点を求める。ゼロクロス点が情報変化分析部12において求めた式6〜8に示した多重解像度分析結果の極値を示しており、特徴点検出部13はその極値が発生した位置を、多重解像度分析結果の特徴点の位置として記憶する。
なお、上記特徴点検出部13における、式6〜式8の結果についてそれぞれの方向においてもう一度同じ方向に微分して得た関数をDC成分を含まない画像データI (x,y,t) に畳み込むことは、式3〜6の結果を同じ方向に2回微分して得た第2分析フィルタ関数をDC成分を含まない画像データI (x,y,t) に畳み込むことと実質的に同じである。
この特徴点検出部13における演算は、畳み込みに使用する分析フィルタ関数が、情報変化分析部12においては式3〜6に示したものであり、特徴点検出部13においては式6〜8をさらに1回微分したものであるという相違はあるが、画像データI (x,y,t) を分析フィルタ関数で畳み込むという点において情報変化分析部12における演算とほぼ同じである。
特徴点検出部13においては、三次元スムージング関数G(x,y,t: σi ) について、式9〜11に示した、x,y,tのそれぞれの方向への2階(2回)微分(偏微分)した第2分析フィルタ関数をDC成分を含まない画像データI (x,y,t) に畳み込んだフィルタ出力のうちゼロクロス点を求めることになる。
スムージング関数G(x,y,t: σi ) について三次元x,y,tのそれぞれの方向への2階(2回)偏微分して求めた第2分析フィルタ関数を下記式9〜式11に示す。
【0028】
【数9】
Figure 0003764494
【0029】
【数10】
Figure 0003764494
【0030】
【数11】
Figure 0003764494
【0031】
上述したように、特徴点検出部13は、上記2階偏微分として式9〜11に定義された第2分析フィルタ関数にDC成分を含まない画像データI(x,y,t) を畳み込む。その演算式を下記12〜14に示す。
【0032】
【数12】
Figure 0003764494
【0033】
【数13】
Figure 0003764494
【0034】
【数14】
Figure 0003764494
【0035】
なお、たとえば、式6に示したx方向における第1畳み込み演算結果W x (x,y,t: σ j ) はスムージング関数G (x,y,t: σ i ) を1回偏微分して求めた第1分析フィルタ関数をDC成分を含まない画像データI (x,y,t) に畳み込んだ結果を示すが、式12に示したx方向における第2畳み込み演算結果W xx (x,y,t: σ j ) はスムージング関数G (x,y,t: σ i ) を2回偏微分して求めた第2分析フィルタ関数をDC成分を含まない画像データI (x,y,t) に畳み込んだ結果を示す。
特徴点検出部13は、式12〜14の演算を行って、その演算結果から三次元x,y,t方向それぞれのゼロクロス点を求める。
ここで、式12において、x方向における第2畳み込み演算結果WxxI(x,y,t: σj ) が0となるゼロクロス点(ゼロクロス位置)を、Pxi (xxi,yxi,txi: σj ) と表す。但し、インデックスi=1,2,・・,Nx j について、Nx jのゼロクロス点があるものとする。
同様に、式13において、y方向における第2畳み込み演算結果WyyI( x,y,t:σj ) が0となるゼロクロス点(ゼロクロス位置)を、Pyh (xyh,yyh,tyh: σj ) と表す。但し、インデックスh=1,2,・・,Ny j について、Ny jのゼロクロス点があるものとする。
また同様に、式14において、t方向における第2畳み込み演算結果WttI(
x,y,t:σj ) が0となるゼロクロス点(ゼロクロス位置)を、Ptk (xtk,ytk,ttk: σj ) と表す。但し、インデックスk=1,2,・・,Nt j について、Nt
jのゼロクロス点があるものとする。
簡単な表現にするため、x方向における第2畳み込み演算結果W xx (x,y,t: σ j ) が0となるゼロクロス点(ゼロクロス位置)Pxi (xxi ,y xi,txi: σj )
を点Pxi (j) 、y方向における第2畳み込み演算結果W yy ( x,y,t: σ j ) が0となるゼロクロス点Pyh (xyh,yyh,tyh: σj ) を点Pyh (j) 、t方向における第2畳み込み演算結果W tt ( x,y,t: σ j ) が0となるゼロクロス点Ptk (xtk,ytk,ttk: σj ) を点Ptk (j) と表す。
【0036】
以上のように、特徴点検出部13において、式12〜14の演算を行って、x,y,t方向それぞれのゼロクロス点、つまり、DC成分を含まない画像データI (x,y,t) についての極大値または極小値(極値)、および、その位置を求める。
【0037】
特徴点符号化部14
特徴点符号化部14は、特徴点検出部13で算出した、x方向における第2畳み込み演算結果W xx (x,y,t: σ j ) が0となるゼロクロス点Pxi (j) 、y方向における第2畳み込み演算結果W yy ( x,y,t: σ j ) が0となるゼロクロス点Pyh (j) 、t方向における第 2畳み込み演算結果W tt ( x,y,t: σ j ) が0となるゼロクロス点Ptk (j) を曲面上の点としてとらえ、その曲面のパラメータにより、ゼロクロス点Pxi (j) 、ゼロクロス点Pyh (j) 、ゼロクロス点Ptk (j) を表すことにより、符号化する。
図6は特徴点符号化部14の処理を示すフローチャートである。この詳細については後述する。
特徴点符号化部14はまず、ゼロクロス点Pxi (j) 、ゼロクロス点Pyh (j) 、ゼロクロス点Ptk (j) 重複している場合は、1つにするようにして特徴点の集合P(j)を作る。つまり、特徴点の集合P(j)は、x方向における第2畳み込み演算結果WxxI(x,y,t: σj ) が0か、y方向における第2畳み込み演算結果yyI( x,y,t:σj ) が0か、t方向における第2畳み込み演算結果ttI( x,y,t:σj ) が0かのいずれかである。その特徴点の要素をPp(j) と表す。ただし、p=1,2,・・・,Np で全部でNp個の特徴点からなるとする。
ここで、x,y,t方向からなる三次元上に分布する特徴点を二次元上に分布する特徴点としてとらえるために、特徴点符号化部14は、x−y−tで構成される三次元空間をx−y二次元平面と平行にスライスして二次元平面に落とす(射影する)。そして、特徴点符号化部14は、二次元平面上の特徴点を連結して曲線を抽出する。
ここで、連結とはある特徴点Pp(j) に注目し、その画素を中心として(3×3)画素から構成される正方形画像について上述した処理を行ない、その中に同じく特徴点 P(j)の要素である特徴点が含まれていればその点を同一曲線に含むことを言う。
さらに、特徴点符号化部14は、以上の処理から得られた各二次元平面上の曲線を時間軸方向(t方向)に連結して曲面として表現する。特徴点符号化部14は、まずある曲線に注目し、この曲線と次のフレームの曲線の各要素点(特徴点)の9個の画素(3×3)の近傍にある点の数を計算する。そして、特徴点符号化部14は一番一致した曲線同士を連結して曲面を構成する。
【0038】
次に、特徴点符号化部14は、上述のごとく連結してグルーピングされた曲面を切断曲線と曲率の極値(極大値または極小値)を連結した曲線で表現する。
図2に曲面の例を示す。
まず、特徴点符号化部14は、上述のごとく二次元平面上の特徴点を連結して得た曲面をx−y平面と平行にスライスする。これにより、上記曲面は各平面上の切断曲線になる。そして、特徴点符号化部14は、基準となる第1フレーム目の曲線の位置の情報を保持する。
次に、特徴点符号化部14は各切断曲線に対し曲率κ(s) を求め、さらに曲率の極大値または極小値(極値)の位置を求める。ただし、変数sは始点からの位置を表すパラメータである。特徴点符号化部14における上記切断曲線から曲率κ(s) を求める手法については後述する。
そして、特徴点符号化部14は求めた曲率κ (s) の極値の位置を、図2に破線で示すt( 時間軸) 方向に連結する。
ここで、特徴点符号化部14は、t方向への連結では、あるフレーム上の曲線Li に含まれる曲率の極値点P niと次のフレーム上の曲線Li+1 に含まれる曲率の極値点P i+1mに対して下記式で定義される距離Dを計算する。
【0039】
【数15】
Figure 0003764494
【0040】
そして、特徴点符号化部14は、距離Dが最小になった極値点同士を、図2に付加データとして例示したように、連結する。
以上により、特徴点符号化部14は、上述のごとく二次元平面上の特徴点を連結して得た曲面をx−y平面と平行にスライスして得た各切断曲線を、基準となる第1フレーム目の位置の情報、各フレーム上での極値の位置をt方向に連結した情報により得た曲面を表現する。
特徴点符号化部14は、このとき、上記曲面をx−y平面と平行にスライスした結果、新たに出現した切断曲線についてはこれをメモリ(図示せず)に保持する。
図3に、基準となる第1フレームとt方向の連結線によって表現された曲面の様子を示す。
【0041】
情報符号化部15
情報符号化部15は、前述の特徴点で構成する曲面の上で情報を分析し、それを参照して情報変化分析部12における多重解像度分析結果の圧縮処理を行なう。これらの上での圧縮を行なう理由を述べる。
つまり、これらの特徴点は、情報変化分析部12で多重解像度分析した第1畳み込み演算結果を示す情報(多重解像度分析結果)の極値を与える点であり、その極値は、つながっている特徴点の上は、なだらかにしか変化しないから(連続しているから)情報変化分析部12における多重解像度分析結果圧縮処理を行うことができる
より具体的に述べると、前述した特徴点の集合p(j)を曲面で表現し、特徴点符号化部14ではその位置(x,y,t) を符号化したが、情報符号化部15は、情報変化分析部12で求めた多重解像度分析結果第1畳み込み演算結果)W xI(x,y,t: σi ) 、W yI(x,y,t: σi ) 、W tI(x,y,t: σi ) を、第2畳み込み演算結果W xx ( x,y,t: σ j ) 、W yy ( x,y,t: σ j ) 、W tt ( x,y,t: σ j ) について上述した特徴点符号化部14と同様の手法で符号化する。
情報符号化部15における曲面の分析結果の符号化では、特徴点符号化部14において表現された特徴点の位置における分析結果を曲面の情報として持つことにより情報変化分析部12の多重解像度分析結果について圧縮を行なう。つまり、曲面上に乗っている情報変化分析部12における多重解像度分析結果を特徴点符号化部14で表された第1フレームの切断曲線と曲率とを時間方向につないだ連結線の位置の分析結果だけで表して圧縮する
以上のように、情報符号化部15は特徴点の上での多重解像度分析結果、特徴点符号化部14の結果を参照して圧縮処理を行なう。
【0042】
総合符号化部16
総合符号化部16は、特徴点符号化部14と情報符号化部15からのデータを符号化する。
この符号化を簡単に述べると、総合符号化部16は特徴点符号化部14における結果と、情報符号化部15における結果との両者の冗長度をさらに圧縮したり、あるいは量子化のためのビット割当などを行なう。
また、必要であれば、総合符号化部16は、誤り訂正のための符号化処理を行なう。さらに総合符号化部16はその結果を記録し、合成部20に送信する。
【0043】
以下、合成部20の処理について述べる。
総合再生部21
総合再生部21は、総合符号化部16の符号化データを入力し総合符号化部16の逆の操作を行なう。
つまり、総合再生部21は、特徴点符号化部14と情報符号化部15の情報、すなわち、特徴点の場所に関するデータとその上の情報を再構成するのに必要なデータを復号する。
【0044】
情報再生部22
情報再生部22は、総合再生部21から得られた特徴点符号化部14の出力と等価なデータから特徴点の位置、および、情報符号化部15の情報符号化の出力と等価な情報から、(x −y −t )で規定される三次元空間における全ての特徴点の位置とその位置における情報(本実施の形態では白黒画像データの輝度)を復元する(復号する)
つまり、情報再生部22は、特徴点符号化部14と情報符号化部15で行なった圧縮の逆処理を行なう。換言すれば、情報再生部22は、曲面としてグループ化された(連結された)特徴点とその上の情報変化分析部12の結果を復元する(復号する)
【0045】
図4は情報再生部22において復元(復号)された曲面を示す図である。
情報再生部22はまず、総合再生部21で復号された基準となる第1フレーム目の情報を読み込む。
次に、情報再生部22は総合再生部21で復元された各フレームの曲率の極値をt方向に連結した情報を読み込む。
さらに情報再生部22は、第1フレームのi番目の極値の位置P1(si ) と、第1フレームの(i+1) 番目の極値の位置P1(si+1 )と、それぞれに対応した次のフレームのj番目の極値の位置P2(sj ) と、(j+1) 番目の極値の位置P2(sj+1)を選び出す。
情報再生部22は、この4点に対し、第1フレーム上のi番目と(i+1) 番目の極値に囲まれた曲線の位置情報を使って、次のフレーム上のi’番目と(i+1)’番目の極値に囲まれた曲線の位置を補間する。
情報再生部22は、以上の操作を全てのフレームに対して行ない位置情報を全て復元する(復号する)上記曲線の位置の補間の方法については後述する。
同様に、情報再生部22は、第1フレーム目の位置情報の上にある分析結果をt方向に順次補間することにより、情報変化分析部12の結果を復元する(復号する)
【0046】
元画像再生部23
元画像再生部23は、情報再生部22における上記の操作で得られた情報変化分析部12の分析結果の極値である情報に基づいて、補間近似し、(x −y −t)の三次元空間全体での情報変化分析部12の結果を復元し(復号し)復号した結果ついて式6〜8の逆変換を行ない、x-y-t の三次元におけるDC成分を含まない画像データI (x,y,t) を復元する(復号する)
この例では、元画像再生部23は、Convex Projection 法(凸面突起)法を用いて補間と逆変換を何回か繰り返して収束させる。
元画像再生部23はまず、特徴点からの補間は簡単のために三次元(x,y,t )の方向に対して独立に行なう。すなわち、元画像再生部23は、x方向に全てのyと全ての時間t に対して全部で(y×t)本の一次元データと見なし、極値における分析結果 xx (x,y,t: σi ) を用いて、Convex Projection 法により、その点を極値とするような射影を取る。元画像再生部23はy方向とt方向に対しても、x方向と同様に処理を行なう。
元画像再生部23は、得られた近似データを式20で定義された方法で逆変換を行ない、再び式6〜8で定義された方法で元の分析空間に射影する。
元画像再生部23は、この操作を数回繰り返して、極値における分析結果(第1畳み込み演算結果)x I(x,y,t: σi ) 、Wy I(x,y,t: σi ) 、Wt I(x,y,t: σi ) へ収束させる。
元画像再生部23は、最後に逆変換を行ないDC成分を含まない画像データI(x,y,t) を復元する(復号する)
逆変換は下記式で表されるフィルタ関数を上記分析結果(第1畳み込み演算結果)W x (x,y,t: σ i ) 、W y (x,y,t: σ i ) 、W t (x,y,t: σ i ) に畳み込めばよい。
【0047】
【数16】
Figure 0003764494
【0048】
【数17】
Figure 0003764494
【0049】
【数18】
Figure 0003764494
【0050】
上記式における記号C(u,v,w)は下記式で定義される。
【0051】
【数19】
Figure 0003764494
【0052】
式16〜18の左辺はそれぞれ、スムージング関数(ガウス関数)Gx (u,v,w: σi ) 、Gy (u,v,w: σi ) 、Gt (u,v,w: σi ) のフーリエ変換を表し、つまり、頭部の山形ハットはフーリエ変換を表し、右肩の*は複素関数を表し、右辺の頭部の−は複素共役を表す。
DC成分を含まない画像データI(x,y,t) は式16〜18で定義される逆変換のフィルタを用いて下記式で求められる。
【0053】
【数20】
Figure 0003764494
【0054】
最後に、元画像再生部23は、下記式に示すように、DC成分を含まない画像データI(x,y,t) にDC成分S iJ(x,y,t) を加えて元の動画像データI0 (x,y,t) を復元する(復 号する)
【0055】
【数21】
Figure 0003764494
【0056】
このようにして、合成部20は分析部(動画像分析装置)10において符号化されたデータから元の画像データI0 (x,y,t) を再現できた。
以下、特徴点符号化部14で用いた曲線からの曲率の計算アルゴリズム(方法)、および、情報再生部22で用いた曲面の補間アルゴリズム(方法)について詳述する。
【0057】
曲率計算方法
まず、特徴点符号化部14における曲率の計算方法について述べる。
特徴点符号化部14は、入力された曲線から曲率を計算し、曲率で曲線を表現する。
いま曲線のデータ列P(s)を、パラメータs として二次元上の位置を下記式で表す。
【0058】
【数22】
Figure 0003764494
【0059】
パラメータl(エル) の関数(x(l),y(l)) の微分が存在しているとすると、曲率κ(l) は次のように計算できる。
【0060】
【数23】
Figure 0003764494
【0061】
として
【0062】
【数24】
Figure 0003764494
【0063】
とする。式24は次式より導出される。
【0064】
【数25】
Figure 0003764494
【0065】
式25を、パラメータxについて1階(1回)微分、さらに2階(2回)微分すると下記式が得られる。
【0066】
【数26】
Figure 0003764494
【0067】
式26を式25に代入すると下記式が得られる。
【0068】
【数27】
Figure 0003764494
【0069】
式27および式25から下記式が得られる。
【0070】
【数28】
Figure 0003764494
【0071】
ここで、x(s),y(s) に対するパラメータs による1階(1回)微分および2階(2回)微分は、下記式で表される。
【0072】
【数29】
Figure 0003764494
【0073】
したがって、下記式が得られる。
【0074】
【数30】
Figure 0003764494
【0075】
式28および式30から曲率κ(l) は下記式で表される。
【0076】
【数31】
Figure 0003764494
【0077】
以上より、特徴点符号化部14は、式31を用いて曲線のデータ列P(s)の曲率κ(s) を求めることができる。曲率κ(s) が求められれば曲面が判る。
しかしながら、データ列P(s)は、量子化された位置のデータであるため、得られる曲率は振動的になる。これを改善するために、特徴点符号化部14は、データ列 P(s) に、スムーシング関数を畳み込む。スムーシング関数としては、一次元のガウス関数g(s,σ)を用いる。ここで、パラメータσは各解像度に対するスケールを表す。
一次元のガウス関数は下記式で表される。
【0078】
【数32】
Figure 0003764494
【0079】
ここで、上記ガウス関数を用いてスムーシングされたデータ列 P(s, σ) を下記式で表す。
【0080】
【数33】
Figure 0003764494
【0081】
1つの畳み込み演算を1つの記号*で表すと下記式が得られる。
【0082】
【数34】
Figure 0003764494
【0083】
曲率κ(s) を求めるためには、式34におけるX(s,σ) およびY(s,σ) のそれぞれの1次(1階)微分および2次(2階)微分が必要である。
一次元ガウス関数g(s,σ) の1次微分を下記式37に示したg1(s, σ) 、2次微分を式36に示したg1(s, σ) とすれば、式34におけるX(s,σ) およびY(s,σ) それぞれの1次微分および2次微分は、式37〜40で定義される。
【0084】
【数35】
Figure 0003764494
【0085】
【数36】
Figure 0003764494
【0086】
【数37】
Figure 0003764494
【0087】
【数38】
Figure 0003764494
【0088】
【数39】
Figure 0003764494
【0089】
【数40】
Figure 0003764494
【0090】
式37〜40式31を代入すると、各解像度における曲率κ(l) が求められる。この曲率κ(l) から曲面が求められる。つまり、特徴点符号化部14は上述した演算を行って、曲率κ(l) を求める。
【0091】
曲面補間方法
以下、図5、図7を参照しながら、情報再生部22で行う曲面補間処理について説明する。
今、図5の様に原点から曲線L i 上の特徴点P in,Pin+1、および、曲線Lii+1
上の特徴点P i+1n,Pi;1n+1までのベクトルを、Pin、Pin+1、Pi+1n+1、Pi+1n+1j とする。
ここで、特徴点PinとPin+1間のデータより、特徴点Pi+1nとPi+1n+1との間のデータを補間することを考える。
特徴点PinとPin+1との間の距離をL1、PinとPin+1との間の距離をL2とすると、下記式が得られる。
【0092】
【数41】
Figure 0003764494
【0093】
【数42】
Figure 0003764494
【0094】
ここで、曲線L1における単位ベクトルをe1、e2とすると、下記式が得られる。
【0095】
【数43】
Figure 0003764494
【0096】
【数44】
Figure 0003764494
【0097】
従って、曲線Li上の特徴点Pa における高さh1、長さl1はそれぞれ下記式で表される。
【0098】
【数45】
Figure 0003764494
【0099】
【数46】
Figure 0003764494
【0100】
同様に、曲線Li+1上の単位ベクトルをe1’、e2’とすると、下記式で表される。
【0101】
【数47】
Figure 0003764494
【0102】
【数48】
Figure 0003764494
【0103】
従って、曲線Li+1上の特徴点Pa'における高さh2、長さl2はそれぞれ、下記式で表される。
【0104】
【数49】
Figure 0003764494
【0105】
【数50】
Figure 0003764494
【0106】
ここで、曲線Li+1上の点Pa'の高さh2、長さl2を次のように決めると、下記式で表される。
【0107】
【数51】
Figure 0003764494
【0108】
【数52】
Figure 0003764494
【0109】
式49〜52から曲線Li+1上の特徴点Pa'=(Pax',Pay')の位置は下記式に基づいて計算できる。
【0110】
【数53】
Figure 0003764494
【0111】
【数54】
Figure 0003764494
【0112】
以上のように、本発明の実施例においては、元の画像データI0 (x,y,t) として白黒の画像を例示したが、本発明の実施に際しては、白黒の動画像に限らず、カラーの動画像データについても、画質および圧縮率を高めて符号化できる。
カラー画像データとしては、たとえば、R,G,Bの画像データの場合、R,G,Bのそれぞれについて上述した分析処理を行えばよい。
【0113】
【発明の効果】
本発明によれば、動画像データを視覚的に遜色のない画質で高い圧縮率を達成できる。つまり、本発明によれば、視覚的に遜色のない空間方向、時間方向への画像の拡大あるいは補間および視覚的に遜色のない画質で高い圧縮率を達成できる。
【図面の簡単な説明】
【図1】 図1は本発明の実施例の動画像分析合成装置のブロック図である。
【図2】 図2は本発明の動画像分析合成装置における処理を示すグラフである。
【図3】 図3は本発明の動画像分析合成装置における処理を示すグラフであって、第1フレームと時間軸(t)方向連結線によって表現された曲面の様子を示すグラフである。
【図4】 図4は本発明の動画像分析合成装置における処理を示すグラフであって、図1に示した情報再生部において復元された曲面を示す図である。
【図5】 図5は本発明の動画像分析合成装置における処理を示すグラフであって、曲面補間を示す図である。
【図6】 図6は図1に示した特徴点符号化部の符号化処理フローチャートである。
【図7】 図7は図5に示した曲面補間の処理を示す情報再生部の処理フローチャートである。
【符号の説明】
1・・動画像分析合成装置
10・・分析部(動画像分析装置)
11・・画像メモリ、12・・情報変化分析部
13・・特徴点検出部、14・・特徴点符号化部
15・・情報符号化部、16・・総合符号化部
20・・合成部(動画像合成装置)
21・・総合再生部、22・・情報再生部、
23・・元画像再生部

Claims (5)

  1. 次元平面と時間方向とで規定される三次元方向のスムージング関数であって、周波数空間の異なる帯域ごとに定義される複数のスムージング関数のうち、最も粗い解像度に相当する帯域のスムージング関数を元の画像データに畳み込んで前記元の画像データのDC成分を独立に分析し、前記元の画像データから前記分析したDC成分を減じてDC成分を含まない画像データを算出し、該DC成分を含まない画像データについて前記複数のスムージング関数を、それぞれ、前記三次元方向の各方向において1回偏微分した複数の第1分析フィルタ関数を畳み込んで、前記異なる帯域ごとに多重解像度分析を行う情報変化分析手段と、
    該情報変化分析手段で求めた前記DC成分を含まない画像データについて、前記複数のスムージング関数を、それぞれ、前記三次元方向の各方向において2回偏微分した複数の第2分析フィルタ関数を畳み込み、畳み込み結果が0となるゼロクロス点を求め、前記異なる帯域ごとに前記ゼロクロス点が発生した位置を検出する特徴点検出手段と、
    複数のフレームの各フレームごとに、前記特徴点検出手段で検出した前記ゼロクロス点の集合からなる該フレームに属するゼロクロス点を抽出し、該抽出したゼロクロス点の集合からなる曲線についてその曲率の極値を与える点を求め、前記複数のフレームのうち所定のフレームを基準フレームとし、該基準フレームにおける前記曲線の位置情報と、前記極値を与える点の集合のうち前記基準フレームとこれに続く各フレームとの間で対応する点を時間方向に連結した曲線の位置情報とを、前記異なる帯域ごとに符号化する特徴点符号化手段と、
    前記情報変化分析手段で求めた多重解像度分析結果について、前記極値を与える点における分析結果を、前記異なる帯域ごとに符号化する情報符号化手段と
    を備えることを特徴とする動画像分析合成装置。
  2. 前記特徴点符号化手段の符号化結果と、前記情報符号化手段の符号化結果との冗長度をさらに圧縮し、または、量子化のためのビット割当を行なうため総合的に符号化する、総合符号化手段をさらに有する、
    請求項1記載の動画像分析合成装置。
  3. 前記特徴点符号化手段は、前記ゼロクロス点について重複している点がある場合には1つにまとめてゼロクロス点の集合とする
    ことを特徴とする請求項1に記載の動画像分析合成装置。
  4. 前記特徴点符号化手段は、隣接するフレームにおける前記極値を与える点の距離が最小になるもの同士を連結する、
    請求項1に記載の動画像分析合成装置。
  5. 請求項2に記載の動画像分析合成装置において、
    前記総合符号化手段から出力されたデータについて、前記特徴点符号化手段における処理と逆の処理を行い前記特徴点検出手段で検出した結果と等価のデータを復号し、該復号したデータについて前記特徴点検出手段における処理と逆の処理を行い前記特徴点検出手段に入力された前記DC成分を含まない画像データを復号し、前記情報符号化手段の処理と逆の処理を行い前記情報変化分析手段から出力されたデータと等価の分析結果を復号する、情報再生手段と、
    該情報再生手段で復号した分析結果に基づいて補間と逆変換を反復して収束させて前記符号化前の元の画像データを復号する元画像再生手段と
    を有する、動画像分析合成装置。
JP26665093A 1993-10-25 1993-10-25 動画像分析合成装置 Expired - Fee Related JP3764494B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26665093A JP3764494B2 (ja) 1993-10-25 1993-10-25 動画像分析合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26665093A JP3764494B2 (ja) 1993-10-25 1993-10-25 動画像分析合成装置

Publications (2)

Publication Number Publication Date
JPH07123409A JPH07123409A (ja) 1995-05-12
JP3764494B2 true JP3764494B2 (ja) 2006-04-05

Family

ID=17433784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26665093A Expired - Fee Related JP3764494B2 (ja) 1993-10-25 1993-10-25 動画像分析合成装置

Country Status (1)

Country Link
JP (1) JP3764494B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0181031B1 (ko) * 1995-03-20 1999-05-01 배순훈 움직임 보상된 인터폴레이션에서의 엣지 보상 장치
KR0178229B1 (ko) * 1995-08-08 1999-05-01 배순훈 특징점에 근거한 화소단위 움직임 추정을 이용한 영상 처리 장치
KR0178230B1 (ko) * 1995-08-08 1999-05-01 배순훈 특징점에 의한 움직임 추정을 이용한 영상 처리 장치
JP2006185038A (ja) * 2004-12-27 2006-07-13 Ge Medical Systems Global Technology Co Llc 4次元ラベリング装置、n次元ラベリング装置、4次元空間フィルタ装置およびn次元空間フィルタ装置
JP2006217406A (ja) * 2005-02-04 2006-08-17 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム、画像処理システムおよび方法
EP3465532A1 (en) * 2016-06-07 2019-04-10 Toyota Motor Europe Control device, system and method for determining the perceptual load of a visual and dynamic driving scene

Also Published As

Publication number Publication date
JPH07123409A (ja) 1995-05-12

Similar Documents

Publication Publication Date Title
DE602004004379T2 (de) Verfahren und einrichtungen zur codierung und decodierung einer bildsequenz mittels bewegungs-/texturzerlegung und wavelet-codierung
USRE37668E1 (en) Image encoding/decoding device
US5835237A (en) Video signal coding method and apparatus thereof, and video signal decoding apparatus
US6360024B1 (en) Method and apparatus for removing noise in still and moving pictures
JP2000508488A (ja) ディジタル画像情報の多重解像度変換のシステム及び方法
US20030053705A1 (en) Image processing apparatus and method
JP2010526455A (ja) 画像データを処理するコンピュータ方法および装置
JP2008514136A (ja) ビデオデータを処理する装置および方法
CN105408935B (zh) 上采样和信号增强
EP1555833B1 (en) Method and apparatus for motion vector field encoding
KR101348931B1 (ko) 이산 웨이블릿 변환 기반 초고해상도 영상 획득 방법
US8311347B2 (en) Image compression based on parameter-assisted inpainting
US6571142B1 (en) Data processing apparatus, data processing method, and medium
JP3764494B2 (ja) 動画像分析合成装置
US6009200A (en) Dynamic image processing apparatus and method
Niu et al. Edge-based perceptual image coding
Luo et al. A scene adaptive and signal adaptive quantization for subband image and video compression using wavelets
CN100544396C (zh) 图像信号处理方法和设备
JP3208879B2 (ja) 動画像分析装置およびその方法ならびに動画像合成装置およびその方法
US6195461B1 (en) Dynamic image processing apparatus and method
JP3663645B2 (ja) 動画像処理装置とその方法
JP3584327B2 (ja) 画像信号分析方法と装置および画像信号合成方法と装置
JP3508250B2 (ja) 動画像処理装置
Zhou et al. Fast single image super resolution reconstruction via image separation
JP5410231B2 (ja) 不等間隔標本化装置、そのプログラム、及び、多次元不等間隔標本化装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060120

LAPS Cancellation because of no payment of annual fees