JPH05304675A - 異なる焦点距離又は異なる視域の複数の像を使用した高解像度静止画像を得る方法及び装置 - Google Patents

異なる焦点距離又は異なる視域の複数の像を使用した高解像度静止画像を得る方法及び装置

Info

Publication number
JPH05304675A
JPH05304675A JP29449192A JP29449192A JPH05304675A JP H05304675 A JPH05304675 A JP H05304675A JP 29449192 A JP29449192 A JP 29449192A JP 29449192 A JP29449192 A JP 29449192A JP H05304675 A JPH05304675 A JP H05304675A
Authority
JP
Japan
Prior art keywords
image
images
frame
focal length
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP29449192A
Other languages
English (en)
Other versions
JP3616111B2 (ja
Inventor
Laura A Teodosio
エィ. テオドシオ ローラ
Walter R Bender
アール. ベンダー ワルター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Original Assignee
Massachusetts Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology filed Critical Massachusetts Institute of Technology
Publication of JPH05304675A publication Critical patent/JPH05304675A/ja
Application granted granted Critical
Publication of JP3616111B2 publication Critical patent/JP3616111B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Closed-Circuit Television Systems (AREA)

Abstract

(57)【要約】 【目的】高解像度を有する静止画像を得る方法及び装置
を提供すること。 【構成】 本発明は静止画像(イメージ)を発生させる
方法であって、複数の画像201、202,203・・
・299,300を創出するステップを有しており、各
画像は他と異なる焦点距離にて創出されており、さら
に、その各画像を共通の焦点距離にスケールするステッ
プと、その各スケールされた画像を1焦点距離の最終画
像に組み合わせるステップを有しており、その最終画像
の部分はそのオリジナルシークエンスと比較して相対的
に高い解像度を有している。本発明はさらに、変化する
視域の静止画像のシークエンスを全体的視域のパノラマ
画像に組み合わせるステップを有し、異なる視域にて発
生された画像を組み合わせることに加えて、本発明の方
法はパノラマシーンのごとき全体的シーンの異なる視域
に関して発生した画像を組み合わされたパノラマ視域に
組み合わせることにも使用可能である。本発明のこの特
質は変化する焦点距離のものとも結合可能である。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は基本的には異なる焦点距
離の複数の像及び装置を使用して高解像度静止画像を創
作する方法に関するものである。特には、本発明はズー
ムビデオシークエンス(sequence)等の複数の
異なる焦点距離像(イメージ)を使用した固定焦点距離
像である静止高解像画像を創出する方法に関するもので
ある。本発明はまた静止パノラマ像のものよりも狭い視
域の複数像から静止パノラマ像(イメージ)を創作する
技術にも関するものである。
【0002】
【従来の技術】画像処理分野においては、あるシーン
(scene) の静止画像を得ることがしばしば望まれる。
たいていの場合においては、その静止画像は記録手段の
性能及びその静止画像を撮像する装置の焦点距離により
決定される解像度を有する。ビデオ装置は現在比較的安
価であり、多くの人々が使用できるほどに単純構造であ
る。ビデオ記録装置はスチール写真のような静止画像描
出と較べてある意味の利点を備えている。始動したビデ
オカメラはその焦点領域内にある全出来事を撮影するこ
とができるが、一方普通のスチール写真の場合には写真
家がシャッターを押すことで選択した被写体のみを撮影
する。よって、スポーツイベントのごとき高速で移動す
る被写体を撮影する場合、又は結婚式や報道ドキュメン
タリーのごとき予期しない事態が発生するような状況下
ではビデオを常時撮影状態にセットしておき、事後に望
むスチールを選択することが往々にして便利である。し
かしながら、ビデオ信号の解像度は1ピクチャー高あた
り480本程度のライン(走査線)と1ピクチャー幅あ
たり640程度のサンプル(sample)に制限されてい
る。(ビデオ信号自体はスキャンラインを通じて連続的
である。しかしながら、ディスプレーするためにスキャ
ンライン方向にサンプル化されている。)多くの場合に
おいてこの程度の解像度では高画質を与えるには不充分
である。特に、もしオリジナルの被写体像が比較的短い
焦点距離で撮影されたものである場合において不足す
る。像が拡大されるとその像は相当に不鮮明になる。同
様に、映画や8ミリ撮影のごとき他の撮影技術の場合に
もそれらに特有の解像度に限定される。像の拡大は画像
全体にわたり単位面積あたりの解像度を必然的に劣化さ
せる。
【0003】例えば、ステージ上のピアノの前で聴衆に
向かって演奏しているソロの演奏家をその聴衆と共に撮
影することが望まれる場合がある。もし撮像装置がビデ
オ装置であれば、聴衆を映し出しているワイドアングル
画像は前記の標準ビデオ解像度に見合った解像度とな
る。画面全体にわたる解像度も同じである。よって、ソ
ロピアニストの像はそのシーンの残り部分と同様な粗さ
となる。たとえば、もしそのソロリスト像が全画面の1
/16のスペースを取っているとすれば、垂直方向に1
20本のラインと、水平方向に160のサンプルを使用
していることになる。この場合、たとえば会場の後方に
ある空席等のあまり重要でないシーンも同一の解像度と
なる。図1は異なる2焦点距離に関する1焦平面上に、
あるシーンの焦点合わせを略図的に示すものである。も
し焦点距離fw が比較的短ければ、像2の全幅は焦平面
4上に焦点が合う。
【0004】もちろん、ソロリストにズームインし、さ
らに長い焦点距離でソロリストの像を撮影することでそ
のソロリストをより鮮明(即ち、垂直方向にさらに多数
のラインと水平方向にさらに多数のピクセル(pixe
l))に映し出すことは可能である。図1に示すごと
く、焦点距離fTはfwよりも長い。しかしながら、像2
の中央部6のみが焦平面4に焦点が合わせされている。
焦平面の範囲外で焦点されているので他のほとんどのシ
ーンは犠牲になっている。ソロリスト像はさらに拡大さ
れて大きなスペースを占め、元の像の輪郭の一部は写ら
ない。
【0005】2チャンネルのデータを結合させて画像デ
ータを増強する(enhance)技術は周知である。その第
1チャンネルは空間的高解像度(即ち、単位長さあたり
に比較的多くの画素)及び比較的時間的低解像度(即
ち、単位時間あたりに比較的少ないフレーム数)を有す
るものであり、その第2チャンネルは空間的低解像度及
び時間的高解像度を有する。その結合の結果、空間的及
び時間的解像度はそれらの高いほうに近づき、普通の状
態で時間的及び空間的高解像度を有するシングル像シー
クエンス(single image sequence) を伝達するのに要
する情報よりも少ない情報伝達で済む。1988年5月
に合衆国のマサチューセッツ工科大学(Massachusetts
Institute of Technology) 電気工学及びコンピュータ
科学部に提出されたB.S.論文であるクレーマン ロ
ーレンス エヌ(Claman,LawrenceN.)の「2チャンネ
ル空間−時間エンコーダ(A Two-Channel Spatio-Tempo
ralEncoder)」 を参照されたい。
【0006】静止画像の種々な空間的部分の解像増強の
ごとく、最短焦点距離で撮影したものを映写化するのに
今日利用可能な技術は見当らない。クレーマンの論文は
固定焦点距離像とベクトル量子化を利用しており、その
結果オリジナルの空間的高解像度像のものを越えない解
像度及び視域のスチールフレームを提供している。
【0007】
【発明が解決しようとする課題】パノラマビュー(vie
w)の一部から他のパノラマビューの一部にかけて実質
的に共通な1焦点距離を維持しつつ、あるシーンのパノ
ラマビューを提供できることもまた望ましいことであ
る。これを行う従来の方法はビデオカメラをパノラマシ
ーンの片側から別側に移動することであり、本質的には
前後のフレームから各々ほんの少々異なる数多くのフレ
ームを撮ることである。その隣接するフレームに関し
て、各フレームは右側と左側のエッジ部分が異なるのみ
である。フレームを形成している像の大部分は隣接する
フレームの像と同一である。パノラマシーンを形成する
これらの種々な像を保存し、ナビゲートするには多量の
データ保存及びデータアクセスが必要とされる。データ
保存及びアクセスには多額の費用を要するのでこの従来
技術は望ましいものとはいえない。また、保存及びアク
セスされたデータの大部分が実用性を有しない。パノラ
マ的空間を撮影するのに現在使用されている撮影装置に
はグルブスコープ(glubuscope)又はボルピ
(volpi)レンズの移動が含まれる。1シーンの1
位置から別位置へパン(pan)し、同時にズームでき
ることも望ましいことである。従来技術の欠点はそのよ
うな組み合わせにおいて望ましくない結果をもたらすこ
とである。
【0008】よって、本発明の目的は、以下の利点を備
えた比較的に高解像度を有する静止画像を創作する方法
及び装置を提供することである: 1)像全体にわたり高解像度で情報を取得する必要がな
い。 2)あまり重要ではない像の大部分に関して情報を収集
する必要がない。 3)種々な焦点距離又は視域の標準的ビデオ像のシーク
エンスを入力要素として取得できる。 4)標準的フィルム像のシークエンスを入力要素として
取得できる。 5)望む像のいかなる部分でもその解像度を増強する。 6)適正にプログラムされた汎用デジタルコンピュータ
及び標準型ビデオ又は映画装置が使用可能である。
【0009】本発明の別目的は過剰なデータ保存及びア
クセス能力を要せず、あるシーンのパノラマビューを観
察者に提供し、その観察者にそのシーンの1位置から他
の位置までのナビゲーションを可能とする方法を提供す
ることである。本発明のさらに別目的はデジタル化され
たいかなる形態の像データであろうとも前記能力を発揮
させることである。
【0010】
【課題を解決するための手段】上記課題を解決するため
の本発明を要約すれば、本発明は静止画像を発生させる
方法であって、複数の像を創出するステップを有してお
り、各像は他と異なる焦点距離にて創出されており、さ
らに、その各像を共通の焦点距離にスケールするステッ
プと、その各スケールされた像を1焦点距離の最終像に
組み合わせるステップを有しており、その最終像の部分
はそのオリジナルシークエンスと比較して相対的に高い
解像度を有している。本発明はさらに、変化する視域の
静止画像のシークエンスを全体的視域のパノラマ像に組
み入れるステップをも有している。異なる視域にて発生
された像を組み合わせることに加えて、本発明の方法は
パノラマシーンのごとき全体的シーンの異なる視域に関
して発生した像を組み合わされたパノラマ視域に組み合
わせることにも使用可能である。本発明のこの特質は変
化する焦点距離のものとも結合可能である。
【0011】本発明はまた静止画像を発生させる装置で
あって、複数の像を創出する手段を有しており、各像は
他と異なる焦点距離にて創出されたものであり、さら
に、各像を共通の焦点距離にスケールする手段とスケー
ルされた像をそれぞれ1焦点距離の1像に組み入れる手
段とを有している。本発明の装置はさらに全体的シーン
の異なる視域に関して発生した像を組み合わされたパノ
ラマ視域に組み入れる装置を含んでいる。
【0012】次に、最初の実施例を解説する。ここでは
本発明は静止画像(イメージ)を発生させる方法であっ
て、以下のステップから成り立っている: 1)それぞれ異なる焦点距離で創出された複数の像をそ
れぞれ代表する複数の信号を発生させるステップ 2)共通の焦点距離にスケール(scale)された対応す
る像を代表するように各信号を変換するステップ 3)各変換した信号を組み合わせ、オリジナルシークエ
ンスの像と比較して部分的には比較的に高解像度である
スケールされた像を1焦点距離の最終像とする組み合わ
せを代表した信号を得るステップ。
【0013】別の実施例を解説する。ここでは本発明は
静止画像を発生させる装置であって、以下の手段から成
り立っている: 1)それぞれ互いに異なる焦点距離にて創出された複数
の像を創出する手段。 2)異なる焦点距離のそれぞれの像を代表する複数の信
号を発生させる手段。 3)共通の焦点距離にスケールされた対応する像を代表
するように複数の信号の各々を変換する手段 4)各変換した信号を組み合わせ、スケールされた像を
1焦点距離の1像とする組み合わせを代表した信号を得
る手段。
【0014】さらに別の実施例を解説する。ここでは本
発明は静止画像を発生させる方法であって、以下のステ
ップから成る: 1)それぞれ異なる視域で創出された複数の像をそれぞ
れ代表する複数の信号を発生させるステップ 2)共通のパノラマ視域内で1位置にトランスレート
(translate) された対応する像を代表するように各信
号を変換するステップ 3)各変換した信号を組み合わせ、オリジナルシークエ
ンスの像と比較してさらに大きな視域をカバーする1パ
ノラマ視域の最終像とするトランスレートされた像の組
み合わせを代表した信号を得るステップ。
【0015】またさらに別の実施例を解説する。ここで
は本発明は静止画像を発生させる装置であって、以下の
手段から成り立っている: 1)それぞれ互いに異なる視域にて創出された複数の像
を創出する手段 2)それぞれ異なる視域の複数の像の1つを代表する複
数の信号を発生させる手段 3)共通のパノラマ視域内の1位置にトランスレートさ
れた対応する像を代表するように複数の信号の各々を変
換する手段 4)各変換した信号を組み合わせ、1パノラマ視域の1
像とするトランスレートされた像の組み合わせを代表し
た信号を得る手段。
【0016】さらにまた別の実施例を解説する。ここで
は本発明は静止画像を発生させる方法であって、以下の
ステップから成る: 1)それぞれ異なる視域にて創出された複数の像の1つ
を各々代表する複数の信号を発生させるステップ 2)共通のパノラマ視域内の1位置にトランスレートさ
れ、共通の焦点距離にスケールされた対応する像を代表
するように各信号を変換するステップ 3)各変換した信号を組み合わせ、部分的にはオリジナ
ルシークエンスの像よりも高い解像度であり、オリジナ
ルシークエンス及び1焦点距離の像と比較してさらに大
きな視域をカバーする1パノラマ視域の最終像とするト
ランスレートされ、スケールされた像の組み合わせを代
表した信号を得るステップ。
【0017】
【作用】上記構成により、以下の利点を備えた比較的に
高解像度を有する静止画像を創作する方法及び装置が提
供される。 1)像全体にわたり高解像度で情報を取得する必要がな
い。 2)あまり重要ではない像の大部分に関して情報を収集
する必要がない。 3)種々な焦点距離又は視域の標準的ビデオ像のシーク
エンスを入力要素として取得できる。 4)標準的フィルム像のシークエンスを入力要素として
取得できる。 5)望む像のいかなる部分でもその解像度を増強する。 6)適正にプログラムされた汎用デジタルコンピュータ
及び標準型ビデオ又は映画装置が使用可能である。
【0018】さらに、過剰なデータ保存及びアクセス能
力を要せず、あるシーンのパノラマビューが観察者に提
供され、その観察者にそのシーンの1位置から他の位置
までのナビゲーションを可能とする方法が提供される。
又、デジタル化されたいかなる形態の像データであろう
とも前記能力を発揮させることができる。
【0019】
【実施例】以下、本発明の実施例につき詳細に説明す
る。典型的なビデオ像はフィールドのシークエンスによ
り創出される。各フィールドは画像化されるシーンの静
止画像を代表する。インターレース(interlace)によ
って連続的フィールド間に1/2のスキャンラインの垂
直方向のずれが生じる。(表示システムによってはイン
ターレースなくスキャンされており、その場合にはフィ
ールド間の垂直方向のずれは生じない。)一般的に毎秒
50又は60フィールドの割合でこのような静止フィー
ルドのシークエンスを表示することにより、モーション
又は変化は人の視覚システムの心理的精神肉体的特性に
よって表出される。各フィールドのペアは前述したごと
くにラインで満ちたスクリーンで構成され、各ラインは
それぞれ画素(ピクセル)により構成されている。各ピ
クセルは、コンピュータメモリー又は他の適当なデジタ
ル記録媒体内に特定のレンジである信号値により代表さ
れる。カラー像においては、このレンジは典型的には色
の3要素(component) の各々に対して0−255であ
り、グレースケール(grayscale) 像に対してはこのレ
ンジは1要素あたり特徴的には0−255である。サテ
ライト映像又はX線のような像源は0−4096ほどの
大きさのレンジを有することもある。ピクセル値はフレ
ーム内のそれらの位置に何らかの手段にて対応する形状
でメモリー内に保存される。ビデオ像に対してなされる
全操作は典型的には個々のピクセル要素の値を代表する
信号に対して行われる。
【0020】像のモノクロ記録の場合には、各ピクセル
要素は単独の個別的(discrete)な要素である。像のカ
ラー記録の場合には、1セットのチャンネル又はピクセ
ルのグループが各ピクチャー要素に対して使用される。
例えば、RGBとして知られる表色スキーム(color va
lue scheme)において、各色は赤(R)、緑(G)及び
青(B)の色量の組み合わせにより代表される。これら
3色の各々の色「チャンネル」が別々に提供される。R
GBシステムにおいて、各チャンネルはスキャンライン
ごとに同数のピクセルとスクリーンごとに同数のスキャ
ンラインを有する。下記他のカラー値システムは異なる
チャンネルに対してスキャンラインごとに異なる数のサ
ンプルを有する。ピクセルの要素は典型的には表示装置
上に相互に隣接して位置しており、同時に表示されると
きには(観察者にとってはそのように錯覚する)結合し
てオリジナルの色を形成する。ピクセルの時間シークエ
ンス(time sequential) ディスプレー等の他のスキー
ムも利用可能である。
【0021】RGBカラー値スキームは特定の使用には
役立つが、カラー値の数学的操作には必ずしも最適では
ない。他のカラースキームの方がさらに有用であり、特
には像の輝度を表しているチャンネルを含むものが有効
である。一般的に輝度とは所定方向における単位あたり
の知覚面積から出される、又は反射された光の強さとし
て記述される。一般的に、輝度及び2つの他のディメン
ション(dimension)により定義される3チャンネルカ
ラースペースはRGBカラースペースと等価である。典
型的な輝度カラースペースは、アメリカ合衆国のテレビ
放送用テレビ基準委員会により使用されているY(輝
度)、i(位相)及びq(クワドラチャー(quadr
ature))カラースペースである。他の輝度カラー
スペースはCIE(Commission Inter
national de l′Eclairage)、
Y、x、y(輝度及び2クロミナンスチャンネル)及び
そのバリアント(variants)、さらにY、u、v(輝度
及び2クロミナンスチャンネル)並びに他にも多数存在
している。
【0022】本発明においては、たいていの処理は1チ
ャンネル又は1コンポーネントで充分である。全てのデ
ータ計算及び操作はまずカラー像のYチャンネルに対し
てのみ実施される。Yチャンネルが選択される理由は普
通、Yチャンネルがビデオシステムにおいて最も高い信
号対ノイズ比を有しているからであり、さらに、Yチャ
ンネルは、たいていの場合にクロミナンスよりも高い空
間(spatial) 周波数にてサンプルされるからである。
Yチャンネルに関して必要な変換が決定された後、同一
の変換が位相及びクワドラチャーのクロミナンスチャン
ネルのような残りのチャンネルに対して適用される。こ
れらの変換の特徴を以下にて述べる。
【0023】ビデオ像は通常一連のフレームと見なされ
ているが、実際にはそのような「フレーム」はいかなる
ときにも存在していない。フレームとして人たる観察者
及び当該分野の技術者に考えられているのは、実際には
「フィールド」の1ペアのことである。各フィールドは
偶数列のスキャンライン、又は奇数列のスキャンライン
により成り立つ。偶数のフィールドは奇数列のスキャン
ラインから垂直方向に1本のスキャンラインの半分だけ
オフセット(offset)されている。1ペアのフィールド
はインターレース(interlace) されて1フレームを形
成している。
【0024】フィールドペア101と102は図2にお
いて略図的に示されている。フィールド101は像の奇
数列のスキャンラインのみを含んでおり、フィールド1
02は像の偶数列のスキャンラインのみを含んでいる。
ビデオ装置はこれらのフィールドを連続的に別々に記録
する。よって、各フィールドは潜在的に多少とも異なる
像を記録することとなり、それはフィールドの記録に要
する時間に関連するシーン又はカメラのモーションによ
る。また、ビデオ装置はフィールドを連続的に素早くデ
ィスプレーし、その速度は典型的には毎秒50から60
フィールドである。この速度でフィールドがディスプレ
ーされるとき、観察者は組み合わされて1つになったフ
レーム110であるフィールドを「見る」こととなる。
各フィールド(シークエンスの最初と最後を除いて)は
各連続した2フレームのコンポーネントであることが理
解されよう。図3に示すように、フィールド102はフ
レーム110の第2フィールドとフレーム112の第1
フィールドを形成する。同様に、フィールド103はフ
レーム112の第2フィールドとフレーム114の第1
フィールドを形成する。人たる観察者により組み合わさ
れる以外は、フレームは個々の信号要素としては実際に
存在しないことがこれで理解されよう。
【0025】本発明の方法はフレームのシークエンス、
特にはビデオ像のシークエンスを使用する。本発明実施
化には、フレームコンポーネントの脱インターレース
(de−interlace)が必要である。脱インタ
ーレースとは、奇数列又は偶数列のラインだけではな
く、像の各ラインのピクセル値を含む、特にコンピュー
タメモリーオンリーにおけるピクセル要素からなる実際
のフレームを表す信号を構成することを意味している。
本発明はまたインターレース技術を利用することなく記
録されたデータに対しても適用が可能である。しかし、
インターレースされる材料は共通なので、それを脱イン
ターレースできることが重要である。
【0026】本発明によれば、脱インターレースはデー
タ信号にメジアン(median)フィルターを適用すること
で達成される。例えば、時間tで脱インターレースされ
たフレームの7番目のスキャンラインを創出するには4
個の値のメジアンが使用される。即ち、時間t−1にお
けるフィールドの7番ラインの各ピクセル要素に対する
値と、時間t+1におけるフィールドの7番ラインの対
応ピクセル要素に対する値と、時間tにおけるフィール
ドの6番ラインの対応ピクセル要素に対する値と、時間
tにおけるフィールドの8番ラインの対応ピクセル要素
に対する値である。これらの4個のメジアンは脱インタ
ーレースされたシークエンスのフレームの7番ラインに
おける対応ピクセル要素に対する値として割り当てられ
る。
【0027】同じプロセスがスキャンラインの各ピクセ
ルと、そのフィールドの各奇数列のスキャンラインに対
して繰り返される。偶数列のスキャンラインは単に時間
tにおけるフィールドから採用される。この脱インター
レースされたフレームはいかなるオリジナルシークエン
スのフレームとも異なることを指摘する必要がある。な
ぜならば、奇数列スキャンラインを形成しているピクセ
ル要素は前後のフィールドと時間tでのフィールドとの
結合により創出されるからである。
【0028】第2の脱インターレースされたフレームを
創出するにはこのプロセスが繰り返されるが、偶数列の
スキャンラインはフィールドt及びt+2からの偶数列
スキャンラインのメジアンを使用することで形成され、
奇数列のスキャンラインは関係するスキャンラインの上
下に存在するフィールドt+1から形成される。奇数列
のスキャンラインは時間t+1でのフィールドから直接
的に採用される。
【0029】フレームが脱インターレースされた後、一
連のフレームが得られ、それらはそれぞれ偶数列と奇数
列のスキャンラインの全必要数から構成されており、フ
ィールドのシークエンスを観察している人たる観察者に
より感知される1フレーム内のものと同数のスキャンラ
インを有しているものとなる。
【0030】他の脱インターレース方法もまた利用で
き、本発明の思想の範囲内である。しかし、これら他の
方法は前述の脱インターレース技術程には優れた結果を
提供するとは考えられていない。その1つの方法は1フ
ィールド内の各ペアのライン間において、データの新ラ
インを合成するために各フィールド内のスキャンライン
間のリニアインタポレーション(linear int
erpolation)を行うことである。この技術は
動きのない像の部分において明らかに空間的解像度(sp
atial resolution)のロスを導く。別の方法としては、
そのときのフィールドの前後のフィールド間でインタポ
レーションを行うことである。この技術は動きのある像
の部分の時間的解像度を犠牲にする。別々のフィールド
に対してデータ操作を施し、1フィールドを次のフィー
ルドにワープさせるためのアファイン変換を利用するこ
とも可能である。しかしながら、フィールドのアファイ
ン変換はインターレースによる空間的時間エイリアシン
グ(temporal aliasing) により脱インターレースされ
たフレームにアファイン変換を施すほどには良好な結果
を提供しない。
【0031】本発明の方法に使用されるフレームのシー
クエンスは、典型的にはズームシークエンスであり、こ
れは長い焦点距離から短い焦点距離、又はその逆のズー
ミングを意味する。又、ズーミング中にパン(水平モー
ション)又はジブ(jib) (垂直モーション)すること
もできる。脱インターレースされた100のフレームの
シークエンス200が図4において略図的に示されてい
る。そのシークエンスは比較的短い焦点距離でワイドな
アングルのフレーム201から比較的長い焦点距離でク
ローズアップのフレーム300までのズームにより構成
されている。フレーム201において一連の文字が略図
的に表されている。フレーム300においてはフレーム
201の中央に位置しているアルファベット「X」の部
分のみがフレームに含まれている。
【0032】シークエンス200の各フレームは同数の
ピクセル要素及びスキャンラインから構成されている。
従って、中央の文字Xのクロス部分がフレーム201の
ズームにおいて50のピクセルを使用しているものと仮
定すれば、そのクロス部分はフレーム300でのズーム
においては300のピクセルを使用していることにな
る。1の典型的なズームは、シークエンスの最初から最
後のフレームにかけて4:1以上のスケーリングファク
ター(scaling factor)をもたらす。フ
レーム300のズームからのクロス部分の映像化は明ら
かにフレーム201のズームからのクロス部分の映像化
よりも多くの情報提供が可能となる。しかし、例えば他
の文字のごとき当初のシーンの他の被写体を映像化する
のに必要な情報はフレーム300からはまったく得られ
ない。なぜなら、これらのものはフレーム300には存
在しないからである。よって、本発明の1つの目的はシ
ークエンスの別々のフレームから得られる情報を1つの
組み合わせ像に形成することであり、そのシーンの大部
分についての充分な情報を提供することである。
【0033】個々のフレームとオリジナルシーンの間の
関係は図5にて略図的に示されている。フレーム201
は全オリジナルシーンを映し出している。フレーム20
2は領域202s内部に見合うだけのオリジナルシーン
のみを映像化しており、それはフレーム201よりも小
さいものである。フレーム203は領域203sに見合
うだけのオリジナルシーンのみを映像化しており、この
ように順番に領域300sまで続く。従って、オリジナ
ルシーンはズーム201によりマッピング(mappi
ng)された全シーンのデータスペースと同一サイズで
あるデータスペース内に徐々により小さな部分へとマッ
ピングされてゆく。(このデータスペースは「小」デー
タスペースという。本方法に関する他のデータスペース
と比べて最小だからである。)
【0034】本発明の目的は各ズームフレームから得ら
れるだけの出来るかぎり多量の情報を利用することであ
る。各ズームフレームは拡大され、最長の焦点距離のフ
レーム、即ちフレーム299と同じスケールを有するこ
ととなる。図6において略図的に示されているように、
拡大されたフレームは相互に積み重ねられる。オリジナ
ルフレーム201はオリジナルサイズの何倍にも拡大さ
れる。各連続するフレーム202、203・・・等は徐
々に多少とも少なめに拡大され、最終フレーム299は
まったく拡大されない。各フレームの像が他の全フレー
ムシーンの同一部分と実質的にぴったりと重なるように
重ね合わせることは可能である。もし各フレームの像部
分が不鮮明であれば、シーンの見える部分(フレーム2
99の全部及び他の全フレームの輪郭部)は最も高い解
像度を有するフレームから構成される。
【0035】各フレームのスケールアップは、各フレー
ムを代表するデータ信号の変換操作と、その変換データ
を一連のデータスペースにマッピングする操作とを経
て、究極的に最終データスペースにマッピングされたデ
ータを代表する信号を発生させる操作により達成され
る。この最終データスペースは、前記小データスペース
よりもずっと大きく、よって大データスペースと呼ばれ
る。(実際各フレームは全大スペース内に構成されてお
り、最大に拡大されたフレーム201と同じデータスペ
ースを占めている。しかし、フレーム201を除く全フ
レームに対しては、フレームの輪郭部はゼロの値を有す
るピクセルにより形成されている。)
【0036】各拡張フレームの解像度はもちろん互いに
異なっており、ある部分、例えば、フレーム201から
の中央文字Xにおいて得られる情報の詳細はフレーム2
03又は299から得られるシーンの同じ部分における
情報の詳細よりもずっと少ないであろう。言い換えるな
らば、フレーム201の拡大像はピクセル間の情報ギャ
ップの影響を受ける。フレーム300からの像はこれら
の情報ギャップの影響をまったく受けない。この情報ギ
ャップは以下に説明するごとく、データを取得可能なピ
クセル間のインタポレーションにより満たされる。
【0037】上記したように、もしフレームが同じサイ
ズにスケールされ、各々のデータが他のデータに重ねら
れると、それらは良く重なり合うが、実質的に重なり合
っているのみであり、必ずしも厳密な意味で重なり合っ
ているわけではない。これはカメラのモーションやシー
ンの要素のモーションのためである。比較的高い解像度
の静止画像を創出するためにフレームのシークエンスを
利用する過程でこれらのモーションを考慮に入れること
も重要である。
【0038】本発明の方法を以下、詳細に説明する。前
記スキームを特定の手段にて活用するには、本発明の方
法は、まず各フレームを同じディメンション(大データ
スペース)のデータスペースにマッピング(map) 又は
「ワーピング」する必要がある。そのワーピング後にシ
ークエンスの個々のフレームは合成画を創出するために
ウエイトを与えられた(weighted)時間メジアン操作に
より結合される。
【0039】各フレームを大データスペースにマッピン
グ又はワーピングするには、ズームのフレームシリーズ
が実質的に一定な焦点距離のフレームのシリーズとして
モデル化(modelled)され、1又は2の動いている被写
体を記録する。その状況は相互的(reciprocal)なもの
である。記録装置の焦点距離を変化するものとして処理
するかわりに、シーン全体が固定焦点距離レンズの記録
装置に近づくか、又は遠ざかるものとして処理しても同
じことである。
【0040】以下の説明において本発明方法の基本的ス
テップを紹介する。基本ステップを最初に紹介するのは
説明を目的としたものであって、決して本発明方法のス
テップ順を示しているのではない。そのステップの順は
基本的概念を紹介した後で説明する。
【0041】本発明の基本的ステップはカメラのズーム
モーションをリカバー(recover)するためのものであ
る。本発明の方法は、水平方向、鉛直方向及びスケール
方向(水平/鉛直平面に垂直)における像の速度成分と
してのカメラズームに影響を受ける連続的フレーム間の
変化をモデル化するものである。そのような像ポーショ
ンに対するフレーム間の速度はこれらの3方向各々につ
いて決定される。その結果どのフレームのいかなるピク
セル値も、多重速度(連続的多重フレームのペアを表し
ているもの)をオリジナル像ポーション(部分)を表し
ているデータに適用することで異なる焦点距離の1フレ
ーム内の対応位置にワーピング可能である。これに関連
する技術は1990年4月に発表されたニュージャージ
ー州プリンストンにあるデイビッド サーノフ リサー
チセンター(David Sarnoff Research Center)のバー
ゲン ジェイ(Bergen,J.)、バート ピー(Burt,
P.)、ヒンゴラニ アール(Hingorani,R.)及びペレグ
エス(Peleg,S.)らによる表題『3フレームからの2
モーション計算』にて開示されている。以下の基本的説
明の多くは実質的には前記バーゲン他の論文から借用し
たものである。
【0042】ある像領域のモーションに対する単純で閉
じた系での形態予想法は前記バーゲン他により導き出さ
れたものである。まず、像の部分的な小移動は、像シー
クエンスであるフレームI(x,y,t−1)及びI
(x,y,t)間で生じると考えることができる。この
I(x,y,t)は、時間tにおけるx(水平)及びy
(鉛直)方向に延びている観察像であり、例えば、フレ
ーム299にて示されている。I(x,y,t−1)は
時間t−1における観察像であり、例えば、フレーム2
98である。いかなるときにもP(x,y)として表さ
れるxとyのパターンはすべてのピクセルの速度フィー
ルドである速度p(x,y)で移動しており、x方向と
y方向双方のモーション成分を有している。モーション
フィールドp(x,y)はxとyにおける変位による以
下で表される。 p(x,y)=(px(x,y),py(x,y)) (1) このpx(x,y)はx方向(xとyの関数)の変位で
あり、py(x,y)はy方向(xとyの関数)の変位
である。よって、以下の式が導かれる。 I(x,y,t)=P(x−tpx,y−tpy) (2) I(x,y,t)=P(x−px,y−py,t−1) (3)
【0043】前記フレームのインターバルを時間の1ユ
ニットとすることで表記を単純化することができる。最
小平方誤差(least squared erro
r)技法に従い、測定値とフィールドpを使用した計算
値との間の平方誤差を最小とするモーションフィールド
p=(px,py)を求めるのが有益である。
【0044】
【数1】 1フレームから次のフレームまでの偏差が小さいと仮定
すれば、等式(4)はI(x,y,t)の省略テーラー
シリーズエクスパンション(truncated Taylorseries e
xpansion)により単純化することが可能である。
【0045】
【数2】 ここにおいて、
【数3】 であり、従って、
【数4】 となる。
【0046】像モーションは速度成分の各パラメータ
(parameter)に関して等式(6)の導関数
(derivatives) をゼロにセットし(誤差は導関数がゼ
ロのときに最小だからである)、得られる等式システム
を解くことで得られる。もし、像ポーションのモーショ
ンが単純移動(simple translation) によりモデル化
されるなら、p=(ax,ay)となり、このax及びay
はピクセルのユニットにおいて定数となり、光学的フロ
ー(flow)等式は以下のようになる。
【0047】
【数5】
【0048】本発明方法の特徴的な適用ケースにおいて
は、モーションは単純移動によってはモデル化できない
ことが理解されよう。なぜなら、単純移動は焦点レンズ
のズームのようにスケール変化のリカバリー又はモデル
化を行わないからである。その代わりに、像のモーショ
ンは、アファイン変換(即ち直線を直線に、平行線を平
行線に変換するが、ポイント間の距離と、ライン間のア
ングルを変化させる可能性のある変換)としてさらに典
型的に正確にモデル化される。この場合、モーションフ
ィールドpは6個のパラメータであるax,bx,cx,
ay,by及びcyを有しており、それらは次のように適
用される。
【0049】
【数6】
【0050】ここで、ax及びayは上記のごとくであ
り、bx はx方向のxのパーセンテージスケールファク
ターであり、cx はxのパーセンテージローテーション
ファクターであり、y位置に関係する(depending on)
ものである。by はyのパーセンテージローテーション
ファクターであり、x位置に関係し、cy はyのパーセ
ンテージスケーリングファクターである。ズームにおけ
る1フレームから次のフレームへのax とay の通常の
レンジは、数個のピクセル程度である。残余ファクター
の普通のレンジは0.001から0.1程度である。も
し、等式(6)の誤差がこれらの6個のパラメータの各
々に関して微分(differentiated)されると、6個の未
知数ax,bx,cx,ay,by及びcyを持つ6個の等式
システムが得られる。即ち、
【0051】
【数7】 である。
【0052】このシステムは係数ax,bx,cx,ay,
by及びcyについて解かれなければならない。解を得る
ことは可能である。なぜなら、Ix,Iy,及びIt、即
ち、x、y及びtに関する像の部分的導関数は時間t及
び時間t+1の像値から決定可能だからである。It は
時間t+1のピクセル値を時間tにおける対応ピクセル
値から差し引くことで決定される。Ix は時間tのピク
セル値と時間t+1の対応ピクセル値を加えて、xにお
ける導関数フィルター(filter)を介してその合計をラ
ン(run)させることで決定される。Iyはその得られた
合計をyの導関数フィルターを介してランさせることで
決定される。これらの3個の値が像内のすべてのピクセ
ルに対して決定されたならば、等式(10)のシステム
は、係数ax,bx,cx,ay,by及びcyについて解か
れる。これらの係数を知れば、1つのフレームから次の
フレームまでの像の特殊なアスペクト(aspect)を代表
する与えられたピクセル値の位置の変化を決定すること
が可能となる。
【0053】従って、フレーム201のピクセル値の位
置を決定するために、像のポーションをワープされてい
ないフレーム202の像の対応ポーションと合致させる
ためにフレーム201が1ステップ分だけワーピングさ
れた後に、等式9xと9yの変換がフレーム201の各
ピクセル値に適用される。図7に示すように、ポイント
(x,y)、ピクセル位置(20、30)の像ポーショ
ンを考慮されたい。(図7はスケールするためものでは
ない。)図7においてオリジナル位置におけるフレーム
201は、符号201にて表される。フレーム202の
スケールにワーピングされた後、フレーム201は20
12 として表される。フレーム203のスケールにワー
ピングされた後には2013 として表され、この要領で
フレーム20199まで続行する。スケールの増加率10
%(1フレームから次のフレームに対するものとしては
大きい率)と5個のピクセルの右側へのパンに対して
は、フレーム201とフレーム202間の典型的な係数
は以下の値を有している。
【0054】
【数8】 フレーム201のピクセル(20、30)での値のx方
向におけるフレーム201からフレーム2012 へのず
れは、5+(.1×20)+(0×30)=7となる。
その値はxの正の方向に7ピクセル分移動させ、x位置
27にくることを意味する。y方向のずれは、0+(0
×20)+(.1×30)=3となり、yの方向に3ピ
クセル分移動してy位置33にくることを意味する。こ
れは図7にて略図的に示されており、フレーム201の
ピクセル位置(x,y)からフレーム2012 の別位置
(その像の同一箇所)へ向かう曲矢印Aである。
【0055】同様に、同じピクセル値をフレーム201
3 にて占める位置にワーピングするには、フレーム20
2と203との間で6つの等式(10)のセットを解く
ことで得られる係数ax,bx,cx,ay,byとcyを使
用してフレーム2012 のピクセル座標(coordinate
s)に変換等式(9x)と(9y)を適用することが必
要である。それらの係数は、フレーム201とフレーム
202との間で得られたものとは異なるかもしれない。
【0056】その変換等式は1次式(linear)であり、
よってリバース可能(reversible)である。フレーム2
01のスケールからフレーム202のスケールへの変換
には係数ax,bx,cx,ay,by及びcyが使用され
る。フレーム202のスケールからフレーム201のス
ケールに変換するには、これらの係数の1次逆元(li
near inverse)が使用される。
【0057】以上説明したように、フレーム201のポ
イント(x,y)からのピクセル値はフレーム2012
の新位置にワーピングされる。ポイント(x+1,y)
からのピクセル値もフレーム2012 の新位置にワーピ
ングされるが、その位置は典型的にはピクセル(x,
y)の値に対応するワーピング位置に隣接することはな
い。もしこれ以上何の操作もしなければ、フレーム20
12 のこれら2ポイント間のスペースはブランク又は値
なしの状態となる。このスペースに情報を入力するには
何らかのインタポレーションが必要となる。1次及び双
1次(bilinear)インタポレーションを含む種々な技法
が可能である。双1次インタポレーションは効果的に使
用されている。
【0058】バーゲン、バート他により説明されている
ように、前記のモーション予想法はズームシークエンス
の1フレームから次のフレームまでの像のずれが少ない
(1ピクセル以下)前記の省略テーラーシリーズ近似法
が適しているの時のみにおいて正確である。図8におい
て略図的に示されている多重解析(ピラミッド)構造
(multiresolution structure) を使用することでさら
に良い結果が得られ、その技法はより一般的な大きな移
動の場合にも適用可能である。
【0059】アファイン変換パラメータax,bx,c
x,ay,byとcyを決定する過程においてガウスのピラ
ミッド(pyramid) Gは、例えばフレーム201と20
2である像フレームペアの各フレームに対して構築され
る。シークエンスの各メンバーに対して、その解析及び
そのサンプルデンシティ(density )が平方根で減じら
れている(reduced by a power of 2) オリジナル像の
修正コピーのシークエンスによりそのピラミッドは形成
される。シークエンス200のフレームの1つがガウス
ピラミッドシークエンスのベースレベルを形成している
ことを除けば、例えばG201,0、G201,1、G201,2 、G
201,I 等のガウスピラミッドシークエンスのメンバーは
シークエンス200のメンバーとは全く異なっているこ
とが特記されなければならない。
【0060】レゾリューション(resolution)を減少さ
せるために、データはローパスフィルターを通過させら
れる。このローパスフィルターを通過させることで像の
小さな又は素早い移動に関連したデータを排除する。従
って、大きなモーションはレゾリューションが最も大き
く減少したレベルにて検知される。ローパスフィルター
がデータ内の偏差の大部分を排除しているので、存在す
る全ピクセルに対する計算をする必要性はなくなる。よ
って、操作対象のピクセル数を減少させるために2程度
のサブサンプリング(sub−sampling)が適
用される。このサブサンプリングは計算の能率を高め、
操作のスピード向上に寄与する。サブサンプリングの特
徴的なパターンは隔行及び隔列を無視することである。
【0061】ピラミッドの各レベルIは、ローパスフィ
ルターの効果を発揮させるために小核(kernel)
フィルターωで先行するレベルのデータを収束させるこ
とで取得され、続いてサブサンプリングを行う。Gt,l
=[Gt,l-1 * ω]↓2 ここでのGt,l は像I(x,
y,t)に対するIthのピラミッドレベルである。上記
2 は、括弧内の量がxとyに対して2でサブサンプル
されていることを示している。例えば、G201,1を得る
にはG201,0をフィルターωで収束し、その結果をサブ
サンプリングする。
【0062】変換の分析は像ピラミッドの低レゾリュー
ションレベル、例えばレベル3にて開始される。480
スキャンラインと640ピクセルにより定義されるオリ
ジナル像に対しては、典型的にはレベル3の分析は良好
な結果をもたらす。レベルIのサンプル距離はオリジナ
ル像のサンプル距離の2I 倍である。従って、この関係
で大きくなる像速度が予想可能となる。追跡手順の各連
続的反復にて、分析は次の段階のレゾリューションピラ
ミッドレベルへと移動してオリジナルに近づいて行く。
【0063】従って、アファイン変換パラメータの決定
は、例えばレベル2にて開始する。まず、ピラミッドG
201 とピラミッドG202 の間でax、bx、cx、ay、b
y 及びcy に対する等式(10)を解く必要がある。こ
れは2ステップで行われる。まず、アファイン変換p2
のシード(seed)セットが選択される。このシード
は全部ゼロであっても、ズームによるスケーリングファ
クター若しくは知られたパン又はジブによるトランスレ
ーションのような変換の知られているアスペクトに近似
して選択されたものであっても構わない。これらのアフ
ァイン変換はレベル2でのワーピングされた像を得るた
めにW2においてG201,2に適用される。これは図8にお
いて歪んだ方形G201,2wにより図示されている。たいて
いの場合には、このワーピングは次の時間インターバル
t+1、即ちG202,2でのガウスメンバーを正確には提
供しないであろう。よって、第2のステップでは調整用
アファインパラメータΔp2 のセットが像の値G202,2
とG201,2w 間で予想される。これらは前述で解説され
たごとくに予想されるものである。
【0064】まず、ローパスフィルタリング及びサブサ
ンプリングを介さずにフレームに対して上記したように
Ix、Iy及びItを解くことが必要である。Ix、Iy及
びItは、さらに小さくローパスフィルタリングされた
データのサブサンプルセットが使用されることを除け
ば、同様に計算される。フレーム202からフレーム2
01に対する値を引く代わりに、ワーピングされたピラ
ミッドフレームG201,2wからの値がピラミッドフレーム
G202,2に対する値から引かれる。このようにして、レ
ベル2の部分的導関数(partial derivative)が決定さ
れ、その後にこのレベル用の調整用アファインパラメー
タax、bx、cx、ay、by及びcyが決定可能となる。
調整用アファインパラメータは図8においてΔp2 とし
て集合的(collectively)に示されている。
【0065】調整用アファインパラメータのセットは、
ガウスシークエンスピラミッド201における先行する
レベルからのアファインパラメータp2 と結合されてレ
ベル1、即ちp1 用のアファインパラメータを形成す
る。この結合は単純な加算ではない。例えば、新axタ
ームは時間tにおけるaxターム(ピラミッドG202)
や時間t−1におけるax ターム(ピラミッドG201)
及びx方向における他の変化に基づくものである。以下
の式はこの関係を説明している。
【0066】
【数9】
【0067】このプロセスは繰り返されるが、今回はレ
ベル1であり、フレーム201及び202に対する操作
過程でアファイン変換パラメータax、bx、cx、ay、
by及びcy がオリジナルレベルにて取得されるまで全
レベルを通して実施される。アファインパラメータは最
も正確なところで収束(converge) するので、ΔpIタ
ームはゼロとなる傾向にある。
【0068】従って、いかなるフレームのスケールから
の1フレーム(例えば、フレーム226から次のフレー
ム227のスケール)を変換するワーピングファクター
を決定するには、前述の操作が実施される。よって、フ
レームスケールの各ペアに対して、アファイン変換パラ
メータax、bx、cx、ay、by及びcyのセットが計算
される。その後、1フレーム、例えばフレーム251を
適当なサイズに変換するには、まずフレーム251と2
52に対する先行する分析により決定されたアファイン
変換パラメータax、bx、cx、ay、by及びcyを使用
してフレーム252のスケールに変換される。次に、そ
の変換されたフレーム2512 はフレーム252と25
3に対する先行する分析により決定されたアファイン変
換パラメータax、bx、cx、ay、by及びcyを使用し
てフレーム253のスケールに変換される。このプロセ
スは繰り返され、フレーム300のスケールにて大デー
タスペースにそのフレームが変換されてしまうまで継続
される。
【0069】前記の方法は、もしカメラ又は被写体(ど
ちらでもよい)間の相対的モーションがほとんど存在し
ないか又はまったく存在しないならば良好に作用し、唯
一の像変化はズーミングによるものとなる。しかしなが
ら、実際上はそのようなモーションを排除できることが
望ましい。いくつかの方法が考えられる。基本的ではあ
るが効果的な方法は全フレームを視覚的に検査すること
であり、視域を横切る人のように大きなモーションを特
定することである。モーションが各フレームにおいて生
じる領域をカバーするためにマスクが利用可能であり、
この領域は変換時には無視することができる。最終的な
ピクチャーのマスク位置を設定するのに望ましいピクセ
ル値をオペレータは手動にて選択する。
【0070】別の方法は図9にて略図的に示すように、
2つのモーションを追跡するバーゲンとバート他により
解説されている技法を利用することである。データはモ
ーションのペアに照らし合わせて評価される。ここでの
像I(x,y,t)はそれぞれ独立したモーションpと
qを有する異なる像パターンP及びQの組み合わせとし
てモデル化される。I、P及びQ間の関係は以下のごと
くである。
【0071】
【数10】 上記等式中の○と+を重ねた記号は、以下において便宜
上(+)と表記する。
【0072】ここでは、オペレータ(+)は、加算又は掛
け算のごとき2モーションを結合させるためのオペレー
ションを表し、Ptpは時間tを通じてモーションpによ
り変換されたパターンPを表しており、バーゲン及びバ
ート他は、もしモーション成分の1つ、及び結合ルール
(+)が知られていれば、パターンP及びQの性質につい
て予想をたてることなく、前述の1成分モーション技法
を活用して他のモーションを計算することが可能である
ことを示している。もし、モーションpが知られていれ
ば、モーションqのみを決定すればよく、その逆のこと
もある。速度pで移動しているパターンPの成分は各像
フレームをpによりシフトし、そのシフトしたフレーム
値を次のフレームから差し引くことにより像シークエン
スから排除することが可能である。得られる差(differ
ence)シークエンスは速度qにて移動しているパターン
のみを含んでいる。
【0073】特殊な場合には、結合オペレーション(+)
は加算である。シークエンス200の3フレームI
(1)、I(2)及びI(3)の場合について考えてみ
よう。変数D1及びD2をそれぞれそれらのフレーム間で
発生した差フレームに当てはめてみよう。等式11は以
下のようになる。
【0074】
【数11】
【0075】これは1ステップにてパターンPを変換す
るための302におけるI(1)のワープとして図9に
おいて略図的に示されている。この次の段階はパターン
Pのモーションの影響を取り除くための304における
I(2)の減算である。その結果得られるものはD1、
即ち差(difference) シークエンスの1要素である。
D2 はパターンPのモーションにより306でワーピン
グされたI(3)とI(2)間の308における差によ
り同様に形成される。
【0076】変更シークエンスは1モーションqで移動
する新パターンQq-Qp から構成されることになる。
【数12】
【0077】従って、モーションqは前述の1モーショ
ン予想技法を活用して2つの差(difference images)
像D1とD2を間で計算可能となる。このことが図9にて
310で略図的に示されている。同様に、モーションp
はqが知られているときにリカバー可能となる。観察さ
れた像I(x,y,t)はqによりシフトされ、新しい
差シークエンスが形成される。
【0078】
【数13】 このシークエンスは速度pにて移動しているパターンP
p-Pq である。
【数14】 よって、pは1モーション予想技法を活用してリカバー
可能となる。
【0079】このシフト及び減法手順はパターンに関わ
りなく、又はパターンを決定することなく像シークエン
スから1つの移動パターンを取り去る。実際上はpもq
も最初は知られていない。しかしながら、最初に非常に
おおまかな予想値を選択したとしても、それらの両方と
もが前記の技法を反復することによりリカバー可能であ
る。この反復手順は1モーション技法を反復的に適用す
る。モーションpを定義するパラメータのおおまかな予
想値で始めても、qの予想値は取り出され、312にて
ワーピングステップの302と306にリターンされ
る。予想値qから改善予想値pが取り出され、312に
てワーピングステップ302と306にリターンされ
る。この手順を繰り返す。この手順にて正確な予想値に
素早く収束する。本当の像シークエンスを使用して、3
から12サイクル後には要求を満たす変換が可能にな
る。
【0080】本発明のこの部分のステップを要約すると
以下のごとくとなる。 1。パターンPのモーションp0に対する(ついて)初
期予想値を決定する。 2。最新のpn予想値を使用して等式(12)における
差像(difference images)D1及びD2を形成する。 3。1(シングル)モーションエスチメータをD1とD2
に適用してqn+1 の予想値を得る。 4。予想値qn+1を使用して新差像D1及びD2を形成す
る。 5。1(シングル)モーションエスチメータを新しいD
1とD2に適用して新pn+2を取得する。 6。ステップ2から手順を繰り返す。
【0081】この2モーション技法に従って取り出され
た2セットのアファインパラメータを観察することで、
移動シーン又はカメラモーションを特定することが可能
となる。一般的に、ズームワーピングのみに関係するパ
ラメータは1フレームから次のフレームにスムーズに、
またほんの少々変化するだけである。像モーション又は
カメラモーションに関係するパラメータはズームによる
ものとは異なる変化を示す。これらの相違する変化は検
査により観察可能である。
【0082】1フレームペアから次のフレームペアまで
のアファインパラメータを自動的に比較し、その変化が
予め設定したレベルを越えるときには遮光装置を機能さ
せる(triggering a flag) ことでシーン又はカメラの
モーションの特定を自動化することは理論的には可能で
ある。1つの可能性を有する技法はフレームの2ペアの
アファインパラメータ間の差を設定した数の先行フレー
ムペアの標準偏差(standard deviation)と比較するこ
とである。例えば、70のフレームのシークエンスに対
しては、少なくとも10のフレームペアの標準偏差を決
定することが一般的である。
【0083】もし、カメラとシーン内の要素の両方とも
が移動しているとき、2個以上のモーションが存在し、
カメラモーションを排除するためのさらに一段上の方法
が便利である。前述したアファインの2モーション予想
法とマスキング技法を組み合わせると便利な結果をもた
らすことが発見されている。像内のずれベクトルの確率
デンシティ関数を決定することもまた便利であろう。一
般的な理解には、1990年6月にアメリカ合衆国マサ
チューセッツ州ケープコッドにて開催されたアメリカ光
学学会の『機械理解及び機械視覚総会』の議事録内にあ
るギロッド ビー(Girod,B.)とクオ デー(Kuo,D.)
による「ずれヒストグラムの直接的予想法(Direct Est
imation of Displacement Histograms)」を参照するの
がよい。ここにはフレーム間で移動する異なる被写体の
数と、それらに対応するずれベクトルがどのようなもの
であるのかについての情報が掲載されている。ローカル
ブロックマッチングエスチメータ(local block matchi
ng estimator)がそれらの移動被写体を空間的に位置取
りさせるのに使用されている。移動被写体の領域は計算
によりマスク処理が施され、その後にアファイン予想値
が計算される。
【0084】フレームペア間のずれが小さいものであっ
て、突き当たったり、焦点距離の急激な変動のごとき予
期しないカメラ移動がまったく存在しないと仮定すれ
ば、アファインパラメータはフレームペア間ではあまり
異なるものではない。前述のごとくにパラメータが決定
された後、その係数は見せ掛けの値を取り除くために簡
略化される。シークエンス200の各フレームからのY
チャンネルデータがワーピングされれば、決定されたア
ファインパラメータはフルカラー映写の変換を提供する
ために、例えば位相及び求積法(phase and quadratur
e)で他のチャンネルに適用される。
【0085】ワーピングされた短焦点距離フレーム20
1のフルラスタ(full raster) が満たされた後、1フ
レームから次のフレームまでのアパーチャ設定の変分の
ごときトーンに影響を及ぼす変化を補うためにトーンス
ケール補正を実施することができる。中央の像から始め
て、2つの像が隣接する箇所周辺で光度のサンプルが採
られる。データにスプライン(spline)がフィッ
トされ、大きい方の像(低めの解像度)のピクセルが小
さい方の像のピクセルに変更される。その後にこの補正
像のトーンスケールは次の大きさのワーピングされた像
との比較に用いられ、最大の像までこの手順が繰り返さ
れる。
【0086】シークエンス200の各フレームからのフ
ルカラーデータが同じデータスペースにワーピングされ
たら、各ピクセルに対する1フレームからのデータは他
の全フレームのデータと組み合わせる必要がある。いく
つかの技法が可能である。最も基本的な技法は最高の解
像度を有するフレームから最終合成ピクチャー用のピク
セル値を選択することである。図6において示されてい
るように、フレーム299がワーピングされたものであ
るフレーム299wが一般的にその合成ピクチャーの中
央部を占め、このフレームはその像の中央部に関して最
も高い解像度となるであろう。フレーム298からの情
報は中央部の環状方形部位を占め、この情報はこの部分
に可能な最高の解像度となる。フレーム297からの情
報はフレーム298wの環状領域周辺の多少大きな軸の
環状方形部位を占め、このようにして第1フレーム20
1wの環状周囲がワーピングされた像(figure)の最も
外部を占めるまで続けられる。
【0087】上記手順にて好ましい結果が得られるが、
明瞭なエッジ部が現れ種々のフレームから発生した領域
間の境界線を際立たせる。この理由によりあるピクセル
に対してシークエンスのワーピングされた全フレームに
ウエイト関数(weighting function)が適用されそのピ
クセルの値としてウエイト値のメジアンがとられる。図
10に示すようにピクセルの位置はベクトルVにより示
され、像の同一位置にワーピングされた全フレーム、即
ち201wから299wまでを突き抜ける。前記ウエイ
トファンクションはベクトルVに沿ってその像値(imag
e values)に適用される。典型的なウエイト関数は図1
1のグラフにて示されている。図から分かるように、そ
のウエイト関数は上向きに凹形状であり、クロースイン
ズームショット(close in zoom shot)からのピクセル
値は最大のウエイト、おそらく100%が付与される。
望む効果に応じて種々のウエイト関数が適用可能とな
る。一般的には低い方の解像度を有するフレームよりも
高い解像度を有するフレームに対してさらにヘビーなウ
エイトが付与される。
【0088】多少不自然ではあるが低い方の解像度を有
するフレームのシークエンスから、高い解像度を有する
1静止画像を得る方法のブロック作成について述べてき
た。図13には、実質的に好ましい順序でその方法のス
テップが示されている。ビデオフィールドのシークエン
スは402にてとられる。フィールドは一連のフレーム
を作成するために404で脱インターレースされる。こ
のポイントで交互的パス(alternate path) が取得可
能となる。被写体又はカメラモーションは、406にて
ズームモーションから分離することができ、その後にア
ファイン変換係数ax、bx、cx、ay、by及びcyを発
生させるために光学系フロー分析がなされる。404に
おいてステップ408に分岐(branch)することが可能
であり、それにより光学系フロー分析と、被写体又はズ
ームモーションからのカメラモーション分離とを結合さ
せる。この分岐は、また係数ax、bx、cx、ay、by
及びcy を生じさせる。次に412においてそのアファ
イン変換が各フレームに対して必要な回数だけ適用さ
れ、各フレームに対して高い解像度ラスタ(raster)で
の対応フレームが創出される。図11に示す時間メジア
ンフィルターは、414にて全フレームに適用され、最
終合成は416にて高解像度ラスタでの各ピクセル位置
で時間メジアンフィルターによりフィルターされている
ワーピングされた各フレーム201w、202w等に対
するそのピクセルでの値を加算することで形成される。
【0089】本発明装置の好適実施例は図14において
略図的に示されている。シーンから反射した光、又はシ
ーンにより伝達される光を採り入れてビデオカメラ等の
入力装置500はシーン502に適用される。その光は
前記入力装置又は標準コンバーター504により電気信
号に変換される。コンバーター504又は入力装置50
0から、データはメモリー装置506又はデータプロセ
スユニット508を通過する。メモリー装置506はフ
ィールド(field) によって、またさらにデータが変換
されるどのような他の形状(configurations)にも従っ
てデータを記録することができる。前記データプロセス
ユニットは、典型的には適正にプログラムされた汎用デ
ジタルコンピュータである。オペレータはコンピュータ
キーボード等の入力装置510を介してデータプロセス
ユニット508にコマンドを発する。これらのコマンド
は前述の本発明方法のステップを行使するようにコンピ
ュータに対して指示する。指示の内容は、例えば、その
フィールドの脱インターレーシング、差シークエンス
(difference sequences)を創出することによる2又は
それ以上の移動被写体の特定、アファイン変換係数の計
算、全フレームを望むデータスペースにワーピングする
こと、ウエイトされた時間メジアンフィルターに従いワ
ーピングされたフレームからのデータを結合させ合成ピ
クチャー映像に導く、等々である。各ステップでの変換
されたデータはメモリ装置506に記録可能であり、プ
リンター、ビデオディスプレー装置又は他の適当な出力
装置等の一般的な出力装置512に出力可能である。さ
らに、データは追加的操作を施したり、蓄積又はディス
プレーを行うために遠隔地(remote location) に伝達
することもできる。
【0090】尚、比較的低解像度でワイドアングルを有
するショットにおいては、多くの箇所は不鮮明である。
一方、本発明の方法に従って作成された合成ピクチャー
の中央部は鮮明で焦点がぴったりと合っており、詳細ま
でくまなく示している。
【0091】以上の解説は本発明の説明を目的としたも
のであり、発明の限定を意図したものではない。ビデオ
以外においても、静止画像のシークエンスを利用するい
かなる記録技術でも使用可能である。もしその記録技術
がピクセル値を発生しないならば、その記録装置により
発生されたデータは周知である本分野技術の方法に従い
ピクセル又は等価なデータスペースにコンバートするこ
とが可能であり、また有効である。ここに紹介した技法
に加え、ズームモーションからのカメラモーション又は
シーン内のモーションを分離するための種々な技法が適
用可能である。さらに、アファイン変換係数を計算する
のにガウスピラミッドのステップを利用する必要もな
い。その計算はそのフル(full)高解像度フレームに対
して施されるもののごとき他の方法によっても可能であ
る。
【0092】本発明の方法はズームからの1静止画像の
場合以外に一連のパンショット及びジブショットからの
1パノラマ静止画像を創出する場合にも利用可能であ
る。そのような場合には、全フレームは全パノラマシー
ンと同じスペースを有するデータスペースにワーピング
されることになる。互いに重なり合った焦点距離の異な
るピクチャーの山とはならないであろう。むしろ、エッ
ジ部がオーバーラップした一連のピクチャーとなるであ
ろう。ズームシークエンスに適用された実施例において
は、ワーピングの主要な要素は各フレームからのデータ
を拡大してシーンの像を互いに整合させることである。
シーンの全像が互いにアラインするようにデータをワー
ピングすることはまたズーム系適用の1重要面である。
この特徴により、例えばカメラモーション又は被写体の
モーションによるモーションを取り去ることができる。
【0093】パノラマ系適用においては、この拡大する
特徴は重要ではなく、たいていの場合には使用されもし
ない。しかしながら、そのアライメントの観点からは大
変重要であり、パノラマシーンの全域的視域が連続的デ
ータスペースとして表されているならば、各フレームは
その全域的視域の限られた部分を取り上げることにな
る。ズーム系適用の場合とは異なり、パノラマ系適用に
おける各フレームは同じ焦点距離で創出される。各フレ
ームの像が別のフィールドの同一像と合致するように、
全域的データスペースでのフレームからのデータをアラ
インするために本発明の方法を使用するこが必要であ
る。本発明の方法は、主にショット間のつなぎ目に適用
される。もしパンのスピードがフレーム周波数に比べて
ゆっくりならば、つなぎ目におけるフレーム間のオーバ
ーラップは非常に大きくなる。
【0094】パノラマシーンの特定部分でさらに鮮明な
画像を得るためにズーム処理をパノラマ処理と結合させ
ることは本発明の思想内である。本発明の技術を被写体
とビデオの非連続的なセグメントからのフレームと結合
させるために使用することも可能である。
【0095】本発明はビデオカメラにより得られたデー
タの範囲にて記述されてきたが、本分野の通常の技術者
であれば、本発明の方法は、いかにして得られたもので
あろうともデジタル像を表すデータにも使用可能である
ことが理解されるであろう。例えば、異なる焦点距離で
撮影された一連のスチール写真は前述した方法により組
み合わせて特定の部分の像を補強した1像を形成するこ
とができる。同様に、パノラマスペース内で種々な位置
を描写している一組みのスチール写真を本発明の技法に
従って組み合わせ、1枚のパノラマ像を作成することが
できる。この中ではその種々な像部分はリカバーするこ
とが可能であり、共通な焦点距離であるが異なる視域を
有する1組みのばらばらとなった静止画像内にはパノラ
マ像の元の人工的要素はほとんど示されていない。
【0096】本発明は「特許請求の範囲」により特定さ
れた全実施例を含む明細書中の記載に照らし合わせて考
慮されるべきものであり、さらに合理的範囲内でのそれ
らの等価形態をも併せて考慮されるべきである。
【0097】
【発明の効果】以上詳述したように、本発明は、以下の
利点を備えた比較的に高解像度を有する静止画像を創作
する方法及び装置を提供することができる。 1)像全体にわたり高解像度で情報を取得する必要がな
い。 2)あまり重要ではない像の大部分に関して情報を収集
する必要がない。 3)種々な焦点距離又は視域の標準的ビデオ像のシーク
エンスを入力要素として取得できる。 4)標準的フィルム像のシークエンスを入力要素として
取得できる。 5)望む像のいかなる部分でもその解像度を増強する。 6)適正にプログラムされた汎用デジタルコンピュータ
及び標準型ビデオ又は映画装置が使用可能である。
【0098】さらに、本発明によれば、過剰なデータ保
存及びアクセス能力を要せず、あるシーンのパノラマビ
ューを観察者に提供し、その観察者にそのシーンの1位
置から他の位置までのナビゲーションを可能とする方法
を提供することができる。又、デジタル化されたいかな
る形態の像データであろうとも前記能力を発揮させるこ
とができるという優れた効果を奏する。
【図面の簡単な説明】
【図1】撮像装置の焦点距離と撮影されたシーン部分と
の関係を略図的に示す図である。
【図2】ビデオフィールドとビデオフレームのペアの概
略を示す図である。
【図3】組み合わされてビデオフレームを構成する典型
的なビデオフィールドのペアのインターレーシング(in
terlacing)を示す図である。
【図4】実質的に同じシーンのビデオフレームのシーク
エンスを略図的に示したものであり、短い焦点距離から
比較的長い焦点距離にズームインした状態を表す図であ
る。
【図5】最も短い焦点距離(ワイドアングルな視域)の
ビデオフレーム内シーンの部分の概略を示す図であり、
徐々に長くなる焦点距離のフレームのシークエンスの残
りメンバー内に供給されている。
【図6】図4において示すシークエンスの各ビデオ像
(図6の左側に示されている)の同一サイズデータスペ
ースにマップ(map)又はワープ(warp)した状
態の概略を示す図であり、そのサイズは拡大されたサイ
ズの最も低い解像度フレームである。
【図7】元は比較的短い焦点距離で記録された1フレー
ムをそのシーンの連続的拡大関与するデータスペースに
ワープしている状態の概略を示す図である。
【図8】シークエンスにおける複数のフレーム間の荒い
モーション及び繊細なモーション両方を特定する方法の
概略を示す図である。
【図9】フレームのシークエンスにおける2つの移動す
る被写体のモーションを特定する方法の概略を示す図で
ある。
【図10】同一データスペース内にワープされた後のシ
ークエンスの各フレームの概略を示す図であり、最終的
映像化に再構築されるようにアラインされている状態を
表し、各フレームの共通ポイントを通るベクトルが示さ
れている。
【図11】最終的な像を構築するのに使用されるウエイ
ト因子(weighting factor)とそのウエイト因子が適用
されているワープされたフレームの元の焦点距離との間
の関係を示すグラフ図である。
【図12】最終的な再構築像とその構築要素の概略を示
す図である。
【図13】本発明の方法の好適実施例を説明するフロー
チャート図である。
【図14】本発明の装置の好適実施例の概略を示す図で
ある。
【符号の説明】
2 像 4 焦平面 6 中央部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ワルター アール. ベンダー アメリカ合衆国 マサチューセッツ州 02166 オーボーンデール セントラル ストリート 22番地

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 あるシーンの静止画像を発生させる方法
    であって、以下記載のステップから成り立っていること
    を特徴とする静止画像発生方法: a。互いに異なる焦点距離にて創出されている複数の像
    を得るステップ b。前記各像に対してその像を表す信号を発生させるス
    テップ c。共通の焦点距離にスケールされたそれぞれ対応する
    像を表すように前記各信号を変換するステップ d。前記各スケールされた像を1焦点距離の1画像に結
    合させてなる最終的な信号を示すように前記各変換され
    た信号を結合するステップ。
  2. 【請求項2】 前記各信号の変換ステップは以下のステ
    ップから成り立っていることを特徴とする請求項1記載
    の静止画像発生方法: a。各像に少なくとも1のアファイン変換を施すステッ
    プ b。前記変換された複数の像をそれぞれ表す信号を発生
    させるステップ。
  3. 【請求項3】 前記少なくとも1のアファイン変換を施
    すステップは、解像度が減じられた修正フレームのシー
    クエンスを発生させ、サンプル化し、当該修正フレーム
    に対して少なくとも1のアファイン変換を施すステップ
    を有していることを特徴とする請求項2記載の方法。
  4. 【請求項4】 前記少なくとも1のアファイン変換を施
    すステップは、以下記載のステップから成り立っている
    ことを特徴とする請求項2記載の方法: a。前記複数の像をシークエンス内に配列するステップ b。前記シークエンス内の各像ペアに対して、当該ペア
    の第1像から第2像への変換を実質的に定義する1組の
    アファインパラメータを決定するステップ c。前記複数の像のそれぞれに対して、前記アファイン
    パラメータの複数組を結合し、1組のアファインパラメ
    ータに合成するステップ d。それぞれ対応する前記合成された1組のアファイン
    パラメータを利用して、アファイン変換を前記各像に対
    して施すステップ。
  5. 【請求項5】 前記結合ステップは、各スケールされた
    像を表すそれぞれに対応する信号の時間メジアンフィル
    ターを適用するステップを有していることを特徴とする
    請求項1記載の方法。
  6. 【請求項6】 前記時間メジアンフィルターを適用する
    ステップは各スケールされた像からのそれぞれに対応す
    る信号のウエイトを与えられた時間メジアンフィルター
    を適用するステップを有することを特徴とする請求項5
    記載の方法。
  7. 【請求項7】 前記ウエイトを与えられた時間メジアン
    フィルターは、比較的短い焦点距離で創出された像に対
    するよりも、比較的長い焦点距離で創出された像に対し
    て大きなウエイトを割り当てるフィルターを有している
    ことを特徴とする請求項6記載の方法。
  8. 【請求項8】 変換ステップの前に信号ペア間の変化を
    特定するステップをさらに含み、当該変化は当該信号に
    より表されている像を創出する手段のモーションと、シ
    ーン内の要素のモーションにより引き起こされるもので
    あって、像間の焦点距離の差により引き起こされるもの
    ではないことを特徴とする請求項1記載の方法。
  9. 【請求項9】 前記像を創出するステップは複数のビデ
    オ像を記録するステップを有していることを特徴とする
    請求項1記載の方法。
  10. 【請求項10】 前記変換ステップは、共通の視域にア
    ラインされたそれぞれに対応する像を表すように各信号
    を変換するステップをさらに有していることを特徴とす
    る請求項1記載の方法。
  11. 【請求項11】 結合ステップの前に、2つの像が相違
    する焦点距離にて創出された事実以外の要因による像ペ
    ア間の相対的モーションを特定するステップをさらに有
    していることを特徴とする請求項1記載の方法。
  12. 【請求項12】 前記相対的モーションを特定するステ
    ップは以下記載のステップから成り立っていることを特
    徴とする請求項11記載の方法: a。あるペアの両像の第1パターン部分の第1相対的モ
    ーションを予想するステップ b。両像の第2パターン部分の第2相対的モーションを
    決定するために前記予想された第1モーションを利用す
    るステップ c。相対的モーションの満足できる解像度が得られるま
    で以下のステップを繰り返すステップ; i。前記第1パターン部分の前記第1相対的モーション
    をさらに正確に特定するために前記第2相対的モーショ
    ンを使用するステップ ii。前記第2パターン部分の前記第2相対的モーショ
    ンをさらに正確に特定するために前記第1相対的モーシ
    ョンのさらに正確なスペックを使用するステップ。
  13. 【請求項13】 あるシーンの静止画像を発生させる方
    法であって、以下記載のステップから成り立っているこ
    とを特徴とする静止画像発生方法: a。複数の像を創出するステップであって、当該複数の
    像の各々は他と異なる視域をカバーして創出され、当該
    視域は全視域の因子(members)であることを特徴とす
    る複数像創出ステップ b。前記各像に対してその像を表す信号を発生させるス
    テップ c。前記全視域にアラインされたそれぞれに対応する像
    を表すように各信号を変換するステップ d。前記アラインされた像を前記全視域の1画像に結合
    させてなる最終的な信号を示すように前記変換された信
    号を結合するステップ。
  14. 【請求項14】 あるシーンの静止画像を発生させる装
    置であって、以下記載の手段から成り立っていることを
    特徴とする静止画像発生装置: a。複数の像を創出する手段であって、当該複数の像の
    それぞれは他と異なる焦点距離にて創出されたものであ
    ることを特徴とする像創出手段 b。前記各像に対してその像を表す信号を発生させる手
    段 c。共通の焦点距離にスケールされたそれぞれに対応す
    る像を表すように各信号を変換する手段 d。前記各スケールされた像を1焦点距離の1画像に結
    合させてなる最終的な信号を示すように前記各変換され
    た信号を結合する手段。
  15. 【請求項15】 前記複数の像を創出する手段はビデオ
    記録装置を含んでいることを特徴とする請求項14記載
    の装置。
JP29449192A 1991-11-01 1992-11-02 異なる焦点距離又は異なる視域の複数の像を使用した高解像度静止画像を得る方法及び装置 Expired - Fee Related JP3616111B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US78669891A 1991-11-01 1991-11-01
US786698 1997-01-23

Publications (2)

Publication Number Publication Date
JPH05304675A true JPH05304675A (ja) 1993-11-16
JP3616111B2 JP3616111B2 (ja) 2005-02-02

Family

ID=25139354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29449192A Expired - Fee Related JP3616111B2 (ja) 1991-11-01 1992-11-02 異なる焦点距離又は異なる視域の複数の像を使用した高解像度静止画像を得る方法及び装置

Country Status (1)

Country Link
JP (1) JP3616111B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411339B1 (en) 1996-10-04 2002-06-25 Nippon Telegraph And Telephone Corporation Method of spatio-temporally integrating/managing a plurality of videos and system for embodying the same, and recording medium for recording a program for the method
JP2008067363A (ja) * 2006-07-25 2008-03-21 Itt Manufacturing Enterprises Inc 画像のミスレジストレーションを補正するシステム及び方法
JP2017525228A (ja) * 2014-06-17 2017-08-31 ゼットティーイー コーポレーションZte Corporation カメラ自動焦点最適化の方法及びカメラ
CN111724381A (zh) * 2020-06-24 2020-09-29 武汉互创联合科技有限公司 基于多视图交叉验证的显微图像细胞计数与姿态识别方法
CN113491113A (zh) * 2019-02-28 2021-10-08 腾讯美国有限责任公司 视频编解码的方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411339B1 (en) 1996-10-04 2002-06-25 Nippon Telegraph And Telephone Corporation Method of spatio-temporally integrating/managing a plurality of videos and system for embodying the same, and recording medium for recording a program for the method
JP2008067363A (ja) * 2006-07-25 2008-03-21 Itt Manufacturing Enterprises Inc 画像のミスレジストレーションを補正するシステム及び方法
JP2017525228A (ja) * 2014-06-17 2017-08-31 ゼットティーイー コーポレーションZte Corporation カメラ自動焦点最適化の方法及びカメラ
US10044931B2 (en) 2014-06-17 2018-08-07 Xi'an Zhongxing New Software Co., Ltd. Camera auto-focusing optimization method and camera
CN113491113A (zh) * 2019-02-28 2021-10-08 腾讯美国有限责任公司 视频编解码的方法和装置
CN113491113B (zh) * 2019-02-28 2023-07-21 腾讯美国有限责任公司 视频编解码的方法和装置
CN111724381A (zh) * 2020-06-24 2020-09-29 武汉互创联合科技有限公司 基于多视图交叉验证的显微图像细胞计数与姿态识别方法

Also Published As

Publication number Publication date
JP3616111B2 (ja) 2005-02-02

Similar Documents

Publication Publication Date Title
JP3590631B2 (ja) 複数の画像を利用した高解像静止画像を創出する方法及び装置
EP1269400B1 (en) High resolution, high speed digital camera
US8396328B2 (en) Minimal artifact image sequence depth enhancement system and method
US8078006B1 (en) Minimal artifact image sequence depth enhancement system and method
US8401336B2 (en) System and method for rapid image sequence depth enhancement with augmented computer-generated elements
Massey et al. Salient stills: Process and practice
US7162083B2 (en) Image segmentation by means of temporal parallax difference induction
US7973827B2 (en) Image data generating apparatus, method and program for generating an image having high spatial and high temporal resolution
EP0395276A2 (en) Video signal to photographic film conversion
Shimoda et al. New chroma-key imagining technique with hi-vision background
CA2238768A1 (en) Multi-camera virtual set system employing still store frame buffers for each camera
JP3616111B2 (ja) 異なる焦点距離又は異なる視域の複数の像を使用した高解像度静止画像を得る方法及び装置
US5805207A (en) Moving image reproduction system providing compensation for cinematographic artifacts
JP3325823B2 (ja) 映像静止画表示方法及び装置並びに映像静止画表示プログラム格納記録媒体
JP2005275765A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録した記録媒体
Shen et al. Mosaic based view enlargement for moving objects in moving pictures
Thomas Motion-compensated matteing
JP2006332904A (ja) 輪郭強調回路
US20080055414A1 (en) Modified Baird sequential detail scanning system
Qin et al. Creating a precise panorama from fanned video sequence images
Tsuruta et al. An advanced high-resolution, high-brightness LCD color video projector
Zhang et al. HVS: an image-based approach for constructing virtual environments
Stumpf Forging a HDTV System for Production and Post Production—A Working Group Report
JP2005234680A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
Langer et al. Capturing Non-Periodic Omnistereo Motion

Legal Events

Date Code Title Description
A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040216

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040916

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041104

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101112

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees