JP2006172170A - 座標系分離記録再生装置 - Google Patents
座標系分離記録再生装置 Download PDFInfo
- Publication number
- JP2006172170A JP2006172170A JP2004364223A JP2004364223A JP2006172170A JP 2006172170 A JP2006172170 A JP 2006172170A JP 2004364223 A JP2004364223 A JP 2004364223A JP 2004364223 A JP2004364223 A JP 2004364223A JP 2006172170 A JP2006172170 A JP 2006172170A
- Authority
- JP
- Japan
- Prior art keywords
- coordinate system
- image
- signal
- camera
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 91
- 239000013598 vector Substances 0.000 claims description 186
- 230000033001 locomotion Effects 0.000 claims description 60
- 238000000354 decomposition reaction Methods 0.000 claims description 48
- 230000006835 compression Effects 0.000 claims description 45
- 238000007906 compression Methods 0.000 claims description 45
- 238000001514 detection method Methods 0.000 claims description 38
- 230000015572 biosynthetic process Effects 0.000 claims description 33
- 238000003786 synthesis reaction Methods 0.000 claims description 33
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 abstract 1
- 238000000034 method Methods 0.000 description 62
- 238000004364 calculation method Methods 0.000 description 59
- 238000012545 processing Methods 0.000 description 53
- 230000008569 process Effects 0.000 description 35
- 230000008859 change Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 230000006837 decompression Effects 0.000 description 14
- 230000036544 posture Effects 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000012937 correction Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 230000006641 stabilisation Effects 0.000 description 8
- 238000011105 stabilization Methods 0.000 description 8
- 230000003068 static effect Effects 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 7
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 7
- 230000008929 regeneration Effects 0.000 description 7
- 238000011069 regeneration method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000011895 specific detection Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000001454 recorded image Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 229910052753 mercury Inorganic materials 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】 座標系分離記録再生装置1は、現実世界を撮影した動画映像に含まれる複数の座標系を検出し、座標系毎に対象物を記録する座標系分解記録構成部10と、座標系分解記録構成部10で記録された信号を再生し、各座標系毎に対象物を構築し、複数の座標系を合成して動画映像を再生し、現実世界をバーチャル世界に再構築する座標系合成再生構成部20と、を備えている。
【選択図】 図8
Description
特に、本発明は、動画映像として取得される現実空間を静止座標系と移動体毎に固有の座標系とに分解し、複数の座標系に分類して座標系毎に分割して記録し、再生時にそれぞれの座標系を合成して配置することでバーチャル空間を構成して動画映像を生成することで、効率よく、精度よく、現実世界をバーチャル空間に記録再生でき、かつ、動画データを極限まで圧縮することができる座標系分離記録再生装置に関する。
MPEGは動画を圧縮するための技術で、MPEG1,MPEG2,MPEG4があり、動画像の圧縮の代表はMPEG2である。MPEG2は、動きの部分を分離し、動きを予測して信号の冗長をなくすことを主とした圧縮方法で、オリジナルデータの約40分の1のデータ圧縮が可能となり、データ転送速度4Mbps以上の記録・再生に対応し、S-VHSのビデオ並みの高画質が得られことから、DVD-VideoやATSC等の次世代デジタルテレビ用に広く利用されている(特許文献1−3参照。)。
例えば、動く背景上に移動する物体がある画像のような場合や、カメラ自体が移動するような画像の場合には、画像全体が動き成分を持ち、しかも画像の各部分で移動速度が同一でないために、画像のすべての部分が周囲に関係なく常に独立に移動しなければならなくなり、圧縮効果は激減することになる。このため、画像全体に動き成分のある画像について、より圧縮効果の高い画像圧縮技術の開発が望まれるようになったが、現在まで有効な手段は実現されていない。
ここで、動画像から三次元画像を生成するには、動画を構成する各フレーム画像のカメラベクトルを取得することで、三次元化することが可能となるが、すべての点について三次元演算を行うには演算にかなりの時間がかかり、また、明度や色の変化部分が少ないような、複数の画像に亘って対応が取れない部分においては三次元化が行えない。
特に、本発明は、ビデオ映像による現実世界の撮影データから、現実世界を記録するものであるが、対象となるビデオ映像は、カメラが移動し、背景が動き、その中に移動物体も存在するような一般化された動画像を対象としており、画像の各部分が動き成分を持ち、かつ異なる速度成分を持つ画像に関しても十分な圧縮効果を持たせることを可能としている。
特に、請求項4に記載するように、差分信号付加部は、複数座標系において、静止座標系のみを採用し、全分割画像を静止座標系で表現し、移動体等の本来他の座標系に分類されるべき分割画像によって生じる誤差を前記差分信号として扱う構成とすることが好ましい。
ここで、CV値とは、カメラベクトルの意味であり、カメラの三次元回転と三次元位置を示す値である。
さらに、本発明の座標系分離記録再生装置は、請求項6に記載するように、座標系分解記録構成部が、複数のカメラによる画像に基づいて、カメラ間の視差により各座標系における位置関係とスケール関係を規定する構成とすることができる。
各座標系は三次元的に定義されるので、再構成された座標系は最終的に同一の三次元空間内に配置されることになる。
従って、最終画像は三次元画像となるが、二次元画像のまま各画素又は各分割画像のブロック単位を一次元の動きに分解して扱うことで、情報を整理することが可能となる。
また、明度や色の変化のない平坦な画像でも、平坦部分をひと固まりとすることで、画像を領域に分割することで、それぞれの三次元座標を取得することができ、再生画像として生成することができる。
また、カメラが静止座標系に対して静止している場合はCV値はゼロであり、運動する場合は静止画像から生成した複数のブロック画像の動きを一次ベクトルで表現することが可能である。さらに、各フレーム画像に座標系の数だけのカメラベクトルを定義すれば、すべての座標系が二次元画面上を移動する一次ベクトルとして単純に記述され、しかもカメラ移動の情報のみで、静止画像から移動中の或る範囲の全フレーム画像を表現できることになる。これによって情報を大幅に省略することができる。
このようにすることで、画像は圧縮され、再生側又は受信側では各座標系をフレーム単位のカメラベクトルから、カメラとの回転を含む相対速度による移動として、元の動画像を再現できる。
また、座標系分解処理時にエラーが生じることを前提として、前もって誤差補正のための差分信号を生成して、信号の一つとして追加し、画像の再構築をより完全にすることが可能となる。
なお、以上は二次元動画の圧縮解凍による動画再生であるが、各分割画像を複数の座標に分解することと、三次元量を三次元のカメラ位置と一次元の移動ベクトルとして記述しているため、最終画像を三次元動画に変換することも可能である。
ビデオ映像から現実世界を複数の座標系に分割し、座標系毎に処理をすることで、効率の良い画像圧縮が実現できる。或いはCGによる三次元地図を効率よく構築することができる。
画像を座標系毎に分解することで、カメラが移動してもしなくても、同じ情報量として記録又は伝送できるという従来にはない画期的効果を実現することができる。
画像は、複数の座標系に分解すれば、一つの座標系について一つのカメラベクトルと、初めの静止画と、追加部分画像を送ることで、それ以降に連続するフレーム画像を初めの静止画から再構築できることが可能となる。座標系が共通であれば、静止画も動画も基本データは同一であり、情報量は追加部分画像の分だけの増加となる。つまり、画像を構成する複数の座標系に分離してしまえば、後は数学的演算のみで画像を再構成できることになる。
また、本発明は、従来の画像圧縮技術と重複しないことから、従来の画像圧縮技術をも同時に併用することができ、更に大幅な画像圧縮が期待できる。
応用例として、座標移動量と方向からいつでも三次元に変換できることから、ビデオ画像から現実世界を直接三次元画像として取得することも可能となる。
ここで、以下に示す本発明の座標系分離記録再生装置は、プログラム(ソフトウェア)の命令によりコンピュータで実行される処理,手段,機能によって実現される。プログラムは、コンピュータの各構成要素に指令を送り、以下に示すような所定の処理や機能、例えば、基準となるフレーム画像の抽出や基準フレーム画像の分割,動画像に含まれる複数の座標系の検出,カメラベクトルの演算,再生画像の生成等を行わせる。このように、本発明の座標系分離記録再生装置における各処理や手段は、プログラムとコンピュータとが協働した具体的手段によって実現されるようになっている。
なお、プログラムの全部又は一部は、例えば、磁気ディスク,光ディスク,半導体メモリ,その他任意のコンピュータで読取り可能な記録媒体により提供され、記録媒体から読み出されたプログラムがコンピュータにインストールされて実行される。また、プログラムは、記録媒体を介さず、通信回線を通じて直接にコンピュータにロードし実行することもできる。
まず、図1〜図21を参照して、本発明に係る座標系分離記録再生装置の第一実施形態について説明する。
[基本構成]
図1は、本発明の第一実施形態に係る座標系分離記録再生装置の概略構成を示すブロック図である。
同図に示すように、本実施形態に係る座標系分離記録再生装置1は、座標系分解記録構成部10と、座標系合成再生構成部20とを備えている。
座標系合成再生構成部20は、座標系分解記録構成部10で記録された信号を再生し、各座標系毎に対象物を構築し、複数の座標系を合成して、現実世界を効率よくバーチャル世界に再構築する画像再生手段となっている。
この座標系分解記録構成部10と座標系合成再生構成部20が、本発明の座標系分離記録再生装置の基本部分をなしている。
そして、このように現実世界を構成している複数の座標系を検出することが、本発明の基本であり、この座標系の検出を座標系分解記録構成部10で行っている。
座標系分解記録構成部10では、検出された複数の座標系毎に、その座標系に属する対象物を記録する。対象物を座標系毎に記録することで、座標系に分解することなく記録した場合よりも、効率の良い記録が可能となる。
ここで、記録する対象物は、映像そのものである場合もあるし、CGに置き換えられる場合もある。さらには、音声等の映像以外の情報であることもある。
座標系合成再生構成部20は、座標系分解記録構成部10で分解・記録された各座標系毎に対象物を構築し、複数の座標系を合成することで現実世界を効率よくバーチャル世界に再構築する。
なお、座標系分解記録構成部10と座標系合成再生構成部20は、単一の装置として一体的に備えることもできるが、画像記録側の座標系分解記録構成部10と画像再生側の座標系合成再生構成部20をそれぞれ別々に構成し、離間して配設することもできる。離間して備えられた座標系分解記録構成部10と座標系合成再生構成部20は、例えばインターネットやLAN等の有線又は無線の通信回線を介して接続されることで、取得・生成された画像データを装置間で送受信することができる。
以下、図2〜図7を参照して、座標系分離記録再生装置1における処理・動作の基本的な考え方を説明する。なお、動画像は、例えばビデオ映像や映画のように、一般に連続する静止画から成り立っており、以下ではそのような静止画の連続である動画像を前提として説明する。
まず、動画像を構成する各フレーム画像のいずれかを、その後の処理の基準となる画像(基準画像)として選択・決定する。そして、選択された基準フレーム画像は所定領域に分割する。
基準画像を所定領域に分割するには、基準フレーム画像をフレーム間で変化しない固まりと見なせるほど十分小さい画像に分割する。例えば、10p×10pのブロック単位に強制的に分割することができる。このように基準画像を分割してブロック化された10×10等の画像の集合の信号が後述する分割画像信号となり、この10×10単位でその移動方向と移動量が検出されることになる。例えば、自動車のような移動体であれば、10×10の単位分割画像が100〜200個程度集まって構成される。
なお、このようにブロック画像に分割することが最も単純な方法であるが、これ以外にも、例えば対象物の同じ色や同じ明るさの領域で分割したり、対象物の面で分割したり、という画像の固有の性質に合わせて分割する方法もある。このような画像固有の分割方法につていは後述する。
画像をブロックに分割し、それぞれの単位ブロック画像の隣接するフレーム画像に渡って対応位置を追跡して、その移動ベクトルを検出すれば、それが座標系に固有の運動となる。すなわち、同一座標系に所属する分割画像は、座標系とカメラ位置の関係で決まる湧きだし点から放射状に外向きに向かう一次元ベクトルで表現できることになる。
湧きだし点とは、図2に示すように、現実の三次元空間において、カメラ位置を中心として投影された球面上の一点として定義される点であり、カメラ移動方向に湧きだし点が、その背面に吸い込み点が、それぞれ一対の点として定義される。
一方、画像は、カメラに一番近い点で最大の大きさになり、後方に移動して行くにつれて小さくなり、最終的に後方の一点に吸い込まれていくように見える。すなわち、画像は、ある点に吸い込まれるように消えていくことになり、その点が吸い込み点となる。
なお、湧きだし点はその点から分割画像が湧きだす点であり、吸い込み点は分割画像がそこに向かって吸い込まれていく点で、湧きだし点が決まれば自ずと吸い込み点も決まることになるので、以下、湧きだし点のみについて説明する。
カメラベクトル(CV値)とは、カメラの三次元位置座標及び3軸回転座標を示すものであり、運動する物体の湧きだし点は、カメラベクトルから一義的に求められることになる。
また、湧きだし点は画枠内にあることもあれば、画枠外にあることもある。カメラ移動が回転無しの直線運動であれば、湧きだし点は、移動しないで球面上の固定点となり、全周画像であれば、その中の一点として決められる。一方前記平面画像上では、画枠に対して固定点となる。
以上のような湧きだし点に基づいて、すべての分割画像について、隣接するフレーム画像に渡って、同一座標系の中の移動として捉えることができる。
図4に示すように、基準フレーム画像を、静止座標系となる座標系1と、2つの移動体が属するそれぞれの座標系2,座標系3に分割することでき、分割された座標系を統合することで、動画像を再構成することができる。同図中、点線で示すのは、各座標系におけるカメラベクトルをカメラの移動軌跡として表したものである。
そして、全分割画像について、隣接するフレーム画像に渡って同一座標系の中の移動として捉えると、原理的には最初のフレーム画像だけからそれ以降のフレームを生成して、動画を生成できることになり、これによって、元の動画像を大幅に圧縮することができる。
なお、同一座標系であっても、基準画像にはない新しい部分画像が出現すれば、それは追加する必要があり、その場合には、カメラ移動による新しい情報を付加してやることで、より完全な動画像を生成することができる。
また、最初の基準フレーム画像はJPEG等の従来の方法で圧縮して記録すればさらに圧縮率が上がることになるので、従来の圧縮技術と組み合わせて用いることができる。
すなわち、湧きだし点を信号として付加しなくても、CV値だけを付加すれば湧きだし点の座標は何時でも求められることになる。従って、生成信号にCV値を持たせることで、湧きだし点の座標を持たせる必要はなくなる。
カメラベクトルを求める具体的な演算処理については、図10〜図21を参照して後に詳述する。
一般に、動画像は複数のフレームから成り、動画を構成する複数フレーム画像を一枚の基準画像と各分割単位画像の一次元ベクトルとして表現することができる。そして、これは基準画像に隣接するフレーム画像の省略という意味を持ち、動画像の持つ重複する情報を整理して、動画像を組み立てることで画像圧縮を実現することが可能となる。
一次元ベクトルを持つ各画像ブロックは共通の湧き出し点を持ち、それは座標系に固有であり、座標系の数だけ存在することになる。
もし、静止座標系で静止している対象物の映像であれば、各フレーム画像は一つの座標系として表現でき、カメラが動いていても一次元ベクトルは一つの湧き出し点又は吸い込み点を持つことになる。
また、カメラベクトル(CV値)から画像安定化の為に回転を止める補正信号を生成するので、カメラの回転については、回転量を記録して、最終的に復元して、復元画像に元画像と同じ回転を与えることができる。
従って、カメラが回転しながら移動し、結果として静止座標系が回転・移動して観察されても、全ブロック画像はすべて共通の湧き出し点を持ち、一次元ベクトルで表現することができる。
これにより、画像の各ブロックの移動は、湧きだし点と何れかの座標系の一次元ベクトルで表現できることになる。すなわち、一般の動画像は複数の座標系と座標系毎に固有の湧き出し点に向かう一次元ベクトルで表現できることになり、カメラ移動に関係なく画像を複数の座標系に分解できることになる。
なお、上述したように、湧きだし点の位置は静止座標系の中のカメラ位置を示すカメラベクトル(CV値)で一義的に決定されるので、カメラベクトルで表現しても良い。
湧きだし点は二次元情報であり、カメラベクトルは三次元情報であるので、画像圧縮の目的だけからは二次元情報の方が有利になるが、画像安定化や追跡処理等の他の画像処理を行うにはカメラベクトルの三次元情報が有利となる場合もある。
画像処理の過程で、各座標系に分解する段階で色のエラーや位置エラーやレンズの歪みによるエラーや座標系を間違うエラーや、同一画像ブロックが時間で変化することで生じるエラーもある。
そこで、このような場合には、記録前に生成した圧縮信号から前もって再生解凍し、再生画像を生成し、それを元画像と比較して、その差分を差分信号として、エラーを修正することが可能である。
このことで処理の途中にエラーが発生しても、圧縮率は落ちるが、画像のエラーは補正できることになる。
そのような場合には、差分信号に制限を設けて、差分信号の情報量がある閾値に達したときには、当該基準フレーム画像についての処理をリセットし、新規フレーム画像を新たに基準画像として処理を始めることができる。
このようにすれば、新規フレームからの各ブロック画像の移動として、動画像の圧縮を連続的に継続することができる。
すなわち、差分信号により移動体が表現されることになり、唯一の座標系として処理した場合でも画像圧縮は十分可能となる。
また、画像を三次元化することなく、二次元画像のまま複数の座標系に分離することで、座標系分類に誤差が生じても、差分信号を付加することで、最終の再生された画像は、画像二次元画像として見る限り正しい画像が生成されることになる。
また、座標系を統合することで再構成された動画像は当然に元画像の二次元映像を再現するが、座標系の統合はカメラ位置を変えた任意位置での統合が可能となるので、元画像とは異なる視点からの映像を生成することも可能となる。
また、異なる視点からの映像により、動画像から複数の視点映像を上述した方法で生成し、立体視をすることも可能である。ここで、立体視とは、複数の視点映像を生成し、又は視差相当の画像をめがね等で左右の目に与えることで、立体感を生じさせるものである(後述する第三実施形態参照)。
さらに、静止画であっても、仮想のカメラベクトルと座標系を仮に指定することで、仮の動画像化と三次元化が可能となる。
次に、基準フレーム画像の自動分割について説明する。
上述した実施形態では、基準フレーム画像を例えば、10p×10pのブロック単位に強制的に分割することを説明したが、以下の方法により、基準画像を画像の持つ固有の性質等に合わせて自動分割することも可能である。
画像処理において、画像を効率よく部分領域の集合となるように分割することが重要となるが、上述した実施形態では単純にブロックに分割して、それぞれを単位領域として処理するようになっている。
これを、さらに画像の持つ固有の性質に合わせて、効率よく画像を自動領域分割することも可能である。
画像を分割する際、単純にブロックに分解する方法が一般的であるが、ここでは演算に有利となるように分割前にずらし演算をする。上述した基準フレーム画像から分割画像を生成する場合に、基準フレーム画像をそのままブロック分割せずに、基準画像のまま適切に定められたピクセル数だけ縦及び横に微量ずらして行く。そして、ずらした回数のずらしフレーム画像を生成する。
例えば、基準フレーム画像について、11*11の領域を決め、121回のずらし演算を行う。次に、基準フレーム画像を微少領域に分割する。
そして、基準フレーム画像と複数のずらしフレーム画像との相関関係を微少量領域周辺で求めるために、微少領域面及びその周囲で差分値を必要とされる画像全域で演算で求める。又は相関値を演算で求めてもよい。
式1において、nは分割したブロック画像の番号を、mはずらしたフレームの全枚数を、sはずらしたフレームm枚のうちの何枚目かを、それぞれ表す。
infs は、ずらしたm枚のフレームのs番目のフレームのn番目のブロック画像の明るさであり、inf0は、ずらさないフレームf0のn番目のブロック画像の明るさである。
従って、n番目のブロックの差分値又は相関値Cnは、f0と同じnの位置のfsなる位置の明るさの差(絶対値)の合計を意味する。Cnが大きいときは、画像のきめがこまいことを意味し、特徴点となり得ることを意味し、Cnが小さいときは、ずらしても差が生じないことであり、相関値が低く、同一領域となり得ることになる。
そして、非特徴点領域については、隣り合う非特徴点領域を結合し、より大きな領域を生成して、特徴点領域に接するまで領域を拡大し、あるいは特徴点領域とはなり得ないが、境界領域とはなり得る微少領域に接するまで結合領域を拡大して、単位処理領域とする。これにより、基準フレーム画像を画像状況に合わせた大きさと形を持つ多数の単位処理領域からなる画像に分解・整理して生成することが可能となる。
以下、より具体的に、本実施形態の座標系分離記録再生装置1を構成する座標系分解記録構成部10と座標系合成再生構成部20について説明する。
図8は、本実施形態に係る座標系分離記録再生装置1を構成する座標系分解記録構成部10と座標系合成再生構成部20の詳細構成を示すブロック図である。
また、図9は、図8に示す座標系分離記録再生装置1の変形実施形態を示すブロック図であり、座標系分解記録構成部10に差分信号付加部14を追加し、また、座標系合成再生構成部20に三次元画像生成部24を追加した場合を示している。
図8に示すように、本実施形態の座標系分解記録構成部10は、動画像取得部11と、座標系検出部12と、座標系分離信号記録部13とを備えている。
さらに、図9に示すように、座標系分解記録構成部10は、差分信号付加部14を備えることができる。
座標系検出部12は、動画像取得部11で取得された動画像の一部分を構成する複数のフレーム画像を代表する単一の基準フレーム画像を選択し、それを適切に分割し、分割された各領域が属する複数の座標系を検出し、動画像の全体に渡って、画像を構成する複数の座標系を検出する。
座標系分離信号記録部13は、分割画像信号,座標系特定信号,座標系別カメラベクトル信号及び移動ベクトル信号の各信号を生成する。
座標系特定信号は、分割画像の各領域が複数の座標系のうちの何れかの座標系に属するように特定して分類し、分割画像の各領域が属する座標系を特定する信号であり、例えば、複数の座標系を識別するために各分割画像に与えられる識別信号である。
移動ベクトル信号は、動画像を代表する基準フレーム画像に関する分割画像の各領域が動画像中を移動する量を検出して生成される信号である。例えば、10×10のブロック画像の移動方向と移動量を示す信号である。
そして、座標系分解記録構成部10では、これら各信号を画像圧縮信号として記録する。
座標系の分離は常に成功するとは限らず、誤差や間違いが生じることもあり得る。そこで、そのような誤差や間違いを差分として検出し、それを差分信号とする。そして、その差分信号を座標系分離信号記録部13の圧縮信号に付加することで、再生側(座標系合成再生構成部20)で正しい動画像を生成することが可能となる。
動画映像においても、静止座標系が代表的座標系となるものである。そこで、動画像から検出される複数の座標系のうち、静止座標系を唯一の座標系として選択し、全ての分割された領域を静止座標系で表現することで、移動体等の本来は他の座標系に分類されるべき領域がすべて誤差となり、その誤差分を差分信号として扱うことで、より正確な再生画像を生成できるようになる。
図8に示すように、本実施形態の座標系合成再生構成部20は、座標系別信号再生部21と、座標系分離信号再構築部22と、再生解凍動画像出力部23とを備えている。
さらに、図9に示すように、座標系合成再生構成部20は、三次元画像生成部24を備えることができる。
座標系分離信号再構築部22は、再生された各信号、すなわち、分割画像信号,座標系特定信号,座標系別カメラベクトル信号,移動ベクトル信号を座標系別に組み立て、各座標系画像を合成して、視点を決定して各フレーム画像を再構築する。
再生解凍画像出力部23は、再構築された画像を指定された再生動画像として出力する。例えば、液晶ディスプレイ等で構成される。
三次元動画像の生成は、上述した画像圧縮技術と同一原理であり、各座標系における各領域画像の一次元ベクトルと、各座標系におけるCV値とから、各領域画像の三次元座標を演算で求めることができ、その作業を連続して行うことで、三次元動画像を生成することが可能となる。
以上のような構成からなる本実施形態の座標系分解記録構成部10及び座標系合成再生構成部20は、次のように動作する。
まず、座標系分解記録構成部10の動画像取得部11で任意のビデオ映像が取得される。ビデオ映像は、通常画像や360度画像からなる動画像であり、複数の連続する静止画フレーム画像から構成されている。
取得された動画像は座標系検出部12で処理され、動画像の一部分を構成する複数のフレーム画像を代表する単一の基準フレーム画像が選択される。選択された基準フレーム画像は、所定のブロック単位等に適切に分割され、分割された各領域が属する複数の座標系が検出されて、基準フレーム画像に含まれる各部分が属する座標系が検出される。
そして、同様の処理が動画像の全体に渡って行われ、複数の座標系が検出される。この処理によって動画像中の対象物の各部分が属する座標系が検出されたことになる。
また、座標系検出部12は、分割画像の各領域が複数の座標系の何れかの座標系に属するように特定して分類し、分割画像の各領域が属する座標系を特定する座標系特定信号を生成する。
また、座標系検出部12は、複数の座標系の間の関係と、各座標系に於けるカメラ位置姿勢関係を示す座標系別カメラベクトル信号を生成する。
さらに、座標系検出部12は、動画映像を代表する基準フレーム画像に関する分割画像の各領域を隣接する複数画像に渡って追跡し、各領域が動画像中を移動する量を検出して移動ベクトル信号を生成する。
そして、これら各信号が画像圧縮信号として座標系分離信号記録部13で記録される。
座標系合成再生構成部20の再生処理においては、まず、座標系別信号再生部21で、座標系分離信号記録部13で記録された信号を座標系別に読み取り、画像圧縮信号を再生する。
再生された各信号、すなわち、分割画像信号,座標系特定信号,移動ベクトル信号及び座標系別カメラベクトル信号は、座標系分離信号再構築部22で、座標系別に組み立てられ、各座標系画像が合成され、視点が決定されて各フレーム画像として再構築される。
そして、再構築された画像は、再生解凍動画像出力部23で、指定された再生動画像として出力されることになる。
次に、上述した本実施形態の座標系分離記録再生装置1における座標系検出の基礎となるカメラベクトルの演算処理について、図10〜図21を参照しつつ具体的に説明する。
複数の画像(動画又は連続静止画)の特徴点からカメラベクトルと特徴点の三次元情報を求めるにはいくつかの方法があるが、本実施形態では、画像内に十分に多くの数の特徴点を自動抽出し、それを自動追跡することで、エピポーラ幾何学により、カメラの三次元ベクトル及び3軸回転ベクトルと特徴点の三次元座標を求めるようにしてある。特徴点を充分に多くとることにより、カメラベクトル情報が重複することになり、重複する情報から誤差を最小化させて、より精度の高いカメラベクトルと特徴点の三次元座標を求めることができる。
このようにして求められたカメラの三次元位置とカメラの3軸回転から、それを各フレーム画像にデータとして付加し、複数のフレーム画像から得られる複数の視差、即ち多重視差と、既に取得しているカメラの三次元位置から、対象物の特徴点の三次元座標を演算で求めることができる。
なお、以上の処理は、車載カメラだけでなく、例えば、人が手に持ってカメラを自由に振り回して、対象物を撮影し、撮影後にその映像からカメラベクトルを演算で求めることができる。
カメラベクトル(CV)とは、カメラの持つ自由度のベクトルをいう。
一般に、静止した三次元物体は、位置座標(X,Y,Z)と、それぞれの座標軸の回転角(Φx,Φy,Φz)の六個の自由度を持つ。従って、カメラベクトルは、カメラの位置座標(X,Y,Z)とそれぞれの座標軸の回転角(Φx,Φy,Φz)の六個の自由度のベクトルをいう。なお、カメラが移動する場合は、自由度に移動方向も入るが、これは上記の六個の自由度から微分して導き出すことができる。
このように、本実施形態の座標系分離記録再生装置1におけるカメラベクトルの検出は、カメラは各フレーム毎に六個の自由度の値をとり、各フレーム毎に異なる六個の自由度を決定することである。
図10に示すように、カメラベクトル演算処理では、まず、画像取得処理101を経て得られた動画映像について、特徴点抽出処理102において、適切にサンプリングしたフレーム画像中に、特徴点となるべき点又は小領域画像を自動抽出し、特徴点対応処理103で、複数のフレーム画像間で特徴点の対応関係を自動的に求める。具体的には、カメラベクトルの検出の基準となる、十分に必要な数以上の特徴点を求める。画像間の特徴点とその対応関係の一例を、図11〜図13に示す。図中「+」が自動抽出された特徴点であり、複数のフレーム画像間で対応関係が自動追跡される(図13に示す対応点1〜4参照)。
ここで、特徴点の抽出は、図14に示すように、各画像中に充分に多くの特徴点を指定,抽出することが望ましく(図14の○印参照)、例えば、100点程度の特徴点を抽出する。
本実施形態では、カメラ映像として原則的に360度全周映像を使用し、360度全周映像のエピポーラ幾何からエピポーラ方程式を解くことによりカメラ運動(カメラ位置とカメラ回転)を計算するようになっている。
十分な数の特徴点を与えることにより、線形代数演算により最小自乗法による解としてt及びRを計算することができる。この演算を対応する複数フレームに適用し演算する。
なお、図13は、カメラベクトル演算処理を理解し易くするために、1台または複数台のカメラで撮影した画像を合成した360度全周囲の球面画像を地図図法でいうメルカトール図法で展開したものを示しているが、実際の座標系分離記録再生装置1における処理では、必ずしもメルカトール図法による展開画像である必要はない。
例えば、複数フレームのカメラ位置、カメラ回転及び複数の特徴点について、Levenberg-Marquardt法により最小自乗法の最適解を推定し、誤差を収束してカメラ位置、カメラ回転行列、特徴点の座標を求める。
さらに、誤差の分布が大きい特徴点につては削除し、他の特徴点に基づいて再演算することで、各特徴点及びカメラ位置での演算の精度を上げるようにする。
このようにして、特徴点の位置とカメラベクトルを精度良く求めることができる。
図15では、図13の画像1,2に示した特徴点1〜4の三次元座標と、画像1と画像2の間で移動するカメラベクトルが示されている。
図16及び図17は、充分に多くの特徴点とフレーム画像により得られた特徴点の位置と移動するカメラの位置が示されている。同図中、グラフ中央に直線状に連続する○印がカメラ位置であり、その周囲に位置する○印が特徴点の位置と高さを示している。
ここで、座標系分離記録再生装置1におけるカメラベクトル演算では、より高精度な特徴点とカメラ位置の三次元情報を高速に得るために、図19に示すように、カメラから特徴点の距離に応じて複数の特徴点を設定し、複数の演算を繰り返し行うことができる。
具体的には、カメラベクトル演算処理において、画像内には映像的に特徴がある特徴点を自動検出し、各フレーム画像内に特徴点の対応点を求める際に、カメラベクトル演算に用いるn番目とn+m番目の二つのフレーム画像FnとFn+mに着目して単位演算とし、nとmを適切に設定した単位演算を繰り返す。
mはフレーム間隔であり、カメラから画像内の特徴点までの距離によって特徴点を複数段に分類し、カメラから特徴点までの距離が遠いほどmが大きくなるように設定し、カメラから特徴点までの距離が近いほどmが小さくなるように設定する。このようにするのは、カメラから特徴点までの距離が遠ければ遠いほど、画像間における位置の変化が少ないからである。
このようにして、フレーム画像FnとFn+mに着目した単位演算を行うことにより、m枚毎にサンプリングした各フレーム間(フレーム間は駒落ちしている)では、長時間かけて精密カメラベクトルを演算し、フレーム画像FnとFn+mの間のm枚のフレーム(最小単位フレーム)では、短時間処理で行える簡易演算とすることができる。
これにより、誤差のない高精度のカメラベクトルを求めつつ、簡易演算を組み合わせることにより、演算処理を高速化することができるようになる。
さらに、より高精度のカメラベクトルを求めるために、三次元情報の追跡を行うことが好ましい。具体的には、まず、三次元情報追跡処理106で、カメラベクトル演算処理104,誤差最小化処理105を経て得られたカメラベクトルを概略のカメラベクトルと位置づけ、その後のプロセスで生成される画像の一部として得られる三次元情報に基づいて、複数のフレーム画像に含まれる部分的三次元情報を隣接するフレーム間で連続的に追跡して三次元形状の自動追跡を行う。
そして、この三次元情報追跡処理106で得られた三次元情報の追跡結果から、高精度カメラベクトル演算処理107が行われて、より高精度なカメラベクトルが求められる。
そして、以上のようにして求められたカメラベクトルは、揺れ成分検出処理108において、あらかじめ予定されたカメラ位置とカメラ姿勢を示す予定カメラベクトルとのズレ成分が抽出される。
揺れ成分検出処理108では、例えば、車載カメラを搭載した車両位置(すなわちカメラ位置)X,Y,Zと、車両回転姿勢(すなわちカメラ姿勢)Φx,Φy,Φzによる揺れ成分であるδX,δY,δZ,δΦx,δΦy,δΦzのすべてが評価の対象となる。ここで、δX,δY,δZ,δΦx,δΦy,δΦzとは、必ずしも微分値や差分値ではなく、予定の位置及び予定の姿勢からのズレを意味する。多くの場合は微分値で代用することで揺れ成分は検出できるが、予定の位置と予定の姿勢が前もって決まっていれば、それとの差分がδX,δY,δZ,δΦx,δΦy,δΦzとなる。
揺れ成分出力としては、X,Y,Z,Φx,Φy,Φzと、δX,δY,δZ,δΦx,δΦy,δΦzの計12個のパラメータを出力することができる。
但し、いずれの揺れ評価を目的とするかによって、パラメータの数はこの中から選択的に組み合わせることができ、評価対象物に対応することができる。
も含めて必要となる場合もあるので、得られる12個のパラメータの中から選択的に組み合わせて画像処理や姿勢制御に用いることができる。
なお、この12個の変数以外に、画像安定化や姿勢安定化に用いられる撮影条件による他の係数としては、カメラの基準姿勢として画像の画枠での揺れ幅制限などがある。
同図において、太線矢印はカメラを取り付けた車両の進行方向を示しており、カメラの光軸を原点とするカメラの位置と姿勢をカメラ座標系(Xc,Yc,Zc)とし(同図に示す破線)、カメラが半固定状態で取り付けられた車両は車両座標系(Xt,Yt,Zt)とし(同図に示す実線)、常に車両進行方向に座標軸を変える座標系を回転世界座標系(Xwr,Ywr,Zwr)とし(同図に示す2点鎖線)、さらに、外界の静止系を表す座標系を世界座標系(Xw,Yw,Zw)とする(同図に示す1点鎖線)。そして、この四つの座標系の関係を求めて、評価に必要な座標系に変換して車両の揺れが表現されるようになっている。
車両進行方向を車両座標系(Xt,Yt,Zt)の3軸の一つに選択することで揺れを評価するのにふさわしい座標系とすることができる。
揺れ評価にあたっては、揺れ評価に適した座標系で評価を行う。
揺れ信号は予定進路からのズレとして検出されるが、図19に示す例では、車両の平均進路を予定進路として揺れを評価している。そこで、世界座標系上でカメラの移動軌跡を求め、その平均進路を求め、これを予定進路とする。
評価される揺れとしては、位置ズレ成分Xt,Yt,Ztと、回転成分Φxt,Φyt,Φzt、及び位置ズレ差分δXt,δYt,δZt等である(但し、ZtとδZtは、進行方向速度及びその加速度成分となるので、揺れの意味が他の成分とは異なる)。
・世界座標系における車両位置表示:
(Xw,Yw,Zw)
・車両進行方向に回転した回転世界座標系における速度及び加速度表示:
(δXwr,δYwr,δZwr) (ΔδXwr,ΔδYwr,ΔδZwr)
・車両座標系における揺れ表示:
(△Xt,△Yt,(△Zt)) (△Φxt,△Φyt,△Φzt)
・車両座標系とカメラ座標系の回転表示(半固定):
(Xc,Yc,Zc)=F(Xt,Yt,Zt)
・世界座標系における進行方向表示:
(Xw,Yw,Zw)=G(Xt,Yt,Zt)
・カメラ座標系における進行方向表示:
(Xc,Yc,Zc)=H(Xt,Yt,Zt)
・世界座標系に対する車両座標系の原点移動、回転姿勢表示:
(Xw,Yw,Zw) (δXw,δYw,δZw)
そして、このような揺れ成分検出処理108を行うことにより、画像の安定化処理やカメラの位置姿勢安定化処理、さらには目的対象物のロックオン処理が実現できるようになる。
そして、分離・抽出された各座標系は三次元的に定義されるので、再構成された座標系は最終的に同一の三次元空間内に配置されることになる。
従って、最終画像は三次元画像となるが、二次元画像のまま各画素又は各画像ブロック単位を一次元の動きに分解して扱うことで、情報を整理することが可能となる。
また、明度や色の変化のない平坦な画像でも、画像を領域に分割することで、それぞれの三次元座標を取得することができ、再生画像として生成することができる。
次に、本発明の座標系分離記録再生装置の第二実施形態について、図22を参照して説明する。
図22は、本発明の第二実施形態に係る座標系分離記録再生装置1の概略構成を示すブロック図である。
同図に示す座標系分離記録再生装置1は、上述した第一実施形態にかかる座標系分離記録再生装置1(図1,図8及び図9参照)をより具体的に示すものであり、基本的な構成は同様である。
従って、同様の構成部分については同一の符号を付し、重複説明は省略する。
[座標系分解記録構成部10]
座標系分解記録構成部10は、動画像取得部11と、座標系検出部12と、座標系分離信号記録部13と、差分信号付加部14を備えている。
動画像取得部11では、画像取得装置11aにより、連続する複数のフレーム画像から構成されるビデオ映像等の動画像を取得する。取得するビデオ映像としては360度全周ビデオ画像や通常のビデオ画像等がある。
画像記憶装置11bでは、画像取得装置11aで取得された動画像をハードディスク等に一時的に記録する。
座標系検出部12では、画像対応装置12aにより、動画像取得部11で取得されたフレーム画像をブロック画像に分割し、各ブロック画像を隣接するフレームに追跡して対応点を求め、各ブロック画像の各フレームにおける対応関係を取得する。
座標系分解装置12bでは、各ブロック画像の対応関係から、各ブロック画像をそれらが所属する固有の座標系に分類して分解し、同時に画像内の各点又は各画像ブロックを、互いに関係づけられた複数の座標系の何れかに属するように分類し、各座標系に分解された座標系別分解画像信号を生成する。
座標系別カメラベクトル検出装置12cでは、カメラベクトルをフレーム単位で生成し、各ブロック画像の移動ベクトルを示す画像ブロック別一次元ベクトル信号を生成する。さらに、分解された座標系別にカメラ位置と姿勢の三次元的関係を示す座標系別カメラベクトル信号を生成する。
座標系分離信号記録部13では、記録装置13aに、生成された各信号、すなわち、座標系別分解画像信号,画像ブロック別ベクトル信号,座標系別カメラベクトル信号、更に後述する差分信号が画像圧縮信号として記録される(差分信号については後述)。
なお、ブロック画像単位の一次元ベクトルは、その大きさのみを信号とし、方向については後の処理でカメラベクトルから求められるので信号としては必要がない。
差分信号付加部14では、座標系合成再生構成部20の座標系分離信号再構築部22と同じ性能と機能を持つ画像再構築装置14aを前もって記録装置13a以前に用意する。そして、この画像再構成装置14aにおいて、フレーム画像の再構築を行う。
差分信号生成部14bでは、画像再構成装置14aで再構築された画像と元フレーム画像との差分を取り、その差分を差分信号として生成する。この差分信号をも記録すべき信号として記録装置13aに送り出し、記録する。
座標系合成再生構成部20は、座標系別信号再生部21と、座標系分離信号再構築部22と、再生解凍動画像出力部23を備えている。
[座標系別信号再生部21]
座標系別信号再生部21では、再生装置21aにおいて、座標系別分解画像信号と、画像ブロック別ベクトル信号と、座標系別カメラベクトル信号と、差分信号を再生する。
[座標系分離信号再構築部22]
座標系分離信号再構築部22では、画像再構成装置22aで、再生された座標系分解画像信号を指定された座標系に変換して画像を再構築する。そして、最後に差分信号で画像を補正することで、再構築画像が完成する。
このように、座標系分離信号再構築部22では、再生信号に加え差分信号をも再生して、画像再構成装置22aに差分信号を付加することで、より誤差の少ない画像を生成するようになっている。
[再生解凍動画像出力部23]
再生解凍動画像出力部23では、表示装置23aで、再構築画像を指定されたカメラ位置から見た各座標系に再構成し、再構成されたフレーム画像を連続的に並べて動画として連続表示することで、動画像を表示する。
これによって、本実施形態の座標系分離記録再生装置1でも、任意の動画像を対象物の座標系に分離し、かつ三次元に移動する対象物を一次元的に扱って解析することができ、動画像から短時間で三次元画像を抽出することが可能となり、元の動画像から大幅に圧縮された圧縮画像を再生することができる。
次に、本発明の座標系分離記録再生装置の第三実施形態について、図23及び図24を参照して説明する。
図23は、本発明の第三実施形態に係る座標系分離記録再生装置の座標系分解記録構成部10の概略構成を示すブロック図であり、図24は、同じく、本発明の第三実施形態に係る座標系分離記録再生装置の座標系合成再生構成部20の概略構成を示すブロック図である。
これらの図に示す座標系分離記録再生装置1は、上述した第一及び第二実施形態の変更実施形態であり、より正確なCV値(カメラベクトル)を求めるために、CV値の概略値を求めて画像処理を行い、画像を安定化させて再度精度の高いCV値を演算で求める二段構えとした座標系分離記録再生装置1の具体例である。
[画像取得装置210]
図23に示すように、座標系分解記録構成部10では、まず、画像取得装置210の画像取得部211でビデオ映像を取得する。
[画像記憶装置220]
取得された動画映像は、画像記憶装置220の画像記憶部221で、画像データとして記録・保存する。
[画像対応装置230]
記録された画像データは、画像対応装置230の画像分割部231で、微少領域に分割する。そして、分割された画像は、特徴点抽出・追跡部232で、領域の中から特徴点となり得る領域を選択して、隣接する複数のフレームに渡って追跡する。
次に、前処理装置240では、より正確なCV値を求めるための前処理が行われる。
まず、CV演算部241で、映像を取得したカメラ位置と姿勢を三次元的に取得する。次に、回転補正信号生成部242で、CV値からカメラの三次元姿勢の値(CV値)を取得し、回転補正信号を生成し、各フレームに対応させる。この回転補正信号は画像圧縮信号の一つとなる。
さらに、安定化画像のCV値取得部245で、安定化され、湧きだし点が固定された画像において、微少領域に分割した画像、あるいは、新たに任意面に展開又は球面に展開して分割した画像を、隣接するフレームに渡って特徴点を追跡して、まず、基本座標系(一般には静止座標系)におけるCV値を演算により取得する(CV演算は上述した図10〜図21及び該当説明を参照)。
再び、画像対応装置230に戻り、静止座標系ベクトル抽出部233で、任意平面に展開された画像を分割して、各画素もしくは、画像の微少領域の特徴点を抽出し、隣接するフレームに渡って追跡し、CV値から求められる静止座標系の湧きだし点に属するブロック画像を選択的に求める。
ベクトル内挿部234では、特徴点以外の分割画像を内挿により結合することで、静止座標系における既知のベクトルから未知のベクトルを求める。この段階で静止座標系については静止座標系に属する分割画像をすべて共通の湧きだし点から放射状に湧き出る一次元ベクトルで表現したことになる。また、静止座標系以外の座標系に属するブロック画像についても内挿し、座標系毎に一次元ベクトルで表現する。ただし、後の処理で差分信号により、精度を上げることができる。
全座標系信号生成部236では、各座標系毎に記録すべき信号を生成する。
フレーム間ベクトル近似部237では、連続するフレーム移動を直線と見なせる範囲内で直線近似する。このことで、各ブロックは同一方向のベクトルで表記できることになる。同一方向のベクトルは連続する一次元ベクトルと見なせるので、これによって画像の圧縮に貢献する。
次に、差分信号生成部250においては、画像再構築部251で、一旦ここまで得られた圧縮信号から画像を再構築する。
差分信号検出部252では、再画像再構築部251による構築画像と、元となる全フレーム画像と比較し、その差分を誤差とし、差分信号を得る。
次に、座標系分解装置260では、移動体検出部261で、差分信号生成部250で得られた差分信号の分布から、移動体の分布を予想し、移動体ベクトル分布から、移動体の位置を予想し、その予想ブロック画像群を上述した付加座標系抽出部235に送る。
また、移動体検出部261では、必要に応じて、移動体座標系に属する特徴点を抽出し、追跡し、移動座標系毎に一次元ベクトルで表現し、前記一次元ベクトルにより、隣接するフレーム画像を予想する。
フレームリセット信号生成部262では、一枚の基準画像で何枚のフレーム画像を再構築できるかを、差分信号の閾値により決定する。そして、差分信号が予め設定した閾値に達したときに画像若しくは画像の一部をリセットして、新たな基準画像を設定する。具体的には、フレームリセット信号生成部262は、誤差の蓄積、カメラ移動方向の変化等から基準フレーム画像信号を変更し、新しい基準フレーム画像信号に切り替えるタイミングを示す信号を生成・出力する。この信号を記録側再生側、若しくは送信側受信側で共有することで、正しい基準フレーム画像信号の切り替えを行うことができる。
記録装置270においては、生成された各信号が記録され、画像圧縮信号出力部271から、画像圧縮信号として出力され、画像再生側となる座標系合成再生構成部20に送信される。
なお、以上のような画像圧縮信号には、長期フレーム単位で記録するものと、単一フレーム単位で記録するものと、ブロック単位で記録するものとがある。
ブロック画像に係わる信号はブロック単位で記録しなければならないが、その他の信号については、圧縮率を可能な限り長期フレーム単位として記録することで、画像圧縮率を向上させることができるようになる。
[座標系別信号再生装置310]
図24に示すように、座標系合成再生構成部20では、まず、座標系別信号再生装置310の受信再生信号部311で、上述した画像圧縮信号出力部271から伝送される画像圧縮信号が受信され再生される。
受信再生信号部311で受信・再生される画像圧縮信号は、図24に示すように、以下のような信号が含まれる。
[静止座標系信号]
・静止座標系回転補正信号321a
・静止座標系ブロック画像信号321b
・静止座標系ブロックベクトル値信号321c
・静止座標系CV値信号321d
・静止座標系その他属性信号321e
・静止座標系差分信号321f
[移動体座標系信号]
・移動体座標系回転補正信号322a
・移動体座標系ブロック画像信号322b
・移動体座標系ブロックベクトル値信号322c
・移動体座標系CV値信号322d
・移動体座標系その他属性信号322e
・移動体座標系差分信号322f
座標系別信号再生装置320では、まず、静止座標系再構成画像信号部321で、上述した画像圧縮信号のうちの静止座標系の信号を、ブロック単位,単一フレーム単位又は長期フレーム単位で再構築して、静止座標系のフレーム画像を再構成する。
また、移動体再構成画像画像信号部322では、上記画像圧縮信号のうちの移動体座標系の信号を再構築して、移動系フレーム画像を再構築する。
そして、総合再構成画像生成部323で、静止座標系と移動体座標系の信号を合成して、動画画像を生成する。
再生解凍動画像出力装置330では、まず、総合再構成画像生成部323で生成された動画像が、記録部331で通常方式の動画像として記録される。
また、表示部332では、総合再構成画像生成部323で生成された動画像が表示される。
ここまでの処理を繰り返すことで、動画の画像圧縮を行い、それを再生する画像圧縮装置が構成されることになる。
三次元画像合成部334では、三次元変換部333で三次元化された各画像ブロックを三次元的に合成して三次元画像を取得し、それを表示装置332に出力・表示し、また、必要に応じて記録部331に記録することができる。
以上の三次元変換処理を連続的に繰り返すことで、ビデオ映像を連続的に三次元化することが可能となる。このように動画像を三次元化できることにより、動画は自由視点で観察できることになる。なお、この場合、視点を余りに大きく変更すると情報に抜けが出ることになるので、視点の移動は一定の範囲に限られたものとなる。
図25(a)は、再生解凍動画像出力装置330に備えられる視差画像生成部335及び立体視装置336の概略構成を示すブロック図である。
同図に示す視差画像生成部335及び立体視装置336は、立体視として画像を観察する場合に設けられる。
視差画像生成部335は、総合再構成画像生成部323で生成された動画像を、連続する複数の視差を持つ画像に分解する複数視点分解処理335aを行い、カメラ方向のみならず、任意の方向に対応する複数視差信号を生成する。
立体視装置336は、視差画像生成部335で生成された複数視差信号を処理し、複数視差信号の内の左右の両眼に対応する画像をそれぞれ両眼に与えることで、立体視ができる。
図25(b)に、立体視画像の概念を模式的に示す。
上述した本発明の各実施形態においては、カメラの設置台数を特に規定してはいないが、本発明の座標系分離記録再生装置は、原理的にはカメラは一台で実現することができる。
一台のカメラの場合は座標系がそれぞれ相対値となり、異なる座標間のスケールも相対値となり、各座標系の関係は未だ規定されていないことになるが、それであっても上述した動画像の圧縮・再生処理は有効に機能する。
例えば、風景にヘリコプターが飛んでいるような場合(図6〜7参照)、ヘリコプターの座標系は独立して決まるが、風景の静止座標系とのスケール関係は規定されないまま座標系が分離されて処理されるが、これは人間の日常の体験から言えることであって、例えば上空を飛ぶ飛行機は、近くを飛ぶ模型飛行機かそれとも遠くを飛ぶ本物の飛行機かの区別は、実際には人間にはできていない。これは、単に経験から判断する以外にない。
座標系を分離し、かつ、座標系間のスケールキャリブレーションを行うには、二台の同期したカメラによる映像を用いればよく、視差による情報を付加すれば、カメラからヘリコプターの距離が、静止座標系と同じスケールで計測されるので、正しく座標系を分離することができる。このようにすると、座標系分離だけで処理するよりも、スケールキャリブレーションをすることにより、精度を向上させることが可能となる。
なお、このように分離された座標系間のスケールキャリブレーションは、本発明にかかる画像圧縮を実施するためには必ずしも必須の条件ではないが、上述した動画像の三次元化処理をする場合には必須の条件となる。
10 座標系分解記録構成部
11 動画像取得部
12 座標系検出部
13 座標系分離信号記録部
14 差分信号付加部
20 座標系合成再生構成部
21 座標系別信号再生部
22 座標系分離信号再構築部
23 再生解凍動画像出力部
24 三次元画像生成部
Claims (6)
- 現実世界を構成する複数の座標系を検出し、座標系毎に対象物を記録する座標系分解記録構成部と、
前記記録された信号を再生し、各座標系毎に対象物を構築し、前記複数の座標系を合成して、現実世界をバーチャル世界に再構築する座標系合成再生構成部と、
を備えることを特徴とする座標系分離記録再生装置。 - 前記座標系分解記録構成部が、
複数のフレーム画像から構成される動画像を取得する動画像取得部と、
前記動画像取得部で取得された動画像を構成する複数のフレーム画像から基準フレーム画像を選択し、当該基準フレーム画像を分割し、分割された各領域が属する複数の座標系を検出し、前記動画像の全体に渡って画像を構成する複数の座標系を検出する座標系検出部と、
動画の進行とともに前記基準フレーム画像を適宜変更しながら選択し、選択された基準フレームを順次各領域に分割して分割画像信号を生成し、前記分割画像の各領域が前記複数の座標系のうちのいずれかの座標系に属するように特定して分類し、前記分割画像の各領域が属する座標系を特定する座標系特定信号を生成し、前記複数の座標系の間の関係と、各座標系に於ける三次元のカメラ位置と三次元のカメラ回転姿勢関係を示す座標系別カメラベクトル信号を生成し、前記基準フレーム画像に関する前記分割画像の各領域が動画像中を移動する量を検出して移動ベクトル信号を生成し、生成された前記各信号を画像圧縮信号として記録する座標系分離信号記録部と、を備え、
前記座標系合成再生構成部が、
前記座標系分離信号記録部で記録された信号を座標系別に読み取り、前記画像圧縮信号を再生する座標系別信号再生部と、
再生された前記各信号を座標系別に組み立てて各座標系画像を合成し、視点を決定して各フレーム画像を再構築する座標系分離信号再構築部と、
再構築された画像を指定された再生動画像として出力する再生解凍画像出力部と、を備える請求項1記載の座標系分離記録再生装置。 - 前記座標系分解記録構成部が、
前記座標系合成再生構成部と同様の前記座標系分離信号再構築部を備え、
当該座標系分離信号再構築部が、
前記各信号を一旦再生解凍をして各フレーム画像を再構築し、元画像である前記動画像を構成しているフレーム画像と比較して差分を取り、所定の差分信号を生成する差分信号付加部を構成する請求項2記載の座標系分離記録再生装置。 - 前記差分信号付加部が、
前記複数座標系において、静止座標系のみを採用し、全分割画像を静止座標系で表現し、移動体等の本来他の座標系に分類されるべき分割画像によって生じる誤差を前記差分信号として扱う請求項3記載の座標系分離記録再生装置。 - 前記座標系合成再生構成部が、
各座標系における各領域の一次元ベクトルと、前記各座標系におけるカメラベクトルとから、各領域の三次元座標を演算で求め、その作業を連続して行い、三次元動画像を生成する三次元画像生成部を備える請求項1乃至4のいずれかに記載の座標系分離記録再生装置。 - 前記座標系分解記録構成部が、
複数のカメラによる画像に基づいて、カメラ間の視差により各座標系における位置関係とスケール関係を規定する請求項1乃至5のいずれかに記載の座標系分離記録再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004364223A JP4502795B2 (ja) | 2004-12-16 | 2004-12-16 | 座標系分離記録再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004364223A JP4502795B2 (ja) | 2004-12-16 | 2004-12-16 | 座標系分離記録再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006172170A true JP2006172170A (ja) | 2006-06-29 |
JP4502795B2 JP4502795B2 (ja) | 2010-07-14 |
Family
ID=36672853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004364223A Active JP4502795B2 (ja) | 2004-12-16 | 2004-12-16 | 座標系分離記録再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4502795B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011191973A (ja) * | 2010-03-15 | 2011-09-29 | Fujifilm Corp | 動きベクトル計測装置および方法 |
JP2013025715A (ja) * | 2011-07-25 | 2013-02-04 | Sony Computer Entertainment Inc | 画像処理装置、画像処理方法、プログラム及び情報記憶媒体 |
CN107578002A (zh) * | 2017-08-28 | 2018-01-12 | 沈阳中科创达软件有限公司 | 一种车道线识别结果的监测方法、装置、设备和介质 |
JP2021192541A (ja) * | 2017-03-23 | 2021-12-16 | 株式会社Free−D | 動画変換システム、動画変換方法及び動画変換プログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7266208B2 (ja) | 2019-05-23 | 2023-04-28 | 株式会社岩根研究所 | 認識位置決め装置及び情報変換装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10255071A (ja) * | 1997-03-10 | 1998-09-25 | Iwane Kenkyusho:Kk | 画像処理システム |
JP2000295611A (ja) * | 1999-04-05 | 2000-10-20 | Iwane Kenkyusho:Kk | 情報変換システム |
WO2002001505A1 (fr) * | 2000-06-26 | 2002-01-03 | Iwane Laboratories, Ltd. | Systeme de conversion d'informations |
-
2004
- 2004-12-16 JP JP2004364223A patent/JP4502795B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10255071A (ja) * | 1997-03-10 | 1998-09-25 | Iwane Kenkyusho:Kk | 画像処理システム |
JP2000295611A (ja) * | 1999-04-05 | 2000-10-20 | Iwane Kenkyusho:Kk | 情報変換システム |
WO2002001505A1 (fr) * | 2000-06-26 | 2002-01-03 | Iwane Laboratories, Ltd. | Systeme de conversion d'informations |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011191973A (ja) * | 2010-03-15 | 2011-09-29 | Fujifilm Corp | 動きベクトル計測装置および方法 |
JP2013025715A (ja) * | 2011-07-25 | 2013-02-04 | Sony Computer Entertainment Inc | 画像処理装置、画像処理方法、プログラム及び情報記憶媒体 |
JP2021192541A (ja) * | 2017-03-23 | 2021-12-16 | 株式会社Free−D | 動画変換システム、動画変換方法及び動画変換プログラム |
CN107578002A (zh) * | 2017-08-28 | 2018-01-12 | 沈阳中科创达软件有限公司 | 一种车道线识别结果的监测方法、装置、设备和介质 |
CN107578002B (zh) * | 2017-08-28 | 2021-01-05 | 沈阳中科创达软件有限公司 | 一种车道线识别结果的监测方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4502795B2 (ja) | 2010-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11876948B2 (en) | Snapshots at predefined intervals or angles | |
US11024093B2 (en) | Live augmented reality guides | |
US10713851B2 (en) | Live augmented reality using tracking | |
US10484669B2 (en) | Inertial measurement unit progress estimation | |
JP6775776B2 (ja) | 自由視点移動表示装置 | |
JP4211292B2 (ja) | 画像処理装置および画像処理方法、プログラム並びにプログラム記録媒体 | |
US10789765B2 (en) | Three-dimensional reconstruction method | |
JP3975736B2 (ja) | 画像処理装置及び画像処理方法、記憶媒体、並びにコンピュータ・プログラム | |
US10687046B2 (en) | Trajectory smoother for generating multi-view interactive digital media representations | |
US12073574B2 (en) | Structuring visual data | |
JP5725953B2 (ja) | 撮像装置及びその制御方法、並びに情報処理装置 | |
KR20190126919A (ko) | 생성 장치, 생성 방법, 및 기억 매체 | |
JP2022523478A (ja) | マルチビュー視覚データからの損傷検出 | |
US20190297258A1 (en) | Conversion of an interactive multi-view image data set into a video | |
US11252398B2 (en) | Creating cinematic video from multi-view capture data | |
JP4272966B2 (ja) | 3dcg合成装置 | |
JP4403421B2 (ja) | 画像処理装置及び画像処理方法 | |
KR20190040746A (ko) | 3차원 관심영역 복원 시스템 및 방법 | |
D'Apuzzo | Surface measurement and tracking of human body parts from multi station video sequences | |
JP4502795B2 (ja) | 座標系分離記録再生装置 | |
Kanade et al. | Virtualized reality: perspectives on 4D digitization of dynamic events | |
US11615582B2 (en) | Enclosed multi-view visual media representation | |
US20210037230A1 (en) | Multiview interactive digital media representation inventory verification | |
WO2022266656A1 (en) | Viewpoint path modeling and stabilization | |
JP3663645B2 (ja) | 動画像処理装置とその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070621 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090616 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20090824 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091201 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20091201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100413 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4502795 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130430 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140430 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |