JP6853928B2 - 三次元動画像表示処理装置、並びにプログラム - Google Patents
三次元動画像表示処理装置、並びにプログラム Download PDFInfo
- Publication number
- JP6853928B2 JP6853928B2 JP2016220072A JP2016220072A JP6853928B2 JP 6853928 B2 JP6853928 B2 JP 6853928B2 JP 2016220072 A JP2016220072 A JP 2016220072A JP 2016220072 A JP2016220072 A JP 2016220072A JP 6853928 B2 JP6853928 B2 JP 6853928B2
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- information
- image
- display
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 125
- 238000000605 extraction Methods 0.000 claims description 100
- 230000015654 memory Effects 0.000 claims description 88
- 239000000284 extract Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 54
- 238000003384 imaging method Methods 0.000 description 53
- 230000002441 reversible effect Effects 0.000 description 31
- 238000004364 calculation method Methods 0.000 description 30
- 230000009471 action Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 27
- 210000001508 eye Anatomy 0.000 description 27
- 230000008569 process Effects 0.000 description 26
- 210000004556 brain Anatomy 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 18
- 230000004075 alteration Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 9
- 238000012937 correction Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 5
- 230000004438 eyesight Effects 0.000 description 4
- 230000009931 harmful effect Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000001356 surgical procedure Methods 0.000 description 3
- 230000003925 brain function Effects 0.000 description 2
- 210000005252 bulbus oculi Anatomy 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 241000226585 Antennaria plantaginifolia Species 0.000 description 1
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 206010047571 Visual impairment Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000004382 visual function Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/122—Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B30/00—Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images
- G02B30/20—Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images by providing first and second parallax images to an observer's left and right eyes
- G02B30/26—Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images by providing first and second parallax images to an observer's left and right eyes of the autostereoscopic type
- G02B30/27—Optical systems or apparatus for producing three-dimensional [3D] effects, e.g. stereoscopic images by providing first and second parallax images to an observer's left and right eyes of the autostereoscopic type involving lenticular arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/128—Adjusting depth or disparity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/139—Format conversion, e.g. of frame-rate or size
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/282—Image signal generators for generating image signals corresponding to three or more geometrical viewpoints, e.g. multi-view systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/275—Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals
- H04N13/279—Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals the virtual viewpoint locations being selected by the viewers or determined by tracking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N2013/0074—Stereoscopic image analysis
- H04N2013/0081—Depth or disparity estimation from stereoscopic image signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Optics & Photonics (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Image Analysis (AREA)
Description
詳しくは、時系列に連続的に供給される少なくとも2系列の画像を得て、これらの画像のうちひとつを主たる表示画像とする一方、ステレオ画像表示をするために必要な奥行きを把握するための演算では、画素を間引いて高速化を図るとともに、画素を採る位置を工夫することで、原動画における高い解像度を維持しつつ、奥行き推定演算における2画像の微少な偏位を鋭敏に処理結果に反映させることができる表示処理装置に関する。
近時、所謂ステレオ・ビューについて、様々なアプローチがされている。ステレオ・ビューは一般に、近隣に設置した少なくとも2つのカメラで同時に撮影した画像に対してコンピュータで処理を行い、これをディスプレイ装置によって観者に見せる際、観者の右目・左目にそれぞれ微妙に異なる画像として看取させることによって、カメラ被写体を立体的に表示させるようになっている。
ステレオ・ビューを実現するには、用途によって、
[A] 近時の映画やゲームに多く採用されているように、オブジェクト(有体物)をコンピュータ内でモデル化し、これから観者視点の画像を生成して表示するアプローチ
[B] 視差ある複数のカメラでオブジェクト(有体物)を撮像し、各カメラが撮像した画像間の微妙な違いから奥行きを推定し、これに基づいて観者に対する表示を修正するアプローチ
[C] 前ふたつの技術を融合したアプローチ
による技術に大別できる。本発明は、このうち[B]のアプローチに属するものである。
視差有る複数のカメラで撮像した画像に基づいて奥行きを推定する発明には、例えば、特許文献1のような提案がある。
(1) 解像度の異なるカメラを用いると、形状も画一的でなく、機械な位置決めが難しくなること、
(2) 同一の撮像素子を用いるよりも製造工程が複雑化すること、
などの憾みがある。
しかし、DPマッチングの演算は並行処理をするのに馴染まず、並列スレッド処理をすることができるCPUを用いても、その処理はシーケンシャルに行う必要がある。このため、DPマッチング処理を二段階で行うとなると、相当のCPUの能力が必要になるという憾みがある。
課題を解決するための手段の説明に先立ち、説明の便宜上、本願明細書における文言を以下のように定義する。
p(i-1,j-1)、 p(i-1,j)、 p(i-1,j+1)、
p(i-1,j) 、p(i+1,j)、
p(i+1,j-1)、 p(i+1,j)、 p(i+1,j+1)
の8つの画素は、「それぞれが離散的となる画素」ではない。
本願発明は上記課題の低減を図るものであり、その目的とするところは、動画について、人間のもつ視覚(脳の機能も含む)の補完力と、見たオブジェクトを脳内で再構成する力との助けを借りて、DPマッチングを用いつつも、簡便で安定した動画像の立体視を実現する三次元動画像表示処理装置等を提供するものである。
ここで、所謂ステレオ・ビューの着想背景に戻って説明する。
請求項1の三次元動画像表示処理装置に係る発明は、第1の動画情報(102)と、第2の動画情報(103)とを入力し、これを処理することでディスプレイ(111)に対して三次元画像を表示させる三次元動画像表示処理装置に係る。
また、間引くことによって、その後の計算対象となる画素数を減少させるように作用する。
請求項2の三次元動画像表示処理装置に係る発明は、前記オフセット加算部において、更に、第1の動画情報の視点中心と第2の画像情報の視点中心とを結ぶ線分の方向を成分に有するベクトル(以下、「カメラ位置相対関係ベクトル」という。)に基づく要素を含める。
請求項3の三次元動画像表示処理装置に係る発明は、ルック・アップ・テーブルを使ったオフセット加算部でオフセットを加えるようになっている。この際、離散基準読出位置決定部を具備する。
ここで、第1の動画情報と第2の動画情報については、フレーム・メモリに入力した動画情報のうち、ルック・アップ・テーブルによって指定されて読み出されたものを「動画情報」として扱うようになっている。オフセットが付加されることにより、歪み補正における長さの伸張があっても、これと同じ伸張がある動画情報を処理できるように作用する。
請求項4は、請求項1から請求項3に係る三次元動画像表示処理装置をコンピュータによって実現する場合に用いるプログラムに係るものであり、その説明は前記請求項1から請求項3の記載に同じである。
-------------[目次]-------------
(1. 本発明に係る各実施の形態に渡って共通する事項)
(1.1. 「左」「右」について)
(1.2. 共通する構成上の特徴)
(1.2.1. 表示の際の主画像)
(1.2.2. 奥行き推定で利用する画像)
(1.3. 各実施の形態に係る影響低減目的)
(2. 第1の実施の形態)
(2.1. 入力する動画情報)
(2.2. ディスプレイ)
(2.3. フレーム・メモリ)
(2.4. 間引き画像抽出部)
(2.4.1. 基準アドレス決定部)
(2.4.2. オフセット加算部)
(2.4.3. 間引画素決定・抽出部)
(2.5. DPマッチング処理部)
(2.5.1. DPマッチング処理の概要)
(2.5.2. DPマッチング処理における縦方向のズレの影響)
(2.5.3. DPマッチング処理における横方向のズレの影響)
(2.5.4. 逆方向探索が必要なDPマッチング処理の弊害)
(2.5.5. 本実施の形態における逆方向探索回避の技法)
(2.6. 表示情報生成部)
(2.7. 第1の実施の形態の動作)
(3. 第2の実施の形態)
(3.1. オフセット加算部)
(3.1.1. オフセット加算の背景と意義)
(3.1.2. オフセット加算部周辺構成)
(3.2. DPマッチング処理部)
(3.3. 第2の実施の形態の動作)
(4. 第3の実施の形態)
(4.1. オフセット加算部)
(4.1.1. オフセット加算の背景と意義)
(4.1.2. オフセット加算部周辺構成)
(4.2. DPマッチング処理部)
(4.3. 第3の実施の形態の動作)
(5. 第4の実施の形態)
(5.1. オフセット加算部)
(5.1.1. ルック・アップ・テーブル実装の背景と意義)
(5.1.2. ルック・アップ・テーブルを用いたオフセット加算部構成)
(5.2. DPマッチング処理部)
(5.3. 第4の実施の形態の動作)
(6. 動画情報を記録する媒体)
(7. 動画情報を記録するサーバ)
(7.1. サーバの構成概要)
(7.2. サーバの情報記録)
(8. その他)
(8.1. コンピュータにプログラムを実装して動作させる場合)
(8.2. アライメント誤差についてのキャリブレーション手法の提案)
(8.3. 脳疲労対策について)
(9. 前記実施の形態と発明特定事項との対応)
(1. 本発明に係る各実施の形態に渡って共通する事項)
はじめに、本発明に係る各実施の形態に共通する事項について触れる。
本発明は、撮像系を構成するカメラについて、これを水平面に配置するかどうかは問わない。もっとも、一般的には、観者はディスプレイを普段生活をしているのと同じ環境で見ることが殆どである。このため、本実施の形態の説明においては、理解容易のために、撮像系を構成する2つのカメラは水平面に配置されたものと仮定して、それぞれを「左」「右」と表現する。従って、実施にあたっては、撮像系を構成するカメラが水平になっていることに限られるわけではない。
(1.2.1. 表示の際の主画像)
本実施の形態についてはいずれも、撮像系から得られた動画情報のうち、左右いずれか一方の動画情報をほぼそのままディスプレイで利用する。即ち、画素間での演算を経ず、実質的に解像度を落とすことなくディスプレイ上に表現されるようになっている。
本実施の形態ではいずれも、撮像系から得られた動画情報のうち、左右2つの動画情報を奥行き推定に利用する。もっとも、奥行き推定には、撮像系から得られた解像度を維持した画像を用いるのではない。所定の間隔毎にサンプリングした結果である間引いた画像から奥行き推定をするのである。
次に、本実施の形態の構成について図2乃至図3を用いて説明する。図2は、本実施の形態における構成図である。また、図3は、DPコストパスの概念を示した図である。なお、機能上の説明をするにあたり、図1に触れる場合がある。また、視差の説明をするにあたり、図15に触れる場合がある。
(2.1. 入力する動画情報)
左動画情報(214)と右動画情報(215)とは、それぞれ動画情報である。そして、左動画情報(214)と右動画情報(215)とは視差をもった画像で同時に撮像されたものであり、かつ概ね同解像度となっている。
画像表示処理部(201)が処理した結果である三次元の表示情報は、これに接続したディスプレイに出力して、観者に看取させることができる。
フレーム・メモリは、入力した動画像情報を少なくとも1フレーム分記録するとともに、指定した場所(アドレス)の画素を読み出すことができるようになっている。
もっとも、指定アドレスの読出しは、連続して大きく離れた位置をアクセスすることはなく、高々数列離れたデータをアクセスする程度に止まる。従って、指定アドレスを読出すといっても、実験的には便利ではあるが、完全なランダムアクセスができるものである必要はない。シフトレジスタを数段シリーズに繋げたストリームラインバッファの態様で実装することも可能である。
次に間引き画像処理部について説明する。本実施の形態では、左間引き画像抽出部(204)と右間引き画像抽出部(205)とを実装する。
基準アドレス決定部(220)は、左右の間引き画像抽出部が奥行き推定に利用する画素をフレーム・メモリから取得するにあたり、その基準読出位置を生成して決定するようになっている。また、基準アドレス決定部(220)は、2D映像情報の基礎となる情報を左フレーム・メモリから読み出す際の場所(画素)指定アドレスとすることができるようになっている。
オフセット加算部(106)は、基準アドレス決定部(220)で決定した読出し場所について、所定のオフセットを加える。オフセット値をどのように採るかによって、効果が大きく異なる。
第1の実施の形態においては、水平側に正とする定数をオフセット値とする。
左間引画素決定・抽出部(224)は、左動画情報(214)を記録した左フレーム・メモリ(216)から、間引き画像を抽出する。同様に、右間引画素決定・抽出部(225)は、右動画情報(215)を記録した右フレーム・メモリ(217)から、間引き画像を抽出する。
いずれも、前記基準アドレス決定部(220)によって決定された基準読出位置が間引き処理により抽出すべき画素のアドレスとなったときに、その画素位置で各フレーム・メモリから対応する画素を取り出すようになっている。
この際、読出アドレスは、オフセット加算部(218,219)に渡され、所定のオフセットが加えられた上で、決せられる。
DPマッチング処理部(209)は、左右の間引き画像抽出部(204,205)から間引後画像を取得して、原則として同一高さの走査線同士で動的計画法に基づくパターンマッチング処理を行い、対応する画素の僅かな左右の偏差を検出するようになっている。そしてその結果を奥行き推定情報として後段の表示情報生成部(221)に渡すようになっている。
処理内容について、図3を用いてより具体的に説明する。図3は、DPコストパスの概念図である。
ステレオ・ビューは左右の画像で撮像したオブジェクトの同一部分が左右で偏位していることによってディスプレイ観者に立体感を生む。
ここで、DPマッチング処理における縦方向のズレの影響について考察する。
たとえば、取り付け精度などの影響で、左カメラで撮影した画像と、右カメラで撮影した画像とで垂直方向にズレが生じているとする。具体的には、左カメラが右カメラより高い位置に設置されていたとする。
DPマッチング処理における横方向のズレの影響について考察する。
通常、横方向のズレが生じているとき、スタートポイントでズレが生じたときには、コストパスは順停進を続けるか、停順進を続けるかを繰り返すことで、マッチングをすることになる。しかし、場面によってはコストが大きくなりすぎ、マッチングに失敗する虞がある。
この点について、図15を用いて説明する。図15は、順視差・逆視差にあるオブジェクトをディスプレイ上で表示すべき位置関係図である。
この点、上記のような場面で逆進を許すということは、パス候補を、起点2(333-0)から選ぶ場合、水平方向(333-3)、垂直方向(333-1)に加え、斜め左下方向(333-2)に辿ることを意味する。加えて斜め左上方向のパスを加えることも考えられないではない。
しかしこれには大きな弊害がある。即ち、探索方向が増えるに従って、考えられるパスは飛躍的に増大する。また、そもそもDPアルゴリズムの趣旨から逸脱する。
これでは実時間で処理しなければならない動画の処理に耐えられない。
本実施の形態では、右間引後画像の読み込みに際し、その読出し位置をオフセット加算部により意図的にずらしている。
表示情報生成部(221)は、DPマッチング処理部で得られた奥行き推定情報と左の動画情報とに基づいてレンチキュラーレンズ型のディスプレイ(222)に表示可能なフォーマットに整える。具体的には、左フレーム・メモリの内容と奥行き推定情報とから、2D映像(230)とデプスマップ映像(229)とに変換して出力するようになっている。
次に、本実施の形態を動画情報の流れの観点から説明する。
デジタルで記録された記録媒体、デジタル動画を配信する情報配信サーバ、ステレオ・カメラなどから得られた左右の動画情報(214,215)は一旦、左右のフレーム・メモリ(216,217)に蓄えられる。
そして読み出された間引後画像に基づいてDPマッチング処理により奥行きが推定される。
次に第2の実施の形態について、図4乃至図6を用いて説明する。
第2の実施の形態は、カメラの取り付け精度に難があり、アライメントズレが生じているような撮像系のものでも正しく奥行き推定をできるように、前記第1の形態におけるオフセット加算部周辺を変更したものとなっている。
具体的には、第1の実施の形態における基準アドレス決定部(220)、両オフセット加算部(218,219)、並びに間引画素決定・抽出部(224,225)に変更を加える。ここでは変更部分について触れ、共通する部分の説明を割愛する。
(3.1.1. オフセット加算の背景と意義)
ペナルティ・マトリックスを用いて奥行き推定をするにあたり、左右の処理対象画像間での縦方向のズレに影響を与えるものに、撮像系を構成する左右のカメラの取付け加工精度に起因するものがある。
一方、現実の実装をする上で、取り付け精度を向上させることはコストアップの原因ともなるので、最終商品との関係で合目的的な精度でも効果的な対策が望まれるわけである。
本実施の形態では、上記オフセット発生の背景事情に対処する。以下、図4を用いて説明する。図4は、第2の実施の形態における間引き抽出部周辺の構成図である。
本実施の形態においてDPマッチング処理部には第1の実施の形態から特に変更すべきところはない。
以上の構成を採る本実施の形態の動作を、図5と図6とを用いて説明する。図5は、第2実施の形態におけるオフセット状況発生例説明図である。図6は、第2の実施の形態における間引き作用例説明図である。
しかし、
(1)視差をつくることで立体的オブジェクトを脳に再構成させるという方式上の特徴、
(2)並びに、奥行き情報は像として表われる複数のオブジェクトの相対的な前後関係が重要なのであって、奥行きの絶対値を演算できることはあまり意味がないという、実質的な特徴、
などを考慮すると、横方向のアライメントズレは無視しうるものである。よって横方向のオフセット加算で重要なのは第1の実施の形態の説明でも指摘したとおり、逆視差によるDPマッチング処理エラーを低減することにある。よって、横方向のオフセットについては、第1の実施の形態において指摘した視点で設定することになる。
左右で得られた動画情報(602,603)は間引き画像抽出部(605,606)を経て左右の間引後画像(626,627)となる。この際、オフセット加算の作用によって、原動画情報が離散的に抽出され、左と右の原画像に対して図中黒点で示した画素(612,613)が得られる。これらはDPマッチング処理、表示情報生成処理を介してディスプレイに出力されることになる。
次に第3の実施の形態について、図7〜図9を用いて説明する。
第3の実施の形態は、前記第2の実施の形態と同じく、カメラの取り付け精度に難があり、アライメントズレが生じているような撮像系のものでも正しく奥行き推定をできるようにオフセット加算部周辺を変更したものとなっている。もっとも、第2の実施の形態と異なり、アライメントに傾き成分がある場合も考慮している。より正しくは、撮像系のカメラの撮像面に対して法線方向を軸とする回転方向のアライメント誤差を考慮している。
本実施の形態は、構成上第2の実施の形態と概ね同様となるが、オフセット決定部周辺の構成・動作が異なる。
ペナルティ・マトリックスを用いて奥行き推定をする上で、左右の処理対象画像間での縦方向のズレの影響を与えるものに、カメラの傾きに起因するものがある。
第3の実施の形態は、左右カメラの取り付け精度由来のアライメント誤差のうち、カメラの傾き方向を意識して、これに対処する。この場合、画像中心より周辺に拡がるに従って縦方向のズレが拡大することになる。本実施の形態では、このような縦方向のズレへの対処を図っている。
本実施の形態も前記第2の実施の形態と同じく、縦方向のずれに対処するものである。もっとも、本実施の形態が対処しようとしているズレは周辺に向かうに従って次第に拡がるものであるから、前記第2の実施の形態のように定数を加えるだけでは足りない。
この点、単純に横方向に数画素進んだときに1画素分縦方向にオフセットを加える(または減ずる)というカウンタ型のオフセット加算をする手法が考えられる。
しかしこの技法には難がある。即ち、左の動画情報ではn画素進んだときの移動距離は単にnであるが、これに対応する右の動画情報ではSQRT(n×n+1)分の長さを進むことになる。僅かな左右の違いで立体を感じさせる本表示処理装置において、この差は致命傷になりかねない憾みがある。
本実施の形態では、上記オフセット発生の背景事情に対処する。以下、図7を用いて説明する。図7は、第3の実施の形態における間引き抽出部周辺の構成図である。
この際、左のオフセット決定部と右のオフセット決定部によって決定されるオフセットは、抽象的に完全水平である基礎アドレスに対して所定の傾きを持つことになるが、その傾きは、正負の差こそあれども、左右で同一値になるようになっている。
本実施の形態においてDPマッチング処理部には第1の実施の形態から特に変更すべきところはない。
第3の実施の形態の動作について、図8と図9を用いて説明する。図8は、第3の実施の形態におけるオフセット状況発生例説明図である。また、図9は第3の実施の形態における間引き作用例説明図である。
次に第4の実施の形態について、図10〜図13を用いて説明する。
第4の実施の形態は、前2形態と同様に、撮像した画像に難があるものでも正しく奥行き推定をできるようにオフセット加算部周辺を変更したものとなっている。もっとも、第2・第3の実施の形態と異なり、アライメントに起因する誤差ばかりでなく、レンズ収差による画像の歪みにも配慮している。
ペナルティ・マトリックスを用いて奥行き推定をする上で、左右の処理対象画像間での縦方向のズレの影響を与えるものに、レンズ歪みに起因するものがある。
レンズ収差が作用するとオブジェクト像の直線が湾曲するような歪みとなって現れる。第4の実施の形態は、このような歪みへの対処を図っている。即ち、本実施の形態では、これまで示してきた撮像系のアライメント誤差等に加え、上記レンズ収差など、全ての事情による不都合性に対処する。もっとも、この実施の形態では製造コストも高まるが、三次元表示の内容・目的・表示画像の大きさ・動体速度・表示態様などを総合的に考慮して、いずれの実施の形態を採用するのがよいかを判断すればよい。
撮像系は、ピンホールカメラ等のレンズを有しない特別な場合を除き、レンズを通して撮像することになる。この際、そのレンズの形状等の影響を受け、撮像対象となるオブジェクトはレンズ位置を境にその反対側におかれた撮像面で、同じ形状とはならず若干歪んだものとなる。この状況は図10に示したように、撮像対象のオブジェクトが平面であっても、樽型湾曲と呼ばれるような中央が膨脹するような歪み(図中(d)参照)を生じたり、糸巻型湾曲と呼ばれるような中央に向かって周囲が湾曲するような歪み(図示しない)を生じたりすることがある。このような場合には、望ましい右動画情報例(図中の(b))のような画像は得られず、周囲が湾曲した画像(図中の(c))が得られることになる。これでは、対象となる左動画情報(図中(a))との間で縦方向の不一致を生じてしまうことになる。
オフセット加算部について、図11を用いて説明する。図11は、第4の実施の形態における間引き抽出部周辺の構成図である。
また、左ルック・アップ・テーブル(1161)は、縦横インデックスカウンタが所定の間引抽出画素を示すアドレスになったときに、その旨を検出して別途左フレーム・メモリ(1116)の記録画像から該当する読出しアドレスの画素を抽出できるようになっている。
また、右ルック・アップ・テーブル(1163)も、縦横インデックスカウンタが所定の間引抽出画素を示すアドレスになったときに、その旨を検出して別途右フレーム・メモリ(1117)の記録画像から該当する読出しアドレスの画素を抽出できるようになっている。
本実施の形態においてもDPマッチング処理部には第3の実施の形態から特に変更すべきところはない。唯一間引後画像の原動画情報上の位置がオフセット加算等の演算に基づくのではなく、ルック・アップ・テーブル(1161,1162)によって決まったものである点のみが異なる。
第4の実施の形態の動作について、図12、及び図13を用いて説明する。図12は第4の実施の形態における動画情報に着目した間引き作用例説明図である。図13は、図12と概ね同様であるが、前記構成に着目した基準アドレス変換状況説明図である。
なお、図12と図13では、レンズ収差による樽型湾曲が生じた例を示している。
縦横インデックスカウンタ(1141,1142)で示された基準読出位置(1320)は、左右のルック・アップ・テーブル(1361,1362)で変換元アドレスとして参照される。左右フレーム・メモリのアクセスは画像情報を書き込む場面を除き、全てこれらルック・アップ・テーブルによって変換されたアドレスで読み出される。特に左フレーム・メモリから得られた動画情報は図示しない表示情報生成部でディスプレイに合わせた規格の動画情報に変換されていく。
以上のように、基準読出位置(1320)は、動画情報のフレーム・メモリへの記録の場面を除き、左右のルック・アップ・テーブル(1361,1362)に対して直接読出しアクセスアドレスをして使われることはない点が本実施の形態における特徴となっている。
以上までで三次元動画像表示処理装置についての説明を終えるが、この装置の利用に供する動画情報記録媒体について簡単に触れる。
具体的には、以下の通りである。
動画情報記録媒体について、変換データ等を動画情報に対応して記録しておくのは前述のとおりであるが、これと同様に、クラウド上に記録した動画情報を保管する場合についても同様に変換データ等を紐付けて記録し、要求に応じてこれを配信するという手法も採りうる。
各実施の形態によって如何なる変換データ等を配信すればよいかは、上記動画情報記録媒体と同じ状況なので、説明を省略する。
サーバとしては、通常のhttp乃至httpsのプロトコルを処理できるものであれば足りる。たとえば、「ジ アパッチ ソフトウェア ファウンデイション」が統括する「APACHE(登録商標)」サーバを用いればよい。
サーバに記録するデータも、前記動画情報記録媒体とかわるところはない。
ひとつの動画情報を要求するhttpリクエストに対してレスポンスする動画情報のなかに重ねあわせておいて、クライアント側でこれを分離するようにする手法でも、別のリクエストに対して、変換データ等をレスポンスするようにしても構わない。
(8. その他)
以下、上記各実施の形態において説明しきれていない点について簡単に触れておく。
各実施の形態についてコンピュータに画像表示処理装置として機能させるためには、各機能を実装させるプログラムをデプロイすればよい。
次に、各実施の形態における変換データ等のキャリブレーションについて簡単に触れる。
第1乃至第3の実施の形態において、オフセット値は僅かな情報量なので、簡単にキャリブレーション用のオブジェクトを撮像しながら適切なオフセット値を決定すればよい。
ところで、三次元画像は、両目から入ってくる微妙に異なる視差有る画像に基づいて立体物を構成する、無意識の脳の作用を利用するのであるから、人が長時間これを見続けると、脳に疲労が生じることも想像できなくはない。このため、本実施の形態に係る装置におけるDPマッチング処理部において得られた奥行き推定値を所定の比率で縮小するなどし、視差を縮小して脳の作用を軽減させ、疲労に対する緩和を図ることは可能である。
ここでは、本願発明について請求項に用いた文言と、実施の形態において用いた文言との対応関係に触れる。この点、これまで述べてきた発明を実施するための形態の説明では、理解容易の観点で用語を選択しているので、それが一般社会的な意味と異なる場合であっても、請求項に用いた文言を制限する趣旨ではないことは勿論である。また、同一の文言を用いている場合には、そのまま対応関係を維持する。
第1の実施の形態では、基準アドレス決定部(220)、オフセット加算部(218,219)、間引画素決定部・抽出部(224,225)の総体に相当する。
第2の実施の形態では、縦横インデックスカウンタ(441,442)、オフセット決定部(443)、基礎アドレス計算部(444)の総体に相当する。
第3の実施の形態では、縦横インデックスカウンタ(741,742)、オフセット決定部(741-1,741-2)、基礎アドレス計算部(744)、アドレス加算部(745-1,745-2)の総体に相当する。
第4の実施の形態では、縦横インデックスカウンタ(1141,1142)、ルック・アップ・テーブル(1161,1162)の総体に相当する。
101 画像表示処理部
102 第1の動画情報
103 第2の動画情報
104 第1の間引き画像抽出部
105 第2の間引き画像抽出部
106 オフセット加算部
109 DPマッチング処理部
110 表示情報生成部
111 ディスプレイ
112 第1の間引後画像
113 第2の間引後画像
204 左間引き画像抽出部
205 右間引き画像抽出部
209 DPマッチング処理部
214 左-動画情報
215 右-動画情報
216 左フレーム・メモリ
217 右フレーム・メモリ
218 左オフセット加算部
219 右オフセット加算部
220 基準アドレス決定部
221 表示情報生成部
222 レンチキュラーレンズ型ディスプレイ
224 左間引画素決定・抽出部
225 右間引画素決定・抽出部
226 左-間引後画像
227 右-間引後画像
229 デプスマップ映像
230 2D映像
332 コストパス
333-0 起点1
333-1 停逆進パス
333-2 逆逆進パス
333-3 逆停進パス
334-0 起点2
334-1 停順進パス
334-2 順順進パス
334-3 順停進パス
416 左フレーム・メモリ
417 右フレーム・メモリ
441 縦インデックスカウンタ
442 横インデックスカウンタ
443 オフセット計算部
444 基礎アドレス計算部
445 アドレス加算部
551 望ましい右動画情報例
552 現実の右動画情報例
553 現実との差分(横成分)
554 現実との差分(縦成分)
602 左-動画情報
603 右-動画情報
604 左-間引画像抽出処理
605 右-間引画像抽出処理
612 左-動画情報からの抽出位置例
613 右-動画情報からの抽出位置例
716 左フレーム・メモリ
717 右フレーム・メモリ
741 縦インデックスカウンタ
742 横インデックスカウンタ
743-1 左オフセット決定部
743-2 右オフセット決定部
744 基礎アドレス計算部
745-1 左アドレス加算部
745-2 右アドレス加算部
851 望ましい右動画情報例
852 現実の右動画情報例
855 カメラアライメント誤差根拠
902 左-動画情報
903 右-動画情報
904 左-間引画像抽出処理
905 右-間引画像抽出処理
912 左-動画情報からの抽出位置例
913 右-動画情報からの抽出位置例
956 右-動画情報からの抽出による誤差修正方向例
1057-1 左ルック・アップ・テーブル
1057-2 右ルック・アップ・テーブル
1058-1 左変換アドレス読出部
1058-2 右変換アドレス読出部
1016 左フレーム・メモリ
1017 右フレーム・メモリ
1202 左動画情報
1203 右動画情報
1204 左間引き画像抽出処理
1205 右間引き画像抽出処理
1212 左間引き抽出画素
1213 右間引き抽出画素
1265 左収差補正軌跡例
1266 右収差補正軌跡例
1304 左間引き画像抽出処理
1305 右間引き画像抽出処理
1316 左フレーム・メモリ
1318 オフセット加算部
1319 オフセット加算部
1320 基準アドレス
1321 表示情報生成部
1471 抽出位置指示ポイント1
1472 抽出位置指示ポイント2
1473 白地
1474 抽出位置指示ポイント3
1474 形状の異なる抽出位置指示ポイント
1576 オブジェクトB
1577 ディスプレイ
1578 オブジェクトA
1579 眼球位置
1580 オブジェクトAB間位置差分
1580 オブジェクトAB間位置差分
1580 左眼側オブジェクトAB間位置差分
1580 右眼側オブジェクトAB間位置差分
Claims (4)
- 第1の動画情報と、第1の動画情報とは視差ある位置で同時に撮像され、概ね同解像度である第2の動画情報とを入力し、これらを処理することでディスプレイに対して三次元画像を表示させる三次元動画像表示処理装置において、
第1の動画情報を構成する画素についてそれぞれが離散的な位置を特定し、第1の動画情報から該特定位置の画素を抽出する第1の間引き画像抽出部と、
第1間引位置画像抽出部が特定した位置に対応する位置であって、第2の動画情報を構成する画素についてそれぞれが離散的となる位置を特定し、第2の動画情報から該特定位置の画素を抽出する第2の間引き画像抽出部と、
第1の動画情報の視点中心と第2の画像情報の視点中心とを結ぶ線分の方向をマッチング走査方向とし、第1の間引き画像抽出部と第2の間引き画像抽出部とで抽出された画素について、DPマッチングによって奥行き予測情報を得るDPマッチング処理部と、
第1の間引き画像抽出部若しくは第2の間引き画像抽出部で特定する位置について、該動画情報を生成したカメラの相対的位置に基づいて決められたオフセットを加算するオフセット加算部と、
第1の動画情報と第2の動画情報のいずれかの動画情報と、該DPマッチング処理部より得た奥行き情報とにより該ディスプレイに対する映像表示情報を生成する、表示情報生成部と、
を具備することを特徴とする三次元動画像表示処理装置。 - 前記オフセット加算部は更に、第1の動画情報の視点中心と第2の画像情報の視点中心とを結ぶ線分の方向を成分に有するベクトルに基づくオフセットを加えることを特徴とする、請求項1に記載の三次元動画像表示処理装置。
- 第1の動画情報と、第1の動画情報とは視差ある位置で同時に撮像され、概ね同解像度である第2の動画情報とを入力し、これらを処理することでディスプレイに対して三次元画像を表示させる三次元動画像表示処理装置において、
順次離散的な位置を特定する離散基準読出位置決定部と、
第1の動画情報を記録する第1フレーム・メモリと、該離散基準読出位置決定部の示す読出し位置と第1フレーム・メモリの読出位置とを対応付ける第1ルック・アップ・テーブルと、を具備し、第1ルック・アップ・テーブルで参照される位置の画素を第1フレーム・メモリから抽出する第1の間引き画像抽出部と、
第2の動画情報を記録する第2フレーム・メモリと、該離散基準読出位置決定部の示す読出し位置と第2フレーム・メモリの読出位置とを対応付ける第2ルック・アップ・テーブルと、を具備し、第2ルック・アップ・テーブルで参照される位置の画素を第2フレーム・メモリから抽出する第2の間引き画像抽出部と、
第1の動画情報の視点中心と第2の画像情報の視点中心とを結ぶ線分の方向をマッチング走査方向とし、第1の間引き画像抽出部と第2の間引き画像抽出部とで抽出された画素について、DPマッチングによって奥行き予測情報を得るDPマッチング処理部と、
第1のフレーム・メモリから第1ルック・アップ・テーブルを用いて読み出された動画情報、若しくは第2のフレーム・メモリから第2ルック・アップ・テーブルを用いて読み出された動画情報のいずれかの動画情報と、該DPマッチング処理部より得た奥行き情報とにより該ディスプレイに対する映像表示情報を生成する表示情報生成部と、
を具備することを特徴とする三次元動画像表示処理装置。 - コンピュータに、請求項1乃至請求項3のいずれかに記載の三次元動画像表示処理装置として動作させるプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016220072A JP6853928B2 (ja) | 2016-11-10 | 2016-11-10 | 三次元動画像表示処理装置、並びにプログラム |
US15/804,931 US10148931B2 (en) | 2016-11-10 | 2017-11-06 | Three-dimensional video image display processing device, video information recording medium, video information providing server, and recording medium storing a program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016220072A JP6853928B2 (ja) | 2016-11-10 | 2016-11-10 | 三次元動画像表示処理装置、並びにプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018078496A JP2018078496A (ja) | 2018-05-17 |
JP2018078496A5 JP2018078496A5 (ja) | 2020-01-09 |
JP6853928B2 true JP6853928B2 (ja) | 2021-04-07 |
Family
ID=62064897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016220072A Active JP6853928B2 (ja) | 2016-11-10 | 2016-11-10 | 三次元動画像表示処理装置、並びにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10148931B2 (ja) |
JP (1) | JP6853928B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018147329A1 (ja) * | 2017-02-10 | 2018-08-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 自由視点映像生成方法及び自由視点映像生成システム |
CN112333438B (zh) * | 2020-09-08 | 2023-07-28 | 深圳Tcl新技术有限公司 | 立体图像处理方法、装置、设备及计算机可读存储介质 |
US11190748B1 (en) * | 2020-11-20 | 2021-11-30 | Rockwell Collins, Inc. | Dynamic parallax correction for visual sensor fusion |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2998791B2 (ja) | 1996-10-31 | 2000-01-11 | 日本電気株式会社 | 三次元構造推定装置 |
JP3284190B2 (ja) * | 1998-05-14 | 2002-05-20 | 富士重工業株式会社 | ステレオカメラの画像補正装置 |
JP4740481B2 (ja) | 2001-06-29 | 2011-08-03 | オリンパス株式会社 | 3次元画像情報生成装置、3次元画像情報生成方法並びに3次元画像情報生成プログラム |
JP4410007B2 (ja) | 2004-03-23 | 2010-02-03 | 日本電信電話株式会社 | 画像作成方法および画像作成プログラム |
JP4961234B2 (ja) * | 2007-03-23 | 2012-06-27 | 株式会社日立製作所 | 物体追跡装置 |
JP5858380B2 (ja) * | 2010-12-03 | 2016-02-10 | 国立大学法人名古屋大学 | 仮想視点画像合成方法及び仮想視点画像合成システム |
JP2013090185A (ja) * | 2011-10-19 | 2013-05-13 | Sharp Corp | 画像ファイル生成装置、画像ファイル読込装置、画像ファイル生成方法、画像ファイル読込方法およびプログラム |
WO2014037603A1 (en) * | 2012-09-06 | 2014-03-13 | Nokia Corporation | An apparatus, a method and a computer program for image processing |
JP2014072809A (ja) * | 2012-09-28 | 2014-04-21 | Dainippon Printing Co Ltd | 画像生成装置、画像生成方法、画像生成装置用プログラム |
JP6071422B2 (ja) * | 2012-10-29 | 2017-02-01 | 日立オートモティブシステムズ株式会社 | 画像処理装置 |
CN105519105B (zh) * | 2013-09-11 | 2019-03-08 | 索尼公司 | 图像处理设备及方法 |
-
2016
- 2016-11-10 JP JP2016220072A patent/JP6853928B2/ja active Active
-
2017
- 2017-11-06 US US15/804,931 patent/US10148931B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10148931B2 (en) | 2018-12-04 |
US20180131921A1 (en) | 2018-05-10 |
JP2018078496A (ja) | 2018-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI520576B (zh) | 將二維影像轉換爲三維影像的方法與系統及電腦可讀媒體 | |
US20160295194A1 (en) | Stereoscopic vision system generatng stereoscopic images with a monoscopic endoscope and an external adapter lens and method using the same to generate stereoscopic images | |
WO2017179350A1 (ja) | 画像表示制御装置および方法並びにプログラム | |
US11276225B2 (en) | Synthesizing an image from a virtual perspective using pixels from a physical imager array weighted based on depth error sensitivity | |
US20140293007A1 (en) | Method and image acquisition system for rendering stereoscopic images from monoscopic images | |
WO2014139079A1 (en) | A method and system for three-dimensional imaging | |
JP2008140271A (ja) | 対話装置及びその方法 | |
JP2015082288A (ja) | 情報処理装置およびその制御方法 | |
JP6853928B2 (ja) | 三次元動画像表示処理装置、並びにプログラム | |
US8902305B2 (en) | System and method for managing face data | |
Zhao et al. | Floating autostereoscopic 3D display with multidimensional images for telesurgical visualization | |
TW201225658A (en) | Imaging device, image-processing device, image-processing method, and image-processing program | |
CN107209949B (zh) | 用于产生放大3d图像的方法和系统 | |
JP2009212728A (ja) | 立体映像処理装置及び立体映像処理方法 | |
US20140125779A1 (en) | Capturing and visualization of images and video for autostereoscopic display | |
JPH07129792A (ja) | 画像処理方法および画像処理装置 | |
JP3054312B2 (ja) | 画像処理装置及び方法 | |
JP2020028114A (ja) | 立体画像生成装置及びそのプログラム | |
JP6846165B2 (ja) | 画像生成装置、画像表示システム及びプログラム | |
CN106303501B (zh) | 基于图像稀疏特征匹配的立体图像重构方法及装置 | |
KR101275127B1 (ko) | 초점 가변 액체 렌즈를 이용한 3차원 이미지 촬영장치 및 방법 | |
KR101121132B1 (ko) | 집적 영상 복원 방법 및 장치 | |
Liao et al. | High spatiotemporal resolution biomedical imaging and visualization | |
KR101439966B1 (ko) | 뎁스 정보를 이용한 영상의 재구성을 위한 영상 처리 방법 및 이를 이용한 영상 처리 장치 | |
JPH07274063A (ja) | 画像処理方法及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200826 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210210 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6853928 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |