WO2023031999A1

WO2023031999A1 - 映像情報処理装置、方法およびプログラム

Info

Publication number: WO2023031999A1
Application number: PCT/JP2021/031720
Authority: WO
Inventors: 卓佐野; 正人小野; 由実菊地; 真二深津
Original assignee: 日本電信電話株式会社
Priority date: 2021-08-30
Filing date: 2021-08-30
Publication date: 2023-03-09
Also published as: JPWO2023031999A1

Abstract

この発明の一態様は、動画像からそのデプスマップを生成する際に、前記動画像を構成する複数のフレームの各々について生成された第１のデプスマップ情報に対し、別途生成されたセグメント情報を用いてエッジ保存平滑化を行う第１のフィルタ処理と、前記複数のフレーム間で前記第１のデプスマップ情報のフレーム内の位置座標が対応する画素の画素値を時間方向に平滑化する第２のフィルタ処理とをそれぞれ行うことで、補正された第２のデプスマップ情報を生成する。

Description

映像情報処理装置、方法およびプログラム

　この発明の一態様は、例えば３次元動画像を生成するために用いられる映像情報処理装置、方法およびプログラムに関する。

　３次元画像を生成する手法の１つとして、視点からの距離情報を奥側の位置と手前側の位置を両端とする階調表現によりマッピングして表すデプスマップという手法がある。また、このデプスマップの奥行き情報に、画像フレーム内におけるオブジェクトの画像を２次元方向に複数の領域に分割したセグメンテーション情報を組み合わせることにより、さらに高精度のデプスマップを生成する手法も提案されている。

　しかし、このデプスマップ生成手法をそのまま動画等の映像情報に適用した場合には、フレーム間の相関が考慮されずにフレームごとに独立してデプスマップの生成が行われる。このため、画像中のオブジェクトの奥行き方向の階調がフレームごとに変化し、生成されたデプスマップを動画として視聴した場合に、上記オブジェクトが奥行き方向にゆらゆらと揺らいでいるように見え、不自然な動画となってしまう。

　そこで、例えば動き補償付きテンポラルフィルタを用いることで、時間方向に連続するフレームに対してオブジェクトのエッジを保存しながら時間方向の平滑化処理を行う手法が提案されている（例えば特許文献１を参照）。この手法は、例えばオブジェクトの画像をフレームごとに複数画素ブロックに分割して、その各画素ブロックに対しそれぞれオブジェクトの画像の動き予測処理を行うことにより、時間方向の動画像の平滑化を可能にするものである。

日本国特開２００９－５５１４６号公報

　ところが、特許文献１に記載された手法は、分割した複数の画素ブロックの各々に対しオブジェクトの動画像の動き予測処理を行うものとなっている。このため、装置の処理負荷が非常に高くなり実用に適さないという課題を有している。

　この発明は上記事情に着目してなされたもので、少ない処理負荷で、動画像中のオブジェクトのエッジを保存しつつ時間方向の平滑化を可能にする技術を提供しようとするものである。

　上記課題を解決するために、この発明に係る映像情報処理装置または映像情報処理方法の一態様は、動画像からそのデプスマップを生成する際に、前記動画像を構成する複数のフレームの各々について生成された第１のデプスマップ情報を取得すると共に、前記動画像を構成する前記複数のフレームの各々について、オブジェクトを含む画像領域を複数の画素ブロックに分割することにより生成されたセグメンテーション情報を取得する。そして、前記複数のフレームの各々について前記セグメンテーション情報をガイド画像として前記第１のデプスマップ情報に対しエッジ保存平滑化する第１のフィルタ処理を行うと共に、前記複数のフレーム間で前記第１のデプスマップ情報の位置が対応する画素の画素値を時間方向に平滑化する第２のフィルタ処理を行うことで、補正された第２のデプスマップ情報を生成するようにしたものである。

　この発明の一態様によれば、複数のフレームの各々について生成された第１のデプスマップ情報に対し、エッジ保存平滑化を行う第１のフィルタ処理と、上記各フレーム間で第１のデプスマップ情報に対し対応する画素の画素値を時間方向に平滑化する第２のフィルタ処理とがそれぞれ行われる。このため、上記第２のフィルタ処理により各フレーム間における第１のデプスマップ情報の時間方向の揺らぎは低減され、かつ上記第２のフィルタ処理によりオブジェクト画像のエッジ部分が不鮮明になったとしても、上記第１のフィルタ処理により上記エッジ部分は鮮明化される。従って、オブジェクト画像のエッジ部分のぼやけ等を抑制した上でフレーム間相関の揺らぎを低減したデプスマップ情報を生成することが可能となる。しかも、時間方向の平滑化処理とエッジ保存平滑化処理とを組み合わせることで、上記したエッジ部分の鮮明化と時間方向の揺らぎの低減を実現しているので、画素ブロックごとの動き予測処理が不要となり、これにより少ない処理負荷で上記効果を得ることが可能となる。

　すなわちこの発明の一態様によれば、少ない処理負荷で、動画像中のオブジェクトのエッジを保存しつつ時間方向の平滑化を可能にした技術を提供することができる。

図１は、この発明の一実施形態に係る映像情報処理装置のハードウェア構成の一例を示すブロック図である。図２は、この発明の一実施形態に係る映像情報処理装置のソフトウェア構成の一例を示すブロック図である。図３は、図２に示した平滑化処理部のさらに詳しい構成を示すブロック図である。図４は、テンポラルフィルタによる平滑化処理に使用されるフレームの第１の例を示す図である。図５は、図２に示した映像情報処理装置の制御部により実行されるデプスマップ生成処理の処理手順と処理内容を示すフローチャートである。図６は、図５に示した処理手順のうち平滑化処理のさらに詳しい処理手順と処理内容を示すフローチャートである。図７は、テンポラルフィルタによる平滑化処理に使用されるフレームの第２の例を示す図である。

　以下、図面を参照してこの発明に係わる実施形態を説明する。

　［一実施形態］
　（構成例）
　この発明の一実施形態における映像情報処理装置は、３次元動画像を表示する表示システムにおいて、視差画像を生成するためのデプスマップを生成する機能を備えたものである。

　図１および図２は、それぞれこの発明の一実施形態における映像情報処理装置１のハードウェア構成およびソフトウェア構成の一例を示すブロック図である。

　映像情報処理装置１は、例えば汎用のパーソナルコンピュータからなり、中央処理ユニット（Central Processing Unit：ＣＰＵ）等のハードウェアプロセッサを使用した制御部１０を備える。この制御部１０には、バス５０を介して、プログラム記憶部２０およびデータ記憶部３０を有する記憶ユニットと、入出力Ｉ／Ｆ部４０とが接続されている。

　なお、制御部１０には、ＣＰＵに加え、画像演算処理ユニット（Graphics Processing Unit：ＧＰＵ）が備えられていてもよい。また、制御部１０には、ネットワークを介して外部装置との間で通信を行うための通信Ｉ／Ｆ部が接続されていてもよい。さらに、映像情報処理装置１は、画像処理用のＡＳＩＣ（Application Specific Integrated Circuit）であってもよいし、場合によってはWeb またはクラウド上に配置されるサーバ装置であってもよい。

　入出力Ｉ／Ｆ部４０には、外部装置である動画像生成装置２および動画像表示装置３がそれぞれ接続される。なお、動画像生成装置２および動画像表示装置３が遠方に設置されている場合には、上記動画像生成装置２および動画像表示装置３を映像情報処理装置１の通信Ｉ／Ｆ部に接続するようにしてもよい。

　動画像生成装置２は、例えばカメラを備え、動画像を生成し出力する。動画像表示装置３は、液晶または有機ＥＬを使用した表示デバイスまたはプロジェクタを備え、映像情報処理装置１により生成されるデプスマップを用いて視差画像を含む３次元動画像を生成し、上記表示デバイスに表示する。

　プログラム記憶部２０は、例えば、記憶媒体としてＨＤＤ（Hard Disk Drive）またはＳＳＤ（Solid State Drive）等の随時書込みおよび読出しが可能な不揮発性メモリと、ＲＯＭ（Read Only Memory）等の不揮発性メモリとを組み合わせて構成したもので、ＯＳ（Operating System）等のミドルウェアに加えて、この発明の一実施形態に係る各種制御処理を実行するために必要な各種プログラムを格納する。

　データ記憶部３０は、例えば、記憶媒体として、ＨＤＤまたはＳＳＤ等の随時書込みおよび読出しが可能な不揮発性メモリと、ＲＡＭ（Random Access Memory）等の揮発性メモリと組み合わせたもので、この発明の一実施形態を実施するために必要な主たる記憶領域として、RGB 画像記憶部３１と、デプスマップ記憶部３２とを備える。

　RGB 画像記憶部３１は、動画像生成装置２から出力される動画像の各フレームRGB画像を順次記憶するために使用される。デプスマップ記憶部３２は、映像バッファとして使用され、制御部１０がテンポラルフィルタによるデプスマップの時間方向の平滑化処理に使用する複数フレーム分のデプスマップを一時保存する。

　ここで、デプスマップ記憶部３２に保存させるフレーム数は、テンポラルフィルタのタップ数に応じて設定される。一般に、テンポラルフィルタのタップ数は、デプスマップ記憶部３２のバッファ量やシステム全体の処理遅延の要件によって任意に設定可能であるが、例えば５タップ程度に設定される。従って、この場合上記デプスマップ記憶部３２に保存するフレーム数は、図４に示すように５フレームに設定される。

　また、デプスマップ記憶部３２に保存されるフレームは、図４に例示したように処理対象フレームＦ０に対する過去のフレームＦｐに限らず、例えば図７に例示するように処理対象フレームＦ０の過去の複数のフレームＦｐに、未来の複数のフレームＦｆが加えられてもよい。

　なお、データ記憶部３０には、制御部１０による一連の処理の過程で生成されるデプスマップやセグメンテーション結果を一時的に保存する記憶領域や、平滑化処理で使用される各種閾値を記憶する領域も備えられている。

　制御部１０は、この発明の一実施形態に係る処理機能として、RGB 画像取得処理部１１と、デプス推定処理部１２と、セグメンテーション処理部１３と、サイズ変更処理部１４と、平滑化処理部１５とを備えている。これらの各処理部１１～１５は、何れもプログラム記憶部２０に格納されたアプリケーション・プログラムを、制御部１０のＣＰＵおよびＧＰＵ等のプロセッサに実行させることにより実現される。

　RGB 画像取得処理部１１は、動画像生成装置２から出力される動画像を構成する各フレームのRGB 画像を入出力Ｉ／Ｆ部４０を介して受け取り、RGB 画像記憶部３１に記憶させる処理を行う。

　デプス推定処理部１２は、上記RGB 画像記憶部３１からフレームごとにRGB 画像を読み込み、読み込まれたRGB 画像からデプスマップを推定し出力する。デプスマップは、各画素の奥行きを例えば０～２５５のグレーの２５６階調で表現した画像データである。例えば、階調は一番奥を０、手前を２５５に設定されるが、２５６階調以外の階調でもよい。デプスマップの推定には、例えばDepth from Videos in the Wildと呼ばれる手法が用いられる。

　セグメンテーション処理部１３は、上記RGB 画像記憶部３１からフレームごとにRGB 画像を読み込み、読み込まれたRGB 画像内から動物体等のオブジェクトを検出し、検出されたオブジェクトを含む例えば矩形の画像領域をピクセル単位で複数のブロックに分割したセグメンテーション情報を出力する。セグメンテーション情報は、分割されたピクセルごとの各ブロックにセグメントＩＤを付与したデータからなる。セグメンテーション処理には、例えば、Mask R-CNNと呼ばれる手法を用いることができる。

　サイズ変更処理部１４は、上記デプス推定処理部１２および上記セグメンテーション処理部１３からそれぞれデプスマップおよびセグメンテーション情報を入力する。そして、デプスマップのサイズとセグメンテーション情報のサイズとが同一サイズとなるようにサイズを変更し、サイズが変更されたデプスマップおよびセグメンテーション情報を出力する。

　平滑化処理部１５は、フレームごとに、上記サイズ変更処理部１４によりサイズが変更された上記デプスマップおよびセグメンテーション情報を入力する。そして平滑化処理部１５は、入力された上記デプスマップに対し、エッジ保存平滑化フィルタにより２次元方向の平滑化処理を行うと共に、テンポラルフィルタによりデプスマップ記憶部３２に記憶されている他のフレームのデプスマップを用いて時間方向の平滑化処理を行い、これらの平滑化処理により補正されたデプスマップを出力する。なお、上記エッジ保存平滑化フィルタおよびテンポラルフィルタを使用した、デプスマップに対する平滑化処理の一例は、動作例において詳しく説明する。

　（動作例）
　次に、以上のように構成された映像情報処理装置１の動作例を説明する。図５は、映像情報処理装置１の制御部１０による全体の処理手順と処理内容を示すフローチャートである。

　（１）RGB 画像の取得
　映像情報処理装置１の制御部１０は、ステップＳ１０においてRGB 画像の入力の有無を監視している。この状態で、動画像生成装置２から動画像を構成する複数のフレームのRGB 画像が入力されると、映像情報処理装置１の制御部１０は、RGB 画像取得処理部１１の制御の下、ステップＳ１１により上記各フレームのRGB 画像を入出力Ｉ／Ｆ部４０を介して取り込み、RGB 画像記憶部３１に順次記憶させる。　
　なお、RGB 画像取得処理部１１は、入力された動画像からフレームごとにRGB 画像を分離抽出する処理を行ってもよい。

　（２）デプス推定
　上記RGB 画像が入力されると、映像情報処理装置１の制御部１０はデプス推定処理部１２の制御の下、ステップＳ１２において、フレームごとにRGB 画像記憶部３１からRGB 画像を読み込み、読み込まれた上記RGB 画像に対しデプス推定を行ってデプスマップＤＭinを生成し、サイズ変更処理部１４へ出力する。デプスマップは、先に述べたように、RGB 画像の各画素の奥行きを例えば０～２５５のグレーの２５６階調で表現した画像データである。

　（３）セグメンテーション情報の生成
　映像情報処理装置１の制御部１０は、上記デプスマップの推定処理と並行して、セグメンテーション処理部１３の制御の下、ステップＳ１３において上記RGB 画像に対しセグメンテーション処理を行う。例えば、セグメンテーション処理部１３は、先ず上記RGB 画像内から動物体等のオブジェクトをすべて検出する。そして、検出されたオブジェクトごとに当該オブジェクトを含む例えば矩形の画像領域をピクセル単位で複数の画素ブロックに分割し、分割された各画素ブロックに対しそれぞれセグメントＩＤを付与する。例えば９個の画素ブロックに分割した場合には、これらの画素ブロックに１～９のセグメントＩＤを付与する。そして、セグメンテーション処理部１３は、フレームごとに、上記セグメントＩＤを含むセグメンテーション情報ＳＧをサイズ変更処理部１４へ出力する。

　（４）サイズ変更
　続いて映像情報処理装置１の制御部１０は、サイズ変更処理部１４の制御の下、ステップＳ１４において、上記デプス推定処理部１２およびセグメンテーション処理部１３からそれぞれ出力されたデプスマップＤＭinおよびセグメンテーション情報ＳＧに対し、フレームサイズが同一となるようにサイズを変更する処理を行う。

　一般に、デプス推定処理およびセグメンテーション処理は、元のRGB 画像を縮小した画像を用いて行われることが多い。縮小されたRGB 画像を用いると、デプスマップの推定処理とセグメンテーション処理の処理コストが小さくなり各処理時間が短縮されるので、結果的にシステム全体での処理時間の短縮が可能となるからである。

　サイズ変更処理部１４は、以上の縮小処理の影響により、デプスマップＤＭinとセグメンテーション情報ＳＧのサイズが異なった場合に対応するために、上記デプスマップＤＭinおよびセグメンテーション情報ＳＧのサイズを、例えば元のRGB 画像と同じサイズに変更する。なお、上記デプスマップＤＭinおよびセグメンテーション情報ＳＧが同じサイズの場合には、サイズ変更の処理は省略される。

　サイズ変更処理部１４は、サイズ変更処理後の上記デプスマップＤＭinおよびセグメンテーション情報ＳＧを平滑化処理部１５へ出力する。またサイズ変更処理部１４は、ステップＳ１５により、上記サイズ変更処理後のデプスマップＤＭinを、後述するテンポラルフィルタによる時間方向の平滑化処理に供するため、デプスマップ記憶部３２に保存させる。

　（５）平滑化処理
　映像情報処理装置１の制御部１０は、次に平滑化処理部１５の制御の下、ステップＳ１６において上記サイズ変更処理部１４から出力されたデプスマップに対し、以下のように平滑化処理を実行する。

　図３は上記平滑化処理部１５の機能構成の一例を示すブロック図、図６は平滑化処理部１５による平滑化処理の処理手順と処理内容の一例を示すフローチャートである。

　平滑化処理部１５は、その処理機能として、エッジ保存平滑化フィルタ１５１と、テンポラルフィルタ１５２と、フィルタ精度判定部１５３とを備えている。これらの処理機能１５１～１５３は、いずれもプログラムをＣＰＵまたはＧＰＵ等のプロセッサに実行させることにより実現される。

　（５－１）初回の平滑化処理
　平滑化処理部１５は、先ずステップＳ２０において、エッジ保存平滑化フィルタ１５１により、入力された上記サイズ変更後のデプスマップＤＭinに対し、同一フレームのセグメンテーション情報ＳＧをガイドにエッジ保存平滑化のためのフィルタリング処理を行う。このエッジ保存平滑化処理には、例えばJoint Bilateral FilterまたはGuided Filterが使用されるが、それ以外のフィルタを使用することも可能である。

　エッジ保存平滑化フィルタ１５１は、上記デプスマップＤＭinに対するフィルタリング処理が初回であれば、上記フィルタリング処理後のデプスマップＤＭ1 を、フィルタ精度判定部１５３を介してテンポラルフィルタ１５２に転送する。なお、このときフィルタ精度判定部１５３は、上記エッジ保存平滑化処理後のデプスマップＤＭ1 をデータ記憶部３０のバッファ領域に一時的に保存する。

　平滑化処理部１５は、次にステップＳ２１において、テンポラルフィルタ１５２により、上記エッジ保存平滑化処理後のデプスマップＤＭ1 に対し、デプスマップ記憶部３２に保存されている過去の複数のフレームのデプスマップを用いて、フレーム内の座標位置が対応する画素ごとに画素値を時間方向に平滑化処理する。

　例えば、いま図４に示すように時刻t のフレームＦ0 が処理対象であれば、このフレームＦ0 のデプスマップに対し、過去の時刻t-1 ，t-2 ，t-3 ，t-4 における４フレームＦp の各デプスマップを用いて、フレーム内の位置座標が対応する画素ごとに画素値を時間方向に平滑化処理する。この平滑化処理には、例えばローパスフィルタが用いられる。上記平滑化処理されたデプスマップＤＭ2 は、テンポラルフィルタ１５２からフィルタ精度判定部１５３に戻される。

　平滑化処理部１５は、続いてステップＳ２２において、フィルタ精度判定部１５３の制御の下、上記テンポラルフィルタ１５２から出力されたデプスマップＤＭ2 と、上記エッジ保存平滑化フィルタ１５１から出力されかつテンポラルフィルタ１５２に供給される前のデプスマップＤＭ1 との間の、差分絶対値和ＤＭ3 を算出する。

　フィルタ精度判定部１５３は、ステップＳ２３において、算出された上記差分絶対値和ＤＭ3 を事前にデータ記憶部３０の閾値記憶領域に記憶された閾値ＴＨ１と比較し、差分絶対値和ＤＭ3 が閾値ＴＨ１以下であるか否かを判定する。そして、差分絶対値和ＤＭ3 が閾値ＴＨ１以下であれば、ステップＳ２６において、上記テンポラルフィルタ１５２から出力されたデプスマップＤＭ2を、補正後のデプスマップＤＭout としてそのまま出力する。

　また、それと共に平滑化処理部１５は、ステップＳ２７において、上記補正後のデプスマップＤＭout をデプスマップ記憶部３２に出力し、それまで保存されていた対応するフレームＦ０のデプスマップＤinを上記補正後のデプスマップＤＭout に更新する。

　（５－２）平滑化処理の繰り返し実行
　一方、テンポラルフィルタ１５２による平滑化処理を行うと、オブジェクトのエッジ部分の画像がぼやけたり霞が掛かったように不鮮明になることがあり、この場合上記差分絶対値和ＤＭ3 は閾値ＴＨ１以下にならない。

　そこで、フィルタ精度判定部１５３は、上記ステップＳ２３による判定の結果、差分絶対値和ＤＭ3 が閾値ＴＨ１以下でない場合には、ステップＳ２４，Ｓ２５による後述する繰り返し実行処理を制限するための制御を行った後、上記テンポラルフィルタ１５２から出力されたデプスマップＤＭ2 を、再度エッジ保存平滑化処理を行うためにエッジ保存平滑化フィルタ１５１に渡す。

　エッジ保存平滑化フィルタ１５１は、ステップＳ２０において、上記デプスマップＤＭ2 に対しエッジ保存平滑化処理を実行する。すなわち、ここでは２回目のエッジ保存平滑化処理を行う。そして、フィルタ精度判定部１５３は、上記エッジ保存平滑化フィルタ１５１により２回目のエッジ保存平滑化処理が行われたデプスマップＤＭ1 を、データ記憶部３０のバッファ領域に一旦保存した後、テンポラルフィルタ１５２に転送する。

　テンポラルフィルタ１５２は、ステップＳ２１により上記デプスマップＤＭ1 に対し２回目のテンポラルフィルタリング処理を行い、フィルタリング処理後のデプスマップＤＭ2 をフィルタ精度判定部１５３に返す。

　フィルタ精度判定部１５３は、ステップＳ２２において、上記２回目のテンポラルフィルタリング処理が行われたデプスマップＤＭ2 と、このテンポラルフィルタリング処理に供する前の上記デプスマップＤＭ1 との間の差分絶対値和ＤＭ３を算出し、算出された上記差分絶対値和ＤＭ3 が閾値ＴＨ１以下であるかどうかをステップＳ２３により再度判定する。そして、差分絶対値和ＤＭ3 が閾値ＴＨ１以下になっていれば、ステップＳ２６により、上記２回目のテンポラルフィルタリング処理が行われた後のデプスマップＤＭ2 を、補正後のデプスマップＤＭout として出力する。

　これに対し、上記差分絶対値和ＤＭ3 がまだ閾値ＴＨ１以下になっていなければ、フィルタ精度判定部１５３は上記デプスマップＤＭ2 をエッジ保存平滑化フィルタ１５１に戻し、再度エッジ保存平滑化処理を行わせる。以後同様に、差分絶対値和ＤＭ3 が閾値ＴＨ１以下になるまで、デプスマップＤＭ2 に対し上記エッジ保存平滑化フィルタ１５１によるエッジ保存平滑化処理と、テンポラルフィルタ１５２による時間方向の平滑化処理が交互に繰り返し実行される。

　（５－３）繰り返し実行処理の制限
　ところで、平滑化処理部１５のフィルタ精度判定部１５３は、上記エッジ保存平滑化フィルタ１５１による平滑化処理と上記テンポラルフィルタ１５２による時間方向の平滑化処理の繰り返し実行処理が際限なく行われないようにするために、上記各フィルタ１５１，１５２による繰り返し実行処理を制限する。

　すなわち、フィルタ精度判定部１５３は、ステップＳ２３による判定の結果、差分絶対値和ＤＭ3 が閾値ＴＨ１以下になっていない場合、ステップＳ２４において繰り返し実行回数Ｃをカウントアップする。そして、ステップＳ２５により上記カウントアップ後の繰り返し実行回数Ｃが上限値ＴＨ２に達したか否かを判定する。この上限値ＴＨ２は、事前にデータ記憶部３０内の閾値記憶領域に記憶されているものが使用される。フィルタ精度判定部１５３は、上記繰り返し実行回数Ｃがまだ上記上限値ＴＨ２に達していなければ、デプスマップＤＭ2 をエッジ保存平滑化フィルタ１５１によるエッジ保存平滑化処理に戻す。

　これに対し、ステップＳ２５による判定の結果、カウントアップ後の繰り返し実行回数Ｃが上限値ＴＨ２に達したとする。この場合、フィルタ精度判定部１５３は、それ以上の平滑化処理を繰り返さず、ステップＳ２６に移行して上記デプスマップＤＭ2 を補正後のデプスマップＤＭout として出力する。

　（作用・効果）
　以上述べたように一実施形態における映像情報処理装置１では、平滑化処理部１５に、エッジ保存平滑化フィルタ１５１と、テンポラルフィルタ１５２とを備え、フレームごとにRGB 画像から推定されたデプスマップＤＭinに対し、上記エッジ保存平滑化フィルタ１５１によるエッジ保存平滑化処理と、テンポラルフィルタ１５２による時間方向の平滑化処理とをそれぞれ行うようにしている。

　このため、テンポラルフィルタ１５２による時間方向の平滑化処理により各フレーム間におけるデプスマップの時間方向の揺らぎは低減され、かつ上記テンポラルフィルタ１５２による平滑化処理によりオブジェクトのエッジ部分の画像にぼやけや霞が発生して画質が不鮮明になったとしても、上記エッジ保存平滑化フィルタ１５１によるエッジ保存平滑化処理により上記エッジ部分の画像のぼやけや霞は低減されて画質は鮮明化される。従って、オブジェクトのエッジ部分の画像のぼやけ等を抑制した上でフレーム間相関の揺らぎを低減したデプスマップＤＭout を生成することが可能となる。しかも、RGB 画像の画素ブロックごとの動き予測処理が不要となり、これにより少ない処理負荷で上記画質改善効果を得ることができる。

　さらに、平滑化処理部１５にフィルタ精度判定部１５３を設け、このフィルタ精度判定部１５３により、テンポラルフィルタ１５２から出力されるデプスマップＤＭ2 と、エッジ保存平滑化フィルタ１５１によるエッジ保存平滑化処理後でかつテンポラルフィルタ１５２に入力される前のデプスマップＤＭ1 との差分絶対値和ＤＭ3 を算出し、算出された差分絶対値和ＤＭ3 が閾値ＴＨ１以下になるまで、上記デプスマップＤＭ2 に対し上記エッジ保存平滑化フィルタ１５１によるエッジ保存平滑化処理とテンポラルフィルタ１５２による時間方向の平滑化処理とを繰り返し実行するようにしている。

　このため、オブジェクトのエッジ部分の画像にぼやけ等が少なく鮮明で、かつフレーム間相関の揺らぎが十分に抑圧された品質が良好なデプスマップＤＭout を生成することができる。

　また、平滑化処理部１５では、フィルタ精度判定部１５３によりエッジ保存平滑化フィルタ１５１によるエッジ保存平滑化処理とテンポラルフィルタ１５２による時間方向の平滑化処理の繰り返し実行回数Ｃを計数し、この繰り返し実行回数Ｃが上限値ＴＨ２に達して時点で上記繰り返し実行処理を終了するようにしている。このため、上記繰り返し実行処理が際限なく実行される不具合を防止することができる。

　［その他の実施形態］
　（１）前記一実施形態では、平滑化処理部１５のフィルタ精度判定部１５３において、エッジ保存平滑化フィルタ１５１から出力されたデプスマップＤＭ1 と、テンポラルフィルタ１５２から出力されたデプスマップＤＭ2 との間の差分絶対値和ＤＭ3 を閾値ＴＨ１と比較し、差分絶対値和ＤＭ3 が閾値ＴＨ１以下になった時点で、その時のデプスマップＤＭ2 を平滑化処理後のデプスマップＤＭout として出力するようにした。しかし、上記差分絶対値和ＤＭ3 によるフィルタ精度の判定処理は必ずしも行わなくてもよく、例えばエッジ保存平滑化フィルタ１５１による平滑化処理とテンポラルフィルタ１５２による平滑化処理とを予め設定された回数だけ無条件に交互に繰り返し実行し、その結果得られたデプスマップＤＭ2 を補正されたデプスマップＤＭout として出力するようにしてもよい。

　（２）一般に、動画像にシーンチェンジやクロスフェード等のようにオブジェクト画像のフレーム間相関値が大きく変化する映像効果が含まれる場合には、テンポラルフィルタによる時間方向の平滑化処理を行っても十分な平滑効果が得られない。そこで、映像情報処理装置１は、例えば動画像生成装置２から動画像中における映像効果の検出情報を受け取り、この検出情報をもとに映像効果が検出されたフレームに対してはテンポラルフィルタによる時間方向の平滑化処理を行わないように制御してもよい。

　（３）前記一実施形態では、入力されたRGB 画像からデプスマップ情報を生成するデプス推定処理と、入力された上記RGB 画像からオブジェクトを含む画像領域のセグメンテーション情報を生成する処理を、映像情報処理装置１内で行う場合を例にとって説明した。しかしながら、例えば、上記デプスマップ情報およびセグメンテーション情報を生成する機能を動画像生成装置２またはそれ以外の外部装置が備えている場合には、映像情報処理装置１は、上記動画像生成装置２またはそれ以外の外部装置からデプスマップ情報およびセグメンテーション情報を取得するようにしてもよい。

　（４）前記一実施形態では、動画像からフレームごとに抽出されたRGB 画像からデプスマップを生成する場合を例にとって説明したが、単眼のカメラにより得られる２次元の動画像からデプスマップを生成するようにしてもよく、またステレオ画像からデプスマップを生成するようにしてもよい。さらに、RGB 画像以外にモノクロ画像からデプスマップを生成するようにしてもよい。

　（５）前記一実施形態では、この発明に係る一連の処理を実行するためのプログラムを事前に映像情報処理装置のプログラム記憶部２０に記憶した場合を例にとって説明した。しかしながら、それ以外に、映像情報処理装置が、必要時に磁気ディスクや光ディスク、USB メモリ等の半導体メモリに代表される外部記憶媒体からアプリケーション・プログラムを読み込んで制御部１０に実行させるようにしてもよいし、Web 上またはクラウド上に配置されたサーバ装置等から必要時にアプリケーション・プログラムをダウンロードして制御部１０に実行させるようにしてもよい。

　（６）前記一実施形態では、この発明に係るすべての処理機能を１台の映像情報処理装置に設けた場合を例にとって説明した。しかし、この発明に係るすべての処理機能を複数の情報処理装置（例えばパーソナルコンピュータや、スマートフォン等の携帯端末、サーバ装置）に分散配置するようにしてもよい。

　（７）その他、映像情報処理装置の機能構成やその処理手順と処理内容、動画像の種類等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。

　以上、この発明の実施形態を詳細に説明してきたが、前述までの説明はあらゆる点においてこの発明の例示に過ぎない。この発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。つまり、本発明の実施にあたって、実施形態に応じた具体的構成が適宜採用されてもよい。

　要するにこの発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態に亘る構成要素を適宜組み合せてもよい。

　１…映像情報処理装置
　２…動画像生成装置
　３…動画像表示装置
　１０…制御部
　１１…RGB 画像取得処理部
　１２…デプス推定処理部
　１３…セグメンテーション処理部
　１４…サイズ変更処理部
　１５…平滑化処理部
　２０…プログラム記憶部
　３０…データ記憶部
　３１…RGB 画像記憶部
　３２…デプスマップ記憶部
　４０…入出力Ｉ／Ｆ部
　５０…バス
　１５１…エッジ保存平滑化フィルタ
　１５２…テンポラルフィルタ
　１５３…フィルタ精度判定部

Claims

　動画像からそのデプスマップを生成する映像情報処理装置であって、
　前記動画像を構成する複数のフレームの各々について生成された第１のデプスマップ情報を取得するデプスマップ情報取得処理部と、
　前記複数のフレームの各々について、オブジェクトを含む画像領域を複数の画素ブロックに分割することにより生成されたセグメンテーション情報を取得するセグメンテーション情報取得処理部と、
　前記複数のフレームの各々について前記セグメンテーション情報をガイド画像として前記第１のデプスマップ情報に対しエッジ保存平滑化を行う第１のフィルタ処理と、前記複数のフレーム間で前記第１のデプスマップ情報に対し位置が対応する画素の画素値を時間方向に平滑化する第２のフィルタ処理とをそれぞれ行うことで、補正された第２のデプスマップ情報を生成する平滑化処理部と
　を具備する映像情報処理装置。
　前記平滑化処理部は、前記第１のフィルタ処理と前記第２のフィルタ処理とを交互に繰り返し実行する、請求項１に記載の映像情報処理装置。
　前記平滑化処理部は、前記第２のフィルタ処理が行われた後の前記第１のデプスマップ情報と、前記第１のフィルタ処理が行われかつ前記第２のフィルタ処理が行われる前の前記第１のデプスマップ情報との間の差分値を算出し、算出された前記差分値が予め設定された閾値以下になるまで、前記第１のフィルタ処理と前記第２のフィルタ処理とを交互に繰り返し実行する、請求項２に記載の映像情報処理装置。
　前記平滑化処理部は、前記第１のフィルタ処理と前記第２のフィルタ処理との繰り返し実行回数を計数し、前記繰り返し実行回数の計数値が予め設定された上限値に達した時点で、前記第１のフィルタ処理と前記第２のフィルタ処理との繰り返し実行処理を終了する、請求項２または３に記載の映像情報処理装置。
　前記平滑化処理部は、前記動画像においてフレーム間の相関値が所定量を超える映像効果が検出された場合に、前記映像効果が検出されたフレームについて生成された前記第１のデプスマップ情報に対する前記第２のフィルタ処理を行わないようにする、請求項１乃至４のいずれかに記載の映像情報処理装置。
　動画像からそのデプスマップを生成する装置が実行する映像情報処理方法であって、
　前記動画像を構成する複数のフレームの各々について生成された第１のデプスマップ情報を取得する過程と、
　前記複数のフレームの各々について、オブジェクトを含む画像領域を複数の画素ブロックに分割することにより生成されたセグメンテーション情報を取得する過程と、
　前記複数のフレームの各々について前記セグメンテーション情報をガイド画像として前記第１のデプスマップ情報に対しエッジ保存平滑化を行う第１のフィルタ処理と、前記複数のフレーム間で前記第１のデプスマップ情報に対し位置が対応する画素の画素値を時間方向に平滑化する第２のフィルタ処理とを行うことで、補正された第２のデプスマップ情報を生成する過程と
　を具備する映像情報処理方法。
　請求項１乃至５のいずれかに記載の映像情報処理装置が具備する前記各処理部による処理を、前記映像情報処理装置が備えるプロセッサに実行させるプログラム。