JP2010093816A - 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法 - Google Patents

視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法 Download PDF

Info

Publication number
JP2010093816A
JP2010093816A JP2009234374A JP2009234374A JP2010093816A JP 2010093816 A JP2010093816 A JP 2010093816A JP 2009234374 A JP2009234374 A JP 2009234374A JP 2009234374 A JP2009234374 A JP 2009234374A JP 2010093816 A JP2010093816 A JP 2010093816A
Authority
JP
Japan
Prior art keywords
visual interest
map
image
feature
maps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009234374A
Other languages
English (en)
Inventor
Ji Won Kim
智 元 金
Yong Ju Jung
用 柱 鄭
Aron Baik
アロン 白
Du-Sik Park
斗 植 朴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2010093816A publication Critical patent/JP2010093816A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/261Image signal generators with monoscopic-to-stereoscopic image conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/285Analysis of motion using a sequence of stereo image pairs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/341Displays for viewing with the aid of special glasses or head-mounted displays [HMD] using temporal multiplexing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/366Image reproducers using viewer tracking
    • H04N13/383Image reproducers using viewer tracking for tracking with gaze detection, i.e. detecting the lines of sight of the viewer's eyes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/398Synchronisation thereof; Control thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/04Indexing scheme for image data processing or generation, in general involving 3D image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0077Colour aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0085Motion estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0092Image segmentation from stereoscopic image signals

Abstract

【課題】 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法を提供する。
【解決手段】 2次元映像におけるオブジェクトの重要度に対する情報である視覚的関心情報を含む視覚的関心マップを生成し、視覚的関心マップを用いて2次元映像の左眼映像および右眼映像に対する情報を含む視差情報を生成し、視差情報を用いて3次元映像を生成する。
【選択図】 図1

Description

本発明は、視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法に関する。
最近では、3次元ディスプレイ装置の発展に伴い、既存の映像よりもさらに現実的な立体感と臨場感のある3次元映像を一般視聴者に提供できるようになり、これによって3次元コンテンツに対する需要が次第に増加している。
一般的に、3次元映像を提供するためには多数の時点の2次元映像が必要であったが、このような方式では、過去に製作された単一時点の2次元映像を活用することができなかった。
2次元映像の3次元映像への変換は、過去に製作されたコンテンツを次世代ディスプレイ装置に積極的に活用するための作業である。
現在広く用いられているステレオ映像方式の場合には、映像を分析して映像の深さマップ、すなわちオブジェクトと観察者との距離を生成し、深さマップを用いた視差生成を介して3次元映像を提供することが一般的であった。
本発明は、2次元映像の視覚的関心マップ(Visual Attention Map)を生成し、これに基づいた視差(Parallax)情報を生成して3次元映像変換に用い、観察者により一層臨場感のある3次元映像を提供することを目的とする。
また、本発明は、映像のテキストまたは物体を画面から観察者方向に引き寄せて配置させることによってユーザの注意を促し、これによって観察者が、テキストまたは物体などが観察者に向かって自然に突出した形態の3次元映像を体感できるようにすることを他の目的とする。
本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換方法は、2次元映像から視覚的関心度と関連した特徴情報を抽出し、前記特徴情報を用いて視覚的関心マップを生成するステップと、前記視覚的関心マップを用いて視覚的関心度に基づいた視差情報を生成するステップとを含む。
このとき、前記視覚的関心マップを生成するステップは、前記特徴情報(feature information)を含む特徴マップ(feature map)を抽出するステップと、前記特徴マップを用いて前記視覚的関心マップを生成するステップとを含むことができる。
このとき、前記視覚的関心マップは、前記特徴マップの各ピクセルと前記各ピクセルの隣接ピクセルとの前記特徴情報の値の差を計算するコントラスト(contrast)計算によって生成することができる。
このとき、前記特徴マップを用いて前記視覚的関心マップを生成するステップは、前記特徴マップの選定された中央領域と選定された周辺領域の前記特徴情報の値のヒストグラム(Histogram)の差を計算して前記視覚的関心マップを生成するステップとすることができる。
このとき、前記特徴情報は、輝度(Luminance)、色(Color)、モーション(Motion)、テクスチャ(Texture)、または方向性(Orientation)のうちの1つ以上を含む認識(perception)と関連した特徴情報とすることができる。
このとき、前記視覚的関心マップを生成するステップは、前記オブジェクトと関連した複数の特徴情報を含む複数の特徴マップを抽出するステップと、前記特徴マップを用いて前記複数の視覚的関心マップを生成するステップと、前記視覚的関心マップを融合を介して最終の視覚的関心マップを生成するステップを含むことができる。
このとき、前記最終の視覚的関心マップを生成するステップは、前記複数の視覚的関心マップを線形融合(Linear fusion)または非線形融合(Nonlinear fusion)を介して前記最終の視覚的関心マップを生成することができる。
このとき、前記特徴マップを用いて前記複数の視覚的関心マップを生成するステップは、前記特徴マップの各ピクセルと前記各ピクセルの隣接ピクセルとの前記特徴情報の値の差を計算するコントラスト計算によって前記複数の視覚的関心マップを生成するステップとすることができる。
このとき、前記特徴マップを用いて前記複数の視覚的関心マップを生成するステップは、前記特徴マップの選定された中央領域と選定された周辺領域の前記特徴情報の値のヒストグラムの差を計算して前記複数の視覚的関心マップを生成するステップとすることができる。
このとき、前記選定された中央領域と前記選定された周辺領域が1つの連続した領域であれば、前記選定された中央領域は、前記1つの連続した領域の中央に位置することができる。
このとき、前記特徴情報は、輝度、色、モーション、テクスチャ、または方向性のうちの1つ以上を含む認識と関連した特徴情報とすることができる。
このとき、前記視覚的関心マップを生成するステップは、前記特徴情報を含む特徴マップをそれぞれ互いに異なる複数のスケール(scale)で抽出するステップと、前記それぞれ互いに異なる複数のスケールの特徴マップを用いて、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップと、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを用いて、最終の視覚的関心マップを生成するステップとを含むことができる。
このとき、前記それぞれ互いに異なる複数のスケールの特徴マップを用いて、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップは、前記特徴マップの各ピクセルと前記各ピクセルの隣接ピクセルとの前記特徴情報の値の差を計算するコントラスト計算によって、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップとすることができる。
このとき、前記それぞれ互いに異なる複数のスケールの特徴マップを用いて、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップは、前記特徴マップの選定された中央領域と選定された周辺領域の前記特徴情報の値のヒストグラムの差を計算して、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップとすることができる。
このとき、前記特徴情報は、輝度、色、モーション、テクスチャ、または方向性のうちの1つ以上を含む認識と関連した特徴情報とすることができる。
このとき、前記視覚的関心マップを生成するステップは、前記オブジェクトと関連した特徴情報を含む複数の特徴マップをそれぞれ互いに異なる複数のスケールで抽出するステップと、前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップを用いて、前記それぞれ互いに異なる複数のスケールを有する視覚的関心マップを複数生成するステップと、前記それぞれ互いに異なる複数のスケールを有する複数の視覚的関心マップを各特徴情報別に結合した結合視覚的関心マップを生成するステップと、前記結合視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成するステップとを含むことができる。
このとき、前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップを用いて、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを複数生成するステップは、前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップそれぞれにおいて、各ピクセルと前記各ピクセルの隣接ピクセルとの前記特徴情報の値の差を計算するコントラスト計算によって、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップとすることができる。
このとき、前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップを用いて、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを複数生成するステップは、前記複数の特徴マップそれぞれにおいて、前記特徴マップの選定された中央領域と選定された周辺領域の前記特徴情報の値のヒストグラムの差を計算して、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップとすることができる。
このとき、前記視差情報を用いて3次元映像を生成するステップをさらに含むことができる。
このとき、前記視差情報を用いて3次元映像を生成するステップは、前記2次元映像の視差情報による左眼映像および右眼映像を用いて3次元映像を生成するステップとすることができる。
本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器は、2次元映像を分析して視覚的関心度と関連した特徴情報を抽出し、前記特徴情報を用いて視覚的関心マップを生成する視覚的関心マップ生成部と、前記視覚的関心マップを用いて視覚的関心度に基づいた視差情報を生成する視差情報生成部とを備える。
このとき、前記視覚的関心マップ生成部は、前記特徴情報を含む特徴マップを抽出する特徴マップ抽出部と、前記特徴マップを用いて前記視覚的関心マップを生成する低レベル関心計算部とを備えることができる。
このとき、前記低レベル関心計算部は、前記特徴マップの各ピクセルと前記各ピクセルの隣接ピクセルとの前記特徴情報の値の差を計算するコントラスト計算によって前記視覚的関心マップを生成することができる。
このとき、前記低レベル関心計算部は、前記特徴マップの選定された中央領域と選定された周辺領域の前記特徴情報の値のヒストグラムの差を計算して前記視覚的関心マップを生成することができる。
このとき、前記視覚的関心マップ生成部は、前記複数の特徴情報を含む複数の特徴マップを抽出する特徴マップ抽出部と、前記特徴マップを用いて前記複数の視覚的関心マップを生成する低レベル関心計算部と、前記視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成する線形/非線形融合部とを備えることができる。
このとき、前記視覚的関心マップ生成部は、前記特徴情報を含む特徴マップをそれぞれ互いに異なる複数のスケールで抽出する特徴マップ抽出部と、前記それぞれ互いに異なる複数のスケールの特徴マップを用いて、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成する低レベル関心計算部と、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを用いて、最終の視覚的関心マップを生成するスケール結合部とを備えることができる。
このとき、前記視覚的関心マップ生成部は、前記特徴情報を含む複数の特徴マップをそれぞれ互いに異なる複数のスケールで抽出する特徴マップ抽出部と、前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップを用いて、前記それぞれ互いに異なる複数のスケールを有する視覚的関心マップを複数生成する低レベル関心計算部と、前記それぞれ互いに異なる複数のスケールを有する複数の視覚的関心マップを各特徴情報別に結合した結合視覚的関心マップを生成するスケール結合部と、前記結合視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成する線形/非線形融合部とを備えることができる。
本発明の実施形態に係る方法は、2次元映像から視覚的関心を意味する要素を抽出するステップと、前記視覚的関心を意味する要素に基づいた3次元表示情報を提供するステップとを含むことができる。
本発明の実施形態に係る2次元映像の3次元映像変換方法は、2次元映像の視覚的関心度に対応する特徴情報を用いて少なくとも1つの視覚的関心マップを生成するステップと、前記少なくとも1つの視覚的関心マップと前記2次元映像からの情報を用いて3次元映像を生成するステップとを含むことができる。
このとき、前記視覚的関心度は、前記2次元映像においてオブジェクトの重要性に対する情報とすることができる。
このとき、前記視覚的関心度は、イメージの特定地域において観察者のフォーカスに関する情報とすることができる。
このとき、前記少なくとも1つの視覚的関心マップと前記2次元映像からの情報は、左眼イメージと右眼イメージに対する情報とすることができる。
このとき、前記少なくとも1つの視覚的関心マップは、それぞれの画素に対する輝度、色、モーション、テクスチャ、または方向性のうちの少なくとも1つの差に基づくことができる。
このとき、前記少なくとも1つの視覚的関心マップは、それぞれの画素に対して感知された特徴間の差に基づくことができる。
このとき、前記少なくとも1つの視覚的関心マップは、前記2次元映像の多様な特徴に対応する多数の特徴マップに基づいて生成することができる。
このとき、前記少なくとも1つの視覚的関心マップは、それぞれ互いに異なる複数のスケールの視覚的関心マップの生成によって生成することができる。
このとき、前記3次元映像を生成するステップは、前記少なくとも1つの視覚的関心マップの融合した情報を用いて前記3次元映像を生成することができる。
このとき、前記3次元映像を生成するステップは、前記少なくとも1つの視覚的関心マップの多様なスケールを結合した情報を用いて前記3次元映像を生成することができる。
このとき、前記少なくとも1つの視覚的関心マップを生成するステップは、特徴情報(feature information)を含む特徴マップ(feature map)を互いに異なる複数のスケールで抽出するステップと、複数のスケールの視覚的関心マップを生成するステップと、前記複数のスケールの視覚的関心マップを多様なスケール結合を介して少なくとも1つの視覚的関心マップを生成するステップとを含むことができる。
本発明の実施形態によれば、2次元映像を用いて視覚的関心マップを生成し、これに基づいた視差情報を生成して3次元映像変換に用いることができるようにすることで、観察者により一層臨場感のある3次元映像を提供することができる。
また、本発明の実施形態によれば、映像のテキストまたは物体を画面から観察者方向に引き寄せて配置させることによってユーザの注意を促し、これによって観察者は、テキストまたは物体などが観察者に向かって自然に突出した形態の3次元映像を体感し、より一層臨場感のある3次元立体感を感じることができる。
本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器を適用したシステムを示す図である。 本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器を示す構成図である。 本発明の実施形態に係る視覚的関心マップ生成部を示す構成図である。 本発明の実施形態に係る視覚的関心マップを生成する方法を説明するためのフローチャートである。 本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法を説明するためのフローチャートである。 本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法を説明するためのフローチャートである。 本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法を説明するためのフローチャートである。 本発明の実施形態に係る低レベル関心計算方法を説明するための図である。 本発明のさらに他の実施形態に係る低レベル関心計算方法を説明するための図である。 本発明のさらに他の実施形態に係る低レベル関心計算方法を説明するための図である。 本発明の実施形態に係る映像で関心対象となるオブジェクトを示す図である。 本発明の実施形態に係る映像で関心対象となるオブジェクトを示す図である。 本発明の実施形態に係る映像で関心対象となるオブジェクトを示す図である。 本発明の実施形態に係る映像で関心対象となるオブジェクトを示す図である。 本発明の実施形態に係る映像を示す図である。 本発明の実施形態に係る映像に対して関心対象を表示した視覚的関心マップを示す図である。
以下、添付の図面および添付の図面に記載された内容を参照しながら、実施形態について詳細に説明する。図中、同じ参照符号は同じ部材を示す。
本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換の原理は、2次元映像を分析して視覚的関心度と関連した特徴情報を抽出し、特徴情報を用いて視覚的関心マップを生成し、視覚的関心マップを用いて視覚的関心度に基づいた視差情報を生成することである。
図1は、本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器を適用したシステムを示す図である。図1を参照しながら、本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器および2次元映像の3次元映像変換器が適用されたシステムについて説明する。
より詳細に説明すれば、図1は、本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器130をステレオTV(Stereoscopic TV)120に適用した一例である。
本発明の実施形態に係る2次元映像の3次元映像変換器130は、TVで視聴することができるすべての種類の2次元映像を3次元映像に変換することができる。
すなわち、提案される実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器130は、地上波放送チューナ(Tuner)、衛星放送受信端末機、ケーブルTV受信コンバータ、VCR、DVDプレーヤ、HDTV放送受信機、ブルーレイディスクプレーヤ(Blu−ray Disc Player)、ゲームコンソール(Game Console)などの多様な映像受信および再生装備110に含まれて構成することができる。また、このような映像の受信および再生装備から2次元映像を受信し、表示するディスプレイ装置を介して3次元映像を実現することができる。
ステレオTV装置120に映像が入力されれば、2次元映像の3次元映像変換器130は、ステレオ方式の左眼/右眼映像を生成する。ステレオTV120は左眼/右眼映像を交互に表示し、観察者はIR(赤外線)リンクを介してコントロールされるシャッタ眼鏡(Shutter Glasses)150を使用着用し、左眼および右眼に入力される映像を介して3次元映像を認識することができる。
より詳察すれば、視覚的関心に基づいた2次元映像の3次元映像変換器130は、視覚的に興味深い領域を観察者にできるだけ近くに配置し、興味のない領域を観察者からできるだけ遠くに配置することができる。このような実施形態に係る視覚的関心による3次元映像変換は、既存の深さ基盤ステレオ変換と差別化することができる。
2次元映像の3次元映像への変換のためには、映像の全領域の視差計算が必要となるので、3次元ディスプレイに適した視覚的関心マップによる計算法が必要である。
視覚的関心に基づいた2次元映像の3次元映像変換器130は、輝度、色、テクスチャ、モーション、方向性などの多様な特徴情報に基づいて特徴情報抽出を実行することができる。
視覚的関心に基づいた2次元映像の3次元映像変換器130は、このような特徴情報を用いて視覚的関心マップを生成することができ、このように生成された視覚的関心マップに基づいて推論して最終の視覚的関心マップを完成することができる。
このような方法は、多様な特徴を総合して最終マップを完成するので、1つの特徴に依存する方法に比べて正確かつロバスト(Robust)である。
この後、最終の視覚的関心マップを用いて2次元映像の視差情報を生成し、視差情報を用いてフレーム遅延部140によってフレーム遅延(Frame Delay)が適用された出力フレーム(または映像)が生成される。
観察者は、シャッタ眼鏡150などを介してこのような出力フレーム(または映像)を視聴して3次元映像を認識することができる。
図2は、本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器を示す構成図である。図2を参照しながら、本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器について説明する。
視覚的関心マップ生成部210は、2次元映像におけるオブジェクトの重要度に対する情報である視覚的関心情報を含む視覚的関心マップを生成する。
視覚的関心マップは、2次元映像に対する視覚的関心度を計算して生成され、2次元映像におけるオブジェクトに対する重要度に関する情報を含むことができる。
視覚的関心度は、生理学(Physiology)、心理学(Psychology)、神経系学(Neural Systems)、さらにコンピュータ・ビジョン(Computer Vision)などで研究が進められている。人間の脳と認知システムは一般的に映像の特定領域にさらに集中するという事実が立証され、このような視覚的関心度は、物体認識、追跡、発見などの伝統的コンピュータ・ビジョン問題のソリューション性能向上に適用が可能である。
本発明の実施形態によれば、このような視覚的関心を用いた視覚的関心マップを生成し、これに基づいた視差を生成して3次元映像変換に用いることができる。
すなわち、2次元映像における視覚的に興味深い領域を観測者にできるだけ近くに配置し、興味のない領域を観測者からできるだけ遠ざける。このような視覚的関心による3次元映像変換は、既存の深さ基盤ステレオ変換と差別化される。
視差情報生成部220は、視覚的関心マップを用いて2次元映像の視差情報を生成する。このとき、視差情報生成部220は、視覚的関心マップを用いて2次元映像の左眼映像および右眼映像に対する情報を含む視差情報を生成することができる。
3次元映像制御部230は、視差情報を用いて3次元映像を生成するように制御する。このとき、3次元映像制御部230は、左眼映像および右眼映像を用いて3次元映像を生成することができる。
図3は、本発明の実施形態に係る視覚的関心マップ生成部を示す構成図である。図3を参照しながら、本発明の実施形態に係る視覚的関心マップ生成部の構成について説明する。
視覚的関心マップ生成部210は、特徴マップ抽出部310と、低レベル関心計算部320と、スケール結合部330と、線形/非線形結合部340とを備える。
特徴マップ抽出部310は、オブジェクトと関連した特徴情報を含む特徴マップを抽出する。
低レベル関心計算部320は、特徴マップを用いて視覚的関心マップを生成する。
低レベル関心計算部320は、特徴マップの各ピクセルと各ピクセルの隣接ピクセルとの特徴情報の値の差を計算するコントラスト計算によって視覚的関心マップを生成することができる。また、低レベル関心計算部320は、特徴マップの選定された中央領域と選定された周辺領域の特徴情報の値のヒストグラムの差を計算して視覚的関心マップを生成することができる。
このとき、特徴情報は、輝度、色、モーション、テクスチャ、方向性を含む認識と関連した特徴情報とすることができる。
また、他の実施形態によれば、視覚的関心マップ生成部210は、オブジェクトと関連した特徴情報を含む複数の特徴マップを抽出する特徴マップ抽出部310と、特徴マップを用いて複数の視覚的関心マップを生成する低レベル関心計算部320と、視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成する線形/非線形融合部340とを備えることができる。
また、他の実施形態によれば、視覚的関心マップ生成部210は、オブジェクトと関連した特徴情報を含む特徴マップを多様なスケールで抽出する特徴マップ抽出部310と、多様なスケールの特徴マップを用いて低レベル関心計算(Low−level Attention Computation)をして多様なスケールの視覚的関心マップを生成する低レベル関心計算部320と、多様なスケールの視覚的関心マップを用いて視覚的関心マップを生成するスケール結合部330とを備えることができる。
さらに、他の実施形態によれば、視覚的関心マップ生成部210は、オブジェクトと関連した特徴情報を含む複数の特徴マップを多様なスケールで抽出する特徴マップ抽出部310と、多様なスケールを有する複数の特徴マップを用いて、多様なスケールの視覚的関心マップを複数生成する低レベル関心計算部320と、多様なスケールを有する複数の視覚的関心マップを各特徴情報別に結合した視覚的関心マップを生成するスケール結合部330と、視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成する線形/非線形融合部340とを備えることができる。
このような多様な視覚的関心マップ生成部210の構成により、多様な方法によって視覚的関心マップに基づいて推論し、最終の視覚的関心マップを完成することができる。
図4は、本発明の実施形態に係る視覚的関心マップを生成する方法を説明するためのフローチャートである。図4を参照しながら、本発明の実施形態に係る視覚的関心マップを生成する方法について説明する。
特徴マップ抽出部は、2次元映像のオブジェクトと関連した特徴情報を抽出し(S410)、特徴情報を含む特徴マップを生成する(S420)。
このとき、特徴情報としては、図4に示すように、輝度を用いることができる。すなわち、特徴マップ抽出部は、2次元映像が入力されれば映像分析を介して輝度成分(Luminance component)を抽出することができる。
この後、低レベル関心計算部は、特徴マップを用いて視覚的関心マップを生成する(S430)。
このとき、低レベル関心計算部は、特徴マップを用いて視覚的関心マップを生成するときに、特徴マップの各ピクセルと各ピクセルの隣接ピクセルとの特徴情報の値の差を計算するコントラスト計算によって視覚的関心マップを生成したり、特徴マップの選定された中央領域と選定された周辺領域の特徴情報の値のヒストグラムの差を計算して視覚的関心マップを生成したりすることができる。
すなわち、低レベル関心計算部は、輝度のコントラスト計算または中央−周辺ヒストグラム(Center−surround Histogram)計算によって視覚的関心マップを生成することができ、この他にも輝度の多様な特徴を分析して視覚的関心マップを生成することができる。
図5は、本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法を説明するためのフローチャートである。図5を参照しながら、本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法について説明する。
特徴マップ抽出部は、2次元映像のオブジェクトと関連した複数の特徴情報を抽出し(S510)、抽出された特徴情報を含む複数の特徴マップを生成することができる(S520)。
このとき、特徴情報としては、輝度の他にも、色、モーション、方向性を含む認識と関連した多様な特徴情報を用いることができる。すなわち、特徴マップ抽出部は、多様な特徴情報を用いて複数の特徴マップを抽出することができる。
低レベル関心計算部は、このように抽出された特徴マップを用いて低レベル関心計算し(S530)、複数の視覚的関心マップを生成することができる(S540)。
視覚的認識(Visual Perception)は極めて複雑なプロセスであり、多様な特徴情報が同時に影響を及ぼすことがある。例えば、上記した特徴情報のうちのいずれか2つの特徴情報は、選定された領域に対して低レベル関心計算結果が一致することもあり、これとは反対に相互配置することもある。したがって、よりロバストな視覚的関心マップを生成するためには、多数の特徴情報の結果を総合的に判断しなければならない。
線形/非線形融合部は、このように生成された視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成することができる(S550)。
すなわち、図5に示す一実施形態に係る視覚的関心マップを生成する方法によれば、視覚的関心に基づいた2次元映像の3次元映像変換器は、多様な特徴情報を抽出し、線形融合または非線形融合を用いて視覚的関心マップを生成することができる。したがって、図5の実施形態によれば、視覚関心マップの計算のための多様な特徴情報に対して多様な組み合わせが可能である。
図6は、本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法を説明するためのフローチャートである。図6を参照しながら、本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法について説明する。
一般的に用いられる2次元映像のサイズは多様であり、高画質ビデオ(High Definition Video)や超高画質ビデオ(Ultra High Definition Video)などはすべてのピクセルを対象として現在広く用いられているハードウェアを用い、複雑な(Complex)演算を実行するにはサイズが極めて大きい。
したがって、このような場合には、図6に示すような効率的な演算のために、多重解像度(Multi−resolution)方法を用いることができる。
特徴マップ抽出部は、2次元映像のオブジェクトと関連した特徴情報を抽出し(S610)、抽出された特徴情報を含む特徴マップを多様なスケールで抽出することができる(S620)。
低レベル関心計算部は、多様なスケールの特徴マップを用いて低レベル関心計算をし(S630)、多様なスケールの視覚的関心マップを生成することができる(S640)。
この後、スケール結合部は、多様なスケールの視覚的関心マップを用いて視覚的関心マップを生成することができる(S650)。
すなわち、図6に示すような実施形態によれば、高解像度(High−resolution)で演算する場合に、各ピクセルに対して演算数を減らすことによって全体での時間複雑度を減らすことができ、全体領域または一部領域に対してより多くの情報を提供することができる。
図7は、本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法を説明するためのフローチャートである。図7を参照しながら、本発明のさらに他の実施形態に係る視覚的関心マップを生成する方法について説明する。
特徴マップ抽出部は、2次元映像を用いて視覚的関心度と関連した特徴情報を抽出し(S710)、視覚的関心度と関連した特徴情報を含む複数の特徴マップを多様なスケールで抽出することができる(S720)。
低レベル関心計算部は、多様なスケールを有する複数の特徴マップを用いて低レベル関心計算をし(S730)、多様なスケールの視覚的関心マップを複数生成することができる(S740)。
スケール結合部は、多様なスケールを有する複数の視覚的関心マップを各特徴情報別に結合した視覚的関心マップを生成することができる(S750、S760)。
線形/非線形融合部は、視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成することができる(S770)。
したがって、本発明の実施形態に係る視覚的関心に基づいた2次元映像の3次元映像変換器は、視覚的関心マップを生成して視覚的に興味深い領域を観察者にできるだけ近くに配置し、興味のない領域を観察者からできるだけ遠くに配置し、これに基づいた視差を生成して3次元映像変換に用いることで、観察者により臨場感のある3次元映像を提供することができる。
図8は、本発明の実施形態に係る低レベル関心計算方法を説明するための図である。図8を参照しながら、本発明の実施形態に係る低レベル関心計算方法について説明する。
低レベルの視覚的関心マップ820を計算するためには、特徴マップ810に対する分析が必要となる。
本発明の実施形態によれば、線形融合または非線形融合を介して最終の視覚的関心マップを生成することができる。図8は、このような最終の視覚的関心マップを生成するためにコントラストを用いて計算する方法について説明している。
任意のピクセルの関心値(Attention Value)821は、隣接ピクセル(Neighbor Pixel)との特徴値の差(Feature Value Distance)811で定義することができる。このとき、特徴値の差は、各特徴値のメトリック(metric)に適するように定義される。例えば、輝度に対しては絶対差(Absolute Difference)や二乗差(Squared Difference)などの適用が可能であり、色は色空間(Color space)におけるユークリッド空間(Euclidean Space)などの適用が可能である。
すなわち、図8に示す実施形態のコントラストに基づいた関心マップ(Contrast−based Attention Map)の計算は、視覚的関心と関連した多様なすべての特徴に使用が可能である。
図9および図10は、本発明のさらに他の実施形態に係る低レベル関心計算方法を説明するための図である。図9および図10を参照しながら、本発明のさらに他の実施形態に係る低レベル関心計算方法について説明する。
より詳細に説明すれば、図10は、本発明の実施形態に係る中央−周辺ヒストグラムを用いる方法を示している。
中央−周辺ヒストグラムを用いる方法は、任意のピクセルに基づいて2つのタイプの隣接領域(Neighbor Area)を定義する。ピクセルの基準にしたがい、それぞれを中央領域(Center Area)1011、周辺領域(Surround Area)1012と定義する。周辺領域1012は中央領域1011を含むが、面積は中央領域1011よりも相対的に大きい。
このような2つの隣接領域のヒストグラムを抽出し、多様なヒストグラム差測定(Histogram Distance Measure)を用いて、2つの領域の特徴値の差1021を求めることができる。したがって、2つの領域の特徴の差値による低レベル関心計算を実行することができる。
例えば、図9において、一番左側のオブジェクト(蟻)の場合には、中央領域910と周辺領域920のヒストグラムの差が大きいので差値が高い。一方、右側上端の背景のような場合には、中央領域930と周辺領域940の特性が類似しているので差値が低い。
したがって、一番左側のオブジェクト(蟻)が関心対象として指定された低レベルの関心マップを生成することができる。
このとき、低レベルの関心マップは、このような方法またはこのような方法を確張したものの他にも、異なる多様な接近によって求めることができる。
図11〜14は、本発明の実施形態に係る映像で関心対象となるオブジェクトを示す図である。
図11〜14は、観察者が映像で視覚的に関心の対象となるオブジェクト1110、1210、1220、1310、1320、1330、1410、1420、1430の一例を示している。
このように関心を有する対象を3次元対象に変換するためには、興味度が高い対象を探すだけではなく、視差生成に必要なピクセル単位の関心マップが必要となる。
図15は本発明の実施形態に係る映像を示す図であり、図16は本発明の実施形態に係る視覚的関心マップを示す図である。
図16は、観察者が映像で視覚的に関心を有するオブジェクトを示したものであり、関心度が高いほど白色1610で示され、関心度が低いほど黒色1620で示される。
提案される実施形態によれば、図16に示す視覚的関心マップを用いてオブジェクト(テキストまたは物体など)を観察者の方向に引き寄せて配置させることによってユーザの注意を促し、それによる適した3次元映像を提供することができる。
より詳細に説明すれば、3次元映像を提供するときに、白色部分1610は観察者に近く感じられるようにし、黒色部分1620は観察者から遠く離れているように感じられるようにする。
したがって、観察者は、テキストまたは物体などが観察者に向かって自然に突出した形態の3次元映像として認識することができる。
なお、上述した方法は、コンピュータにより実現される多様な動作を実行するためのプログラム命令を含むコンピュータ読取可能な記録媒体を含む。当該記録媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むこともでき、記録媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。また、記録媒体は、プログラム命令、データ構造などを保存する信号を送信する搬送波を含む光または金属線、導波管などの送信媒体でもある。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高級言語コードを含む。前記したハードウェア要素は、本発明の動作を実行するために一以上のソフトウェアモジュールとして作動するように構成することができ、その逆もできる。
上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明を多様に修正および変更させることができることを理解することができるであろう。すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
110:映像受信および再生装備
120:ステレオTV
130:映像変換器
140:フレーム遅延部
150:シャッタ眼鏡

Claims (40)

  1. 2次元映像から視覚的関心度と関連した特徴情報を抽出し、前記特徴情報を用いて視覚的関心マップを生成するステップと、
    前記視覚的関心マップを用いて視覚的関心度に基づいた視差情報を生成するステップと、
    を含むことを特徴とする視覚的関心に基づいた2次元映像の3次元映像変換方法。
  2. 前記視覚的関心マップを生成するステップは、
    視覚的関心度と関連した特徴情報を含む特徴マップを抽出するステップと、
    前記特徴マップを用いて前記視覚的関心マップを生成するステップと、
    を含むことを特徴とする請求項1に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  3. 前記特徴マップを用いて前記視覚的関心マップを生成するステップは、
    前記特徴マップの各ピクセルと前記各ピクセルの隣接ピクセルとの特徴情報値の差を計算するコントラスト計算によって前記視覚的関心マップを生成することを特徴とする請求項2に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  4. 前記特徴マップを用いて前記視覚的関心マップを生成するステップは、
    前記特徴マップの選定された中央領域と選定された周辺領域の特徴情報値のヒストグラムの差を計算して前記視覚的関心マップを生成することを特徴とする請求項2に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  5. 前記特徴情報は、
    輝度、色、モーション、テクスチャ、または方向性のうちの1つ以上を含むことを特徴とする請求項2に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  6. 前記視覚的関心マップを生成するステップは、
    視覚的関心度と関連した複数の特徴情報を含む複数の特徴マップを抽出するステップと、
    前記複数の特徴マップを用いて複数の視覚的関心マップを生成するステップと、
    前記複数の視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成するステップと、
    を含むことを特徴とする請求項1に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  7. 前記最終の視覚的関心マップを生成するステップは、
    前記複数の視覚的関心マップを線形融合または非線形融合を介して前記最終の視覚的関心マップを生成することを特徴とする請求項6に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  8. 前記複数の特徴マップを用いて前記複数の視覚的関心マップを生成するステップは、
    前記特徴マップの各ピクセルと前記各ピクセルの隣接ピクセルとの前記特徴情報値の差を計算するコントラスト計算によって前記複数の視覚的関心マップを生成するステップ、
    であることを特徴とする請求項6に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  9. 前記特徴マップを用いて前記複数の視覚的関心マップを生成するステップは、
    前記特徴マップの選定された中央領域と選定された周辺領域の特徴情報値のヒストグラムの差を計算して前記複数の視覚的関心マップを生成するステップ、
    であることを特徴とする請求項6に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  10. 前記選定された中央領域と前記選定された周辺領域が1つの連続した領域であれば、前記選定された中央領域は、前記1つの連続した領域の中央に位置することを特徴とする請求項9に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法
  11. 前記特徴情報は、
    輝度、色、モーション、テクスチャ、または方向性のうちの1つ以上を含むことを特徴とする請求項6に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  12. 前記視覚的関心マップを生成するステップは、
    特徴情報を含む特徴マップを互いに異なる複数のスケールで抽出するステップと、
    前記互いに異なる複数のスケールの特徴マップを用いて、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップと、
    前記それぞれ互いに異なる複数のスケールの視覚的関心マップを用いて、最終の視覚的関心マップを生成するステップと、
    を含むことを特徴とする請求項1に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  13. 前記互いに異なる複数のスケールの特徴マップを用いて、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップは、
    前記特徴マップの各ピクセルと前記各ピクセルの隣接ピクセルとの特徴情報値の差を計算するコントラスト計算によって、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップ、
    であることを特徴とする請求項12に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  14. 前記それぞれ互いに異なる複数のスケールの特徴マップを用いて、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップは、
    前記特徴マップの選定された中央領域と選定された周辺領域の前記特徴情報の値のヒストグラムの差を計算して、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップ、
    であることを特徴とする請求項12に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  15. 前記特徴情報は、
    輝度、色、モーション、テクスチャ、または方向性のうちの1つ以上を含むことを特徴とする請求項12に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  16. 前記視覚的関心マップを生成するステップは、
    前記特徴情報を含む複数の特徴マップをそれぞれ互いに異なる複数のスケールで抽出するステップと、
    前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップを用いて、前記それぞれ互いに異なる複数のスケールを有する視覚的関心マップを複数生成するステップと、
    前記それぞれ互いに異なる複数のスケールを有する複数の視覚的関心マップを各特徴情報別に結合した結合視覚的関心マップを生成するステップと、
    前記結合視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成するステップと、
    を含むことを特徴とする請求項1に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  17. 前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップを用いて、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを複数生成するステップは、
    前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップそれぞれにおいて、各ピクセルと前記各ピクセルの隣接ピクセルとの前記特徴情報の値の差を計算するコントラスト計算によって、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップ、
    であることを特徴とする請求項16に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  18. 前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップを用いて、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを複数生成するステップは、
    前記複数の特徴マップそれぞれにおいて、前記特徴マップの選定された中央領域と選定された周辺領域の前記特徴情報の値のヒストグラムの差を計算して、前記それぞれ互いに異なる複数のスケールの視覚的関心マップを生成するステップ、
    であることを特徴とする請求項16に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  19. 前記視差情報を用いて3次元映像を生成するステップ、
    をさらに含むことを特徴とする請求項1に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  20. 前記視差情報を用いて3次元映像を生成するステップは、
    前記2次元映像の視差情報による左眼映像および右眼映像を用いて3次元映像を生成するステップ、
    であることを特徴とする請求項19に記載の視覚的関心に基づいた2次元映像の3次元映像変換方法。
  21. 2次元映像を分析して視覚的関心度と関連した特徴情報を抽出し、前記特徴情報を用いて視覚的関心マップを生成する視覚的関心マップ生成部と、
    前記視覚的関心マップを用いて視覚的関心度に基づいた視差情報を生成する視差情報生成部と、
    を備えることを特徴とする視覚的関心に基づいた2次元映像の3次元映像変換器。
  22. 前記視覚的関心マップ生成部は、
    前記特徴情報を含む特徴マップを抽出する特徴マップ抽出部と、
    前記特徴マップを用いて前記視覚的関心マップを生成する低レベル関心計算部と、
    を備えることを特徴とする請求項21に記載の視覚的関心に基づいた2次元映像の3次元映像変換器。
  23. 前記低レベル関心計算部は、
    前記特徴マップの各ピクセルと前記各ピクセルの隣接ピクセルとの前記特徴情報の値の差を計算するコントラスト計算によって前記視覚的関心マップを生成することを特徴とする請求項22に記載の視覚的関心に基づいた2次元映像の3次元映像変換器。
  24. 前記低レベル関心計算部は、
    前記特徴マップの選定された中央領域と選定された周辺領域の特徴情報値のヒストグラムの差を計算して前記視覚的関心マップを生成することを特徴とする請求項22に記載の視覚的関心に基づいた2次元映像の3次元映像変換器。
  25. 前記視覚的関心マップ生成部は、
    前記オブジェクトと関連した複数の特徴情報を含む複数の特徴マップを抽出する特徴マップ抽出部と、
    前記複数の特徴マップを用いて前記複数の視覚的関心マップを生成する低レベル関心計算部と、
    前記視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成する線形/非線形融合部と、
    を備えることを特徴とする請求項21に記載の視覚的関心に基づいた2次元映像の3次元映像変換器。
  26. 前記視覚的関心マップ生成部は、
    前記特徴情報を含む特徴マップをそれぞれ互いに異なる複数のスケールで抽出する特徴マップ抽出部と、
    前記それぞれ互いに異なる複数のスケールの特徴マップを用いて、それぞれ互いに異なる複数のスケールの視覚的関心マップを生成する低レベル関心計算部と、
    前記それぞれ互いに異なる複数のスケールの視覚的関心マップを用いて最終の視覚的関心マップを生成するスケール結合部と、
    を備えることを特徴とする請求項21に記載の視覚的関心に基づいた2次元映像の3次元映像変換器。
  27. 前記視覚的関心マップ生成部は、
    前記特徴情報を含む複数の特徴マップをそれぞれ互いに異なる複数のスケールで抽出する特徴マップ抽出部と、
    前記それぞれ互いに異なる複数のスケールを有する複数の特徴マップを用いて、前記それぞれ互いに異なる複数のスケールを有する視覚的関心マップを複数生成する低レベル関心計算部と、
    前記それぞれ互いに異なる複数のスケールを有する複数の視覚的関心マップを各特徴情報別に結合した結合視覚的関心マップを生成するスケール結合部と、
    前記結合した視覚的関心マップを線形融合または非線形融合を介して最終の視覚的関心マップを生成する線形/非線形融合部と、
    を備えることを特徴とする請求項21に記載の視覚的関心に基づいた2次元映像の3次元映像変換器。
  28. 2次元映像から視覚的関心を意味する要素を抽出するステップと、
    前記視覚的関心を意味する要素に基づいた3次元表示情報を提供するステップと、
    を含む方法。
  29. 2次元映像の視覚的関心度に対応する特徴情報を用いて少なくとも1つの視覚的関心マップを生成するステップと、
    前記少なくとも1つの視覚的関心マップと前記2次元映像からの情報を用いて3次元映像を生成するステップと、
    を含むことを特徴とする2次元映像の3次元映像変換方法。
  30. 前記視覚的関心度は、
    前記2次元映像においてオブジェクトの重要性に対する情報であることを特徴とする請求項29に記載の2次元映像の3次元映像変換方法。
  31. 請求項28の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  32. 前記視覚的関心度は、
    イメージの特定地域において観察者のフォーカスに関する情報であることを特徴とする請求項29に記載の2次元映像の3次元映像変換方法。
  33. 前記少なくとも1つの視覚的関心マップと前記2次元映像からの情報は、
    左眼イメージと右眼イメージに対する情報を含むことを特徴とする請求項29に記載の2次元映像の3次元映像変換方法。
  34. 前記少なくとも1つの視覚的関心マップは、
    それぞれの画素に対して輝度、色、モーション、テクスチャ、または方向性のうちの少なくとも1つの差に基づくことを特徴とする請求項29に記載の2次元映像の3次元映像変換方法。
  35. 前記少なくとも1つの視覚的関心マップは、
    それぞれの画素に対して感知された特徴間の差に基づくことを特徴とする請求項29に記載の2次元映像の3次元映像変換方法。
  36. 前記少なくとも1つの視覚的関心マップは、
    前記2次元映像の多様な特徴に対応する多数の特徴マップに基づいて生成されることを特徴とする請求項29に記載の2次元映像の3次元映像変換方法。
  37. 前記少なくとも1つの視覚的関心マップは、
    それぞれ互いに異なる複数のスケールの視覚的関心マップの生成によって生成されることを特徴とする請求項29に記載の2次元映像の3次元映像変換方法。
  38. 前記3次元映像を生成するステップは、
    前記少なくとも1つの視覚的関心マップの融合した情報を用いて前記3次元映像を生成することを特徴とする請求項36に記載の2次元映像の3次元映像変換方法。
  39. 前記3次元映像を生成するステップは、
    前記少なくとも1つの視覚的関心マップの多様なスケールを結合した情報を用いて前記3次元映像を生成することを特徴とする請求項37に記載の2次元映像の3次元映像変換方法。
  40. 前記少なくとも1つの視覚的関心マップを生成するステップは、
    特徴情報を含む特徴マップを互いに異なる複数のスケールで抽出するステップと、
    複数のスケールの視覚的関心マップを生成するステップと、
    前記複数のスケールの視覚的関心マップを多様なスケール結合を介して少なくとも1つの視覚的関心マップを生成するステップと、
    を含むことを特徴とする請求項29に記載の2次元映像の3次元映像変換方法。
JP2009234374A 2008-10-09 2009-10-08 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法 Pending JP2010093816A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20080099197 2008-10-09
KR1020090025444A KR20100040236A (ko) 2008-10-09 2009-03-25 시각적 관심에 기반한 2차원 영상의 3차원 영상 변환기 및 변환 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2014105698A Division JP5969537B2 (ja) 2008-10-09 2014-05-21 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法

Publications (1)

Publication Number Publication Date
JP2010093816A true JP2010093816A (ja) 2010-04-22

Family

ID=41351548

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2009234374A Pending JP2010093816A (ja) 2008-10-09 2009-10-08 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法
JP2014105698A Active JP5969537B2 (ja) 2008-10-09 2014-05-21 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2014105698A Active JP5969537B2 (ja) 2008-10-09 2014-05-21 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法

Country Status (4)

Country Link
US (2) US20100266198A1 (ja)
EP (1) EP2175664A1 (ja)
JP (2) JP2010093816A (ja)
KR (1) KR20100040236A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012029168A (ja) * 2010-07-26 2012-02-09 Toshiba Corp 視差画像生成方法及び装置
WO2012157887A2 (en) * 2011-05-19 2012-11-22 Samsung Electronics Co., Ltd. Apparatus and method for providing 3d content
WO2013186881A1 (ja) * 2012-06-13 2013-12-19 株式会社エム・ソフト 立体視画像生成方法および立体視画像生成システム
JP2014504468A (ja) * 2011-08-18 2014-02-20 ベイジン・ゴランド・テック・カンパニー・リミテッド 画像運動情報に基づく2dから3dへの変換方法
CN109658517A (zh) * 2018-12-20 2019-04-19 广东精鹰传媒股份有限公司 二维箭图在虚拟环境下产生三维视觉效果的实现方法
JP2019128889A (ja) * 2018-01-26 2019-08-01 日本放送協会 画像情報変換器およびそのプログラム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012037685A1 (en) * 2010-09-22 2012-03-29 Berfort Management Inc. Generating 3d stereoscopic content from monoscopic video content
US20120105581A1 (en) * 2010-10-29 2012-05-03 Sony Corporation 2d to 3d image and video conversion using gps and dsm
JP5468526B2 (ja) * 2010-11-25 2014-04-09 株式会社東芝 画像処理装置及び画像処理方法
JP2012174145A (ja) * 2011-02-23 2012-09-10 Nintendo Co Ltd 情報処理プログラム、情報処理装置、情報処理方法及び情報処理システム
KR101121625B1 (ko) * 2011-04-28 2012-03-09 서울대학교산학협력단 양안 영상데이터 생성 단말 및 방법
JP2012257022A (ja) * 2011-06-08 2012-12-27 Sony Corp 画像処理装置および方法、並びにプログラム
CA2855190C (en) 2011-10-05 2017-02-07 Bitanimate, Inc. Resolution enhanced 3d video rendering systems and methods
US8687470B2 (en) 2011-10-24 2014-04-01 Lsi Corporation Optical disk playback device with three-dimensional playback functionality
KR101960844B1 (ko) * 2011-11-01 2019-03-22 삼성전자주식회사 영상 처리 장치 및 방법
CN103686139B (zh) 2013-12-20 2016-04-06 华为技术有限公司 帧图像转换方法、帧视频转换方法及装置
CN106470338A (zh) * 2015-08-21 2017-03-01 深圳市天易联科技有限公司 基于智能电视的3d游戏转换方法及装置
US10839593B2 (en) 2016-04-08 2020-11-17 Maxx Media Group, LLC System, method and software for adding three-dimensional images to an intelligent virtual assistant that appear to project forward of or vertically above an electronic display
CN106934397B (zh) * 2017-03-13 2020-09-01 北京市商汤科技开发有限公司 图像处理方法、装置及电子设备
CN109389055B (zh) * 2018-09-21 2021-07-20 西安电子科技大学 基于混合卷积和注意力机制的视频分类方法
KR102562731B1 (ko) * 2020-11-06 2023-08-01 연세대학교 산학협력단 자기 집중 모듈 및 이를 이용한 정규화 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08331607A (ja) * 1995-03-29 1996-12-13 Sanyo Electric Co Ltd 三次元表示画像生成方法
JP2000092516A (ja) * 1998-09-17 2000-03-31 Sanyo Electric Co Ltd 2次元映像を3次元映像に変換する装置および方法
JP2000209614A (ja) * 1999-01-14 2000-07-28 Sony Corp 立体映像システム
JP2001515287A (ja) * 1997-09-02 2001-09-18 ダイナミック ディジタル デプス リサーチ プロプライエタリー リミテッド 画像処理方法および装置
JP2005049668A (ja) * 2003-07-30 2005-02-24 Sharp Corp データ変換装置、表示装置、データ変換方法、プログラム及び記録媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69528946T2 (de) * 1994-09-22 2003-10-02 Sanyo Electric Co Verfahren zum Umsetzen von zweidimensionalen Bildern in dreidimensionale Bilder
US20050047647A1 (en) * 2003-06-10 2005-03-03 Ueli Rutishauser System and method for attentional selection
EP1544792A1 (en) * 2003-12-18 2005-06-22 Thomson Licensing S.A. Device and method for creating a saliency map of an image
US20070156382A1 (en) * 2005-12-29 2007-07-05 Graham James L Ii Systems and methods for designing experiments
EP2041984A4 (en) * 2006-07-17 2009-08-05 Thomson Licensing METHOD AND DEVICE FOR ADAPTING A DEFAULT CODING OF A DIGITAL VIDEO SIGNAL DURING A SCENE CHANGE PERIOD
US7853072B2 (en) * 2006-07-20 2010-12-14 Sarnoff Corporation System and method for detecting still objects in images
JP5615552B2 (ja) * 2006-11-21 2014-10-29 コーニンクレッカ フィリップス エヌ ヴェ 画像の深度マップの生成
KR101037940B1 (ko) * 2007-01-30 2011-05-30 삼성전자주식회사 압축 영상의 화질 검출장치 및 방법
WO2008109771A2 (en) * 2007-03-08 2008-09-12 Second Sight Medical Products, Inc. Saliency-based apparatus and methods for visual prostheses

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08331607A (ja) * 1995-03-29 1996-12-13 Sanyo Electric Co Ltd 三次元表示画像生成方法
JP2001515287A (ja) * 1997-09-02 2001-09-18 ダイナミック ディジタル デプス リサーチ プロプライエタリー リミテッド 画像処理方法および装置
JP2000092516A (ja) * 1998-09-17 2000-03-31 Sanyo Electric Co Ltd 2次元映像を3次元映像に変換する装置および方法
JP2000209614A (ja) * 1999-01-14 2000-07-28 Sony Corp 立体映像システム
JP2005049668A (ja) * 2003-07-30 2005-02-24 Sharp Corp データ変換装置、表示装置、データ変換方法、プログラム及び記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6013044911; Itty, Koch, Niebur: 'A Model of Saliency-Based Visual Attention for Rapid Scene Analysis' IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE VOL.20, NO.11, 199811, P1254-1259 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012029168A (ja) * 2010-07-26 2012-02-09 Toshiba Corp 視差画像生成方法及び装置
WO2012157887A2 (en) * 2011-05-19 2012-11-22 Samsung Electronics Co., Ltd. Apparatus and method for providing 3d content
WO2012157887A3 (en) * 2011-05-19 2013-03-21 Samsung Electronics Co., Ltd. Apparatus and method for providing 3d content
JP2014504468A (ja) * 2011-08-18 2014-02-20 ベイジン・ゴランド・テック・カンパニー・リミテッド 画像運動情報に基づく2dから3dへの変換方法
WO2013186881A1 (ja) * 2012-06-13 2013-12-19 株式会社エム・ソフト 立体視画像生成方法および立体視画像生成システム
JP2019128889A (ja) * 2018-01-26 2019-08-01 日本放送協会 画像情報変換器およびそのプログラム
JP7042092B2 (ja) 2018-01-26 2022-03-25 日本放送協会 画像情報変換器およびそのプログラム
CN109658517A (zh) * 2018-12-20 2019-04-19 广东精鹰传媒股份有限公司 二维箭图在虚拟环境下产生三维视觉效果的实现方法

Also Published As

Publication number Publication date
KR20100040236A (ko) 2010-04-19
US20100266198A1 (en) 2010-10-21
EP2175664A1 (en) 2010-04-14
JP5969537B2 (ja) 2016-08-17
US20160065939A1 (en) 2016-03-03
JP2014222874A (ja) 2014-11-27

Similar Documents

Publication Publication Date Title
JP5969537B2 (ja) 視覚的関心に基づいた2次元映像の3次元映像変換器および変換方法
JP5750505B2 (ja) 立体映像エラー改善方法及び装置
KR101690297B1 (ko) 영상 변환 장치 및 이를 포함하는 입체 영상 표시 장치
US8406524B2 (en) Apparatus, method, and medium of generating visual attention map
JP2013527646A5 (ja)
US20090315981A1 (en) Image processing method and apparatus
US20110271235A1 (en) Method for displaying a setting menu and corresponding device
CN102780902B (zh) 处理三维图像的装置和方法
CN103081476A (zh) 利用深度图信息转换三维图像的方法和设备
KR20100002048A (ko) 영상 처리 방법, 영상 출력 방법 및 그 장치
CN104272729A (zh) 用于处理3d视频的质量度量
KR20120039767A (ko) 3차원 비디오 위에 그래픽 객체를 오버레이하기 위한 추천 깊이 값
KR101674568B1 (ko) 영상 변환 장치 및 이를 포함하는 입체 영상 표시 장치
JP4892113B2 (ja) 画像処理方法及び装置
KR101797035B1 (ko) 오버레이 영역의 3d 영상 변환 방법 및 그 장치
JP2012019517A (ja) ディスプレイ方法および装置
EP2515544B1 (en) 3D image processing apparatus and method for adjusting 3D effect thereof
KR101228916B1 (ko) 멀티 비젼의 3차원 영상 표시 장치 및 방법
KR101519463B1 (ko) 3d 이미지 변환 장치 및 그 방법
JP2014072809A (ja) 画像生成装置、画像生成方法、画像生成装置用プログラム
KR20160056132A (ko) 영상 변환 장치 및 그 영상 변환 방법
KR20150044455A (ko) 감성광고 기반의 플래시 기능을 구비한 스마트 tv
EP2525582A2 (en) Apparatus and Method for Converting 2D Content into 3D Content, and Computer-Readable Storage Medium Thereof
US9210406B2 (en) Apparatus and method for converting 2D content into 3D content
KR20120023218A (ko) 2d 및 3d 겸용 디스플레이 장치, 3d 보조 장치 및 선택적인 디스플레이 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130823

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130917

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131213

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140121