JP5450739B2 - 画像処理装置及び画像表示装置 - Google Patents

画像処理装置及び画像表示装置 Download PDF

Info

Publication number
JP5450739B2
JP5450739B2 JP2012189900A JP2012189900A JP5450739B2 JP 5450739 B2 JP5450739 B2 JP 5450739B2 JP 2012189900 A JP2012189900 A JP 2012189900A JP 2012189900 A JP2012189900 A JP 2012189900A JP 5450739 B2 JP5450739 B2 JP 5450739B2
Authority
JP
Japan
Prior art keywords
face
image
information
unit
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012189900A
Other languages
English (en)
Other versions
JP2014049866A (ja
Inventor
奈保 澁久
圭 徳井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2012189900A priority Critical patent/JP5450739B2/ja
Priority to US14/423,485 priority patent/US20150206354A1/en
Priority to CN201380043318.1A priority patent/CN104584531B/zh
Priority to PCT/JP2013/072546 priority patent/WO2014034556A1/ja
Publication of JP2014049866A publication Critical patent/JP2014049866A/ja
Application granted granted Critical
Publication of JP5450739B2 publication Critical patent/JP5450739B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2621Cameras specially adapted for the electronic generation of special effects during image pickup, e.g. digital cameras, camcorders, video cameras having integrated special effects capability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/20Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/75Determining position or orientation of objects or cameras using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/261Image signal generators with monoscopic-to-stereoscopic image conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • H04N7/144Constructional details of the terminal equipment, e.g. arrangements of the camera and the display camera and display on the same optical axis, e.g. optically multiplexing the camera and display for eye to eye contact
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0088Synthesising a monoscopic image signal from stereoscopic images, e.g. synthesising a panoramic or high resolution monoscopic image

Description

本発明は、撮像部の撮像方向と表示部の表示方向が揃うような、いわゆる自分撮り撮影の場合に、好適な自分撮り画像を生成する画像処理装置、及びその画像処理装置を備える画像表示装置に関する。
携帯電話、タブレット、ノートPCやテレビなどの各種ディスプレイにおいて、撮像部の撮像方向と表示部の表示方向とを同一の方向に向けて配置し、自分の顔を被写体として撮像する、いわゆる自分撮り撮影がある。
自分撮り撮影の代表的なアプリケーションには以下の2つがある。1つは、遠隔地の相手が保有するディスプレイに撮像画像を表示することで遠隔地の相手との会話を可能にするビデオチャット、もしくはTV会議機能である。もう1つは、撮像した画像を左右反転させて鏡像表示することで自分の顔の確認が必要な化粧などの作業を可能にするミラー機能である。
ビデオチャットでは表示部に相手の顔が表示され、ミラー機能では表示部に自分の顔が表示されるため、使用者は撮像部ではなく、表示部を注視することになる。撮像される被写体の視線方向と撮像部の撮像方向が一致しないため、撮像される被写体は正面を向いておらず、遠隔地にいる相手、もしくは被写体本人が撮像画像を見ても被写体と視線が一致しない状態となる。この被写体の顔方向を補正する方法として、例えば、下記特許文献1では、複数の撮像手段を画像表示部の表示画面の外側部に分散して配置し、各撮像手段によって得られた複数の撮像データから被写体の画像を処理して三次元画像を得ることにより、撮像部に正対した被写体の画像を生成する方法が開示されている。
特開2004−159061号公報
しかしながら、先述した方法では、撮像した被写体が常に表示画面に正対した画像に修正されてしまう。例えば、被写体の横顔を撮像したいときでも正対した画像に修正されてしまい、好適な自分撮り画像を生成することが困難であった。
本発明は上記課題を鑑みて発明されたものであり、撮像部の撮像方向と表示部の表示方向が揃うような、いわゆる自分撮り撮影の場合に、好適な自分撮り画像を生成する画像処理装置を提供することを目的とする。
本発明の一観点によれば、本発明の画像処理装置は、画像データから被写体の顔位置情報と、顔の大きさ情報と、顔部品情報とを検出する顔情報検出部と、前記顔位置情報と、前記顔の大きさ情報と、前記顔部品情報とから前記被写体の顔方向情報を算出する顔方向算出部と、前記顔位置情報が前記画像データの中心となるように前記画像データを平行移動させる画像平行移動部と、前記顔位置情報と、前記顔の大きさ情報と、前記顔部品情報と、前記顔方向情報とに基づいて顔の立体形状を表す顔立体形状テンプレート情報を変形させて前記被写体の顔モデルを生成する顔モデル生成部と、前記顔方向情報と前記顔モデルとに基づいて前記被写体の顔を正面顔になるように変換した画像を生成する画像生成部と、を備え、前記顔方向情報に応じて、前記画像平行移動部によって平行移動させた画像データを出力する処理と、前記画像生成部によって生成された画像データを出力する処理とを切り替えることを特徴とする。
また、本発明の他の観点によれば、被写体を撮像する撮像部と、前記撮像部で撮像された前記被写体の画像データを処理する前記画像処理装置と、前記画像処理装置において生成された画像を送信する送信部と、を備える画像表示装置が提供される。
また、本発明の他の観点によれば、被写体を撮像する撮像部と、前記撮像部で撮像された前記被写体の画像データを処理する前記画像処理装置と、他の撮像部付き画像表示装置で生成された画像データを受信する受信部と、を備える画像表示装置が提供される。
本発明によれば、撮像部の撮像方向と表示部の表示方向が揃うような、いわゆる自分撮り撮影の場合に、被写体の顔方向に応じて適切に画像処理することができ、好適な自分撮り撮像画像を生成できるようになる。
本発明の画像処理装置を備える画像表示装置の第1実施例のシステム構成を示す図である。 顔情報検出部で検出される顔部品情報と顔の大きさ情報と顔の位置情報を説明する図である。 被写体の顔方向情報と目の配置の関係を説明する図である。 被写体の顔の向きと撮像部の撮像方向とが成す角度を説明する図である。 画像平行移動部の動作を説明する図である。 画像平行移動部の動作を説明する図である。 顔モデル生成で使用する顔立体形状テンプレート情報を説明する図である。 生成された顔モデルを説明する図である。 画像生成部の動作を説明する図である。 本発明の第1実施例における動作のフローチャートである。 本発明の画像処理装置を備える画像表示装置の第2実施例のシステム構成を示す図である。
以下、添付図面を参照して本発明の実施例について説明する。なお、添付図面は本発明の原理に則った具体的な実施例と実装例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではない。また、各図における構成は、理解しやすいように誇張して記載しており、実際の間隔や大きさとは異なる。
<第1実施例>
図1は、本発明の画像処理装置101を備える画像表示装置100の実施例を示す図であり、画像表示装置100で被写体を自分撮りして、撮像した自分の画像から好適な自分撮り画像を生成し、生成画像を表示部104に表示する場合の例を示す。
以下、本発明の第1の実施例のシステム構成及び動作の詳細を、図1を用いて詳細に説明する。本実施例に係る画像表示装置100は、例えば、カメラ付き携帯電話やタブレット等の通信端末であり、画像の撮像や撮像した画像の保存と伝送等を行うことができる。
画像表示装置100は、撮像部103と、表示部104と、記憶部105と、画像処理装置101と、送受信部106と、入出力部107と、を備える。また、画像表示装置100は、送受信部106を介して外部ネットワーク113と接続され、他の通信機器等につながっている。
撮像部103は、撮像レンズ及びCCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の撮像素子を備えており、被写体の静止画や動画を撮像できる。
表示部104は、LCD(Liquid Crystal Display:液晶ディスプレイ)や有機EL(Electro Luminescence)ディスプレイなどの表示画面であり、画像や文字などの情報や被写体の画像等を表示する。
画像処理装置101は、例えばCPU(Central Processing Unit:中央処理装置)やGPU(Graphic Processing Unit:画像処理用処理装置)等で構成することができ、撮像部103、記憶部105、入出力部107、送受信部106等から画像、テキスト、音声などの情報を取得して処理し、表示部104、記憶部105等へ処理後の情報を出力する。
また、画像処理装置101は、顔情報検出部108と、顔方向算出部109と、画像平行移動部110と、顔モデル生成部111と、画像生成部112とを備えている。顔情報検出部108は、画像処理装置101に入力される画像データから、顔情報(被写体の顔の位置情報、顔の大きさ情報、及び、顔部品情報、すなわち目や鼻や口等の顔の特徴)を抽出する。
顔方向算出部109は、顔情報検出部108で検出された顔情報を基に、被写体の顔方向情報を算出する。また、画像平行移動部110は、検出された被写体の顔位置情報が画像中心となるように画像データの顔領域を平行移動する。
顔モデル生成部111は、顔情報検出部108で検出された顔情報と、顔方向算出部109で算出された顔方向情報と、顔立体形状テンプレート情報とを基に、被写体に応じた顔モデルを生成する。顔立体形状テンプレート情報については後述する。また、画像生成部112は、顔方向情報と顔モデルとを基に、被写体の顔が正面顔となるように補正する。
記憶部105は、例えばフラッシュメモリやハードディスクであり、画像と顔立体形状テンプレート情報等を記憶したり、機器固有のデータを保存したりする。また、入出力部107は、キーボタンやマイクやスピーカー等の音声入出力装置等、ユーザの命令や音声などを画像処理装置101に入力したり音声を出力したりする。また、送受信部106は、携帯電話の通信部やケーブル等であり、外部と画像データ、画像生成に必要なデータ、顔立体形状テンプレート情報等を送受信する。以上が第1の実施例のシステム構成である。
次に、第1の実施例における画像表示装置100の動作について図2乃至図9を用いて詳しく説明する。まず、顔情報検出の動作について、図2を用いて説明をする。図2は、顔情報検出部108で検出される顔部品情報と顔の大きさ情報と顔の位置情報を説明する図である。
顔情報検出部108は、画像データから、被写体の顔情報として、顔位置情報と顔の大きさ情報と顔部品情報(すなわち、被写体の顔の目(201Lと201R)や鼻202や口203等の顔の特徴)を検出する。ここで、顔位置情報とは、検出された顔領域の中心位置204のことである。顔の大きさ情報とは、検出された顔領域の縦画素数と横画素数のことである。つまり、顔領域の中心位置204とは、顔領域の横方向をx軸、縦方向をy軸、顔領域左上を原点(x、y)=(0、0)とし、顔領域の縦解像度をh_k、横解像度をw_kとしたとき、(x、y)=(w_k/2、h_k/2)となる位置のことである。
検出された顔領域の画像データから顔位置情報204と顔の大きさ情報と顔部品情報(両眼201Lと201R、鼻202、口203等)とを検出する方法は、肌色を検出して顔領域を特定した後に目、鼻、口等をパターンマッチングで検出する方法や、多数の顔画像と顔以外の画像(非顔)の学習サンプルから統計的に識別関数を求め、顔位置情報と顔部品情報を検出する方法(P.Viola and M.Jones,“Rapid object detection using a boosting cascade of simple features”,Proc.IEEE Conf.CVPR,pp.511−518,2001)が知られており、上述した方法を用いてもよい。以上により、顔部品情報の検出がなされる。
次に、顔方向算出の動作について、図3を用いて説明をする。図3は、被写体の顔方向情報と目の配置の関係を説明する図である。
顔方向算出部109は、顔情報検出部108で検出された顔情報を基に、被写体の顔方向情報を算出する。顔方向算出部109は、撮像画像から検出された被写体の顔の位置情報と顔の大きさ情報と顔部品情報(目・鼻・口等)とから、被写体の顔の向きを検出する。画像から検出された顔位置情報や目、鼻、口等の顔部品情報を利用して顔の方向を決定する方法は、様々な方向を向いた顔画像とのパターンマッチング、顔部品情報の位置関係を用いる方法が知られている。ここでは、顔部品情報の位置関係を用いた方法を説明する。
顔の向きと顔領域内における顔部品情報の位置には図3に示す関係がある。図3の枠301〜305は、顔の位置情報と顔の大きさ情報を用いて切り出した被写体の顔領域である。図3のように顔領域内を4分割し、被写体の顔部品情報が偏っている方向を、被写体の顔方向情報として算出する。
顔領域301は顔部品情報が上に偏っているため、顔方向は上向きであると判断する。また、顔領域302は顔部品情報が左に偏っているため、顔方向は左向きであると判断する。また、顔領域304は顔部品情報が右に偏っているため、顔方向は右向きであると判断する。また、顔領域305は顔部品情報が下に偏っているため、顔方向は下向きであると判断する。このとき、顔の向きとして、図4に示すように撮像部401と表示部402が異なる位置に配置されている場合に、顔画像が正面顔のとき0度となるような角度403で算出しておくと、後述する画像生成の際に、より品質の高い正面顔画像を生成することができるため好適である。正面顔とは被写体が撮像部(103または401)に正対している状態で撮像された顔画像のことである。
ここでは顔領域における左右の目の位置関係だけで顔方向の算出を行ったが、鼻や口等の目以外の顔部品情報を用いると顔方向算出の精度を向上させることができるため好適である。以上により顔方向の算出がなされる。
次に、画像平行移動の動作について図5及び図6を用いて説明をする。図5は、画像平行移動部110の動作を説明する図であり、被写体の顔方向が横向きの場合の例である。画像平行移動部110は、画像データ501上の顔位置情報503が画像中心504となるように、画像データ501を平行移動させる。画像中心504とは、画像の横方向をx軸、縦方向をy軸、画像左上を原点(x、y)=(0、0)とし、画像の縦解像度をh、横解像度をwとしたとき、(x、y)=(w/2、h/2)となる位置のことである。
図6は、画像平行移動部110の動作を説明する図であり、被写体の顔方向が横向き以外の場合の例である。図6に示すように、画像平行移動部110は、画像データ601上の顔位置情報603が画像中心604となるように画像データ601を平行移動させる。
図5及び図6において、平行移動後の画像データ505または605では、被写体の顔領域502または602が画面中心に表示されており、ユーザが見易い好適な画像が生成できている。このとき、表示部104の解像度よりも撮像データの解像度が大きいと、顔位置情報を平行移動させたときに画角外の領域が現れることがないため好適である。画角外領域が表れた場合は、画角外領域に黒色を表示する方法や、画像端を引き延ばす方法、画像端付近領域を折り返して表示する方法を用いて、画角外領域の補間を行う。
また、検出された被写体の顔位置情報に対して時間軸方向に平滑化フィルタやメディアンフィルタ等を施すと、動画や連続撮像画像に適用した際に被写体の顔位置情報の微小変動が抑制され、一定の位置に顔画像が表示されるため好適である。また、検出された顔位置情報の時間軸方向の二次微分を算出して顔位置情報が大きく変動する瞬間を検出し、顔位置情報が微小変動しているときにだけ平滑化処理を施す。このように、顔位置情報が大きく変動するときは位置の変動に追随するように顔位置情報を大きく移動させ、顔位置情報が微小変動を繰り返しているときは微小変動を抑制すると、一定の位置に顔画像が表示されるため好適である。以上の効果は、被写体の顔位置情報だけでなく、被写体の顔の向きにおいても同様の効果が得られる。
次に、顔モデル生成の動作について図7及び図8を用いて説明をする。図7は、顔モデル生成で使用する顔立体形状テンプレート情報を説明する図である。顔モデル生成部111は、顔情報検出部108で検出された顔の大きさ情報と、顔方向算出部109で算出された顔の向きと、顔立体形状テンプレート情報とを用いて顔モデルを生成し、生成された顔モデルを画像生成部112に出力する。なお、顔モデル生成部111の処理対象となる画像データは、画像平行移動部110によって平行移動処理が施された後の画像データである。
ここで、顔モデル生成に用いる顔の立体形状を表す顔立体形状テンプレート情報について詳しく説明する。顔立体形状テンプレート情報とは、図7のように顔の立体形状が記録されたデータのことである。ここでは、簡単のために被写体の顔を球として表現している。顔立体形状テンプレート情報は、人物の顔の平均顔であり、複数人のサンプルから取得した顔の立体形状を平均して作成することができる。また、CG(Computer Graphics)を用いても作成することができる。図7に示した顔立体形状テンプレート情報701は、画像表示装置100から顔までの距離を画素毎に格納した画像であり、顔の立体形状を輝度値で表している。画像表示装置100に近い顔の部分ほど距離は短く、画像表示装置100に遠い被写体ほど距離は長くなる。ここでは距離が短いほど明るい画素で、距離が長いほど暗い画素で表している。この顔立体形状テンプレート情報を用いて、顔モデルの生成を行う。
まず、顔立体形状テンプレート情報の大きさ情報と、検出された顔の大きさ情報に合わせる。すなわち、顔立体形状テンプレート情報の縦解像度と横解像度を、検出された顔領域の縦解像度と横解像度が等しくなるように、顔立体形状テンプレート情報を拡大あるいは縮小する。拡大あるいは縮小することにより、顔の大きさ情報とおおよそ同じ大きさとなった顔立体形状テンプレート情報を、被写体の顔方向と等しくなるように変形させる。すなわち、顔立体形状テンプレート情報、すなわち顔の距離データ用いて画像中の3次元空間での位置を変換する。顔方向が上向きであれば上向きの顔モデルを、下向きであれば下向きの顔モデルを生成し、画像生成部112に出力する。
図8は、被写体が下向きの画像データ801に対し、生成された顔モデル802を示している。ここでは顔方向情報が上向きと下向きのときの説明をしたが、上向き、下向きだけでなく、左右方向、あるいはそれらを複合した右下方向といった顔方向の顔モデル生成を行うと、次に説明する画像生成の際に、より品質の高い正面顔画像を生成することができるため好適である。以上により顔モデルの生成がなされる。
上述の方法は、被写体の顔の立体形状を取得するために画像表示装置100に新たなセンサを追加したり、立体形状算出処理などの複雑な処理を実行したりする必要がなく、簡易なシステムで被写体の顔モデルを生成し、被写体の正面顔生成に活用できるため好適である。また、顔立体形状テンプレート情報とその顔部品情報の位置情報を検出しておき、顔立体形状テンプレート情報の顔部品情報の位置情報と、検出された顔領域の顔部品情報の位置情報が一致するように、顔立体形状テンプレート情報を変形すると、次に説明する画像生成の際に、より品質の高い正面顔画像を生成することができるため好適である。
最後に、画像生成の動作について図9を用いて説明をする。図9は、顔方向が横向き以外の場合の画像生成の動作を説明する図である。画像生成部112は、顔方向情報と顔モデルを用いて、被写体の正面顔903を生成する。なお、画像生成部112の処理対象である画像データ901は、画像平行移動部110によって平行移動処理が施された後の画像データである。これにより、被写体の顔が正面を向き、かつ画像中心に顔領域が表示される画像が生成される。
次に、正面顔を生成する方法を説明する。顔方向が正面を向いていない画像データを、顔モデル、すなわち顔の距離データを用いて画像中の3次元空間での位置を変換し、顔方向が正面となる画像データを生成する。この3次元空間での位置変換は、顔モデル生成部111において使用された顔方向に基づいて行う。すなわち、顔モデル生成部111で下方向に5度ずれた顔モデル(補正後の顔立体形状テンプレート)が生成されているとき、画像生成部112では上方向に5度ずらした顔画像を生成し、その生成画像を顔方向が正面となる画像データとして出力する。このように、画像生成部112では、平行移動後の画像データを顔モデル上の位置に変換し、顔モデル上で傾いている角度分を修正するように画像データ上の画素を補正する。
顔モデル生成部111における顔モデル生成処理と、画像生成部112における画像生成処理とは、被写体の顔方向情報がしきい値未満のときに実行する。このしきい値は、被写体の顔の傾き度合いのことである。値が小さいほど被写体が正面を向いている、すなわち撮像部103と正対していることを表し、値が大きいほど被写体が正面からずれている、すなわち撮像部103と正対していないことを表す。例えば、被写体の顔方向情報が横向きの状態をしきい値とすれば、しきい値未満とは、被写体の顔の方向が横向きよりも正面を向いている状態のことで、しきい値以上とは、被写体の顔の方向が横向きよりも正面側からずれている状態のことである。被写体の顔方向情報がしきい値未満の場合、被写体の顔方向を正面顔に変換した顔画像が画像中心に表示され、被写体の顔方向情報がしきい値以上の場合、顔の向きはそのまま画像中心に顔画像が表示される。顔方向が横向きとは、被写体の両眼が顔領域の左右に偏っている状態や、片方の目が見えない状態である等、被写体の顔方向が正面から大きくずれていることを示す。
また、横向きだけではなく、上向きや下向き等もしきい値にし、被写体の顔が上下方向に大きく傾いているときと、左右方向に大きく傾いているとき、またはその複合状態のときに被写体の顔方向はしきい値以上であると判断する。例えば、被写体の顔が下方向に大きく傾いている場合、被写体は頭の天辺を見せたいと判断し、正面顔にするのではなく、顔を画面中心に平行移動して表示させる処理とする。以上の様に被写体の顔方向に応じて画像データを平行移動させた後の画像データを出力する処理と、被写体の顔を正面顔になるように変換した後の画像データを出力する処理とを切り替えることで、処理量が少なくなりかつユーザが意図した見易い画像を生成することができる。
以下、上記動作の流れを図10に示すフローチャートを用いて説明をする。
まず、ステップS1001において、画像処理装置101は、撮像部103や送受信部106等から撮像画像データを取り込む。次に、ステップS1002において、顔情報検出部108が、撮像画像データから顔の大きさ情報や顔位置情報や顔部品情報などの顔情報を検出する。次に、ステップS1003において、顔方向算出部109が、顔情報を用いて被写体の顔の方向を算出する。
次に、ステップS1004において、画像平行移動部110が、顔位置情報が画像中心となるように画像全体を平行移動させる。ここで、ステップS1005において、顔モデル生成部111は、顔方向情報がしきい値未満であるか判定を行い、顔方向情報がしきい値未満であれば、ステップS1006において、顔立体形状テンプレート情報を取得する。次に、ステップS1007において、顔モデル生成部111は、顔モデル生成を行う。顔モデル生成では、顔の大きさ情報と顔方向情報に応じて顔立体形状テンプレート情報を変換し、顔モデルを生成する。
次に、ステップS1008において、画像生成部112が、生成された顔モデルを用いて、撮像データ中の被写体の顔が正面顔となる画像を生成する。そして、ステップS1009において、画像生成部112が、生成した画像を表示部104に出力する。なお、顔方向情報がしきい値以上であれば、顔位置情報を画像中心となるように画像全体を平行移動させた画像が、生成画像として出力される。以上が画像処理装置101の動作の流れである。以上のようにして、第1実施例の画像表示装置100は動作する。
本実施例では、画像表示装置100が有する画像処理装置101で生成された画像を表示部104に表示したが、本発明の画像処理装置101を有する他の画像表示装置で生成された画像を送受信部106にて受信し、表示部104に表示するような構成としてもよい。この構成によれば、遠隔地とのテレビ会議やビデオチャット等が可能になるため好適である。
上述した本発明に係る画像処理装置101を備える画像表示装置100によれば、被写体の顔方向に応じて適切に画像処理することができ、好適な自分撮り画像を表示することができる。
また、本実施例では顔立体テンプレート情報が1つであった場合で説明したが、複数の顔立体形状テンプレート情報から適切なものを選択するようにしても良い。例えば、検出された顔部品情報や顔の大きさ情報等から、被写体の目の幅や顔部品情報の配置や顔の形等の顔の情報を解析し、年齢や顔の形や彫りの深さ等の顔の立体形状を推定し、推定した顔の立体形状に最も近い顔立体形状テンプレート情報を選択する。これにより、ユーザに適した顔立体形状テンプレート情報で画像処理を行うため、生成される画質を向上させることができ好適である。
さらに、ユーザの顔の立体形状に似ている少なくとも2つ以上の顔立体形状テンプレート情報が存在する場合、2つ以上の顔立体形状テンプレート情報の中間となる中間顔立体形状テンプレート情報を生成すると、ユーザの顔の立体形状により適合した顔モデルを生成できるため好適である。中間顔立体形状テンプレート情報は、2つ以上の顔立体形状テンプレート情報にモーフィングを施して生成する。ユーザの顔の立体形状が顔立体形状テンプレート情報Aに45%類似し、顔立体形状テンプレート情報Bに55%類似している場合、類似している割合に応じてモーフィングを施す。複数の顔立体形状テンプレート情報からモーフィングでユーザに適した顔立体形状テンプレート情報を生成することで、ユーザの顔の立体形状により適合した顔モデルを生成できるため好適である。
また、顔立体形状テンプレート情報Aと顔立体形状テンプレート情報Bとの間でテンプレート情報の選択が大きく変動しないので、選択したテンプレート情報が急に切り変わることにより生成画像に生じる違和を失くすことができるため好適である。さらに、ユーザの顔部品情報毎に類似度合を算出すると、目の形状は顔立体形状テンプレートCを、顔の輪郭は顔立体形状テンプレートDを用いるなど、よりユーザの顔の立体形状に適合した顔モデルを生成できるため好適である。
<第2実施例>
次に、本発明の第2実施例に係る画像表示装置の構成について、図11を用いて説明する。図11において、図1と同じ構成要素には同じ番号を付しており、これらの構成要素は図1の実施例と同じ処理を行うため説明を省略する。
本実施例と第1実施例の違いは、送受信部106を送信部1106に置き変えた構成になっていることである。動作は第1実施例とほぼ同様で、撮像した画像データを保存したり送信したりするものであり、送信専用の画像表示装置1100である。また、図11の送信部1106を無くした構成も考えられる。この場合は通信を行わないで補正された画像を撮像表示及び保存するだけの装置となる。
第2実施例では、表示部104と撮像部103との関係が一意に決定し、表示部104の外枠上部に撮像部103が設置されているとする。この構成の場合、撮像部103にて撮像される被写体画像は常に下を向いていることになるため、顔立体形状テンプレート情報を下向きの顔に限定できる。また、表示部104の外枠下部に撮像部103が設置されている場合は、撮像部103にて撮像される被写体画像は常に上を向いているため、顔立体形状テンプレート情報を上向きの顔に限定できる。以上に示すように位置関係で保存する顔立体形状テンプレート情報の顔方向の向きが一意に決まるため、記憶部105に上向き、または、下向きの顔立体形状テンプレート情報を保存しておき、顔モデル生成時に顔立体形状テンプレート情報を読み出すことで、顔向きを変更することなく顔モデル生成が可能となる。すなわち、第2実施例は、顔モデル生成部111にて、顔方向に応じて顔立体形状テンプレート情報の顔向きを変換する必要がなく、処理量が少なくなるという利点がある。
以上のように、画像処理装置101を備えた画像表示装置100、1100及びそれを用いた通信装置において、自分撮り撮影時に表示部104を見ながら表示、保存、送信することができ、好適な自分撮り画像を生成することができる。
なお、本発明は、上述した実施例によって限定的に解釈されるものではなく、特許請求の範囲に記載した事項の範囲内で、種々の変更が可能であり本発明の技術的範囲に含まれる。
本発明による画像処理装置101で動作するプログラムは、本発明に関わる上記実施例の機能を実現するように、CPU等を制御するプログラム(コンピュータを機能させるプログラム)であっても良い。そして、これら装置で取り扱われる情報は、その処理時に一時的にRAM(Random Access Memory)に蓄積され、その後、Flash ROM(Read Only Memory)などの各種ROMやHDDに格納され、必要に応じてCPUによって読み出し、修正・書き込みが行われる。
また、図1の各構成の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、CPUなどが実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。
また、上述した実施例における画像処理装置101の一部、または全部を典型的には集積回路であるLSIとして実現してもよい。画像処理装置101の各機能ブロックは個別にチップ化してもよいし、一部、または全部を集積してチップ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いることも可能である。
また、上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 :画像表示装置
101 :画像処理装置
103 :撮像部
104 :表示部
105 :記憶部
106 :送受信部
107 :入出力部
108 :顔情報検出部
109 :顔方向算出部
110 :画像平行移動部
111 :顔モデル生成部
112 :画像生成部
113 :外部ネットワーク
1100 :画像表示装置
1106 :送信部

Claims (5)

  1. 画像データから被写体の顔位置情報と、顔の大きさ情報と、顔部品情報とを検出する顔情報検出部と、
    前記顔位置情報と、前記顔の大きさ情報と、前記顔部品情報とから前記被写体の顔方向情報を算出する顔方向算出部と、
    前記顔位置情報が前記画像データの中心となるように前記画像データを平行移動させる画像平行移動部と、
    前記顔位置情報と、前記顔の大きさ情報と、前記顔部品情報と、前記顔方向情報とに基づいて顔の立体形状を表す顔立体形状テンプレート情報を変形させて前記被写体の顔モデルを生成する顔モデル生成部と、
    前記顔方向情報と前記顔モデルとに基づいて前記被写体の顔を正面顔になるように変換した画像を生成する画像生成部と、を備え、
    前記顔方向情報と前記被写体の顔の傾き度合いを示す所定のしきい値とを比較することによって前記顔の傾きが上下左右方向に大きく傾いていると判断された場合、前記画像平行移動部によって平行移動させた画像データを出力前記顔の傾きが正面を向いていると判断された場合、前記画像生成部によって生成された画像データを出力することを特徴とする画像処理装置。
  2. 前記画像平行移動部は、前記顔位置情報を時間軸方向に平滑化することを特徴とする請求項1に記載の画像処理装置。
  3. 前記顔モデル生成部は、複数の顔立体形状テンプレート情報を備えており、
    前記顔モデル生成部は、前記被写体に近い顔立体形状テンプレート情報が2つ以上選択された場合、前記2つ以上の顔立体形状テンプレート情報を元に中間顔立体形状テンプレート情報を生成することを特徴とする請求項1からのいずれか1項に記載の画像処理装置。
  4. 被写体を撮像する撮像部と、
    前記撮像部で撮像された前記被写体の画像データを処理する、請求項1に記載の画像処理装置と、
    前記画像処理装置において生成された画像を送信する送信部と、
    を備えることを特徴とする画像表示装置。
  5. 被写体を撮像する撮像部と、
    前記撮像部で撮像された前記被写体の画像データを処理する、請求項1に記載の画像処理装置と、
    他の撮像部付き画像表示装置で生成された画像データを受信する受信部と、
    前記受信部で受信した画像データを表示する表示部と、
    を備えることを特徴とする画像表示装置。
JP2012189900A 2012-08-30 2012-08-30 画像処理装置及び画像表示装置 Expired - Fee Related JP5450739B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012189900A JP5450739B2 (ja) 2012-08-30 2012-08-30 画像処理装置及び画像表示装置
US14/423,485 US20150206354A1 (en) 2012-08-30 2013-08-23 Image processing apparatus and image display apparatus
CN201380043318.1A CN104584531B (zh) 2012-08-30 2013-08-23 图像处理装置以及图像显示装置
PCT/JP2013/072546 WO2014034556A1 (ja) 2012-08-30 2013-08-23 画像処理装置及び画像表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012189900A JP5450739B2 (ja) 2012-08-30 2012-08-30 画像処理装置及び画像表示装置

Publications (2)

Publication Number Publication Date
JP2014049866A JP2014049866A (ja) 2014-03-17
JP5450739B2 true JP5450739B2 (ja) 2014-03-26

Family

ID=50183369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012189900A Expired - Fee Related JP5450739B2 (ja) 2012-08-30 2012-08-30 画像処理装置及び画像表示装置

Country Status (4)

Country Link
US (1) US20150206354A1 (ja)
JP (1) JP5450739B2 (ja)
CN (1) CN104584531B (ja)
WO (1) WO2014034556A1 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140098296A1 (en) * 2012-10-04 2014-04-10 Ati Technologies Ulc Method and apparatus for changing a perspective of a video
KR20140090538A (ko) * 2013-01-09 2014-07-17 삼성전자주식회사 디스플레이 장치 및 제어 방법
KR20150039355A (ko) * 2013-10-02 2015-04-10 엘지전자 주식회사 이동 단말기 및 그 제어방법
WO2015056466A1 (ja) * 2013-10-16 2015-04-23 オリンパスイメージング株式会社 表示装置、画像生成装置、表示方法およびプログラム
WO2015156128A1 (ja) * 2014-04-07 2015-10-15 ソニー株式会社 表示制御装置、表示制御方法、及び、プログラム
CN106462937B (zh) * 2014-06-06 2019-12-31 夏普株式会社 图像处理装置以及图像显示装置
JP6032252B2 (ja) * 2014-09-09 2016-11-24 カシオ計算機株式会社 画像補正装置、画像補正方法及びプログラム
US9762791B2 (en) * 2014-11-07 2017-09-12 Intel Corporation Production of face images having preferred perspective angles
US10219688B2 (en) * 2015-10-19 2019-03-05 The Charles Stark Draper Laboratory, Inc. System and method for the selection of optical coherence tomography slices
CN105611161B (zh) * 2015-12-24 2019-03-12 Oppo广东移动通信有限公司 拍照控制方法、拍照控制装置及拍照系统
WO2017110041A1 (ja) * 2015-12-25 2017-06-29 パナソニックIpマネジメント株式会社 メイクパーツ作成装置、メイクパーツ利用装置、メイクパーツ作成方法、メイクパーツ利用方法、メイクパーツ作成プログラム、およびメイクパーツ利用プログラム
DE112017007011B4 (de) * 2017-03-10 2021-11-04 Mitsubishi Electric Corporation Gesichtsrichtungsschätzvorrichtung und Gesichtsrichtungsschätzverfahren
CN110959286A (zh) * 2017-07-31 2020-04-03 索尼公司 图像处理装置、图像处理方法、程序以及远程通讯系统
JP2019070872A (ja) * 2017-10-05 2019-05-09 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
CN108200334B (zh) * 2017-12-28 2020-09-08 Oppo广东移动通信有限公司 图像拍摄方法、装置、存储介质及电子设备
JP7040043B2 (ja) * 2018-01-25 2022-03-23 セイコーエプソン株式会社 写真処理装置、写真データの生産方法および写真処理プログラム
JP7075237B2 (ja) * 2018-02-23 2022-05-25 ラピスセミコンダクタ株式会社 操作判定装置及び操作判定方法
JP2021071735A (ja) * 2018-03-01 2021-05-06 住友電気工業株式会社 コンピュータプログラム
CN112040135A (zh) * 2020-09-22 2020-12-04 深圳鼎识科技股份有限公司 人脸摄像头自动抓拍人脸的方法
US11228702B1 (en) 2021-04-23 2022-01-18 Gopro, Inc. Stabilization of face in video

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3639475B2 (ja) * 1999-10-04 2005-04-20 シャープ株式会社 3次元モデル生成装置および3次元モデル生成方法ならびに3次元モデル生成プログラムを記録した記録媒体
KR100323678B1 (ko) * 2000-02-28 2002-02-07 구자홍 화면비 변환 장치
US7466843B2 (en) * 2000-07-07 2008-12-16 Pryor Timothy R Multi-functional control and entertainment systems
KR100459892B1 (ko) * 2001-12-13 2004-12-03 삼성전자주식회사 3차원 얼굴 모델을 위한 텍스쳐 생성 방법 및 장치
JP2004159061A (ja) * 2002-11-06 2004-06-03 Sony Corp 撮像機能付き画像表示装置
JP2004326179A (ja) * 2003-04-21 2004-11-18 Sharp Corp 画像処理装置、画像処理方法および画像処理プログラムならびに画像処理プログラムを記録した記録媒体
JP4144492B2 (ja) * 2003-09-19 2008-09-03 株式会社日立製作所 画像表示装置
US20110102553A1 (en) * 2007-02-28 2011-05-05 Tessera Technologies Ireland Limited Enhanced real-time face models from stereo imaging
JP2007006016A (ja) * 2005-06-22 2007-01-11 Sharp Corp 撮影装置
JP5239625B2 (ja) * 2008-08-22 2013-07-17 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP4862934B2 (ja) * 2008-11-28 2012-01-25 カシオ計算機株式会社 画像処理装置、画像処理方法及びプログラム
CN102136069A (zh) * 2010-01-25 2011-07-27 华晶科技股份有限公司 用于辨识的对象影像校正装置与其方法
JP2012003576A (ja) * 2010-06-18 2012-01-05 Casio Comput Co Ltd 画像処理装置、画像処理方法及びプログラム
JP5564384B2 (ja) * 2010-09-28 2014-07-30 任天堂株式会社 画像生成プログラム、撮像装置、撮像システム、及び画像生成方法

Also Published As

Publication number Publication date
CN104584531A (zh) 2015-04-29
WO2014034556A1 (ja) 2014-03-06
JP2014049866A (ja) 2014-03-17
US20150206354A1 (en) 2015-07-23
CN104584531B (zh) 2018-03-13

Similar Documents

Publication Publication Date Title
JP5450739B2 (ja) 画像処理装置及び画像表示装置
JP6499583B2 (ja) 画像処理装置及び画像表示装置
CN108933915B (zh) 视频会议装置与视频会议管理方法
CN106462937B (zh) 图像处理装置以及图像显示装置
CN109788189B (zh) 将相机与陀螺仪融合在一起的五维视频稳定化装置及方法
US9710923B2 (en) Information processing system, information processing device, imaging device, and information processing method
KR102114377B1 (ko) 전자 장치에 의해 촬영된 이미지들을 프리뷰하는 방법 및 이를 위한 전자 장치
AU2013276984B2 (en) Display apparatus and method for video calling thereof
KR102018887B1 (ko) 신체 부위 검출을 이용한 이미지 프리뷰
US8749607B2 (en) Face equalization in video conferencing
CN113973190A (zh) 视频虚拟背景图像处理方法、装置及计算机设备
US8400532B2 (en) Digital image capturing device providing photographing composition and method thereof
EP4156082A1 (en) Image transformation method and apparatus
CN107977636B (zh) 人脸检测方法及装置、终端、存储介质
CN113711123B (zh) 一种对焦方法、装置及电子设备
CN114429495A (zh) 一种三维场景的重建方法和电子设备
CN111385481A (zh) 图像处理方法及装置、电子设备及存储介质
TWI807495B (zh) 虛擬運鏡方法、攝像裝置及電子系統
CN115908120A (zh) 图像处理方法和电子设备
JP6103942B2 (ja) 画像データ処理装置及び画像データ処理プログラム
Li et al. 3D vision attack against authentication
WO2023206475A1 (zh) 图像处理方法、装置、电子设备及存储介质
KR101879813B1 (ko) 눈 맞춤 가능한 영상 촬영 핸드폰
CN114882089A (zh) 一种图像处理方法、装置、设备及存储介质
CN115118879A (zh) 图像拍摄、显示方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131225

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5450739

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees