JP2004064102A - Virtual video phone and image generating method in virtual video phone - Google Patents
Virtual video phone and image generating method in virtual video phone Download PDFInfo
- Publication number
- JP2004064102A JP2004064102A JP2002215379A JP2002215379A JP2004064102A JP 2004064102 A JP2004064102 A JP 2004064102A JP 2002215379 A JP2002215379 A JP 2002215379A JP 2002215379 A JP2002215379 A JP 2002215379A JP 2004064102 A JP2004064102 A JP 2004064102A
- Authority
- JP
- Japan
- Prior art keywords
- image
- person
- simplified
- simplified image
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
- Image Analysis (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、携帯電話や無線ローカルエリアネットワーク(LAN)、インターネットと言った通信基盤を利用して遠隔地の不特定多数の受信者にリアルタイムに送信者の感情や表情を伝える仮想テレビ電話装置および仮想テレビ電話装置における画像生成方法に関する。
【0002】
【従来の技術】
従来の仮想テレビ電話装置としては、例えば音声に応じた口形状を、データベースに登録されているアニメーションから選択することで、遠隔地にいる受信者に口形状の動きと音声が同期したアニメーション画像を画面表示させるものがある。
【0003】
図2は従来の仮想テレビ電話装置の構成を示すブロック図である。図2において、マイクロホンを通じて入力された送信者の音声を音声分析手段201に入力すると、音声分析手段201はその音圧レベルおよび周波数に応じた音声パラメータを抽出して画像情報取得手段202に送信する。画像情報取得手段202は、音声パラメータを基にアニメーションデータベース203から対応するアニメーション画像を選択する。これにより音声に応じた動きをする口の映像を出力することができる。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の仮想テレビ電話装置では、音声に応じて口の形状が変化する画像を選択して出力しているため、送信者である人物の口の動きは受信者に分かるものの顔にあらわれる細かい表情や感情を相手の受信者に伝えることができないと言う問題がある。
【0005】
本発明は上記従来の問題点を解決するもので、画面表示するアニメーション画像に臨場感を付与することができる仮想テレビ電話装置および仮想テレビ電話装置における画像生成方法を提供することを目的とする。
【0006】
【課題を解決するための手段】
請求項1記載の仮想テレビ電話装置は、撮像装置により撮像された人物の動画像から人物の顔の表情を分析する表情分析手段と、前記撮像装置により撮像された人物の動画像から当該人物の顔の簡略画像を作成して記憶装置に蓄積する簡略画像作成手段と、前記表情分析手段から得られた表情分析結果に従って前記記憶装置に蓄積されている簡略画像から対応する簡略画像を選択する簡略画像選択手段と、前記簡略画像選択手段により選択された簡略画像に対して、前記表情分析手段により分析した表情に応じて特殊効果を施す特殊効果処理手段とを具備したことを特徴とする。
【0007】
また、請求項6記載の仮想テレビ電話装置における画像生成方法は、撮像した人物の動画像からこの人物の顔の表情を分析する表情分析工程と、前記動画像から人物の顔の簡略画像を作成して記憶装置に蓄積する簡略画像作成工程と、前記表情分析ステップで抽出された表情パラメータを基に前記記憶装置から簡略画像を選択する簡略画像選択工程と、前記簡略画像選択工程で作成された簡略画像に対し表情パラメータに応じた特殊効果を施す特殊効果処理工程とを具備することを特徴とする。
【0008】
上記構成によれば、送信者の動画像から得た顔の表情の情報をリアルタイムに取り出して、これを利用して表情豊かな顔のアニメーション画像を作成することができる。
【0009】
請求項2記載の仮想テレビ電話装置は、撮像装置により撮像された人物の動画像から人物の顔の表情を分析する表情分析手段と、前記撮像装置により撮像された人物の動画像から当該人物の顔の簡略画像を作成して記憶装置に蓄積する簡略画像作成手段と、音声入力装置より入力された音声に基づいて前記人物の口形状を推測する口形状推測手段と、前記表情分析手段および口形状推測手段から得られた表情分析結果および口形状推測結果に従って前記記憶装置に蓄積されている簡略画像から対応する簡略画像を選択する簡略画像選択手段と、前記簡略画像選択手段により選択された簡略画像に対して、前記表情分析手段により分析した表情に応じて特殊効果を施す特殊効果処理手段とを具備したことを特徴とする。
【0010】
また、請求項7記載の仮想テレビ電話装置における画像生成方法は、撮像した人物の動画像からこの人物の顔の表情を分析する表情分析工程と、前記人物の音声から該人物の口形状を推測する口形状推測工程と、前記動画像から人物の顔の簡略画像を作成して記憶装置に蓄積する簡略画像作成工程と、前記表情分析工程および口形状推測工程で抽出された表情パラメータおよび口形状パラメータを基に前記記憶装置から簡略画像を選択する簡略画像選択工程と、前記簡略画像選択工程で作成された簡略画像に対し表情パラメータに応じた特殊効果を施す特殊効果付加処理工程と、を具備することを特徴とする。
【0011】
上記構成によれば、送信者の動画像から得た顔の表情の情報と送信者の音声に基づいて得た口形状情報とをリアルタイムに取り出して、これを利用してより表情豊かな顔のアニメーション画像を作成することができる。
【0012】
請求項3記載の仮想テレビ電話装置は、請求項1または請求項2記載の仮想テレビ電話装置において、前記表情分析手段を、撮像された人物の動画像からこの人物の顔領域を抜き出す顔領域画像抜き出し部と、前記顔領域画像抜き出し部より抜き出した顔領域の画像から顔構成要素を判断する顔構成要素判断部と、前記顔構成要素判断部による顔構成要素の判断結果から表情を判断しパラメータ化する表情判断部とから構成したことを特徴とする。
【0013】
上記構成によれば、動画像の一部である顔情報のみを取り出して、その顔の各部における特徴のある表情を高精度にパラメータ化することができる。
【0014】
請求項4記載の仮想テレビ電話装置は、請求項1または請求項2記載の仮想テレビ電話装置において、前記特殊効果処理手段に、前記表情分析手段において抽出された表情パラメータに応じて前記簡略画像選択手段により選択した簡略画像を変形させたり、背景を変更したりする画像処理機能を持たせたことを特徴とする。
【0015】
上記構成によれば、表情パラメータに応じて顔アニメーションを任意かつ効果的に変形させて、喜怒哀楽の表情を強調したり変化させたりすることができる。
【0016】
請求項5記載の仮想テレビ電話装置は、請求項1から請求項4のいずれか1項に記載の仮想テレビ電話装置において、前記簡略画像作成手段に、前記撮像装置から得られた動画像の顔の各部の三次元位置を計測する三次元位置計測部と、前記三次元位置計測部により計測された三次元位置情報を基に立体画像を作成する立体画像作成部とを設けたことを特徴とする。
【0017】
上記構成によれば、簡略画像の顔面を立体的に変化させることができ、仮想テレビ電話システムであるにも拘らず、送信者の表情を相手に詳しく伝達することができる。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。図1は本発明の一実施の形態に係る仮想テレビ電話装置を示すブロック図である。本実施の形態の仮想テレビ電話装置は、人物の表情を分析し、この表情に応じて選択された簡略画像に特殊効果を施すというものである。
【0019】
図1において、101は画像入力装置としての撮像装置であり、ここでは人物の動画像を撮像するビデオカメラなどが用いられる。102は撮像した動画像の映像信号と同期信号とを混合した複合映像信号の処理を行って、次段の表情分析手段103へ入力する画像処理手段である。ここで、撮像対象となるのは送信側の人物である。
【0020】
表情分析手段103は、入力された動画像より人物の顔領域の画像を特定して抜き出す顔領域画像抜き出し部104と、特定された顔領域の中から人物の顔を構成している目、鼻、口といった各部を特定する顔構成要素判断部105と、特定された顔各部の変形や位置関係、変化量から喜怒哀楽といった表情パラメータを抽出する表情判断部106とから構成され、表情を数値化した表情パラメータを簡略画像選択手段107と特殊効果処理手段108に出力する。
【0021】
また、109は画像処理手段102を介して撮像装置101から得られた動画像に基づいて、人物の顔を簡略化したアニメーション画像をリアルタイムに作成する簡略画像作成手段である。112はこのアニメーション画像を記憶する記憶装置としての簡略画像データベースである。簡略画像作成手段109には、動画各部の三次元位置を計測する三次元位置計測部110および三次元位置計測部110により計測された三次元位置情報を基に立体画像を作成する立体画像作成部111が設けられている。なお、簡略画像データベース112には、人物の顔のアニメーションだけではなく、動物や他の人物といった色々なキャラクタを登録することができる。これにより、オリジナルなアニメーション画像を作成することができる。
【0022】
113は音声入力装置としての収音用のマイクロホンであり、このマイクロホン113には送信側の前記人物が話す音声を増幅し、不要周波数成分およびノイズを除去して口形状推測手段115へ入力する音声処理手段114が接続されている。口形状推測手段115は入力された音声信号に基づいて人物の口形状を推測する。口形状推測手段115は、入力された音声を分析することでリアルタイムにどの音を発しているかを推測し、簡略画像選択手段107に出力する。
【0023】
簡略画像選択手段107は、表情分析手段103から出力される表情パラメータおよび口形状の分析結果を基に、簡略画像作成手段109で作成されて記憶装置112に記憶された顔アニメーションまたは既に登録されているキャラクタアニメーションから、音声や表情に応じた画像を選択するように機能する。特殊効果処理手段108は、表情分析手段103から出力される表情パラメータに応じて選択された顔アニメーションを、変形させたり強調させたりする顔画像変形処理部110と、背景となる画像を切り替える背景処理部117とを備え、合成された表情付き簡略画像を出力するように機能する。
【0024】
上記構成の仮想テレビ電話装置は、送信側の人物である送信者(発信者)を画像入力装置である撮像装置101により撮像し、撮像した人物の動画像を画像処理手段102を通じて表情分析手段103に入力する。表情分析手段103は、まず、動画像情報の中から、顔領域画像抜き出し部104によって人物の顔領域を特定して抜き出し、抜き出した顔領域の動画像における目、鼻、口などの顔各部の要素を顔構成要素判断部105において判断し、これらの顔各部の変形、位置関係、変化量から、表情判断部106が人物の喜怒哀楽を判断して、これら表情に対応して数値化した表情パラメータを出力する。表情パラメータは簡略画像選択手段107および特殊効果処理手段108に入力される。
【0025】
一方、画像処理手段102から出力された動画像情報は簡略画像作成手段109にも入力される。簡略画像作成手段109は、人物の動画像から人物の基本である顔の簡略画像をアニメーションとしてリアルタイムにて作成し、記憶装置である簡略画像データベース112に登録する。なお、簡略画像作成手段109に三次元位置計測部110を設けることで、簡略画像における三次元位置を特定できる。そして特定した三次元位置に基づいて立体画像作成部111が立体画像を作成することができる。これにより立体的な簡略画像が作成される。
【0026】
また、送信者は音声入力装置であるマイクロホン113に音声を入力すると、マイクロホン113からの音声信号が音声処理手段114にて増幅され、さらにノイズ等のフィルタリング処理が行われて口形状推測手段115に入力される。口形状推測手段115は、音声信号のレベルや周波数を解析し、解析結果が口形状およびその口形状の変化を推定する。つまり、人物の発した音声に基づいてその音声を発している口の形状およびその変化を判別して、口形状推測手段115がその判別結果としての口形状パラメータを前記簡略画像選択手段107に入力する。
【0027】
従って、簡略画像選択手段107は口形状パラメータおよび表情分析手段103からの表情パラメータに基づいて記憶装置112に蓄積されている簡略画像情報の中から対応する簡略画像情報を選択して取り出し、特殊効果処理手段108に入力する。このため、特殊効果処理手段108では選択された簡略画像に対し、表情分析手段103から得られた表情パラメータに応じて特殊効果を施すこととなる。例えば、顔画像変形処理部116によって簡略画像の顔アニメーションを変形させたり、背景処理部117によって背景となる画像を切り換えて合成したりすることができる。この結果、特殊処理を施した表情付きの簡略画像情報が、図示しない画像制御手段を介して画像メモリに書き込まれるとともに、画像メモリから簡略画像情報を順次読み出して受信側に送信する。このため、受信側では送信者の顔の表情を表現した簡略画像を看取できることになる。
【0028】
なお、本実施の形態では、簡略画像選択手段107は表情分析手段103からの表情パラメータおよび口形状推測手段115からの音声情報に基づく口形状パラメータの両方に基づいて、簡略画像データベースである記憶装置112に蓄えられている簡略画像の中から対応する簡略画像を選択し、これに特殊効果処理を施すこととしたが、表情パラメータのみに基づいて、記憶装置112に蓄えられた簡略画像の中から対応する簡略画像を選択してもよく、特殊効果処理を施せば、目、鼻、頬などといった顔面各部における喜怒哀楽の表情をアニメーション画像上に具現して、受信者に看取せしめることができる。
【0029】
【発明の効果】
以上説明したように、本発明によれば、仮想テレビ電話装置において、送信者の動画像から得た顔の表情の情報をリアルタイムに取り出して、これを利用して表情豊かな顔のアニメーション画像を作成することができる。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る仮想テレビ電話装置の構成を示すブロック図。
【図2】従来の仮想テレビ電話装置の構成を示すブロック図。
【符号の説明】
101 撮像装置
103 表情分析手段
104 顔領域画像抜き出し部
105 顔構成要素判断部
106 表情判断部
107 簡略画像選択手段
108 特殊効果処理手段
109 簡略画像作成手段
110 三次元位置計測部
111 立体画像作成部
112 簡略画像データベース(記憶装置)
113 マイクロホン(音声入力装置)
115 口形状推測手段
116 顔画像変形処理部
117 背景処理部[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a virtual videophone device that transmits a sender's emotions and expressions in real time to an unspecified large number of recipients using a communication infrastructure such as a mobile phone, a wireless local area network (LAN), and the Internet. The present invention relates to a method for generating an image in a virtual videophone device.
[0002]
[Prior art]
As a conventional virtual videophone device, for example, by selecting a mouth shape corresponding to a voice from animation registered in a database, an animation image in which the movement of the mouth shape and the voice are synchronized with a remote receiver can be provided. Some are displayed on the screen.
[0003]
FIG. 2 is a block diagram showing a configuration of a conventional virtual videophone device. In FIG. 2, when a voice of a sender input through a microphone is input to a
[0004]
[Problems to be solved by the invention]
However, in the conventional virtual videophone device, since the image whose mouth shape changes in accordance with the voice is selected and output, the mouth movement of the person who is the sender can be seen by the receiver but the fine movements appearing on the face There is a problem that facial expressions and emotions cannot be transmitted to the recipient of the other party.
[0005]
SUMMARY OF THE INVENTION An object of the present invention is to provide a virtual videophone device and an image generation method for the virtual videophone device capable of giving a sense of reality to an animation image displayed on a screen.
[0006]
[Means for Solving the Problems]
A virtual videophone device according to claim 1, wherein the facial expression analysis means analyzes a facial expression of a person from a moving image of the person captured by the imaging device, and a facial image of the person from the moving image of the person captured by the imaging device. A simplified image creating means for creating a simplified image of the face and storing the same in the storage device; and a simplified method for selecting a corresponding simplified image from the simplified images stored in the storage device in accordance with the expression analysis result obtained from the expression analysis means. The image processing apparatus further includes an image selecting unit and a special effect processing unit that applies a special effect to the simplified image selected by the simplified image selecting unit in accordance with the facial expression analyzed by the facial expression analyzing unit.
[0007]
According to a sixth aspect of the present invention, there is provided an image generating method for a virtual videophone device, comprising: a facial expression analyzing step of analyzing a facial expression of a person from a captured moving image; and a simplified image of a human face from the moving image. A simplified image creating step of storing a simple image from the storage device based on the facial expression parameters extracted in the facial expression analyzing step. A special effect processing step of applying a special effect according to the expression parameter to the simplified image.
[0008]
According to the above configuration, facial expression information obtained from a moving image of a sender is extracted in real time, and an animation image of an expressive facial image can be created by using the information.
[0009]
The virtual videophone device according to claim 2, wherein the facial expression analyzing means for analyzing the facial expression of the person from the moving image of the person imaged by the imaging device, and the expression of the person from the moving image of the person imaged by the imaging device. A simplified image creating means for creating a simplified image of a face and storing it in a storage device; a mouth shape estimating means for estimating the mouth shape of the person based on voice input from a voice input device; Simple image selecting means for selecting a corresponding simple image from the simple images stored in the storage device in accordance with the expression analysis result and the mouth shape estimating result obtained from the shape estimating means, and the simplified image selected by the simple image selecting means A special effect processing means for applying a special effect to the image according to the facial expression analyzed by the facial expression analyzing means.
[0010]
According to a seventh aspect of the present invention, there is provided an image generating method for a virtual videophone device, comprising: a facial expression analyzing step of analyzing a facial expression of a person from a captured moving image; and a mouth shape of the person from voice of the person. Mouth shape estimating step, a simplified image creating step of creating a simplified image of a person's face from the moving image and storing the same in a storage device, the facial expression parameters and the mouth shape extracted in the facial expression analyzing step and the mouth shape estimating step A simplified image selecting step of selecting a simplified image from the storage device based on the parameters; and a special effect adding processing step of applying a special effect according to an expression parameter to the simplified image created in the simplified image selecting step. It is characterized by doing.
[0011]
According to the above configuration, information on the facial expression obtained from the moving image of the sender and mouth shape information obtained based on the voice of the sender are extracted in real time, and the extracted facial shape information is used for a more expressive face. Animation images can be created.
[0012]
A virtual videophone device according to claim 3, wherein the facial expression analysis unit extracts a face region of a person from a captured moving image of the person in the virtual videophone device according to claim 1 or 2. A extracting unit, a face component determining unit that determines a face component from an image of the face region extracted from the face region image extracting unit, and a parameter that determines a facial expression from a result of the face component determining performed by the face component determining unit. And a facial expression judging unit to be converted.
[0013]
According to the above configuration, it is possible to extract only the face information which is a part of the moving image and parameterize the characteristic facial expression in each part of the face with high accuracy.
[0014]
According to a fourth aspect of the present invention, in the virtual videophone apparatus according to the first or second aspect, the special effect processing means selects the simplified image according to the facial expression parameter extracted by the facial expression analysis means. An image processing function for deforming the simplified image selected by the means or changing the background is provided.
[0015]
According to the above configuration, the facial animation can be arbitrarily and effectively deformed in accordance with the facial expression parameter to emphasize or change the facial expression of emotions and emotions.
[0016]
A virtual videophone device according to claim 5, wherein the virtual videophone device according to any one of claims 1 to 4, wherein the simplified image creating means includes a face of a moving image obtained from the imaging device. A three-dimensional position measurement unit that measures the three-dimensional position of each part, and a three-dimensional image creation unit that creates a three-dimensional image based on the three-dimensional position information measured by the three-dimensional position measurement unit, I do.
[0017]
According to the above configuration, the face of the simplified image can be three-dimensionally changed, and the expression of the sender can be transmitted to the other party in detail, despite being a virtual videophone system.
[0018]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a virtual videophone device according to one embodiment of the present invention. The virtual videophone device according to the present embodiment analyzes the expression of a person and applies a special effect to a simplified image selected according to the expression.
[0019]
In FIG. 1,
[0020]
The facial
[0021]
[0022]
Reference numeral 113 denotes a microphone for sound collection as a voice input device. The microphone 113 amplifies the voice spoken by the person on the transmitting side, removes unnecessary frequency components and noise, and inputs the voice to the mouth
[0023]
The simplified image selecting means 107 is a face animation created by the simplified image creating means 109 and stored in the
[0024]
The virtual videophone device having the above configuration captures a sender (sender), which is a person on the transmitting side, by an
[0025]
On the other hand, the moving image information output from the image processing means 102 is also input to the simplified image creation means 109. The simplified image creation means 109 creates a simplified image of a face, which is the basic of a person, from a moving image of the person as an animation in real time, and registers it in the
[0026]
Further, when the sender inputs a sound to the microphone 113 which is a sound input device, the sound signal from the microphone 113 is amplified by the sound processing means 114, and a filtering process such as noise is performed. Is entered. The mouth shape estimating means 115 analyzes the level and frequency of the audio signal, and estimates the mouth shape and a change in the mouth shape based on the analysis result. That is, the shape of the mouth emitting the voice and the change thereof are determined based on the voice emitted by the person, and the mouth
[0027]
Therefore, the simple image selecting means 107 selects and extracts corresponding simple image information from the simple image information stored in the
[0028]
In the present embodiment, the simplified
[0029]
【The invention's effect】
As described above, according to the present invention, in a virtual videophone device, information of a facial expression obtained from a moving image of a sender is extracted in real time, and an animation image of an expressive face is used by using the information. Can be created.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a virtual videophone device according to an embodiment of the present invention.
FIG. 2 is a block diagram showing a configuration of a conventional virtual videophone device.
[Explanation of symbols]
113 microphone (voice input device)
115 mouth shape estimating means 116 face image
Claims (7)
前記撮像装置により撮像された人物の動画像から当該人物の顔の簡略画像を作成して記憶装置に蓄積する簡略画像作成手段と、
前記表情分析手段から得られた表情分析結果に従って前記記憶装置に蓄積されている簡略画像から対応する簡略画像を選択する簡略画像選択手段と、
前記簡略画像選択手段により選択された簡略画像に対して、前記表情分析手段により分析した表情に応じて特殊効果を施す特殊効果処理手段と、
を具備したことを特徴とする仮想テレビ電話装置。Expression analysis means for analyzing the expression of the face of a person from a moving image of the person captured by the imaging device,
A simplified image creation unit that creates a simplified image of the face of the person from the moving image of the person captured by the imaging device and stores the simplified image in the storage device;
A simplified image selecting means for selecting a corresponding simplified image from the simplified images stored in the storage device according to the expression analysis result obtained from the expression analyzing means,
Special effect processing means for applying a special effect to the simplified image selected by the simplified image selecting means in accordance with the facial expression analyzed by the facial expression analyzing means,
A virtual videophone device comprising:
前記撮像装置により撮像された人物の動画像から当該人物の顔の簡略画像を作成して記憶装置に蓄積する簡略画像作成手段と、
音声入力装置より入力された音声に基づいて前記人物の口形状を推測する口形状推測手段と、
前記表情分析手段および口形状推測手段から得られた表情分析結果および口形状推測結果に従って前記記憶装置に蓄積されている簡略画像から対応する簡略画像を選択する簡略画像選択手段と、
前記簡略画像選択手段により選択された簡略画像に対して、前記表情分析手段により分析した表情に応じて特殊効果を施す特殊効果処理手段と、
を具備したことを特徴とする仮想テレビ電話装置。Expression analysis means for analyzing the expression of the face of a person from a moving image of the person captured by the imaging device,
A simplified image creation unit that creates a simplified image of the face of the person from the moving image of the person captured by the imaging device and stores the simplified image in the storage device;
Mouth shape estimating means for estimating the mouth shape of the person based on the voice input from the voice input device,
A simplified image selecting means for selecting a corresponding simplified image from the simplified images stored in the storage device according to the facial expression analysis result and the mouth shape estimation result obtained from the facial expression analyzing means and the mouth shape estimating means;
Special effect processing means for applying a special effect to the simplified image selected by the simplified image selecting means in accordance with the facial expression analyzed by the facial expression analyzing means,
A virtual videophone device comprising:
撮像された人物の動画像から人物の顔領域を抜き出す顔領域画像抜き出し部と、
前記顔領域画像抜き出し部より抜き出した顔領域の画像から顔構成要素を判断する顔構成要素判断部と、
前記顔構成要素判断部による前記顔構成要素の判断結果から表情を判断しパラメータ化する表情判断部と、
を有することを特徴とする請求項1または請求項2に記載の仮想テレビ電話装置。The expression analysis means,
A face region image extraction unit that extracts a person's face region from a captured moving image of a person,
A face component determining unit that determines a face component from an image of the face region extracted from the face region image extracting unit;
A facial expression determining unit that determines a facial expression from the determination result of the facial component by the facial component determining unit and parameterizes the facial expression;
The virtual videophone device according to claim 1, further comprising:
前記撮像装置から得られた動画像の顔の各部の三次元位置を計測する三次元位置計測部と、
前記三次元位置計測部により計測された三次元位置情報を基に立体画像を作成する立体画像作成部と、
を有することを特徴とする請求項1から請求項4のいずれか1項に記載の仮想テレビ電話装置。The simplified image creating means includes:
A three-dimensional position measurement unit that measures the three-dimensional position of each part of the face of the moving image obtained from the imaging device,
A stereoscopic image creating unit that creates a stereoscopic image based on the three-dimensional position information measured by the three-dimensional position measuring unit,
The virtual videophone device according to any one of claims 1 to 4, comprising:
前記動画像から人物の顔の簡略画像を作成して記憶装置に蓄積する簡略画像作成工程と、
前記表情分析ステップで抽出された表情パラメータを基に前記記憶装置から簡略画像を選択する簡略画像選択工程と、
前記簡略画像選択工程で作成された簡略画像に対し表情パラメータに応じた特殊効果を施す特殊効果処理工程と、
を具備することを特徴とする仮想テレビ電話装置における画像生成方法。A facial expression analysis step of analyzing the facial expression of the person from the captured moving image of the person,
A simplified image creation step of creating a simplified image of a person's face from the moving image and storing the simplified image in a storage device;
A simplified image selection step of selecting a simplified image from the storage device based on the expression parameters extracted in the expression analysis step,
A special effect processing step of applying a special effect according to an expression parameter to the simplified image created in the simplified image selecting step,
An image generation method in a virtual videophone device, comprising:
前記人物の音声から該人物の口形状を推測する口形状推測工程と、
前記動画像から人物の顔の簡略画像を作成して記憶装置に蓄積する簡略画像作成工程と、
前記表情分析工程および口形状推測工程で抽出された表情パラメータおよび口形状パラメータを基に前記記憶装置から簡略画像を選択する簡略画像選択工程と、
前記簡略画像選択工程で作成された簡略画像に対し表情パラメータに応じた特殊効果を施す特殊効果付加処理工程と、
を具備することを特徴とする仮想テレビ電話装置における画像生成方法。A facial expression analysis step of analyzing the facial expression of the person from the captured moving image of the person,
A mouth shape estimation step of estimating the mouth shape of the person from the voice of the person,
A simplified image creation step of creating a simplified image of a person's face from the moving image and storing the simplified image in a storage device;
A simplified image selection step of selecting a simplified image from the storage device based on the expression parameters and the mouth shape parameters extracted in the expression analysis step and the mouth shape estimation step;
A special effect addition processing step of applying a special effect according to an expression parameter to the simplified image created in the simplified image selection step,
An image generation method in a virtual videophone device, comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002215379A JP2004064102A (en) | 2002-07-24 | 2002-07-24 | Virtual video phone and image generating method in virtual video phone |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002215379A JP2004064102A (en) | 2002-07-24 | 2002-07-24 | Virtual video phone and image generating method in virtual video phone |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004064102A true JP2004064102A (en) | 2004-02-26 |
Family
ID=31937426
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002215379A Pending JP2004064102A (en) | 2002-07-24 | 2002-07-24 | Virtual video phone and image generating method in virtual video phone |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004064102A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007043712A1 (en) * | 2005-10-14 | 2007-04-19 | Nagasaki University | Emotion evaluating method and emotion indicating method, and program, recording medium, and system for the methods |
CN110148191A (en) * | 2018-10-18 | 2019-08-20 | 腾讯科技(深圳)有限公司 | The virtual expression generation method of video, device and computer readable storage medium |
JP2020173714A (en) * | 2019-04-12 | 2020-10-22 | 株式会社竹中工務店 | Device, system, and program for supporting dialogue |
JP2021512562A (en) * | 2018-01-18 | 2021-05-13 | 上海掌門科技有限公司Shanghai Zhangmen Science And Technology Co., Ltd. | Video call methods and devices based on virtual images |
-
2002
- 2002-07-24 JP JP2002215379A patent/JP2004064102A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007043712A1 (en) * | 2005-10-14 | 2007-04-19 | Nagasaki University | Emotion evaluating method and emotion indicating method, and program, recording medium, and system for the methods |
JP2021512562A (en) * | 2018-01-18 | 2021-05-13 | 上海掌門科技有限公司Shanghai Zhangmen Science And Technology Co., Ltd. | Video call methods and devices based on virtual images |
CN110148191A (en) * | 2018-10-18 | 2019-08-20 | 腾讯科技(深圳)有限公司 | The virtual expression generation method of video, device and computer readable storage medium |
CN110148191B (en) * | 2018-10-18 | 2023-02-28 | 腾讯科技(深圳)有限公司 | Video virtual expression generation method and device and computer readable storage medium |
JP2020173714A (en) * | 2019-04-12 | 2020-10-22 | 株式会社竹中工務店 | Device, system, and program for supporting dialogue |
JP7323098B2 (en) | 2019-04-12 | 2023-08-08 | 三菱電機株式会社 | Dialogue support device, dialogue support system, and dialogue support program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4310916B2 (en) | Video display device | |
JP7504968B2 (en) | Avatar display device, avatar generation device and program | |
CN110446000B (en) | Method and device for generating dialogue figure image | |
KR100912877B1 (en) | A mobile communication terminal having a function of the creating 3d avata model and the method thereof | |
CN104170318B (en) | Use the communication of interaction incarnation | |
TWI486904B (en) | Method for rhythm visualization, system, and computer-readable memory | |
US6943794B2 (en) | Communication system and communication method using animation and server as well as terminal device used therefor | |
CN110418095B (en) | Virtual scene processing method and device, electronic equipment and storage medium | |
US20140139619A1 (en) | Communication method and device for video simulation image | |
CN110401810B (en) | Virtual picture processing method, device and system, electronic equipment and storage medium | |
JP7347597B2 (en) | Video editing device, video editing method and program | |
WO2010038693A1 (en) | Information processing device, information processing method, program, and information storage medium | |
CN110413108A (en) | Processing method, device, system, electronic equipment and the storage medium of virtual screen | |
CN108668050A (en) | Video capture method and apparatus based on virtual reality | |
JP2016118991A (en) | Image generation device, image generation method, and program | |
CN111670431A (en) | Information processing apparatus, information processing method, and program | |
WO2016159165A1 (en) | Image display system and image display method | |
JP5813542B2 (en) | Image communication system, AR (Augmented Reality) video generation device, and program | |
JP2004064102A (en) | Virtual video phone and image generating method in virtual video phone | |
KR20170127354A (en) | Apparatus and method for providing video conversation using face conversion based on facial motion capture | |
JP2013242835A (en) | Image communication system, image generation device and program | |
WO2014208169A1 (en) | Information processing device, control method, program, and recording medium | |
JP2001092990A (en) | Three-dimensional virtual space participant display method, three-dimensional virtual space display device and recording medium stored with three-dimensional virtual space participant display program | |
KR101807813B1 (en) | Motion Recognition Service Offering System and Method thereof | |
EP4354400A1 (en) | Information processing device, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050711 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060325 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071114 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071121 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071128 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071211 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080109 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080430 |