JP4865093B2 - 顔の特徴をアニメーション化する方法およびシステムならびに表情変換のための方法およびシステム - Google Patents

顔の特徴をアニメーション化する方法およびシステムならびに表情変換のための方法およびシステム Download PDF

Info

Publication number
JP4865093B2
JP4865093B2 JP2011029319A JP2011029319A JP4865093B2 JP 4865093 B2 JP4865093 B2 JP 4865093B2 JP 2011029319 A JP2011029319 A JP 2011029319A JP 2011029319 A JP2011029319 A JP 2011029319A JP 4865093 B2 JP4865093 B2 JP 4865093B2
Authority
JP
Japan
Prior art keywords
face
facial
expression
different
subdivision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2011029319A
Other languages
English (en)
Other versions
JP2011100497A (ja
Inventor
マーシュナー スティーブン
ケイ.ジェンター ブライアン
ラグフパティー サシ
オリニク カーク
ビン カン シン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2011100497A publication Critical patent/JP2011100497A/ja
Application granted granted Critical
Publication of JP4865093B2 publication Critical patent/JP4865093B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/04Texture mapping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/10Constructive solid geometry [CSG] using solid primitives, e.g. cylinders, cubes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • G06T17/205Re-meshing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/08Indexing scheme for image data processing or generation, in general involving all processing steps from image acquisition to 3D model generation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S345/00Computer graphics processing and selective visual display systems
    • Y10S345/949Animation processing method
    • Y10S345/956Language driven animation

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、顔をリアルにアニメーション化するためのモデリングとレンダリングの方法およびシステムに関する。具体的には、本発明は顔画像処理のための方法およびシステムに関する。
コンピュータグラフィックスの分野では、さまざまなオブジェクトをレンダリングして、そのオブジェクトがユーザのためにコンピュータディスプレイから表示される。例えば、コンピュータゲームでは、コンピュータオブジェクトを生成し、レンダリングしてコンピュータモニタやテレビジョンに表示するためのコンピュータグラフィックスアプリケーションを含むことが代表的である。リアル感のある画像のモデリングとレンダリングは、コンピュータグラフィックス分野に従事するものにとっては、絶え間のない努力目標となっている。コンピュータグラフィックス分野で特に努力目標となっている分野は、リアル感のある顔画像をレンダリングすることである。1つの例として、ある特定のコンピュータグラフィックスアプリケーションでは、会話に参加している個人の表示をレンダリングすることが行われている。よく見られることは、この個人の、最終的にレンダリングされた画像はコンピュータでレンダリングされた画像であり、現実の個人とはしばしば大幅に異なっている。
リアル感のある顔と顔表情をモデリングし、レンダリングすることは、特に2つの理由で困難な作業となっている。1つは、人間の皮膚が、現在利用可能である、種々のシェーディングモデルでモデリングするのに不適切な反射率特性をもっているからである。例えば、周知のPhongモデルは、人間の皮膚をモデリングするには不十分である。もう1つは、顔表情をレンダリングするとき、「リアルな」顔の動きとして感知されるものと若干でもずれがあると、そのずれは、無頓着な観察者でさえも、正しくないものとして感知されるからである。現存の、顔の動き取り込み(キャプチャ)システムを使用すると、かなり説得力のある顔アニメーションを作成することができるが、取り込まれた動きは、別の顔に適用されたときは、その説得力がはるかに低下し、非常に奇異になることがよく起こっている。例えば、ある人物からその顔の動きのサンプリングをとれば、個々の顔の動きをアニメーション化することは、その動きの元となった顔が同じ顔であることを考慮すれば、困難ではない。その結果、ある表情と別の表情の間で同じか、あるいは非常に類似している動きの特徴が得られることになる。しかし、この人物の顔の動きを別の人物の顔に変換することは、この2つの顔の間には固有の差異(例えば、顔のサイズと形状)があるため、説得力に欠けることがよく起こっている。
従って、本発明は、人間の皮膚のテクスチャと反射率をモデリングするための改良システムと方法を提供することを課題にしてなされたものである。また、本発明は、ある人物の顔の動きを別人物の顔の動きに変換することによって、顔の動きの取り込み(キャプチャ)データを再使用するためのシステムと方法を提供することを課題にしてなされたものである。
以下に図示し、説明している実施形態では、3次元 (3-D) 顔つきを記述しているデータを取り込んで、顔の動きを、ある個人から別の個人にリアルに変換し、皮膚の反射率をモデリングするための、新規な手法が提案されている。
ここで説明している実施形態では、人間の被写体が用意され、被写体の顔を照射するために複数の異なる光源が利用されている。複数の光源の中の1つは、被写体の顔の上にパターンを投影する構造化光源 (structured light source)である。この構造化光源により1つまたは2つ以上のカメラが、被写体の3−Dの顔つきを記述しているデータを取り込むことが可能となる。他の光源がさらにもう1つ用意されているが、これは被写体の顔を照射するために使用されるものである。この他の1つの光源により被写体の顔の種々反射率特性 (reflectance properties) を確認する。また、この他方の光源は偏光フィルタ (polarizing filter) と併用されて、顔の反射率の鏡面反射成分 (specular component) が除去される。すなわち、拡散反射成分 (diffuse component) だけがカメラによって取り込まれる。複数の異なる光源を使用すると、顔の構造特性と反射率特性の両方を、同時に確認することが可能になる。光源の選択を慎重に行うと、例えば、光源をナローバンドにし、整合ナローバンドフィルタ (matching narrowband filter) をカメラで使用すると、周囲照明源の影響を除去することが可能になる。
ここで説明している照明プロセスの結果として、2つの有用なアイテムが得られる。すなわち、(1) レンジマップ(またはデプスマップ(depth map))と、(2)構造化光源のパターンがそこに投影されていない顔の画像である。3D面がレンジマップから導き出され、3D面に対する面法線 (surface normal) が計算される。3D面を定義するためにレンジマップを処理するとき、その処理にオプションとしてのフィルタリングステップを含めておくと、汎用顔テンプレート (genericface template) がレンジマップと結合され、不要なノイズが拒絶されることになる。計算された面法線と顔の画像は、アルベドマップ (albedo map) を導き出すために使用される。アルベドマップは特殊タイプのテクスチャマップ (texture map) であり、そこでは、各サンプルは、面上の特定ポイント(点)における顔面の拡散反射率を記述している。従って、プロセスのこの時点で、顔の3D面(つまり、面法線)を記述している情報と、顔の反射率(つまり、アルベドマップ)を記述している情報は確認されていることになる。
ある実施形態では、照明プロセスで得られた情報またはデータは、ある人物の顔の表情を、別人物の顔の表情に変換するために使用される。この実施形態では、コードブック (code book) の考え方が取り入れられ、使用されている。
コードブックは、別人物(人物A)の、多数の汎用表情 (generic expressions) を記述しているデータを収めている。1つの目標は、コードブックの表情を取り出し、その表情を使用して別人物(人物B)の表情を変換することである。これを行うために、本発明による方法では、人物Bを使用してトレーニング 表情(training expressions)の 集合を作成している。トレーニング表情は、コードブックに存在する表情の集合から構成されている。トレーニング表情および各表情に対応するコードブック表情を使用すると、変換関数 (transformation function) が導き出される。この変換関数は、人物Bの表情に合致しているはずの合成表情の集合 (a set of synthetic expressions) を導き出すために使用される。すなわち、変換関数が導き出されると、これはコードブック内の表情の各々に適用され、コードブック表情が人物Bの表情に合致するようにされる。従って、トレーニング集合の中に存在しない可能性のある、新しい表情が、例えば、人物Bから受信されたときは、合成コードブック表情をサーチすれば、人物Bの表情に最も合致する表情を見付けることができる。
別の実施形態では、顔の表情と動きを、ある顔から別の顔に変換するために使用できる共通顔構造 (common face structure) が定義されている。ここで説明している実施形態では、共通顔構造は、粗メッシュ構造 (coarse mesh structure) または「ベースメッシュ(base mesh)」からなり、これは、ある人物の表情を別の人物の表情に変換するときの基礎として使用される細分面 (subdivision surface) を定義している。共通ベースメッシュはすべての顔に対して使用され、2または3以上の顔が対応付けられるようにしている。従って、これによって定義された構造を使用すると、顔の動きをある人物から別人物に適応することが可能になる。この実施形態によれば、細分面を被写体の顔モデルに適応するための手法が用いられている。本発明による手法では、細分面上の、いくつかのポイントは、顔モデル上の対応するポイントに直接的にマッピングされるように定義されている。このことは、起こり得る、あらゆる異なる顔モデルについても同じである。この制約 (constraint) を加えると、ベースメッシュは、異なる顔モデルを同じように適合させる、という特性をもつことになる。さらに、本発明によるアルゴリズムでは、ベースメッシュと顔モデルとが確実に対応づけられるように最小限にされた平滑化汎関数 (smoothing functional) が利用されている。
別の実施形態では、被写体の顔面の反射率を計量化する反射率処理手法が用意されている。反射率を測定するために、本発明による手法では、反射率は拡散反射成分 (diffuse component) と鏡面反射成分 (specular component) に分離され、拡散反射成分の処理が中心になっている。
拡散反射成分を測定するために、アルベドマップ (albedo map) が最初に定義される。このアルベドマップは、カメラと、複数の異なる光源によって照射される被写体とを、最初に用意することによって定義される。光源は偏光フィルタ (polarizing filter) によってフィルタリングされる。このフィルタリングは、偏光フィルタがカメラの前に置かれた偏光フィルタと併用されて、鏡面反射を抑止するか、あるいは鏡面反射が記録されるのを防止することによって行われる。画像シーケンスは、被写体の頭を取り巻くように撮影される。各々の個別画像は、その画像に対応する個別アルベドマップが得られるように処理される。特定の被写体に対するすべてのアルベドマップは、その被写体の顔全体に対して単一のアルベドマップが得られるように結合される。
結論
上述してきた実施形態によれば、顔をリアル感のある顔にモデリングし、レンダリングするという高い基準を満たしてから、人間の顔と同じように親しみのある画像が信頼できる形で表示できるようにするという難題を解決するシステムと方法が提供されている。このアプローチの考え方は、顔モデルが実際に現実の顔に似るように、可能な限り測定を利用することにある。顔のジオメトリは、異なる顔に共通して統一した接続性と対応性をもつ、変位でマッピングされた細分面で表されている。反射率は、従来による人間の皮膚のBRDF測定から得られ、その測定が新規な測定と併用されて、複数の視点(ビュー)が拡散反射率を表す、単一の照明補正テクスチャマップになるように結合されている。動きは、上述した動き取り込み手法によって得られ、その動きが、改良された変形方法を使用して顔モデルに適用されることによって、シェーディング面に適した動きが得られるようにしている。レンダリングのリアル感は、現実の顔のジオメトリ、動きおよび反射率を物理ベースのレンダラ (physically-based renderer) で使用することによって大幅に向上されている。
以上、構造上の特徴および/または方法ステップからとらえて本発明を説明してきたが、以上の説明から理解されるように、請求項に明確化されている本発明は、上述した具体的特徴または方法ステップに必ずしも限定されるものではない。むしろ、具体的特徴および方法ステップは、請求項に記載の発明を実現する、好ましい実施形態として開示されたものである。
本発明の実施形態を実現する上で使用するのに適している汎用コンピュータを示すブロック図である。 被写体の顔の構造情報と反射率情報とを同時に取り込むために利用できるシステムを示す構成図である。 本発明の実施形態に従って構造情報と反射率情報を取り込むための例示方法を記載しているフローチャートである。 本発明の実施形態による例示コードブックと変換関数を示す説明図である。 本発明の実施形態による表情変換プロセスを示すフローチャートである。 本発明の実施形態のある種の原理が採用可能である例示システムを示すブロック図である。 (A)〜(C)は本発明の実施形態による例示表情変換を示す例示カラープレートのコレクションを示す図である。 同一細分制御メッシュを、顔が異なるごとに変位された細分面にマッピングするプロセスを示す図である。 (A)および(B)は面適合過程で特徴の対応づけを行うために利用される例示制約を示す図である。 本発明の実施形態による面適合方法のステップを記載しているフローチャートである。 本発明の実施形態に従って顔のアルベドマップを作るために採用できる例示システムを示す構成図である。 (A)および(B)はテクスチャ空間内に投影され、照明が補正された2つの写真の例示アルベドマップを示す図である。 (A)および(B)は図12に示す写真に対応する例示重み付け関数を示す図である。 (A)および(B)は2つの異なるデータセットに対する2つの完全アルベドマップを示す図である。 (A)および(B)は編集したあとの図14のアルベドマップを示す図である。 (A)〜(C)は異なる照明条件の下で異なる向きにレンダリングされた顔モデルのコレクションを示す図である。 (A)〜(C)は異なる照明条件の下で異なる向きにレンダリングされた顔モデルのコレクションを示す図である。 (A)〜(C)は異なる照明条件の下で異なる向きにレンダリングされた顔モデルのコレクションを示す図である。 本発明の実施形態に従ってアルベドマップを作成するための方法のステップを記載しているフローチャートである。 本発明の実施形態に従ってシングルピクセルのアルベドを計算するための方法のステップを記載しているフローチャートである。
以下、図面を参照して本発明の実施形態を詳細に説明する。
概要リアル感のある顔と顔表情をレンダリングするには、皮膚の反射率と顔の動きを非常に正確なモデルで表す必要がある。以下では、ジオメトリ、動きおよび反射率に関する測定データを使用して、顔をモデリングし、アニメーション化し、レンダリングして特定人物の顔の外観と顔表情をリアルに再現するための方法および手法が説明されている。ジオメトリと双方向反射率を含んでいる完全モデルが構築されるので、どのような照明条件と表示条件においても、顔をレンダリングすることができる。以下に説明するモデリングシステムと方法では、異なる顔間が対応付けられた構造化顔モデル (structured face model) が構築され、この顔モデルは、さまざまな顔のアニメーション操作の基礎となっている。
本発明による実施形態は、以下に説明するように、顔モデリングプロセスを構成する各部分と係わりをもっている。ジオメトリの表現を構造化し、統一化することによって、そのジオメトリ表現を顔モデルの基礎とし、多くの以後の顔モデリングとレンダリング操作の基礎となるようにするために、本発明の実施形態では、従来の面適合手法 (surface fitting technique) を拡張し、汎用の顔 (generic face) が異なる個人の顔に合致させるようにしている。リアル感のある反射率モデルを構築するために、最初に、最近の皮膚反射率測定が使用されるが、これは公知で実用化されている。さらに、改良されたテクスチャ取り込みプロセス (texture capture process) を使用して、新規に測定された拡散テクスチャマップが付加されている。汎用メッシュ (generic mesh) をアニメーション化するために、改良された手法が使用され、高品質レンダリングに適した面形状が得られるようにしている。
例示コンピュータシステム予備知識として、図1に、ここで説明している実施形態で使用できるデスクトップコンピュータ130の例の概要を示す。分散コンピューティング環境の状況下では、図示のようなコンピュータはさまざまなものが使用可能である。これらのコンピュータは、以下に記載されている説明に従ってグラフィックスをレンダリングし、画像(イメージ)を処理するために使用することができる。
コンピュータ130は、1つまたは2つ以上のプロセッサまたは処理ユニット132、システムメモリ134、およびバス136、すなわち、システムメモリ134を含む種々のシステムコンポーネントをプロセッサ132に結合しているバス136を含んでいる。バス136は、数種タイプのバス構造のいずれか1つまたは2つ以上で表されているが、この中には、さまざまなバスアーキテクチャを採用したメモリバスまたはメモリコントローラ、ペリフェラルバス、高速グラフィックスポート、およびプロセッサまたはローカルバスが含まれている。システムメモリ134としては、リードオンリメモリ (read only memory - ROM) 138とランダムアクセスメモリ (random access memory - RAM) 140がある。基本入出力システム (basic input/output system - BIOS) 142は、スタートアップ時のときのように、コンピュータ内のエレメント間の情報転送を支援する基本ルーチンで構成され、ROM 138に格納されている。
コンピュータ130は、さらに、ハードディスク(図示せず)との間で読み書きするハードディスクドライブ144、取り外し可能ディスク148との間で読み書きする磁気ディスクドライブ146、CD-ROMや他の光媒体のような、取り外し可能光ディスク152との間で読み書きする光ディスクドライブ150を装備している。ハードディスクドライブ144、磁気ディスクドライブ146、および光ディスクドライブ150は、SCSIインタフェース154または他の、ある種の該当ペリフェラルインタフェースを通してバス136に接続されている。これらのドライブおよびその関連コンピュータ読取可能媒体は不揮発性ストレージとして、コンピュータ読取可能命令、データ構造、プログラムモジュールおよび他のデータを、コンピュータ130のために格納している。ここで説明している例示環境では、ハードディスク、取り外し可能磁気ディスク148および取り外し可能光ディスク152が採用されているが、当業者ならば理解されるように、磁気カセット、フラッシュメモリカード、デジタルビデオディスク、ランダムアクセスメモリ (RAM)、リードオンリメモリ (ROM)などのように、コンピュータがアクセスできるデータを格納しておくことができる、他のタイプのコンピュータ読取可能媒体を、例示の動作環境で使用することも可能である。
いくつかのプログラムモジュールは、ハードディスク144、磁気ディスク148、光ディスク152、ROM 138またはRAM 140に格納しておくことが可能であり、その中には、オペレーティングシステム158、1または2以上のアプリケーションプログラム160、他のプログラムモジュール162、およびプログラムデータ164が含まれている。ユーザは、キーボード166やポインティングデバイス168などの入力デバイスを通して、コマンドや情報をコンピュータ130に入力することができる。他の入力デバイス(図示せず)として可能なものとして、マイクロホン、ジョイスティック、ゲームパッド、サテライトディッシュ、スキャナ、1つまたは2つ以上のカメラなどがある。上記および他の入力デバイスは、バス136に結合されたインタフェース170を通して処理ユニット132に接続されている。モニタ172または他のタイプのディスプレイデバイスも、ビデオアダプタ174などのインタフェースを介してバス136に接続されている。モニタのほかに、パーソナルコンピュータは、スピーカやプリンタのような、他の周辺出力デバイス(図示せず)を装備しているのが代表的である。
コンピュータ130は、リモートコンピュータ176のような、1つまたは2つ以上のリモートコンピュータとの論理コネクションを使用するネットワーキング環境で動作するのが通常である。リモートコンピュータ176としては、別のパーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ピアデバイスまたは他の共通ネットワークノードにすることが可能であり、図1にはメモリストレージデバイス178だけが示されているが、コンピュータ130に関連して上述したエレメントの多くまたはすべてを装備しているのが代表的である。図1に示す論理コネクションとしては、ローカルエリアネットワーク (local area network - LAN) 180と広域ネットワーク (wide area network - WAN) 182がある。この種のネットワーキング環境は、オフィス、企業内コンピュータネットワーク、イントラネット、およびインターネット (the Internet) ではありふれた存在になっている。
LANネットワーキング環境で使用されるときは、コンピュータ130は、ネットワークインタフェースまたはアダプタ184を通してローカルネットワーク180に接続されている。WANネットワーキング環境で使用されるときは、コンピュータ130は、インターネットのような、広域ネットワーク182上のコミュニケーションを確立するために、モデム186またはネットワークインタフェースのような他の手段を装備しているのが代表的である。モデム186は内蔵型と外付け型があり、どちらも、シリアルポートインタフェース156を介してバス136に接続されている。ネットワーキング環境では、パーソナルコンピュータ130に関連して上述したプログラムモジュールまたはその一部は、リモートメモリストレージデバイスに置いておくことが可能である。当然に理解されるように、図示のネットワークコネクションは例示であり、コンピュータ間の通信リンクを確立する他の手段を使用することも可能である。
一般的に、コンピュータ130のデータプロセッサは、コンピュータの種々コンピュータ読取可能媒体に、それぞれ時間を異にして格納されている命令によってプログラムされている。プログラムとオペレーティングシステムは、例えば、フロッピディスクやCD-ROM上に分散化されているのが代表的である。プログラムとオペレーティングシステムは、フロッピディスクやCD-ROMからコンピュータの二次メモリにインストールまたはロードされる。実行時には、プログラムとオペレーティングシステムは、少なくともその一部が、コンピュータの一次エレクトロニックメモリにロードされる。ここで説明している本発明によれば、マイクロプロセッサまたは他のデータプロセッサに関連して以下に説明されているステップを実現するための命令またはプログラムは、上述したタイプまたは他の種々タイプのコンピュータ読取可能記憶媒体に格納されている。また、本発明によれば、コンピュータ自体は、以下に説明されている方法および手法に従ってプログラムされている。
説明の便宜上、オペレーティングシステムのように、プログラムや他の実行可能プログラムコンポーネントは、ここでは離散的ブロックとして示されているが、当然に理解されるように、これらのプログラムとコンポーネントは、時期を異にしてコンピュータの異種ストレージコンポーネントに置かれていて、コンピュータのデータプロセッサによって実行される。
顔面の構造と特性を取り込むための例示システム従来は、取り込みシステム (capturing system) は、顔全体の顔構造と反射率特性の両方を、相互から独立して同時に取り込むことができなかった。例えば、構造化光 (structured light) を使用して顔の構造を取り込むシステムが存在しているが、これらのシステムは、反射率 (reflectance) のような、顔の特性を取り込んでいない。同様に、顔の反射率を取り込むシステムが存在しているが、これらのシステムは、顔の構造を取り込んでいない。顔の構造と反射率を、相互に独立して同時に取り込むことができると、収集したデータに別の操作を加え、さまざまな顔レンダリングとアニメーション化操作に役立てることが可能になる。以下では、例示レンダリング操作の一具体例が説明されているが、当然に理解されるように、下述しているシステムと方法の結果として得られる情報またはデータは、他のさまざまな分野で利用することが可能である。例えば、アプリケーション分野としては、セキュリティやパーソナルユーザ間のやりとり、などを目的とした顔の認識、ゲーム、ムービ(映画、動画)などのアニメーションを目的としたリアル感のある顔モデルの構築、およびユーザが自分の顔を容易に取り込んで、インタラクティブエンターテイメントやビジネスコミュニケーションで使用できるようにすること、などがある。
図2は、被写体の顔の顔構造と反射率特性を同時に取り込む上で、使用するのに適している例示システム200を示す。この例示システムは、1つまたは2つ以上のカメラの形体をしたデータ取り込みシステムを装備し、その1つがカメラ202として例示されている。カメラ202は、CCD画像センサと関連回路を装備し、CCDアレイを動作させ、CCDアレイから画像を読み取り、画像をデジタル形体に変換し、その画像をコンピュータに通知することを可能にしている。また、システムは、複数の光源またはプロジェクタの形体をした顔照明システム (facial illumination system) も装備している。複数のカメラが使用される場合には、これらのカメラは、時間的に同時取り込みを可能にするようにジェンロック (genlock) されている。図示の例では、2つの光源204、206が利用されている。光源204は、望ましくは、被写体の顔の上に投影される構造化パターン(structured pattern) を出力する。光源204は、適当なロケーションであれば、どこにでも置くことが可能になっている。このパターンは、被写体の顔の3D形状に関する構造情報またはデータを、カメラ202で取り込むことを可能にしている。赤外線領域の光で構成されたパターンを採用すると有利であるが、適当な光源であれば、どの光源でも使用可能である。光源206は、望ましくは、顔の反射率特性の拡散反射成分をカメラ202で取り込めるようにする光を出力する。光源206は、例えば、ビームスプリット (beam splitting) 手法でカメラのレンズ202aと同列に置いておくと有利であるが、適当なロケーションであれば、どこにでも置くことが可能である。この光源は、カメラのレンズを取り囲むように適応させることも可能である。また、この光源は、反射率の鏡面反射成分 (specular component) が抑止または除去されるように選択されている。図示の例では、線形偏光フィルタ (linear polarizing filter)は偏光照明を得るために採用され、別の偏光フィルタは前記線形偏光フィルタに直交する向きになっていて、レンズ202aの前に置かれているため、顔からの鏡面反射がカメラによって記録されないようにしている。上述した照明システムは、異なる周波数の光源、例えば、カメラの赤と緑チャネルに対応する光源を使用してシミュレートされている。なお、これらのチャネルは、どちらも赤外線領域にすることが可能である。さらに、光源がナローバンド(例えば、780-880 nm)になるように選択すると、周囲光の影響を除去することができる。この特性が達成されるのは、カメラもナローバンドになるようにフィルタリングされるときだけである。光源からの照明はナローバンドの波長に集中されるのに対し、周囲光はブロードレンジの波長にわたって拡散されるので、光源からの光は、上記のような波長のときの周囲光よりも強力になる。カメラは、光源から放出された波長だけを記録するようにフィルタリングされるので、周囲光による影響を受けることはほとんどない。その結果、カメラは、選択された光源が被写体に及ぼす影響だけを検出することになる。
複数の異なる光源を使用すると、具体的には、赤外線光源を偏光光源(これも赤外線光源にすることが可能である)と併用すると、カメラは、顔に関する構造情報またはデータ(光源204からの)と顔に関する反射率情報またはデータ(光源206からの)を、相互に独立して同時に取り込むことが可能になる。構造情報は顔の3次元様相を記述しているのに対し、反射率情報は顔の拡散反射率特性を記述している。この情報は、コンピュータ208などの、コンピュータ化画像プロセッサによって処理されると、以後の顔アニメーション操作で使用できる情報またはデータが得られることになる。以下で説明する例では、この情報は3次元データ(3Dデータ)とアルベドマップ (albedo map) を含んでいる。
図3は、ここで説明する実施形態による方法のステップを記載しているフローチャートである。ここで説明する方法によれば、顔の構造と反射率特性に関する情報またはデータは、同時に収集し、処理することが可能になっている。ステップ300で、被写体の顔は複数の異なる光源で照射される。このステップを実現する例示システムは図2に示されている。なお、図示の例では、2つの例示光源が利用されているが、当然に理解されるように、他の複数の光源を使用することも可能である。ステップ302で、ステップ300の照射からレンジマップデータ(デプスマップデータ)と画像データが測定される。すなわち、ステップ300の照射により、カメラは光反射率を検出することが可能になり、この光反射率は、レンジマップデータと、そこに構造光源パターンを含んでいない画像データ(つまり、反射率)の両方を得るために利用されることになる。レンジマップデータと画像データはコンピュータ208(図2)に渡され、そこで処理される。この時点で、ステップ304で、汎用顔テンプレート (generic face template)をレンジマップデータに適用すると、レンジマップデータに関連して生じている種々のノイズを除去することができるが、これはオプションである。汎用顔テンプレートは、レンジマップデータに含まれるノイズを除去する3Dフィルタと考えることができる。汎用顔テンプレートは、この分野の精通者に自明のものである。
ステップ306で、レンジマップデータが使用され、3D面が導き出され、あるいは計算される。適当なアルゴリズムであれば、どのアルゴリズムでも使用可能であり、これは、この分野の精通者に自明のものである。アルゴリズムの例としては、次の論文に記載されているものがある。すなわち、Turk & Levoy著「レンジ画像からのジッパドポリゴンメッシュ(Zippered Polygon Meshes)」(SIGGRAPH94)、およびF. Bernardini、J. Mittleman、H. Rushmeier、C. Silva、G. Taubin共著「面再構築のためのボールビボッティングアルゴリズム(The Ball-Pivoting Algorithm)」(Trans. Vis. Comp. Graph. 5:4 (1999)) である。ステップ308で、ステップ306の3D面に対する面法線ベクトル(「面法線」)が、公知のアルゴリズムを使用して計算される。このタスクを実行する1つの方法は、三角形に対する法線を計算し、各頂点周りの三角形法線の平均をとって、頂点法線を作り、頂点法線を各三角形の内部を横切るように補間することである。当然のことであるが、他の方法を利用することも可能である。次に、ステップ310で、ステップ308で計算された面法線とステップ302の画像データが使用されて、アルベドマップが導き出される。アルベドとは、特殊タイプのテクスチャマップであり、そこでは、各サンプルは、顔面上の特定ポイントでの顔面の拡散反射率を記述している。アルベドマップの導出は、上記に示した情報が与えられていれば、この分野の精通者には自明のものである。例示のアルゴリズムは、Marschner著「コンピュータグラフィックスの逆レンダリング(Inverse Rendering for Computer Graphics)」(PhD thesis, Cornel University, August 1998) に記載されている。
この時点で、図2に示すように、照明処理の結果として、被写体の顔の構造特徴を記述している3Dデータと、画面の拡散反射率を記述しているアルベドマップデータとが得られている。
上記照明処理は、記述されている情報を抽出するために使用できるので、抽出した情報は適当な目的のために使用することができる。特に利点のある実施形態では、抽出された情報は、被写体の表情を抽出し、認識するために利用されている。この情報は、表情変換のために使用できる。すぐあとで説明されている、本発明による実施形態では、ある人物の表情は、別人物の表情を、リアル感をもって変換するために使用することができる。
コードブックの使用による表情変換ある表情変換実施形態では、コードブック (code book) の考え方が取り入れられ、以下に説明されている表情変換操作で利用されている。図4は、ある人物から取り込まれた多数の、異なる表情を収めているコードブック400の例を示す。これらの表情は、汎用表情 (generic expressions)、つまり、特定の個人からではなく、汎用的人物からの表情と考えることができる。この例では、表情は、表情1から表情Nまでの範囲を有する。表情1は、例えば、「スマイル」であり、表情2は「しかめ面」にであり、表情3は「怒り」の表情である。以下、同様である。コードブック400に収められている表情は、数学的には、それらのジオメトリの形で記述されており、すぐ上で説明したプロセスのような、適当な方法で取り込むことが可能である。
表情変換を行うために、コードブック400内の表情の一部を使用して、変換関数 (transformation function) が最初に導き出される。変換関数を導き出すために、トレーニング表情集合 (training set of expressions) 402という考え方が取り入れられている。表情トレーニング集合402は、その表情がコードブック400に記述されている個人とは別の個人から得られる表情の集合で構成されている。トレーニング集合402のトレーニング表情は、コードブック表情のサブセット(部分集合)になっている。つまり、トレーニング集合の中の各表情は、コードブック400の中の表情に対応している。例えば、トレーニング集合402は、3つの表情、すなわち、表情1、表情2、および表情3で構成することが可能であり、そこでは、表情は、それぞれ「スマイル」、「しかめ面」および「怒り」になっている。変換関数の目標は、トレーニング集合の表情に関連付けられたジオメトリック変形を受け取り、そのジオメトリック変形をコードブック400の表情のすべてに適用して、コードブック表情がリアル感のある表情表現となるようにすることである。すなわち、各人物の顔は、どの任意の表情についても、ジオメトリが異なった変形の仕方をするものと考えられる。ある表情のときの、ある人物のジオメトリックな顔の変形が、表情をレンダリングする目的で別人物の顔に単純に適用されると、その変形が適用された顔は、非常にゆがんだように見えることになる。このようなことが起こるのは、顔のジオメトリが異なるだけでなく、顔と顔の間のように顔の変形が異なるためである。従って、ある表情集合から別の表情集合への最良変換が得られるような変換関数が導き出されている。
図4に戻って説明すると、図4には、線形変換プロセッサ406が示されている。この変換プロセッサ406は、適当なハードウェア、ソフトウェア、ファームウェア、あるいはこれらの組み合わせで実現することが可能である。図示の例では、線形変換プロセッサ406はソフトウェアで実現されている。線形変換プロセッサはトレーニング表情集合402と、対応するコードブック表情404とを入力として受け取る。変換プロセッサはこれらの入力を処理して、変換関数408を導き出す。この変換関数408を、コードブック400内の表情のすべてに適用すると、合成表情集合 (synthesized set of expressions) が得られる。この合成表情集合は、トレーニング表情集合が得られた人物の表情に関連するジオメトリック変形によって操作された、コードブックの表情を表している。
表情が同じであるときの顔の変位は、次の2つの理由で異なる人物では同じになっていない。その1つは、動き取り込みサンプルポイント(この具体例では、この特定アルゴリズムによると、顔の動きがどのように表現できるかを示している)は、位置に誤差があると、正確に一致しないからである。もう1つは、頭の形状とサイズは人物と人物の間で変化するからである。
第1の不一致は、すべての顔の動き取り込み変位データを、汎用メッシュ上の一定位置集合で再サンプリングすることによって解消することができる。これについては、以下の「顔モデルを構築するための例示システムと方法」の個所に詳しく説明されている。そこでは、一定位置集合は「標準サンプル位置(standardsample positions)」と呼ばれている。再サンプリング関数はメッシュ変形関数(mesh deformation function) である。標準サンプル位置は、一度細分化された汎用メッシュの頂点に対応する、顔メッシュの頂点である。
第2の不一致では、ある顔から別の顔へ変位データを変換し、顔のサイズと形状の変化を補償する必要がある。図示の例では、これは、2つのデータセットについて対応する表情の小さなトレーニング集合を見付けたあと、一方から他方への最良線形変換を見付けることによって行われる。1つの例として、次の場合を考えてみる。すなわち、実験的環境では、感情を表す表情は、複数の表情のさまざまな強さを含む、49個の対応する表情に対して手作業でラベルが付けられていた。音声の動きについては、10,000フレームは、時間歪曲 (time warping) 手法を用いて自動的にアライメントされていた。
各表情は、m個の標準サンプル位置でのx, y, z変位のすべてを含んでいる3mベクトルgによって表されている。変換される顔のn個の表情ベクトル集合をga1...nとし、ターゲット顔の対応するベクトル集合をgb1...nとすると、線形予測子 (linear predictors) 集合ajは、下に示す3m線形最小二乗システムの解を求めることによって、gnの座標ごとに1つずつ計算される。
図示の例では、各gajのポイントは小さなサブセットだけが使用されている。具体的には、標準サンプルポイントとエッジを共有するポイントだけが考慮の対象になっている。使用されたメッシュでは、平均価 (average valence) は約6であるので、代表的なgajは18要素になっている。その結果のシステムは大体n x 18である。
結果の線形システムは条件付けが十分でない場合があり、その場合には、線形予測子ajは良好に概念化されない。特異値(singular value) の拡散は、擬似逆関数(pseudoinverse) を計算して、ajの解を求めるとき制御されるので、概念化が大幅に改善される。ασ1未満の特異値はすべてゼロにされる。ただし、σ1はマトリックスの最大特異値であり、α = 0.2,・・・0.1である。
図5は、ここで説明している実施形態による表情変換方法のステップを記載しているフローチャートである。ステップ500で、表情のコードブックが用意される。この種のコードブックの例は上に示されている。ステップ502で、トレーニング表情集合が用意される。代表例として、このトレーニング集合は、コードブック表情が得られた人物とは異なる人物からの表情の集合になっている。トレーニング表情集合は、適切であれば、どの方法によっても取り込むことができる。1つの例として、表情は、図2に示すようなシステムを使用して取り込むことができる。トレーニング表情集合が用意されたあと、ステップ504で、トレーニング集合とコードブックを使用して変換関数が導き出される。この作業を行う1つの方法例は、上述した通りである。当然のことであるが、本発明の精神と範囲を逸脱しない限り、他の方法を使用することも可能である。例えば、ニューラルネットワーク (neural network) などの、種々の非線形変換を使用することも、基礎表情 (basis expressions) の加重和を使用することも可能である。変換関数が導き出されると、これはコードブック内の表情のすべてに適用され、以後の顔アニメーション操作の基礎として利用できる合成表情集合が得られ、あるいは定義される。
例示のアプリケーション図6はシステム600を示す。そこには、上述した表情変換プロセスをどのように採り入れるかが、1つの例で示されている。システム600は送信側コンピューティングシステム、つまり、トランスミッタ602と、受信側コンピューティングシステム、つまり、レシーバ604とを含み、これらは、インターネット(the Internet) などのネットワーク603を介して通信するように接続されている。トランスミッタ602は照明システム200(図2)を含み、これは、図2を参照して上述したように、ある人物の表情を取り込むように構成されている。さらに、トランスミッタ602は、図4を参照して上述したものと同じような、コードブック400を含んでいる。なお、ここでは、コードブックは、上述したように合成表情集合に合成されているものとする。すなわち、照明システム200が取り込んだ表情をもつ人物から得られたトレーニング表情集合を使用して、コードブックが処理され、合成表情集合が得られている。
レシーバ604は再構築モジュール606を含み、これは、トランスミッタ602から受信したデータから顔画像を再構築するように構成されている。また、レシーバ604は、トランスミッタ602側のそれと同じコードブック400を含んでいる。ここでは、トランスミッタ602側にいる人物が、レシーバ604側にいる人物と通信しようとしている。トランスミッタ602側にいる人物が通信のために顔を動かすと、その顔表情と動きはトランスミッタ602によって取り込まれ、処理される。この処理には、顔表情を取り込み、合成コードブックをサーチして、コードブックの中で最も近似している合致表情を見付けることを含めることが可能である。合致する表情が合成コードブックの中で見つかると、その表情のインデックスがレシーバ604に送られ、アニメーション化された顔が再構築モジュール606を使用して再構築される。
例示の顔変換図7は、ここで説明している実施形態による表情変換のいくつかの効果を示す図である。1行目の絵(A)は、第1人物(人物A)の合成顔を構成しており、そこには3つの異なる表情が示されている。これらの絵は、人物Aの取り込まれた顔の動きの結果である。第2人物(人物B)の顔の動きは、すでに取り込まれている。人物Bの取り込まれた顔の動きは3行目(C)に示されている。ここでは、3D動きデータは、いくつかのカラードットを人物の顔の上に置き、人物の顔が変形されたときドットの動きを測定することによって取り込まれているが、このことは、この分野の精通者ならば当然に理解されるものである。なお、顔の動きは、上述したシステムと方法によって取り込むことができる。人物Bの取り込まれた動きは、上述したように使用されて、人物Aの表情が変換されている。この操作の結果は、2行目に示されている。これら3セットの絵の表情は、すべて相互に一致している。同図に示すように、1行目(A)と2行目(B)の表情は、非常に異なる2人物から導き出されたとしても、非常に類似しているのに対し、第2人物(3行目(C))のオリジナル表情は、1行目(A)と2行目(B)の表情とは全体的に類似していない。
顔モデルを構築するための例示システムと方法リアル感のある画像を作るために必要とされる顔のモデルは、2つの部分からなっている。モデルの第1部分は、顔のジオメトリ(つまり、顔面の形状)に関係している。他方、モデルの第2部分は、顔の反射率(つまり、顔のカラーと反射特性)に関係している。このセクションでは、このモデルの第1部分、つまり、顔のジオメトリについて説明する。
顔のジオメトリは、皮膚面に、目を表す別の面を加えたものから構成されている。この例では、皮膚面は、頭をレーザレンジでスキャンすることによって導き出され、変位マップをもつ細分面で表されている。目は別モデルであり、これは皮膚面と位置合わせされ、マージされて、高品質レンダリングに適した完全顔モデルが得られている。
メッシュ適合顔モデルを構築する第1ステップでは、レーザレンジスキャナで測定されたジオメトリに密接に近似する細分面が作成される。図示の例では、細分面は、Loopの細分ルールを使用して粗三角メッシュから定義されている。Loopの細分ルールは、Charles Loop著「三角形に基づく平滑細分面(Smooth Subdivision SurfacesBased on Triangles)」(PhD thesis, University of Utah, August 1987) に詳しく説明されている。さらに、細分面は、Hoppe他著「区分平滑面再構築(Piecewise smooth surface reconstruction)」(Computer Graphics (SIGGRAPH '94 Proceedings) pp. 295-302, July 1994) に記載されているものと類似のシャープエッジを追加して定義されている。なお、不規則なクリーズマスク (crease mask)は使用されていない。さらに、ダーツ(dart) とクリーズ頂点(crease vertex)の間のエッジを細分化するとき、クリーズ頂点に隣接する新エッジだけがシャープエッジとしてマークされている。
すべての顔モデルに対する細分面は、シングルベースメッシュを使用して定義され、頂点位置だけが、各々の異なる顔の形状に適応するように変化している。図示の例では、227個の頂点と416個の三角形をもつベースメッシュは、顔の全体形状をもち、目と唇付近が詳細化されるように定義されており、そこでは、最も複雑なジオメトリと動きが現れている。口の開きはメッシュの境界になっており、上唇と下唇上の対応する頂点の位置を1つに結ぶことによって、適合プロセス期間は、閉じたままになっている。このベースメッシュには、シャープな細分ルール用にマークされた少数のエッジがあり、これらは、口の開きの両側にコーナを作成し、鼻の両側を折り重ねるときの場所を得るのに役立っている。修正された細分ルールでは、少なくとも3つのシャープエッジのチェインに対してだけクリーズが取り入れられているので、このモデルは表面にクリーズがない。孤立頂点 (isolated vertex) だけは、明確に定義された限界法線 (limit normal) をもつことができないからである。
図8は、この例に従って使用された粗定義メッシュ(中央の図)の例を示す。図8は、この粗メッシュをどのように使用して、同じ細分制御(粗)メッシュを各々の顔の変位細分面にマッピングすると、ある顔と別の顔との間に自然な対応関係が得られるかを示したものである。この側面は、以下に詳しく説明されている。
細分面を各顔に適合させるために使用されるプロセスは、Hoppe他著「区分平滑面再構築(Piecewise smooth surface reconstruction)」(Computer Graphics(SIGGRAPH '94 Proceedings) pp. 295-302, July 1994)に記載されているアルゴリズムに基づいている。Hoppeの面適合法は、基本的には、3つのフェーズからなるものと言うことができる。すなわち、トポロジ型推定(フェーズ1)、メッシュ最適化(フェーズ2)、および区分平滑面最適化(フェーズ3)である。
フェーズ1では、未知の面上または付近に未組織のポイント集合が与えられている、相対的に多数の三角形からなる三角メッシュが構築される。このフェーズでは、面のトポロジ型が判断され、ジオメトリの初期推定が得られる。フェーズ2は、フェーズ1の出力から始まり、三角形の数を減らし、データへの適合を改善する。このアプローチでは、表現の簡潔化と適合の良好化という、相互に競合する目標間のトレードオフを明示的にモデル化するエネルギ関数を最適化することを課題としている。この最適化手順における自由変数としては、メッシュ内の頂点の数、その接続性 (connectivity)、およびその位置がある。フェーズ3は、フェーズ2で得られた最適化メッシュ(区分線形面)から出発し、この場合も、簡潔性とデータへの適合性をトレードオフするエネルギ関数を最適化することによって、正確で、簡潔な区分平滑細分面を適合させる。フェーズ3で最適化が行われると、制御メッシュ内の頂点の数、その接続性、その位置、およびシャープな特徴の数とロケーションが変化する。面におけるシャープな特徴の自動検出と回復は、このフェーズの不可欠な部分となっている。
この実施形態では、処理の仕方が、Hoppe他に記載されているアプローチとは、2つの点で異なっている。第1は、制御メッシュの接続性を変更する必要がないので、連続的最適化は、頂点位置に対してだけ行われることである。さらに、特徴の制約が、平滑化項と共に追加されていることである。
図示の例では、適合プロセスは次の汎関数を最小化する。
上記において、vはすべての頂点位置のベクトル、pはレンジスキャナからの全データポイントのベクトルである。3つの項の下付き文字は、距離、形状、および制約を表している。距離関数Edは、レンジスキャナポイントから細分面までの和二乗距離 (sum-squared distance) を測定する。
上記において、piはI番目のレンジポイント、Π(v, pi) は、頂点位置vで定義された細分面上のレンジポイントの投影である。重みaiは、piにおけるスキャナの視点方向がΠ(v, pi) における面法線と一致していないポイントを無視させるブール項である。さらに、面からある距離以上に離れているポイントは拒否される。
上記において、s(p) は、ポイントpにおけるスキャナの視点に向かう方向、n(x) はポイントxにおける外側に面する面法線である。
平滑関数Esは、制御メッシュをローカルに平坦化させるものである。この関数は、各頂点から隣接頂点の平均までの距離を測定する。
頂点vkiは、vjの隣接頂点である。
制約関数Ecは、単純には、制約頂点集合から対応するターゲット位置集合までの和二乗距離である。
上記において、Ajは、j番目の頂点の限界位置を、制御メッシュからとらえて定義し、頂点ciの限界位置が3Dポイントdiに付加されるようにする線形関数である。制約は、最適化変数の再パラメータ化によって厳格に適用することも可能であるが、この制約をソフトにすると、繰り返しが望ましいローカル最小限まで円滑に行われることが判明している。制約は、汎用メッシュの顔特徴を、適合される特定の顔上の、対応する特徴に合致させるためにユーザによって選択される。この例では、約25乃至30の制約が使用され、目、鼻、および口に集中している。図9は、900での細分制御メッシュ(A)の制約と、顔モデル(B)上の対応するポイントを示す。
E(v) を最小限にすることは、Πとaiがvの線形関数でないので、非線形最小二乗問題である。しかし、aiを一定に保ち、Π(v,pi) を一定の線形的制御頂点の組み合わせによって近似化すると、これを線形問題にすることができる。従って、適合プロセスは、線形最小二乗問題のシーケンスとして進められ、a1および面上のpiの投影は、各繰り返しの前に再計算されることになる。細分限界面は、これらの計算を行うために、特定の細分レベルにあるメッシュによって近似化される。顔を適合することは、少数の繰り返しで行われ(30未満)、制約は、繰り返しの進行と共に、単純なスケジュールに従って更新されて行く。その更新は高λと低μから始まって、最適化を非常にスムーズな顔の近似化に導いて行き、低λと高μまで進んで行き、最終的解により、データと制約は密接に適合することになる。実際の計算時間は、Π(v,pi)の計算時間によって決まる。
レンダリングのためのメッシュを作るために、面は望ましいレベルまで細分化され、顔の形状にスムーズに近似しているメッシュが得られる。変位は、各々の頂点ごとに、その頂点での面に対するライン法線を、オリジナルスキャンで定義された三角面と交差させることによって計算される。これについては、Lee他著「変位細分面(Displaced Subdivision Surfaces)」(SIGGRAPH '00 Proceedings,July 2000)に説明されている。その結果の面は、オリジナルスキャンの目立った特徴をすべて、若干三角形が少なくなっているメッシュに再現しているが、これは、ベースメッシュは顔の重要な領域の三角形が多くなっているためである。この細分ベースの表現によると、面をパラメータ化したものと、そのパラメータ化で定義された組み込み多重解像基底関数集合 (built-in set of multiresolution basis functions) とが得られることになり、さらに、特徴制約が適合時使用されるため、この方法を使用して適合されるすべての顔にわたって自然の対応関係が得られることになる。この構造は、顔のアニメーションで利用すると、多くの面で便利である。
図10は、ここで説明している実施形態に従って顔モデルを構築するための方法のステップを記載しているフローチャートである。この方法は、適当なハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせで実現することが可能である。この例では、方法はソフトウェアで実現されている。
ステップ1000で、1つまたは2つ以上の顔の3Dデータが測定され、対応する顔モデルが得られる。上記の例では、3Dデータは、顔をレーザレンジでスキャンすることによって得られていた。当然に理解されるように、3Dデータは他の方法で得ることも可能である。ステップ1002で、1つまたは2つ以上の顔モデルに適合するために使用される汎用顔モデルが定義される。当然に理解されるように、汎用顔モデルは、多数の異なる顔に適合するように利用できるという利点がある。従って、このことは、そのようなことが行われていなかった従来の方法に比べて、改良点となっている。上述した例では、汎用顔モデルは、粗三角メッシュ (coarse triangle mesh) の形体をしたメッシュ構造になっている。この三角メッシュは、顔のジオメトリに密接に近似している細分面を定義している。図示の例では、顔モデルのすべてについての細分面は、シングルベースメッシュを使用して定義されている。ステップ1004で、汎用顔モデル上の個々のポイントまたは制約が選択される。これらの個々のポイントまたは制約は、顔モデル上にマークされた、対応するポイントに直接にマッピングされる。これら個々のポイントのマッピングは、起こり得る多数の、異なる顔モデルの各々について、同じように行われる。ステップ1006で、汎用顔モデルは1つまたは2つ以上の顔モデルに適合される。このステップは、各々の異なる顔の形状に適応するように、頂点の位置だけを操作することによって行われる。適合プロセス期間には、頂点位置だけにわたって連続的最適化が行われるので、メッシュの連続性が変更されることはない。さらに、この適合プロセスでは、個々のポイントまたは制約が直接に顔モデルにマッピングされる。さらに、平滑項 (smoothing term) が追加され、これは、制御メッシュがローカルに平坦化されるように最小化されている。
目の追加上述してきた変位細分面は、顔の皮膚面の形状を非常によく表している。しかし、リアル感のある顔を得るために望ましいとされる特徴が、他にもいくつかある。その中で最も重要な特徴が目である。レーザレンジスキャナは目に関する適切な情報を取り込まないので、メッシュは、別々にモデル化された目を追加することによって、レンダリングのために補強されている。顔モデルの他の部分と異なり、目とその動きは、特定の人物から測定されないので、リアルな目の外観を再現するとは限らないようになっている。しかし、目の存在と動きは、顔モデルの全体的外観にとって非常に重要である。
適切な目モデルであれば、その目モデルを使用して目をモデル化することができる。図示の例では、2部分からなるモデルを構築するために、市販のモデリングパッケージが使用されている。第1部分は眼球のモデルであり、第2部分は目回りの皮膚面のモデルであり、その中には、まぶた、眼窩、および周囲顔面部分が含まれている(この第2部分は「眼窩面(orbit surface)」と呼ぶことにする)。目を全体顔モデルの一部にするためには、眼窩面を、モデル化しようとする個人の顔に適合させる必要があり、2つの面を縫い合わせる必要がある。これは2ステップで行われる。最初に、2つのメッシュは、眼窩面上に定義された重み付け関数に従ってゆがみが付けられ、顔と眼窩が重なり合った個所で同時に現れるようにする。次に、2つ面はペアの同心楕円面でカットされ、1つのメッシュになるように縫い合わされる。
なお、上述してきた実施形態の利点のある特徴の1つは、これらの実施形態によると、ある人物の表情を別の人物の表情に変換するために使用できる構造またはフレームワークが得られることである。汎用顔モデルを各個人の顔に適合することは、汎用モデルのどの部分も、各人物の顔上の同じ特徴に常にマッピングされるように制約されている。例えば、汎用モデル中の口の左隅は、どの人物の顔でも、その口の左隅に常にマッピングされる。適合顔モデルの集合を利用すると、どの顔においても、ある特定の顔にある特定のポイントに対応するポイントを判断することができる。例えば、人物Aの顔上の口の左隅の動きが測定されたとする。顔Aへの汎用モデルの適合を使用すると、汎用モデルのどのポイントが測定ポイントに対応しているかを判断することができ、次に、顔Bへの汎用モデルの適合を使用すると、Bの顔のどのポイントが汎用モデル上の、計算されたポイントに対応しているか、従って、顔Aの測定ポイントに対応しているかも判断することができる。測定した顔上のポイント集合から動きを再現するために新しい顔のどの部分を移動させる必要があるかを知っている必要があるため、この情報は、動きをある顔から別の顔に変換する上で不可欠である。
顔の動き顔の動きは、画面上のサンプルポイント集合の、時間と共に変化する3D位置によって指定される。顔が動き取り込みデータによって制御されるとき、これらのポイントは、動き取り込みシステムによってトラッキングされる、顔上のマーカになっている。これらのポイントの動きは、顔面の領域にスムーズに影響する制御ポイントの集合によって顔面を制御するために使用される。顔の動きデータの取り込みは、この分野の精通者ならば理解されるように、いずれかの適当な方法で行うことができる。1つの具体例では、顔の動きは、Guenter他著「顔の作成(Making Faces)」(Proceedings of SIGGRAPH 1998, pp. 55-67, 1998) に記載されている手法を使用して取り込まれていた。
メッシュ変形顔は、制御ポイント集合qjの変位の線形的組み合わせに従って、三角メッシュの各頂点wiをその静止位置から変位することによってアニメーション化されている。これらの制御ポイントは、動きを記述しているサンプル点pjと1対1で対応している。各制御ポイントが頂点に及ぼす影響は、対応するサンプルポイントからの距離と共に低下していき、複数の制御ポイントが頂点に影響する場合には、それらの重みは総和が1になるように正規化される。
上記において、頂点iが複数の制御ポイントによって影響される場合、βi =Σk αik であり、そうでなければ1である。これらの重みは、サンプルポイントと顔メッシュの静止位置を使用して一回計算されるので、フレームごとのメッシュの動きはスパースマトリックス乗算 (sparse matrix multiplication) になっている。重み付け関数については、次式が使用されていた。
顔をアニメーション化する細部を処理するには、これらの重み付けルールには2つタイプの例外が設けられている。目と口の付近の頂点と制御ポイントは、「上」および「下」のタグが付けられ、例えば、口の上にある制御ポイントは口の下にある頂点の動きには影響しない。また、目の周囲の領域におけるスカラテクスチャマップ (scalar texture map) は、目がスムーズなテ−パ状になって、まぶたの個所でゼロになるように動きに重み付けするために使用されている。サンプルポイント集合に従って顔メッシュを動かすには、制御ポイント位置を計算して、顔面がそれなりに変形されるようにしなければならない。上述したのと同じ重み付け関数を使用すると、サンプルポイントが制御ポイントに応じてどのような動きをするかを計算することができる。その結果は線形変換p = Aqである。従って、時刻tに、サンプル位置ptを求めるには、制御ポイントqt = A-1ptを使用することができる。しかし、マトリックスAは条件付けが十分でないことがあるので、制御ポイントの動きが非常に大きいために起こる、望ましくない面形状を回避するために、SVD(Singular Value Decomposition−特異値分解)を使用してA-1が計算され、A-1の特異値は限界Mでクランプされる。図示の例では、M = 1.5が使用されている。SVDを論じている参考文献としては、GolubおよびVan Loan著「マトリックス計算(Matrix Computations)」第3版、Johns Hopkins press,1996がある。
目と頭の動き顔を実物に近い外観にするためには、プロシージャで生成された動きが目に加えられ、別々に取り込まれた剛体運動が頭全体に加えられる。眼球は、ランダムな固定方向のシーケンスに従って回転され、一方の眼球から次の眼球に向かってスムーズに移動して行く。まぶたは、眼球の中心を通る軸周りにまぶたを定義している頂点を回転し、まぶたメッシュ上に定義された重みを使用して変形がスムーズに行われるようにすることでアニメーション化される。
頭の剛体運動は人物の頭の物理的動きから取り込まれ、これは、その人物が特殊なマシン認知可能ターゲットでマークされた帽子を着用している間にその動きをフィルムに写すことによって行われる(帽子は、Marschner他著「人間の皮膚を含む画像ベースBRDF測定(Image-based BRDF measurements including human skin)」、Rendering Techniques '99 (Proceedings of the Eurographics Workshop on Rendering), pp. 131-144, June 1999で使用されているものに近似するようにパターン化されている)。これらのターゲットをビデオシーケンスでトラッキングすることにより、頭の剛体運動が計算され、そのあと、これは頭モデルをレンダリングするために適用される。このセットアップによると、ビデオカメラだけで済むので、望みのアクションを実演しながら頭の動きを作っていくことができる。
反射率をモデリングするための例示システムと方法リアル感のある顔画像をレンダリングするためには、ジオメトリが正確であるだけでなく、皮膚からの光の反射の計算が正確であることが要求される。図示の例では、顔をレンダリングするために、物理ベースのMonte Carlo光線トレーサが使用されている。手法の例としては、Cook他著「分布光線トレーシング(Distribution Ray Tracing)」、Computer Graphics (SIGGRAPH '84 Proceedings), pp. 165-174, July 1984およびShirley他著「直接照明計算のためのMonte Carlo手法(Monte Carlo techniques for direct lighting calculations)」、Transactions on Graphics, 15(1):1-36, 1996に記載されているものがある。この方法によると、任意のBRDF(bi-directional reflectance distribution functions:双方向反射率分布関数)を使用して、単純なシェーディングモデルでは近似化が困難であった、皮膚の外観を正確にシミュレートすることができる。さらに、拡張光源が使用されているが、これは、ポートレート写真のようにレンダリングするとき、見苦しくない画像を得るために必要になるものである。物理的光移動は、計算効率の必要上、次の2点でずれるようにしている。すなわち、拡散相互反射 (diffuse interreflection) は無視され、目は屈折なしで瞳を通るように照明されている。
図示の例では、皮膚の反射率モデルは、実際の人間の顔の測定に基づいている。手法の例としては、Marschner他著「人間の皮膚を含む画像ベースBRDF測定(Image-based BRDF measurements including human skin)」、Rendering Techniques '99 (Proceedings of the Eurographics Workshop on Rendering), pp. 131-144, June 1999に記載されているものがある。これらの測定は、いくつかの被写体の額の平均BRDFを記述しており、Lafortune他著「反射率関数の非線形近似化(Non-linear approximation of reflectance functions)」、Computer Graphics(SIGGRAPH '97 Proceedings), pp. 117-126, August 1997に記載されているBRDFモデルの適合パラメータを含んでいる。従って、これらの測定は、リアル感のある顔をレンダリングするときの、すぐれた出発点となっている。しかし、これらの測定は、実際の顔で観察される空間的変化の一部を含むように補強する必要がある。これは、その皮膚がレンダリングした皮膚と類似している被写体の測定BRDFへの適合から始め、それを拡散反射成分と鏡面反射成分に分離することによって行われる。そのあと、各々をモジュレートするためにテクスチャマップが取り入れられている。
拡散反射成分のテクスチャマップ、つまり、「アルベドマップ(albedo map)」は、以下で説明するように、被写体の実際の顔から取られた測定に従って、拡散反射率をモジュレートする。鏡面反射成分は、スカラテクスチャマップ (scalartexture map) によってモジュレートされ、皮膚反射率でレンダリングしてはならない個所(まゆやまつ毛など)から鏡面反射が除去され、顔の下部の鏡面反射が低減され、顔の皮膚の特徴に近似するようにされる。その結果は、空間的に変化するBRDFであり、これは、Lafortune他著「反射率関数の非線形近似化(Non-linear approximation of reflectance functions)」、Computer Graphics (SIGGRAPH '97 Proceedings), pp. 117-126, August 1997の概念化コサインローブ (generalized cosine lobes) の和によって各ポイントに記述されている。
アルベドマップの構築図示し、上述してきた実施形態では、拡散反射に起因する、空間的に変化する反射率を記述していることが要求されるアルベドマップは、制御された照明の下で撮影された顔のデジタル写真シーケンスを使用して測定されていた。
図11は、デジタル写真または画像を取り込むために使用された例示システムを示している。図示のシステムでは、デジタルカメラ1100が装備され、複数の光源を含んでいる。そのいつくかの例は1102、1104で示されている。垂直ポラライザ1106、1108、および1110の形体をした偏光フィルタが装備され、光源とカメラレンズを被覆しているため、鏡面反射が抑止され、拡散反射成分だけが画像に残るようにしている。この例では、被写体は、マシン認識可能ターゲットがプリントされた帽子1112を着用し、頭のポーズをトラッキングするようにしている。カメラ1110は、被写体が回転している間静止したままになっている。唯一の照明は、カメラ付近の測定個所に置かれた光源1102、1104から得ている。漏れた光からの間接的反射を減らすため、黒のバックドロップ(背景幕)が使用されている。
カメラと光源のロケーションは分かっているので、面法線、放射照度 (irradiance)、視点方向、およびテクスチャ空間内の対応する座標は、各画像のピクセルごとに標準的光線トレーシング手法を使用して計算することができる。理想的なランベルト (Lambertian) 反射が観察されるとの想定の下では、ランベルト反射率は、テクスチャ空間内の特定のポイントについてこの情報から計算することができる。この計算は、1つの写真に含まれるピクセルごとに繰り返され、その総和が得られると、画像がテクスチャ空間内に投影され、光源に起因する計算された放射照度で除すると、面を横切る拡散反射率のマップが得られる。図12に示すように、2つの写真(A),(B)がテクスチャ空間内に投影され、照明が補正されている。実際には、この投影は、外側ループがテクスチャマップ内のすべてのピクセルを通るように繰り返される逆マッピング (reverse mapping) によって行われ、特定のテクスチャピクセルに投影される画像エリア全体の平均をとるために、確率的ス−パサンプリング (stochastic supersampling) が使用されている。
単一の写真からのアルベドマップは、面の一部だけをカバーしており、その結果は、グレージング (grazing) 角度が小さいとき最良になっている。従って、顔全体のシングルアルベドマップを作成するために、すべての個別マップの加重平均が計算されている。重み付け関数は、そのビジュアル例が図13(A),(B)に示されているが、面に対してほぼ法線をなしている方向から表示および/または照射されるピクセルには高い重みが与えられるように選択され、表示か照射のどちらかが極度にグレージングする前にゼロに降下するようになっている。図示の例では、次の関数が使用されている。(cosθi cosθe - c)p、ただし、c= 0.2, p = 4。
特定のテクスチャピクセルのアルベドを計算する前に、ピクセルが可視であり、適当に照射されていることが確かめられる。複数の光線は、そのピクセル上のポイントから光源上のポイントまでとカメラポイントまでトレースされ、そのピクセルには、可視性と照明がゼロでるか、部分的であるか、完全であるかのマークが付けられる。光源のサイズを見積もるとき、重大なエラーを避けるのが賢明である。完全に可視であり、少なくとも1つの光源によって完全に照射され、どの光源によっても部分的に照射されないピクセルのアルベドだけが計算される。このようにすると、部分的に隠されたピクセルおよび全影または半影領域にあるピクセルは使用されることがない。
これらの測定に意味をもたせるためには、若干の較正が必要である。カメラの転写曲線は、Debevec他著「写真からの高ダイナミックレンジ放射輝度マップの回復(Recovering high dynamic range radiance maps from photographs)」、Computer Graphics (SIGGRAPH '97 Proceedings), pp. 369-378, August 1997に記載されている方法を使用して較正されている。光/カメラシステムのフラットフィールド応答は、大きなホワイトカードの写真を使用して較正されている。レンズのフォーカルレングスとひずみは、Zhang著「カメラ較正のためのフレキシブルな新手法(A flexible new technique for camera calibration)」、TechnicalReport MSR-TR-98-71, Microsoft Research, 1998に記載されている手法を用いて較正されている。全体スケールファクタは、既知反射率の参照サンプルを使用してセットされている。光源強度の画像間の変化が考慮の対象となっているときは、すべての画像に参照サンプルを組み込むことによって制御が行われている。
上記プロセスから得られたテクスチャマップは、顔全体にわたる詳細なカラー変化を自動的に取り込む上で良好な働きをしている。さらに、較正帽子を定位置に保持するために使用されるストラップは可視になっている。これらの問題は、画像編集ツールを使用し、ブランクエリアに近傍テクスチャまたは均一カラーを埋め込むことによって解消されている。
図14(A),(B)と図15(A),(B)は、編集前のアルベドマップと編集後のアルベドマップを、比較目的で示したものである。アルベドマップから妥当な結果が得られない個所がどこであるかは、面が十分に観察されない個所(例えば、あごの下)であるか、あるいは面が余りに複雑な形状をしているため画像と共に正しくスキャンし、記録できない個所(例えば、耳)であることは明らかである。これらの個所は、どちらも、リアル感のある外観を得るためにアルベドマップからのテクスチャを必要としていない。第1の個所は視覚的に目立たないからであり、第2の個所は、ジオメトリがビジュアル的に詳細になっているからである。そのため、これらの個所を編集しても、最終的レンダリングの外観はほとんど影響されない。
図16〜図18は、付随するビデオからの静止フレームを使用した顔モデルのいくつかの、異なる様相を示す図である。1行目(図16の(A),(B),(C))には、いくつかの角度からの顔が示されている。そこには、アルベドマップと測定されたBRDFが、任意の角度から見た顔全体にわたる皮膚の外観とそのカラー変化をどのように取り込むかが示されている。2行目(図17の(A),(B),(C))は、グレージング角度での強い鏡面反射を含む、リムとサイドの照明の効果を示している。なお、光源は、この行の3画像のいずれも、同じ強度であり、顔から同じ距離に置かれている。反射率の方向変化は、親しみのある照明効果がレンダリングに現れることに貢献している。3行目(図18の(A),(B),(C))では、表情の変形が顔に加えられても、顔は通常の表情の動きでは自然のように見えることを示している。
図19は、ここで説明している実施形態に従ってアルベドマップを作成するための方法のステップを記載しているフローチャートである。この方法は、適切なハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせで実現することが可能である。ここで説明している実施形態では、この方法は、図11を参照して説明してきたシステムと同じシステムで使用されるものとして、ソフトウェアで実現されている。
ステップ1700で、被写体を照射するために使用できる1つまたは2つ以上の偏光光源が準備される。光源の例は上述した通りである。ここで説明している実施形態では、光源は、被写体の顔反射率の鏡面反射成分が抑止または除去されるように選択されている。ステップ1702で、被写体の顔は光源で照射される。ステップ1704で、被写体を回転させ、その間に一連のデジタル写真または画像が取り込まれる。ステップ1706で、テクスチャマップ内のピクセルごとに、面法線、放射照度、視点方向およびテクスチャ空間内の座標が計算される。この計算は公知のアルゴリズムを使用して行われる。ステップ1708で、画像のテクスチャ空間内の特定ピクセルに対するランベルト反射率が計算される。これにより、ピクセルのアルベドが得られる。ステップ1712で、追加のピクセルがアルベドマップに残っているかどうかが判断される。残っていれば、ステップ1712で次のピクセルが得られ、ステップ1708に戻る。追加のピクセルがアルベドマップに残っていなければ、ステップ1714で、追加のデジタル画像が残っているかどうかが確かめられる。追加のデジタル画像が残っていれば、ステップ1716で次のデジタル画像が得られ、ステップ1706に戻る。追加のデジタル画像が残っていなければ、ステップ1718で、各画像の個別アルベドマップの加重平均が計算され、顔全体のシングルアルベドマップが作成される。この加重平均処理がどのように行われるかの具体例は、Marschner著「コンピュータグラフィックスの逆レンダリング(Inverse Rendering for Computer Graphics)」、PhD thesis, Cornell University, August 1998に記載されている。
図20は、シングルピクセルのアルベドを計算する方法のステップを記載しているフローチャートである。この方法は、適切なハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせで実現することが可能である。ここで説明している実施形態では、この方法はソフトウェアで実現されている。ステップ1800で、あるピクセルが与えられているとき、そのピクセルが完全に可視であるかどうかが判断される。ピクセルが完全に可視でなければ、ピクセルのアルベドは計算されない(ステップ1804)。ピクセルが完全に可視であれば、ステップ1802で、ピクセルが少なくとも1つの光源で完全に照射されているかどうかが判断される。ピクセルが少なくとも1つの光源で完全に照射されていなければ、ピクセルのアルベドは計算されない(ステップ1804)。ピクセルが少なくとも1つの光源で完全に照射されていれば、ステップ1806で、ピクセルがいずれかの光源で部分的に照射されているかどうかが判断される。そうであれば、そのピクセルについては、アルベドは計算されない。ピクセルがいずれかの光源で部分的に照射されていなければ、ステップ1808で、そのピクセルのアルベドと重みが計算される。この重みは、あとで個別マップをまとめて、その平均をとるとき使用される。従って、上述したように、アルベドが計算されるのは、完全に可視であり、少なくとも1つの光源で完全に照射され、いずれかの光源で部分的に照射されていないピクセルについてだけである。このようにすると、部分的に隠されているピクセルと全影または半影領域にあるピクセルは使用されることがない。
以上、説明した顔の特徴をアニメーション化する方法および表情変換のための方法を実現するためのアプリケーションプログラムは当業者であれば、本明細書の説明に基づいて、当業者であれば作成することが可能であろう。
アプリケーションプログラムはCPUが実行可能な読取り実行可能な命令で作成すればよい。また、上記アプリケーションプログラムを記憶しておく記録媒体は、メモリ、ハードディスク、周知の携帯用記録媒体に記憶すればよく、これらの記録媒体は1つまたは2つ以上でもよい。たとえば、アプリケーションで使用するデータ、たとえば、コードブックやトレーニング表情を定義したデータ等はCDROMに記憶しておき、これらのデータを使用するアプリケーションプログラムはハードディスクに記憶しておくというように異なる記録媒体にアプリケーションプログラムとデータとを記憶させてもよい。また、同一の記録媒体に記録させてもよいこと勿論である。
さらにアプリケーションプログラムを実行するコンピュータは1台でもよいしアプリケーションプログラムで規定した処理を複数台のコンピュータで分散処理してもよい。
符合の説明
200 照明システム
202 カメラ
202a カメラのレンズ
204、206 光源
400 コードブック
402 トレーニング表情集合
406 変換プロセッサ
408 変換関数
410 合成表情集合
602 トランスミッタ(送信側)
604 レシーバ(受信側)
606 再構築モジュール

Claims (12)

  1. 顔の特徴をアニメーション化するシステムであって、
    (1)複数の異なる顔の幾何学的形状(geometry)を近似する細分面(a single subdivision surface)を定義する手段であって、前記細分面は変換関数からの変換された表情(facial expressions)を表す粗メッシュ構造によって定義され、前記変換関数は(a)前記複数の異なる顔とは別の顔の表情を元とするトレーニング表情集合(a training set of facial expressions)と(b)前記複数の異なる顔の中のそれぞれの顔の表情を元とする集合(a set of facial expressions)を含むコードブックとを含むデータから導かれ、前記トレーニング表情集合に属するそれぞれの表情は前記コードブックの中のどれか1つの表情に対応し、前記変換関数は更に前記訓練用集合と関連する変形を特徴付けるように構成されている、定義手段と、
    (2)前記細分面を前記コードブックの中の複数の顔のそれぞれに適合させる手段であって、(c)前記細分面の頂点位置に関して最適化動作を実行する手段と(d)前記細分面を定義する粗メッシュ構造の接続関係(connectivity)を変更せずに前記細分面を前記複数の異なる顔に適合させる手段とを含む、適合手段と、
    を含むことを特徴とするシステム。
  2. 請求項1に記載のシステムにおいて、前記粗メッシュ構造は三角メッシュによって構成されることを特徴とするシステム。
  3. 請求項1記載のシステムにおいて、前記適合手段は、前記細分面を定義する粗メッシュ構造と関連する平滑化汎関数(smoothing functional)を最小化する手段を含むことを特徴とするシステム。
  4. 請求項1記載のシステムにおいて、前記適合手段は、前記細分面を定義する粗メッシュ構造と関連する1又は複数の制約(constraints)を選択する手段と、前記1又は複数の制約を前記複数の異なる顔の上の対応する点に直接的に適合させる手段と、を含むことを特徴とするシステム。
  5. 請求項4記載のシステムにおいて、前記1又は複数の制約は目、鼻又は口の中の1つと関連することを特徴とするシステム。
  6. 請求項1記載のシステムにおいて、前記適合手段は、距離と平滑性と制約とのための項を含む汎関数を最小化する手段を含むことを特徴とするシステム。
  7. 請求項1記載のシステムにおいて、前記適合手段は、一連の線形最小自乗問題を解く手段を含むことを特徴とするシステム。
  8. 顔の特徴を表示してアニメーション化する方法であって、
    (1)複数の異なる顔の幾何学的形状を近似する細分面を定義するステップであって、前記細分面は変換関数からの変換された表情を表す粗メッシュ構造によって定義され、前記変換関数は(a)前記複数の異なる顔とは別の顔の表情を元とするトレーニング表情集合と(b)前記複数の異なる顔の中のそれぞれの顔の表情を元とする集合を含むコードブックとを含むデータから導かれ、前記トレーニング表情集合に属するそれぞれの表情は前記コードブックの中のどれか1つの表情に対応し、前記変換関数は更に前記トレーニング表情集合と関連する変形を特徴付けるように構成されている、ステップと、
    (2)前記細分面を前記コードブックの中の複数の顔のそれぞれに適合させて前記複数の異なる顔の間の対応関係を確立するステップであって、前記適合は(c)前記細分面の頂点位置に関する最適化動作の実行と(d)細分面を定義するベース・メッシュの前記ベース・メッシュの接続関係を変更しない操作とを含む、ステップと、
    (3)前記複数の異なる顔の間の対応関係を用いて或る顔の表情を別の顔の表情に変換するステップと、
    (4)前記顔の特徴を表示するステップと、
    を含むことを特徴とする方法。
  9. 顔の特徴を表示してアニメーション化する方法であって、
    (1)複数の異なる顔に対する3次元データを測定して対応する顔モデルを提供するステップと、
    (2)それぞれの対応する顔モデルにマップするのに用いられる汎用顔モデル(generic face model)をただ1つ定義するステップであって、前記汎用顔モデルは変換関数からの変換された表情を表す粗メッシュ構造によって定義され、前記変換関数は(a)前記複数の異なる顔とは別の顔の表情を元とするトレーニング表情集合と(b)前記複数の異なる顔の中のそれぞれの顔の表情を元とする集合を含むコードブックとを含むデータから導かれ、前記トレーニング表情集合に属するそれぞれの表情は前記コードブックの中のどれか1つの表情に対応し、前記変換関数は更に前記トレーニング表情集合と関連する変形を特徴付けるように構成されている、ステップと、
    (3)前記対応する顔モデルのそれぞれにおける対応する点に直接にマップされる前記汎用顔モデルの上の複数の点を選択するステップと、
    (4)前記汎用顔モデルを前記コードブックの中の前記対応する顔モデルのそれぞれに適合させるステップであって、(c)前記選択されたそれぞれの点を前記対応する顔モデルのそれぞれにおける前記対応する点に直接にマップするステップと、(d)細分面の頂点位置に関する最適化動作を実行するステップと、(e)細分面を定義するベース・メッシュを前記ベース・メッシュの接続関係を変更しないで操作するステップとを含む、ステップと、
    (5)前記顔の特徴を表示するステップと、
    を含むことを特徴とする方法。
  10. 請求項9記載の方法において、
    前記定義するステップは、複数の頂点を含み前記顔モデルの幾何学的形状を近似する細分面をベース・メッシュ構造から定義するステップを含み、
    前記適合させるステップは、前記細分面の頂点の位置だけを操作するステップを含むことを特徴とする方法。
  11. 請求項9記載の方法において、前記適合させるステップは、細分面を定義するベース・メッシュを操作するステップを含むことを特徴とする方法。
  12. 請求項9記載の方法において、前記測定するステップは、レーザ・レンジ・スキャンを用いて前記3次元データを測定するステップを含むことを特徴とする方法。
JP2011029319A 2000-08-30 2011-02-15 顔の特徴をアニメーション化する方法およびシステムならびに表情変換のための方法およびシステム Expired - Lifetime JP4865093B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/651880 2000-08-30
US09/651,880 US6950104B1 (en) 2000-08-30 2000-08-30 Methods and systems for animating facial features, and methods and systems for expression transformation

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001261558A Division JP4733318B2 (ja) 2000-08-30 2001-08-30 顔の特徴をアニメーション化する方法およびシステムならびに表情変換のための方法およびシステム

Publications (2)

Publication Number Publication Date
JP2011100497A JP2011100497A (ja) 2011-05-19
JP4865093B2 true JP4865093B2 (ja) 2012-02-01

Family

ID=24614598

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001261558A Expired - Lifetime JP4733318B2 (ja) 2000-08-30 2001-08-30 顔の特徴をアニメーション化する方法およびシステムならびに表情変換のための方法およびシステム
JP2011029319A Expired - Lifetime JP4865093B2 (ja) 2000-08-30 2011-02-15 顔の特徴をアニメーション化する方法およびシステムならびに表情変換のための方法およびシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001261558A Expired - Lifetime JP4733318B2 (ja) 2000-08-30 2001-08-30 顔の特徴をアニメーション化する方法およびシステムならびに表情変換のための方法およびシステム

Country Status (2)

Country Link
US (4) US6950104B1 (ja)
JP (2) JP4733318B2 (ja)

Families Citing this family (137)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8725493B2 (en) * 2004-01-06 2014-05-13 Neuric Llc Natural language parsing method to provide conceptual flow
US7925492B2 (en) 2004-01-06 2011-04-12 Neuric Technologies, L.L.C. Method for determining relationships through use of an ordered list between processing nodes in an emulated human brain
US20070156625A1 (en) * 2004-01-06 2007-07-05 Neuric Technologies, Llc Method for movie animation
US7089218B1 (en) * 2004-01-06 2006-08-08 Neuric Technologies, Llc Method for inclusion of psychological temperament in an electronic emulation of the human brain
FR2810770B1 (fr) * 2000-06-23 2003-01-03 France Telecom Raffinement d'un maillage triangulaire representatif d'un objet en trois dimensions
EP1358633A2 (en) * 2001-02-01 2003-11-05 Mental Images GmbH & Co. KG. Generating smooth feature lines for subdivision surfaces
US9400921B2 (en) * 2001-05-09 2016-07-26 Intel Corporation Method and system using a data-driven model for monocular face tracking
US20030067538A1 (en) * 2001-10-04 2003-04-10 Myers Kenneth J. System and method for three-dimensional data acquisition
JP3911527B2 (ja) * 2002-01-17 2007-05-09 富士通株式会社 携帯端末、携帯端末処理用プログラム及び携帯端末システム
US8013852B2 (en) 2002-08-02 2011-09-06 Honda Giken Kogyo Kabushiki Kaisha Anthropometry-based skeleton fitting
US7218320B2 (en) * 2003-03-13 2007-05-15 Sony Corporation System and method for capturing facial and body motion
US8106911B2 (en) * 2003-03-13 2012-01-31 Sony Corporation Mobile motion capture cameras
US7333113B2 (en) 2003-03-13 2008-02-19 Sony Corporation Mobile motion capture cameras
US7573480B2 (en) * 2003-05-01 2009-08-11 Sony Corporation System and method for capturing facial and body motion
US7358972B2 (en) * 2003-05-01 2008-04-15 Sony Corporation System and method for capturing facial and body motion
US7218774B2 (en) * 2003-08-08 2007-05-15 Microsoft Corp. System and method for modeling three dimensional objects from a single image
US7285047B2 (en) * 2003-10-17 2007-10-23 Hewlett-Packard Development Company, L.P. Method and system for real-time rendering within a gaming environment
JP4721052B2 (ja) * 2004-01-13 2011-07-13 日本電気株式会社 特徴変化画像作成方法、特徴変化画像作成装置および特徴変化画像作成プログラム
JP2005225025A (ja) * 2004-02-12 2005-08-25 Konica Minolta Holdings Inc 顔画像処理システム
US9826537B2 (en) 2004-04-02 2017-11-21 Rearden, Llc System and method for managing inter-cluster handoff of clients which traverse multiple DIDO clusters
US8654815B1 (en) 2004-04-02 2014-02-18 Rearden, Llc System and method for distributed antenna wireless communications
US10277290B2 (en) 2004-04-02 2019-04-30 Rearden, Llc Systems and methods to exploit areas of coherence in wireless systems
US9819403B2 (en) 2004-04-02 2017-11-14 Rearden, Llc System and method for managing handoff of a client between different distributed-input-distributed-output (DIDO) networks based on detected velocity of the client
US10425134B2 (en) 2004-04-02 2019-09-24 Rearden, Llc System and methods for planned evolution and obsolescence of multiuser spectrum
US20060055706A1 (en) * 2004-09-15 2006-03-16 Perlman Stephen G Apparatus and method for capturing the motion of a performer
US7561312B1 (en) * 2004-10-04 2009-07-14 Google Inc. Systems and methods for glare removal using polarized filtering in document scanning
US8473449B2 (en) * 2005-01-06 2013-06-25 Neuric Technologies, Llc Process of dialogue and discussion
US7633521B2 (en) * 2005-02-25 2009-12-15 Onlive, Inc. Apparatus and method improving marker identification within a motion capture system
US7605861B2 (en) * 2005-03-10 2009-10-20 Onlive, Inc. Apparatus and method for performing motion capture using shutter synchronization
NZ561570A (en) 2005-03-16 2010-02-26 Lucasfilm Entertainment Compan Three-dimensional motion capture
US8963926B2 (en) * 2006-07-11 2015-02-24 Pandoodle Corporation User customized animated video and method for making the same
US8077179B2 (en) * 2005-07-11 2011-12-13 Pandoodle Corp. System and method for creating animated video with personalized elements
US20070065000A1 (en) * 2005-09-21 2007-03-22 Joonpyo Hong Apparatus and method for producing character sculpture
US8659668B2 (en) 2005-10-07 2014-02-25 Rearden, Llc Apparatus and method for performing motion capture using a random pattern on capture surfaces
EP1964069A2 (en) * 2005-12-16 2008-09-03 Philips Intellectual Property & Standards GmbH Surface tesselation of shape models
US7764283B2 (en) * 2005-12-23 2010-07-27 Sony Corporation Eye movement data replacement in motion capture
US7567251B2 (en) * 2006-01-10 2009-07-28 Sony Corporation Techniques for creating facial animation using a face mesh
US7936927B2 (en) * 2006-01-27 2011-05-03 Auryn Inc. Constraint-based ordering for temporal coherence of stroke-based animation
WO2007092795A2 (en) * 2006-02-02 2007-08-16 Neuric Technologies, Llc Method for movie animation
US7548272B2 (en) * 2006-06-07 2009-06-16 Onlive, Inc. System and method for performing motion capture using phosphor application techniques
US7567293B2 (en) * 2006-06-07 2009-07-28 Onlive, Inc. System and method for performing motion capture by strobing a fluorescent lamp
US7667767B2 (en) * 2006-06-07 2010-02-23 Onlive, Inc. System and method for three dimensional capture of stop-motion animated characters
US8330823B2 (en) * 2006-11-01 2012-12-11 Sony Corporation Capturing surface in motion picture
KR100900823B1 (ko) 2006-12-02 2009-06-04 한국전자통신연구원 캐릭터 애니메이션 시 피부의 주름 실시간 표현 방법 및장치
US8542236B2 (en) * 2007-01-16 2013-09-24 Lucasfilm Entertainment Company Ltd. Generating animation libraries
US8130225B2 (en) 2007-01-16 2012-03-06 Lucasfilm Entertainment Company Ltd. Using animation libraries for object identification
US8199152B2 (en) * 2007-01-16 2012-06-12 Lucasfilm Entertainment Company Ltd. Combining multiple session content for animation libraries
US8035643B2 (en) * 2007-03-19 2011-10-11 Lucasfilm Entertainment Company Ltd. Animation retargeting
US7952590B2 (en) * 2007-04-13 2011-05-31 Lucasfilm Entertainment Company Ltd. Texturing a translucent surface
US9342912B1 (en) * 2007-06-06 2016-05-17 Lucasfilm Entertainment Company Ltd. Animation control retargeting
KR100856824B1 (ko) * 2007-07-23 2008-09-05 재단법인서울대학교산학협력재단 캐릭터 시뮬레이션 방법 및 시스템
JP4572220B2 (ja) * 2007-07-31 2010-11-04 株式会社コナミデジタルエンタテインメント 画像表示装置、画像表示方法、ならびに、プログラム
CN101883520B (zh) * 2007-08-22 2013-02-06 皇家飞利浦电子股份有限公司 用于表面的光学表征的方法和设备
EP2191445B1 (en) * 2007-09-04 2017-05-31 Sony Corporation Integrated motion capture
US20090103783A1 (en) * 2007-10-19 2009-04-23 Artec Ventures System and Method for Biometric Behavior Context-Based Human Recognition
US8144153B1 (en) 2007-11-20 2012-03-27 Lucasfilm Entertainment Company Ltd. Model production for animation libraries
KR100914847B1 (ko) * 2007-12-15 2009-09-02 한국전자통신연구원 다시점 영상정보를 이용한 삼차원 얼굴 모델 생성방법 및장치
KR100896065B1 (ko) * 2007-12-17 2009-05-07 한국전자통신연구원 3차원 얼굴 표정 애니메이션 생성 방법
EP2257864A1 (en) * 2008-01-28 2010-12-08 Anoto AB Digital pens and a method for digital recording of information
WO2010004466A1 (en) * 2008-07-10 2010-01-14 C-True Ltd. Three dimensional mesh modeling
CA2745094A1 (en) * 2008-12-04 2010-07-01 Total Immersion Software, Inc. Systems and methods for dynamically injecting expression information into an animated facial mesh
US9142024B2 (en) * 2008-12-31 2015-09-22 Lucasfilm Entertainment Company Ltd. Visual and physical motion sensing for three-dimensional motion capture
US8493286B1 (en) 2009-04-21 2013-07-23 Mark T. Agrama Facial movement measurement and stimulation apparatus and method
CN101872488B (zh) * 2009-04-27 2012-05-16 鸿富锦精密工业(深圳)有限公司 曲面渲染系统及方法
KR20100138648A (ko) * 2009-06-25 2010-12-31 삼성전자주식회사 영상 처리 장치 및 방법
US8194149B2 (en) * 2009-06-30 2012-06-05 Cisco Technology, Inc. Infrared-aided depth estimation
US20110025685A1 (en) * 2009-07-29 2011-02-03 Doug Epps Combined geometric and shape from shading capture
US9595108B2 (en) 2009-08-04 2017-03-14 Eyecue Vision Technologies Ltd. System and method for object extraction
CN102713931A (zh) * 2009-08-04 2012-10-03 艾修视力科技有限公司 用于对象提取的系统和方法
US20110102449A1 (en) * 2009-11-02 2011-05-05 Konami Digital Entertainment Co., Ltd. Image Display Device, Image Display Method and Computer-Readable Information Recording Medium
US8614714B1 (en) 2009-12-21 2013-12-24 Lucasfilm Entertainment Company Ltd. Combining shapes for animation
CN101833791B (zh) * 2010-05-11 2012-04-18 成都索贝数码科技股份有限公司 一种单摄像机下的场景建模方法及系统
KR20120005587A (ko) * 2010-07-09 2012-01-17 삼성전자주식회사 컴퓨터 시스템에서 얼굴 애니메이션 생성 방법 및 장치
EP2630635B1 (en) * 2010-10-21 2021-04-21 Samsung Electronics Co., Ltd. Method and apparatus for recognizing an emotion of an individual based on facial action units
US8629875B2 (en) * 2010-11-09 2014-01-14 Qualcomm Incorporated Constraint systems and methods for manipulating non-hierarchical objects
US9082222B2 (en) * 2011-01-18 2015-07-14 Disney Enterprises, Inc. Physical face cloning
KR101261737B1 (ko) 2011-06-13 2013-05-09 한국과학기술원 얼굴 애니메이션 리타게팅 방법 및 이를 위한 기록 매체
US8948447B2 (en) 2011-07-12 2015-02-03 Lucasfilm Entertainment Companyy, Ltd. Scale independent tracking pattern
KR20130028370A (ko) * 2011-09-09 2013-03-19 삼성전자주식회사 영상 모델링 시스템에서 형상 정보, 재질 정보 및 조명 정보를 획득하는 장치 및 방법
WO2013074926A1 (en) 2011-11-18 2013-05-23 Lucasfilm Entertainment Company Ltd. Path and speed based character control
US20130218525A1 (en) * 2012-02-16 2013-08-22 IntegrityWare, Inc. Methods and Systems for Generating and Editing Surfaces
KR102094723B1 (ko) * 2012-07-17 2020-04-14 삼성전자주식회사 견고한 얼굴 표정 인식을 위한 특징 기술자
US9531961B2 (en) 2015-05-01 2016-12-27 Duelight Llc Systems and methods for generating a digital image using separate color and intensity data
US9918017B2 (en) 2012-09-04 2018-03-13 Duelight Llc Image sensor apparatus and method for obtaining multiple exposures with zero interframe time
US9898848B2 (en) * 2012-10-05 2018-02-20 Max-Planck-Gesellschaft Zur Foerderung Der Wissenschaften E. V. Co-registration—simultaneous alignment and modeling of articulated 3D shapes
US11189917B2 (en) 2014-04-16 2021-11-30 Rearden, Llc Systems and methods for distributing radioheads
US10558848B2 (en) 2017-10-05 2020-02-11 Duelight Llc System, method, and computer program for capturing an image with correct skin tone exposure
US9807322B2 (en) 2013-03-15 2017-10-31 Duelight Llc Systems and methods for a digital image sensor
US9819849B1 (en) 2016-07-01 2017-11-14 Duelight Llc Systems and methods for capturing digital images
US9973246B2 (en) 2013-03-12 2018-05-15 Rearden, Llc Systems and methods for exploiting inter-cell multiplexing gain in wireless cellular systems via distributed input distributed output technology
US10488535B2 (en) 2013-03-12 2019-11-26 Rearden, Llc Apparatus and method for capturing still images and video using diffraction coded imaging techniques
US9923657B2 (en) 2013-03-12 2018-03-20 Rearden, Llc Systems and methods for exploiting inter-cell multiplexing gain in wireless cellular systems via distributed input distributed output technology
RU2767777C2 (ru) 2013-03-15 2022-03-21 Риарден, Ллк Системы и способы радиочастотной калибровки с использованием принципа взаимности каналов в беспроводной связи с распределенным входом - распределенным выходом
US10134167B2 (en) 2013-03-15 2018-11-20 Dreamworks Animation Llc Using curves to emulate soft body deformation
US9514381B1 (en) 2013-03-15 2016-12-06 Pandoodle Corporation Method of identifying and replacing an object or area in a digital image with another object or area
US9418434B2 (en) * 2013-04-03 2016-08-16 Mitsubishi Electric Research Laboratories, Inc. Method for detecting 3D geometric boundaries in images of scenes subject to varying lighting
CN103198508A (zh) * 2013-04-07 2013-07-10 河北工业大学 人脸表情动画生成方法
EP3004924B1 (en) * 2013-06-06 2021-10-06 Heptagon Micro Optics Pte. Ltd. Sensor system with active illumination
CN106133796B (zh) 2014-03-25 2019-07-16 苹果公司 用于在真实环境的视图中表示虚拟对象的方法和系统
JP6346525B2 (ja) * 2014-08-29 2018-06-20 アルプス電気株式会社 視線検出装置
US10924688B2 (en) 2014-11-06 2021-02-16 Duelight Llc Image sensor apparatus and method for obtaining low-noise, high-speed captures of a photographic scene
US11463630B2 (en) 2014-11-07 2022-10-04 Duelight Llc Systems and methods for generating a high-dynamic range (HDR) pixel stream
EP3032241B1 (en) * 2014-12-11 2023-03-01 X-Rite Europe GmbH Method and apparatus for digitizing the appearance of a real material
US9958383B2 (en) * 2014-12-18 2018-05-01 Microsoft Technology Licensing, Llc. Range camera
WO2016132113A1 (en) * 2015-02-16 2016-08-25 University Of Surrey Three dimensional modelling
US9576190B2 (en) * 2015-03-18 2017-02-21 Snap Inc. Emotion recognition in video conferencing
US9864922B2 (en) * 2015-09-10 2018-01-09 Adobe Systems Inc. Content aware pattern stamp tool
CN106097373B (zh) * 2016-06-24 2018-11-02 聊城大学 一种基于分部式稀疏成分分析模型的笑脸合成方法
US9947099B2 (en) * 2016-07-27 2018-04-17 Microsoft Technology Licensing, Llc Reflectivity map estimate from dot based structured light systems
US10573065B2 (en) 2016-07-29 2020-02-25 Activision Publishing, Inc. Systems and methods for automating the personalization of blendshape rigs based on performance capture data
US10270958B2 (en) 2016-09-01 2019-04-23 Duelight Llc Systems and methods for adjusting focus based on focus target information
WO2018102700A1 (en) * 2016-12-01 2018-06-07 Pinscreen, Inc. Photorealistic facial texture inference using deep neural networks
US10055880B2 (en) * 2016-12-06 2018-08-21 Activision Publishing, Inc. Methods and systems to modify a two dimensional facial image to increase dimensional depth and generate a facial image that appears three dimensional
US10504273B2 (en) * 2016-12-09 2019-12-10 Nvidia Corporation Automatic level-of-detail for physically-based materials
KR102387570B1 (ko) 2016-12-16 2022-04-18 삼성전자주식회사 표정 생성 방법, 표정 생성 장치 및 표정 생성을 위한 학습 방법
US10636175B2 (en) * 2016-12-22 2020-04-28 Facebook, Inc. Dynamic mask application
TWI621832B (zh) * 2017-02-10 2018-04-21 緯創資通股份有限公司 物體偵測系統以及方法
WO2019023397A1 (en) * 2017-07-28 2019-01-31 Baobab Studios Inc. SYSTEMS AND METHODS FOR ANIMATIONS AND INTERACTIVITY OF REAL-TIME COMPLEX CHARACTERS
US10785422B2 (en) 2018-05-29 2020-09-22 Microsoft Technology Licensing, Llc Face recognition using depth and multi-spectral camera
RU2697627C1 (ru) 2018-08-01 2019-08-15 Самсунг Электроникс Ко., Лтд. Способ корректировки освещенности объекта на изображении в последовательности изображений и вычислительное устройство пользователя, реализующее упомянутый способ
US11245875B2 (en) 2019-01-15 2022-02-08 Microsoft Technology Licensing, Llc Monitoring activity with depth and multi-spectral camera
RU2720361C1 (ru) * 2019-08-16 2020-04-29 Самсунг Электроникс Ко., Лтд. Обучение по нескольким кадрам реалистичных нейронных моделей голов говорящих персон
US11568645B2 (en) 2019-03-21 2023-01-31 Samsung Electronics Co., Ltd. Electronic device and controlling method thereof
US11182595B2 (en) * 2019-08-08 2021-11-23 Avaya Inc. Optimizing interaction results using AI-guided manipulated video
US20210407527A1 (en) * 2019-08-08 2021-12-30 Avaya Inc. Optimizing interaction results using ai-guided manipulated video
CN110517339B (zh) 2019-08-30 2021-05-25 腾讯科技(深圳)有限公司 一种基于人工智能的动画形象驱动方法和装置
KR102111499B1 (ko) * 2019-09-19 2020-05-18 (주)자이언트스텝 얼굴 애니메이션을 위한 얼굴 형태 변화 전사 방법 및 컴퓨터 판독 가능한 저장매체
WO2021096192A1 (en) * 2019-11-12 2021-05-20 Samsung Electronics Co., Ltd. Neural facial expressions and head poses reenactment with latent pose descriptors
US11010951B1 (en) * 2020-01-09 2021-05-18 Facebook Technologies, Llc Explicit eye model for avatar
US11585654B2 (en) * 2020-06-02 2023-02-21 Micron Technology, Inc. Texture detection apparatuses, systems, and methods for analysis
US11450077B2 (en) * 2020-11-20 2022-09-20 Nvidia Corporation Appearance-driven automatic three-dimensional modeling
US20230107571A1 (en) * 2021-10-01 2023-04-06 Liberty Reach Inc. Machine Vision-Based Method and System for Locating Objects within a Scene Containing the Objects
CN112862968B (zh) * 2021-03-15 2024-01-19 网易(杭州)网络有限公司 目标植被模型的渲染显示方法、装置、设备及存储介质
US11694385B2 (en) * 2021-06-08 2023-07-04 Sony Group Corporation 3D microgeometry and reflectance modeling
CN113470182B (zh) * 2021-09-03 2022-02-18 中科计算技术创新研究院 人脸几何特征编辑方法及深度人脸重塑编辑方法
WO2024010484A1 (en) * 2022-07-07 2024-01-11 Nvidia Corporation Audio-driven facial animation with emotion support using machine learning
CN116310659B (zh) * 2023-05-17 2023-08-08 中数元宇数字科技(上海)有限公司 训练数据集的生成方法及设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2802725B2 (ja) * 1994-09-21 1998-09-24 株式会社エイ・ティ・アール通信システム研究所 表情再現装置および表情再現に用いられるマトリックスの算出方法
EP0972285A4 (en) * 1995-10-08 2002-04-03 Face Imaging Ltd METHOD FOR AUTOMATIC COMPUTER ASSISTED AUDIOVISUAL COPYING FILMS
JPH09135447A (ja) * 1995-11-07 1997-05-20 Tsushin Hoso Kiko 知的符号化/復号方法、特徴点表示方法およびインタラクティブ知的符号化支援装置
JP2918499B2 (ja) * 1996-09-17 1999-07-12 株式会社エイ・ティ・アール人間情報通信研究所 顔画像情報変換方法および顔画像情報変換装置
JP3017110B2 (ja) * 1996-10-16 2000-03-06 株式会社エイ・ティ・アール人間情報通信研究所 イメージ生成装置およびイメージ生成方法
US6044168A (en) * 1996-11-25 2000-03-28 Texas Instruments Incorporated Model based faced coding and decoding using feature detection and eigenface coding
JPH10240908A (ja) * 1997-02-27 1998-09-11 Hitachi Ltd 映像合成方法
CA2227361A1 (en) * 1998-01-19 1999-07-19 Taarna Studios Inc. Method and apparatus for providing real-time animation utilizing a database of expressions
JP2986441B2 (ja) * 1998-01-27 1999-12-06 株式会社エイ・ティ・アール人間情報通信研究所 任意表情を持つ3次元顔モデルの生成方法
JPH11219422A (ja) * 1998-02-02 1999-08-10 Hitachi Ltd 顔による個人同定通信方法
JP2974655B1 (ja) * 1998-03-16 1999-11-10 株式会社エイ・ティ・アール人間情報通信研究所 アニメーションシステム
US6351269B1 (en) * 1998-04-17 2002-02-26 Adobe Systems Incorporated Multiple image morphing
JPH11326057A (ja) * 1998-05-20 1999-11-26 Kao Corp 三次元物体の計測方法及び装置
JP2000090233A (ja) * 1998-09-08 2000-03-31 Olympus Optical Co Ltd 画像処理装置
GB2342026B (en) * 1998-09-22 2003-06-11 Luvvy Ltd Graphics and image processing system
US6807290B2 (en) * 2000-03-09 2004-10-19 Microsoft Corporation Rapid computer modeling of faces for animation
US6664956B1 (en) * 2000-10-12 2003-12-16 Momentum Bilgisayar, Yazilim, Danismanlik, Ticaret A. S. Method for generating a personalized 3-D face model

Also Published As

Publication number Publication date
JP2002123837A (ja) 2002-04-26
US20060192785A1 (en) 2006-08-31
JP4733318B2 (ja) 2011-07-27
US20050062743A1 (en) 2005-03-24
JP2011100497A (ja) 2011-05-19
US7098920B2 (en) 2006-08-29
US20040263510A1 (en) 2004-12-30
US7450126B2 (en) 2008-11-11
US7129949B2 (en) 2006-10-31
US6950104B1 (en) 2005-09-27

Similar Documents

Publication Publication Date Title
JP4865093B2 (ja) 顔の特徴をアニメーション化する方法およびシステムならびに表情変換のための方法およびシステム
JP4932951B2 (ja) 顔画像処理方法およびシステム
Marschner et al. Modeling and rendering for realistic facial animation
US11694392B2 (en) Environment synthesis for lighting an object
US7200281B2 (en) System and method for image-based surface detail transfer
JP6246757B2 (ja) 現実環境の視野におけるバーチャルオブジェクトを表現方法及びシステム
Seitz et al. Plenoptic image editing
Pighin et al. Modeling and animating realistic faces from images
CN108447017A (zh) 人脸虚拟整容方法和装置
Wu et al. Interactive normal reconstruction from a single image
JP2018195996A (ja) 画像投影装置、画像投影方法、及び、画像投影プログラム
Tarini et al. Texturing faces
Hülsken et al. Modeling and animating virtual humans for real-time applications
Neumann et al. Constructing a realistic head animation mesh for a specific person
Zhang An efficient texture generation technique for human head cloning and morphing
Karunaratne et al. A new efficient expression generation and automatic cloning method for multimedia actors
Ahmed High quality dynamic reflectance and surface reconstruction from video
JP2021068271A (ja) 画像処理システム、画像処理方法及びプログラム
Sousa et al. An Advanced Color Representation for Lossy
Duce et al. A Formal Specification of a Graphics System in the
ed eric Pighin Modeling and Animating Realistic Faces from Images

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110303

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111109

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141118

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4865093

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term