JP7846580B2 - 感情判定装置およびモデル学習装置、ならびに、それらのプログラム - Google Patents
感情判定装置およびモデル学習装置、ならびに、それらのプログラムInfo
- Publication number
- JP7846580B2 JP7846580B2 JP2022115233A JP2022115233A JP7846580B2 JP 7846580 B2 JP7846580 B2 JP 7846580B2 JP 2022115233 A JP2022115233 A JP 2022115233A JP 2022115233 A JP2022115233 A JP 2022115233A JP 7846580 B2 JP7846580 B2 JP 7846580B2
- Authority
- JP
- Japan
- Prior art keywords
- facial
- model
- face image
- emotion
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Image Analysis (AREA)
Description
また、近年では視覚障害者を含めたすべての人がより高い臨場感で視聴可能な映像メディアの実現を目指す技術の研究開発が進められている。例えば、競技映像から「得点」などの試合イベントをリアルタイムに取得し、その試合イベントに応じた触覚振動を触覚提示デバイスに提示することで、視聴者により高い臨場感を提供することができる。
また、放送コンテンツにおけるコンテンツ内の登場人物の感情を提示することも視聴者に高い臨場感を提供することに繋がる。
また、放送映像では人物が正面を向いているとは限らない。そこで、顔の傾き、障害物(例えば、手で顔を覆っている、眼鏡をかけている)などの難条件を含んだ顔画像から、アテンションネットワークを用いて顔の表情を判定する手法が開示されている(非特許文献2参照)。
また、非特許文献2に記載の手法では、画像に映っている顔の領域のみを考慮し、画像には映っていない顔の情報を考慮せずに感情の判定を行うため、さらなる推定精度の向上が望まれていた。
そして、感情判定装置は、顔画像特徴抽出手段によって、予め学習された顔画像特徴抽出モデルを用いて、入力された顔画像から顔の特徴量である顔画像特徴ベクトルを抽出する。
そして、感情判定装置は、判定手段によって、予め学習された感情判定モデルを用いて、特徴ベクトルから予め定めた感情のラベルを判定する。
なお、感情判定装置は、コンピュータを、前記した各手段として機能させるためのプログラムで動作させることができる。
そして、モデル学習装置は、3次元顔特徴点抽出手段によって、予め学習された3次元顔特徴点抽出モデルを用いて、学習用の顔画像から顔の3次元の特徴点の位置を抽出する。
そして、モデル学習装置は、顔画像特徴抽出手段によって、顔画像特徴抽出モデルを用いて、学習用の顔画像から顔の特徴量である顔画像特徴ベクトルを抽出する。
そして、モデル学習装置は、感情判定モデル学習手段によって、特徴ベクトルを入力し、学習用の顔画像に対応する正解の感情ラベルを出力するように、感情判定モデルを学習する。これによって、感情判定モデル学習手段は、顔画像の特徴以外に、顔の3次元の特徴点の位置を補助情報として感情判定モデルを学習することになる。
なお、モデル学習装置は、コンピュータを、前記した各手段として機能させるためのプログラムで動作させることができる。
また、本発明によれば、2次元の画像には映っていない3次元の顔特徴点を補助情報として利用することで、画像に映った人物の感情を精度よく判定するモデルを学習することができる。
≪感情判定装置の構成≫
まず、図1を参照して、本発明の第1実施形態に係る感情判定装置1の構成について説明する。
感情判定装置1は、顔画像から、顔画像に映った人物の感情を判定するものである。
図1に示すように、感情判定装置1は、記憶部10と、制御部20と、を備える。
記憶部10は、3次元顔特徴点抽出モデル記憶手段11と、顔画像特徴抽出モデル記憶手段12と、感情判定モデル記憶手段13と、を備える。なお、各記憶手段は、同じ記憶媒体内に領域を区分して記憶される構成であってもよいし、異なる記憶媒体に記憶される構成であってもよい。
すなわち、感情判定装置1は、3次元顔特徴点抽出モデルM1を用いて、顔画像Fから3次元顔特徴点を抽出する。また、感情判定装置1は、顔画像特徴抽出モデルM2を用いて、顔画像Fから顔画像特徴を抽出する。そして、感情判定装置1は、感情判定モデルM3を用いて、3次元顔特徴点と顔画像特徴とから、感情ラベルLを判定する。
感情ラベルLは、感情判定モデルM3の出力層から出力されるベクトルの各成分に対応し、予め「楽しい」、「怒り」、「悲しい」、「驚き」等の感情が対応付けられている。
図1に戻って、記憶部10に記憶されている各モデルについて具体的に説明する。
例えば、3次元顔特徴点抽出モデルM1は、顔画像から68個の3次元のキーポイントを推定する「FaceAlignment(以下、参考文献1)」や、顔画像から468個の3次元の顔のランドマークを推定する「Face Mesh(以下、参考文献2)」等の既存の学習済のモデルを用いることができる。
(参考文献2)「MediaPipe Face Mesh」、「URL:https://google.github.io/mediapipe/solutions/face_mesh」
ここでは、3次元顔特徴点抽出モデルM1は、図3に示すように、顔画像Fを入力し、(X,Y,Z)の3次元座標で表される3次元顔特徴点C3Dを出力するモデルである。なお、(X,Y,Z)の1つの座標が、顔の特徴点の1つ分に相当する。
この3次元顔特徴点抽出モデルM1によって、顔が横を向いている場合、障害物で顔の一部が隠されている場合等、2次元の画像では顔の一部が見えていない場合でも、予め3次元空間の位置として顔の3次元の特徴点の位置が学習されているため、顔画像から、顔の3次元の特徴点の位置を推定することができる。
例えば、顔画像特徴抽出モデルM2は、畳み込みニューラルネットワーク(CNN:Convolution Neural Network)、Vision Transformer等、一般的な画像認識用のモデルを使用することができる。なお、顔画像特徴抽出モデルM2は、ニューラルネットワークに限定されず、一般的な教師あり機械学習のモデルであってもよい。
なお、顔画像特徴抽出モデルM2の学習は、後記するモデル学習装置2(図9参照)で行うことができる。この学習手法については、モデル学習装置2の説明において行うこととする。
例えば、感情判定モデルM3は、順伝播ニューラルネットワーク(FFNN:Feed Forward Neural Network)を用いることができる。なお、感情判定モデルM3は、ニューラルネットワークに限定されず、一般的な教師あり機械学習のモデルであってもよい。例えば、サポートベクタマシン(SVM:Support Vector Machine)、条件付き確率場(CRF:Conditional Random Fields)等であってもよい。
感情判定モデルM3は、判定結果として、予め定めた感情ラベルごとに、0から1の範囲の確率値を出力する。すなわち、確率値が最大の感情ラベルが、判定結果の感情を示すラベルとなる。
3次元顔特徴点ベクトルV3Dは、図3で説明した3次元顔特徴点抽出モデルM1が出力する3次元顔特徴点C3Dを正規化し、1次元化したベクトルである。例えば、3次元顔特徴点ベクトルV3Dは、3次元顔特徴点C3Dの各座標値を、最大値が“1”、最小値が“0”となるように、すべての座標値を0~1の範囲の値に正規化(Min-Max法)した1次元のベクトルである。
なお、感情判定モデルM3の学習は、後記するモデル学習装置2(図9参照)で行うことができる。この学習手法については、モデル学習装置2の説明において行うこととする。
図7に示すように、感情判定モデルM3に入力される特徴ベクトルVFには、2次元の顔画像から抽出される顔画像特徴ベクトルV2Dに、3次元顔特徴点ベクトルV3Dとして、顔の3次元の特徴点の位置が補助情報として付加されることになる。
これによって、判定結果となる感情ラベルLは、2次元の画像上の顔の特徴とともに、3次元の顔の特徴点の位置が加味された判定結果となる。
図1に戻って、感情判定装置1の構成について説明を続ける。
制御部20は、3次元顔特徴点抽出手段21と、顔画像特徴抽出手段22と、特徴量結合手段23と、判定手段24と、を備える。
3次元顔特徴点抽出手段21は、図3に示すように、顔画像Fを入力し、3次元顔特徴点抽出モデルM1のニューラルネットワークの演算を行うことで、顔の予め定めた複数の位置(ランドマーク、キーポイント)の3次元座標位置を3次元顔特徴点C3Dとして抽出する。
3次元顔特徴点抽出手段21は、抽出した3次元顔特徴点C3Dを特徴量結合手段23に出力する。
顔画像特徴抽出手段22は、図4に示すように、顔画像Fを入力し、顔画像特徴抽出モデルM2のニューラルネットワークの演算を行うことで、顔の特徴量を顔画像特徴ベクトルV2Dとして抽出する。
顔画像特徴抽出手段22は、抽出した顔画像特徴ベクトルV2Dを特徴量結合手段23に出力する。
特徴量結合手段23は、例えば、図6に示すように、3次元顔特徴点C3Dの各座標値を、最大値が“1”、最小値が“0”となるように、すべての座標値を0~1の範囲の値に正規化する。そして、特徴量結合手段23は、正規化したX座標の値の数値列、正規化したY座標の数値列、正規化したZ座標の数値列を並べて1次元の数値列である3次元顔特徴点ベクトルV3Dを生成する。そして、特徴量結合手段23は、正規化および1次元化した3次元顔特徴点ベクトルV3Dを顔画像特徴ベクトルV2Dに連結して、特徴ベクトルVFを生成する。
特徴量結合手段23は、結合後の特徴ベクトルVFを判定手段24に出力する。
判定手段24は、図5に示すように、顔画像特徴ベクトルV2Dと3次元顔特徴点ベクトルV3Dとを連結した特徴ベクトルVFを入力し、感情判定モデルM3のニューラルネットワークの演算を行うことで、感情ラベルLごとの確率値を算出する。
そして、判定手段24は、確率値が最大となった感情ラベルLを判定結果として出力する。
次に、図8を参照(構成については適宜図1参照)して、本発明の第1実施形態に係る感情判定装置1の動作について説明する。
ステップS1において、感情判定装置1は、図示を省略した入力手段によって、外部から顔画像を入力する。
ステップS2において、感情判定装置1は、3次元顔特徴点抽出手段21によって、3次元顔特徴点抽出モデル記憶手段11に記憶されている3次元顔特徴点抽出モデルを用いて、ステップS1で入力された顔画像から顔の3次元の特徴点(3次元顔特徴点)の位置を抽出する。
ステップS3において、感情判定装置1は、顔画像特徴抽出手段22によって、顔画像特徴抽出モデル記憶手段12に記憶されている顔画像特徴抽出モデルを用いて、ステップS1で入力された顔画像から顔の特徴を顔画像特徴ベクトルとして抽出する。
なお、ステップS2とステップS3は、図8のように、並列で動作させてもよいし、ステップS2,S3の順、あるいは、ステップS3,S2の順に動作させてもよい。
ステップS5において、感情判定装置1は、特徴量結合手段23によって、ステップ3で抽出された顔画像特徴ベクトルと、ステップS4で生成された3次元顔特徴点ベクトルとを連結し、特徴ベクトルを生成する。
ステップS7において、感情判定装置1は、判定手段24によって、ステップS6で判定された感情ラベルを判定結果として外部に出力する。
ここで、まだ、顔画像が入力される場合(ステップS8でNo)、感情判定装置1は、ステップS1に戻って動作を継続する。
一方、顔画像が入力されない場合(ステップS8でYes)、感情判定装置1は、動作を終了する。
以上の動作によって、感情判定装置1は、顔画像から、顔画像に映った人物の感情を判定することができる。
次に、図9を参照して、本発明の第2実施形態に係るモデル学習装置2の構成について説明する。
すなわち、モデル学習装置2は、感情判定装置1で用いる顔画像特徴抽出モデルおよび感情判定モデルを学習する。
モデル学習装置2は、感情ラベルが既知の顔画像(学習用顔画像)と、対応する感情ラベル(正解感情ラベル)とを、学習データとして入力し、顔画像特徴抽出モデルおよび感情判定モデルを学習する
図9に示すように、モデル学習装置2は、記憶部10と、制御部20Bと、を備える。
また、顔画像特徴抽出モデル記憶手段12には、一般的な画像認識用として事前学習されたモデル(畳み込みニューラルネットワーク〔CNN〕、Vision Transformer等)が顔画像特徴抽出モデルとして記憶されている。
また、感情判定モデル記憶手段13には、1次元のベクトルから、予め定めたラベルを推定するモデル、例えば、順伝播ニューラルネットワーク(FFNN)のモデルが感情判定モデルとして記憶されている。
3次元顔特徴点抽出手段21、顔画像特徴抽出手段22および特徴量結合手段23は、図1で説明した感情判定装置1の構成と同じである。ただし、3次元顔特徴点抽出手段21および顔画像特徴抽出手段22が入力する顔画像は、学習用顔画像である。
なお、顔画像特徴抽出モデル学習手段25の学習には、顔画像特徴抽出モデルM2以外に、感情判定モデルM3が用いられるが、ここでは、顔画像特徴抽出モデルM2のみを学習対象とすればよい。
これによって、顔画像特徴抽出モデルM2は、感情ラベルLの分類数に応じた特徴(顔画像特徴ベクトルV2D)を出力するように学習されることになる。
顔画像特徴抽出モデル学習手段25は、学習後のパラメータを顔画像特徴抽出モデル記憶手段12に記憶する。
顔画像特徴抽出モデル学習手段25は、一対の学習用顔画像と正解感情ラベルとを用いた学習が完了した段階で、学習用顔画像を顔画像特徴抽出手段22に出力する。
ここでは、感情判定モデル学習手段26は、特徴量結合手段23で結合された特徴ベクトルを感情判定モデルに入力して、正解となる感情ラベル(正解感情ラベル)を出力するように、感情判定モデルを学習する。
次に、図10を参照(構成については適宜図9参照)して、本発明の第2実施形態に係るモデル学習装置2の動作について説明する。
ステップS10において、モデル学習装置2は、図示を省略した入力手段によって、外部から学習用顔画像および正解感情ラベルを入力する。
ステップS11において、モデル学習装置2は、3次元顔特徴点抽出手段21によって、3次元顔特徴点抽出モデル記憶手段11に記憶されている3次元顔特徴点抽出モデルを用いて、ステップS10で入力された学習用顔画像から顔の3次元の特徴点(3次元顔特徴点)の位置を抽出する。
そして、顔画像特徴抽出モデル学習手段25は、学習後のパラメータを顔画像特徴抽出モデル記憶手段12に記憶する(ステップとして不図示)。
なお、ステップS11とステップS12、13とは、図10のように、並列で動作させてもよいし、ステップS11,S12,S13の順、あるいは、ステップS12,S13,S11の順に動作させてもよい。
ステップS15において、モデル学習装置2は、特徴量結合手段23によって、ステップ13で抽出された顔画像特徴ベクトルと、ステップS14で生成された3次元顔特徴点ベクトルとを連結し、特徴ベクトルを生成する。
そして、感情判定モデル学習手段26は、学習後のパラメータを感情判定モデル記憶手段13に記憶する(ステップとして不図示)。
ここで、まだ、学習が終了していない場合(ステップS17でNo)、モデル学習装置2は、ステップS10に戻って動作を継続する。
一方、学習が終了した場合(ステップS17でYes)、モデル学習装置2は、動作を終了する。
しかし、本発明は、感情判定装置1とモデル学習装置2とを動作モードの変更によって1つの装置で動作する構成(第3実施形態)としても構わない。
具体的な構成を図11に示す。
感情判定装置1Bは、学習モードで動作する場合、学習用の顔画像(学習用顔画像)と対応する正解の感情ラベル(正解感情ラベル)とを学習データとして、感情を判定するためのモデル(顔画像特徴抽出モデルおよび感情判定モデル)を学習する。
また、感情判定装置1Bは、判定モードで動作する場合、判定用の顔画像(判定用顔画像)から感情ラベル(判定感情ラベル)を判定する。
図11に示すように、感情判定装置1Bは、記憶部10と、制御部20Cと、を備える。
制御部20Cは、3次元顔特徴点抽出手段21と、顔画像特徴抽出手段22と、特徴量結合手段23と、判定手段24と、顔画像特徴抽出モデル学習手段25と、感情判定モデル学習手段26と、を備える。
これらの各手段は、感情判定装置1やモデル学習装置2の構成と同じ機能を有するため、同一の符号を付して説明を省略する。
具体的には、学習モードでは、3次元顔特徴点抽出手段21と、顔画像特徴抽出手段22と、特徴量結合手段23と、顔画像特徴抽出モデル学習手段25と、感情判定モデル学習手段26と、が動作する。
特徴量結合手段23は、結合した特徴ベクトルを、学習モードにおいては感情判定モデル学習手段26に出力し、判定モードにおいては判定手段24に出力する。
なお、感情判定装置1Bの動作は、学習モードでは、図10で説明したモデル学習装置2の動作と同じであり、判定モードでは、図8で説明した感情判定装置1の動作と同じであるため、説明を省略する。
これによって、放送コンテンツの登場人物の感情を、解説音声、触覚刺激等によって、提示することができ、視覚障害者を含めたすべての人に、より高い臨場感を提供することが可能になる。
2 モデル学習装置
10 記憶部
11 3次元顔特徴点抽出モデル記憶手段
12 顔画像特徴抽出モデル記憶手段
13 感情判定モデル記憶手段
20,20B,20C 制御部
21 3次元顔特徴点抽出手段
22 顔画像特徴抽出手段
23 特徴量結合手段
24 判定手段
25 顔画像特徴抽出モデル学習手段
26 感情判定モデル学習手段
Claims (5)
- 顔画像に映った人物の感情を判定する感情判定装置であって、
予め学習された3次元顔特徴点抽出モデルを用いて、入力された顔画像から顔の3次元の特徴点の位置を抽出する3次元顔特徴点抽出手段と、
予め学習された顔画像特徴抽出モデルを用いて、前記入力された顔画像から顔の特徴量である顔画像特徴ベクトルを抽出する顔画像特徴抽出手段と、
前記顔の3次元の特徴点の位置と前記顔画像特徴ベクトルとを連結した特徴ベクトルを生成する特徴量結合手段と、
予め学習された感情判定モデルを用いて、前記特徴ベクトルから予め定めた感情のラベルを判定する判定手段と、
を備えることを特徴とする感情判定装置。 - 学習用の顔画像を前記顔画像特徴抽出モデルに入力し出力される顔画像特徴ベクトルを所定長のベクトルとして前記感情判定モデルに入力し、前記学習用の顔画像に対応する正解の感情ラベルを出力するように、前記顔画像特徴抽出モデルを学習する顔画像特徴抽出モデル学習手段と、
前記特徴ベクトルを入力し、前記学習用の顔画像に対応する正解の感情ラベルを出力するように、前記感情判定モデルを学習する感情判定モデル学習手段と、
をさらに備えることを特徴とする請求項1に記載の感情判定装置。 - コンピュータを、請求項1または請求項2に記載の感情判定装置として機能させるためのプログラム。
- 顔画像を入力して前記顔画像から顔の特徴量である顔画像特徴ベクトルを出力する顔画像特徴抽出モデルと、前記顔画像特徴ベクトルに顔の3次元の特徴点の位置を連結した特徴ベクトルを入力して予め定めた感情のラベルを判定結果として出力する感情判定モデルと、を学習するモデル学習装置であって、
学習用の顔画像を前記顔画像特徴抽出モデルに入力して出力される顔画像特徴ベクトルを所定長のベクトルとして前記感情判定モデルに入力し、前記学習用の顔画像に対応する正解の感情ラベルを出力するように、前記顔画像特徴抽出モデルを学習する顔画像特徴抽出モデル学習手段と、
予め学習された3次元顔特徴点抽出モデルを用いて、前記学習用の顔画像から顔の3次元の特徴点の位置を抽出する3次元顔特徴点抽出手段と、
前記顔画像特徴抽出モデルを用いて、前記学習用の顔画像から顔の特徴量である顔画像特徴ベクトルを抽出する顔画像特徴抽出手段と、
前記顔の3次元の特徴点の位置と前記顔画像特徴ベクトルとを連結した特徴ベクトルを生成する特徴量結合手段と、
前記特徴ベクトルを入力し、前記学習用の顔画像に対応する正解の感情ラベルを出力するように、前記感情判定モデルを学習する感情判定モデル学習手段と、
を備えることを特徴とするモデル学習装置。 - コンピュータを、請求項4に記載のモデル学習装置として機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022115233A JP7846580B2 (ja) | 2022-07-20 | 2022-07-20 | 感情判定装置およびモデル学習装置、ならびに、それらのプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022115233A JP7846580B2 (ja) | 2022-07-20 | 2022-07-20 | 感情判定装置およびモデル学習装置、ならびに、それらのプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2024013280A JP2024013280A (ja) | 2024-02-01 |
| JP7846580B2 true JP7846580B2 (ja) | 2026-04-15 |
Family
ID=89718460
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022115233A Active JP7846580B2 (ja) | 2022-07-20 | 2022-07-20 | 感情判定装置およびモデル学習装置、ならびに、それらのプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7846580B2 (ja) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011128966A (ja) | 2009-12-18 | 2011-06-30 | Denso Corp | 顔特徴点検出装置および眠気検出装置 |
| JP2012185545A (ja) | 2011-03-03 | 2012-09-27 | Secom Co Ltd | 顔画像処理装置 |
| JP2018530017A (ja) | 2015-07-30 | 2018-10-11 | インテル・コーポレーション | 感情拡張アバターアニメーション |
| JP2021111107A (ja) | 2020-01-09 | 2021-08-02 | 富士通株式会社 | 判定プログラム、判定方法、判定装置 |
| JP2021535499A (ja) | 2018-08-27 | 2021-12-16 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 顔姿勢推定/3次元顔再構築方法、装置、及び電子デバイス |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007058397A (ja) * | 2005-08-23 | 2007-03-08 | Konica Minolta Holdings Inc | 認証システム、登録システム及び証明用媒体 |
| JP2020099367A (ja) * | 2017-03-28 | 2020-07-02 | 株式会社Seltech | 感情認識装置および感情認識プログラム |
-
2022
- 2022-07-20 JP JP2022115233A patent/JP7846580B2/ja active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011128966A (ja) | 2009-12-18 | 2011-06-30 | Denso Corp | 顔特徴点検出装置および眠気検出装置 |
| JP2012185545A (ja) | 2011-03-03 | 2012-09-27 | Secom Co Ltd | 顔画像処理装置 |
| JP2018530017A (ja) | 2015-07-30 | 2018-10-11 | インテル・コーポレーション | 感情拡張アバターアニメーション |
| JP2021535499A (ja) | 2018-08-27 | 2021-12-16 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 顔姿勢推定/3次元顔再構築方法、装置、及び電子デバイス |
| JP2021111107A (ja) | 2020-01-09 | 2021-08-02 | 富士通株式会社 | 判定プログラム、判定方法、判定装置 |
Non-Patent Citations (1)
| Title |
|---|
| 高橋 正樹 他4名,TV視聴者の顔向きと表情に基づく番組評価推定,FIT2014 第13回情報科学技術フォーラム 講演論文集 第3分冊,日本,2014年08月19日,社団法人電子情報通信学会,pp.317~318 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2024013280A (ja) | 2024-02-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12561956B2 (en) | Affordance-based reposing of an object in a scene | |
| Chuang et al. | Mood swings: expressive speech animation | |
| TWI766499B (zh) | 互動物件的驅動方法、裝置、設備以及儲存媒體 | |
| Deng et al. | Animating blendshape faces by cross-mapping motion capture data | |
| CN111383307A (zh) | 基于人像的视频生成方法及设备、存储介质 | |
| EP3743925A1 (en) | Interactive systems and methods | |
| WO2023284435A1 (zh) | 生成动画的方法及装置 | |
| CN111401101A (zh) | 基于人像的视频生成系统 | |
| TW202248994A (zh) | 互動對象驅動和音素處理方法、設備以及儲存媒體 | |
| US7257538B2 (en) | Generating animation from visual and audio input | |
| CN112990123B (zh) | 图像处理方法、装置、计算机设备和介质 | |
| CN115550744B (zh) | 一种语音生成视频的方法和装置 | |
| RU2755396C1 (ru) | Нейросетевой перенос выражения лица и позы головы с использованием скрытых дескрипторов позы | |
| WO2025012626A1 (en) | Generating facial representations | |
| Neverova | Deep learning for human motion analysis | |
| Liu et al. | A survey on deep multi-modal learning for body language recognition and generation | |
| Manglani et al. | Lip reading into text using deep learning | |
| CN118015142A (zh) | 人脸图像处理方法、装置、计算机设备和存储介质 | |
| CN112637692B (zh) | 互动方法、装置、设备 | |
| JP7846580B2 (ja) | 感情判定装置およびモデル学習装置、ならびに、それらのプログラム | |
| CN116168432A (zh) | 一种面部表情及头部动作迁移方法及系统 | |
| CN119962483A (zh) | 一种2d数字人驱动方法、装置、电子设备及存储介质 | |
| Deena et al. | Visual speech synthesis by modelling coarticulation dynamics using a non-parametric switching state-space model | |
| Müller et al. | Realistic speech animation based on observed 3-D face dynamics | |
| Chuang | Analysis, synthesis, and retargeting of facial expressions |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250602 |
|
| TRDD | Decision of grant or rejection written | ||
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20260302 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260310 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260403 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7846580 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |