JP2967058B2 - 階層的感情認識装置 - Google Patents

階層的感情認識装置

Info

Publication number
JP2967058B2
JP2967058B2 JP9030576A JP3057697A JP2967058B2 JP 2967058 B2 JP2967058 B2 JP 2967058B2 JP 9030576 A JP9030576 A JP 9030576A JP 3057697 A JP3057697 A JP 3057697A JP 2967058 B2 JP2967058 B2 JP 2967058B2
Authority
JP
Japan
Prior art keywords
emotion
voice
emotion recognition
emotions
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP9030576A
Other languages
English (en)
Other versions
JPH10228295A (ja
Inventor
シルバ チャンダラティラク リヤナゲ ディ
勉 宮里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EI TEI AARU CHINO EIZO TSUSHIN KENKYUSHO KK
Original Assignee
EI TEI AARU CHINO EIZO TSUSHIN KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI TEI AARU CHINO EIZO TSUSHIN KENKYUSHO KK filed Critical EI TEI AARU CHINO EIZO TSUSHIN KENKYUSHO KK
Priority to JP9030576A priority Critical patent/JP2967058B2/ja
Publication of JPH10228295A publication Critical patent/JPH10228295A/ja
Application granted granted Critical
Publication of JP2967058B2 publication Critical patent/JP2967058B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は階層的感情認識装
置に関し、特に、人間の声からの情報と顔の表情からの
情報とを統合して階層的に感情を認識できるような階層
的感情認識装置に関する。
【0002】
【従来の技術】遠隔地にいる人々があたかも同じ卓を囲
んで会議をするような感じで話し合ったり時間や空間を
克服して本当に有意義なコミュニケーションをするに
は、人工現実感を利用した臨場感通信が望まれている。
臨場感通信で会議を行なうときに、会議に参加している
人の感情を音声と画像で表現する必要がある。そのため
には、感情認識するためのアルゴリズムが必要とされ
る。
【0003】
【発明が解決しようとする課題】従来より、感情認識の
アルゴリズムについて知られたものもあるが、そのほと
んどが画像情報と音声情報とを別々に利用したものであ
り、感情の種類によって音声情報を優先させるかあるい
は画像情報を優先させるかなどの優先度合いを利用して
いなかった。
【0004】それゆえに、この発明の主たる目的は、感
情別に音声情報と画像情報に重み付けして感情を認識し
得る階層的感情認識装置を提供することである。
【0005】
【課題を解決するための手段】請求項1に係る発明は、
人間の声の情報と顔の情報とから感情を認識する階層的
感情認識装置であって、人間の声の情報から音声データ
を抽出する音声抽出手段と、人間の顔の情報から画像デ
ータを抽出する画像抽出手段と、抽出された音声データ
に基づいて感情を認識する第1の感情認識手段と、抽出
された画像データに基づいて感情を認識する第2の感情
認識手段と、第1および第2の感情認識手段によってそ
れぞれ認識された感情に重み付けして統合する重み付け
手段とを備えて構成される。
【0006】請求項2に係る発明では、請求項1の重み
付け手段は、第1の感情認識手段によって「悲しみ」と
「恐怖」が認識されたとき、これらの感情の声の重み付
けを大きくし、第2の感情認識手段によって「怒り」と
「幸福」と「驚き」が認識されたとき、これらの感情の
画像の重み付けを大きくする。
【0007】
【発明の実施の形態】まず、本願発明者らは、感情を認
識するとき、人間の声を優先する感情と、顔の表情を優
先する感情と、声と表情の両方に依存する感情の3種類
に分けられることを被験者を使った実験により確認し
た。まず、その実験結果について説明する。
【0008】図1は感情認識実験方法を説明するための
図である。この実施形態では、スペイン語とシンハラ語
(スリランカの国語)で次に示す6つの感情を標題とし
て与え、図1に示すタイムシーケンスでその感情を表情
と音声とで表わした人の声と顔画像を録画した。
【0009】 怒り:なぜあなたは来なかったのか 幸福:おはようございます 悲しみ:私はお金を使った 驚き:なんと不快な作品だ 嫌悪:私は彼が嫌いだ 恐怖:どうか殺さないで 被験者はスペイン語とシンハラ語を理解することができ
ない日本人の大学生である。これらの言語を理解できる
人では、言葉により感情を判別してしまい、声と顔の表
情のみで感情を判別できないからである。実験は、Aと
Bの2種類で行なった。実験Aは声と映像を別々に被験
者に見せるものであり、実験Bは声と映像の組合せを変
えて被験者に見せるものであり、たとえば幸福な顔の映
像と悲しみの声とを組合せたようなものである。
【0010】図2はスペイン語での実験Aの認識結果を
示し、図3はシンハラ語での実験Aの認識結果を示し、
図4はスペイン語とシンハラ語における6つの感情の認
識結果を対比して示した図である。
【0011】図2と図3とを対比すれば明らかなよう
に、言語で認識結果は異なっているが、両者の傾向はよ
く似ていることがわかる。すなわち、「悲しみ」と「恐
怖」はともに映像よりも音声のみで認識される度合いが
高くなっており、その他の「怒り」,「幸福」,「驚
き」,「嫌悪」は音声のみよりも表情で認識される度合
いが高くなっていることがわかる。
【0012】図5はスペイン語での実験Bの認識結果を
示し、図6はシンハラ語での実験Bの認識結果を示し、
図7はスペイン語とシンハラ語における6つの感情の認
識結果を対比して示した図である。
【0013】この実験Bにおいても、「悲しみ」と「恐
怖」はともに音声のみで認識される度合いが高くなって
おり、「怒り」,「幸福」,「驚き」は映像のみで認識
される度合いが高くなっており、「嫌悪」だけではスペ
イン語では映像が優位になっており、シンハラ語では音
声が優位になっている。
【0014】上述の実験結果から、「怒り」と「幸福」
と「驚き」が表情を優先し、「悲しみ」と「恐怖」とが
声を優先していることが確かめられた。
【0015】図8はこの発明の一実施形態を示すブロッ
ク図である。図8において、カメラ1は話者の顔画像を
撮像し、マイクロホン2は話者の声を取得する。顔画像
は画像データを用いた感情認識部3に入力されて感情が
認識され、音声は音声データを用いた感情認識部4に与
えられて感情が認識される。それぞれの認識結果は重み
付け処理部5に与えられて音声と表情を統合した感情が
出力される。
【0016】ここで、画像データを用いた感情認識部3
としては、J.SICE(計測と制御)特集:人間と共
存するロボットの新技術、Vol.34,No.4,p
p.248−254,Apr.1995で発表された技
術が用いられる。すなわち、撮像した顔画像からたとえ
ば額,目,口の動きに関連する30の特徴を抽出してニ
ューラルネットワークに与え、6つの感情を認識する。
また、音声データを用いた感情認識部4としては、In P
roceedings of Spring Symposiurm on Believable Agen
ts, Stanford University, AAAI (American Associati
on for Artificial Intelligence), March 1994に発表
された技術が用いられる。
【0017】重み付け処理部5は怒り,幸福,悲しみ,
驚き,嫌悪,恐怖のそれぞれの画像データをVAng ,V
Hap ,VSad ,VSur ,VDis ,VFea で表わし、それ
ぞの音声データをAAng ,AHap ,ASad ,ASur ,A
Dis ,AFea とすると、次の第(1)式のように入力さ
れる。 (VAng ,VHap ,VSad ,VSur ,VDis ,VFea ,AAng ,AHap ,ASad ,ASur ,ADis ,AFea )∈{0,1} (1) 重み付け処理部5の中での感情選択手法は次のとおりと
なる。
【0018】 怒り* =W(1,Ang) Ang +W(2,Ang) Ang 幸福* =W(1,Hap) Hap +W(2,Hap) Hap 悲しみ* =W(1,Sad) Sad +W(2,Sad) Sad (2) 驚き* =W(1,Sur) Sur +W(2,Sur) Sur 嫌悪* (1,Dis) Dis +W(2,Dis) Dis 恐怖* (1,Fea) Fea +W(2,Fea) Fea たとえば、重み付けマトリクスWは実験の結果により、
次のように設定できる。
【0019】 W(1,Ang) =22.59 W(2,Ang) = 0 W(1,Hap) =41.88 W(2,Hap) = 0 W(1,Sad) = 0 W=(2,Sad) 20.65 (3) W(1,Sur) =11.64 W(2,Sur) = 0 W(1,Dis) =23.30 W(2,Dis) = 0 W(1,Fea) = 0 W(2,Fea) =6.54 基本的に、W(1,xxx) ,W(2,xxx) の値は次のとおり設
定すれば、従来の感情認識方法により優位な結果が得ら
れる。
【0020】 {W(1,Ang) ,W(1,Hap) ,W(2,Sad) ,W(1,Sur) ,W(1,Dis) , W(2,Fea) }>>>1 {W(2,Ang) ,W(2,Hap) ,W(1,Sad) ,W(2,Sur) ,W(2,Dis) , W(1,Fea) }<=0 (4) 最終的に、第(5)式により入力感情が認識される。
【0021】 Max{怒り* ,幸福* ,悲しみ* ,驚き* ,嫌悪* ,恐怖* } (5) 図9はこの発明の一実施形態を用いて実現した臨場感通
信での会議システムを示す概念図である。臨場感通信で
の会議システムでは、互いに離れた空間10,20にい
る2人の人30,40が会議を行なう。一方の空間上に
いる人30の表情および音声はこの発明の一実施形態に
よる認識装置50で認識され、他方の空間20の表現装
置80で表現される。同様にして、他方の空間20にい
る人40の表情および音声は認識装置60で認識され、
一方の空間10の表現装置70で表現される。そして、
各表現装置70,80には、会議をしている人30,4
0の感情が表情と音声で表現される。すなわち、たとえ
ば驚きの音声を発したときには、驚いたときの顔の表情
となるように表現される。その際、実写映像を表示する
のではなく、コンピュータグラフィックス(CG)像で
再構成した人物像を表示することにより、実物の表情よ
りも強調した表情にすることができる。それによって、
自然な感情の表現で会議を進めることができる。
【0022】
【発明の効果】以上のように、この発明によれば、音声
データに基づいて認識した感情と、画像データに基づい
て認識した感情にそれぞれ重み付けして統合するように
したので、認識率を高めることができ、この認識結果に
基づいて感情を表現したとき、自然な表情と音声で感情
を再現できる。
【図面の簡単な説明】
【図1】感情認識実験結果を説明するための図である。
【図2】スペイン語での実験Aの認識結果を示す図であ
る。
【図3】シンハラ語での実験Aの認識結果を示す図であ
る。
【図4】スペイン語とシンハラ語における6つの感情の
認識結果を対比して示した図である。
【図5】スペイン語での実験Bの認識結果を示す図であ
る。
【図6】シンハラ語での実験Bの認識結果を示す図であ
る。
【図7】スペイン語とシンハラ語における6つの感情の
認識結果を対比して示した図である。
【図8】この発明の一実施形態を示すブロック図であ
る。
【図9】この発明の一実施形態を用いて実施形態した臨
場感通信での会議システムを示す概念図である。
【符号の説明】 1 カメラ 2 マイクロホン 3 画像データを用いた感情認識部 4 音声データを用いた感情認識部 5 重み付け処理部
フロントページの続き (56)参考文献 特開 平10−254484(JP,A) 特開 平5−252509(JP,A) 特開 平10−49188(JP,A) 特開 平5−12023(JP,A) 特開 平2−183371(JP,A) 特開 平4−342078(JP,A) 特許2798622(JP,B2) 電子情報通信学会技術研究報告 Vo l.96,No.296,IE96−58,”D egree o Human Perc eption of Facial E motions based on A udio and Video Inf ormation”,p9−15,(1996 /10/14) 電子情報通信学会技術研究報告 Vo l.95,No.436,CS95−152,「臨 場感通信会議システムの評価−感情認識 と伝達について−」,P.31−36 電子情報通信学会技術研究報告 IE 95−104,「臨場感通信会議システムの 評価−感情認識と伝達について−」, P.31−36 IEICE Transaction s on Informations and Systems,Vol.E79 −D,No.6,June 1996,”E motion Enhanced Fa ce to Face Meeting s Using the Concep t of Virtual Space Teleconferencing" p.772−780 IEICE Transaction s on Informations and Systems,Vol.E81 −D,No.1,January 1998,”Use of Multimo dal Information in Facial Emotion Re cognition”,p.105−114 (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 531 G10L 3/00 571 G06T 1/00 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 人間の声の情報と顔の情報とから感情を
    認識する階層的感情認識装置であって、 前記人間の声の情報から音声データを抽出する音声抽出
    手段、 前記人間の顔の情報から画像データを抽出する画像抽出
    手段、 前記音声抽出手段によって抽出された音声データに基づ
    いて感情を認識する第1の感情認識手段、 前記画像抽出手段によって抽出された画像データに基づ
    いて感情を認識する第2の感情認識手段、および前記第
    1および第2の感情認識手段によってそれぞれ認識され
    た感情に重み付けして統合する重み付け手段を備えた、
    階層的感情認識装置。
  2. 【請求項2】 前記重み付け手段は、前記第1の感情認
    識手段によって「悲しみ」と「恐怖」が認識されたと
    き、これらの感情の声の重み付けを大きくし、前記第2
    の感情認識手段によって「怒り」と「幸福」と「驚き」
    が認識されたとき、これらの感情の画像の重み付けを大
    きくすることを特徴とする、請求項1の階層的感情認識
    装置。
JP9030576A 1997-02-14 1997-02-14 階層的感情認識装置 Expired - Lifetime JP2967058B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9030576A JP2967058B2 (ja) 1997-02-14 1997-02-14 階層的感情認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9030576A JP2967058B2 (ja) 1997-02-14 1997-02-14 階層的感情認識装置

Publications (2)

Publication Number Publication Date
JPH10228295A JPH10228295A (ja) 1998-08-25
JP2967058B2 true JP2967058B2 (ja) 1999-10-25

Family

ID=12307686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9030576A Expired - Lifetime JP2967058B2 (ja) 1997-02-14 1997-02-14 階層的感情認識装置

Country Status (1)

Country Link
JP (1) JP2967058B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001083984A (ja) * 1999-09-09 2001-03-30 Alpine Electronics Inc インタフェース装置
GB0110480D0 (en) 2001-04-28 2001-06-20 Univ Manchester Metropolitan Methods and apparatus for analysing the behaviour of a subject
ES2242484B1 (es) * 2003-01-24 2007-01-01 Pedro Monagas Asensio Dispositivo analizador animico para mamiferos.
JP2005202854A (ja) * 2004-01-19 2005-07-28 Nec Corp 画像処理装置、画像処理方法及び画像処理プログラム
JP4794846B2 (ja) 2004-10-27 2011-10-19 キヤノン株式会社 推定装置、及び推定方法
JP2006350577A (ja) * 2005-06-14 2006-12-28 Fuji Xerox Co Ltd 動作分析装置
JP2007041988A (ja) 2005-08-05 2007-02-15 Sony Corp 情報処理装置および方法、並びにプログラム
KR100903348B1 (ko) * 2007-11-28 2009-06-23 중앙대학교 산학협력단 특징 융합 기반 감정인식 방법 및 시스템
KR100958030B1 (ko) * 2007-11-28 2010-05-17 중앙대학교 산학협력단 결정 융합 기반 감정인식 방법 및 시스템
JP4914398B2 (ja) 2008-04-09 2012-04-11 キヤノン株式会社 表情認識装置、撮像装置、方法及びプログラム
KR101558553B1 (ko) 2009-02-18 2015-10-08 삼성전자 주식회사 아바타 얼굴 표정 제어장치
US9110501B2 (en) 2012-04-17 2015-08-18 Samsung Electronics Co., Ltd. Method and apparatus for detecting talking segments in a video sequence using visual cues
JP6761598B2 (ja) * 2016-10-24 2020-09-30 富士ゼロックス株式会社 感情推定システム、感情推定モデル生成システム
CN108962255B (zh) * 2018-06-29 2020-12-08 北京百度网讯科技有限公司 语音会话的情绪识别方法、装置、服务器和存储介质
JP7279494B2 (ja) * 2019-04-23 2023-05-23 コニカミノルタ株式会社 会議支援装置、および会議支援システム
JP7170594B2 (ja) * 2019-06-25 2022-11-14 Kddi株式会社 同一事象に対して時系列に発生した異なるメディアデータを統合した学習モデルを構築するプログラム、装置及び方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
IEICE Transactions on Informations and Systems,Vol.E79−D,No.6,June 1996,"Emotion Enhanced Face to Face Meetings Using the Concept of Virtual Space Teleconferencing"p.772−780
IEICE Transactions on Informations and Systems,Vol.E81−D,No.1,January 1998,"Use of Multimodal Information in Facial Emotion Recognition",p.105−114
電子情報通信学会技術研究報告 IE95−104,「臨場感通信会議システムの評価−感情認識と伝達について−」,P.31−36
電子情報通信学会技術研究報告 Vol.95,No.436,CS95−152,「臨場感通信会議システムの評価−感情認識と伝達について−」,P.31−36
電子情報通信学会技術研究報告 Vol.96,No.296,IE96−58,"Degree o Human Perception of Facial Emotions based on Audio and Video Information",p9−15,(1996/10/14)

Also Published As

Publication number Publication date
JPH10228295A (ja) 1998-08-25

Similar Documents

Publication Publication Date Title
JP2967058B2 (ja) 階層的感情認識装置
WO2022048403A1 (zh) 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端
De Silva et al. Bimodal emotion recognition
Bruce The role of the face in communication: Implications for videophone design
US10095918B2 (en) System and method for interpreting interpersonal communication
Chen Audiovisual speech processing
WO2022116977A1 (zh) 目标对象的动作驱动方法、装置、设备及存储介质及计算机程序产品
US9060095B2 (en) Modifying an appearance of a participant during a video conference
US20160134840A1 (en) Avatar-Mediated Telepresence Systems with Enhanced Filtering
Huang et al. Bimodal emotion recognition by man and machine
JP7279494B2 (ja) 会議支援装置、および会議支援システム
CN114187547A (zh) 目标视频的输出方法及装置、存储介质及电子装置
Liu et al. Generation of nodding, head tilting and gazing for human–robot speech interaction
Ritschel et al. Multimodal joke generation and paralinguistic personalization for a socially-aware robot
JP2021086415A (ja) 仮想人物対話システム、映像生成方法、映像生成プログラム
JP2023099309A (ja) アバターを通じて映像の音声を手話に通訳する方法、コンピュータ装置、およびコンピュータプログラム
JP7096626B2 (ja) 情報抽出装置
Lee et al. AEGIS: A real-time multimodal augmented reality computer vision based system to assist facial expression recognition for individuals with autism spectrum disorder
Verma et al. Animating expressive faces across languages
Frank et al. Automatic pixel selection for optimizing facial expression recognition using eigenfaces
Faruquie et al. Audio Driven Facial Animation For Audio-Visual Reality.
KR20190111642A (ko) 실제 사진의 픽셀 기반의 토킹 헤드 애니메이션을 이용한 영상 처리 시스템 및 방법
JP7465040B1 (ja) コミュニケーション可視化システム
WO2024014318A1 (ja) 学習モデル生成装置、推論処理装置、学習モデル生成方法および推論処理方法
WO2022059088A1 (ja) 人物評価情報生成方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990803

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080813

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090813

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100813

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110813

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120813

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120813

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130813

Year of fee payment: 14

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term