JP2967058B2 - 階層的感情認識装置 - Google Patents
階層的感情認識装置Info
- Publication number
- JP2967058B2 JP2967058B2 JP9030576A JP3057697A JP2967058B2 JP 2967058 B2 JP2967058 B2 JP 2967058B2 JP 9030576 A JP9030576 A JP 9030576A JP 3057697 A JP3057697 A JP 3057697A JP 2967058 B2 JP2967058 B2 JP 2967058B2
- Authority
- JP
- Japan
- Prior art keywords
- emotion
- voice
- emotion recognition
- emotions
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
置に関し、特に、人間の声からの情報と顔の表情からの
情報とを統合して階層的に感情を認識できるような階層
的感情認識装置に関する。
んで会議をするような感じで話し合ったり時間や空間を
克服して本当に有意義なコミュニケーションをするに
は、人工現実感を利用した臨場感通信が望まれている。
臨場感通信で会議を行なうときに、会議に参加している
人の感情を音声と画像で表現する必要がある。そのため
には、感情認識するためのアルゴリズムが必要とされ
る。
アルゴリズムについて知られたものもあるが、そのほと
んどが画像情報と音声情報とを別々に利用したものであ
り、感情の種類によって音声情報を優先させるかあるい
は画像情報を優先させるかなどの優先度合いを利用して
いなかった。
情別に音声情報と画像情報に重み付けして感情を認識し
得る階層的感情認識装置を提供することである。
人間の声の情報と顔の情報とから感情を認識する階層的
感情認識装置であって、人間の声の情報から音声データ
を抽出する音声抽出手段と、人間の顔の情報から画像デ
ータを抽出する画像抽出手段と、抽出された音声データ
に基づいて感情を認識する第1の感情認識手段と、抽出
された画像データに基づいて感情を認識する第2の感情
認識手段と、第1および第2の感情認識手段によってそ
れぞれ認識された感情に重み付けして統合する重み付け
手段とを備えて構成される。
付け手段は、第1の感情認識手段によって「悲しみ」と
「恐怖」が認識されたとき、これらの感情の声の重み付
けを大きくし、第2の感情認識手段によって「怒り」と
「幸福」と「驚き」が認識されたとき、これらの感情の
画像の重み付けを大きくする。
識するとき、人間の声を優先する感情と、顔の表情を優
先する感情と、声と表情の両方に依存する感情の3種類
に分けられることを被験者を使った実験により確認し
た。まず、その実験結果について説明する。
図である。この実施形態では、スペイン語とシンハラ語
(スリランカの国語)で次に示す6つの感情を標題とし
て与え、図1に示すタイムシーケンスでその感情を表情
と音声とで表わした人の声と顔画像を録画した。
ない日本人の大学生である。これらの言語を理解できる
人では、言葉により感情を判別してしまい、声と顔の表
情のみで感情を判別できないからである。実験は、Aと
Bの2種類で行なった。実験Aは声と映像を別々に被験
者に見せるものであり、実験Bは声と映像の組合せを変
えて被験者に見せるものであり、たとえば幸福な顔の映
像と悲しみの声とを組合せたようなものである。
示し、図3はシンハラ語での実験Aの認識結果を示し、
図4はスペイン語とシンハラ語における6つの感情の認
識結果を対比して示した図である。
に、言語で認識結果は異なっているが、両者の傾向はよ
く似ていることがわかる。すなわち、「悲しみ」と「恐
怖」はともに映像よりも音声のみで認識される度合いが
高くなっており、その他の「怒り」,「幸福」,「驚
き」,「嫌悪」は音声のみよりも表情で認識される度合
いが高くなっていることがわかる。
示し、図6はシンハラ語での実験Bの認識結果を示し、
図7はスペイン語とシンハラ語における6つの感情の認
識結果を対比して示した図である。
怖」はともに音声のみで認識される度合いが高くなって
おり、「怒り」,「幸福」,「驚き」は映像のみで認識
される度合いが高くなっており、「嫌悪」だけではスペ
イン語では映像が優位になっており、シンハラ語では音
声が優位になっている。
と「驚き」が表情を優先し、「悲しみ」と「恐怖」とが
声を優先していることが確かめられた。
ク図である。図8において、カメラ1は話者の顔画像を
撮像し、マイクロホン2は話者の声を取得する。顔画像
は画像データを用いた感情認識部3に入力されて感情が
認識され、音声は音声データを用いた感情認識部4に与
えられて感情が認識される。それぞれの認識結果は重み
付け処理部5に与えられて音声と表情を統合した感情が
出力される。
としては、J.SICE(計測と制御)特集:人間と共
存するロボットの新技術、Vol.34,No.4,p
p.248−254,Apr.1995で発表された技
術が用いられる。すなわち、撮像した顔画像からたとえ
ば額,目,口の動きに関連する30の特徴を抽出してニ
ューラルネットワークに与え、6つの感情を認識する。
また、音声データを用いた感情認識部4としては、In P
roceedings of Spring Symposiurm on Believable Agen
ts, Stanford University, AAAI (American Associati
on for Artificial Intelligence), March 1994に発表
された技術が用いられる。
驚き,嫌悪,恐怖のそれぞれの画像データをVAng ,V
Hap ,VSad ,VSur ,VDis ,VFea で表わし、それ
ぞの音声データをAAng ,AHap ,ASad ,ASur ,A
Dis ,AFea とすると、次の第(1)式のように入力さ
れる。 (VAng ,VHap ,VSad ,VSur ,VDis ,VFea ,AAng ,AHap ,ASad ,ASur ,ADis ,AFea )∈{0,1} (1) 重み付け処理部5の中での感情選択手法は次のとおりと
なる。
次のように設定できる。
定すれば、従来の感情認識方法により優位な結果が得ら
れる。
信での会議システムを示す概念図である。臨場感通信で
の会議システムでは、互いに離れた空間10,20にい
る2人の人30,40が会議を行なう。一方の空間上に
いる人30の表情および音声はこの発明の一実施形態に
よる認識装置50で認識され、他方の空間20の表現装
置80で表現される。同様にして、他方の空間20にい
る人40の表情および音声は認識装置60で認識され、
一方の空間10の表現装置70で表現される。そして、
各表現装置70,80には、会議をしている人30,4
0の感情が表情と音声で表現される。すなわち、たとえ
ば驚きの音声を発したときには、驚いたときの顔の表情
となるように表現される。その際、実写映像を表示する
のではなく、コンピュータグラフィックス(CG)像で
再構成した人物像を表示することにより、実物の表情よ
りも強調した表情にすることができる。それによって、
自然な感情の表現で会議を進めることができる。
データに基づいて認識した感情と、画像データに基づい
て認識した感情にそれぞれ重み付けして統合するように
したので、認識率を高めることができ、この認識結果に
基づいて感情を表現したとき、自然な表情と音声で感情
を再現できる。
る。
る。
認識結果を対比して示した図である。
る。
る。
認識結果を対比して示した図である。
る。
場感通信での会議システムを示す概念図である。
Claims (2)
- 【請求項1】 人間の声の情報と顔の情報とから感情を
認識する階層的感情認識装置であって、 前記人間の声の情報から音声データを抽出する音声抽出
手段、 前記人間の顔の情報から画像データを抽出する画像抽出
手段、 前記音声抽出手段によって抽出された音声データに基づ
いて感情を認識する第1の感情認識手段、 前記画像抽出手段によって抽出された画像データに基づ
いて感情を認識する第2の感情認識手段、および前記第
1および第2の感情認識手段によってそれぞれ認識され
た感情に重み付けして統合する重み付け手段を備えた、
階層的感情認識装置。 - 【請求項2】 前記重み付け手段は、前記第1の感情認
識手段によって「悲しみ」と「恐怖」が認識されたと
き、これらの感情の声の重み付けを大きくし、前記第2
の感情認識手段によって「怒り」と「幸福」と「驚き」
が認識されたとき、これらの感情の画像の重み付けを大
きくすることを特徴とする、請求項1の階層的感情認識
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9030576A JP2967058B2 (ja) | 1997-02-14 | 1997-02-14 | 階層的感情認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9030576A JP2967058B2 (ja) | 1997-02-14 | 1997-02-14 | 階層的感情認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10228295A JPH10228295A (ja) | 1998-08-25 |
JP2967058B2 true JP2967058B2 (ja) | 1999-10-25 |
Family
ID=12307686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9030576A Expired - Lifetime JP2967058B2 (ja) | 1997-02-14 | 1997-02-14 | 階層的感情認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2967058B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001083984A (ja) * | 1999-09-09 | 2001-03-30 | Alpine Electronics Inc | インタフェース装置 |
GB0110480D0 (en) | 2001-04-28 | 2001-06-20 | Univ Manchester Metropolitan | Methods and apparatus for analysing the behaviour of a subject |
ES2242484B1 (es) * | 2003-01-24 | 2007-01-01 | Pedro Monagas Asensio | Dispositivo analizador animico para mamiferos. |
JP2005202854A (ja) * | 2004-01-19 | 2005-07-28 | Nec Corp | 画像処理装置、画像処理方法及び画像処理プログラム |
JP4794846B2 (ja) | 2004-10-27 | 2011-10-19 | キヤノン株式会社 | 推定装置、及び推定方法 |
JP2006350577A (ja) * | 2005-06-14 | 2006-12-28 | Fuji Xerox Co Ltd | 動作分析装置 |
JP2007041988A (ja) | 2005-08-05 | 2007-02-15 | Sony Corp | 情報処理装置および方法、並びにプログラム |
KR100903348B1 (ko) * | 2007-11-28 | 2009-06-23 | 중앙대학교 산학협력단 | 특징 융합 기반 감정인식 방법 및 시스템 |
KR100958030B1 (ko) * | 2007-11-28 | 2010-05-17 | 중앙대학교 산학협력단 | 결정 융합 기반 감정인식 방법 및 시스템 |
JP4914398B2 (ja) | 2008-04-09 | 2012-04-11 | キヤノン株式会社 | 表情認識装置、撮像装置、方法及びプログラム |
KR101558553B1 (ko) | 2009-02-18 | 2015-10-08 | 삼성전자 주식회사 | 아바타 얼굴 표정 제어장치 |
US9110501B2 (en) | 2012-04-17 | 2015-08-18 | Samsung Electronics Co., Ltd. | Method and apparatus for detecting talking segments in a video sequence using visual cues |
JP6761598B2 (ja) * | 2016-10-24 | 2020-09-30 | 富士ゼロックス株式会社 | 感情推定システム、感情推定モデル生成システム |
CN108962255B (zh) * | 2018-06-29 | 2020-12-08 | 北京百度网讯科技有限公司 | 语音会话的情绪识别方法、装置、服务器和存储介质 |
JP7279494B2 (ja) * | 2019-04-23 | 2023-05-23 | コニカミノルタ株式会社 | 会議支援装置、および会議支援システム |
JP7170594B2 (ja) * | 2019-06-25 | 2022-11-14 | Kddi株式会社 | 同一事象に対して時系列に発生した異なるメディアデータを統合した学習モデルを構築するプログラム、装置及び方法 |
-
1997
- 1997-02-14 JP JP9030576A patent/JP2967058B2/ja not_active Expired - Lifetime
Non-Patent Citations (5)
Title |
---|
IEICE Transactions on Informations and Systems,Vol.E79−D,No.6,June 1996,"Emotion Enhanced Face to Face Meetings Using the Concept of Virtual Space Teleconferencing"p.772−780 |
IEICE Transactions on Informations and Systems,Vol.E81−D,No.1,January 1998,"Use of Multimodal Information in Facial Emotion Recognition",p.105−114 |
電子情報通信学会技術研究報告 IE95−104,「臨場感通信会議システムの評価−感情認識と伝達について−」,P.31−36 |
電子情報通信学会技術研究報告 Vol.95,No.436,CS95−152,「臨場感通信会議システムの評価−感情認識と伝達について−」,P.31−36 |
電子情報通信学会技術研究報告 Vol.96,No.296,IE96−58,"Degree o Human Perception of Facial Emotions based on Audio and Video Information",p9−15,(1996/10/14) |
Also Published As
Publication number | Publication date |
---|---|
JPH10228295A (ja) | 1998-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2967058B2 (ja) | 階層的感情認識装置 | |
WO2022048403A1 (zh) | 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端 | |
De Silva et al. | Bimodal emotion recognition | |
Bruce | The role of the face in communication: Implications for videophone design | |
US10095918B2 (en) | System and method for interpreting interpersonal communication | |
Chen | Audiovisual speech processing | |
WO2022116977A1 (zh) | 目标对象的动作驱动方法、装置、设备及存储介质及计算机程序产品 | |
US9060095B2 (en) | Modifying an appearance of a participant during a video conference | |
US20160134840A1 (en) | Avatar-Mediated Telepresence Systems with Enhanced Filtering | |
Huang et al. | Bimodal emotion recognition by man and machine | |
JP7279494B2 (ja) | 会議支援装置、および会議支援システム | |
CN114187547A (zh) | 目标视频的输出方法及装置、存储介质及电子装置 | |
Liu et al. | Generation of nodding, head tilting and gazing for human–robot speech interaction | |
Ritschel et al. | Multimodal joke generation and paralinguistic personalization for a socially-aware robot | |
JP2021086415A (ja) | 仮想人物対話システム、映像生成方法、映像生成プログラム | |
JP2023099309A (ja) | アバターを通じて映像の音声を手話に通訳する方法、コンピュータ装置、およびコンピュータプログラム | |
JP7096626B2 (ja) | 情報抽出装置 | |
Lee et al. | AEGIS: A real-time multimodal augmented reality computer vision based system to assist facial expression recognition for individuals with autism spectrum disorder | |
Verma et al. | Animating expressive faces across languages | |
Frank et al. | Automatic pixel selection for optimizing facial expression recognition using eigenfaces | |
Faruquie et al. | Audio Driven Facial Animation For Audio-Visual Reality. | |
KR20190111642A (ko) | 실제 사진의 픽셀 기반의 토킹 헤드 애니메이션을 이용한 영상 처리 시스템 및 방법 | |
JP7465040B1 (ja) | コミュニケーション可視化システム | |
WO2024014318A1 (ja) | 学習モデル生成装置、推論処理装置、学習モデル生成方法および推論処理方法 | |
WO2022059088A1 (ja) | 人物評価情報生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990803 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080813 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090813 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100813 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110813 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120813 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120813 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130813 Year of fee payment: 14 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |