JP2018159788A5 - 情報処理装置、感情認識方法、及び、プログラム - Google Patents
情報処理装置、感情認識方法、及び、プログラム Download PDFInfo
- Publication number
- JP2018159788A5 JP2018159788A5 JP2017056482A JP2017056482A JP2018159788A5 JP 2018159788 A5 JP2018159788 A5 JP 2018159788A5 JP 2017056482 A JP2017056482 A JP 2017056482A JP 2017056482 A JP2017056482 A JP 2017056482A JP 2018159788 A5 JP2018159788 A5 JP 2018159788A5
- Authority
- JP
- Japan
- Prior art keywords
- emotion
- voice
- score
- user
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001815 facial Effects 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 claims description 3
- 230000000875 corresponding Effects 0.000 claims 4
- 230000002996 emotional Effects 0.000 claims 2
- 230000001186 cumulative Effects 0.000 claims 1
- 238000001514 detection method Methods 0.000 claims 1
Description
本発明は、情報処理装置、感情認識方法、及び、プログラムに関する。
本発明は、上記の事情に鑑みてなされたものであり、ユーザの感情に適合しない処理の実行を抑制する情報処理装置、感情認識方法、及び、プログラムを提供することを目的とする。
上記目的を達成するため、本発明に係る情報処理装置は、
ユーザが発音した音声を取得する音声取得手段と、
感情毎に、前記音声を発音した際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る音声感情スコアを取得する音声感情スコア取得手段と、
前記音声が録音された際に撮像された前記ユーザの顔画像を取得する顔画像取得手段と、
感情毎に、前記顔画像が撮像された際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る顔感情スコアを取得する顔感情スコア取得手段と、
前記音声を音素列に変換する音素列変換手段と、
前記音声感情スコアと前記顔感情スコアとに基づいて、音素列のうち、前記ユーザの感情と関連度が高い音素列を感情音素列として抽出する抽出手段と、
前記抽出手段により抽出された感情音素列に基づいて、前記ユーザの感情認識に係る処理を実行する処理手段と、
を備えることを特徴とする。
ユーザが発音した音声を取得する音声取得手段と、
感情毎に、前記音声を発音した際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る音声感情スコアを取得する音声感情スコア取得手段と、
前記音声が録音された際に撮像された前記ユーザの顔画像を取得する顔画像取得手段と、
感情毎に、前記顔画像が撮像された際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る顔感情スコアを取得する顔感情スコア取得手段と、
前記音声を音素列に変換する音素列変換手段と、
前記音声感情スコアと前記顔感情スコアとに基づいて、音素列のうち、前記ユーザの感情と関連度が高い音素列を感情音素列として抽出する抽出手段と、
前記抽出手段により抽出された感情音素列に基づいて、前記ユーザの感情認識に係る処理を実行する処理手段と、
を備えることを特徴とする。
本発明によれば、ユーザの感情に適合しない処理の実行を抑制する情報処理装置、感情認識方法、及び、プログラムを提供することができる。
Claims (8)
- ユーザが発音した音声を取得する音声取得手段と、
感情毎に、前記音声を発音した際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る音声感情スコアを取得する音声感情スコア取得手段と、
前記音声が録音された際に撮像された前記ユーザの顔画像を取得する顔画像取得手段と、
感情毎に、前記顔画像が撮像された際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る顔感情スコアを取得する顔感情スコア取得手段と、
前記音声を音素列に変換する音素列変換手段と、
前記音声感情スコアと前記顔感情スコアとに基づいて、音素列のうち、前記ユーザの感情と関連度が高い音素列を感情音素列として抽出する抽出手段と、
前記抽出手段により抽出された感情音素列に基づいて、前記ユーザの感情認識に係る処理を実行する処理手段と、
を備えることを特徴とする情報処理装置。 - 前記音声感情スコア取得手段は、音素列に応じて、感情毎に、当該音素列に対応する音声を発音した際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る音声感情スコアを取得し、
音素列に対応付けて、感情毎に、当該音素列に対応する音声に応じた当該感情に係る前記音声感情スコア及び前記顔感情スコアが検出条件を満たすと判定された回数の累積値である、当該感情に係る感情頻度を含む頻度データを取得する頻度データ取得手段と、
音素列と感情との関連度を前記頻度データに従って評価することにより、当該音素列が前記感情音素列であるか否かを判定する判定手段と、
をさらに備え、
前記抽出手段は、前記判定手段による判定に従って前記感情音素列を抽出することを特徴とする請求項1に記載の情報処理装置。 - 前記判定手段は、音素列のうち、当該音素列と感情との関連度が有意に高いことと、当該音素列に対応付けて前記頻度データに含まれている各感情に係る前記感情頻度の合計値に対する当該音素列に対応付けて前記頻度データに含まれている当該感情に係る前記感情頻度の割合が学習閾値以上であることと、のうち少なくとも何れか一方の条件を満たす音素列を感情音素列であると判定することを特徴とする請求項2に記載の情報処理装置。
- 前記感情音素列と感情との関連度に応じた調整スコアを生成する調整スコア生成手段をさらに備えることを特徴とする請求項2又は3に記載の情報処理装置。
- 前記処理手段は、前記調整スコアに従って前記ユーザの感情を認識することを特徴とする請求項4に記載の情報処理装置。
- 前記処理手段は、前記調整スコアに従って前記音声感情スコア及び前記顔感情スコアの計算に用いるパラメータを更新することを特徴とする請求項4又は5に記載の情報処理装置。
- 情報処理装置の感情認識方法であって、
ユーザが発音した音声を取得する音声取得ステップと、
感情毎に、前記音声を発音した際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る音声感情スコアを取得する音声感情スコア取得ステップと、
前記音声が録音された際に撮像された前記ユーザの顔画像を取得する顔画像取得ステップと、
感情毎に、前記顔画像が撮像された際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る顔感情スコアを取得する顔感情スコア取得ステップと、
前記音声を音素列に変換する音素列変換ステップと、
前記音声感情スコアと前記顔感情スコアとに基づいて、音素列のうち、前記ユーザの感情と関連度が高い音素列を感情音素列として抽出する抽出ステップと、
前記抽出ステップにより抽出された感情音素列に基づいて、前記ユーザの感情認識に係る処理を実行する処理ステップと、
を含むことを特徴とする感情認識方法。 - 情報処理装置のコンピュータを、
ユーザが発音した音声を取得する音声取得手段、
感情毎に、前記音声を発音した際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る音声感情スコアを取得する音声感情スコア取得手段、
前記音声が録音された際に撮像された前記ユーザの顔画像を取得する顔画像取得手段、
感情毎に、前記顔画像が撮像された際の前記ユーザの感情が当該感情である可能性の高さを示す当該感情に係る顔感情スコアを取得する顔感情スコア取得手段、
前記音声を音素列に変換する音素列変換手段、
前記音声感情スコアと前記顔感情スコアとに基づいて、音素列のうち、前記ユーザの感情と関連度が高い音素列を感情音素列として抽出する抽出手段、
前記抽出手段により抽出された感情音素列に基づいて、前記ユーザの感情認識に係る処理を実行する処理手段、
として機能させることを特徴とするプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017056482A JP6866715B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、感情認識方法、及び、プログラム |
US15/868,421 US20180277145A1 (en) | 2017-03-22 | 2018-01-11 | Information processing apparatus for executing emotion recognition |
CN201810092508.7A CN108630231B (zh) | 2017-03-22 | 2018-01-30 | 信息处理装置、感情识别方法以及存储介质 |
JP2021065068A JP7143916B2 (ja) | 2017-03-22 | 2021-04-07 | 情報処理装置、情報処理方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017056482A JP6866715B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、感情認識方法、及び、プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021065068A Division JP7143916B2 (ja) | 2017-03-22 | 2021-04-07 | 情報処理装置、情報処理方法、及び、プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018159788A JP2018159788A (ja) | 2018-10-11 |
JP2018159788A5 true JP2018159788A5 (ja) | 2020-03-26 |
JP6866715B2 JP6866715B2 (ja) | 2021-04-28 |
Family
ID=63583528
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017056482A Active JP6866715B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、感情認識方法、及び、プログラム |
JP2021065068A Active JP7143916B2 (ja) | 2017-03-22 | 2021-04-07 | 情報処理装置、情報処理方法、及び、プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021065068A Active JP7143916B2 (ja) | 2017-03-22 | 2021-04-07 | 情報処理装置、情報処理方法、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20180277145A1 (ja) |
JP (2) | JP6866715B2 (ja) |
CN (1) | CN108630231B (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11017239B2 (en) * | 2018-02-12 | 2021-05-25 | Positive Iq, Llc | Emotive recognition and feedback system |
JP7192222B2 (ja) * | 2018-03-08 | 2022-12-20 | トヨタ自動車株式会社 | 発話システム |
US11127181B2 (en) * | 2018-09-19 | 2021-09-21 | XRSpace CO., LTD. | Avatar facial expression generating system and method of avatar facial expression generation |
CN111145871A (zh) * | 2018-11-02 | 2020-05-12 | 京东方科技集团股份有限公司 | 情绪干预方法、装置和系统,以及计算机可读存储介质 |
AU2020211809A1 (en) * | 2019-01-25 | 2021-07-29 | Soul Machines Limited | Real-time generation of speech animation |
CA3157835A1 (en) * | 2019-10-30 | 2021-05-06 | Lululemon Athletica Canada Inc. | Method and system for an interface to provide activity recommendations |
CN110910903B (zh) * | 2019-12-04 | 2023-03-21 | 深圳前海微众银行股份有限公司 | 语音情绪识别方法、装置、设备及计算机可读存储介质 |
CN113126951B (zh) * | 2021-04-16 | 2024-05-17 | 深圳地平线机器人科技有限公司 | 音频播放方法、装置、计算机可读存储介质及电子设备 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001157976A (ja) * | 1999-11-30 | 2001-06-12 | Sony Corp | ロボット制御装置およびロボット制御方法、並びに記録媒体 |
JP2001215993A (ja) * | 2000-01-31 | 2001-08-10 | Sony Corp | 対話処理装置および対話処理方法、並びに記録媒体 |
TWI221574B (en) * | 2000-09-13 | 2004-10-01 | Agi Inc | Sentiment sensing method, perception generation method and device thereof and software |
JP2003248841A (ja) * | 2001-12-20 | 2003-09-05 | Matsushita Electric Ind Co Ltd | バーチャルテレビ通話装置 |
JP2004310034A (ja) * | 2003-03-24 | 2004-11-04 | Matsushita Electric Works Ltd | 対話エージェントシステム |
JP4403859B2 (ja) * | 2004-03-30 | 2010-01-27 | セイコーエプソン株式会社 | 感情マッチング装置 |
JP4456537B2 (ja) * | 2004-09-14 | 2010-04-28 | 本田技研工業株式会社 | 情報伝達装置 |
US7983910B2 (en) * | 2006-03-03 | 2011-07-19 | International Business Machines Corporation | Communicating across voice and text channels with emotion preservation |
JP4085130B2 (ja) * | 2006-06-23 | 2008-05-14 | 松下電器産業株式会社 | 感情認識装置 |
US20080096533A1 (en) * | 2006-10-24 | 2008-04-24 | Kallideas Spa | Virtual Assistant With Real-Time Emotions |
JP5326843B2 (ja) * | 2009-06-11 | 2013-10-30 | 日産自動車株式会社 | 感情推定装置及び感情推定方法 |
TWI395201B (zh) * | 2010-05-10 | 2013-05-01 | Univ Nat Cheng Kung | 情緒語音辨識方法及系統 |
JP5496863B2 (ja) * | 2010-11-25 | 2014-05-21 | 日本電信電話株式会社 | 感情推定装置、その方法、プログラム及びその記録媒体 |
JP5694976B2 (ja) * | 2012-02-27 | 2015-04-01 | 日本電信電話株式会社 | 分散補正パラメータ推定装置、音声認識システム、分散補正パラメータ推定方法、音声認識方法及びプログラム |
US9020822B2 (en) * | 2012-10-19 | 2015-04-28 | Sony Computer Entertainment Inc. | Emotion recognition using auditory attention cues extracted from users voice |
US9031293B2 (en) * | 2012-10-19 | 2015-05-12 | Sony Computer Entertainment Inc. | Multi-modal sensor based emotion recognition and emotional interface |
CN103903627B (zh) * | 2012-12-27 | 2018-06-19 | 中兴通讯股份有限公司 | 一种语音数据的传输方法及装置 |
JP6033136B2 (ja) * | 2013-03-18 | 2016-11-30 | 三菱電機株式会社 | 情報処理装置およびナビゲーション装置 |
WO2015107681A1 (ja) * | 2014-01-17 | 2015-07-23 | 任天堂株式会社 | 情報処理システム、情報処理サーバ、情報処理プログラム、および情報提供方法 |
US10884503B2 (en) * | 2015-12-07 | 2021-01-05 | Sri International | VPA with integrated object recognition and facial expression recognition |
WO2017112813A1 (en) * | 2015-12-22 | 2017-06-29 | Sri International | Multi-lingual virtual personal assistant |
-
2017
- 2017-03-22 JP JP2017056482A patent/JP6866715B2/ja active Active
-
2018
- 2018-01-11 US US15/868,421 patent/US20180277145A1/en not_active Abandoned
- 2018-01-30 CN CN201810092508.7A patent/CN108630231B/zh active Active
-
2021
- 2021-04-07 JP JP2021065068A patent/JP7143916B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018159788A5 (ja) | 情報処理装置、感情認識方法、及び、プログラム | |
JP6754184B2 (ja) | 音声認識装置及び音声認識方法 | |
CN107492382B (zh) | 基于神经网络的声纹信息提取方法及装置 | |
WO2018108080A1 (zh) | 一种基于声纹搜索的信息推荐方法及装置 | |
TWI473080B (zh) | The use of phonological emotions or excitement to assist in resolving the gender or age of speech signals | |
US20170154640A1 (en) | Method and electronic device for voice recognition based on dynamic voice model selection | |
JP7143916B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
KR20130133858A (ko) | 청각 주의 큐를 사용하여 스피치 음절/모음/음의 경계 검출 | |
CN103959761B (zh) | 摄像装置以及信息处理装置 | |
CN111951825A (zh) | 一种发音测评方法、介质、装置和计算设备 | |
CN113076847B (zh) | 一种多模态情感识别方法及系统 | |
KR20170073113A (ko) | 음성의 톤, 템포 정보를 이용한 감정인식 방법 및 그 장치 | |
KR20140066640A (ko) | 다국어 음향 모델 구축 장치 및 이의 다국어 음향 모델 구축 방법, 그리고 그 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능 매체 | |
US20150058005A1 (en) | Automatic Collection of Speaker Name Pronunciations | |
JP2018173818A5 (ja) | ||
JP2018180334A (ja) | 感情認識装置、方法およびプログラム | |
CN111179919B (zh) | 一种确定失语类型的方法及装置 | |
JP6276513B2 (ja) | 音声認識装置および音声認識プログラム | |
CN104240698A (zh) | 一种语音识别的方法 | |
CN112466287B (zh) | 一种语音分割方法、装置以及计算机可读存储介质 | |
CN111950327A (zh) | 口型纠正方法、装置、介质和计算设备 | |
JP2015055653A (ja) | 音声認識装置及び方法、並びに、電子機器 | |
JP2017187676A5 (ja) | ||
JP4775961B2 (ja) | 映像を用いた発音の推定方法 | |
US11961510B2 (en) | Information processing apparatus, keyword detecting apparatus, and information processing method |