JP6852161B2 - 満足度推定モデル学習装置、満足度推定装置、満足度推定モデル学習方法、満足度推定方法、およびプログラム - Google Patents
満足度推定モデル学習装置、満足度推定装置、満足度推定モデル学習方法、満足度推定方法、およびプログラム Download PDFInfo
- Publication number
- JP6852161B2 JP6852161B2 JP2019530606A JP2019530606A JP6852161B2 JP 6852161 B2 JP6852161 B2 JP 6852161B2 JP 2019530606 A JP2019530606 A JP 2019530606A JP 2019530606 A JP2019530606 A JP 2019530606A JP 6852161 B2 JP6852161 B2 JP 6852161B2
- Authority
- JP
- Japan
- Prior art keywords
- satisfaction
- utterance
- dialogue
- estimation model
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Description
〔参考文献1〕R. Caruana, “Multitask Learning,” Machine Learning, vol. 28, no. 1, pp.41-75, 1997.
実施形態の満足度推定モデル学習装置1は、図4に示すように、学習データ記憶部10、音声区間検出部11、特徴量抽出部12、モデル学習部13、および満足度推定モデル記憶部20を含む。満足度推定モデル学習装置1は、学習データ記憶部10に記憶された学習データを用いて満足度推定モデルを学習し、学習済みの満足度推定モデルを満足度推定モデル記憶部20へ記憶する。満足度推定モデル学習装置1が図5に示す各ステップの処理を行うことにより実施形態の満足度推定モデル学習方法が実現される。
満足度推定装置2は、図6に示すように、満足度推定モデル記憶部20、音声区間検出部21、特徴量抽出部22、および満足度推定部23を含む。満足度推定装置2は、満足度を推定する対象となる対話の音声を収録した対話音声を入力とし、満足度推定モデル記憶部20に記憶された満足度推定モデルを用いて、その対話に含まれる各発話の発話満足度とその対話の対話満足度を推定し、発話満足度の推定値による系列と対話満足度の推定値を出力する。満足度推定装置2が図7に示す各ステップの処理を行うことにより実施形態の満足度推定方法が実現される。
上述の実施形態では、満足度推定モデル学習装置1と満足度推定装置2を別個の装置として構成する例を説明したが、満足度推定モデルを学習する機能と学習済みの満足度推定モデルを用いて満足度を推定する機能とを兼ね備えた1台の満足度推定装置を構成することも可能である。すなわち、変形例の満足度推定装置は、学習データ記憶部10、音声区間検出部11、特徴量抽出部12、モデル学習部13、満足度推定モデル記憶部20、および満足度推定部23を含む。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
Claims (9)
- 複数の発話からなる対話を収録した対話音声と、上記対話に対する対話満足度の正解値と、上記対話に含まれる各発話に対する発話満足度の正解値とからなる学習データを記憶する学習データ記憶部と、
上記対話音声から抽出した発話ごとの特徴量と上記発話満足度の正解値と上記対話満足度の正解値とを用いて、発話ごとの特徴量を入力として発話ごとの発話満足度を推定する発話満足度推定モデル部分と、少なくとも発話ごとの発話満足度を入力として対話満足度を推定する対話満足度推定モデル部分とを連結した満足度推定モデルを学習するモデル学習部と、
を含む満足度推定モデル学習装置。 - 請求項1に記載の満足度推定モデル学習装置であって、
上記発話満足度推定モデル部分は、1個の発話に対して1個の発話満足度推定器を構成するものであり、
上記発話満足度推定器は、上記発話ごとの特徴量を入力とし、当該発話の前の発話または前後の発話に関する情報を用いて、当該発話の発話満足度を推定して出力するものであり、
上記対話満足度推定モデル部分は、1個の発話満足度推定器に対して1個の対話満足度推定器を構成するものであり、
上記対話満足度推定器は、上記発話満足度推定器が出力する発話満足度と、当該発話満足度に付随し対話満足度の推定に寄与する情報とを入力とし、当該発話の前の発話に関する情報を用いて、上記対話に含まれる最初の発話から当該発話までの対話満足度を推定して出力するものである、
満足度推定モデル学習装置。 - 請求項2に記載の満足度推定モデル学習装置であって、
上記発話満足度推定器および上記対話満足度推定器は、入力ゲートと出力ゲート、入力ゲートと出力ゲートと忘却ゲート、リセットゲートと更新ゲート、のいずれかを備えることを特徴とする、
満足度推定モデル学習装置。 - 請求項1から3のいずれかに記載の満足度推定モデル学習装置であって、
上記満足度推定モデルの損失関数は、上記発話満足度推定モデル部分の損失関数と上記対話満足度推定モデル部分の損失関数との重み付き和であり、上記発話満足度推定モデル部分の損失関数と上記対話満足度推定モデル部分の損失関数との重みを調整可能としたものである、
満足度推定モデル学習装置。 - 請求項1から4のいずれかに記載の満足度推定モデル学習装置により学習した満足度推定モデルを記憶するモデル記憶部と、
複数の発話からなる対話を収録した対話音声から抽出した発話ごとの特徴量を上記満足度推定モデルに入力して各発話に対する発話満足度および上記対話に対する対話満足度を推定する満足度推定部と、
を含む満足度推定装置。 - 学習データ記憶部に、複数の発話からなる対話を収録した対話音声と、上記対話に対する対話満足度の正解値と、上記対話に含まれる各発話に対する発話満足度の正解値とからなる学習データが記憶されており、
モデル学習部が、上記対話音声から抽出した発話ごとの特徴量と上記発話満足度の正解値と上記対話満足度の正解値とを用いて、発話ごとの特徴量を入力として発話ごとの発話満足度を推定する発話満足度推定モデル部分と、少なくとも発話ごとの発話満足度を入力として対話満足度を推定する対話満足度推定モデル部分とを連結した満足度推定モデルを学習する、
満足度推定モデル学習方法。 - モデル記憶部に、請求項6に記載の満足度推定モデル学習方法により学習した満足度推定モデルが記憶されており、
満足度推定部が、複数の発話からなる対話を収録した対話音声から抽出した発話ごとの特徴量を上記満足度推定モデルに入力して各発話に対する発話満足度および上記対話に対する対話満足度を推定する、
満足度推定方法。 - 請求項1から4のいずれかに記載の満足度推定モデル学習装置としてコンピュータを機能させるためのプログラム。
- 請求項5に記載の満足度推定装置としてコンピュータを機能させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141790 | 2017-07-21 | ||
JP2017141790 | 2017-07-21 | ||
PCT/JP2018/027211 WO2019017462A1 (ja) | 2017-07-21 | 2018-07-20 | 満足度推定モデル学習装置、満足度推定装置、満足度推定モデル学習方法、満足度推定方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019017462A1 JPWO2019017462A1 (ja) | 2020-07-30 |
JP6852161B2 true JP6852161B2 (ja) | 2021-03-31 |
Family
ID=65015511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019530606A Active JP6852161B2 (ja) | 2017-07-21 | 2018-07-20 | 満足度推定モデル学習装置、満足度推定装置、満足度推定モデル学習方法、満足度推定方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11557311B2 (ja) |
JP (1) | JP6852161B2 (ja) |
WO (1) | WO2019017462A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7293826B2 (ja) * | 2019-04-09 | 2023-06-20 | 富士通株式会社 | 問題検出装置、問題検出方法および問題検出プログラム |
RU2720359C1 (ru) * | 2019-04-16 | 2020-04-29 | Хуавэй Текнолоджиз Ко., Лтд. | Способ и оборудование распознавания эмоций в речи |
US11928611B2 (en) * | 2019-11-18 | 2024-03-12 | International Business Machines Corporation | Conversational interchange optimization |
CN110728997B (zh) * | 2019-11-29 | 2022-03-22 | 中国科学院深圳先进技术研究院 | 一种基于情景感知的多模态抑郁症检测系统 |
JPWO2022097204A1 (ja) * | 2020-11-04 | 2022-05-12 | ||
CN113516304B (zh) * | 2021-06-29 | 2024-01-23 | 上海师范大学 | 基于时空图网络的区域污染物时空联合预测方法及装置 |
JP7017822B1 (ja) * | 2021-08-27 | 2022-02-09 | 株式会社インタラクティブソリューションズ | コンピュータを用いた会話支援方法 |
JP7231894B1 (ja) | 2021-08-27 | 2023-03-02 | 株式会社インタラクティブソリューションズ | コンピュータを用いた会話支援方法 |
WO2023119675A1 (ja) * | 2021-12-24 | 2023-06-29 | 日本電信電話株式会社 | 推定方法、推定装置及び推定プログラム |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4728868B2 (ja) * | 2006-04-18 | 2011-07-20 | 日本電信電話株式会社 | 応対評価装置、その方法、プログラムおよびその記録媒体 |
JP2011210133A (ja) * | 2010-03-30 | 2011-10-20 | Seiko Epson Corp | 満足度算出方法、満足度算出装置およびプログラム |
WO2014069076A1 (ja) * | 2012-10-31 | 2014-05-08 | 日本電気株式会社 | 会話分析装置及び会話分析方法 |
US20150286627A1 (en) * | 2014-04-03 | 2015-10-08 | Adobe Systems Incorporated | Contextual sentiment text analysis |
US10664661B2 (en) * | 2014-09-12 | 2020-05-26 | Nextiva, Inc. | System and method for monitoring a sentiment score |
US9786270B2 (en) * | 2015-07-09 | 2017-10-10 | Google Inc. | Generating acoustic models |
CN110476206B (zh) * | 2017-03-29 | 2021-02-02 | 谷歌有限责任公司 | 将文本转换为语音的系统及其存储介质 |
US20190005421A1 (en) * | 2017-06-28 | 2019-01-03 | RankMiner Inc. | Utilizing voice and metadata analytics for enhancing performance in a call center |
-
2018
- 2018-07-20 JP JP2019530606A patent/JP6852161B2/ja active Active
- 2018-07-20 US US16/630,896 patent/US11557311B2/en active Active
- 2018-07-20 WO PCT/JP2018/027211 patent/WO2019017462A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US11557311B2 (en) | 2023-01-17 |
JPWO2019017462A1 (ja) | 2020-07-30 |
US20200152178A1 (en) | 2020-05-14 |
WO2019017462A1 (ja) | 2019-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6852161B2 (ja) | 満足度推定モデル学習装置、満足度推定装置、満足度推定モデル学習方法、満足度推定方法、およびプログラム | |
US10176811B2 (en) | Neural network-based voiceprint information extraction method and apparatus | |
US10417329B2 (en) | Dialogue act estimation with learning model | |
US10789943B1 (en) | Proxy for selective use of human and artificial intelligence in a natural language understanding system | |
CN109964270B (zh) | 用于关键短语识别的系统和方法 | |
JP6780033B2 (ja) | モデル学習装置、推定装置、それらの方法、およびプログラム | |
JP6732703B2 (ja) | 感情インタラクションモデル学習装置、感情認識装置、感情インタラクションモデル学習方法、感情認識方法、およびプログラム | |
JP6615736B2 (ja) | 音声言語識別装置、その方法、及びプログラム | |
JP7229847B2 (ja) | 対話装置、対話方法、及び対話コンピュータプログラム | |
JP6553015B2 (ja) | 話者属性推定システム、学習装置、推定装置、話者属性推定方法、およびプログラム | |
CN111897935A (zh) | 基于知识图谱的话术路径选择方法、装置和计算机设备 | |
JP6845489B2 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
US9697825B2 (en) | Audio recording triage system | |
US20230069908A1 (en) | Recognition apparatus, learning apparatus, methods and programs for the same | |
WO2022097204A1 (ja) | 満足度推定モデル適応装置、満足度推定装置、それらの方法、およびプログラム | |
US20220122584A1 (en) | Paralinguistic information estimation model learning apparatus, paralinguistic information estimation apparatus, and program | |
US11798578B2 (en) | Paralinguistic information estimation apparatus, paralinguistic information estimation method, and program | |
JP7420211B2 (ja) | 感情認識装置、感情認識モデル学習装置、それらの方法、およびプログラム | |
CN113327596B (zh) | 语音识别模型的训练方法、语音识别方法和装置 | |
JP7216348B2 (ja) | 音声処理装置、音声処理方法、および音声処理プログラム | |
WO2022176124A1 (ja) | 学習装置、推定装置、それらの方法、およびプログラム | |
US20240055018A1 (en) | Iterative speech recognition with semantic interpretation | |
CN114387949A (zh) | 一种语音识别的置信度估计方法、装置及计算机设备 | |
JP2021032920A (ja) | パラ言語情報推定装置、学習装置、それらの方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210309 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210310 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6852161 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |