JP2012242528A - 対話評価装置、方法及びプログラム - Google Patents
対話評価装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2012242528A JP2012242528A JP2011110989A JP2011110989A JP2012242528A JP 2012242528 A JP2012242528 A JP 2012242528A JP 2011110989 A JP2011110989 A JP 2011110989A JP 2011110989 A JP2011110989 A JP 2011110989A JP 2012242528 A JP2012242528 A JP 2012242528A
- Authority
- JP
- Japan
- Prior art keywords
- dialogue
- user
- dialog
- evaluation function
- statistic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】対話データ記憶部1には、複数のユーザのそれぞれについての各対話の対話データが記憶されている。統計量抽出部2は、対話データから各複数のユーザの対話の所定の発言の数の平均値及び対話の長さの平均値を計算し、また、対話データから評価関数の説明変数となる統計量を抽出する。クラスタリング部3は、計算された対話の所定の発言の数の平均値及び対話の長さの平均値に基づいて複数のユーザをクラスタリングする。評価関数導出部4は、各クラスタに対応する評価関数を、その各クラスタに含まれるユーザについての統計量を説明変数としユーザ評定値を応答変数とする重回帰分析により導出する。
【選択図】図1
Description
(E1) 評価の対象となる対話の長さ
(E1)’ 現在の目標達成対話の長さと、現在の目標不達成対話の長さ
(E2) それまでに実行された対話における目標達成対話の長さの平均値と目標不達成対話の長さの平均値
(E3) (E1)から一つ前の対話までに実行された対話の長さの平均値を引いた値
(Q1) 評価の対象となる対話における所定の発言についての単位時間発言数
(Q2) それまでに実行された対話における所定の発言についての単位時間発言数の平均値
(Q3) (Q1)から一つ前の対話までに実行された対話における所定の発言についての単位時間発言数の平均値を引いた値
(Q4) それまでに実行された対話における対話トピックごとの目標達成対話についての分布エントロピー
Xスポーツ=スポーツの対話トピックの目標達成対話の生起数
X文学・芸術=文学・芸術の対話トピックの目標達成対話の生起数
X政治=政治の対話トピックの目標達成対話の生起数
X歴史上の人物=歴史上の人物の対話トピックの目標達成対話の生起数
X合計=X芸能+Xスポーツ+X文学・芸術+X政治+X歴史上の人物
P(芸能)=X芸能/X合計
P(スポーツ)=Xスポーツ/X合計
P(文学・芸術)=X文学・芸術/X合計
P(政治)=X政治/X合計
P(歴史上の人物)=X歴史上の人物/X合計
HG(SuccessfulDialog)=-ΣAi∈ΩP(Ai)log2P(Ai)
ただし、Ω={A1,…,Ai,…,AN}
なお、P(Ai)が0のとき、P(Ai)log2P(Ai)は0と定義する。
HG(SuccessfulDialog)=-ΣAi∈ΩP(Ai)log2P(Ai)
ただし、Ω={芸能,スポーツ,文学・芸術,政治,歴史上の人物}
(S1) 評価の対象となる対話が目標達成対話ならば1、さもなければ0となる変数の値
(S2) それまでに実行された対話における目標達成対話の割合
(S3) (S1)から一つ前の対話までに実行された対話における目標達成対話の割合を引いた値
対話評価装置の各部間のデータのやり取りは直接行われてもよいし、図示していない記憶部を介して行われてもよい。
2 統計量抽出部
3 クラスタリング部
4 評価関数導出部
Claims (5)
- ユーザである人間と対話を行う対話システムの対話の質を評価する対話評価装置において、
対話に関するデータ及びその対話のユーザ評定値をその対話の対話データとして、複数のユーザのそれぞれについての各対話の対話データを記憶する対話データ記憶部と、
上記対話データから各上記複数のユーザの対話の所定の発言の数の平均値及び対話の長さの平均値を計算し、また、上記対話データから評価関数の説明変数となる統計量を抽出する統計量抽出部と、
上記計算された対話の所定の発言の数の平均値及び対話の長さの平均値に基づいて上記複数のユーザをクラスタリングするクラスタリング部と、
各クラスタに対応する評価関数を、その各クラスタに含まれるユーザについての上記統計量を説明変数とし上記ユーザ評定値を応答変数とする重回帰分析により導出する評価関数導出部と、
を含む対話評価装置。 - 請求項1の対話評価装置において、
上記統計量は、上記評価関数による評価の対象となる対話及び当該対話より前に実行された対話の対話データから抽出される統計量を含む、
対話評価装置。 - 請求項1及び2の対話評価装置において、
上記対話は、複数の対話トピックに属するとし、ユーザが所定の目標を達成した対話を目標達成対話として、
上記統計量は、対話トピックごとの目標達成対話についての分布エントロピーを含む、
対話評価装置。 - ユーザである人間と対話を行う対話システムの対話の質を評価する対話評価方法において、
対話データ記憶部には、対話に関するデータ及びその対話のユーザ評定値をその対話の対話データとして、複数のユーザのそれぞれについての各対話の対話データが記憶されており、
統計量抽出部が、上記対話データから各上記複数のユーザの対話の所定の発言の数の平均値及び対話の長さの平均値を計算し、また、上記対話データから評価関数の説明変数となる統計量を抽出する統計量抽出ステップと、
クラスタリング部が、上記計算された対話の所定の発言の数の平均値及び対話の長さの平均値に基づいて上記複数のユーザをクラスタリングするクラスタリングステップと、
評価関数導出部が、各クラスタに対応する評価関数を、その各クラスタに含まれるユーザについての上記統計量を説明変数とし上記ユーザ評定値を応答変数とする重回帰分析により導出する評価関数導出ステップと、
を含む対話評価方法。 - 請求項1から3の何れかの対話評価装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011110989A JP5783793B2 (ja) | 2011-05-18 | 2011-05-18 | 対話評価装置、方法及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011110989A JP5783793B2 (ja) | 2011-05-18 | 2011-05-18 | 対話評価装置、方法及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012242528A true JP2012242528A (ja) | 2012-12-10 |
| JP5783793B2 JP5783793B2 (ja) | 2015-09-24 |
Family
ID=47464321
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011110989A Active JP5783793B2 (ja) | 2011-05-18 | 2011-05-18 | 対話評価装置、方法及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5783793B2 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019215493A (ja) * | 2018-06-14 | 2019-12-19 | Zホールディングス株式会社 | 学習装置、学習方法および学習プログラム |
| JP2020524346A (ja) * | 2018-04-17 | 2020-08-13 | 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co.,Ltd. | 短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体 |
| CN114969195A (zh) * | 2022-05-27 | 2022-08-30 | 北京百度网讯科技有限公司 | 对话内容挖掘方法和对话内容评估模型的生成方法 |
| KR102654344B1 (ko) * | 2023-11-28 | 2024-04-03 | 주식회사 커먼컴퓨터 | 블록체인 기반의 챗봇 평가 방법 및 시스템 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003345816A (ja) * | 2002-05-22 | 2003-12-05 | Nippon Telegr & Teleph Corp <Ntt> | 対話理解評価方法、対話理解評価装置、対話理解評価プログラム、記憶媒体 |
-
2011
- 2011-05-18 JP JP2011110989A patent/JP5783793B2/ja active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003345816A (ja) * | 2002-05-22 | 2003-12-05 | Nippon Telegr & Teleph Corp <Ntt> | 対話理解評価方法、対話理解評価装置、対話理解評価プログラム、記憶媒体 |
Non-Patent Citations (2)
| Title |
|---|
| JPN7014000796; Marilyn A. Walker, et al.: 'PARADISE: A framework for evaluating Spoken Dialogue Agents' EACL '97 Proceedings of the eighth conference on European chapter of the Association for Computation , 19970707, pp.271-280, the Association for Computational Linguistics * |
| JPN7014000797; Marilyn Walker, et al.: 'Towards developing general models of usability with PARADISE' Natural Language Engeneering vol.6, no.3-4, 200009, pp.363-377, Cambridge University Press * |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020524346A (ja) * | 2018-04-17 | 2020-08-13 | 平安科技(深▲せん▼)有限公司Ping An Technology (Shenzhen) Co.,Ltd. | 短期利益を予測する方法、装置、コンピューターデバイス、プログラムおよび記憶媒体 |
| JP2019215493A (ja) * | 2018-06-14 | 2019-12-19 | Zホールディングス株式会社 | 学習装置、学習方法および学習プログラム |
| JP7013332B2 (ja) | 2018-06-14 | 2022-01-31 | ヤフー株式会社 | 学習装置、学習方法および学習プログラム |
| CN114969195A (zh) * | 2022-05-27 | 2022-08-30 | 北京百度网讯科技有限公司 | 对话内容挖掘方法和对话内容评估模型的生成方法 |
| CN114969195B (zh) * | 2022-05-27 | 2023-10-27 | 北京百度网讯科技有限公司 | 对话内容挖掘方法和对话内容评估模型的生成方法 |
| KR102654344B1 (ko) * | 2023-11-28 | 2024-04-03 | 주식회사 커먼컴퓨터 | 블록체인 기반의 챗봇 평가 방법 및 시스템 |
| WO2025116179A1 (ko) * | 2023-11-28 | 2025-06-05 | 주식회사 커먼컴퓨터 | 블록체인 기반의 챗봇 평가 방법 및 시스템 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP5783793B2 (ja) | 2015-09-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Litman et al. | Designing and evaluating an adaptive spoken dialogue system | |
| Lala et al. | Evaluation of real-time deep learning turn-taking models for multiple dialogue scenarios | |
| US10027804B2 (en) | System and method for providing hiring recommendations of agents within a call center | |
| US8694307B2 (en) | Method and apparatus for temporal speech scoring | |
| Ivanov et al. | Recognition of Personality Traits from Human Spoken Conversations. | |
| CN110610705A (zh) | 一种基于人工智能的语音交互提示器 | |
| Murray et al. | Learning backchanneling behaviors for a social robot via data augmentation from human-human conversations | |
| Hara et al. | Turn-Taking Prediction Based on Detection of Transition Relevance Place. | |
| JP2010140282A (ja) | 対話装置、対話方法、対話プログラムおよび記録媒体 | |
| JP5783793B2 (ja) | 対話評価装置、方法及びプログラム | |
| Dehbozorgi et al. | Sentiment analysis on conversations in collaborative active learning as an early predictor of performance | |
| Lala et al. | Analysis of Effect and Timing of Fillers in Natural Turn-Taking. | |
| de Kok et al. | A survey on evaluation metrics for backchannel prediction models | |
| EP4093005A1 (en) | System method and apparatus for combining words and behaviors | |
| Yamamoto et al. | Character expression for spoken dialogue systems with semi-supervised learning using Variational Auto-Encoder | |
| Yamamoto et al. | Dialogue behavior control model for expressing a character of humanoid robots | |
| CN120356628A (zh) | 一种基于多模态大模型和认知行为疗法的智能心理咨询系统 | |
| Patel et al. | Google duplex-a big leap in the evolution of artificial intelligence | |
| Saito et al. | Estimating User's Attitude in Multimodal Conversational System for Elderly People with Dementia. | |
| JP7643552B2 (ja) | 対話評価装置、対話評価方法、及びプログラム | |
| Elbarougy et al. | Feature selection method for real-time speech emotion recognition | |
| Shahverdi et al. | Learning turn-taking behavior from human demonstrations for social human-robot interactions | |
| Fang et al. | Estimation of cohesion with feature categorization on small scale groups | |
| Vanderlyn et al. | Investigating the effect of mental models in user interaction with an adaptive dialog agent | |
| KR102851477B1 (ko) | Ai 기반 통화 품질 평가 및 개선안 제공 방법 및 시스템 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130829 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140220 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140311 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140507 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141202 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141226 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150714 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150721 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5783793 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |