JP2016045769A - 対話システム評価方法、対話システム評価装置及びプログラム - Google Patents
対話システム評価方法、対話システム評価装置及びプログラム Download PDFInfo
- Publication number
- JP2016045769A JP2016045769A JP2014170516A JP2014170516A JP2016045769A JP 2016045769 A JP2016045769 A JP 2016045769A JP 2014170516 A JP2014170516 A JP 2014170516A JP 2014170516 A JP2014170516 A JP 2014170516A JP 2016045769 A JP2016045769 A JP 2016045769A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- evaluation value
- evaluation
- input
- sentences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
第一実施形態の対話システム評価装置1は、図1に示すように、リファレンス文データベース10、出力文取得部11、文間類似度計算部12及び評価値計算部13を例えば含む。
第二実施形態の対話システム評価装置2は、図3に示すように、出力文取得部11及び文間類似度計算部12を第一実施形態と同様に含み、リファレンス文データベース20及び評価値計算部23をさらに含む。
第三実施形態の対話システム評価装置3は、図3に示すように、リファレンス文データベース20、出力文取得部11及び文間類似度計算部12を第二実施形態と同様に含み、評価値計算部33をさらに含む。
第四実施形態の対話システム評価装置4は、図5に示すように、リファレンス文データベース20、出力文取得部11及び文間類似度計算部12を第三実施形態と同様に含み、学習データ記憶部40、回帰モデル学習部41、回帰モデルパラメータ記憶部42、特徴量抽出部43及び評価値計算部44をさらに含む。
第五実施形態の対話システム評価装置5は、図7に示すように、出力文取得部11、文間類似度計算部12、学習データ記憶部30、特徴量抽出部43を第四実施形態と同様に含み、リファレンス文データベース50、分類モデル学習部51、分類モデルパラメータ記憶部52及び評価値計算部54をさらに含む。
上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
9 対話システム
10、20、50 リファレンス文データベース
11 出力文取得部
12 文間類似度計算部
13、23、33、44、54 評価値計算部
40 学習データ記憶部
41 回帰モデル学習部
42 回帰モデルパラメータ記憶部
43 特徴量抽出部
51 分類モデル学習部
52 分類モデルパラメータ記憶部
Claims (8)
- 出力文取得部が、特定のタスクをもたない対話システムへ入力文を入力し、上記対話システムからのシステム出力文を得る出力文取得ステップと、
評価値計算部が、上記入力文に対して予め定めたリファレンス文に基づいて上記システム出力文を評価するシステム評価値を計算する評価値計算ステップと、
を含む対話システム評価方法。 - 請求項1に記載の対話システム評価方法であって、
リファレンス文データベースに、上記入力文と上記入力文ごとに予め定めた複数の上記リファレンス文とが記憶されており、
上記評価値計算ステップは、上記入力文に対応する複数の上記リファレンス文と上記システム出力文とに基づいて、上記システム出力文ごとに上記システム評価値を計算するものである
対話システム評価方法。 - 請求項2に記載の対話システム評価方法であって、
文間類似度計算部が、上記システム出力文と上記リファレンス文それぞれとの間で文間の類似度を計算する文間類似度計算ステップをさらに含み、
上記評価値計算ステップは、上記類似度が高い方から所定の数の上記リファレンス文を選択し、選択された上記リファレンス文の上記類似度の平均値を上記システム評価値として計算するものである
対話システム評価方法。 - 請求項2に記載の対話システム評価方法であって、
上記リファレンス文データベースに、上記リファレンス文ごとに付与された評価値がさらに記憶されており、
文間類似度計算部が、上記システム出力文と上記リファレンス文それぞれとの間で文間の類似度を計算する文間類似度計算ステップをさらに含み、
上記評価値計算ステップは、上記評価値と上記類似度に基づいて上記リファレンス文を選択し、選択した上記リファレンス文の類似度もしくは評価値の少なくとも一方を用いて上記システム評価値を計算するものである
対話システム評価方法。 - 請求項2に記載の対話システム評価方法であって、
上記リファレンス文データベースに、上記リファレンス文ごとに付与された評価値がさらに記憶されており、
回帰モデルパラメータ記憶部に、上記リファレンス文から抽出した特徴量と上記評価値とを用いて学習した、特徴量を入力すると当該特徴量に対応する評価値を出力する回帰モデルのパラメータが記憶されており、
上記評価値計算ステップは、上記システム出力文から抽出した特徴量を上記回帰モデルへ入力し、上記回帰モデルから出力される評価値を上記システム評価値とするものである
対話システム評価方法。 - 請求項2に記載の対話システム評価方法であって、
上記リファレンス文データベースに、上記リファレンス文のペアごとに適切な方を表す勝ち負けが評価値としてさらに記憶されており、
分類モデルパラメータ記憶部に、上記リファレンス文から抽出した特徴量と上記評価値とを用いて学習した、2つの特徴量を入力すると上記勝ち負けを出力する分類モデルのパラメータが記憶されており、
上記評価値計算ステップは、上記システム出力文から抽出した特徴量と上記リファレンス文から抽出した特徴量とを上記分類モデルへ入力し、上記分類モデルから出力される勝ち負けから計算した勝率を上記システム評価値とするものである
対話システム評価方法。 - 特定のタスクをもたない対話システムへ入力文を入力し、上記対話システムからのシステム出力文を得る出力文取得部と、
上記入力文に対して予め定めたリファレンス文に基づいて上記システム出力文を評価するシステム評価値を計算する評価値計算部と、
を含む対話システム評価装置。 - 請求項1から6のいずれかに記載の対話システム評価方法の各ステップをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014170516A JP6259377B2 (ja) | 2014-08-25 | 2014-08-25 | 対話システム評価方法、対話システム評価装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014170516A JP6259377B2 (ja) | 2014-08-25 | 2014-08-25 | 対話システム評価方法、対話システム評価装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016045769A true JP2016045769A (ja) | 2016-04-04 |
JP6259377B2 JP6259377B2 (ja) | 2018-01-10 |
Family
ID=55636263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014170516A Active JP6259377B2 (ja) | 2014-08-25 | 2014-08-25 | 対話システム評価方法、対話システム評価装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6259377B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472030A (zh) * | 2018-11-09 | 2019-03-15 | 科大讯飞股份有限公司 | 一种系统回复质量的评价方法及装置 |
CN110704597A (zh) * | 2019-09-29 | 2020-01-17 | 北京金山安全软件有限公司 | 对话系统可靠性校验方法、模型生成方法及装置 |
CN110941701A (zh) * | 2019-11-27 | 2020-03-31 | 珠海格力电器股份有限公司 | 语义分析样本集的优化方法、存储介质和计算设备 |
CN112036923A (zh) * | 2020-07-06 | 2020-12-04 | 北京嘀嘀无限科技发展有限公司 | 一种服务评价方法、系统、装置及存储介质 |
-
2014
- 2014-08-25 JP JP2014170516A patent/JP6259377B2/ja active Active
Non-Patent Citations (1)
Title |
---|
今井健太 他2名: "複数の対話システムから応答候補文を用いた最適応答文選択手法の性能評価", 情報処理学会研究報告[CD−ROM], vol. 2010 February, JPN6017027894, 15 February 2010 (2010-02-15), JP * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472030A (zh) * | 2018-11-09 | 2019-03-15 | 科大讯飞股份有限公司 | 一种系统回复质量的评价方法及装置 |
CN109472030B (zh) * | 2018-11-09 | 2023-11-24 | 科大讯飞股份有限公司 | 一种系统回复质量的评价方法及装置 |
CN110704597A (zh) * | 2019-09-29 | 2020-01-17 | 北京金山安全软件有限公司 | 对话系统可靠性校验方法、模型生成方法及装置 |
CN110704597B (zh) * | 2019-09-29 | 2022-07-29 | 北京金山安全软件有限公司 | 对话系统可靠性校验方法、模型生成方法及装置 |
CN110941701A (zh) * | 2019-11-27 | 2020-03-31 | 珠海格力电器股份有限公司 | 语义分析样本集的优化方法、存储介质和计算设备 |
CN110941701B (zh) * | 2019-11-27 | 2023-02-28 | 珠海格力电器股份有限公司 | 语义分析样本集的优化方法、存储介质和计算设备 |
CN112036923A (zh) * | 2020-07-06 | 2020-12-04 | 北京嘀嘀无限科技发展有限公司 | 一种服务评价方法、系统、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP6259377B2 (ja) | 2018-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Larson et al. | An evaluation dataset for intent classification and out-of-scope prediction | |
US10311454B2 (en) | Customer interaction and experience system using emotional-semantic computing | |
US20190163691A1 (en) | Intent Based Dynamic Generation of Personalized Content from Dynamic Sources | |
US11645470B2 (en) | Automated testing of dialog systems | |
US9601104B2 (en) | Imbuing artificial intelligence systems with idiomatic traits | |
US9722965B2 (en) | Smartphone indicator for conversation nonproductivity | |
TW201933267A (zh) | 機器人客服轉人工客服的方法和裝置 | |
US20200135213A1 (en) | Electronic device and control method thereof | |
US12001465B2 (en) | Response selecting apparatus, response selecting method, and response selecting program | |
WO2017075017A1 (en) | Automatic conversation creator for news | |
US9858923B2 (en) | Dynamic adaptation of language models and semantic tracking for automatic speech recognition | |
US10067935B2 (en) | Prediction and optimized prevention of bullying and other counterproductive interactions in live and virtual meeting contexts | |
US10573311B1 (en) | Generating self-support metrics based on paralinguistic information | |
US11928985B2 (en) | Content pre-personalization using biometric data | |
JP6259377B2 (ja) | 対話システム評価方法、対話システム評価装置及びプログラム | |
US11748393B2 (en) | Creating compact example sets for intent classification | |
US11676044B1 (en) | Systems and methods for generating a chatbot | |
JP6230987B2 (ja) | 言語モデル作成装置、言語モデル作成方法、プログラム、および記録媒体 | |
US11797769B1 (en) | Artificial intelligence system using hybrid technique for task-oriented dialog management | |
CN117493830A (zh) | 训练数据质量的评估、评估模型的生成方法、装置及设备 | |
CN108733672A (zh) | 实现网络信息质量评估的方法和装置 | |
JP6158105B2 (ja) | 言語モデル作成装置、音声認識装置、その方法及びプログラム | |
Keizer et al. | User simulation in the development of statistical spoken dialogue systems | |
US11397857B2 (en) | Methods and systems for managing chatbots with respect to rare entities | |
JP6486789B2 (ja) | 音声認識装置、音声認識方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160907 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6259377 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |