JP7416665B2 - 対話システム、及び対話システムの制御方法 - Google Patents
対話システム、及び対話システムの制御方法 Download PDFInfo
- Publication number
- JP7416665B2 JP7416665B2 JP2020102121A JP2020102121A JP7416665B2 JP 7416665 B2 JP7416665 B2 JP 7416665B2 JP 2020102121 A JP2020102121 A JP 2020102121A JP 2020102121 A JP2020102121 A JP 2020102121A JP 7416665 B2 JP7416665 B2 JP 7416665B2
- Authority
- JP
- Japan
- Prior art keywords
- input sentence
- similarity
- dialogue system
- terms
- calculation model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000004364 calculation method Methods 0.000 claims description 66
- 238000012545 processing Methods 0.000 claims description 43
- 230000004044 response Effects 0.000 claims description 39
- 230000003993 interaction Effects 0.000 claims description 32
- 230000010365 information processing Effects 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 8
- 230000002452 interceptive effect Effects 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 description 24
- 230000006870 function Effects 0.000 description 16
- 239000000047 product Substances 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 230000009118 appropriate response Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- WWYNJERNGUHSAO-XUDSTZEESA-N (+)-Norgestrel Chemical compound O=C1CC[C@@H]2[C@H]3CC[C@](CC)([C@](CC4)(O)C#C)[C@@H]4[C@@H]3CCC2=C1 WWYNJERNGUHSAO-XUDSTZEESA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
語の組合せ(以下、「区別用語」と称する。)のリストを含む。区別用語リスト223は、例えば、対話コンテンツ管理部5の区別用語リスト生成部52が、質問応答データ221、同義語辞書222、テキストデータ21等を用いて生成する。また、区別用語リスト223は、ユーザが手動で作成(入力)してもよい。
似度を求める関数や機械学習モデルである。類似度算出モデル23は、類似度算出モデル生成部6によって生成される。対話処理部7は、ユーザとの対話に際し、類似度算出モデル23を用いることで、入力文に一致する入力文(以下、「想定入力文」と称する。)が質問応答データ221に定義されていない場合でも、入力文が質問応答データ221におけるいずれの入力文に対応するのかを特定する。
)、DVD(Digital Versatile Disc)等)、ICカード、SDカード等である。補助記憶装置106には、対話装置10の機能を実現するためのプログラム及びデータが格納されている。補助記憶装置106は、記録媒体の読取装置や通信装置103を介してプログラムやデータの書き込み/読み出しが可能である。補助記憶装置106に格納(記憶)されているプログラムやデータは、主記憶装置102に随時読み出される。プロセッサ101が、主記憶装置102に格納されているプログラムを読み出して実行することにより、対話装置10が備える各機能が実現される。
ードウェアによって実現してもよい。
掲載されたWebページから取得されるテキストデータに基づき質問応答データ221を生成する場合を例示している。
に関する問い合わせ」等である場合、例えば、「プランA」と「プランB」のように商品名やサービス名の表現が類似していることがあり、この場合、区別用語リスト223に「プランA」と「プランB」が夫々区別用語として登録される。また、例えば、トピックが図5Aに示した仕様表の内容に関するものである場合、例えば、「USB2.0」と「USB3.0」が区別用語として登録される。
い合わせ内容ごとに分類されたものであるので、例えば、カテゴリや章節の見出しに現れる用語を区別用語の代表語として抽出してもよい。
士の類似度であり、その算出方法としては、例えば、w1とw2の分散表現のコサイン類似度を用いる方法がある。また、w1とw2の単語概念間距離を用いる方法もある。
f(X,Y)=C×f1(X,Y)+f2(X,Y)
としてもよい。合成係数Cは、例えば、C=0.1とする。また、f1(X,Y)が十分大きいときには、表記がかなり類似しており、f1(X,Y)の値が信頼できる。そのため、予め閾値Hを定めて置き、以下の式のように、f1がHより大きい場合には、f1の値を類似度として採用してもよい。
f(X,Y)=f1(X,Y) f1(X、Y)>Hの場合
・・・式1
f(X,Y)=C×f1(X,Y)+f2(X,Y) f1(X,Y)≦Hの場合
・・・式2
装置」の属性における値(HDD、SSD)の中で、どの値に最も近いかを算出する。
させることができる。対話装置10は、以上のような類似度算出モデル23を用いることで、入力文と最も類似度が高い想定入力文を特定し、適切な応答文を返すおことができる。
ICカード、SDカード、DVD等の記録媒体に置くことができる。
同義語辞書、223 区別用語リスト、23 類似度算出モデル、24 主要用語リスト、30 通信ネットワーク、40 ユーザ端末、41 ユーザ入力欄
Claims (16)
- 情報処理装置を用いて構成される対話システムであって、
入力文に対して応答文を出力する対話処理部と、
前記入力文を想定した文である想定入力文と前記応答文とを対応付けた質問応答データ、同義語辞書、対話のトピックに応じて互いに区別されるべき用語である区別用語のリストである区別用語リスト、及び入力文と想定入力文との類似度を求める類似度算出モデルを記憶する記憶部と、
前記類似度算出モデルを生成する類似度算出モデル生成部と、
を備え、
前記類似度算出モデル生成部は、前記同義語辞書に記録されている同義語同士は類似度が高く、前記区別用語リストの区別用語同士は類似度が低くなるように類似度を算出する類似度算出モデルを生成し、
前記対話処理部は、前記入力文と前記想定入力文との類似度を、前記類似度算出モデルを用いて求め、求めた前記類似度に基づき前記想定入力文を選択し、選択した当該想定入力文に対応する応答文を出力する、
対話システム。 - 請求項1に記載の対話システムであって、
前記質問応答データを、章節構造を有する文書からなるテキストデータに基づき生成するとともに、前記区別用語を、当該テキストデータにおける章節の見出し、または章節の分類を示す表記から抽出する対話コンテンツ管理部を更に備える、
対話システム。 - 請求項1に記載の対話システムであって、
前記類似度算出モデル生成部は、前記入力文と前記想定入力文の夫々に含まれる用語の集合同士の類似度に基づく第1の類似度算出モデルと、前記入力文と前記想定入力文の夫々に含まれる単語同士の類似度に基づく第2の類似度算出モデルとを生成し、前記第1の類似度算出モデルと前記第2の類似度算出モデルとを合成した関数を前記類似度算出モデルとして生成する、
対話システム。 - 請求項3に記載の対話システムであって、
前記対話処理部は、前記第1の類似度算出モデルで算出した前記入力文と前記想定入力文との類似度が所定の閾値以上である場合に、当該第1の類似度算出モデルを前記類似度算出モデルとして採用する、
対話システム。 - 請求項1に記載の対話システムであって、
前記対話処理部は、前記入力文に含まれる用語を、前記同義語辞書または前記区別用語リストを用いて前記想定入力文に含まれる用語に統一した上で前記類似度を算出する、
対話システム。 - 請求項1に記載の対話システムであって、
前記記憶部は、前記想定入力文の夫々に含まれる用語を主要用語として抽出した主要用語リストを記憶し、
前記対話処理部は、入力した前記入力文に類似する前記想定入力文についての前記主要用語を、ユーザが選択可能な状態で出力するとともに、前記入力文を当該ユーザによって選択された前記主要用語で補完する、
対話システム。 - 請求項1に記載の対話システムであって、
前記記憶部は、前記想定入力文の夫々に含まれる用語を主要用語として抽出した主要用語リストを記憶し、
前記対話処理部は、入力した前記入力文に類似する前記想定入力文についての前記主要用語を、当該入力文に含まれる一部の用語と置換可能な状態で出力するとともに、前記一部の用語を置換する旨のユーザの指示を受け付けると前記入力文の一部を指示された前記主要用語に置換する、
対話システム。 - 請求項1に記載の対話システムであって、
前記記憶部は、前記想定入力文の夫々に含まれる用語を主要用語として抽出した主要用語リストを記憶し、
前記対話処理部は、前記入力文に含まれる単語において、前記想定入力文に含まれる単語との類似度が所定の閾値以上である単語を前記入力文で識別可能に表示する、
対話システム。 - 情報処理装置を用いて構成される対話システムの制御方法であって、
対話システムが、
入力文に対して応答文を出力するステップ、
前記入力文を想定した文である想定入力文と前記応答文とを対応付けた質問応答データ、同義語辞書、対話のトピックに応じて互いに区別されるべき用語である区別用語のリストである区別用語リスト、及び入力文と想定入力文との類似度を求める類似度算出モデルを記憶するステップ、
前記類似度算出モデルを生成するステップ、
前記同義語辞書に記録されている同義語同士は類似度が高く、前記区別用語リストの区別用語同士は類似度が低くなるように類似度を算出する類似度算出モデルを生成するステップ、及び、
前記入力文と前記想定入力文との類似度を、前記類似度算出モデルを用いて求め、求めた前記類似度に基づき前記想定入力文を選択し、選択した当該想定入力文に対応する応答文を出力するステップ、
を実行する、対話システムの制御方法。 - 請求項9に記載の対話システムの制御方法であって、
前記対話システムが、前記質問応答データを、章節構造を有する文書からなるテキストデータに基づき生成するとともに、前記区別用語を、当該テキストデータにおける章節の見出し、または章節の分類を示す表記から抽出するステップ、
を更に実行する、対話システムの制御方法。
- 請求項9に記載の対話システムの制御方法であって、
前記対話システムが、前記入力文と前記想定入力文の夫々に含まれる用語の集合同士の類似度に基づく第1の類似度算出モデルと、前記入力文と前記想定入力文の夫々に含まれる単語同士の類似度に基づく第2の類似度算出モデルとを生成し、前記第1の類似度算出モデルと前記第2の類似度算出モデルとを合成した関数を前記類似度算出モデルとして生成するステップ、
を更に実行する、対話システムの制御方法。 - 請求項11に記載の対話システムの制御方法であって、
前記対話システムが、前記第1の類似度算出モデルで算出した前記入力文と前記想定入
力文との類似度が所定の閾値以上である場合に、当該第1の類似度算出モデルを前記類似度算出モデルとして採用するステップ、
を更に実行する、対話システムの制御方法。 - 請求項9に記載の対話システムの制御方法であって、
前記対話システムが、前記入力文に含まれる用語を、前記同義語辞書または前記区別用語リストを用いて前記想定入力文に含まれる用語に統一した上で前記類似度を算出するステップ、
を更に実行する、対話システムの制御方法。 - 請求項9に記載の対話システムの制御方法であって、
前記対話システムが、
前記想定入力文の夫々に含まれる用語を主要用語として抽出した主要用語リストを記憶するステップ、及び、
入力した前記入力文に類似する前記想定入力文についての前記主要用語を、ユーザが選択可能な状態で出力するとともに、前記入力文を当該ユーザによって選択された前記主要用語で補完するステップ、
を更に実行する、対話システムの制御方法。 - 請求項9に記載の対話システムの制御方法であって、
前記対話システムが、
前記想定入力文の夫々に含まれる用語を主要用語として抽出した主要用語リストを記憶するステップ、及び、
入力した前記入力文に類似する前記想定入力文についての前記主要用語を、当該入力文に含まれる一部の用語と置換可能な状態で出力するとともに、前記一部の用語を置換する旨のユーザの指示を受け付けると前記入力文の一部を指示された前記主要用語に置換するステップ、
を更に実行する、対話システムの制御方法。 - 請求項9に記載の対話システムの制御方法であって、
前記対話システムが、前記想定入力文の夫々に含まれる用語を主要用語として抽出した主要用語リストを記憶するステップ、及び、
前記入力文に含まれる単語において、前記想定入力文に含まれる単語との類似度が所定の閾値以上である単語を前記入力文で識別可能に表示するステップ、
を更に実行する、対話システムの制御方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020102121A JP7416665B2 (ja) | 2020-06-12 | 2020-06-12 | 対話システム、及び対話システムの制御方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020102121A JP7416665B2 (ja) | 2020-06-12 | 2020-06-12 | 対話システム、及び対話システムの制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021196798A JP2021196798A (ja) | 2021-12-27 |
JP7416665B2 true JP7416665B2 (ja) | 2024-01-17 |
Family
ID=79195510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020102121A Active JP7416665B2 (ja) | 2020-06-12 | 2020-06-12 | 対話システム、及び対話システムの制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7416665B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024004320A1 (ja) * | 2022-06-30 | 2024-01-04 | 有限会社Bond | 教育装置、教育方法及び記録媒体 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006244262A (ja) | 2005-03-04 | 2006-09-14 | Nec Corp | 質問回答検索システム、方法およびプログラム |
JP2009536401A (ja) | 2006-05-05 | 2009-10-08 | ハリス コーポレイション | 文書データベースにおける文書の領域識別のための方法 |
JP2015038710A (ja) | 2013-08-19 | 2015-02-26 | 株式会社東芝 | 方法、電子機器およびプログラム |
JP2017505937A (ja) | 2013-12-02 | 2017-02-23 | ラクテン ユーエスエー インコーポレイテッド | オブジェクトネットワークをモデル化するシステム及び方法 |
JP2020507155A (ja) | 2017-01-22 | 2020-03-05 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 単語ベクトル処理方法および装置 |
JP2020071801A (ja) | 2018-11-02 | 2020-05-07 | 株式会社ユニバーサルエンターテインメント | 情報提供システム、情報提供方法、及び、知識データのデータ構造 |
WO2020100553A1 (ja) | 2018-11-13 | 2020-05-22 | 株式会社日立製作所 | 質問応答データ生成装置および質問応答データ生成方法 |
-
2020
- 2020-06-12 JP JP2020102121A patent/JP7416665B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006244262A (ja) | 2005-03-04 | 2006-09-14 | Nec Corp | 質問回答検索システム、方法およびプログラム |
JP2009536401A (ja) | 2006-05-05 | 2009-10-08 | ハリス コーポレイション | 文書データベースにおける文書の領域識別のための方法 |
JP2015038710A (ja) | 2013-08-19 | 2015-02-26 | 株式会社東芝 | 方法、電子機器およびプログラム |
JP2017505937A (ja) | 2013-12-02 | 2017-02-23 | ラクテン ユーエスエー インコーポレイテッド | オブジェクトネットワークをモデル化するシステム及び方法 |
JP2020507155A (ja) | 2017-01-22 | 2020-03-05 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | 単語ベクトル処理方法および装置 |
JP2020071801A (ja) | 2018-11-02 | 2020-05-07 | 株式会社ユニバーサルエンターテインメント | 情報提供システム、情報提供方法、及び、知識データのデータ構造 |
WO2020100553A1 (ja) | 2018-11-13 | 2020-05-22 | 株式会社日立製作所 | 質問応答データ生成装置および質問応答データ生成方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2021196798A (ja) | 2021-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11397762B2 (en) | Automatically generating natural language responses to users' questions | |
Najmi et al. | CAPRA: a comprehensive approach to product ranking using customer reviews | |
US20230394242A1 (en) | Automated translation of subject matter specific documents | |
Toba et al. | Discovering high quality answers in community question answering archives using a hierarchy of classifiers | |
US9910886B2 (en) | Visual representation of question quality | |
US9864741B2 (en) | Automated collective term and phrase index | |
KR100969447B1 (ko) | 자연 언어 커맨드에 따른 표 렌더링 | |
US9053423B2 (en) | Assisted update of knowledge base for problem solving | |
US9817821B2 (en) | Translation and dictionary selection by context | |
US20050149499A1 (en) | Systems and methods for improving search quality | |
US20170103439A1 (en) | Searching Evidence to Recommend Organizations | |
TW201314476A (zh) | 基於本體之自動自助式使用者支援 | |
WO2013088287A1 (en) | Generation of natural language processing model for information domain | |
JP4904496B2 (ja) | 文書類似性導出装置及びそれを用いた回答支援システム | |
CN112417090A (zh) | 利用未提交的用户输入数据来提高任务性能 | |
JP6622236B2 (ja) | 発想支援装置及び発想支援方法 | |
Delaere | Do translations walk the line?: visually exploring translated and non-translated texts in search of norm conformity | |
WO2010061733A1 (ja) | 誤訳の検出を支援する装置及び方法 | |
JP2020113129A (ja) | 文書評価装置、文書評価方法及びプログラム | |
JP7416665B2 (ja) | 対話システム、及び対話システムの制御方法 | |
US10339826B1 (en) | Systems and methods for determining the effectiveness of source material usage | |
US10120858B2 (en) | Query analyzer | |
B. Shelke et al. | Marathi SentiWordNet: A lexical resource for sentiment analysis of Marathi | |
Moorkens | Consistency in Translation Memory Corpora: A mixed methods case study | |
JP7364512B2 (ja) | ラベル付与モデル生成装置、及びラベル付与モデル生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231107 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7416665 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |