JP5718407B2 - 対話パターン抽出装置、対話装置、方法、及びプログラム - Google Patents
対話パターン抽出装置、対話装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP5718407B2 JP5718407B2 JP2013101631A JP2013101631A JP5718407B2 JP 5718407 B2 JP5718407 B2 JP 5718407B2 JP 2013101631 A JP2013101631 A JP 2013101631A JP 2013101631 A JP2013101631 A JP 2013101631A JP 5718407 B2 JP5718407 B2 JP 5718407B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- utterance
- word
- pair
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
大量の対話データから定型やりとりを抽出して、対話システムが用いる発話ペアを獲得する。また、対応できるユーザ入力を拡充するために、発話ペアにおける先の発話を抽象化する。さらに、対話システムがユーザ発話に対して応答するとき、抽象化されていない発話ペア、抽象化された発話ペアを順に用いることで、入力に対して、適切な応答を行う。
以下では、対話システムに本発明を適用した場合を例に説明する。
なお、本実施の形態では、応答部63は、完全一致のみではなく、一致するとみなされる単語パターンや抽象化パターンを検索している。具体的には、例えば、編集距離や単語の重複率などを用いて、予め設けておいた閾値に基づいて当該閾値を超えるか否かにより、一致するか否かを判断して、単語パターンや抽象化パターンを検索している。このように応答部63は、上記取得した単語列と完全に一致する単語パターンのみではなく、一致すると判断される単語パターンを検索し、上記取得した抽象化された文字列と完全に一致する抽象化パターンのみではなく、一致すると判断される抽象化パターンを検索することが好ましい。
次に、本実施の形態に係る対話システムの作用について説明する。まず、予め用意されたツイート対話データが対話パターン抽出装置100に入力されると、対話パターン抽出装置100によって、入力されたツイート対話データが、対話データ記憶部21へ格納される。そして、対話パターン抽出装置100によって、図8に示すパターン抽出処理ルーチンが実行される。
20、60 演算部
21 対話データ記憶部
22 発話ペア抽出部
23 単語パターン取得部
24 抽象化パターン取得部
25 パターン登録部
26、61 単語パターンデータベース
27、62 抽象化パターンデータベース
63 応答部
70 出力部
100 対話パターン抽出装置
150 対話装置
Claims (6)
- 複数の発話データを含む対話データから、応答関係にある発話データのペアを各々抽出する発話ペア抽出部と、
前記発話ペア抽出部によって抽出された前記発話データのペアの各々について、前記ペアの先に発話された発話データを表す単語列の各単語に対して予め用意された前記単語の意味情報、及び意味情報がない単語からなる文字列と、後に発話された発話データを表す単語列とのペアである抽象化パターンを取得するパターン取得部と、
前記パターン取得部によって取得された抽象化パターンのうちの、前記対話データにおける前記抽象化パターンの出現頻度が閾値以上となる抽象化パターンを出力するパターン出力部と、
を含む対話パターン抽出装置。 - 前記パターン取得部は、
前記発話ペア抽出部によって抽出された前記発話データのペアの各々について、前記ペアの前記先に発話された発話データの形態素解析結果に基づいて得られる単語の各々の意味情報、及び意味情報がない単語からなる文字列と前記後に発話された発話データの形態素解析結果に基づいて得られる単語列とのペアを、前記抽象化パターンとして取得する請求項1記載の対話パターン抽出装置。 - 前記パターン取得部は、前記発話ペア抽出部によって抽出された前記発話データのペアの各々について、前記ペアの先に発話された発話データを表す単語列と後に発話された発話データを表す単語列とのペアである単語パターン、及び前記ペアの抽象化パターンを取得し、
前記パターン出力部は、前記パターン取得部によって取得された単語パターンのうちの、前記対話データにおける前記単語パターンの出現頻度が閾値以上となる単語パターン、及び前記パターン取得部によって取得された抽象化パターンのうちの、前記対話データにおける前記抽象化パターンの出現頻度が閾値以上となる抽象化パターンを出力する請求項1又は2記載の対話パターン抽出装置。 - 前記パターン取得部は、
前記発話ペア抽出部によって抽出された前記発話データのペアの各々について、前記ペアの前記先に発話された発話データの形態素解析結果に基づいて得られる単語列と前記後に発話された発話データの形態素解析結果に基づいて得られる単語列とのペアを、前記単語パターンとして取得する請求項3記載の対話パターン抽出装置。 - 発話ペア抽出部によって、複数の発話データを含む対話データから、応答関係にある発話データのペアを各々抽出し、
パターン取得部によって、前記発話ペア抽出部によって抽出された前記発話データのペアの各々について、前記ペアの先に発話された発話データを表す単語列の各単語に対して予め用意された前記単語の意味情報、及び意味情報がない単語からなる文字列と後に発話された発話データを表す単語列とのペアである抽象化パターンを取得し、
パターン出力部によって、前記パターン取得部によって取得された抽象化パターンのうちの、前記対話データにおける前記抽象化パターンの出現頻度が閾値以上となる抽象化パターンを出力する
対話パターン抽出方法。 - コンピュータを、請求項1記載の対話パターン抽出装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101631A JP5718407B2 (ja) | 2013-05-13 | 2013-05-13 | 対話パターン抽出装置、対話装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101631A JP5718407B2 (ja) | 2013-05-13 | 2013-05-13 | 対話パターン抽出装置、対話装置、方法、及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014221444A Division JP5964924B2 (ja) | 2014-10-30 | 2014-10-30 | 対話装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014222413A JP2014222413A (ja) | 2014-11-27 |
JP5718407B2 true JP5718407B2 (ja) | 2015-05-13 |
Family
ID=52121915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013101631A Active JP5718407B2 (ja) | 2013-05-13 | 2013-05-13 | 対話パターン抽出装置、対話装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5718407B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020177366A (ja) * | 2019-04-16 | 2020-10-29 | 日本電信電話株式会社 | 発話ペア獲得装置、発話ペア獲得方法、およびプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5117744B2 (ja) * | 2007-03-13 | 2013-01-16 | 日本電信電話株式会社 | 単語意味タグ付与装置および方法、プログラム並びに記録媒体 |
-
2013
- 2013-05-13 JP JP2013101631A patent/JP5718407B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014222413A (ja) | 2014-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241538B (zh) | 基于关键词和动词依存的中文实体关系抽取方法 | |
CN104636466B (zh) | 一种面向开放网页的实体属性抽取方法和系统 | |
JP6596517B2 (ja) | 口語語義解析システム及び方法 | |
JP6466952B2 (ja) | 文章生成システム | |
CN102693279B (zh) | 一种快速计算评论相似度的方法、装置及系统 | |
CN110765235B (zh) | 训练数据的生成方法、装置、终端及可读介质 | |
JP2018028752A (ja) | 対話システム及びそのためのコンピュータプログラム | |
CN110046351A (zh) | 规则驱动下基于特征的文本关系抽取方法 | |
CN103593412B (zh) | 一种基于树形结构问题的应答方法及系统 | |
Ljubešić et al. | Standardizing tweets with character-level machine translation | |
CN108319583A (zh) | 从中文语料库提取知识的方法与系统 | |
JP6427466B2 (ja) | 同義語ペア獲得装置、方法、及びプログラム | |
JP2015045833A (ja) | 発話文生成装置とその方法とプログラム | |
JP5718405B2 (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
JP5964924B2 (ja) | 対話装置、方法、及びプログラム | |
US20120096028A1 (en) | Information retrieving apparatus, information retrieving method, information retrieving program, and recording medium on which information retrieving program is recorded | |
KR101333485B1 (ko) | 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치 | |
Jain et al. | Text independent root word identification in Hindi language using natural language processing | |
JP5291351B2 (ja) | 評価表現抽出方法、評価表現抽出装置、および、評価表現抽出プログラム | |
JP4005343B2 (ja) | 情報検索システム | |
Shen et al. | Dependency parse reranking with rich subtree features | |
JP5718407B2 (ja) | 対話パターン抽出装置、対話装置、方法、及びプログラム | |
JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
JP6126965B2 (ja) | 発話生成装置、方法、及びプログラム | |
JP5718406B2 (ja) | 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140902 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5718407 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |