JP2014222413A - 対話パターン抽出装置、対話装置、方法、及びプログラム - Google Patents
対話パターン抽出装置、対話装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2014222413A JP2014222413A JP2013101631A JP2013101631A JP2014222413A JP 2014222413 A JP2014222413 A JP 2014222413A JP 2013101631 A JP2013101631 A JP 2013101631A JP 2013101631 A JP2013101631 A JP 2013101631A JP 2014222413 A JP2014222413 A JP 2014222413A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- utterance data
- word
- pair
- utterance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】発話ペア抽出部22によって、対話データから、発話ペアを各々抽出し、単語パターン取得部23によって、発話ペアの先に発話された発話データを表す単語列と後に発話された発話データを表す単語列とのペアである単語パターンを取得し、抽象化パターン取得部24によって、発話ペアの先に発話された発話データの意味情報を含む文字列と後に発話された発話データを表す単語列とのペアである抽象化パターン取得する。パターン登録部25によって、出現頻度が閾値以上となる単語パターン及び抽象化パターンを出力する。
【選択図】図1
Description
大量の対話データから定型やりとりを抽出して、対話システムが用いる発話ペアを獲得する。また、対応できるユーザ入力を拡充するために、発話ペアにおける先の発話を抽象化する。さらに、対話システムがユーザ発話に対して応答するとき、抽象化されていない発話ペア、抽象化された発話ペアを順に用いることで、入力に対して、適切な応答を行う。
以下では、対話システムに本発明を適用した場合を例に説明する。
なお、本実施の形態では、応答部63は、完全一致のみではなく、一致するとみなされる単語パターンや抽象化パターンを検索している。具体的には、例えば、編集距離や単語の重複率などを用いて、予め設けておいた閾値に基づいて当該閾値を超えるか否かにより、一致するか否かを判断して、単語パターンや抽象化パターンを検索している。このように応答部63は、上記取得した単語列と完全に一致する単語パターンのみではなく、一致すると判断される単語パターンを検索し、上記取得した抽象化された文字列と完全に一致する抽象化パターンのみではなく、一致すると判断される抽象化パターンを検索することが好ましい。
次に、本実施の形態に係る対話システムの作用について説明する。まず、予め用意されたツイート対話データが対話パターン抽出装置100に入力されると、対話パターン抽出装置100によって、入力されたツイート対話データが、対話データ記憶部21へ格納される。そして、対話パターン抽出装置100によって、図8に示すパターン抽出処理ルーチンが実行される。
20、60 演算部
21 対話データ記憶部
22 発話ペア抽出部
23 単語パターン取得部
24 抽象化パターン取得部
25 パターン登録部
26、61 単語パターンデータベース
27、62 抽象化パターンデータベース
63 応答部
70 出力部
100 対話パターン抽出装置
150 対話装置
Claims (9)
- 複数の発話データを含む対話データから、応答関係にある発話データのペアを各々抽出する発話ペア抽出部と、
前記発話ペア抽出部によって抽出された前記発話データのペアの各々について、前記ペアの先に発話された発話データを表す単語列と後に発話された発話データを表す単語列とのペアである単語パターン、及び前記ペアの先に発話された発話データの意味情報を含む文字列と後に発話された発話データを表す単語列とのペアである抽象化パターンの少なくとも一方を取得するパターン取得部と、
前記パターン取得部によって取得された単語パターンのうちの、前記対話データにおける前記単語パターンの出現頻度が閾値以上となる単語パターン、又は前記パターン取得部によって取得された抽象化パターンのうちの、前記対話データにおける前記抽象化パターンの出現頻度が閾値以上となる抽象化パターンを出力するパターン出力部と、
を含む対話パターン抽出装置。 - 前記パターン取得部は、
前記発話ペア抽出部によって抽出された前記発話データのペアの各々について、前記ペアの前記先に発話された発話データの形態素解析結果に基づいて得られる単語列と前記後に発話された発話データの形態素解析結果に基づいて得られる単語列とのペアを、前記単語パターンとして取得し、又は前記ペアの前記先に発話された発話データの形態素解析結果に基づいて得られる単語の各々の意味情報を含む文字列と前記後に発話された発話データの形態素解析結果に基づいて得られる単語列とのペアを、前記抽象化パターンとして取得する請求項1記載の対話パターン抽出装置。 - 応答関係にある発話データのペアの各々について予め取得された、前記ペアの先に発話された発話データを表す単語列と後に発話された発話データを表す単語列とのペアである、複数の単語パターン、及び前記発話データのペアの各々について予め取得された、前記ペアの前記先に発話された発話データの意味情報を含む文字列と前記後に発話された発話データを表す単語列とのペアである、複数の抽象化パターンの少なくとも一方を記憶した記憶部と、
入力されたユーザの発話データに基づいて、前記発話データを表す単語列及び前記発話データの意味情報を含む文字列の少なくとも一方を取得する取得部と、
前記取得部によって取得された前記発話データを表す単語列と、前記ペアの前記先に発話された発話データを表す単語列とが一致すると判断される前記単語パターンを、前記記憶部に記憶された前記複数の単語パターンから検索する、又は前記取得部によって取得された前記発話データの意味情報を含む文字列と、前記ペアの前記先に発話された発話データの意味情報を含む文字列とが一致すると判断される前記抽象化パターンを、前記記憶部に記憶された前記複数の抽象化パターンから検索する検索部と、
前記検索部によって検索された前記単語パターン又は前記抽象化パターンの、前記後に発話された発話データを表す単語列を、前記ユーザの発話データに対する応答として出力する応答部と、
を含む対話装置。 - 応答関係にある発話データのペアの各々について予め取得された、前記ペアの先に発話された発話データを表す単語列と後に発話された発話データを表す単語列とのペアである、複数の単語パターン、及び前記発話データのペアの各々について予め取得された、前記ペアの前記先に発話された発話データの意味情報を含む文字列と前記後に発話された発話データを表す単語列とのペアである、複数の抽象化パターンを記憶した記憶部と、
入力されたユーザの発話データに基づいて、前記発話データを表す単語列、及び前記発話データの意味情報を含む文字列を取得する取得部と、
前記取得部によって取得された前記発話データを表す単語列と、前記ペアの前記先に発話された発話データを表す単語列とが一致すると判断される前記単語パターンを、前記記憶部に記憶された前記複数の単語パターンから検索し、前記取得部によって取得された、前記発話データの意味情報を含む文字列と、前記ペアの前記先に発話された発話データの意味情報を含む文字列とが一致すると判断される前記抽象化パターンを、前記記憶部に記憶された前記複数の抽象化パターンから検索する検索部と、
前記検索部によって前記単語パターンが検索された場合には、前記単語パターンの、前記後に発話された発話データを表す単語列を、前記ユーザの発話データに対する応答として出力し、前記検索部によって前記単語パターンが検索されなかった場合であって、かつ、前記検索部によって前記抽象化パターンが検索された場合には、前記抽象化パターンの、前記後に発話された発話データを表す単語列を、前記ユーザの発話データに対する応答として出力する応答部と、
を含む対話装置。 - 発話ペア抽出部によって、複数の発話データを含む対話データから、応答関係にある発話データのペアを各々抽出し、
パターン取得部によって、前記発話ペア抽出部によって抽出された前記発話データのペアの各々について、前記ペアの先に発話された発話データを表す単語列と後に発話された発話データを表す単語列とのペアである単語パターン、及び前記ペアの先に発話された発話データの意味情報を含む文字列と後に発話された発話データを表す単語列とのペアである抽象化パターンの少なくとも一方を取得し、
パターン出力部によって、前記パターン取得部によって取得された単語パターンのうちの、前記対話データにおける前記単語パターンの出現頻度が閾値以上となる単語パターン、又は前記パターン取得部によって取得された抽象化パターンのうちの、前記対話データにおける前記抽象化パターンの出現頻度が閾値以上となる抽象化パターンを出力する
対話パターン抽出方法 - 応答関係にある発話データのペアの各々について予め取得された、前記ペアの先に発話された発話データを表す単語列と後に発話された発話データを表す単語列とのペアである、複数の単語パターン、及び前記発話データのペアの各々について予め取得された、前記ペアの前記先に発話された発話データの意味情報を含む文字列と前記後に発話された発話データを表す単語列とのペアである、複数の抽象化パターンの少なくとも一方を記憶した記憶部を含む対話装置における対話方法であって、
取得部によって、入力されたユーザの発話データに基づいて、前記発話データを表す単語列及び前記発話データの意味情報を含む文字列の少なくとも一方を取得し、
検索部によって、前記取得部によって取得された前記発話データを表す単語列と、前記ペアの前記先に発話された発話データを表す単語列とが一致すると判断される前記単語パターンを、前記記憶部に記憶された前記複数の単語パターンから検索し、又は前記取得部によって取得された前記発話データの意味情報を含む文字列と、前記ペアの前記先に発話された発話データの意味情報を含む文字列とが一致すると判断される前記抽象化パターンを、前記記憶部に記憶された前記複数の抽象化パターンから検索し、
応答部によって、前記検索部によって検索された前記単語パターン又は前記抽象化パターンの、前記後に発話された発話データを表す単語列を、前記ユーザの発話データに対する応答として出力する
対話方法。 - 応答関係にある発話データのペアの各々について予め取得された、前記ペアの先に発話された発話データを表す単語列と後に発話された発話データを表す単語列とのペアである、複数の単語パターン、及び前記発話データのペアの各々について予め取得された、前記ペアの前記先に発話された発話データの意味情報を含む文字列と前記後に発話された発話データを表す単語列とのペアである、複数の抽象化パターンを記憶した記憶部を含む対話装置の対話方法であって、
取得部によって、入力されたユーザの発話データに基づいて、前記発話データを表す単語列、及び前記発話データの意味情報を含む文字列を取得し、
検索部によって、前記取得部によって取得された前記発話データを表す単語列と、前記ペアの前記先に発話された発話データを表す単語列とが一致すると判断される前記単語パターンを、前記記憶部に記憶された前記複数の単語パターンから検索し、前記取得部によって取得された、前記発話データの意味情報を含む文字列と、前記ペアの前記先に発話された発話データの意味情報を含む文字列とが一致すると判断される前記抽象化パターンを、前記記憶部に記憶された前記複数の抽象化パターンから検索し、
応答部によって、前記検索部によって前記単語パターンが検索された場合には、前記単語パターンの、前記後に発話された発話データを表す単語列を、前記ユーザの発話データに対する応答として出力し、前記検索部によって前記単語パターンが検索されなかった場合であって、かつ、前記検索部によって前記抽象化パターンが検索された場合には、前記抽象化パターンの、前記後に発話された発話データを表す単語列を、前記ユーザの発話データに対する応答として出力する
対話方法。 - コンピュータを、請求項1記載の対話パターン抽出装置を構成する各部として機能させるためのプログラム。
- コンピュータを、請求項3又は4記載の対話装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101631A JP5718407B2 (ja) | 2013-05-13 | 2013-05-13 | 対話パターン抽出装置、対話装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013101631A JP5718407B2 (ja) | 2013-05-13 | 2013-05-13 | 対話パターン抽出装置、対話装置、方法、及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014221444A Division JP5964924B2 (ja) | 2014-10-30 | 2014-10-30 | 対話装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014222413A true JP2014222413A (ja) | 2014-11-27 |
JP5718407B2 JP5718407B2 (ja) | 2015-05-13 |
Family
ID=52121915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013101631A Active JP5718407B2 (ja) | 2013-05-13 | 2013-05-13 | 対話パターン抽出装置、対話装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5718407B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020213531A1 (ja) * | 2019-04-16 | 2020-10-22 | 日本電信電話株式会社 | 発話ペア獲得装置、発話ペア獲得方法、およびプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008225846A (ja) * | 2007-03-13 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 単語意味タグ付与装置および方法、プログラム並びに記録媒体 |
-
2013
- 2013-05-13 JP JP2013101631A patent/JP5718407B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008225846A (ja) * | 2007-03-13 | 2008-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 単語意味タグ付与装置および方法、プログラム並びに記録媒体 |
Non-Patent Citations (4)
Title |
---|
CSNG201000984010; 東中竜一郎 他2名: '「なりきり質問応答」を用いた対話システム' 第60回 言語・音声理解と対話処理研究会資料(SIG-SLUD-B002) , 20101015, 51-52頁, 社団法人人工知能学会 * |
CSNG201400213017; 長谷川貴之 他3名: '聞き手の感情を喚起する発話応答生成' 言語処理学会第19回年次大会 発表論文集[online] , 20130304, 150-153頁, 言語処理学会 * |
JPN6014037414; 長谷川貴之 他3名: '聞き手の感情を喚起する発話応答生成' 言語処理学会第19回年次大会 発表論文集[online] , 20130304, 150-153頁, 言語処理学会 * |
JPN6014037415; 東中竜一郎 他2名: '「なりきり質問応答」を用いた対話システム' 第60回 言語・音声理解と対話処理研究会資料(SIG-SLUD-B002) , 20101015, 51-52頁, 社団法人人工知能学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020213531A1 (ja) * | 2019-04-16 | 2020-10-22 | 日本電信電話株式会社 | 発話ペア獲得装置、発話ペア獲得方法、およびプログラム |
JP2020177366A (ja) * | 2019-04-16 | 2020-10-29 | 日本電信電話株式会社 | 発話ペア獲得装置、発話ペア獲得方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5718407B2 (ja) | 2015-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241538B (zh) | 基于关键词和动词依存的中文实体关系抽取方法 | |
CN106776544B (zh) | 人物关系识别方法及装置和分词方法 | |
CN104636466B (zh) | 一种面向开放网页的实体属性抽取方法和系统 | |
JP6596517B2 (ja) | 口語語義解析システム及び方法 | |
JP6466952B2 (ja) | 文章生成システム | |
CN102693279B (zh) | 一种快速计算评论相似度的方法、装置及系统 | |
CN110765235B (zh) | 训练数据的生成方法、装置、终端及可读介质 | |
JP2018028752A (ja) | 対話システム及びそのためのコンピュータプログラム | |
CN110046351A (zh) | 规则驱动下基于特征的文本关系抽取方法 | |
CN103593412B (zh) | 一种基于树形结构问题的应答方法及系统 | |
Ljubešić et al. | Standardizing tweets with character-level machine translation | |
JP6225012B2 (ja) | 発話文生成装置とその方法とプログラム | |
CN108319583A (zh) | 从中文语料库提取知识的方法与系统 | |
WO2014114175A1 (zh) | 一种提供搜索引擎标签的方法和装置 | |
JP5718405B2 (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
JP5964924B2 (ja) | 対話装置、方法、及びプログラム | |
KR20120042562A (ko) | 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치 | |
Jain et al. | Text independent root word identification in Hindi language using natural language processing | |
JP5291351B2 (ja) | 評価表現抽出方法、評価表現抽出装置、および、評価表現抽出プログラム | |
JP4005343B2 (ja) | 情報検索システム | |
Shen et al. | Dependency parse reranking with rich subtree features | |
JP5718407B2 (ja) | 対話パターン抽出装置、対話装置、方法、及びプログラム | |
JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
JP6126965B2 (ja) | 発話生成装置、方法、及びプログラム | |
JP5718406B2 (ja) | 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140902 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5718407 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |