JP5620349B2 - 対話装置、対話方法および対話プログラム - Google Patents
対話装置、対話方法および対話プログラム Download PDFInfo
- Publication number
- JP5620349B2 JP5620349B2 JP2011161405A JP2011161405A JP5620349B2 JP 5620349 B2 JP5620349 B2 JP 5620349B2 JP 2011161405 A JP2011161405 A JP 2011161405A JP 2011161405 A JP2011161405 A JP 2011161405A JP 5620349 B2 JP5620349 B2 JP 5620349B2
- Authority
- JP
- Japan
- Prior art keywords
- response sentence
- concept
- occurrence
- template
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G06F17/28—
-
- G06F17/30—
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
第1の実施形態の対話装置は、ユーザが入力したキーワードに適合する応答文を出力する対話装置である。例えば、ユーザが入力した「京都」「お土産」というキーワードに対して「京都のお土産は八橋がお勧めだよ」という応答文を出力する。これにより、ユーザとのインタラクティブなやり取りを実現する。
図1は、第1の実施形態にかかる対話装置を示すブロック図である。本実施形態の対話装置は、ユーザからキーワードを取得するキーワード取得部101と、ユーザに提示する応答文を生成する応答文生成処理部102と、応答文生成処理部102で生成された応答文をユーザに提示する応答文出力部103とを備える。
本実施形態の対話装置は、図2に示すような通常のコンピュータを利用したハードウェアで構成されており、装置全体を制御するCPU(Central Processing Unit)等の制御部201と、各種データや各種プログラムを記憶するROM(Read Only Memory)やRAM(Random Access Memory)等の記憶部202と、各種データや各種プログラムを記憶するHDD(Hard Disk Drive)やCD(Compact Disk)ドライブ装置等の外部記憶部203と、ユーザの指示入力を受け付けるキーボードやマウスなどの操作部204と、外部装置との通信を制御する通信部205と、ユーザの発声を取得するマイク206と、音声波形を再生して再生音を発生させるスピーカ207と、映像を表示するディスプレイ209と、これらを接続するバス208とを備えている。
キーワード取得部101は、対話中におけるユーザのキーワードを取得する。具体的には、ユーザが操作部204のキーボードを介して入力した自立語をキーワードとして取得できる。また、対話中の話題に関するテキストを、通信部205を介してWebサイトから取得し、このテキストに含まれる自立語をキーワードとして利用することもできる。テキストからの自立語の抽出には、形態素解析を用いる。
「四条河原町に行ったことある?」: 名詞(四条河原町)/助詞(に)/動詞(行く)/助動詞(た)/名詞(こと)/動詞(ある)
この結果より、「京都」と「四条河原町」は同じ使われ方をしているので、「四条河原町」には「京都」と同じ概念の「場所」を付与することができる。このような手法を用いることにより、大量な自立語に自動で概念を付与することができる。なお、概念辞書111は、記憶部202、外部記憶部203や通信部205を介して接続された外部サーバの記憶部に保持することができる。
この文には、「京都」「金閣寺」「有名」という3つの自立語が含まれる。そこで、これらの概念を概念辞書111で検索すると、「京都」(場所)、「金閣寺」(建物名)、「有名」(評判)を取得できる。そして文に含まれる自立語を概念で置き換えることにより、以下のような発話文テンプレートを作成することができる。
図3のフローチャートを利用して、本実施形態にかかる対話装置の処理を説明する。まず、ステップS301では、キーワード取得部101は、対話中におけるユーザのキーワードを取得する。取得するキーワードの数は2つ以上でもよい。本実施形態では、「京都」、「お土産」という2つのキーワードを取得したものとする。
[場所]の[物品]が盗まれたらしいよ
[場所]の[物品]にカニを買ってきてね
このように、本実施形態ではキーワードの総括的な意味を表す概念を用いて応答文テンプレートを検索する。これにより、ステップS304で検索される文(発話文テンプレート)の数を増加させることができる。
[場所]の[物品]が盗まれたらしいよ
[場所]の[物品]にカニを買ってきてね
ここで、自立語を動詞、名詞、形容詞、形容動詞に限定するのは、助詞・助動詞等の意味を持たない品詞はどんな単語とも共起する蓋然性が高いため、これらの品詞が含まれる組み合わせはキーワードに対応する応答文の生成に寄与しないからである。なお、応答文テンプレートに含まれる自立語が、形態素の基本形でない場合は基本形に変換したものを応答文テンプレートの自立語として用いる。上述した例であれば、「盗まれた」は「盗む」に、「買って」は「買う」のように、形態素の基本形に変換したものを自立語として用いる。また、発話文テンプレート中の自立語は、オフラインで形態素解析を実施することで予め特定することもできる。
(京都 お勧め)
(京都 盗む)
(京都 カニ)
(京都 買う)
(お土産 八橋)
(お土産 お勧め)
(お土産 盗む)
(お土産 カニ)
(お土産 買う)
ステップS307では、ステップS306での結果に応じて処理を分岐する。応答文テンプレート中に自立語が含まれていなかった等の理由により組み合わせが1つも生成されなかった場合はステップS314へ、組み合わせが1つ以上生成された場合はステップS308移行する。
(京都 お勧め) 0.1
(京都 盗む) 0.002
(京都 カニ) 0.01
(京都 買う) 0.005
(お土産 八橋) 0.05
(お土産 お勧め) 0.1
(お土産 盗む) 0.00002
(お土産 カニ) 0.04
(お土産 買う) 0.1
次に、ステップS311では、応答文生成部118は、ステップS310で付与した共起スコアから各応答文テンプレートの共起性を表すテンプレートスコアを算出する。まず、各応答文テンプレート中の自立語を含む組み合わせの中で、各キーワードに対して最大の共起スコアを示す組み合わせを選択する。次に、各応答文テンプレートについて、選択された共起スコアの平均値を計算し、この値を各応答文テンプレートのテンプレートスコアとする。
このように、本実施形態の対話装置は、自立語に対する概念が付与された応答文テンプレートを利用して応答文を生成する。これにより、予め記憶された文をキーワードそのものではなく概念を用いて検索することができ、被検索対象となる文の数を増加させることができる。結果として、予め記憶した文に含まれないキーワードが入力された場合でも適切な応答文を生成することができる。
応答文生成部118で計算されたテンプレートスコアに閾値を適用して、ユーザに提示する応答文を制御することもできる。例えば、予め設定した閾値と各発話文テンプレートのテンプレートスコアを比較し、テンプレートスコアが閾値以上であれば発話文テンプレートを使用して応答文を生成し、閾値を下回る場合は定型文を応答文として用いる等の制御を行うことができる。これにより、不適切な応答文が出力されることを防止する。
共起辞書116は、複数の自立語からなる組み合わせを含む辞書であるためサイズが膨大になり、共起スコア付与部117における検索時間が長くなることがある。検索時間を短くするためには、必要のない組み合わせを共起辞書116から排除する必要がある。
idfが低い自立語は、どのような文でもまんべんなく使われる自立語である。そこで、idfが所定の閾値より低い自立語を含む組み合わせを共起辞書116から予め除外しておくことで検索時間の短縮を図ることができる。
キーワード取得部101を音声認識で、応答文出力部103を音声合成で実現することもできる。この場合、キーワード取得部101は、マイク206に入力されたユーザの音声を認識し、この認識結果に含まれる自立語をキーワードとして取得する。認識結果から自立語を取得する際は形態素解析を用いる。また、応答文出力部103は、応答文生成処理部102で生成されたテキストの応答文を音声合成により音声波形に変換し、スピーカ207から再生する。これにより、人と人とが対話するような自然なインターフェースでユーザとの対話を進行させることができる。
102 応答文生成処理部
103 応答文出力部
111 概念辞書
112 概念検索部
113 応答文テンプレート辞書
114 応答文検索部
115 組み合わせ生成部
116 共起辞書
117 共起スコア付与部
118 応答文生成部
201 制御部
202 記憶部
203 外部記憶部
204 操作部
205 通信部
206 マイク
207 スピーカ
208 バス
209 ディスプレイ
701 キーワード「京都」に対して最大の共起スコアを示した組み合わせ
702 キーワード「お土産」に対して最大の共起スコアを示した組み合わせ
703 共起スコアの平均値(テンプレートスコア)
Claims (10)
- ユーザからのキーワードを取得するキーワード取得手段と、
自立語およびこの自立語の概念を記憶した概念辞書から、前記キーワードの概念を検索する概念検索手段と、
概念が付与された応答文テンプレートを記憶した応答文テンプレート辞書から、前記概念検索手段で検索された概念を含む応答文テンプレートを検索する応答文検索手段と、
前記応答文検索手段で検索された応答文テンプレート中の自立語と前記キーワードとの組み合わせを生成する組み合わせ生成手段と、
複数の自立語の組み合わせ及びこの自立語が共起する尤もらしさを表す共起スコアを記憶した共起辞書を利用して、前記組み合わせ生成手段で生成された組み合わせに共起スコアを付与する共起スコア付与手段と、
前記キーワードと、前記応答文検索手段で検索された応答文テンプレートと、前記共起スコア付与手段で付与された共起スコアとを利用して、ユーザに提示する応答文を生成する応答文生成手段と、
を備える対話装置。 - 前記応答文生成手段が、前記共起スコア付与手段で付与された共起スコアを利用して、前記応答文検索手段で検索された応答文テンプレートに応答文テンプレート全体の共起性を表すテンプレートスコアを付与し、このテンプレートスコアが最も高くなる応答文テンプレートに付与された概念を前記キーワードで置換してユーザに提示する応答文を生成する請求項1記載の対話装置。
- 前記応答文生成手段が、前記共起スコア付与手段で付与された共起スコアを利用して、前記応答文検索手段で検索された応答文テンプレートに応答文テンプレート全体の共起性を表すテンプレートスコアを付与し、このテンプレートスコアが予め決められた閾値を超える応答文テンプレートを利用して応答文を生成する請求項1乃至請求項2記載の対話装置。
- 前記キーワード取得手段が音声認識を利用してユーザの音声からキーワードを取得する請求項1から請求項3の何れか1項に記載の対話装置。
- 前記応答文生成手段で生成された応答文を音声合成により音声波形に変換して出力する応答文出力手段を更に備える請求項1から請求項4の何れか1項に記載の対話装置。
- 前記音声認識の認識結果の信頼度を予め決められた閾値と比較し、前記信頼度が前記閾値以上の場合は、前記認識結果に含まれる自立語をキーワードとして取得し、前記信頼度が前記閾値を下回る場合は、前記応答文生成手段が以前生成した応答文に含まれる自立語をキーワードとして取得する請求項4記載の対話装置。
- 前記共起辞書に記憶された複数の自立語の組み合わせおよびこの自立語の共起スコアが、テキスト情報を利用して予め学習される請求項1から請求項6の何れか1項に記載の対話装置。
- 前記共起辞書に記憶された複数の自立語の前記テキスト情報での出現頻度が、予め決められた閾値より低い請求項7記載の対話装置。
- ユーザからのキーワードを取得するキーワード取得工程と、
自立語およびこの自立語の概念を記憶した概念辞書から、前記キーワードの概念を検索する概念検索工程と、
概念が付与された応答文テンプレートを記憶した応答文テンプレート辞書から、前記概念検索工程で検索された概念を含む応答文テンプレートを検索する応答文検索工程と、
前記応答文検索工程で検索された応答文テンプレート中の自立語と前記キーワードとの組み合わせを生成する組み合わせ生成工程と、
複数の自立語の組み合わせおよびこの自立語が共起する尤もらしさを表す共起スコアを記憶した共起辞書を利用して、前記組み合わせ生成工程で生成された組み合わせに共起スコアを付与する共起スコア付与工程と、
前記キーワードと、前記応答文検索工程で検索された応答文テンプレートと、前記共起スコア付与工程で付与された共起スコアとを利用して、ユーザに提示する応答文を生成する応答文生成工程と、
を備える、コンピュータが実行する対話方法。 - 対話装置に、
ユーザからのキーワードを取得するキーワード取得工程と、
自立語およびこの自立語の概念を記憶した概念辞書から、前記キーワードの概念を検索する概念検索工程と、
概念が付与された応答文テンプレートを記憶した応答文テンプレート辞書から、前記概念検索工程で検索された概念を含む応答文テンプレートを検索する応答文検索工程と、
前記応答文検索工程で検索された応答文テンプレート中の自立語と前記キーワードとの組み合わせを生成する組み合わせ生成工程と、
複数の自立語の組み合わせおよびこの自立語が共起する尤もらしさを表す共起スコアを記憶した共起辞書を利用して、前記組み合わせ生成工程で生成された組み合わせに共起スコアを付与する共起スコア付与工程と、
前記キーワードと、前記応答文検索工程で検索された応答文テンプレートと、前記共起スコア付与工程で付与された共起スコアとを利用して、ユーザに提示する応答文を生成する応答文生成工程と、
を実現させるための対話プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011161405A JP5620349B2 (ja) | 2011-07-22 | 2011-07-22 | 対話装置、対話方法および対話プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011161405A JP5620349B2 (ja) | 2011-07-22 | 2011-07-22 | 対話装置、対話方法および対話プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013025648A JP2013025648A (ja) | 2013-02-04 |
JP5620349B2 true JP5620349B2 (ja) | 2014-11-05 |
Family
ID=47783909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011161405A Expired - Fee Related JP5620349B2 (ja) | 2011-07-22 | 2011-07-22 | 対話装置、対話方法および対話プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5620349B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021547A (zh) * | 2016-11-04 | 2018-05-11 | 株式会社理光 | 一种自然语言的生成方法、自然语言生成装置及电子设备 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5718406B2 (ja) * | 2013-05-13 | 2015-05-13 | 日本電信電話株式会社 | 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム |
JP2015194812A (ja) * | 2014-03-31 | 2015-11-05 | 株式会社ナカヨ | 文書作成支援装置 |
JP5963328B2 (ja) | 2014-10-30 | 2016-08-03 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 生成装置、生成方法、およびプログラム |
JP6489805B2 (ja) * | 2014-11-19 | 2019-03-27 | シャープ株式会社 | サーバ、回答支援システム、回答支援方法、および制御プログラム |
US10581766B2 (en) * | 2016-09-20 | 2020-03-03 | Google Llc | System and method for transmitting a response in a messaging application |
JP6723188B2 (ja) * | 2017-04-17 | 2020-07-15 | 日本電信電話株式会社 | 対話ルール選択装置、対話装置、対話ルール選択方法、対話方法、及び対話ルール選択プログラム |
JP6943192B2 (ja) * | 2018-01-24 | 2021-09-29 | 沖電気工業株式会社 | 家電機器および場所検索システム |
WO2019160152A1 (ja) * | 2018-02-19 | 2019-08-22 | Arithmer株式会社 | 対話管理サーバ、対話管理方法、及びプログラム |
JP7041355B2 (ja) * | 2018-10-18 | 2022-03-24 | 日本電信電話株式会社 | 技術名・サービス名生成装置とその方法 |
CN109492222B (zh) * | 2018-10-31 | 2023-04-07 | 平安科技(深圳)有限公司 | 基于概念树的意图识别方法、装置及计算机设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4539149B2 (ja) * | 2004-04-14 | 2010-09-08 | ソニー株式会社 | 情報処理装置および情報処理方法、並びに、プログラム |
JP2009003811A (ja) * | 2007-06-22 | 2009-01-08 | Toyota Central R&D Labs Inc | 属性判別装置、対話装置、及びプログラム |
-
2011
- 2011-07-22 JP JP2011161405A patent/JP5620349B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021547A (zh) * | 2016-11-04 | 2018-05-11 | 株式会社理光 | 一种自然语言的生成方法、自然语言生成装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2013025648A (ja) | 2013-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
US10642939B2 (en) | Systems and methods for generating jokes | |
Tucker et al. | The massive auditory lexical decision (MALD) database | |
JP6505903B2 (ja) | 会話型相互作用システムの検索入力におけるユーザ意図を推定する方法およびそのためのシステム | |
US10878817B2 (en) | Systems and methods for generating comedy | |
CN107944027B (zh) | 创建语义键索引的方法及系统 | |
US9805718B2 (en) | Clarifying natural language input using targeted questions | |
JP5149737B2 (ja) | 自動会話システム、並びに会話シナリオ編集装置 | |
US8036894B2 (en) | Multi-unit approach to text-to-speech synthesis | |
KR102101044B1 (ko) | 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법 | |
Malandrakis et al. | Distributional semantic models for affective text analysis | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
US9548052B2 (en) | Ebook interaction using speech recognition | |
US11080485B2 (en) | Systems and methods for generating and recognizing jokes | |
US8359200B2 (en) | Generating profiles of words | |
JP5073024B2 (ja) | 音声対話装置 | |
CN100583086C (zh) | 对话控制系统和对话控制方法 | |
JP7091146B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
Fan et al. | Just speak it: Minimize cognitive load for eyes-free text editing with a smart voice assistant | |
WO2015040751A1 (ja) | 音声選択支援装置、音声選択方法、およびプログラム | |
Zee et al. | Paradigmatic relations interact during the production of complex words: Evidence from variable plurals in Dutch | |
JP5636309B2 (ja) | 音声対話装置および音声対話方法 | |
Otake et al. | Lexical selection in action: Evidence from spontaneous punning | |
Ramesh et al. | ‘Beach’to ‘Bitch’: Inadvertent Unsafe Transcription of Kids’ Content on YouTube | |
JP6260208B2 (ja) | テキスト要約装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140129 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140530 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140822 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140918 |
|
LAPS | Cancellation because of no payment of annual fees |