WO2018169001A1

WO2018169001A1 - 対話システム、対話装置及びそのためのコンピュータプログラム

Info

Publication number: WO2018169001A1
Application number: PCT/JP2018/010231
Authority: WO
Inventors: 阿部　憲幸; 可奈子大西; 健太郎鳥澤; カナサイクルンカライ; 豊木俵
Original assignee: 国立研究開発法人情報通信研究機構
Priority date: 2017-03-16
Filing date: 2018-03-15
Publication date: 2018-09-20
Also published as: JP6804763B2; JP2018156272A

Abstract

【課題】ある特徴に特化した対話を行える対話システムを提供する。【解決手段】対話装置６６は、複数の評価項目（例えば発話が表す感情）に関する基準値を設定する入出力装置９８及び応答発話選択基準記憶部１００と、入力発話に対して複数の応答発話候補を生成する応答発話候補選択部９０と、複数の応答発話候補の各々について、評価項目の各々に関する評価値を算出する応答発話感情分析部９４と、複数の応答発話候補のうち、評価値が基準値に最も近い応答発話候補を入力発話６２に対する応答発話６８として選択する応答発話選択・生成部９６とを含む。

Description

対話システム、対話装置及びそのためのコンピュータプログラム

　この発明はコンピュータを用いた対話システムに関し、特に、ある特徴（高齢者向け又は学習者向けを含むが、それに限定されない）に特化した、その特徴に応じた「らしさ」を持つ応答を行うことができる対話装置に関する。本出願は、２０１７年３月１６日に日本国に出願した出願番号２０１７－０５１５０３を基礎とする優先権を主張しており、その全体をここに参照により援用する。

　コンピュータを用いた対話システムが実用化されている。そうしたシステムの応用例として、特定の目的に合致した対話システムが今後必要になってくる。例えば、一人暮らしの高齢者に対しては、一般的な世間話を行ったり高齢者が好む話題を取り上げたりする対話システムが望ましい。また、大学受験にむけて勉強を行っている学習者に対しては、学習に役立つような応答を行うことができる対話システムが望ましい。

　従来、そうした対話システムは、目的に合致した入力文と応答文との対を収集してデータベース化し、入力された発話に対する応答文として適切な応答をデータベースから選択するという手法により構築されている。音声を用いてそうした応答を行うものが特許文献１に開示されている。

　特許文献１に開示されたシステムは、特定のドメインにおける話題について人と対話するシステムである。このシステムは、意図理解部を持つ。意図理解部は、入力発話を解析し、発話者がドメインにおけるどのような情報を知りたがっているか、すなわち発話者の意図を理解する。そのために意図理解部は、意図理解モデルと問題解決知識の記憶装置を持つ。意図理解モデルは、意図ごとに様々な言い方からなる文例を集めたものであり、発話文が含む単語及びその表現パターンが示す意図をデータベース化したものである。問題解決知識は、発話表現とその解決策との対応関係を集めたものである。

　このシステムでは、発話の意図を意図理解モデルにより理解し、その意図により、応答すべき問題を特定して、問題解決知識を検索してその問題に対する回答からなる応答を生成し、出力する。

特開２０１６－０９９３８１号公報

　しかし、特許文献１に開示されたシステム構成では、意図理解モデルを構築するためには様々な発話を収集し、各発話の意図を人手で付与しなければならないという問題がある。そのため、結局、各ドメインについて専用の意図理解モデルを構築する必要がある。また、特許文献１に開示されたシステムでは、応答としては単純な事実を与えればよいだけであるが、適切な対話を可能とするためには、各意図に対する応答候補を準備し、応答候補データベースとして準備しなければならない。しかもこの応答候補データベースもドメインごとに準備する必要がある。したがって、適切な応答を行うことができる対話システムを様々な分野において容易に構築するのは、特許文献１に開示された技術では行うことができない。すなわち、特許文献１に開示された技術では、ある特徴に特化して適切な応答を行える対話システムを構築するのは容易ではない。

　それゆえに本発明は、発話に対して適切な応答を行うことができる対話システムであって、さまざまな特徴に対応した対話を行えるものを提供することを目的とする。

　本発明の第１の局面に係る対話装置は、予め定められた一組の評価項目に関する基準値を設定するための基準値設定手段と、入力発話に対して複数の応答発話候補を生成するための応答発話候補生成手段と、複数の応答発話候補の各々について、一組の評価項目の各々に関する評価値を算出するための評価手段と、複数の応答発話候補の内、評価手段による評価値が基準値に対して予め定める関係にある応答発話候補を入力発話に対する応答発話として選択するための応答発話選択手段とを含む。

　好ましくは、一組の評価項目は、複数の項目を含み、評価手段は、発話が与えられると、当該発話が複数の項目に合致する度合いを示すスコアを複数の項目の各々について出力するように機械学習により学習済のモデルを用いるための判別手段を含む。

　より好ましくは、一組の評価項目は、当該一組の評価項目の値に対応して１点が定められる評価空間を定義し、応答発話選択手段は、評価空間内において、応答発話候補の内、対応する点が基準値により定められる点に最も近いものを入力発話に対する応答発話として選択するための手段を含む。

　さらに好ましくは、一組の評価項目は、複数の項目を含む第１の評価項目と、第１の評価項目とは独立な第２の評価項目とを含み、評価手段は、複数の応答発話候補の各々について、第１の評価項目の複数の項目の各々について評価値を算出するための第１の評価手段と、複数の応答発話候補の各々について、第２の評価項目について評価値を算出するための第２の評価手段とを含む。

　好ましくは、複数の項目は、複数の項目の値に対応して１点が定められる評価空間を定義し、応答発話選択手段は、評価空間内において、応答発話候補の内、対応する点が基準値により定められる点から一定の範囲内にあるものを抽出するための候補抽出手段と、候補抽出手段により抽出された応答発話候補の内、第２の評価項目による評価値が、基準値とは独立な基準を充足するものを応答発話として選択するための手段とを含む。

　本発明の第２の局面に係る対話システムは、上記したいずれかの対話装置と、複数の学習用テキストの各々を、一組の評価項目にしたがった評価値と関係づけて記憶するテキスト記憶装置と、テキスト記憶装置に記憶された複数の学習用テキストを学習データとして、入力発話が与えられると、一組の評価項目に関する評価値を推定し出力するよう、機械学習により評価手段の学習を行うための学習手段とを含む。

　本発明の第３の局面に係るコンピュータプログラムは、コンピュータを、上記したいずれかの装置の各手段として機能させる。

本発明の第１の実施の形態に係る対話システムの概略構成を示すブロック図である。図１に示す大規模テキストデータベースに記憶されたテキスト例を示す図である。図１に示すテキスト抽出・分類部を実現するコンピュータプログラムの制御構造を示すフローチャートである。図３に示すテキスト抽出・分類部により分類された学習用テキストの構成を示す図である。図１に示す感情判定モデルの概略構成を示す図である。図１に示す会話文データベースに記憶された会話文の例を示す図である。図１に示す応答発話候補選択部を実現するコンピュータプログラムの制御構造を示すフローチャートである。図１に示す応答発話感情分析部を実現するコンピュータプログラムの制御構造を示すフローチャートである。応答発話候補の感情スコアの例を示す図である。ユーザが望む応答発話の傾向を設定するために入出力装置に表示されるダイアログボックスの例を示す図である。図１に示す応答発話選択・生成部による応答発話選択の方法を説明するための、探索空間を示す模式図である。応答発話選択・生成部を実現するコンピュータプログラムの制御構造を示すフローチャートである。本発明の第２の実施の形態に係る対話システムの概略構成を示すブロック図である。図１３に示す特定サイトらしさ／ニュースらしさスコア算出部により算出される各文のスコア例を示す図である。図１３に示す応答発話選択・生成部を実現するコンピュータプログラムの制御構造を示すフローチャートである。本発明の第３の実施の形態に係る対話システムの概略構成を示すブロック図である。図１６に示す応答発話感情分析部、特定サイトらしさスコア算出部及びニュースらしさスコア算出部により各文に対して算出されるスコア例を示す図である。本発明の各実施の形態に係る対話システム実現するコンピュータの外観を示す図である。図１８に示すコンピュータのハードウェア構成を示すブロック図である。

　以下の説明及び図面では、同一の部品には同一の参照番号を付してある。したがって、それらについての詳細な説明は繰返さない。

　［第１の実施の形態］
　＜構成＞
　図１に、本発明の第１の実施の形態に係る対話システム４０のブロック図を示す。図１を参照して、この対話システム４０は、ウェブから収集した大量のテキストをそのＵＲＬとともに記憶した大規模テキストデータベース５２と、予めこの大規模テキストデータベースから抽出された、評価項目としての一組の感情語を記憶した感情語辞書５４と、後に感情語のいずれかが現れることが多い語（ここでは「接続語」と呼ぶ。）を記憶した接続語辞書５６と、感情語辞書５４に記憶された感情語の各々について、入力された文がそれらに合致するスコアを算出するよう、事前に機械学習済の感情判定モデル６０と、大規模テキストデータベース５２、感情語辞書５４及び接続語辞書５６を用いて感情判定モデル６０の機械学習を行うためのモデル学習部５８とを含む。

　図２を参照して、大規模テキストデータベース５２には、多くのテキストが格納されている。図２に示す例文において、単語１５０、１５２、１５４、１５６及び１５８は何らかの感情を表す単語である。各単語の前に存在する単語１３０、１３２、１３４、１３６及び１３８は、これら感情語を導くために特徴的に使用される接続語である。最初に、後ろに感情語を伴うことが多い接続語を収集し、接続語辞書５６に格納する。そして大規模テキストデータベース５２から各接続語に後続する単語を集める。そうした単語が感情を表すものであれば感情語辞書５４に格納し、そうでなければ捨てる。本実施の形態では、同根の感情語であっても語形が異なるものは別々の感情語とする。したがって感情語の数はかなり多くなる。

　再び図１を参照して、モデル学習部５８は、感情語辞書５４及び接続語辞書５６を参照して、大規模テキストデータベース５２から接続語辞書５６に記憶された接続語のいずれかと、感情語辞書５４に記憶された感情語のいずれかが連続して現れるテキストを抽出し、各テキストにそのテキストが含む感情語をラベルとして付して出力するテキスト抽出・分類部８０と、テキスト抽出・分類部８０から出力されるラベル付きのテキストを感情判定モデル６０の学習用として記憶する学習用テキスト記憶部８２と、学習用テキスト記憶部８２に記憶された学習用テキストを用いて感情判定モデル６０の学習を行う学習処理部８４とを含む。

　本実施の形態では、テキスト抽出・分類部８０は、コンピュータプログラムにより実現される。図３を参照して、このプログラムは、感情語辞書５４から全ての感情語を読出すステップ２００と、接続語辞書５６から全ての接続語を読出すステップ２０２と、ステップ２０２で読出された先行する接続語と、ステップ２００で読出された後続する感情語とからなる全ての単語列の組合せのいずれかを含むテキストを大規模テキストデータベース５２から検索するための検索式を生成するステップ２０４と、ステップ２０４で生成された検索式を用いて大規模テキストデータベース５２から条件を満たすテキストを全て抽出するステップ２０６と、ステップ２０６で抽出されたテキストの各々に対し、以下に説明する処理２１０を実行するステップ２０８とを含む。

　処理２１０は、処理対象となっているテキストの内、接続語の前までを抽出するステップ２２０と、ステップ２２０で抽出されたテキストに、検索された感情語をラベルとして付すステップ２２２と、ステップ２２０で抽出され、ステップ２２２で感情語のラベルが付されたテキストを学習データとして学習用テキスト記憶部８２に格納するステップ２２４とを含む。

　図４に、図１に示す学習用テキスト記憶部８２に格納されたテキストの集合を模式的に示す。図４を参照して、各テキストには感情語（嬉しい、悲しい、楽しい、しんどい）が付されている。これら感情語が後述するように応答発話を選択する際の評価項目となる。このラベルによりテキストはグループに分けられる。学習処理部８４における感情判定モデル６０の学習は、テキストが入力されると、そのテキストが学習用テキスト記憶部８２に記憶されたテキストに付されたラベル（感情語）の各々について、そのラベルにより表される感情に合致するテキストである確率を出力するように行われる。ここでの確率は、そのテキストがそのラベルにより表される感情を表すものである「らしさ」を示す、すなわちその感情に合致する度合いを示すスコアと考えることができる。ラベルは複数個あり、確率はこれら各ラベルを排他的な評価項目として取り扱うことにより算出される。

　図５に感情判定モデル６０の構成を概念的に示す。本実施の形態では、感情判定モデル６０はコンボリューショナル・ニューラル・ネットワーク（ＣＮＮ）からなる。感情判定モデル６０は、入力されるテキストを構成する単語列が入力される複数個の入力２４０と、感情語辞書５４に記憶された感情語の数だけの出力２４２とを持つ。本実施の形態では、入力される単語はいずれも、図示しない単語変換部により単語の識別子に変換され、入力２４０として与えられる。出力２４２の各々は感情語辞書５４に記憶された感情語のいずれかに対応する。入力２４０に処理対象のテキストの単語列が与えられると、そのテキストが各感情語により表される感情に合致する確率が、各感情語に対応する出力に得られる。

　再び図１を参照して、対話システム４０はさらに、大量の会話文を記憶した会話文データベース６４と、入力発話６２を受け、感情判定モデル６０を用いて、会話文データベース６４から入力発話６２に対する適切な応答発話６８を選択し出力する対話装置６６とを含む。

　図６に、会話文データベース６４に記憶された会話文の例を示す。会話文データベース６４には、図６に示すような会話文が予め大量に収集され記憶されている。こうした会話文はどのようにして収集しても良いが、本実施の形態ではウェブ及びソーシャル・ネットワーキング・サービス上に存在する文を収集した。これら会話文は、そのテキストに基づいて検索可能となっている。

　再び図１を参照して、対話装置６６は、入力発話６２に応答して、会話文データベース６４に記憶された応答発話から応答発話候補の文を生成（本実施の形態では選択）する応答発話候補選択部９０と、応答発話候補選択部９０により選択された応答発話候補を記憶する応答発話候補記憶部９２と、応答発話候補記憶部９２に記憶された各応答発話候補について、感情判定モデル６０を参照して各感情の評価値である感情スコアを算出する応答発話感情分析部９４と、応答発話を選択するための基準をユーザが設定する際に使用する入出力装置９８と、入出力装置９８により設定された応答発話選択の基準を記憶する応答発話選択基準記憶部１００と、応答発話選択基準記憶部１００に記憶された応答発話選択基準にしたがって、応答発話感情分析部９４により算出されたスコアに基づいて、応答発話候補記憶部９２に記憶された応答発話候補の１つを選択して応答発話６８として出力する応答発話選択・生成部９６とを含む。

　図１に示す応答発話候補選択部９０は、本実施の形態では入力発話６２に含まれる単語の内、最も重要な単語を抽出し、その単語を含む会話文を会話文データベース６４から抽出する。重要な単語としては、例えばtf/idf値が最大のものを採用できる。応答発話候補選択部９０は、本実施の形態ではコンピュータプログラムにより実現される。図７にそのコンピュータプログラムの制御構造をフローチャート形式で示す。

　図７を参照して、このプログラムは、入力発話６２に含まれる内容語を抽出するステップ２８０と、ステップ２８０で抽出された内容語のいずれかを含む会話文を会話文データベース６４から検索し抽出するステップ２８２と、ステップ２８２で抽出された会話文について、入力発話６２の内容語と一致する内容語の数の多いものから順番に所定個数を選択するステップ２８４と、ステップ２８４で選択された会話文を応答発話候補として格納するステップ２８６とを含む。

　図１に示す応答発話感情分析部９４も本実施の形態ではコンピュータプログラムにより実現される。図８を参照して、このプログラムは、応答発話候補記憶部９２に記憶された応答発話候補の各々に対して以下に述べるスコア算出処理３１０を実行するステップ３００を含む。

　スコア算出処理３１０は、処理対象の応答発話候補の感情スコアを算出する処理である。スコア算出処理３１０は、処理対象の応答発話候補を応答発話候補記憶部９２から読出すステップ３２０と、ステップ３２０で読出された応答発話候補を構成する単語の各々を識別子に変換して連結することにより、感情判定モデル６０への入力パラメータを作成するステップ３２２と、ステップ３２２により作成された入力パラメータを図５に示す感情判定モデル６０の入力２４０に与えるステップ３２４と、ステップ３２４により与えられた入力パラメータに応答して感情判定モデル６０の出力２４２に得られるスコアのベクトルの各要素（確率値）を、処理中の応答発話候補に対応するスコア配列に格納するステップ３２６とを含む。

　スコア配列は各応答発話候補に対応して準備される。したがって得られるこのスコア配列は２次元である。図９にスコア配列の例を示す。図９に示す例は、４つの応答発話候補の各々に対して算出された感情スコアを示している。例えば、応答発話候補「チョコレートを食べた」について算出された、「嬉しい」、「悲しい」、「楽しい」、及び「しんどい」という感情スコアはそれぞれ０．５、０．１、０．３及び０．１である。これらスコアは確率であるから、図９に示す各行のスコアを横に加えた値は１となる。

　図１０は、図１に示す入出力装置９８に表示される、応答発話選択の基準を設定するダイアログの例である。図１０を参照して、このダイアログ３４０は、「嬉しい」、「悲しい」、「楽しい」、及び「しんどい」という４つの感情の各々について、０から１の範囲でスコアの基準値を設定するために、４つのシークバー３６０、３６２、３６４及び３６６を持つ。各シークバー３６０、３６２，３６４及び３６６はそれぞれサム３７０、３７２、３７４及び３７６を持ち、これらサムを左右に移動させることにより各感情に対するスコアの基準値を設定できる。なお、本実施の形態では、各スコアの合計は１という制約がある。したがって、例えばあるシークバーのサムを左右に移動させたときにはその値を１から引き、それを残りの３つの感情のそれまで設定されていた基準値に応じて各感情に配分する必要がある。したがって、あるサムを移動させると、そのたびに他のサムも左右に移動することになる。

　図１１に、図１に示す応答発話選択・生成部９６による応答発話の選択方法を示す。例えば３つの感情スコアを各評価項目の評価値と考えた場合、これら感情スコアを各軸に対応付けることにより、図１１に示すような３次元の立方体により囲まれた評価のための空間（評価空間）を考えることができる。この評価空間では、応答発話のスコアごとに対応する１点が定義できる。さらに、応答発話選択基準記憶部１００に記憶された基準値に応じ、この評価空間内に基準点３９０を定めることができる。応答発話選択・生成部９６は、応答発話感情分析部９４により各応答発話候補に対して計算されたスコアを座標として用いることにより、各応答発話候補をこの評価空間内の１点に割り当て、その点と基準点３９０との間のユークリッド距離（以下、単に「距離」という。）を計算する。そして、基準点３９０との間の距離が最も小さな応答発話候補を応答発話６８として選択する。なお、本実施の形態では、計算時間を短縮するために、基準点３９０を中心とした所定の探索範囲３９２内にある応答発話候補のみを抽出して距離の計算対象とする。ここでは距離としてユークリッド距離を用いているが、一般的に距離が満たすべき数学的条件を満たす測度であればどのようなものを用いても良い。

　本実施の形態では、この応答発話選択・生成部９６もコンピュータプログラムにより実現される。図１２を参照して、このプログラムは、応答発話選択基準記憶部１００から基準値を読出すステップ４００と、探索範囲３９２を定めるステップ４０２とを含む。探索範囲３９２は、例えば各座標の値について基準値±αの範囲に定めることができる。αは本実施の形態では全ての座標について共通の定数値とする。しかし本発明はそのような実施の形態には限定されない。αを基準値の各座標値の例えば１／２０等として座標別（感情別）に定めることもできる。又は、特定の座標については固定値とし、他の座標については基準値により変化させることもできる。

　このプログラムはさらに、感情スコアを構成する各値が、ステップ４０２で定めた探索範囲３９２内に存在する応答発話候補のみを応答発話候補記憶部９２に記憶された候補から抽出するステップ４０４と、距離の最小値を記憶する変数にその変数の型で許容される最大数を代入するステップ４０６と、応答発話を表す変数に、予め定めたデフォルトの文を代入するステップ４０８と、ステップ４０４で抽出された応答発話候補の各々について以下に説明する処理４１２を実行することにより、基準点３９０からの距離が最小となる応答発話候補を選択するステップ４１０と、ステップ４１０で選択された応答発話候補を応答発話６８として出力するステップ４１４とを含む。

　処理４１２は、処理対象の応答発話候補と、基準点３９０との距離を計算するステップ４２０と、ステップ４２０で計算された距離が、これまでに計算された最小値より小さいか否かを判定し、判定が否定なら現在の応答発話候補に対する処理４１２を終了するステップ４２２と、ステップ４２２の判定が肯定であれば、最小値にステップ４２０で計算された距離を代入し、応答発話を表す変数に処理中の応答発話候補を代入して処理４１２を終了するステップ４２４とを含む。

　［動作］
　以上に構成を説明した対話システム４０は以下のように動作する。動作には２つのフェーズがある。第１はモデル学習部５８による感情判定モデル６０の学習フェーズであり、第２は対話装置６６による対話動作フェーズである。

　〈学習フェーズ〉
　大規模テキストデータベース５２には大量のテキストを格納し、データベース化する。また、接続語辞書５６には予め接続語を格納しておき、感情語辞書５４には接続語辞書５６を用いて大規模テキストデータベース５２から抽出した感情語を格納しておく。

　学習時、テキスト抽出・分類部８０は、大規模テキストデータベース５２から、接続語辞書５６に記憶された接続語のいずれかと、感情語辞書５４に記憶された感情語のいずれかが連続して現れるテキストを抽出し、各テキストにそのテキストが含む感情語をラベルとして付して出力する。学習用テキスト記憶部８２は、これらラベル付きのテキストを記憶する。学習処理部８４は、学習用テキスト記憶部８２に記憶された学習用テキストを用いて感情判定モデル６０の学習を行う。感情判定モデル６０は前述したとおりＣＮＮからなる。したがってこの感情判定モデル６０の学習は、通常のニューラルネットワークと同様、誤差逆伝播方式により行える。こうして大規模テキストデータベース５２に記憶された全てのテキストについて感情判定モデル６０の学習が終わると、対話装置６６による応答発話処理が可能になる。

　［対話動作フェーズ］
　会話文データベース６４には予め大量の会話文を格納し、テキストに含まれる任意の文字列に基づいて検索できるようデータベース化しておく。また、実際に対話動作を行う前に、ユーザは入出力装置９８を用いて、図１０に示すようなダイアログ３４０を表示させ、応答の基準値を設定する。設定された基準値は応答発話選択基準記憶部１００に記憶される。

　入力発話６２が対話装置６６の応答発話候補選択部９０に与えられると、応答発話候補選択部９０は、会話文データベース６４から応答発話候補の会話文を選択する。具体的には、応答発話候補選択部９０は、入力発話６２から内容語を抽出し（図７、ステップ２８０）、その内容語を含む会話文を会話文データベース６４から抽出する（ステップ２８２）。さらに応答発話候補選択部９０は、入力発話６２のうちで重要な単語を抽出し、それら会話文の内で、この重要な単語を含むものを応答発話候補として抽出し（ステップ２８４）、応答発話候補記憶部９２に格納する（ステップ２８６）。

　応答発話感情分析部９４は、応答発話候補記憶部９２に記憶された各応答発話候補について、感情判定モデル６０を参照して感情スコアを算出する。より具体的には、応答発話感情分析部９４は、応答発話候補記憶部９２に記憶された応答発話候補を読み（図８のステップ３２０）、感情判定モデル６０への入力パラメータをその応答発話候補を構成する単語列から作成する（ステップ３２２）。この入力パラメータを感情判定モデル６０の入力２４０（図５参照）に入力して感情判定モデル６０の出力を待ち（ステップ３２４）、感情判定モデル６０の出力２４２（図５参照）に得られるスコアのベクトルの各要素（確率値）を処理中の応答発話候補に対応するスコア配列に格納する（ステップ３２６）。この処理により、図９に示すような２次元配列が得られる。

　応答発話選択・生成部９６は、応答発話選択基準記憶部１００から基準値を読出す（図１２、ステップ４００）。応答発話選択・生成部９６はさらに、この基準値に基づいてその基準値±αの範囲を図１１に示す探索範囲３９２に決定する（ステップ４０２）。応答発話選択・生成部９６は、図１に示す応答発話候補記憶部９２に記憶された応答発話の内、応答発話感情分析部９４に算出された感情スコアが探索範囲内３９２にあるもののみを抽出する（ステップ４０４）。さらに応答発話選択・生成部９６は、距離の最小値を表す変数に、その変数のとり得る最大値を代入し（ステップ４０６）、応答発話を表す変数にデフォルト文を代入する（ステップ４０８）。

　応答発話選択・生成部９６はさらに、ステップ４０４で抽出された各応答発話候補に対し、その応答発話候補と基準点３９０との間の距離を計算する（ステップ４２０）。この距離がこれまでに算出された最小値より小さければ（ステップ４２２でＹＥＳ）、この距離を最小値に代入し、応答発話を表す変数にこの応答発話候補を代入して（ステップ４２４）、次の応答発話候補に処理を移す。ステップ４２２の判定が否定（ステップ４２２でＮＯ）ならこの応答発話候補については何もせず、次の応答発話候補に処理を移す。

　こうして、全ての応答発話候補に対する処理４１２が終了すると、応答発話を表す変数には、図１１に示す基準点３９０との距離が最も小さな応答発話候補が格納されている。応答発話選択・生成部９６は、この応答発話候補を応答発話６８（図１）として出力する（図１２、ステップ４１４）。

　以上のようにこの実施の形態によれば、ユーザが設定した感情スコアの配列に最も近い応答発話候補が応答発話として選択される。そのため、ユーザが対話として楽しいものを望むときには「楽しい」という感情のスコアが大きくなるように図１０に示すダイアログ３４０を用いて基準値を設定すれば、ユーザの望みに応じた楽しい会話を行うことができる。さらに、上記実施の形態では、感情語辞書５４及び接続語辞書５６を十分に準備することにより、感情語辞書５４に記憶された感情語の範囲で任意の組合せを選び、対話装置６６で選択できる。そのため、汎用性が極めて高い対話システムを得ることができる。

　［第２の実施の形態］
　上記第１の実施の形態では、対話における感情に焦点を当てている。しかし本発明はそのような実施の形態には限定されない。例えば、多数のユーザが多くの発言を行うようなサイトでは、そのサイト特有の発言スタイルが形成されていたり、特有の話題に焦点があった発言のみが行われていたりする。例えば２ｃｈ（登録商標）等が有名である。ユーザがこうしたサイトでの発言を読むことを好んでいる場合、対話でも同じような発言スタイルを採用したり、特定の話題に関する話題に焦点が当てられていたりすることを望む場合があり得る。この第２の実施の形態は、第１の実施の形態で採用されていた「感情」に代えて、こうした発話スタイルを基準にした対話を可能にする。特にこの実施の形態は、特定サイトでの発言スタイルに近い発言をし、かつ、そのような特定サイトらしさとは独立に、発言の内容として最近のニュースに関する話題を扱うような対話システムを提供する。

　図１３を参照して、第２の実施の形態に係る対話システム４３０は、大規模テキストデータベース５２と、特定サイト及びニュースサイトのＵＲＬを格納した特定サイト／ニュースＵＲＬリスト４５２と、第１の実施の形態と同様にＣＮＮからなり、発話が特定サイトのいずれかから得られた確率とそれ以外のサイトから得られた確率とを出力する特定サイト判別モデル４４８と、特定サイト判別モデル４４８とは独立に、入力発話がニュース記事である確率とそれ以外のサイトから得られた確率とを出力するニュース判別モデル４５０と、大規模テキストデータベース５２及び特定サイト／ニュースＵＲＬリスト４５２を用いて、特定サイト判別モデル４４８及びニュース判別モデル４５０の学習を行うモデル学習部４４０とを含む。すなわち、特定サイト判別モデル４４８は発話が特定サイトから得られたか否かを評価項目とするのに対し、ニュース判別モデル４５０は、発話がニュース記事であるか否かという、特定サイト判別モデル４４８の評価項目とは独立なことがらを評価項目としている。

　対話システム４３０はさらに、ウェブ上から、対話の入力文とその応答文とのペアを大量に収集しデータベース化して得た入力・応答データベース４４４と、入力発話４４２に応答して、特定サイト判別モデル４４８及びニュース判別モデル４５０を参照して、入力・応答データベース４４４に格納された入力・応答の内で、入力発話４４２に近い入力発話とペアになった応答発話であって、ユーザが設定した「特定サイトらしさ」に近い発話スタイルを持ち、かつニュースらしさとしては最も高いスコアを持つ応答発話を選択して応答発話４５４として出力する対話装置４４６とを含む。

　モデル学習部４４０は、特定サイト／ニュースＵＲＬリスト４５２を参照して、大規模テキストデータベース５２に格納されたテキストを、特定サイトのＵＲＬから収集したテキストとそれ以外からのテキストとに分類した第１のテキスト集合、及びニュース記事であるテキストとそれ以外のテキストとに分類した第２のテキスト集合を作成し、出所を示すラベル（特定サイト／それ以外、ニュース記事／それ以外）を付して、それぞれ出力するテキスト分類部４６０と、第１のテキスト集合を記憶する第１の学習用テキスト記憶部４６２と、第２のテキスト集合を記憶する第２の学習用テキスト記憶部４６３と、第１の学習用テキスト記憶部４６２に記憶された学習用テキストを用いて特定サイト判別モデル４４８の学習を行うための第１の学習処理部４６４と、第２の学習用テキスト記憶部４６３に記憶されたテキストを用いてニュース判別モデル４５０の学習を行う第２の学習処理部４６５とを含む。

　特定サイト判別モデル４４８及びニュース判別モデル４５０はいずれも、図５に示す感情判定モデル６０と基本的には同じ構成である。しかし、特定サイト判別モデル４４８の場合にはテキストが特定サイトのＵＲＬ及びそれ以外のＵＲＬ得られたものである確率をそれぞれ示す２つの出力を持つ点、ニュース判別モデル４５０の場合にはテキストがニュース記事である及びそれ以外である確率をそれぞれ示す２つの出力を持つ点でいずれも感情判定モデル６０とは異なる。

　対話装置４４６は、入力発話４４２に応答して、入力・応答データベース４４４において、入力発話４４２に類似した入力発話を持つペアを検索し、検索されたペアの応答発話を応答発話候補として選択する応答発話候補選択部４７０と、応答発話候補選択部４７０により選択された応答発話候補を記憶する応答発話候補記憶部４７２と、応答発話候補記憶部４７２に記憶された応答発話候補の各々について、ニュース判別モデル４５０を参照してニュース記事である確率を算出し、ニュースらしさを示すスコアとして出力するニュースらしさスコア算出部４７４と、応答発話候補記憶部４７２に記憶された応答発話候補の各々について、特定サイト判別モデル４４８を参照して特定サイトのサイトから得られたものである確率を算出し、特定サイトらしさを示すスコアとして出力する特定サイトらしさスコア算出部４７５とを含む。応答発話候補選択部４７０による、類似した発話の検索には、例えば発話に含まれる単語からなる単語ベクトル間の類似度を用いたり、２つの発話の間の編集距離を用いたりすることが可能である。

　対話装置４４６はさらに、応答発話を選択するための基準を設定するためにユーザが用いる入出力装置４７８と、入出力装置４７８により設定された基準を記憶する応答発話選択基準記憶部４８０とを含む。本実施の形態では、応答発話の選択基準として設定できるのは特定サイトからの発話らしさのみである。ニュースらしさの選択基準はユーザにより設定されたものではなく、本実施の形態では最も高いもの、という基準を充足すること、というものである。

　対話装置４４６はさらに、特定サイトらしさスコア算出部４７５により計算された各応答発話候補の内で、特定サイトらしさのスコアがその基準値を中心とする所定範囲内にある応答発話候補のみを探索対象とし、その中でニュースらしさスコアが最高の応答発話候補を選択して応答発話４５４として出力する応答発話選択・生成部４７６を含む。

　図１４に、ある応答発話候補の文について特定サイトらしさスコア算出部４７５により算出される特定サイトらしさのスコアとニュースらしさスコア算出部４７４により算出されるニュースらしさのスコアの例を示す。この例では、各スコアはそれぞれ別のモデルにより算出される。第１の実施の形態の場合と異なり、各文に対して算出されたスコアはそれぞれ０～１の範囲に分布する。したがってそれらの値を合計しても必ずしも１にはならず、０から２の範囲内の値となる点に注意が必要である。

　図１５に、応答発話選択・生成部４７６を実現するコンピュータプログラムの制御構造をフローチャート形式で示す。図１５を参照して、このプログラムは、応答発話選択基準記憶部４８０に記憶された基準値（特定サイトらしさのスコア）を読出すステップ４９０と、読出したスコアを中心とする所定範囲（基準値±α）を応答発話候補の探索範囲として定めるステップ４９２と、特定サイトらしさのスコアがステップ４９２で定められた探索範囲内にある応答発話候補のみを抽出するステップ４９４とを含む。

　このプログラムはさらに、ステップ４９４で抽出された応答発話候補を、ニュースらしさのスコアの降順でソートするステップ４９６と、ステップ４９６でソートされた応答発話候補の内で、先頭の応答発話候補を応答発話として選択し出力するステップ４９８とを含む。

　〈動作〉
　この第２の実施の形態に係る対話システム４３０は以下のように動作する。予め大規模テキストデータベース５２及び入力・応答データベース４４４を準備しておくことは第１の実施の形態と同様である。この対話システム４３０にも動作フェーズは学習と対話との２つがある。

　学習フェーズでは、モデル学習部４４０のテキスト分類部４６０は、特定サイト／ニュースＵＲＬリスト４５２を参照しながら、大規模テキストデータベース５２に記憶されたテキストを、特定サイトからのテキストとそれ以外のテキストに分類して第１のテキスト集合を作成し、第１の学習用テキスト記憶部４６２に格納する。テキスト分類部４６０はさらに、大規模テキストデータベース５２に記憶されたテキストを、ニュース記事のテキスト及びそれ以外のテキストに分類して第２のテキスト集合を作成し、第２の学習用テキスト記憶部４６３に格納する。この際、各テキストにはその出所を示すラベル（特定サイト／それ以外、ニュース記事／それ以外）が付される。

　第１の学習処理部４６４は第１の学習用テキスト記憶部４６２に記憶されたテキストの集合を用いて特定サイト判別モデル４４８の学習を行う。第２の学習処理部４６５は、第２の学習用テキスト記憶部４６３に記憶されたテキストの集合を用いてニュース判別モデル４５０の学習を行う。この学習の結果、発話のテキストが与えられると、特定サイト判別モデル４４８はその発話が特定サイトからか否かを示す２つの確率を出力し、ニュース判別モデル４５０はその発話がニュース記事であるか否かを示す２つの確率を出力する。特定サイトからのテキストである確率が特定サイトらしさのスコアであり、ニュース記事のテキストである確率がニュースらしさのスコアである。

　特定サイト判別モデル４４８及びニュース判別モデル４５０の学習が終了すると、対話装置４４６による対話処理が可能になる。

　〈対話〉
　図１３を参照して、入力発話４４２が与えられると、対話装置４４６の応答発話候補選択部４７０は、入力・応答データベース４４４に記憶されている入力・応答ペアの内、入力が入力発話４４２に類似しているものを所定個数検索し、対応する応答を応答発話候補として選択し応答発話候補記憶部４７２に格納する。

　ニュースらしさスコア算出部４７４は、応答発話候補記憶部４７２に記憶された各応答発話候補について、ニュース判別モデル４５０を用いてニュースらしさを算出する。特定サイトらしさスコア算出部４７５も同様に、各応答発話候補について、特定サイト判別モデル４４８を用いて特定サイトらしさを算出する。これらは各応答発話候補に関するスコアとして、図１４に示すような２次元配列として記憶され応答発話選択・生成部４７６に与えられる。

　応答発話選択・生成部４７６は、応答発話選択基準記憶部４８０に記憶された特定サイトらしさの基準値を読出し（図１５，ステップ４９０）、その基準値を中心とした基準値±αの範囲を応答発話候補の探索範囲に設定する（ステップ４９２）。応答発話選択・生成部４７６はさらに、探索範囲内の特定サイトスコアを持つ応答発話候補の中で（ステップ４９４）最もニュースらしさのスコアが高いものを選択し（ステップ４９６及び４９８）、応答発話４５４として出力する。

　本実施の形態では、異なる２つの評価項目を評価軸とし、一方の評価軸において設定された基準値に近い応答発話候補の内で、他方の評価軸で測定したスコアが最も高いものを応答発話として選択する。２つの評価軸の内、一方の評価軸に関する基準値を設定することだけが必要であって、基準値の設定が容易になるという効果がある。なお、本実施の形態では、説明を容易にするために、評価の軸を２つのみとした。しかし本発明はそうした実施の形態には限定されない。評価の軸を３つ以上とし、基準値を設定する軸を２つ以上、又は基準値を設定せずにスコアの高いものを選択する軸を２つ以上としてもよい。また、必ずしもスコアの高いものに限らず、任意の基準を充足するように基準を選択できる。例えばスコアが低いもの、予め設定した値に近いもの、探索範囲内にある応答発話候補のスコアの中央値を持つもの、又は平均値に近いもの等を選択するようにしてもよい。さらに、互いに独立にスコアが算出される複数の評価軸が存在する場合、各軸について独立に評価するのではなく、例えば第１の軸のスコアと第２の軸のスコアとの和（又は差、積、特定の関数の値等）が最大（又は最小）のものを選択する応用も可能である。なお、上記した応答発話選択・生成部４７６は、最初に探索範囲を決定した後、その探索範囲内でニュースらしさのスコアが最も高い応答発話候補を選択している。しかし本発明はそのような実施の形態には限定されず、最初にニュースらしさのスコアが高いものを選択した後、選択された応答発話候補の中で特定サイトらしさの基準値に最も近い応答発話候補を選択するようにしてもよい。

　［第３の実施の形態］
　第３の実施の形態は、上記第１の実施の形態と第２の実施の形態とを組合せたものである。図１６を参照して、第３の実施の形態に係る対話システム５１０は、入力発話４４２が与えられると、第１の実施の形態で用いられた感情判定モデル６０、並びに第２の実施の形態で用いられた特定サイト判別モデル４４８及びニュース判別モデル４５０を用いて、入力・応答データベース４４４に記憶された応答発話候補から、ユーザにより設定された基準値に最もよく合致するものを選択して応答発話５２８として出力する対話装置５２６を含む。

　対話装置５２６は、応答発話候補選択部４７０及び応答発話候補記憶部４７２と、ユーザが基準値を設定する際に使用する入出力装置５５０と、入出力装置５５０を用いて設定された基準値を記憶する応答発話選択基準記憶部５５２とを含む。本実施の形態では、第１の実施の形態で用いられた感情スコアと、第２の実施の形態で用いられた特定サイトらしさのスコア及びニュースらしさのスコアとを用いる。これらの内で、ユーザが設定可能なものはニュースらしさのスコア以外のものである。入出力装置５５０は、第１の実施の形態に関連して図１０に示したものと同様のダイアログで基準値を入力するためのものである。本実施の形態では、感情スコアについては第１の実施の形態と同様、感情ごとのスコアの合計が１となるような入力が行われるが、特定サイトらしさのスコアはそれらとは独立に０～１の範囲で設定できるようにしておく必要がある。

　対話装置５２６はさらに、第１の実施の形態と同様の応答発話感情分析部９４と、いずれも第２の実施の形態と同様のニュースらしさスコア算出部４７４及び特定サイトらしさスコア算出部４７５と、応答発話選択基準記憶部５５２に記憶された基準値に基づいて応答発話候補の探索範囲を設定し、応答発話候補記憶部４７２に記憶された応答発話候補の中で、探索範囲内にあり、かつニュースらしさのスコアが最も高いものを選択して応答発話５２８として出力する応答発話選択・生成部５５４とを含む。

　図１７に、応答発話感情分析部９４、ニュースらしさスコア算出部４７４、及び特定サイトらしさスコア算出部４７５により各応答発話候補に対して算出されたスコアの例を示す。この例でも、各文の感情スコアについては横に合計すると１になるが、特定サイトらしさスコア及びニュースらしさスコアはそれとは無関係にそれぞれ０～１の範囲内となる。

　この第３の実施の形態に係る対話装置５２６の対話時の動作については、第１及び第２の実施の形態から明らかであるので、ここでは繰返さない。

　上記実施の形態によれば、様々な基準を設定することで、その基準に最も合致した応答発話を対話の応答として出力できる。ユーザがそのニーズ又は望みに合わせて基準値を設定することにより、同じ対話システムを利用してユーザのニーズ又は望みに合わせて発話内容が変化する対話システムを得ることができる。

　なお、上記実施の形態では、感情スコア、特定サイトらしさ、及びニュースらしさを応答発話選択の基準軸に採用している。しかし本発明はそのような実施の形態には限定されない。これ以外に、例えば発話内容が前向き（ポジティブ）か後ろ向き（ネガティブ）か、他サイトに転載された記事中の発話か否か、論文かそれ以外か、教師による発話かそれ以外か、ある年代以前に書かれた文か否か、発話者の年代がどの程度か、等を評価軸に採用することも可能である。また、これらの評価の軸を互いに自由に組合せることもできる。

　上記実施の形態では、ＣＮＮによって学習したモデルを用いて出力したスコア（確率値）に基づいて応答発話候補を選択している。しかし本発明はそのような実施の形態には限定されない。例えば学習者用の対話装置のような場合には、教科書に出現している頻度が高い単語を含む応答発話候補を選択してもよい。

　また、応答発話候補を決めるにあたっては、上記した第１の実施の形態、又は第２及び第３の実施の形態で使用したものに限定されるわけではない。入力発話との間にある関係が存在することが高い応答発話候補を抽出できるものであれば既存のものも、将来利用可能になるものも含めてどのようなものを用いてもよい。

　なお、本実施の形態では、ＣＮＮへの入力として単語の識別子列を用いているが、本発明はそうした実施の形態には限定されず、例えば単語ベクトルの形で入力するようにしてもよい。

　［コンピュータによる実現］
　本発明の実施の形態に係る対話システム４０、４３０及び５１０及びその構成要素は、いずれもコンピュータハードウェアと、そのコンピュータハードウェア上で実行されるコンピュータプログラムとによっても実現できる。図１８はこのコンピュータシステム６３０の外観を示し、図１９はコンピュータシステム６３０の内部構成を示す。

　図１８を参照して、コンピュータシステム６３０は、メモリポート６５２及びＤＶＤ（Digital　Versatile　Disk）ドライブ６５０を有するコンピュータ６４０と、いずれもコンピュータ６４０に接続されたキーボード６４６と、マウス６４８と、モニタ６４２とを含む。

　図１９を参照して、コンピュータ６４０は、メモリポート６５２及びＤＶＤドライブ６５０に加えて、ＣＰＵ（中央処理装置）６５６と、ＣＰＵ６５６、メモリポート６５２及びＤＶＤドライブ６５０に接続されたバス６６６と、起動プログラム等を記憶する読出専用メモリ（ＲＯＭ）６５８と、バス６６６に接続され、上記対話システム４０、４３０及び５１０の各部の機能を実現するプログラム命令、システムプログラム及び作業データ等を記憶するランダムアクセスメモリ（ＲＡＭ）６６０と、ハードディスク６５４を含む。コンピュータシステム６３０はさらに、他端末との通信を可能とするネットワーク６６８への接続を提供するネットワークインターフェイス（I/F）６４４を含む。

　コンピュータシステム６３０を上記した実施の形態に係る対話システム４０、４３０及び５１０並びにその各機能部として機能させるためのコンピュータプログラムは、ＤＶＤドライブ６５０又はメモリポート６５２に装着されるＤＶＤ６６２又はリムーバブルメモリ６６４に記憶され、さらにハードディスク６５４に転送される。又は、プログラムはネットワーク６６８を通じてコンピュータ６４０に送信されハードディスク６５４に記憶されてもよい。プログラムは実行の際にＲＡＭ６６０にロードされる。ＤＶＤ６６２から、リムーバブルメモリ６６４から又はネットワーク６６８を介して、直接にＲＡＭ６６０にプログラムをロードしてもよい。

　このプログラムは、コンピュータ６４０を、上記実施の形態に係る対話システム４０、４３０及び５１０の各機能部として機能させるための複数の命令からなる命令列を含む。コンピュータ６４０にこの動作を行わせるのに必要な基本的機能のいくつかはコンピュータ６４０上で動作するオペレーティングシステム若しくはサードパーティのプログラム又はコンピュータ６４０にインストールされる、ダイナミックリンク可能な各種プログラミングツールキット又はプログラムライブラリにより提供される。したがって、このプログラム自体はこの実施の形態のシステム、装置及び方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令の内、所望の結果が得られるように制御されたやり方で適切な機能又はプログラミングツールキット又はプログラムライブラリ内の適切なプログラムを実行時に動的に呼出すことにより、上記したシステム、装置又は方法としての機能を実現する命令のみを含んでいればよい。もちろん、独立したプログラムのみで必要な機能を全て提供してもよい。

　今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味及び範囲内での全ての変更を含む。

　この発明は、科学、工学、教育、製造業、サービス業など、質問に対して回答を与えることが有益な全ての産業に適用できる。

４０、４３０、５１０　対話システム
５２　大規模テキストデータベース
５４　感情語辞書
５６　接続語辞書
５８、４４０　モデル学習部
６０　感情判定モデル
６２、４４２　入力発話
６４　会話文データベース
６６、４４６、５２６　対話装置
６８、４５４、５２８　応答発話
８０　テキスト抽出・分類部
８２　学習用テキスト記憶部
８４　学習処理部
９０、４７０　応答発話候補選択部
９２、４７２　応答発話候補記憶部
９４　応答発話感情分析部
９６、４７６、５５４　応答発話選択・生成部
９８、４７８、５５０　入出力装置
１００、４８０、５５２　応答発話選択基準記憶部
２４０　入力
２４２　出力
３４０　ダイアログ
３９０　基準点
３９２　探索範囲
４４４　入力・応答データベース
４４８　特定サイト判別モデル
４５０　ニュース判別モデル
４５２　特定サイト／ニュースＵＲＬリスト
４６０　テキスト分類部
４６２　第１の学習用テキスト記憶部
４６３　第２の学習用テキスト記憶部
４６４　第１の学習処理部
４６５　第２の学習処理部
４７４　ニュースらしさスコア算出部
４７５　特定サイトらしさスコア算出部

Claims

予め定められた一組の評価項目に関する基準値を設定するための基準値設定手段と、
　入力発話に対して複数の応答発話候補を生成するための応答発話候補生成手段と、
　前記複数の応答発話候補の各々について、前記一組の評価項目の各々に関する評価値を算出するための評価手段と、
　前記複数の応答発話候補の内、前記評価手段による評価値が前記基準値に対して予め定める関係にある応答発話候補を前記入力発話に対する応答発話として選択するための応答発話選択手段とを含む、対話装置。
前記一組の評価項目は複数の項目を含み、
　前記評価手段は、発話が与えられると、当該発話が前記複数の項目に合致する度合いを示すスコアを前記複数の項目の各々について出力するように機械学習により学習済のモデルを用いるための判別手段を含む、請求項１に記載の対話装置。
前記一組の評価項目は、当該一組の評価項目の値に対応して１点が定められる評価空間を定義し、
　前記応答発話選択手段は、前記評価空間内において、前記応答発話候補の内、対応する点が前記基準値により定められる点に最も近いものを前記入力発話に対する応答発話として選択するための手段を含む、請求項１又は請求項２に記載の対話装置。
前記一組の評価項目は、複数の項目を含む第１の評価項目と、前記第１の評価項目とは独立な第２の評価項目とを含み、
　前記評価手段は、
　前記複数の応答発話候補の各々について、前記第１の評価項目の前記複数の項目の各々について評価値を算出するための第１の評価手段と、
　前記複数の応答発話候補の各々について、前記第２の評価項目について評価値を算出するための第２の評価手段とを含む、請求項１に記載の対話装置。
請求項１～請求項４のいずれかに記載の対話装置と、
　複数の学習用テキストの各々を、前記一組の評価項目にしたがった評価値と関係づけて記憶するテキスト記憶装置と、
　前記テキスト記憶装置に記憶された前記複数の学習用テキストを学習データとして、入力発話が与えられると、前記一組の評価項目に関する評価値を推定し出力するよう、機械学習により前記評価手段の学習を行うための学習手段とを含む、対話システム。
コンピュータを、請求項１～請求項５の何れかに記載の各手段として機能させる、コンピュータプログラム。