JP2019087123A

JP2019087123A - 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法

Info

Publication number: JP2019087123A
Application number: JP2017216234A
Authority: JP
Inventors: 俊一田原; Shunichi Tawara; 池田　和史; Kazufumi Ikeda; 和史池田; 啓一郎帆足; Keiichiro Hoashi
Original assignee: KDDI Corp
Current assignee: KDDI Corp
Priority date: 2017-11-09
Filing date: 2017-11-09
Publication date: 2019-06-06
Anticipated expiration: 2037-11-09
Also published as: JP6821542B2

Abstract

【課題】第１種の対話から第２種の対話への対話遷移をより自然に実施することができる対話制御装置を提供する。【解決手段】本対話制御装置は、第１種及び／又は第２種の対話に関連する第１及び／又は第２のテキスト群に含まれる各テキストについて、各テキストのテキスト構成要素情報を決定するテキスト解析手段と、第１テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストのテキスト関連情報と、第２のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストのテキスト関連情報との対比に基づいて、第１のテキスト群が複数のテキストを含む場合に第１のテキスト群から、第１種の対話における発話に係るテキストを決定し、第２のテキスト群から、第２種の対話における発話に係るテキストを決定するテキスト決定手段と、決定されたテキストに基づいた発話を出力する発話制御手段とを有する。【選択図】図１

Description

本発明は、ユーザ等との間で対話を行う対話システムの技術に関する。

近年、ユーザと対話を行い、当該ユーザに種々のサービスを提供可能な対話システムの開発が盛んに進められている。例えば、現在普及しているスマートフォンには、ユーザの発話による問合せに音声で回答し、検索結果等の情報を提供する対話応答機能が常備されているものも少なくない。

通常、人間同士の対話では、１つの内容・種類の対話から別の内容・種類の対話への対話遷移が少なからず発生する。例えば、ある事件を報じたニュース記事についての対話から、この事件に関する話題についての雑談対話へ、対話の内容・種類が変換することも多い。

このような対話遷移について、例えば、特許文献１には、話題転換の自然性を目的として、ユーザによる発話文の単語を抽出し、抽出した単語に関連する発話を応答する対話制御装置が開示されている。この装置では、その単語に関連する発話が存在しない場合、その単語に含まれる部分文字列を抽出し、抽出した部分文字列に関連する発話を応答している。

また、対話遷移ではないが、話題となり得るコンテンツを配信する技術として、特許文献２には、ユーザの携帯端末内のニュース記事閲覧履歴に基づき、ニュース記事のカテゴリ候補を抽出し、そのカテゴリ内のニュース記事をユーザに推薦する最新記事推薦方法の技術が開示されている。

特開２０１７−４９４７１号公報特開２００３−２１６６３６号公報

しかしながら、特許文献１や特許文献２といったような従来技術をもってしても、対話遷移が不自然になる問題は依然、十分に解消されていない。

実際、特許文献１に記載された技術では、ユーザの話題に基づき、当該話題と同一の話題又は類似する話題を応答する対応がとられている。すなわち、あくまでユーザの発話を前提として装置側が応答するのである。そのため、装置側は、ユーザの話題の範囲内でしか応答することができず、例えば、外部のコンテンツに基づくニュース対話と、それに続く雑談対話とを行った場合、両種対話間の対話遷移が不自然になる可能性が解消されない。

また、特許文献２に記載された技術ではたしかに、ユーザの趣味嗜好に応じたニュース記事を推薦する手法も提示されてはいる。しかしながら、例えば上記のようにニュース対話とそれに続く雑談対話との間で対話遷移を行う状況において、ニュース記事の選択にこのような手法を適用したとしても、対話遷移先の雑談対話について何ら考慮することなくニュース記事を選択せざるを得ないので、結局、対話の流れが不自然になってしまう可能性が残ってしまう。

そこで、本発明は、ある種の対話から別の種の対話への対話遷移をより自然に実施することができる対話制御装置、対話制御プログラム、及び対話制御方法を提供することを目的とする。

本発明によれば、第１種の対話と、それに次ぐ第２種の対話とを実施可能な対話制御装置であって、
当該第１種の対話に関連する第１のテキスト群に含まれる各テキスト、及び当該第２種の対話に関連する第２のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するテキスト解析手段と、
当該第１テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第２のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第１のテキスト群が複数のテキストを含む場合に当該第１のテキスト群から、当該第１種の対話における発話に係るテキストを決定し、当該第２のテキスト群から、当該第２種の対話における発話に係るテキストを決定するテキスト決定手段と、
決定された当該テキストに基づいた発話を出力する発話制御手段と
を有する対話制御装置が提供される。ここで、典型的な実施形態として、当該テキスト構成要素情報は、当該テキストに含まれる単語及び該単語の特徴度であることも好ましい。

この本発明による対話制御装置の一実施形態として、当該第１のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、当該第２のテキスト群は所定の発話に係るテキストであって当該テキスト関連情報としてのキーワードが紐づけられたテキストである発話テキストの集合であり、
テキスト解析手段は、当該各コンテンツテキストに含まれる単語を抽出して該単語の特徴度を算出し、当該特徴度に基づいて当該コンテンツテキストの特徴語を決定し、
テキスト決定手段は、当該キーワードと一致する特徴語である一致特徴語に係るコンテンツテキストを、当該第１種の対話における発話に係るテキストに決定し、当該一致特徴語と一致するキーワードに係る発話テキストを、当該第２種の対話における発話に係るテキストに決定することも好ましい。

また、本発明による対話制御装置の他の実施形態として、当該第１のテキスト群は少なくとも所定の発話に係るテキストである発話テキストを含み、当該第２のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、
テキスト解析手段は、当該発話テキストに含まれる単語を抽出して該単語の特徴度を算出し、また、当該各コンテンツテキストに含まれる単語を抽出して該単語の特徴度を算出し、
テキスト決定手段は、当該発話テキストに含まれる単語及び該単語の特徴度と、当該各コンテンツテキストに含まれる単語及び該単語の特徴度とに基づいて、当該発話テキストと当該各コンテンツテキストとの類似度を算出し、当該発話テキストに類似したコンテンツテキストを、当該第２種の対話における発話に係るテキストに決定することも好ましい。

さらに、本発明による対話制御装置において、当該第１テキスト群に含まれる各テキストに係る当該単語のうち当該特徴度の最も高い単語を用いて、当該第１種の対話から当該第２種の対話への対話遷移のための遷移発話を生成する遷移発話生成手段を更に有し、
発話制御手段は、当該第１種の対話から当該第２種の対話へ対話を遷移させるタイミングで、当該遷移発話を出力することも好ましい。

さらにまた、本発明による対話制御装置において、当該テキスト関連情報は当該テキストに紐づけられたキーワードであって、当該キーワードの１つは職業名に係る単語であり、
テキスト解析手段は、当該特徴語が人名に係る単語である場合に、人物と職業とが対応付けられた辞書を用いて、該特徴語を職業名に係る単語に置換する職業置換手段を有し、
テキスト決定手段は、当該発話に係るテキストを決定する際の対比を、置換後の当該職業名に係る単語について実施することも好ましい。

また、上記の職業置換手段を有する実施形態において、当該第１テキスト群に含まれる各テキストに係る当該単語のうち当該特徴度の最も高い単語を用いて、当該第１種の対話から当該第２種の対話への対話遷移のための遷移発話を生成し、当該特徴度の最も高い単語が当該職業名に係る単語に置換されていても元の当該特徴度の最も高い単語を用いて遷移発話を生成する遷移発話生成手段を更に有し、
発話制御手段は、当該第１種の対話から当該第２種の対話へ対話を遷移させるタイミングで、当該遷移発話を出力することも好ましい。

さらに、上記の職業置換手段を有する実施形態において、職業置換手段は、当該職業名に係る単語に置換された特徴語の特徴度を、意外性を有する対話遷移を行うためにより高い値に変更し、または、置換の過誤を抑制するためにより低い値に変更することも好ましい。

また、本発明による対話制御装置の更なる他の実施形態として、当該第１のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、当該第２のテキスト群は所定の発話に係るテキストであって当該テキスト関連情報としてのキーワードが紐づけられたテキストである発話テキストの集合であり、
テキスト決定手段は、当該第１種の対話に次ぐ当該第２種の対話の後に再び当該第１種の対話を実施すべく、実施された当該発話テキストに係る当該単語及び特徴度と、当該各コンテンツテキストに含まれる単語と該単語の特徴度とに基づいて、当該発話テキストと当該各コンテンツテキストとの類似度を算出し、当該発話テキストに類似したコンテンツテキストを、再び実施する当該第１種の対話における発話に係るテキストに決定することも好ましい。

さらに、本発明による対話制御装置において、当該第１のテキスト群又は当該第２のテキスト群は、所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、
発話制御手段は、所定のＳＮＳ（Social Networking Service）投稿を取得するＳＮＳ投稿取得手段を有し、取得されたＳＮＳ投稿であって、当該発話に係るテキストに決定されたコンテンツテキストに関連しており所定条件を満たすＳＮＳ投稿に基づいた発話を出力することも好ましい。

本発明によれば、また、第１種の対話と、それに次ぐ第２種の対話とを実施可能な装置に搭載されたコンピュータを機能させるプログラムであって、
当該第１種の対話に関連する第１のテキスト群に含まれる各テキスト、及び当該第２種の対話に関連する第２のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するテキスト解析手段と、
当該第１テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第２のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第１のテキスト群が複数のテキストを含む場合に当該第１のテキスト群から、当該第１種の対話における発話に係るテキストを決定し、当該第２のテキスト群から、当該第２種の対話における発話に係るテキストを決定するテキスト決定手段と、
決定された当該テキストに基づいた発話を出力する発話制御手段と
してコンピュータを機能させる対話制御プログラムが提供される。

本発明によれば、さらに、第１種の対話と、それに次ぐ第２種の対話とを実施可能な装置に搭載されたコンピュータにおいて実施される対話制御方法であって、
当該第１種の対話に関連する第１のテキスト群に含まれる各テキスト、及び当該第２種の対話に関連する第２のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するステップと、
当該第１テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第２のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第１のテキスト群が複数のテキストを含む場合に当該第１のテキスト群から、当該第１種の対話における発話に係るテキストを決定し、当該第２のテキスト群から、当該第２種の対話における発話に係るテキストを決定するステップと、
決定された当該テキストに基づいた発話を出力するステップと
を有する対話制御方法が提供される。

本発明の対話制御装置、対話制御プログラム、及び対話制御方法によれば、ある種の対話から別の種の対話への対話遷移をより自然に実施することが可能となる。

本発明による対話制御装置の一実施形態における機能構成を示す機能ブロック図である。本発明に係る雑談シナリオデータベース（ＤＢ）に格納された雑談発話テキストの一実施例を示す模式図である。本発明に係るニュース記事テキスト解析処理の一実施例を説明するための模式図である。発話制御部による雑談シナリオＤＢを用いた発話制御処理の一実施例を示す模式図である。ユーザインタフェースがタッチパネル・ディスプレイである場合の発話出入力例を示す模式図である。発話制御部における、取得したＳＮＳ投稿を利用したニュース対話の一実施形態を説明するための機能ブロック図である。本発明による対話制御方法の一実施形態を概略的に示すフローチャートである。本発明による対話制御方法の他の実施形態を概略的に示すフローチャートである。本発明による対話制御方法の更なる他の実施形態を概略的に示すフローチャートである。

以下では、本発明の実施形態について、図面を用いて詳細に説明する。

［対話制御装置］
図１は、本発明による対話制御装置の一実施形態における機能構成を示す機能ブロック図である。

図１によれば、本発明の一実施形態としての対話制御装置１は、ユーザとの間で、スピーカ・マイクやタッチパネル・ディスプレイといったユーザインタフェース（ＵＩ）１０２を介して対話を実施可能な装置であり、特に、第１種の対話と、それに次ぐ第２種の対話との間の対話遷移をより自然にする、言い換えれば第１種の対話から第２種の対話への対話の流れをより違和感のないものにすることの可能な装置となっている。

ここで、対話の種類は、大きく２つに大別される。１つはニュース記事、解説記事や、評論・エッセイ、さらにはＳＮＳ（Social Networking Service）投稿等、通信ネットワークを介して取得されるコンテンツについての対話（コンテンツ対話）であり、もう１つは、このようなコンテンツに限定されない内容の非コンテンツ対話である。

また、このコンテンツ対話を、そのコンテンツの種別によってさらに分類することも可能である。さらに、非コンテンツ対話も、雑談対話や講義対話等、便宜的な分類を行うことができる。以下に示す実施形態では、２つの種類の対話として、ニュース記事についてのニュース対話と、非コンテンツ対話としての雑談対話とを採用しているが、本発明に係る複数種の対話は当然、これらに限定されるものではない。

同じく図１に示すように、対話制御装置１は、本実施形態において通信インタフェース１０１を備えており、通信ネットワーク上に設置された、（ａ）デジタルコンテンツ配信事業者の運営する種々のニュース記事データを配信・提供可能なニュースサーバ２や、（ｂ）ＳＮＳ投稿データを配信・提供可能なＳＮＳサーバ４と通信接続して、ニュース記事データやＳＮＳ投稿データを取得することができる。これらのデータは、より自然な対話遷移を伴うユーザとの対話を実施する際に活用される。

具体的に、対話制御装置１は、その顕著な特徴として、
第１種の対話と、それに次ぐ第２種の対話とを実施可能な対話制御装置であって、
（Ａ）第１種の対話に関連する「第１のテキスト群」に含まれる各テキスト、及び第２種の対話に関連する「第２のテキスト群」に含まれる各テキストのうちの少なくとも一方について、各テキストの構成要素に係る「テキスト構成要素情報」を決定するテキスト解析部（１１１ｆ，１１１ｓ）と、
（Ｂ）「第１テキスト群」に含まれる各テキストに係る「テキスト構成要素情報」又は当該テキストに関連付けられた「テキスト関連情報」と、「第２のテキスト群」に含まれる各テキストに係る「テキスト構成要素情報」又は当該テキストに関連付けられた「テキスト関連情報」との対比に基づいて、「第１のテキスト群」が複数のテキストを含む場合に「第１のテキスト群」から、第１種の対話における発話に係るテキスト（発話テキスト）を決定し、「第２のテキスト群」から、第２種の対話における発話に係るテキスト（発話テキスト）を決定するテキスト決定部（１１２）と、
（Ｃ）決定されたテキストに基づいた発話を出力する発話制御部（１１４）と
を有している。

ここで、第１種及びそれに次ぐ第２種の対話として、それぞれ上述したニュース対話及び雑談対話を採用した場合、「第１のテキスト群」は、例えばニュースサーバ２から取得されるニュース記事テキストデータの集合とすることができ、また、「第２のテキスト群」は、例えば装置１内の雑談シナリオデータベース（ＤＢ）１０４に格納された雑談発話テキストデータの集合とすることができる。ちなみに、この雑談シナリオＤＢは、装置１内ではなく外部、例えば通信ネットワーク上に（図１では雑談シナリオＤＢ３として）設置されてもよい。または、第１種及びそれに次ぐ第２種の対話として、それぞれ（上記とは逆である）雑談対話及びニュース対話を採用した場合は、「第１のテキスト群」を雑談発話テキストデータの集合とし、「第２のテキスト群」をニュース記事テキストデータの集合とすることができる。

以上に述べたように対話制御装置１は、第１種の対話での発話テキストを決定する際には、「第２のテキスト群」のテキストも考慮し、第２種の対話での発話テキストを決定する際には、「第１のテキスト群」のテキストも考慮している。これにより、第１種の対話での発話と、第２種の対話での発話との間に、発話内容や話題の関連性が生じ、結果的に、第１種の対話から第２種の対話への対話遷移がより自然な形で行われることになるのである。

特に例えば、当初のニュース対話での発話テキストとしてニュース記事テキストを選択することができる状況において、雑談対話での雑談発話テキストとの対比を行い、次いで行われる予定の雑談対話の内容へ自然な形で遷移し易い内容のニュース記事テキストを選択して、ニュース対話を実施することができるので、対話遷移の自然性がより向上する。

ちなみに、「テキスト構成要素情報」は、以下に示す実施形態では、テキストに含まれる単語及び当該単語の特徴度である。このような単語は、例えば後述するように形態素解析によってテキストから抽出可能である。勿論、この「テキスト構成要素情報」として、テキストを構成する要素単位についての情報であれば種々のものが採用可能であり、例えばN-gramによって求められるｎ文字単位及びその出現頻度を採用してもよい。さらに、以下に示す実施形態では、「テキスト関連情報」は、予めテキストに紐づけられたキーワードとしているが、これもテキストに関連する情報であれば種々の情報が採用可能である。

［装置機能構成］
同じく図１の機能ブロック図によれば、対話制御装置１は、通信インタフェース１０１と、ユーザインタフェース（ＵＩ）１０２と、ニュース記事データベース（ＤＢ）１０３と、雑談シナリオＤＢ１０４と、ＳＮＳ投稿ＤＢ１０５と、人物・職業辞書１０６と、プロセッサ・メモリとを有する。

ここで、このプロセッサ・メモリは、本発明による対話制御プログラムの一実施形態を保存しており、また、コンピュータ機能を有していて、この対話制御プログラムを実行することによって、対話制御処理を実施する。したがって、対話制御装置１は、本発明による対話制御プログラムを搭載した、例えばスマートフォン、タブレット型若しくはノート型コンピュータ、又はパーソナル・コンピュータ（ＰＣ）等であってもよい。

さらに、このプロセッサ・メモリは、機能構成部として、第１職業置換部１１１ｆａを含む第１テキスト解析部１１１ｆと、第２職業置換部１１１ｓａを含む第２テキスト解析部１１１ｓと、第１発話生成部１１２ａ及び第２発話生成部１１２ｂを含むテキスト決定部１１２と、遷移発話生成部１１３と、ＳＮＳ投稿取得部１１４ａを含む発話制御部１１４と、通信制御部１２１と、テキスト取得部１２２と、入出力制御部１２３とを有する。

なお、これらの機能構成部は、プロセッサ・メモリに保存された対話制御プログラムの機能と捉えることができ、また、図１における対話制御装置１の機能構成部間を矢印で接続して示した処理の流れは、本発明による対話制御方法の一実施形態としても理解される。

同じく図１において、ニュース記事データベースＤＢ１０３は、例えば外部に設置されたニュースサーバ２から通信インタフェース１０１及び通信制御部１２１を介して取得されたニュース記事テキストデータを、例えば記事の内容を表す記事キーワードや予め設定された記事種別情報を対応付けて保存したデータベースである。ここで、ニュース記事テキスト（データ）は、例えばタイトルと本文とから構成されていてもよい。

また、雑談シナリオＤＢ１０４は、想定される装置１とユーザとの対話を記述した雑談発話テキスト（データ）を保存したデータベースである。ここで、各雑談発話テキストには、後に実施されるテキスト決定処理の際に利用すべく所定のキーワードが対応付けられている。

図２は、本発明に係る雑談シナリオＤＢ１０４に格納された雑談発話テキストの一実施例を示す模式図である。

図２（Ａ）によれば、雑談シナリオＤＢ１０４には、多数の雑談発話テキストが識別番号を付与されて格納されている。また、これらの雑談発話テキストは、対話制御装置１側の発話テキストと、ユーザ側の発話テキストとの２種類に分類されている。ちなみに、これらの雑談発話テキストは、本装置や他の対話システムで収集された対話シナリオや対話の実績データ、さらには種々のオーサリングツールで作成された対話シナリオから抽出されたものとすることができる。

また、図２（Ｂ）によれば、装置１側の雑談発話テキスト（図２（Ａ）では番号１〜５０のテキスト）には各々、
（ａ）その発話内容に関係する、類似する又は当該発話内容を代表する名詞等である類似キーワードと、
（ｂ）その発話内容に出現する又は関係する職業名である職業キーワードと
が人手等によってタグ付けされている。このうち職業キーワードは、例えば、雑談発話テキストの内容に合致した（例えばテキストに出現する知名人についての）Wikipediaの記載を検索し、当該記載から職業名を、職業名辞書を用いて抽出し入手してもよい。

勿論、雑談発話テキストに予め紐づけされるキーワードは、上記（ａ）及び（ｂ）に限定されるものではない。例えばその一方のみでも後のテキスト決定処理を実施することができ、また、他の種類のキーワードも採用可能である。しかしながら、本実施形態のように類似キーワード及び職業キーワードを採用することによって、対話遷移をより自然にするニュース記事テキストと、それに合った雑談発話テキストとを決定することが可能となっている。

図１に戻って、第１種及び第２種の対話がそれぞれニュース対話及び雑談対話である場合に、テキスト取得部１２２は、ニュース記事ＤＢ１０３から、ニュース記事テキストを複数取得し、第１テキスト解析部１１１ｆへ出力する。その際、ユーザの趣味嗜好に合ったテキストを取得することも好ましい。例えば、後述するＳＮＳ投稿取得部１１４ａで決定された、又は所定のルートで取得されたユーザの趣味嗜好情報が「野球」である場合、ニュース記事ＤＢ１０３から、記事キーワードや記事種別情報として「野球」が紐づけられているニュース記事テキストを引き出してきてもよい。

また、テキスト取得部１２２は、雑談シナリオＤＢ１０４から、所定分だけの又は所定の種別の雑談発話テキストを複数取得し、第２テキスト解析部１１１ｓへ出力する。

第１テキスト解析部１１１ｆは、入力されたニュース記事テキスト群に含まれるニュース記事テキストの各々について、タイトルと本文とを合わせて１つのテキストとし、このテキストから、例えばＴＦ-ＩＤＦ（Term Frequency-Inverse Document Frequency）解析によって、特徴的な単語である「ニュース単語」を例えば所定数だけ抽出し、抽出した各単語のスコア（特徴度）を算出する。このスコアは、例えばtf・idfスコア（tf値×idf値）とすることができる。また、ここで解析されたニュース記事テキストと抽出されたニュース単語及びそのスコアとは、テキスト決定部１１２へ出力される。

図３は、本発明に係るニュース記事テキスト解析処理の一実施例を説明するための模式図である。

図３によれば、識別番号１〜１００が付与された１００個のニュース記事テキストの各々について、ＴＦ-ＩＤＦ解析を行い、スコア（特徴度）の高い順に５つのニュース単語（特徴語）を抽出して列挙している。例えば、識別番号２のニュース記事テキストでは、最高のスコア（0.82）を有しており最も特徴的なニュース単語として「野球」が挙がっている。

図１に戻って、一方、第２テキスト解析部１１１ｓは、第１種及び第２種の対話がそれぞれニュース対話及び雑談対話である場合、テキスト取得部１２２から入力した雑談発話テキスト群を、テキスト決定部１１２へ出力する。

次いで、テキスト決定部１１２は、
（ａ１）入力したニュース記事テキストの各々におけるニュース単語及びそのスコアと、
（ａ２）同じく入力した雑談発話テキストの各々における紐づけられた類似キーワード及び職業キーワードと
を対比し、類似及び職業キーワードのいずれかと一致するニュース単語である「一致ニュース単語」（一致特徴語）を決定する。

テキスト決定部１１２は、さらに、
（ｂ）決定した一致ニュース単語の中から、スコアの最も高い単語である「高スコア単語」を決定し、
（ｃ）決定した高スコア単語が属するニュース記事テキストを、ニュース対話における発話テキストに決定し、
（ｄ）高スコア単語が一致したところの（類似又は職業）キーワードが対応付けられた雑談発話テキストを、ニュース対話に次いで行う雑談対話における発話テキストに決定する。

ここで、上述したテキスト決定処理の一実施例を説明する。図３に示したニュース記事テキスト１〜１００のニュース単語のうち、図２（Ｂ）に示された類似及び職業キーワードのいずれかと一致し、且つ最もtf・idfスコアが高いのは「野球」となっている。そこで、テキスト決定部１１２は、高スコア単語「野球」の属するニュース記事テキスト２を、ニュース対話の発話テキストに決定する。また、図２（Ａ）に示された装置１側の発話テキストのうち、類似キーワード「野球」が対応付けられた識別番号２の「スポーツする？」を、雑談対話の発話テキストに決定するのである。

ちなみに、上記（ｃ）のニュース記事テキストの決定処理についての変更態様として、テキスト決定部１１２は、決定した一致ニュース単語を含む各ニュース記事テキストにおいて、一致ニュース単語のスコアの合計値を算出し、この合計値の最も高いニュース記事テキストを、ニュース対話における発話テキストに決定してもよい。この場合、高スコア単語だけに依存しない総合的な単語対比に基づいて、テキスト決定の判断を行うことができる。

また、一致するキーワードの対応付けられた雑談発話テキストが複数存在し、それ故、上記（ｄ）の雑談対話における発話テキストが複数決定され得る場合も存在する。この場合、それらの中から１つをランダムで選択してもよい。または、対応付けられた他の（非一致である）キーワードの種別が、予め分類された複数の種別のうちの所定のものであるような雑談発話テキストを選択することも可能である。

ここで図１に示したように、第１テキスト解析部１１１ｆは、第１職業置換部１１１ｆａを有することも好ましい。この第１職業置換部１１１ｆａは、（第１種の対話に係るニュース記事テキストについて決定された）ニュース単語が人名に係る単語（人名語）である場合に、人物と職業とが対応付けられた辞書である人物・職業辞書１０６を用いて、このニュース単語を職業名に係る単語（職業名語）に置換する。ちなみにこの場合、テキスト決定部１１２は、発話テキストを決定する際の対比を、置換後の職業名語について実施することになる。

このように、第１テキスト解析部１１１ｆにおいて人名語を職業名語に置換することによって、単語対比で人名そのものが一致するケースが相当に限定される実情に対処することができる。例えば、ニュース単語が人名語である場合において、雑談発話テキスト群にも同一の人名語がキーワードとして対応付けられていれば両者の一致を判定できる。しかしながら実際には、人名語は膨大な数存在し、その雑談発話テキストに関連しそうな人名語を例えば人手で紐づけていくことには限界がある。一方、その人名の人物が従事する職業の名前であれば、比較的数も少ないので例えば人手でテキストへの対応付けを行うことも可能となる。

そこで、雑談発話テキストに予め職業キーワードを紐づけた上で、人名語であるニュース単語は対応する職業名語に置換することによって、両テキストの単語対比を適切に実施することが可能となるのである。

具体的には、例えばWikipediaを利用し、Wikipediaの存命人物カテゴリに含まれる人物毎に、当該人物の人名語と、各人物についての記載から抽出された職業名語とを紐づけたデータを作成して、このデータを例えばオープンソースの形態素解析エンジンであるMeCabの辞書に登録する。この辞書を補強したMeCabを利用することにより、人名語であるニュース単語を、対応する職業名語に置換することができる。

なお、第２テキスト解析部１１１ｓの第２職業置換部１１１ｓａも、第２種の対話に係るテキストがニュース記事テキストである場合に、上記の第１職業置換部１１１ｆａと同様の置換処理を実施することが可能な機能構成部となっている。また、後に図８及び図９を用いて説明するように、雑談対話からニュース対話へ対話遷移する実施形態では、第１（第２）職業置換部１１１ｓａ（１１１ｆａ）は、雑談対話に係る発話テキストについて、人名語を職業名語に置換する処理を行ってもよい。

またさらに、第１職業置換部１１１ｆａ（第２職業置換部１１１ｓａ）は、職業名語に置換されたニュース単語のスコアを、（ア）意外性を有する対話遷移を行うためにより高い値に変更し、または、（イ）置換の過誤を抑制するためにより低い値に変更することも好ましい。

ここで、上記（ア）の例として、第１種の対話としてのニュース対話における話題が「ファッション」であり、そのニュース単語がプロ野球の選手名であって職業名語「プロ野球選手」に置換された場合を説明する。この場合、通常は、次いで実施される雑談対話においても話題を「ファッション」とした対話を実施することが、自然な対話遷移を実現する観点から好ましいといえる。

しかしながら、例えばこのニュース対話における話題がより具体的に「プロ野球選手のプライベートにおけるファッション」である場合、次いで実施される雑談対話において話題を、（「ファッション」からすると意外なものである）「プロ野球（選手）」に変更することも自然な対話遷移の下、十分にあり得る。そこで、「プロ野球（選手）」を話題とした雑談発話テキストを選択され易くすべく、このニュース対話のニュース単語（プロ野球の選手名）のスコアをより高くするのである。

一方、上記（イ）の例としては、ニュース単語の人名が同姓同名であって異なる職業に従事する人物の人名である場合が挙げられる。例えば、このニュース単語の人名が、上述したMeCabの辞書に登録された人名ではあるが互いに職業の異なる複数の人物の人名に相当する場合である。

この場合、人名語を職業名語に置換した結果、ニュース単語の人名とは無関係の職業名に係るキーワードを対応付けられた雑談発話テキストが選択されてしまい、対話遷移が不自然となる可能性が高くなってしまう。そこで、このような雑談発話テキストが選択され難くなるように、このような人名であるニュース単語のスコアをより低くする。これにより、より自然な対話遷移を確保することが可能となるのである。

また、テキスト決定部１１２の第１発話生成部１１２ａ及び第２発話生成部１１２ｂはそれぞれ、
（ａ）第１種の対話であるニュース対話のためのニュース発話（データ）を、ニュース対話の発話テキストとして決定されたニュース記事テキストから生成し、及び
（ｂ）第２種の対話である雑談対話のための雑談発話（データ）を、雑談対話の発話テキストとして決定された雑談発話テキストを含めた雑談発話テキスト群から、さらにはユーザインタフェース１０２を介して取得したユーザ側の発話データに基づいて、生成する。

ここで、上記（ａ）のニュース発話は例えば、決定されたニュース記事テキストにおけるタイトルと本文の全部又は所定の一部とをもって構成されていてもよい。

また同じく図１に示すように、装置１の機能構成部として遷移発話生成部１１３が設けられていることも好ましい。遷移発話生成部１１３は、（第１種の対話である）ニュース対話に係るニュース記事テキストから決定された高スコア単語を用いて、ニュース対話から（第２種の対話である）雑談対話への対話遷移のための遷移発話を生成する。ここで、決定された雑談発話テキストに対応付けられた、当該高スコア単語とは一致していないキーワードも用いて、遷移発話を生成することも可能である。

ちなみに、このように生成された遷移発話は、ニュース対話から雑談対話への対話遷移の際に（第１種の対話から第２種の対話へ対話を遷移させるタイミングで）出力され、当該対話遷移を自然な形で進める作用効果を奏する。

本実施形態の遷移発話生成部１１３は具体的に、高スコア単語と、決定された雑談発話テキストとから遷移発話（データ）を生成する。簡単な例として、「ところで、ニュース記事に＜高スコア単語＞が出てきたけど、＜雑談発話テキスト＞」といった定型フォーマットを用いて遷移発話データを生成してもよい。この場合、高スコア単語が「野球」であって、決定された雑談発話テキストが「スポーツはする？」である場合、遷移発話は「ところで、ニュース記事に野球が出てきたけど、何かスポーツはする？」となる。

ちなみに、上記のように雑談発話テキストを用いて生成した遷移発話は、対話の種別としては、雑談対話（第２種の対話）に含まれることになる。すなわちこの場合、遷移発話は、ニュース対話（第１種の対話）の終了直後に開始された雑談対話における冒頭の発話となる。また、このような遷移発話を実施しない形態では、上記の決定された雑談発話テキストである「スポーツはする？」から雑談発話を生成し、ニュース対話の終了直後に雑談対話の出だしとして出力することも可能である。

また、遷移発話生成部１１３は、第１職業置換部１１１ｆａにおいて高スコア単語（人名語）が職業名語に置換されている場合でも、この元の高スコア単語（人名語）を用いて遷移発話を生成することも好ましい。これにより、ニュース発話で使用された可能性の低い置換後の職業名語に代わって、使用された可能性の高い人名語（高スコア単語）を遷移発話に使用し、対話遷移をより自然な形で進めることが可能となる。

発話制御部１１４は、第１発話生成部１１２ａ、遷移発話生成部１１３、及び第２発話生成部１１２ｂから、それぞれで生成されたニュース発話、遷移発話、及び雑談発話を入力し、所定の順序（ニュース発話→遷移発話→雑談発話の順序）、及びユーザインタフェース１０２及び入出力制御部１２３を介したユーザとの対話が成立するような所定のタイミングでそれらの発話を入出力制御部１２３へ出力し、ユーザインタフェース１０２を介してユーザに提示（例えば画面表示及び／又は音声提示）する。

図４は、発話制御部１１４による雑談シナリオＤＢ１０４を用いた発話制御処理の一実施例を示す模式図である。

図４に示すように、本実施形態の雑談シナリオＤＢ１０４には、当初の装置１側の発話である雑談発話（図４では「野球好きですか？」）に対する応答としてのユーザ側の発話候補が、複数通り（図４では３通り）設定されている。また、これらのユーザ側の発話候補の各々に沿って分岐する形で、当該発話候補に合った応答となる雑談発話テキストを設定している。

ここで、発話制御部１１４は、実際に応答としてのユーザ側の発話を取得した際、雑談シナリオＤＢ１０４にアクセスし、取得したユーザ側の発話との間で最も高い類似度を有するユーザ側発話候補に対応付けられた雑談発話テキストを取得して、これに応じた発話を生成し出力する。例えば、応答としてのユーザ側の発話：「ええ、野球は好きですよ。」を取得した際、最も類似しているユーザ側発話候補：「はい。野球は大好きですよ。」に対応付けられた「そうなんですね。野球って楽しいですもんね。」との雑談発話を取得・生成し、出力するのである。

図１に戻って、入出力制御部１２３は、発話制御部１１４から入力された発話（ニュース発話、遷移発話、雑談発話）を、ユーザインタフェース１０２で出力可能な形に変換し、発話制御部１１４から指定された順序及びタイミングでユーザインタフェース１０２へ出力する。

例えば、ユーザインタフェース１０２がタッチパネル・ディスプレイである場合、入出力制御部１２３は、発話をディスプレイ表示データに変換して出力する。また、この場合、タッチパネル経由で入力されたユーザ側の発話を、例えばテキストデータに変換して発話制御部１１４へ出力することも好ましい。さらに、ユーザインタフェース１０２がスピーカ・マイクである場合、入出力制御部１２３は、発話を音声データに変換して出力する。また、この場合は、マイク経由で入力されたユーザ側の発話音声データを、例えばテキストデータに変換して発話制御部１１４へ出力することも好ましい。

図５は、ユーザインタフェース１０２がタッチパネル・ディスプレイである場合の発話出入力例を示す模式図である。

図５によれば、ユーザインタフェース１０２の表示画面に、左端部からの吹き出しの形で装置１側発話が表示され、右端部からの吹き出しの形でユーザ側発話が表示されている。両者の発話は上から順に交互に表示され、雑談対話の実施されていることが一目で理解される。

このうち、ユーザ側発話の入力は、タッチパネルを用いた文字入力でもよく、装置１に備えられたマイクを介したユーザによる音声入力であってもよい。また、装置１側の発話の出力も装置１に備えられたスピーカを介した音声出力することもできる。勿論、発話の入出力を音声入出力だけとしてもよい。ちなみに例えば、対話制御装置１が、本発明による対話制御プログラムである対話アプリをダウンロードしたスマートフォンである場合、このアプリの機能としてこのような入出力を実現することが可能となる。

なお、ユーザインタフェース１０２の他の実施形態として、キーボードを備えたものや点字入出力器を備えたものを採用することも可能である。

図１に戻って、発話制御部１１４は、ＳＮＳ投稿取得部１１４ａを有していてもよい。このＳＮＳ投稿取得部１１４ａは、ＳＮＳサーバ４から通信インタフェース１０１を介して受信したＳＮＳ投稿群を蓄積したＳＮＳ投稿ＤＢ１０５から、ＳＮＳ投稿を取得し、さらにＳＮＳにおけるユーザのプロフィールやツイート本文の情報を取得して、ユーザの趣味嗜好に係る情報を決定する。

例えば、ユーザのプロフィールとツイート本文とを１つの文書にし、この文書からＴＦ-ＩＤＦ解析によって特徴語を抽出して、tf・idfスコアが上位である単語の中から趣味嗜好に関連する単語を選択し、この単語をユーザの趣味嗜好に係る情報としてもよい。このように決定されたユーザの趣味嗜好情報は例えば、テキスト取得部１２２が、ニュース記事ＤＢ１０３から、ユーザの趣味嗜好に合ったニュース記事テキストを取得する際に利用される。

また、発話制御部１１４は、例えば第１のテキスト群又は第２のテキスト群がニュース記事テキスト群（コンテンツテキスト群）である場合に、取得されたＳＮＳ投稿であって、決定されたニュース記事テキストに関連しており所定条件を満たすＳＮＳ投稿に基づいたニュース発話を出力することも好ましい。

図６は、発話制御部１１４における、取得したＳＮＳ投稿を利用したニュース対話の一実施形態を説明するための機能ブロック図である。

図６によれば、発話制御部１１４は、ニュース対話に係る機能構成部として、すでに述べたＳＮＳ投稿取得部１１４ａと、ニュース発話出力部１１４ｂと、ＳＮＳ投稿判定部１１４ｃと、ＳＮＳ投稿発話出力部１１４ｄとを有している。このうち、ニュース発話出力部１１４ｂは、決定されたニュース記事テキストから生成された（例えばニュース記事テキストのタイトルと本文の全部又は所定の一部とから構成された）ニュース発話を出力する。

また、ＳＮＳ投稿取得部１１４ａは、決定されたニュース記事テキストに関連する複数のＳＮＳ投稿を取得する。例えば、このニュース記事のＳＮＳリンクボタン（ツイートボタン）を通して生成されたＳＮＳ投稿を、関連する投稿として取得してもよい。

さらに、ＳＮＳ投稿判定部１１４ｃは、取得したＳＮＳ投稿をポジティブ又はネガティブの２つのカテゴリに分類し、ニュース対話時に取得されるユーザ側発話の内容に応じて、いずれかのカテゴリの中からＳＮＳ投稿を１つ選択する。例えば、ユーザの発話内容がネガティブな内容であると判定された場合、ネガティブ・カテゴリの中からＳＮＳ投稿を１つ選択する。

ここで、ＳＮＳ投稿やユーザ側発話におけるポジティブ／ネガティブの分類は、予め作成されたポジティブ語・ネガティブ語辞書を用いて行うことができる。この場合、ＳＮＳ投稿（若しくはユーザ側発話）から抽出した単語群又は特徴語を、この辞書を用いてポジティブ／ネガティブに分類して判断してもよい。例えば、「すごいね」を有するＳＮＳ投稿はポジティブであり、「・・・ない」を有するＳＮＳ投稿はネガティブであると判断されてもよい。さらに他の分類方法として、ＳＶＭ（Support Vector Machine）等の（ポジティブ／ネガティブの学習済みの）識別器を用いて分類を行うことも可能である。

また、ＳＮＳ投稿発話出力部１１４ｄは、ＳＮＳ投稿判定部１１４ｃで選択したＳＮＳ投稿を、装置１側のニュース発話としてユーザインタフェース１０２へ出力する。以上説明したように、発話制御部１１４は、ユーザとの間で、関連するＳＮＳ投稿も利用した好適なニュース対話を実施することができるのである。

［対話制御方法］
図７は、本発明による対話制御方法の一実施形態を概略的に示すフローチャートである。同図に示す対話制御方法は、対話制御装置１における以上に説明したような、第１種及び第２種の対話がそれぞれニュース対話及び雑談対話である場合における対話制御処理に相当する。

（Ｓ１０１）所定の（例えばユーザの趣味嗜好情報に類似する）複数のニュース記事テキストを取得する。
（Ｓ１０２）取得したニュース記事テキストから、ニュース単語を抽出し、抽出した各ニュース単語のスコアを算出する。
（Ｓ１０３）各々キーワードの付与された複数の雑談発話テキストを取得する。

（Ｓ１０４）取得した雑談発話テキストのキーワードと一致しており最高のスコアを有するニュース単語である高スコア単語を決定し、取得したニュース記事テキストの中から、決定した高スコア単語が属しているニュース記事テキストを選択し、ニュース発話を生成する。
（Ｓ１０５）決定した高スコア単語と一致するキーワードが紐づけられた雑談発話テキストを選択する。

（Ｓ１０６）決定した高スコア単語及び選択した雑談発話テキストに基づいて、対話遷移発話を生成する。
（Ｓ１０７）ユーザインタフェース１０２を介して対話を実施する。具体的には、生成したニュース発話を出力し、次いで、生成した遷移発話を出力して、その後、ユーザ側発話に基づき生成した雑談発話を出力する。

次に、本発明による対話制御方法の他の実施形態を説明する。この実施形態は、対話制御装置１において以上に説明してきたように、最初にニュース対話（第１種の対話）が実施されて、次いで雑談対話（第２種の対話）が実施され、その後再びニュース対話（第１種の対話）が実施される形態となっている。

この場合、第１（第２）テキスト解析部１１１ｆ（１１１ｓ）及びテキスト決定部１１２（図１）は、ニュース対話（第１種の対話）に次ぐ雑談対話（第２種の対話）の後に再びニュース対話（第１種の対話）を実施すべく、
（ａ）直前に実施された雑談対話で実施された（ユーザ側及び装置１側の）発話テキストに係る単語及びその特徴度と、
（ｂ）ニュース記事テキスト群の各ニュース記事テキストに含まれる単語及びその特徴度と
に基づいて、直前に実施された雑談対話の発話テキストと各ニュース記事テキストとの類似度を算出し、この発話テキストに類似したニュース記事テキストを、再び実施するニュース対話（第１種の対話）における発話テキストに決定する。

より具体的には、第１（第２）テキスト解析部１１１ｆ（１１１ｓ）及びテキスト決定部１１２は、雑談対話からニュース対話へ戻る形で対話遷移を行う際、この雑談対話におけるユーザ側発話と装置１側発話とをまとめて１つの雑談文章テキストとし、ＴＦ-ＩＤＦ解析を用いてこの雑談文章テキストから特徴語である雑談単語を抽出して当該雑談単語のtf・idfスコアを算出する。ここで、抽出した雑談単語に人名語があれば、この人名語を上述したようにMeCab等を用いて職業名語に置換する。ここで上述した目的の下、職業名語に置換した雑談単語のtf・idfスコアをより高くしたり、又はより低くしたりしてもよい。

次いで、この雑談文章テキストにおける雑談単語と、すでに最初のニュース対話について抽出されたニュース単語とを比較し、一致したニュース単語をマーキングする。ここで、雑談文章テキストのtf・idfスコアベクトルと、マーキングしたニュース単語の属する各ニュース記事テキストのtf・idfスコアベクトルとのコサイン（cos）類似度を算出し、cos類似度の最も高いニュース記事テキストを、次いで実施するニュース対話の発話テキストに決定するのである。

ちなみに、対話の中で同じ内容を繰り返す事態を回避するため、過去のニュース対話の中ですでに選択されたニュース記事テキストは、ここでは発話テキストとして決定されないことも好ましい。

なお、本実施形態において、遷移発話生成部１１３（図１）は、雑談対話から、それに続く再度のニュース対話への対話遷移をより自然な形にする目的で、この対話遷移のタイミングで遷移発話を生成し出力することも好ましい。簡単な例として、「ところで、会話の中に＜雑談文章テキストにおける最高のtf・idfスコアを有する特徴語＞って出てきたけど、こんなニュースがあったよ。」といった定型フォーマットを用いて遷移発話を生成してもよい。

図８は、本発明による対話制御方法の他の実施形態を概略的に示すフローチャートである。同図に示す対話制御方法は、対話制御装置１における以上に説明したような、第１種及び第２種の対話としてそれぞれニュース対話及び雑談対話を実施した後に再度、ニュース対話を実施する場合における対話制御処理に相当する。具体的には、図７に示したフローの続きのフローとなっている。

（Ｓ２０１）ユーザインタフェース１０２を介して雑談対話を実施し、実施した雑談対話の発話を文章化した雑談文章テキストから、雑談単語（特徴語）を抽出し、抽出した雑談単語のスコアを算出する。
（Ｓ２０２）抽出した雑談単語と一致するニュース単語（一致ニュース単語）と、一致ニュース単語の（すでに算出された）スコアとを抽出する。
（Ｓ２０３）一致ニュース単語を有するニュース記事テキストと対話文章テキストとの間で、スコアベクトルの類似度を算出する。

（Ｓ２０４）類似度の最も高いニュース記事テキストを選択し、ニュース発話を生成する。
（Ｓ２０５）雑談文章テキストで最高のスコアを有する雑談単語に基づいて、遷移発話を生成する。
（Ｓ２０６）ユーザインタフェース１０２を介して対話を実施する。具体的には、生成した遷移発話を出力し、その後、生成したニュース発話を出力する。

次いで、本発明による対話制御方法の更なる他の実施形態を説明する。この実施形態は、対話制御装置１において以上に説明してきたのとは逆に、最初に雑談対話（第１種の対話）が実施され、次いでニュース対話（第２種の対話）が実施される形態となっている。

この場合、第１（第２）テキスト解析部１１１ｆ（１１１ｓ）及びテキスト決定部１１２（図１）は、
（ａ）各ニュース記事テキストに含まれる単語及びその特徴度と、
（ｂ）実施した雑談対話の発話テキストに含まれる単語及びその特徴度と
に基づいて、この発話テキストと各ニュース記事テキストとの類似度を算出し、この発話テキストに類似したニュース記事テキストを、ニュース対話（第２種の対話）における発話テキストに決定することができる。

より具体的には、第１（第２）テキスト解析部１１１ｆ（１１１ｓ）及びテキスト決定部１１２は、各ニュース記事テキストからニュース単語を抽出し、ニュース単語のtf・idfスコアを算出する。また、最初の雑談対話（第１種の対話）におけるユーザ側発話と装置１側発話とをまとめて１つの雑談文章テキストとし、ＴＦ-ＩＤＦ解析を用いてこの雑談文章テキストから特徴語である雑談単語を抽出して当該雑談単語のtf・idfスコアを算出する。ここで、抽出した雑談単語に人名語があれば、この人名語を上述したようにMeCab等を用いて職業名語に置換する。また、上述したような目的の下、職業名語に置換した雑談単語のtf・idfスコアをより高くしたり、又はより低くしたりしてもよい。

次いで、この雑談文章テキストにおける雑談単語と、ニュース対話について抽出されたニュース単語とを比較し、一致したニュース単語をマーキングする。ここで、雑談文章テキストのtf・idfスコアベクトルと、マーキングしたニュース単語の属する各ニュース記事テキストのtf・idfスコアベクトルとのcos類似度を算出し、cos類似度の最も高いニュース記事テキストを、次いで実施するニュース対話の発話テキストに決定するのである。

このように、最初に説明した「ニュース対話→雑談対話」の（図７に示した）実施形態では、雑談対話における内容の異なる複数の発話に係る情報（類似キーワード及び職業キーワード）を考慮してニュース記事テキストが選択されるが、本実施形態では、雑談対話からのより自然な対話遷移を達成するため、装置１とユーザとの雑談対話そのものを考慮して選択を行っているのである。ちなみに、算出したcos類似度がいずれもゼロである場合、この最初に説明した実施形態と同じく雑談対話の発話に係る情報（類似キーワード及び職業キーワード）を考慮してニュース記事テキストを選択することも好ましい。

なお、本実施形態では、第１のテキスト群には、雑談文章テキストが１つ含まれている形であるので当然に、第１種の対話（雑談対話）における発話テキストを決定する処理は行われない。

図９は、本発明による対話制御方法の更なる他の実施形態を概略的に示すフローチャートである。同図に示す対話制御方法は、対話制御装置１において以上に説明してきたように、第１種及び第２種の対話としてそれぞれ雑談対話及びニュース対話を実施する場合における対話制御処理に相当する。

（Ｓ３０１）所定の（例えばユーザの趣味嗜好情報に類似する）複数のニュース記事テキストを取得する。
（Ｓ３０２）取得したニュース記事テキストから、ニュース単語を抽出し、抽出した各ニュース単語のスコアを算出する。
（Ｓ３０３）ユーザインタフェース１０２を介して雑談対話を実施し、実施した雑談対話の発話を文章化した雑談文章テキストから、雑談単語（特徴語）を抽出し、抽出した雑談単語のスコアを算出する。

（Ｓ３０４）雑談文章テキストと各ニュース記事テキストとの間で、スコアベクトルの類似度を算出し、類似度の最も高いニュース記事テキストを選択し、ニュース発話を生成する。
（Ｓ３０５）雑談文章テキストで最高のスコアを有する雑談単語に基づいて、遷移発話を生成する。
（Ｓ３０６）ユーザインタフェース１０２を介して対話を実施する。具体的には、生成した遷移発話を出力し、その後、生成したニュース発話を出力する。

以上詳細に説明したように、本発明によれば、第１種の対話での発話テキストを決定する際には、第２のテキスト群のテキストも考慮し、第２種の対話での発話テキストを決定する際には、第１のテキスト群のテキストも考慮している。これにより、第１種の対話での発話と、第２種の対話での発話との間に、発話内容や話題の関連性が生じ、結果的に、第１種の対話から第２種の対話への対話遷移がより自然な形で行われることになる。

特に、所定のコンテンツに係る対話（コンテンツ対話）での発話テキストとして、このコンテンツテキストを選択することができる状況において、非コンテンツ対話での発話テキストとの対比を行い、次いで行われる予定の非コンテンツ対話の内容へ自然な形で遷移し易い内容のコンテンツテキストを選択して、コンテンツ対話を実施することができるので、対話遷移の自然性がより向上するのである。

以上に述べた本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。

１対話制御装置
１０１通信インタフェース
１０２ユーザインタフェース（ＵＩ）
１０３ニュース記事データベース（ＤＢ）
１０４、３雑談シナリオＤＢ
１０５ＳＮＳ投稿ＤＢ
１０６人物・職業辞書
１１１ｆ第１テキスト解析部
１１１ｆａ第１職業置換部
１１１ｓ第２テキスト解析部
１１１ｓａ第２職業置換部
１１２テキスト決定部
１１２ａ第１発話生成部
１１２ｂ第２発話生成部
１１３遷移発話生成部
１１４発話制御部
１１４ａＳＮＳ投稿取得部
１２１通信制御部
１２２テキスト取得部
１２３入出力制御部
２ニュースサーバ
４ＳＮＳサーバ

Claims

第１種の対話と、それに次ぐ第２種の対話とを実施可能な対話制御装置であって、
当該第１種の対話に関連する第１のテキスト群に含まれる各テキスト、及び当該第２種の対話に関連する第２のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するテキスト解析手段と、
当該第１テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第２のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第１のテキスト群が複数のテキストを含む場合に当該第１のテキスト群から、当該第１種の対話における発話に係るテキストを決定し、当該第２のテキスト群から、当該第２種の対話における発話に係るテキストを決定するテキスト決定手段と、
決定された当該テキストに基づいた発話を出力する発話制御手段と
を有することを特徴とする対話制御装置。
当該テキスト構成要素情報は、当該テキストに含まれる単語及び該単語の特徴度であることを特徴とする請求項１に記載の対話制御装置。
当該第１のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、当該第２のテキスト群は所定の発話に係るテキストであって当該テキスト関連情報としてのキーワードが紐づけられたテキストである発話テキストの集合であり、
前記テキスト解析手段は、当該各コンテンツテキストに含まれる単語を抽出して該単語の特徴度を算出し、当該特徴度に基づいて当該コンテンツテキストの特徴語を決定し、
前記テキスト決定手段は、当該キーワードと一致する特徴語である一致特徴語に係るコンテンツテキストを、当該第１種の対話における発話に係るテキストに決定し、当該一致特徴語と一致するキーワードに係る発話テキストを、当該第２種の対話における発話に係るテキストに決定する
ことを特徴とする請求項２に記載の対話制御装置。
当該第１のテキスト群は少なくとも所定の発話に係るテキストである発話テキストを含み、当該第２のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、
前記テキスト解析手段は、当該発話テキストに含まれる単語を抽出して該単語の特徴度を算出し、また、当該各コンテンツテキストに含まれる単語を抽出して該単語の特徴度を算出し、
前記テキスト決定手段は、当該発話テキストに含まれる単語及び該単語の特徴度と、当該各コンテンツテキストに含まれる単語及び該単語の特徴度とに基づいて、当該発話テキストと当該各コンテンツテキストとの類似度を算出し、当該発話テキストに類似したコンテンツテキストを、当該第２種の対話における発話に係るテキストに決定する
ことを特徴とする請求項２に記載の対話制御装置。
当該第１テキスト群に含まれる各テキストに係る当該単語のうち当該特徴度の最も高い単語を用いて、当該第１種の対話から当該第２種の対話への対話遷移のための遷移発話を生成する遷移発話生成手段を更に有し、
前記発話制御手段は、当該第１種の対話から当該第２種の対話へ対話を遷移させるタイミングで、当該遷移発話を出力する
ことを特徴とする請求項２から４のいずれか１項に記載の対話制御装置。
当該テキスト関連情報は当該テキストに紐づけられたキーワードであって、当該キーワードの１つは職業名に係る単語であり、
前記テキスト解析手段は、当該特徴語が人名に係る単語である場合に、人物と職業とが対応付けられた辞書を用いて、該特徴語を職業名に係る単語に置換する職業置換手段を有し、
前記テキスト決定手段は、当該発話に係るテキストを決定する際の対比を、置換後の当該職業名に係る単語について実施する
ことを特徴とする請求項２から５のいずれか１項に記載の対話制御装置。
当該第１テキスト群に含まれる各テキストに係る当該単語のうち当該特徴度の最も高い単語を用いて、当該第１種の対話から当該第２種の対話への対話遷移のための遷移発話を生成し、当該特徴度の最も高い単語が当該職業名に係る単語に置換されていても元の当該特徴度の最も高い単語を用いて遷移発話を生成する遷移発話生成手段を更に有し、
前記発話制御手段は、当該第１種の対話から当該第２種の対話へ対話を遷移させるタイミングで、当該遷移発話を出力する
ことを特徴とする請求項６に記載の対話制御装置。
前記職業置換手段は、当該職業名に係る単語に置換された特徴語の特徴度を、意外性を有する対話遷移を行うためにより高い値に変更し、または、置換の過誤を抑制するためにより低い値に変更することを特徴とする請求項６又は７に記載の対話制御装置。
当該第１のテキスト群は所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、当該第２のテキスト群は所定の発話に係るテキストであって当該テキスト関連情報としてのキーワードが紐づけられたテキストである発話テキストの集合であり、
前記テキスト決定手段は、当該第１種の対話に次ぐ当該第２種の対話の後に再び当該第１種の対話を実施すべく、実施された当該発話テキストに係る当該単語及び特徴度と、当該各コンテンツテキストに含まれる単語と該単語の特徴度とに基づいて、当該発話テキストと当該各コンテンツテキストとの類似度を算出し、当該発話テキストに類似したコンテンツテキストを、再び実施する当該第１種の対話における発話に係るテキストに決定する
ことを特徴とする請求項２又は３に記載の対話制御装置。
当該第１のテキスト群又は当該第２のテキスト群は、所定のコンテンツに係るテキストであるコンテンツテキストの集合であり、
前記発話制御手段は、所定のＳＮＳ（Social Networking Service）投稿を取得するＳＮＳ投稿取得手段を有し、取得されたＳＮＳ投稿であって、当該発話に係るテキストに決定されたコンテンツテキストに関連しており所定条件を満たすＳＮＳ投稿に基づいた発話を出力する
ことを特徴とする請求項２から９のいずれか１項に記載の対話制御装置。
第１種の対話と、それに次ぐ第２種の対話とを実施可能な装置に搭載されたコンピュータを機能させるプログラムであって、
当該第１種の対話に関連する第１のテキスト群に含まれる各テキスト、及び当該第２種の対話に関連する第２のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するテキスト解析手段と、
当該第１テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第２のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第１のテキスト群が複数のテキストを含む場合に当該第１のテキスト群から、当該第１種の対話における発話に係るテキストを決定し、当該第２のテキスト群から、当該第２種の対話における発話に係るテキストを決定するテキスト決定手段と、
決定された当該テキストに基づいた発話を出力する発話制御手段と
してコンピュータを機能させることを特徴とする対話制御プログラム。
第１種の対話と、それに次ぐ第２種の対話とを実施可能な装置に搭載されたコンピュータにおいて実施される対話制御方法であって、
当該第１種の対話に関連する第１のテキスト群に含まれる各テキスト、及び当該第２種の対話に関連する第２のテキスト群に含まれる各テキストのうちの少なくとも一方について、当該各テキストの構成要素に係るテキスト構成要素情報を決定するステップと、
当該第１テキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報と、当該第２のテキスト群に含まれる各テキストに係るテキスト構成要素情報又は当該テキストに関連付けられたテキスト関連情報との対比に基づいて、当該第１のテキスト群が複数のテキストを含む場合に当該第１のテキスト群から、当該第１種の対話における発話に係るテキストを決定し、当該第２のテキスト群から、当該第２種の対話における発話に係るテキストを決定するステップと、
決定された当該テキストに基づいた発話を出力するステップと
を有することを特徴とする対話制御方法。