JP2021071569A

JP2021071569A - キーワード評価装置、キーワード評価方法及びキーワード評価プログラム

Info

Publication number: JP2021071569A
Application number: JP2019197588A
Authority: JP
Inventors: 金子　豊; Yutaka Kaneko; 金子　　豊; 祐太星; Yuta Hoshi; 勇太萩尾; Yuta Hagio
Original assignee: Nippon Hoso Kyokai NHK; Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 2019-10-30
Filing date: 2019-10-30
Publication date: 2021-05-06
Anticipated expiration: 2039-10-30
Also published as: JP7407560B2

Abstract

【課題】キーワードそれぞれに対する、利用者の興味度を評価できるキーワード評価装置、キーワード評価方法及びキーワード評価プログラムを提供すること。【解決手段】キーワード評価装置１は、入力されたキーワードを含む発話文を生成し、利用者に対して出力する発話生成部１３と、発話文に対する利用者のリアクション種別を取得するリアクション取得部１４と、リアクション種別に基づいて、利用者のキーワードに対する興味度を算出する興味度演算部１６と、を備える。【選択図】図１

Description

本発明は、キーワードを評価する装置、方法及びプログラムに関する。

従来、人と一緒にテレビ番組などの映像を視聴するコミュニケーションロボットに関する技術が提案されている。
例えば、特許文献１では、映像に関連するソーシャルメディアコメントを利用し、ロボットの内部的なパーソナリティ又は感情状態などに応じて、発話文を生成し、ロボットを動作させることで、ロボットがユーザと共に映像を視聴しているかのようなアクションを実現する技術が提案されている。
また、特許文献２では、ロボットが人からのチャンネル切り替えなどの命令に応じると共に、テレビの方向を向きながら自発的につぶやくことで、ロボットが自律してテレビを視聴しているかのような動作をするロボットの制御技術が提案されている。

特許第６１２２７９２号公報特開２０１８−１８０４７２号公報特許第５１９４１９８号公報特許第６４８６１６５号公報

山本誠、谷本浩昭、新田直子、馬場口登；「個人的選好獲得のための特定人物のテレビ視聴時における興味区間推定」、電子情報通信学会論文誌Ｄ、Ｖｏｌ．Ｊ９０−Ｄ、Ｎｏ．８、ｐｐ．２２０２−２２１１、２００７

ところで、人と一緒にテレビを視聴するコミュニケーションロボットに、視聴中の番組に関連する話題に対して、人と共感する動作などをさせるためには、ロボットと一緒にいる人がどのような事に興味があるかを知ることが重要である。このような情報の１つとして、固有名詞などのキーワードにその人がどの程度興味を持っているかの指標である興味度がある。
例えば、ロボットと一緒にテレビを視聴している人が「Ａ子さん」のファンであること、すなわち興味度が高いことが分かると、「Ａ子さんってかわいいよね」というような共感する発話文や、「今、Ａ子さんがテレビに出てるよ」といった情報提供の発話文などをロボットから発話することができるようになる。

特許文献３では、過去の視聴履歴から、その人が興味を持ちそうな番組を推薦する技術が提案されている。これは、利用者が嗜好するコンテンツを提示する技術であり、特に他の人との関係性も含めた嗜好性の推定が行われる。
しかし、このような番組推薦で使われる技術では、推定対象は番組であり、視聴中の番組に関連した興味のあるキーワードの推定には利用できない。

特許文献４では、番組に関連する数多くのキーワードの中から、興味候補キーワードを抽出する技術が提案されている。これは、予め準備された複数の辞書を用いて、番組に関連した多くのキーワードの中から、一般的に興味が強いと推定されるキーワードを抽出する技術である。
しかし、抽出されたキーワードはあくまで、複数の辞書によって興味が強いと推定されるキーワードであり、番組を視聴している個人の興味は反映されない。

非特許文献１では、視聴中のテレビ番組の興味区間を推定する技術が提案されている。この技術は、テレビ視聴中の人の表情をカメラで撮り、その表情から興味区間を推定する手法である。これにより、番組内の興味区間にタグ付けされているキーワードを、興味のあるキーワードとして推定できる。
しかし、推定された興味区間内にタグ付けされたキーワードが複数ある場合には、これらの中のどのキーワードに興味があるかという推定はできない。また、テレビ番組を視聴中の人の表情を撮影するためには、家庭内にカメラを設置する必要があり、現実的には困難である。たとえ、カメラが設置できたとしても、日常の生活では、例えば横になって視聴するなど、顔の位置と向きとは様々であるため、人の表情を精度よく抽出することは困難である。

このように、番組に数多くの関連するキーワードがタグ付けされていた場合、番組視聴中の視聴者の興味の対象であるキーワードを推定するには、視聴中のユーザからの何らかのリアクションが情報として必要となる。しかし、カメラなどのセンサ機器を家庭内に設置すること、又は身体にセンサ類を装着して視聴者のリアクションを観測することは、現実的には困難な場合が多い。また、視聴履歴、又はリモコンの操作などにより取得できる情報は、番組単位の嗜好を推定するためには利用できるが、番組内の関連するキーワードに対する興味度を推定するには不十分であるという課題があった。

本発明は、キーワードそれぞれに対する、利用者の興味度を評価できるキーワード評価装置、キーワード評価方法及びキーワード評価プログラムを提供することを目的とする。

本発明に係るキーワード評価装置は、入力されたキーワードを含む発話文を生成し、利用者に対して出力する発話生成部と、前記発話文に対する前記利用者のリアクション種別を取得するリアクション取得部と、前記リアクション種別に基づいて、前記利用者の前記キーワードに対する興味度を算出する興味度演算部と、を備える。

前記リアクション取得部は、前記リアクション種別として、ポジティブ及びネガティブを含む複数の種別のいずれかを取得してもよい。

前記リアクション取得部は、前記発話文に対する前記利用者のリアクション時間を計測し、当該リアクション時間が所定時間を超える場合、前記リアクション種別として無反応の種別を取得してもよい。

前記キーワード評価装置は、前記発話文の種別を、所定数の発話種別の中から、予め定められた確率で選択する発話種別選択部を備えてもよい。

前記キーワード評価装置は、前記リアクション種別に基づいて、前記発話種別ごとに、前記キーワードを含む発話文に対する嗜好度を算出する嗜好度演算部を備え、前記興味度演算部は、前記嗜好度の統計情報により前記興味度を算出してもよい。

前記リアクション取得部は、前記発話文に対する前記利用者のリアクション時間を計測し、前記嗜好度演算部は、前記リアクション時間に基づいて、前記嗜好度に重み付けしてもよい。

前記キーワード評価装置は、放送番組から、所定のデータベースに含まれる前記キーワードを抽出するキーワード抽出部を備えてもよい。

本発明に係るキーワード評価方法は、入力されたキーワードを含む発話文を生成し、利用者に対して出力する発話生成ステップと、前記発話文に対する前記利用者のリアクション種別を取得するリアクション取得ステップと、前記リアクション種別に基づいて、前記利用者の前記キーワードに対する興味度を算出する興味度演算ステップと、をコンピュータが実行する。

本発明に係るキーワード評価プログラムは、前記キーワード評価装置としてコンピュータを機能させるためのものである。

本発明によれば、キーワードそれぞれに対する、利用者の興味度を評価できる。

実施形態におけるキーワード評価装置の機能構成を示すブロック図である。実施形態における発話生成部の詳細な機能構成を示す図である。実施形態における開示テンプレートの一例を示す図である。実施形態における質問テンプレートの一例を示す図である。実施形態における確認テンプレートの一例を示す図である。実施形態におけるキーワード辞典の登録例を示す図である。実施形態におけるキーワード辞書に記録される嗜好度の一例を示す図である。

以下、本発明の実施形態の一例について説明する。
本実施形態におけるキーワード評価方法は、キーワードに対する利用者の興味度を評価する方法である。特に、本実施形態では、テレビなどの放送番組の視聴者と一緒に番組を視聴するロボットが、視聴中の番組に関連するキーワードに対する視聴者の興味度を評価する方法を例示する。
なお、本実施形態では、キーワードに対する興味の指標値を興味度と呼び、値が大きいほど興味が高いものとする。

本実施形態では、人と一緒に番組を視聴するロボットに、キーワードの興味度を評価するキーワード評価装置が組み込まれ、ロボットは、視聴中の放送番組に関連するキーワードを含んだ発話文を視聴中の人に対して話しかけ、その反応を取得することによって、キーワードに対する興味度を評価する。

図１は、本実施形態におけるキーワード評価装置１の機能構成を示すブロック図である。
キーワード評価装置１は、制御部及び記憶部の他、各種インタフェースを備えた情報処理装置であり、記憶部に格納されたソフトウェア（キーワード評価プログラム）を制御部が実行することにより、本実施形態の各種機能が実現される。

キーワード評価装置１の制御部は、キーワード抽出部１１と、発話種別選択部１２と、発話生成部１３と、リアクション取得部１４と、嗜好度演算部１５と、興味度演算部１６とを備える。
また、キーワード評価装置１の記憶部は、キーワード評価プログラムの他、キーワード辞書１７などの各種データベースを備えている。

本実施形態において、キーワード評価装置１は、利用者との間のインタフェースの一例として音声による入出力を行うこととする。キーワード評価装置１から出力された発話文出力Ｏは、音声合成装置２により音声出力ＯＡとして利用者に音声として提示される。音声出力ＯＡに対する利用者の応答である音声入力ＩＡは、音声認識装置３によりテキスト文に変換され、キーワード評価装置１の応答文入力Ｉとして入力される。

なお、本実施形態では、利用者との間のインタフェースとして音声による方式を説明するが、これに限定されるものではなく、例えば、発話文出力Ｏをディスプレイに表示し、利用者がキーボードなどを使って応答文入力Ｉを入力する方法でもよい。

キーワード抽出部１１は、キーワード評価装置１に入力される入力文Ｔから、キーワード辞書１７に存在するキーワードを抽出する。本実施形態では、入力文Ｔは、視聴中の放送番組に含まれる字幕情報（クローズドキャプション）として説明する。例えば、「今日はこのお店のラーメンを食べに行ってみたいと思います。」という字幕文が入力文Ｔとして入力され、キーワード辞書１７に「ラーメン」というキーワードが含まれている場合には、キーワード抽出部１１は、キーワード「ラーメン」を抽出する。

なお、キーワード辞書１７は、評価対象のキーワードが登録されたデータベースである。キーワードは、主に、人名、地名、施設などの固有名詞及び一般名詞などである。本実形態では、キーワード辞書１７にキーワードが予め登録されているものとする。また、キーワード辞書１７に登録されている各キーワードに対して、後述の発話文種別ごとに、嗜好の程度を示す嗜好度が保存される。

ここで、放送番組から字幕情報を抽出する方法は限定されないが、例えば、ロボットがテレビ受像機と連動して字幕情報を取得したり、放送連動サービスとして、インターネットなどの通信設備を用いて配信される字幕情報を取得したりといった方法がとられる。
なお、本実施形態では、入力文Ｔを字幕情報としているが、これには限定されない。例えば、ロボットに装備されたカメラ又はマイクロフォンを用いて、テレビ画像の画像処理、又はテレビ音声の音声認識などにより抽出された文であってもよい。

また、字幕情報などからキーワードを抽出する頻度は、一定時間を挟みながらランダムにサンプリングするなど、適宜調整されてよい。あるいは、キーワード抽出部１１は、単語の出現頻度などに基づく重要度の高いキーワードを優先して、又は発話回数が少なく評価が十分に得られていないキーワードを優先して、抽出されるキーワードの数を絞ってもよい。

発話種別選択部１２は、発話生成部１３で生成する発話文の種別を、所定数の発話種別の中から、予め定められた確率で選択する。
ここで、発話種別は、テレビ視聴時の人同士の会話における発話を分類したものであり、例えば、次の文献Ａでは、「質問」「指示」「情報」「開示」「反射」「確認」「解釈」「応答」の８種類の種別が定義されている。
文献Ａ：星裕太、金子豊、萩尾勇太、村崎康博、上原道宏：「ロボット発話に向けたテレビ視聴時の人同士の対話解析」、電子情報通信学会、信学技報、ＣＮＲ２０１９−１（２０１９−０６）、ｐｐ．１−６

本実施形態では、発話種別を、「質問」「情報」「開示」「確認」の４種類とし、発話種別選択部１２は、これら４つの種別の中から１つを、所定の確率で選択する。
「質問」は、相手へ質問をする発話であり、例えば、「Ａ子さんは好きですか？」などがこれにあたる。
「情報」は、相手へ何らかの情報を提供する発話であり、例えば、「Ａ子さんは昔、〇〇ドラマに出てたんだ。」などがこれにあたる。
「開示」は、相手に自分の考えや気持ちを伝える発話であり、例えば、「Ａ子さんって大好き。」などがこれにあたる。
「確認」は、相手に何かの確認をする発話であり、例えば、「Ａ子さんはきれいですね。」などがこれにあたる。

文献Ａによれば、テレビ視聴時の人同士の会話では、会話を始める際の発話種別は、「開示」が２０〜４０％と多く、次いで「確認」が１４〜２０％、「質問」が８〜１６％、「情報」が４〜９％となっている。そこで、発話種別選択部１２は、例えば、「開示」を４５％、「確認」を３０％、「質問」を１５％、「情報」を１０％の割合でランダムに選択する。

発話生成部１３は、キーワード抽出部１１により抽出されたキーワードと、発話種別選択部１２により選択された発話種別とに基づいて、発話文を生成し、発話文出力Ｏとして出力する。
具体的には、発話生成部１３は、発話種別選択部１２が選択した発話種別に応じた、キーワード抽出部１１が抽出したキーワードを含む発話文を生成する。このため、発話生成部１３は、４種類の発話種別のそれぞれに対応した発話文の生成手段を含んでいてよい。

例えば、次の文献Ｂでは、過去の放送番組の字幕文を用いて、感情語が含まれる字幕文をテンプレート文として保管しておき、キーワードと組み合わせることで、このキーワードを含む感情を表す発話文を自動生成する技術が提案されている。この技術では、「食べたい」、「話したい」、「行きたい」などの願望を表す動詞句と、「きれい」、「おもしろい」、「大きい」などの形容詞とを代表語と呼び、対象のキーワードと特徴ベクトルの近い代表語が選択される。対象キーワードに対応する代表語が選択されると、この代表語を含むテンプレート文により発話文が生成される。本実施形態では、前述の４つの発話種別のうち、「開示」「質問」「確認」の各発話文を生成するために、この技術を応用する。
文献Ｂ：特開２０１８−１９００７７号公報

図２は、本実施形態における発話生成部１３の詳細な機能構成を示す図である。
発話生成部１３は、テンプレート抽出部１３１と、ベクトル距離算出部１３２と、テンプレート選択部１３３、キーワード検索部１３４、情報文生成部１３５とを備える。
また、発話生成部１３は、記憶部に格納されたテンプレートデータベース１８Ａ、特徴ベクトルデータベース１８Ｂ、及びキーワード辞典１８Ｃの各データベースを参照する。

発話生成部１３には、キーワード抽出部１１により抽出されたキーワードＫｅｙと、発話種別選択部１２により選択された発話種別Ｃとが入力される。
ここで、発話種別Ｃが「質問」「開示」「確認」のいずれかの場合、キーワードＫｅｙ及び発話種別Ｃはテンプレート抽出部１３１に、発話種別Ｃが「情報」の場合、キーワードＫｅｙ及び発話種別Ｃはキーワード検索部１３４に、それぞれ入力される。

テンプレート抽出部１３１は、テンプレートデータベース１８Ａから、発話種別Ｃが「開示」の場合には開示テンプレートを、「質問」の場合には質問テンプレートを、「確認」の場合には確認テンプレートを抽出する。
ＸＸテンプレートは、「ＸＸ」文を生成するためのテンプレートが保管されたデータであり、代表語と、この代表語に対応したテンプレート文とが含まれる。

図３は、本実施形態における開示テンプレートの一例を示す図である。
開示テンプレートは、代表語と、この代表語に対する「開示」文を生成するためのテンプレート文とが対になって登録されたデータである。
この例では、代表語として、「話したい」「行きたい」「食べたい」「きれい」「おもしろい」「大きい」の６つの代表語と、各代表語に対応するテンプレート文とが登録されている。例えば、動詞句の代表語「話したい」に対して、２つのテンプレート文「％ｋｅｙと話したい」、「％ｋｅｙとおしゃべりしたい」が登録されている。また、形容詞の代表語「きれい」に対して、「％ｋｅｙってとっても綺麗」、「なんてきれいな％ｋｅｙ」の２つのテンプレート文が登録されている。
なお、テンプレート文の％ｋｅｙは、キーワードの挿入位置を示している。

図４は、本実施形態における質問テンプレートの一例を示す図である。
質問テンプレートについても、開示テンプレートと同様の構造であり、代表語と共に、「質問」文を生成するためのテンプレート文が登録されている。
この例では、「話したい」「行きたい」「食べたい」の３つの動詞句の代表語に対するテンプレート文が登録されている。例えば、動詞句の代表語「話したい」に対して、「％ｋｅｙと話したことある？」、「％ｋｅｙとおしゃべりしたいですか？」の２つのテンプレート文が登録されている。

図５は、本実施形態における確認テンプレートの一例を示す図である。
確認テンプレートについても、データの構造は開示テンプレート及び質問テンプレートと同様であり、代表語と共に、「確認」文を生成するためのテンプレート文が登録されている。
この例では、形容詞の代表語「きれい」「おもしろい」「おいしい」の３つの形容詞の代表語に対するテンプレート文が登録されている。例えば、形容詞の代表語「きれい」に対して、「％ｋｅｙってとっても綺麗ですよね」、「きれいな％ｋｅｙってすてきですよね」の２つのテンプレート文が登録されている。

ベクトル距離算出部１３２は、テンプレート抽出部１３１により抽出されたテンプレート群に対して、テンプレート内の各代表語の特徴ベクトルと、キーワード（Ｋｅｙ）の特徴ベクトルとのベクトル距離を計算する。
特徴ベクトルデータベース１８Ｂには、少なくともキーワード辞書１７に記録されているキーワードと、各テンプレートに含まれている代表語とに関して、予め特徴ベクトルが記録されている。

特徴ベクトルの算出方法としては、例えばｗｏｒｄ２ｖｅｃなどの方法がある。ｗｏｒｄ２ｖｅｃは、３層のニューラルネットワークを用いており、分かち書きされた大量の文章を入力することで算出された特徴ベクトルは、類似した語が距離の近いベクトルになることが経験的に知られている。
なお、特徴ベクトルの算出方法は、ｗｏｒｄ２ｖｅｃには限られず、意味的に近い語の特徴ベクトルがベクトル空間上で近くに分布する演算方式であればよい。

ここで、キーワードＫｅｙの特徴ベクトルをｖｅｃ＿ｋ、代表語ｔの特徴ベクトルをｖｅｃ＿ｔとしたとき、ベクトル間の距離として、例えば、コサイン類似度ｃｏｓ（ｖｅｃ＿ｋ，ｖｅｃ＿ｔ）＝（ｖｅｃ＿ｋ・ｖｅｃ＿ｔ）／（｜ｖｅｃ＿ｋ｜｜ｖｅｃ＿ｔ｜）が利用できる。

テンプレート選択部１３３は、ベクトル距離算出部１３２によるキーワードＫｅｙの特徴ベクトルと各代表語の特徴ベクトルとのコサイン類似度の計算結果の中から、キーワードＫｅｙの特徴ベクトルに最も近い、すなわちコサイン類似度の値が大きい特徴ベクトルを持つ代表語を選択する。

次に、テンプレート選択部１３３は、選択された代表語に対するテンプレート文の中から１つのテンプレートを選択し、テンプレート文の中の％ｋｅｙをキーワードＫｅｙで置換することにより発話文（「質問」文、「開示」文、又は「確認」文）を生成する。
例えば、発話生成部１３にキーワードＫｅｙとして「讃岐うどん」が、発話種別Ｃとして「確認」が入力された場合、テンプレート抽出部１３１は、図５の確認テンプレートを抽出する。続いて、ベクトル距離算出部１３２は、「讃岐うどん」の特徴ベクトルｖｅｃ＿讃岐うどんと、代表語の特徴ベクトルｖｅｃ＿きれい、ｖｅｃ＿おもしろい、ｖｅｃ＿おいしいとのベクトル距離をそれぞれ計算する。そして、テンプレート選択部１３３は、これらの計算結果から、ｖｅｃ＿おいしいが最もベクトル距離が近かった場合には、「おいしい」に対するテンプレート文の中からランダムに１つを選択する。この結果、テンプレート文として「％ｋｅｙっておいしいですよね」を選択した場合には、テンプレート選択部１３３は、「確認」文として、「讃岐うどんっておいしいですよね」という発話文を生成する。

キーワード検索部１３４は、キーワード辞典１８Ｃから、入力されたキーワードＫｅｙの説明文を取得する。
キーワード辞典１８Ｃには、キーワードの意味などの説明文が登録されている。

図６は、本実施形態におけるキーワード辞典１８Ｃの登録例を示す図である。
この例では、キーワードとして、「アンモナイト」「讃岐うどん」「シリウス」が登録され、キーワード「アンモナイト」の説明として「３億５０００万年前に海に生息した巻貝みたいな殻をもった生物」が、キーワード「讃岐うどん」の説明として「香川県の特産うどん」が、「シリウス」の説明として「おおいぬ座で最も明るい恒星で、太陽を除けば地球上から見える最も明るい恒星」が登録されている。

情報文生成部１３５は、キーワード検索部１３４により取得された説明文とキーワードＫｅｙとを用い、発話文として「（Ｋｅｙ）は（説明文）なんだって」「（ｋｅｙ）は（説明文）なんだよ」などの「情報」文を生成する。
例えば、発話生成部１３にキーワードとして「シリウス」、発話種別として「情報」が入力された場合、キーワード検索部１３４は、説明文「おおいぬ座で最も明るい恒星で、太陽を除けば地球上から見える最も明るい恒星」を取得し、情報文生成部１３５は、「シリウスはおおいぬ座で最も明るい恒星で、太陽を除けば地球上から見える最も明るい恒星なんだって」を出力する。

リアクション取得部１４は、発話生成部１３が出力した発話文出力Ｏに対する利用者の反応である応答文入力Ｉから、利用者の嗜好を示すリアクション種別Ｃｒを取得する。また、発話文出力Ｏを出力してから応答文入力Ｉが入力されるまでの時間であるリアクション時間Ｔｒを計測する。

リアクション種別Ｃｒは、例えば、ポジティブな嗜好を示す「はい」、ネガティブな嗜好を示す「いいえ」、どちらでもない無関心を示す「無反応」の３種類であってよい。
リアクション取得部１４は、リアクション時間Ｔｒが予め決められた時間Ｔｈを超えて計測できない場合（Ｔｒ＝０とする）、すなわち時間Ｔｈ以内に応答文入力Ｉがない場合に、リアクション種別Ｃｒを「無反応」とする。また、リアクション取得部１４は、リアクション時間Ｔｒが時間Ｔｈ以内の場合、すなわち時間Ｔｈ以内に応答文入力Ｉがあった場合には、応答文入力Ｉについて、「はい」又は「いいえ」のいずれの文であるかの２クラス分類を行う。

文を２クラス分類する方法としては、例えば、予め学習データを用いた分類器を作成しておく方法があり、学習方法として、ニューラルネットワークを用いた方法、サポートベクタマシンを用いた方法などがある。なお、分類方法は、これらには限られない。

嗜好度演算部１５は、リアクション取得部１４により取得されたリアクション種別Ｃｒとリアクション時間Ｔｒとから、キーワードＫｅｙに対する嗜好の度合いを数値データとして算出する。算出結果は、キーワードＫｅｙを含む発話種別Ｃの発話文に対する嗜好度として、キーワードＫｅｙ及び発話種別Ｃごとにキーワード辞書１７に記録される。

ここで、キーワードＫｅｙを含む発話種別Ｃの発話文に対する嗜好度をＳ＿Ｃ＿Ｋｅｙとする。嗜好度の計算方法は限定されないが、嗜好度演算部１５は、例えば、リアクション時間Ｔｒに基づいて重み付けし、次の式によりＳ＿Ｃ＿Ｋｅｙを求める。
Ｓ＿Ｃ＿Ｋｅｙ＝｛α＿Ｃ×ｎ（Ｃｒ）−β＿Ｃ×（１−ｎ（Ｃｒ））｝／Ｔｒ
（Ｔｒ≠０のとき）
＝０（Ｔｒ＝０、すなわちＣｒ＝「無反応」のとき）
なお、ｎ（Ｃｒ）は、Ｃｒが「はい」のとき１、「いいえ」のとき０となる２値関数であり、α＿Ｃ及びβ＿Ｃは、予め決めておく定数である。

α＿Ｃ及びβ＿Ｃは、発話種別Ｃごとに設定することができる。例えば、発話種別が「質問」の発話文は、キーワードに関して直接的に利用者に質問する発話文であり、利用者からの「はい」又は「いいえ」の回答は、他の発話種別の発話文に対する応答文から推定したリアクション種別に比べ、信頼できるデータである。このため、α＿質問及びβ＿質問の値を他の発話種別より大きく設定しておくことで、他の発話種別の嗜好度よりも興味度への影響を大きくすることができる。

なお、本実施形態では、ｎ（Ｃｒ）を０又は１の２値関数として説明するが、これには限られず、ｎ（Ｃｒ）は整数又は実数であってもよい。例えば、リアクション取得部１４によるリアクション種別の分類時に信頼度などの値が取得できる場合、この値を用いることができる。また、リアクション取得部１４の入力として心拍計などのセンサデータを使う場合、この値を用いることもできる。

図７は、本実施形態におけるキーワード辞書１７に記録される嗜好度の一例を示す図である。
この例では、キーワードとして「アンモナイト」「讃岐うどん」「シリウス」が記録されている。また、各キーワードには、発話種別ごとの、これまでに計算された嗜好度の合計が記録されている。
嗜好度演算部１５は、発話文に対するリアクションを取得する度に、計算した嗜好度を、キーワード辞書１７の該当するキーワード及び発話種別の欄に記録されている嗜好度に加算すると共に、発話回数を＋１する。

例えば、キーワード「アンモナイト」に関する「質問」の発話は、これまでに１回行われ、嗜好度は＋１．２、「開示」の発話はこれまでに１回行われ、嗜好度は＋０．２である。同様に、キーワード「讃岐うどん」に関する「開示」の発話は３回行われ、嗜好度の合計値が＋０．３、「確認」の発話は１回行われ、嗜好度は−０．２である。

なお、発話文に対するリアクション種別が「無反応」だった場合、加算される嗜好度は０だが発話回数がカウントされるため、嗜好度の平均は、ポジティブ（好き）でもネガティブ（嫌い）でもない中立の状態へと近づく。

興味度演算部１６は、キーワードが指定された際に、このキーワードを含む発話文に対して過去のリアクション種別及びリアクション時間に基づいて算出された嗜好度の統計情報により、キーワードに対する利用者の興味度Ｋを算出して出力する。

具体的には、興味度演算部１６は、例えば、キーワード辞書１７の該当するキーワードの嗜好度の平均値を興味度として計算する。図７の例では、キーワード「アンモナイト」の興味度は（１．２／１＋０．２／１）／２＝０．７、キーワード「讃岐うどん」の興味度は（０．３／３−０．２／１）／２＝−０．１、キーワード「シリウス」の興味度は（０．４／２−０．２／１）／２＝０と計算できる。

本実施形態によれば、キーワード評価装置１は、キーワード辞書１７に保存されているキーワードに対して、利用者がどのような興味度を持っているかを推定するために、キーワード抽出部１１により抽出したキーワードに対して、発話生成部１３により発話文出力Ｏを生成する。キーワード評価装置１は、この発話文出力Ｏに対する利用者の応答である応答文入力Ｉから、リアクション取得部１４によりリアクション種別を判別し、このリアクション種別に基づいて、興味度演算部１６によりキーワードに対する興味度を算出する。

キーワード評価装置１は、例えば、ロボットに組み込まれることで、キーワードを含む発話文をロボットから人へ話しかけ、発話文への反応からキーワードに対する興味度を推定できる。従来の手法がテレビ視聴中の人からのパッシブな情報を収集して興味度を推定するのに対し、本実施形態では、ロボットから利用者に発話するというアクティブな手法により、キーワードそれぞれに対する利用者の反応の違いに基づいて、キーワードそれぞれに対する、利用者の興味度を評価できる。
この結果、ロボットは、利用者が好きなもの又は嫌いなものを選んで発話したり、キーワードへの興味度に応じて挙動を変化させたりといった、自然なコミュニケーションを実現できる。

また、キーワード評価装置１は、例えば、ロボットに組み込まれることで、利用者と一緒にテレビなどの放送番組を視聴中に、字幕文などからキーワード辞書１７に含まれるキーワードを抽出し、このキーワードに関する発話をロボットにさせる。
これにより、キーワード評価装置１は、ロボットの発話に対する利用者の反応から、視聴中の放送番組に関連するキーワードそれぞれに対する利用者の興味度を評価できる。

この結果、ロボットは、キーワードが入力された際に、このキーワードへの利用者の興味度に応じて異なる動作をすることが可能となる。すなわち、ロボットは、あるキーワードで発話をすべきかどうかを判断し、動作内容を選択したり、適時に興味のある関連番組などの情報を利用者に提示したりできる。
なお、興味度の高いキーワードに関して発話する内容と、興味度を評価するために発話する内容とは、共通であってよい。この場合、前述の各種テンプレートは共用される。そして、いずれの場合にも、利用者の応答に応じて、嗜好度及び興味度が更新されてよい。

キーワード評価装置１は、リアクション種別として、ポジティブ及びネガティブを含む複数の種別のいずれかを取得することで、キーワードに対する利用者の興味度を、一定の尺度で数値化して評価できる。

キーワード評価装置１は、発話文に対する利用者のリアクション種別を計測し、リアクション時間が所定時間を超える場合、リアクション種別として無反応の種別を取得する。
これにより、キーワード評価装置１は、キーワードに対して利用者が無関心であるような嗜好の種類を判別でき、興味度を適切に評価できる。

キーワード評価装置１は、発話種別選択部１２により、発話文の種別を所定数の発話種別の中から、予め定められた確率で選択する。
発話種別は、例えば「質問」のみでも興味度の評価は可能であるが、「質問」ばかりでは、利用者は、始めはロボットからの質問に応答していても、そのうちうっとうしいなどの理由で応答しなくなってしまうため、発話種別のバリエーションが必要である。文献Ａでは、人同士の会話では、「開示」文で会話が始まることが多いこと、また、「質問」「情報」「確認」は、「開示」文に比べて多くの発話は行われていないが、相手の反応率が高いという結果が示されている。
したがって、ロボットから人への発話の種別も、人同士の会話に近い確率で選択することにより、キーワード評価装置１は、例えば質問ばかりするロボットや、情報ばかり読み上げるロボットなどによって、利用者を飽きさせてしまうことなく、人と同じような発話種別の割合でロボットに発話させ、自然な対話を実現できる。

キーワード評価装置１は、嗜好度演算部１５により、リアクション種別に基づいて、発話種別ごとに、キーワードを含む発話文に対する嗜好度を算出し、キーワード辞書１７を更新する。
例えば、キーワード評価装置１は、キーワード「Ａ子さん」に対して、発話種別「質問」が選択された場合、「Ａ子さんは好きですか？」と利用者に質問し、利用者からの「好きです」、「あまり好きではない」、「嫌い」などの応答により、「Ａ子さん」に関する「質問」文に対する嗜好度を推定する。
これにより、キーワード評価装置１は、発話種別ごとに推定された嗜好度の統計情報により興味度を算出するので、例えば、「質問」文に対する嗜好度の値を大きくするなど、発話種別ごとの発話文に対する利用者の応答の信頼性を興味度へ反映させることができる。

キーワード評価装置１は、発話文に対するリアクション時間に基づいて、嗜好度に重み付けすることにより、キーワードに対する利用者の好き嫌いの度合いを嗜好度に反映し、興味度を適切に評価できる。

以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、前述の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載されたものに限定されるものではない。

前述の実施形態では、発話文の生成時に、キーワードに対して選択した代表語のテンプレートを用いたが、キーワードに関する発話を生成する手法であれば、これには限られない。また、代表語の選択には、特徴ベクトルによるベクトル距離を利用したが、例えば、各キーワードに対して代表語を予め決めておき、これらの代表語の中から選択する方式でもよい。さらに、代表語を使用せずに、キーワード辞書１７に登録されている各キーワードに対して、予め個別の発話文を準備しておき、これを直接用いる方式でもよい。

また、「情報」文を生成する際には、キーワード辞典１８Ｃを使う方法を説明したが、これには限られない。例えば、インターネットに接続し、ウィキペディアなどのオンライン百科事典を参照してキーワードの説明文を取得する方法も適用可能である。

前述の実施形態では、利用者のリアクション種別の判定時に、音声認識装置３により音声入力ＩＡをテキストデータに変換した応答文入力Ｉを用いたが、これには限られず、リアクションとして「はい」又は「いいえ」の判定、すなわち、発話文出力Ｏに対する利用者のポジティブ又はネガティブの判別が可能な方法であればよい。例えば、カメラにより利用者の顔を撮影した画像を入力としてもよいし、心電計、心拍計、脳波計などの身体データを取得する装置を利用者に装着する方法でもよい。
また、複数人が同時に利用している場合、キーワード評価装置１は、例えば、発話文に応じて、人同士の会話が弾んだか否かといった反応によって、リアクション種別を取得してもよい。

前述の実施形態では、利用者を一人として説明したが、これには限られない。複数の利用者それぞれを識別し、キーワード辞書１７の嗜好度を利用者ごとに管理することで、利用者ごとの興味度を取得することができる。

前述の実施形態では、キーワード評価装置１は、ロボットに組み込まれるものとして説明したが、これには限られず、ロボットの外部に配置され、ロボットと有線又は無線にて、あるいはネットワークを介して通信接続されてもよい。
また、各種のデータベースは、キーワード評価装置１が備える構成としたが、これには限られず、データベースは、クラウドなどの外部サーバに配置されてもよい。

本実施形態では、主にキーワード評価装置１の構成と動作について説明したが、本発明はこれに限られず、各構成要素を備え、キーワードを評価するための方法、又はプログラムとして構成されてもよい。

さらに、キーワード評価装置１の機能を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。

ここでいう「コンピュータシステム」とは、ＯＳや周辺機器などのハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ−ＲＯＭなどの可搬媒体、コンピュータシステムに内蔵されるハードディスクなどの記憶装置のことをいう。

さらに「コンピュータで読み取り可能な記録媒体」とは、インターネットなどのネットワークや電話回線などの通信回線を介してプログラムを送信する場合の通信線のように、短時刻の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時刻プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。

１キーワード評価装置
２音声合成装置
３音声認識装置
１１キーワード抽出部
１２発話種別選択部
１３発話生成部
１４リアクション取得部
１５嗜好度演算部
１６興味度演算部
１７キーワード辞書
１８Ａテンプレートデータベース
１８Ｂ特徴ベクトルデータベース
１８Ｃキーワード辞典
１３１テンプレート抽出部
１３２ベクトル距離算出部
１３３テンプレート選択部
１３４キーワード検索部
１３５情報文生成部

Claims

入力されたキーワードを含む発話文を生成し、利用者に対して出力する発話生成部と、
前記発話文に対する前記利用者のリアクション種別を取得するリアクション取得部と、
前記リアクション種別に基づいて、前記利用者の前記キーワードに対する興味度を算出する興味度演算部と、を備えるキーワード評価装置。
前記リアクション取得部は、前記リアクション種別として、ポジティブ及びネガティブを含む複数の種別のいずれかを取得する請求項１に記載のキーワード評価装置。
前記リアクション取得部は、前記発話文に対する前記利用者のリアクション時間を計測し、当該リアクション時間が所定時間を超える場合、前記リアクション種別として無反応の種別を取得する請求項２に記載のキーワード評価装置。
前記発話文の種別を、所定数の発話種別の中から、予め定められた確率で選択する発話種別選択部を備える請求項１から請求項３のいずれかに記載のキーワード評価装置。
前記リアクション種別に基づいて、前記発話種別ごとに、前記キーワードを含む発話文に対する嗜好度を算出する嗜好度演算部を備え、
前記興味度演算部は、前記嗜好度の統計情報により前記興味度を算出する請求項４に記載のキーワード評価装置。
前記リアクション取得部は、前記発話文に対する前記利用者のリアクション時間を計測し、
前記嗜好度演算部は、前記リアクション時間に基づいて、前記嗜好度に重み付けする請求項５に記載のキーワード評価装置。
放送番組から、所定のデータベースに含まれる前記キーワードを抽出するキーワード抽出部を備える請求項１から請求項６のいずれかに記載のキーワード評価装置。
入力されたキーワードを含む発話文を生成し、利用者に対して出力する発話生成ステップと、
前記発話文に対する前記利用者のリアクション種別を取得するリアクション取得ステップと、
前記リアクション種別に基づいて、前記利用者の前記キーワードに対する興味度を算出する興味度演算ステップと、をコンピュータが実行するキーワード評価方法。
請求項１から請求項７のいずれかに記載のキーワード評価装置としてコンピュータを機能させるためのキーワード評価プログラム。