JP6310796B2

JP6310796B2 - 制御装置、制御方法および制御プログラム

Info

Publication number: JP6310796B2
Application number: JP2014148334A
Authority: JP
Inventors: 香里谷尾; 北岸　郁雄; 郁雄北岸
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2014-07-18
Filing date: 2014-07-18
Publication date: 2018-04-11
Anticipated expiration: 2034-07-18
Also published as: JP2016024636A

Description

本発明は、制御装置、制御方法および制御プログラムに関する。

従来、ユーザ端末からメッセージを受け付けたことに応じて、このメッセージに対応するメッセージをユーザ端末に出力する対話エージェントシステムが知られている。このような対話エージェントシステムにおいて、ユーザ端末から受け付けたメッセージに対して多様なメッセージの出力を行ったり、このユーザ端末のユーザに適したメッセージの出力を行ったりする技術が提供されている。

例えば、ユーザのウェブ上の行動履歴に基づいて決定されたユーザ関心カテゴリと、各ノードに対応するメッセージのカテゴリとに基づいて、ユーザに負担をかけることなく、ユーザの趣向に即して対話エージェントシステムの対話ルールを変更する技術が提案されている。

特開２０１３−１２０１２号公報特開２００８−２９９７５３号公報

しかしながら、上記の従来技術では、ユーザに適したメッセージが出力されるとは限らない。例えば、上記の従来技術では、無駄話を好まないユーザに対して、対話文脈から外れた応答メッセージを出力することにより、かかるユーザに不快感を与えてしまう可能性がある。このように、上記の従来技術では、ユーザに適したメッセージが出力されるとは限らない。

本願は、上記に鑑みてなされたものであって、ユーザに適したメッセージを出力することができる応答生成装置を提供することを目的とする。

本願にかかる、制御装置は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、前記応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、を備えることを特徴とする。

実施形態の一態様によれば、ユーザに適したメッセージを出力することができる効果を奏する。

図１は、実施形態にかかる応答生成処理の一例を示す図である。図２は、実施形態にかかる応答生成システムの構成例を示す図である。図３は、実施形態にかかる広告入札装置の構成例を示す図である。図４は、実施形態にかかる広告情報記憶部の一例を示す図である。図５は、実施形態にかかる応答生成装置の構成例を示す図である。図６は、実施形態にかかる判定情報記憶部の一例を示す図である。図７は、実施形態にかかる判定情報記憶部に記憶されるツリー構造の模式図である。図８は、実施形態にかかる検索情報記憶部の一例を示す図である。図９は、実施形態にかかる応答生成装置による応答生成処理手順を示すシーケンス図である。図１０は、応答生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願にかかる制御装置、制御方法および制御プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願にかかる制御装置、制御方法および制御プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

〔１．応答生成処理〕
まず、図１を用いて、実施形態にかかる制御装置が実行する応答生成処理の一例について説明する。図１は、実施形態にかかる応答生成処理の一例を示す図である。なお、図１に示すように、本実施形態において制御装置は、音声認識装置２０と応答生成装置１００とによって構成される。

ユーザ端末１０は、ユーザによって利用される端末装置である。ユーザ端末１０は、例えば、スマートフォンなどの携帯電話機や、タブレット端末や、ＰＤＡ（Personal Digital Assistant）や、デスクトップ型ＰＣ（Personal Computer）や、ノート型ＰＣ等である。

音声認識装置２０は、ユーザ端末１０から受信した入力メッセージ、すなわち、発話の音声データをテキストデータに変換する。また、音声認識装置２０は、ユーザ端末１０から受信した音声データを解析し、音の特徴情報としてユーザに関する情報を特定する。具体的には、音声認識装置２０は、音声データ解析により音声波形を生成する。そして、音声認識装置２０は、生成した音声波形のピーク形状や周波数特性等に基づいて、音声を入力したユーザのに関する情報を特定する。

なお、音の特徴情報としてのユーザ情報とは、ユーザの年齢、性別、感情、方言、体調といったユーザ属性に関する情報や、ユーザ周辺の環境音から得られる周辺情報等を含む各種情報である。例えば、音声認識装置２０は、音声波形に基づいて、音のテンポや単語と単語との間隔が所定値より短ければ「せっかち」、長ければ「おっとり」といった性格を判定することができる。また、音声認識装置２０は、音声波形における振動の幅、ピーク形状、周波数から、年齢・性別・方言を判定することができる。

さらに、音声認識装置２０は、テキスト情報からは判定しにくい体調を判定することもできる。例えば、音声認識装置２０は、ユーザから咳き込み音を特徴づける音声波形が得られた場合には、ユーザは「風邪気味」であると判定することができる。なお、音声認識装置２０は、上述した処理以外にも、任意の手法を用いて、音声からユーザの属性を特定してよい。

また、音声認識装置２０は、ユーザＵ０１周辺の周辺情報を判定することもできる。具体的には、ユーザ端末１０は、人間の声だけでなく、バックノイズとしてその周りの環境音も取得するので、結果的に、音声認識装置２０は、人間の声に関する音声波形だけでなく、その周りの環境音に関する音声波形も生成することができる。例えば、バックノイズから生成した音声波形が子供の泣き声に対応している場合には、音声認識装置２０は、ユーザＵ０１には「小さな子供がいる」といった周辺情報を判定することができる。また、例えば、音声認識装置２０は、バックノイズに電車の走行音、駅のアナウンス、出発ベル等の音声が含まれる場合には、ユーザＵ０１が駅に居るといった周辺情報を判定することができる。なお、音声認識装置２０は、上述した処理以外にも、任意の手法を用いて、環境音からユーザの周辺情報を判定してよい。

広告主端末３０は、広告主によって利用される端末装置である。広告主端末３０は、例えば、スマートフォンなどの携帯電話機や、タブレット端末や、ＰＤＡや、デスクトップ型ＰＣや、ノート型ＰＣ等である。また、広告主端末３０は、広告主から受け付けた広告情報を広告入札装置４０へ送信する。

広告入札装置４０は、入札用画面を広告主端末３０に提示する。また、広告入札装置４０は、広告主端末３０から受け付けた広告情報を所定の記憶部に記憶する。

応答生成装置１００は、ユーザの発話である入力メッセージに対し、予め設定された対話情報に従って応答メッセージを出力制御することにより対話を実現する。

以下、実施形態にかかる応答生成システム１では、ユーザの入力メッセージの音声波形の性質から得られたユーザ情報に基づいて、広告情報を検索し応答メッセージとして出力制御する例について説明する。

まず、ユーザ端末１０は、その所有者であるユーザＵ０１から、例えば、「キーマカレーめっちゃ好きやわ」といったメッセージの入力を受け付けたとすると（ステップＳ１１）、その音声データを音声認識装置２０へ送信する（ステップＳ１２）。

音声認識装置２０は、ユーザ端末１０から受信した発話の音声データをテキストデータに変換すると共に、ユーザ端末１０から受け付けた音声データを解析し、音声データに含まれる音の特徴を示す特徴情報として、ユーザ情報を特定する（ステップＳ１３）。ここでは、音声認識装置２０は、ユーザ情報「大阪弁」を特定したものとする。

そして、音声認識装置２０は、テキストデータと、特定したユーザ情報「大阪弁」をユーザ端末１０へ送信する（ステップＳ１４）。ユーザ端末１０は、受信したテキストデータと、ユーザ情報「大阪弁」を応答生成装置１００へ送信する（ステップＳ１５）。

そして、応答生成装置１００は、応答メッセージとなる広告情報を検索するための検索処理を行う（ステップＳ１６）。具体的には、応答生成装置１００は、ユーザ情報と検索用タグとなる情報とを対応付けて所定の記憶部に予め記憶していることにより、例えば、ユーザ情報「大阪弁」を受信した場合には、対応する検索タグとして「大阪地方」を特定する。なお、検索タグとは、各種検索条件を示す。つまり、検索タグによって検索対象や検索範囲が変動する。検索対象は、例えば、大阪地方や食品関連の広告情報等、広告情報を検索する際の検索クエリに対応する情報である。検索範囲は、例えば、広告検索時の類似性をどの程度まで広げるかを示す情報である。

また、後に詳述するが、応答生成装置１００は、方言に関するユーザ情報だけでなく、年齢、性別、性格、感情、体調、環境音等に関するユーザ情報と、各ユーザ情報を特徴付ける検索タグとを対応付けて、所定の記憶部に予め記憶している。例えば、応答生成装置１００は、性別「女性」と、検索タグ「化粧品」とを対応付けて記憶していたり、性格「無駄話嫌い」と、検索タグ「狭い検索」とを対応付けて記憶している。なお、応答生成装置１００は、必ずしもこのような記憶部を有している必要はなく、例えば、受信したユーザ情報そのものを検索タグとして用いてもよい。

また、応答生成装置１００は、検索処理として、ユーザＵ０１の入力メッセージに含まれる所定のキーワードを検索キーワードとして設定する。ここでは、ユーザＵ０１は、「キーマカレーめっちゃ好きやわー」を入力していることにより、応答生成装置１００は、「キーマカレー」を検索キーワードとして設定する。

そして、応答生成装置１００は、検索キーワード及び検索タグと一致する広告情報に含まれる広告データを広告入札装置４０から取得する（ステップＳ１７）。

例えば、広告入札装置４０は、広告主Ａ店から広告情報として、「広告キーワード：キーマカレー、広告タグ：大阪地方、広告データ：カレー屋Ａ店大阪進出！」を受け付けているとすると、検索キーワードと広告キーワードとが一致し、また、検索タグとして設定されている検索対象「大阪地方」と広告タグ「大阪地方」とが一致している。つまり、広告主Ａ店の広告情報が、検索キーワード及び検索タグを満たしていることから、広告入札装置４０は、広告主Ａ店の広告情報に含まれる広告データ「カレー屋Ａ店大阪進出！」を、応答生成装置１００に提示する。

そして、応答生成装置１００は、広告入札装置４０によって提示された広告データを取得し、取得した広告データを出力するようユーザ端末１０に対して出力制御を行う（ステップＳ１８）。具体的には、応答生成装置１００は、ユーザ端末１０に対して、取得した広告データを送信する。

このように、応答生成装置１００は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとなる広告情報を検索し、検索結果として取得した広告データを応答メッセージとして出力するよう出力制御する。これにより、応答生成装置１００は、ユーザに適したメッセージを出力することができると共に、広告主の意向に沿った広告配信をすることができる。

〔２．応答生成システムの構成〕
次に、図２を用いて、実施形態にかかる応答生成システムの構成について説明する。図２は、実施形態にかかる応答生成システム１の構成例を示す図である。図２に示すように、応答生成システム１は、ユーザ端末１０と、音声認識装置２０と、広告主端末３０と、広告入札装置４０と、ＡＰＩサーバ装置６０と、音声合成装置７０と、応答生成装置１００とを含む。ユーザ端末１０と、音声認識装置２０と、広告主端末３０と、広告入札装置４０と、ＡＰＩサーバ装置６０と、音声合成装置７０と、応答生成装置１００とは、ネットワークＮを介して有線または無線により通信可能に接続される。なお、図２に示す応答生成システム１には、複数台のユーザ端末１０や、複数台の広告主端末３０が含まれてよい。

ここで、応答生成システム１がユーザへ音声サービスを提供する処理の概要について説明する。ユーザ端末１０は、アプリケーションの起動後、ユーザの発話を検知すると、発話の音声データを音声認識装置２０へ送信する。

音声認識装置２０は、ユーザ端末１０から発話の音声データを受信すると、音声データをテキストデータに変換し、発話のテキストデータをユーザ端末１０へ送信する。音声認識サーバ２０から発話のテキストデータを受信したユーザ端末１０は、発話のテキストデータを応答生成装置１００に送信する。

広告主端末３０は、広告主から受け付けた広告情報を広告入札装置４０へ送信する。なお、広告情報には広告キーワード、広告タグ、広告データ等が含まれる。広告入札装置４０は、入札用画面を広告主端末３０に提示する。また、広告入札装置４０は、広告主端末３０から受け付けた広告情報を後述する記憶部に記憶する。

応答生成装置１００は、ユーザ端末１０から発話のテキストデータ及び音声認識装置２０によって取得されたユーザ情報を受信すると、上述した検索処理を実行して応答メッセージを生成する。また、応答生成装置１００は、ユーザの発話に基づいて画像検索結果や経路検索結果等を応答として出力する場合には、応答の生成に必要なデータの検索条件を指定し、ユーザ端末１０が起動したアプリケーションに対応するＡＰＩサーバ装置６０に対してデータの要求を行う。

ＡＰＩサーバ装置６０は、応答生成装置１００から受信した検索条件に従って、画像検索結果や経路検索結果等を含むデータを応答生成装置１００に送信する。例えば、ＡＰＩサーバ装置６０は、画像検索結果や経路検索結果を含むＸＭＬ（Extensible Markup Language）データを取得する処理を行い、取得したＸＭＬデータを応答生成装置１００に送信する。

応答生成装置１００は、ＡＰＩサーバ装置６０から、例えば、ＸＭＬデータを受信すると、ＸＭＬデータからデータを抽出し、ＸＭＬデータをＨＴＭＬデータに変換するとともに、ＸＭＬデータまたはＨＴＭＬデータから音声にて応答を行うテキストデータ（以下、応答発話表示用のテキストデータと記載する）を抽出する。また、応答生成装置１００は、応答発話表示用のテキストデータや、上述した検索処理により取得した広告データを音声合成装置７０に送信する。音声合成装置７０は、応答発話表示用のテキストデータや広告データから音声を合成する音声合成処理を行って生成した応答発話用の中間表記を応答生成装置１００に送信する。応答生成装置１００は、応答発話用の中間表記と応答発話表示用のテキストデータとＨＴＭＬデータとをユーザ端末１０に送信する。

ユーザ端末１０は、受信した応答発話用の中間表記を用いて、応答の音声を出力するとともに、応答発話表示用のテキストデータとＨＴＭＬデータとを用いて、応答内容を表示する。このようにして、応答生成システム１は、ユーザの発話に対して適切な応答を行う音声サービスを実現する。

なお、応答生成装置１００は、上述した応答生成処理を組み合わせることにより、ユーザの特性に応じた応答メッセージの出力を実現する。具体的には、応答生成装置１００は、対話エージェントシステムとユーザとの会話の中で受け付けられた音声から特定されたユーザ情報を受信し、受信したユーザ情報に対応する検索タグを特定する。また、応答生成装置１００は、ユーザの発話に含まれるキーワードを抽出し、抽出したキーワードを検索キーワードとする。そして、応答生成装置１００は、かかる検索タグと検索キーワードを広告入札装置４０に送信する。かかる場合、広告入札装置４０は、受信した検索タグと検索キーワードとに対応する広告情報を検索し、検索結果の広告情報に含まれる広告データを応答生成装置１００へ送信する。そして、応答生成装置１００は、受信した広告のテキストデータを音声合成装置７０に送信して応答発話用の中間表記を取得し、取得した中間表記や広告のテキストデータをユーザ端末１０に送信する。

〔３−１．広告入札装置の構成〕
次に、図３を用いて、実施形態にかかる広告入札装置４０について説明する。図３は、実施形態にかかる広告入札装置４０の構成例を示す図である。図３に示すように、広告入札装置４０は、通信部４１と、広告情報記憶部４２と、制御部４３とを有する。

通信部４１は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部４１は、ネットワークと有線または無線で接続される。

広告情報記憶部４２は、例えば、ＲＡＭ（Random Access Memory)、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。

広告情報記憶部４２は、各種広告情報を記憶する。具体的には、広告情報記憶部４２は、広告主端末３０から入札として受け付けた広告情報を記憶する。ここで、図４に、実施形態にかかる広告情報記憶部４２の一例を示す。図４に示した例では、広告情報記憶部４２は、広告ＩＤに、広告キーワードと、広告タグとを対応付けて記憶する。

「広告ＩＤ」は、広告情報を識別するための識別情報を示す。また、「広告ＩＤ」は、広告主及び広告主端末３０を識別するための識別情報でもある。「広告キーワード」は、広告主によって設定されるキーワードである。例えば、広告主は、広告したい商品や情報を特徴づける言葉を広告キーワードとして設定する。「広告タグ」は、どのような人に対して広告したいかといった広告対象や、どのような検索の範囲で検索された場合に広告したいかといった検索範囲や、どのような広告の種類（例えば、メッセージ長の長い広告等）で検索された場合に広告したいかといった広告種類を示す。また、「広告データ」は、広告主によって設定される広告文であり、例えば、テキストデータ形式で入稿される。

すなわち、図４では、広告ＩＤ「Ｃ０１」によって識別される広告主（例えばＡ店とする）は、広告キーワード「キーマカレー」、広告タグ「大阪地方」を設定することにより、ユーザが「キーマカレー」を含むメッセージを入力した場合に、自身の広告情報を出力対象候補とするよう指定すると共に、例えば、大阪周辺在住のユーザや、大阪弁を使うユーザ等を対象とする広告情報であること、または、大阪弁で表現された広告情報であること、または、大阪地方に店舗が存在すること等を示している。

図３に戻って説明を続ける。制御部４３は、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、広告入札装置４０の内部の記憶装置に記憶されている各種プログラム（広告入札プログラムの一例に相当）がＲＡＭ（Random Access Memory）を作業領域として実行されることにより実現される。また、制御部４３は、例えば、ＡＳＩＣ（Application Specific Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図３に示すように、制御部４３は、入札受付部４４と、提示部４５とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部４３の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部４３が有する各処理部の接続関係は、図３に示した接続関係に限られず、他の接続関係であってもよい。

入札受付部４４は、広告主端末３０に所定の入札画面を提示することにより、広告主から広告キーワードと、広告タグと、広告データとを含む広告情報の入札を受け付ける。そして、入札受付部４４は、広告ＩＤを払い出し、払い出した広告ＩＤに、受け付けた広告情報に含まれる広告キーワードと、広告タグと、広告データとを対応付けて広告情報記憶部４２に格納する。なお、広告入札装置４０は、後述する応答生成装置１００の有する「検索タグ」と同様の内容のものを「広告タグ」として有していることにより、入札受付部４４は、その「広告タグ」を広告主に対して選択可能に提示する。これにより、広告入札装置４０は、広告主によって選択された「広告タグ」を、広告情報記憶部４２に格納する。なお、「広告タグ」は、広告主によって自由入力されてもよい。また、入札受付部４４は、必ずしも広告タグを受け付ける必要はない。

提示部４５は、応答生成装置１００からの広告取得要求に応じて広告情報を検索し、検索した広告情報に含まれる広告データを提示する。具体的には、提示部４５は、応答生成装置１００から検索キーワードと検索タグを受け付け、受け付けた検索キーワードと検索タグを用いて広告情報記憶部４２の広告データを検索する。例えば、提示部４５は、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部４２から抽出し、抽出した広告データを検索キーワードの送信元である応答生成装置１００に提示する。

〔３−２．応答生成装置の構成〕
次に、図５を用いて、実施形態にかかる応答生成装置１００について説明する。図５は、実施形態にかかる応答生成装置１００の構成例を示す図である。図５に示すように、応答生成装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。

通信部１１０は、例えば、ＮＩＣ等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続される。

記憶部１２０は、例えば、ＲＡＭ、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図５に示すように、記憶部１２０は、判定情報記憶部１２１と、検索情報記憶部１２２とを有する。

ここで、図６に実施形態にかかる判定情報記憶部１２１の一例を示す。図６に示した例では、各ノードを識別するノードＩＤと、ノードの種別を示すノード種別と、メッセージに対応する処理手順を示す処理内容とを関連付けて記憶する。

なお、図６では記載を省略したが、判定情報記憶部１２１には、各ノードがどのノードと接続されているかを示す情報が登録されているものとする。例えば、判定情報記憶部１２１には、ノードＩＤ「Ｎ１」のノードと、ノードＩＤ「Ｎ２」、「Ｎ３」のノードとが接続され、ノードＩＤ「Ｎ１」のノードからノードＩＤ「Ｎ２」、「Ｎ３」に遷移する確率である遷移確率がそれぞれ「０．５」であるものとする。この結果、判定情報記憶部１２１は、図７に示すツリー構造のデータを記憶することとなる。

図７は、判定情報記憶部１２１に記憶されるツリー構造の模式図である。図７に示される破線ブロックは、検出ノードを示しており、実線ブロックは動作ノードを示している。また、これらのブロックには、ノードＩＤが付されている。また、各ブロック同士を繋ぐ矢印は、エッジを示しており、具体的には、始点（矢がない側）が接続元ノードを示し、終点（矢がある側）が接続先ノードを示している。例えば、ノードＩＤ「Ｎ１１」のノードとノードＩＤ「Ｎ１２」のノードとを接続する矢印は、接続元ノードがノードＩＤ「Ｎ１１」の検出ノードであり、接続先ノードがノードＩＤ「Ｎ１２」の動作ノードであることを示している。なお、表記されている数値（０．５等）は、遷移確率を示す。また、図７に模式した判定ツリーは、判定情報記憶部１２１が記憶する検出ノードや動作ノードのうち一部のノードのみを表したものであり、各ノードには図６や図７に示すノード以外にも、各種の検出ノードや動作ノードが接続されているものとする。

検索情報記憶部１２２は、応答メッセージとなる広告情報を検索するための検索情報を記憶する。ここで、図８に、実施形態にかかる検索情報記憶部１２２の一例を示す。図８に示した例では、検索情報記憶部１２２は、「ユーザ情報」と「検索タグ」とを対応付けて記憶する。

「ユーザ情報」は、音声認識装置２０によって特定される可能性のあるユーザ情報であり、例えば、年齢、性別、性格、感情、方言、体調、または、前記ユーザ周辺の環境音に関する情報等である。なお、ユーザ情報は、これら情報を組み合わせたものであってもよい。「検索タグ」は、検索対象や検索範囲といった各種検索条件を示す。

すなわち、応答生成装置１００は、ユーザ情報と関連を有する広告情報を検索する。例えば、広告生成装置１００は、音声認識装置２０からユーザ情報「大阪弁」を受信した場合には、大阪周辺在住のユーザや、大阪弁を使うユーザ等を対象とする広告情報、または、大阪弁で表現された広告情報、または、大阪地方に店舗を有する広告主の広告情報等を検索する。なお、検索情報記憶部１２２に登録された対応付けは、広告主や広告生成装置１００の管理者により任意の対応付けが登録されることとしてよい。

なお、上述したが、応答生成装置１００は、必ずしも検索情報記憶部１２２を有する必要はない。例えば、検索情報記憶部１２２は、音声認識装置２０から受け付けたユーザ情報そのものを検索タグとして用いてもよい。つまり、応答生成装置１００は、例えば、ユーザ情報「６０代」を受け付けた場合には、広告タグ（広告対象）として「６０代」が設定されている広告情報を検索してもよい。このように、応答生成装置１００は、会話における音声波形に基づいて出力対象となる広告を検索するのであれば、任意の手法を採用することができる。

図５に戻って説明を続ける。制御部１３０は、例えば、ＣＰＵやＭＰＵ等によって、応答生成装置１００の内部の記憶装置に記憶されている各種プログラム（応答生成プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、例えば、ＡＳＩＣやＦＰＧＡ等の集積回路により実現される。

図５に示すように、制御部１３０は、受信部１３１と、検索部１３２と、出力制御部１３３とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図５に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部１３０が有する各処理部の接続関係は、図５に示した接続関係に限られず、他の接続関係であってもよい。

受信部１３１は、音声認識装置２０から音声テキストと、ユーザ情報とを受信する。具体的には、受信部１３１は、音の特徴情報として、ユーザが発話した音声波形に関する性質から得られる情報を受信する。そして、音声波形に関する性質から得られる情報とは、すなわち、ユーザに関するユーザ情報であり、例えば、年齢、性別、性格、感情、方言、体調、または、ユーザ周辺の環境音に関する情報等である。

以下では、検索部１３２によって、方言に基づいて、地域による広告の絞込みが行われる例について説明する。例えば、図７に示すように、「どんなカレーが好き？」といった応答生成装置１００による応答メッセージに対し、ユーザＵ０１が「キーマカレーめっちゃ好きやわー」と入力したことにより、音声認識装置２０によってユーザ情報「大阪弁」が特定されたとする。かかる場合に、受信部１３１は、音声のテキストデータと共に、ユーザ情報「大阪弁」を、ユーザ端末１０を介して受信する。そして、受信部１３１は、受信したテキストデータと、ユーザ情報「大阪弁」を検索部１３２へ送信する。

検索部１３２は、ユーザが発話した音声の特徴に基づいて、広告情報を検索する。具体的には、検索部１３２は、受け付けたユーザ情報に基づいて、広告情報の検索対象、または、検索範囲を変動させて広告情報を検索する。

具体的には、検索部１３２は、受信部１３１から音声テキスト及びユーザ情報を受け付けた場合は、音声テキストと判定情報記憶部１２１に記憶された情報とを用いて、応答メッセージを選択する。例えば、検索部１３２は、音声テキストを受け付けた場合に、かかる音声テキストに含まれているキーワードを有する検出ノードを判定し、判定した検出ノードと接続された動作ノードに対応する応答メッセージが出力されるよう、かかる応答メッセージのデータを出力制御する。続いて、検索部１３２は、この応答メッセージに対する入力メッセージの音声テキストを受け付けた場合に、かかる動作ノードと接続された複数の検出ノードのうち、この音声テキストに含まれているキーワードを有する検出ノードを判定する。そして、検索部１３２は、判定した検出ノードに接続された動作ノードに対応する応答メッセージのデータを出力制御する。このように、応答生成装置１００は、検出ノードと動作ノードを使用してユーザとの会話を実現する。

また、検索部１３２は、処理内容に広告検索を行う旨が登録されている場合には、以下の処理を実行する。具体的には、検索部１３２は、検索情報記憶部１２２にアクセスし、受け付けたユーザ情報に対応する検索タグを特定する。かかる例の場合では、検索部１３２は、受信部１３１からユーザ情報「大阪弁」を受信しているので、ユーザ情報「大阪弁」に対応する検索タグ「大阪地方」を特定する。この検索タグ「大阪地方」は、例えば、大阪周辺在住のユーザを対象とする広告情報や、大阪地域に店舗を有する広告主の広告情報といった大阪地域の広告情報を検索するよう検索対象を指定していることを示す。

また、検索部１３２は、受け付けた音声テキストからキーワードを抽出し、抽出したキーワードを検索キーワードとして設定する。かかる例では、ユーザＵ０１は、「キーマカレーめっちゃ好きやわー」を入力していることにより、検索部１３２は、「キーマカレー」を検索キーワードとして設定する。

そして、検索部１３２は、広告入札装置４０に対して、検索キーワードと検索タグに対応する広告情報を検索するよう要求することで広告データを取得する。具体的には、検索部１３２は、検索キーワード及び検索タグを検索条件として広告入札装置４０へ送信する。例えば、検索部１３２は、検索キーワード「キーマカレー」と、検索タグ「大阪地方」を送信する。

ここで、広告入札装置４０の提示部４５は、検索キーワードと検索タグを受信したことにより、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部４２から抽出する。例えば、図４の例では、広告ＩＤ「Ｃ０１」で識別される広告主が、広告キーワード「キーマカレー」、広告タグ「大阪地方」を設定しており、検索部１３２によって送信された検索条件と一致する。よって、提示部４５は、対応する広告データ「カレー屋Ａ店大阪進出！」を抽出する。

また、提示部４５は、抽出した広告データを送信元である応答生成装置１００に提示する。これにより、検索部１３２は、広告入札装置４０によって提示された広告データを取得する。そして、検索部１３２は、取得した広告データを出力制御部１３３へ送信する。かかる例では、広告データ「カレー屋Ａ店大阪進出！」が提示部４５によって提示されることになるので、検索部１３２は、広告データ「カレー屋Ａ店大阪進出！」を取得し、出力制御部１３３へ送信する。

出力制御部１３３は、応答メッセージがユーザ端末１０によって音声として出力されるよう出力制御を行う。具体的には、出力制御部１３３は、音声合成装置７０に広告データを送信して中間表現（例えば、再生波形のデータ）を受信し、受信した中間表現や広告データのテキストを応答生成装置１００に送信する。

〔４．応答生成処理フロー〕
次に、図９を用いて、実施形態にかかる応答生成装置１００による応答生成処理について説明する。図９は、実施形態にかかる応答生成装置１００による応答生成処理手順を示すフローチャート図である。

図９に示すように、まず、ユーザ端末１０が、ユーザの発話に関する音声や、ユーザ周辺の環境音等を受け付ける（ステップＳ２０１）。そして、ユーザ端末１０は、受け付けた音声データを音声認識装置２０へ送信する（ステップＳ２０２）。音声認識装置２０は、音声データを受信した場合に、かかる音声データをテキストデータに変換すると共に、音声データからユーザ情報を特定する（ステップＳ２０３）。具体的には、音声認識装置２０は、音声データを解析することにより音の特徴情報として、ユーザに関するユーザ情報を特定する。さらに具体的には、音声認識装置２０は、音声データから音声波形を生成し、その音声波形に関する性質から得られる情報として、ユーザ情報を特定する。そして、音声認識装置２０は、テキストデータと取得したユーザ情報とをユーザ端末１０へ送信する（ステップＳ２０４）。ユーザ端末１０は、受け付けたテキストデータとユーザ情報を応答生成装置１００へ送信する（ステップＳ２０５）。

ここで、応答生成装置１００は、テキストデータとユーザ情報を受け付けた場合に、処理内容に広告検索を行う旨が登録されていれば、検索情報記憶部１２２にアクセスし、受け付けたユーザ情報に対応する検索タグを特定する。また、応答生成装置１００は、テキストデータからキーワードを抽出し、抽出したキーワードを検索キーワードとして設定する（ステップＳ２０６）。そして、応答生成装置１００は、検索キーワード及び検索タグを検索条件として広告入札装置４０へ送信することにより、広告入札装置４０に対して、検索キーワードと検索タグに対応する広告情報を検索するよう要求する（ステップＳ２０７）。これに対し、広告入札装置４０は、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部４２から抽出し、抽出した広告データを送信元である応答生成装置１００に提示する（ステップＳ２０８）。

応答生成装置１００は、広告入札装置４０によって提示された広告データを取得する（ステップＳ２０９）。そして、応答生成装置１００は、取得した広告データがユーザ端末１０によって音声として出力されるよう出力制御を行う（ステップＳ２１０）。

〔５．変形例〕
上述した実施例にかかる応答生成装置１００は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、応答生成装置１００の他の実施例について説明する。

〔５−１．検索処理（１）〕
上述してきた応答生成装置１００の検索部１３２は、音声から取得されたユーザ情報として、かかるユーザによって使用される方言に基づいて、地域による広告の絞込みが行われる例を示した。しかし、検索部１３２は、ユーザ情報としてユーザの性格、または、感情に関する情報が受信した場合に、その性格、または、感情に関する情報に応じて検索対象を変動させてもよい。つまり、検索部１３２は、性格、または、感情に関する情報に応じて広告情報の絞込みを行ってもよい。

具体的には、検索部１３２は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する。

例えば、応答生成装置１００は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザが「無駄話嫌い」な性格であるとのユーザ情報を受信した場合には、「メッセージ長さが短い」広告情報を検索する。この場合、例えば、応答生成装置１００は、ユーザ情報「無駄話嫌い」と検索タグ「短メッセージ広告」とを対応付けて記憶している。

なお、音声認識装置２０は、例えば、音声波形に基づいて算出した口調のテンポが所定より短いユーザは、早口であるため、せっかちで「無駄話が嫌い」（話題が切り替わりにくい）な性格であるといったユーザ情報を特定していることになる。

ここで、応答生成装置１００は、メッセージの文字数に所定の閾値を設定している。そして、検索部１３２は、検索キーワードと広告キーワードが一致し、かつ、設定された閾値より少ない文字数の広告情報を検索するよう、広告入札装置４０に対して検索要求することで、対応する広告情報に含まれる広告データを取得する。

このように、応答生成装置１００は、メッセージを入力したユーザが「無駄話嫌い」である場合には、メッセージ長さが短い広告データを広告入札装置４０から取得し、取得した広告データを出力制御する。例えば、「無駄話嫌い」なユーザは、応答メッセージが長い場合には、不快感を覚えてしまう可能性がある。そのため、応答生成装置１００は、「無駄話嫌い」なユーザには、メッセージ長さが短い広告データを出力制御する。

一方、検索部１３２は、メッセージを入力したユーザが「無駄話好き」である場合には、メッセージ長さが長い広告情報を検索する。つまり、応答生成装置１００は、例えば、ユーザ情報「無駄話好き」と検索タグ「長メッセージ広告」対応付けて記憶している。そして、検索部１３２は、検索キーワードと広告キーワードが一致し、かつ、設定された閾値より多い文字数の広告情報を検索するよう、広告入札装置４０に対して検索要求することで、対応する広告データを取得する。

なお、この場合、音声認識装置２０は、音声波形に基づいて算出した口調のテンポが所定より長いユーザに対して、口調がゆっくりなため、のんびりしており「無駄話が好き」（話題が切り替わりにくい）な性格であるといったユーザ情報を特定していることになる。

このように、応答生成装置１００は、メッセージを入力したユーザが「無駄話好き」である場合には、メッセージ長さが長い広告を検索し、出力制御する。上述した「無駄話嫌い」の例とは逆で、「無駄話好き」であれば、メッセージ長さが長い広告情報に不快感を覚える可能性は低いと考えられる。そのため、応答生成装置１００は、「無駄話好き」なユーザには、メッセージ長さが長い広告データを出力制御する。

以上のように、応答生成装置１００は、ユーザの性格、または、感情に応じて、それらに適した広告情報を応答メッセージとして提供することができる。

なお、感情には起伏があるため、通常は「無駄話好き」な性格のユーザであっても、例えば、一時的に「イライラ」している場合には、メッセージ長さが長い広告情報に対して不快感を覚える可能性がある。そのため、応答生成装置１００は、通常は、性格に応じた広告データを出力制御しておき、所定の感情を受信した場合には、その感情に応じた検索処理を優先して行ってもよい。

〔５−２．検索処理（２）〕
また、上述してきた応答生成装置１００の検索部１３２は、ユーザ情報としてユーザの性格、または、感情に関する情報が受信された場合に、その性格、または、感情に関する情報に応じて検索範囲を変動させてもよい。

具体的には、検索部１３２は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、広告情報の検索範囲を広げ、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、広告情報を検索する範囲を狭める。

例えば、応答生成装置１００は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザが「無駄話嫌い」な性格であるとのユーザ情報を受信した場合には、広告情報検索時の類似性を狭める。つまり、検索部１３２は、入力メッセージから抽出した所定のキーワードを検索キーワードとする。例えば、ユーザによって「キーマカレー好き」と入力された場合には、検索部１３２は、「キーマカレー」を抽出し、検索キーワードとする。そして、検索部１３２は、検索キーワード「キーマカレー」を用いて検索するよう検索要求することで、広告キーワード「キーマカレー」が設定されている広告データを取得する。

このように、応答生成装置１００は、「無駄話嫌い」なユーザに対し、かかるユーザの入力メッセージに含まれるキーワードを用いて検索された広告データを応答メッセージとして出力制御する。このような応答メッセージは、対話文脈に忠実であるため、無駄話が嫌いなユーザに不快感を与えることもない。具体的には、応答生成装置１００は、「キーマカレー」に関する会話をしているユーザに対し、「キーマカレー」に関する内容の応答メッセージを出力することになるので、対話文脈から外れることがなく、不快感を与えることもない。

一方、検索部１３２は、「無駄話好き」な性格であるとのユーザ情報を受信した場合には、広告情報検索時の類似性を広める。「無駄話好き」なユーザは、応答生成装置１００との様々な会話を楽しみたいと考えているといえる。つまり、対話文脈から外れた応答メッセージにより、不快感を与えてしまうことはないと考えられる。よって、検索部１３２は、あえて対話文脈から外れたような応答メッセージとしての広告情報も出力制御してよいことになる。例えば、ユーザによって「キーマカレー好き」と入力された場合には、検索部１３２は、「キーマカレー」を抽出し、検索キーワードとすると共に、その関連語である類似検索キーワードを用いることにより検索範囲を広める。言い換えれば、検索部１３２は、「キーマカレー」を検索範囲に含める類似性の広い広告情報を検索する。

例えば、検索部１３２は、「キーマカレー」と類似する類似検索キーワードとして、「カレー」、「インド料理」を設定する。なお、応答生成装置１００が関連語を検索する処理については、任意の公知技術が適用されるものとする。ここで、検索部１３２は、「キーマカレー」、「カレー」、「インド料理」を用いて検索するよう検索要求することで、広告キーワード「キーマカレー」」、「カレー」、「インド料理」が設定されている広告データを取得する。

このように、応答生成装置１００は、「無駄話好き」なユーザに対し、かかるユーザの入力メッセージに含まれるキーワードと関連する関連語を用いて検索した広告データを応答メッセージとして出力する。このような応答メッセージは、検索キーワードによる検索に基づく応答メッセージを出力する場合に比べ、対話文脈から外れてしまう可能性がある。つまり、応答生成装置１００は、「キーマカレー」に関する会話をしているユーザに対し、「カレー」や、「インド料理」に関する応答メッセージを出力する場合がある。このように、応答生成装置１００は、「無駄話好き」と判定したユーザに対しては、対話文脈から外れた応答メッセージを出力することにより、様々な話題を提供することができ、ユーザの会話に対する満足度を高めることができる。

〔５−３．検索処理（３）〕
また、上述してきた応答生成装置１００の検索部１３２は、ユーザの年齢が受信された場合に、その年齢に応じて広告情報の検索範囲を変動させてもよい。例えば、応答生成装置１００は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザのユーザ情報「６０代」を受信した場合には、広告情報検索時の類似性を狭める。つまり、検索部１３２は、入力メッセージから抽出した所定のキーワードを検索キーワードとし、かかる検索キーワードを用いて検索するよう検索要求する。

このように、応答生成装置１００は、メッセージを入力したユーザが高齢である場合には、そのユーザが入力したメッセージと関連性の高い広告データを応答メッセージとして出力制御する。例えば、応答生成装置１００は、類似性の広い検索を行うことにより、入力メッセージと関連性の低い応答メッセージを出力制御した場合に、高齢者は、応答メッセージの内容を十分に理解できず不快感を覚えてしまう可能性がある。そのため、応答生成装置１００は、高齢者には、あえて広告情報検索時の類似性を狭めることにより、入力メッセージと関連性の高い広告データを応答メッセージとして出力制御する。これにより、応答生成装置１００は、ユーザに応じた広告情報を提供することができる。

一方、応答生成装置１００は、例えば、メッセージを入力したユーザの音声の特徴情報として、かかるユーザのユーザ情報「２０代」を受信した場合には、広告情報検索時の類似性を広げる。つまり、検索部１３２は、上述したように、入力メッセージの内容に基づいて、検索キーワードと類似検索キーワードを設定し、これらを用いて検索するよう要求する。

このように、応答生成装置１００は、メッセージを入力したユーザが若者である場合には、そのユーザが入力したメッセージと関連性の低い広告データも応答メッセージとして出力制御する場合がある。若者は、インターネットを通して様々な情報を取得しようとする傾向にあるので、応答生成装置１００が類似性の広い検索を行うことにより、入力メッセージと関連性の低い応答メッセージを出力制御した場合であっても不快感を覚えてしまう可能性は低い。そのため、応答生成装置１００は、若者には、あえて広告情報検索時の類似性を広げることにより、入力メッセージと関連性の低い広告情報を応答メッセージとして出力制御する。これにより、応答生成装置１００は、広告の出力機会を増やすことができる。

なお、上述してきたユーザ情報と検索処理の組合せは一例であり、任意に組み合わせることができる。例えば、検索部１３２は、年齢に応じて検索範囲を変動させる例を示したが、年齢に応じて検索対象を変動させてもよい。例えば、検索部１３２は、高齢者に対しては、内容が理解しやすいように、メッセージ長さの長い広告情報を検索し、その結果得られた広告データを出力制御してもよい。一方、若者であればメッセージ長さの長い広告情報であっても苦にならないことが考えられるので、検索部１３２は、若者に対しては、メッセージ長さの長い広告情報を検索し、その結果得られた広告データを出力制御してもよい。

また、応答生成装置１００は、高齢者に対しては検索範囲を狭め、若者に対しては検索範囲を広げる例を示したが、例えば、若者であっても子供に対しては検索範囲を狭めてもよい。つまり、応答生成装置１００は、年齢と検索範囲の関係を任意に設定してもよい。

〔５−４．検索処理（４）〕
また、上述してきた応答生成装置１００の検索部１３２は、ユーザの体調に基づく検索を行ってもよい。具体的には、音声認識装置２０は、ユーザ情報として体調に関する情報を特定する。例えば、音声認識装置２０は、生成した音声波形に「咳き込み音」を特徴付ける形状を特定できた場合に、例えば、ユーザ情報として「風邪気味」を特定する。これにより、検索部１３２は、ユーザ情報「風邪気味」を検索タグとして、検索要求する。これにより、応答生成装置１００は、広告主に対して、体調に関する入札を可能とできる。例えば、広告主がドラッグストア経営主である場合には、その広告主は、広告タグ「風邪気味」を設定することにより、風邪を引いているユーザに対して自身の店舗の製品を広告することができる。このように、応答生成装置１００、音の特徴情報を利用することにより、体調に関する入札を可能とすることで、広告効果を高めることができる。また、応答生成装置１００は、例えば、体調の悪いユーザに対して、薬品や薬局等に関する広告情報を提供することができるので、ユーザに適した応答メッセージを出力することができる。

〔５−５．検索処理（５）〕
また、上述してきた応答生成装置１００の検索部１３２は、ユーザ周辺の環境音に基づく検索を行ってもよい。具体的には、音声認識装置２０は、ユーザ情報としてユーザ周辺の環境音に関する情報を特定する。例えば、音声認識装置２０は、バックノイズとして取得した音の音声波形に「赤ん坊の泣き声」を特徴付ける形状を特定できた場合に、例えば、ユーザ情報として「赤ちゃんの親」を特定する。これにより、応答生成装置１００は、ユーザ情報「赤ちゃんの親」を検索タグとして、検索要求する。これにより、応答生成装置１００は、広告主に対して、例えば、ベビー用品に関する入札を可能とできる。このように、応答生成装置１００は、音の特徴情報を利用することにより、環境音に関する入札を可能とすることで、広告効果を高めることができる。また、その環境音はユーザ周辺の環境音であるため、応答生成装置１００は、ユーザに有利な広告情報を提供することができる。

〔５−６．位置情報を考慮した検索〕
また、上述してきた応答生成装置１００の検索部１３２は、位置情報を考慮した検索を行ってもよい。このために、広告入札装置４０は、広告主から広告情報を出力して欲しい出力場所を受け付けておく。そして、検索部１３２は、ユーザ情報を受信した場合に、受信したユーザ情報に対応するユーザの所在地を取得する。具体的には、検索部１３２は、受信したユーザ情報に含まれる端末ＩＤと、ＧＰＳログに含まれる端末ＩＤとのマッチングを行うことにより、かかるユーザの所在地を特定する。そして、検索部１３２は、検索キーワード及び検索タグと共に、特定した所在地を広告入札装置４０へ送信する。広告入札装置４０は受信した検索条件と一致する広告データを、送信元の応答生成装置１００に提示する。検索部１３２は、提示された広告データを取得し、取得した広告データを出力制御する。

これにより、応答生成装置１００は、広告主が希望する出力場所に所在するユーザに対して、その広告主の広告データを配信することができるため、広告効果を高めることができる。

〔５−７．装置構成〕
上記実施形態では、応答生成装置１００は、音声認識装置２０によって特定されたユーザ情報を受信する例を示した。しかし、応答生成装置１００が、音の特徴情報として、ユーザ情報を特定してもよい。この場合、音声を受け付けたユーザ端末１０は、その音データを応答生成装置１００へ送信する。応答生成装置１００は、受け付けた音声データに関する音声波形を作成し、その音声波形の特徴ユーザ情報を特定する。

〔５−８．ユーザ端末以外の例〕
上記実施形態では、ユーザはユーザ端末１０を用いて、応答生成装置１００と会話を行う例を示した。しかし、ユーザ端末１０の有する応答生成装置１００との対話機能が、会話を行うロボットに搭載されていてもよい。これにより、かかるロボットがユーザに代わって応答生成装置１００と会話を行うことが実現できる。

〔５−９．プログラム〕
また、上述してきた各実施形態にかかる応答生成装置１００は、例えば図１０に示すような構成のコンピュータ１０００によって実現される。以下、応答生成装置１００を例に挙げて説明する。図１０は、応答生成装置１００の機能を実現するコンピュータ１０００の一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、通信網５０を介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータを、通信網５０を介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを、入出力インターフェイス１６００を介して出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態にかかる応答生成装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。また、ＨＤＤ１４００には、記憶部１２０内のデータが格納される。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを、記録媒体１８００から読み取って実行するが、他の例として、他の装置から、通信網５０を介してこれらのプログラムを取得してもよい。

〔５−１０．その他〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

〔６．効果〕
上述してきたように、実施形態にかかる制御装置において、応答生成装置１００は、検索部１３２と、出力制御部１３３とを有する。検索部１３２は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する。出力制御部１３３は、検索部１３２によって検索された広告情報に関する広告を応答メッセージとして出力するよう制御する。

これにより、応答生成装置１００は、ユーザに適したメッセージを出力することができると共に、広告主の意向に沿った広告配信を行うことができる。

また、実施形態にかかる検索部１３２は、ユーザが発話した音声の特徴に基づいて、広告情報を検索する。

これにより、実施形態にかかる応答生成装置１００は、音声のテキストからは得ることができない音声特有の情報を得ることができる。

また、実施形態にかかる検索部１３２は、ユーザが発話した音声の特徴に基づいて推定されたユーザの年齢、性別、性格、感情、方言、または、体調の少なくともいずれか１つに基づいて、広告情報を検索する。

これにより、実施形態にかかる応答生成装置１００は、ユーザに適した広告情報を応答メッセージを出力することができると共に、広告主の意向に沿った広告配信を行うことができる。

また、実施形態にかかる検索部１３２は、推定された方言によって特定される地域に対応する広告の広告情報を検索する。

これにより、実施形態にかかる応答生成装置１００は、ユーザの出身地に関する広告情報を出力することができるため、広告情報に対するユーザの関心を高めることができ、また、広告主に対して地域に関する広告情報を入札しやすくすることができる。

また、実施形態にかかる検索部１３２は、推定された年齢が低いほど広告情報の検索範囲を広げ、推定された年齢が高いほど広告情報の検索範囲を狭める。

これにより、実施形態にかかる応答生成装置１００は、年齢に応じた広告情報を応答メッセージとして出力することができる。

また、実施形態にかかる検索部１３２は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、広告情報の検索範囲を広げ、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、広告情報を検索する範囲を狭める。

これにより、実施形態にかかる応答生成装置１００は、ユーザの性格や感情に応じた広告情報を応答メッセージとして出力することができるため、会話に対するユーザの満足度を高めることができる。

また、実施形態にかかる検索部１３２は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、判定部は、特定手段や特定回路に読み替えることができる。

１０ユーザ端末
２０音声認識装置
３０広告主端末
４０広告入札装置
４２広告情報記憶部
４４入札受付部
４５提示部
１００応答生成装置
１２１判定情報記憶部
１２２検索情報記憶部
１３０制御部
１３１受信部
１３２検索部
１３３出力制御部

Claims

対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、
前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、
を備え、
前記検索部は、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が低いほど前記広告情報の検索範囲を広げ、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が高いほど前記広告情報の検索範囲を狭める、
ことを特徴とする制御装置。
対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、
前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、
を備え、
前記検索部は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、前記広告情報の検索範囲を広げ、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記広告情報を検索する範囲を狭める、
ことを特徴とする制御装置。
対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、
前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、
を備え、
前記検索部は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する
ことを特徴とする制御装置。
前記検索部は、前記ユーザが発話した音声の特徴に基づいて、前記広告情報を検索する、
ことを特徴とする請求項１〜３のいずれか１つに記載の制御装置。
前記検索部は、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢、性別、性格、感情、方言、または、体調の少なくともいずれか１つに基づいて、前記広告情報を検索する
ことを特徴とする請求項４に記載の制御装置。
前記検索部は、推定された前記ユーザが使用する方言によって特定される地域に対応する広告の広告情報を検索する、
ことを特徴とする請求項５に記載の制御装置。
コンピュータが実行する制御方法であって、
対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索工程と、
前記検索工程によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御工程と、
を含み、
前記検索工程、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が低いほど前記広告情報の検索範囲を広げ、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が高いほど前記広告情報の検索範囲を狭める、
ことを特徴とする制御方法。
コンピュータが実行する制御方法であって、
対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索工程と、
前記検索工程によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御工程と、
を含み、
前記検索工程は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、前記広告情報の検索範囲を広げ、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記広告情報を検索する範囲を狭める、
ことを特徴とする制御方法。
コンピュータが実行する制御方法であって、
対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索工程と、
前記検索工程によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御工程と、
を含み、
前記検索工程は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する
ことを特徴とする制御方法。
対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索手順と、
前記検索手順によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御手順と、
をコンピュータに実行させ、
前記検索手順は、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が低いほど前記広告情報の検索範囲を広げ、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が高いほど前記広告情報の検索範囲を狭める、
ことを特徴とする制御プログラム。
対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索手順と、
前記検索手順によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御手順と、
をコンピュータに実行させ、
前記検索手順は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、前記広告情報の検索範囲を広げ、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記広告情報を検索する範囲を狭める、
ことを特徴とする制御プログラム。
対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索手順と、
前記検索手順によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御手順と、
をコンピュータに実行させ、
前記検索手順は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する
ことを特徴とする制御プログラム。