JP6310796B2 - 制御装置、制御方法および制御プログラム - Google Patents

制御装置、制御方法および制御プログラム Download PDF

Info

Publication number
JP6310796B2
JP6310796B2 JP2014148334A JP2014148334A JP6310796B2 JP 6310796 B2 JP6310796 B2 JP 6310796B2 JP 2014148334 A JP2014148334 A JP 2014148334A JP 2014148334 A JP2014148334 A JP 2014148334A JP 6310796 B2 JP6310796 B2 JP 6310796B2
Authority
JP
Japan
Prior art keywords
advertisement
user
search
information
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014148334A
Other languages
English (en)
Other versions
JP2016024636A (ja
Inventor
香里 谷尾
香里 谷尾
北岸 郁雄
郁雄 北岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2014148334A priority Critical patent/JP6310796B2/ja
Publication of JP2016024636A publication Critical patent/JP2016024636A/ja
Application granted granted Critical
Publication of JP6310796B2 publication Critical patent/JP6310796B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、制御装置、制御方法および制御プログラムに関する。
従来、ユーザ端末からメッセージを受け付けたことに応じて、このメッセージに対応するメッセージをユーザ端末に出力する対話エージェントシステムが知られている。このような対話エージェントシステムにおいて、ユーザ端末から受け付けたメッセージに対して多様なメッセージの出力を行ったり、このユーザ端末のユーザに適したメッセージの出力を行ったりする技術が提供されている。
例えば、ユーザのウェブ上の行動履歴に基づいて決定されたユーザ関心カテゴリと、各ノードに対応するメッセージのカテゴリとに基づいて、ユーザに負担をかけることなく、ユーザの趣向に即して対話エージェントシステムの対話ルールを変更する技術が提案されている。
特開2013−12012号公報 特開2008−299753号公報
しかしながら、上記の従来技術では、ユーザに適したメッセージが出力されるとは限らない。例えば、上記の従来技術では、無駄話を好まないユーザに対して、対話文脈から外れた応答メッセージを出力することにより、かかるユーザに不快感を与えてしまう可能性がある。このように、上記の従来技術では、ユーザに適したメッセージが出力されるとは限らない。
本願は、上記に鑑みてなされたものであって、ユーザに適したメッセージを出力することができる応答生成装置を提供することを目的とする。
本願にかかる、制御装置は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、前記応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、を備えることを特徴とする。
実施形態の一態様によれば、ユーザに適したメッセージを出力することができる効果を奏する。
図1は、実施形態にかかる応答生成処理の一例を示す図である。 図2は、実施形態にかかる応答生成システムの構成例を示す図である。 図3は、実施形態にかかる広告入札装置の構成例を示す図である。 図4は、実施形態にかかる広告情報記憶部の一例を示す図である。 図5は、実施形態にかかる応答生成装置の構成例を示す図である。 図6は、実施形態にかかる判定情報記憶部の一例を示す図である。 図7は、実施形態にかかる判定情報記憶部に記憶されるツリー構造の模式図である。 図8は、実施形態にかかる検索情報記憶部の一例を示す図である。 図9は、実施形態にかかる応答生成装置による応答生成処理手順を示すシーケンス図である。 図10は、応答生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願にかかる制御装置、制御方法および制御プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願にかかる制御装置、制御方法および制御プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.応答生成処理〕
まず、図1を用いて、実施形態にかかる制御装置が実行する応答生成処理の一例について説明する。図1は、実施形態にかかる応答生成処理の一例を示す図である。なお、図1に示すように、本実施形態において制御装置は、音声認識装置20と応答生成装置100とによって構成される。
ユーザ端末10は、ユーザによって利用される端末装置である。ユーザ端末10は、例えば、スマートフォンなどの携帯電話機や、タブレット端末や、PDA(Personal Digital Assistant)や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。
音声認識装置20は、ユーザ端末10から受信した入力メッセージ、すなわち、発話の音声データをテキストデータに変換する。また、音声認識装置20は、ユーザ端末10から受信した音声データを解析し、音の特徴情報としてユーザに関する情報を特定する。具体的には、音声認識装置20は、音声データ解析により音声波形を生成する。そして、音声認識装置20は、生成した音声波形のピーク形状や周波数特性等に基づいて、音声を入力したユーザのに関する情報を特定する。
なお、音の特徴情報としてのユーザ情報とは、ユーザの年齢、性別、感情、方言、体調といったユーザ属性に関する情報や、ユーザ周辺の環境音から得られる周辺情報等を含む各種情報である。例えば、音声認識装置20は、音声波形に基づいて、音のテンポや単語と単語との間隔が所定値より短ければ「せっかち」、長ければ「おっとり」といった性格を判定することができる。また、音声認識装置20は、音声波形における振動の幅、ピーク形状、周波数から、年齢・性別・方言を判定することができる。
さらに、音声認識装置20は、テキスト情報からは判定しにくい体調を判定することもできる。例えば、音声認識装置20は、ユーザから咳き込み音を特徴づける音声波形が得られた場合には、ユーザは「風邪気味」であると判定することができる。なお、音声認識装置20は、上述した処理以外にも、任意の手法を用いて、音声からユーザの属性を特定してよい。
また、音声認識装置20は、ユーザU01周辺の周辺情報を判定することもできる。具体的には、ユーザ端末10は、人間の声だけでなく、バックノイズとしてその周りの環境音も取得するので、結果的に、音声認識装置20は、人間の声に関する音声波形だけでなく、その周りの環境音に関する音声波形も生成することができる。例えば、バックノイズから生成した音声波形が子供の泣き声に対応している場合には、音声認識装置20は、ユーザU01には「小さな子供がいる」といった周辺情報を判定することができる。また、例えば、音声認識装置20は、バックノイズに電車の走行音、駅のアナウンス、出発ベル等の音声が含まれる場合には、ユーザU01が駅に居るといった周辺情報を判定することができる。なお、音声認識装置20は、上述した処理以外にも、任意の手法を用いて、環境音からユーザの周辺情報を判定してよい。
広告主端末30は、広告主によって利用される端末装置である。広告主端末30は、例えば、スマートフォンなどの携帯電話機や、タブレット端末や、PDAや、デスクトップ型PCや、ノート型PC等である。また、広告主端末30は、広告主から受け付けた広告情報を広告入札装置40へ送信する。
広告入札装置40は、入札用画面を広告主端末30に提示する。また、広告入札装置40は、広告主端末30から受け付けた広告情報を所定の記憶部に記憶する。
応答生成装置100は、ユーザの発話である入力メッセージに対し、予め設定された対話情報に従って応答メッセージを出力制御することにより対話を実現する。
以下、実施形態にかかる応答生成システム1では、ユーザの入力メッセージの音声波形の性質から得られたユーザ情報に基づいて、広告情報を検索し応答メッセージとして出力制御する例について説明する。
まず、ユーザ端末10は、その所有者であるユーザU01から、例えば、「キーマカレーめっちゃ好きやわ」といったメッセージの入力を受け付けたとすると(ステップS11)、その音声データを音声認識装置20へ送信する(ステップS12)。
音声認識装置20は、ユーザ端末10から受信した発話の音声データをテキストデータに変換すると共に、ユーザ端末10から受け付けた音声データを解析し、音声データに含まれる音の特徴を示す特徴情報として、ユーザ情報を特定する(ステップS13)。ここでは、音声認識装置20は、ユーザ情報「大阪弁」を特定したものとする。
そして、音声認識装置20は、テキストデータと、特定したユーザ情報「大阪弁」をユーザ端末10へ送信する(ステップS14)。ユーザ端末10は、受信したテキストデータと、ユーザ情報「大阪弁」を応答生成装置100へ送信する(ステップS15)。
そして、応答生成装置100は、応答メッセージとなる広告情報を検索するための検索処理を行う(ステップS16)。具体的には、応答生成装置100は、ユーザ情報と検索用タグとなる情報とを対応付けて所定の記憶部に予め記憶していることにより、例えば、ユーザ情報「大阪弁」を受信した場合には、対応する検索タグとして「大阪地方」を特定する。なお、検索タグとは、各種検索条件を示す。つまり、検索タグによって検索対象や検索範囲が変動する。検索対象は、例えば、大阪地方や食品関連の広告情報等、広告情報を検索する際の検索クエリに対応する情報である。検索範囲は、例えば、広告検索時の類似性をどの程度まで広げるかを示す情報である。
また、後に詳述するが、応答生成装置100は、方言に関するユーザ情報だけでなく、年齢、性別、性格、感情、体調、環境音等に関するユーザ情報と、各ユーザ情報を特徴付ける検索タグとを対応付けて、所定の記憶部に予め記憶している。例えば、応答生成装置100は、性別「女性」と、検索タグ「化粧品」とを対応付けて記憶していたり、性格「無駄話嫌い」と、検索タグ「狭い検索」とを対応付けて記憶している。なお、応答生成装置100は、必ずしもこのような記憶部を有している必要はなく、例えば、受信したユーザ情報そのものを検索タグとして用いてもよい。
また、応答生成装置100は、検索処理として、ユーザU01の入力メッセージに含まれる所定のキーワードを検索キーワードとして設定する。ここでは、ユーザU01は、「キーマカレーめっちゃ好きやわー」を入力していることにより、応答生成装置100は、「キーマカレー」を検索キーワードとして設定する。
そして、応答生成装置100は、検索キーワード及び検索タグと一致する広告情報に含まれる広告データを広告入札装置40から取得する(ステップS17)。
例えば、広告入札装置40は、広告主A店から広告情報として、「広告キーワード:キーマカレー、広告タグ:大阪地方、広告データ:カレー屋A店大阪進出!」を受け付けているとすると、検索キーワードと広告キーワードとが一致し、また、検索タグとして設定されている検索対象「大阪地方」と広告タグ「大阪地方」とが一致している。つまり、広告主A店の広告情報が、検索キーワード及び検索タグを満たしていることから、広告入札装置40は、広告主A店の広告情報に含まれる広告データ「カレー屋A店大阪進出!」を、応答生成装置100に提示する。
そして、応答生成装置100は、広告入札装置40によって提示された広告データを取得し、取得した広告データを出力するようユーザ端末10に対して出力制御を行う(ステップS18)。具体的には、応答生成装置100は、ユーザ端末10に対して、取得した広告データを送信する。
このように、応答生成装置100は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとなる広告情報を検索し、検索結果として取得した広告データを応答メッセージとして出力するよう出力制御する。これにより、応答生成装置100は、ユーザに適したメッセージを出力することができると共に、広告主の意向に沿った広告配信をすることができる。
〔2.応答生成システムの構成〕
次に、図2を用いて、実施形態にかかる応答生成システムの構成について説明する。図2は、実施形態にかかる応答生成システム1の構成例を示す図である。図2に示すように、応答生成システム1は、ユーザ端末10と、音声認識装置20と、広告主端末30と、広告入札装置40と、APIサーバ装置60と、音声合成装置70と、応答生成装置100とを含む。ユーザ端末10と、音声認識装置20と、広告主端末30と、広告入札装置40と、APIサーバ装置60と、音声合成装置70と、応答生成装置100とは、ネットワークNを介して有線または無線により通信可能に接続される。なお、図2に示す応答生成システム1には、複数台のユーザ端末10や、複数台の広告主端末30が含まれてよい。
ここで、応答生成システム1がユーザへ音声サービスを提供する処理の概要について説明する。ユーザ端末10は、アプリケーションの起動後、ユーザの発話を検知すると、発話の音声データを音声認識装置20へ送信する。
音声認識装置20は、ユーザ端末10から発話の音声データを受信すると、音声データをテキストデータに変換し、発話のテキストデータをユーザ端末10へ送信する。音声認識サーバ20から発話のテキストデータを受信したユーザ端末10は、発話のテキストデータを応答生成装置100に送信する。
広告主端末30は、広告主から受け付けた広告情報を広告入札装置40へ送信する。なお、広告情報には広告キーワード、広告タグ、広告データ等が含まれる。広告入札装置40は、入札用画面を広告主端末30に提示する。また、広告入札装置40は、広告主端末30から受け付けた広告情報を後述する記憶部に記憶する。
応答生成装置100は、ユーザ端末10から発話のテキストデータ及び音声認識装置20によって取得されたユーザ情報を受信すると、上述した検索処理を実行して応答メッセージを生成する。また、応答生成装置100は、ユーザの発話に基づいて画像検索結果や経路検索結果等を応答として出力する場合には、応答の生成に必要なデータの検索条件を指定し、ユーザ端末10が起動したアプリケーションに対応するAPIサーバ装置60に対してデータの要求を行う。
APIサーバ装置60は、応答生成装置100から受信した検索条件に従って、画像検索結果や経路検索結果等を含むデータを応答生成装置100に送信する。例えば、APIサーバ装置60は、画像検索結果や経路検索結果を含むXML(Extensible Markup Language)データを取得する処理を行い、取得したXMLデータを応答生成装置100に送信する。
応答生成装置100は、APIサーバ装置60から、例えば、XMLデータを受信すると、XMLデータからデータを抽出し、XMLデータをHTMLデータに変換するとともに、XMLデータまたはHTMLデータから音声にて応答を行うテキストデータ(以下、応答発話表示用のテキストデータと記載する)を抽出する。また、応答生成装置100は、応答発話表示用のテキストデータや、上述した検索処理により取得した広告データを音声合成装置70に送信する。音声合成装置70は、応答発話表示用のテキストデータや広告データから音声を合成する音声合成処理を行って生成した応答発話用の中間表記を応答生成装置100に送信する。応答生成装置100は、応答発話用の中間表記と応答発話表示用のテキストデータとHTMLデータとをユーザ端末10に送信する。
ユーザ端末10は、受信した応答発話用の中間表記を用いて、応答の音声を出力するとともに、応答発話表示用のテキストデータとHTMLデータとを用いて、応答内容を表示する。このようにして、応答生成システム1は、ユーザの発話に対して適切な応答を行う音声サービスを実現する。
なお、応答生成装置100は、上述した応答生成処理を組み合わせることにより、ユーザの特性に応じた応答メッセージの出力を実現する。具体的には、応答生成装置100は、対話エージェントシステムとユーザとの会話の中で受け付けられた音声から特定されたユーザ情報を受信し、受信したユーザ情報に対応する検索タグを特定する。また、応答生成装置100は、ユーザの発話に含まれるキーワードを抽出し、抽出したキーワードを検索キーワードとする。そして、応答生成装置100は、かかる検索タグと検索キーワードを広告入札装置40に送信する。かかる場合、広告入札装置40は、受信した検索タグと検索キーワードとに対応する広告情報を検索し、検索結果の広告情報に含まれる広告データを応答生成装置100へ送信する。そして、応答生成装置100は、受信した広告のテキストデータを音声合成装置70に送信して応答発話用の中間表記を取得し、取得した中間表記や広告のテキストデータをユーザ端末10に送信する。
〔3−1.広告入札装置の構成〕
次に、図3を用いて、実施形態にかかる広告入札装置40について説明する。図3は、実施形態にかかる広告入札装置40の構成例を示す図である。図3に示すように、広告入札装置40は、通信部41と、広告情報記憶部42と、制御部43とを有する。
通信部41は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部41は、ネットワークと有線または無線で接続される。
広告情報記憶部42は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
広告情報記憶部42は、各種広告情報を記憶する。具体的には、広告情報記憶部42は、広告主端末30から入札として受け付けた広告情報を記憶する。ここで、図4に、実施形態にかかる広告情報記憶部42の一例を示す。図4に示した例では、広告情報記憶部42は、広告IDに、広告キーワードと、広告タグとを対応付けて記憶する。
「広告ID」は、広告情報を識別するための識別情報を示す。また、「広告ID」は、広告主及び広告主端末30を識別するための識別情報でもある。「広告キーワード」は、広告主によって設定されるキーワードである。例えば、広告主は、広告したい商品や情報を特徴づける言葉を広告キーワードとして設定する。「広告タグ」は、どのような人に対して広告したいかといった広告対象や、どのような検索の範囲で検索された場合に広告したいかといった検索範囲や、どのような広告の種類(例えば、メッセージ長の長い広告等)で検索された場合に広告したいかといった広告種類を示す。また、「広告データ」は、広告主によって設定される広告文であり、例えば、テキストデータ形式で入稿される。
すなわち、図4では、広告ID「C01」によって識別される広告主(例えばA店とする)は、広告キーワード「キーマカレー」、広告タグ「大阪地方」を設定することにより、ユーザが「キーマカレー」を含むメッセージを入力した場合に、自身の広告情報を出力対象候補とするよう指定すると共に、例えば、大阪周辺在住のユーザや、大阪弁を使うユーザ等を対象とする広告情報であること、または、大阪弁で表現された広告情報であること、または、大阪地方に店舗が存在すること等を示している。
図3に戻って説明を続ける。制御部43は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告入札装置40の内部の記憶装置に記憶されている各種プログラム(広告入札プログラムの一例に相当)がRAM(Random Access Memory)を作業領域として実行されることにより実現される。また、制御部43は、例えば、ASIC(Application Specific Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部43は、入札受付部44と、提示部45とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部43の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部43が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
入札受付部44は、広告主端末30に所定の入札画面を提示することにより、広告主から広告キーワードと、広告タグと、広告データとを含む広告情報の入札を受け付ける。そして、入札受付部44は、広告IDを払い出し、払い出した広告IDに、受け付けた広告情報に含まれる広告キーワードと、広告タグと、広告データとを対応付けて広告情報記憶部42に格納する。なお、広告入札装置40は、後述する応答生成装置100の有する「検索タグ」と同様の内容のものを「広告タグ」として有していることにより、入札受付部44は、その「広告タグ」を広告主に対して選択可能に提示する。これにより、広告入札装置40は、広告主によって選択された「広告タグ」を、広告情報記憶部42に格納する。なお、「広告タグ」は、広告主によって自由入力されてもよい。また、入札受付部44は、必ずしも広告タグを受け付ける必要はない。
提示部45は、応答生成装置100からの広告取得要求に応じて広告情報を検索し、検索した広告情報に含まれる広告データを提示する。具体的には、提示部45は、応答生成装置100から検索キーワードと検索タグを受け付け、受け付けた検索キーワードと検索タグを用いて広告情報記憶部42の広告データを検索する。例えば、提示部45は、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部42から抽出し、抽出した広告データを検索キーワードの送信元である応答生成装置100に提示する。
〔3−2.応答生成装置の構成〕
次に、図5を用いて、実施形態にかかる応答生成装置100について説明する。図5は、実施形態にかかる応答生成装置100の構成例を示す図である。図5に示すように、応答生成装置100は、通信部110と、記憶部120と、制御部130とを有する。
通信部110は、例えば、NIC等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続される。
記憶部120は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図5に示すように、記憶部120は、判定情報記憶部121と、検索情報記憶部122とを有する。
ここで、図6に実施形態にかかる判定情報記憶部121の一例を示す。図6に示した例では、各ノードを識別するノードIDと、ノードの種別を示すノード種別と、メッセージに対応する処理手順を示す処理内容とを関連付けて記憶する。
なお、図6では記載を省略したが、判定情報記憶部121には、各ノードがどのノードと接続されているかを示す情報が登録されているものとする。例えば、判定情報記憶部121には、ノードID「N1」のノードと、ノードID「N2」、「N3」のノードとが接続され、ノードID「N1」のノードからノードID「N2」、「N3」に遷移する確率である遷移確率がそれぞれ「0.5」であるものとする。この結果、判定情報記憶部121は、図7に示すツリー構造のデータを記憶することとなる。
図7は、判定情報記憶部121に記憶されるツリー構造の模式図である。図7に示される破線ブロックは、検出ノードを示しており、実線ブロックは動作ノードを示している。また、これらのブロックには、ノードIDが付されている。また、各ブロック同士を繋ぐ矢印は、エッジを示しており、具体的には、始点(矢がない側)が接続元ノードを示し、終点(矢がある側)が接続先ノードを示している。例えば、ノードID「N11」のノードとノードID「N12」のノードとを接続する矢印は、接続元ノードがノードID「N11」の検出ノードであり、接続先ノードがノードID「N12」の動作ノードであることを示している。なお、表記されている数値(0.5等)は、遷移確率を示す。また、図7に模式した判定ツリーは、判定情報記憶部121が記憶する検出ノードや動作ノードのうち一部のノードのみを表したものであり、各ノードには図6や図7に示すノード以外にも、各種の検出ノードや動作ノードが接続されているものとする。
検索情報記憶部122は、応答メッセージとなる広告情報を検索するための検索情報を記憶する。ここで、図8に、実施形態にかかる検索情報記憶部122の一例を示す。図8に示した例では、検索情報記憶部122は、「ユーザ情報」と「検索タグ」とを対応付けて記憶する。
「ユーザ情報」は、音声認識装置20によって特定される可能性のあるユーザ情報であり、例えば、年齢、性別、性格、感情、方言、体調、または、前記ユーザ周辺の環境音に関する情報等である。なお、ユーザ情報は、これら情報を組み合わせたものであってもよい。「検索タグ」は、検索対象や検索範囲といった各種検索条件を示す。
すなわち、応答生成装置100は、ユーザ情報と関連を有する広告情報を検索する。例えば、広告生成装置100は、音声認識装置20からユーザ情報「大阪弁」を受信した場合には、大阪周辺在住のユーザや、大阪弁を使うユーザ等を対象とする広告情報、または、大阪弁で表現された広告情報、または、大阪地方に店舗を有する広告主の広告情報等を検索する。なお、検索情報記憶部122に登録された対応付けは、広告主や広告生成装置100の管理者により任意の対応付けが登録されることとしてよい。
なお、上述したが、応答生成装置100は、必ずしも検索情報記憶部122を有する必要はない。例えば、検索情報記憶部122は、音声認識装置20から受け付けたユーザ情報そのものを検索タグとして用いてもよい。つまり、応答生成装置100は、例えば、ユーザ情報「60代」を受け付けた場合には、広告タグ(広告対象)として「60代」が設定されている広告情報を検索してもよい。このように、応答生成装置100は、会話における音声波形に基づいて出力対象となる広告を検索するのであれば、任意の手法を採用することができる。
図5に戻って説明を続ける。制御部130は、例えば、CPUやMPU等によって、応答生成装置100の内部の記憶装置に記憶されている各種プログラム(応答生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASICやFPGA等の集積回路により実現される。
図5に示すように、制御部130は、受信部131と、検索部132と、出力制御部133とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図5に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図5に示した接続関係に限られず、他の接続関係であってもよい。
受信部131は、音声認識装置20から音声テキストと、ユーザ情報とを受信する。具体的には、受信部131は、音の特徴情報として、ユーザが発話した音声波形に関する性質から得られる情報を受信する。そして、音声波形に関する性質から得られる情報とは、すなわち、ユーザに関するユーザ情報であり、例えば、年齢、性別、性格、感情、方言、体調、または、ユーザ周辺の環境音に関する情報等である。
以下では、検索部132によって、方言に基づいて、地域による広告の絞込みが行われる例について説明する。例えば、図7に示すように、「どんなカレーが好き?」といった応答生成装置100による応答メッセージに対し、ユーザU01が「キーマカレーめっちゃ好きやわー」と入力したことにより、音声認識装置20によってユーザ情報「大阪弁」が特定されたとする。かかる場合に、受信部131は、音声のテキストデータと共に、ユーザ情報「大阪弁」を、ユーザ端末10を介して受信する。そして、受信部131は、受信したテキストデータと、ユーザ情報「大阪弁」を検索部132へ送信する。
検索部132は、ユーザが発話した音声の特徴に基づいて、広告情報を検索する。具体的には、検索部132は、受け付けたユーザ情報に基づいて、広告情報の検索対象、または、検索範囲を変動させて広告情報を検索する。
具体的には、検索部132は、受信部131から音声テキスト及びユーザ情報を受け付けた場合は、音声テキストと判定情報記憶部121に記憶された情報とを用いて、応答メッセージを選択する。例えば、検索部132は、音声テキストを受け付けた場合に、かかる音声テキストに含まれているキーワードを有する検出ノードを判定し、判定した検出ノードと接続された動作ノードに対応する応答メッセージが出力されるよう、かかる応答メッセージのデータを出力制御する。続いて、検索部132は、この応答メッセージに対する入力メッセージの音声テキストを受け付けた場合に、かかる動作ノードと接続された複数の検出ノードのうち、この音声テキストに含まれているキーワードを有する検出ノードを判定する。そして、検索部132は、判定した検出ノードに接続された動作ノードに対応する応答メッセージのデータを出力制御する。このように、応答生成装置100は、検出ノードと動作ノードを使用してユーザとの会話を実現する。
また、検索部132は、処理内容に広告検索を行う旨が登録されている場合には、以下の処理を実行する。具体的には、検索部132は、検索情報記憶部122にアクセスし、受け付けたユーザ情報に対応する検索タグを特定する。かかる例の場合では、検索部132は、受信部131からユーザ情報「大阪弁」を受信しているので、ユーザ情報「大阪弁」に対応する検索タグ「大阪地方」を特定する。この検索タグ「大阪地方」は、例えば、大阪周辺在住のユーザを対象とする広告情報や、大阪地域に店舗を有する広告主の広告情報といった大阪地域の広告情報を検索するよう検索対象を指定していることを示す。
また、検索部132は、受け付けた音声テキストからキーワードを抽出し、抽出したキーワードを検索キーワードとして設定する。かかる例では、ユーザU01は、「キーマカレーめっちゃ好きやわー」を入力していることにより、検索部132は、「キーマカレー」を検索キーワードとして設定する。
そして、検索部132は、広告入札装置40に対して、検索キーワードと検索タグに対応する広告情報を検索するよう要求することで広告データを取得する。具体的には、検索部132は、検索キーワード及び検索タグを検索条件として広告入札装置40へ送信する。例えば、検索部132は、検索キーワード「キーマカレー」と、検索タグ「大阪地方」を送信する。
ここで、広告入札装置40の提示部45は、検索キーワードと検索タグを受信したことにより、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部42から抽出する。例えば、図4の例では、広告ID「C01」で識別される広告主が、広告キーワード「キーマカレー」、広告タグ「大阪地方」を設定しており、検索部132によって送信された検索条件と一致する。よって、提示部45は、対応する広告データ「カレー屋A店大阪進出!」を抽出する。
また、提示部45は、抽出した広告データを送信元である応答生成装置100に提示する。これにより、検索部132は、広告入札装置40によって提示された広告データを取得する。そして、検索部132は、取得した広告データを出力制御部133へ送信する。かかる例では、広告データ「カレー屋A店大阪進出!」が提示部45によって提示されることになるので、検索部132は、広告データ「カレー屋A店大阪進出!」を取得し、出力制御部133へ送信する。
出力制御部133は、応答メッセージがユーザ端末10によって音声として出力されるよう出力制御を行う。具体的には、出力制御部133は、音声合成装置70に広告データを送信して中間表現(例えば、再生波形のデータ)を受信し、受信した中間表現や広告データのテキストを応答生成装置100に送信する。
〔4.応答生成処理フロー〕
次に、図9を用いて、実施形態にかかる応答生成装置100による応答生成処理について説明する。図9は、実施形態にかかる応答生成装置100による応答生成処理手順を示すフローチャート図である。
図9に示すように、まず、ユーザ端末10が、ユーザの発話に関する音声や、ユーザ周辺の環境音等を受け付ける(ステップS201)。そして、ユーザ端末10は、受け付けた音声データを音声認識装置20へ送信する(ステップS202)。音声認識装置20は、音声データを受信した場合に、かかる音声データをテキストデータに変換すると共に、音声データからユーザ情報を特定する(ステップS203)。具体的には、音声認識装置20は、音声データを解析することにより音の特徴情報として、ユーザに関するユーザ情報を特定する。さらに具体的には、音声認識装置20は、音声データから音声波形を生成し、その音声波形に関する性質から得られる情報として、ユーザ情報を特定する。そして、音声認識装置20は、テキストデータと取得したユーザ情報とをユーザ端末10へ送信する(ステップS204)。ユーザ端末10は、受け付けたテキストデータとユーザ情報を応答生成装置100へ送信する(ステップS205)。
ここで、応答生成装置100は、テキストデータとユーザ情報を受け付けた場合に、処理内容に広告検索を行う旨が登録されていれば、検索情報記憶部122にアクセスし、受け付けたユーザ情報に対応する検索タグを特定する。また、応答生成装置100は、テキストデータからキーワードを抽出し、抽出したキーワードを検索キーワードとして設定する(ステップS206)。そして、応答生成装置100は、検索キーワード及び検索タグを検索条件として広告入札装置40へ送信することにより、広告入札装置40に対して、検索キーワードと検索タグに対応する広告情報を検索するよう要求する(ステップS207)。これに対し、広告入札装置40は、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部42から抽出し、抽出した広告データを送信元である応答生成装置100に提示する(ステップS208)。
応答生成装置100は、広告入札装置40によって提示された広告データを取得する(ステップS209)。そして、応答生成装置100は、取得した広告データがユーザ端末10によって音声として出力されるよう出力制御を行う(ステップS210)。
〔5.変形例〕
上述した実施例にかかる応答生成装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、応答生成装置100の他の実施例について説明する。
〔5−1.検索処理(1)〕
上述してきた応答生成装置100の検索部132は、音声から取得されたユーザ情報として、かかるユーザによって使用される方言に基づいて、地域による広告の絞込みが行われる例を示した。しかし、検索部132は、ユーザ情報としてユーザの性格、または、感情に関する情報が受信した場合に、その性格、または、感情に関する情報に応じて検索対象を変動させてもよい。つまり、検索部132は、性格、または、感情に関する情報に応じて広告情報の絞込みを行ってもよい。
具体的には、検索部132は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する。
例えば、応答生成装置100は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザが「無駄話嫌い」な性格であるとのユーザ情報を受信した場合には、「メッセージ長さが短い」広告情報を検索する。この場合、例えば、応答生成装置100は、ユーザ情報「無駄話嫌い」と検索タグ「短メッセージ広告」とを対応付けて記憶している。
なお、音声認識装置20は、例えば、音声波形に基づいて算出した口調のテンポが所定より短いユーザは、早口であるため、せっかちで「無駄話が嫌い」(話題が切り替わりにくい)な性格であるといったユーザ情報を特定していることになる。
ここで、応答生成装置100は、メッセージの文字数に所定の閾値を設定している。そして、検索部132は、検索キーワードと広告キーワードが一致し、かつ、設定された閾値より少ない文字数の広告情報を検索するよう、広告入札装置40に対して検索要求することで、対応する広告情報に含まれる広告データを取得する。
このように、応答生成装置100は、メッセージを入力したユーザが「無駄話嫌い」である場合には、メッセージ長さが短い広告データを広告入札装置40から取得し、取得した広告データを出力制御する。例えば、「無駄話嫌い」なユーザは、応答メッセージが長い場合には、不快感を覚えてしまう可能性がある。そのため、応答生成装置100は、「無駄話嫌い」なユーザには、メッセージ長さが短い広告データを出力制御する。
一方、検索部132は、メッセージを入力したユーザが「無駄話好き」である場合には、メッセージ長さが長い広告情報を検索する。つまり、応答生成装置100は、例えば、ユーザ情報「無駄話好き」と検索タグ「長メッセージ広告」対応付けて記憶している。そして、検索部132は、検索キーワードと広告キーワードが一致し、かつ、設定された閾値より多い文字数の広告情報を検索するよう、広告入札装置40に対して検索要求することで、対応する広告データを取得する。
なお、この場合、音声認識装置20は、音声波形に基づいて算出した口調のテンポが所定より長いユーザに対して、口調がゆっくりなため、のんびりしており「無駄話が好き」(話題が切り替わりにくい)な性格であるといったユーザ情報を特定していることになる。
このように、応答生成装置100は、メッセージを入力したユーザが「無駄話好き」である場合には、メッセージ長さが長い広告を検索し、出力制御する。上述した「無駄話嫌い」の例とは逆で、「無駄話好き」であれば、メッセージ長さが長い広告情報に不快感を覚える可能性は低いと考えられる。そのため、応答生成装置100は、「無駄話好き」なユーザには、メッセージ長さが長い広告データを出力制御する。
以上のように、応答生成装置100は、ユーザの性格、または、感情に応じて、それらに適した広告情報を応答メッセージとして提供することができる。
なお、感情には起伏があるため、通常は「無駄話好き」な性格のユーザであっても、例えば、一時的に「イライラ」している場合には、メッセージ長さが長い広告情報に対して不快感を覚える可能性がある。そのため、応答生成装置100は、通常は、性格に応じた広告データを出力制御しておき、所定の感情を受信した場合には、その感情に応じた検索処理を優先して行ってもよい。
〔5−2.検索処理(2)〕
また、上述してきた応答生成装置100の検索部132は、ユーザ情報としてユーザの性格、または、感情に関する情報が受信された場合に、その性格、または、感情に関する情報に応じて検索範囲を変動させてもよい。
具体的には、検索部132は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、広告情報の検索範囲を広げ、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、広告情報を検索する範囲を狭める。
例えば、応答生成装置100は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザが「無駄話嫌い」な性格であるとのユーザ情報を受信した場合には、広告情報検索時の類似性を狭める。つまり、検索部132は、入力メッセージから抽出した所定のキーワードを検索キーワードとする。例えば、ユーザによって「キーマカレー好き」と入力された場合には、検索部132は、「キーマカレー」を抽出し、検索キーワードとする。そして、検索部132は、検索キーワード「キーマカレー」を用いて検索するよう検索要求することで、広告キーワード「キーマカレー」が設定されている広告データを取得する。
このように、応答生成装置100は、「無駄話嫌い」なユーザに対し、かかるユーザの入力メッセージに含まれるキーワードを用いて検索された広告データを応答メッセージとして出力制御する。このような応答メッセージは、対話文脈に忠実であるため、無駄話が嫌いなユーザに不快感を与えることもない。具体的には、応答生成装置100は、「キーマカレー」に関する会話をしているユーザに対し、「キーマカレー」に関する内容の応答メッセージを出力することになるので、対話文脈から外れることがなく、不快感を与えることもない。
一方、検索部132は、「無駄話好き」な性格であるとのユーザ情報を受信した場合には、広告情報検索時の類似性を広める。「無駄話好き」なユーザは、応答生成装置100との様々な会話を楽しみたいと考えているといえる。つまり、対話文脈から外れた応答メッセージにより、不快感を与えてしまうことはないと考えられる。よって、検索部132は、あえて対話文脈から外れたような応答メッセージとしての広告情報も出力制御してよいことになる。例えば、ユーザによって「キーマカレー好き」と入力された場合には、検索部132は、「キーマカレー」を抽出し、検索キーワードとすると共に、その関連語である類似検索キーワードを用いることにより検索範囲を広める。言い換えれば、検索部132は、「キーマカレー」を検索範囲に含める類似性の広い広告情報を検索する。
例えば、検索部132は、「キーマカレー」と類似する類似検索キーワードとして、「カレー」、「インド料理」を設定する。なお、応答生成装置100が関連語を検索する処理については、任意の公知技術が適用されるものとする。ここで、検索部132は、「キーマカレー」、「カレー」、「インド料理」を用いて検索するよう検索要求することで、広告キーワード「キーマカレー」」、「カレー」、「インド料理」が設定されている広告データを取得する。
このように、応答生成装置100は、「無駄話好き」なユーザに対し、かかるユーザの入力メッセージに含まれるキーワードと関連する関連語を用いて検索した広告データを応答メッセージとして出力する。このような応答メッセージは、検索キーワードによる検索に基づく応答メッセージを出力する場合に比べ、対話文脈から外れてしまう可能性がある。つまり、応答生成装置100は、「キーマカレー」に関する会話をしているユーザに対し、「カレー」や、「インド料理」に関する応答メッセージを出力する場合がある。このように、応答生成装置100は、「無駄話好き」と判定したユーザに対しては、対話文脈から外れた応答メッセージを出力することにより、様々な話題を提供することができ、ユーザの会話に対する満足度を高めることができる。
〔5−3.検索処理(3)〕
また、上述してきた応答生成装置100の検索部132は、ユーザの年齢が受信された場合に、その年齢に応じて広告情報の検索範囲を変動させてもよい。例えば、応答生成装置100は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザのユーザ情報「60代」を受信した場合には、広告情報検索時の類似性を狭める。つまり、検索部132は、入力メッセージから抽出した所定のキーワードを検索キーワードとし、かかる検索キーワードを用いて検索するよう検索要求する。
このように、応答生成装置100は、メッセージを入力したユーザが高齢である場合には、そのユーザが入力したメッセージと関連性の高い広告データを応答メッセージとして出力制御する。例えば、応答生成装置100は、類似性の広い検索を行うことにより、入力メッセージと関連性の低い応答メッセージを出力制御した場合に、高齢者は、応答メッセージの内容を十分に理解できず不快感を覚えてしまう可能性がある。そのため、応答生成装置100は、高齢者には、あえて広告情報検索時の類似性を狭めることにより、入力メッセージと関連性の高い広告データを応答メッセージとして出力制御する。これにより、応答生成装置100は、ユーザに応じた広告情報を提供することができる。
一方、応答生成装置100は、例えば、メッセージを入力したユーザの音声の特徴情報として、かかるユーザのユーザ情報「20代」を受信した場合には、広告情報検索時の類似性を広げる。つまり、検索部132は、上述したように、入力メッセージの内容に基づいて、検索キーワードと類似検索キーワードを設定し、これらを用いて検索するよう要求する。
このように、応答生成装置100は、メッセージを入力したユーザが若者である場合には、そのユーザが入力したメッセージと関連性の低い広告データも応答メッセージとして出力制御する場合がある。若者は、インターネットを通して様々な情報を取得しようとする傾向にあるので、応答生成装置100が類似性の広い検索を行うことにより、入力メッセージと関連性の低い応答メッセージを出力制御した場合であっても不快感を覚えてしまう可能性は低い。そのため、応答生成装置100は、若者には、あえて広告情報検索時の類似性を広げることにより、入力メッセージと関連性の低い広告情報を応答メッセージとして出力制御する。これにより、応答生成装置100は、広告の出力機会を増やすことができる。
なお、上述してきたユーザ情報と検索処理の組合せは一例であり、任意に組み合わせることができる。例えば、検索部132は、年齢に応じて検索範囲を変動させる例を示したが、年齢に応じて検索対象を変動させてもよい。例えば、検索部132は、高齢者に対しては、内容が理解しやすいように、メッセージ長さの長い広告情報を検索し、その結果得られた広告データを出力制御してもよい。一方、若者であればメッセージ長さの長い広告情報であっても苦にならないことが考えられるので、検索部132は、若者に対しては、メッセージ長さの長い広告情報を検索し、その結果得られた広告データを出力制御してもよい。
また、応答生成装置100は、高齢者に対しては検索範囲を狭め、若者に対しては検索範囲を広げる例を示したが、例えば、若者であっても子供に対しては検索範囲を狭めてもよい。つまり、応答生成装置100は、年齢と検索範囲の関係を任意に設定してもよい。
〔5−4.検索処理(4)〕
また、上述してきた応答生成装置100の検索部132は、ユーザの体調に基づく検索を行ってもよい。具体的には、音声認識装置20は、ユーザ情報として体調に関する情報を特定する。例えば、音声認識装置20は、生成した音声波形に「咳き込み音」を特徴付ける形状を特定できた場合に、例えば、ユーザ情報として「風邪気味」を特定する。これにより、検索部132は、ユーザ情報「風邪気味」を検索タグとして、検索要求する。これにより、応答生成装置100は、広告主に対して、体調に関する入札を可能とできる。例えば、広告主がドラッグストア経営主である場合には、その広告主は、広告タグ「風邪気味」を設定することにより、風邪を引いているユーザに対して自身の店舗の製品を広告することができる。このように、応答生成装置100、音の特徴情報を利用することにより、体調に関する入札を可能とすることで、広告効果を高めることができる。また、応答生成装置100は、例えば、体調の悪いユーザに対して、薬品や薬局等に関する広告情報を提供することができるので、ユーザに適した応答メッセージを出力することができる。
〔5−5.検索処理(5)〕
また、上述してきた応答生成装置100の検索部132は、ユーザ周辺の環境音に基づく検索を行ってもよい。具体的には、音声認識装置20は、ユーザ情報としてユーザ周辺の環境音に関する情報を特定する。例えば、音声認識装置20は、バックノイズとして取得した音の音声波形に「赤ん坊の泣き声」を特徴付ける形状を特定できた場合に、例えば、ユーザ情報として「赤ちゃんの親」を特定する。これにより、応答生成装置100は、ユーザ情報「赤ちゃんの親」を検索タグとして、検索要求する。これにより、応答生成装置100は、広告主に対して、例えば、ベビー用品に関する入札を可能とできる。このように、応答生成装置100は、音の特徴情報を利用することにより、環境音に関する入札を可能とすることで、広告効果を高めることができる。また、その環境音はユーザ周辺の環境音であるため、応答生成装置100は、ユーザに有利な広告情報を提供することができる。
〔5−6.位置情報を考慮した検索〕
また、上述してきた応答生成装置100の検索部132は、位置情報を考慮した検索を行ってもよい。このために、広告入札装置40は、広告主から広告情報を出力して欲しい出力場所を受け付けておく。そして、検索部132は、ユーザ情報を受信した場合に、受信したユーザ情報に対応するユーザの所在地を取得する。具体的には、検索部132は、受信したユーザ情報に含まれる端末IDと、GPSログに含まれる端末IDとのマッチングを行うことにより、かかるユーザの所在地を特定する。そして、検索部132は、検索キーワード及び検索タグと共に、特定した所在地を広告入札装置40へ送信する。広告入札装置40は受信した検索条件と一致する広告データを、送信元の応答生成装置100に提示する。検索部132は、提示された広告データを取得し、取得した広告データを出力制御する。
これにより、応答生成装置100は、広告主が希望する出力場所に所在するユーザに対して、その広告主の広告データを配信することができるため、広告効果を高めることができる。
〔5−7.装置構成〕
上記実施形態では、応答生成装置100は、音声認識装置20によって特定されたユーザ情報を受信する例を示した。しかし、応答生成装置100が、音の特徴情報として、ユーザ情報を特定してもよい。この場合、音声を受け付けたユーザ端末10は、その音データを応答生成装置100へ送信する。応答生成装置100は、受け付けた音声データに関する音声波形を作成し、その音声波形の特徴ユーザ情報を特定する。
〔5−8.ユーザ端末以外の例〕
上記実施形態では、ユーザはユーザ端末10を用いて、応答生成装置100と会話を行う例を示した。しかし、ユーザ端末10の有する応答生成装置100との対話機能が、会話を行うロボットに搭載されていてもよい。これにより、かかるロボットがユーザに代わって応答生成装置100と会話を行うことが実現できる。
〔5−9.プログラム〕
また、上述してきた各実施形態にかかる応答生成装置100は、例えば図10に示すような構成のコンピュータ1000によって実現される。以下、応答生成装置100を例に挙げて説明する。図10は、応答生成装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網50を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網50を介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態にかかる応答生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信網50を介してこれらのプログラムを取得してもよい。
〔5−10.その他〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔6.効果〕
上述してきたように、実施形態にかかる制御装置において、応答生成装置100は、検索部132と、出力制御部133とを有する。検索部132は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する。出力制御部133は、検索部132によって検索された広告情報に関する広告を応答メッセージとして出力するよう制御する。
これにより、応答生成装置100は、ユーザに適したメッセージを出力することができると共に、広告主の意向に沿った広告配信を行うことができる。
また、実施形態にかかる検索部132は、ユーザが発話した音声の特徴に基づいて、広告情報を検索する。
これにより、実施形態にかかる応答生成装置100は、音声のテキストからは得ることができない音声特有の情報を得ることができる。
また、実施形態にかかる検索部132は、ユーザが発話した音声の特徴に基づいて推定されたユーザの年齢、性別、性格、感情、方言、または、体調の少なくともいずれか1つに基づいて、広告情報を検索する。
これにより、実施形態にかかる応答生成装置100は、ユーザに適した広告情報を応答メッセージを出力することができると共に、広告主の意向に沿った広告配信を行うことができる。
また、実施形態にかかる検索部132は、推定された方言によって特定される地域に対応する広告の広告情報を検索する。
これにより、実施形態にかかる応答生成装置100は、ユーザの出身地に関する広告情報を出力することができるため、広告情報に対するユーザの関心を高めることができ、また、広告主に対して地域に関する広告情報を入札しやすくすることができる。
また、実施形態にかかる検索部132は、推定された年齢が低いほど広告情報の検索範囲を広げ、推定された年齢が高いほど広告情報の検索範囲を狭める。
これにより、実施形態にかかる応答生成装置100は、年齢に応じた広告情報を応答メッセージとして出力することができる。
また、実施形態にかかる検索部132は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、広告情報の検索範囲を広げ、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、広告情報を検索する範囲を狭める。
これにより、実施形態にかかる応答生成装置100は、ユーザの性格や感情に応じた広告情報を応答メッセージとして出力することができるため、会話に対するユーザの満足度を高めることができる。
また、実施形態にかかる検索部132は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する。
これにより、実施形態にかかる応答生成装置100は、ユーザの性格や感情に応じた広告情報を応答メッセージとして出力することができるため、会話に対するユーザの満足度を高めることができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、判定部は、特定手段や特定回路に読み替えることができる。
10 ユーザ端末
20 音声認識装置
30 広告主端末
40 広告入札装置
42 広告情報記憶部
44 入札受付部
45 提示部
100 応答生成装置
121 判定情報記憶部
122 検索情報記憶部
130 制御部
131 受信部
132 検索部
133 出力制御部

Claims (12)

  1. 対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、
    前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、
    を備え
    前記検索部は、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が低いほど前記広告情報の検索範囲を広げ、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が高いほど前記広告情報の検索範囲を狭める、
    とを特徴とする制御装置。
  2. 対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、
    前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、
    を備え、
    前記検索部は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、前記広告情報の検索範囲を広げ、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記広告情報を検索する範囲を狭める、
    ことを特徴とする制御装置。
  3. 対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、
    前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、
    を備え、
    前記検索部は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する
    ことを特徴とする制御装置。
  4. 前記検索部は、前記ユーザが発話した音声の特徴に基づいて、前記広告情報を検索する、
    ことを特徴とする請求項1〜3のいずれか1つに記載の制御装置。
  5. 前記検索部は、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢、性別、性格、感情、方言、または、体調の少なくともいずれか1つに基づいて、前記広告情報を検索する
    ことを特徴とする請求項に記載の制御装置。
  6. 前記検索部は、推定された前記ユーザが使用する方言によって特定される地域に対応する広告の広告情報を検索する、
    ことを特徴とする請求項に記載の制御装置。
  7. コンピュータが実行する制御方法であって、
    対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索工程と、
    前記検索工程によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御工程と、
    を含み、
    前記検索工程、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が低いほど前記広告情報の検索範囲を広げ、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が高いほど前記広告情報の検索範囲を狭める、
    とを特徴とする制御方法。
  8. コンピュータが実行する制御方法であって、
    対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索工程と、
    前記検索工程によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御工程と、
    を含み、
    前記検索工程は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、前記広告情報の検索範囲を広げ、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記広告情報を検索する範囲を狭める、
    ことを特徴とする制御方法。
  9. コンピュータが実行する制御方法であって、
    対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索工程と、
    前記検索工程によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御工程と、
    を含み、
    前記検索工程は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する
    ことを特徴とする制御方法。
  10. 対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索手順と、
    前記検索手順によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御手順と、
    をコンピュータに実行させ
    前記検索手順は、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が低いほど前記広告情報の検索範囲を広げ、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢が高いほど前記広告情報の検索範囲を狭める、
    とを特徴とする制御プログラム。
  11. 対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索手順と、
    前記検索手順によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御手順と、
    をコンピュータに実行させ、
    前記検索手順は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、前記広告情報の検索範囲を広げ、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記広告情報を検索する範囲を狭める、
    ことを特徴とする制御プログラム。
  12. 対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索手順と、
    前記検索手順によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御手順と、
    をコンピュータに実行させ、
    前記検索手順は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する
    ことを特徴とする制御プログラム。
JP2014148334A 2014-07-18 2014-07-18 制御装置、制御方法および制御プログラム Active JP6310796B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014148334A JP6310796B2 (ja) 2014-07-18 2014-07-18 制御装置、制御方法および制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014148334A JP6310796B2 (ja) 2014-07-18 2014-07-18 制御装置、制御方法および制御プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017212857A Division JP6791829B2 (ja) 2017-11-02 2017-11-02 制御装置、制御方法および制御プログラム

Publications (2)

Publication Number Publication Date
JP2016024636A JP2016024636A (ja) 2016-02-08
JP6310796B2 true JP6310796B2 (ja) 2018-04-11

Family

ID=55271345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014148334A Active JP6310796B2 (ja) 2014-07-18 2014-07-18 制御装置、制御方法および制御プログラム

Country Status (1)

Country Link
JP (1) JP6310796B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12112745B2 (en) 2018-11-08 2024-10-08 Samsung Electronics Co., Ltd. Electronic device and control method thereof

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6462628B2 (ja) * 2016-05-18 2019-01-30 株式会社野村総合研究所 商品販売支援システム、及び商品販売支援方法
WO2018072151A1 (zh) * 2016-10-19 2018-04-26 深圳市大疆创新科技有限公司 控制方法、控制装置及电子装置
JP6854146B2 (ja) * 2017-02-17 2021-04-07 シャープ株式会社 ネットワークシステム、サーバ、情報処理方法および冷蔵庫
WO2020031599A1 (ja) * 2018-08-08 2020-02-13 パナソニックIpマネジメント株式会社 情報提供方法、サーバ、音声認識装置、情報提供プログラム、及び情報提供システム
JP2020086943A (ja) * 2018-11-26 2020-06-04 シャープ株式会社 情報処理装置、情報処理方法、および、プログラム
US20230055597A1 (en) * 2019-12-27 2023-02-23 Umee Technologies Inc. System, Method, Program and Recording Medium Recording Program for Recommendation Item Determination and Personality Model Generation

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297626A (ja) * 2001-03-30 2002-10-11 Just Syst Corp 情報提示装置、情報提示プログラム、及び情報提示方法
JP2003005950A (ja) * 2001-06-26 2003-01-10 Sharp Corp ウェブブラウザ
JP4209628B2 (ja) * 2002-04-18 2009-01-14 シャープ株式会社 情報提供装置および情報提供方法、携帯端末器、携帯端末システム、情報提供プログラム、並びに、プログラム記録媒体
US7805740B2 (en) * 2006-11-10 2010-09-28 Audiogate Technologies Ltd. System and method for providing advertisement based on speech recognition
JP2010277388A (ja) * 2009-05-29 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法、情報提供システム及び情報提供プログラム
JP5921833B2 (ja) * 2010-08-27 2016-05-24 ソフトバンク株式会社 広告配信装置及びそれに使用する携帯通信機器
US8401853B2 (en) * 2010-09-22 2013-03-19 At&T Intellectual Property I, L.P. System and method for enhancing voice-enabled search based on automated demographic identification

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12112745B2 (en) 2018-11-08 2024-10-08 Samsung Electronics Co., Ltd. Electronic device and control method thereof

Also Published As

Publication number Publication date
JP2016024636A (ja) 2016-02-08

Similar Documents

Publication Publication Date Title
JP6310796B2 (ja) 制御装置、制御方法および制御プログラム
JP6670350B2 (ja) サードパーティサービスをデジタルアシスタントと統合するシステム及び方法
JP6305274B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
US10096319B1 (en) Voice-based determination of physical and emotional characteristics of users
JP6570226B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
US20210217413A1 (en) Voice activated interactive audio system and method
KR101983635B1 (ko) 개인방송 컨텐츠 추천방법
JP7525575B2 (ja) ビジュアルコンテンツからのインタラクティブなオーディオトラックの生成
JP6262613B2 (ja) 提示装置、提示方法及び提示プログラム
US20200210505A1 (en) Electronic apparatus and controlling method thereof
JP2008052449A (ja) 対話型エージェントシステム及び方法
JP6884722B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5881647B2 (ja) 判定装置、判定方法及び判定プログラム
JP6568263B2 (ja) 装置、方法及びプログラム
JP6368025B2 (ja) 装置、方法及びプログラム
JP7260263B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP6791829B2 (ja) 制御装置、制御方法および制御プログラム
JPWO2019026395A1 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2014109998A (ja) 対話装置及びコンピュータ対話方法
JP2019109780A (ja) 情報提供装置、情報提供方法、および情報提供プログラム
JP6898064B2 (ja) 対話決定システム、対話決定方法、対話決定プログラム、及び端末装置
JP6482703B1 (ja) 推定装置、推定方法および推定プログラム
JP6553223B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
JP6774438B2 (ja) 情報処理システム、情報処理方法、およびプログラム
JP2021012660A (ja) 情報処理装置、情報処理方法および情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170727

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180220

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180319

R150 Certificate of patent or registration of utility model

Ref document number: 6310796

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250