JP2016045584A - 応答生成装置、応答生成方法及び応答生成プログラム - Google Patents

応答生成装置、応答生成方法及び応答生成プログラム Download PDF

Info

Publication number
JP2016045584A
JP2016045584A JP2014167794A JP2014167794A JP2016045584A JP 2016045584 A JP2016045584 A JP 2016045584A JP 2014167794 A JP2014167794 A JP 2014167794A JP 2014167794 A JP2014167794 A JP 2014167794A JP 2016045584 A JP2016045584 A JP 2016045584A
Authority
JP
Japan
Prior art keywords
user
response
unit
response generation
advertisement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014167794A
Other languages
English (en)
Other versions
JP6570226B2 (ja
Inventor
香里 谷尾
Kaori Tanio
香里 谷尾
北岸 郁雄
Ikuo Kitagishi
郁雄 北岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2014167794A priority Critical patent/JP6570226B2/ja
Publication of JP2016045584A publication Critical patent/JP2016045584A/ja
Application granted granted Critical
Publication of JP6570226B2 publication Critical patent/JP6570226B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】ユーザと適切な会話を行うこと。【解決手段】本願にかかる応答生成装置は、対話エージェントシステムとユーザとの会話の特徴に関する特徴情報を特定する特定部と、特定部によって特定された特徴情報に応じて応答メッセージの内容を変形する変形部と、変形部によって内容が変形された応答メッセージを出力するよう制御する出力制御部と、を備えたことを特徴とする。このため、応答生成装置は、ユーザと適切な会話を行うことができる。【選択図】図5

Description

本発明は、応答生成装置、応答生成方法及び応答生成プログラムに関する。
従来、ユーザ端末からメッセージを受け付けたことに応じて、このメッセージに対応するメッセージをユーザ端末に出力する対話エージェントシステムが知られている。このような対話エージェントシステムにおいて、ユーザ端末から受け付けたメッセージに対応するメッセージの出力を行ったり、このユーザ端末のユーザに適した広告を含むメッセージの出力を行ったりする技術が提供されている。また、対話のコンテンツやコンテキストに基づいて、ユーザに提供する広告を決定する技術が提案されている。
特表2006−500699号広報 特表2001−525951号広報
しかしながら、上記の従来技術では、ユーザと適切な会話を行うことができない場合がある。例えば、上記の従来技術では、ユーザ端末から受け付けたメッセージに対応する応答や広告を、あらかじめ登録された応答や広告から選択してそのまま出力するので、会話が不自然になったり、広告効果が最適にならない場合がある。
本願は、上記に鑑みてなされたものであって、ユーザと適切な会話を行うことができる応答生成装置を提供することを目的とする。
本願にかかる、応答生成装置は、対話エージェントシステムとユーザとの会話の特徴に関する特徴情報を特定する特定部と、前記特定部によって特定された特徴情報に応じて応答メッセージの内容を変形する変形部と、前記変形部によって内容が変形された応答メッセージを出力するよう制御する出力制御部と、を備えたことを特徴とする。
実施形態の一態様によれば、ユーザと適切な会話を行うことができる効果を奏する。
図1は、実施形態にかかる応答生成処理の一例を示す図である。 図2は、実施形態にかかる応答生成システムの構成例を示す図である。 図3は、実施形態にかかる広告入札装置の構成例を示す図である。 図4は、実施形態にかかる広告情報記憶部の一例を示す図である。 図5は、実施形態にかかる応答生成装置の構成例を示す図である。 図6は、実施形態にかかる判定情報記憶部の一例を示す図である。 図7は、判定情報記憶部に記憶されるツリー構造の模式図である。 図8は、実施形態にかかる応答生成装置による応答生成処理手順を示すシーケンス図である。 図9は、変形例にかかる判定ツリーの一例を示す図である。 図10は、変形例にかかる判定ツリーの一例を示す図である。 図11は、応答生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
以下に、本願にかかる応答生成装置、応答生成方法及び応答生成プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願にかかる応答生成装置、応答生成方法及び応答生成プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
〔1.応答生成処理〕
まず、図1を用いて、実施形態にかかる応答生成処理の一例について説明する。図1は、実施形態にかかる応答生成処理の一例を示す図である。図1では、応答生成装置100によって応答生成処理が行われる例を示す。
ユーザ端末10は、ユーザによって利用される端末装置である。ユーザ端末10は、例えば、スマートフォンなどの携帯電話機や、タブレット端末や、PDA(Personal Digital Assistant)や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。なお、ユーザ端末10は、会話を行うロボットや、ロボットが有する情報処理装置、その他ロボットに内蔵される任意の装置に適用することができる。
音声認識装置20は、ユーザ端末10から受信した入力メッセージ、すなわち、発話の音声データをテキストデータに変換する。また、音声認識装置20は、ユーザ端末10から受信した音声データを解析し、音の特徴情報としてユーザに関する特性を特定する。具体的には、音声認識装置20は、音声データ解析により音声波形を生成する。そして、音声認識装置20は、生成した音声波形のピーク形状や周波数特性等に基づいて、音声を入力したユーザ特性を特定する。
なお、音の特徴情報としてのユーザ特性とは、例えば、ユーザの年齢、性別、感情、方言、体調といったユーザ属性に関する情報である。例えば、音声認識装置20は、音声波形に基づいて、音のテンポや単語と単語との間隔が所定値より短ければ「せっかち」、長ければ「おっとり」といった性格を判定することができる。また、音声認識装置20は、音声波形における振動の幅、ピーク形状、周波数から、年齢・性別・方言を判定することができる。なお、音声認識装置20は、上述した処理以外にも、任意の手法を用いて、音声からユーザ特性を特定してよい。
広告主端末30は、広告主によって利用される端末装置である。広告主端末30は、例えば、スマートフォンなどの携帯電話機や、タブレット端末や、PDAや、デスクトップ型PCや、ノート型PC等である。また、広告主端末30は、広告主から受け付けた広告情報を広告入札装置40へ送信する。
広告入札装置40は、入札用画面を広告主端末30に提示する。また、広告入札装置40は、広告主端末30から受け付けた広告情報を所定の記憶部に記憶する。なお、広告情報には、広告の内容を特徴づける広告キーワードや、応答メッセージとして出力される広告データ等が含まれる。広告データとは、例えば、テキスト形式の広告文に該当する。
応答生成装置100は、ユーザの発話である入力メッセージに対し、予め設定された判定情報に従って応答メッセージを出力することにより会話を実現する。以下、実施形態では、かかる判定情報は、入力メッセージ及び応答メッセージに対応する各ノードから成るツリー構造(以下、「判定ツリー」と表記する場合がある)であるものとする。
なお、図1に示す判定ツリーおいて、破線ブロックは、検出ノードを示しており、実線ブロックは、動作ノードを示している。検出ノードは、ユーザからの入力メッセージに対応し、動作ノードは応答メッセージに対応する。
そして、実施形態における応答生成装置100は、会話の特徴に関する特徴情報として、会話の進め方の傾向、または、音の特徴情報に関するユーザ特性を特定し、特定したユーザ特性に応じて応答メッセージの内容を変形する。そして、応答生成装置100は、内容を変形した応答メッセージを出力するよう出力制御する。これにより、応答生成装置100は、よりユーザの特性に応じた会話を実現する。なお、上述したように、音の特徴情報としてのユーザ特性は、音声認識装置20によって特定されるため、応答生成装置100は、会話の進め方の傾向に関するユーザ特性を、任意の技術を用いて特定する。そして、応答生成装置100は、特定されたいずれかのユーザ特性に基づいて、変形処理を行う。また、応答生成装置100は、複数のユーザ特性を用いて変形処理を行ってもよい。
例えば、応答生成装置100は、会話の進め方の傾向として、ユーザとの一連の会話の中で使用した所定のノードの使用回数や、使用したノードの総数等に基づいて、ユーザ特性を特定する。具体的には、応答生成装置100は、所定のノードの使用回数や、会話が終了するまでに使用したノード総数に所定の閾値を設定する。そして、応答生成装置100は、各ノードの使用回数や、広告情報を出力するまでに使用したノード総数が所定の閾値よりも少ない場合は、ユーザ特性として、「話題の切り替えを好まない傾向(話題の無駄が生じない傾向)→無駄話嫌い」と特定し、多い場合は、「話題の切り替えを好む傾向(話題の無駄が生じる傾向)→無駄話好き」と特定する。
ここでは、応答生成装置100は、音声認識装置20によって特定されたユーザ特性を用いるものとする。具体的には、応答生成装置100は、音声認識装置20によって特定されたユーザU01のユーザ特性として、「大阪弁」を用いるものとする。そして、以下では、図1を用いて、応答生成装置100が、ユーザ特性「大阪弁」に基づいて、応答メッセージの内容を変形する例について説明する。
まず、ユーザ端末10は、その所有者であるユーザU01からメッセージの入力を受け付けたとすると(ステップS11)、その音声データを音声認識装置20へ送信する(ステップS12)。
音声認識装置20は、ユーザ端末10から受信した発話の音声データをテキストデータに変換すると共に、ユーザ端末10から受け付けた音声データを解析し、音声データに含まれる音の特徴を示す特徴情報として、ユーザ特性を特定する(ステップS13)。
そして、音声認識装置20は、テキストデータと、特定したユーザ特性「大阪弁」をユーザ端末10へ送信する(ステップS14)。ユーザ端末10は、受信したテキストデータと、ユーザ特性「大阪弁」を応答生成装置100へ送信する(ステップS15)。
そして、応答生成装置100は、出力する応答メッセージのデータを取得する(ステップS16)。ちなみに、応答生成装置100は、音声テキストを受け付けた場合に、かかる音声テキストに含まれているキーワードを有する検出ノードを判定し、判定した検出ノードと接続された動作ノードに対応する応答メッセージのデータを取得する。このように、応答生成装置100は、検出ノードと動作ノードを使用してユーザとの会話を実現する。
ここで、応答生成装置100は、判定した検出ノードを使用するたびに広告情報を広告入札装置40から検索し、検索の結果、広告情報が存在する場合には、その広告情報に含まれる広告データを、動作ノードとして登録されている応答メッセージに変わる応答メッセージとして取得する。なお、応答生成装置100は、判定した検出ノードに広告検索を行う旨が登録されている場合に、広告情報を検索してもよい。
なお、広告情報は、応答生成装置100が所定の検出ノードを使用(音声テキストの受信に該当)した場合に、その検出ノードに対応する動作ノードとして使用(応答メッセージの出力)されるよう、予め広告主によって、かかる検出ノードを識別するためのノードID(以下、「検出ノードID」と表記する場合がある)が登録されている。よって、応答生成装置100は、音声テキストを受信することにより検出ノードを使用するたびに、かかる検出ノードIDに対応する広告情報を検索するよう広告入札装置40に要求し、広告入札装置40によって検索された広告情報に含まれる広告データを取得することになる。なお、検出ノードに対応する広告情報が登録されていない場合等には、応答生成装置100は、判定ツリーに登録されている通常の応答メッセージを取得する。なお、通常の応答メッセージとは、広告情報以外の応答メッセージのことである。
そして、応答生成装置100は、取得した応答メッセージが、判定ツリーに登録されている通常の応答メッセージであっても、また、広告主によって登録されている広告データのいずれであっても、その内容をユーザ特性「大阪弁」に合わせて、「大阪弁」に変形する(ステップS17)。
例えば、図1に示す判定ツリーにおいて、太線で示す曲線K1の流れで会話が行われたとする。また、判定ツリーには、応答メッセージが標準語で登録されているとする。ここで、従来の応答サーバは、「食べること好きや」といった「大阪弁」でメッセージが入力されても、標準語の応答メッセージ「何が好きですか?」を変形せずに出力するので、会話が不自然になってしまう。また、かかる応答メッセージに対して、「キーマカレーが好きやわ」といった「大阪弁」でメッセージが入力されても、従来の応答サーバは、標準語の応答メッセージ「A店のキーマカレーすごくおいしいです」を変形せずに出力するので、会話が不自然になる結果、広告効果が悪化してしまう。
一方、応答生成装置100は、変形処理を行う場合には、「食べること好きや」といった「大阪弁」の入力メッセージに応じて、標準語の応答メッセージ「何が好きですか?」を、「何が好きなん?」と「大阪弁」に変形する。また、続く、「キーマカレーが好きやわ」といった「大阪弁」の入力メッセージに応じて、標準語の応答メッセージ「A店のキーマカレーすごくおいしいです」を、「A店のキーマカレーめっちゃうまいで!」に変形する。
そして、応答生成装置100は、文章を変形した応答メッセージがユーザ端末10によって出力されるよう出力制御を行う(ステップS18)。
このように、応答生成装置100は、特定したユーザ特性に応じて応答メッセージの内容を変形する。例えば、応答生成装置100は、ユーザ特性として、ユーザが「大阪弁」を話すことを特定した場合には、入力メッセージを受け付けるたびに、対応する応答メッセージの文章を「大阪弁」に変形し、変形した応答メッセージの出力制御を行う。これにより、応答生成装置100は、「大阪弁」を話すユーザに対し、「標準語」で応答することによる違和感を与えることがない。すなわち、応答生成装置100は、自然な流れでユーザの特性に応じた会話を行うことができ、会話に対するユーザの満足度を高めることができる。
〔2.応答生成システムの構成〕
次に、図2を用いて、実施形態にかかる応答生成システムの構成について説明する。図2は、実施形態にかかる応答生成システム1の構成例を示す図である。図2に示すように、応答生成システム1は、ユーザ端末10と、音声認識装置20と、広告主端末30と、広告入札装置40と、APIサーバ装置60と、音声合成装置70と、応答生成装置100とを含む。ユーザ端末10と、音声認識装置20と、広告主端末30と、広告入札装置40と、APIサーバ装置60と、音声合成装置70と、応答生成装置100とは、ネットワークNを介して有線または無線により通信可能に接続される。なお、図2に示す応答生成システム1には、複数台のユーザ端末10や、複数台の広告主端末30が含まれてよい。
ここで、応答生成システム1がユーザへ音声サービスを提供する処理の概要について説明する。ユーザ端末10は、アプリケーションの起動後、ユーザの発話を検知すると、発話の音声データを音声認識装置20へ送信する。
音声認識装置20は、ユーザ端末10から発話の音声データを受信すると、音声データをテキストデータに変換し、発話のテキストデータをユーザ端末10へ送信する。音声認識装置20から発話のテキストデータを受信したユーザ端末10は、発話のテキストデータを応答生成装置100に送信する。
広告主端末30は、広告主から受け付けた広告情報を広告入札装置40へ送信する。なお、広告情報には広告キーワード、広告データ等が含まれる。広告入札装置40は、入札用画面を広告主端末30に提示する。また、広告入札装置40は、広告主端末30から受け付けた広告情報を後述する記憶部に記憶する。また、広告入札装置40は、応答生成装置100によって変形された広告文を広告主に提示する。
応答生成装置100は、ユーザ端末10から発話のテキストデータ及び音声認識装置20によって取得されたユーザ情報を受信すると、上述した検索処理を実行して応答メッセージを生成する。また、応答生成装置100は、ユーザの発話に基づいて画像検索結果や経路検索結果等を応答として出力する場合には、応答の生成に必要なデータの検索条件を指定し、ユーザ端末10が起動したアプリケーションに対応するAPIサーバ装置60に対してデータの要求を行う。
APIサーバ装置60は、応答生成装置100から受信した検索条件に従って、画像検索結果や経路検索結果等を含むデータを応答生成装置100に送信する。例えば、APIサーバ装置60は、画像検索結果や経路検索結果を含むXML(Extensible Markup Language)データを取得する処理を行い、取得したXMLデータを応答生成装置100に送信する。
応答生成装置100は、APIサーバ装置60から、例えば、XMLデータを受信すると、XMLデータからデータを抽出し、XMLデータをHTMLデータに変換するとともに、XMLデータまたはHTMLデータから音声にて応答を行うテキストデータ(以下、応答発話表示用のテキストデータと記載する)を抽出する。また、応答生成装置100は、応答発話表示用のテキストデータや、判定処理により取得された応答のテキストデータを音声合成装置70に送信する。
音声合成装置70は、応答発話表示用のテキストデータや判定処理により取得された応答のテキストデータから音声を合成する音声合成処理を行って生成した応答発話用の中間表記を応答生成装置100に送信する。応答生成装置100は、応答発話用の中間表記と応答発話表示用のテキストデータとHTMLデータとをユーザ端末10に送信する。
ユーザ端末10は、受信した応答発話用の中間表記を用いて、応答の音声を出力するとともに、応答発話表示用のテキストデータとHTMLデータとを用いて、応答内容を表示する。このようにして、応答生成システム1は、ユーザの発話に対して適切な応答を行う音声サービスを実現する。
なお、応答生成装置100は、上述した音声サービスを提供する処理に、上述した応答メッセージ変形処理を組み合わせることにより、よりユーザの特性に応じた応答メッセージの出力を実現する。
〔3−1.広告入札装置の構成〕
次に、図3を用いて、実施形態にかかる広告入札装置40について説明する。図3は、実施形態にかかる広告入札装置40の構成例を示す図である。図3に示すように、広告入札装置40は、通信部41と、広告情報記憶部42と、制御部43とを有する。
通信部41は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部41は、ネットワークと有線または無線で接続される。
広告情報記憶部42は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
広告情報記憶部42は、各種広告情報を記憶する。具体的には、広告情報記憶部42は、広告主端末30から入札として受け付けた広告情報を記憶する。ここで、図4に、実施形態にかかる広告情報記憶部42の一例を示す。図4に示した例では、広告情報記憶部42は、広告IDに、広告キーワードと、広告タグと、広告データとを対応付けて記憶する。
「広告ID」は、広告情報を識別するための識別情報を示す。また、「広告ID」は、広告主及び広告主端末30を識別するための識別情報でもある。「出力箇所」は、広告主が希望する広告出力箇所を示す。具体的には、広告入札装置40は、応答生成装置100から所定の部分の判定ツリーを取得し、取得した判定ツリーを広告主に提示することにより、広告主は、かかる判定ツリーを参考に、広告を出力したい出力箇所として、任意の検出ノードに対応するノードIDを選択する。つまり、広告主は、選択した検索ノード(出力メッセージ)に対する応答メッセージとして自身の広告情報を出力するよう指定する。
「広告キーワード」は、広告主によって設定されるキーワードである。例えば、広告主は、広告したい商品や情報を特徴づける言葉を広告キーワードとして設定する。「広告タグ」は、どのような人に対して広告したいかといった広告対象を示す。
すなわち、図4では、広告ID「C01」によって識別される広告主(例えばA店とする)は、ノードID「N9」に対する応答メッセージとして、「A店のキーマカレーすごくおいしいです」といった広告データを出力するよう指定している。また、ユーザが「キーマカレー」を含むメッセージを入力した場合に、そのユーザが大阪地方に関係するユーザであれば、出力するよう指定していることを示す。
図3に戻って説明を続ける。制御部43は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告入札装置40の内部の記憶装置に記憶されている各種プログラム(広告入札プログラムの一例に相当)がRAM(Random Access Memory)を作業領域として実行されることにより実現される。また、制御部43は、例えば、ASIC(Application Specific Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部43は、入札受付部44と、提示部45とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部43の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部43が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
入札受付部44は、広告主端末30に所定の入札画面を提示することにより、広告主から、希望する広告出力箇所を示す検出ノードIDと、広告キーワード、広告タグと、広告データとを含む広告情報の入札を受け付ける。そして、入札受付部44は、広告IDを払い出し、払い出した広告IDに受け付けた広告情報に含まれる検索ノードIDと、広告キーワードと、広告タグと、広告データとを対応付けて広告情報記憶部42に格納する。なお、入札受付部44は、必ずしもノードIDと、広告キーワード、広告タグの全てを受け付ける必要はなく、少なくともいずれか一つを受け付けていればよい。
提示部45は、応答生成装置100からの広告取得要求に応じて広告情報を検索し、検索した広告情報に含まれる広告データを提示する。具体的には、提示部45は、応答生成装置100から検索ノードIDやユーザ特性を受け付けた場合に、かかる検索ノードIDと一致する出力箇所が設定されている広告情報を検索する。なお、提示部45は、検索により複数の広告情報を得た場合には、例えば、それら広告情報のうち、受け付けた検索キーワード及びユーザ特性を満たす広告情報を特定することにより絞り込む。そして、提示部45は、検索した広告情報に含まれる広告データを応答生成装置100に対して提示する。なお、後述するが検索キーワードとは、応答生成装置100によって入力メッセージに含まれる所定のキーワードが、広告情報検索のための検索キーワードとして設定される。
〔3−2.応答生成装置の構成〕
次に、図5を用いて、実施形態にかかる応答生成装置100について説明する。図5は、実施形態にかかる応答生成装置100の構成例を示す図である。図5に示すように、応答生成装置100は、通信部110と、判定情報記憶部120と、制御部130とを有する。
通信部110は、例えば、NIC等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続される。
判定情報記憶部120は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。そして、判定情報記憶部120は、ユーザによる応答メッセージに対する応答メッセージを判定するための判定情報を記憶する。判定情報は、入力メッセージに対応する処理手順が定められた検出ノードと、応答メッセージに対応する処理手順が定められた動作ノードと、検出ノードと動作ノードとの接続関係を示すエッジとから構成されるツリー構造のデータである。
ここで、図6に実施形態にかかる判定情報記憶部120の一例を示す。図6に示した例では、各ノードを識別するノードIDと、ノードの種別を示すノード種別と、メッセージに対応する処理手順を示す処理内容とを関連付けて記憶する。また、判定情報記憶部120には、各ノードがどのノードと接続されているかを示す情報が登録されているものとする。例えば、判定情報記憶部120には、ノードID「N1」のノードと、ノードID「N2」、「N3」のノードとが接続され、ノードID「N1」のノードからノードID「N2」、「N3」に遷移する確率である遷移確率がそれぞれ「0.5」であるものとする。この結果、判定情報記憶部120は、図7に示すツリー構造のデータを記憶することとなる。
図7は、判定情報記憶部120に記憶されるツリー構造の模式図である。図7に示される破線ブロックは、検出ノードを示しており、実線ブロックは動作ノードを示している。また、これらのブロックには、ノードIDが付されている。また、各ブロック同士を繋ぐ矢印は、エッジを示しており、具体的には、始点(矢がない側)が接続元ノードを示し、終点(矢がある側)が接続先ノードを示している。例えば、ノードID「N1」のノードとノードID「N2」のノードとを接続する矢印は、接続元ノードがノードID「N1」の検出ノードであり、接続先ノードがノードID「N2」の動作ノードであることを示している。
また、図7に模式した判定ツリーは、判定情報記憶部120が記憶する検出ノードや動作ノードのうち一部のノードのみを表したものであり、各ノードには図6や図7に示すノード以外にも、各種の検出ノードや動作ノードが接続されているものとする。
図5に戻って説明を続ける。制御部130は、例えば、CPUやMPU等によって、応答生成装置100の内部の記憶装置に記憶されている各種プログラム(応答生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASICやFPGA等の集積回路により実現される。
図5に示すように、制御部130は、受信部131と、特定部132と、変形部133と、出力制御部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図5に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図5に示した接続関係に限られず、他の接続関係であってもよい。
受信部131は、上述したように、ユーザ端末10、APIサーバ装置60、音声合成装置70から各種情報を受信する。また、受信部131は、図示しない外部装置によって作製された判定情報を受信し、判定情報記憶部120に格納する。また、受信部131は、音声認識装置20から音声テキストとユーザ特性を受け付ける。そして、受信部131は、受け付けたユーザ特性を変形部133へ送信する。
特定部132は、ユーザとの会話の特徴に関する特徴情報を特定する。具体的には、特定部132は、かかる特徴情報として、会話の進め方の傾向に応じたユーザ特性を特定する。
なお、図1でも説明したように、応答生成装置100は、音声認識装置20によって音の特徴情報から特定されたユーザ特性を用いて、以下に示す変形処理を行ってもよい。また、応答生成装置100は、特定部132によって特定されたユーザ特性と、音声認識装置20によって特定されたユーザ特性の両方を用いて、以下に示す変形処理を行ってもよい。
特定部132が、会話の進め方の傾向からユーザ特性を特定するには、例えば、以下に示す第1の特定方法がある。具体的には、特定部132は、応答生成装置100によって使用されるノードに基づいて会話の進め方の傾向を特定する。応答生成装置100によって使用されるノードとは、例えば、入力メッセージを受け付けたことによる対応する検出ノードの使用や、かかる入力メッセージに対する応答メッセージに対応する動作ノードの使用である。
第1の特定方法として、特定部132は、一連の会話の中で、応答生成装置100が検出ノード、または、動作ノードを使用するたびに、その使用回数をノード毎に計数する。そして、特定部132は、使用回数に基づく会話の進め方の傾向に基づくユーザ特性を特定する。具体的には、特定部132は、一連の会話の中で、応答生成装置100によって使用された各ノードにおいて、使用回数が所定の閾値より少ないか多いかに基づく会話傾向から、ユーザ特性を特定する。例えば、特定部132は、閾値に「特定回数:2回」を設定し、これに基づいて、「特定回数:2回未満→会話傾向:話題が切り替わりにくい→性格:無駄話嫌い」、「特定回数:2回以上→会話傾向:話題が切り替わりやすい→性格:無駄話好き」といった判定基準を設定することにより、特定部132は、計数結果と判定基準を比較し、ユーザ特性を特定する。
例えば、所定のノードが使用される回数が多いということは、無駄話を好む傾向等により、ユーザは応答生成装置100と何度も同じ内容の会話をしていることが予測できる。つまり、無駄話好きな性格であるほどこのような傾向にあるといえる。一方、所定のノードが使用される回数が少ないということは、無駄話を好まない傾向、判定ツリーに忠実な会話が行われたことが予測できる。つまり、無駄話嫌いな性格であるほどこのような傾向にあるといえる。
第2の特定方法として、特定部132は、一連の会話の中で、広告情報を検索するまでに、応答生成装置100によって使用されたノードの総数に基づく会話傾向からユーザ特性を特定する。具体的には、特定部132は、一連の会話の中で、応答生成装置100によって使用されたノードの総数に閾値を設定しており、その閾値より総数が少ないか多いかに基づく会話傾向から、ユーザ特性を特定する。
例えば、一連の会話の中で、応答生成装置100によって使用されたノード総数が多いほど、会話が盛り上がったために、会話が長引いたことが予測できる。つまり、無駄話好きな性格であるほどこのような傾向にあるといえる。一方、ノード総数が少ないほど、無駄のない短い会話であることが予測できる。つまり、無駄話嫌いな性格であるほどこのような傾向にあるといえる。
第3の特定方法として、特定部132は、応答生成装置100によって使用されたノードの組合せに基づく会話傾向からユーザ特性を特定する。具体的には、上記第1の特定方法によって、「無駄話嫌い」と特定された場合であっても、ノードの組合せによっては「無駄話好き」と特定した方が妥当である場合がある。例えば、「カレー」に関す会話において、「サッカー」に関するメッセージが入力された場合には、そのようなメッセージを入力したユーザは、「無駄話好き」と特定した方が妥当である。つまり、「無駄話好き」であるために、話題を変えてさらに様々な会話を行おうとしていることが予測できる。
具体的な処理としては、特定部132は、入力メッセージが対話文脈に沿っているか否かを示す指数を、各ノードに対応付けられているカテゴリに基づいて算出し、その値が所定値より小さいほど対話文脈から外れた入力メッセージであるとし、そのようなメッセージを入力したユーザを「無駄話好き」と特定する。
なお、カテゴリとは、話題の分類を示し、カレーの話、六本木の話といった様々なカテゴリが存在する。例えば、カテゴリ「カレーの話」が対応付けられたノードから成る一連の会話において、カテゴリ「六本木の話」を有する検出ノードが応答生成装置100によって使用された場合、その検出ノードに対応する入力メッセージは、対話文脈から外れているといえる。特定部132は、このように対話文脈から外れている度合いを数値化し、その数値が所定値より小さい場合には、そのようなメッセージを入力したユーザを「無駄話好き」と特定する。
第4の特定方法として、特定部132は、応答メッセージが出力制御されてから新たな入力メッセージをユーザから受け付けるまでの時間に基づく会話傾向からユーザ特性を特定する。つまり、特定部132は、ノードが使用されるたびに、次のノードを使用されるまでの時間を計測する。そして、特定部132は、この操作を会話が終了するまで各ノードについて行い、広告を検索する時点における各ノード間の平均時間を算出する。具体的には、特定部132は、平均時間に閾値を設定しており、その閾値より算出した平均時間が少ないか多いかに基づく会話傾向から、ユーザの性格を判定する。
例えば、一連の会話の中で、特定部132によって算出された平均時間が長いほど、会話が盛り上がったために、会話が長引いたことが予測できる。つまり、無駄話好きな性格であるほどこのような傾向にあるといえる。一方、平均時間が短いほど、無駄のない短い会話であることが予測できる。つまり、無駄話嫌いな性格であるほどこのような傾向にあるといえる。
第5の特定方法として、特定部132は、応答生成装置100によって、最初のノードが使用されてから広告情報を検索するまでの所要時間を計測する。そして、特定部132は、上述してきた特定例と同様に、所要時間に閾値を設定することにより、計測した所要時間がその閾値より少ないか多いかに基づく会話傾向からユーザ特性を特定する。
最後に、第6の特定例として、特定部132は、第1〜第5の特定方法を合わせて用いることにより、総合的にユーザ特性を特定する。
特定部132は、以上のような方法を用いてユーザ特性を特定する。そして、特定部132は、特定したユーザ特性を変形部133へ送信する。
一方、音声認識装置20が音の特徴情報としてユーザ特性を特定するには、例えば、以下に示す方法がある。具体的には、音声認識装置20は、ユーザ端末10から受信した音声データを解析することにより、音の特徴情報としてユーザ特性を特定する。つまり、音声認識装置20は、音声データ解析により音声波形を生成する。そして、応答生成装置100は、生成した音声波形のピーク形状や周波数等を所定の情報と照合することにより、ユーザ特性を特定する。例えば、音の特徴情報から得られるユーザ特性としては、年齢、性別、性別、感情、方言、体調等がある。そして、音声認識装置20は、音声テキストと共に、特定したユーザ特性を応答生成装置100へ送信する。音声認識装置20からユーザ特性を受信した、応答生成装置100の受信部131は、かかるユーザ特性を変形部133へ送信する。
変形部133は、音声認識装置20や特定部132によって特定されたユーザ特性に基づいて、応答メッセージの内容を変形する。まず、変形部133は、ユーザ特性を受信した場合に、応答メッセージを取得する。
ここで、応答生成装置100は、受信部131から音声テキスト及びユーザ情報を受け付けた場合は、音声テキストと判定情報記憶部121に記憶された情報(判定ツリー)とを用いて、応答メッセージを選択する。例えば、検索部132は、音声テキストを受け付けた場合に、かかる音声テキストに含まれているキーワードを有する検出ノードを判定し、判定した検出ノードと接続された動作ノードに対応する応答メッセージが出力されるよう、かかる応答メッセージのデータを出力制御する。続いて、検索部132は、この応答メッセージに対する入力メッセージの音声テキストを受け付けた場合に、かかる動作ノードと接続された複数の検出ノードのうち、この音声テキストに含まれているキーワードを有する検出ノードを判定する。そして、検索部132は、判定した検出ノードに接続された動作ノードに対応する応答メッセージのデータを出力制御する。このように、応答生成装置100は、検出ノードと動作ノードを使用してユーザとの会話を実現する。
そして、変形部133は、応答生成装置100によって検出ノードが使用されるたびに、かかる検出ノードに対応する動作ノード(応答メッセージ)となる広告情報を広告入札装置40から取得する。また、広告情報が登録されていない場合には、変形部133は、動作ノードとして判定ツリーに登録されている通常の応答メッセージのデータを取得する。
例えば、変形部133は、広告情報を取得する場合には、応答生成装置100によって使用された検出ノードIDを広告入札装置40へ通知する。ここで、広告入札装置40の提示部45は、応答生成装置100によって通知されたノードIDに対応する広告情報を広告情報記憶部42から検索し、検索した広告情報に含まれる広告データを応答生成装置100に提示する。そして、変形部133は、提示された広告データを取得する。
なお、必ずしも検出ノードのノードIDに基づく検索が行われる必要はない。例えば、変形部133は、入力メッセージに含まれる所定のキーワードを検索キーワードとする。例えば、応答生成装置100が、「キーマカレー好きやわ」といった入力メッセージのテキストを受け付けたとすると、変形部133は、「キーマカレー」を検索キーワードとする。そして、変形部133は、検索キーワードとユーザ特性とを広告入札装置40へ送信する。ここで、広告入札装置40の提示部45は、検索キーワードと広告キーワードが一致し、かつ、ユーザ特性と広告タグが一致する広告情報を広告情報記憶部42から検索し、検索した広告情報に含まれる広告データを応答生成装置100に提示する。また、提示部45は、通知された検出ノードIDに基づいて検索を行った場合、複数の広告情報が得られた際には、検索キーワードとユーザ特性を用いることにより広告情報を絞り込んでもよい。
以下では、変形部133は、出力時における音声の特徴が、特定されたユーザ特性に対応する音声の特徴と同様の特徴となるように、応答メッセージの内容を変形する例について説明する。具体的には、音声認識装置20によって特定されたユーザ特性に応じて、通常の応答メッセージの内容(以下、「応答文」と表記する場合がある)、及び、広告データの内容を変形する例について図7を用いて説明する。
まず、ユーザU01が、例えば、「カレーめっちゃ好きやわ」といったメッセージを入力したことにより、音声認識装置20は、ユーザ特性「大阪弁」を特定したものとする。そして、応答生成装置100は、音声認識装置20から音声テキストと、ユーザ特性「大阪弁」を受け付けたことにより、検出ノードID「N1」を使用したとする。また、応答生成装置100の受信部131は、ユーザ特性「大阪弁」を変形部133へ送信する。
ここで、応答生成装置100の変形部133は、応答生成装置100によって検出ノードID「N1」が使用されたことにより、検出ノードID「N1」に対する広告情報が広告入札装置40に登録されている場合には、その広告情報に含まれる広告データを取得する。ここでは、広告情報の登録がなく、変形部133は、動作ノードID「N3」に対応する通常の応答メッセージを取得したとする。かかる場合に、変形部133は、取得した応答メッセージをユーザ特性「大阪弁」に合わせて大阪弁の文章に変形する。具体的には、変形部133は、「どこのカレー?六本木?」を「どこのカレーなん?六本木?」と変形する。そして、変形部133は、変形した応答メッセージのデータを出力制御部134へ送信する。さらに、この応答メッセージに対して、ユーザU01によってメッセージが入力されたことにより、応答生成装置100が検出ノードID「N5」を使用した場合に、変形部133は、広告入札装置40に広告情報の登録がないため、動作ノードID「N8」に対応する通常の応答メッセージを取得したとする。かかる場合に、変形部133は、取得した応答メッセージ「どんなカレーが好き?」を「どんなカレーが好きなん?」と変形する。そして、変形部133は、変形した応答メッセージのデータを出力制御部134へ送信する。
さらに、この応答メッセージに対して、ユーザU01によってメッセージが入力されたことにより、応答生成装置100が検出ノードID「N9」を使用した場合に、変形部133は、検出ノードID「N9」に対する広告情報が広告入札装置40に登録されていることにより、その広告情報に含まれる広告データを広告入札装置40から取得する。具体的には、変形部133は、検出ノードID「N9」を広告入札装置40へ通知することにより、対応する広告データを取得する。例えば、図4では、検出ノードID「N9」を登録している広告主が2つ存在する。ここで、広告入札装置40の提示部45は、変形部133によって設定された検索キーワード「キーマカレー」とユーザ特性「大阪弁」とを受け付け、これらに対応する広告情報を検索し、「C01」を得る。そして、提示部45は、広告データ「A店のキーマカレーすごくおいしいです」を提示する。
変形部133は、提示部45によって提示された広告データ「A店のキーマカレーすごくおいしいです」を取得し、ユーザ特性「大阪弁」に合わせて大阪弁の文章に変形する。具体的には、変形部133は、「A店のキーマカレーすごくおいしいです」を「A店のキーマカレーめっちゃうまいで!」と変形する。そして、変形部133は、変形した広告データを出力制御部134へ送信する。
なお、変形部133は、変形した応答メッセージ応じてイントネーションも変形してもよい。例えば、変形部133は、ユーザ特性「大阪弁」に基づいて変形した場合には、変形した応答メッセージを「大阪弁」のイントネーションに変形する。
出力制御部134は、変形部133によって変形された応答メッセージの応答データを受け付けた場合に、受け付けた応答データを音声合成装置70に送信して中間表現(例えば、再生波形のデータ)を受信する。そして、出力制御部134は、受信した中間表現や応答データのテキストを応答生成装置100へ送信する。また、応答生成装置100は、受信した中間表現や応答データのテキストをユーザ端末10へ送信する。
〔4.応答生成処理フロー〕
次に、図8を用いて、実施形態にかかる応答生成装置100による応答生成処理について説明する。図8は、実施形態にかかる応答生成装置100による応答生成処理手順を示すシーケンス図である。
図8に示すように、まず、ユーザ端末10が、ユーザの発話に関する音声を受信する(ステップS201)。そして、ユーザ端末10は、受信した音声データを音声認識装置20へ送信する(ステップS202)。音声認識装置20は、音声データを受信した場合に、かかる音声データをテキストデータに変換すると共に、音の特徴情報としてユーザ特性を特定する(ステップS203)。そして、音声認識装置20は、音声テキストと特定したユーザ特性をユーザ端末10へ送信する(ステップS204)。ユーザ端末10は、受け付けた音声テキストとユーザ特性を応答生成装置100へ送信する(ステップS205)。
ここで、応答生成装置100は、会話の進め方の傾向としてユーザ特性を特定する処理を行う(ステップS206)。例えば、応答生成装置100の特定部132は、上述した第1〜第6の特定方法によってユーザ特性を特定する。なお、音声認識装置20によってユーザ特性が特定される場合には、応答生成装置100の特定部132は、ユーザ特性の特定処理を行わなくてもよい。
続いて、応答生成装置100の変形部133は、ユーザ特性を受け付けると、出力する応答メッセージとなる広告情報を取得する(ステップS207)。なお、広告情報が登録されていない場合には、通常の応答メッセージを取得する。そして、変形部133は、取得した応答メッセージの内容をユーザ特性に基づいて変形し(ステップS208)、変形した応答メッセージがユーザ端末10によって出力されるよう出力制御する(ステップS209)。
〔5.変形例〕
上述した実施例にかかる応答生成装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、応答生成装置100の他の実施例について説明する。
〔5−1.変形処理(1)〕
上述してきた応答生成装置100の変形部133は、応答メッセージが通常の応答文であっても、また、広告文であってもユーザ特性に基づき、その内容を変形する例を示した。しかし、変形部133は、特定されたユーザ特性に対応する音声の特徴とは異なる音声の特徴となるよう、応答メッセージとしての広告情報の内容を変形してもよい。例えば、音声認識装置20によってユーザ特性「標準語」が特定された場合に、変形部133は、広告文のみを「標準語」とは異なる方言の文章に変形する。この点について、図9を用いて説明する。
図9は変形例にかかる判定ツリーの一例を示す図である。例えば、所定のユーザとして、ユーザU02がメッセージを入力したことにより、音声認識装置20は、ユーザ特性「標準語」を特定したものとする。そして、応答生成装置100は、音声認識装置20から音声テキストと、ユーザ特性「標準語」を受け付けたことにより、検出ノードID「N1」を使用したとする。また、応答生成装置100の受信部131は、ユーザ特性「大阪弁」を変形部133へ送信する。
ここで、変形部133は、応答生成装置100によって検出ノードID「N1」が使用されたことにより、検出ノードID「N1」に対する広告情報が広告入札装置40に登録されている場合には、その広告情報に含まれる広告データを取得する。ここでは、広告情報の登録がなく、動作ノードID「N3」に対応する通常の応答メッセージを取得したとする。変形部133は、取得した応答メッセージの変形は行わず、そのまま出力制御部134へ送信する。さらに、この応答メッセージに対して、ユーザU02によってメッセージが入力されたことにより、応答生成装置100が検出ノードID「N5」を使用した場合に、変形部133は、広告入札装置40に広告情報の登録がないため、動作ノードID「N8」に対応する通常の応答メッセージを取得したとする。変形部133は、取得した応答メッセージの変形は行わず、そのまま出力制御部134へ送信する。
さらに、この応答メッセージに対して、ユーザU02によってメッセージが入力されたことにより、応答生成装置100が検出ノードID「N9」を使用した場合に、変形部133は、検出ノードID「N9」に対する広告情報が広告入札装置40に登録されていることにより、その広告情報に含まれる広告データを取得する。具体的には、変形部133は、検出ノードID「N9」を広告入札装置40へ通知することにより、対応する広告データを取得する。例えば、変形部133は、広告ID「C01」に対応する広告データ「A店のキーマカレーすごくおいしいです」を取得したとする。ここで、変形部133は、例えば、ユーザ特性「標準語」とは異なる「大阪弁」に広告データを変形する。具体的には、変形部133は、広告データ「A店のキーマカレーすごくおいしいです」を「A店のキーマカレーめっちゃうまいで!」と変形する。そして、変形部133は、変形した広告データを出力制御部134へ送信する。
なお、ここでは、ユーザU02の使用する方言とは異なる方言として「大阪弁」を例示したが、これに限るものではない。例えば、変形部133は、ユーザ特性として「無駄話嫌い」を受け付けた場合には、広告文をあえて長い文章に変形してもよい。この場合、変形部133は、例えば、広告文が所定の製品を広告する内容であるなら、詳細情報や店舗情報等を追加することにより広告文を長く変形する。また、変形部133は、ユーザ特性として「落ち込んでいる」を受け付けた場合には、広告文をあえて友好的な明るい文章に変形したり、明るいイントネーションに変形する。
このように、応答生成装置100は、特定されたユーザ特性とは異なるユーザ特性に基づく変形を広告文に対してのみ行う。これにより、応答生成装置100は、ユーザに対して広告を印象付けることができ、広告効果を高めることができる。例えば、応答生成装置100とユーザとの標準語の会話の中で、所定の応答メッセージだけが大阪弁で出力されたとすると、その応答メッセージはユーザに対して印象に残る可能性が高いといえる。また、応答生成装置100は、このような意外性を利用することにより、ユーザとの会話を盛り上げることもできる。
〔5−2.変形処理(2)〕
また、上記実施形態において応答生成装置100の特定部132は、出力予定の広告情報を予測し、予測した広告情報の内容から、かかる広告情報の特徴を特定し、変形部133は、特定部132によって特定された広告情報の特徴に基づいて、応答メッセージを変形してもよい。この点について、図10を用いて説明する。
まず、特定部132は、応答生成装置100とユーザとの会話の経過に基づいて出力予定の広告情報を予測する。具体的には、特定部132は、判定ツリーを用いて、応答生成装置100によって使用されたノードの経過から、将来、応答生成装置100によって使用されるノードを予測する。例えば、特定部132は、応答生成装置100によってノードが使用されるたびに、使用されたノードを記憶する。そして、特定部132は、応答生成装置100とユーザとの間でメッセージのやり取りが進むことにより、所定数のノードを記憶した時点で、応答生成装置100によって将来使用される検出ノードを予測する。
そして、特定部132は、予測した検出ノードに対する広告情報が広告入札装置40に登録されている場合には、その広告情報を出力予定の広告情報とし、その広告情報に含まれる広告データを取得する。そして、特定部132は、取得した広告データの内容から、かかる広告データの特徴を特定し、特定した特徴と予測したノードのノードIDとを変形部133に通知する。
ここで、図10を用いて説明する。図10は変形例にかかる判定ツリーの一例を示す図である。例えば、特定部132は、ノードID「N1」が使用された時点で、ノードID「01」よりも先に存在するノード(すなわち、ノードID「01」を根ノードとした際の葉ノード)を抽出し、抽出したノードに、広告検索を行わせるノードが含まれるか判定する。図10に示す例では、特定部132は、ノードID「N9」が示すノードを特定する。そして、特定部132は、特定したノードのノードID「N9」を広告入札装置40へ通知し、広告入札装置40による検索によって、ノードID「N9」に対応する広告情報が存在する場合には、その広告情報を出力予定の広告情報とする。ここでは、広告入札装置40によって、出力予定の広告情報として広告データ「B店のキーマカレーめっちゃうまいで!」が検索されたとし、特定部132は、かかる広告データを取得する。
ここで、特定部132は、取得した広告データ「B店のキーマカレーめっちゃうまいで!」の特徴として「大阪弁」であることを特定したとする。特定部132は、特定した広告情報の特徴「大阪弁」と、ノードID「N9」とを変形部133に通知する。なお、特定部132は、必ずしも方言等の地域に関する特徴を特定する必要はない。かかる特徴は、例えば、性別、性格、メッセージ長さ、抑揚等に関する特徴であってもよい。
変形部133は、特定部132から広告情報の特徴とノードIDを受け付けた場合に、出力予定の応答メッセージのうち、特定部132によって予測された出力予定の広告情報が出力されるまでの応答回数が所定の閾値を超える応答メッセージの内容を広告情報の特徴に基づいて変形する。
例えば、変形部133は、出力予定の広告情報が出力されるまでの応答回数に閾値「1回」を設定しているものとする。上述したように、特定部132は、ノードID「N1」の時点で、将来は、応答生成装置100によってノードID「N9」が使用されると予測したとすると、変形部133は、判定ツリーを用いることにより、かかる閾値「1回」を超える応答メッセージとして、ノードID「N1」からカウントすることによりノードID「N8」を特定する。なお、変形部133は、ノードID「N1」からカウントして1回目の応答メッセージであるノードID「N3」は閾値に含まれるため除外する。
ここで、変形部133は、特定したノードID「N8」に対応する応答メッセージ「どんなカレーが好き?」を取得し、広告情報の特徴「大阪弁」に合わせて「どんなカレーが好きなん?」と変形する。また、変形部133は、文章の変形に伴い、イントネーションも変形してもよい。
このように、応答生成装置100は、出力予定の広告情報を予測し、予測した広告情報の特徴を特定し、特定した特徴に基づいて、予測した広告情報までの出力予定の応答メッセージの内容を変形する。これにより、応答生成装置100は、自然な流れでユーザとの会話の中に、広告情報を応答メッセージとして出力することができる。
なお、かかる変形例では、広告情報の特徴に合わせて応答メッセージを変形する例を示したが、広告情報の特徴とは異なる特徴に変形してもよい。例えば、広告情報の特徴「明るい抑揚」に対して、変形部133は、その広告情報までの出力予定の応答メッセージの内容を「暗い抑揚」に変形する。これにより、応答生成装置100は、ユーザに対して広告情報を印象付けることができ、広告効果を高めることができる。
〔5−3.検索処理〕
上述してきた応答生成装置100の変形部133は、応答メッセージを変形するにあたって、検出ノードに対する広告情報が広告入札装置40に登録されている場合には、かかる広告情報を変形対象として取得し、登録されていない場合には、判定ツリーに登録されている通常の応答メッセージを変形対象として取得する例を示した。しかし、変形部133は、遷移確立に基づいて、変形する応答メッセージを取得してもよい。例えば、応答生成装置100によって、所定の検出ノードに対して、通常の応答メッセージに対応する動作ノードと、広告用の動作ノードが遷移確立と共に紐付られているとする。ここで、変形部133は、遷移確立に基づき、通常の応答メッセージに対応する動作ノードを選択した場合には、その動作ノードに対応する応答メッセージを変形し、広告用の動作ノードを選択した場合には、その広告用の動作ノードに含めるための広告情報を広告入札装置40から取得する。取得方法は、上述してきたように、検出ノードIDを用いたものであってもよいし、検索キーワード及びユーザ特性を用いたものであってもよい。
〔5−4.広告主による変形処理〕
上記実施形態では、変形部133によって応答メッセージの内容が変形される例を示した。しかし、広告主がユーザ特性に応じた広告情報を複数入札しておくことで、変形部133は、受け付けたユーザ特性と一致するユーザ特性に対応付けられた広告データを取得し、変形することなく出力制御させてもよい。
例えば、広告主は、広告情報として大阪弁用の広告データと、無駄話好きな人用の広告データを入札しておく。ここで、変形部133は、ユーザ特性「無駄話好き」を受け付けたとする。そして、広告入札装置40は、変形部133から送信されたユーザ特性「無駄話好き」に基づいて、かかる広告主の広告情報に含まれる広告データのうち、無駄話好きな人用の広告データ取得し、変形部133に提示する。そして、変形部133は、その広告データを取得する。このような広告データは、特定部132によって特定されたユーザ特性に対応しているので、変形部133が変形を行う必要はない。したがって、変形部133は、取得した広告データを変形することなく、出力制御部134へ送信する。
〔5−5.装置構成(1)〕
上記実施形態では、応答生成装置100は、音声認識装置20によって特定された音の特徴情報としてのユーザ特性に基づいて、変形処理を行う例を示した。しかし、応答生成装置100が音の特徴情報としてのユーザ特性を特定してもよい。この場合、応答生成装置100は、音声認識装置20の音声データ解析機能を有することになる。
〔5−6.装置構成(2)〕
また、上記実施形態では、音声認識装置20または応答生成装置100によって、ユーザ特性が特定させる例を示した。しかしながら、実施形態は、これに限定されるものではない。例えば、ユーザ端末10は、上述した特定処理を行い、特定したユーザ特性を応答生成装置100に送信する。そして、応答生成装置100は、ユーザ端末10から受け付けたユーザ特性に基づいて、上述した変形処理を行ってもよい。
〔5−7.ユーザ端末以外の例〕
上記実施形態では、ユーザはユーザ端末10を用いて、応答生成装置100と会話を行う例を示した。しかし、ユーザ端末10の有する応答生成装置100との対話機能が、会話を行うロボットに搭載されていてもよい。これにより、かかるロボットがユーザに代わって応答生成装置100と会話を行うことが実現できる。
〔5−8.プログラム〕
また、上述してきた各実施形態にかかる応答生成装置100は、例えば図11に示すような構成のコンピュータ1000によって実現される。以下、応答生成装置100を例に挙げて説明する。図11は、応答生成装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網50を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網50を介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態にかかる応答生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、判定情報記憶部内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信網50を介してこれらのプログラムを取得してもよい。
〔5−9.その他〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
〔6.効果〕
上述してきたように、実施形態にかかる応答生成装置100は、特定部132と、変形部133と、出力制御部134とを有する。特定部132は、対話エージェントシステムとユーザとの会話の特徴に関する特徴情報を特定する。変形部133は、特定部132によって特定された特徴情報に応じて応答メッセージの内容を変形する。出力制御部134は、変形部133によって内容が変形された応答メッセージを出力するよう制御する。
これにより、実施形態にかかる応答生成装置100は、ユーザと適切な会話を行うことができる。具体的には、応答生成装置100は、ユーザの特性に応じて応答メッセージを変形することによりユーザと自然な会話を行うことができ、また、会話に対するユーザの満足度を高めることができる。
また、実施形態にかかる特定部132は、特徴情報として、ユーザに関するユーザ情報を特定し、変形部133は、特定部によって特定されたユーザ情報に基づいて、応答メッセージの内容を変形する。
これにより、実施形態にかかる応答生成装置100は、ユーザと適切な会話を行うことができる。
また、実施形態にかかる特定部132は、特徴情報として、ユーザの音声の特徴を特定し、変形部133は、出力時における音声の特徴が、特定部132によって特定されたユーザ情報に対応する音声の特徴とは異なる音声の特徴となるように、応答メッセージとしての広告情報の内容を変形する。
これにより、実施形態にかかる応答生成装置100は、ユーザに対して広告情報を印象付けることができるので、広告効果を高めることができる。
また、実施形態にかかる特定部132は、特徴情報として、ユーザの音声の特徴を特定し、変形部133は、出力時における音声の特徴が、特定部132によって特定されたユーザ情報に対応する音声の特徴と同様の特徴となるように、応答メッセージとしての広告情報の内容を変形する。
これにより、実施形態にかかる応答生成装置100は、自然な流れでユーザとの会話の中に、広告情報を応答メッセージとして出力することができる。
応答メッセージとして登録されている所定の広告情報であって、出力予定の広告情報を予測し、予測した広告情報の内容から当該広告情報の特徴を特定し、変形部133は、特定部132によって特定された広告情報の特徴に基づいて、応答メッセージの内容を変形する。
これにより、実施形態にかかる応答生成装置100は、自然な流れでユーザとの会話の中に、広告情報を応答メッセージとして出力することができる。
また、実施形態にかかる変形部133は、出力予定の応答メッセージのうち、特定部132によって予測された広告情報が出力されるまでの応答回数が所定の閾値以下である場合に、応答メッセージの内容を変形する。
これにより、実施形態にかかる応答生成装置100は、自然な流れでユーザとの会話の中に、広告情報を応答メッセージとして出力することができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、特定部は、特定手段や特定回路に読み替えることができる。
10 ユーザ端末
20 音声認識装置
30 広告主端末
40 広告入札装置
42 広告情報記憶部
44 入札受付部
45 提示部
100 応答生成装置
120 判定情報記憶部
130 制御部
131 受信部
132 特定部
133 変形部
134 出力制御部

Claims (8)

  1. 対話エージェントシステムとユーザとの会話の特徴に関する特徴情報を特定する特定部と、
    前記特定部によって特定された特徴情報に応じて応答メッセージの内容を変形する変形部と、
    前記変形部によって内容が変形された応答メッセージを出力するよう制御する出力制御部と、
    を備えたことを特徴とする応答生成装置。
  2. 前記特定部は、前記特徴情報として、前記ユーザに関するユーザ情報を特定し、
    前記変形部は、前記特定部によって特定されたユーザ情報に基づいて、応答メッセージの内容を変形する、
    ことを特徴とする請求項1に記載の応答生成装置。
  3. 前記特定部は、前記特徴情報として、前記ユーザの音声の特徴を特定し、
    前記変形部は、出力時における音声の特徴が、前記特定部によって特定されたユーザ情報に対応する音声の特徴とは異なる音声の特徴となるように、応答メッセージとしての広告情報の内容を変形する、
    ことを特徴とする請求項2に記載の応答生成装置。
  4. 前記特定部は、前記特徴情報として、前記ユーザの音声の特徴を特定し、
    前記変形部は、出力時における音声の特徴が、前記特定部によって特定されたユーザ情報に対応する音声の特徴と同様の特徴となるように、応答メッセージとしての広告情報の内容を変形する、
    ことを特徴とする請求項2に記載の応答生成装置。
  5. 前記特定部は、応答メッセージとして登録されている所定の広告情報であって、出力予定の広告情報を予測し、予測した広告情報の内容から当該広告情報の特徴を特定し、
    前記変形部は、前記特定部によって特定された広告情報の特徴に基づいて、応答メッセージの内容を変形する、
    ことを特徴とする請求項1又は2に記載の応答生成装置。
  6. 前記変形部は、前記出力予定の応答メッセージのうち、前記特定部によって予測された広告情報が出力されるまでの応答回数が所定の閾値以下である場合に、応答メッセージの内容を変形する、
    ことを特徴とする請求項5に記載の応答生成装置。
  7. コンピュータが実行する応答生成方法であって、
    対話エージェントシステムとユーザとの会話の特徴に関する特徴情報を特定する特定工程と、
    前記特定工程によって特定された特徴情報に応じて応答メッセージの内容を変形する変形工程と、
    前記変形工程によって内容が変形された応答メッセージを出力するよう制御する出力制御工程と、
    を含んだことを特徴とする応答生成方法。
  8. 対話エージェントシステムとユーザとの会話の特徴に関する特徴情報を特定する特定手順と、
    前記特定手順によって特定された特徴情報に応じて応答メッセージの内容を変形する変形手順と、
    前記変形手順によって内容が変形された応答メッセージを出力するよう制御する出力制御手順と、
    をコンピュータに実行させることを特徴とする応答生成プログラム。
JP2014167794A 2014-08-20 2014-08-20 応答生成装置、応答生成方法及び応答生成プログラム Active JP6570226B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014167794A JP6570226B2 (ja) 2014-08-20 2014-08-20 応答生成装置、応答生成方法及び応答生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014167794A JP6570226B2 (ja) 2014-08-20 2014-08-20 応答生成装置、応答生成方法及び応答生成プログラム

Publications (2)

Publication Number Publication Date
JP2016045584A true JP2016045584A (ja) 2016-04-04
JP6570226B2 JP6570226B2 (ja) 2019-09-04

Family

ID=55636129

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014167794A Active JP6570226B2 (ja) 2014-08-20 2014-08-20 応答生成装置、応答生成方法及び応答生成プログラム

Country Status (1)

Country Link
JP (1) JP6570226B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2563303A (en) * 2017-06-09 2018-12-12 Google Llc Validate modification of audio-based computer program output
WO2019065688A1 (ja) * 2017-09-28 2019-04-04 株式会社トラヴォス 対話式健康促進システム、対話式学習促進システム、対話式購入促進システム
JP2019125357A (ja) * 2017-12-22 2019-07-25 サウンドハウンド,インコーポレイテッド インタラクティブなエクスペリエンスに適合させた自然言語文法
US10600409B2 (en) 2017-06-09 2020-03-24 Google Llc Balance modifications of audio-based computer program output including a chatbot selected based on semantic processing of audio
US10652170B2 (en) 2017-06-09 2020-05-12 Google Llc Modification of audio-based computer program output
US10657173B2 (en) 2017-06-09 2020-05-19 Google Llc Validate modification of audio-based computer program output
JPWO2019026395A1 (ja) * 2017-08-01 2020-06-25 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020160640A (ja) * 2019-03-26 2020-10-01 本田技研工業株式会社 ライドシェアサーバ装置、情報処理システム、エージェントシステム、ライドシェアサーバ装置の制御方法、およびプログラム
US11900928B2 (en) 2017-12-23 2024-02-13 Soundhound Ai Ip, Llc System and method for adapted interactive experiences

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001338203A (ja) * 2000-05-24 2001-12-07 Sony Corp 情報配信システム及び情報配信方法、並びに、記憶媒体
JP2003256419A (ja) * 2001-12-28 2003-09-12 Fujitsu Ltd 対話方法、対話装置、対話プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP2004109323A (ja) * 2002-09-17 2004-04-08 Denso Corp 音声対話装置及びプログラム
JP2008170817A (ja) * 2007-01-12 2008-07-24 Toyota Motor Corp 対話制御装置、対話制御方法及び対話制御プログラム
JP2012118623A (ja) * 2010-11-29 2012-06-21 Nec Corp 広告配信システム、広告配信方法及び広告配信プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001338203A (ja) * 2000-05-24 2001-12-07 Sony Corp 情報配信システム及び情報配信方法、並びに、記憶媒体
JP2003256419A (ja) * 2001-12-28 2003-09-12 Fujitsu Ltd 対話方法、対話装置、対話プログラム及びこれを記録したコンピュータ読み取り可能な記録媒体
JP2004109323A (ja) * 2002-09-17 2004-04-08 Denso Corp 音声対話装置及びプログラム
JP2008170817A (ja) * 2007-01-12 2008-07-24 Toyota Motor Corp 対話制御装置、対話制御方法及び対話制御プログラム
JP2012118623A (ja) * 2010-11-29 2012-06-21 Nec Corp 広告配信システム、広告配信方法及び広告配信プログラム

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2563303A (en) * 2017-06-09 2018-12-12 Google Llc Validate modification of audio-based computer program output
US11582169B2 (en) 2017-06-09 2023-02-14 Google Llc Modification of audio-based computer program output
US10855627B2 (en) 2017-06-09 2020-12-01 Google Llc Modification of audio-based computer program output
US10600409B2 (en) 2017-06-09 2020-03-24 Google Llc Balance modifications of audio-based computer program output including a chatbot selected based on semantic processing of audio
US10614122B2 (en) 2017-06-09 2020-04-07 Google Llc Balance modifications of audio-based computer program output using a placeholder field based on content
US10652170B2 (en) 2017-06-09 2020-05-12 Google Llc Modification of audio-based computer program output
US10657173B2 (en) 2017-06-09 2020-05-19 Google Llc Validate modification of audio-based computer program output
JPWO2019026395A1 (ja) * 2017-08-01 2020-06-25 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2020184384A (ja) * 2017-09-28 2020-11-12 株式会社トラヴォス 対話式健康促進システム、対話式学習促進システム、対話式購入促進システム
JP2022000807A (ja) * 2017-09-28 2022-01-04 株式会社トラヴォス 対話式健康促進システム、対話式学習促進システム、対話式購入促進システム
WO2019065688A1 (ja) * 2017-09-28 2019-04-04 株式会社トラヴォス 対話式健康促進システム、対話式学習促進システム、対話式購入促進システム
JP2020091907A (ja) * 2017-12-22 2020-06-11 サウンドハウンド,インコーポレイテッド インタラクティブなエクスペリエンスに適合させた自然言語文法
JP2019125357A (ja) * 2017-12-22 2019-07-25 サウンドハウンド,インコーポレイテッド インタラクティブなエクスペリエンスに適合させた自然言語文法
JP7129439B2 (ja) 2017-12-22 2022-09-01 サウンドハウンド,インコーポレイテッド インタラクティブなエクスペリエンスに適合させた自然言語文法
JP7178248B2 (ja) 2017-12-22 2022-11-25 サウンドハウンド,インコーポレイテッド インタラクティブなエクスペリエンスに適合させた自然言語文法
US11900928B2 (en) 2017-12-23 2024-02-13 Soundhound Ai Ip, Llc System and method for adapted interactive experiences
JP2020160640A (ja) * 2019-03-26 2020-10-01 本田技研工業株式会社 ライドシェアサーバ装置、情報処理システム、エージェントシステム、ライドシェアサーバ装置の制御方法、およびプログラム

Also Published As

Publication number Publication date
JP6570226B2 (ja) 2019-09-04

Similar Documents

Publication Publication Date Title
JP6570226B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
US11315546B2 (en) Computerized system and method for formatted transcription of multimedia content
US10096319B1 (en) Voice-based determination of physical and emotional characteristics of users
US10819811B2 (en) Accumulation of real-time crowd sourced data for inferring metadata about entities
US10991012B2 (en) Creative brief-based content creation
JP6305274B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム
US11586689B2 (en) Electronic apparatus and controlling method thereof
JP6310796B2 (ja) 制御装置、制御方法および制御プログラム
KR101983635B1 (ko) 개인방송 컨텐츠 추천방법
US20150317699A1 (en) Method, apparatus, device and system for inserting audio advertisement
JP6262613B2 (ja) 提示装置、提示方法及び提示プログラム
JP2014167722A (ja) 商品情報提供システムおよび商品情報提供用プログラム
JP5881647B2 (ja) 判定装置、判定方法及び判定プログラム
JP6440660B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6568263B2 (ja) 装置、方法及びプログラム
KR102226427B1 (ko) 호칭 결정 장치, 이를 포함하는 대화 서비스 제공 시스템, 호칭 결정을 위한 단말 장치 및 호칭 결정 방법
US20230208791A1 (en) Contextual interstitials
US20150180818A1 (en) Interface for Product Reviews Identified in Online Reviewer Generated Content
JP6368025B2 (ja) 装置、方法及びプログラム
JP2011170622A (ja) コンテンツ提供システム、コンテンツ提供方法、およびコンテンツ提供プログラム
Chang et al. Using Machine Learning to Extract Insights from Consumer Data
JP6898064B2 (ja) 対話決定システム、対話決定方法、対話決定プログラム、及び端末装置
JP6791829B2 (ja) 制御装置、制御方法および制御プログラム
JP2021162997A (ja) 情報処理装置及び情報処理方法
JP6553223B2 (ja) 応答生成装置、応答生成方法及び応答生成プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171124

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180420

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180502

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20180706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190524

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190806

R150 Certificate of patent or registration of utility model

Ref document number: 6570226

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350