JP2018041494A - Control device, control method, and control program - Google Patents

Control device, control method, and control program Download PDF

Info

Publication number
JP2018041494A
JP2018041494A JP2017212857A JP2017212857A JP2018041494A JP 2018041494 A JP2018041494 A JP 2018041494A JP 2017212857 A JP2017212857 A JP 2017212857A JP 2017212857 A JP2017212857 A JP 2017212857A JP 2018041494 A JP2018041494 A JP 2018041494A
Authority
JP
Japan
Prior art keywords
advertisement
user
search
information
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017212857A
Other languages
Japanese (ja)
Other versions
JP6791829B2 (en
Inventor
香里 谷尾
Kaori Tanio
香里 谷尾
北岸 郁雄
Ikuo Kitagishi
郁雄 北岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2017212857A priority Critical patent/JP6791829B2/en
Publication of JP2018041494A publication Critical patent/JP2018041494A/en
Application granted granted Critical
Publication of JP6791829B2 publication Critical patent/JP6791829B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a control device, a control method, and a control program for outputting a message suitable for a user.SOLUTION: A control device (response generation device 100) includes: a search section which searches for advertisement information, which is information on an advertisement to be output as a response message, within a search range on the basis of characteristics of sound in interactions between an interactive agent system and a user; and an output control section which controls the advertisement on the advertisement information searched by the search section to be output as a response message. The control device outputs a message suitable for a user.SELECTED DRAWING: Figure 5

Description

本発明は、制御装置、制御方法および制御プログラムに関する。   The present invention relates to a control device, a control method, and a control program.

従来、ユーザ端末からメッセージを受け付けたことに応じて、このメッセージに対応するメッセージをユーザ端末に出力する対話エージェントシステムが知られている。このような対話エージェントシステムにおいて、ユーザ端末から受け付けたメッセージに対して多様なメッセージの出力を行ったり、このユーザ端末のユーザに適したメッセージの出力を行ったりする技術が提供されている。   2. Description of the Related Art Conventionally, there is known an interactive agent system that outputs a message corresponding to a message to the user terminal in response to receiving the message from the user terminal. In such an interactive agent system, there is provided a technique for outputting various messages in response to a message received from a user terminal and outputting a message suitable for the user of the user terminal.

例えば、ユーザのウェブ上の行動履歴に基づいて決定されたユーザ関心カテゴリと、各ノードに対応するメッセージのカテゴリとに基づいて、ユーザに負担をかけることなく、ユーザの趣向に即して対話エージェントシステムの対話ルールを変更する技術が提案されている。   For example, based on the user interest category determined based on the user's behavior history on the web, and the message category corresponding to each node, the conversation agent according to the user's preference without imposing a burden on the user Techniques for changing the system interaction rules have been proposed.

特開2013−12012号公報JP 2013-122012 A 特開2008−299753号公報JP 2008-299753 A

しかしながら、上記の従来技術では、ユーザに適したメッセージが出力されるとは限らない。例えば、上記の従来技術では、無駄話を好まないユーザに対して、対話文脈から外れた応答メッセージを出力することにより、かかるユーザに不快感を与えてしまう可能性がある。このように、上記の従来技術では、ユーザに適したメッセージが出力されるとは限らない。   However, the above-described conventional technology does not always output a message suitable for the user. For example, in the above-described conventional technology, there is a possibility that a user who does not like a useless talk may be given an unpleasant feeling by outputting a response message out of the conversation context. Thus, in the above-described conventional technology, a message suitable for the user is not always output.

本願は、上記に鑑みてなされたものであって、ユーザに適したメッセージを出力することができる応答生成装置を提供することを目的とする。   The present application has been made in view of the above, and an object thereof is to provide a response generation apparatus capable of outputting a message suitable for a user.

本願にかかる、制御装置は、対話エージェントシステムとユーザとの会話における音の特徴に基づく検索範囲で、前記応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、を備えることを特徴とする。   The control device according to the present application includes: a search unit that searches for advertisement information that is information related to an advertisement that is output as the response message in a search range based on a sound characteristic in a conversation between a dialog agent system and a user; and the search unit An output control unit that controls to output an advertisement related to the searched advertisement information as a response message.

実施形態の一態様によれば、ユーザに適したメッセージを出力することができる効果を奏する。   According to one aspect of the embodiment, there is an effect that a message suitable for the user can be output.

図1は、実施形態にかかる応答生成処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of a response generation process according to the embodiment. 図2は、実施形態にかかる応答生成システムの構成例を示す図である。FIG. 2 is a diagram illustrating a configuration example of the response generation system according to the embodiment. 図3は、実施形態にかかる広告入札装置の構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of the advertising bid device according to the embodiment. 図4は、実施形態にかかる広告情報記憶部の一例を示す図である。FIG. 4 is a diagram illustrating an example of the advertisement information storage unit according to the embodiment. 図5は、実施形態にかかる応答生成装置の構成例を示す図である。FIG. 5 is a diagram illustrating a configuration example of the response generation device according to the embodiment. 図6は、実施形態にかかる判定情報記憶部の一例を示す図である。FIG. 6 is a diagram illustrating an example of the determination information storage unit according to the embodiment. 図7は、実施形態にかかる判定情報記憶部に記憶されるツリー構造の模式図である。FIG. 7 is a schematic diagram of a tree structure stored in the determination information storage unit according to the embodiment. 図8は、実施形態にかかる検索情報記憶部の一例を示す図である。FIG. 8 is a diagram illustrating an example of a search information storage unit according to the embodiment. 図9は、実施形態にかかる応答生成装置による応答生成処理手順を示すシーケンス図である。FIG. 9 is a sequence diagram illustrating a response generation processing procedure performed by the response generation apparatus according to the embodiment. 図10は、応答生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 10 is a hardware configuration diagram illustrating an example of a computer that implements the function of the response generation apparatus.

以下に、本願にかかる制御装置、制御方法および制御プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願にかかる制御装置、制御方法および制御プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。   Hereinafter, a mode for carrying out a control device, a control method, and a control program according to the present application (hereinafter referred to as “embodiment”) will be described in detail with reference to the drawings. In addition, the control apparatus, the control method, and the control program concerning this application are not limited by this embodiment. In the following embodiments, the same portions are denoted by the same reference numerals, and redundant description is omitted.

〔1.応答生成処理〕
まず、図1を用いて、実施形態にかかる制御装置が実行する応答生成処理の一例について説明する。図1は、実施形態にかかる応答生成処理の一例を示す図である。なお、図1に示すように、本実施形態において制御装置は、音声認識装置20と応答生成装置100とによって構成される。
[1. Response generation process)
First, an example of a response generation process executed by the control device according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of a response generation process according to the embodiment. As shown in FIG. 1, in the present embodiment, the control device includes a voice recognition device 20 and a response generation device 100.

ユーザ端末10は、ユーザによって利用される端末装置である。ユーザ端末10は、例えば、スマートフォンなどの携帯電話機や、タブレット端末や、PDA(Personal Digital Assistant)や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。   The user terminal 10 is a terminal device used by a user. The user terminal 10 is, for example, a mobile phone such as a smartphone, a tablet terminal, a PDA (Personal Digital Assistant), a desktop PC (Personal Computer), a notebook PC, or the like.

音声認識装置20は、ユーザ端末10から受信した入力メッセージ、すなわち、発話の音声データをテキストデータに変換する。また、音声認識装置20は、ユーザ端末10から受信した音声データを解析し、音の特徴情報としてユーザに関する情報を特定する。具体的には、音声認識装置20は、音声データ解析により音声波形を生成する。そして、音声認識装置20は、生成した音声波形のピーク形状や周波数特性等に基づいて、音声を入力したユーザのに関する情報を特定する。   The speech recognition device 20 converts the input message received from the user terminal 10, that is, speech speech data into text data. In addition, the voice recognition device 20 analyzes voice data received from the user terminal 10 and specifies information about the user as sound feature information. Specifically, the voice recognition device 20 generates a voice waveform by voice data analysis. Then, the voice recognition device 20 specifies information related to the user who has input the voice based on the peak shape, frequency characteristics, and the like of the generated voice waveform.

なお、音の特徴情報としてのユーザ情報とは、ユーザの年齢、性別、感情、方言、体調といったユーザ属性に関する情報や、ユーザ周辺の環境音から得られる周辺情報等を含む各種情報である。例えば、音声認識装置20は、音声波形に基づいて、音のテンポや単語と単語との間隔が所定値より短ければ「せっかち」、長ければ「おっとり」といった性格を判定することができる。また、音声認識装置20は、音声波形における振動の幅、ピーク形状、周波数から、年齢・性別・方言を判定することができる。   The user information as the sound feature information is various information including information on user attributes such as the user's age, gender, emotion, dialect, physical condition, and peripheral information obtained from environmental sounds around the user. For example, the speech recognition apparatus 20 can determine a character such as “impatient” if the sound tempo or the interval between words is shorter than a predetermined value, and “occupy” if it is longer, based on the speech waveform. Further, the speech recognition device 20 can determine the age, sex, and dialect from the vibration width, peak shape, and frequency in the speech waveform.

さらに、音声認識装置20は、テキスト情報からは判定しにくい体調を判定することもできる。例えば、音声認識装置20は、ユーザから咳き込み音を特徴づける音声波形が得られた場合には、ユーザは「風邪気味」であると判定することができる。なお、音声認識装置20は、上述した処理以外にも、任意の手法を用いて、音声からユーザの属性を特定してよい。   Furthermore, the speech recognition apparatus 20 can also determine a physical condition that is difficult to determine from text information. For example, the voice recognition device 20 can determine that the user is “cold” when a voice waveform characterizing the coughing sound is obtained from the user. Note that the speech recognition apparatus 20 may specify user attributes from speech using any method other than the processing described above.

また、音声認識装置20は、ユーザU01周辺の周辺情報を判定することもできる。具体的には、ユーザ端末10は、人間の声だけでなく、バックノイズとしてその周りの環境音も取得するので、結果的に、音声認識装置20は、人間の声に関する音声波形だけでなく、その周りの環境音に関する音声波形も生成することができる。例えば、バックノイズから生成した音声波形が子供の泣き声に対応している場合には、音声認識装置20は、ユーザU01には「小さな子供がいる」といった周辺情報を判定することができる。また、例えば、音声認識装置20は、バックノイズに電車の走行音、駅のアナウンス、出発ベル等の音声が含まれる場合には、ユーザU01が駅に居るといった周辺情報を判定することができる。なお、音声認識装置20は、上述した処理以外にも、任意の手法を用いて、環境音からユーザの周辺情報を判定してよい。   The voice recognition device 20 can also determine the peripheral information around the user U01. Specifically, since the user terminal 10 acquires not only a human voice but also surrounding environmental sounds as back noise, as a result, the voice recognition device 20 not only has a voice waveform related to a human voice, An audio waveform related to the surrounding environmental sound can also be generated. For example, when the speech waveform generated from the back noise corresponds to a child's cry, the speech recognition apparatus 20 can determine peripheral information such as “there is a small child” for the user U01. Further, for example, when the back noise includes a train running sound, a station announcement, a departure bell, or the like, the voice recognition device 20 can determine peripheral information such that the user U01 is at the station. Note that the speech recognition apparatus 20 may determine the surrounding information of the user from the environmental sound using any method other than the above-described processing.

広告主端末30は、広告主によって利用される端末装置である。広告主端末30は、例えば、スマートフォンなどの携帯電話機や、タブレット端末や、PDAや、デスクトップ型PCや、ノート型PC等である。また、広告主端末30は、広告主から受け付けた広告情報を広告入札装置40へ送信する。   The advertiser terminal 30 is a terminal device used by the advertiser. The advertiser terminal 30 is, for example, a mobile phone such as a smartphone, a tablet terminal, a PDA, a desktop PC, a notebook PC, or the like. Further, the advertiser terminal 30 transmits the advertisement information received from the advertiser to the advertisement bidding device 40.

広告入札装置40は、入札用画面を広告主端末30に提示する。また、広告入札装置40は、広告主端末30から受け付けた広告情報を所定の記憶部に記憶する。   The advertisement bidding device 40 presents a bid screen to the advertiser terminal 30. Further, the advertising bidding device 40 stores the advertising information received from the advertiser terminal 30 in a predetermined storage unit.

応答生成装置100は、ユーザの発話である入力メッセージに対し、予め設定された対話情報に従って応答メッセージを出力制御することにより対話を実現する。   The response generation apparatus 100 realizes a dialogue by controlling the output of the response message in accordance with preset dialogue information with respect to an input message that is a user's utterance.

以下、実施形態にかかる応答生成システム1では、ユーザの入力メッセージの音声波形の性質から得られたユーザ情報に基づいて、広告情報を検索し応答メッセージとして出力制御する例について説明する。   Hereinafter, in the response generation system 1 according to the embodiment, an example will be described in which advertisement information is searched for and output-controlled as a response message based on user information obtained from the nature of a voice waveform of a user input message.

まず、ユーザ端末10は、その所有者であるユーザU01から、例えば、「キーマカレーめっちゃ好きやわ」といったメッセージの入力を受け付けたとすると(ステップS11)、その音声データを音声認識装置20へ送信する(ステップS12)。   First, when the user terminal 10 accepts an input of a message such as “Kima Curry, I love you very much” from the user U01 who is the owner (step S11), the user terminal 10 transmits the voice data to the voice recognition device 20 ( Step S12).

音声認識装置20は、ユーザ端末10から受信した発話の音声データをテキストデータに変換すると共に、ユーザ端末10から受け付けた音声データを解析し、音声データに含まれる音の特徴を示す特徴情報として、ユーザ情報を特定する(ステップS13)。ここでは、音声認識装置20は、ユーザ情報「大阪弁」を特定したものとする。   The voice recognition device 20 converts the voice data of the utterance received from the user terminal 10 into text data, analyzes the voice data received from the user terminal 10, and as feature information indicating the characteristics of the sound included in the voice data, User information is specified (step S13). Here, it is assumed that the voice recognition device 20 specifies the user information “Osaka dialect”.

そして、音声認識装置20は、テキストデータと、特定したユーザ情報「大阪弁」をユーザ端末10へ送信する(ステップS14)。ユーザ端末10は、受信したテキストデータと、ユーザ情報「大阪弁」を応答生成装置100へ送信する(ステップS15)。   Then, the voice recognition device 20 transmits the text data and the specified user information “Osaka dialect” to the user terminal 10 (step S14). The user terminal 10 transmits the received text data and user information “Osaka dialect” to the response generation device 100 (step S15).

そして、応答生成装置100は、応答メッセージとなる広告情報を検索するための検索処理を行う(ステップS16)。具体的には、応答生成装置100は、ユーザ情報と検索用タグとなる情報とを対応付けて所定の記憶部に予め記憶していることにより、例えば、ユーザ情報「大阪弁」を受信した場合には、対応する検索タグとして「大阪地方」を特定する。なお、検索タグとは、各種検索条件を示す。つまり、検索タグによって検索対象や検索範囲が変動する。検索対象は、例えば、大阪地方や食品関連の広告情報等、広告情報を検索する際の検索クエリに対応する情報である。検索範囲は、例えば、広告検索時の類似性をどの程度まで広げるかを示す情報である。   And the response production | generation apparatus 100 performs the search process for searching the advertisement information used as a response message (step S16). Specifically, the response generation device 100 stores the user information and the search tag information in association with each other in advance in a predetermined storage unit, for example, when the user information “Osaka dialect” is received. Specifies “Osaka region” as the corresponding search tag. The search tag indicates various search conditions. That is, the search target and the search range vary depending on the search tag. The search target is information corresponding to a search query when searching for advertisement information, such as, for example, the Osaka region or food-related advertisement information. The search range is information indicating, for example, to what extent the similarity during advertisement search is expanded.

また、後に詳述するが、応答生成装置100は、方言に関するユーザ情報だけでなく、年齢、性別、性格、感情、体調、環境音等に関するユーザ情報と、各ユーザ情報を特徴付ける検索タグとを対応付けて、所定の記憶部に予め記憶している。例えば、応答生成装置100は、性別「女性」と、検索タグ「化粧品」とを対応付けて記憶していたり、性格「無駄話嫌い」と、検索タグ「狭い検索」とを対応付けて記憶している。なお、応答生成装置100は、必ずしもこのような記憶部を有している必要はなく、例えば、受信したユーザ情報そのものを検索タグとして用いてもよい。   As will be described in detail later, the response generation apparatus 100 supports not only user information related to dialects but also user information related to age, gender, personality, emotion, physical condition, environmental sound, and the like, and search tags characterizing each user information. In addition, it is stored in advance in a predetermined storage unit. For example, the response generation device 100 stores the gender “female” and the search tag “cosmetics” in association with each other, or stores the personality “dislike talk” and the search tag “narrow search” in association with each other. ing. Note that the response generation device 100 does not necessarily have such a storage unit. For example, the received user information itself may be used as a search tag.

また、応答生成装置100は、検索処理として、ユーザU01の入力メッセージに含まれる所定のキーワードを検索キーワードとして設定する。ここでは、ユーザU01は、「キーマカレーめっちゃ好きやわー」を入力していることにより、応答生成装置100は、「キーマカレー」を検索キーワードとして設定する。   In addition, as a search process, the response generation apparatus 100 sets a predetermined keyword included in the input message of the user U01 as a search keyword. Here, since the user U01 has input “Kima Curry, I really like you”, the response generation apparatus 100 sets “Kima Curry” as a search keyword.

そして、応答生成装置100は、検索キーワード及び検索タグと一致する広告情報に含まれる広告データを広告入札装置40から取得する(ステップS17)。   Then, the response generation device 100 acquires the advertisement data included in the advertisement information that matches the search keyword and the search tag from the advertisement bidding device 40 (step S17).

例えば、広告入札装置40は、広告主A店から広告情報として、「広告キーワード:キーマカレー、広告タグ:大阪地方、広告データ:カレー屋A店大阪進出!」を受け付けているとすると、検索キーワードと広告キーワードとが一致し、また、検索タグとして設定されている検索対象「大阪地方」と広告タグ「大阪地方」とが一致している。つまり、広告主A店の広告情報が、検索キーワード及び検索タグを満たしていることから、広告入札装置40は、広告主A店の広告情報に含まれる広告データ「カレー屋A店大阪進出!」を、応答生成装置100に提示する。   For example, if the advertising bidding apparatus 40 receives “advertising keyword: keema curry, advertising tag: Osaka region, advertising data: curry shop A in Osaka!” As advertising information from the advertiser A store, the search keyword And the advertising keyword match, and the search target “Osaka region” set as the search tag matches the advertising tag “Osaka region”. That is, since the advertisement information of the advertiser A store satisfies the search keyword and the search tag, the advertising bidding apparatus 40 has the advertisement data “curry store A store Osaka advance!” Included in the advertisement information of the advertiser A store! Is presented to the response generation device 100.

そして、応答生成装置100は、広告入札装置40によって提示された広告データを取得し、取得した広告データを出力するようユーザ端末10に対して出力制御を行う(ステップS18)。具体的には、応答生成装置100は、ユーザ端末10に対して、取得した広告データを送信する。   Then, the response generation device 100 acquires the advertisement data presented by the advertisement bidding device 40, and performs output control on the user terminal 10 so as to output the acquired advertisement data (step S18). Specifically, the response generation device 100 transmits the acquired advertisement data to the user terminal 10.

このように、応答生成装置100は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとなる広告情報を検索し、検索結果として取得した広告データを応答メッセージとして出力するよう出力制御する。これにより、応答生成装置100は、ユーザに適したメッセージを出力することができると共に、広告主の意向に沿った広告配信をすることができる。   In this way, the response generation device 100 searches for advertisement information that becomes a response message based on the characteristics of sound in the conversation between the dialog agent system and the user, and outputs the advertisement data acquired as the search result as a response message. Control output. Thereby, the response generation device 100 can output a message suitable for the user and can perform advertisement distribution in accordance with the intention of the advertiser.

〔2.応答生成システムの構成〕
次に、図2を用いて、実施形態にかかる応答生成システムの構成について説明する。図2は、実施形態にかかる応答生成システム1の構成例を示す図である。図2に示すように、応答生成システム1は、ユーザ端末10と、音声認識装置20と、広告主端末30と、広告入札装置40と、APIサーバ装置60と、音声合成装置70と、応答生成装置100とを含む。ユーザ端末10と、音声認識装置20と、広告主端末30と、広告入札装置40と、APIサーバ装置60と、音声合成装置70と、応答生成装置100とは、ネットワークNを介して有線または無線により通信可能に接続される。なお、図2に示す応答生成システム1には、複数台のユーザ端末10や、複数台の広告主端末30が含まれてよい。
[2. Response generation system configuration]
Next, the configuration of the response generation system according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram illustrating a configuration example of the response generation system 1 according to the embodiment. As shown in FIG. 2, the response generation system 1 includes a user terminal 10, a speech recognition device 20, an advertiser terminal 30, an advertisement bidding device 40, an API server device 60, a speech synthesis device 70, and a response generation. Device 100. The user terminal 10, the speech recognition device 20, the advertiser terminal 30, the advertisement bidding device 40, the API server device 60, the speech synthesis device 70, and the response generation device 100 are wired or wirelessly via the network N. To be communicable. Note that the response generation system 1 illustrated in FIG. 2 may include a plurality of user terminals 10 and a plurality of advertiser terminals 30.

ここで、応答生成システム1がユーザへ音声サービスを提供する処理の概要について説明する。ユーザ端末10は、アプリケーションの起動後、ユーザの発話を検知すると、発話の音声データを音声認識装置20へ送信する。   Here, an outline of processing in which the response generation system 1 provides a voice service to the user will be described. When the user terminal 10 detects the user's speech after the application is started, the user terminal 10 transmits speech data of the speech to the speech recognition device 20.

音声認識装置20は、ユーザ端末10から発話の音声データを受信すると、音声データをテキストデータに変換し、発話のテキストデータをユーザ端末10へ送信する。音声認識サーバ20から発話のテキストデータを受信したユーザ端末10は、発話のテキストデータを応答生成装置100に送信する。   When the speech recognition apparatus 20 receives speech voice data from the user terminal 10, the speech recognition apparatus 20 converts the speech data into text data and transmits the speech text data to the user terminal 10. Upon receiving the utterance text data from the speech recognition server 20, the user terminal 10 transmits the utterance text data to the response generation apparatus 100.

広告主端末30は、広告主から受け付けた広告情報を広告入札装置40へ送信する。なお、広告情報には広告キーワード、広告タグ、広告データ等が含まれる。広告入札装置40は、入札用画面を広告主端末30に提示する。また、広告入札装置40は、広告主端末30から受け付けた広告情報を後述する記憶部に記憶する。   The advertiser terminal 30 transmits the advertising information received from the advertiser to the advertising bidding device 40. The advertisement information includes advertisement keywords, advertisement tags, advertisement data, and the like. The advertisement bidding device 40 presents a bid screen to the advertiser terminal 30. Further, the advertising bidding device 40 stores the advertising information received from the advertiser terminal 30 in a storage unit described later.

応答生成装置100は、ユーザ端末10から発話のテキストデータ及び音声認識装置20によって取得されたユーザ情報を受信すると、上述した検索処理を実行して応答メッセージを生成する。また、応答生成装置100は、ユーザの発話に基づいて画像検索結果や経路検索結果等を応答として出力する場合には、応答の生成に必要なデータの検索条件を指定し、ユーザ端末10が起動したアプリケーションに対応するAPIサーバ装置60に対してデータの要求を行う。   When receiving the text data of the utterance and the user information acquired by the voice recognition device 20 from the user terminal 10, the response generation device 100 executes the above-described search process and generates a response message. When the response generation apparatus 100 outputs an image search result or a route search result as a response based on the user's utterance, the response generation apparatus 100 specifies a search condition for data necessary for generating the response, and the user terminal 10 is activated. The data request is made to the API server device 60 corresponding to the application.

APIサーバ装置60は、応答生成装置100から受信した検索条件に従って、画像検索結果や経路検索結果等を含むデータを応答生成装置100に送信する。例えば、APIサーバ装置60は、画像検索結果や経路検索結果を含むXML(Extensible Markup Language)データを取得する処理を行い、取得したXMLデータを応答生成装置100に送信する。   The API server device 60 transmits data including an image search result and a route search result to the response generation device 100 in accordance with the search condition received from the response generation device 100. For example, the API server device 60 performs processing for acquiring XML (Extensible Markup Language) data including image search results and route search results, and transmits the acquired XML data to the response generation device 100.

応答生成装置100は、APIサーバ装置60から、例えば、XMLデータを受信すると、XMLデータからデータを抽出し、XMLデータをHTMLデータに変換するとともに、XMLデータまたはHTMLデータから音声にて応答を行うテキストデータ(以下、応答発話表示用のテキストデータと記載する)を抽出する。また、応答生成装置100は、応答発話表示用のテキストデータや、上述した検索処理により取得した広告データを音声合成装置70に送信する。音声合成装置70は、応答発話表示用のテキストデータや広告データから音声を合成する音声合成処理を行って生成した応答発話用の中間表記を応答生成装置100に送信する。応答生成装置100は、応答発話用の中間表記と応答発話表示用のテキストデータとHTMLデータとをユーザ端末10に送信する。   When the response generation apparatus 100 receives, for example, XML data from the API server apparatus 60, the response generation apparatus 100 extracts the data from the XML data, converts the XML data into HTML data, and responds by voice from the XML data or HTML data. Text data (hereinafter referred to as text data for response utterance display) is extracted. Further, the response generation device 100 transmits the response utterance display text data and the advertisement data acquired by the search processing described above to the speech synthesizer 70. The speech synthesizer 70 transmits an intermediate notation for response utterance generated by performing speech synthesis processing for synthesizing speech from response utterance display text data and advertisement data to the response generation device 100. The response generation device 100 transmits the intermediate notation for response utterance, the text data for displaying the response utterance, and the HTML data to the user terminal 10.

ユーザ端末10は、受信した応答発話用の中間表記を用いて、応答の音声を出力するとともに、応答発話表示用のテキストデータとHTMLデータとを用いて、応答内容を表示する。このようにして、応答生成システム1は、ユーザの発話に対して適切な応答を行う音声サービスを実現する。   The user terminal 10 outputs the response voice using the received intermediate notation for response utterance, and displays the response content using text data for displaying the response utterance and HTML data. In this way, the response generation system 1 realizes a voice service that makes an appropriate response to the user's utterance.

なお、応答生成装置100は、上述した応答生成処理を組み合わせることにより、ユーザの特性に応じた応答メッセージの出力を実現する。具体的には、応答生成装置100は、対話エージェントシステムとユーザとの会話の中で受け付けられた音声から特定されたユーザ情報を受信し、受信したユーザ情報に対応する検索タグを特定する。また、応答生成装置100は、ユーザの発話に含まれるキーワードを抽出し、抽出したキーワードを検索キーワードとする。そして、応答生成装置100は、かかる検索タグと検索キーワードを広告入札装置40に送信する。かかる場合、広告入札装置40は、受信した検索タグと検索キーワードとに対応する広告情報を検索し、検索結果の広告情報に含まれる広告データを応答生成装置100へ送信する。そして、応答生成装置100は、受信した広告のテキストデータを音声合成装置70に送信して応答発話用の中間表記を取得し、取得した中間表記や広告のテキストデータをユーザ端末10に送信する。   The response generation device 100 realizes output of a response message according to the user's characteristics by combining the response generation processing described above. Specifically, the response generation device 100 receives the user information specified from the voice received in the conversation between the dialog agent system and the user, and specifies the search tag corresponding to the received user information. Further, the response generation apparatus 100 extracts a keyword included in the user's utterance, and uses the extracted keyword as a search keyword. Then, the response generation device 100 transmits the search tag and the search keyword to the advertisement bidding device 40. In such a case, the advertisement bidding device 40 searches for advertisement information corresponding to the received search tag and search keyword, and transmits the advertisement data included in the advertisement information of the search result to the response generation device 100. Then, the response generation apparatus 100 transmits the received advertisement text data to the speech synthesizer 70 to acquire an intermediate expression for response utterance, and transmits the acquired intermediate expression and advertisement text data to the user terminal 10.

〔3−1.広告入札装置の構成〕
次に、図3を用いて、実施形態にかかる広告入札装置40について説明する。図3は、実施形態にかかる広告入札装置40の構成例を示す図である。図3に示すように、広告入札装置40は、通信部41と、広告情報記憶部42と、制御部43とを有する。
[3-1. Configuration of advertising bid device]
Next, the advertising bidding apparatus 40 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration example of the advertisement bidding apparatus 40 according to the embodiment. As shown in FIG. 3, the advertisement bidding apparatus 40 includes a communication unit 41, an advertisement information storage unit 42, and a control unit 43.

通信部41は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部41は、ネットワークと有線または無線で接続される。   The communication unit 41 is realized by, for example, a NIC (Network Interface Card). The communication unit 41 is connected to the network by wire or wireless.

広告情報記憶部42は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。   The advertisement information storage unit 42 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk.

広告情報記憶部42は、各種広告情報を記憶する。具体的には、広告情報記憶部42は、広告主端末30から入札として受け付けた広告情報を記憶する。ここで、図4に、実施形態にかかる広告情報記憶部42の一例を示す。図4に示した例では、広告情報記憶部42は、広告IDに、広告キーワードと、広告タグとを対応付けて記憶する。   The advertisement information storage unit 42 stores various types of advertisement information. Specifically, the advertisement information storage unit 42 stores advertisement information received as a bid from the advertiser terminal 30. Here, FIG. 4 shows an example of the advertisement information storage unit 42 according to the embodiment. In the example illustrated in FIG. 4, the advertisement information storage unit 42 stores the advertisement keyword and the advertisement tag in association with the advertisement ID.

「広告ID」は、広告情報を識別するための識別情報を示す。また、「広告ID」は、広告主及び広告主端末30を識別するための識別情報でもある。「広告キーワード」は、広告主によって設定されるキーワードである。例えば、広告主は、広告したい商品や情報を特徴づける言葉を広告キーワードとして設定する。「広告タグ」は、どのような人に対して広告したいかといった広告対象や、どのような検索の範囲で検索された場合に広告したいかといった検索範囲や、どのような広告の種類(例えば、メッセージ長の長い広告等)で検索された場合に広告したいかといった広告種類を示す。また、「広告データ」は、広告主によって設定される広告文であり、例えば、テキストデータ形式で入稿される。   “Advertisement ID” indicates identification information for identifying advertisement information. The “advertisement ID” is also identification information for identifying the advertiser and the advertiser terminal 30. “Advertising keyword” is a keyword set by the advertiser. For example, the advertiser sets a word characterizing a product or information to be advertised as an advertising keyword. “Ad tags” can be used to identify what people want to advertise, what search range they want to advertise for, and what type of advertisement (for example, This indicates the type of advertisement that the user wants to advertise when searching for an advertisement with a long message length. “Advertisement data” is an advertisement text set by the advertiser, and is submitted in a text data format, for example.

すなわち、図4では、広告ID「C01」によって識別される広告主(例えばA店とする)は、広告キーワード「キーマカレー」、広告タグ「大阪地方」を設定することにより、ユーザが「キーマカレー」を含むメッセージを入力した場合に、自身の広告情報を出力対象候補とするよう指定すると共に、例えば、大阪周辺在住のユーザや、大阪弁を使うユーザ等を対象とする広告情報であること、または、大阪弁で表現された広告情報であること、または、大阪地方に店舗が存在すること等を示している。   That is, in FIG. 4, the advertiser (for example, store A) identified by the advertisement ID “C01” sets the advertisement keyword “Kima Curry” and the advertisement tag “Osaka region”, so that the user ”Is specified as an output target candidate, and for example, it is advertisement information for users living in the vicinity of Osaka, users using Osaka dialect, etc., Alternatively, it indicates that the advertisement information is expressed in Osaka dialect, or that a store exists in the Osaka area.

図3に戻って説明を続ける。制御部43は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告入札装置40の内部の記憶装置に記憶されている各種プログラム(広告入札プログラムの一例に相当)がRAM(Random Access Memory)を作業領域として実行されることにより実現される。また、制御部43は、例えば、ASIC(Application Specific Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。   Returning to FIG. 3, the description will be continued. For example, the control unit 43 stores various programs (corresponding to an example of an advertisement bidding program) stored in a storage device inside the advertising bidding apparatus 40 by a CPU (Central Processing Unit), an MPU (Micro Processing Unit), or the like. This is realized by executing (Random Access Memory) as a work area. The control unit 43 is realized by an integrated circuit such as an application specific circuit (ASIC) or a field programmable gate array (FPGA).

図3に示すように、制御部43は、入札受付部44と、提示部45とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部43の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部43が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。   As shown in FIG. 3, the control unit 43 includes a bid accepting unit 44 and a presentation unit 45, and realizes or executes information processing functions and operations described below. Note that the internal configuration of the control unit 43 is not limited to the configuration illustrated in FIG. 3, and may be another configuration as long as information processing described later is performed. Further, the connection relationship between the processing units included in the control unit 43 is not limited to the connection relationship illustrated in FIG. 3, and may be another connection relationship.

入札受付部44は、広告主端末30に所定の入札画面を提示することにより、広告主から広告キーワードと、広告タグと、広告データとを含む広告情報の入札を受け付ける。そして、入札受付部44は、広告IDを払い出し、払い出した広告IDに、受け付けた広告情報に含まれる広告キーワードと、広告タグと、広告データとを対応付けて広告情報記憶部42に格納する。なお、広告入札装置40は、後述する応答生成装置100の有する「検索タグ」と同様の内容のものを「広告タグ」として有していることにより、入札受付部44は、その「広告タグ」を広告主に対して選択可能に提示する。これにより、広告入札装置40は、広告主によって選択された「広告タグ」を、広告情報記憶部42に格納する。なお、「広告タグ」は、広告主によって自由入力されてもよい。また、入札受付部44は、必ずしも広告タグを受け付ける必要はない。   The bid reception unit 44 receives a bid for advertisement information including an advertisement keyword, an advertisement tag, and advertisement data from the advertiser by presenting a predetermined bid screen on the advertiser terminal 30. Then, the bid reception unit 44 pays out the advertisement ID, and stores the advertisement keyword included in the received advertisement information, the advertisement tag, and the advertisement data in the advertisement information storage unit 42 in association with the paid-out advertisement ID. The advertisement bidding device 40 has the same content as the “search tag” of the response generation device 100 described later as the “advertising tag”, so that the bid accepting unit 44 has the “advertising tag”. To the advertiser in a selectable manner. As a result, the advertisement bidding device 40 stores the “advertisement tag” selected by the advertiser in the advertisement information storage unit 42. The “advertisement tag” may be freely input by the advertiser. Moreover, the bid reception part 44 does not necessarily need to receive an advertisement tag.

提示部45は、応答生成装置100からの広告取得要求に応じて広告情報を検索し、検索した広告情報に含まれる広告データを提示する。具体的には、提示部45は、応答生成装置100から検索キーワードと検索タグを受け付け、受け付けた検索キーワードと検索タグを用いて広告情報記憶部42の広告データを検索する。例えば、提示部45は、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部42から抽出し、抽出した広告データを検索キーワードの送信元である応答生成装置100に提示する。   The presentation unit 45 searches for advertisement information in response to an advertisement acquisition request from the response generation device 100, and presents advertisement data included in the searched advertisement information. Specifically, the presentation unit 45 receives a search keyword and a search tag from the response generation device 100, and searches for advertisement data in the advertisement information storage unit 42 using the received search keyword and search tag. For example, the presentation unit 45 extracts advertisement data in which the search keyword and the advertisement keyword match and the search tag and the advertisement tag match from the advertisement information storage unit 42, and extracts the extracted advertisement data from the search keyword transmission source Is presented to the response generation apparatus 100.

〔3−2.応答生成装置の構成〕
次に、図5を用いて、実施形態にかかる応答生成装置100について説明する。図5は、実施形態にかかる応答生成装置100の構成例を示す図である。図5に示すように、応答生成装置100は、通信部110と、記憶部120と、制御部130とを有する。
[3-2. Response generator configuration]
Next, the response generation device 100 according to the embodiment will be described with reference to FIG. FIG. 5 is a diagram illustrating a configuration example of the response generation device 100 according to the embodiment. As illustrated in FIG. 5, the response generation device 100 includes a communication unit 110, a storage unit 120, and a control unit 130.

通信部110は、例えば、NIC等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続される。   The communication unit 110 is realized by a NIC or the like, for example. The communication unit 110 is connected to the network by wire or wireless.

記憶部120は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図5に示すように、記憶部120は、判定情報記憶部121と、検索情報記憶部122とを有する。   The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM or a flash memory, or a storage device such as a hard disk or an optical disk. As illustrated in FIG. 5, the storage unit 120 includes a determination information storage unit 121 and a search information storage unit 122.

ここで、図6に実施形態にかかる判定情報記憶部121の一例を示す。図6に示した例では、各ノードを識別するノードIDと、ノードの種別を示すノード種別と、メッセージに対応する処理手順を示す処理内容とを関連付けて記憶する。   Here, FIG. 6 illustrates an example of the determination information storage unit 121 according to the embodiment. In the example shown in FIG. 6, the node ID for identifying each node, the node type indicating the type of the node, and the processing content indicating the processing procedure corresponding to the message are stored in association with each other.

なお、図6では記載を省略したが、判定情報記憶部121には、各ノードがどのノードと接続されているかを示す情報が登録されているものとする。例えば、判定情報記憶部121には、ノードID「N1」のノードと、ノードID「N2」、「N3」のノードとが接続され、ノードID「N1」のノードからノードID「N2」、「N3」に遷移する確率である遷移確率がそれぞれ「0.5」であるものとする。この結果、判定情報記憶部121は、図7に示すツリー構造のデータを記憶することとなる。   Although omitted from FIG. 6, it is assumed that information indicating which node each node is connected to is registered in the determination information storage unit 121. For example, the node having the node ID “N1” and the nodes having the node IDs “N2” and “N3” are connected to the determination information storage unit 121, and the node IDs “N2” and “N2” are connected to the nodes having the node ID “N1”. It is assumed that the transition probabilities that are the probabilities of transition to “N3” are “0.5”, respectively. As a result, the determination information storage unit 121 stores data having the tree structure shown in FIG.

図7は、判定情報記憶部121に記憶されるツリー構造の模式図である。図7に示される破線ブロックは、検出ノードを示しており、実線ブロックは動作ノードを示している。また、これらのブロックには、ノードIDが付されている。また、各ブロック同士を繋ぐ矢印は、エッジを示しており、具体的には、始点(矢がない側)が接続元ノードを示し、終点(矢がある側)が接続先ノードを示している。例えば、ノードID「N11」のノードとノードID「N12」のノードとを接続する矢印は、接続元ノードがノードID「N11」の検出ノードであり、接続先ノードがノードID「N12」の動作ノードであることを示している。なお、表記されている数値(0.5等)は、遷移確率を示す。また、図7に模式した判定ツリーは、判定情報記憶部121が記憶する検出ノードや動作ノードのうち一部のノードのみを表したものであり、各ノードには図6や図7に示すノード以外にも、各種の検出ノードや動作ノードが接続されているものとする。   FIG. 7 is a schematic diagram of a tree structure stored in the determination information storage unit 121. A broken line block shown in FIG. 7 indicates a detection node, and a solid line block indicates an operation node. Also, node IDs are assigned to these blocks. Moreover, the arrow which connects each block has shown the edge, and specifically, the start point (side without an arrow) shows a connection origin node, and the end point (side with an arrow) shows a connection destination node. . For example, the arrow connecting the node with the node ID “N11” and the node with the node ID “N12” is an operation in which the connection source node is the detection node with the node ID “N11” and the connection destination node is the node ID “N12”. Indicates a node. In addition, the numerical value (0.5 etc.) described shows a transition probability. Further, the determination tree schematically illustrated in FIG. 7 represents only some of the detection nodes and operation nodes stored in the determination information storage unit 121, and the nodes illustrated in FIGS. 6 and 7 are included in each node. In addition, it is assumed that various detection nodes and operation nodes are connected.

検索情報記憶部122は、応答メッセージとなる広告情報を検索するための検索情報を記憶する。ここで、図8に、実施形態にかかる検索情報記憶部122の一例を示す。図8に示した例では、検索情報記憶部122は、「ユーザ情報」と「検索タグ」とを対応付けて記憶する。   The search information storage unit 122 stores search information for searching for advertisement information serving as a response message. Here, FIG. 8 illustrates an example of the search information storage unit 122 according to the embodiment. In the example illustrated in FIG. 8, the search information storage unit 122 stores “user information” and “search tag” in association with each other.

「ユーザ情報」は、音声認識装置20によって特定される可能性のあるユーザ情報であり、例えば、年齢、性別、性格、感情、方言、体調、または、前記ユーザ周辺の環境音に関する情報等である。なお、ユーザ情報は、これら情報を組み合わせたものであってもよい。「検索タグ」は、検索対象や検索範囲といった各種検索条件を示す。   “User information” is user information that may be specified by the speech recognition device 20, for example, information on age, gender, personality, emotion, dialect, physical condition, or environmental sounds around the user. . The user information may be a combination of these information. The “search tag” indicates various search conditions such as a search target and a search range.

すなわち、応答生成装置100は、ユーザ情報と関連を有する広告情報を検索する。例えば、広告生成装置100は、音声認識装置20からユーザ情報「大阪弁」を受信した場合には、大阪周辺在住のユーザや、大阪弁を使うユーザ等を対象とする広告情報、または、大阪弁で表現された広告情報、または、大阪地方に店舗を有する広告主の広告情報等を検索する。なお、検索情報記憶部122に登録された対応付けは、広告主や広告生成装置100の管理者により任意の対応付けが登録されることとしてよい。   That is, the response generation device 100 searches for advertisement information that is related to the user information. For example, when the user information “Osaka dialect” is received from the speech recognition device 20, the advertisement generation device 100 receives advertisement information for users living in the vicinity of Osaka, users using the Osaka dialect, etc. Search for advertisement information expressed in the above, or advertisement information of an advertiser who has a store in the Osaka region. The association registered in the search information storage unit 122 may be registered as an arbitrary association by the advertiser or the administrator of the advertisement generation device 100.

なお、上述したが、応答生成装置100は、必ずしも検索情報記憶部122を有する必要はない。例えば、検索情報記憶部122は、音声認識装置20から受け付けたユーザ情報そのものを検索タグとして用いてもよい。つまり、応答生成装置100は、例えば、ユーザ情報「60代」を受け付けた場合には、広告タグ(広告対象)として「60代」が設定されている広告情報を検索してもよい。このように、応答生成装置100は、会話における音声波形に基づいて出力対象となる広告を検索するのであれば、任意の手法を採用することができる。   As described above, the response generation device 100 does not necessarily have the search information storage unit 122. For example, the search information storage unit 122 may use the user information itself received from the voice recognition device 20 as a search tag. That is, for example, when the user information “60s” is received, the response generation apparatus 100 may search for advertisement information in which “60s” is set as the advertisement tag (advertisement target). As described above, the response generation apparatus 100 can employ any method as long as it searches for an advertisement to be output based on the speech waveform in the conversation.

図5に戻って説明を続ける。制御部130は、例えば、CPUやMPU等によって、応答生成装置100の内部の記憶装置に記憶されている各種プログラム(応答生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASICやFPGA等の集積回路により実現される。   Returning to FIG. The control unit 130 is realized by executing various programs (corresponding to an example of a response generation program) stored in a storage device inside the response generation apparatus 100 by using the RAM as a work area by, for example, a CPU or MPU. Is done. The control unit 130 is realized by an integrated circuit such as an ASIC or FPGA, for example.

図5に示すように、制御部130は、受信部131と、検索部132と、出力制御部133とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図5に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図5に示した接続関係に限られず、他の接続関係であってもよい。   As illustrated in FIG. 5, the control unit 130 includes a reception unit 131, a search unit 132, and an output control unit 133, and realizes or executes functions and operations of information processing described below. Note that the internal configuration of the control unit 130 is not limited to the configuration illustrated in FIG. 5, and may be another configuration as long as information processing described later is performed. In addition, the connection relationship between the processing units included in the control unit 130 is not limited to the connection relationship illustrated in FIG. 5, and may be another connection relationship.

受信部131は、音声認識装置20から音声テキストと、ユーザ情報とを受信する。具体的には、受信部131は、音の特徴情報として、ユーザが発話した音声波形に関する性質から得られる情報を受信する。そして、音声波形に関する性質から得られる情報とは、すなわち、ユーザに関するユーザ情報であり、例えば、年齢、性別、性格、感情、方言、体調、または、ユーザ周辺の環境音に関する情報等である。   The receiving unit 131 receives voice text and user information from the voice recognition device 20. Specifically, the receiving unit 131 receives information obtained from the properties related to the speech waveform uttered by the user as the sound feature information. The information obtained from the property related to the speech waveform is user information related to the user, such as age, sex, personality, emotion, dialect, physical condition, or information related to environmental sounds around the user.

以下では、検索部132によって、方言に基づいて、地域による広告の絞込みが行われる例について説明する。例えば、図7に示すように、「どんなカレーが好き?」といった応答生成装置100による応答メッセージに対し、ユーザU01が「キーマカレーめっちゃ好きやわー」と入力したことにより、音声認識装置20によってユーザ情報「大阪弁」が特定されたとする。かかる場合に、受信部131は、音声のテキストデータと共に、ユーザ情報「大阪弁」を、ユーザ端末10を介して受信する。そして、受信部131は、受信したテキストデータと、ユーザ情報「大阪弁」を検索部132へ送信する。   Hereinafter, an example in which the search unit 132 narrows down advertisements by region based on dialects will be described. For example, as shown in FIG. 7, in response to a response message from the response generation device 100 such as “What kind of curry do you like?”, The user U01 has input “Keyma Curry I love you” It is assumed that the information “Osaka dialect” is specified. In such a case, the receiving unit 131 receives the user information “Osaka dialect” along with the voice text data via the user terminal 10. Then, the reception unit 131 transmits the received text data and user information “Osaka dialect” to the search unit 132.

検索部132は、ユーザが発話した音声の特徴に基づいて、広告情報を検索する。具体的には、検索部132は、受け付けたユーザ情報に基づいて、広告情報の検索対象、または、検索範囲を変動させて広告情報を検索する。   The search unit 132 searches for advertisement information based on the characteristics of the voice spoken by the user. Specifically, based on the received user information, the search unit 132 searches for advertisement information by changing a search target or search range of advertisement information.

具体的には、検索部132は、受信部131から音声テキスト及びユーザ情報を受け付けた場合は、音声テキストと判定情報記憶部121に記憶された情報とを用いて、応答メッセージを選択する。例えば、検索部132は、音声テキストを受け付けた場合に、かかる音声テキストに含まれているキーワードを有する検出ノードを判定し、判定した検出ノードと接続された動作ノードに対応する応答メッセージが出力されるよう、かかる応答メッセージのデータを出力制御する。続いて、検索部132は、この応答メッセージに対する入力メッセージの音声テキストを受け付けた場合に、かかる動作ノードと接続された複数の検出ノードのうち、この音声テキストに含まれているキーワードを有する検出ノードを判定する。そして、検索部132は、判定した検出ノードに接続された動作ノードに対応する応答メッセージのデータを出力制御する。このように、応答生成装置100は、検出ノードと動作ノードを使用してユーザとの会話を実現する。   Specifically, when receiving the voice text and the user information from the receiving unit 131, the search unit 132 selects a response message using the voice text and the information stored in the determination information storage unit 121. For example, when receiving the speech text, the search unit 132 determines a detection node having a keyword included in the speech text, and a response message corresponding to the operation node connected to the determined detection node is output. The output of the response message data is controlled. Subsequently, when receiving the voice text of the input message for the response message, the search unit 132 has a keyword included in the voice text among the plurality of detection nodes connected to the operation node. Determine. Then, the search unit 132 controls the output of response message data corresponding to the operation node connected to the determined detection node. In this way, the response generation device 100 realizes a conversation with the user using the detection node and the operation node.

また、検索部132は、処理内容に広告検索を行う旨が登録されている場合には、以下の処理を実行する。具体的には、検索部132は、検索情報記憶部122にアクセスし、受け付けたユーザ情報に対応する検索タグを特定する。かかる例の場合では、検索部132は、受信部131からユーザ情報「大阪弁」を受信しているので、ユーザ情報「大阪弁」に対応する検索タグ「大阪地方」を特定する。この検索タグ「大阪地方」は、例えば、大阪周辺在住のユーザを対象とする広告情報や、大阪地域に店舗を有する広告主の広告情報といった大阪地域の広告情報を検索するよう検索対象を指定していることを示す。   Moreover, the search part 132 performs the following processes, when performing the advertisement search is registered in the process content. Specifically, the search unit 132 accesses the search information storage unit 122 and specifies a search tag corresponding to the received user information. In the case of this example, the search unit 132 receives the user information “Osaka dialect” from the reception unit 131, and thus specifies the search tag “Osaka district” corresponding to the user information “Osaka dialect”. This search tag “Osaka region” designates a search target so as to search, for example, advertisement information for users living in the vicinity of Osaka and advertisement information in the Osaka area such as advertisement information of an advertiser who has a store in the Osaka area. Indicates that

また、検索部132は、受け付けた音声テキストからキーワードを抽出し、抽出したキーワードを検索キーワードとして設定する。かかる例では、ユーザU01は、「キーマカレーめっちゃ好きやわー」を入力していることにより、検索部132は、「キーマカレー」を検索キーワードとして設定する。   In addition, the search unit 132 extracts a keyword from the received speech text, and sets the extracted keyword as a search keyword. In such an example, the user U01 has input “Keyma Curry, I love you”, and the search unit 132 sets “Keyma Curry” as a search keyword.

そして、検索部132は、広告入札装置40に対して、検索キーワードと検索タグに対応する広告情報を検索するよう要求することで広告データを取得する。具体的には、検索部132は、検索キーワード及び検索タグを検索条件として広告入札装置40へ送信する。例えば、検索部132は、検索キーワード「キーマカレー」と、検索タグ「大阪地方」を送信する。   Then, the search unit 132 acquires the advertisement data by requesting the advertisement bidding device 40 to search for advertisement information corresponding to the search keyword and the search tag. Specifically, the search unit 132 transmits the search keyword and the search tag to the advertisement bidding apparatus 40 as a search condition. For example, the search unit 132 transmits the search keyword “key curry” and the search tag “Osaka region”.

ここで、広告入札装置40の提示部45は、検索キーワードと検索タグを受信したことにより、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部42から抽出する。例えば、図4の例では、広告ID「C01」で識別される広告主が、広告キーワード「キーマカレー」、広告タグ「大阪地方」を設定しており、検索部132によって送信された検索条件と一致する。よって、提示部45は、対応する広告データ「カレー屋A店大阪進出!」を抽出する。   Here, the presentation unit 45 of the advertisement bidding device 40 receives the search keyword and the search tag, and thus the advertisement data in which the search keyword and the advertisement keyword match and the search tag and the advertisement tag match is sent to the advertisement information. Extracted from the storage unit 42. For example, in the example of FIG. 4, the advertiser identified by the advertisement ID “C01” has set the advertisement keyword “Kima Curry” and the advertisement tag “Osaka region”, and the search condition transmitted by the search unit 132 is Match. Therefore, the presentation unit 45 extracts the corresponding advertisement data “curry shop A store Osaka advance!”.

また、提示部45は、抽出した広告データを送信元である応答生成装置100に提示する。これにより、検索部132は、広告入札装置40によって提示された広告データを取得する。そして、検索部132は、取得した広告データを出力制御部133へ送信する。かかる例では、広告データ「カレー屋A店大阪進出!」が提示部45によって提示されることになるので、検索部132は、広告データ「カレー屋A店大阪進出!」を取得し、出力制御部133へ送信する。   In addition, the presentation unit 45 presents the extracted advertisement data to the response generation device 100 that is the transmission source. Thereby, the search unit 132 acquires the advertisement data presented by the advertisement bidding device 40. Then, the search unit 132 transmits the acquired advertisement data to the output control unit 133. In this example, since the advertisement data “curry shop A store Osaka advance!” Is presented by the presentation unit 45, the search unit 132 acquires the advertisement data “curry store A store Osaka advance!” And outputs control. To the unit 133.

出力制御部133は、応答メッセージがユーザ端末10によって音声として出力されるよう出力制御を行う。具体的には、出力制御部133は、音声合成装置70に広告データを送信して中間表現(例えば、再生波形のデータ)を受信し、受信した中間表現や広告データのテキストを応答生成装置100に送信する。   The output control unit 133 performs output control so that the response message is output as voice by the user terminal 10. Specifically, the output control unit 133 transmits advertisement data to the speech synthesizer 70 to receive an intermediate representation (for example, reproduction waveform data), and receives the received intermediate representation and text of the advertisement data as a response generation device 100. Send to.

〔4.応答生成処理フロー〕
次に、図9を用いて、実施形態にかかる応答生成装置100による応答生成処理について説明する。図9は、実施形態にかかる応答生成装置100による応答生成処理手順を示すフローチャート図である。
[4. Response generation process flow)
Next, a response generation process performed by the response generation apparatus 100 according to the embodiment will be described with reference to FIG. FIG. 9 is a flowchart illustrating a response generation processing procedure performed by the response generation apparatus 100 according to the embodiment.

図9に示すように、まず、ユーザ端末10が、ユーザの発話に関する音声や、ユーザ周辺の環境音等を受け付ける(ステップS201)。そして、ユーザ端末10は、受け付けた音声データを音声認識装置20へ送信する(ステップS202)。音声認識装置20は、音声データを受信した場合に、かかる音声データをテキストデータに変換すると共に、音声データからユーザ情報を特定する(ステップS203)。具体的には、音声認識装置20は、音声データを解析することにより音の特徴情報として、ユーザに関するユーザ情報を特定する。さらに具体的には、音声認識装置20は、音声データから音声波形を生成し、その音声波形に関する性質から得られる情報として、ユーザ情報を特定する。そして、音声認識装置20は、テキストデータと取得したユーザ情報とをユーザ端末10へ送信する(ステップS204)。ユーザ端末10は、受け付けたテキストデータとユーザ情報を応答生成装置100へ送信する(ステップS205)。   As illustrated in FIG. 9, first, the user terminal 10 receives a voice related to a user's utterance, an environmental sound around the user, and the like (step S201). Then, the user terminal 10 transmits the received voice data to the voice recognition device 20 (step S202). When receiving the voice data, the voice recognition device 20 converts the voice data into text data and identifies user information from the voice data (step S203). Specifically, the voice recognition device 20 identifies user information regarding the user as sound characteristic information by analyzing voice data. More specifically, the speech recognition apparatus 20 generates a speech waveform from speech data, and specifies user information as information obtained from the properties related to the speech waveform. Then, the voice recognition device 20 transmits the text data and the acquired user information to the user terminal 10 (step S204). The user terminal 10 transmits the received text data and user information to the response generation device 100 (step S205).

ここで、応答生成装置100は、テキストデータとユーザ情報を受け付けた場合に、処理内容に広告検索を行う旨が登録されていれば、検索情報記憶部122にアクセスし、受け付けたユーザ情報に対応する検索タグを特定する。また、応答生成装置100は、テキストデータからキーワードを抽出し、抽出したキーワードを検索キーワードとして設定する(ステップS206)。そして、応答生成装置100は、検索キーワード及び検索タグを検索条件として広告入札装置40へ送信することにより、広告入札装置40に対して、検索キーワードと検索タグに対応する広告情報を検索するよう要求する(ステップS207)。これに対し、広告入札装置40は、検索キーワードと広告キーワードとが一致し、かつ、検索タグと広告タグとが一致する広告データを広告情報記憶部42から抽出し、抽出した広告データを送信元である応答生成装置100に提示する(ステップS208)。   Here, when the response generation apparatus 100 receives text data and user information, if the fact that an advertisement search is performed is registered in the processing content, the response generation apparatus 100 accesses the search information storage unit 122 and corresponds to the received user information. Identify the search tag you want. In addition, the response generation apparatus 100 extracts keywords from the text data, and sets the extracted keywords as search keywords (step S206). Then, the response generation device 100 requests the advertisement bidding device 40 to search for advertisement information corresponding to the search keyword and the search tag by transmitting the search keyword and the search tag to the advertisement bidding device 40 as a search condition. (Step S207). On the other hand, the advertisement bidding device 40 extracts advertisement data in which the search keyword and the advertisement keyword match and the search tag and the advertisement tag match from the advertisement information storage unit 42, and transmits the extracted advertisement data to the transmission source. Is presented to the response generation apparatus 100 (step S208).

応答生成装置100は、広告入札装置40によって提示された広告データを取得する(ステップS209)。そして、応答生成装置100は、取得した広告データがユーザ端末10によって音声として出力されるよう出力制御を行う(ステップS210)。   The response generation device 100 acquires the advertisement data presented by the advertisement bidding device 40 (step S209). And the response production | generation apparatus 100 performs output control so that the acquired advertisement data is output as an audio | voice by the user terminal 10 (step S210).

〔5.変形例〕
上述した実施例にかかる応答生成装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、応答生成装置100の他の実施例について説明する。
[5. (Modification)
The response generation apparatus 100 according to the above-described example may be implemented in various different forms other than the above embodiment. Accordingly, another embodiment of the response generation device 100 will be described below.

〔5−1.検索処理(1)〕
上述してきた応答生成装置100の検索部132は、音声から取得されたユーザ情報として、かかるユーザによって使用される方言に基づいて、地域による広告の絞込みが行われる例を示した。しかし、検索部132は、ユーザ情報としてユーザの性格、または、感情に関する情報が受信した場合に、その性格、または、感情に関する情報に応じて検索対象を変動させてもよい。つまり、検索部132は、性格、または、感情に関する情報に応じて広告情報の絞込みを行ってもよい。
[5-1. Search process (1)]
The search unit 132 of the response generation device 100 described above has shown an example in which advertisements are narrowed down by region based on a dialect used by the user as user information acquired from speech. However, when information about the user's personality or emotion is received as user information, the search unit 132 may change the search target according to the information about the personality or emotion. That is, the search unit 132 may narrow down the advertisement information according to information on personality or emotion.

具体的には、検索部132は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する。   Specifically, when it is estimated that the topic of the user tends to switch based on the characteristics of sound in conversation, the search unit 132 advertises advertisement information including a message longer than a predetermined message. If it is estimated that the user's topic tends to be difficult to switch, advertisement information of an advertisement including a message shorter than the predetermined message is searched.

例えば、応答生成装置100は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザが「無駄話嫌い」な性格であるとのユーザ情報を受信した場合には、「メッセージ長さが短い」広告情報を検索する。この場合、例えば、応答生成装置100は、ユーザ情報「無駄話嫌い」と検索タグ「短メッセージ広告」とを対応付けて記憶している。   For example, when the user information that the user has the character of “dislike uselessness” is received as the feature information of the voice of the user who has input the message, the response generation apparatus 100 “the message length is short”. Search for advertising information. In this case, for example, the response generation apparatus 100 stores the user information “I don't like useless talk” and the search tag “short message advertisement” in association with each other.

なお、音声認識装置20は、例えば、音声波形に基づいて算出した口調のテンポが所定より短いユーザは、早口であるため、せっかちで「無駄話が嫌い」(話題が切り替わりにくい)な性格であるといったユーザ情報を特定していることになる。   Note that the voice recognition device 20 has a personality that, for example, a user whose tone of tempo calculated based on a voice waveform is shorter than a predetermined tone is quick, so he / she does not like useless talk (topic switching is difficult). That is, the user information is specified.

ここで、応答生成装置100は、メッセージの文字数に所定の閾値を設定している。そして、検索部132は、検索キーワードと広告キーワードが一致し、かつ、設定された閾値より少ない文字数の広告情報を検索するよう、広告入札装置40に対して検索要求することで、対応する広告情報に含まれる広告データを取得する。   Here, the response generation device 100 sets a predetermined threshold for the number of characters in the message. Then, the search unit 132 makes a search request to the advertisement bidding device 40 so that the search keyword and the advertisement keyword match and the number of characters less than the set threshold value is searched, thereby corresponding advertisement information. Get the advertising data contained in.

このように、応答生成装置100は、メッセージを入力したユーザが「無駄話嫌い」である場合には、メッセージ長さが短い広告データを広告入札装置40から取得し、取得した広告データを出力制御する。例えば、「無駄話嫌い」なユーザは、応答メッセージが長い場合には、不快感を覚えてしまう可能性がある。そのため、応答生成装置100は、「無駄話嫌い」なユーザには、メッセージ長さが短い広告データを出力制御する。   As described above, when the user who has input the message is “dislike useless talk”, the response generation apparatus 100 acquires the advertisement data having a short message length from the advertisement bidding apparatus 40, and controls the output of the acquired advertisement data. To do. For example, a user who dislikes useless talk may feel uncomfortable when the response message is long. Therefore, the response generation apparatus 100 controls to output advertisement data having a short message length to a user who dislikes useless talk.

一方、検索部132は、メッセージを入力したユーザが「無駄話好き」である場合には、メッセージ長さが長い広告情報を検索する。つまり、応答生成装置100は、例えば、ユーザ情報「無駄話好き」と検索タグ「長メッセージ広告」対応付けて記憶している。そして、検索部132は、検索キーワードと広告キーワードが一致し、かつ、設定された閾値より多い文字数の広告情報を検索するよう、広告入札装置40に対して検索要求することで、対応する広告データを取得する。   On the other hand, the search unit 132 searches for advertisement information with a long message length when the user who has input the message is “I like useless talk”. That is, the response generation device 100 stores, for example, user information “like a waste story” and a search tag “long message advertisement” in association with each other. Then, the search unit 132 makes a search request to the advertisement bidding device 40 so that the search keyword and the advertisement keyword match and the advertisement information having a number of characters larger than the set threshold value is searched, thereby corresponding advertisement data. To get.

なお、この場合、音声認識装置20は、音声波形に基づいて算出した口調のテンポが所定より長いユーザに対して、口調がゆっくりなため、のんびりしており「無駄話が好き」(話題が切り替わりにくい)な性格であるといったユーザ情報を特定していることになる。   In this case, the voice recognition device 20 is relaxed because the tone of the tone calculated based on the voice waveform is longer than a predetermined tone, so that the user recognizes “I like useless talk” (the topic is switched). This means that the user information is specified as having a difficult character.

このように、応答生成装置100は、メッセージを入力したユーザが「無駄話好き」である場合には、メッセージ長さが長い広告を検索し、出力制御する。上述した「無駄話嫌い」の例とは逆で、「無駄話好き」であれば、メッセージ長さが長い広告情報に不快感を覚える可能性は低いと考えられる。そのため、応答生成装置100は、「無駄話好き」なユーザには、メッセージ長さが長い広告データを出力制御する。   As described above, the response generation apparatus 100 searches for an advertisement having a long message length and performs output control when the user who has input the message is “I like useless talk”. Contrary to the above-mentioned example of “dislike useless talk”, it is considered that if “I like useless talk”, there is a low possibility of feeling uncomfortable with advertisement information having a long message length. Therefore, the response generation apparatus 100 controls to output advertisement data having a long message length to a user who likes “useless talk”.

以上のように、応答生成装置100は、ユーザの性格、または、感情に応じて、それらに適した広告情報を応答メッセージとして提供することができる。   As described above, the response generation device 100 can provide advertisement information suitable for the response message according to the personality or emotion of the user.

なお、感情には起伏があるため、通常は「無駄話好き」な性格のユーザであっても、例えば、一時的に「イライラ」している場合には、メッセージ長さが長い広告情報に対して不快感を覚える可能性がある。そのため、応答生成装置100は、通常は、性格に応じた広告データを出力制御しておき、所定の感情を受信した場合には、その感情に応じた検索処理を優先して行ってもよい。   In addition, since emotions have ups and downs, even a user who normally has a character that likes “waste talk”, for example, if the user is temporarily “irritated”, Can cause discomfort. For this reason, the response generation apparatus 100 may normally control the output of advertisement data according to personality, and when a predetermined emotion is received, priority may be given to search processing according to that emotion.

〔5−2.検索処理(2)〕
また、上述してきた応答生成装置100の検索部132は、ユーザ情報としてユーザの性格、または、感情に関する情報が受信された場合に、その性格、または、感情に関する情報に応じて検索範囲を変動させてもよい。
[5-2. Search process (2)]
In addition, when the search unit 132 of the response generation device 100 described above receives information about the user's personality or emotion as user information, the search unit 132 changes the search range according to the information about the personality or emotion. May be.

具体的には、検索部132は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、広告情報の検索範囲を広げ、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、広告情報を検索する範囲を狭める。   Specifically, when it is estimated that the user's topic is likely to be switched based on the characteristics of sound in the conversation, the search unit 132 widens the search range of the advertisement information and the user's topic is switched. When it is estimated that there is a tendency to be difficult, the search range of advertisement information is narrowed.

例えば、応答生成装置100は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザが「無駄話嫌い」な性格であるとのユーザ情報を受信した場合には、広告情報検索時の類似性を狭める。つまり、検索部132は、入力メッセージから抽出した所定のキーワードを検索キーワードとする。例えば、ユーザによって「キーマカレー好き」と入力された場合には、検索部132は、「キーマカレー」を抽出し、検索キーワードとする。そして、検索部132は、検索キーワード「キーマカレー」を用いて検索するよう検索要求することで、広告キーワード「キーマカレー」が設定されている広告データを取得する。   For example, when the response generation apparatus 100 receives user information indicating that the user has a disliked character as the feature information of the voice of the user who has input the message, the response generation apparatus 100 resembles the similarity at the time of advertisement information search. To narrow. That is, the search unit 132 uses a predetermined keyword extracted from the input message as a search keyword. For example, when the user inputs “I like Key Maca curry”, the search unit 132 extracts “Key Maca curry” and uses it as a search keyword. Then, the search unit 132 makes a search request to search using the search keyword “key curry”, thereby acquiring the advertisement data in which the advertisement keyword “key curry” is set.

このように、応答生成装置100は、「無駄話嫌い」なユーザに対し、かかるユーザの入力メッセージに含まれるキーワードを用いて検索された広告データを応答メッセージとして出力制御する。このような応答メッセージは、対話文脈に忠実であるため、無駄話が嫌いなユーザに不快感を与えることもない。具体的には、応答生成装置100は、「キーマカレー」に関する会話をしているユーザに対し、「キーマカレー」に関する内容の応答メッセージを出力することになるので、対話文脈から外れることがなく、不快感を与えることもない。   As described above, the response generation apparatus 100 controls the output of advertisement data searched using a keyword included in the input message of the user as a response message for a user who dislikes useless talk. Since such a response message is faithful to the conversation context, it does not cause discomfort to a user who dislikes useless talk. Specifically, since the response generation apparatus 100 outputs a response message with the content related to “key macurry” to the user having a conversation related to “key curry”, the response generation apparatus 100 does not deviate from the conversation context. There is no discomfort.

一方、検索部132は、「無駄話好き」な性格であるとのユーザ情報を受信した場合には、広告情報検索時の類似性を広める。「無駄話好き」なユーザは、応答生成装置100との様々な会話を楽しみたいと考えているといえる。つまり、対話文脈から外れた応答メッセージにより、不快感を与えてしまうことはないと考えられる。よって、検索部132は、あえて対話文脈から外れたような応答メッセージとしての広告情報も出力制御してよいことになる。例えば、ユーザによって「キーマカレー好き」と入力された場合には、検索部132は、「キーマカレー」を抽出し、検索キーワードとすると共に、その関連語である類似検索キーワードを用いることにより検索範囲を広める。言い換えれば、検索部132は、「キーマカレー」を検索範囲に含める類似性の広い広告情報を検索する。   On the other hand, if the search unit 132 receives user information indicating that the personality is “likeless talk”, the search unit 132 spreads the similarity when searching for advertisement information. It can be said that a user who likes “waste talk” wants to enjoy various conversations with the response generation device 100. In other words, it is considered that a discomfort is not given by a response message out of the dialog context. Therefore, the search unit 132 may output control advertisement information as a response message that deviates from the conversation context. For example, when the user inputs “I like Kema curry”, the search unit 132 extracts “Kima curry” as a search keyword and uses a similar search keyword that is a related word to search range. To spread. In other words, the search unit 132 searches for advertisement information with a wide similarity that includes “key curry” in the search range.

例えば、検索部132は、「キーマカレー」と類似する類似検索キーワードとして、「カレー」、「インド料理」を設定する。なお、応答生成装置100が関連語を検索する処理については、任意の公知技術が適用されるものとする。ここで、検索部132は、「キーマカレー」、「カレー」、「インド料理」を用いて検索するよう検索要求することで、広告キーワード「キーマカレー」」、「カレー」、「インド料理」が設定されている広告データを取得する。   For example, the search unit 132 sets “curry” and “indian cuisine” as similar search keywords similar to “Kima curry”. Note that any known technique is applied to the process in which the response generation apparatus 100 searches for related words. Here, the search unit 132 makes a search request using “Kima Curry”, “Curry”, and “Indian Food”, so that the advertising keywords “Kema Curry”, “Curry”, and “Indian Food” are obtained. Get the set advertisement data.

このように、応答生成装置100は、「無駄話好き」なユーザに対し、かかるユーザの入力メッセージに含まれるキーワードと関連する関連語を用いて検索した広告データを応答メッセージとして出力する。このような応答メッセージは、検索キーワードによる検索に基づく応答メッセージを出力する場合に比べ、対話文脈から外れてしまう可能性がある。つまり、応答生成装置100は、「キーマカレー」に関する会話をしているユーザに対し、「カレー」や、「インド料理」に関する応答メッセージを出力する場合がある。このように、応答生成装置100は、「無駄話好き」と判定したユーザに対しては、対話文脈から外れた応答メッセージを出力することにより、様々な話題を提供することができ、ユーザの会話に対する満足度を高めることができる。   As described above, the response generation apparatus 100 outputs advertisement data searched using a related word related to a keyword included in the input message of the user as a response message to a user who likes “useless talk”. Such a response message may deviate from the dialog context as compared to a case where a response message based on a search by a search keyword is output. That is, the response generation apparatus 100 may output a response message regarding “curry” or “indian food” to a user having a conversation regarding “key curry”. As described above, the response generation apparatus 100 can provide various topics to the user who has determined that he / she likes “useless talk” by outputting a response message out of the conversation context. Satisfaction with can be increased.

〔5−3.検索処理(3)〕
また、上述してきた応答生成装置100の検索部132は、ユーザの年齢が受信された場合に、その年齢に応じて広告情報の検索範囲を変動させてもよい。例えば、応答生成装置100は、メッセージを入力したユーザの音声の特徴情報として、かかるユーザのユーザ情報「60代」を受信した場合には、広告情報検索時の類似性を狭める。つまり、検索部132は、入力メッセージから抽出した所定のキーワードを検索キーワードとし、かかる検索キーワードを用いて検索するよう検索要求する。
[5-3. Search process (3)]
Moreover, the search part 132 of the response production | generation apparatus 100 mentioned above may change the search range of advertisement information according to the age, when a user's age is received. For example, when the user information “60s” of the user is received as the feature information of the voice of the user who has input the message, the response generation apparatus 100 narrows the similarity when searching for advertisement information. That is, the search unit 132 uses a predetermined keyword extracted from the input message as a search keyword, and requests to search using the search keyword.

このように、応答生成装置100は、メッセージを入力したユーザが高齢である場合には、そのユーザが入力したメッセージと関連性の高い広告データを応答メッセージとして出力制御する。例えば、応答生成装置100は、類似性の広い検索を行うことにより、入力メッセージと関連性の低い応答メッセージを出力制御した場合に、高齢者は、応答メッセージの内容を十分に理解できず不快感を覚えてしまう可能性がある。そのため、応答生成装置100は、高齢者には、あえて広告情報検索時の類似性を狭めることにより、入力メッセージと関連性の高い広告データを応答メッセージとして出力制御する。これにより、応答生成装置100は、ユーザに応じた広告情報を提供することができる。   As described above, when the user who inputs the message is elderly, the response generation apparatus 100 outputs and controls advertisement data highly relevant to the message input by the user as a response message. For example, when the response generation apparatus 100 performs output control of a response message having a low relevance to the input message by performing a search with a wide similarity, the elderly cannot fully understand the content of the response message and feel uncomfortable. You may remember. For this reason, the response generation apparatus 100 controls the output of advertisement data highly relevant to the input message as a response message to the elderly by intentionally narrowing the similarity when searching for advertisement information. Thereby, the response generation device 100 can provide advertisement information according to the user.

一方、応答生成装置100は、例えば、メッセージを入力したユーザの音声の特徴情報として、かかるユーザのユーザ情報「20代」を受信した場合には、広告情報検索時の類似性を広げる。つまり、検索部132は、上述したように、入力メッセージの内容に基づいて、検索キーワードと類似検索キーワードを設定し、これらを用いて検索するよう要求する。   On the other hand, for example, when the user information “20s” of the user who received the message is received as the feature information of the voice of the user who has input the message, the response generation apparatus 100 expands the similarity when searching for advertisement information. That is, as described above, the search unit 132 sets a search keyword and a similar search keyword based on the content of the input message, and requests to search using these keywords.

このように、応答生成装置100は、メッセージを入力したユーザが若者である場合には、そのユーザが入力したメッセージと関連性の低い広告データも応答メッセージとして出力制御する場合がある。若者は、インターネットを通して様々な情報を取得しようとする傾向にあるので、応答生成装置100が類似性の広い検索を行うことにより、入力メッセージと関連性の低い応答メッセージを出力制御した場合であっても不快感を覚えてしまう可能性は低い。そのため、応答生成装置100は、若者には、あえて広告情報検索時の類似性を広げることにより、入力メッセージと関連性の低い広告情報を応答メッセージとして出力制御する。これにより、応答生成装置100は、広告の出力機会を増やすことができる。   As described above, when the user who inputs the message is a young person, the response generation apparatus 100 may output and control advertisement data having a low relevance to the message input by the user as a response message. Since young people tend to acquire various information through the Internet, the response generation device 100 performs a search with a wide similarity to output a response message that is less relevant to the input message. It is unlikely that you will feel uncomfortable. Therefore, the response generation apparatus 100 controls the output of advertisement information having low relevance to the input message as a response message by expanding the similarity when searching for advertisement information. Thereby, the response generation device 100 can increase the output opportunity of the advertisement.

なお、上述してきたユーザ情報と検索処理の組合せは一例であり、任意に組み合わせることができる。例えば、検索部132は、年齢に応じて検索範囲を変動させる例を示したが、年齢に応じて検索対象を変動させてもよい。例えば、検索部132は、高齢者に対しては、内容が理解しやすいように、メッセージ長さの長い広告情報を検索し、その結果得られた広告データを出力制御してもよい。一方、若者であればメッセージ長さの長い広告情報であっても苦にならないことが考えられるので、検索部132は、若者に対しては、メッセージ長さの長い広告情報を検索し、その結果得られた広告データを出力制御してもよい。   Note that the above-described combination of user information and search processing is an example, and can be arbitrarily combined. For example, although the search part 132 showed the example which fluctuates a search range according to age, you may fluctuate a search object according to age. For example, the search unit 132 may search for advertisement information with a long message length and control the output of the advertisement data obtained as a result of the search so that the contents can be easily understood for the elderly. On the other hand, if it is a young person, even if it is advertisement information with a long message length, it is considered that there is no problem, so the search unit 132 searches for advertisement information with a long message length for the young person, and as a result The obtained advertisement data may be output controlled.

また、応答生成装置100は、高齢者に対しては検索範囲を狭め、若者に対しては検索範囲を広げる例を示したが、例えば、若者であっても子供に対しては検索範囲を狭めてもよい。つまり、応答生成装置100は、年齢と検索範囲の関係を任意に設定してもよい。   In addition, the response generation apparatus 100 has shown an example in which the search range is narrowed for elderly people and the search range is widened for young people. For example, even for young people, the search range is narrowed for children. May be. That is, the response generation device 100 may arbitrarily set the relationship between the age and the search range.

〔5−4.検索処理(4)〕
また、上述してきた応答生成装置100の検索部132は、ユーザの体調に基づく検索を行ってもよい。具体的には、音声認識装置20は、ユーザ情報として体調に関する情報を特定する。例えば、音声認識装置20は、生成した音声波形に「咳き込み音」を特徴付ける形状を特定できた場合に、例えば、ユーザ情報として「風邪気味」を特定する。これにより、検索部132は、ユーザ情報「風邪気味」を検索タグとして、検索要求する。これにより、応答生成装置100は、広告主に対して、体調に関する入札を可能とできる。例えば、広告主がドラッグストア経営主である場合には、その広告主は、広告タグ「風邪気味」を設定することにより、風邪を引いているユーザに対して自身の店舗の製品を広告することができる。このように、応答生成装置100、音の特徴情報を利用することにより、体調に関する入札を可能とすることで、広告効果を高めることができる。また、応答生成装置100は、例えば、体調の悪いユーザに対して、薬品や薬局等に関する広告情報を提供することができるので、ユーザに適した応答メッセージを出力することができる。
[5-4. Search process (4)]
In addition, the search unit 132 of the response generation device 100 described above may perform a search based on the physical condition of the user. Specifically, the voice recognition device 20 specifies information related to physical condition as user information. For example, when the shape that characterizes the “coughing sound” can be identified in the generated speech waveform, the speech recognition apparatus 20 identifies “coldness” as user information, for example. Thereby, the search unit 132 makes a search request with the user information “cold taste” as a search tag. Thereby, the response generation device 100 can make a bid for the physical condition to the advertiser. For example, if the advertiser is a drugstore owner, the advertiser advertises the product of his store to the user who has a cold by setting the advertisement tag “cold” Can do. In this way, by using the response generation device 100 and the sound feature information, it is possible to increase the advertising effect by enabling a bid related to physical condition. Moreover, since the response production | generation apparatus 100 can provide the advertising information regarding a chemical | medical agent, a pharmacy, etc. with respect to a user with bad physical condition, for example, it can output the response message suitable for a user.

〔5−5.検索処理(5)〕
また、上述してきた応答生成装置100の検索部132は、ユーザ周辺の環境音に基づく検索を行ってもよい。具体的には、音声認識装置20は、ユーザ情報としてユーザ周辺の環境音に関する情報を特定する。例えば、音声認識装置20は、バックノイズとして取得した音の音声波形に「赤ん坊の泣き声」を特徴付ける形状を特定できた場合に、例えば、ユーザ情報として「赤ちゃんの親」を特定する。これにより、応答生成装置100は、ユーザ情報「赤ちゃんの親」を検索タグとして、検索要求する。これにより、応答生成装置100は、広告主に対して、例えば、ベビー用品に関する入札を可能とできる。このように、応答生成装置100は、音の特徴情報を利用することにより、環境音に関する入札を可能とすることで、広告効果を高めることができる。また、その環境音はユーザ周辺の環境音であるため、応答生成装置100は、ユーザに有利な広告情報を提供することができる。
[5-5. Search process (5)]
Further, the search unit 132 of the response generation device 100 described above may perform a search based on environmental sounds around the user. Specifically, the voice recognition device 20 specifies information related to environmental sounds around the user as user information. For example, when the shape characterizing the “baby cry” can be identified in the speech waveform of the sound acquired as the back noise, the speech recognition apparatus 20 identifies “baby parent” as the user information, for example. As a result, the response generation apparatus 100 makes a search request using the user information “parent of baby” as a search tag. Thereby, the response generation device 100 can make a bid for the baby product with respect to the advertiser, for example. As described above, the response generation device 100 can increase the advertising effect by enabling the bid for the environmental sound by using the feature information of the sound. Moreover, since the environmental sound is an environmental sound around the user, the response generation apparatus 100 can provide advertisement information advantageous to the user.

〔5−6.位置情報を考慮した検索〕
また、上述してきた応答生成装置100の検索部132は、位置情報を考慮した検索を行ってもよい。このために、広告入札装置40は、広告主から広告情報を出力して欲しい出力場所を受け付けておく。そして、検索部132は、ユーザ情報を受信した場合に、受信したユーザ情報に対応するユーザの所在地を取得する。具体的には、検索部132は、受信したユーザ情報に含まれる端末IDと、GPSログに含まれる端末IDとのマッチングを行うことにより、かかるユーザの所在地を特定する。そして、検索部132は、検索キーワード及び検索タグと共に、特定した所在地を広告入札装置40へ送信する。広告入札装置40は受信した検索条件と一致する広告データを、送信元の応答生成装置100に提示する。検索部132は、提示された広告データを取得し、取得した広告データを出力制御する。
[5-6. Search considering location information)
Further, the search unit 132 of the response generation apparatus 100 described above may perform a search in consideration of position information. For this purpose, the advertising bidding device 40 accepts an output location from which the advertiser wants to output advertising information. And the search part 132 acquires the user's location corresponding to the received user information, when receiving user information. Specifically, the search unit 132 specifies the location of the user by matching the terminal ID included in the received user information with the terminal ID included in the GPS log. Then, the search unit 132 transmits the specified location to the advertising bid device 40 together with the search keyword and the search tag. The advertisement bidding apparatus 40 presents the advertisement data that matches the received search condition to the response generation apparatus 100 of the transmission source. The search unit 132 acquires the presented advertisement data, and controls output of the acquired advertisement data.

これにより、応答生成装置100は、広告主が希望する出力場所に所在するユーザに対して、その広告主の広告データを配信することができるため、広告効果を高めることができる。   Thereby, since the response production | generation apparatus 100 can distribute the advertising data of the advertiser with respect to the user who exists in the output place which an advertiser desires, it can improve an advertising effect.

〔5−7.装置構成〕
上記実施形態では、応答生成装置100は、音声認識装置20によって特定されたユーザ情報を受信する例を示した。しかし、応答生成装置100が、音の特徴情報として、ユーザ情報を特定してもよい。この場合、音声を受け付けたユーザ端末10は、その音データを応答生成装置100へ送信する。応答生成装置100は、受け付けた音声データに関する音声波形を作成し、その音声波形の特徴ユーザ情報を特定する。
[5-7. Device configuration〕
In the said embodiment, the response generation apparatus 100 showed the example which receives the user information specified by the speech recognition apparatus 20. However, the response generation apparatus 100 may specify user information as sound feature information. In this case, the user terminal 10 that has received the voice transmits the sound data to the response generation device 100. The response generation device 100 creates a speech waveform related to the received speech data, and identifies characteristic user information of the speech waveform.

〔5−8.ユーザ端末以外の例〕
上記実施形態では、ユーザはユーザ端末10を用いて、応答生成装置100と会話を行う例を示した。しかし、ユーザ端末10の有する応答生成装置100との対話機能が、会話を行うロボットに搭載されていてもよい。これにより、かかるロボットがユーザに代わって応答生成装置100と会話を行うことが実現できる。
[5-8. Example other than user terminal)
In the above-described embodiment, an example has been described in which the user performs a conversation with the response generation apparatus 100 using the user terminal 10. However, the interactive function with the response generation device 100 of the user terminal 10 may be installed in a robot that performs conversation. Thereby, it can be realized that the robot has a conversation with the response generation device 100 on behalf of the user.

〔5−9.プログラム〕
また、上述してきた各実施形態にかかる応答生成装置100は、例えば図10に示すような構成のコンピュータ1000によって実現される。以下、応答生成装置100を例に挙げて説明する。図10は、応答生成装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
[5-9. program〕
Further, the response generation apparatus 100 according to each embodiment described above is realized by a computer 1000 having a configuration as shown in FIG. 10, for example. Hereinafter, the response generation apparatus 100 will be described as an example. FIG. 10 is a hardware configuration diagram illustrating an example of a computer 1000 that implements the function of the response generation apparatus 100. The computer 1000 includes a CPU 1100, RAM 1200, ROM 1300, HDD 1400, communication interface (I / F) 1500, input / output interface (I / F) 1600, and media interface (I / F) 1700.

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。   The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400 and controls each unit. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started up, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網50を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、通信網50を介して他の機器へ送信する。   The HDD 1400 stores programs executed by the CPU 1100, data used by the programs, and the like. The communication interface 1500 receives data from other devices via the communication network 50 and sends the data to the CPU 1100, and transmits the data generated by the CPU 1100 to other devices via the communication network 50.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。   The CPU 1100 controls an output device such as a display and a printer and an input device such as a keyboard and a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。   The media interface 1700 reads a program or data stored in the recording medium 1800 and provides it to the CPU 1100 via the RAM 1200. The CPU 1100 loads such a program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. Etc.

例えば、コンピュータ1000が実施形態にかかる応答生成装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信網50を介してこれらのプログラムを取得してもよい。   For example, when the computer 1000 functions as the response generation apparatus 100 according to the embodiment, the CPU 1100 of the computer 1000 implements the function of the control unit 130 by executing a program loaded on the RAM 1200. The HDD 1400 stores data in the storage unit 120. The CPU 1100 of the computer 1000 reads these programs from the recording medium 1800 and executes them, but as another example, these programs may be acquired from other devices via the communication network 50.

〔5−10.その他〕
上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[5-10. Others]
Of the processes described in the above embodiment, all or part of the processes described as being automatically performed can be performed manually, or all of the processes described as being performed manually or A part can be automatically performed by a known method. In addition, the processing procedures, specific names, and information including various data and parameters shown in the document and drawings can be arbitrarily changed unless otherwise specified.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。   Further, each component of each illustrated apparatus is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured.

また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。   Moreover, each embodiment mentioned above can be combined suitably in the range which does not contradict a process content.

〔6.効果〕
上述してきたように、実施形態にかかる制御装置において、応答生成装置100は、検索部132と、出力制御部133とを有する。検索部132は、対話エージェントシステムとユーザとの会話における音の特徴に基づいて、応答メッセージとして出力する広告に関する情報である広告情報を検索する。出力制御部133は、検索部132によって検索された広告情報に関する広告を応答メッセージとして出力するよう制御する。
[6. effect〕
As described above, in the control device according to the embodiment, the response generation device 100 includes the search unit 132 and the output control unit 133. The search unit 132 searches for advertisement information that is information related to an advertisement to be output as a response message, based on the characteristics of sound in the conversation between the dialog agent system and the user. The output control unit 133 controls to output an advertisement related to the advertisement information searched by the search unit 132 as a response message.

これにより、応答生成装置100は、ユーザに適したメッセージを出力することができると共に、広告主の意向に沿った広告配信を行うことができる。   Thereby, the response generation apparatus 100 can output a message suitable for the user and can perform advertisement distribution in accordance with the intention of the advertiser.

また、実施形態にかかる検索部132は、ユーザが発話した音声の特徴に基づいて、広告情報を検索する。   In addition, the search unit 132 according to the embodiment searches for advertisement information based on the characteristics of the voice spoken by the user.

これにより、実施形態にかかる応答生成装置100は、音声のテキストからは得ることができない音声特有の情報を得ることができる。   Thereby, the response generation device 100 according to the embodiment can obtain voice-specific information that cannot be obtained from the voice text.

また、実施形態にかかる検索部132は、ユーザが発話した音声の特徴に基づいて推定されたユーザの年齢、性別、性格、感情、方言、または、体調の少なくともいずれか1つに基づいて、広告情報を検索する。   In addition, the search unit 132 according to the embodiment performs advertisement based on at least one of the user's age, sex, personality, emotion, dialect, or physical condition estimated based on the characteristics of the voice spoken by the user. Search for information.

これにより、実施形態にかかる応答生成装置100は、ユーザに適した広告情報を応答メッセージを出力することができると共に、広告主の意向に沿った広告配信を行うことができる。   Thereby, the response generation apparatus 100 according to the embodiment can output a response message with advertisement information suitable for the user, and can perform advertisement distribution in accordance with the intention of the advertiser.

また、実施形態にかかる検索部132は、推定された方言によって特定される地域に対応する広告の広告情報を検索する。   Moreover, the search part 132 concerning embodiment searches the advertising information of the advertisement corresponding to the area specified by the estimated dialect.

これにより、実施形態にかかる応答生成装置100は、ユーザの出身地に関する広告情報を出力することができるため、広告情報に対するユーザの関心を高めることができ、また、広告主に対して地域に関する広告情報を入札しやすくすることができる。   Thereby, since the response generation device 100 according to the embodiment can output the advertisement information related to the user's hometown, the user's interest in the advertisement information can be increased, and the advertisement related to the region can be provided to the advertiser. Information can be made easier to bid.

また、実施形態にかかる検索部132は、推定された年齢が低いほど広告情報の検索範囲を広げ、推定された年齢が高いほど広告情報の検索範囲を狭める。   Moreover, the search part 132 concerning embodiment expands the search range of advertisement information, so that the estimated age is low, and narrows the search range of advertisement information, so that the estimated age is high.

これにより、実施形態にかかる応答生成装置100は、年齢に応じた広告情報を応答メッセージとして出力することができる。   Thereby, the response generation device 100 according to the embodiment can output advertisement information corresponding to the age as a response message.

また、実施形態にかかる検索部132は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、広告情報の検索範囲を広げ、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、広告情報を検索する範囲を狭める。   In addition, when it is estimated that the user's topic is likely to be switched based on the sound characteristics in the conversation, the search unit 132 according to the embodiment widens the search range of the advertisement information, and the user's topic is When it is estimated that it is difficult to switch, the range for searching for advertisement information is narrowed.

これにより、実施形態にかかる応答生成装置100は、ユーザの性格や感情に応じた広告情報を応答メッセージとして出力することができるため、会話に対するユーザの満足度を高めることができる。   Thereby, since the response production | generation apparatus 100 concerning embodiment can output the advertising information according to a user's character and emotion as a response message, it can raise the user's satisfaction with respect to a conversation.

また、実施形態にかかる検索部132は、会話における音の特徴に基づいて、ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する。   In addition, when it is estimated that the user's topic tends to switch based on the characteristics of sounds in conversation, the search unit 132 according to the embodiment may advertise an advertisement including a message longer than a predetermined message. When information is searched and it is estimated that the user's topic tends to be difficult to switch, advertisement information of an advertisement including a message shorter than a predetermined message is searched.

これにより、実施形態にかかる応答生成装置100は、ユーザの性格や感情に応じた広告情報を応答メッセージとして出力することができるため、会話に対するユーザの満足度を高めることができる。   Thereby, since the response production | generation apparatus 100 concerning embodiment can output the advertising information according to a user's character and emotion as a response message, it can raise the user's satisfaction with respect to a conversation.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail with reference to the drawings. However, these are merely examples, and various modifications, including the aspects described in the disclosure section of the invention, based on the knowledge of those skilled in the art, It is possible to implement the present invention in other forms with improvements.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、判定部は、特定手段や特定回路に読み替えることができる。   In addition, the “section (module, unit)” described above can be read as “means” or “circuit”. For example, the determination unit can be read as specifying means or a specific circuit.

10 ユーザ端末
20 音声認識装置
30 広告主端末
40 広告入札装置
42 広告情報記憶部
44 入札受付部
45 提示部
100 応答生成装置
121 判定情報記憶部
122 検索情報記憶部
130 制御部
131 受信部
132 検索部
133 出力制御部
DESCRIPTION OF SYMBOLS 10 User terminal 20 Speech recognition apparatus 30 Advertiser terminal 40 Advertisement bid apparatus 42 Advertisement information storage part 44 Bid reception part 45 Presentation part 100 Response generation apparatus 121 Judgment information storage part 122 Search information storage part 130 Control part 131 Reception part 132 Search part 133 Output control unit

Claims (9)

対話エージェントシステムとユーザとの会話における音の特徴に基づく検索範囲で、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索部と、
前記検索部によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御部と、
を備えたことを特徴とする制御装置。
A search unit that searches for advertisement information that is information related to an advertisement to be output as a response message within a search range based on the characteristics of sound in a conversation between a dialog agent system and a user;
An output control unit that controls to output an advertisement related to the advertisement information searched by the search unit as a response message;
A control device comprising:
前記検索部は、前記会話における音の特徴として前記ユーザが発話した音声の特徴に基づく検索範囲で、前記広告情報を検索する、
ことを特徴とする請求項1に記載の制御装置。
The search unit searches the advertisement information in a search range based on a voice feature spoken by the user as a sound feature in the conversation.
The control device according to claim 1.
前記検索部は、前記ユーザが発話した音声の特徴に基づいて推定された前記ユーザの年齢、性別、性格、感情、方言、または、体調の少なくともいずれか1つに基づく検索範囲で、前記広告情報を検索する
ことを特徴とする請求項2に記載の制御装置。
The search unit is a search range based on at least one of the age, gender, personality, emotion, dialect, or physical condition of the user estimated based on the characteristics of the voice spoken by the user, and the advertisement information The control device according to claim 2, wherein the control device is searched.
前記検索部は、推定された前記ユーザが使用する方言によって特定される地域に対応する広告の広告情報を検索する、
ことを特徴とする請求項3に記載の制御装置。
The search unit searches for advertisement information of an advertisement corresponding to an area specified by the estimated dialect used by the user;
The control device according to claim 3.
前記検索部は、推定された前記ユーザの年齢が低いほど前記広告情報の検索範囲を広げ、推定された前記ユーザの年齢が高いほど前記広告情報の検索範囲を狭める、
ことを特徴とする請求項3または4に記載の制御装置。
The search unit expands the search range of the advertisement information as the estimated age of the user is low, and narrows the search range of the advertisement information as the estimated age of the user is high.
The control device according to claim 3 or 4, wherein
前記検索部は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、前記広告情報の検索範囲を広げ、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記広告情報を検索する範囲を狭める、
ことを特徴とする請求項1〜5のうちいずれか1つに記載の制御装置。
When it is estimated that the user's topic is likely to be switched based on the sound characteristics in the conversation, the search unit expands the search range of the advertisement information and the user's topic is difficult to switch. If it is estimated that there is a tendency, narrow the search range of the advertising information,
The control device according to any one of claims 1 to 5, wherein:
前記検索部は、前記会話における音の特徴に基づいて、前記ユーザの話題が切り替わりやすい傾向にある旨が推定される場合には、所定のメッセージよりも長いメッセージを含む広告の広告情報を検索し、前記ユーザの話題が切り替わりにくい傾向にある旨が推定される場合には、前記所定のメッセージよりも短いメッセージを含む広告の広告情報を検索する
ことを特徴とする請求項1〜6のうちいずれか1つに記載の制御装置。
The search unit searches for advertisement information of an advertisement including a message longer than a predetermined message when it is estimated that the topic of the user is likely to switch based on the characteristics of sound in the conversation. The advertisement information of an advertisement including a message shorter than the predetermined message is searched when it is estimated that the topic of the user is not likely to be switched. The control apparatus as described in any one.
コンピュータが実行する制御方法であって、
対話エージェントシステムとユーザとの会話における音の特徴に基づく検索範囲で、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索工程と、
前記検索工程によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御工程と、
を含んだことを特徴とする制御方法。
A control method executed by a computer,
A search step of searching for advertisement information that is information related to an advertisement to be output as a response message in a search range based on the characteristics of sound in a conversation between a dialog agent system and a user;
An output control step of controlling to output an advertisement related to the advertisement information searched by the search step as a response message;
The control method characterized by including.
対話エージェントシステムとユーザとの会話における音の特徴に基づく検索範囲で、応答メッセージとして出力する広告に関する情報である広告情報を検索する検索手順と、
前記検索手順によって検索された前記広告情報に関する広告を応答メッセージとして出力するよう制御する出力制御手順と、
をコンピュータに実行させることを特徴とする制御プログラム。
A search procedure for searching advertisement information, which is information related to an advertisement to be output as a response message, within a search range based on the characteristics of sound in a conversation between a dialog agent system and a user,
An output control procedure for controlling to output an advertisement related to the advertisement information searched by the search procedure as a response message;
A control program for causing a computer to execute.
JP2017212857A 2017-11-02 2017-11-02 Control unit, control method and control program Active JP6791829B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017212857A JP6791829B2 (en) 2017-11-02 2017-11-02 Control unit, control method and control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017212857A JP6791829B2 (en) 2017-11-02 2017-11-02 Control unit, control method and control program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014148334A Division JP6310796B2 (en) 2014-07-18 2014-07-18 Control device, control method, and control program

Publications (2)

Publication Number Publication Date
JP2018041494A true JP2018041494A (en) 2018-03-15
JP6791829B2 JP6791829B2 (en) 2020-11-25

Family

ID=61626358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017212857A Active JP6791829B2 (en) 2017-11-02 2017-11-02 Control unit, control method and control program

Country Status (1)

Country Link
JP (1) JP6791829B2 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297626A (en) * 2001-03-30 2002-10-11 Just Syst Corp Device, program, and method for presenting information
JP2003005950A (en) * 2001-06-26 2003-01-10 Sharp Corp Web browser
JP2003308338A (en) * 2002-04-18 2003-10-31 Sharp Corp Device and method for providing information, mobile terminal equipment, mobile terminal system, program for providing information, and recording medium for program
US20080115163A1 (en) * 2006-11-10 2008-05-15 Audiogate Technologies Ltd. System and method for providing advertisement based on speech recognition
JP2010277388A (en) * 2009-05-29 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> Method, system and program for providing information
US20120072219A1 (en) * 2010-09-22 2012-03-22 At & T Intellectual Property I, L.P. System and method for enhancing voice-enabled search based on automated demographic identification
JP2012069101A (en) * 2010-08-27 2012-04-05 Willcom Inc Advertisement distribution device and portable communication device used for the same

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002297626A (en) * 2001-03-30 2002-10-11 Just Syst Corp Device, program, and method for presenting information
JP2003005950A (en) * 2001-06-26 2003-01-10 Sharp Corp Web browser
JP2003308338A (en) * 2002-04-18 2003-10-31 Sharp Corp Device and method for providing information, mobile terminal equipment, mobile terminal system, program for providing information, and recording medium for program
US20080115163A1 (en) * 2006-11-10 2008-05-15 Audiogate Technologies Ltd. System and method for providing advertisement based on speech recognition
JP2010277388A (en) * 2009-05-29 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> Method, system and program for providing information
JP2012069101A (en) * 2010-08-27 2012-04-05 Willcom Inc Advertisement distribution device and portable communication device used for the same
US20120072219A1 (en) * 2010-09-22 2012-03-22 At & T Intellectual Property I, L.P. System and method for enhancing voice-enabled search based on automated demographic identification

Also Published As

Publication number Publication date
JP6791829B2 (en) 2020-11-25

Similar Documents

Publication Publication Date Title
JP6670350B2 (en) System and method for integrating a third party service with a digital assistant
JP6310796B2 (en) Control device, control method, and control program
JP6570226B2 (en) Response generation apparatus, response generation method, and response generation program
JP6305274B2 (en) Response generation apparatus, response generation method, and response generation program
US20210217413A1 (en) Voice activated interactive audio system and method
KR101983635B1 (en) A method of recommending personal broadcasting contents
JP2008052449A (en) Interactive agent system and method
JP6262613B2 (en) Presentation device, presentation method, and presentation program
JP6884722B2 (en) Information processing equipment, information processing methods, and programs
JP7171911B2 (en) Generate interactive audio tracks from visual content
JP6333329B2 (en) Information processing apparatus, information processing method, and program
JP5881647B2 (en) Determination device, determination method, and determination program
JP6568263B2 (en) Apparatus, method, and program
JP6368025B2 (en) Apparatus, method, and program
JP6791829B2 (en) Control unit, control method and control program
JP2014109998A (en) Interactive apparatus and computer interactive method
JPWO2019026395A1 (en) Information processing apparatus, information processing method, and program
JP2019109780A (en) Information processing device, information processing method and information processing program
JP6898064B2 (en) Dialogue decision system, dialogue decision method, dialogue decision program, and terminal device
JP6482703B1 (en) Estimation apparatus, estimation method, and estimation program
JP6553223B2 (en) Response generation apparatus, response generation method, and response generation program
JP6774438B2 (en) Information processing systems, information processing methods, and programs
WO2019177102A1 (en) Ai speaker system, method for controlling ai speaker system, and program
JP2021012660A (en) Information processing device, information processing method, and information processing program
JP7409781B2 (en) Output program, output device and output method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190320

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190624

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20190624

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190703

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20190709

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20190719

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20190723

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20200303

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20200414

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20200616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200806

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20200923

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20201027

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20201027

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201105

R150 Certificate of patent or registration of utility model

Ref document number: 6791829

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350