JP2020067584A - Communication device and control program for communication device - Google Patents

Communication device and control program for communication device Download PDF

Info

Publication number
JP2020067584A
JP2020067584A JP2018200830A JP2018200830A JP2020067584A JP 2020067584 A JP2020067584 A JP 2020067584A JP 2018200830 A JP2018200830 A JP 2018200830A JP 2018200830 A JP2018200830 A JP 2018200830A JP 2020067584 A JP2020067584 A JP 2020067584A
Authority
JP
Japan
Prior art keywords
response
utterance
character
conversion
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018200830A
Other languages
Japanese (ja)
Other versions
JP7044031B2 (en
Inventor
亮輔 中西
Ryosuke Nakanishi
亮輔 中西
美奈 舩造
Mina Funatsukuri
美奈 舩造
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018200830A priority Critical patent/JP7044031B2/en
Publication of JP2020067584A publication Critical patent/JP2020067584A/en
Application granted granted Critical
Publication of JP7044031B2 publication Critical patent/JP7044031B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/10Energy storage using batteries

Landscapes

  • Machine Translation (AREA)

Abstract

To provide a communication device, etc., capable of talking with a user with the tone and content that match a set character.SOLUTION: A communication device comprises: an input unit for inputting an input speech that is the speech of a user; a response generation module for generating a response speech sentence to the input speech; a determination filter for determining whether or not the content of the response speech sentence generated by the response generation module matches the temperament of a preset character; a conversion filter for referring to a conversion lookup table and replacing with another a specific word, among the words included in the response speech sentence generated by the response generation module, that pertains to character property addition that causes the impression given to the user by a speech; and an output unit for outputting a response speech sentence in which the specific word is replaced by the conversion filter, the output unit outputting a response speech sentence when the content of the response speech sentence is determined to match by the determination filter.SELECTED DRAWING: Figure 2

Description

本発明は、コミュニケーション装置およびコミュニケーション装置の制御プログラムに関する。   The present invention relates to a communication device and a control program for the communication device.

ユーザの発話を解析して意味内容を把握し、そのタイプに応じた応答発話を生成して音声またはテキストによりユーザに提示する技術が知られている(例えば、特許文献1参照)。   BACKGROUND ART There is known a technique of analyzing a user's utterance to grasp the meaning and content, generating a response utterance according to the type, and presenting the response utterance to a user by voice or text (for example, refer to Patent Document 1).

特開2010−140282号公報JP, 2010-14028, A

コミュニケーション装置には、ユーザが親しみを持ちやすいように動物などのキャラクタ性が与えられるが、キャラクタのバリエーションを増やしても、いずれのキャラクタも画一的な語調で発話をさせると、かえって違和感を生じさせることになる。また、設定されているキャラクタの気質と、発話内容が一致しない場合にも、違和感を生じさせる。   Characters such as animals are given to the communication device so that the user can easily become familiar with them, but even if the variation of characters is increased, if any character speaks in a uniform tone, it causes a sense of discomfort. I will let you. In addition, even when the set character's temperament does not match the utterance content, a sense of discomfort is generated.

本発明は、このような問題を解決するためになされたものであり、設定されたキャラクタに相応しい語調と内容でユーザと対話可能なコミュニケーション装置等を提供するものである。   The present invention has been made to solve such a problem, and provides a communication device or the like capable of interacting with a user with a tone and content suitable for a set character.

本発明の第1の態様におけるコミュニケーション装置は、ユーザの発話である入力発話を入力する入力部と、入力発話に対する応答発話文を生成する応答生成モジュールと、応答生成モジュールが生成した応答発話文の内容が、予め設定されたキャラクタの気質に一致するか否かを判断する判断フィルタと、応答生成モジュールが生成した応答発話文に含まれる単語のうち、発話によってユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換ルックアップテーブルを参照して置き換える変換フィルタと、変換フィルタによって特定単語が置き換えられた応答発話文を出力する出力部とを備え、出力部は、判断フィルタが一致すると判断した場合に応答発話文を出力する。   The communication device according to the first aspect of the present invention includes an input unit that inputs an input utterance that is an utterance of a user, a response generation module that generates a response utterance sentence for the input utterance, and a response utterance sentence that is generated by the response generation module. A judgment filter that judges whether or not the content matches the preset character's temperament, and character characteristics that change the impression given to the user by the utterance among the words included in the response utterance sentence generated by the response generation module. A conversion filter that replaces a specific word related to assignment by referring to a conversion lookup table and an output unit that outputs a response utterance sentence in which the specific word is replaced by the conversion filter are provided, and the output unit determines that the determination filters match. When it does, a response utterance sentence is output.

このように構成することにより、キャラクタの設定にかかわらず汎用的に利用可能な応答生成モジュールが生成する応答発話文を、キャラクタの設定に合わせて個別に修正することができるので、キャラクタ設定に相応しい語調の発話を実現することができる。また、汎用的に利用可能な応答生成モジュールが生成する応答発話文から、キャラクタ設定に合った応答発話文を取捨選択できるようになる。   With such a configuration, the response utterance sentence generated by the response generation module that can be used universally can be individually corrected according to the character setting regardless of the character setting, and thus is suitable for the character setting. It is possible to realize speech in tone. In addition, it becomes possible to select a response utterance sentence that matches the character setting from the response utterance sentences that are generated by the response generation module that can be used for general purposes.

上記のコミュニケーション装置において、変換フィルタは、応答生成モジュールが生成した応答発話文の語尾の単語を特定単語として置き換える、語尾変換フィルタを含むと良い。キャラクタの性質を印象づける語調は、その一つとして語尾の単語に現れることが多い。このように語尾の特定の単語を置き換えることにより、効率的に応答発話文の語調を修正することができる。   In the communication device, the conversion filter may include a ending conversion filter that replaces the ending word of the response utterance sentence generated by the response generating module as a specific word. The tone that impresses the character's character often appears in the word at the end as one of them. By thus replacing the specific word at the end of the word, it is possible to efficiently correct the tone of the response utterance sentence.

また、上記のコミュニケーション装置において、変換フィルタは、応答生成モジュールが生成した応答発話文に含まれる単語のうち、名詞、形容詞、形容動詞、副詞の少なくともいずれかの一部の単語を特定単語として置き換える、言回し変換フィルタを含むと良い。キャラクタの性質を印象づける語調は、その一つとして名詞、形容詞、形容動詞、副詞の独特な言い回しとして現れることがある。このような品詞の特定の単語を置き換えることにより、効率的に応答発話文の語調を修正することができる。   Further, in the above communication device, the conversion filter replaces at least a part of at least one of the noun, adjective, adjective verb, and adverb, among the words included in the response utterance generated by the response generation module, as a specific word. , It is better to include a word conversion filter. The tone that impresses the character's character may appear as a unique expression of a noun, an adjective, an adjective, or an adverb. By replacing a specific word of such a part of speech, it is possible to efficiently correct the tone of the response utterance sentence.

また、上記のコミュニケーション装置において、出力部が、応答発話文を音声として出力する音声出力部と、応答発話文を文字として出力する文字出力部とを有する場合に、変換フィルタは、応答発話文を音声出力部により音声として出力する場合と文字出力部により文字として出力する場合に関わらず、単一の変換ルックアップテーブルを参照して特定単語を置き換えるようにすると良い。   In the above communication device, when the output unit has a voice output unit that outputs the response utterance sentence as a voice and a character output unit that outputs the response utterance sentence as a character, the conversion filter outputs the response utterance sentence. It is preferable to refer to the single conversion lookup table to replace the specific word regardless of whether the voice output unit outputs the voice or the character output unit outputs the character.

また、上記のコミュニケーション装置において、変換フィルタは、判断フィルタが一致すると判断した場合に、応答生成モジュールが生成した応答発話文の特定単語を置き換えると良い。このような処理手順により、特定単語の置き換え処理を行った後に応答発話文として出力されない無駄を省くことができる。また、判断フィルタは、応答生成モジュールが応答発話文を生成するときに用い得るそれぞれの単語に対して気質に対応する属性が予め登録された属性ルックアップテーブルを参照して、応答発話文の内容が、気質に一致するか否かを判断するように構成すると良い。このように構成すると、比較的簡単な処理で判断を行えるので、処理の高速化に寄与する。   Further, in the above communication device, the conversion filter may replace the specific word of the response utterance sentence generated by the response generation module when it is determined that the determination filters match. With such a processing procedure, it is possible to eliminate waste that is not output as a response utterance sentence after performing the replacement processing of the specific word. In addition, the judgment filter refers to the attribute lookup table in which the attributes corresponding to the disposition for each word that can be used when the response generation module generates the response utterance sentence are referred to, and the content of the response utterance sentence is referred to. However, it may be configured to determine whether or not it matches the disposition. With this configuration, the determination can be performed by a relatively simple process, which contributes to speeding up the process.

本発明の第2の態様におけるコミュニケーション装置の制御プログラムは、ユーザの発話である入力発話を入力する入力ステップと、入力発話に対する応答発話文を生成する応答生成ステップと、応答生成ステップで生成した応答発話文の内容が、予め設定されたキャラクタの気質に一致するか否かを判断する判断ステップと、応答生成ステップで生成した応答発話文に含まれる単語のうち、発話によってユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換ルックアップテーブルを参照して置き換える変換ステップと、判断ステップが一致すると判断した場合に、変換ステップによって特定単語が置き換えられた応答発話文を出力する出力ステップとをコンピュータに実行させる。このようなプログラムがコンピュータによって実行されるコミュニケーション装置によれば、第1の態様と同様に、キャラクタ設定に相応しい語調と内容の発話を実現することができる。   The control program of the communication device according to the second aspect of the present invention includes an input step of inputting an input utterance which is an utterance of a user, a response generation step of generating a response utterance sentence for the input utterance, and a response generated in the response generation step. Change the impression given to the user by the utterance, among the words included in the response utterance generated in the response generation step, and a determination step that determines whether or not the content of the utterance matches the preset character's temperament. A conversion step of replacing a specific word relating to character imparting by referring to a conversion lookup table, and an output step of outputting a response utterance in which the specific word is replaced by the conversion step when it is determined that the determination step matches Causes the computer to execute. According to the communication device in which such a program is executed by the computer, it is possible to realize the utterance of the tone and the content suitable for the character setting, as in the first aspect.

本発明により、設定されたキャラクタに相応しい語調と内容でユーザと対話可能なコミュニケーション装置等を提供することができる。   According to the present invention, it is possible to provide a communication device or the like capable of interacting with a user with a tone and content suitable for a set character.

ロボットとユーザのコミュニケーション例を示す図である。It is a figure which shows the communication example of a robot and a user. ロボットのシステム構成図である。It is a system configuration diagram of a robot. キャラクタの属性と気質を定義する設定ファイルの一例である。It is an example of a setting file that defines the attributes and temperament of a character. 語尾変換に用いられる語尾変換ルックアップテーブルの一例である。It is an example of the ending conversion look-up table used for ending conversion. 言回し変換に用いられる言回し変換ルックアップテーブルの一例である。It is an example of a phrase conversion lookup table used for phrase conversion. ユーザの発話を受けてから応答するまでの処理を示すフロー図である。It is a flowchart which shows the process from receiving a user's utterance to responding. 第1変形例に係るロボットとユーザのコミュニケーション例を示す図である。It is a figure which shows the example of communication of the robot and user which concern on a 1st modification. 第2変形例に係るスマートフォンを示す図である。It is a figure which shows the smart phone which concerns on a 2nd modification.

以下、発明の実施の形態を通じて本発明を説明するが、特許請求の範囲に係る発明を以下の実施形態に限定するものではない。また、実施形態で説明する構成の全てが課題を解決するための手段として必須であるとは限らない。   Hereinafter, the present invention will be described through embodiments of the invention, but the invention according to the claims is not limited to the following embodiments. In addition, not all of the configurations described in the embodiments are essential as means for solving the problem.

図1は、第1の実施例に係るロボット100とユーザのコミュニケーションの例を示す図である。ロボット100は、ユーザである人間と音声対話を行うコミュニケーション装置である。ロボット100は、キャラクタを具現化したキャラクタ装置であり、対話に合わせて眼の表情や視線方向が変化するように構成しても良い。   FIG. 1 is a diagram illustrating an example of communication between a robot 100 according to the first embodiment and a user. The robot 100 is a communication device that performs a voice conversation with a human being who is a user. The robot 100 is a character device that embodies a character, and may be configured so that the facial expression and the line-of-sight direction of the eye change in accordance with a dialogue.

ロボット100は、外観として動物を模しており、頭部110と胴体部120を有する。頭部110のいずれかの位置には、マイク101が隠されて配置されている。マイク101は、ユーザの発話音声を入力発話として入力する入力部としての機能を担う。ロボット100の口の位置には、スピーカ102が隠されて配置されている。また、スピーカ102は、ロボット100が生成した音声を発する出力部としての機能を担う。ユーザは、口の位置から出力される音声に、ロボット100が喋っているような感覚を覚える。本実施形態において説明するロボット100は、「おじいちゃん」のキャラクタ設定が成されており、発話文が「おじいちゃん」にありがちな語調に調整されて発せられる。図示するように、例えばユーザがロボット100に「今日の天気はどうなるの?」と話しかけると、ロボット100は、その話しかけに反応して、「晴れのちくもりじゃ。」などと発話する。   The robot 100 imitates an animal in appearance and has a head 110 and a body 120. The microphone 101 is hidden and arranged at any position of the head 110. The microphone 101 has a function as an input unit that inputs a user's uttered voice as an input utterance. A speaker 102 is hidden and arranged at the position of the mouth of the robot 100. The speaker 102 also has a function as an output unit that emits a sound generated by the robot 100. The user feels as if the robot 100 is talking to the voice output from the position of the mouth. In the robot 100 described in the present embodiment, the character setting of "grandpa" is made, and the utterance sentence is adjusted and emitted in a tone that is likely to be present in "grandpa". As shown in the figure, for example, when the user talks to the robot 100, "What happens to the weather today?", The robot 100 responds to the talk and utters "It's sunny Chikumori."

図2は、ロボット100のシステム構成図である。ここでは、ユーザとのコミュニケーションに関係する主な要素について説明するが、ロボット100の構成としては他の要素も備え、またコミュニケーションに寄与する他の要素が加えられることもあり得る。   FIG. 2 is a system configuration diagram of the robot 100. Here, the main elements related to communication with the user will be described, but the robot 100 may include other elements and may include other elements that contribute to communication.

ロボット100は、主なシステム構成として、マイク101、スピーカ102、制御部200、メモリ210、発話データベース220、極性辞書230、および変換ルックアップテーブル240(以下、「変換LUT240」と記す)を備えている。   The robot 100 is provided with a microphone 101, a speaker 102, a control unit 200, a memory 210, a speech database 220, a polarity dictionary 230, and a conversion lookup table 240 (hereinafter, referred to as “conversion LUT 240”) as a main system configuration. There is.

制御部200は、例えばCPUによって構成され、ロボット100の全体を制御すると共に、様々な演算を実行する。マイク101は、主な機能として、ユーザの発話音声を集音する。マイク101は、集音したユーザの発話音声を音声信号に変換し、ユーザからの入力発話として制御部200へ引き渡す。   The control unit 200 is configured by, for example, a CPU, controls the entire robot 100, and executes various calculations. The microphone 101 has a main function of collecting a speech voice of the user. The microphone 101 converts the collected voice of the user's utterance into a voice signal and delivers it to the control unit 200 as an input utterance from the user.

メモリ210は、不揮発性の記憶媒体であり、例えばソリッドステートドライブが用いられる。メモリ210は、ロボット100を制御するための制御プログラムの他にも、制御や演算に用いられる様々なパラメータ値、関数、ルックアップテーブル等を記憶している。特に、設定ファイル211を記憶している。設定ファイル211は、ロボット100に付与されるキャラクタ性に関する属性と気質を定義するファイルである。詳しくは後述する。   The memory 210 is a non-volatile storage medium, and for example, a solid state drive is used. The memory 210 stores various parameter values, functions, look-up tables, etc. used for control and calculation, in addition to the control program for controlling the robot 100. In particular, the setting file 211 is stored. The setting file 211 is a file that defines attributes and dispositions relating to character characteristics given to the robot 100. Details will be described later.

制御部200は、機能ごとの実行を担う機能実行部としても動作し、主に、発話解析部201、応答生成モジュール202、判断フィルタ203、変換フィルタ204および発話制御部205として動作する。発話解析部201は、マイク101から受け取った入力発話を解析してテキスト化し、ユーザの発話内容を認識する。発話解析部201は、具体的には、一般的な音声認識技術を用いてユーザの発話内容を認識する。例えば、テキスト化された入力発話に単語分析等を施して、DNNモデルやロジスティック回帰モデルを用いて発話内容を認識する。発話解析部201は、認識した発話内容を応答生成モジュール202へ引き渡す。   The control unit 200 also operates as a function execution unit responsible for executing each function, and mainly operates as the speech analysis unit 201, the response generation module 202, the judgment filter 203, the conversion filter 204, and the speech control unit 205. The utterance analysis unit 201 analyzes the input utterance received from the microphone 101, converts it into text, and recognizes the utterance content of the user. The utterance analysis unit 201 specifically recognizes the utterance content of the user using a general voice recognition technique. For example, a text analysis is performed on the input utterance, and the utterance content is recognized using a DNN model or a logistic regression model. The speech analysis unit 201 passes the recognized speech content to the response generation module 202.

応答生成モジュール202は、発話データベース220を参照して入力発話に相応しい応答発話文を生成する。発話データベース220は、例えばハードディスクドライブに格納されたデータベースであり、コーパスとして体系化された個々の用語は、再生可能な音声データを伴って格納されている。なお、応答生成モジュール202は、標準的な言回しの応答発話文を生成する汎用的なモジュールであり、発話データベース220も、標準的な言回しの応答発話文を生成するための用語群が格納されている。   The response generation module 202 refers to the utterance database 220 and generates a response utterance sentence suitable for the input utterance. The utterance database 220 is, for example, a database stored in a hard disk drive, and each term organized as a corpus is stored together with reproducible voice data. The response generation module 202 is a general-purpose module that generates a standard utterance response utterance sentence, and the utterance database 220 also stores a term group for generating a standard utterance response utterance sentence. Has been done.

判断フィルタ203は、応答生成モジュール202が生成した応答発話文を受け取り、極性辞書230を参照してその内容を解析する。そして、解析結果が設定されたキャラクタの気質に一致するか否かを判断する。一致すれば、当該応答発話文を変換フィルタ204へ引き渡し、一致しなければ、応答生成モジュール202に応答発話文を再度生成するよう要求する。極性辞書230は、係り受け関係にある複数の単語を入力すると、その中の名詞が当該応答発話文において感情的に肯定的な意味合いを持つのか(以下、「ポジティブ」と称する)、否定的な意味合いをもつのか(以下、「ネガティブ」と称する)を出力する辞書である。極性辞書230は、例えばハードディスクドライブに格納されている。判断フィルタ203の具体的な処理については後述する。   The determination filter 203 receives the response utterance sentence generated by the response generation module 202, and refers to the polarity dictionary 230 to analyze the content thereof. Then, it is determined whether or not the analysis result matches the set character's temperament. If they match, the response utterance sentence is passed to the conversion filter 204, and if they do not match, the response generation module 202 is requested to generate the response utterance sentence again. When a plurality of words having a dependency relationship are input to the polarity dictionary 230, whether the noun therein has an emotionally positive meaning in the response utterance sentence (hereinafter, referred to as “positive”) or a negative word. It is a dictionary that outputs whether it has meaning (hereinafter referred to as "negative"). The polarity dictionary 230 is stored in, for example, a hard disk drive. Specific processing of the judgment filter 203 will be described later.

変換フィルタ204は、応答生成モジュール202が生成した応答発話文に含まれる単語のうち、発話によってユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換LUT240を参照して置き換える変換フィルタである。変換フィルタ204は、語尾変換フィルタ203aと言回し変換フィルタ203bを含む。語尾変換フィルタ203aは、応答生成モジュール202が生成した応答発話文の語尾の単語を、変換LUT240に格納されている語尾変換LUTを参照して置き換える。言回し変換フィルタ203bは、応答生成モジュール202が生成した応答発話文に含まれる単語のうち、名詞、形容詞、形容動詞、副詞の少なくともいずれかの一部の単語を、変換LUT240に格納されている言回し変換LUTを参照して置き換える。変換LUT240は、例えばハードディスクドライブに格納されている。変換フィルタ204は、置き換え処理を終えた応答発話文を発話制御部205へ引き渡す。変換フィルタ204の具体的な処理については後述する。   The conversion filter 204 is a conversion filter that replaces, among the words included in the response utterance sentence generated by the response generation module 202, a specific word relating to character property imparting that changes the impression given to the user by utterance by referring to the conversion LUT 240. . The conversion filter 204 includes an ending conversion filter 203a and a word conversion filter 203b. The ending conversion filter 203a replaces the ending word of the response utterance sentence generated by the response generating module 202 with reference to the ending conversion LUT stored in the conversion LUT 240. The wording conversion filter 203b stores, in the conversion LUT 240, some of at least one of the words included in the response utterance generated by the response generation module 202, which is a noun, an adjective, an adjective, or an adverb. The phrase conversion LUT is referenced and replaced. The conversion LUT 240 is stored in, for example, a hard disk drive. The conversion filter 204 delivers the response utterance sentence that has undergone the replacement process to the utterance control unit 205. The specific processing of the conversion filter 204 will be described later.

発話制御部205は、受け取った応答発話文を音声信号に変換してスピーカ102へ引き渡す。スピーカ102は、発話制御部205で変換された音声信号を受け取って、出力発話を音声として出力する。   The utterance control unit 205 converts the received response utterance sentence into a voice signal and delivers it to the speaker 102. The speaker 102 receives the voice signal converted by the utterance control unit 205 and outputs the output utterance as voice.

図3は、キャラクタの属性と気質を定義する設定ファイル211の一例である。設定ファイル211は、図示するように、キャラクタ属性の定義と、特定単語の気質属性を示す属性テーブルの2つを含む。キャラクタ属性は、例えば「おじいちゃん」であり、ロボット100に年配男性の属性を与えることが定義されている。属性は、他にも様々に定義し得る。年齢や性別を基準とするなら、「おじいちゃん」の他にも「おばあちゃん」や「少年」などを定義し得る。また、職種や地位を基準とするなら、「お侍さん」や「社長さん」などを定義し得る。   FIG. 3 is an example of a setting file 211 that defines the attributes and temperament of a character. The setting file 211 includes two, as shown in the figure, a definition of a character attribute and an attribute table indicating a disposition attribute of a specific word. The character attribute is, for example, “grandpa”, and it is defined to give the robot 100 the attribute of an elderly man. Various other attributes may be defined. Based on age and sex, "grandma" and "boy" can be defined in addition to "grandpa". Further, if a job type or a position is used as a standard, "Samurai-san", "President", etc. can be defined.

属性テーブルは、例えばロボット100に外出やアウトドアが好みであるとする「外向性志向」を付与する場合に、外向性志向に関連する特定単語を列挙し、それぞれの特定単語に「ポジティブ(P)」と「ネガティブ(N)」の気質属性を登録したテーブルである。登録する特定単語は、応答生成モジュールが応答発話文を生成するときに用い得る単語である。   The attribute table enumerates specific words related to the extroversion, for example, when the robot 100 is given "extroversion", which is a preference for going out or outdoors, and each specific word is labeled as "positive (P)". And “negative (N)” temperament attributes are registered in the table. The specific word to be registered is a word that can be used by the response generation module when generating a response utterance sentence.

「外向性志向」を付与する場合には、図示するように、屋外での活動に関する単語である「外出」、「キャンプ」に対しては「P」、屋内の活動に関する単語である「パソコン」、「模型」に対しては「N」の気質属性が登録されている。このように、ロボット100に付与される気質は、関連する特定単語に「P」が登録されているか「N」が登録されているかにより間接的に表わされる。換言すると、設定ファイルにどのような特定単語が列挙され、それぞれの特定単語にどのような気質属性が登録されているかによって、ロボット100の気質が総体的に定義付けられている。   When "extroversion" is given, as shown in the figure, the word is "outgoing" which is related to outdoor activities, "P" is related to "camping", and "PC" is related to indoor activities. , “N” temperament attribute is registered for “model”. In this way, the temperament imparted to the robot 100 is indirectly represented by whether "P" or "N" is registered in the related specific word. In other words, the temperament of the robot 100 is generally defined by what specific words are listed in the setting file and what kind of temperament attribute is registered in each specific word.

判断フィルタ203は、まず、応答生成モジュール202が生成した応答発話文の係り受け関係を解析する。例えば、応答発話文として「キャンプは虫が多くて嫌いです。」の一文を受け取った場合には、係り受けとして「キャンプ」→「多く」、「嫌い」と「虫」→「多く」、「嫌い」のそれぞれの組み合わせを解析する。そして、この一文の主題である可能性が高い「キャンプ」「嫌い」の単語を抽出する。判断フィルタ203は、この2つの単語を極性辞書230に入力すると、「キャンプ」が「ネガティブ」であるとの結果を得る。判断フィルタ203は、次に、設定ファイル211を参照して、「キャンプ」が登録されているか、登録されていれば「P」か「N」のいずれであるかを確認する。上述のように、設定ファイル211には、「キャンプ」が「P」として登録されているので、極性辞書230の出力結果と矛盾する。したがって、判断フィルタ203は、応答発話文の内容がロボット100の気質に一致しないと判断する。判断フィルタ203は、応答発話文がロボット100の気質に一致しないと判断した場合には、応答生成モジュール202に応答発話文を再度生成するよう要求する。   The determination filter 203 first analyzes the dependency relation of the response utterance sentence generated by the response generation module 202. For example, if you receive the sentence "I hate camp because I have a lot of insects" as the response utterance sentence, the dependency is "Camp" → "Many", "I hate" and "Insect" → "Many", " Analyze each combination of "I hate". Then, the words “camp” and “dislike” that are likely to be the subject of this sentence are extracted. When the decision filter 203 inputs these two words into the polarity dictionary 230, it obtains the result that “camp” is “negative”. Next, the judgment filter 203 refers to the setting file 211 and confirms whether “camp” is registered or, if registered, is “P” or “N”. As described above, since “camp” is registered as “P” in the setting file 211, it conflicts with the output result of the polarity dictionary 230. Therefore, the determination filter 203 determines that the content of the response utterance sentence does not match the temperament of the robot 100. When the determination filter 203 determines that the response utterance sentence does not match the disposition of the robot 100, the determination filter 203 requests the response generation module 202 to generate the response utterance sentence again.

例えば、応答発話文として「私は外出が好きです。」の一文を受け取った場合には、係り受けとして「私」→「好き」、「外出」→「好き」のそれぞれの組み合わせを解析する。そして、この一文の主題である可能性が高い「外出」「好き」の単語を抽出する。判断フィルタ203は、この2つの単語を極性辞書230に入力すると、「外出」が「ポジティブ」であるとの結果を得る。判断フィルタ203は、次に、設定ファイル211を参照して、「外出」が登録されているか、登録されていれば「P」か「N」のいずれであるかを確認する。上述のように、設定ファイル211には、「外出」が「P」として登録されているので、極性辞書230の出力結果と一致する。したがって、判断フィルタ203は、応答発話文の内容がロボット100の気質と一致すると判断する。判断フィルタ203は、応答発話文がロボット100の気質と一致すると判断した場合には、当該応答発話文を変換フィルタ204へ引き渡す。なお、応答発話文から抽出された単語のいずれもが、設定ファイル211の属性テーブルに登録されていない場合には、当該応答発話文をそのまま変換フィルタ204へ引き渡す。   For example, when the sentence “I like going out” is received as the response utterance sentence, each combination of “I” → “like” and “going out” → “like” is analyzed as the modification. Then, the words “out” and “like” that are highly likely to be the subject of this sentence are extracted. When the decision filter 203 inputs these two words into the polarity dictionary 230, it obtains the result that “going out” is “positive”. The determination filter 203 then refers to the setting file 211 and confirms whether “going out” is registered or, if registered, whether it is “P” or “N”. As described above, since “going out” is registered as “P” in the setting file 211, it matches the output result of the polarity dictionary 230. Therefore, the determination filter 203 determines that the content of the response utterance sentence matches the temperament of the robot 100. When the determination filter 203 determines that the response utterance sentence matches the temperament of the robot 100, it passes the response utterance sentence to the conversion filter 204. If none of the words extracted from the response utterance sentence is registered in the attribute table of the setting file 211, the response utterance sentence is passed to the conversion filter 204 as it is.

図4は、語尾変換に用いられる語尾変換LUTの一例である。語尾変換LUTは、図示するように、対象キャラクタを示すキャラクタ属性と、特定語尾の置き換えを列挙した置換テーブルの2つを含む。図示するように、キャラクタ属性が「おじいちゃん」に指定されている場合は、設定ファイル211に「おじいちゃん」が定義されているロボット100の語尾変換フィルタ203aに参照される。すなわち、語尾変換LUTは、設定ファイル211に定義され得るキャラクタ属性ごとに予め作成されて、変換LUT240に格納される。   FIG. 4 is an example of a word ending conversion LUT used for word ending conversion. As shown in the figure, the word ending conversion LUT includes two of a character attribute indicating a target character and a replacement table listing the replacement of specific endings. As shown in the figure, when the character attribute is designated as "grandpa", the ending conversion filter 203a of the robot 100 in which "grandpa" is defined in the setting file 211 is referred to. That is, the ending conversion LUT is created in advance for each character attribute that can be defined in the setting file 211, and is stored in the conversion LUT 240.

置換テーブルは、置換え対象となる特定語尾と、その置換え後である変換語尾との組み合わせが列挙されたテーブルである。語尾変換LUTにおける特定語尾は、応答生成モジュール202が生成する標準的な言回しの応答発話文の語尾に用いられる単語である。語尾変換LUTにおける変換語尾は、指定されたキャラクタ属性が語尾として用いる傾向のある単語である。キャラクタ属性が「おじいちゃん」であれば、「だけど」(特定語尾)に対して「じゃけど」(変換語尾)、「です」(特定語尾)に対して「じゃ」(変換語尾)のように組み合わされる。   The replacement table is a table listing combinations of specific endings to be replaced and converted endings after the replacement. The specific ending in the ending conversion LUT is a word used as the ending of a response utterance sentence of standard wording generated by the response generating module 202. The converted ending in the ending conversion LUT is a word that the designated character attribute tends to use as the ending. If the character attribute is "Grandpa", it will be combined as "Jada" (converted ending) for "No but" (specific ending) and "Ja" (converted ending) for "is" (specific ending). Be done.

語尾変換フィルタ203aは、応答生成モジュール202が生成した応答発話文の特定語尾を、語尾変換LUTを参照して変換語尾に置き換える。例えば、語尾変換フィルタ203aが受け取った応答発話文が「私の友達はお年寄りだけど、みんな元気です。」であれば、「だけど」「です」が特定語尾に該当するので、これを変換語尾の「じゃけど」「じゃ」に置き換え、「私の友達はお年寄りじゃけど、みんな元気じゃ。」とする。また、「もう服はたくさん持っているから、いらないかなあ。」であれば、「もう服はたくさん持っているから、いらないかのう。」とする。   The ending conversion filter 203a replaces the specific ending of the response utterance sentence generated by the response generating module 202 with the converted ending by referring to the ending conversion LUT. For example, if the response utterance received by the ending conversion filter 203a is "My friends are elderly, but everyone is fine.", "But" "is" corresponds to the specific ending, so change this to " Replaced with "Ja" and "Ja" and said, "My friends are old people, but everyone is fine." In addition, if "I already have a lot of clothes, I wonder if I don't need it.", Then I will say "I don't need it because I already have a lot of clothes."

キャラクタの性質を印象づける語調は、その一つとして語尾の単語に現れることが多いので、このように語尾の特定の単語を置き換えることにより、効率的に応答発話文の語調を修正することができる。ユーザは、修正された語調により、ロボット100のキャラクタ性をより強く感じることができる。   Since the tone that impresses the character of the character often appears in the word at the end of the sentence, it is possible to efficiently correct the tone of the response utterance sentence by replacing the specific word at the end in this way. The user can feel the character of the robot 100 more strongly by the corrected tone.

図5は、言回し変換に用いられる言回し変換LUTの一例である。言回し変換LUTは、図示するように、対象キャラクタを示すキャラクタ属性と、特定単語の置き換えを列挙した置換テーブルの2つを含む。図示するように、キャラクタ属性が「おじいちゃん」に指定されている場合は、設定ファイル211に「おじいちゃん」が定義されているロボット100の言回し変換フィルタ203bに参照される。すなわち、言回し変換LUTは、設定ファイル211に定義され得るキャラクタ属性ごとに予め作成されて、変換LUT240に格納される。   FIG. 5 is an example of a wording conversion LUT used for wording conversion. As shown in the figure, the wording conversion LUT includes two, a character attribute indicating a target character and a replacement table listing replacements of specific words. As shown in the figure, when the character attribute is designated as "grandpa", the word conversion filter 203b of the robot 100 in which "grandpa" is defined in the setting file 211 is referred to. That is, the wording conversion LUT is created in advance for each character attribute that can be defined in the setting file 211 and is stored in the conversion LUT 240.

置換テーブルは、置換え対象となる特定単語と、その置換え後である変換単語との組み合わせが列挙されたテーブルである。言回し変換LUTにおける特定単語は、応答生成モジュール202が生成する標準的な言回しの応答発話文に含まれる単語のうち、名詞、形容詞、形容動詞、副詞の少なくともいずれかの一部の単語である。言回し変換LUTにおける変換単語は、指定されたキャラクタ属性が用いる傾向にある、変換単語に対応する単語である。キャラクタ属性が「おじいちゃん」であれば、「私」(特定単語:名詞)に対して「儂」(変換単語:名詞)、「たくさん」(特定単語:副詞)に対して「たんと」(変換単語:副詞)、「かわいい」(特定単語:形容詞)に対して「かわゆい」(変換単語:形容詞)のように組み合わされる。   The replacement table is a table listing combinations of specific words to be replaced and converted words after the replacement. The specific word in the phrase conversion LUT is a part of at least one of a noun, an adjective, an adjective verb, and an adverb among words included in the standard utterance response utterance generated by the response generation module 202. is there. The conversion word in the word conversion LUT is a word corresponding to the conversion word that the designated character attribute tends to use. If the character attribute is "Grandpa", "I" (specific word: noun) for "I" (converted word: noun) and "many" (specific word: adverb) for "tanto" (converted) Words: adverbs), "kawaii" (specific words: adjectives) and "kawaii" (converted words: adjectives) are combined.

言回し変換フィルタ203bは、語尾変換フィルタ203aが語尾を置き換えた応答発話文の特定単語を、言回し変換LUTを参照して変換単語に置き換える。例えば、言回し変換フィルタ203bが受け取った応答発話文が「私の友達はお年寄りじゃけど、みんな元気じゃ。」であれば、「私」が特定単語に該当するので、これを変換単語の「儂」に置き換え、「儂の友達はお年寄りじゃけど、みんな元気じゃ。」とする。また、「もう服はたくさん持っているから、いらないかのう。」であれば、「もう服はたんと持っているから、いらないかのう。」とする。   The wording conversion filter 203b replaces the specific word of the response utterance sentence whose word ending conversion filter 203a has replaced the word ending with the word conversion LUT with reference to the wording conversion LUT. For example, if the response utterance received by the phrase conversion filter 203b is "My friends are old people, but everyone is fine.", "I" corresponds to a specific word, and this is the converted word "" "I'm old friends, but everyone's fine." If "I already have a lot of clothes, I don't need it.", "I already have clothes, I don't need it."

キャラクタの性質を印象づける語調は、その一つとして名詞、形容詞、形容動詞、副詞の独特な言い回しとして現れることがあるので、このような品詞の特定の単語を置き換えることにより、効率的に応答発話文の語調を修正することができる。ユーザは、修正された語調により、ロボット100のキャラクタ性をより強く感じることができる。   The tone that impresses the character's character may appear as a unique phrase such as a noun, adjective, adjective verb, or adverb as one of them, so by replacing a specific word of such a part of speech, the response utterance is efficiently The tone of can be modified. The user can feel the character of the robot 100 more strongly by the corrected tone.

次に、ユーザの発話を受けてから応答するまでの制御部200の処理の流れについて説明する。図6は、ユーザの発話を受けてから応答するまでの処理を示すフロー図である。図のフローは、ユーザが1フレーズを発話してから、ロボット100が1フレーズ返すまでの処理を表わしている。   Next, a flow of processing of the control unit 200 from receiving a user's utterance to responding will be described. FIG. 6 is a flowchart showing the processing from receiving the user's utterance to responding. The flow in the figure shows the processing from the user uttering one phrase to the robot 100 returning one phrase.

制御部200は、ステップS101で、マイク101を介してユーザ発話を取得すると、機能ブロックとしての発話解析部201が、ステップS102で、当該ユーザ発話を入力発話として解析し認識する。発話解析部201は、認識した発話内容を応答生成モジュール202へ引き渡す。応答生成モジュール202は、ステップS103で、発話データベース220を参照して入力発話に対する応答発話文を生成する。応答生成モジュール202は、生成した応答発話文を判断フィルタ203へ引き渡す。   When the control unit 200 acquires a user utterance via the microphone 101 in step S101, the utterance analysis unit 201 as a functional block analyzes and recognizes the user utterance as an input utterance in step S102. The speech analysis unit 201 passes the recognized speech content to the response generation module 202. In step S103, the response generation module 202 refers to the utterance database 220 to generate a response utterance sentence for the input utterance. The response generation module 202 delivers the generated response utterance sentence to the determination filter 203.

判断フィルタ203は、ステップS104で、極性辞書230を参照して受け取った応答発話文の内容を解析する。そして、ステップS105で、設定ファイル211の属性テーブルを参照して、解析結果が設定されたキャラクタの気質に一致するか否かを判断する。一致していないと判断したら、応答生成モジュール202に再度応答発話文を生成さるべく、ステップS103へ戻る。一致していると判断したら、応答発話文を変換フィルタ204へ引き渡して、ステップS106へ進む。   The determination filter 203 analyzes the content of the response utterance sentence received by referring to the polarity dictionary 230 in step S104. Then, in step S105, it is determined by referring to the attribute table of the setting file 211 whether the analysis result matches the set character's temperament. If it is determined that they do not match, the process returns to step S103 so that the response generation module 202 can generate a response utterance sentence again. If it is determined that they match, the response utterance sentence is passed to the conversion filter 204, and the process proceeds to step S106.

語尾変換フィルタ203aは、ステップS106で、変換LUT240の語尾変換LUTを参照し、受け取った応答発話文の特定語尾を置き換えて、言回し変換フィルタ203bへ引き渡す。応答発話文に特定語尾が含まれない場合には、受け取った応答発話文をそのまま言回し変換フィルタ203bへ引き渡す。   In step S106, the word ending conversion filter 203a refers to the word ending conversion LUT of the conversion LUT 240, replaces the specific ending of the received response utterance sentence, and passes it to the word turning conversion filter 203b. When the response utterance sentence does not include the specific ending, the received response utterance sentence is passed to the conversion filter 203b as it is.

言回し変換フィルタ203bは、ステップS107で、変換LUT240の言回し変換LUTを参照し、受け取った応答発話文の特定単語を置き換えて、発話制御部205へ引き渡す。応答発話文に特定単語が含まれない場合には、受け取った応答発話文をそのまま発話制御部205へ引き渡す。なお、ステップS106とステップS107の処理の順序は逆であっても良い。   In step S107, the phrase conversion filter 203b refers to the phrase conversion LUT of the conversion LUT 240, replaces the specific word of the received response utterance sentence, and delivers it to the utterance control unit 205. When the response utterance sentence does not include the specific word, the received response utterance sentence is delivered to the utterance control unit 205 as it is. The order of the processes of steps S106 and S107 may be reversed.

発話制御部205は、ステップS108で、受け取った出力発話を音声信号に変換して、スピーカ102から発声させる。以上により、一連の処理を終了する。再びユーザからの発話があれば、同様に繰り返す。   In step S108, the utterance control unit 205 converts the received output utterance into a voice signal and causes the speaker 102 to speak. With the above, a series of processing is completed. If there is a utterance from the user again, the same process is repeated.

なお、以上説明した本実施形態においては、判断フィルタ203の処理を行ってから変換フィルタ204の処理を行った。この手順で処理することにより、特定単語の置き換え処理を行った後に応答発話文として出力されない無駄を省くことができる。ただし、応答生成モジュール202に変換フィルタ204を組み込む構成にする場合等においては、必ずしもこの順序でなくても良い。   In the present embodiment described above, the process of the determination filter 203 is performed and then the process of the conversion filter 204 is performed. By performing the processing in this procedure, it is possible to eliminate waste that is not output as a response utterance sentence after the replacement processing of the specific word. However, when the conversion filter 204 is incorporated in the response generation module 202, the order does not necessarily have to be set.

次に、第1変形例について説明する。図6は、第1変形例に係るロボットとユーザのコミュニケーション例を示す図である。上述の実施形態では、ロボット100が単独でユーザとコミュニケーションが取れるように、主要な機能要素を全て本体に備える構成であったが、第1変形例におけるロボット100’は、演算に関する機能要素をサーバ300に任せる構成を採用する。   Next, a first modified example will be described. FIG. 6 is a diagram showing an example of communication between the robot and the user according to the first modification. In the above-described embodiment, the main body is provided with all the main functional elements so that the robot 100 can independently communicate with the user. However, the robot 100 ′ in the first modified example stores the functional elements related to the calculation in the server. Adopt a configuration that is up to 300.

例えばユーザがロボット100’に「今日の天気はどうなるの?」と話しかけると、ロボット100’のマイクがその音声を取り込む。ロボット100’は、取り込んだ音声を音声信号に変換して、無線通信によりサーバ300へ送信する。サーバ300は、これらの情報を用いて、応答音声(図の例では「晴れのちくもりじゃ。」)の音声データを調整して、ロボット100’へ送信する。ロボット100’は、受け取った音声データに対応する音声をスピーカ102から発する。   For example, when the user talks to the robot 100 ', "What happens to the weather today?", The microphone of the robot 100' captures the voice. The robot 100 'converts the captured voice into a voice signal and transmits the voice signal to the server 300 by wireless communication. The server 300 uses these pieces of information to adjust the voice data of the response voice (in the example of the figure, "Hairy Chikumorija") and transmits it to the robot 100 '. The robot 100 'emits a voice corresponding to the received voice data from the speaker 102.

このような第1変形例のシステム構成であっても、上述の実施形態と同様に、ユーザとのコミュニケーションを実現できる。また、演算に関する機能をサーバ300に集約することで、ロボット100’の構成を簡易にすることができ、ロボット100’に高性能な制御チップを設けなくても、キャラクタ性を存分に表出したコミュニケーションを実現できる。また、サーバ300が演算に関する機能を担うのであれば、複数のロボット100’からの演算要請にシーケンシャルに応えることもできるので、システム全体としての製造コストを軽減することもできる。   Even with the system configuration of the first modified example, communication with the user can be realized as in the above-described embodiment. Further, by consolidating the functions related to the calculation in the server 300, the configuration of the robot 100 ′ can be simplified, and the character characteristics can be fully expressed without providing the robot 100 ′ with a high-performance control chip. Communication can be realized. Further, if the server 300 has a function related to the calculation, it is possible to sequentially respond to the calculation requests from the plurality of robots 100 ', so that the manufacturing cost of the entire system can be reduced.

次に、第2変形例について説明する。図8は、第2変形例に係るスマートフォン700を示す図である。上述の実施形態および第1変形例においては、キャラクタを具現化したロボット100、100’をユーザが対話する相手としたが、第2変形例においては、スマートフォン700に表示した映像キャラクタ800を対話する相手とする。キャラクタをロボットとして実体化すれば、ユーザは、ペットのように感じることができ、より愛着を持てるようになるが、スマートフォン700でより簡便にキャラクタを表現することもできる。   Next, a second modification will be described. FIG. 8 is a diagram showing a smartphone 700 according to the second modification. In the above-described embodiment and the first modified example, the robots 100 and 100 ′ embodying the character are the users with whom the user interacts, but in the second modified example, the video character 800 displayed on the smartphone 700 interacts. To be a partner. If the character is embodied as a robot, the user can feel like a pet and have more attachment. However, the character can be more easily expressed on the smartphone 700.

スマートフォン700のシステム構成は、図2を用いて説明したロボット100のシステム構成とほぼ共通する。共通する構成についてはその説明を省略して、異なる構成について以下に説明する。   The system configuration of the smartphone 700 is almost the same as the system configuration of the robot 100 described with reference to FIG. A description of common configurations will be omitted, and different configurations will be described below.

スマートフォン700は、表示パネル710、マイク711、スピーカ712を備える。表示パネル710は、例えば液晶パネルであり、映像キャラクタ800を表示する。マイク711は、ロボット100におけるマイク101と置き換わる要素であり、ユーザの発話音声を集音する。スピーカ712は、ロボット100におけるスピーカ102と置き換わる要素であり、発話制御部205で変換された音声信号を受け取って、出力発話を音声出力する。   The smartphone 700 includes a display panel 710, a microphone 711, and a speaker 712. The display panel 710 is, for example, a liquid crystal panel, and displays the video character 800. The microphone 711 is an element that replaces the microphone 101 in the robot 100, and collects the voice uttered by the user. The speaker 712 is an element that replaces the speaker 102 in the robot 100, receives the voice signal converted by the utterance control unit 205, and outputs the output utterance as a voice.

また、表示パネル710には、ユーザの発話である入力発話を文字で示す入力テキストウィンドウ721が表示される。発話解析部201は、入力発話を文字変換して入力テキストウィンドウ721を生成し、表示パネル710に表示する。さらに、表示パネルには、生成された応答発話文を文字で示す出力テキストウィンドウ722が表示される。発話制御部205は、応答発話文を文字変換して出力テキストウィンドウ722を生成し、表示パネル710に表示する。   Further, on the display panel 710, an input text window 721 showing the input utterance, which is the utterance of the user, in characters is displayed. The speech analysis unit 201 converts the input speech into characters to generate an input text window 721 and displays it on the display panel 710. Further, the display panel displays an output text window 722 showing the generated response utterance sentence in characters. The utterance control unit 205 character-converts the response utterance sentence to generate an output text window 722, and displays it on the display panel 710.

このように文字情報として表示すれば、視覚的にも対話を確認することができる。また、音声出力をオフにすれば、ユーザは、静かな環境においても、周囲に迷惑をかけることなく、コミュニケーションを楽しむことができる。また、入力発話も音声としてではなく、スマートフォン700の文字入力機能を用いて文字で与えれば、ユーザは、音声を介さずにコミュニケーションを楽しむことができる。この場合は、入力発話も出力発話も文字情報として処理される。   When the text information is displayed in this way, the dialogue can be visually confirmed. Also, by turning off the audio output, the user can enjoy communication without disturbing the surroundings even in a quiet environment. In addition, if the input utterance is given as characters using the character input function of the smartphone 700 instead of as voice, the user can enjoy communication without using voice. In this case, both the input utterance and the output utterance are processed as character information.

なお、このように、スピーカ712を音声出力部として機能させ、表示パネル710を文字出力部として機能させる場合には、変換フィルタ204は、応答発話文をスピーカ712により音声として出力する場合と表示パネル710により文字として出力する場合に関わらず、単一の変換LUT240を参照して特定単語を置き換えると良い。このように構成すれば、別々のLUTを参照して異なる応答発話文を生成してしまうことを防ぐことができる。   When the speaker 712 functions as a voice output unit and the display panel 710 functions as a character output unit as described above, the conversion filter 204 outputs the response utterance sentence as a sound through the speaker 712 and the display panel. Regardless of the case of outputting as a character by 710, it is good to refer to the single conversion LUT 240 and replace the specific word. With this configuration, it is possible to prevent different response utterances from being generated by referring to different LUTs.

このようにスマートフォン700をコミュニケーション装置として機能させれば、コミュニケーション装置としての専用ハードウェアを必要としないので、ユーザはより気軽にキャラクタとの対話を楽しむことができる。また、スマートフォン700の他のアプリケーションに連動させて映像キャラクタ800と対話できるように構成すれば、様々な用途に応用できる。なお、スマートフォン700は、第1例のように、サーバが連携するシステムであっても良い。   If the smartphone 700 is made to function as a communication device in this way, the dedicated hardware as a communication device is not required, so that the user can more easily enjoy the interaction with the character. In addition, if it is configured so as to be able to interact with the video character 800 in conjunction with other applications of the smartphone 700, it can be applied to various purposes. The smartphone 700 may be a system in which servers cooperate with each other, as in the first example.

また、スマートフォン700をコミュニケーション装置として機能させるのであれば、装置の外観がキャラクタ性を認識させることがない。したがって、スマートフォン700に様々な映像キャラクタ800を用意しておき、ユーザがその中から対話相手を選べるように構成することができる。このように、一つのコミュニケーション装置に、選択し得る複数のキャラクタを用意する場合には、それぞれのキャラクタに応じた設定ファイル211を併せて用意しておけば良い。   Moreover, if the smartphone 700 is made to function as a communication device, the appearance of the device does not cause the character to be recognized. Therefore, various video characters 800 can be prepared in the smartphone 700, and the user can select a dialogue partner from among them. In this way, when a plurality of selectable characters are prepared for one communication device, a setting file 211 corresponding to each character may be prepared together.

100、100’ ロボット、101 マイク、102 スピーカ、110 頭部、120 胴体部、200 制御部、201 発話解析部、202 応答生成モジュール、203 判断フィルタ、204 変換フィルタ、204a 語尾変換フィルタ、204b 言回し変換フィルタ、205 発話制御部、210 メモリ、211 設定ファイル、220 発話DB、230 極性辞書、240 変換LUT、300 サーバ、700 スマートフォン、710 表示パネル、711 マイク、712 スピーカ、721 入力テキストウィンドウ、722 出力テキストウィンドウ、800 映像キャラクタ 100, 100 ′ robot, 101 microphone, 102 speaker, 110 head, 120 body, 200 control unit, 201 speech analysis unit, 202 response generation module, 203 judgment filter, 204 conversion filter, 204a inflection conversion filter, 204b wording Conversion filter, 205 speech control unit, 210 memory, 211 setting file, 220 speech DB, 230 polarity dictionary, 240 conversion LUT, 300 server, 700 smartphone, 710 display panel, 711 microphone, 712 speaker, 721 input text window, 722 output Text window, 800 video characters

Claims (7)

ユーザの発話である入力発話を入力する入力部と、
前記入力発話に対する応答発話文を生成する応答生成モジュールと、
前記応答生成モジュールが生成した前記応答発話文の内容が、予め設定されたキャラクタの気質に一致するか否かを判断する判断フィルタと、
前記応答生成モジュールが生成した前記応答発話文に含まれる単語のうち、発話によって前記ユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換ルックアップテーブルを参照して置き換える変換フィルタと、
前記変換フィルタによって前記特定単語が置き換えられた前記応答発話文を出力する出力部と
を備え、
前記出力部は、前記判断フィルタが一致すると判断した場合に前記応答発話文を出力するコミュニケーション装置。
An input unit for inputting an input utterance that is a user's utterance,
A response generation module that generates a response utterance sentence for the input utterance;
A determination filter for determining whether or not the content of the response utterance sentence generated by the response generation module matches a preset character disposition,
Among the words included in the response utterance sentence generated by the response generation module, a conversion filter that replaces a specific word relating to character property imparting that changes an impression given to the user by utterance by referring to a conversion lookup table,
An output unit that outputs the response utterance sentence in which the specific word is replaced by the conversion filter,
The said output part is a communication apparatus which outputs the said response utterance sentence, when it determines with the said determination filter matching.
前記変換フィルタは、前記応答生成モジュールが生成した前記応答発話文の語尾の単語を前記特定単語として置き換える、語尾変換フィルタを含む請求項1に記載のコミュニケーション装置。   The communication device according to claim 1, wherein the conversion filter includes a ending conversion filter that replaces a word at the end of the response utterance sentence generated by the response generation module as the specific word. 前記変換フィルタは、前記応答生成モジュールが生成した前記応答発話文に含まれる単語のうち、名詞、形容詞、形容動詞、副詞の少なくともいずれかの一部の単語を前記特定単語として置き換える、言回し変換フィルタを含む請求項1または2に記載のコミュニケーション装置。   The conversion filter replaces at least a part of at least one of a noun, an adjective, an adjective verb, and an adverb among the words included in the response utterance sentence generated by the response generation module, as the specific word. The communication device according to claim 1, further comprising a filter. 前記出力部は、前記応答発話文を音声として出力する音声出力部と、前記応答発話文を文字として出力する文字出力部とを有し、
前記変換フィルタは、前記応答発話文を前記音声出力部により音声として出力する場合と前記文字出力部により文字として出力する場合に関わらず、単一の前記変換ルックアップテーブルを参照して前記特定単語を置き換える請求項1から3のいずれか1項に記載のコミュニケーション装置。
The output unit includes a voice output unit that outputs the response utterance sentence as a voice, and a character output unit that outputs the response utterance sentence as a character,
The conversion filter refers to the single conversion lookup table regardless of whether the response utterance is output as a voice by the voice output unit or as a character by the character output unit, and the specific word The communication device according to any one of claims 1 to 3, wherein
前記変換フィルタは、前記判断フィルタが一致すると判断した場合に、前記応答生成モジュールが生成した前記応答発話文の前記特定単語を置き換える請求項1から4のいずれか1項に記載のコミュニケーション装置。   The communication device according to claim 1, wherein the conversion filter replaces the specific word of the response utterance sentence generated by the response generation module when the conversion filter determines that the determination filter matches. 前記判断フィルタは、前記応答生成モジュールが前記応答発話文を生成するときに用い得るそれぞれの単語に対して前記気質に対応する属性が予め登録された設定ファイルを参照して、前記応答発話文の内容が、前記気質に一致するか否かを判断する請求項1から5のいずれか1項に記載のコミュニケーション装置。   The determination filter refers to a setting file in which an attribute corresponding to the temperament for each word that can be used when the response generation module generates the response utterance sentence is referred to, and the response utterance sentence The communication device according to claim 1, wherein the communication device determines whether or not the content matches the temperament. ユーザの発話である入力発話を入力する入力ステップと、
前記入力発話に対する応答発話文を生成する応答生成ステップと、
前記応答生成ステップで生成した前記応答発話文の内容が、予め設定されたキャラクタの気質に一致するか否かを判断する判断ステップと、
前記応答生成ステップで生成した前記応答発話文に含まれる単語のうち、発話によって前記ユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換ルックアップテーブルを参照して置き換える変換ステップと、
前記判断ステップが一致すると判断した場合に、前記変換ステップによって前記特定単語が置き換えられた前記応答発話文を出力する出力ステップと
をコンピュータに実行させるコミュニケーション装置の制御プログラム。
An input step of inputting an input utterance that is a user's utterance,
A response generation step of generating a response utterance sentence for the input utterance,
A determination step of determining whether or not the content of the response utterance generated in the response generation step matches a preset character's temperament;
Of the words included in the response utterance sentence generated in the response generation step, a conversion step of replacing a specific word relating to character property imparting a change in the impression given to the user by utterance by referring to a conversion lookup table,
A control program of a communication device for causing a computer to execute an output step of outputting the response utterance sentence in which the specific word is replaced by the conversion step when it is determined that the determination steps match.
JP2018200830A 2018-10-25 2018-10-25 Communication device and control program for communication device Active JP7044031B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018200830A JP7044031B2 (en) 2018-10-25 2018-10-25 Communication device and control program for communication device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018200830A JP7044031B2 (en) 2018-10-25 2018-10-25 Communication device and control program for communication device

Publications (2)

Publication Number Publication Date
JP2020067584A true JP2020067584A (en) 2020-04-30
JP7044031B2 JP7044031B2 (en) 2022-03-30

Family

ID=70390268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018200830A Active JP7044031B2 (en) 2018-10-25 2018-10-25 Communication device and control program for communication device

Country Status (1)

Country Link
JP (1) JP7044031B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022249222A1 (en) * 2021-05-24 2022-12-01 日本電信電話株式会社 Dialog device, dialog method, and program

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108362A (en) * 2001-07-23 2003-04-11 Matsushita Electric Works Ltd Communication supporting device and system thereof
JP2015148701A (en) * 2014-02-06 2015-08-20 日本電信電話株式会社 Robot control device, robot control method and robot control program
JP2017151394A (en) * 2016-02-26 2017-08-31 シャープ株式会社 Control device, method for controlling control device, and display device
JP2018092485A (en) * 2016-12-06 2018-06-14 カシオ計算機株式会社 Sentence generation device, sentence generation method, and program
JP2019015837A (en) * 2017-07-06 2019-01-31 一般社団法人It&診断支援センター・北九州 Conversation type robot having character of cat and conversation management program for showing character of cat

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108362A (en) * 2001-07-23 2003-04-11 Matsushita Electric Works Ltd Communication supporting device and system thereof
JP2015148701A (en) * 2014-02-06 2015-08-20 日本電信電話株式会社 Robot control device, robot control method and robot control program
JP2017151394A (en) * 2016-02-26 2017-08-31 シャープ株式会社 Control device, method for controlling control device, and display device
JP2018092485A (en) * 2016-12-06 2018-06-14 カシオ計算機株式会社 Sentence generation device, sentence generation method, and program
JP2019015837A (en) * 2017-07-06 2019-01-31 一般社団法人It&診断支援センター・北九州 Conversation type robot having character of cat and conversation management program for showing character of cat

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022249222A1 (en) * 2021-05-24 2022-12-01 日本電信電話株式会社 Dialog device, dialog method, and program

Also Published As

Publication number Publication date
JP7044031B2 (en) 2022-03-30

Similar Documents

Publication Publication Date Title
JP7354301B2 (en) Detection and/or registration of hot commands to trigger response actions by automated assistants
US9053096B2 (en) Language translation based on speaker-related information
CN105991847B (en) Call method and electronic equipment
RU2685392C1 (en) Providing self-contained semantic processing in limited resources device
WO2016080553A1 (en) Learning robot, learning robot system, and learning robot program
CN111542814A (en) Method, computer device and computer readable storage medium for changing responses to provide rich-representation natural language dialog
KR20160132748A (en) Electronic apparatus and the controlling method thereof
CN112292724A (en) Dynamic and/or context-specific hotwords for invoking automated assistants
WO2017200078A1 (en) Dialog method, dialog system, dialog device, and program
WO2018235607A1 (en) Information processing device, information processing method, and program
WO2018061776A1 (en) Information processing system, information processing device, information processing method, and storage medium
JP2008125815A (en) Conversation robot system
CN111556999B (en) Method, computer device and computer readable storage medium for providing natural language dialogue by providing substantive answer in real time
JP7063230B2 (en) Communication device and control program for communication device
WO2021134250A1 (en) Emotion management method and device, and computer-readable storage medium
JP7044031B2 (en) Communication device and control program for communication device
US9507849B2 (en) Method for combining a query and a communication command in a natural language computer system
CN111557001A (en) Method, computer device and computer readable storage medium for providing natural language dialog by providing instant responsive language response
JP2008107673A (en) Conversation robot
KR102063389B1 (en) Character display device based the artificial intelligent and the display method thereof
JP7010193B2 (en) Dialogue device and control program for dialogue unit
JP2019203998A (en) Conversation device, robot, conversation device control method and program
JP2005196645A (en) Information presentation system, information presentation device and information presentation program
WO2020194828A1 (en) Information processing system, information processing device, and information processing method
WO2021064947A1 (en) Interaction method, interaction system, interaction device, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210426

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220228

R151 Written notification of patent or utility model registration

Ref document number: 7044031

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151