JP7044031B2 - コミュニケーション装置およびコミュニケーション装置の制御プログラム - Google Patents

コミュニケーション装置およびコミュニケーション装置の制御プログラム Download PDF

Info

Publication number
JP7044031B2
JP7044031B2 JP2018200830A JP2018200830A JP7044031B2 JP 7044031 B2 JP7044031 B2 JP 7044031B2 JP 2018200830 A JP2018200830 A JP 2018200830A JP 2018200830 A JP2018200830 A JP 2018200830A JP 7044031 B2 JP7044031 B2 JP 7044031B2
Authority
JP
Japan
Prior art keywords
response
utterance
conversion
filter
utterance sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018200830A
Other languages
English (en)
Other versions
JP2020067584A (ja
Inventor
亮輔 中西
美奈 舩造
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018200830A priority Critical patent/JP7044031B2/ja
Publication of JP2020067584A publication Critical patent/JP2020067584A/ja
Application granted granted Critical
Publication of JP7044031B2 publication Critical patent/JP7044031B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/10Energy storage using batteries

Description

本発明は、コミュニケーション装置およびコミュニケーション装置の制御プログラムに関する。
ユーザの発話を解析して意味内容を把握し、そのタイプに応じた応答発話を生成して音声またはテキストによりユーザに提示する技術が知られている(例えば、特許文献1参照)。
特開2010-140282号公報
コミュニケーション装置には、ユーザが親しみを持ちやすいように動物などのキャラクタ性が与えられるが、キャラクタのバリエーションを増やしても、いずれのキャラクタも画一的な語調で発話をさせると、かえって違和感を生じさせることになる。また、設定されているキャラクタの気質と、発話内容が一致しない場合にも、違和感を生じさせる。
本発明は、このような問題を解決するためになされたものであり、設定されたキャラクタに相応しい語調と内容でユーザと対話可能なコミュニケーション装置等を提供するものである。
本発明の第1の態様におけるコミュニケーション装置は、ユーザの発話である入力発話を入力する入力部と、入力発話に対する応答発話文を生成する応答生成モジュールと、応答生成モジュールが生成した応答発話文の内容が、予め設定されたキャラクタの気質に一致するか否かを判断する判断フィルタと、応答生成モジュールが生成した応答発話文に含まれる単語のうち、発話によってユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換ルックアップテーブルを参照して置き換える変換フィルタと、変換フィルタによって特定単語が置き換えられた応答発話文を出力する出力部とを備え、出力部は、判断フィルタが一致すると判断した場合に応答発話文を出力する。
このように構成することにより、キャラクタの設定にかかわらず汎用的に利用可能な応答生成モジュールが生成する応答発話文を、キャラクタの設定に合わせて個別に修正することができるので、キャラクタ設定に相応しい語調の発話を実現することができる。また、汎用的に利用可能な応答生成モジュールが生成する応答発話文から、キャラクタ設定に合った応答発話文を取捨選択できるようになる。
上記のコミュニケーション装置において、変換フィルタは、応答生成モジュールが生成した応答発話文の語尾の単語を特定単語として置き換える、語尾変換フィルタを含むと良い。キャラクタの性質を印象づける語調は、その一つとして語尾の単語に現れることが多い。このように語尾の特定の単語を置き換えることにより、効率的に応答発話文の語調を修正することができる。
また、上記のコミュニケーション装置において、変換フィルタは、応答生成モジュールが生成した応答発話文に含まれる単語のうち、名詞、形容詞、形容動詞、副詞の少なくともいずれかの一部の単語を特定単語として置き換える、言回し変換フィルタを含むと良い。キャラクタの性質を印象づける語調は、その一つとして名詞、形容詞、形容動詞、副詞の独特な言い回しとして現れることがある。このような品詞の特定の単語を置き換えることにより、効率的に応答発話文の語調を修正することができる。
また、上記のコミュニケーション装置において、出力部が、応答発話文を音声として出力する音声出力部と、応答発話文を文字として出力する文字出力部とを有する場合に、変換フィルタは、応答発話文を音声出力部により音声として出力する場合と文字出力部により文字として出力する場合に関わらず、単一の変換ルックアップテーブルを参照して特定単語を置き換えるようにすると良い。
また、上記のコミュニケーション装置において、変換フィルタは、判断フィルタが一致すると判断した場合に、応答生成モジュールが生成した応答発話文の特定単語を置き換えると良い。このような処理手順により、特定単語の置き換え処理を行った後に応答発話文として出力されない無駄を省くことができる。また、判断フィルタは、応答生成モジュールが応答発話文を生成するときに用い得るそれぞれの単語に対して気質に対応する属性が予め登録された属性ルックアップテーブルを参照して、応答発話文の内容が、気質に一致するか否かを判断するように構成すると良い。このように構成すると、比較的簡単な処理で判断を行えるので、処理の高速化に寄与する。
本発明の第2の態様におけるコミュニケーション装置の制御プログラムは、ユーザの発話である入力発話を入力する入力ステップと、入力発話に対する応答発話文を生成する応答生成ステップと、応答生成ステップで生成した応答発話文の内容が、予め設定されたキャラクタの気質に一致するか否かを判断する判断ステップと、応答生成ステップで生成した応答発話文に含まれる単語のうち、発話によってユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換ルックアップテーブルを参照して置き換える変換ステップと、判断ステップが一致すると判断した場合に、変換ステップによって特定単語が置き換えられた応答発話文を出力する出力ステップとをコンピュータに実行させる。このようなプログラムがコンピュータによって実行されるコミュニケーション装置によれば、第1の態様と同様に、キャラクタ設定に相応しい語調と内容の発話を実現することができる。
本発明により、設定されたキャラクタに相応しい語調と内容でユーザと対話可能なコミュニケーション装置等を提供することができる。
ロボットとユーザのコミュニケーション例を示す図である。 ロボットのシステム構成図である。 キャラクタの属性と気質を定義する設定ファイルの一例である。 語尾変換に用いられる語尾変換ルックアップテーブルの一例である。 言回し変換に用いられる言回し変換ルックアップテーブルの一例である。 ユーザの発話を受けてから応答するまでの処理を示すフロー図である。 第1変形例に係るロボットとユーザのコミュニケーション例を示す図である。 第2変形例に係るスマートフォンを示す図である。
以下、発明の実施の形態を通じて本発明を説明するが、特許請求の範囲に係る発明を以下の実施形態に限定するものではない。また、実施形態で説明する構成の全てが課題を解決するための手段として必須であるとは限らない。
図1は、第1の実施例に係るロボット100とユーザのコミュニケーションの例を示す図である。ロボット100は、ユーザである人間と音声対話を行うコミュニケーション装置である。ロボット100は、キャラクタを具現化したキャラクタ装置であり、対話に合わせて眼の表情や視線方向が変化するように構成しても良い。
ロボット100は、外観として動物を模しており、頭部110と胴体部120を有する。頭部110のいずれかの位置には、マイク101が隠されて配置されている。マイク101は、ユーザの発話音声を入力発話として入力する入力部としての機能を担う。ロボット100の口の位置には、スピーカ102が隠されて配置されている。また、スピーカ102は、ロボット100が生成した音声を発する出力部としての機能を担う。ユーザは、口の位置から出力される音声に、ロボット100が喋っているような感覚を覚える。本実施形態において説明するロボット100は、「おじいちゃん」のキャラクタ設定が成されており、発話文が「おじいちゃん」にありがちな語調に調整されて発せられる。図示するように、例えばユーザがロボット100に「今日の天気はどうなるの?」と話しかけると、ロボット100は、その話しかけに反応して、「晴れのちくもりじゃ。」などと発話する。
図2は、ロボット100のシステム構成図である。ここでは、ユーザとのコミュニケーションに関係する主な要素について説明するが、ロボット100の構成としては他の要素も備え、またコミュニケーションに寄与する他の要素が加えられることもあり得る。
ロボット100は、主なシステム構成として、マイク101、スピーカ102、制御部200、メモリ210、発話データベース220、極性辞書230、および変換ルックアップテーブル240(以下、「変換LUT240」と記す)を備えている。
制御部200は、例えばCPUによって構成され、ロボット100の全体を制御すると共に、様々な演算を実行する。マイク101は、主な機能として、ユーザの発話音声を集音する。マイク101は、集音したユーザの発話音声を音声信号に変換し、ユーザからの入力発話として制御部200へ引き渡す。
メモリ210は、不揮発性の記憶媒体であり、例えばソリッドステートドライブが用いられる。メモリ210は、ロボット100を制御するための制御プログラムの他にも、制御や演算に用いられる様々なパラメータ値、関数、ルックアップテーブル等を記憶している。特に、設定ファイル211を記憶している。設定ファイル211は、ロボット100に付与されるキャラクタ性に関する属性と気質を定義するファイルである。詳しくは後述する。
制御部200は、機能ごとの実行を担う機能実行部としても動作し、主に、発話解析部201、応答生成モジュール202、判断フィルタ203、変換フィルタ204および発話制御部205として動作する。発話解析部201は、マイク101から受け取った入力発話を解析してテキスト化し、ユーザの発話内容を認識する。発話解析部201は、具体的には、一般的な音声認識技術を用いてユーザの発話内容を認識する。例えば、テキスト化された入力発話に単語分析等を施して、DNNモデルやロジスティック回帰モデルを用いて発話内容を認識する。発話解析部201は、認識した発話内容を応答生成モジュール202へ引き渡す。
応答生成モジュール202は、発話データベース220を参照して入力発話に相応しい応答発話文を生成する。発話データベース220は、例えばハードディスクドライブに格納されたデータベースであり、コーパスとして体系化された個々の用語は、再生可能な音声データを伴って格納されている。なお、応答生成モジュール202は、標準的な言回しの応答発話文を生成する汎用的なモジュールであり、発話データベース220も、標準的な言回しの応答発話文を生成するための用語群が格納されている。
判断フィルタ203は、応答生成モジュール202が生成した応答発話文を受け取り、極性辞書230を参照してその内容を解析する。そして、解析結果が設定されたキャラクタの気質に一致するか否かを判断する。一致すれば、当該応答発話文を変換フィルタ204へ引き渡し、一致しなければ、応答生成モジュール202に応答発話文を再度生成するよう要求する。極性辞書230は、係り受け関係にある複数の単語を入力すると、その中の名詞が当該応答発話文において感情的に肯定的な意味合いを持つのか(以下、「ポジティブ」と称する)、否定的な意味合いをもつのか(以下、「ネガティブ」と称する)を出力する辞書である。極性辞書230は、例えばハードディスクドライブに格納されている。判断フィルタ203の具体的な処理については後述する。
変換フィルタ204は、応答生成モジュール202が生成した応答発話文に含まれる単語のうち、発話によってユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換LUT240を参照して置き換える変換フィルタである。変換フィルタ204は、語尾変換フィルタ203aと言回し変換フィルタ203bを含む。語尾変換フィルタ203aは、応答生成モジュール202が生成した応答発話文の語尾の単語を、変換LUT240に格納されている語尾変換LUTを参照して置き換える。言回し変換フィルタ203bは、応答生成モジュール202が生成した応答発話文に含まれる単語のうち、名詞、形容詞、形容動詞、副詞の少なくともいずれかの一部の単語を、変換LUT240に格納されている言回し変換LUTを参照して置き換える。変換LUT240は、例えばハードディスクドライブに格納されている。変換フィルタ204は、置き換え処理を終えた応答発話文を発話制御部205へ引き渡す。変換フィルタ204の具体的な処理については後述する。
発話制御部205は、受け取った応答発話文を音声信号に変換してスピーカ102へ引き渡す。スピーカ102は、発話制御部205で変換された音声信号を受け取って、出力発話を音声として出力する。
図3は、キャラクタの属性と気質を定義する設定ファイル211の一例である。設定ファイル211は、図示するように、キャラクタ属性の定義と、特定単語の気質属性を示す属性テーブルの2つを含む。キャラクタ属性は、例えば「おじいちゃん」であり、ロボット100に年配男性の属性を与えることが定義されている。属性は、他にも様々に定義し得る。年齢や性別を基準とするなら、「おじいちゃん」の他にも「おばあちゃん」や「少年」などを定義し得る。また、職種や地位を基準とするなら、「お侍さん」や「社長さん」などを定義し得る。
属性テーブルは、例えばロボット100に外出やアウトドアが好みであるとする「外向性志向」を付与する場合に、外向性志向に関連する特定単語を列挙し、それぞれの特定単語に「ポジティブ(P)」と「ネガティブ(N)」の気質属性を登録したテーブルである。登録する特定単語は、応答生成モジュールが応答発話文を生成するときに用い得る単語である。
「外向性志向」を付与する場合には、図示するように、屋外での活動に関する単語である「外出」、「キャンプ」に対しては「P」、屋内の活動に関する単語である「パソコン」、「模型」に対しては「N」の気質属性が登録されている。このように、ロボット100に付与される気質は、関連する特定単語に「P」が登録されているか「N」が登録されているかにより間接的に表わされる。換言すると、設定ファイルにどのような特定単語が列挙され、それぞれの特定単語にどのような気質属性が登録されているかによって、ロボット100の気質が総体的に定義付けられている。
判断フィルタ203は、まず、応答生成モジュール202が生成した応答発話文の係り受け関係を解析する。例えば、応答発話文として「キャンプは虫が多くて嫌いです。」の一文を受け取った場合には、係り受けとして「キャンプ」→「多く」、「嫌い」と「虫」→「多く」、「嫌い」のそれぞれの組み合わせを解析する。そして、この一文の主題である可能性が高い「キャンプ」「嫌い」の単語を抽出する。判断フィルタ203は、この2つの単語を極性辞書230に入力すると、「キャンプ」が「ネガティブ」であるとの結果を得る。判断フィルタ203は、次に、設定ファイル211を参照して、「キャンプ」が登録されているか、登録されていれば「P」か「N」のいずれであるかを確認する。上述のように、設定ファイル211には、「キャンプ」が「P」として登録されているので、極性辞書230の出力結果と矛盾する。したがって、判断フィルタ203は、応答発話文の内容がロボット100の気質に一致しないと判断する。判断フィルタ203は、応答発話文がロボット100の気質に一致しないと判断した場合には、応答生成モジュール202に応答発話文を再度生成するよう要求する。
例えば、応答発話文として「私は外出が好きです。」の一文を受け取った場合には、係り受けとして「私」→「好き」、「外出」→「好き」のそれぞれの組み合わせを解析する。そして、この一文の主題である可能性が高い「外出」「好き」の単語を抽出する。判断フィルタ203は、この2つの単語を極性辞書230に入力すると、「外出」が「ポジティブ」であるとの結果を得る。判断フィルタ203は、次に、設定ファイル211を参照して、「外出」が登録されているか、登録されていれば「P」か「N」のいずれであるかを確認する。上述のように、設定ファイル211には、「外出」が「P」として登録されているので、極性辞書230の出力結果と一致する。したがって、判断フィルタ203は、応答発話文の内容がロボット100の気質と一致すると判断する。判断フィルタ203は、応答発話文がロボット100の気質と一致すると判断した場合には、当該応答発話文を変換フィルタ204へ引き渡す。なお、応答発話文から抽出された単語のいずれもが、設定ファイル211の属性テーブルに登録されていない場合には、当該応答発話文をそのまま変換フィルタ204へ引き渡す。
図4は、語尾変換に用いられる語尾変換LUTの一例である。語尾変換LUTは、図示するように、対象キャラクタを示すキャラクタ属性と、特定語尾の置き換えを列挙した置換テーブルの2つを含む。図示するように、キャラクタ属性が「おじいちゃん」に指定されている場合は、設定ファイル211に「おじいちゃん」が定義されているロボット100の語尾変換フィルタ203aに参照される。すなわち、語尾変換LUTは、設定ファイル211に定義され得るキャラクタ属性ごとに予め作成されて、変換LUT240に格納される。
置換テーブルは、置換え対象となる特定語尾と、その置換え後である変換語尾との組み合わせが列挙されたテーブルである。語尾変換LUTにおける特定語尾は、応答生成モジュール202が生成する標準的な言回しの応答発話文の語尾に用いられる単語である。語尾変換LUTにおける変換語尾は、指定されたキャラクタ属性が語尾として用いる傾向のある単語である。キャラクタ属性が「おじいちゃん」であれば、「だけど」(特定語尾)に対して「じゃけど」(変換語尾)、「です」(特定語尾)に対して「じゃ」(変換語尾)のように組み合わされる。
語尾変換フィルタ203aは、応答生成モジュール202が生成した応答発話文の特定語尾を、語尾変換LUTを参照して変換語尾に置き換える。例えば、語尾変換フィルタ203aが受け取った応答発話文が「私の友達はお年寄りだけど、みんな元気です。」であれば、「だけど」「です」が特定語尾に該当するので、これを変換語尾の「じゃけど」「じゃ」に置き換え、「私の友達はお年寄りじゃけど、みんな元気じゃ。」とする。また、「もう服はたくさん持っているから、いらないかなあ。」であれば、「もう服はたくさん持っているから、いらないかのう。」とする。
キャラクタの性質を印象づける語調は、その一つとして語尾の単語に現れることが多いので、このように語尾の特定の単語を置き換えることにより、効率的に応答発話文の語調を修正することができる。ユーザは、修正された語調により、ロボット100のキャラクタ性をより強く感じることができる。
図5は、言回し変換に用いられる言回し変換LUTの一例である。言回し変換LUTは、図示するように、対象キャラクタを示すキャラクタ属性と、特定単語の置き換えを列挙した置換テーブルの2つを含む。図示するように、キャラクタ属性が「おじいちゃん」に指定されている場合は、設定ファイル211に「おじいちゃん」が定義されているロボット100の言回し変換フィルタ203bに参照される。すなわち、言回し変換LUTは、設定ファイル211に定義され得るキャラクタ属性ごとに予め作成されて、変換LUT240に格納される。
置換テーブルは、置換え対象となる特定単語と、その置換え後である変換単語との組み合わせが列挙されたテーブルである。言回し変換LUTにおける特定単語は、応答生成モジュール202が生成する標準的な言回しの応答発話文に含まれる単語のうち、名詞、形容詞、形容動詞、副詞の少なくともいずれかの一部の単語である。言回し変換LUTにおける変換単語は、指定されたキャラクタ属性が用いる傾向にある、変換単語に対応する単語である。キャラクタ属性が「おじいちゃん」であれば、「私」(特定単語:名詞)に対して「儂」(変換単語:名詞)、「たくさん」(特定単語:副詞)に対して「たんと」(変換単語:副詞)、「かわいい」(特定単語:形容詞)に対して「かわゆい」(変換単語:形容詞)のように組み合わされる。
言回し変換フィルタ203bは、語尾変換フィルタ203aが語尾を置き換えた応答発話文の特定単語を、言回し変換LUTを参照して変換単語に置き換える。例えば、言回し変換フィルタ203bが受け取った応答発話文が「私の友達はお年寄りじゃけど、みんな元気じゃ。」であれば、「私」が特定単語に該当するので、これを変換単語の「儂」に置き換え、「儂の友達はお年寄りじゃけど、みんな元気じゃ。」とする。また、「もう服はたくさん持っているから、いらないかのう。」であれば、「もう服はたんと持っているから、いらないかのう。」とする。
キャラクタの性質を印象づける語調は、その一つとして名詞、形容詞、形容動詞、副詞の独特な言い回しとして現れることがあるので、このような品詞の特定の単語を置き換えることにより、効率的に応答発話文の語調を修正することができる。ユーザは、修正された語調により、ロボット100のキャラクタ性をより強く感じることができる。
次に、ユーザの発話を受けてから応答するまでの制御部200の処理の流れについて説明する。図6は、ユーザの発話を受けてから応答するまでの処理を示すフロー図である。図のフローは、ユーザが1フレーズを発話してから、ロボット100が1フレーズ返すまでの処理を表わしている。
制御部200は、ステップS101で、マイク101を介してユーザ発話を取得すると、機能ブロックとしての発話解析部201が、ステップS102で、当該ユーザ発話を入力発話として解析し認識する。発話解析部201は、認識した発話内容を応答生成モジュール202へ引き渡す。応答生成モジュール202は、ステップS103で、発話データベース220を参照して入力発話に対する応答発話文を生成する。応答生成モジュール202は、生成した応答発話文を判断フィルタ203へ引き渡す。
判断フィルタ203は、ステップS104で、極性辞書230を参照して受け取った応答発話文の内容を解析する。そして、ステップS105で、設定ファイル211の属性テーブルを参照して、解析結果が設定されたキャラクタの気質に一致するか否かを判断する。一致していないと判断したら、応答生成モジュール202に再度応答発話文を生成さるべく、ステップS103へ戻る。一致していると判断したら、応答発話文を変換フィルタ204へ引き渡して、ステップS106へ進む。
語尾変換フィルタ203aは、ステップS106で、変換LUT240の語尾変換LUTを参照し、受け取った応答発話文の特定語尾を置き換えて、言回し変換フィルタ203bへ引き渡す。応答発話文に特定語尾が含まれない場合には、受け取った応答発話文をそのまま言回し変換フィルタ203bへ引き渡す。
言回し変換フィルタ203bは、ステップS107で、変換LUT240の言回し変換LUTを参照し、受け取った応答発話文の特定単語を置き換えて、発話制御部205へ引き渡す。応答発話文に特定単語が含まれない場合には、受け取った応答発話文をそのまま発話制御部205へ引き渡す。なお、ステップS106とステップS107の処理の順序は逆であっても良い。
発話制御部205は、ステップS108で、受け取った出力発話を音声信号に変換して、スピーカ102から発声させる。以上により、一連の処理を終了する。再びユーザからの発話があれば、同様に繰り返す。
なお、以上説明した本実施形態においては、判断フィルタ203の処理を行ってから変換フィルタ204の処理を行った。この手順で処理することにより、特定単語の置き換え処理を行った後に応答発話文として出力されない無駄を省くことができる。ただし、応答生成モジュール202に変換フィルタ204を組み込む構成にする場合等においては、必ずしもこの順序でなくても良い。
次に、第1変形例について説明する。図6は、第1変形例に係るロボットとユーザのコミュニケーション例を示す図である。上述の実施形態では、ロボット100が単独でユーザとコミュニケーションが取れるように、主要な機能要素を全て本体に備える構成であったが、第1変形例におけるロボット100’は、演算に関する機能要素をサーバ300に任せる構成を採用する。
例えばユーザがロボット100’に「今日の天気はどうなるの?」と話しかけると、ロボット100’のマイクがその音声を取り込む。ロボット100’は、取り込んだ音声を音声信号に変換して、無線通信によりサーバ300へ送信する。サーバ300は、これらの情報を用いて、応答音声(図の例では「晴れのちくもりじゃ。」)の音声データを調整して、ロボット100’へ送信する。ロボット100’は、受け取った音声データに対応する音声をスピーカ102から発する。
このような第1変形例のシステム構成であっても、上述の実施形態と同様に、ユーザとのコミュニケーションを実現できる。また、演算に関する機能をサーバ300に集約することで、ロボット100’の構成を簡易にすることができ、ロボット100’に高性能な制御チップを設けなくても、キャラクタ性を存分に表出したコミュニケーションを実現できる。また、サーバ300が演算に関する機能を担うのであれば、複数のロボット100’からの演算要請にシーケンシャルに応えることもできるので、システム全体としての製造コストを軽減することもできる。
次に、第2変形例について説明する。図8は、第2変形例に係るスマートフォン700を示す図である。上述の実施形態および第1変形例においては、キャラクタを具現化したロボット100、100’をユーザが対話する相手としたが、第2変形例においては、スマートフォン700に表示した映像キャラクタ800を対話する相手とする。キャラクタをロボットとして実体化すれば、ユーザは、ペットのように感じることができ、より愛着を持てるようになるが、スマートフォン700でより簡便にキャラクタを表現することもできる。
スマートフォン700のシステム構成は、図2を用いて説明したロボット100のシステム構成とほぼ共通する。共通する構成についてはその説明を省略して、異なる構成について以下に説明する。
スマートフォン700は、表示パネル710、マイク711、スピーカ712を備える。表示パネル710は、例えば液晶パネルであり、映像キャラクタ800を表示する。マイク711は、ロボット100におけるマイク101と置き換わる要素であり、ユーザの発話音声を集音する。スピーカ712は、ロボット100におけるスピーカ102と置き換わる要素であり、発話制御部205で変換された音声信号を受け取って、出力発話を音声出力する。
また、表示パネル710には、ユーザの発話である入力発話を文字で示す入力テキストウィンドウ721が表示される。発話解析部201は、入力発話を文字変換して入力テキストウィンドウ721を生成し、表示パネル710に表示する。さらに、表示パネルには、生成された応答発話文を文字で示す出力テキストウィンドウ722が表示される。発話制御部205は、応答発話文を文字変換して出力テキストウィンドウ722を生成し、表示パネル710に表示する。
このように文字情報として表示すれば、視覚的にも対話を確認することができる。また、音声出力をオフにすれば、ユーザは、静かな環境においても、周囲に迷惑をかけることなく、コミュニケーションを楽しむことができる。また、入力発話も音声としてではなく、スマートフォン700の文字入力機能を用いて文字で与えれば、ユーザは、音声を介さずにコミュニケーションを楽しむことができる。この場合は、入力発話も出力発話も文字情報として処理される。
なお、このように、スピーカ712を音声出力部として機能させ、表示パネル710を文字出力部として機能させる場合には、変換フィルタ204は、応答発話文をスピーカ712により音声として出力する場合と表示パネル710により文字として出力する場合に関わらず、単一の変換LUT240を参照して特定単語を置き換えると良い。このように構成すれば、別々のLUTを参照して異なる応答発話文を生成してしまうことを防ぐことができる。
このようにスマートフォン700をコミュニケーション装置として機能させれば、コミュニケーション装置としての専用ハードウェアを必要としないので、ユーザはより気軽にキャラクタとの対話を楽しむことができる。また、スマートフォン700の他のアプリケーションに連動させて映像キャラクタ800と対話できるように構成すれば、様々な用途に応用できる。なお、スマートフォン700は、第1例のように、サーバが連携するシステムであっても良い。
また、スマートフォン700をコミュニケーション装置として機能させるのであれば、装置の外観がキャラクタ性を認識させることがない。したがって、スマートフォン700に様々な映像キャラクタ800を用意しておき、ユーザがその中から対話相手を選べるように構成することができる。このように、一つのコミュニケーション装置に、選択し得る複数のキャラクタを用意する場合には、それぞれのキャラクタに応じた設定ファイル211を併せて用意しておけば良い。
100、100’ ロボット、101 マイク、102 スピーカ、110 頭部、120 胴体部、200 制御部、201 発話解析部、202 応答生成モジュール、203 判断フィルタ、204 変換フィルタ、204a 語尾変換フィルタ、204b 言回し変換フィルタ、205 発話制御部、210 メモリ、211 設定ファイル、220 発話DB、230 極性辞書、240 変換LUT、300 サーバ、700 スマートフォン、710 表示パネル、711 マイク、712 スピーカ、721 入力テキストウィンドウ、722 出力テキストウィンドウ、800 映像キャラクタ

Claims (7)

  1. ユーザの発話である入力発話を入力する入力部と、
    前記入力発話に対する応答発話文を生成する応答生成モジュールと、
    前記応答生成モジュールが生成した前記応答発話文の内容が、予め設定されたキャラクタの気質に一致するか否かを判断する判断フィルタと、
    前記応答生成モジュールが生成した前記応答発話文に含まれる単語のうち、発話によって前記ユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換ルックアップテーブルを参照して置き換える変換フィルタと、
    前記変換フィルタによって前記特定単語が置き換えられた前記応答発話文を出力する出力部と
    を備え、
    前記出力部は、前記判断フィルタが一致すると判断した場合に前記応答発話文を出力するコミュニケーション装置。
  2. 前記変換フィルタは、前記応答生成モジュールが生成した前記応答発話文の語尾の単語を前記特定単語として置き換える、語尾変換フィルタを含む請求項1に記載のコミュニケーション装置。
  3. 前記変換フィルタは、前記応答生成モジュールが生成した前記応答発話文に含まれる単語のうち、名詞、形容詞、形容動詞、副詞の少なくともいずれかの一部の単語を前記特定単語として置き換える、言回し変換フィルタを含む請求項1または2に記載のコミュニケーション装置。
  4. 前記出力部は、前記応答発話文を音声として出力する音声出力部と、前記応答発話文を文字として出力する文字出力部とを有し、
    前記変換フィルタは、前記応答発話文を前記音声出力部により音声として出力する場合と前記文字出力部により文字として出力する場合に関わらず、単一の前記変換ルックアップテーブルを参照して前記特定単語を置き換える請求項1から3のいずれか1項に記載のコミュニケーション装置。
  5. 前記変換フィルタは、前記判断フィルタが一致すると判断した場合に、前記応答生成モジュールが生成した前記応答発話文の前記特定単語を置き換える請求項1から4のいずれか1項に記載のコミュニケーション装置。
  6. 前記判断フィルタは、前記応答生成モジュールが前記応答発話文を生成するときに用い得るそれぞれの単語に対して前記気質に対応する属性が予め登録された設定ファイルを参照して、前記応答発話文の内容が、前記気質に一致するか否かを判断する請求項1から5のいずれか1項に記載のコミュニケーション装置。
  7. ユーザの発話である入力発話を入力する入力ステップと、
    前記入力発話に対する応答発話文を生成する応答生成ステップと、
    前記応答生成ステップで生成した前記応答発話文の内容が、予め設定されたキャラクタの気質に一致するか否かを判断する判断ステップと、
    前記応答生成ステップで生成した前記応答発話文に含まれる単語のうち、発話によって前記ユーザに与える印象を変化させるキャラクタ性付与に関する特定単語を、変換ルックアップテーブルを参照して置き換える変換ステップと、
    前記判断ステップが一致すると判断した場合に、前記変換ステップによって前記特定単語が置き換えられた前記応答発話文を出力する出力ステップと
    をコンピュータに実行させるコミュニケーション装置の制御プログラム。
JP2018200830A 2018-10-25 2018-10-25 コミュニケーション装置およびコミュニケーション装置の制御プログラム Active JP7044031B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018200830A JP7044031B2 (ja) 2018-10-25 2018-10-25 コミュニケーション装置およびコミュニケーション装置の制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018200830A JP7044031B2 (ja) 2018-10-25 2018-10-25 コミュニケーション装置およびコミュニケーション装置の制御プログラム

Publications (2)

Publication Number Publication Date
JP2020067584A JP2020067584A (ja) 2020-04-30
JP7044031B2 true JP7044031B2 (ja) 2022-03-30

Family

ID=70390268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018200830A Active JP7044031B2 (ja) 2018-10-25 2018-10-25 コミュニケーション装置およびコミュニケーション装置の制御プログラム

Country Status (1)

Country Link
JP (1) JP7044031B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022249222A1 (ja) * 2021-05-24 2022-12-01

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108362A (ja) 2001-07-23 2003-04-11 Matsushita Electric Works Ltd コミュニケーション支援装置およびコミュニケーション支援システム
JP2015148701A (ja) 2014-02-06 2015-08-20 日本電信電話株式会社 ロボット制御装置、ロボット制御方法及びロボット制御プログラム
JP2017151394A (ja) 2016-02-26 2017-08-31 シャープ株式会社 制御装置、制御装置の制御方法、および表示装置
JP2018092485A (ja) 2016-12-06 2018-06-14 カシオ計算機株式会社 文生成装置、文生成方法及びプログラム
JP2019015837A (ja) 2017-07-06 2019-01-31 一般社団法人It&診断支援センター・北九州 猫の性格を持つ会話型ロボット及び猫の性格を発現させる対話管理プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108362A (ja) 2001-07-23 2003-04-11 Matsushita Electric Works Ltd コミュニケーション支援装置およびコミュニケーション支援システム
JP2015148701A (ja) 2014-02-06 2015-08-20 日本電信電話株式会社 ロボット制御装置、ロボット制御方法及びロボット制御プログラム
JP2017151394A (ja) 2016-02-26 2017-08-31 シャープ株式会社 制御装置、制御装置の制御方法、および表示装置
JP2018092485A (ja) 2016-12-06 2018-06-14 カシオ計算機株式会社 文生成装置、文生成方法及びプログラム
JP2019015837A (ja) 2017-07-06 2019-01-31 一般社団法人It&診断支援センター・北九州 猫の性格を持つ会話型ロボット及び猫の性格を発現させる対話管理プログラム

Also Published As

Publication number Publication date
JP2020067584A (ja) 2020-04-30

Similar Documents

Publication Publication Date Title
US10943605B2 (en) Conversational interface determining lexical personality score for response generation with synonym replacement
US10878816B2 (en) Persona-based conversational interface personalization using social network preferences
US8902050B2 (en) Systems and methods for haptic augmentation of voice-to-text conversion
US9053096B2 (en) Language translation based on speaker-related information
AU2014331209B2 (en) Method for dialogue between a machine, such as a humanoid robot, and a human interlocutor; computer program product; and humanoid robot for implementing such a method
KR20190006403A (ko) 음성 처리 방법 및 이를 지원하는 시스템
CN111542814A (zh) 改变应答以提供表现丰富的自然语言对话的方法、计算机装置及计算机可读存储介质
RU2685392C1 (ru) Обеспечение автономной семантической обработки в устройстве с ограниченными ресурсами
WO2018061774A1 (ja) 情報処理システム、情報処理装置、情報処理方法、及び記憶媒体
KR20160132748A (ko) 전자 장치 및 그 제어 방법
WO2018235607A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US20180275956A1 (en) Prosthesis automated assistant
WO2018061776A1 (ja) 情報処理システム、情報処理装置、情報処理方法、及び記憶媒体
JP7044031B2 (ja) コミュニケーション装置およびコミュニケーション装置の制御プログラム
JP7063230B2 (ja) コミュニケーション装置およびコミュニケーション装置の制御プログラム
CN111556999B (zh) 通过即时提供实质性回答以提供自然语言对话的方法、计算机装置及计算机可读存储介质
McDonnell et al. “Easier or Harder, Depending on Who the Hearing Person Is”: Codesigning Videoconferencing Tools for Small Groups with Mixed Hearing Status
CN111557001B (zh) 提供自然语言对话的方法、计算机装置及计算机可读存储介质
JP6643077B2 (ja) 対話システムおよびプログラム
Mueller Data logging: It's popular, but how can this feature be used to help patients?
US20220141160A1 (en) Electronic apparatus for responding to question using multi chat-bot and control method thereof
JP6660770B2 (ja) 対話システムおよびプログラム
KR20200040625A (ko) 사용자의 발화를 처리하는 사용자 단말 및 그 제어 방법
JP7010193B2 (ja) 対話装置および対話装置の制御プログラム
WO2021064947A1 (ja) 対話方法、対話システム、対話装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210426

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220228

R151 Written notification of patent or utility model registration

Ref document number: 7044031

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151