JP2016109897A

JP2016109897A - 電子機器、発話制御方法、およびプログラム

Info

Publication number: JP2016109897A
Application number: JP2014247827A
Authority: JP
Inventors: 孝之永松; Takayuki Nagamatsu
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2014-12-08
Filing date: 2014-12-08
Publication date: 2016-06-20
Anticipated expiration: 2034-12-08
Also published as: JP6452420B2

Abstract

【課題】会話の相手に適した発話をする電子機器を提供する。
【解決手段】電子機器であるロボット１は、人との会話に基づき人の特徴を判定し、判定された特徴に応じた発話を行なう。ロボット１は、方言の種別や年齢層、性別などを音声特徴から判定し、判定された種別、年齢層、性別に適した発話を行なう。
【選択図】図２

Description

本発明は、発話が可能な電子機器、電子機器における発話制御方法、および電子機器を制御するためのプログラムに関する。

従来、フレーズから語調に関する特徴量を分析する技術が知られている。たとえば、特許文献１には、このような分析技術を備えるユーザプロファイル抽出装置が開示されている。当該ユーザプロファイル抽出装置は、発話者の音声信号から有声区間の音声信号をフレーズとして抽出し、フレーズから語調に関する特徴量を分析する。さらに、ユーザプロファイル抽出装置は、第１記憶手段に記憶されている地域別の語調特徴量を読み出して、分析した特徴量に最も近い語調特徴量に対応する地域を判定する。

特許文献２にも、上記のような分析技術を備える情報処理システムが開示されている。情報処理システムでは、音声状況判定部が、ユーザの音声信号から発話中の方言を語調に基づいて分析し、方言が使用されている地域を判定すると共に、分析された方言の数及び各方言の使用時間長に基づいて利用者の発話状況を判定する。さらに、当該情報処理システムでは、サービスゲートウェイが、前回の会話から一定時間以内に該利用者から情報検索要求が送信された場合に、判定された地域情報及び利用者の発話状況に対応する付加情報を情報検索要求に追加して、追加された付加情報に対応する情報検索応答を利用者に提供する。

また、従来、ユーザとの間で会話が可能なロボットが開発されている。たとえば、特許文献３には、このようなロボットとしてのコミュニケーションロボットが開示されている。当該コミュニケーションロボットは、ユーザが発話する言葉を検知する音声検知手段と、所定の応答反応を表出する反応表出手段とを有する。コミュニケーションロボットは、ユーザの話し言葉に反応して予め定められた複数パターンの応答反応を表出させる。詳しくは、コミュニケーションロボットは、話し言葉が通常表現であるか否かの判定、話し言葉が同意要求表現であるか否かの判定、話し言葉が断定表現であるか否かの判定の少なくともいずれかの判定を実施し、判定結果に基づいて異なる応答反応を表出させる。

特許文献４には、子供の相手をするためのロボットが開示されている。当該ロボットは、子供の状況を示す情報を取得する。また、ロボットは、取得された状況に基づき、状況と、当該状況が生じたときにロボットがとるべき行動とを対応づけて記憶する行動記憶部を参照して、行動を決定する。

特開２０１０−２５６７６５号公報特開２０１０−２７７３８８号公報特開２０１３−８６２２６号公報特開２００５−３０５６３１号公報

特許文献１のユーザプロファイル抽出装置は、特定された方言を用いて発話をするものではない。この点は、特許文献２の情報処理システムでも同様である。

特許文献３における応答反応は、相槌を打つこと、首を振ること等である。それゆえ、応答反応は、ロボットがユーザに話す場合の話し言葉とは関連性がない。

特許文献４のロボットは、ロボットの前にいる子供の声に基づき行動を決定する構成であって、子供との会話を通じて行動を決定するものではない。

本願発明は、上記の問題点に鑑みなされたものであって、その目的は、会話の相手に適した発話をすることが可能な電子機器、発話制御方法、およびプログラムを提供することにある。

本発明のある局面に従うと、電子機器は、人との会話に基づき人の特徴を判定し、判定された特徴に応じた発話を行なう。

好ましくは、特徴は、方言の種別、年齢層、および会話時の気分のうちの少なくとも１つである。

好ましくは、特徴は、方言の種別である。電子機器は、発話のために音声を出力する音声出力手段と、方言の種別を判定する第１の判定手段と、判定された特徴に応じた発話を音声出力手段に行なわせる発話制御手段とを備える。発話制御手段は、音声出力手段に判定された種別の方言で発話させる。

好ましくは、特徴は、方言の種別である。電子機器は、発話のために音声を出力する音声出力手段と、方言の種別を判定する第１の判定手段と、判定された特徴に応じた発話を音声出力手段に行なわせる発話制御手段とを備える。発話制御手段は、音声出力手段に判定された種別の方言が用いられている地域の情報に関する発話を行なわせる。

好ましくは、特徴は、年齢層である。電子機器は、発話のために音声を出力する音声出力手段と、人の年齢層を判定する第２の判定手段と、判定された特徴に応じた発話を音声出力手段に行なわせる発話制御手段とを備える。発話制御手段は、音声出力手段に判定された年齢層に見合った話し方で発話を行わせる。

好ましくは、発話制御手段は、音声出力手段に判定された年齢層に見合った内容を発話させる。

好ましくは、特徴は、気分である。電子機器は、発話のために音声を出力する音声出力手段と、人の気分を判定する第３の判定手段と、判定された特徴に応じた発話を音声出力手段に行なわせる発話制御手段とを備える。発話制御手段は、音声出力手段に判定された気分に応じた発話を行なわせる。

好ましくは、電子機器は、複数の人との会話に基づき複数の人の各々の特徴を判定する。電子機器は、判定された複数の特徴のうち、特徴を共通にする人が最も多い特徴を特定する。電子機器は、特定された特徴に応じた発話を行なう。

好ましくは、電子機器は、複数の人のうち特定された特徴とは異なる特徴を有する人に対して発話する場合には、特定された特徴に応じた発話を行なわずに、当該人の特徴に応じた発話を行なう。

好ましくは、電子機器は自走式のロボットである。
本発明の他の局面に従うと、発話制御方法は、電子機器において実行される。発話制御方法は、人との会話に基づき人の特徴を判定するステップと、判定された特徴に応じた発話を行なうステップとを備える。

本発明のさらに他の局面に従うと、プログラムは、電子機器を制御する。プログラムは、人との会話に基づき人の特徴を判定するステップと、判定された特徴に応じた発話を行なうステップとを、電子機器のプロセッサに実行させる。

上記の発明によれば、会話の相手に適した発話をすることが可能となる。

ロボット１の外観を表した図である。ロボット１と人９０１とが会話をしている状態を表した図である。ロボット１が使用するデータベースＤ３の概略構成を説明するための図である。ロボット１の機能的構成を説明するための機能ブロック図である。ロボット１における処理の流れを説明するためのフローチャートである。ロボット１のハードウェア構成を表した図である。ロボット１と複数の人間とが輪になっている状況を表した図である。ロボット１における処理の流れを説明するためのフローチャートである。図８のステップＳ１１０，Ｓ１１８の処理における例外処理を説明するためのフローチャートである。ロボットとサーバとを備えた通信システムの概略図である。ロボット２と人９０１とが会話をしている状態を表した図である。

以下、図面を参照しつつ、本発明の各実施の形態に係る電子機器について説明する。また、以下の説明では、同一の部材には同一の参照符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。

また、実施の形態１〜４では、電子機器が自走式の人間型ロボットである場合を例に挙げて説明する。実施の形態５では、電子機器が自走式の掃除機型ロボットである場合を例に挙げて説明する。なお、電子機器は、必ずしもロボットである必要はない。また、上記ロボットは、必ずしも自走式ではなくてもよい。

さらに、実施の形態１では、説明を簡略化するため、ロボットが一人の人間と会話するときの処理を説明する。その後、実施の形態２等において、ロボットが複数の人間と会話するときの処理を説明する。
［実施の形態１］
＜Ａ．外観＞
図１は、ロボット１の外観を表した図である。図１を参照して、ロボット１は、車輪１１１によって自走可能なロボットである。ロボット１は、タッチスクリーン１０９を備えている。ロボット１は、発話機能のみならず、人と会話を行なう機能を備える。このため、ロボット１は、図示しないマイクおよびスピーカを筐体に備えている。なお、ロボット１は、一般家庭のみならず、公共施設で使用され得る。公共施設としては、たとえば、駅、空港等が挙げられる。

＜Ｂ．処理の概要＞
ロボット１は、人との会話に基づき当該人の特徴を判定し、当該判定された特徴に応じた発話を行なう。典型的には、ロボット１は、人との会話における内容および音声に基づき、人が使用する方言の種別、人の年齢層、人の気分等を判定し、判定結果に基づいた発話を行なう。また、ある局面では、ロボット１は、人との会話に基づき当該人の特徴を判定し、当該判定された特徴に応じた発話を行なう。

上述したように、上記特徴としては、方言の種別、年齢層、および会話時の気分が挙げられる。なお、特徴は、これらに限定されるものではない。以下では、特徴が上記の典型な例である場合の処理について、例を挙げて説明する。

（ｂ１．方言の種別）
ロボット１は、人との会話を通じて、人の特徴として方言の種別を判定する。ロボット１は、当該判定結果に基づいた発話を行なう。たとえば、ロボット１は、判定された種別の方言を用いた発話を行なう。

図２は、ロボット１と人（男性）９０１とが会話をしている状態を表した図である。図２を参照して、ロボット１は、人９０１が発話した言葉がたとえば関西弁であると判定すると、人９０１に対して関西弁で発話を行なう。

判定結果に基づいた発話は、判定された種別の方言を用いた発話に限定されるものではない。たとえば、判定結果に基づいた発話は、判定された種別の方言が用いられている地域の情報が含まれたものであってもよい。

（ｂ２．年齢）
ロボット１は、人９０１との会話を通じて、人９０１の特徴として年齢層を判定する。ロボット１は、当該判定結果に基づいた発話を行なう。典型的には、ロボット１は、判定された年齢層に応じた発話（話し方）をする。また、ロボット１は、判定された年齢層に応じた内容を発話する。

（ｂ３．気分）
ロボット１は、人９０１との会話を通じて、人９０１の特徴として会話時の人９０１の気分を判定する。ロボット１は、判定結果（気分）に応じた発話を行なう。たとえば、ロボット１は、人９０１が落ち込んでいると判定すると、優しい口調で発話する。

（ｂ４．利点）
以上のように、ロボット１が、人９０１との会話に基づき人９０１の特徴を判定し、当該判定された特徴に応じた発話を行なうため、ロボット１は、会話の相手に適した発話をすることが可能となる。それゆえ、人９０１は、ロボット１との会話を通じて、ロボット１に親近感を抱くことができる。したがって、ロボット１と人９０１との会話が活発になり、ロボット１が人９０１にとって一層役に立つ存在となり得る。

以下、上記のような機能を有するロボット１の詳細について説明する。
＜Ｃ．データ＞
図３は、ロボット１が使用するデータベースＤ３の概略構成を説明するための図である。図３を参照して、データベースＤ３は、上述した特徴とロボットの発話形式とが対応付けられている。特徴は、複数に分類（大分類）されている。詳しくは、各分類は、さらに、複数に分類（小分類）されている。データベースＤ３においては、小分類毎に、ロボットの発話形式が対応付けられている。

大分類としては、典型的には、上述したように、方言の種別、年齢層、および発話時の気分（機嫌）が挙げられる。方言の種別についての分類（小分類）としては、“標準語”、“関西弁”、“九州弁”等が挙げられる。年齢層についての分類としては、“幼い”、“学生”、“お年寄り”等が挙げられる。発話時の気分についての分類としては、“機嫌よい”、“怒り”、“苛立ち”、“落ち込み”等が挙げられる。

ロボット１は、データベースＤ３を参照し、人９０１との会話に使用するフレーズ、語調等を決定する。詳しくは、ロボット１は、データベースＤ３を参照し、人９０１との会話を通じて、人９０１の特徴を判定する。その後、ロボット１は、判定された特徴に応じた発話を行なう。一例として、ロボット１は、人９０１の発話が関西弁であって、年寄りの発話であると判定すると、関西弁で発話するとともに、ゆっくり一語ずつ丁寧に話す。

なお、小分類毎のロボットの発話形式の欄に、複数の発話形式（たとえば、“標準語で話す”、“日本で最近の話題を活用する”）が記載されている場合には、ロボット１は、全ての発話形式を利用して、人９０１に対して発話を行なってもよいし、あるいは、ロボット１は、複数の発話形式のうちの１つを利用して、人９０１に対して発話してもよい。後者の場合には、ロボット１は、予め定められた規則に基づき、どの発話形式を選択するかを決定すればよい。

＜Ｄ．機能的構成＞
図４は、ロボット１の機能的構成を説明するための機能ブロック図である。図４を参照して、ロボット１は、制御部１５１と、音声入力部１５２と、記憶部１５３と、音声出力部１５４と、通信部１５５とを備える。

制御部１５１は、特徴判定部１５１０と、発話制御部１５２０とを含む。特徴判定部１５１０は、方言判定部１５１１と、年齢層判定部１５１２と、気分判定部１５１３とを有する。

制御部１５１は、ロボット１の全体の動作を制御する。詳しくは、制御部１５１は、記憶部１５３に記憶された、オペレーティングシステムおよび各種のプログラムを実行することにより、ロボット１の全体の動作を制御する。さらに詳しくは、ロボット１は、記憶部１５３に記憶されたデータベースＤ３（図３）を参照して、特徴を判定し、当該判定された特徴に応じた発話を行なうための制御を行なう。

音声入力部１５２は、マイク１０８（図６）に対応する。音声入力部１５２からは、人９０１等の声、周囲の雑音等が入力される。

音声出力部１５４は、スピーカ１０６（図６）に対応する。音声出力部１５４は、典型的には、発話のために音声を出力する。

通信部１５５は、無線通信ＩＦ（InterFace）１１２およびアンテナ１１３に対応する。通信部１５５は、他の通信機器（図示せず）と通信するために設けられている。

次に、制御部１５１の特徴判定部１５１０と発話制御部１５２０との処理について説明する。

特徴判定部１５１０は、人９０１との会話に基づき人９０１の特徴を判定する。発話制御部１５２０は、上記判定された特徴に応じた発話を音声出力部１５４に行なわせる。

方言判定部１５１１は、人９０１が方言で発話した場合、当該方言の種別を判定する。具体的に説明すると以下の通りである。記憶部１５３には、各地域の方言（複数の言葉）が当該地域（正確には地域の識別情報）に対応付けて記憶されている。方言判定部１５１１は、人９０１が方言を発話した場合、当該方言の種別を判定する。方言判定部１５１１は、判定結果を発話制御部１５２０に送る。

発話制御部１５２０は、典型的には、判定された種別の方言を音声出力部１５４に発話させる制御を行なう。具体的には、発話制御部１５２０は、データベースＤ３におけるロボットの発話形式を参照することにより、たとえば判定された種別の方言を音声出力部１５４に発話させる制御を行なう。

あるいは、発話制御部１５２０は、データベースＤ３におけるロボットの発話形式を参照することにより、判定された種別の方言が用いられている地域の情報を含んだ発話を、音声出力部１５４に行わせてもよい。

年齢層判定部１５１２は、人９０１が発話した場合、人９０１の年齢層を判定する。具体的に説明すると以下の通りである。具体的に説明すると以下の通りである。記憶部１５３には、年齢層を判定するためのデータ（図示せず）が記憶されている。当該データは、各年齢層が使用する特有の言葉の情報等が格納されている。年齢層判定部１５１２は、人９０１が発話した場合、発話の内容（使用される言葉等）に基づき、年齢層を判定する。
年齢層判定部１５１２は、判定結果を発話制御部１５２０に送る。

発話制御部１５２０は、典型的には、判定された年齢層に見合った話し方で、音声出力部１５４に発話させる制御を行なう。具体的には、発話制御部１５２０は、データベースＤ３におけるロボットの発話形式を参照することにより、たとえば判定された年齢層に見合った話で、音声出力部１５４に発話させる制御を行なう。

あるいは、発話制御部１５２０は、データベースＤ３におけるロボットの発話形式を参照することにより、判定された年齢層に見合った内容を音声出力部１５４に発話させてもよい。

気分判定部１５１３は、人９０１が発話した場合、人９０１の気分を判定する。具体的に説明すると以下の通りである。記憶部１５３には、様々な気分を表す言葉が、当該気分（正確には、気分の識別情報）に対応付けて記憶されている。気分判定部１５１３は、人９０１が発話した場合、当該発話における言葉が対応付けれた気分を判定する。気分判定部１５１３は、判定結果を発話制御部１５２０に送る。なお、気分判定部１５１３は、人９０１の発話における声の抑揚等に基づいて、気分を判定してもよい。この場合には、判定の精度を上げるため、ロボット１は、人９０１の通常時の抑揚を事前に学習しておくことが好ましい。

発話制御部１５２０は、典型的には、判定された気分に応じた発話を、音声出力部１５４にさせる制御を行なう。具体的には、発話制御部１５２０は、データベースＤ３におけるロボットの発話形式を参照することにより、たとえば判定された気分に応じた発話を音声出力部１５４に行わせる。

＜Ｅ．制御構造＞
図５は、ロボット１における処理の流れを説明するためのフローチャートである。図５を参照して、ステップＳ２において、ロボット１は、特徴についてのデフォルトの設定で、人９０１との会話する。ステップＳ４において、ロボット１は、人９０１との会話を通じて、人９０１の特徴を判定する。ステップＳ６において、ロボット１は、特徴が判定できたか否かを判断する。

特徴が判定できたと判断された場合（ステップＳ６においてＹＥＳ）、ロボット１は、ステップＳ８において、判定された特徴で会話をする。たとえば、デフォルトの設定が標準語である場合、人９０１の特徴が関西弁であると判定されると、ロボット１は、標準語による発話（会話）を取止め、関西弁に応じた発話（会話）をする。なお、特徴が判定できていないと判断された場合（ステップＳ６においてＮＯ）、ロボット１は、処理をステップＳ４に戻す。

ステップＳ１０において、ロボット１は、会話の終了を示すイベントが発生したか否かを判断する。「インベントの発生」としては、たとえば、ロボット１の周囲に人９０１がいなくなったこと、人９０１からの発話が予め定めらた時間行われなかったこと、人９０１から所定の入力を受け付けたこと等とすることができる。

イベントが発生したと判断した場合（ステップＳ１０においてＹＥＳ）、ロボット１は、ステップＳ１２において、判定された特徴をデフォルトに設定する。これにより、ロボット１は、次回の会話において、最初から、上記判定された特徴で会話を開始することができる。たとえば、ロボット１は、ステップＳ２において、関西弁で会話を開始することができる。なお、イベントが発生していないと判断した場合（ステップＳ１０においてＮＯ）、ロボット１は、処理をステップＳ８に戻す。

なお、特徴についてのデフォルトの設定を変更しない構成であってもよい。たとえば、ステップＳ２において、常に標準語で会話を開始するようにロボット１を構成してもよい。

＜Ｆ．ハードウェア構成＞
図６は、ロボット１のハードウェア構成を表した図である。図６を参照して、ロボット１は、プログラムを実行するＣＰＵ１０１と、ＲＯＭ（Read Only Memory）１０２と、ＲＡＭ（Random Access Memory）１０３と、フラッシュメモリ１０４と、操作キー１０５と、スピーカ１０６と、カメラ１０７と、マイク１０８と、タッチスクリーン１０９と、モータ１１０と、車輪１１１と、無線通信ＩＦ（Interface）１１２と、アンテナ１１３とを、少なくとも含んで構成されている。タッチスクリーン１０９は、ディスプレイ１０９１と、タッチパネル１０９２とを含む。各構成要素１０１〜１１０，１１２は、相互にデータバスによって接続されている。

アンテナ１１３は、無線通信ＩＦ１１２に接続されている。アンテナ１１３および無線通信ＩＦ１１２は、たとえば、基地局を介した、他の移動体端末、固定電話、およびＰＣ（Personal Computer）との間における無線通信に用いられる。

ＲＯＭ１０２は、不揮発性の半導体メモリである。ＲＯＭ１０２は、ロボット１のブートプログラムが予め格納されている。フラッシュメモリ１０４は、不揮発性の半導体メモリである。フラッシュメモリ１０４は、一例としてＮＡＮＤ型で構成してもよい。フラッシュメモリ１０４は、ロボット１のオペレーティングシステム、ロボット１を制御するための各種のプログラム、並びに、ロボット１が生成したデータ、ロボット１の外部装置から取得したデータ等の各種データを揮発的に格納する。

ロボット１における処理は、各ハードウェアおよびＣＰＵ１０１により実行されるソフトウェアによって実現される。このようなソフトウェアは、フラッシュメモリ１０４に予め記憶されている場合がある。また、ソフトウェアは、図示しないメモリカードその他の記憶媒体に格納されて、プログラムプロダクトとして流通している場合もある。あるいは、ソフトウェアは、いわゆるインターネットに接続されている情報提供事業者によってダウンロード可能なプログラムプロダクトとして提供される場合もある。このようなソフトウェアは、アンテナ１１３および無線通信ＩＦ１１２を介してダウンロードされた後、フラッシュメモリ１０４に一旦格納される。そのソフトウェアは、ＣＰＵ１０１によってフラッシュメモリ１０４から読み出され、さらにフラッシュメモリ１０４に実行可能なプログラムの形式で格納される。ＣＰＵ１０１は、そのプログラムを実行する。

本発明の本質的な部分は、フラッシュメモリ１０４その他の記憶媒体に格納されたソフトウェア、あるいはネットワークを介してダウンロード可能なソフトウェアであるともいえる。なお、記録媒体としては、ＤＶＤ-ＲＯＭ、ＣＤ−ＲＯＭ、ＦＤ、ハードディスクに限られず、磁気テープ、カセットテープ、光ディスク、光カード、マスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュＲＯＭなどの半導体メモリ等の固定的にプログラムを担持する媒体でもよい。また、記録媒体は、当該プログラム等をコンピュータが読取可能な一時的でない媒体である。また、ここでいうプログラムとは、ＣＰＵにより直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。
［実施の形態２］
本実施の形態では、上述したとおり、ロボット１が複数の人間と会話するときの処理を説明する。

図７は、ロボット１と複数の人間とが輪になっている状況を表した図である。図７を参照して、ロボット１は、２名の大人の男性９０１，９０２と、２名の大人の女性９０３，９０４と、１名の男の子（子供）と会話が可能な状態となっている。

この場合、ロボット１は、５人と会話を行なう。会話の内容としては、５人全員に対するもの、特定の一人に対するもの、５人を１つのグループとしてとらえた場合における一部のサブグループ（たとえば、２人の大人の女性で構成されるサブグループ、４人の大人で構成されるサブグループ）に対するもの等がある。

図８は、ロボット１における処理の流れを説明するためのフローチャートである。図８を参照して、図５のフローチャートの相違は、ステップＳ１０２〜Ｓ１２０が追加されている点である。したがって、以下では、図５のフローチャートと異なる点を主として説明する。

ステップＳ２の後、ロボット１は、ステップＳ１０２において、会話の相手が複数人か否かを判断する。複数人ではないと判断された場合（ステップＳ１０２においてＮＯ）、ロボット１は、処理をステップＳ４に進める。複数人であると判断された場合（ステップＳ１０２においてＹＥＳ）、ロボット１は、ステップＳ１０４において、会話を通じて各人の特徴の判定を開始する。ステップＳ１０６において、ロボット１は、全員分の特徴が判定されたか否かを判断する。

全員の特徴が判定されていないと判断された場合（ステップＳ１０６においてＮＯ）、ロボット１は、ステップＳ１０８において、判定がなされた人数分の判定結果に基づいて、会話に用いる特徴を決定する。ステップＳ１１０において、ロボット１は、決定された特徴で会話する。

ステップＳ１１２において、ロボット１は、会話の終了を示すイベントが発生したか否かを判断する。インベントが発生したと判断された場合（ステップＳ１１２においてＹＥＳ）、ロボット１は、ステップＳ１１４において、決定された特徴をデフォルトに設定する。インベントが発生していないと判断された場合（ステップＳ１１２においてＮＯ）、ロボット１は、処理をステップＳ１０４に戻す。

全員の特徴が判定されたと判断された場合（ステップＳ１０６においてＹＥＳ）、ロボット１は、ステップＳ１１６において、全員の判定結果に基づいて、会話に用いる特徴を決定する。ステップＳ１１８において、ロボット１は、決定された特徴で会話する。

ステップＳ１２０において、ロボット１は、会話の終了を示すイベントが発生したか否かを判断する。インベントが発生したと判断された場合（ステップＳ１２０においてＹＥＳ）、ロボット１は、処理をステップＳ１１４に進める。インベントが発生していないと判断された場合（ステップＳ１２０においてＮＯ）、ロボット１は、処理をステップＳ１２０に戻す。

ロボット１は、ステップＳ１０８，Ｓ１１６において、典型的には、最も人数の多い特徴（つまり、特徴を共通にする人が最も多い特徴）を、会話に用いる特徴として決定する。たとえば、ロボット１は、全員（５人）のうち、３人の特徴が関西弁で、かつ２人の特徴が標準語であると判断した場合、ロボット１は、ステップＳ１１６において、会話に用いる特徴を関西弁とする。

以上のように、ロボット１は、複数の前記人との会話に基づき当該複数の人の各々の特徴を判定する。ロボット１は、判定された複数の特徴のうち、特徴を共通にする人が最も多い特徴を特定する。ロボット１は、特定された特徴に応じた発話を行なう。これにより、ロボット１は、複数人と会話する場合であっても、全体最適の観点から全体（グループ）に適した発話をすることができる。
［実施の形態３］
本実施の形態でも、実施の形態２と同様、ロボットが複数の人間と会話するときの処理を説明する。

実施の形態２においては、ステップＳ１０８およびステップＳ１１６において決定された特徴でのみ会話が行われる構成を説明した。

本実施の形態では、ロボット１が、ステップＳ１０８およびステップＳ１１６で決定された特徴に基づき、ステップＳ１１０およびステップＳ１１８において会話（発話）をすることを原則としつつも、ステップＳ１１０およびステップＳ１１８において例外処理を設ける。以下、例外処理について説明する。

図９は、図８のステップＳ１１０，Ｓ１１８の処理における例外処理を説明するためのフローチャートである。図９を参照して、ステップＳ２０２において、ロボット１は、発話するフレーズを決定する。ステップＳ２０４において、ロボット１は、決定されたフレーズは、全員向けのフレーズであるか否かを判断する。なお、フレーズが全員向けであるか否かは、フレーズ毎に予め識別情報を付加しておくことより、ロボット１が当該識別情報を参照して判断すればよい。

全員向けのフレーズであると判断された場合（ステップＳ２０６においてＹＥＳ）、ロボット１は、ステップＳ１１０またはステップＳ１１２で決定された特徴で会話する。全員向けのフレーズであると判断されなかった場合（ステップＳ２０６においてＮＯ）、ロボット１は、特定の人、または特定のサブグループ向けの特徴で会話する。

本実施の形態における処理の一例を、具体例を挙げて説明すれば以下のとおりである。たとえば、図７においては、５人のうち４人が中年の大人であるため、ロボット１は、ステップＳ１１６において、会話に用いる特徴として、年齢層のうち“中年”を選択する。

このため、ロボット１は、ステップＳ１１８において、“中年”に対応したロボットの発話形式（図３参照）にて、会話する。しかしながら、フレーズが子供向けである場合には、会話に用いる特徴として、年齢層のうち“幼い”を選択する。つまり、フレーズが子供向けの場合には、ロボット１は、発話形式を“中年”に対応した形式から“幼い”に対応した形式に一時的に切り替えて、発話を行なう。

以上のように、ロボット１は、複数の人のうち特定された特徴とは異なる特徴を有する人に対して発話する場合には、特定された特徴に応じた発話を行なわずに、当該人の特徴に応じた発話を行なう。これにより、ロボット１は、会話相手に対して一層柔軟な発話を行なうことが可能となる。
［実施の形態４］
上記の実施の形態１から３においては、ロボット１が上述したデータテーブルＤ３等の各種のデータ、プログラムを格納し、上述した全ての処理を単独で実行する構成を例に挙げて説明した。しかしながら、これに限定されず、ロボット１は、サーバと共同して、上述した各処理を実行してもよい。

図１０は、ロボットとサーバとを備えた通信システムの概略図である。図１０を参照して、通信システムは、ロボット１Ａと、サーバ７００と、ルータ９００とを備える。ロボット１は、ルータ９００を介して、サーバ７００と通信可能に接続されている。なお、ロボット１Ａは、ロボット１と同様のハードウェア構成を有するため、ここでは、ロボット１Ａのハードウェア構成については繰り返し説明は行わない。

このような通信システムでは、たとえば、ロボット１Ａの代わりにサーバ７００がデータベースＤ３を備えていてもよい。また、ロボット１Ａの代わりにサーバ７００が図４に示した特徴判定部１５１０を備えていてもよい。

このような構成であっても、ロボット１Ａは、会話の相手に適した発話をすることが可能となる。
［実施の形態５］
実施の形態１から４では、電子機器の一例として、人間型のロボット１，１Ａを例に挙げて説明したが、これに限定されるものではない。

図１１は、ロボット２と人９０１とが会話をしている状態を表した図である。図１１を参照して、ロボット１，１Ａの代わりに掃除機型のロボット２に、ロボット１，１Ａと同様の発話処理（発話制御方法）を行なわせてもよい。

＜まとめ＞
（１）以上のように、ロボット１，１Ａ，２は、人との会話に基づき人の特徴を判定し、判定された特徴に応じた発話を行なう。上記の構成によれば、会話の相手に適した発話をすることが可能となる。

（２）たとえば、特徴は、方言の種別、年齢層、および会話時の気分のうちの少なくとも１つである。

（３）特徴は、方言の種別である。ロボット１，１Ａ，２は、発話のために音声を出力する音声出力部１５４と、方言の種別を判定する方言判定部１５１１と、判定された特徴に応じた発話を音声出力部１５４に行なわせる発話制御部１５２０とを備える。発話制御部１５２０は、音声出力部１５４に判定された種別の方言で発話させる。上記の構成によれば、ロボット１，１Ａ，２は、人が話している方言と同じ方言で発話することが可能となるため、会話が弾む。

（４）特徴は、方言の種別である。ロボット１，１Ａ，２は、発話のために音声を出力する音声出力部１５４と、方言の種別を判定する方言判定部１５１１と、判定された特徴に応じた発話を音声出力部１５４に行なわせる発話制御部１５２０とを備える。発話制御部１５２０は、音声出力部１５４に判定された種別の方言が用いられている地域の情報に関する発話を行なわせる。上記の構成によれば、ロボット１，１Ａ，２は、人の出身地に関する情報を発話するため、会話が弾む。

（５）好ましくは、特徴は、年齢層である。ロボット１，１Ａ，２は、発話のために音声を出力する音声出力部１５４と、人の年齢層を判定する年齢層判定部１５１２と、判定された特徴に応じた発話を音声出力部１５４に行なわせる発話制御部１５２０とを備える。発話制御部１５２０は、音声出力部１５４に判定された年齢層に見合った話し方で発話を行わせる。上記の構成によれば、ロボット１，１Ａ，２は、同じような話し方で発話をするため、人は違和感を感じすることなくロボット１，１Ａ，２と会話ができる。

（６）発話制御部１５２０は、音声出力部１５４に判定された年齢層に見合った内容を発話させる。上記の構成によれば、ロボット１，１Ａ，２は、会話の内容に興味を抱きやすいため、人との会話が弾む。

（７）特徴は、気分である。ロボット１，１Ａ，２は、発話のために音声を出力する音声出力部１５４と、人の気分を判定する気分判定部１５１３と、判定された特徴に応じた発話を音声出力部１５４に行なわせる発話制御部１５２０とを備える。発話制御部１５２０は、音声出力部１５４に判定された気分に応じた発話を行なわせる。上記の構成によれば、ロボット１は、ユーザの気分に応じた発話を行なうため、ユーザは、ロボット１と心地の良い会話ができる。

（８）ロボット１，１Ａ，２は、複数の人との会話に基づき複数の人の各々の特徴を判定する。ロボット１，１Ａ，２は、判定された複数の特徴のうち、特徴を共通にする人が最も多い特徴を特定する。ロボット１，１Ａ，２は、特定された特徴に応じた発話を行なう。上記の構成によれば、ロボット１，１Ａ，２は、複数人と会話する場合であっても、全体最適の観点から全体（グループ）に適した発話をすることができる。

（９）ロボット１，１Ａ，２は、複数の人のうち特定された特徴とは異なる特徴を有する人に対して発話する場合には、特定された特徴に応じた発話を行なわずに、当該人の特徴に応じた発話を行なう。上記の構成によれば、ロボット１，１Ａ，２は、会話相手に対して一層柔軟な発話を行なうことが可能となる。
（１０）好ましくは、ロボット１，１Ａ，２は自走式である。

今回開示された実施の形態は例示であって、上記内容のみに制限されるものではない。本発明の範囲は特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

１，１Ａ，２ロボット、１０６スピーカ、１０８マイク、１０９タッチスクリーン、１１１車輪、１５１制御部、１５２音声入力部、１５３記憶部、１５４音声出力部、１５５通信部、７００サーバ、９００ルータ、１５１０特徴判定部、１５１１方言判定部、１５１２年齢層判定部、１５１３気分判定部、１５２０発話制御部、Ｄ３データベース。

Claims

人との会話に基づき前記人の特徴を判定し、前記判定された特徴に応じた発話を行なう、電子機器。
前記特徴は、方言の種別、年齢層、および前記会話時の気分のうちの少なくとも１つである、請求項１に記載の電子機器。
前記特徴は、前記方言の種別であって、
前記発話のために音声を出力する音声出力手段と、
前記方言の種別を判定する第１の判定手段と、
前記判定された特徴に応じた発話を前記音声出力手段に行なわせる発話制御手段とを備え、
前記発話制御手段は、前記音声出力手段に前記判定された種別の方言で発話させる、請求項２に記載の電子機器。
前記特徴は、前記方言の種別であって、
前記発話のために音声を出力する音声出力手段と、
前記方言の種別を判定を判定する第１の判定手段と、
前記判定された特徴に応じた発話を前記音声出力手段に行なわせる発話制御手段とを備え、
前記発話制御手段は、前記音声出力手段に前記判定された種別の方言が用いられている地域の情報に関する発話を行なわせる、請求項２に記載の電子機器。
前記特徴は、前記年齢層であって、
前記発話のために音声を出力する音声出力手段と、
前記人の年齢層を判定する第２の判定手段と、
前記判定された特徴に応じた発話を前記音声出力手段に行なわせる発話制御手段とを備え、
前記発話制御手段は、前記音声出力手段に前記判定された年齢層に見合った話し方で発話を行わせる、請求項２に記載の電子機器。
前記発話制御手段は、前記音声出力手段に前記判定された年齢層に見合った内容を発話させる、請求項５に記載の電子機器。
前記特徴は、前記気分であって、
前記発話のために音声を出力する音声出力手段と、
前記人の気分を判定する第３の判定手段と、
前記判定された特徴に応じた発話を前記音声出力手段に行なわせる発話制御手段とを備え、
前記発話制御手段は、前記音声出力手段に前記判定された気分に応じた発話を行なわせる、請求項２に記載の電子機器。
複数の前記人との会話に基づき前記複数の人の各々の特徴を判定し、
前記判定された複数の前記特徴のうち、前記特徴を共通にする人が最も多い前記特徴を特定し、
前記特定された特徴に応じた発話を行なう、請求項１から７のいずれか１項に記載の電子機器。
前記複数の人のうち前記特定された特徴とは異なる特徴を有する人に対して発話する場合には、前記特定された特徴に応じた発話を行なわずに、当該人の特徴に応じた発話を行なう、請求項８に記載の電子機器。
前記電子機器は自走式のロボットである、請求項１から９のいずれか１項に記載の電子機器。
電子機器における発話制御方法であって、
人との会話に基づき前記人の特徴を判定するステップと、
前記判定された特徴に応じた発話を行なうステップとを備える、発話制御方法。
電子機器を制御するためのプログラムであって、
人との会話に基づき前記人の特徴を判定するステップと、
前記判定された特徴に応じた発話を行なうステップとを、前記電子機器のプロセッサに実行させる、プログラム。