WO2017051627A1

WO2017051627A1 - 音声発話装置及び音声発話方法

Info

Publication number: WO2017051627A1
Application number: PCT/JP2016/073190
Authority: WO
Inventors: 暁本村
Original assignee: シャープ株式会社
Priority date: 2015-09-24
Filing date: 2016-08-05
Publication date: 2017-03-30
Also published as: JPWO2017051627A1

Abstract

ロボット（１）は、発話機能を備えた音声発話装置であって、ロボット（１）の姿勢を変化させる駆動部（５０）を制御する駆動制御部（１０４）と、姿勢に応じた言葉を発話する音声出力部（６０）と、を備える。

Description

音声発話装置及び音声発話方法

　本発明は、主に音声発話装置及び音声発話方法に関する。

　特許文献１には、基体に可動連結した可動部の駆動を制御する駆動制御手段と、音声を生成する音声生成手段と、前記音声生成手段において生成された音声を出力する音声出力手段とを有するロボットにおいて、前記音声生成手段は、前記駆動制御手段によって制御される前記可動部の前記基体に対する姿勢に基づいて、生成する音声を補正することを特徴とするロボットが記載されている。

日本国公開特許公報「特開２０１１－１８９４３９号公報（２０１１年９月２９日公開）」

　上述のような従来技術は、姿勢に基づいて、違和感のない自然な音声を出力する技術を提供している。

　しかしながら、従来の発話型ロボットに特許文献１の技術を適用しても、発話型ロボットとの間で生じるコミュニケーションの不自然さを低減することができない、という問題がある。

　例えば、ユーザが「立って」と呼びかけた場合に、「わかった」と言って立ち上がる動作を行うロボットについて考える。このロボットは、既に立っている状態であったとしても、「立って」と呼びかけたユーザに対して「わかった」と返すことになる。これではユーザとロボットとの間のコミュニケーションが不自然になってしまう。

　本発明は、上記課題に鑑みて成されたものであり、その主な目的は、従来よりも発話の内容によってユーザに違和感を与えにくい音声発話装置を提供することにある。

　上記の課題を解決するために、本発明の一態様に係る音声発話装置は、発話機能を備えた音声発話装置であって、上記音声発話装置の姿勢を変化させる駆動部を制御する駆動制御部と、上記姿勢に応じた言葉を発話する発話処理部と、を備える。

　上記の課題を解決するために、本発明の一態様に係る音声発話方法は、発話機能を備えた音声発話装置による音声発話方法であって、上記音声発話装置の姿勢を変化させるように制御する駆動制御工程と、上記姿勢に応じた言葉を発話する発話処理工程と、を含む。

　本発明の一態様に係る音声発話装置は、従来よりも発話の内容によってユーザに違和感を与えにくいという効果を奏する。

本発明の実施形態１に係る音声対話装置の構成を示すブロック図である。本発明の各実施形態に係る音声対話装置の姿勢を概略的に示す図である。本発明の各実施形態に係る音声対話装置が保持している姿勢テーブルを例示する図である。図１の音声対話装置が保持している発話内容テーブルを例示する図である。図１の音声対話装置の動作を示すフローチャートである。本発明の実施形態２に係る音声対話装置の構成を示すブロック図である。図６の音声対話装置が保持している発話内容テーブルを例示する図である。図６の音声対話装置が保持している目標姿勢テーブルを例示する図である。図６の音声対話装置の動作を示すフローチャートである。図９のフローチャートのうち、Ｓ２０２の詳細を示すフローチャートである。本発明の実施形態３に係る音声対話装置の構成を示すブロック図である。図１１の音声対話装置が保持している発話内容テーブルを例示する図である。図１１の音声対話装置が保持している目標姿勢テーブルを例示する図である。図１１の音声対話装置の動作を示すフローチャートである。

　＜実施形態１＞
　以下、図１～図５を参照して、本発明に係る音声発話装置の一実施形態であるロボット（音声対話装置）１について説明する。ロボット１は対話（発話）機能を備えている。

　〔ロボット１の構成〕
　図１は、ロボット１の構成を示すブロック図である。ロボット１は、制御部１０、音声入力部２０、電源部３０、記憶部４０、駆動部５０及び音声出力部（発話処理部）６０を備えている。

　［制御部１０］
　制御部１０は、ロボット１を統括的に制御するものであり、ＣＰＵで構成されている。制御部１０は、ロボット１がユーザと対話するための各種処理を統括するものである。制御部１０は、音声認識部１０１、発話トリガ部１０２、発話内容決定部（動作決定部）１０３、駆動制御部１０４及び音声出力制御部（発話処理部）１０５を備えている。

　（音声認識部１０１）
　音声認識部１０１は、音声入力部２０に入力された音声を認識し、認識した結果を発話トリガ部１０２に通知する。

　（発話トリガ部１０２）
　発話トリガ部１０２は、ロボット１が発話及び姿勢制御をする契機となる発話トリガ（イベントの内容）を検知し、当該発話トリガの情報を発話内容決定部１０３に送る。

　発話トリガ部１０２は、主に、音声認識部１０１で認識した音声に対し、ロボット１が応答を返す必要があるかどうかを判断する。発話トリガとなる認識した音声としては、例えば、図４の発話内容テーブル４２の「立って」等が挙げられる。

　また、発話トリガ部１０２は音声を認識しなくても発話トリガを検知する場合がある。例えば、発話トリガ部１０２は、バッテリの残量が少ない場合は、「バッテリの残量が少なくなり充電が必要になった」旨を、バッテリの残量が満タンである場合は、「充電の結果容量が満タンになった」旨をユーザへ通知するため発話が必要であると判断する。それ以外の場合は、発話トリガ部１０２は、発話は不要であると判断する。

　また、発話トリガ部１０２が検知する発話トリガは、電源部３０からの情報に限定されず、図４の発話内容テーブル４２に示すように、ロボット１の内部状態に起因するもの（タイマー（タイマー満了）又はアラーム（アラーム発動）等）、及び、外部環境（通信部（図示なし）からの着信）に起因するものなども挙げることができる。

　（発話内容決定部１０３）
　発話内容決定部（動作決定部）１０３は、発話トリガ部１０２からの発話トリガの情報の取得を契機に、駆動制御部１０４から現在の姿勢の情報を取得する。発話内容決定部１０３は、当該発話トリガと現在の姿勢の情報とに基づき、図４に示す発話内容テーブル４２を参照し、発話する言葉及び現在の姿勢よりも後の姿勢である目標姿勢を決定する。例えば発話トリガが「タイマー」であり、現在の姿勢が「立ち姿勢」である場合、発話内容決定部１０３は発話する言葉を「座ろうかな」に、目標姿勢を「座り姿勢」に決定する。

　（駆動制御部１０４）
　駆動制御部１０４は、発話内容決定部１０３から目標姿勢の情報を取得し、図３の姿勢テーブル４１を参照し、現在の姿勢から目標姿勢となるように駆動部５０を制御する。

　また、駆動制御部１０４は、発話内容決定部１０３からの要求に基づき、後述の姿勢テーブル４１と駆動部５０の各サーボモータの現在の回転角度とを参照し、ロボット１の現在の姿勢を特定し、当該現在の姿勢を示す情報を発話内容決定部１０３に送る。

　（音声出力制御部１０５）
　音声出力制御部（発話処理部）１０５は、発話内容決定部１０３で決定した言葉を音声出力するよう音声出力部６０を制御する。

　［音声入力部２０］
　音声入力部２０は、音声を入力するものである。入力された音声は、音声認識部１０１へと出力される。本実施形態では、音声入力部２０はマイクで構成されている。

　［電源部３０］
　電源部３０は、ロボット１に電源を供給するものである。電源部３０はバッテリである。電源部３０のバッテリの残量のデータは、発話トリガ部１０２へと送られる。

　［記憶部４０］
　記憶部４０は、姿勢テーブル４１及び発話内容テーブル４２等の、発話内容決定部１０３が発話する言葉及び目標姿勢を決定するのに必要な情報を記憶するものである。記憶部４０は、ハードディスク及びフラッシュメモリ等で構成されている。

　（姿勢テーブル４１）
　図３に示すように、姿勢テーブル４１は、ロボット１がとり得る姿勢毎に、姿勢の名称と、駆動部に関する情報（駆動部５０がどのような状態の時にロボット１がその姿勢になっているかを駆動制御部１０４が判断するための情報）とを示すデータテーブルである。

　ここで、図３における座り姿勢、立ち姿勢及び歩行姿勢を図示すると、それぞれ図２の（ａ）、（ｂ）及び（ｃ）のようになる。図３の駆動部に関する情報は、具体的には、ロボット１が該当する姿勢であるかどうか判断するための、駆動部５０の各サーボモータの回転角度に関する条件を示している。

　また、姿勢テーブル４１は、駆動制御部１０４がロボット１を目標姿勢にするために参照すべき情報でもある。即ち、駆動部に関する情報は、ロボット１を目標姿勢にするための駆動部５０の制御の仕方を示してもいる。なお、姿勢テーブル４１の代わりに複数のテーブルを保持してもよい。即ち、ロボット１がとり得る各姿勢について、当該姿勢に対応する「駆動部に関する情報」のみを含むテーブルを保持していてもよい。

　（発話内容テーブル４２）
　発話内容テーブル４２は、図４に示すように、発話トリガと、現在の姿勢と、発話する言葉と、目標姿勢との対応関係を示すテーブルである。なお、図４では、認識した音声の例として「立って」のみ記載されているが、「座って」、「休憩して」、「充電して」、「歩いて」及び「おはよう」等も挙げることができる。

　（駆動部５０）
　駆動部５０は、ロボット１における頭部及び脚部等の可動部位を駆動するものであり、駆動制御部１０４により制御される。本実施形態では、駆動部５０はサーボモータで構成されているが、空気圧を利用したアクチュエータであってもよい。

　（音声出力部６０）
　音声出力部（発話処理部）６０は、音声を出力するためのものであり、音声出力制御部１０５によって制御される。音声出力部６０はスピーカで構成されている。

　〔ロボット１の動作〕
　次に、図５を参照しながらロボット１の動作（音声発話方法）について説明する。図５は当該動作を示すフローチャートである。

　まず、ロボット１は、発話トリガ部１０２で発話トリガを検知したか否かを確認する。発話トリガ部１０２は、発話トリガを検知していない場合は、発話トリガを検知するまで待ち、検知した場合は、発話内容決定部１０３に発話トリガの情報を送る（Ｓ１０１）。

　次に、発話内容決定部１０３は、発話トリガの情報の取得を契機に、当該発話トリガと、現在の姿勢とに基づき、発話内容テーブル４２を参照し、発話する言葉と目標姿勢とを決定する（Ｓ１０２）。

　音声出力制御部１０５は、発話内容決定部１０３から発話する言葉の情報を取得し、音声出力部６０を制御し、音声出力部６０は発話する言葉を音声出力する（発話処理工程）。駆動制御工程では、駆動制御部１０４は、発話内容決定部１０３から目標姿勢の情報を取得し、現在の姿勢を当該目標姿勢となるように駆動部５０を制御する（Ｓ１０３）。

　なお、駆動制御部１０４は、Ｓ１０３の駆動部５０の制御を、音声出力部６０による発話する言葉の音声出力と同時に行ってもよいし、音声出力部６０による上記音声出力の前または後に行ってもよい。

　ロボット１は、Ｓ１０３の後、図５のフローチャートに従った動作を終了する。

　＜実施形態２＞
　以下、図６～１０を参照して本発明の別の一実施形態であるロボット（音声対話装置）２について説明する。上述の実施形態１の部材と全く同じ機能又は略同じ機能を有する部材については、同じ符号を付記し、基本的にその説明を省略する。

　〔ロボット２の構成〕
　図６は、ロボット２の構成を示すブロック図である。ロボット２の構成は、制御部１１及び記憶部２４０以外は、実施形態１と同じである。

　［記憶部２４０］
　記録部２４０は、発話内容テーブル４２の代わりに発話内容テーブル２４１と目標姿勢テーブル２４２とを備えている以外は、実施形態１と同じである。

　（発話内容テーブル２４１）
　発話内容テーブル２４１は、発話トリガと、現在の姿勢と、発話する言葉との対応関係を示すテーブルである。なお、図７に示す発話内容テーブル２４１では、認識した音声の例として「立って」しか記載されていないが、これに限定されず、例えば、「座って」、「休憩して」、「充電して」、「歩いて」及び「おはよう」等も挙げることができる。

　（目標姿勢テーブル２４２）
　目標姿勢テーブル２４２は、キーワードと、目標姿勢との対応関係を示すデータテーブルである。ここで、キーワードは目標姿勢と関連するものであればよく、図８のキーワードに限定されない。また、目標姿勢テーブル２４２に明記されているキーワード（「座る」、「立つ」及び「歩く」）の他、そのキーワードを活用変化させたもの（例えば、「立って」及び「立ち」等）をキーワードとしてもよい。

　［制御部１１］
　制御部１１は、発話内容決定部の処理内容が異なっている点以外は、上述の実施形態１と同じである。

　（発話内容決定部２０３）
　発話内容決定部（動作決定部）２０３は、発話トリガ部１０２から発話トリガの情報を取得し、当該発話トリガと現在の姿勢とに基づき、図７に示す発話内容テーブル２４１を参照し、発話する言葉を決定する。

　また、発話内容決定部２０３は、発話する言葉に図８に示す目標姿勢テーブル２４２で管理するキーワードが含まれているか否かを確認し、キーワードが含まれている場合、そのキーワードに対応する目標姿勢を選択する。含まれていない場合、発話トリガの内容を示す文言が、目標姿勢テーブル２４２で管理するキーワードを含むか確認し、キーワードが含まれている場合そのキーワードに対応する目標姿勢を選択する。キーワードが含まれていない場合は、発話内容決定部２０３は、姿勢を変化させない。

　〔ロボット２の動作〕
　次に、図９を参照しながらロボット２の動作について説明する。図９は当該動作を示すフローチャートである。

　まず、ロボット２は、発話トリガ部１０２で発話トリガを検知したか否かを確認する。発話トリガ部１０２は、発話トリガを検知していない場合は、発話トリガを検知するまで待ち、検知した場合は、発話内容決定部２０３に発話トリガの情報を送る（Ｓ２０１）。

　次に、発話内容決定部２０３は、発話トリガの情報の取得を契機に、当該発話トリガと、現在の姿勢の情報とに基づき、発話する言葉及び目標姿勢を決定する（Ｓ２０２）。詳細は後述する。

　音声出力制御部１０５は、発話内容決定部２０３から発話する言葉の情報を受け取り、当該発話する言葉を音声出力するように音声出力部６０を制御する。音声出力部６０は当該発話する言葉を音声出力する（発話処理工程）。また、駆動制御工程では、駆動制御部１０４は、発話内容決定部２０３から目標姿勢の情報を受け取り、ロボット２の現在の姿勢を当該目標姿勢となるように駆動部５０を制御する（Ｓ２０３）。

　ロボット２は、Ｓ２０３の後、図９のフローチャートに従った動作を終了する。

　〔Ｓ２０２の詳細〕
　次に、図１０を参照しながらＳ２０２の詳細について説明する。図１０は、Ｓ２０２の詳細を示すフローチャートである。

　まず、発話内容決定部２０３は、発話トリガと、現在の姿勢の情報とに基づき、発話内容テーブル２４１を参照して発話する言葉を決定し、Ｓ２１１へと進む（Ｓ２１０）。

　発話内容決定部２０３は、発話する言葉にキーワードが含まれているか否かを確認し、含まれていればＳ２１３に進み、含まれていなければＳ２１２に進む（Ｓ２１１）。

　発話する言葉にキーワードが含まれていない場合は、発話内容決定部２０３は、発話トリガの内容を示す文言にキーワードが含まるか確認し、キーワードが含まれていればＳ２１３に進み、含まれていなければＳ２１４に進む（Ｓ２１２）。

　発話する言葉又は発話トリガの内容を示す文言にキーワードが含まれる場合、発話内容決定部２０３は目標姿勢テーブル２４２を参照し、目標姿勢を決定する（Ｓ２１３）。

　発話する言葉にも発話トリガの内容を示す文言にもキーワードが含まれていない場合は、発話内容決定部２０３は、現在の姿勢から姿勢を変化させない（Ｓ２１４）。

　ロボット２は、Ｓ２１３又はＳ２１４の後、図１０のフローチャートに従った動作を終了する。

　以下に、Ｓ２０２のフローチャートを、２つの例を用いてより具体的に説明する。

　（Ｓ２０２の詳細の例１）
　発話トリガが「立って」という音声の認識であり、現在の姿勢が「立ち姿勢」である場合、発話内容決定部２０３は、図７の発話内容テーブル２４１を参照し、発話する言葉「もう立ってるよ。」を選択し、Ｓ２１１へと進む（Ｓ２１０）。

　次に、発話内容決定部２０３は、発話する言葉「もう立ってるよ。」が図８の目標姿勢テーブル２４２のキーワード「立つ」を含むため、Ｓ２１３へと進む（Ｓ２１１）。

　次に、発話内容決定部２０３は、目標姿勢テーブル２４２を参照し、キーワード「立つ」に対応する目標姿勢である「立ち姿勢」を選択する（Ｓ２１３）。

　ロボット２は、Ｓ２１３の後、図１０のフローチャートに従った動作を終了する。ただし、現在の姿勢と目標姿勢とがともに「立ち姿勢」であるため、図９のＳ２０３では姿勢を維持することになる。

　（Ｓ２０２の詳細の例２）
　発話トリガが「立って」という音声の認識であり、現在の姿勢が「座り姿勢」である場合、発話内容決定部２０３は、発話内容テーブル２４１を参照し、発話する言葉「オッケー」を選択し、Ｓ２１１へと進む（Ｓ２１０）。

　次に、発話内容決定部２０３は、発話する言葉「オッケー。」が目標姿勢テーブル２４２で管理するキーワードを含まれていないことを確認し、Ｓ２１２に進む（Ｓ２１１）。

　次に、発話内容決定部２０３は、発話トリガの内容を示す文言に、目標姿勢テーブル２４２の「立つ」というキーワードが含まれていることを確認し、Ｓ２１３に進む（Ｓ２１２）。

　ロボット２は、Ｓ２１３の後、図１０のフローチャートに従った動作を終了する。

　＜実施形態３＞
　以下、図１１～１４を参照して本発明の別の一実施形態であるロボット（音声対話装置）３について説明する。なお、上述の実施形態１及び２にて説明した部材と全く同じ機能又は略同じ機能を有する部材については、同じ符号を付記し、その説明を省略する。

　〔ロボット３の構成〕
　図１１は、ロボット３の構成を示すブロック図である。ロボット３の構成は、制御部１２及び記憶部３４０以外は、実施形態１及び２と同じである。

　［記憶部３４０］
　記憶部３４０は、テーブル２４１及びテーブル２４２に代えて発話内容テーブル３４１と目標姿勢テーブル３４２とを備えている以外は、実施形態２と同じである。

　（発話内容テーブル３４１）
　発話内容テーブル３４１は、図１１に示すように、目標姿勢と、現在の姿勢と、発話する言葉との対応関係を示すテーブルである。

　（目標姿勢テーブル３４２）
　目標姿勢テーブル３４２は、図１２に示すように、発話トリガと、目標姿勢との対応関係を示すデータテーブルである。

　［制御部１２］
　制御部１２は、発話内容決定部の処理内容が異なっている点以外は、上述の実施形態１及び２と同じである。

　（発話内容決定部３０３）
　発話内容決定部（動作決定部）３０３は、発話トリガ部１０２から発話トリガの情報を取得し、当該発話トリガに基づき、目標姿勢テーブル３４２を参照し、目標姿勢を決定する。次に、発話内容決定部３０３は、当該目標姿勢と、現在の姿勢に基づき、発話内容テーブル３４１を参照し、発話する言葉を決定する。

　例えば、発話トリガが「立って」という音声の認識である場合、発話内容決定部３０３は、図１３の目標姿勢テーブル３４２を参照し、目標姿勢を「立ち姿勢」に決定する。そして、発話内容決定部３０３は、例えば現在の姿勢が「立ち姿勢」である場合、目標姿勢「立ち姿勢」と現在の姿勢「立ち姿勢」とに基づき、図１２の発話内容テーブル３４１を参照し、発話する言葉を「立ってるよ。」に決定する。

　〔ロボット３の動作〕
　次に、図１４を参照しながらロボット３の動作について説明する。図１４は当該動作を示すフローチャートである。

　まず、ロボット３は、発話トリガ部１０２で発話トリガを検知したか否かを確認する。発話トリガ部１０２が、発話トリガを検知していない場合は、発話トリガを検知するまで待ち、検知した場合は、発話内容決定部３０３に発話トリガの情報を送る（Ｓ３０１）。

　次に、発話内容決定部３０３は、取得した発話トリガの情報に基づき、目標姿勢テーブル３４２を参照して、目標姿勢を決定し、当該目標姿勢と、現在の姿勢の情報とに基づき、発話内容テーブル３４１を参照し、発話する言葉を決定する（Ｓ３０２）。発話内容決定部３０３は、当該発話する言葉の情報を音声出力制御部１０５に送り、当該目標姿勢の情報を駆動制御部１０４に送る。

　音声出力制御部１０５は、発話内容決定部３０３から発話する言葉の情報を受け取り、当該発話する言葉を音声出力するように音声出力部６０を制御する。音声出力部６０は当該発話する言葉を音声出力する（発話処理工程）。駆動制御部１０４は、発話内容決定部３０３からロボット３の目標姿勢の情報を受け取り、ロボット３の現在の姿勢を当該目標姿勢となるように駆動部５０を制御する（Ｓ３０３）。

　ロボット３は、Ｓ３０３の後、図１４のフローチャートに従った動作を終了する。

　〔ソフトウェアによる実現例〕
　制御部１０、１１及び１２は、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を用いてソフトウェアによって実現してもよい。

　後者の場合、制御部１０、１１及び１２は、各機能を実現するソフトウェアであるプログラムの命令を実行するＣＰＵ、上記プログラムおよび各種データがコンピュータ（またはＣＰＵ）で読み取り可能に記録されたＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）または記憶装置（これらを「記録媒体」と称する）、上記プログラムを展開するＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などを備えている。そして、コンピュータ（またはＣＰＵ）が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

　〔まとめ〕
　本発明の態様１に係る音声発話装置（ロボット１、２、３）は、発話機能を備えた音声発話装置であって、上記音声発話装置の姿勢を変化させる駆動部（駆動部５０）を制御する駆動制御部（駆動制御部１０４）と、上記姿勢に応じた言葉を発話する発話処理部（音声出力部６０）と、を備える。

　上記の構成によれば、上記音声発話装置は、従来よりも発話の内容によってユーザに違和感を与えにくいという効果を奏する。

　本発明の態様２に係る音声発話装置（ロボット１、２、３）は、上記態様１において、上記音声発話装置の現在の姿勢と、当該現在の姿勢よりも後の姿勢である目標姿勢とのうちの少なくとも一つに応じた言葉を上記姿勢に応じた言葉として決定する動作決定部（発話内容決定部１０３、２０３、３０３）を備え、上記発話処理部は、上記動作決定部が決定した言葉を発話してもよい。

　上記の構成によれば、上記音声発話装置は、現在及び／又は目標の姿勢に応じて発話を行うので、よりユーザに違和感を与えにくいという更なる効果を奏する。

　本発明の態様３に係る音声発話装置（ロボット１）は、上記態様２において、上記動作決定部（発話内容決定部１０３）は、上記音声発話装置が発話及び姿勢制御を行う契機となるイベントの内容と、上記音声発話装置の現在の姿勢とに応じて、発話する言葉を決定してもよい。

　上記構成によれば、上記音声発話装置は、イベントの内容と、現在の姿勢の姿勢に応じて発話を行うので、さらにユーザに違和感を与えにくいという更なる効果を奏する。

　本発明の態様４に係る音声発話装置（ロボット３）は、上記態様２において、上記動作決定部（発話内容決定部３０３）は、少なくとも上記音声発話装置の目標姿勢に応じた言葉を発話する言葉として決定してもよい。

　上記構成によれば、上記音声発話装置は、少なくとも目標姿勢に応じて発話する言葉が決まるので、目標姿勢と発話する言葉とが対応し、よりユーザに違和感を与えにくいという更なる効果を奏する。

　本発明の態様５に係る音声発話装置（ロボット２）は、上記態様２の態様において、上記動作決定部（発話内容決定部２０３）は、発話する言葉にキーワードが含まれているかどうかを確認し、当該キーワードが含まれている場合には、当該キーワードに対応する上記音声発話装置の目標姿勢を決定することを決定してもよい。

　上記構成によれば、上記音声発話装置は、発話する言葉に含まれるキーワードに対応する目標姿勢が決まるので、発話する言葉と目標姿勢とが対応し、よりユーザに違和感を与えにくいという更なる効果を奏する。

　本発明の態様６に係る音声発話装置（ロボット１、２、３）は、上記態様２から５までのいずれかの態様において、上記駆動制御部は、上記音声発話装置の現在の姿勢から、上記動作決定部が決定した目標姿勢となるように、上記駆動部を制御してもよい。

　上記構成によれば、上記音声発話装置は、目標姿勢となるように姿勢が変化するので、よりユーザに違和感を与えにくいという更なる効果を奏する。

　本発明の態様７に係る音声発話方法は、発話機能を備えた音声発話装置（ロボット１、２及び３）による音声発話方法であって、上記音声発話装置の姿勢を変化させるように制御する駆動制御工程と、上記姿勢に応じた言葉を発話する発話処理工程と、を含む。

　上記の構成によれば、上記音声発話方法は、従来よりも発話の内容によってユーザに違和感を与えにくいという効果を奏する。

　本発明の各態様に係る音声発話装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記音声発話装置が備える各部（ソフトウェア要素）として動作させることにより上記音声発話装置をコンピュータにて実現させるプログラム、及びそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

　本発明は、ロボット等の各種音声発話装置に好適に利用することができる。

　１、２、３　　　　　　　ロボット（音声発話装置）
　６０　　　　　　　　　　音声出力部（発話処理部）
　１０５　　　　　　　　　音声出力制御部（発話処理部）
　１０３、２０３、３０３　発話内容決定部（動作決定部）
　１０４　　　　　　　　　駆動制御部

Claims

　発話機能を備えた音声発話装置であって、
　上記音声発話装置の姿勢を変化させる駆動部を制御する駆動制御部と、
　上記姿勢に応じた言葉を発話する発話処理部と、を備えることを特徴とする音声発話装置。
　上記音声発話装置の現在の姿勢と、当該現在の姿勢よりも後の姿勢である目標姿勢とのうちの少なくとも一つに応じた言葉を上記姿勢に応じた言葉として決定する動作決定部を備え、
　上記発話処理部は、上記動作決定部が決定した言葉を発話することを特徴とする請求項１に記載の音声発話装置。
　上記動作決定部は、上記音声発話装置が発話及び姿勢制御を行う契機となるイベントの内容と、上記音声発話装置の現在の姿勢とに応じて、発話する言葉を決定することを特徴とする請求項２に記載の音声発話装置。
　上記動作決定部は、少なくとも上記音声発話装置の目標姿勢に応じた言葉を発話する言葉として決定することを特徴とする請求項２に記載の音声発話装置。
　上記動作決定部は、発話する言葉にキーワードが含まれているかどうかを確認し、当該キーワードが含まれている場合には、当該キーワードに対応する上記音声発話装置の目標姿勢を決定することを特徴とする請求項２に記載の音声発話装置。
　上記駆動制御部は、上記音声発話装置の現在の姿勢から、上記動作決定部が決定した目標姿勢となるように、上記駆動部を制御することを特徴とする請求項２～５の何れか１項に記載の音声発話装置。
　発話機能を備えた音声発話装置による音声発話方法であって、
　上記音声発話装置の姿勢を変化させるように制御する駆動制御工程と、
　上記姿勢に応じた言葉を発話する発話処理工程と、を含むことを特徴とする音声発話方法。