JP2013235134A

JP2013235134A - 言語療法ロボット及び言語療法システム

Info

Publication number: JP2013235134A
Application number: JP2012107440A
Authority: JP
Inventors: Tadashi Samejima; 正鮫島; Miyuki Koyama; 美雪小山; Shunei Tanaka; 俊英田中
Original assignee: Terumo Corp
Current assignee: Terumo Corp
Priority date: 2012-05-09
Filing date: 2012-05-09
Publication date: 2013-11-21
Anticipated expiration: 2032-05-09
Also published as: JP6046913B2

Abstract

【課題】より有用な機能を提供する
【解決手段】ロボット１０は、患者Ｐに示す定型会話文と、当該定型会話文の模範音声とを予め記憶部６６に記憶し、定型会話文をモニタ１４により患者Ｐに示し、患者Ｐが定型会話文を読んで発声した発話音声を胴体部マイク３２と頭部マイク４０とにより取得し、模範音声と、発話音声とを、対応する所定分割単位である単語に区切って比較し、当該単語毎に一致度を比較部により算出し、一致度が所定の閾値以下である単語における発話音声を、対応する単語の模範音声に置き換え補正音声を生成するようにした。
【選択図】図３１

Description

本発明は言語療法ロボット及び言語療法システムに関し、構音障害のリハビリテーションを行う言語療法ロボット及び言語療法システムに適用して好適なものである。

従来、声を出し発語する際に障害が出る構音障害の患者のリハビリテーション（音声訓練）として、言語聴覚士による言語療法が行われている。

そのような言語療法において、言語聴覚士における言語療法の補助を行う装置の開発が求められており、そのような装置として、正答の音声と患者の発声とを聞き比べる装置が提案されている（例えば特許文献１参照）。

特開２０１１−２０９４７１公報

言語療法は、患者の構音障害を回復させるためのより効果的な訓練や、患者及び言語聴覚士の負担を軽減するためのより効率の良い訓練が望まれており、そのような言語療法に用いられる装置において、より有用な機能が望まれている。

本発明は以上の点を考慮してなされたもので、一段と有用な機能を提供し得る言語療法ロボット及び言語療法システムを提案しようとするものである。

かかる課題を解決するため本発明の言語療法ロボットにおいては、患者に示す言葉と、当該言葉の模範音声とを予め記憶する記憶部と、言葉を患者に示す出力部と、患者が言葉に応じて発声した発話音声を入力する音声入力部と、模範音声と、発話音声とを、対応する所定分割単位に区切って比較し、当該所定分割単位毎に一致度を算出する比較部と、一致度が所定の閾値以下である分割単位における発話音声を、対応する分割単位の模範音声に置き換え補正音声を生成する補正部とを設けるようにした。

この言語療法ロボットは、患者の発音が適切でなかった場合に音声を補正した上で患者に聞かせることができる。

本発明によれば、言語療法ロボットは、患者の発音が適切でなかった場合に音声を補正した上で患者に聞かせることができる。かくして本発明は、一段と有用な機能を提供し得る言語療法ロボット及び言語療法システムを実現できる。

言語療法システムの全体構成を示す略線図である。ロボットの外観構成を示し、（ａ）は平面図、（ｂ）は正面図、（ｃ）は背面図である。ロボットの制御構成を示す略線図である。例文ライブラリの構成を示す略線図である。問題文ライブラリの構成を示す略線図である。定型会話文ライブラリの構成を示す略線図である。フォルダライブラリの構成を示す略線図である。サーバの回路構成を示す略線図である。音声検出スタンバイ処理手順（１）を示すフローチャートである。音声検出スタンバイ処理手順（２）を示すフローチャートである。録音再生処理手順（１）を示すフローチャートである。録音再生処理手順（２）を示すフローチャートである。音声分析提示処理の実行時における制御部の機能ブロック構成を示す略線的ブロック図である。音声信号波形を示す略線図である。子音部波形を示す略線図である。バーグラフを示す略線図である。音声分析提示処理手順を示すフローチャートである。再生処理手順を示すフローチャートである。操作解答問題処理手順（１）を示すフローチャートである。操作解答問題処理手順（２）を示すフローチャートである。発声解答問題処理手順（１）を示すフローチャートである。発声解答問題処理手順（２）を示すフローチャートである。発声持続時間測定処理手順を示すフローチャートである。ディアトコキネシス処理手順を示すフローチャートである。解答結果提示処理手順を示すフローチャートである。遠隔通信処理手順（１）を示すシーケンスチャートである。遠隔通信処理手順（２）を示すシーケンスチャートである。遠隔通信処理手順（３）を示すシーケンスチャートである。遠隔通信処理手順（４）を示すシーケンスチャートである。音声補正処理の実行時における制御部の機能ブロック構成を示す略線的ブロック図である。音声が補正される様子を示す略線図である。音声補正処理手順（１）を示すフローチャートである。音声補正処理手順（２）を示すフローチャートである。他の実施の形態によるロボットの外観構成を示し、（ａ）は平面図、（ｂ）は正面図、（ｃ）は背面図である。

以下、図面について、本発明の一実施の形態を詳述する。

１．実施の形態
１−１．言語療法システムの構成
図１に示すように、言語療法システム１は、複数のロボット１０（ロボット１０ａ及びロボット１０ｂ）と管理センタ１２とを含んで構成されている。

ロボット１０は、言語療法が行われる言語療法施設２ａ及び２ｂそれぞれに１台ずつ設置される。

言語療法施設２ａに設置されたロボット１０ａは、複数人の患者Ｐ（患者Ｐａのみ図示する）と、当該複数人の患者Ｐの言語療法の補助を行う言語聴覚士（以下では聴覚士と呼ぶ）Ｔａとにより使用される。

言語療法施設２ｂに設置されたロボット１０ｂは、複数人の患者Ｐ（患者Ｐｂのみ図示する）と、当該複数人の患者Ｐの言語療法の補助を行う聴覚士Ｔｂとにより使用される。

ロボット１０ａ及び１０ｂの管理情報は、サーバ１３を有する管理センタ１２によって管理される。管理センタ１２は、サーバ１３を介しロボット１０ａ及び１０ｂを互いに通信させる。

１−２．ロボットの構成
図２に示すように、ロボット１０は全体として人間を模した構成を有し（これを言語療法ロボットと呼ぶ）、円錐台形状の胴体部２２と球体状の頭部２０とが連結されることにより構成されている。

頭部２０は、頭部アクチュエータが内蔵されており、胴体部２２の垂直軸ＶＡとその垂直軸ＶＡに直交する水平軸ＨＡに関して決められた範囲で回転する。かくして、頭部２０は左右と上下の２自由度で、決められた範囲内で回転する。

胴体部２２の下部には左右にそれぞれ車輪２４Ｌ及び２４Ｒが取り付けられており、当該車輪２４Ｌ及び２４Ｒは独立して前後に回転する。以下では車輪２４Ｌ及び２４Ｒをまとめて車輪２４とも呼ぶ。これによりロボット１０は、前進、後退、旋回、信地旋回、超信地旋回等の動作を行うことができる。

胴体部２２には、正面の中央部分に、人間が触れたことを感知する腹部タッチセンサ２６が設けられている。当該腹部タッチセンサ２６は、言語療法を行う際、患者Ｐの準備が完了して実際に言語療法を開始するために操作される。

また胴体部２２には、背面の左右にそれぞれ左背中タッチセンサ２８及び右背中タッチセンサ３０が設けられている。当該左背中タッチセンサ２８は、言語療法を行う際、患者Ｐが各種問題に解答した解答結果が正解であった場合に操作される。一方右背中タッチセンサ３０は、患者Ｐの解答結果が不正解であった場合に操作される。

胴体部２２における腹部タッチセンサ２６の上部には、周囲の音声を集音する胴体部マイク３２が設けられている。また胴体部２２における腹部タッチセンサ２６の下部には、音声を発生させるスピーカ３４が左右に設けられている。

胴体部２２における背面の下部には、ケーブルが接続される端子３６が設けられている。

頭部２０の上部には、人間が触れたことを感知する頭部タッチセンサ４２が左右に設けられている。当該頭部タッチセンサ４２は、言語療法が行われている際、当該言語療法の作業を終了するために操作される。

また頭部２０には、右目及び左目に相当する位置において、周囲の状況を撮像するＣＣＤ（Charge Coupled Device）カメラ３８が設けられている。

ＣＣＤカメラ３８の上部には、周囲の音声を集音する頭部マイク４０が設けられている。

またＣＣＤカメラ３８の下部であり、口に相当する位置には、複数のＬＥＤ（Light Emitting Diode）４４が二次元配列状に設けられている。

図３に示すように、ロボット１０は、胴体部２２に設けられた制御部５０を中心として各部が接続された構成となっており、当該制御部５０によって頭部２０及び胴体部２２を統括制御する。

制御部５０は、ＣＰＵ（Central Processing Unit）５２が、各種プログラムが格納されたＲＯＭ（Read Only Memory）５４及びＣＰＵ５２のワークエリアとして使用されるＲＡＭ（Random Access Memory）５６にデータバス５１を介して接続される。

これにより制御部５０は、ＲＯＭ５４に格納されたアプリケーションプログラムを言語療法処理部５７ａ、入出力動作処理部５８及びデータ記憶処理部５９にそれぞれ取り込ませることにより、ロボット１０を用いた言語療法機能を実行する。

言語療法処理部５７は、患者Ｐに示す問題情報を生成すると共に、問題に対し患者Ｐが解答した際、解答情報として取り込んで評価して記憶データを生成し、記憶部６６に記憶させる。

さらに言語療法処理部５７は、通信部６４を介して他のロボット１０へ音声信号等を送信すると共に、他のロボット１０からの音声信号等を受信し、音声データを生成する。

入出力動作処理部５８は、患者Ｐや聴覚士Ｔから指示命令が与えられたとき、対応する応答動作をロボット１０が行う動作情報を生成する。また入出力動作処理部５８は、入力情報がロボット１０に与えられたとき、これを取り込んで対応する出力情報を生成する。

頭部タッチセンサ４２、腹部タッチセンサ２６、左背中タッチセンサ２８又は右背中タッチセンサ３０は、使用者（患者Ｐ及び聴覚士Ｔ）によるタッチ操作に応じた接触信号を制御部５０に送出する。

頭部マイク４０及び胴体部マイク３２は、使用者からの指示命令を示す音声を含む周囲の音声を集音して得た音声信号を制御部５０に送出する。

入出力動作処理部５８は、頭部マイク４０及び胴体部マイク３２から受信した音声信号をデジタル変換した後に所定の方式でエンコードすることにより音声データを得て、当該音声データを音声認識することにより、使用者が発声した内容を認識する。

ＣＣＤカメラ３８は、ロボット１０周辺の人物や周囲の状況を撮像して得た画像信号を制御部５０に送出する。

入出力動作処理部５８は、ＣＣＤカメラ３８から得た画像信号を画像処理することにより画像データを得て、聴覚士Ｔ及び患者Ｐの位置を認識する。

胴体部２２には、端子３６を介してケーブルによりモニタ１４が接続されている。入出力動作処理部５８は、各種画像データをモニタ１４に出力することにより表示させる。

モニタ１４にはタッチパネル１５が組み込まれており、使用者は当該タッチパネル１５が組み込まれたモニタ１４を操作することにより、各種操作信号を制御部５０に入力する。

このように入出力動作処理部５８は、接触信号、操作信号、音声信号及び画像信号を取得することにより、周囲の状況及び使用者の指令を判断する。入出力動作処理部５８は判断結果に基づいて次の行動を決定し、各部を駆動させる。

ロボット１０自体を物理的に移動させる場合、入出力動作処理部５８は、車輪アクチュエータ６０を駆動することにより車輪２４を回転させる。これにより入出力動作処理部５８は、ロボット１０を聴覚士Ｔや患者Ｐの方へ移動させ対面させたり、その場で回転させたりする。

また、頷く等の動作をロボット１０に行わせる場合、入出力動作処理部５８は、頭部アクチュエータ６２を駆動することにより、胴体部２２に対し頭部２０を上下左右に回転させる。

さらに話す動作をロボット１０に行わせる場合、入出力動作処理部５８は、音声信号をスピーカ３４に出力し音声を放音させる。

また、ロボット１０の表情を変化させる場合、入出力動作処理部５８は、複数のＬＥＤ４４の点灯パターンを制御する。

例えば、嬉しそうな態度を使用者に示す場合、入出力動作処理部５８は、喜びモードでロボット１０を行動させる。

具体的には、入出力動作処理部５８は、ＬＥＤ４４の点灯パターンを制御することにより、人間が笑っているときの口の形を示すと共に、車輪アクチュエータ６０を駆動しロボット１０を超信地旋回させることにより、喜んでいる態度を使用者に示す。

一方、悲しそう態度を使用者に示す場合、入出力動作処理部５８は、悲しみモードでロボット１０を行動させる。

具体的には、入出力動作処理部５８は、ＬＥＤ４４の点灯パターンを制御することにより、人間が悲しんでいるときの口の形を示すと共に、頭部アクチュエータ６２を駆動し頭部２０を左右に小さく往復させることにより、悲しんでいる態度を使用者に示す。

このようにロボット１０は、周囲の状況等に基づき、移動する、頭部２０を回転させる、話す、表情を変化させる等の、人間に模した行動を行う。

また言語療法処理部５７は、管理センタ１２を介し他者と会話する機能が使用者の指示により選択された場合、頭部マイク４０及び胴体部マイク３２から集音し得た音声信号をエンコードし、記憶部６６に音声データとして記憶すると共に、当該音声データを通信部６４へ送出する。

それと共に言語療法処理部５７は、管理センタ１２から通信部６４により受信信号を受信する。

通信部６４は、受信信号を所定の方式に従って復調等することにより受信データに変換し、これを言語療法処理部５７へ送出する。言語療法処理部５７は、当該受信データをデコードすることにより相手方の音声データを復元し、音声信号としてスピーカ３４へ出力する。スピーカは音声信号を基に相手方の音声を出力する。

記憶部６６は例えばフラッシュメモリでなり、図４に示す、患者Ｐに話させる例文の音声データが、１番、２番及び３番の難易度毎にそれぞれ数種類ずつ格納された例文ライブラリＬ１を記憶している。

例文は、難易度１の例文が「おはよう」等の短文でなり、難易度２の例文が「おはようございます。本日は……。」等の数行の文章でなり、難易度３の例文が「おはようございます。本日は……。……。」等の数十行の文章で構成されることにより、数字が大きくなるほど難易度が上がるように設定されている。

また記憶部６６は、例文ライブラリＬ１に記憶されている例文を発音する際の模範的な発音を示す模範音声データを予め記憶している。

また記憶部６６は、図５に示す、患者Ｐに解答させる問題文が、１番、２番及び３番の難易度毎にそれぞれ数種類ずつ格納された問題文ライブラリＬ２を記憶している。

問題文は、難易度１の問題文が「日本の首都はどこ？」等の問題でなり、難易度２の問題文が「今の総理大臣は誰？」等の問題でなり、難易度３の問題文が「大化の改新は何年？」等の問題で構成されることにより、数字が大きくなるほど難易度が上がるように設定されている。

また記憶部６６は、問題文ライブラリＬ２の問題文に対する解答を予め記憶している。

さらに記憶部６６は、図６に示す、複数の患者Ｐに対話形式で話させる定形会話文が、１番、２番及び３番の難易度毎にそれぞれ数種類ずつ格納された定型会話文ライブラリＬ３を記憶している。因みに、図６においては難易度１のみを示し、他は省略している。

定型会話文は、例文ライブラリＬ１及び問題文ライブラリＬ２と同様に、難易度の数字が大きくなるほど難易度が上がるように設定されている。

また記憶部６６は、定型会話文ライブラリＬ３に記憶されている定型会話文を発音する際の模範的な発音を示す模範音声データを予め記憶している。

さらに記憶部６６は、図７に示す、ロボット１０を使用する複数の患者Ｐの解答結果等の各種データが日にち毎に区切ってまとめられたフォルダライブラリＬ４を記憶している。フォルダライブラリＬ４は、患者Ｐ毎のデータがまとめられた患者フォルダを複数個有している。因みに図７においては、ロボット１０ａを使用する「患者Ｐａ」の患者フォルダのみを示している。

患者フォルダは、録音音声ライブラリ、問題解答ライブラリ、質問解答ライブラリ、発声持続時間ライブラリ、ディアトコ回数ライブラリ及び定型会話音声ライブラリにより構成されている。

録音音声ライブラリは、ロボット１０ａを使用する患者Ｐの音声データを、それぞれ当該音声データが記録された際の記録時点と対応付けて記憶している。

例えば録音音声ライブラリは、患者Ｐａの「Ａ１」というデータ名でなる音声データを、当該音声データが記録された日にち「２０１２年２月１日」と、当該日にち内での何回目の音声データかを示す「１回目」という記録時点と対応付けて記憶される。以下では、日にち及び当該日にち内での何回目かを示す情報を、記録時点と呼ぶ。

また録音音声ライブラリは、録音された患者Ｐの音声と、予め記憶されている模範音声との一致度を記憶している。

問題解答ライブラリは、ロボット１０ａが出題した問題に対しモニタ１４をタッチして入力した患者Ｐの解答の正誤及び解答に要した時間を、それぞれ解答された際の日にち及び当該日にち内での何回目かを示す情報である解答時点と対応付けて記憶する。

例えば問題解答ライブラリは、「２０１２年２月１日１回目」に行われた問題が「難易度１、問題文１」であって、当該問題に対する患者Ｐａの解答の正誤が「正解」であり、問題が出題されてから解答するまでに患者Ｐａが要した解答時間が「３０秒」であることを示している。

また問題解答ライブラリは、同一の日にちにおいて行われた難易度毎の問題の正答率を記憶する。図７においては、「２０１２年２月１日」に行われた「難易度１」の問題に対する正答率が「５０％」であることを示している。

質問解答ライブラリは、ロボット１０ａが出題した問題に対し発声することにより解答した患者Ｐの解答の正誤及び解答に要した時間を、それぞれ解答時点と対応付けて記憶する。

また質問解答ライブラリは、同一の日にちにおいて行われた難易度毎の問題の正答率を記憶する。

発声持続時間ライブラリは、患者Ｐａが発声した所定の言葉の発声持続時間を測定した結果を記憶する。

ディアトコ回数ライブラリは、患者Ｐａが所定時間内に同じ言葉を発音した回数を計測して結果を記憶する。

定形会話音声ライブラリは、ロボット１０ａを使用する患者Ｐａが、ロボット１０ｂを使用する患者Ｐｂと対話形式で会話した際の音声データを、当該音声データが記録された際の記録時点と対応付けて記憶している。

ロボット１０は、使用者の操作指示に従って種々のプログラムを実行することにより、後述する録音再生機能、再生機能、操作解答問題機能、発声解答問題機能、発声持続時間測定機能、ディアトコ機能、解答結果提示機能及び遠隔通信機能、並びにアプリケーションプログラムによる種々の機能を実現するようになされている。

１−３．管理センタの構成
図８に示すように、管理センタ１２はサーバ１３を有し、全体として言語療法システム１を使用するロボット１０及び患者Ｐの情報を管理するようになされており、制御部７０、通信部７２及び記憶部７４により構成されている。

制御部７０は、ＣＰＵ７６、ＲＯＭ７８及びＲＡＭ８０が設けられており、管理センタ１２全体を統括制御する。

記憶部７４は、言語療法システム１を使用するロボット１０及び患者Ｐを管理する使用者データベース（図示しない）を記憶している。

使用者データベースは、現在電源が投入されており使用されているロボット１０と、当該ロボット１０を使用している患者Ｐとを対応付けた情報となっている。

制御部７０は、通信部７２を介してロボット使用開始通知をロボット１０から受信することにより、当該ロボット１０の電源が投入され使用されていることを認識し、ロボット１０を使用者データベースに登録する。

一方制御部７０は、通信部７２を介してロボット使用終了通知をロボット１０から受信することにより、当該ロボット１０の電源が切断され使用されていないことを認識し、ロボット１０を使用者データベースから削除する。

このように制御部７０は、ロボット使用開始通知及びロボット使用終了通知を受信することにより、現在使用されているロボットを認識する。

また通信部７２は、ロボット１０ｂを送信先と指定する送信先情報と音声データとをロボット１０ａから受信すると、ロボット１０ｂへ当該音声データを送信する。

一方通信部７２は、ロボット１０ａを送信先と指定する送信先情報と音声データとをロボット１０ｂから受信すると、ロボット１０ａへ当該音声データを送信する。

このように管理センタ１２は、ロボット１０ａ及びロボット１０ｂに対し、当該管理センタ１２を介して互いに音声データを通信させる。

１−４．音声検出スタンバイ処理
ロボット１０ａの制御部５０ａは、図９に示すフローチャートに従った処理を行う。因みに、ロボット１０ａ及び１０ｂ（図１）は同じ構成であるため、以下ではロボット１０ａについてのみ説明する。

言語療法処理部５７ａは、例えば聴覚士Ｔａによりロボット１０ａの電源が投入されると、ＲＯＭ５４から音声検出スタンバイプログラムを読み出して実行することにより音声検出スタンバイ処理手順ＲＴ１を開始し、ステップＳＰ１へ移る。

この音声検出スタンバイ処理において言語療法処理部５７ａは、使用者からの指示命令となる音声を検出するまで待機する音声検出スタンバイ状態となる。

ステップＳＰ１において言語療法処理部５７ａは、ロボット１０ａの使用を開始したことを示すロボット使用開始通知を、当該ロボット１０ａを使用している患者Ｐａを示す情報と対応付け、管理センタ１２へ送信する。

ステップＳＰ２において入出力動作処理部５８ａは、「ろくおん」という言葉を音声認識したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ３へ移り録音再生サブルーチンＳＲＴ１（詳しくは後述する）に従った処理を行い、ステップＳＰ１８（図１０）へ移る。

一方ステップＳＰ２において否定結果が得られた場合、入出力動作処理部５８ａは、ステップＳＰ４へ移り、「さいせい」を音声認識したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ５へ移り再生サブルーチンＳＲＴ２（詳しくは後述する）に従った処理を行い、ステップＳＰ１８へ移る。

一方ステップＳＰ４において否定結果が得られた場合、入出力動作処理部５８ａは、ステップＳＰ６へ移り、「もんだい」を音声認識したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ７へ移り操作解答問題サブルーチンＳＲＴ３（詳しくは後述する）に従った処理を行い、ステップＳＰ１８へ移る。

一方ステップＳＰ６において否定結果が得られた場合、入出力動作処理部５８ａは、ステップＳＰ８へ移り、「しつもん」を音声認識したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ９へ移り、発声解答問題サブルーチンＳＲＴ４（詳しくは後述する）に従った処理を行い、ステップＳＰ１８へ移る。

一方ステップＳＰ８において否定結果が得られた場合、入出力動作処理部５８ａは、ステップＳＰ１０へ移り、「はっせいじかん」を音声認識したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ１１へ移り発声持続時間測定サブルーチンＳＲＴ５（詳しくは後述する）に従った処理を行い、ステップＳＰ１８へ移る。

一方ステップＳＰ１０において否定結果が得られた場合、入出力動作処理部５８ａは、ステップＳＰ１２へ移り、「ディアトコ」を音声認識したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ１３へ移りディアトコキネシスサブルーチンＳＲＴ６（詳しくは後述する）に従った処理を行い、ステップＳＰ１８へ移る。

一方ステップＳＰ１２において否定結果が得られた場合、入出力動作処理部５８ａは、ステップＳＰ１４へ移り、「けっかみせて」を音声認識したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ１５へ移り、解答結果提示サブルーチンＳＲＴ７（詳しくは後述する）に従った処理を行い、ステップＳＰ１８へ移る。

一方ステップＳＰ１４において否定結果が得られた場合、入出力動作処理部５８ａは、ステップＳＰ１６へ移り、「グループ」を音声認識したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ１７へ移り、遠隔通信サブルーチンＳＲＴ８（詳しくは後述する）に従った処理を行い、ステップＳＰ１８へ移る。

ステップＳＰ１８において入出力動作処理部５８ａは、例えば聴覚士Ｔａによりロボット１０ａの電源が切断されたか否かを判定する。ここで肯定結果が得られると、制御部５０ａは、ステップＳＰ１９へ移る。

一方ステップＳＰ１８において否定結果が得られた場合、制御部５０ａは、ステップＳＰ２へ戻り、再度使用者からの指示命令を待ち受ける。

ステップＳＰ１９において言語療法処理部５７ａは、ロボット１０ａの使用を終了したことを示すロボット使用終了通知を、当該ロボット１０ａを使用している患者Ｐａを示す情報と対応付けて管理センタ１２へ送信し、ステップＳＰ２０へ移り音声検出スタンバイ処理を終了する。

このように制御部５０ａは、音声検出スタンバイ状態において、聴覚士Ｔａ又は患者Ｐａからの指示命令となる音声を検出し、当該指示命令に応じた機能を実行する処理を、それぞれのサブルーチンにおいて行う。

１−５．録音再生機能
制御部５０ａは、音声検出スタンバイ処理手順ＲＴ１（図９）においてステップＳＰ３へ移ると、ＲＯＭ５４から録音再生プログラムを読み出して実行することにより、録音再生処理を実行する。

制御部５０ａは、この録音再生処理を実行することにより、頭部マイク４０及び胴体部マイク３２により集音して得た音声信号をエンコードし、記憶部６６における録音音声ライブラリに音声データとして記憶する。

それと共に制御部５０ａは、一旦録音音声ライブラリに記憶した音声データをデコードして音声信号とし、スピーカ３４に出力することにより放音させる。

１−５−１．録音再生処理手順
制御部５０ａは、録音再生サブルーチンＳＲＴ１（図１１）を開始し、ステップＳＰ２１へ移る。

ステップＳＰ２１において入出力動作処理部５８ａは、スピーカ３４から「ろくおんですね。名前を教えて」と出力し、ステップＳＰ２２へ移り待機する。

ステップＳＰ２２において言語療法処理部５７ａは、頭部マイク４０及び胴体部マイク３２により集音した使用者の音声に基づき、フォルダライブラリＬ４（図７）において音声データを記憶する患者フォルダを決定し、ステップＳＰ２３へ移る。

具体的には言語療法処理部５７ａは、患者Ｐａを示す「Ａさん」を音声認識すると、フォルダライブラリＬ４の患者Ｐａの患者フォルダにおける録音音声ライブラリに、この後の処理において受信する音声データを記憶すると決定する。

ステップＳＰ２３において入出力動作処理部５８ａは、スピーカ３４から「Ａさんですね」と出力し、ステップＳＰ２４へ移り待機する。

ステップＳＰ２４において言語療法処理部５７ａは、「はい」を音声認識したか否かを判定する。ここで例えば「いいえ」を音声認識することにより否定結果が得られると、言語療法処理部５７ａはステップＳＰ２１へ戻り、患者Ｐの名前を再度待ち受ける。

一方ステップＳＰ２４において肯定結果が得られると、入出力動作処理部５８ａは、スピーカ３４から「何番のレベルをやりますか」と出力し、ステップＳＰ２６へ移り待機する。

ステップＳＰ２６において言語療法処理部５７ａは、例えば「１番」を音声認識すると、例文ライブラリＬ１における難易度「１番」を選択し、ステップＳＰ２７へ移る。

ステップＳＰ２７において入出力動作処理部５８ａは、スピーカ３４から「１番ですね」と出力し、ステップＳＰ２８へ移り待機する。

ステップＳＰ２８において言語療法処理部５７ａは、「はい」を音声認識したか否かを判定する。ここで例えば「いいえ」を音声認識することにより否定結果が得られると、言語療法処理部５７ａはステップＳＰ２５へ戻り、例文の難易度の指定を再度待ち受ける。

一方ステップＳＰ２８において肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ２９へ移り、スピーカ３４から「準備ができたらお腹を触ってください」と出力し、ステップＳＰ３０へ移る。

ステップＳＰ３０において入出力動作処理部５８ａは、車輪アクチュエータ６０を駆動することにより車輪２４を回転させ、ＣＣＤカメラ３８から得られた画像信号に基づき患者Ｐａの方に胴体部２２の正面を向ける。このようにロボット１０ａは、腹部タッチセンサ２６を患者Ｐａに向けることにより、患者Ｐａに対し当該腹部タッチセンサ２６に触りやすくすることができる。

ステップＳＰ３１において言語療法処理部５７ａは、腹部タッチセンサ２６から接触信号を受信したか否かを判定する。ここで否定結果が得られると、言語療法処理部５７ａはステップＳＰ２９へ戻り、患者Ｐａの準備が整うまで待機する。

一方ステップＳＰ３１において肯定結果が得られると、言語療法処理部５７ａはステップＳＰ３２へ移り、指定した難易度「１番」の複数の例文から１つの例文を選択して、スピーカ３４から例えば例文１の「おはよう」を出力し、ステップＳＰ３３へ移る。

ステップＳＰ３３において入出力動作処理部５８ａは、スピーカ３４から「続けて言ってみてください。終わったら頭を撫でてください。どうぞ」と出力することにより、患者Ｐａに対し音声を復唱することを促し、ステップＳＰ３４へ移る。

ステップＳＰ３４において入出力動作処理部５８ａは、車輪アクチュエータ６０を駆動することにより車輪２４を回転させ、ＣＣＤカメラ３８から得られた画像信号に基づき患者Ｐａの方に胴体部２２及び頭部２０の正面を向ける。これによりロボット１０ａは、頭部マイク４０及び胴体部マイク３２を患者Ｐａに向け、当該患者Ｐａの音声を確実に集音することができる。

ステップＳＰ３５において言語療法処理部５７ａは、頭部マイク４０及び胴体部マイク３２により集音した患者Ｐａの音声に基づく音声データを、ステップＳＰ２２において決定した患者フォルダにおける録音音声ライブラリに、現在の日にち及び本日における何回目の音声データかを示す記録時点と対応付け記憶する。これによりロボット１０ａは、患者Ｐａの音声を録音する。

ステップＳＰ３６において言語療法処理部５７ａは、頭部タッチセンサ４２から接触信号を受信したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ４１へ移る。

一方ステップＳＰ３６において否定結果が得られると、言語療法処理部５７ａはステップＳＰ３７へ移り、ステップＳＰ３５の処理開始時点から（すなわち録音を開始してから）３分が経過したか否かを判定する。

ここで否定結果が得られると、言語療法処理部５７ａはステップＳＰ３６へ移り、録音の終了指示を待ち受ける。

一方ステップＳＰ３７において肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ３８へ移り、スピーカ３４から「終わったら頭を撫でてください」と出力することにより、使用者に対し、録音が終了した場合頭部タッチセンサ４２に触れることを再度促し、ステップＳＰ３９へ移る。

ステップＳＰ３９において言語療法処理部５７ａは、頭部タッチセンサ４２から接触信号を受信したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ４１へ移る。

一方ステップＳＰ３９において否定結果が得られると、言語療法処理部５７ａは、ステップＳＰ３８の処理完了時点から（すなわち録音が終了した場合頭部タッチセンサ４２に触れることを再度促してから）１分が経過したか否かを判定する。

ここで否定結果が得られると、言語療法処理部５７ａはステップＳＰ３９へ移り、録音の終了指示を待ち受ける。

一方ステップＳＰ４０において肯定結果が得られると、入出力動作処理部５８ａは、一定時間待機しても録音の終了指示がないため、ステップＳＰ４８へ移りスピーカ３４から「ろくおん、おしまい」と出力することにより、録音再生機能を終了することを使用者に伝えた後、ステップＳＰ４９へ移り録音再生サブルーチンＳＲＴ１を終了する。

これに対しステップＳＰ４１において入出力動作処理部５８ａは、スピーカ３４から「では、音声を聞いてみましょう」と出力することにより、患者Ｐａに対し、録音した患者Ｐａ自身の音声を聞くことを促し、ステップＳＰ４２へ移る。

ステップＳＰ４２において制御部５０は、音声分析提示サブルーチンＳＲＴ９（詳しくは後述する）に従った処理を行って分析結果をモニタ１４ａに表示し、ステップＳＰ４３へ移る。

ステップＳＰ４３において入出力動作処理部５８ａは、録音した患者Ｐａ自身の音声データを録音音声ライブラリから選択してスピーカ３４から出力し、ステップＳＰ４４へ移る。

このようにロボット１０ａは、患者Ｐａが発声した直後に、当該患者Ｐａに対し自身の音声を聞かせることにより、患者Ｐａがどのように発音したかを忘れないうちに自身の音声を確認させることができる。

ステップＳＰ４４において入出力動作処理部５８ａは、スピーカ３４から「もう一度聞く場合はお腹を触ってください。やめる場合は頭を撫でてください」と出力しステップＳＰ４５へ移る。

ステップＳＰ４５において言語療法処理部５７ａは、腹部タッチセンサ２６から接触信号を受信したか否かを判定する。ここで肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ４３へ移り、録音した音声を再度スピーカ３４から出力する。

一方ステップＳＰ４５において否定結果が得られると、言語療法処理部５７ａはステップＳＰ４６へ移り、頭部タッチセンサ４２から接触信号を受信したか否かを判定する。ここで肯定結果が得られると、言語療法処理部５７ａはステップＳＰ４８を介してステップＳＰ４９へ移り録音再生サブルーチンＳＲＴ１を終了する。

一方ステップＳＰ４６において否定結果が得られると、言語療法処理部５７ａはステップＳＰ４７へ移る。ステップＳＰ４７において言語療法処理部５７ａは、ステップＳＰ４４の処理完了時点から（すなわち頭部タッチセンサ４２又は腹部タッチセンサ２６への接触を促してから）３分が経過したか否かを判定する。

ここで否定結果が得られると、言語療法処理部５７ａはステップＳＰ４４へ移り、録音音声を聞くか、又は録音再生処理を終了するかの指示を再度待ち受ける。

一方ステップＳＰ４７において肯定結果が得られると、一定時間待機しても指示がないため、言語療法処理部５７ａはステップＳＰ４８を介してステップＳＰ４９へ移り録音再生サブルーチンＳＲＴ１を終了する。

このようにロボット１０ａは、使用者の指示により録音再生機能が選択された場合、例文を患者Ｐａに対し読み上げて、当該例文を患者Ｐａに復唱させ、患者Ｐａの音声を記録し、当該記録した音声を再生することができる。

１−５−２．音声分析提示機能
制御部５０ａは、録音再生処理手順ＳＲＴ１（図１２）においてステップＳＰ４２へ移ると、ＲＯＭ５４から音声分析提示プログラムを読み出して実行することにより、音声分析提示処理を実行する。

このとき制御部５０ａは、図１３に示すように、分析部８２、提示体作成部８４及び判定部８６として機能する。

上述したように、記憶部６６は、例文ライブラリＬ１（図４）に記憶されている例文を発音する際の模範的な発音を模範音声データとして記憶している。

ところで構音障害の患者は、例えば「がく」という言葉を発音しようとした際、「が」行が、実際の発音としては「な」行になってしまい、「なく」と発音してしまうなど、ある特定の子音が発音しにくくなる場合がある。

図１４（ａ）に「が」の音の信号波形を、図１４（ｂ）に「な」の音の信号波形を示すように、それぞれの音は、振幅が比較的小さい子音部と、振幅が比較的大きい母音部とから構成されている。

図１４（ａ）における「が」の子音部を拡大した信号波形である「が」子音部波形ＷＧを図１５（ａ）に、図１４（ｂ）における「な」の子音部を拡大した「な」子音部波形ＷＮを図１５（ｂ）に示す。

「が」子音部波形ＷＧには、中央やや左側に位置する第１分析区間ＡＡ１において、「か」の音の特徴となる波形が現れている。

また、「が」子音部波形ＷＧの子音部の最終部分（右端）に位置する第２分析区間ＡＡ２には、濁音の特徴となる波形である濁音特徴波形が現れている。

一方、「な」子音部波形ＷＮ（図１５（ｂ））には、中央やや左側に位置する第１分析区間ＡＡ１において、「な」の音の特徴となる波形が現れているが、第２分析区間ＡＡ２には、濁音特徴波形が現れていない。

分析部８２（図１３）は、頭部マイク４０及び胴体部マイク３２から音声信号（以下、入力音声信号とも呼ぶ）を受信し分析を行う。このとき分析部８２は、正しい発音としては「が」であるにもかかわらず、図１４（ａ）に示した「な」の音声信号を受信したとする。

分析部８２は、「な」の音声信号から、図１５（ｂ）に示した「な」子音部波形ＷＮを得て、第１分析区間ＡＡ１における最大の振幅の絶対値である最大振幅ＧＡ（０．１７Ｖ）を検出する。

提示体作成部８４は、分析部８２により検出した第１分析区間ＡＡ１における最大振幅ＧＡに応じた上下方向の長さでなるバーグラフＢＧ（図１６）の画像データを生成する。すなわち、入力音声の第１分析区間ＡＡ１における最大振幅ＧＡが大きいほどバーグラフＢＧの長さは長くなる。

また分析部８２は、「な」子音部波形ＷＮの第２分析区間ＡＡ２において濁音特徴波形が存在するか否かを判定する。分析部８２により濁音特徴波形が存在しないと判定されると、提示体作成部８４は、赤色のバーグラフＢＧを生成する。

一方分析部８２により濁音特徴波形が存在すると判定されると、提示体作成部８４は、緑色のバーグラフＢＧを生成する。

「な」の入力音声に対し、提示体作成部８４は、図１６（ａ）に示すバーグラフＢＧ１を生成する。バーグラフＢＧ１は、赤色でなり、長さが長く構成されている。

さらに分析部８２は、「が」の模範音声の分析を行う。分析部８２は、「が」の音声信号から、図１５（ａ）に示した「が」子音部波形ＷＧを得て、第１分析区間ＡＡ１における最大振幅ＧＡ（０．１Ｖ）を検出する。

提示体作成部８４は、分析部８２により検出した「が」子音部波形ＷＧの第１分析区間ＡＡ１における最大振幅ＧＡに応じ、バーグラフＢＧと重ねて、適正範囲線ＬＣを破線で生成する。

この適正範囲線ＬＣは、発音が適切であったか否かを示すものであり、バーグラフＢＧの長さが短くなり、適正範囲線ＬＣを下回って適正範囲ＲＣに収まった場合、判定部８６は、患者の発音が適切であったと判定する。

また判定部８６は、適正範囲線ＬＣに対しバーグラフＢＧの長さがどれだけ近づいているか、すなわち模範音声に対する入力音声の適切さを算出し、患者フォルダの録音音声ライブラリにおける一致度として記憶する。

かかる構成において、適切な発音が「が」である場合に「な」が入力されると、提示体作成部は８４、図１６（ａ）に示すように、長さが適正範囲線ＬＣを超えてしまっており、かつ赤色のバーグラフＢＧ１を作成する。

また、「か」が入力されると、「な」よりは適切な発音である「が」に近づいたが濁音の成分が含まれていないため、提示体作成部８４は、図１６（ｂ）に示すように、長さはバーグラフＢＧ１と等しいが緑色のバーグラフＢＧ２を作成する。

さらに、「か」と「が」との間の発音である場合、提示体作成部８４は、図１６（ｃ）に示すように、緑色であり、長さがバーグラフＢＧ２よりも短いバーグラフＢＧ３を作成する。このとき提示体作成部８４は、入力音声の第１分析区間ＡＡ１の最大振幅ＧＡに基づきバーグラフＢＧ３の長さを設定する。

さらに、「が」が入力された場合、提示体作成部８４は、図１６（ｄ）に示すように、緑色であり、かつ長さが適正範囲線ＬＣ以下であるバーグラフＢＧ４を作成する。

このように制御部５０ａは、患者の発音の適正度合いを、バーグラフＢＧの長さ及び色で表現すると共に、適正範囲線ＬＣをバーグラフＢＧと重ねて表示することにより、患者に対し、患者自身の発音が模範データに対しどの程度正しいかを、一目瞭然にして示すことができる。

第１分析区間ＡＡ１における最大振幅ＧＡは、「な」の音から「が」の音に近づくに連れて大きくなる傾向がある。このため提示体作成部８４は、分析部８２により検出された入力音声の最大振幅ＧＡに基づくだけで、適切な発音になるに連れて短くなるバーグラフＢＧを生成できる。

１−５−３．音声分析提示処理手順
制御部５０ａは、音声分析提示サブルーチンＳＲＴ９（図１７）を開始し、ステップＳＰ５１へ移る。

ステップＳＰ５１において制御部５０ａは、分析部８２により模範音声の第１分析区間ＡＡ１を分析して最大振幅ＧＡを検出し、ステップＳＰ５２へ移る。

ステップＳＰ５２において制御部５０ａは、模範音声の第１分析区間ＡＡ１における最大振幅ＧＡに基づき、提示体作成部８４により適正範囲線ＬＣを設定し、ステップＳＰ５３へ移る。

ステップＳＰ５３において制御部５０ａは、分析部８２により入力音声の第１分析区間ＡＡ１を分析して最大振幅ＧＡを検出し、ステップＳＰ５４へ移る。

ステップＳＰ５４において制御部５０ａは、入力音声の第１分析区間ＡＡ１における最大振幅ＧＡに基づき、提示体作成部８４によりバーグラフＢＧの長さを設定し、ステップＳＰ５５へ移る。

ステップＳＰ５５において制御部５０ａは、分析部８２により入力音声の第２分析区間ＡＡ２に濁音特徴波形が存在するか否かを判定する。ここで否定結果が得られると、このことは患者Ｐが濁音を発音できなかったことを意味し、このとき制御部５０ａはステップＳＰ５８へ移り、提示体作成部８４によりバーグラフＢＧの色を赤色にし、ステップＳＰ５９へ移る。

一方ステップＳＰ５５において肯定結果か得られると、このことは患者Ｐが濁音を発音できたことを意味し、このとき制御部５０ａはステップＳＰ５７へ移り、提示体作成部８４によりバーグラフＢＧの色を緑色にし、ステップＳＰ５９へ移る。

ステップＳＰ５９において制御部５０ａは、提示体作成部８４により作成したバーグラフＢＧ及び適正範囲線ＬＣをモニタ１４ａに表示し、ステップＳＰ６０へ移る。

ステップＳＰ６０において制御部５０ａは、判定部８６によりバーグラフＢＧが適正範囲ＲＣ内であるか否かを判定する。ここで肯定結果が得られると、制御部５０ａはステップＳＰ６１へ移り、判定部８６によりバーグラフＢＧが緑色であるか否かを判定する。

ステップＳＰ６１において肯定結果が得られると、このことは、患者Ｐの発音が正しかったことを意味し、このとき制御部５０ａはステップＳＰ６２へ移り、スピーカ３４から「ピンポーン」と出力することにより、発音が正しかったことを患者Ｐに伝え、ステップＳＰ６４へ移り、音声分析提示サブルーチンＳＲＴ９を終了する。

一方ステップＳＰ６０又はステップＳＰ６１において否定結果が得られると、このことは患者Ｐの発音が不適切であったことを意味し、このとき制御部５０ａはステップＳＰ６３へ移り、スピーカ３４から「もう一度頑張ろう」と出力することにより、発音が不適切であったことを患者Ｐに伝え、ステップＳＰ６４へ移り、音声分析提示サブルーチンＳＲＴ９を終了する。

１−５−４．録音再生機能の動作及び効果
以上の構成において、ロボット１０は、患者Ｐが発声した音声を録音して再生する。

このためロボット１０は、患者Ｐに訓練のフィードバックをすることができる。これにより患者Ｐは、自身の声を確認することができ、構音障害の回復を早くすることができる。

また聴覚士Ｔは、ロボット１０に記録されている情報を確認することにより、患者Ｐの構音障害の状況を把握し、どの程度改善されているかを知ることができるため、言語療法の作業効率を高めることができる。

またロボット１０は、人間を模した形状でなり、人間を模した行動を取るようにした。これにより患者Ｐは、ロボット１０に対し親しみを持ちやすく、単なる電子機器を相手に言語療法を行うよりも、感情を伴った訓練を行うことができる。

また従来、言語療法の現場ではカセットテープが使用されていたため、録音後の頭出し等が不便であった。これに対しロボット１０においては、フラッシュメモリでなる記憶部６６に音声データを記憶するため、極めて簡便に音声データを再生することができる。

また制御部５０は、音声分析提示処理において、患者Ｐの発音の分析結果を瞬時に可視化することにより、患者Ｐ及び聴覚士Ｔに訓練結果をフィードバックでき、その場の訓練の指標を提供することができる。

例えば、単純に模範音声と録音音声の波形を並べて表示しただけでは、患者Ｐは自分の音声が正しいのか理解しにくい。

これに対し本実施の形態においては、バーグラフＢＧと共に適正範囲線ＬＣを表示するため、患者Ｐは自分の発音の正しさを一目瞭然にして知ることができる。

また、構音障害の患者の多くは多くは高齢者であったり、半身マヒがあったりするために、細かい動作を行うことが難しい。

これに対しロボット１０は、次に患者Ｐが何を行えば良いかを示して患者Ｐを誘導しながら、発声させたりロボット１０を触らせたり等のシンプルな動作により指示入力させることができる。

以上の構成によれば、動物の形状を模したロボット１０は、スピーカ３４により例文を患者Ｐに示し、当該例文を読み上げた患者Ｐの発話音声を頭部マイク４０及び胴体部マイク３２により取得し、模範音声と発話音声とを比較し、模範音声に対する発話音声の正しさを示すバーグラフを提示体作成部により作成し、当該バーグラフをモニタ１４ａにより患者Ｐに提示するようにした。

これによりロボット１０は、模範音声に対する患者Ｐの発話音声の正しさを、一目瞭然にして患者Ｐに示すことができる。

１−６．再生機能
制御部５０ａは、音声検出スタンバイ処理手順ＲＴ１（図９）においてステップＳＰ５へ移ると、ＲＯＭ５４から再生プログラムを読み出して実行することにより、再生処理を実行する。

制御部５０ａは、この再生処理を実行することにより、記憶部６６における録音音声ライブラリに記憶された音声データをデコードして音声信号とし、スピーカ３４に出力することにより放音させる。

１−６−１．再生処理手順
制御部５０ａは、再生サブルーチンＳＲＴ２（図１８）を開始し、ステップＳＰ７１へ移る。

ステップＳＰ７１において入出力動作処理部５８ａは、スピーカ３４から「さいせいですね。名前を教えて」と出力し、ステップＳＰ７２へ移り待機する。

ステップＳＰ７２において言語療法処理部５７ａは、頭部マイク４０及び胴体部マイク３２により集音した患者の音声に基づき、フォルダライブラリＬ４（図７）において音声データを再生する患者フォルダを決定し、ステップＳＰ７３へ移る。ここで言語療法処理部５７ａは、「Ａさん」を音声認識したとする。

ステップＳＰ７３において入出力動作処理部５８ａは、スピーカ３４から「Ａさんですね」と出力し、ステップＳＰ７４へ移り待機する。

ステップＳＰ７４において言語療法処理部５７ａは、「はい」を音声認識したか否かを判定する。ここで否定結果が得られると、言語療法処理部５７ａはステップＳＰ７１へ戻り、患者Ｐの名前を再度待ち受ける。

一方ステップＳＰ７４において肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ７５へ移り、ステップＳＰ７２において決定した患者フォルダにおける録音音声ライブラリをモニタ１４ａに一覧表示する。

ステップＳＰ７６において入出力動作処理部５８ａは、スピーカ３４から「いつの何回目のファイルにしますか」と出力し、ステップＳＰ７７へ移り待機する。

ステップＳＰ７７において言語療法処理部５７ａは、例えば「２０１２年２月１日１回目」を音声認識すると、当該指定された記録時点における音声データを録音音声ライブラリから選択し、ステップＳＰ７８へ移る。

ステップＳＰ７８において入出力動作処理部５８ａは、スピーカ３４から、ステップＳＰ７７において指定された音声データの記録時点を示す「２０１２年２月１日１回目ですね」と出力し、ステップＳＰ７９へ移り待機する。

ステップＳＰ７９において言語療法処理部５７ａは、「はい」を音声認識したか否かを判定する。ここで否定結果が得られると、言語療法処理部５７ａはステップＳＰ７５へ戻り、再生する音声データの指定を再度待ち受ける。

一方ステップＳＰ７９において肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ８０へ移り、スピーカ３４から、指定された音声データである「Ａ１」（図７）の音声を出力し、ステップＳＰ８１へ移る。

ステップＳＰ８１において入出力動作処理部５８ａは、スピーカ３４から「もう一度言いますか？」と出力し、ステップＳＰ８２へ移り待機する。

ステップＳＰ８２において言語療法処理部５７ａは、「はい」を音声認識したか否かを判定する。ここで肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ８０へ戻り、指定された音声をスピーカ３４から再度出力する。

一方ステップＳＰ８２において否定結果が得られると、入出力動作処理部５８ａはステップＳＰ８３へ移り、スピーカ３４から「さいせい、おしまい」と出力することにより、再生機能を終了することを使用者に伝えた後、ステップＳＰ８４へ移り再生サブルーチンＳＲＴ２を終了する。

このようにロボット１０ａは、上述した録音再生機能において録音直後に音声を再生するだけでなく、使用者の指示により再生機能が選択された場合には、予め記録した患者Ｐａの音声を、ある程度時間が経った後にも再生機能により再生し、使用者に聞かせることができる。

１−７．操作解答問題機能
制御部５０ａは、音声検出スタンバイ処理手順ＲＴ１（図９）においてステップＳＰ７へ移ると、ＲＯＭ５４から操作解答問題プログラムを読み出して実行することにより、操作解答問題処理を実行する。

制御部５０ａは、この操作解答問題処理を実行することにより、記憶部６６における問題文ライブラリＬ２（図５）の問題文の画像データをモニタ１４ａに表示させる。

それと共に制御部５０ａは、患者Ｐａがモニタ１４ａをタッチすることにより入力した解答を操作信号として取得する。

１−７−１．操作解答問題処理手順
制御部５０ａは、操作解答問題サブルーチンＳＲＴ３（図１９）を開始し、ステップＳＰ９１へ移る。

ステップＳＰ９１において入出力動作処理部５８ａは、スピーカ３４から「もんだいですね。名前を教えて」と出力し、ステップＳＰ９２へ移り待機する。

ステップＳＰ９２において言語療法処理部５７ａは、頭部マイク４０及び胴体部マイク３２により集音した患者の音声に基づき、フォルダライブラリＬ４（図７）において解答結果を記憶する患者フォルダを決定し、ステップＳＰ９３へ移る。

制御部５０ａは、ステップＳＰ９３からステップＳＰ１０１までは、録音再生サブルーチンＳＲＴ１（図１１及び図１２）におけるステップＳＰ２３からステップＳＰ３１までと同様の処理を行う。但し、ステップＳＰ９６においては、指定された難易度（例えば「１番」）の問題文を問題文ライブラリＬ２から選択する。

ステップＳＰ１０２において入出力動作処理部５８ａは、スピーカ３４から「では問題スタート。どうぞ」と出力することにより、患者Ｐａに対し問題を解くことを促し、ステップＳＰ１０３へ移る。

ステップＳＰ１０３において入出力動作処理部５８ａは、指定された難易度の複数の問題文から１つの問題文を選択して、例えば「日本の首都はどこ？」を示す画像をモニタ１４ａに表示し、ステップＳＰ１０４へ移る。このとき入出力動作処理部５８ａは、問題と共に、キーボードを示す画像をモニタ１４ａに表示する。

ステップＳＰ１０４において言語療法処理部５７ａは計時動作を開始し、ステップＳＰ１０５へ移る。

ステップＳＰ１０５において入出力動作処理部５８ａは、患者Ｐａの方に胴体部２２の正面を向け、ステップＳＰ１０６へ移り、タッチパネル１５から操作信号を受信したか否かを判定することにより、問題の解答を待ち受ける。

このとき患者Ｐａは、モニタ１４ａに表示された問題に対し、モニタ１４ａに表示されたキーボード画面をタッチすることにより、解答を入力する。

ステップＳＰ１０６において肯定結果が得られると言語療法処理部５７ａはステップＳＰ１０７へ移り、計時動作を終了することにより、患者Ｐａが問題の解答に要した時間を測定し、ステップＳＰ１０９へ移る。

一方ステップＳＰ１０６において否定結果が得られると、言語療法処理部５７ａはステップＳＰ１０８へ移り、ステップＳＰ１０３の処理開始時点から（すなわち問題を患者Ｐａに提示してから）５分が経過したか否かを判定する。

ここで否定結果が得られると、言語療法処理部５７ａはステップＳＰ１０６へ移り、患者の解答を待ち受ける。

一方ステップＳＰ１０８において肯定結果が得られると、このことは解答する時間として設定された時間である５分間を経過したことを意味し、このとき言語療法処理部５７ａはステップＳＰ１１８へ移る。

これに対しステップＳＰ１０９において言語療法処理部５７ａは、キーボードを操作することにより患者Ｐａが入力した解答が正解であったか否かを判定し、解答時点、問題文、正誤及び解答時間を問題解答ライブラリに記憶する。

このとき言語療法処理部５７ａは、ステップＳＰ１０６において取得した操作信号により示される患者Ｐａの解答と、記憶部６６に予め記憶されている模範解答とが一致している場合、正解であると判定する。

ステップＳＰ１１０において入出力動作処理部５８ａは、患者Ｐａの解答が正解であった場合、ステップＳＰ１１１へ移り、スピーカ３４から「正解！」と出力し、ステップＳＰ１１２へ移る。

ステップＳＰ１１２において入出力動作処理部５８ａは、ロボット１０ａを喜びモードで行動させる。すなわち入出力動作処理部５８ａは、車輪アクチュエータ６０を駆動することによりロボット１０ａを超信地旋回させると共に、ＬＥＤ４４を制御して笑顔の表情を示すことにより、嬉しそうな態度を患者Ｐａに示し、ステップＳＰ１１５へ移る。

一方ステップＳＰ１１０において患者Ｐａの解答が不正解であった場合、入出力動作処理部５８ａはステップＳＰ１１３へ移り、スピーカ３４から「残念！」と出力し、ステップＳＰ１１４へ移る。

ステップＳＰ１１４において入出力動作処理部５８ａは、ロボット１０ａを悲しみモードで行動させる。すなわち入出力動作処理部５８ａは、頭部アクチュエータ６２を駆動することにより、頭部２０を左右に小さく往復させると共に、ＬＥＤ４４を制御して落胆の表情を示すことにより、悲しそうな態度を患者Ｐａに示し、ステップＳＰ１１５へ移る。

このようにロボット１０ａは、患者Ｐａの解答が正解か否かを、発声、頭部２０の回転及び表情の変化により患者Ｐａに伝えることにより、患者Ｐａは、ロボット１０ａの行動を見て、正解か不正解かを一目瞭然に判断できる。

ステップＳＰ１１５において言語療法処理部５７ａは、「次」を音声認識すると、ステップＳＰ１１６へ移った後にステップＳＰ１０３へ戻り、指定された難易度の問題文から、今回出題した問題文以外の問題文を選択して出題する。

ステップＳＰ１１５において「次」を音声認識しなかった場合、言語療法処理部５７ａはステップＳＰ１１７へ移って指定された難易度の正答率を算出し、問題解答ライブラリに記憶してステップＳＰ１１８へ移る。

ステップＳＰ１１８において入出力動作処理部５８ａは、スピーカ３４から「もんだい、おしまい」と出力することにより、操作解答問題機能を終了することを使用者に伝えた後、ステップＳＰ１１９へ移り操作解答問題サブルーチンＳＲＴ３を終了する。

このようにロボット１０ａは、使用者の指示により操作解答問題機能が選択された場合、文章問題を患者Ｐａに対し提示し、当該問題の解答をタッチパネル１５により解答させると共に、解答時間を測定することができる。

１−７−２．操作解答問題機能の動作及び効果
以上の構成において、ロボット１０は、患者Ｐの解答時間を計測しながら操作信号を受信し、患者Ｐが正解を入力したか否かを判定し、使用者に対し正誤を音声出力すると共に、喜びモード又は悲しみモードで伝えるようにした。

これにより患者Ｐは、自分の解答が正解か否かを、ロボット１０の発声及び行動により一目瞭然に判断できる。

またロボット１０は、解答結果及び正答率を記憶部６６に記憶することにより、使用者は、患者Ｐの長期的な訓練経過を把握できる。

従来は、聴覚士Ｔがストップウォッチを用いて解答時間を測定していたため、非常に煩雑であった。

これに対しロボット１０においては、ロボット１０が自動的に解答時間を測定すると共に記録するため、聴覚士Ｔの負担を軽減させ、言語療法の効率を向上させることができる。

また従来は、聴覚士Ｔが患者Ｐの目の前で解答時間を測定していたため、患者Ｐに心理的なプレッシャーを与えてしまい、このような訓練を実施しにくかった。

これに対しロボット１０においては、聴覚士Ｔが患者Ｐの目の前で計測せずに、ロボット１０が患者Ｐに直接分からないように計測しているため、患者Ｐは心理的なプレッシャーが軽減され、効果的に訓練を実施することができる。

以上の構成によれば、動物の形状を模したロボット１０は、患者Ｐに示す問題を予め記憶部６６に記憶し、当該問題を患者Ｐに示し、当該問題に対する患者Ｐの解答を取得し、患者Ｐの言語能力の状態を判定する際に指標となる解答時間を計測するようにした。

これによりロボット１０は、患者Ｐが問題に解答する時間を測定するという一段と有用な機能を提供することができる。

１−８．発声解答問題機能
制御部５０ａは、音声検出スタンバイ処理手順ＲＴ１（図９）においてステップＳＰ９へ移ると、ＲＯＭ５４から発声解答問題プログラムを読み出して実行することにより、発声解答問題処理を実行する。

制御部５０ａは、この発声解答問題処理を実行することにより、記憶部６６における問題文ライブラリＬ２（図５）の問題文の画像データをモニタ１４ａに出力することにより表示させる。

それと共に制御部５０ａは、患者Ｐａが発声した解答を頭部マイク４０及び胴体部マイク３２により集音する。

１−８−１．発声解答問題処理手順
制御部５０ａは、発声解答問題サブルーチンＳＲＴ４（図２１）を開始し、ステップＳＰ１２１へ移る。

ステップＳＰ１２１において入出力動作処理部５８ａは、スピーカ３４から「しつもんですね。名前を教えて」と出力し、ステップＳＰ１２２へ移り待機する。

制御部５０ａは、ステップＳＰ１２２からステップＳＰ１３１までは、操作解答問題サブルーチンＳＲＴ３（図１９）におけるステップＳＰ９２からステップＳＰ１０１までと同様の処理を行う。

ステップＳＰ１３２において入出力動作処理部５８ａは、スピーカ３４から「では、１番の問題を見てみましょう。問題を読んで答えてください。どうぞ」と出力することにより、患者Ｐａに対し問題に対する解答を発声することを促し、ステップＳＰ１３３へ移る。

制御部５０ａは、ステップＳＰ１３３からステップＳＰ１３５までは、操作解答問題サブルーチンＳＲＴ３（図１９）におけるステップＳＰ１０３からステップＳＰ１０５までと同様の処理を行う。

ステップＳＰ１３６において入出力動作処理部５８ａは、頭部マイク４０及び胴体部マイク３２により集音した患者Ｐａの音声信号を受信し、ステップＳＰ１３７において頭部タッチセンサ４２からの接触信号の受信を待機する。

ここで否定結果が得られると、患者Ｐａは解答中であるため、言語療法処理部５７ａはステップＳＰ１３６へ移り、患者の解答を待ち受ける。

一方ステップＳＰ１３７において肯定結果が得られると、このことは患者Ｐａが解答を終了したことを意味し、言語療法処理部５７ａはステップＳＰ１３８へ移り、計時動作を終了することにより、患者Ｐａが問題の解答に要した時間を測定する。

この発声解答問題機能においては、上述した操作解答問題機能とは異なり、患者Ｐａが問題に対し発声して解答すると、聴覚士Ｔａがその正誤を判定し、ロボット１０ａの左背中タッチセンサ２８又は右背中タッチセンサ３０にタッチすることにより、正解又は不正解をロボット１０ａに入力する。

ステップＳＰ１３９において言語療法処理部５７ａは、右背中タッチセンサ３０から接触信号を受信したか否かを判定する。ここで肯定結果が得られると、患者Ｐａの解答が正解であったため、入出力動作処理部５８ａはステップＳＰ１４０へ移りスピーカ３４から「正解！」と出力し、ステップＳＰ１４１へ移りロボット１０ａを喜びモードで行動させてステップＳＰ１４５へ移る。

一方ステップＳＰ１３９において否定結果が得られると、言語療法処理部５７ａは、ステップＳＰ１４２へ移り、左背中タッチセンサ２８から接触信号を受信したか否かを判定する。ここで肯定結果が得られると、患者Ｐａの解答が不正解であったため、入出力動作処理部５８ａはステップＳＰ１４３へ移りスピーカ３４から「残念！」と出力し、ステップＳＰ１４４へ移りロボット１０ａを悲しみモードで行動させてステップＳＰ１４５へ移る。

ステップＳＰ１４５において言語療法処理部５７ａは患者Ｐａが発声した解答の解答時点、問題文、正誤及び解答時間を質問解答ライブラリに記憶する。

制御部５０ａは、ステップＳＰ１４６からステップＳＰ１４８までは、操作解答問題サブルーチンＳＲＴ３（図２０）におけるステップＳＰ１１６からステップＳＰ１１８までと同様の処理を行う。

ステップＳＰ１４９において入出力動作処理部５８ａは、スピーカ３４から「しつもん、おしまい」と出力することにより、発声解答問題機能を終了することを使用者に伝えた後、ステップＳＰ１５０へ移り発声解答問題サブルーチンＳＲＴ４を終了する。

このようにロボット１０ａは、使用者の指示により発声解答問題機能が選択された場合、文章問題を患者Ｐａに対し提示し、当該問題の解答を発声させて解答させると共に、解答時間を測定することができる。

１−８−２．発声解答問題機能の動作及び効果
以上の構成において、ロボット１０は、患者Ｐの解答時間を計測しながら音声信号を受信し、聴覚士Ｔの操作に基づき使用者に対し正誤を音声出力すると共に、喜びモード又は悲しみモードで伝えるようにした。

ロボット１０が、文字として書かれた質問を読み解答するという訓練を患者Ｐに行わせることにより、聴覚士Ｔは、患者Ｐの文章理解度を把握することができる。

従来は、聴覚士Ｔが紙に書かれた問題を患者Ｐに読ませ、その場で問題に答えてもらっていたため、どの程度正答率があったのか、どの位のスピードで解答できたのかは記録できなかった。

これに対しロボット１０においては、聴覚士Ｔの簡易な動作により、正解、不正解及び解答時間を記録し、正答率を算出することができ、言語療法の効率を高めることができる。

その他発声解答問題処理においてロボット１０は、操作解答問題処理の場合とほぼ同様の作用効果を奏し得る。

１−９．発声持続時間測定機能
制御部５０ａは、音声検出スタンバイ処理手順ＲＴ１（図９）においてステップＳＰ１１へ移ると、ＲＯＭ５４から発声持続時間測定プログラムを読み出して実行することにより、発声持続時間測定処理を実行する。

制御部５０ａは、この発声持続時間測定処理を実行することにより、患者Ｐａが発声した所定の言葉を頭部マイク４０及び胴体部マイク３２により集音し、発声持続時間を測定して記憶部６６における発声持続時間ライブラリに記憶する。

１−９−１．発声持続時間測定処理手順
制御部５０ａは、発声持続時間測定サブルーチンＳＲＴ５（図２３）を開始し、ステップＳＰ１５１へ移る。

ステップＳＰ１５１において入出力動作処理部５８ａは、スピーカ３４から「はっせいじかんですね。名前を教えて」と出力し、ステップＳＰ１５２へ移り待機する。

制御部５０ａは、ステップＳＰ１５２からステップＳＰ１５４までは、発声解答問題サブルーチンＳＲＴ４（図２１）におけるステップＳＰ１２２からステップＳＰ１２４までと同様の処理を行う。

ステップＳＰ１５５において入出力動作処理部５８ａは、スピーカ３４から「息の続く限り『あー』と言い続けてください。準備ができたらお腹を触ってください」と出力し、ステップＳＰ１５６へ移る。

ステップＳＰ１５６において入出力動作処理部５８ａは、患者Ｐａの方に胴体部２２の正面を向け、ステップＳＰ１５７において腹部タッチセンサ２６から接触信号を受信したか否かを判定する。

ここで肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ１５８へ移り、スピーカ３４から「では、発声時間スタート」と出力することにより、患者Ｐａに対し、『あー』と言う音を可能な限り長い時間発声することを促し、ステップＳＰ１５９へ移る。

一方ステップＳＰ１５７において否定結果が得られると、言語療法処理部５７ａはステップＳＰ１５５へ戻り、患者Ｐａの準備が整うまで待機する。

ステップＳＰ１５９において言語療法処理部５７ａは、計時動作を開始し、ステップＳＰ１６０へ移る。

ステップＳＰ１６０において入出力動作処理部５８ａは、患者Ｐａの方に胴体部２２及び頭部２０の正面を向け、ステップＳＰ１６１へ移る。

ステップＳＰ１６１において言語療法処理部５７ａは、頭部マイク４０及び胴体部マイク３２により集音した患者Ｐａの音声信号を受信し、ステップＳＰ１６２において『あ』という言葉を音声認識したか否かを判定する。

ここで肯定結果が得られると、このことは患者Ｐａが未だ言葉を発声し続けていることを意味し、言語療法処理部５７ａはステップＳＰ１６１へ移り、再度音声信号を受信する。

一方ステップＳＰ１６２において否定結果が得られた場合、このことは患者Ｐａが発声を終えたことを意味し、言語療法処理部５７ａはステップＳＰ１６３へ移って計時動作を終了し、ステップＳＰ１６４へ移る。

ステップＳＰ１６４において言語療法処理部５７ａは、ステップＳＰ１５２において決定した患者フォルダにおける発声持続時間ライブラリに、患者Ｐａの発声が持続した発声持続時間を記憶し、ステップＳＰ１６５へ移る。

ステップＳＰ１６５において入出力動作処理部５８ａは、スピーカ３４から例えば「今回は１０秒でした」と出力することにより、使用者に対し発声持続時間の計測結果を伝え、ステップＳＰ１６６へ移る。

ステップＳＰ１６６において言語療法処理部５７ａは、発声持続時間が１０秒以上であったか否かを判定する。言語療法処理部５７ａは、患者Ｐａが１０秒以上連続して発声できた場合、健常と判断する。

ここで肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ１６８へ移り、スピーカ３４から「頑張りましたね」と出力することにより、発声持続時間が正常であったことを患者Ｐａに伝え、ステップＳＰ１６９へ移る。

一方ステップＳＰ１６６において否定結果が得られると、入出力動作処理部５８ａはステップＳＰ１６７へ移り、スピーカ３４から「少し短かったかな」と出力することにより、発声持続時間が正常ではなかったことを患者Ｐａに伝え、ステップＳＰ１６９へ移る。

ステップＳＰ１６９において入出力動作処理部５８ａは、スピーカ３４から「終了する場合は頭を撫でてください」と出力し、ステップＳＰ１７０へ移り頭部タッチセンサ４２からの接触信号の受信を待機し、ステップＳＰ１７１へ移りスピーカ３４から「はっせいじかん、おしまい」と出力することにより、発声持続時間測定機能を終了することを使用者に伝えた後、ステップＳＰ１７２へ移り発声持続時間測定サブルーチンＳＲＴ５を終了する。

このようにロボット１０は、使用者の指示により発声持続時間測定機能が選択された場合、音声信号を受信しながら音声認識を行って発声持続時間を測定し、患者Ｐが正常な時間だけ発音を持続できているか否かを判定し、使用者に結果を伝えるようにした。

これによりロボット１０は、患者Ｐの発声を聞きながら聴覚士Ｔがストップウォッチ等で発声持続時間を計測するといった手間を省くことができる。

またロボット１０は、発声持続時間を記憶部６６に記憶することにより、使用者は、患者Ｐの発声持続時間の長期的な測定経過を把握できる。これにより患者Ｐは、自身の発声持続時間が日時の経過に連れて改善している様子を知ることができ、言語療法に対するモチベーションを保つことができる。

以上の構成によれば、動物の形状を模したロボット１０は、患者Ｐに示す言葉を予め記憶部６６に記憶し、当該言葉を患者Ｐに示し、患者Ｐが当該言葉に応じて可能な限り長い時間発声した発話音声を胴体部マイク３２と頭部マイク４０とにより取得し、患者Ｐの言語能力の状態を判定する際に指標となる発声持続時間を計測するようにした。

これによりロボット１０は、発声持続時間を測定するという一段と有用な機能を提供することができる。

１−１０．ディアトコキネシス機能
制御部５０ａは、音声検出スタンバイ処理手順ＲＴ１（図１０）においてステップＳＰ１３へ移ると、ＲＯＭ５４からディアトコキネシスプログラムを読み出して実行することにより、ディアトコキネシス処理を実行する。

制御部５０ａは、このディアトコキネシス処理を実行することにより、口腔器官の巧緻性や運動速度を評価する、いわゆるオーラルディアトコキネシスを行う。本実施の形態においては、制御部５０ａは患者Ｐが５秒間に何回「パ」を発音できるかを計測する。

１−１０−１．ディアトコキネシス処理手順
制御部５０ａは、ディアトコキネシスサブルーチンＳＲＴ６（図２４）を開始し、ステップＳＰ１８１へ移る。

ステップＳＰ１８１において入出力動作処理部５８ａは、スピーカ３４から「ディアトコですね。名前を教えて」と出力し、ステップＳＰ１８２へ移り待機する。

制御部５０ａは、ステップＳＰ１８２からステップＳＰ１８４までは、発声持続時間測定サブルーチンＳＲＴ５（図２３）におけるステップＳＰ１５２からステップＳＰ１５４までと同様の処理を行う。

ステップＳＰ１８５において入出力動作処理部５８ａは、スピーカ３４から「５秒間『パ』と言い続けてください。準備ができたらお腹を触ってください」と出力し、ステップＳＰ１８６へ移る。

制御部５０ａは、ステップＳＰ１８６からステップＳＰ１９０までは、発声持続時間測定サブルーチンＳＲＴ５（図２３）におけるステップＳＰ１５６からステップＳＰ１６０までと同様の処理を行う。

ステップＳＰ１９１において言語療法処理部５７ａは、頭部マイク４０及び胴体部マイク３２により集音した患者Ｐａの『パ』の音声信号を受信し、音声データとして記憶部６６に記憶しステップＳＰ１９２へ移る。

ステップＳＰ１９２において言語療法処理部５７ａは、５秒間の計時動作を終了し、ステップＳＰ１９３へ移る。

ステップＳＰ１９３において言語療法処理部５７ａは、記憶部６６に記憶した音声データを音声認識して５秒間の間に受信した『パ』の音の回数を計測し、ステップＳＰ１９４へ移り、患者フォルダにおけるディアトコ回数ライブラリに発声回数を記憶し、ステップＳＰ１９５へ移る。

ステップＳＰ１９５において入出力動作処理部５８ａは、スピーカ３４から例えば「今回は１０回でした」と出力することにより、使用者に対し発声回数の計測結果を伝え、ステップＳＰ１９６へ移る。

ステップＳＰ１９６において言語療法処理部５７ａは、発声回数が２０回以上であったか否かを判定する。言語療法処理部５７ａは、患者Ｐａが２０回以上発声できた場合、健常と判断する。

ここで肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ１９７へ移り、スピーカ３４から「頑張りましたね」と出力することにより、発声回数が正常であったことを患者Ｐａに伝え、ステップＳＰ１９９へ移る。

一方ステップＳＰ１９６において否定結果が得られると、入出力動作処理部５８ａはステップＳＰ１９８へ移り、スピーカ３４から「少し少なかったかな」と出力することにより、発生回数が正常ではなかったことを患者に伝え、ステップＳＰ１９９へ移る。

制御部５０ａは、ステップＳＰ１９９からステップＳＰ２００までは、発声持続時間測定サブルーチンＳＲＴ５（図２３）におけるステップＳＰ１６９からステップＳＰ１７０までと同様の処理を行う。

ステップＳＰ２０１において入出力動作処理部５８ａは、スピーカ３４から「ディアトコ、おしまい」と出力することにより、ディアトコキネシス機能を終了することを使用者に伝えた後、ステップＳＰ２０２へ移りディアトコキネシスサブルーチンＳＲＴ６を終了する。

このようにロボット１０ａは、使用者の指示によりディアトコ機能が選択された場合、
５秒間測定している間音声信号を受信し、音声認識を行って発声回数を測定し、患者Ｐａが正常な回数だけ発音できているか否かを判定し、使用者に結果を伝えるようにした。

これによりロボット１０ａは、聴覚士Ｔがストップウォッチ等で５秒間を測定しつつ、発声回数を計測するといった困難な作業を行わずにオーラルディアトコキネシスを行うことができる。

またロボット１０ａは、発声回数を記憶部６６に記憶することにより、使用者は、患者Ｐａの発声回数の長期的な測定経過を把握できる。これにより患者Ｐａは、自身の発声回数が日時の経過に連れて改善している様子を知ることができ、言語療法に対するモチベーションを保つことができる。

以上の構成によれば、動物の形状を模したロボット１０は、患者Ｐに示す言葉を予め記憶部６６に記憶し、当該言葉を患者Ｐに示し、患者Ｐが当該言葉に応じて可能な限り多く発声した発話音声を胴体部マイク３２と頭部マイク４０とにより取得し、患者Ｐの言語能力の状態を判定する際に指標となる所定時間と、発話回数とを計測するようにした。

これによりロボット１０は、患者Ｐの所定時間内の発声回数を計測するという一段と有用な機能を提供することができる。

１−１１．解答結果提示機能
制御部５０ａは、音声検出スタンバイ処理手順ＲＴ１（図１０）においてステップＳＰ１５へ移ると、ＲＯＭ５４から解答結果提示プログラムを読み出して実行することにより、解答結果提示処理を実行する。

制御部５０ａは、この解答結果提示処理を実行することにより、記憶部６６における問題解答ライブラリに記憶された患者Ｐａの解答結果を読み出し、スピーカ３４に出力することにより放音させる。

１−１１−１．解答結果提示処理手順
制御部５０ａは、解答結果提示サブルーチンＳＲＴ７（図２５）を開始し、ステップＳＰ２１１へ移る。

ステップＳＰ２１１において入出力動作処理部５８ａは、スピーカ３４から「けっかみせてですね。名前を教えて」と出力し、ステップＳＰ２１２へ移り待機する。

制御部５０ａは、ステップＳＰ２１２からステップＳＰ２１９までは、再生サブルーチンＳＲＴ２（図１８）におけるステップＳＰ７２からステップＳＰ７９までと同様の処理を行う。

但し、ステップＳＰ２１５において入出力動作処理部５８ａは、患者フォルダにおける問題解答ライブラリをモニタ１４ａに一覧表示する。

ステップＳＰ２２０において入出力動作処理部５８ａは、スピーカ３４から例えば「２０１２年２月１日第１回の問題は、３０秒で解けました」と出力しステップＳＰ２２１へ移る。

制御部５０ａは、ステップＳＰ２２１からステップＳＰ２２２までは、再生サブルーチンＳＲＴ２（図１８）におけるステップＳＰ８１からステップＳＰ８２までと同様の処理を行い、ステップＳＰ２２３へ移りスピーカ３４から「けっか、おしまい」と出力することにより、解答結果提示機能を終了することを使用者に伝えた後、ステップＳＰ２２４へ移り解答結果提示サブルーチンＳＲＴ７を終了する。

このようにロボット１０ａは、使用者の指示により解答結果提示機能が選択された場合、上述した操作解答問題機能において患者Ｐａが問題に解答した結果を、その後解答結果提示処理により出力し、使用者に提示することができる。

１−１２．遠隔通信機能
ロボット１０ａの制御部５０ａは、音声検出スタンバイ処理手順ＲＴ１（図１０）においてステップＳＰ１７へ移ると、ＲＯＭ５４から遠隔通信プログラムを読み出して実行することにより、遠隔通信処理を実行する。

同様にロボット１０ｂの制御部５０ｂは、音声検出スタンバイ処理手順ＲＴ１（図１０）においてステップＳＰ１７へ移ると、ＲＯＭ５４から遠隔通信プログラムを読み出して実行することにより、遠隔通信処理を実行する。

制御部５０ａ及び５０ｂは、この遠隔通信処理を実行することにより、ロボット１０ａを使用する患者Ｐａ及びロボット１０ｂを使用する患者Ｐｂに対し定型会話文を表示して、患者Ｐａ及び患者Ｐｂに交互に読み上げさせ、会話をさせる。

１−１２−１．遠隔通信処理手順
ロボット１０ａの制御部５０ａは、遠隔通信サブルーチンＳＲＴ８（図２６）を開始し、ステップＳＰ２３１へ移る。

同様にロボット１０ｂの制御部５０ｂは、遠隔通信サブルーチンＳＲＴ８（図２６）を開始し、ステップＳＰ２６３へ移る。

ステップＳＰ２３１において入出力動作処理部５８ａは、スピーカ３４から「グループですね。名前を教えて」と出力し、ステップＳＰ２３２へ移り待機する。

ステップＳＰ２３２において言語療法処理部５７ａは、頭部マイク４０及び胴体部マイク３２により集音した患者の音声信号（「Ａさん」）に基づき、フォルダライブラリＬ４（図７）において音声データを記憶する患者Ｐａの患者フォルダを選択し、ステップＳＰ２３３へ移る。

ステップＳＰ２３３において入出力動作処理部５８ａは、スピーカ３４から「Ａさん。こんにちは。これから一緒に練習する人を探します」と出力し、ステップＳＰ２３４へ移る。

ステップＳＰ２３４において言語療法処理部５７ａは、患者情報要求を管理センタ１２へ送信する。

ロボット１０ｂの制御部５０ｂは、ステップＳＰ２６３からステップＳＰ２６６までは、ロボット１０ａの制御部５０ａにおけるステップＳＰ２３１からステップＳＰ２３４までの処理とほぼ同様の処理を行う。

但し、ステップＳＰ２６４において言語療法処理部５７ｂは、患者名「Ｂさん」が入力されると、ロボット１０ｂの記憶部６６のフォルダライブラリＬ４において音声データを記憶する患者Ｐｂの患者フォルダを選択する。

ステップＳＰ２５６において管理センタ１２の制御部７０は、ロボット１０ａ及び１０ｂから患者情報要求を受信し、ステップＳＰ２５７において患者データベースを検索することにより、現在ロボット１０を使用している患者Ｐを探索する。

ここで制御部７０は、ロボット１０ａを患者Ｐａが、ロボット１０ｂを患者Ｐｂがそれぞれ使用中であることを患者データベースから判定し、ステップＳＰ２５８において、患者情報をロボット１０ａ及びロボット１０ｂへ送信する。

具体的に制御部７０は、患者Ｐｂがロボット１０ｂを使用中であることを示す患者情報をロボット１０ａに、患者Ｐａがロボット１０ａを使用中であることを示す患者情報をロボット１０ｂにそれぞれ送信する。

ステップＳＰ２３５においてロボット１０ａの言語療法処理部５７ａは、患者Ｐｂがロボット１０ｂを使用中であること示す患者情報を管理センタ１２から受信する。

一方ステップＳＰ２６７においてロボット１０ｂの言語療法処理部５７ｂは、患者Ｐａがロボット１０ａを使用中であることを示す患者情報を管理センタ１２から受信する。

ステップＳＰ２３６においてロボット１０ａの言語療法処理部５７ａは、患者情報に基づき、ロボット１０ａ以外のロボット１０を使用している患者Ｐが現在存在するか否かを判定する。

ここで否定結果が得られると、現在ロボット１０を使用している患者Ｐが他に存在しないために遠隔通信機能による訓練ができないことを意味し、入出力動作処理部５８ａは、ステップＳＰ２３８へ移り、スピーカ３４から「今、練習している人がいないみたいです。また一緒に練習しましょうね」と出力し、ステップＳＰ２８９へ移り遠隔通信サブルーチンＳＲＴ８を終了する。

一方ステップＳＰ２３６において肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ２３７へ移り、スピーカ３４から「Ｂさんが一緒に練習する人を探しています。一緒にやりますか？」と出力し、ステップＳＰ２３９へ移り待機する。

ステップＳＰ２３９において言語療法処理部５７ａは、「はい」を音声認識したか否かを判定する。ここで否定結果が得られると、言語療法処理部５７ａはステップＳＰ２８９へ移り遠隔通信サブルーチンＳＲＴ８を終了する。

一方ステップＳＰ２３９において肯定結果が得られると、入出力動作処理部５８ａはステップＳＰ２４０に移り、スピーカ３４から「では、定型会話をしてみましょう。Ａさん何番の会話をしますか。やめたい場合は、『おしまい』と言ってください」と出力し、ステップＳＰ２４１へ移り待機する。

ステップＳＰ２４１において入出力動作処理部５８ａは、例えば「１番」を音声認識すると、スピーカ３４から「１番ですね。Ｂさんいいですか」と出力し待機する。

一方ロボット１０ｂの制御部５０ｂは、ステップＳＰ２６８からステップＳＰ２７３までは、ロボット１０ａの制御部５０ａにおけるステップＳＰ２３８からステップＳＰ２４３までの処理とほぼ同様の処理を行う。

ステップＳＰ２７４において言語療法処理部５７ｂは、「はい」を音声認識したか否かを判定する。ここで否定結果が得られると、言語療法処理部５７ｂはステップＳＰ２７２へ戻り、定型会話文の難易度の指定を患者Ｐｂから待ち受ける。

一方ステップＳＰ２７４において肯定結果が得られると、ロボット１０ａの言語療法処理部５７ａは、ステップＳＰ２４２へ移り、定型会話文ライブラリＬ３（図６）における難易度「１番」を選択し、ステップＳＰ２４３へ移る。

ステップＳＰ２４３からステップＳＰ２４５において入出力動作処理部５８ａは、腹部タッチセンサ２６から接触信号を受信し、患者Ｐａの方に胴体部２２の正面を向ける。

ステップＳＰ２４６において入出力動作処理部５８ａは、スピーカ３４から「では、Ａさんから読み上げてください」と出力し、ステップＳＰ２４７に移り定型会話文をモニタ１４ａに表示する。

ロボット１０ｂの制御部５０ｂは、患者Ｐｂに対し、ステップＳＰ２７５からステップＳＰ２８０までは、ロボット１０ａの制御部５０ａにおけるステップＳＰ２４２からステップＳＰ２４７までの処理とほぼ同様の処理を行う。

ステップＳＰ２４８においてロボット１０ａの言語療法処理部５７ａは、頭部マイク４０及び胴体部マイク３２により集音した患者Ｐａの音声に基づく音声データを、患者Ｐａの患者フォルダの定型会話音声ライブラリに記憶する。

ステップＳＰ２４９において制御部５０ａは、音声補正サブルーチンＳＲＴ１０（詳しくは後述する）に従った処理を行うことにより、録音した音声を補正し、ステップＳＰ２５０へ移る。

ステップＳＰ２５０において言語療法処理部５７ａは、補正した音声データを、ロボット１０ｂを送信先と指定する送信先情報と共に管理センタ１２へ送信する。

ステップＳＰ２５９において管理センタ１２の制御部７０は音声データを受信し、ステップＳＰ２６０へ移り、送信先情報により指定された送信先であるロボット１０ｂへ音声データを送信する。

ステップＳＰ２８１においてロボット１０ｂの言語療法処理部５７ｂは音声データを受信し、ステップＳＰ２８２へ移り、スピーカ３４から当該音声データに基づく音声「おはようございます」を出力する。

患者Ｐｂは、当該音声を聞くと、モニタ１４ｂに表示された定型会話文を見ながら、当該音声の返答となる、「おはようございます」を発音する。

ステップＳＰ２８３において言語療法処理部５７ｂは、頭部マイク４０及び胴体部マイク３２により集音した患者Ｐｂの音声に基づく音声データを、ロボット１０ｂにおける患者フォルダの定型会話音声ライブラリに記憶する。

ステップＳＰ２８４において制御部５０ｂは、音声補正サブルーチンＳＲＴ１０（詳しくは後述する）に従った処理を行うことにより、録音した音声を補正し、ステップＳＰ２８５へ移る。

ステップＳＰ２８５において言語療法処理部５７ｂは、記憶した音声データを、ロボット１０ａを送信先と指定する送信先情報と共に管理センタ１２へ送信する。

ステップＳＰ２６１において管理センタ１２の制御部７０は音声データを受信し、ステップＳＰ２６２へ移り、送信先情報により指定された送信先であるロボット１０ａへ音声データを送信する。

ステップＳＰ２５１においてロボット１０ａの言語療法処理部５７ａは、音声データを管理センタ１２から受信してステップＳＰ２５２へ移り、スピーカ３４から音声「おはようございます」を出力する。

ステップＳＰ２５３において言語療法処理部５７ａは、「おしまい」を音声認識したか否かを判定する。ここで否定結果が得られると、このことは患者Ｐａが訓練を継続する意思があることを意味する。

このとき言語療法処理部５７ａはステップＳＰ２４８へ戻り、定型会話文ライブラリＬ３における次の会話文「本日は天気がいいですね」を頭部マイク４０及び胴体部マイク３２により集音した患者Ｐａの音声に基づく音声データを、患者Ｐａの患者フォルダの定型会話音声ライブラリに記憶し、引き続き訓練を継続する。

一方ステップＳＰ２８６においてロボット１０ｂの言語療法処理部５７ｂは、「おしまい」を音声認識したか否かを判定する。ここで否定結果が得られると、このことは、患者Ｐｂは訓練を継続する意思があることを意味する。

このとき言語療法処理部５７ｂはステップＳＰ２８１へ戻り、音声データを管理センタ１２から受信し、スピーカ３４から音声「本日は天気がいいですね」を出力し、引き続き訓練を継続する。

これに対しステップＳＰ２５３において肯定結果が得られると、このことは、患者Ｐａは訓練を継続する意思がないことを意味するため、入出力動作処理部５８ａは、スピーカ３４から「そろそろおしまいにしましょう。Ａさん、Ｂさん、ありがとうございました。Ａさん、Ｂさんあいさつをどうぞ」と出力し、患者Ｐａ及び患者Ｐｂに互いに挨拶することを促し、ステップＳＰ２５５へ移る。

ステップＳＰ２５５において入出力動作処理部５８ａは、スピーカ３４から「また一緒に練習しましょうね」と出力し、ステップＳＰ２８９へ移り遠隔通信サブルーチンＳＲＴ８を終了する。

ロボット１０ｂの制御部５０ｂは、ステップＳＰ２８７からステップＳＰ２８８までは、ロボット１０ａの制御部５０ａにおけるステップＳＰ２５４からステップＳＰ２５５までの処理とほぼ同様の処理を行い、ステップＳＰ２９１へ移り遠隔通信サブルーチンＳＲＴ８を終了する。

このように制御部５０ａ及び５０ｂは、遠隔通信処理を実行することにより、ロボット１０ａを使用する患者Ｐａ及びロボット１０ｂを使用する患者Ｐｂに対し定型会話文を表示して、患者Ｐａ及び患者Ｐｂに交互に読み上げさせ、音声を適宜補正しつつ会話をさせる。

１−１２−２．音声補正機能
制御部５０（５０ａ及び５０ｂ）は、遠隔通信処理手順ＳＲＴ８（図２８）においてステップＳＰ２４９又はＳＰ２８４へ移ると、ＲＯＭ５４から音声補正プログラムを読み出して実行することにより、音声補正処理を実行する。

このとき制御部５０は、図３０に示すように、比較部９０及び補正部９２として機能する。

また記憶部６６は、定型会話文ライブラリＬ３（図６）に記憶されている定型会話文を発音する際の模範的な発音を単語毎に区切り、ロボット１０の声色である模範音声データとして記憶している。

比較部９０は、頭部マイク４０及び胴体部マイク３２から受信した音声信号に基づく音声データ（以下、入力音声データとも呼ぶ）を得て、当該入力音声データを１文字ずつ音声認識して、例えば形態素解析により単語毎に分割する。

さらに比較部９０は、入力音声データと模範音声データとを対応する単語毎に、すなわち例えば入力音声データの「本日は」と、模範音声データの「本日は」とを、音声分析を行うことにより比較し、一致度を算出する。

比較部９０は、一致度が所定の閾値よりも大きい場合、現在判定の対象となっている判定対象単語に対する患者Ｐの発音は適切であると判定する。一方比較部９０は、一致度が所定の閾値以下であった場合、判定対象単語に対する患者Ｐの発音は不適切と判定する。

補正部９２は、比較部９０により患者Ｐの発音が不適切であると判定された場合、入力音声データの判定対象単語を、当該判定対象単語に対応する模範音声データの単語と置換する。これにより入力音声データにおける発音が不適切な単語は、ロボットの声色の模範的な音声に補正される。

一方補正部９２は、比較部９０により患者Ｐの発音が適切であると判定された場合、判定対象単語を模範音声データと置換せず、音声認識結果に基づく判定対象単語の文字列を発音するロボットの声色に変更する。

すなわち補正部９２は、患者Ｐの音声の速度、音量、音の高さに対応した音声を、ロボットの声色として生成する。

このため図３１に示すように、入力音声データにおいて、構音障害の患者Ｐが発音しにくい単語である「が」が、「か」と不適切に発音されてしまった場合においても、当該「か」は、模範音声データの「が」に置換される。

これにより、制御部５０ｂはステップＳＰ２８２（図２８）において、また制御部５０ａはステップＳＰ２５２において、不適切な発音が補正された定型会話文を、ロボット１０の声色としてスピーカから出力する。

１−１２−３．音声補正処理手順
制御部５０は、音声補正処理サブルーチンＳＲＴ１０（図３２）を開始し、ステップＳＰ３０１へ移る。

ステップＳＰ３０１において制御部５０は、入力音声データにおける１つの会話文（例えば「本日は天気がいいですね」）が話される速度が、所定の閾値以上であるか否かを判定する。

ここで肯定結果が得られると、制御部５０はステップＳＰ３０２へ移り、補正部９２により音声データに所定の処理を施すことにより、速度を低下させ、ステップＳＰ３０３へ移る。

一般的に、構音障害の患者は会話速度が速くなる傾向にある。このため会話相手が音声を聞き取りにくくなる場合がある。

これに対し制御部５０は、適切な会話速度となるように音声を遅延させることにより患者Ｐが聞き取りやすい音声にすることができる。

一方ステップＳＰ３０２において否定結果が得られると、制御部５０はステップＳＰ３０２をスキップしてステップＳＰ３０３へ移る。

ステップＳＰ３０３において制御部５０は、入力音声データの１つ目の単語である「本日」を選択して判定対象単語として設定し、ステップＳＰ３０４へ移る。

ステップＳＰ３０４において制御部５０は、比較部９０により、判定対象単語の音量が所定の下側閾値以下であるか否かを判定する。

ここで肯定結果が得られると、制御部５０はステップＳＰ３０５へ移り、補正部９２により入力音声データに所定の処理を施すことにより、音量を増大させ、ステップＳＰ３０６へ移る。

一方ステップＳＰ３０４において否定結果が得られると、制御部５０はステップＳＰ３０６へ移り、比較部９０により、判定対象単語の音量が所定の上側閾値以上であるか否かを判定する。

ここで肯定結果が得られると、制御部５０はステップＳＰ３０７へ移り、補正部９２により入力音声データに所定の処理を施すことにより、音量を減衰させ、ステップＳＰ３０８へ移る。

一般的に、患者が難聴気味の場合、声が大きくなる傾向にあり、一方患者が病み上がりの場合、声が小さい可能性がある。

これに対し制御部５０は、所定の下側閾値以下の音量の音声であった場合、音量を大きくする一方、所定の上側閾値以上の音量の音声であった場合、音量を小さくすることにより、聞き取りやすい音声にすることができる。

一方ステップＳＰ３０６において否定結果が得られると、音量は適正な範囲内に収まっているため、制御部５０はステップＳＰ３０８へ移り、比較部９０により、判定対象単語の音の高さが所定の閾値以上であるか否かを判定する。

ここで肯定結果が得られると、制御部５０はステップＳＰ３０９へ移り、補正部９２により音声データに所定の処理を施すことにより、音の高さを下げ、ステップＳＰ３１０へ移る。

構音障害の患者は高齢者が多く、高い周波数の音声、すなわち高い声が聞き取りにくい傾向にある。

これに対し制御部５０は、適切な会話速度となるように音の高さを下げることにより、患者が聞き取りやすい音声にすることができる。

ステップＳＰ３１０において制御部５０は、比較部９０により音声分析を行い、模範音声と入力音声とを比較し、発音の一致度が所定の閾値以下であるか否かを判定する。

ここで肯定結果が得られると、制御部５０はステップＳＰ３１１へ移り、補正部９２により判定対象単語を模範音声データで置き換えることにより補正し、ステップＳＰ３１２へ移る。

一方ステップＳＰ３１０において否定結果が得られると、制御部５０はステップＳＰ３１３へ移り、音声認識結果に基づいて判定対象単語の声色を変更し、ステップＳＰ３１２へ移る。

このように制御部５０は、入力音声データを、患者本人の音声ではなく、ロボットの声色に変換し、会話相手の患者に聞かせるようにした。

これによりロボット１０は患者Ｐに対し、ロボット１０と一緒に訓練している雰囲気を高め、知らない他の患者と会話をする際に、患者が恥ずかしがって練習できないという状態を回避することができる。

ステップＳＰ３１２において制御部５０は、入力音声の全ての単語の判定が終了したか、すなわち、「ね」まで判定したか否かを判定する。

ここで否定結果が得られると、制御部５０はステップＳＰ３１４へ移り、次の単語を選択し、ステップＳＰ３０４へ移って再度判定を行う。

一方ステップＳＰ３１２において肯定結果が得られると、制御部５０は補正した入力音声の音声データを記憶部６６に記憶し、ステップＳＰ３１５へ移り音声補正サブルーチンＳＲＴ１０を終了する。

１−１２−４．遠隔通信機能の動作及び効果
以上の構成において、言語療法システム１は、ロボット１０ａ及び１０ｂを介して患者Ｐａ及びＰｂに定型会話文を読ませることで会話を行わせるようにした。

このため患者Ｐａ及びＰｂは、自分以外の患者とコミュニケーションを取るような、人と話すという状況における言語療法を行うことができる。

また、言語療法システム１は、患者Ｐａ及び患者Ｐｂを互いに直接話させることなく、ロボット１０ａ及び１０ｂを介して訓練を行わせるようにした。

これにより、患者Ｐａ及びＰｂの発音が正しくなかったり、聞き取りにくかったりする場合であっても、ロボット１０ａ及び１０ｂが音声を補正した上で会話相手に聞かせるため、訓練を成立させることができる。

以上の構成によれば、動物の形状を模した言語療法ロボットとしてのロボット１０は、患者Ｐに示す定型会話文と、当該定型会話文の模範音声とを予め記憶部６６に記憶し、定型会話文をモニタ１４により患者Ｐに示し、患者Ｐが定型会話文を読んで発声した発話音声を胴体部マイク３２と頭部マイク４０とにより取得し、模範音声と、発話音声とを、対応する所定分割単位である単語に区切って比較し、当該単語毎に一致度を比較部により算出し、一致度が所定の閾値以下である単語における発話音声を、対応する単語の模範音声に置き換え補正音声を生成するようにした。

これによりロボット１０は、患者Ｐの発音が適切でなかった場合に音声を補正した上で訓練相手の患者Ｐに聞かせることができる。

２．他の実施の形態
なお上述した実施の形態においては、モニタ１４をロボット１０の外部に設ける場合について述べたが、本発明はこれに限らず、例えばモニタをロボットに内蔵したり、プロジェクターをロボットに内蔵して周囲に画像を投影するようにしたりしても良い。

また上述した実施の形態においては、ロボット１０を、円錐台形状の胴体部２２と球体状の頭部２０とが連結された形状とする場合について述べたが、本発明はこれに限らず、例えば図３４に示すロボット１１０のように、球体状の胴体部１１２２と球体状の頭部２０とが連結された形状等、人間を模した形状であれば種々の形状としても良い。

さらに上述した実施の形態においては、ロボット１０の形状を、人間を模した形状とする場合について述べたが、本発明はこれに限らず、例えば犬や猫等の動物の形状を模していても良い。この場合、患者が感情を通わせることができると感じ、親しみを覚えやすい形状が望ましい。

さらに上述した実施の形態においては、胴体部マイク３２と頭部マイク４０との機能を分けない場合について述べたが、本発明はこれに限らず、例えば胴体部マイク３２は患者の音声を取得し、頭部マイク４０は患者以外の周囲の音声を取得する等、機能を分けても良い。

さらに上述した実施の形態においては、喜びモード又は悲しみモードの２種類のモードによりロボット１０の感情を表現するようにしたが、本発明はこれに限らず、ＬＥＤ４４の点灯パターンと頭部アクチュエータ６２及び車輪アクチュエータ６０の駆動方法との組み合わせ等により、ロボット１０の３種類以上のモードの感情を表現しても良い。

さらに上述した実施の形態においては、頭部マイク４０及び胴体部マイク３２に対する音声入力、並びに腹部タッチセンサ２６、頭部タッチセンサ４２、左背中タッチセンサ２８又は右背中タッチセンサ３０に接触することによる操作入力によりロボット１０に情報を入力する場合について述べた。

本発明はこれに限らず、ロボット１０に物理的なテンキーを設け押下したり、バーコードリーダを設けバーコードを読み取らせたり、ＩＣタグリーダを設けＩＣカードを読み取らせたりしても良い。

さらにロボット１０は、スピーカ３４から音声を出力している途中においても、頭部マイク４０及び胴体部マイク３２を介し指示命令を受け付けるようにしても良い。

さらにロボット１０は、スピーカ３４から音声を出力した後待機している際に、「もう一度言って」を音声認識した場合、再度スピーカ３４から同じ音声を出力しても良い。

さらに上述した音声分析提示処理においては、バーグラフを表示する場合について述べたが、本発明はこれに限らず、例えば円グラフ等や、数値等を表示しても良い。要は使用者が、患者の発音の正しさの度合いを一目で認識できる表示形態で表示すれば良い。

さらに上述した音声分析提示処理においては、先頭の一文字目について音声分析提示処理を行う場合について述べたが、本発明はこれに限らず、文中、文末の言葉について行なっても良い。

さらに上述した音声分析提示処理においては、最大振幅ＧＡに応じてバーグラフＢＧの長さを変化させたが、本発明はこれに限らず、入力音声と模範音声との音声分析を種々の方法により行い、一致度を算出し、一致度が高いほどバーグラフを短くするようにしても良い。

さらに上述した音声分析提示処理においては、バーグラフＢＧを赤色又は緑色に変化させたが、本発明はこれに限らず、入力音声と模範音声との一致度に応じて３色以上に変化させても良い。

さらに上述した音声分析提示処理においても、入力音声と模範音声との一致度に応じて、操作解答問題処理と同様に、ロボット１０を喜びモード又は悲しみモードで行動させて良い。

さらに上述した音声分析提示処理においては、「が」行を「な」行に患者が言い間違えた場合について述べたが、本発明はこれに限らず、それ以外の患者が発音し難い言葉としても良い。

そのような言葉としては、例えば「か」行又は「た」行が「あ」行又は「な」行に、「が」行又は「だ」行が「な」行に、「さ」行が「しゃ」行に、「ざ」行が「じゃ」行に、「だ」行が「な」行に、「ちゃ」行又は「ぢゃ」行が「や」行に、「な」行、「は」行又は「ま」行が「あ」行に、「ば」行又は「ぱ」行が「ま」行に、「ら」行が「あ」行又は「た」行にそれぞれ変化してしまうことが考えられる。

さらに上述した音声分析提示処理においては、繰り返し訓練を行う場合、前回の訓練時のバーグラフＢＧをまず表示し、今回の訓練時のバーグラフＢＧを表示する際にバーグラフＢＧの形状が前回の訓練の状態から変化する様子を表示するようにしても良い。これにより患者Ｐは、前回の訓練からの上達具合を視認することができるため、モチベーションを保つことができる。

さらに上述した再生処理においては、記憶部６６における録音音声ライブラリに記憶された音声データを再生する場合について述べたが、本発明はこれに限らず、記憶部６６における定型会話文音声ライブラリに記憶された音声データを再生しても良い。

さらに上述した実施の形態においては、音声分析提示処理においてバーグラフを表示する場合について述べたが、本発明はこれに限らず、再生処理においてバーグラフを表示しても良い。

さらに上述した操作解答問題処理においては、患者Ｐがモニタ１４をタッチすることにより解答する場合について述べたが、本発明はこれに限らず、例えば紙にペンで記入して解答しても良い。

その場合、紙に記入された解答を聴覚士Ｔが目視して正誤判定し、ロボット１０の左背中タッチセンサ２８又は右背中タッチセンサ３０をタッチすることにより正誤をロボット１０に入力すれば良い。

さらに上述した操作解答問題処理においては、発声解答問題処理のように聴覚士が正誤判定し、発声解答問題処理において操作解答問題処理のようにロボット１０が自動的に正誤判定しても良い。

さらに上述した発声解答問題処理においては、ロボット１０は、時間測定開始から５秒後、１０秒後にそれぞれ、「５秒経過」、「１０秒経過」とスピーカ３４から出力しても良い。

さらに上述したディアトコキネシス処理においては、『パ』に限らず、『タ』、『カ』、『パタカ』等を発音させても良い。

さらに上述した解答結果提示処理においては、解答結果を音声により患者Ｐ及び聴覚士Ｔに提示する場合について述べたが、本発明はこれに限らず、例えばモニタ１４に解答結果を表示するようにしても良い。

さらに上述した解答結果提示処理においては、記憶部６６における問題解答ライブラリに記憶された解答結果を再生する場合について述べたが、本発明はこれに限らず、記憶部６６における質問解答ライブラリに記憶された解答結果を再生しても良い。

さらに上述した遠隔通信処理においては、患者Ｐａが定型会話文を読み上げる際、患者Ｐａに対しバーグラフを提示しても良く、また患者Ｐｂが定型会話文を読み上げる際、患者Ｐｂに対しバーグラフを提示しても良い。

さらに上述した遠隔通信処理においては、患者ＰａとＰｂとが定型会話文を読み上げる場合について述べたが、本発明はこれに限らず、患者Ｐａが例文を読み上げ、患者Ｐｂが復唱したり、紙に書き取りをするようにしたりしても良い。

また、例えば患者Ｐａ及び患者Ｐｂの脳波を測定器により測定することにより、患者Ｐａ及び患者Ｐｂが話そうとしている発音を検出し、患者Ｐａ及び患者Ｐｂが自由に対話している最中に、患者Ｐａ及び患者Ｐｂが話そうとしている発音から、実際の発音が一定以上異なる場合、補正した発音をロボットから出力するようにしても良い。

さらに上述した遠隔通信処理においては、管理センタ１２を用いてロボット１０ａと１０ｂとが通信する場合について述べたが、本発明はこれに限らず、ロボット１０ａと１０ｂとが自律的にネットワークを構築し、いわゆるアドホック通信を行うようにしても良い。

さらに上述した音声補正処理においては、入力音声データ及び模範音声データを単語毎に分割して処理する場合について述べたが、１文字ずつ判定して置換処理を行っても良い。

さらに上述した実施の形態においては、ロボット１０が例文ライブラリＬ１、問題文ライブラリＬ２、定型会話文ライブラリＬ３及びフォルダライブラリＬ４を記憶部６６に記憶する場合について述べたが、本発明はこれに限らず、管理センタ１２が各種ライブラリを記憶し、ロボット１０は当該管理センタ１２と通信しながら当該ライブラリに対し記憶及び参照を行っても良い。

さらに上述した実施の形態においては、ロボット１０が音声検出スタンバイ処理ＲＴ１、録音再生処理ＳＲＴ１、再生処理ＳＲＴ２、操作解答問題処理ＳＲＴ３、発声解答問題処理ＳＲＴ４、発声持続時間測定処理ＳＲＴ５、ディアトコキネシス処理ＳＲＴ６、解答結果提示処理ＳＲＴ７、遠隔通信処理ＳＲＴ８、音声分析提示処理ＳＲＴ９及び音声補正処理ＳＲＴ１０を実行する場合について述べたが、本発明はこれに限らず、ロボット１０を介して、管理センタ１２が処理を実行するようにしても良い。

さらに上述した実施の形態においては、管理センタ１２にロボット１０ａ及び１０ｂが無線接続される場合について述べたが、本発明はこれに限らず、それ以上の台数のロボットが無線接続されても良い。

さらに上述した実施の形態においては、ロボット１０の制御部５０が、予めＲＯＭ５４に格納されている音声検出スタンバイプログラム、録音再生プログラム、再生プログラム、操作解答問題プログラム、発声解答問題プログラム、発声持続時間測定プログラム、ディアトコキネシスプログラム、解答結果提示プログラム、遠隔通信プログラム、音声分析提示プログラム及び音声補正プログラムを実行することにより、音声検出スタンバイ処理ＲＴ１、録音再生処理ＳＲＴ１、再生処理ＳＲＴ２、操作解答問題処理ＳＲＴ３、発声解答問題処理ＳＲＴ４、発声持続時間測定処理ＳＲＴ５、ディアトコキネシス処理ＳＲＴ６、解答結果提示処理ＳＲＴ７、遠隔通信処理ＳＲＴ８、音声分析提示処理ＳＲＴ９及び音声補正処理ＳＲＴ１０等に従った種々の処理を行うようにした場合について述べた。

本発明はこれに限らず、ロボット１０の制御部５０が、記憶媒体からインストールしたアプリケーションプログラムや、インターネットからダウンロードしたアプリケーションプログラム、その他種々の入手経路を経てインストールしたアプリケーションプログラムに従って上述した各処理を行うようにしても良い。

さらに上述した実施の形態においては、記憶部としての記憶部６６と、出力部としてのスピーカ３４又はモニタ１４と、音声入力部としての頭部マイク４０又は胴体部マイク３２と、分析部としての分析部８２と、提示体作成部としての提示体作成部８４と、提示部としてのスピーカ３４又はモニタ１４とによって、言語療法ロボットとしてのロボット１０を構成する場合について述べた。

本発明はこれに限らず、その他種々の構成でなる記憶部と、出力部と、音声入力部と、分析部と、提示体作成部と、提示部とによって、言語療法ロボットを構成するようにしても良い。

本発明は、例えばリハビリテーション分野に適用することができる。

１……言語療法システム、２……言語療法施設、１０……ロボット、１２……管理センタ、１３……サーバ、１４……モニタ、１５……タッチパネル、２０……頭部、２２……胴体部、２４……車輪、２６……腹部タッチセンサ、２８……左背中タッチセンサ、３０……右背中タッチセンサ、３２……胴体部マイク、３４……スピーカ、３６……端子、３８……ＣＣＤカメラ、４０……頭部マイク、４２……頭部タッチセンサ、４４……ＬＥＤ、５０……制御部、５１……データバス、５２……ＣＰＵ、５４……ＲＯＭ、５６……ＲＡＭ、５７……言語療法処理部、５８……入出力動作処理部、６０……車輪アクチュエータ、６２……頭部アクチュエータ、６４……通信部、６６……記憶部、７０……制御部、７２……通信部、７４……記憶部、７６……ＣＰＵ、７８……ＲＯＭ、８０……ＲＡＭ、Ｐ……患者、Ｔ……聴覚士。

Claims

患者に示す言葉と、当該言葉の模範音声とを予め記憶する記憶部と、
前記言葉を前記患者に示す出力部と、
前記患者が前記言葉に応じて発声した発話音声を入力する音声入力部と、
前記模範音声と、前記発話音声とを、対応する所定分割単位に区切って比較し、当該所定分割単位毎に一致度を算出する比較部と、
前記一致度が所定の閾値以下である分割単位における前記発話音声を、対応する分割単位の模範音声に置き換え補正音声を生成する補正部と
を有する言語療法ロボット。
前記補正部は、前記発話音声を、前記患者とは異なる声色に変更する
請求項１に記載の言語療法ロボット。
前記補正部は、前記発話音声の発話速度が所定の閾値以上であった場合、当該発話音声の速度を低下させる
請求項１に記載の言語療法ロボット。
前記補正部は、前記発話音声の音量が所定の範囲外であった場合、当該発話音声の音量を増大又は減少させ前記所定の範囲内に補正する
請求項１に記載の言語療法ロボット。
前記補正部は、前記発話音声の音の高さが所定の閾値以上であった場合、当該発話音声の音の高さを低下させる
請求項１に記載の言語療法ロボット。
第１の患者に使用される第１の言語療法ロボットと第２の患者に使用される第２の言語療法ロボットとを具える言語療法システムであって、
前記第１の言語療法ロボットは、
前記第１の患者に示す言葉と、当該言葉の模範音声とを予め記憶する記憶部と、
前記言葉を前記第１の患者に示す出力部と、
前記第１の患者が前記言葉に応じて発声した発話音声を入力する音声入力部と、
前記模範音声と、前記発話音声とを、対応する所定分割単位に区切って比較し、当該所定分割単位毎に一致度を算出する比較部と、
前記一致度が所定の閾値以下である分割単位における前記発話音声を、対応する分割単位の模範音声に置き換え第１の補正音声を生成する補正部と、
前記第１の補正音声を前記第２の言語療法ロボットに送信する送信部と
を有し、
前記第２の言語療法ロボットは、
前記第１の補正音声を前記第１の言語療法ロボットから受信する受信部と、
受信した前記第１の補正音声を再生する再生部と
を有する言語療法システム。
前記第２の言語療法ロボットは、
前記第２の患者に示す言葉と、当該言葉の模範音声とを予め記憶する記憶部と、
前記言葉を前記第２の患者に示す出力部と、
前記患者が前記言葉に応じて発声した発話音声を入力する音声入力部と、
前記模範音声と、前記発話音声とを、対応する所定分割単位に区切って比較し、当該所定分割単位毎に一致度を算出する比較部と、
前記一致度が所定の閾値以下である分割単位における前記発話音声を、対応する分割単位の模範音声に置き換え第２の補正音声を生成する補正部と、
前記第２の補正音声を前記第１の言語療法ロボットに送信する送信部と
をさらに有し、
前記第１の言語療法ロボットは、
前記第２の補正音声を前記第１の言語療法ロボットから受信する受信部と、
受信した前記第２の補正音声を再生する再生部と
をさらに有する請求項６に記載の言語療法システム。