JP2002189497A - ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム - Google Patents

ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム

Info

Publication number
JP2002189497A
JP2002189497A JP2001016871A JP2001016871A JP2002189497A JP 2002189497 A JP2002189497 A JP 2002189497A JP 2001016871 A JP2001016871 A JP 2001016871A JP 2001016871 A JP2001016871 A JP 2001016871A JP 2002189497 A JP2002189497 A JP 2002189497A
Authority
JP
Japan
Prior art keywords
voice
unit
robot
speech
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001016871A
Other languages
English (en)
Inventor
Kazuo Ishii
和夫 石井
Jun Hiroi
順 広井
Wataru Onoki
渡 小野木
Takashi Toyoda
崇 豊田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2001016871A priority Critical patent/JP2002189497A/ja
Publication of JP2002189497A publication Critical patent/JP2002189497A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Toys (AREA)
  • Manipulator (AREA)

Abstract

(57)【要約】 【課題】 音声が受け付けられていることを、ユーザに
認識させる。 【解決手段】 マイク15に入力されたユーザの音声
は、音声認識部50Aで音声認識され、行動決定機構部
52は、その音声認識結果に基づいて、ロボットの次の
行動を決定する。一方、エコーバック部56は、マイク
15から与えられ、音声認識部50Aで音声認識される
音声信号から、ユーザの音声が入力されている音声区間
(時間)を検出するとともに、検出した時間に応じた、
その音声信号を復唱するような音声を生成して出力す
る。この音声は、出力制御部57を介して、スピーカ1
8に供給されて出力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ロボット制御装置
およびロボット制御方法、記録媒体、並びにプログラム
に関し、特に、例えば、音声認識装置による音声認識結
果に基づいて行動するロボットに用いて好適なロボット
制御装置およびロボット制御方法、記録媒体、並びにプ
ログラムに関する。
【0002】
【従来の技術】近年においては、例えば、玩具等とし
て、ユーザが発した音声を音声認識し、その音声認識結
果に基づいて、ある仕草をしたり、合成音を出力する等
の行動を行うロボット(本明細書においては、ぬいぐる
み状のものを含む)が製品化されている。
【0003】
【発明が解決しようとする課題】しかしながら、ロボッ
トにおいては、音声認識結果が得られても、何の行動も
起こさない場合があり、この場合、ユーザは、ロボット
において音声が認識されているのかどうか、あるいはロ
ボットが故障しているのかどうか不安になる。
【0004】本発明は、このような状況に鑑みてなされ
たものであり、ロボットにおいて、ユーザの音声が認識
されていることを分かるようにすることで、ユーザの不
安を解消すること等ができるようにするものである。
【0005】
【課題を解決するための手段】本発明のロボット制御装
置は、音声認識されるユーザの音声の音声区間を検出す
る検出手段と、音声区間の長さに応じた音声データを生
成する生成手段と、生成手段により生成された音声デー
タの出力を制御する出力制御手段とを備えることを特徴
とする。
【0006】生成手段は、音声区間の長さが所定の長さ
より長い場合、音声の一部を利用して音声データを生成
するとともに、音声区間の長さが所定の長さ以下である
場合、音声の全部を利用して音声データを生成すること
ができる。
【0007】生成手段は、音声の一部または全部の韻律
情報を取得するとともに、韻律情報に基づいて、韻律を
制御した音声データを生成することができる。
【0008】本発明のロボット制御方法は、音声認識さ
れるユーザの音声の音声区間を検出する検出ステップ
と、音声区間の長さに応じた音声データを生成する生成
ステップと、生成ステップの処理で生成された音声デー
タの出力を制御する出力制御ステップとを含むことを特
徴とする。
【0009】本発明の記録媒体は、音声認識されるユー
ザの音声の音声区間を検出する検出ステップと、音声区
間の長さに応じた音声データを生成する生成ステップ
と、生成ステップの処理で生成された音声データの出力
を制御する出力制御ステップとを含むプログラムが記録
されていることを特徴とする。
【0010】本発明のプログラムは、音声認識されるユ
ーザの音声の音声区間を検出する検出ステップと、音声
区間の長さに応じた音声データを生成する生成ステップ
と、生成ステップの処理で生成された音声データの出力
を制御する出力制御ステップとを含むことを特徴とす
る。
【0011】本発明のロボット制御装置および方法、並
びにプログラムにおいては、音声認識されるユーザの音
声の音声区間が検出され、音声区間の長さに応じた音声
データが生成され、生成された音声データの出力が制御
される。
【0012】
【発明の実施の形態】図1は、本発明を適用したロボッ
トの一実施の形態の外観構成例を示しており、図2は、
その電気的構成例を示している。
【0013】本実施の形態では、ロボットは、例えば、
犬等の四つ足の動物の形状のものとなっており、胴体部
ユニット2の前後左右に、それぞれ脚部ユニット3A,
3B,3C,3Dが連結されるとともに、胴体部ユニッ
ト2の前端部と後端部に、それぞれ頭部ユニット4と尻
尾部ユニット5が連結されることにより構成されてい
る。
【0014】尻尾部ユニット5は、胴体部ユニット2の
上面に設けられたベース部5Bから、2自由度をもって
湾曲または揺動自在に引き出されている。
【0015】胴体部ユニット2には、ロボット全体の制
御を行うコントローラ10、ロボットの動力源となるバ
ッテリ11、並びにバッテリセンサ12および熱センサ
13からなる内部センサ部14などが収納されている。
【0016】頭部ユニット4には、「耳」に相当するマ
イク(マイクロフォン)15、「目」に相当するCCD
(Charge Coupled Device)カメラ16「触覚」に相当す
るタッチセンサ17、「口」に相当するスピーカ18な
どが、それぞれ所定位置に配設されている。また、頭部
ユニット4には、口の下顎に相当する下顎部4Aが1自
由度をもって可動に取り付けられており、この下顎部4
Aが動くことにより、ロボットの口の開閉動作が実現さ
れるようになっている。
【0017】脚部ユニット3A乃至3Dそれぞれの関節
部分や、脚部ユニット3A乃至3Dそれぞれと胴体部ユ
ニット2の連結部分、頭部ユニット4と胴体部ユニット
2の連結部分、頭部ユニット4と下顎部4Aの連結部
分、並びに尻尾部ユニット5と胴体部ユニット2の連結
部分などには、図2に示すように、それぞれアクチュエ
ータ3AA1乃至3AAK、3BA1乃至3BAK、3CA
1乃至3CAK、3DA1乃至3DAK、4A1乃至4AL
5A1および5A2が配設されている。
【0018】頭部ユニット4におけるマイク15は、ユ
ーザからの発話を含む周囲の音声(音)を集音し、得ら
れた音声信号を、コントローラ10に送出する。CCD
カメラ16は、周囲の状況を撮像し、得られた画像信号
を、コントローラ10に送出する。
【0019】タッチセンサ17は、例えば、頭部ユニッ
ト4の上部に設けられており、ユーザからの「なでる」
や「たたく」といった物理的な働きかけにより受けた圧
力を検出し、その検出結果を圧力検出信号としてコント
ローラ10に送出する。
【0020】胴体部ユニット2におけるバッテリセンサ
12は、バッテリ11の残量を検出し、その検出結果
を、バッテリ残量検出信号としてコントローラ10に送
出する。熱センサ13は、ロボット内部の熱を検出し、
その検出結果を、熱検出信号としてコントローラ10に
送出する。
【0021】コントローラ10は、CPU(Central Pro
cessing Unit)10Aやメモリ10B等を内蔵してお
り、CPU10Aにおいて、メモリ10Bに記憶された
制御プログラムが実行されることにより、各種の処理を
行う。
【0022】即ち、コントローラ10は、マイク15
や、CCDカメラ16、タッチセンサ17、バッテリセ
ンサ12、熱センサ13から与えられる音声信号、画像
信号、圧力検出信号、バッテリ残量検出信号、熱検出信
号に基づいて、周囲の状況や、ユーザからの指令、ユー
ザからの働きかけなどの有無を判断する。
【0023】さらに、コントローラ10は、この判断結
果等に基づいて、続く行動を決定し、その決定結果に基
づいて、アクチュエータ3AA1乃至3AAK、3BA1
乃至3BAK、3CA1乃至3CAK、3DA1乃至3DA
K、4A1乃至4AL、5A1、5A2のうちの必要なもの
を駆動させる。これにより、頭部ユニット4を上下左右
に振らせたり、下顎部4Aを開閉させる。さらには、尻
尾部ユニット5を動かせたり、各脚部ユニット3A乃至
3Dを駆動して、ロボットを歩行させるなどの行動を行
わせる。
【0024】また、コントローラ10は、必要に応じ
て、合成音、あるいは後述するようなエコーバック音声
を生成し、スピーカ18に供給して出力させたり、ロボ
ットの「目」の位置に設けられた図示しないLED(Li
ght Emitting Diode)を点灯、消灯または点滅させる。
【0025】以上のようにして、ロボットは、周囲の状
況等に基づいて自律的に行動をとるようになっている。
【0026】次に、図3は、図2のコントローラ10の
機能的構成例を示している。なお、図3に示す機能的構
成は、CPU10Aが、メモリ10Bに記憶された制御
プログラムを実行することで実現されるようになってい
る。
【0027】センサ入力処理部50は、マイク15や、
CCDカメラ16、タッチセンサ17等から与えられる
音声信号、画像信号、圧力検出信号等に基づいて、特定
の外部状態や、ユーザからの特定の働きかけ、ユーザか
らの指示等を認識し、その認識結果を表す状態認識情報
を、モデル記憶部51および行動決定機構部52に通知
する。
【0028】即ち、センサ入力処理部50は、音声認識
部50Aを有しており、音声認識部50Aは、マイク1
5から与えられる音声信号について音声認識を行う。そ
して、音声認識部50Aは、その音声認識結果として
の、例えば、「歩け」、「伏せ」、「ボールを追いかけ
ろ」等の指令その他を、状態認識情報として、モデル記
憶部51および行動決定機構部52に通知する。
【0029】また、センサ入力処理部50は、画像認識
部50Bを有しており、画像認識部50Bは、CCDカ
メラ16から与えられる画像信号を用いて、画像認識処
理を行う。そして、画像認識部50Bは、その処理の結
果、例えば、「赤い丸いもの」や、「地面に対して垂直
なかつ所定高さ以上の平面」等を検出したときには、
「ボールがある」や、「壁がある」等の画像認識結果
を、状態認識情報として、モデル記憶部51および行動
決定機構部52に通知する。
【0030】さらに、センサ入力処理部50は、圧力処
理部50Cを有しており、圧力処理部50Cは、タッチ
センサ17から与えられる圧力検出信号を処理する。そ
して、圧力処理部50Cは、その処理の結果、所定の閾
値以上で、かつ短時間の圧力を検出したときには、「た
たかれた(しかられた)」と認識し、所定の閾値未満
で、かつ長時間の圧力を検出したときには、「なでられ
た(ほめられた)」と認識して、その認識結果を、状態
認識情報として、モデル記憶部51および行動決定機構
部52に通知する。
【0031】モデル記憶部51は、ロボットの感情、本
能、成長の状態を表現する感情モデル、本能モデル、成
長モデルをそれぞれ記憶、管理している。
【0032】ここで、感情モデルは、例えば、「うれし
さ」、「悲しさ」、「怒り」、「楽しさ」等の感情の状
態(度合い)を、所定の範囲の値によってそれぞれ表
し、センサ入力処理部50からの状態認識情報や時間経
過等に基づいて、その値を変化させる。本能モデルは、
例えば、「食欲」、「睡眠欲」、「運動欲」等の本能に
よる欲求の状態(度合い)を、所定の範囲の値によって
それぞれ表し、センサ入力処理部50からの状態認識情
報や時間経過等に基づいて、その値を変化させる。成長
モデルは、例えば、「幼年期」、「青年期」、「熟年
期」、「老年期」等の成長の状態(度合い)を、所定の
範囲の値によってそれぞれ表し、センサ入力処理部50
からの状態認識情報や時間経過等に基づいて、その値を
変化させる。
【0033】モデル記憶部51は、上述のようにして感
情モデル、本能モデル、成長モデルの値で表される感
情、本能、成長の状態を、状態情報として、行動決定機
構部52に送出する。
【0034】なお、モデル記憶部51には、センサ入力
処理部50から状態認識情報が供給される他、行動決定
機構部52から、ロボットの現在または過去の行動、具
体的には、例えば、「長時間歩いた」などの行動の内容
を示す行動情報が供給されるようになっており、モデル
記憶部51は、同一の状態認識情報が与えられても、行
動情報が示すロボットの行動に応じて、異なる状態情報
を生成するようになっている。
【0035】即ち、例えば、ロボットが、ユーザに挨拶
をし、ユーザに頭を撫でられた場合には、ユーザに挨拶
をしたという行動情報と、頭を撫でられたという状態認
識情報とが、モデル記憶部51に与えられ、この場合、
モデル記憶部51では、「うれしさ」を表す感情モデル
の値が増加される。
【0036】一方、ロボットが、何らかの仕事を実行中
に頭を撫でられた場合には、仕事を実行中であるという
行動情報と、頭を撫でられたという状態認識情報とが、
モデル記憶部51に与えられ、この場合、モデル記憶部
51では、「うれしさ」を表す感情モデルの値は変化さ
れない。
【0037】このように、モデル記憶部51は、状態認
識情報だけでなく、現在または過去のロボットの行動を
示す行動情報も参照しながら、感情モデルの値を設定す
る。これにより、例えば、何らかのタスクを実行中に、
ユーザが、いたずらするつもりで頭を撫でたときに、
「うれしさ」を表す感情モデルの値を増加させるよう
な、不自然な感情の変化が生じることを回避することが
できる。
【0038】なお、モデル記憶部51は、本能モデルお
よび成長モデルについても、感情モデルにおける場合と
同様に、状態認識情報および行動情報の両方に基づい
て、その値を増減させるようになっている。また、モデ
ル記憶部51は、感情モデル、本能モデル、成長モデル
それぞれの値を、他のモデルの値にも基づいて増減させ
るようになっている。
【0039】行動決定機構部52は、センサ入力処理部
50からの状態認識情報や、モデル記憶部51からの状
態情報、時間経過等に基づいて、次の行動を決定し、決
定された行動の内容を、行動指令情報として、姿勢遷移
機構部53に送出する。
【0040】即ち、行動決定機構部52は、ロボットが
とり得る行動をステート(状態)(state)に対応させた
有限オートマトンを、ロボットの行動を規定する行動モ
デルとして管理しており、この行動モデルとしての有限
オートマトンにおけるステートを、センサ入力処理部5
0からの状態認識情報や、モデル記憶部51における感
情モデル、本能モデル、または成長モデルの値、時間経
過等に基づいて遷移させ、遷移後のステートに対応する
行動を、次にとるべき行動として決定する。
【0041】ここで、行動決定機構部52は、所定のト
リガ(trigger)があったことを検出すると、ステートを
遷移させる。即ち、行動決定機構部52は、例えば、現
在のステートに対応する行動を実行している時間が所定
時間に達したときや、特定の状態認識情報を受信したと
き、モデル記憶部51から供給される状態情報が示す感
情や、本能、成長の状態の値が所定の閾値以下または以
上になったとき等に、ステートを遷移させる。
【0042】なお、行動決定機構部52は、上述したよ
うに、センサ入力処理部50からの状態認識情報だけで
なく、モデル記憶部51における感情モデルや、本能モ
デル、成長モデルの値等にも基づいて、行動モデルにお
けるステートを遷移させることから、同一の状態認識情
報が入力されても、感情モデルや、本能モデル、成長モ
デルの値(状態情報)によっては、ステートの遷移先は
異なるものとなる。
【0043】その結果、行動決定機構部52は、例え
ば、状態情報が、「怒っていない」こと、および「お腹
がすいていない」ことを表している場合において、状態
認識情報が、「目の前に手のひらが差し出された」こと
を表しているときには、目の前に手のひらが差し出され
たことに応じて、「お手」という行動をとらせる行動指
令情報を生成し、これを、姿勢遷移機構部53に送出す
る。
【0044】また、行動決定機構部52は、例えば、状
態情報が、「怒っていない」こと、および「お腹がすい
ている」ことを表している場合において、状態認識情報
が、「目の前に手のひらが差し出された」ことを表して
いるときには、目の前に手のひらが差し出されたことに
応じて、「手のひらをぺろぺろなめる」ような行動を行
わせるための行動指令情報を生成し、これを、姿勢遷移
機構部53に送出する。
【0045】また、行動決定機構部52は、例えば、状
態情報が、「怒っている」ことを表している場合におい
て、状態認識情報が、「目の前に手のひらが差し出され
た」ことを表しているときには、状態情報が、「お腹が
すいている」ことを表していても、また、「お腹がすい
ていない」ことを表していても、「ぷいと横を向く」よ
うな行動を行わせるための行動指令情報を生成し、これ
を、姿勢遷移機構部53に送出する。
【0046】なお、行動決定機構部52には、モデル記
憶部51から供給される状態情報が示す感情や、本能、
成長の状態に基づいて、遷移先のステートに対応する行
動のパラメータとしての、例えば、歩行の速度や、手足
を動かす際の動きの大きさおよび速度などを決定させる
ことができ、この場合、それらのパラメータを含む行動
指令情報が、姿勢遷移機構部53に送出される。
【0047】また、行動決定機構部52では、上述した
ように、ロボットの頭部や手足等を動作させる行動指令
情報の他、ロボットに発話を行わせる行動指令情報も生
成される。ロボットに発話を行わせる行動指令情報は、
音声合成部55に供給されるようになっており、音声合
成部55に供給される行動指令情報には、音声合成部5
5に生成させる合成音に対応するテキスト等が含まれ
る。そして、音声合成部55は、行動決定部52から行
動指令情報を受信すると、その行動指令情報に含まれる
テキストに基づき、合成音を生成し、出力制御部57を
介して、スピーカ18に供給して出力させる。これによ
り、スピーカ18からは、例えば、ロボットの鳴き声、
さらには、「お腹がすいた」等のユーザへの各種の要
求、「何?」等のユーザの呼びかけに対する応答その他
の音声出力が行われる。
【0048】姿勢遷移機構部53は、行動決定機構部5
2から供給される行動指令情報に基づいて、ロボットの
姿勢を、現在の姿勢から次の姿勢に遷移させるための姿
勢遷移情報を生成し、これを制御機構部54に送出す
る。
【0049】ここで、現在の姿勢から次に遷移可能な姿
勢は、例えば、胴体や手や足の形状、重さ、各部の結合
状態のようなロボットの物理的形状と、関節が曲がる方
向や角度のようなアクチュエータ3AA1乃至5A1およ
び5A2の機構とによって決定される。
【0050】また、次の姿勢としては、現在の姿勢から
直接遷移可能な姿勢と、直接には遷移できない姿勢とが
ある。例えば、4本足のロボットは、手足を大きく投げ
出して寝転んでいる状態から、伏せた状態へ直接遷移す
ることはできるが、立った状態へ直接遷移することはで
きず、一旦、手足を胴体近くに引き寄せて伏せた姿勢に
なり、それから立ち上がるという2段階の動作が必要で
ある。また、安全に実行できない姿勢も存在する。例え
ば、4本足のロボットは、その4本足で立っている姿勢
から、両前足を挙げてバンザイをしようとすると、簡単
に転倒してしまう。
【0051】このため、姿勢遷移機構部53は、直接遷
移可能な姿勢をあらかじめ登録しておき、行動決定機構
部52から供給される行動指令情報が、直接遷移可能な
姿勢を示す場合には、その行動指令情報を、そのまま姿
勢遷移情報として、制御機構部54に送出する。一方、
行動指令情報が、直接遷移不可能な姿勢を示す場合に
は、姿勢遷移機構部53は、遷移可能な他の姿勢に一旦
遷移した後に、目的の姿勢まで遷移させるような姿勢遷
移情報を生成し、制御機構部54に送出する。これによ
りロボットが、遷移不可能な姿勢を無理に実行しようと
する事態や、転倒するような事態を回避することができ
るようになっている。
【0052】制御機構部54は、姿勢遷移機構部53か
らの姿勢遷移情報にしたがって、アクチュエータ3AA
1乃至5A1および5A2を駆動するための制御信号を生
成し、これを、アクチュエータ3AA1乃至5A1および
5A2に送出する。これにより、アクチュエータ3AA1
乃至5A1および5A2は、制御信号にしたがって駆動
し、ロボットは、自律的に行動を起こす。
【0053】エコーバック部56は、マイク15から与
えられ、音声認識部50Aで音声認識される音声信号か
ら、ユーザの音声が入力されている音声区間(時間)を
検出するとともに、検出した時間に応じた、その音声信
号を復唱するような音声(以下、適宜、エコーバック音
声という)を生成して出力する。このエコーバック音声
は、出力制御部57を介して、スピーカ18に供給され
て出力される。なお、エコーバック部56が行う処理
(エコーバック処理)の詳細は、後述する。
【0054】出力制御部57には、音声合成部55から
の合成音のディジタルデータと、エコーバック部56か
らのエコーバック音声のディジタルデータとが供給され
るようになっており、出力制御部57は、それらのディ
ジタルデータを、アナログの音声信号にD/A変換し、
スピーカ18に供給して出力させる。また、出力制御部
57は、音声合成部55からの合成音と、エコーバック
部56からのエコーバック音声の、スピーカ18への出
力が競合した場合に、その競合を調整する。即ち、エコ
ーバック部56からのエコーバック音声の出力は、行動
決定機構部52の制御にしたがって音声合成部55が行
う合成音の出力とは独立に行われるようになっており、
このため、エコーバック音声の出力と合成音の出力とは
競合する場合がある。そこで、出力制御部57は、その
競合の調停を行う。
【0055】次に、図4は、図3の音声認識部50Aの
構成例を示している。
【0056】マイク15からの音声信号は、AD(Analo
g Digital)変換部21に供給される。AD変換部21で
は、マイク15からのアナログ信号である音声信号がサ
ンプリング、量子化され、ディジタル信号である音声デ
ータにA/D変換される。この音声データは、特徴抽出
部22および音声区間検出部27に供給される。
【0057】特徴抽出部22は、そこに入力される音声
データについて、適当なフレームごとに、例えば、MF
CC(Mel Frequency Cepstrum Coefficient)分析を行
い、その分析の結果得られるMFCCを、特徴パラメー
タ(特徴ベクトル)として、マッチング部23に出力す
る。なお、特徴抽出部22では、その他、例えば、線形
予測係数、ケプストラム係数、線スペクトル対、所定の
周波数帯域ごとのパワー(フィルタバンクの出力)等
を、特徴パラメータとして抽出することが可能である。
【0058】マッチング部23は、特徴抽出部22から
の特徴パラメータを用いて、音響モデル記憶部24、辞
書記憶部25、および文法記憶部26を必要に応じて参
照しながら、マイク15に入力された音声(入力音声)
を、例えば、連続分布HMM(Hidden Markov Model)法
に基づいて音声認識する。
【0059】即ち、音響モデル記憶部24は、音声認識
する音声の言語における個々の音素や音節などの音響的
な特徴を表す音響モデルを記憶している。ここでは、連
続分布HMM法に基づいて音声認識を行うので、音響モ
デルとしては、HMM(Hidden Markov Model)が用いら
れる。辞書記憶部25は、認識対象の各単語について、
その発音に関する情報(音韻情報)が記述された単語辞
書を記憶している。文法記憶部26は、辞書記憶部25
の単語辞書に登録されている各単語が、どのように連鎖
する(つながる)かを記述した文法規則を記憶してい
る。ここで、文法規則としては、例えば、文脈自由文法
(CFG)や、統計的な単語連鎖確率(N−gram)
などに基づく規則を用いることができる。
【0060】マッチング部23は、辞書記憶部25の単
語辞書を参照することにより、音響モデル記憶部24に
記憶されている音響モデルを接続することで、単語の音
響モデル(単語モデル)を構成する。さらに、マッチン
グ部23は、幾つかの単語モデルを、文法記憶部26に
記憶された文法規則を参照することにより接続し、その
ようにして接続された単語モデルを用いて、特徴パラメ
ータに基づき、連続分布HMM法によって、マイク15
に入力された音声を認識する。即ち、マッチング部23
は、特徴抽出部22が出力する時系列の特徴パラメータ
が観測されるスコア(尤度)が最も高い単語モデルの系
列を検出し、その単語モデルの系列に対応する単語列の
音韻情報(読み)を、音声の認識結果として出力する。
【0061】より具体的には、マッチング部23は、接
続された単語モデルに対応する単語列について、各特徴
パラメータの出現確率を累積し、その累積値をスコアと
して、そのスコアを最も高くする単語列の音韻情報を、
音声認識結果として出力する。
【0062】以上のようにして出力される、マイク15
に入力された音声の認識結果は、状態認識情報として、
モデル記憶部51および行動決定機構部52に出力され
る。
【0063】なお、音声区間検出部27は、AD変換部
21からの音声データについて、特徴抽出部22がMF
CC分析を行うのと同様のフレームごとに、例えば、パ
ワーを算出している。さらに、音声区間検出部27は、
各フレームのパワーを、所定の閾値と比較し、その閾値
以上のパワーを有するフレームで構成される区間を、ユ
ーザの音声が入力されている音声区間として検出する。
そして、音声区間検出部27は、検出した音声区間を、
特徴抽出部22とマッチング部23に供給しており、特
徴抽出部22とマッチング部23は、音声区間のみを対
象に処理を行う。
【0064】次に、図5は、図3の音声合成部55の構
成例を示している。
【0065】テキスト生成部31には、行動決定機構部
52が出力する、音声合成の対象とするテキストを含む
行動指令情報が供給されるようになっており、テキスト
生成部31は、辞書記憶部34や生成用文法記憶部35
を参照しながら、その行動指令情報に含まれるテキスト
を解析する。
【0066】即ち、辞書記憶部34には、各単語の品詞
情報や、読み、アクセント等の情報が記述された単語辞
書が記憶されており、また、生成用文法記憶部35に
は、辞書記憶部34の単語辞書に記述された単語につい
て、単語連鎖に関する制約等の生成用文法規則が記憶さ
れている。そして、テキスト生成部31は、この単語辞
書および生成用文法規則に基づいて、そこに入力される
テキストの形態素解析や構文解析等の解析を行い、後段
の規則合成部32で行われる規則音声合成に必要な情報
を抽出する。ここで、規則音声合成に必要な情報として
は、例えば、ポーズの位置や、アクセントおよびイント
ネーションを制御するための情報その他の韻律情報や、
各単語の発音等の音韻情報などがある。
【0067】テキスト生成部31で得られた情報は、規
則合成部32に供給され、規則合成部32では、音素片
記憶部36を参照しながら、テキスト生成部31に入力
されたテキストに対応する合成音の音声データ(ディジ
タルデータ)が生成される。
【0068】即ち、音素片記憶部36には、例えば、C
V(Consonant, Vowel)や、VCV、CVC等の形で音素
片データが記憶されており、規則合成部32は、テキス
ト生成部31からの情報に基づいて、必要な音素片デー
タを接続し、さらに、音素片データの波形を加工するこ
とによって、ポーズ、アクセント、イントネーション等
を適切に付加し、これにより、テキスト生成部31に入
力されたテキストに対応する合成音の音声データを生成
する。
【0069】以上のようにして生成された音声データ
は、出力制御部57(図3)を介して、スピーカ18に
供給され、これにより、スピーカ18からは、テキスト
生成部31に入力されたテキストに対応する合成音が出
力される。
【0070】なお、図3の行動決定機構部52では、上
述したように、行動モデルに基づいて、次の行動が決定
されるが、合成音として出力するテキストの内容は、ロ
ボットの行動と対応付けておくことが可能である。
【0071】即ち、例えば、ロボットが、座った状態か
ら、立った状態になる行動には、テキスト「よっこいし
ょ」などを対応付けておくことが可能である。この場
合、ロボットが、座っている姿勢から、立つ姿勢に移行
するときに、その姿勢の移行に同期して、合成音「よっ
こいしょ」を出力することが可能となる。
【0072】次に、図6のフローチャートを参照して、
図3の出力制御部57の処理(出力制御処理)について
説明する。
【0073】出力制御部57は、音声合成部55からの
合成音を受信すると、エコーバック部56からエコーバ
ック音声を受信していない限り、音声合成部55からの
合成音を、スピーカ18に供給して出力させる。
【0074】そして、出力制御部57は、エコーバック
部56からエコーバック音声を受信した場合、図6のフ
ローチャートにしたがった出力制御処理を行う。
【0075】即ち、出力制御部57は、エコーバック部
56からエコーバック音声を受信した場合、まず最初
に、ステップS1において、音声合成部55から合成音
が出力されているかどうかを判定し、出力されていない
と判定された場合、ステップS2に進み、エコーバック
部56から受信したエコーバック音声を、スピーカ18
に供給して出力させ、処理を終了する。
【0076】一方、ステップS1において、音声合成部
55から合成音が出力されていると判定された場合、即
ち、音声合成部55からの合成音の出力と、エコーバッ
ク部56からのエコーバック音声の出力とが競合した場
合、ステップS3に進み、出力制御部57は、エコーバ
ック音声の出力を制限し、音声合成部55からの合成音
を、スピーカ18に供給して、出力させ、処理を終了す
る。
【0077】なお、出力制御部57はエコーバック音声
の出力中に、音声合成部55から合成音と受信した場
合、エコーバック音声の出力を中止し、音声合成部55
からの合成音の出力を優先させる。
【0078】以上のように、出力制御部57は、音声合
成部55からの合成音の出力と、エコーバック部56か
らのエコーバック音声の出力とが競合した場合、音声合
成部55からの合成音の出力を優先させる。これは、音
声合成部55からの合成音の出力が、行動決定機構部5
2からの行動指令情報に基づくものであり、ロボットの
行動であるのに対して、エコーバック音声の出力は、ユ
ーザの発話を復唱するものであることから、音声合成部
55からの合成音の方が、エコーバック音声に比較し
て、ユーザに対する重要度が高いと考えられるためであ
る。
【0079】但し、出力制御部57では、例えば、エコ
ーバック音声の出力を、音声合成部55からの合成音の
出力より優先させることも可能であるし、また、例え
ば、エコーバック音声と、音声合成部55からの合成音
のうち、先に受信した方の出力を優先させるようにする
こと等も可能である。
【0080】次に、図7は、図3のエコーバック部56
の構成例を示している。
【0081】マイク15からの音声信号は、AD変換部
41に供給される。AD変換部41では、マイク15か
らのアナログ信号である音声信号がサンプリング、量子
化され、ディジタル信号である音声データにA/D変換
される。この音声データは、韻律分析部42および音声
区間検出部46に供給される。
【0082】韻律分析部42は、そこに入力される音声
データを、適当なフレームごとに音響分析することによ
り、例えば、ピッチ周波数やパワー等といった音声デー
タの韻律情報を抽出する。この韻律情報は、音生成部4
3に供給される。
【0083】即ち、韻律分析部42は、例えば、人間の
一般的なピッチ周期よりも長い32ms等を1フレーム
として、AD変換部41からの音声データのピッチ周波
数とパワーを、フレーム単位で求める。
【0084】具体的には、韻律分析部42は、第jフレ
ームのパワーP(j)を、次式にしたがって求める。
【0085】 P(j)=Σxi 2 ・・・(1) 但し、式(1)において、xiは、第jフレームの先頭
からi番目の音声データのサンプル値を表し、Σは、第
jフレームの音声データのサンプルすべてについてのサ
メーションを表す。
【0086】また、韻律分析部42は、第jフレームの
音声データのサンプルについて、自己相関値を演算し、
その自己相関値を最大にする、0でないずれ量(時間)
τを求めて、次式により、第jフレームのピッチ周波数
f(j)を演算する。
【0087】 f(j)=1/τ ・・・(2)
【0088】音生成部43は、韻律分析部42からの韻
律情報に基づいて、韻律を制御したエコーバック音声を
生成する。
【0089】即ち、音生成部43は、例えば、韻律分析
部42からの韻律情報と同一の韻律を有する、音韻のな
い音声(以下、適宜、無音韻音声という)を、サイン(s
in)波を重畳することにより生成し、エコーバック音声
として、出力部44に供給する。
【0090】なお、韻律情報としての、例えば、ピッチ
周波数とパワーから音声データを生成する方法について
は、例えば、鈴木、石井、竹内、「非分節音による反響
的な模倣とその心理的影響」、情報処理学会論文誌、vo
l.41,No.5,pp1328-1337,May,2000や、特開2000-181896
号公報等に、その一例が記載されている。
【0091】出力部44は、音生成部43からのエコー
バック音声のデータを、メモリ45に記憶させるととも
に、出力制御部57(図3)に出力する。
【0092】音声区間検出部46は、AD変換部41か
らの音声データについて、図4の音声区間検出部27に
おける場合と同様の処理を行うことにより、音声区間を
検出し、韻律分析部42と音生成部43に供給する。こ
れにより、韻律分析部42と音生成部43では、音声区
間のみを対象に処理が行われる。
【0093】なお、図7のAD変換部41または音声区
間検出部46と、図4のAD変換部21または音声区間
検出部27とは、それぞれ兼用することが可能である。
【0094】以上のように構成されるエコーバック部5
6では、例えば、図8のフローチャートにしたがったエ
コーバック処理が行われる。
【0095】即ち、まず最初に、ステップS11におい
て、音声区間検出部46が、AD変換部41の出力に基
づいて、音声区間であるかどうかを判定し、音声区間で
ないと判定した場合、処理を終了し、再度、ステップS
11からの処理を再開する。
【0096】ステップS11で、音声区間であると判定
された場合、ステップS12に進み、音声区間検出部4
6は、音声区間の長さ、すなわち、ユーザの音声が入力
されている時間が、所定の時間としての、例えば2秒以
下であるか否かを判定し、2秒以下であると判定した場
合、ステップS13に進む。
【0097】ステップS13において、韻律分析部42
は、AD変換部41の出力、即ち、マイク15に入力さ
れたユーザの音声の全部(音声区間の全部)を音響分析
し、その結果得られた韻律情報を、音生成部43に供給
する。
【0098】一方、ステップS12で、音声区間の長さ
が、2秒以下でないと判定された場合、即ち、ユーザの
発話時間が2秒より長い場合、ステップS14に進み、
韻律分析部42は、AD変換部41の出力、すなわち、
マイク15に入力されたユーザの音声の一部(例えば、
音声区間のはじめから500msec分の音声)を音響分析
し、その結果得られた韻律情報を、音生成部43に供給
する。
【0099】ステップS13またはステップS14で、
韻律情報が音生成部43に供給された後は、ステップS
15に進み、音生成部43は、韻律分析部42から供給
された韻律情報と同一の韻律を有する無音韻音声を生成
し、エコーバック音声として、出力部44に供給する。
【0100】出力部44は、ステップS16において、
音生成部43からのエコーバック音声のデータを、メモ
リ45に記憶させた後、ステップS17に進み、そのエ
コーバック音声を、出力制御部57(図3)に出力し
て、処理を終了する。
【0101】これにより、エコーバック音声は、出力制
御部57を介して、スピーカ18に供給されて出力され
る。
【0102】従って、この場合、スピーカ18からは、
ユーザが発した音声から、その音韻を無くしたものが、
エコーバック音声として出力される。
【0103】このエコーバック音声は、音声認識部50
Aにおいて音声認識の対象とされるユーザの音声を復唱
するようなものであり、このようなエコーバック音声が
出力される結果、ユーザは、それを聴くことにより、ロ
ボットにおいて、自身の音声が受け付けられたことを認
識することができる。従って、ロボットが、ユーザから
の音声に対する応答として、何の行動も起こさない場合
(音声認識部50Aにおいて、ユーザの音声が正しく認
識されている場合と、誤って認識されている場合の両方
を含む)であっても、ユーザにおいて、ロボットが故障
しているといったような勘違いをすること等を防止する
ことができる。
【0104】また、以上のように、ユーザの音声が所定
の時間以上継続する場合(ユーザが所定の時間以上の発
話を行った場合)、その音声の全部を復唱せず、その一
部だけを復唱するようにして、あたかもユーザの発話に
対して相づちを打っているかのようにしたので、ユーザ
は、違和感を感じることなく、ロボットへの話しかけを
続けることができる。
【0105】さらに、エコーバック音声は、ユーザが発
した音声そのものではなく、その音声の音韻をなくした
ものであるため、ユーザには、ロボットが、ユーザの音
声を理解し、自身の声で復唱しているかのように聞こえ
る。従って、ロボットにおいて、ユーザの音声を、単に
録音して再生しているのではなく、理解しているかのよ
うな印象を、ユーザに与えることができる。
【0106】なお、ここでは、音生成部43において、
サイン波を重畳することによって、エコーバック音声を
生成するようにしたが、その他、例えば、エコーバック
音声は、ロボットの鳴き声となるような複雑な波形を用
意しておき、その波形をつなぎ合わせることによって生
成することが可能である。
【0107】さらに、エコーバック音声としては、例え
ば、ユーザの音声を構成する音素を認識し、その音素列
によって構成される音韻を有するようなものを生成する
ことが可能である。また、エコーバック音声は、例え
ば、ユーザの音声について、ケプストラム係数を得て、
そのケプストラム係数をタップ係数とするディジタルフ
ィルタによって生成すること等も可能である。但し、エ
コーバック音声が、ユーザの音声に似過ぎると、ロボッ
トにおいて、ユーザの音声を、単に録音して再生してい
るかのような、いわば興ざめした印象を、ユーザに与え
かねないので、エコーバック音声は、ユーザの音声に、
あまり似たものにしない方が望ましい。
【0108】また、上述の場合には、音生成部43にお
いて、ユーザの音声の韻律と同一の韻律を有するエコー
バック音声を生成するようにしたが、音生成部43に
は、ユーザの音声の韻律に加工を加えた韻律を有するエ
コーバック音声を生成させることも可能である。
【0109】即ち、例えば、上述したようにして、韻律
分析部42において、第jフレームのパワーP(j)と
ピッチ周波数f(j)が求められる場合には、音生成部
43では、そのパワーP(j)とピッチ周波数f(j)
を用い、例えば、次式にしたがって、エコーバック音声
y(t)を生成することができる。
【0110】 y(t)=log(P(j))sin(2πNf(j)t) ・・・(3) 但し、式(3)において、Nは、正の整数である。
【0111】式(3)によれば、第jフレームの音声に
対して、そのパワーP(j)を対数によって非線形に
し、かつ、ピッチ周波数f(j)をN倍にしたエコーバ
ック音声y(t)が生成される。
【0112】なお、経験的には、Nを、例えば6等とし
た場合に、鳴き声らしく、かつ聞きやすいエコーバック
音声が得られる。
【0113】また、上述の場合においては、ユーザの音
声の音声区間が2秒より大のときには、500msのエ
コーバック音声が出力され、2秒以下のときには、ユー
ザの音声の音声区間と同一の時間長のエコーバック音声
が出力されることとなるが、ユーザの音声の音声区間が
2秒以下のときには、その音声区間と同一の時間長では
なく、異なる時間長のエコーバック音声を出力すること
が可能である。
【0114】即ち、例えば、式(3)にしたがって、エ
コーバック音声を生成する場合においては、パワーP
(j)やピッチ周波数f(j)を補間または間引きする
こと等によって、ユーザの音声の音声区間よりも長いま
たは短い時間長のエコーバック音声を生成するようにす
ることが可能である。
【0115】なお、ユーザの音声の音声区間が2秒程度
以下の短い時間である場合、経験的には、エコーバック
音声は、ユーザの音声の音声区間の、例えば、3/2倍
等の、長めの時間長にする方が、ユーザに自然な感じを
与えるものとなる。
【0116】また、以上においては、エコーバック音声
が出力される場合を例として説明したが、エコーバック
音声に替えて、音声合成部55から、合成音を出力させ
るようにすることもできる。なお、この場合、行動決定
機構部52は、センサ入力処理部50の音声認識部50
Aにより検出された音声区間の長さに応じた発話をロボ
ットにさせるための行動指令情報を生成し、音声合成部
55に供給する。
【0117】以上、本発明を、エンターテイメント用の
ロボット(疑似ペットとしてのロボット)に適用した場
合について説明したが、本発明は、これに限らず、例え
ば、産業用のロボット等の各種のロボットに広く適用す
ることが可能である。また、本発明は、現実世界のロボ
ットだけでなく、例えば、液晶ディスプレイ等の表示装
置に表示される仮想的なロボットにも適用可能である。
【0118】さらに、本実施の形態においては、上述し
た一連の処理を、CPU10Aにプログラムを実行させ
ることにより行うようにしたが、一連の処理は、それ専
用のハードウェアによって行うことも可能である。
【0119】なお、プログラムは、あらかじめメモリ1
0B(図2)に記憶させておく他、フロッピー(登録商
標)ディスク、CD-ROM(Compact Disc Read Only Memor
y),MO(Magneto optical)ディスク,DVD(Digital Versa
tile Disc)、磁気ディスク、半導体メモリなどのリムー
バブル記録媒体に、一時的あるいは永続的に格納(記
録)しておくことができる。そして、このようなリムー
バブル記録媒体を、いわゆるパッケージソフトウエアと
して提供し、ロボット(メモリ10B)にインストール
するようにすることができる。
【0120】また、プログラムは、ダウンロードサイト
から、ディジタル衛星放送用の人工衛星を介して、無線
で転送したり、LAN(Local Area Network)、インターネ
ットといったネットワークを介して、有線で転送し、メ
モリ10Bにインストールすることができる。
【0121】この場合、プログラムがバージョンアップ
されたとき等に、そのバージョンアップされたプログラ
ムを、メモリ10Bに、容易にインストールすることが
できる。
【0122】ここで、本明細書において、CPU10A
に各種の処理を行わせるためのプログラムを記述する処
理ステップは、必ずしもフローチャートとして記載され
た順序に沿って時系列に処理する必要はなく、並列的あ
るいは個別に実行される処理(例えば、並列処理あるい
はオブジェクトによる処理)も含むものである。
【0123】また、プログラムは、1のCPUにより処
理されるものであっても良いし、複数のCPUによって
分散処理されるものであっても良い。
【0124】
【発明の効果】本発明のロボット制御装置およびロボッ
ト制御方法、並びにプログラムによれば、音声認識され
るユーザの音声の音声区間を検出し、音声区間の長さに
応じた音声データを生成し、生成された音声データの出
力を制御するようにしたので、ユーザは、違和感なく、
ロボットに話しかけることができる。
【図面の簡単な説明】
【図1】本発明を適用したロボットの一実施の形態の外
観構成例を示す斜視図である。
【図2】ロボットの内部構成例を示すブロック図であ
る。
【図3】コントローラ10の機能的構成例を示すブロッ
ク図である。
【図4】音声認識部50Aの構成例を示すブロック図で
ある。
【図5】音声合成部55の構成例を示すブロック図であ
る。
【図6】出力制御部57の処理を説明するフローチャー
トである。
【図7】エコーバック部56の構成例を示すブロック図
である。
【図8】エコーバック部56によるエコーバック処理を
説明するフローチャートである。
【符号の説明】
1 頭部ユニット, 4A 下顎部, 10 コントロ
ーラ, 10A CPU, 10B メモリ, 15
マイク, 16 CCDカメラ, 17 タッチセン
サ, 18 スピーカ, 21 AD変換部, 22
特徴抽出部, 23 マッチング部, 24 音響モデ
ル記憶部, 25 辞書記憶部, 26文法記憶部,
27 音声区間検出部, 31 テキスト生成部, 3
2 規則合成部, 34 辞書記憶部, 35 生成用
文法記憶部, 36 音素片記憶部, 41 AD変換
部, 42 韻律分析部, 43 音生成部, 44
出力部, 45 メモリ, 46 音声区間検出部,
50 センサ入力処理部,50A 音声認識部, 50
B 画像認識部, 50C 圧力処理部, 51モデル
記憶部, 52 行動決定機構部, 53 姿勢遷移機
構部, 54制御機構部, 55 音声合成部, 56
エコーバック部, 57 出力制御部
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 13/00 G10L 3/00 Q 13/08 H 15/00 551H 13/06 5/04 F (72)発明者 小野木 渡 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 豊田 崇 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 2C150 BA06 BA11 CA01 CA02 CA04 DA05 DA24 DA26 DA27 DA28 DF03 DF04 DF06 DF33 ED42 ED52 EF07 EF16 EF23 EF29 EF33 EF36 3F059 AA00 BB06 DD18 FB11 3F060 AA00 BA00 CA14 5D015 DD03 KK01 KK04 5D045 AA07 AB11

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 少なくとも音声認識結果に基づいて行動
    するロボットを制御するロボット制御装置において、 音声認識されるユーザの音声の音声区間を検出する検出
    手段と、 前記音声区間の長さに応じた音声データを生成する生成
    手段と、 前記生成手段により生成された前記音声データの出力を
    制御する出力制御手段とを備えることを特徴とするロボ
    ット制御装置。
  2. 【請求項2】 前記生成手段は、前記音声区間の長さが
    所定の長さより長い場合、前記音声の一部を利用して前
    記音声データを生成するとともに、前記音声区間の長さ
    が前記所定の長さ以下である場合、前記音声の全部を利
    用して前記音声データを生成することを特徴とする請求
    項1に記載のロボット制御装置。
  3. 【請求項3】 前記生成手段は、前記音声の一部または
    全部の韻律情報を取得するとともに、前記韻律情報に基
    づいて、韻律を制御した前記音声データを生成すること
    を特徴とする請求項2に記載のロボット制御装置。
  4. 【請求項4】 少なくとも音声認識結果に基づいて行動
    するロボットを制御するロボット制御装置のロボット制
    御方法において、 音声認識されるユーザの音声の音声区間を検出する検出
    ステップと、 前記音声区間の長さに応じた音声データを生成する生成
    ステップと、 前記生成ステップの処理で生成された前記音声データの
    出力を制御する出力制御ステップとを含むことを特徴と
    するロボット制御方法。
  5. 【請求項5】 少なくとも音声認識結果に基づいて行動
    するロボットを制御するロボット制御装置のプログラム
    であって、 音声認識されるユーザの音声の音声区間を検出する検出
    ステップと、 前記音声区間の長さに応じた音声データを生成する生成
    ステップと、 前記生成ステップの処理で生成された前記音声データの
    出力を制御する出力制御ステップとを含むことを特徴と
    するコンピュータが読み取り可能なプログラムが記録さ
    れている記録媒体。
  6. 【請求項6】 少なくとも音声認識結果に基づいて行動
    するロボットを制御するロボット制御装置のプログラム
    であって、 音声認識されるユーザの音声の音声区間を検出する検出
    ステップと、 前記音声区間の長さに応じた音声データを生成する生成
    ステップと、 前記生成ステップの処理で生成された前記音声データの
    出力を制御する出力制御ステップとを含むことを特徴と
    するコンピュータが読み取り可能なプログラム。
JP2001016871A 2000-10-11 2001-01-25 ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム Withdrawn JP2002189497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001016871A JP2002189497A (ja) 2000-10-11 2001-01-25 ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000310988 2000-10-11
JP2000-310988 2000-10-11
JP2001016871A JP2002189497A (ja) 2000-10-11 2001-01-25 ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム

Publications (1)

Publication Number Publication Date
JP2002189497A true JP2002189497A (ja) 2002-07-05

Family

ID=26601898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001016871A Withdrawn JP2002189497A (ja) 2000-10-11 2001-01-25 ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム

Country Status (1)

Country Link
JP (1) JP2002189497A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006088276A (ja) * 2004-09-24 2006-04-06 Advanced Telecommunication Research Institute International 動作生成システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006088276A (ja) * 2004-09-24 2006-04-06 Advanced Telecommunication Research Institute International 動作生成システム
JP4617428B2 (ja) * 2004-09-24 2011-01-26 株式会社国際電気通信基礎技術研究所 動作生成システム

Similar Documents

Publication Publication Date Title
JP4296714B2 (ja) ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム
JP2002268699A (ja) 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体
JP2001154681A (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP4687936B2 (ja) 音声出力装置および音声出力方法、並びにプログラムおよび記録媒体
JP2002304188A (ja) 単語列出力装置および単語列出力方法、並びにプログラムおよび記録媒体
JP2002116792A (ja) ロボット制御装置およびロボット制御方法、並びに記録媒体
WO2002086861A1 (fr) Processeur de langage
JP4587009B2 (ja) ロボット制御装置およびロボット制御方法、並びに記録媒体
JP2002268663A (ja) 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2002258886A (ja) 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP4656354B2 (ja) 音声処理装置および音声処理方法、並びに記録媒体
JP2001154693A (ja) ロボット制御装置およびロボット制御方法、並びに記録媒体
JP2002189497A (ja) ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム
JP2004286805A (ja) 話者識別装置および話者識別方法、並びにプログラム
JP2002304187A (ja) 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2004170756A (ja) ロボット制御装置および方法、記録媒体、並びにプログラム
JP2002311981A (ja) 自然言語処理装置および自然言語処理方法、並びにプログラムおよび記録媒体
JP2002318590A (ja) 音声合成装置および音声合成方法、並びにプログラムおよび記録媒体
JP2002120177A (ja) ロボット制御装置およびロボット制御方法、並びに記録媒体
JP4742415B2 (ja) ロボット制御装置およびロボット制御方法、並びに記録媒体
JP2001212779A (ja) 行動制御装置および行動制御方法、並びに記録媒体
JP2002318593A (ja) 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
JP2003271181A (ja) 情報処理装置および情報処理方法、並びに記録媒体およびプログラム
JP2004258290A (ja) 音声処理装置および方法、記録媒体、並びにプログラム
JP2005345529A (ja) 音声認識装置および方法、記録媒体、プログラム、並びにロボット装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080401