JP3613389B2 - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP3613389B2
JP3613389B2 JP2000077869A JP2000077869A JP3613389B2 JP 3613389 B2 JP3613389 B2 JP 3613389B2 JP 2000077869 A JP2000077869 A JP 2000077869A JP 2000077869 A JP2000077869 A JP 2000077869A JP 3613389 B2 JP3613389 B2 JP 3613389B2
Authority
JP
Japan
Prior art keywords
voice
mode
toy
parameter
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000077869A
Other languages
English (en)
Other versions
JP2001265377A (ja
Inventor
淳司 桑原
学 星野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rhythm Watch Co Ltd
Original Assignee
Rhythm Watch Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rhythm Watch Co Ltd filed Critical Rhythm Watch Co Ltd
Priority to JP2000077869A priority Critical patent/JP3613389B2/ja
Publication of JP2001265377A publication Critical patent/JP2001265377A/ja
Application granted granted Critical
Publication of JP3613389B2 publication Critical patent/JP3613389B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Toys (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、認識した音声と記憶し音声を照合して記憶し、記憶された音声を出力する音声処理装置に関する。
【0002】
【従来の技術】
本発明者らは、たとえば電子玩具またはパーソナルコンピュータ上のキャラクタに応用でき、入力した音声を音声で返しながら登録する音声処理装置(音声認識および音声発生装置)を既に出願した(特願平09−262557号)。
この音声処理装置は、出力させる音声や記憶させる音声の選択、言葉の学習の容易性の制御を乱数に応じてランダムに変化させているので、機械的な操作を繰り返す単調さを免れ、より生き物らしい振る舞いをさせている。
【0003】
【発明が解決しようとする課題】
しかし、この従来の音声処理装置では、こうしてランダムに装置の動作や応答が変化する傾向になんらの意味付けがないため、依然として単調な偶然性を扱っているに過ぎず、本来の生き物の振る舞いが備えている気分などの傾向を表現できなかった。
【0004】
本発明は、このような事情に鑑みてなされたものであり、より生き物を相手している感覚が得られやすい音声処理装置を提供することにある。
【0005】
【課題を解決するための手段】
上述した従来技術の問題点を解決し、上記目的を達成するために、本発明に係る音声処理装置は、音声入力手段と、記憶手段と、制御手段と、音声出力手段を備える音声処理装置であって、前記記憶手段は、気分パラメータの値の範囲内に対応付けられた音声データを記憶し、前記制御手段は、前記音声入力手段からの音声信号を検出するたびに前記気分パラメータの値を増加させるとともに、音声出力指令の発生に従い、その時点の前記気分パラメータの値に応じた音声データの中から読み出して前記音声出力手段に出力させる。
【0006】
本発明では、前記制御手段は、前記音声入力手段が音声信号を検出しない場合は、所定時間毎に前記気分パラメータの値を減少させる。
【0007】
本発明では、前記音声出力指令は、スイッチの操作によって発生する。
【0008】
本発明では、前記音声データは、前記スイッチの操作時間にも対応付けられ、前記制御手段は、前記スイッチの操作時間にも応じた音声データの中から読み出す。
【0009】
本発明では、前記スイッチは、操作圧力を検出可能とし、前記音声データは、前記スイッチの操作圧力にも対応付けられ、前記制御手段は、前記スイッチの操作圧力にも応じた音声データの中から読み出す。
【0010】
【発明の実施の形態】
以下、本発明の音声処理装置の実施形態を、本発明を電子ペット玩具に適用した場合を例に説明する。
【0011】
図1は、本発明の音声処理装置の実施形態に係る玩具の外観を示す図である。図1においてM1〜M8は擬似生物をかたどった玩具の体の各部を示しており、M1は頭部ボタンを、M2およびM3は耳を、M4は右手を、M5は左手を、M6は右足を、M7は左足を、M8は本体をそれぞれ示している。
【0012】
頭部ボタンM1は本発明における起動および就寝を制御するボタンであり、内部に後述する頭部スイッチを内蔵させている。使用者が頭部ボタンM1を押し下げることによって、後述する頭部スイッチをONにさせることができる。
耳M2およびM3は、内部に後述するマイク(音入力手段)を内蔵させており、玩具に認識される音声はここにから玩具に取り込まれる。
右手M4は、内部に後述する磁石を内蔵させており、左手M5は、内部に後述するリードスイッチを内蔵させている。左手に磁石が接近してリードスイッチが導通すると、後述するコミュニケーションスイッチがONにされる。また右手M4および左手M5は矢印aおよび矢印bの方向へ上下に動かすことができ、右手M4および左手M5の上げ下ろし動作に応じて後述するアラームスイッチがONにされる。
右足M6および左足M7は本体M8の側面に配設されて玩具が水平面上に直立できるように本体M8を支持している。
本体M8は玩具を動作させるための電池や、後述する時計動作機構、スピーカ、制御回路等を含む基板を内蔵している。
【0013】
図2は、本発明の音声処理装置の実施形態に係る玩具の構成を示す図である。図2において、1は制御回路(登録手段)を、2はROMを(通知音記憶手段)、3はFLASH ROM(記憶手段および一時記憶手段)を、4はマイク(音入力手段)を、5は音程変換回路を、6は音声増幅回路を、7はスピーカ(音声出力手段)を、8は頭部スイッチを、9はコミュニケーションスイッチを、10はアラームスイッチを、11はリセットスイッチを、12は時計動作機構をそれぞれ示している。
【0014】
制御回路1は、マイク4から出力されたアナログの音声信号をデジタルの音声データに変換してFLASH ROM3に記録させるとともに、ROM2およびFLASH ROM3に記録された音声データをアナログの音声信号S3に変換して音程変換回路5に出力する。また、制御信号S4によって音程変換回路の出力する音声信号の音程を制御する。また、時計動作機構12による制御信号S1によって後述するアラームモードの警報動作が開始され、パルス信号S2によって時間の計測が行われる。さらに、頭部スイッチ8、コミュニケーションスイッチ9、アラームスイッチ10、リセットスイッチ11による各制御信号に応じて音声の記録や音声の出力を行う。制御回路1の動作は、ROM2から読み出されるプログラムに基づいて実行される。
【0015】
ROM2は、玩具に発声させる各音声データおよび制御回路1のプログラムがデータとして記録されており、制御回路1によって指定されたアドレスのデータを制御回路1に出力する。
FLASH ROM3は、制御回路1から出力された音声データを含む各種のデータを制御回路の指定する所定のアドレスに記録するとともに、制御回路1の指定する所定のアドレスのデータを制御回路1に出力する。
マイク4は音声信号を制御回路1に出力する。
音程変換回路5は、制御回路1の出力する音声信号S3の音程を制御信号S4に基づいて変換した信号を音声増幅回路6に出力する。
音声増幅回路6は、音程変換回路5の出力する信号を増幅して、スピーカ7に出力する。
スピーカ7は、音声増幅回路6の出力する音声信号を音声に変換して出力する。
頭部スイッチ8、コミュニケーションスイッチ9、アラームスイッチ10は、いずれも後述する玩具の動作モードを制御する信号を制御回路1に出力する。
リセットスイッチ11は、玩具に記憶させた音声や玩具の動作を制御する各パラメータの値をすべてリセットし、玩具の動作モードを初期状態に設定する。
時計動作機構は、アラーム動作の開始と停止を制御する信号S1を制御回路1に出力するとともに、一定の周期のパルス信号S2を時間計測用のパルス信号として制御回路1に出力している。
【0016】
次に、上述した構成を有する玩具の動作を説明する。
【0017】
図3は、本発明の実施形態に係る玩具の初回起動時の動作に係る動作モードを示す図である。
図3において、M0は初起動モードをMは通常モードをそれぞれ示している。また、I0〜I2は各モードにおけるモードの遷移をそれぞれ示している。
【0018】
初起動モードM0は、初めて電池が挿入された状態もしくはリセットスイッチ11がONされた状態における動作モードである。この初起動モードでは、玩具自身の名前(以下、ペット名という)および玩具の使用者の名前(以下、飼い主名という)を、玩具に登録させる動作が実行される。
通常モードMは、後述する玩具の通常の動作が行なわれるモードである。
【0019】
玩具に初めて電池が挿入されたとき、玩具の動作状態は初起動モードM0になる。本モードの初期では、後述するパラメータは全て初期状態になっており、また、後述する登録ワードも全て消去されている。本モードにおいて上述したペット名および飼い主名を玩具に登録させる処理が行なわれ、この登録が完了したとき、動作モードは遷移I2により通常モードMに移行される。
モードが通常モードに移行すると、後述する通常モードMの動作が実行される。通常モードMにおいてリセットスイッチ11の状態は常に監視されており、このリセットスイッチ11がONされると、動作モードは遷移I1によって直ちに初起動モードM0に移行される。このとき、後述する各パラメータや登録ワードは全て失われる。
なお、遷移I0は電池の交換等による内部回路への電源供給の一時的な停止によるモードの遷移を表している。通常モードMにおいて電池の交換等により電源供給が停止されても、再び電源の供給が開始された場合、動作モードは通常モードMのままで変わらない。すなわち、後述するパラメータや登録ワードはFLASH ROM3に保持される。初起動モードM0においても、遷移I0によるモードの移行は発生しない。
【0020】
図4は、通常モードMにおける動作モードの詳細を示した図である。
図4において、M11は起床モードを、M12は就寝モードを、M13はアラームモードを、M14はコミュニケーションモードをそれぞれ示している。
【0021】
起床モードM11は、会話や言葉の学習を行なう音声認識処理や、記憶した言葉をランダムに発言するランダム発言処理、マイク4に入力された音を自動的に記憶する自動音声登録処理などの後述する処理を行なうモードである。
【0022】
就寝モードM12は、起床モードM11における会話など動作処理を全て停止させたモードである。
【0023】
アラームモードM13は、使用者があらかじめ設定した所定の時刻になったときに、登録されている言葉等をアラームとして発声することにより、使用者に設定時刻がきたことを知らせる音声アラームの動作を行なうモードである。使用者は、玩具がアラームの音声を発した後、玩具の記憶している言葉を玩具のマイク4に向かって話し掛けて言葉を認識させることにより、玩具に触れることなく時報のアラームを一時的停止させることができる。
【0024】
コミュニケーションモードM14は、本玩具同士を近接させた状態で本玩具が記憶している言葉を互いに発声させるとともに、発声されている音を記憶させるモードである。このような動作によって、玩具同士があたかも自律的にコミュニケーションを図っているような印象を使用者に与える。
図5は、コミニュケーションモードM14における玩具の配置を示す俯瞰図である。
玩具の左手M5および右手M4の先端には、それぞれリードスイッチ91および磁石92が内蔵されている。一方の玩具のリードスイッチ91に他方の玩具の磁石92が近接してリードスイッチ91が導通しコミニュケーションスイッチ9がONされると、動作モードがコミュニケーションモードM14に移行する。
【0025】
次に、上述した通常モードMにおける各モード間の遷移について説明する。
【0026】
初起動モードM0における上述した動作が完了すると、動作モードは遷移I2で起床モードM11に移行する。起床モードM0への移行とともに計時が開始し、動作モードが起床モードにある経過時間が計時され、経過時間が例えば10分を超えると、遷移I3で動作モードは就寝モードM12に移行する。
【0027】
就寝モードM12において、玩具の頭部ボタンM1が押されて頭部ボタンM1に内蔵されている頭部スイッチ8がONされると、動作モードは遷移I4で起床モードM11に移行する。
起床モードM11において、頭部スイッチ8がONされた場合、玩具が何らかの発声を行っていない状態であれば、動作モードは変化しない。この場合、上述した起床モードM11の経過時間がリセットされて、起床モードM11から就寝モードM12に移行するまでの時間が10分間延長される。一方、起床モードM11において、玩具が何らかの発声を行っている状態で頭部スイッチ8がONされた場合には、動作モードは強制的に就寝モードM12へ移行される。
【0028】
左手M5が図1の矢印aの方向に回転されてアラームスイッチ10がONされると、起床モードM11、就寝モードM12およびコミュニケーションモードM14から遷移I5でアラームモードM13に移行する。アラームモードM13は、通常モードMにおける他の3つのモードの中で最も優先されるモードである。右手M4または左手M5が矢印aと反対の方向に回転されてアラームスイッチ10がOFFされると、遷移I6で動作モードは就寝モードM12に移行する。
【0029】
リードスイッチ91が導通しコミニュケーションスイッチ9がONされると、起床モードM11および就寝モードM12は遷移I7でコミュニケーションモードM14に移行する。アラームスイッチ10とコミュニケーションスイッチ9が同時にONされている場合は、アラームスイッチ10によるアラームモードM13が優先されるため、コミュニケーションモードM14には移行しない。
【0030】
以上説明した初起動モードM0および通常モードMに係る動作モードとは独立に、後述する信頼パラメータに係る3つの動作モードがある。
図6は、信頼パラメータに係る動作モードを示す図である。
図6において、M21は健康モードを、M22は病気モードを、M23は仮死モードをそれぞれ示している。
【0031】
初回の電池挿入後およびリセットスイッチ11がONされた後、信頼パラメータに係るモードは健康モードM21になっている。後に述べる条件によって信頼パラメータの値が変動し健康モードM21と病気モードM22の境界を定めるしきい値を超えると、遷移I9で健康モードM21から病気モードM22に移行する。病気モードM22においては、健康モードM21で処理されていた一部の動作が行なわれなくなったり、玩具が病気になっているような声を発するなどして、使用者にあたかも玩具が病気になっているような印象を起こさせる。玩具に言葉を認識させる等の行為を続けることによって、玩具の使用者が信頼パラメータを所定のしきい値内に回復させれば、遷移I11で病気モードM22から健康モードM21に移行させることができる。逆に、信頼パラメータが変動して病気モードM22と仮死モードM23の境界を定めるしきい値を超えると、遷移I10で病気モードM22から仮死モードM23に移行する。仮死モードM23においては健康モードM22でなされていたほとんどの処理が行なわれなくなり、記憶されていた言葉も全て消去されるほか、後述するパラメータが更新されなくなる。リセットスイッチ11をONさせると、信頼パラメータに係るモードは病気モードM22および仮死モードM23から遷移I1で健康モードM21に移行する。
【0032】
次に、上述した各動作モードにおける具体的な動作を説明する。
【0033】
図7および図8は、初起動モードM0における処理を説明するフローチャート図である。
図7および図8において、Pa1〜Pa54、PbおよびPcはステップを示している。また、図7の丸1と図8の丸1はステップの接続関係を示している。
【0034】
初起動モードM0における処理では、まずマイク4から入力された音声データがペット名として登録される。その場合、誤った音声が登録されてしまわないように、使用者に2回おなじ音声を入力させることによって登録させたい音声を確認させ、2回の音声データの特徴が一致した場合にこれをペット名として登録させている。ペット名の登録に続けて、飼い主名の登録も行なわれる。この登録手順も、ペット名の登録と同様であり、使用者に2回おなじ音声を入力させて、2回の音声データの特徴が一致した場合にこれを飼い主名として登録させている。
【0035】
ステップPa1において、初起動モードM0の処理が開始される。
ステップPa2において、初期起動モードの最初に玩具が音声を発する処理が実行される。このステップにおいてはまだ音声データが記録されていないので、ROM2にあらかじめ記録されている音声データから音声が生成される。具体的には、ROM2に記録されている音声、例えば「ヒヒャハハ」といった音声のデジタル化されたデータが制御回路1の要求に応じてROM2の所定のアドレスから制御回路1に出力される。制御回路1に出力された音声データはD/A変換を施されてアナログの音声信号に変換され、信号S3として音程変換回路5に出力される。音程変換回路5に出力された音声信号は、制御回路1の出力する信号S4に応じて音程を変換され、音声増幅回路6により増幅されてスピーカ7で音波に変換される。
ステップPa2において玩具から所定の音声が発せられることにより、使用者は玩具が動作状態にあることを認識できる。
【0036】
ステップPa3において、次に説明する待ち時間パラメータがリセットされ、ステップPa4において、時計動作機構12から所定の時間間隔、例えば2秒ごとに入力されるパルス信号S2に応じて、待ち時間パラメータをインクリメントする割り込み処理が開始される。待ち時間パラメータの値はステップPa3においてリセットされているため、この値を参照することにより、ステップPa4からの経過時間を計ることができる。
【0037】
ステップPa5においては、後述するステップPa10において使用される整数kの値がリセットされて0になる。
【0038】
ステップPa6において、マイク4から入力される音声の有無が制御回路1によって判断される。具体的には、マイク4から入力された音声信号のレベルが所定のしきい値より小さいとき音声信号が入力されていないと判断され、所定のしきい値より大きいとき音声信号が入力されていると判断される。
制御回路1において音声信号が入力されていないと判断された場合、ステップPa7に処理が移行される。ステップPa7では、上述した待ち時間パラメータの値によって示されるステップPa4からの経過時間と所定の時間、例えば10秒間とが比較されて、経過時間が10秒間より短い場合、ステップPa6に再び処理が戻されて、マイク4から入力される音声の有無が検出される。10秒以内にステップPa6において音声が検出された場合は、前記した待ち時間パラメータをインクリメントする割り込み処理が停止されてステップPa6からステップPa8に処理が移行される。また、10秒以内にステップPa6において音声が検出されなかった場合は、同様に待ち時間パラメータをインクリメントする割り込み処理が停止された後、ステップPa7から後述するステップPa25に処理が移行される。
【0039】
ステップPa8では、ステップPa6で検出されたアナログの音声信号が、制御回路1でA/D変換を施されてデジタル化された音声データに変換される。この際、例えば、音声の大きさが制御回路1において定められている上限のしきい値より大きい場合や、下限のしきい値より小さい場合、さらには音声の長さが定められた上限のしきい値より長い場合には、ステップPa9に処理が移行されて、入力された音声のレベルが不適当であることを知らせる音声が発せられる。具体的には、例えば「ブ〜」という音のデータがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。
【0040】
次いで、ステップPa10において上述した整数kの値が1だけインクリメントされ、ステップPa11でこの整数kと整数1の大小関係が判断される。整数kが所定の整数、例えば1と等しいか、または1より小さい場合は、ステップPa6に戻って再び音声の入力を待つ処理が実行され、整数kが1より大きい場合は、後述するステップPa25に処理が移行される。このように、ステップPa8で変換された音声のレベルが不適当であった場合に、所定の回数だけ音声を再入力させる機会を設けているので、使用者が誤った音声を入力したときに同一の手順を繰り返す不便を軽減させている。
【0041】
ステップPa12では、ステップPa8で取得された音声データを変数Vdに代入させている。この音声データは後の処理で参照される。
【0042】
ステップPa13では、音声データが認識されたことを使用者に通知する音声、例えば「ウン?」という音声データがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。このように、入力された音声が玩具に認識された結果に応じて異なる音声(上記の例では「ブ〜」および「ウン?」)が出力されるため、使用者は玩具と対話するような感覚で玩具に音声を登録させることができる。
【0043】
ステップPa14において、上述した待ち時間パラメータが再びリセットされ、ステップPa15において、時計動作機構12から所定の時間間隔ごとに入力されるパルス信号S2に応じて、待ち時間パラメータをインクリメントする割り込み処理が開始される。ステップPa16においては、ステップPa21において使用する整数kの値がリセットされて0になる。
【0044】
ステップPa17において、マイク4から入力される音声の有無が再び制御回路1によって判断され、音声信号が入力されていないと判断された場合、ステップPa18に処理が移行される。ステップPa18では、上述した待ち時間パラメータの値によって示されるステップPa15からの経過時間と所定の時間、例えば10秒間とが比較されて、経過時間が10秒間より短い場合、ステップPa17に再び処理が戻されて、マイク4から入力される音声の有無が検出される。10秒以内にステップPa17において音声が検出された場合は、前記した待ち時間パラメータをインクリメントする割り込み処理が停止されてステップPa17からステップPa19に処理が移行される。また、10秒以内にステップPa17において音声が検出されなかった場合は、同様に待ち時間パラメータをインクリメントする割り込み処理が停止された後、ステップPa18から後述するステップPa25に処理が移行される。
【0045】
ステップPa19では、ステップPa17で検出されたアナログの音声信号が、制御回路1でA/D変換を施されてデジタル化された音声データに変換される。上述したステップPa8と同様の条件で入力された音声が不適当と判断された場合は、ステップPa20に処理が移行されて、入力された音声のレベルが不適当であることを知らせる音声、例えば「ブ〜」という音声データがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。次いで、ステップPa21において上述した整数kの値が1だけインクリメントされ、ステップPa22でこの整数kと所定の整数の大小関係が判断される。整数kが所定の整数、例えば1と等しいか、または1より小さい場合は、ステップPa17に戻って再び音声の入力を待つ処理が実行され、整数kが1より大きい場合は、後述するステップPa25に処理が移行される。ステップPa9〜Pa11と同様にして、音声のレベルが不適当であった場合に所定の回数だけ音声を再入力させる機会を設けているので、使用者の不便が軽減させる。
【0046】
ステップPa23では、ステップPa12で変数Vdに代入され音声データと、ステップPa19で取得された音声データの特徴が制御回路1において比較される。音声データの特徴は、例えば音声データをフーリエ変換して得られた周波数スペクトルの振幅などを用いて抽出され、所定の比較手順で比較される。変数Vdの音声データとステップPa19で取得された音声データの特徴が一致していると判断された場合は、ステップPa24に処理が移行され、ステップPa19で取得された音声データがペット名としてFLASH ROM3の所定のアドレスに書き込まれる。逆に互いの音声データの特徴が一致しないと判断された場合は、上述したステップPa20に処理が移行され、ステップPa17で再び音声を入力させる機会が使用者に与えられる。
【0047】
ステップPa24でペット名が登録されるとステップPa28に処理が移行されて、使用者にペット名が登録されたことを通知する音声、例えばペット名として登録された音声が発せられる。これにより、使用者がペット名の登録に成功したことを知ることができる他、登録させた音声を確認することができる。
【0048】
この場合、FLASH ROM3に書き込んだ音声データは使用者自身の発した音声のデータであるが、音程変換回路5の出力する音声信号は制御回路1による信号S4によって音程を制御させることができるので、例えばインコのような愛らしい音声に変換させてスピーカ7より音声を出力させることができる。これにより、使用者自身の音声を聞かされる味気なさを免れることができ、あたかも玩具が自らの音声を発しているような印象を使用者に与えることができるため、玩具を擬似生物として扱う趣向性が高まる。
【0049】
ステップPa25〜Pa27は、音声の入力待ち時間が10秒を超えてしまった場合や、音が大きすぎる等により音声データが不適当だった場合に他の処理へランダムに移行させるためのステップである。ランダムに移行させる手順は、上述したステップPa2〜Pa24によるペット名の登録手順および後述するランダム発言処理Pb、自動音声登録処理Pcの3つである。
【0050】
ステップPa25では、0から2の整数がランダムに生成されて、変数mに代入される。ステップPa26では、変数mに代入された数値と整数0との一致を判断し、一致している場合、ステップPa2に処理を戻して、再びペット名を登録させる処理が初めから実行される。また、変数mと整数0が一致していない場合はステップPa27に処理を移行させて、変数mと整数1との一致が判断され、一致している場合には後述するランダム発言処理Pbに処理を移行させ、一致していない場合は後述する自動音声登録処理Pcに処理を移行させる。
このように、初起動モードにおいてペット名が登録されないまま放置されている状態であっても、後述するランダム発言処理Pbや自動音声登録処理Pcなどの処理がランダムに実行されるので、上述したような処理によれば、ペット名が登録されないときにいつまでも登録を催促し続けるような処理に比べて使用者が玩具に抱く機械的な印象を低減させることができる。
【0051】
ここで、ランダム発言処理Pbおよび自動音声登録処理Pcについて説明する。
【0052】
ランダム発言処理Pbにおいては、玩具のROM2に記録されているあらかじめ用意された音声データや、FLASH ROM3に記録されている使用者によって登録された音声データが制御回路1によってランダムに読み出されて、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。動作モードが初起動モードにある場合は、まだ使用者の登録操作によってFLASH ROM3に音声データが登録されていないので、後述する自動音声登録処理Pcによって自動的に登録された音声データや、ROM2に記録されているあらかじめ用意された音声データが専ら出力される。ランダム発言処理Pbによってランダムに選択される音声データは、後述する気分パラメータや信頼パラメータによって種類が変化する。
【0053】
図17は、ランダム発言処理Pbにおける処理を説明するフローチャート図である。図17において、Pb1〜Pb22は処理の各ステップを示している。
ランダム発言処理PbはステップPb1で処理を開始し、ステップPb2で1〜10の範囲でランダムに生成された整数を変数mに代入し、ステップPb3〜Pb11において変数mと整数1〜9の一致が判断され、一致した整数に応じてステップPb12〜Pb21に処理を移行させる。そして各ステップで定められた処理に応じて(発言処理1〜10)、記憶されている音声をスピーカ7から出力させる。
各発言処理においては、例えばROM2にあらかじめ記憶させてある種々の合成音や、使用者が後に述べる操作によってFLASH ROM3に記憶させた種々の登録ワードをランダムに選択させ、ランダムな回数で発言させることができる。また、後に述べる各音声の対語をランダムに発声させることができる。さらに、次に述べる自動音声登録モードで登録させた音声をランダムに選択して発言させることもできる。あるいは、初期起動モードで玩具に記憶させた飼い主名とペット名を一番最初に発言させ、その後他の音声を続けて発声させることができる、玩具が飼い主名とペット名を主語にして何か言葉をしゃべっているような発声をさせることもできる。このように、玩具がROM2やFLASH ROM3に記憶させている音声に対し、さまざまな発声の処理手順を設け、それらをランダムに選択して音声を出力させているので、使用者に意外性をもたらし、玩具を飽きのこないものにできる。
【0054】
自動音声登録処理Pcにおいては、マイク4に入力された所定の長さ以内の音声が制御回路1において自動的に音声データに変換されて、FLASH ROM3へ記録される。登録される音声データの数は所定の最大数、例えば3つ以下に定められており、これを超えて登録される場合は、自動音声登録処理Pcにおいて音声データが記録される何れかの記録エリアに上書きして記録される。
自動音声登録処理Pcにおいて登録された音声データは、上記のランダム発言処理Pbのほか、後述する会話処理などで発声されるため、玩具が発声する音声の内容の意外性が増し、これにより玩具の機械的な印象が低減して、擬似生物としての趣向性を高めることができる。
【0055】
ペット名登録処理の過程で上述したランダム発言処理Pbや自動音声登録処理Pcに移行するほか、他の異なる処理をいくつも設けてランダムに移行させることができる。これにより、単一な処理を使用者に強いることによって玩具を飽きさせるデメリットを低減させることができる。
【0056】
次に、初起動モードM0においてペット名登録が完了した後の処理について説明する。
【0057】
ペット名を登録した後は、同様のステップによって今度は飼い主名を登録させる。具体的には、ステップPa29〜Pa49とステップPa3〜Pa23ではそれぞれ同じ処理が行われる。
【0058】
ステップPa52では、0から2の整数がランダムに生成されて、変数mに代入される。ステップPa53では、変数mに代入された数値と整数0との一致を判断し、一致している場合、ステップPa28に処理を戻して、ペット名を発声させた後再び飼い主名を登録させる処理が初めから実行される。また、変数mと整数0が一致していない場合はステップPa54に処理を移行させて、変数mと整数1との一致が判断され、一致している場合には上述したランダム発言処理Pbに処理を移行させ、一致していない場合は上述した自動音声登録処理Pcに処理を移行させる。ペット名の登録におけるステップPa25〜Pa27と同様の手順を経て、ランダム発言処理Pbや自動音声登録処理Pcなどの処理がランダムに実行されるので、使用者が玩具に抱く機械的な印象を低減させることができる。
【0059】
ステップPa49において、ステップPa45で取得された音声データと変数Vdの音声データの特徴が一致していると判断されると、ステップPa50においてステップPa45で取得された音声データが飼い主名としてFLASH ROM3の所定のアドレスに書き込まれる。その後、飼い主名が登録されたことを示す音声、例えば登録された飼い主名が出力される。ペット名の登録における処理と同様に、FLASH ROM3に飼い主名として登録された音声データを音声に変換させる場合にも、音程変換回路5により音程を変化されるので、あたかも玩具が自らの音声を発しているような印象を使用者に与えることができる。
【0060】
ペット名および飼い主名の登録が完了することによって初起動モードM0の動作は完了し、動作モードは遷移I2で起床モードM11に移行される。
【0061】
次に、起床モードM11の動作を説明する。
図9は、起床モードM11における処理を説明するフローチャート図である。図4と図9の同一符号は同一内容を示す。その他、Pd1〜Pd17はステップを示している。
【0062】
起床モードM11では、上述したランダム発言処理Pbや自動音声登録処理Pcのほか、後述する音声認識処理Peが生成された乱数によってランダムに選択されて実行される。このとき、信頼パラメータによるモードが上述した病気モードM21にある場合はランダム発言処理Pbや自動音声登録処理Pcが実行されず、時折病気を暗示するような音声が発せられる。仮死モードM23にある場合は、ランダム発言処理Pb、自動音声登録処理Pcおよび後述する音声認識処理Peが全て実行されなくなり、仮死モードを通知する音声が発せられる。また、頭部スイッチ8、コミュニケーションスイッチ9、アラームスイッチ10の状態が監視され、スイッチの状態に応じて各動作モードに処理を移行させる。さらに、起床モードM11に処理が移行してからの時間が計測され、所定の時間を経過した場合は就寝モードM12に処理を移行させる。
【0063】
起床モードM11のステップPd1において処理が開始されると、ステップPd2において、次に述べる起床時間パラメータがリセットされてゼロになる。ステップPd3において、時計動作機構12から所定の時間間隔、例えば2秒ごとに入力されるパルス信号S2に応じて、起床時間パラメータをインクリメントする割り込み処理が開始される。起床時間パラメータの値はステップPd2においてリセットされているため、この値を参照することにより、ステップPd3からの経過時間を計ることができる。
【0064】
ステップPd4において、信頼パラメータに係るモードが仮死モードM23になっているかどうか確認される。仮死モードM23になっている場合は、ステップPd5において仮死モードにあることを使用者に通知する音声を発する。具体的には、ROM2の所定のアドレスに記録されている仮死状態を表現する音声データが読み出されてD/A変換され、音程変換回路5で音程を変換されて音声増幅回路6を経てスピーカ7から音声として出力される。その後、後述するステップPd11に処理が移行される。
【0065】
ステップPd4において仮死モードM23でないことが確認された場合、次にステップPd6において病気モードM22になってるかどうか確認される。病気モードM22になっている場合は、ステップPd7において病気モードM22にあることを使用者に通知する音声を発する。具体的には、ROM2の所定のアドレスに記録されている病気状態を表現する音声データが読み出されてD/A変換され、音程変換回路5で音程を変換されて音声増幅回路6を経てスピーカ7から音声として出力される。その後、後述する音声認識処理Peに処理が移行される。
【0066】
ステップPd4およびステップPd6において信頼パラメータに係るモードが仮死モードM23および病気モードM22でない、すなわち健康モードM21になっていることが確認された後、ステップPd8〜Pd10において音声認識処理Pe、ランダム発言処理Pbおよび自動音声登録処理Pcがランダムに選択されて実行される。具体的には、ステップPd8において0〜2の整数がランダムに生成されて、変数mに代入される。次いでステップPd9において整数0と変数mの一致が判断され、一致した場合は後述する音声認識処理Peに処理が移行され、一致しない場合はステップPd10に処理が移行される。ステップPd10においては整数1と変数mの一致が判断されて、一致した場合は上述したランダム発言処理Pbに処理が移行され、一致しない場合は上述した自動音声登録処理Pcに処理が移行される。したがって、音声認識処理Pe、ランダム発言処理Pbおよび自動音声登録処理Pcのいずれか選択されて実行される。
【0067】
音声認識処理Pe、ランダム発言処理Pbおよび自動音声登録処理Pcが終了したところで、ステップPd11に処理が移行される。ステップPd11においてはアラームスイッチ10の状態が確認され、アラームスイッチ10がONになっている場合は上述した遷移I5によってアラームモードM13に処理が移行される。アラームスイッチ10がOFFになっていることが確認された場合は、ステップPd12に処理が移行される。
【0068】
ステップPd12では、コミュニケーションスイッチ9の状態が確認される。コミュニケーションスイッチ9がONになっている場合は、ステップPd13において信頼パラメータに係るモードの状態が確認され、モードが仮死モードにない場合に、上述した遷移I7によってコミュニケーションモードM14に処理が移行される。信頼パラメータに係るモードが仮死モードになっている場合は、コミュニケーションモードM14に処理は移行されず、次のステップPd14へ処理が移行される。また、ステップPd12においてコミュニケーションスイッチ9がONになっていないことが確認された場合にも、ステップPd14へ処理が移行される。
【0069】
ステップPd14において、就寝モードが選択されているか否かが確認される。就寝モードが選択されている場合は上述した遷移I3によって就寝モードM12に処理が移行され、選択されていない場合は後述するステップPd15に処理が移行される。
【0070】
就寝モードが選択されたか否かの判別は、就寝モード選択フラグの状態を確認することによってなされる。頭部スイッチ8がONされると割り込み処理が発生し、その処理において就寝モード選択フラグがセットされる。具体的には、ランダム発言処理Pbや音声認識処理Pe、コミュニケーションモードM14において制御回路1から音声信号が出力されているときに頭部スイッチ8がONされて上記の割り込み処理が発生すると、この割り込み処理において就寝モード選択フラグがセットされる。そして、ステップPd14において就寝モード選択フラグの状態が判定され、就寝モード選択フラグがセットされていることが確認された場合は、遷移I3で就寝モードM12に処理が移行され、就寝モード選択フラグがセットされていないことが確認された場合は、ステップPd15に処理が移行される。すなわち、ランダム発言処理Pbや音声認識処理Pe、コミュニケーションモードM14において玩具が音声を発しているときに玩具の頭部をたたいて頭部スイッチ8をONさせると、玩具の動作モードは就寝モードに移行される。ステップPd14において就寝モード選択フラグの状態が確認されて次の処理に移行する際に、就寝モード選択フラグはリセットされる。以上の処理によって、使用者は玩具の発生する音声が耳障りになった場合に、玩具の頭をたたくことによって玩具の発声を停止させることができる。
【0071】
ステップPd15において、起床時間の延長が選択されているか否かが確認される。起床時間の延長が選択されている場合はステップPd16に処理が移行され、上記の起床時間パラメータがリセットされた後ステップPd17に処理が移行される。また、起床時間の延長が選択されていない場合は、ステップPd17へそのまま処理が移行される。後述するステップPd17によって起床時間パラメータの計測する時間が所定の時間を超えたときに起床モードM11から就寝モードM12へ処理が移行されるが、ステップPd16により起床時間パラメータがリセットされると、計測した時間がゼロに戻されるため、動作モードが起床モードM11から就寝モードM12へ処理が移行されるまでの時間が延長される。
【0072】
起床時間の延長が選択されているか否かの判別は、起床時間延長フラグの状態を確認することによってなされる。頭部スイッチ8がONされると、就寝モード選択フラグの場合と同様に割り込み処理が発生し、その処理において起床時間延長フラグがセットされる。具体的には、就寝モード選択フラグをセットさせる上述の条件(ランダム発言処理Pbや音声認識処理Peにおいて制御回路1から音声信号が出力されているとき)以外の期間における起床モードM11において、頭部スイッチ8がONされて上記の割り込み処理が発生すると、この割り込み処理において起床時間延長フラグがセットされる。そして、ステップPd15において就寝モード選択フラグの状態が判定され、起床時間延長フラグがセットされていることが確認された場合は、ステップPd16において起床時間パラメータがリセットされ、起床時間延長フラグがセットされていないことが確認された場合は、ステップPd17に処理が移行される。すなわち、ランダム発言処理Pbや音声認識処理Pe、コミュニケーションモードM14において玩具が音声を発しているとき以外の期間における起床モードM11において玩具の頭部をたたいて頭部スイッチ8をONさせると、動作モードが就寝モードM12に移行されるまでの時間を延長させることができる。ステップPd15において起床時間延長フラグの状態が確認されて次の処理に移行する際に、起床時間延長フラグはリセットされる。以上の処理によって、使用者は好きなだけ起床モードM11を延長させて玩具の動作を楽しむことができる。
【0073】
なお、頭部スイッチ8がONされたときに、所定の音声データを玩具に発声させる処理を設けることができる。これにより、使用者が玩具の頭部に触れたことによって生ずる玩具の反応を楽しむことができる。
また、頭部スイッチがONされている時間に応じて異なる音声を発生させることもできる。例えば制御回路1に適切な周期を有するパルスを設け、このパルスの数を頭部スイッチがONされたときからOFFされたときまでの期間制御回路1に計数させることにより、頭部スイッチがONされている時間を計測させ、このような方法で計数したパルス数に応じて、玩具に発声させる音声を変化させることができる。例えば頭部スイッチのON時間が0.03秒以上0.4秒未満の間にあるときは頭を叩かれたと見なして、怒りを表現した音声を玩具に発声させ、頭部スイッチが0.4秒より長くONにされた場合は頭をなでられたとみなして快楽を表現した音声を玩具に発声させる処理を、頭部スイッチ8がONされ発生する割り込み処理または分岐処理において実行させる。頭部スイッチに圧力を検出させるセンサーを内蔵させて、圧力の大小に応じて音声を変化させることもできる。さらに、音声データの種類を後で述べる気分パラメータによって変化させて、快や不快の気分を音声によって表現させることもできる。以上のような処理により、使用者の操作に対し玩具は多様な音声を発してこれに応じることができるので、玩具の機械的な印象が薄らぎ、擬似生物としての趣向性を高めることができる。
【0074】
次に、上述した音声認識処理Peの動作を説明する。
図10は、音声認識処理Peにおける処理を説明するフローチャート図である。図10においてPe1〜Pe16およびPf、Pg、Phはステップを示している。
【0075】
まず、音声認識処理Peの概要を説明する。
音声認識処理Peでは、マイク4から入力された音声データとFLASH ROM3に記録されている音声データの特徴が比較され、特徴の一致する音声データがFLASH ROM3に記録されている場合は会話処理Phを実行させる。会話処理Phでは、マイク4から入力された音声に対し、ROM2およびFLASH ROM3に記録されている音声データがさまざまな組み合わせで音声に変換されて発声される。このため、使用者はマイクに入力した音声に対して玩具の発する意外な音声の応答を楽しむことができる。
一方、マイク4から入力された音声データと特徴の一致する音声データがFLASH ROM3に記録されていない場合は、後述する仮登録処理Pfおよび登録延長処理Pgが実行される。これにより、マイク4から入力された音声は制御回路1で音声データに変換されてFLASH ROM3に記録される。仮登録処理Pfおよび登録延長処理Pgには、音声データをFLASH ROM3に記録させるまでの過程をランダムに変化させる処理が含まれており、玩具に音声を覚えさせる行為に対して使用者に面白味を持たせている。
【0076】
また、音声認識処理Peにおいてマイク4に入力された音声が制御回路1によって音声データに変換される度に、気分パラメータがインクリメントされる。気分パラメータは上述したランダム発言処理Pbにおいて発声させる音声や、頭部スイッチ8をONさせた時に発声させる音声の種類を変化させるパラメータである。
【0077】
図18は、気分パラメータの値によって変化する発言の例を示す図である。
この図において、各気分パラメータの値の範囲における玩具の発言内容が示されている。ペットが発言していないときに頭部スイッチ8をONさせた場合は、ONさせた時間によって使用者が叩いたのか、なでたのかを判定し、それに応じて発言内容を変え、さらに気分パラメータに応じて発言内容を変化させている。 また、上述したランダム発言処理Pbにおいては、同じ気分パラメータでも確率に応じて2種類の音声を出力できる。このようにして、常に移ろう生き物の気分を、発言内容を変化させることによって表現することができる。
【0078】
気分パラメータは上述した信頼パラメータと関係しており、気分パラメータが所定の最大値まで高められた場合に、信頼パラメータがインクリメントされる。すなわち、音声認識処理Peで音声を認識させる毎に気分パラメータが大きくなり、気分パラメータに応じて信頼パラメータも大きくなる。一方、気分パラメータおよび信頼パラメータは時計動作機構12の出力する所定周期のパルス信号S2の計数によって所定時間ごとに発生される割り込み処理において、所定時間ごとにデクリメントされるため、音声認識処理Peにおいて玩具に音声を認識させる操作を使用者が怠ると、気分パラメータの低下によって玩具の発生する音声の種類が変化するのみならず、信頼パラメータの低下によって一定期間の後玩具の動作モードは自動的に病気モードM22や仮死モードM23に移行して、通常の処理の一部が動作不能になってしまう。以上のように、玩具に音声を認識させる処理と玩具の他の挙動を関連付けているため、玩具に対して継続的に音声を与えて世話をする行為に対し、使用者に面白味を持たせている。
【0079】
以下に、音声認識処理Peの詳細な動作を説明する。
【0080】
音声認識処理Peは、ステップPe1より開始される。まず、ステップPe2において音声認識時間パラメータがリセットされ、その後ステップPe3において、時計動作機構12から所定の時間間隔、例えば2秒ごとに入力されるパルス信号S2に応じて音声認識時間パラメータをインクリメントする割り込み処理が開始される。音声認識時間パラメータの値はステップPe2においてリセットされているため、この値を参照することにより、ステップPe3からの経過時間を計測することができる。
【0081】
音声認識時間の計測が開始された後、ステップPe4においてマイク4から入力される音声の有無が制御回路1によって判断される。具体的には、マイク4から入力された音声信号のレベルが所定のしきい値より小さいとき音声信号が入力されていないと判断され、所定のしきい値より大きいとき音声信号が入力されていると判断される。
制御回路1において音声信号が入力されていないと判断された場合、ステップPe5に処理が移行される。ステップPe5では、上述した音声認識時間パラメータの値によって示されるステップPe3からの経過時間と所定の時間、例えば30秒間とが比較されて、経過時間が30秒間より短い場合、ステップPe4に再び処理が戻されて、マイク4から入力される音声の有無が検出される。30秒以内にステップPe4において音声が検出された場合は、前記した音声認識時間パラメータをインクリメントする割り込み処理が停止されてステップPe4からステップPe6に処理が移行される。また、30秒以内にステップPe4において音声が検出されなかった場合は、同様に音声認識時間パラメータをインクリメントする割り込み処理が停止された後、ステップPe5からステップPe16に処理が移行され、音声認識処理が終了する。
【0082】
ステップPe6では、ステップPe4で検出されたアナログの音声信号が、制御回路1でA/D変換を施されてデジタル化された音声データに変換される。この際、例えば、音声の大きさが制御回路1において定められている上限のしきい値より大きい場合や、下限のしきい値より小さい場合、さらには音声の長さが定められた上限のしきい値より長い場合には、ステップPe7に処理が移行されて、入力された音声のレベルが不適当であることを知らせる音声が発せられる。具体的には、例えば「ブ〜」という音のデータがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。その後、ステップPe7に処理を戻して、再び音声の入力を待つ処理が実行される。
ステップPe6において、マイク4による音声信号が音声データへ正常に変換された場合、取得された音声データは変数Vdに代入される。
【0083】
音声データが変数Vdに代入された後、ステップPe9において上記した気分パラメータが例えば1だけインクリメントされ、ステップPe10に処理が移行される。その後、ステップPe10において玩具の動作モードが病気モードM22になっているか否かが確認され、病気モードM22になっている場合は、ステップPe11で病気モードにあることを示す音声データがROM2から読み出されて音声信号に変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として出力される。そして、ステップPe12で音声認識回数をインクリメントした後、ステップPe4に処理が戻されて、再び音声の入力を待つ処理が実行される。このように、玩具が病気モードM22になっている場合は、後述する音声の登録処理が実行されない。
【0084】
ステップPe10において玩具が病気モードM22になっていないことが確認された場合、ステップPe13に処理が移行される。ステップPe13において、ステップPe8で変数Vdに代入されている音声データと、FLASH ROM3に既に登録されている音声データ(以下、登録ワードと呼ぶ)の特徴が比較される。そして、所定の判断手法により互いの音声データの特徴が一致していると判定される登録ワードが見つかると、その登録ワードの記憶場所を示す番号が登録ワード番号として変数Jに代入される(ステップPe14)。次いで、取得された登録ワードが後述する仮登録ワードであるか否かが判定され(ステップPe15)、仮登録ワードでない場合は上述した会話処理Phが実行された後、再びステップPe2に戻って、音声の入力を待つ処理が実行される。
【0085】
ステップPe13における検索において、変数Vdに代入されている音声データに特徴が一致している音声データがFLASH ROM3に見つからなかった場合、入力された言葉を再度使用者に入力させて、登録ワードとして玩具に記憶させるための仮登録処理Pfおよび登録延長処理Pgが実行される。これらの処理の詳細については後で説明する。登録延長処理Pgが終了すると、会話処理Phと同様に、ステップPe2へ処理が戻されて再び音声の入力を待つ処理が実行される。また、ステップPe14で検索された登録ワードが仮登録された登録ワードであることがステップPe15において確認されたときは、会話処理Phが実行されるかわりに登録延長処理Pgが実行される。
【0086】
続いて、上述した仮登録処理Pfの動作を説明する。
図11および図12は、仮登録処理Pfにおける処理を説明するフローチャート図である。図11および図12においてPf1〜Pf33はステップを示している。また、図11の丸2と図12の丸2はステップの接続関係を示している。
【0087】
仮登録処理Pfにおいては、マイク4から入力された音声を、登録ワードとしてFLASH ROM3に記録する処理が行なわれる。そのとき、使用者がステップPf5で入力させた音声を登録ワードとして玩具に記憶させる意志を有しているか否かを確認するために、同一の音声を複数回入力させる処理を行い、これらの処理で入力された音声データの特徴が一致していると判断されたときに、その音声データを登録ワードとしてFLASH ROM3に記録させる。前記の処理を行なうことによって、例えば誤った音声を玩具に入力してしまった場合のように、登録させる意志がない音声が玩具に登録される不都合が防止されるので、新規な音声を登録させる場合に例えばボタンを押すなどの面倒な操作が不要になる。
【0088】
ステップPf1において、仮登録処理が開始される。
ステップPf2において、仮登録処理の最初に玩具が音声を発する処理が実行される。具体的には、ROM2に記録されている音声、例えば「ウン?」といった音声データがROM2から読み出されてD/A変換、音程変換回路5で音程を変換された後に音声増幅回路6により増幅されてスピーカ7より音声として出力される。このように、ステップPf2において玩具から所定の音声が発せられることにより、使用者は入力した音声が玩具に登録されていない音声であることを確認できる。
【0089】
ステップPf3において、待ち時間パラメータがリセットされ、ステップPf4において、時計動作機構12から所定の時間間隔、例えば2秒ごとに入力されるパルス信号S2に応じて、待ち時間パラメータをインクリメントする割り込み処理が開始される。待ち時間パラメータの値はステップPf3においてリセットされているため、この値を参照することにより、ステップPf4からの経過時間を計ることができる。
【0090】
ステップPf5において、マイク4から入力される音声の有無が制御回路1によって判断される。具体的には、マイク4から入力された音声信号のレベルが所定のしきい値より小さいとき音声信号が入力されていないと判断され、所定のしきい値より大きいとき音声信号が入力されていると判断される。
制御回路1において音声信号が入力されていないと判断された場合、ステップPf6に処理が移行される。ステップPf6では、上述した待ち時間パラメータの値によって示されるステップPf4からの経過時間と所定の時間、例えば10秒間とが比較されて、経過時間が10秒間より短い場合、ステップPf5に再び処理が戻されて、マイク4から入力される音声の有無が検出される。10秒以内にステップPf5において音声が検出された場合は、前記した待ち時間パラメータをインクリメントする割り込み処理が停止されてステップPf5からステップPf7に処理が移行される。また、10秒以内にステップPf5において音声が検出されなかった場合は、同様に待ち時間パラメータをインクリメントする割り込み処理が停止された後、ステップPf6から上述した音声認識処理Peの冒頭のステップに処理が移行される。
【0091】
ステップPf7では、ステップPf5で検出されたアナログの音声信号が、制御回路1でA/D変換を施されてデジタル化された音声データに変換される。この際、例えば、音声の大きさが制御回路1において定められている上限のしきい値より大きい場合や、下限のしきい値より小さい場合、さらには音声の長さが定められた上限のしきい値より長い場合には、ステップPf8に処理が移行されて、入力された音声のレベルが不適当であることを知らせる音声が発せられる。具体的には、例えば「ブ〜」という音のデータがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。この後、上述した音声認識処理Peの冒頭のステップに処理が戻される。
ステップPf7において音声データが正常に取得された場合は、次のステップPf9において、音声データが認識されたことを使用者に通知する音声、例えば「ウン?」という音声データがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。
【0092】
ステップPf10において、上述した待ち時間パラメータが再びリセットされ、ステップPf11において、時計動作機構12から所定の時間間隔ごとに入力されるパルス信号S2に応じて、待ち時間パラメータをインクリメントする割り込み処理が開始される。ステップPf12においては、後述するステップPf17において使用される整数kの値がゼロにリセットされる。
【0093】
ステップPf13において、マイク4から入力される音声の有無が再び制御回路1によって判断され、音声信号が入力されていないと判断された場合、ステップPf14に処理が移行される。ステップPf14では、上述した待ち時間パラメータの値によって示されるステップPf11からの経過時間と所定の時間、例えば10秒間とが比較されて、経過時間が10秒間より短い場合、ステップPf13に再び処理が戻されて、マイク4から入力される音声の有無が検出される。10秒以内にステップPf13において音声が検出された場合は、前記した待ち時間パラメータをインクリメントする割り込み処理が停止されてステップPf13からステップPf15に処理が移行される。また、10秒以内にステップPf13において音声が検出されなかった場合は、同様に待ち時間パラメータをインクリメントする割り込み処理が停止された後、音声認識処理Peの冒頭のステップに処理が戻される。
【0094】
ステップPf15では、ステップPf13で検出されたアナログの音声信号が、制御回路1でA/D変換を施されてデジタル化された音声データに変換される。上述したステップPf7と同様の条件で入力された音声が不適当と判断された場合は、ステップPf16に処理が移行されて、入力された音声のレベルが不適当であることを知らせる音声、例えば「ブ〜」といった音声データがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。次いで、ステップPf17において上述した整数kの値が1だけインクリメントされ、ステップPf18でこの整数kと整数1の大小関係が判断される。整数kが所定の整数、例えば1と等しいか、または1より小さい場合は、ステップPf13に戻って再び音声の入力を待つ処理が実行され、整数kが1より大きい場合は、音声認識処理Peの冒頭のステップに処理が戻される。このように、音声のレベルが不適当であった場合に所定の回数(上記の例では1回)だけ音声を再入力させる機会を設けているので、誤った音声を入力してしまったとき直ちに音声認識処理Peの冒頭のステップに戻って初めから入力をやり直さなくても済み、同じ操作を反復させられる不便さが軽減される。
【0095】
ステップPf15において音声データが正常に取得された場合は、ステップPf19において取得された音声データが変数Vdに代入される。変数Vdは、後述する処理で入力される音声データとの一致を確認するために使用される。
【0096】
次いで、ステップPf20において、音声データが認識されたことを通知する音声、例えば「ウーンモ」といった音声データがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。玩具が音声の認識に応じて発する音声が変化(上記の例では「ウン?」から「ウーンモ」に変化)するため、使用者は、玩具が音声を認識していること、および音声の登録中の段階を知ることができる。
【0097】
ステップPf21において、上述した待ち時間パラメータが再びリセットされ、ステップPf22において、時計動作機構12から所定の時間間隔ごとに入力されるパルス信号S2に応じて、待ち時間パラメータをインクリメントする割り込み処理が開始される。ステップPf23においては、後述するステップPf28において使用される整数kの値がゼロにリセットされる。
【0098】
ステップPf24において、マイク4から入力される音声の有無が再び制御回路1によって判断され、音声信号が入力されていないと判断された場合、ステップはステップPf25に移行される。ステップPf25では、上述した待ち時間パラメータの値によって示されるステップPf22からの経過時間と所定の時間、例えば10秒間とが比較されて、経過時間が10秒間より短い場合、ステップPf24に再び処理が戻されて、マイク4から入力される音声の有無が検出される。10秒以内にステップPf24において音声が検出された場合は、前記した待ち時間パラメータをインクリメントする割り込み処理が停止されてステップPf24からステップPf26に処理が移行される。また、10秒以内にステップPf24において音声が検出されなかった場合は、同様に待ち時間パラメータをインクリメントする割り込み処理が停止された後、音声認識処理Peの冒頭のステップに処理が戻される。
【0099】
ステップPf26では、ステップPf24で検出されたアナログの音声信号が、制御回路1でA/D変換を施されてデジタル化された音声データに変換される。上述したステップPf7と同様の条件で入力された音声が不適当と判断された場合は、ステップPf27に処理が移行されて、入力された音声のレベルが不適当であることを知らせる音声、例えば「ブ〜」といった音声データがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。次いで、ステップPf28において上述した整数kの値が1だけインクリメントされ、ステップPf29でこの整数kと整数1の大小関係が判断される。整数kが所定の整数、例えば1と等しいか、または1より小さい場合は、ステップPf24に戻って再び音声の入力を待つ処理が実行され、整数kが1より大きい場合は、音声認識処理Peの冒頭のステップに処理が戻される。ステップPf12〜Pf18と同様に、音声のレベルが不適当であった場合に所定の回数だけ音声を再入力させる機会を設けているので、同じ操作を反復させられる不便が軽減される。
【0100】
ステップPf30では、ステップPf19で変数Vdに代入され音声データと、ステップPf26で取得された音声データの特徴が制御回路1において比較される。音声データの特徴は、例えば音声データをフーリエ変換して得られた周波数スペクトルの振幅などを用いて抽出され、所定の比較手順で比較される。互いの音声データの特徴が一致しないと判断された場合は、上述したステップPf27に処理が移行されて、入力された音声のレベルが不適当であることを知らせる音声が発せられ、ステップPf27を通過した回数に応じ、音声の再入力を許可されるか、あるいは音声認識処理Peの冒頭のステップに処理が戻される。
【0101】
変数Vdの音声データとステップPf26で取得された音声データの特徴が一致していると判断された場合は、ステップPf26で取得された音声データをFLASH ROM3に記録する処理が行なわれる。まず、ステップPf31において、FLASH ROM3にデータを格納させる場所に係る登録ワード番号が取得されて変数Jにその番号が代入され、次いでステップPf32において登録ワード番号がJ番であるFLASH ROM3の格納エリアにステップPf26で取得された音声データが格納される。
このとき、この音声データの情報とともに、仮登録状態にセットされている仮登録フラグも記録される。仮登録フラグは図10のステップPe15において参照されるフラグである。仮登録フラグがセットされている登録ワードは、このステップにおいて仮登録ワードであると判断されて会話処理Phの実行が許可されず、登録延長処理Pgが実行される。登録延長処理において仮登録フラグがリセットされて正式に登録された登録ワードだけが、会話処理Phの実行を許可される仕組みになっている。
【0102】
引き続いて、登録延長処理Pgの動作を説明する。
図13および図14は、登録延長処理Pgにおける処理を説明するフローチャート図である。図13および図14においてPg1〜Pg23はステップを示している。また、図13の丸3と図14の丸3はステップの接続関係を示している。
【0103】
上述したように、仮登録フラグがセットされている登録ワードが認識された場合は、会話処理Phが実行されずに登録延長処理Pgが実行される。登録延長処理Pgにおいては、仮登録フラグをリセットして登録ワードを正式に登録させるまでに、音声を認識させる処理を複数回反復させて、正式登録を延長させる処理が行なわれる。音声を認識させる処理を反復させる回数は、上述した信頼パラメータを加味した範囲でランダムに決定される。
【0104】
会話処理Phは、使用者がマイク4に入力した音声に応じて登録ワードや上述した自動音声登録処理Pcをさまざまに組み合わせてランダムに発声させる処理であり、使用者が玩具と音声のやり取りを交わす行為を楽しむ上で欠かすことができない処理である。したがって、登録延長処理Pgで会話処理Phの楽しみを先延ばしさせることにより、玩具と会話することに対する使用者の興味と期待感を掻き立てる効果を生み出すことができる。また、規定の回数で言葉の登録が完了してしまうと玩具が機械的に音声を記録している印象を使用者に抱かせてしまい玩具の擬似生物としての趣向性を損なってしまうが、このように言葉の登録をランダムに延長させる処理を設けることで生物が言葉を記憶する際の不確定性を表現できるので、あたかも生物に言葉を覚えさせているような感覚を使用者に喚起させることができる。
【0105】
登録延長処理PgはステップPg1から処理が開始される。まず、ステップPg2において上述した信頼パラメータの大きさが所定の整数値例えば整数45と大小関係を比較され、信頼パラメータが整数45より小さい場合はステップPg3に処理が移行される。ステップPg3では例えば2〜4の整数がランダムに生成されて変数mに代入される。
また、信頼パラメータが整数45より大きい場合はステップPg4に処理が移行される。ステップPg4でもステップPg2と同様に信頼パラメータの大きさが所定の整数値例えば整数55と大小関係を比較され、信頼パラメータが整数55より小さい場合はステップPg5に処理が移行される。ステップPg5では、例えば1〜3の整数がランダムに生成されて変数mに代入される。
また、信頼パラメータが整数55より大きい場合はステップPg6に処理が移行され、例えば0〜2の整数がランダムに生成されて変数mに代入される。
以上の処理によって、変数mには信頼パラメータの大きさに応じた0から4の整数が代入される。
【0106】
変数mに整数が代入された後、ステップPg7において整数mと整数0の一致が確認される。整数mが整数0に等しい場合はステップPg21に処理が移行され、登録ワード番号がJ番の登録ワードの仮登録フラグがリセットされて正式登録される。また、整数mが整数0に等しくない場合は、ステップPg8〜Pg18の処理が実行される。このステップにより、作業者が正式登録を完了させるためには、登録させたい音声を玩具に認識させる作業を変数mに応じた回数だけ反復させなくてはならない。
【0107】
ステップPg8において、後の処理で参照する整数の変数kおよびiがゼロにリセットされる。次いで、ステップPg9において待ち時間パラメータがリセットされ、ステップPg10において、時計動作機構12から所定の時間間隔ごとに入力されるパルス信号S2に応じて、待ち時間パラメータをインクリメントする割り込み処理が開始される。待ち時間パラメータの値はステップPg9においてリセットされているため、この値を参照することにより、ステップPg10からの経過時間を計ることができる。
【0108】
ステップPg11において、マイク4から入力される音声の有無が制御回路1によって判断される。具体的には、マイク4から入力された音声信号のレベルが所定のしきい値より小さいとき音声信号が入力されていないと判断され、所定のしきい値より大きいとき音声信号が入力されていると判断される。
制御回路1において音声信号が入力されていないと判断された場合、ステップPg12に処理が移行される。ステップPg12では、上述した待ち時間パラメータの値によって示されるステップPg10からの経過時間と所定の時間、例えば10秒間とが比較されて、経過時間が10秒間より短い場合、ステップPg11に再び処理が戻されて、マイク4から入力される音声の有無が検出される。10秒以内にステップPg11において音声が検出された場合は、前記した待ち時間パラメータをインクリメントする割り込み処理が停止されてステップPg11からステップPg13に処理が移行される。また、10秒以内にステップPg11において音声が検出されなかった場合は、同様に待ち時間パラメータをインクリメントする割り込み処理が停止された後、ステップPg12から後述するステップPg19に処理が移行される。
【0109】
ステップPg13では、ステップPg11で検出されたアナログの音声信号が、制御回路1でA/D変換を施されてデジタル化された音声データに変換される。この際、例えば、音声の大きさが制御回路1において定められている上限のしきい値より大きい場合や、下限のしきい値より小さい場合、さらには音声の長さが定められた上限のしきい値より長い場合には、ステップPg14に処理が移行されて、入力された音声のレベルが不適当であることを知らせる音声が発せられる。具体的には、例えば「ブ〜」という音のデータがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。このあと、後述するステップPg19に処理が移行される。
【0110】
ステップPg13において音声データが正常に取得された場合は、次のステップPg15において、音声データが認識されたことを使用者に通知する音声、例えば「ウーンニャ」という音声データがROM2から読み出されてD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。上述の例によれば、ステップPf2およびステップPf9の「ウン?」からステップPf20の「ウーンモ」、さらにステップPg15の「ウーンニャ」といったように、音声を玩具に登録させる諸段階に玩具が発する音声が変化するので、使用者は玩具に対する音声の登録段階を大まかに把握することができる。
【0111】
次に、ステップPg16において上述した変数iに整数1が加算され、ステップPg17において変数mと変数iの一致が確認される。変数mと変数iが一致していない場合はステップPg11に処理が戻されて、再び音声の入力を待って音声データに変換する処理が実行される。したがって、ステップPg2〜Pg6で信頼パラメータを加味しながらランダムに決定された変数mにより、ステップPg11からステップPg17の処理を反復する回数が決定される。
【0112】
ステップPg17において変数mと変数iが一致していることが確認された場合は、ステップPg18において、登録ワード番号がJ番の音声データとステップPg13で取得された音声データの特徴が一致しているか否か判定される。一致している場合はステップPg21に処理が移行され、登録ワード番号がJ番の登録ワードの仮登録フラグがリセットされてFLASH ROM3の所定のアドレスに格納される。これにより、登録ワードJ番の音声データは正式登録される。登録ワード番号Jの音声データとステップPg13で取得された音声データの特徴が一致していない場合は、後述するステップPg19に処理が移行される。
【0113】
ステップPg19およびPg20では、音声入力の待ち時間が所定時間をオーバーしてしまったエラー(ステップPg12)や、入力された音声にレベルが大きすぎる等の不具合があるエラー(ステップPg13)、あるいは登録させたい音声データと仮登録されている音声データの特徴が一致しないエラー(ステップPg18)が発生した場合において、変数kの値に整数1が加えられる。そしてステップPg20において変数kと所定の整数たとえば整数3の大小関係が判断されて、変数kが整数3と同じか小さい場合はステップPg11に処理が戻されて、音声データを取得する処理が反復される。また、変数kが整数3より大きい場合は、音声認識処理Peの冒頭に処理が戻される。
このように、上記のようなエラーが発生した場合に音声認識処理Peの冒頭までいきなり処理を戻してしまうのではなく、前述のエラーが発生した回数が3回以内である場合はステップPg11からの音声を取得する処理に戻される。したがって、例えば間違ったイントネーションで音声を入力してしまった場合などであっても再び音声を入力させる機会が設けられているので初めから音声の入力をやり直さなくても済み、同じ操作を反復させられる不便さが軽減される。
【0114】
ステップPg21で仮登録フラグがリセットされてFLASH ROM3に記録された後、ステップPg22において音声が玩具に記憶されたことを表現する音声が発せられる。たとえばステップP21で正式登録させた音声データがD/A変換され、音程変換回路5、音声増幅回路6を経てスピーカ7より音声として発せられる。これにより、玩具が音声を記憶したことを使用者に通知させることができる。
【0115】
次に、会話処理Phの動作について説明する。
【0116】
会話処理Phにおいては、使用者の入力させた音声に対して種々のパターンの音声を発する処理が行われる。また、交互に連続して入力された登録済みの音声を関連付けて対語として記憶させる処理も行われる。
【0117】
この会話処理Phにおいて処理される音声は仮登録を経て正式に登録された音声に限ることは既に述べたが、正式に登録された各音声には記憶度パラメータと対語関連度パラメータという2つのパラメータが付加される。記憶度パラメータは、正式登録されてFLASH ROM3に記憶された音声の記憶を保持させる度合いに関するパラメータであり、対語関連度パラメータは上述した対語関係の情報の記憶を保持させる度合いに関するパラメータである。
【0118】
FLASH ROM3に記憶できる音声は、メモリの容量によって制限される。したがって、記憶された音声が増えて、定められた上限の個数に達した場合、記憶されている音声の何れかを消去しなければ新規の音声を記憶できない。記憶度パラメータは、このような場合に消去させる音声を決定するためのパラメータであり、このパラメータが最も小さいデータから順に消去される。この記憶度パラメータは、この音声を入力して認識させる毎に呼び出した時点における信頼値に応じた値を加算される。また、例えば1日といった一定期間毎に僅かに減少させる。これにより、あまり入力されない音声データは時間と共に自動的に減少し、新規の音声データと置き換えられて消去される。また、記憶度パラメータに所定の下限値を設け、これを下回ったら、新規の言葉と置き換えられるまでもなく自動的に音声データを消去させることもできる。このように、玩具が言葉を忘却するさまは生き物を連想させるので、使用者が玩具に抱く疑似生物としての趣向性を高めることができる。
【0119】
一つの音声データに記憶させることができる対語の数も所定数、例えば3つまでに制限されており、例えば現在3つの対語を有している音声データに4つ目の異なる音声データを対語として認識させる場合、この対語を新規に設定するためには、3つのうちの何れかの対語の記憶を消去しなくてはならない。対語関連度パラメータは、このような場合に消去させる対語を決定するためのパラメータであり、このパラメータが最も小さいデータから順に消去される。
また、対語関連度パラメータは後に述べる対語の連続発声機能においても参照され、対語関連度パラメータの値が大きい対語が選択されて発声される。
【0120】
この対語関連度パラメータは、対語を発声させる度に信頼値に応じた値を加算される。例えば、
音声データ:「こんにちは」
対語1:「こんばんは」 対語関連度パラメータ=20
という音声データと
音声データ:「こんばんは」
対語1:「こんにちは」 対語関連度パラメータ=15
という音声データが登録されている状態で、「こんにちは」という音声を入力してこれが認識され、この対語である「こんばんは」という音声が玩具から発声された場合、対語関連度パラメータ20に信頼パラメータに応じたランダムな数値が加算される。
【0121】
対語関連度パラメータも、記憶度パラメータと同様に、例えば1日といった一定期間毎に僅かに減少させる。これにより、あまり認識されない対語関連度パラメータは時間と共に自動的に減少し、新規の対語が学習された場合にこれと置き換えられて消去される。
【0122】
図15は、会話処理Phにおける処理を説明するフローチャート図である。図15においてPh1〜Ph13は処理の各ステップを示している。
【0123】
本会話処理Phは、図10のステップP e 15で示す仮登録ワードでない場合に、ステップPh1から開始する。ステップPh2において、登録ワード番号Jの音声データの記憶度パラメータに、信頼パラメータに応じた所定の値が加算され、ステップPh3において、登録ワード番号Jが対語を有するか否かが判別される。まず対語を有しない場合について説明すると、この場合はステップPh12に処理を移行させて登録ワード番号Jの音声を出力させる。すなわち、対語となる音声がない場合は、使用者が入力した音声と一致する登録ワードをそのままオウム返しに出力させる処理を行う。
次いで、後述する対語処理Piに移行してこれを実行し、その後会話処理を終了する。
【0124】
ステップPh3において、登録ワード番号Jが対語を有することが判別された場合は、ステップPh4において複数のステップのうちの1つを所定の確率でランダムに選択し、選択したステップへ処理を移行させる。例えば、ステップPh5へ60%、ステップPh9へ10%、ステップPh10へ20%、ステップPh11へ10%の確率で処理を移行させる。
【0125】
ステップPh5へ処理を移行させた場合は、登録ワードJの有する対語を発声させる3つのステップPh6〜Ph8のうちの1つを所定の確率でランダムに選択し、選択したステップへ処理を移行させる処理が行われる。この場合、移行する確率は例えば各対語の有する上述の対語関連度パラメータに応じた大きさになる。すなわち対語1、対語2、対語3に対して対語関連度パラメータをそれぞれr1、r2、r3とし、各対語を発声させるステップへ処理を移行させる確率をそれぞれQ1、Q2、Q3とした場合、これらの比には以下の関係がある。
Q1:Q2:Q3 = r1:r2:r3
したがって、例えば対語1、対語2、対語3に対して対語関連度パラメータをそれぞれ25、10、15とした場合、ステップPh4からステップPh6、ステップPh7、ステップPh8へ移行する確率はそれぞれ30%、12%、18%となる。
なお選択されて発声された対語の対語関連度パラメータは、発声させた時点の信頼パラメータに応じたランダムな数値が加算される。また、選択されて発声された各対語の対語関連度パラメータおよび記憶度パラメータには、それぞれ信頼パラメータに応じたランダムな数値が加算される。
このように、一つの入力音声に対して複数の対語を発声させることができるのみならず、その対語を発声させる確率を、対語の認識頻度に応じて重み付けを与えて変えているので、使用者が所定の対語を反復して玩具に認識させる行為に意味付けがなされ、玩具を飽きのこないものにすることができる。
【0126】
ステップPh4においてステップPh9が選択されて処理が移行すると、登録されている全ての音声データのうちの1つがランダムに選択されて発声される。入力された音声と無縁の音声が発せられるため、使用者に意外性を与え、玩具と会話することに興味を抱かせる。
【0127】
ステップPh4においてステップPh10が選択されて処理が移行すると、登録ワード番号Jの音声データが発声されると共に、登録ワード番号Jの有する対語のうちの対語関連度が最も大きい音声データが発声される。さらにその音声データが有する対語関連度パラメータの最も大きい対語が発声され、この繰り返しにより最大で例えば10語までの対語が連続的に発声される(対語の連続発声機能)。ただし、同一の音声が繰り返されないよう処理される。また、連続的に発声された各対語の対語関連度パラメータおよび記憶度パラメータには、それぞれ信頼パラメータに応じたランダムな数値が加算される。
このように対語が連続的に発声されることによって、あたかも玩具が歌を歌うような印象を与え、使用者に面白味を与える。
対語の連続発声処理が終了した後は、後述する処理Piに移行してこれを実行し、その後会話処理を終了する。
【0128】
ステップPh4においてステップPh11が選択されて処理が移行すると、自動音声登録処理Pcで登録された音声が選択されて発声される。自動音声登録処理Pcで登録された音声は、使用者の全く意図しない音声なので、他の発声処理にはない意外感を使用者に与え、玩具を飽きのこないものにさせる。
【0129】
引き続いて、対語処理Piの動作を説明する。
対語処理Piの目的は、2つの音声が交互に連続して入力される回数を検出し、その回数が信頼パラメータに応じてランダムに選択された数に達したとき、その2つの音声を対語として関連付けることにある。
図16は、対語処理Piにおける処理を説明するフローチャート図である。図16においてPi1〜Pi22は処理の各ステップを示している。
【0130】
対語処理PiはステップPi1において開始する。次いでステップPi2およびステップPi3において、マイク4より入力されて認識された登録ワード番号Jと、変数BOX1および変数BOX2に記憶された登録ワード番号の一致が判断される。ここで先に述べておくと、この対語処理Piで用いられる各変数(BOX1、BOX2、CNT1、CNT2、i、p)は、すべて音声認識処理Peの初期においてリセットされており、音声認識処理Peを終了するか、後に述べるステップPi8、ステップPi18においてリセットされるまで保持される。
【0131】
ここで、変数BOX1および変数BOX2には、マイクから登録された音声が交互に連続して入力された場合に2つの音声の登録ワード番号が保持される。変数BOX1および変数BOX2に保持された登録ワード番号が登録ワード番号Jと一致していないことが判断されると、ステップPi4およびステップPi5において、変数BOX1および変数BOX2とゼロの一致が検出されている。なおこの説明では、登録ワード番号がゼロの音声記憶エリア存在しないこととしている。ステップPi4およびステップPi5において、交互に連続して入力された音声が、対語として認識される途中にあるか否かが検出される。もし対語として認識させている途中なら、変数BOX1および変数BOX2のいずれか一方がゼロになる。
【0132】
変数BOX1および変数BOX2の何れもゼロでない場合はステップPi6に移行する。この場合、前々回、前回、および今回入力した音声が何れも異なっているので使用者は対語を認識させていないと考えられるが、音声の入力を誤ってしまったケースも考えられるので、さらにもう一回猶予を与えるためにステップPi6およびステップPi7でステップPi8による変数のリセットを回避させている。ステップPi6を通過する際に変数iがインクリメントされるので、次回もう一度ステップPi6を通過して変数iがインクリメントされて1より大きくなると、ステップPi7を経てステップPi8で変数がリセットされる。ステップPi8では上記した各変数がリセットされてすべてゼロになる。
【0133】
ステップPi4およびステップPi5において、変数BOX1および変数BOX2の何れかがゼロになっていると、ゼロになっている変数に現在入力した音声の登録ワード番号Jが代入され、さらに、対語となる音声が入力された数を計数する変数CNT1または変数CNT2がインクリメントされる。次にステップPi11において変数BOX1および変数BOX2の何れの変数も一回づつ入力されているか否かが判断される。つまり2つの音声が交互に1回づつ対語として入力されたことを確認する。変数CNT1または変数CNT2の何れかがゼロの場合は対語処理を終了する。
【0134】
ステップPi11において対語の第1回目の入力が確認されると、次にステップPi12において、入力された2つの音声が既に対語として登録されているか否かが判別される。対語として登録されている場合は、ステップPi14において変数BOX1および変数BOX2で登録ワード番号が示された2つの音声データの各対語関連度パラメータに信頼パラメータに応じたランダムの数値を加算する。2つの音声データが対語でなかった場合は変数pに信頼パラメータに応じたランダムの数値を与える。変数pは、対語を登録させるまでに使用者が繰り返さなければならない対語の入力回数を示す。すなわち2つの音声を交互に1回ずつ入力させる操作を繰り返す回数を示す。
【0135】
ステップPi2およびステップPi3において、マイク4から入力された音声が変数BOX1または変数BOX2の何れかに入力された音声と一致していることが確認された場合は、一致している変数BOX1または変数BOX2に対応する変数CNT1または変数CNT2がインクリメントされる(ステップPi15またはステップPi16)。そして、ステップPi17において変数CNT1と変数CNT2の差が検出され、両者の値の差が所定数、例えば3以上になっている場合はPi18で変数をリセットして対語処理を終了させる。すなわち、一方の音声のみが続けて入力される状態を検出し、それが3回以上の場合には、使用者が対語を学習させていないと認識して、対語の学習に関する変数をリセットさせている。
【0136】
変数CNT1と変数CNT2の差が3未満である場合は、ステップPi19において、上述した変数pがセットされているか否かが判定される。セットされていない場合は、まだ第1回目の対語の認識が成されていないと判断して、対語処理を終了させる。変数pがセットされている場合は、ステップPi20において変数CNT1または変数CNT2の何れか一方が変数pより大きいか否かが判断され、小さい場合はさらに対語の認識を反復させるためにそのまま対語処理を終了させ、大きい場合は対語を認識させた回数が所定数に達したと判断し、ステップPi21において、変数BOX1および変数BOX2で登録ワード番号が示された2つの音声データを対語として登録する。
【0137】
以上説明したように、会話処理Phにおいては様々なバリエーションで記憶されている音声を出力させるので、その度に意外性を与え、使用者の楽しみを持続させる。また、まるでインコに言葉を覚えさせるときのように同じ音声を繰り返し語りかけることによって対語を認識させることができるので、玩具の機械的な印象が薄らぎ、本物の生き物を相手にしているような感覚を使用者に起こさせる。さらに、対語を認識させるための回数がランダムに生成されるため、こうした面でも本物らしさを損なうことがない。このようにして、疑似生物としての趣向性の高い玩具を提供することができる。
【0138】
なお本発明の実施形態は、図1の外観図に示したような電子ペット玩具に限定されるものではなく、たとえば音声出力装置を備えたコンピュータやゲーム機などにも広く適用することができる。
また、本発明の本実施形態の説明で使用した各図におけるフローチャートをプログラムとして表現することにより、本願発明を、プログラムを記録した記録媒体に適用することも可能である。
【0139】
【発明の効果】
本発明によれば、音声の認識回数によって変動する気分パラメータと、気分パラメータの連動してさらに気分パラメータより長い周期で変動する信頼パラメータにより、音声の認識、記憶、出力に係るさまざまな動作を制御するので、音声処理装置があたかも生物の気分等を表現しているかのような感覚を使用者に与え、疑似生物と会話を楽しむ趣向性を高めることができる。
【図面の簡単な説明】
【図1】図1は、本発明の音声処理装置の実施形態に係る玩具の外観を示す図である。
【図2】図2は、本発明の音声処理装置の実施形態に係る玩具の構成を示す図である。
【図3】図3は、本発明の実施形態に係る玩具の初回起動時の動作に係る動作モードを示す図である。
【図4】図4は、通常モードにおける動作モードの詳細を示した図である。
【図5】図5は、コミニュケーションモードにおける玩具の配置を示す俯瞰図である。
【図6】図6は、信頼パラメータに係る動作モードを示す図である。
【図7】図7は、初起動モードにおける処理を説明する第1のフローチャート図である。
【図8】図8は、初起動モードにおける処理を説明する第2のフローチャート図である。
【図9】図9は、起床モードにおける処理を説明するフローチャート図である。
【図10】図10は、音声認識処理における処理を説明するフローチャート図である。
【図11】図11は、仮登録処理における処理を説明する第1のフローチャート図である。
【図12】図12は、仮登録処理における処理を説明する第2のフローチャート図である。
【図13】図13は、登録延長処理における処理を説明する第1のフローチャート図である。
【図14】図14は、登録延長処理における処理を説明する第2のフローチャート図である。
【図15】図15は、会話処理Phにおける処理を説明するフローチャート図である。
【図16】図16は、対語処理Piにおける処理を説明するフローチャート図である。
【図17】図17は、ランダム発言処理Pbにおける処理を説明するフローチャート図である。
【図18】図18は、気分パラメータの値によって変化する発言の例を示す図である。
【符号の説明】
1…制御回路(制御手段)、2…ROM、3…FLASH ROM(記憶手段
)、4…マイク(音入力手段)、5…音程変換回路、6…音声増幅回路、7…スピーカ(音声出力手段)、8…頭部スイッチ、9…コミュニケーションスイッチ、10…アラームスイッチ、11…リセットスイッチ、12…時計動作機構。

Claims (5)

  1. 音声入力手段と、記憶手段と、制御手段と、音声出力手段を備える音声処理装置であって、
    前記記憶手段は、気分パラメータの値の範囲内に対応付けられた音声データを記憶し、前記制御手段は、前記音声入力手段からの音声信号を検出するたびに前記気分パラメータの値を増加させるとともに、音声出力指令の発生に従い、その時点の前記気分パラメータの値に応じた音声データの中から読み出して前記音声出力手段に出力させる
    音声処理装置。
  2. 前記制御手段は、前記音声入力手段が音声信号を検出しない場合は、所定時間毎に前記気分パラメータの値を減少させる
    請求項に記載の音声処理装置。
  3. 前記音声出力指令は、スイッチの操作によって発生する .
    請求項1または2に記載の音声処理装置。
  4. 前記音声データは、前記スイッチの操作時間にも対応付けられ、
    前記制御手段は、前記スイッチの操作時間にも応じた音声データの中から読み出す
    請求項に記載の音声処理装置。
  5. 前記スイッチは、操作圧力を検出可能とし、
    前記音声データは、前記スイッチの操作圧力にも対応付けられ、
    前記制御手段は、前記スイッチの操作圧力にも応じた音声データの中から読み出す
    請求項に記載の音声処理装置。
JP2000077869A 2000-03-15 2000-03-15 音声処理装置 Expired - Fee Related JP3613389B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000077869A JP3613389B2 (ja) 2000-03-15 2000-03-15 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000077869A JP3613389B2 (ja) 2000-03-15 2000-03-15 音声処理装置

Publications (2)

Publication Number Publication Date
JP2001265377A JP2001265377A (ja) 2001-09-28
JP3613389B2 true JP3613389B2 (ja) 2005-01-26

Family

ID=18595357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000077869A Expired - Fee Related JP3613389B2 (ja) 2000-03-15 2000-03-15 音声処理装置

Country Status (1)

Country Link
JP (1) JP3613389B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6883351B2 (ja) * 2019-12-24 2021-06-09 株式会社ユピテル 装置及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5920000A (ja) * 1982-07-26 1984-02-01 トヨタ自動車株式会社 車両用音声認識装置
JP2559031B2 (ja) * 1986-09-01 1996-11-27 富士通株式会社 音声認識方式
JPH08187368A (ja) * 1994-05-13 1996-07-23 Matsushita Electric Ind Co Ltd ゲーム装置、入力装置、音声選択装置、音声認識装置及び音声反応装置
JPH08115386A (ja) * 1994-10-19 1996-05-07 Hitachi Ltd パターン認識装置
JP3337588B2 (ja) * 1995-03-31 2002-10-21 松下電器産業株式会社 音声応答装置
JPH08335094A (ja) * 1995-06-08 1996-12-17 Nippon Telegr & Teleph Corp <Ntt> 音声入力方法およびこの方法を実施する装置
JPH09160587A (ja) * 1995-12-05 1997-06-20 Fujitsu Ltd 入力データ認識システム
JPH10179941A (ja) * 1996-10-21 1998-07-07 Junji Kuwabara 音声認識および音声発生装置、および、該音声認識および音声発生装置を備えた玩具、ならびに、音声認識および音声発生制御プログラムを記録した記録媒体
JPH11164966A (ja) * 1997-12-05 1999-06-22 Enix Corp 携帯用電子機器装置
JP3156964B2 (ja) * 1998-06-19 2001-04-16 株式会社エス・エヌ・ケイ ゲーム装置
JPH11347253A (ja) * 1999-05-06 1999-12-21 Snk:Kk 健康機器

Also Published As

Publication number Publication date
JP2001265377A (ja) 2001-09-28

Similar Documents

Publication Publication Date Title
US6641454B2 (en) Interactive talking dolls
TW586056B (en) Robot control device, robot control method, and recording medium
US7379871B2 (en) Speech synthesizing apparatus, speech synthesizing method, and recording medium using a plurality of substitute dictionaries corresponding to pre-programmed personality information
JP3273550B2 (ja) 自動応答玩具
JP2003255991A (ja) 対話制御システム、対話制御方法及びロボット装置
EP1256931A1 (en) Method and apparatus for voice synthesis and robot apparatus
JPH096390A (ja) 音声認識対話処理方法および音声認識対話装置
JP2005342862A (ja) ロボット
JP3000999B1 (ja) 音声認識方法および音声認識装置ならびに音声認識処理プログラムを記録した記録媒体
WO2004084183A1 (ja) 音声対話装置及び方法並びにロボット装置
JP2002169590A (ja) 模擬会話システム、模擬会話方法、および情報記憶媒体
JP3613389B2 (ja) 音声処理装置
JP3613388B2 (ja) 音声処理装置
WO1999032203A1 (en) A standalone interactive toy
JP3612687B2 (ja) 音声処理装置
JP2002123289A (ja) 音声対話装置
JP3485517B2 (ja) 擬似生物玩具
JP3485516B2 (ja) 音声出力玩具
JP2001265364A (ja) 音声処理装置
JP2001264466A (ja) 音声処理装置
JP2004301942A (ja) 音声認識装置、会話装置およびロボット玩具
JP2004024867A (ja) 音声対話玩具
JP2015231456A (ja) しりとり玩具
CN112802474A (zh) 语音识别方法、装置、设备及存储介质
JP3001000B1 (ja) 音声認識装置における連続単語認識方法および音声認識装置における連続単語認識処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041020

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees