JP3179370B2 - おしゃべりオウム発声装置 - Google Patents

おしゃべりオウム発声装置

Info

Publication number
JP3179370B2
JP3179370B2 JP16883797A JP16883797A JP3179370B2 JP 3179370 B2 JP3179370 B2 JP 3179370B2 JP 16883797 A JP16883797 A JP 16883797A JP 16883797 A JP16883797 A JP 16883797A JP 3179370 B2 JP3179370 B2 JP 3179370B2
Authority
JP
Japan
Prior art keywords
response
text
attribute
voice
parrot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP16883797A
Other languages
English (en)
Other versions
JPH119847A (ja
Inventor
勝廣 前田
裕子 空
Original Assignee
神戸日本電気ソフトウェア株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 神戸日本電気ソフトウェア株式会社 filed Critical 神戸日本電気ソフトウェア株式会社
Priority to JP16883797A priority Critical patent/JP3179370B2/ja
Publication of JPH119847A publication Critical patent/JPH119847A/ja
Application granted granted Critical
Publication of JP3179370B2 publication Critical patent/JP3179370B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Toys (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、玩具に組込まれ
る音声応答装置に関し、特に呼びかけに応じて、種種の
応答を発声するおしゃべりオウム発声装置に関する。
【0002】
【従来の技術】従来の玩具に組込まれている音声応答装
置のおしゃべりオウム発声装置は、話者の発声した言葉
を録音しておき、呼びかけると同じ言葉を再生して応答
していた。しかしながら、このようなおしゃべりオウム
発声装置は常に同じ応答で、「しゃべっている」という
感じでなく、あくまでも「繰り返している」という感じ
しか得られない。
【0003】
【発明が解決しようとする課題】呼びかけに対する応答
を、あたかもオウムに対するときのように応答させる。
そこで、呼びかけの言葉をそのまま応答する、あるいは
呼びかけの言葉を異なるイントネーションで応答する、
または間違った言葉で応答するなどの作用を音声応答装
置に組込む。また、応答する言葉をあらかじめ設定する
作用も組込んでおき、応答の言葉を変更したり、間違え
させることによりオウムの応答を真似させて玩具として
の特性を付加する。
【0004】
【課題を解決するための手段】そのため、この発明の、
音声による呼びかけに対して、音声によって応答するお
しゃべりオウム発声装置において、呼びかけ音声あるい
は応答音声をテキストに変換する変換手段と、前記テ
ストに対して、前記テキストを登録するかあるいは前記
テキストに応答するかを選択する選択手段と、前記登録
が選択されたとき、前記テキストに基づく呼びかけテキ
ストおよび応答テキストならびに前記呼びかけテキスト
応答属性を組にして、データベースに登録する登録手
段と、前記応答が選択されたとき、前記呼びかけテキス
トとそれの応答属性とを検索キーにして、前記データベ
ースを検索し、前記呼びかけテキストに対する複数の応
答テキストの1つを選択する検索手段と、前記応答テキ
ストを前記応答属性に基づいて音声変換する音声応答手
段と、を有することを特徴とする。
【0005】更に、前記応答属性は、呼びかけテキスト
に対して、前記テキストをそのままのイントネーション
で応答するオウム返し属性と、呼びかけテキストに対し
て、前記テキストを異なるイントネーションで、あるい
は合い言葉で、応答する特定応答属性と、呼びかけテキ
ストに対して、複数の応答テキストの内から発生乱数で
選択されるテキストを応答するランダム応答属性と、を
含むことを特徴とする。
【0006】音声入力された音声信号を音声テキスト化
手段によりテキスト化し、該テキストを呼びかけテキス
トあるいは応答テキストとして、応答属性入力手段(図
1の2)により入力された応答属性を付加して、データ
ベースに登録する。応答時に、呼びかけ音声を音声テキ
スト化手段により、テキスト化した呼びかけテキスト
と、応答属性入力手段からの応答属性とを検索キーとし
て、応答テキストを検索する。検索された応答テキスト
を応答テキスト音声化手段により音声信号に変換し、そ
れを音声出力手段により、音声出力する。応答テキスト
を属性によって選択し、また乱数による間違い応答を選
択させることによって、オウムが「しゃべっている」と
か「対話している」という感じを生じさせる。また、デ
ータベースには応答する言葉を蓄えるデータベース登録
手段によって、オウムのボキャブラリーを変える。
【0007】
【発明の実施の形態】この発明の実施の形態について、
図面を参照して説明する。図1は、この発明の第1の実
施の形態を示すシステムブロック図である。図2は、図
1に示す実施の形態の動作を説明するためのフローチャ
ートである。図3は、図1に示すデータベース7に格納
されるテキストデータの一例を示す図である。図4は、
この発明の他の実施の形態の動作を説明するためのフロ
ーチャートである。
【0008】図1を参照すると、おしゃべりオウム発声
装置1は、登録応答キー入力手段2と、応答属性入力手
段3と、呼びかけ入力手段4と、音声テキスト化(音声
認識)手段5と、データベース登録手段6と、データベ
ース7と、データベース検索手段8と、応答テキスト音
声化手段9と、音声出力手段10とを備える。登録応答
キー入力手段2は、データベース7に応答テキストを登
録するか、あるいは応答テキストを検索して応答する
か、を指示するためのキーである。該キーが押下される
と、押下状態を保って登録指示信号を出力し、キーが押
下されていなければ応答指示信号を出力する。なお、押
下されている状態の時に再度押下すればキー状態が反転
し元にもどる。応答属性入力手段3は、例えば数字キー
などが用いられ、入力された音声データが応答時にどの
ような応答をするかを指示する応答属性信号を出力す
る。応答属性として数字キーが「1」のときには「オウ
ム返し」を、「2」のときには「特定応答」を、「3」
のときには「ランダム応答」、などを指すものとする。
呼びかけ入力手段4は、呼びかけの音声を入力し、該音
声に対応して音声信号を出力する。音声テキスト化手段
5は、入力された音声信号を音声認識して対応した呼び
かけテキストもしくは応答テキストを出力する。データ
ベース登録手段6は、登録応答キー入力手段2から登録
指示信号が供給されているとき、入力された呼びかけテ
キスト,応答テキストおよび応答属性を組にしてデータ
ベース7に登録する。データベース検索手段8は、応答
指示信号が供給されているとき、入力された呼びかけテ
キストおよび応答属性を検索キーとしてデータベース7
に登録されている応答テキストを検索し、応答テキスト
を出力する。応答テキスト音声化手段9は、該出力され
た応答テキストに対応して音声合成を行い音声信号を出
力する。音声出力手段10は、入力された音声信号を音
声として出力する。
【0009】次に図1に示す実施の形態について、図2
を参照して動作を説明する。まず、データベース7に呼
びかけあるいは応答のテキストを登録する場合の動作を
図2および図3を参照して説明する。応答テキストを登
録する場合には、動作ステップ11で、登録応答キー入
力が行われる。これは登録応答キーが押下され、登録を
示すキーの状態に特定されることにより達成される。動
作ステップ12で、応答属性入力が行われる。これは、
数字キーを押下すると、該当数字が応答属性を指す数字
として登録される。動作ステップ13で、呼びかけ音声
入力が行われる。これは、マイクなどで話者が発声する
ことで達成される。動作ステップ14で、音声テキスト
化が行われる。入力された話者音声信号を音声認識して
対応した呼びかけテキストに変換することで達成され
る。動作ステップ15で、応答登録キーのキーチェック
が行われる。ここでは、動作ステップ11で入力された
登録応答キーの状態を判断し、キーの状態が「登録」を
示しているので、動作ステップ16で、応答属性チェッ
クが行われる。これは、動作ステップ12で入力された
応答属性入力のキー値の種類を判断する。応答属性が
「1」ならば以下の動作ステップ17および動作ステッ
プ18を行わず、動作ステップ19に動作が移る。応答
属性が「1」以外ならば以下の動作ステップ17および
動作ステップ18に動作が移る。動作ステップ17で、
応答音声入力が行われる。これは、動作ステップ14と
同様に動作ステップ17で入力された応答音声信号を音
声認識して対応した応答テキストに変換することで達成
される。次に動作ステップ19で、データベース7へ登
録が行われる。該データベース7への登録は、動作ステ
ップ14で得られた呼びかけテキストと、動作ステップ
12で入力された応答属性と、動作ステップ18で得ら
れた応答テキストと、を組にして登録される。
【0010】次に、データベース7に格納された応答テ
キストを利用してこの装置1が発声応答する場合の動作
を説明する。呼びかけに応答する場合には、動作ステッ
プ11で、登録応答キー入力が行われる。これは登録応
答キーが押下され、応答を示すキーの状態にあることに
より達成される。次に動作ステップ12で、応答属性入
力が行われる。これは、応答属性入力手段3で数字キー
が押下されることで達成される。次に動作ステップ14
で、呼びかけ音声のテキスト化が行われる。これは、動
作ステップ13で、入力された呼びかけ音声信号を音声
認識して呼びかけテキストに変換することで達成され
る。次に動作ステップ15で、キーチェックが行われ
る。ここでは、動作ステップ11で、入力された登録応
答キーの状態を判断し、キーの状態が「応答」を示して
いるので動作ステップ21で、動作ステップ14で、テ
キスト化された呼びかけテキストを第1の検索キーと
し、動作ステップ12で入力された応答属性を第2の検
索キーとしてデータベース7を検索する。検索結果の応
答テキストを動作ステップ22で音声信号に音声合成
し、動作ステップ23で出力する。この第1の実施の形
態では、応答テキストを音声合成技術を用いて単に音声
信号として変換してスピーカなどの音声出力手段10に
出力する例について説明したが、この応答をより自然な
発声あるいは、あたかもオウムがしゃべっているような
感じで出力することもできる。また、この第1の実施の
形態では、テキストをデータベース7に格納する例を示
したが、データベース7の具体例としてRAMやROM
を用いてもよい。
【0011】第2の実施の形態の動作を示す図4を参照
して説明する。図4に示す実施の形態の動作はデータベ
ース7の具体例としてROM44を用いた場合の例であ
る。このROM44には、図3に示すデータベース7に
呼びかけテキスト71,応答属性72,応答テキスト7
3があらかじめ登録されているものとする。図4に示す
おしゃべりオウム発声装置40は、マイクなどの呼びか
け入力手段43とスイッチなどで構成される応答属性入
力手段42と、スピーカなどの応答音声出力手段45
と、呼びかけテキスト71,応答属性72,応答テキス
ト73を格納するデータベース7を収容するROM44
と、音声応答処理を行うCPU41と、を備える。
【0012】次に、CPU41で行う音声応答処理につ
いて、図4および図3を参照しながら動作を説明する。
今、呼びかけ入力手段43から、音声信号として「オハ
ヨウ」と入力されたとすると、CPU41では動作ステ
ップ411で音声信号として「オハヨウ」が出力され、
動作ステップ412では、音声テキスト化処理が行わ
れ、呼びかけテキストとして「おはよう」が出力され
る。この音声テキスト化処理では、例えば音声信号のフ
ーリエ変換ベクトルのような特徴抽出を行い、抽出され
た特徴とあらかじめ登録された特徴系列と文字列との対
応を示す辞書パターンとの照合により音声信号に対応す
る文字列である呼びかけテキストに変換され出力され
る。動作ステップ413では、この呼びかけテキストを
検索キーとしてROM44に格納されている応答テキス
ト73が検索されるが、このときに第2の検索キーとし
て応答属性が用いられる。この応答属性は、応答属性入
力手段42から供給されるが、応答属性としては、「オ
ウム返し」で応答することを示す「1」,イントネーシ
ョンの変更あるいは「合い言葉」などの特定応答を示す
「2」,または「ランダムに応答」することを示す
「3」などがある。ここで、応答属性として「1」が供
給されていると、ROM44の検索結果の出力として応
答テキストとして「おはよう」が出力される。また応答
属性として「2」が供給されていると、応答テキストと
して「おっはよう」が、応答属性として「3」が供給さ
れていると、「こんにちは」,「こんばんは」,「いま
なんじ」あるいは「どこいくの」などの応答テキスト7
3のうちのいずれかが乱数で選択されて応答テキストと
して出力される。動作ステップ414では、このように
して供給された応答テキストが音声合成などの技術を用
いて音声信号に変換される。この音声合成の方法として
は波形合成方式や規則合成方式などの手法を用いて応答
テキストが示す文字列情報を音声合成するものである。
例えば規則合成方式を適用したテキスト音声化手段にあ
っては、入力文字列情報を分析し、その文字列が示す音
韻情報と韻律情報とを求めてその合成音声を規則合成し
て出力するものである。動作ステップ415では、この
音声信号が応答音声出力手段45に出力され、「オハヨ
ウ」,「オッハヨウ」,「コンニチハ」,「コンバン
ハ」,「イマナンジ」あるいは「ドコイクノ」などが発
声される。またROM44の場合には、事前にテキスト
を登録することができ、この場合には登録動作は不要と
なる。さらに、これに伴って登録応答キーが不要となる
と共にデータベース登録手段も不要である。
【0013】以上の実施の形態の他にも、この発明は種
々の応用や変形が可能であることは言うまでもない。例
えば、応答属性としてランダム応答を利用する場合に
は、呼びかけテキストに応答する応答テキストとして複
数を準備し、このうちの任意の一つを、乱数などを用い
て選択し、画一的な応答テキストが出力されることがな
いようにすることもできる。さらに、この場合応答テキ
ストとして「オウム返し」や、「合い言葉」も選択され
る得るようにすることもできる。また、応答テキストを
乱数を用いて選択する場合に非常に少ない確率で呼びか
けテキストと無関係な間違い応答テキストが出力される
ようにするようにすることもできる。また応答テキスト
を音声化するにあたり、より自然な発声やオウムの発声
とするために、データベースにイントネーションやアク
セントを指定する付加情報を登録しておくこともでき
る。この付加情報は応答テキストの作成時に一対として
作成されることは言うまでもない。なお、付加情報の例
として、種々のものがあげられる。すなわち、ピッチ情
報やピッチパターン,ポーズコード,発声速度指示,休
止挿入位置や時間,音韻継続時間やイントネーションや
アクセントである。
【0014】
【発明の効果】この発明の第一の効果は、玩具の音声応
答として、オウムに呼びかけるときの応答のように応答
が常に一定せず変化させることができることである。そ
の理由はデータベースに呼びかけテキストと応答属性と
応答テキストとを格納しておくことにより、呼びかけに
対して、「オウム返し」や「合い言葉」や「イントネー
ションの異なる応答」や「間違え応答」を発声応答させ
ることができるからである。
【図面の簡単な説明】
【図1】この発明の第1の実施の形態を示すシステムブ
ロック図である。
【図2】図1に示す第1の実施の形態の動作を説明する
ためのフローチャートである。
【図3】図1に示すデータベースに格納されるデータの
一例を示す図である。
【図4】この発明の第2の実施の形態の動作を説明する
ための図である。
【符号の説明】
1 おしゃべりオウム発声装置 2 登録応答キー入力手段 3 応答属性入力手段 4 呼びかけ入力手段 5 音声テキスト化手段 6 データベース登録手段 7 データベース 8 データベース検索手段 9 応答テキスト音声化手段 10 音声出力手段
フロントページの続き (56)参考文献 特開 昭60−55984(JP,A) 特開 昭61−167997(JP,A) 特開 昭64−15084(JP,A) 特開 平1−106000(JP,A) 実開 平5−82488(JP,U) (58)調査した分野(Int.Cl.7,DB名) A63H 3/33 G06F 3/16 G10L 13/00 G10L 15/00

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声による呼びかけに対して、音声によ
    って応答するおしゃべりオウム発声装置において、 呼びかけ音声あるいは応答音声をテキストに変換する変
    換手段と、 前記テキストに対して、前記テキストを登録するかある
    いは前記テキストに応答するかを選択する選択手段と、 前記登録が選択されたとき、前記テキストに基づく呼び
    かけテキストおよび応答テキストならびに前記呼びかけ
    テキスト応答属性を組にして、データベースに登録す
    る登録手段と、 前記応答が選択されたとき、前記呼びかけテキストとそ
    れの応答属性とを検索キーにして、前記データベースを
    検索し、前記呼びかけに対する複数の応答テキストの1
    つを選択する検索手段と、 前記応答テキストを前記応答属性に基づいて、音声変換
    する音声応答手段と、を有することを特徴とするおしゃ
    べりオウム発声装置。
  2. 【請求項2】 前記応答属性は、 呼びかけテキストに対して、前記テキストをそのままの
    イントネーションで応答するオウム返し属性と、 呼びかけテキストに対して、前記テキストを異なるイン
    トネーションで、あるいは合い言葉で、応答する特定応
    答属性と、 呼びかけテキストに対して、複数の応答テキストの内か
    ら発生乱数で選択されるテキストを応答するランダム応
    答属性と、 を含むことを特徴とする請求項1記載のおしゃべりオウ
    ム装置。
JP16883797A 1997-06-25 1997-06-25 おしゃべりオウム発声装置 Expired - Fee Related JP3179370B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16883797A JP3179370B2 (ja) 1997-06-25 1997-06-25 おしゃべりオウム発声装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16883797A JP3179370B2 (ja) 1997-06-25 1997-06-25 おしゃべりオウム発声装置

Publications (2)

Publication Number Publication Date
JPH119847A JPH119847A (ja) 1999-01-19
JP3179370B2 true JP3179370B2 (ja) 2001-06-25

Family

ID=15875451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16883797A Expired - Fee Related JP3179370B2 (ja) 1997-06-25 1997-06-25 おしゃべりオウム発声装置

Country Status (1)

Country Link
JP (1) JP3179370B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125900A (ja) 1999-10-29 2001-05-11 Yazaki Corp 対話システム及び対話方法、双方向対話システム及び双方向対話方法並びに記録媒体
JP3574632B2 (ja) * 2001-07-09 2004-10-06 憲三 岩間 単語学習ロボット、移動物体の学習動作制御装置およびその方法
JP5404781B2 (ja) * 2008-07-18 2014-02-05 ハイドレイ リミテッド 対話式玩具
TWI396581B (zh) * 2009-12-10 2013-05-21 Compal Communications Inc 機器娃娃隨機對答系統及其方法
CN108326847B (zh) * 2017-12-19 2020-12-18 北京可以科技有限公司 模块化机器人的校正方法、校正系统及控制方法

Also Published As

Publication number Publication date
JPH119847A (ja) 1999-01-19

Similar Documents

Publication Publication Date Title
JP3968133B2 (ja) 音声認識対話処理方法および音声認識対話装置
US5946658A (en) Cartridge-based, interactive speech recognition method with a response creation capability
US6792406B1 (en) Information processing apparatus, portable device, electronic pet apparatus recording medium storing information processing procedures and information processing method
EP1267326B1 (en) Artificial language generation
EP0974141B1 (en) Extensible speech recognition system that provides a user with audio feedback
JP3282075B2 (ja) 連続音声認識において句読点を自動的に生成する装置および方法
EP1217609A2 (en) Speech recognition
US6975986B2 (en) Voice spelling in an audio-only interface
JPH10507536A (ja) 言語認識
WO2000058943A1 (fr) Systeme et procede de synthese de la parole
JP2002304190A (ja) 発音変化形生成方法及び音声認識方法
JP2002169590A (ja) 模擬会話システム、模擬会話方法、および情報記憶媒体
US20020198712A1 (en) Artificial language generation and evaluation
US20040019488A1 (en) Email address recognition using personal information
KR100467590B1 (ko) 발음 사전 갱신 장치 및 방법
JP3179370B2 (ja) おしゃべりオウム発声装置
CN113192484B (zh) 基于文本生成音频的方法、设备和存储介质
JP3576066B2 (ja) 音声合成システム、および音声合成方法
JP2820093B2 (ja) 単音節認識装置
JP2003099089A (ja) 音声認識・合成装置および方法
JP4859642B2 (ja) 音声情報管理装置
JP2007535692A (ja) 任意に話されたキャラクタのコンピュータによる認識及び解釈のためのシステム及び方法
JP2980382B2 (ja) 話者適応音声認識方法および装置
JP2001175275A (ja) サブワード音響モデル生成方法および音声認識装置
JP2001067096A (ja) 音声認識結果評価装置および記録媒体

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010313

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080413

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090413

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100413

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees