JPH119847A - おしゃべりオウム発声装置 - Google Patents
おしゃべりオウム発声装置Info
- Publication number
- JPH119847A JPH119847A JP9168837A JP16883797A JPH119847A JP H119847 A JPH119847 A JP H119847A JP 9168837 A JP9168837 A JP 9168837A JP 16883797 A JP16883797 A JP 16883797A JP H119847 A JPH119847 A JP H119847A
- Authority
- JP
- Japan
- Prior art keywords
- response
- text
- attribute
- voice
- talking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Toys (AREA)
Abstract
の言葉を返したり、誤った言葉を返したりすることによ
って、オウムが応答しているような感じを得る装置にあ
る。 【解決手段】 登録応答キーを入力する登録応答キー入
力手段2と、応答属性を入力する応答属性入力手段3
と、呼びかけを入力する呼びかけ入力手段4と、音声信
号をテキスト化する音声テキスト化手段5と、呼びかけ
テキストと応答属性と応答テキストをデータベース7に
格納するデータベース登録手段6と、呼びかけテキスト
と応答属性を検索キーとしてデータベース7を検索し応
答テキストを出力するデータベース検索手段8と、応答
テキストを音声信号にする応答テキスト音声化手段9
と、音声を出力する音声出力手段10と、を備える。
Description
る音声応答装置に関し、特に呼びかけに応じて、種種の
応答を発声するおしゃべりオウム発声装置に関する。
置のおしゃべりオウム発声装置は、話者の発声した言葉
を録音しておき、呼びかけると同じ言葉を再生して応答
していた。しかしながら、このようなおしゃべりオウム
発声装置は常に同じ応答で、「しゃべっている」という
感じでなく、あくまでも「繰り返している」という感じ
しか得られない。
を、あたかもオウムに対するときのように応答させる。
そこで、呼びかけの言葉をそのまま応答する、あるいは
呼びかけの言葉を異なるイントネーションで応答する、
または間違った言葉で応答するなどの作用を音声応答装
置に組込む。また、応答する言葉をあらかじめ設定する
作用も組込んでおき、応答の言葉を変更したり、間違え
させることによりオウムの応答を真似させて玩具として
の特性を付加する。
音声による呼びかけに対して、音声によって応答するお
しゃべりオウム発声装置において、呼びかけ音声あるい
は応答音声をテキストに変換する変換手段と、前記変換
したテキストに対して、前記テキストを登録するかある
いは前記テキストに応答するかを選択する選択手段と、
前記登録が選択されたとき、前記テキストに基づく呼び
かけテキストおよび応答テキストならびに前記呼びかけ
テキストに対する応答属性を組にして、データベースに
登録する登録手段と、前記応答が選択されたとき、前記
呼びかけテキストとそれの応答属性とを検索キーにし
て、前記データベースを検索し、複数の応答テキストの
1つを選択する検索手段と、前記応答テキストを音声変
換する音声応答手段と、を有することを特徴とする。
に対して、前記テキストをそのままのイントネーション
で応答するオウム返し属性と、呼びかけテキストに対し
て、前記テキストを異なるイントネーションで、あるい
は合い言葉で、応答する特定応答属性と、呼びかけテキ
ストに対して、複数の応答テキストの内から発生乱数で
選択されるテキストを応答するランダム応答属性と、を
含むことを特徴とする。
手段によりテキスト化し、該テキストを呼びかけテキス
トあるいは応答テキストとして、応答属性入力手段(図
1の2)により入力された応答属性を付加して、データ
ベースに登録する。応答時に、呼びかけ音声を音声テキ
スト化手段により、テキスト化した呼びかけテキストな
らびに応答属性入力手段からの応答属性とを検索キーと
して、応答テキストを検索する。検索された応答テキス
トを応答テキスト音声化手段により音声信号に変換し、
それを音声出力手段により、音声出力する。応答テキス
トを属性によって選択し、また乱数による間違い応答を
選択させることによって、オウムが「しゃべっている」
とか「対話している」という感じを生じさせる。また、
データベースには応答する言葉を蓄えるデータベース登
録手段によって、オウムのボキャブラリーを変える。
図面を参照して説明する。図1は、この発明の第1の実
施の形態を示すシステムブロック図である。図2は、図
1に示す実施の形態の動作を説明するためのフローチャ
ートである。図3は、図1に示すデータベース7に格納
されるテキストデータの一例を示す図である。図4は、
この発明の他の実施の形態の動作を説明するためのフロ
ーチャートである。
装置1は、登録応答キー入力手段2と、応答属性入力手
段3と、呼びかけ入力手段4と、音声テキスト化(音声
認識)手段5と、データベース登録手段6と、データベ
ース7と、データベース検索手段8と、応答テキスト音
声化手段9と、音声出力手段10とを備える。登録応答
キー入力手段2は、データベース7に応答テキストを登
録するか、あるいは応答テキストを検索して応答する
か、を指示するためのキーである。該キーが押下される
と、押下状態を保って登録指示信号を出力し、キーが押
下されていなければ応答指示信号を出力する。なお、押
下されている状態の時に再度押下すればキー状態が反転
し元にもどる。応答属性入力手段3は、例えば数字キー
などが用いられ、入力された音声データが応答時にどの
ような応答をするかを指示する応答属性信号を出力す
る。応答属性として数字キーが「1」のときには「オウ
ム返し」を、「2」のときには「特定応答」を、「3」
のときには「ランダム応答」、などを指すものとする。
呼びかけ入力手段4は、呼びかけの音声を入力し、該音
声に対応して音声信号を出力する。音声テキスト化手段
5は、入力された音声信号を音声認識して対応した呼び
かけテキストもしくは応答テキストを出力する。データ
ベース登録手段6は、登録応答キー入力手段2から登録
指示信号が供給されているとき、入力された呼びかけテ
キスト,応答テキストおよび応答属性を組にしてデータ
ベース7に登録する。データベース検索手段8は、応答
指示信号が供給されているとき、入力された呼びかけテ
キストおよび応答属性を検索キーとしてデータベース7
に登録されている応答テキストを検索し、応答テキスト
を出力する。応答テキスト音声化手段9は、該出力され
た応答テキストに対応して音声合成を行い音声信号を出
力する。音声出力手段10は、入力された音声信号を音
声として出力する。
を参照して動作を説明する。まず、データベース7に呼
びかけあるいは応答のテキストを登録する場合の動作を
図2および図3を参照して説明する。応答テキストを登
録する場合には、動作ステップ11で、登録応答キー入
力が行われる。これは登録応答キーが押下され、登録を
示すキーの状態に特定されることにより達成される。動
作ステップ12で、応答属性入力が行われる。これは、
数字キーを押下すると、該当数字が応答属性を指す数字
として登録される。動作ステップ13で、呼びかけ音声
入力が行われる。これは、マイクなどで話者が発声する
ことで達成される。動作ステップ14で、音声テキスト
化が行われる。入力された話者音声信号を音声認識して
対応した呼びかけテキストに変換することで達成され
る。動作ステップ15で、応答登録キーのキーチェック
が行われる。ここでは、動作ステップ11で入力された
登録応答キーの状態を判断し、キーの状態が「登録」を
示しているので、動作ステップ16で、応答属性チェッ
クが行われる。これは、動作ステップ12で入力された
応答属性入力のキー値の種類を判断する。応答属性が
「1」ならば以下の動作ステップ17および動作ステッ
プ18を行わず、動作ステップ19に動作が移る。応答
属性が「1」以外ならば以下の動作ステップ17および
動作ステップ18に動作が移る。動作ステップ17で、
応答音声入力が行われる。これは、動作ステップ14と
同様に動作ステップ17で入力された応答音声信号を音
声認識して対応した応答テキストに変換することで達成
される。次に動作ステップ19で、データベース7へ登
録が行われる。該データベース7への登録は、動作ステ
ップ14で得られた呼びかけテキストと、動作ステップ
12で入力された応答属性と、動作ステップ18で得ら
れた応答テキストと、を組にして登録される。
キストを利用してこの装置1が発声応答する場合の動作
を説明する。呼びかけに応答する場合には、動作ステッ
プ11で、登録応答キー入力が行われる。これは登録応
答キーが押下され、応答を示すキーの状態にあることに
より達成される。次に動作ステップ12で、応答属性入
力が行われる。これは、応答属性入力手段3で数字キー
が押下されることで達成される。次に動作ステップ14
で、呼びかけ音声のテキスト化が行われる。これは、動
作ステップ13で、入力された呼びかけ音声信号を音声
認識して呼びかけテキストに変換することで達成され
る。次に動作ステップ15で、キーチェックが行われ
る。ここでは、動作ステップ11で、入力された登録応
答キーの状態を判断し、キーの状態が「応答」を示して
いるので動作ステップ21で、動作ステップ14で、テ
キスト化された呼びかけテキストを第1の検索キーと
し、動作ステップ12で入力された応答属性を第2の検
索キーとしてデータベース7を検索する。検索結果の応
答テキストを動作ステップ22で音声信号に音声合成
し、動作ステップ23で出力する。この第1の実施の形
態では、応答テキストを音声合成技術を用いて単に音声
信号として変換してスピーカなどの音声出力手段10に
出力する例について説明したが、この応答をより自然な
発声あるいは、あたかもオウムがしゃべっているような
感じで出力することもできる。また、この第1の実施の
形態では、テキストをデータベース7に格納する例を示
したが、データベース7の具体例としてRAMやROM
を用いてもよい。
して説明する。図4に示す実施の形態の動作はデータベ
ース7の具体例としてROM44を用いた場合の例であ
る。このROM44には、図3に示すデータベース7に
呼びかけテキスト71,応答属性72,応答テキスト7
3があらかじめ登録されているものとする。図4に示す
おしゃべりオウム発声装置40は、マイクなどの呼びか
け入力手段43とスイッチなどで構成される応答属性入
力手段42と、スピーカなどの応答音声出力手段45
と、呼びかけテキスト71,応答属性72,応答テキス
ト73を格納するデータベース7を収容するROM44
と、音声応答処理を行うCPU41と、を備える。
いて、図4および図3を参照しながら動作を説明する。
今、呼びかけ入力手段43から、音声信号として「オハ
ヨウ」と入力されたとすると、CPU41では動作ステ
ップ411で音声信号として「オハヨウ」が出力され、
動作ステップ412では、音声テキスト化処理が行わ
れ、呼びかけテキストとして「おはよう」が出力され
る。この音声テキスト化処理では、例えば音声信号のフ
ーリエ変換ベクトルのような特徴抽出を行い、抽出され
た特徴とあらかじめ登録された特徴系列と文字列との対
応を示す辞書パターンとの照合により音声信号に対応す
る文字列である呼びかけテキストに変換され出力され
る。動作ステップ413では、この呼びかけテキストを
検索キーとしてROM44に格納されている応答テキス
ト73が検索されるが、このときに第2の検索キーとし
て応答属性が用いられる。この応答属性は、応答属性入
力手段42から供給されるが、応答属性としては、「オ
ウム返し」で応答することを示す「1」,イントネーシ
ョンの変更あるいは「合い言葉」などの特定応答を示す
「2」,または「ランダムに応答」することを示す
「3」などがある。ここで、応答属性として「1」が供
給されていると、ROM44の検索結果の出力として応
答テキストとして「おはよう」が出力される。また応答
属性として「2」が供給されていると、応答テキストと
して「おっはよう」が、応答属性として「3」が供給さ
れていると、「こんにちは」,「こんばんは」,「いま
なんじ」あるいは「どこいくの」などの応答テキスト7
3のうちのいずれかが乱数で選択されて応答テキストと
して出力される。動作ステップ414では、このように
して供給された応答テキストが音声合成などの技術を用
いて音声信号に変換される。この音声合成の方法として
は波形合成方式や規則合成方式などの手法を用いて応答
テキストが示す文字列情報を音声合成するものである。
例えば規則合成方式を適用したテキスト音声化手段にあ
っては、入力文字列情報を分析し、その文字列が示す音
韻情報と韻律情報とを求めてその合成音声を規則合成し
て出力するものである。動作ステップ415では、この
音声信号が応答音声出力手段45に出力され、「オハヨ
ウ」,「オッハヨウ」,「コンニチハ」,「コンバン
ハ」,「イマナンジ」あるいは「ドコイクノ」などが発
声される。またROM44の場合には、事前にテキスト
を登録することができ、この場合には登録動作は不要と
なる。さらに、これに伴って登録応答キーが不要となる
と共にデータベース登録手段も不要である。
々の応用や変形が可能であることは言うまでもない。例
えば、応答属性としてランダム応答を利用する場合に
は、呼びかけテキストに応答する応答テキストとして複
数を準備し、このうちの任意の一つを、乱数などを用い
て選択し、画一的な応答テキストが出力されることがな
いようにすることもできる。さらに、この場合応答テキ
ストとして「オウム返し」や、「合い言葉」も選択され
る得るようにすることもできる。また、応答テキストを
乱数を用いて選択する場合に非常に少ない確率で呼びか
けテキストと無関係な間違い応答テキストが出力される
ようにするようにすることもできる。また応答テキスト
を音声化するにあたり、より自然な発声やオウムの発声
とするために、データベースにイントネーションやアク
セントを指定する付加情報を登録しておくこともでき
る。この付加情報は応答テキストの作成時に一対として
作成されることは言うまでもない。なお、付加情報の例
として、種々のものがあげられる。すなわち、ピッチ情
報やピッチパターン,ポーズコード,発声速度指示,休
止挿入位置や時間,音韻継続時間やイントネーションや
アクセントである。
答として、オウムに呼びかけるときの応答のように応答
が常に一定せず変化させることができることである。そ
の理由はデータベースに呼びかけテキストと応答属性と
応答テキストとを格納しておくことにより、呼びかけに
対して、「オウム返し」や「合い言葉」や「イントネー
ションの異なる応答」や「間違え応答」を発声応答させ
ることができるからである。
ロック図である。
ためのフローチャートである。
一例を示す図である。
ための図である。
Claims (2)
- 【請求項1】 音声による呼びかけに対して、音声によ
って応答するおしゃべりオウム発声装置において、 呼びかけ音声あるいは応答音声をテキストに変換する変
換手段と、 前記変換したテキストに対して、前記テキストを登録す
るかあるいは前記テキストに応答するかを選択する選択
手段と、 前記登録が選択されたとき、前記テキストに基づく呼び
かけテキストおよび応答テキストならびに前記呼びかけ
テキストに対する応答属性を組にして、データベースに
登録する登録手段と、 前記応答が選択されたとき、前記呼びかけテキストとそ
れの応答属性とを検索キーにして、前記データベースを
検索し、複数の応答テキストの1つを選択する検索手段
と、 前記応答テキストを音声変換する音声応答手段と、 を有することを特徴とするおしゃべりオウム発声装置。 - 【請求項2】 前記応答属性は、 呼びかけテキストに対して、前記テキストをそのままの
イントネーションで応答するオウム返し属性と、 呼びかけテキストに対して、前記テキストを異なるイン
トネーションで、あるいは合い言葉で、応答する特定応
答属性と、 呼びかけテキストに対して、複数の応答テキストの内か
ら発生乱数で選択されるテキストを応答するランダム応
答属性と、 を含むことを特徴とする請求項1記載のおしゃべりオウ
ム装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16883797A JP3179370B2 (ja) | 1997-06-25 | 1997-06-25 | おしゃべりオウム発声装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16883797A JP3179370B2 (ja) | 1997-06-25 | 1997-06-25 | おしゃべりオウム発声装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH119847A true JPH119847A (ja) | 1999-01-19 |
JP3179370B2 JP3179370B2 (ja) | 2001-06-25 |
Family
ID=15875451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16883797A Expired - Fee Related JP3179370B2 (ja) | 1997-06-25 | 1997-06-25 | おしゃべりオウム発声装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3179370B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003022131A (ja) * | 2001-07-09 | 2003-01-24 | Kenzo Iwama | 単語学習ロボット、移動物体の学習動作制御装置およびその方法 |
US7127398B1 (en) | 1999-10-29 | 2006-10-24 | Adin Research, Inc. | Interactive system, interactive method, two-way interactive system, two-way interactive method and recording medium |
TWI396581B (zh) * | 2009-12-10 | 2013-05-21 | Compal Communications Inc | 機器娃娃隨機對答系統及其方法 |
JP2014028284A (ja) * | 2008-07-18 | 2014-02-13 | Hydrae Ltd | 対話式玩具 |
WO2019120152A1 (zh) * | 2017-12-19 | 2019-06-27 | 北京可以科技有限公司 | 构建模块化机器人的校正方法及系统和模块化机器人的控制方法 |
-
1997
- 1997-06-25 JP JP16883797A patent/JP3179370B2/ja not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7127398B1 (en) | 1999-10-29 | 2006-10-24 | Adin Research, Inc. | Interactive system, interactive method, two-way interactive system, two-way interactive method and recording medium |
JP2003022131A (ja) * | 2001-07-09 | 2003-01-24 | Kenzo Iwama | 単語学習ロボット、移動物体の学習動作制御装置およびその方法 |
JP2014028284A (ja) * | 2008-07-18 | 2014-02-13 | Hydrae Ltd | 対話式玩具 |
TWI396581B (zh) * | 2009-12-10 | 2013-05-21 | Compal Communications Inc | 機器娃娃隨機對答系統及其方法 |
WO2019120152A1 (zh) * | 2017-12-19 | 2019-06-27 | 北京可以科技有限公司 | 构建模块化机器人的校正方法及系统和模块化机器人的控制方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3179370B2 (ja) | 2001-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3968133B2 (ja) | 音声認識対話処理方法および音声認識対話装置 | |
US11594215B2 (en) | Contextual voice user interface | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
KR100383353B1 (ko) | 음성인식장치및음성인식장치용어휘발생방법 | |
US20080126093A1 (en) | Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System | |
WO2000058943A1 (fr) | Systeme et procede de synthese de la parole | |
JPH0916602A (ja) | 翻訳装置および翻訳方法 | |
JP2002511154A (ja) | ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム | |
JP2002304190A (ja) | 発音変化形生成方法及び音声認識方法 | |
US11798559B2 (en) | Voice-controlled communication requests and responses | |
US10143027B1 (en) | Device selection for routing of communications | |
KR100467590B1 (ko) | 발음 사전 갱신 장치 및 방법 | |
JP3179370B2 (ja) | おしゃべりオウム発声装置 | |
JP2003163951A (ja) | 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法 | |
US10854196B1 (en) | Functional prerequisites and acknowledgments | |
CN113192484B (zh) | 基于文本生成音频的方法、设备和存储介质 | |
US11172527B2 (en) | Routing of communications to a device | |
JP3576066B2 (ja) | 音声合成システム、および音声合成方法 | |
JP2820093B2 (ja) | 単音節認識装置 | |
JP4859642B2 (ja) | 音声情報管理装置 | |
JP2003099089A (ja) | 音声認識・合成装置および方法 | |
JP2001067096A (ja) | 音声認識結果評価装置および記録媒体 | |
JPH06337700A (ja) | 音声合成装置 | |
JP2001175275A (ja) | サブワード音響モデル生成方法および音声認識装置 | |
KR20010035173A (ko) | 음성 합성 훈련 툴킷을 이용한 개인용 음성 합성기 및 그방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010313 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080413 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090413 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100413 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |