JPH08266747A - 音声認識装置、反応装置、反応選択装置及びこれらを用いた反応玩具 - Google Patents

音声認識装置、反応装置、反応選択装置及びこれらを用いた反応玩具

Info

Publication number
JPH08266747A
JPH08266747A JP7112265A JP11226595A JPH08266747A JP H08266747 A JPH08266747 A JP H08266747A JP 7112265 A JP7112265 A JP 7112265A JP 11226595 A JP11226595 A JP 11226595A JP H08266747 A JPH08266747 A JP H08266747A
Authority
JP
Japan
Prior art keywords
voice
input
reaction
output
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7112265A
Other languages
English (en)
Other versions
JP3337588B2 (ja
Inventor
Kazuhiro Kayashima
一弘 萱嶋
Yoshihiko Matsukawa
善彦 松川
Kenji Matsui
謙二 松井
Hidetsugu Maekawa
英嗣 前川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11226595A priority Critical patent/JP3337588B2/ja
Priority to EP96105137A priority patent/EP0735521A3/en
Priority to KR1019960009539A priority patent/KR960035427A/ko
Priority to CN96106098A priority patent/CN1140295A/zh
Publication of JPH08266747A publication Critical patent/JPH08266747A/ja
Application granted granted Critical
Publication of JP3337588B2 publication Critical patent/JP3337588B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/09Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Toys (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【目的】音声を用いた直接的なマン・マシンインターフ
ェイスを用い、音声で対話できる玩具を提供する。 【構成】ヘリウムガス等が注入された反重力手段210
1と、1つまたは複数の糸2102の引き出しを行う糸
駆動手段2104と、この糸2102と前記反重力手段
2101の一部分が接続されており、その糸駆動手段2
104により前記反重力手段2101の変形・移動・動
作等の機械的反応をさせることを特徴とする玩具。

Description

【発明の詳細な説明】
【産業上の利用分野】本発明は音声反応装置に関するも
のである。
【従来の技術】従来、ヘリウムガスを注入した風船にプ
ロペラ付きモーターとそれを駆動する駆動装置及び無線
受信器を備え、手元の無線送信器付きリモートコントロ
ーラーのスティックを人が操作することによって風船を
前後左右上下に動かせるものがあった。
【発明が解決しようとする課題】しかし、リモートコン
トローラーのスティックによる操作であるため、風船を
非生物的にとらえてしまい、風船独特の暖かみが薄れる
という問題があった。
【課題を解決するための手段】そこで、以下のような手
段を用いて上記の問題を解決する。一つの入力に対して
複数の音声の中から乱数によってある音声選択・出力す
る音声選択装置と、複数のマイクを備えこれらのマイク
のうち入力された音のエネルギーが最大となるマイクの
方向を検出された方向とする方向検出装置と、方位計を
備え入力とその方位計の示す方向により次に移動する方
向を決定する方向選択装置と、音声認識装置とを備え
る。又、本発明は、発声音声を含む音を一定時間循環的
に貯める循環メモリーと、その音の終了点を検出する音
声終了点検出装置と、前記循環メモリーの中から前記終
了点までの発声音声部分を切り出す音声検出装置と、音
声のゼロ交差数等の特徴量を抽出する特徴量抽出装置
と、前記音声の発声部分にある音声発声時間を計る音声
時間検出装置とを具備し、登録したい音声の特徴量と音
声発声時間を辞書として予め保存し、前記特徴量抽出装
置を用いて認識したい音声特徴量と、前記音声時間検出
装置を用いて音声発声時間を求め、前記辞書内の音声特
徴量と音声発声時間との距離を求め、最も近い前記辞書
内の音声を認識結果とする音声認識装置である。又、本
発明は、ヘリウムガス等が注入された反重力手段と、1
つまたは複数の糸の引き出しを行う糸駆動手段と、この
糸と前記反重力手段の一部分が接続されており、その糸
駆動手段により前記反重力手段の変形・移動・動作等の
機械的反応をさせることを特徴とする反応装置である。
【作用】音声を音声認識装置によって認識し、音声選択
装置によって各認識結果毎に用意された複数の音声の中
から乱数を用いて出力する。また、認識結果に応じて動
力装置を駆動し、音声の指示に従って移動させる。ある
いは、その認識結果を用いて方向選択装置により次に移
動すべき方向を決定し、動力装置を用いて決定した方向
へ移動する。一方、音声の発声された方向を方向検出装
置を用いて検出し、その方向を用いて方向選択装置によ
り次に移動すべき方向を決定し、動力装置を用いて決定
した方向へ移動する。また、方向検出装置によって検出
された方向を動力装置に入力し、検出された方向へ移動
させる。
【実施例】以下、本発明の実施例について図面を参照し
て説明する。まず,音声選択装置、方向検出装置、方向
選択装置の基本的な装置、そして音声終了点検出装置、
音声検出装置、特徴量抽出装置、音声認識装置の音声の
認識に関する装置について述べ、最後にこれらの組み合
せによる各装置について説明する。音声選択装置102
は、状態sにおける入力x(非負の整数)とn(s)個
の出力音声sp(x,i)(0≦i<n(s))とから
なる入出力状態105と、乱数発生装置101と、入出
力状態メモリ103とを持っている(図1参照)。最初
入出力状態メモリ103には図2の初期状態201が格
納されているとする。ここで、入力xがあった場合、そ
れに対応する出力音声の集合sp(x,i)が選択さ
れ、この中からiを乱数発声装置101r(n(s))
(ただし、0≦r(n(s))<n(s))で決定し、
音声を出力する。この時、状態遷移装置104はその出
力を観測しており、入出力状態メモリを書き変える。例
えば、初期状態201において「元気?」が出力された
場合、入出力状態105を参照して、この出力に対する
状態202に書き変えられる。このようにして、簡単な
対話システムを構築することが可能となる。また、図3
のような簡単な構成にして、一回だけの応答をさせるよ
うにもできる。図4に示したように方向検出装置401
は複数のマイク402を持っている。例えばマイクの個
数が4個の場合、マイクm(i)(0≦i<4)から入
力された音声s(m(i),t)をフレームf(m
(i),j)501(0≦j、例えば、16ms間隔)
に分割する(図5参照)。そして、この分割されたフレ
ーム内の音声のエネルギーe(m(n),j)を求め
る。このエネルギーe(m(n),j)を長さ1(例え
ば長さ100)の循環メモリに順次蓄えていく。そし
て、フレーム毎のエネルギーが求まる度に、それぞれの
マイクについて過去1フレーム分のエネルギーの和を求
め、このエネルギーの和が最大となるものを求める。そ
して、その最大値が予め実験的に定められた閾値The
よりも大きい場合、その最大値を計測したマイクの方向
が、音声が発声された方向とみなし、そのマイク番号i
を出力する。図6のように入力x(xは非負の整数)に
対し、現在の方向からのオフセットをオフセット算出装
置601より求め、方位計602によって計測された方
向にそのオフセットを加えることで、次に移動する方向
を目的方向メモリに格納する。オフセット算出装置60
1というのは入力xに対し、オフセットをテーブルとし
て保持し、入力xがあった時にそれに対応するオフセッ
トを出力するものである。あるいは、図7のように入力
x(xは非負の整数)に対し、絶対的な方向を方向算出
装置701により求め、目的方向メモリ603にその絶
対的な方向を格納する。ここの方向算出装置701もオ
フセット算出装置601と同様、入力xに対する方向の
値をテーブルとして保持することによって実現可能であ
る。上記のように目的とする方向を求めた後、装置全体
が移動していく中で方向を方位計602で順次計測し、
その計測された方向と目的方向メモリ603に記憶され
た方向との差分を出力し、フィードバック制御すること
で目的とする方向に装置全体を移動させることが可能と
なる。次に音声認識に関する装置、すなわち、音声終了
点検出装置、音声検出装置、特徴量抽出装置について述
べる。まずマイクから入力された音声s(t)をフレー
ムf(i)(iは非負の整数、また、フレームの間隔は
例えば16ms)に分割し、このフレーム内のエネルギ
ーをe(i)802とする。(図8参照)ここで、フレ
ーム単位の音声が入力される度に、それから一定期間遡
ったフレームまでのエネルギーの分散を求め、この分散
が予め実験的に求めた閾値Thvを大きい方から小さい
方へ交差した時点を音声終了点とする。ここで一定期間
のフレーム毎のエネルギーから分散を求める方法につい
て述べる。まず、循環メモリを使う方法であるが、フレ
ーム毎に求まるエネルギーを順次、長さ1の循環メモリ
803に格納していく。そして、フレームのエネルギー
が求まる度に、それから一定期間遡ったエネルギーを循
環メモリから参照し、分散を求めることができる。もう
一つは循環メモリを使わない方法である。過去のエネル
ギーの平均m(i−1)と分散v(i−1)を保持し、
新しく求まったエネルギーe(i)と過去のエネルギー
の平均との重みづけした和を新しいエネルギーの平均m
(i)とし、同じく過去の分散v(i−1)と|e
(i)−m(i)|との重みづけ和を新しい分散v
(i)とすることにより、擬似的なエネルギーの分散を
求めることができる。ここで、重みづけには減衰定数α
を用い、次式で示される方法で分散を求める。αとして
は1.02を用いている。
【数1】 このようにすることにより、循環メモリを必要とせず、
メモリの節約につながり、新しいエネルギーが求まる度
に一定期間内のエネルギーの総和を求める等の手間が省
け、処理時間の短縮にもつながる。図10は音声検出方
法の説明図、図11は音声認識装置の構成図である。そ
して、エネルギー用の循環メモリMe803と平滑化エ
ネルギー用の循環メモリMse902を用意し、フレー
ムのエネルギーが求まる度にメモリMeにはそのエネル
ギー802を、メモリMseには平滑化エネルギー90
1を蓄えてゆく。上述した終了点903が求まった時点
で、これらの循環メモリにはエネルギーの履歴が残って
おり、循環メモリの長さを十分な長さ(例えば2秒に相
当する長さ)にしておけば、一単語分のエネルギーは残
されていることになる。そこで、このメモリから音声が
発音された区間を抽出する。この区間を抽出する方法と
は、ある閾値Thを求め、循環メモリMe内のエネルギ
ーを観察した場合に、過去からその閾値を初めて越える
点を音声の始点とし、逆に音声終了点から過去に遡った
時にその閾値を交差する点を音声の終点とし、これら始
点と終点との間を音声が発音された区間とするものであ
る。ここで閾値Thの求め方は、音声終了点が検出され
た時点のメモリMe内のエネルギー最大値max100
1とメモリMse内の平滑化エネルギーの最小値min
1002とを求め、次式で示される値をThとするもの
である。
【数2】 ただし、βとしては0.07程度の値とした。また、平
滑化の方法としては一定ウインドウ内のメディアン値を
採用したが、これに限定されるものではなく平均値でも
かまわない。このように、閾値を求める際に上記の最大
値としてエネルギーを用いたのは、平滑化エネルギーで
あると単語の長さが変動した場合に最大値が大幅に変動
し、それに伴なって閾値も変動し、良好な音声検出がで
きないためである。次に、検出された音声から認識のた
めの特徴量を抽出する。特徴量もエネルギー同様、フレ
ーム毎に求めるものとし、循環メモリに蓄えていくもの
とする。ここで特徴量とは、原信号のゼロ交差数と原信
号の微分信号のゼロ交差数と原信号のエネルギーの対数
をとった物のフレーム間差分の3つ要素からなる特徴量
ベクトルとする。図11は音声認識装置の構成図であ
る。このように音声終了点検出装置1101、音声検出
装置1102、特徴量抽出装置1103を経て得られた
音声の特徴量ベクトルと、事前に登録した音声の特徴量
ベクトルの辞書1105とを距離計算装置1104を用
いて照合し、最もスコアが良かったものを認識結果とし
て出力する。ただし、照合の方法は単純にベクトル間の
ユークリッド距離を取ってもよいし、DPマッチング法
を用いてもよい。ここで、以下で用いる動作装置の説明
をする。この動作装置というのは例えばプロペラ付きの
モーターを3個とこれらのモーターの駆動装置とかなら
なり、次に移動しようとする方向を入力すると、応用装
置全体がその方向へ移動するように3個のモーターを制
御するものである。図12は音声認識装置、音声選択装
置を用いた音声反応装置の構成図である。次に、以上の
装置を用いた応用装置について述べる。上記のような音
声認識装置1201と音声選択装置1202とを組み合
せた音声反応装置1203について述べる。(図12参
照)音声認識装置1201は複数の音声を登録でき、入
力した音声がどの登録音声に近かったかを出力する。こ
の出力として、例えば登録された音声に一意に付けられ
た登録番号を設定する。一方、音声選択装置1202に
はその登録番号に対して複数の音声を登録しておき、あ
る登録番号が入力された時にこれら複数の音声のうちか
らランダムに選択し、出力させる。全体としては、ある
音声を入力するとそれに対応した音声が出力され、しか
も、同じ入力に対してもさまざまな応答をするような装
置となる。例えば、「おはよう」という発声に対し、
「おはよう」と「元気?」という返答音声を用意してお
き、「おはよう」と認識された場合にこれらの返答音声
をランダムに発声させればよい。図13は方向検出装
置、動作装置を用いた音声反応装置の構成図である。二
つ目は方向検出装置1301と動作装置1302とを持
ち、方向検出装置1301によって得られた方向を上記
のような動作装置1302に入力し、装置全体をその方
向へ移動させる音声反応装置1303である。図14は
音声認識装置、方向選択装置、動作装置を用いた音声反
応装置の構成図である。三つ目は音声認識装置1201
と方向選択装置1401と動作装置1302とを持ち、
音声認識装置1201の結果を方向選択装置1401の
入力とし、その出力を動作装置1302の入力とするこ
とによって、現在装置全体が向いている方向と目的とす
る方向を比較しながら装置全体を目的とする方向へ移動
させる音声反応装置1402である。例えば、北を0度
とし東周りを正の方向とすると、装置全体が0度の方向
を向いており、音声認識装置により「右」と認識された
場合、「右」という単語に+90度を対応づけしておけ
ば、装置全体が最終的に向く方向は0+90=90度と
なり、動作装置がこの目的とする方向に移動するように
働く。この時、装置全体が移動するにつれて現在の方向
とその目的とする方向とを比較し、目的とする方向に向
くように動作装置はモーターを制御する。ただし、
「右」とか「左」のような相対的な方向を表す単語では
なく、「北」や「南西」という絶対的な方向を表す単語
であれば、目的とする方向は「北」ならば0度、「南
西」ならば−135度という値になる。ここで、目的と
する方向とは−180〜+180とする。図15は方向
検出装置、方向選択装置、動作装置を用いた音声反応装
置の構成図である。四つ目は方向検出装置1301と方
向選択装置1401と動作装置1302とを持ち、三つ
目の音声反応装置1402と同様、方向検出装置130
1の結果を方向選択装置1401の入力とし、その出力
を動作装置1302の入力とすることによって、現在装
置全体が向いている方向と目的とする方向を比較しなが
ら装置全体をその目的とする方向へ移動させる音声反応
装置1501である。図16は音声認識装置、動作装置
を用いた音声反応装置の構成図である。五つ目は音声認
識装置1201と動作装置1302とを持ち、上記の音
声反応装置1402と同様、音声認識装置1201の結
果を動作装置1302の入力として目的の方向へ装置全
体を移動させる音声反応装置1601である。図17は
遠隔操作が可能な音声反応装置の構成図である。さら
に、以上五つの音声反応装置のうち音声認識装置120
1を含むものは、音声認識装置側に信号送信装置170
1を付加し、それぞれの構成の中で音声認識装置の後段
に来る音声選択装置1202や方向選択装置1401や
動作装置1302に信号受信装置1702を付加し、音
声認識装置のみを手元のリモコンとして遠隔操作するこ
とが可能となる。ここで信号送受信に赤外線や無線を用
いることが可能である。また、上記のような音声反応装
置を風船に取りつけることによって、風船と対話した
り、風船をコントロールすることが可能になり、風船独
特のあたたかみを生かした玩具を作ることが可能とな
る。図18は音声反応装置を用いた玩具の説明図であ
る。上述した音声認識装置と音声選択装置とを備えた音
声反応装置1203を風船に取り付けた物を2つ用意
し、人がこの音声反応装置に話しかけるのではなく、2
つの音声反応装置同士がお互いに対話するように構成す
れば、勝手に対話するような玩具を作ることが可能とな
る。さらに、この音声反応装置付き風船を複数用意し、
対話させることも可能である。この時に、それぞれの音
声反応装置付き風船は音声認識過程でリジェクト機能を
持っていれば、特定の言葉に対してのみ反応することが
可能となり、ある発声に対し一つの風船だけが反応する
ように構成することも可能となる。例えば、それぞれの
風船に名前を付け、その名前を呼んだ時だけ反応させる
ことが可能となる。ここでリジェクトの方法は音声認識
を行う時に内部の辞書と距離を計算するが、実験的に閾
値を決めておき、その閾値を越えたものをリジェクトす
るというものがある。なお、上記の玩具は風船に限定す
るものではなく、ぬいぐるみや人形、あるいは写真や絵
であってもかまわない。また、ディスプレイ中の動画で
あってもよい。図19は、本発明の請求項25にかかる
音声認識装置の一実施例の構成図である。本実施例は、
図11の音声認識装置に循環メモリ1901と音声時間
検出装置1902とが追加された構成となっている。即
ち、循環メモリ1901は、入力した発生音声を含む音
を一定時間循環的記憶するものである。音声時間検出装
置1902は、音声検出装置1102で検出した音声の
時間を検出するものである。但し、辞書1105は、音
声の特徴量に加えて、音声の発音された区間の時間も登
録されている。次に、本実施例の動作について説明す
る。循環メモリ1901は、入力される音を一定期間循
環的に記憶する。音声終了点検出装置1101は、循環
メモリ1901に記憶された音から音声の終了点を検出
する。音声検出装置1102は、音声終了点検出装置1
101が音声の終了点を検出した場合、循環メモリ19
01からその音声が発音された区間を抽出する。音声時
間検出装置1902は、前記音声が発音された区間の長
さに対する音声時間の検出を行う。また、特徴量抽出装
置1103は、検出された音声から認識のための特徴量
を検出する。このようにして得られた音声の特徴量と音
声時間に基づき、辞書1105及び距離計算装置110
4を用いて照合し、最もスコアが良かったものを認識結
果として出力する。なお、本実施例では、得られた音声
の特徴量と音声時間に基づき、辞書1105及び距離計
算装置1104を用いて照合し、最もスコアが良かった
ものを認識結果として出力するとしたが、必ずしもこれ
に限らず、辞書1105に登録されている言葉が音声時
間によりグループ分けされており、認識においては、ま
ず認識しようとする音声の音声時間に基づきグループを
特定し、そのグループの中で特徴量に対するスコアが最
も良かったものを認識結果として出力するとしてもよ
い。図20は、辞書1105に登録されている言葉が、
音声時間に基づきグループ分けされている様子を示す図
である。即ち、AとBは、同じ音声グループに属してい
る。CとDは、同じ音声グループに属しており、AとB
とは違うグループとなる。次に、図21を用いて、他の
発明の反応装置の一実施例を説明する。同図において、
反応装置は、ヘリウムガス等が注入された球形の反重力
手段2101と、1つの細い糸2102の引き出しある
いは巻取りを行う糸駆動手段の一部としてのプーリー2
103と、このプーリー2103を回転駆動するための
モータ2104と、モータ2104の回転力をプーリー
2103に伝達するためのベルト2105を有してい
る。この細い糸2102と反重力手段2101の一部分
が接続されており、プーリー2103及びモータ210
4により反重力手段2101の変形・移動・動作等の機
械的反応をさせる。又、この反応装置は、人間の音声を
検出するマイク2106と、そのマイク2106により
入力された音声を認識し、各部に所定の出力信号を出す
ためのCPUやROMからなる制御回路部2107と、
反応動作の一つとしての音声を出力するためのスピーカ
2108を有している。さらにこの反重力手段2101
の表面には、愉快な表情をした人間の顔が描かれてい
る。又、上記プーリー2103と、モータ2104と、
マイク2106と、制御回路部2107等の部分を収納
するためのボデー2109は、床面に設置できるように
するために底面は平面状になっている。このボデー21
09の上部に孔があいており、糸2102はこの孔を通
して上下する。このように構成された本実施例の動作を
次に説明する。即ち、マイク2106から入力された人
間の音声に応じて、制御回路2107の働きにより、出
力音声をスピーカ2108から出力する。そして、この
出力音声を発生しながら、モータ2104が回転する。
例えば、モータ2104を右回転と左回転を交互に動か
すことにより、反重力手段2101に対して、あたかも
うなずくような動作を行わせることが可能となる。この
とき、モータ2104を回転させ糸2102を解放しき
ると、反重力手段2101はゆっくりふんわりと上昇
し、上昇しきった時間を見計らい、モータ2104を逆
回転させ糸2102を巻取ると反重力手段2101を急
激に下降するなどのおもしろい動きが可能となる。特
に、反重力手段2101のこのような動作は、外界の条
件として、例えば、風等の影響を受けて、予想もしない
よな動きをなす等、極めて人間的なあたたかみをかもし
出すといった効果を発揮する。この効果は、決まりきっ
た機械的な動作では、発揮され得ないものである。尚、
本発明の糸とは、単に狭義の糸ではなく、紐、あるは柔
らかな金属線等、広義の意味での糸である。又、上記実
施例では、反応装置として図21を用いて説明したが、
これに限らず例えば、図27に示すような構成でもよ
い。即ち、靴の形をした一対の固定部2701aと、2
701bがあり、そこから柔軟性を有する紙で作られた
蛇腹状の脚に相当する部分2702a,2702bが上
方に伸びている。そして、これら脚2702a,270
2bの上には、上半身に相当する部分として球形の反重
力手段2703が設けられている。反重力手段の中に
は、ヘリウムガス等が注入されており、下部に細い糸2
705がつながっている。この反重力手段2703の両
側から、腕に相当する部分として、2704a,270
4bが左右斜め下方向に伸びている。固定部2701a
にはマイク、スピーカ、制御回路部等が収納されてい
る。又、固定部2701bにはモータ、プーリー等が収
納されている。上記糸2705の一端は、このプーリー
につなげられている。モータの回転動作によって、反重
力手段2703が、うなずくような動作等をするのは、
上記実施例の場合と本質的にはおなじである。同図は、
両脚が伸びた状態を表している。次に、表を用いて、他
の発明の反応選択装置の一実施例を説明する。反応選択
装置は、入力の集合とそれぞれの入力に対する複数の音
声応答と複数の機械的反応とからなる入出力の状態を複
数有し、一つの入力に対して音声応答と機械的反応を選
択・出力した後に前記複数の入出力の状態のうちの一つ
に状態が遷移され、過去の入出力の履歴により次の入出
力が決定される装置である。又、基本的動作は、図1〜
図3を用いて上記実施例にて説明したことと同様であ
る。次に、上記動作との主な相違点について、下表を参
照しながらその動作を説明する。 ここで、モード0は、おはよう、こんにちはの動作とし
て、ゆっくりした動作を表し、モード1は、元気の動作
として速い動作を表す。又、モード2は、更に速い動作
を表す。例えば、図21に示した反応装置を利用して説
明する。この反応装置にはスマイリーという名前がつけ
られている。即ち、初期状態において、スマイリーに対
して、人間が「元気」と呼びかけると、スマイリーは、
その音声を制御回路に入力して、「元気」という出力音
声を発する。そして、そのときの動作は、モード1で指
定されているので、速い動作をしめすのである。次に、
スマイリーが「元気」と出力した後の、動作について
は、下表に示す入力と、出力音声と、機械反応の関係に
基づいて動作する。 次に、図22を用いて、他の発明の応答玩具の一実施例
を説明する。同図に示すように、本実施例の反応玩具
は、主としてヘリウムガスが注入された上述した反重力
手段(図示省略)と、音声認識装置2201と、これの
認識結果を入力とし音声応答と機械的反応を決定するた
めの上述した反応選択装置2202と、音声応答結果を
発声する音声出力手段2203と、機械的反応結果によ
り反重力手段を駆動するための上述した反応装置220
4等とからなる。同実施例の具体的な応用例としては、
図25に示す通りである。即ち、本体2501は、猫の
形状をしており、内部にはヘリウムガスが注入された反
重力手段である。図22にかかる応答玩具の制御・駆動
装置2502は、本体2501の腹の部分に設けられて
いる。図25に示すように、制御・駆動装置2502か
ら、本体2501の口の部分には口をパクパク動かすた
めの糸Aが、尻尾の部分には尻尾を動かすための糸B
が、そして足の部分には各々の足を動かすための糸C,
D,E,Fがつなげられている。このような構成によ
り、人間が本体2501に対して、話しかけた場合、音
声認識装置2201によって、その音声が認識され、更
に反応選択装置2202によって、例えば、「おはよ
う」という出力音声が選択され、その声が音声出力手段
2203から出力される。その音声出力と共に機械反応
モードに応じて、猫の本体の各部を動かすものである。
図25は本発明の請求項30記載の応答玩具に係る一実
施例を示す図であり、図23は応答玩具にかかる装置に
関する構成図である。即ち、図25に示す猫の本体25
01は、ヘリウムガス等が注入された反重力手段であ
る。図23の応答玩具にかかる装置は、図25の250
2の部分に格納されている。応答玩具に係る装置250
2は、図22の各装置に、接触検知装置2301が追加
された構成となる。接触検知装置2301は、本体25
01の全面あるいは一部に設けられてアルミコート又は
樹脂コートされたタッチセンサーのことである。図24
に示すように、人が反重力手段であるタッチセンサーで
覆われた猫に触れると、その接触が検出される。人が応
答玩具に話かけたり及び/又は触ったりしたときの応答
玩具の応答の一例を以下に示す。 人が応答玩具に対して話しかけた場合が、音声入力の列
に当たる。例えば、音声入力の0が「おはよう」であれ
ば、音声認識装置2201によりその音声が認識され
て、反応選択装置2202により「おはよう」という音
声が選択され、音声出力手段2203から出力される。
その出力と共に音声入力の「おはよう」に対して、反応
装置2202により反応装置に対する機械反応のモード
が選択される。機械反応のモードは猫の所定の部位を動
かす早さ及び/又は大きさである。所定の部位とは、図
25に示すように本実施例では、A,B,C,D,E及
びFのことである。即ち、しっぽを振るときは、Bの糸
が動かされ、口をパクパクさすときはAの糸が動かされ
る。人が応答玩具に対して触れた場合が、接触入力の列
に当たる。例えば、接触入力の0が猫のノド付近であれ
ば、接触検知装置2301によりその部位が検出され、
反応選択装置2202により「ゴロニャーン」という音
声が選択され、音声出力手段2203から出力される。
その出力と共に接触入力に対して、反応装置2202に
より反応装置に対する機械反応のモードが選択される。
この場合は、例えば、猫がしっぽ振る。なお、本実施例
の音声認識装置は、請求項25及び26記載の音声認識
装置であるとしてもよい。また、図26に示すように、
音声認識装置2201に音声検出装置2601とパワー
検出手段2602とを具備させて、入力音声の音声パワ
ーに応じて機械反応のモードを切り換えるようにしても
よい。これにより、大きな声で「コラ」といえば、大き
くしっぽを振っていたのをやめさせて、しっぽをお尻に
はさむ方向に図25のBをひっぱるようにして、より動
物らしさを表現させることが可能となる。
【発明の効果】請求項1記載の入出力の状態を複数用意
し過去の入出力の履歴により入出力の状態を遷移させる
ことにより、簡単な対話をすることが可能となる。ま
た、一つの入力に対し複数の出力を用意することによ
り、一つの入力に対し常に同じ応答ではなく、変化のあ
る応答をさせることが可能となる。請求項4記載の複数
のマイクを持つことにより、エネルギーが最大となるマ
イクを検出することで、音声が発声された方向を検出す
ることが可能となる。請求項5記載の方位計を備えるこ
とにより、装置全体を入力した方向に正確に向かわせる
ことが可能となる。請求項9記載の音声認識装置は、請
求項6記載の音声終了点検出装置によりまず大まかな音
声の終了点を求め、請求項7記載の音声検出装置で自動
的に閾値を求め、音声区間を抽出し、請求項8記載の特
徴量を用いて音声認識をする。ここで、音声検出装置で
循環メモリ内のエネルギーの最大値と平滑化エネルギー
の最小値により閾値を求めているが、これは音声の発声
区間の長短に対応するためである。請求項10記載の音
声反応装置は、音声認識装置と請求項1記載の音声選択
装置を組合せることにより、人が声で話しかけて機械が
それに返答することが可能となり、マン・マシンインタ
ーフェースを構築することが可能となる。請求項11記
載のように方向検出装置と動作装置を組み合わせること
により、音声に反応して装置全体を動作させることが可
能となり、音声に反応する装置を構築することが可能と
なる。請求項12記載のように音声認識装置と方向選択
装置と動作装置を組み合わせることにより、音声の内容
が示す方向に装置全体を正確に移動させることが可能と
なる。請求項13記載のように方向検出装置と方向選択
装置と動作装置を組み合わせることにより、音声の方向
に装置全体を正確に移動させることが可能となる。請求
項14記載のように音声認識装置と動作装置を組み合わ
せることにより、音声の内容が示す方向に装置全体を移
動させることが可能となる。請求項15、16、17記
載の音声反応装置は音声認識装置に信号送信装置、そし
て、それぞれの装置において音声認識装置の後段にくる
装置に信号受信装置を備えることにより、遠隔からの操
作を可能とする。請求項18、19記載のように請求項
10記載の音声反応装置を2個、あるいはそれ以上用意
し向い合わせておけば、自動的に対話をする玩具を構成
することが可能となる。請求項20、21、22、2
3、24記載のように請求項10、11、12、13、
14記載の音声反応装置をそれぞれ風船に付けることに
より、風船独特の暖かみを持ち、しかも話しかけること
が可能な玩具を作れることになる。また、時計を組み込
み、ある時間がくれば適当な音声を出力することによっ
て人間から話かけるのではなく、機械から話しかける装
置を作ることも可能である。請求項25、26は、単語
の時間の長さを考慮するので、より一層音声認識が容易
となる。請求項27〜33は、例えば、糸を用いるの
で、より自然な動きを実現することが出来る。
【図面の簡単な説明】
【図1】音声選択装置の構成図
【図2】音声選択装置における入出力状態
【図3】音声選択装置の構成図
【図4】方向検出装置の構成図
【図5】音声波形とフレームの説明図
【図6】オフセットを入力とした方向選択装置の構成図
【図7】絶対値を入力とした方向選択装置の構成図
【図8】音声波形、エネルギー、循環メモリの説明図
【図9】音声終了点検出方法の説明図
【図10】音声検出方法の説明図
【図11】音声認識装置の構成図
【図12】音声認識装置、音声選択装置を用いた音声反
応装置の構成図
【図13】方向検出装置、動作装置を用いた音声反応装
置の構成図
【図14】音声認識装置、方向選択装置、動作装置を用
いた音声反応装置の構成図
【図15】方向検出装置、方向選択装置、動作装置を用
いた音声反応装置の構成図
【図16】音声認識装置、動作装置を用いた音声反応装
置の構成図
【図17】遠隔操作が可能な音声反応装置の構成図
【図18】音声反応装置を用いた玩具の説明図
【図19】本発明の音声認識装置を示すフローチャート
【図20】単語の時間の長さを示す図面
【図21】本発明の反重力装置の一例を示す応答玩具の
【図22】本発明の反重力装置の一例を示す応答玩具の
機能的構成図
【図23】本発明の反重力装置の接触検知機能を有する
応答玩具の機能的構成図
【図24】本発明の反重力装置の一例を示す応答玩具の
接触検知機能の電気回路図
【図25】本発明の反重力装置の一例を示す猫の応答玩
具の図
【図26】本発明の反重力装置の一例を示す応答玩具の
改良機能図
【図27】本発明の反重力装置の一例を示す応答玩具の
別の例の図
【符号の説明】
101 乱数発生装置 102 音声選択装置 103 入出力状態メモリ 104 状態遷移装置 105 入出力状態 401 方向検出装置 601 オフセット算出装置 602 方位計 603 目的方向メモリ 701 方向算出装置 1101 音声終了点検出装置 1102 音声検出装置 1103 特徴量抽出装置 1104 距離計算装置 1105 辞書 1201 音声認識装置 1202 音声選択装置 1301 方向検出装置 1302 動作装置 1401 方向選択装置 1701 信号送信装置 1702 信号受信装置 1801 風船
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G10L 3/00 551 G10L 3/00 551H 5/02 5/02 J (72)発明者 前川 英嗣 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (33)

    【特許請求の範囲】
  1. 【請求項1】入力の集合とそれぞれの入力に対する複数
    の音声とからなる入出力の状態を複数有し、一つの入力
    に対して音声を選択・出力した後に前記複数の入出力の
    状態のうちの一つに状態が遷移され、過去の入出力の履
    歴により次の入出力が決定されることを特徴とする音声
    選択装置。
  2. 【請求項2】請求項1記載の音声選択装置は、前記入出
    力の状態が一つだけであり、入力があった時に前記複数
    の音声から一つ選択し、出力することを特徴とする音声
    選択装置。
  3. 【請求項3】請求項1記載の複数の音声から一つの音声
    を選択する方法は、乱数を用いることを特徴とする音声
    選択装置。
  4. 【請求項4】複数のマイクを具備し、前記複数のマイク
    のうち入力された音のエネルギーが最大となるマイクの
    方向を検出された方向とする方向検出装置。
  5. 【請求項5】方位計を具備し、装置全体が方向を変えて
    いく途中で、順次目的の方向と前記方位計の示す方向と
    の差分を出力し、前記目的の方向へ正しく向かせること
    を特徴とする方向選択装置。
  6. 【請求項6】音声を入力とし、フレームに分割し、各フ
    レーム毎のエネルギーからなるエネルギー列を求め、前
    記エネルギー列の分散が予め実験的に設定した閾値より
    も小さくなった点を音声の終了点とする音声終了点検出
    装置。
  7. 【請求項7】音声終了点検出装置と一定時間の循環メモ
    リとを具備し、前記循環メモリにはフレーム毎のエネル
    ギーを順次蓄え、前記音声終了検出装置により音声終了
    点が検出されると、前記循環メモリに蓄えられたエネル
    ギー列内の最大値と、前記エネルギー列を平滑化した平
    滑化エネルギー列内の最小値とを求め、前記最大値と前
    記最小値から閾値を導出し、前記エネルギー列を参照し
    前記閾値よりも大きくなる最初の部分と最後の部分の間
    を音声が発声された区間であるとする音声検出装置。
  8. 【請求項8】音声検出装置を具備し、検出された音声の
    各フレーム毎に、原信号のゼロ交差数と、原信号の微分
    信号のゼロ交差数と、原信号エネルギーとをフレームの
    特徴量ベクトルとする特徴量抽出装置。
  9. 【請求項9】請求項6記載の音声終了点検出装置と請求
    項7記載の音声検出装置と請求項8記載の特徴量抽出装
    置とを具備し、前記特徴量抽出装置を用いて予め登録し
    たい音声の特徴量を辞書として保存し、前記特徴量抽出
    装置を用いて認識したい音声の特徴量を求め、前記辞書
    内の特徴量との距離を求め、最も近い前記辞書内の音声
    を認識結果とする音声認識装置。
  10. 【請求項10】音声認識装置と請求項1記載の音声選択
    装置とを具備し、入力した音声に対応して応答すること
    を特徴とする音声反応装置。
  11. 【請求項11】請求項4記載の方向検出装置と動作装置
    とを具備し、前記方向検出装置の結果に応じて動作装置
    を駆動することを特徴とする音声反応装置。
  12. 【請求項12】音声認識装置と請求項5記載の方向選択
    装置と動作装置とを具備し、前記方向選択装置の入力と
    して前記音声認識装置の出力を用い、前記方向選択装置
    の出力に応じて動作装置を駆動することを特徴とする音
    声反応装置。
  13. 【請求項13】請求項4記載の方向検出装置と請求項5
    記載の方向選択装置と動作装置とを具備し、前記方向選
    択装置の入力として前記方向検出装置の出力を用い、前
    記方向選択装置の出力に応じて動作装置を駆動すること
    を特徴とする音声反応装置。
  14. 【請求項14】音声認識装置と動作装置とを具備し、前
    記音声認識装置の出力に応じて動作装置を駆動すること
    を特徴とする音声反応装置。
  15. 【請求項15】請求項10記載の音声認識装置と音声選
    択装置は、前記音声認識装置に信号送信装置を具備し、
    前記音声選択装置に信号受信装置を具備し、遠隔からの
    操作を可能とすることを特徴とする音声反応装置。
  16. 【請求項16】請求項12記載の音声認識装置と方向選
    択装置は、前記音声認識装置に信号送信装置を具備し、
    前記方向選択装置に信号受信装置を具備し、遠隔からの
    操作を可能とすることを特徴とする音声反応装置。
  17. 【請求項17】請求項14記載の音声認識装置と動作装
    置は、前記音声認識装置に信号送信装置を具備し、前記
    動作装置に信号受信装置を具備し、遠隔からの操作を可
    能とすることを特徴とする音声反応装置。
  18. 【請求項18】請求項10記載の音声反応装置2つから
    なり、前記2つの音声反応装置がお互いに対話すること
    を特徴とする玩具。
  19. 【請求項19】請求項10記載の音声反応装置複数個か
    らなり、一つの音声反応装置が出力した音声に対し他の
    音声反応装置の内の一部の音声反応装置が反応して音声
    を出力し、前記複数個の音声反応装置がお互いに対話す
    ることを特徴とする玩具。
  20. 【請求項20】請求項10記載の音声反応装置と風船か
    らなり、入力した音声に対応して応答することを特徴と
    する玩具。
  21. 【請求項21】請求項11記載の音声反応装置と風船か
    らなり、音声が発声された方向に移動することを特徴と
    する玩具。
  22. 【請求項22】請求項12記載の音声反応装置と風船か
    らなり、入力した音声の指示した方向に移動することを
    特徴とする玩具。
  23. 【請求項23】請求項13記載の音声反応装置と風船か
    らなり、音声が発声された方向に移動することを特徴と
    する玩具。
  24. 【請求項24】請求項14記載の音声反応装置と風船か
    らなり、入力した音声の指示に従って動作することを特
    徴とする玩具。
  25. 【請求項25】発声音声を含む音を一定時間循環的に貯
    める循環メモリーと、その音の終了点を検出する音声終
    了点検出装置と、前記循環メモリーの中から前記終了点
    までの発声音声部分を切り出す音声検出装置と、音声の
    ゼロ交差数等の特徴量を抽出する特徴量抽出装置と、前
    記音声の発声部分にある音声発声時間を計る音声時間検
    出装置とを具備し、登録したい音声の特徴量と音声発声
    時間を辞書として予め保存し、前記特徴量抽出装置を用
    いて認識したい音声特徴量と、前記音声時間検出装置を
    用いて音声発声時間を求め、前記辞書内の音声特徴量と
    音声発声時間との距離を求め、最も近い前記辞書内の音
    声を認識結果とする音声認識装置。
  26. 【請求項26】辞書に登録された複数の単語は、音声発
    生時間が所定時間異なる単語群毎に分類されており、音
    声認識の際、先ず音声発声時間を検出し、その所定時間
    に対応する単語群を選択し、更に、その単語群中の単語
    同士では、前記特徴量抽出装置が抽出する特徴量が異な
    る単語が選択されることを特徴とする請求項1記載の音
    声認識装置。
  27. 【請求項27】ヘリウムガス等が注入された反重力手段
    と、1つまたは複数の糸の引き出しを行う糸駆動手段
    と、この糸と前記反重力手段の一部分が接続されてお
    り、その糸駆動手段により前記反重力手段の変形・移動
    ・動作等の機械的反応をさせることを特徴とする反応装
    置。
  28. 【請求項28】入力の集合と、それぞれの入力に対する
    複数の音声応答と、複数の機械的反応とを含む入出力の
    状態を複数有し、一つの入力に対して音声応答と機械的
    反応を選択・出力した後に前記複数の入出力の状態のう
    ちの一つに状態が遷移され、過去の入出力の履歴により
    次の入出力が決定されることを特徴とする反応選択装
    置。
  29. 【請求項29】ヘリウムガス等が注入された反重力手段
    と、音声認識装置と、これの認識結果を入力とし音声応
    答と機械的反応を決定する請求項28の反応選択装置
    と、前記音声応答結果を発声する音声出力手段と、前記
    機械的反応結果により反重力手段を駆動する請求項27
    の反応装置とを備えたことを特徴とする応答玩具。
  30. 【請求項30】ヘリウムガス等が注入された反重力手段
    と、音声認識装置と、前記反重力手段の表面の全面ある
    いは一部にタッチセンサーが設けられ、手等の接触検知
    を出力する接触検知装置と、これらの認識結果と接触検
    知結果を入力とし音声応答と機械的反応を決定する請求
    項28の反応選択装置と、前記音声応答結果を発声する
    音声出力手段と、前記機械的反応結果により反重力手段
    を駆動する請求項27の反応装置とを備えた応答玩具。
  31. 【請求項31】音声認識装置は、請求項25または請求
    項26の音声認識装置であることを特徴とする請求項2
    9の応答玩具。
  32. 【請求項32】音声認識装置は、請求項25または請求
    項26の音声認識装置であることを特徴とする請求項3
    0の応答玩具。
  33. 【請求項33】音声認識装置には音声発声のパワーを検
    出するパワー検出手段を有し、前記反応装置は前記音声
    発声パワーに比例して機械的反応の大きさを制御するこ
    とを特徴とする請求項31または32記載の応答玩具。
JP11226595A 1995-03-31 1995-03-31 音声応答装置 Expired - Fee Related JP3337588B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP11226595A JP3337588B2 (ja) 1995-03-31 1995-03-31 音声応答装置
EP96105137A EP0735521A3 (en) 1995-03-31 1996-03-29 Voice recognition device, reaction device, reaction selection device, and reaction toy using them
KR1019960009539A KR960035427A (ko) 1995-03-31 1996-03-30 음성인식장치, 음성응답장치와 응답선택장치 및 이들 장치를 이용한 응답성 장난감
CN96106098A CN1140295A (zh) 1995-03-31 1996-03-31 语音识别装置、响应装置、响应选择装置以及采用这些装置的响应玩具

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11226595A JP3337588B2 (ja) 1995-03-31 1995-03-31 音声応答装置

Publications (2)

Publication Number Publication Date
JPH08266747A true JPH08266747A (ja) 1996-10-15
JP3337588B2 JP3337588B2 (ja) 2002-10-21

Family

ID=14582383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11226595A Expired - Fee Related JP3337588B2 (ja) 1995-03-31 1995-03-31 音声応答装置

Country Status (4)

Country Link
EP (1) EP0735521A3 (ja)
JP (1) JP3337588B2 (ja)
KR (1) KR960035427A (ja)
CN (1) CN1140295A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10111697A (ja) * 1996-10-04 1998-04-28 Matsushita Electric Ind Co Ltd 音声反応装置と音声認識装置
JPH10179941A (ja) * 1996-10-21 1998-07-07 Junji Kuwabara 音声認識および音声発生装置、および、該音声認識および音声発生装置を備えた玩具、ならびに、音声認識および音声発生制御プログラムを記録した記録媒体
JPH10328422A (ja) * 1997-05-29 1998-12-15 Omron Corp 自動応答玩具
JP2001121463A (ja) * 1999-10-29 2001-05-08 Atr Media Integration & Communications Res Lab 知能ロボット
JP2001265377A (ja) * 2000-03-15 2001-09-28 Junji Kuwabara 音声処理装置
JP2008064733A (ja) * 2006-08-09 2008-03-21 Fujitsu Ltd 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
WO2013106152A1 (en) * 2012-01-10 2013-07-18 Gonzalez Alejandro Doring Balloon toy and method of use
US9101850B2 (en) 2012-01-10 2015-08-11 Alejandro Doring Gonzalez Aerial toy and method of use
JP2017049210A (ja) * 2015-09-04 2017-03-09 株式会社東芝 レーダ信号処理装置およびレーダ信号処理プログラム
JP2018072784A (ja) * 2016-11-06 2018-05-10 ナレルシステム株式会社 音声認識方法、コンピュータプログラム及び装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4533845B2 (ja) * 2003-12-05 2010-09-01 株式会社ケンウッド オーディオ機器制御装置、オーディオ機器制御方法及びプログラム
KR102129786B1 (ko) * 2013-04-03 2020-07-03 엘지전자 주식회사 단말기 및 이의 제어방법
CN104978958A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和系统
KR102444061B1 (ko) 2015-11-02 2022-09-16 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
CN106516108A (zh) * 2016-05-12 2017-03-22 王金海 大气压反重力装置
CN108172224B (zh) * 2017-12-19 2019-08-27 浙江大学 基于机器学习的防御无声指令控制语音助手的方法

Citations (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56113199A (en) * 1980-02-12 1981-09-05 Tokyo Shibaura Electric Co Voice recognizing apparatus
JPS57181600A (en) * 1981-04-30 1982-11-09 Gen Corp Scattered word voice recognition apparatus
JPS5852696A (ja) * 1981-09-25 1983-03-28 大日本印刷株式会社 音声認識装置
JPS58143396A (ja) * 1982-02-19 1983-08-25 日本電気株式会社 音声認識装置
JPS59176991A (ja) * 1983-03-25 1984-10-06 Sharp Corp ワイヤレスリモ−トコントロ−ル装置
JPS60205600A (ja) * 1984-03-30 1985-10-17 株式会社東芝 音声認識装置
JPS61167997A (ja) * 1985-01-21 1986-07-29 カシオ計算機株式会社 会話ロボツト
JPS62170282A (ja) * 1986-01-21 1987-07-27 久間 章生 おしやべりロボツト
JPS6356698A (ja) * 1986-08-27 1988-03-11 沖電気工業株式会社 多数話者音声認識装置
JPS6316766B2 (ja) * 1980-02-15 1988-04-11 Nippon Electric Co
JPS63183087A (ja) * 1987-01-27 1988-07-28 株式会社 ナムコ 振り向き玩具
JPH01116789A (ja) * 1987-10-30 1989-05-09 Nec Corp 対話機能付音声装置
JPH0283727A (ja) * 1988-09-21 1990-03-23 Matsushita Electric Ind Co Ltd 音声対話装置
JPH0222398B2 (ja) * 1981-10-31 1990-05-18 Tokyo Shibaura Electric Co
JPH0333794A (ja) * 1989-06-30 1991-02-14 Hitachi Ltd 文字変形制御方式
JPH0333796A (ja) * 1989-06-29 1991-02-14 Matsushita Electric Ind Co Ltd 対話システム
JPH03168794A (ja) * 1989-11-29 1991-07-22 Takara Co Ltd 連結糸の緊張、弛緩による動作ディスプレー装置
JPH04158476A (ja) * 1990-10-22 1992-06-01 Sharp Corp 音声対話装置
JPH04240468A (ja) * 1991-01-23 1992-08-27 Omron Corp おもちゃ等の遊戯装置および実用装置
JPH05216618A (ja) * 1991-11-18 1993-08-27 Toshiba Corp 音声対話システム
JPH06142342A (ja) * 1992-10-14 1994-05-24 Sanyo Electric Co Ltd 音声認識玩具
JPH06175689A (ja) * 1992-12-07 1994-06-24 Ricoh Co Ltd 音声認識反応装置
JPH06327842A (ja) * 1993-05-24 1994-11-29 Takara Co Ltd 動物玩具
JPH06332493A (ja) * 1993-05-19 1994-12-02 Canon Inc 音声対話型情報検索装置及び方法
JPH0713586A (ja) * 1993-06-23 1995-01-17 Matsushita Electric Ind Co Ltd 音声判別装置と音響再生装置
JPH07104778A (ja) * 1993-10-07 1995-04-21 Fuji Xerox Co Ltd 感情表出装置
JPH07140997A (ja) * 1993-11-16 1995-06-02 Hitachi Ltd パーソナルロボット装置及びその制御方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4093821A (en) * 1977-06-14 1978-06-06 John Decatur Williamson Speech analyzer for analyzing pitch or frequency perturbations in individual speech pattern to determine the emotional state of the person
US4245430A (en) * 1979-07-16 1981-01-20 Hoyt Steven D Voice responsive toy
ZA813750B (en) * 1981-06-04 1982-06-30 Digicor Pty Ltd Audio sensing apparatus
US4799171A (en) * 1983-06-20 1989-01-17 Kenner Parker Toys Inc. Talk back doll
JPS6055985A (ja) * 1983-09-05 1985-04-01 株式会社トミー 音声認識玩具
US4780906A (en) * 1984-02-17 1988-10-25 Texas Instruments Incorporated Speaker-independent word recognition method and system based upon zero-crossing rate and energy measurement of analog speech signal
US4696653A (en) * 1986-02-07 1987-09-29 Worlds Of Wonder, Inc. Speaking toy doll
US4840602A (en) * 1987-02-06 1989-06-20 Coleco Industries, Inc. Talking doll responsive to external signal
US4923428A (en) * 1988-05-05 1990-05-08 Cal R & D, Inc. Interactive talking toy
US4931028A (en) * 1988-08-15 1990-06-05 Jaeger Hugh D Toy blimp
US5007367A (en) * 1988-12-12 1991-04-16 Matteucci Lawrence A Inflatable balloon distress signal device
US5095467A (en) * 1990-09-14 1992-03-10 Alliant Techsystems Inc. Target tracking system for determining bearing of a target
US5209695A (en) * 1991-05-13 1993-05-11 Omri Rothschild Sound controllable apparatus particularly useful in controlling toys and robots
US5323337A (en) * 1992-08-04 1994-06-21 Loral Aerospace Corp. Signal detector employing mean energy and variance of energy content comparison for noise detection

Patent Citations (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56113199A (en) * 1980-02-12 1981-09-05 Tokyo Shibaura Electric Co Voice recognizing apparatus
JPS6316766B2 (ja) * 1980-02-15 1988-04-11 Nippon Electric Co
JPS57181600A (en) * 1981-04-30 1982-11-09 Gen Corp Scattered word voice recognition apparatus
JPS5852696A (ja) * 1981-09-25 1983-03-28 大日本印刷株式会社 音声認識装置
JPH0222398B2 (ja) * 1981-10-31 1990-05-18 Tokyo Shibaura Electric Co
JPS58143396A (ja) * 1982-02-19 1983-08-25 日本電気株式会社 音声認識装置
JPS59176991A (ja) * 1983-03-25 1984-10-06 Sharp Corp ワイヤレスリモ−トコントロ−ル装置
JPS60205600A (ja) * 1984-03-30 1985-10-17 株式会社東芝 音声認識装置
JPS61167997A (ja) * 1985-01-21 1986-07-29 カシオ計算機株式会社 会話ロボツト
JPS62170282A (ja) * 1986-01-21 1987-07-27 久間 章生 おしやべりロボツト
JPS6356698A (ja) * 1986-08-27 1988-03-11 沖電気工業株式会社 多数話者音声認識装置
JPS63183087A (ja) * 1987-01-27 1988-07-28 株式会社 ナムコ 振り向き玩具
JPH01116789A (ja) * 1987-10-30 1989-05-09 Nec Corp 対話機能付音声装置
JPH0283727A (ja) * 1988-09-21 1990-03-23 Matsushita Electric Ind Co Ltd 音声対話装置
JPH0333796A (ja) * 1989-06-29 1991-02-14 Matsushita Electric Ind Co Ltd 対話システム
JPH0333794A (ja) * 1989-06-30 1991-02-14 Hitachi Ltd 文字変形制御方式
JPH03168794A (ja) * 1989-11-29 1991-07-22 Takara Co Ltd 連結糸の緊張、弛緩による動作ディスプレー装置
JPH04158476A (ja) * 1990-10-22 1992-06-01 Sharp Corp 音声対話装置
JPH04240468A (ja) * 1991-01-23 1992-08-27 Omron Corp おもちゃ等の遊戯装置および実用装置
JPH05216618A (ja) * 1991-11-18 1993-08-27 Toshiba Corp 音声対話システム
JPH06142342A (ja) * 1992-10-14 1994-05-24 Sanyo Electric Co Ltd 音声認識玩具
JPH06175689A (ja) * 1992-12-07 1994-06-24 Ricoh Co Ltd 音声認識反応装置
JPH06332493A (ja) * 1993-05-19 1994-12-02 Canon Inc 音声対話型情報検索装置及び方法
JPH06327842A (ja) * 1993-05-24 1994-11-29 Takara Co Ltd 動物玩具
JPH0713586A (ja) * 1993-06-23 1995-01-17 Matsushita Electric Ind Co Ltd 音声判別装置と音響再生装置
JPH07104778A (ja) * 1993-10-07 1995-04-21 Fuji Xerox Co Ltd 感情表出装置
JPH07140997A (ja) * 1993-11-16 1995-06-02 Hitachi Ltd パーソナルロボット装置及びその制御方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10111697A (ja) * 1996-10-04 1998-04-28 Matsushita Electric Ind Co Ltd 音声反応装置と音声認識装置
JPH10179941A (ja) * 1996-10-21 1998-07-07 Junji Kuwabara 音声認識および音声発生装置、および、該音声認識および音声発生装置を備えた玩具、ならびに、音声認識および音声発生制御プログラムを記録した記録媒体
JPH10328422A (ja) * 1997-05-29 1998-12-15 Omron Corp 自動応答玩具
JP2001121463A (ja) * 1999-10-29 2001-05-08 Atr Media Integration & Communications Res Lab 知能ロボット
JP2001265377A (ja) * 2000-03-15 2001-09-28 Junji Kuwabara 音声処理装置
JP2008064733A (ja) * 2006-08-09 2008-03-21 Fujitsu Ltd 音源方向推定装置、音源方向推定方法、及びコンピュータプログラム
WO2013106152A1 (en) * 2012-01-10 2013-07-18 Gonzalez Alejandro Doring Balloon toy and method of use
US8556675B2 (en) 2012-01-10 2013-10-15 Alejandro Doring Gonzalez Balloon toy and method of use
US9101850B2 (en) 2012-01-10 2015-08-11 Alejandro Doring Gonzalez Aerial toy and method of use
JP2017049210A (ja) * 2015-09-04 2017-03-09 株式会社東芝 レーダ信号処理装置およびレーダ信号処理プログラム
JP2018072784A (ja) * 2016-11-06 2018-05-10 ナレルシステム株式会社 音声認識方法、コンピュータプログラム及び装置

Also Published As

Publication number Publication date
CN1140295A (zh) 1997-01-15
EP0735521A3 (en) 1998-12-02
KR960035427A (ko) 1996-10-24
JP3337588B2 (ja) 2002-10-21
EP0735521A2 (en) 1996-10-02

Similar Documents

Publication Publication Date Title
JPH08266747A (ja) 音声認識装置、反応装置、反応選択装置及びこれらを用いた反応玩具
US10702991B2 (en) Apparatus, robot, method and recording medium having program recorded thereon
JPH08187368A (ja) ゲーム装置、入力装置、音声選択装置、音声認識装置及び音声反応装置
CN113454708A (zh) 语言学风格匹配代理
US6471420B1 (en) Voice selection apparatus voice response apparatus, and game apparatus using word tables from which selected words are output as voice selections
JP3254994B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP4030162B2 (ja) 息検出機能付情報処理装置及び息検出による画像表示制御方法
WO2017215297A1 (zh) 云端互动系统及其多感知型智能机器人和感知互动方法
US7526363B2 (en) Robot for participating in a joint performance with a human partner
CN111128118B (zh) 语音合成方法、相关设备及可读存储介质
JP2003255991A (ja) 対話制御システム、対話制御方法及びロボット装置
CN113643693B (zh) 以声音特征为条件的声学模型
JP6585733B2 (ja) 情報処理装置
JP7180139B2 (ja) ロボット、ロボットの制御方法及びプログラム
KR20220130000A (ko) 인공지능 아바타에 기초한 인터랙션 서비스 방법 및 장치
CN111002303A (zh) 识别装置、机器人、识别方法和存储介质
CN115167656A (zh) 基于人工智能虚拟形象的互动服务方法及装置
JP2006123136A (ja) コミュニケーションロボット
JP2017047494A (ja) アンドロイドロボットの制御システム、装置、プログラムおよび方法
CN110444189A (zh) 一种缄默通信方法、系统和存储介质
JP2024108175A (ja) ロボット、音声合成プログラム、及び音声出力方法
JPH0379711B2 (ja)
JP2006088276A (ja) 動作生成システム
JP2018075657A (ja) 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム
JP2004024863A (ja) 口唇認識装置および発生区間認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070809

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080809

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080809

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090809

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090809

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100809

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110809

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees