JP2001005492A - 音声認識方法および音声認識装置 - Google Patents

音声認識方法および音声認識装置

Info

Publication number
JP2001005492A
JP2001005492A JP11174526A JP17452699A JP2001005492A JP 2001005492 A JP2001005492 A JP 2001005492A JP 11174526 A JP11174526 A JP 11174526A JP 17452699 A JP17452699 A JP 17452699A JP 2001005492 A JP2001005492 A JP 2001005492A
Authority
JP
Japan
Prior art keywords
voice
registered
command
registered word
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11174526A
Other languages
English (en)
Inventor
Hisashi Kurokawa
久 黒河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11174526A priority Critical patent/JP2001005492A/ja
Priority to EP00113016A priority patent/EP1063637A1/en
Publication of JP2001005492A publication Critical patent/JP2001005492A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

(57)【要約】 【課題】 音声認識により機器の操作を行う場合に、速
やかな応答が得られるようにする。 【解決手段】 登録語音声を入力する手順A1と、前記入
力された登録語音声が、限定された数の登録語と一致す
るか否かを判定する手順A2と、前記判定の結果に応じて
外部機器にコマンドを発行する手順A3とからなる。音声
認識をする際の登録語を限定し、登録語自体をトリガ音
声のごとく扱うことによって、ボタン操作やトリガ音声
入力といった登録語音声の入力を開始するための処理
と、登録語音声の入力、および音声認識の処理を一つに
したので、速やかなコマンド発行が可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、機器の制御を音声
入力により行うために必要な音声認識方法および音声認
識装置に関し、特に、速やかな応答が得られる音声認識
方法および音声認識装置に関する。
【0002】
【従来の技術】従来の音声認識方法および音声認識装置
としては、例えば、特許登録第1725050号に記載された
ものがあった。図7は、前記特許登録第1725050号に記
載されているものと同様な音声認識方法の概略処理を示
すフローチャートである。また、図8は、前記特許登録
第1725050号に記載されているものと同様な構成を有す
る音声認識装置の概略構成を示すブロック図である。
【0003】次に、図7に示されている音声認識方法お
よび図8に示されている音声認識装置について説明す
る。
【0004】図7のフローチャートにおいて、ステップ
B1では、音声認識を開始するためのトリガ音声の入力を
受け付ける。ステップB2では、入力された音声がトリガ
音声と一致するか否かを判断し、一致すると判断された
場合はステップB3へ進み、一致しないと判断された場合
はステップB1に戻る。
【0005】ステップB3では、音声認識をする対象とな
る登録語の音声入力を受け付ける。ステップB4では、一
定時間内に音声が入力されたか否かを判断し、入力され
たと判断された場合はステップB5に進み、入力されてい
ないと判断された場合はステップB1に戻る。
【0006】ステップB5では、入力された音声が、通
常、複数設定されている登録語のいずれかと一致するか
否かを判断し、一致すると判断された場合はステップB6
に進み、一致しないと判断された場合はステップB1に戻
る。
【0007】ステップB6では、一致した登録語に対応す
るコマンドを外部機器に対して発行し、ステップB1に戻
る。
【0008】図8のブロック図において、音声入力手段
1はマイクロフォンおよびA/D変換器などによって構
成され、トリガ音声や登録語音声を入力し、入力開始判
定手段11および音声認識手段13に出力するための手段で
ある。
【0009】入力開始判定手段11は、音声入力手段1か
ら入力された音声がトリガ音声記憶手段12に記憶された
トリガ音声と一致するか否かを判断し、一致する場合に
は入力有無判定手段13に登録語音声入力の開始を通知す
る。なお、トリガ音声記憶手段12および入力開始判定手
段11は、ボタンなどによって構成され、ボタンが押下さ
れた場合に入力有無判定手段13に登録語音声入力の開始
を通知するような場合もある。
【0010】入力有無判定手段13は、登録語音声入力開
始の通知から一定時間内に、音声入力手段1から音声の
入力があったか否かを判断し、入力があったと判断され
た場合には音声認識手段14に音声認識の開始を通知す
る。
【0011】音声認識手段14は、音声認識開始の通知を
受けたとき、入力された音声が登録語記憶手段3に記憶
されている登録語のいずれかと一致するか否かを判断す
る。
【0012】コマンド発行手段4は、音声認識手段14に
おいて、登録語音声が登録語のいずれかと一致すると判
断されたとき、一致する登録語に対応したコマンドを外
部機器5に対して発行する。
【0013】外部機器5は、コマンド発行手段4によっ
て発行されたコマンドに基づく動作を実行する。
【0014】以上説明したように、従来の音声認識方
法、および音声認識装置では、予めトリガ音声を入力し
た上で、一定の時間内だけ登録語音声の入力を受け付け
ることによって、登録語音声の切り出しを容易にし、認
識率を高めることができる。
【0015】
【発明が解決しようとする課題】しかしながら、上記音
声認識方法および音声認識装置では、登録語音声を入力
するまでにトリガ音声を予め入力したり、ボタンを押下
するなどの操作が必要であるため、外部機器を操作する
場合に、速やかな応答を得ることができないという課題
があった。
【0016】また、トリガ音声および登録音声の内容が
固定されているため、トリガ音声および登録音声ののパ
ターンや長さをユーザが調整することができないという
課題があった。
【0017】さらに、一つの登録語に対応するコマンド
が固定であるため、ユーザが自由にコマンドを設定する
ことができないという課題があった。
【0018】また、操作する外部機器が複数の動作モー
ドを備える場合、動作モードに応じて登録語を設定する
ことができないという課題があった。
【0019】さらに、操作する外部機器が複数の動作モ
ードを備える場合、動作モードに応じてコマンドを設定
することができないという課題があった。
【0020】本発明の目的は、上記課題を解決するた
め、外部機器を操作する場合に、速やかな応答を得るこ
とができる音声認識方法および音声認識装置を提供する
ことにある。
【0021】本発明の他の目的は、登録音声のパターン
や長さをユーザが自由に調整することができる音声認識
装置を提供することにある。
【0022】本発明のさらに他の目的は、一つの登録語
に対応するコマンドをユーザが自由に設定することがで
きる音声認識装置を提供することにある。
【0023】本発明の別の目的は、操作する外部機器が
複数の動作モードを備える場合、動作モードに応じて登
録語を設定することができる音声認識装置を提供するこ
とにある。
【0024】本発明のさらに別の目的は、操作する外部
機器が複数の動作モードを備える場合、動作モードに応
じてコマンドを設定することができる音声認識装置を提
供することにある。
【0025】
【課題を解決するための手段】上記課題を解決するため
に本発明は、音声認識方法を、登録語音声を入力する手
順と、前記入力された登録語音声が、限定された数の登
録語と一致するか否かを判定する手順と、前記判定の結
果に応じて外部機器にコマンドを発行する手順とからな
る構成とした。このように構成したことにより、外部機
器に対して速やかにコマンドを発行することができる。
【0026】また、本発明に係る音声認識装置は、登録
語音声を入力するための音声入力手段と、限定された数
の登録語が予め格納された登録語記憶手段と、前記音声
入力手段で入力された登録語音声が前記登録語記憶手段
に登録されている登録語と一致するか否かを判定する音
声認識手段と、前記音声認識手段で一致すると判定され
たときに外部機器に対してコマンドを発行するコマンド
発行手段とを備え、前記音声認識手段では登録語音声の
入力を開始するための処理と、前記処理の後に実行する
登録語音声の入力および音声認識の処理を一つにした。
このように構成したことにより、外部機器に対して速や
かにコマンドを発行することができる。
【0027】さらに、前記本発明に係る音声認識装置
に、登録語を設定するための登録語設定手段、あるいは
外部機器に対して発行するコマンドを設定するためのコ
マンド設定手段を付加した。このように構成したことに
より、登録語の設定、あるいは外部機器に対して発行す
るコマンドの設定が可能になる。
【0028】また、前記本発明に係る音声認識装置に、
外部機器の動作モードを判定するモード判定手段、およ
び前記モード判定手段で判定された動作モードに応じて
登録語を設定する登録語設定手段または前記モード判定
手段で判定された動作モードに応じてコマンドを設定す
るコマンド設定手段を付加した。このように構成したこ
とにより、外部機器の動作モードに応じて登録語を設定
したり、外部機器の動作モードに応じてコマンドを設定
したりすることが可能となる。
【0029】
【発明の実施の形態】本発明の請求項1記載の発明は、
登録語音声を入力する手順と、前記入力された登録語音
声が、限定された数の登録語と一致するか否かを判定す
る手順と、前記判定の結果に応じて外部機器にコマンド
を発行する手順とからなる音声認識方法であり、音声認
識する際の登録語数を限定し、かつ登録語自体をトリガ
音声のごとく扱うことによって、登録語音声の入力を開
始するための処理と、前記処理の後に実行する登録語音
声の入力および音声認識の処理を一つにするという作用
を有する。
【0030】本発明の請求項2記載の発明は、登録語音
声を入力するための音声入力手段と、限定された数の登
録語が予め格納された登録語記憶手段と、前記音声入力
手段で入力された登録語音声が前記登録語記憶手段に登
録されている登録語と一致するか否かを判定する音声認
識手段と、前記音声認識手段で一致すると判定されたと
きに外部機器に対してコマンドを発行するコマンド発行
手段とを備え、前記音声認識手段では登録語音声の入力
を開始するための処理と、前記処理の後に実行する登録
語音声の入力および音声認識の処理を一つにした音声認
識装置であり、音声認識する際の登録語数を限定し、か
つ登録語自体をトリガ音声のごとく扱うことによって、
登録語音声の入力を開始するための処理と、前記処理の
後に実行する登録語音声の入力および音声認識の処理を
一つにするという作用を有する。
【0031】本発明の請求項3記載の発明は、請求項2
記載の音声認識装置において、前記登録語を設定するた
めの登録語設定手段をさらに備えた音声認識装置であ
り、登録語の設定を可能にするという作用を有する。
【0032】本発明の請求項4記載の発明は、請求項2
記載の音声認識装置において、前記外部機器に対して発
行するコマンドを設定するコマンド設定手段をさらに備
えた音声認識装置であり、外部機器に対して発行するコ
マンドの設定を可能にするという作用を有する。
【0033】本発明の請求項5記載の発明は、請求項2
記載の音声認識装置において、前記外部機器の動作モー
ドを判定するモード判定手段と、前記モード判定手段で
判定された動作モードに応じて登録語を設定する登録語
設定手段とをさらに備えた音声認識装置であり、外部機
器の動作モードに応じて登録語を設定するという作用を
有する。
【0034】本発明の請求項6記載の発明は、請求項2
記載の音声認識装置において、前記外部機器の動作モー
ドを判定するモード判定手段と、前記モード判定手段で
判定された動作モードに応じてコマンドを設定するコマ
ンド設定手段とをさらに備えた音声認識装置であり、外
部機器の動作モードに応じてコマンドを設定するという
作用を有する。
【0035】以下、本発明の実施の形態について図面に
基づいて詳細に説明する。
【0036】(第1の実施の形態)本発明の第1の実施
の形態の音声認識方法では、音声認識をする際の登録語
数を限定し、かつ登録語自体をトリガ音声のごとく扱う
ことによって、登録語音声の入力を開始するための処理
と、前記処理の後に実行する登録語音声の入力および音
声認識の処理を一つにし、速やかなコマンド発行を可能
にした。
【0037】図1は、本発明の第1の実施の形態による
音声認識方法の概略処理を示すフローチャートである。
なお、この音声認識処理は、マイクロホンおよびA/D
変換器などを有する音声入力手段と、ROMなどの登録
語記憶手段と、CPUなどの演算手段と、各種キーなど
を有する操作手段とを備えた音声認識装置により実行さ
れる。
【0038】図1のフローチャートにおいて、ステップ
A1では、登録語音声をトリガ音声のごとく扱うために、
好ましくは1個あるいは2〜3個程度の少数に限定され
た登録語の音声入力を受け付ける。ステップA2では、入
力された音声が登録語のいずれかと一致するか否かを判
断し、一致すると判断された場合はステップA3へ進み、
一致しないと判断された場合はステップA1に戻る。ステ
ップA3では、入力された登録語に対応するコマンドを外
部機器に対して発行し、ステップA1に戻る。
【0039】以上説明したように、本実施の形態の音声
認識方法によれば、事前のトリガ音声入力、あるいはボ
タン押下などの操作が不要となり、また音声認識を行う
対象となる登録語を限定することによって音声認識に必
要な所要時間を短縮できるため、外部機器を操作する場
合に、速やかな応答を得ることができる。また、音声認
識を行う対象となる登録語を限定することによって、認
識率の低下を防止することも可能である。このため、ユ
ーザが外部機器を快適に使用することができる。また、
ナビゲーション装置などに適用した場合、走行中の操作
を行う際の安全性を向上させることができる。
【0040】(第2の実施の形態)本発明の第2の実施
の形態の音声認識装置では、音声認識をする際の登録語
数を限定し、かつ登録語自体をトリガ音声のごとく扱う
ことによって、登録語音声の入力を開始するための処理
と、前記処理の後に実行する登録語音声の入力および音
声認識の処理を一つにし、速やかなコマンド発行を可能
にした。
【0041】図2は、本発明の第2の実施の形態による
音声認識装置の概略構成を示すブロック図である。
【0042】この音声認識装置は、音声入力手段1と、
音声認識手段2と、登録語記憶手段3と、コマンド発行
手段4とから構成されている。音声入力手段1はマイク
ロフォンおよびA/D変換器などによって構成され、登
録語音声を入力し、音声認識手段2に出力する。音声認
識手段2は、入力された音声と登録語記憶手段3に格納
されている登録語のいずれかと一致するか否かを判断す
る。登録語記憶手段3には、予め少数の登録語のみが登
録されている。コマンド発行手段4は、音声認識の結果
に応じたコマンドを発行し、外部機器5に出力する。外
部機器5は音声認識による制御の対象となる機器であ
る。
【0043】次に、以上のように構成された音声認識装
置について、その動作を説明する。図2のブロック図に
おいて、音声認識手段2は、常に音声入力手段1からの
音声入力を受け付け、入力された音声が、登録語記憶手
段3に登録されている登録語のいずれかと一致するか否
かを判断する。コマンド発行手段4は、音声認識手段2
において、入力された音声が登録語のいずれかと一致す
ると判断されたとき、一致する登録語に対応したコマン
ドを外部機器5に対して発行する。外部機器5は、コマ
ンド発行手段4によって発行されたコマンドに基づく動
作を実行する。
【0044】以上説明したように、本実施の形態の音声
認識装置によれば、事前のトリガ音声入力、あるいはボ
タン押下などの操作が不要となり、また音声認識を行う
対象となる登録語を限定することによって音声認識に必
要な所要時間を短縮できるため、外部機器を操作する場
合に、速やかな応答を得ることができる。さらに、音声
認識を行う対象となる登録語を限定することによって、
認識率の低下を防止することも可能である。このため、
ユーザが外部機器を快適に使用することができる。ま
た、ナビゲーション装置などに適用した場合、走行中の
操作を行う際の安全性を向上させることができる。
【0045】(第3の実施の形態)本発明の第3の実施
の形態では、登録語設定手段を設け、登録語のパターン
や長さをユーザが自分の好みに応じて自由に調整できる
ようにした。
【0046】図3は、本発明の第3の実施の形態による
音声認識装置の概略構成を示すブロック図である。この
図において、図2に基づいて説明した部分については、
同一符号を付して、説明を省略する。
【0047】この音声認識装置は、図2に示した音声認
識装置に登録語設定手段6を付加したものである。登録
語設定手段6は、音声認識手段2において音声認識をす
る対象となる登録語をユーザが設定し、登録語記憶手段
3に登録するための手段である。
【0048】次に、以上のように構成された音声認識装
置について、その動作を説明する。この音声認識装置に
おいて、音声入力手段1から入力された音声が音声認識
手段2で認識され、その認識結果に従ってコマンド発行
手段4が外部機器5にコマンドを発行する動作について
は、前述した第2の実施の形態と同一であるから、ここ
では、登録語設定手段6の動作を説明する。
【0049】登録語設定手段6では、スイッチを切り替
えることによって登録語を選択したり、表示装置と、リ
モコンなどの入力装置とを用いて、文字情報を入力した
り、予め候補として設定しておいた登録語のリストを表
示して、その中から選択するなどの手順により登録語を
設定する。このとき、表示装置や入力装置を外部機器5
と共用したり、入力装置として音声入力手段1を用いる
ことも可能である。入力装置として音声入力手段1を用
いる場合、ユーザの音声自体を登録語として利用するこ
とも可能である。
【0050】以上説明したように、本実施の形態の音声
認識装置によれば、登録語のパターンや長さをユーザが
自分の好みに応じて自由に調整することができる。ま
た、認識率が低くなってしまう場合には、登録語を変更
することによって認識率を向上させることができる。
【0051】(第4の施の形態)本発明の第4の実施の
形態では、コマンド設定手段を設け、登録語に対応する
コマンドをユーザが自由に設定することができるように
した。
【0052】図4は、本発明の第4の実施の形態による
音声認識装置の概略構成を示すブロック図である。この
図において、図2に基づいて説明した部分については、
同一符号を付して、説明を省略する。
【0053】この音声認識装置は、図2に示した音声認
識装置にコマンド設定手段7を付加したものである。コ
マンド設定手段7は外部機器に対して発行するコマンド
をユーザが設定するための手段である。
【0054】次に、以上のように構成された音声認識装
置について、その動作を説明する。この音声認識装置に
おいて、音声入力手段1から入力された音声が音声認識
手段2で認識され、その認識結果に従ってコマンド発行
手段4が外部機器5にコマンドを発行する動作について
は、前述した第2の実施の形態と同一であるから、ここ
では、コマンド設定手段7の動作を説明する。
【0055】コマンド設定手段7では、スイッチを切り
替えることによってコマンドを選択したり、表示装置
と、リモコンなどの入力装置とを用いて、予め候補とし
て設定しておいたコマンドのリストを表示して、その中
から選択するなどの手順によりコマンドを設定する。登
録語が複数存在する場合には、登録語とコマンドとを対
応付けるためのテーブルを作成すればよい。
【0056】以上説明したように、本実施の形態の音声
認識装置によれば、登録語に対応するコマンドをユーザ
が自由に設定することができる。したがって、ユーザが
頻繁に使用するコマンドが変わったときなどに、同一の
登録語を用いたままコマンドの内容を変更することがで
きる。
【0057】(第5の実施の形態)本発明の第5の実施
の形態では、外部機器の動作モードに応じて登録語を設
定できるようにした。
【0058】図5は本発明の第5の実施の形態による音
声認識装置の概略構成を示すブロック図である。この図
において、図2に基づいて説明した部分については、同
一符号を付して、説明を省略する。
【0059】この音声認識装置は、図2に示した音声認
識装置に、動作モード判定手段8と、登録語設定手段9
とを付加したものである。動作モード判定手段8は、外
部機器5が出力する動作モードを判定するための手段で
ある。登録語設定手段9は、動作モード判定手段8で判
定された動作モードに応じて登録語を設定するための手
段である。
【0060】次に、以上のように構成された音声認識装
置について、その動作を説明する。この音声認識装置に
おいて、音声入力手段1から入力された音声が音声認識
手段2で認識され、その認識結果に従ってコマンド発行
手段4が外部機器5へコマンドを発行する動作について
は、前述した第2の実施の形態と同一であるから、ここ
では、動作モード判定手段8と登録語設定手段9の動作
を説明する。
【0061】動作モード判定手段8は外部機器5が動作
中のモードを判定し、判定結果を登録語設定手段9に通
知する。登録語設定手段9では、図3の登録語設定手段
6と同様な手順を外部機器の動作モード毎に繰り返して
実行し、動作モードと登録語とを対応づけるためのテー
ブルを作成することなどによって、動作モード判定手段
8で判定された動作モードに応じて登録語記憶手段3に
登録語を登録する。
【0062】以上説明したように、本実施の形態の音声
認識装置によれば、外部機器5が複数の動作モードを有
する場合、動作モードに応じて登録語を設定することが
できる。したがって、ユーザは外部機器の各モードごと
に登録語を設定することができるとともに、一回の音声
認識で対象とする登録語の数を減らすことができるの
で、音声認識に必要な処理時間を短縮することが可能で
ある。
【0063】(第6の実施の形態)本発明の第6の実施
の形態では、外部機器の動作モードに応じてコマンドを
設定できるようにした。
【0064】図6は、本発明の第6の実施の形態による
音声認識装置の概略構成を示すブロック図である。この
図において、図2に基づいて説明した部分については、
同一符号を付して、説明を省略する。
【0065】この音声認識装置は、図2に示した音声認
識装置に、動作モード判定手段8と、コマンド設定手段
10とを付加したものである。動作モード判定手段8は、
外部機器5が出力する動作モードを判定するための手段
である。コマンド設定手段10は、動作モード判定手段8
で判定された動作モードに応じてコマンドを設定するた
めの手段である。
【0066】次に、以上のように構成された音声認識装
置について、その動作を説明する。この音声認識装置に
おいて、音声入力手段1から入力された音声が音声認識
手段2で認識され、その認識結果に従ってコマンド発行
手段4が外部機器5へコマンドを発行する動作について
は、前述した第2の実施の形態と同一であるから、ここ
では、動作モード判定手段8とコマンド設定手段10の動
作を説明する。
【0067】動作モード判定手段8は外部機器5が動作
中のモードを判定し、判定結果をコマンド設定手段10に
通知する。コマンド設定手段10では、図4のコマンド設
定手段7と同様の手順を外部機器の動作モード毎に繰り
返し実行して、動作モードとコマンドとを対応づけるた
めのテーブルを作成することなどによって、判定された
動作モードに応じてコマンドを設定する。
【0068】以上説明したように、本実施の形態の音声
認識装置によれば、制御対象である外部機器が複数の動
作モードを有する場合、動作モードに応じてコマンドを
設定することができる。したがって、ユーザは同一の登
録語を用いて、複数のコマンドを外部機器に対して発行
することができる。
【0069】
【発明の効果】以上説明したように、本発明によれば、
音声認識をする際の登録語数を限定し、かつ登録語自体
をトリガ音声のごとく扱うことによって、登録語音声の
入力を開始するための処理と、前記処理の後に実行する
登録語音声の入力および音声認識の処理を一つにしたの
で、外部機器に対して速やかにコマンドを発行すること
ができるという効果が得られる。
【0070】また、登録語設定手段、あるいはコマンド
設定手段を設けたので、登録語の設定、あるいはコマン
ドの設定をユーザが自分の好みに応じて自由に行えると
いう効果が得られる。
【0071】さらに、外部機器の動作モードを判定する
モード判定手段、および前記モード判定手段で判定され
た動作モードに応じて登録語を設定する登録語設定手段
または前記モード判定手段で判定された動作モードに応
じてコマンドを設定するコマンド設定手段を設けたの
で、外部機器の動作モードに応じて登録語を設定した
り、外部機器の動作モードに応じてコマンドを設定した
りすることが可能となるという効果が得られる。。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態の音声認識方法の概
略処理を示すフローチャート、
【図2】本発明の第2の実施の形態の音声認識装置の概
略構成を示すブロック図、
【図3】本発明の第3の実施の形態の音声認識装置の概
略構成を示すブロック図、
【図4】本発明の第4の実施の形態の音声認識装置の概
略構成を示すブロック図、
【図5】本発明の第5の実施の形態の音声認識装置の概
略構成を示すブロック図、
【図6】本発明の第6の実施の形態の音声認識装置の概
略構成を示すブロック図、
【図7】従来の音声認識方法の概略処理を示すフローチ
ャート、
【図8】従来の音声認識装置の概略構成を示すブロック
図である。
【符号の説明】
1 音声入力手段 2 音声認識手段 3 登録語記憶手段 4 コマンド発行手段 5 外部機器 6、9 登録語設定手段 7、10 コマンド設定手段 8 動作モード判定手段 A1 登録音声入力手順 A2 音声認識手順 A3 コマンド発行手順

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 登録語音声を入力する手順と、前記入力
    された登録語音声が、限定された数の登録語と一致する
    か否かを判定する手順と、前記判定の結果に応じて外部
    機器にコマンドを発行する手順とからなることを特徴と
    する音声認識方法。
  2. 【請求項2】 登録語音声を入力するための音声入力手
    段と、限定された数の登録語が予め格納された登録語記
    憶手段と、前記音声入力手段から入力された登録語音声
    が前記登録語記憶手段に登録されている登録語と一致す
    るか否かを判定する音声認識手段と、前記音声認識手段
    で一致すると判定されたときに外部機器に対してコマン
    ドを発行するコマンド発行手段とを備え、前記音声認識
    手段では登録語音声の入力を開始するための処理と、前
    記処理の後に実行する登録語音声の入力および音声認識
    の処理を一つにしたことを特徴とする音声認識装置。
  3. 【請求項3】 前記登録語を設定するための登録語設定
    手段をさらに備えたことを特徴とする請求項2記載の音
    声認識装置。
  4. 【請求項4】 前記外部機器に対して発行するコマンド
    を設定するためのコマンド設定手段をさらに備えたこと
    を特徴とする請求項2記載の音声認識装置。
  5. 【請求項5】 前記外部機器の動作モードを判定するモ
    ード判定手段と、前記モード判定手段で判定された動作
    モードに応じて登録語を設定する登録語設定手段とをさ
    らに備えたことを特徴とする請求項2記載の音声認識装
    置。
  6. 【請求項6】 前記外部機器の動作モードを判定するモ
    ード判定手段と、前記モード判定手段で判定された動作
    モードに応じてコマンドを設定するコマンド設定手段と
    をさらに備えたことを特徴とする請求項2記載の音声認
    識装置。
JP11174526A 1999-06-21 1999-06-21 音声認識方法および音声認識装置 Pending JP2001005492A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP11174526A JP2001005492A (ja) 1999-06-21 1999-06-21 音声認識方法および音声認識装置
EP00113016A EP1063637A1 (en) 1999-06-21 2000-06-21 Voice-actuated control apparatus and method of control using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11174526A JP2001005492A (ja) 1999-06-21 1999-06-21 音声認識方法および音声認識装置

Publications (1)

Publication Number Publication Date
JP2001005492A true JP2001005492A (ja) 2001-01-12

Family

ID=15980076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11174526A Pending JP2001005492A (ja) 1999-06-21 1999-06-21 音声認識方法および音声認識装置

Country Status (2)

Country Link
EP (1) EP1063637A1 (ja)
JP (1) JP2001005492A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016531375A (ja) * 2013-09-20 2016-10-06 アマゾン テクノロジーズ インコーポレイテッド ローカルとリモートのスピーチ処理
US10515637B1 (en) 2017-09-19 2019-12-24 Amazon Technologies, Inc. Dynamic speech processing
JP2020012954A (ja) * 2018-07-18 2020-01-23 株式会社東芝 情報処理装置、情報処理方法、およびプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100434545B1 (ko) 2002-03-15 2004-06-05 삼성전자주식회사 홈네트워크로 연결된 가전기기들을 제어하는 방법 및 장치
CN104238379B (zh) * 2013-06-07 2017-07-28 艾默生过程控制流量技术有限公司 变送器、现场仪表以及用于控制变送器的方法
CN105334997A (zh) * 2014-08-12 2016-02-17 扬智科技股份有限公司 智能输入装置及其设定方法与控制方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0810502A1 (de) * 1996-05-30 1997-12-03 DIEHL GMBH & CO. Steuereinheit für eine Heizungsanlage
US5867817A (en) * 1996-08-19 1999-02-02 Virtual Vision, Inc. Speech recognition manager
US5777571A (en) * 1996-10-02 1998-07-07 Holtek Microelectronics, Inc. Remote control device for voice recognition and user identification restrictions
GB2326490A (en) * 1997-06-19 1998-12-23 Mitel Corp Voice activated control system and method
EP1147513A1 (en) * 1998-12-29 2001-10-24 Alcatel USA Sourcing, L.P. Security and user convenience through voice commands

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016531375A (ja) * 2013-09-20 2016-10-06 アマゾン テクノロジーズ インコーポレイテッド ローカルとリモートのスピーチ処理
US10515637B1 (en) 2017-09-19 2019-12-24 Amazon Technologies, Inc. Dynamic speech processing
JP2020012954A (ja) * 2018-07-18 2020-01-23 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
JP7000268B2 (ja) 2018-07-18 2022-01-19 株式会社東芝 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
EP1063637A1 (en) 2000-12-27

Similar Documents

Publication Publication Date Title
JP6570651B2 (ja) 音声対話装置および音声対話方法
JP3979209B2 (ja) データ入力方法およびデータ入力装置
JP2005331882A (ja) 音声認識装置、音声認識方法、および音声認識プログラム
JP2012226299A (ja) 音声命令語処理装置及びその方法
JP2001005492A (ja) 音声認識方法および音声認識装置
JP2009265307A (ja) 音声認識装置及びこれを用いる車両システム
JP2007127896A (ja) 音声認識装置及び音声認識方法
JP2000250587A (ja) 音声認識装置及び音声認識翻訳装置
JP4212947B2 (ja) 音声認識システムおよび音声認識の訂正・学習方法
JP2009145402A (ja) 装置動作スイッチ
JP4702081B2 (ja) 文字入力装置
JP2004294872A (ja) 音声認識を利用した電子機器
US20230169943A1 (en) Musical performance apparatus, musical performance phrase determining method, and storage medium
JP2009271835A (ja) 機器操作制御装置及びプログラム
JP2020060730A (ja) 音声認識装置
JP2008233009A (ja) カーナビゲーション装置及びカーナビゲーション装置用プログラム
JP2000056796A (ja) 音声入力装置および方法
JP2010026963A (ja) スケジュール管理装置およびスケジュール管理プログラム
JP2000181474A (ja) 文書データ音声合成方式
JP2007164712A (ja) 情報入力装置
JPH06332665A (ja) 音声入力システム
JP2007127895A (ja) 音声入力装置及び音声入力方法
JP2007272123A (ja) 音声操作システム
JPS61275972A (ja) 文章処理装置における音声入力装置
JPH10225886A (ja) ロボットの操作装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040608