JPH0683388A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0683388A
JPH0683388A JP23694592A JP23694592A JPH0683388A JP H0683388 A JPH0683388 A JP H0683388A JP 23694592 A JP23694592 A JP 23694592A JP 23694592 A JP23694592 A JP 23694592A JP H0683388 A JPH0683388 A JP H0683388A
Authority
JP
Japan
Prior art keywords
voice
recognition
units
input
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP23694592A
Other languages
English (en)
Inventor
Shoji Fujimoto
昇治 藤本
Kazuya Sako
和也 佐古
Hiroyuki Fujimoto
博之 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP23694592A priority Critical patent/JPH0683388A/ja
Publication of JPH0683388A publication Critical patent/JPH0683388A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 本発明は音声を認識することにより機器の制
御を行うための音声認識装置に関し、音声認識の誤認識
を低減することを目的とする。 【構成】 音声を認識して各種機器を制御するための音
声認識装置に、音声を捕捉する一つのマイクロフォン2
00と、複数の異なる認識方式を用いて、前記マイクロ
フォン200からの入力音声と基準音声とを比較し、基
準音声の複数の有力候補を導出し、それらの候補と入力
音声との近さを認識距離として出力する複数の音声認識
部1と、認識距離の最も小さいものの候補を最終的な認
識結果として出力する認識判定部2とを設ける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声を認識することによ
り機器の制御を行うための音声認識装置に関し、特に本
発明では音声認識の誤認識を低減することに関する。
【0002】
【従来の技術】従来このような分野の技術として以下に
説明するものがあった。図21は従来の音声認識装置を
用いた制御システムを示す図である。本図に示すように
音声認識装置を用いた制御システムは、話者の音声を捕
捉するマイクロフォン100と、該マイクロフォン10
0に接続され話者の音声を単語として認識する音声認識
装置101と、該音声認識装置101に接続され登録さ
れた単語に認識された音声に基づき機器を制御する制御
信号を形成する機器制御部102と、該機器制御部10
2に接続され制御信号により動作する被制御機器103
とを含む。この音声認識装置を用いた制御システムで
は、音声認識を行うことで手足を用いずに機器が制御さ
れている。
【0003】
【発明が解決しようとする課題】ところで、音声認識装
置には認識方式により得意、不得意な条件があり、不得
意の条件では誤認識が通常増えている。しかも、従来の
音声認識装置を用いた制御システムでは音声認識を行う
主要部分が1系統しか設けられていないため、例えば認
識率が90%の性能を有する装置の場合10回に1回の
割合(10%)で誤った認識結果を出力していた。誤っ
た認識を行うと機器の誤動作を招くから、これを防止す
るために音声認識の誤認識の低減化が要請されていた。
【0004】したがって本発明は上記課題に鑑み音声認
識装置の認識方式の不得意の条件でも誤認識を低減でき
る音声認識装置を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明は前記問題点を解
決するために、音声を認識して各種機器を制御するため
の音声認識装置に、音声を捕捉する一つのマイクロフォ
ンと、複数の異なる認識方式を用いて、前記マイクロフ
ォンからの入力音声と基準音声とを比較し、基準音声の
複数の有力候補を導出し、それらの候補と入力音声との
近さを認識距離として出力する複数の音声認識部と、前
記認識距離の最も小さいものの候補を最終的な認識結果
として出力する認識判定部とを設ける。
【0006】また共通の入力音声により各複数の音声認
識部で求められた認識距離を各複数の音声認識部の尺度
として、各複数の音声認識部の認識距離を補正して前記
認識判定部に出力する複数の正規化部を設けてもよい。
さらに前記マイクロフォンが複数からなり、各前記マイ
クロフォンの入力音声が各前記複数の音声認識部に入力
するようにしてもよい。
【0007】前記マイクロフォンが複数からなり、各前
記マイクロフォンの入力音声が各前記複数の音声認識部
に入力し、前記認識判定部は、複数の音声認識部からの
複数の候補がすべて一致した場合にこの候補を最終的な
認識結果として出力するようにしてもよい。前記認識判
定部は、前記複数の音声認識部で最も近いとして得られ
た上位候補についてそれぞれの複数の音声認識部での認
識距離、順位を重みとして入力音声に最も近いと判断す
るようにしてもよい。
【0008】音声を認識して各種機器を制御するための
音声認識装置に、音声を捕捉する一つのマイクロフォン
と、入力音声と基準音声とを比較し、基準音声の複数の
有力候補を導出し、それらの候補と入力音声との近さを
認識距離として出力する一つの音声認識部と、前記一つ
の音声認識部から得られた第1の候補と他の候補との認
識距離の差が一定の関係に有るものを良しと判断しさら
に判断されたものの中から最も良いものを最終的な候補
として出力する前記認識判定部と、複数の基準音声を生
成し、前記一つの音声認識部に設けられた複数の辞書
と、前記マイクロフォンからの音声を記憶し前記複数の
基準音声との比較毎に前記一つの音声認識部に入力音声
を送出する音声記憶手段とを設ける。
【0009】一対の音声認識部及び辞書部を複数設け、
前記一対の音声認識部及び辞書部が基準音声との比較を
行う都度前記音声記憶手段から記憶された入力音声が前
記音声認識部に送出されるようにしてもよい。音声を認
識して各種機器を制御するための音声認識装置に、音声
を捕捉する複数のマイクロフォンと、該複数のマイクロ
フォンからの音声を記憶する複数の音声記憶手段と、該
複数の音声記憶手段に記憶された複数の入力音声を逐次
入力音声と基準音声とを比較し、基準音声の複数の有力
候補を導出し、それらの候補と入力音声との近さを認識
距離として出力する一つの音声認識部と、前記一つの音
声認識部から得られた第1の候補と他の候補との認識距
離の差が一定の関係に有るものを良しと判断し、判断さ
れたものの中から最も良いものを最終的な候補として出
力する認識判定部とを設ける。
【0010】前記認識判定部は、入力音声から切り出さ
れた音声区間及び雑音区間から得られた音声パワー及び
雑音パワーによるS/N比から最終判断の候補の一つと
して選ばれるようにしてもよい。音声を認識して各種機
器を制御するための音声認識装置に、音声を捕捉する複
数のマイクロフォンと、該複数のマイクロフォンからの
音声を記憶する複数の音声記憶手段と、該複数の音声記
憶手段に記憶された複数の入力音声を逐次入力音声と基
準音声とを比較し、基準音声の複数の有力候補を導出
し、それらの候補と入力音声との近さを認識距離として
出力する複数の音声認識部と、各前記複数のマイクロフ
ォンについて前記複数の音声認識部から得られた第1の
候補で一致するものをそれぞれ複数抽出し、抽出された
中で最も多く一致するものを最終的な候補として出力す
る認識判定部とを設ける。
【0011】
【作用】本発明の音声認識装置によれば、音声が一つの
マイクロフォンにより捕捉され、複数の異なる認識方式
により、前記マイクロフォンからの入力音声と基準音声
とが比較され、基準音声の複数の有力候補が導出され、
それらの候補と入力音声との近さが認識距離として出力
される。そして前記認識距離の最も小さいものの候補が
最終的な認識結果として出力される。このため認識方式
の不得意の条件による誤認識が低減することになる。ま
た共通の入力音声により各複数の音声認識部で求められ
た認識距離が各複数の音声認識部の尺度とされ、各複数
の音声認識部の認識距離が補正され判定されることにな
り最終的な認識結果の信頼性が向上する。さらに複数の
マイクロフォンからの入力音声と基準音声とがそれぞれ
異なる認識方式により比較されことにより最終的な認識
結果の認識距離が小さくでき、誤認識を低減できる。複
数のマイクロフォンの入力音声がそれぞれ認識され複数
の候補がすべて一致した場合にこの候補が最終的な認識
結果として出力されるので誤認識とされるものの出力は
著しく低減する。複数の認識方式で最も近いとして得ら
れた上位候補についてそれぞれの複数の認識距離、順位
を重みとして入力音声に最も近いと判断することにより
さらに誤認識を低減できる。
【0012】またマイクロフォンからの音声を記憶し基
準音声との比較毎に入力音声を送出することにより、認
識処理規模が低減でき全体としても規模の低減になる。
得られた第1の候補と他の候補との認識距離の差が一定
の関係に有るものを良しと判断し、判断されたものの中
から最も良いものを最終的な候補とすることにより誤認
識を低減できる。また入力音声から切り出された音声区
間及び雑音区間から得られた音声パワー及び雑音パワー
によるS/N比から最終判断の候補の一つとすることに
より誤認識を低減できる。複数のマイクロフォンからの
入力音声と基準音声とを比較し、基準音声の複数の有力
候補を導出し、それらの候補と入力音声との近さが認識
距離として出力され複数のマイクロフォンについて得ら
れた第1の候補で一致するものをそれぞれ複数抽出し、
抽出された中で最も多く一致するものを最終的な候補と
して出力することにより、マイクロフォンを複数設置し
た音声認識でも誤認識を低減できるようになった。
【0013】
【実施例】以下本発明の実施例について図面を参照して
説明する。図1は本発明の実施例に係る音声認識装置を
用いた制御システムを示す図である。本図に示すよう
に、音声認識装置を用いた制御システムは、車両の車室
300内の話者の音声を捕捉する二つのマイクロフォン
200と、該マイクロフォン200からの音声の方向、
音源からの距離から話者を識別する話者方向距離判定部
201と、該話者方向距離判定部201に接続され話者
を識別した音声信号から雑音を消去する適応形処理さら
に自動利得制御(AGC)を行う音声認識の前処理部2
02と、該前処理部202に接続され音声を登録された
どの単語に一致するかを認識する音声認識部203と、
該音声認識部203で認識された単語に基づき制御信号
を形成する各種制御部204と、該各種制御部204を
介して認識された単語を音声に合成する音声合成部20
5と、該音声合成部205に接続され合成された音声を
再生するスピーカ206と、前記各種制御部204によ
り制御されるオーディオ207と、エアコンデショナー
208と、電話209と、ナビゲーション210と、オ
ートドライブ211等を含む。
【0014】図2は図1の音声認識装置の第1の構成を
示す図である。本図に示すように、音声認識部203に
は、話者から発せられた音声がマイクロフォン200等
により電気信号に変換され入力する。この音声を複数系
統に分岐して入力する認識部(1)、(2)、…、
(n)からなる複数の認識部1はそれぞれ異なる認識ア
ルゴリズムにより音声の認識を行う。該複数の認識部1
では音声認識方式によって認識しやすい条件が異なるこ
とを利用する。音声認識の結果に与えるパラメータには
音声分析に使用されるフィルタバンク、FFT(Fast Fo
urier Transformation) 、線形予測分析(LPC)、ケ
プストラム等、標準パターンとのマッチング処理に使用
されるDP(Dinamic Programming) マッチング、二段D
Pマッチング、リニアマッチング、隠れマルコフ等があ
る。さらに本実施例では同一人の使用を前提としている
が、標準パターンを形成する辞書には音声を認識すべき
単語が記憶されていて、この辞書の作成が音声認識の結
果に与えるパラメータには辞書が作成される環境の雑音
の有無、体調の相違等がある。したがってこれらのパラ
メータの組み合わせにより音声認識しやすい条件を形成
することができる。
【0015】前記複数の認識部1に接続される認識判定
部2は、複数の認識部1からの複数の認識結果1、2、
…、nに基づきこの中で最も正解に近いと考えられる結
果を採用する。この音声結果の判定では、辞書との照合
結果として認識された単語と音声の距離等を用いる。す
なわち複数の認識部1からの認識結果が異なる場合には
認識された単語の距離が最も近いものが採用される。
【0016】このようにして最終的に採用された結果は
音声認識部203から出力され各種制御部204を介し
てオーディオ207等の被制御機器を制御する。本実施
例によれば、認識方式の相違による誤認識が減り、機器
の誤動作を低減することが可能になる。図3は図2の音
声認識装置を用いて工場内の選別装置を駆動する例を示
す図である。本図に示すように、図1の制御システム以
外にも工場内で音声装置を用いることを想定することが
でき、本実施例の音声認識装置204により話者が発し
た音声から各種制御部204を介して工場内の選別装置
220を駆動することができるようになる。
【0017】図4は音声認識装置の第2の実施例を示す
図である。本図における音声認識部203において図2
と相違するものは、複数の認識部1と認識判定部2との
間に設けられた複数の正規化部3である。該正規化部3
では話者が同一の条件で発した音声で辞書を作成し、こ
の辞書を用いて話者が発した音声を複数の認識部1で認
識した結果を比較してその相違を予め統計的処理して求
めた尺度として記憶する。この場合話者の音声は録音し
ておき同一条件を形成することができる。このようにす
るのは、複数の認識部1で認識された単語が同一でかつ
距離が同一であっても、正確さが異なるからである。し
たがって複数の正規化部3では正規化(1)、(2)、
…、(3)が各複数の認識部1の結果1、2、…、nを
入力すると尺度1、2、…、nで補正して距離を求め、
この補正された距離により認識判定部2では正解の最も
近い認識結果を判定する。したがって第1の実施例より
も正確さが増し信頼性が向上することになる。
【0018】図5は図1の音声認識装置の第3の実施例
を示す図である。本図に示す音声認識部203において
図2のものと異なるものは、マイクロフォン(1)、
(2)、…、(n)からなる複数のマイクロフォン20
0に接続される該複数のマイクロフォン200に接続さ
れ複数の認識部(1)、(2)、…、(n)からなる複
数の認識部1と、該複数の認識部1により認識された認
識結果1、2、…、nが全部一致する場合に前記各種制
御部204に認識結果を出力し、一つでも不一致があれ
ば前記各種制御部204に認識結果を出力しないように
した認識判定部2である。
【0019】本実施例によれば、従来の音声認識装置で
は1系統処理であるため、例えば認識率が90%の性能
を有する場合、10回に1回の割合(10%)で誤った
認識結果を出力していたことになるが、複数系統の処理
を行うと誤認識出力が極端に少なくなる。例えは2系統
の場合、各系統の認識率が90%の場合、両方の誤認識
する確率は、1/10×1/10×100=1.0%と
なり誤認識の割合は極端に少なくなる。誤認識結果を出
力してしまうのは両方誤認識しかつ両系統の誤認識結果
が一致する場合だけであるから1%以下の確率しか生じ
ない。さらに系統数が増加すればこの確率はもっと低下
する。なお、一つの音声に対して複数のマイクロフォン
200を設けているので、一部のマイクロフォンに雑音
が増加して音声認識の識別が悪化した場合には認識結果
の出力を阻止できるため音声の発生環境が変化して誤認
識率が増加するを防止できる。すなわち誤認識と判断し
た場合には認識結果を出力しない、換言すれば認識結果
を出力する場合にはその正解率は非常に高くなり音声認
識装置の信頼性が向上することになる。
【0020】図6は図1の音声認識装置の第4の実施例
を示す図である。本図における音声認識装置203にお
いて、図5のものと異なるものは、認識判定部2であ
り、該認識判定部2には複数の認識部1の認識結果1、
2、…、nに重みを付け処理を行うようにしてある。以
下に前記重み付け処理の内容を説明する。第1の処理で
は各認識結果1、2、…、nで得られた(上位候補の)
認識距離をnで単純加算して最も認識距離の小さなもの
を認識結果として出力する。
【0021】第2の処理では各認識結果1、2、…、n
で得られた(上位候補の)認識距離のnの2乗和を求
め、この2乗和が最も小さなものを認識結果として出力
する。第3の処理では各認識結果で得られた認識順位
(近いと思われるものから1、2、…、x)をnで単純
平均加算して最も数字の少ないものを識別結果として出
力する。
【0022】第4の処理では各認識結果で得られた認識
順位をnの2乗和を求め、最も数字の少ないものを認識
結果として出力する。第5の処理では各認識結果で得ら
れた認識順位に対して重み付けを行い(例えば第1候補
5点、以下第2候補2点、第3候補2点、第4候補1
点)得られた点数をnだけ加算して点数の多いものを結
果として出力する。
【0023】本実施例によれば、複数系統認識を用いる
ことによりより精度良い認識が可能である。特に1マイ
クロフォンの場合突発的なノイズ等による音声区間切り
出し誤りによる誤認識が生じるが、複数系統処理におい
ては、一つの系統でこの種の誤認識が生じても最終的な
結果には反映されないことになる。以上の説明では複数
の音声認識部を有する音声認識装置について行ったが、
以下では前記音声認識装置の規模の低減化について説明
する。
【0024】図7は図1の音声認識装置の第5の実施例
を示す図である。本図に示す音声認識部203は、一つ
の認識部1と、前記識別部1の識別された複数の識別結
果を判定して結果を各種制御部204に出力する認識判
定手段2と、該認識部1に設けられる標準パターンを記
憶する辞書(1)、(2)、…、(n)からなる複数の
辞書部4と、該複数の辞書部4を切り換えるスイッチ5
と、マイクロフォン200からの音声等を記憶する音声
記憶手段6と、該音声記憶手段6の書き込み及び読み出
しを制御する記憶制御手段7とを具備する。
【0025】本実施例の場合には複数の辞書部4には複
数の話者を対象にし、例えば男女の別、発音の明確性、
背景の雑音レベル等をパラメータとして標準パターンで
ある単語が予め登録されている。話者がマイクロフォン
200を用いて発声すると、その音声が記憶制御部7に
より音声記憶手段6に記憶される。記憶された音声のデ
ータは複数の辞書部4が切り換えられる都度に複数の認
識部1に出力されて音声認識が行われる。この認識部1
は、例えば特定の、例えばDPマッチングによるもので
あってもよい。かくして音声記憶手段6等を設けること
より、認識処理では複数の認識処理を行う必要が無く、
複数の辞書4の一つと一つの認識部2との処理だけでよ
くなるので処理規模を小さくすることができるようにな
る。
【0026】図8は図1の音声認識装置の第6の実施例
を示す図である。本図における音声認識装置において図
7のものと異なるものは複数の認識部1と、各該複数の
認識部1に設けられる複数の辞書部4と、各該複数の認
識部1の前後で連動して切り換えられるスイッチ8、9
である。本図実施例においても、音声記憶手段6等を設
けることにより、認識処理では複数の処理を行う必要が
無く、一対の識別部と辞書の認識処理だけすればよくな
り処理規模を小さくすることができるようになる。
【0027】図9は図1の音声認識装置の第7の実施例
を示す図である。本図に示す音声認識装置203は、辞
書を内蔵する一つの認識部1と、該認識部1に接続され
認識された複数の認識結果を判定して結果を各種制御部
204に出力する認識判定手段2と、複数のマイクロフ
ォン(1)、(2)、…、(n)からなるマイクロフォ
ン200と、各該マイクロフォン200の音声信号を記
憶する記憶手段(1)、(2)、…、(n)からなる音
声記憶手段6と、各該音声記憶手段6の音声の書き込み
と読み出しを制御する記憶手段6と、各該音声記憶手段
6を切り換えて前記認識部1に音声データを出力するス
イッチ10とを具備する。本図実施例においても複数の
マイクロフォンにより音声信号の入力に対して複数の音
声記憶手段6を設けることにより、認識処理では複数の
認識処理を行う必要が無く、一つの認識の処理だけでよ
くなり処理規模を小さくすることができるようになる。
なおマイクロフォン200を複数にしているのは、音声
が捕捉される環境を考慮して、判定の結果最も良いもの
を使用することを可能するためである。
【0028】以下に実施例第5〜7における認識判定部
2について説明する図10は実施例第5〜7における認
識判定部の構成を示す図であり、図11は図10の結果
記憶部の結果群の構成を示す図である。本図に示す認識
判定部2は、認識部1からの複数の認識結果を記憶する
結果記憶部21と、該結果記憶部21に記憶された結果
から正解に近いものを採用しその結果を各種制御部20
4に出力する処理を行う処理回路22とを具備する。結
果記憶部21には、図11に示すように、結果群nつい
て、前述したように標準パターンに類似する程度を距離
として表し、距離の小さい順番にした候補1、これに対
する評価点(距離)1、…、候補k、これに対する評価
点(距離)kが記憶されている。
【0029】次に処理回路22を説明する。図12は図
10の処理回路における認識結果の評価を説明するフロ
ーチャートである。本図におけるステップ11において
結果記憶部21における結果群nの候補1の評価点1と
候補2の評価点2との差ΔPを取る。ステップ2におい
て、ΔP≧Δth(Δth:予め決定したしきい値)の
関係が成立するかを判断する。
【0030】ステップ3において、上記関係が成立する
場合には結果群nを良しとして採用する。ステップ4に
おいて、上記関係が成立しなければ結果群nを否として
棄却する。かくして、誤認識するのは通常候補1と候補
2とが明確に区別できない場合に生じるから、評価点1
と評価点2との差が所定値以上であれば、候補1が最も
正解に近いとすることができる。このようにして結果群
nで選ばれた複数の候補1のなかで一番よいものを採用
することにする。以下同様である。
【0031】図13は図10の処理回路における第2の
認識結果を説明するフローチャートである。本図に示す
ステップ21では、評価点1と、評価点2からkの中で
代表点として評価点qとの差ΔPを取る。以下のステッ
プは図13のもの同様である。候補2以下が固まりにな
っている場合に簡易な方法である。図14は図10の処
理回路における第3の認識結果の評価を説明するフロー
チャートである。本図に示すステップにおいて、評価点
1と評価点2との差をとりさらに評価点1と代表点であ
る評価点qとの差をとりこれらの差の平均をとってΔP
を形成する。以下のステップは図12のものと同様であ
る。本評価は図12のものと図13のものとの折衷案で
ある。
【0032】図15は図10の処理回路における第4の
認識結果の評価を説明するフローチャートである。本図
に示すステップ31において、評価点1と評価点iとの
差の平均値をΔPとして求める。以下のステップは図1
2のものと同様である。図16は図1の音声認識装置の
第8の実施例を示す図である。本図に示す音声認識装置
203は、辞書を内蔵する認識部1と、該認識部1に接
続され認識された複数の認識結果を判定して各種制御部
204に出力する認識判定部2と、マイクロフォン20
0の音声信号を記憶する音声記憶手段6と、該音声記憶
手段6の音声の書き込み読み出しを制御する記憶制御手
段7と、マイクロフォン200の信号から音声区間を切
り出す手段12と、該音声区間切り出し手段12から音
声区間と雑音区間のアドレスを入力し、前記音声記憶手
段6からの記憶された音声データから音声区間のパワー
を算出し、雑音区間のパワーを算出するパワー計算手段
13とを具備する。
【0033】図17は図16のパワー計算手段による音
声区間及び雑音区間でのパワーの算出を説明する図であ
る。本図(a)に示すにように、音声区間切り出し手段
12ではマイクロフォン200の信号から音声区間アド
レスAl1〜Al2、雑音区間アドレスAl0からAl
1が検出され、この情報を与えられたパワー計算手段1
3では音声記憶手段6から記憶されたデータを読み出し
て音声区間及び雑音区間のパワーがそれぞれ、本図
(b)に示すように、S及びNとして計算される。音声
区間を切り出す手段12からの音声区間を示すアドレス
Al1〜Al2を一つの音声認識部(1)に入力させる
ことにより、認識率の向上が図れる。以下に本実施例に
係る認識判定部2を説明する。
【0034】図18は本実施例に係る図10処理回路に
おける第5の認識結果の評価を説明する図である。本図
に示すように、ステップ41において、ΔP=S/Nと
して計算される。以下のステップは図12のものと同様
である。このようにS/Nが所定値以上のものが良しと
判断される。図19は図1の音声認識装置の第9の実施
例を示す図である。本図に示す音声認識部203は、辞
書を内蔵する認識部(1)、(2)、…、(n)からな
る複数の認識部1と、該複数の認識部1に接続され認識
された複数の認識結果を判定して結果を各種制御部20
4に出力する認識判定部2と、複数のマイクロフォン
(1)、(2)、…、(n)からなるマイクロフォン2
00と、各該マイクロフォン200の音声信号を記憶す
る音声記憶手段(1)、(2)、…、(n)からなる音
声記憶手段6と、各該音声記憶手段6の音声の書き込み
と読み出しを制御する記憶手段6と、各該音声記憶手段
6を切り換えて前記複数の認識部1に音声データを出力
するスイッチ11とを具備する。複数のマイクロフォン
200に複数の音声記憶手段6を設けることにより、各
複数のマイクロフォン200からの音声を複数の認識部
1で認識できるようになり、認識率の向上と処理規模の
縮小化を同時に達成できるにようになる。以下に本実施
例に係る認識判定部2の説明をする。
【0035】図20は本実施例に係る図10の処理回路
における第6の認識結果の評価を説明するフローチャー
トである。本図に示すように、ステップ51で結果群1
〜結果群nの第1候補で一致するものを抽出する。ステ
ップ52では上記ステップで選択された一致する第1の
候補内で最も多く一致した候補を抽出する。このように
して多数決法により確度を高めることができる。
【0036】
【発明の効果】以上説明したように本発明によれば、音
声がマイクロフォンにより捕捉され、複数の異なる認識
方式により、マイクロフォンからの入力音声と基準音声
とが比較され、基準音声の複数の有力候補が導出され、
それらの候補と入力音声との近さが認識距離として出力
される。そして前記認識距離の最も小さいものの候補が
最終的な認識結果として出力される。このため認識方式
の不得意の条件により誤認識が低減することになる。さ
らに入力音声の記憶により逐次音声認識を行うことがで
き処理規模を低減することができる。
【図面の簡単な説明】
【図1】本発明の実施例に係る音声認識装置を用いた制
御システムを示す図である。
【図2】図1の音声認識装置の第1の実施例を示す図で
ある。
【図3】図2の音声認識装置を用いて工場内の選別装置
を駆動する例を示す図である。
【図4】図1の音声認識装置の第2の実施例を示す図で
ある。
【図5】図1の音声認識装置の第3の実施例を示す図で
ある。
【図6】図1の音声認識装置の第4の実施例を示す図で
ある。
【図7】図1の音声認識装置の第5の実施例を示す図で
ある。
【図8】図1の音声認識装置の第6の実施例を示す図で
ある。
【図9】図1の音声認識装置の第7の実施例を示す図で
ある。
【図10】実施例第5〜7における認識判定部の構成を
示す図である。
【図11】図10の結果記憶部の結果群の構成を示す図
である。
【図12】図10の処理回路における第1の認識結果の
評価を説明するフローチャートである。
【図13】図10の処理回路における第2の認識結果の
評価を説明するフローチャートである。
【図14】図10の処理回路における第3の認識結果の
評価を説明するフローチャートである。
【図15】図10の処理回路における第4の認識結果の
評価を説明するフローチャートである。
【図16】図1の音声認識装置の第8の実施例を示す図
である。
【図17】図16のパワー計算手段により音声区間及び
雑音区間でのパワーの算出を説明する図である。
【図18】図10の処理回路における第5の認識結果の
評価を説明するフローチャートである。
【図19】図1の音声認識装置の第9の実施例を示す図
である。
【図20】図10の処理回路における第6の認識結果の
評価を説明するフローチャートである。
【図21】従来の音声認識装置を用いた制御システムを
示すブロック図である。
【符号の説明】
1…認識部 2…認識判定部 3…正規化部 4…辞書部 6…記憶手段 7…記憶制御部 21…結果記憶部 22…処理回路 200…マイクロフォン 203…音声認識部 204…各種制御部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 音声を認識して各種機器を制御するため
    の音声認識装置であって、 音声を捕捉する一つのマイクロフォン(200)と、 複数の異なる認識方式を用いて、前記マイクロフォン
    (200)からの入力音声と基準音声とをそれぞれ比較
    し、基準音声の複数の有力候補を導出し、それらの候補
    と入力音声との近さを認識距離として出力する複数の音
    声認識部(1)と、 前記認識距離の最も小さいものの候補を最終的な認識結
    果として出力する認識判定部(2)と備えることを特徴
    とする音声認識装置。
  2. 【請求項2】 請求項1の音声認識装置に、共通の入力
    音声により各複数の音声認識部(1)で求められた認識
    距離を各複数の音声認識部(1)の尺度として、各複数
    の音声認識部(1)の認識距離を補正して前記認識判定
    部(2)に出力する複数の正規化部(3)を備える音声
    認識装置。
  3. 【請求項3】 前記マイクロフォン(200)が複数か
    らなり、各前記マイクロフォン(200)の入力音声が
    各前記複数の音声認識部(1)に入力する請求項1記載
    の音声認識装置。
  4. 【請求項4】 前記マイクロフォン(200)が複数か
    らなり、各前記マイクロフォン(200)の入力音声が
    各前記複数の音声認識部(1)に入力し、前記認識判定
    部(2)は、複数の音声認識部(1)からの複数の候補
    がすべて一致した場合にこの候補を最終的な認識結果と
    して出力する請求項1記載の音声認識装置。
  5. 【請求項5】 前記認識判定部(2)は、前記複数の音
    声認識部(1)で最も近いとして得られた上位候補につ
    いてそれぞれの複数の音声認識部(1)での認識距離、
    順位を重みとして入力音声に最も近いと判断する請求項
    記載4の音声認識装置。
  6. 【請求項6】 音声を認識して各種機器を制御するため
    の音声認識装置であって、 音声を捕捉する一つのマイクロフォン(200)と、 入力音声と基準音声とを比較し、基準音声の複数の有力
    候補を導出し、それらの候補と入力音声との近さを認識
    距離として出力する一つの音声認識部(1)と、 前記一つの音声認識部(1)から得られた第1の候補と
    他の候補との認識距離の差が一定の関係に有るものを良
    しと判断し、さらに判断されたものの中から最も良いも
    のを最終的な候補として出力する前記認識判定部(2)
    と、 複数の基準音声を生成し、前記一つの音声認識部(1)
    に設けられた複数の辞書部(4)と、 前記マイクロフォン(200)からの音声を記憶し前記
    複数の基準音声との比較毎に前記一つの音声認識部
    (1)に入力音声を送出する音声記憶手段(6)とを備
    える音声認識装置。
  7. 【請求項7】 一対の音声認識部(1)及び辞書部
    (4)を複数設け、前記一対の音声認識部(1)及び辞
    書部(4)が基準音声との比較を行う都度前記音声記憶
    手段(6)から記憶された入力音声が前記音声認識部
    (1)に送出される請求項6記載の音声認識装置。
  8. 【請求項8】 音声を認識して各種機器を制御するため
    の音声認識装置であって、 音声を捕捉する複数のマイクロフォン(200)と、 該複数のマイクロフォン(200)からの音声を記憶す
    る複数の音声記憶手段(6)と、 該複数の音声記憶手段(6)に記憶された複数の入力音
    声を逐次入力音声と基準音声とを比較し、基準音声の複
    数の有力候補を導出し、それらの候補と入力音声との近
    さを認識距離として出力する一つの音声認識部(1)
    と、 前記一つの音声認識部(1)から得られた第1の候補と
    他の候補との認識距離の差が一定の関係に有るものを良
    しと判断し、さらに判断されたものの中から最も良いも
    のを最終的な候補として出力する認識判定部(2)とを
    備えることを特徴とする音声認識装置。
  9. 【請求項9】 前記認識判定部(2)は、入力音声から
    切り出された音声区間及び雑音区間から得られた音声パ
    ワー及び雑音パワーによるS/N比から最終判断の候補
    の一つとして選ばれる請求項6又は8記載の音声認識装
    置。
  10. 【請求項10】 音声を認識して各種機器を制御するた
    めの音声認識装置であって、 音声を捕捉する複数のマイクロフォン(200)と、 該複数のマイクロフォン(200)からの音声を記憶す
    る複数の音声記憶手段(6)と、 該複数の音声記憶手段(6)に記憶された複数の入力音
    声を逐次入力音声と基準音声とを比較し、基準音声の複
    数の有力候補を導出し、それらの候補と入力音声との近
    さを認識距離として出力する複数の音声認識部(1)
    と、 各前記複数のマイクロフォン(200)について前記複
    数の音声認識部(1)から得られた第1の候補で一致す
    るものをそれぞれ複数抽出し、抽出された中で最も多く
    一致するものを最終的な候補として出力する認識判定部
    (2)とを備えることを特徴とする音声認識装置。
JP23694592A 1992-09-04 1992-09-04 音声認識装置 Withdrawn JPH0683388A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23694592A JPH0683388A (ja) 1992-09-04 1992-09-04 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23694592A JPH0683388A (ja) 1992-09-04 1992-09-04 音声認識装置

Publications (1)

Publication Number Publication Date
JPH0683388A true JPH0683388A (ja) 1994-03-25

Family

ID=17008084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23694592A Withdrawn JPH0683388A (ja) 1992-09-04 1992-09-04 音声認識装置

Country Status (1)

Country Link
JP (1) JPH0683388A (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323196A (ja) * 2002-05-08 2003-11-14 Nec Corp 音声認識システム、音声認識方法および音声認識用プログラム
JP2004325688A (ja) * 2003-04-23 2004-11-18 Toyota Motor Corp 音声認識システム
JP2005195834A (ja) * 2004-01-07 2005-07-21 Sony Corp 音声認識装置および方法、並びに、プログラムおよび記録媒体
KR100504982B1 (ko) * 2002-07-25 2005-08-01 (주) 메카트론 환경 적응형 다중 음성인식 장치 및 음성인식 방법
JP2005524859A (ja) * 2001-12-29 2005-08-18 モトローラ・インコーポレイテッド 多重レベル分散型音声認識のための方法および装置
JP2007256643A (ja) * 2006-03-23 2007-10-04 Denso Corp 音声認識装置及びナビゲーションシステム
JP2008089625A (ja) * 2006-09-29 2008-04-17 Honda Motor Co Ltd 音声認識装置、音声認識方法及び音声認識プログラム
JP2009141942A (ja) * 2007-11-14 2009-06-25 Canon Inc 情報処理装置及び情報処理方法及びプログラム及び記憶媒体
JP2010091675A (ja) * 2008-10-06 2010-04-22 Mitsubishi Electric Corp 音声認識装置
US8244533B2 (en) 2002-12-12 2012-08-14 Alpine Electronics, Inc. Speech recognition performance improvement method and speech recognition device
JPWO2011121978A1 (ja) * 2010-03-29 2013-07-04 日本電気株式会社 音声認識システム、装置、方法、およびプログラム
KR20130088637A (ko) * 2012-01-31 2013-08-08 삼성전자주식회사 디스플레이장치 및 그 음성인식방법
JP2014186184A (ja) * 2013-03-25 2014-10-02 Panasonic Corp 音声入力選択装置及び音声入力選択方法
WO2016006038A1 (ja) * 2014-07-08 2016-01-14 三菱電機株式会社 音声認識システム及び音声認識方法
JP2016517023A (ja) * 2013-07-18 2016-06-09 三菱電機株式会社 音響信号を処理する方法
JP2017049537A (ja) * 2015-09-04 2017-03-09 株式会社東芝 操作装置、訂正方法およびプログラム
JP2020086048A (ja) * 2018-11-21 2020-06-04 株式会社リコー 音声認識システム、及び音声認識方法
WO2021008534A1 (zh) * 2019-07-15 2021-01-21 华为技术有限公司 一种语音唤醒的方法和电子设备

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005524859A (ja) * 2001-12-29 2005-08-18 モトローラ・インコーポレイテッド 多重レベル分散型音声認識のための方法および装置
JP2003323196A (ja) * 2002-05-08 2003-11-14 Nec Corp 音声認識システム、音声認識方法および音声認識用プログラム
KR100504982B1 (ko) * 2002-07-25 2005-08-01 (주) 메카트론 환경 적응형 다중 음성인식 장치 및 음성인식 방법
US8244533B2 (en) 2002-12-12 2012-08-14 Alpine Electronics, Inc. Speech recognition performance improvement method and speech recognition device
JP2004325688A (ja) * 2003-04-23 2004-11-18 Toyota Motor Corp 音声認識システム
JP4706893B2 (ja) * 2004-01-07 2011-06-22 ソニー株式会社 音声認識装置および方法、並びに、プログラムおよび記録媒体
JP2005195834A (ja) * 2004-01-07 2005-07-21 Sony Corp 音声認識装置および方法、並びに、プログラムおよび記録媒体
JP2007256643A (ja) * 2006-03-23 2007-10-04 Denso Corp 音声認識装置及びナビゲーションシステム
JP2008089625A (ja) * 2006-09-29 2008-04-17 Honda Motor Co Ltd 音声認識装置、音声認識方法及び音声認識プログラム
JP2009141942A (ja) * 2007-11-14 2009-06-25 Canon Inc 情報処理装置及び情報処理方法及びプログラム及び記憶媒体
JP2010091675A (ja) * 2008-10-06 2010-04-22 Mitsubishi Electric Corp 音声認識装置
JPWO2011121978A1 (ja) * 2010-03-29 2013-07-04 日本電気株式会社 音声認識システム、装置、方法、およびプログラム
KR20130088637A (ko) * 2012-01-31 2013-08-08 삼성전자주식회사 디스플레이장치 및 그 음성인식방법
JP2014186184A (ja) * 2013-03-25 2014-10-02 Panasonic Corp 音声入力選択装置及び音声入力選択方法
JP2016517023A (ja) * 2013-07-18 2016-06-09 三菱電機株式会社 音響信号を処理する方法
WO2016006038A1 (ja) * 2014-07-08 2016-01-14 三菱電機株式会社 音声認識システム及び音声認識方法
CN106663421A (zh) * 2014-07-08 2017-05-10 三菱电机株式会社 声音识别系统以及声音识别方法
US10115394B2 (en) 2014-07-08 2018-10-30 Mitsubishi Electric Corporation Apparatus and method for decoding to recognize speech using a third speech recognizer based on first and second recognizer results
JP2017049537A (ja) * 2015-09-04 2017-03-09 株式会社東芝 操作装置、訂正方法およびプログラム
JP2020086048A (ja) * 2018-11-21 2020-06-04 株式会社リコー 音声認識システム、及び音声認識方法
WO2021008534A1 (zh) * 2019-07-15 2021-01-21 华为技术有限公司 一种语音唤醒的方法和电子设备
CN112712803A (zh) * 2019-07-15 2021-04-27 华为技术有限公司 一种语音唤醒的方法和电子设备
CN112712803B (zh) * 2019-07-15 2022-02-25 华为技术有限公司 一种语音唤醒的方法和电子设备

Similar Documents

Publication Publication Date Title
US7409341B2 (en) Speech recognizing apparatus with noise model adapting processing unit, speech recognizing method and computer-readable medium
JPH0683388A (ja) 音声認識装置
US5167004A (en) Temporal decorrelation method for robust speaker verification
US7529665B2 (en) Two stage utterance verification device and method thereof in speech recognition system
US6134527A (en) Method of testing a vocabulary word being enrolled in a speech recognition system
EP1355295B1 (en) Speech recognition apparatus, speech recognition method, and computer-readable recording medium in which speech recognition program is recorded
US4910782A (en) Speaker verification system
US5621849A (en) Voice recognizing method and apparatus
US4937870A (en) Speech recognition arrangement
JPH04255900A (ja) 音声認識装置
KR100737358B1 (ko) 음성/비음성 검증 방법 및 이를 이용한 음성 인식 장치
JPH04318900A (ja) 多方向同時収音式音声認識方法
EP0177854B1 (en) Keyword recognition system using template-concatenation model
Rohlicek Word spotting
EP1063634A2 (en) System for recognizing utterances alternately spoken by plural speakers with an improved recognition accuracy
JPH11249688A (ja) 音声認識装置およびその方法
JP3357752B2 (ja) パターンマッチング装置
JP2001013988A (ja) 音声認識方法及び装置
JPH0119597B2 (ja)
JPH1185189A (ja) 音声認識装置
JPS6336678B2 (ja)
JPH01185599A (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置
JPH05210396A (ja) 音声認識装置
JPS62111292A (ja) 音声認識装置

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19991130