JP3119510B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3119510B2
JP3119510B2 JP03281245A JP28124591A JP3119510B2 JP 3119510 B2 JP3119510 B2 JP 3119510B2 JP 03281245 A JP03281245 A JP 03281245A JP 28124591 A JP28124591 A JP 28124591A JP 3119510 B2 JP3119510 B2 JP 3119510B2
Authority
JP
Japan
Prior art keywords
voice
urgency
pattern
registered
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03281245A
Other languages
English (en)
Other versions
JPH05119792A (ja
Inventor
敬 有吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP03281245A priority Critical patent/JP3119510B2/ja
Publication of JPH05119792A publication Critical patent/JPH05119792A/ja
Application granted granted Critical
Publication of JP3119510B2 publication Critical patent/JP3119510B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、発声の緊急性を検出し
てその緊急性に応じて認識処理を変更する技術に係り、
特に音声による指示の内で緊急停止等の緊急性のある指
示が含まれる音声認識アプリケーション(機械、車両、
及び、これらのシミュレーションシステム、ゲーム等)
に利用される音声認識装置に関する。
【0002】
【従来の技術】音声認識装置の実用化において、発声変
動がしばしば問題になっている。この発声変動の周知の
ものとしては、例えば、音声の経時変化、騒音下の発声
変動(ロンバード効果)、発声様式(孤立発声の単語と
連続発声中の単語)の違いによる変動、発声時の話者の
感情の違いによる変動等がある。このような発声変動に
より登録時の音声と実際の認識時の音声とに違いが生
じ、音声認識処理を行う上で問題となっている。
【0003】そこで、音声による指示のうちで緊急停止
等の緊急性のある指示とそうでない平常時のみの指示と
が混在する音声認識アプリケーションを考えてみると、
緊急性のある音声指示は緊急時に行われるため、平常時
に登録された音声に対して大きくなったり、高くなった
り、速くなったりする。したがって、緊急時の音声指示
は平常時の音声指示より認識率が低くなってしまう。
【0004】また、緊急時と平常時とでは認識対象とな
る候補はそれぞれ異なると考えられているが、従来の音
声認識装置にあっては、入力音声に緊急性があるか否か
を判断する機能がないので、緊急時と平常時とで認識対
象となる候補を変更したり、いずれかの候補を認識し易
くしたり、又は、いずれかの候補を認識し難くすること
ができなかった。
【0005】そして、緊急時には、誤認識とリジェクト
とは同様の結果しかもたらさない場合が多いので、リジ
ェクトを中止し、正答率=正答数/試行数を上げる必要
がある。しかし、従来の音声認識装置では、パターンマ
ッチングの第一位の候補の信頼性が低い場合、リジェク
トを行い、正答率を下げても、認識率=正答数/(試行
数−リジェクト数)を上げるようにしているため、緊急
時に対応して正答率を上げることはできなかった。
【0006】さらに、緊急性のある音声指示に対しては
特に正確な認識が要求されるため、従来にあっては、特
に、平常時と緊急時とを混在させて使用する場合、緊急
性のある音声指示には音声認識は適さないというのが一
般的な常識となっていた。
【0007】このような問題点を解決し、緊急性のある
音声の認識率を高めた従来技術として、例えば、特公平
2−30039号公報に開示された「音声認識装置」が
ある。これは、入力音声パターンと、重要性(緊急性)
の高い特定登録音声パターン及びその他の重要性の低い
登録音声パターンとの間で類似度を求め、重要性の高い
特定登録音声パターンと入力音声パターンとの類似度に
重み付けを行うことにより、重要性の高い音声に対する
認識率を高めたものである。
【0008】
【発明が解決しようとする課題】しかしながら、重要性
の高い音声が一位候補に選ばれ易くなった分、その他の
音声は一位候補に選ばれ難くなり、重要性の高くない平
常の音声指示に対する認識率が低くなる。また、重要性
のある音声指示の数は、通常、その他の音声指示より少
ないので、ほぼ全単語に対する認識率も低くなることに
なる。さらに、緊急時と平常時との区別がないので、上
述したような問題点が、常に存在することになる。
【0009】
【課題を解決するための手段】請求項1記載の発明で
は、入力音声から緊急時に発せられたものか否かの緊急
性を検出する緊急性検出手段と、前記入力音声を分析し
て入力音声パターンを生成する入力音声パターン生成手
段と、予め登録された複数の登録音声標準パターンを記
憶する登録音声標準パターン記憶手段と、前記入力音声
パターンと前記登録音声標準パターンとのマッチングを
行うことによりこれらの各登録音声標準パターンに対す
る前記入力音声パターンのパターン間距離を求めるマッ
チング手段と、前記パターン間距離に基づいて認識結果
を判定する認識判定手段とよりなり、前記登録音声標準
パターン記憶手段は、登録された各々の登録音声標準パ
ターンに緊急性があるか否かの緊急性情報を併せて記憶
し、前記マッチング手段は、前記緊急性検出手段により
検出された緊急性と前記登録音声標準パターン記憶手段
に記憶された緊急性情報とに対応してマッチングを行う
ようにした
【0010】請求項2記載の発明では、入力音声から緊
急時に発せられたものか否かの緊急性を検出する緊急性
検出手段と、前記入力音声を分析して入力音声パターン
を生成する入力音声パターン生成手段と、予め登録され
た複数の登録音声標準パターンを記憶する登録音声標準
パターン記憶手段と、前記入力音声パターンと前記登録
音声標準パターンとのマッチングを行うことによりこれ
らの各登録音声標準パターンに対する前記入力音声パタ
ーンのパターン間距離を求めるマッチング手段と、前記
パターン間距離に基づいて認識結果を判定する認識判定
手段とよりなり、前記認識判定手段は、前記緊急性検出
手段により検出された緊急性に対応してリジェクト条件
を変更させて認識結果を判定するようにした。
【0011】
【0012】
【0013】請求項記載の発明では、請求項1又は2
記載の発明において、緊急性検出手段は、緊急性を示す
パラメータとして音声のパワーを検出する。
【0014】請求項記載の発明では、請求項1又は2
記載の発明において、緊急性検出手段は、緊急性を示す
パラメータとして音声のピッチを検出する。
【0015】請求項記載の発明では、請求項1又は2
記載の発明において、緊急性検出手段は、緊急性を示す
パラメータとして音声の発声速度を検出する。
【0016】請求項記載の発明では、請求項1又は2
記載の発明において、緊急性検出手段は、緊急性を示す
パラメータとして音声のパワーと音声のピッチと音声の
発声速度とを含む複数のパラメータを併用する。
【0017】
【作用】請求項1記載の発明においては、緊急性検出手
段にて検出された入力音声の緊急性と、登録音声標準パ
ターン記憶手段に記憶された各々の登録音声標準パター
ンの緊急性情報とに対応してマッチング手段にてパター
ン間距離を求めることによって、緊急性のある入力音声
を緊急時に認識し易くすることが可能となり、これによ
り、平常時の音声認識性能を損なわずに緊急時の音声認
識性能を向上させることが可能となる。
【0018】請求項2記載の発明においては、入力音声
の緊急性に対応して認識結果のリジェクトの条件を変更
させることによって、緊急時にリジェクトを少なくして
正答率を上げることが可能となり、これにより、平常時
の音声認識性能を損なわずに緊急時の音声認識性能を向
上させることが可能となる。
【0019】
【0020】
【0021】請求項記載の発明においては、音声のパ
ワーを検出することにより、緊急性を的確に捉えること
が可能となる。
【0022】請求項記載の発明においては、音声のピ
ッチを検出することにより、緊急性を的確に捉えること
が可能となる。
【0023】請求項記載の発明においては、音声の発
声速度を検出することにより、緊急性を的確に捉えるこ
とが可能となる。
【0024】請求項記載の発明においては、音声のパ
ワーと音声のピッチと音声の発声速度とを含む複数のパ
ラメータを併用することにより、パラメータが1つの場
合に比べて緊急性をより一層的確に捉えることが可能と
なる。
【0025】
【実施例】本発明の第一の実施例を図1に基づいて説明
する。まず、本実施例の全体構成の概略を図1に基づい
て述べる。音声が入力される図示しないマイクロフォン
の出力側には、緊急性検出手段としての緊急性検出部1
と、入力音声パターン生成手段としての入力音声パター
ン生成部2とが並列に接続されている。この入力音声パ
ターン生成部2の出力側には、マッチング手段としての
マッチング部3、認識判定手段としての認識判定部4が
順次直列に接続されている。また、前記マッチング部3
には、登録音声標準パターン記憶手段としての登録音声
標準パターン記憶部5が接続されている。さらに、前記
緊急性検出部1の出力側は、前記入力音声パターン生成
部2と、前記マッチング部3と、前記認識判定部4とに
並列に接続されている。すなわち、AB間と、AC間
と、AD間とが接続された状態になっている。
【0026】このような構成において、まず、本実施例
で行われる音声認識処理の概略を説明する。緊急性検出
部1にてマイクロフォンから入力された入力音声から緊
急性を検出し、同時に入力音声パターン生成部2にて入
力音声を分析して入力音声パターンを生成する。この入
力音声パターンと登録音声標準パターン記憶部5に予め
登録された複数の登録音声標準パターンとの間でマッチ
ング部3にてマッチングを行うことにより、これらの各
登録音声標準パターンに対する入力音声パターンのパタ
ーン間距離を求める。そして、認識判定部4にてパター
ン間距離に基づいて認識結果を判定する。
【0027】次に、上述した音声認識処理について具体
的に説明する。まず、緊急性検出部1では、マイクロフ
ォンから入力された入力音声から緊急性を検出する。こ
こに、緊急時の入力音声は、平常の音声に対して、大き
くなったり、高くなったり、速くなったりするので、そ
れぞれ、音声のパワー、音声のピッチ、音声の発声速度
を検出することによって、入力音声に緊急性があるか否
かを検出することが可能である。本実施例では緊急性を
示すパラメータとして音声のパワーを用いる。すなわ
ち、1つの入力音声の平均パワーが一定の閾値以上であ
る場合を緊急性あり、それ以外の場合を緊急性なしとす
る。これにより、緊急性を的確に捉えることが可能とな
る。
【0028】また、入力音声パターン生成部2では、入
力された入力音声に対して音声区間検出処理と音響分析
処理とを行い、音声区間中の音響分析データから入力音
声パターンを生成する。すなわち、周知の処理方法を用
いて、音声区間検出処理は音声のパワーと閾値とを比較
することにより行い、音響分析処理はLPCケプストラ
ム分析により行う。これにより、入力音声パターンのパ
ラメータはLPCケプストラムと音声のパワーとにな
る。但し、緊急性検出部1にて緊急性が検出された場
合、周知の補正方法を用いて入力音声パターンの補正を
行う。すなわち、大声で発声された音声(緊急時の音
声)は、平常時の音声と比べてレベルだけでなく周波数
軸上でも歪を生じることが周知となっており、騒音下で
の発声変動(ロンバード効果)がこれに該当する。この
ような発声変動に起因する入力音声パターンの歪を周知
の補正方法を用いて補正する。
【0029】なお、上述の音声区間検出処理と音響分析
処理とに用いた周知の処理方法については、例えば、
「ディジタル音声処理」、古井著、東海大学出版会等に
記載されている。また、上述の騒音下での発声変動に対
する周知の補正方法については、例えば、「雑音下での
発声変形に対するホルマント移動による補正法の性能評
価」、滝沢他、音響学会講演論文集、1−8−9、平成
2年9月に記載されている。
【0030】一方、登録音声標準パターン記憶部5に
は、予め登録された複数の登録音声標準パターンを記憶
すると共に、これらの登録音声標準パターンの各々に緊
急性があるか否かの緊急性情報を併せて記憶しておく。
但し、登録音声標準パターンのパラメータは、入力音声
パターンのパラメータと同様にLPCケプストラムと音
声のパワーとである。ここに、登録音声標準パターン記
憶部5に記憶された単語セットと各々の単語の緊急性情
報との一例を表1に示す。
【0031】
【表1】
【0032】表1に示すように、緊急性が1である停
止、右、左の単語は緊急性があり得て、その他の緊急性
が0である前進、後退、加速、減速の単語は緊急性があ
り得ないように設定されている。なお、表1に示す例で
は、緊急性があるか無いかが1か0の2値で表現されて
いるが、連続量(0から1までの実数)で表現しても同
様に実施可能である。この場合には、緊急性をさらに正
確に検出することが可能となる。
【0033】そして、マッチング部3では、入力音声パ
ターン生成部2により得られた入力音声パターンと、登
録音声標準パターン記憶部5に記憶された登録音声標準
パターンとの間で周知のDP(ダイナミックプログラミ
ング)マッチングを行い、各登録音声標準パターンと入
力音声パターンとの間のパターン間距離を求める。但
し、緊急性検出部1で緊急性が検出された場合、登録音
声標準パターン記憶部5に記憶された複数の登録音声標
準パターンの内、緊急性があり得ることを示している登
録音声標準パターンに関しては、入力音声パターンとの
間のパターン間距離が小さくなるように1より小さい定
数を乗じてパターン間距離を補正する。
【0034】さらに、認識判定部4では、マッチング部
3で得られたパターン間距離を用いて認識結果を判定す
る。すなわち、最小のパターン間距離と2番目に小さい
パターン間距離との比が1より大きいリジェクト閾値以
上の場合には、最小のパターン間距離を与えた登録音声
標準パターンの音声を認識結果とし、それ以外の場合に
はリジェクトする。但し、緊急性検出部1で緊急性が検
出された場合には、リジェクト閾値を小さくするか、1
に等しくして緊急性のある音声を認識し易くする。
【0035】上述したように、緊急性検出部1にて検出
された入力音声の緊急性に対応して音声認識処理を行う
ことによって、入力音声パターンを補正して緊急時の発
声変動による認識率の低下を防止することが可能とな
り、しかも、緊急性のある音声を緊急時に認識し易くす
ることが可能となり、さらに、緊急時にリジェクトを少
なくして正答率を上げることが可能となり、これによ
り、平常時の音声認識性能を損なわずに緊急時の音声認
識性能を向上させることが可能となる。
【0036】なお、本実施例では、緊急性を示すパラメ
ータとして音声のパワーを用いたが、上述の音声のピッ
チや音声の発声速度を用いても同様に実施可能である。
ここに、緊急性を示すパラメータとして、音声のピッチ
を用いる場合には、1つの音声のピッチの平均値が一定
の閾値以上であれば緊急性あり、それ以外であれば緊急
性なしとする。この場合、音声のピッチの抽出には、周
知のケプストラム分析による方法が用いられる。このよ
うに、音声のピッチを用いても緊急性を的確に捉えるこ
とが可能となる。
【0037】また、緊急性を示すパラメータとして、音
声の発声速度を用いる場合には、音声の発声速度が一定
の閾値以上であれば緊急性あり、それ以外であれば緊急
性なしとする。この場合、音声の発声速度は単位時間当
りのパワーのピークとディップとから求めることが可能
である。このように、音声の発声速度を用いても緊急性
を的確に捉えることが可能となる。但し、緊急性を示す
パラメータとして、発声速度を用いる場合、マッチング
部3のマッチングのパスの制限を変えることによって
も、緊急性のある入力音声の認識を良好なものにするこ
とが可能となる。
【0038】さらに、上述の音声のパワーと、音声のピ
ッチと、音声の発声速度との緊急性を示すパラメータ、
或いは、その他のパラメータを重み付けした後に加算す
ることにより併用することも可能である。このように複
数のパラメータを併用すれば、パラメータが1つの場合
に比べて緊急性をより一層的確に捉えることが可能とな
る。
【0039】次に、本発明の第二の実施例を図2に基づ
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図2に示すように、緊急性検出部1の出
力側は、入力音声パターン生成部2に接続されている。
また、その接続状態は、AB間のみが接続されており、
図1に示した第一の実施例のようにAC間、AD間が接
続されていない状態になっている。
【0040】このような構成において、本実施例で行わ
れる音声認識処理を図2に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、図示しないマイクロフォンから入力
された入力音声から緊急性を検出する。すなわち、1つ
の入力音声の平均パワーが一定の閾値以上である場合を
緊急性あり、それ以外の場合を緊急性なしとする。ま
た、入力音声パターン生成部2では、入力音声パターン
のパラメータとしてLPCケプストラムと音声のパワー
とを用い、入力音声に対して音声区間検出処理と音響分
析処理とを行うことにより、音声区間中の音響分析デー
タから入力音声パターンを生成する。但し、緊急性検出
部1にて緊急性が検出された場合、入力音声パターンの
補正を行う。一方、登録音声標準パターン記憶部5に
は、予め登録された複数の登録音声標準パターンを記憶
しておく。この登録音声標準パターンのパラメータは、
入力音声パターンのパラメータと同様にLPCケプスト
ラムと音声のパワーとである。そして、マッチング部3
により、入力音声パターン生成部2にて得られた入力音
声パターンと、登録音声標準パターン記憶部5に記憶さ
れた登録音声標準パターンとの間で周知のDPマッチン
グを行い、各登録音声標準パターンと入力音声パターン
との間のパターン間距離を求める。さらに、認識判定部
4によりマッチング部3で得られたパターン間距離を用
いて認識結果を判定する。すなわち、最小のパターン間
距離を与えた登録音声標準パターンの音声を認識結果と
し、それ以外の音声をリジェクトする。
【0041】上述したように、入力音声の緊急性に対応
して入力音声パターンの補正を行うことによって、緊急
時の発声変動による認識率の低下を防止することが可能
となり、これにより、平常時の音声認識性能を損なわず
に緊急時の音声認識性能を向上させることが可能とな
る。
【0042】なお、本実施例では、緊急性検出部1の緊
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
【0043】次に、本発明の第三の実施例を図3に基づ
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図3に示すように、緊急性検出部1の出
力側は、マッチング部3に接続されている。また、その
接続状態は、AC間が接続されており、図1に示した第
一の実施例のようにAB間、AD間が接続されていない
状態になっている。
【0044】このような構成において、本実施例で行わ
れる音声認識処理を図3に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、マイクロフォンから入力された入力
音声から緊急性を検出する。すなわち、1つの入力音声
の平均パワーが一定の閾値以上である場合を緊急性あ
り、それ以外の場合を緊急性なしとする。また、入力音
声パターン生成部2では、入力音声パターンのパラメー
タとしてLPCケプストラムと音声のパワーとを用い
て、入力音声に対して音声区間検出処理と音響分析処理
とを行うことにより、音声区間中の音響分析データから
入力音声パターンを生成する。一方、登録音声標準パタ
ーン記憶部5には、予め登録された複数の登録音声標準
パターンを記憶すると共に、これらの登録音声標準パタ
ーンの各々に緊急性があるか否かの緊急性情報を併せて
記憶しておく。この登録音声標準パターンのパラメータ
は、入力音声パターンのパラメータと同様にLPCケプ
ストラムと音声のパワーとである。そして、マッチング
部3により、入力音声パターン生成部2にて得られた入
力音声パターンと、登録音声標準パターン記憶部5に記
憶された登録音声標準パターンとの間で周知のDPマッ
チングを行い、各登録音声標準パターンと入力音声パタ
ーンとの間のパターン間距離を求める。但し、緊急性検
出部1で緊急性が検出された場合、登録音声標準パター
ン記憶部5に記憶された複数の登録音声標準パターンの
内、緊急性があり得ることを示している登録音声標準パ
ターンに関しては、入力音声パターンとの間のパターン
間距離が小さくなるように1より小さい定数を乗じてパ
ターン間距離を補正する。これにより、緊急性のある入
力音声を認識し易くさせる。さらに、認識判定部4によ
りマッチング部3で得られたパターン間距離を用いて認
識結果を判定する。すなわち、最小のパターン間距離を
与えた登録音声標準パターンの音声を認識結果とし、そ
れ以外の音声をリジェクトする。
【0045】上述したように、入力音声の緊急性と各々
の登録音声標準パターンの緊急性情報とに対応してパタ
ーン間距離を求めているため、緊急性のある入力音声を
緊急時に認識し易くすることが可能となり、これによ
り、平常時の音声認識性能を損なわずに緊急時の音声認
識性能を向上させることが可能となる。
【0046】なお、本実施例では、緊急性検出部1の緊
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
【0047】次に、本発明の第四の実施例を図4に基づ
いて説明する。なお、第一の実施例(図1参照)におい
て説明した部分と同一部分については同一符号を用い、
その説明も省略する。本実施例の構成は、図1に示した
第一の実施例の構成と比べて接続状態が異なるものであ
る。すなわち、図4に示すように、緊急性検出部1の出
力側は、認識判定部4に接続されている。また、その接
続状態は、AD間が接続されており、図1に示した第一
の実施例のようにAB間、AC間が接続されていない状
態になっている。
【0048】このような構成において、本実施例で行わ
れる音声認識処理を図4に基づいて説明する。まず、緊
急性検出部1では、緊急性を示すパラメータとして音声
のパワーを用いて、マイクロフォンから入力された入力
音声から緊急性を検出する。すなわち、1つの入力音声
の平均パワーが一定の閾値以上である場合を緊急性あ
り、それ以外の場合を緊急性なしとする。また、入力音
声パターン生成部2では、入力音声パターンのパラメー
タとしてLPCケプストラムと音声のパワーとを用い
て、入力音声に対して音声区間検出処理と音響分析処理
とを行うことにより、音声区間中の音響分析データから
入力音声パターンを生成する。一方、登録音声標準パタ
ーン記憶部5には、予め登録された複数の登録音声標準
パターンを記憶しておく。この登録音声標準パターンの
パラメータは、入力音声パターンのパラメータと同様に
LPCケプストラムと音声のパワーとである。そして、
マッチング部3により、入力音声パターン生成部2にて
得られた入力音声パターンと、登録音声標準パターン記
憶部5に記憶された登録音声標準パターンとの間で周知
のDPマッチングを行い、各登録音声標準パターンと入
力音声パターンとの間のパターン間距離を求める。さら
に、認識判定部4によりマッチング部3で得られたパタ
ーン間距離を用いて認識結果を判定する。すなわち、最
小のパターン間距離を与えた登録音声標準パターンの音
声を認識結果とし、それ以外の音声をリジェクトする。
但し、緊急性検出部1で緊急性が検出された場合には、
リジェクト閾値を小さくするか、1に等しくして緊急性
のある入力音声がリジェクトされ難くすることにより、
緊急時の入力音声の認識率を向上させることが可能とな
る。
【0049】上述したように、入力音声の緊急性に対応
して認識判定部4のリジェクトの条件を変更させること
によって、緊急時にリジェクトを少なくして正答率を上
げることが可能となり、これにより、平常時の音声認識
性能を損なわずに緊急時の音声認識性能を向上させるこ
とが可能となる。
【0050】なお、本実施例では、緊急性検出部1の緊
急性を示すパラメータとして音声のパワーを用いたが、
音声のピッチや音声の発声速度を用いても同様に実施可
能である。さらに、音声のパワーと、音声のピッチと、
音声の発声速度との緊急性を示すパラメータ、或いは、
その他のパラメータを重み付けした後に、加算すること
により併用することも可能である。
【0051】
【発明の効果】請求項1記載の発明は、入力音声から
急時に発せられたものか否かの緊急性を検出する緊急性
検出手段と、前記入力音声を分析して入力音声パターン
を生成する入力音声パターン生成手段と、予め登録され
た複数の登録音声標準パターンを記憶する登録音声標準
パターン記憶手段と、前記入力音声パターンと前記登録
音声標準パターンとのマッチングを行うことによりこれ
らの各登録音声標準パターンに対する前記入力音声パタ
ーンのパターン間距離を求めるマッチング手段と、前記
パターン間距離に基づいて認識結果を判定する認識判定
手段とよりなり、前記登録音声標準パターン記憶手段
は、登録された各々の登録音声標準パターンに緊急性が
あるか否かの緊急性情報を併せて記憶し、前記マッチン
グ手段は、前記緊急性検出手段により検出された緊急性
と前記登録音声標準パターン記憶手段に記憶された緊急
性情報とに対応してマッチングを行うようにしたので、
緊急性検出手段にて検出された入力音声の緊急性と、登
録音声標準パターン記憶手段に記憶された各々の登録音
声標準パターンの緊急性情報とに対応してマッチング手
段にてパターン間距離を求めることによって、緊急性の
ある入力音声を緊急時に認識し易くすることが可能とな
り、これにより、平常時の音声認識性能を損なわずに緊
急時の音声認識性能を向上させることができるものであ
る。
【0052】請求項2記載の発明は、入力音声から緊急
時に発せられたものか否かの緊急性を検出する緊急性検
出手段と、前記入力音声を分析して入力音声パターンを
生成する入力音声パターン生成手段と、予め登録された
複数の登録音声標準パターンを記憶する登録音声標準パ
ターン記憶手段と、前記入力音声パターンと前記登録音
声標準パターンとのマッチングを行うことによりこれら
の各登録音声標準パターンに対する前記入力音声パター
ンのパターン間距離を求めるマッチング手段と、前記パ
ターン間距離に基づいて認識結果を判定する認識判定手
段とよりなり、前記認識判定手段は、前記緊急性検出手
段により検出された緊急性に対応してリジェクト条件を
変更させて認識結果を判定するようにしたので、入力音
声の緊急性に対応して認識結果のリジェクトの条件を変
更させることによって、緊急時にリジェクトを少なくし
て正答率を上げることが可能となり、これにより、平常
時の音声認識性能を損なわずに緊急時の音声認識性能を
向上させることができるものである。
【0053】
【0054】
【0055】請求項記載の発明は、請求項1又は2
載の発明において、緊急性検出手段は、緊急性を示すパ
ラメータとして音声のパワーを検出するので、緊急性を
的確に捉えることができるものである。
【0056】請求項記載の発明は、請求項1又は2
載の発明において、緊急性検出手段は、緊急性を示すパ
ラメータとして音声のピッチを検出するので、緊急性を
的確に捉えることができるものである。
【0057】請求項記載の発明は、請求項1又は2
載の発明において、緊急性検出手段は、緊急性を示すパ
ラメータとして音声の発声速度を検出するので、緊急性
を的確に捉えることができるものである。
【0058】請求項記載の発明は、請求項1又は2
載の発明において、緊急性検出手段は、緊急性を示すパ
ラメータとして音声のパワーと音声のピッチと音声の発
声速度とを含む複数のパラメータを併用するので、パラ
メータが1つの場合に比べて緊急性をより一層的確に捉
えることができるものである。
【図面の簡単な説明】
【図1】本発明の第一の実施例を示すブロック回路図で
ある。
【図2】本発明の第二の実施例を示すブロック回路図で
ある。
【図3】本発明の第三の実施例を示すブロック回路図で
ある。
【図4】本発明の第四の実施例を示すブロック回路図で
ある。
【符号の説明】
1 緊急性検出手段 2 入力音声パターン生成手段 3 マッチング手段 4 認識判定手段 5 登録音声標準パターン記憶手段
フロントページの続き (56)参考文献 特開 平3−203488(JP,A) 特開 平2−127699(JP,A) 特開 平2−87225(JP,A) 特開 昭64−38392(JP,A) 特開 平1−222299(JP,A) 実開 昭61−192301(JP,U) 実開 平1−64568(JP,U) 特公 平2−30039(JP,B2) 特公 平5−58551(JP,B2) 特公 平5−37914(JP,B2) 特表 昭55−500275(JP,A) Proceedings of 24t h the Annual Sympo sium of SAFE Assoc iation (Survival a nd Flight Equipmen t),P.Wetterlind et al,”An Emergency Command Recognizer for Voiced System Control”,p.181−184, 1986 (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 17/00 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声から緊急時に発せられたものか
    否かの緊急性を検出する緊急性検出手段と、前記入力音
    声を分析して入力音声パターンを生成する入力音声パタ
    ーン生成手段と、予め登録された複数の登録音声標準パ
    ターンを記憶する登録音声標準パターン記憶手段と、前
    記入力音声パターンと前記登録音声標準パターンとのマ
    ッチングを行うことによりこれらの各登録音声標準パタ
    ーンに対する前記入力音声パターンのパターン間距離を
    求めるマッチング手段と、前記パターン間距離に基づい
    て認識結果を判定する認識判定手段とよりなり、前記登
    録音声標準パターン記憶手段は、登録された各々の登録
    音声標準パターンに緊急性があるか否かの緊急性情報を
    併せて記憶し、前記マッチング手段は、前記緊急性検出
    手段により検出された緊急性と前記登録音声標準パター
    ン記憶手段に記憶された緊急性情報とに対応してマッチ
    ングを行うようにしたことを特徴とする音声認識装置。
  2. 【請求項2】 入力音声から緊急時に発せられたものか
    否かの緊急性を検出する緊急性検出手段と、前記入力音
    声を分析して入力音声パターンを生成する入力音声パタ
    ーン生成手段と、予め登録された複数の登録音声標準パ
    ターンを記憶する登録音声標準パターン記憶手段と、前
    記入力音声パターンと前記登録音声標準パターンとのマ
    ッチングを行うことによりこれらの各登録音声標準パタ
    ーンに対する前記入力音声パターンのパターン間距離を
    求めるマッチング手段と、前記パターン間距離に基づい
    て認識結果を判定する認識判定手段とよりなり、前記認
    識判定手段は、前記緊急性検出手段により検出された緊
    急性に対応してリジェクト条件を変更させて認識結果を
    判定するようにしたことを特徴とする音声認識装置。
  3. 【請求項3】 緊急性検出手段は、緊急性を示すパラメ
    ータとして音声のパワーを検出することを特徴とする請
    求項1又は2記載の音声認識装置。
  4. 【請求項4】 緊急性検出手段は、緊急性を示すパラメ
    ータとして音声のピッチを検出することを特徴とする請
    求項1又は2記載の音声認識装置。
  5. 【請求項5】 緊急性検出手段は、緊急性を示すパラメ
    ータとして音声の発声速度を検出することを特徴とする
    請求項1又は2記載の音声認識装置。
  6. 【請求項6】 緊急性検出手段は、緊急性を示すパラメ
    ータとして音声のパワーと音声のピッチと音声の発声速
    度とを含む複数のパラメータを併用することを特徴とす
    る請求項1又は2記載の音声認識装置。
JP03281245A 1991-10-28 1991-10-28 音声認識装置 Expired - Fee Related JP3119510B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03281245A JP3119510B2 (ja) 1991-10-28 1991-10-28 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03281245A JP3119510B2 (ja) 1991-10-28 1991-10-28 音声認識装置

Publications (2)

Publication Number Publication Date
JPH05119792A JPH05119792A (ja) 1993-05-18
JP3119510B2 true JP3119510B2 (ja) 2000-12-25

Family

ID=17636384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03281245A Expired - Fee Related JP3119510B2 (ja) 1991-10-28 1991-10-28 音声認識装置

Country Status (1)

Country Link
JP (1) JP3119510B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001287599A (ja) * 2000-04-07 2001-10-16 Kenwood Corp 無線通信機
JP4736404B2 (ja) * 2004-11-11 2011-07-27 日産自動車株式会社 音声認識装置
JP4973722B2 (ja) * 2009-02-03 2012-07-11 株式会社デンソー 音声認識装置、音声認識方法、及びナビゲーション装置
WO2012137263A1 (ja) 2011-04-08 2012-10-11 三菱電機株式会社 音声認識装置およびナビゲーション装置
JP5664480B2 (ja) 2011-06-30 2015-02-04 富士通株式会社 異常状態検出装置、電話機、異常状態検出方法、及びプログラム
JP6983405B2 (ja) * 2017-10-25 2021-12-17 株式会社パロマ 加熱調理器
US11495245B2 (en) 2017-11-29 2022-11-08 Nippon Telegraph And Telephone Corporation Urgency level estimation apparatus, urgency level estimation method, and program
JP7339124B2 (ja) * 2019-02-26 2023-09-05 株式会社Preferred Networks 制御装置、システム及び制御方法
WO2020174930A1 (ja) * 2019-02-26 2020-09-03 株式会社Preferred Networks 制御装置、システム及び制御方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Proceedings of 24th the Annual Symposium of SAFE Association (Survival and Flight Equipment),P.Wetterlind et al,"An Emergency Command Recognizer for Voiced System Control",p.181−184,1986

Also Published As

Publication number Publication date
JPH05119792A (ja) 1993-05-18

Similar Documents

Publication Publication Date Title
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
US5754978A (en) Speech recognition system
US8731925B2 (en) Solution that integrates voice enrollment with other types of recognition operations performed by a speech recognition engine using a layered grammar stack
US5621849A (en) Voice recognizing method and apparatus
JP3119510B2 (ja) 音声認識装置
US6029130A (en) Integrated endpoint detection for improved speech recognition method and system
JP3069531B2 (ja) 音声認識方法
JP2969862B2 (ja) 音声認識装置
Hirschberg et al. Generalizing prosodic prediction of speech recognition errors
JP2996019B2 (ja) 音声認識装置
JP4201470B2 (ja) 音声認識システム
JPH03120598A (ja) 音声認識方法及び装置
KR100940641B1 (ko) 음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법
JP3112037B2 (ja) 音声認識装置
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JPH04369698A (ja) 音声認識方式
JP3075250B2 (ja) 話者認識方法及び装置
JP3008593B2 (ja) 音声認識装置
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
JPH1097269A (ja) 音声検出装置及び方法
KR100677224B1 (ko) 안티워드 모델을 이용한 음성인식 방법
JP3031081B2 (ja) 音声認識装置
JPS6147999A (ja) 音声認識装置
JP3026855B2 (ja) 音声認識装置
JP3533773B2 (ja) 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071013

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081013

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081013

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees