JPS61277999A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS61277999A
JPS61277999A JP60120015A JP12001585A JPS61277999A JP S61277999 A JPS61277999 A JP S61277999A JP 60120015 A JP60120015 A JP 60120015A JP 12001585 A JP12001585 A JP 12001585A JP S61277999 A JPS61277999 A JP S61277999A
Authority
JP
Japan
Prior art keywords
pattern
speech
matching
input
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60120015A
Other languages
English (en)
Inventor
武志 則松
正宏 浜田
明寿 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60120015A priority Critical patent/JPS61277999A/ja
Publication of JPS61277999A publication Critical patent/JPS61277999A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、標準パタンと入力音声パタンとのパタンマツ
チングによる認識結果を導き出す音声認識装置に関する
ものである。
従来の技術 一般に、音声認識装置では、入力音声パタンと辞書に蓄
えられた各標準パタンとの類似度を計算し、類似度の最
大となる標準パタンを認識結果とする方法が行なわれて
いる。二つの音声パタンの類似度を計算するためには動
的計画法(ダイナミック プログラミング法)を用いて
、二つのパタンの時間軸を非線形に伸縮するパタンマツ
チング(以下、DPマツチングと記す。)が使用されて
いる。特に、単語音声認識装置では、とのDPマツチン
グ法により高い認識率を得ている。(例えば、「ダイナ
ミック プログラミング オブティミゼイション フォ
 スポークンワード レコダ= ’y −1ン−J (
H,5akoe and S、 Chiba、Dyna
micprogramming  optimizat
ion  for  spokenword  rec
ognition”、 IRE]E  Tr2Lns、
ムcoustiC,5peech 、 Signal 
 Processsing、 to l 。
ム5SP−27pp。336−349.1979))発
明が解決しようとする問題点 しかしながら上記の音声認識装置では、異なった音声パ
タン間のDPマツチングにおいても、極端な時間軸の非
線形伸縮のため両者の距離がlトさくなる場合があシ、
誤認識を生じる原因となっていた。
また、類似した音声パタン間のDPマツチングでは、音
声パタン全体に渡ってDPマツチングを行なうため、両
者間の違いが埋もれてしまい、その結果、パタン間の距
離が小さくなシ誤認識を生じやすいという問題点を有し
ていた。
本発明は上記問題点に鑑み、類似音声パタン間での誤認
識および極端なりPマツチングによる誤認識を極力抑え
ることのできる音声認識装置を提供するものである。
問題点を解決するだめの手段 上記問題点を解決するために本発明の音声認識装置は入
力音声からエネルギー系列を含む特徴ベクトルの時系列
を出力する音声分析手段と、前記音声分析手段から出力
されるエネルギー系列から、音声パタン中の音声部分と
無音声部分を判別し、無音声区間の個数およびそのフレ
ーム位置を検出する無音区間検出手段と、パタンマツチ
ングにより得られる入力パタンと各標準パタンとの距離
のうち最小値を与えるものから順に複数個選択し、それ
らに対応した各標準パタンと入力パタンとの間で、無音
声区間のフレーム位置の交点をマツチングパスが必ず通
過するように制限を加えたパタンマツチングを行ない、
両者間の距離を算出し、距離の最小となる標準パタンを
認識結果とする認識結果検証手段とを備えたものである
作用 本発明は上記に述べた構成によって、あらかじめ音声パ
タン中の無音区間を検出しておき、パタン全体に渡るパ
タンマツチング後、距離の小さなものから上位複数候補
を選択し、それらと入力音声パタンとの間で無音区間の
フレーム位置を合わせて必ずその交点をマツチングパス
が通過するように制限をしたパタンマツチングを行ない
認識結果の検証を行なうことにより、類似パタン間の誤
認識および極端なマツチングによる誤認識を極力抑える
ことができる。
実施例 以下本発明の一実施例の音声認識装置について、図面を
参照しながら説明する。
第1図は本発明の一実施例における音声認識装置のブロ
ック図である。第1図において、1は音声入力部で、話
者の音声がマイクロホン等を通して入力される。2は音
声分析手段で、入力された音声信号から特徴ベクトルの
時系列を抽出する。
3は無音区間検出手段で、音声のエネルギー系列から無
音区間部分を検出する。4は音声分析手段2より得られ
る特徴ベクトルの時系列を標準パタンとして記憶し、ま
た無音区間検出手段3より得られる無音声区間の個数お
よびそのフレーム位置を記憶する記憶手段、6はパタン
マツチング手段で、記憶手段4により蓄えられた標準パ
タンと入力音声パタンとの間でパタンマツチングを行な
い両者間の距離を算出する。6は認識結果検証手段で、
無音区間検出手段3とパタンマツチング手段6の結果か
ら認識結果の検証を行ない認識候補音声を導き出す。7
は認識結果出方部で、認識結果をLED等に表示する◇ 第2図は本実施例の構成を示す回路図で、上記の無音区
間検出手段3.記憶手段4.パタンマツチング手段5.
認識結果検証手段6をマイクロコンピュータ16で実現
したものである。1oは音声の入力を行なうマイクロホ
ン、11はマイクロポン10から入力された音声信号を
アナログ−ディジタル変換するアナログ−ディジタル変
換器(以下ム/D変換器という。)である。13は入方
音声の特徴ベクトルの時系列を記憶する入力パタンメモ
リ、14は標準パタン音声の特徴ベクトルの時系列を記
憶する標準パタンメモリ、16は認識候補音声を表示す
る認識結果表示器である。
第3図は本実施例のマイクロコンピュータの動作を説明
するだめの要部フローチャートであり、第4図は第3図
のフローチャートを説明するだめの図である。以上の構
成による本実施例の動作を、第3図の70−チャートに
沿って詳細に説明する。
まず、ステップ21でマイクロホン1oから音声を入力
し、ム/D変換器11で音声信号をアナログ−ディジタ
ル変換したあと、音声分析部12で音声パタンの特徴ベ
クトル(例えば、10次元の線形予測係数)の時系列と
エネルギー系列を求め、入力パタンメモリ13に記憶す
る。次に、ステップ22で入力パタンメモリ13に、記
憶されたエネルギー系列からエネルギー値がしきい値を
下回る区間が一定時間TOを超える区間を無音区間とし
て検出し、無音区間の個数と無音区間の最終フレーム位
置を記憶部16bに記憶する。なお、各標準パタンの特
徴ベクトルの時系列が標準パタンメモリ14に、各標準
パタンに対応した無音区間の個数とフレーム位置が記憶
部15bにあらかじめ蓄えられているものとする。
ステップ23では、入力パタンメモリ13に記憶された
入力音声パタンと標準パタンメモリ14に記憶された標
準パタンとの間でDPマツチングを行ない、すべての標
準パタンとのDPマツチングが終了したかをステップ2
4で判定する。ステップ23で得られるDP短距離逐次
記憶部15bに記憶される。ステップ23の条件が満た
されるとステップ25で記憶部16bに記憶されたII
P距離のうち最小値を与えるものから上位複数候補を選
択する。ここでは上位3候補を選択する場合について説
明するが それ以外の場合についても同様に処理できる
まず、ステップ26でカウンタを3にセットする。次に
、ステップ27で第一番目の候補の標準パタンと入力音
声パタンの無音区間の個数が一致するかを判定する。ス
テップ27の条件が満たされるとステップ28以下の処
理によυ両者の距離を算出する。ここでは入力パタンと
標準パタンの無音区間の個数が1つ存在する場合につい
て説明する。
入力パタンのフレーム長をI、その無音区間の最終フレ
ーム位置を”j  +標準パタンのフレーム長をJ、そ
の無音区間の最終フレーム位置を51とする。ステップ
28では、 0<i<11 かつ Jl<j≦J または 11〈1≦工 かつ O<j<Jj の条件を満たす入力パタンの第iフレームと標準パタン
の第jフレームとの特徴ベクトル間の距離を無限大にセ
ットする。この設定は第4図において、斜線の部分に対
応する各ベクトル間距離を無限大に設定することであり
、すなわちマツチングバスが斜線の部分を絶対に通過し
ないように制限を加えたことと等価である。
ステップ28の設定が終ると、ステップ29により入カ
パタンと標準パタン間でDPマツチングを行ない、両者
間の距離を算出し記憶部15bに記憶する。ここで得ら
れる距離は、入力パタンの第三1フレームと標準パタン
の第51 フレームの交点をマツチングパスが必ず通過
するように制限を加えたDPマツチングを行なった時に
得られる結果である。ここで、入力パタンの第三1  
フレームと標準パタンの第11  フレームの交点が整
合窓の範囲を超える場合は両者のDPマツチングは不可
能であるためこの標準パタンは認識候補からはずす。こ
の後、ステップ30でカウンタをデクリメントしステッ
プ31でカウンタが0であるかを判定し、0でなければ
ステップ27に戻シ第二。
第三候補の標準パタンについて同様の処理を続ける。ス
テップ31の条件が満足すると、ステップ32で、ステ
ップ27の条件を満たしさらにステップ29で得られた
距離値のうち最小値を与える標準パタンを認識候補音声
と判定し、認識結果表示器16に認識候補音声を表示す
る。
なお、本実施例では、入力パタンの無音区間の個数が1
個の場合について説明したが、無音区間が2個以上存在
する場合にも同様の処理を行なうことができる。
以上のように本実施例によれば、音声パタン中の無音区
間を検出する無音区間検出手段と、DPマツチングの結
果から上位複数候補についてさらに、無音区間の個数の
一致するものについて入力パタンと標準パタンの無音区
間のフレーム位置の交点を通過するように制限を加えた
DPマツチングを行ない、認識結果の検証を行なう認識
結果検証手段を備えたことにより、極端なマツチングに
よる誤認識、および音韻的に類似したパタン間の誤認識
を減少させることができる。
発明の効果 以上のように本発明は、音声パタン中の無音区間の個数
とそのフレーム位置を検出する無音区間検出手段と、D
Pマツチングの結果亦ら、距離の最小値を与えるものか
ら上位複数候補を選択し、それらについてさらに無音区
間の個数の一致する入力パタンと標準パタンで無音区間
のフレーム位置を合わせ、その交点をマツチングバスが
必ず通過するように制限したDPマツチングを行ない、
距離の最小となる標準パタンを認識結果として導き出す
認識結果検証手段を設けたことにより、音韻の類似した
パタン間での誤認識、および極端なマツチングによる誤
認識を極力抑えることのできる音声認識装置を提供する
ことができる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置の構成
を示すブロック図、第2図は同装置の構成を示す回路図
、第3図は同装置の動作説明のための要部70−チャー
ト、第4図は第3図の70−チャート説明のための特性
図である。 2・・・・・・音声分析手段、3・・・・・・無音区間
検出手段、4・・・・・・記憶手段、6・・・・・・パ
タンマツチング手段、6・・・・・・認識結果検証手段
、10・・・・・・マイクロホン、13・・・・・・入
力パタンメモリ、14・・・・・・標準パタンメモリ、
15・・・・・・マイクロコンピュータ。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第 
1 図 第 2 図

Claims (1)

    【特許請求の範囲】
  1. 入力音声からエネルギー系列を含む特徴ベクトルの時系
    列を出力する音声分析手段と、前記音声分析手段から出
    力されるエネルギー系列から、音声パタン中の音声部分
    と無音声部分を判別し、無音声区間の個数およびそのフ
    レーム位置を検出する無音区間検出手段と、前記音声分
    析手段より得られる特徴ベクトルの時系列を標準パタン
    として記憶し、また前記無音区間検出手段より得られる
    無音声区間の個数およびそのフレーム位置を記憶する記
    憶手段と、前記記憶手段により蓄えられた標準パタンと
    入力パタンとの間でパタンマッチングを行ない両者間の
    距離を算出するパタンマッチング手段と、前記パタンマ
    ッチング手段により得られた入力パタンと各標準パタン
    との距離のうち最小値を与えるものから順に複数個選択
    し、それらに対応した各標準パタンと入力パタンとの間
    で、前記記憶手段に記憶された無音声区間のフレーム位
    置の交点をマッチングパスが必ず通過するように制限を
    加えたパタンマッチングを行ない、両者間の距離を算出
    し、距離の最小となる標準パタンを認識結果とする認識
    結果検証手段とを備えたことを特徴とする音声認識装置
JP60120015A 1985-06-03 1985-06-03 音声認識装置 Pending JPS61277999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60120015A JPS61277999A (ja) 1985-06-03 1985-06-03 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60120015A JPS61277999A (ja) 1985-06-03 1985-06-03 音声認識装置

Publications (1)

Publication Number Publication Date
JPS61277999A true JPS61277999A (ja) 1986-12-08

Family

ID=14775789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60120015A Pending JPS61277999A (ja) 1985-06-03 1985-06-03 音声認識装置

Country Status (1)

Country Link
JP (1) JPS61277999A (ja)

Similar Documents

Publication Publication Date Title
JP2692581B2 (ja) 音響カテゴリ平均値計算装置及び適応化装置
EP0109190B1 (en) Monosyllable recognition apparatus
JP3066920B2 (ja) 音声認識方法及び装置
JPH03201079A (ja) パターンマッチング装置
JP3798530B2 (ja) 音声認識装置及び音声認識方法
JPH0247760B2 (ja)
JP2996019B2 (ja) 音声認識装置
JPS61277999A (ja) 音声認識装置
JPS645320B2 (ja)
JPS6247100A (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置
JPH0247758B2 (ja)
JPH0316038B2 (ja)
JP2975808B2 (ja) 音声認識装置
JPS61138298A (ja) 音声認識装置
JPS6312000A (ja) 音声認識装置
JPS5972498A (ja) パタ−ン比較装置
JPH0335297A (ja) 有音・無音検出方式
JPS6336678B2 (ja)
JPS6383800A (ja) 音声認識装置
JPS63121099A (ja) 音声認識装置
JPH04199199A (ja) 音声認識装置
JPH06324696A (ja) 音声認識装置及び方法
JPH0449716B2 (ja)
JPS6157995A (ja) 音声認識装置