JPS58176698A - パターンマッチング装置 - Google Patents

パターンマッチング装置

Info

Publication number
JPS58176698A
JPS58176698A JP57058098A JP5809882A JPS58176698A JP S58176698 A JPS58176698 A JP S58176698A JP 57058098 A JP57058098 A JP 57058098A JP 5809882 A JP5809882 A JP 5809882A JP S58176698 A JPS58176698 A JP S58176698A
Authority
JP
Japan
Prior art keywords
pattern
matching
pattern matching
standard
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57058098A
Other languages
English (en)
Other versions
JPH0454960B2 (ja
Inventor
次男 高橋
賢一 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP57058098A priority Critical patent/JPS58176698A/ja
Publication of JPS58176698A publication Critical patent/JPS58176698A/ja
Publication of JPH0454960B2 publication Critical patent/JPH0454960B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の対象 本発明はパターンマツチング方式に関し、@に旨声パタ
ーン認識装置等の高速実行を要求される用途に岐適なパ
ターンマツチング方式に関する。
従来技術 パターン認識装置は人カバターンと標準パターンとのパ
ターンマツチングを行うが、音声パターン認識装置など
ではこれを尚速度で実行する必快がある。このような尚
速のパターンマツチングは、マイクロコンピュータ等の
汎用演算器によるプログラム演算では一般に速度が不足
する。そこで従来のf/”パターン認識装置などは、好
適、専用の尚速演算器を用いてパターンマツチングを実
行する構成となっている。しかし、認m梢度を向上すべ
くパターンマツチングの演算精度を上げようとすると、
かかる構成ではハードウェアコスト上昇が看しく、装置
価格の大幅な上昇を招いている。
発明の目的 本発明の目的は、パターン認識装置において、・・−ド
クエアコストの上昇を可及的に抑えながら、認識精度の
同上を図るパターンマツチング方式を提供することにあ
る。
マイクロコンピュータ寺の汎用演算手段(二よるプログ
ラム演算は、演算速度は専用演算手段よりも、jlなり
遅いが、その反曲、容易;二高い演算ffKを得ること
ができる。
本発明はこの点じ層目し、入カバターンと標準パターン
とのパターンマツチングを専用演算手段による1次のパ
ターンマツチングと、汎用演算手段による2(′にのパ
ターンマツチングと(二分け、1次のパターンマツチン
グで人カバターンを十分な6[で同定不可能なとぎのみ
、2次のパターンマツチングを演算精度を上げて実行し
、人カバターンを同定する。
2次のパターンマツチングは全標準パターンについて実
行するのではなく、□1次のパターンマツチングで抽出
された第1、第2@補パターンを含む限られた数の標準
パターンについてのみ実行することにより、実行時間の
短縮を図る。
発明の実施例 添付の図面を参照して、本発明の一実施例)二ついて説
明する。
本実施列においては、全ての標準パターンについて、専
用の演算手段によって人カバターンとの整合距離が高速
演算される。求められた整合距離が規定値以丁の標準パ
ターンのうち、整合距離が最小の標準パターンが第1恢
補パターンとして、その次に小さな標準パターンが第2
候補パターンとして選ばれる。そして、第1、弔2候補
パターンの整合距離の差が規定値吸上で、F+れば、人
カバターンは第1候補パターンと刊疋され、認識を終了
する。しかし、弗1、第2侯桶パターンの整合出端が規
定値未満の場合は、汎用演算手段を用いfこプログラム
演Jlにより、上記の第1、第2の候補パターンを含む
限られた数の標準パターン(二ついてのみ、人カバター
ンとの整合距離が上記の専用演算手段よりも高い演算n
度で再演算される。
そして、この再演算の結果(二基ついて上記の判定が杏
度行われる。
laF、本実Mffljの各部について峰述する。
本実施列は音声パターンを認識する装置であり、音声は
マイク′ロフオン1によって電気信号に変換され入力さ
れる。この音声信号は緩衝増幅器ンを介して一群のバン
ドパスフィルタ31(i=1.2゜・・・+ n)に並
列的に人力され、例えば200H2〜6000Hzの音
声周波数成分がnチャンネルに周波数分析される。チャ
ンネル数nは通常、16ないし」チャンネルである。
バンドパスフィルタ3iの出力信号は、時定数が50 
ミIJ秒前後の一群のローパスフィルタ4i(t=t、
2.・・・t”)にチャンネル対応で通され、背戸波形
のエンベロープ波形龜変換される。ローパスフィルタ4
1の各出力信号は、約四ミリ秒(1フレーム)毎I:、
制御ユニット90制佃の下に時分割でアナログスイヅチ
5を介し、アナログ/ディジタル(A/D )変換器6
へ送られる。 −A/D変換a6は通線8ないし12ビ
ツトのものが用いられ、その出力信号はチーヤンネル毎
に、約加ミリ秒毎に1フレームのスペラトル情報とじで
バッファメモリ7に一時記憶される。
バッファメモリ7に一時記憶されたスペクトルFft報
は、例えば式(1)で示される演算が施され正規化され
る。
ここで、Piはチャンネルiのパワー出力、nは全チャ
ンネル数、Cは定数である。すなわら、この式(1)に
よれば、正規化後の各チャンネル出力の合計が定数Cに
等しくなるようζ二正規化される。
この正規化演算は、マイクロコンピュータで構成された
汎用演算ユニット80マイクロプログラムで実行される
また、i声区間の検出も汎用演算ユニット80マイクロ
プログラム(二より、制御ユニット90市1」碑の下(
二実行される。そのアルゴリズムは種々知られているが
、例えば予め決めた@1区以上のトータルパワーのフレ
ームを音声信号のフレームトミなし、閾値未満のフレー
ムをノイズ信号のフレームとみなす。そして、音声信号
のフレームが5つ以上連続すると音声区間として切出し
を開始し、その後、ノイズ信号のフレームがIOα上連
続すると音声区間の終了と判断する等のアルゴリズムで
、音声区間が検出される。
なお、音声区間として切り出された一連のフレームの情
報(音声パターン清報)は、標準パターンの登録時には
RAM(ランダムアクセスメモリ)10に格納されるが
、人力音声の認識時(二はDPマツテングユニツ)11
へ送られる。なお、隙率パターンの登録は本発明の要旨
ではなく、また従来装置と同様でよいので詳細は割愛す
る。
1)Pマッチングユニッ)11は、汎用演算ユニット8
から送られる入力音声パターンと、RAMl0に格納さ
れている音声パターン(標準パターン)との間の、いわ
ゆるDP(動的計画法)に基づいタパターンマッチング
(1次のパターンマツチングと称す)を商運で実行す兎
。専用の特殊演算ユニットである。なお、DPマツチン
グ手法は、周知のように標準パターンと人力音声パター
ンの発生速度の変動を吸収でき、音声認識におけるパタ
ーンマツチング手法と己て有効性が認められている。ま
たDPマツチングユニット11は、公知の構成でよい。
DPマツチングユニット11において、各標準パターン
と入力音声パターンとの整合距離が順次演算され、判定
ユニット12へ送られる。判定ユニツH2は、整合距離
が規定の閾値以下の標準パターンのうちで、整合距離が
最小の(人力音声パターンと最も類似度が高い)標準パ
ターンを第1候補パターン、その次に整合距離が小さい
標準パターンを第2候補パターンとして選択する。そし
て、第1、第2侯補パターンの整合距離の差が規定値以
上ならば、第1候補パターンを認識結果として田力する
。この条件が満たされないと、汎用演算ユニット8のマ
イクロプログラムにより、演算精度を上げて改めてDP
マツチング(2次のパターンマツチングと称す)が実行
される。そして、この2次のパターンマツチングの結果
1″一ついて、判定ユニット12は同様の判定を行なう
。これでも上記の条件が満足されなげれば、轟該入力音
声パターンは認識不能としてリジェクト処理される。
上記の汎用演算ユニット8の演算速度は、専用のhaユ
ニットであるl)Pマッチングユニツ)11に比し、著
しく遅い。したがって、全標準パターンについて2次の
パターンマツチングを実行したのでは、実行時間がか\
り過ぎる。そこで本発明では、1次のパターンマツチン
グの第1、第2候補パターンを含む限られた数の標準パ
ターンについてのみ、2次のパターンマツチングを実行
し、実行時間の短幅を図っている。この時に対酸とする
標準パターンは、レリえば、DPマッチングユニッ)1
1によって求められた整合距離の小さい順(二遇田する
方法等で容易に選ぶことができる。
ここで、DPマツチング手法における整合距離の演J!
精度について説明する。
前記の式(1)で表わされる人力fFの正規1ヒバワー
スベクトルの時刻tにおける値をNPl(t)とし、同
様に#4準パターンの正規化スペクトルの時刻τにおけ
る値をN5Pi(τ)とすれば、DPマツチングを行な
って両者の整合距離を算出する(二必安な格子間距離は
、例えば式(2)で示される。
、Σ (NPl(t)−N8Pi(τ))2  ・・・
・・・式(2)格子間距離が小さいほど、入力音声の時
刻t(二おける正規化パワースペクトルと標準パターン
の時刻τにおける正規化パワースペクトルとが似ている
ことを食味している。格子間距離は整合距離を算出する
もとじなるので、その関数形は種々工夫されており、例
えば式(2)の代りに式(3)のような1次式も考えら
れている。
iミ、l NPi(t)−N、5Pi(τ)1   ・
・・・・・式(3)このような格子間距離の演X(=用
いる関数形によって、DPマツチングを実行する演算手
段ζ二必贅な桁数(演算精度)が変わってくることは明
らかである。式(2)のような2次式は、正規化パワー
スペクトルの差分を強調するので、式(3)のような1
次式による場合:二比べ、DPマツチングを行なって竪
@−距離を求めると、i声のボルトマントに対応したパ
ワースペクトルの特徴が十分に1反映される。したがっ
て、同一発声内容(同一カテゴリ)のi声相互間の整合
距離は小さくなり、それに対し異カテゴリの蛭声相互間
の整合距離は著しく大きくなる結果、判定が各局になる
そこで商い認識積度を得るためには、前記のDPマツチ
ングユニット11は式(2)のような2次式を採用する
のがよいが、上述の利点をいかすため(=は整合距離を
求める全過程を桁数の多い演算器;二よって高い8度で
演算しなげればならず、DPマツチングユニット11の
ハードウェアコストの上昇が避けられない。ハードウェ
アコストを抑えるには、ド立の桁を切り捨てることが考
えられる。しかし、この切捨ては演真梢閾の1次丁、し
たがって認識+1v度の低下を招く。別の方法として、
式(2)の値の上限値を設定しておぎ、計岸値がその上
限値を越えたとぎに上限値に置換−j隘、方法も考えら
れる。しかし、これではスペクトルの強調が重書される
ため、結果として異カテゴリの音戸相瓦間の整合距離の
差が減小され、演算精度を丁げたと同じこと(ニなって
しまう。
このように、専用の高速演算手段であるDPマツチング
ユニット11によるパターンマツチングだけで、尚い認
識精度を達成しようとすると、)・−ドウエアコストの
大幅な上昇が避けられない。
本発明によれば、専用の高速演算手段を用いて1次のパ
ターンマツチングを実行し、それで十分な判定が不可能
な場合は、汎用演算手段を用いて崗い演算精度の2次の
パターンマツチングを行う。
したがって、1次のパターンマツチングの演算精度をそ
れほど制<シなくても、認識精度を確保できるため、専
用演算手段であるL)Pマツチングユニット11のハー
ドウェアコストを引き下げることができる。また、汎用
演算手段である汎用演算ユニット8はプログラム(二よ
り演算を実行するから、演算速度は制限される。しかし
、1次のパターンマツチングで判定できない場合のみ2
次の)くターンマツチングを実行し、しかも、2次のパ
ターンマツチングは全標準パターンではなく、1次のノ
くターンマツチングで候補パターンとして抽出された標
準パターンを含む限られた数の標準ノくターンのみを対
象として実行する。このため、パターンマツチングの実
行時間の増加は惚めて小さく抑えられ、十分な認識1室
度を:I!成できる。
音声パターン認識装置の例について本発明を詳述した。
しかし、本発明は汁声パターン認鍼装置に限らず、文字
−#!装置などの他のパターン認識装置にも同様に適用
できることは勿論である。
発明の効果 以上に詳述した0口<、本発明によれば、パターンマツ
チングのためのハードウェアコストの上昇を可及的に抑
えながら、高精闇の篩速パターンマツチングが6■能と
なり、認識積度、認識速度ともに浚れた高1生自旨のパ
ターンを忍r峨装置を安1曲(二実現できる。
【図面の簡単な説明】
図は本発明の一実施例を示すブロック図である。 1・・・マイクロフォン、2・・・緩衝増@器、3i 
(31〜3n)・・・バントハスフィルタ、4i (4
t〜4n)・・・ローパスフィルタ、5・・・アナログ
スイッチ、6・・・アナログ/ディジタル変換器、7・
・・バッファメモリ、8・・・汎用演算ユニット、10
・・・ランダムアクセスメモリ、11・・・l)Pマッ
チングユニツl−、i2・・・判定ユニット。

Claims (1)

    【特許請求の範囲】
  1. (1)パターン認!It![1−おいて、入カバターン
    と標準パターンとのパターンマツチングを、専用演算手
    段による1次のパターンマツチングと、汎用演算手段を
    用いたプログラム演算による2次のパターンマツチング
    とに分けて行い、該1次のパターンマツチングは全ての
    標準パターンについて実行し、該1次のパターンマツチ
    ングで入カバターンに対応する候補パターンとして選ば
    れた2つの標準パターンの人カバターンとの蟹合距離の
    差が規定値未満のときのみ、該候補パターンとしての2
    つの憚阜パターンを含む限られた数の標準パターンにつ
    いてのみ、該第1のパターンマツチングより演算精度を
    上げて該4M2のパターンマツチングを実行することを
    特徴とするパターンマツチング方式。
JP57058098A 1982-04-09 1982-04-09 パターンマッチング装置 Granted JPS58176698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57058098A JPS58176698A (ja) 1982-04-09 1982-04-09 パターンマッチング装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57058098A JPS58176698A (ja) 1982-04-09 1982-04-09 パターンマッチング装置

Publications (2)

Publication Number Publication Date
JPS58176698A true JPS58176698A (ja) 1983-10-17
JPH0454960B2 JPH0454960B2 (ja) 1992-09-01

Family

ID=13074475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57058098A Granted JPS58176698A (ja) 1982-04-09 1982-04-09 パターンマッチング装置

Country Status (1)

Country Link
JP (1) JPS58176698A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62119597A (ja) * 1985-11-20 1987-05-30 富士通株式会社 単語音声認識装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5293817B2 (ja) * 2009-06-19 2013-09-18 富士通株式会社 音声信号処理装置及び音声信号処理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58159597A (ja) * 1982-03-03 1983-09-21 富士通株式会社 単音節音声認識方式
JPS58159599A (ja) * 1982-03-03 1983-09-21 富士通株式会社 単音節音声認識方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58159597A (ja) * 1982-03-03 1983-09-21 富士通株式会社 単音節音声認識方式
JPS58159599A (ja) * 1982-03-03 1983-09-21 富士通株式会社 単音節音声認識方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62119597A (ja) * 1985-11-20 1987-05-30 富士通株式会社 単語音声認識装置

Also Published As

Publication number Publication date
JPH0454960B2 (ja) 1992-09-01

Similar Documents

Publication Publication Date Title
EP0077558B1 (en) Method and apparatus for speech recognition and reproduction
US4624010A (en) Speech recognition apparatus
US5596679A (en) Method and system for identifying spoken sounds in continuous speech by comparing classifier outputs
US5903863A (en) Method of partitioning a sequence of data frames
WO1995034035A1 (en) Method of training neural networks used for speech recognition
US4426551A (en) Speech recognition method and device
JPS63261400A (ja) 音声認識方式
JPS58176698A (ja) パターンマッチング装置
JP2992324B2 (ja) 音声区間検出方法
JP4760179B2 (ja) 音声特徴量算出装置およびプログラム
JP2989231B2 (ja) 音声認識装置
JP3298658B2 (ja) 音声認識方式
JPS58149099A (ja) パタ−ン認識方式
JPH0554678B2 (ja)
JPS58195893A (ja) 音声認識装置における前処理方法
JPS625299A (ja) 音声認識装置
JPH0311478B2 (ja)
JPS6019200A (ja) 音声認識方法
JPH0311479B2 (ja)
JPS63223696A (ja) 音声パタ−ン作成方式
JPS59124388A (ja) 単語音声認識処理方式
JPS63104099A (ja) 音声認識装置
JPS60202489A (ja) 音声認識方法
JPH02205900A (ja) 話者照合方式
JPS6172296A (ja) パタ−ン類似度算出方式