JPS63204491A - パタ−ン認識システム - Google Patents

パタ−ン認識システム

Info

Publication number
JPS63204491A
JPS63204491A JP62038205A JP3820587A JPS63204491A JP S63204491 A JPS63204491 A JP S63204491A JP 62038205 A JP62038205 A JP 62038205A JP 3820587 A JP3820587 A JP 3820587A JP S63204491 A JPS63204491 A JP S63204491A
Authority
JP
Japan
Prior art keywords
pattern
similar
standard
patterns
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62038205A
Other languages
English (en)
Inventor
Toru Shimizu
透 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62038205A priority Critical patent/JPS63204491A/ja
Publication of JPS63204491A publication Critical patent/JPS63204491A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (従来の技術) 近年、音声、手書き文字等、数々の実用的なパターン認
識システムが発売され、産業界で利用されている。これ
らの認識システムの大部分はパターンマツチング法を原
理として動作するものである。すなわち、認識すべき対
象の特徴を示すパターンを認識に先立ち予め作成、登録
しておき(以下このパターンを標準パターンと称する)
、認識時に入力されたパターン(以下このパターンを入
力パターンと称する)と比較処理(以下マツチングと称
する)を行い、その差(以下距離と称する)の最も小さ
い標準パターンのカテゴリ名を認識結果とする方法であ
る。
このパターンマツチング法は、特願昭49−241F1
号明細書記載の如く、動的計画法を利用して一方のパタ
ーンが他方のパターンに最適に対応するような歪み関数
を求め、その歪み関数を用いてマツチングを行うという
DPマツチングを用いることで、マツチングの際の両パ
ターンの発声長の3.Itいに対処でき、実用性が高め
られた。
しかし、上記パターンマツチング法においても、「和歌
山」と「岡山」等、類似した単語音声、「キ」と「ギ」
、「リヤ」と「ミャ」等、類似した単音節音声等は、認
識が困難で誤りが多い現状である。また、文字認識でも
、「7」と「ケ」等の類似した文字において、同様の問
題がある。
その対策として、特願昭54−88909号明細書に示
されるように、前もって、類似した標準パターンの類似
部分を平均化して共通にしておき、相違部分のみの遠い
で認識を行うという方法が提案されている。
(発明が解決しようとする問題点) 上記方法において、どの標準パターンが類似していて、
そのどの部分が類似した部分であるかを見つけることが
必要である。それを誤って、類似部分を少なく検出した
ら平均する部分が少なくなってしまい誤認識を改善でき
ないし、逆に多く検出したら本来具なる部分まで平均化
してしまい、かえって認識の低下を招くという問題点が
ある。
また、上記方法は、類似した標準パターンが2つの場合
の改善法であり、類似した標準パターンが3つ以上存在
する場合の対策は述べられていない。
本発明の目的は、上記問題点に着目してなされたもので
、類似した標準パターンが3つ以上存在する場合でも、
それら標準パターンの中から、類似した標準パターンの
組とその類似した部分を正確に検出し、その部分のみを
平均化することで、高い認識率の得られるパターン認識
システムを提供することにある。
(1問題点を解決するための手段) 本発明のパターン認識システムは、標準パターンを記憶
する標準パターン記憶部と、入力パターンと各標準パタ
ーンとの比較処理を行うためのマツチング部と、前記マ
ツチング結果に基づいて認識を行う認識部と、前記標準
パターン間で比較処理を行いその差の小さい部分と大き
い部分を基に前記標準パターン中の類似単語群とその類
似部分を検出する標準パターン類似部検出部と、前記類
似単語群の標準パターン間で共通な類似部分を相互に平
均化する処理を行い類似単語群に対する新たな標準パタ
ーンとする標準パターン平均化部とから構成される。
(作用) 以下、本発明の作用を、単語音声パターンの認識を例に
あげて説明する。しかしながら、本発明の対象は、音声
認識のみにとどまるものではない。
入力パターンrOKAYAMA」の認識を行う際、標準
パターンにrOKAYAMAJ、rWAKAYAMAJ
  rOKUYAMAJという類似したパターンが3つ
含まれているとする。この場合、入力パターンrOKA
YAMA、と、3つの類似した標準パターンrOKAY
AMAJ、[WAKAYAMAJ、rOKUYAMAJ
の距離は、他の標準パターンとの距離よりも小さいが、
正しい認識結果のrOKAYAMA」との距離が最小と
なっているとは限らない。つまり、誤認識している可能
性が高い。これは、前記特願昭54−80909号明細
書に例があげられているように、°“WA”と″0”、
’KA”と’KU”の違いが明確に存在しているにもか
かわらず、類似した残余の部分に影響されて、“WA”
と“O”、“KA”と°’KU”の弁別的特徴がマスク
されてしまうからである。その改善法として、類似した
標準パターンの弁別部である“WA”と″“0”、“K
A”と“K U ”以外の類似部分を平均化して共通に
しておき、入力パターンとこの3つの標準パターンの識
別は、弁別部“W A ”と“0”と″KA”と“KU
″の違いのみで行うという方法である。本発明の特徴は
、この類似した標準パターン間の弁別部の検出方法にあ
る。
一般に、音声の特徴ベクトルの距離は、両者が同一の音
素に属する場合は小さく、異なった音素に属するときは
大きい。ゆえに、両パターン間の距離が他より大きく違
う部分を異なる音素、つまり、弁別部とみなすことがで
きる。
今、標準パターンベクトル列B1−1,1.b+2.・
・・。
bI+、・・・+ b ’ Iと、標準パターンベクト
ル列口2=1,2.。
b22.・・・+ b2J +・・・、b2,3を考え
、二つをDPマツチングする。その結果、ベクトルBl
のiフレームにべクトルロ2のjフレームが対応したと
する。その対応するフレームのベクトル間距離d(b’
+、b2j) [以下、この距離をDP対応ベクトル間
距離と称する]を基にして、弁別部を検出することがで
きる。
つまり、単語どうしをマツチングした場合、連続した数
フレーム分を平滑化したDP対応ベクトル距離[以下、
平滑化DP対応ベクトル距雛と称する]の大きい値と小
さい値を比較して、その値が大きく違う場合は、小さい
値を与えたフレームは同じ音素が対応しているものとす
る。そして、その部分の平滑化DP対応ベクトル距離[
以下、同一音素間距離と称する]を基準にして、弁別部
と類似部を区別することができる。
今、上記3つの類似した標準パターンが存在する場合を
考える。まず、標準パターンrOKAYAMAJと他の
すべての標準パターンとマツチングを行って距離を求め
る。その中で、特に距離の小さかったものを、rOKA
YAMA、と類似しているパターンとして、平均化処理
をすべきパターンの候補とする。なお、この候補の中に
は、あまり類似していないパターンが含まれていても良
いので、少し多めに候補を選ぶようにする。その結果、
rOKAYAMA、と平均化処理をすべきパターンの候
補として、rWAKAYAMAJ、rOKUYAMA、
、rUKIsIMA、、[AKIKAWAJが選ばれた
とする。
次に、rOKUYAMA、と各候補の単語との平滑化D
P対応ベクトル距離を計算し、それを基に上記方法で、
同一音素間距離を求める。同一音素間距離の求まらない
、つまり、平滑化DP対応ベクトル距離の最大値と最小
値の差が大きくない単語は、平均化処理をしないものと
して、候補から除く。そして、各候補ごとに求められて
いる同一音素間距離の中で最も小さい値を基にある閾値
(たとえば、定数倍)を定める。各候補において、その
閾値以上のDP対応ベクI−ル距離を与えるフレームは
弁別部、その閾値を下回るDP対応ベクトル距離を与え
るフレームは類似部とする。
その結果、rAK I KAWAJは候補から除がれ、
rWAKAYAMAJのと類似部は“KAYAMA”、
rOKUYAMA、のと類似部は“OK”“と“YAM
A″、rUKIsIMA、との類似部は°” M A 
”となる。
各候補の類似部が求まれば、rOKUYAMA」のパタ
ーンと類似部のパターンの平均を求め、それをrOKU
YAMA、の新たな標準パターンとする。つまり、“O
K”は「○KUYAMA」の“’OK’”との平均、“
YA’“はrOKAYAMAJ、rWAKAYAMA」
のY A ”との平均、” M A ”はrOKAYA
MA、、” Y A KAYAMAJ、rUKISIM
AJの“’MA’“どの平均したパターンを用いる。
rOKUYAMA、に対して行った以上の操作を、他の
標準パターンについても、同様に行えば、全ての標準パ
ターンについて、類似したパターンの類似部分のみを平
均化でき、誤認識を改善することができる。
〈実施例) 以下、本発明の実施例について図面とともに説明する。
第1図は、本発明の一実施例における音声認識装置のブ
ロック図である。
マイクロホン1より入力された音声信号は、音声分析部
2において、たとえば特願昭52−144205号明細
書及びその第3図に示された如き周波数分析器によって
、音声分析がなされ、ベクトルの時系列の形に変換され
る。
本装置は、標準パターンの登録を行う登録モードと、入
力パターンの認識を行う認識モードとで、動作が異なり
、スイッチ回路3で切り替える。
認識モードにおいて、スイッチ回路3は入力パターン記
憶部4 filに接続される。マイクロホン1より入力
された音声は、音声分析部2を経て、ベクトル時系列の
形の入力パターンとして入力パターン記憶部4に記憶さ
れる。また、千均凛準パターン記憶部5には、後述の登
録モードの際に作成される類似標準パターン間での平均
化処理の行われた平均標準パターンが記憶されている。
マ・ソチング部6は、入力パターン記憶部4から入力パ
タ−ンへ−aI+a2+・・・+al+−・・・+ l
 +を、平均標準パターン記憶部から平均標準パターン
8”= b’″、1.m□、・・。
b′″j、・・・、b′″Jを受は取り、特願昭49−
2418号記載のごとく、動的計画法を利用して時間軸
方向の変動を正規化し、2つのパターンA、B”の距離
を計算する。このアルゴリズムは、パターン認識の分野
では、周知の技術なので、詳細な説明は省く。以下、こ
の距離をDP距離と称する。ただし、j=jm(i>は
、時間軸が最適に対応するようにパターンAをパターン
Bに歪ませる歪み関数である。DP距離は、順次認識部
7に送られ、大小比較される。すべての平均標準パター
ンとのDP距雛の比較が終了すると、最小値を与えた平
均標準パターンのカテゴリ名が認識結果として、出力さ
れる。
次に、登録モードの説明をする。本発明の原理は、登録
モード時に適用される。登録モードにおいて、スイッチ
回路3は標準パターン記憶部8fflJに接続される。
マイクロホン1より順次入力された登録用音声は、音声
分析部2を経て、ベクI・ル時系列の形の標準パターン
として標準パターン記憶部8に記憶される。すべての標
準パターン81〜02の登録が終了すると、標準パター
ンは、逐次、類似部分検出部って、類似標準パターンと
その類似部分が検出され、標準パターン平均化処理部1
0で平均化され、平均標準パターン記憶部5に記憶され
る。
以下、+!準ハターンB’=b’I、bs2.−、b’
+、−・・。
b51を平均化する場合を例にして、各部の説明をする
。第2図は、類似部分検出部9の詳細図である。標準パ
ターンB5と、BS以外のすべての標準パターン(B”
、 m =1〜z 、 m≠S・)とのDP距離D(口
iEl”)がマツチング部6で計算され、判定部91に
送られる。判定部91では、D(B5.B”)を監視し
その値が第に番目以内に小さい値かどうかを判定し、小
さい値であれば、マルチプレクサ92に指令して、マツ
チング部6の計算結果である歪み関数jm(i)。
■フレーム分のDP対応ベクl〜ル距離d<b’l。
b”JvaL口)(i・1〜■〉と、その標準パターン
のカテゴリ名mを、それぞれ、記憶部93、記憶部94
、記憶部95に記憶する。平滑化DP対応ベクトル距離
計算部96では、記憶部94のDP対応ベクl〜ル距離
のLフレーム分の平均値である平滑化DP対応ベクレー
ムづつシフトして1個求め、判定部97に逐次送る。比
較部97では、その最大値MAXDM mと最小値NI
NDM mを求め、それぞれ、記憶部98、記憶部99
に記憶する。以上の動作が終了すると、記憶部93.9
4.95.98.99には、それぞれ、標準パターンB
5とのDP距離の小さかった上位に個の標準パターンに
ついての、歪み関数、DP対応ベクトル距離、その標準
パターンのカテゴリ名、最大の平滑1ヒDP対応ベクト
ル距離、最小の平滑化DP対応ベクトル距離が記憶され
ている。
次に、判定部910は、K個の各カテゴリ名mについて
の最大平滑化DP対応ベクl〜ル距i4MINDM1n
と最小の平滑化DP対゛応ベクトル距離NINDにmを
記憶部98.99より受は取り、その比率R=MAXD
M m / NINDM mを計算し、値Rがある閾値
し以下である場合は、クリア回路911に指令して、そ
のカテゴリ名mに対する歪み関数、DP対応ベクトル距
離、その標準パターンのカテゴリ名、最大の平滑化DP
対応ベクトル距離、最小の平滑化DP対応ベクトル距離
を、それぞれ記憶部93.94.95.98.99より
削除する。同時に記憶部99の削除されなかった最小の
平滑化DP対応ベクl−ル距離NINDM mの中から
その最小値NIN sを求め、その値を閾値決定部91
2に送る。閾値決定部912で、は、NIN sにある
定数Mを掛けた値を閾値θSとして、比較部913に送
る。
比較部913は、i・1〜■までの、それぞれのフレー
ムについて、各カテゴリ名のDP対応ベクトル距離d(
b’+、b”Jmt++)を記憶部94より受は取り、
閾値θSと大小比較し、θs > d(bsl、b”j
++++ 1 +)なるカテゴリ名mには、信号Sim
=1、それ以外のカテゴリ名mには、信号Sim=0を
、標準パターン平均化処理部10に送る。第3図は、標
準パターン平均化処理部10の詳細図である。制御部1
01では、フレーム番号i・1〜Iについて順次、各カ
テゴリ名mに対する信号Simを受は収る。そして、あ
るiにおいてSimが、1であるカテゴリ名mの個数に
iをカウント回路102でカウントし、にiをベクトル
平均部103に送る。同時に、Simが1であるカテゴ
リ名1nとそのフレーム番号iが記憶部93に送られj
m(i)が読みだされ、標準パターン記憶部8より、カ
テゴリ名mの第jrn(i )フレームのベクトルb□
mf11が、順次ベクトル平均部103に送られる。ま
た、標準パターン記憶部9より、カテゴリ名Sの第iフ
レームのベクトルbも、ベクトル平均部103に送られ
る。ベクトル平均部103でン記憶部5に出力し、Ki
=0の場合は、1.Slを平均標準パターン記憶部5に
出力する。以上の動作をフレーム番号i・1〜■まで行
えば、標準パターンB5の平均化処理が施された平均標
準パターンが、平均標準パターン記憶部5に記憶される
以上の標準パターン05に対し行った動作を、他の1票
準パターンB′″(m・1〜Z)に対して行えば、すべ
ての標準パターンに対する平均標準パターンか作成され
る。以上、本発明の原理を実施例に基づいて説明したが
、これらの記載は本発明を限定するものではない。とく
に、判定部910の動作を、最大平滑化DP対応ベクl
ヘル距i4HINDM mと最小の平滑化DP対応ベク
トル距雛NINDM mの比率R;M八XDM rn 
/ NINDM mがある閾値し以下のカテゴリ名mに
ついて、クリア回路911に指令したが、これを、たと
えば、MAXDM m−NINDM mがある閾値■−
以下のカテゴリ名mについてとしても良い。また、閾値
決定部912では、閾値θSを旧Nsにある定数Mを掛
けた値としたが、これを、たとえば、ある定数Mを加え
た値としても良い。さらに、L=Mを定数でなく、たと
えば、D〈口5.B″′)等に依存する変数としても良
い。
(発明の効果) 以上に述べたとうり、本発明によれば、類似した標準パ
ターンが3つ以上存在する場合でも、それら標準パター
ンの中から、類似した標べちパターンの組とその類似し
た部分を正確に検出し、その部分のみを平均化すること
で、高い認識率の得られるパターン認識システムを提供
することができる。
【図面の簡単な説明】
第1図は、本発明の一実施例の音声認識装置のブロック
図、第2図は、類似部分検出部9の詳細図、第3図は、
標準パターン平均化処理部10の詳細図である。 1・・・マイクロホン、2・・音声分析部、3・・・ス
イ・ンチ回路、4・・・入力パターン記憶部、5・・・
平均化標準パターン記憶部、°6・・・マツチング部、
7・・・認識部、8・・・標準パターン記憶部、9・・
・類似部分検出部、10・・・標準パターン平均化処理
部、 91,910・・・判定部、92・・マルチプレ
クサ、 93,94,95.98.99・・・記憶部、
96・・・平滑化DP対応ベクトル距離計算部。 91.913・・・比較部、911・・・クリア回路、
912・・・閾値決定部、101・・・制御部、102
・・・カウント回路。

Claims (1)

    【特許請求の範囲】
  1. 標準パターンを記憶する標準パターン記憶部と、入力パ
    ターンと各標準パターンとの比較処理を行うためのマッ
    チング部と、前記マッチング結果に基づいて認識を行う
    認識部とを有するパターン認識システムにおいて、前記
    標準パターン間で比較処理を行いその差の小さい部分と
    大きい部分を基に前記標準パターン中の類似単語群とそ
    の類似部分を検出する標準パターン類似部検出部と、前
    記類似単語群の標準パターン間で共通な類似部分を相互
    に平均化する処理を行い類似単語群に対する新たな標準
    パターン平均化部とを有することを特徴とするパターン
    認識システム。
JP62038205A 1987-02-20 1987-02-20 パタ−ン認識システム Pending JPS63204491A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62038205A JPS63204491A (ja) 1987-02-20 1987-02-20 パタ−ン認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62038205A JPS63204491A (ja) 1987-02-20 1987-02-20 パタ−ン認識システム

Publications (1)

Publication Number Publication Date
JPS63204491A true JPS63204491A (ja) 1988-08-24

Family

ID=12518828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62038205A Pending JPS63204491A (ja) 1987-02-20 1987-02-20 パタ−ン認識システム

Country Status (1)

Country Link
JP (1) JPS63204491A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5614381A (en) * 1979-07-13 1981-02-12 Nec Corp Pattern recognizing system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5614381A (en) * 1979-07-13 1981-02-12 Nec Corp Pattern recognizing system

Similar Documents

Publication Publication Date Title
EP0691022B1 (en) Speech recognition with pause detection
US4918732A (en) Frame comparison method for word recognition in high noise environments
JPH0222398B2 (ja)
JPH04182700A (ja) 音声認識装置
JPH04255900A (ja) 音声認識装置
JPH0683388A (ja) 音声認識装置
JPH05119792A (ja) 音声認識装置
JPS63204491A (ja) パタ−ン認識システム
CA1301338C (en) Frame comparison method for word recognition in high noise environments
JPS6312312B2 (ja)
JP2975772B2 (ja) 音声認識装置
JPH0119597B2 (ja)
JPS63210997A (ja) パタ−ン認識システム
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JPS63210998A (ja) パタ−ン認識システム
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
JPH0651792A (ja) 音声認識装置
KR20010091093A (ko) 음성 인식 및 끝점 검출방법
JP2001034291A (ja) 音声認識装置
JP2547541B2 (ja) 単音節音声認識装置
JPH04152397A (ja) 音声認識装置
JPH08254991A (ja) パターン認識装置
JPH05257493A (ja) 音声認識装置
JPH01185599A (ja) 音声認識装置
JP2712704B2 (ja) 信号処理装置