JPS63210997A - パタ−ン認識システム - Google Patents

パタ−ン認識システム

Info

Publication number
JPS63210997A
JPS63210997A JP62045701A JP4570187A JPS63210997A JP S63210997 A JPS63210997 A JP S63210997A JP 62045701 A JP62045701 A JP 62045701A JP 4570187 A JP4570187 A JP 4570187A JP S63210997 A JPS63210997 A JP S63210997A
Authority
JP
Japan
Prior art keywords
pattern
standard
similar
distance
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62045701A
Other languages
English (en)
Inventor
透 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62045701A priority Critical patent/JPS63210997A/ja
Publication of JPS63210997A publication Critical patent/JPS63210997A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声、文字等のパターン認識システムの改良
に関する。
(従来の技術) 近年、音声、手書き文字等、数々の実用的なパターン認
識システムが発売され、産業界で利用されている。これ
らの認識システムの大部分はパターンマツチング法を原
理として動作するものである。すなわち、認識すべき対
象の特徴を示すパターンを認識に先立ち予め作成、登録
しておき(以下このパターンを標準パターンと称する)
、認識時に入力されたパターン(以下このパターンを入
力パターンと称する)と比較処理(以下マツチングと称
する)を行い、その差(以下距離と称する)の最も小さ
い標準パターンのカテゴリ名を認識結、果とする方法で
ある。
このパターンマツチング法は、特願昭49−24111
号明細書記載の如く、動的計画法を利用して一方のパタ
ーンが他方のパターンに最適に対応するような歪み関数
を求め、その歪み関数を用いてマツチングを行うという
DPマツチングを用いることで、マツチングの際の両パ
ターンの発声長の違いに対処でき、実用性が高められた
しかし、上記パターンマツチング法においても、「和歌
山」と「岡山」等、類似した単語音声、「キ」と「ギ」
、「リヤ」と「ミャ」等、類似した単音節音声等は、認
識が困難で誤りが多い現状である。また、文字認識でも
、「7」と「ケ」等の類似した文字において、同様の問
題が存在する。
その対策として、特願昭54−88909号明細書に示
されるように、前もって、類似した標準パターンの類似
部分を平均化して共通にしておき、相違部分のみの違い
で認識を行うという方法が提案されている。
(発明が解決しようとする問題点) 上記方法において、どの標準パターンが類似していて、
そのどの部分が類似した部分であるかを見つけることが
必要である。それを誤って、類似部分を少なく検出した
ら平均する部分が少なくなってしまい誤認識を改善でき
ないし、逆に多く検出したら本来具なる部分まで平均化
してしまい、かえって認識の低下を招くという問題点が
ある。
また、上記方法は、類似した標準パターンが2つの場合
の改善法であり、類似した標準パターンが3つ以上存在
する場合の対策は述べられていない。
本発明の目的は、上記問題点に着目してなされたもので
、類似した標準パターンが3つ以上存在する場合でも、
それら標準パターンの中から、類似した標準パターンの
組とその類似した部分を正確に検出し、その部分のみを
平均化することで、高い認識率の得られるパターン認識
システムを提供することにある。
(問題点を解決するための手段) 本発明のパターン認識システムは、標準パターンを記憶
する標準パターン記憶部と、入力パターンと各標準パタ
ーンとの比較処理を行うためのマツチング部と、前記マ
ツチング結果に基づいて認識を行う認識部と、同一音素
間の距離を予め記憶しておく同一音素間距離記憶部と、
前記同一音素間距離記憶部の同一音素間の距離を基に前
記標準パターン中の類似単語群とその類似部分を検出す
る標準パターン類似部検出部と、前記類似単語群の標準
パターン間で共通な類似部分を相互に平均化する処理を
行い類似単語群に対する新たな標準パターンとする標準
パターン平均化部とから構成される。
(作用) 以下、本発明の作用を、単語音声パターンの認識を例に
あげて説明する。しかしながら、本発明の対象は、音声
認識のみにとどまるものではない。
入力パターンrOKAYAMAJの認識を行う際、標準
パターンにrOKAYAMA」、rWAKAYAMAJ
  rOKUYAMAJという類似したパターンが3つ
含まれているとする。この場合、入力パターンrOKA
YAMAJと、3つの類似した標準パターンrOKAY
AMA、、[WAKAYAMAJ 、rOKUYAMA
」の距離は、他の標準パターンとの距離よりも小さいが
、正しい認識結果のrOKAYAMA、との距離が最小
となっているとは限らない、つまり、誤認識している可
能性が高い、これは、前記特願昭54−88909号明
細書に例があげられているように、“WA″と“0″、
”KA″と“KU”の違いが明確に存在しているにもか
かわらず、類似した残余の部分に影響されて、“WA”
と“0”、“KA”と“KU”の弁別的特徴がマスクさ
れてしまうからである。その改善法として、類似した標
準パターンの弁別部である“WA”と“0”、“KA”
と“KU”以外の類似部分を平均化して共通にしておき
、入力パターンとこの3つの標準パターンの識別は、弁
別部“WA”と“0”と“KA”と“KU”の違いのみ
で行うという方法である0本発明の特徴は、この類似し
た標準パターン間の弁別部の検出方法にある。
一般に、音声の特徴ベクトルの距離は、両者が同一の音
素に属する場合は小さく、異なった音素に属するときは
大きい、ゆえに、両パターン間の距離が他より大きく違
う部分を異なる音素、つまリ、弁別部とみなすことがで
きる。
今、標準パターンベクトル列B l =b11. bl
 2.・・・。
b’1.・・・* b ’ lと、標準パターンベクト
ル列B2=b21゜b22.・・・+ b 2J +・
・・・+bJを考え、二つをDPマツチングする。その
結果、ベクトルBlのiフレームにベクトルB2のjフ
レームが対応したとする。その対応するフレームのベク
トル問距離d(b”+、b”J) [以下、この距離を
DP対応ベクトル間距離と称する]を基にして、弁別部
を検出することができる。
つまり、同一の音素の間の距離[以下、同一音素間距離
と称する]が前もって分かっていれば、その値を基準と
して、弁別部と類似部を区別することが出来る。同一音
素間距離を求める方法としては、例えば、標準パターン
登録の際に、話者に同じ単語もしくは単音節を2度発声
してもらい、2つをDPマツチングし、そのDP対応ベ
クトル間距離の全フレームの平均値もしくは最大値もし
くは最小値等を用いる方法が考えられる。
今、上記3つの類似した標準パターンが存在する場合を
考える。まず、標準パターンrOKAYA M A 」
と他のすべての標準パターンとマ・ソチングを行って距
離を求める。その中で、特に距離の小さかったものを、
rOKAYAMA、と類似しているパターンとして、平
均化処理をすべきパターンの候補とする。なお、この候
補の中には、あまり類似していないパターンが含まれて
いても良いので、少し多めに候補を選ぶようにする。そ
の結果、rOKAYAMAJと平均化処理をすべきパタ
ーンの候補として、rWAKAYAMAJ、rOKUY
A’MA」、rUKIsIMA」、「AKIKAWA、
が選ばれたとする。
次に、rOKUYAMAJと各候補の単語とをDPマツ
チングし、連続した数フレーム分のDP対応ベクトル間
距離を平滑化した値[以下、平滑化DP対応ベクトル距
離と称する]を計算する。
そして、その平滑化DP対応ベクトル間距離と、すでに
求められている同一音素間距離を基に定めたある閾値(
たとえば、同−音素間距離の定数倍)を比較して、その
閾値以上の平滑化DP対応ベクトル距離を与えるフレー
ムは弁別部、その閾値を下回る平滑化DP対応ベクトル
距離を与えるフレームは類似部とする。その結果、rA
K I KAWAJは類似部が存在せず、候補から除か
れ、r W A K A Y A M A Jのと類似
部は“KAYAMA”、rOKUYAMA、のと類似部
は“OK”と“YAMA″、rUKIsIMA」との類
似部は“MA″となる。
各候補の類似部が求まれば、rOKUYAMA」のパタ
ーンと類似部のパターンの平均を求め、それをrOKU
YAMAJの新たな標準パターンとする。つまり、”O
K”は「OKUYAMA」の’OK″との平均、“YA
”はrOKAYAMA、、rWAKAYAMAJの“Y
A″との平均、”MA”はrOKAYAMA」、rYA
KAYAMAJ、rUK I S I MA、の“MA
″との平均したパターンを用いる。
rOKUYAMA、に対して行った以上の操作を、他の
標準パターンについても、同様に行えば、全ての標準パ
ターンについて、類似したパターンの類似部分のみを平
均化でき、誤認識を改善することができる。
(実施例) 以下、本発明の実施例について図面とともに説明する。
第1図は、本発明の一実施例における音声認識装置のブ
ロック図である。
マイクロホン1より入力された音声信号は、音声分析部
2において、たとえば特願昭52−144205号明細
書及びその第3図に示された如き周波数分析器によって
、音声分析がなされ、ベクトルの時系列の形に変換され
る。
本装置は、標準パターンの登録を行う登録モードと、入
力パターンの認識を行う認識モードとで、動作が異なり
、スイッチ回路3で切り替える。
認識モードにおいて、スイッチ回路3は入力パターン記
憶部4側に接続される。マイクロホン1より入力された
音声は、音声分析部2を経て、ベクトル時系列の形の入
力パターンとして入力パターン記憶部4に記憶される。
また、平均標準パタ−ン記憶部5には、後述の登録モー
ドの際に作成される類似標準パターン間での平均化処理
の行われた平均標準パターンが記憶されている。マツチ
ング部6は、入力パターン記憶部4から入力パターン^
”al、a2.・・・+al+・・・・+ a lを、
平均標準パターン記憶部5から平均標準パターンB’″
=l、II、、l、1″2゜・・・b”j、・・・・1
.s″Jを受は取り、特願昭49−2418号記載のご
とく、動的計画法を利用して時間軸方向の変動を正規化
し、2つのパターンA、B″″の距離D(A、B”) 
= 1/I・m in(Σ(d(as、b−J))j−
賦J−1烏+1111 を計算する。このアルゴリズムは、パターン認識の分野
では、周知の技術なので、詳細な説明は省く。以下、こ
の距離をDP距離と称する。ただし、j=jm(i)は
、時間軸が最適に対応するようにパターンB鋤をパター
ンAに歪ませる歪み関数である。DP距離は、順次認識
部7に送られ、大小比較される。すべての平均標準パタ
ーンとのDP距離の比較が終了すると、最小値を与えた
平均標準パターンのカテゴリ名が認識結果として、出力
される。
次に、登録モードの説明をする6本発明の原理は、登録
モード時に適用される。認識モードにおいて、スイッチ
回路3は標準パターン記憶部8側に接続される。マイク
ロホン1より入力された登録用音声は、音声分析部2を
経て、ベクトル時系列の形の標準パターンとして標準パ
ターン記憶部8に記憶される0次に、先に入力された登
録用音声と同じカテゴリ名の音声が、マイクロホン1よ
り入力され、標準パターンと同様に分析部2を経てベク
トル時系列の形[以下、このベクトル時系列を音素間距
離計算用パターンと称する]に変換され、l14−音素
間距離計算を求めるために使われル@ II 準バター
 ンss= bsl、b”2+・+b’t+ 、−+1
)’1と、それと同じカテゴリ名である音素間距離計算
用i<9−7B’°=b”l+1)”3+”’+1)’
°J * ”’ * b” J カら、同一音素間離O
5を求める場合の説明をする。
BS、 BS’は、マツチング部6に送られ、DP距離
D(B’、B” )が計算され、同−音素間距離計算部
11に送られる。同−音素間距離計算部11は、D(B
’。
n”)にある定数Mを掛けた値を、aSに対する同−音
素間距離D3として、同一音素間距離記憶部12に記憶
する。以上の動作をすべての標準パターンaS(s=1
〜2)について行う、すべての標準パターン81〜B2
とそれに対する同一音素間距離Dl〜D2の登録が終了
すると、次に、標準パターンは、逐次、類似部分検出部
9で、類似標準パターンとその類似部分が検出され、標
準パターン平均化処理部lOで平均化され、平均標準パ
ターン記憶部5に記憶される。
以下、II mハ9− ンB”= b’l、b’2.、
、、 、bs、、 、、、、 。
bs+を平均化する場合を例にして、各部の説明をする
。第2図は、類似部分検出部9の詳細図である。標準パ
ターンBSと、Bs以外のすべての標準パターン8” 
(m=1〜z、m#s)とのDP距離D(B’、B”)
がマツチング部6で計算され、判定部91に送られる6
判定部91では、D(B’、’B”)を監辣しその値が
第に番目以内に小さい値かどうかを判定し、小さい値で
あれば、マルチプレクサ92に指令して、マツチング部
6の計算結果である歪み関数jrn(i )、■フレー
ム分のDP対応ベクトル距離d(b’+、b”jat+
+)(i== 1〜I)ト、ソノ標準パターンのカテゴ
リ名mを、それぞれ、記憶部93、記憶部94、記憶部
95に記憶する。平滑化DP対対応ベクトル距離計郡部
6では、記憶部94のDPP応ペクト(bs−◆に+b
”1m1+i+)(i = 1〜I)を1フレームづつ
シフトして1個求め、記憶部97に記憶する。以上の動
作が終了すると、記憶部93.94.95.97には、
それぞれ、標準パターンaSとのDP距離の小さかった
上位に個の標準パターンについての、歪み関数、DPP
応ベクトル距離、その標準パターンのカテゴリ名、平滑
化DPP応ベクトル距離が記憶されている。
比敦部98は、i=1〜Iまでの、それぞれのフレーム
について、各カテゴリ名の平滑化DPP応ベクトル距離
5d(b’I、b”jmt++)を記憶部97より受は
取り、同一音素間距離記憶11のDsと大小比較し、D
s>5d(b’+、b”jlz)なるカテゴリ名mには
、信号Sim = 1 、それ以外のカテゴリ名mには
、信号Sim = Oを、標準パターン平均化処理部1
0に送る。
第3図は、標準パターン平均化処理部10の詳細図であ
る。制御部101では、フレーム番号5− = 1〜I
について順次、各カテゴリ名mに対する信号Simを受
は取る。そして、あるiにおいてSimが1であるカテ
ゴリ名mの個数Kiをカウント回路102でカウントし
、Kiをベクトル平均部103に送る。同時に、Sin
が1であるカテゴリ名mとそのフレーム番号iが記憶部
93に送られjm(i)が読みだされ、標準パターン記
憶部8より、カテゴリ名mの第jm(i)フレームのベ
クトルt)”J++*(1)が、順次ベクトル平均部1
03に送られる。また、標準パターン記憶部8より、カ
テゴリ名Sの第iフレームのベクトルb−も、ベクトル
平均部103に送られる。ベクトル平均部103では、
Ki> 0の場合は、へ9 ) ルノ平均値Y+TT 
(b’+ + ”F’、−、b’ JL (I l )
 ヲ。
計算し、その値を平均標準パターン記憶部5に出力し、
にn=oの場合は、bsIを平均標準パターン記憶部5
に出力する。以上の動作をフレーム番号i=1〜Iまで
行えば、標準パターンB3の平均化処理が施された平均
標準パターンが、平均標準パターン記憶部5に記憶され
る。
以上の標準パターンB5に対し行った動作を、他の標準
パターンB’(n=1〜2)に対して行えば、すべての
標準パターンに対する平均標準パターンが作成される。
以上、本発明の原理を実施例に基づいて説明したが、こ
れらの記載は本発明を限定するものではない、とくに、
同−音素間距離計算部11における同一音素間距離OS
を、D(B’、、B’°)にある定数Mを掛けた値とし
たが、これを、例えば、ある定数Mを加えた値としても
良い、さらに、M、Lを定数でなく、例えば、D(B’
、B”)等に依存する値としても良い、また、同一音素
間距離DSを、標準パターンBSごとに違う値を用いた
が、ある特定の単語間のDP距離を基にして求めて、ど
の標準パターンにも共通な値を用いても良い。さらに、
本発明の原理は、音声以外のパターンを対象にする場合
にも有効に適用されるのは明かである0例えば、文字認
識に適用された場合には、1間」とF間」のような極め
て類似した文字間の弁別に効果がある。
(発明の効果) 以上に述べたとうり、本発明によれば、類似した標準パ
ターンが3つ以上存在する場合でも、それら標準パター
ンの中から、類似した標準パターンの組とその類似した
部分を正確に検出し、その部分のみを平均化することで
、高い認識率の得られるパターン認識システムを提供す
ることができる。
【図面の簡単な説明】
第1図は、本発明の一実施例の音声認識装置のブロック
図、第2図は、類似部分検出部9の詳細図、第3図は、
標準パターン平均化処理部10の詳細を示す図である。 1・・・マイクロホン、2・・・音声分析部、3・・・
スイッチ回路、4・・・入力パターン記憶部、5・・・
平均化標準パターン記憶部、6・・・マツチング部、7
・・・認識部、8・・・標準パターン記憶部、9・・・
類似部分検出部、10・・・標準パターン平均化処理部
、11・−・同−音素間距離計算部、12・・・同一音
素間距離記憶部、91・・・判定部、92・・・マルチ
プレクサ、93.94.95.97・・・記憶部、96
・・・平滑化DP対応ベクトル距離計算部、9B・・・
比較部、101・・・制御部、102・・・カウントl
1iii鷹g瞭

Claims (1)

    【特許請求の範囲】
  1. 標準パターンを記憶する標準パターン記憶部と、入力パ
    ターンと各標準パターンとの比較処理を行うためのマッ
    チング部と、前記マッチング結果に基づいて認識を行う
    認識部とを有するパターン認識システムにおいて、同一
    音素間の距離を予め記憶しておく同一音素間距離記憶部
    と、前記同一音素間距離記憶部の同一音素間の距離を基
    に前記標準パターン中の類似単語群とその類似部分を検
    出する標準パターン類似部検出部と、前記類似単語群の
    標準パターン間で共通な類似部分を相互に平均化する処
    理を行い類似単語群に対する新たな標準パターンとする
    標準パターン平均化部とを有することを特徴とするパタ
    ーン認識システム。
JP62045701A 1987-02-27 1987-02-27 パタ−ン認識システム Pending JPS63210997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62045701A JPS63210997A (ja) 1987-02-27 1987-02-27 パタ−ン認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62045701A JPS63210997A (ja) 1987-02-27 1987-02-27 パタ−ン認識システム

Publications (1)

Publication Number Publication Date
JPS63210997A true JPS63210997A (ja) 1988-09-01

Family

ID=12726675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62045701A Pending JPS63210997A (ja) 1987-02-27 1987-02-27 パタ−ン認識システム

Country Status (1)

Country Link
JP (1) JPS63210997A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5614381A (en) * 1979-07-13 1981-02-12 Nec Corp Pattern recognizing system
JPS58145996A (ja) * 1982-02-24 1983-08-31 株式会社京三製作所 音声認識方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5614381A (en) * 1979-07-13 1981-02-12 Nec Corp Pattern recognizing system
JPS58145996A (ja) * 1982-02-24 1983-08-31 株式会社京三製作所 音声認識方式

Similar Documents

Publication Publication Date Title
Lamel et al. An improved endpoint detector for isolated word recognition
US4918732A (en) Frame comparison method for word recognition in high noise environments
EP0112717B1 (en) Continuous speech recognition apparatus
KR102655791B1 (ko) 화자 인증 방법, 화자 인증을 위한 학습 방법 및 그 장치들
JPS6312312B2 (ja)
CA1301338C (en) Frame comparison method for word recognition in high noise environments
JPS63210997A (ja) パタ−ン認識システム
JPS63210998A (ja) パタ−ン認識システム
JPS63204491A (ja) パタ−ン認識システム
JPH0119597B2 (ja)
JP3031081B2 (ja) 音声認識装置
JP2547541B2 (ja) 単音節音声認識装置
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JP3533773B2 (ja) 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置
JPS63163399A (ja) パタ−ン認識装置
KR20010091093A (ko) 음성 인식 및 끝점 검출방법
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
JPH0336439B2 (ja)
WO2024081203A1 (en) Evaluation-based speaker change detection evaluation metrics
JPS5977500A (ja) 単語音声認識方式
JP2712704B2 (ja) 信号処理装置
JPH0950292A (ja) 音声認識装置
JPS61114386A (ja) パタン認識装置
JP2000322080A (ja) 音声認識処理装置および音声認識処理方法
JPS593498A (ja) 音声認識装置