JPS63210998A - パタ−ン認識システム - Google Patents

パタ−ン認識システム

Info

Publication number
JPS63210998A
JPS63210998A JP62045702A JP4570287A JPS63210998A JP S63210998 A JPS63210998 A JP S63210998A JP 62045702 A JP62045702 A JP 62045702A JP 4570287 A JP4570287 A JP 4570287A JP S63210998 A JPS63210998 A JP S63210998A
Authority
JP
Japan
Prior art keywords
pattern
similar
standard
patterns
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62045702A
Other languages
English (en)
Other versions
JPH0654438B2 (ja
Inventor
透 清水
迫江 博昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62045702A priority Critical patent/JPH0654438B2/ja
Publication of JPS63210998A publication Critical patent/JPS63210998A/ja
Publication of JPH0654438B2 publication Critical patent/JPH0654438B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声、文字等のパターン認識システムの改良
に関する。
(従来の技術) 近年、音声、手書き文字等、数々の実用的なパターン認
識システムが発売され、産業界で利用されている。これ
らの認識システムの大部分はパターンマツチング法を原
理として動作するものである。すなわち、認識すべき対
象の特徴を示すパターンを認識に先立ち予め作成、登録
しておき(以下このパターンを標準パターンと称する)
、認識時に入力されたパターン(以下このパターンを入
力パターンと称する)と比較処理(以下マツチングと称
する)を行い、その差(以下距離と称する)の最も小さ
い標準パターンのカテゴリ名を認識結果とする方法であ
る。
このパターンマツチング法は、特願昭49−2418号
明細書記載の如く、動的計画法を利用して一方のパター
ンが他方のパターンに最適に対応するような歪み関数を
求め、その歪み関数を用いてマッチングを行うというD
Pマツチングを用いることで、マツチングの際の両パタ
ーンの発声長の違いに対処でき、実用性が高められた。
しかし、上記パターンマツチング法においても、「和歌
山」と「岡山」等、類似した単語音声、「キ」と「ギ」
、「リヤ」と「ミャ」等、類似した単音節音声等は、認
識が困難で誤りが多い現状である。また、文字認識でも
、「7」とEヶ」等の類似した文字において、同様の問
題が存在する。
その対策として、特願昭54−88909号明細書に示
されるように、前もって、類似した標準パターンの類似
部分を平均化して共通にしておき、相違部分のみの違い
で認識を行うという方法が提案されている。
(発明が解決しようとする問題点) 上記方法において、どの標準パターンが類似していて、
そのどの部分が類似した部分であるかを見つけることが
必要である。それを誤って、類似部分を少なく検出した
ら平均する部分が少なくなってしまい誤認識を改善でき
ないし、逆に多く検出したら本来具なる部分まで平均化
してしまい、かえって認識の低下を招くという問題点が
ある。
また、上記方法は、類似した標準パターンが2つの場合
の改善法であり、類似した標準パターンが3つ以上存在
する場合の対策は述べられていない。
本発明の目的は、上記問題点に着目してなされたもので
、類似した標準パターンが3つ以上存在する場合でも、
それら標準パターンの中から、類似した標準パターンの
組とその類似した部分を正確に検出し、その部分のみを
平均化することで、高い認識率の得られるパターン認識
システムを提供することにある。
(問題点を解決するための手段) 本発明のパターン認識システムは、標準パターンを記゛
憶する標準パターン記憶部と、入力パターンと各標準パ
ターンとの比較処理を行うためのマツチング部と、前記
マツチング結果に基づいて認識を行う認識部と、前記標
準パターン間で比較処理を行った結果であるパターン間
距離を基にパターン間の類似部分が全体に占める割合を
推定する類似部割合検定部と、前記推定した割合を用い
て前記標準パターン中の類似単語群とその類似部分を検
出する標準パターン類似部検出部と、前記類似、単語群
の標準パターン間で共通な類似部分を相互に平均化する
処理を行い類似単語群に対する新たな標準パターンとす
る標準パターン平均化部とから構成される。
(作用) 以下、本発明の作用を、単語音声パターンの認識を例に
あげて説明する。しかしながら、本発明の対象は、音声
認識のみにとどまるものではない。
入力パターンrOKAYAMA、の認識を行う際、標準
パターンにrOKAYAMAJ、rWAKAYAMAJ
  rOKUYAMA」という類似したパターンが3つ
含まれているとする。この場合、入力パターンrOKA
YAMA、と、3つの類似した標準パターンrOKAY
AMA、、[WAKAYAMAJ、rOKUYAMA」
の距離は、他の標準パターンとの距離よりも小さいが、
正しい認識結果のrOKAYAMAjとの距離が最小と
なっているとは限らない、つまり、誤認識している可能
性が高い、これは、前記特願昭54−88909号明細
書に例があげられているように、“WA”と“0”、“
KA″と“KU″の違いが明確に存在しているにもかか
わらず、類似した残余の部分に影響されて、“WA”と
“0”、“KA”と“KU”の弁別的特徴がマスクされ
てしまうからである。その改善法として、類似した標準
パターンの弁別部である“WA”と“0”、“KA”と
“KU”以外の類似部分を平均化して共通にしておき、
入力パターンとこの3つの標準パターンの識別は、弁別
部“WA”と“O”、“KA”と“KU”の違いのみで
行うという方法である0本発明の特徴は、この類似した
標準パターン間の弁別部の検出方法にある。
−mに、音声の特徴ベクトルの距離は、両者が同一の音
素に属する場合は小さく、異なった音素に属するときは
大きい、ゆえに、両パターン間の距離が大きい場合は、
異なる音素が多いつまり類似部が少なく弁別部が多く、
両パターン間の距離が小さい場合は、異なる音素が少な
いつまり類似部が多く弁別部が少ないとみなすことがで
きる。
今、標準パターンベクトル列B 1 = bl 、 、
 bl 2.・・・。
b’1.・・・、b’+と、標準パターンベクトル列B
2=b21゜b22.・・・、b2j、・・・・+ b
2Jを考え、二つをDPマツチングする。その結果、ベ
クトルB1のiフレームにベクトルB2のjフレームが
対応したとする。その対応するフレームのベクトル間距
離d(bll、b2j)[以下、この距離をDP対応ベ
クトル閏距離と称する]の全フレームの平均値D(b’
l、b2J) [以下、この値をDP距離と称する]を
基にして、類似部を検出することができる。
つまり、前もって、単語長に対する類似部分の割合E以
下、類似部割合と称する]と単語間のDP距離との対応
E以下、この対応を距離−類似部割合対応と称する]を
求め記憶しておき、標準パターン間のDP距離とその関
係を照らし合わせることにより、標準パターン間の類似
部分の割合を推測できる。そして、DP対応ベクトル間
距離の小さいものから順に、その割合分のフレームを類
似部とすることができる。
今、上記3つの類似した標準パターンが存在する場合を
考える。まず、標準パターンrOKAYAMAJと他の
すべての標準パターンとマツチングを行って距離を求め
る。その中で、特に距離の小さかったものを、rOKA
YAMA」と類似しているパターンとして、平均化処理
をすべきパターンの候補とする。なお、この候補の中に
は、あまり類似していないパターンが含まれていても良
いので、少し多めに候補を選ぶようにする。その結果、
rOKAYAMA、と平均化処理をすべきパターンの候
補として、rWAKAYAMA」、rOKUYAMA」
、rUKIsIMA、、「A KIKAWAJが選ばれ
たとする。
次に、rOKUYAMA」と各候補の単語とをDPマツ
チングした際のDP距離と、前もって求めておいた距離
−類似部割合対応とを照らし合わベクトル距離を与える
フレームは弁別部、その閾値を下回る平滑化DP対応ベ
クトル距離を与えるフレームは類似部とする。その結果
、rAK I KAWAJは類似部が存在せず、候補か
ら除かれ、rWAKAYAMAJのと類似部はKAYA
MA”、rOKUYAMAJのと類似部は“OK″′と
“YAMA”、rUKIsIMA」との類似部は“MA
”となる。
各候補の類似部が求まれば、rOKUYAMA」のパタ
ーンと類似部のパターンの平均を求め、それをrOKU
YAMAJの新たな標準パターンとする。つまり、”O
K”はrOKUYAMA」の“OK″との平均、“YA
″はrOKAYAMAJ、rWAKAYAMAJの“Y
A”との平均、“MA”はrOKAYAMAJ、rYA
KAYAMAJ、rUKISIMAJの“MA”との平
均したパターンを用いる。
rOKUYAMA、に対して行った以上の操作を、他の
標準パターンについても、同様に行えば、全ての標準パ
ターンについて、類似したパターンの類似部分のみを平
均化でき、誤認識を改善することができる。
(実施例) 以下、本発明の実施例について図面とともに説明する。
第1図は、本発明の一実施例における音声認識装置のブ
ロック図である。
マイクロホン1より入力された音声信号は、音声分析部
2において、たとえば特願昭52−144205号明細
書及びその第3図に示された如き周波数分析器によって
、音声分析がなされ、ベクトルの時系列の形に変換され
る。
本装置は、標準パターンの登録を行う登録モードと、入
力パターンの認識を行う認識モードとで、動作が異なり
、スイッチ回路3で切り替える。
認識モードにおいて、スイッチ回路3は入力パターン記
憶部4側に接続される。マイクロホン1より入力された
音声は、音声分析部2を経て、ベクトル時系列の形の入
力パターンとして入力パターン記憶部4に記憶される。
また、平均標準バタクトル時系列の形の入力パターンと
して入力パターン記憶部4に記憶される。また、平均標
準パターン記憶部5には、後述の登録モードの際に作成
される類似標準パターン間での平均化処理の行われた平
均標準パターンが記憶されている。マツチング部6は、
入力パターン記憶部4から入力パターンA=a1.a2
.・・・、al、・・・・、alを、平均標準パターン
記憶部5から平均標準パターンB″″=b’″l+b”
3+・・・rb”J+・・・・、b″″Jを受は取り、
特願昭49−24111号記載のごとく、動的計画法を
利用して時間軸方向の変動を正規化し、2つのパターン
A、B’″の距離D(A、B”)  = 115−m、
%+2.(ンモ、1d(al、b議J))を計算する。
このアルゴリズムは、パターン認識の分野では、周知の
技術なので、詳細な説明は省く。以下、この距離をDP
距離と称する。。ただし、j=jm(i)は、時間軸が
最適に対応するようにパターンB″″をパターンAに歪
ませる歪み関数である。DP距離は、順次認識部7に送
られ、大小比較される。すべての平均標準パターンとの
DP距離の比較が終了すると、最小値を与えた平均標準
パターンのカテゴリ名が認識結果として、出力される。
次に、登録モードの説明をする0本発明の原理は、登録
モード時に適用される。登録モードにおいて、スイッチ
回路3は標準パ久−ン記憶部8側に接続される。マイク
ロホン1より入力された登録用音声は、音声分析部2を
経て、ベクトル時系列の形の標準パターンとして標準パ
ターン記憶部8に記憶される。すべての標準パターン8
1〜B2の登録が終了すると、標準パターンは、逐次、
類似部分検出部9で、類似標準パターンとその類似部分
が検出され、標準パターン平均化処理部10で平均化さ
れ、平均標準パターン記憶部5に記憶される。
以下、II mハターンB”l)’1+1)’2+”’
+1)sl+−+b5.を平均化する場合を例にして、
各部の説明をする。第2図は、類似部分検出部9の詳細
図である。標準パターンBSと aS以外のすべての標
準パターンB”(m=1〜z、m1s)とのDP距離D
(Bs、B”″)がマツチング部6で計算され、判定部
91に送られる0判定部91では、D(B’、B″″)
を監視しその値が第に番目以内に小さい値かどうかを判
定し、小さい値であれば、マルチプレクサ92に指令し
、て、マツチング部6の計算結果である歪み関数jin
(i )、■フレーム分のDP対応ベクトル距離d(b
s+、l)”、s+ 1 +)(i= 1〜I)ト、ソ
(1)WA準)< 9−:/のカテゴリ名m、DP距離
D(B’、B”)を、それぞれ、記憶部93、記憶部9
4、記憶部95、記憶部96に記憶する。同時に、標準
パターン記憶部8よりそのカテゴリ名のパターンのフレ
ーム数f”を記憶部97に記憶する。平滑化DP対対応
ベクトル距離計郡部8では、記憶部94のDPP応ベク
トル距離のLフレーム分の平均値である平滑化DPP応
ベクトル距離5d(b’++b−jmt目)= l/L
・Σd(b’、+x+1)”J、(++sH) (i 
= 1〜■)を1フレームづつシフトして1個求め、記
憶部99に記憶する0以上の動作が終了すると、記憶部
93.94.95.99.96.97には、それぞれ、
標準パターンUSとのDP距離の小さかった上位に個の
標準パターンについての、iみ関数、DPP応ベクトル
距離、その標準パターンのカテゴリ名、平滑化DPP応
ベクトル距離、DP距離、フレーム数が記憶されている
次に、パターンBSと上位に個の標準パターンとの類似
部分を求める際の動作の説明をする。今、」二位に個の
内の一つのパターンB”との類似部分を求める場合につ
いて説明する。平均化フレーム数計算部910i、t、
記’tft部96ヨリD P 距離D(B’、B”)ヲ
受は取り、その値に対応する類似部割合Rs−(0≦1
8++i≦1)を距離−類似部割合対応記憶部11より
得る。距離と類似部割合の対応は、例えば、第3図に示
すようなものが考えられる。第3図において、横軸はD
P距離、縦軸は類似部割合を示し、DP距離が大きくな
るほど、類似部割合が小さくなるようになっている0次
に、記憶部97から、f″″を受は取り、R5wmXf
”″なる計算を行い、その値を類似部分縮フレーム数N
Smとして、比較部911に送る。比較部911は、B
Sのi=1〜Iまでのフレームについての81との平滑
化DPP応ベクトル距離5d(b’++b”jlo)を
記憶部99より受は取り、ソノ値が小さいものから順に
N51個選び、それらのフレームには類似部分として信
号Sim・1、それ以外のフレームには信号Sim・0
を、標準パターン平均化処理部10に送る。以上の動作
を上位に個の全てのパターンについて行えば、パターン
nsと上位に個の標準パターンとの類似部分が求められ
る。
第4図は、標準パターン平均化処理部10の詳細図であ
る。制御部101では、フレーム番号i=1〜Iについ
て順次、各カテゴリ名mに対する信号Simを受は取る
。そして、あるiにおいてSimが、1であるカテゴリ
名mの個数にiをカウント回路102でカウントし、に
iをベクトル平均部103に送る。同時に、Sinが1
であるカテゴリ名mとそのフレーム番号iが歪み関数記
憶部93に送られjrn(i>が読みだされ、標準パタ
ーン記憶部8より、カテゴリ名mの第jm(i)フレー
ムのベクトル1)−Jm(l lが、順次ベクトル平均
部103に送られる。また、標準パターン記憶部9よつ
、カテゴリ名Sの第iフレームのベクトルbs+も、ベ
クトル平均部103に送られる。ベクトル平均部103
では、K11oの場合は、ベクトルの平均優品(bsI
+Σ”Jj(+1)を計算し、その値を平均標準バタj
諷1 一ン記憶部5に出力し、にn=oの場合は、b?、を平
均標準パターン記憶部5に出力する0以上の動作をフレ
ーム番号i=1〜■まで行えば、標準パターンB5の平
均化処理が施された平均標準パターンが、平均標準パタ
ーン記憶部5に記憶される。
以上の標準パターンB5に対し行った動作を、他の標準
パターンB’(n= 1〜2)に対して行えば、すべて
の標準パターンに対する平均標準パターンが作成される
以上、本発明の原理を実施例に基づいて説明したが、こ
れらの記載は本発明を限定するものではない、とくに、
距離−類似部割合対応記憶部11に記憶しておく距離と
類似部割合の対応は、第3図に限定されず、例えば、第
5図に示すようなものでも良い、さらに、本発明の原理
は、音声以外のパターンを対象にする場合にも有効に適
用されるのは明かである0例えば、文字認識に適用され
た場合には、r間」と「間」のような極めて類似した文
字間の弁別に効果がある。
(発明の効果) 以上に述べた通り、本発明によれば、類似した標準パタ
ーンが3つ以上存在する場合でも、それら標準パターン
め中から、類似した標準パターンの組とその類似した部
分を正確に検出し、その部分のみを平均化することで、
高い認識率の得られるパターン認識システムを提供する
ことができる。
【図面の簡単な説明】
第1図は、本発明の一実施例の音声認識装置のブロック
図、第2図は、類似部分検出部9の詳細図、第4図は、
標準パターン平均化処理部1◎の詳細図、第3図、第5
図は距離と類似部割合の対応の一例を表す図である。 1・・・マイクロホン、2・・・音声分析部、3・・・
スイッチ回路、4・・・入力パターン記憶部、5・・・
平均化標準パターン記憶部、6・・・マツチング部、7
・・・認識部、8・・・標準パターン記憶部、9・・・
類似部分検出部、lO・・・標準パターン平均化処理部
、11・・・距離−類似部割合記憶部、91・・・判定
部、92・・・マルチプレクサ、93.94.95.9
6.97.99・・・記憶部、98・・・平滑化DP対
対応ベクトル距離計郡部910・・・平均化フレーム計
算部、911・・・比較部、101・・・制御部、10
2・・・カウント回路、103・・・ベクトル平均部、
、・代理人 弁理士 内照 會11′− 第3図 第5図 DP距離

Claims (1)

    【特許請求の範囲】
  1. 標準パターンを記憶する標準パターン記憶部と、入力パ
    ターンと各標準パターンとの比較処理を行うためのマッ
    チング部と、前記マッチング結果に基づいて認識を行う
    認識部とを有するパターン認識システムにおいて、前記
    標準パターン間で比較処理を行った結果であるパターン
    間距離を基に類似部分が全体に占める割合を推定する類
    似部割合推定部と、前記推定した割合を用いて前記標準
    パターン中の類似単語群とその類似部分を検出する標準
    パターン類似部検出部と、前記類似単語群の標準パター
    ン間で共通な類似部分を相互に平均化する処理を行い類
    似単語群に対する新たな標準パターンとする標準パター
    ン平均化部とを有することを特徴とするパターン認識シ
    ステム。
JP62045702A 1987-02-27 1987-02-27 パタ−ン認識システム Expired - Lifetime JPH0654438B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62045702A JPH0654438B2 (ja) 1987-02-27 1987-02-27 パタ−ン認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62045702A JPH0654438B2 (ja) 1987-02-27 1987-02-27 パタ−ン認識システム

Publications (2)

Publication Number Publication Date
JPS63210998A true JPS63210998A (ja) 1988-09-01
JPH0654438B2 JPH0654438B2 (ja) 1994-07-20

Family

ID=12726701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62045702A Expired - Lifetime JPH0654438B2 (ja) 1987-02-27 1987-02-27 パタ−ン認識システム

Country Status (1)

Country Link
JP (1) JPH0654438B2 (ja)

Also Published As

Publication number Publication date
JPH0654438B2 (ja) 1994-07-20

Similar Documents

Publication Publication Date Title
Lamel et al. An improved endpoint detector for isolated word recognition
JPS5876899A (ja) 音声区間検出装置
CN112215154A (zh) 一种应用于人脸检测系统的基于蒙版的模型评估方法
De Souza A statistical approach to the design of an adaptive self-normalizing silence detector
EP0614169B1 (en) Voice signal processing device
JPS63210998A (ja) パタ−ン認識システム
Rabiner et al. Isolated word recognition using a two-pass pattern recognition approach
JP2000215313A (ja) デ―タ識別方法およびその装置
JPS6312312B2 (ja)
JPS63210997A (ja) パタ−ン認識システム
JPH0119597B2 (ja)
Anguita et al. Detection of confusable words in automatic speech recognition
JP2005115386A5 (ja)
JP2005115386A (ja) 誤認識予測方法
JP3031081B2 (ja) 音声認識装置
Himawan et al. The QUT speaker diarization system for the First DIHARD challenge
JPS593498A (ja) 音声認識装置
JP3533773B2 (ja) 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
JPS62111295A (ja) 音声認識装置
KR100349656B1 (ko) 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법
JPH0519784A (ja) 音声認識装置
JPS6287995A (ja) 音声パタ−ン登録方式
JP2000322080A (ja) 音声認識処理装置および音声認識処理方法
Zhu A combined neural network and hidden Markov model approach to speaker recognition