JPS6385883A - パタ−ン認識学習装置 - Google Patents

パタ−ン認識学習装置

Info

Publication number
JPS6385883A
JPS6385883A JP61230638A JP23063886A JPS6385883A JP S6385883 A JPS6385883 A JP S6385883A JP 61230638 A JP61230638 A JP 61230638A JP 23063886 A JP23063886 A JP 23063886A JP S6385883 A JPS6385883 A JP S6385883A
Authority
JP
Japan
Prior art keywords
recognition
pattern
patterns
learning
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61230638A
Other languages
English (en)
Inventor
Hiroshi Matsuura
博 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61230638A priority Critical patent/JPS6385883A/ja
Publication of JPS6385883A publication Critical patent/JPS6385883A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は入力パターンの認識に用いる認識辞書を効果的
に学習し、その認識性能の向上を図り得るパターン認識
学習装置に関する。
(従来の技術) 従来のパターン認識装置は、一般に標準パターン登録時
に入力された複数個のパターンに多少の修正を加え、こ
れを殆んどそのまま漂弗パターンとして認識辞書メモリ
に登録している。そして認識辞書メモリに登録された種
々のカテゴリの標準パターンと入力パターンとを、例え
ばDPマツチング法を用いて照合してその認識を行なっ
ている。
またこのようにして登録された標準パターンを修正(標
準パターンの学習)も、通常は新たな標準パターンの追
加やその削除、或いは標準パターンの入替え等による簡
単な操作によって行われている。しかし、このようにし
て作成される標準パターンは認識対象パターンのばらつ
き(分布)ヲ考慮していない為、その認識率を十分高め
ることができないと云う問題があった。
そこで最近では、2次識別関数による認識法や複合類似
度法を採用してその認識率の向上を図ることが行われて
いる。
しかして上記2次識別関数を用いた認識法における認識
辞書の学習は、通常その平均値と共分散行列を逐次更新
することにより行われ、また複合類似度法にあっては、
その特性核を逐次更新して認識辞書の学習が行なわれる
この認識辞書の逐次更新に際しては、従来、単に新たな
学習パターンを加えるだけであったが、最近では予め認
識処理を行い、誤りを生じたパターンについては本来認
識されるべくカテゴリから、誤認識されたカテゴリにつ
いての学習パターンの要素を差引くと云う操作を行って
いる。この処理によって、その学習の処理速度を速め、
しかも認識辞書の改善の確実化を図るようにしている。
一方、認識辞−書の学習、即ち、辞書修正やその逐次更
新の為のデータ収集は、通常認識対象とするカテゴリの
全てについて、或いは誤認識が生じたカテゴリについて
そのデータ収集している。しかしこのようにして学習パ
ターンを収集することは、オペレータに相当の負担を強
いることのみならず、多くの収集時間を必要とする等の
問題があった。
そこで学習対象とするカテゴリを減らし、必要な計算量
を減らす為に、誤認識が発生し易いカテゴリについての
みデータ収集し、そのデータに対して学習することが試
みられている。然し乍ら、特定のカテゴリについてのみ
学習しても、認識処理自体は他のカテゴリに対する類似
度との関係に従って行われるので、その学習効果が必ず
しも十分に現われるとは云い難かった。
(発明が解決しようとする問題点) このように従来にあっては、認識辞書の学習に必要な学
習パターンを如何に効率良く収集してその学習を行い、
認識率の向上を如何にして図るかに種々の問題があった
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、学習対象カテゴリの削減を図り
、その学習に必要なパターンを効率良く収集して認識辞
書の学習を効果的に行なわしめ、ひいては認識率の向上
を図ることのできるパターン認識学習装置を提供するこ
とにある。
[発明の構成] (問題点を解決するための手段) 本発明は、入力パターンと認識辞書とを良合類似度や部
分空間法により照合して上記入力パターンを認識処理す
ると共に、この認識結果に基いて上記人カバターンを用
いて特定カテゴリの認識辞書を学習するようにしたパタ
ーン認識学習装置において、学習パターンを収集する際
に、誤認識を生じたカテゴリのデータのみならず、誤っ
た認識結果として求められたカテゴリのデータについて
も収集し、これらの収集データに従って認識辞書を効率
良く学習するようにしたものである。
(作用) かくして本発明によれば、誤認識の生じ易いカテゴリの
データのみならず、誤って認識されるカテゴリのデータ
についても認識辞書の学習パターンとして収集される。
例えば入力パターンの「ア」なるカテゴリが「パ」や「
夕」なるカテゴリに誤認識された場合、「ア」のパター
ンの”みならず「パ」や「夕」のパターンも収集する。
そして、これらのパターンを用いて上記「ア」 「パ」
「り」の認識辞書の学習がそれぞれ行われる。これ故、
認識辞書の学習に必要なパターンを効果的に収集してそ
の学習処理を効率良く行わせ、その認識率の向上を図る
ことが可能となる。
(実施例) 以下、図面を参照して本発明の一実施例につき説明する
第1図は実施例装置の概略構成図である。尚、ここでは
発声入力された音声パターンの認識につき説明するが、
手書き文字認識等のパターン認識にあっても同様に適用
することができる。
音声人力部1はマイクロフォンや増幅器からなり、入力
音声を電気信号に変換している。この音声入力部1を介
して入力された音声信号は特徴抽出部2に与えられ、例
えば8チヤンネルのフィルタバンクを介して周波数分解
され。そして各周波数成分を入力音声の特徴パラメータ
とする入力音声パターンに変換される。
認識部3は、入力音声パターンの特徴ベクトルをfとし
たとき、辞書メモリ4に登録されたカテに) ゴリlの辞書パターン(φ  )の各n面のベクトル成
分との間で なる複合類似度計算を実行し、その類似度Sを最大とす
るカテゴリを前記入力音声パターンの認識結果としてい
る。尚、この認識処理法としては、マハラノビス汎距離
やユークリッド距離等を用いて行なうようにしても良い
このようにして求められた前記入力音声パターンの認識
結果が表示部5にてディスプレイ表示される。
一方、学習部8は前記入力音声パターン、およびメモリ
部6に蓄積された入力パターンを用いて前記辞書メモリ
4に登録された認識辞書(辞書パターン)を、各認識対
象カテゴリ毎に学習するものである。この学習部8にお
ける辞書パターンの学習は、例えば第2図に示すように
共分散行列の繰返し更新処理とその共分散行列データの
KL展開によって行われる。即ち、 なる演算を施すことによってその学習が行われる。
但し、Sは学習パターンであり、例えば64次元のベク
トルとして与えられる。またKは上記学習パターンSを
学習する前の共分散行列であり、K′は学習後の共分散
行列である。そしてWは正負の値をとる重み係数であり
、正の場合には上記共分散行列の入力パターンに対する
類似度を大きくする作用があり、また負ならばその類似
度を小さくする作用を呈する。
このような共分散行列の学習が、各認識対象カテゴリ毎
に複数のサンプルパターンを用いて複数回繰返して行わ
れる。そしてこの学習結果として求められた共分散行列
ベクトルに′をKL展開して、その固有値と固有ベクト
ルとが計算される。
しかしてこの学習とKL展開によって求められた固有値
とその固有ベクトルが、各認識対象の認識辞書(辞書パ
ターン)として前記辞書メモリ4に格納される。
尚、辞書メモリ4の記憶容量が満杯になったときには、
各カテゴリ毎にその認識パターンを外部メモリ7に格納
し、これを適宜辞書メモリ4に読出して認識処理に用い
る。尚、発声例メモリ9は学習パターンを収集する際に
用いる、単語例を格納したものである。
さてこのように構成された装置において、認識辞書の学
習は次のようにして行われる。今、認識部3における認
識結果から、例えばカテゴリ「ア」の認識率が特に悪い
とき、「ア」の辞書を改善する必要があると判断される
しかしてこの場合、先ず「ア」のカテゴリに属する人カ
バターンが、誤認識によってどのカテゴリに属すると認
識されることが多いかが調べられる。そしてrパ」と「
夕」に誤ることが多いと判断された場合には、「ア」の
データを収集することのみならず、「バ」と「夕」のデ
ータについても収集する。つまり、誤認識を生じたカテ
ゴリのパターンのみならず、誤認識の結果として求めら
れるカテゴリのパターンについてもデータ収集する。
そしてこれらの収集データを用いて前記学習部8にて、
その共分散行列の更新処理を行い、各カテゴリの認識辞
書をそれぞれ学習する。このときの重み係数Wの値につ
いては、第3図に示すようにその正負の値を定めてそれ
ぞれのカテゴリの学習を行なう。
このようにすれば、例えば「ア」のカテゴリに属する入
力パターンが「パ」や「夕」に属するとして誤認識され
た場合、「ア」の辞書パターンがその学習によって改善
されることのみならず、「パ」や「夕」のカテゴリの辞
書パターンもその学習により同時に改善される。故に、
その認識辞書を非常に効率良く学習して、認識性能の向
上を図ることが可能となる。
ところでこのようにして学習パターンを収集して認識辞
書を学習する場合、例えば学習カテゴリ「ア」を単音節
として発声人力しただけでは、連続発声時における「ア
」の発声パターン変動を考慮した学習ができなくなる。
つまり連続発声される音声における単音節は、一般にそ
の前後の音節の影響を受けて比較的大きな変動を示す。
そこでこのような音節パターンの変動を吸収するべく、
上記単音節の前後に他の音節を付加した単語を前記発声
例メモリ9から得、その単語を前記表示部5に表示して
学習パターンの発声入力を促す。例えば「ア」なる音声
カテゴリの認識辞書を学習する場合には、この「ア」を
含む「しあい」 「きあつ」「シあげ」・・・・・・等
の単語の発声入力を促す。尚、これらの学習パターンの
入力を促すための単語の表示は、1つづつ選択的に表示
しても良いし、或いは複数の単語を表示し、カーソル等
で順次指定するようにしても良い。また表示された複数
の単語の中から、オペレータが自ら選択指定して、その
指定単語を発声人力するよにしても良い。
しかして装置側では、このような学習用の音声入力時に
は、その入力音声パターン中から学習対象としているカ
テゴリ、ここでは「ア」の入力パターンを抽出し、これ
を前記メモリ部6に順次蓄積する。またこの入力パター
ンを前記学習部8に与えて前述した学習処理を行なうこ
とになる。
以上説明したように本装置によれば、認識辞書の効果的
な学習に必要な入力パターンをオペレータに提示し、同
時に学習に適したパターンを得るべくその発声例(単語
)がオペレータに提示される。従ってオペレータは提示
された指示に従って音声を発声入力するだけで良いので
、パターン人力作業を非常に簡易に行い得る。
また学習部8では認識辞書の学習に必要な人カバターン
だけを効果的に収集し、これを用いてその学習処理を実
行し得るので、不本意な入力パターンによる学習誤差の
発生を招くことがない。しかも学習効果の向上を図るに
有効なパターンのみを効率良く、しかも学習に必要なた
け収集することができ、認識辞書の効果的な学習を行い
得る。
従って、認識辞書の効率的な学習、無駄の少ない学習に
より該認識辞書の充実化を図り、その認識性能の向上を
図り得る。
尚、本発明は上述した実施例に限定されるものではない
。例えば認識辞書の学習に必要な人カバターンの数やそ
の種類は、その認識結果に応じて定めれば良いものであ
る。また認識辞書の構成法も特に限定されない。また前
述したように手書き文字認識等のパターン認識装置にお
ける認識辞書の学習にも同様に適用することができる。
更には学習に必要なパターン入力の提示法も特に限定さ
れない。要するに本発明はその要旨を逸脱しない範囲で
種々変形して実施することができる。
[発明の効果] 以上説明したように本発明によれば、誤認歳されたカテ
ゴリのみならず、誤った認識されたカテゴリについても
そのパターンを入力し、これらの学習パターンを用いて
それぞれの認識辞書を学習するので、認識辞書を非常に
効率良く学習してその充実化を図り、認識率の向上を図
り得る等の実用上多大なる効果を奏する。
【図面の簡単な説明】
第1図は本発明の一実施例装置の概略構成図、第2図は
実施例装置における認識辞書の学習アルゴリズムを示す
図、第3図は認識対象カテゴリとその認識結果に対する
学習カテゴリと重み係数の関係を示す図である。 ■・・・音声人力部、2・・・特徴抽出部、3・・・認
識部、4・・・辞書メモリ、5・・・表示部、6・・・
メモリ部、7・・・外部メモリ、8・・・学習部、9・
・・発声例メモリ。 出願人代理人 弁理士 鈴江武彦 第1図 第2図

Claims (4)

    【特許請求の範囲】
  1. (1)入力パターンと認識辞書とを照合して上記入力パ
    ターンを認識処理する手段と、この認識結果に基いて誤
    認識し易いカテゴリのパターン、および誤認識の結果と
    して出力されるカテゴリのパターンの入力を促す手段と
    、この入力パターンを用いて上記誤認識し易いカテゴリ
    および誤認識の結果として求められるカテゴリの認識辞
    書を学習する手段とを具備したことを特徴とするパター
    ン認識学習装置。
  2. (2)特定のカテゴリのパターンの入力を促す手段は、
    特定カテゴリ名とその特定カテゴリの認識辞書の学習に
    必要パターン数とをディスプレイ表示して行われるもの
    である特許請求の範囲第1項記載のパターン認識学習装
    置。
  3. (3)特定カテゴリのパターンの入力を促す手段は、該
    特定カテゴリを含むデータ入力例をディスプレイ表示し
    て行われるものである特許請求の範囲第1項記載のパタ
    ーン認識学習装置。
  4. (4)入力パターンと認識辞書との照合によるパターン
    認識処理は、複合類似度法または部分空間分割法により
    行われるものであって、特定カテゴリの認識辞書の学習
    は、共分散行列の更新とKL展開法とを用い、その特性
    核または上記共分散行列に対する入力パターンの寄与率
    を変化させて行われるものである特許請求の範囲第1項
    記載のパターン認識学習装置。
JP61230638A 1986-09-29 1986-09-29 パタ−ン認識学習装置 Pending JPS6385883A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61230638A JPS6385883A (ja) 1986-09-29 1986-09-29 パタ−ン認識学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61230638A JPS6385883A (ja) 1986-09-29 1986-09-29 パタ−ン認識学習装置

Publications (1)

Publication Number Publication Date
JPS6385883A true JPS6385883A (ja) 1988-04-16

Family

ID=16910924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61230638A Pending JPS6385883A (ja) 1986-09-29 1986-09-29 パタ−ン認識学習装置

Country Status (1)

Country Link
JP (1) JPS6385883A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60107192A (ja) * 1983-11-16 1985-06-12 Toshiba Corp パタ−ン認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60107192A (ja) * 1983-11-16 1985-06-12 Toshiba Corp パタ−ン認識装置

Similar Documents

Publication Publication Date Title
JPH02195400A (ja) 音声認識装置
Mansour et al. Voice recognition using dynamic time warping and mel-frequency cepstral coefficients algorithms
JPS6172377A (ja) パタ−ン認識装置
JPH0352640B2 (ja)
US5677991A (en) Speech recognition system using arbitration between continuous speech and isolated word modules
Patil et al. Automatic Speech Recognition of isolated words in Hindi language using MFCC
Rajasekhar et al. A study of speech, speaker and emotion recognition using Mel frequency cepstrum coefficients and support vector machines
US8219386B2 (en) Arabic poetry meter identification system and method
Chuctaya et al. Isolated automatic speech recognition of Quechua numbers using MFCC, DTW and KNN
Sunny et al. Recognition of speech signals: an experimental comparison of linear predictive coding and discrete wavelet transforms
JP2955297B2 (ja) 音声認識システム
Maqsood et al. A comparative study of classifier based mispronunciation detection system for confusing
Kamble et al. Emotion recognition for instantaneous Marathi spoken words
JPH07219579A (ja) 音声認識装置
JP5544575B2 (ja) 音声言語評価装置、方法、及びプログラム
Hanifa et al. Comparative analysis on different cepstral features for speaker identification recognition
JPS6385883A (ja) パタ−ン認識学習装置
JPH03148750A (ja) 音声ワープロ
Suryawanshi et al. Hardware implementation of speech recognition using mfcc and euclidean distance
Missaoui et al. Gabor filterbank features for robust speech recognition
JPS61249182A (ja) パタ−ン認識学習装置
Majidnezhad A HTK-based method for detecting vocal fold pathology
CN110875034A (zh) 用于语音识别的模板训练方法、语音识别方法及其系统
JPS63161498A (ja) 音声情報入力装置
JP2656239B2 (ja) 音声認識学習方式