JPS61100883A - パタン認識装置 - Google Patents

パタン認識装置

Info

Publication number
JPS61100883A
JPS61100883A JP59222423A JP22242384A JPS61100883A JP S61100883 A JPS61100883 A JP S61100883A JP 59222423 A JP59222423 A JP 59222423A JP 22242384 A JP22242384 A JP 22242384A JP S61100883 A JPS61100883 A JP S61100883A
Authority
JP
Japan
Prior art keywords
pattern
section
recognition
input
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59222423A
Other languages
English (en)
Other versions
JPH0634180B2 (ja
Inventor
Masao Watari
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59222423A priority Critical patent/JPH0634180B2/ja
Publication of JPS61100883A publication Critical patent/JPS61100883A/ja
Publication of JPH0634180B2 publication Critical patent/JPH0634180B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 本発明は音声や文字などのパタンを認識する装置に関し
、特に入力パタンの経時変化に追従するブとめ標準パタ
ンの学習機能を持つパタンH識装置に関する。
〈従来技術とその問題点〉 音声や文字などのパタンを認識する手段として従来から
種々の方法が試みられている。それらの中で比較的簡単
でかつ有効な方法としてパタンマツチング法がある。パ
タンマツチング法では認識対象を特徴ベクトルの系列で
表現し標準パタンとして記憶させておき、認識しようと
するパタン(入力パタンと呼ぶ)と比較し最も近いすな
わち類似度の最も大きい標準パタンを求め、その標準パ
タンの属するカテゴリを認識結果として出力する。
一方、人力する音声パタンは時間とともに変動する経時
変化があることが知られている。このため、標準パタン
を作成した直後では高い認識率を示していても時間とと
もに認識率が低下して行く。
このような経時変化に対応するため適時標準パタンを更
新して行く学習法が知られている。このような標準パタ
ンの学習方式が昭和58年9月発行の昭和58年度電子
通信学会情報・システム′部門全国大会予稿集1−45
r音声詔識装置における簡易学習機能の一方式について
」 (以下文献1とする)に記載されている。文献1に
は2つの方式が述べられている。1つはバッドマーク方
式と読ばれ、誤認識に関与した標準パタンに指標(バ。
ドマーク)を付与し、その指標が大きくなった場合新し
いパタンと入れ換える方式である。他の1つは負献度方
式と読ばれ、正認識に関与した標準パタンに指標(貢献
度)を与え、その指標の小姑い標準パタンを新しいパタ
ンに更新する方式である。これらの方式では悪いと思わ
れる標準パタンを新しいパタンと入れ換え更新するため
、標準パタンは入力パタンの経時変化に追従し、認識率
が改善賂れる。
しかし、入力パタンは経時変化たけでなく発声ごとのバ
ラツキがあり、新しいパタンかその時点での平均的な代
表パタンに近いとけかぎらない。
すなわち、新しいパタンか経時変化に追従した代表パタ
ンに常になっていないため、場合によって正シい代表パ
タンより速いパタンを標準パタントしてしまう。このよ
うに従来の標準パタンの学習方式では、新しいパタンを
無条件に標準パタンと更新しているため、発声ごとのバ
ラツキをカバーできずに認識率を低下させる欠点があっ
た。
〈発明の目的〉 本発明の目的は、標準パタンを更新するための学習パタ
ンを記憶するメモリ部を備えその学習パタンを常に新し
いパタンによって更新させその学習パタンより標準パタ
ンを作成することにより、発声ごとのバラツキをカバー
し経時変化に追従する標準パタンを学習する機能を持つ
パタン認識装置を提供することにある。
〈発明の構成〉 本発明によれば、認識する対象の特徴パタンを得る特徴
抽出部と、前記特徴抽出部より得られた入力パタンを一
時記憶する入力パタンメモリ部と、認識する対象の標準
となる特徴パタンを記憶する標準パタンメモリ部と、入
力パタンと標準パタンの類似度を求める類似度計算部と
、前記類似度計算部の出力より認識結果を決定し出力す
る認識判定部と、利用者による前記認識結果の確認判定
を入力する確認入力部と、前記確認入力部に従い入力パ
タンメモリ部に記憶されていた入力パタンを読込み最も
古いパタンを捨てるFIFOメモリ部と、前記FIFO
メモリ部に記憶されている学習パタンより標準パタンを
作成し標準パタンメモリ部へ記憶させる標準パタン作成
部を持つことを特徴とするパタン8識装置が得られる。
また本発明によれば、認識する対象の特徴パタンを得る
特徴抽出部と、前記特徴抽出部より得られた入力パタン
を一時記憶する入力パタンメモリ部と、認識する対象の
標準となる特徴パタンを記51fる標準パタンメモリ部
と、入力パタンと標準パタンの類似度を求める類似度計
算部と、前記類似度計算部の出力より認識結果を決定し
出力する認識判定部と、前記認識結果に基づき認識の確
らしさを″求め確度の高い場合入力パタンを学習サンプ
ルと指定する学習指定部と、前記学習指定部に従い入力
パタンメモリ部に記憶されていた入力パタンを読込み最
も古いパタンを捨てるFIFOメモリ部と、前記FIF
Oメモリ部に記憶されている学習パタンより標準パタン
を作成し標準パタンメモリ部へ記憶させる標準パタン作
成部を持つことを特徴とするパタン認識装置が得られる
〈本発明の原理〉 次に本発明の詳細な説明する。入力パタンとあらかじめ
記憶されている標準パタンと類似度を求め認識する装置
では、認識対象の最も代表的であると思わnるパタンを
標準パタンとしている。しかし、入力パタンには、発声
ごとのバラツキと経時変化による変動があるため、高い
認識率を得るためには、発声ごとのバラツキをカバーす
る標準パタンの作成と経時変化に追従して行く標準パタ
ンか必要である。本発明では、入力パタンの経時変化に
標準パタンか追従するように、最新のN個の学習パタン
より標準パタンを作成している。すなわち、新しい学習
パタンを得た時唯最も古い学習パタンを捨て、常にN個
の最新の学習パタンより発声ごとのバラツキを考慮し標
準パタンを作成し、標準パタンを更新する。この標準パ
タンを作成する方法は種々試みられている。例えは、同
一カテゴリの中の学習サンプルの代表パタン(平均パタ
ン、または中心パタン)とする方法、クラスタリングの
手法により複数のサブカテゴリを求めそのサブカテゴリ
ごとの代表パタンとする方法などがある。
さらに、学習パタンを得る方法として、利用者による認
識結果の確認に従い、入力パタンか正しく認識された詩
人カパタンを学習サンプルに加える教師つき学習法と、
認識結果の類似度を基に認識の確らしさを求めその確度
が高い詩人カパタンを学習サンプルとする教師なし学習
法がある。
以下に述べる本発明の第1の実施例においては教師つき
学習法を用いており、利用者による確認の入力を用いて
いる。この方式では、学習サンプルに誤ったサンプルが
入ることはないため止しく標準パタンの更新を行うこと
ができ、認識率が同上する。
一方、本発明第2の実施例では教師なし学習法を用いて
おり、利用者の確認人力の手間が省かれ、利用者の負担
はない。
〈実施例1〉 次に本発明の第1の・実施例を図面を用いて説明する。
第1の実施例は第1図に示すように特徴抽出部1、入力
パタンメモリ部2、標準パタンメモリ部3、類似度計算
部4、認識判定部5、確認入力部6、FIFOメモリ部
7、標準パタン作成部8より構成される。
始めに、入力された音声は特徴抽出部1にて例エバスペ
クトラムパラメータのような特徴を抽出し、特徴々クト
ルの時系列として入力パタンメモリ部2へ記taされる
。このような特徴抽出部1には、共立出版社の昭和54
年10月発行の「音声認識」 (以下文献2とする)の
第113頁の図4.7に記載されている前処理部、特徴
抽出部を使用することができる。
類似度計算部4け入力パタンと標準パタンとの間の類似
度を求める部分で、1983年11月7日発行の日経エ
レクトロニクス誌の第171頁から第208頁の[連続
発声した単Hj音声を効率的に認識する2段Drマツチ
ングー1 (以下文献3とする)の図11に記載されて
いるDPマ、チング処理部を使用することができる。
認識判定部5け類似度計算部4より送られてくる各標準
パタンと入力パタンとの類似度s (Asn” )の最
小値を求め、最小値が得られたカテゴリ9を認識結果と
して出力する。すなわち、認識カテゴリ9は Q = m、jn s (A、、Bn)       
   山’mただしAけ入力パタン、Bnはnカテゴリ
の標準パタンで求められる。
#詔入力部6は第3図に承すようにG’ate回路より
構成され、利用者が確認判定した時(cf=1)は認識
結果会をFIFOメモリ部7への制御信号mへ出力する
。すなわち 1fcf=0(不確*’i!、 ) tban m、−
= Oif cf = 1 (M詔)  thqn m
:=Q   、、、(2)となる。
制御信号mがゼロでない時(m=会である時)は、FI
FOメモリ部7け入力パタンメモリ部2よジ入カパタン
を読み込みFIFOメモリへ記憶する。
さらにFIFOメそりに記憶されているパタンの個数が
N個を越えた時1otaも古いパタンを捨て、常にN値
以下のパタンを記憶しておく。
標準パタン作成部8はよく知られなマイクルプロセッサ
により構成することができ、jI41Nのように構成さ
れ、第5図に示すフローチャートに従って動作する。す
なわち、FIFOメモリ部7よりカテゴリごとに学習サ
ンプルを読み出し、その平均パタンを求める。各カテゴ
リごとに求められた平均パタンは標準パタンメモリ3へ
送られ標準パタンか更新される。
〈実施例2〉 次に本発明の第2の実施例を図面を用いて説明する。第
2の実施例は第2図に示すように構成され、第1の実施
例における確認入力部6のみが学習指定部9へ置き換え
られたものであり、その他の動作は第1の実施例と同じ
である。
学習指定部9は第6図のように構成され、認識判定部5
よシの類似度Sと閾値Sゎhと比較し、類似度Sが大き
い場合#′i認識結果会をFIFOメモリ部7への制御
信号mへ出力する。すなわち、if  S≦8th  
then  m = Aif  S < 5ththe
n  m= O−=(3)となる。これによって類似度
が十分大きい時は認識の確度が高いと判断しその時入力
されたパタンを学習サンプルとしてFIFOメモリ部7
へ記憶スる。
以上、本発明を実施例にもとづいて説明したが、これら
の記載は本発明の権利範囲を限定するものではない。特
に本実施例では類似度の計算にDPマツチング法を使用
したが、特徴抽出部において時間軸の正規化を行ってパ
タンことの時間方向の長さを一定にする方法を用いるこ
とができる。この場合類似度計算部は単純な固定長ベク
トル間の距離を求めるだけでよ〈回路が簡単となる。こ
こで時間方向の長さを一定にする方法としては、線形に
伸縮させる方法、特徴ベクトルの変化が均一になる方法
、音声のパワーの変化か均一になる方法などがある。
また、本発明第2の実施例の学習指定部として認識結果
の類似度がある閾値(絶対閾値)より大きい場合学習サ
ンプルとして採用するとしたが、この閾値はカテゴリご
とに異なる値でもよい。また、類似度の最大値と第2位
との差、すなわち認識結果の第1位の類似度と第2位の
類似度の差がある閾値(相対閾値)より大きい場合学習
サンプルとして採用するとしてもよい。さらに、絶対閾
値と相対閾値を組合せて使用するとしてもよい。
さらに、第1の実施例の標準パタン作成部7では平均パ
タンを求めているが、中心パタンを求める方法、クラス
タリングにより複数のサブカテゴリを求め各サブカテゴ
リごとに平均パタンあるいは中心パタンを求める方法を
用いてもよい。これら自明な倹更は本発明の権利範囲に
属するものである。
〈発明の効果〉 以上説明したように本発明のパタン認識装置では利用者
に確認された正しいパタンを学習サンプルとして記憶し
、N個の学習サンプルより更新用の標準パタンを作成す
る。これにより発声ごとのバラツキを考慮した標準パタ
ンが得られ、高い認識率ボ得られ−る。さらに学習サン
プルIfi最新のパタンにより逐次更新されているため
、この学習サンプルより求められる標準パタンは経時変
化に追従したものとなっている。これにより本装置は利
用者のパタンの経時変化にも対応でき、常に高い認識率
を保つことができる。
一方、本発明の第2の実施例に示したパタン認識装置で
は、認識したパタンの類似度より認識の確らしさを求め
、十分確度か高い場合学習サンプルとして記憶させてい
る。これにより発明第1項と同じ特徴である発声ごとの
バラツキと経時変化を考慮した標準パタンの更′frが
行われ、常に高い認識率を保つことができることはもち
ろん利用者による確認判定は行なわないため利用者の負
担がなくなる。
【図面の簡単な説明】
第1図は本発明の第1の実施例を示すプロ、り図、第2
図は本発明の第2の実施例を示すプロ、7り図、第3図
、第4図は第1図に示した実施例の一部詳細構成を示す
ブロック図、第5図は標準パタン作成部の動作を示すフ
ローチャート、第6図は第2図に示した実施例の一部詳
細構成を示すブロック図である。 図において、1は特徴抽出部、2は入力パタンメモリ部
、3は徐準パタンメモリ部、4は類似度計算部、5は認
識判定部、6は確認入力部、7FiFIFOメモリ部、
8は標準パタン作成部、9は学習指定部である 第3図 L−−−−++++−+++−++1 第5図

Claims (2)

    【特許請求の範囲】
  1. (1)認識する対象の特徴パタンを得る特徴抽出部と、
    前記特徴抽出部より得られた入力パタンを一時記憶する
    入力パタンメモリ部と、認識する対象の標準となる特徴
    パタンを記憶する標準パタンメモリ部と、入力パタンと
    標準パタンの類似度を求める類似度計算部と、前記類似
    度計算部の出力より認識結果を決定し出力する認識判定
    部と、利用者による前記認識結果の確認判定を入力する
    確認入力部と、前記確認入力部に従い入力パタンメモリ
    部に記憶されていた入力パタンを読込み最も古いパタン
    を捨てるFIFOメモリ部と、前記FIFOメモリ部に
    記憶されている学習パタンより標準パタンを作成し、標
    準パタンメモリ部へ記憶させる標準パタン作成部を持つ
    ことを特徴とするパタン認識装置。
  2. (2)認識する対象の特徴パタンを得る特徴抽出部と、
    前記特徴抽出部より得られた入力パタンを一時記憶する
    入力パタンメモリ部と、認識する対象の標準となる特徴
    パタンを記憶する標準パタンメモリ部と、入力パタンと
    標準パタンの類似度を求める類似度計算部と、前記類似
    度計算部の出力より認識結果を決定し出力する認識判定
    部と、前記認識結果の類似度に基づき認識の確らしさを
    求め確度の高い場合入力パタンを学習サンプルと指定す
    る学習指定部と、前記学習指定部に従い入力パタンメモ
    リ部に記憶されていた入力パタンを読込み最も古いパタ
    ンを捨てるFIFOメモリ部と、前記FIFOメモリ部
    に記憶されている学習パタンより標準パタンを作成し標
    準パタンメモリ部へ記憶させる標準パタン作成部を持つ
    ことを特徴とするパタン認識装置。
JP59222423A 1984-10-23 1984-10-23 パタン認識装置 Expired - Lifetime JPH0634180B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59222423A JPH0634180B2 (ja) 1984-10-23 1984-10-23 パタン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59222423A JPH0634180B2 (ja) 1984-10-23 1984-10-23 パタン認識装置

Publications (2)

Publication Number Publication Date
JPS61100883A true JPS61100883A (ja) 1986-05-19
JPH0634180B2 JPH0634180B2 (ja) 1994-05-02

Family

ID=16782157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59222423A Expired - Lifetime JPH0634180B2 (ja) 1984-10-23 1984-10-23 パタン認識装置

Country Status (1)

Country Link
JP (1) JPH0634180B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0495607A2 (en) * 1991-01-14 1992-07-22 NCR International, Inc. A method and apparatus for representing an unrecognised character in optical character recognition means for subsequent recognition

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862739A (ja) * 1981-10-12 1983-04-14 Nec Corp 単音節音声認識装置における標準パタ−ン更新方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5862739A (ja) * 1981-10-12 1983-04-14 Nec Corp 単音節音声認識装置における標準パタ−ン更新方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0495607A2 (en) * 1991-01-14 1992-07-22 NCR International, Inc. A method and apparatus for representing an unrecognised character in optical character recognition means for subsequent recognition

Also Published As

Publication number Publication date
JPH0634180B2 (ja) 1994-05-02

Similar Documents

Publication Publication Date Title
US5684924A (en) User adaptable speech recognition system
JPH09127972A (ja) 連結数字の認識のための発声識別立証
US5864807A (en) Method and apparatus for training a speaker recognition system
JPS61100883A (ja) パタン認識装置
JP2852298B2 (ja) 標準パターン適応化方式
JPH11149296A (ja) 単語認識装置
JPH09198086A (ja) 話者認識用しきい値設定方法及びこの方法を用いた話者認識装置
JP2892397B2 (ja) 認識結果判定装置
WO2021238324A1 (zh) 流量识别方法、装置、电子设备及存储介质
JP2606211B2 (ja) 音源正規化方法
JP3107905B2 (ja) 音声認識装置
JPH11249688A (ja) 音声認識装置およびその方法
JPH02293798A (ja) 音声認識装置の辞書更新方式
JP2602271B2 (ja) 連続音声中の子音識別方式
JPH0443600B2 (ja)
JP2744622B2 (ja) 破裂子音識別方式
JPH0895595A (ja) 隠れマルコフモデルの学習方法
JPS62147496A (ja) 連続音声認識装置
JPH10214096A (ja) 話者認識装置
JP3056745B2 (ja) 音声認識辞書管理装置
JPS59162600A (ja) 音声認識装置
JP3011984B2 (ja) パターン照合方法
JPS5977500A (ja) 単語音声認識方式
JPH02198499A (ja) 音声認識装置の辞書の自動更新システム
JPH0114600B2 (ja)