JPS63254497A - パタ−ン認識装置 - Google Patents

パタ−ン認識装置

Info

Publication number
JPS63254497A
JPS63254497A JP62090260A JP9026087A JPS63254497A JP S63254497 A JPS63254497 A JP S63254497A JP 62090260 A JP62090260 A JP 62090260A JP 9026087 A JP9026087 A JP 9026087A JP S63254497 A JPS63254497 A JP S63254497A
Authority
JP
Japan
Prior art keywords
pattern
recognition
input
recognition result
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62090260A
Other languages
English (en)
Inventor
紀代 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP62090260A priority Critical patent/JPS63254497A/ja
Publication of JPS63254497A publication Critical patent/JPS63254497A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は複数種類の標準パターンあるいは識別関数を用
いて、入力パターンの認識を行なうパターン認識装置に
関し、特に標準パターンを学習させるために、誤認識し
た際の入力パターンを誤認識パターンとして記憶してお
く手段を有したパターン認識装置に関する。
従来の技術 パターン認識技術は音声認識や文字認識によく利用され
る有効な手法であり、特に音声認識においては広く応用
されている。
音声認識装置には、入力音声を認識する単位として単音
節(ay、c:子音、■=母音を表す)を用いるもの、
CvおよびvCvを用いるもの、音素(CおよびV)を
用いるもの等が考えられる。
また、使用者があらかじめ基準となる音声を発声、登録
してから認識処理をはじめる登録型と、たくさんの発声
データをもとに統計処理を行い、普遍的な標準パターン
を準備しておき、使用者の登録を必要としない不特定型
とがある。また、特徴抽出の方法としては線形予測分析
やフィルタバンクを用いたものが主流となっている。こ
こでは、説明を簡単にするために、従来例、実施例とも
に母音定常点における母音認識のみを行なう線形予測分
析を用いた不特定型音声認識装置について説明するが、
これらに限定されるものではない。以下図面を用いて従
来の音声認識装置の一例を説明する。
第4図は不特定型音声認識装置の一実施例の構成を示す
ブロック図である。図において、実線は処理の流れ、点
線はデータの参照あるいは更新を示す。音声入力端1か
ら入力された音声は線形予測分析部2において窓長20
1m!1150 、フレームシフト51!1860、次
数15次の自己相関法を用いて分析され、16個のケプ
ストラム係数および残差パワー(0次のケプストラム係
数)の計16個(CO〜C16)のパラメータの列とし
て出力される(線形予測分析については、マーケル、グ
レイ著鈴木久喜訳:音声の線形予測1980年 コロナ
社)。3は音声区間検出部で残差パワーを用いて語頭、
語尾、および語中の無音部の検出を行う。
定常点検出部4においては各フレーム間の変化量を用い
て、安定な部分を母音定常点として検出する。母音認識
部5では、あらかじめ沢山の発声データを処理して得ら
れた母音識別関数(安田三部著:社会統計学、2章7w
J 1969年丸善)の係数を格納した識別関数記憶部
6より係数を読みみ込み、定常点検出部4で得られた母
音定常点について母音認識を行なう。7は認識結果確定
部で認識結果出力端8を通じて認識結果を音声入力者に
知らせ、結果確認入力端9を通じて認識結果の正否を得
る。認識結果が正しい場合、次の入力処理に移り、誤っ
ている場合はその時の入力パターンを誤認識パターン記
憶部11に格納して、誤認識パターン数をインクリメン
トする。例えば認識結果がa、正しい内容がOの場合、
この入力パターンは0の誤認識パターンとして格納され
る。12は、識別関数更新部で、誤認識パターンの数が
ある決められた閾値に達したとき、識別関数の更新を行
なう。
第5図は、誤認識パターン記憶部11のメモリ配置を示
した図であり、16進数でバイトアドレスを付記しであ
る。この従来例では誤認識パターンの記憶数は各母音6
4個で、誤認識パターン数が64個に達した地点で識別
関数の更新が行なわれる。
発明が解決しようとする問題点 この様な従来の音声認識装置における誤認識パターンの
記憶法では、入力パターンをそのままの形で誤認識パタ
ーンとして記憶するため、必要記憶容量が大きく、アド
レス管理が複雑化し、システムの柔軟性に欠ける等の問
題点があった。
本発明はかかる点に鑑みてなされたもので、入力パター
ンそのままを誤認識パターンとして格納するのではなく
、加工して記憶することにより上記の問題点を解決する
ことを目的としている。
問題点を解決するための手段 本発明は、パターン入力手段と、あらかじめ準備された
幾つかの標準となるパターンあるいは識別関数の係数を
格納しておく標準パターン格納手段と、前記パターン入
力手段から入力さ扛た入力パターンと前記標準パターン
格納手段から読みだされた標準パターンあるいは識別関
数の係数を用いて最も入力パターンに近い標準パターン
に付与された記号を入力パターンの認識結果として与え
るパターン認識手段と、前記認識結果が正しいかどうか
を判定する認識結果判定手段と、前記認識結果が誤認識
の場合入力パターンを誤認識パターンとして記憶してお
く誤認識パターン記憶手段を有し、誤認識パターン記憶
の際に、誤認識された入力パターンを加工して記憶する
パターン認識装置である。
作用 パターン入力手段により入力されたパターンに対し、あ
らかじめ準備づれた幾つかの標準となるパターンあるい
は識別関数を用いて、前記入力パターンに最も近い標準
パターンに付与された記号を入力パターンの認識結果と
して与えるパターン認識手段によりパターン認識を行な
い、認識結果判定手段により認識結果が正しいかどうか
を判定し、認識結果が誤認識の場合入力・ぐターンを誤
認識パターンとして誤認識パターン記憶手段により記憶
しておく際、誤認識された入カッ(ターンをそのままで
はなく加工して記憶することにより、記憶容量の削減、
アドレス管理の簡単化、システムの柔軟性の拡張を図る
実施例 第1図は不特定型音声認識装置の一実施例の構成を示す
ブロック図である。図において実線は処理の流れ、点線
はデータの参照、あるいは更新を示す。音声入力端1か
ら入力された音声は線形予測分析部2において窓長20
 m580.フレームシフト5 m560、次数15次
の自己相関法を用いて分析され、15個のケプストラム
係数および残差パワー(0次のケプストラム係数)の計
16個(C。
〜C15)のパラメータの列として出力される。
3は音声区間検出部で残差パワーを用いて語頭、語尾、
および語中の無音部の検出を行う。定常点検出部4にお
いては各フレーム間の変化量を用いて、安定な部分を母
音定常点として検出する。母音認識部6では、あらかじ
め沢山の発声データを処理して得られた母音識別関数の
係数を格納した識別関数記憶部6より係数を読み込み、
定常点検出部4で得られた母音定常点について母音認識
を行なう。7は認識結果確定部で認識結果出力端8を通
じて認識結果を音声入力者に知らせ、結果確認入力端9
を通じて認識結果の正否を得る。認識結果が正しい場合
、次の入力処理に移り、誤っている場合はその時の入力
パターンを誤認識パターンとして記憶する。10は誤認
識パターン加工部で、既に登録された誤認識パターンを
誤認識パターン記憶部11から読みだし、入力パターン
の和を求めて新しい誤認識パターンとして誤認識パター
ン記憶部11に格納して、誤認識パターン数をインクリ
メントする。12は、識別関数更新部で、誤認識パター
ンの数がある決められた閾値に達したとき、識別関数の
更新を行なう。
第2図は、誤認識パターン記憶部1oのメモリ配置を示
した図であり、16進数でアドレスを付記しである。誤
認識パターン記憶領域は誤認識パターン数のカウンタを
入れて各母音16ワードである。
次に母音認識の方法について詳細に説明する。
本実施例では簡易型マハラノビス距離を用いて母音認識
を行なっており、母音はa+  1+  u、  el
lo、Hの6種類である。入力パターンをX、各母音の
平均パターンを鶴!、全母音共通の共通敢行列をWとし
た時、Xと母音にとの簡易型マノ・ラノピス距離8(x
、k)は(1)式で表わされる。
S (El  k ) =a zX + Ox    
 ・・・”’(1)但し遣工=−2m工W  + C”
!I!l KWll K 1(1)式で得られた距離の
最小値を与えるki入力パターンXの認識結果とする。
識別関数記憶部6には、識別関数の係数dz、c(、共
分散行列W、及び平均パターン1mlが格納されている
第3図は認識結果確定後から識別関数更新までの処理の
流れを示した図である。認識結果100が正しいか誤っ
ているかの判定101を使用者から得て、正しい場合は
そのまま次の入力処理に移る。誤っている場合、誤認識
パターンの登録処理102を行なう。入力パターンを)
C(X、・ x2゜・・・x15)、認識結果がa、正
しい内容がo、oの誤認識パターンを・(0+、021
 ・・・0,5)、0の誤認識パターン数をcoとした
とき、O工=Oi+ X i +  1 ” 1.15
     (2)co=co+1.         
   (3)を求め、0を新しい誤認識パターンとして
登録する。次に誤認識パターン数と識別関数更新の閾値
を比較103し、閾値以下の場合法の入力処理106に
移る。閾値に達した時は次の方法で識別関数の更新10
4を行なう。0の平均パターンをmoとすると 11oi=(moi+oi/64)/2+i、=1.1
5 1゜=−2mQW Oo二m 。!  !+00 + 次からの処理ではこうして更新された識別関数を用いて
入力処理105を行なう。
以上のように、本発明によれば誤認識パターン記憶部の
記憶容量を大幅に削減でき、またアドレス管理を単純化
し、システム変更(例えば識別関数更新の閾値の変更)
を容易に行なうことができる。
また、本実施例に於いては平均値学習を行なったため、
誤認識パターンを和の形で記憶したがこれに限られるも
のではない。
発明の詳細 な説明したように、本発明によれば、誤認識パターンの
格納に用いる記憶容量が大幅に削減出来、それに伴って
アドレス管理が単純化し、格納出来るパターン数も記憶
容量の制限を受けずに決定することが可能となり、その
実用的価値には犬なるものがある。
【図面の簡単な説明】
第1図は本発明における一実施例の音声認識装置のブロ
ック図、第2図は同実施例における誤認識パターン記憶
領域のレイアウト図、第3図は同実施例における誤認識
パターン登録処理の流れ図、第4図は従来例の音声認識
装置のブロック図、第6図は同音声認識装置における誤
認識パターン記憶領域のレイアウト図である。 2・・・・・・特徴抽出部、3・・・・・・音声区間検
出部、4・・・・・・定常点検出部、5・・・・・・母
音認識部、6・・・・・・識別関数記憶部、T・・・・
・・認識結果確定部、8・・・・・・認識結果出力端、
9・・・・・・結果確認入力端、1o・・・・・・誤認
識パターン加工部、11・・・・・・誤認識パターン記
憶部、12・・・・・・識別関数更新部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第2
図 第4図 y1妬玉出1

Claims (1)

    【特許請求の範囲】
  1. パターン入力手段と、あらかじめ準備された幾つかの標
    準となるパターンあるいは識別関数の係数を格納してお
    く標準パターン格納手段と、前記パターン入力手段から
    入力された入力パターンと前記標準パターン格納手段か
    ら読みだされた標準パターンあるいは識別関数の係数を
    用いて最も入力パターンに近い標準パターンに付与され
    た記号を入力パターンの認識結果として与えるパターン
    認識手段と、前記認識結果が正しいかどうかを判定する
    認識結果判定手段と、前記認識結果が誤認識の場合入力
    パターンを誤認識パターンとして記憶しておく誤認識パ
    ターン記憶手段を有し、誤認識パターン記憶の際に、誤
    認識された入力パターンを加工して記憶することを特徴
    とするパターン認識装置。
JP62090260A 1987-04-13 1987-04-13 パタ−ン認識装置 Pending JPS63254497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62090260A JPS63254497A (ja) 1987-04-13 1987-04-13 パタ−ン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62090260A JPS63254497A (ja) 1987-04-13 1987-04-13 パタ−ン認識装置

Publications (1)

Publication Number Publication Date
JPS63254497A true JPS63254497A (ja) 1988-10-21

Family

ID=13993529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62090260A Pending JPS63254497A (ja) 1987-04-13 1987-04-13 パタ−ン認識装置

Country Status (1)

Country Link
JP (1) JPS63254497A (ja)

Similar Documents

Publication Publication Date Title
JPH02195400A (ja) 音声認識装置
JPS62235998A (ja) 音節識別方式
JPS63254497A (ja) パタ−ン認識装置
JP2002215184A (ja) 音声認識装置、及びプログラム
Seman et al. Hybrid methods of Brandt’s generalised likelihood ratio and short-term energy for Malay word speech segmentation
JPS645320B2 (ja)
JPS60164800A (ja) 音声認識装置
JPS63161499A (ja) 音声認識装置
JPS63161500A (ja) 音声認識装置
JPS6147999A (ja) 音声認識装置
JPS6225796A (ja) 音声認識装置
JPS6225797A (ja) 音声認識装置
JP2000242292A (ja) 音声認識方法、この方法を実施する装置およびこの方法を実行するプログラムを記憶した記憶媒体
JPS62218997A (ja) 単語音声認識装置
JPH0415960B2 (ja)
JPS60147797A (ja) 音声認識装置
JPS615300A (ja) 学習機能付音声入力装置
JPS60159798A (ja) 音声認識装置
JPS61180300A (ja) 音声認識装置
JPS6069695A (ja) 語頭子音のセグメンテ−ション法
JPS63161497A (ja) 音声認識装置
JPS6355599A (ja) 音声認識装置
JPS58176699A (ja) 音声標準パタ−ン登録方式
JPH08305389A (ja) 音声認識装置
JPS62113196A (ja) 音声認識学習方式