JPS61114386A - パタン認識装置 - Google Patents

パタン認識装置

Info

Publication number
JPS61114386A
JPS61114386A JP59235410A JP23541084A JPS61114386A JP S61114386 A JPS61114386 A JP S61114386A JP 59235410 A JP59235410 A JP 59235410A JP 23541084 A JP23541084 A JP 23541084A JP S61114386 A JPS61114386 A JP S61114386A
Authority
JP
Japan
Prior art keywords
termination
pattern
detection
distance
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59235410A
Other languages
English (en)
Inventor
Hiromi Fujii
藤井 浩美
Masao Watari
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59235410A priority Critical patent/JPS61114386A/ja
Publication of JPS61114386A publication Critical patent/JPS61114386A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声や文字などのパタン全自動的に認識するパ
タン認識装置の改良に関する。
(従来技術とその問題点) 従来より、音声や文字などを認識する装置として、パタ
ンの始端、終端を検出する検出部と、認識処理を行う認
識処理部をもつものが知られている。
第5図罠従来装置のブロック図を示す。入力されるデー
タはスペクトル、パワー、ペンのup/downの状態
などの特徴量である。音声や文字の時間軸をもつパタン
は一般に、これらの特徴量の時系列で表現される。
検出部1では入力された時系列の特徴量からパタンの始
端と終端を検出する。検出九用いられる特徴量は種々の
ものがあり、認識対象によっても特徴量は異彦る。ここ
ではパワーを用いた音声検出とペンのup/down情
報を用いた文字/くタン検出についてその原理を説明す
る。
第6図(alは音声検出の様子を示した図で、発声され
た音声のパワーの変化を横軸に時間t1縦軸圧パワーを
とり示したものである。この時、始端は、パワーがあら
かじめ定められた閾値THIを超え、かつ、その状態が
以後、定められた始端検出時間長L1より長く続いた場
合に、はじめKTHlf:超え友時点Sとして検出され
る。同様に1終端Bもあらかじめ定められたTH2を下
まわり、その状態がL2時間以上続い几場合、はじめK
TH21下まわった時点とする。ここで用いる閾値TH
I、TH2,Ll、L2けすべて前もって定めておくパ
ラメータである。
認識対象が文字の場合Fi第6図(b)K示すようにペ
ンのup/down情報から始端、終端を検出すること
ができる。す々わち、ペンがdownされた状態がL1
時間以上続い友場合、はじめKdownされた時点を始
端Sとし、ペンがupされ良状態がL2時間以以上−た
場合、はじめにupさn比時点を終端Eとすることによ
って8.Eが決定される。
以上説明した原理でパタンの始端S1終端Bが検出され
ると、入力データのうちSからgtでの特徴景の時系列
が入力パタンとして入力パタンバッファメモリ4へ格納
される。
認識処理としては種々の方法が試みられているが、その
うち比較的簡単で効果的な方法としてパタンマツチング
法がある。パタンマツチング法トは認識対象を標準パタ
ンとして記憶しておき、認識しようとする入力パタンと
比較し、類似性の高い、すなわち、パタン間の距離の小
さい標準パタン金兄つけ、その標準パタンの属するカテ
ゴIJ i認識結果とする方法である。第5図のブロッ
ク図において、認識処理部は距離計算部5と結果判定部
6とからなシ、距離計算部5では標準パタンバッファ3
と入力パタンバッファ4とからそれぞれパタンを読みこ
み動的計画法を用いて距離を計算する。距離はすべての
標準パタンに対して求められ、結果判定部6ではそれら
の距離の最小値が得られた標準パタンの属するカテゴリ
を認識結果として出力する。
以上、従来方法の原理を簡単に説明しtが、従来方法に
おけるパタンの終端検出には、固定された終端検出パラ
メータが用いられている。これらのパラメータのみでは
、入力データにボーズが現われた時、それが終端である
か、またはパタンの途中であるかの区別をすることは困
難である。すなわち、単語の発声途中で言いよどんだり
、文字を書いている途中にペンの停滞があった場合、従
来方式では終端検出のルールにあてViまってしまう之
めパタンの途中でも終端とみ彦される場合があった。
従って誤った入力パタンとのマツチングが行われ、誤認
識になるという欠点があっ次。
また、従来方法では、言いよどみ、ペンの停滞による検
出誤りを減らすためには終端検出長L2を長く設定して
訃く以外に方法がなく、その結果、入力の間隔を長くと
らなければならず、処理速度を大きくできがいという欠
点があった。
(発明の目的) 本発明の目的は、単語発声中の言いよどみやペンの停滞
があっても、確実忙認識することができ、かつ、入力の
間隔を長くとる必要のないパタン認識装置を提供するこ
とにある。
(発明の構成) 本発明によるパタン認識装置は、入力された音声や文字
パタンの始端終端を検出する検出部と、前記検出部にて
得られた始端終端の情報に従って前記入力された音声、
文字パタンを格納する入力パタンバッファと、あらかじ
め設定された標準パタンを格納する標準パタンバッファ
と、前記入力パタンバッファの入力パタント標準パタン
バッファの標準パタンとを読みこみ、入力パタンの入力
時刻ごとに遂次パタン間の距離を計算する距離計算部と
、前記距離計算部で得られたパタン間の距離より、認識
結果を求める結果判定部と、終端候補が得られた時刻に
おいて前記距離計算部より得られたパタン間距離の値エ
リ、検出部の終端検出パラメータを再設定する終端検出
制御部とを含んで構成される。
(本発明の原理) 従来方法では、終端検出時間長L2が固定されており、
はじめにパワーが閾値TH2を下まわった時刻、または
ペンがupされた時刻(以下終端候補という)が終端で
あるか、言いよどみ等によるポーズであるか罠かかわら
ず、前記の終端検出アルゴリズムを満足すれば終端とし
て検出されてしまう。しかし、何らかの方法で終端候補
が終端であるか、また言いよどみ等によるポーズである
かの情報を知ることができれば、その情報に最適々終端
検出パラメータを設定することができる。すなわち終端
候補が終端である可能性が高い場合はL2を短くして、
終端検出が行われやすいようにし、逆圧終端候補が言い
よどみ等によるポーズの始まりである可能性が高い場合
はL2’li−長くして終端検出が行われにくいよう圧
する。このようKして検出誤りを減らすことができる。
終端候補が終端である度合は標準パタンと入力パタンの
始端から終端検出までの距離計算の結果から求めること
ができる。第3図(a) 、 (b)に示した音声のパ
ワーによる例を用いてその原理を説明する。第3図(a
tのように1発声の途中のポーズの之めに終端候補E′
が実際の終端とならない場合は、始端SからE’tでの
入力パタンと標準パタンとの距離は大きく彦る。第3図
(b)のよう[’が実際の終端と一致する場合は両パタ
ンは類似しているため距離は小さく々る。す々わら、逆
にいうと入力パタンSからE′と標準パタン複数偽に対
するそれぞれの距離のうちある閾値より小さいものが存
在するときは、E′が終端である可能性が高く存在し々
いときはE′が終端である可能性が低いということがい
える。
本発明によるパタン認識装置では、終端検出制御部を備
えることで、以上述べた原理に基づい次処理が可能であ
る。すなわち終端検出制御部では距離計算部で得られた
値から終端候補E′が終端である可能性を調べ、その可
能性に基づいて終端検出パラメータを変化させることが
できる。その几め従来では誤検出になっていた言いよど
みやペンの停滞があるパタンも確実に検出することがで
き、認識率が向上する。
(実施例) 以下に本発明の実施例について図面音用いて詳細に説明
する。第1図は本発明の一実施例を示すプロ、ツク図で
ある。検出部1では入力された特徴量の時系列ベクトル
から始端S1終端Bf検出する。検出のアルゴリズムは
従来方法と同じものを用いることができる。検出部1に
おいて始端が検出されると、始端検出信号C1が入力パ
タンバッファへ送られ、その時点Sから時系列データが
入力パタンとして入力パタンパクファ4に順次送られ保
存される。終端候補E′が検出部れると、終端候補検出
信号C2が終端検出制御部2へ送られる。
終端検出制御部2から、新しい終端検出時間長L2を受
けとると、そのパラメータL2で引き続き検出アルゴリ
ズムを実行する。入力パタンは検出部1で終端Bが検出
される時点まで送られ保存される。以上述べた検出部1
にVi特公昭56−28279号公報(以下文献1とす
る)に述べられている構成のものを使用することができ
る。
標準パタンバッファ31CH認識の対象となる複数個の
標準パタンか特徴ベクトルの時系列としてあらかじめ格
納されている。距離計算部5では入力パタンと標準パタ
ンとを読みこみ、動的計画法を利用して両パタンの距離
を計算する。距離計算の方法、およびそのハードウェア
は特開昭58−98796号公報(以下文献2とする)
K詳しく述べられており、それを用いることができる。
文献2の方法では、入力パタンが入力パタンバッファに
送られる時点ごとに始端からその時点までの距離が標準
パタンすべてに対して求められる。したがって、引例の
方法を用いると入力パタンの入力と同期して距離計算を
進めることができ、本発明の特徴である検出パラメータ
を距離計算の値より逐次最適化するという点?実現でき
る。
終端検出制御部2は、第2図に示すように最小値回路2
1、比較回路22、終端検出パラメータ記憶部23とで
構成される。終端検出パラメータ記憶部23にはあらか
じめ終端検出用時間長が複数個記憶されている。ここで
は2つのパラメータL2a 、 L2b (L2a>L
2b )が記憶されているとする。検出部lから終端候
補検出信号C2f:受けると最小値回路21ではその時
点B’lでの入力パタンとすべての標準パタンとの距離
を距離計算部5から読みこみ、距離の最小値を求める。
次に比較回路22では、最小回路21で得られた最小値
とあらかじめ定6られた閾値TH3とを比較する。
距離の最小値が閾値TH3より大きければ終端候補が終
端である可能性が低いとして終端検出パラメータ記憶部
23のL2aが検出部2へ送られる。
検出部1ではL2a’i終端検出時間長として用い終端
の検出を行う。反対に距離の最小値が閾値TH3より小
さければ終端候補が終端である可能性が高いとしてL2
bが検出部1へ送られ、同様にして終端の検出が行われ
る。
以上の終端検出制御部2における処理を第4図のフロー
チャートで示す。記号の意味は以下の通りである。
A:入力パタン B、:標準パタン i−1,2・・・2口n:標準パタ
ンの数 D”(A I B;) :始端からE′までの入カパタ
ン人と標準パタンB、との距離 検出部1において終端Eが検出されると、終端検出信号
C3が結果判定部6に送られる。結果判定部6では、そ
の時点Eまでの入力パタンとすべての標準パタンとの距
離を距離計算部5から読みこみ、その距離の最小値を与
える標準パタンの属するカテゴリを認識結果として出力
する。
以上、本発明の一実施例を説明し念が、これらの記載は
本発明の範囲を限るものではない。たとえば、終端検出
時間長L2を選択するための閾値TH3は1個である必
要はなく必要に応じて増すことができる。ま之、選択す
る終端検出時間長の種類も閾値に対して増すことが可能
である。また、閾値と比較する距離は最小値の他に、距
離の小さいものからN個の平均をとることもできる。ま
た終端検出時間長L21jr:選択する際に距離のうち
のN個以上が閾値を下まわるかどうかをルールとして用
いることもできる。
さら忙、終端検出制御部7における処理は、実施例で説
明したような、L2を選択する方法の他に定められた固
定長L2に対する可変弁Δ1,2t−計算する方法も考
えられる。
(発明の効果) 以上述べ友ようなパタン認識装置では入力データ中に存
在するポーズが終端であるか、または言いよどみ等のポ
ーズであるかの度合を距離計算部から得て、その情報に
基づいて終端検出を行うことができる。
す々わちそれ罠よって従来言いよどみ等のために起こっ
てい几誤検出が減り認識率が向上するという効果が生じ
る。
さらに終端候補が終端である可能性が高い場合は、終端
検出時間長L2を短くとる念め、次のパタンの入力まで
の時間は短かくできる。す々わち、パタン認識装置の処
理速度を上げることができるという効果が生じる。
【図面の簡単な説明】
第1図、第2図は本発明の一実施例を示すブロック図、
第3図(at 、 (blは終端候補が終端である傾向
を調べる処理を説明するための図、第4図は終端検出制
御部2における処理を示す70−チャート、第5図は従
来方法を示すブロック図、第6図は従来方法における検
出の例を示した図である。 1・・・検出部、2・・・終端検出制御部、3・・・標
準パタンバッファメモリ、4・・・入力パタンバッファ
メモリ、5・・・距離計算部、6・・・結果判定部、2
1・・・最小値回路、22・・・比較回路、23・・・
終端検出パラメータ記憶部。 ゛ζ3.−′ 第3図<(1) S                F  時間第3図
(b) 5             E 時間オ6図(a)

Claims (1)

    【特許請求の範囲】
  1. 入力された音声や文字パタンの始端終端を検出する検出
    部と、前記検出部にて得られた始端終端の情報に従って
    前記入力された音声や文字パタンを格納する入力パタン
    バッファとあらかじめ設定された標準パタンを格納する
    標準パタンバッファと、前記入力パタンバッファの入力
    パタンと標準パタンバッファの標準パタンとを読みこみ
    入力パタンの入力時刻ごとに遂次パタン間の距離を計算
    する距離計算部と、前記距離計算部で得られたパタン間
    の距離より認識結果を求める結果判定部と、終端候補が
    得られた時刻において前記距離計算部より得られたパタ
    ン間距離の値より検出部の終端検出パラメータを再設定
    する終端検出制御部とを有することを特徴とするパタン
    認識装置。
JP59235410A 1984-11-08 1984-11-08 パタン認識装置 Pending JPS61114386A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59235410A JPS61114386A (ja) 1984-11-08 1984-11-08 パタン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59235410A JPS61114386A (ja) 1984-11-08 1984-11-08 パタン認識装置

Publications (1)

Publication Number Publication Date
JPS61114386A true JPS61114386A (ja) 1986-06-02

Family

ID=16985680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59235410A Pending JPS61114386A (ja) 1984-11-08 1984-11-08 パタン認識装置

Country Status (1)

Country Link
JP (1) JPS61114386A (ja)

Similar Documents

Publication Publication Date Title
US7447634B2 (en) Speech recognizing apparatus having optimal phoneme series comparing unit and speech recognizing method
US4905295A (en) Code sequence matching method and apparatus
CN108847218B (zh) 一种自适应门限整定语音端点检测方法,设备及可读存储介质
JP4393648B2 (ja) 音声認識装置
KR102011489B1 (ko) 심층 신경망을 이용한 발화 검증 방법
US5974381A (en) Method and system for efficiently avoiding partial matching in voice recognition
JPS61114386A (ja) パタン認識装置
JP2006313261A (ja) 音声認識装置並びに音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JPS62141595A (ja) 音声検出方式
KR20010091093A (ko) 음성 인식 및 끝점 검출방법
CN108962225B (zh) 一种多尺度自适应语音端点检测方法
JP3484559B2 (ja) 音声認識装置および音声認識方法
JPH0336436B2 (ja)
JPH0619491A (ja) 音声認識装置
JPS58159598A (ja) 単音節音声認識方式
JPH01185599A (ja) 音声認識装置
JPH0336438B2 (ja)
JPH0119597B2 (ja)
JPH0376471B2 (ja)
KR20000056527A (ko) 선 스펙트럼 쌍 거리를 이용한 음성 구간 검출 방법
JPS5870288A (ja) 音声認識装置
JP2712586B2 (ja) 単語音声認識装置用パターンマッチング方式
CN111079522A (zh) 一种人脸检测的方法
JP3439602B2 (ja) 音声認識装置
JPS63204491A (ja) パタ−ン認識システム