JPS635396A - 時系列パタ−ン認識装置 - Google Patents

時系列パタ−ン認識装置

Info

Publication number
JPS635396A
JPS635396A JP61150381A JP15038186A JPS635396A JP S635396 A JPS635396 A JP S635396A JP 61150381 A JP61150381 A JP 61150381A JP 15038186 A JP15038186 A JP 15038186A JP S635396 A JPS635396 A JP S635396A
Authority
JP
Japan
Prior art keywords
pattern
time
mapping
storage unit
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61150381A
Other languages
English (en)
Inventor
透 清水
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61150381A priority Critical patent/JPS635396A/ja
Publication of JPS635396A publication Critical patent/JPS635396A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声、文字等の時系列パターン認識装置に関
し、少ない次元数でカテゴリ間の分離を強調して精度良
く認識できる時系列パターン認識装置に関する。
〔従来の技術〕
従来、音声認識装置、オンライン文字認識装置等の時系
列パターン認識装置においては、認識すべきものの特徴
をベクトル時系列パターン(バンドパスフィルタの出力
、ケプヌトラム係数、メルケプストラム係数、LPC係
数、LPCメルヶプストラム係数、X−Y成分、方向角
等)の形で抽出する。そして、認識に先立ちパターンを
予め登録しておき(以下、この登録したパターンを標準
パターンと称す)、認識時に入力されたパターン(以下
、このパターンを入力パターンと称する)と比較処理を
行い、その差(以下、距離と称する)の最も小さい標準
パターンのカテゴリ名を認識結果とする方法が一般に採
用されている。
さらに、識別を容易にするため、特徴パターンを統計量
を用いてカテゴリ間の分離を強調した後、時間軸の正規
化を行った距離を求める方法〔マハラノビス距離を用い
てDI’マツチングを行う方法(電子通信学会論文誌V
o l 、J66−A P、 64〜70 ) 。
主成分分析をした後距離を求めDPマツチングを行う方
法(ICASSP86 P、 2699〜2702) 
) カ試みられている。
〔発明が解決しようとする問題点〕
しかしながら、上記従来の方法では、同一カテゴリ内だ
けの関係した考慮していないので、カテゴリ間の分離は
考慮されていないという欠点がある0 したがって本発明の目的は、上記欠点全解決し、よシ効
果的にカテゴリ間の分離を強調し、高い認識率の得られ
る時系列パターン認識装!全提供することにある。
〔問題点を解決するための手段〕
本発明の時系列パターン認識装置は、一つのカテゴリ名
に対して少なくとも一つ以上のクラスに分類された学習
パターンである複数の時系列パターンを基にクラス間分
散を大きくかつクラス内分散を小さくするように求めら
れた写像関数を記憶する写像関数記憶部と、前記写像関
数記憶部に記憶されている写像が行われたベクトルの時
系列の形で表される標準パターンを一つのカテゴリ名に
対し少なくとも一つ以上記憶する標準パターン記憶部と
、ベクトルの時系列の形で表される入力パターンを記憶
する入力パターン記憶部と、前記入力パターン記憶部の
時系列パターンに対し前記写像関数記憶部に記憶されて
いる写像を行り与体実行部と、前記写像実行部によシ写
像された空間上の入力パターンと前記標準パターン記憶
部に記憶されている標準パターンとの時間軸を正規化し
た距m’を求めるマツチング部と、前記距離が最小と〔
作用〕 本発明の詳細な説明する。多数の時系列パターンから、
カテゴリ間分散をできるだけ太きく、かつカテゴリ内分
散をできるだけ小さくするような写像関数を、たとえば
判別分析法によシ求めておく。そして、標準パターン、
入力パターンを共に、その写像関数によシ、新たな特徴
空間に写像し。
そこで1時間軸正規化した距離を計算し、距離が最小と
なった標準パターンのカテゴリ名を認識結果とする。な
お、一つのカテゴリ名に対して、複数のクラスを仮定す
る場合もあるので、以下、カテゴリ間分散をクラス間分
散、カテゴリ内分散をクラス内分散と称することとする
判別分析法によると、上記のような写像行列人は、次の
ようにして求めることができる。クラス内分散をΦ1、
クラス間分散をΦ1写像後のクラス内分散をσt、写像
後のクラス間分散をσ2゜とし、行列人の一つの成分ベ
クトルiaとすれば、分散比 J (al = ’* / ’w = a ’ΦHa/
a’Φw a   −(1)が太きくなるa?:求めれ
ば良いこととなる。これは、制約条件 62w= at@y a = 1          
 ”・(21のもとで、へヲ大きくするaf求めること
と同じである。したがって、λをIagrange乗数
として、次式の変分問題の停留層としてaf求めていけ
ば良いことになる。
J (aJ =σ2.−λσ〜=atψ、a−λatΦ
wa  ・・・(3)偏微分して aJ / Da = 2 (h a−2λΦ、a二o 
       −(4Jゆえに Φ富a=λΦwa             ・・・(
5)という固有値問題に帰着される。λは固有値に対応
し、(5)式ヲ(1)式に代入すると、J(alは、固
有値λに等しくなる。つまり、 J(a)が大きいとは
固有値λが大きいことで、aは、大きな固有値に対応し
た固有ベクトルということになる。
ゆえに、行列人は、上位数個の固有値に対応した固有ベ
クトルで構成できる。
〔実施例〕
以下、本発明による時系列パターン認識装置について図
面を参照しながら説明する。
第1図は、本発明の一実施例における音声認識装置のブ
ロック図である。同図においてマイクロホン1より入力
された音声信号は、音声分析部2において、たとえば特
願昭52−144205号明細書記載の如き周波数分析
器によって、音声分析がなされ、ベクトルの時系列の形
で写像実行部3に送られる。写像実行部3では写像記憶
部4に記憶されている写像関数により、入力パターンは
ある特徴空間上に写像される(以下、この写像された入
力パターンを、変換入力パターンと称する)。
そして、マツチング部6に送られる。なお、写像関数記
憶部4に記憶されている写像関数は、前もって、学習用
音声データから、クラス間分散を大きくかつクラス内分
散を小さくするように統計的に求められたものである。
変換入力パターンのマツチング部6への転送が終了する
と、標準パターン記憶部5から、順次標準パターンの時
系列パターンが、マツチング部6に転送される。マツチ
ング部6では、2つの時系列パターンを、特願昭49−
2418号記載の如く、動的計画法を利用して、2つの
パターンが最適に対応するような、パターン認識の分野
では周知のDPマツチングを用いて距離(これをDP短
距離称する)を計算し、そのDP短距離逐次判定部7に
送る。
判定部7では、各DP短距離最小値を求め、その最小と
なった標準パターンのカテゴリ名を認識結果として出力
する。
以上本発明の原理を実施例に基づいて説明したが、これ
らの記載は本発明を限定するものではない。特に、写像
関数記憶部4に記憶されている写像関数は、時系列パタ
ーンの時刻ごとに変化しても良い。即ち、この方法は、
訓練用の音声データの時系列パターンを時間軸の正規化
を行い時間軸の対応をとり、各時間ごとに独立に求めて
おき、写像実行部3においてパターンを写像すル際、各
時間に対応した写像関数を用いる。
また、マツチング部6で、2つの時系列パターンの距離
を求める際、DPマツチングを用いたが、特徴ベクトル
の変化量を線形正規化する方法、特徴抽出によシセグメ
ンテーションを行い時間軸正規化する方法等、その他の
時間軸正規化マツチングを用いてもよい。
さらに、本発明の原理は、音声以外のパターン。
つ″1シ文字、図形等の時系列パターンを扱うパターン
認識装置においても、有効に活用できる。
〔発明の効果〕 以上に述べたとうシ、本発明によれば、より効果的にカ
テゴリ間の分離を強調し、高い認識率の得られる時系列
パターン認識装置を得ることができる。
【図面の簡単な説明】
第1図は、本発明による音声認識装置の一実施例を示す
ブロック図である。 1・・・マイクロホン、2・・・音声分析部、3・・・
写像実行部、4・・・写像関数記憶部、5・・・標準パ
ターン記憶部、6・・・マツチング部、7・・・判定部

Claims (1)

    【特許請求の範囲】
  1. 一つのカテゴリ名に対して少なくとも一つ以上のクラス
    に分類された学習パターンである複数の時系列パターン
    を基にクラス間分散を大きくかつクラス内分散を小さく
    するように求められた写像関数を記憶する写像関数記憶
    部と、前記写像関数記憶部に記憶されている写像が行わ
    れたベクトルの時系列の形で表される標準パターンを一
    つのカテゴリ名に対し少なくとも一つ以上記憶する標準
    パターン記憶部と、ベクトルの時系列の形で表される入
    力パターンを記憶する入力パターン記憶部と、前記入力
    パターン記憶部の時系列パターンに対し前記写像関数記
    憶部に記憶されている写像を行う写像実行部と、前記写
    像実行部により写像された空間上の入力パターンと前記
    標準パターン記憶部に記憶されている標準パターンとの
    時間軸を正規化した距離を求めるマッチング部と、前記
    距離が最小となる標準パターンのカテゴリ名を認識結果
    とする判定部とを有することを特徴とする時系列パター
    ン認識装置。
JP61150381A 1986-06-25 1986-06-25 時系列パタ−ン認識装置 Pending JPS635396A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61150381A JPS635396A (ja) 1986-06-25 1986-06-25 時系列パタ−ン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61150381A JPS635396A (ja) 1986-06-25 1986-06-25 時系列パタ−ン認識装置

Publications (1)

Publication Number Publication Date
JPS635396A true JPS635396A (ja) 1988-01-11

Family

ID=15495754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61150381A Pending JPS635396A (ja) 1986-06-25 1986-06-25 時系列パタ−ン認識装置

Country Status (1)

Country Link
JP (1) JPS635396A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04267300A (ja) * 1991-02-22 1992-09-22 A T R Jido Honyaku Denwa Kenkyusho:Kk 雑音除去と話者適応の機能を有する音声認識装置
JP2009216760A (ja) * 2008-03-07 2009-09-24 Nec Corp 音響分析条件正規化システム、音響分析条件正規化方法および音響分析条件正規化プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04267300A (ja) * 1991-02-22 1992-09-22 A T R Jido Honyaku Denwa Kenkyusho:Kk 雑音除去と話者適応の機能を有する音声認識装置
JP2009216760A (ja) * 2008-03-07 2009-09-24 Nec Corp 音響分析条件正規化システム、音響分析条件正規化方法および音響分析条件正規化プログラム

Similar Documents

Publication Publication Date Title
US9368110B1 (en) Method for distinguishing components of an acoustic signal
CN108346427A (zh) 一种语音识别方法、装置、设备及存储介质
Bellegarda et al. The metamorphic algorithm: A speaker mapping approach to data augmentation
CN105261367B (zh) 一种说话人识别方法
CN108281146A (zh) 一种短语音说话人识别方法和装置
CN113223536B (zh) 声纹识别方法、装置及终端设备
JP2002149185A (ja) 複数の学習用話者を表現する固有空間の決定方法
Xie et al. Multimodal information fusion of audiovisual emotion recognition using novel information theoretic tools
JP2018194828A (ja) マルチビューベクトルの処理方法及び装置
Zhang et al. Speech emotion recognition using combination of features
CN106971724A (zh) 一种防干扰声纹识别方法和系统
JP2002156993A (ja) 複数の学習話者を表現する固有空間の特定方法
EP1141943B1 (en) Speaker recognition using spectrogram correlation
JPH07104952B2 (ja) パターンマッチング装置
JPS6391699A (ja) 音声認識方式
WO2003030089A1 (en) System and method of face recognition through 1/2 faces
CN111462762B (zh) 一种说话人向量正则化方法、装置、电子设备和存储介质
CN111785284A (zh) 基于音素辅助的文本无关声纹识别方法、装置以及设备
JPS635396A (ja) 時系列パタ−ン認識装置
JPH10171988A (ja) パターン認識・照合装置
EP0215065A1 (en) Individual recognition by voice analysis
CN116434758A (zh) 声纹识别模型训练方法、装置、电子设备及存储介质
CN112489678B (zh) 一种基于信道特征的场景识别方法及装置
KR20110088851A (ko) 사용자 인증을 위한 특징벡터 추출장치 및 방법
Barkan et al. Diffusion maps for PLDA-based speaker verification