JP2595495B2 - パタンマッチング装置 - Google Patents

パタンマッチング装置

Info

Publication number
JP2595495B2
JP2595495B2 JP57153767A JP15376782A JP2595495B2 JP 2595495 B2 JP2595495 B2 JP 2595495B2 JP 57153767 A JP57153767 A JP 57153767A JP 15376782 A JP15376782 A JP 15376782A JP 2595495 B2 JP2595495 B2 JP 2595495B2
Authority
JP
Japan
Prior art keywords
distance
storage unit
pattern
patterns
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57153767A
Other languages
English (en)
Other versions
JPS5942600A (ja
Inventor
隆夫 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP57153767A priority Critical patent/JP2595495B2/ja
Priority to DE8383108675T priority patent/DE3374907D1/de
Priority to EP83108675A priority patent/EP0103245B1/en
Publication of JPS5942600A publication Critical patent/JPS5942600A/ja
Priority to US07/080,249 priority patent/US4742547A/en
Application granted granted Critical
Publication of JP2595495B2 publication Critical patent/JP2595495B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は音声パタンのような特徴ベクトルの系列とし
て表わされるパタンの比較を行うパタンマッチング装置
の改良に関する。
パタン認識の方法として,認識すべきパタンをあらか
じめ標準パタンとして登録しておき認識時に入力される
未知パタンを標準パタンと比較し,最も類似度の高いも
のを認識結果として決定するパタンマッチング法は従来
から広く用いられている。
パタンマッチング法では,音声パタンにおける発声速
度の変動のような変動に対処することが重要である。動
的計画法を利用した時間軸正規化マッチング法(以下DP
法と称す)は非常に有効な方法となっており(日本音響
学会誌Vol.27No.9P483−P487参照),広く実用に供され
ている。
今,2つのパタンA,Bの特徴ベクトル系列をそれぞれ A={a(1),…,a(i),…,a(I)}, B={b(1),…,b(j),…,b(J)} で表わすと従来のDP法ではパタンAとBとの距離は次の
ようにして求められる。
ベクトルa(i)とb(j)との距離d(i,j)に関
する積分量gについて,初期条件g(1,1)=d(1,1)
として,漸化式 をi=1,j=1からi=I,j=Jまで順次求める。最後に
得られるg(I,J)よりパタンAとBとの距離を として求める。式(1−1)はI×Jの時間点の格子上
で第1図に示す傾斜制限及び荷重のもとで点(1,1)か
ら点(I,J)までd(i,j)を積分することに対応してい
る。
DP法ではこのように時間軸で非線形に伸縮させながら
2つのパタンの距離を求めるので同じカテゴリの2つの
パタンのマッチングにおいて発声速度の変動を正規化す
ることができる。しかし同時にDP法では,マッチングの
対象となる2つのパタンが異るカテゴリである場合,非
線形な時間伸縮により2つのパタンの似ている部分が強
調されて不自然なマッチングが行われる傾向がある。
このような不自然さは,通常の単語認識ではそれ程問
題とならないが,単音節認識のように子音の継続時間や
子音から母音への過渡時間が認識にとって重要な意味を
もつ場合には問題となる。
本発明は,DPマッチング法を改良することにより,発
声速度の変動の正規化能力をもち,かつ異なるカテゴリ
パタンのマッチングにおいて不自然なマッチングの行わ
れることの少ない方法を実現し,高い認識精度をもつパ
タンマッチング装置を提供することを目的としている。
音声パタンの発声速度の変動は、主に母音部における
発声時間の変動に基づくのでパタン全体を同じような比
率で伸縮させるのは適当でない。
しかし,同じカテゴリの異なる発声において,パタン
のある部分は圧縮され,別の部分は伸張されるようなケ
ースは一般には少ないと考えられる。したがって2つの
パタンA,BのマッチングにおいてパタンAがBより長い
場合には,Bを非線形に伸張させることにより(圧縮する
ことなしに)マッチングさせ,また,パタンBがAより
長い場合には,Aを非線形に伸張させることにより(圧縮
することなしに)マッチングさせることができる。これ
は漸化式の計算において第2図に示すようにパタンAが
パタンBより長い場合(IJ)には パタンBがパタンAより長い場合(I<J)には を用いることに対応している。
この場合には、2つのパタンの時間軸の対応付けは圧
縮と伸張が同時に行われることがないので,異なるカテ
ゴリのパタンをマッチングする際,不自然な対応付けは
行われにくくなっており,したがって異なるカテゴリの
パタンの時間的な違いがより保存された形でマッチング
が行われるので認識精度を向上させることができる。
本発明による装置は特徴ベクトルの系列として表わさ
れる第1のパタンA{a(1),…,a(i),…,a
(I)}を格納する第1パタン記憶部と,特徴ベクトル
の系列として表わされる第2のパタンB{b(1),
…,b(j),…,b(J)}を格納する第2パタン記憶部
と,指定されたi,jに対して特徴ベクトルa(i)とb
(j)との距離d(i,j)を算出する距離計算部と,上
記距離d(i,j)をI×Jの時間点の格子上の点(i,j)
に対応させたときi,jを順次変化させることによって得
られる格子状の構造をもつ距離情報のうちの少なくとも
必要個数を記憶する距離記憶部と,上記格子の点に対す
る積分量gを少なくとも必要個数記憶する積分量記憶部
と,格子の各点における積分量gを,積分量記憶部に記
憶された過去の積分量と距離記憶部に記憶された過去の
距離の荷重和を指定された複数の組合せに対して計算し
その最小値として算出する漸化式計算部と,上記漸次化
式計算部において荷重和の計算される組合せを2つのパ
タンA,Bの長さI,Jを比較した結果に従って指定する傾斜
制限指定部とを含んで構成され,i=1,j=1からi=1,j
=Jまでi,jを順次変化させて前記パタンAとBとの距
離を算出することを特徴としている。
以下に本発明の原理を図面を参照して説明する。第3
図は本発明による装置の一実施例を示すブロック図であ
る。第1ベクトル記憶部1,第2ベクトル記憶部2にはそ
れぞれパタンA,Bの特徴ベクトル系列{a(1),…,a
(I)},{b(1),…,b(J)}が格納される。3
は距離計算部で,制御部7により指定されたi,jに対し
て距離d(i,j)を計算し,結果を距離記憶部5へ格納
する。
傾斜制限指定部8は記憶部1,2に格納された2つのパ
タンA,Bの長さI,Jを比較しIJのときは漸化式
(2),その他のときは漸化式(3)を用いることを指
定する信号を漸化式計算部4へ出力する。漸化式計算部
4は制御部7により指定されたi,jに対する積分量g
(i,j)を,前記傾斜制御指定部の出力に従って漸化式
(2),(3)のいずれかを用いて計算することにより
求める。このとき計算に必要な距離情報は距離記憶部5
より読み出され,過去の積分量gは積分量記憶部6より
読み出され,得られたg(i,j)を積分量記憶部6へ格
納される。7は制御部であり制御信号i,jをi=1,j=1
からi=I,j=Jまで順次変化させ,距離計算部3及び
漸化式計算部4を制御してi=I,j=Jの時点で得られ
る積分量g(I,J)を用いて式(1−2)によりパタン
間距離を算出する。
以上,本発明の原理を説明したが,これらの記載は本
発明の原理を限定するものではない。説明で用いた漸化
式(2),(3)のかわりに次のようなものを用いても
よい。
IJのとき I<Jのとき 式(2)′,(3)′は第4図に示す傾斜制限,荷重
に対応している。漸化式としては,この他にもIJの
ときとI<Jのときとで異る形をとるものであれば,類
似のものを用いてもよい。
説明では音声パタンの例を用いたが特徴ベクトルの系
列として表わされるパタンであれば音声,文字等任意の
パタンに対して本発明の原理は成立する。
【図面の簡単な説明】 第1図は従来のDP法を説明する図,第2図は本発明によ
る漸化式の第1の例を説明するための図,第3図は本発
明による一実施例を示すブロック図,第4図は傾斜制
限,荷重を説明する図である。図において1,2……ベク
トル記憶部,3……距離計算部,4……漸化式計算部,5……
距離記憶部,6……積分量記憶部,7……制御部,8……傾斜
制限指定部である。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】特徴ベクトルの系列として表わされる第1
    のパタンA{a(1),…,a(i),…,a(I)}を格
    納する第1パタン記憶部と,特徴ベクトルの系列として
    表わされる第2のパタンB{b(1),…,b(j),
    …,b(J)}を格納する第2パタン記憶部と,指定され
    たi,jに対して特徴ベクトルa(i)とb(j)との距
    離d(i,j)を算出する距離計算部と,上記距離d(i,
    j)をI×Jの時間点の格子上の点(i,j)に対応させた
    ときi,jを順次変化させることによって得られる格子状
    の構造をもつ距離情報のうち少なくとも必要個数を記憶
    する距離記憶部と,上記格子の点に対する積分量gを少
    なくとも必要個数記憶する積分量記憶部と,格子の各点
    における積分量gを,積分量記憶部に記憶された過去の
    積分量と距離記憶部に記憶された過去の距離の荷重和を
    指定された複数の組合せに対して計算しその最小値とし
    て算出する漸化式計算部と,上記漸化式計算部において
    荷重和の計算される組合せを2つのパタンA,Bの長さI,J
    を比較した結果に従って指定する傾斜制限指定部とを含
    んで構成され,i=1,j=1からi=I,j=Jまでi,jを順
    次変化させて前記パタンAとBとの距離を算出すること
    を特徴とするパタンマッチング装置。
JP57153767A 1982-09-03 1982-09-03 パタンマッチング装置 Expired - Lifetime JP2595495B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP57153767A JP2595495B2 (ja) 1982-09-03 1982-09-03 パタンマッチング装置
DE8383108675T DE3374907D1 (en) 1982-09-03 1983-09-02 Pattern matching apparatus
EP83108675A EP0103245B1 (en) 1982-09-03 1983-09-02 Pattern matching apparatus
US07/080,249 US4742547A (en) 1982-09-03 1987-07-28 Pattern matching apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57153767A JP2595495B2 (ja) 1982-09-03 1982-09-03 パタンマッチング装置

Publications (2)

Publication Number Publication Date
JPS5942600A JPS5942600A (ja) 1984-03-09
JP2595495B2 true JP2595495B2 (ja) 1997-04-02

Family

ID=15569681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57153767A Expired - Lifetime JP2595495B2 (ja) 1982-09-03 1982-09-03 パタンマッチング装置

Country Status (4)

Country Link
US (1) US4742547A (ja)
EP (1) EP0103245B1 (ja)
JP (1) JP2595495B2 (ja)
DE (1) DE3374907D1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62250498A (ja) * 1986-04-23 1987-10-31 富士通株式会社 連続単語音声認識装置
JPH0638195B2 (ja) * 1987-01-30 1994-05-18 日本電気株式会社 パタンマッチング装置
JPH04194999A (ja) * 1990-11-27 1992-07-14 Sharp Corp 学習を用いた動的計画法
JP2808906B2 (ja) * 1991-02-07 1998-10-08 日本電気株式会社 音声認識装置
IL113204A (en) * 1995-03-30 1999-03-12 Advanced Recognition Tech Pattern recognition system
US5677990A (en) * 1995-05-05 1997-10-14 Panasonic Technologies, Inc. System and method using N-best strategy for real time recognition of continuously spelled names
US5825977A (en) * 1995-09-08 1998-10-20 Morin; Philippe R. Word hypothesizer based on reliably detected phoneme similarity regions
US5822728A (en) * 1995-09-08 1998-10-13 Matsushita Electric Industrial Co., Ltd. Multistage word recognizer based on reliably detected phoneme similarity regions
US5684925A (en) * 1995-09-08 1997-11-04 Matsushita Electric Industrial Co., Ltd. Speech representation by feature-based word prototypes comprising phoneme targets having reliable high similarity
JP2980026B2 (ja) * 1996-05-30 1999-11-22 日本電気株式会社 音声認識装置
US7364380B2 (en) * 2003-09-26 2008-04-29 The Hartz Mountain Corporation Grooming/cleaning apparatus
US7309182B2 (en) * 2002-05-10 2007-12-18 The Hartz Mountain Corporation Liquid dispensing brush
US6698626B2 (en) 2002-05-10 2004-03-02 Mckay William D. Lint remover and spray dispenser apparatus
US7234188B1 (en) 2003-09-26 2007-06-26 The Hartz Mountain Corporation Lint removal apparatus with edge orientation
US7225950B2 (en) * 2002-05-10 2007-06-05 The Hartz Mountain Corporation Lint roll/dispensable fluid container apparatus
US20040052570A1 (en) * 2002-05-10 2004-03-18 Mckay William D. Lint roller/brush assembly
US7039982B1 (en) * 2002-05-10 2006-05-09 The Hartz Mountain Corporation Lint roller/brush assembly
US20050066457A1 (en) * 2003-09-26 2005-03-31 Mckay William D. Grooming/cleaning apparatus
JP2004314945A (ja) * 2003-03-31 2004-11-11 Komatsu Forklift Co Ltd フォークリフトのパワートレーン支持装置
US7281288B1 (en) 2003-09-26 2007-10-16 The Hartz Mountain Corporation Cleaning apparatus with flexible connection between head and handle
US6981291B2 (en) * 2003-09-26 2006-01-03 The Hartz Mountain Corporation Motorized cleaning apparatus
US7090908B1 (en) * 2004-02-18 2006-08-15 The Hartz Mountain Corporation Lint tape roll with peeling feature
US7715961B1 (en) 2004-04-28 2010-05-11 Agnik, Llc Onboard driver, vehicle and fleet data mining
JP5103907B2 (ja) * 2005-01-17 2012-12-19 日本電気株式会社 音声認識システム、音声認識方法及び音声認識プログラム
EP2535894B1 (en) * 2007-03-02 2015-01-07 Telefonaktiebolaget L M Ericsson (PUBL) Methods and arrangements in a telecommunications network
WO2010110181A1 (ja) * 2009-03-27 2010-09-30 日本電気株式会社 パターン照合装置、パターン照合方法及びパターン照合プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57147781A (en) * 1981-03-06 1982-09-11 Nec Corp Pattern matching device

Also Published As

Publication number Publication date
EP0103245A1 (en) 1984-03-21
EP0103245B1 (en) 1987-12-09
JPS5942600A (ja) 1984-03-09
DE3374907D1 (en) 1988-01-21
US4742547A (en) 1988-05-03

Similar Documents

Publication Publication Date Title
JP2595495B2 (ja) パタンマッチング装置
US4400828A (en) Word recognizer
US6278972B1 (en) System and method for segmentation and recognition of speech signals
US4426551A (en) Speech recognition method and device
JP2980026B2 (ja) 音声認識装置
US5220609A (en) Method of speech recognition
JPH0247760B2 (ja)
JPH0361956B2 (ja)
JPS59161782A (ja) パタ−ン・マツチング方法
JPH02750B2 (ja)
JP3094473B2 (ja) 動的計画法照合装置
JPH024919B2 (ja)
JP2951661B2 (ja) パタン尤度計算方式
JPH0247758B2 (ja)
JPH022159B2 (ja)
JPS59195699A (ja) 単語音声認識装置
JPS59124387A (ja) 連続単語音声認識方法
JPH0638195B2 (ja) パタンマッチング装置
JPH0636155B2 (ja) パタ−ン比較装置
JPH0361955B2 (ja)
JPH0565908B2 (ja)
JPH06175685A (ja) パタン認識装置及びヒドゥンマルコフモデル作成装置
JPS62209497A (ja) 連続音声認識装置
JPS59172692A (ja) 連続単語音声認識方法
JPH0449718B2 (ja)