JP2595495B2 - パタンマッチング装置 - Google Patents
パタンマッチング装置Info
- Publication number
- JP2595495B2 JP2595495B2 JP57153767A JP15376782A JP2595495B2 JP 2595495 B2 JP2595495 B2 JP 2595495B2 JP 57153767 A JP57153767 A JP 57153767A JP 15376782 A JP15376782 A JP 15376782A JP 2595495 B2 JP2595495 B2 JP 2595495B2
- Authority
- JP
- Japan
- Prior art keywords
- distance
- storage unit
- pattern
- patterns
- stored
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000013598 vector Substances 0.000 claims description 13
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000008602 contraction Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/12—Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】 本発明は音声パタンのような特徴ベクトルの系列とし
て表わされるパタンの比較を行うパタンマッチング装置
の改良に関する。
て表わされるパタンの比較を行うパタンマッチング装置
の改良に関する。
パタン認識の方法として,認識すべきパタンをあらか
じめ標準パタンとして登録しておき認識時に入力される
未知パタンを標準パタンと比較し,最も類似度の高いも
のを認識結果として決定するパタンマッチング法は従来
から広く用いられている。
じめ標準パタンとして登録しておき認識時に入力される
未知パタンを標準パタンと比較し,最も類似度の高いも
のを認識結果として決定するパタンマッチング法は従来
から広く用いられている。
パタンマッチング法では,音声パタンにおける発声速
度の変動のような変動に対処することが重要である。動
的計画法を利用した時間軸正規化マッチング法(以下DP
法と称す)は非常に有効な方法となっており(日本音響
学会誌Vol.27No.9P483−P487参照),広く実用に供され
ている。
度の変動のような変動に対処することが重要である。動
的計画法を利用した時間軸正規化マッチング法(以下DP
法と称す)は非常に有効な方法となっており(日本音響
学会誌Vol.27No.9P483−P487参照),広く実用に供され
ている。
今,2つのパタンA,Bの特徴ベクトル系列をそれぞれ A={a(1),…,a(i),…,a(I)}, B={b(1),…,b(j),…,b(J)} で表わすと従来のDP法ではパタンAとBとの距離は次の
ようにして求められる。
ようにして求められる。
ベクトルa(i)とb(j)との距離d(i,j)に関
する積分量gについて,初期条件g(1,1)=d(1,1)
として,漸化式 をi=1,j=1からi=I,j=Jまで順次求める。最後に
得られるg(I,J)よりパタンAとBとの距離を として求める。式(1−1)はI×Jの時間点の格子上
で第1図に示す傾斜制限及び荷重のもとで点(1,1)か
ら点(I,J)までd(i,j)を積分することに対応してい
る。
する積分量gについて,初期条件g(1,1)=d(1,1)
として,漸化式 をi=1,j=1からi=I,j=Jまで順次求める。最後に
得られるg(I,J)よりパタンAとBとの距離を として求める。式(1−1)はI×Jの時間点の格子上
で第1図に示す傾斜制限及び荷重のもとで点(1,1)か
ら点(I,J)までd(i,j)を積分することに対応してい
る。
DP法ではこのように時間軸で非線形に伸縮させながら
2つのパタンの距離を求めるので同じカテゴリの2つの
パタンのマッチングにおいて発声速度の変動を正規化す
ることができる。しかし同時にDP法では,マッチングの
対象となる2つのパタンが異るカテゴリである場合,非
線形な時間伸縮により2つのパタンの似ている部分が強
調されて不自然なマッチングが行われる傾向がある。
2つのパタンの距離を求めるので同じカテゴリの2つの
パタンのマッチングにおいて発声速度の変動を正規化す
ることができる。しかし同時にDP法では,マッチングの
対象となる2つのパタンが異るカテゴリである場合,非
線形な時間伸縮により2つのパタンの似ている部分が強
調されて不自然なマッチングが行われる傾向がある。
このような不自然さは,通常の単語認識ではそれ程問
題とならないが,単音節認識のように子音の継続時間や
子音から母音への過渡時間が認識にとって重要な意味を
もつ場合には問題となる。
題とならないが,単音節認識のように子音の継続時間や
子音から母音への過渡時間が認識にとって重要な意味を
もつ場合には問題となる。
本発明は,DPマッチング法を改良することにより,発
声速度の変動の正規化能力をもち,かつ異なるカテゴリ
パタンのマッチングにおいて不自然なマッチングの行わ
れることの少ない方法を実現し,高い認識精度をもつパ
タンマッチング装置を提供することを目的としている。
声速度の変動の正規化能力をもち,かつ異なるカテゴリ
パタンのマッチングにおいて不自然なマッチングの行わ
れることの少ない方法を実現し,高い認識精度をもつパ
タンマッチング装置を提供することを目的としている。
音声パタンの発声速度の変動は、主に母音部における
発声時間の変動に基づくのでパタン全体を同じような比
率で伸縮させるのは適当でない。
発声時間の変動に基づくのでパタン全体を同じような比
率で伸縮させるのは適当でない。
しかし,同じカテゴリの異なる発声において,パタン
のある部分は圧縮され,別の部分は伸張されるようなケ
ースは一般には少ないと考えられる。したがって2つの
パタンA,BのマッチングにおいてパタンAがBより長い
場合には,Bを非線形に伸張させることにより(圧縮する
ことなしに)マッチングさせ,また,パタンBがAより
長い場合には,Aを非線形に伸張させることにより(圧縮
することなしに)マッチングさせることができる。これ
は漸化式の計算において第2図に示すようにパタンAが
パタンBより長い場合(IJ)には パタンBがパタンAより長い場合(I<J)には を用いることに対応している。
のある部分は圧縮され,別の部分は伸張されるようなケ
ースは一般には少ないと考えられる。したがって2つの
パタンA,BのマッチングにおいてパタンAがBより長い
場合には,Bを非線形に伸張させることにより(圧縮する
ことなしに)マッチングさせ,また,パタンBがAより
長い場合には,Aを非線形に伸張させることにより(圧縮
することなしに)マッチングさせることができる。これ
は漸化式の計算において第2図に示すようにパタンAが
パタンBより長い場合(IJ)には パタンBがパタンAより長い場合(I<J)には を用いることに対応している。
この場合には、2つのパタンの時間軸の対応付けは圧
縮と伸張が同時に行われることがないので,異なるカテ
ゴリのパタンをマッチングする際,不自然な対応付けは
行われにくくなっており,したがって異なるカテゴリの
パタンの時間的な違いがより保存された形でマッチング
が行われるので認識精度を向上させることができる。
縮と伸張が同時に行われることがないので,異なるカテ
ゴリのパタンをマッチングする際,不自然な対応付けは
行われにくくなっており,したがって異なるカテゴリの
パタンの時間的な違いがより保存された形でマッチング
が行われるので認識精度を向上させることができる。
本発明による装置は特徴ベクトルの系列として表わさ
れる第1のパタンA{a(1),…,a(i),…,a
(I)}を格納する第1パタン記憶部と,特徴ベクトル
の系列として表わされる第2のパタンB{b(1),
…,b(j),…,b(J)}を格納する第2パタン記憶部
と,指定されたi,jに対して特徴ベクトルa(i)とb
(j)との距離d(i,j)を算出する距離計算部と,上
記距離d(i,j)をI×Jの時間点の格子上の点(i,j)
に対応させたときi,jを順次変化させることによって得
られる格子状の構造をもつ距離情報のうちの少なくとも
必要個数を記憶する距離記憶部と,上記格子の点に対す
る積分量gを少なくとも必要個数記憶する積分量記憶部
と,格子の各点における積分量gを,積分量記憶部に記
憶された過去の積分量と距離記憶部に記憶された過去の
距離の荷重和を指定された複数の組合せに対して計算し
その最小値として算出する漸化式計算部と,上記漸次化
式計算部において荷重和の計算される組合せを2つのパ
タンA,Bの長さI,Jを比較した結果に従って指定する傾斜
制限指定部とを含んで構成され,i=1,j=1からi=1,j
=Jまでi,jを順次変化させて前記パタンAとBとの距
離を算出することを特徴としている。
れる第1のパタンA{a(1),…,a(i),…,a
(I)}を格納する第1パタン記憶部と,特徴ベクトル
の系列として表わされる第2のパタンB{b(1),
…,b(j),…,b(J)}を格納する第2パタン記憶部
と,指定されたi,jに対して特徴ベクトルa(i)とb
(j)との距離d(i,j)を算出する距離計算部と,上
記距離d(i,j)をI×Jの時間点の格子上の点(i,j)
に対応させたときi,jを順次変化させることによって得
られる格子状の構造をもつ距離情報のうちの少なくとも
必要個数を記憶する距離記憶部と,上記格子の点に対す
る積分量gを少なくとも必要個数記憶する積分量記憶部
と,格子の各点における積分量gを,積分量記憶部に記
憶された過去の積分量と距離記憶部に記憶された過去の
距離の荷重和を指定された複数の組合せに対して計算し
その最小値として算出する漸化式計算部と,上記漸次化
式計算部において荷重和の計算される組合せを2つのパ
タンA,Bの長さI,Jを比較した結果に従って指定する傾斜
制限指定部とを含んで構成され,i=1,j=1からi=1,j
=Jまでi,jを順次変化させて前記パタンAとBとの距
離を算出することを特徴としている。
以下に本発明の原理を図面を参照して説明する。第3
図は本発明による装置の一実施例を示すブロック図であ
る。第1ベクトル記憶部1,第2ベクトル記憶部2にはそ
れぞれパタンA,Bの特徴ベクトル系列{a(1),…,a
(I)},{b(1),…,b(J)}が格納される。3
は距離計算部で,制御部7により指定されたi,jに対し
て距離d(i,j)を計算し,結果を距離記憶部5へ格納
する。
図は本発明による装置の一実施例を示すブロック図であ
る。第1ベクトル記憶部1,第2ベクトル記憶部2にはそ
れぞれパタンA,Bの特徴ベクトル系列{a(1),…,a
(I)},{b(1),…,b(J)}が格納される。3
は距離計算部で,制御部7により指定されたi,jに対し
て距離d(i,j)を計算し,結果を距離記憶部5へ格納
する。
傾斜制限指定部8は記憶部1,2に格納された2つのパ
タンA,Bの長さI,Jを比較しIJのときは漸化式
(2),その他のときは漸化式(3)を用いることを指
定する信号を漸化式計算部4へ出力する。漸化式計算部
4は制御部7により指定されたi,jに対する積分量g
(i,j)を,前記傾斜制御指定部の出力に従って漸化式
(2),(3)のいずれかを用いて計算することにより
求める。このとき計算に必要な距離情報は距離記憶部5
より読み出され,過去の積分量gは積分量記憶部6より
読み出され,得られたg(i,j)を積分量記憶部6へ格
納される。7は制御部であり制御信号i,jをi=1,j=1
からi=I,j=Jまで順次変化させ,距離計算部3及び
漸化式計算部4を制御してi=I,j=Jの時点で得られ
る積分量g(I,J)を用いて式(1−2)によりパタン
間距離を算出する。
タンA,Bの長さI,Jを比較しIJのときは漸化式
(2),その他のときは漸化式(3)を用いることを指
定する信号を漸化式計算部4へ出力する。漸化式計算部
4は制御部7により指定されたi,jに対する積分量g
(i,j)を,前記傾斜制御指定部の出力に従って漸化式
(2),(3)のいずれかを用いて計算することにより
求める。このとき計算に必要な距離情報は距離記憶部5
より読み出され,過去の積分量gは積分量記憶部6より
読み出され,得られたg(i,j)を積分量記憶部6へ格
納される。7は制御部であり制御信号i,jをi=1,j=1
からi=I,j=Jまで順次変化させ,距離計算部3及び
漸化式計算部4を制御してi=I,j=Jの時点で得られ
る積分量g(I,J)を用いて式(1−2)によりパタン
間距離を算出する。
以上,本発明の原理を説明したが,これらの記載は本
発明の原理を限定するものではない。説明で用いた漸化
式(2),(3)のかわりに次のようなものを用いても
よい。
発明の原理を限定するものではない。説明で用いた漸化
式(2),(3)のかわりに次のようなものを用いても
よい。
IJのとき I<Jのとき 式(2)′,(3)′は第4図に示す傾斜制限,荷重
に対応している。漸化式としては,この他にもIJの
ときとI<Jのときとで異る形をとるものであれば,類
似のものを用いてもよい。
に対応している。漸化式としては,この他にもIJの
ときとI<Jのときとで異る形をとるものであれば,類
似のものを用いてもよい。
説明では音声パタンの例を用いたが特徴ベクトルの系
列として表わされるパタンであれば音声,文字等任意の
パタンに対して本発明の原理は成立する。
列として表わされるパタンであれば音声,文字等任意の
パタンに対して本発明の原理は成立する。
【図面の簡単な説明】 第1図は従来のDP法を説明する図,第2図は本発明によ
る漸化式の第1の例を説明するための図,第3図は本発
明による一実施例を示すブロック図,第4図は傾斜制
限,荷重を説明する図である。図において1,2……ベク
トル記憶部,3……距離計算部,4……漸化式計算部,5……
距離記憶部,6……積分量記憶部,7……制御部,8……傾斜
制限指定部である。
る漸化式の第1の例を説明するための図,第3図は本発
明による一実施例を示すブロック図,第4図は傾斜制
限,荷重を説明する図である。図において1,2……ベク
トル記憶部,3……距離計算部,4……漸化式計算部,5……
距離記憶部,6……積分量記憶部,7……制御部,8……傾斜
制限指定部である。
Claims (1)
- 【請求項1】特徴ベクトルの系列として表わされる第1
のパタンA{a(1),…,a(i),…,a(I)}を格
納する第1パタン記憶部と,特徴ベクトルの系列として
表わされる第2のパタンB{b(1),…,b(j),
…,b(J)}を格納する第2パタン記憶部と,指定され
たi,jに対して特徴ベクトルa(i)とb(j)との距
離d(i,j)を算出する距離計算部と,上記距離d(i,
j)をI×Jの時間点の格子上の点(i,j)に対応させた
ときi,jを順次変化させることによって得られる格子状
の構造をもつ距離情報のうち少なくとも必要個数を記憶
する距離記憶部と,上記格子の点に対する積分量gを少
なくとも必要個数記憶する積分量記憶部と,格子の各点
における積分量gを,積分量記憶部に記憶された過去の
積分量と距離記憶部に記憶された過去の距離の荷重和を
指定された複数の組合せに対して計算しその最小値とし
て算出する漸化式計算部と,上記漸化式計算部において
荷重和の計算される組合せを2つのパタンA,Bの長さI,J
を比較した結果に従って指定する傾斜制限指定部とを含
んで構成され,i=1,j=1からi=I,j=Jまでi,jを順
次変化させて前記パタンAとBとの距離を算出すること
を特徴とするパタンマッチング装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57153767A JP2595495B2 (ja) | 1982-09-03 | 1982-09-03 | パタンマッチング装置 |
DE8383108675T DE3374907D1 (en) | 1982-09-03 | 1983-09-02 | Pattern matching apparatus |
EP83108675A EP0103245B1 (en) | 1982-09-03 | 1983-09-02 | Pattern matching apparatus |
US07/080,249 US4742547A (en) | 1982-09-03 | 1987-07-28 | Pattern matching apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57153767A JP2595495B2 (ja) | 1982-09-03 | 1982-09-03 | パタンマッチング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5942600A JPS5942600A (ja) | 1984-03-09 |
JP2595495B2 true JP2595495B2 (ja) | 1997-04-02 |
Family
ID=15569681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57153767A Expired - Lifetime JP2595495B2 (ja) | 1982-09-03 | 1982-09-03 | パタンマッチング装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US4742547A (ja) |
EP (1) | EP0103245B1 (ja) |
JP (1) | JP2595495B2 (ja) |
DE (1) | DE3374907D1 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62250498A (ja) * | 1986-04-23 | 1987-10-31 | 富士通株式会社 | 連続単語音声認識装置 |
JPH0638195B2 (ja) * | 1987-01-30 | 1994-05-18 | 日本電気株式会社 | パタンマッチング装置 |
JPH04194999A (ja) * | 1990-11-27 | 1992-07-14 | Sharp Corp | 学習を用いた動的計画法 |
JP2808906B2 (ja) * | 1991-02-07 | 1998-10-08 | 日本電気株式会社 | 音声認識装置 |
IL113204A (en) * | 1995-03-30 | 1999-03-12 | Advanced Recognition Tech | Pattern recognition system |
US5677990A (en) * | 1995-05-05 | 1997-10-14 | Panasonic Technologies, Inc. | System and method using N-best strategy for real time recognition of continuously spelled names |
US5825977A (en) * | 1995-09-08 | 1998-10-20 | Morin; Philippe R. | Word hypothesizer based on reliably detected phoneme similarity regions |
US5822728A (en) * | 1995-09-08 | 1998-10-13 | Matsushita Electric Industrial Co., Ltd. | Multistage word recognizer based on reliably detected phoneme similarity regions |
US5684925A (en) * | 1995-09-08 | 1997-11-04 | Matsushita Electric Industrial Co., Ltd. | Speech representation by feature-based word prototypes comprising phoneme targets having reliable high similarity |
JP2980026B2 (ja) * | 1996-05-30 | 1999-11-22 | 日本電気株式会社 | 音声認識装置 |
US7364380B2 (en) * | 2003-09-26 | 2008-04-29 | The Hartz Mountain Corporation | Grooming/cleaning apparatus |
US7309182B2 (en) * | 2002-05-10 | 2007-12-18 | The Hartz Mountain Corporation | Liquid dispensing brush |
US6698626B2 (en) | 2002-05-10 | 2004-03-02 | Mckay William D. | Lint remover and spray dispenser apparatus |
US7234188B1 (en) | 2003-09-26 | 2007-06-26 | The Hartz Mountain Corporation | Lint removal apparatus with edge orientation |
US7225950B2 (en) * | 2002-05-10 | 2007-06-05 | The Hartz Mountain Corporation | Lint roll/dispensable fluid container apparatus |
US20040052570A1 (en) * | 2002-05-10 | 2004-03-18 | Mckay William D. | Lint roller/brush assembly |
US7039982B1 (en) * | 2002-05-10 | 2006-05-09 | The Hartz Mountain Corporation | Lint roller/brush assembly |
US20050066457A1 (en) * | 2003-09-26 | 2005-03-31 | Mckay William D. | Grooming/cleaning apparatus |
JP2004314945A (ja) * | 2003-03-31 | 2004-11-11 | Komatsu Forklift Co Ltd | フォークリフトのパワートレーン支持装置 |
US7281288B1 (en) | 2003-09-26 | 2007-10-16 | The Hartz Mountain Corporation | Cleaning apparatus with flexible connection between head and handle |
US6981291B2 (en) * | 2003-09-26 | 2006-01-03 | The Hartz Mountain Corporation | Motorized cleaning apparatus |
US7090908B1 (en) * | 2004-02-18 | 2006-08-15 | The Hartz Mountain Corporation | Lint tape roll with peeling feature |
US7715961B1 (en) | 2004-04-28 | 2010-05-11 | Agnik, Llc | Onboard driver, vehicle and fleet data mining |
JP5103907B2 (ja) * | 2005-01-17 | 2012-12-19 | 日本電気株式会社 | 音声認識システム、音声認識方法及び音声認識プログラム |
EP2535894B1 (en) * | 2007-03-02 | 2015-01-07 | Telefonaktiebolaget L M Ericsson (PUBL) | Methods and arrangements in a telecommunications network |
WO2010110181A1 (ja) * | 2009-03-27 | 2010-09-30 | 日本電気株式会社 | パターン照合装置、パターン照合方法及びパターン照合プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57147781A (en) * | 1981-03-06 | 1982-09-11 | Nec Corp | Pattern matching device |
-
1982
- 1982-09-03 JP JP57153767A patent/JP2595495B2/ja not_active Expired - Lifetime
-
1983
- 1983-09-02 DE DE8383108675T patent/DE3374907D1/de not_active Expired
- 1983-09-02 EP EP83108675A patent/EP0103245B1/en not_active Expired
-
1987
- 1987-07-28 US US07/080,249 patent/US4742547A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0103245A1 (en) | 1984-03-21 |
EP0103245B1 (en) | 1987-12-09 |
JPS5942600A (ja) | 1984-03-09 |
DE3374907D1 (en) | 1988-01-21 |
US4742547A (en) | 1988-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2595495B2 (ja) | パタンマッチング装置 | |
US4400828A (en) | Word recognizer | |
US6278972B1 (en) | System and method for segmentation and recognition of speech signals | |
US4426551A (en) | Speech recognition method and device | |
JP2980026B2 (ja) | 音声認識装置 | |
US5220609A (en) | Method of speech recognition | |
JPH0247760B2 (ja) | ||
JPH0361956B2 (ja) | ||
JPS59161782A (ja) | パタ−ン・マツチング方法 | |
JPH02750B2 (ja) | ||
JP3094473B2 (ja) | 動的計画法照合装置 | |
JPH024919B2 (ja) | ||
JP2951661B2 (ja) | パタン尤度計算方式 | |
JPH0247758B2 (ja) | ||
JPH022159B2 (ja) | ||
JPS59195699A (ja) | 単語音声認識装置 | |
JPS59124387A (ja) | 連続単語音声認識方法 | |
JPH0638195B2 (ja) | パタンマッチング装置 | |
JPH0636155B2 (ja) | パタ−ン比較装置 | |
JPH0361955B2 (ja) | ||
JPH0565908B2 (ja) | ||
JPH06175685A (ja) | パタン認識装置及びヒドゥンマルコフモデル作成装置 | |
JPS62209497A (ja) | 連続音声認識装置 | |
JPS59172692A (ja) | 連続単語音声認識方法 | |
JPH0449718B2 (ja) |