JPS60158498A - パターン照合装置 - Google Patents
パターン照合装置Info
- Publication number
- JPS60158498A JPS60158498A JP59014112A JP1411284A JPS60158498A JP S60158498 A JPS60158498 A JP S60158498A JP 59014112 A JP59014112 A JP 59014112A JP 1411284 A JP1411284 A JP 1411284A JP S60158498 A JPS60158498 A JP S60158498A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- time
- register
- section
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 13
- 230000008602 contraction Effects 0.000 claims description 6
- 230000006835 compression Effects 0.000 description 8
- 238000007906 compression Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
炎亙公」
本発明は、音声パターンの照合方式に関する。
しり」
音声認識において、単語等の音声を時間−周波数のパタ
ーンに変換することは広く行われている手段である。又
、同じ単語を発声しても発声毎に非線形な時間伸縮があ
り、この時間変動を吸収してパターン照合をするために
動的計画法による方法やパターンに幅を持たせたいわゆ
るFuzzy集合におけるMembe rsh i p
関数の性質を利用する方法なとが知られている。この中
で特に後者の場合は、照合すべき2つのパターンの時間
長を適当な手段によって一致させてから重ね合わせ、そ
の重なり具合から類似度をめなければならない。又、メ
モリー容量を減少させるために一方のパターンの情報圧
縮をすることが行われる。例えば第1図に示すように周
波数成分の大きさを表わす数字を並べた時間−周波数パ
ターン以外に圧縮情報Aを記入したレジスタを持つよう
なものがある。これはillフレームのパターンはlフ
レーム分だけ、又、次のフレームのパターンは3フレー
ム分続くことを示している。このようなパターンと圧縮
していないパターンを照合する場合、圧縮されたパター
ンを一度元へ戻してから非圧縮パターンと対応づけられ
るのが一般であるが、元の状態へ戻すという無駄な作業
が必要となる。或いは非圧縮パターンも一関圧縮演算を
してから対応づけても良いが、この場合にも不必要な演
算をすることになる。
ーンに変換することは広く行われている手段である。又
、同じ単語を発声しても発声毎に非線形な時間伸縮があ
り、この時間変動を吸収してパターン照合をするために
動的計画法による方法やパターンに幅を持たせたいわゆ
るFuzzy集合におけるMembe rsh i p
関数の性質を利用する方法なとが知られている。この中
で特に後者の場合は、照合すべき2つのパターンの時間
長を適当な手段によって一致させてから重ね合わせ、そ
の重なり具合から類似度をめなければならない。又、メ
モリー容量を減少させるために一方のパターンの情報圧
縮をすることが行われる。例えば第1図に示すように周
波数成分の大きさを表わす数字を並べた時間−周波数パ
ターン以外に圧縮情報Aを記入したレジスタを持つよう
なものがある。これはillフレームのパターンはlフ
レーム分だけ、又、次のフレームのパターンは3フレー
ム分続くことを示している。このようなパターンと圧縮
していないパターンを照合する場合、圧縮されたパター
ンを一度元へ戻してから非圧縮パターンと対応づけられ
るのが一般であるが、元の状態へ戻すという無駄な作業
が必要となる。或いは非圧縮パターンも一関圧縮演算を
してから対応づけても良いが、この場合にも不必要な演
算をすることになる。
目 的
本発明は、に述のごとき従来技術の欠点を解決するため
になされたもので、特に、無駄な演算を除いて効率良く
パターンの照合を行うこ、とのできるパターン照合方式
を提供することを目的としてなされたものである。
になされたもので、特に、無駄な演算を除いて効率良く
パターンの照合を行うこ、とのできるパターン照合方式
を提供することを目的としてなされたものである。
一−1
本発明の構成について、以下、−・実施例に基づいて説
明する。
明する。
第251Jは、本発明によるパターン照合方式の一実施
例を説明するための電気的ブロック線図で、図中、1は
マイク、2はフィルタ群、3は区間検出部、4はレジス
タ、4aは時間長レジスタ、5は照合部、6は辞書部、
7はパターン伸縮部、8は重ね合せ類似度判定部、9は
リセット部、1゜は結果表示部で、特に、本発明におい
ては、上記目的を達成するため、時間−周波数で表わさ
れたパターンの時間軸に対応するレジスタ4aを有し、
パターンの照合に際し、このレジスタ内にパターンの伸
縮情報を記入した後にこの情報に基づいて一方のパター
ンを他方のパターンに対応づけるようにしている。第2
図において、あらかじめ認識すべき全ての単語について
使用者か発声し、各単語音声は特徴量が変換されて辞書
に納められているものとする。認識に際し、入力された
音声はマイク1からフィルタ群2を通過して時間−周波
数パターンに変換される。フィルタ群2は通過帯域の異
なるいくつかのバントパスフィルタにより構成されてい
る。次に区間検出部3によって中nh 音声に係るパタ
ーンのみを抽出し、レジスタ4に格納する。この時にパ
ターンは一般に10m秒毎にサンプルされ、バントパス
フィルタの数は8〜30程度のものが用いられる。仮に
バンドパスフィルタ数を8とすると、10m秒毎に8コ
のデータがレジスタ4に格納される。単語長が600m
秒であるなら480コのデータとなる。この時、レジス
タ内に単語長600m秒と一致するデータ数60コの時
間長レジスタ4aを設けておく。この時間長レジスタ4
aはリセット状態で全てlになっている。このように入
カバターンとすでに登録されている辞書中の各単語パタ
ーンとを照合する。辞書中のパターンは第1図に示すご
とく圧縮されており、通常のパターン部以外に同しフレ
ームがいくつ続くかを示す圧縮情報°と、更に圧縮61
ノの単語長つまりフレーム数を記録しである。そこで入
カバターンを照合すべき単語パターンの長さを線形挿入
によって一致させる。ここでは仮に線形挿入による方法
を述べるがこれはどのような方法をもってしても良く本
発明の範囲外である。まず、単語パターンの時間長と入
カバターンの時間長を比較しどちらをどれだけ伸縮すれ
ば良いかを決め、単語パターンの圧縮情報をレジスタ4
に入れてパターン伸縮部7へ送る。ここでは実際のパタ
ーンは不要で入力の時間長レジスタと単語パターンの圧
縮情報のみによりパターンの伸縮を行なう。仮に単語パ
ターンの時間長が620m秒、62サンプル(62フレ
ーム)あり、短いパターンを伸ばして長いパターンに一
致させるものとすると入カバターンを2サンプル増やさ
なければならない。そこで入カバターンの時間長60フ
レームに均一に2サンプル増すようにする。っt!J6
0フレームの21フレーム目と417レーム目に各々2
0フレーム目、40フレーム目と回し情報を加えて均一
に全体を62フレームに伸ばす。挿入する部分は全体の
フレーム数を挿入すべきフレーム数+1で割ることによ
り容易にめられる。これがめられると20#i目、4o
#目の時間長レジスタ4aに1を加える。こうして二つ
のパターンの重ね合わせ操作つまり2つのパターンの積
を取る時には両パターンの時間長レジスタと圧縮情報を
参照しな力七、ら積を取るようにする。
例を説明するための電気的ブロック線図で、図中、1は
マイク、2はフィルタ群、3は区間検出部、4はレジス
タ、4aは時間長レジスタ、5は照合部、6は辞書部、
7はパターン伸縮部、8は重ね合せ類似度判定部、9は
リセット部、1゜は結果表示部で、特に、本発明におい
ては、上記目的を達成するため、時間−周波数で表わさ
れたパターンの時間軸に対応するレジスタ4aを有し、
パターンの照合に際し、このレジスタ内にパターンの伸
縮情報を記入した後にこの情報に基づいて一方のパター
ンを他方のパターンに対応づけるようにしている。第2
図において、あらかじめ認識すべき全ての単語について
使用者か発声し、各単語音声は特徴量が変換されて辞書
に納められているものとする。認識に際し、入力された
音声はマイク1からフィルタ群2を通過して時間−周波
数パターンに変換される。フィルタ群2は通過帯域の異
なるいくつかのバントパスフィルタにより構成されてい
る。次に区間検出部3によって中nh 音声に係るパタ
ーンのみを抽出し、レジスタ4に格納する。この時にパ
ターンは一般に10m秒毎にサンプルされ、バントパス
フィルタの数は8〜30程度のものが用いられる。仮に
バンドパスフィルタ数を8とすると、10m秒毎に8コ
のデータがレジスタ4に格納される。単語長が600m
秒であるなら480コのデータとなる。この時、レジス
タ内に単語長600m秒と一致するデータ数60コの時
間長レジスタ4aを設けておく。この時間長レジスタ4
aはリセット状態で全てlになっている。このように入
カバターンとすでに登録されている辞書中の各単語パタ
ーンとを照合する。辞書中のパターンは第1図に示すご
とく圧縮されており、通常のパターン部以外に同しフレ
ームがいくつ続くかを示す圧縮情報°と、更に圧縮61
ノの単語長つまりフレーム数を記録しである。そこで入
カバターンを照合すべき単語パターンの長さを線形挿入
によって一致させる。ここでは仮に線形挿入による方法
を述べるがこれはどのような方法をもってしても良く本
発明の範囲外である。まず、単語パターンの時間長と入
カバターンの時間長を比較しどちらをどれだけ伸縮すれ
ば良いかを決め、単語パターンの圧縮情報をレジスタ4
に入れてパターン伸縮部7へ送る。ここでは実際のパタ
ーンは不要で入力の時間長レジスタと単語パターンの圧
縮情報のみによりパターンの伸縮を行なう。仮に単語パ
ターンの時間長が620m秒、62サンプル(62フレ
ーム)あり、短いパターンを伸ばして長いパターンに一
致させるものとすると入カバターンを2サンプル増やさ
なければならない。そこで入カバターンの時間長60フ
レームに均一に2サンプル増すようにする。っt!J6
0フレームの21フレーム目と417レーム目に各々2
0フレーム目、40フレーム目と回し情報を加えて均一
に全体を62フレームに伸ばす。挿入する部分は全体の
フレーム数を挿入すべきフレーム数+1で割ることによ
り容易にめられる。これがめられると20#i目、4o
#目の時間長レジスタ4aに1を加える。こうして二つ
のパターンの重ね合わせ操作つまり2つのパターンの積
を取る時には両パターンの時間長レジスタと圧縮情報を
参照しな力七、ら積を取るようにする。
例えば第1図のパターンでは第1フレームのパターンは
入力の第1フレームと積がとられ、第2フレームのパタ
ーンは入力の第2、第3、第4フレームと積がとられる
ことになる。なお、ここでは入力音声長を伸ばすことを
述べたが辞書の単語パターンを伸ばす場合には圧縮情報
に1を加えれば良く縮める場合は1を引けは°良い。第
2図の例ではこうして一つの単語パターンとの類似をめ
れば時間長レジスタをリセットして次の単語パターンの
照合へ移る。
入力の第1フレームと積がとられ、第2フレームのパタ
ーンは入力の第2、第3、第4フレームと積がとられる
ことになる。なお、ここでは入力音声長を伸ばすことを
述べたが辞書の単語パターンを伸ばす場合には圧縮情報
に1を加えれば良く縮める場合は1を引けは°良い。第
2図の例ではこうして一つの単語パターンとの類似をめ
れば時間長レジスタをリセットして次の単語パターンの
照合へ移る。
以下に、重ね合わせて類似度を算出する部分をFORT
RANでサブルーチンプログラムにして示すが、DIC
Tは辞書の単語パターン、INPは、入カバターン、N
Fは時間長を一致させた後のフレーム数、IDは類似度
である。
RANでサブルーチンプログラムにして示すが、DIC
Tは辞書の単語パターン、INPは、入カバターン、N
Fは時間長を一致させた後のフレーム数、IDは類似度
である。
5UBROUTINE 5UPER(D[CT、INP
、NF、10INTEGERDICT(9,’1OO)
、INP(9,100)Id=O J3=1 Di5 10 J=I、NF J1≧INP(9,J) Dii 10 J2=l、JI JD−旧CT(9,J3)−1 1F(JD、LT、0) Gi5 T5 5D610I
−1,8 ID=DICT(1、J3)木TNP(1,J2) +
IDGδ Ti5 IQ 5 j3=J3+ 1 10 C0NTINUE ETURN ND 防−−−浬 以−1−の説明から明らかなように、本発明によると、
無駄な演算かなくなり、効率の良いパターン照合が実現
できる゛。
、NF、10INTEGERDICT(9,’1OO)
、INP(9,100)Id=O J3=1 Di5 10 J=I、NF J1≧INP(9,J) Dii 10 J2=l、JI JD−旧CT(9,J3)−1 1F(JD、LT、0) Gi5 T5 5D610I
−1,8 ID=DICT(1、J3)木TNP(1,J2) +
IDGδ Ti5 IQ 5 j3=J3+ 1 10 C0NTINUE ETURN ND 防−−−浬 以−1−の説明から明らかなように、本発明によると、
無駄な演算かなくなり、効率の良いパターン照合が実現
できる゛。
iR1図は、従来のパターン照合方式の一例を説−明す
るだめの図、第2図は、本発明によるパターン照合方式
の一例を説明するための電気的ブロック線図である。 l・・・マイク、2・・・フィルタ群、3・・・区間検
出部、4・・・レジスタ、4a・・・時間長レジスタ、
5・・・照合部、6・・・辞書部、7・・・パターン伸
縮部、8・・・重ね合せ類似度判定部、9・・・リセッ
ト部、10・・・結果表示部。
るだめの図、第2図は、本発明によるパターン照合方式
の一例を説明するための電気的ブロック線図である。 l・・・マイク、2・・・フィルタ群、3・・・区間検
出部、4・・・レジスタ、4a・・・時間長レジスタ、
5・・・照合部、6・・・辞書部、7・・・パターン伸
縮部、8・・・重ね合せ類似度判定部、9・・・リセッ
ト部、10・・・結果表示部。
Claims (1)
- 高声を時間と周波数の2次元面子のパターンとして表わ
し、このパターンの時間軸サンプルに対応するレジスタ
を有し、複数のパターンの照合に際し、両パターンが有
する該レジスタ内にパターンの伸縮情報を記入した後に
この情報に基づいて方のパターンの−・つの時間サンプ
ルを他方のパターンの複数に対応づけたり或いは対応光
をなくしたりすることによって照合することを特徴とす
るパターン照合方式。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59014112A JPS60158498A (ja) | 1984-01-27 | 1984-01-27 | パターン照合装置 |
US07/511,979 US5095508A (en) | 1984-01-27 | 1990-04-16 | Identification of voice pattern |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59014112A JPS60158498A (ja) | 1984-01-27 | 1984-01-27 | パターン照合装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS60158498A true JPS60158498A (ja) | 1985-08-19 |
JPH0582599B2 JPH0582599B2 (ja) | 1993-11-19 |
Family
ID=11852029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59014112A Granted JPS60158498A (ja) | 1984-01-27 | 1984-01-27 | パターン照合装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5095508A (ja) |
JP (1) | JPS60158498A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011022621A (ja) * | 2006-10-20 | 2011-02-03 | Toshiba Tec Corp | パターンマッチング装置及び方法 |
US9517735B2 (en) | 2012-03-08 | 2016-12-13 | Ts Tech Co., Ltd. | Interior material |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03163623A (ja) * | 1989-06-23 | 1991-07-15 | Articulate Syst Inc | 音声制御コンピュータ・インターフェース |
US5680506A (en) * | 1994-12-29 | 1997-10-21 | Lucent Technologies Inc. | Apparatus and method for speech signal analysis |
US5835894A (en) * | 1995-01-19 | 1998-11-10 | Ann Adcock Corporation | Speaker and command verification method |
US5765132A (en) * | 1995-10-26 | 1998-06-09 | Dragon Systems, Inc. | Building speech models for new words in a multi-word utterance |
US5794189A (en) * | 1995-11-13 | 1998-08-11 | Dragon Systems, Inc. | Continuous speech recognition |
US5799279A (en) * | 1995-11-13 | 1998-08-25 | Dragon Systems, Inc. | Continuous speech recognition of text and commands |
US5946654A (en) * | 1997-02-21 | 1999-08-31 | Dragon Systems, Inc. | Speaker identification using unsupervised speech models |
US6029124A (en) * | 1997-02-21 | 2000-02-22 | Dragon Systems, Inc. | Sequential, nonparametric speech recognition and speaker identification |
JP4527679B2 (ja) * | 2006-03-24 | 2010-08-18 | 学校法人早稲田大学 | 音声の類似度の評価を行う方法および装置 |
JP4305509B2 (ja) * | 2006-12-26 | 2009-07-29 | ヤマハ株式会社 | 音声処理装置およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5882300A (ja) * | 1981-11-11 | 1983-05-17 | 住友電気工業株式会社 | 音声認識方式 |
JPS59195699A (ja) * | 1983-04-21 | 1984-11-06 | 三菱電機株式会社 | 単語音声認識装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3641496A (en) * | 1969-06-23 | 1972-02-08 | Phonplex Corp | Electronic voice annunciating system having binary data converted into audio representations |
US4297528A (en) * | 1979-09-10 | 1981-10-27 | Interstate Electronics Corp. | Training circuit for audio signal recognition computer |
JPS57125999A (en) * | 1981-01-29 | 1982-08-05 | Seiko Instr & Electronics | Voice synthesizer |
US4570232A (en) * | 1981-12-21 | 1986-02-11 | Nippon Telegraph & Telephone Public Corporation | Speech recognition apparatus |
US4608708A (en) * | 1981-12-24 | 1986-08-26 | Nippon Electric Co., Ltd. | Pattern matching system |
-
1984
- 1984-01-27 JP JP59014112A patent/JPS60158498A/ja active Granted
-
1990
- 1990-04-16 US US07/511,979 patent/US5095508A/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5882300A (ja) * | 1981-11-11 | 1983-05-17 | 住友電気工業株式会社 | 音声認識方式 |
JPS59195699A (ja) * | 1983-04-21 | 1984-11-06 | 三菱電機株式会社 | 単語音声認識装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011022621A (ja) * | 2006-10-20 | 2011-02-03 | Toshiba Tec Corp | パターンマッチング装置及び方法 |
US9517735B2 (en) | 2012-03-08 | 2016-12-13 | Ts Tech Co., Ltd. | Interior material |
Also Published As
Publication number | Publication date |
---|---|
US5095508A (en) | 1992-03-10 |
JPH0582599B2 (ja) | 1993-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS60158498A (ja) | パターン照合装置 | |
JPS5972496A (ja) | 単音識別装置 | |
JP2989211B2 (ja) | 音声認識装置における辞書制御方式 | |
JP2980026B2 (ja) | 音声認識装置 | |
JPH02210500A (ja) | 標準パターン登録方式 | |
JPS62211699A (ja) | 音声区間検出回路 | |
JPS61180297A (ja) | 話者照合装置 | |
JPS5882300A (ja) | 音声認識方式 | |
JPS61278896A (ja) | 話者照合装置 | |
JPS5876892A (ja) | 音声認識装置 | |
JPS63125998A (ja) | 音声入出力装置 | |
JPS63798B2 (ja) | ||
JPH04212199A (ja) | 標準パターン登録方法 | |
JPS60115996A (ja) | 音声認識装置 | |
JPS6344698A (ja) | 単語検出方式 | |
JPS63303395A (ja) | マルチ増幅機能を備えた音声認識装置 | |
JPS59124388A (ja) | 単語音声認識処理方式 | |
JPS60158497A (ja) | パタ−ン照合方式 | |
JPS6363099A (ja) | 音声認識装置 | |
JPS62206596A (ja) | 音声認識システム | |
JPH0679232B2 (ja) | 音声認識装置 | |
JPS5936299A (ja) | 音声認識装置 | |
JPH03206497A (ja) | パターン照合方法 | |
JPS5944640B2 (ja) | 音声情報サンプリング装置 | |
JPS6070496A (ja) | 音声認識処理方式 |