JPS60158498A

JPS60158498A - パターン照合装置

Info

Publication number: JPS60158498A
Application number: JP59014112A
Authority: JP
Inventors: 潤一郎藤本
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1984-01-27
Filing date: 1984-01-27
Publication date: 1985-08-19
Also published as: JPH0582599B2; US5095508A

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】炎亙公」本発明は、音声パターンの照合方式に関する。

しり」音声認識において、単語等の音声を時間−周波数のパタ
ーンに変換することは広く行われている手段である。又
、同じ単語を発声しても発声毎に非線形な時間伸縮があ
り、この時間変動を吸収してパターン照合をするために
動的計画法による方法やパターンに幅を持たせたいわゆ
るＦｕｚｚｙ集合におけるＭｅｍｂｅ　ｒｓｈ　ｉ　ｐ
関数の性質を利用する方法なとが知られている。この中
で特に後者の場合は、照合すべき２つのパターンの時間
長を適当な手段によって一致させてから重ね合わせ、そ
の重なり具合から類似度をめなければならない。又、メ
モリー容量を減少させるために一方のパターンの情報圧
縮をすることが行われる。例えば第１図に示すように周
波数成分の大きさを表わす数字を並べた時間−周波数パ
ターン以外に圧縮情報Ａを記入したレジスタを持つよう
なものがある。これはｉｌｌフレームのパターンはｌフ
レーム分だけ、又、次のフレームのパターンは３フレー
ム分続くことを示している。このようなパターンと圧縮
していないパターンを照合する場合、圧縮されたパター
ンを一度元へ戻してから非圧縮パターンと対応づけられ
るのが一般であるが、元の状態へ戻すという無駄な作業
が必要となる。或いは非圧縮パターンも一関圧縮演算を
してから対応づけても良いが、この場合にも不必要な演
算をすることになる。

目　的本発明は、に述のごとき従来技術の欠点を解決するため
になされたもので、特に、無駄な演算を除いて効率良く
パターンの照合を行うこ、とのできるパターン照合方式
を提供することを目的としてなされたものである。

一−１本発明の構成について、以下、−・実施例に基づいて説
明する。

第２５１Ｊは、本発明によるパターン照合方式の一実施
例を説明するための電気的ブロック線図で、図中、１は
マイク、２はフィルタ群、３は区間検出部、４はレジス
タ、４ａは時間長レジスタ、５は照合部、６は辞書部、
７はパターン伸縮部、８は重ね合せ類似度判定部、９は
リセット部、１゜は結果表示部で、特に、本発明におい
ては、上記目的を達成するため、時間−周波数で表わさ
れたパターンの時間軸に対応するレジスタ４ａを有し、
パターンの照合に際し、このレジスタ内にパターンの伸
縮情報を記入した後にこの情報に基づいて一方のパター
ンを他方のパターンに対応づけるようにしている。第２
図において、あらかじめ認識すべき全ての単語について
使用者か発声し、各単語音声は特徴量が変換されて辞書
に納められているものとする。認識に際し、入力された
音声はマイク１からフィルタ群２を通過して時間−周波
数パターンに変換される。フィルタ群２は通過帯域の異
なるいくつかのバントパスフィルタにより構成されてい
る。次に区間検出部３によって中ｎｈ　音声に係るパタ
ーンのみを抽出し、レジスタ４に格納する。この時にパ
ターンは一般に１０ｍ秒毎にサンプルされ、バントパス
フィルタの数は８〜３０程度のものが用いられる。仮に
バンドパスフィルタ数を８とすると、１０ｍ秒毎に８コ
のデータがレジスタ４に格納される。単語長が６００ｍ
秒であるなら４８０コのデータとなる。この時、レジス
タ内に単語長６００ｍ秒と一致するデータ数６０コの時
間長レジスタ４ａを設けておく。この時間長レジスタ４
ａはリセット状態で全てｌになっている。このように入
カバターンとすでに登録されている辞書中の各単語パタ
ーンとを照合する。辞書中のパターンは第１図に示すご
とく圧縮されており、通常のパターン部以外に同しフレ
ームがいくつ続くかを示す圧縮情報°と、更に圧縮６１
ノの単語長つまりフレーム数を記録しである。そこで入
カバターンを照合すべき単語パターンの長さを線形挿入
によって一致させる。ここでは仮に線形挿入による方法
を述べるがこれはどのような方法をもってしても良く本
発明の範囲外である。まず、単語パターンの時間長と入
カバターンの時間長を比較しどちらをどれだけ伸縮すれ
ば良いかを決め、単語パターンの圧縮情報をレジスタ４
に入れてパターン伸縮部７へ送る。ここでは実際のパタ
ーンは不要で入力の時間長レジスタと単語パターンの圧
縮情報のみによりパターンの伸縮を行なう。仮に単語パ
ターンの時間長が６２０ｍ秒、６２サンプル（６２フレ
ーム）あり、短いパターンを伸ばして長いパターンに一
致させるものとすると入カバターンを２サンプル増やさ
なければならない。そこで入カバターンの時間長６０フ
レームに均一に２サンプル増すようにする。っｔ！Ｊ６
０フレームの２１フレーム目と４１７レーム目に各々２
０フレーム目、４０フレーム目と回し情報を加えて均一
に全体を６２フレームに伸ばす。挿入する部分は全体の
フレーム数を挿入すべきフレーム数＋１で割ることによ
り容易にめられる。これがめられると２０＃ｉ目、４ｏ
＃目の時間長レジスタ４ａに１を加える。こうして二つ
のパターンの重ね合わせ操作つまり２つのパターンの積
を取る時には両パターンの時間長レジスタと圧縮情報を
参照しな力七、ら積を取るようにする。

例えば第１図のパターンでは第１フレームのパターンは
入力の第１フレームと積がとられ、第２フレームのパタ
ーンは入力の第２、第３、第４フレームと積がとられる
ことになる。なお、ここでは入力音声長を伸ばすことを
述べたが辞書の単語パターンを伸ばす場合には圧縮情報
に１を加えれば良く縮める場合は１を引けは°良い。第
２図の例ではこうして一つの単語パターンとの類似をめ
れば時間長レジスタをリセットして次の単語パターンの
照合へ移る。

以下に、重ね合わせて類似度を算出する部分をＦＯＲＴ
ＲＡＮでサブルーチンプログラムにして示すが、ＤＩＣ
Ｔは辞書の単語パターン、ＩＮＰは、入カバターン、Ｎ
Ｆは時間長を一致させた後のフレーム数、ＩＤは類似度
である。

５ＵＢＲＯＵＴＩＮＥ　５ＵＰＥＲ（Ｄ［ＣＴ、ＩＮＰ
、ＮＦ、１０ＩＮＴＥＧＥＲＤＩＣＴ（９，’１ＯＯ）
、ＩＮＰ（９，１００）Ｉｄ＝ＯＪ３＝１Ｄｉ５　１０　Ｊ＝Ｉ、ＮＦＪ１≧ＩＮＰ（９，Ｊ）Ｄｉｉ　１０　Ｊ２＝ｌ、ＪＩＪＤ−旧ＣＴ（９，Ｊ３）−１１Ｆ（ＪＤ、ＬＴ、０）　Ｇｉ５　Ｔ５　５Ｄ６１０Ｉ
−１，８ＩＤ＝ＤＩＣＴ（１、Ｊ３）木ＴＮＰ（１，Ｊ２）　＋
　ＩＤＧδ　Ｔｉ５　ＩＱ５　ｊ３＝Ｊ３＋　１１０　Ｃ０ＮＴＩＮＵＥＥＴＵＲＮＮＤ防−−−浬以−１−の説明から明らかなように、本発明によると、
無駄な演算かなくなり、効率の良いパターン照合が実現
できる゛。

【図面の簡単な説明】

ｉＲ１図は、従来のパターン照合方式の一例を説−明す
るだめの図、第２図は、本発明によるパターン照合方式
の一例を説明するための電気的ブロック線図である。ｌ・・・マイク、２・・・フィルタ群、３・・・区間検
出部、４・・・レジスタ、４ａ・・・時間長レジスタ、
５・・・照合部、６・・・辞書部、７・・・パターン伸
縮部、８・・・重ね合せ類似度判定部、９・・・リセッ
ト部、１０・・・結果表示部。

Claims

【特許請求の範囲】

高声を時間と周波数の２次元面子のパターンとして表わ
し、このパターンの時間軸サンプルに対応するレジスタ
を有し、複数のパターンの照合に際し、両パターンが有
する該レジスタ内にパターンの伸縮情報を記入した後に
この情報に基づいて方のパターンの−・つの時間サンプ
ルを他方のパターンの複数に対応づけたり或いは対応光
をなくしたりすることによって照合することを特徴とす
るパターン照合方式。