JPH0229700A

JPH0229700A - 音声パターン照合方式

Info

Publication number: JPH0229700A
Application number: JP63179832A
Authority: JP
Inventors: Harutake Yasuda; 安田　晴剛
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1988-07-19
Filing date: 1988-07-19
Publication date: 1990-01-31

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】伎宜分災本発明は、音声認識におけるパターン照合方式％式％従来、音声認識における非線形伸縮法としてＤＰマツチ
ング方式があるが、これは演算量が大きいため、簡易な
方式では線形伸縮を用いる。しかしながら、線形伸縮は
マツチングパスが一意に決定されるためその精度が悪く
なる。そのため、例えばＢ　Ｔ　Ｓ　Ｐ　（Ｂ　１ｎａ
ｒｙ　Ｔ　１ａｅ−Ｓ　ｐｅｃｔｒｕｍ　Ｐａｔｔｅｒ
ｎ）方式などでは無音区間に着目した部分線形伸縮を導
入し、より精度を向上させようとしている（室井他：電
子通信学会誌　Ｖｏｌ−Ｊ　６９−　Ａ　　Ｎｏ。

１　１９８６、Ｊａｎ　ｒ部分的な線形伸縮と荷重平均
辞書を用いる方法」）、シかしながら１水力式は無音区
間によって形成される有音ブロックに基いており、無音
区間が存在しない場合は無効となり、又、存在しても有
音ブロックが長い場合、さほど照合に寄与しない場合が
多々存在する。

第３図は、−船釣な特定話者方式の音声認識装置の構成
を説明するための図で、図中、１はマイクロフォン、２
は前処理部、３は特徴抽出部、４は登録部、５は音声区
間検出部、６は認識部、７は辞書メモリ、８は結果出力
部で、マイクロフォン１より入力された音声を前処理部
２でレベル補正などを行ったあと、特徴抽出部３におい
て例えばパワースペクトルやＬＰＧケプストラムなどの
特徴量を抽出し、それを音声区間検出部５によって得ら
れた音声区間信号に基いてパターン照合を行う、このパ
ターンは登録時には単一発声又は数回の発声の特徴サン
プルを音声辞書として辞書メモリ７に登録され、認識時
に認識部６において入カバターンとパターン照合を行っ
て認識結果８を求める。これらの登録時、認識演算は先
述した様にシステムの簡素化を計るために線形伸縮が用
いられている場合があり、この場合、第４図に示す様に
マツチングパスＡは始点Ｂと終点Ｃを一本の直線で結ぶ
事になる。この様に線形伸縮を用いた場合、−意に音声
の始点と終点を結ぶため、−単語内の時間的変動に対し
て比較的吸収できない。

この点に鑑みてより正確にその時間変動を吸収するため
に導入されているのが無音区間に基いた部分線形伸縮法
で、第５図に示す様に、音声の音声区間信号に基いて検
出された入力の有音ブロックＩＢ０．ＩＢよとあらかじ
め登録もしくは記憶されている辞書データのＤＢ、、Ｄ
Ｂ、と図に示す様に対応するブロック間ＩＢ０ｅＤＢ、
、ＩＢ工０ＤＢ０で部分線形伸縮を行い、パターン照合
する事により、より正確に照合演算を行うものである。

しかしながら、全ての単語に無音区間が存在している訳
ではなく、更に同じ有音区間内においても時間的変動を
有している事は周知の事実である。

且−一五本発明は、上述のごとき実情に鑑みてなされたもので、
線形伸縮を用いる音声パターン照合方式において、より
正確にパターン照合を行う事を目的としてなされたもの
である。

盈−一双本発明は、上記目的を達成するために、音声波形からあ
るサンプル周期で音声の特徴量を得る手段と、その特徴
量又は別の特徴量からその音声の音声区間を生成する手
段を具備し、その得られた一発声による特徴パターン列
と他発声による特徴パターン列を音声の始端、終端によ
り線型に伸縮する手段と、その伸縮に基いて照合する手
段を有し、更に、一発声内に無音区間が存在する場合、
その無音区間に着目し、それぞれの有音区間同志をパタ
ーン照合する部分線形伸縮を有するパターン照合方式に
おいて、無音区間に基づく・有音区間内の第２の特徴量
を節として、線形伸縮を行う事を特徴としたものである
。以下１本発明の実施例に基いて説明する。

第１図は、本発明の一実施例を説明するための構成図で
、図中、１１はマイクロフォン、１２は前処理部、１３
は特徴抽出部、１４は人カバターン生成部、１５は部分
線形伸縮部、１６は音声区間抽・山部、１７は辞書メモ
リ、１８はパターン照合部、１９は類似度演算部、２０
は結果出力部で、本発明は、上記従来技術の欠点に対し
て、無音区間に基く有音区間内に更に第２の特徴量を用
いて、それに基いて、さらに細い部分線形伸縮を行うこ
とによりより正確にパターン照合を行なわせるようにし
たものである。

今、第２図に示す様な入力と辞書のパターン照合を行う
場合、先述の方式において示した様にＩＢ、ＭＤＢ、、
ＩＢ工４＋ＤＢ、の部分線形伸縮−を行うが、本発明に
おいては、この部分線形内、に更に第２の特徴量を用い
、そのブロックを分割する。

例えば、第２図に示す様に、無音区間Ｓが存在する場合
、その音声パワーを見て行くときに必ずパワーの最高点
Ｐが存在する。このパワーのピーク点を節として更に細
い部分線形伸縮を行う、つまり日本語などの場合、はと
んどの単語がＣｖ（子音母音）の連絡でできており、そ
の母音の部分がピーク点となる。従って、２つのパター
ン間の照合を行う際に無音区間と、このパワーピーク点
を節として行えば更に細かいパターン照合を行う事が可
能となる。

なお１以上においては例としてパワー包絡信号を用いた
が、もちろん、その他の有効な特徴量でも問題はない。

仇−一来以上の説明から明らかなように、本発明によると、従来
の無音区間に基づいた部分線形伸縮に対し、更に細かな
線形伸縮を導入し、より正確なパターン照合を行う事が
可能となった。

【図面の簡単な説明】

第１図は、本発明の一実施例を説明するための構成図、
第２図は、本発明の動作説明をするためのタイムチャー
ト、第３図は、−船釣な特定話者方式の音声認識装置の
一例を説明するための構成図、第４図及び第５図は、そ
の動作説明をするための図である。１１・・・マイクロフォン、１２・・・前処理部、１３
・・・特徴抽出部、１４・・・入カバターン生成部、１
５・・・部分線形伸縮部、１６・・・音声区間抽出部、
１７・・・辞書メモリ、１８・・・パターン照合部、１
９・・・類似度演算部、２０・・・結果出力部。

Claims

【特許請求の範囲】

１、音声波形からあるサンプル周期で音声の特徴量を得
る手段と、その特徴量又は別の特徴量からその音声の音
声区間を生成する手段を具備し、その得られた一発声に
よる特徴パターン列と他発声による特徴パターン列を音
声の始端、終端により線型に伸縮する手段と、その伸縮
に基いて照合する手段を有し、更に、一発声内に無音区
間が存在する場合、その無音区間に着目し、それぞれの
有音区間同志をパターン照合する部分線形伸縮を有する
パターン照合方式において、無音区間に基づく有音区間
内の第２の特徴量を節として、線形伸縮を行う事を特徴
とする音声パターン照合方式。