JPH0552514B2

JPH0552514B2 -

Info

Publication number: JPH0552514B2
Application number: JP58136421A
Authority: JP
Inventors: Yoshiteru Mifune
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1983-07-25
Filing date: 1983-07-25
Publication date: 1993-08-05
Also published as: JPS6027000A

Description

【発明の詳細な説明】産業上の利用分野本発明は、連続発声された日本語を認識する場
合に、母音定常部中心を検出しておき、母音定常
部中心〜母音定常部中心の範囲に対して前もつて
登録したV₁CV₂標準パタンマツチングさせて、
語中の音節を認識する場合等に用いられるパタン
マツチング方法に関する。

従来例の構成とその問題点従来の語中の音韻もしくは音節を認識する方式
は、簡単なものとしては、フレーム毎に前もつて
登録された音素パタン｛例えば、５母音｜Ａ｜｜
ｉ｜｜ｕ｜｜Ｅ｜｜ｏ｜、子音｜ｓ｜｜ｃ｜｜ｈ
｜，｜ｐ｜｜ｔ｜｜ｋ｜，｜ｂ｜｜ｄ｜｜ｇ｜，｜
ｍ｜｜ｎ｜｜ｒ｜等｝との距離を計算して音素識
別した結果をマージ例えば連続音素は１音素に代
表し、不連続音素は切り捨てする等の処理をし
て、認識結果としていた。しかしこの方式では調
音結合等による子音の変形が起こるために構成は
簡単であるが、音韻区間が不明瞭なために認識率
は、著しく低下する原因となつていた。さらに認
識率を向上させる認識方式としては、語中音節の
認識させるために、CV音節を前もつて標準パタ
ンとして登録しておき、２段DP手法と呼ばれて
いる。個々の登録CV音節とは時間軸伸縮を行つ
た上で、全体として最適なCV音節系列を決定す
る、パタンマツチング手法を用いて、音節系列と
して認識結果を求めているものなどがあつた。し
かしこのような２段DP手法を用いる方法では、
実時間処理を行うためには、莫大な計算量を実行
するため専用ハードウエアを必要とするためにコ
スト低減が困難でありまた、種々の方法に比べて
認識率が優れているものの、調音結合を吸収する
ためにはVCV音節パタンも必要でありまた、２
段DP手法に固有の挿入、脱落誤り（例えば２音
節データを３音節としてマツチングして誤認識す
る。２音節データを１音節とマツチングして誤認
識する）が発生することがあり対策処理が困難で
あるため認識率にも限界があつた。

発明の目的本発明は上記従来の問題を解決し、パタンマツ
チングによる認識率を向上させることを目的とす
る。

発明の構成本発明は予め記憶したV₁CV₂標準パタンとパ
タンマツチングを行う場合において、V₁CV₂標
準パタンV₁Ｃセグメント境界のポインタ及び
CV₂セグメント境界のポインタを設けておき、標
準パタンのV₁先頭〜V₁Ｃセグメント境界のマツ
チング開始フレームとCV₂セグメント境界〜V₂
終了のマツチング終了フレームに自由度を持たせ
ることによつて、上記目的を達成するものであ
る。

実施例の説明以下に本発明を適用した実施例について説明す
る。

第１図において、１は入力端子より入力された
信号をデイジタル信号に変換するＡ／Ｄ変換器、
２は電力系列変換手段、３は入力信号を特徴ベク
トルの時系列パタンに変換する特徴系列変換手段
である。４は入力音声の電力系列によつて長い無
音を検出して音声間を検出する音声区間検出手段
である。５は音声区間検出手段４によつて切り出
される音声区間において電力系列によつて短い無
音を検出して無音区間を検出する無音区間検出手
段である。６は入力音声のピーク電力を検出する
ピーク電力検出手段６ａと特徴ベクトル系列のベ
クトル毎に母音識別を行う母音識別手段６ｂから
なり、ピーク電力の前後のフレームにおける母音
識別結果の同一母音中心から、母音定常部中心を
検出する母音定常部中心検出部である。７は入力
音声を特徴ベクトルの形でCV音節７ａもしくは、
V₁CV₂音節７ｂの単位で記憶する標準パタン記
憶部である。８は平均発声長Ｌのフレーム分だ
け、母音認識結果の系列を記憶する母音系列記憶
する特徴系列記憶部８ｂからなる記憶部である。
９は特徴ベクトル記憶部８ｂにおける語頭４ａも
しくは無音区間終了５ｂから平均発声長Ｌのフレ
ーム以内の母音定常部中心６ｃまでの区間の場合
にはCV標準パタン７ａとパタンマツチングを行
い、平均発声長Ｌのフレーム以内の母音定常部中
心６ｃ〜母音定常部中心６ｃの区間の場合には
V₁CV₂標準パタン７ｂとパタンマツチングを行
うパタンマツチング手法である。

１０は音声区間検出手段４、無音区間検出手段
５、母音定常部中心検出部６、記憶部８およびパ
タンマツチング手段９を全体的に制御して、入力
音声の母音定常部中心に語頭や無音区間の情報を
使用して、CV音節とV₁CV₂音節とのパタンマツ
チング結果を接続して、CV音節のストリングス
として認識結果を出力する総合制御手段である。
１２は音声認識動作中には端子１２ａに、標準パ
タン作成時には端子１２ｂに接続される切換スイ
ツチである。

次にこの実施例の動作について第２図と共に説
明する。入力端子１１に入力された音声信号は
Ａ／Ｄ変換器１によりデイジタル信号に変換さ
れ、電力系列変換手段２および特徴系列変換手段
３に加えられる。電力系列変換手段２の出力の一
例を第２図イに示す。この波形は入力音声が｜ヒ
バリが空に｜と発声された場合のものである。そ
の音声信号の語頭４ａ〜語尾４ｂは音声区間検出
手段４によつて検出される。一定の閾値以上とな
る電力系列が一定フレーム長以上連続している期
間で、かつ母音識別手段６ｂによつて識別された
母音が同一種類で一定フレーム長以上連続する場
合に、ピーク電力検出手段６ａによつて母音系列
の中心を検出する。その検出点をiV₁，iV₂，…
…，iV₆として第２図に示している。また母音定
常部中心が検出される毎に、現在の母音定常部中
心から平均発声速度長Ｌ逆上つた時点に語頭もし
くは無音区間が検出される場合には、CV標準パ
タン７ａとパタンマツチングを行い、平均発声速
度長Ｌ逆上つた時点に語頭も無音区間も検出され
ない場合には、平均発声長Ｌフレーム以内の母音
定常部中心と現在の母音定常部中心のすべての組
合せの範囲に対してV₁CV₂標準パタンとパタン
マツチングを行う。このようにして第２図ハのよ
うな認識を行ない、ニに示す結果が出力される。

次にこの実施例におけるマツチング方式につい
て説明する。

前記のパタンマツチング装置９においてマツチ
ングをとるための距離尺度としては、コークリツ
ド距離、市街距離、DPマツチング等が上げられ
る。しかしDPマツチングを使用したとしても、
標準パタンの発声時点の発声速度と音声入力時点
の発声速度が異なること、発声速度が同一であつ
たとしても母音の継続時間長が種々異なる事や、
母音定常部中心位置の検出誤りが生じる事がある
ために何かの対策が必要となる。そこで母音区間
にマツチング範囲の自由度を持たせることが考え
られる。第３図および第４図は、CVパタンマツ
チング及びV₁CV₂パタンマツチングの方式を説
明するものである。まずCV標準パタンとのマツ
チングについて第３図と共に説明する。同図にお
いて入力音声の語頭もしくは無音区間終了から母
音定常部中心の範囲に対して、例えば、第５図
イ，ロに示すようにマツチングバスのようなパス
距離計算を行う場合にCV標準パタンのセグメン
ト境界から母音定常部中心までの範囲を終端自由
とする。

すなわち、標準パタンＡの特徴ベクトルの各フ
レームと入力音声パターンＢの特徴ベクトルの各
フレームとを比較するに際し、終端自由区間Ｔを
設けるようにしたものである。この結果、母音部
の長さの変動に起因するパタンマツチングのミス
をなくすことができる。

また第４図はVCV標準パタンとのマツチング
の場合を示している。同図において入力音声の語
頭もしくは無音区間の存在しない母音定常部中心
〜母音定常部中心の範囲に対して例えば第５図に
示すようなマツチングパスで距離計算を行う場合
に、V₁CV₂標準パタンのV₁の開始からV₁Ｃセグ
メント境界の範囲を始端点自由区間T₁としまた
CV₂セグメント境界からV₁の終了までの範囲を
終端点自由区間T₂としている。

発明の効果上記実施例より明らかなように本発明によるパ
タンマツチング方法によれば認識処理は母音定常
部中心毎に行なうものとして、語頭および無音区
間終了から前もつて定めた平均発声長内の母音定
常部中心とはCV標準パタンとCVセグメント境界
〜母音定常部中心は終端自由とし、現在の母音定
常部中心から前もつて定めた平均発声長逆上つた
範囲に語頭や無音区間が検出されない場合には、
範囲内での母音定常部中心との組合せの範囲には
V₁CV₂標準パタンとV₁の開始フレームとV₁Ｃセ
グメント境界の範囲を始端自由としてCV₂セグメ
ント境界とV₂の終了フレームの範囲を終端自由
とすることによつて、標準パタン発声時と入力音
声発声時の速度速動を吸収し、また、母音定常部
中心位置検出誤りを吸収することができる。

【図面の簡単な説明】

第１図は本発明によるパターンマツチング方法
を適用した音声認識装置のブロツク図、第２図は
この装置における処理動作の説明図、第３図は入
力音声とCV標準パタンのマツチング処理を示す
図、第４図は入力音声とV₁CV₂標準パタンのマ
ツチング処理を示す図、第５図イ，ロはマツチン
グパスを示す図である。２……電力系列変換手段、３……特徴系列変換
手段、７……標準パタン記憶部、８……記憶部、
９……パタンマツチング手段。

Claims

【特許請求の範囲】

１入力音声を特徴ベクトルの時系列パタンに変
換し、前記特徴ベクトル毎に母音識別と電力値計
算を行つて母音定常部中心、語頭及び語中の無音
区間を検出し、前記語頭及び語中の無音区間とそ
れに続く前記母音定常部中心までの範囲には音節
パタン記憶手段に記憶されたCV音節の標準パタ
ンとマツチングを行い、前記の範囲でなく前記母
音定常部中心が２つ以上連続する範囲にはVCV
音節（但しＣは子音、Ｖは母音）の標準パタンと
マツチングを行うように切換えを行い、前記標準
パタン作成時にCV音節では子音と母音の境界を、
またVCV音節では前母音と子音の境界ならびに
子音と後母音の境界を前もつて検出しておき、前
記CV音節のマツチングを行う場合には子音と母
音の境界から母音までの範囲を終端自由にしてマ
ツチングを行い、前記VCV音節のマツチングを
行う場合には前母音から前母音と子音の境界まで
は始端自由に、また子音と後母音の境界から後母
音までは終端自由にしてマツチングを行うことを
特徴とするパタンマツチング方法。