JPH0552514B2 - - Google Patents
Info
- Publication number
- JPH0552514B2 JPH0552514B2 JP58136421A JP13642183A JPH0552514B2 JP H0552514 B2 JPH0552514 B2 JP H0552514B2 JP 58136421 A JP58136421 A JP 58136421A JP 13642183 A JP13642183 A JP 13642183A JP H0552514 B2 JPH0552514 B2 JP H0552514B2
- Authority
- JP
- Japan
- Prior art keywords
- vowel
- syllables
- matching
- consonant
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 241000036848 Porzana carolina Species 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、連続発声された日本語を認識する場
合に、母音定常部中心を検出しておき、母音定常
部中心〜母音定常部中心の範囲に対して前もつて
登録したV1CV2標準パタンマツチングさせて、
語中の音節を認識する場合等に用いられるパタン
マツチング方法に関する。
合に、母音定常部中心を検出しておき、母音定常
部中心〜母音定常部中心の範囲に対して前もつて
登録したV1CV2標準パタンマツチングさせて、
語中の音節を認識する場合等に用いられるパタン
マツチング方法に関する。
従来例の構成とその問題点
従来の語中の音韻もしくは音節を認識する方式
は、簡単なものとしては、フレーム毎に前もつて
登録された音素パタン{例えば、5母音|A||
i||u||E||o|、子音|s||c||h
|,|p||t||k|,|b||d||g|,|
m||n||r|等}との距離を計算して音素識
別した結果をマージ例えば連続音素は1音素に代
表し、不連続音素は切り捨てする等の処理をし
て、認識結果としていた。しかしこの方式では調
音結合等による子音の変形が起こるために構成は
簡単であるが、音韻区間が不明瞭なために認識率
は、著しく低下する原因となつていた。さらに認
識率を向上させる認識方式としては、語中音節の
認識させるために、CV音節を前もつて標準パタ
ンとして登録しておき、2段DP手法と呼ばれて
いる。個々の登録CV音節とは時間軸伸縮を行つ
た上で、全体として最適なCV音節系列を決定す
る、パタンマツチング手法を用いて、音節系列と
して認識結果を求めているものなどがあつた。し
かしこのような2段DP手法を用いる方法では、
実時間処理を行うためには、莫大な計算量を実行
するため専用ハードウエアを必要とするためにコ
スト低減が困難でありまた、種々の方法に比べて
認識率が優れているものの、調音結合を吸収する
ためにはVCV音節パタンも必要でありまた、2
段DP手法に固有の挿入、脱落誤り(例えば2音
節データを3音節としてマツチングして誤認識す
る。2音節データを1音節とマツチングして誤認
識する)が発生することがあり対策処理が困難で
あるため認識率にも限界があつた。
は、簡単なものとしては、フレーム毎に前もつて
登録された音素パタン{例えば、5母音|A||
i||u||E||o|、子音|s||c||h
|,|p||t||k|,|b||d||g|,|
m||n||r|等}との距離を計算して音素識
別した結果をマージ例えば連続音素は1音素に代
表し、不連続音素は切り捨てする等の処理をし
て、認識結果としていた。しかしこの方式では調
音結合等による子音の変形が起こるために構成は
簡単であるが、音韻区間が不明瞭なために認識率
は、著しく低下する原因となつていた。さらに認
識率を向上させる認識方式としては、語中音節の
認識させるために、CV音節を前もつて標準パタ
ンとして登録しておき、2段DP手法と呼ばれて
いる。個々の登録CV音節とは時間軸伸縮を行つ
た上で、全体として最適なCV音節系列を決定す
る、パタンマツチング手法を用いて、音節系列と
して認識結果を求めているものなどがあつた。し
かしこのような2段DP手法を用いる方法では、
実時間処理を行うためには、莫大な計算量を実行
するため専用ハードウエアを必要とするためにコ
スト低減が困難でありまた、種々の方法に比べて
認識率が優れているものの、調音結合を吸収する
ためにはVCV音節パタンも必要でありまた、2
段DP手法に固有の挿入、脱落誤り(例えば2音
節データを3音節としてマツチングして誤認識す
る。2音節データを1音節とマツチングして誤認
識する)が発生することがあり対策処理が困難で
あるため認識率にも限界があつた。
発明の目的
本発明は上記従来の問題を解決し、パタンマツ
チングによる認識率を向上させることを目的とす
る。
チングによる認識率を向上させることを目的とす
る。
発明の構成
本発明は予め記憶したV1CV2標準パタンとパ
タンマツチングを行う場合において、V1CV2標
準パタンV1Cセグメント境界のポインタ及び
CV2セグメント境界のポインタを設けておき、標
準パタンのV1先頭〜V1Cセグメント境界のマツ
チング開始フレームとCV2セグメント境界〜V2
終了のマツチング終了フレームに自由度を持たせ
ることによつて、上記目的を達成するものであ
る。
タンマツチングを行う場合において、V1CV2標
準パタンV1Cセグメント境界のポインタ及び
CV2セグメント境界のポインタを設けておき、標
準パタンのV1先頭〜V1Cセグメント境界のマツ
チング開始フレームとCV2セグメント境界〜V2
終了のマツチング終了フレームに自由度を持たせ
ることによつて、上記目的を達成するものであ
る。
実施例の説明
以下に本発明を適用した実施例について説明す
る。
る。
第1図において、1は入力端子より入力された
信号をデイジタル信号に変換するA/D変換器、
2は電力系列変換手段、3は入力信号を特徴ベク
トルの時系列パタンに変換する特徴系列変換手段
である。4は入力音声の電力系列によつて長い無
音を検出して音声間を検出する音声区間検出手段
である。5は音声区間検出手段4によつて切り出
される音声区間において電力系列によつて短い無
音を検出して無音区間を検出する無音区間検出手
段である。6は入力音声のピーク電力を検出する
ピーク電力検出手段6aと特徴ベクトル系列のベ
クトル毎に母音識別を行う母音識別手段6bから
なり、ピーク電力の前後のフレームにおける母音
識別結果の同一母音中心から、母音定常部中心を
検出する母音定常部中心検出部である。7は入力
音声を特徴ベクトルの形でCV音節7aもしくは、
V1CV2音節7bの単位で記憶する標準パタン記
憶部である。8は平均発声長Lのフレーム分だ
け、母音認識結果の系列を記憶する母音系列記憶
する特徴系列記憶部8bからなる記憶部である。
9は特徴ベクトル記憶部8bにおける語頭4aも
しくは無音区間終了5bから平均発声長Lのフレ
ーム以内の母音定常部中心6cまでの区間の場合
にはCV標準パタン7aとパタンマツチングを行
い、平均発声長Lのフレーム以内の母音定常部中
心6c〜母音定常部中心6cの区間の場合には
V1CV2標準パタン7bとパタンマツチングを行
うパタンマツチング手法である。
信号をデイジタル信号に変換するA/D変換器、
2は電力系列変換手段、3は入力信号を特徴ベク
トルの時系列パタンに変換する特徴系列変換手段
である。4は入力音声の電力系列によつて長い無
音を検出して音声間を検出する音声区間検出手段
である。5は音声区間検出手段4によつて切り出
される音声区間において電力系列によつて短い無
音を検出して無音区間を検出する無音区間検出手
段である。6は入力音声のピーク電力を検出する
ピーク電力検出手段6aと特徴ベクトル系列のベ
クトル毎に母音識別を行う母音識別手段6bから
なり、ピーク電力の前後のフレームにおける母音
識別結果の同一母音中心から、母音定常部中心を
検出する母音定常部中心検出部である。7は入力
音声を特徴ベクトルの形でCV音節7aもしくは、
V1CV2音節7bの単位で記憶する標準パタン記
憶部である。8は平均発声長Lのフレーム分だ
け、母音認識結果の系列を記憶する母音系列記憶
する特徴系列記憶部8bからなる記憶部である。
9は特徴ベクトル記憶部8bにおける語頭4aも
しくは無音区間終了5bから平均発声長Lのフレ
ーム以内の母音定常部中心6cまでの区間の場合
にはCV標準パタン7aとパタンマツチングを行
い、平均発声長Lのフレーム以内の母音定常部中
心6c〜母音定常部中心6cの区間の場合には
V1CV2標準パタン7bとパタンマツチングを行
うパタンマツチング手法である。
10は音声区間検出手段4、無音区間検出手段
5、母音定常部中心検出部6、記憶部8およびパ
タンマツチング手段9を全体的に制御して、入力
音声の母音定常部中心に語頭や無音区間の情報を
使用して、CV音節とV1CV2音節とのパタンマツ
チング結果を接続して、CV音節のストリングス
として認識結果を出力する総合制御手段である。
12は音声認識動作中には端子12aに、標準パ
タン作成時には端子12bに接続される切換スイ
ツチである。
5、母音定常部中心検出部6、記憶部8およびパ
タンマツチング手段9を全体的に制御して、入力
音声の母音定常部中心に語頭や無音区間の情報を
使用して、CV音節とV1CV2音節とのパタンマツ
チング結果を接続して、CV音節のストリングス
として認識結果を出力する総合制御手段である。
12は音声認識動作中には端子12aに、標準パ
タン作成時には端子12bに接続される切換スイ
ツチである。
次にこの実施例の動作について第2図と共に説
明する。入力端子11に入力された音声信号は
A/D変換器1によりデイジタル信号に変換さ
れ、電力系列変換手段2および特徴系列変換手段
3に加えられる。電力系列変換手段2の出力の一
例を第2図イに示す。この波形は入力音声が|ヒ
バリが空に|と発声された場合のものである。そ
の音声信号の語頭4a〜語尾4bは音声区間検出
手段4によつて検出される。一定の閾値以上とな
る電力系列が一定フレーム長以上連続している期
間で、かつ母音識別手段6bによつて識別された
母音が同一種類で一定フレーム長以上連続する場
合に、ピーク電力検出手段6aによつて母音系列
の中心を検出する。その検出点をiV1,iV2,…
…,iV6として第2図に示している。また母音定
常部中心が検出される毎に、現在の母音定常部中
心から平均発声速度長L逆上つた時点に語頭もし
くは無音区間が検出される場合には、CV標準パ
タン7aとパタンマツチングを行い、平均発声速
度長L逆上つた時点に語頭も無音区間も検出され
ない場合には、平均発声長Lフレーム以内の母音
定常部中心と現在の母音定常部中心のすべての組
合せの範囲に対してV1CV2標準パタンとパタン
マツチングを行う。このようにして第2図ハのよ
うな認識を行ない、ニに示す結果が出力される。
明する。入力端子11に入力された音声信号は
A/D変換器1によりデイジタル信号に変換さ
れ、電力系列変換手段2および特徴系列変換手段
3に加えられる。電力系列変換手段2の出力の一
例を第2図イに示す。この波形は入力音声が|ヒ
バリが空に|と発声された場合のものである。そ
の音声信号の語頭4a〜語尾4bは音声区間検出
手段4によつて検出される。一定の閾値以上とな
る電力系列が一定フレーム長以上連続している期
間で、かつ母音識別手段6bによつて識別された
母音が同一種類で一定フレーム長以上連続する場
合に、ピーク電力検出手段6aによつて母音系列
の中心を検出する。その検出点をiV1,iV2,…
…,iV6として第2図に示している。また母音定
常部中心が検出される毎に、現在の母音定常部中
心から平均発声速度長L逆上つた時点に語頭もし
くは無音区間が検出される場合には、CV標準パ
タン7aとパタンマツチングを行い、平均発声速
度長L逆上つた時点に語頭も無音区間も検出され
ない場合には、平均発声長Lフレーム以内の母音
定常部中心と現在の母音定常部中心のすべての組
合せの範囲に対してV1CV2標準パタンとパタン
マツチングを行う。このようにして第2図ハのよ
うな認識を行ない、ニに示す結果が出力される。
次にこの実施例におけるマツチング方式につい
て説明する。
て説明する。
前記のパタンマツチング装置9においてマツチ
ングをとるための距離尺度としては、コークリツ
ド距離、市街距離、DPマツチング等が上げられ
る。しかしDPマツチングを使用したとしても、
標準パタンの発声時点の発声速度と音声入力時点
の発声速度が異なること、発声速度が同一であつ
たとしても母音の継続時間長が種々異なる事や、
母音定常部中心位置の検出誤りが生じる事がある
ために何かの対策が必要となる。そこで母音区間
にマツチング範囲の自由度を持たせることが考え
られる。第3図および第4図は、CVパタンマツ
チング及びV1CV2パタンマツチングの方式を説
明するものである。まずCV標準パタンとのマツ
チングについて第3図と共に説明する。同図にお
いて入力音声の語頭もしくは無音区間終了から母
音定常部中心の範囲に対して、例えば、第5図
イ,ロに示すようにマツチングバスのようなパス
距離計算を行う場合にCV標準パタンのセグメン
ト境界から母音定常部中心までの範囲を終端自由
とする。
ングをとるための距離尺度としては、コークリツ
ド距離、市街距離、DPマツチング等が上げられ
る。しかしDPマツチングを使用したとしても、
標準パタンの発声時点の発声速度と音声入力時点
の発声速度が異なること、発声速度が同一であつ
たとしても母音の継続時間長が種々異なる事や、
母音定常部中心位置の検出誤りが生じる事がある
ために何かの対策が必要となる。そこで母音区間
にマツチング範囲の自由度を持たせることが考え
られる。第3図および第4図は、CVパタンマツ
チング及びV1CV2パタンマツチングの方式を説
明するものである。まずCV標準パタンとのマツ
チングについて第3図と共に説明する。同図にお
いて入力音声の語頭もしくは無音区間終了から母
音定常部中心の範囲に対して、例えば、第5図
イ,ロに示すようにマツチングバスのようなパス
距離計算を行う場合にCV標準パタンのセグメン
ト境界から母音定常部中心までの範囲を終端自由
とする。
すなわち、標準パタンAの特徴ベクトルの各フ
レームと入力音声パターンBの特徴ベクトルの各
フレームとを比較するに際し、終端自由区間Tを
設けるようにしたものである。この結果、母音部
の長さの変動に起因するパタンマツチングのミス
をなくすことができる。
レームと入力音声パターンBの特徴ベクトルの各
フレームとを比較するに際し、終端自由区間Tを
設けるようにしたものである。この結果、母音部
の長さの変動に起因するパタンマツチングのミス
をなくすことができる。
また第4図はVCV標準パタンとのマツチング
の場合を示している。同図において入力音声の語
頭もしくは無音区間の存在しない母音定常部中心
〜母音定常部中心の範囲に対して例えば第5図に
示すようなマツチングパスで距離計算を行う場合
に、V1CV2標準パタンのV1の開始からV1Cセグ
メント境界の範囲を始端点自由区間T1としまた
CV2セグメント境界からV1の終了までの範囲を
終端点自由区間T2としている。
の場合を示している。同図において入力音声の語
頭もしくは無音区間の存在しない母音定常部中心
〜母音定常部中心の範囲に対して例えば第5図に
示すようなマツチングパスで距離計算を行う場合
に、V1CV2標準パタンのV1の開始からV1Cセグ
メント境界の範囲を始端点自由区間T1としまた
CV2セグメント境界からV1の終了までの範囲を
終端点自由区間T2としている。
発明の効果
上記実施例より明らかなように本発明によるパ
タンマツチング方法によれば認識処理は母音定常
部中心毎に行なうものとして、語頭および無音区
間終了から前もつて定めた平均発声長内の母音定
常部中心とはCV標準パタンとCVセグメント境界
〜母音定常部中心は終端自由とし、現在の母音定
常部中心から前もつて定めた平均発声長逆上つた
範囲に語頭や無音区間が検出されない場合には、
範囲内での母音定常部中心との組合せの範囲には
V1CV2標準パタンとV1の開始フレームとV1Cセ
グメント境界の範囲を始端自由としてCV2セグメ
ント境界とV2の終了フレームの範囲を終端自由
とすることによつて、標準パタン発声時と入力音
声発声時の速度速動を吸収し、また、母音定常部
中心位置検出誤りを吸収することができる。
タンマツチング方法によれば認識処理は母音定常
部中心毎に行なうものとして、語頭および無音区
間終了から前もつて定めた平均発声長内の母音定
常部中心とはCV標準パタンとCVセグメント境界
〜母音定常部中心は終端自由とし、現在の母音定
常部中心から前もつて定めた平均発声長逆上つた
範囲に語頭や無音区間が検出されない場合には、
範囲内での母音定常部中心との組合せの範囲には
V1CV2標準パタンとV1の開始フレームとV1Cセ
グメント境界の範囲を始端自由としてCV2セグメ
ント境界とV2の終了フレームの範囲を終端自由
とすることによつて、標準パタン発声時と入力音
声発声時の速度速動を吸収し、また、母音定常部
中心位置検出誤りを吸収することができる。
第1図は本発明によるパターンマツチング方法
を適用した音声認識装置のブロツク図、第2図は
この装置における処理動作の説明図、第3図は入
力音声とCV標準パタンのマツチング処理を示す
図、第4図は入力音声とV1CV2標準パタンのマ
ツチング処理を示す図、第5図イ,ロはマツチン
グパスを示す図である。 2……電力系列変換手段、3……特徴系列変換
手段、7……標準パタン記憶部、8……記憶部、
9……パタンマツチング手段。
を適用した音声認識装置のブロツク図、第2図は
この装置における処理動作の説明図、第3図は入
力音声とCV標準パタンのマツチング処理を示す
図、第4図は入力音声とV1CV2標準パタンのマ
ツチング処理を示す図、第5図イ,ロはマツチン
グパスを示す図である。 2……電力系列変換手段、3……特徴系列変換
手段、7……標準パタン記憶部、8……記憶部、
9……パタンマツチング手段。
Claims (1)
- 1 入力音声を特徴ベクトルの時系列パタンに変
換し、前記特徴ベクトル毎に母音識別と電力値計
算を行つて母音定常部中心、語頭及び語中の無音
区間を検出し、前記語頭及び語中の無音区間とそ
れに続く前記母音定常部中心までの範囲には音節
パタン記憶手段に記憶されたCV音節の標準パタ
ンとマツチングを行い、前記の範囲でなく前記母
音定常部中心が2つ以上連続する範囲にはVCV
音節(但しCは子音、Vは母音)の標準パタンと
マツチングを行うように切換えを行い、前記標準
パタン作成時にCV音節では子音と母音の境界を、
またVCV音節では前母音と子音の境界ならびに
子音と後母音の境界を前もつて検出しておき、前
記CV音節のマツチングを行う場合には子音と母
音の境界から母音までの範囲を終端自由にしてマ
ツチングを行い、前記VCV音節のマツチングを
行う場合には前母音から前母音と子音の境界まで
は始端自由に、また子音と後母音の境界から後母
音までは終端自由にしてマツチングを行うことを
特徴とするパタンマツチング方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13642183A JPS6027000A (ja) | 1983-07-25 | 1983-07-25 | パタンマツチング方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP13642183A JPS6027000A (ja) | 1983-07-25 | 1983-07-25 | パタンマツチング方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6027000A JPS6027000A (ja) | 1985-02-09 |
JPH0552514B2 true JPH0552514B2 (ja) | 1993-08-05 |
Family
ID=15174757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP13642183A Granted JPS6027000A (ja) | 1983-07-25 | 1983-07-25 | パタンマツチング方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6027000A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3460723B2 (ja) * | 1992-05-19 | 2003-10-27 | 富士通株式会社 | 音声認識方式 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5326505A (en) * | 1976-08-24 | 1978-03-11 | Nippon Telegr & Teleph Corp <Ntt> | Voice rec ognizing device |
-
1983
- 1983-07-25 JP JP13642183A patent/JPS6027000A/ja active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5326505A (en) * | 1976-08-24 | 1978-03-11 | Nippon Telegr & Teleph Corp <Ntt> | Voice rec ognizing device |
Also Published As
Publication number | Publication date |
---|---|
JPS6027000A (ja) | 1985-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3069531B2 (ja) | 音声認識方法 | |
JP3523382B2 (ja) | 音声認識装置及び音声認識方法 | |
JPH0552514B2 (ja) | ||
JPH0449716B2 (ja) | ||
JP3277579B2 (ja) | 音声認識方法および装置 | |
JP2000099099A (ja) | データ再生装置 | |
KR100350003B1 (ko) | 음성신호로부터워드를결정하는시스템 | |
JP3583930B2 (ja) | 音声認識装置及びその方法 | |
JPH0554117B2 (ja) | ||
JPH05303391A (ja) | 音声認識装置 | |
JP3125928B2 (ja) | 音声認識装置 | |
JPH0449953B2 (ja) | ||
JP2578771B2 (ja) | 音声認識装置 | |
JPH0534677B2 (ja) | ||
JPS6344699A (ja) | 音声認識装置 | |
JPS59149400A (ja) | 音声入力装置 | |
JPS61261798A (ja) | 音声認識装置 | |
JPS6043697A (ja) | 子音と母音の境界検出装置 | |
JPS6070499A (ja) | 音声セグメンテ−ション方法 | |
JPS61200596A (ja) | 連続音声認識装置 | |
JPS60170900A (ja) | 音節音声標準パタン登録方式 | |
JPH03145167A (ja) | 音声認識方式 | |
JPH0567036B2 (ja) | ||
Yanagida et al. | Detection and Identification of Plosive Sounds in Japanese Words | |
JPS6313199B2 (ja) |