JPH0552514B2 - - Google Patents

Info

Publication number
JPH0552514B2
JPH0552514B2 JP58136421A JP13642183A JPH0552514B2 JP H0552514 B2 JPH0552514 B2 JP H0552514B2 JP 58136421 A JP58136421 A JP 58136421A JP 13642183 A JP13642183 A JP 13642183A JP H0552514 B2 JPH0552514 B2 JP H0552514B2
Authority
JP
Japan
Prior art keywords
vowel
syllables
matching
consonant
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58136421A
Other languages
English (en)
Other versions
JPS6027000A (ja
Inventor
Yoshiteru Mifune
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP13642183A priority Critical patent/JPS6027000A/ja
Publication of JPS6027000A publication Critical patent/JPS6027000A/ja
Publication of JPH0552514B2 publication Critical patent/JPH0552514B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、連続発声された日本語を認識する場
合に、母音定常部中心を検出しておき、母音定常
部中心〜母音定常部中心の範囲に対して前もつて
登録したV1CV2標準パタンマツチングさせて、
語中の音節を認識する場合等に用いられるパタン
マツチング方法に関する。
従来例の構成とその問題点 従来の語中の音韻もしくは音節を認識する方式
は、簡単なものとしては、フレーム毎に前もつて
登録された音素パタン{例えば、5母音|A||
i||u||E||o|、子音|s||c||h
|,|p||t||k|,|b||d||g|,|
m||n||r|等}との距離を計算して音素識
別した結果をマージ例えば連続音素は1音素に代
表し、不連続音素は切り捨てする等の処理をし
て、認識結果としていた。しかしこの方式では調
音結合等による子音の変形が起こるために構成は
簡単であるが、音韻区間が不明瞭なために認識率
は、著しく低下する原因となつていた。さらに認
識率を向上させる認識方式としては、語中音節の
認識させるために、CV音節を前もつて標準パタ
ンとして登録しておき、2段DP手法と呼ばれて
いる。個々の登録CV音節とは時間軸伸縮を行つ
た上で、全体として最適なCV音節系列を決定す
る、パタンマツチング手法を用いて、音節系列と
して認識結果を求めているものなどがあつた。し
かしこのような2段DP手法を用いる方法では、
実時間処理を行うためには、莫大な計算量を実行
するため専用ハードウエアを必要とするためにコ
スト低減が困難でありまた、種々の方法に比べて
認識率が優れているものの、調音結合を吸収する
ためにはVCV音節パタンも必要でありまた、2
段DP手法に固有の挿入、脱落誤り(例えば2音
節データを3音節としてマツチングして誤認識す
る。2音節データを1音節とマツチングして誤認
識する)が発生することがあり対策処理が困難で
あるため認識率にも限界があつた。
発明の目的 本発明は上記従来の問題を解決し、パタンマツ
チングによる認識率を向上させることを目的とす
る。
発明の構成 本発明は予め記憶したV1CV2標準パタンとパ
タンマツチングを行う場合において、V1CV2
準パタンV1Cセグメント境界のポインタ及び
CV2セグメント境界のポインタを設けておき、標
準パタンのV1先頭〜V1Cセグメント境界のマツ
チング開始フレームとCV2セグメント境界〜V2
終了のマツチング終了フレームに自由度を持たせ
ることによつて、上記目的を達成するものであ
る。
実施例の説明 以下に本発明を適用した実施例について説明す
る。
第1図において、1は入力端子より入力された
信号をデイジタル信号に変換するA/D変換器、
2は電力系列変換手段、3は入力信号を特徴ベク
トルの時系列パタンに変換する特徴系列変換手段
である。4は入力音声の電力系列によつて長い無
音を検出して音声間を検出する音声区間検出手段
である。5は音声区間検出手段4によつて切り出
される音声区間において電力系列によつて短い無
音を検出して無音区間を検出する無音区間検出手
段である。6は入力音声のピーク電力を検出する
ピーク電力検出手段6aと特徴ベクトル系列のベ
クトル毎に母音識別を行う母音識別手段6bから
なり、ピーク電力の前後のフレームにおける母音
識別結果の同一母音中心から、母音定常部中心を
検出する母音定常部中心検出部である。7は入力
音声を特徴ベクトルの形でCV音節7aもしくは、
V1CV2音節7bの単位で記憶する標準パタン記
憶部である。8は平均発声長Lのフレーム分だ
け、母音認識結果の系列を記憶する母音系列記憶
する特徴系列記憶部8bからなる記憶部である。
9は特徴ベクトル記憶部8bにおける語頭4aも
しくは無音区間終了5bから平均発声長Lのフレ
ーム以内の母音定常部中心6cまでの区間の場合
にはCV標準パタン7aとパタンマツチングを行
い、平均発声長Lのフレーム以内の母音定常部中
心6c〜母音定常部中心6cの区間の場合には
V1CV2標準パタン7bとパタンマツチングを行
うパタンマツチング手法である。
10は音声区間検出手段4、無音区間検出手段
5、母音定常部中心検出部6、記憶部8およびパ
タンマツチング手段9を全体的に制御して、入力
音声の母音定常部中心に語頭や無音区間の情報を
使用して、CV音節とV1CV2音節とのパタンマツ
チング結果を接続して、CV音節のストリングス
として認識結果を出力する総合制御手段である。
12は音声認識動作中には端子12aに、標準パ
タン作成時には端子12bに接続される切換スイ
ツチである。
次にこの実施例の動作について第2図と共に説
明する。入力端子11に入力された音声信号は
A/D変換器1によりデイジタル信号に変換さ
れ、電力系列変換手段2および特徴系列変換手段
3に加えられる。電力系列変換手段2の出力の一
例を第2図イに示す。この波形は入力音声が|ヒ
バリが空に|と発声された場合のものである。そ
の音声信号の語頭4a〜語尾4bは音声区間検出
手段4によつて検出される。一定の閾値以上とな
る電力系列が一定フレーム長以上連続している期
間で、かつ母音識別手段6bによつて識別された
母音が同一種類で一定フレーム長以上連続する場
合に、ピーク電力検出手段6aによつて母音系列
の中心を検出する。その検出点をiV1,iV2,…
…,iV6として第2図に示している。また母音定
常部中心が検出される毎に、現在の母音定常部中
心から平均発声速度長L逆上つた時点に語頭もし
くは無音区間が検出される場合には、CV標準パ
タン7aとパタンマツチングを行い、平均発声速
度長L逆上つた時点に語頭も無音区間も検出され
ない場合には、平均発声長Lフレーム以内の母音
定常部中心と現在の母音定常部中心のすべての組
合せの範囲に対してV1CV2標準パタンとパタン
マツチングを行う。このようにして第2図ハのよ
うな認識を行ない、ニに示す結果が出力される。
次にこの実施例におけるマツチング方式につい
て説明する。
前記のパタンマツチング装置9においてマツチ
ングをとるための距離尺度としては、コークリツ
ド距離、市街距離、DPマツチング等が上げられ
る。しかしDPマツチングを使用したとしても、
標準パタンの発声時点の発声速度と音声入力時点
の発声速度が異なること、発声速度が同一であつ
たとしても母音の継続時間長が種々異なる事や、
母音定常部中心位置の検出誤りが生じる事がある
ために何かの対策が必要となる。そこで母音区間
にマツチング範囲の自由度を持たせることが考え
られる。第3図および第4図は、CVパタンマツ
チング及びV1CV2パタンマツチングの方式を説
明するものである。まずCV標準パタンとのマツ
チングについて第3図と共に説明する。同図にお
いて入力音声の語頭もしくは無音区間終了から母
音定常部中心の範囲に対して、例えば、第5図
イ,ロに示すようにマツチングバスのようなパス
距離計算を行う場合にCV標準パタンのセグメン
ト境界から母音定常部中心までの範囲を終端自由
とする。
すなわち、標準パタンAの特徴ベクトルの各フ
レームと入力音声パターンBの特徴ベクトルの各
フレームとを比較するに際し、終端自由区間Tを
設けるようにしたものである。この結果、母音部
の長さの変動に起因するパタンマツチングのミス
をなくすことができる。
また第4図はVCV標準パタンとのマツチング
の場合を示している。同図において入力音声の語
頭もしくは無音区間の存在しない母音定常部中心
〜母音定常部中心の範囲に対して例えば第5図に
示すようなマツチングパスで距離計算を行う場合
に、V1CV2標準パタンのV1の開始からV1Cセグ
メント境界の範囲を始端点自由区間T1としまた
CV2セグメント境界からV1の終了までの範囲を
終端点自由区間T2としている。
発明の効果 上記実施例より明らかなように本発明によるパ
タンマツチング方法によれば認識処理は母音定常
部中心毎に行なうものとして、語頭および無音区
間終了から前もつて定めた平均発声長内の母音定
常部中心とはCV標準パタンとCVセグメント境界
〜母音定常部中心は終端自由とし、現在の母音定
常部中心から前もつて定めた平均発声長逆上つた
範囲に語頭や無音区間が検出されない場合には、
範囲内での母音定常部中心との組合せの範囲には
V1CV2標準パタンとV1の開始フレームとV1Cセ
グメント境界の範囲を始端自由としてCV2セグメ
ント境界とV2の終了フレームの範囲を終端自由
とすることによつて、標準パタン発声時と入力音
声発声時の速度速動を吸収し、また、母音定常部
中心位置検出誤りを吸収することができる。
【図面の簡単な説明】
第1図は本発明によるパターンマツチング方法
を適用した音声認識装置のブロツク図、第2図は
この装置における処理動作の説明図、第3図は入
力音声とCV標準パタンのマツチング処理を示す
図、第4図は入力音声とV1CV2標準パタンのマ
ツチング処理を示す図、第5図イ,ロはマツチン
グパスを示す図である。 2……電力系列変換手段、3……特徴系列変換
手段、7……標準パタン記憶部、8……記憶部、
9……パタンマツチング手段。

Claims (1)

    【特許請求の範囲】
  1. 1 入力音声を特徴ベクトルの時系列パタンに変
    換し、前記特徴ベクトル毎に母音識別と電力値計
    算を行つて母音定常部中心、語頭及び語中の無音
    区間を検出し、前記語頭及び語中の無音区間とそ
    れに続く前記母音定常部中心までの範囲には音節
    パタン記憶手段に記憶されたCV音節の標準パタ
    ンとマツチングを行い、前記の範囲でなく前記母
    音定常部中心が2つ以上連続する範囲にはVCV
    音節(但しCは子音、Vは母音)の標準パタンと
    マツチングを行うように切換えを行い、前記標準
    パタン作成時にCV音節では子音と母音の境界を、
    またVCV音節では前母音と子音の境界ならびに
    子音と後母音の境界を前もつて検出しておき、前
    記CV音節のマツチングを行う場合には子音と母
    音の境界から母音までの範囲を終端自由にしてマ
    ツチングを行い、前記VCV音節のマツチングを
    行う場合には前母音から前母音と子音の境界まで
    は始端自由に、また子音と後母音の境界から後母
    音までは終端自由にしてマツチングを行うことを
    特徴とするパタンマツチング方法。
JP13642183A 1983-07-25 1983-07-25 パタンマツチング方法 Granted JPS6027000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13642183A JPS6027000A (ja) 1983-07-25 1983-07-25 パタンマツチング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13642183A JPS6027000A (ja) 1983-07-25 1983-07-25 パタンマツチング方法

Publications (2)

Publication Number Publication Date
JPS6027000A JPS6027000A (ja) 1985-02-09
JPH0552514B2 true JPH0552514B2 (ja) 1993-08-05

Family

ID=15174757

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13642183A Granted JPS6027000A (ja) 1983-07-25 1983-07-25 パタンマツチング方法

Country Status (1)

Country Link
JP (1) JPS6027000A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3460723B2 (ja) * 1992-05-19 2003-10-27 富士通株式会社 音声認識方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5326505A (en) * 1976-08-24 1978-03-11 Nippon Telegr & Teleph Corp <Ntt> Voice rec ognizing device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5326505A (en) * 1976-08-24 1978-03-11 Nippon Telegr & Teleph Corp <Ntt> Voice rec ognizing device

Also Published As

Publication number Publication date
JPS6027000A (ja) 1985-02-09

Similar Documents

Publication Publication Date Title
JP3069531B2 (ja) 音声認識方法
JP3523382B2 (ja) 音声認識装置及び音声認識方法
JPH0552514B2 (ja)
JPH0449716B2 (ja)
JP3277579B2 (ja) 音声認識方法および装置
JP2000099099A (ja) データ再生装置
KR100350003B1 (ko) 음성신호로부터워드를결정하는시스템
JP3583930B2 (ja) 音声認識装置及びその方法
JPH0554117B2 (ja)
JPH05303391A (ja) 音声認識装置
JP3125928B2 (ja) 音声認識装置
JPH0449953B2 (ja)
JP2578771B2 (ja) 音声認識装置
JPH0534677B2 (ja)
JPS6344699A (ja) 音声認識装置
JPS59149400A (ja) 音声入力装置
JPS61261798A (ja) 音声認識装置
JPS6043697A (ja) 子音と母音の境界検出装置
JPS6070499A (ja) 音声セグメンテ−ション方法
JPS61200596A (ja) 連続音声認識装置
JPS60170900A (ja) 音節音声標準パタン登録方式
JPH03145167A (ja) 音声認識方式
JPH0567036B2 (ja)
Yanagida et al. Detection and Identification of Plosive Sounds in Japanese Words
JPS6313199B2 (ja)