JPS607493A

JPS607493A - 単音節音声認識方式

Info

Publication number: JPS607493A
Application number: JP58115574A
Authority: JP
Inventors: 寺尾　修
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-06-27
Filing date: 1983-06-27
Publication date: 1985-01-16

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（ａ）　発明の技術分野本発明は擬似連続発声学音節を認識対象とする登録方式
による音声認識方式に関する。

（ｂ）　技術の背景近年音声認識はデータ処理技術の発ヌ室特に半導体にお
ける電在化技術の１１（展に支えられ１ｉＣ来困ｌ、ｉ
ｊｐとされていた論理回路あるいは高速大容量メモリが
ＬＳＩとして一４１供されるようになり、日本語による
音声入力手段の持つ対話形式に摘し操作者に！１７別の
習熟を必要とすることｄない操作が容易なデータ入力機
能を生かして普及するようになった。

（ｃ）　従来技術と問題点第１図は従来および本発明の一実施例におけるｍ音節認
識方式のブロック図および第２図は従来におけるその処
理手順図を示す。図において、１は例えばマイクロプロ
セッサ（ＭＰｔＪ）により構成される制御部、２は高速
半導体メモリによる記憶部、３は音声処理部、４は入カ
バターンバッファおよび５は比較部更に２１は制御プル
グラム、２２は制御データ、２３は標準バタン辞書、２
３８〜ｎは標準バタンである。

単音節認識方式は通常特定話者のため認識すべき入力音
声における複数の例えば後述の１０１５の音素を設定し
、学習モードにおいて制御部１は音声処理部３への入力
音声における昨音節を図示省略したが、予め複数の帯域
フィルタ群に印加して得るスペクトル出方毎に５ｍｓ程
度のフレーム周期で標本化して得た特徴パラメータの各
音素毎に対応した定常的な部分を記憶部３に標準パター
ン辞−５２３として蓄積する。線形時間正規化ζこより
１琳語につき例えば５１２ピツトの標準バタンか作成蓄
積される。このように先行する学習モードでは５〜１０
個程のＢｉｌ＋練サンプルから平均的な標準パターン２
３ａ〜ｎを作成して標準パターン辞書２３を登録保持し
、認識モードでは入力音声による入力バタンと該標準バ
タン２３ａｘｎとを同一フレーム周期で１，０の状態に
よる類似度を比較部４によりめて日本語における母音お
よび子音（ア〜ン）４５種、消音１８種、半濁音５乱拗
音３３種の計１０１程の単音節を基本に認識を行う。

認識は通常垂音節を子音部分と母音部分に分離し、母音
標準パタンを使って母音を決定し候補を削減した後、過
渡部を含めて子音の？＋ｐ　ｎｌｌを行う方法ζこよっ
ている。この方法は認識における学音節の候補が削減さ
れるので子音の認識が容易になる上処理量が少くなる利
点がある。しかしこの方法は辿常子音部十過渡部十母音
部と連続する音韻の先頭における子音部の特徴が特に一
般的な擬似連続発声による拗音において小さく焚、える
ため詔、横を誤る。鳴合が存在する。

（ｄ）　発明の目的本発明の目的は上記の欠点を除去するため、従来におけ
る通常の標準バタンと入力バタンにおける母音部の照合
が得られた後、残りの子音部子過渡部について行う子音
部の照合を行ない、町にその区間にスペクトラム変動が
みられる場合には、そこまでの母音部の＠定したフレー
ム部分即ち母音代表部の前縁から予め設定したフレーム
部を過渡部として除いた過渡部要素の少い入カバターン
の子音部分だけを再度欅イ＜ヘパターンと照合する方法
によって子音部のより高い認識率を得ようとするもので
ある。

（ｅ）　発明の構廊この目的は、未知入力音声を予め辞書に登録された巷音
節標準バタンと照合して行う音声認識装置において、音
声処理部は、話者の学音節標準バタンの登録時にスペク
トラム時系列による分析に基づく標準バタンと共にスペ
クトラム変動量による子音部の抽出機能により、過渡部
と子音先頭部とを特定の単音節に対して分け、その情報
を作成し、記憶部に登録せしめる機能を備え、制御部は
擬似連続発声された入力音声に伴う音声処理部、経内、
照合部における入力バタンと母音標準パータンによる一
次照合後、スペクトラム変動量を用いて子音部の抽出を
行った後、まず、過渡部を含む子音と照合し、候補を絞
った後、過渡部を除いた子音先頭部との照合を行うこと
により入力バタンを認識することを特徴とする嚇音節音
声認識方式を提供することによって達成することが出来
る。

（ｆ）　発明の実施例以下、図面を角皿しつつ本発明の一実施例について説明
する。

第３図は本発明の一実施例におりる単音節認識方式によ
るブロック図、第４図は本発明の−Ｖｒ＃１例における
学音節認８ダニ方式による処理手順図および第５図は入
力バタン何回である。

図において１ａは制φ■部、２ａは記憶部、３＾は音声
処理部、４は入力バタンバッファ、５は比較部、更に２
１ａは制御プログラム、２２ａは制御データ、２３は標
準バタン辞書、２３ａ−ｒｒは標準バタン、２４は■々
切出しデータ部である。主要百成はＶ／Ｃ切出しデータ
部２４を除き類似であり、新たにサフィックスの追加さ
れた各部は従来と共と同様に制御プログラムおよび制御
データに従い構成各部をして音声認識を行う。

一音声処理部３は、学音節標準パタンの、Ｑ！ＦＶ！時に
スペクトラム時系列による分析に基く標準バタン２２ａ
−ｎを記憶せしめるのと同時に、別途スベクドラム変動
量による子音部の抽出機能を作動させ、母音部（Ｖ）／
子音部（Ｃ）の切出しデータを作成し、Ｖ／Ｃ切出しデ
ータ部２４に記憶ぜしめておく。

ｍｌ　Ｄモードにおいて音声処理部ｉ′ニ付加される入
力音声についてスペクトラム時系列による分析を行って
得た入力バタンと（１）式によるスペクトラム変動量と
から得られたスペクトラム変動部を入力バタンバッファ
４ζこ設定する。比較部５は、第４図に示すように従来
と同様、未知バタンを比較部５ヘセツトすると共に、該
母音部（Ｖ）のバタンを記憶部２における標準バタン辞
書２３の標準パタンａ　−ｎに逐次アクセスして比較照
合する。次に母音部（Ｖ）について一致が得られた時に
過ｉ度部を含んだ子音抽出部（のについて比較部５をし
て第一次照合ステップを実行せしめるが、第５図に示す
ように子音先頭部（Ｃｃ）の有効領域が狭い例では、過
渡部（Ｔｃ）の占める割合が大きいので、従来では、認
識の誤り原因となっていたが、スペクトラム変動部がそ
の過渡部を含む子音部（Ｃ）に存在するときには、Ｖ／
Ｃ切出しデータ部２４Ｉこアクセスしつ′＞第一次ステ
ップで得られた貼音節を対象に過渡部を除いた子音先頭
部（Ｃｃ）についてのみで更に照合することにより、よ
り高い認識率となる擬似連続発声の単音節方式が得られ
るので有効である。

スヘク）　ラｔＪＪ１ｍ）＝５　（Ｓｔ　−Ｓｔ＋＋）
ｊ＊（Ｔｌ　−Ｔ　ｊ＋＋）−（１）Ｊ＝１但しＴｊ＝ｉ（Ｓｔ−８ｔ＋ｔ）１−（Ｓｔ−８ｔ＋ｔ
）　４＋１１＊Ｗ３ｔ：フレーム方向、Ｊ　：？ｔ７Ｍ
フィルタＷｊ：重み係数（ｇ）　発明の詳細な説明したように本発明によれば従来子Ｗ　１１（の照
合において誤認識の原因となる確率の大きかった過渡部
を除去して子音部の認識を実行するのでより高い認識率
となる第音節認識方式が得られるので有用である。

【図面の簡単な説明】

第１図は従来および本発明の一実施例における単音節認
識方式のブロック図、Ｓ１２図は従来における単音節、
１３ａ方式の処理手順図、Ｍ３Ｍは本発明の一実施例に
おける昨音節認織方式によるブロック図、第４図はその
処理手順図および第５図は入力バタン何回である。図に
おいて１は制御部。２は記憶部、３は音声処理部、４は入力バッファ。 −５は比較部、２３は標準バタン辞書および２３ｎ〜ｎ
は標準バタンである。ネ　１　の簗　２　口第　３　目第　４　図峯　Ｓ　日騎謂を−

Claims

【特許請求の範囲】

未知入力音声を予め辞書に登録された単音節標準バタン
と照合して行う音声認識装置において、音声処理部は、
話者の単音節標準バタンの登録時にスペクトラム時系列
による分析に基づく標準バタンと共にスペクトラム変動
量による子音部の抽出機能により、過渡部と子音先頭部
とを特定の単音節に対して分け、その情報を作成し、記
憶部に登録せしめる機能を備え、制御部は擬似連続発声
された入力音声に伴う音声処理部、経由、照合部におけ
る入力バタンと母音標準バタンによる一次照合後、スペ
クトラム変動量を用いて子音部の抽出を行った後、まず
、過渡部を含む子音と照合し、０補を絞った後、過渡部
を除いた子音先頭部との照合を行うことにより入力バタ
ンを認識することを特徴とする眼音節音声認識方式。