JPS58224396A

JPS58224396A - 音声認識装置

Info

Publication number: JPS58224396A
Application number: JP57107767A
Authority: JP
Inventors: 清岩田; 裕二木島; 晋太木村
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-06-23
Filing date: 1982-06-23
Publication date: 1983-12-26
Also published as: JPH0254560B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（１）発明の技術分野本発明は多数単語音声認識方式を用いた音声の実時間認
識処理において、候補単語を選択する前照合処理部を具
え、高速かつ高い認織槽度を有する音声認識方式に関す
るものである。

（２）従来技術と問題点従来、多数単語音声認識装置における前照合処理部式と
しては、スペクトルの大城的％黴を抽出するもの、正規
化パワーの時間正規化照会するもの、または語頭１語尾
の詳細パターン照合によるもの等かめる。これらには率
暗の基本的差異である単語発Ｉ長、または母音、子音の
パワー情報が積極的に適用されていない。このため、前
照合におけるパラメータは本照合におけるパラメータに
対し重責的に変らないことになり、分類機＃＠を上げる
ためにはかなシ細かな情報？用いなければならｒ照合に
時間がかかるという欠点がめる。

（３）発明の目的本発明の目的は多数単一音声認識方式において単一の基
本的差異を示す単語発声長または母音。

子音のパワー電清報を適用することにより、高速かり扁
い認猷祠度を有する音声認ｌｉ＆装置を提供することで
るる。

（４）発明の構成　。

前記目的を達成するため、本発明の音声ｆＩ！を織装置
は多数単一音声認識方式を用いた音声の実時間認識処理
を行ない候補単ｔｉ全選択する前照合処理部を有する音
声認識装置において、前日己前照合石塊部に、単語発声
長、正規化パワーから求めた単語発声の全パワー量、お
よび母音性、子音性を示す比較的パワーの大きい時間長
と比較的パワーの小さい時１１５長との比の６つの特徴
パラメータを用い諌補単ＰＦ＃を選択する手段を設けた
ことを特徴とするものでめる。

（５）発明の実施例第１図、第２図（ｃＬ）　ｌ　（ｂ）は本発明の詳細な
説明図でるる。

本発明の多数単語ｉ声認峨装置における侯補単語金選択
する方式として、前照合逃鳩のパラメータは、本照合九
理の識別用パラメータとは別に、６つの量、すなわち単
語発声長と、正規化パワーから求めた単語発声の全パワ
ー３と、母′＃注、子音性を示す量として正規化パワー
の平均値に＋１Ａ４ＵＡ差１直を刃口えたものと、これ
から差引いたものの比の６つの特徴パラメータを用いる
ことによシー補単飴が選択される。

第１図はこの場合に使用される時間正規化に関する説明
図である。

単語音声の発声時間長は異なる単語は勿論のこと、同図
の波形１１〜１．に示すように、同一の単語でも発声ご
とに異なっている。

そこで、同図の波形２に示すように基準時間長に正規化
し、辞書との照合にはこの時間正規化照曾波形が用いら
れる。この時、照合対象の辞書としては極端に長さの異
なるもの、すなわち長さが２倍以上または１／２以下は
除外される。従来方式ではこの単語発声の固有電である
時１…長正規化が積極的に適用されていなかつ九のに対
し、本発明ではこれを設足したものである。

第２図（α）　、　（ｂ）は本発明の前照合処理部ｅ用
いられる単語発声の全パワー量の説明図である。

同図（ｃＬ）　、　Ｌｂ）は横軸に時間長、縦軸にパワ
ーをとった場拷の単＃発声の時間方向のパワー変化３！
＋３ｇを例示し、第１図に示し死時間正規化された同一
単語に対応している。

通導、同一単語でもその発声の仕方によｐ時間成分のみ
ならずパワーの大きさも異なってくる。この単語波形３
１＋３８に対し、最大パワーと最小パワーの１川で線形
に正規化して単語波形４ｘｙ４鵞が得られる。なお、発
声単語の時間長は発声ごとに変動するが、大略の値とし
ては単語固有の長さが存在する。従って、同図のように
、単語の比較的単純なｌｌ４ｉｌ１４ｉｉ情報量として
、パワーｔ−Ｑ間長とともに正規化し単語波形４ｔｙ４
ｉの斜線部分より単語の全パワー量が得られる。

以上の方法により、６つの特徴パラメータのうち４１４
１１目のパラメータは正規化された音声発声長であシ、
第２着目のパラメータは発声の正規化　・パワーの全時
間長にわたる総和、すなわち単語の全パワー量である。

この両パラメータを粗汁せた第２図の全パワー量が単語
発声の固有清報蓋として安定なパラメータが設足される
。

次の第６脩目のパラメーシは、単語中の母音らしき、子
音らしさを示すチｌｉ＋ｓとして、単語発声中のｉ　ｔ
　＊　／子音量　という直で必る。母音量としては正規
化パワーが、（その平均値）＋（４準偏差ンを越えた時
１…長が匣われ、また子音量としては正規化パワーが（
その平均値）−（４準閤差）以上の時間長が使われる。

すなわち、が指標となる。これは単語分類に有効なパラメータとな
る。

第６図は本発明の実施例の構成説明図である。

認識に先立ち、後述の前照合辞誉１６と本照合辞４１７
を用意しておく。前照合辞誓１６は６つの特徴パラメー
タに関して、谷値の大きさ順に単語が類別されており、
前照合では入力音声の１つのパラメータ騰を求め、その
直の±６０％以内に入る辞蒼項目を選択する。これを５
つのパラメータについて行ない、６者の論理積金と９前
照合結果として侯補単語が選択される。

本照合辞簀１７は本照合で用いるスペクトルパターンの
ような通線の特徴パラメータが格納される。

同図において、認識時にマイクロホーン１０から背戸を
人力し、その−気ＩＭ号は壇幅器１１を通して分析回路
１２に送られ、音声認識のために必要な６橿パラメータ
の分析を行なう。

まず、＠禰単＃を選択する前照合処理のために、１声パ
ワーがパワー正規化回路１４によ）前述の第１図、４２
因の手法で正規化され、単語の発声時間長、全パワー量
、母音／子音比の６特徴パラメータに質換される。これ
らが酌照汁回路１５に送られ、前照汗辞優１６と照合さ
れ前述のようにして候補単一が選択される。これが本照
合辞書１７に送られ、対応するパラメータのたとえばス
ペクトルパターンがＡ定される。一方、本照合凪魂では
前照会悪場で用いるパラメータと相捕的な電を抽出する
ため、分析回路１２の出力を時機抽出回路１３に送り、
たとえばスペクトルパターンの特徴パラメータが抽出さ
れ、本照合回路１８において本照会辞−１１１７からの
パラメータとの距離＃ｆ４を行ない、その結果を旬ボ回
路１９に送りｆ−ＩＪ定し４誠結果を出力する。

（６）＠明の効果以上説明し次ように、本発明によれば、前照合処理部に
おいて、単語発声固有の清報蓋として単語の正規化パワ
ーを基にした前述の５つの特徴パラメータによｐｌ−ま
た本照会」１部では、１目浦的なパラメータにより照合
し、併せて２一段の照会処理上行なうので、安定にかつ
高速に候補単一の選択ができ、高い！ｇ＃ｉ率で単語音
声認識がＯＪ′能となる。

【図面の簡単な説明】

４１図、第２図（（Ｌ）　、　（６）は本発明の詳細な
説明図、第６図は本発明の実施例の構成説明図でろ’）
　、４１＋４２は正規化された全パワー量、１０はマイ
クロホーン、１１は増１編器、１２は分析回路、１６は
％微細出回路、１４はパワー正規化回路、１５は前照合
回路、１６は前照合辞誉、１７は本照合辞書、１８は本
照会回路、１９は判定回路耐水す。時詐出顧人富士通株式会社復代理人　弁理士　１）坂　善　１第１図第２図

Claims

【特許請求の範囲】

多数単語音声認識方式を用いた音声の実時間−織処理を
行ない候補率１ｌｌｔ−選択する前照合処理部を有する
音声認識装置において、前記前照合地理部に、単語発声
長、正規化パワーから求めた単語発声の全パワー量、お
よび母音性、子音性を示す比較的パワーの大きい時間長
と比較的パワーの小さい時間長との比の６つの特徴パラ
メータを用い候補単語を選択する手段を設けたことを特
徴とする音声認識装置。