JPS58195895A

JPS58195895A - 単語音声認識装置

Info

Publication number: JPS58195895A
Application number: JP57078565A
Authority: JP
Inventors: 康則木村
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1982-05-11
Filing date: 1982-05-11
Publication date: 1983-11-15

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】囚　発明の技術分野本発明は単胎音Ｐｓ絽砿装置、特に、入力音声の音節数
を算出し、音節数によシ単飴音声の予備選択を行なった
後に、単一音声の標準パターンと照合するよう構成した
重鎖音声認識装置に関するものである。

（６）技術の背景近年、オフィスコンビ凰−夕の急速な発展にともない、
各種入出力機鰺の機能向上が望まれておシ、％に音声認
識装置は情報の人力手段の一つとして鋭意研究開発が進
められている。

（Ｑ　従来技術と問題点従来、単一音声の認識においては、入力音声と単ａａＷ
書とのマツチング方法は、ダイナミックプログラミング
（ＤＰ）マツチングのように、単語音声そのものの持つ
Ｉ！＃徴をあまシ加味しない嚇なる距離計算であること
が多い。

このため、予期しない認識結果を生ずることがあった。

を友、単一音声のｌ１ｌｌ！！識は、入力された単一音
声と辞書内の単一音声との比較、すなわち、距離計算を
行うため膨大な計算舊となシ、計算時間が憂くなるとい
う欠点を有する。

０　発明の目的本発明の目的は、前述の欠点に鑑みなされたものであっ
て、簡単な構成で良好な認識結果を得ることがで暑為単
語音声−ｍ装置を提供することにある。

（ト）発明の構成そして、この目的は本発明によれば、入力音声の音節数
を算出する音節数算出部、単語音声の標準パターンと音
節数が格納される辞書メモリ、駄辞書メ七りから絖み出
された単語音声の標準パターンと、入力音声に対応した
入カバターンとを照合する照合部と、を具備してなり、
該音節数算出部により入力音声の音節数を算出し、該音
節数によシ単語音声の標準パターンの予備選択を行なっ
た後に、該照合部によシ単飴音声の照合を行なうことを
特徴とする単語音声認識装置を提供することによシ達成
される。

■　発明の実施例以下、本発明の実施例を図面を用いて詳細に説明する。

第１図は、本発明にかかる単語音声認識装置の一実施例
を説明する丸めの概略構成図である。

図において、１はｖＰ入力部であって、！イク等を介し
て単語音声が入力される。２はＡ／Ｄ変換器であって、
音声入力部１からのアナログデータをディジタルデータ
に変換する。このときのサンプリング周波数は８（ＫＨ
ｚ）とする。　３はＡ／Ｄ変［Ｓｒ１によりディジタル
データ化された単語音声のパワーを計算するパワー計算
部で、このと自１２４ｍ１を１フレームとする。４はパ
ワー計算部によ〉得られたパワーを正規化するパワー正
規化部、５はパワー正規化部４により得られたパワーの
微分値を算出するパワー値分値算出部であって、第２図
（ａ）、（ｂ）に例えば、０ＮＡＪＩ（同じ）という単
語音声のパワーの時間変化とその微分波形を示す。６は
パワー微分値算出部５により得られた微分波層によシ単
語音声の音節数（入力された単語音声内の母音のｗｌ）
を算出する音節数算出部、７は単語音声の標準パターン
が格納される辞書メモリであって、７−１は単峰音声の
標準パターンに対応する音節数が格納される１ｉ節数メ
モリ、７−２は単語音声の標準パターンが格納される単
語音声メモリである。８は入力された単語音声と一１Ｉ
ｍ算出部・によシ算出された旨節数に対応する音節数の
単語音声の標準パターンとを照合する照合部でありて、
例えばＤＰマツチング等を行なうことによシ入力された
単語音声の認識を行なう。

以上説明したような構成において、その動作について説
明する。

■　単語音声が音声入力部ｌにより入力される。

■　入力された単語音声はＡ／Ｄ変換器によシディジタ
ルデータに変換される。

■　パワー計算部３によシ１単語ごとにパワー計算を行
なう。

■　パワー正規化部４によシパワーの正規化を行なう。

■　正規化されたパワーをパワー微分値算出部５によｐ
微分値を求める。

微分値を求める方法としては、ディジタルデータ化さｉ
またパワーの連続する５サンプルを一つの単位として、
最小自乗の意味で、直線近似し、その傾きを中心のサン
プルの微分値とする方法を用いる。

この演算をサンプルのＩＩ数をＮとすれば、２ナンプル
目から（Ｎ−２）サンプルまで行なう。

（すなわち、最初と最後の２サンプルの傾きはゼロとす
る。）これを嬉２図伽）の実線で示す。

■　パワー微分値計算ＳＳによシ算出した微分−−で値
がゼロになゐ点を検出する。（第２図で端破線と交わる
点）さらに、となシ合う破線で囲まれた区間において、
絶対値で微分値が最大になる点を検出する。第２１伽）
において、Ｐｓｅ　ｄ１＊　ｐｔ＋４鵞′０等を検出す
る。

となりあう（ｐｔ’＊　ｄｔ’）＊　（ｄｓ’ｓ　ｐ雪
′）等を一つのピークまたはディップの存在する区間と
する。

（Ｐｔ＊Ｄｓ・・・−［ピークかディップかの判断は微分−−が極太から極小に
変化していれば、その区間にはピークがある、逆の場合
はディップがあるものとする。

このディタブは、いわゆる子音区間を表しているので鼻
音が母音の間にはさまれ穴場合等には明瞭龜ディップを
示すと社限らないが、ピーク区間は主として、母音の増
大を示していると考えられるので、このビータ区間がい
くつあるかを数えることにより、＃ｔｈ＃よ確実に単語
音声の音節数を推定することができる。

■　このようにして得られ友音節数にもとづいて辞書メ
モリ７内の音節数メモＩＪ　７−　Ｉ　Ｋ対応する単語
音声メモリ７−２内の単語音声のパターンを読み出し、
照合部８により入力された単語音声と予備選択された単
＠η音声のパターンとを照合する。

（Ｑ　発明の効果 υ上ｍｌと明したように本発明によれば、入力された単
語音声の音節数を算出し、該音節数に対応する単語音声
を予備選択した後に認識を行なうので良好なＶＷ＆結果
を得ることができ、認識に要する計３１！菫、計算時間
を大幅に減少することができる。

【図面の簡単な説明】

’　　Ｍ１図は本発明にかかる単語音声＆［識装置の一
実施例を説明するための概略構成図、第２図は単語音声
のパワーの時間変化と、微分波形を示す図である。図において、ｌは音声入力部、２はＡ／Ｄ変換器、３は
パワー計算部、４はパワー正規化部、５はパワー微分値
算出部、６は音節数算出部、７は辞書メモリ、８は照合
部である。１も果第　ｌ　図俤２図

Claims

【特許請求の範囲】

入力１声の音節数を算出する音節数算出部、単語音声の
標準パターンと音節数が格納される辞書メモリ、該辞書
メモリから読み出された単語音声の痺準パターンと入力
ｆＦに対応した入カバターンとを照合する照合部、とを
具備してなり、該音節数算出部により入力音声の音節数
を算出し、腋音節数によシ単ｉ＠音声の憾阜パターンの
予備選択を行なっ九後に、該照合部より単一音声の照合
を行なうことを特徴とする卑語音声認識装置。