JP2820093B2

JP2820093B2 - 単音節認識装置

Info

Publication number: JP2820093B2
Application number: JP7339493A
Authority: JP
Inventors: 浩明服部
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1995-12-26
Filing date: 1995-12-26
Publication date: 1998-11-05
Anticipated expiration: 2015-12-26
Also published as: JPH09179578A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は単音節認識装置に関
し、特に任意の単語あるいは文を入力するための単音節
認識装置に関する。

【０００２】

【従来の技術】従来の単音節認識の実例としては、例え
ば、電話や無線等の通話品質が低い環境で認識が困難な
単音節を伝えようとする場合、目的の単音節そのものを
発声するのではなく、関連した単語を発声することが行
われている。一例として、図６として従来の単音節認識
方法の文字と関連する単語の説明図を掲示する。これ
は、電報等で使用されていたもので、平仮名を伝える際
には「朝日のあ」、「葉書のは」等と唱えて伝達してい
た。そして、この方法は、音声認識装置にも応用可能
で、認識が困難な単音節そのものを認識するのではな
く、その単音節に関連した単語を認識することにより、
任意の単語あるいは文を高精度に入力することができ
る。

【０００３】

【発明が解決しようとする課題】上述した従来の単音節
認識装置は、予め各単音節に対応した単語を記憶しなけ
ればならないため、効率よく入力を行うためには熟練が
必要であるという問題点がある。

【０００４】本発明の目的は、熟練を必要としない高精
度の単音節認識装置を提供することにある。

【０００５】

【課題を解決するための手段】本発明の単音節認識装置
は、単音節の音声を入力し認識する単音節認識装置にお
いて、任意の単音節の標準パターンとして一つ以上の当
該音節を特定の位置に含んだ任意の音節系列を許容した
標準パターンを記憶する標準パターン記憶部と、前記入
力する音声から特徴量を抽出し入力パターンに変換する
分析部と、前記入力パターンと前記標準パターン記憶部
に蓄えられた複数の標準パターンとを照合し前記複数の
標準パターンの中で最も類似度の高い標準パターンを選
択し出力する照合部と、前記照合部が選択した標準パタ
ーンに対応する単音節を出力する出力部とを備える構成
である。

【０００６】本発明の単音節認識装置は、標準パターン
記憶部で記憶する任意の単音節の標準パターンとして、
当該音節を先頭に持つ任意の音節系列に助詞の「の」お
よび前記当該単音節が継続する標準パターンを記憶して
もよい。

【０００７】本発明の単音節認識装置は、１および複数
の音節系列の日本語における出現頻度情報を蓄える音節
連鎖情報記憶部を備え、照合部が入力パターンと標準パ
ターンとを照合する際に前記出現頻度情報を参照しても
よい。

【０００８】［作用］本発明では各単音節に対応した単
語の代わりに各単音節を特定の位置に含む任意の音節系
列が許される標準パターンを用いることにより、熟練を
必要としない高精度の単音節入力装置を提供するもので
ある。

【０００９】例えば「あ」の標準パターンとして、語頭
の「あ」に任意の音節系列が続き、「のあ」で終る標準
パターンを用いる。これにより「朝日のあ」、「明日の
あ」、「頭のあ」等が発声可能となり発声の自由度が向
上するため初心者でも簡単に使用可能である。「ん」の
ように語頭に来得ない文字や単独では発音不能な濁点等
（以下、特殊文字）については従来の標準パターンを併
用するものとする。また、任意の音節系列を受理するに
当たっては日本語における音節系列の頻度情報を利用す
ることにより、より精度の高い入力が可能となる。

【００１０】

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。

【００１１】図１は本発明の第１の実施の形態を示すブ
ロック図である。

【００１２】本発明の単音節認識装置１は、入力端子２
から入力する音声波形から特徴量を抽出し入力パターン
に変換する分析部３と、任意の単音節の標準パターンと
して一つ以上の当該音節を特定の位置に含んだ任意の音
節系列を許容した標準パターンを記憶する標準パターン
記憶部４と、分析部３の出力する入力パターンと標準パ
ターン記憶部４に蓄えられた複数の標準パターンとを照
合し複数の標準パターンの中で最も類似度の高い標準パ
ターンを選択し出力する照合部５と、照合部５が選択し
た標準パターンに対応する単音節を出力端子７に出力す
る出力部６とから成る。

【００１３】次に動作について説明する。入力端子２か
ら入力された音声波形は、これを受けた分析部３により
特徴ベクトル系列に変換され、分析部３はこの特徴ベク
トルを入力パターンとして照合部５に出力する。このと
きの特徴ベクトルとしては、例えば古井著「ディジタル
音声処理」東海大学出版会（以下文献１と記す）にあげ
られているＦＦＴ分析および線形予測分析、等により得
られるケプストラムおよびＬＰＣ係数の時間変化量等が
利用可能である。

【００１４】つぎに、照合部５は、分析部３の出力する
入力パターンと標準パターン記憶部４から各単音節の標
準パターンを読み出した複数の標準パターンとを照合
し、複数の標準パターンの中で最も類似度の高い標準パ
ターンを選択し出力部６に出力する。このとき、標準パ
ターン記憶部４に蓄えられた複数の標準パターンとして
は、図３の日本語の任意音節系列を受理可能なモデル
（以下ガーベージモデルと記す）の説明図に示すモデル
を用いたものである。このモデルは、一つの状態と各単
音節に対応した自状態への弧を持ち、任意の音節を任意
の個数受理可能なモデルとなっている。

【００１５】図４は本発明に用いる標準パターン記憶部
４に格納してある標準パターンを説明する説明図であ
る。

【００１６】図４分図（Ａ）に示すように各単音節に続
いて、図３に示した任意の音節系列が受理可能なパター
ン、即ち、助詞の「の」と当該単音節が継続することを
許した単音節の標準パターンと、図４分図（Ｂ）に示す
「ん」のように語頭に来得ない文字や単独では発音不能
な特殊文字の標準パターンとの２種類とから構成されて
いる。また、入力パターンと標準パターンとの比較にあ
たっては、文献１の１７２〜１７７ページにあげられる
２段ＤＰ，ＯＳＤＰ法等の連続音声認識方式の利用が可
能である。出力部６は、照合部５で選択された標準パタ
ーンに対応する単音節あるいは特殊文字を標準パターン
記憶部４からの文字情報に基づき出力端子７に出力す
る。また、図３では、任意音節系列を受理可能な標準パ
ターンとして、音節を認識単位とする場合を示したが、
これに限らず音素等のより短い単位や、音節よりも長い
単位を用いて、任意の音節系列を受理可能な標準パター
ンを作成し、利用することができる。

【００１７】図２は本発明の第２の実施の形態を示すブ
ロック図である。本発明の単音節認識装置８は、第１の
実施の形態と比較し、音節連鎖情報記憶部１０が追加さ
れたものである。これに伴い、照合部９にも機能的には
追加がある。その他、第１の実施の形態と比較し変更の
ないものは、同一の名称および符号を付与してあり、機
能の説明は省略する。照合部９は、標準パターン記憶部
４から各単音節の標準パターンを読み出し、受けとった
音節連鎖情報を参照し頻度に応じた重み付けを行い、分
析部３から受けとった入力パターンと比較し、もっとも
類似した標準パターンを選択する。

【００１８】音節連鎖情報記憶部１０には、図５の本発
明で用いる音節連鎖情報の説明図に示すように、日本語
における１つ以上の音節系列の出現頻度情報を蓄えてお
く。この出現頻度情報は、予め大規模な日本語文章デー
タから求めておくものとし、医学、法学等の分野ごとに
複数個の出現頻度情報を持つことも可能である。図５分
図（Ａ）では１音節系列の出現頻度情報を、図５分図
（Ｂ）では２音節系列の出現頻度情報を示したが、これ
より長い音節系列の出現頻度情報を用いることも可能で
ある。

【００１９】

【発明の効果】以上説明したように、本発明は、任意の
単音節の標準パターンとして一つ以上の当該音節を特定
の位置に含んだ任意の音節系列を許容した標準パターン
を記憶する標準パターン記憶部と、入力する音声から特
徴量を抽出し入力パターンに変換する分析部と、入力パ
ターンと標準パターン記憶部に蓄えられた複数の標準パ
ターンとを照合し複数の標準パターンの中で最も類似度
の高い標準パターンを選択し出力する照合部と、照合部
が選択した標準パターンに対応する単音節を出力する出
力部とを備えるとにより、単音節を入力するにあたっ
て、あらかじめ各単音節に関連した単語を記憶する必要
がないため、熟練を必要としない高い認識性能をもつ単
音節認識装置が実現できるという効果が有る。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態を示すブロック図で
ある。

【図２】本発明の第２の実施の形態を示すブロック図で
ある。

【図３】日本語の任意音節系列を受理可能なモデルの説
明図である。

【図４】本発明に用いる標準パターン記憶部に格納して
ある標準パターンを説明する説明図である。

【図５】本発明で用いる音節連鎖情報の説明図である。

【図６】従来の単音節認識方法の文字と関連する単語の
説明図である。

【符号の説明】

１，８単音節認識装置２入力端子３分析部４標準パターン記憶部５照合部６出力部７出力端子９照合部９１０音節連鎖情報記憶部

Claims

(57)【特許請求の範囲】

【請求項１】単音節の音声を入力し認識する単音節認
識装置において、任意の単音節の標準パターンとして一
つ以上の当該音節を特定の位置に含んだ任意の音節系列
を許容した標準パターンを記憶する標準パターン記憶部
と、前記入力する音声から特徴量を抽出し入力パターン
に変換する分析部と、前記入力パターンと前記標準パタ
ーン記憶部に蓄えられた複数の標準パターンとを照合し
前記複数の標準パターンの中で最も類似度の高い標準パ
ターンを選択し出力する照合部と、前記照合部が選択し
た標準パターンに対応する単音節を出力する出力部とを
備えることを特徴とする単音節認識装置。
【請求項２】標準パターン記憶部で記憶する任意の単
音節の標準パターンとして、当該音節を先頭に持つ任意
の音節系列に助詞の「の」および当該単音節が継続する
標準パターンを記憶することを特徴とする請求項１記載
の単音節認識装置。
【請求項３】１および複数の音節系列の日本語におけ
る出現頻度情報を蓄える音節連鎖情報記憶部を備え、照
合部が入力パターンと標準パターンとを照合する際に前
記出現頻度情報を参照することを特徴とする請求項１ま
たは２記載の単音節認識装置。