JPH01290000A

JPH01290000A - 音声認識方式

Info

Publication number: JPH01290000A
Application number: JP12161688A
Authority: JP
Inventors: Mitsuhiro Toya; 充宏斗谷; Hiroyuki Iwahashi; 岩橋　弘幸
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1988-05-17
Filing date: 1988-05-17
Publication date: 1989-11-21

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、入力音声を音節単位で認識し、認識した音節
の組きわせから文節候補を選び出す音声認識装置におい
て実施される音声認識方式に関する。

従来の技術音声ＭＩｌ識装置は、入力音声を音節毎にセグメント化
し、音節識別部において予め登録された音節標準パター
ンと入力音声とをパターンマツチングして入力音声を構
成する各音節を認識し、　ｖｉ、識された音節の組合せ
から得られる複数の文節候補の中から最適な文節候補を
選ぶことによって文章などを作成する。

このような音声認識装置では、文節候補の出力順を設定
するにあたっては、認識音声に含まれるアクセント情報
が考慮される。アクセント情報を考慮することによって
、文節候補の出力順序を効率よく設定することができる
とともに、たとえば同音の自動選択を行うことができる
場合がある。

たとえば、「雨（あめ）」および「飴（あめ）」の２つ
の語句については、キーボードによる入力処理において
は自動選択は不可能である番すれども、アクセントの相
違を識別することができる音声入力装置においては、こ
れら２つの同音語の自動選択を行うことが可能である。

発明が解決しようとする課題前述した音節標準パターンを登録する際には、予め定め
られた語句に′）いて発声者の音声が音節単位にセグメ
ント化され、各音節毎の音節標準パターンが作成される
。音節標準パターンを作成する際に発声される語句のア
クセントは予め設けられたアクセント辞書に登録されて
おり、このアクセン１〜辞書からの情報に基づいて音声
認識を行うことがてきる。

しかしながら、予め設けられたアクセント辞書は、いわ
ゆる標準語に関するアクセントの情報が登録されており
、このアクセント情報はたとえば大阪地方出身の人のア
クセントとは相違している。

したがって、大阪地方出身の操作者がこの装置を使用す
る場６には、大阪地方のアクセントを有するアクセント
辞書を備えなければ正確な音声認識を行うことは困難で
ある。また、複数の地方にっいてのアクセ〉ト辞書が予
め設けられていた場ぎても、使用する操イヤ者は自分に
適合したアクセント辞書を選択するなとの操作が必要で
ある。

本発明の目的は、音声認識を行うために必要な音声の登
録作業時において、発声者に適きしたアクセントの種類
を選ひ出すことができ、操作性が向上された音声認識方
式を提供することである。

課題を解決するための手段本発明は、複数の音節から成る意味のある複数の各語句
のアクセンｔ・を各語句毎に相互に対応して複数種類予
め登録しておき、予め定める語句を表示し、発声された音声のアクセ〉′
■・を検出し、その検出されたアクセントと前記予め定める語句に対応
して予め登録されている複数種類のアクセントとを比較
して、一致するアクセントの種類を選び出し、前記選び出されたアクセントの種類に対応する各語句毎
の登録されているアクセントの種類を用いて音声認識を
することを特徴とする音声認識力式である。

作　　用本発明に従えば、複数の音節から成る意味のある複数の
各語句のアクセントは、各語句毎に相互に対応して複数
種類予め登録されている。音声認識を行うために必要な
音声登録を行う際には、予め定める語句が表示され、こ
の語句について発声された音声のアクセントが検出され
る。この後に、検出されたアクセントと前記予め定める
語句に対応して予め登録されている複数種類のアクセン
トとが比較され、相互に一致するアクセ〉トの種類が選
び出される。

音声認識を行うにあたっては、前記選び出されたアクセ
ントの種類に対応する各語句毎の登録されているアクセ
ント・の種類が用いられる。これによって発声された音
声のアクセントの種類と予め登録されているアクセント
の種類とが一致し、操作者は予め登録されているアクセ
ンｌ−の種類のうちから自分に適きしたアクセントの種
類を選択する作業から解放され、操作性が向上される。

実施例第１図は、本発明の一実施例の電気的構成を示すブロツ
ク図である。発声された音声は、マイクロフォン１て電
気的信号に変換され、増幅器２て増幅された後にアナロ
グ７、′デジタル変換器３でデジタル信号に変換されて
音声分析部４に与えられる。音声分析部４では、入力音
声がｌ　６　ｒｎ　ｓ　ｅ　ｃ程度のフレームに分割さ
れ、スペクトル分析が行われる。分析された結果、たと
えば音節区間の抽出に必要な情報や各フレーム毎の基本
周波数（ピッチ）およびスペクトル分析の特徴パターン
などが、８　ｍ　ｓ　ｅ　Ｃ程度の間隔で音節区間抽出
部５に与えられる。

音節区間抽出部５では、音声分析部４がらの情報に基づ
いて入力音声を構成する各音節が切り出され、切り出さ
れた音節の特徴パターンと、音節区間の中から母音定常
部のフレームのピッチ情報とが中央制御部６を介してパ
ターン記憶部７の特徴パターン領域８に記憶される。パ
ターン記憶部７は、前述したように入力音声を構成する
各音節の特徴パターンが複数個記憶される特徴パターン
領域８と、音声認識を行うために必要な音節標準パター
ンが複数個記憶された標準パターン領域９とから構成さ
れる。

単音節認識部１０ては、前記特徴パターン領域８に記憶
された特徴パターンと標準パターン領域９に記憶された
音節標準パターンとのいわゆるパターンマンチ〉゛り（
比較照な）が行われ、この認識結果が中央制御部６に与
えられる。

中央制御部６には、後述される登録用語句のアクセント
辞書１１と後述される認識用のアクセンｌ−辞書１２と
から成るアクセント辞書１３と、複数の音節に対する認
識結果が記憶される認識結果記憶部１４と、キーボード
１５と、後述するような登録単語の表示などを行う表示
装置１６と、前記認識結果などを外部装置に転送する際
の制御が行われるインタフェイス部１７と、発声者の音
節標準パターンやアクセント情報などが記憶される記憶
部１８とがそれぞれ並列に接続される。

次に、発声された音声のアクセント判定の手順について
説明する。日本語では、アクセントの表現が主に音程（
基本周波数（ピッチ）の変化）を主体としている。

先ず最初に、表示部１６の表示画面に登、録すべき語句
、たとえは「頭（あたま）」が提示される（第２図参照
）。次に発声者によって発声された音声が分析されて、
音節単位に分割され、各音節毎にその音節区間を代表す
る基本周波数が算出される。たとえば語句「あたま」を
構成する各音節「あ」、「た」、および「ま」において
、たとえば第３図（１）に示されるような基本周波数が
得られる。

各基本周波数は、これ以降の信号処理の便宜のためにそ
の数値の変換が行われる。たとえば、各音節の特徴を表
す値として、ある定数（ｘ＜　＝　１２０００）を前記
各基本周波数で割った値が用いられる。このように変換
された各音節の特徴を示す変換値Ｐは、たとえば第３図
〈２）に示される。

前記変換値Ｐには、次のような補正が行われる。

一般に、複数音節から成る単語をいわば自然発声した場
合には、後ろの音節はどその基本周波数が小さくなる傾
向があり、これを補正するために次の第１式で示される
補正式が用いられる。

ＰＬ＝Ｐ−３ンｌＮ−１）　　　　　　　　　　　・・
・　　（１）こうして補正された値ＰＬ（以下、特徴値
Ｐ１と称する）は、第３図（３）に示されるよでに算出
される。

次に各音節毎の特徴値Ｐ１を相互に比較してその音程の
高低が判定される。この判定を行うにあたっては、次の
第１表が参照される。

第　　１　　表すなわち、発声された語句を構成する音節のうち、特徴
値Ｐ１が最も小さいものく基本周波数が最も大きいもの
）を選び出し、この最小値Ｐ１．。

を基準にして他の音節の音程の高低が判定される。

「低い」と判定された音節は、「１」がセットされる。

「高い」と判定された音節は、「２」がセンｔ〜され、
それ以外の場きは「不定」と判定され、「３」がセット
される。このような判定方法によって、第３図（３）に
示される特徴値を比較すると、第３図（４）に示される
ような判定結果（アクセントパターン）が得られる。

こうして意味のある複数の音節からなる語句のアクセ〉
・ドパターンが決定される。前記登録用アクセン１〜辞
書１１には、予め定める語句について設定された複数種
類のアクセントパターンが登録されている。たとえば第
４図に示されるように、「あなま（頭）Ｊという１つの
単語に関して、標準語のアクセントパターン、大阪地方
のアクセントパターン、および任意の地方のアクセント
パターンの３種類のアクセントパターンが登録されてい
る。また、同一地方のアクセ〉′ｌ・パターンに関して
も、さらに詳細に第１種類のアクセント１および第２種
類のアクセント２が示され登録されている場きもある。

このようなアクセントパターンが登録された登錘用アク
セント辞書１１を用いるのは、発声された音声によって
複数の音節のうちから最適なものを選び出す際にアクセ
ン１〜パターンを考慮することによって、文節候補の選
択を効率よく行うことができるからである。また、同音
語についても、アクセントパターンを考慮することによ
って容易に識別することが可能となり、音声認識を確実
に行うことができるからである。

第５［２Ｉは、動作を説明するためのフローチャートで
ある。

ステップｎ　ｌでは登録すべき単語が表示され、これを
目視した発声者が登録単語を発声する。発声された音声
はステップｒＩ２で特徴抽出され、ステップｎ　３でそ
のアクセントパターンが検出される。

ステップｒ１４ては、検出されたアクセン）−パターン
と、登録用アクセンｌ−辞書１１内の該当単語のアクセ
ントパターンとが各音節毎に比較照会される。このとき
音節の音程が「不定」であることを示す「３」に対応し
た音節に関しては、登録用アクセ〉・ト辞書の内容にか
かわらず一致したものとみなす。このようにして比較照
６を行った後に、ステップｎ　５で該当単語の全音節が
一致した地方についてカウント数をインクリメント・す
る。たとえば大阪地方の第１種類のアクセン）−１と一
致し、その他の地方とは一致しなか−）た場合には、大
阪地方に−）いてのカウント数がインクリメントされる
（第２表参照）。

第　　２　　表ステップｒ＋　６では、登録用アクセント辞書１１内の
全ての単語について比較照会が行われたがどうかが判断
され、そうでないときにはステップｒ１１に戻り、こう
してステップｒ１１〜ｒ＋　６を繰返し、登録用アクセ
ント辞書１１内の全ての単語についての比較照６が終了
するとステップｒ＋　７に移る。

なお、各地方に−）いてのカラン■・数は、登録作業開
始以前に全て「０」に設定しである。このような処理は
、登録すべき単語の数だけ行われ、こうしてステップの
７で全ての登録単語に関する比較照会結果に基づいて発
声者のアクセントの判定が行われ、動作を終了する。

アクセントの判定方法としては、たとえば各地方に一致
した単語数を登録単語数て除算することによって、ｉ地
方の適合度数Ｐｉを算出し、この１Ｍ会度数Ｐｉを用い
ることによ−）て実現される。

すなわち、適き度数Ｐｉが最も大きく、かつ０８以上の
地方を発声者の属するアクセントの種類であると判定す
る。音声認識を行う際には、判定されたアクセントの種
類の辞書を参照して行われる。なお、適な度数Ｐｉが０
．８以上の地方が存在しない場きには、その発声者のア
クセントの種類の限定をするのは困難であるとみなし、
アクセント辞書を参照せずに音声認識を行うようにする
。

このような判定基準によって発声者のアクセントに関す
る情報、たとえば第６図に示されるような表示をするこ
とも可能である。これによって発声音は、自分の属する
アクセントの種即を認識することもできる。

このようにして複数種類のアクセント・辞書のうちから
、発声者の属するアクセント辞書を音声登録の作業中に
自動的に選択することができ、発声者が自分の属するア
クセント辞書を選択する作業を省略することがてきる。

また、記憶部１８には発声者の音節標準パターンやアク
セント情報が記憶されるので、−度、音声登録すれば、
これ以降の装置の使用に際しては、登録された音節標準
パターンを読み出すと同時にアクセント情報も読み出す
ことができ、これによって前述したように発声者に適合
したアクセント辞書を自動的に選択することができ、ぞ
の操作性が向上される。

なお、本実施例では、登録用アクセント辞書１１に複数
地方のアクセントパターンか登録されているけれども、
たとえば標準語のアクセント情報のみが登録されたアク
セント辞書を用い、前述したような判定基準によ−）て
発声者が標準語に適合するか否かを判定するようにして
もよい。

発明の効果以上の本発明に従えば、音声認識を行うのに必要な音声
登録を行う際において、発声者にＭ　自したアクセ〉ト
の種類を自動的に選択することができ、その操作性を向
上することができる。

【図面の簡単な説明】

第１図は本発明の一実施例の電気的構成を示すブロック
図、第２図は登録単語の一表示例を示す図、第３図はア
クセントバター〉・の検出を説明するための図、第４図
は登録用アクセント辞書１１の登録内容の一例を示す図
、第５図は動ｆ？を説明するためのフローチャー■・、
第６図は一表示例を示ず図である。４−・・音声分析部、５・・・音節区間抽出部、６・・
・中央制御部、７−・パターン記憶部、８・・・特徴バ
ター〉・領域、≦）・・・標準パターン領域、１０・・
単音節認識部、１１・・・登録用アクセ〉゛［・辞書、
１２・・・認識用アクセント辞書、１３・・・アクセン
ト辞書、１４・・・認識結果記憶部、１５・・キーボー
ド、１６・−・表示装置？

Claims

【特許請求の範囲】複数の音節から成る意味のある複数の各語句のアクセン
トを各語句毎に相互に対応して複数種類予め登録してお
き、予め定める語句を表示し、発声された音声のアクセント
を検出し、その検出されたアクセントと前記予め定める語句に対応
して予め登録されている複数種類のアクセントとを比較
して、一致するアクセントの種類を選び出し、前記選び出されたアクセントの種類に対応する各語句毎
の登録されているアクセントの種類を用いて音声認識を
することを特徴とする音声認識方式。