JPS62121499A

JPS62121499A - 音声認識装置

Info

Publication number: JPS62121499A
Application number: JP60261482A
Authority: JP
Inventors: 増村　利行
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1985-11-22
Filing date: 1985-11-22
Publication date: 1987-06-02

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は特定話者用の音声認識装置に関し、特に、音素
標準・ぐタンを格納する音素標準・ぐタン部と、音素系
列で表現された単語を格納する学語辞書部とを有する音
声認識装置に関する。

〔従来の技術〕

特定話者用の音声認識装置を大別すると１話者に固有の
特徴パラメータとして、単語標準パタンを有するものと
、音素標準ｉ＜？タンを有するものとに分ける事ができ
る。本発明１は後者に属するものである。

音素の学習は、音素系列と、その音素系列で表現された
単語の入力音声とを照合し、それぞれの音素に対する入
力音声の特徴・９ラメータを得る事である。それは入力
音声を一定の区間に区切り。

特徴パラメータをもとめ、その区間の入力音声がどの音
素であるかに調べる事によシ行われる。

又、単語の認識は次の様に行われる。まず、入力音声を
一定の区間に区切り１区間毎に各音素標準パタンをの類
似度を計算する。次に各単語とのマツチングを行う。単
語は音素系列の形で表現されているので、その区間に対
応する音素に関する類似度を求め、それを全区間につい
て加え合わせた結果が、入力音声と音素系列との類似度
である。。

次に全単語（（ついての類似度を比較して、最大の類似
度を示す単語を認識結果とする。

ところで、入力音声がある条Ｐ！ｌ：と満たす時２例え
ば２語尾の無声子音の後（例えば、　ＲＯＫＵのＵ）。

又は無声子音にはさまれた時などに、音素が変化する場
合があるため、同一単語に対し二種類の音素系列が用意
されている。従来、この様な単語に対する学習は、入力
音声がどちらの音素系列に属するかを調べるために、同
じ単語の入力を二面行い、それぞれ別の音素系列との類
似度をもとめて。

類似度の大きい方の音素系列を選択し、前述した処理を
行っていた。

以下余日〔発明が解決しようとす不問厘点〕従来の音声認識装置では、前記単語に対する発声が二面
必要であり１話者を混乱させる恐れがあると同時に１話
者への負担が大きくなるという欠点がある。

又、前述したように、二つの音素系列の違い、：ｄ。

その系列中の一部の声素の違いであり、二面の発声が全
く同じであるという保障もないので、類似度の差は、音
素の違いによるものでもあり２発声の違い；こよるもの
でもある。従来は音素の違いによるものとみなして処理
していたわけであるが６発声の違いによる影響の方が太
きかった場合、まちがった音素系列全選択してしまう可
能性がある。

そして、誤った音素標準・ぐタンを作成してしまい。

ひいては、認識率の低下をひきおこすという欠点がある
。

本発明の目的は、二種類の音素系列を持つ単語に関する
学習を一回の発声で行うことができるようにして１話者
の負担全軽減すると共に、認識時にまちがった音声系列
全選択することのない認識率の向上した音声認識装置を
提供することにある。

〔間原点を解決するだめの手段〕

本発明によれば、特定話者用の音声認識装置において、
二種類の音素系列で表現された単語を格１納する単語辞
書部と、該単語の入力音声と該単語辞書部の該単語に関
する前記二種類の音素系列のうちの一方とを照合し、そ
れぞれの音素に対する特徴パラメータを抽出し、類似度
を計算する第１の学習機能部と、該単語の入力音声と該
単語辞書部の該単語に関する前記二種類の音素系列のう
ちの他方とを照合し、それぞれの音素に対する特徴パラ
メータを抽出し、類似度を計算する第２の学習機能部と
、該第１及び第２の学習機能部のうち。

類似度の大きい方の学習；幾能部での処理結果をもとに
して音素標準・ぐタンを作成し、音素標準・ぐタン部に
格納する制御部とを備えたことを特徴とする音声認識装
置ｔが得られる。

〔実施例〕

次に本発明について図面を参照して説明する。

第１図は本発明の一実施例による音声認識装置のブロッ
ク図である。１はマイクロホン、２は音声入力部、３お
よび９は学習・認識部、４および１０は単語辞書部、５
および１１は音素標準７４７７部、６は制御部、７は制
御部６を制御する制御プログラムが格納されるメモリ部
、８は表示部を゛示す。この図において、学習・認識部
３および学習・認識部９は、制御部６の制御により学習
機能力認識機能かのどちらかを選択する。

二種類の音素系列を持つ単語に関する学習を行う場合の
処理の流れを次に列挙する。

（１）制御部６の制御てより、学習・認識部３および学
習・認識部９を学習機能に設定する。

（２）制御部６は、学習・認識部３の学習対象用音素系
列を、二種類の音素系列のうちのどちらか一方（即ち、
単語辞書部４）とする。

（３）制御部６は、学習・認識部９の学習対象用音素系
列を、もう一方の音素系列（即ち、単語辞書部１０）と
する。

（４）制御部６は１表示部８に該当単語を表示し。

話者に発声を促す。

（５）話者はマイクロホン１に音声を入力する。

（６）　　音声入力部２は、入力音声のΦ変換等の処理
を行いその：結果を学習・認識部３および学習・認識部
９に送る。

（７）学習・認識部３および学習・認識部９は送られて
きたデータ全もとにそれぞれの音素に対する特徴パラメ
ータの抽出、類似度計算等を行う。

（８）　　制御部６は、二つの類似度を比較して類似度
の大きい方の学習・認識部での処理結果をもとにして音
素標準・ぐタンの作成を行い、対応する音素標準・ぐタ
ン部５または１１に格納する。

尚１本装置において学習・認識部３および学習・認識部
９を認識機能に設定し、単語辞書部４と単語辞書部１０
に異なる単語辞書を格納しておけば。

従来の約２倍の単語を認識する事も可能である。

〔発明の効果〕

以上説明したよって本発明は、二つの学習機能部を有す
る事により、二種類の音素系列を持つ単語に関する学習
を一回の発声で行う事ができ話者の負担が軽減すると同
時に、まちがった音素系列を選択することがないので認
識率の向上が見込まれるという効果がある。

【図面の簡単な説明】

第１図は本発明の一実施例だよる音声認識装置のブロッ
ク図である。１・・・マイクロホン、２・・・音声入力部、３，９・
・・学習認識部、４．１０・・・単語辞書部、５．１１
・・・音素標準・やタン部、６・・・制御部、７・・・
メモリ部。８・・・表示部。３゛°′−１，１（ゴム（７７８３）弁理士？也田憲保　は、−ノ。

Claims

【特許請求の範囲】

１、特定話者用の音声認識装置において、二種類の音素
系列で表現された単語を格納する単語辞書部と、該単語
の入力音声と該単語辞書部の該単語に関する前記二種類
の音素系列のうちの一方とを照合し、それぞれの音素に
対する特徴パラメータを抽出し、類似度を計算する第１
の学習機能部と、該単語の入力音声と該単語辞書部の該
単語に関する前記二種類の音素系列のうちの他方とを照
合し、それぞれの音素に対する特徴パラメータを抽出し
、類似度を計算する第２の学習機能部と、該第１及び第
２の学習機能部のうち、類似度の大きい方の学習機能部
での処理結果をもとにして音素標準パタンを作成し、音
素標準パタン部に格納する制御部とを備えたことを特徴
とする音声認識装置。