JPS6060698A

JPS6060698A - 音声標準特徴パターン作成処理装置

Info

Publication number: JPS6060698A
Application number: JP58168797A
Authority: JP
Inventors: 佐藤　泰雄; 教幸藤本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-09-13
Filing date: 1983-09-13
Publication date: 1985-04-08
Also published as: JPH0331275B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】囚　発明の技術分野本発明は音声標準特徴パターン作成処理方式。

クル゛に、未知入力音声から得られる入力特徴パターン
との照合に用いられる標準特徴パターンに関する登録音
声を、再生して使用者に聞かせるようにし、誤った発声
による標準特徴パターンを再登録できるようにした音声
標準特徴パターン作成処理方式に関するものである。

（Ｂｌ　従来技術と問題点一般に音声認識において、認識率を向上させるためには
、音声情報からどのような特徴パラメータを抽出し照合
に用いるかが重要でちるが、そのシステムで定められた
０似抽出により、各項目を代表する標ｆ！特徴バ２メー
タとして、いかに最適なものを辞書に用意するかについ
ても重要である。

特徴の抽出のし方や照合のし方が、いかに優れていても
、辞書中に登録される標準特徴パターンに。

雑音付加パターン、不明瞭発声パターン等の不良標準％
徴パターンや１例えばｒａＪを登録すべきときに「ｉ」
と発声してしまう等の発声誤りによる誤り標準特徴パタ
ーンが多ければ、認識率は向上しない。

標準特徴パターンは、辞１．中にディジタル情報で記憶
され、その数が多り１機械部品のように目にみえるわけ
ではなく、またすべての標ｉｋｊ＜特徴ハターンが一律
に使用されるわけではないので、一旦登録されてしまう
と、上記不良標準特徴パターン、誤り標準特徴パターン
等の検出は容易ではない０従来、一旦登録した標準特徴パターンはすべて正しいも
のとして扱い、認識誤りが生じた場合。

認識させようとする入力音声が悪いか、またはｌ′Ｚ識
の限界であって、止むを得ないものとされるのが一般的
であった。また、誤ｕ　ｉ１＆を生じさぜた入力音声か
ら抽出された入力特徴パターンと、既に登録されている
標準特徴パターンとのいわゆる平均化によシ、辞書の品
質を改良していく学習方式等も提案されているが、登録
済みの標準特徴パターンが、ある程度正しいという前提
のもとにとられる方式であって、標準特徴パターンが誤
っている場合には、収束が遅いという問題がちった。

登録しようとする標準特徴パターンま／こは既に登録さ
れている標準特徴パターンが適描なものではない場合、
それを検出して再登録できるようにすることが望まれる
。

ところで、従来、音声の認識結果を音声で出力する方式
は考えられていたが、認識結果として出力される音声の
情報は、各項目に対応して用意されているものであって
、各標緒特徴パターンに対応して用意されているもので
はなかった。そのため、誤認πλが生じた場合等に、出
力音声をＩｊｒＪいても、それによって標準特徴パター
ンの良否を決定することはできなかった。

（Ｃ１発明の目的と（；・１成本発明は上記問題点の解決を図り、登録／練習モード時
もしくは認識モード時に、′ｆＡ在着目されている標準
特徴パターンのもとになった登録音声を再生して出力す
ることにより、使用者が誤った発声による登録であるこ
とを認知できるようにし。

妥当でない標準特徴パターンについてｔよ、７＋）登録
することにより、辞書の品質を向上させｌ　Ｉ：ｇｊｔ
ｆｆｉｔ率を高めることを目的としている。そのため９
本発明の音声標準特徴パターン作成処理方式は、未知入
力音声を音響分析して得られる入力！１ヶ徴パターンと
、予め辞書中の各項目に対応して格納された標準特徴パ
ターンとの照合によって、８声ＩＸ　職を行う音声認識
システムにおいて、上記標準％％ａパターンを上記辞書
中に登録するにあたって１Ｊｔｔｔ：のだめに入力した
音声を再生して出力する音ｐ３　Ｗｆ生部と、登録音声
発声誤りに関する指示を入力する登録音声誤り指示部と
、該登録音声誤り指示部からの指示にもとづいて当該登
録音声情へ・１）を棄却する登録棄却部とをそなえたこ
とを特徴としている。

さらに、もう１つの本発明は、未知入力ｆｆ声を音響分
析して得られる入力％徴パター：／と、予め辞書中の各
項目に対応して格納された標＄ｌｊｒ憧パターンとの照
合によって、音声認識を行う音Ｐ’Ｊ　Ｐｇ識クシステ
ムおいて、上記辞書は上記標準％　ｒ；、＜パターンに
対応して音声情報を記憶する音声情報記憶部をそなえ、
音声認識時または認識誤りが生じた際に上記辞Ｑ中の該
当する上記音声情報にもとづいて音声を再生して出力す
る音声再生部と、使用者の指示により当該標準特徴パタ
ーンの登録を削除する登録削除部とをそなえたことを特
徴としている。以下図面を参照しつつ、実施例に従って
説明する。

（Ｄｉ　発明の実施例第１図は音声パターンの分布と標準特徴パターンとの間
係を説明するための図、第２図は本発明による処理概要
を説明するだめの図、第３図は本発明の一実施例（、゛
Ｊ城、力４図は第６図図示実施例における音声１チ生に
ついての説明図を示す。

第１図において、Ａ、Ｂ、Ｃの実線で囲まれた部分は、
パターン空間における実際の音声パターンの分布を示し
、Ａ１およびＡ２は単語Ａ（単音節を含む。以下同称。

）に対する登録された標準特徴パターン、Ｂ１ないしＢ
３は単語Ｂに対する標準特徴パターン、Ｃ１は単語Ｃに
対する標準％微パターンを表わしている。図示Ｃのよう
に、１つの単語項目について、１つの標準特徴パターン
でカバーできる場合もあるが２通常２図示Ａ、Ｈのよう
に。

１つの項目について複数の標準特徴パターンを用意し、
認識すべき音声パターンの分布屈曲をカバーするのが普
通である。例えば、未知入力■声の入力ｌ特徴パターン
Ｘが抽出されると、その人力Ｉｔｓ徴パターンＸと各標
準特徴パターンＡ、１１　Ａ２１１３１　＋・・・・・
・とのマツチング距離の演３Ｆ、を行い、距離の小さい
標準特徴パターンの属する項目をＰだ舵結里とする。

もし、辞書に登録された標準特徴で（ターンの中に、音
声パターンの分布から外れた不良性イ（へ１”ろ・微パ
ターンや誤り標準特徴パターン等が心れば、認識率は劣
化することとなる。本発明は、このような妥当でない標
準特徴パターンを登録前または登録後に削除することに
よって、認識率を向上さぜようとするものである。

例えは、第２図図示の如く、単語「衣谷」の音声パター
ンの分布が２図示Ｓであり１．甲飴［ト１比谷」の音声
パターンの分布が図示Ｈであったとする。辞１！ｌ：の
作成にあたって、それぞれ復航側の標バヘ！１ン徴パタ
ーンを登録するとき、操作ミスまたは発声ミスによって
、「シプヤ」と発声すべきところを、誤って「ヒビャ」
と発声し、この標準特徴パターンＳ３を登録してしまっ
たとする。標準％微パターンＳ３は、実際には「ヒビャ
」の音声）（ターンであるにもかかわらず、辞書におい
ては単語「波谷」にが≦するものとして記憶されること
になる。

１兜、上記のように登録されてしまうと２例えば「シブ
ヤ」の発声に対する認識にあたっては。

標準特徴パターンＳ１およびＢ２だけがマツチングし。

パターンＳ３はマツチングしない。しかし、パターンＳ
、が誤っていることは、検知されず、単にパターンＳ、
に該当する発声がなされないとして扱われる。一方９例
えば第２図図示の如く、「ヒビャ」について入力性徴パ
ターンＸの発声がなされたとする。入力特徴パターンＸ
と標準特徴パターンＳ３との距離ｄ、は、標準特徴パタ
ーンＨ８との距離ｄ２よシも小さいため、パターンＸは
、単語「波谷」と認識されることとなる。この場合、従
来の学習方式等によれば、相準特徴パターンＳ３が誤っ
ているというよりも、むしろ、単語「日比谷」の４”ツ
〕′＜へ特徴パターンＨ１，Ｈ２，Ｈ，が適当でないと
判断し。

「日比谷」に屑する標準特徴パターンの追加、イ１へ正
を行うようにされていた。そのため、誤り４．１％　３
Ｔ／！特徴パターンＳ３は、そのまま辞書中に放置され
ることとなる。

本発明の場合、第３図を参照して後述する如く。

まず第１に、標準特徴パターンを登録しようとして入力
した音声を、その場で再生して出力することにより、そ
の出力音声が登録を意図したものと同じでおるかどうか
を聞きわけることができるようにし、上記標準特徴パタ
ーンＳ３のような誤り標準特徴パターンの登録が、未然
に防止されるようにする。さらに他の本発明は、第５図
を参照して後述する如く１間違って上記誤り標準特徴パ
ターンＳ３が登録されてしまったとしても、その標準特
徴パターンＳｓが認識候補に用いられたとき、バタ−ン
Ｓ３に関する登ｆＪ音声を再生して出力することにより
、該’！９’ｉ　Ｘへ！１ケ徴パターンＳ３が妥当なも
のでちるか否かを判断できるようにする。これによって
。

不良標バ゛口［ケ徴パターン等を検出し、辞書中から排
除できることとなる。

第６図は２本発明の一実施例栂成を示すブロック図でる
って１図中、符号１はマイクロホ／、２は音７ｊｊ、・
分析部、６はパターン抽出部、４は切替部。

５は音声再生部、６はスピーカ、７は入カイ々ターン・
バッファ、８はが択キー、９は誤り指示部。

１０はパターン追加部、１１は登録梨却部、１２は辞書
、１６は照合判定部を表わす。

マイクロホン１から入力された音声信号は、音ｆ；２戸
分析部２において周波数分析される。音響分析部２は９
例えば帯域フィルタ群、パラメータ抽出回路等を有して
おり、入力音声の特信景（パラメータ）５例えば第１ホ
ルマント周波θに相当するモーメントＭ１や、第２ホル
マント周波数に相当するモーメントＭ２や、さらには、
低域電力や高域電力などを抽出し、これらの４′￥微量
に関するサンプル点を決定して、＠微量の時系列情報を
得る。

音響分析部２において得られたノ（ラメータ時系列情報
は、パターン抽出部６に入力される。）ぐターン抽出部
３は、このパラメータ時系列情報から。

入力音声の特徴を表わす入力４守徴ノ（ターンを抽出す
る。切替部４は、パターン情報の登録または照合を１例
えばキーボード（図示省略）からのモード切替指示によ
り、切り替えるものでるる。

登録モードが指示されている場合、上記入力１ｒ＋ｆ歓
パターンは、入カバターン・ノ（ツファ７に保持される
。音声再生部５は、登録のだめの入力音声を、音声合成
等により再生して、スピーカ６から出力する。これによ
って９例えば「シブヤ」と発声すべきところ、誤って「
ヒビャ」と発声した場合に、登録前にその発声を耳で確
認できるため。

誤りを検知できる。選択キー８は、登録するかしないか
を選択するためのキーである。旧り指示部９は、登録の
場合には、パターン追加部１０を起動し２発声誤りのた
め、登録しない場合に（よ、登録棄却部１１を起動する
。パターン追加部１０は。

入カバターン・バッファ７に格納された入力０９パター
ンを、標準特徴〕くターンとして、辞書１２へ追加登録
する。登録棄却部１１は、入カッ（ターン・バッファ７
上の入力特徴）くターンを棄却し。

再発声入力を促す。照合判定部１６は、認識モード時に
、入力特徴パターンと、辞書中の標準特徴パターンとを
照合し、認識結果を出力するものでちる。

なお、第３図において、ノ（ターン追加部１０は。

無条件にパターンの追加登録を行い、後に誤シ指示部９
からの指示により、登録棄却部１１がその登録を抹消す
るようにしてもよい。

音声再生部５は９例えば第４図図示の如くにして、入力
ｉｆ　？をＭ生して、スピーカ６に出力することができ
る。第４図（イ）図示の場合、登録音声を音８１蓼分析
して得られた％徴ノくラメータ時系列をもとに、音声合
成することにより、音声を出力している。なお、この音
声合成は９周知の技術により実現できるので、ここでは
この程度の説明にとどめる。

第４図（ロ）図示の場合、登録音声をアナログ／デジタ
ル変換したディジタル音声を、そのｉｔ音声バッファに
蓄え、音声再生部において、ディジタル／アナログ変換
を行って出力する。第４図（ハ）図示の場合、登録音声
をアナログ・デジタル変Ｊｆｉ　したディジタル音声を
、音声符号化して＋ＴＪ’７”バッファに保持し、それ
を復号してディジタル／アナログ変換することにより、
音声を０生している。

第５図は他の本発明の一実施例措成、第６図は第５図図
示実施例の音声再生方式説明図を示す。

図中、符号１ないし６，１２．１３は第３図に対応し、
２０はパターン争音声登録部、２１は誤認識指示キー、
２２は登録削除指示キー、２３は誤認識指示部、２４は
登録削除部、２５は＊　７’情報記憶部を表わす。

第６図図示実施例の発明では、登録時にイｉ、録音声を
再生して出力するが、第５図図示実施例の場合、認識時
に常時または認識誤りが生じた１ケに。

選択された標準特徴、パターンに関する登り音７＋７を
再生して出力する。従って、登録後にも、１１１リイγ
準特徴パターンの検出および再登録が可能である。

音ツ、ン分析部２．パターン抽出部３．切替部４は。

第３図で説明したものと同様である。パターン・音声登
録部２０は、登録モード時に、登録背戸の入力特徴パタ
ーンとともに、第６図を参照して後述する音声情報を、
辞−？！！：　１２中の音声情報記憶部２５へ、標準特
徴パターンに対応させて登録する。

認ｉ＋ｉｉ２モード時、照合判定部１３は、入力特徴パ
ターンと各標準特徴パターンとの距ｐＨを演算し。

照合を行う。そして、距ｔｌの小さなものを認識結果と
して出力する。使用者は、認識結果が誤っている」ん合
に、誤認識指示キー２１を押下する。誤認ａ１に指示部
２３は、誤認耀指示キー２１の押下を検出して）ａＵＮ
ｔλ誤りを辞書１２の処理部または音声再生部５へ迫知
する。音声再生部５は、認識候補第１位または所定の範
囲内もしくは使用者の要求範囲内のｔλ準特徴パターン
に対応する音声情報を、音声情報記・は部２５から読出
し、音声を再生してスピーカ６から出力する。

一般に誤認識が生じる原因として、未知入力音声が不明
瞭でちる場合と、標準特徴パターンが適尚でない場合と
がある。本発明の場合、音ｒ；４１生部５による音声出
力によつ゛Ｃ２認識時に選択された標準特徴パターンの
妥当性がチェック可能となる。もし、標準特徴パターン
が妥当なものでない場合、使用者は、登録削除指示キー
２２を押下する。この押下によって、登録削除部２４は
、辞デ１１２中の当該標準特徴パターンおよびその音声
情報を削除する。そして、必要であれば、登録モードに
切替えて、正しい標準％徴パターンを７１）登ｆ？する
。なお、音声再生部５は、上述の如く、認識誤シが生じ
たときだけ、音声を再生して出力してもよいし、また、
照合判定部１３が認識結果を出力する際、その結果に従
って、認識誤りの有無にかかわらず音声を出力するよう
にしてもよい。

次に、第６図を参照して、音声再生の処理について説明
する。例えば第６図（イ）図示の如く、旦り５１時に、
登録音声を音ｔ・分析して得られた’ＶＦｊ徴パラメー
タ時系列を、辞書１２に記憶する。音声ｆ）生部５は、
その特徴パラメータ時系列を読出して。

音声を合成し、スピーカ６へ出方する。また、第６１ｙ
Ｉ（ロ）図示の如く、登録音声をアナ四グ／ディジタル
変換したディジタル音声を、そのままの形で辞窃１２へ
格納しておき、認識時に読出して、ディジタル／アナロ
グ変換を行い、音声を再生してもよい。さらに第６図（
ハ）図示の如く、辞書１２の記憶領域を削減するため、
登録音声をアナログ／ディジタル変挨後に音声符号化し
、その符号化情報を辞書１２へ記憶し、認識時に俵号し
て音声を１゛）生じ出力するようにしてもよい。

ｆｉｌ　発明の効果以上説すｊした如く９本発明によれば、雑音付加パター
ン、不明瞭発声パターン等の不良特徴パターンや、誤り
発声にょるーシ標準特徴パターンの登録防止もしくは登
録削除が容易にできるようになり、経書の品質を向上さ
せて、認識率を良好にすることが可能となる。

４、　図面の？ざｊ単な説明第１図は音声パターンの分布と標準特徴パターンとの関
係を説明するための図、第２図は本発明による処理概要
を説明するための図、第６図は本発明の一実施例措成、
第４図は第３図図示実施例における音声再生についての
説明図、第５図は他の本発明の一実施例購成、第６図は
第５図図示実施例の音声再生方式説明図を示す。

図中、３はパターン抽出部、５は音声再生部。

９は誤り指示部、１１は登録棄却部、１２はＦ′ｆＷｔ
＋１３は照合判定部、２３は誤認識指示部、２４ｔよ登
録削除部、２５は音声情報記憶部を表わす。

特許出願人　富士通株式会社

Claims

【特許請求の範囲】

（１）　未知入力音声を音０分析して得られる入力４’
Ｗ　Ｑパターンと、予め辞谷中の各項目に対応して格納
された標準特徴パターンとの照合によって。音声認ｔ１λを行う音声認識システムにおいて、上記（
、ｙ＋　ｊ、；’ｌ　１ｆ４ｊ徴パターンを上記辞ｔ９
・中に登録するにあたって、登録のために入力した音声
を再生して出力する音声再生部と、登録音声発声誤りに
関する指示を入力する登録音声誤り指示部と、該登録音
声誤り指示部からの指示にもとづいて当該登録音声（ｊ
’？報を原動する登録棄却部とをそなえたことを特徴と
する音声標４！特徴パターン作成処理方式。
（２）　上記音声再生部は、上記入力音声の再生にあた
って、該入力音声を音谷分析して得られた特徴パラメー
タ時系列を用いて音声合成することを特徴とする特許請
求の範囲第（１）項記載の音声停準特徴パターン作成処
理方式。
（３）　未知入力音声を音響分析して得られる入力特徴
パターンと、予め辞書中の各項目に対応して格納された
標準特徴パターンとの照合によつで。音声認識を行う音声認識システムにおいて、上記辞書は
上記標準特徴パターンに対応して音声情報を記憶する音
声情報記憶部をそなえ、音声認識時または認識誤りが生
じた際に上記辞書中の該当する上記音声情報にもとづい
て音声を杓生じで出力する音声再生部と、使用者の指示
により当該標準＠徴パターンの登録を削除する登録削除
部とをそなえたことを０徴とする音声標準特徴パターン
作成処理方式。
（４）上記辞書に記憶される音声情報は、登（−六へ声
から抽出した特徴パラメータ時系列、または登録音声を
Ａ／Ｄ変換したディジタル情報もしくはその音声符号化
情報でおることを特徴とする１１°イｎ’Ｆ請求の範囲
第（３）項記載の音声標準特徴パターン作成処理方式。