JPS58166398A - 音声認識装置における音声辞書登録方式 - Google Patents

音声認識装置における音声辞書登録方式

Info

Publication number
JPS58166398A
JPS58166398A JP57049460A JP4946082A JPS58166398A JP S58166398 A JPS58166398 A JP S58166398A JP 57049460 A JP57049460 A JP 57049460A JP 4946082 A JP4946082 A JP 4946082A JP S58166398 A JPS58166398 A JP S58166398A
Authority
JP
Japan
Prior art keywords
voice
speech
pattern
dictionary
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57049460A
Other languages
English (en)
Inventor
清田 由美
鈴木 賀子
木暮 邦子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57049460A priority Critical patent/JPS58166398A/ja
Publication of JPS58166398A publication Critical patent/JPS58166398A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は、音声認識装置における音声辞書登録方式に蘭
し、特に、音声認識装置の使用前に予め話者の音声を登
録する特定結着方式の音声認識装置において、音声辞書
の各音声単位について複数のテンブレー)!使用し、か
つ各テンプレートの登録に際して一定のパターン間距離
をもつ音声パターンのみを選択して登録する手段を有す
る音声辞書登録方式に関する。
技術の背景 登録話者を対象とする音声g識装置な使用する場合には
、予め話者の音声を登録する処理操作が行なわれる。一
般には、同一話者の同−音に関する発声でも1話者の状
態により音声パターンがかなり変動することが多い。そ
のため通常は、−回の発声だけでテンプレート、すな勅
ち標準バターンの登録なするのではなく、数回の発声を
行ない。
それらの音声パターンを、同−音に約する複数個のテン
プレートとして登録する方式がとられている。
しかし9人間が実際に認識できるパターンは。
相当に広い幅をもりているので、採用されるテンプレー
ト数が限定される場合には、それらのパターンの有効性
が問題となる。第1図は、その様子を模式的に示したも
のである。
同図において、Sはある一つの音声について人間が認識
するパターンの範8v表わし、Pl乃至P。
は9話者により発声された音声パターンのサンプルを示
す。各音声パターンを囲む点線の領域は。
i1!繊義置が認識可能なパターンの範囲を表わし【い
る。
通常、各音声について用意されるテンプレート数は、感
層速度やコストの面から、比較的少い数に制限される。
このため、テンプレートとなる標準パターンを設定する
場合にはできるだけ効率のよいパターンを採用する必要
かある。たとえは。
図のパターンP4およびP@は、それぞれ5its範囲
トとしての効率が悪(不適当なものである。たとえは、
テングレート数が5個に制限されるのであれは、  P
aあるいはPgの代りにQのような領域に入るパターン
を収集することがむしろ好ましい。
発明の目的および構成 本発明の目的は、音声辞書を作成する際に、同一音声に
対する複数のテングレートとして有効性の高いもののみ
か採用されるような音声辞書登鍮方弐を提供することに
ある。
そのため音声登録時に9発声された同−音の複数の音声
パターンについて、相互の距離を計算し。
明確に相違のある音声パターンのみな登録するようにす
るもので1発明の構成として、音声認識装置において、
音声単位毎にテングレートとなる複数の音声パターンを
保有する音声辞書メモリと。
咳音声辞書内の音声パターンと入力音声パターンとのパ
ターン距離を計算するパターンマツチング部と、音声辞
書登録を許容される音声単位毎の音声パターン数および
パターン距■閾値と許容された音声パターン数とt記録
する音声登録管理表メモリと、音声辞書登録処理部と1
表示部とをそなえ、上記音声辞書登鍮#&履部は、音声
登録の際に。
上記音声登録管理表を管理しつつ入力音声のパターン距
離が閾値な超えた場合に登録し、そして閾値V超えない
場合には表示IIKメツセージな出力して話者に同一音
声の再発声を指示し、許容される音声パターン数を充足
するまで上記のam!繰り返すことを特徴とするもので
ある。
以下に本発明な実施例にしたがりて説明する。
1112図は、実施例システムにおける音声辞書登録処
理に関連する部分のみを取り出して示した構成図であり
、第3図は本実施例で使用される音声登鍮管ll懺の説
明図、篇4Iiilは本実施例の動作【説明するだめの
フロー図である。
第2園において、1はマイクロホン、2は音声レコード
採集部、3は音声制御部、4は制御キー。
5はディスプレイ装置、6は音声辞書メモリ、7はパタ
ーンマツチング部、8は音声辞書登鎌鵡履部、9は音声
登録管理表メモ9に示す。
話者が発声した音声は、マイクロホンlから入力され、
音声レコード採集部において、音声認識の認識単位とな
る音声パターンに変換される。音声パターンはパワース
ペクトル値、*型予測分析パラメータ等必要に応じて適
切なものが使用される。
音声制御部3は、制御キー4から指示される音声辞書登
録モードか音声認識モードかの動作条件にしたがりて、
it臓装置の制御を行なう。この場合には、音声辞書登
録モードであり、音声制御部3は、を声辞書登碌処理部
8v起動する。
音声辞書登録処理部8は、を声登鋒管場表メモ17 Y
初期化し、制御キー4から指示される登録すべき音声の
文字をディスプレイ装置5に表示し。
話者に対して鋏文字の発声をメツセージにより指示する
音声登録管理表メモリ9は、第3図に示すように、登録
音声のコード〔υ、(2)、・・・・・・・・・、各登
録量声優に設定すべきテンプレート数、パターン距離の
閾値、設定すべき各テンプレート■、■、■・・・・・
・について音声辞書記録有無のフラグ表示からなってい
る。
登録を指示された音声の鍛初のテングレート■を設定す
る場合、f声辞書登鍮縄理@Sは、無条件で入力された
現音声パターンを、音声辞書メモリ内の登録音声(2)
、テングレート■の位置に記録する。それと同時に、音
声登録管理表9内の対応する音声(2)のテングレート
■記鍮欄)l、0Nfi示にする。
処理部8は、テンプレート■記鍮橢がOFF表示である
ことな確認して、同−音につい工の次の発声指示メツセ
ージを、ディスプレイ装置5に出力する。
話者により再発声された同−音の音声パターンは、今度
はバター/マツチングs7の机音声入力に与えられる。
他方、音声辞膏6に先に記録した同−曾のテングレート
■の音声パターンが読出され、パターンマツチング部グ
′の比歇童声入力に与えられる。ここでパターンマツチ
ング部7は、2つ声辞書登録処塩部8に送る。
処理部8は管理表9から閾値′211を読出し。
パターンマツチング部7から送られたパターン距離と比
較する。パターン距離が閾値よりも大きい場合には、入
力された現音声パターンを、を声辞書メモリ6のテンプ
レート■の位置に記録し、同時に管理表メモリ9のテン
グレード■記録欄の表示をONにする。
しかし、パターン距離が閾値よりも小さい場合には、不
適切パターンとして登録せず、管理表メモリ9のテンプ
レート■記鍮欄はOFFのままとし、ディスプレイ装置
5に対して、再発声のメツセージを出力する。
このようにして、管理表9のテングレート数欄に設定さ
れた数だけの有効音声パターンか、音声辞書6に記録さ
れたとき、管m表9の対応するテングレート記録欄は全
てON表示となるので、処!111s8は1次の登録音
声■の登録処理へ進む。
第4図に示すフ四−の上部分は、上述した処理を概略的
に示している0図の下部分は学習処理を示し9本実施例
において作成された音声辞薔の性能な更に高めるために
挿入されるものである。以下に簡単に説明する。
任意の一つの音声単位について、設定すべき全てのテン
グレートが作成された後、制御キー4により学習処Jl
!指示する。音声辞書登−処理部8は、制御キーにより
指示された一つの音声単位について、ディスプレイ上で
再び話者に発声を指示する。
話者が発声し、入力音声の音声パターンが生成されると
、前と同様に、これをパターンマツチングs7の現音声
入力として与える。次に、処理部8は、音声辞書メモリ
6から、対応する音声のテンプレートを次々に読出し、
パターンマツチング部7の比at声大入力して与える。
l&埋部8は、各テングレートのパターンの中から、現
音声パターンにもりとも距離が近いものを1つ選択し、
これと現音声パターンとの間で平均化処理を行なう。平
均化感層は、パワースペクトルの場合には、それぞれ適
切な最適化の論理処理を行なう。
このようにして、得られた新しい音声パターンで、選択
したテンプレートの内容を更新してゆくことにより、テ
ンプレートの識別性能な高めることができる。
これらの処理を、全ての登録音声について実行し終った
とき、音声辞書登録モードは終了し、li繊処理に入る
ことができる。
発明の効果 本発明によれは、各音声単位毎に用意される複数のテン
グレートが最適化されるために、認識率を大幅に改善す
ることができる。また、音声辞書登録の際の入力音声パ
ターンの採否の判定および処理の進行は自動化されてお
り9話者に対する適切なメツセージ指示を発行しながら
簡単な操作で行なうことができる。
【図面の簡単な説明】
第1図は音声認識における音声辞書のテンプレ−ト性能
の説明図、182図は本実施例システムの構成図、第3
wAは音声参会登録管理表の構成図。 第4図は本実施例の処理フロー図である。 図中、1はマイク四ホン、2は音声レコード採集部、3
は音声制御部、4は制御キー、5はディスプレイ装置、
6は音声辞書メモリ、7はパターンマツチング部、8は
音声辞書登録処理部、9は音声登鍮管jl我メモVVt
示す。 特許出願人 富士通株式会社 代理人弁瑠士 長谷用 文 廣 (外1名) 1+圓 3m

Claims (1)

  1. 【特許請求の範囲】 音声認識装置におい【、音声単位毎にテンプレートとな
    る複数の音声パターンを保有する音声辞書メモリと、#
    音声辞書内の音声パターンと入力音声パターンとのパタ
    ーン距離な計算するパターンマツチング部と、音声辞書
    **V許容される音声単位毎の音声パターン数およびパ
    ターン距離閾値と許容された音声パターン数とV配置す
    る音声登録管m嵌メモリと、音声辞書登録方式部と1表
    示部とをそなえ、上記音声辞書登録方式部は、音声登録
    の際に、上記音声登鍮管Jli表t’YJ!1シつつ入
    力音声のパターン距離が閾値な超えた場合に登録し、そ
    して閾値を超えない場合には表示11にメツセージを出
    力して話者に岡−音声の再発声を指示し、許容される音
    声パターン数を充足するまで上記の処理な繰り返すこと
    !特徴とする音声辞書登録方式。
JP57049460A 1982-03-27 1982-03-27 音声認識装置における音声辞書登録方式 Pending JPS58166398A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57049460A JPS58166398A (ja) 1982-03-27 1982-03-27 音声認識装置における音声辞書登録方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57049460A JPS58166398A (ja) 1982-03-27 1982-03-27 音声認識装置における音声辞書登録方式

Publications (1)

Publication Number Publication Date
JPS58166398A true JPS58166398A (ja) 1983-10-01

Family

ID=12831749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57049460A Pending JPS58166398A (ja) 1982-03-27 1982-03-27 音声認識装置における音声辞書登録方式

Country Status (1)

Country Link
JP (1) JPS58166398A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5969799A (ja) * 1982-10-14 1984-04-20 沖電気工業株式会社 音声登録方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5969799A (ja) * 1982-10-14 1984-04-20 沖電気工業株式会社 音声登録方法
JPH0376476B2 (ja) * 1982-10-14 1991-12-05 Oki Electric Ind Co Ltd

Similar Documents

Publication Publication Date Title
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
US6996528B2 (en) Method for efficient, safe and reliable data entry by voice under adverse conditions
US20020184035A1 (en) Voice spelling in an audio-only interface
US20020111805A1 (en) Methods for generating pronounciation variants and for recognizing speech
JPS58166398A (ja) 音声認識装置における音声辞書登録方式
JPS597998A (ja) 連続音声認識装置
JPS63149699A (ja) 音声入出力装置
JPH11184495A (ja) 音声認識装置
JPH11231892A (ja) 音声認識装置
JP3192324B2 (ja) 特定話者用単語音声認識装置
JPH0556519B2 (ja)
JPH06337700A (ja) 音声合成装置
JPS59111698A (ja) 音声認識方式
JPS59117632A (ja) 音声入力方式
JPS6073592A (ja) 特定話者用音声認識装置
JPS6211732B2 (ja)
JPS61279925A (ja) 対話型入力装置
JPH05216493A (ja) オペレータ支援型音声認識装置
JPS60170885A (ja) 単音節音声学習方式
JPS60227284A (ja) 外国語練習装置
JPS6287993A (ja) 音声認識装置
JPS60113298A (ja) 特定話者音声認識装置
JPH09319395A (ja) 離散単語音声認識システムにおける音声データ学習装置
JPH04301695A (ja) 音声認識装置の辞書制御方式
JPS5953900A (ja) 音声認識方法