JPS60113298A - 特定話者音声認識装置 - Google Patents

特定話者音声認識装置

Info

Publication number
JPS60113298A
JPS60113298A JP58221097A JP22109783A JPS60113298A JP S60113298 A JPS60113298 A JP S60113298A JP 58221097 A JP58221097 A JP 58221097A JP 22109783 A JP22109783 A JP 22109783A JP S60113298 A JPS60113298 A JP S60113298A
Authority
JP
Japan
Prior art keywords
dictionary
patterns
prompt
learning
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58221097A
Other languages
English (en)
Other versions
JPH0314359B2 (ja
Inventor
山田 豊志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58221097A priority Critical patent/JPS60113298A/ja
Publication of JPS60113298A publication Critical patent/JPS60113298A/ja
Publication of JPH0314359B2 publication Critical patent/JPH0314359B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、学習機能を持ち、リジェクトや類似語有、発
声にばらつき有の場合には自動的に同じプロンプトを再
表示するようにした特定話者音声認識装置の音声登録方
式に関するものである。
〔従来技術と問題点〕
音声認識装置において、認識率を高める重要な要素のひ
とつに、入力する音声パターンと比較照合する辞書パタ
ーンの最適化が挙げられる。
特定話者音声認識装置では、この辞書パターンの最適化
のために学習機能を有し、オペレータは、音声登録時に
同一語を数回発声して装置に学習をさせる。高度な学習
機能では、ひとつの語に対し、辞書テンプレートが複数
卿用意されていて、辞書の修正(平均化)、追加、或い
は削除/追加を行うO 音声登録には、初期登録モードと学習モードがあり、初
期登録は、すべての登録語に対し一通9発声し、辞書の
イニシャル・ノくターンを作成するものであり、学習は
、初期登録後、即ちイニシャル・パターンが作成された
後に行われ、成る語の発声に対し認識処理を実行し、そ
の認識結果の順位、距離情報をもとにリジェクト、辞書
ノくターン゛の修正、或いは追加を行う。さらに学習が
進んで行けば、辞書パターンの削除/追加も行う。
音声登録では、オペレータにとって、できるだけ少ない
発声回数で効率的に辞書を完成させるのが望ましく、ま
た傘針なキー操作や判断を回避させて発声に専念させる
のが望ましい。
〔発明の目的〕
本発明は、上記の考察に基づくものであって、学習機能
を持った特定話者音声認識装置において、自動的に次に
発声すべき語を順次オペレータに表示し、オペレータの
判断やキー操作を極力少なくし、オペレータの負担の軽
減を図った特定話者音声認識装置の音声登録方式を提供
することを目的とするものである。
〔発明の構成〕
そのために本発明の特定話者音声認識装置の音声登録方
式は、登録語の文字列が格納され登録語に対する音声の
辞書パターンが登録される辞書メモリ、入カバターンと
辞書パターンとを照合して学習モード時に認識結果と入
カバターンの修正情報を出力する照合部、ディスプレイ
、学習モード時に辞書メモリから登録語の文字列を送出
してディスプレイに表示させるプロンプト送出制御部、
辞書メモリの辞書パターンの追加登録や修正を行う辞書
制御修正部、及び照合部から出力された認識結果と入カ
バターンの修正情報をもとに学習を行う学習機構部を具
備した特定話者音声認識装置の音声登録方式であって、
学習機構部は、辞書制御修正部を制御してリジェクト、
辞書ノ(ターンの追加若しくは辞書パターンの修正のい
ずれかの処理を実行し、プロンプト送出制御部を制御し
て登録語の文字列を順次ディスプレイにプロンプト表示
させ、リジェクト処理を実行した場合又は類似語重着し
くは発声にばらつき有の場合には関連する補助情報と共
に同じプロンプトを再度表示させるように構成されたこ
とを特徴とするものである。
〔発明の実施例〕
以下、本発明の実施例を図面を参照しつつ説明する0 図は本発明の1実施例構成を示す図である。図において
、1は入カバターン・バッファ、2は辞書制御修正部、
3は辞書メモリ、4は照合部、5はプロンプト送出(t
il制御部、6は学習機構部、7はディスプレイを示す
。入カバターン・バッファ1は、オペレータによって音
声入力された入カッ(ターンを蓄えるものであり、照合
部4は、入カッ々ターン・バッファIK蓄えられた入カ
ッ(ターンと辞書メモリ3に格納された辞書パターンと
を照合し、学習モード時には、その照合結果として、認
識結果(複数の候補とその距離)■及び入カッくターン
の修正情報■をそれぞれ学習機構部6に送る。辞書メモ
リ3は、テーブルと辞書ノ(ターンよりなり、テーブル
には登録語の文字列が格納され、辞書)くターンには登
録語に対する複数の辞書テンプレートが用意され音声の
パターンが登録される。初期登録では、テーブルのすべ
ての登録語に対して−通り発声し、そのパターンが辞書
ノくターンに登録され、学習では、登録語に対して発声
した入カッくターンと辞書パターンとの照合が行われ、
照合結果に応じて、リジェクト、辞書ノ(ターンの追加
や辞書パターンの修正が行われる。辞書メモリ6に対す
るこれらの処理は、学習機構部6からの指示■をもとに
辞書制御修正部2により実行されるO学習機構部6は、
正解(発声した語)の距離情報、正解と他の語との間の
距離差、及び辞書テンプレートの空き情報によシ、先に
述べたように、辞書制御修正部2を制御■してリジェク
ト、辞書/くターンの追加、或いは辞書ノくターンの修
正のいずirかの処理を実行する。リジェクトは、学習
を行わないようにする処理でちゃ、辞書パターンの追加
は、入カバターンをそのまま追加辞書パターンとする処
理であり、辞書パターンの修正は、辞書パターンを平均
化して入れ換える処理である。まだ、この学習結果に関
連して学習機構部6は、オペレータに対して次に何を発
声すべきかをディスプレイ7に表示するための処理を行
う。学習機構部6け、プロンプト送出制御部5に対し、
辞書メモリ3のテーブルの文字列を順次ディスプレイ7
に表示させるが、例えば次の■ないしOのケースが起き
た場合には再発声が必要としてプロンプトを次に進ませ
ないで、同じプロンプトを再度表示させる。(■) ■ リジェクトされた時叛(正常な音声入力と見なされ
なかった時)。
■ 正解が第1位で認識されない時(類似語有Y■ 正
解が第1位で認識されても第2位候補との距離が近い時
、即ち類似語が存在する時(類似語有)。
■ 正解が第1位で認識されてもその距離がある閾値よ
り大きい時、即ち発声がばらつきやすい語(発声にばら
つき有)。
さらに、学習機構部5は、なぜ再発声が必要なのかをオ
ペレータに通知するため、補助情報として次の■と■の
情報をディスプレイ7に表示させる。
(■) ■ 認識結果の第4位程度までの候補。
■ リジェクト、類似語有、発声にばらつき有のいずれ
かの情報。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば、学習
機能を持った特定話者音声認識装置において、学習を行
っていく過程で、認識装置自体がとζまで(何回)発声
すればよいかを自動的に判断してプロンプトを表示する
ので、オペレータは、余計な判断、キー操作無しにただ
プロンプトに従って発声していけばよく、オペレータの
負担の軽減や学習効率の向上を図ることができる。

Claims (1)

    【特許請求の範囲】
  1. 登録語の文字列が格納され登録語に対する音声の辞書パ
    ターンが登録される辞書メモリ、入カバターンと辞書パ
    ターンとを照合して学習モード時に認識結果と入カバタ
    ーンの修正情報を出力する照合部、ディスプレイ、学習
    モード時に辞書メモリから登録語の文字列を送出してデ
    ィスプレイに表示させるプロンプト送出制御部、辞書メ
    モリの辞書パターンの追加登録や修正を行う辞書制御修
    正部、及び照合部から出力された認識結果と入カバター
    ンの修正情報をもとに学習を行う学習機構部を具備した
    特定話者音声認識装置の音声登録方式であって、学習機
    構部は、辞書制御修正部を制御してリジェクト、辞書パ
    ターンの追加若しくは辞書パターンの修正のいずれかの
    処理を実行し、プロンプト送出制御部を制御して登録語
    の文字列を順次ディスプレイにプロンプト表示させ、リ
    ジェクト処理を実行した場合又は類似語有蓋しくは発声
    にばらつき有の場合には関連する補助情報と共に同じプ
    ロンプトを再度表示させるように構成されたことを特徴
    とする特定話者音声認識装置の音声登録方式。
JP58221097A 1983-11-24 1983-11-24 特定話者音声認識装置 Granted JPS60113298A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58221097A JPS60113298A (ja) 1983-11-24 1983-11-24 特定話者音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58221097A JPS60113298A (ja) 1983-11-24 1983-11-24 特定話者音声認識装置

Publications (2)

Publication Number Publication Date
JPS60113298A true JPS60113298A (ja) 1985-06-19
JPH0314359B2 JPH0314359B2 (ja) 1991-02-26

Family

ID=16761438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58221097A Granted JPS60113298A (ja) 1983-11-24 1983-11-24 特定話者音声認識装置

Country Status (1)

Country Link
JP (1) JPS60113298A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000035795A (ja) * 1998-06-15 2000-02-02 Dragon Syst Inc 音声認識におけるノンインタラクティブ方式のエンロ―ルメント

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system
JPS5766498A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern automatic deleting system
JPS5766499A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern learning system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5766497A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Voice registration pattern adding system
JPS5766498A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern automatic deleting system
JPS5766499A (en) * 1980-10-14 1982-04-22 Fujitsu Ltd Reference voice registration pattern learning system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000035795A (ja) * 1998-06-15 2000-02-02 Dragon Syst Inc 音声認識におけるノンインタラクティブ方式のエンロ―ルメント
JP4510953B2 (ja) * 1998-06-15 2010-07-28 ドラゴン・システムズ・インコーポレーテッド 音声認識におけるノンインタラクティブ方式のエンロールメント

Also Published As

Publication number Publication date
JPH0314359B2 (ja) 1991-02-26

Similar Documents

Publication Publication Date Title
JP3124277B2 (ja) 音声認識システム
JPH11161464A (ja) 日本語文章作成装置
JPS597998A (ja) 連続音声認識装置
JPS60113298A (ja) 特定話者音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JP3100208B2 (ja) 音声認識装置
JPH0736481A (ja) 補完音声認識装置
JPS6281699A (ja) 音声ワ−プロ装置における辞書作成及び更新方法
JPS60170885A (ja) 単音節音声学習方式
JPS59117632A (ja) 音声入力方式
JPS61138296A (ja) 音声認識装置
JPS60159899A (ja) 学習機能付音声認識装置
JPH09319395A (ja) 離散単語音声認識システムにおける音声データ学習装置
JPS59176791A (ja) 音声登録方式
JPS608898A (ja) 音声認識装置
JPS62226196A (ja) 標準パタン逐次学習方式
JPS59195299A (ja) 特定話者音声認識装置
JPH01191199A (ja) 音声入力装置
JPS6026398A (ja) 音声入力装置
JPH04184398A (ja) 音声認識装置
JPH0990979A (ja) 音情報記述方法および音情報認識方法
JPS61121093A (ja) 音声認識装置
JPS58166398A (ja) 音声認識装置における音声辞書登録方式
JPS62121499A (ja) 音声認識装置
JPH04251300A (ja) 音声認識装置