JPS59176791A

JPS59176791A - 音声登録方式

Info

Publication number: JPS59176791A
Application number: JP58050645A
Authority: JP
Inventors: 松本　正至; 三郎安藤; 新家　修; 横溝　信一; 宇佐美　隆一
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-03-26
Filing date: 1983-03-26
Publication date: 1984-10-06

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（ａ１発明の技術分野本発明は電子計算機等に対する音声入力装置に係り、と
くに特定話者認識方式にお←）る音声パターン登録の方
式に関する。

（ｂｌ技術の背景近時、電子計算機等に対して音声により情報を入力した
り、あるいは該音声入力情報を自動的に文書化する等の
、いわゆる音声処理の開発が盛んに行われている。

上記の音声による情報の入力においては、音声パターン
を、例えば単語あるいは音韻単位で識別し、該単語の、
もしくは該音韻列に対応する意味を音声認識用辞書から
検索するのであるが、この場合における音声パターンの
識別方式として、不特定話者認識方式と特定話者認識方
式とがある。

不特定話者認識方式は音声パターンの個人差を考慮に入
れた標準パターンに基づいそ不特定多数の話者の音声を
分析し認識を行うもので、話者各人ごとに特徴音声パタ
ーンを登録する必要がないが、高い認識率を得ることが
困難であるために、認識対象語電数が少ない欠点がある
。

これに対して、特定話者認識方式は各話者の特徴音声パ
ターンを登録しておき、各話者ことにその登録音声パタ
ーンに基づいて音声認識を行うもので、特徴音声パター
ンの登録等の手間を要するが、高い認識率が得られるの
で多数の倍電を取り扱うことが可能である。

（Ｃ）従来技術と問題点しかしながら、従来の特定話者認識方式の音声認識装置
においては、音声出力に必要な音声合成パラメータ作成
のための音声分析は汎用計算機によって行われていた。

したがって、話者の＠徴音声バクーンの登録時において
、該話者の発声を即時に音声分析ならひに合成すること
ができず、該話者は自分の発声が意図した通りの音声に
登録されたかどうかを確認することが不可能であり、こ
のために、実際の音声認ｉＲ［作において初めて認識誤
り、あるいは認識不能等の存在に気付き、かつその原因
が認識処理にあるのか、あるいは発声音に原因があるの
かの判断ができず、また、一般にこのような誤認識等が
正常な認識中に散発的に発生ずるためにその発見が遅れ
、重大な、認識誤りを生したり、宇宙の認識操作におけ
る認識率の低下を招く欠点があった。

（ｄ＋発明の目的本発明の目的とするところは、登録される話者の特徴音
声パターンを登録時に確認可能とする方式を提供し、こ
れにより該登録パターンに基づく音声認識における認識
率を向上することにある。

ｔｅ１発明の構成本発明は、話者の音声パターンをあらか′しめ登録して
おいた該話者の音声パターンと比較することによって認
識する特定話者認識装置において、音声合成のだめの音
声分析回路と音声合成回路を設け、音声パターン登録時
に登録される音声を分析して該分析データに基づく合成
音声を該話者に対して出力し、該話者の発声がその意図
する音声として認識されたことを確認した場合にのめこ
れを登録することを特徴とする。

（ｆ１発明の実施例本発明の実施例を図面を参照して説明する。

まず、ディスプレイ１の上に特徴音声パターンとして登
録する文字が表示される。登録話者は該ディスプレイ１
画面上の指示にしたがって該文字を発声する。例えば、
ディスプレイ１上に片カナ文字「ア」が表示されると、
話者は″ア°゛と発声する。

該発声音入力はＡ／Ｄコンバータ７によりデジタル化さ
れ音声認識部２に入力する。音声認識部２は音声入力“
ア”の始点を検出し、その音声スペクトル分析を行い、
得られた分析パラメータを音声標準パラメータとして標
準パターンメモリ３に格納すると同時にＡ／Ｄ変換され
た“ア”に相当する音声データを音声分析・合成部４に
送出する。

音声分析・合成部４は該音声データを受は取ると、直ち
に音声分析ならびに合成を行ってスピーカ５から“ア”
の合成音を出力する。

該話者はこの合成音を聞取り、自分の発声した音声と比
較し、意図した通りの音声と判断ずれは前記音声認識部
２に対して登録確認を入力する。

もし、例えば登録時に“ア”の発声音に騒音等が重畳し
、音声認識部２で、例えは“ガ”として分析された場合
、これば標準パターンメモリ３には“ア”として登録さ
れる。

このままで、つぎにディスプレイ１に「ガ」が表示され
、これにしたがって話者が“ガパを発声して登録された
とすると、以後の認識操作におし１ては、該話者の発声
音の“ア”と“ガ”は識別されないことになるのである
。

しかしながら、本発明においては、上記のように騒音等
が重畳して“ガ”と認識された“ア′”の音声は音声分
析・合成部４により分析ならびに合成され、スピーカ５
から″ガ゛の合成音が出力される。したがって、話者は
自分の発声音“ア゛が正しく登録されていないことを知
り、直ちに再登録を行うことが可能となるのである。

なお、上記音声分析・合成部４は、音声合成パラメータ
格納メモリ６に記憶された定型文等を音声合成してスピ
ーカ５から出力する、従来の音声合成回路と同様の装置
として使用することも可能であり、このための回路とし
ては、すでに開発されている八ＤＰＣＭ　（八ｄａｐｔ
ｉｖｅ　Ｄｉｆｆｅｒｅｎｔｉａｌ　Ｐｕ１ｓｅＣｏｄ
ｅ　Ｍｏｄｕｌａｔｉｏｎ　　：適応差分パルス符号変
調）方式の集積回路を用いれば、その実現はきわめて容
易である。

図において８は音声登録回路系を制御する制御部、９は
標準パターンおよび音声認識装置の制御プログラム等を
格納するだめの、例えばフロンピーディスク装置等のフ
ァイル装置である。

（ｇ１発明の効果本発明によれば、話者の特徴音声パターンの登録時にお
いて即時に登録誤りを発見可能とし、高信頼度の特徴音
声パターンの登録ができ、その結果として音声認識率の
向上を可能とする効果がある。

【図面の簡単な説明】

図は本発明に係る音声登録方式の機能ブし１２２図であ
る。図において、１ばディスプレイ、２は音声認識部、３は
標準パターンメモリ、４は音声分析・合成部、５はスピ
ーカ、６は音声合成パラメータ格納メモリ、７はＡ／Ｄ
コンバータ、８は制御部、９はファイル装置である。

Claims

【特許請求の範囲】

話者の音声パターンをあらかじめ登録しておいた該話者
の音声パターンと比較することによって認識する特定話
者認識装置において、音声合成のだめの音声分析回路と
音声合成回路を設け、音声パターン登録時に登録される
音声を分析して該分析データに基づく合成音声を該話者
に対して出力し、該話者の発声がその意図する音声とし
て認識されたことを確認した場合にのみこれを登録する
ことを特徴とする音声登録方式。