JPS61231600A

JPS61231600A - 音声認識装置

Info

Publication number: JPS61231600A
Application number: JP60072260A
Authority: JP
Inventors: 桜庭　孝宏
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1985-04-05
Filing date: 1985-04-05
Publication date: 1986-10-15

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［概　要］特定話者音声認識装置に、使用者の発声器官の特徴を抽
出する機構と、それにより抽出した特徴により使用者の
発声に近い音声を合成する機構とを設け、その音声合成
機能により、使用者に代って音声登録を行うよう構成し
たもので、これにより、大きな手間のかかる音声登録を
省略できるものである。

［産業上の利用分野］本発明は、特定話者音声認識装置に係わり、さらに特定
すれば、話者に代って音声登録する機能を備えた特定話
者音声認識装置に関するものである。

［従来の技術］音声認識装置には、一般に不特定の話者を対象とするも
のと、特定話者を対象とするものがある。

不特定話者音声認識装置は、誰の音声でも認識できるが
、認識できる語が少数に限定される欠点があり、また、
特定話者音声認識装置は多くの語を認識できるが、認識
させる語の音声を総て登録する必要があり、語数が多い
と、大きな手間がかかるという欠点があった。

第２図は、特定話者音声認識装置の構成の−例を示すブ
ロック図である。

第２図によって、音声の登録を手順を追って説明すると
、次のとおりである。

■音声登録／認識・制御部３から、登録すべき語の表示
指示が登録語テーブル５に送られ、ディスプレイ６に表
示される。

■使用者は、その表示された登録語をマイク１に向かい
発声する。

■マイク１からの音声信号は、音声特徴抽出部２へ入り
、音声特徴抽出部２では、その音声から音声認識に用い
る特徴を抽出して音声パラメータに変換する。

■音声パラメータは、音声登録／認識・制御部３を経由
して、音声辞書４に登録される。

０以上で、１つの語の音声が完了し、他の語も同様に実
行することにより、音声辞書４を作成することができる
。

つぎに、同じく音声認識について順を追って説明する。

■マイク１より入力された音声は、音声特徴抽出部で、
音声パラメータに変換され、音声登録／認識・制御部へ
送られる。

■音声登録／認識・制御部では、その音声パラメータと
、音声辞書に登録されている複数の音声パラメータとを
比較照合し、最も似ているものを認識結果として出力す
る。

［発明が解決しようとする問題点］上記に説明したように、特定話者音声認識装置には、多
（の語を認識できる長所があるが、認識させる語の音声
を総て登録する必要があり、語数が多いと、大きな手間
がかかるという欠点がある。

本発明は、この欠点を除去した新規な、特定話者音声認
識装置を提供しようとするものである。

［問題点を解決するための手段〕第１図は本発明の音声認識装置の原理ブロック図を示す
。

第１図において、１〜６は第２図に示した従来の特定話
者音声認識装置と同一の対象物を示し、第２図に比べる
と、７の話者特徴抽出部、８の音声合成部、および９の
マルチプレクサが、新たな構成要素として追加されてい
る。

話者特徴抽出部７は、話者特徴を抽出するに必要な予め
定めた複数の音の発声から、ホルマントその他の話者特
徴を抽出する回路である。

音声合成部８は、話者特徴抽出部７の抽出した話者特徴
から、登録語テーブル５の指定する語のスペクトル包絡
特性を合成する回路である。

マルチプレクサ９は、音声特徴抽出部２および話者特徴
抽出部７への入力の切換えを行うスイッチ回路である。

［作用〕第１図に示した本発明の特定話者音声認識装置の動作を
、登録と認識とに別けて順を追、て説明する。

登録については、従来の特定話者音声認識装置と異なり
、話者の発声器官の特徴を抽出し、それにより、使用者
の発声に近い形で音声合成を行って全登録語を発声し、
これによって、使用者に代って自動的に音声登録を行う
ものである。

■音声登録／認識・制御部から話者特徴抽出部へ、話者
特徴抽出指示を行う。

■話者特徴抽出部は、話者特徴を抽出するに必要な予め
定めた発声情報をディスプレイ上に表示する。予め定め
る発声情報は、例えば、５母音、複数の特定な子音、お
よび複数の特定な拗音等である。

■使用者は、その表示された発声情報を発声し、マイク
から入力させる。

■マイクからの音声信号はマルチプレクサを経由して、
話者特徴抽出部へ送られ、ここで使用者の発声器官の特
徴が抽出される。抽出された話者特徴は音声合成部に送
られる。

■総ての発声情報の発声が終り、話者特徴の抽出が完了
すると、音声登録／認識・制御部は、続いて、登録語テ
ーブルから登録語情報を順番に音声合成部へ送る。

■音声合成部では話者特徴に基づいて登録語を音座台成
し、その出力はマルチプレクサを経由して音声特徴抽出
部へ送られる。

■音声特徴抽出部では、入力さた合成音声を音声パラメ
ータに変換する。その音声パラメータは、音声登録／認
識・制御部を経由して、音声辞書に登録される。

■以下、同様に総ての登録語を音声合成して音声辞書に
登録し、音声辞書を作成する。

次に、認識については、従来′と同様である。即ち、 ■マイクから入力された使用者の音声は、マルチプレク
サを経由して、音声特徴抽出部へ送られ、音声パラメー
タに変換される。

０その音声パラメータは、音声登録／認識・制御部にお
いて、音声辞書に登録されている複数の音声パラメータ
と比較照合され、最も似ているものを認識結果として出
力する。

［発明の効果］以上説明のように本発明によれば、使用者は、大きな手
間のかかる音声の登録を行わずに、多数の語の音声認識
を行うことができ、その実用上の効果はきわめて大きい
。

【図面の簡単な説明】

第１図は本発明の原理ブロック図、第２図は特定話者音声認識装置の構成例を示すブロック
図である。図面において、１はマイクロホン、　　　　　２は音声特徴抽出部、３
は音声登録／認識・制御部、４は音声辞書、５は登録語
テーブル、　　　　　６はディスプレイ、７は話者特徴
抽出部、　　　　８は音声合成部、９はマルチプレクサ
、

Claims

【特許請求の範囲】特定話者音声認識装置において、使用者の発声器官の特
徴を抽出する話者特徴抽出部（７）と、該話者特徴抽出
部（７）により抽出した特徴により、使用者の発声を模
擬した音声を合成する音声合成部（８）とを備え、登録語を、該音声合成部（８）により合成した音声によ
り自動的に登録処理を行うよう構成したことを特徴とす
る音声認識装置。