JPS61231600A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS61231600A JPS61231600A JP60072260A JP7226085A JPS61231600A JP S61231600 A JPS61231600 A JP S61231600A JP 60072260 A JP60072260 A JP 60072260A JP 7226085 A JP7226085 A JP 7226085A JP S61231600 A JPS61231600 A JP S61231600A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech
- speaker
- feature extraction
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[概 要]
特定話者音声認識装置に、使用者の発声器官の特徴を抽
出する機構と、それにより抽出した特徴により使用者の
発声に近い音声を合成する機構とを設け、その音声合成
機能により、使用者に代って音声登録を行うよう構成し
たもので、これにより、大きな手間のかかる音声登録を
省略できるものである。
出する機構と、それにより抽出した特徴により使用者の
発声に近い音声を合成する機構とを設け、その音声合成
機能により、使用者に代って音声登録を行うよう構成し
たもので、これにより、大きな手間のかかる音声登録を
省略できるものである。
[産業上の利用分野]
本発明は、特定話者音声認識装置に係わり、さらに特定
すれば、話者に代って音声登録する機能を備えた特定話
者音声認識装置に関するものである。
すれば、話者に代って音声登録する機能を備えた特定話
者音声認識装置に関するものである。
[従来の技術]
音声認識装置には、一般に不特定の話者を対象とするも
のと、特定話者を対象とするものがある。
のと、特定話者を対象とするものがある。
不特定話者音声認識装置は、誰の音声でも認識できるが
、認識できる語が少数に限定される欠点があり、また、
特定話者音声認識装置は多くの語を認識できるが、認識
させる語の音声を総て登録する必要があり、語数が多い
と、大きな手間がかかるという欠点があった。
、認識できる語が少数に限定される欠点があり、また、
特定話者音声認識装置は多くの語を認識できるが、認識
させる語の音声を総て登録する必要があり、語数が多い
と、大きな手間がかかるという欠点があった。
第2図は、特定話者音声認識装置の構成の−例を示すブ
ロック図である。
ロック図である。
第2図によって、音声の登録を手順を追って説明すると
、次のとおりである。
、次のとおりである。
■音声登録/認識・制御部3から、登録すべき語の表示
指示が登録語テーブル5に送られ、ディスプレイ6に表
示される。
指示が登録語テーブル5に送られ、ディスプレイ6に表
示される。
■使用者は、その表示された登録語をマイク1に向かい
発声する。
発声する。
■マイク1からの音声信号は、音声特徴抽出部2へ入り
、音声特徴抽出部2では、その音声から音声認識に用い
る特徴を抽出して音声パラメータに変換する。
、音声特徴抽出部2では、その音声から音声認識に用い
る特徴を抽出して音声パラメータに変換する。
■音声パラメータは、音声登録/認識・制御部3を経由
して、音声辞書4に登録される。
して、音声辞書4に登録される。
0以上で、1つの語の音声が完了し、他の語も同様に実
行することにより、音声辞書4を作成することができる
。
行することにより、音声辞書4を作成することができる
。
つぎに、同じく音声認識について順を追って説明する。
■マイク1より入力された音声は、音声特徴抽出部で、
音声パラメータに変換され、音声登録/認識・制御部へ
送られる。
音声パラメータに変換され、音声登録/認識・制御部へ
送られる。
■音声登録/認識・制御部では、その音声パラメータと
、音声辞書に登録されている複数の音声パラメータとを
比較照合し、最も似ているものを認識結果として出力す
る。
、音声辞書に登録されている複数の音声パラメータとを
比較照合し、最も似ているものを認識結果として出力す
る。
[発明が解決しようとする問題点]
上記に説明したように、特定話者音声認識装置には、多
(の語を認識できる長所があるが、認識させる語の音声
を総て登録する必要があり、語数が多いと、大きな手間
がかかるという欠点がある。
(の語を認識できる長所があるが、認識させる語の音声
を総て登録する必要があり、語数が多いと、大きな手間
がかかるという欠点がある。
本発明は、この欠点を除去した新規な、特定話者音声認
識装置を提供しようとするものである。
識装置を提供しようとするものである。
[問題点を解決するための手段〕
第1図は本発明の音声認識装置の原理ブロック図を示す
。
。
第1図において、1〜6は第2図に示した従来の特定話
者音声認識装置と同一の対象物を示し、第2図に比べる
と、7の話者特徴抽出部、8の音声合成部、および9の
マルチプレクサが、新たな構成要素として追加されてい
る。
者音声認識装置と同一の対象物を示し、第2図に比べる
と、7の話者特徴抽出部、8の音声合成部、および9の
マルチプレクサが、新たな構成要素として追加されてい
る。
話者特徴抽出部7は、話者特徴を抽出するに必要な予め
定めた複数の音の発声から、ホルマントその他の話者特
徴を抽出する回路である。
定めた複数の音の発声から、ホルマントその他の話者特
徴を抽出する回路である。
音声合成部8は、話者特徴抽出部7の抽出した話者特徴
から、登録語テーブル5の指定する語のスペクトル包絡
特性を合成する回路である。
から、登録語テーブル5の指定する語のスペクトル包絡
特性を合成する回路である。
マルチプレクサ9は、音声特徴抽出部2および話者特徴
抽出部7への入力の切換えを行うスイッチ回路である。
抽出部7への入力の切換えを行うスイッチ回路である。
[作用〕
第1図に示した本発明の特定話者音声認識装置の動作を
、登録と認識とに別けて順を追、て説明する。
、登録と認識とに別けて順を追、て説明する。
登録については、従来の特定話者音声認識装置と異なり
、話者の発声器官の特徴を抽出し、それにより、使用者
の発声に近い形で音声合成を行って全登録語を発声し、
これによって、使用者に代って自動的に音声登録を行う
ものである。
、話者の発声器官の特徴を抽出し、それにより、使用者
の発声に近い形で音声合成を行って全登録語を発声し、
これによって、使用者に代って自動的に音声登録を行う
ものである。
■音声登録/認識・制御部から話者特徴抽出部へ、話者
特徴抽出指示を行う。
特徴抽出指示を行う。
■話者特徴抽出部は、話者特徴を抽出するに必要な予め
定めた発声情報をディスプレイ上に表示する。予め定め
る発声情報は、例えば、5母音、複数の特定な子音、お
よび複数の特定な拗音等である。
定めた発声情報をディスプレイ上に表示する。予め定め
る発声情報は、例えば、5母音、複数の特定な子音、お
よび複数の特定な拗音等である。
■使用者は、その表示された発声情報を発声し、マイク
から入力させる。
から入力させる。
■マイクからの音声信号はマルチプレクサを経由して、
話者特徴抽出部へ送られ、ここで使用者の発声器官の特
徴が抽出される。抽出された話者特徴は音声合成部に送
られる。
話者特徴抽出部へ送られ、ここで使用者の発声器官の特
徴が抽出される。抽出された話者特徴は音声合成部に送
られる。
■総ての発声情報の発声が終り、話者特徴の抽出が完了
すると、音声登録/認識・制御部は、続いて、登録語テ
ーブルから登録語情報を順番に音声合成部へ送る。
すると、音声登録/認識・制御部は、続いて、登録語テ
ーブルから登録語情報を順番に音声合成部へ送る。
■音声合成部では話者特徴に基づいて登録語を音座台成
し、その出力はマルチプレクサを経由して音声特徴抽出
部へ送られる。
し、その出力はマルチプレクサを経由して音声特徴抽出
部へ送られる。
■音声特徴抽出部では、入力さた合成音声を音声パラメ
ータに変換する。その音声パラメータは、音声登録/認
識・制御部を経由して、音声辞書に登録される。
ータに変換する。その音声パラメータは、音声登録/認
識・制御部を経由して、音声辞書に登録される。
■以下、同様に総ての登録語を音声合成して音声辞書に
登録し、音声辞書を作成する。
登録し、音声辞書を作成する。
次に、認識については、従来′と同様である。即ち、
■マイクから入力された使用者の音声は、マルチプレク
サを経由して、音声特徴抽出部へ送られ、音声パラメー
タに変換される。
サを経由して、音声特徴抽出部へ送られ、音声パラメー
タに変換される。
0その音声パラメータは、音声登録/認識・制御部にお
いて、音声辞書に登録されている複数の音声パラメータ
と比較照合され、最も似ているものを認識結果として出
力する。
いて、音声辞書に登録されている複数の音声パラメータ
と比較照合され、最も似ているものを認識結果として出
力する。
[発明の効果]
以上説明のように本発明によれば、使用者は、大きな手
間のかかる音声の登録を行わずに、多数の語の音声認識
を行うことができ、その実用上の効果はきわめて大きい
。
間のかかる音声の登録を行わずに、多数の語の音声認識
を行うことができ、その実用上の効果はきわめて大きい
。
第1図は本発明の原理ブロック図、
第2図は特定話者音声認識装置の構成例を示すブロック
図である。 図面において、 1はマイクロホン、 2は音声特徴抽出部、3
は音声登録/認識・制御部、4は音声辞書、5は登録語
テーブル、 6はディスプレイ、7は話者特徴
抽出部、 8は音声合成部、9はマルチプレクサ
、
図である。 図面において、 1はマイクロホン、 2は音声特徴抽出部、3
は音声登録/認識・制御部、4は音声辞書、5は登録語
テーブル、 6はディスプレイ、7は話者特徴
抽出部、 8は音声合成部、9はマルチプレクサ
、
Claims (1)
- 【特許請求の範囲】 特定話者音声認識装置において、使用者の発声器官の特
徴を抽出する話者特徴抽出部(7)と、該話者特徴抽出
部(7)により抽出した特徴により、使用者の発声を模
擬した音声を合成する音声合成部(8)とを備え、 登録語を、該音声合成部(8)により合成した音声によ
り自動的に登録処理を行うよう構成したことを特徴とす
る音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60072260A JPS61231600A (ja) | 1985-04-05 | 1985-04-05 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60072260A JPS61231600A (ja) | 1985-04-05 | 1985-04-05 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61231600A true JPS61231600A (ja) | 1986-10-15 |
Family
ID=13484137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60072260A Pending JPS61231600A (ja) | 1985-04-05 | 1985-04-05 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61231600A (ja) |
-
1985
- 1985-04-05 JP JP60072260A patent/JPS61231600A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
JP4867804B2 (ja) | 音声認識装置及び会議システム | |
JPH10511196A (ja) | 情報処理システム | |
JP2015014665A (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP2001166789A (ja) | 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置 | |
JP2844817B2 (ja) | 発声練習用音声合成方式 | |
JPS63157226A (ja) | 会話型文章読み上げ装置 | |
JPS61231600A (ja) | 音声認識装置 | |
JPH0194398A (ja) | 音声標準パターンの作成方法 | |
JPS6126678B2 (ja) | ||
JP3438293B2 (ja) | 音声認識における単語テンプレートの自動作成方法 | |
JP2004309654A (ja) | 音声認識装置 | |
JPH1165410A (ja) | 発音練習装置 | |
JPH0556519B2 (ja) | ||
JPH03223799A (ja) | 分離しているワード、特に非常に大きい語いの認識方法と装置 | |
JPS61249099A (ja) | 音声認識装置 | |
Akintola et al. | Speech Processing Algorithm for Automatic Speaker Recognition-Based Telephone Voice Dialing in Yorùbá | |
JPH01285998A (ja) | 音声認識装置 | |
JPS62174800A (ja) | 外国語母音の模範発音出力装置 | |
JPH01289997A (ja) | 音声登録方式 | |
Hiranrat | Speech synthesis and voice recognition using small computers | |
JPS59195300A (ja) | 音声認識装置 | |
JPH09198078A (ja) | 音声認識装置 | |
JPS62217297A (ja) | 単語音声認識装置 | |
JPS59176791A (ja) | 音声登録方式 |