JPS638798A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS638798A JPS638798A JP61153140A JP15314086A JPS638798A JP S638798 A JPS638798 A JP S638798A JP 61153140 A JP61153140 A JP 61153140A JP 15314086 A JP15314086 A JP 15314086A JP S638798 A JPS638798 A JP S638798A
- Authority
- JP
- Japan
- Prior art keywords
- template
- voice
- individual
- telephone terminal
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は主に電話端末装置に用いられる音声認識装置に
関するものである。
関するものである。
従来の技術
近年、電話端末装置に用いる音声認識装置が利用される
ようになってきた。例えば特定話者の声だけを効率良く
認識しようとする登録型音声認識装置や不特定多数の人
の声を認識しようとする不特定話者音声認識装置がある
。
ようになってきた。例えば特定話者の声だけを効率良く
認識しようとする登録型音声認識装置や不特定多数の人
の声を認識しようとする不特定話者音声認識装置がある
。
以下図面を参照しながら、上述した従来の電話端末装置
に用いる音声認識装置の一例について説明する。
に用いる音声認識装置の一例について説明する。
第2図は従来の電話端末装置用音声認識装置の構成を示
すものである。第2図において、6は送話器、3は電話
端末装置本体部、6は音声認識用のテンプレートである
。
すものである。第2図において、6は送話器、3は電話
端末装置本体部、6は音声認識用のテンプレートである
。
以上のように構成された音声認識装置について、以下そ
の動作を説明する。
の動作を説明する。
まず入力音声は送話器5を経て電話端末装置本体部3へ
入力され、ここで音響分析・音声区間検出等の、音声認
識に必要な処理の一部がなされる、さらにテンプレート
6からは予め記憶されている標準の音声パターンが読み
出され、これも電話端末装置本体部3へ送られ、前記入
力音声の分析結果との間で類似性の計算が行なわれる。
入力され、ここで音響分析・音声区間検出等の、音声認
識に必要な処理の一部がなされる、さらにテンプレート
6からは予め記憶されている標準の音声パターンが読み
出され、これも電話端末装置本体部3へ送られ、前記入
力音声の分析結果との間で類似性の計算が行なわれる。
送話器5からの入力音声が特定話者のものである場合に
は、同一人が予め発声し登録しておいたパターンをテン
プレート6から読み出すのが良く、不特定話者のもので
ある場合には、多人数の音声から統計的に処理されたパ
ターンをテンプレート6から読み出すのが良い。
は、同一人が予め発声し登録しておいたパターンをテン
プレート6から読み出すのが良く、不特定話者のもので
ある場合には、多人数の音声から統計的に処理されたパ
ターンをテンプレート6から読み出すのが良い。
発明が解決しようとする問題点
しかしながら上記のような構成では、予め電話端末装置
毎に特定話者型か不特定話者型かの区別をせねばならず
、一般オフィスにおけるボタン電話のように、高い頻度
で特定個人が使用するものの、不特定話者が使用する頻
度も無視できないという用途においては、この両者の要
求に適切に対処することができないという問題点を有し
ていた。
毎に特定話者型か不特定話者型かの区別をせねばならず
、一般オフィスにおけるボタン電話のように、高い頻度
で特定個人が使用するものの、不特定話者が使用する頻
度も無視できないという用途においては、この両者の要
求に適切に対処することができないという問題点を有し
ていた。
本発明は上記問題点に鑑み、−個の電話端末装置を特定
話者が使用する場合と不特定話者が使用する場合とのい
ずれにおいても良好に動作する音声認識装置を提供する
ものである。
話者が使用する場合と不特定話者が使用する場合とのい
ずれにおいても良好に動作する音声認識装置を提供する
ものである。
問題点を解決するだめの手段
この目的を達成するために本発明の音声認識装置は、各
人が音声を発声し当人の音声の認識に最適になるように
作成された個人別テンプレートと、多人数の音声から不
特定話者音声認識に最適になるように作成された共通テ
ンプレートと、音声入力用に個人毎に割り当てられた1
台ないし複数台の電話端末装置と、テンプレート選択手
段とから構成されている。
人が音声を発声し当人の音声の認識に最適になるように
作成された個人別テンプレートと、多人数の音声から不
特定話者音声認識に最適になるように作成された共通テ
ンプレートと、音声入力用に個人毎に割り当てられた1
台ないし複数台の電話端末装置と、テンプレート選択手
段とから構成されている。
作用
本発明は上記した構成により、テンプレート選択手段に
よって個人別テンプレートと共通テンプレートとのうち
のいずれか適切な方が選べるため、特定話者音声認識に
対しても、不特定話者音声認識に対しても良好に動作す
ることが期待できる音声認識装置を提供することができ
る。
よって個人別テンプレートと共通テンプレートとのうち
のいずれか適切な方が選べるため、特定話者音声認識に
対しても、不特定話者音声認識に対しても良好に動作す
ることが期待できる音声認識装置を提供することができ
る。
実施例
以下本発明の一実施例について、図面を参照しながら説
明する。
明する。
第1図は本発明の一実施例における音声認識装置の構成
を示すものである。第1図において、1は個人別テンプ
レート、2は共通テンプレート、3は電話端末装置本体
部、4はテンプレート選択手段、5は送話器である。な
お、3は電話端末装置本体部でこれは従来例の基本構成
と同じものである共通テンプレート2は不特定話者音声
認識に最適になるように多人数の音声からクラスタリン
グ等の技術を用いて作成されたもので、−単語当たり複
数のテンプレートから成っているため、マルチテンプレ
ートと呼ばれているものである。個人別テンプレート1
は、電話端末装置に割り当てようとする本人が実際に発
声し、共通テンプレート2の中から本人の声を認識する
のに最も都合の良いテンプレートを単語毎に選択し、こ
のようにして選択されたテンプレートを一組のセットと
して保持したもので、セット化テンプレートと呼ばれて
いるものである。またテンプレート選択手段4ば、個人
別パターン選択ボタンと共通パターン選択ボタンとの2
個のボタンから成っている。音声分析やパターン照合等
の演算は電話端末装置本体部3の中に組み込まれた音声
認識ユニットが実行する。
を示すものである。第1図において、1は個人別テンプ
レート、2は共通テンプレート、3は電話端末装置本体
部、4はテンプレート選択手段、5は送話器である。な
お、3は電話端末装置本体部でこれは従来例の基本構成
と同じものである共通テンプレート2は不特定話者音声
認識に最適になるように多人数の音声からクラスタリン
グ等の技術を用いて作成されたもので、−単語当たり複
数のテンプレートから成っているため、マルチテンプレ
ートと呼ばれているものである。個人別テンプレート1
は、電話端末装置に割り当てようとする本人が実際に発
声し、共通テンプレート2の中から本人の声を認識する
のに最も都合の良いテンプレートを単語毎に選択し、こ
のようにして選択されたテンプレートを一組のセットと
して保持したもので、セット化テンプレートと呼ばれて
いるものである。またテンプレート選択手段4ば、個人
別パターン選択ボタンと共通パターン選択ボタンとの2
個のボタンから成っている。音声分析やパターン照合等
の演算は電話端末装置本体部3の中に組み込まれた音声
認識ユニットが実行する。
以上のように構成された音声認識装置について、以下そ
の動作について説明する。
の動作について説明する。
まず使用者は1台ないし複数台ある電話端末装置のそれ
ぞれに、その電話機に割り当てるべき使用者を決める。
ぞれに、その電話機に割り当てるべき使用者を決める。
割り尚てられた使用者はその電話機を使用する場合には
他の人より高い認識率が得られることが期待できるので
、通常はその電話機の音声認識機能を最も高い頻度で使
用する人に割り当てるのが良い。このようにして割り当
てられた使用者は、送話器5を用いて予め自分の声で発
声し、自分に最適な個人別テレプレート1を作成してお
く。さて、前記使用者が自分の割り当ての電話端末装置
を使用して認識する場合には、テンプレート選択手段4
のうちの個人別パターン選択ボタンを押した後に発声す
る。音声認識装置はこのボタン操作を受けて、個人別テ
ンプレート1を選択し、選択したテンプレートを用いて
前記使用者の声を認識する。個人別テンプレート1はセ
ット化されているので、不要な話者間スペクトル差異等
により誤認識を生じる危険が小さい。一方、同じ電話端
末装置を、その装置に割り当てられていない人が使用す
る場合には、テンプレート選択手段4のうちの共通テン
プレート選択ボタンを押しだ後に発声する。音声認識装
置はこのボタン操作を受けて、共通テンプレート2を選
択し、選択したテンプレートを用いて使用者の声を認識
する。
他の人より高い認識率が得られることが期待できるので
、通常はその電話機の音声認識機能を最も高い頻度で使
用する人に割り当てるのが良い。このようにして割り当
てられた使用者は、送話器5を用いて予め自分の声で発
声し、自分に最適な個人別テレプレート1を作成してお
く。さて、前記使用者が自分の割り当ての電話端末装置
を使用して認識する場合には、テンプレート選択手段4
のうちの個人別パターン選択ボタンを押した後に発声す
る。音声認識装置はこのボタン操作を受けて、個人別テ
ンプレート1を選択し、選択したテンプレートを用いて
前記使用者の声を認識する。個人別テンプレート1はセ
ット化されているので、不要な話者間スペクトル差異等
により誤認識を生じる危険が小さい。一方、同じ電話端
末装置を、その装置に割り当てられていない人が使用す
る場合には、テンプレート選択手段4のうちの共通テン
プレート選択ボタンを押しだ後に発声する。音声認識装
置はこのボタン操作を受けて、共通テンプレート2を選
択し、選択したテンプレートを用いて使用者の声を認識
する。
共通テンプレート2は既に述べたように不特定話者音声
認識に最適になるように作成されているので、使用者が
どのような性質の音声を持っていても、大過ない認識結
果を出力することができる。
認識に最適になるように作成されているので、使用者が
どのような性質の音声を持っていても、大過ない認識結
果を出力することができる。
以上のように本実施例によれば、テンプレート選択手段
として個人別テンプレート用と共通テンプレート用との
押ボタンを設け、本装置使用者が発声の前にいずれかの
ボタンを押して自らチンプレートラ選択することにより
、一台の電話端末装置を特定話者音声認識にも不特定話
者音声認識にも用いることができる。さらに、既に作成
された個人別テンプレートを抹消し、別の新たな話者の
音声で個人別テンプレートを作成し直すことにより、対
象となる特定話者を変更することもできる。
として個人別テンプレート用と共通テンプレート用との
押ボタンを設け、本装置使用者が発声の前にいずれかの
ボタンを押して自らチンプレートラ選択することにより
、一台の電話端末装置を特定話者音声認識にも不特定話
者音声認識にも用いることができる。さらに、既に作成
された個人別テンプレートを抹消し、別の新たな話者の
音声で個人別テンプレートを作成し直すことにより、対
象となる特定話者を変更することもできる。
なお、本実施例ではテンプレート選択手段4を個人別パ
ターン選択ボタンと共通パターン選択ボタンとの2個の
ボタンから成るとしたが、個人別テンプレート選択ボタ
ンを複数化し、同時に個人別テンプレート1に登録でき
る個人別の音声パターンも複数化し、これらの複数化さ
れた個人別テンプレート選択ボタンと個人別テンプレー
トとを一対一に対応させてもよい。この場合は、複数人
の特定話者が互いに、かつ独立に本電話端末装!を特定
話者用音声認識装置として利用することができる。
ターン選択ボタンと共通パターン選択ボタンとの2個の
ボタンから成るとしたが、個人別テンプレート選択ボタ
ンを複数化し、同時に個人別テンプレート1に登録でき
る個人別の音声パターンも複数化し、これらの複数化さ
れた個人別テンプレート選択ボタンと個人別テンプレー
トとを一対一に対応させてもよい。この場合は、複数人
の特定話者が互いに、かつ独立に本電話端末装!を特定
話者用音声認識装置として利用することができる。
発明の効果
本発明は、個人別テンプレートと共通テンプレートとを
設け、さらに発声者自身がこれらのうちの一つを任意に
選択できるようにテンプレート選択手段を設けることに
より、一台の電話端末装置が特定話者音声認識にも不特
定話者音声認識にも用いることができ、さらに、既に作
成された個人別テンプレートを抹消し別の新たな話者の
音声で個人別テレプレートを作成し直すことにより、対
象となる特定話者を変更することもできる優れた音声認
識装置を実現できるものである。
設け、さらに発声者自身がこれらのうちの一つを任意に
選択できるようにテンプレート選択手段を設けることに
より、一台の電話端末装置が特定話者音声認識にも不特
定話者音声認識にも用いることができ、さらに、既に作
成された個人別テンプレートを抹消し別の新たな話者の
音声で個人別テレプレートを作成し直すことにより、対
象となる特定話者を変更することもできる優れた音声認
識装置を実現できるものである。
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は従来の電話端末装置用音声認識装置の
ブロック図である。 1・・・・・・個人別テンプレート、2・・・・・・共
通テンプレート、3・・・・・電話端末装置本体部、4
・・・・・・テンプレート選択手段、5・・・・・・送
話器、6・・・・・テンプレート。
ック図、第2図は従来の電話端末装置用音声認識装置の
ブロック図である。 1・・・・・・個人別テンプレート、2・・・・・・共
通テンプレート、3・・・・・電話端末装置本体部、4
・・・・・・テンプレート選択手段、5・・・・・・送
話器、6・・・・・テンプレート。
Claims (3)
- (1)各人の音声発声に基いて各個人別の音声の認識に
最適になるように作成された個人別テンプレートと、多
人数の音声発声に基いて不特定話者の音声認識に最適に
なるように作成された共通テンプレートと、音声入力用
に個人毎に割り当てられた1台ないし複数台の電話端末
装置と、前記電話端末装置が割り当てられた個人が前記
電話端末装置を使用する場合には個人別テンプレートを
用い、それ以外の者が使用する場合には共通テンプレー
トを用いるように使用者がテンプレートを選択するテン
プレート選択手段とを有することを特徴とする音声認識
装置。 - (2)個人別テンプレートは各人の音声パターンをその
まま登録したことを特徴とする特許請求の範囲第1項記
載の音声認識装置。 - (3)共通テンプレートは1単語当たり複数個のテンプ
レートから成り、個人別テンプレートは、各人毎の声を
認識するのに最も適するように前記共通テンプレートか
ら単語毎に選択されたテンプレートのセットからなるこ
とを特徴とする特許請求の範囲第1項記載の音声認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61153140A JPS638798A (ja) | 1986-06-30 | 1986-06-30 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61153140A JPS638798A (ja) | 1986-06-30 | 1986-06-30 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS638798A true JPS638798A (ja) | 1988-01-14 |
Family
ID=15555884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61153140A Pending JPS638798A (ja) | 1986-06-30 | 1986-06-30 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS638798A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07210190A (ja) * | 1993-12-30 | 1995-08-11 | Internatl Business Mach Corp <Ibm> | 音声認識方法及びシステム |
US6522725B2 (en) | 1997-12-05 | 2003-02-18 | Nec Corporation | Speech recognition system capable of flexibly changing speech recognizing function without deteriorating quality of recognition result |
JP2008094725A (ja) * | 2006-10-06 | 2008-04-24 | Kracie Home Products Kk | パール状皮膚洗浄剤組成物 |
JP2010032865A (ja) * | 2008-07-30 | 2010-02-12 | Kddi Corp | 音声認識装置、音声認識システムおよびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5987500A (ja) * | 1982-11-12 | 1984-05-21 | 株式会社日立製作所 | 音声認識装置 |
JPS602997A (ja) * | 1983-06-20 | 1985-01-09 | 富士通株式会社 | 話者識別音声入力方法 |
-
1986
- 1986-06-30 JP JP61153140A patent/JPS638798A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5987500A (ja) * | 1982-11-12 | 1984-05-21 | 株式会社日立製作所 | 音声認識装置 |
JPS602997A (ja) * | 1983-06-20 | 1985-01-09 | 富士通株式会社 | 話者識別音声入力方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07210190A (ja) * | 1993-12-30 | 1995-08-11 | Internatl Business Mach Corp <Ibm> | 音声認識方法及びシステム |
US6522725B2 (en) | 1997-12-05 | 2003-02-18 | Nec Corporation | Speech recognition system capable of flexibly changing speech recognizing function without deteriorating quality of recognition result |
JP2008094725A (ja) * | 2006-10-06 | 2008-04-24 | Kracie Home Products Kk | パール状皮膚洗浄剤組成物 |
JP2010032865A (ja) * | 2008-07-30 | 2010-02-12 | Kddi Corp | 音声認識装置、音声認識システムおよびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4085924B2 (ja) | 音声処理装置 | |
JPS638798A (ja) | 音声認識装置 | |
KR900010649A (ko) | 음성 인식 장치 및 이것을 이용한 전화기 | |
JP2002229592A (ja) | 音声認識装置 | |
JPH04324499A (ja) | 音声認識装置 | |
JPH0863185A (ja) | 音声認識装置 | |
JPS63121097A (ja) | 電話用音声認識装置 | |
JPS63259599A (ja) | 音声認識装置 | |
JPS63253480A (ja) | 声紋確認カ−ドシステム | |
JP2000125397A (ja) | 話者識別型ディジタル補聴器 | |
JPH0421244A (ja) | ダイヤル信号自動送出補助装置 | |
JPH01293397A (ja) | 音声応答方式 | |
JPS5977499A (ja) | 音声認識装置 | |
JPS6041863A (ja) | プッシュホン音声入力装置 | |
JPS63303550A (ja) | 音声認識装置 | |
JPS63304298A (ja) | 音声認識装置 | |
JPS59121398A (ja) | 音声認識方式 | |
JPS61281299A (ja) | 音声認識装置 | |
JPH0197044A (ja) | 音声ダイヤル装置 | |
JPS63236454A (ja) | 登録内容検索装置 | |
JPS58108595A (ja) | 音声認識方法 | |
JPH04951A (ja) | 音声ダイヤル装置 | |
JPH04200049A (ja) | 音声ダイヤル装置 | |
JPS63121098A (ja) | 電話用音声認識装置 | |
JPH0667688A (ja) | 入力装置 |