JPS59176791A - 音声登録方式 - Google Patents
音声登録方式Info
- Publication number
- JPS59176791A JPS59176791A JP58050645A JP5064583A JPS59176791A JP S59176791 A JPS59176791 A JP S59176791A JP 58050645 A JP58050645 A JP 58050645A JP 5064583 A JP5064583 A JP 5064583A JP S59176791 A JPS59176791 A JP S59176791A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speaker
- speech
- recognition
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(a1発明の技術分野
本発明は電子計算機等に対する音声入力装置に係り、と
くに特定話者認識方式にお←)る音声パターン登録の方
式に関する。
くに特定話者認識方式にお←)る音声パターン登録の方
式に関する。
(bl技術の背景
近時、電子計算機等に対して音声により情報を入力した
り、あるいは該音声入力情報を自動的に文書化する等の
、いわゆる音声処理の開発が盛んに行われている。
り、あるいは該音声入力情報を自動的に文書化する等の
、いわゆる音声処理の開発が盛んに行われている。
上記の音声による情報の入力においては、音声パターン
を、例えば単語あるいは音韻単位で識別し、該単語の、
もしくは該音韻列に対応する意味を音声認識用辞書から
検索するのであるが、この場合における音声パターンの
識別方式として、不特定話者認識方式と特定話者認識方
式とがある。
を、例えば単語あるいは音韻単位で識別し、該単語の、
もしくは該音韻列に対応する意味を音声認識用辞書から
検索するのであるが、この場合における音声パターンの
識別方式として、不特定話者認識方式と特定話者認識方
式とがある。
不特定話者認識方式は音声パターンの個人差を考慮に入
れた標準パターンに基づいそ不特定多数の話者の音声を
分析し認識を行うもので、話者各人ごとに特徴音声パタ
ーンを登録する必要がないが、高い認識率を得ることが
困難であるために、認識対象語電数が少ない欠点がある
。
れた標準パターンに基づいそ不特定多数の話者の音声を
分析し認識を行うもので、話者各人ごとに特徴音声パタ
ーンを登録する必要がないが、高い認識率を得ることが
困難であるために、認識対象語電数が少ない欠点がある
。
これに対して、特定話者認識方式は各話者の特徴音声パ
ターンを登録しておき、各話者ことにその登録音声パタ
ーンに基づいて音声認識を行うもので、特徴音声パター
ンの登録等の手間を要するが、高い認識率が得られるの
で多数の倍電を取り扱うことが可能である。
ターンを登録しておき、各話者ことにその登録音声パタ
ーンに基づいて音声認識を行うもので、特徴音声パター
ンの登録等の手間を要するが、高い認識率が得られるの
で多数の倍電を取り扱うことが可能である。
(C)従来技術と問題点
しかしながら、従来の特定話者認識方式の音声認識装置
においては、音声出力に必要な音声合成パラメータ作成
のための音声分析は汎用計算機によって行われていた。
においては、音声出力に必要な音声合成パラメータ作成
のための音声分析は汎用計算機によって行われていた。
したがって、話者の@徴音声バクーンの登録時において
、該話者の発声を即時に音声分析ならひに合成すること
ができず、該話者は自分の発声が意図した通りの音声に
登録されたかどうかを確認することが不可能であり、こ
のために、実際の音声認iR[作において初めて認識誤
り、あるいは認識不能等の存在に気付き、かつその原因
が認識処理にあるのか、あるいは発声音に原因があるの
かの判断ができず、また、一般にこのような誤認識等が
正常な認識中に散発的に発生ずるためにその発見が遅れ
、重大な、認識誤りを生したり、宇宙の認識操作におけ
る認識率の低下を招く欠点があった。
、該話者の発声を即時に音声分析ならひに合成すること
ができず、該話者は自分の発声が意図した通りの音声に
登録されたかどうかを確認することが不可能であり、こ
のために、実際の音声認iR[作において初めて認識誤
り、あるいは認識不能等の存在に気付き、かつその原因
が認識処理にあるのか、あるいは発声音に原因があるの
かの判断ができず、また、一般にこのような誤認識等が
正常な認識中に散発的に発生ずるためにその発見が遅れ
、重大な、認識誤りを生したり、宇宙の認識操作におけ
る認識率の低下を招く欠点があった。
(d+発明の目的
本発明の目的とするところは、登録される話者の特徴音
声パターンを登録時に確認可能とする方式を提供し、こ
れにより該登録パターンに基づく音声認識における認識
率を向上することにある。
声パターンを登録時に確認可能とする方式を提供し、こ
れにより該登録パターンに基づく音声認識における認識
率を向上することにある。
te1発明の構成
本発明は、話者の音声パターンをあらか′しめ登録して
おいた該話者の音声パターンと比較することによって認
識する特定話者認識装置において、音声合成のだめの音
声分析回路と音声合成回路を設け、音声パターン登録時
に登録される音声を分析して該分析データに基づく合成
音声を該話者に対して出力し、該話者の発声がその意図
する音声として認識されたことを確認した場合にのめこ
れを登録することを特徴とする。
おいた該話者の音声パターンと比較することによって認
識する特定話者認識装置において、音声合成のだめの音
声分析回路と音声合成回路を設け、音声パターン登録時
に登録される音声を分析して該分析データに基づく合成
音声を該話者に対して出力し、該話者の発声がその意図
する音声として認識されたことを確認した場合にのめこ
れを登録することを特徴とする。
(f1発明の実施例
本発明の実施例を図面を参照して説明する。
まず、ディスプレイ1の上に特徴音声パターンとして登
録する文字が表示される。登録話者は該ディスプレイ1
画面上の指示にしたがって該文字を発声する。例えば、
ディスプレイ1上に片カナ文字「ア」が表示されると、
話者は″ア°゛と発声する。
録する文字が表示される。登録話者は該ディスプレイ1
画面上の指示にしたがって該文字を発声する。例えば、
ディスプレイ1上に片カナ文字「ア」が表示されると、
話者は″ア°゛と発声する。
該発声音入力はA/Dコンバータ7によりデジタル化さ
れ音声認識部2に入力する。音声認識部2は音声入力“
ア”の始点を検出し、その音声スペクトル分析を行い、
得られた分析パラメータを音声標準パラメータとして標
準パターンメモリ3に格納すると同時にA/D変換され
た“ア”に相当する音声データを音声分析・合成部4に
送出する。
れ音声認識部2に入力する。音声認識部2は音声入力“
ア”の始点を検出し、その音声スペクトル分析を行い、
得られた分析パラメータを音声標準パラメータとして標
準パターンメモリ3に格納すると同時にA/D変換され
た“ア”に相当する音声データを音声分析・合成部4に
送出する。
音声分析・合成部4は該音声データを受は取ると、直ち
に音声分析ならびに合成を行ってスピーカ5から“ア”
の合成音を出力する。
に音声分析ならびに合成を行ってスピーカ5から“ア”
の合成音を出力する。
該話者はこの合成音を聞取り、自分の発声した音声と比
較し、意図した通りの音声と判断ずれは前記音声認識部
2に対して登録確認を入力する。
較し、意図した通りの音声と判断ずれは前記音声認識部
2に対して登録確認を入力する。
もし、例えば登録時に“ア”の発声音に騒音等が重畳し
、音声認識部2で、例えは“ガ”として分析された場合
、これば標準パターンメモリ3には“ア”として登録さ
れる。
、音声認識部2で、例えは“ガ”として分析された場合
、これば標準パターンメモリ3には“ア”として登録さ
れる。
このままで、つぎにディスプレイ1に「ガ」が表示され
、これにしたがって話者が“ガパを発声して登録された
とすると、以後の認識操作におし1ては、該話者の発声
音の“ア”と“ガ”は識別されないことになるのである
。
、これにしたがって話者が“ガパを発声して登録された
とすると、以後の認識操作におし1ては、該話者の発声
音の“ア”と“ガ”は識別されないことになるのである
。
しかしながら、本発明においては、上記のように騒音等
が重畳して“ガ”と認識された“ア′”の音声は音声分
析・合成部4により分析ならびに合成され、スピーカ5
から″ガ゛の合成音が出力される。したがって、話者は
自分の発声音“ア゛が正しく登録されていないことを知
り、直ちに再登録を行うことが可能となるのである。
が重畳して“ガ”と認識された“ア′”の音声は音声分
析・合成部4により分析ならびに合成され、スピーカ5
から″ガ゛の合成音が出力される。したがって、話者は
自分の発声音“ア゛が正しく登録されていないことを知
り、直ちに再登録を行うことが可能となるのである。
なお、上記音声分析・合成部4は、音声合成パラメータ
格納メモリ6に記憶された定型文等を音声合成してスピ
ーカ5から出力する、従来の音声合成回路と同様の装置
として使用することも可能であり、このための回路とし
ては、すでに開発されている八DPCM (八dapt
ive Differential Pu1seCod
e Modulation :適応差分パルス符号変
調)方式の集積回路を用いれば、その実現はきわめて容
易である。
格納メモリ6に記憶された定型文等を音声合成してスピ
ーカ5から出力する、従来の音声合成回路と同様の装置
として使用することも可能であり、このための回路とし
ては、すでに開発されている八DPCM (八dapt
ive Differential Pu1seCod
e Modulation :適応差分パルス符号変
調)方式の集積回路を用いれば、その実現はきわめて容
易である。
図において8は音声登録回路系を制御する制御部、9は
標準パターンおよび音声認識装置の制御プログラム等を
格納するだめの、例えばフロンピーディスク装置等のフ
ァイル装置である。
標準パターンおよび音声認識装置の制御プログラム等を
格納するだめの、例えばフロンピーディスク装置等のフ
ァイル装置である。
(g1発明の効果
本発明によれば、話者の特徴音声パターンの登録時にお
いて即時に登録誤りを発見可能とし、高信頼度の特徴音
声パターンの登録ができ、その結果として音声認識率の
向上を可能とする効果がある。
いて即時に登録誤りを発見可能とし、高信頼度の特徴音
声パターンの登録ができ、その結果として音声認識率の
向上を可能とする効果がある。
図は本発明に係る音声登録方式の機能ブし122図であ
る。 図において、1ばディスプレイ、2は音声認識部、3は
標準パターンメモリ、4は音声分析・合成部、5はスピ
ーカ、6は音声合成パラメータ格納メモリ、7はA/D
コンバータ、8は制御部、9はファイル装置である。
る。 図において、1ばディスプレイ、2は音声認識部、3は
標準パターンメモリ、4は音声分析・合成部、5はスピ
ーカ、6は音声合成パラメータ格納メモリ、7はA/D
コンバータ、8は制御部、9はファイル装置である。
Claims (1)
- 話者の音声パターンをあらかじめ登録しておいた該話者
の音声パターンと比較することによって認識する特定話
者認識装置において、音声合成のだめの音声分析回路と
音声合成回路を設け、音声パターン登録時に登録される
音声を分析して該分析データに基づく合成音声を該話者
に対して出力し、該話者の発声がその意図する音声とし
て認識されたことを確認した場合にのみこれを登録する
ことを特徴とする音声登録方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58050645A JPS59176791A (ja) | 1983-03-26 | 1983-03-26 | 音声登録方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58050645A JPS59176791A (ja) | 1983-03-26 | 1983-03-26 | 音声登録方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59176791A true JPS59176791A (ja) | 1984-10-06 |
Family
ID=12864680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58050645A Pending JPS59176791A (ja) | 1983-03-26 | 1983-03-26 | 音声登録方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59176791A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63292196A (ja) * | 1987-05-26 | 1988-11-29 | 日本電気株式会社 | 特定話者用音声認識装置 |
-
1983
- 1983-03-26 JP JP58050645A patent/JPS59176791A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63292196A (ja) * | 1987-05-26 | 1988-11-29 | 日本電気株式会社 | 特定話者用音声認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7496510B2 (en) | Method and apparatus for the automatic separating and indexing of multi-speaker conversations | |
US6975986B2 (en) | Voice spelling in an audio-only interface | |
US20020111805A1 (en) | Methods for generating pronounciation variants and for recognizing speech | |
JP2007233412A (ja) | ユーザが定義したフレーズの話者に依存しない認識方法及びシステム | |
JP2003029776A (ja) | 音声認識装置 | |
JPS597998A (ja) | 連続音声認識装置 | |
JPS59176791A (ja) | 音声登録方式 | |
JP2820093B2 (ja) | 単音節認識装置 | |
JP3277579B2 (ja) | 音声認識方法および装置 | |
JP3437492B2 (ja) | 音声認識方法及び装置 | |
CA2191377A1 (en) | A time-varying feature space preprocessing procedure for telephone based speech recognition | |
JPS63149699A (ja) | 音声入出力装置 | |
JPS6126678B2 (ja) | ||
EP1426924A1 (en) | Speaker recognition for rejecting background speakers | |
JPH0194398A (ja) | 音声標準パターンの作成方法 | |
JPS5953900A (ja) | 音声認識方法 | |
JPH0556519B2 (ja) | ||
JPH01285998A (ja) | 音声認識装置 | |
JPH08110790A (ja) | 音声認識装置 | |
JP2000056794A (ja) | 音声認識システム及び記録媒体 | |
JPH05158493A (ja) | 音声認識装置 | |
JPH08194491A (ja) | 音声認識装置 | |
JPS6073592A (ja) | 特定話者用音声認識装置 | |
JPH0854892A (ja) | 音声認識方法 | |
JP2001175275A (ja) | サブワード音響モデル生成方法および音声認識装置 |