JPH0634188B2 - 情報処理方法 - Google Patents
情報処理方法Info
- Publication number
- JPH0634188B2 JPH0634188B2 JP60015437A JP1543785A JPH0634188B2 JP H0634188 B2 JPH0634188 B2 JP H0634188B2 JP 60015437 A JP60015437 A JP 60015437A JP 1543785 A JP1543785 A JP 1543785A JP H0634188 B2 JPH0634188 B2 JP H0634188B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition
- message
- speaker
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】 [技術分野] 本発明は情報処理方法に関し、特に不特定話者が使用す
るもので、かつ音声認識の信頼性が要求される情報処理
方法に関するものである。
るもので、かつ音声認識の信頼性が要求される情報処理
方法に関するものである。
[従来技術] 従来、この種の音声認識応答装置では完全な音声認識は
不可能であり、特に認識の信頼性が要求される用途にお
いては、音声応答装置等を使用して認識結果を応答出力
し、その確認入力を促していた。
不可能であり、特に認識の信頼性が要求される用途にお
いては、音声応答装置等を使用して認識結果を応答出力
し、その確認入力を促していた。
一例として、バンキングサービスにおける残高照会を示
すと表1のような音声認識応答手順となる。
すと表1のような音声認識応答手順となる。
このように顧客側入力と銀行側応答は交互に行なわれ、
その中で認識の結果の確認「はい」、「いいえ」の認識
も行なわれる。即ち、認識結果の確認が肯定的であれば
次のステップに進み、新たな入力と応答が行なわれる
が、否定的の場合は同じプロセスを繰り返し、正しく認
識されるまでは次のステップに進めなかった。
その中で認識の結果の確認「はい」、「いいえ」の認識
も行なわれる。即ち、認識結果の確認が肯定的であれば
次のステップに進み、新たな入力と応答が行なわれる
が、否定的の場合は同じプロセスを繰り返し、正しく認
識されるまでは次のステップに進めなかった。
しかしながら単に認識回数を増やしても正しい結果が得
られるとは限らず、実際は2〜3回入力して認識できな
い時は以後何回入力しても認識されない事が多い。音声
認識応答装置は操作者をわずらわしいキー操作から開放
するものとして開発されたが、現実には誰にでも使用す
るできるものでなく、認識がうまくできない場合は正し
く認識されるまで何度でも音声を入力しなければなら
ず、かえって話者に時間と労力を強要するものと考えら
れていた。
られるとは限らず、実際は2〜3回入力して認識できな
い時は以後何回入力しても認識されない事が多い。音声
認識応答装置は操作者をわずらわしいキー操作から開放
するものとして開発されたが、現実には誰にでも使用す
るできるものでなく、認識がうまくできない場合は正し
く認識されるまで何度でも音声を入力しなければなら
ず、かえって話者に時間と労力を強要するものと考えら
れていた。
[目的] 本発明は上記従来例に鑑みてなされたもので、音声を何
度入力しても認識されない場合を解決することを目的と
し、個性の高い話者に対しても十分に対応できる情報処
理方法を提供することを目的とする。
度入力しても認識されない場合を解決することを目的と
し、個性の高い話者に対しても十分に対応できる情報処
理方法を提供することを目的とする。
[実施例] 以下、添付図面に従って本発明の実施例を詳細に説明す
る。
る。
第1図は本発明に係る実施例の音声認識応答装置のブロ
ック構成図である。図において、1は音声を入力するマ
イクロホン、2は音声信号をデジタル変換するA/D変
換器、3は入力音声信号の特徴パラメータを抽出する特
徴抽出部、4はRAM,ROMを含むマイクロプロセッ
サから成り、入力音声の認識及びそれに基づく音声応答
制御を実行するセントラルプロセッシングユニット(C
PU)、5は装置が音声出力をするスピーカ、6は本装
置の認識結果を利用して動作する外部装置(キャッシュ
ディスペンサ)である。
ック構成図である。図において、1は音声を入力するマ
イクロホン、2は音声信号をデジタル変換するA/D変
換器、3は入力音声信号の特徴パラメータを抽出する特
徴抽出部、4はRAM,ROMを含むマイクロプロセッ
サから成り、入力音声の認識及びそれに基づく音声応答
制御を実行するセントラルプロセッシングユニット(C
PU)、5は装置が音声出力をするスピーカ、6は本装
置の認識結果を利用して動作する外部装置(キャッシュ
ディスペンサ)である。
CPU4内にはプログラムの実行により実現される各種
機能ブロックが示されている。7は所定種類の音声、例
えば「ゼロ」〜「キュー」及び「ハイ」等の入力を認識
する第1認識部、8は特定音声、例えば「ハイ」のみを
高性能、高認識率で認識する第2認識部、9は認識結果
に基づいて制御を進める制御部、10は音声応答信号を
合成出力する音声応答部、11は応答用メッセージの音
声データを格納しているメッセージメモリである。
機能ブロックが示されている。7は所定種類の音声、例
えば「ゼロ」〜「キュー」及び「ハイ」等の入力を認識
する第1認識部、8は特定音声、例えば「ハイ」のみを
高性能、高認識率で認識する第2認識部、9は認識結果
に基づいて制御を進める制御部、10は音声応答信号を
合成出力する音声応答部、11は応答用メッセージの音
声データを格納しているメッセージメモリである。
第2図はメッセージメモリ11の記憶内容を示す図であ
る。メッセージメモリ11はグループ分けした各種メッ
セージを記憶しており、12は話者に対する案内用(ガ
イダンス)メッセージを記憶しているガイダンスメッセ
ージの記憶エリア、13は入力音声認識結果の確認メッ
セージを記憶しているエリア、14は認識がうまくいか
ない場合に装置側から話者に提案する提案メッセージを
記憶しているエリアである。
る。メッセージメモリ11はグループ分けした各種メッ
セージを記憶しており、12は話者に対する案内用(ガ
イダンス)メッセージを記憶しているガイダンスメッセ
ージの記憶エリア、13は入力音声認識結果の確認メッ
セージを記憶しているエリア、14は認識がうまくいか
ない場合に装置側から話者に提案する提案メッセージを
記憶しているエリアである。
第3図は実施例の動作手順を説明するフローチャートで
ある。ステップS1では認識できなかった回数を数える
リトライカウンタRCを0に、またガイダンスエリア用
のインデックスレジスタiを1に初期化する。ステップ
S2ではスイッチSWを1側に接続する。所定種類の入
力音声を認識、識別するためである。ステップS3では
インデックスレジスタiの内容(最初は1)でガイダン
スメッセージをアクセスしてスピーカ5に出力する。即
ち、「暗証番号の1ケタ目をどうぞ」の音声出力をす
る。ステップS4では話者の音声入力を待つ。音声入力
があるとステップS5に進んでで音声認識をし、認識結
果の符号(数)をレジスタjに格納する。ステップS6
では該レジスタjの内容(例えば3)で確認メッセージ
をアクセスし、スピーカ5に出力する。即ち、「サンで
すか」を音声出力する。ステップS7では話者の返事を
待ち、返事があるとステップS8で入力音声を認識し、
ステップS9で「はい」か否かを判別する。
ある。ステップS1では認識できなかった回数を数える
リトライカウンタRCを0に、またガイダンスエリア用
のインデックスレジスタiを1に初期化する。ステップ
S2ではスイッチSWを1側に接続する。所定種類の入
力音声を認識、識別するためである。ステップS3では
インデックスレジスタiの内容(最初は1)でガイダン
スメッセージをアクセスしてスピーカ5に出力する。即
ち、「暗証番号の1ケタ目をどうぞ」の音声出力をす
る。ステップS4では話者の音声入力を待つ。音声入力
があるとステップS5に進んでで音声認識をし、認識結
果の符号(数)をレジスタjに格納する。ステップS6
では該レジスタjの内容(例えば3)で確認メッセージ
をアクセスし、スピーカ5に出力する。即ち、「サンで
すか」を音声出力する。ステップS7では話者の返事を
待ち、返事があるとステップS8で入力音声を認識し、
ステップS9で「はい」か否かを判別する。
「はい」であればステップS5の認識が正しいことの確
認がとれたことになる。ステップS10でリトライカウ
ンタRCを0にし、ステップS11でインデックスレジ
スタiにプラス1し、ステップS12で認識結果jの符
号を外部装置6に送る。ステップS13ではインデック
スレジスタiが最大(暗証の入力ケタ数を満足した)か
否かを判別し、満足なら処理を終了し、満足でなければ
ステップS2に戻り、次のガイダンスメッセージを出力
する。
認がとれたことになる。ステップS10でリトライカウ
ンタRCを0にし、ステップS11でインデックスレジ
スタiにプラス1し、ステップS12で認識結果jの符
号を外部装置6に送る。ステップS13ではインデック
スレジスタiが最大(暗証の入力ケタ数を満足した)か
否かを判別し、満足なら処理を終了し、満足でなければ
ステップS2に戻り、次のガイダンスメッセージを出力
する。
次に前記同様にしてステップS3からステップS9に進
み、話者の返事が「はい」でないときは認識結果のjが
誤りであったことを意味する。例えば「イチ」と発音し
たのに「ハチ」と認識してしまった場合はアドレスA−
Q(8)の音声「ハチですか」が出力される。話者は間
違っているので「イイエ」を入力する。「ハイ」でない
からフローはステップS14に進み、リトライカウンタ
RCにプラス1する。ステップS15ではリトライカウ
ンタRCを調べ、内容が2でなければステップS2に戻
る。このように実施例では1回だけ同一方法で音声の再
入力、確認を行うこととした。
み、話者の返事が「はい」でないときは認識結果のjが
誤りであったことを意味する。例えば「イチ」と発音し
たのに「ハチ」と認識してしまった場合はアドレスA−
Q(8)の音声「ハチですか」が出力される。話者は間
違っているので「イイエ」を入力する。「ハイ」でない
からフローはステップS14に進み、リトライカウンタ
RCにプラス1する。ステップS15ではリトライカウ
ンタRCを調べ、内容が2でなければステップS2に戻
る。このように実施例では1回だけ同一方法で音声の再
入力、確認を行うこととした。
もし、ステップS15でリトライカウンタRC=2と判
別するとステップA16に進み、スイッチSWを2側に
切り替える。第2認識部を使うためである。実施例の第
2認識部8はあらゆるタイプの話者の「はい」のみを高
性能、高信頼で認識できるように構成されている。この
意味で本実施例では第1認識部と第2認識部を分けて示
してある。
別するとステップA16に進み、スイッチSWを2側に
切り替える。第2認識部を使うためである。実施例の第
2認識部8はあらゆるタイプの話者の「はい」のみを高
性能、高信頼で認識できるように構成されている。この
意味で本実施例では第1認識部と第2認識部を分けて示
してある。
さて、ステップS17では提案カウンタkの内容を1に
初期化する。ステップS18では提案カウンタkの内容
で提案メッセージをアクセスしてスピーカ5に音声出力
する。即ち、「イチならばハイとこたえてください」を
音声出力する。ステップS9では話者の返事を待つ。ス
テップS20では返事の音声入力を認識する。ステップ
S21では認識結果が「ハイ」か否かを調べる。「ハ
イ」ならば話者の入力したかった音声数字は提案カウン
タkの内容と等しいから、ステップS24でkの内容を
インデックスレジスタiに移し、ステップS10に進
む。次の桁の暗証入力を行うためである。
初期化する。ステップS18では提案カウンタkの内容
で提案メッセージをアクセスしてスピーカ5に音声出力
する。即ち、「イチならばハイとこたえてください」を
音声出力する。ステップS9では話者の返事を待つ。ス
テップS20では返事の音声入力を認識する。ステップ
S21では認識結果が「ハイ」か否かを調べる。「ハ
イ」ならば話者の入力したかった音声数字は提案カウン
タkの内容と等しいから、ステップS24でkの内容を
インデックスレジスタiに移し、ステップS10に進
む。次の桁の暗証入力を行うためである。
またステップS21で「ハイ」でないときは話者の意図
した数でないことを意味する。フローはステップS22
に進んで提案カウンタkにプラス1をし、ステップS2
3で提案カウンタkが最大か否かを判別する。最大でな
けれがステップS18に戻って次の数を提案し、また最
大ならステップS17に戻って1から始める。
した数でないことを意味する。フローはステップS22
に進んで提案カウンタkにプラス1をし、ステップS2
3で提案カウンタkが最大か否かを判別する。最大でな
けれがステップS18に戻って次の数を提案し、また最
大ならステップS17に戻って1から始める。
尚、上述実施例において、第1認識部が「ハイ」又は
「イイエ」を高性能認識できるなら、第2認識部を別に
設ける必要はない。
「イイエ」を高性能認識できるなら、第2認識部を別に
設ける必要はない。
また、第2認識部の「ハイ」又は「イイエ」の高性能認
識が困難な場合は「ハイ」又は「イイエ」を認識する代
りに単に音声(又は音)の有無を検出するような単純か
つ確実な方法で、確認するようにしてもよい。
識が困難な場合は「ハイ」又は「イイエ」を認識する代
りに単に音声(又は音)の有無を検出するような単純か
つ確実な方法で、確認するようにしてもよい。
また上述実施例において、制御部は話者が入力した音声
が誤って認識された場合に誤りの回数を数え、ある一定
値(実施例では2回)を越えた場合に質問応答形式を変
えていた。この場合に、話者が入力した音声の認識結果
応答はスコア(類似度)の一番高い語句を第1候補とし
て話者に確認出力しているわけであるが、この第1候補
を認識結果として出力し、確認音声を認識した結果、誤
っていた場合は、話者に再び数字の音声入力を要求する
のでなく、直ちに装置内の第2候補、第3候補でもって
提案応答を行なうことにすれば、更に効率良い動作を行
なわせることができる。
が誤って認識された場合に誤りの回数を数え、ある一定
値(実施例では2回)を越えた場合に質問応答形式を変
えていた。この場合に、話者が入力した音声の認識結果
応答はスコア(類似度)の一番高い語句を第1候補とし
て話者に確認出力しているわけであるが、この第1候補
を認識結果として出力し、確認音声を認識した結果、誤
っていた場合は、話者に再び数字の音声入力を要求する
のでなく、直ちに装置内の第2候補、第3候補でもって
提案応答を行なうことにすれば、更に効率良い動作を行
なわせることができる。
[効果] 以上述べたごとく本発明によれば、効率よく正確な認識
ができ、特に音声を何度入力しても認識されないという
事態の発生を防止できる効果がある。
ができ、特に音声を何度入力しても認識されないという
事態の発生を防止できる効果がある。
第1図は本発明に係る実施例の音声認識応答装置のブロ
ック構成図、 第2図はメッセージメモリの記憶内容を示す図、 第3図は実施例の動作手順を説明するフローチャートで
ある。 ここで、1……マイクロホン、2……特徴抽出部、3…
…A/D変換器、4……セントラルプロセッシングユニ
ット(CPU)、5……スピーカ、6……外部装置、7
……第1認識部、8……第2認識部、9……制御部、1
0……音声応答部、11……メッセージメモリである。
ック構成図、 第2図はメッセージメモリの記憶内容を示す図、 第3図は実施例の動作手順を説明するフローチャートで
ある。 ここで、1……マイクロホン、2……特徴抽出部、3…
…A/D変換器、4……セントラルプロセッシングユニ
ット(CPU)、5……スピーカ、6……外部装置、7
……第1認識部、8……第2認識部、9……制御部、1
0……音声応答部、11……メッセージメモリである。
Claims (3)
- 【請求項1】入力音声を第1の方法で認識し、 前記第1の認識結果の正誤を判断し、 前記第1の認識結果が誤っていると判断される場合に、
成否が応答メッセージとなり得るメッセージを出力し、 前記メッセージに対する応答を第2の方法で認識するこ
とにより、前記入力音声を特定することを特徴とする情
報処理方法。 - 【請求項2】前記メッセージは、複数のメッセージから
なるメッセージ群であり、前記メッセージ群内で順に出
力することを特徴とする特許請求の範囲第1項に記載の
情報処理方法。 - 【請求項3】前記第2の認識方法は、成否に関する情報
の認識が特に高精度であることを特徴とする特許請求の
範囲第1項に記載の情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60015437A JPH0634188B2 (ja) | 1985-01-31 | 1985-01-31 | 情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60015437A JPH0634188B2 (ja) | 1985-01-31 | 1985-01-31 | 情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61175696A JPS61175696A (ja) | 1986-08-07 |
JPH0634188B2 true JPH0634188B2 (ja) | 1994-05-02 |
Family
ID=11888774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60015437A Expired - Lifetime JPH0634188B2 (ja) | 1985-01-31 | 1985-01-31 | 情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0634188B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090511A (ja) * | 1998-09-11 | 2000-03-31 | Victor Co Of Japan Ltd | Av機器の予約方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63296098A (ja) * | 1987-05-28 | 1988-12-02 | 富士通株式会社 | 音声検索方式 |
JPH02278297A (ja) * | 1989-04-20 | 1990-11-14 | Sanyo Electric Co Ltd | 音声認識装置 |
JPH0749697A (ja) * | 1994-06-03 | 1995-02-21 | Fujitsu Ten Ltd | 音声認識装置 |
JP2003091299A (ja) * | 2001-07-13 | 2003-03-28 | Honda Motor Co Ltd | 車載用音声認識装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6173998A (ja) * | 1984-09-19 | 1986-04-16 | シャープ株式会社 | 音声認識装置 |
-
1985
- 1985-01-31 JP JP60015437A patent/JPH0634188B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000090511A (ja) * | 1998-09-11 | 2000-03-31 | Victor Co Of Japan Ltd | Av機器の予約方法 |
Also Published As
Publication number | Publication date |
---|---|
JPS61175696A (ja) | 1986-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4653097A (en) | Individual verification apparatus | |
JP6394709B2 (ja) | 話者識別装置および話者識別用の登録音声の特徴量登録方法 | |
JP2008164647A (ja) | 発話分割方法、装置およびプログラム | |
US5781887A (en) | Speech recognition method with error reset commands | |
JPH0634188B2 (ja) | 情報処理方法 | |
JP4845955B2 (ja) | 音声認識結果訂正装置および音声認識結果訂正方法 | |
US20040015354A1 (en) | Voice recognition system allowing different number-reading manners | |
KR101925253B1 (ko) | 문맥 독립형 화자확인 장치 및 이를 이용한 화자확인 방법 | |
JPH0795240B2 (ja) | 個人音声パタ−ン入りカ−ドシステム | |
JP3039453B2 (ja) | 音声認識装置 | |
JP3108121B2 (ja) | 音声認識装置の辞書制御方式 | |
WO2021250837A1 (ja) | 検索装置、検索方法、および記録媒体 | |
JP4749438B2 (ja) | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム | |
JP2538543B2 (ja) | 文字情報認識装置 | |
JPS6126133A (ja) | 音声認識入力装置 | |
KR100317215B1 (ko) | Plu를 이용한 화자독립/어휘독립 음성모델 등록장치 및그 방법 | |
JP3515143B2 (ja) | パターン追加登録装置 | |
JPH0654503B2 (ja) | パタ−ン認識装置 | |
JP2000132183A (ja) | 音声認識装置 | |
JPH09161014A (ja) | 文字認識装置 | |
JP2006039381A (ja) | 音声対話装置 | |
JPH09288495A (ja) | ボタン指定・音声認識併用型入力方法及び装置 | |
JP4815463B2 (ja) | 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム | |
JPH0562359B2 (ja) | ||
JPS59111697A (ja) | 音声認識方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |