JP2646080B2 - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JP2646080B2
JP2646080B2 JP61182726A JP18272686A JP2646080B2 JP 2646080 B2 JP2646080 B2 JP 2646080B2 JP 61182726 A JP61182726 A JP 61182726A JP 18272686 A JP18272686 A JP 18272686A JP 2646080 B2 JP2646080 B2 JP 2646080B2
Authority
JP
Japan
Prior art keywords
voice
word
recognition
input
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61182726A
Other languages
English (en)
Other versions
JPS6338996A (ja
Inventor
隆憲 村田
満次 松下
和一郎 辻田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP61182726A priority Critical patent/JP2646080B2/ja
Publication of JPS6338996A publication Critical patent/JPS6338996A/ja
Application granted granted Critical
Publication of JP2646080B2 publication Critical patent/JP2646080B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声認識方法に関し、更に詳細には音声によ
る入力において誤認識が発生した場合、誤認識を訂正す
る音声認識方法に関する。
(従来の技術) 現在、金融業界,流通業界等に電話回線による音声応
答認識装置が導入され、残高照会,オーダーエントリー
等のサービスが利用者に提供されている。つまり、これ
らのサービスは利用者が暗証番号,会員番号,サービス
コード等を音声により電話機等から入力して行なわれる
ものである。
第6図は従来の音声応答認識装置による認識結果の確
認手順を示す図である。同図からわかるように、音声応
答認識装置からの「暗証番号をどうぞ」等の合成音声に
よるガイダンスに従つて利用者が発声した暗証番号の全
桁の入力音声を認識する。そして、暗証番号の全桁の認
識結果の確認を行なつて誤認識があれば、同図のように
1桁目から順に認識結果の訂正を行なつていく。
(発明が解決しようとする問題点) しかしながら、上記従来の方法では入力すべき番号の
桁数が多く、かつ認識結果で1桁のみ誤認識だけであつ
た場合でも1桁目から順に誤認識を検索して訂正してい
くので、正しい認識結果が得られている桁まで確認して
不要な動作が加わり入力の確定に至るまで時間がかかり
サービスの低下を招くという問題点があつた。
本発明はこれらの問題点を解決するためのもので、誤
認識が発生した場合、認識結果の確認,訂正のための再
入力等による認識結果の確定に至るまでの時間を短く
し、利用者に対するサービスの向上を図ることができる
音声認識方法を提供することを目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、利用者の入力
タイミングに従って入力された音声の単語を音声認識す
る単語音声認識部と、利用者へのガイダンスのための音
声データに基づいて合成音声を出力する音声合成部とを
具備している。
(作用) 以上のような構成を有する本発明によれば、次のよう
に作用する。
利用者が単語を入力した時にその単語は単語音声認識
部で認識される。そして、その認識結果が音声合成部に
より音声合成出力される。次に、認識結果を音声合成出
力した後であって利用者が単語を音声入力した時に単語
音声認識部でその単語を認識し、認識結果が単語音声認
識部で再音声入力を要求するカテゴリーと認識されたと
きは、入力された音声の単語の認識結果に誤認識が発生
したと判断するとともに次に入力される音声を訂正入力
とする。また、当該認識結果が単語音声認識部で音声入
力終了を要求するカテゴリーと認識されたときは、認識
結果に対する認識結果の入力を促すガイダンスとともに
すべての認識結果を音声合成部により音声合成出力する
ことにより確認を促す。更に、当該認識結果が単語音声
認識部で再音声入力を要求するカテゴリー及び音声入力
終了を要求するカテゴリーのいずれでもないと認識され
たときは、次の単語が音声入力されたと判断するととも
に前の入力音声の認識結果が正常であると判断する。
したがつて、本発明は前記問題点を解決でき、認識結
果の確認、訂正のための再入力等による認識結果の確定
に至るまでの時間を短くでき、利用者に対するサービス
の向上を図ることができる音声認識方法を提供できる。
(実施例) 以下、本発明の一実施例を図面に基づいて説明する。
第1図は本発明の一実施例を示すブロツク図である。
同図において、1は電話機、2は交換機、3は公衆電話
回線等とのインタフエースを司どる回線制御部、4は利
用者の発する音声を認識する音声認識部、5は後述する
主制御部6からの指示によつて音声データをガイダンス
として音声合成出力する音声合成部、6は音声応答認識
装置の各構成要素を制御する主制御部である。
また、第2図は第1図の音声認識部4を示すブロツク
図である。同図において、41は利用者が発声した入力音
声を分析して特徴パラメータを抽出する音声分析回路、
42は認識すべきカテゴリーの音声の特徴パラメータを蓄
えられている音声辞書、43は音声分析回路41からの特徴
パラメータと音声辞書42に蓄えられている各特徴パラメ
ータとを照合して両者の距離を算出する照合演算回路、
44は照合演算回路43により算出した各特徴パラメータの
距離値に基づいた認識結果を出力する判定回路である。
次に、本実施例による応答認識動作を説明する。
ここで、第3図は本実施例の動作を示すフローチヤー
トであり、第4図には例えば入力音声が6桁の数字の場
合の認識結果を示し、更に第5図に本実施例による応答
認識動作手順を示す。
はじめに、音声応答認識装置は利用者に第5図のよう
な「暗証番号をどうぞ」等のガイダンスを第1図の音声
合成部5を介して送出する(ステツプ51)。ここで、以
後に述べる1桁毎の音声入力において、利用者が認識結
果の音声応答により正しく認識されたと確認した桁数を
nとすると、ステツプ51ではまだ確認されていませんの
でn=0である(ステツプ52)。そして、前記ガイダン
スに従つて、利用者の発声した1桁目の入力音声「キユ
ー」を第1図の音声認識部4により認識する(ステツプ
53)。そして、音声応答認識装置は第4図に示す認識結
果を利用者に対して第5図のように「9」と第1図の音
声合成部5により出力する(ステツプ54)。利用者は応
答音声が正しかつたので、ひき続き2桁目「ハチ」を第
5図のように発声する。音声応答認識装置はこの入力音
声を認識する(ステツプ55)。この入力音声が「テイセ
イ」のような再入力を必要とするものでないので(ステ
ツプ56)、ステツプ57へ進み1桁目の認識において再入
力が発声しなかつたことによりn=1とする。ここで、
もしステツプ55で1桁目の認識結果に対して利用者が発
声した入力音声が「テイセイ」であれば(ステツプ55、
56)、ステツプ53へ戻り、再度1桁目「キユー」を音声
入力することになる。次に、2桁目の認識結果が「オワ
リ」のような入力終了とする結果であるかどうか判定さ
れ(ステツプ58)、本実施例では「オワリ」でなかつた
のでステツプ59へ進む。そして、ステツプ59ではn(=
1)と入力桁数N(=6)が比較され、n(=1)がN
(=6)より小さいので所定の桁数入力が終了していな
いと判断してステツプ54へ進む。ステツプ54では2桁目
の第4図に示す認識結果を利用者に対して第5図のよう
に「8」と第1図の音声合成部5により出力される。
以後、3桁目,4桁目についてはステツプ55,56,57,58,
59,54の順に処理される。
そして、5桁目については、入力音声が「ヨン」であ
るのに対して認識結果は第4図のように「サン(3)」
であり(ステツプ55)、ステツプ56〜59の順に動作した
後に第5図のように「3」と利用者に対して第1図の音
声合成部5により出力する(ステツプ54)。利用者は5
桁目の認識結果が誤まつているので、第5図のように
「テイセイ」のような再入力を必要とする旨を発声し、
音声応答認識装置はこの入力音声を認識する(ステツプ
55)。そして、再入力が必要であると判断し(ステツプ
56)、再びステツプ53へ戻り利用者は第5図のように
「ヨン」と再入力を行なう。音声応答認識装置はこの入
力音声を認識し(ステツプ53)、第4図のように5桁目
の再入力時の認識結果「ヨン(4)」を第5図のように
「4」と利用者に対して第1図の音声合成部5により出
力する(ステツプ54)。利用者は5桁目の再入力の認識
結果が正しかつたので、次の6桁目の「ゼロ」を発声す
る。以後、ステツプ55〜59の順に動作し後に第4図のよ
うな認識結果「ゼロ(0)」を第5図のように「0」と
利用者に対して第1図の音声合成部5により出力する
(ステツプ54)。利用者は、6桁目の認識結果が正し
く、所定の入力桁数N(=6)の入力を終了したので、
第5図のように「オワリ」のような入力動作を終了する
旨を発声する。音声応答認識装置はこの入力音声を認識
し(ステツプ55)、ステツプ56,57を経てステツプ58
で、入力動作終了を判断してステツプ61へ進む。
そこで、音声応答認識装置は全桁の認識結果に基づい
て第5図のように「暗証番号は9,8,7,6,4,0ですね」の
ように利用者に対して認識結果の確認要求のガイダンス
を第1図の音声合成部により出力する(ステツプ61)。
利用者は音声入力した内容と応答内容とが全て一致して
いるので、第5図のように「ハイ」のような正しく入力
された旨を発声する。音声応答認識装置はこの入力音声
を認識し(ステツプ62)、暗証番号入力が正しく行なわ
れたと判断して(ステツプ63)応答認識動作を終了す
る。
尚、ステツプ63で誤認識が発声していればステツプ71
以降の動作に移行するが、ステツプ71からの動作は1桁
毎の認識結果の確認及び誤認識した桁の再入力の処理で
あり、第6図に示す従来の動作に相当する。
また、上記で説明した例とは異なり、入力された桁数
が、所定の桁数Nに満たない状態で、「オワリ」が入力
された場合、例えば6桁の暗証番号入力においてn=2
の状態で「オワリ」が入力された場合は、入力された2
桁を暗証番号の下2桁とし、上4桁は0とみなす。つま
り、000059のような暗証番号の場合、利用者は、下2桁
の5,9だけ入力すればよい。
(発明の効果) 以上説明したように、本発明によれば、利用者が発声
する音声の単語毎に認識し、その認識結果を音声合成出
力することによつて利用者に音声入力した単語の認識結
果を確認させて誤認識が発声した場合には即座に再入力
できるようにしたことにより、認識結果の確認、再入力
動作に要する時間,手間が少なくて済み、利用者に対す
るサービスの向上を図ることができる音声認識方法を提
供できる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロツク図、第2図は
第1図の音声認識部の構成を示す図、第3図は本実施例
の動作を示すフローチヤート、第4図は本実施例の入力
音声と認識結果の関係を示す図、第5図は本実施例によ
る応答認識動作手順を示す図、第6図は従来の音声応答
認識装置による認識結果の認識手順を示す図である。 1……電話機、2……交換機、3……回線制御部、4…
…音声認識部、5……音声合成部、6……主制御部、41
……音声分析回路、42……音声辞書、43……照合演算回
路、44……判定回路。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 辻田 和一郎 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 昭58−55993(JP,A) 特開 昭60−260095(JP,A) 特開 昭60−178577(JP,A) 実開 昭58−123500(JP,U) 発明協会公開技報 84−2646

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】利用者の入力タイミングに従って入力され
    た音声の単語を音声認識する単語音声認識部と、 利用者へのガイダンスのための音声データに基づいて合
    成音声を出力する音声合成部とを具備し、 利用者が単語を入力した時にその単語を前記単語音声認
    識部で認識し、認識結果を前記音声合成部により音声合
    成出力し、 前記認識結果を音声合成出力した後であって利用者が単
    語を音声入力した時に前記単語音声認識部でその単語を
    認識し、認識結果が前記単語音声認識部で再音声入力を
    要求するカテゴリーと認識されたときは、入力された音
    声の単語の認識結果に誤認識が発生したと判断するとと
    もに次に入力される音声を訂正入力とし、 前記認識結果を音声合成出力した後であって利用者が単
    語を音声入力した時に前記単語音声認識部でその単語を
    認識し、認識結果が前記単語音声認識部で音声入力終了
    を要求するカテゴリーと認識されたときは、認識結果に
    対する認識結果の入力を促すガイダンスとともにすべて
    の認識結果を前記音声合成部により音声合成出力するこ
    とにより認識を促し、 前記認識結果を音声合成出力した後であって利用者が単
    語を音声入力した時に前記単語音声認識部でその単語を
    認識し、認識結果が前記単語音声認識部で再音声入力を
    要求するカテゴリー及び音声入力終了を要求するカテゴ
    リーのいずれでもないと認識されたときは、次の単語が
    音声入力されたと判断するとともに前の入力音声の認識
    結果が正常であると判断することを特徴とする音声認識
    方法。
JP61182726A 1986-08-05 1986-08-05 音声認識方法 Expired - Fee Related JP2646080B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61182726A JP2646080B2 (ja) 1986-08-05 1986-08-05 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61182726A JP2646080B2 (ja) 1986-08-05 1986-08-05 音声認識方法

Publications (2)

Publication Number Publication Date
JPS6338996A JPS6338996A (ja) 1988-02-19
JP2646080B2 true JP2646080B2 (ja) 1997-08-25

Family

ID=16123368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61182726A Expired - Fee Related JP2646080B2 (ja) 1986-08-05 1986-08-05 音声認識方法

Country Status (1)

Country Link
JP (1) JP2646080B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2975633B2 (ja) 1990-03-29 1999-11-10 三洋電機株式会社 音声認識方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02109100A (ja) * 1988-10-19 1990-04-20 Fujitsu Ltd 音声入力装置
JPH08115096A (ja) * 1994-10-14 1996-05-07 Sanyo Electric Co Ltd 音声処理装置
US5956675A (en) * 1997-07-31 1999-09-21 Lucent Technologies Inc. Method and apparatus for word counting in continuous speech recognition useful for reliable barge-in and early end of speech detection
JP2006268319A (ja) * 2005-03-23 2006-10-05 Fuji Xerox Co Ltd 音声ガイドシステムおよびその音声ガイド方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5855993A (ja) * 1981-09-30 1983-04-02 株式会社日立製作所 音声デ−タ入力装置
JPS60178577A (ja) * 1984-02-24 1985-09-12 Toshiba Corp 入力情報の訂正方式
JPS60260095A (ja) * 1984-06-06 1985-12-23 株式会社日立製作所 音声認識装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
発明協会公開技報 84−2646

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2975633B2 (ja) 1990-03-29 1999-11-10 三洋電機株式会社 音声認識方法

Also Published As

Publication number Publication date
JPS6338996A (ja) 1988-02-19

Similar Documents

Publication Publication Date Title
US6671672B1 (en) Voice authentication system having cognitive recall mechanism for password verification
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
US5566272A (en) Automatic speech recognition (ASR) processing using confidence measures
US5832063A (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
US6081782A (en) Voice command control and verification system
US5752231A (en) Method and system for performing speaker verification on a spoken utterance
US20060122837A1 (en) Voice interface system and speech recognition method
JP2646080B2 (ja) 音声認識方法
TW495737B (en) Verbal utterance rejection using a labeller with grammatical constraints
US20050049858A1 (en) Methods and systems for improving alphabetic speech recognition accuracy
JP7339116B2 (ja) 音声認証装置、音声認証システム、および音声認証方法
JP2585547B2 (ja) 音声入出力装置における入力音声の修正方法
JP5215512B2 (ja) 発声内に含まれる会社名の自動認識方法
JPH11175093A (ja) 音声認識確認応答方法
JP4622106B2 (ja) 人物特定システム
JP3443874B2 (ja) 音声認識装置および方法
JPS6333797A (ja) 音声認識制御方法
JP2000293195A (ja) 音声入力装置
JPH09230889A (ja) 音声認識応答装置
JP3018759B2 (ja) 特定話者方式音声認識装置
JP2007272123A (ja) 音声操作システム
JPH0351898A (ja) 音声認識装置
JPH02149900A (ja) 音声認識応答装置
JP2001175279A (ja) 音声認識方法
JPH09130377A (ja) コード照合装置及び方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees