JPH03280100A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPH03280100A
JPH03280100A JP2082535A JP8253590A JPH03280100A JP H03280100 A JPH03280100 A JP H03280100A JP 2082535 A JP2082535 A JP 2082535A JP 8253590 A JP8253590 A JP 8253590A JP H03280100 A JPH03280100 A JP H03280100A
Authority
JP
Japan
Prior art keywords
voice
recognition
candidate
command word
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2082535A
Other languages
English (en)
Other versions
JP2975633B2 (ja
Inventor
Shoichi Kamei
亀井 正一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2082535A priority Critical patent/JP2975633B2/ja
Publication of JPH03280100A publication Critical patent/JPH03280100A/ja
Application granted granted Critical
Publication of JP2975633B2 publication Critical patent/JP2975633B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)・産業上の利用分野 本発明は話者が発声した音声を機械的に認識するシステ
ムに於ける音声認識方法に関する。
(ロ)従来の技術 話者が発声した音声を機械的に認識するシステムとして
は、従来から種々の音声認識装置が開発されており、近
年では、例えば、音声によってオートダイヤルできる電
話システムに採用されるに至っている(特開昭62−8
1152号)。
しかしながら、音声認識手法の研究開発が進み誤認識が
如何に低減されたとは言え、人間が音声を発声する以上
不確定な要素があり、さらに周囲雑音の影響を回避でき
ないために、やはり誤認識を完全には解消できないのが
現状である。
従って、上述の如き、オートダイヤル電話システムに於
ては、第1ステツプとして発呼者相手先名が音声認識し
てこの認識結果を表示あるいは合成音声で報知し、報知
された認識結果が正しいときに始めて、この認識結果の
相手先名にダイヤルするように、第2ステツプで“ダイ
ヤル”などの実行指令語音声を音声認識させ、一方、報
知された認識結果が誤りである時には、第2ステツプで
“キャンセル”などの非実行指令語を音声認識させる方
式(2段階認識処理力式)が採用されている。
ところが、このような従来の2段階認識処理力式では、
相手先名の誤認識がある度に、使用者、即ち話者は、非
実行指令語の入力、及び相手先名の再入力を&!9返さ
なければならないので、使用者への負担が大きくなる欠
点があった。
(ハ)発明が解決しようとする課題 本発明は、上述の欠点を解消するべくなされたものであ
って、誤認識があり得ることを前提として、使用者の負
担の軽減を図った音声認識方法を提供するものである。
(ニ)課題を解決するための手段 本発明の音声認識方法は、以下の処理行程を備えるもの
である。
話者が発声した音声を認識して複数の認識候補を得る第
1の音声認識処理行程、 該第1の音声認識処理で得られる複数の認識候補を話者
に順次報知出力する認識候補報知処理行程、 該認識候補報知処理で特定の認識候補が報知された時に
該候補が上記第1の音声認識処理での話者の話者に該当
する事を指示するめに話者が発声する指令語音声を認識
する第2の音声認識処理行程、 上記認識候補報知処理で全ての候補の報知が終了した時
点までに、第2の音声認識処理による指令語音声の認識
がなされなかった場合に、上記認識候補報知処理を再度
実行するかどうかを話者に尋ねるための案内報知を行う
案内報知処理行程、該案内報知処理での案内報知に対応
して話者が発声する上記第2の音声認識処理での指令語
音声と同一の指令語音声を認識する第3の音声認識処理
行程、 該第3の音声認識処理で指令語音声を認識可能であった
場合に、上記認識候補報知処理を再度実行する認識候補
報知処理行程。
(ホ)作用 本発明の音声認識方法は、複数の認識候補が順次報知出
力されるので、第1候補の認識結果が誤りであっても、
次々に報知される候補の中から所望の認識結果を見出す
ことが可能になり、この候補に対して、“OK”などの
指令語音声を音声入力し、この指令語音声が認識されれ
ば、該候補を正しい認識結果として出力することができ
る。しかも、もしこの指令語音声が認識不能であった場
合、あるいは話者が指令語音声の入力ができなかった場
合に、これら認識候補の再報知を尋ねる案内報知に対応
して、話者が上記指令音声と同一の指令音声を認識させ
るための音声入力を行うことにより、この時上記指令語
音声が正しく認識できれば、指令語音声自体の認識可能
性の確認が行えると同時に、これらの認識候補の再報知
を実行させることができる。
(へ)実施例 以下、図面を参照して、この発明を自動車に搭載された
ワイヤレスオートダイヤル電話に適用した場合の実施例
について説明する。
第1図および第2図は、ワイヤレスオートダイヤル電話
機の電気的構成を示し、第1図は親機、第2図は子機を
示している。
第2図の子機は、音声入力するためのマイクロホン1、
マイクロホン1がら入力された音声信号を増幅する増幅
部2、増幅された音声信号によって搬送波を変調するた
めの変調回路および変調回路から出力される被変調波を
増幅する増幅回路を含む送信部3、アンテナ結合器4、
送受信用アンテナ5、受信された被変調波を増幅する増
幅回路および増幅された被変調波を復調する復調回路を
含む受信部6、受信部6によって再生された音声信号を
増幅する増幅部7、増幅された音声信号を音声として出
力するスピーカ8、テンキー、各種機能キーを有するキ
ー人力部9、ならびに送信部3、受信部6およびキー人
力部9を制御する制御部10を備えている。
第1図の親機は、回線ループの状態を検出するループ検
出部27、オートダイヤルを音声入力によって行うため
の音声認識部25、音声認識部25によって認識された
音声に対応する電話番号を回線に供給するとともに送受
話信号を回線に供給する回線制御部26、送受信用アン
テナ21、アンテナ結合器22、受信された被変調波を
増幅する増幅回路および増幅された被変調波を復調する
復調回路を含む受信部23、受信部23によって再生さ
れた音声信号を回線制御部26および音声認識部25の
うちのいずれに供給するかを切替えるための切替スイッ
チ24、テンキー、各種機能キーを有するキー人力部3
4、各種合成音声を形成するための音声合成部28、音
声合成部28の出力信号または回線制御部26からの受
話信号によって搬送波を変調するための変調回路および
変調回路から出力される被変調波を増幅する増幅回路を
含む送信部29ならびにこれらの機器を制御する制御部
30を備えている。
音声認識部25は、入力された音声信号を周波数分析す
る分析部41、分析部41の分析結果に基づいて音声ス
ペクトルの時系列群、すなわち音声パターンを作成する
音声パターン作成部42、パターン作成部42によって
作成された音声パターンを記憶するための入力音声パタ
ーンメモリ45、複数の発呼相手先名の標準音声パター
ンを記憶する第1標準パターンメモリ43、複数の指令
語の標準音声パターンを記憶する第2標準パターンメモ
リ44および音声パターン作成部42から出力される音
声パターンと標準パターンとを比較し、両パターンの類
似度を識別する識別部46を備えている。
制御部30は、プログラムおよび必要なデータを記憶す
るための主メモリ31、発呼相手名の音声認識に応じて
、類似度の高いものから順に発呼相手名を記憶する認識
結果メモリ32ならびに時間計測のためのカウンタ33
を備えている。
また、制御部30には、この電話が搭載されている自動
車のハンドルの回転角度を検出するハンドルの回転角検
出器35の検出信号、ブレーキの作動状態を検出するブ
レーキ作動検出器36の検出信号および車速を検出する
車速検出器37の検出信号が入力される。
このワイヤレスオートダイヤル電話を用いてオートダイ
ヤルを音声によって行うために、あらかじめ、指令語お
よび発呼相手先名の音声記録が行われる。この指令語と
しては、電話をオフフックさせるための指令語“オフフ
ック”や確認用指令語“OK″などがある。
指令語および発呼相手先の音声登録は、次のようにして
行われる。まず、子機のキー人力部9に設けられた登録
キーを押す。すると、子機の制御部10から、登録動作
開始信号が出力される。そして、送信部3において、こ
の登録動作開始信号によって搬送波が変調され、被変調
波が結合器4およびアンテナ5を介して送信される。こ
の被変調波は、親機のアンテナ21によって受信され、
結合器22を介して受信部23に送られる。そして、受
信部23において、受信された被変調信号が復調され、
増幅される。受信部23で再生された登録動作開始信号
は制御部30に送られ、これにより、登録動作状態とな
る。
子機のキー人力部9の登録キーを押さずに、親機のキー
人力部34の登録キーを押してもよい。
この場合には、キー人力部34の出力が親機の制御部3
0に入力することにより、登録動作状態となる。
次に、指令語および発呼相手先を子機のマイクロホン1
によって入力する。マイクロホン1から出力される音声
信号は、増幅部2で増幅されたのち、送信部3に送られ
る。そして、送信部3で、搬送波が音声信号によって変
調され、被変調波が増幅される。送信部3から出力され
る被変調波は結合器4およびアンテナ5を介して送信さ
れる。
この被変調波は、親機のアンテナ21によって受信され
、結合器22を介して受信部23に送られる。そして、
受信部23において、受信された被変調信号が復調され
、増幅される。受信部23で再生された音声信号は切替
スイッチ24を介して音声認識部25に送られる。
音声認識部25においては、まず、音声分析部41によ
って、入力した音声信号が周波数分析され、パターン作
成部42によって、この分析結果に基づいて音声パター
ンが作成される。この音声パターンは、入力音声が発呼
相手先名の場合は第り標準パターンメモリに、入力音声
が指令語の場合は第2標準パターンメモリに記憶される
このような動作により、すべての発呼相手先名の音声パ
ターンおよびすべての指令語の音声パターンが第1また
は第2標準パターンメモリに記憶される。
発呼相手先名の音声登録時には、各発呼相手先名前の音
声入力に続いて発呼相手先の電話番号が親機または子機
のキー人力部9.34のテンキーによって入力され、音
声登録された各発呼相手先ごとに対応する電話番号が主
メモリ31に記憶される。
第3図(I)〜(IV)は、親機の制御部30による発
呼処理の手順を示している。
まず、使用者(話者)は、子機の電源を入れた後、オフ
フック指令語“オフフック”をマイクロホン1によって
音声入力する。マイクロホン1にこのオフフック指令語
が入力されると(ステップS1)、マイクロホンlから
の音声信号は増幅され、増幅された音声信号によって搬
送波が変調された後、被変調波が子機のアンテナ5から
送信される。この被変調波は、親機のアンテナ21によ
って受信され、復調される。再生された音声信号は切替
スイッチを介して音声認識部25に送られて音声認識処
理が行われる(ステップS2)。
音声認識部25においては、まず、音声分析部41によ
って、入力した音声信号が周波数分析される。次に、パ
ターン作成部42によって、この分析結果に基づいて音
声パターンが作成され、作成された音声パターンが入力
音声バタンメモリ45に記憶される。そして、識別部4
6において、作成された音声パターンと第2標準パター
ンメモリ44に記憶されているすべての指令語標準パタ
ーンとが比較され、その類似度が識別される。
識別部46において入力音声が“オフフック”と認識さ
れると(ステップS3)、回線制御部26によって直流
ループが形成され、オフフック状態となる(ステップS
4)。この後、使用者が電話操作を行なうことに関し、
運転情況が安全な状態にあるか否かを調べるための安全
確認処理が行われる(ステップS5)。この処理の詳細
については後述する。
安全確認処理において、安全であることが確認されると
、音声合成部28から、使用者に発呼相手先の名前の入
力を促すための案内音声、例えば“相手先名を入力して
下さい”を表す合成音声信号が出力される。この信号は
、送信部29に送られ、搬送波がこの信号によって変調
される。被変調波は、増幅された後、アンテナ21を介
して送信される。
この被変調波は子機のアンテナ5によって受信され、復
調される。再生された音声合成信号は、増幅された後、
スピーカ8に送られ、スピーカ8から“相手先名を入力
して下さい”という音声が出力される(ステップS6)
この後、使用者が発呼相手先名、例えば“サンヨウ”を
マイクロホン1から音声入力すると(ステップS7)、
この音声信号は、無線通信によって親機に受信され、音
声認識部25によって、第1標準パターンメモリ43内
のすべての相手先標準パターンとの類似度が算出される
。そして、類似度の高いものから順に認識結果メモリ3
2に、発呼相手先名が記憶される(ステップS8)。こ
の後、候補順位nが1だけ更新される(ステップS9)
。尚、候補順位nは、初期設定において、n=oに設定
されているので、1回目は、n=1となる。
この後、安全確認処理が行われる(ステップS10)。
安全確認処理において、安全であることが確認されると
、確認結果メモリ32に記憶されている発呼相手先のう
ち、第n候補のものが読み出される。1回目は、第1候
補、すなわち、類似度の最も高い発呼相手先名に対応す
る合成音声信号が音声合成部28から出力される。この
出力に基づいて、子機のスピーカ8から、第n候補の発
呼相手先名が出力される(ステップ511)。
また、所定時間を計測するための計時動作が開始される
(ステップ、512)。この所定時間は、発呼相手先名
の音声出力に対して、使用者が確認指令語“OK”を入
力できる適当な時間(例えば3秒)に設定されている。
使用者は、音声出力された発呼相手先名が、使用者が音
声入力した発呼相手先名である場合にのみ、確認指令語
“OK”を子機のマイクロホン1から音声入力する。
上記所定時間内に、子機のマイクロホン1から使用者が
“OK″を音声入力すると(ステップ513)、無線通
信により、その音声信号が親機に受信され、音声認識部
25で入力音声パターンが第2標準パターンメモリ44
内のすべての指令語標準パターンと比較される(ステッ
プ515)。
この音声認識の結果、入力音声が“OK”であると認識
されると(ステップ516)、上記ステップSllで音
声出力された発呼相手先名に対応する電話番号が主メモ
リ31から読み出され、回線制御部26を介して回線に
送られる(ステップ517)。この結果、発呼相手先に
電話がかけられる。
そして、一定時間内にループ検出器27によって、発呼
相手先がオフフックしたことが検出されると(ステップ
518)、子機に入力される音声信号が回線制御部26
に供給されるように、切替スイッチ24の切り替えが行
われる(ステップ519)。これにより、発呼相手先と
の通話が可能となる。通話が終了すると(ステップ52
0)、認識結果メモリ31の内容がクリアされるととも
に候補順位nがリセット(n=o)され(ステップ52
1)この処理は終了する。
上記ステップ512で計時動作が開始されてから、所定
時間内に、音声入力がなかった場合(ステップ514)
および音声に入力があってもその入力音声が“OK”と
認識されなかった場合(ステップ516)には、上記ス
テップSllで音声出力した発呼相手先名が最終候補(
n =N)か否かが調べられる(ステップ522)。
そして、最終候補でなければ(n<N) 、ステップS
9に戻って、候補順位nが1だけ更新される。この後、
安全確認処理が行われ(ステップ523)、安全が確認
されると、認識結果メモリ32から第n候補すなわち、
次候補の発呼相手先名が読み出される。この発呼相手先
に対応する合成音声信号が音声合成部28から出力され
、これに基づいて子機のスピーカ8がらこの合成音声が
出力される(ステップ511)。また、計時動作が開始
される(ステップ512)。
そして、所定時間の間、確認指令語“OK”の音声入力
待ちとなる(ステップS13および514)。この音声
入力待状態において、音声入力があり、その音声認識の
結果、入力音声が確認指令語“OK”であると認識され
ると(ステップS13、S15および516)、オート
ダイヤルおよび通話のための処理(ステップ817〜5
21)が行われる。
確認指令語“OK”の音声入力待状態で、音声入力がな
かった場合(ステップ514)、および音声入力があっ
てもそれが入力音声が確認指令語“OK”であると認識
されなかった場合(ステップ816)は、今回音声出力
された相手先名が最終候補か否かが調べられる(ステッ
プ522)。
そして、今回音声出力された相手先名が最終候補でなけ
れば(n<N) 、ステップS9に戻る。
今回音声出力された相手先名が最終候補であれば(n=
N) 、安全確認処理が行われた後(ステップ523)
、再度発呼相手先名を候補順に出力するか否かを使用者
に尋ねるための案内音声、例えば“再度相手先名を音声
出力しますか”が音声出力される(ステップ524)。
また、所定時間の計時が開始される(ステップ525)
。この所定時間は、上記案内音声出力に対して、使用者
が上記ステップ512、S13での確認指令語−同一の
確認指令語、この場合“OK”を入力で16適当な時間
に設定されている。使用者は、発呼相手先名の再度出力
を望む場合にのみ、確認指1語“OK”を子機のマイク
ロホン1から音声人ノする。この所定時間内に、子機の
マイクロホン1から使用者が“OK″を音声入力すると
(ステ・)ブ526)、無線通信により、その音声信号
が重機に受信され、音声認識部25で、第2標準ノター
ンメモリ44内のすべての指令語標準パターンと比較さ
れる(ステップ828)。
音声認識部25でのステップS28における1声認識の
結果、入力音声が“OK”であると認曙されると(ステ
ップ529)、候補順位nがリセットされる(ステップ
530)。そして、上にステップS9に戻って、次候補
の発呼相手先名の出力、確認指令語音声入力待ち、確認
指令語音声入力があった場合の電話番号の出力などの処
理が再び行われる。
上記ステップS25で計時動作が開始されてから、所定
時間内に、音声入力がなかった場合および音声入力があ
ってもその入力音声がOK”と認識されなかった場合に
は(ステップS27でYESまたはステップS29でN
o)、認識結果メモリ32の内容がクリアされるととも
に候補順位nがリセットされ(ステップ531)、この
処理は終了する。
以上の実施例のステップ524〜530での処理が本発
明が特徴とするところであり、具体的には、“再度相手
先名を音声出力しますか”なる音声案内に対して、発呼
相手先名の音声出力に対しての確認指令語と同一の“O
K″を入力して、これを認識処理させる点にある。
即ち、1巡目の複数の認識候補である発呼相手先名の音
声出力中に、所望の発呼相手先名に対して“OK”を発
声してもこれが周囲雑音で認識されないこともあるので
、“再度相手先名を音声出力しますか”に対しての“O
K″が認識できたなら、次の2巡目の複数の発呼相手先
名の音声出力中ではも“OK”が認識される可能性が高
いことを示していると見做すことができるのである。こ
のような指令語“OK”の認識処理は、この語自体の認
識可能性のテストと再度の発呼相手先名の音声出力の指
令とを兼ねたものとなっている。
第4図は、安全確認処理の詳細を示している。
この処理においては、まず、ハンドル回転角検出器35
によって検出された検出回転角が、あらかじめ定められ
た基準角度より小さいか否かが判別される(ステップ5
41)。
検出回転角が基準角度より小さければ、次に、ブレーキ
作動検出器36の出力に基づいて、ブレーキがオフとな
っているか否かが判別される(ステップ542)。
ブレーキがオフとなっていれば、次に速度検出器37に
よって検出された検出速度があらかじめ定められた基準
速度より小さいか否がが判別される(ステップ543)
。そして、検出速度が基準速度より小さければ、この処
理は終了し、この処理に続く音声出力のためのステップ
S6.511またはS24 (第3図番M)に移る。
上記ステップ541において検出回転角が基準角度より
大きい場合、上記ステップS42においてブレーキがオ
ンとなっている場合、上記ステップS43において検出
速度が基準速度より大きい場合には、ステップ541に
戻る。
したがって、検出回転角が基準角度より小さくかつブレ
ーキがオフとなっており、しかも検出速度が基準速度よ
り小さい状態になるまで、安全確認処理に続くステップ
S6、Sllまたは524(第3図参照)での音声出力
が禁止される。
上記実施例のステップ2においては、入力音声パターン
と第2標準パターンメモリ44に記憶されているすべて
の指令語標準パターンとが比較されているが、入力音声
パターンを第2標準パターンメモリ44に記憶されてい
るオフフック指令語の標準パターンのみと比較するよう
にしてもよい。
また、相手先標準音声パターンと指令語標準音声パター
ンとは、別個のメモリ43.44に記憶されているが、
一つの標準パターンメモリに記憶するようにしてもよい
また、上記ステップ8においては、第1標準パターンメ
モリ43内のすべての相手先標準パターンとの類似度が
算出されているが、第1標準パターンメモリ43内の相
手先標準パターンのうち、あらかじめ指定された所定範
囲内でのすべての相手先標準パターンとの類似度を算出
するようにしてもよい。
たとえば、相手先を所定のグループに分け、第1標準パ
ターンメモリ43にグループごとに、相手先標準パター
ンを記憶させ、電話操作を開始する前にグループ名指定
データをキー人力、音声入力等によって入力するように
する。そして、ステップ8においては、第1標準パター
ンメモリ43に記憶されている相手先標準音声パターン
のうち、指定されたグループの範囲内で、すべての相手
先標準パターンとの類似度が算出されるようにする。
さらに、利用者が複数ある場合には、第1標準パターン
メモリ43に利用者ごとに、相手先標準パターンを記憶
させ、電話操作を開始する前に利用者名指定データをキ
ー人力、音声入力等によって入力するようにする。そし
て、ステップ8においては、第1標準パターンメモリ4
3に記憶されている相手先標準音声パターンのうち、指
定された利用者についての相手先標準パターンのすべて
との類似度が算出されるようにする。
さらに、利用者が複数ある場合には、第1標準パターン
メモリ43に利用者および所定のグループごとに相手先
標準パターンを記憶させ、電話操作を開始する前に利用
者名指定データおよびグループ名指定データをキー人力
、音声入力等によって入力するようにする。そして、ス
テップ8においては、第1標準パターンメモリ43に記
憶されている相手先標準音声パターンのうち、指定され
た利用者および指定されたグループについての相手先標
準パターンのすべてとの類似度が算出されるようにする
上記の実施例では、第1候補から最終候補までの発呼相
手先名が順次音声出力され、それに対して指令語の音声
入力がない場合または指令語の音声入力があっても“O
K″と認識されない場合には、再度第1候補から発呼相
手先名の音声を出力するか否かを使用者に尋ねている(
ステップ822〜S24参[)。しかしながら、使用者
の意思に関係なく、第1候補から最終候補までの発呼相
手先名出力の繰返回数mが所定回数Mとなる迄、発呼相
手先名の出力を繰返すようにしてもよい。
この場合の処理手順が第3図に破線で示されている。即
ち、ステップS22において、今回音声出力した発呼相
手先名が最終候補(n −N m )である判別される
と、繰返回数mが1だけ更新される(ステップ551)
。繰返回数mは、初期設定において0に設定されている
そして、繰返回数mがあらかじめ定められた所定回数M
より大きいか否かが判別される(ステップ552)。繰
返回数mが所定回数Mより小さければ、候補順位nがリ
セットされた後(ステップ553)、ステップS9に戻
る。したがって、第1候補から順次発呼相手先名が出力
され、それに対して確認指令語“OK”の入力があれば
、対応する電話番号が出力される。
そして、第1候補から最終候補までの発呼相手先名が出
力されたが、これらに対し、確認指令語“OK”の入力
がない場合および音声名人力があっても“OK” と確
認されなかった場合には、第3図(■)に示す如く、再
び、繰返回数mが1だけ更新され(ステップ551)、
繰返回数mが所定回数Mより大きいか否かが判別される
(ステップ552)。そして、繰返回数mが所定回数M
より大きい場合には、認識結果メモリ32の内容がクリ
アされるとともに候補順位nおよび繰返回数mがリセッ
トされ(ステップ554)、この処理は終了する。
上記2つの実施例では、オフフックおよび確認を行うた
めに、指令語“オフフック”および“OK”を音声入力
しているが、他の指令語を用いてもよい。また、オフフ
ックおよび確認を行うために、親機又は子機のキー人力
部34または9に、各指令のための機能キーを設け、キ
ー人力によりオフフックおよび確認を行うようにしても
よい。
fJ15図はこの発明のさらに他の実施例におけjlI
JIIp部30の発呼処理手順の一部を示しており、第
3図(II)に変わるものである。従って、同β以外の
処理手順は第3図(1)  (FIT)  (IV)に
1している。
第5図において、第3図(TI )と同じステップには
、同じステップ番号を付して、その説明をt略する。こ
の実施例による処理と第3図の処理を比較するとこの実
施例ではステップ561およυS62が追加されている
点のみが異なっている。
この実施例においては、音声出力された発呼相手先名に
対して確認指令語″OK″が音声入力されなければ、第
3図の場合と同様に、次候補が計力される。
しかしながら、誤った発呼相手先名の音声出力がなされ
た後一定時間内に、再度希望する発呼相手先名を入力す
れば、この音声入力に基づいて、発呼相手先名の音声確
認が再度自動的に行われる(ステップS6]およびS6
2参照)。
すなわち、ステップ511で、たとえば第1候補の発呼
相手先名が音声出力されたが、使用者が希望するものと
興なる場合において、使用者が再度発呼相手先名を音声
入力すると、その入力音声の音声パターンが入力音声パ
ターンメモリ45に記憶される。そして、入力音声パタ
ーンと、第2標準パターンメモリ44内のすべての指令
語標準パターンとが比較され1、その類似度が調べられ
る(ステップ515)。
次に、各指令語標準パターンと入力音声パターンとの類
似度のうち、最も高い類似度αがあらかじめ定められた
相手先・指令語判別用基準値a。
と比較される(ステップ561)。発呼相手先名と指令
語との間には、音声的に距離があるので、上記のように
発呼相手先名が音声入力された場合には、入力音声パタ
ーンと指令語標準パターンとの類似度αが基準値α0よ
り低くなる。
したがって、ステップ561からステップS62に進み
、認識結果メモリ32の内容がクリアされるとともに候
補順位nがリセットされる。そして、ステップS8に戻
り、上記ステップ515で入力音声パターンメモリ45
に記憶された発呼相手先名の音声パターンと、第1標準
パターンメモリ43内のすべての相手先標準パターンと
が比較され、類似度の高いものから順に発呼相手先名が
認識結果メモリ32に記憶される。そして、ステップS
9以降の処理が行われる。
ステップSllで、音声出力された発呼相手先名が使用
者が希望するものである場合に於て、使用者が確認指令
語“OK″を入力した場合には、指令語標準パターンと
の類似度aが基準値α0より高くなるので、ステップS
61からステップS16に進む。そして、ステップS1
6において、入力音声が“OK”と認識され、今回音声
出力された発呼相手先名に対応する電話番号が出力され
る(ステップ517)。
第6図(I)(II)は、この発明のさらに他の実施例
における制御部30の発呼処理手順の一部を示しており
、それぞれ第3図(I)  (II)に変わるものであ
る。従って、同図以外の処理手順は第3図(II+ )
  (TV )に準じている。
第6図において、第3図と同じステップには、同じステ
ップ番号を付してその説明を省略する。
この実施例では、第3図の場合と異なり、発呼相手先名
の音声認識が行われると、第1候補の発呼相手先名のみ
が出力される。このため、第3図のステップS9におけ
る候補順位nの更新処理およびステップS22以降にお
ける相手先名繰返出力のための処理は実行されない。そ
して、この実施例では、ステップ871〜S76が追加
されている。
オフフック状態において、ステップS6にて、“相手先
名を入力して下さい”の音声案内が行われると、所定時
間の計時動作が開始される(ステップ571)。そして
、この所定時間内に音声入力がない場合には(ステップ
572)、オフフックが解除される(ステップ573)
。そして、ステップS1に戻り、オフフック指令語の音
声入力待状態となる。
上記時間内に、音声入力がある場合には(ステップS7
)、入力音声パターンと第1標準パターンメモリ43内
のすべての相手先標準パターンとが比較される(ステッ
プS8)。
次に、各相手先標準パターンと入力音声パターンとの類
似度のうち、最も高い類似度βが、あらかじめ定められ
た雑音判別用基準値β0と比較される(ステップ574
)。
類似度βが基準値β0より小さいときには、音声入力が
雑音によるものであると判断され、オフフックが解除さ
れた後(ステップ573)、ステップS1に戻り、オフ
フック指令語の音声入力待状態となる。
上記ステップS74において、類似度βが基準値β0よ
り大きい時、安全確認処理の後(ステップ510)、類
似度の最も高い発呼相手先名(第1候補)が音声出力さ
れる(ステップ511)。
また、所定時間の計時動作が開始される(ステップ51
2)。
そして、この所定時間内に音声入力がない場合には(ス
テップ514)、オフフックが解除された後(ステップ
575)、ステップS1に戻り、オフフック指令語の音
声入力待状態となる。
上記所定時間内に音声入力があった場合には(ステップ
513)、入力音声パターンと第2標準パターンメモリ
44内のすべての指令語標準パターンとが比較される(
ステップ515)。
次に、各指令語パターンと入力音声パターンとの類似度
のうち、最も高い類似度βが、あらかじめ定められた雑
音判別用基準値β0が比較される(ステップ576)。
類似度βが基準値β0より小さいときには、音声入力が
雑音によるものであると判断され、オフフックが解除さ
れた後(ステップ575)、ステップS1に戻り、オフ
フック指令語の音声入力待状態となる。
上記ステップS76において、類似度βが基準値β0よ
り大きいときには、入力音声が“OK”であるか否かが
識別される(ステップ816)。
入力音声が“OK″であると認識されない時、オフフッ
クが解除された後(ステップ575)、ステップS1に
戻り、オフフック指令語の音声入力待状態となる。
上記ステップ575において、入力音声が“OK”であ
ると認識されたときには、今回音声出力された発呼相手
先名に対応する電話番号が出力される(ステップ517
)。
第7図(I)(IT)  はこの発明のさらに他の実施
例における制御部30の発呼処理手順の一部を示してお
り、それぞれ第3図(I)  (II)に変わるもので
ある。従って、同図以外の処理手順は第3図(III 
)  (TV )に準じている。
第7図において、第3図と同じステップには、同じステ
ップ番号を付してその説明を省略する。
第3図の処理では、発呼相手先名が音声入力の認識結果
に基づいて第1候補から順に音声出力されているが、こ
の実施例では発呼相手先名は音声入力されず、あらかじ
め定められ順番で発呼相手先名が音声出力される。この
ため、第3図のステップS7における相手先名人力待ち
およびステップS8における音声認識の処理は行われな
い。
また、第3図のステップS9に対応するステ・ノブ59
aにおいては、音声認識結果に基づく候補順位ではなく
、あらかじめ定められた順番nが更新される。したがっ
て、第3図のステップSllに対応するステップ5ll
aにおいては、あらかじめ定められた順番におけるn番
目の発呼相手先名が音声出力される。その他の点は、第
3図と同じなので、詳細な説明を省略する。
この実施例においても、オフフックおよび確認を行うた
めに、指令語“オフフック”および“OK”を音声入力
しているが、他の指令語を用し)てもよい。また、オフ
フックおよび確認を行うために、親機または子機のキー
人力部34または9に各指令のための機能キーを儲け、
キー人力によって、オフフックおよび確認を行うように
してもよい 上述したすべての実施例おいて、通常の電話機のように
、音声入力装置(電話機またはマイクロホン)を定常位
置からはずすと自動的にオフフ・ン夕になるようにして
もよいし、マイクロホンまノは受話機を定常位置に置い
たままキー人力またj音声入力によりオフフックさせる
ようにしても。
い。
また、上記すべての実施例は、この発明をワノヤレスオ
ートダイヤル電話に通用したものであ2が、ワイヤレス
でないオートダイヤル電話にもこの発明を適用すること
ができるのはいうまでもくい。
さらに、上の説明においては、音声合成部28で生成さ
れる合成音声によって、“相手先名をλカして下さい”
の初期案内、複数の認識候補でシる発呼相手先名、“再
度相手先名を音声出力しますか”なる案内音声を報知出
力する構成について示したが、表示器を用いてこれらを
表示報知する構成にすることもできる。
(ト)発明の効果 本発明の音声認識方法によれば、以上の説明がら明らか
な如く、1巡目の複数の認識候補の報知に、所望の認識
候補に対して“OK”などの指令語を発声してもこれが
周囲雑音で認識されないこともあるので、認識候補の再
報知を尋ねる案内音声に対しての上記指令語とおなし“
OK”などの指令語が認識できたなら、次の2巡目の複
数の認識候補の報知中ではもこの指令語が認識される可
能性が高いことを示していると見做すことができる。従
って、本発明の音声認識方法を採用した音声認識システ
ムは、指令語の認識処理が、話自体の認識可能性のテス
トと再度の認識候補報知の指令とを兼ねたものとなって
いるので、話者の操作上の負担を大幅に軽減できる。
【図面の簡単な説明】
第1図および第2図は本発明の音声認識方法をワイヤレ
スオートダイヤル電話機の親機及びその子機の電気的構
成を示すブロック図、第3図乃至第7図は処理フロー図
である。 1・・・マイクロホン、3・・・送信部、4・・・結合
器、5・・・アンテナ、21・・・アンテナ、22・・
・結合器、23・・・受信部、25・・・音声認識部、
26・・・回線制御部、27・・・ループ検出部、31
・・・認識結果メモノ、 3・・・カウンタ、 6・・・識別部。

Claims (1)

    【特許請求の範囲】
  1. (1)話者が発声した音声を認識して複数の認識候補を
    得る第1の音声認識処理行程、 該第1の音声認識処理で得られる複数の認識候補を話者
    に順次報知出力する認識候補報知処理行程、 該認識候補報知処理で特定の認識候補が報知された時に
    該候補が上記第1の音声認識処理での話者の話者に該当
    する事を指示するめに話者が発声する指令語音声を認識
    する第2の音声認識処理行程、 上記認識候補報知処理で全ての候補の報知が終了した時
    点までに、第2の音声認識処理による指令語音声の認識
    がなされなかった場合に、上記認識結果候補報知処理を
    再度実行するかどうかを話者に尋ねるための案内報知を
    行う案内報知処理行程、 該案内報知処理での案内報知に対応して話者が発声する
    上記第2の音声認識処理での指令語音声と同一の指令語
    音声を認識する第3の音声認識処理行程、 更に、該第3の音声認識処理で指令語音声を認識可能で
    あった場合に、上記認識候補報知処理を再度実行する認
    識候補再報知処理行程を備えた音声認識方法。
JP2082535A 1990-03-29 1990-03-29 音声認識方法 Expired - Fee Related JP2975633B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2082535A JP2975633B2 (ja) 1990-03-29 1990-03-29 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2082535A JP2975633B2 (ja) 1990-03-29 1990-03-29 音声認識方法

Publications (2)

Publication Number Publication Date
JPH03280100A true JPH03280100A (ja) 1991-12-11
JP2975633B2 JP2975633B2 (ja) 1999-11-10

Family

ID=13777201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2082535A Expired - Fee Related JP2975633B2 (ja) 1990-03-29 1990-03-29 音声認識方法

Country Status (1)

Country Link
JP (1) JP2975633B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112382285A (zh) * 2020-11-03 2021-02-19 北京百度网讯科技有限公司 语音控制方法、装置、电子设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2646080B2 (ja) 1986-08-05 1997-08-25 沖電気工業 株式会社 音声認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112382285A (zh) * 2020-11-03 2021-02-19 北京百度网讯科技有限公司 语音控制方法、装置、电子设备和存储介质
CN112382285B (zh) * 2020-11-03 2023-08-15 北京百度网讯科技有限公司 语音控制方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
JP2975633B2 (ja) 1999-11-10

Similar Documents

Publication Publication Date Title
US5301227A (en) Automatic dial telephone
CA1298877C (en) Radio telephone apparatus with voice actuated dialing
KR100616787B1 (ko) 전화 핸드셋용 음성 인식 사용자 인터페이스
EP0307193A2 (en) Telephone apparatus
KR900009169B1 (ko) 적절한 인식기능을 갖춘 음성인식시스템
JP2004248248A (ja) ユーザがプログラム可能な移動局ハンドセット用の音声ダイヤル入力
KR20030050151A (ko) 차량용 핸즈프리 시스템
USH1646H (en) Speech recognition adapter for telephone system
US7020292B1 (en) Apparatuses and methods for recognizing an audio input and muting an audio device
JP2003152856A (ja) 通信端末装置、通信方法、およびそのプログラム
EP1241861A2 (en) Method and apparatus for voice recognition dialing and using memorized dialing prefixes
JPH03280100A (ja) 音声認識方法
KR100247009B1 (ko) 기능모드의음성인식이가능한디지털휴대용전화기및그인식방법
JP2000338991A (ja) 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法
JP3384282B2 (ja) 電話装置
JP3278595B2 (ja) 携帯電話
JPH0927845A (ja) 自動ダイヤル電話装置
JPH0276353A (ja) 音声ダイヤル装置
WO1999049639A1 (en) Method for establishing telephone calls
JPH03123254A (ja) 自動車用電話
JP3866665B2 (ja) 携帯電話装置及びそれに用いる置き忘れ対策方法並びにそのプログラム
JP3316361B2 (ja) 電話装置
JP2524213B2 (ja) 自動車電話器
JPH03123256A (ja) 自動車用電話
JPH03145248A (ja) 発信者識別電話機

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080903

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees