JPH01142600A - 音声制御装置 - Google Patents
音声制御装置Info
- Publication number
- JPH01142600A JPH01142600A JP62301130A JP30113087A JPH01142600A JP H01142600 A JPH01142600 A JP H01142600A JP 62301130 A JP62301130 A JP 62301130A JP 30113087 A JP30113087 A JP 30113087A JP H01142600 A JPH01142600 A JP H01142600A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- timer
- recognition
- pattern
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 abstract description 9
- 230000006870 function Effects 0.000 abstract description 9
- 238000003786 synthesis reaction Methods 0.000 abstract description 9
- 230000005540 biological transmission Effects 0.000 abstract description 4
- 238000012790 confirmation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、機器の作動を音声にて指令し、該音声を認識
して機器の作動を制御する音声制御装置に関する。
して機器の作動を制御する音声制御装置に関する。
従来、例えば特開昭55−158762号公報に開示さ
れるような音声制御装置が知られている。
れるような音声制御装置が知られている。
このものは、音声にて発信先を指定した後、電話機が、
認識した発信先を音声合成にて復唱することにより、音
声認識の誤りを話者に認識させる。
認識した発信先を音声合成にて復唱することにより、音
声認識の誤りを話者に認識させる。
そして、ダイヤル発信は、その後の番号発信ボタンの操
作にて行われる。
作にて行われる。
前述の従来の技術によると、話者は発信先を音声にて指
定することはできても、結局は音声の認識内容を確認し
たあと、番号送信ボタンを押さなければならない、また
、音声認識の確認に要する時間や、番号送信ボタンの操
作の手間を考えると、決して使い勝手は良いものとはい
えなかった。
定することはできても、結局は音声の認識内容を確認し
たあと、番号送信ボタンを押さなければならない、また
、音声認識の確認に要する時間や、番号送信ボタンの操
作の手間を考えると、決して使い勝手は良いものとはい
えなかった。
そこで本発明は、上述の問題点に鑑み、機器の作動を音
声にて指令でき、さらに話者に多くの操作を強いること
なく機器を音声にて指令された作動に制御できる音声制
御装置を提供することを目的としてなされたものである
。
声にて指令でき、さらに話者に多くの操作を強いること
なく機器を音声にて指令された作動に制御できる音声制
御装置を提供することを目的としてなされたものである
。
本発明は、上述の目的を達成するために、機器の作動を
音声にて入力し、該音声に応じて機器を制御する音声制
御装置において、 音声を入力する入力手段と、 この入力手段から入力された音声を認識し、この音声に
対応する機能を特定する音声認識手段と、この音声認識
手段による、前記音声と前記音声の認識結果との認識の
度合いに応じて、所定の設定時間を設定するタイマ設定
手段と、 この音声認識手段により、前記音声に対応する機能が特
定された後に起動され、所定時間を計測するタイマ手段
と、 このタイマ手段が計測する所定時間の間に、前記入力手
段から音声の入力がないことを判定し、作動許可信号を
出力する判定手段と、 前記作動許可信号を受けて、前記音声認識手段にて特定
された機能を実行する作動手段と、を備えるという技術
的手段を採用する。
音声にて入力し、該音声に応じて機器を制御する音声制
御装置において、 音声を入力する入力手段と、 この入力手段から入力された音声を認識し、この音声に
対応する機能を特定する音声認識手段と、この音声認識
手段による、前記音声と前記音声の認識結果との認識の
度合いに応じて、所定の設定時間を設定するタイマ設定
手段と、 この音声認識手段により、前記音声に対応する機能が特
定された後に起動され、所定時間を計測するタイマ手段
と、 このタイマ手段が計測する所定時間の間に、前記入力手
段から音声の入力がないことを判定し、作動許可信号を
出力する判定手段と、 前記作動許可信号を受けて、前記音声認識手段にて特定
された機能を実行する作動手段と、を備えるという技術
的手段を採用する。
以上に述べた本発明の構成によると、話者が音声にて機
器の作動を指令するだけで、その指令された作動が、作
動手段により実現される。また、話者が発声した音声の
認識から作動手段の作動までに音声の認識の度合いに応
じた設定時間を設けるため、この間に機器の作動を再び
指令することができるため、音声認識の誤りによる誤作
動を低減でき、音声制御装置の有用性を高めることがで
きる。
器の作動を指令するだけで、その指令された作動が、作
動手段により実現される。また、話者が発声した音声の
認識から作動手段の作動までに音声の認識の度合いに応
じた設定時間を設けるため、この間に機器の作動を再び
指令することができるため、音声認識の誤りによる誤作
動を低減でき、音声制御装置の有用性を高めることがで
きる。
以下、本発明を適用した実施例を図面に基づいて説明す
る。
る。
第1図は本発明を適用した電話機の構成を示すブロック
図である。
図である。
1は送受話器であり、図示せぬスピーカとマイクロホン
とを内蔵している。2はハンズフリー通話装置で、スピ
ーカ3とマイクロホン4とが接続され、操作者が他の操
作を継続したまま、電話通話を可能とするものである。
とを内蔵している。2はハンズフリー通話装置で、スピ
ーカ3とマイクロホン4とが接続され、操作者が他の操
作を継続したまま、電話通話を可能とするものである。
これらの送受話器1とハンズフリー通話装置2とは切換
装置5により選択的に通話回路6に接続され、電話回線
に接続される。7は音声認識部、8は音声バタンメモリ
、9はダイヤル番号メモリ、10は音声合成部である。
装置5により選択的に通話回路6に接続され、電話回線
に接続される。7は音声認識部、8は音声バタンメモリ
、9はダイヤル番号メモリ、10は音声合成部である。
llはタイマで、音声認識部7により起動され、設定時
間の後、ゲート12を開く、13は発信部で、ダイヤル
番号メモリ9からゲート12を通過して送られるダイヤ
ル番号を電話回線に送出する。14は電話機の制御部で
、ダイヤルスイッチ等を備え、各部の作動を制御する。
間の後、ゲート12を開く、13は発信部で、ダイヤル
番号メモリ9からゲート12を通過して送られるダイヤ
ル番号を電話回線に送出する。14は電話機の制御部で
、ダイヤルスイッチ等を備え、各部の作動を制御する。
次に、図面に従い本発明の実施例の作動を説明する。
この装置を利用するにあたり、利用者は予め発信先(接
続先)の名義音声及び対応するダイヤル番号を登録する
必要がある。
続先)の名義音声及び対応するダイヤル番号を登録する
必要がある。
名義音声の登録は、制御部14のキーにより登録番号を
キーインし、その後送話器から登録する名義を発声する
。音声認識部7は、その音声を分析し音声認識に必要な
情報に加工して、その音声を特徴づける音声の時系列パ
ターンとして音声パターンメモリ8に蓄える0次に登録
番号に対応させて、ダイヤル番号を制御部14のキーか
らダイヤル番号メモリ9に登録する。同様に確認用の合
成音声を登録番号に対応させ音声合成部10に登録する
。
キーインし、その後送話器から登録する名義を発声する
。音声認識部7は、その音声を分析し音声認識に必要な
情報に加工して、その音声を特徴づける音声の時系列パ
ターンとして音声パターンメモリ8に蓄える0次に登録
番号に対応させて、ダイヤル番号を制御部14のキーか
らダイヤル番号メモリ9に登録する。同様に確認用の合
成音声を登録番号に対応させ音声合成部10に登録する
。
なお、この操作は、認識用の音声を登録する時の発声を
利用して同時に合成音声用の音声パターンを作成するよ
うにしてもよい。
利用して同時に合成音声用の音声パターンを作成するよ
うにしてもよい。
次に発信時の動作について説明する。
利用者は送受話器1をオフフックし、呼出そうとする名
義を発声する。この発声は、予め登録の操作によって登
録された名義である。この入力音声は、登録の時と同様
に音声認識部7で分析されて特徴量が抽出され、音声パ
ターンに加工される。
義を発声する。この発声は、予め登録の操作によって登
録された名義である。この入力音声は、登録の時と同様
に音声認識部7で分析されて特徴量が抽出され、音声パ
ターンに加工される。
認識は、この入力音声パターンと音声パターンメモリ8
に予め登録された標準パターンとのパターンマツチング
をすることにより実行される。すなわち入力音声パター
ンとすべての標準パターンとの類似度が計算され、最も
よく似通った標準パターンを認識結果と判定し、対応す
る登録番号をダイヤル番号メモリ9、音声合成部10に
出力すると同時に、タイマー11を起動する。
に予め登録された標準パターンとのパターンマツチング
をすることにより実行される。すなわち入力音声パター
ンとすべての標準パターンとの類似度が計算され、最も
よく似通った標準パターンを認識結果と判定し、対応す
る登録番号をダイヤル番号メモリ9、音声合成部10に
出力すると同時に、タイマー11を起動する。
゛ 音声合成部10は、対応する合成音を送受話器1に
出力し利用者に確認を求める。
出力し利用者に確認を求める。
タイマー11に設定した時間内に言い直しがない場合、
タイマー11がオフとなりゲート12が開かれ、ダイヤ
ル番号が発信部13に出力され回線が接続される。
タイマー11がオフとなりゲート12が開かれ、ダイヤ
ル番号が発信部13に出力され回線が接続される。
この時、タイマー11がオフとなると同時に、切換え装
置5を作動させ、通話信号ラインをハンズフリー通話装
置2に切換え、以後はハンズフリーによる通話を可能と
する。もし、音声認識部7が誤認識した時は、タイマー
11に設定した時間内に(回線接続される前に)言い直
しをする。
置5を作動させ、通話信号ラインをハンズフリー通話装
置2に切換え、以後はハンズフリーによる通話を可能と
する。もし、音声認識部7が誤認識した時は、タイマー
11に設定した時間内に(回線接続される前に)言い直
しをする。
すると、前と同様のシーケンスで音声認識部7は、その
発声について類似度を計算し、その結果に対応した登録
番号をダイヤル番号メモリ9、音声合成部10へ出力し
、タイマー11をセットしなおす。
発声について類似度を計算し、その結果に対応した登録
番号をダイヤル番号メモリ9、音声合成部10へ出力し
、タイマー11をセットしなおす。
以上は、−通りの動作例であるが、本発明においては、
利便性をさらに高める為に、タイマー11にセットする
時間を音声認識部7で計算した類似度に対応させて、適
応的に可変とする。すなわち、認識結果と判定された標
準パターンの類似度が大きな時は、認識の信頼度が高い
わけであり、それだけ言い直しの確率が小さいと推測さ
れ、タイマー11に設定する言い直しを許す(発信まで
の)時間を短く設定する。逆に類似度が小さかった時は
、それだけ認識の信頼度が低く、言い直す確率が大きい
と推測され、タイマー11に設定する時間を長く設定す
るものとする。
利便性をさらに高める為に、タイマー11にセットする
時間を音声認識部7で計算した類似度に対応させて、適
応的に可変とする。すなわち、認識結果と判定された標
準パターンの類似度が大きな時は、認識の信頼度が高い
わけであり、それだけ言い直しの確率が小さいと推測さ
れ、タイマー11に設定する言い直しを許す(発信まで
の)時間を短く設定する。逆に類似度が小さかった時は
、それだけ認識の信頼度が低く、言い直す確率が大きい
と推測され、タイマー11に設定する時間を長く設定す
るものとする。
次に、これについて説明する。
今、第2図に示すごとくN個の標準パターンが音声パタ
ーンメモリ8に登録されているとする。
ーンメモリ8に登録されているとする。
入力音声パターンは、音声認識部7において、このN個
の標準パターンすべてとの類似度が計算される。そして
、最も類似度の高かった標準パターンに対応した登録番
号を認識結果として出力する。
の標準パターンすべてとの類似度が計算される。そして
、最も類似度の高かった標準パターンに対応した登録番
号を認識結果として出力する。
この最も高い類似度Aを、数段階に分け、それぞれにタ
イマー設定時間°を割り当てて、その値をタイマー11
にセットするものとする。
イマー設定時間°を割り当てて、その値をタイマー11
にセットするものとする。
−例として類似度をlOO点満煮出して、第3図に示す
ように、類似度に対応してタイマー時間を設定するもの
とする。このようにした時、ある入力音声の最も似通っ
た標準パターンとの類似度が例えば95の時、タイマー
11には1秒の値がセットされ、85の時は2秒、75
の時は3秒、そして70以下の時は認識不可能(リジェ
クト)と判断するというように動作させる。
ように、類似度に対応してタイマー時間を設定するもの
とする。このようにした時、ある入力音声の最も似通っ
た標準パターンとの類似度が例えば95の時、タイマー
11には1秒の値がセットされ、85の時は2秒、75
の時は3秒、そして70以下の時は認識不可能(リジェ
クト)と判断するというように動作させる。
以上に説明した作動を、第4図および第5図のフローチ
ャートに示す、第4図は第1図に示す装置の概略作動を
示し、第5図は第4図のステップ140およびステップ
150の詳細を示す。
ャートに示す、第4図は第1図に示す装置の概略作動を
示し、第5図は第4図のステップ140およびステップ
150の詳細を示す。
このような適応的な機能を持たせることにより、音声ダ
イヤル装置におけるタイマーを利用した確認、訂正機能
の性能をおとすことなく、認識結果の確認から訂正、発
信までの一連のシーケンスに必要な時間を短縮すること
が可能であり、音声認識装置を利用した音声ダイヤルの
利便性をさらに高めることが可能である。
イヤル装置におけるタイマーを利用した確認、訂正機能
の性能をおとすことなく、認識結果の確認から訂正、発
信までの一連のシーケンスに必要な時間を短縮すること
が可能であり、音声認識装置を利用した音声ダイヤルの
利便性をさらに高めることが可能である。
なお、第3図に示す類似度とタイマー設定時間の対応は
、連続的にしてもよい。すなわち、第6図に示すように
類似度とタイマー設定時間の関数を定義し、この関数を
適宜計算して時間設定するようにしてもよい。
、連続的にしてもよい。すなわち、第6図に示すように
類似度とタイマー設定時間の関数を定義し、この関数を
適宜計算して時間設定するようにしてもよい。
また、この設定値を利用者が自由に設定できる機能を持
たせてもよい。
たせてもよい。
本発明は、音声ダイヤル以外にも音声で機器をコントロ
ールする一般的な音声コマンドシステムにも応用可能で
ある。
ールする一般的な音声コマンドシステムにも応用可能で
ある。
第1図は本発明を適用した一実施例の構成を示すブロッ
ク図、第2図、第3図、第4図および第5図は一実施例
の作動を説明する作動説明図、第6図は他の実施例の作
動を説明する説明図、第7図は本発明の構成を示すブロ
ック図である。 l・・・送受話器、2・・・ハンズフリー通話装置、6
・・・通話回路、7・・・音声認識部、8・・・音声パ
ターンメモリ、9・・・ダイヤル番号メモリ、10・・
・音声合成部、11・・・タイマー、12・・・ゲート
、13・・・発信部、14・・・制御部。
ク図、第2図、第3図、第4図および第5図は一実施例
の作動を説明する作動説明図、第6図は他の実施例の作
動を説明する説明図、第7図は本発明の構成を示すブロ
ック図である。 l・・・送受話器、2・・・ハンズフリー通話装置、6
・・・通話回路、7・・・音声認識部、8・・・音声パ
ターンメモリ、9・・・ダイヤル番号メモリ、10・・
・音声合成部、11・・・タイマー、12・・・ゲート
、13・・・発信部、14・・・制御部。
Claims (4)
- (1)機器の作動を音声にて入力し、該音声に応じて機
器を制御する音声制御装置において、 音声を入力する入力手段と、 この入力手段から入力された音声を認識し、この音声に
対応する機能を特定する音声認識手段と、この音声認識
手段による、前記音声と前記音声の認識結果との認識の
度合いに応じて、所定の設定時間を設定するタイマ設定
手段と、 この音声認識手段により、前記音声に対応する機能が特
定された後に起動され、設定時間を計測するタイマ手段
と、 このタイマ手段が計測する所定時間の間に、前記入力手
段から音声の入力がないことを判定し、作動許可信号を
出力する判定手段と、 前記作動許可信号を受けて、前記音声認識手段にて特定
された機能を実行する作動手段と、を備えることを特徴
とする音声制御装置。 - (2)前記タイマ設定手段は、 前記度合いが小さいとき、前記所定時間をより長く設定
するよう構成されることを特徴とする特許請求の範囲第
1項記載の音声制御装置。 - (3)前記機器は電話機であることを特徴とする特許請
求の範囲第1項記載の音声制御装置。 - (4)前記音声認識手段は、前記機能として電話の発信
先を特定するよう構成されることを特徴とする特許請求
の範囲第3項記載の音声制御装置。(5)前記作動手段
は、前記発信先の電話番号を発信する自動ダイヤル手段
を備えることを特徴とする特許請求の範囲第4項記載の
音声制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62301130A JPH01142600A (ja) | 1987-11-27 | 1987-11-27 | 音声制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62301130A JPH01142600A (ja) | 1987-11-27 | 1987-11-27 | 音声制御装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01142600A true JPH01142600A (ja) | 1989-06-05 |
Family
ID=17893183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62301130A Pending JPH01142600A (ja) | 1987-11-27 | 1987-11-27 | 音声制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01142600A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001083990A (ja) * | 1999-09-09 | 2001-03-30 | Toshiba Corp | 音声認識装置および方法 |
-
1987
- 1987-11-27 JP JP62301130A patent/JPH01142600A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001083990A (ja) * | 1999-09-09 | 2001-03-30 | Toshiba Corp | 音声認識装置および方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4945570A (en) | Method for terminating a telephone call by voice command | |
KR960004692B1 (ko) | 음성 명령에 의한 전화 호출 종료 방법 | |
EP0788268A1 (en) | Process for interaction between a telephone and its user | |
JP2003044081A (ja) | 音声認識装置の訓練又は適応を行う方法 | |
JPH10341276A (ja) | 音声コマンドによって電話番号をダイヤルする方法、及び音声コマンドによって制御される通信端末装置 | |
US6223161B1 (en) | Method for setting terminal specific parameters of a communication terminal | |
JPH01142600A (ja) | 音声制御装置 | |
JPH0548702A (ja) | 音声着呼機能付音声ダイヤル装置 | |
JPH0197044A (ja) | 音声ダイヤル装置 | |
KR19980065571A (ko) | 음성인식에 의해 통화수행 가능한 전화기 및 그 운용방법 | |
JPS601960A (ja) | ハンズフリ−電話機 | |
JP4441137B2 (ja) | 音声認識装置 | |
KR900002471Y1 (ko) | 키폰 시스템의 묵음방식 | |
KR100788652B1 (ko) | 자동 음성 다이얼 장치 및 방법 | |
JPH04192852A (ja) | ダイヤル番号発信方法 | |
JP2658698B2 (ja) | 電話装置 | |
JP3866665B2 (ja) | 携帯電話装置及びそれに用いる置き忘れ対策方法並びにそのプログラム | |
JP3032246B2 (ja) | 電子機器 | |
JPS60233972A (ja) | 音声認識構内交換機 | |
JPH0352442A (ja) | 音声入力制御電話機 | |
JPH0255448A (ja) | 音声ダイヤリング方式 | |
JPH02305046A (ja) | 電話機 | |
JPH02200046A (ja) | 音声認識機能付電話装置 | |
JPH0351898A (ja) | 音声認識装置 | |
JPH08251073A (ja) | 送受信機 |