JPH0823369A - 音声操作電話装置およびその音声による操作指示受付方法 - Google Patents

音声操作電話装置およびその音声による操作指示受付方法

Info

Publication number
JPH0823369A
JPH0823369A JP6157585A JP15758594A JPH0823369A JP H0823369 A JPH0823369 A JP H0823369A JP 6157585 A JP6157585 A JP 6157585A JP 15758594 A JP15758594 A JP 15758594A JP H0823369 A JPH0823369 A JP H0823369A
Authority
JP
Japan
Prior art keywords
voice
input
unit
telephone device
indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6157585A
Other languages
English (en)
Inventor
Hitoshi Ino
仁 猪野
Ryoichi Shibuya
良一 渋谷
Yasushi Hatakeyama
寧 畠山
Kazuhiko Sagara
和彦 佐柄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Nakayo Telecommunications Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Nakayo Telecommunications Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Nakayo Telecommunications Inc filed Critical Nippon Telegraph and Telephone Corp
Priority to JP6157585A priority Critical patent/JPH0823369A/ja
Publication of JPH0823369A publication Critical patent/JPH0823369A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】音声入力により電話装置の操作が行えるような
音声操作電話装置およびその音声による操作指示受付方
法を提供する。 【構成】 あらかじめ定めた音声と操作を示すコマンド
とを対応させて単語パターンモデル110に記憶してお
き、マイク112から音声を入力し、マイク112から
入力された音声が、当該電話装置のあらかじめ定めた操
作の開始指示を示す「操作」という音声入力であるか否
かを判断する。判断の結果、マイク112から入力され
た音声が「操作」という音声入力であると判断されたと
きに、音声による認識の起動状態とし、そのつぎにマイ
ク112から入力された音声と単語パターンモデル11
0に記憶する音声とを、比較処理部109において比較
する。比較の結果、一致する音声に対応するコマンドの
操作を実行する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、電話装置にかかり、特
に、音声入力により電話の操作を行うことができる音声
操作電話装置に関する。
【0002】
【従来の技術】従来、電話装置においては、図14
(b)および(c)に示すように、ユーザが、相手先の
電話番号を、電話装置1200に備えられているキーを
押下したり、電話装置1210に備えられているダイヤ
ルを操作することにより、相手先への発信の操作を行っ
ている。また、図14(a)に示すように、相手先の電
話番号をダイヤルする代わりに、受話器を持ち上げて相
手先の電話番号や相手先を発声し、音声認識により発信
の操作を行える電話装置がある。
【0003】また、着信があって呼び出し音を送出時
に、音声入力があると着信を受け付けるような音声応答
機能を備えている電話装置もある。
【0004】
【発明が解決しようとする課題】上述した従来の電話装
置においては、発信時に、キーやダイヤルの操作が必要
であったり、また、音声認識機能を動作させるために
は、受話器をユーザが持ち上げるという動作が必要であ
る。また、音声応答機能を備えている電話装置において
も、通話終了後に、回線切断の指示にはキー押下等の操
作が必要となる。このため、高齢者や障害者など、操作
に不自由な人は、電話装置を扱いにくいという問題点が
ある。
【0005】本発明は、上記課題を解決するために、音
声入力により電話装置の操作が行えるような音声操作電
話装置およびその音声による操作指示受付方法を提供す
ることを目的とする。また、他の目的としては、音声入
力により電話装置の操作を行う場合において、誤認識を
防げるような音声操作電話装置を提供する。
【0006】
【課題を解決するための手段】本発明は、上記課題を解
決するために、外部からの音声を入力する音声入力手段
と、回線を介して前記音声を送信する送信手段と、前記
回線から音声を受信する受信手段とを備える電話装置に
おいて、前記音声入力手段により入力された音声が、当
該電話装置のあらかじめ定めた操作の指示を示す音声入
力であるか否かを判断する判断手段と、あらかじめ定め
た音声と操作を示すコマンドとを対応させて記憶するコ
マンド記憶手段と、前記音声入力手段により入力された
音声と、前記コマンド記憶手段に記憶する音声とを比較
する比較手段と、前記判断手段により、前記音声入力手
段により入力された音声が操作の指示を示す音声入力で
あると判断されたときに、前記比較手段による比較の結
果、一致する音声に対応するコマンドを前記コマンド記
憶手段から抽出し、当該コマンドに対応する操作を実行
する実行手段とを有する。
【0007】また、他の解決手段としては、回線に接続
され、当該回線の制御を行う電話装置において、電話の
音声による操作の開始を示す特定の音声を外部から受け
付ける操作開始受け付け手段と、前記操作開始受け付け
手段で前記特定の音声を受け付けたときに、音声による
操作の指示を示す音声入力を受け付け可能である旨のガ
イダンスメッセージを出力するメッセージ出力手段と、
前記メッセージ出力手段による前記ガイダンスメッセー
ジの出力後、前記音声による操作の指示として発信相手
先を特定する音声を受け付ける発信相手先受け付け手段
と、前記発信相手先受け付け手段により発信相手先を特
定する音声に対応する電話番号を発信する発信手段とを
有することができる。
【0008】
【作用】コマンド記憶手段には、あらかじめ定めた音声
と操作を示すコマンドとを対応させて記憶させておく。
【0009】音声入力手段は、例えばマイクなどであ
り、外部からの音声を入力し、判断手段は、音声入力手
段により入力された音声が、当該電話装置のあらかじめ
定めた操作の指示を示す音声入力であるか否かを判断す
る。
【0010】比較手段は、前記音声入力手段により入力
された音声と、前記コマンド記憶手段に記憶する音声と
を比較する。実行手段では、前記判断手段により、前記
音声入力手段により入力された音声が操作の指示を示す
音声入力であると判断されたときに、前記比較手段によ
る比較の結果、一致する音声に対応するコマンドを前記
コマンド記憶手段から抽出し、当該コマンドに対応する
操作を実行する。これにより、判断手段において音声が
操作の指示を示す音声入力であると判断されたときに、
音声による操作指示として実行することができる。この
ため、回線を介しての通話中に会話として音声による操
作指示を発声しても、判断手段で音声が操作の指示を示
す音声入力であると判断していなければ、誤って切断等
の操作を実行することがない。
【0011】判断手段の判断方法としては、コマンド記
憶手段に、音声による操作開始を示す特定の音声をさら
に記憶しておき、判断手段は、前記比較手段による比較
の結果、前記音声入力手段により入力された音声が前記
音声による操作開始を示す特定の音声に一致した場合
に、音声による操作開始と判断し、その後に、前記音声
入力手段により入力された音声は、前記操作の指示を示
す音声であるとすることができる。また、音声入力手段
により音声が最後に入力されたときから特定時間音声の
入力がなかった後に入力された音声が、操作の指示を示
す音声入力であると判断するようにしてもよい。さら
に、操作の指示を示す音声入力を受け付け可能である旨
のガイダンスメッセージを出力するようにして、ガイダ
ンスメッセージを送出後に、入力された音声は操作指示
を示す音声であると判断するようにしてもよい。
【0012】このようにすることにより、入力した音声
が、音声による操作の指示であることを認識でき、電話
装置の、発信、着信、切断等の操作を音声入力により行
うことができる。また、判断手段を設けることにより、
音声入力が操作の指示か否かを判断するので、誤認識を
防ぐことができる。
【0013】
【実施例】以下、本発明に係わる音声操作電話装置の実
施例について説明する。
【0014】図1に、音声応答・認識機能電話システム
の構成図を示す。図1において、音声応答・認識機能電
話システムは、伝送路を介して公衆網(PSTN)に接
続され、通話の制御を行う通話回路120と、通信相手
側の音声を出力するための受話器170と、音声を増幅
する受話アンプ160と、音声を入力するための送話器
190と、音声を増幅する送話アンプ180と、スピー
カおよびマイクが一体となったヘッドセット155と、
音声の入出力を制御するためのヘッドセット制御部15
0と、あらかじめ登録された音声パターンと照合して音
声認識を行う音声認識制御部140とを備える。また、
留守時に、相手先の電話に応答するための留守番電話機
能を備える留守番制御部130をさらに備えてもよい。
【0015】本実施例における音声操作電話装置では、
電話装置に対して音声で操作を指示することにより電話
装置に手で操作することなく、発信から切断までと着信
から切断までとの動作を行うことができる。このため、
音声の入出力部分の実現形態としては、図4に示すよう
な構成をとることができる。図4(a)および図5
(b)に示すように、通常の受話器のほかに、イヤホン
405などのスピーカ401とマイク402とを備える
ことができる。また、図4(b)に示すように、電話装
置のユーザと対向する面にスピーカ411とマイク41
2とを備えてもよい。また、図5(d)に示すように、
外付けのスピーカ530とマイク540とを電話装置に
接続できるようにしてもよい。さらに、図4(c)およ
び図5(c)に示すように、スピーカとマイクとが一体
となったヘッドセット430を備えることができる。外
付けのイヤホン405、ヘッドセット430、または、
スピーカ530とマイク540とを接続する場合、図5
(a)に示すように、接続端子510を電話装置400
に設けておく。接続端子510は、通話路に接続され
る。このような構成にすることにより、ハンズフリー
で、音声により電話の操作を行うことができる。
【0016】音声操作電話装置の内部回路は、図2に示
すように構成される。図2において、SPCユニット2
00は、図1における音声認識制御部140であり、音
声の認識を行う。また、H/Sハンズフリ制御部208
は、図1に示すヘッドセット制御部150に相当し、音
声の入出力を制御する。留守制御部230は、図1に示
す留守番制御部130に相当する。また、通話路スイッ
チ211、局線インタフェース220および電話機機能
部制御用CPU250は、図1に示す通話回路120に
相当する。通話路スイッチ211は、入力された音声
が、操作指示のための音声であるか否かを判断するため
の判断部である。電話機機能部制御用CPU250は、
SPCユニット200で認識された操作コマンドに従っ
て局線インタフェース220を制御する。
【0017】図2に示すように、モジュラ223および
224において局線221を接続し、局線インタフェー
ス220において、発信または着信の局線の制御を行
う。通話路スイッチ211では、マイク205やハンド
セット204から入力された音声を、音声による操作で
あるか通話における会話であるかを判断し、判断結果に
従って、音声認識を行うSPCユニット200もしくは
局線インタフェース220に音声を送出する。従来の電
話装置では、ダイアルキー260を押下することにより
ダイヤル操作を行って発信操作をしたり、受話器を持ち
上げることで着信操作を行っていたが、本実施例におい
ては、これらの操作を音声により指示することにより行
う。音声認識を行うSPCユニット200では、後述す
るように、操作コマンドを音声により認識すると、パラ
レルインタフェース202を介して電話機能部制御用C
PU250に指示し、電話機能部制御用CPU250で
は、指示された操作コマンドに従って、局線インタフェ
ース220を制御する。また、パラレルインタフェース
202に、電話機能部制御用CPU250における制御
プログラムを記憶するROM(Read Only Memory)およ
びEEPROM(Electrically Erasable and Programm
able Random Access Memory)と、一時的にデータを記
憶するためのRAM(Random Access Memory)と、時間
を計測するためのRTC(Real Time clock)とを接続さ
せており、電話機能部制御用CPU250からこれらの
メモリ等にアクセスすることができる。
【0018】つぎに、図3に示す音声操作電話装置の機
能構成図を参照し、機能ブロックごとに動作を説明す
る。
【0019】図3において、101は装置全体を管理す
る主制御部、102は電話回線と接続する回線i/f
部、103は発着信の監視や制御を行う回線制御部、1
04は通話路の接続制御を行う通話路制御部、105は
サービス音やガイダンスメッセージを出力する音源部、
106はマイク112からの音声の有無を判定する音検
出部、107はアナログ音とデジタル音の変換を行うA
/D変換機、108はデジタル音声信号を分析する音声
分析部、109は音声分析結果と単語パターンモデルを
比較する比較処理部、110は音声認識に必要な単語の
パラメータをあらかじめ蓄積する単語パターンモデル
部、111は電話機使用者へ音を通知するスピーカ、1
12は電話機使用者が音声を入力するためのマイクであ
る。単語パターンモデル部110には、あらかじめ音声
コマンドに対応する音声パターンモデルが記憶されてい
る。
【0020】本実施例においては、音声分析部108に
おいて音声の特徴を表すパラメータを抽出し、その抽出
したパラメータと、単語パターンモデル部110にあら
かじめ登録しておいた単語(コマンド)のパラメータと
を、DP(Dynamic Programming)マッチングやHMM
(Hidden Markov Model)などの手法により音声認識を行
う。DPマッチング法では、入力音声から抽出したパラ
メータと単語パターンモデル部110に登録されている
標準モデルとの二つのパタン間の伸び縮みを吸収し、2
つのパタンの最もよく対応のとれるパスを能率よくもと
める方法であり、HMM法では、マルコフモデルを利用
し、マルコフモデルの各状態における種々のシンボルの
出力確率と状態間の遷移確率とによって、音声スペクト
ルの確率的な変動を求め、最大確率で出力する単語を認
識結果としている。これらの方法により音声認識を行う
ことができる。音声認識は、信号処理用DSPを利用す
ることができる。
【0021】また、音声コマンドの例を図16に示す。
図16に示すように、各コマンドごとにその操作を規定
しておき、これらのコマンドごとの音声パラメータを単
語パターンモデル部110にあらかじめ登録しておく。
また、認識されたコマンドにしたがって図3に示す主制
御部101が操作の指示を行う。図16に示すように、
コマンドとしては、ダイアルを回線に送出指示するため
の「発信」というコマンドや、「天気予報」などのよう
に、相手先電話番号を特定するための単語を登録してお
いてもよい。また、ダイヤル番号を選択するためのコマ
ンドやダイヤル番号を直接入力して送出するためにダイ
アル番号のコマンド等をさらに登録しておいてもよい。
【0022】さらに、音声による操作の開始を指示する
ために、「操作」という起動用単語を設けておくことが
できる。これにより、電話の通話中に、図3に示すマイ
ク112から入力した音声が会話の音声なのか操作指示
のための音声なのかを判断することができ、「操作」と
いう起動用単語が入力された後は、その後に入力する音
声は操作指示の音声であると判断することができる。例
えば、登録されているコマンドの「切断」という言葉を
通話中に発声しても、その前に「操作」という音声が認
識されていなければ、「切断」の音声コマンドとしては
認識しないようにできる。また、「操作」という起動用
単語の代わりに、マイク112に音声が最後に入力され
たときから特定時間音声の入力がなかった後に入力され
た音声が、操作の指示を示す音声入力であると判断する
ようにしてもよい。例えば、通話中に、3秒間、マイク
112から音声が入力されなければ音声による操作の開
始であると判断し、その後に、「切断」という音声が入
力されて認識できた場合には、回線の切断を実行する。
また、操作の指示を示す音声入力を受け付け可能である
旨のガイダンスメッセージをスピーカ111から出力す
るようにして、ガイダンスメッセージを送出後に、マイ
ク112から入力された音声は操作指示を示す音声であ
ると判断するようにしてもよい。例えば、「発声してく
ださい」等のガイダンスメッセージを送出後、「天気予
報」の単語が入力された場合には、「177」のダイア
ルを送出して発信を実行するようにできる。ガイダンス
メッセージは、音源105にあらかじめ登録しておくこ
とができる。ガイダンスメッセージとしては、ほかに、
一致するコマンドがなかった場合や、音声認識できなか
った場合に、「認識できませんでした。」などのよう
に、その旨のガイダンスメッセージを出力するようにで
きる。また、音声認識できた場合には、単語パターンモ
デル部110に登録してある音声をエコーバックにより
通知することができる。これにより、動作状態を容易に
確認することができる。さらに、操作の指示を示す音声
入力を受け付けることを示す表示を行うLEDなどの表
示手段をさらに設けておき、表示が行われているとき
に、マイク112から入力された音声は操作指示を示す
音声であると判断するようにしてもよい。さらに、音声
認識結果を送出することによりユーザが認識結果を確認
し、確認用単語を発声するようにして手続を確実にして
もよい。
【0023】また、コマンドに対応する音声を単語パタ
ーンモデル部110に登録する方法としては、図15に
示すような登録手順フローにしたがって、あらかじめ登
録しておくことができる。図15に示すように、登録
は、電話装置に備えられているキー入力によりコマンド
の識別番号を指示後、登録すべき音声を入力する。例え
ば、発信コマンドを登録する場合、図16に示すコマン
ドの識別番号の「3」を、ステップ1806およびステ
ップ1807、もしくは、ステップ1808において、
押下後、登録すべき音声を「発信」というように発声
し、登録を行う。このようにして音声パターンをあらか
じめ登録しておける。
【0024】つぎに、実際に発信、着信、切断等を行う
場合に、図3に示す音声操作電話装置における制御動作
を図9〜図13に示すフローと、図6〜図8に示すシー
ケンスとを参照して説明する。
【0025】図9に、本実施例に係わる音声操作電話装
置の発信制御のフローチャートを示す。また、図6に、
発信時に、マイク112/スピーカ111と、主制御部
101のCPUと、音声分析部108、比較処理部10
9および音源105に相当する音声認識ボードとのやり
取りを示すシーケンス図を示す。CPUと音声認識ボー
ド間は、CPUから音声認識ボードに対して操作を指示
するためのコマンドと、音声認識ボードからCPUに対
して応答するレスポンスとの識別番号があらかじめ定め
られている。例えば、コマンド0は音声認識ボードの初
期化を指示するためのコマンドであり、コマンド2は話
者や単語を登録する際に指示するコマンドであり、コマ
ンド7は話者を特定するためのコマンドであり、コマン
ド10は音声認識を行うように指示するコマンドであ
る。また、レスポンス2は、音声認識ができたときに出
力するレスポンスであり、レスポンス3は、音声認識が
できなかったときに出力するレスポンスを示している。
また、音声認識ボードからはガイダンスメッセージを出
力することができる。なお、シーケンス図において、示
している時間は、処理にかかる時間を例示したものであ
る。
【0026】図9に示すように、音声操作電話装置が待
ち受け状態(S901)の時に、マイク112から音を
受信した場合(S902)、その音は通話路制御部10
4により音声分析部108に入力される(S903)。
音声分析部108では、入力された音声のパラメータを
抽出し、比較処理部109に抽出したパラメータを出力
する。比較処理部109では、単語パターンモデル部1
10に登録されている音声パラメータと比較照合を行う
ことにより音声認識処理を行い(S903)、比較結果
を主制御部101に通知する。主制御部101では、比
較結果により、起動用単語の「操作」を認識したか否か
を判断し(S904)、起動用単語でなかった場合は待
ち受け状態(S901)に戻り、比較結果が起動用単語
の場合は起動用単語の受付確認音もしくは音声認識開始
を示す旨や発声を促すガイダンスメッセージをスピーカ
111より出力し(S905)、以後、受け付ける音声
は、操作指示であると判断できる(この状態を、以下、
起動状態という)。
【0027】起動状態の時に、マイク112から音を受
信した場合(S906)、その音は通話路制御部104
を経由して音声分析部108に入力し(S907)、比
較処理部109において音声認識処理を行い、比較結果
を主制御部101に通知する。比較結果が発信相手先を
特定する単語を認識した場合は(S908)、受付確認
音をもしくは確認用単語音声の発声を促すガイダンスメ
ッセージをスピーカ111より出力し(S912)、確
認用単語もしくは発信指示単語をマイク112から受信
する(S913)。その音は通話路制御部104を経由
して音声分析部108に入力し(S914)、比較処理
部109において音声認識処理を行い、比較結果を主制
御部101に通知する。
【0028】比較の結果、認識できなかった場合は(S
908もしくはS915)、認識不可通知音もしくは
「認識できませんでした」等のガイダンスメッセージを
スピーカ111より出力し(S909もしくはS91
7)、起動状態に戻る。また、認識不可回数を計数し
(S908−1もしくはS915−1)、認識不可回数
が特定回数になったときには(S910もしくはS91
6)、認識できないことを示すビープ音やガイダンスメ
ッセージを出力し(S911)、待ち受け状態(S90
1)に戻ってもよい。または、このとき、比較結果が取
消指示単語の場合は、受付確認音をスピーカ111より
出力し、待ち受け状態(S901)に戻るようにしても
よい。
【0029】確認用単語を認識した場合には(S91
5)、受付確認音をスピーカ111より出力し、回線を
ループ閉成し(S918)、発信相手先のダイヤルを回
線に送出し(S919)、相手先呼出中状態(S92
0,S921)に移る。これにより、発信が実行され
る。
【0030】以上のように、発信時には、音声入力によ
る操作を開始する旨の起動用単語を受け付けて、それを
認識後、発信相手先を特定する音声を受け付けて認識
後、発信を実行することができる。さらに、確認用単語
を受け付けることにより、発信の実行を確認することが
できる。また、ガイダンスメッセージを出力して、発声
を促すことができる。さらに、認識不可の場合にはその
旨のガイダンスメッセージを出力することにより、ユー
ザが音声認識できなかったことを知ることができる。ま
た、図6に示すように、比較処理部109の比較の結
果、一致した、単語パターンモデル110に記憶する音
声もしくはマイク112で入力した音声をスピーカから
出力するようにしてもよい。これにより、ユーザは、音
声認識結果を知ることができる。
【0031】つぎに、図10に、本実施例に係わる音声
操作電話装置の着信制御のフローチャートを示す。ま
た、図7に、着信時に、マイク112/スピーカ111
と、音声認識の開始を指示するためのボイススイッチ
と、主制御部101のCPUと、音声分析部108、比
較処理部109および音源105に相当する音声認識ボ
ードと、電話回線が接続される網と、網から受信した音
声を出力するスピーカとのやり取りを示すシーケンス図
を示す。着信時には、着信音鳴動中に、マイク112か
ら音声を入力すると、音声認識の開始であるとし、その
後、着信応答指示を受け付ける。
【0032】図10に示すように、音声操作電話装置が
待ち受け状態(S101)の時に、回線からの着信を監
視し、着信を検出した場合(S102)、回線からの1
6Hz信号を受信中は、スピーカ111より着信音を出
力し(S103)、着信がある旨を通知する。回線から
の16Hz信号が中断中は、スピーカ111の着信音鳴
動も中断する。着信音の鳴動中断中はマイク112から
の音入力を音検出部106で監視し(S104)、音入
力を検出した場合は、回線からの16Hz信号を受信し
た時も着信音は鳴動させないようにして(S105)、
音受信確認音もしくは着信応答指示音性の入力案内ガイ
ダンスをスピーカ111より出力し(S106)、指示
待ち状態とする。
【0033】指示待ち状態の時に、マイク112から音
を受信した場合、その音は通話路制御部104を経由し
て音声分析部108に入力し(S108)、比較処理部
109において音声認識処理を行い、比較結果を主制御
部101に通知する。比較結果が着信応答指示単語の場
合は(S109)、受付確認音もしくは着信応答指示用
音声をスピーカ111より出力し(S110)、回線を
ループ閉成し(S111)、相手と通話可能状態にする
(S112)。比較の結果、着信応答指示単語を認識で
きなかった場合は、認識不可通知音(ビープ音等)もし
くは認識不可ガイダンスおよび音声の再入力案内ガイダ
ンスをスピーカ111より出力し(S112)、S10
3に移行する。また、認識不可回数を計数し(S119
−1)、認識不可回数が特定回数になったときには(S
113)、認識できないことを示すビープ音やガイダン
スメッセージを出力てもよい(S114)。このように
して着信に応答することができる。
【0034】以上のように、着信時には、着信音鳴動中
に、マイク112から音声を入力すると、音声認識の開
始であるとし、その後、着信応答指示を受け付けて、着
信応答を実行することができる。
【0035】つぎに、図11に、本実施例に係わる音声
操作電話装置の通話状態における切断制御のフローチャ
ートを示す。また、図8に、切断、復旧時にマイク11
2/スピーカ111と、主制御部101のCPUと、音
声分析部108、比較処理部109および音源105に
相当する音声認識ボードと、電話回線が接続される網と
のやり取りを示すシーケンス図を示す。通話中に切断指
示を受け付ける場合、通話の会話であるのか切断指示の
音声であるのかを判断する必要があるので、音声入力に
よる操作を開始する旨の起動用単語を受け付けて、それ
を認識後、切断指示用音声の「切断」を受け付けて認識
後、切断処理を実行する。
【0036】図11に示すように、音声操作電話装置が
通話状態の時に、マイク112からの音入力を音検出部
106で監視し(S201)、マイク112から音声を
受信した場合は(S203)、その音は通話路制御部1
04により音声分析部108に入力される(S20
4)。音声分析部108では、入力された音声のパラメ
ータを抽出し、比較処理部109に抽出したパラメータ
を出力する。比較処理部109では、単語パターンモデ
ル部110に登録されている音声パラメータと比較照合
を行うことにより音声認識処理を行い(S204)、比
較結果を主制御部101に通知する。主制御部101で
は、比較結果により、起動用単語の「操作」を認識した
か否かを判断し(S205)、起動用単語でなかった場
合は待ち受け状態(S201)に戻り、比較結果が起動
用単語の場合は、ガイダンスメッセージが回線に送出さ
れないようにするためにマイク/スピーカと回線制御部
間の通話路を切断する(S206)。そして、起動用単
語の受付確認音もしくは音声認識開始を示す旨や発声を
促す、音声入力案内ガイダンスメッセージをスピーカ1
11より出力し(S207)、以後、受け付ける音声
は、操作指示であると判断できる(この状態を、以下、
起動状態という)。
【0037】起動状態の時に、マイク112から音を受
信した場合(S208)、その音を通話路制御部104
を経由して音声分析部108に入力し(S209)、比
較処理部109において音声認識処理を行い、比較結果
を主制御部101に通知する。比較の結果が、切断指示
単語の場合は(S210)、受付確認音もしくは切断指
示用音声をスピーカ111より出力し(S211)、回
線のループを解放して回線を切断し(S212)、話中
音をスピーカから数秒間出力後(S213)、待ち受け
状態に移る。また、比較の結果が、取消指示単語の場合
は(S214)、受付確認音もしくは取り消し指示用音
声をスピーカ111より出力し(S215)、マイク1
12と音声分析部108の通話路を切断し、通話状態3
05に戻る。また、比較結果が取消指示単語または切断
指示単語でない場合で、認識不可回数がリトライ回数制
限値に満たない場合は、指示待ち状態に戻るようにして
もよい。認識不可回数がリトライ回数制限値に達した場
合は、不完了音をスピーカ111より出力し、マイク1
12と音声分析部108の通話路を切断し、通話状態3
05に戻る。このようにして通話中の切断を実行するこ
とができる。
【0038】また、上述した処理は、相手呼出し中に切
断を行う場合にも同様の処理を行うことにより切断を実
行できる。
【0039】以上のように、切断時には、音声入力によ
る操作を開始する旨の起動用単語を受け付けて、それを
認識後、切断指示の音声を受け付けて認識後、切断を実
行することができる。
【0040】さらに、上述した切断の処理においては、
起動用単語を認識しているが、さらに、通話中の無音時
間を計測して無音時間が特定時間続いた後に起動用単語
を認識するようにしてもよい。
【0041】この場合の処理を、図17および図18を
参照して説明する。図17および図18に、本実施例に
係わる音声操作電話装置の通話状態における切断制御の
他のフローチャートを示す。
【0042】図17において、音声操作電話装置が通話
状態の時に、マイク112からの音入力を音検出部10
6で監視し(S801)、音入力が無くなったことを検
出した場合は、無音時間の計測を開始し(S802)、
次の音入力を検出するまで無音時間の計数を行う(S8
03)。無音時間の計測は、図2に示すRTC240に
おいて行うことができる。無音時間が音声認識開始準備
時間の特定時間nを越える前にマイク112からの音入
力を検出した場合は、無音時間の計数をクリアし(S8
06)、通話状態305を継続する。無音時間が音声認
識開始準備時間nを越えた場合は、無音時間の計数をク
リアし、マイク112と音声分析部108の通話路を接
続し、マイク112からの音入力を待つ(S807)。
マイク112から音を受信した場合、その音を通話路制
御部104を経由して音声分析部108に入力し(S8
08)、比較処理部109において音声認識処理を行い
(S809)、比較結果を主制御部101に通知する
(S810)。比較の結果、起動用単語の場合は、受付
確認音をスピーカ111より出力し(S812)、指示
待ち状態813に移る。比較結果が起動用単語でない場
合は、マイク112と音声分析部108の通話路を切断
し、通話状態を継続する。
【0043】図18において、指示待ち状態S813の
時に、マイク112から音を受信した場合、その音を通
話路制御部104を経由して音声分析部108に入力し
(S815)、比較処理部109において音声認識処理
を行い(S816)、比較結果を主制御部101に通知
する(S817)。比較結果が取消指示単語の場合は、
受付確認音をスピーカ111より出力し(S819)、
マイク112と音声分析部108の通話路を切断し、通
話状態305に戻る。比較結果が切断指示単語の場合
は、受付確認音をスピーカ111より出力し(S82
1)、回線のループを解放して回線を切断し(S82
2)、待ち受け状態に移る。また、比較結果が取消指示
単語または切断指示単語でない場合で、認識不可回数が
リトライ回数制限値に満たない場合は、指示待ち状態8
13に戻るようにしてもよい。認識不可回数がリトライ
回数制限値に達した場合は、不完了音をスピーカ111
より出力し(S825)、マイク112と音声分析部1
08の通話路を切断し、通話状態305に戻る。
【0044】以上のように処理することにより、通話中
の無音時間を計測して無音時間が特定時間続いた後に起
動用単語を認識し、切断指示を受け付けた場合に切断を
実行することができる。これにより、通話中にも、切断
指示を音声によりすることができ、無音時間を計測する
ことにより、切断指示であることをより確実に認識する
ことができる。また、無音時間が特定時間続いた後に、
起動用単語を受け付けないで、直接切断指示を受け付け
るようにしてもよい。また、相手先呼出し中の切断処理
も同様に行うことができる。
【0045】つぎに、図12および図13に、本実施例
に係わる音声操作電話装置のキャッチホン制御のフロー
チャートを示す。通話中に相手先から発信があった場合
に、相手先を変更できるキャッチホンのサービスを受け
ている場合には、キャッチホンを行う旨のキャッチホン
指示用単語を受けて認識することにより相手先を変更す
ることができる。
【0046】図12に示すように、音声操作電話装置が
通話状態305の時に、マイク112からの音入力を音
検出部106で監視し(1001)、音入力が無くなっ
たことを検出した場合は、無音時間の計測を開始し(1
002)、次の音入力を検出するまで無音時間の計数を
行う(1003)。無音時間が音声認識開始準備時間n
を越える前にマイク112からの音入力を検出した場合
は、無音時間の計数をクリアし(1006)、通話状態
305を継続する。無音時間が音声認識開始準備時間n
を越えた場合は、無音時間の計数をクリアし、マイク1
12と音声分析部108の通話路を接続し、マイク11
2からの音入力を待つ(1007)。マイク112から
音を受信した場合、その音を通話路制御部104を経由
して音声分析部108に入力し(1008)、比較処理
部109において音声認識処理を行い(1009)、比
較結果を主制御部101に通知する(1010)。比較
結果が起動用単語の場合は、受付確認音をスピーカ11
1より出力し(1012)、指示待ち状態1013に移
る。比較結果が起動用単語でない場合は、マイク112
と音声分析部108の通話路を切断し、通話状態305
を継続する。
【0047】図13において、指示待ち状態1013の
時に、マイク112から音を受信した場合、その音を通
話路制御部104を経由して音声分析部108に入力し
(1015)、比較処理部109において音声認識処理
を行い(1016)、比較結果を主制御部101に通知
する(1017)。比較結果が取消指示単語の場合は、
受付確認音をスピーカ111より出力し(1019)、
マイク112と音声分析部108の通話路を切断し、通
話状態305に戻る。比較結果がキャッチホン指示単語
の場合は、受付確認音をスピーカ111より出力し(1
021)、回線のループを瞬断して通話相手を切り替え
て(1022)、マイク112と音声分析部108の通
話路を切断し、通話状態305に戻る。比較結果が取消
指示単語またはキャッチホン指示単語でなかった場合
で、認識不可回数がリトライ回数制限値に満たない場合
は、指示待ち状態1013に戻る。認識不可回数がリト
ライ回数制限値に達した場合は、不完了音をスピーカ1
11より出力し(1024)、マイク112と音声分析
部108の通話路を切断し、通話状態305に戻る。
【0048】以上のように処理することにより、通話中
の無音時間を計測して無音時間が特定時間続いた後に起
動用単語を認識し、キャッチホンの指示を受け付けた場
合に相手先を変更することができる。これにより、通話
中にも、キャッチホン指示を音声によりすることがで
き、また、無音時間を計測することにより、キャッチホ
ン指示であることをより確実に認識することができる。
また、無音時間が特定時間続いた後に、起動用単語を受
け付けないで、直接キャッチホン指示を受け付けるよう
にしてもよい。また、相手先からの呼び出し音送出後
に、直接キャッチホン指示を受け付けるようにしてもよ
い。
【0049】以上説明したように、上記各実施例によれ
ば、音声操作電話装置において、手で操作することなし
に、音声入力により、発信、着信、切断等の電話装置の
操作を行うことができる。このため、高齢者や障害者等
の手による操作が不自由な者にも使い勝手がよく、音声
認識による容易な操作を提供することができる。
【0050】さらに、音声による操作の開始を指示する
ために、「操作」という起動用単語を設けておくことに
より、電話の通話中に、入力した音声が会話の音声なの
か操作指示のための音声なのかを判断することができ、
「操作」という起動用単語が入力された後は、その後に
入力する音声は操作指示の音声であると判断することが
できる。これにより、誤認識を防ぐことができる。ま
た、「操作」という起動用単語の代わりに、音声が最後
に入力されたときから特定時間音声の入力がなかった後
に入力された音声が、操作の指示を示す音声入力である
と判断することができる。また、操作の指示を示す音声
入力を受け付け可能である旨のガイダンスメッセージを
スピーカから出力するようにして、ガイダンスメッセー
ジを送出後に、マイクから入力された音声は操作指示を
示す音声であると判断することができる。
【0051】また、ガイダンスメッセージとしては、ほ
かに、一致するコマンドがなかった場合や、音声認識で
きなかった場合に、「認識できませんでした。」などの
ように、その旨のガイダンスメッセージを出力するよう
にでき、認識結果をユーザが知ることができる。
【0052】
【発明の効果】本発明によれば、音声操作電話装置にお
いて、手で操作することなしに、音声入力により、発
信、着信、切断等の電話装置の操作を行うことができ
る。また、音声が操作指示の音声であることを判断する
ため、誤認識を防ぐことができる。
【図面の簡単な説明】
【図1】本実施例における音声応答・認識機能電話シス
テムの構成図。
【図2】本実施例における音声応答・認識機能電話シス
テムのブロック図。
【図3】本実施例における音声操作電話装置の機能構成
図。
【図4】本実施例における音声操作電話装置の実現形態
を示す説明図。
【図5】本実施例における音声操作電話装置の実現形態
を示す説明図。
【図6】本実施例における発信シーケンスを示す説明
図。
【図7】本実施例における着信シーケンスを示す説明
図。
【図8】本実施例における通話中/呼出し中での切断復
旧シーケンスを示す説明図。
【図9】本実施例における発信制御フローチャート。
【図10】本実施例における着信制御フローチャート。
【図11】本実施例における切断制御フローチャート。
【図12】本実施例におけるキャッチホン制御フローチ
ャート(その1)。
【図13】本実施例におけるキャッチホン制御フローチ
ャート(その2)。
【図14】従来技術を示す説明図。
【図15】本実施例における音声コマンド登録フローチ
ャート。
【図16】本実施例における音声操作電話装置における
音声コマンドを示す説明図。
【図17】本実施例における他の切断制御フローチャー
ト(その1)。
【図18】本実施例における他の切断制御フローチャー
ト(その2)。
【符号の説明】
100…公衆網、111…スピーカ、120…通話回
線、130…留守番制御部、140…音声認識制御部、
150…ヘッドセット制御部、155…ヘッドセット、
160…受話アンプ、170…受話器、180…送話ア
ンプ、190…送話器。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 畠山 寧 東京都千代田区内幸町一丁目1番6号 日 本電信電話株式会社内 (72)発明者 佐柄 和彦 東京都千代田区内幸町一丁目1番6号 日 本電信電話株式会社内

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】外部からの音声を入力する音声入力手段
    と、回線を介して前記音声を送信する送信手段と、前記
    回線から音声を受信する受信手段とを備える電話装置に
    おいて、 前記音声入力手段により入力された音声が、当該電話装
    置のあらかじめ定めた操作の指示を示す音声入力である
    か否かを判断する判断手段と、 あらかじめ定めた音声と操作を示すコマンドとを対応さ
    せて記憶するコマンド記憶手段と、 前記音声入力手段により入力された音声と、前記コマン
    ド記憶手段に記憶する音声とを比較する比較手段と、 前記判断手段により、前記音声入力手段により入力され
    た音声が操作の指示を示す音声入力であると判断された
    ときに、前記比較手段による比較の結果、一致する音声
    に対応するコマンドを前記コマンド記憶手段から抽出
    し、当該コマンドに対応する操作を実行する実行手段と
    を有することを特徴とする音声操作電話装置。
  2. 【請求項2】請求項1において、前記判断手段は、前記
    音声入力手段により音声が入力されたときから特定時間
    音声の入力がなかった後に入力された音声が、操作の指
    示を示す音声入力であると判断することを特徴とする音
    声操作電話装置。
  3. 【請求項3】請求項2において、前記判断手段における
    判断は、回線を介しての通話中に行うことを特徴とする
    音声操作電話装置。
  4. 【請求項4】請求項1において、前記コマンド記憶手段
    は、音声による操作開始を示す特定の音声をさらに記憶
    し、 前記判断手段は、前記比較手段による比較の結果、前記
    音声入力手段により入力された音声が前記音声による操
    作開始を示す特定の音声に一致した場合に、音声による
    操作開始と判断し、その後に、前記音声入力手段により
    入力された音声は、前記操作の指示を示す音声であると
    することを特徴とする音声操作電話装置。
  5. 【請求項5】請求項1において、前記操作の指示を示す
    音声入力を受け付け可能である旨のガイダンスメッセー
    ジを出力するメッセージ出力手段をさらに有することを
    特徴とする音声操作電話装置。
  6. 【請求項6】請求項5において、前記判断手段は、前記
    メッセージ出力手段による前記ガイダンスメッセージを
    出力後に、前記音声入力手段により入力された音声は操
    作指示を示す音声であると判断することを特徴とする音
    声操作電話装置。
  7. 【請求項7】請求項1において、前記比較手段による比
    較の結果、一致するコマンドがなかった場合にその旨の
    ガイダンスメッセージを出力する不一致メッセージ出力
    手段をさらに有することを特徴とする音声操作電話装
    置。
  8. 【請求項8】請求項1において、前記操作の指示を示す
    音声入力を受け付けることを示す表示を行う表示手段を
    さらに有し、 前記判断手段において、前記表示手段により前記表示が
    行われているときに、前記音声入力手段により入力され
    た音声は操作指示を示す音声であると判断することを特
    徴とする音声操作電話装置。
  9. 【請求項9】請求項1において、前記コマンド記憶手段
    に、前記コマンドに対応する音声を登録する登録手段を
    さらに有することを特徴とする音声操作電話装置。
  10. 【請求項10】請求項1において、前記実行手段による
    実行の前に、前記比較手段による比較の結果、一致し
    た、前記コマンド記憶手段に記憶する音声もしくは前記
    音声入力手段で入力した音声を外部に出力する出力手段
    をさらに有することを特徴とする音声操作電話装置。
  11. 【請求項11】回線に接続され、当該回線の制御を行う
    電話装置において、 電話の音声による操作の開始を示す特定の音声を外部か
    ら受け付ける操作開始受け付け手段と、 前記操作開始受け付け手段で前記特定の音声を受け付け
    たときに、音声による操作の指示を示す音声入力を受け
    付け可能である旨のガイダンスメッセージを出力するメ
    ッセージ出力手段と、 前記メッセージ出力手段による前記ガイダンスメッセー
    ジの出力後、前記音声による操作の指示として発信相手
    先を特定する音声を受け付ける発信相手先受け付け手段
    と、 前記発信相手先受け付け手段により発信相手先を特定す
    る音声に対応する電話番号を発信する発信手段とを有す
    ることを特徴とする音声操作電話装置。
  12. 【請求項12】回線に接続され、当該回線の制御を行う
    電話装置において、 電話の着信を検出し、着信音を出力する着信音出力手段
    と、 前記着信音出力手段による着信音出力中に、音声を外部
    から受け付ける音声受け付け手段と、 前記音声受け付け手段による音声の受付後に、操作の指
    示を示す音声入力を受け付け可能である旨のガイダンス
    メッセージを出力するメッセージ出力手段と、 前記メッセージ出力手段によるガイダンスメッセージの
    出力後、着信応答を行うことを示すコマンドに対応する
    特定の音声を受け付ける着信応答受け付け手段と、 前記着信応答受け付け手段による前記特定の音声の受付
    後、着信を受け付けて通話状態にする着信応答手段とを
    有することを特徴とする音声操作電話装置。
  13. 【請求項13】回線に接続され、当該回線の制御を行う
    電話装置において、 通話中に、電話の操作の開始を示す特定の音声を外部か
    ら受け付ける操作開始受け付け手段と、 前記操作開始受け付け手段による前記特定の音声を受け
    付けたときに、操作の指示を示す音声入力を受け付け可
    能である旨のガイダンスメッセージを出力するメッセー
    ジ出力手段と、 前記メッセージ出力手段によるメッセージの出力後、切
    断指示を示すコマンドに対応する特定の音声を受け付け
    る切断指示受け付け手段と、 前記切断指示受け付け手段による前記特定の音声の受付
    後、回線の切断を行う切断手段とを有することを特徴と
    する音声操作電話装置。
  14. 【請求項14】請求項1から請求項13の各々におい
    て、前記回線から受信した音声を出力する音声出力手段
    をさらに有することを特徴とする音声操作電話装置。
  15. 【請求項15】回線に接続され、当該回線の制御を行う
    電話装置における音声による操作指示受付方法であっ
    て、 あらかじめ定めた音声と操作を示すコマンドとを対応さ
    せて記憶しておき、 外部からの音声を入力し、 前記入力された音声が、当該電話装置のあらかじめ定め
    た操作の指示を示す音声入力であるか否かを判断し、 前記判断の結果、前記入力された音声が操作の指示を示
    す音声入力であると判断されたときに、前記入力された
    音声と、前記記憶する音声とを比較し、 前記比較の結果、一致する音声に対応するコマンドの操
    作を実行することを特徴とする音声による操作指示受付
    方法。
JP6157585A 1994-07-08 1994-07-08 音声操作電話装置およびその音声による操作指示受付方法 Pending JPH0823369A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6157585A JPH0823369A (ja) 1994-07-08 1994-07-08 音声操作電話装置およびその音声による操作指示受付方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6157585A JPH0823369A (ja) 1994-07-08 1994-07-08 音声操作電話装置およびその音声による操作指示受付方法

Publications (1)

Publication Number Publication Date
JPH0823369A true JPH0823369A (ja) 1996-01-23

Family

ID=15652923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6157585A Pending JPH0823369A (ja) 1994-07-08 1994-07-08 音声操作電話装置およびその音声による操作指示受付方法

Country Status (1)

Country Link
JP (1) JPH0823369A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003511924A (ja) * 1999-10-05 2003-03-25 オーボ・テクノロジーズ・インコーポレイテッド ローカルなインターラプト検出に基づく音声認識技術
JP2004341033A (ja) * 2003-05-13 2004-12-02 Matsushita Electric Ind Co Ltd 音声媒介起動装置およびその方法
JP2006317722A (ja) * 2005-05-13 2006-11-24 Xanavi Informatics Corp 音声処理装置
JP2009153188A (ja) * 1999-02-01 2009-07-09 Qualcomm Inc 音声起動移動電話通話応答装置
JP2014192769A (ja) * 2013-03-27 2014-10-06 Brother Ind Ltd 画像表示装置および画像表示プログラム
JP2016081003A (ja) * 2014-10-22 2016-05-16 株式会社大林組 水中作業支援システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009153188A (ja) * 1999-02-01 2009-07-09 Qualcomm Inc 音声起動移動電話通話応答装置
JP2003511924A (ja) * 1999-10-05 2003-03-25 オーボ・テクノロジーズ・インコーポレイテッド ローカルなインターラプト検出に基づく音声認識技術
JP2012108557A (ja) * 1999-10-05 2012-06-07 Research In Motion Ltd ローカルなインターラプト検出に基づく音声認識技術
JP2004341033A (ja) * 2003-05-13 2004-12-02 Matsushita Electric Ind Co Ltd 音声媒介起動装置およびその方法
JP2006317722A (ja) * 2005-05-13 2006-11-24 Xanavi Informatics Corp 音声処理装置
JP2014192769A (ja) * 2013-03-27 2014-10-06 Brother Ind Ltd 画像表示装置および画像表示プログラム
JP2016081003A (ja) * 2014-10-22 2016-05-16 株式会社大林組 水中作業支援システム

Similar Documents

Publication Publication Date Title
JPH0823369A (ja) 音声操作電話装置およびその音声による操作指示受付方法
EP1287675A2 (en) Method and apparatus for audio signal based answer call message generation
JP2550056B2 (ja) 音声ダイアル電話機
KR100229877B1 (ko) 자동중계장치를 이용한 원격지에서 도어폰 제어방법
KR950005978B1 (ko) 전화기의 버튼음성 발성방법
JPH11317810A (ja) 電話機
JPH08163228A (ja) 音声遠隔制御留守番電話装置およびその音声による操作指示受付方法
KR200308131Y1 (ko) 발신자정보의 음성출력수단을 구비한 전화기
US7340050B2 (en) Apparatus and method for controlling incoming melody
JP3148547B2 (ja) 電話機
KR100732962B1 (ko) 발신자정보를 이용한 음성벨 출력 방법
JPH0777397B2 (ja) 音声ダイアル制御装置
KR100208763B1 (ko) 전화단말기에서 원격제어에 의한 전화수신방법
JP2004505509A (ja) 消音システム
KR100674799B1 (ko) 화자종속 고립단어 음성인식을 통한 안내전화번호 자동다이얼링 방법
JPH09214599A (ja) 特定者着信方法および特定者着信機能付き電話機
JPH04286443A (ja) 電話機の保留制御装置
JPH03145248A (ja) 発信者識別電話機
KR20020005554A (ko) 일반 전화기에서 음성 다이얼을 통한 핸즈프리 통화구현방법
JPH0318160A (ja) 電話機
KR20030051540A (ko) 발신자정보의 음성출력수단을 구비한 전화기
KR20030075875A (ko) 이동통신 단말기에서의 착신 경보음 제어방법
JP2002344616A (ja) ハンズフリーホンおよびハンズフリーホンシステム
KR970004528A (ko) 신체장애자를 위한 전화통화 제어방법 및 장치
KR20000041983A (ko) 이동전화에서의 음성인식에 의한 자동통화방법