JPH03154551A - 電話入力装置 - Google Patents

電話入力装置

Info

Publication number
JPH03154551A
JPH03154551A JP29435889A JP29435889A JPH03154551A JP H03154551 A JPH03154551 A JP H03154551A JP 29435889 A JP29435889 A JP 29435889A JP 29435889 A JP29435889 A JP 29435889A JP H03154551 A JPH03154551 A JP H03154551A
Authority
JP
Japan
Prior art keywords
input
voice
processing
result
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP29435889A
Other languages
English (en)
Inventor
Masashi Katsumata
勝俣 雅司
Koichi Sakagami
晃一 阪上
Hisashi Nakada
中田 寿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP29435889A priority Critical patent/JPH03154551A/ja
Publication of JPH03154551A publication Critical patent/JPH03154551A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は電話入力装置に係り、特に声音、プッシュボタ
ン(P B)信号の両方を用いて電話から複数の項目を
入力するのに好適な電話入力装置に関する。
〔従来の技術〕
電話サービスにおいて電話機から情報を入力する場合、
入力方式には、計算機センタからのガイダンスで指定さ
れた項目を入力するガイダンス方式と、1回の入力で任
意の複数(1も含む)の項目を入力する一括入力方式が
あり、また、入力信号については、声音とPB倍信号あ
る。
第4図ガイダンス方式の構成例を示したもので。
1oは計算機センタ、20は電話機である。計算機セン
タ10は電話機20からの入力を受は付けるもので、音
声認識機構11、PB受信機構12、声音合成機構13
.ガイダンス会話処理機構16よりなる。利用者は電話
機20から音声またはPBにより情報を入力する。入力
された信号は、計算機センタ10において音声認識機構
11またはPB受信機構12でコードに変換され、ガイ
ダンス会話処理機構16へ渡される。ガイダンス会話処
理機構16は入力された信号を解釈し、利用者に対して
声音合成機構13を用いてガイダンスを音声出力する。
第5図はガイダンス方式による利用者と計算機センタの
会話シーケンス例で、(イ)は声音入力。
(ロ)はPB入力、(ハ)は数字をPB入力で他は声音
入力で行う例である。いずれも、1回の入力要求に対し
ては、声音かPBのいずれかのみの入力であり、利用者
は計算機センタから指定された項目を入力する。
第6図は一括入力方式の構成例で、音声による入力の場
合を示したものである。計算機センタ10は音声認識機
構11.声音合成機構13.−括入力会話機構15より
なり、−指入力解釈会話機構15はさらに項目組立て部
151、意味検索部152及び間合せ部153よりなる
電話機20から入力された音声は、計算機センタ10に
おいて、音声認識機構11で認識され、単語列(コート
列)に変換されて、−指入力解釈会話機構15へ渡され
る。−指入力解釈会話機構15の各部では、この単語列
に対して次のような処理を行い、複数項目を直しく解釈
する。即ち。
項目組立て部151は関連ある単語をまとめて複数の項
目に組立てる。意味検索部152は項目をサービス毎に
決められた入力項目に対応づける。
間合せ部153は誤認識等の原因で生じた解釈不可部分
を声音合成機構13を用いて利用者に問い合せる。なお
、この−指入力解釈会話機構1.5については、例えば
特願昭63−129349号に詳述されている。
第7図は第6図の一括入力方式による利用者と計算機セ
ンタの会話シーケンス例を示したものである。
〔発明が解決しようとする課題〕
ガイダンス方式では、1回しこ1項目の入力だけである
ので、入力毎に声音、PBを変えた入力が可能である。
第5図(ハ)は、数字入力項目はPB、その他の入力項
目は声音入力とした例である。
しかしながら、ガイダンス方式には、インタラクション
数が多くなることや、入力の必要がない項目にも「不要
」などと答えなければならないといった問題がある。こ
れに対し、−括入力方式では1回の入力で複数項目が入
力可能であり、かかるガイダンス方式の場合の問題が解
釈される。
−括入力方式において、1回の入力に声音とPBを混在
させると1例えば、数字入力は確実に入力できて操作が
簡単なPB入力、数字以外の入力は覚え易い単語を用い
た声音入力とし、これらを自由に組合せて一括入力する
ことにより、効率的でマンマシンインタフェースのよい
入力が期待できる。しかしながら、従来は1回の入力で
は声音、PB一方のみの入力を前提としているため、声
音とPBを自由に組合せて一括入力するようなマンマシ
ンインタフェースのよい入力方式を実現できなかった。
本発明の目的は、声音とP Bを自由に組合せ、複数項
目(1項目も含む)を電話機から一括入力す゛る効率的
でマンマシンインタフェースのより1データ入力を可能
とする′電話入力装置を提供することにある。
〔課題を解決するための手段〕
上記を達成するため、本発明の電話入力装置は、電話機
からの声音入力を認識し、対応するコードを出力する音
声認識機構と、電話機からのPB信号入力を検出し、対
応するコードを出力するPB受信機構と、前記音声認識
機構とPB受信機構の出力を受けて、当該コードが声音
入力かPB信号入力か判定し、声音入力と判定した時は
音声認識機構の出力を選択は、PB信号入力と判定した
時はPB受信機構の出力を選択する選択機構と、前記選
択機構の選択結果を予め定義した入力項目の構成情報に
もづいて解釈する解釈機構からなることを特徴とする。
〔作 用〕
声音、PB倍信号判定は、一般に声音周波数とPB信号
周波数の帯域が異なることを利用して、周波数フィルタ
により行われる。この場合、周波数フィルタにより、声
音でPB受信fi構が動作しないようにできても、音声
認識機構がPB倍信号誤って認識する危険性があり、声
音とPB倍信号2つの入力があったと誤判定されること
がある。
また、音声認識処理時間、PB検出処理時間は一般に異
なるので、音声認識機構からの出力、P 13受信機構
からの出力順序が反転することがある。
このような場合も、選択機構により、声音入力に対して
は音声認識機構の処理結果、PB倍信号対してはPB受
信機構の処理結果が必ず得られるため、電話機から声音
とPB倍信号両者を使用して複数の項目を入力すること
ができるようになる。
〔実施例〕
以下、本発明の一実施例について図面により説明する。
第1図は本発明の一実施例の構成図で、10は計算機セ
ンタ、20は電話機である。計算機センタ10は電話機
20からの音声とPB大入力受は付けるもので、音声認
識機構11、PB受信機構12、声音合成機構13、選
択機構14及び−括入力解釈会話機構15よりなり、−
括入力解釈会話機構15はさらに項目組立て部151、
意味検索部152、問合せ部15よりなる。
電話機20から入力された信号(声音またはPB倍信号
は音声認識機構11、PB受信機構12で並行して処理
され、処理結果(コード)が選択機構14へ渡される。
選択機構14では、音声認識機構11とPB受信機構1
2の処理結果を受け。
PB大入力声音入力かの判定を行い、声音入力と判定し
た時は音声認識機構11の処理結果を採用し、PB大入
力判定した時はPB受信機構12がらの処理結果を採用
する。選択機構14の処理結果は一括入力解釈会話機構
15に渡され、第6図の場合と同様にして一括入力され
た複数項目が正しく解釈される。
第2図は声音とPB倍信号混在した一括入力方式による
利用者と計算機センタの会話シーケンス例を示したもの
で、数字にはPB大入力それ以外には声音入力を用いた
例である。第3図は、この声音、PB大入力判別する選
択機構14の処理を説明する図である。
音声認識機構11では、声音周波数とPB信号周波数の
帯域が異なることを利用して音声を認識し、単語列(コ
ード列)を出力する。この結果、声音入力(入力1、入
力4)は、音声認識機構11からTvの処理遅延後、認
識結果v1、v4として出力される。この音声認識機構
11にはPB倍信号入力されるため、該PB倍信号標準
バタンとの照合を行い、この結果が、ある閾値より近け
れば、処理遅延Tv後、音声認識結果が出力される6第
3図の認識結果■2は、PB倍信号入力2)を誤って認
識したことを示している。閾値より離れていれば、認識
対象語ではないと判定し何も出力されない(入力3、入
力5、入力6に対しては音声認識機構11からの出力は
ない)。一方、PB受信機構12には、ある帯域の周波
数を減衰または強調する周波数フィルタをPB信号受信
部の前に置くことにより、声音入力を誤ってPB(il
i号とすることを防ぎ1本当にPB倍信号有った時のみ
、該PB受信機構12が動作するようにすることが可能
である(例えば特開昭61−78296号公報)。この
結果、PB大入力入力2.入力3、入力5、入力6)は
、PB受信機構12がらTpの処理遅延後、処理結果(
コード)P2、P3゜PB、P6が必ず出力され、声音
を誤ってPB受信結果として出力することはない。
このように、周波数フィルタにより音声でPB受信機構
12が動作しないようにできても、音声認識機構11が
PBを誤って認識する危険性があり、PB入力が音声認
識4!に構11、PB受信機構12の両方から出力され
ることがある(入力2のケース)。さらには、音声認識
機構11の処理遅延Tv、PB受信機構12の処理遅延
Tpの違いにより、入力順序と処理結果の出力順序が逆
転することがある(入力4と入力Sのケース)。このた
め1選択機構14では以下の処理を行う。なお。
説明は第3図に示したようにT v > T pとして
行うが、逆の場合でも全く同様である。
処理遅延の小さいPB受信機構12の出力が実際の出力
時刻より処理遅延の差ITv−Tplだけ遅れたと見な
し、処理遅延の差を補正する。具体的には、PBB信機
構12の出力を遅延[11路等により1Tv−Tpl遅
らせて出力する方法、I〕B受信機構12.音声認識機
構11からの出力時刻に処理遅延時間を加減することに
より、計算上行う方法などが考えられる。
選択機構14では、上記処理時間の差を補正したPBB
信機構12、音声認識機構11の処理結果に対し、両者
の時間差がある値dより小さかった場合には、PB大入
力PBB信機構12、音声認識機構11の両者で処理さ
れたものとみなし、音声認識機構11からの出力を破棄
する。dよりも大きかった場合には、遅延時間の差を補
正した結果をそのまま出力する。なお、dは利用者が声
音またはPBを入力する時間間隔Tiに比べ小さいため
、利用者が独立に入力した音声とPBを誤って同一入力
とみなし捨ててしまうことはない。
この結果、■PBが音声認識機構11で誤って処理され
た時の出力を削除することが出来る(入力2のケース)
。■処理遅延の差により出力が逆転した時にも1元の正
しい順序に戻すことができる(入力4、入力5のケース
)。
以上により、音声入力に対しては音声認識機構11の処
理結果、PB倍信号対してはPB受受信機工12処理結
果を必ず得ることができる。選択機構14の処理結果は
第6図における音声認識機構11の出力と同じであり、
これ以降は一括入力解釈会話機構15により、従来と同
様にして一括入力された複数項目が正しく解釈される。
〔発明の効果〕
以上述べたように、本発明によれば、音声とPBを組み
合わせた複数項目の一括入力が可能となるので、従来技
術に比べ以下の効果がある。
■ 音声またはPBによるガイダンス久方と比較し、入
力インタラクション数を減少できる。
■ 音声あるいはPBのみによる一括入力方式と比較し
、数字をPB大入力数字以外を音声入力とすることによ
り、 イ、数字の入力が確実になる。
口、電話から受発注を行うような場合、商品名(非数字
単語の音声入力)と個数(数字のPB大入力のベアで構
成される入力項目が複数−括入力されるが、このような
ケースでは、確実なPB大入力よる数字が入力項目の区
切りとできるので。
−括入力の解釈を確実なものとすることができる。
ハ、数字の音声認識用の標準バタンか不要になるので、
認識装置の価格を安くすることができ、または、その分
、他の認識単語数を増すことができる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成図、第2図は音声とP
B倍信号混在する会話シーケンス例を示す図、第3図は
第1図の選択機構の処理を説明する図、第4図は従来の
ガイダンス方式の構成例を示す図、第5図は第4図に対
する会話シーケンス例を示す図、第6図は従来の一括入
力方式の構成例を示す図、第7図は第6図に対する会話
シーケンス例を示す図である。 10・・・計算機センタ、  11・・・音声認識機構
、12・・・PBB信機構、  13・・・声音合成機
構、14・・・選択機構、 15・・・−括入力解釈会話機構、 20・・・電話機。

Claims (1)

    【特許請求の範囲】
  1. (1)電話機から音声とプッシュボタン信号(以下、P
    B信号と称す)の組合わされた1または複数の項目を入
    力する装置であって、 電話機からの音声入力を認識し、対応するコードを出力
    する音声認識機構と、 電話機からのPB信号入力を検出し、対応するコードを
    出力するPB受信機構と、 前記音声認識機構とPB受信機構の出力を受けて、当該
    コードが音声入力かPB信号入力か判定し、音声入力と
    判定した時は音声認識機構の出力を選択し、PB信号入
    力と判定した時はPB受信機構の出力を選択する選択機
    構と、前記選択機構の選択結果を予め定義した入力項目
    の構成情報にもとづいて解釈する解釈機構とからなるこ
    とを特徴とする電話入力装置。
JP29435889A 1989-11-13 1989-11-13 電話入力装置 Pending JPH03154551A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29435889A JPH03154551A (ja) 1989-11-13 1989-11-13 電話入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29435889A JPH03154551A (ja) 1989-11-13 1989-11-13 電話入力装置

Publications (1)

Publication Number Publication Date
JPH03154551A true JPH03154551A (ja) 1991-07-02

Family

ID=17806679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29435889A Pending JPH03154551A (ja) 1989-11-13 1989-11-13 電話入力装置

Country Status (1)

Country Link
JP (1) JPH03154551A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1316944A2 (en) * 2001-11-28 2003-06-04 Fujitsu Limited Sound signal recognition system and method, and dialog control system and method using it

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1316944A2 (en) * 2001-11-28 2003-06-04 Fujitsu Limited Sound signal recognition system and method, and dialog control system and method using it
EP1316944A3 (en) * 2001-11-28 2006-06-07 Fujitsu Limited Sound signal recognition system and method, and dialog control system and method using it
US7177806B2 (en) 2001-11-28 2007-02-13 Fujitsu Limited Sound signal recognition system and sound signal recognition method, and dialog control system and dialog control method using sound signal recognition system

Similar Documents

Publication Publication Date Title
CN109949810A (zh) 一种语音唤醒方法、装置、设备及介质
EP1085500B1 (en) Voice recognition for controlling a device
US20100049525A1 (en) Methods, apparatuses, and systems for providing timely user cues pertaining to speech recognition
US9799332B2 (en) Apparatus and method for providing a reliable voice interface between a system and multiple users
US20100114564A1 (en) Dynamic update of grammar for interactive voice response
CN115631738A (zh) 音频数据处理方法、装置、电子设备及存储介质
JPH03154551A (ja) 電話入力装置
US6859238B2 (en) Scaling adjustment to enhance stereo separation
US8050412B2 (en) Scaling adjustment to enhance stereo separation
CN112002319A (zh) 智能设备的语音识别方法及装置
US8639514B2 (en) Method and apparatus for accessing information identified from a broadcast audio signal
Grechanik et al. Research in radio frequency signals using APCO P25 standart in Moscow
EP0520050B1 (en) Enabling code for radiotransmission of data
JPH0863185A (ja) 音声認識装置
CN103297579A (zh) 语音辅助键区输入
EP4383253A2 (en) Relevance based source selection for far-field voice systems
JPS59144945A (ja) 音声認識制御方式
CN116798430A (zh) 一种设备控制方法、多功能识别设备和存储介质
JP2001112033A (ja) Dtmf信号検出装置及び検出方法
JP2004126198A (ja) 信号抽出システム、信号抽出方法および信号抽出プログラム
JPS6314377B2 (ja)
CN110764484A (zh) 家庭设备控制系统
KR0128844B1 (ko) 음성합성을 이용한 정보통신 서비스 검색 장치 및 방법
EP1341379A2 (en) Scaling adjustment to enhance stereo separation
JPS6041863A (ja) プッシュホン音声入力装置