JPH0719239B2 - 音声認識応答システム - Google Patents

音声認識応答システム

Info

Publication number
JPH0719239B2
JPH0719239B2 JP59101746A JP10174684A JPH0719239B2 JP H0719239 B2 JPH0719239 B2 JP H0719239B2 JP 59101746 A JP59101746 A JP 59101746A JP 10174684 A JP10174684 A JP 10174684A JP H0719239 B2 JPH0719239 B2 JP H0719239B2
Authority
JP
Japan
Prior art keywords
voice
user
information
operator
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59101746A
Other languages
English (en)
Other versions
JPS60246468A (ja
Inventor
洋一 竹林
英範 篠田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59101746A priority Critical patent/JPH0719239B2/ja
Publication of JPS60246468A publication Critical patent/JPS60246468A/ja
Publication of JPH0719239B2 publication Critical patent/JPH0719239B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、音声、文字、画像等を媒体として、情報の入
出力を行い、人間と機械(計算機)とが対話を行う音声
認識応答システムに関する。
〔発明の技術的背景とその問題点〕
ニューメディア時代,CATV,ビデオテックス(キャプテン
システム)等、情報サービスの重要性が高まっている。
またLSI技術,高性能,低価格,半導体技術の進歩,計
算機の低価格化,高性能化光通信技術,人口衛生,パタ
ーン認識技術,音声認識技術,情報検索技術,知識工学
の進歩,大規模データベース,文字,画像,音声や他の
入出力媒体を用いて、人間と機械(計算機)とが対話
し、種々の情報サービスを行う対話システム(マンマシ
ンシステム)のニーズが高まってきている。例えば、 人件消削減、利益、売上拡大、サービス向上、経済性
向上のため、 テレンンショッピング、銀行のテレンンサービス、国
鉄、航空券、映画等の座席予約、レストランの予約、プ
レイガイド等がある。
しかしながら、 人間と人間の音声による自然な会話に比べて、現状で
は、人間と機械(計算機)との対話は、不自然でわずら
わしく、情報入出力装置の使用方法(例えばキー操作
等)を覚えるのが大変である。
しかし、省略化、低コスト化、経済性アップ、利益・売
上拡大のためには、人間と機械とのマンマシンシステム
の適用範囲は拡大している。
利用者の入力方法や入力情報が誤まっていると、情報入
出力装置の計算機は十分に理解できず、対応できないこ
とがある。
特に利用者が不慣れな場合や、上記情報入出力装置の導
入した初期には問題が多い。
また、情報サービスを行う、情報入出力装置の所有者、
すなわち、旅行代理店、プレイガイド、情報サービス会
社、テレホンショッピング会社はセールスやサービスを
向上させたい。
すなわち、人間−人間の音声による自然な会話でサービ
スを行い、ユーザやお客を確保して利益を上げたいとい
う要求が強い。
人間と機械(計算機)との対話が正常に運用されていな
いと、利用者が間違った使い方をする、あるいは、使用
方法がわからない、また音声入力やオンライン文字入力
の場合には、音声認識装置や文字認識装置の認識率が悪
く、正しく情報入力できないことが生じるという問題が
あった。
〔発明の概要〕
上記のように、人間−機械(計算機)との対話が円滑に
運ばなくなった場合、また、利用者が情報サービスを行
う側から、オペレータの肉声で会話を行い、サービスを
受けたい場合、利用者がオペレータと対話したい旨、オ
ペレータに通知する手段を有する音声認識応答システム
を提供することにある。
〔発明の効果〕
利用者は、機械との対話あるいはオペレータとの対話の
選択ができるため、利用者が不慣れな場合や情報入出力
が円滑に行かない場合、オペレータとの対話により、ス
ムーズに情報の入出力が行える。このため、情報のサー
ビスを行う情報入出力装置の導入範囲が、利用者に対す
るサービスの低下を招かせず、拡大できる。そして、利
用者は適宜、機械、オペレータと選択できるため安心し
て、情報入出力装置を用い、情報のサービスを受けられ
るようになる。
〔発明の実施例〕 実施例 第1図は、本発明による人間と機械との間の情報入出力
装置の構成図を示す。
入出力端末装置1(音声入力とキー入力を併用する場合
音声、画像、文字を出力として用いる) イ マイクロホンで入力された音声のアナログ信号を、
例えば、0〜3.6KHzに低域フィルタを用いて、帯域制限
した後、8KHzの標本化周波数で標本化しA/D変換し、8
ビットで対数圧縮した量子化を行いディジタル信号に変
換される。
このような、CODEC用のLSIは既に製品化されており、音
声の符号化用として本実施例装置は用いる。
ロ キーボード(英字,数字,カナ,記号を入力でき
る。) ハ 音声の符号化された8ビットのディジタル信号をD/
A変換し、アナログ信号に変換し、スピーカから音声出
力する。
(イのLSIには、D/Aの機能も含まれたものが既にある) ニ 文字,画像表示用ディスプレイ (CRTディスプレイまたは液品ディスプレイなど) 上記イ〜ニのうち、イ,ハだけの構成のときは音声認識
応答システムになる。
回線2 文字、画像、音声情報のディジタル信号を伝送
するディジタル回線。
インターフェース3 利用者からの、音声、文字画像等の情報を統合して取
り扱い、利用者と機械(計算機),利用者とオペレータ
との対話に、それぞれ適するように、情報の交換を行
う。
入出力を音声を媒体として使用し、機械(計算機)と
の対話を、音声認識装置と音声規則合成装置を用いて行
う場合、3のインターフェースの内容は、第2図のよう
になる。
音声認識装置7 (回線から入力された情報検索用のキーワードや数字等
の音声信号を認識することのできる不特定話者用の単語
音声認識装置) 音声規則合成装置8 (計算機からの文字情報(言語情報)を音声信号に変換
する。例えば、LSPパラメータやケプストラムを用い
て、音節を単位にして行える) インターフェース3では、回線2に入出力する利用者側
からの情報と計算機5及びオペレータ側からの情報を結
合するためのものである。
計算機/オペレータ切替装置4 利用者側から、音声入力でオペレータへの対話に切替え
る要求があった場合、インターフェース3で切替情報が
抽出され、計算機5の対話からオペレータの対話に、切
替える。
計算機5 データベースに知識を保有しており、利用者からの入力
情報により、処理を行い、適当な情報を出力する。
例えば、プレイガイドを行う情報サービスシステムで
は、利用者からの入力情報、 等と利用者は、キー等の非音声入力あるいは音声で情報
を入力し、計算機はそれに対して処理し、適当な情報を
利用者に出力する。
このときの出力情報は文字、画像等の非音声情報やある
いは、音声を含むように構成してもよい。
オペレータ用入出力端末装置6 オペレータが、利用者と音声を用いて会話できるよう、
マイクロホンとスピーカが備えられており、また、利用
者と計算機との対話に対する状況を、CRT等のディスプ
レイで文字情報あるいは画像情報としてモニタできるよ
うになっている。
上記のような構成の本実施例装置で、 に、切り替えたとき、次のようなシステムの運用形態が
考えられる。
単に、利用者とオペレータとが会話する場合 オペレータが計算機と対話し、利用者との仲介を行い音
声等に利用者に情報を知らせる。
利用者とオペレータの対話モードに切り替えられたと
き、計算機からの出力は、オペレータの端末か、また
は、利用者の端末に出力される。
☆入出力の手段(メディア)により、次のような変形例
がある。
入出力が全て音声の場合 第1図の利用者入出力端末1は電話器回線2は電話公衆
回線 インターフェース3は第2図と同じく音声認識装置と音
声規則合成装置 切替装置4は、音声認識結果により得られた情報であり
「オペレータ」等という単語を検出し、計算機とオペレ
ータの何れかを選択する。
この場合、音声のパターン認識による入力のため、利用
者の個人性や話し方、雑音や回線状態が悪いとき、利用
者と計算機との通常のデータ入出力が円滑に運ばないと
きがある。このような場合、認識が容易な単語例えば
「オペレータ」等と発声し、利用者は、オペレータとの
会話に切り替えることが可能であるため、現在、銀行の
残高照会等で利用されているテレホンサービスの欠点を
解消される。すなわち、音声認識技術が、不十分なた
め、利用者が情報入力できないとき、オペレータとの通
話でバックアップできるため、多方面の分野で、このよ
うな、自動化システムが導入できるという利点があり、
人件費の削減と経済性のアップが既存の全て、人手によ
るサービスに比べて、得られる。
人間と機械との対話に音声が含まれない場合、第1図
の入出力端末1は、キー入力や画像入力装置及びマイク
ロホン、出力は、CRTやファクシミリスピーカ 回線2は、文字,画像,音声を統一して伝送できるデジ
タル回線。
インターフェース3は、音声認識装置及び合成装置を含
んでいない。オペレータと利用者との会話のときだけ音
声が使われる。
キー、図形、画像、文字情報により、利用者が情報を入
力しても使い方がわからなかったり、さらに、別種の情
報を得たい場合、利用者は、「交替」等といった特殊キ
ーを打鍵することにより、オペレータとの対話を要求で
きる。このため、導入時には、オペレータが多数必要だ
が、順々に削減できる。
文字認識による入力(オンライン認識)にも適用可能
である。
と二種類のモードが、本発明では存在する。
このうち は、時分割処理を行い、一台の処理装置で、多数の回線
を対象とし、多数の利用者と対話が行える。しかし、 は人と人との会話であるため、同時に、多数の会話は不
可能である。
したがって、利用者から、オペレータと会話を行いたい
との要求が、多すぎる場合(処理会話不能)次のような
応対が考えられる。
(a)「只今、オペレータは手が離せませんので、計算
機との対話でお願いします。」と利用者にメッセージを
出力する。(計算機から) (b)「お客様の方へ、後ほど、オペレータの方から連
絡いたしましょうか」とメッセージを出す。(計算機か
ら) (c)現在の電話のように、一担オペレータが対話中の
利用者との会話を中断しつ、利用者に手か離せないこと
を伝える。オペレータは手のあいているとき処置する。
(d)本発明によるシステム装置は、利用者番号を記憶
しておき、後でオペレータの方から連絡する。
以上のような方法が、オペレータの多忙時の対策として
考えられる。
☆以上述べたように本発明は、従来のマンマシンシステ
ムにおける不備を軽減し、利用者の立場に立脚したもの
であり、人間と機械との対話を促進する一方、利用者の
希望で、オペレータとの対話に切り替えることができ、
種々の情報サービスを行う情報入出力システムに適用で
きる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す図、第2図は本発明の
一実施例におけるインターフェース3の構成例を示す
図、第3図及び第4図は本発明の対話システムを説明す
るための図、第5図は、本発明の一実施例の処理手順を
示す図である。 1…入出力端末装置、2…回線、3…インターフェー
ス、4…計算機/オペレータ切替装置、5…計算機、6
…オペレータ用入出力端末装置。
フロントページの続き (56)参考文献 特開 昭58−169273(JP,A) 特開 昭50−93195(JP,A) 特開 昭58−215699(JP,A) 特開 昭59−49638(JP,A) 特開 昭58−50068(JP,A) 実開 昭59−6209(JP,U)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】利用者から入力された音声を認識する音声
    認識手段と、 この音声認識手段による認識に応じて、音声で応答を行
    う音声合成手段とを備える音声認識応答システムにおい
    て、 前記音声認識手段は、利用者から入力された音声の内、
    オペレータとの対話を所望する旨の特定の単語を常時検
    出する検出手段と、この検出手段による検出の後オペレ
    ータとの音声による会話を実現し得る手段へ切替えを行
    う手段とを具備することを特徴とする音声認識応答シス
    テム。
  2. 【請求項2】検出手段における特定の単語の検出が、同
    時に多数あった場合に、予め定められた応答用のメッセ
    ージを利用者に出力することを特徴とする特許請求の範
    囲第1項記載の音声認識応答システム。
JP59101746A 1984-05-22 1984-05-22 音声認識応答システム Expired - Lifetime JPH0719239B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59101746A JPH0719239B2 (ja) 1984-05-22 1984-05-22 音声認識応答システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59101746A JPH0719239B2 (ja) 1984-05-22 1984-05-22 音声認識応答システム

Publications (2)

Publication Number Publication Date
JPS60246468A JPS60246468A (ja) 1985-12-06
JPH0719239B2 true JPH0719239B2 (ja) 1995-03-06

Family

ID=14308807

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59101746A Expired - Lifetime JPH0719239B2 (ja) 1984-05-22 1984-05-22 音声認識応答システム

Country Status (1)

Country Link
JP (1) JPH0719239B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015036826A (ja) * 2013-08-12 2015-02-23 日本電気株式会社 コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272624A (ja) * 1989-04-13 1990-11-07 Nec Corp 聴覚情報入力管理方式
JPH02272626A (ja) * 1989-04-13 1990-11-07 Nec Corp 聴覚情報出力管理方式
US5802526A (en) * 1995-11-15 1998-09-01 Microsoft Corporation System and method for graphically displaying and navigating through an interactive voice response menu
JPH10133847A (ja) * 1996-10-28 1998-05-22 Casio Comput Co Ltd 移動端末音声認識/データベース検索/リソースアクセス通信システム
JPH10177469A (ja) * 1996-12-16 1998-06-30 Casio Comput Co Ltd 移動端末音声認識/データベース検索/リソースアクセス通信システム
JP3857047B2 (ja) 2000-12-28 2006-12-13 富士通株式会社 音声対話システム及び音声対話方法
WO2014141574A1 (ja) * 2013-03-14 2014-09-18 日本電気株式会社 音声制御システム、音声制御方法、音声制御用プログラムおよび耐雑音音声出力用プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3876864A (en) * 1973-12-11 1975-04-08 Diebold Inc Teller-assisted currency dispenser system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015036826A (ja) * 2013-08-12 2015-02-23 日本電気株式会社 コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム

Also Published As

Publication number Publication date
JPS60246468A (ja) 1985-12-06

Similar Documents

Publication Publication Date Title
CN108737667B (zh) 语音质检方法、装置、计算机设备及存储介质
WO2021160191A1 (zh) 一种实现人机协同的语音通讯系统及方法
Arons The Audio-Graphical Interface to a Personal Integrated Telecommunications System
JP3514372B2 (ja) マルチモーダル対話装置
US6775651B1 (en) Method of transcribing text from computer voice mail
Lewis Practical speech user interface design
CN107707745A (zh) 用于提取信息的方法和装置
WO2007091453A1 (ja) モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム
CN103714813A (zh) 短语辨认系统和方法
CN101547261A (zh) 关联赋予装置、关联赋予方法和记录介质
CN111949784A (zh) 基于意图识别的外呼方法及装置
CN107093425A (zh) 电力系统的语音导航系统、语音识别方法和语音交互方法
CN109285548A (zh) 信息处理方法、系统、电子设备、和计算机存储介质
WO2020250016A1 (en) Apparatus for processing an audio signal for the generation of a multimedia file with speech transcription
JPH0719239B2 (ja) 音声認識応答システム
JP6327252B2 (ja) 分析対象決定装置及び分析対象決定方法
JP3526101B2 (ja) 音声認識装置
Furui et al. Ubiquitous speech processing
US20020193993A1 (en) Voice communication with simulated speech data
JP2000347684A (ja) 音声認識システム
Gilbert et al. Intelligent virtual agents for contact center automation
Philip et al. Man machine interaction by voice: Developments in speech technology: Part I: the state-of-the-art
Kouroupetroglou et al. Speech-enabled e-Commerce for disabled and elderly persons
JPH03167666A (ja) 情報案内・提供方法
JP4408665B2 (ja) 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term