JPS59144945A - 音声認識制御方式 - Google Patents

音声認識制御方式

Info

Publication number
JPS59144945A
JPS59144945A JP58017503A JP1750383A JPS59144945A JP S59144945 A JPS59144945 A JP S59144945A JP 58017503 A JP58017503 A JP 58017503A JP 1750383 A JP1750383 A JP 1750383A JP S59144945 A JPS59144945 A JP S59144945A
Authority
JP
Japan
Prior art keywords
input
voice
service
reminder message
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58017503A
Other languages
English (en)
Other versions
JPH0516604B2 (ja
Inventor
Toshihiko Kurino
栗野 利彦
Kazuhiro Umemura
梅村 和裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP58017503A priority Critical patent/JPS59144945A/ja
Publication of JPS59144945A publication Critical patent/JPS59144945A/ja
Publication of JPH0516604B2 publication Critical patent/JPH0516604B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、例えば、各種情報(例えば銀行業務の預金残
高、入金)について、電話回線によシ、ユーザからの要
求(照会)に応じて所望の情報を音声で自動的に応答(
提供)シ、または発生した所定の情報をユーザへ音声で
自動的に通知する音声応答・通知サービスシステムにお
いて、ユーザの電話機からの入力音声を識別するのに使
用される音声認識装置の認識率を向上させるだめの音声
認識制御方式に関するものである。
〔従来技術〕
上述のような音声応答・通知サービスシステムは、当初
、ユーザの電話機が押しボタンダイヤル式(PB式)の
ものに対してのみ適用されていた。
したがって、このシステムに対するサービス要求種別等
は、ユーザのPB式電話機が当該システムと接続されて
から後、そのPB倍信号音声帯域内の特定周波数の組合
せ)によ−シ、当該システムに入力されて以後の処理が
進行されるようになっていた。
ところで、最近、この種のサービス(例えば銀行業務に
おける預金残高照会、入金通知等のサービス)が広く行
われることが要望されるようになってきている。
しかしながら、ユーザの電話機は、必ずしもPB式のも
のでなく、むしろダイヤル式(DP式)のものの方が多
く、DP式電話機では上記のようにPB倍信号よるサー
ビス要求種別等の入力は不可能である。また、ユーザの
電話機がPB式のものであっても、ユーザによっては機
械操作でなく音声の入力によってサービスを受けたいと
希望する場合もある。
このような場合には、ユーザの電話機からの入力音声を
音声認識装置で識別し、その°サービス要求等を上記シ
ステムに入力し、所望のサービスを提供しうるようにし
なければならない。
この場合、入力音声は電話回線を通して伝送さ。
れたものであり、音声認識装置に不慣れなユーザ(以下
、初心者というが、これに対して慣れたユーザを熟練者
という。)は入力方法9発声方法が不確実であるにもか
かわらず、この種の音声認識装置の従来のものは、例え
ば1種類の音声入力案内(入力催告メツセージ)しか用
意されておらず、特に初心者の入力音声が不適当、不確
実となり、その認識率が低くならざるを得ないとともに
、全体の認識率も低下させる原因となっていた。
〔発明の目的〕
本発明の目的は、上記した従来技術の欠点をなりシ、特
に初心者からの入力音声についても高い認識率を得るこ
とができる音声認識制御方式を提供することにある。
〔発明の概要〕
本発明に係る界声認識制御方式は、入力催告メツセージ
として内容が異なる所定青刈のものを設定しておき、情
報応答サービスの場合は、所望の入力催告メツセージ種
別に対応した電話番号によってサービス要求の着信をせ
しめることにより、または情報通知サービスの場合は、
情報通知サービスを行うべき各通知者に応じて各所望の
入力催告メツセージ種別を選定・記憶せしめておくこと
によシ、所望の入力催告メツセージ種別の内容に応じて
所要の音声入力をさせるように制御するものである。
〔発明の実施例〕
以下、本発明の実施例を図に基づいて説明する。
第1図は、本発明に係る音声認識制御方式による音声認
識装置の一実櫂例のブロック図、第2図は、そのフロー
チャートである。
ここで、IA、IBは、発イを鳥(ユーザ)からの音声
入力および認識装置からの合成音声出力に係る電話回線
であって、異なる電話番号のもの、2け、入力音声信号
について利得調整、帯域制限その他所要の前処理を行っ
た後、そのディジタル変換をするとともに、電話回線I
A、IBに関する着信2発信のために所要の機能を果す
入力部、3け、入力されたディジタル音声信号に基づい
て入力音声の音声分析を行い、その特徴データを抽出す
る分析部、4は、所定の音声区間検出用の閾値に従って
入力音声の音声区間の検出処理をする音声区間検出部、
5は、入力音声と各標準音声バタンとのバタンマツチン
グ処理(類似度計算処理)を行う音声認識部、6は、そ
の処理結果によって入力音声に対する各類似度の順位を
判定する判定部、7は、認識対象の各単語について各複
数組の標準音声バタンデータを格納(記憶)している標
準音声バタンメモリ、8は、その選択制御をする標準音
声バタン選郡部、9は、入力音声の分析結果・認識結果
の表示・確認、音声入力指示その他所要の表示・指示に
係る音声合成部、10は、発声者に合わせて、初心者用
、熟練者用の2通りの入力催告メツセージのうち、いず
れかを選択するメツセージ選択部、11は、利用者(ユ
ーザ)に関する通知者メモリ、12は、上記各部に対す
る制御その他所要の処理を行う制御部、13は、音声認
識結果に基づいて所望のサービス処理を行うホスト装置
である。
最初に、この音声認識装置が利用されているサービスシ
ステムにおいて、その情報照会(応答)サービスの制御
・動作について、第1図、第2図(a)に基づいて説明
する。
まず、入力催告メツセージ種別は、例えば初心者、熟練
者用の2種別が用意されているが、それらは、それぞれ
、電話回線IA、IBに対応しているものとする。なお
、上記種別は、実用の場合によって更に多数の内容のも
のを設けるようにしてもよい。
ユーザは、例えば情報応答サービスを受けようとし、そ
の内容要求コード(依頼コード)の入力指示について、
初心者用、熟練者用いずれの入力催告メツセージを希望
するかに応じ、電話回線IAtたはIBに対応する電話
番号をダイヤルする。
それにより、そのユーザの電話機は、電話回線IAまた
はIBに接続され、入力部2は、そのいずれに着信があ
ったかを検出した後、その情報を制御部12へ伝達する
(第2図(a)の処理20A)。
制御部12は、その情報によって以後の入力催告種別(
初心者用、熟練者用の入力催告メツセージのいずれか)
を決定するとともに(同処理21A)、音声入力に対す
る準備を入力部21分析部3゜音声区間検出部4へ指示
する。また、その時に認識対象となるべき単語の分類(
例えば、数字、サービス種別名、物品名、地名等の分類
゛)の標準音声バタンの全組を標準音声バタンメモリ7
から選択するように標準音声バタン選択部8に対して指
示する(同処理22)。
これらの準備が完了すると、発声者に対して音声入力を
促すべき入力催告メツセージ(初心者用。
熟練者のいずれか)を音声合成部9経由で電話回線IA
またはIBから送出せしめる(同処理23)。
これにより、発声者が電話回線IA1たけIBから音声
を入力すると(同処理24)、入力部2は、そのディジ
タル変換等をし、分析部3は、そのディジタル音声信号
について音声分析をして当該特徴データ等の抽出をする
(同処理25)。
音声認識部5ば、入力音声の特徴データと選択されてい
る標準音声バタンデータとの間でバタンマツチング処理
を行い、入力音声に対する上記各標準音声パタンの類似
度を判定部6へ伝える(同処理26)。
判定部6は、類似度が最上位と々る(最も確からしい)
ものを認識結果として制御部12へ伝える(同処理26
)。
入力音声に対して最も確からしい類似度の値が低く、そ
れを認識結果として出力するのけ疑わしいとすべきりジ
エクトの場合には、制御部12は、標準音声バタン選択
部8に対して今までと同一のバタンを選択するように指
示するとともに(同処理30)、音声合成部9経由で電
話回線IAtたはIBから再入力催告メツセージを送出
せしめる(同処理31)。
また、リジェクトでない場合には、制御部12は、その
認識結果が正しいものであるか否かを発声者に確認させ
るだめの表示として、確認要求メツセージを音声合成部
9経由で電話回線IAまたはIBから送出させる(同処
理28)。
発声者は、これを聴取して自己の入力音声について正認
識、誤認識いずれであったかを知り、その確認結果を電
話回線IAまたはIBから入力する(同処理29)。
制御部12は、上記確認情報により、上述の認識候補が
正しいものであるときは、それを認識結果としてホスト
装置13へ送出し、1つの入力音声に対する処理を終了
せしめて次の入力に備える。
一方、誤認識であったという確認情報を受けた場合は、
前述のりジェクトの場合と同様に処理30.31を行わ
せ、これを正認識が得られるまで繰り返して行い、正認
識となったときは、上述と同様に当該認識結果がホスト
装置13へ送出され、一連の処理が終了する。
ここで、初心者用、熟練者用の入力催告メッセ次に、こ
の音声認識装置が利用されているサービスシステムにお
いて、システム側からユーザに対する情報通知サービス
の制御・動作について、第1図、第2図(b)に基づい
て説明する。
まず、このサービスシステムに加入しているユーザに関
して、所定内容の情報通知を行う必要が生ずると、ホス
ト装置13は、その情報通知を行うべきユーザ(以下、
通知者という。)の識別情報(例えば、氏名9氏名コー
ド、電話番号、暗証番号など)を制御部13に対して指
定する(第2図(b)の処理20B)。
制御部12は、上記識別情報に基づいて通知者メモリ1
1から、その通知者の電話番号および入力催告メツセー
ジ種別その他所要の情報を読み取り、入力部2を制御し
て電話回線IA(またはIJ3)経由で当該通知者の電
話機への発信・接続をせしめる。
者用、熟練者用の2種類)に従って処理22以下が行わ
れ、所定の情報通知が行れるが、処理22以下は前述の
第2図(a)の同符号のものと全く同様であるので説明
を省略する。なお、入力催告メツセージの内容例につい
ても画表のものと同様である。
以上の実症例において説明したように、発声者が、音声
認識装置に慣れてない場合と、慣れている場合とで、初
心者用、熟練者の各入力催告メソセニジに従って音声入
力をすることができるので、初心者は懇切な内容で間違
いなく、また、熟練者は簡略な内容で能率的にサービス
を受けることができる。
〔発明の効果〕
以上、詳細に説明したように、本発明によれば、特に初
心者からの音声入力を確実化することによって音声認識
装置の認識率を全体的に向上することができるので、こ
の種のサービスシステムの信頼性、サービス性の向上、
ひいては導入拡大に顕著な効果が得られる。
【図面の簡単な説明】
第1図は、本発明に係る音声認識制御方式による音声認
識装置の一実施例のブロック図、第2図は、そのフロー
チャートである。 1・・・電話回線、2・・・入力部、3・・・分析部、
4・・・音声区間検出部、5・・・音声認識部、6・・
・判定部、7・・・標準音声バタンメモリ、8・・・標
準音声バタン選択部、9・・・音声合成部、10・・・
メツセージ選択部、11・・・通知者メモリ、12・・
・制御部、13・・・ホスト装置。 代理人 弁理士 福田幸作 (ほか1名) 25 第1 目 朱 2  日

Claims (1)

    【特許請求の範囲】
  1. 1、電話回線を通して、入力催告メツセージを送出し、
    それに従って順次に入力される入力音声について、その
    標準音声パタンのうちで類似度が最も確からしいものを
    当該認識結来として判定・出力する機能を有し、情報応
    答・通知サービスシステム用として使用される音声認識
    装置において、入力催告メツセージとして内容が異なる
    所定種別のものを設定しておき、情報応答サービスの場
    合は、所望の人力催告メツセージ種別に対応した電話番
    号によってサービス要求の着信をせしめることにより、
    または情報通知サービスの場合は、情報通知サービスを
    行うべき各通知者に応じて各所望の入力催告メツセージ
    種別を選定・記憶せしめておくことにより、所望の入力
    催告メツセージ種別の内容に応じて所要の音声入力をさ
    せるように制御することを特徴とする音声認識制御方式
JP58017503A 1983-02-07 1983-02-07 音声認識制御方式 Granted JPS59144945A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58017503A JPS59144945A (ja) 1983-02-07 1983-02-07 音声認識制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58017503A JPS59144945A (ja) 1983-02-07 1983-02-07 音声認識制御方式

Publications (2)

Publication Number Publication Date
JPS59144945A true JPS59144945A (ja) 1984-08-20
JPH0516604B2 JPH0516604B2 (ja) 1993-03-04

Family

ID=11945784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58017503A Granted JPS59144945A (ja) 1983-02-07 1983-02-07 音声認識制御方式

Country Status (1)

Country Link
JP (1) JPS59144945A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6239899A (ja) * 1985-08-15 1987-02-20 株式会社東芝 会話音声理解方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59125433A (ja) * 1982-12-30 1984-07-19 Fujitsu Ltd 音声応答方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59125433A (ja) * 1982-12-30 1984-07-19 Fujitsu Ltd 音声応答方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6239899A (ja) * 1985-08-15 1987-02-20 株式会社東芝 会話音声理解方法

Also Published As

Publication number Publication date
JPH0516604B2 (ja) 1993-03-04

Similar Documents

Publication Publication Date Title
US6629071B1 (en) Speech recognition system
JP3168033B2 (ja) 音声テレフォン・ダイヤリング
US6493670B1 (en) Method and apparatus for transmitting DTMF signals employing local speech recognition
EP0592150B1 (en) Speaker verification
US5917889A (en) Capture of alphabetic or alphanumeric character strings in an automated call processing environment
US6744860B1 (en) Methods and apparatus for initiating a voice-dialing operation
US20010056345A1 (en) Method and system for speech recognition of the alphabet
US20050049858A1 (en) Methods and systems for improving alphabetic speech recognition accuracy
US6049768A (en) Speech recognition system with implicit checksum
US20040015353A1 (en) Voice recognition key input wireless terminal, method, and computer readable recording medium therefor
US6845356B1 (en) Processing dual tone multi-frequency signals for use with a natural language understanding system
JPH09326856A (ja) 音声認識応答装置
JPS59144945A (ja) 音声認識制御方式
JP3797497B2 (ja) ページャへのメッセージ作成方式
JP2788658B2 (ja) 音声ダイヤル装置
JPS63142950A (ja) 音声ダイヤル電話方式
KR100214085B1 (ko) 음성 다이얼링 시스템에서 다수의 후보단어를 이용한 음성 다이얼링 방법
JP3314481B2 (ja) 構内交換電話装置
JPS6160055A (ja) 音声認識応答装置
JPS6041863A (ja) プッシュホン音声入力装置
JPH0730629A (ja) 音声ダイヤリング装置
JPS61143798A (ja) 音声ダイヤル装置
JPH1195792A (ja) 音声処理装置および文字入力方法
JPS5988799A (ja) 音声パタン登録方式
JPS604999A (ja) 音声認識方法