JPS60118892A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS60118892A
JPS60118892A JP58225738A JP22573883A JPS60118892A JP S60118892 A JPS60118892 A JP S60118892A JP 58225738 A JP58225738 A JP 58225738A JP 22573883 A JP22573883 A JP 22573883A JP S60118892 A JPS60118892 A JP S60118892A
Authority
JP
Japan
Prior art keywords
voice
recognition
result
code
digit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58225738A
Other languages
English (en)
Inventor
上原 堅助
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP58225738A priority Critical patent/JPS60118892A/ja
Publication of JPS60118892A publication Critical patent/JPS60118892A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、例えば電話回線を利用した音声認識応答シス
テムに使用される音声認識装置に関する。
〔発明の技術的背景とその問題点〕
近年、例えば銀行等のサービス方式として電話回線を利
用した音声認識応答システムが使用されている。このシ
ステムでは、利用者が電話回線を通じて音声によυ情報
を送信し、この送信された情報が音声認識装置で認識さ
れる。そして、音声認識装置の認識結果に応じた応答情
報が、音声応答装置により電話回線を通じて利用者に送
信されるように構成されている。このようなシステムに
よシ、銀行等と利用者間の情報交換が効率的に行なわれ
る。
ところで、上記のようなシステムでは音声認識装置とし
て通常不特定話者単語認識装置が使用され、主として一
連の数字からなる音声コードデータを認識できるように
なっている。この場合、利用者は一連の数字を各桁毎に
区切って発声して入力することになる(例えば「ゼロ」
「イチ」、「ゴ」・・・のように発声する)。ここで、
利用者の発声に対して音声認識装置でコードデータを正
しく認識できない場合、例えば音声応答装置からの応答
(最初から入力して下さい等の応答発声)に応じて利用
者は再度コードデータを発声して入力する必要がある。
また、例えば利用者が発声するコードデータの1桁毎に
音声認識が正しいか否かを確認しながら入力する方式も
ある。この方式では、例えば利用者が発声すると音声応
答装置から「最初の桁は1ですね」のような応答情報が
出力される。これに対して、誤認識がなされた場合、利
用者は「いいえ」と発声すると、音声応答装置から「そ
の桁を入力して下さい」のような応答情報が出力される
。そして、利用者は再度同じ桁の数字を発声する。正し
い認識がなされた場合には、利用者は「はい」と発声す
る。以下同様にして全桁のコードデータに対する処理が
繰返される。
上記のようにして、利用者が発声したコードデータが音
声認識応答システムに入力されることになる。しかしな
がら、音声認識装置で入力に対する誤認識が発生すると
、利用者は再度発声することが必要となるなど修正処理
が非常に煩りしい欠点がある。特に、音声認識応答シス
テムで使用されるコードデータ(具体的には、例えば加
入者コード、物品コード、口座番号等)が多数桁からな
る場合、音声認識装置での認識率が低下するため、シス
テム全体の処理効率が著1−<低下することになる。
〔発明の目的〕
本発明は上記の事情に鑑みてなされたもので、その目的
は、音声認識応答システムにおいて、一連の数字からな
る音声コードデータの音声認識率を向上するようにして
、システム全体の処理効率を大幅に高めることができる
音声認識装置を提供することにある。
〔発明の4翫要〕 本発明では、一連の数字からなる入力音声コードデータ
に対して各桁毎に第1位及び第2位の音声認識結果の候
補を発生する音声認識手段が設けられる。この音声認識
手段は、各候補の類似度の差に応じてその差が小さい順
に該当する桁の第1位と第2位の候補を交換し、その交
換処理以前の音声認識結果を含めて各桁毎に第1位の候
補からなる音声認識結果を出力する。
この出力される音声認識結果は、リプルトメモリに一時
格納される。
コードチェック回路は、予め設定されたコードの規則性
に基づいて、上記リプルトメモリから出力される音声認
識結果に対するコードチェック処理を行なって、そのチ
ェック結果を出力する。このチェック結果に基づいて、
制御手段は上記コードの規則性に合致してしかもリプル
トメモリから出力する順位の早い音声認識結果を入力音
声コードデータに対する答として出力する。
これによp、入力音声コードデータに対する音声認識率
を向上することができ、この音声認識結果を音声応答装
置に供給することにより音声認識応答システム全体の処
理効率を高めることができる。
〔発明の実施例〕
以下図面を参月して本発明の一実施例について説明する
。箪1図は一実施例に係わる音声認識応答システムの構
成を示すブロック図である。
第1図において、音声認識装置10は、例えば不特定話
者単語認識装置を備えており、電話回線11を通じて利
用者から送信される入力音声コードデータ(一連の数字
からなる)CDに対する音声認識処理を行なう。この音
声認識装置10は、入力音声コードデータCDに対して
各桁毎に第1位及び第2位の認識結果の候補を発生する
。さらに、各候補の類似度の差に応じてその差が小さい
順に該当する桁の第1位と第2位の候補間を交換する。
そして、音声認識装置10は交換処理以前の認識結果を
含めて各桁毎に第1位の候補からなる音声認識結果を出
力する。
音声認識装置10から出力される音声認識結果は、リプ
ルトメモリ12に一時格納される。
このリプルトメモリ12は、例えば第2図に示すように
複数桁(例えば6桁)からなる認識結果a−gを後数個
格納する格納エリアを有し、A常RAM(ランダムアク
セスメモリ)からなる。
コードチェック回路13は、リプルトメモリ12から格
納順に出力される認識結果に対して、予め設定されるコ
ードの規則性に応じてコードチェック処理を行なう。具
体的には、例えは認識結果の全桁の加算値の1桁目の数
値(チェックサム)が、予め設定された基準値と一致す
るか否かのチェック処理が行なわれる。このチェック結
果は、通常コンピュータからなる制御装置14へ供給さ
れる。制御装置14は、コードチェック回路13からの
チェック結果に応じて、予め設定されるコードの規則性
に合致しく即ちチェックサムが基準値と一致する)、し
かもリプルトメモリから出力する順位の早い音声認識結
果を上記入力音声コードデータに対する答として出力す
る。音声応答装置15は、制御装置14からの答に対す
る応答処理を行なって、その応答情報を電話回線11を
介して利用者に送信する。
上記のような構成の音声認識応答システムにおいて、一
実施例に係わる動作を説明する。先ず、利用者の操作に
よシシステムに電話回線11が接続されると、制御装置
14は音声応答装置15に対して、最初のメツセージ出
力を行なうための指令信号を出力する。これにょシ、音
声応答装置15は電話回線11を介して、利用者に最初
のメツセージ(例えば、サービスコードを入力しC下さ
い)を送信する。これに対して、利用者は予め決められ
た弓−ドデータ(実施例では6桁の数字列)CDを発声
する。
この発声によシ、6桁の音声コードデータCDが電話回
線11を通じて音声認識装置10へ供給される。
ところで、利用者が発声するコードデータは、予め一定
の規則性を有するように設定される。
即ち、例えば6桁のコードデータにおいて各桁を全て加
算した加算値の1桁目が一定の値(チェックサム)にな
るようなコードデータである。
音声認識装置10では、音声コードデータCDが入力さ
れると、各桁毎の認識結果が発生する。
この認識結果は、類似度の第1位及び第2位の候補から
なυ、各候補毎に類似度値を有している。例えば第3図
に示すように、第1位の候補はIQ、1,1..3’、
4,5Jであシ、その類似度値がそれぞれr510.5
00,510゜500.510,550Jとする。また
、第2位の候補はr7,8−2.5,3.64であシ、
その類似度値がそれぞれr4oo、46o。
480.450,460,500Jとする。通常、類似
度値が高く、第1位と第2位の類似度の差が大きい程第
1位の候補が認識結果として信頼性の冒いものとなる。
音声認識装置10では、先ず第1位の候補からなる認識
結果が第2図に示すリプルトメモリ12のエリアaに出
力される。この場合、第1位の類似度値が極端に低い桁
があるとき、利用者から再度該当する桁の音声入力が行
なわれるように制御装置14が動作する。次に、第1位
と第2位の各候補において、類似度差が小さい順に該当
する桁の第1位と第2位の候補が交換され、第1位の候
補からなる認識結果がリプルトメモリ12の各エリアb
−Hに順次格納される。即ち、例えば類似度差が最も小
さい3桁目の第1位と第2位の候補が交換され、その第
1位の候補からなる6桁の認識結果(0,1,2゜3.
4,5)がリプルトメモリ12のエリアbに格納される
。以下同様にして、第4図に示すような各認識結果&−
gがリプルトメモリ12に格納される。
次に、リプルトメモリ12から格納順に認識結果がコー
ドチェック回路13に与えられる。
コードチェック回路13では、リザルトメモリ12から
の認識結果に対するコードチェック処理が行なわれる。
即ち、コードチェック回路13では、認識結果である6
桁のコードデータに対するチェックサムが算出され、そ
のチェックサムが予め設定された基準値(飼えば5とす
る)に一致するか否かの判定が行なわれる。このチェッ
ク結果が、コードチェック回路13がら:ulJ 1i
111装置14へ送られる。制御装置14では、チェッ
ク、結果に応じてチェックサムが基準値と不一致のl場
合には、その認識結果はリジェクトされる。即ち、リプ
ルトメモリノ2のエリアaに格納された認識結果は、第
4図に示すようにチェックサムが「4」であるだめ基準
値(r5J)と不一致となり、リジェクトされる。そし
て、チェック結果に応じて、チェックサムが基準値と一
致した場合には、その認識結果(リプルトメモリ12の
エリアbに格納されだコードデータ)が答として判断さ
れる。ここで第4図に示すように、リプルトメモリ12
のエリアfに格納された認識結果もエリアbの結果と同
じくチェックサムが「5」であるが、上記のように類似
度差の小さい3桁目の第1位候補を又換したエリアbの
認識結果の方が信頼度が高い。このため、制御装置14
では、チェックサムが基準値と一致し、しかもリプルト
メモリ12の格納順位の早いエリアbの認識結果が答と
して判断される。
制御装置14は、答である認識結果を音声応答装置15
に出力すると共に、音声認識装置10の認識動作を停止
させる。音声応答装置15では、予め記憶した登録情報
に基づいて、制御装置14から送られる認識結果(コー
ドデータ)に対する応答処理が行なわれる。即ち、利用
者からのコードデータCDに対応する応答情報が、電話
回線1ノを通じて送信される。但し、上記認識結果に対
応する応答情報が存在しない場合、再度利用者からコー
ドデータが発声により入力されることになる。
このようにして、利用者が発声する一連の数字からなる
音声コードデータCDに対して、類似度差に応じた複数
の認識結果が作成され、その各認識結果から予め設定さ
れたコードの規則性に一致するか否かの判断にょシ最終
的答が決定される。したがって、最初の認識処理で誤認
識が生じた場合(即ち、類似度差に応じた交換処理以前
の第1位の候補からなる認識結果が誤認識の場合)、コ
ードチェック処理に基づいて自動的にリジェクトされ、
結果的に正しい認識結果に修正されることになる。これ
により、誤認識の発生の場合でも、利用者に対して再度
発声させるなどの煩しい処理を大幅に減少することがで
きる。
なお、上記実施例において、リプルトメモリ12は複数
の認識結果を格納するメモリであるが、これに限ること
なく認識結果を1個のみ格納できるメモリでもよい。但
し、この場合には制御装置14は、コードチェック回路
13がらのチェック結果に応じてリプルトメモリ内の認
識結果が答であるか否かを判定し、リジェクトの場合に
次の認識結果を音声認識装置1oがらリプルトメモリへ
格納させるように制御することが必要となる。
〔発明の効果〕
以上詳述したように本発明によれば、一連の数字からな
る音声コードデータに対してコードの規則性に基づいた
コードチェック処理等を利用することにより、結果的に
音声認識率を向上することができる。したがって、本発
明を音声認識応答システムに適用すれば、入力音声コー
ドデータに対する誤認識が発生した場合でも利用者に再
度発声させるなどの修正処理を大幅に減少することがで
きる。これによシ、音声認識応答システム全体の処理効
率を大幅に高めることができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる音声認識応答システ
ムの構成を示すブロック図、第2図は第1図のリプルト
メモリの構成を示す図、第3図は第1図の音声認識処理
の動作を説明するための認識結果の一例を示す図、第4
図は第1図のリザルトメモリの格納内容の一例を示す図
である。 10・・・音声認識装置、11・・・電話回線、12・
・・リザルトメモリ、13・・・コードチェック回路、
ノ4・・・制御装置、15・・・音声応答装置。

Claims (1)

    【特許請求の範囲】
  1. 一連の数字からなる入力音声コードデータに対して各桁
    毎に第1位及び第2位の音声認識結果の候補を発生し各
    候補の類似度の差が小さい順に該当する桁の7IIrj
    I位と第2位の候補を交換しその交換処理以前の音声認
    識結果を含めて各桁毎に第1位の候補からなる音声認識
    結果を出力する音声認識手段と、この音声認識手段から
    出力される音声認識結果を一時格納するリザルトメモリ
    と、このリザルトメモリから格納順に出力される音声認
    識結果に対して予め設定されたコードの規則性に基づい
    てコードチェック処理を行なってそのチェック結果を出
    力するコードチェック手段と、このコードチェック手段
    のチェック結果に基づいて上記コードの規則性に合致し
    てしかも上記リザルトメモリから出力する順位の早い音
    声認識結果を上記入力音声コードデータに対する答とし
    て出力する制御手段とを具備してなることを特徴とする
    音声認識装置。
JP58225738A 1983-11-30 1983-11-30 音声認識装置 Pending JPS60118892A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58225738A JPS60118892A (ja) 1983-11-30 1983-11-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58225738A JPS60118892A (ja) 1983-11-30 1983-11-30 音声認識装置

Publications (1)

Publication Number Publication Date
JPS60118892A true JPS60118892A (ja) 1985-06-26

Family

ID=16834055

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58225738A Pending JPS60118892A (ja) 1983-11-30 1983-11-30 音声認識装置

Country Status (1)

Country Link
JP (1) JPS60118892A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113093A (ja) * 1997-06-11 1999-01-06 Hitachi Ltd 音声データの認識方法及びその装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH113093A (ja) * 1997-06-11 1999-01-06 Hitachi Ltd 音声データの認識方法及びその装置

Similar Documents

Publication Publication Date Title
USRE38101E1 (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
CA2088080C (en) Automatic speech recognizer
JP3542026B2 (ja) 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
JP2007233412A (ja) ユーザが定義したフレーズの話者に依存しない認識方法及びシステム
JPH01167898A (ja) 音声認識装置
US6260014B1 (en) Specific task composite acoustic models
US7509257B2 (en) Method and apparatus for adapting reference templates
US6499012B1 (en) Method and apparatus for hierarchical training of speech models for use in speaker verification
US4860358A (en) Speech recognition arrangement with preselection
US4790017A (en) Speech processing feature generation arrangement
JPS60118892A (ja) 音声認識装置
JPS60118893A (ja) 音声認識装置
JPS63186298A (ja) 単語音声認識装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPS6052440B2 (ja) 音声認識装置
AU657064B2 (en) Speech recognition system
JP2002196789A (ja) 音声対話装置
JPS6312000A (ja) 音声認識装置
JPS59111698A (ja) 音声認識方式
JPH103296A (ja) 音声認識システムにおける単語予備選択装置
JPS58159598A (ja) 単音節音声認識方式
JPH04301695A (ja) 音声認識装置の辞書制御方式
JP2000242292A (ja) 音声認識方法、この方法を実施する装置およびこの方法を実行するプログラムを記憶した記憶媒体
JPS6073592A (ja) 特定話者用音声認識装置
JPS6039692A (ja) 単語音声認識方法