JPS6329276B2 - - Google Patents

Info

Publication number
JPS6329276B2
JPS6329276B2 JP55116672A JP11667280A JPS6329276B2 JP S6329276 B2 JPS6329276 B2 JP S6329276B2 JP 55116672 A JP55116672 A JP 55116672A JP 11667280 A JP11667280 A JP 11667280A JP S6329276 B2 JPS6329276 B2 JP S6329276B2
Authority
JP
Japan
Prior art keywords
standard
pattern
recognition
speech
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55116672A
Other languages
English (en)
Other versions
JPS5741700A (en
Inventor
Juji Kijima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP55116672A priority Critical patent/JPS5741700A/ja
Publication of JPS5741700A publication Critical patent/JPS5741700A/ja
Publication of JPS6329276B2 publication Critical patent/JPS6329276B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 本発明は入力された音声信号から音声特徴を抽
出し、標準辞書からの標準音声に対する音声特徴
と比較して音声認識を行なう音声認識処理装置に
係り、予じめ特定利用者に対する特定利用者標準
辞書を作る事なしに通常の音声認識処理過程で標
準辞書に対して特定利用者標準辞書を追加する事
を可能とした音声認識処理装置に関するものであ
る。
一般に不特定利用者(認識対象者が定められて
いない事。)の音声認識装置においては認識対象
カテゴリの各々に複数の標準音声パターンを用意
し、入力音声パターンと、それぞれの標準パター
ンとの類似性を評価することにより、最も類似度
の高い標準パターンを持つカテゴリを回答する事
が行なわれている。
一方特定利用者(認識対象者が定められている
場合)の場合には予じめ利用者の音声を用いて認
識カテゴリの音声パターン(各カテゴリに1つま
たは複数)を標準パターンとして登録し、上記不
特定話者の場合と同様に処理する方法も知られて
いる。一般に、同じカテゴリが発生された場合で
も利用者によつてその音声パターンによつてかな
り違いがある為、不特定利用者用に用意された標
準パターン群よりも、利用者本人の音声を登録し
た標準パターン群を用いる方が高い認識率を得る
事が出来る。
しかしながらこの特定利用者の場合には上述の
標準パターンを予じめ登録する必要があるため、
多数の利用者がある場合には、それぞれの音声パ
ターンを全て記憶しておくと厖大な記録領域が必
要であり、かつ対応利用者の音声パターンを選ん
でくる手段が必要となる。
また、同一人物でも健康状態の違いや時間の経
過によつて音声パターンが変化する為、適宜、再
登録する必要がある。
これらの問題を解決する為には、利用者が毎回
の利用の度に、標準音声パターンの登録から始め
ることにすればよいか、1回の利用で発声する語
数が少ない場合でも、認識対象単語を全て登録す
るなど、煩雑になる。
例えば、次のような状況を考える。
銀行預金残高の照会を電話を通じて行なうシス
テムがあるとする。利用者は、照会専用の番号に
電話をかけて、暗照番号、口座番号等を言う。シ
ステムはそれを認識して確認し、残高を答える。
この場合、まえもつて標準音声パターンを登録す
るシステムを考えると、 Γ利用者は口座を持つ者に限られるから、登録し
ておくことは可能であるが、通常多数であるた
め、全ての音声パターンを記憶しておくと厖大
な記憶容量が必要となる。
Γ電話を通じての利用の為、既に登録してある音
声パターンを利用しようにも、誰の音声パター
ンを用いればよいのかわからない。
Γある程度の期間毎に音声パターンを再登録に行
く必要があり、またカゼをひいていたりすると
利用できないこともある。
また電話をかけてまず最初に登録を行なうこと
にすると、数ケタの番号を認識させる為に0〜9
の10数字の標準音声パターンを登録することにな
り、煩雑である。
従つて誰が利用するかわからず多数の人が利用
し、かつ1人1人の利用頻度が高くなく、さらに
1回の利用が短時間であるような場合には、まえ
もつて登録を行なわずに利用できる方がよいが前
述のように利用者自身の音声パターンを標準パタ
ーンとして持つ方が、より高い認識率を得ること
ができる。
従つて本発明では上記相反する問題を解決し利
用者が事前に音声パターンを標準パターンとして
登録しなくても高い認識率を得る事が出来る音声
認識処理方式を提供する事を目的とするものでこ
の目的は利用者から入力された音声信号の音声パ
ターンと標準辞書に格納された標準音声パターン
とを比較して当該入力音声パターンを認識する音
声認識処理方式において、上記利用者から入力さ
れた音声信号の音声パターンと上記標準辞書に格
納された標準音声パターンとの類似度を記憶する
記憶手段と、該記憶手段に記憶された各標準音声
パターンに対応した類似度を参照しながら類似度
の高い順に標準音声パターンに対応した音声を順
次認識結果の候補として出力する判定部よりなり
該判定部より出力された認識結果の候補より上記
利用者が正解を選び該正解とした時点の認識結果
の候補を認識結果として出力するとともに該認識
結果を得た時点の対応標準音声パターンと上記入
力音声パターンと上記入力音声パターンの類似度
が予じめ決められた閾値以下の場合に当該入力音
声パターンを認識結果に対応する標準音声パター
ンとして上記標準辞書に追加するようにした事を
特徴とする音声認識処理装置により達成する事が
出来る。
以下本発明を図面を参照しながら説明する。
第1図は本発明の音声認識処理装置の一実施例
である。図において1は入力部、2は入力音声パ
ターン記憶部、3は類似度計算部、4は類似度記
憶部、5は判定部、6は応答部、7は正誤認識用
単語標準音声パターン記憶部、8は認識対象単語
標準音声パターン記憶部、9は標準パターン追
加・削除決定部、10は認識対象単語不特定話者
用標準音声パターン記憶部をそれぞれ示す。
本発明の音声認識処理方式において、音声認識
を開始する前に不特定話者用の標準パターン群1
0より認識対象単語に対する標準パターンを標準
パターン記憶部8にコピーする。
以下本発明を前記電話による預金残高照会を例
にとつて説明する。
まず音声認識装置には不特定話者用の標準パタ
ーンが記憶部8に格納されている。
また正誤確認用パターン記憶部7には利用者か
らの返答「はい」、「いいえ」または「そうです」
「違います」等、正否を表わす2種類の単語で、
誰が発声しても、高い正解率で識別出来るものを
選んで決めて記憶しておくか、または予じめこの
2種類の単語だけを利用の最初に登録するように
する。
以下、簡単の為、利用者の口座番号を1ケタず
つ発声し、1ケタ毎に認識する場合を例に説明す
る。まず利用者が数字の「8」を発声したとす
る。この「8」は入力部1により入力され入力音
声パターン記憶部2に記憶される。
この記憶部2に記憶された入力音声は特徴パタ
ーンを抽出された標準パターン記憶部8の標準パ
ターンと類似度計算部3により順次標準パターン
と入力音声の特徴パターンとの類似度が計算され
類似度記憶部4に記憶される。
この類似度計算部は動的計画法(DP)がよく
知られている。このようにして計算された類似度
より判定部5により一番類似度の高いものを応答
部を介して利用者に回答する。
もし一番類似度の高いパターンが「8」のカテ
ゴリパターンであれば上記回答として「8です
ね」と回答する。
利用者は「はい」あるいは「そうです」等正し
く認識された事を伝える為に上述したように予じ
め決められている言葉で返答する。このように返
答された音声は再び入力部1を介して入力音声パ
ターン記憶部2に記憶されるとともに正誤認識用
のパターン記憶部7に記憶された標準パターンと
類似度が計算されその結果正解という事であれば
判定部により得られた答を正解として認識結果を
出力する。
また類似度記憶部4の内容は標準パターン追
加・削除決定部9に送られ前述の「8」のカテゴ
リ中で入力音声のパターンとの類似度が一番高い
標準パターン8の類似度が予じめ決められた値
(追加決定の為の閾値)より小さければ入力パタ
ーンを「8」の標準パターン群8に追加し、逆に
「8」以外のカテゴリ中の標準パターンのうち、
入力音声パターンとの類似度があらかじめ決めら
れた値(削除決定の為の閾値)より大きいものが
あれば標準パターン群8より削除する。
このように第1の発声音に対する認識結果が正
しいかつた場合は以上の処理で終了する。
しかしながら認識を誤まつた場合、第1発声音
「8」に対して一番類似度の高いパターンが「8」
以外の他のカテゴリ、例えば「1」のカテゴリパ
ターンであつたとする。
従つて判定部5においては応答部6を介して利
用者に「1ですね」と聞き返すが、利用者は上記
と同様「いいえ」あるいは「違います」等の誤認
識であることを伝える予じめ決められた単語で返
答する。
これに対して音声装置側においては正誤確認用
パターン記憶部7と入力音声パターン記憶部2と
により誤認識である事を認識し、その結果判定部
5により今答として出力したパターンを除いて、
類似度の高いパターンを持つカテゴリを探し、こ
れが例えば「6」であれば応答部6を介して利用
者に「6ですか」と聞き直す。
これを繰り返して、最終的に正解を得た時点
で、上記正解の場合と同様の処理を行なう。(最
悪の場合には0〜9)の10数字全てを聞き返すこ
とになるが、もちろん途中で再度利用者に発声し
直してもらつてもよい。) このように本発明においては、利用者の音声認
識を認識結果を確認しながら行なうことが出来る
とともに利用者の音声パターンにより順次標次標
準パターンを追加・削除するため、最初に不特定
話者用の標準パターンを格納しておくだけで、認
識を続けて行く間に高い認識率を得る事が可能と
なる。
【図面の簡単な説明】
第1図は本発明の音声認識処理装置の一実施例
である。 図において1は入力部、2は入力音声パターン
記憶部、3は類似度計算部、4は類似度記憶部、
5は判定部、6は応答部、7は正誤認識用単語標
準音声パターン記憶部、8は認識対象単語標準音
声パターン記憶部、9は標準パターン追加・削除
決定部、10は認識対象単語不特定話者用標準音
声パターン記憶部をそれぞれ示す。

Claims (1)

    【特許請求の範囲】
  1. 1 利用者から入力された音声信号の音声パター
    ンと標準辞書に格納された標準音声パターンとを
    比較して当該入力音声パターンを認識する音声認
    識処理方式において、上記利用者から入力された
    音声パターンと上記標準辞書に格納された標準音
    声パターンとの類似度を記憶する記憶手段と、該
    記憶手段に記憶された各標準音声パターンに対応
    した類似度を参照しながら類似度の高い順に標準
    音声パターンに対応した音声を順次認識結果の候
    補として出力する判定部よりなり該判定部より出
    力された認識結果の候補より上記利用者が正解を
    選ぶ手段と、該正解とした時点の認識結果の候補
    を認識結果として出力する手段と、該認識結果を
    得た時点の対応標準音声パターンと上記入力音声
    パターンの類似度が予じめ決められた閾値と比較
    する手段と、当該入力音声パターンを認識結果に
    対応する標準音声パターンとして上記標準辞書に
    追加する手段を備えたことを特徴とする音声認識
    処理装置。
JP55116672A 1980-08-25 1980-08-25 Voice recognition processing system Granted JPS5741700A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP55116672A JPS5741700A (en) 1980-08-25 1980-08-25 Voice recognition processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP55116672A JPS5741700A (en) 1980-08-25 1980-08-25 Voice recognition processing system

Publications (2)

Publication Number Publication Date
JPS5741700A JPS5741700A (en) 1982-03-08
JPS6329276B2 true JPS6329276B2 (ja) 1988-06-13

Family

ID=14693030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP55116672A Granted JPS5741700A (en) 1980-08-25 1980-08-25 Voice recognition processing system

Country Status (1)

Country Link
JP (1) JPS5741700A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0314969U (ja) * 1989-06-27 1991-02-14

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0314969U (ja) * 1989-06-27 1991-02-14

Also Published As

Publication number Publication date
JPS5741700A (en) 1982-03-08

Similar Documents

Publication Publication Date Title
US6219407B1 (en) Apparatus and method for improved digit recognition and caller identification in telephone mail messaging
US7603279B2 (en) Grammar update system and method for speech recognition
CA2088080C (en) Automatic speech recognizer
JP3703991B2 (ja) 自由音声評点法を用いた動的音声認識の方法および装置
US5146503A (en) Speech recognition
JPS6329276B2 (ja)
JPH0225517B2 (ja)
JPS6312312B2 (ja)
JP3835032B2 (ja) 利用者照合装置
JPH09114493A (ja) 対話制御装置
JPS645320B2 (ja)
JPS6052440B2 (ja) 音声認識装置
JPS61175696A (ja) 情報処理方法
JP2864511B2 (ja) 話者識別方式と装置
JPH0150920B2 (ja)
JPS60107192A (ja) パタ−ン認識装置
KR0173914B1 (ko) 음성 다이얼링 시스템에서의 명칭 검색 방법
CN115312066A (zh) 对文本识别说话者和训练说话者识别模型的方法和装置
JPH10105190A (ja) データベースへの照会を実施する方法
JPS60260095A (ja) 音声認識装置
JPS6344239B2 (ja)
JPS5968794A (ja) 単語音声認識方法
JPH0567240B2 (ja)
JPS5952300A (ja) 電話入力音声認識方式
JPH05313692A (ja) 音声認識装置