JPH06266388A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH06266388A
JPH06266388A JP5081093A JP8109393A JPH06266388A JP H06266388 A JPH06266388 A JP H06266388A JP 5081093 A JP5081093 A JP 5081093A JP 8109393 A JP8109393 A JP 8109393A JP H06266388 A JPH06266388 A JP H06266388A
Authority
JP
Japan
Prior art keywords
weighting
voice
weighting coefficient
voice recognition
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5081093A
Other languages
English (en)
Inventor
Yoshiki Kichise
美喜 吉瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5081093A priority Critical patent/JPH06266388A/ja
Publication of JPH06266388A publication Critical patent/JPH06266388A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 複数の標準パタンを必要とせず、音声品質が
異なる音声に対しても認識できる音声認識装置を提供す
る。 【構成】 標準パタン記憶部3にある標準パタンは、重
み付け係数記憶部4に格納されている重み付け係数に基
づき、重み付け処理部5で重み付け処理されて重み付け
標準パタンとなり、入力された音声が音声分析部2によ
り分析処理された音声パタンと音声認識部6により比較
認識される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置に関し、
特に重み付け係数に基づき標準パタンに対して重み付け
処理を行うことによって複数の異なる標準パタンを導出
する音声認識装置に関するものである。
【0002】
【従来の技術】一般的な音声認識装置は、基準となる音
声の各種特徴部分を分析した標準パタンを備えておき、
これと入力された音声を同様に分析した音声パタンとを
比較し認識判定するものであり、標準パタンと音声パタ
ンとの類似認識の判定方法として、両パタンの類似性を
定量的に示す類似度値、例えば認識判定距離を算出し、
これが所定の基準値以下である場合、両者は類似してい
ると判定する方法が採用されている。
【0003】ここで、このような音声認識装置において
標準パタンを入力する場合、専用の音声入力装置を用い
て予め標準パタンを入力し、あるいは電話機等に組み込
まれている場合にはマイクや受話器から任意に標準パタ
ンを入力するものであり、このようにして作成された標
準パタンを用いた場合には、変質した音声に対する音声
認識の認識精度は満足できるものではなく、特に伝送損
失により音声が劣化する傾向のある内線あるいは局線か
らの音声に対する認識精度はさらに低下する。
【0004】従来、このような問題を解決する方法とし
て、特に複数の標準パターンを予め備えておき、接続さ
れる電話端末に応じて適当な標準パタンを選択して音声
認識処理を行うものが提案されている(例えば、特開昭
63−121097号公報)。図2は、複数の標準パタ
ンを備える音声認識装置のブロック図であり、同図にお
いて、21,22は電話端末、23は交換機、24は音
声認識処理の対象となる電話端末に応じて適切な標準パ
タンを選択するための対応テーブル、25は予め複数設
けられている標準パタン群、26は選択された標準パタ
ンに応じて音声認識を行う音声認識部である。
【0005】今、電話端末21からの音声認識要求に応
じて、交換機23は電話端末21を音声認識部26に接
続するとともに、接続した電話端末が電話端末21であ
ることを対応テーブル24に出力する。対応テーブル2
4には、各電話端末と、その電話端末から送られてくる
音声に対する最も認識効率の良い標準パタンとの対応関
係が予め記憶されており、交換機23からの電話端末情
報に応じて複数の標準パタン群25の内から所定の標準
パタンを選択する。音声認識部26では、選択された標
準パタンと電話端末21からの音声を分析した音声パタ
ンとから算出される類似度値により認識判定を行うこと
により、認識効率の良い音声認識処理が実現される。
【0006】
【発明が解決しようとする課題】従って、このような従
来の音声認識装置では、各電話端末に対して適切な標準
パタンを複数設ける必要があり、同じ標準パタンを複数
の電話端末が兼用でき得るとしても、収容する電話端末
あるいは局線が多数ある場合には、このような時系列デ
ータである標準パタンを記憶するためのメモリが増大す
るとともに、個々に標準パタン登録処理が必要となり、
実際には対応不可能となるという問題点があった。本発
明はこのような課題を解決するためのものであり、複数
の標準パタンを格納するメモリを必要とせず、品質の異
なる音声に対して安定して認識できる音声認識装置を提
供することを目的としている。
【0007】
【課題を解決するための手段】このような目的を達成す
るために、本発明による音声認識装置は、各特徴パラメ
ータの重み付けを示す重み付け係数を複数記憶する記憶
手段と、所定の重み付け係数に基づき標準パタンに対し
て重み付けを行うことによって異なる標準パタンを出力
する重み付け処理手段とを備えるものである。
【0008】また、さらに音声認識の結果に対する正誤
を検出する検出手段と、この検出手段の正解の検出出力
に応じて現在の重み付け係数を調整して同じ音声パタン
に対して繰り返し認識処理することにより音声認識部か
ら出力される類似度値が最小となる重み付け係数を導出
するとともに、この重み付け係数に基づき以後の一連の
音声認識処理を制御する制御手段とを備えたものであ
る。
【0009】
【作用】従って、所定の重み付け係数に基づき標準パタ
ンから異なる標準パタンが導出され、音声認識部におい
て入力音声が分析された音声パタンと比較され認識処理
が行われる。
【0010】また、選択された重み付け係数による認識
が成功した場合には、その入力音声に対してさらに適切
な標準パタンを導出するための重み付け係数が求めら
れ、以後の一連の認識処理に用いられる。
【0011】
【実施例】次に、本発明について図面を参照して説明す
る。図1は本発明の一実施例である音声認識装置を利用
した音声電話案内装置のブロック図である。ここでいう
音声電話案内装置とは、音声で相手先の名前を入力する
ことにより所望の相手電話番号を問い合わせることがで
きるものであり、この場合装置は電話端末と局線間に設
置されている。
【0012】同図において、1は電話端末13が接続さ
れる電話機インターフェース部、10は回線12が収容
される局線インターフェース部、2は電話機インターフ
ェース部1および局線インターフェース部10から入力
される音声に対して前処理や各種音響分析を行いその特
徴パラメータを音声パタンとして出力する音声分析部で
ある。
【0013】また、3は認識処理の基準となる音声を各
種音響分析して得た標準パタンが格納されている標準パ
タン記憶部、4は標準パタンに対する複数の重み付け係
数と各重み付け係数毎の使用頻度を記憶する重み付け係
数記憶部、5は所定の重み付け係数に基づき標準パタン
記憶部3から読み出した標準パタンに対して重み付け処
理を行う重み付け処理部、6は重み付け処理部5から出
力される重み付け標準パタンと、音声分析部2から出力
される音声パタンとの類似性を示す認識判定距離を算出
することにより認識判定する音声認識部である。
【0014】また、9は重み付け係数記憶部4から読み
出した所定の重み付け係数に基づく重み付け処理部5へ
の重み付け標準パタン導出の指示や、現在の重み付け係
数の最適化処理等、音声電話案内装置全体の制御を行う
制御部、7は制御回路9の制御により所定のガイドメッ
セージを出力する音声合成部、8は相手先の電話番号が
格納されている電話番号記憶部、11は制御回路部9の
制御により局線12を音声認識装置側と電話端末13側
とに切替接続する局線切替スイッチである。
【0015】なお、標準パタンは基準とする音声につい
て予め各種音響分析を行いその特徴パラメータの時系列
変化を示すデータであり、また重み付け係数はこの標準
パタンを構成する各特徴パラメータについて個々に重み
付けするための係数データである。従って、標準パタン
の各特徴パラメータに対して異なる重み付け係数に基づ
き個々に重み付け処理することにより、1種類の標準パ
タンから複数種類の標準パタン、すなわち入力された個
々の音声を認識処理するのに最適な標準パタンを導出す
ることが可能となる。
【0016】次に本発明の動作として、電話端末13か
らの音声に応じて電話番号を返答する場合の動作につい
て、図1を参照して説明する。まず、電話端末13の回
線捕捉に応じて、電話機インターフェース部1は電話端
末13からのダイヤル信号を検出する。ここで、電話機
インターフェース部1により電話端末13からのダイヤ
ル信号が検出された場合には、制御部9に対してダイヤ
ル検出信号を出力し、これに応じて制御部9はこの音声
認識装置の動作モードを電話モードとし、局線切替スイ
ッチ11を制御して局線12を局線インターフェース部
10側から電話端末13側に直ちに接続し、電話機イン
ターフェース部1からの終話検出信号に応じて、局線切
替スイッチ11を局線インターフェース部10側に切替
制御した後、この音声電話案内装置を通常モードすなわ
ち発信および着信待ちの状態に戻す。
【0017】また、電話端末13からダイヤル信号では
なく音声電話案内を要求する「電話帳」が出力された場
合、電話機インターフェース部1は何かの音声信号が検
出されたとして、制御部9に対して音声入力信号を出力
するとともに、この音声を音声分析部2へ出力する。こ
れに応じて音声分析部2はこの音声を分析し、分析結果
を音声パタンとして音声認識部6に出力する。一方、制
御部9は音声入力信号に応じてこの音声電話案内装置の
動作モードを電話帳モードにするとともに、重み付け係
数記憶部4から所定の重み付け係数、例えば最も使用頻
度の高い重み付け係数を読み取り、重み付け処理部5へ
転送し重み付け処理を指示する。
【0018】重み付け処理部5は、入力された重み付け
係数に基づき、標準パタン記憶部3から読み取った標準
パタンを重み付け処理する。今、時系列で変化する複数
の特徴パラメータで構成される標準パタンのうち、時間
tにおけるn番目の特徴パラメータをT(n,t)、あ
る重み付け係数のうちn番目の特徴パラメータに対する
係数をW(n)とすると、これらの特徴パラメータおよ
び係数に基づく重み付け処理により導出される時間tの
n番目の特徴パラメータT’(n,t)は、 T’(n,t)=T(n,t)・W(n) となり、これを標準パタンの全特徴パラメータについて
処理することによって、新たな標準パタンすなわち重み
付け標準パタンが導出される。
【0019】次に、音声認識部6では、音声分析部2か
らの音声パタンと、重み付け処理部5で導出された重み
付け標準パタンとを比較することにより認識処理し、そ
の認識結果として認識した内容と認識尺度となる認識判
定距離を出力する。制御部9はこの認識結果に応じて、
音声合成部7および電話機インターフェース部1を制御
して、電話端末13に対し、認識結果の正誤を確認する
メッセージ、例えば「電話帳ですね。正しければ#、誤
りのときは*を入力してください。」というメッセージ
を送出する。
【0020】ここで、この認識結果が正しく電話端末1
3より「#」が送出された場合、制御部9は電話機イン
ターフェース部1を介してこれを検出した後、先に受信
し分析した音声パタンに対する重み付け係数の最適化処
理をおこなう。すなわち、現在使用している重み付け係
数を若干づつ調整し、あるいは重み付け係数記憶部4に
記憶されている他の重み付け係数を読み出し、これに基
づく重み付け処理を行った標準パタンと元の同じ音声パ
タンとにより前述の音声認識処理を繰り返し行い、その
認識判定距離が最小になった最適な重み付け係数を導出
するものである。この後、制御部9は重み付け係数記憶
部4に格納されている複数の重み付け係数のうち、その
使用頻度が最も低いものを消去し、新たに導出した重み
付け係数を格納するとともに、以降入力された音声に対
する認識処理はこの重み付け係数に基づき実施される。
【0021】次に制御部9は、音声合成部7および電話
機インターフェース部1を制御して、使用者が電話番号
を調べたい相手の名前の入力を促すガイドメッセージを
電話端末13に送出し、これに応じて入力された音声に
対して、重み付け係数最適化処理により導出した重み付
け係数により認識処理し、認識した相手先名に対応する
電話番号を電話番号記憶部8から読み出し、これに応じ
て音声合成部7および電話機インターフェース部1を制
御して、応答メッセージとして電話端末13に送出す
る。電話機インターフェース部1による電話端末13の
終話検出に応じて、制御部9はこの音声電話案内装置を
通常モードに戻す。
【0022】
【発明の効果】以上説明したように、本発明は、標準パ
タンおよび重み付け係数を設けて、標準パタンから複数
の異なる標準パタンを導出するようにしたので、音声認
識の基準となる標準パタンを音声の入力系統毎に多数設
ける必要がなくなる。また、音声認識動作によりこの重
み付け係数を自動的に最適化するようにしたので、入力
系統の違いにより音声信号が変化しても的確に対応で
き、さらにその音声認識の精度は繰り返し使用する毎に
向上するものとなる。従って、音声認識装置において、
時系列データである膨大な標準パタン用のメモリを軽減
し、かつ複数の標準パタンを備えることが可能となり、
さらに音声信号の変化に対応でき、使用に応じてさらに
安定した音声認識動作が得られるという格別な効果を奏
するものである。
【図面の簡単な説明】
【図1】本発明の一実施例による電話案内装置のブロッ
ク図である。
【図2】従来の音声認識装置のブロック図である。
【符号の説明】
1 電話機インターフェース部 2 音声分析部 3 標準パタン記憶部 4 重み付け係数記憶部 5 重み付け処理部 6 音声認識部 7 音声合成部 8 電話番号記憶部 9 制御部 10 局線インターフェース部 11 局線切替スイッチ 12 局線 13 電話端末

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 基準となる音声の各種特徴を示す特徴パ
    ラメータの時系列データから構成される標準パタンを予
    め記憶しておき、音声認識部によりこの標準パタンと入
    力された音声信号を分析して得た音声パタンとの類似度
    値を算出し、基準値内の類似度値が得られた場合に認識
    処理の結果を出力する音声認識装置において、 前記各特徴パラメータの重み付けを示す重み付け係数を
    複数記憶する記憶手段と、所定の前記重み付け係数に基
    づき標準パタンに対して重み付けを行うことによって異
    なる標準パタンを出力する重み付け処理手段とを備えた
    ことを特徴とする音声認識装置。
  2. 【請求項2】 請求項1の音声認識装置において、 音声認識の結果に対する正誤を検出する検出手段と、こ
    の検出手段の正解の検出出力に応じて現在の重み付け係
    数を調整して同じ音声パタンに対して繰り返し認識処理
    することにより前記音声認識部から出力される類似度値
    が最小となる重み付け係数を導出するとともに、この重
    み付け係数に基づき以後の一連の音声認識処理を制御す
    る制御手段とを備えたことを特徴とする音声認識装置。
JP5081093A 1993-03-17 1993-03-17 音声認識装置 Pending JPH06266388A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5081093A JPH06266388A (ja) 1993-03-17 1993-03-17 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5081093A JPH06266388A (ja) 1993-03-17 1993-03-17 音声認識装置

Publications (1)

Publication Number Publication Date
JPH06266388A true JPH06266388A (ja) 1994-09-22

Family

ID=13736781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5081093A Pending JPH06266388A (ja) 1993-03-17 1993-03-17 音声認識装置

Country Status (1)

Country Link
JP (1) JPH06266388A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099076A (ja) * 1998-09-25 2000-04-07 Fujitsu Ltd 音声認識を活用した実行環境設定装置及び方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60100197A (ja) * 1983-11-07 1985-06-04 日本電気株式会社 音声入力装置
JPS6458519A (en) * 1987-08-31 1989-03-06 Toshiba Corp Mold apparatus for injection molding
JPH04260923A (ja) * 1990-10-15 1992-09-16 Fuji Xerox Co Ltd パターン生成方法
JPH04264596A (ja) * 1991-02-20 1992-09-21 N T T Data Tsushin Kk 雑音下音声認識方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60100197A (ja) * 1983-11-07 1985-06-04 日本電気株式会社 音声入力装置
JPS6458519A (en) * 1987-08-31 1989-03-06 Toshiba Corp Mold apparatus for injection molding
JPH04260923A (ja) * 1990-10-15 1992-09-16 Fuji Xerox Co Ltd パターン生成方法
JPH04264596A (ja) * 1991-02-20 1992-09-21 N T T Data Tsushin Kk 雑音下音声認識方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099076A (ja) * 1998-09-25 2000-04-07 Fujitsu Ltd 音声認識を活用した実行環境設定装置及び方法

Similar Documents

Publication Publication Date Title
US5594784A (en) Apparatus and method for transparent telephony utilizing speech-based signaling for initiating and handling calls
JPS62163445A (ja) 電話切換装置
JPH0685893A (ja) 音声テレフォン・ダイヤリング
US5524139A (en) System for automatic access to automated telephonic information services
US6522725B2 (en) Speech recognition system capable of flexibly changing speech recognizing function without deteriorating quality of recognition result
JPH1063293A (ja) 電話音声認識装置
US9165557B2 (en) Voice recognizing apparatus, voice recognizing method, and program for recognizing voice
EP1185976B1 (en) Speech recognition device with reference transformation means
JPH06266388A (ja) 音声認識装置
MXPA02002812A (es) Metodo y dispositivo para distinguir entre conversacion de voz y reconocimiento automatico.
US6229881B1 (en) Method and apparatus to provide enhanced speech recognition in a communication network
JPH09326856A (ja) 音声認識応答装置
US7203650B2 (en) Telecommunication system, speech recognizer, and terminal, and method for adjusting capacity for vocal commanding
JP2000010590A (ja) 音声認識装置およびその制御方法
JP2001086243A (ja) 音声応答方法及び装置及び音声応答プログラムを格納した記憶媒体
JPH10290294A (ja) 携帯電話における別番号提供装置および方法
JPH03122696A (ja) 音声認識装置
JPH039648A (ja) 情報案内システム
JP2000125006A (ja) 音声認識装置、音声認識方法、及び電話自動応答装置
US5872839A (en) Office line selecting technique of a telephone switching system
JPS61143798A (ja) 音声ダイヤル装置
JPS60233972A (ja) 音声認識構内交換機
JPH03157696A (ja) 音声応答認識方式
JPH05308402A (ja) 音声認識アダプタ
KR19990055977A (ko) 사설교환기에서 우선순위에 따른 착신호 전환 방법

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees