JPS6170598A - 電話入力音声認識装置 - Google Patents

電話入力音声認識装置

Info

Publication number
JPS6170598A
JPS6170598A JP59191713A JP19171384A JPS6170598A JP S6170598 A JPS6170598 A JP S6170598A JP 59191713 A JP59191713 A JP 59191713A JP 19171384 A JP19171384 A JP 19171384A JP S6170598 A JPS6170598 A JP S6170598A
Authority
JP
Japan
Prior art keywords
voice
signal
speech
terminal
amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59191713A
Other languages
English (en)
Inventor
俊宏 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi High Tech Corp
Original Assignee
Hitachi Electronics Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Electronics Engineering Co Ltd filed Critical Hitachi Electronics Engineering Co Ltd
Priority to JP59191713A priority Critical patent/JPS6170598A/ja
Publication of JPS6170598A publication Critical patent/JPS6170598A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、電話回線を通して入力される特定者の音声
を認識する装置に関し、特に各特定者に対応した最適な
条件で該装置を起動させることにより正確に音声の認識
を行なうことができるようにしたものに関する。
〔従来の技術〕
マン・マシン・インターフェース改善の一つとして、音
声認識装置が近年実用化の段階に移行しつつあるが、そ
の応用例の一つに電話回線を使っ定の加入者(預金者等
)を呼出し、呼出された相手から電話回線を通してセン
ター側に入力される音声を音声認識装置を用いて認識す
ることによりその相手が加入者本人であるか否かを判断
し、本人であることが確認されればセンター側から電話
回線を通しズ端末側のその加入者に所定のサービス(預
金口座への振込通知等)を行なうというものである。
このような音声認識装置は、電話回線を通して信号が入
力されると、電話回線を通過した際の損失を補償するた
めに所定の増幅度で入力信号の増幅を行なう。次に、所
定の閾値を基準として、増幅された前記入力信号から音
声信号とみなされる信号区間を検出する。検出された音
声信号については、フィルタを用いてスペクトル分析を
行なうことによりそのスペクトルデータを求める。そし
て、所定の多数の語についての標準パターンと該スペク
トルデータとを逐次比較演算して各標準パターンと該ス
ペクトルデータの類似度を求めるとともに、最も類似度
の大きい標準パターンを選択し、選択された標準パター
ンに対応する語を示すデータを音声認識データ(入力音
声から認識した語 肪を示すデータ)として出力するのである。
〔発明が解決しようとする問題点〕
ところで、端末側から電話回線を通してセンター側に入
力される音声信号の電話回線による損失の度合いは、各
端末側からセンター側までの距離の相違に応じて端末毎
にまちまちである。しかるに、従来の音声認識装置では
、各端末毎の損失の度合いに個別に対応して入力信号の
増幅度を決定することが行なわれていなかった。そのた
め、増幅度が大きすぎて、音声信号とノイズとを区別す
るための基準となる前記閾値以上の範囲のものの中にノ
イズが含まれたり、逆に増幅度が小さすぎて、前記閾値
未満の範囲のものの中に音声信号が含まれたりして、音
声区間の検出が不正確に行なわれることがあった。
また、入力されるノイズの大きさは各端末の設置されて
いる周囲の環境(静かな場所か、騒音の大きい場所か)
等の相違によりまちまちであるが、従来の音声認識装置
では、音声信号とノイズとを区別するための基準となる
前記閾値の決定に関しても、各端末毎のノイズの大きさ
に個別に対応した決定が行なわれていなかった。そのた
め、特に騒音の大きい端末側から入力された信号につい
て、前記閾値以上の範囲のものの中にノイズが含まれる
場合等があり、この点からも音声区間の検出が不正確に
行なわれることがあった。
音声区間を正確に検出することは、音声認識を正確に行
なうための最も重要な要件の一つであるが、従来の音声
認識装置では、上述のような理由から正確な音声区間の
検出を行なうことが困難である。その結果、音声認識を
正確に行なうことができないという問題があった。
この発明は上述の点に鑑みてなされたもので、電話回線
を通して入力される特定者の音声を正確に認識すること
ができるようにした音声認識装置を提供しようとするも
のである。
〔問題点を解決するための手段及び作用〕この発明に係
る電話入力音声認識装置には、各損失を補償するのに最
適な増幅度の値及び入力信号の中から音声信号とノイズ
とを区別するのに最適な閾値な可変制御するための各種
パラメータを記憶した記憶手段が具えられている。増幅
手段においては、各端末から入力される信号に対し、前
記記憶手段から読出した該端末に関する最適の増幅度に
より増幅が行なわれるようになっている。
また音声区間検出手段においては、前記増幅手段により
最適の増幅度で増幅された信号に対し、前記記憶手段か
ら読出した同じく最適の閾値を基準として、音声信号と
ノイズとの区別が行なわれるようになっている。
これにより、各端末から入力される信号について、該信
号に最も適合した条件で正確に音声区間検出が行なわれ
るので、こうして検出された正確な音声信号に基づき、
高い認識率で音声認識を行なうことができる。
尚、前記記憶手段は各端末側の特定者毎に該特定者の音
声の特徴に最も適合したフィルタ特性パラメータをも記
憶するようにすることが好ましい。
その場合前記音声分析手段は、各端末側の特定者から入
力される信号に対し、前記記憶手段から読出した該端末
側の特定者に関する最適のフィルタ特性によりスペクト
ル分析を行なう。これにより、検出された前記音声信号
に対してより正確なスペクトル分析が行なわれるので、
より高い認識率で音声認識を行なうことができる。
〔実施例〕
以下、添付図面を参照してこの発明の一実施例を詳細に
説明しよう。
この発明に係る電話入力音声認識装置には、音声増幅部
1、音声区間検出部2、音声分析特徴抽出部3、比較演
算部4、判定部5、パラメータメモリ6、標準パターン
メモリ7が含まれている。
音声増幅部1は、端末側から電話回線を通して入力され
た信号を所定の増幅度で増幅して音声区間検出部2に与
えるものである。
音声区間検出部2は、増幅された入力信号から、所定の
閾値を基準として音声信号の検出を行ない、検出された
音声信号を音声分析特徴抽出部3に与えるものである。
尚音声区間検出部2では、入力信号に対してノイズスペ
クトル及び子母スペクトルの検出を行ない、その結果を
補助的に用いて音声分析特徴抽出部3に与える信号の範
囲の修正を行なうこともある。
音声分析特徴抽出部3は、与えられた信号について、フ
ィルタを用いてスペクトル分析を行なうとともに、求め
られたスペクトルデータを、その特徴を損なわない程度
に圧縮するものである。
この発明によれば、上述の増幅度、閾値、フィルタ41
は、パラメータメモリ6から各端末毎に個別に対応した
データがパラメータとして与えられることにより、具体
的に決定されるようになっている。パラメータメモリ6
は、端末までの距離、端末の周囲の環境、端末の特定者
の音声の特徴て夫々窓じて、各端末毎に、電話回線を通
過した際の信号の損失を補償するのに最適な増幅度のパ
ラメータ、入力信号の中から音声信号とノイズとを区別
するのに最適な閾値のパラメータ、特定者の音声の特徴
て最も適合したフィルタ特性パラメータを記憶するもの
である。メモリ6の読出しアドレス指定は、図示しない
ホストコンピュータによって行なわれる。
音声分析特徴抽出部3によって得られたスペクトルデー
タは、比較演算部4に逐次与えられる。
比較演算部4は、標準パターンメモリ7の記憶内容を読
出して各記憶内容と与えられたスペクトルデータとの比
較演算を逐次性ない、夫々の類似度を求めるものである
。標準パターンメモリ7は、所定の語案に属する6語に
ついての音声スペクトルの標準パターンを記憶しており
、これにより比較演算部4では、この6語についての標
準パターンと前記スペクトルデータとの類似度が求めら
れることになる。求められた夫々の類似度を示す信号は
、判定部5に逐次与えられる。
判定部5は、この類似度を示す信号に基づき、各標準パ
ターンの中から前記スペクトルデータに対する類似度の
最も大きいものを選択するものである。選択された標準
パターンに対応する語を示すデータは、入力音声の音声
認識データとして、図示しない前記ホストコンピュータ
に出力される。
次に、この発明に係る音声認識装置の動作の一例を説明
すると、以下のとおりである。センター側(例えば銀行
)から電話回線を使って成る端末側の特定者(預金者等
)の呼出しを行なうとき1、 センター側では、ホスト
コンピュ−タを用いて、該端末て対応する増幅度、閾値
、フィルタ特性等の各種パラメータを2瞳しているパラ
メータメモリ6のアドレスを指定し、該アドレスの記憶
内容をあらかじめ音声増幅部1、音声区間検出部2、音
声分析特徴抽出部3にパラメータとして与えておく。
前記端末側の特定者から電話回線を通して信号が入力さ
れると、音声増幅部1では、前記パラメータに基づき該
入力信号の損失を補償するのに最適な増幅度で該入力信
号が増幅される。音声区間、      検出部2では
、前記パラメータに基づき、該入力信号の中から音声信
号とノイズとを区別するのに最適な閾値を基準として、
音声信号の検出が行なわれる。続いて音声分析特徴抽出
部3では、検出された音声信号について、前記フィルタ
特性パラメータに基づき最適の特性に制御されたフィル
タを用いてスペクトル分析が行なわれ、求められたスペ
クトルデータの圧縮が必要に応じて行なわれるちこうし
て得られたスペクトルデータに関しては、比較演算部4
において前述のように標準パターンメモリ7内の各標準
パターンとの類似度が求められ1判定部5において最も
類似度が大きいと判定された標準パターンに対応する語
を示すデータが、前記端末側の特定者からの入力音声の
音声認識データとして、ホストコンピュータに与えられ
る。
このように、各端末側の特定者から入力される信号につ
いて、該信号に最も適合した条件で正確に音声区間検出
、スペクトル分析が行なわれるので、こうして得らnた
スペクトルデータに基づき、電話回線を通して入力され
た音声の認識が高い認識率で行なわれることになる。
〔発明の効果〕
以上の通りこの発明に係る電話入力音声認識装置によれ
ば、特定の端末から電話回線を通して入力される信号に
対して夫々最適の条件で増幅し、ノイズと音声信号との
区別を正確知行なえるようにしたことにより音声認識に
とって最も重要な要件の一つである音声区間の検出を正
確に行なうことができる。従って、これに基づいて各端
末毎の加入者から電話回線を通して入力される音声に対
して高い認識率で正確に音声認識を行なうことが可能で
ある。
また、検出された音声信号に対するスペクトル分析を、
各端末毎の加入者の音声に最も適合した特性のフィルタ
を用いて行なうようにすれば、該音声信号についてのス
ペクトルデータをより正確に得ることができるので、各
加入者から電話回線を通して入力される音声に対してよ
り正確に音声認識を行なうことが可能である。
【図面の簡単な説明】
図はこの発明に係る電話入力音声認識装置の一実施例を
示す概略ブロック図である。 1・・・音声増幅部、2・・・音声区間検出部、3・・
・音声分析特徴抽出部・、4・・・比較演算部、5・・
・判定部、6・・・パラメータメモリ、7・・・標準パ
ターンメモリ。

Claims (1)

  1. 【特許請求の範囲】 1、電話回線を通して特定の端末から入力された信号を
    所定の増幅度で増幅する増幅手段と、前記増幅手段によ
    って増幅された入力信号から、所定の閾値を基準にして
    音声信号とみなされる信号区間を検出する音声区間検出
    手段と、 前記音声区間検出手段によって検出された音声信号を音
    声分析回路によってスペクトル特徴抽出し、該音声信号
    のスペクトルデータを得る音声分析手段と、 所定の多数の語に関してその音声スペクトルの標準パタ
    ーンを夫々記憶した第1の記憶手段と、前記音声分析手
    段により得られたスペクトルデータを入力し、該スペク
    トルデータと前記記憶手段に記憶された全ての標準パタ
    ーンとを比較し、その類似度を求める比較演算手段と、 前記比較演算手段の出力に基づき、前記類似度の最も大
    きな標準パターンを選択し、該標準パターンに対応する
    音声認識データを出力する判定手段と、 を具える電話入力音声認識装置において、 各端末毎の条件に適合させて、少なくとも前記増幅手段
    の増幅度及び前記音声区間検出手段の閾値を可変制御す
    るパラメータを予め記憶した第2の記憶手段を具え、 特定の端末を呼出す際に、前記第2の記憶手段から該特
    定の端末に対応する各種パラメータを読み出し、このパ
    ラメータによって少なくとも前記増幅手段及び音声区間
    検出手段の動作条件を設定するようにしたことを特徴と
    する電話入力音声認識装置。 2、前記第2の記憶手段は、前記音声分析手段における
    フィルタ特性パラメータを各端末毎の条件に適合させて
    更に記憶したものであり、特定の端末に対応して読み出
    された前記フィルタ特性パラメータによって前記音声分
    析手段のフィルタ特性を設定するようにしたことを特徴
    とする特許請求の範囲第1項記載の電話入力音声認識装
    置。
JP59191713A 1984-09-14 1984-09-14 電話入力音声認識装置 Pending JPS6170598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59191713A JPS6170598A (ja) 1984-09-14 1984-09-14 電話入力音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59191713A JPS6170598A (ja) 1984-09-14 1984-09-14 電話入力音声認識装置

Publications (1)

Publication Number Publication Date
JPS6170598A true JPS6170598A (ja) 1986-04-11

Family

ID=16279235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59191713A Pending JPS6170598A (ja) 1984-09-14 1984-09-14 電話入力音声認識装置

Country Status (1)

Country Link
JP (1) JPS6170598A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236095A (ja) * 2000-02-23 2001-08-31 Olympus Optical Co Ltd 音声記録装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001236095A (ja) * 2000-02-23 2001-08-31 Olympus Optical Co Ltd 音声記録装置
JP4574780B2 (ja) * 2000-02-23 2010-11-04 オリンパス株式会社 音声記録装置

Similar Documents

Publication Publication Date Title
CN105989836B (zh) 一种语音采集方法、装置及终端设备
US6411928B2 (en) Apparatus and method for recognizing voice with reduced sensitivity to ambient noise
JPH09325790A (ja) 音声処理方法および装置
US5159637A (en) Speech word recognizing apparatus using information indicative of the relative significance of speech features
JPS6170598A (ja) 電話入力音声認識装置
JPS584198A (ja) 音声認識装置における標準パタ−ン登録方式
CN111816217B (zh) 一种自适应端点检测的语音识别方法与系统、智能设备
JP3484559B2 (ja) 音声認識装置および音声認識方法
JPS58102999A (ja) 音声認識装置
JPH0651792A (ja) 音声認識装置
JPS62141595A (ja) 音声検出方式
JPS63266497A (ja) 音声認識装置
JP3450972B2 (ja) パターン認識装置
JPS61113099A (ja) 音声認識装置における音声区間検出方式
JPS58159590A (ja) 単音節音声認識方式
JPS58159599A (ja) 単音節音声認識方式
JPS6194093A (ja) 音声認識装置
JPH05232983A (ja) 音声処理装置
JPS5886598A (ja) 音声認識装置
JPH08254991A (ja) パターン認識装置
JPH01244497A (ja) 音声区間検出回路
JPH0443277B2 (ja)
JPS6136798A (ja) 音声セグメンテ−シヨン法
JPS6229800B2 (ja)
JPH02103600A (ja) 音声認識装置