JPH02165198A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH02165198A
JPH02165198A JP63321069A JP32106988A JPH02165198A JP H02165198 A JPH02165198 A JP H02165198A JP 63321069 A JP63321069 A JP 63321069A JP 32106988 A JP32106988 A JP 32106988A JP H02165198 A JPH02165198 A JP H02165198A
Authority
JP
Japan
Prior art keywords
voice
output
maximum value
speech
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63321069A
Other languages
English (en)
Inventor
Hiroki Onishi
宏樹 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP63321069A priority Critical patent/JPH02165198A/ja
Publication of JPH02165198A publication Critical patent/JPH02165198A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 +発明は入力された音声を精度よく分析することのでき
るU声分析回路を備えた音声認識装置に関するらのであ
る。
(ロ)従来の技術 音声認識装置においては、入力される音声の音II−の
変動に対応するために、AGC(自動利得制9pJ回路
を用いるのが一般的である[特公昭63−26880号
公i]。又、音声を分析する10m5ec程度の単時間
単位(フレーム)毎にパワーを11日脱化する方法も多
様されている。
第3図に音声分析手法としてアナログのバンドパスフィ
ルタを用いた従来のフィルタバンク方式を採用する音声
認識装置の一例を示す。
同図の装置は、マイクロフォンlOより入力さ!した音
声が、AGC(自動利得制御)増幅器11で増幅され、
アナログのバンドパスフィルタで溝成された音声分析部
12で分析された後、A/D変換器13でI Oms程
度のフレーム周期でスベクトルに変換される。このスペ
クトルは、フレームバッファI4に格納され、パワーの
正規化が行なわれる。
パワーの正規化方法の1つとして、フレームごとのスペ
クトルの最大値を一定値に固定する方法がある。これは
第6図(a)図示のようにスペクトルの最大値が一定値
(図では255)になるように、原スペクトル[イ]の
成分を示す各バンドパスフィルタの出力値に正規化定数
(図では、2 :> 5/ 120=2.125)をか
けるものである。これによって図示の正規化スペクトル
[口]が得られる。
ヒ述の如く、フレームごとに正規化されたスペクトル[
口]は、フレーム周期ごとのスペクトル時系列として、
入力音声パターンバッファ15に格納される。さらに、
パターンマツチング部16は入力音声パターンバッファ
15の入力音声パターンと標準a声パターンメモリ17
内の標準音声パターンとで、DPマツチングなどのパタ
ーンマツチング法によって音声の識別を行なう。
第4図はAGC(自動利得制御)増幅器11の一例を示
している。同図のオペアンプOPに付属される抵抗R1
の抵抗値rl、及びFETなどからなる電圧可変抵抗素
子R2の抵抗値r2に従って、この回路のゲインは、G
= (rl+r2)/「1で決定される。また、振幅検
出回路Pは、オペアンプOPの出力よりその振幅値を検
出し、電し+−町変抵抗業子R1は、振幅検出回路Pの
出力電圧により、その抵抗gr1が制御される。即ち、
AGC増幅器11の出力振幅が大きいときは、その可変
抵抗R1の抵抗値r1が大きくなり、逆にその振幅が小
さいときは、rlが小さくなる方向に制御される。
(ハ)発明が解決しようとする課題 ヒ述のようなAGC増幅器を用いた音声認識装置では、
ぎ声の急激な変化に対応して、ゲインを最適に追従させ
ることは難しく、音声波形に歪みを生じることがある。
第5図(a)、及び(b)は過大入力が入った場合の第
4図の構成のAGC増輻器11の入力波形、及び出力波
形を示したもので、フィードバックの時間遅れによるゲ
イン調整のタイミングのずれから同図(b)の出力波形
に浪みが生じていることが分かる。
このように、従来装置のAGC増幅611に於ては、無
音から音声の立ち上がりの部分などで、波形に歪みが生
じ、そのため、同じ音声を入力してら、音声のパワーに
よって、音声分析結果のスペクトルが異なってしまった
。その結果、パターンマツチング時にマツチング誤差を
生じ、誤認識を起こす原因となっていた。
また、フレームごとのパワー正規化においてはA、/D
変換器への入力レベルが小さいと、正規化定数が大きく
なり過ぎるので、パワー正規化されたスペクトルには拡
大された大きな量子化誤差を含むことになる。
したがって、本発明では音声波形に歪みを生じることな
(、パワー正規化においても、スペクトルの量子化誤差
を拡大することのないように音声パワーを最適に設定で
きる認識精度の高い音声S2識装置を提供するものであ
る。
(ニ)課題を解決するための手段 本発明では、#声パワーを最適な値とするために、音声
分析部の出力であるアナログのスペクトル額のうち、最
大となる値を検出し、それを−旦A/!〕変換した後、
このデジタル化された最大値が一定値になるように音声
分析部の出力とA/D変換器の間にある可変利得増幅器
のゲインを変えた後、音声分析部の出力で音声パターン
を得るものである。
(ホ)作用 本発明の音声認識装置によれば、分析前の波形レベルで
のAGCが必要でないので、音声波形に潰みを生じるこ
とがなくなる。また、音声分析後のA/D変換処理の前
に、十分な振幅が得られるため、このA/D変換も最適
レベルで行なわれ、11゛規化定数を急激に増大させる
危惧がなく、量子化誤差の異常な拡大を防止できる。
(・\)実施例 第1図に本発明の音声認識装置の一実施例を示す。同図
の音声認識装置のマイクロフォンlよす入力された音声
は、増幅器2で振幅が飽和しない作文に増幅され、音声
分析部3で分析される。この音声分析部3は、第2図の
ような構成になっている。同図に於て、31は15チヤ
ネルのバンドパスフィルタ(BPF)であり、音声の2
00〜6400Hzの帯域を15に分割している。32
は整流回路(DET) 、33はローパスフィルタ(■
、PF)であり、BPFの各出力の振幅包絡を検出して
いる。DI−DI5は該BPFの各出力BPF 1〜B
PF15の出力の最大値を検出するためのダイオードに
よる最大値検出回路で、アナログマルチプレクサ(MP
X)35の入力Oに接続されている。また、BPF l
〜BPF15は、それぞれ、MPX35の入力1〜人力
15に接続されている。音声分析部3で分析された音声
は、可変利得増幅器4で増幅されたのち、A/D変換部
5で10ms程度のフレーム周期でスペクトルのデジタ
ルデータに変換され、フレームバッファ6に格納される
。このとき、A/D変換部5は、フレームバッファの取
り込みの最初に、音声分析部3のアナログマルチプレク
サ(MPX)に対して、・1ビツトのアナログマルチプ
レクサの選択制御信号C2をMPXの入力0を選択する
ように送出する。
このようにして、音声分析部3の第2図の最大値検出回
路りの出力をA/D変換し、スペクトルの最大値を検出
する。このとき、フレームバッファ6も選択制御信号C
2により、バッファ内の最大値格納領域が選択され、ス
ペクトルの最大値がここに格納される。
ここで、可変利得増幅器4は、フレームバッファ6の最
大値格納領域の値により、制御されるようになっており
、制御信号C1によって、ゲインが設定される。ゲイン
の設定は、15チヤネルのスペクトルの最大値が最適レ
ベルでA/D変換さ!しるように行なれる。なお、フレ
ームバッファ6の最大値格納領域は、フレーム周期ごと
に初期値が設定され、可変利得増幅器4は、音声分析部
3の最大値検出回路の出力をA/D変換するときはこの
初期値をらとにゲインが設定されている。
このようにして、最適レベルでA/D変換されたスペク
トルは、フレームバッファ6に格納された後、10m5
のフレーム周期で、フレームごとにパワー正規化され、
入力音声パターンバッファ7に格納される。パターンマ
ツチング部8は、入力音声パターンバッファ7の入力音
声パターンと標準音声パターンメモリ9内の標準音声パ
ターンとでパターンマツチングを行ない、最も距離の小
さい標準音声パターンを算出し、認識語を決定する。こ
のとき、パターンマツチングは、一般にDPマツチング
が用いられる。
h述の実施例によれば、従来例のような分析前の音声波
形上でのAGC(自動利得制御)による音声波形の歪み
を生じることなく、また、フレームごとのパワー正規化
における、A/D変換器への入力レベルが小さい場合に
ついての量子化誤差の拡大を防ぐことができる。よって
、歪みの小さい音声パターンの抽出が行なえ、より精度
の高い音声認識装置が実現できる。
(ト)発明の効果 本5δ明の音声認識装置によれば、歪みのない音声分析
処理の後にこれを線形に自動利得制御できるので、最適
利得で歪みや量子化誤差の無いスペクトルデータが得ら
れ、これに基すいた音声パターンを取り扱って制度の高
い音声認識処理を実現できる。又、本発明によれば、音
声分析後のアナログのスペクトルの最大値を検出する最
大値検出回路の出力をA/D変換しただけの情報で利得
制御ができるので、このために必要なA/D変換器の増
加はlフレームに1度となり、A/D変換器のサンプリ
ング周波数の大幅な高速化はない。
【図面の簡単な説明】
第1図は本発明の音声認識装置の一実施例を示す構成図
、第2図は音声分析部の一実施例を示す構成図、第3図
は従来のAGC(自動利得制御)を用いた音声認識装置
の一例を示す構成図、第4図はAGC増幅器の回路図、
第5図(a)、及び(b)はAGC増幅器を用いた場合
の過大入力が入った場合のAGC増幅器の入力波形図、
及び出力波形図、第6図(a)(b)はそれぞれパワー
の正規化の実例を示すグラフ図である。 (3)・・・音声分析部、 (4)・・・可変利得増幅器、 (5)・・・A/D変換部、 (6)・・・フレームバッファ、 (7)・・・入力音声パターンバッファ、(8)・・・
パターンマツチング部、 (9)・・・標準音声パターンメモリ、(D)・・・イ
オードによる最大値検出回路。 第1図 出順人  三洋電機株式会社 代理人  弁理士 西野卓嗣(外1名)第5図 第3図 (G)入力波形 第4図 Cb)出力波彫

Claims (1)

    【特許請求の範囲】
  1. (1)音声入力手段と音声分析手段を備えた音声認識装
    置において、 該音声分析手段から出力される音声分析結果である一組
    の複数の値から最大値を検出する最大値検出手段と、該
    音声分析手段の複数の出力と該最大値検出手段の出力を
    選択出力するマルチプレクサと、該マルチプレクサの出
    力を増幅、或は、減衰せしめる可変利得増幅器と、該増
    幅器の出力をデジタル信号に変換するA/D変換器を備
    え、上記マルチプレクサを上記最大値検出手段の出力に
    選択せしめ、この時の最大値を上記A/D変換器にてA
    /D変換し、その値に応じて上記可変利得増幅器の利得
    、或は、減衰量を適応制御した状態で、この後に上記マ
    ルチプレクサから得られる上記音声分析手段の複数の出
    力に基ずいて音声パターンを作成することを特徴とした
    音声認識装置。
JP63321069A 1988-12-20 1988-12-20 音声認識装置 Pending JPH02165198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63321069A JPH02165198A (ja) 1988-12-20 1988-12-20 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63321069A JPH02165198A (ja) 1988-12-20 1988-12-20 音声認識装置

Publications (1)

Publication Number Publication Date
JPH02165198A true JPH02165198A (ja) 1990-06-26

Family

ID=18128459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63321069A Pending JPH02165198A (ja) 1988-12-20 1988-12-20 音声認識装置

Country Status (1)

Country Link
JP (1) JPH02165198A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010266488A (ja) * 2009-05-12 2010-11-25 Raytron:Kk 音声認識モデルパラメータ作成装置、音声認識モデルパラメータ作成方法および音声認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010266488A (ja) * 2009-05-12 2010-11-25 Raytron:Kk 音声認識モデルパラメータ作成装置、音声認識モデルパラメータ作成方法および音声認識装置

Similar Documents

Publication Publication Date Title
JP2529129B2 (ja) 信号圧縮装置及び方法
US5794187A (en) Method and apparatus for improving effective signal to noise ratios in hearing aids and other communication systems used in noisy environments without loss of spectral information
JP2962732B2 (ja) 補聴器用信号処理システム
US5572593A (en) Method and apparatus for detecting and extending temporal gaps in speech signal and appliances using the same
US6285979B1 (en) Phoneme analyzer
US6768801B1 (en) Hearing aid having improved speech intelligibility due to frequency-selective signal processing, and method for operating same
JPH02165198A (ja) 音声認識装置
CA2257461C (en) Hearing aid with improved percentile estimator
US20050091043A1 (en) Acoustic signal processor
JPS6257040B2 (ja)
JP3420831B2 (ja) 骨伝導音声のノイズ除去装置
KR100381372B1 (ko) 음성특징 추출장치
JPH07312795A (ja) 音声信号処理方法及び装置
JP2989219B2 (ja) 音声区間検出方式
JPS6195398A (ja) 音声認識装置
JP2966452B2 (ja) 音声認識装置の雑音除去システム
KR920008108Y1 (ko) 음성인식 시스템의 디지탈 음성데이타 검증장치
JPH04367899A (ja) 音声認識装置のagc制御方式
JPH08298698A (ja) 環境音分析装置
JPS59195291A (ja) 音声認識装置
JPH02176796A (ja) 音声認識装置
JPH04343399A (ja) 音声特徴量抽出方式及び音声認識装置
JPS6355280B2 (ja)
JPH04369697A (ja) 音声認識装置
JPS63127294A (ja) 音声区間検出方式