JPH04369697A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH04369697A
JPH04369697A JP3147518A JP14751891A JPH04369697A JP H04369697 A JPH04369697 A JP H04369697A JP 3147518 A JP3147518 A JP 3147518A JP 14751891 A JP14751891 A JP 14751891A JP H04369697 A JPH04369697 A JP H04369697A
Authority
JP
Japan
Prior art keywords
audio
gain
input
maximum value
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3147518A
Other languages
English (en)
Inventor
Shoichi Kamei
正一 亀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP3147518A priority Critical patent/JPH04369697A/ja
Publication of JPH04369697A publication Critical patent/JPH04369697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、AGC(自動利得制御
)機能を備えた音声認識装置に関するものである。
【0002】
【従来の技術】音声認識装置においては、入力音声の入
力レベルに影響されることなく適切な音声パタンを得て
、この音声パタンを用いてパタンマッチングする必要が
ある。そのために、入力された音声の音圧の変動に吸収
するため、入力された音声に対してAGC(自動利得制
御)回路を用いるのが一般的である。
【0003】従来、このようなAGCはマイクロホンか
ら入力された音声信号に対して、直接適用される場合が
多い。しかしながら、AGCを入力音声信号に直接行う
と、細かく、時系列のサンプリングを行わなければなら
ず、AGCの遅れのために、突発的に大きな音が発生し
た場合、波形が歪むといった問題があった。
【0004】このような従来の問題を解消するために、
最近、図3に示すように、音声分析後にAGCを行う音
声認識装置が実現されている。
【0005】以下に、音声分析後にAGC回路を用いた
従来の音声認識装置の一実施例を示し、説明する。
【0006】マイクロホン31より入力された音声は、
増幅器32で振幅が飽和しない程度に増幅され、音声分
析部33で分析される。
【0007】音声分析部33は通過帯域が異なる16の
バンドパスフィルタ群と該各バンドパスフィルタの出力
を順次選択するマルチプレクサとからなるフィルタバン
ク方式の音声特徴抽出機能を備えている。該音声分析部
33で分析された音声は、可変利得増幅器14で増幅さ
れた後、A/D変換部35で10ms程度のフレーム周
期でスペクトルのデジタルデータに変換され、フレーム
バッファ36に格納される。
【0008】この時のA/D変換部35でのA/D変換
処理は、音声分析部33から得られる音声のスペクトル
(この場合は、1サンプルにつきバンドパスフィルタの
数と等しい16本のスペクトル)が最適レベルになるよ
うに可変利得増幅器34の利得が動的に設定される。
【0009】このような従来のA/D変換処理を以下に
説明する。
【0010】初め、可変利得増幅器34の利得は最大利
得に設定されており、音声分析部33で各バンドパスフ
ィルタからの35のスペクトル出力の内、マルチプレク
サは第1のスペクトルを選択し、A/Dする。この時A
/D変換された値が、変換の最大値(8ビットのA/D
の時、255)となっていれば、可変利得増幅器34の
利得を1ステップ落としてA/D変換し、そうでなけれ
ば、次の第2のスペクトルの選択出力処理に移行する。
【0011】以上を第1のスペクトルから第16のスペ
クトルまで順に行い、最後に設定された利得がそのフレ
ーム利得として設定される。
【0012】このようにして、フレーム周期ごとのスペ
クトル時系列を得て、DPマッチングなどのパタンマッ
チング法により、識別処理が行われる。
【0013】
【発明が解決しようとする課題】上述の如くスペクトル
が最適レベルとなるように可変利得増幅器の利得を設定
しながらA/D変換を行う場合、従来は、初期状態にお
いて可変利得増幅器の利得を最大利得に設定し、A/D
変換された値が変換の最大値となっていれば可変利得増
幅器の利得を1ステップ落としてA/D変換していた。
【0014】しかしこの方法では、実際の入力値がどの
程度の大きさであるか判断できないので、一度にまとめ
て利得を落とすことは不可能であり、1ステップずつ利
得を落としていかなければならない為に迅速に適正な利
得設定が行えないという不都合があった。
【0015】
【課題を解決するための手段】音声を入力する音声入力
手段と、該音声入力手段で入力された音声を増幅する増
幅手段と、該増幅手段で増幅された音声を分析する音声
分析手段と、該音声分析手段の複数の出力を選択出力す
るマルチプレクサと、該マルチプレクサの出力を増幅、
あるいは減衰させる制御手段と、該制御手段で増幅、あ
るいは減衰された音声を特定のフレーム周期でデジタル
データに変換するA/D変換手段と、該A/D変換手段
で変換されたフレーム周期ごとのデジタルデータを保持
するフレームバッファと、該フレームバッファのデータ
に基づき特定された入力音声パタンを標準パタンと比較
し、入力音声を特定するパタンマッチング手段とを備え
た音声認識装置において、上記制御手段は、上記マルチ
プレクサの出力を増幅、あるいは減衰せしめるための利
得を可変設定可能な利得設定手段と、該A/D変換され
た複数の出力の中の最大値を検出する最大値検出手段と
、該最大値検出手段で検出された最大値と該A/D変換
手段で許容される最大出力との比率を算出する算出手段
と、該算出手段で算出された比率に応じて上記利得設定
手段の増幅度を該比率に応じて可変させる可変利得制御
手段とを備えている。
【0016】
【作用】本発明の音声認識装置によれば、上記最大値検
出手段で、上記A/D変換手段で変換された複数の出力
の中の最大値を検出し、上記算出手段で、その検出され
た最大値とそのA/D変換手段の最大出力との比率を算
出し、上記可変利得制御手段でその算出された比率に基
づいて上記利得設定手段で利得を一度に目標値に可変設
定できる。
【0017】
【実施例】図1は、本発明の一実施例の音声認識装置の
機能構成を示すブロック図である。
【0018】同図の音声認識装置は、マイクロホン11
より入力された音声信号は、増幅器12で振幅が飽和し
ない程度に増幅され、音声分析部13で分析される。
【0019】ここで、上記音声分析部13の具体例の構
成について、図2を用いて、更に詳述する。
【0020】同図において、211〜2116は、16
チャネルのバンドパスフィルタ(BPF)で音声を16
の周波数帯域に分割している。221〜2216は、整
流回路(DET)、231〜2316はロ−パスフィル
タ(LPF)で、BPF各出力の崩落を検出している。 またLPF1〜LPF16の出力は、それぞれアナログ
マルチプレクサ(MPX)の入力1〜入力16に接続さ
れている。このような構成の上記音声分析部13からの
出力は図1の可変利得増幅器14に入力される。該可変
利得増幅器14は、音声分析部13の出力を増幅し、A
/D変換部15に送る。A/D変換部15はフレームバ
ッファ16の各チャネルの取り込みごとに、最初に音声
分析部13のアナログマルチプレクサ(MPX)に対し
て4ビットのMPX選択制御信号C1を送り、変換する
チャネルを選択する。また、予めこの可変利得増幅器1
4の初期利得は小さい値に設定されている。
【0021】次にレベル比較部21は、フレームバッフ
ァ16の各チャネルの出力値と閾値設定部22に設定さ
れた閾値を比較する。閾値設定部22における閾値は上
記A/D変換器15の出力がライン雑音レベル以上にな
る閾値が設定されている。この時、該チャネルの出力値
がその閾値を越えるものがない場合は、閾値適応利得決
定部24において、上記A/D変換器が飽和しない範囲
での最大利得を決定する。しかる後、該最大利得に対応
する利得制御信号C2を可変利得増幅器14に送り、利
得を設定する。
【0022】一方、該チャネルの出力値の中にその閾値
を越えるものがある場合は、最大値検出部20で各チャ
ネルの最大値を検出し、利得決定部19においてA/D
変換で許容された最大値(8ビットのA/D変換では、
255となる)との比率をもとに該A/D変換部の変換
ビット精度を最適とする最適利得を1回で設定できる。 しかる後、その最適利得に対応する利得制御信号C3を
可変利得増幅器14に送り、最適利得を設定する。
【0023】また、上述の如く、最適レベルでA/D変
換されたスペクトルは、フレームバッファ16に格納さ
れた後、例えば10msのフレーム周期でパワー正規化
され、入力音声パタンバッファ17に格納される。
【0024】パタンマッチング部18は、その入力音声
パタンバッファ17の入力音声パタンと標準音声パタン
メモリ23に記憶されている標準音声パタンとでパタン
マッチングを行い、最も距離の小さい標準音声パタンを
算出し、認識語を決定する。このとき、パタンマッチン
グは一般にDPマッチング法が用いられる。
【0025】図2に上記音声分析部13の具体例の構成
図を示す。同図において、211〜2116は、16チ
ャネルのバンドパスフィルタ(BPF)で音声を16の
周波数帯域に分割している。221〜2216は、整流
回路(DET)、231〜2316はロ−パスフィルタ
(LPF)で、BPF各出力の崩落を検出している。ま
たLPF1〜LPF16の出力は、それぞれアナログマ
ルチプレクサ(MPX)の入力1〜入力16に接続され
ている。
【0026】
【発明の効果】本発明によれば、A/D変換器の複数出
力の中の最大値とA/D変換器の最大出力との比を求め
、初期利得を該比率に応じて増大されることによりスペ
クトルが最適レベルとなるように可変利得増幅器の利得
を設定することができ、A/D変換器の変換ビット精度
を最適にしてスペクトルデータの抽出が高精度に行える
。従って、最適利得を求める迄におこなわれるA/D変
換回数を従来よりも削減できるので全体の処理時間が短
くなり、より高速で高精度な音声認識装置が実現できる
【図面の簡単な説明】
【図1】本発明の音声認識装置の一実施例の機能構成図
【図2】本発明の音声認識装置の一実施例の音声分析部
の構成図
【図3】従来の音声認識装置の構成図
【符号の説明】
11  マイクロホン 12  増幅器 13  音声分析部 14  可変利得増幅器 15  A/D変換部 16  フレームバッファ 17  入力音声パタンバッファ 18  パタンマッチング部 19  最適利得決定部 20  最大値検出部 21  レベル比較部 22  閾値設定部 23  標準音声パタンメモリ 24  閾値適応利得決定部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  入力された音声を音声信号に変換する
    音声入力手段と、該音声入力手段で入力されたアナログ
    音声信号を増幅する増幅手段と、該増幅手段で増幅され
    た音声を分析する音声分析手段と、該音声分析手段から
    の出力を増幅、あるいは減衰させる制御手段と、該制御
    手段で増幅、あるいは減衰された音声信号を特定のフレ
    ーム周期でデジタルデータに変換するA/D変換手段と
    、該A/D変換手段で変換されたフレーム周期ごとのデ
    ジタルデータを保持するフレームバッファと、該フレー
    ムバッファのデータに基づき特定された入力音声パタン
    を標準パタンと比較し、入力音声を特定するパタンマッ
    チング手段とを備えた音声認識装置において、上記制御
    手段は、上記マルチプレクサの出力を増幅、あるいは減
    衰せしめるための利得を可変設定可能な利得設定手段と
    、該A/D変換された複数の出力の中の最大値を検出す
    る最大値検出手段と、該最大値検出手段で検出された最
    大値と該A/D変換手段で許容される最大出力との比率
    を算出する算出手段と、該算出手段で算出された比率に
    応じて上記利得設定手段の増幅度を該比率に応じて可変
    させる可変利得制御手段とを備えたことを特徴とする音
    声認識装置。
  2. 【請求項2】  入力された音声を音声信号に変換する
    音声入力手段と、該音声入力手段で入力された音声信号
    を増幅する増幅手段と、該増幅手段で増幅された音声信
    号を分析する特定数のバンドパスフィルタからなる音声
    分析手段と、該音声分析手段のバンドパスフィルタの各
    出力を選択出力するマルチプレクサと、該マルチプレク
    サの出力を増幅、あるいは減衰させる制御手段と、該制
    御手段で増幅、あるいは減衰された音声を特定のフレー
    ム周期でデジタルデータに変換するA/D変換手段と、
    該A/D変換手段で変換されたフレーム周期ごとのデジ
    タルデータを保持するフレームバッファと、該フレーム
    バッファのデータに基づき特定された入力音声パタンを
    標準パタンと比較し、入力音声を特定するパタンマッチ
    ング手段とを備えた音声認識装置において、上記制御手
    段は、上記マルチプレクサの出力を増幅、あるいは減衰
    せしめるための利得を可変設定可能な利得設定手段と、
    上記A/D変換手段の量子化雑音、あるいは信号ライン
    雑音等の雑音に基づいて入力信号の最低信号レベルの閾
    値を設定する閾値設定手段と、上記A/D変換手段で変
    換されたデジタル信号と該閾値を比較し、該最低信号レ
    ベルを越えているか否かを判定する判定手段と、該判定
    手段で該最低信号レベルを越えていないと判定されたと
    きは、入力信号が該A/D変換手段のビット精度を飽和
    させない範囲で最大となるように該利得設定手段の増幅
    度を設定する増幅度設定手段と、該判定手段で該最低信
    号レベルを越えていると判定されたときは、該A/D変
    換された複数の出力の中の最大値を検出する最大値検出
    手段と、該最大値検出手段で検出された最大値と該A/
    D変換手段の最大出力との比率を算出する算出手段と、
    該算出手段で算出された比率に応じて上記利得設定手段
    の増幅度を該比率に応じて可変させる可変利得制御手段
    と備えたことを特徴とする音声認識装置。
JP3147518A 1991-06-19 1991-06-19 音声認識装置 Pending JPH04369697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3147518A JPH04369697A (ja) 1991-06-19 1991-06-19 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3147518A JPH04369697A (ja) 1991-06-19 1991-06-19 音声認識装置

Publications (1)

Publication Number Publication Date
JPH04369697A true JPH04369697A (ja) 1992-12-22

Family

ID=15432148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3147518A Pending JPH04369697A (ja) 1991-06-19 1991-06-19 音声認識装置

Country Status (1)

Country Link
JP (1) JPH04369697A (ja)

Similar Documents

Publication Publication Date Title
KR950011963B1 (ko) 음성처리장치, 그 장치를 이용한 셀룰러 무선단말장치 및 음성처리방법
US4633499A (en) Speech recognition system
US6411928B2 (en) Apparatus and method for recognizing voice with reduced sensitivity to ambient noise
US4455676A (en) Speech processing system including an amplitude level control circuit for digital processing
US8155327B2 (en) Tone detector and method used in a robot for detecting a tone
JPH04369697A (ja) 音声認識装置
KR100906676B1 (ko) 지능형 로봇의 음성인식장치 및 방법
JPH0416900A (ja) 音声認識装置
US4833711A (en) Speech recognition system with generation of logarithmic values of feature parameters
JPH027099A (ja) 過大音声検出装置
JPH02189600A (ja) 音声認識装置
JPS6172299A (ja) 音声認識装置
JPH0573090A (ja) 音声認識方法
JPH0664478B2 (ja) パターン認識装置
KR100501919B1 (ko) 2개의 증폭기를 구비한 음성인식기 및 그 음성인식 방법
JPH02165198A (ja) 音声認識装置
JPH01316799A (ja) 音声認識装置
JP2001117585A (ja) 音声認識方法及び装置
JPH04365100A (ja) 音声認識に使用する子音の認識方法
JPS5873217A (ja) 信号入力装置
JPH03122700A (ja) 音声認識装置
JPS63226698A (ja) 不特定話者電話音声認識装置
JPS59204895A (ja) 音声認識装置
JPH04343399A (ja) 音声特徴量抽出方式及び音声認識装置
JPS63127294A (ja) 音声区間検出方式