JPH0635498A - 音声認識装置及び方法 - Google Patents

音声認識装置及び方法

Info

Publication number
JPH0635498A
JPH0635498A JP4212180A JP21218092A JPH0635498A JP H0635498 A JPH0635498 A JP H0635498A JP 4212180 A JP4212180 A JP 4212180A JP 21218092 A JP21218092 A JP 21218092A JP H0635498 A JPH0635498 A JP H0635498A
Authority
JP
Japan
Prior art keywords
voice
unit
waveform shaping
data
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4212180A
Other languages
English (en)
Inventor
Nobuo Hagimoto
信男 萩本
Toshio Sakuragi
俊男 桜木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Faurecia Clarion Electronics Co Ltd
Original Assignee
Clarion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Clarion Co Ltd filed Critical Clarion Co Ltd
Priority to JP4212180A priority Critical patent/JPH0635498A/ja
Publication of JPH0635498A publication Critical patent/JPH0635498A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 騒音により変形された音声の分析データを波
形整形することで、耐騒音性能(音声認識率)を向上さ
せた音声認識装置の提供。 【構成】 音声認識装置は、音声分析部100、音声入
力部105、音声認識部200、辞書部300、コント
ローラ301、音声波形整形部402を有する騒音対策
部400から構成されている。音声分析部100から出
力された騒音成分を含む分析データは音声波形整形部4
02に入力し、音声波形整形部402は有音検出用波形
(区間検出用波形)によりデータのゼロ詰め範囲を検出
しながら順次音声認識データの波形整形を行なう。音声
波形整形部402は音声分析部100からの出力データ
を受け取ると音声区間検出手段により対称チャンネルの
分析データとCH7の有音検出用波形とを比較し区間ゼ
ロ詰め処理手段によりデフォルトの場合はゼロデータを
音声認識部200に出力する。また、音声波形整形処理
方式は音声の存在範囲が検出(有意判定)されたときの
み音声分析部100から入力した音声認識データを出力
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声認識装置に関し、
特に、騒音抑圧装置を有する音声認識装置及び方法に関
する。
【0002】
【従来の技術】近年、音声認識装置を用いて機器をコン
トロールするシステムの研究開発が行なわれ実用化され
つつある。特に、自動車等の車室内における機器操作
は、音声認識装置を用いることにより手を使わず(ハン
ズフリー)、視点をそらすことなく(アイズフリー)行
なえるため、機器操作における運転の安全の確保や向上
が実現できるという利点がある。しかし、現状の音声認
識装置は(特に、車両の走行騒音のような)、騒音環境
下では音声認識性能が大幅に低下するという問題点があ
った。
【0003】図16は従来の音声認識装置の構成を示す
ブロック図であり、音声認識装置は、構成を大きく分け
ると、音声分析部100、音声認識部200及び辞書部
300から構成されている。そして、音声の分析結果は
外部バス110を介して音声認識部200に出力される
よう構成されている。
【0004】図16に示したような従来の音声認識装置
の音声認識性能が騒音環境下で低下する原因としては、
主に、騒音の混入により音声のスペクトルパターンが変
形されるために、予め辞書部300に登録されている標
準パターンとの類似性の低下が生じることが挙げられ
る。
【0005】また、単語音声認識装置の場合、孤立発音
された単語音声の始端と終端を検出し、音声信号を切り
出す音声区間検出処理が必要になることが知られている
が、騒音により音声信号が変形したり、騒音に埋もれた
りすることで、正確な音声検出が行なえなくなり検出精
度が低下し、これが認識性能の低下を招くこととなる。
【0006】更に、周囲の騒音が高くなってくると音声
区間検出が行なえなくなり、認識装置側が動作不能にな
り、音声を発声しても認識結果が出力されなくなる等と
いう問題点があった。そこで、周囲騒音への対策とし
て、従来はマイクと発声者の口許との距離を近付け(5
〜10cmくらいに)、マイク感度を落すことで発声者以
外の音のマイクからの入力がされにくくするという方策
がとられることが多い。
【0007】
【発明が解決しようとする課題】しかしながら、マイク
距離を短くするためにはマイクの設置方法が問題とな
る。例えば、発声者がマイクを身に付けたり、または発
声者の目の前にマイクが設置される。このような場合、
例えば、車の運転中に音声認識される場合等はマイクが
目の前にあると使いにくい、など用途によってはマイク
が邪魔になったり、また、例えば、マイクを体に装着し
て用いている場合等は、車に乗り降りする度にマイクを
着脱しなければならないなど、発声に煩わしさを感じさ
せる等の不都合がある。
【0008】このため、車室内などでの使用ではマイク
距離を数10cm(30〜50cmくらい)に離し、サンバ
イザ等に取り付ける場合が多い。この方法によればマイ
クの取付法による不都合は解消されるがマイク距離が離
れた分だけマイク感度を上げる必要が生じ、反って騒音
がマイクから拾われやすくなるので、マイクの位置如何
による解決策でなく音声認識装置側での騒音対策が必要
となる。
【0009】走行騒音は、低周波数にパワーが偏ってい
るので、音声認識装置の前処理としてHPF(ハイパス
フィルタ)を用いて一部のノイズを相対的に低減する方
法が考えられる。しかし、この方法では、HPFを用い
ることにより音声情報も欠落するので遮断周波数を適当
に選択する必要がある。なお、この場合HPFを用いる
ことにより音声情報の欠落に比べて低域ノイズの低減が
大きいので、相対的にS/Nは向上する。
【0010】HPFによる走行騒音対策は、例えば、文
献として、「耐騒音音声認識システム」浜田、滝沢共著
(松下電器)信学技法SP89−105に示されてい
る。上記耐騒音音声認識システムの欠点として、 騒音を大幅に低減しようとして遮断周波数を高く設
定すると、それと共に音声情報の欠落も大きくなり、認
識性能が低下するため遮断周波数の設定に限界があり、
従って、騒音の低減にも限界があること、 HPFにより抑圧される騒音成分以外の帯域にも騒
音は存在しているが、この部分の騒音対策が何等講じら
れていないので認識性能の飛躍的な向上を望めない点、 があり、このハイパスフィルターによる騒音対策はあく
までも、前処理として用いられる実用的な手法の1つに
過ぎない。
【0011】上述したように、音声認識に用いられる音
声の分析データは騒音が混入することで大きく変形され
認識性能を低下させる原因となっている。そして、HP
Fによる低域騒音の抑圧だけでは(または、HPFがな
くても)、音声の分析帯域内に存在する騒音成分の抑圧
を、音声情報の欠落なしにできないという問題点があ
る。
【0012】本発明は、上記欠点及び問題点に鑑みて創
案されたものであり、音声認識装置において、騒音によ
り変形された音声の分析データを波形整形することで、
耐騒音性能(音声認識率)を向上させた音声認識装置の
提供を目的とする。
【0013】
【課題を解決するための手段】上記の目的を達成するた
めに本発明の音声認識装置の基本構成は、音声入力部に
より取り込まれた音声を所定の音声分析データに変換す
る音声分析部と、音声分析データを波形整形処理し波形
整形処理信号を得る騒音対策部と、波形整形処理信号に
基づいて音声を認識処理し音声認識結果を得る音声認識
部を備え、音声分析部が騒音成分を含んだ音声を複数の
所定帯域毎に分割し、第1の音声分析データとしての所
定帯域毎の音声認識処理用データと第2の音声分析デー
タとしての所定帯域の全てを含む帯域の音声区間検出用
データを得る音声分析データ抽出手段を有し、騒音対策
部が、有音検出用波形データに基づいて前記第1の音声
分析データの音声区間を検出し、所定の波形整形用パラ
メータに基づいて音声成分の有無を判定する音声区間検
出手段と、音声区間判定結果に基づいて第1の音声分析
データの音声区間の有無を判定し波形整形区間を設定す
る波形整形区間設定手段と、波形整形区間設定手段の設
定値に基づいて第1の音声分析データの音声区間内に含
まれる無音区間を略ゼロ詰め処理して波形整形し波形整
形処理信号を得る信号波形整形処理手段と、を有する音
声波形整形部を含むことを特徴とする。
【0014】そして、本発明に基づく第2の発明は上記
音声認識装置において、有音検出用波形データが第2の
音声分析データであることを特徴とする。また、本発明
に基づく第3の発明は上記第2の音声認識装置におい
て、騒音対策部が、更に、第1の音声分析データからデ
ータに含まれる騒音レベルを検出してレベル検出信号を
得る騒音レベル検出手段と、前記レベル検出手段に基づ
いて、所定の波形整形用パラメータを騒音レベル変動に
応じて変更するように調整制御する波形整形用パラメー
タ調節制御手段と、を含むことを特徴とする。
【0015】更に、本発明に基づく第4の発明は本発明
の音声認識装置において、音声波形整形部が、更に、第
1の音声分析データのうち所定レベル以下のデータを検
出し該検出データの略高域成分に所定の重み付け処理を
行ない重み付け処理信号を得る重み付け処理手段を有
し、前記重み付け処理信号を有音検出用波形データとし
て音声区間検出手段に与えることを特徴とする。
【0016】更にまた、本発明に基づく第5の発明は上
記第2または第4の発明において、騒音対策部が、更
に、第1の音声分析データを、該データに含まれた騒音
成分の平均騒音レベルに基づく減算量により所定レベル
に減算処理し、減算処理の結果を第1の音声分析データ
として音声波形整形部に入力する騒音減算部を有するこ
とを特徴とする。
【0017】なお、更に本発明に基づく第6の発明は、
音声入力部により取り込まれた音声を音声分析部にて所
定の音声分析データに変換し音声分析し、その分析され
た音声出力を音声波形整形部で波形整形して、整形され
た音声を音声認識部で認識処理し音声認識結果を得る音
声認識方法において、前記音声波形部により前記分析さ
れた音声出力が所定のしきい値を越え、その越えている
期間が所定フレーム継続すると有音と判定する立上り判
定ステップと、前記音声波形部により前記分析された音
声出力が所定のしきい値を下回り、その下回っている期
間が所定フレーム継続すると無音が以降に続くと判定す
る立下り判定ステップと、を含むことを特徴とする。
【0018】
【作用】上記構成により第2の発明に基づく音声認識装
置は、騒音対策部が、音声区間検出手段により第2の音
声分析データに基づいて第1の音声分析データの音声区
間を検出し、所定の波形整形用パラメータに基づいて音
声成分の有無を判定し、波形整形区間設定手段が音声区
間判定結果に基づいて第1の音声分析データの音声区間
の有無を判定し波形整形区間を設定し、信号波形整形処
理手段により波形整形区間設定手段の設定値に基づいて
第1の音声分析データの音声区間内に含まれる無音区間
を略ゼロ詰め処理して波形整形し波形整形処理信号を得
る。
【0019】また、第3の発明に基づく音声認識装置
は、騒音対策部が、更に、騒音レベル検出手段により第
1の音声分析データからデータに含まれる騒音レベルを
検出してレベル検出信号を得て、波形整形用パラメータ
調節制御手段により所定の波形整形用パラメータを騒音
レベル変動に応じて変更するように調整制御する。
【0020】更にまた、第5の発明による音声認識装置
は、騒音対策部が、更に、第1の音声分析データを、該
データに含まれた騒音成分の平均騒音レベルに基づく減
算量により所定レベルに減算処理し、減算処理の結果を
第1の音声分析データとして音声波形整形部に入力す
る。
【0021】更に、第4の発明による音声認識装置は、
音声波形整形部が、重み付け処理手段により第1の音声
分析データのうち所定レベル以下のデータを検出し該検
出データの略高域成分に所定の重み付け処理を行ない重
み付け処理信号を得て、重み付け処理信号を有音検出用
波形データとして音声区間検出手段に与える。
【0022】また第6の発明の方法によると、有意判定
が適切となり、無音区間がゼロ詰めされ、騒音抑圧が可
能となる。
【0023】
【実施例】図1は本発明に基づく音声認識装置の基本構
成を示すブロック図である。図1において、100は音
声分析部、105は音声入力部としてのマイク、200
は音声認識部、300は辞書部としてのメモリ、301
はコントローラ、400は騒音対策部、402は音声波
形整形部である。本実施例では説明上、音声分析部10
0、音声入力部105、音声認識部200、辞書部30
0及びコントローラの各々の構成は前述した従来の音声
認識装置と同様の構成とする。また、音声分析部100
は音声分析データ抽出手段としてのフィルタバンク10
2(図16)を有する。
【0024】本発明では、音声分析部100から出力さ
れた騒音成分を含む分析データ(音声認識処理用データ
(図4B参照))が音声波形整形部402に入力され、
音声波形整形部402は有音検出用波形(図4の場合
は、実施例1で後述するように区間検出用波形(CH
7)を有音検出用波形として用いている)によりデータ
のゼロ詰め範囲を検出しながら順次音声認識データの波
形整形を行なう。図3に有音検出用波形と各種パラメー
タとの関係を示す。波形整形用のパラメータとしては下
記表1に示す5個がある。
【0025】
【表1】 Level … 有音判定を行なうためのしきい値。 UP … しきい値を越えてから、有音と判定す
るためのフレーム数 IPOFFSET … 有音と判定されてから、ゼロ詰めする
ポイントまでのオフセット数 DOWN … しきい値を下回ってから、無音と判定
するまでのフレーム数 DOWNOFFSET … 無音と判定されてから、スルーとなる
ポイントまでのオフセット数
【0026】図2は音声波形整形部402の構成例を示
すブロック図である。図2において、音声波形整形部4
02により対象チャンネル(CH1〜CH6)の音声認
識データがデフォルトの場合はゼロ詰めを行なうので出
力データはゼロとなる。具体的には、音声波形整形部4
02は音声分析部100からの出力データを受け取ると
音声区間検出手段により有音検出用波形を比較検査しデ
フォルトの場合は、波形整形フラグ設定手段により波形
整形フラグ0を設定し、信号波形整形処理手段によりゼ
ロデータを音声認識部200に出力する。一方、音声区
間検出手段により音声の存在が検出された時は、波形整
形フラグ設定手段により音声の存在範囲(有音部分)に
波形整形フラグ1を設定し、信号波形整形処理手段によ
り音声認識処理用データ(分析データ)を音声認識部2
00に出力する。音声波形整形部402において有音判
定を適切に行ない音声区間内の無音区間をゼロ詰め処理
することにより、騒音抑圧を行なうことができる。以
下、図3により有音検出用波形を用いた音声波形整形部
402の動作概要を述べる。
【0027】図3において、音声がしきい値「Level」
を越え(ポイントa)、その期間が「UP」フレーム継続
すると音声区間検出手段425が有音と判断する(ポイ
ントb)。そして、波形整形フラグ設定手段426がポ
イントbより「UP+UPOFFSET-1」フレームだけ遡ったと
ころ(ポイントc)をゼロ詰めの最終ポイントとし、そ
れ以降、無音と判定されるまで入力する音声認識データ
に対し有音フラグ“1”をたてる。そして、信号波形整
形手段427はゼロ詰めすることなくそのまま音声認識
部200に出力する。
【0028】次に、音声が「Level」を下回って(ポイ
ントd)、その期間が「DOWN」フレーム継続すると音声
区間検出手段425は無音が以降に続くものと判定す
る。そして、波形整形フラグ設定手段426がポイント
eから「DOWNOFFSET-1」フレームだけすすんだフレーム
(ポイントf)をゼロ詰め開始位置とし、ゼロ詰めフラ
グをたてる。信号波形整形手段427はそれによりゼロ
データを音声認識処理用データの代りに音声認識部20
0に出力する。
【0029】〈実施例1〉本実施例は、図1のブロック
図に示す音声認識装置において、区間検出用波形(CH
7)を有音検出用波形として用いた例である。また、図
4は“さっぽろ”という単語を音声入力した時の音声分
析部100の出力波形図であり、部分図4Aは騒音の無
い時の音声“さっぽろ”の波形図、部分図4Bは騒音下
の音声“さっぽろ”の波形図、部分図4Cは音声波形整
形部402による波形整形処理後の音声“さっぽろ”の
波形図である。
【0030】図1において、マイク105から入力した
騒音の重畳した音声は音声分析部100に入力され、帯
域分割されたバンクフィルタ(実施例では説明上、7チ
ャンネル(以下、CHと記す)とする)により図4Bに
示すような分析データとなる。CH1からCH6までは
低域から高域の順になっており、CH7はCH1からC
H6までの分析帯域をカバーする全帯域フィルタの分析
結果である。CH1〜CH6を音声認識用のデータ作成
に用い、CH7は音声区間検出用として用いる。なお、
図4Bにおいて、音声に重畳している騒音は車両の走行
騒音であり、低域のチャンネルにそのパワーレベルが集
中しているため、CH1、CH2、CH3…の順に騒音
による音声の変形が大きいことがわかる。以下に、図5
及び図6により本実施例における波形整形部402の動
作を詳細に述べる。
【0031】図5は、波形整形処理で用いるデータバッ
ファとポインタとの関係の説明図であり、波形整形処理
で用いるデータバッファ51(ring[ch][ptr])と、波
形整形動作を切り換えるためのフラグgate[ptr]を格納
するバッファ52が示されている。これらはそれぞれリ
ングバッファ構成をとっており、時々刻々とデータを格
納する位置(ptr-wr)と読み出される位置(ptr-rd)が
変わる。ただし、ch=1〜7,ptr=0〜RINGMAX(バッ
ファサイズ)であり、chは分析データ(音声認識用デー
タ)のチャンネル番号、ptrはリングバッファの対象位
置を示すポインタである。また、ptr-rd,ptr-wrは、そ
れぞれ、データの読み出し、書き込みのためのポインタ
である。例えば、図5では、右回りに1つずれ、ptr-wr
に相当するバッファエリアに入力データが格納され、pt
r-rdに相当するデータが読み出される。従って、読み出
されたデータ(即ち、音声認識部200に出力するデー
タ)は、入力されたデータに対して、バッファサイズRI
NGMAXフレームだけ遅れることになる。
【0032】波形整形処理において時間軸を遡る処理を
行なう必要があり、信号にその処理に必要な遅延を与え
るために上述のバッファを要する。そして、バッファサ
イズRINGMAXの大きさは波形整形処理を行なうために十
分な、また、音声発声時から音声認識装置の応答までの
時間を極端に遅くしない程度に設定する(例えば、RINGM
AX=20とすると、分析フレーム周期が10msecのと
き、発声から約0.2秒の遅延が生じる)。
【0033】図6は、音声波形整形部402の動作を示
すフローチャートである。以下、図6のステップに従っ
て音声波形整形部の動作を説明する。
【0034】[ステップ100〜115] 音声区間の
検出(音声区間検出手段) 入力分析部100からの1フレーム分のデータをデータ
の一時記憶領域f-input[0]〜f-input[7]に入力し、有音
検出用波形f-input[7]が、しきい値Levelを越えている
(以下、Uと記す)か否か(以下、Dと記す)の比較を
行ない、Uならば“越えている”、Dならば“下回って
いる”状態、を示すフラグwaveflaguのチェックを行な
う。なお、電源投入時は予め何れか(例えば、D)に初
期設定されているものとする(ステップ100)。
【0035】次に、1つ前のフレームのデータがLevel
を下回っていたかどうかをwaveflagにより判定する。wa
veflagがDであれば現在の有音検出用波形f-input[7]と
しきい値Levelとの比較を行なう。ここでLevelを下回っ
ていればしきい値を連続して下回るフレーム数をカウン
トするカウンタdowncntに1を加える(ステップ11
0)。現在の有音検出用波形f-input[7]としきい値Leve
lとの比較の結果がLevelを下回っていなければカウンタ
downcntをクリアし、f-input[7]の状態がしきい値を上
回っているものとしてwaveflagにUをセットする(ステ
ップ111)。
【0036】また、1つ前のフレームのデータがLevel
を上回っていたかどうかをwaveflagにより判定する。wa
veflagがUであれば現在の有音検出用波形f-input[7]と
しきい値Levelとの比較を行なう。ここでLevelを上回っ
ていれば状態が継続中であると判断して、しきい値を連
続して上回るフレーム数をカウントするカウンタupcnt
に1を加える(ステップ112)。
【0037】現在の有音検出用波形f-input[7]としきい
値Levelとの比較の結果がLevelを上回っていなければカ
ウンタupcntをクリアし、f-input[7]の状態がしきい値
を下回っているものとしてwaveflagにDをセットする
(ステップ113)。なお、異常入力に対する措置とし
て、例えば、騒音が大きくてしきい値を常に越えている
ような状態の場合には、upcntがバッファサイズに達し
た時にupcntをクリアする(ステップ114)。入力信
号のない場合の措置として、入力信号が常にしきい値を
下回っている状態において、downcntがバッファサイズ
に達した時にdowncntをクリアする(ステップ11
5)。
【0038】[ステップ116〜123] 立上りの判
定;波形整形条件の判定1(波形整形フラグ設定手段) リングバッファ51,52のポインタを更新し(ステッ
プ116)、次に、連続したメモリ領域の一部をリング
バッファとして用いるため、リングバッファのポインタ
がバッファサイズに達した時ポインタをバッファの先頭
に戻す(ステップ117)。音声の立上りのポイントを
検出すると共にゼロ詰め終了ポイント(図3のポイント
c)の探索を開始するか否かの判定を行なう。この場
合、ステップ112でカウントしたupcntと予め設定し
た定数u-flameとの比較を行ない、upcntがu-flameに達
していればステップ119及びステップ120を実行す
る(ステップ118)。
【0039】[ステップ119,120] 波形整形フ
ラグの設定1(波形整形フラグ設定手段) ゼロ詰めの切換えスイッチGETFLAGに1セットし、現在
からゼロ詰め処理を中止する設定を行なう(ステップ1
19)。ステップ118で検出した音声の立上りのポイ
ントより以前のフレームにも音声が存在するので、ゼロ
詰め終了ポイントの現在のポイント(図3のポイント
b)から過去へ引き戻す処理を行なう。現在のデータを
格納する位置を示すポインタptr-wrから、「upcnt+UPO
FFSET-1」フレームだけ、リングバッファ42(gate[pt
r])を遡り、その間に1を格納する(但し、UPOFFSETは
予め定めた値である)。これにより、gate[ptr]が1で
あるから対応するポインタ位置のリングバッファ41
(ring[ch][ptr])に格納されているデータをゼロ詰め
されることなくそのまま出力する設定が行なわれたこと
になる(ステップ120)。
【0040】[ステップ121〜123] 立下りの判
定;波形整形条件の判定2(波形整形フラグ設定手段) 前述した音声の立下りのポイントを検出すると共にゼロ
詰め開始の探索を開始するか否かの判定を行なう。この
場合、ステップ110でカウントしたdowncntと予め設
定した定数d-flameとの比較を行ない、downcntがd-flam
eに達していればステップ122及びステップ123を
実行する(ステップ121)。
【0041】[ステップ122,123] 波形整形フ
ラグの設定2(波形整形フラグ設定手段) ゼロ詰めの切換えスイッチGETFLAGに0をセットし、現
在からゼロ詰めを開始する処理の設定を行なう(ステッ
プ122)。ステップ121で検出した音声の立下りの
ポイントは有音区間を越えて無音区間に入っているの
で、ゼロ詰めを開始するポイントを現在のポイント(図
3のポイントf)から過去へ引き戻す処理を行なう。ス
テップ120と同様にポインタptr-wrから、「downcnt+
DOWNOFFSET-1」フレームだけ、リングバッファ52(gat
e[ptr])を遡り、その間に0を格納する(但し、DOWNOF
FSETは予め定めた値である)。これによりgate[ptr]が
0であるから対応するポインタ位置のリングバッファ4
1(ring[ch][ptr])に格納されているデータは出力さ
れず、代りにゼロデータを出力する設定が行なわれたこ
とになる(ステップ123)。
【0042】[ステップ124〜128] 波形整形処
理(信号波形整形処理手段) 入力した分析データをリングバッファ5のring[ch][ptr
wr]に格納し(ステップ124)、出力すべきデータを
一時記憶エリアであるf-output[CH]に格納する(ステッ
プ125)。次に、読み出しポインタptr-rdに対応する
gate[ptr-rd]の値を参照し、これが0に設定されていれ
ばゼロ詰め動作モードであると判断し、ステップ127
を実行し、gate[ptr-rd]の値が1に設定されていればゼ
ロ詰め動作モードでないと判断しそのままステップ12
8を実行する(ステップ126)。
【0043】ゼロ詰め動作モードの時、一時記憶エリア
f-output[CH]の値をゼロとする(ステップ127)。な
お、本実施例では、このとき、ゼロ詰め処理する対象チ
ャンネルを低域のCH1〜CH4とCH7としている
(図4C参照)。これは、本実施例では走行騒音を仮定
しているため低域騒音の多い走行騒音では高域には騒音
の影響が殆どないと考えられるからであり、本実施例の
例によることなく全てのチャンネルに対してゼロ詰め処
理を行なってもよい。
【0044】gate[ptr]の内容によりリングバッファ5
1の値(内容)を読み出して音声認識部200に出力す
る。例えば、gate[ptr]に、図5に示すような配列で0
または1が格納されていたとすると、現在の読み出しポ
インタptr-rdは、2→3→4→…の順にバッファ51の
内容を全てのチャンネルについて読み出す。このとき、
gate[2]〜gate[4]までが1であるため、バッファ51か
ら読み出したデータについてこの間はゼロ詰めされるこ
となくそのまま音声認識部200に出力される。それ以
降はgate[ptr]がゼロであるから波形整形処理の対象と
なっているチャンネルの出力データはゼロに置き換えら
れて音声認識部200に出力される。上記ステップ10
0〜128の処理により波形整形処理が完了する。な
お、ステップ128では、波形整形処理後の分析データ
はデータの一時記憶エリアf-output[CH]に格納されてお
り、最終的に騒音対策部400の出力データとなる。
【0045】〈実施例2〉図7は第3の発明に基づく音
声認識装置の一実施例の構成を示すブロック図である。
本実施例の構成は図1の構成において、騒音対策部40
0が、更に、騒音レベル測定部403とパラメータ変更
部404を有する点で図1と異なるが、他の部分の構成
及び機能、動作は図1に示した第1の音声認識装置と等
しいので説明を省略し、異なる点について述べる。
【0046】前述したように波形整形処理では5つのパ
ラメータ「Level,UP,UPOFFSET,DOWN,DOWNOFFSET」(表
1参照)があり、この値により有音の判定を行なう。こ
の場合、騒音が大きく変動すると、音声の欠落や騒音の
付加等が起こり、有音検出を失敗する場合があった。そ
こで、騒音レベルが大きく変動した時パラメータを調整
する必要があった。
【0047】第3の発明によれば音声認識装置はこのよ
うな場合に対処できるよう騒音レベルに応じて適当なパ
ラメータ設定が行なわれるように構成されている。そし
て、波形整形処理のパラメータ「Level,UP,UPOFFSET,DO
WN,DOWNOFFSET」がいくつかの騒音レベルN1,N2,
N3,…のそれぞれについて最適な値として異なる組み
合わせを持っている時に本方式は有効となる。
【0048】パラメータのうち「Level」は音声の存在
場所を検索するためのしきい値であるため、騒音レベル
に最も敏感である。例えば、しきい値が騒音レベルを下
回ってしまうような場合は、波形整形処理は全く行なわ
れなくなってしまう。従って、少なくとも「Level」は
騒音レベルよりも高く設定しなければならない。しかし
ながら、高く設定し過ぎるとレベルの低い音声部分の検
出ができなくなり、語頭あるいは語尾の欠落が発生する
ため、「Level」は騒音レベルに応じて適切に設定され
なければならない。
【0049】しきい値Levelが変われば、最終的にゼロ
詰め処理を開始或いは終了するポイントを決定するため
の他のパラメータも変更する必要がある。例えばしきい
値Levelが高くなればゼロ詰め終了となるべきポイント
(図3のポイントc)と、有音として判定されるポイン
ト(図3のポイントb)までの時間はしきい値が低い時
に比べて長くなるのでパラメータ「UPOFFSET」の値を大
きく取る必要がある。このように、種々の場合に応じて
最適なパラメータを騒音レベル毎に決めておくことがで
きる。
【0050】例えば、パラメータが騒音レベル(N1,
N2)=(15,25)で切り換えられる時のパラメー
タの設定は以下のようになる。但し、レベルは図4に示
したグラフの縦軸のデータであり、最大レベル256の
無名数である。 Pn=「Level,UP,UPOFFSET,DOWN,DOWNOFFSET」 P1=[40,3,3,3,−1](騒音レベル N1
=15が境界) P2=[40,3,4,3,−1](騒音レベル N2
=25が境界) P3=[40,3,6,3,−2] 以下の説明では、上記のパラメータがパラメータ変更部
404に、例えば、パラメータテーブル(図示せず)と
して、登録されているものとする。
【0051】図7において、騒音レベル測定部403に
は、波形整形処理部402での波形整形処理の対象とな
る分析データと同じデータが入力分析部に入力される。
騒音レベル測定部403はこの分析データに混入してい
る騒音のレベルを検出する。検出した結果はパラメータ
変更部404で判定され、変更の必要があればパラメー
タテーブルを参照し該当するパラメータを音声波形整形
部402に設定する。例えば、騒音レベル測定部403
により測定された騒音レベルNxはパラメータ変更部4
04に入力され、次のような判定処理を受ける。 N1>Nx ならばP1を選択する。 N2>Nx≧N1 ならばP2を選択する。 Nx≧N2 ならばP3を選択する。 例えば、騒音レベルが18であるとすると、音声波形整
形部402に設定されるパラメータはP2=[40,
3,4,3,−1]となる。音声波形整形部402で
は、実施例1の第1の音声認識装置におけると同様に波
形整形処理を行なう。
【0052】〈実施例3〉騒音のある信号に対してパワ
ーレベルで環境騒音を減算する方法は、文献、F.ボー
ル(F.BOLL)著、「Suppression of Acoustic No
ise in Speech Using Spectral Subtraction」IEEE Tra
ns.ASSp.,Vol.ASSP-272,pp.113-120(1979)に示されてお
り、抑圧の対象となる騒音に定常性を仮定し得るときに
は、有効な方法である。本発明は、騒音の重畳した波形
の騒音レベルの減算処理後に波形整形処理を施すもので
ある。
【0053】図8は第3の発明に基づく音声認識装置の
一実施例の構成を示すブロック図である。本実施例の構
成は図1の構成において、騒音対策部400が、更に、
環境騒音減算部401を有し、騒音対策部400が音声
分析部100から受け取った分析データに対し、環境騒
音を減算し、その後、実施例1で述べたと同様に波形整
形処理を施し音声認識部200へ出力するよう構成され
ている点で図1と異なるが、他の構成部分の機能及び動
作は図1に示した第1の音声認識装置と等しいので説明
を省略し、異なる点について述べる。また、図9は環境
騒音減算部401の構成例を示すブロック図であり、環
境騒音減算部401は非対称変換部410、騒音レベル
測定部411、減算数設定部412、環境騒音減算処理
部413、対数変換部414から構成されている。
【0054】また、図10は音声分析部の対数特性図で
あり、図11は本実施例における減算処理の各過程にお
ける減算処理の動作の説明図であり、図12Aは図12
Bに示した走行騒音が変化する時の波形に対して環境騒
音減算部401により、分析データの持つ対数特性を補
正して線形に変換した分析データから、各チャンネル毎
に騒音レベルを減算した後、再び対数データに変換した
(非線形)を示す図であり、図12Bは図12Aの減算
処理後の波形に対して図8の音声波形整形部402によ
り音声波形整形した後の波形図である。
【0055】以下、図8、図9のブロック図に基づいて
減算処理の動作について説明する。一般に、音声認識装
置の分析データは、広いダイナミックレンジを確保する
ために図10に示すような対数特性(図10の例は、対
数特性を折線近似したものである)を用いて対数変換さ
れることが多い。対数変換はマイク105の入力アンプ
(図示せず)でアナログ処理で行なわれたり、デジタル
処理で行なわれたりして、種々の方式が取られている
が、本実施例では(音声分析装置100内の)A/Dコ
ンバータの入力特性に図10に示したような対数特性を
持たせた場合として説明する。
【0056】このとき、音声分析部100からの出力で
ある分析データは、対数変換されたデータ(図11A参
照)であるから、これを非対称(リニア)データに戻す
必要がある。この処理を行なうのが非対数変換部410
である。音声認識装置によっては対数変換を音声認識部
200で行なう場合があるが、この場合は、環境騒音減
算部401において、非対数変換部410と対数変換部
414は構成上必要がない。
【0057】分析データはCH1〜CH7の順に入力分
析部100から出力され、分析周期(フレーム周期)は
10msecである。非対数変換部410はこのように順次
出力されてくる分析データの全てについて非対数変換処
理を行なう。非対数変換部410により、リニアなデー
タに変換された分析データ(図11B参照)は、騒音レ
ベル測定部411に入力される。騒音レベル測定部41
1は一定時間範囲の分析データを蓄え、そのデータに対
し各チャンネル毎に平均騒音レベルを検出する。平均騒
音レベルは各チャンネル毎に蓄えられた分析データのヒ
ストグラムの最大値をとることで決定する。
【0058】平均値でなくヒストグラムをとる理由は、
分析データの中に音声が含まれると音響レベルの影響で
平均値が騒音レベルよりも高くなり、正確な騒音レベル
の測定ができないときがあるからである。ヒストグラム
は発生頻度でレベルをみるためにレベルの大きさに左右
されず、発生頻度最大のレベルを平均騒音レベルとみな
すことで、音声の存在にかかわらず精度のよい測定が可
能となる。
【0059】測定された平均騒音レベルにしたがって、
減算量が減算量設定部412により環境騒音減算処理部
413に設定され、各チャンネル毎に騒音の減算処理が
行なわれる。減算量の設定は測定した環境騒音レベル分
がそのまま用いられるが、騒音が大きいときは減算量が
大きくなり音声レベルが小さくなり過ぎてしまうときが
あるので、測定した騒音レベルよりも少なめに設定して
もよく、これらの処理は騒音レベルに応じて適応するよ
う設定する。減算処理した波形(図11C参照)は、対数
変換部414に渡され、再び対数データに変換される
(図11D参照)。なお、図4Bに示す走行騒音の波形に
対して環境騒音減算部401で減算処理を行なうと図1
2Aの波形になる。この出力を音声波形整形部402で
波形整形した結果が図12Bの波形図に示す信号であ
る。走行騒音処理の場合、この信号(データ)を音響認
識部200に出力する。
【0060】〈実施例4〉波形整形処理のパラメータ
「Level,UP,UPOFFSET,DOWN,DOWNOFFSET」(表1参照)
を用いて有音区間を検出する際に、検出に用いる波形
(有音検出用波形)として、従来の音声区間検出用の波
形(CH7)を用いるが、実験によるとCH7の波形に
対して有音/無音の判定処理を行なうと、音声レベルの
低い区間がゼロ詰めされる場合があることが判明した。
【0061】図13は有音検出用波形としてCH7(音
声区間検出用波形)を用いた波形整形処理の失敗例であ
る。図13Aにおいて点線が騒音のある波形であり、実
線が波形整形を施した波形であり、処理前の波形に比べ
て0.2秒の遅延がある。これを見ると、本来2つの音
声波形の山があるべきところで、後の山が検出できずゼ
ロ詰め処理がなされている。
【0062】上述の点を解決するために、重み付け処理
手段によりCH1からCH6の波形を用いてレベルの低
い区間を含むチャンネルに重みをかけた加算波形を作
り、これを有音検出用波形とする。重み付けは、音声レ
ベルの低い部分は子音などのように比較的高域チャンネ
ルに有る場合が多く、また走行騒音は低域チャンネルに
存在し高域に重みを付けても騒音に影響されにくいこと
から高域チャンネルを重視する。こうすることにより、
レベルの低い部分も高域チャンネルにその波形があれ
ば、その形状がゼロ詰めに反映されるようになる。
【0063】図13Bに示す有音検出用波形Yは、以下
の式1に基づいて作ったものである。この有音検出用波
形Yを用いることにより今まで検出できなかったレベル
の小さい音声の山が検出可能になり良好な波形整形処理
がなされる。 (式1) Y=(ΣXi×αi)/β Xi;iチャン
ネルのデータ 有音検出用波形(加算波形)を作る時のパラメータはC
H1〜CH6の重み係数α1〜α6と、加算結果を適当
な大きさにスケール変換するスケールファクタβの7個
からなる。実施例で加算パラメータは、 [α1,α2,α3,α4,α5,α6]/β=[1,2,3,
3,5,10]/4である。
【0064】図14は第4の発明に基づく音声波形整形
部の構成例を示すブロック図であり、本方式による重み
付け手段421を音声波形整形部402に設けたもので
ある。本実施例において本方式を適用するための構成は
実施例3の図7と同様の構成であり、騒音対策部400
の環境騒音減算部401において音声分析部100から
受け取った分析データに対し、環境騒音を減算し、その
後、波形整形処理を施し音声認識部200へ出力する。
本方式では特定のチャンネルを極端に重視するので、高
域に若干の騒音があると、その騒音も一緒に重み付け加
算され加算波形に反映してしまうので、予め減算処理に
より騒音を低減しておくことが望ましい。
【0065】減算処理後の動作は実施例3に示した内容
と殆ど同じであるが、図6のフローチャートのステップ
100において、入力した分析データf-input[CH]に対
して重み付け手段421により次式の計算を行ない有音
検出用波形Yを作成する。 (式2)Y=(Σf-input[i]×αi/β) i;チ
ャンネル番号 この有音検出用波形Yをステップ100〜115で有音
検出用波形として用いる。図15に認識実験結果(平均
値)を示す。実験条件は下記の表2の通りである。
【0066】
【表2】 音声ソース : あらかじめDATに、防音室で収録し
た話者3名の音声。地名20単語6回発声データ。3回
分を登録用、残りを認識用に用いた。 騒音ソース : 擬似雑音。ホワイトノイズをLPFを
介した後、走行騒音の特性に、近くなるようにイコライ
ジングしたものを、DATテープに記録し使用した。 システム : DATより再生した音声および騒音信
号を、それぞれライン入力し回路上でミックスし、音声
分析部へ入力した。
【0067】図15において、粗い点線151で示した
グラフが騒音対策なしのもの、細い点線152で示した
グラフが従来のHPFによる前処理を施したもの、実線
153で示したグラフがHPFの前処理の後、本発明の
騒音対策を施したものである。騒音に対する動作範囲の
拡大と認識率の向上が実現できていることが明白に示さ
れている。
【0068】なお、上記実施例1〜4において音声波形
整形部の重み付け処理手段、音声区間検出手段、波形整
形フラグ設定手段、信号波形処理手段はIC化して、音
声認識装置の駆動時に実行されるよう構成することがで
きる。
【0069】
【発明の効果】以上説明した本発明による音声認識装置
の騒音抑制効果は次の通りである。 第1の発明 音声区間検出用の波形(実施例ではCH7)が騒音の抑
制されたものとなるために、音声認識装置は騒音に影響
されることなく安定した音声区間検出動作を行なうこと
が可能となり認識性能が向上する。また、第6の発明の
方法のようにして音声認識用に使われる波形(実施例で
はCH1〜CH4)が波形整形されることで、騒音の混
入により失われた音声の特徴が復活する。従って、辞書
とのマッチングにより得られる類似度が、騒音のある波
形とのマッチングに比べて高くなり、認識性能の向上に
寄与する。 第3の発明 波形整形処理のパラメータが周囲騒音レベルに応じて最
適な値となるように適応的に設定されているので、騒音
レベルの大きな変動による語頭、語尾の欠落及び騒音の
付加が減少し、結果として認識性能が向上する。 第4の発明 本発明に基づく第1の音声認識装置に対して、設定され
たしきい値レベルよりも高い騒音レベルが入力されると
波形整形処理が行なわれなくなるので、本発明によれば
減算処理により騒音レベルが低減されているために、騒
音レベルがしきい値よりも低くなり、波形整形処理が可
能となる。また、騒音レベルが変動しても、平均騒音レ
ベルに応じて減算処理を行なっているために、波形整形
処理部に入力する騒音レベルは大きく変動しない。その
ために、波形整形処理のパラメータに対する制約が緩和
され、パラメータの変更の必要がなくなる。 第5の発明 音声のレベルの低い部分があっても、走行騒音に影響さ
れることなく有音検出を行ない、正確な波形整形処理を
可能にする。
【図面の簡単な説明】
【図1】本発明に基づく音声認識装置の基本構成を示す
ブロック図である。
【図2】図1の音声波形整形部の構成例を示すブロック
図である。
【図3】有音検出用波形としてCH7の音声区間検出用
波形を直接用いた場合の有音検出用波形と各種パラメー
タとの関係を示す説明図である。
【図4】“さっぽろ”という単語を音声入力した時の音
声分析部の出力波形図であり、部分図Aは騒音の無い時
の音声“さっぽろ”の波形図、部分図Bは騒音下の音声
“さっぽろ”の波形図、部分図Cは音声波形整形部によ
る波形整形処理後の音声“さっぽろ”の波形図である。
【図5】波形整形処理で用いるデータバッファとポイン
タとの関係の説明図である。
【図6】音声波形部の動作を示すフローチャートであ
る。
【図7】第3の発明に基づく音声認識装置の一実施例の
構成を示すブロック図である。
【図8】第4の発明に基づく音声認識装置の一実施例の
構成を示すブロック図である。
【図9】環境騒音減算部の構成例を示すブロック図であ
る。
【図10】音声分析部の対数特性図である。
【図11】図9の環境騒音減算部における減算処理の各
過程における減算処理の動作の説明図である。
【図12】図4の走行騒音に図9の環境騒音減算部での
処理を行なった場合の出力波形図である。
【図13】波形整形処理の有音検出用波形による相違を
示す波形図である。
【図14】第4の発明に基づく音声波形整形部の構成例
を示すブロック図である。
【図15】音声認識装置実験結果
【図16】従来の音声認識装置の構成を示すブロック図
である。
【符号の説明】
100 音声分析部 105 音声入力部(マイク) 200 音声認識部 400 騒音対策部 401 環境騒音減算部 402 音声波形整形部 403 騒音レベル測定部 404 パラメータ変更部 410 非対称変換部 411 騒音レベル測定部 412 減算量設定部 413 環境騒音減算処理部 414 対数変換部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声入力部により取り込まれた音声を所
    定の音声分析データに変換する音声分析部と、該音声分
    析データを波形整形処理し波形整形処理信号を得る騒音
    対策部と、該波形整形処理信号に基づいて前記音声を認
    識処理し音声認識結果を得る音声認識部を備え、前記音
    声分析部が騒音成分を含んだ音声を複数の所定帯域毎に
    分割し、第1の音声分析データとしての前記所定帯域毎
    の音声認識処理用データと第2の音声分析データとして
    の前記所定帯域の全てを含む帯域の音声区間検出用デー
    タを得る音声分析データ抽出手段を有し、前記騒音対策
    部が、有音検出用波形データに基づいて前記第1の音声
    分析データの音声区間を検出し、所定の波形整形用パラ
    メータに基づいて音声成分の有無を判定する音声区間検
    出手段と、音声区間判定結果に基づいて前記第1の音声
    分析データの音声区間の有無を判定し波形整形区間を設
    定する波形整形区間設定手段と、波形整形区間設定手段
    の設定値に基づいて前記第1の音声分析データの音声区
    間内に含まれる無音区間を略ゼロ詰め処理して波形整形
    し波形整形処理信号を得る信号波形整形処理手段と、を
    有する音声波形整形部を含むことを特徴とする音声認識
    装置。
  2. 【請求項2】 請求項1記載の音声認識装置において、
    有音検出用波形データが第2の音声分析データであるこ
    とを特徴とする音声認識装置。
  3. 【請求項3】 請求項2記載の音声認識装置において、
    騒音対策部が、更に、第1の音声分析データから該デー
    タに含まれる騒音レベルを検出してレベル検出信号を得
    る騒音レベル検出手段と、前記レベル検出手段に基づい
    て、所定の波形整形用パラメータを騒音レベル変動に応
    じて変更するように調整制御する波形整形用パラメータ
    調節制御手段と、を含むことを特徴とする音声認識装
    置。
  4. 【請求項4】 請求項1記載の音声認識装置において、
    音声波形整形部が、更に、第1の音声分析データのうち
    所定レベル以下のデータを検出し該検出データの略高域
    成分に所定の重み付け処理を行ない重み付け処理信号を
    得る重み付け処理手段を有し、前記重み付け処理信号を
    有音検出用波形データとして音声区間検出手段に与える
    ことを特徴とする音声認識装置。
  5. 【請求項5】 請求項2または4に記載の音声認識装置
    において、騒音対策部が、更に、第1の音声分析データ
    を、該データに含まれた騒音成分の平均騒音レベルに基
    づく減算量により所定レベルに減算処理し、減算処理の
    結果を第1の音声分析データとして音声波形整形部に入
    力する騒音減算部を有することを特徴とする音声認識装
    置。
  6. 【請求項6】 音声入力部により取り込まれた音声を音
    声分析部にて所定の音声分析データに変換し音声分析
    し、その分析された音声出力を音声波形整形部で波形整
    形して、整形された音声を音声認識部で認識処理し音声
    認識結果を得る音声認識方法において、 前記音声波形部により前記分析された音声出力が所定の
    しきい値を越え、その越えている期間が所定フレーム継
    続すると有音と判定する立上り判定ステップと、 前記音声波形部により前記分析された音声出力が所定の
    しきい値を下回り、その下回っている期間が所定フレー
    ム継続すると無音が以降に続くと判定する立下り判定ス
    テップと、 を含むことを特徴とする音声認識方法。
JP4212180A 1992-07-16 1992-07-16 音声認識装置及び方法 Pending JPH0635498A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4212180A JPH0635498A (ja) 1992-07-16 1992-07-16 音声認識装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4212180A JPH0635498A (ja) 1992-07-16 1992-07-16 音声認識装置及び方法

Publications (1)

Publication Number Publication Date
JPH0635498A true JPH0635498A (ja) 1994-02-10

Family

ID=16618244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4212180A Pending JPH0635498A (ja) 1992-07-16 1992-07-16 音声認識装置及び方法

Country Status (1)

Country Link
JP (1) JPH0635498A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212195A (ja) * 1995-12-12 1997-08-15 Nokia Mobile Phones Ltd 音声活性検出装置及び移動局並びに音声活性検出方法
JP2005223595A (ja) * 2004-02-05 2005-08-18 Toppan Forms Co Ltd 音声認識システムおよびそのプログラム
JP2019191557A (ja) * 2018-04-20 2019-10-31 百度在線網絡技術(北京)有限公司 音声認識方法、装置、機器及び記憶媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09212195A (ja) * 1995-12-12 1997-08-15 Nokia Mobile Phones Ltd 音声活性検出装置及び移動局並びに音声活性検出方法
JP2008293038A (ja) * 1995-12-12 2008-12-04 Nokia Corp 音声活性検出装置及び移動局並びに音声活性検出方法
JP2005223595A (ja) * 2004-02-05 2005-08-18 Toppan Forms Co Ltd 音声認識システムおよびそのプログラム
JP4509590B2 (ja) * 2004-02-05 2010-07-21 トッパン・フォームズ株式会社 音声認識システムおよびそのプログラム
JP2019191557A (ja) * 2018-04-20 2019-10-31 百度在線網絡技術(北京)有限公司 音声認識方法、装置、機器及び記憶媒体
US11087763B2 (en) 2018-04-20 2021-08-10 Baidu Online Network Technology (Beijing) Co., Ltd. Voice recognition method, apparatus, device and storage medium

Similar Documents

Publication Publication Date Title
JP2995737B2 (ja) 改良されたノイズ抑圧システム
KR100870889B1 (ko) 음신호 처리 방법, 음신호 처리 장치 및 기록 매체
US8612222B2 (en) Signature noise removal
US4558459A (en) Speech recognition system for an automotive vehicle
JP2654503B2 (ja) 無線端末装置
US5579431A (en) Speech detection in presence of noise by determining variance over time of frequency band limited energy
EP1153387B1 (en) Pause detection for speech recognition
EP0459384B1 (en) Speech signal processing apparatus for cutting out a speech signal from a noisy speech signal
US8990092B2 (en) Voice recognition device
JPH0635498A (ja) 音声認識装置及び方法
JP2701431B2 (ja) 音声認識装置
JPH0449952B2 (ja)
JP3106543B2 (ja) 音声信号処理装置
JPH03114100A (ja) 音声区間検出装置
JP3255077B2 (ja) 電話機
JPH07101853B2 (ja) 雑音低減方法
JPH06208393A (ja) 音声認識装置
JP3125928B2 (ja) 音声認識装置
JP2666296B2 (ja) 音声認識装置
JPH04230798A (ja) 雑音予測装置
CN113748461A (zh) 对话检测器
JPH01200294A (ja) 音声認識装置
JPS6227798A (ja) 音声認識装置
JPH09297596A (ja) 音声認識装置
KR100322203B1 (ko) 차량의 음성인식장치 및 그 방법