JP3106543B2 - 音声信号処理装置 - Google Patents

音声信号処理装置

Info

Publication number
JP3106543B2
JP3106543B2 JP03117276A JP11727691A JP3106543B2 JP 3106543 B2 JP3106543 B2 JP 3106543B2 JP 03117276 A JP03117276 A JP 03117276A JP 11727691 A JP11727691 A JP 11727691A JP 3106543 B2 JP3106543 B2 JP 3106543B2
Authority
JP
Japan
Prior art keywords
noise
voice
signal
section
cepstrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03117276A
Other languages
English (en)
Other versions
JPH04230800A (ja
Inventor
丈二 加根
明 野原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP03117276A priority Critical patent/JP3106543B2/ja
Publication of JPH04230800A publication Critical patent/JPH04230800A/ja
Application granted granted Critical
Publication of JP3106543B2 publication Critical patent/JP3106543B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号処理装置に関
し、特に、雑音混じりの音声信号に付いて音声信号を切
り出す音声切り出し装置、その切り出された音声を利用
して音声認識を行う音声認識装置などの信号処理装置、
並びに、音声認識の前段などに用いられる信号処理装置
に関する。
【0002】
【従来の技術】従来、音声認識装置では、雑音混じりの
音声信号中から、フィルタなどを用いて音声部分を見つ
けだして、パターンマッチング法などを用いて音声認識
を行っている(例えば、特開昭59-121099号公報、特開
昭62-179000号公報参照)。しかしながら、このような
フィルタなどを用いて音声部分を切り出す方法では誤認
識率が高かった。特に、雑音が多く混じっている音声信
号に付いては、その誤認識率が高いという課題がある。
【0003】図22に従来の音声信号処理装置を示す。図
22に示すように、従来の音声信号処理装置は、雑音混じ
りの音声信号について、その音声部分を検出する音声検
出手段451と、その音声検出手段451によって検出された
音声区間から雑音区間を算出する雑音算出手段452と、
その雑音算出手段452からミュートするための制御信号
を発生するミューティング制御手段453と、そのミュー
ティング制御信号に従い、前記雑音混じりの音声信号に
付いて、雑音区間のみ信号を減衰させるミュート手段45
4とを備えている。
【0004】この従来の音声信号処理装置は、音声検出
手段451で雑音混じりの音声信号から音声区間を検出
し、雑音算出手段452によって、反転させるなどして雑
音区間を算出し、ミューティング制御手段453によっ
て、その雑音区間に付いての制御信号を発生し、ミュー
ト手段454によって、雑音混じりの音声信号について雑
音区間の信号を減衰させる。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声信号処理装置では、まだ雑音の抑制が十
分ではなく、音声認識装置などの前段階に用いられた場
合など、誤認識率が高かった。
【0006】かかる点に鑑み、本発明の第1の目的は、
上記の従来の音声認識装置の課題を解決するものであっ
て、ケプストラム分析法を利用した正確な音声切り出し
を行える信号処理装置を提供することにある。
【0007】また、本発明の第2の目的は、上記の従来
の音声認識装置の課題を解決するものであって、雑音を
除去した音声信号に付いて、音声切り出しを行える信号
処理装置を提供することにある。
【0008】また、本発明の第3の目的は、上記の従来
の信号処理装置の課題を考慮し、雑音を効果的に抑制で
きる信号処理装置を提供することにある。
【0009】また、本発明の第4の目的は、上記の従来
の信号処理装置の課題を考慮し、雑音除去を行った上、
さらに雑音を減衰させる信号処理装置を提供することに
ある。
【0010】
【課題を解決するための手段】上記目的を達成するため
本発明は、入力された雑音を含む音声信号の周波数帯域
を分割する帯域分割手段と、前記帯域分割手段の帯域分
割出力が入力されケプストラム分析を行うケプストラム
分析手段と、前記ケプストラム分析手段におけるケプス
トラム分析出力におけるケプストラムピークを検出する
ピーク検出手段と、前記ケプストラム分析手段のケプス
トラム分析出力における平均値レベルを算出する平均算
出手段を具備し、前記ピーク検出手段のピーク検出情報
に基づいて母音を判定するとともに前記平均値算出手段
の平均値情報に基づいて子音を判定する母音/子音判定
手段とを備え、前記母音/子音判定手段によって判定さ
れた母音/子音判定結果が存在する区間を音声区間とし
て算出する音声算出手段と、前記音声算出手段によって
算出される音声区間情報が存在しない区間を雑音区間と
して算出する雑音算出手段と、前記雑音算出手段によっ
て算出された雑音区間情報に基づいて、前記入力された
雑音を含む音声信号における雑音区間のレベルを減衰さ
せるミュート手段を備えたことを特徴とする音声信号処
理装置である。
【0011】
【0012】
【0013】
【0014】
【0015】
【0016】
【作用】上記した構成により本発明は、入力信号に対す
るケプストラム分析信号出力におけるケプストラムピー
ク信号等を用いて、音声信号区間を判断し、この音声検
出信号によって雑音環境中の音声信号に対する音声信号
区間検出をする。
【0017】
【実施例】以下に本発明にかかる各実施例について図面
を参照して説明する。
【0018】<第1の実施例>図1は本発明にかかる第
1の実施例の信号処理装置の一実施例を示すブロック図
である。
【0019】帯域分割手段1は、A/D変換手段とフー
リエ変換手段とを備え、帯域を分割する手段である。
【0020】ケプストラム分析手段2は、スペクトラム
信号についてのケプストラムを求める手段である。図5
(a)はそのスペクトラム、(b)はそのケプストラムを示
す。音声判別手段3は、ケプストラム分析手段2で得ら
れたケプストラムに基づいて音声部分の判別を行う手段
である。具体的には、図3に示すように、ピーク検出手
段31と、平均値算出手段32と、音声判別回路33を備えて
いる。このピーク検出手段31は、ケプストラム分析手段
2で得られたケプストラムについて、そのピーク(ピッ
チ)を求める手段である。他方、平均値算出手段32は、
ケプストラム分析手段2で得られるケプストラムの平均
値を算出する手段である。音声判別回路33は、ピーク検
出手段31から供給されるケプストラムのピークと平均値
算出手段32から供給されるケプストラムの平均値を用い
て音声部分を判別する回路である。例えば、母音と子音
を判別して、音声部分を的確に判別するものである。す
なわち、ピーク検出手段31からピークが検出されたこと
を示す信号が入力された場合には、その音声信号入力は
母音区間であると判断する。また、子音の判定について
は、例えば平均値算出手段32より入力されるケプストラ
ム平均値が予め決められた規定値より大きな場合、或は
そのケプストラム平均値の増加量(微分係数)が予め決
められた規定値より大きな場合は、音声信号入力は子音
区間であると判定する。そして結果としては、母音/子
音を示す信号、或は母音と子音を含んだ音声区間を示す
信号を出力する。
【0021】音声切り出し手段4は、雑音混じりの音声
信号に付いて、音声判別手段3の結果に基づき、音声部
分を切り出す手段である。例えば、最も単純な回路とし
ては、音声部分のあるタイミングに合わせて、スイッチ
をオン・オフするスイッチング素子である。
【0022】次に、図1に示す実施例の動作を説明す
る。雑音混じりの音声信号は、帯域分割手段1入力にさ
れ、帯域分割される。そしてこの帯域分割された信号
は、ケプストラム分析手段2によってケプストラム分析
され、そのケプストラム分析結果を利用して、音声判別
手段3は音声部分を検出する。音声切り出し手段4は、
雑音混じりの音声信号について、音声判別手段3の結果
を利用して、音声部分のみを正確に切り出すことが出来
る。
【0023】<第2の実施例>図2は、本発明にかかる
第2の実施例を示すブロック図である。
【0024】本実施例は、図1の実施例の音声切り出し
手段4で得られた音声信号を利用して音声認識を行う音
声認識装置である。すなわち、前記音声切り出し手段4
の後に、その切り出された音節などの特徴を抽出する特
徴抽出手段5が接続され、その後に、その抽出された特
徴と、記憶手段7に予め記憶されている標準となる音節
などの標準特徴とを比較して、その音節の種類を認識す
る特徴比較手段6が接続されている。その記憶手段7に
予め特徴を記憶させる場合、本実施例の別経路8を利用
して、既知の人の音声を音声信号入力端子9に入力さ
せ、帯域分割、ケプストラム分析、音声判別、音声切り
出し、特徴抽出を順次行い、得られた音声特徴をその人
情報とともに記憶手段7に記憶させておけばよい。この
ように、この音声認識の実施例は、音声部分が正確に切
り出されるので、音声認識率が高くなる。
【0025】<第3の実施例>図4は本発明にかかる第
3の実施例を示すブロック図である。
【0026】図2に示す第2の実施例と図4に示す第3
の実施例を組み合わせたものであって、音声判別手段3
として、ピーク検出手段31と、平均値算出手段32とを用
い、また、音声切り出し手段4の出力に付いて音声認識
を行うものである。
【0027】<第4の実施例>図6は、本発明にかかる
第4の実施例の信号処理装置を概略的に示すブロック図
である。
【0028】音声検出手段101は、雑音混じりの音声信
号を入力し、その音声部分を検出する手段である。例え
ば、フィルタなどを用いて音声部分と、雑音のみの部分
とを区別する手段である。
【0029】雑音予測手段102は、音声検出手段101によ
って、音声部分が検出されると、それを利用して、それ
以外の部分を雑音のみの部分と判断できる。そこで、そ
の雑音のみの区間の雑音データを利用して音声部分の区
間の中の雑音データを予測する手段である。
【0030】キャンセル手段103は、その雑音予測手段1
02によって、予測された雑音を前記雑音混じりの音声信
号からキャンセルする手段である。一般に、キャンセル
の方法の一例として、時間軸でのキャンセレーション
は、図10に示すように、雑音混入音声信号(a)から予
測された雑音波形(b)を引算するものである。それによ
って信号のみが取り出される(c)。
【0031】音声切り出し手段104は、キャンセル手段1
03によって、その雑音がキャンセルされた音声信号に付
いて、前記音声検出手段101により検出された音声部分
に基づき、音声部分を切り出す手段である。
【0032】<第5の実施例>図7は、図6の第4の実
施例において、チャンネル分割を使用する場合の第5の
実施例を示すブロック図である。
【0033】本実施例では、雑音混じりの音声信号が帯
域手段105によって、チャンネル分割されるようになっ
ている。例えば、A/D変換手段とフーリエ変換手段と
を備え、帯域を分割する手段である。
【0034】また、音声検出手段101は、ケプストラム
分析手段111と音声判別手段112とを有する。このケプス
トラム分析手段111は、帯域分割手段105によって帯域分
割された雑音混じりの音声信号のスペクトラム信号につ
いてのケプストラムを求める手段である。図5(a)はそ
のスペクトラム、(b)はそのケプストラムを示す。音声
判別手段112は、ケプストラム分析手段111で得られたケ
プストラムに基づいて音声部分の判別を行う手段であ
る。具体的には、ピーク検出手段と、平均値算出手段
と、音声判別回路を備えている。そのピーク検出手段
は、ケプストラム分析手段111で得られたケプストラム
について、そのピーク(ピッチ)を求める手段である。
他方、平均値算出手段は、ケプストラム分析手段111で
得られるケプストラムの平均値を算出する手段である。
音声判別回路は、ピーク検出手段から供給されるケプス
トラムのピークと平均値算出手段から供給されるケプス
トラムの平均値を用いて音声部分を判別する回路であ
る。例えば、母音と子音を判別して、音声部分を的確に
判別するものである。すなわち、ピーク検出手段からピ
ークが検出されたことを示す信号が入力された場合に
は、その音声信号入力は母音区間であると判断する。ま
た、子音の判定については、例えば平均値算出手段より
入力されるケプストラム平均値が予め決められた規定値
より大きな場合、或はそのケプストラム平均値の増加量
(微分係数)が予め決められた規定値より大きな場合
は、音声信号入力は子音区間であると判定する。そして
結果としては、母音/子音を示す信号、或は母音と子音
を含んだ音声区間を示す信号を出力する。
【0035】また、雑音予測手段102は、帯域分割され
た雑音混じりの音声信号に付いて、雑音区間での雑音デ
ータに基づいて、音声区間の雑音を予測する手段であ
る。すなわち、この雑音予測手段102は、mチャンネル
に分割された音声/雑音入力に基づき、雑音成分を各チ
ャンネル毎に予測する手段である。例えば、図11に示す
ように、x軸に周波数、y軸に音声レベル、z軸に時間
をとるとともに、周波数f1のところのデータp1,p2,・・
・,piをとり、その先のpjを予測する。例えば、雑音部
分p1〜piの平均をとりpjとする。あるいは更に、音声信
号部分が続くときはpjに減衰係数を掛けるなどである。
【0036】また、キャンセル手段103は、帯域分割手
段105及び雑音予測手段102よりmチャンネルの信号が供
給され、チャンネル毎に雑音を引算するなどしてキャン
セルし、帯域合成手段106へ供給する手段である。本実
施例のようなチャンネルを利用する場合は、図12に示
すように、周波数を基準にしたキャンセレーションであ
り、雑音混入音声信号(a)をフーリエ変換し(b)、それか
ら予測雑音のスペクトル(c)を引き(d)、それを逆フーリ
エ変換して、雑音の無い音声信号を得る(e)ものであ
る。帯域合成手段106は、キャンセル手段103より供給さ
れるmチャンネルの信号を逆フーリエ変換して品質のよ
い音声出力を得る手段である。
【0037】次に、図7の実施例の動作を説明する。雑
音混じりの音声信号は、帯域分割手段105によって帯域
分割され、キャンセル手段103へ入力される。また、ケ
プストラム分析手段111へも入力され、ケプストラム分
析される。このケプストラム分析結果は、音声判別手段
112へ入力され、音声部分、雑音のみの部分が区分けさ
れる。雑音予測手段102は、帯域された音声信号に付い
て、雑音のみに部分のデータに基づいて、音声信号分内
の雑音を予測する。キャンセル手段103は、この予測さ
れた雑音を、雑音混じりの音声信号から除去する。雑音
が除去された音声信号は、帯域合成手段106によって合
成される。音声切り出し手段104は、その合成された信
号から、音声判別手段112の結果を利用しながら、単語
毎、又は「ア」、「イ」、「ウ」等の音節毎、さらには
音素毎に切り出しを行う。
【0038】<第6の実施例>図8は、図6の第4の実
施例で得られた音声に付いて、音声認識を行う第6の実
施例の音声認識装置を示すブロック図である。
【0039】音声切り出し手段104の後に、その切り出
された音節などの特徴を抽出する特徴抽出手段107が接
続され、その後に、その抽出された特徴と、記憶手段10
8に予め記憶されている標準となる音節などの標準特徴
とを、パターンマッチング法等の方法により比較して、
その音節の種類を認識する特徴比較手段109が接続され
ている。その記憶手段108に予め特徴を記憶させる場
合、本実施例の別経路110を利用して、既知の人の音声
を音声信号入力端子111に入力させ、帯域分割、ケプス
トラム分析、音声判別、音声切り出し、特徴抽出を順次
行い、得られた音声特徴を、その人情報とともに記憶手
段108に記憶させておけばよい。このように、この音声
認識の実施例は、雑音が予測されて除去された音声を対
象に音声認識を行うので、特に音声認識率が高くなる。
【0040】<第7の実施例>図9は、図7の第5の実
施例で得られた音声に付いて、音声認識を行う第7の実
施例の音声認識装置を示すブロック図である。
【0041】すなわち、雑音混じりの音声信号は、mチ
ャンネルに帯域分割され、ケプストラム分析され、音声
部分が判別された結果に基づいて、雑音を予測してキャ
ンセルし、その音声に付いて、音声認識が行われる。
【0042】<第8の実施例>図13は、本発明にかか
る第8の実施例における音声信号処理装置のブロック図
である。
【0043】図13において、201は、信号を周波数分
析する周波数分析手段の一例としての帯域分割手段であ
り、特に信号をA/D変換するA/D変換手段と、フー
リエ変換するFFT手段とを備え、202は、ケプストラ
ム分析を行うケプストラム分析手段、203はケプストラ
ム分析結果を利用して、音声部分を判別する音声判別手
段である。更に具体的に述べると、音声判別手段203
は、図15に示すように、ケプストラム分布のピークを
検出するピッチ検出手段の一例としてのピーク検出手段
231、ケプストラム分布の平均値を算出する平均値算出
手段232、母音と子音を判定する母音/子音判定手段23
3、音声判別回路234を有する。
【0044】雑音算出手段204は、その音声判別手段203
によって判別された音声区間情報に基づいて、雑音区間
を算出する手段である。例えば、音声区間を反転するな
どである。ミューティング制御手段205は、その雑音区
間に付いての制御信号を発生する手段であって、例え
ば、雑音区間の始まりと終わりのタイミングを発生する
回路である。ミュート手段206は、このミューティング
制御信号にしたがって、雑音混じりの音声信号について
雑音区間の信号を減衰させる手段である。
【0045】次に、上記実施例の動作を説明する。雑音
混じりの音声信号は、帯域分割手段201によって、帯域
分割され、更に、ケプストラム分析手段202によって、
ケプストラム分析を行う。ケプストラムとは、波形の短
時間振幅スペクトルの対数の逆フーリエ変換であって、
図5に示すようなものである。図5(a)は、短時間スペ
クトルであって、同図(b)は、そのケプストラムであ
る。ピーク検出手段231は、そのケプストラム分析結果
に付いてピーク(ピッチ)を検出する。図5(b)のピッ
チがそのピークを示し、そのピークが存在するところが
音声信号部分である。そのピークの検出は、例えば所定
の閾値を予め設定しておき、それとの比較を行うことに
よって検出する。平均値算出手段232はケプストラム分
析結果に付いての平均値を算出する。母音/子音判定手
段233は、このピーク情報と、平均値情報によって、母
音/子音を判定する。すなわち、ピーク検出手段231が
らピークが検出されたことを示す信号が入力された場合
には、その音声信号入力は母音区間であると判断する。
また、子音の判定については、例えば平均値算出手段23
2より入力されるケプストラム平均値が予め決められた
規定値より大きな場合、或はそのケプストラム平均値の
増加量(微分係数)が予め決められた規定値より大きな
場合は、音声信号入力は子音区間であると判定する。そ
して結果としては、母音/子音を示す信号、或は母音と
子音を含んだ音声区間を示す信号を出力する。音声判別
回路234は、その母音/子音判定手段233の出力に基づ
き、音声区間を判定する。雑音算出手段204は、この音
声区間情報を反転させるなどして、雑音区間を算出す
る。ミューティング制御手段205は、この雑音区間情報
を利用して、制御信号を出力する。ミュート手段206
は、この制御信号に従い、雑音混じりの音声信号の雑音
区間のレベルを減衰させる。
【0046】<第9の実施例>図14は、本発明にかか
る第9の実施例を示すブロック図である。
【0047】本実施例は、全てディジタル処理で行われ
るものである。A/D変換手段207は、雑音混じりの音
声信号をディジタル信号に変換する手段である。FFT
208は、このディジタル信号をフーリエ変換する手段で
ある。ケプストラム分析手段202、音声判別手段203、雑
音算出手段204、ミューティング制御手段205は、図13
の第8の実施例と同じである。ディジタルミュート手段
208は、ミューティング制御手段205からの制御信号に従
い、A/D変換手段207から出力されたディジタル信号
を減衰させるディジタル機能を有する手段である。D/
A変換手段209は、ディジタルミュート手段208のディジ
タル出力をアナログ信号に変換する手段である。
【0048】これら手段によって、全てディジタル的に
処理され雑音区間は減衰される。<第10の実施例>図1
6は、本発明にかかる第10の実施例を示す図である。
【0049】音声検出手段210は、雑音混じりの音声信
号の音声部分を検出する手段である。例えば、図13
の、帯域分割手段201、ケプストラム分析手段202、音声
判別手段203等である。あるいは、フィルタなどを用い
た回路であってもよい。
【0050】記憶手段211は、予め色々な人の音声信号
の特徴を記憶したROM等の手段である。この記憶手段
211には、特定の人の音声特徴を選択させ、出力させる
音声選択信号が入力されるようになっている。最ゆう検
出手段212は、前記音声検出手段210で検出された音声部
分に付いて、記憶手段211から選択されて出力される音
声特徴と比較し、その音声が誰のものであるかを検出す
る手段である。その方法としては、パターンマッチング
法、振幅レベルの類似度、位相の類似度を調べる方法な
どがある。それによって、現在でている音声は、選択さ
れた人の音声かどうかを検出できる。雑音算出手段204
は、前記音声検出手段210の出力と、最ゆう検出手段212
の出力とを入力し、音声検出手段204からの信号に基づ
いて、音声以外の雑音区間を算出し、また、最ゆう検出
手段212の出力信号に基づいて、選択された人の音声で
あるか、それ以外の人の音声、すなわち雑音であるかど
うかを算出する。ミューティング制御手段205、ミュー
ト手段206は、図13の第8の実施例のものと同じであ
る。
【0051】本実施例の動作は次の通りである。予め、
色々な人(A,B,C・・・)の音声の特徴を記憶手段
211に書き込んでおく。そして、特定の人(例えば、
A)の音声を選択する音声選択信号を入力させておく。
その結果、記憶手段211からは、Aの音声の特徴情報
が、最ゆう検出手段212へ入力される。
【0052】いま、自動車をAが運転しており、Bが同
乗者として乗っているとする。運転しているAは、音声
を用いて、音声ダイヤルやハンドフリー通話を行う。そ
のAの発する音声には、自動車のエンジン音などの本来
の雑音が入るほか、同乗者のBの話声などが入る。
【0053】音声検出手段210は、これら雑音混じりの
音声を入力し、音声部分を検出する。検出された音声信
号は、雑音算出手段204と最ゆう検出手段212へ入力され
る。最ゆう検出手段212は、この検出された音声の特徴
と、記憶手段211から出力されたAの音声特徴とを比較
し、その音声がAか否か判断する。したがって、検出さ
れた音声がBの場合は、Aではないという判断結果がで
る。また、検出された音声がAの場合は、Aという判断
結果がだされる。
【0054】雑音算出手段204は、音声検出手段210から
の信号に基づき、音声でないエンジン音などの信号区間
を雑音区間とするとともに、最ゆう検出手段212の判断
結果を入力し、Aでない人の音声をも雑音として、本来
の雑音とともに雑音区間としてする。また、Aの音声の
みを音声区間とする。その結果をミューティング制御手
段205へ出力する。ミューティング制御手段205はその入
力に応じて、制御信号を出力する。ミュート手段206
は、その制御信号を受けて、雑音区間に付いて信号を減
衰する。これによって、エンジン音はもちろん、Aでな
い人の音声も雑音として減衰されるので、雑音が十分抑
制されたAの音声信号が得られる。従って、音声ダイヤ
ルやハンドフリー通話がまちがいなく行われる。
【0055】<第11の実施例>図17は、図16に示す
第10の実施例の音声検出手段210が、帯域分割手段201、
ケプストラム分析手段202、音声判別手段203である場合
の第11の実施例の信号処理装置のブロック図である。こ
れら手段は、図13の第8の実施例のものと同じである
のでその説明は省略する。本実施例では、ケプストラム
分析が用いられるので、記憶手段211や最ゆう検出手段2
12で用いられる音声特徴も、ケプストラム分析結果のピ
ーク情報や、平均値情報や、ホルマント情報が用いられ
ることが望ましい。
【0056】<第12の実施例>図18は、図17に示す
第11の実施例の音声判別手段203が、ピーク検出手段23
1、平均値算出手段232、母音/子音判定手段233及び音
声判別回路234とで構成される場合の第12の実施例の信
号処理装置を示すブロック図である。それら各手段は、
図15で示されるものと同じであるのでその説明は省略
する。本実施例では、母音/子音が判定されるので、よ
り一層音声部分の判断が正確になる。
【0057】<第13の実施例>図19は、本発明にかか
る第13の実施例の音声信号処理装置のブロック図、図2
0はそれを具体化した実施例を示すブロック図である。
以下、両図の実施例に付いて関連させながら説明する。
【0058】19において、音声検出手段301は、雑
音混じりの音声信号に音声部分を検出するための手段で
あって、例えば、図20に示すような、帯域分割手段30
7、ケプストラム分析手段308、音声判別手段309等から
構成される。すなわち、帯域分割手段307は、雑音混じ
りの信号を帯域分割する帯域分割手段であり、例えば、
信号をA/D変換するA/D変換手段と、フーリエ変換
するFFT手段とを備える。ケプストラム分析手段308
におけるケプストラムとは、波形の短時間振幅スペクト
ルの対数の逆フーリエ変換であって、図5に示すような
ものである。図5(a)は、短時間スペクトルであって、
同図(b)は、そのケプストラムである。音声判別手段309
は、例えば、ケプストラム分布のピークを検出するピッ
チ検出手段、ケプストラム分布の平均値を算出する平均
値算出手段、母音と子音を判定する母音/子音判定手
段、音声判別回路から構成され、音声部分を判別する。
【0059】雑音算出手段304は、その音声検出手段301
によって判別された音声区間情報に基づいて、雑音区間
を算出する手段である。例えば、音声区間を反転するな
どである。ミューティング制御手段305は、その雑音区
間に付いての制御信号を発生する手段であって、例え
ば、雑音区間の始まりと終わりのタイミングを発生する
回路である。なお、このミューティング制御手段305
は、外部から与えられるミューティングON/OFF制
御信号に従って制御信号を出力するようになっている。
このミューティングON/OFF制御信号はマニュアル
で設定される外部信号であって、入力信号が雑音だけの
とき又は処理時に雑音が不要のときはオンとされ、処理
時に雑音が存在してもよいときにはオフとされる。雑音
予測手段302は、音声検出手段301によって、音声部分が
検出されると、それを利用して、それ以外の部分の雑音
のみの部分と判断できる。そこで、その雑音のみの区間
の雑音データを利用して音声部分の区間の中の雑音デー
タを予測する手段である。すなわち、図20に示すよう
に、この雑音予測手段302は、mチャンネルに分割され
た音声/雑音入力に基づき、雑音成分を各チャンネル毎
に予測する。例えば、図11に示すように、x軸に周波
数、y軸に音声レベル、z軸に時間をとるとともに、周
波数f1のところのデータp1,p2,・・・,piをとり、その
先のpjを予測する。例えば、雑音部分p1〜piの平均をと
りpjとする。あるいは更に、音声信号部分が続くときは
pjに減衰係数を掛けるなどである。
【0060】キャンセル手段303は、その雑音予測手段3
02によって、予測された雑音を前記雑音混じりの音声信
号からキャンセルする手段である。一般に、キャンセル
の方法の一例として、時間軸でのキャンセレーション
は、図10に示すように、雑音混入音声信号(a)から予
測された雑音波形(b)を引算するものである。それによ
って信号のみが取り出される(c)。また、図20の実施
例のような周波数軸でのキャンセルは、図12に示すよ
うに、周波数を基準にしたキャンセレーションであり、
雑音混入音声信号(a)をフーリエ変換し(b)、それから予
測雑音のスペクトル(c)を引き(d)、それを逆フーリエ変
換して、雑音の無い音声信号を得る(ホ)ものである。
すなわち、キャンセル手段303は、帯域分割手段7及び
雑音予測手段302よりmチャンネルの信号が供給され、
チャンネル毎に雑音を引算するなどしてキャンセルする
手段である。帯域合成手段306は、キャンセル手段303よ
り供給されるmチャンネルの信号を逆フーリエ変換して
品質のよい音声出力を得る手段である。
【0061】ミュート手段306は、前記ミューティング
制御手段305から出力される制御信号に従い、前記キャ
ンセル手段303からの出力信号について雑音区間の信号
を減衰させる手段である。
【0062】次に上記実施例の動作を、図20の実施例
の場合を例に取って、説明する。雑音混じりの音声信号
は、帯域分割手段301によって帯域分割され、更に、ケ
プストラム分析手段302によって、ケプストラム分析を
行う。音声判別手段309のピーク検出手段は、そのケプ
ストラム分析結果に付いてピーク(ピッチ)を検出す
る。図5(b)のピッチがそのピークを示し、そのピーク
が存在するところが音声信号部分である。そのピークの
検出は、例えば所定の閾値を予め設定しておき、それと
の比較を行うことによって検出する。また、音声判別手
段309の平均値算出手段はケプストラム分析結果に付い
ての平均値を算出する。さらに、音声判別手段309の母
音/子音判定手段は、このピーク情報と、平均値情報に
よって、母音/子音を判定する。すなわち、ピーク検出
手段からピークが検出されたことを示す信号を入力され
た場合には、その音声信号入力は母音区間であると判断
する。また、子音の判定については、例えば平均値算出
手段より入力されるケプストラム平均値が予め決められ
た規定値より大きな場合、或はそのケプストラム平均値
の増加量(微分係数)が予め決められた規定値より大き
な場合は、音声信号入力は子音区間であると判定する。
そして結果としては、母音/子音を示す信号、或は母音
と子音を含んだ音声区間を示す信号を出力する。音声判
別回路は、その母音/子音判定手段の出力に基づき、音
声区間を判定する。
【0063】雑音算出手段304は、この音声区間情報を
反転させるなどして、雑音区間を算出する。ミューティ
ング制御手段305は、この雑音区間情報を利用して、制
御信号を出力する。ミュート手段306は、この制御信号
に従い、雑音混じりの音声信号の雑音区間のレベルを減
衰させる。なお、ミューティングON/OFF制御信号
がOFFの場合は、減衰させない。
【0064】雑音予測手段302は、帯域分割された音声
信号に付いて、音声判別手段309からの信号を利用し
て、雑音のみに部分のデータに基づいて、音声信号部分
内の雑音を予測する。キャンセル手段303は、この予測
された雑音を、帯域分割手段307から出力される帯域分
割された雑音混じりの信号から除去する。雑音が除去さ
れた音声信号は、帯域合成手段310によって合成され
る。
【0065】ミュート手段306は、前記ミューティング
制御信号に従い、帯域合成された信号から、雑音区間の
信号を減衰させる。
【0066】<第14の実施例>図21は、本発明にかか
る第14の実施例を示すブロック図である。
【0067】本実施例は、図19の第13の実施例に、雑
音パワー算出手段311が追加されている。すなわち、こ
の雑音パワー算出手段311は、音声検出手段301で検出さ
れた音声部分情報を入力し、雑音部分のパワーを算出す
る手段である。そして、前記ミューティング制御手段30
5は、この雑音パワー算出手段311の算出結果に基づき、
雑音の減衰をするかしないか、あるいはその程度をコン
トロールするようにするなどを行うようになっている。
図19及び図20の第13の実施例では、ミューティング
制御手段305へ入力されるミューティングON/OFF
制御信号が外部からの固定された信号であるのに対し
て、本実施例では、雑音パワーの大きさに対応して、例
えば、雑音が大きいときのみ、雑音の減衰を行わせ、雑
音が比較的小さいときは、減衰を行わせ無いようにして
いるものである。
【0068】なお、以上の実施例において、ケプストラ
ム分析手段、音声切り出し手段、音声検出手段、雑音算
出手段、ミュート手段、キャンセル手段などの各種手段
は、コンピュータを利用してソフトウェア的に実現でき
るが、専用のハード回路を用いても実現可能である。
【0069】
【発明の効果】以上説明したように、本発明にかかる信
号処理装置は、雑音の混入した音声信号に付いて、ケプ
ストラム分析法によって、音声部分を正確に判別し、そ
れを利用して音声を切り出すので、その音声切り出しは
的確なものとなる。
【0070】また、雑音の混入した音声信号に付いて、
雑音を予測し、その雑音を除去することによって、品質
のよい音声信号を得、その中から音声を切り出すので、
その音声切り出しは的確なものとなる。
【0071】また、ケプストラム分析を利用して雑音部
分を算出しているので、よりいっそう正確に雑音減衰が
可能となる。
【0072】さらに、音声部分の雑音をキャンセルし
て、さらに雑音区間の雑音を減衰させるものであるの
で、よりいっそう効果的な雑音減衰が可能となる。
【図面の簡単な説明】
【図1】 本発明にかかる第1の実施例の信号処理装置
を示すブロック図
【図2】 本発明にかかる第2の実施例の信号処理装置
を示すブロック図
【図3】 音声判別手段を具体的に示した場合の実施例
の信号処理装置を示すブロック図
【図4】 本発明にかかる第3の実施例の信号処理装置
を示すブロック図
【図5】 本発明のケプストラム分析を説明するための
【図6】 本発明にかかる第4の実施例に信号処理装置
を示すブロック図
【図7】 本発明にかかる第5の実施例の信号処理装置
を示すブロック図
【図8】 本発明にかかる第6の実施例の信号処理装置
を示すブロック図
【図9】 本発明にかかる第7の実施例の信号処理装置
を示すブロック図
【図10】 本発明におけるキャンセル方法を説明する
ためのグラフ
【図11】 本発明における雑音予測を説明するための
グラフ
【図12】 本発明のキャンセル方法を説明するための
グラフ
【図13】 本発明にかかる第8の実施例の信号処理装
置を示すブロック図
【図14】 本発明にかかる第9の実施例の信号処理装
置を示すブロック図
【図15】 音声判別手段を具体的に示した場合の実施
例の信号処理装置を示すブロック図
【図16】 本発明にかかる第10の実施例の信号処理装
置を示すブロック図
【図17】 本発明にかかる第11の実施例の信号処理装
置を示すブロック図
【図18】 本発明にかかる第12の実施例の信号処理装
置を示すブロック図
【図19】 本発明にかかる第13の実施例の信号処理装
置を示すブロック図
【図20】 図19の第13の実施例の具体例の信号処理
装置を示すブロック図
【図21】 本発明にかかる第14の実施例の信号処理装
置を示すブロック図
【図22】 従来の信号処理装置を示すブロック図であ
る。
【符号の説明】
1 帯域分割手段 2 ケプストラム分析手段 3 音声判別手段 4 音声切り出し手段 5 特徴抽出手段 6 特徴比較手段 7 記憶手段 31 ピーク検出手段 32 平均値算出手段 33 音声判別回路 102 雑音予測手段 103 キャンセル手段 106 音声切り出し手段 107 スイッチ手段 204 雑音算出手段 205 ミュート制御手段 206 ミュート手段 207 A/D 208 FFT 209 D/A 212 最ゆう検出手段
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 21/02 // G10L 101:04 (31)優先権主張番号 特願平2−138060 (32)優先日 平成2年5月28日(1990.5.28) (33)優先権主張国 日本(JP) (56)参考文献 特開 昭61−292699(JP,A) 特開 昭59−165098(JP,A) 特開 昭57−161800(JP,A) 特開 平4−230799(JP,A) 特開 平3−235999(JP,A) 特公 平3−16038(JP,B2) 日本音響学会昭和60年度秋季研究発表 会講演論文集▲I▼,1−4−1,神谷 伸外,「音声通過フィルタ」,p.1− 2(昭和60年9月30日発行) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された雑音を含む音声信号の周波数
    帯域を分割する帯域分割手段と、前記帯域分割手段の帯
    域分割出力が入力されケプストラム分析を行うケプスト
    ラム分析手段と、前記ケプストラム分析手段におけるケ
    プストラム分析出力におけるケプストラムピークを検出
    するピーク検出手段と、前記ケプストラム分析手段のケ
    プストラム分析出力における平均値レベルを算出する平
    均算出手段を具備し、前記ピーク検出手段のピーク検出
    情報に基づいて母音を判定するとともに前記平均値算出
    手段の平均値情報に基づいて子音を判定する母音/子音
    判定手段とを備え、前記母音/子音判定手段によって判
    定された母音/子音判定結果が存在する区間を音声区間
    として算出する音声算出手段と、前記音声算出手段によ
    って算出される音声区間情報が存在しない区間を雑音区
    間として算出する雑音算出手段と、前記雑音算出手段に
    よって算出された雑音区間情報に基づいて、前記入力さ
    れた雑音を含む音声信号における雑音区間のレベルを減
    衰させるミュート手段を備えたことを特徴とする音声信
    号処理装置。
JP03117276A 1990-05-28 1991-05-22 音声信号処理装置 Expired - Fee Related JP3106543B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03117276A JP3106543B2 (ja) 1990-05-28 1991-05-22 音声信号処理装置

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP2-138060 1990-05-28
JP13805990 1990-05-28
JP13805590 1990-05-28
JP2-138055 1990-05-28
JP13805490 1990-05-28
JP13806090 1990-05-28
JP2-138059 1990-05-28
JP2-138054 1990-05-28
JP03117276A JP3106543B2 (ja) 1990-05-28 1991-05-22 音声信号処理装置

Publications (2)

Publication Number Publication Date
JPH04230800A JPH04230800A (ja) 1992-08-19
JP3106543B2 true JP3106543B2 (ja) 2000-11-06

Family

ID=27526760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03117276A Expired - Fee Related JP3106543B2 (ja) 1990-05-28 1991-05-22 音声信号処理装置

Country Status (1)

Country Link
JP (1) JP3106543B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06282297A (ja) * 1993-03-26 1994-10-07 Idou Tsushin Syst Kaihatsu Kk 音声符号化方式
JP4710130B2 (ja) * 2000-12-19 2011-06-29 ヤマハ株式会社 音声信号分離方法及び装置
JP4244524B2 (ja) * 2001-02-16 2009-03-25 カシオ計算機株式会社 音声認証装置、音声認証方法、及びプログラム
JP4456504B2 (ja) * 2004-03-09 2010-04-28 日本電信電話株式会社 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
CN117356107A (zh) * 2021-05-31 2024-01-05 索尼集团公司 信号处理装置、信号处理方法及程序

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
日本音響学会昭和60年度秋季研究発表会講演論文集▲I▼,1−4−1,神谷伸外,「音声通過フィルタ」,p.1−2(昭和60年9月30日発行)

Also Published As

Publication number Publication date
JPH04230800A (ja) 1992-08-19

Similar Documents

Publication Publication Date Title
KR950011964B1 (ko) 신호처리장치
EP0763812B1 (en) Speech signal processing apparatus for detecting a speech signal from a noisy speech signal
US8612222B2 (en) Signature noise removal
KR950013551B1 (ko) 잡음신호예측장치
EP0459362B1 (en) Voice signal processor
JP3451146B2 (ja) スペクトルサブトラクションを用いた雑音除去システムおよび方法
EP0459384B1 (en) Speech signal processing apparatus for cutting out a speech signal from a noisy speech signal
US5204906A (en) Voice signal processing device
JP3033061B2 (ja) 音声雑音分離装置
JP3106543B2 (ja) 音声信号処理装置
JPH08160994A (ja) 雑音抑圧装置
US20030046069A1 (en) Noise reduction system and method
JPH04230796A (ja) 音声信号処理装置
JPH04227338A (ja) 音声信号処理装置
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计
JPH04230798A (ja) 雑音予測装置
KR950013555B1 (ko) 음성신호처리장치
JP2959792B2 (ja) 音声信号処理装置
JPH04211523A (ja) 信号処理装置及びボイスダイアル電話システム
KR950001067B1 (ko) 음성인식장치
JPH0635498A (ja) 音声認識装置及び方法
JP4710130B2 (ja) 音声信号分離方法及び装置
JPH06110492A (ja) 音声認識装置
JPH0844390A (ja) 音声認識装置
JPH06208393A (ja) 音声認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080908

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees