JPH04230800A - 音声信号処理装置 - Google Patents
音声信号処理装置Info
- Publication number
- JPH04230800A JPH04230800A JP3117276A JP11727691A JPH04230800A JP H04230800 A JPH04230800 A JP H04230800A JP 3117276 A JP3117276 A JP 3117276A JP 11727691 A JP11727691 A JP 11727691A JP H04230800 A JPH04230800 A JP H04230800A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- voice
- signal
- speech
- cepstrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 claims description 84
- 238000001514 detection method Methods 0.000 claims description 79
- 230000005236 sound signal Effects 0.000 claims description 64
- 238000004364 calculation method Methods 0.000 claims description 50
- 238000000605 extraction Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 34
- 238000000034 method Methods 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】本発明は音声信号処理装置に関し
、特に、雑音混じりの音声信号に付いて音声信号を切り
出す音声切り出し装置、その切り出された音声を利用し
て音声認識を行う音声認識装置などの信号処理装置、並
びに、音声認識の前段などに用いられる信号処理装置に
関する。
、特に、雑音混じりの音声信号に付いて音声信号を切り
出す音声切り出し装置、その切り出された音声を利用し
て音声認識を行う音声認識装置などの信号処理装置、並
びに、音声認識の前段などに用いられる信号処理装置に
関する。
【0002】
【従来の技術】従来、音声認識装置では、雑音混じりの
音声信号中から、フィルタなどを用いて音声部分を見つ
けだして、パターンマッチング法などを用いて音声認識
を行っている(例えば、特開昭59−121099号公
報、特開昭62−179000号公報参照)。しかしな
がら、このようなフィルタなどを用いて音声部分を切り
出す方法では誤認識率が高かった。特に、雑音が多く混
じっている音声信号に付いては、その誤認識率が高いと
いう課題がある。
音声信号中から、フィルタなどを用いて音声部分を見つ
けだして、パターンマッチング法などを用いて音声認識
を行っている(例えば、特開昭59−121099号公
報、特開昭62−179000号公報参照)。しかしな
がら、このようなフィルタなどを用いて音声部分を切り
出す方法では誤認識率が高かった。特に、雑音が多く混
じっている音声信号に付いては、その誤認識率が高いと
いう課題がある。
【0003】図22に従来の音声信号処理装置を示す。
図22に示すように、従来の音声信号処理装置は、雑音
混じりの音声信号について、その音声部分を検出する音
声検出手段451と、その音声検出手段451によって
検出された音声区間から雑音区間を算出する雑音算出手
段452と、その雑音算出手段452からミュートする
ための制御信号を発生するミューティング制御手段45
3と、そのミューティング制御信号に従い、前記雑音混
じりの音声信号に付いて、雑音区間のみ信号を減衰させ
るミュート手段454とを備えている。
混じりの音声信号について、その音声部分を検出する音
声検出手段451と、その音声検出手段451によって
検出された音声区間から雑音区間を算出する雑音算出手
段452と、その雑音算出手段452からミュートする
ための制御信号を発生するミューティング制御手段45
3と、そのミューティング制御信号に従い、前記雑音混
じりの音声信号に付いて、雑音区間のみ信号を減衰させ
るミュート手段454とを備えている。
【0004】この従来の音声信号処理装置は、音声検出
手段451で雑音混じりの音声信号から音声区間を検出
し、雑音算出手段452によって、反転させるなどして
雑音区間を算出し、ミューティング制御手段453によ
って、その雑音区間に付いての制御信号を発生し、ミュ
ート手段454によって、雑音混じりの音声信号につい
て雑音区間の信号を減衰させる。
手段451で雑音混じりの音声信号から音声区間を検出
し、雑音算出手段452によって、反転させるなどして
雑音区間を算出し、ミューティング制御手段453によ
って、その雑音区間に付いての制御信号を発生し、ミュ
ート手段454によって、雑音混じりの音声信号につい
て雑音区間の信号を減衰させる。
【0005】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の音声信号処理装置では、まだ雑音の抑制が十
分ではなく、音声認識装置などの前段階に用いられた場
合など、誤認識率が高かった。
うな従来の音声信号処理装置では、まだ雑音の抑制が十
分ではなく、音声認識装置などの前段階に用いられた場
合など、誤認識率が高かった。
【0006】かかる点に鑑み、本発明の第1の目的は、
上記の従来の音声認識装置の課題を解決するものであっ
て、ケプストラム分析法を利用した正確な音声切り出し
を行える信号処理装置を提供することにある。
上記の従来の音声認識装置の課題を解決するものであっ
て、ケプストラム分析法を利用した正確な音声切り出し
を行える信号処理装置を提供することにある。
【0007】また、本発明の第2の目的は、上記の従来
の音声認識装置の課題を解決するものであって、雑音を
除去した音声信号に付いて、音声切り出しを行える信号
処理装置を提供することにある。
の音声認識装置の課題を解決するものであって、雑音を
除去した音声信号に付いて、音声切り出しを行える信号
処理装置を提供することにある。
【0008】また、本発明の第3の目的は、上記の従来
の信号処理装置の課題を考慮し、雑音を効果的に抑制で
きる信号処理装置を提供することにある。
の信号処理装置の課題を考慮し、雑音を効果的に抑制で
きる信号処理装置を提供することにある。
【0009】また、本発明の第4の目的は、上記の従来
の信号処理装置の課題を考慮し、雑音除去を行った上、
さらに雑音を減衰させる信号処理装置を提供することに
ある。
の信号処理装置の課題を考慮し、雑音除去を行った上、
さらに雑音を減衰させる信号処理装置を提供することに
ある。
【0010】
【課題を解決するための手段】上記目的を達成するため
本発明は、雑音混じりの音声信号を入力し、帯域分割を
行う帯域分割手段と、その帯域分割結果に付いてケプス
トラム分析を行うケプストラム分析手段と、そのケプス
トラム分析結果を利用して音声部分の判別を行う音声判
別手段と、前記雑音混じりの音声信号に付いて、前記音
声判別手段の結果に基づき、音声部分を切り出す音声切
り出し手段とを備えたことを特徴とする信号処理装置で
ある。
本発明は、雑音混じりの音声信号を入力し、帯域分割を
行う帯域分割手段と、その帯域分割結果に付いてケプス
トラム分析を行うケプストラム分析手段と、そのケプス
トラム分析結果を利用して音声部分の判別を行う音声判
別手段と、前記雑音混じりの音声信号に付いて、前記音
声判別手段の結果に基づき、音声部分を切り出す音声切
り出し手段とを備えたことを特徴とする信号処理装置で
ある。
【0011】本発明の第1の態様にかかる信号処理装置
は、雑音の混入した音声信号に付いて、ケプストラム分
析法によって、音声部分を正確に判別し、それを利用し
て音声を切り出すので、その音声切り出しは的確なもの
となる。また、その的確な音声切り出し結果を利用して
音声認識を行うので、その音声認識率は高いものとなる
。
は、雑音の混入した音声信号に付いて、ケプストラム分
析法によって、音声部分を正確に判別し、それを利用し
て音声を切り出すので、その音声切り出しは的確なもの
となる。また、その的確な音声切り出し結果を利用して
音声認識を行うので、その音声認識率は高いものとなる
。
【0012】また、雑音混じりの音声信号を入力し、音
声部分を検出する音声検出手段と、その音声検出手段の
検出結果及び前記雑音混じりの音声信号を入力し、その
音声部分の雑音を予測する雑音予測手段と、その雑音予
測手段によって、予測された雑音を前記雑音混じりの音
声信号からキャンセルするキャンセル手段と、その雑音
がキャンセルされた音声信号に付いて、前記音声検出手
段により検出された音声部分に基づき、音声部分を切り
出す音声切り出し手段とを備えたことを特徴とする信号
処理装置である。
声部分を検出する音声検出手段と、その音声検出手段の
検出結果及び前記雑音混じりの音声信号を入力し、その
音声部分の雑音を予測する雑音予測手段と、その雑音予
測手段によって、予測された雑音を前記雑音混じりの音
声信号からキャンセルするキャンセル手段と、その雑音
がキャンセルされた音声信号に付いて、前記音声検出手
段により検出された音声部分に基づき、音声部分を切り
出す音声切り出し手段とを備えたことを特徴とする信号
処理装置である。
【0013】また、入力された、雑音を含む音声信号の
周波数帯域を分割する帯域分割手段と、その帯域分割手
段の帯域分割出力が入力され、ケプストラム分析を行う
ケプストラム手段と、そのケプストラム分析手段によっ
て分析された分析結果に基づいて、音声部分を判別する
音声判別手段と、その音声判別手段によって判別された
音声区間情報に基づいて、雑音区間を算出する雑音算出
手段と、この雑音算出手段によって算出された雑音区間
情報に基づいて、前記雑音を含む音声信号に付いて、雑
音区間だけ、その信号のレベルを減衰させるミュート手
段とを備えたことを特徴とする信号処理装置である。
周波数帯域を分割する帯域分割手段と、その帯域分割手
段の帯域分割出力が入力され、ケプストラム分析を行う
ケプストラム手段と、そのケプストラム分析手段によっ
て分析された分析結果に基づいて、音声部分を判別する
音声判別手段と、その音声判別手段によって判別された
音声区間情報に基づいて、雑音区間を算出する雑音算出
手段と、この雑音算出手段によって算出された雑音区間
情報に基づいて、前記雑音を含む音声信号に付いて、雑
音区間だけ、その信号のレベルを減衰させるミュート手
段とを備えたことを特徴とする信号処理装置である。
【0014】また、予め複数の人の音声の特徴を記憶し
ている記憶手段と、雑音混じりの音声信号について、音
声信号部分を検出する音声検出手段と、その音声検出手
段による音声部分に付いての特徴情報と前記記憶手段の
選択された所定の人の特徴情報とを比較し、その音声信
号部分の種類を検出する最ゆう検出手段と、前記音声検
出手段の出力及び前記最ゆう検出手段の出力を入力し、
雑音区間を算出する雑音算出手段と、この雑音算出手段
によって算出された雑音区間情報に基づいて、前記雑音
を含む音声信号に付いて、雑音区間だけ、その信号のレ
ベルを減衰させるミュート手段とを備えたことを特徴と
する信号処理装置である。
ている記憶手段と、雑音混じりの音声信号について、音
声信号部分を検出する音声検出手段と、その音声検出手
段による音声部分に付いての特徴情報と前記記憶手段の
選択された所定の人の特徴情報とを比較し、その音声信
号部分の種類を検出する最ゆう検出手段と、前記音声検
出手段の出力及び前記最ゆう検出手段の出力を入力し、
雑音区間を算出する雑音算出手段と、この雑音算出手段
によって算出された雑音区間情報に基づいて、前記雑音
を含む音声信号に付いて、雑音区間だけ、その信号のレ
ベルを減衰させるミュート手段とを備えたことを特徴と
する信号処理装置である。
【0015】また、入力された、雑音を含む音声信号の
音声部分を検出する音声検出手段と、その音声検出手段
によって検出された音声部分情報に基づいて、雑音区間
を算出する雑音算出手段と、前記音声検出手段によって
検出された音声部分に基づいて、前記雑音混じりの入力
信号について、音声部分の雑音を予測する雑音予測手段
と、この雑音予測手段によって、予測された雑音を、前
記雑音混じりの入力信号からキャンセルするキャンセル
手段と、前記雑音算出手段によって算出された雑音区間
情報に基づいて、前記キャンセル手段から出力される音
声信号に付いて、雑音区間だけ、その信号のレベルを減
衰させるミュート手段とを備えたことを特徴とする信号
処理装置である。
音声部分を検出する音声検出手段と、その音声検出手段
によって検出された音声部分情報に基づいて、雑音区間
を算出する雑音算出手段と、前記音声検出手段によって
検出された音声部分に基づいて、前記雑音混じりの入力
信号について、音声部分の雑音を予測する雑音予測手段
と、この雑音予測手段によって、予測された雑音を、前
記雑音混じりの入力信号からキャンセルするキャンセル
手段と、前記雑音算出手段によって算出された雑音区間
情報に基づいて、前記キャンセル手段から出力される音
声信号に付いて、雑音区間だけ、その信号のレベルを減
衰させるミュート手段とを備えたことを特徴とする信号
処理装置である。
【0016】
【作用】上記した構成により本発明は、入力信号に対す
るケプストラム分析信号出力におけるケプストラムピー
ク信号等を用いて、音声信号区間を判断し、この音声検
出信号によって雑音環境中の音声信号に対する音声信号
区間検出をする。
るケプストラム分析信号出力におけるケプストラムピー
ク信号等を用いて、音声信号区間を判断し、この音声検
出信号によって雑音環境中の音声信号に対する音声信号
区間検出をする。
【0017】
【実施例】以下に本発明にかかる各実施例について図面
を参照して説明する。
を参照して説明する。
【0018】<第1の実施例>図1は本発明にかかる第
1の実施例の信号処理装置の一実施例を示すブロック図
である。
1の実施例の信号処理装置の一実施例を示すブロック図
である。
【0019】帯域分割手段1は、A/D変換手段とフー
リエ変換手段とを備え、帯域を分割する手段である。
リエ変換手段とを備え、帯域を分割する手段である。
【0020】ケプストラム分析手段2は、スペクトラム
信号についてのケプストラムを求める手段である。図5
(a)はそのスペクトラム、(b)はそのケプストラム
を示す。音声判別手段3は、ケプストラム分析手段2で
得られたケプストラムに基づいて音声部分の判別を行う
手段である。具体的には、図3に示すように、ピーク検
出手段31と、平均値算出手段32と、音声判別回路3
3を備えている。このピーク検出手段31は、ケプスト
ラム分析手段2で得られたケプストラムについて、その
ピーク(ピッチ)を求める手段である。他方、平均値算
出手段32は、ケプストラム分析手段2で得られるケプ
ストラムの平均値を算出する手段である。音声判別回路
33は、ピーク検出手段31から供給されるケプストラ
ムのピークと平均値算出手段32から供給されるケプス
トラムの平均値を用いて音声部分を判別する回路である
。例えば、母音と子音を判別して、音声部分を的確に判
別するものである。すなわち、ピーク検出手段31から
ピークが検出されたことを示す信号が入力された場合に
は、その音声信号入力は母音区間であると判断する。ま
た、子音の判定については、例えば平均値算出手段32
より入力されるケプストラム平均値が予め決められた規
定値より大きな場合、或はそのケプストラム平均値の増
加量(微分係数)が予め決められた規定値より大きな場
合は、音声信号入力は子音区間であると判定する。そし
て結果としては、母音/子音を示す信号、或は母音と子
音を含んだ音声区間を示す信号を出力する。
信号についてのケプストラムを求める手段である。図5
(a)はそのスペクトラム、(b)はそのケプストラム
を示す。音声判別手段3は、ケプストラム分析手段2で
得られたケプストラムに基づいて音声部分の判別を行う
手段である。具体的には、図3に示すように、ピーク検
出手段31と、平均値算出手段32と、音声判別回路3
3を備えている。このピーク検出手段31は、ケプスト
ラム分析手段2で得られたケプストラムについて、その
ピーク(ピッチ)を求める手段である。他方、平均値算
出手段32は、ケプストラム分析手段2で得られるケプ
ストラムの平均値を算出する手段である。音声判別回路
33は、ピーク検出手段31から供給されるケプストラ
ムのピークと平均値算出手段32から供給されるケプス
トラムの平均値を用いて音声部分を判別する回路である
。例えば、母音と子音を判別して、音声部分を的確に判
別するものである。すなわち、ピーク検出手段31から
ピークが検出されたことを示す信号が入力された場合に
は、その音声信号入力は母音区間であると判断する。ま
た、子音の判定については、例えば平均値算出手段32
より入力されるケプストラム平均値が予め決められた規
定値より大きな場合、或はそのケプストラム平均値の増
加量(微分係数)が予め決められた規定値より大きな場
合は、音声信号入力は子音区間であると判定する。そし
て結果としては、母音/子音を示す信号、或は母音と子
音を含んだ音声区間を示す信号を出力する。
【0021】音声切り出し手段4は、雑音混じりの音声
信号に付いて、音声判別手段3の結果に基づき、音声部
分を切り出す手段である。例えば、最も単純な回路とし
ては、音声部分のあるタイミングに合わせて、スイッチ
をオン・オフするスイッチング素子である。
信号に付いて、音声判別手段3の結果に基づき、音声部
分を切り出す手段である。例えば、最も単純な回路とし
ては、音声部分のあるタイミングに合わせて、スイッチ
をオン・オフするスイッチング素子である。
【0022】次に、図1に示す実施例の動作を説明する
。雑音混じりの音声信号は、帯域分割手段1入力にされ
、帯域分割される。そしてこの帯域分割された信号は、
ケプストラム分析手段2によってケプストラム分析され
、そのケプストラム分析結果を利用して、音声判別手段
3は音声部分を検出する。音声切り出し手段4は、雑音
混じりの音声信号について、音声判別手段3の結果を利
用して、音声部分のみを正確に切り出すことが出来る。
。雑音混じりの音声信号は、帯域分割手段1入力にされ
、帯域分割される。そしてこの帯域分割された信号は、
ケプストラム分析手段2によってケプストラム分析され
、そのケプストラム分析結果を利用して、音声判別手段
3は音声部分を検出する。音声切り出し手段4は、雑音
混じりの音声信号について、音声判別手段3の結果を利
用して、音声部分のみを正確に切り出すことが出来る。
【0023】<第2の実施例>図2は、本発明にかかる
第2の実施例を示すブロック図である。
第2の実施例を示すブロック図である。
【0024】本実施例は、図1の実施例の音声切り出し
手段4で得られた音声信号を利用して音声認識を行う音
声認識装置である。すなわち、前記音声切り出し手段4
の後に、その切り出された音節などの特徴を抽出する特
徴抽出手段5が接続され、その後に、その抽出された特
徴と、記憶手段7に予め記憶されている標準となる音節
などの標準特徴とを比較して、その音節の種類を認識す
る特徴比較手段6が接続されている。その記憶手段7に
予め特徴を記憶させる場合、本実施例の別経路8を利用
して、既知の人の音声を音声信号入力端子9に入力させ
、帯域分割、ケプストラム分析、音声判別、音声切り出
し、特徴抽出を順次行い、得られた音声特徴をその人情
報とともに記憶手段7に記憶させておけばよい。このよ
うに、この音声認識の実施例は、音声部分が正確に切り
出されるので、音声認識率が高くなる。
手段4で得られた音声信号を利用して音声認識を行う音
声認識装置である。すなわち、前記音声切り出し手段4
の後に、その切り出された音節などの特徴を抽出する特
徴抽出手段5が接続され、その後に、その抽出された特
徴と、記憶手段7に予め記憶されている標準となる音節
などの標準特徴とを比較して、その音節の種類を認識す
る特徴比較手段6が接続されている。その記憶手段7に
予め特徴を記憶させる場合、本実施例の別経路8を利用
して、既知の人の音声を音声信号入力端子9に入力させ
、帯域分割、ケプストラム分析、音声判別、音声切り出
し、特徴抽出を順次行い、得られた音声特徴をその人情
報とともに記憶手段7に記憶させておけばよい。このよ
うに、この音声認識の実施例は、音声部分が正確に切り
出されるので、音声認識率が高くなる。
【0025】<第3の実施例>図4は本発明にかかる第
3の実施例を示すブロック図である。
3の実施例を示すブロック図である。
【0026】図2に示す第2の実施例と図4に示す第3
の実施例を組み合わせたものであって、音声判別手段3
として、ピーク検出手段31と、平均値算出手段32と
を用い、また、音声切り出し手段4の出力に付いて音声
認識を行うものである。
の実施例を組み合わせたものであって、音声判別手段3
として、ピーク検出手段31と、平均値算出手段32と
を用い、また、音声切り出し手段4の出力に付いて音声
認識を行うものである。
【0027】<第4の実施例>図6は、本発明にかかる
第4の実施例の信号処理装置を概略的に示すブロック図
である。
第4の実施例の信号処理装置を概略的に示すブロック図
である。
【0028】音声検出手段101は、雑音混じりの音声
信号を入力し、その音声部分を検出する手段である。例
えば、フィルタなどを用いて音声部分と、雑音のみの部
分とを区別する手段である。
信号を入力し、その音声部分を検出する手段である。例
えば、フィルタなどを用いて音声部分と、雑音のみの部
分とを区別する手段である。
【0029】雑音予測手段102は、音声検出手段10
1によって、音声部分が検出されると、それを利用して
、それ以外の部分を雑音のみの部分と判断できる。そこ
で、その雑音のみの区間の雑音データを利用して音声部
分の区間の中の雑音データを予測する手段である。
1によって、音声部分が検出されると、それを利用して
、それ以外の部分を雑音のみの部分と判断できる。そこ
で、その雑音のみの区間の雑音データを利用して音声部
分の区間の中の雑音データを予測する手段である。
【0030】キャンセル手段103は、その雑音予測手
段102によって、予測された雑音を前記雑音混じりの
音声信号からキャンセルする手段である。一般に、キャ
ンセルの方法の一例として、時間軸でのキャンセレーシ
ョンは、図10に示すように、雑音混入音声信号(a)
から予測された雑音波形(b)を引算するものである。 それによって信号のみが取り出される(c)。
段102によって、予測された雑音を前記雑音混じりの
音声信号からキャンセルする手段である。一般に、キャ
ンセルの方法の一例として、時間軸でのキャンセレーシ
ョンは、図10に示すように、雑音混入音声信号(a)
から予測された雑音波形(b)を引算するものである。 それによって信号のみが取り出される(c)。
【0031】音声切り出し手段104は、キャンセル手
段103によって、その雑音がキャンセルされた音声信
号に付いて、前記音声検出手段101により検出された
音声部分に基づき、音声部分を切り出す手段である。
段103によって、その雑音がキャンセルされた音声信
号に付いて、前記音声検出手段101により検出された
音声部分に基づき、音声部分を切り出す手段である。
【0032】<第5の実施例>図7は、図6の第4の実
施例において、チャンネル分割を使用する場合の第5の
実施例を示すブロック図である。
施例において、チャンネル分割を使用する場合の第5の
実施例を示すブロック図である。
【0033】本実施例では、雑音混じりの音声信号が帯
域手段105によって、チャンネル分割されるようにな
っている。例えば、A/D変換手段とフーリエ変換手段
とを備え、帯域を分割する手段である。
域手段105によって、チャンネル分割されるようにな
っている。例えば、A/D変換手段とフーリエ変換手段
とを備え、帯域を分割する手段である。
【0034】また、音声検出手段101は、ケプストラ
ム分析手段111と音声判別手段112とを有する。こ
のケプストラム分析手段111は、帯域分割手段105
によって帯域分割された雑音混じりの音声信号のスペク
トラム信号についてのケプストラムを求める手段である
。図5(a)はそのスペクトラム、(b)はそのケプス
トラムを示す。音声判別手段112は、ケプストラム分
析手段111で得られたケプストラムに基づいて音声部
分の判別を行う手段である。具体的には、ピーク検出手
段と、平均値算出手段と、音声判別回路を備えている。 そのピーク検出手段は、ケプストラム分析手段111で
得られたケプストラムについて、そのピーク(ピッチ)
を求める手段である。 他方、平均値算出手段は、ケプストラム分析手段111
で得られるケプストラムの平均値を算出する手段である
。 音声判別回路は、ピーク検出手段から供給されるケプス
トラムのピークと平均値算出手段から供給されるケプス
トラムの平均値を用いて音声部分を判別する回路である
。例えば、母音と子音を判別して、音声部分を的確に判
別するものである。すなわち、ピーク検出手段からピー
クが検出されたことを示す信号が入力された場合には、
その音声信号入力は母音区間であると判断する。また、
子音の判定については、例えば平均値算出手段より入力
されるケプストラム平均値が予め決められた規定値より
大きな場合、或はそのケプストラム平均値の増加量(微
分係数)が予め決められた規定値より大きな場合は、音
声信号入力は子音区間であると判定する。そして結果と
しては、母音/子音を示す信号、或は母音と子音を含ん
だ音声区間を示す信号を出力する。
ム分析手段111と音声判別手段112とを有する。こ
のケプストラム分析手段111は、帯域分割手段105
によって帯域分割された雑音混じりの音声信号のスペク
トラム信号についてのケプストラムを求める手段である
。図5(a)はそのスペクトラム、(b)はそのケプス
トラムを示す。音声判別手段112は、ケプストラム分
析手段111で得られたケプストラムに基づいて音声部
分の判別を行う手段である。具体的には、ピーク検出手
段と、平均値算出手段と、音声判別回路を備えている。 そのピーク検出手段は、ケプストラム分析手段111で
得られたケプストラムについて、そのピーク(ピッチ)
を求める手段である。 他方、平均値算出手段は、ケプストラム分析手段111
で得られるケプストラムの平均値を算出する手段である
。 音声判別回路は、ピーク検出手段から供給されるケプス
トラムのピークと平均値算出手段から供給されるケプス
トラムの平均値を用いて音声部分を判別する回路である
。例えば、母音と子音を判別して、音声部分を的確に判
別するものである。すなわち、ピーク検出手段からピー
クが検出されたことを示す信号が入力された場合には、
その音声信号入力は母音区間であると判断する。また、
子音の判定については、例えば平均値算出手段より入力
されるケプストラム平均値が予め決められた規定値より
大きな場合、或はそのケプストラム平均値の増加量(微
分係数)が予め決められた規定値より大きな場合は、音
声信号入力は子音区間であると判定する。そして結果と
しては、母音/子音を示す信号、或は母音と子音を含ん
だ音声区間を示す信号を出力する。
【0035】また、雑音予測手段102は、帯域分割さ
れた雑音混じりの音声信号に付いて、雑音区間での雑音
データに基づいて、音声区間の雑音を予測する手段であ
る。すなわち、この雑音予測手段102は、mチャンネ
ルに分割された音声/雑音入力に基づき、雑音成分を各
チャンネル毎に予測する手段である。例えば、図7に示
すように、x軸に周波数、y軸に音声レベル、z軸に時
間をとるとともに、周波数f1のところのデータp1,
p2,・・・,piをとり、その先のpjを予測する。 例えば、雑音部分p1〜piの平均をとりpjとする。 あるいは更に、音声信号部分が続くときはpjに減衰係
数を掛けるなどである。
れた雑音混じりの音声信号に付いて、雑音区間での雑音
データに基づいて、音声区間の雑音を予測する手段であ
る。すなわち、この雑音予測手段102は、mチャンネ
ルに分割された音声/雑音入力に基づき、雑音成分を各
チャンネル毎に予測する手段である。例えば、図7に示
すように、x軸に周波数、y軸に音声レベル、z軸に時
間をとるとともに、周波数f1のところのデータp1,
p2,・・・,piをとり、その先のpjを予測する。 例えば、雑音部分p1〜piの平均をとりpjとする。 あるいは更に、音声信号部分が続くときはpjに減衰係
数を掛けるなどである。
【0036】また、キャンセル手段103は、帯域分割
手段105及び雑音予測手段102よりmチャンネルの
信号が供給され、チャンネル毎に雑音を引算するなどし
てキャンセルし、帯域合成手段106へ供給する手段で
ある。本実施例のようなチャンネルを利用する場合は、
図12に示すように、周波数を基準にしたキャンセレー
ションであり、雑音混入音声信号(a)をフーリエ変換
し(b)、それから予測雑音のスペクトル(c)を引き
(d)、それを逆フーリエ変換して、雑音の無い音声信
号を得る(e)ものである。帯域合成手段106は、キ
ャンセル手段103より供給されるmチャンネルの信号
を逆フーリエ変換して品質のよい音声出力を得る手段で
ある。
手段105及び雑音予測手段102よりmチャンネルの
信号が供給され、チャンネル毎に雑音を引算するなどし
てキャンセルし、帯域合成手段106へ供給する手段で
ある。本実施例のようなチャンネルを利用する場合は、
図12に示すように、周波数を基準にしたキャンセレー
ションであり、雑音混入音声信号(a)をフーリエ変換
し(b)、それから予測雑音のスペクトル(c)を引き
(d)、それを逆フーリエ変換して、雑音の無い音声信
号を得る(e)ものである。帯域合成手段106は、キ
ャンセル手段103より供給されるmチャンネルの信号
を逆フーリエ変換して品質のよい音声出力を得る手段で
ある。
【0037】次に、図7の実施例の動作を説明する。雑
音混じりの音声信号は、帯域分割手段105によって帯
域分割され、キャンセル手段103へ入力される。また
、ケプストラム分析手段111へも入力され、ケプスト
ラム分析される。このケプストラム分析結果は、音声判
別手段112へ入力され、音声部分、雑音のみの部分が
区分けされる。雑音予測手段102は、帯域された音声
信号に付いて、雑音のみに部分のデータに基づいて、音
声信号分内の雑音を予測する。キャンセル手段103は
、この予測された雑音を、雑音混じりの音声信号から除
去する。雑音が除去された音声信号は、帯域合成手段1
06によって合成される。音声切り出し手段104は、
その合成された信号から、音声判別手段112の結果を
利用しながら、単語毎、又は「ア」、「イ」、「ウ」等
の音節毎、さらには音素毎に切り出しを行う。
音混じりの音声信号は、帯域分割手段105によって帯
域分割され、キャンセル手段103へ入力される。また
、ケプストラム分析手段111へも入力され、ケプスト
ラム分析される。このケプストラム分析結果は、音声判
別手段112へ入力され、音声部分、雑音のみの部分が
区分けされる。雑音予測手段102は、帯域された音声
信号に付いて、雑音のみに部分のデータに基づいて、音
声信号分内の雑音を予測する。キャンセル手段103は
、この予測された雑音を、雑音混じりの音声信号から除
去する。雑音が除去された音声信号は、帯域合成手段1
06によって合成される。音声切り出し手段104は、
その合成された信号から、音声判別手段112の結果を
利用しながら、単語毎、又は「ア」、「イ」、「ウ」等
の音節毎、さらには音素毎に切り出しを行う。
【0038】<第6の実施例>図8は、図6の第4の実
施例で得られた音声に付いて、音声認識を行う第6の実
施例の音声認識装置を示すブロック図である。
施例で得られた音声に付いて、音声認識を行う第6の実
施例の音声認識装置を示すブロック図である。
【0039】音声切り出し手段104の後に、その切り
出された音節などの特徴を抽出する特徴抽出手段107
が接続され、その後に、その抽出された特徴と、記憶手
段108に予め記憶されている標準となる音節などの標
準特徴とを、パターンマッチング法等の方法により比較
して、その音節の種類を認識する特徴比較手段109が
接続されている。その記憶手段108に予め特徴を記憶
させる場合、本実施例の別経路110を利用して、既知
の人の音声を音声信号入力端子111に入力させ、帯域
分割、ケプストラム分析、音声判別、音声切り出し、特
徴抽出を順次行い、得られた音声特徴を、その人情報と
ともに記憶手段108に記憶させておけばよい。このよ
うに、この音声認識の実施例は、雑音が予測されて除去
された音声を対象に音声認識を行うので、特に音声認識
率が高くなる。
出された音節などの特徴を抽出する特徴抽出手段107
が接続され、その後に、その抽出された特徴と、記憶手
段108に予め記憶されている標準となる音節などの標
準特徴とを、パターンマッチング法等の方法により比較
して、その音節の種類を認識する特徴比較手段109が
接続されている。その記憶手段108に予め特徴を記憶
させる場合、本実施例の別経路110を利用して、既知
の人の音声を音声信号入力端子111に入力させ、帯域
分割、ケプストラム分析、音声判別、音声切り出し、特
徴抽出を順次行い、得られた音声特徴を、その人情報と
ともに記憶手段108に記憶させておけばよい。このよ
うに、この音声認識の実施例は、雑音が予測されて除去
された音声を対象に音声認識を行うので、特に音声認識
率が高くなる。
【0040】<第7の実施例>図9は、図7の第5の実
施例で得られた音声に付いて、音声認識を行う第7の実
施例の音声認識装置を示すブロック図である。
施例で得られた音声に付いて、音声認識を行う第7の実
施例の音声認識装置を示すブロック図である。
【0041】すなわち、雑音混じりの音声信号は、mチ
ャンネルに帯域分割され、ケプストラム分析され、音声
部分が判別された結果に基づいて、雑音を予測してキャ
ンセルし、その音声に付いて、音声認識が行われる。
ャンネルに帯域分割され、ケプストラム分析され、音声
部分が判別された結果に基づいて、雑音を予測してキャ
ンセルし、その音声に付いて、音声認識が行われる。
【0042】<第8の実施例>図13は、本発明にかか
る第8の実施例における音声信号処理装置のブロック図
である。
る第8の実施例における音声信号処理装置のブロック図
である。
【0043】図13において、201は、信号を周波数
分析する周波数分析手段の一例としての帯域分割手段で
あり、特に信号をA/D変換するA/D変換手段と、フ
ーリエ変換するFFT手段とを備え、202は、ケプス
トラム分析を行うケプストラム分析手段、203はケプ
ストラム分析結果を利用して、音声部分を判別する音声
判別手段である。更に具体的に述べると、音声判別手段
203は、図15に示すように、ケプストラム分布のピ
ークを検出するピッチ検出手段の一例としてのピーク検
出手段231、ケプストラム分布の平均値を算出する平
均値算出手段232、母音と子音を判定する母音/子音
判定手段233、音声判別回路234を有する。
分析する周波数分析手段の一例としての帯域分割手段で
あり、特に信号をA/D変換するA/D変換手段と、フ
ーリエ変換するFFT手段とを備え、202は、ケプス
トラム分析を行うケプストラム分析手段、203はケプ
ストラム分析結果を利用して、音声部分を判別する音声
判別手段である。更に具体的に述べると、音声判別手段
203は、図15に示すように、ケプストラム分布のピ
ークを検出するピッチ検出手段の一例としてのピーク検
出手段231、ケプストラム分布の平均値を算出する平
均値算出手段232、母音と子音を判定する母音/子音
判定手段233、音声判別回路234を有する。
【0044】雑音算出手段204は、その音声判別手段
203によって判別された音声区間情報に基づいて、雑
音区間を算出する手段である。例えば、音声区間を反転
するなどである。ミューティング制御手段205は、そ
の雑音区間に付いての制御信号を発生する手段であって
、例えば、雑音区間の始まりと終わりのタイミングを発
生する回路である。ミュート手段206は、このミュー
ティング制御信号にしたがって、雑音混じりの音声信号
について雑音区間の信号を減衰させる手段である。
203によって判別された音声区間情報に基づいて、雑
音区間を算出する手段である。例えば、音声区間を反転
するなどである。ミューティング制御手段205は、そ
の雑音区間に付いての制御信号を発生する手段であって
、例えば、雑音区間の始まりと終わりのタイミングを発
生する回路である。ミュート手段206は、このミュー
ティング制御信号にしたがって、雑音混じりの音声信号
について雑音区間の信号を減衰させる手段である。
【0045】次に、上記実施例の動作を説明する。雑音
混じりの音声信号は、帯域分割手段201によって、帯
域分割され、更に、ケプストラム分析手段202によっ
て、ケプストラム分析を行う。ケプストラムとは、波形
の短時間振幅スペクトルの対数の逆フーリエ変換であっ
て、図5に示すようなものである。図5(a)は、短時
間スペクトルであって、同図(b)は、そのケプストラ
ムである。ピーク検出手段231は、そのケプストラム
分析結果に付いてピーク(ピッチ)を検出する。図5(
b)のピッチがそのピークを示し、そのピークが存在す
るところが音声信号部分である。そのピークの検出は、
例えば所定の閾値を予め設定しておき、それとの比較を
行うことによって検出する。平均値算出手段232はケ
プストラム分析結果に付いての平均値を算出する。母音
/子音判定手段233は、このピーク情報と、平均値情
報によって、母音/子音を判定する。すなわち、ピーク
検出手段231がらピークが検出されたことを示す信号
が入力された場合には、その音声信号入力は母音区間で
あると判断する。 また、子音の判定については、例えば平均値算出手段2
32より入力されるケプストラム平均値が予め決められ
た規定値より大きな場合、或はそのケプストラム平均値
の増加量(微分係数)が予め決められた規定値より大き
な場合は、音声信号入力は子音区間であると判定する。 そして結果としては、母音/子音を示す信号、或は母音
と子音を含んだ音声区間を示す信号を出力する。音声判
別回路234は、その母音/子音判定手段233の出力
に基づき、音声区間を判定する。雑音算出手段204は
、この音声区間情報を反転させるなどして、雑音区間を
算出する。ミューティング制御手段205は、この雑音
区間情報を利用して、制御信号を出力する。ミュート手
段206は、この制御信号に従い、雑音混じりの音声信
号の雑音区間のレベルを減衰させる。
混じりの音声信号は、帯域分割手段201によって、帯
域分割され、更に、ケプストラム分析手段202によっ
て、ケプストラム分析を行う。ケプストラムとは、波形
の短時間振幅スペクトルの対数の逆フーリエ変換であっ
て、図5に示すようなものである。図5(a)は、短時
間スペクトルであって、同図(b)は、そのケプストラ
ムである。ピーク検出手段231は、そのケプストラム
分析結果に付いてピーク(ピッチ)を検出する。図5(
b)のピッチがそのピークを示し、そのピークが存在す
るところが音声信号部分である。そのピークの検出は、
例えば所定の閾値を予め設定しておき、それとの比較を
行うことによって検出する。平均値算出手段232はケ
プストラム分析結果に付いての平均値を算出する。母音
/子音判定手段233は、このピーク情報と、平均値情
報によって、母音/子音を判定する。すなわち、ピーク
検出手段231がらピークが検出されたことを示す信号
が入力された場合には、その音声信号入力は母音区間で
あると判断する。 また、子音の判定については、例えば平均値算出手段2
32より入力されるケプストラム平均値が予め決められ
た規定値より大きな場合、或はそのケプストラム平均値
の増加量(微分係数)が予め決められた規定値より大き
な場合は、音声信号入力は子音区間であると判定する。 そして結果としては、母音/子音を示す信号、或は母音
と子音を含んだ音声区間を示す信号を出力する。音声判
別回路234は、その母音/子音判定手段233の出力
に基づき、音声区間を判定する。雑音算出手段204は
、この音声区間情報を反転させるなどして、雑音区間を
算出する。ミューティング制御手段205は、この雑音
区間情報を利用して、制御信号を出力する。ミュート手
段206は、この制御信号に従い、雑音混じりの音声信
号の雑音区間のレベルを減衰させる。
【0046】<第9の実施例>図14は、本発明にかか
る第9の実施例を示すブロック図である。
る第9の実施例を示すブロック図である。
【0047】本実施例は、全てディジタル処理で行われ
るものである。A/D変換手段207は、雑音混じりの
音声信号をディジタル信号に変換する手段である。FF
T208は、このディジタル信号をフーリエ変換する手
段である。ケプストラム分析手段202、音声判別手段
203、雑音算出手段204、ミューティング制御手段
205は、図13の第8の実施例と同じである。ディジ
タルミュート手段208は、ミューティング制御手段2
05からの制御信号に従い、A/D変換手段207から
出力されたディジタル信号を減衰させるディジタル機能
を有する手段である。D/A変換手段209は、ディジ
タルミュート手段208のディジタル出力をアナログ信
号に変換する手段である。
るものである。A/D変換手段207は、雑音混じりの
音声信号をディジタル信号に変換する手段である。FF
T208は、このディジタル信号をフーリエ変換する手
段である。ケプストラム分析手段202、音声判別手段
203、雑音算出手段204、ミューティング制御手段
205は、図13の第8の実施例と同じである。ディジ
タルミュート手段208は、ミューティング制御手段2
05からの制御信号に従い、A/D変換手段207から
出力されたディジタル信号を減衰させるディジタル機能
を有する手段である。D/A変換手段209は、ディジ
タルミュート手段208のディジタル出力をアナログ信
号に変換する手段である。
【0048】これら手段によって、全てディジタル的に
処理され雑音区間は減衰される。<第10の実施例>図
16は、本発明にかかる第10の実施例を示す図である
。
処理され雑音区間は減衰される。<第10の実施例>図
16は、本発明にかかる第10の実施例を示す図である
。
【0049】音声検出手段210は、雑音混じりの音声
信号の音声部分を検出する手段である。例えば、図13
の、帯域分割手段201、ケプストラム分析手段202
、音声判別手段203等である。あるいは、フィルタな
どを用いた回路であってもよい。
信号の音声部分を検出する手段である。例えば、図13
の、帯域分割手段201、ケプストラム分析手段202
、音声判別手段203等である。あるいは、フィルタな
どを用いた回路であってもよい。
【0050】記憶手段211は、予め色々な人の音声信
号の特徴を記憶したROM等の手段である。この記憶手
段211には、特定の人の音声特徴を選択させ、出力さ
せる音声選択信号が入力されるようになっている。最ゆ
う検出手段212は、前記音声検出手段210で検出さ
れた音声部分に付いて、記憶手段211から選択されて
出力される音声特徴と比較し、その音声が誰のものであ
るかを検出する手段である。その方法としては、パター
ンマッチング法、振幅レベルの類似度、位相の類似度を
調べる方法などがある。それによって、現在でている音
声は、選択された人の音声かどうかを検出できる。雑音
算出手段204は、前記音声検出手段210の出力と、
最ゆう検出手段212の出力とを入力し、音声検出手段
204からの信号に基づいて、音声以外の雑音区間を算
出し、また、最ゆう検出手段212の出力信号に基づい
て、選択された人の音声であるか、それ以外の人の音声
、すなわち雑音であるかどうかを算出する。ミューティ
ング制御手段205、ミュート手段206は、図13の
第8の実施例のものと同じである。
号の特徴を記憶したROM等の手段である。この記憶手
段211には、特定の人の音声特徴を選択させ、出力さ
せる音声選択信号が入力されるようになっている。最ゆ
う検出手段212は、前記音声検出手段210で検出さ
れた音声部分に付いて、記憶手段211から選択されて
出力される音声特徴と比較し、その音声が誰のものであ
るかを検出する手段である。その方法としては、パター
ンマッチング法、振幅レベルの類似度、位相の類似度を
調べる方法などがある。それによって、現在でている音
声は、選択された人の音声かどうかを検出できる。雑音
算出手段204は、前記音声検出手段210の出力と、
最ゆう検出手段212の出力とを入力し、音声検出手段
204からの信号に基づいて、音声以外の雑音区間を算
出し、また、最ゆう検出手段212の出力信号に基づい
て、選択された人の音声であるか、それ以外の人の音声
、すなわち雑音であるかどうかを算出する。ミューティ
ング制御手段205、ミュート手段206は、図13の
第8の実施例のものと同じである。
【0051】本実施例の動作は次の通りである。予め、
色々な人(A,B,C・・・)の音声の特徴を記憶手段
211に書き込んでおく。そして、特定の人(例えば、
A)の音声を選択する音声選択信号を入力させておく。 その結果、記憶手段211からは、Aの音声の特徴情報
が、最ゆう検出手段212へ入力される。
色々な人(A,B,C・・・)の音声の特徴を記憶手段
211に書き込んでおく。そして、特定の人(例えば、
A)の音声を選択する音声選択信号を入力させておく。 その結果、記憶手段211からは、Aの音声の特徴情報
が、最ゆう検出手段212へ入力される。
【0052】いま、自動車をAが運転しており、Bが同
乗者として乗っているとする。運転しているAは、音声
を用いて、音声ダイヤルやハンドフリー通話を行う。そ
のAの発する音声には、自動車のエンジン音などの本来
の雑音が入るほか、同乗者のBの話声などが入る。
乗者として乗っているとする。運転しているAは、音声
を用いて、音声ダイヤルやハンドフリー通話を行う。そ
のAの発する音声には、自動車のエンジン音などの本来
の雑音が入るほか、同乗者のBの話声などが入る。
【0053】音声検出手段210は、これら雑音混じり
の音声を入力し、音声部分を検出する。検出された音声
信号は、雑音算出手段204と最ゆう検出手段212へ
入力される。最ゆう検出手段212は、この検出された
音声の特徴と、記憶手段211から出力されたAの音声
特徴とを比較し、その音声がAか否か判断する。したが
って、検出された音声がBの場合は、Aではないという
判断結果がでる。また、検出された音声がAの場合は、
Aという判断結果がだされる。
の音声を入力し、音声部分を検出する。検出された音声
信号は、雑音算出手段204と最ゆう検出手段212へ
入力される。最ゆう検出手段212は、この検出された
音声の特徴と、記憶手段211から出力されたAの音声
特徴とを比較し、その音声がAか否か判断する。したが
って、検出された音声がBの場合は、Aではないという
判断結果がでる。また、検出された音声がAの場合は、
Aという判断結果がだされる。
【0054】雑音算出手段204は、音声検出手段21
0からの信号に基づき、音声でないエンジン音などの信
号区間を雑音区間とするとともに、最ゆう検出手段21
2の判断結果を入力し、Aでない人の音声をも雑音とし
て、本来の雑音とともに雑音区間としてする。また、A
の音声のみを音声区間とする。その結果をミューティン
グ制御手段205へ出力する。ミューティング制御手段
205はその入力に応じて、制御信号を出力する。ミュ
ート手段206は、その制御信号を受けて、雑音区間に
付いて信号を減衰する。これによって、エンジン音はも
ちろん、Aでない人の音声も雑音として減衰されるので
、雑音が十分抑制されたAの音声信号が得られる。従っ
て、音声ダイヤルやハンドフリー通話がまちがいなく行
われる。
0からの信号に基づき、音声でないエンジン音などの信
号区間を雑音区間とするとともに、最ゆう検出手段21
2の判断結果を入力し、Aでない人の音声をも雑音とし
て、本来の雑音とともに雑音区間としてする。また、A
の音声のみを音声区間とする。その結果をミューティン
グ制御手段205へ出力する。ミューティング制御手段
205はその入力に応じて、制御信号を出力する。ミュ
ート手段206は、その制御信号を受けて、雑音区間に
付いて信号を減衰する。これによって、エンジン音はも
ちろん、Aでない人の音声も雑音として減衰されるので
、雑音が十分抑制されたAの音声信号が得られる。従っ
て、音声ダイヤルやハンドフリー通話がまちがいなく行
われる。
【0055】<第11の実施例>図17は、図16に示
す第10の実施例の音声検出手段210が、帯域分割手
段201、ケプストラム分析手段202、音声判別手段
203である場合の第11の実施例の信号処理装置のブ
ロック図である。これら手段は、図13の第8の実施例
のものと同じであるのでその説明は省略する。本実施例
では、ケプストラム分析が用いられるので、記憶手段2
11や最ゆう検出手段212で用いられる音声特徴も、
ケプストラム分析結果のピーク情報や、平均値情報や、
ホルマント情報が用いられることが望ましい。
す第10の実施例の音声検出手段210が、帯域分割手
段201、ケプストラム分析手段202、音声判別手段
203である場合の第11の実施例の信号処理装置のブ
ロック図である。これら手段は、図13の第8の実施例
のものと同じであるのでその説明は省略する。本実施例
では、ケプストラム分析が用いられるので、記憶手段2
11や最ゆう検出手段212で用いられる音声特徴も、
ケプストラム分析結果のピーク情報や、平均値情報や、
ホルマント情報が用いられることが望ましい。
【0056】<第12の実施例>図18は、図17に示
す第11の実施例の音声判別手段203が、ピーク検出
手段231、平均値算出手段232、母音/子音判定手
段233及び音声判別回路234とで構成される場合の
第12の実施例の信号処理装置を示すブロック図である
。それら各手段は、図15で示されるものと同じである
のでその説明は省略する。本実施例では、母音/子音が
判定されるので、より一層音声部分の判断が正確になる
。
す第11の実施例の音声判別手段203が、ピーク検出
手段231、平均値算出手段232、母音/子音判定手
段233及び音声判別回路234とで構成される場合の
第12の実施例の信号処理装置を示すブロック図である
。それら各手段は、図15で示されるものと同じである
のでその説明は省略する。本実施例では、母音/子音が
判定されるので、より一層音声部分の判断が正確になる
。
【0057】<第13の実施例>図19は、本発明にか
かる第13の実施例の音声信号処理装置のブロック図、
図20はそれを具体化した実施例を示すブロック図であ
る。 以下、両図の実施例に付いて関連させながら説明する。
かる第13の実施例の音声信号処理装置のブロック図、
図20はそれを具体化した実施例を示すブロック図であ
る。 以下、両図の実施例に付いて関連させながら説明する。
【0058】第19において、音声検出手段301は、
雑音混じりの音声信号に音声部分を検出するための手段
であって、例えば、図20に示すような、帯域分割手段
307、ケプストラム分析手段308、音声判別手段3
09等から構成される。すなわち、帯域分割手段307
は、雑音混じりの信号を帯域分割する帯域分割手段であ
り、例えば、信号をA/D変換するA/D変換手段と、
フーリエ変換するFFT手段とを備える。ケプストラム
分析手段308におけるケプストラムとは、波形の短時
間振幅スペクトルの対数の逆フーリエ変換であって、図
5に示すようなものである。図5(a)は、短時間スペ
クトルであって、同図(b)は、そのケプストラムであ
る。音声判別手段309は、例えば、ケプストラム分布
のピークを検出するピッチ検出手段、ケプストラム分布
の平均値を算出する平均値算出手段、母音と子音を判定
する母音/子音判定手段、音声判別回路から構成され、
音声部分を判別する。
雑音混じりの音声信号に音声部分を検出するための手段
であって、例えば、図20に示すような、帯域分割手段
307、ケプストラム分析手段308、音声判別手段3
09等から構成される。すなわち、帯域分割手段307
は、雑音混じりの信号を帯域分割する帯域分割手段であ
り、例えば、信号をA/D変換するA/D変換手段と、
フーリエ変換するFFT手段とを備える。ケプストラム
分析手段308におけるケプストラムとは、波形の短時
間振幅スペクトルの対数の逆フーリエ変換であって、図
5に示すようなものである。図5(a)は、短時間スペ
クトルであって、同図(b)は、そのケプストラムであ
る。音声判別手段309は、例えば、ケプストラム分布
のピークを検出するピッチ検出手段、ケプストラム分布
の平均値を算出する平均値算出手段、母音と子音を判定
する母音/子音判定手段、音声判別回路から構成され、
音声部分を判別する。
【0059】雑音算出手段304は、その音声検出手段
301によって判別された音声区間情報に基づいて、雑
音区間を算出する手段である。例えば、音声区間を反転
するなどである。ミューティング制御手段305は、そ
の雑音区間に付いての制御信号を発生する手段であって
、例えば、雑音区間の始まりと終わりのタイミングを発
生する回路である。なお、このミューティング制御手段
305は、外部から与えられるミューティングON/O
FF制御信号に従って制御信号を出力するようになって
いる。 このミューティングON/OFF制御信号はマニュアル
で設定される外部信号であって、入力信号が雑音だけの
とき又は処理時に雑音が不要のときはオンとされ、処理
時に雑音が存在してもよいときにはオフとされる。雑音
予測手段302は、音声検出手段301によって、音声
部分が検出されると、それを利用して、それ以外の部分
の雑音のみの部分と判断できる。そこで、その雑音のみ
の区間の雑音データを利用して音声部分の区間の中の雑
音データを予測する手段である。すなわち、図20に示
すように、この雑音予測手段302は、mチャンネルに
分割された音声/雑音入力に基づき、雑音成分を各チャ
ンネル毎に予測する。例えば、図11に示すように、x
軸に周波数、y軸に音声レベル、z軸に時間をとるとと
もに、周波数f1のところのデータp1,p2,・・・
,piをとり、その先のpjを予測する。例えば、雑音
部分p1〜piの平均をとりpjとする。あるいは更に
、音声信号部分が続くときはpjに減衰係数を掛けるな
どである。
301によって判別された音声区間情報に基づいて、雑
音区間を算出する手段である。例えば、音声区間を反転
するなどである。ミューティング制御手段305は、そ
の雑音区間に付いての制御信号を発生する手段であって
、例えば、雑音区間の始まりと終わりのタイミングを発
生する回路である。なお、このミューティング制御手段
305は、外部から与えられるミューティングON/O
FF制御信号に従って制御信号を出力するようになって
いる。 このミューティングON/OFF制御信号はマニュアル
で設定される外部信号であって、入力信号が雑音だけの
とき又は処理時に雑音が不要のときはオンとされ、処理
時に雑音が存在してもよいときにはオフとされる。雑音
予測手段302は、音声検出手段301によって、音声
部分が検出されると、それを利用して、それ以外の部分
の雑音のみの部分と判断できる。そこで、その雑音のみ
の区間の雑音データを利用して音声部分の区間の中の雑
音データを予測する手段である。すなわち、図20に示
すように、この雑音予測手段302は、mチャンネルに
分割された音声/雑音入力に基づき、雑音成分を各チャ
ンネル毎に予測する。例えば、図11に示すように、x
軸に周波数、y軸に音声レベル、z軸に時間をとるとと
もに、周波数f1のところのデータp1,p2,・・・
,piをとり、その先のpjを予測する。例えば、雑音
部分p1〜piの平均をとりpjとする。あるいは更に
、音声信号部分が続くときはpjに減衰係数を掛けるな
どである。
【0060】キャンセル手段303は、その雑音予測手
段302によって、予測された雑音を前記雑音混じりの
音声信号からキャンセルする手段である。一般に、キャ
ンセルの方法の一例として、時間軸でのキャンセレーシ
ョンは、図10に示すように、雑音混入音声信号(a)
から予測された雑音波形(b)を引算するものである。 それによって信号のみが取り出される(c)。また、図
20の実施例のような周波数軸でのキャンセルは、図1
2に示すように、周波数を基準にしたキャンセレーショ
ンであり、雑音混入音声信号(a)をフーリエ変換し(
b)、それから予測雑音のスペクトル(c)を引き(d
)、それを逆フーリエ変換して、雑音の無い音声信号を
得る(ホ)ものである。 すなわち、キャンセル手段303は、帯域分割手段7及
び雑音予測手段302よりmチャンネルの信号が供給さ
れ、チャンネル毎に雑音を引算するなどしてキャンセル
する手段である。帯域合成手段306は、キャンセル手
段303より供給されるmチャンネルの信号を逆フーリ
エ変換して品質のよい音声出力を得る手段である。
段302によって、予測された雑音を前記雑音混じりの
音声信号からキャンセルする手段である。一般に、キャ
ンセルの方法の一例として、時間軸でのキャンセレーシ
ョンは、図10に示すように、雑音混入音声信号(a)
から予測された雑音波形(b)を引算するものである。 それによって信号のみが取り出される(c)。また、図
20の実施例のような周波数軸でのキャンセルは、図1
2に示すように、周波数を基準にしたキャンセレーショ
ンであり、雑音混入音声信号(a)をフーリエ変換し(
b)、それから予測雑音のスペクトル(c)を引き(d
)、それを逆フーリエ変換して、雑音の無い音声信号を
得る(ホ)ものである。 すなわち、キャンセル手段303は、帯域分割手段7及
び雑音予測手段302よりmチャンネルの信号が供給さ
れ、チャンネル毎に雑音を引算するなどしてキャンセル
する手段である。帯域合成手段306は、キャンセル手
段303より供給されるmチャンネルの信号を逆フーリ
エ変換して品質のよい音声出力を得る手段である。
【0061】ミュート手段306は、前記ミューティン
グ制御手段305から出力される制御信号に従い、前記
キャンセル手段303からの出力信号について雑音区間
の信号を減衰させる手段である。
グ制御手段305から出力される制御信号に従い、前記
キャンセル手段303からの出力信号について雑音区間
の信号を減衰させる手段である。
【0062】次に上記実施例の動作を、図20の実施例
の場合を例に取って、説明する。雑音混じりの音声信号
は、帯域分割手段301によって帯域分割され、更に、
ケプストラム分析手段302によって、ケプストラム分
析を行う。音声判別手段309のピーク検出手段は、そ
のケプストラム分析結果に付いてピーク(ピッチ)を検
出する。図5(b)のピッチがそのピークを示し、その
ピークが存在するところが音声信号部分である。そのピ
ークの検出は、例えば所定の閾値を予め設定しておき、
それとの比較を行うことによって検出する。また、音声
判別手段309の平均値算出手段はケプストラム分析結
果に付いての平均値を算出する。さらに、音声判別手段
309の母音/子音判定手段は、このピーク情報と、平
均値情報によって、母音/子音を判定する。すなわち、
ピーク検出手段からピークが検出されたことを示す信号
を入力された場合には、その音声信号入力は母音区間で
あると判断する。また、子音の判定については、例えば
平均値算出手段より入力されるケプストラム平均値が予
め決められた規定値より大きな場合、或はそのケプスト
ラム平均値の増加量(微分係数)が予め決められた規定
値より大きな場合は、音声信号入力は子音区間であると
判定する。 そして結果としては、母音/子音を示す信号、或は母音
と子音を含んだ音声区間を示す信号を出力する。音声判
別回路は、その母音/子音判定手段の出力に基づき、音
声区間を判定する。
の場合を例に取って、説明する。雑音混じりの音声信号
は、帯域分割手段301によって帯域分割され、更に、
ケプストラム分析手段302によって、ケプストラム分
析を行う。音声判別手段309のピーク検出手段は、そ
のケプストラム分析結果に付いてピーク(ピッチ)を検
出する。図5(b)のピッチがそのピークを示し、その
ピークが存在するところが音声信号部分である。そのピ
ークの検出は、例えば所定の閾値を予め設定しておき、
それとの比較を行うことによって検出する。また、音声
判別手段309の平均値算出手段はケプストラム分析結
果に付いての平均値を算出する。さらに、音声判別手段
309の母音/子音判定手段は、このピーク情報と、平
均値情報によって、母音/子音を判定する。すなわち、
ピーク検出手段からピークが検出されたことを示す信号
を入力された場合には、その音声信号入力は母音区間で
あると判断する。また、子音の判定については、例えば
平均値算出手段より入力されるケプストラム平均値が予
め決められた規定値より大きな場合、或はそのケプスト
ラム平均値の増加量(微分係数)が予め決められた規定
値より大きな場合は、音声信号入力は子音区間であると
判定する。 そして結果としては、母音/子音を示す信号、或は母音
と子音を含んだ音声区間を示す信号を出力する。音声判
別回路は、その母音/子音判定手段の出力に基づき、音
声区間を判定する。
【0063】雑音算出手段304は、この音声区間情報
を反転させるなどして、雑音区間を算出する。ミューテ
ィング制御手段305は、この雑音区間情報を利用して
、制御信号を出力する。ミュート手段306は、この制
御信号に従い、雑音混じりの音声信号の雑音区間のレベ
ルを減衰させる。なお、ミューティングON/OFF制
御信号がOFFの場合は、減衰させない。
を反転させるなどして、雑音区間を算出する。ミューテ
ィング制御手段305は、この雑音区間情報を利用して
、制御信号を出力する。ミュート手段306は、この制
御信号に従い、雑音混じりの音声信号の雑音区間のレベ
ルを減衰させる。なお、ミューティングON/OFF制
御信号がOFFの場合は、減衰させない。
【0064】雑音予測手段302は、帯域分割された音
声信号に付いて、音声判別手段309からの信号を利用
して、雑音のみに部分のデータに基づいて、音声信号部
分内の雑音を予測する。キャンセル手段303は、この
予測された雑音を、帯域分割手段307から出力される
帯域分割された雑音混じりの信号から除去する。雑音が
除去された音声信号は、帯域合成手段310によって合
成される。
声信号に付いて、音声判別手段309からの信号を利用
して、雑音のみに部分のデータに基づいて、音声信号部
分内の雑音を予測する。キャンセル手段303は、この
予測された雑音を、帯域分割手段307から出力される
帯域分割された雑音混じりの信号から除去する。雑音が
除去された音声信号は、帯域合成手段310によって合
成される。
【0065】ミュート手段306は、前記ミューティン
グ制御信号に従い、帯域合成された信号から、雑音区間
の信号を減衰させる。
グ制御信号に従い、帯域合成された信号から、雑音区間
の信号を減衰させる。
【0066】<第14の実施例>図21は、本発明にか
かる第14の実施例を示すブロック図である。
かる第14の実施例を示すブロック図である。
【0067】本実施例は、図19の第13の実施例に、
雑音パワー算出手段311が追加されている。すなわち
、この雑音パワー算出手段311は、音声検出手段30
1で検出された音声部分情報を入力し、雑音部分のパワ
ーを算出する手段である。そして、前記ミューティング
制御手段305は、この雑音パワー算出手段311の算
出結果に基づき、雑音の減衰をするかしないか、あるい
はその程度をコントロールするようにするなどを行うよ
うになっている。 図19及び図20の第13の実施例では、ミューティン
グ制御手段305へ入力されるミューティングON/O
FF制御信号が外部からの固定された信号であるのに対
して、本実施例では、雑音パワーの大きさに対応して、
例えば、雑音が大きいときのみ、雑音の減衰を行わせ、
雑音が比較的小さいときは、減衰を行わせ無いようにし
ているものである。
雑音パワー算出手段311が追加されている。すなわち
、この雑音パワー算出手段311は、音声検出手段30
1で検出された音声部分情報を入力し、雑音部分のパワ
ーを算出する手段である。そして、前記ミューティング
制御手段305は、この雑音パワー算出手段311の算
出結果に基づき、雑音の減衰をするかしないか、あるい
はその程度をコントロールするようにするなどを行うよ
うになっている。 図19及び図20の第13の実施例では、ミューティン
グ制御手段305へ入力されるミューティングON/O
FF制御信号が外部からの固定された信号であるのに対
して、本実施例では、雑音パワーの大きさに対応して、
例えば、雑音が大きいときのみ、雑音の減衰を行わせ、
雑音が比較的小さいときは、減衰を行わせ無いようにし
ているものである。
【0068】なお、以上の実施例において、ケプストラ
ム分析手段、音声切り出し手段、音声検出手段、雑音算
出手段、ミュート手段、キャンセル手段などの各種手段
は、コンピュータを利用してソフトウェア的に実現でき
るが、専用のハード回路を用いても実現可能である。
ム分析手段、音声切り出し手段、音声検出手段、雑音算
出手段、ミュート手段、キャンセル手段などの各種手段
は、コンピュータを利用してソフトウェア的に実現でき
るが、専用のハード回路を用いても実現可能である。
【0069】
【発明の効果】以上説明したように、本発明にかかる信
号処理装置は、雑音の混入した音声信号に付いて、ケプ
ストラム分析法によって、音声部分を正確に判別し、そ
れを利用して音声を切り出すので、その音声切り出しは
的確なものとなる。また、その的確な音声切り出し結果
を利用して音声認識を行うので、その音声認識率は高い
ものとなる。
号処理装置は、雑音の混入した音声信号に付いて、ケプ
ストラム分析法によって、音声部分を正確に判別し、そ
れを利用して音声を切り出すので、その音声切り出しは
的確なものとなる。また、その的確な音声切り出し結果
を利用して音声認識を行うので、その音声認識率は高い
ものとなる。
【0070】また、雑音の混入した音声信号に付いて、
雑音を予測し、その雑音を除去することによって、品質
のよい音声信号を得、その中から音声を切り出すので、
その音声切り出しは的確なものとなる。また、その的確
な音声切り出し結果を利用して音声認識を行うので、そ
の音声認識率は高いものとなる。
雑音を予測し、その雑音を除去することによって、品質
のよい音声信号を得、その中から音声を切り出すので、
その音声切り出しは的確なものとなる。また、その的確
な音声切り出し結果を利用して音声認識を行うので、そ
の音声認識率は高いものとなる。
【0071】また、ケプストラム分析を利用して雑音部
分を算出しているので、よりいっそう正確に雑音減衰が
可能となる。また、色々な人の音声の特徴を記憶してお
き特定の人以外の音声を雑音として扱うので、特定の人
の音声をよりいっそう効果的に雑音を減衰して取り出せ
る。
分を算出しているので、よりいっそう正確に雑音減衰が
可能となる。また、色々な人の音声の特徴を記憶してお
き特定の人以外の音声を雑音として扱うので、特定の人
の音声をよりいっそう効果的に雑音を減衰して取り出せ
る。
【0072】さらに、音声部分の雑音をキャンセルして
、さらに雑音区間の雑音を減衰させるものであるので、
よりいっそう効果的な雑音減衰が可能となる。
、さらに雑音区間の雑音を減衰させるものであるので、
よりいっそう効果的な雑音減衰が可能となる。
【図1】 本発明にかかる第1の実施例の信号処理装
置を示すブロック図
置を示すブロック図
【図2】 本発明にかかる第2の実施例の信号処理装
置を示すブロック図
置を示すブロック図
【図3】 音声判別手段を具体的に示した場合の実施
例の信号処理装置を示すブロック図
例の信号処理装置を示すブロック図
【図4】 本発明にかかる第3の実施例の信号処理装
置を示すブロック図
置を示すブロック図
【図5】 本発明のケプストラム分析を説明するため
の図
の図
【図6】 本発明にかかる第4の実施例に信号処理装
置を示すブロック図
置を示すブロック図
【図7】 本発明にかかる第5の実施例の信号処理装
置を示すブロック図
置を示すブロック図
【図8】 本発明にかかる第6の実施例の信号処理装
置を示すブロック図
置を示すブロック図
【図9】 本発明にかかる第7の実施例の信号処理装
置を示すブロック図
置を示すブロック図
【図10】 本発明におけるキャンセル方法を説明す
るためのグラフ
るためのグラフ
【図11】 本発明における雑音予測を説明するため
のグラフ
のグラフ
【図12】 本発明のキャンセル方法を説明するため
のグラフ
のグラフ
【図13】 本発明にかかる第8の実施例の信号処理
装置を示すブロック図
装置を示すブロック図
【図14】 本発明にかかる第9の実施例の信号処理
装置を示すブロック図
装置を示すブロック図
【図15】 音声判別手段を具体的に示した場合の実
施例の信号処理装置を示すブロック図
施例の信号処理装置を示すブロック図
【図16】 本発明にかかる第10の実施例の信号処
理装置を示すブロック図
理装置を示すブロック図
【図17】 本発明にかかる第11の実施例の信号処
理装置を示すブロック図
理装置を示すブロック図
【図18】 本発明にかかる第12の実施例の信号処
理装置を示すブロック図
理装置を示すブロック図
【図19】 本発明にかかる第13の実施例の信号処
理装置を示すブロック図
理装置を示すブロック図
【図20】 図19の第13の実施例の具体例の信号
処理装置を示すブロック図
処理装置を示すブロック図
【図21】 本発明にかかる第14の実施例の信号処
理装置を示すブロック図
理装置を示すブロック図
【図22】 従来の信号処理装置を示すブロック図で
ある。
ある。
1 帯域分割手段
2 ケプストラム分析手段
3 音声判別手段
4 音声切り出し手段
5 特徴抽出手段
6 特徴比較手段
7 記憶手段
31 ピーク検出手段
32 平均値算出手段
33 音声判別回路
102 雑音予測手段
103 キャンセル手段
106 音声切り出し手段
107 スイッチ手段
204 雑音算出手段
205 ミュート制御手段
206 ミュート手段
207 A/D
208 FFT
209 D/A
212 最ゆう検出手段
Claims (17)
- 【請求項1】 雑音混じりの音声信号を入力し、帯域
分割を行う帯域分割手段と、その帯域分割結果に付いて
ケプストラム分析を行うケプストラム分析手段と、その
ケプストラム分析結果を利用して音声部分の判別を行う
音声判別手段と、前記雑音混じりの音声信号に付いて、
前記音声判別手段の結果に基づき、音声部分を切り出す
音声切り出し手段とを備えたことを特徴とする信号処理
装置。 - 【請求項2】 音声切り出し手段によって切り出され
た音声特徴を抽出する特徴抽出手段と、基準となる特徴
を記憶した記憶手段と、その特徴抽出手段によって抽出
された特徴と基準となる特徴とを比較して音声認識を行
う特徴比較手段とを備えたことを特徴とする請求項1記
載の信号処理装置。 - 【請求項3】 前記音声判別手段は、ケプストラム分
析手段のケプストラム分析出力におけるケプストラムピ
ークを検出するピーク検出手段と、前記ケプストラム分
析手段のケプストラム分析出力における平均値レベルを
算出する平均値算出手段と、前記ピーク検出手段ピーク
検出情報と前記平均値算出手段の平均値情報に基づいて
、音声部分を判別する音声判別回路であることを特徴と
する請求項1記載の信号処理装置。 - 【請求項4】 前記音声判別手段は、ケプストラム分
析手段のケプストラム分析出力におけるケプストラムピ
ークを検出するピーク検出手段と、前記ケプストラム分
析手段のケプストラム分析出力における平均値レベルを
算出する平均値算出手段と、前記ピーク検出手段のピー
ク検出情報と前記平均値算出手段の平均値情報に基づい
て、音声部分を判別する音声判別回路であり、前記音声
切り出し手段によって切り出された音声特徴を抽出する
特徴抽出手段と、基準となる特徴を記憶した記憶手段と
、その特徴抽出手段によって抽出された特徴と基準とな
る特徴とを比較して音声認識を行う特徴比較手段とを備
えたことを特徴とする請求項1記載の信号処理装置。 - 【請求項5】 雑音混じりの音声信号を入力し、音声
部分を検出する音声検出手段と、その音声検出手段の検
出結果及び前記雑音混じりの音声信号を入力し、その音
声部分の雑音を予測する雑音予測手段と、その雑音予測
手段によって、予測された雑音を前記雑音混じりの音声
信号からキャンセルするキャンセル手段と、その雑音が
キャンセルされた音声信号に付いて、前記音声検出手段
により検出された音声部分に基づき、音声部分を切り出
す音声切り出し手段とを備えたことを特徴とする信号処
理装置。 - 【請求項6】 入力される雑音混じりの音声は、予め
帯域分割手段によって帯域分割されたものであり、前記
音声検出手段は、その雑音混じりの音声信号を入力し、
ケプストラム分析を行うケプストラム分析手段と、その
ケプストラム分析結果を利用して音声部分の判別を行う
音声判別手段とを備え、前記音声切り出し手段は、前記
キャンセル手段によって雑音がキャンセルされた音声信
号が帯域合成手段により合成された合成信号に付いて、
音声切り出しを行うことを特徴とする請求項5記載の信
号処理装置。 - 【請求項7】 音声切り出し手段によって切り出され
た音声の特徴を抽出する特徴抽出手段と、基準となる特
徴を記憶した記憶手段と、その特徴抽出手段によって抽
出された特徴と基準となる特徴とを比較して音声認識を
行う特徴比較手段とを備えたことを特徴とする請求項5
記載の信号処理装置。 - 【請求項8】音声切り出し手段によって切り出された音
声の特徴を抽出する特徴抽出手段と、基準となる特徴を
記憶した記憶手段と、その特徴抽出手段によって抽出さ
れた特徴と基準となる特徴とを比較して音声認識を行う
特徴比較手段とを備えたことを特徴とする請求項6記載
の信号処理装置。 - 【請求項9】 入力された、雑音を含む音声信号の周
波数帯域を分割する帯域分割手段と、その帯域分割手段
の帯域分割出力が入力され、ケプストラム分析を行うケ
プストラム手段と、そのケプストラム分析手段によって
分析された分析結果に基づいて、音声部分を判別する音
声判別手段と、その音声判別手段によって判別された音
声区間情報に基づいて、雑音区間を算出する雑音算出手
段と、この雑音算出手段によって算出された雑音区間情
報に基づいて、前記雑音を含む音声信号に付いて、雑音
区間だけ、その信号のレベルを減衰させるミュート手段
とを備えたことを特徴とする信号処理装置。 - 【請求項10】 雑音混じりの音声信号をA/D変換
するA/D変換手段と、そのA/D変換手段からのディ
ジタル出力について、フーリエ変換するフーリエ変換手
段と、そのフーリエ変換手段によって変換された信号に
付いてケプストラム分析を行うケプストラム分析手段と
、そのケプストラム分析手段によって分析された分析結
果に基づいて、音声部分を判別する音声判別手段と、そ
の音声判別手段によって判別された音声区間情報に基づ
いて、雑音区間を算出する雑音算出手段と、この雑音算
出手段によって算出された雑音区間情報に基づいて、前
記A/D変換手段からのディジタル出力について、雑音
区間だけ、その信号のレベルを減衰させるミュート手段
と、そのミュート手段からの出力に付いてのD/A変換
を行うD/A変換手段とを備えたことを特徴とする信号
処理装置。 - 【請求項11】 音声判別手段は、前記ケプストラム
分析手段からのケプストラム結果を入力し、そのケプス
トラム分析出力におけるケプストラムピークを検出する
ピーク検出手段と、前記ケプストラム分析手段のケプス
トラム分析出力における平均値レベルを算出する平均算
出手段と、前記ピーク検出手段のピーク検出情報と前記
平均値算出手段の平均値情報に基づいて、前記ピークに
基づき母音を判定し、前記平均値情報のレベルに基づき
子音を判定して、母音、子音を判定する母音/子音判定
手段とを備えたことを特徴とする請求項9記載の信号処
理装置。 - 【請求項12】 予め複数の人の音声の特徴を記憶し
ている記憶手段と、雑音混じりの音声信号について、音
声信号部分を検出する音声検出手段と、その音声検出手
段による音声部分に付いての特徴情報と前記記憶手段の
選択された所定の人の特徴情報とを比較し、その音声信
号部分の種類を検出する最ゆう検出手段と、前記音声検
出手段の出力及び前記最ゆう検出手段の出力を入力し、
雑音区間を算出する雑音算出手段と、この雑音算出手段
によって算出された雑音区間情報に基づいて、前記雑音
を含む音声信号に付いて、雑音区間だけ、その信号のレ
ベルを減衰させるミュート手段とを備えたことを特徴と
する信号処理装置。 - 【請求項13】 音声検出手段は、入力された、雑音
を含む音声信号の周波数帯域を分割する帯域分割手段と
、その帯域分割手段の帯域分割出力が入力され、ケプス
トラム分析を行うケプストラム手段と、そのケプストラ
ム分析手段によって分析された分析結果に基づいて、音
声部分を判別する音声判別手段とを備えたものであるこ
とを特徴とする請求項12記載の信号処理装置。 - 【請求項14】 音声判別手段は、前記ケプストラム
分析手段からのケプストラム結果を入力し、そのケプス
トラム分析出力におけるケプストラムピークを検出する
ピーク検出手段と、前記ケプストラム分析手段のケプス
トラム分析出力における平均値レベルを算出する平均値
算出手段と、前記ピーク検出手段のピーク検出情報と前
記平均値算出手段の平均値情報に基づいて、前記ピーク
に基づき、母音を判定し、前記平均値情報のレベルに基
づき子音を判定して、母音、子音を判定する母音/子音
判定手段とを備え、前記記憶手段に記憶される特徴及び
前記最ゆう検出手段で判断される特徴は、その検出され
たピーク情報及び平均値情報であることを特徴とする請
求項13記載の信号処理装置。 - 【請求項15】 入力された、雑音を含む音声信号の
音声部分を検出する音声検出手段と、その音声検出手段
によって検出された音声部分情報に基づいて、雑音区間
を算出する雑音算出手段と、前記音声検出手段によって
検出された音声部分に基づいて、前記雑音混じりの入力
信号について、音声部分の雑音を予測する雑音予測手段
と、この雑音予測手段によって、予測された雑音を、前
記雑音混じりの入力信号からキャンセルするキャンセル
手段と、前記雑音算出手段によって算出された雑音区間
情報に基づいて、前記キャンセル手段から出力される音
声信号に付いて、雑音区間だけ、その信号のレベルを減
衰させるミュート手段とを備えたことを特徴とする信号
処理装置。 - 【請求項16】 音声検出手段で検出された音声部分
情報を入力し、雑音部分のパワーを算出する雑音パワー
算出手段を備え、前記ミュート手段は、この雑音パワー
算出手段の算出結果に基づき、雑音の減衰を変更するこ
とを特徴とする請求項15記載の信号処理装置。 - 【請求項17】 入力された、雑音を含む音声信号の
周波数帯域を分割する帯域分割手段と、その帯域分割手
段の帯域分割出力が入力され、ケプストラム分析を行う
ケプストラム手段と、そのケプストラム分析手段によっ
て分析された分析結果に基づいて、音声部分を判別する
音声判別手段と、その音声判別手段によって判別された
音声部分情報に基づいて、雑音区間を算出する雑音算出
手段と、前記音声判別手段で判別された音声部分情報に
よって、帯域分割された信号に付いて、音声部分の雑音
を予測する雑音予測手段と、帯域分割された信号から、
その雑音予測手段によって予測された雑音を除去するキ
ャンセル手段と、この雑音がキャンセルされた信号を帯
域合成する帯域合成手段と、その帯域合成された信号に
付いて、前記雑音算出手段によって算出された雑音区間
情報に基づいて、雑音区間だけ、その信号のレベルを減
衰させるミュート手段とを備えたことを特徴とする信号
処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP03117276A JP3106543B2 (ja) | 1990-05-28 | 1991-05-22 | 音声信号処理装置 |
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2-138059 | 1990-05-28 | ||
JP2-138060 | 1990-05-28 | ||
JP13805590 | 1990-05-28 | ||
JP2-138054 | 1990-05-28 | ||
JP13805990 | 1990-05-28 | ||
JP2-138055 | 1990-05-28 | ||
JP13805490 | 1990-05-28 | ||
JP13806090 | 1990-05-28 | ||
JP03117276A JP3106543B2 (ja) | 1990-05-28 | 1991-05-22 | 音声信号処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04230800A true JPH04230800A (ja) | 1992-08-19 |
JP3106543B2 JP3106543B2 (ja) | 2000-11-06 |
Family
ID=27526760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP03117276A Expired - Fee Related JP3106543B2 (ja) | 1990-05-28 | 1991-05-22 | 音声信号処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3106543B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06282297A (ja) * | 1993-03-26 | 1994-10-07 | Idou Tsushin Syst Kaihatsu Kk | 音声符号化方式 |
JP2002182689A (ja) * | 2000-12-19 | 2002-06-26 | Yamaha Corp | 音声信号分離方法及び装置 |
JP2002244697A (ja) * | 2001-02-16 | 2002-08-30 | Casio Comput Co Ltd | 音声認証装置、音声認証方法、及びプログラム |
JP2005292812A (ja) * | 2004-03-09 | 2005-10-20 | Nippon Telegr & Teleph Corp <Ntt> | 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム、およびプログラムの記録媒体 |
CN104956437A (zh) * | 2013-02-08 | 2015-09-30 | 高通股份有限公司 | 执行增益控制的系统及方法 |
WO2022254834A1 (ja) * | 2021-05-31 | 2022-12-08 | ソニーグループ株式会社 | 信号処理装置、信号処理方法およびプログラム |
-
1991
- 1991-05-22 JP JP03117276A patent/JP3106543B2/ja not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06282297A (ja) * | 1993-03-26 | 1994-10-07 | Idou Tsushin Syst Kaihatsu Kk | 音声符号化方式 |
JP2002182689A (ja) * | 2000-12-19 | 2002-06-26 | Yamaha Corp | 音声信号分離方法及び装置 |
JP4710130B2 (ja) * | 2000-12-19 | 2011-06-29 | ヤマハ株式会社 | 音声信号分離方法及び装置 |
JP2002244697A (ja) * | 2001-02-16 | 2002-08-30 | Casio Comput Co Ltd | 音声認証装置、音声認証方法、及びプログラム |
JP2005292812A (ja) * | 2004-03-09 | 2005-10-20 | Nippon Telegr & Teleph Corp <Ntt> | 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム、およびプログラムの記録媒体 |
CN104956437A (zh) * | 2013-02-08 | 2015-09-30 | 高通股份有限公司 | 执行增益控制的系统及方法 |
JP2016507087A (ja) * | 2013-02-08 | 2016-03-07 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 利得制御を行うシステムおよび方法 |
US9741350B2 (en) | 2013-02-08 | 2017-08-22 | Qualcomm Incorporated | Systems and methods of performing gain control |
WO2022254834A1 (ja) * | 2021-05-31 | 2022-12-08 | ソニーグループ株式会社 | 信号処理装置、信号処理方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3106543B2 (ja) | 2000-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0763812B1 (en) | Speech signal processing apparatus for detecting a speech signal from a noisy speech signal | |
KR950013551B1 (ko) | 잡음신호예측장치 | |
US8612222B2 (en) | Signature noise removal | |
KR950011964B1 (ko) | 신호처리장치 | |
EP0459362B1 (en) | Voice signal processor | |
JP3451146B2 (ja) | スペクトルサブトラクションを用いた雑音除去システムおよび方法 | |
US5220610A (en) | Speech signal processing apparatus for extracting a speech signal from a noisy speech signal | |
KR960007842B1 (ko) | 음성잡음분리장치 | |
KR960005740B1 (ko) | 음성신호처리장치 | |
JP3106543B2 (ja) | 音声信号処理装置 | |
US20030046069A1 (en) | Noise reduction system and method | |
JP2007093635A (ja) | 既知雑音除去装置 | |
JPH04230796A (ja) | 音声信号処理装置 | |
CN113707156B (zh) | 一种用于车载的语音识别方法及系统 | |
Taboada et al. | Explicit estimation of speech boundaries | |
EP1102240A1 (en) | Interval normalization device for voice recognition input voice | |
JPH04227338A (ja) | 音声信号処理装置 | |
JPH04230798A (ja) | 雑音予測装置 | |
Kyriakides et al. | Isolated word endpoint detection using time-frequency variance kernels | |
KR950013555B1 (ko) | 음성신호처리장치 | |
JP2959792B2 (ja) | 音声信号処理装置 | |
KR950001067B1 (ko) | 음성인식장치 | |
JPH04211523A (ja) | 信号処理装置及びボイスダイアル電話システム | |
KR950001071B1 (ko) | 음성신호처리장치 | |
JPH0844390A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080908 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |