JP2003218745A - ノイズキャンセラ及び音声検出装置 - Google Patents

ノイズキャンセラ及び音声検出装置

Info

Publication number
JP2003218745A
JP2003218745A JP2002013498A JP2002013498A JP2003218745A JP 2003218745 A JP2003218745 A JP 2003218745A JP 2002013498 A JP2002013498 A JP 2002013498A JP 2002013498 A JP2002013498 A JP 2002013498A JP 2003218745 A JP2003218745 A JP 2003218745A
Authority
JP
Japan
Prior art keywords
signal
noise
frequency characteristic
equalizer
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002013498A
Other languages
English (en)
Inventor
Masafumi Miyabe
雅史 宮部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asahi Kasei Microsystems Co Ltd
Asahi Kasei Microdevices Corp
Original Assignee
Asahi Kasei Microsystems Co Ltd
Asahi Kasei Microdevices Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahi Kasei Microsystems Co Ltd, Asahi Kasei Microdevices Corp filed Critical Asahi Kasei Microsystems Co Ltd
Priority to JP2002013498A priority Critical patent/JP2003218745A/ja
Publication of JP2003218745A publication Critical patent/JP2003218745A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 演算能力の限られた処理系のための演算負荷
を軽減して、より高精度でノイズキャンセル及び話者発
話(話者音声)の検出ができる。 【解決手段】 その構成は、所定の周波数特性のノイズ
信号を含む音声信号が入力され、前記ノイズ信号の周波
数特性を平坦化する第1のイコライザ14と、第1のイ
コライザ14の出力信号に基づいて線スペクトルを強調
する適応フィルタ16と、適応フィルタ16の出力信号
の周波数特性を第1のイコライザ14の周波数特性を補
償するように変更する第3のイコライザ15と、適応フ
ィルタ16の出力信号に基づいて音声信号を検出する第
2のイコライザ21、変換変換部23及び通話状態検出
部45とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号に含まれ
ているノイズ信号を消去或いは削減するノイズキャンセ
ラ、電話装置、ノイズキャンセル方法及びコンピュータ
が実行可能なプログラム、並びにノイズ信号が含まれて
いる音声信号から話者音声信号を検出する音声検出装
置、電話装置、音声検出方法及びコンピュータが実行可
能なプログラムに関する。
【0002】
【従来の技術】従来より、電話装置には、話者の発話
(話者音声)を検出する話者発話検出器や、雑音を減衰
するための雑音減衰器(ノイズキャンセラ)が搭載され
ている。話者発話検出器としては、スペクトルマッチン
グ法や単純な音圧閾値比較法を採用して構成されている
ものがある。スペクトルマッチング法を採用した話者発
話検出器は、高速演算処理系向きとされており、また、
単純な音圧閾値比較法を採用した話者発話検出器は、低
演算処理系向きとされている。例えば、話者発話検出器
は、電話装置等においてエコーキャンセラ用として搭載
されている。
【0003】また、雑音減衰器としては、スペクトル減
算法や適応フィルタを採用して構成されているものがあ
る。スペクトル減算法を採用した雑音減衰器は、高速演
算処理系向きであり、単入力用とされており、また、適
応フィルタを採用した雑音減衰器は、低演算処理系向き
であり、複入力用とされている。
【0004】
【発明が解決しようとする課題】ところで、前記高速演
算処理系用のスペクトルマッチング法やスペクトル減算
法は、優れた方法ではあるが、FFT(Fast Fourier T
ransform)、IFFT(Inverse Fast Fourier Transfo
rm)演算等のスペクトル演算が要求されるため、比較的
高い演算処理能力が必要であり、メモリも同様に多く必
要になる。そのためLSIへの実装は困難となる問題が
ある。
【0005】一方、前記低演算処理系用として挙げた単
純な音圧閾値比較法は、雑音を話者発話として誤識別し
てしまう等、雑音による誤動作耐力が低い。また、雑音
減衰器に通常の適応フィルタを導入するためには、主入
力に加えてそれに相関のある雑音を入力しなければなら
ない。このため、主マイクと複数の副マイク(例えば、
アレーマイク等)が必要になり、マイク増設によるコス
トアップを招来するといった問題がある。
【0006】そこで、本発明は、前記問題に鑑みてなさ
れたものであり、演算能力の限られた処理系のための演
算負荷を軽減して、より高精度でノイズキャンセル及び
話者発話(話者音声)の検出ができるノイズキャンセ
ラ、音声検出装置、電話装置、ノイズキャンセル方法、
音声検出方法及びコンピュータが実行可能なプログラム
を提供することを目的としている。
【0007】
【課題を解決するための手段】前記問題を解決するため
に、請求項1記載の発明に係るノイズキャンセラは、所
定の周波数特性のノイズ信号を含む音声信号が入力さ
れ、前記ノイズ信号の周波数特性を平坦化する平坦化用
イコライザと、前記平坦化用イコライザの出力信号に基
づいて線スペクトルを強調する適応フィルタと、前記適
応フィルタの出力信号の周波数特性を前記平坦化用イコ
ライザの周波数特性を補償するように変更する補償用イ
コライザと、を備えたことを特徴としている。
【0008】また、請求項2記載の発明に係る音声検出
装置は、所定の周波数特性のノイズ信号を含む音声信号
が入力され、前記ノイズ信号の周波数特性を平坦化する
平坦化用イコライザと、前記平坦化用イコライザの出力
信号に基づいて線スペクトルを強調する適応フィルタ
と、前記適応フィルタの出力信号に基づいて前記音声信
号を検出する音声信号検出手段と、を備えたことを特徴
としている。
【0009】また、請求項3記載の発明に係る電話装置
は、前記請求項1に記載のノイズキャンセラ又は請求項
2に記載の音声検出装置を備えていることを特徴として
いる。また、請求項4記載の発明に係る電話装置は、所
定の周波数特性のノイズ信号を含む音声信号が入力さ
れ、前記ノイズ信号の周波数特性を平坦化する平坦化用
イコライザと、前記平坦化用イコライザの出力信号に基
づいて線スペクトルを強調する適応フィルタと、前記適
応フィルタの出力信号の周波数特性を前記平坦化用イコ
ライザの周波数特性を補償するように変更する補償用イ
コライザと、前記適応フィルタの出力信号に基づいて前
記音声信号を検出する音声信号検出手段と、を備えたこ
とを特徴としている。
【0010】また、請求項5記載の発明に係るノイズキ
ャンセル方法は、所定の周波数特性のノイズ信号を含む
音声信号内の前記ノイズ信号の周波数特性を平坦化し、
前記ノイズ信号の周波数特性を平坦化した前記音声信号
に基づいて線スペクトルを強調し、前記線スペクトルを
強調した前記音声信号の周波数特性を、前記平坦化した
周波数特性を補償するように変更することを特徴として
いる。
【0011】また、請求項6記載の発明に係る音声検出
方法は、所定の周波数特性のノイズ信号を含む音声信号
内の前記ノイズ信号の周波数特性を平坦化し、前記ノイ
ズ信号の周波数特性を平坦化した前記音声信号に基づい
て線スペクトルを強調し、前記線スペクトルを強調した
信号に基づいて音声信号を検出することを特徴としてい
る。
【0012】また、請求項7記載の発明に係るコンピュ
ータが実行可能なプログラムは、所定の周波数特性のノ
イズ信号を含む音声信号を入力し、前記ノイズ信号の周
波数特性を平坦化させ、前記平坦化された出力信号に基
づいて線スペクトルを強調させ、前記強調された出力信
号の周波数特性を前記周波数特性を補償するように変更
させる記述を含んでいることを特徴としている。
【0013】また、請求項8記載の発明に係るコンピュ
ータが実行可能なプログラムは、所定の周波数特性のノ
イズ信号を含む音声信号を入力し、前記ノイズ信号の周
波数特性を平坦化させ、前記平坦化された出力信号に基
づいて線スペクトルを強調させ、前記強調された出力信
号に基づいて前記音声信号を検出させる記述を含んでい
ることを特徴としている。
【0014】ここで、請求項1,5及び7に記載の発明
では、音声信号が含む所定の周波数特性のノイズ信号の
当該周波数特性を平坦化し、ノイズ信号の周波数特性を
平坦化した音声信号に基づいて線スペクトルを強調し、
線スペクトルを強調した前記音声信号の周波数特性を、
平坦化した周波数特性を補償するように変更している。
【0015】これにより、音声信号中の所定信号は線ス
ペクトルにであるため強調される一方、ノイズ信号は、
周波数特性として一旦平坦化されることでノイズの線ス
ペクトル性が失われて減衰される。また、請求項2,6
及び8に記載の発明では、所定の周波数特性のノイズ信
号を含む音声信号内のノイズ信号の周波数特性を平坦化
し、ノイズ信号の周波数特性を平坦化した音声信号に基
づいて線スペクトルを強調し、線スペクトルを強調した
信号に基づいて音声信号を検出している。
【0016】例えば、音声信号の周波数特性について線
スペクトルを強調しようとすると、long-term instabil
ity problemにより、所定の周波数特性を有するノイズ
信号も強調されてしまう。しかし、ノイズ信号の周波数
特性を平坦化することで、ノイズ信号の周波数が強調さ
れてしまうこともない。すなわち、請求項2,6及び8
に記載の発明では、音声信号内のノイズ信号を除く所定
信号についてその線スペクトルを強調している。
【0017】また、請求項1に記載のノイズキャンセラ
と、請求項2に記載の音声検出装置とは、平坦化用イコ
ライザ及び適応フィルタが共通の構成部分となってい
る。請求項3及び4に記載の発明では、電話装置がその
ノイズキャンセラや音声検出装置を搭載している。特
に、請求項4記載の電話装置では、平坦化用イコライザ
及び適応フィルタを共通の構成部分として備えて、ノイ
ズキャンセラの機能と音声検出装置の機能とを実現して
いる。
【0018】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら詳細に説明する。図1は、この実施の形
態であるノイズキャンセラ10及び音声検出装置20の
構成を示す。図1に示すように、ノイズキャンセラ(雑
音減衰器)10は、第1乃至第3のアンプ11,12,
13、第1及び第3のイコライザ14,15、並びに適
応フィルタ16を備えている。また、音声検出装置20
は、前記第1のアンプ11、前記第1のイコライザ1
4、前記適応フィルタ16、第2のイコライザ21、第
4のアンプ22、音圧変換部23及び通話状態検出部
(音圧閾値比較器)45を備えている。すなわち、ノイ
ズキャンセラ10と音声検出装置20とは、前記第1の
アンプ11、前記第1のイコライザ14、前記適応フィ
ルタ16といった構成部分を共有し、それぞれの機能を
果すように構成されている。
【0019】例えば、ノイズキャンセラ10は、雑音減
衰用として、また、音声検出装置20は、話者の発話
(話者音声)の検出用として、電話装置に搭載されてい
る。例えば、音声検出装置20については、電話装置に
おいてエコーキャンセラ用として利用される。このよう
なノイズキャンセラ10及び音声検出装置20の構成に
おいて、第1のアンプ11を介して第1のイコライザ1
4に音声入力される。ここで、音声入力される信号は、
単入力信号であって、話者音声信号と雑音信号とを含ん
だ信号である。
【0020】第1のイコライザ14は、音声信号の所定
の帯域内のノイズを平坦化してノイズの線スペクトル性
を失わせて、後段の適応フィルタ16にその線スペクト
ル性を失ったとノイズ信号と音声信号を出力する。適応
フィルタ16は、ラインエンハンス法を採用した適応フ
ィルタである。この適応フィルタ16は、線スペクトル
(ラインスペクトル)のもつ周期性信号(正弦波信号)
に混入する広帯域信号(雑音)を消去し、その周期性信
号のスペクトルを強調することができる。これにより、
適応フィルタ16は、所定の周波数特性を持つ想定され
る雑音中から話者音声信号を抽出することができる。例
えば、車内で使用することを目的としているハンズフリ
ー電話の場合、前記想定される雑音は、自動車の走行音
等の雑音になる。
【0021】ここで、ラインエンハンス法を採用した適
応フィルタ16は、いわゆるlong-term instability pr
oblemが発生してしまう場合がある。適応フィルタ16
は、このlong-term instability problemにより、周期
性信号(正弦波)を適応した後に、その周期性信号内の
混入雑音にも適応してしまう場合がある。この場合、適
応フィルタ16は、その混入雑音を強調してしまう。こ
の問題は、特にその混入雑音が有色であり、係数更新ア
ルゴリズムとしてLMS法を使用した場合に生じる問題
である。
【0022】このような問題を解決するため、前記第1
のイコライザ14をこの適応フィルタ16の前段に備え
ている。すなわち、第1のイコライザ14を適応フィル
タ16の前段に備えることで、適応フィルタ16に入力
される音声信号内の雑音特性分をこの第1のイコライザ
14により、周波数特性について平坦化して、無色雑音
に変換している。
【0023】また、適応フィルタ16は、係数更新アル
ゴリズムに学習同定法を採用している。学習同定法の係
数更新精度(速度)をパワー項の係数調整等によって調
整することにより、瞬時的な周期性信号の合成である音
声に対して、音圧(音質)の劣化を最小限に抑えること
を実現している。この適応フィルタ16は、信号処理し
た音声信号を第2のイコライザ21に出力し、また、第
2のアンプ12を介して第3のイコライザ15に出力し
ている。
【0024】第2のイコライザ21は、適応フィルタ1
6からの音声信号を主帯域に制限(主帯域を強調)して
いる。第2のイコライザ21は、音声信号を第4のアン
プ22を介して音圧変換部23に出力する。音圧変換部
23は、入力された音声信号を音圧信号に変換する。音
圧変換部23は、音圧信号を通話状態検出部(音圧閾値
比較器)45に出力する。音圧閾値比較器は、閾値と比
較することで、話者音声か否かを判定することを可能に
するものである。
【0025】一方、第3のイコライザ15は、適応フィ
ルタ16からの音声信号の所定帯域を強調する。適応フ
ィルタ16からの音声信号は、当該適応フィルタ16の
前段の第1のイコライザ14により雑音が平坦化された
音声信号となっており、第3のイコライザ15は、この
第1のイコライザ14に入力される前の状態の音声信号
の周波数特性に戻すように所定帯域を強調する。すなわ
ち、第3のイコライザ15は、第1のイコライザ14に
よりなした音声信号の処理を補償している。また、第3
のイコライザ15は、音声中心帯域を強調する。これに
より、第3のイコライザ15は、聴感補正を実施してい
る。
【0026】以上のような構成において、音声信号(話
者音声信号と雑音信号からなる信号)は、第1のイコラ
イザ14において、無色信号に変換されて、適応フィル
タ16に入力される。音声信号は、適応フィルタ16に
おいて、想定される周波数特性(例えば、自動車の走行
音)を持つ雑音中から所望の音声信号として話者音声信
号が抽出される。
【0027】適応フィルタ16にて抽出された話者音声
信号は、第3のイコライザ15及びノイズキャンセラ1
0外の第2のイコライザ21に出力される。第2のイコ
ライザ21に入力された話者音声信号は、ここで、主帯
域が強調され、音圧変換部23に出力される。話者音声
信号は、この音圧変換部23において、音圧信号に変換
されて、音圧閾値比較器に出力される。
【0028】このように、第1のイコライザ14、適応
フィルタ16及び第2のイコライザ21により、入力さ
れた音声信号から話者音声信号を抽出し、さらにその話
者音声信号の主帯域を強調することで、第1のイコライ
ザ14、適応フィルタ16、第2のイコライザ21、音
圧変換部23及び通話状態検出部(音圧閾値比較器)4
5は、検出装置20として機能する。
【0029】一方、第3のイコライザ15に入力された
話者音声信号は、前記第1のイコライザ14に入力前の
状態になるように、その帯域が補正され、さらに聴感補
正されて、当該ノイズキャンセラ10外に外部出力され
る。このように、第1のイコライザ14、適応フィルタ
16及び第3のイコライザ15により、入力された音声
信号の雑音を減衰させ、その後、雑音が減衰された音声
信号の中心帯域を強調することで、すなわち、雑音につ
いてその周波数特性を一旦平坦化することで、第1のイ
コライザ14、適応フィルタ16及び第3のイコライザ
15は、ノイズキャンセラ10として機能する。
【0030】以上のように、図1に示す実施の形態は、
ノイズキャンセラ10と音声検出装置20とを組み合わ
せて構成されている。ここで、第1のイコライザ14
は、所定の周波数特性のノイズ信号を含む音声信号が入
力され、前記ノイズ信号の周波数特性を平坦化する平坦
化用イコライザに対応し、適応フィルタ16は、第1の
イコライザ14の出力信号に基づいて線スペクトルを強
調する適応フィルタに対応し、第3のイコライザ15
は、適応フィルタ16の出力信号の周波数特性を第1の
イコライザ14の周波数特性を補償するように変更する
補償用イコライザに対応し、第2のイコライザ21、音
圧変換部23及び通話状態検出部(音圧閾値比較器)4
5は、適応フィルタ16の出力信号に基づいて音声信号
を検出する音声信号検出手段に対応する。
【0031】以上のような構成では、前述したように、
ラインエンハンス法を採用した適応フィルタ16を用
い、音声信号中の話者音声信号を抽出している。これに
より、マイク増設等によるコストアップを招来すること
なく、後段で行う音圧閾値比較等を可能にしている。ま
た、ラインエンハンス法を採用した適応フィルタは、軽
微な演算量で適応フィルタとしての機能を達成すること
から、簡単な構成としながらも、雑音耐力の高い音声検
出装置を実現する。
【0032】また、前述したように、適応フィルタ16
への音声信号の入力段に、第1のイコライザ14を備え
ている。これにより、適応フィルタ16への入力音声信
号中の雑音を第1のイコライザ14で無色雑音に変換し
て、ラインエンハンス法を採用した適応フィルタを用い
ることによるlong-term instability problemの発生を
防止している。
【0033】さらに、ノイズキャンセラ10は、音声検
出装置の一部として機能する適応フィルタ16の後段に
第3のイコライザ15を設ける構成になっている。よっ
て、ノイズキャンセラ10は、そのような適応フィルタ
16を利用した構成、すなわち、話者信号検出のための
中間信号を使用して、雑音減衰を実現するような構成に
なっており、演算負担が少ないノイズキャンセラとして
実現されている。
【0034】ここで、前記のような構成における各段階
の各種信号のスペクトル特性(周波数特性)を説明す
る。図2は、自動車の走行時における車室内の走行雑音
の周波数特性(実線)を示す。すなわち、第1のアンプ
11に入力される前の音声信号であって雑音信号のみの
音声信号の周波数特性を示す。なお、後述の図3及び図
4は、このような雑音信号のみからなる音声信号につい
ての処理結果を示す。
【0035】図3は、第1のイコライザ14により信号
処理されて雑音特性が無色化され音声信号(雑音信号)
の周波数特性(破線)、及び適応フィルタ16により信
号処理された音声信号(雑音信号)の周波数特性(実
線)を示す。この図3が示すように、音声信号(雑音信
号)は、適応フィルタ16によるラインエンハンス法で
信号処理されて、減衰している。
【0036】図4は、第1のイコライザ14に入力され
る前の音声信号(雑音信号)の周波数特性(破線)、及
び第3のイコライザ15により信号処理されて音声信号
(雑音信号)の周波数特性(実線)を示す。この図4が
示すように、音声信号(雑音信号)は、第1のイコライ
ザ14への入力前、第3のイコライザ15からの出力後
において、周波数特性では相似形を示すものの、第3の
イコライザ15により出力された状態で減衰している。
【0037】図5は、所定信号(話者音声信号に対応す
る信号)と雑音信号とからなる音声信号であって、第1
のイコライザ14により信号処理されて雑音信号につい
て無色化された音声信号(話者音声信号+雑音信号)の
周波数特性(破線)、及び適応フィルタ16により信号
処理された音声信号(話者音声信号+雑音信号)の周波
数特性(実線)を示す。例えば、所定信号(話者音声信
号に相当する信号)は、ランダムな周波数の正弦波3波
の約100ms(無音約1000ms)の繰り返し信号
を使用している。
【0038】この図5が示すように、適応フィルタ16
により所定信号が抽出されているのがわかる。図6は、
第1のイコライザ14に入力される前の音声信号(話者
音声信号+雑音信号)の周波数特性(破線)、及び第3
のイコライザ15により信号処理された音声信号(話者
音声信号+雑音信号)の周波数特性(実線)を示す。
【0039】ここで、第3のイコライザ15により信号
処理された音声信号(話者音声信号+雑音信号)の周波
数特性(実線)については、第1のイコライザ14への
入力前の元の周波数特性に戻されたものであって、さら
に聞き易くするために聴感補正として2kHz帯域が補
正された信号の周波数特性である。この図6が示すよう
に、所定信号(話者音声信号に相当する信号)の周波数
特性が維持された状態とされ、その一方で雑音信号の周
波数特性が減衰している。
【0040】以上の結果からも明らかなように、本実施
の形態の構成が、ノイズキャンセラ10及び音声検出装
置20として十分機能しているのがわかる。次に、図1
に示したノイズキャンセラ10及び音声検出装置20か
らなる構成が搭載される電話装置の具体例を説明する。
電話装置としては、車載のハンズフリー電話装置が挙げ
られる。図7は、ノイズキャンセラ10及び音声検出装
置20を搭載したハンズフリー電話装置の構成を示す。
【0041】先ず、通話相手(遠端話者)の音声信号に
関する処理を行う部分、及びその部分の処理内容を説明
する。このハンズフリー電話装置では、A/D変換部3
1に通話相手(遠端話者)の音声信号が入力され、この
A/D変換部31は、遠端話者の音声信号をデジタル変
換する。このA/D変換部31からの音声信号は、アン
プ32を介して、フィルタ(TEL_Filter)33に入
力される。
【0042】フィルタ33は、音声信号から低域ノイズ
をカットする。このフィルタ33からの信号は、アッテ
ネータ34、及びアンプ41を介してイコライザ42、
或いはアンプ51を介してエコーキャンセラ52にそれ
ぞれ入力される。アッテネータ34は、遠端話者の音声
信号の検出がない場合に、音量を下げるためのものであ
る。このアッテネータ34は、通話状態検出器45に連
動する。このアッテネータ34からの音声信号は、アン
プ35を介してD/A変換部36に入力される。
【0043】例えば、D/A変換部36は、L/Rch
に応じて備えられている。このD/A変換部36は、入
力された信号をアナログ変換する。このD/A変換部3
6によりアナログ変換された信号は、スピーカ37によ
り遠端話者の発話として外部出力される。一方、前記フ
ィルタ33からの音声信号がアンプ41を介して入力さ
れるイコライザ42は、音声の主帯域を制限(或いは強
調)する。このイコライザ42にて信号処理された音声
信号は、音圧変換部43に入力される。
【0044】音圧変換部43は、入力された音声信号を
音圧信号に変換する。この音圧変換部43からの音圧信
号は、AGC(Automatic Gain Control )部44に入
力される。AGC部44は、入力された音圧信号につい
て、当該電話装置や通話状態の音圧のばらつきを吸収す
るようにそのゲインを調整する。このAGC部44で信
号処理された音圧信号は、通話状態検出部45に入力さ
れる。通話状態検出部45は、各種信号に基づいて通話
状態を検出するように構成されている。この通話状態検
出部45は、話者の音声信号の音圧を調整するための音
圧閾値比較器を備えている。
【0045】一方、前記フィルタ33からの音声信号が
アンプ51を介して入力される擬似エコーパス合成部5
2は、エコーを消去或いは減衰するための信号を生成す
る部分である。この擬似エコーパス合成部52における
処理については後で説明する。次に、当該電話装置の使
用者(近端話者)の音声信号に関する処理を行う部分、
及びその部分の処理内容を説明する。
【0046】ハンズフリー電話装置では、先ず、音声が
マイク61から入力される。ここで、マイク61は、車
室内に設けられていることから、このマイク61には、
近端話者の話者音声、雑音及びスピーカ37から回り込
んだ出力音声(遠端話者の音声)からなる音声が入力さ
れる。そして、マイク61に入力された音声信号は、A
/D変換部62に入力される。
【0047】A/D変換部62は、入力された音声信号
をデジタル変換する。このA/D変換部62でデジタル
変換された音声信号は、アンプ63を介してフィルタ
(MIC_Filter)64に入力される。フィルタ64
は、マイク61とスピーカ37の特性を合わせるための
フィルタである。このフィルタ64により信号処理され
た音声信号は、加算器65を介して学習制御部66や前
述のノイズキャンセラ10及び音声検出装置20の構成
部に入力される。
【0048】学習制御部66は、自己に入力される音声
信号に基づいて、擬似エコーパス合成部52を制御して
いる。ここで、擬似エコーパス合成部52は、遠端話者
の音声信号(アンプ51からの音声信号)を参照して、
擬似エコーを生成するように構成されている。学習制御
部66は、推定学習により、加算器65からの残信号が
小さくなるように擬似エコーパス合成部52を制御す
る。このような制御により、加算器65からノイズキャ
ンセラ10及び音声検出装置20の構成部に入力される
音声信号は、エコー(エコー成分)が消去或いは減衰さ
れたものになる。
【0049】ここで、遠端話者が発話中にのみ擬似エコ
ーパス合成部52或いは学習制御部66が動作してい
る。すなわち、遠端話者が発話中にのみ、擬似エコーパ
ス合成部52は擬似エコーを合成し、或いは学習制御部
66はエコーの学習をしている。なお、擬似エコーパス
合成部52、学習制御部66及び加算器65は、いわゆ
るエコーキャンセラとして機能している。
【0050】ノイズキャンセラ10及び音声検出装置2
0の構成部では、前述したように動作する。すなわち、
音声信号(近端話者の話者音声信号と雑音信号とからな
る音声信号)は、第1のイコライザ14において、無色
信号に変換されて、適応フィルタ16に入力される。音
声信号は、適応フィルタ16において、自動車の走行音
の周波数特性を持つ雑音中から話者音声信号が抽出され
る。そして、適応フィルタ16からの音声信号は、第2
のイコライザ21及び第3のイコライザ15に出力され
る。
【0051】第2のイコライザ21に入力された音声信
号は、ここで、主帯域(話者音声信号の主帯域)が強調
され、音圧変換部23に出力される。音声信号は、音圧
変換部23において、音圧信号に変換されて、通話状態
検出部45に出力される。通話状態検出部45には、前
記AGC部44からの音圧信号が遠端話者の音圧信号と
して入力され、音圧変換部23からの音圧信号が近端話
者の音圧信号として入力される。通話状態検出部45
は、遠端話者の音圧信号と、近端話者の音圧信号とに基
づいて、各種の通話状態を検出している。
【0052】例えば、通話状態検出部45は、通話状態
の検出結果を、前記アッテネータ34や擬似エコーパス
合成部52、或いは後述のアッテネータ71に出力して
いる。前記アッテネータ34では、通話状態検出器45
からの通話状態の検出結果から、遠端話者の音声信号の
検出がない場合は、音量を下げている。また、擬似エコ
ーパス合成部52は、通話状態検出器45からの通話状
態の検出結果から、遠端話者のみが発話中であることを
検出して、擬似エコーを合成する。或いは、学習制御部
66は、通話状態検出器45からの通話状態の検出結果
から、遠端話者のみが発話中であることを検出して、エ
コーの学習をする。
【0053】一方、第3のイコライザ15に入力された
話者音声信号は、第1のイコライザ14に入力前の状
態、すなわち、雑音信号との合成信号とされた音声信号
とされ、さらに、その中心帯域が強調されて聴感補正さ
れて、アッテネータ71に出力される。そして、ここで
アッテネータ71に出力される信号は、雑音が減衰され
た音声信号になっている。
【0054】アッテネータ71は、遠端話者の音声信号
の検出がある場合に、入力される音声信号について、音
量を下げるためのものである。そして、アッテネータ7
1は、通話状態検出部45等に連動している。すなわ
ち、アッテネータ71は、通話状態検出器45からの通
話状態の検出結果から、遠端話者の音声信号の検出があ
る場合は、音量を下げている。このアッテネータ71か
らの信号は、アンプ72を介してD/A変換部73に入
力される。
【0055】以上のような車載用のハンズフリーの電話
装置では、マイク61に、車室内の話者の音声と、車室
内の雑音と、およびスピーカ37からのエコー(反射音
或いは回り込み音)とが混入して入力される。このマイ
ク61が拾った音声を直接相手(遠端話者)に返してし
まうと、自分の声がエコーとして聞こえること、雑音が
聞こえること等から、非常に聞きづらくなってしまう。
擬似エコーパス合成部52或いは学習制御部66は、そ
のようなエコーを除去するためのものである。
【0056】ここで、擬似エコーパス合成部52或いは
学習制御部66は、エコーを推定学習して、エコーを除
去するための擬似エコーを生成するが、それを精度よく
行うためには、遠端話者のみが話している正確なタイミ
ングで動作する必要がある。ここで、電話装置は、前述
したように精度よく話者音声検出を実現できる話者音声
検出装置20を備えており、音声検出装置20の検出結
果を参照することで、精度よく話者状態の検出ができ
る。よって、通話状態検出部45の検出結果に基づいて
動作する擬似エコーパス合成部52或いは学習制御部6
6は、通話状態検出部45にてなされる高精度の遠端話
者のみの発話状態の検出結果を参照することで、遠端話
者のみが話している正確なタイミングで動作することが
できる。
【0057】実施の形態では、第2のイコライザ21で
ある場合について説明したが、例えば、ハイパスフィル
タであってもよい。なぜならば、この場合のノイズは車
のロードノイズ(低域ノイズ)が支配的だからである。
また、ノイズキャンセラ10や音声検出装置20が実行
する各種処理は、記録媒体或いは通信媒体を介して電話
装置に提供されたコンピュータが実行可能なプログラム
により実現されるものであってもよい。ここで、コンピ
ュータは、マイクロプロセッサ、CPU、DSP等を含
んでいる。
【0058】また、以上説明した実施の形態では、以下
のようなノイズキャンセル方法及び音声検出方法が実現
されている。すなわち、所定の周波数特性のノイズ信号
を含む音声信号内の前記ノイズ信号の周波数特性を平坦
化し、前記ノイズ信号の周波数特性を平坦化した前記音
声信号に基づいて線スペクトルを強調し、前記線スペク
トルを強調した前記音声信号の周波数特性を、前記平坦
化した周波数特性を補償するように変更するノイズキャ
ンセル方法を実現している。
【0059】また、所定の周波数特性のノイズ信号を含
む音声信号内の前記ノイズ信号の周波数特性を平坦化
し、前記ノイズ信号の周波数特性を平坦化した前記音声
信号に基づいて線スペクトルを強調し、前記線スペクト
ルを強調した信号に基づいて音声信号を検出する音声検
出方法を実現している。
【0060】
【発明の効果】以上より、本発明によれば、音声信号中
の所定信号を線スペクトルにより強調する一方、ノイズ
信号をその周波数特性について一旦平坦化することで減
衰させており、演算処理の負担が少ないため、簡単な構
成で、高精度なノイズキャンセラが実現される。
【0061】また、線スペクトルにより周波数特性を強
調しても、long-term instabilityproblemによる問題等
が発生してしまうことを防止しており、演算処理の負担
が少ないため、簡単な構成でかつ誤動作耐力が高く高精
度な音声検出装置が実現される。また、電話装置におい
て、構成部品を共通化してノイズキャンセラ及び音声検
出装置を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態のノイズキャンセラ及び音
声検出装置の構成を示すブロック図である。
【図2】自動車の走行時における車室内走行雑音の周波
数特性(実線)を示す特性図である。
【図3】第1のイコライザにより信号処理されて雑音特
性が無色化された音声信号(雑音信号)の周波数特性
(破線)、及び適応フィルタにより信号処理された音声
信号(雑音信号)の周波数特性(実線)を示す特性図で
ある。
【図4】第1のイコライザに入力される前の音声信号
(雑音信号)の周波数特性(破線)、及び第3のイコラ
イザにより信号処理された音声信号(雑音信号)の周波
数特性(実線)を示す特性図である。
【図5】第1のイコライザにより信号処理されて雑音信
号が無色化された音声信号(話者音声信号+雑音信号)
の周波数特性(破線)、及び適応フィルタにより信号処
理された音声信号(話者音声信号+雑音信号)の周波数
特性(実線)を示す特性図である。
【図6】第1のイコライザに入力される前の音声信号
(話者音声信号+雑音信号)の周波数特性(破線)、及
び第3のイコライザにより信号処理された音声信号(話
者音声信号+雑音信号)の周波数特性(実線)を示す特
性図である。
【図7】本発明の実施の形態のハンズフリー電話装置の
構成を示すブロック図である。
【符号の説明】
10 ノイズキャンセラ 11,12,13,22 アンプ 14 第1のイコライザ 15 第3のイコライザ 16 適応フィルタ 20 音声検出装置 21 第2のイコライザ 23 音圧変換部 45 通話状態検出部(音圧閾値比較器)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 9/00 D

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 所定の周波数特性のノイズ信号を含む音
    声信号が入力され、前記ノイズ信号の周波数特性を平坦
    化する平坦化用イコライザと、 前記平坦化用イコライザの出力信号に基づいて線スペク
    トルを強調する適応フィルタと、 前記適応フィルタの出力信号の周波数特性を前記平坦化
    用イコライザの周波数特性を補償するように変更する補
    償用イコライザと、 を備えたことを特徴とするノイズキャンセラ。
  2. 【請求項2】 所定の周波数特性のノイズ信号を含む音
    声信号が入力され、前記ノイズ信号の周波数特性を平坦
    化する平坦化用イコライザと、 前記平坦化用イコライザの出力信号に基づいて線スペク
    トルを強調する適応フィルタと、 前記適応フィルタの出力信号に基づいて前記音声信号を
    検出する音声信号検出手段と、 を備えたことを特徴とする音声検出装置。
  3. 【請求項3】 前記請求項1に記載のノイズキャンセラ
    又は請求項2に記載の音声検出装置を備えていることを
    特徴とする電話装置。
  4. 【請求項4】 所定の周波数特性のノイズ信号を含む音
    声信号が入力され、前記ノイズ信号の周波数特性を平坦
    化する平坦化用イコライザと、 前記平坦化用イコライザの出力信号に基づいて線スペク
    トルを強調する適応フィルタと、 前記適応フィルタの出力信号の周波数特性を前記平坦化
    用イコライザの周波数特性を補償するように変更する補
    償用イコライザと、 前記適応フィルタの出力信号に基づいて前記音声信号を
    検出する音声信号検出手段と、 を備えたことを特徴とする電話装置。
  5. 【請求項5】 所定の周波数特性のノイズ信号を含む音
    声信号内の前記ノイズ信号の周波数特性を平坦化し、 前記ノイズ信号の周波数特性を平坦化した前記音声信号
    に基づいて線スペクトルを強調し、 前記線スペクトルを強調した前記音声信号の周波数特性
    を、前記平坦化した周波数特性を補償するように変更す
    ることを特徴とするノイズキャンセル方法。
  6. 【請求項6】 所定の周波数特性のノイズ信号を含む音
    声信号内の前記ノイズ信号の周波数特性を平坦化し、 前記ノイズ信号の周波数特性を平坦化した前記音声信号
    に基づいて線スペクトルを強調し、 前記線スペクトルを強調した信号に基づいて音声信号を
    検出することを特徴とする音声検出方法。
  7. 【請求項7】 所定の周波数特性のノイズ信号を含む音
    声信号を入力し、前記ノイズ信号の周波数特性を平坦化
    させ、 前記平坦化された出力信号に基づいて線スペクトルを強
    調させ、 前記強調された出力信号の周波数特性を前記周波数特性
    を補償するように変更させる記述を含んでいることを特
    徴とするコンピュータが実行可能なプログラム。
  8. 【請求項8】 所定の周波数特性のノイズ信号を含む音
    声信号を入力し、前記ノイズ信号の周波数特性を平坦化
    させ、 前記平坦化された出力信号に基づいて線スペクトルを強
    調させ、 前記強調された出力信号に基づいて前記音声信号を検出
    させる記述を含んでいることを特徴とするコンピュータ
    が実行可能なプログラム。
JP2002013498A 2002-01-22 2002-01-22 ノイズキャンセラ及び音声検出装置 Withdrawn JP2003218745A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002013498A JP2003218745A (ja) 2002-01-22 2002-01-22 ノイズキャンセラ及び音声検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002013498A JP2003218745A (ja) 2002-01-22 2002-01-22 ノイズキャンセラ及び音声検出装置

Publications (1)

Publication Number Publication Date
JP2003218745A true JP2003218745A (ja) 2003-07-31

Family

ID=27650440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002013498A Withdrawn JP2003218745A (ja) 2002-01-22 2002-01-22 ノイズキャンセラ及び音声検出装置

Country Status (1)

Country Link
JP (1) JP2003218745A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011522294A (ja) * 2008-05-29 2011-07-28 クゥアルコム・インコーポレイテッド スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
CN112309413A (zh) * 2019-07-31 2021-02-02 株式会社电装天 降噪装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011522294A (ja) * 2008-05-29 2011-07-28 クゥアルコム・インコーポレイテッド スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
CN112309413A (zh) * 2019-07-31 2021-02-02 株式会社电装天 降噪装置
US11017796B2 (en) 2019-07-31 2021-05-25 Denso Ten Limited Noise reduction apparatus

Similar Documents

Publication Publication Date Title
CA2989759C (en) System and method for echo suppression for in-car communications
EP1298815B1 (en) Echo processor generating pseudo background noise with high naturalness
JP4913155B2 (ja) 音響エコーキャンセラ
US8111840B2 (en) Echo reduction system
US7930175B2 (en) Background noise reduction system
US6674865B1 (en) Automatic volume control for communication system
US8306234B2 (en) System for improving communication in a room
US8189766B1 (en) System and method for blind subband acoustic echo cancellation postfiltering
JP5148150B2 (ja) 音響信号処理における均等化
US20140233757A1 (en) Noisy Environment Communication Enhancement System
US8175290B2 (en) Feedback reduction system
EP2859772B1 (en) Wind noise detection for in-car communication systems with multiple acoustic zones
US9699554B1 (en) Adaptive signal equalization
US8761410B1 (en) Systems and methods for multi-channel dereverberation
EP1081985A2 (en) Microphone array processing system for noisly multipath environments
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
US8259926B1 (en) System and method for 2-channel and 3-channel acoustic echo cancellation
WO2002032356A1 (en) Transient processing for communication system
WO2013096159A2 (en) Apparatus and method for noise removal
JP2009094802A (ja) 通信装置
JP4345208B2 (ja) 反響及び雑音除去装置
JP2003218745A (ja) ノイズキャンセラ及び音声検出装置
JP5383008B2 (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
US11323804B2 (en) Methods, systems and apparatus for improved feedback control
JP3233525B2 (ja) 音声通信システム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050405