JP4441293B2 - 収音方法、収音装置、収音プログラム - Google Patents

収音方法、収音装置、収音プログラム Download PDF

Info

Publication number
JP4441293B2
JP4441293B2 JP2004065514A JP2004065514A JP4441293B2 JP 4441293 B2 JP4441293 B2 JP 4441293B2 JP 2004065514 A JP2004065514 A JP 2004065514A JP 2004065514 A JP2004065514 A JP 2004065514A JP 4441293 B2 JP4441293 B2 JP 4441293B2
Authority
JP
Japan
Prior art keywords
frequency
signal
sound
band
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004065514A
Other languages
English (en)
Other versions
JP2005257749A (ja
Inventor
真理子 青木
末廣 島内
賢一 古家
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004065514A priority Critical patent/JP4441293B2/ja
Publication of JP2005257749A publication Critical patent/JP2005257749A/ja
Application granted granted Critical
Publication of JP4441293B2 publication Critical patent/JP4441293B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

この発明は例えば音声認識を目的として音声を収音する場合に適用することができる収音方法、収音装置、収音プログラムに関し、特に雑音が混入した音声をS/N比よく収音しようとする技術に関するものである。
音声認識を目的として音声を収音する場合、目的信号に雑音が重畳していると、音声認識の低下をもたらす。このために雑音が重畳している音声をS/N比よく収音する技術が求められている。雑音を抑圧する一つの方法にリミッタ技術がある(非特許文献1)。
リミッタとは入力信号が予め決められたレベルを超えると、その大き過ぎる部分を予め設定された割合で圧縮する技術である。圧縮が始まるレベルをスレッショルド、圧縮する割合をレシオ、実際に圧縮された音量をゲイン・リダクションと呼ぶ。また入力信号がスレッショルドを超えてから、レシオで決められた割合に圧縮されるまでの時間をアタック・タイム、入力信号が再びスレッショルド以下になってから圧縮が止むまでの時間をリリース・タイムと称している。
エフェクターの全知識、17頁、安斎直宗著、リットーミュージック、1988年
従来のリミッタ技術は、上述した圧縮処理を時間領域のまま処理を施すものであった。つまり、信号のレベルを観測し、あるレベル以上の信号が入力された場合に、信号レベルを圧縮し、信号レベルが大きくなり過ぎないように制御する技術であった。
然し乍ら、目的信号に雑音が重畳した信号にこのリミッタ技術を適用した場合、目的信号が全帯域に渡って一様に抑圧されるため、雑音が抑圧されるのと同時に目的信号も抑圧されて小さくなり、聞きたい音も小さくなり、かえって聞き取り難くなるといった課題がある。
この発明の目的はリミッタ技術を改良し、雑音成分のみを圧縮し、目的信号のS/N比を改善しようとするものである。
この発明の第1実施形態では目的信号に雑音が重畳された受音信号を複数の周波数帯域の周波数成分に分割する帯域分割処理と、予めデータベースに格納された目的信号のデータと雑音信号のデータそれぞれから周波数帯域毎の平均レベルを算出し、前記雑音信号の平均レベルの対数値から前記目的信号の平均レベルの対数値を差し引いた値が所定の値より大きい周波数帯域を圧縮候補領域と定める圧縮候補領域決定処理と、圧縮候補領域中の帯域毎に、受音信号の周波数成分のレベルが前記目的信号の周波数成分の平均レベルを超えたことを検出する過入力検出処理と、この過入力検出処理で過入力が検出された帯域については予め定めた圧縮比で受音信号の周波数成分を圧縮して収音しそれ以外の帯域については受音信号の周波数成分そのままのレベルで収音する圧縮レシオ乗算処理とを含むことを特徴とする収音方法を提案する。
この発明の収音方法によれば元々受音信号に含まれる雑音成分が目的信号成分より大きい周波数領域を圧縮候補領域と定め、この圧縮候補領域において、受音信号のレベルがスレッショルドを超えると、圧縮候補領域の成分を圧縮し、圧縮候補領域以外の領域の信号成分はそのままのレベルで収音する。従って圧縮される成分は主に雑音成分とすることができ、受音信号に含まれる目的信号はそのままのレベルで収音されるため目的信号のS/N比を改善することができる。
図1にこの発明の第1実施形態を示す。この第1実施形態はこの発明の請求項1で提案する収音方法を用いて動作する請求項4で提案する収音装置に対応する。
この発明の請求項4で提案する収音装置10は音声入力手段1と、帯域分割手段2と、レベル算出手段3と、圧縮候補領域決定手段4と、過入力検出手段5と、レシオ算出手段6と、圧縮レシオ乗算手段7とを具備して構成される。
音声入力手段1はマイクロホンで構成され、目的音源Sと雑音源Nとが発生する目的音S1(t)と雑音S2(t)とを受音し、目的信号に雑音が重畳した信号x(t)を出力する。
信号x(t)は帯域分割手段2で複数の周波数帯域の成分x(ω)…x(ω)に分割される。この周波数分割には例えばフーリエ変換或はウェーブレット変換などを用いることができる。帯域分割手段2で帯域分割された各帯域の信号を式(1)に示す。式(1)においてiは帯域の番号を示す。
X(ωi)=|X(ωi)|exp(j arg(X(ωi)) (1)
レベル算出手段3においては、受音信号の各周波数帯域における振幅値|X(ωi)|を算出する。
本発明の特徴とする構成は圧縮候補領域決定手段4と、レシオ算出手段6と、圧縮レシオ乗算手段7を具備した構成となるが、ここでは、受音信号には目的信号と雑音信号が混ざって受音されており、目的音信号の周波数特性が音声のように高域になるにつれ振幅が小さくなる特性を持ち、雑音信号の周波数特性が、高域になるにつれ振幅が大きくなる特性を持つ場合を例に挙げて説明する。図2に音声信号(目的信号)の周波数特性の例を、図3に雑音信号の周波数特性の例を示す。受音信号(目的信号+雑音信号)の周波数特性は図4のようになる。このような受音信号に対し、従来技術である時間領域のリミッタを使い、振幅値がある値を超えた場合に信号の振幅を抑えるような処理を施すと、全周波数帯域に同じ重み値を乗算することになるため、雑音が小さくなると同時に目的信号も小さくなり、聞き取り難くなる。
本発明ではデータベース4Aに予め収集された目的信号のデータと、雑音信号のデータを格納する。従って、データベース4Aには収音すべき音声信号と、各種の雑音がデータを用意する。周波数特性算出手段4Bにおいて、予め収集された目的信号のデータと雑音信号のデータを用い、目的信号の平均パワー|S(ωi)|と雑音信号の平均パワー|N(ωi)|を各帯域毎に算出する。次に周波数特性差算出手段4Cにおいて、周波数特性算出手段4Bで算出された目的信号の平均パワー|S(ωi)|と、雑音信号の平均パワー|N(ωi)|の差分(10log10| (N(ωi)|/|S(ωi)|))を算出する。
この差分の値が或る値(例えばα(ωi)=6dB)であるならば、その周波数領域ωiを圧縮候補領域と決定する。過入力検出手段5は受音信号のパワー|X(ωi)|と目的信号の平均パワー|S(ωi)|とを用いて受音信号のレベルが目的信号のレベルを超えたかを判定する。
また、レシオ算出手段6では、上記目的信号の平均パワー(S(ωi)と受音信号の平均パワー|X(ωi)|、そして|S(ωi)|と|N(ωi)|の差分(10log10| (N(ωi)|/|S(ωi)|))を用いて、リミッタで圧縮する割合(圧縮レシオ:g(ωi))を決定する。圧縮レシオを決定するアルゴリズムを式(2)で示す。各式の末尾に処理内容を示す。
if 10log10| (N(ωi)|/|S(ωi)|)>α(ωi):圧縮候補領域決定処理、
then
if |X(ωi)|≧|S(ωi)| :過入力検出処理
then g(ωi)= S(ωi)/ X(ωi) :レシオ算出処理
else g(ωi)=1.0 :レシオ算出処理
else
g(ωi)=1.0 :レシオ算出処理 (2)
式(2)の定性的な説明は|S(ωi)|と|N(ωi)|の差分(10log10| (N(ωi)|/|S(ωi)|))が或る値α(ωi)以上(例えばα(ωi)=6dB)であったならば、その帯域ωiは騒音信号が目的信号よりかなり大きい帯域であるとして、レベルを圧縮する帯域の候補とする。上記条件を満たしたωiのなかで、更に、受音信号のパワーが目的信号の平均パワーよりも大きいならば(|X(ωi)|≧|S(ωi)|)、その帯域は圧縮する帯域であるとしてゲインをg(ωi)= S(ωi)/ X(ωi)とする。上記条件を満たさない帯域は、受音信号をそのままとするために、ゲインをg(ωi)=1.0とする。式(2)で示したように、圧縮が始まるレベル(スレッショルド)は例えば、目的信号の平均パワー|S(ωi)|とする。
スレッショルドを決める際、目的信号の平均パワー|S(ωi)|と騒音信号の平均パワー|N(ωi)|を算出し、|S(ωi)|<P<|N(ωi)|を満たす範囲でスレッショルドPを決めても良い。
上記アルゴリズムを用いることで、例えば受音信号に大きな雑音が重畳している場合には、図5に示すように、雑音信号のスペクトルが目的信号のスペクトルより大きくなる帯域のみを抑圧できるため、受音信号のうちの目的信号を損傷させずにS/N比を改善することが出来る。一方、受音信号に重畳した雑音が小さい場合(ほぼ目的信号のみの場合)には(図6)、目的信号がほとんど抑圧されないため、目的信号はほとんど損傷を受けない。
このように、上記アルゴリズムを用いることで、目的信号はあまり抑圧されず、雑音信号が優勢な帯域が抑圧されるため、目的信号は損傷を受けずに雑音信号を効果的に抑圧することが出来る。
圧縮レシオ乗算手段7においては、受音信号がスレッショルドを超えた場合に、レシオ算出手段6で算出したレシオの割合まで受音信号の振幅を圧縮する。圧縮レシオ乗算手段7における演算を式(3)に示す。
Y(ωi)=g(ωi)X(ωi) (1≦i≦N) (3)
圧縮には一定の時間(アタックタイム)をかけ、圧縮は徐々に行われる。また、受音信号が再びスレッショルド以下になってから圧縮が止むまでにも一定の時間(リリース・タイム)をかけ、圧縮の解除も徐々に行われる。この圧縮の開始と解除の動作については、従来のリミッタと同じ動作で行われる。
本発明の収音方法を施すことで、特定の(抑圧したい)周波数帯域のみ抑圧可能な周波数領域のリミッタが実現できる。
この発明では更に、請求項3で提案するように、この発明の収音方法及び装置を構成する場合、帯域分割手段2の帯域の分割幅を広域に向うに従って、漸次分割幅を広く採る点を請求する。この方法を採ることにより人の聴覚に影響を与えずに周波数分割処理に要する演算量を低減することができる。
つまり、この発明による収音方法及び収音装置はコンピュータにプログラムを解読させて実行させることにより実現することができる。この発明の収音方法及び装置で最も演算量が大きい部分は帯域分割手段2の部分である。この部分の演算量を低減できると全体の処理速度を速めることができ、応答速度の速い収音装置を得ることができる。この点を考慮してこの発明では人間の聴覚は低域程周波数の変動に敏感であり、高域では周波数変動に鈍感であることに着目し、帯域分割手段2の帯域分割幅を高域に向うに従って、漸次広くし、高域部分の周波数分割数を低減することで演算量を少なくし、応答速度を速めようとするものである。帯域分割幅の広げ方は例えば人間の臨界帯域幅に合わせると云う方法がある。
上述した本発明の収音方法は収音プログラムをコンピュータに実行させて実現される。収音プログラムはコンピュータが解読可能なプログラム言語によって記述され、コンピュータにインストールされて実行される。本発明による収音プログラムは磁気ディスク或はCD−ROMのような記録媒体に記録され、これらからコンピュータにインストールするか、又は通信回線を通じてインストールされる場合もある。インストールされた収音プログラムはコンピュータに備えられた中央演算処理装置CPUに解読されてこの発明の収音方法が実現される。
この発明の実施形態を説明するためのブロック図。 図1に示した実施形態で用いた目的信号の周波数特性の一例を説明するための特性曲線図。 図1に示した実施形態で用いた雑音信号の周波数特性の一例を説明するための特性曲線図。 受音信号の周波数特性の一例を説明するための特性曲線図。 この発明の動作を説明するための特性曲線図。 図5と同様の特性曲線図。
符号の説明
1 音声入力手段 5 過入力検出手段
2 帯域分割手段 6 レシオ算出手段
3 レベル算出手段 7 圧縮レシオ乗算手段
4 圧縮候補領域決定手段 10 収音装置
4A データベース S 目的音源
4B 周波数特性算出手段 N 雑音源
4C 周波数特性差算出手段

Claims (7)

  1. 目的信号に雑音が重畳された受音信号を複数の周波数帯域の周波数成分に分割する帯域分割処理と
    予めデータベースに格納された目的信号のデータと雑音信号のデータそれぞれから周波数帯域毎の平均レベルを算出し、前記雑音信号の平均レベルの対数値から前記目的信号の平均レベルの対数値を差し引いた値が所定の値より大きい周波数帯域を圧縮候補領域と定める圧縮候補領域決定処理と、
    前記圧縮候補領域中の帯域毎に、前記受音信号の周波数成分のレベルが前記目的信号の周波数成分の平均レベルを超えたことを検出する過入力検出処理と、
    前記過入力検出処理で過入力が検出された帯域については予め定めた圧縮比で前記受音信号の周波数成分を圧縮して収音しそれ以外の帯域については前記受音信号の周波数成分そのままのレベルで収音する圧縮レシオ乗算処理と、
    を含むことを特徴とする収音方法。
  2. 請求項1記載の収音方法において、前記圧縮比は該帯域の前記受音信号の周波数成分のレベルと前記目的信号の周波数成分の平均レベルとの比で決定することを特徴とする収音方法。
  3. 請求項1又は2記載の収音方法の何れかにおいて、前記帯域分割処理の周波数分割幅は周波数が高い領域に向う程分割幅を広く採ることを特徴とする収音方法。
  4. 目的信号に雑音が重畳された受音信号を複数の周波数帯域の周波数成分に分割する周波数分割手段と、
    予めデータベースに格納された目的信号のデータと雑音信号のデータそれぞれから周波数帯域毎の平均レベルを算出し、前記雑音信号の平均レベルの対数値から前記目的信号の平均レベルの対数値を差し引いた値が所定の値より大きい周波数帯域を検出し、その周波数帯域を圧縮候補領域と定める圧縮候補領域決定手段と、
    前記圧縮候補領域中の帯域毎に、前記受音信号の周波数成分のレベルが前記目的信号の周波数成分の平均レベルを超えたことを検出する過入力検出手段と、
    前記過入力検出手段で過入力が検出された帯域については前記受音信号の周波数成分を予め定めた圧縮比で圧縮して収音しそれ以外の帯域については前記受音信号の周波数成分そのままのレベルで収音する圧縮レシオ乗算手段と、
    より成る収音装置。
  5. 請求項4記載の収音装置において、前記圧縮レシオは該帯域の前記受音信号の周波数成分のレベルと、前記目的信号の周波数成分の平均レベルとの比で決定することを特徴とする収音装置。
  6. 請求項4又は5記載の収音装置の何れかにおいて、前記帯域分割手段の周波数分割幅は周波数が高い領域に向うに従って漸次分割帯域幅を広く採ることを特徴とする収音装置。
  7. コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項1乃至3記載の収音方法の何れかを実行させる収音プログラム。
JP2004065514A 2004-03-09 2004-03-09 収音方法、収音装置、収音プログラム Expired - Fee Related JP4441293B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004065514A JP4441293B2 (ja) 2004-03-09 2004-03-09 収音方法、収音装置、収音プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004065514A JP4441293B2 (ja) 2004-03-09 2004-03-09 収音方法、収音装置、収音プログラム

Publications (2)

Publication Number Publication Date
JP2005257749A JP2005257749A (ja) 2005-09-22
JP4441293B2 true JP4441293B2 (ja) 2010-03-31

Family

ID=35083569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004065514A Expired - Fee Related JP4441293B2 (ja) 2004-03-09 2004-03-09 収音方法、収音装置、収音プログラム

Country Status (1)

Country Link
JP (1) JP4441293B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4642820B2 (ja) * 2006-10-23 2011-03-02 パナソニック株式会社 雑音抑圧装置、fm受信装置、及びfm受信装置調整方法
US7929933B2 (en) 2006-10-23 2011-04-19 Panasonic Corporation Noise suppression apparatus, FM receiving apparatus and FM receiving apparatus adjustment method

Also Published As

Publication number Publication date
JP2005257749A (ja) 2005-09-22

Similar Documents

Publication Publication Date Title
JP6328627B2 (ja) 雑音検出及びラウドネス低下検出によるラウドネスコントロール
JP5730881B2 (ja) 録音の適応的ダイナミックレンジ強化
US9312829B2 (en) System for adjusting loudness of audio signals in real time
KR101597375B1 (ko) 오디오 신호의 인지된 음량을 조절하기 위한 시스템
US9837971B2 (en) Method and system for excursion protection of a speaker
US8634578B2 (en) Multiband dynamics compressor with spectral balance compensation
EP2136362A1 (en) Audio signal processing device and audio signal processing method
EP2172930B1 (en) Audio signal processing device and audio signal processing method
US20070129036A1 (en) Method and apparatus to reconstruct a high frequency component
KR20080072225A (ko) 자동 오디오 볼륨 기능을 갖는 오디오 재생 방법 및 장치
JP2013537779A (ja) オーディオ信号の臨界周波数帯域における歪みを制御する方法とシステム
KR101855969B1 (ko) 오디오 신호를 압축하는 디지털 압축기
JP2013153307A (ja) 音声処理装置および方法、並びにプログラム
KR20160113224A (ko) 오디오 신호를 압축하는 오디오 압축 시스템
US20130301841A1 (en) Audio processing device, audio processing method and program
EP3573058A1 (en) Dry sound and ambient sound separation
KR102141889B1 (ko) 적응적 햅틱 신호 발생 장치 및 방법
JP4441293B2 (ja) 収音方法、収音装置、収音プログラム
US20100329470A1 (en) Audio information processing apparatus and method
JP4787316B2 (ja) デジタル信号処理装置及び倍音生成方法
JP2006178333A (ja) 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP2007036710A (ja) アタック信号増幅デジタル信号処理装置
JP6205758B2 (ja) 音響装置、音響装置の制御方法およびプログラム
KR100933604B1 (ko) 유동적 주파수 밴드를 이용한 단채널 음질 향상 기술
JP4249697B2 (ja) 音源分離学習方法、装置、プログラム、音源分離方法、装置、プログラム、記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060411

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060411

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090626

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4441293

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees