JP2005252904A - 入力音処理装置 - Google Patents

入力音処理装置 Download PDF

Info

Publication number
JP2005252904A
JP2005252904A JP2004063294A JP2004063294A JP2005252904A JP 2005252904 A JP2005252904 A JP 2005252904A JP 2004063294 A JP2004063294 A JP 2004063294A JP 2004063294 A JP2004063294 A JP 2004063294A JP 2005252904 A JP2005252904 A JP 2005252904A
Authority
JP
Japan
Prior art keywords
power
frequency band
input sound
consonant
vowel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004063294A
Other languages
English (en)
Other versions
JP4235128B2 (ja
Inventor
Shingo Kiuchi
真吾 木内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2004063294A priority Critical patent/JP4235128B2/ja
Priority to US11/070,829 priority patent/US7542577B2/en
Priority to EP05004681A priority patent/EP1575034B1/en
Priority to DE602005000897T priority patent/DE602005000897T2/de
Priority to CNB2005100530511A priority patent/CN100370516C/zh
Publication of JP2005252904A publication Critical patent/JP2005252904A/ja
Application granted granted Critical
Publication of JP4235128B2 publication Critical patent/JP4235128B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

【課題】 処理量を削減するとともにコストを低減することができる「入力音処理装置」を提供すること。
【解決手段】 入力音処理装置は、入力音の各周波数帯域毎のパワーと基準値との比較結果に基づいてトータルパワーの算出対象となる周波数帯域を乗算ポイントとして決定し、この乗算ポイントについて、スピーカからマイクロホン100までの伝達特性を示すフィルタ係数の二乗振幅値と各周波数帯域毎のパワーとの積和演算を行うことにより、入力音のマイクロホン位置でのトータルパワーを推定する。
【選択図】 図1

Description

本発明は、ガイド音声等の特定位置でのパワーを算出する入力音処理装置に関する。
従来から、ナビゲーション装置のガイド音声の音圧レベルを周辺騒音レベルに応じて可変することにより、騒音下でもガイド音声を明瞭に聴き取ることができるナビゲーション音声補正装置が知られている(例えば、特許文献1参照。)。このナビゲーション音声補正装置では、ガイド音声の聴取位置を想定したマイクロホン位置での周辺騒音とガイド音声のそれぞれの音圧レベルに基づいて、スピーカから出力するガイド音声のゲイン補正をラウドネス補償ゲイン算出部によって行っている。ここで、ラウドネス補償ゲイン算出部に入力される周辺騒音やガイド音声の音圧レベルは、複数の周波数帯域成分毎に計算したパワーを全周波数帯域成分について合計したトータルパワーの形で表される。
ところで、実際にガイド音声がマイクロホンに到達する際には周辺騒音も同時にマイクロホンに到達するため、マイクロホンによって集音された音からガイド音声のみを抽出することはできない。そこで、一般には、スピーカからマイクロホンまでの伝達特性を用いて、スピーカに入力されたガイド音声に基づいてマイクロホンに到達するガイド音声を推定する手法が採用されている。また、実際の計算方法としては、ガイド音声の各周波数帯域成分毎のパワーと、伝達特性の各周波数帯域成分に対応する値の二乗振幅値とを別々に計算して各周波数帯域成分を対応させた積和演算を行うことにより、マイクロホン位置でのガイド音声のトータルパワーを求める手法が従来から知られている(例えば、特許文献2参照。)。
特開平11−166835号公報(第3−6頁、図1−10) 特開2002−23790号公報(第3−4頁、図1−2)
ところで、上述した特許文献2に開示された従来技術では、入力音声の各周波数帯域成分毎にパワーが算出され、その結果に伝達特性を示す各タップ係数の二乗振幅値を掛け合わせた後に、各周波数帯域成分毎の積を加算している。このように全ての周波数帯域成分についての積和演算を行う必要があるため、処理量が非常に大きくなってしまうという問題があった。したがって、高性能のプロセッサ等が必要になってコスト増になるという問題があった。
本発明は、このような点に鑑みて創作されたものであり、その目的は、処理量を削減するとともにコストを低減することができる入力音処理装置を提供することにある。
上述した課題を解決するために、本発明の入力音処理装置は、スピーカから出力される入力音のマイクロホン位置でのトータルパワーを推定するものであって、スピーカに入力される入力音信号を複数の周波数帯域の成分に分割する第1の周波数分析手段と、第1の周波数分析手段によって分割された各周波数帯域成分毎のパワーを算出する第1のパワー演算手段と、スピーカからマイクロホンまでの音響空間の伝達特性に対応するフィルタ特性であって複数の周波数帯域のそれぞれに対応するフィルタ係数の二乗振幅値を算出する二乗振幅値演算手段と、第1のパワー演算手段によって算出された各周波数帯域毎のパワーPを基準値Rと比較するパワー比較手段と、パワー比較手段による比較結果に基づいて、トータルパワーの算出対象となる周波数帯域を乗算ポイントとして決定する乗算ポイント設定手段と、乗算ポイント設定手段によって決定された乗算ポイントについて、第1のパワー演算手段によって算出された各周波数帯域毎のパワーと、二乗振幅値演算手段によって算出された各周波数帯域毎のフィルタ係数の二乗振幅値とを用いて積和演算を行う積和演算手段とを備えている。これにより、パワーがほとんどない周波数帯域に対応する積和演算を省略することができるため、処理量を削減することができるとともに、安価なプロセッサ等の使用が可能になることによるコスト低減を図ることができる。
また、上述した乗算ポイント設定手段は、パワーPが基準値R以下の周波数帯域をトータルパワーの算出対象から除外して乗算ポイントを決定することが望ましい。これにより、パワーとフィルタ係数に二乗振幅値の積の値が小さく、積和演算全体への影響が少ない周波数帯域を確実に抽出することができる。
また、上述したパワー比較手段は、第1のパワー演算手段によって算出された各周波数帯域毎のパワーPを基準値Rと比較するとともに、フィルタ係数の二乗振幅値Cを基準値Rと比較しており、乗算ポイント設定手段は、パワーPと二乗振幅値Cの少なくとも一方が基準値R以下の周波数帯域をトータルパワーの算出対象から除外して乗算ポイントを決定することが望ましい。スピーカからマイクロホンまでの音響空間の伝達特性を考えると、特に車室内空間の伝達特性を考えると、特定の周波数帯域において音が吸収される場合もあるため、このような周波数帯域ではフィルタ特性の二乗振幅値が極端に小さくなって、この二乗振幅値とパワーの積が小さくなる。このような周波数帯域を積和演算の対象から除外することにより、積和演算全体の処理量を削減することが可能になる。
また、本発明の入力音処理装置は、スピーカから出力される入力音のマイクロホン位置でのトータルパワーを推定するものであって、スピーカに入力される入力音信号を複数の周波数帯域の成分に分割する第1の周波数分析手段と、第1の周波数分析手段によって分割された各周波数帯域成分毎のパワーを算出する第1のパワー演算手段と、スピーカからマイクロホンまでの音響空間の伝達特性に対応するフィルタ特性であって複数の周波数帯域のそれぞれに対応するフィルタ係数の二乗振幅値を算出する二乗振幅値演算手段と、入力音が子音か母音かを判定する子音/母音判定手段と、子音/母音判定手段による判定結果に基づいて、トータルパワーの算出対象となる周波数帯域を乗算ポイントとして決定する乗算ポイント設定手段と、乗算ポイント設定手段によって決定された乗算ポイントについて、第1のパワー演算手段によって算出された各周波数帯域毎のパワーと、二乗振幅値演算手段によって算出された各周波数帯域毎のフィルタ係数の二乗振幅値とを用いて積和演算を行う積和演算手段とを備えている。入力音が音声の場合には、この音声が子音か母音かによって各周波数帯域成分の値に大きな偏りが生じる。具体的には、子音の場合には子音特有の周波数帯域成分のみが値を有し、それ以外の周波数帯域成分の値はほぼ0になる。反対に、母音の場合には母音特有の周波数帯域成分のみが値を有し、それ以外の周波数帯域成分の値はほぼ0になる。したがって、入力音が母音か子音かを判定することにより、パワーがほとんどない周波数帯域を特定してこれらに対応する積和演算を省略することができるため、処理量を削減することができる。また、安価なプロセッサ等の使用が可能になることによるコスト低減を図ることができる。
また、上述した子音/母音判定手段は、母音帯域のパワーと子音帯域のパワーとを比較することにより、入力音が子音と母音のいずれに該当するかを判定することが望ましい。これにより、入力音が子音か母音かを容易に判定することが可能になる。
また、上述した母音帯域は100Hz〜1kHzであり、子音帯域は1kHz〜8kHzであることが望ましい。このように重複しない周波数帯域の範囲を母音帯域と子音帯域にそれぞれ設定することにより、子音と母音の判定をさらに容易に行うことができる。
また、上述した第1のパワー演算手段によって算出された各周波数帯域のパワーの中から子音帯域に含まれるものを加算することにより子音帯域パワーを算出する子音帯域パワー算出手段と、第1のパワー演算手段によって算出された各周波数帯域のパワーの中から母音帯域に含まれるものを加算することにより母音帯域パワーを算出する母音帯域パワー算出手段とをさらに備えることが望ましい。これにより、子音帯域パワーと母音帯域パワーとを計算することが容易となる。
また、上述したフィルタ係数を設定する適応フィルタをさらに備えることが望ましい。また、マイクロホンから出力される信号を複数の周波数帯域の成分に分割する第2の周波数分析手段をさらに備え、適応フィルタは、第1および第2の周波数分析手段のそれぞれによって分割された各周波数帯域成分に基づいてフィルタ係数を決定することが望ましい。これにより、実際の音響空間に対応するフィルタ係数を正確に決定することが可能になる。
また、上述したマイクロホンには、スピーカから出力された入力音以外の周辺騒音が集音されることが望ましい。これにより、マイクロホン位置において周辺騒音が存在する場合であってもこの周辺騒音の影響のない入力音のみのトータルパワーを得ることができる。
また、上述したマイクロホンによって集音した音のトータルパワーを算出するトータルパワー算出手段と、トータルパワー算出手段によって算出されたトータルパワーから積和演算手段による積和演算によって得られた入力音声のマイクロホン位置でのトータルパワーを減算することにより、周辺騒音のトータルパワーを算出する減算手段とをさらに備えることが望ましい。これにより、マイクロホン位置での入力音のトータルパワーのみでなく、入力音を含まない周辺騒音のトータルパワーも知ることが可能になる。
また、上述した入力音は、車載装置から出力されるガイド音声であることが望ましい。車載装置から出力されるガイド音声のみのトータルパワーを知ることができるため、周辺騒音が比較的大きな車室内においてガイド音声の利得制御等を行うことが可能になる。
以下、本発明を適用した一実施形態の入力音処理装置について、図面を参照しながら説明する。
〔第1の実施形態〕
図1は、第1の実施形態の入力音処理装置の構成を示す図である。図1に示す入力音処理装置は、車両に搭載されており、マイクロホン100の設置位置に到達したガイド音声のパワーを推定するとともに、このマイクロホン100で集音した音からガイド音声以外の周辺騒音を抽出してそのパワーを算出する動作を行っている。このために、本実施形態の入力音処理装置は、マイクロホン100、DFT(離散フーリエ変換)演算部10、12、パワー演算部14、16、トータルパワー算出部18、適応フィルタ20、二乗振幅値演算部22、積和演算部24、パワー比較部26、乗算ポイント設定部28、加算器30を含んで構成されている。
一方のDFT演算部10は、マイクロホン100の出力信号に対して離散フーリエ変換を行って、各周波数帯域成分毎の信号レベルを抽出する。なお、DFT演算部10の前段にアナログ−デジタル変換器が設けられており、マイクロホン100の出力信号がデジタルデータに変換された後にDFT演算部10に入力される。DFT演算部10では、例えば可聴周波数帯域を1024分割した各点について信号レベルが算出される。また、マイクロホン100は、ユーザの聴取位置を想定した車室内の所定位置、例えばハンドルの所定位置に設置されている。
パワー演算部14は、DFT演算部10によって算出された各周波数帯域成分毎の信号レベルのパワーを算出する。具体的には、DFT演算部10から出力される信号の実部と虚部をそれぞれ2乗して和をとることにより、各周波数帯域成分毎のパワーが求められる。トータルパワー算出部18は、パワー演算部14によって算出された各周波数帯域成分毎のパワーを合計することにより、マイクロホン100で集音した音に対応するトータルパワーを算出する。
他方のDFT演算部12は、ガイド音声ソース200から入力されるガイド音声信号に対して離散フーリエ変換を行って、各周波数帯域成分毎の信号レベルを抽出する。なお、DFT演算部12の前段には一方のDFT演算部10の場合と同様にアナログ−デジタル変換器が設けられており、ガイド音声ソース200から出力されたガイド音声信号がデジタルデータに変換された後にDFT演算部12に入力される。DFT演算部12では、DFT演算部10と同じ分割数(例えば1024点)の各周波数帯域成分毎に信号レベルが算出される。また、ガイド音声ソース200は、例えばナビゲーション装置であり、経路誘導時の交差点案内等の案内音声に対応した信号が出力される。この案内音声は、スピーカ(図示せず)から車室内に出力されてマイクロホン100に到達する。したがって、マイクロホン100では、オーディオ音やロードノイズ等の各種の周辺騒音の他にガイド音声が混在した音が集音される。
パワー演算部16は、DFT演算部12によって算出された各周波数帯域成分毎の信号レベルのパワーを算出する。適応フィルタ20は、2つのDFT演算部10、12の各出力に基づいて、案内音声が出力されるスピーカからマイクロホン100までの車室内の伝達特性を同定する。上述したように、ガイド音声ソース200から出力される案内音声はスピーカから出力されて車室内の音響空間を通った後にマイクロホン100に到達して、対応する信号がDFT演算部10に入力される第1の経路とは別に、ガイド音声信号として直接DFT演算部12に入力される第2の経路とが存在する。この第1の経路には車室内の音響空間が含まれ、第2の経路には車室内の音響空間が含まれないため、2つのDFT演算部10、12の出力に基づいて適応等化処理を行うことにより、車室内音響空間の伝達特性を推定することが可能になる。適応フィルタ20では、各周波数帯域毎に設定されるフィルタ係数(タップ係数)としてこの伝達特性が表される。二乗振幅値演算部22は、適応フィルタ20の各フィルタ係数の実部と虚部をそれぞれ2乗し、和をとった二乗振幅値を算出する。
パワー比較部26は、パワー演算部16から出力される案内音声の各周波数帯域成分毎のパワー(P)と、二乗振幅値演算部22から出力される各周波数帯域に対応する適応フィルタ20の各フィルタ係数の二乗振幅値(C)とが入力されており、これら2種類の値P、Cと基準値Rとを比較する。すなわち、各周波数帯域毎に積和演算を行う場合に、PとCの少なくとも一方の値が0あるいは十分に小さい場合には、これらの積の値が十分に小さくなるため、積和演算の対象から除外しても算出されるトータルパワーへの影響は小さいと考えられる。パワー比較部26では、2つの値P、Cが基準値R以下であるか否かを調べる処理が行われる。
一般に、案内音声を含む一般の音声は、母音と子音によって構成されている。母音は、100Hz〜1kHzの範囲の周波数成分を、子音は1kHz〜8kHzの周波数成分をそれぞれ含んでおり、存在する周波数帯域が異なっている。したがって、案内音声が母音のときには子音に対応する各周波数帯域の信号レベルはほぼ0になっており、それを二乗したパワーもほぼ0になる。反対に、案内音声が子音のときには母音に対応する各周波数帯域の信号レベルはほぼ0になっており、そのパワーPもほぼ0になる。また、車室内空間の伝達特性を考えたときに、特定の周波数帯域について信号レベルが大きく減衰する場合、例えば、車室内空間の形状や車室内に備わった座席の材質等によって特定周波数の音が吸収されて伝搬しにくい場合には、この周波数帯域に対応する適応フィルタ20のフィルタ係数の値およびその二乗振幅値Cがほぼ0になる。このようにP、Cの少なくとも一方がほぼ0(基準値K以下)の場合には、この周波数帯域は積和演算の対象から除外される。
乗算ポイント設定部28は、パワー比較部26による比較処理に基づいて、P、Cの少なくとも一方がほぼ0(基準値R以下)の周波数帯域を積和演算の対象から除外し、それ以外の周波数帯域を乗算ポイントとして設定する。
積和演算部24は、パワー演算部16によって算出された案内音声の各周波数帯域成分毎のパワーPと、二乗振幅値演算部22によって算出された適応フィルタ20の各フィルタ係数の二乗振幅値Cとを、同一の周波数帯域毎に乗算した結果を、乗算ポイント設定部28によって設定された乗算ポイントについて加算する積和演算を行う。これにより、マイクロホン100に到達した案内音声が適応フィルタ20を用いることにより推定され、その推定された案内音声のトータルパワーが積和演算部24によって算出される。
加算器30は、トータルパワー算出部18によって算出されたマイクロホン100で集音された案内音声と周辺騒音が含まれる音のトータルパワーから、積和演算部24から出力されたマイクロホン位置での推定された案内音声のトータルパワーを減算する。これにより、加算器30からは、マイクロホン100で集音された周辺騒音のトータルパワーのみが出力される。
ところで、上述した基準値Rは、積和演算部24から出力される推定された案内音声のトータルパワーの誤差が所定値以内になるように設定される。例えば、パワー演算部16から出力される案内音声の各周波数帯域成分の値の最大値、あるいは二乗振幅値演算部22から出力される適応フィルタ20の各フィルタ係数の二乗振幅値の最大値が2M であったときに誤差が5dB以内になるように基準値Rが設定される。具体的には、M=16の場合には基準値R=398になる。
上述したDFT演算部12が第1の周波数分析手段に、パワー演算部16が第1のパワー演算手段に、二乗振幅値演算部22が二乗振幅値演算手段に、パワー比較部26がパワー比較手段に、乗算ポイント設定部28が乗算ポイント設定手段に、積和演算部24が積和演算手段に、DFT演算部10が第2の周波数分析手段に、DFT演算部10、パワー演算部14、トータルパワー算出部18がトータルパワー算出手段に、加算器30が減算手段にそれぞれ対応する。
このように、全ての周波数帯域について積和演算を行わずにパワーがほとんどない周波数帯域に対応する積和演算を省略して、有効な値を有する周波数帯域についてのみ積和演算を行うことにより、処理量を削減することができる。また、これに伴い、安価なプロセッサ等の使用が可能になることによるコスト低減を図ることができる。
また、スピーカからマイクロホン100までの音響空間の伝達特性を考えると、特に車室内空間の伝達特性を考えると、特定の周波数帯域において音が吸収される場合もあるため、このような周波数帯域ではフィルタ特性の二乗振幅値が極端に小さくなって、この二乗振幅値とパワーの積が小さくなる。このような周波数帯域を積和演算の対象から除外することにより、積和演算全体の処理量を削減することが可能になる。
また、適応フィルタを用いてフィルタ係数を設定することにより、実際の音響空間に対応するフィルタ係数を正確に決定することが可能になる。
また、加算器30によってマイクロホン100の出力信号のトータルパワーからマイクロホン位置でのガイド音声のトータルパワーを減算することにより、入力音を含まない周辺騒音のトータルパワーも知ることが可能になる。これにより、ガイド音声のラウドネス補償のゲイン算出を行うことができ、周辺騒音が比較的大きな車室内においてガイド音声が明瞭に聴き取れるようにすることができる。
〔第2の実施形態〕
図2は、第2の実施形態の入力音処理装置の構成を示す図である。図2に示す入力音処理装置は、マイクロホン100、DFT(離散フーリエ変換)演算部10、12、パワー演算部14、16、トータルパワー算出部18、適応フィルタ20、二乗振幅値演算部22、積和演算部24、母音帯域パワー算出部40、子音帯域パワー算出部42、子音/母音判定部44、乗算ポイント設定部46、加算器30を含んで構成されている。図1に示した入力音処理装置に対して、パワー比較部26、乗算ポイント設定部28を母音帯域パワー算出部40、子音帯域パワー算出部42、子音/母音判定部44、乗算ポイント設定部46に置き換えた構成を有している。以下では、これらの構成に着目して説明を行う。
母音帯域パワー算出部40は、母音に対応する周波数帯域に含まれる各周波数帯域成分毎のパワーを加算することにより、母音の周波数帯域に対応するパワー(母音帯域パワー)を算出する。子音帯域パワー算出部42は、子音に対応する周波数帯域に含まれる各周波数帯域成分毎のパワーを加算することにより、子音の周波数帯域に対応するパワー(子音帯域パワー)を算出する。なお、母音帯域パワーと子音帯域パワーの計算は、それぞれの周波数帯域全体について行う必要は必ずしもなく、母音の周波数帯域の一部に対応するパワーを母音帯域パワーとして、子音の周波数帯域の一部に対応するパワーを子音帯域パワーとして求めるようにしてもよい。
子音/母音判定部44は、母音帯域パワー算出部40によって算出された母音帯域パワーと子音帯域パワー算出部42によって算出された子音帯域パワーとを比較することにより、ガイド音声ソース200から入力された案内音声が母音/子音のいずれであるかを判定する。上述したように、案内音声の構成音は、母音と子音のいずれかが排他的に現れるものであるため、母音帯域パワーと子音帯域パワーを比較することにより、現時点での案内音声が母音であるか子音であるかを容易に判定することができる。
乗算ポイント設定部46は、子音/母音判定部44による判定結果が「母音」である場合には母音に対応する各周波数帯域以外を積和演算の対象から除外して母音に対応する各周波数帯域を乗算ポイントとして設定し、反対に、子音/母音判定部44による判定結果が「子音」である場合には子音に対応する各周波数帯域以外を積和演算の対象から除外して子音に対応する各周波数帯域を乗算ポイントとして設定する。
積和演算部24は、パワー演算部16によって算出された案内音声の各周波数帯域成分毎のパワーと、二乗振幅値演算部22によって算出された適応フィルタ20の各フィルタ係数の二乗振幅値とを、同一の周波数帯域毎に乗算した結果を、乗算ポイント設定部46によって設定された乗算ポイントについて加算する積和演算を行う。これにより、マイクロホン100に到達した案内音声が適応フィルタ20を用いることにより推定され、その推定された案内音声のトータルパワーが積和演算部24によって算出される。
上述した乗算ポイント設定部46が乗算ポイント設定手段に、子音/母音判定部44が子音/母音判定手段に、母音帯域パワー算出部40が母音帯域パワー算出手段に、子音帯域パワー算出部42が子音帯域パワー算出手段にそれぞれ対応する。
このように、ガイド音声が子音か母音かによって各周波数帯域成分の値に大きな偏りが生じる。具体的には、子音の場合には子音特有の周波数帯域成分のみが値を有し、それ以外の周波数帯域成分の値はほぼ0になる。反対に、母音の場合には母音特有の周波数帯域成分のみが値を有し、それ以外の周波数帯域成分の値はほぼ0になる。したがって、ガイド音声が母音か子音かを判定することにより、パワーがほとんどない周波数帯域を特定してこれらに対応する積和演算を省略することができるため、処理量を削減することができる。また、安価なプロセッサ等の使用が可能になることによるコスト低減を図ることができる。
なお、本発明は上記実施形態に限定されるものではなく、本発明の要旨の範囲内において種々の変形実施が可能である。例えば、上述した実施形態では、ガイド音声ソース200から出力されるガイド音声のパワーを推定する場合について説明したが、その他の音声のマイクロホン位置でのトータルパワーを推定するようにしてもよい。例えば、ラジオ受信機等から出力される放送内容に対応した音声のパワーを推定する場合に本発明を適用することができる。
また、上述した第1の実施形態では、ガイド音声ソース200の代わりにオーディオ装置等を用い、ガイド音声に代えてオーディオ音等のマイクロホン位置でのトータルパワーを推定するようにしてもよい。
また、上述した各実施形態では、DFT演算部10、12を用いて入力信号の周波数帯域成分の分割を行ったが、フィルタバンク等の他の方法を用いて周波数帯域成分の分割を行うようにしてもよい。
第1の実施形態の入力音処理装置の構成を示す図である。 第2の実施形態の入力音処理装置の構成を示す図である。
符号の説明
10、12 DFT演算部
14、16 パワー演算部
18 トータルパワー算出部
20 適応フィルタ
22 二乗振幅値演算部
24 積和演算部
26 パワー比較部
28、46 乗算ポイント設定部
40 母音帯域パワー算出部
42 子音帯域パワー算出部
44 子音/母音判定部
100 マイクロホン
200 ガイド音声ソース

Claims (12)

  1. スピーカから出力される入力音のマイクロホン位置でのトータルパワーを推定する入力音処理装置であって、
    前記スピーカに入力される入力音信号を複数の周波数帯域の成分に分割する第1の周波数分析手段と、
    前記第1の周波数分析手段によって分割された各周波数帯域成分毎のパワーを算出する第1のパワー演算手段と、
    前記スピーカから前記マイクロホンまでの音響空間の伝達特性に対応するフィルタ特性であって前記複数の周波数帯域のそれぞれに対応するフィルタ係数の二乗振幅値を算出する二乗振幅値演算手段と、
    前記第1のパワー演算手段によって算出された各周波数帯域毎のパワーPを基準値Rと比較するパワー比較手段と、
    前記パワー比較手段による比較結果に基づいて、トータルパワーの算出対象となる周波数帯域を乗算ポイントとして決定する乗算ポイント設定手段と、
    前記乗算ポイント設定手段によって決定された乗算ポイントについて、前記第1のパワー演算手段によって算出された各周波数帯域毎のパワーと、前記二乗振幅値演算手段によって算出された各周波数帯域毎の前記フィルタ係数の二乗振幅値とを用いて積和演算を行う積和演算手段と、
    を備えることを特徴とする入力音処理装置。
  2. 請求項1において、
    前記乗算ポイント設定手段は、前記パワーPが前記基準値R以下の周波数帯域をトータルパワーの算出対象から除外して前記乗算ポイントを決定することを特徴とする入力音処理装置。
  3. 請求項1において、
    前記パワー比較手段は、前記第1のパワー演算手段によって算出された各周波数帯域毎の前記パワーPを前記基準値Rと比較するとともに、前記フィルタ係数の二乗振幅値Cを前記基準値Rと比較しており、
    前記乗算ポイント設定手段は、前記パワーPと前記二乗振幅値Cの少なくとも一方が前記基準値R以下の周波数帯域をトータルパワーの算出対象から除外して前記乗算ポイントを決定することを特徴とする入力音処理装置。
  4. スピーカから出力される入力音のマイクロホン位置でのトータルパワーを推定する入力音処理装置であって、
    前記スピーカに入力される入力音信号を複数の周波数帯域の成分に分割する第1の周波数分析手段と、
    前記第1の周波数分析手段によって分割された各周波数帯域成分毎のパワーを算出する第1のパワー演算手段と、
    前記スピーカから前記マイクロホンまでの音響空間の伝達特性に対応するフィルタ特性であって前記複数の周波数帯域のそれぞれに対応するフィルタ係数の二乗振幅値を算出する二乗振幅値演算手段と、
    前記入力音が子音か母音かを判定する子音/母音判定手段と、
    前記子音/母音判定手段による判定結果に基づいて、トータルパワーの算出対象となる周波数帯域を乗算ポイントとして決定する乗算ポイント設定手段と、
    前記乗算ポイント設定手段によって決定された乗算ポイントについて、前記第1のパワー演算手段によって算出された各周波数帯域毎のパワーと、前記二乗振幅値演算手段によって算出された各周波数帯域毎の前記フィルタ係数の二乗振幅値とを用いて積和演算を行う積和演算手段と、
    を備えることを特徴とする入力音処理装置。
  5. 請求項4において、
    前記子音/母音判定手段は、母音帯域のパワーと子音帯域のパワーとを比較することにより、前記入力音が子音と母音のいずれに該当するかを判定することを特徴とする入力音処理装置。
  6. 請求項5において、
    前記母音帯域は100Hz〜1kHzであり、前記子音帯域は1kHz〜8kHzであることを特徴とする入力音処理装置。
  7. 請求項5または6において、
    前記第1のパワー演算手段によって算出された各周波数帯域のパワーの中から子音帯域に含まれるものを加算することにより前記子音帯域パワーを算出する子音帯域パワー算出手段と、
    前記第1のパワー演算手段によって算出された各周波数帯域のパワーの中から母音帯域に含まれるものを加算することにより前記母音帯域パワーを算出する母音帯域パワー算出手段と、
    をさらに備えることを特徴とする入力音処理装置。
  8. 請求項1〜7のいずれかにおいて、
    前記フィルタ係数を設定する適応フィルタをさらに備えることを特徴とする入力音処理装置。
  9. 請求項8において、
    前記マイクロホンから出力される信号を複数の周波数帯域の成分に分割する第2の周波数分析手段をさらに備え、
    前記適応フィルタは、前記第1および第2の周波数分析手段のそれぞれによって分割された各周波数帯域成分に基づいて前記フィルタ係数を決定することを特徴とする入力音処理装置。
  10. 請求項9において、
    前記マイクロホンには、前記スピーカから出力された前記入力音以外の周辺騒音が集音されることを特徴とする入力音処理装置。
  11. 請求項10において、
    前記マイクロホンによって集音した音のトータルパワーを算出するトータルパワー算出手段と、
    前記トータルパワー算出手段によって算出されたトータルパワーから前記積和演算手段による積和演算によって得られた前記入力音声の前記マイクロホン位置でのトータルパワーを減算することにより、前記周辺騒音のトータルパワーを算出する減算手段と、
    をさらに備えることを特徴とする入力音処理装置。
  12. 請求項1〜11のいずれかにおいて、
    前記入力音は、車載装置から出力されるガイド音声であることを特徴とする入力音処理装置。
JP2004063294A 2004-03-08 2004-03-08 入力音処理装置 Expired - Fee Related JP4235128B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004063294A JP4235128B2 (ja) 2004-03-08 2004-03-08 入力音処理装置
US11/070,829 US7542577B2 (en) 2004-03-08 2005-03-01 Input sound processor
EP05004681A EP1575034B1 (en) 2004-03-08 2005-03-03 Input sound processor
DE602005000897T DE602005000897T2 (de) 2004-03-08 2005-03-03 Eingangsschallprozessor
CNB2005100530511A CN100370516C (zh) 2004-03-08 2005-03-08 输入音处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004063294A JP4235128B2 (ja) 2004-03-08 2004-03-08 入力音処理装置

Publications (2)

Publication Number Publication Date
JP2005252904A true JP2005252904A (ja) 2005-09-15
JP4235128B2 JP4235128B2 (ja) 2009-03-11

Family

ID=34824514

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004063294A Expired - Fee Related JP4235128B2 (ja) 2004-03-08 2004-03-08 入力音処理装置

Country Status (5)

Country Link
US (1) US7542577B2 (ja)
EP (1) EP1575034B1 (ja)
JP (1) JP4235128B2 (ja)
CN (1) CN100370516C (ja)
DE (1) DE602005000897T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10115392B2 (en) 2010-06-03 2018-10-30 Visteon Global Technologies, Inc. Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100800725B1 (ko) * 2005-09-07 2008-02-01 삼성전자주식회사 이동통신 단말의 오디오 재생시 주변 잡음에 적응하는 자동음량 조절 방법 및 장치
US8862387B2 (en) * 2013-01-08 2014-10-14 Apple Inc. Dynamic presentation of navigation instructions
JP6284003B2 (ja) 2013-03-27 2018-02-28 パナソニックIpマネジメント株式会社 音声強調装置及び方法
US20220392484A1 (en) * 2021-06-03 2022-12-08 International Business Machines Corporation Audiometric receiver system to detect and process audio signals
CN114898732B (zh) * 2022-07-05 2022-12-06 深圳瑞科曼环保科技有限公司 一种可调整频率范围的噪音处理方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241692A (en) 1991-02-19 1993-08-31 Motorola, Inc. Interference reduction system for a speech recognition device
JPH11166835A (ja) 1997-12-03 1999-06-22 Alpine Electron Inc ナビゲーション音声補正装置
JP3774580B2 (ja) * 1998-11-12 2006-05-17 アルパイン株式会社 音声入力装置
JP3964092B2 (ja) * 2000-02-17 2007-08-22 アルパイン株式会社 オーディオ用適応イコライザ及びフィルタ係数の決定方法
JP3877270B2 (ja) 2000-07-12 2007-02-07 アルパイン株式会社 音声特徴量抽出装置
JP4002775B2 (ja) * 2002-03-15 2007-11-07 アルパイン株式会社 音声出力処理装置
US7177416B1 (en) * 2002-04-27 2007-02-13 Fortemedia, Inc. Channel control and post filter for acoustic echo cancellation
JP2004023481A (ja) * 2002-06-17 2004-01-22 Alpine Electronics Inc 音響信号処理装置及び方法並びにオーディオ装置
US7146315B2 (en) 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
US7054437B2 (en) * 2003-06-27 2006-05-30 Nokia Corporation Statistical adaptive-filter controller

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10115392B2 (en) 2010-06-03 2018-10-30 Visteon Global Technologies, Inc. Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system

Also Published As

Publication number Publication date
CN100370516C (zh) 2008-02-20
US7542577B2 (en) 2009-06-02
JP4235128B2 (ja) 2009-03-11
EP1575034B1 (en) 2007-04-18
US20050195992A1 (en) 2005-09-08
EP1575034A1 (en) 2005-09-14
DE602005000897T2 (de) 2008-01-17
CN1667702A (zh) 2005-09-14
DE602005000897D1 (de) 2007-05-31

Similar Documents

Publication Publication Date Title
JP5444472B2 (ja) 音源分離装置、音源分離方法、及び、プログラム
US8891778B2 (en) Speech enhancement
EP2546831B1 (en) Noise suppression device
EP2141695B1 (en) Speech sound enhancement device
EP2773137B1 (en) Microphone sensitivity difference correction device
US10515650B2 (en) Signal processing apparatus, signal processing method, and signal processing program
EP3276621B1 (en) Noise suppression device and noise suppressing method
JP2006163231A (ja) 雑音除去装置、雑音除去プログラム、及び雑音除去方法
JP2006313997A (ja) 騒音量推定装置
EP1575034B1 (en) Input sound processor
CN109416909B (zh) 噪音降低装置、移动体装置以及噪音降低方法
JP2008070878A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
US9674607B2 (en) Sound collecting apparatus, correction method of input signal of sound collecting apparatus, and mobile equipment information system
JP5466581B2 (ja) 反響消去方法、反響消去装置及び反響消去プログラム
JP2003333683A (ja) ノイズ抑圧方法及びマイクロフォン装置
US20230320903A1 (en) Ear-worn device and reproduction method
JP2008070877A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
EP3261363B1 (en) Phase control signal generation device, phase control signal generation method, and phase control signal generation program
EP3748626B1 (en) Mixing apparatus and mixing method
Koskimies Real-time noise filtering with adaptive filters in heavy equipment soundscape
JP2012014106A (ja) 騒音補正装置
JP2007171798A (ja) 音響装置
JP2020134778A (ja) 雑音除去装置、雑音除去方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081212

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111219

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121219

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131219

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees