JP2009163105A - 音声明瞭度改善システム及び音声明瞭度改善方法 - Google Patents

音声明瞭度改善システム及び音声明瞭度改善方法 Download PDF

Info

Publication number
JP2009163105A
JP2009163105A JP2008002144A JP2008002144A JP2009163105A JP 2009163105 A JP2009163105 A JP 2009163105A JP 2008002144 A JP2008002144 A JP 2008002144A JP 2008002144 A JP2008002144 A JP 2008002144A JP 2009163105 A JP2009163105 A JP 2009163105A
Authority
JP
Japan
Prior art keywords
power
voice
speech intelligibility
gain
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008002144A
Other languages
English (en)
Other versions
JP5219522B2 (ja
Inventor
Toru Marumoto
徹 丸本
Nozomi Saito
望 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alpine Electronics Inc
Original Assignee
Alpine Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alpine Electronics Inc filed Critical Alpine Electronics Inc
Priority to JP2008002144A priority Critical patent/JP5219522B2/ja
Priority to US12/339,360 priority patent/US8249259B2/en
Priority to CN2008101889332A priority patent/CN101483414B/zh
Publication of JP2009163105A publication Critical patent/JP2009163105A/ja
Application granted granted Critical
Publication of JP5219522B2 publication Critical patent/JP5219522B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Navigation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

【目的】簡単な構成で、かつ少ない演算量で騒音パワーの推定を正確に行なえるようにする「音声明瞭度改善システム及び音声明瞭度改善方法」を提供する。
【構成】音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する音声明瞭度改善システムにおいて、音声パワーが設定レベル以上であるか検出し、音声パワーが設定レベルより小さいときの騒音パワーを測定して保存し、音声パワーが設定レベルより大きいときの騒音パワーを保存してあるパワーであると推定し、音声パワーと推定した騒音パワーとに基づいて音声信号のゲインを制御する。
【選択図】図1

Description

本発明は音声明瞭度改善システム及び音声明瞭度改善方法に係り、特に音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する音声明瞭度改善システム及び音声明瞭度改善方法に関する。
スピーカから出力された音声(ナビゲーションガイド音声や,ニュースやメールの読上げ音声など)を騒音下でも明瞭に聞こえるようにする車載の音声明瞭度改善システムがある。例えば、車載用ナビゲーション装置では進路案内等の音声がスピーカから車室内に出力されるが、走行中などでエンジン音、ロードノイズ等の騒音が大きいときはマスキング効果でスピーカ出力音声が聞きづらくなる。そこで、スピーカ出力音声に比し騒音が大きいときはスピーカ出力音声にラウドネス補償を施して音声帯域全体のゲインを上げるなどして騒音下でもスピーカ出力音声が明瞭に聞こえるようにしている。
図8は従来の音声明瞭度改善システムの構成図である(例えば特許文献1参照)。図8によれば、同定フィルタ1によりマイク2の設置位置における案内音声信号を模擬し、減算器3により、マイク2の出力から前記信号を引くことによって騒音信号を抽出している。ラウドネス補償ゲイン算出部4では、案内音声信号および騒音信号のそれぞれの信号をもとにGoptを算出してRG補正部5に入力している。
この際、同定用フィルタ6における同定処理は、適応フィルタ7を用いて行なわれる。この中の適応アルゴリズム部8は、種々の適応アルゴリズムを用いて実現することができ、その代表的なものの一つがLMSアルゴリズムであるが、Fast-LMSアルゴリズム(周波数領域におけるLMSアルゴリズム)等を使用してフィルタ係数の更新を行なうようにしてもよい。
特開平11−166835号公報
上記の従来音声明瞭度改善システムには以下の課題がある。
第1の課題は、音声信号のパワーに推定誤差(理想状態からのズレ:α)が生じると、次式で示すように、減算によって算出される騒音推定パワーの誤差が、音声信号の推定パワーの誤差αの符号と逆符号となり、差幅が大きくなってゲインを正しく決定できなくなる。
Figure 2009163105
すなわち、音声信号に推定誤差(理想状態からのズレ:α)が生じると、騒音推定も−αの誤差を生じてしまう。その結果、それらのパワー値で算出されるゲイン値が理想値から大幅にずれ、補正効果に悪影響を及ぼす。たとえば、 騒音と音声の推定パワーがともに70dBA相当のとき、理想とする補正ゲイン値は5.9dBである。ここで、音声の推定値が5dB程度の誤差(⇒65dBA)をもった場合、騒音推定値もつられて75dBA相当と大きくなり、ゲイン値は9.9dBまでもちあがってしまう。もし、騒音推定値=70dBAのままであれば、ゲイン値は7.6dBとなり、ゲインの誤差は小さい。
第2の課題は、従来の音声明瞭度改善システムでは演算量が多すぎて高価なDSPが必要とされる点である。従来の音声明瞭度改善システムの場合、演算量が比較的少ないと言われるFast-LMS アルゴリズムにより図8の適応アルゴリズム部8を構成したとしても、単位信号ブロック長あたり2回のFFT処理と、フィルタ係数の更新処理を行う必要がある。また、これらは複素数の演算であるため、DSP上で19000回弱の乗算回数が必要であり、DSPで20MIPS程度の計算パワーを必要としていた。そして、この処理量は、従来の音声明瞭度改善システムを実現する際に必要となるDSP処理量全体の8割程度を占める。このため、図8に示したような従来の音声明瞭度改善システムを実現する際には高価なDSPが必要となり、その分、他の処理にはDSPの計算パワーを十分に回せなくなる、といった問題が生じる。なお、乗算回数はFFTを行なう際の窓長NをN=1024とすれば、次式
Nlog2N+N/2×17=18944
回となる。
以上から本発明の目的は、騒音パワーの推定を正確に行なえるようにすることであり、特に音声パワー推定に誤差が生じても、該誤差が騒音パワーの推定に影響を与えないようにすることである。
本発明の別の目的は、音声明瞭度改善システムにおける演算量を削減することである。
・音声明瞭度改善システム
本発明の第1は、音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する車載の音声明瞭度改善システムであり、前記音声パワーが設定レベル以上であるか検出する音声パワー検出部、騒音パワーを測定する騒音パワー測定部、前記音声パワーが設定レベルより小さいときの騒音パワーを保存する騒音パワー保存部、前記音声パワーが設定レベルより大きいときの騒音パワーを前記保存してあるパワーであると推定して音声信号のゲインを制御するゲイン制御部を備えている。
前記音声明瞭度改善システムは、更に、車両停止時の同定モードにおいて、音声を出力するスピーカより騒音を検出するマイクロホンまでの伝達特性を同定する伝達特性同定部、通常動作モードにおいて、前記音声パワーに前記伝達特性を付与してマイクロホン位置における音声パワーを出力する伝達特性付与部を備え、前記ゲイン制御部は、前記伝達特性付与部から出力する音声パワーと前記推定した騒音パワーとに基づき音声信号のゲインを制御する。
同定モードにおいて、前記伝達特性同定部は、前記伝達特性をゲインで近似して同定し、通常動作モードにおいて、前記伝達特性付与部は前記音声パワーに該ゲインを乗算してマイクロホン位置における音声パワーを出力する。
前記音声明瞭度改善システムは、更に、マイク検出信号のパワーを測定するマイクパワー測定部、同定モードにおいて模擬音声信号を発生する模擬音声信号発生部を備え、前記伝達特性同定部は、同定モードにおいて、模擬音声信号発生部から出力する模擬音声信号のパワーを測定し、前記マイクパワー測定部から出力するパワーと該模擬音声のパワーとの比より前記ゲインを同定する。
前記音声明瞭度改善システムは、更に、前記模擬音声パワーを所定時間平均化する第1平均部、前記マイク検出パワーを所定時間平均化する第2平均部を備え、前記伝達特性同定部は、第2平均部より出力する平均マイク検出パワーと第1平均部より出力する平均模擬音声パワーとの比より前記ゲインを同定する。
前記騒音パワーを保存する騒音パワー保存部は、前記音声パワーが設定レベルより小さいときの該騒音パワーを所定時間平均化して保存する。
前記騒音パワー保存部は、移動平均演算により最新の所定時間当たりの騒音パワーの平均値を保存する。
前記記音声明瞭度改善システムは、更に、同定モードと通常動作モードを切り換えるモード切替部を備えている。
前記音声信号が、男性が発声した音声に応じた音声信号であれば、前記模擬音声信号発生部は男性の模擬音声信号を発生し、前記音声信号が、女性が発声した音声に応じた音声信号であれば、前記模擬音声信号発生部は女性の模擬音声信号を発生する。
前記音声明瞭度改善システムは、更に、音声明瞭度改善システムの動作オン・オフを設定する手段、動作オンにした時、過去に伝達特性を同定しているかチェックし、伝達特性を同定していれば、音声明瞭度改善システムの動作を開始し、伝達特性を同定してなければ、同定モードにして伝達特性を同定するか否かをユーザに選択させる手段を備えている。
・音声明瞭度改善方法
本発明の第2は、音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する車載の音声明瞭度改善システムにおける音声明瞭度改善方法であり、前記音声パワーが設定レベル以上であるか検出するステップ、前記音声パワーが設定レベルより小さいときの騒音パワーを測定して保存するステップ、前記音声パワーが設定レベルより大きいときの騒音パワーを前記保存してあるパワーであると推定し、
前記音声パワーと前記推定した騒音パワーとに基づいて音声信号のゲインを制御するステップを有している。
本発明の音声明瞭度改善方法は、更に、車両停止時における同定モードにおいて、音声を出力するスピーカより騒音を検出するマイクロホンまでの伝達特性を同定するステップ、通常動作モードにおいて、前記音声パワーに前記伝達特性を付与してマイクロホン位置における音声パワーを出力するステップを有し、前記ゲインを制御するステップにおいて、前記マイクロホン位置における音声パワーと前記推定した騒音パワーとに基づき音声信号のゲインを制御する。
本発明の音声明瞭度改善方法は、更に、同定モードにおいて、前記伝達特性をゲインで近似して同定するステップ、通常動作モードにおいて、前記音声パワーに該ゲインを乗算してマイクロホン位置における音声パワーを出力するステップを有している。
本発明の音声明瞭度改善方法は、更に、同定モードにおいて、模擬音声信号を発生するステップ、該模擬音声信号のパワーを測定すると共に、前記マイク検出信号のパワーを測定するステップ、前記マイク検出信号のパワーと該模擬音声信号のパワーとの比より前記ゲインを同定するステップを有している。この場合、前記模擬音声信号のパワーを所定時間平均化すると共に、前記マイク検出信号のパワーを所定時間平均化し、平均マイク検出パワーと平均模擬音声パワーとの比より前記ゲインを同定する。
本発明によれば、マイク検出信号のパワー(騒音と音声の合成信号のパワー)から音声パワーを減算して騒音パワーを演算しないため、本発明の騒音パワーに音声信号と騒音信号の相関成分が含まれず、このため音声と騒音の相関が大きくなっても騒音パワーの推定誤差を小さくできる。また、音声パワーに推定誤差が生じても、該誤差が騒音パワーの推定値に何ら影響を与えないようにでき、音声信号のゲインが大幅に誤差を持たないようにできる。
また、本発明によれば、FFT演算や複雑なF-LMSアルゴリズムを行なわなくても良いため音声明瞭度改善システムにおける演算量を大幅に削減することができる。
(A)本発明の概略
本発明では、音声例えばガイド音声が出力されていない区間で騒音パワーを算出して保存し、音声出力中の騒音パワーを該保存してある騒音パワーとする。このように騒音パワーを推定しても、ガイド音声が出力されていない区間が頻繁に発生するため、音声出力中の騒音パワーとして直近のガイド音声が出力されていない区間に算出したパワーを採用できるため騒音パワーの推定誤差は小さい。
また、スピーカからマイク位置までの音響伝達特性をゲインGで近似し、マイク位置での音声パワーをガイド音声信号の二乗振幅値(パワー)に該ゲインGを乗算することにより推定する。
以上のように、本発明では、音声パワーと騒音パワー
Figure 2009163105
を次式により互いに独立して計算する。
Figure 2009163105
このため、従来のように減算処理により騒音パワーを推定しないため、音声パワーに推定誤差が生じても、該誤差が騒音パワーの推定値に何ら影響を与えないようにできる。さらに、本発明によれば、音響伝達特性をゲインGで近似するため、音声明瞭度改善システムにおける演算量を大幅に削減することができる。
(B)実施例
図1は実施例の音声明瞭度改善システムのブロック図である。
(a)通常の音声明瞭度改善制御
通常時、ナビゲーション装置の案内音声発生部51は、例えば交差点に接近したとき案内音声信号を発生する。オーディオ部52はこの案内音声信号に音質、音量制御等を施し、増幅して出力する。ゲイン調整部(音量補正部)53は後述するラウドネス補償制御部(ゲイン制御部)61で決定したゲインgをオーディオ部52より出力する音声信号に乗算し、音量補正してスピーカ54に入力する。スピーカ54は入力音声信号を音響変換して車室内に案内音声を出力する。マイクロホン(マイク)55は案内音声Aと周辺の騒音N(エンジン音、ロードノイズ等)の合成音を検出して聴感補正フィルタ56を介してパワー計算部57に入力する。パワー計算部57は入力されたマイク検出信号の振幅の二乗演算を行なってパワーを計算し、切替部58に入力する。
切替部58は、ガイド音声が出力されていない区間において、すなわち、音声信号のパワー(音声パワー)が設定値より小さいとき、パワー計算部57で計算されたパワーを、固定接点Aを介して騒音パワー平均化部59に入力し、ガイド音声が出力されている区間において、すなわち、音声パワーが設定値より大きいとき、パワー計算部57で計算されたパワーをB接点側に出力していずれのユニットにも入力しない。
騒音パワー平均化部59は、ガイド音声が出力されていない区間において、パワー計算部57から出力するパワーを騒音パワーと見なし、パワー計算部57から出力する最新の256個のパワーの移動平均値を求め、該移動平均値を騒音パワーとしてパワー保存部60に保存する。この結果、ガイド音声が出力されたとき、直前のガイド音声が出力されていない区間における最新の騒音パワーがパワー保存部60に保存されていることになる。本発明では、ガイド音声出力中の騒音パワーは、パワー保存部60に保存されている騒音パワーであると見なし、パワー保存部60に保存されている騒音パワーをゲイン制御部61に入力する。
以上と並行して、オーディオ部52から出力する音声信号は、聴感補正フィルタ62を介して音声パワー計算部63に入力する。音声パワー計算部63は入力された音声信号の振幅の二乗演算を行なって音声パワーを計算し、該音声パワーを判定部64と音声パワー平均化部65に入力する。判定部64は、入力された音声パワーと設定レベルとを比較し、音声パワーが設定レベルより小さいときはガイド音声が出力されていない区間であると判定し、音声パワーが設定レベルより大きいときはガイド音声が出力されている区間であると判定する。そして、判定部64は、ガイド音声が出力されていない区間では切替器58を制御してパワー計算部57が計算したパワーを騒音パワー平均化部59に入力し、ガイド音声が出力されている区間では、何れのユニットにも入力しない。
音声パワー平均化部65は音声パワー計算部63から出力する1024個の音声パワーの平均値を演算し、平均値を通常オンしているスイッチ66を介して可変ゲイン部67に入力し、可変ゲイン部67は設定されているゲインGを平均音声パワーに乗算してゲイン制御部61に入力する。なお、可変ゲイン部67に設定されるゲインGは、スピーカ54の入力端子からマイク出力端子までの伝播特性をゲインのみで近似できると見なして、特性同定部70が該ゲインGを後述する同定モードにおいて予め同定して設定するものである。
ラウドネス補償制御部61は、ガイド音声が出力されている区間において、可変ゲイン部67から入力する音声パワーとパワー保存部60から入力する騒音パワーに基づき、騒音のレベルによらず案内音声が明瞭に聞こえるゲインgを人のラウドネス特性により決定してゲイン調整部53に入力し、ゲイン調整部53は該ゲインgを入力され、案内音声信号にゲインgを乗算して出力する。なお、ラウドネス補償制御部61は、ガイド音声が出力されていない区間では、ゲインgの決定制御を行なわない。
図2は音声明瞭度改善中の動作ユニットのみを示す構成図である。
以上は、スピーカ入力端子からマイク出力端子までの伝播特性を近似するゲインGが同定されており、操作部71の音声明瞭度改善スイッチ71aがオンになっている場合である。しかし、制御部72は音声明瞭度改善スイッチ71aがオフであれば、音声明瞭度改善制御を行なわないようにラウドネス補償制御部61を制御する。
(b)同定制御
制御部72は、操作部71の音声明瞭度改善スイッチ71aがオンになっていても、ゲインGが同定されていなければ音声明瞭度改善制御を行なわない。しかし、制御部72はゲインGが同定されていなければ、車両の駐車を検出して表示部71cにゲインGの同定を行なうか否かの選択メッセージを表示し、ユーザがモード選択スイッチ71bにより同定モードを選択すればゲインGの同定処理を開始する。
すなわち、同定モードになると、制御部72は模擬音声発生部73を駆動して模擬音声を出力させると共にラウドネス補償制御部61のゲイン決定制御を停止し、また、スイッチ66をオフし、かつ特性同定部70をイネーブルしてゲインGの同定開始を指示する。
同定時、模擬音声発生部73は模擬音声を発生し、該模擬音声信号をオーディオ部52、ゲイン調整部(音量補正部)53を介してスピーカ54に入力する。スピーカ54は入力音声信号を音響変換して車室内に案内音声を出力する。マイクロホン(マイク)55は案内音声A(騒音Nは0)を検出して聴感補正フィルタ56を介してパワー計算部57に入力する。パワー計算部57は入力されたマイク検出信号の振幅の二乗演算を行なってパワーを計算し、パワー平均化部74に入力する。パワー平均化部74はパワー計算部57から入力する1024個のパワーの平均値PMICを演算し、平均値PMICをマイク位置における音声パワーとして特性同定部70に入力する。
一方、オーディオ部52から出力する音声信号は以上と並行して、聴感補正フィルタ62を介して音声パワー計算部63に入力する。音声パワー計算部63は入力された音声信号の振幅の二乗演算を行なって音声パワーを計算し、該音声パワーを音声パワー平均化部65に入力する。音声パワー平均化部65は音声パワー計算部63から出力する1024個の音声パワーの平均値PAUDを演算し、平均値PAUDを特性同定部70に入力する。
特性同定部70は、次式
G=PMIC/PAUD (3)
により、ゲインGを計算し、該ゲインGをスピーカ入力端子からマイク出力端子までの伝播特性を近似するものと認定し、該ゲインGを可変ゲイン部67に設定する。すなわち、本発明では伝達特性がナビゲーション音声の周波数帯域においてほぼ均一に近似できることに着目してゲインGで該伝達特性を代用させている。ゲインGが同定されれば、音声明瞭度改善スイッチ71aがオンの通常モードにおいて、前述のように音声明瞭度改善制御が行なわれる。
図3は同定処理中の動作ユニットのみを示す構成図である。なお、特性同定部70は、音声パワー平均化部65から入力する音声パワーの平均値PAUDを累積加算する累積加算部70aと、パワー平均化部74から入力するパワーの平均値PMICを累積加算する累積加算部70bと、(3)式によりゲインを計算する除算部70cで構成されている。
同定時に使用する模擬音源73としては図4に示すように音声のスペクトル分布の平均を模擬した模擬音声を用いる。また、案内音声信号が男性の音声信号であれば男性の模擬音声信号を用い、案内音声信号が女性の音声信号であれば、女性の模擬音声信号を用いる。なお、図4は、三浦,越川:音声の瞬時レベル分布およびスペクトル,通研実報4.2,pp245〜262(1955) から抜粋している
(c)声明瞭度改善スイッチをオンしたときの制御処理
図5は音声明瞭度改善スイッチ71aをオンしたときの制御処理フローである。
音声明瞭度改善スイッチ71aがオンしたとき、制御部72は過去にゲインGの設定を行なったことがあるかチェックし(ステップ101)、ゲイン設定を行なったことがあれば、音声明瞭度改善を行えるように各部を制御し(ステップ102)、以後、音声明瞭度改善処理を開始する。
一方、ステップ101においてゲイン設定を行なったことがなければ、制御部72はゲイン同定が必要な旨のメッセージを表示部71cに表示する(ステップ103)。なお、車両は駐車中であるものとする。
該メッセージを表示し、設定時間経過してもユーザが同定モードを選択しなければ(ステップ104)、制御部72は処理を終了し、音声明瞭度改善制御を実行しない。しかし、ユーザがモードスイッチ71bを操作して同定モードを選択すれば、現在音楽再生中であるかチェックし(ステップ105)、再生中であれば再生音をミュートする(ステップ106)。しかる後、制御部72はラウドネス補償制御部61のゲイン決定制御を停止し(補正オフ)、特性同定部70をイネーブルしてゲインGの同定開始を指示する(ステップ107)。
また、制御部72はオーディオ部52に音声音量を規定値に変更するよう指示し(ステップ108)、模擬音声発生部73を駆動して模擬音声を出力させる(ステップ109)。かかる状態で、特性同定部70は前述の同定処理を開始し、ゲインGを決定して可変ゲイン部67に設定する(ステップ110)。ゲイン設定が完了すれば、制御部72はオーディオ部52に音声音量を元に戻すよう指示するとともに、オーディオミュート中であればオーディオミュートを解除し(ステップ111〜113)、以後、ステップ102において音声明瞭度改善を行えるように各部を制御し、以後、音声明瞭度改善処理を開始する。
同定はパーキング信号検知により停車時でないと操作できないようにし、同定後は再設定をするまでこの値を記憶するようにする。なお、図5の処理フローはゲインGを同定してなかった場合の処理フローであるが、ゲインGを再設定する場合には、停車中に同定モードオンにして図5のステップ105以降の処理フローに従って更新する。
(d)効果
実施例によれば、ガイド音声が出力されていない区間において騒音パワーを算出して保存し、音声出力中の騒音パワーを該保存してある騒音パワーとする。また、スピーカからマイク位置までの音響伝達特性をゲインGで近似し、マイク位置での音声パワーをガイド音声信号の二乗振幅値(パワー)に該ゲインGを乗算することにより推定する。この結果、従来技術のようにマイク検出信号のパワー(騒音と音声の合成音のパワー)から音声パワーを減算して騒音パワーを演算しないため、騒音パワーに音声信号と騒音信号の相関成分が含まれず、このため音声と騒音の相関が大きくなっても騒音パワーの推定誤差を小さくできる。なお、以上のように騒音パワーを推定しても、ガイド音声が出力されていない区間が頻繁に発生するため、音声出力中の騒音パワーの推定誤差を小さくすることができる。
また、音声パワーに推定誤差が生じても、該誤差が騒音パワーの推定値に何ら影響を与えないようにでき、音声信号のゲインが大幅に誤差を持たないようにできる。仮に音声パワーの推定値に誤差(理想状態からのズレ:α)が生じても、本実施例の独立したパワー推定機構により減算処理を行わないため、それらのパワー値で算出されるゲイン値が理想値から大幅にずれることがない。たとえば、騒音と音声パワーの騒音パワーの推定値がともに70dBA相当のとき,理想とする補正ゲイン値は5.9dBである。ここで、音声パワーの推定値が5dB程度の誤差(⇒65dBA)をもった場合でも、騒音パワーは70dBA相当のままでゲイン値は7.6dBまで抑圧することができる(従来は9.9dBとなる)。
実施例によれば、FFT演算や複雑なF-LMSアルゴリズムを行なわなくても良いため音声明瞭度改善システムにおける演算量を大幅に削減することができる。すなわち、乗算回数が一区間単位あたり3000回強と,従来の15%程度の処理量で同等の性能を発揮することができる。本発明と従来技術による音声明瞭度改善システムを同一環境で組込、評価した結果は図6に示すようになる。すなわち、通常動作時において予想通り従来比85%の処理量削減,全体でも1/3となっている。なお、図6の横軸は従来技術のMIPSを100%としたときの本発明のMIPSの割合を示すものであり、81,81′騒音推定演算量、82,82′はその他の演算量である。
図7は本発明の騒音推定精度を示す図であり、実測値65.2(dBA)であるが、本発明によればほぼ正確に騒音パワーを推定できていることがわかる。ただし、a,b,cはガイド音声が出力されていない区間である。
以上より、本発明によれば、DSPデバイスのコストダウンおよび適用モデルへの拡大が可能となる。
(C)変形例
実施例では、スピーカ入力端子からマイク出力端子での伝達特性をゲインGで近似したが、演算量は増えるが同定モードにおいてLMSアルゴリズムあるいはF-LMSアルゴリズムにより伝達特性を求め、音声明瞭度改善制御に際して音声パワーに該伝達特性を付与してラウドネス補償制御部61に入力するように構成することもできる。
以上の説明では案内音声の明瞭度を制御する場合について説明したが、本発明はかかる案内音声の明瞭度を改善する場合に限らず、ニュースやメールの読上げ音声、その他の音声の音声明瞭度を改善する際にも適用することができるものである。
実施例の音声明瞭度改善システムのブロック図である。 音声明瞭度改善中の動作ユニットのみを示す構成図である。 同定処理中の動作ユニットのみを示す構成図である。 音声のスペクトル分布の平均を模擬した模擬音声の特性図である。 音声明瞭度改善スイッチをオンしたときの制御処理フローである。 本発明の効果説明図である。 本発明の騒音推定精度を示す図である。 従来の音声明瞭度改善システムの構成図である。
符号の説明
51 案内音声発生部
52 オーディオ部
53 ゲイン調整部(音量補正部)
54 スピーカ
55 マイクロホン(マイク)
57 パワー計算部
58 切替部
59 騒音パワー平均化部
60 パワー保存部
61 ラウドネス補償制御部(ゲイン制御部)
63 音声パワー計算部
64 判定部
65 音声パワー平均化部
67 可変ゲイン部
70 特性同定部
71 操作部
72 制御部
73 模擬音声発生部
74 パワー平均化部

Claims (19)

  1. 音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する車載の音声明瞭度改善システムにおいて、
    前記音声パワーが設定レベル以上であるか検出する音声パワー検出部、
    騒音パワーを測定する騒音パワー測定部、
    前記音声パワーが設定レベルより小さいときの騒音パワーを保存する騒音パワー保存部、
    前記音声パワーが設定レベルより大きいときの騒音パワーを前記保存してあるパワーであると推定して音声信号のゲインを制御するゲイン制御部、
    を備えたことを特徴とする音声明瞭度改善システム。
  2. 前記音声明瞭度改善システムは、更に、
    車両停止時の同定モードにおいて、音声を出力するスピーカより騒音を検出するマイクロホンまでの伝達特性を同定する伝達特性同定部、
    通常動作モードにおいて、前記音声パワーに前記伝達特性を付与してマイクロホン位置における音声パワーを出力する伝達特性付与部、
    を備え、
    前記ゲイン制御部は、前記伝達特性付与部から出力する音声パワーと前記推定した騒音パワーとに基づき音声信号のゲインを制御する、
    ことを特徴とする請求項1記載の音声明瞭度改善システム。
  3. 同定モードにおいて、前記伝達特性同定部は、前記伝達特性をゲインで近似して同定し、通常動作モードにおいて、前記伝達特性付与部は前記音声パワーに該ゲインを乗算してマイクロホン位置における音声パワーを出力する、
    ことを特徴とする請求項2記載の音声明瞭度改善システム。
  4. 前記音声明瞭度改善システムは、更に、
    マイク検出信号のパワーを測定するマイクパワー測定部、
    同定モードにおいて模擬音声信号を発生する模擬音声信号発生部、
    を備え、
    前記伝達特性同定部は、同定モードにおいて、模擬音声信号発生部から出力する模擬音声信号のパワーを測定し、前記マイクパワー測定部から出力するパワーと該模擬音声のパワーとの比より前記ゲインを同定する、
    ことを特徴とする請求項3記載の音声明瞭度改善システム。
  5. 前記音声明瞭度改善システムは、更に、
    前記模擬音声パワーを所定時間平均化する第1平均部、
    前記マイク検出パワーを所定時間平均化する第2平均部、
    を備え、前記伝達特性同定部は、第2平均部より出力する平均マイク検出パワーと第1平均部より出力する平均模擬音声パワーとの比より前記ゲインを同定する、
    ことを特徴とする請求項4記載の音声明瞭度改善システム。
  6. 前記騒音パワーを保存する騒音パワー保存部は、前記音声パワーが設定レベルより小さいときの該騒音パワーを所定時間平均化して保存する、
    ことを特徴とする請求項1記載の音声明瞭度改善システム。
  7. 前記騒音パワー保存部は、移動平均演算により最新の所定時間当たりの騒音パワーの平均値を保存する、
    ことを特徴とする請求項6記載の音声明瞭度改善システム。
  8. 前記記音声明瞭度改善システムは、更に、
    同定モードと通常動作モードを切り換えるモード切替部、
    を備えたことを特徴とする請求項2記載の音声明瞭度改善システム。
  9. 前記音声信号が、男性が発声した音声に応じた音声信号であれば、前記模擬音声信号発生部は男性の模擬音声信号を発生し、前記音声信号が、女性が発声した音声に応じた音声信号であれば、前記模擬音声信号発生部は女性の模擬音声信号を発生する、
    ことを特徴とする請求項4記載の音声明瞭度改善システム。
  10. 前記音声明瞭度改善システムは、更に、
    音声明瞭度改善システムの動作オン・オフを設定する手段、
    動作オンにした時、過去に伝達特性を同定しているかチェックし、伝達特性を同定していれば、音声明瞭度改善システムの動作を開始し、伝達特性を同定してなければ、同定モードにして伝達特性を同定するか否かをユーザに選択させる手段、
    を備えたことを特徴とする請求項2または3記載の音声明瞭度改善システム。
  11. 音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する車載の音声明瞭度改善システムにおける音声明瞭度改善方法において、
    前記音声パワーが設定レベル以上であるか検出し、
    前記音声パワーが設定レベルより小さいときの騒音パワーを測定して保存し、
    前記音声パワーが設定レベルより大きいときの騒音パワーを前記保存してあるパワーであると推定し、
    前記音声パワーと前記推定した騒音パワーとに基づいて音声信号のゲインを制御する、
    ことを特徴とする音声明瞭度改善方法。
  12. 車両停止時における同定モードにおいて、音声を出力するスピーカより騒音を検出するマイクロホンまでの伝達特性を同定し、
    通常動作モードにおいて、前記音声パワーに前記伝達特性を付与してマイクロホン位置における音声パワーを出力し、
    前記ゲインを制御するステップにおいて、前記マイクロホン位置における音声パワーと前記推定した騒音パワーとに基づき音声信号のゲインを制御する、
    ことを特徴とする請求項11記載の音声明瞭度改善方法。
  13. 同定モードにおいて、前記伝達特性をゲインで近似して同定し、
    通常動作モードにおいて、前記音声パワーに該ゲインを乗算してマイクロホン位置における音声パワーを出力する、
    ことを特徴とする請求項12記載の音声明瞭度改善方法。
  14. 同定モードにおいて、模擬音声信号を発生し、
    該模擬音声信号のパワーを測定すると共に、前記マイク検出信号のパワーを測定し、
    前記マイク検出信号のパワーと該模擬音声信号のパワーとの比より前記ゲインを同定する、
    ことを特徴とする請求項13記載の音声明瞭度改善方法。
  15. 前記模擬音声信号のパワーを所定時間平均化すると共に、前記マイク検出信号のパワーを所定時間平均化し、平均マイク検出パワーと平均模擬音声パワーとの比より前記ゲインを同定する、
    ことを特徴とする請求項14記載の音声明瞭度改善方法。
  16. 前記音声パワーが設定レベルより小さいときの前記騒音パワーを所定時間平均化して保存する、
    ことを特徴とする請求項11記載の音声明瞭度改善方法。
  17. 移動平均演算により最新の所定時間当たりの騒音パワーの平均値を保存する、
    ことを特徴とする請求項16記載の音声明瞭度改善方法。
  18. 前記音声信号が、男性が発声した音声に応じた音声信号であれば、男性の模擬音声信号を発生し、前記音声信号が、女性が発声した音声に応じた音声信号であれば、女性の模擬音声信号を発生する、
    ことを特徴とする請求項14記載の音声明瞭度改善方法。
  19. 音声明瞭度改善システムの動作オンを設定したとき、過去に伝達特性を同定しているかチェックし、伝達特性を同定していれば、音声明瞭度改善システムの動作を開始し、伝達特性を同定してなければ、同定モードにして伝達特性を同定するか否かをユーザに選択させる、
    ことを特徴とする請求項12または13記載の音声明瞭度改善方法。
JP2008002144A 2008-01-09 2008-01-09 音声明瞭度改善システム及び音声明瞭度改善方法 Active JP5219522B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008002144A JP5219522B2 (ja) 2008-01-09 2008-01-09 音声明瞭度改善システム及び音声明瞭度改善方法
US12/339,360 US8249259B2 (en) 2008-01-09 2008-12-19 Voice intelligibility enhancement system and voice intelligibility enhancement method
CN2008101889332A CN101483414B (zh) 2008-01-09 2008-12-26 声音清晰度改善系统及声音清晰度改善方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008002144A JP5219522B2 (ja) 2008-01-09 2008-01-09 音声明瞭度改善システム及び音声明瞭度改善方法

Publications (2)

Publication Number Publication Date
JP2009163105A true JP2009163105A (ja) 2009-07-23
JP5219522B2 JP5219522B2 (ja) 2013-06-26

Family

ID=40844572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008002144A Active JP5219522B2 (ja) 2008-01-09 2008-01-09 音声明瞭度改善システム及び音声明瞭度改善方法

Country Status (3)

Country Link
US (1) US8249259B2 (ja)
JP (1) JP5219522B2 (ja)
CN (1) CN101483414B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013172454A (ja) * 2012-02-22 2013-09-02 Kotatsu Kokusai Denshi Kofun Yugenkoshi オーディオ明瞭度増大方法および装置とコンピュータ装置
US11373669B2 (en) * 2019-06-07 2022-06-28 Yamaha Corporation Acoustic processing method and acoustic device
WO2023157101A1 (ja) * 2022-02-15 2023-08-24 パイオニア株式会社 情報処理装置、情報処理方法、プログラムおよび記録媒体

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120123769A1 (en) * 2009-05-14 2012-05-17 Sharp Kabushiki Kaisha Gain control apparatus and gain control method, and voice output apparatus
EP2367286B1 (en) * 2010-03-12 2013-02-20 Harman Becker Automotive Systems GmbH Automatic correction of loudness level in audio signals
GB2486268B (en) * 2010-12-10 2015-01-14 Wolfson Microelectronics Plc Earphone
JP6147744B2 (ja) * 2011-07-29 2017-06-14 ディーティーエス・エルエルシーDts Llc 適応音声了解度処理システムおよび方法
US9934780B2 (en) 2012-01-17 2018-04-03 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch
US9997069B2 (en) 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US9052197B2 (en) 2012-06-05 2015-06-09 Apple Inc. Providing navigation instructions while device is in locked mode
US9482296B2 (en) 2012-06-05 2016-11-01 Apple Inc. Rendering road signs during navigation
US9230556B2 (en) 2012-06-05 2016-01-05 Apple Inc. Voice instructions during navigation
US9886794B2 (en) 2012-06-05 2018-02-06 Apple Inc. Problem reporting in maps
US10176633B2 (en) 2012-06-05 2019-01-08 Apple Inc. Integrated mapping and navigation application
US20130321400A1 (en) 2012-06-05 2013-12-05 Apple Inc. 3D Map Views for 3D Maps
US9418672B2 (en) 2012-06-05 2016-08-16 Apple Inc. Navigation application with adaptive instruction text
US20130328861A1 (en) 2012-06-06 2013-12-12 Apple Inc. Generation of Road Data
US9863780B2 (en) 2012-06-10 2018-01-09 Apple Inc. Encoded representation of traffic data
US11935190B2 (en) 2012-06-10 2024-03-19 Apple Inc. Representing traffic along a route
CN110808723B (zh) * 2014-05-26 2024-09-17 杜比实验室特许公司 音频信号响度控制
CN105702264B (zh) * 2015-12-30 2020-02-07 深圳海福地电子科技有限公司 音频处理装置和方法
US10679603B2 (en) * 2018-07-11 2020-06-09 Cnh Industrial America Llc Active noise cancellation in work vehicles
CN112151053B (zh) * 2019-06-11 2024-04-16 北京汇钧科技有限公司 语音增强方法、系统、电子设备和存储介质
CN112614507B (zh) * 2020-12-09 2024-06-11 腾讯音乐娱乐科技(深圳)有限公司 检测噪声的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0174621U (ja) * 1987-11-06 1989-05-19
JPH08317497A (ja) * 1995-05-17 1996-11-29 Kiyoshi Kawachi 音声案内装置
JP2005006247A (ja) * 2003-06-16 2005-01-06 Alpine Electronics Inc 音声補正装置
JP2005062713A (ja) * 2003-08-20 2005-03-10 Alpine Electronics Inc 音声補正装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01500952A (ja) 1986-08-13 1989-03-30 アランダ・オーデイオ・アプリケーションズ・ピー・テイ・ワイ・リミテッド 適応利得制御増幅器
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
US5790671A (en) * 1996-04-04 1998-08-04 Ericsson Inc. Method for automatically adjusting audio response for improved intelligibility
FR2754663A1 (fr) * 1996-10-10 1998-04-17 Philips Electronics Nv Appareil telephonique muni de moyens de controle automatique de gain
JPH11166835A (ja) 1997-12-03 1999-06-22 Alpine Electron Inc ナビゲーション音声補正装置
JP4260046B2 (ja) 2004-03-03 2009-04-30 アルパイン株式会社 音声明瞭度改善装置及び音声明瞭度改善方法
EP1729410A1 (en) * 2005-06-02 2006-12-06 Sony Ericsson Mobile Communications AB Device and method for audio signal gain control

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0174621U (ja) * 1987-11-06 1989-05-19
JPH08317497A (ja) * 1995-05-17 1996-11-29 Kiyoshi Kawachi 音声案内装置
JP2005006247A (ja) * 2003-06-16 2005-01-06 Alpine Electronics Inc 音声補正装置
JP2005062713A (ja) * 2003-08-20 2005-03-10 Alpine Electronics Inc 音声補正装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013172454A (ja) * 2012-02-22 2013-09-02 Kotatsu Kokusai Denshi Kofun Yugenkoshi オーディオ明瞭度増大方法および装置とコンピュータ装置
US9064497B2 (en) 2012-02-22 2015-06-23 Htc Corporation Method and apparatus for audio intelligibility enhancement and computing apparatus
US11373669B2 (en) * 2019-06-07 2022-06-28 Yamaha Corporation Acoustic processing method and acoustic device
WO2023157101A1 (ja) * 2022-02-15 2023-08-24 パイオニア株式会社 情報処理装置、情報処理方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
US8249259B2 (en) 2012-08-21
JP5219522B2 (ja) 2013-06-26
US20090175459A1 (en) 2009-07-09
CN101483414A (zh) 2009-07-15
CN101483414B (zh) 2013-05-08

Similar Documents

Publication Publication Date Title
JP5219522B2 (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
KR100860805B1 (ko) 음성 강화 시스템
US8355511B2 (en) System and method for envelope-based acoustic echo cancellation
US8472616B1 (en) Self calibration of envelope-based acoustic echo cancellation
US20090010445A1 (en) Echo suppressor, echo suppressing method, and computer readable storage medium
EP2180465B1 (en) Noise suppression device and noice suppression method
EP3276621B1 (en) Noise suppression device and noise suppressing method
JP2002501337A (ja) 通信システムのコンフォートノイズ提供方法及び装置
JP5598552B2 (ja) 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置
US20080095384A1 (en) Apparatus and method for detecting voice end point
US9544687B2 (en) Audio distortion compensation method and acoustic channel estimation method for use with same
WO2020127939A1 (en) Methods, devices and system for a compensated hearing test
EP2058945A1 (en) Audio processing apparatus and program
JP5459220B2 (ja) 発話音声検出装置
US20100046772A1 (en) Sound level control
US9245537B2 (en) Speech enhancement apparatus and method for emphasizing consonant portion to improve articulation of audio signal
JP4460256B2 (ja) 雑音低減処理方法、この方法を実施する装置、プログラム、記録媒体
JP4187615B2 (ja) 出力音補正装置
JP4522509B2 (ja) オーディオ装置
JP5105912B2 (ja) 音声明瞭度改善装置およびその騒音レベル推定方法
JP2008070877A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
JP2001228893A (ja) 音声認識装置
JPH0646499A (ja) 音場補正装置
JP5339849B2 (ja) 音声明瞭度改善方法および音声明瞭度改善システム
US20220199105A1 (en) Signal component estimation using coherence

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120808

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5219522

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150