JP2009163105A

JP2009163105A - 音声明瞭度改善システム及び音声明瞭度改善方法

Info

Publication number: JP2009163105A
Application number: JP2008002144A
Authority: JP
Inventors: Toru Marumoto; 徹丸本; Nozomi Saito; 望齊藤
Original assignee: Alpine Electronics Inc
Current assignee: Alpine Electronics Inc
Priority date: 2008-01-09
Filing date: 2008-01-09
Publication date: 2009-07-23
Anticipated expiration: 2028-01-09
Also published as: US8249259B2; JP5219522B2; US20090175459A1; CN101483414A; CN101483414B

Abstract

【目的】簡単な構成で、かつ少ない演算量で騒音パワーの推定を正確に行なえるようにする「音声明瞭度改善システム及び音声明瞭度改善方法」を提供する。
【構成】音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する音声明瞭度改善システムにおいて、音声パワーが設定レベル以上であるか検出し、音声パワーが設定レベルより小さいときの騒音パワーを測定して保存し、音声パワーが設定レベルより大きいときの騒音パワーを保存してあるパワーであると推定し、音声パワーと推定した騒音パワーとに基づいて音声信号のゲインを制御する。
【選択図】図１

Description

本発明は音声明瞭度改善システム及び音声明瞭度改善方法に係り、特に音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する音声明瞭度改善システム及び音声明瞭度改善方法に関する。

スピーカから出力された音声（ナビゲーションガイド音声や，ニュースやメールの読上げ音声など）を騒音下でも明瞭に聞こえるようにする車載の音声明瞭度改善システムがある。例えば、車載用ナビゲーション装置では進路案内等の音声がスピーカから車室内に出力されるが、走行中などでエンジン音、ロードノイズ等の騒音が大きいときはマスキング効果でスピーカ出力音声が聞きづらくなる。そこで、スピーカ出力音声に比し騒音が大きいときはスピーカ出力音声にラウドネス補償を施して音声帯域全体のゲインを上げるなどして騒音下でもスピーカ出力音声が明瞭に聞こえるようにしている。

図８は従来の音声明瞭度改善システムの構成図である（例えば特許文献１参照）。図８によれば、同定フィルタ１によりマイク２の設置位置における案内音声信号を模擬し、減算器３により、マイク２の出力から前記信号を引くことによって騒音信号を抽出している。ラウドネス補償ゲイン算出部４では、案内音声信号および騒音信号のそれぞれの信号をもとにGoptを算出してRG補正部５に入力している。
この際、同定用フィルタ６における同定処理は、適応フィルタ７を用いて行なわれる。この中の適応アルゴリズム部８は、種々の適応アルゴリズムを用いて実現することができ、その代表的なものの一つがLMSアルゴリズムであるが、Fast-LMSアルゴリズム（周波数領域におけるLMSアルゴリズム）等を使用してフィルタ係数の更新を行なうようにしてもよい。
特開平１１−１６６８３５号公報

上記の従来音声明瞭度改善システムには以下の課題がある。
第１の課題は、音声信号のパワーに推定誤差（理想状態からのズレ：α）が生じると、次式で示すように、減算によって算出される騒音推定パワーの誤差が、音声信号の推定パワーの誤差αの符号と逆符号となり、差幅が大きくなってゲインを正しく決定できなくなる。

すなわち、音声信号に推定誤差（理想状態からのズレ：α）が生じると、騒音推定も−αの誤差を生じてしまう。その結果、それらのパワー値で算出されるゲイン値が理想値から大幅にずれ、補正効果に悪影響を及ぼす。たとえば、騒音と音声の推定パワーがともに70dBA相当のとき、理想とする補正ゲイン値は5.9dBである。ここで、音声の推定値が5dB程度の誤差（⇒65dBA）をもった場合、騒音推定値もつられて75dBA相当と大きくなり、ゲイン値は9.9dBまでもちあがってしまう。もし、騒音推定値＝70dBAのままであれば、ゲイン値は７.6dBとなり、ゲインの誤差は小さい。

第２の課題は、従来の音声明瞭度改善システムでは演算量が多すぎて高価なDSPが必要とされる点である。従来の音声明瞭度改善システムの場合、演算量が比較的少ないと言われるFast-LMS アルゴリズムにより図８の適応アルゴリズム部８を構成したとしても、単位信号ブロック長あたり２回のFFT処理と、フィルタ係数の更新処理を行う必要がある。また、これらは複素数の演算であるため、DSP上で19000回弱の乗算回数が必要であり、DSPで20MIPS程度の計算パワーを必要としていた。そして、この処理量は、従来の音声明瞭度改善システムを実現する際に必要となるDSP処理量全体の８割程度を占める。このため、図８に示したような従来の音声明瞭度改善システムを実現する際には高価なDSPが必要となり、その分、他の処理にはDSPの計算パワーを十分に回せなくなる、といった問題が生じる。なお、乗算回数はFFTを行なう際の窓長NをN=1024とすれば、次式
Nlog₂N+N/2×17=18944
回となる。
以上から本発明の目的は、騒音パワーの推定を正確に行なえるようにすることであり、特に音声パワー推定に誤差が生じても、該誤差が騒音パワーの推定に影響を与えないようにすることである。
本発明の別の目的は、音声明瞭度改善システムにおける演算量を削減することである。

・音声明瞭度改善システム
本発明の第1は、音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する車載の音声明瞭度改善システムであり、前記音声パワーが設定レベル以上であるか検出する音声パワー検出部、騒音パワーを測定する騒音パワー測定部、前記音声パワーが設定レベルより小さいときの騒音パワーを保存する騒音パワー保存部、前記音声パワーが設定レベルより大きいときの騒音パワーを前記保存してあるパワーであると推定して音声信号のゲインを制御するゲイン制御部を備えている。
前記音声明瞭度改善システムは、更に、車両停止時の同定モードにおいて、音声を出力するスピーカより騒音を検出するマイクロホンまでの伝達特性を同定する伝達特性同定部、通常動作モードにおいて、前記音声パワーに前記伝達特性を付与してマイクロホン位置における音声パワーを出力する伝達特性付与部を備え、前記ゲイン制御部は、前記伝達特性付与部から出力する音声パワーと前記推定した騒音パワーとに基づき音声信号のゲインを制御する。
同定モードにおいて、前記伝達特性同定部は、前記伝達特性をゲインで近似して同定し、通常動作モードにおいて、前記伝達特性付与部は前記音声パワーに該ゲインを乗算してマイクロホン位置における音声パワーを出力する。
前記音声明瞭度改善システムは、更に、マイク検出信号のパワーを測定するマイクパワー測定部、同定モードにおいて模擬音声信号を発生する模擬音声信号発生部を備え、前記伝達特性同定部は、同定モードにおいて、模擬音声信号発生部から出力する模擬音声信号のパワーを測定し、前記マイクパワー測定部から出力するパワーと該模擬音声のパワーとの比より前記ゲインを同定する。
前記音声明瞭度改善システムは、更に、前記模擬音声パワーを所定時間平均化する第１平均部、前記マイク検出パワーを所定時間平均化する第２平均部を備え、前記伝達特性同定部は、第２平均部より出力する平均マイク検出パワーと第１平均部より出力する平均模擬音声パワーとの比より前記ゲインを同定する。
前記騒音パワーを保存する騒音パワー保存部は、前記音声パワーが設定レベルより小さいときの該騒音パワーを所定時間平均化して保存する。
前記騒音パワー保存部は、移動平均演算により最新の所定時間当たりの騒音パワーの平均値を保存する。
前記記音声明瞭度改善システムは、更に、同定モードと通常動作モードを切り換えるモード切替部を備えている。
前記音声信号が、男性が発声した音声に応じた音声信号であれば、前記模擬音声信号発生部は男性の模擬音声信号を発生し、前記音声信号が、女性が発声した音声に応じた音声信号であれば、前記模擬音声信号発生部は女性の模擬音声信号を発生する。
前記音声明瞭度改善システムは、更に、音声明瞭度改善システムの動作オン・オフを設定する手段、動作オンにした時、過去に伝達特性を同定しているかチェックし、伝達特性を同定していれば、音声明瞭度改善システムの動作を開始し、伝達特性を同定してなければ、同定モードにして伝達特性を同定するか否かをユーザに選択させる手段を備えている。

・音声明瞭度改善方法
本発明の第２は、音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する車載の音声明瞭度改善システムにおける音声明瞭度改善方法であり、前記音声パワーが設定レベル以上であるか検出するステップ、前記音声パワーが設定レベルより小さいときの騒音パワーを測定して保存するステップ、前記音声パワーが設定レベルより大きいときの騒音パワーを前記保存してあるパワーであると推定し、
前記音声パワーと前記推定した騒音パワーとに基づいて音声信号のゲインを制御するステップを有している。
本発明の音声明瞭度改善方法は、更に、車両停止時における同定モードにおいて、音声を出力するスピーカより騒音を検出するマイクロホンまでの伝達特性を同定するステップ、通常動作モードにおいて、前記音声パワーに前記伝達特性を付与してマイクロホン位置における音声パワーを出力するステップを有し、前記ゲインを制御するステップにおいて、前記マイクロホン位置における音声パワーと前記推定した騒音パワーとに基づき音声信号のゲインを制御する。
本発明の音声明瞭度改善方法は、更に、同定モードにおいて、前記伝達特性をゲインで近似して同定するステップ、通常動作モードにおいて、前記音声パワーに該ゲインを乗算してマイクロホン位置における音声パワーを出力するステップを有している。
本発明の音声明瞭度改善方法は、更に、同定モードにおいて、模擬音声信号を発生するステップ、該模擬音声信号のパワーを測定すると共に、前記マイク検出信号のパワーを測定するステップ、前記マイク検出信号のパワーと該模擬音声信号のパワーとの比より前記ゲインを同定するステップを有している。この場合、前記模擬音声信号のパワーを所定時間平均化すると共に、前記マイク検出信号のパワーを所定時間平均化し、平均マイク検出パワーと平均模擬音声パワーとの比より前記ゲインを同定する。

本発明によれば、マイク検出信号のパワー（騒音と音声の合成信号のパワー）から音声パワーを減算して騒音パワーを演算しないため、本発明の騒音パワーに音声信号と騒音信号の相関成分が含まれず、このため音声と騒音の相関が大きくなっても騒音パワーの推定誤差を小さくできる。また、音声パワーに推定誤差が生じても、該誤差が騒音パワーの推定値に何ら影響を与えないようにでき、音声信号のゲインが大幅に誤差を持たないようにできる。
また、本発明によれば、FFT演算や複雑なF-LMSアルゴリズムを行なわなくても良いため音声明瞭度改善システムにおける演算量を大幅に削減することができる。

（A）本発明の概略
本発明では、音声例えばガイド音声が出力されていない区間で騒音パワーを算出して保存し、音声出力中の騒音パワーを該保存してある騒音パワーとする。このように騒音パワーを推定しても、ガイド音声が出力されていない区間が頻繁に発生するため、音声出力中の騒音パワーとして直近のガイド音声が出力されていない区間に算出したパワーを採用できるため騒音パワーの推定誤差は小さい。
また、スピーカからマイク位置までの音響伝達特性をゲインGで近似し、マイク位置での音声パワーをガイド音声信号の二乗振幅値（パワー）に該ゲインGを乗算することにより推定する。
以上のように、本発明では、音声パワーと騒音パワー

を次式により互いに独立して計算する。

このため、従来のように減算処理により騒音パワーを推定しないため、音声パワーに推定誤差が生じても、該誤差が騒音パワーの推定値に何ら影響を与えないようにできる。さらに、本発明によれば、音響伝達特性をゲインGで近似するため、音声明瞭度改善システムにおける演算量を大幅に削減することができる。

（B）実施例
図１は実施例の音声明瞭度改善システムのブロック図である。
（ａ）通常の音声明瞭度改善制御
通常時、ナビゲーション装置の案内音声発生部５１は、例えば交差点に接近したとき案内音声信号を発生する。オーディオ部５２はこの案内音声信号に音質、音量制御等を施し、増幅して出力する。ゲイン調整部（音量補正部）５３は後述するラウドネス補償制御部（ゲイン制御部）６１で決定したゲインgをオーディオ部５２より出力する音声信号に乗算し、音量補正してスピーカ５４に入力する。スピーカ５４は入力音声信号を音響変換して車室内に案内音声を出力する。マイクロホン（マイク）５５は案内音声Ａと周辺の騒音Ｎ（エンジン音、ロードノイズ等）の合成音を検出して聴感補正フィルタ５６を介してパワー計算部５７に入力する。パワー計算部５７は入力されたマイク検出信号の振幅の二乗演算を行なってパワーを計算し、切替部５８に入力する。
切替部５８は、ガイド音声が出力されていない区間において、すなわち、音声信号のパワー（音声パワー）が設定値より小さいとき、パワー計算部５７で計算されたパワーを、固定接点Aを介して騒音パワー平均化部５９に入力し、ガイド音声が出力されている区間において、すなわち、音声パワーが設定値より大きいとき、パワー計算部５７で計算されたパワーをB接点側に出力していずれのユニットにも入力しない。
騒音パワー平均化部５９は、ガイド音声が出力されていない区間において、パワー計算部５７から出力するパワーを騒音パワーと見なし、パワー計算部５７から出力する最新の２５６個のパワーの移動平均値を求め、該移動平均値を騒音パワーとしてパワー保存部６０に保存する。この結果、ガイド音声が出力されたとき、直前のガイド音声が出力されていない区間における最新の騒音パワーがパワー保存部６０に保存されていることになる。本発明では、ガイド音声出力中の騒音パワーは、パワー保存部６０に保存されている騒音パワーであると見なし、パワー保存部６０に保存されている騒音パワーをゲイン制御部６１に入力する。

以上と並行して、オーディオ部５２から出力する音声信号は、聴感補正フィルタ６２を介して音声パワー計算部６３に入力する。音声パワー計算部６３は入力された音声信号の振幅の二乗演算を行なって音声パワーを計算し、該音声パワーを判定部６４と音声パワー平均化部６５に入力する。判定部６４は、入力された音声パワーと設定レベルとを比較し、音声パワーが設定レベルより小さいときはガイド音声が出力されていない区間であると判定し、音声パワーが設定レベルより大きいときはガイド音声が出力されている区間であると判定する。そして、判定部６４は、ガイド音声が出力されていない区間では切替器５８を制御してパワー計算部５７が計算したパワーを騒音パワー平均化部５９に入力し、ガイド音声が出力されている区間では、何れのユニットにも入力しない。
音声パワー平均化部６５は音声パワー計算部６３から出力する１０２４個の音声パワーの平均値を演算し、平均値を通常オンしているスイッチ６６を介して可変ゲイン部６７に入力し、可変ゲイン部６７は設定されているゲインGを平均音声パワーに乗算してゲイン制御部６１に入力する。なお、可変ゲイン部６７に設定されるゲインGは、スピーカ５４の入力端子からマイク出力端子までの伝播特性をゲインのみで近似できると見なして、特性同定部７０が該ゲインGを後述する同定モードにおいて予め同定して設定するものである。
ラウドネス補償制御部６１は、ガイド音声が出力されている区間において、可変ゲイン部６７から入力する音声パワーとパワー保存部６０から入力する騒音パワーに基づき、騒音のレベルによらず案内音声が明瞭に聞こえるゲインgを人のラウドネス特性により決定してゲイン調整部５３に入力し、ゲイン調整部５３は該ゲインgを入力され、案内音声信号にゲインgを乗算して出力する。なお、ラウドネス補償制御部６１は、ガイド音声が出力されていない区間では、ゲインgの決定制御を行なわない。
図２は音声明瞭度改善中の動作ユニットのみを示す構成図である。
以上は、スピーカ入力端子からマイク出力端子までの伝播特性を近似するゲインGが同定されており、操作部７１の音声明瞭度改善スイッチ７１aがオンになっている場合である。しかし、制御部７２は音声明瞭度改善スイッチ７１aがオフであれば、音声明瞭度改善制御を行なわないようにラウドネス補償制御部６１を制御する。

（ｂ）同定制御
制御部７２は、操作部７１の音声明瞭度改善スイッチ７１aがオンになっていても、ゲインGが同定されていなければ音声明瞭度改善制御を行なわない。しかし、制御部７２はゲインGが同定されていなければ、車両の駐車を検出して表示部７１ｃにゲインGの同定を行なうか否かの選択メッセージを表示し、ユーザがモード選択スイッチ７１bにより同定モードを選択すればゲインGの同定処理を開始する。
すなわち、同定モードになると、制御部７２は模擬音声発生部７３を駆動して模擬音声を出力させると共にラウドネス補償制御部６１のゲイン決定制御を停止し、また、スイッチ６６をオフし、かつ特性同定部７０をイネーブルしてゲインGの同定開始を指示する。
同定時、模擬音声発生部７３は模擬音声を発生し、該模擬音声信号をオーディオ部５２、ゲイン調整部（音量補正部）５３を介してスピーカ５４に入力する。スピーカ５４は入力音声信号を音響変換して車室内に案内音声を出力する。マイクロホン（マイク）５５は案内音声Ａ（騒音Nは0）を検出して聴感補正フィルタ５６を介してパワー計算部５７に入力する。パワー計算部５７は入力されたマイク検出信号の振幅の二乗演算を行なってパワーを計算し、パワー平均化部７４に入力する。パワー平均化部７４はパワー計算部５７から入力する１０２４個のパワーの平均値P_MICを演算し、平均値P_MICをマイク位置における音声パワーとして特性同定部７０に入力する。
一方、オーディオ部５２から出力する音声信号は以上と並行して、聴感補正フィルタ６２を介して音声パワー計算部６３に入力する。音声パワー計算部６３は入力された音声信号の振幅の二乗演算を行なって音声パワーを計算し、該音声パワーを音声パワー平均化部６５に入力する。音声パワー平均化部６５は音声パワー計算部６３から出力する１０２４個の音声パワーの平均値P_AUDを演算し、平均値P_AUDを特性同定部７０に入力する。
特性同定部７０は、次式
G＝P_MIC／P_AUD (3)
により、ゲインGを計算し、該ゲインGをスピーカ入力端子からマイク出力端子までの伝播特性を近似するものと認定し、該ゲインGを可変ゲイン部６７に設定する。すなわち、本発明では伝達特性がナビゲーション音声の周波数帯域においてほぼ均一に近似できることに着目してゲインGで該伝達特性を代用させている。ゲインGが同定されれば、音声明瞭度改善スイッチ７１aがオンの通常モードにおいて、前述のように音声明瞭度改善制御が行なわれる。
図３は同定処理中の動作ユニットのみを示す構成図である。なお、特性同定部７０は、音声パワー平均化部６５から入力する音声パワーの平均値P_AUDを累積加算する累積加算部７０aと、パワー平均化部７４から入力するパワーの平均値P_MICを累積加算する累積加算部７０bと、(3)式によりゲインを計算する除算部７０cで構成されている。
同定時に使用する模擬音源７３としては図４に示すように音声のスペクトル分布の平均を模擬した模擬音声を用いる。また、案内音声信号が男性の音声信号であれば男性の模擬音声信号を用い、案内音声信号が女性の音声信号であれば、女性の模擬音声信号を用いる。なお、図４は、三浦，越川：音声の瞬時レベル分布およびスペクトル，通研実報4．2，pp245〜262(1955) から抜粋している

（ｃ）声明瞭度改善スイッチをオンしたときの制御処理
図５は音声明瞭度改善スイッチ７１aをオンしたときの制御処理フローである。
音声明瞭度改善スイッチ７１aがオンしたとき、制御部７２は過去にゲインGの設定を行なったことがあるかチェックし（ステップ１０１）、ゲイン設定を行なったことがあれば、音声明瞭度改善を行えるように各部を制御し（ステップ１０２）、以後、音声明瞭度改善処理を開始する。
一方、ステップ１０１においてゲイン設定を行なったことがなければ、制御部７２はゲイン同定が必要な旨のメッセージを表示部７１cに表示する（ステップ１０３）。なお、車両は駐車中であるものとする。
該メッセージを表示し、設定時間経過してもユーザが同定モードを選択しなければ（ステップ１０４）、制御部７２は処理を終了し、音声明瞭度改善制御を実行しない。しかし、ユーザがモードスイッチ７１bを操作して同定モードを選択すれば、現在音楽再生中であるかチェックし（ステップ１０５）、再生中であれば再生音をミュートする（ステップ１０６）。しかる後、制御部７２はラウドネス補償制御部６１のゲイン決定制御を停止し（補正オフ）、特性同定部７０をイネーブルしてゲインGの同定開始を指示する（ステップ１０７）。

また、制御部７２はオーディオ部５２に音声音量を規定値に変更するよう指示し（ステップ１０８）、模擬音声発生部７３を駆動して模擬音声を出力させる（ステップ１０９）。かかる状態で、特性同定部７０は前述の同定処理を開始し、ゲインGを決定して可変ゲイン部６７に設定する（ステップ１１０）。ゲイン設定が完了すれば、制御部７２はオーディオ部５２に音声音量を元に戻すよう指示するとともに、オーディオミュート中であればオーディオミュートを解除し（ステップ１１１〜１１３）、以後、ステップ１０２において音声明瞭度改善を行えるように各部を制御し、以後、音声明瞭度改善処理を開始する。
同定はパーキング信号検知により停車時でないと操作できないようにし、同定後は再設定をするまでこの値を記憶するようにする。なお、図５の処理フローはゲインGを同定してなかった場合の処理フローであるが、ゲインGを再設定する場合には、停車中に同定モードオンにして図５のステップ１０５以降の処理フローに従って更新する。

（d）効果
実施例によれば、ガイド音声が出力されていない区間において騒音パワーを算出して保存し、音声出力中の騒音パワーを該保存してある騒音パワーとする。また、スピーカからマイク位置までの音響伝達特性をゲインGで近似し、マイク位置での音声パワーをガイド音声信号の二乗振幅値（パワー）に該ゲインGを乗算することにより推定する。この結果、従来技術のようにマイク検出信号のパワー（騒音と音声の合成音のパワー）から音声パワーを減算して騒音パワーを演算しないため、騒音パワーに音声信号と騒音信号の相関成分が含まれず、このため音声と騒音の相関が大きくなっても騒音パワーの推定誤差を小さくできる。なお、以上のように騒音パワーを推定しても、ガイド音声が出力されていない区間が頻繁に発生するため、音声出力中の騒音パワーの推定誤差を小さくすることができる。
また、音声パワーに推定誤差が生じても、該誤差が騒音パワーの推定値に何ら影響を与えないようにでき、音声信号のゲインが大幅に誤差を持たないようにできる。仮に音声パワーの推定値に誤差（理想状態からのズレ：α）が生じても、本実施例の独立したパワー推定機構により減算処理を行わないため、それらのパワー値で算出されるゲイン値が理想値から大幅にずれることがない。たとえば、騒音と音声パワーの騒音パワーの推定値がともに70dBA相当のとき，理想とする補正ゲイン値は5.9dBである。ここで、音声パワーの推定値が5dB程度の誤差（⇒65dBA）をもった場合でも、騒音パワーは70dBA相当のままでゲイン値は7.6dBまで抑圧することができる（従来は9.9dBとなる）。
実施例によれば、FFT演算や複雑なF-LMSアルゴリズムを行なわなくても良いため音声明瞭度改善システムにおける演算量を大幅に削減することができる。すなわち、乗算回数が一区間単位あたり3000回強と，従来の15%程度の処理量で同等の性能を発揮することができる。本発明と従来技術による音声明瞭度改善システムを同一環境で組込、評価した結果は図６に示すようになる。すなわち、通常動作時において予想通り従来比85%の処理量削減，全体でも1/3となっている。なお、図６の横軸は従来技術のMIPSを100％としたときの本発明のMIPSの割合を示すものであり、８１,８１′騒音推定演算量、８２，８２′はその他の演算量である。
図７は本発明の騒音推定精度を示す図であり、実測値65.2（dBA）であるが、本発明によればほぼ正確に騒音パワーを推定できていることがわかる。ただし、a，b，cはガイド音声が出力されていない区間である。
以上より、本発明によれば、DSPデバイスのコストダウンおよび適用モデルへの拡大が可能となる。

（C）変形例
実施例では、スピーカ入力端子からマイク出力端子での伝達特性をゲインGで近似したが、演算量は増えるが同定モードにおいてLMSアルゴリズムあるいはF-LMSアルゴリズムにより伝達特性を求め、音声明瞭度改善制御に際して音声パワーに該伝達特性を付与してラウドネス補償制御部６１に入力するように構成することもできる。
以上の説明では案内音声の明瞭度を制御する場合について説明したが、本発明はかかる案内音声の明瞭度を改善する場合に限らず、ニュースやメールの読上げ音声、その他の音声の音声明瞭度を改善する際にも適用することができるものである。

実施例の音声明瞭度改善システムのブロック図である。音声明瞭度改善中の動作ユニットのみを示す構成図である。同定処理中の動作ユニットのみを示す構成図である。音声のスペクトル分布の平均を模擬した模擬音声の特性図である。音声明瞭度改善スイッチをオンしたときの制御処理フローである。本発明の効果説明図である。本発明の騒音推定精度を示す図である。従来の音声明瞭度改善システムの構成図である。

符号の説明

５１案内音声発生部
５２オーディオ部
５３ゲイン調整部（音量補正部）
５４スピーカ
５５マイクロホン（マイク）
５７パワー計算部
５８切替部
５９騒音パワー平均化部
６０パワー保存部
６１ラウドネス補償制御部（ゲイン制御部）
６３音声パワー計算部
６４判定部
６５音声パワー平均化部
６７可変ゲイン部
７０特性同定部
７１操作部
７２制御部
７３模擬音声発生部
７４パワー平均化部

Claims

音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する車載の音声明瞭度改善システムにおいて、
前記音声パワーが設定レベル以上であるか検出する音声パワー検出部、
騒音パワーを測定する騒音パワー測定部、
前記音声パワーが設定レベルより小さいときの騒音パワーを保存する騒音パワー保存部、
前記音声パワーが設定レベルより大きいときの騒音パワーを前記保存してあるパワーであると推定して音声信号のゲインを制御するゲイン制御部、
を備えたことを特徴とする音声明瞭度改善システム。
前記音声明瞭度改善システムは、更に、
車両停止時の同定モードにおいて、音声を出力するスピーカより騒音を検出するマイクロホンまでの伝達特性を同定する伝達特性同定部、
通常動作モードにおいて、前記音声パワーに前記伝達特性を付与してマイクロホン位置における音声パワーを出力する伝達特性付与部、
を備え、
前記ゲイン制御部は、前記伝達特性付与部から出力する音声パワーと前記推定した騒音パワーとに基づき音声信号のゲインを制御する、
ことを特徴とする請求項１記載の音声明瞭度改善システム。
同定モードにおいて、前記伝達特性同定部は、前記伝達特性をゲインで近似して同定し、通常動作モードにおいて、前記伝達特性付与部は前記音声パワーに該ゲインを乗算してマイクロホン位置における音声パワーを出力する、
ことを特徴とする請求項２記載の音声明瞭度改善システム。
前記音声明瞭度改善システムは、更に、
マイク検出信号のパワーを測定するマイクパワー測定部、
同定モードにおいて模擬音声信号を発生する模擬音声信号発生部、
を備え、
前記伝達特性同定部は、同定モードにおいて、模擬音声信号発生部から出力する模擬音声信号のパワーを測定し、前記マイクパワー測定部から出力するパワーと該模擬音声のパワーとの比より前記ゲインを同定する、
ことを特徴とする請求項３記載の音声明瞭度改善システム。
前記音声明瞭度改善システムは、更に、
前記模擬音声パワーを所定時間平均化する第１平均部、
前記マイク検出パワーを所定時間平均化する第２平均部、
を備え、前記伝達特性同定部は、第２平均部より出力する平均マイク検出パワーと第１平均部より出力する平均模擬音声パワーとの比より前記ゲインを同定する、
ことを特徴とする請求項４記載の音声明瞭度改善システム。
前記騒音パワーを保存する騒音パワー保存部は、前記音声パワーが設定レベルより小さいときの該騒音パワーを所定時間平均化して保存する、
ことを特徴とする請求項１記載の音声明瞭度改善システム。
前記騒音パワー保存部は、移動平均演算により最新の所定時間当たりの騒音パワーの平均値を保存する、
ことを特徴とする請求項６記載の音声明瞭度改善システム。
前記記音声明瞭度改善システムは、更に、
同定モードと通常動作モードを切り換えるモード切替部、
を備えたことを特徴とする請求項２記載の音声明瞭度改善システム。
前記音声信号が、男性が発声した音声に応じた音声信号であれば、前記模擬音声信号発生部は男性の模擬音声信号を発生し、前記音声信号が、女性が発声した音声に応じた音声信号であれば、前記模擬音声信号発生部は女性の模擬音声信号を発生する、
ことを特徴とする請求項４記載の音声明瞭度改善システム。
前記音声明瞭度改善システムは、更に、
音声明瞭度改善システムの動作オン・オフを設定する手段、
動作オンにした時、過去に伝達特性を同定しているかチェックし、伝達特性を同定していれば、音声明瞭度改善システムの動作を開始し、伝達特性を同定してなければ、同定モードにして伝達特性を同定するか否かをユーザに選択させる手段、
を備えたことを特徴とする請求項２または３記載の音声明瞭度改善システム。
音声信号生成部が生成した音声信号の音声パワーと騒音パワーとに基づき音声信号のゲインを制御する車載の音声明瞭度改善システムにおける音声明瞭度改善方法において、
前記音声パワーが設定レベル以上であるか検出し、
前記音声パワーが設定レベルより小さいときの騒音パワーを測定して保存し、
前記音声パワーが設定レベルより大きいときの騒音パワーを前記保存してあるパワーであると推定し、
前記音声パワーと前記推定した騒音パワーとに基づいて音声信号のゲインを制御する、
ことを特徴とする音声明瞭度改善方法。
車両停止時における同定モードにおいて、音声を出力するスピーカより騒音を検出するマイクロホンまでの伝達特性を同定し、
通常動作モードにおいて、前記音声パワーに前記伝達特性を付与してマイクロホン位置における音声パワーを出力し、
前記ゲインを制御するステップにおいて、前記マイクロホン位置における音声パワーと前記推定した騒音パワーとに基づき音声信号のゲインを制御する、
ことを特徴とする請求項１１記載の音声明瞭度改善方法。
同定モードにおいて、前記伝達特性をゲインで近似して同定し、
通常動作モードにおいて、前記音声パワーに該ゲインを乗算してマイクロホン位置における音声パワーを出力する、
ことを特徴とする請求項１２記載の音声明瞭度改善方法。
同定モードにおいて、模擬音声信号を発生し、
該模擬音声信号のパワーを測定すると共に、前記マイク検出信号のパワーを測定し、
前記マイク検出信号のパワーと該模擬音声信号のパワーとの比より前記ゲインを同定する、
ことを特徴とする請求項１３記載の音声明瞭度改善方法。
前記模擬音声信号のパワーを所定時間平均化すると共に、前記マイク検出信号のパワーを所定時間平均化し、平均マイク検出パワーと平均模擬音声パワーとの比より前記ゲインを同定する、
ことを特徴とする請求項１４記載の音声明瞭度改善方法。
前記音声パワーが設定レベルより小さいときの前記騒音パワーを所定時間平均化して保存する、
ことを特徴とする請求項１１記載の音声明瞭度改善方法。
移動平均演算により最新の所定時間当たりの騒音パワーの平均値を保存する、
ことを特徴とする請求項１６記載の音声明瞭度改善方法。
前記音声信号が、男性が発声した音声に応じた音声信号であれば、男性の模擬音声信号を発生し、前記音声信号が、女性が発声した音声に応じた音声信号であれば、女性の模擬音声信号を発生する、
ことを特徴とする請求項１４記載の音声明瞭度改善方法。
音声明瞭度改善システムの動作オンを設定したとき、過去に伝達特性を同定しているかチェックし、伝達特性を同定していれば、音声明瞭度改善システムの動作を開始し、伝達特性を同定してなければ、同定モードにして伝達特性を同定するか否かをユーザに選択させる、
ことを特徴とする請求項１２または１３記載の音声明瞭度改善方法。