WO2010137650A1

WO2010137650A1 - 音声再生装置、音声再生方法及びプログラム

Info

Publication number: WO2010137650A1
Application number: PCT/JP2010/058994
Authority: WO
Inventors: 藤井　修
Original assignee: シャープ株式会社
Priority date: 2009-05-29
Filing date: 2010-05-27
Publication date: 2010-12-02
Also published as: US9093968B2; JPWO2010137650A1; US20120128178A1; JP5149991B2; MX2011012736A; CN102461207B; CN102461207A

Abstract

　音声再生を行う際に、高齢者特有の聴力機能に対して最適な状態で音声が聞こえるように制御する。音声再生装置は、入力した音声信号の周波数特性を設定する周波数特性設定手段と、音声信号を音声出力際の音量を可変制御する音量設定手段とを有する。周波数特性設定手段は、音量設定手段より設定される音量の増大に応じて、人の声の帯域を含む音声帯域が強調された周波数特性から、周波数に応じたゲインの特性が徐々に平坦となる周波数特性に変更する。これにより、低い音量では、人の声の周波数帯域を相対的に強く強調して高齢者でも人の声を聞こえやすくするとともに、大音量になるに従ってより平坦な周波数特性としていくことで、特定の周波数帯域の強調により生じる煩わしさを抑えて、聞きやすい音声出力を行うことができるようになる。

Description

音声再生装置、音声再生方法及びプログラム

　本発明は、音声再生装置、音声再生方法及びプログラムに関し、より詳細には、放送波や録音されたコンテンツ等の音声を再生する際に、出力音声を聞きやすくするともに煩わしさを感じないようにするために、出力音声の特性を最適化する処理を行う音声再生装置、音声再生方法、及び当該音声再生装置の機能を実現するためのプログラムに関する。

　テレビ放送や録画・録音コンテンツ等を視聴するときには、これらコンテンツの音声再生を行う装置が用いられる。音声再生装置は、例えばテレビやオーディオ、ＰＣ等の音声再生装置能を有する装置等に適用され、放送波や録音・録画コンテンツの音声信号を入力し、これら装置が備えるもしくは外部接続されたスピーカから音声出力させる機能を有している。

　このような音声再生装置を用いてユーザが再生音声を聞く場合、通常はユーザの好みや必要に応じて音量を調整して、音声を聞くようにしている。ここで例えば、高齢者が再生音声を聞く場合には、高齢者特有に見られる聴覚機能の衰え等によって、小さい音が聞こえにくくなっている。このような高齢者にとっては、再生音声に含まれるセリフやボーカルなどの人の声が若年者よりも聞き取りにくくなるため、高齢者向けの音声特性の制御として、人の声を含む周波数域を強調するような制御を行うことが好ましい。

　この場合、音量を上げて人の声を正確に聞こうとすると、人の声以外の騒音や効果音まで大きくなり、人の声が聴き取りやすくなるとは限らない。また、音量を上げた場合には、高齢者特有にみられる聴覚機能の変化によって、若年者よりもよりうるさく感じられることがあり、煩わしさが生じる場合がある。

　図１４は、加齢による聴力低下の状態をモデル的に示す図である。図１４に示すように、一般的に、人は加齢によって聴力機能が徐々に低下していき、小音量の音が聞こえにくくなってくる。特に高周波数帯域の聞こえ方の落ち込みが大きく、低周波数帯域よりも高周波数帯域の音がより聞こえにくくなる。

　また、高齢者は、過補充現象（オーバーリクルートメント現象）によって大きな音が若年者よりも大きく聞こえ、煩わしさを感じることがある。図１５は、過補充現象による音の聞こえ方の一例をモデル的に示す図である。図１５に示すように、高齢者の場合、例えば６０ｄｂＳＰＬを超えた当たりから聞こえる音圧が急減に立ち上がり、８０ｄＢＳＰＬ程度で正常者（例えば若年者）と同じ程度の音圧で聞こえるようになる。そして８０ｄＢＳＰＬを超えると、正常者よりも大きな音として感じてしまう。つまり小さな音は聞こえにくいにもかかわらず、大きな音がより大きく聞こえてしまう、という現象が見られる。このような現象は、個人差はあるものの高齢者特有の現象であるといえる。

　つまり、高齢者は、小さい音量では音が聞こえにくいため、ボーカルやセリフの人の声がよくわからなくなるという問題があり、さらに高齢者は、音量に応じて音の聞こえ方が変わるため、小さい音量で人の声を強調する制御を行ったとしても、大きい音量では若年者よりも大きな音に聞こえて逆に煩わしさを感じる、という問題が生じる。
　従って、放送波や再生中のコンテンツについては、状況に応じて、音声（人の声）を強調して騒音や音楽などを抑制する必要があり、このときに音量の増減があっても煩わしさを感じないように出力音声特性を最適に制御する必要がある。

　例えば、特許文献１には、小音量時にはボーカル／セリフが明瞭に聴こえるように強調されるとともに、中音量以上では原音のバランスを保ちつつ適正に強調されるようにしたボーカル音帯域強調回路が開示されている。このボーカル音帯域強調回路は、Ｌ／Ｒチャンネル信号から両者の同相成分Ａを取り出す同相成分抽出回路と、同相成分Ａからボーカル音帯域Ｂを抽出するバンドパスフィルタと、ボーカル音帯域Ｂから所定の周波数成分Ｃを吸収減衰させるノッチフィルタと、その出力信号Ｄを増幅し出力信号Ｅを出力する自動レベルコントロール回路（ＡＬＣ）と、その増幅レベルを制御するマイクロコンピュータと、出力信号Ｅと入力のＬ／Ｒチャンネルを合成してボーカル音帯域強調Ｌ／Ｒチャンネルの信号Ｌｏｕｔ、Ｒｏｕｔとして出力する第１、第２の合成回路を備えている。そして、マイクロコンピュータは、原オーディオ信号の信号レベル及び／又は設定音量値を判断して、自動レベルコントロール回路の増幅レベルを略反比例の関係に制御する。

特開２００５－８６４６２号公報

　上記のように、高齢者特有に見られる聴覚機能の特徴に対応して、高齢者が快適に再生音声を聞くことができるようにするためには、状況に応じて、音声（人の声）を強調して騒音や音楽などを抑制する必要があり、このときに音量の増減があっても煩わしさを感じないように出力音声特性を最適に制御する必要がある。
　特許文献１は、自動レベルコントロール（ＡＬＣ）の一般的な制御方法を開示するものであり、高齢者の聴力機能の低下に起因する聞こえにくさや煩わしさを解消するために音声特性を最適化する技術思想については、何ら開示されていない。

　本発明は、上述のごとき実情に鑑みてなされたもので、音声再生を行う際に、高齢者特有の聴力機能に対して最適な状態で音声が聞こえるように制御することができる音声再生装置、音声再生方法及びプログラムを提供することを目的とするものである。

　上記課題を解決するために、本発明の第１の技術手段は、入力した音声信号の周波数特性を設定する周波数特性設定手段と、音声信号を音声出力する際の音量を可変制御する音量設定手段とを有する音声再生装置であって、周波数特性設定手段は、人の声の帯域を含む音声帯域を強調し、または、音声帯域以外の帯域を減衰し、音量設定手段は、ダイナミックレンジを圧縮することを特徴としたものである。

　第２の技術手段は、入力した音声信号の周波数特性を設定する周波数特性設定手段と、音声信号を音声出力する際の音量を可変制御する音量設定手段とを有する音声再生装置であって、周波数特性設定手段が、音量設定手段より設定される音量の増大に応じて、人の声の帯域を含む音声帯域が強調された周波数特性から、周波数に応じたゲインの特性が徐々に平坦となる周波数特性に変更することを特徴としたものである。

　第３の技術手段は、第２の技術手段において、音声帯域が、略１ｋＨｚ～８ｋＨｚの範囲とすることを特徴としたものである。

　第４の技術手段は、第２または第３の技術手段において、聴取者が高齢者か若年者かをユーザ操作に応じて選択する聴取者選択手段を有し、高齢者が選択されている場合に、音量設定手段により設定された音量の増大に応じて、周波数特性を変更することを特徴としたものである。

　第５の技術手段は、入力した音声信号のダイナミックレンジを設定するダイナミックレンジ設定手段と、音声信号を音声出力する際の音量を可変制御する音量設定手段とを有する音声再生装置であって、ダイナミックレンジ設定手段は、音量設定手段より設定される音量の増大に応じて、ダイナミックレンジの圧縮率が徐々に高くなるように変更することを特徴としたものである。

　第６の技術手段は、第５の技術手段において、聴取者が高齢者か若年者かをユーザ操作に応じて選択する聴取者選択手段を有し、高齢者が選択されている場合に、音量設定手段により設定された音量の増大に応じて、ダイナミックレンジの圧縮率を変更することを特徴としたものである。

　第７の技術手段は、複数のチャンネルにそれぞれ対応する複数の音声信号から、共通成分を抽出する手段と、複数の音声信号のそれぞれから共通成分を減算して、共通成分以外の成分を抽出する手段と、抽出した共通成分と前記共通成分以外の成分のゲインを変更して混合する手段と、音声信号を音声出力する際の音量を可変制御する音量設定手段とを有する音声再生装置であって、音量設定手段より設定される音量の増大に応じて、共通成分のゲインを小さくすることを特徴としたものである。

　第８の技術手段は、第７の技術手段において、聴取者が高齢者か若年者かをユーザ操作に応じて選択する聴取者選択を有し、高齢者が選択されている場合に、音量設定手段により設定された音量の増大に応じて、音量設定手段により設定された音量の増大に応じて、混合割合とゲインを変更することを特徴としたものである。

　第９の技術手段は、入力した音声信号の周波数特性を設定し、音声信号を音声出力する際の音量を可変制御する音声再生装置により実行される音声再生方法であって、音声再生装置が、人の声の帯域を含む音声帯域を強調し、または、音声帯域以外の帯域を減衰し、ダイナミックレンジを圧縮するステップを有することを特徴としたものである。

　第１０の技術手段は、入力した音声信号の周波数特性を設定し、音声信号を音声出力際の音量を可変制御する音声再生装置により実行される音声再生方法であって、音声再生装置が、音声出力の際に設定される音量の増大に応じて、人の声の帯域を含む音声帯域が強調された周波数特性から、周波数に応じたゲインの特性が徐々に平坦となる周波数特性に変更するステップを有することを特徴としたものである。

　第１１の技術手段は、入力した音声信号のダイナミックレンジを設定し、音声信号を音声出力際の音量を可変制御する音声再生装置によって実行する音声再生方法であって、音声再生装置が、音声出力の際に設定される音量の増大に応じて、ダイナミックレンジの圧縮率が徐々に高くなるように変更するステップを有することを特徴としたものである。

　第１２の技術手段は、複数のチャンネルにそれぞれ対応する複数の音声信号から、共通成分を抽出し、複数の音声信号のそれぞれから共通成分を減算して、共通成分以外の成分を抽出し、抽出した共通成分と共通成分以外の成分のゲインを変更して混合することで、音声信号を音声出力する際の音量を可変制御する音声再生装置により実行する音声再生方法であって、音声再生装置が、設定される音量の増大に応じて、共通成分のゲインを小さくするステップを有することを特徴としたものである。

　第１３の技術手段は、第１～８のいずれか１の音声再生装置の機能をコンピュータにより実現させるためのプログラムである。

　本発明によれば、音声再生を行う際に、高齢者特有の聴力特性に対して最適な状態で音声が聞こえるように制御することができる音声再生装置、音声再生方法、及びプログラムを提供することができる。

本発明による音声再生装置の第１の実施形態の構成例を示す図である。図２は、図１の係数ａ１～ｂ２係数テーブルの設定例を示す図である。イコライザ部における周波数特性の設定例を示す図である周波数略１ｋＨｚ～８ｋＨｚの周波数帯域のゲインを他の周波数帯域に比較して大きくして強調させるときの効果を説明するための図である。音量に連動して変更させる周波数特性の例を模式的に示す図である高齢者向けの再生音圧のレンジ幅の設定例を示す図である。若者向けの再生音圧のレンジ幅の設定例を示す図である。本発明の音声再生装置の第２の実施形態を説明するための図である。図７のＤＲＣ閾値テーブルとゲインテーブルの設定例を示す図である。音量に連動して変更させるダイナミックレンジ圧縮特性の設定例を説明するための図である。本発明に係る音声再生装置の第３の実施形態を示すブロック図である。図１０の構成における共通成分を説明するための図である。図１０の構成におけるゲインテーブルの設定例を示す図である加齢による聴力低下の状態をモデル的に示す図である。過補充現象による音の聞こえ方の一例をモデル的に示す図である。

　［実施形態１］
　本発明に係る音声再生装置の第１の実施形態は、入力音声信号を再生して音声出力する音声再生装置において、音声出力の音量が相対的に小さいときには、イコライザによって人の声に相当する音声帯域の周波数を強調し、音声再生装置の音量が上がっていくに従って、徐々に出力音声の周波数帯域を変更して平坦（周波数方向に平坦）にしていくことを特徴とする。このために本実施形態では、入力音声信号の周波数特性を変更するイコライザを使用して、音声出力の音量に応じてイコライザにより音声信号の周波数特性を変化させる。

　図１は、本発明による音声再生装置の第１の実施形態の構成例を示す図で、入力音声信号の周波数特定を変更するイコライザ部の構成例を示すものである。本発明に係る音声再生装置の実施形態は、放送信号を受信して出力する手段を有する装置、例えばテレビやＰＣなどの装置に適用することができる。あるいはレコーダなどの外部記録装置や外部メモリなどから入力される入力音声信号、あるいはネットワークを介して外部から入力される音声信号などを再生する装置に適用することができる。図１に示すイコライザ部では、入力音声信号の周波数特性を変換して出力する。そして音声信号は、図示しないアンプによって増幅され図示しないスピーカから音声出力される。
　本実施形態の音声再生装置は、ユーザ操作に応じてスピーカからの出力音声の音量設定を可能とする音量設定手段を有し、イコライザ部１０では、その音量に応じて周波数特性を変化させて出力する、また、音量に応じた周波数特性の変化は、音声再生装置の最大出力音圧情報に基づいて決定される。

　本例のイコライザ部１０は、バイクアッド（２次伝達関数）デジタルフィルタ１１ａ～１１ｃを３段にカスケード接続して構成されたパラメトリックイコライザであり、音声周波数帯域を数分割することによって、それぞれの帯域ごとに通過レベルのゲイン等のパラメータを調整できるイコライザである。
　イコライザ部１０には、係数ａ１～ｂ２選択部２１，２３が設けられる。係数ａ１～ｂ２選択部２１，２３は、後段の２つのバイクアッドデジタルフィルタ１１ｂ，１１ｃの係数ａ１～ｂ２（ａ１，ａ２，ｂ１，ｂ２）を、音声再生装置の音量情報と、当該音声再生装置の最大出力音圧情報とに基づいて選択し、イコライザ部１０の特性を変更する。これら係数ａ１～ｂ２の係数選択は、音声再生装置のメモリ等の記憶手段に予め係数テーブル２２，２４を記憶させておき、その係数テーブルから上記音量情報と最大出力音圧情報とに基づいて係数を選択する。また、１段目のバイクアッドデジタルフィルタ１１ａは、ハイパスフィルタとして用いる。

　それぞれのバイクアッドデジタルフィルタ１１（１１ａ～１１ｃ）は、混合器１２，１３と、２つの遅延素子１４、１５とを備えている。処理の一例を説明すると、まず入力側の混合器１２を入力信号で初期化し、第１遅延素子１４の後側の値Ｄ１と係数ａ１との積を混合器１２から減算する。さらに第２遅延素子１５の後側の値Ｄ２と係数ａ２との積を混合器１２から減算する。これにより混合器１２の値Ｄ０が決定される。
　そして、出力側の混合器１３を、入力側の混合器１２の値Ｄ０と係数ｂ０との積で上書きし、第１遅延器１４の後側の値Ｄ１と係数ｂ１１との積を出力側の混合器１３に加算する。さらに第２遅延器１５の後側の値Ｄ２と係数ｂ２との積を混合器１３に加算する。

　次に各遅延素子１４，１５の作用により各値を更新する。すなわち、第２遅延素子１５の前側の値Ｄ１で後側の値Ｄ２を更新し、第１遅延素子１４の前側の値Ｄ０で後側の値Ｄ１を更新する。さらに入力側の混合器１２の値で、出力側の混合器１３の値を更新する。
　イコライザ部１０では、このような各バイクアッドデジタルフィルタ１１の処理を段数分反復し、出力側の混合器１３の出力を出力信号として出力する。

　上記のごとくの構成により、各バイクアッドデジタルフィルタ１１の係数を選択することによって、周波数帯域ごとのレベルと先鋭度を変化させることができる。上記のごとくのイコライザ部の構成および動作は従来公知の技術であるが、本発明に係る実施形態では、音声再生装置のイコライザ部１０の係数を、当該音声再生装置の音量情報と、最大出力音圧情報とによって制御することで、高齢者に最適な周波数特性の音声を音量に応じて設定することができるようになる。

　図２は、図１の係数ａ１～ｂ２係数テーブルの設定例を示す図である。
　２段目のバイクアッドデジタルフィルタ１１ｂの係数選択を行う第１の係数ａ１～ｂ２選択部２１が使用する第１のａ１～ｂ２係数テーブル２２は、再生機最大出力のレベルごとに、音量に応じた係数が設定されている。例えば、図２（Ａ）に示すように、再生機最大出力レベル１のとき、音量１では、係数ａ１＝０.９、・・・ｂ２＝０.６のように定められる。音量２以降も同様に音量６０まで係数が定められている。なお、この例では、音量１～６０は、単に音声出力レベルを６０段階に設定したものを表している。また、再生機最大出力レベル１、２・・・についても予め定めたレベルに相当する固有の番号を割り当てたものを示している。

　３段目のバイクアッドデジタルフィルタ１１ｃに対しても２段目と同様の構成を有している。すなわち、３段目のバイクアッドデジタルフィルタ１１ｃの係数選択を行う第２の係数ａ１～ｂ２選択部２３が使用する第２のａ１～ｂ２係数テーブル２４は、再生機最大出力のレベルごとに、音量に応じた係数が設定されている。例えば、図２（Ｂ）に示すように、再生機最大出力レベル１のとき、音量１では、係数ａ１＝０.６、・・・ｂ２＝０.８のように定められる。音量２以降も同様に音量６０まで係数が定められている。

　また、１段目のフィルタは、ハイパスフィルタ（ＨＰＦ）として機能し、ゲインは常にゼロで、カットオフ周波数（Ｆｃ）とＱ（Quality factor）のみで、その出力特性が決定される。
　１段目～３段目までのパラメトリックイコライザを経ることで調整された特性をもつ音声信号がイコライザ部１０から出力される。

　再生機最大出力音圧は、それぞれの再生装置が再生できる最大の音圧レベル（単位：ｄＢ　ＳＰＬ「Sound pressure level」）を示している。例えば、家庭用電気機器では、商品スペックとして、定格出力（Ｗ）を保障しているが、スピーカを駆動するアンプのこの定格出力は例えば２チャンネルの場合、１０Ｗ＋１０Ｗ、５Ｗ＋５Ｗなど、音声再生装置の機種により異なるスペックを持っている。このアンプの定格出力と音声再生装置のスピーカの能率［ｄＢ／Ｗ／ｍ］＝［ｄＢＳＰＬ］との関係により、再生装置の最大の出力音圧が決まる。

　例えば、１チャンネルあたりの定格が１０Ｗで、スピーカの能率が８０ｄＢ／Ｗ／ｍの場合、再生機最大出力音圧は９０ｄＢＳＰＬとなる。１０Ｗ＋１０Ｗの２チャンネルの場合は、同位相の信号で測定すると約９６ｄＢＳＰＬとなる。
　一方、前述の図１５に示した音圧、あるいは後述する図６，７，１０等に示す音圧は、電気的な特性ではなく、音声再生装置のスピーカから出力される音圧をどのように制御するかを示したものである。ボリュームの目盛が同じ位置（例えば６０のｍａｘ値）であるとすると、例えば、定格が５Ｗで、スピーカの能率が８０ｄＢ／Ｗ／ｍの場合は、８５ｄＢＳＰＬとなるので、定格が１０Ｗで、スピーカの能率が８０ｄＢ／Ｗ／ｍの場合と比較すると、５ｄＢＳＰＬ低い音圧となるが、ＤＲＣの閾値やゲインは図６，７，１０，１５等が示すレンジに圧縮すればよいので、５ｄＢＳＰＬ分低い制御が必要となる。すなわち、音声再生装置が何Ｗ＋何Ｗの定格出力を持っていて、能率が何ｄＢＳＰＬのスピーカを備えているかによって、聴取者の耳に届く音圧レベルが異なるため、（定格の種類）×（スピーカの能率の種類）の組み合わせにより生じる種類数のテーブルが必要となる。

　図３は、上記イコライザ部における周波数特性の設定例を示す図である。上記のように、本実施形態では、イコライザ部１０のバイクアッドデジタルフィルタ１１に設定する係数を音量に応じて最適化している。図３の例は、音量が中程度のときの周波数特性（図３（Ａ））と、このときの係数の値（図３（Ｂ））を示している。
　図３（Ａ）に示す例では、出力音声のうち、人の声に相当する周波数帯域であって、特に高齢者が聞こえにくくなってくる周波数帯域を強調して良く聞こえるように制御してある。ここでは、一般的に人の声の帯域の高次フォルマントに相当する周波数略１ｋＨｚ～８ｋＨｚの周波数帯域のゲインを周波数帯域に比較して大きくして強調させる。ここで８ｋＨｚ以上の周波数帯域についても強調させるようにしてもよいが、特に高齢者では、このレベルの高い周波数帯域の音は非常に聞こえにくくなっているので、音圧を上げてもよく聞こえるようになるとは限らない。また、高い周波数帯域を強調すると、出力された音声信号のピーク成分が飽和し、信号波形がクリップした状態となることがあるため、無理して強調する必要はない。このような観点から、中程度の音量のときには図３（Ａ）に示すような周波数特性が得られるようにイコライザ部１０の係数を設定している。図３（Ｂ）は、このときの係数の設定例を示すもので、１～３（１段目から３段目）のそれぞれのパラメトリックイコライザに設定する係数の例を示している。

　１段目のハイパスフィルタは、例えばカットオフ周波数が１６０Ｈｚであり、周波数とゲイン［ｄＢ］との関係をみれば、１段目のハイパスフィルタの特性は、周波数が３００Ｈｚ以上では平坦となる。高齢者は、３００Ｈｚ以下のような低周波数域の音声に対しては、若年者と同じ程度の聴力があり、過補充現象も発生しないためである。ここで、イコライザ部の周波数特性は、人の声に相当する周波数帯域以外の効果音や雑音を含む特に低域側の周波数特性を削減しているため、１段目のハイパスフィルタの特性は、全ての周波数帯域で平坦にしない方が好ましく、例として、上記のようなカットオフ周波数を設定する。

　図４は、周波数略１ｋＨｚ～８ｋＨｚの周波数帯域のゲインを他の周波数帯域に比較して大きくして強調させるときの効果を説明するための図である。
　普通の人間の声は、図４のＳ１に示すような周波数上のＡ，Ｂ，Ｃ，Ｄにエネルギーが集中する特徴的な周波数分布となっている。これらＡ，Ｂ，Ｃ，Ｄをそれぞれ基本周波数、第１フォルマント、第２フォルマント、第３フォルマントと呼んでいる。一般的に、基本周波数が最も音が強く、フォルマントが高次になるほど減衰する。
　本実施形態では、通常であれば減衰する第１フォルマント、第２フォルマント、第３フォルマントを増幅してＳ２のようにすることで、通りやすい（聞こえやすい）音質に調整する。そして、音量が相対的に低い状態では、周波数が略１ｋＨｚ～８ｋＨｚの中間の周波数領域を相対的に強調し、音量が大きくなっていくに従ってより平坦な形状に変化させる。

　図５は、音量に連動して変更させる周波数特性の例を模式的に示す図である。上述したように、本実施形態では、イコライザ部１０による出力音声の周波数特性を音声再生装置で設定された音量に応じて変換させる。この例では、音量のレベルが例えば１～６０で表されているものとする。図５に示すように、音量が相対的に低い状態では、中間の周波数領域が相対的に強調され、低周波数領域と高周波数領域とが相対的に低くなっている。そして、音量が大きくなっていくに従って、イコライザ部の係数が変化し、周波数特性はより平坦な形状に変わっていく。音量最大（ここではＶＯＬ＝６０）のときには、最低周波数側の一部の領域を除いて、ほぼ平坦な周波数特性となる。つまり、本実施形態では、音量設定手段より設定される音量の増大に応じて、人の声の帯域を含む音声帯域が強調された周波数特性から、周波数に応じたゲインの特性が徐々に平坦となる周波数特性に変更する制御を行う。

　このように、低い音量では、人の声の周波数帯域を相対的に強く強調して高齢者でも人の声を聞こえやすくするとともに、大音量になるに従ってより平坦な周波数特性としていくことで、特定の周波数帯域の強調により生じる煩わしさを抑えて、聞きやすい音声出力を行うことができるようになる。
　また、本実施形態では、高齢者用の再生モードと若年者用の再生モードとを用意し、高齢者用の再生モードがユーザ操作によって選択されたときに、上記のように音量の増大に応じて周波数特性を変更する制御を行うようにしてもよい。このときの高齢者用の再生モードと若年者用の再生モードを選択する手段が本発明の聴取者選択手段に該当する。

［実施形態２］
　高齢者の場合、加齢によって最小可聴限のレベルが上がり、若年に比して小さい音圧の音が聞こえにくくなる。また、心地良く聞こえる音圧の上限側に関しては、前述のように過補充現象が生じる可能性があり、例えば７０～８０ｄＢＳＰＬを超えるような音圧の再生は高齢者に向かない。
　つまり、高齢者にとっては、最適な音圧レベルの領域が若年の人に比べて狭くなるのが一般的である。このような高齢者に対応するために、本実施形態では、高齢者向けの再生音圧のダイナミックレンジを設定する。

　図６は、高齢者向けの再生音圧のレンジ幅の設定例を示す図、図７は、若者向けの再生音圧のレンジ幅の設定例を示す図である。これらは、例えば記録再生装置が適用されたテレビの設定出力音量がｍａｘのときの再生音圧のレンジ幅を示している。
　図６に示すように、本例では、高齢者向けの再生音圧は、上限を７０ｄＢＳＰＬ付近とし、下限を１５ｄＢＳＰＬ付近とする。この理由として、上記のように高齢者は、過補充現象などに説明されるように大きな音圧の再生音を好まないことと、最小可聴限のレベルが高いことがある。これに比べて図７に示すように、若者向けの再生音圧レンジは、上限が８０ｄＢＳＰＬで下限は１０ｄＢＳＰＬ以下とすることができる。広い再生レンジをとっても、若年者は違和感や煩わしさを感じることなく再生音を聞くことができるからである。

　このように本実施形態では、高齢者用の再生音圧のダイナミックレンジを設定する。このときに、高齢者用の再生モードと若年者用の再生モードとを用意し、ユーザ操作によって適宜これらのモードを切り替えるようにしてもよい。
　そして、本実施形態では、音声再生装置の音量の変化に従って、高齢者用の再生音圧のダイナミックレンジの圧縮率を変更する。より具体的には、音声再生装置の音量の増大に伴ってダイナミックレンジの圧縮率を増大させる。これにより、大音量のときにも高齢者が過補充現象に起因する煩わしさを感じることなく、再生音声を聞くことができるようになる。

　図８は、本発明の音声再生装置の第２の実施形態を説明するための図である。
　本実施形態の音声再生装置は、入力音声信号のダイナミックレンジを圧縮するダイナミックレンジ圧縮器３１と、ダイナミックレンジ圧縮器３１からの出力音声信号の増幅・減衰を行う増幅・減衰器３２とを備えている。そしてダイナミックレンジ圧縮器３１の閾値を選択するＤＲＣ（ダイナミックレンジ圧縮）閾値選択部３３と、増幅・減衰器３２におけるゲインを選択するゲイン選択部３４とを有し、これらＤＲＣ閾値選択部３３とゲイン選択部３４は、音声再生装置の音量情報と再生機最大出力音圧情報とに基づいて、ダイナミックレンジ圧縮器３１の閾値選択および増幅・減衰器３２のゲイン選択を行う。

　ダイナミックレンジ圧縮器３１と増幅・減衰器３２は、入力された音声信号の信号レベルに基づいて、出力される音声信号のレベルを変化させる。ダイナミックレンジ圧縮器３１は、例えば、入力された音声信号の周波数が閾値に達するまでは、入力信号レベルに正比例したレベルの音声信号を出力し、音声信号の周波数が閾値を超えた場合には、入力信号レベルに対して減衰されたレベルの音声信号を出力する。増幅・減衰器３２は、ダイナミックレンジから出力された音声信号を設定されたゲインに従って増幅／減衰して出力する。閾値を操作することによって、ダイナミックレンジの圧縮率（レンジ幅）を任意に変えることができる。

　このようなダイナミックレンジ圧縮器３１と増幅・減衰器３２の構成により、音声信号の信号レベルに応じて、入力音声信号全体としてのダイナミックレンジを適切に圧縮し、音声信号の再現をより適確に実行できるようにしている。また、ダイナミックレンジ圧縮器３１および増幅・減衰器３２を組み合わせたＡＬＣ（オートレベルコントロール）として構成することもできる。

　ＤＲＣ閾値選択部３３により選択する閾値は、メモリ等の記憶手段に予めＤＲＣ閾値テーブル３５として記憶させておくことができる。この場合、ＤＲＣ閾値テーブル３５には、再生機最大出力のレベルごとに、音量に応じた閾値が設定されている。図９（Ａ）にＤＲＣ閾値テーブルの設定例を示す。ここでは、再生機最大出力レベル１のとき、音量１では閾値は－５ｄＢ、音量２では閾値は－６ｄＢが定められる。音量２以降も同様に音量６０まで閾値が定められている。なお、実施形態１と同様に、音量１～６０は、単に音声出力レベルを６０段階に設定したものを表しており、再生装置最大出力レベル１、２・・についても予め定めたレベルに相当する固有の番号を割り当てたものを示している。

　また、ゲイン選択部３４により選択するゲインは、メモリ等の記憶手段に予めゲインテーブル３６として記憶させておくことができる。この場合、ゲインテーブル３６には、再生機最大出力のレベルごとに、音量に応じたゲインが設定されている。図９（Ｂ）にゲインテーブルの設定例を示す。ここでは、再生機最大出力レベル１のとき、音量１ではゲインは１.５、音量２ではゲインは１.４、のように定められる。音量２以降音量６０においても同様にゲインが定められている。なお、この例においても、音量１～６０は、単に音声出力レベルを６０段階に設定したものを表している。また、再生装置最大出力レベル１、２・・についても予め定めたレベルに相当する固有の番号を割り当てたものを示している。

　上記のような構成により、本実施形態では、記録再生装置の音量情報と、最大出力音圧情報とに基づいて、ＤＲＣ閾値選択部３３がＤＲＣ閾値テーブル３５から閾値を選択し、ダイナミックレンジ圧縮器３１における圧縮特性を変更し、またゲイン選択部３４により選択したゲインによって増幅・減衰率を最適化する。

　図１０は、音量に連動して変更させるダイナミックレンジ圧縮特性の設定例を説明するための図である。ダイナミックレンジ圧縮器３１においてダイナミックレンジの圧縮率を変化させない場合には、記録再生装置の音量が大きくなるに従って上限の音圧も上昇していく。これに対して本実施形態では、音声再生装置の音量の増大に従って、ダイナミックレンジの圧縮率を変更する。具体的にはダイナミックレンジ圧縮器３１に対する閾値を低く設定することにより、ダイナミックレンジの圧縮率を大きくしていく。このとき、音量の増大に対するダイナミックレンジの圧縮率は非線形で増大していくようにする。つまり音量が大きくなるに従って、音量に対する圧縮率の傾きがより大きくなるようにする。
　例えば、図１０に示すように、音量２０のときの圧縮上限Ｃ１を３５ｄＢＳＰＬ付近とするとき、記録再生装置の音量が上げられて音量５０になったときには、圧縮上限Ｃ２を７０ｄＢＳＰＬ弱とする。さらに、本例の最大音量である音量６０になったときには、圧縮上限Ｃ３は７０ｄＢＳＰＬ強の付近となる。

　このとき、ダイナミックレンジの圧縮率が一定であれば音量の増大に伴って圧縮上限が増大していき、高齢者にとって煩わしさを感じることがある音圧（例えば７０～８０ｄＢＳＰＬ以上）になる。これに対して、本実施形態では、音量の増大に応じた圧縮上限の増大を非線形に押さえ込むことで、音量の増大に伴ってダイナミックレンジ幅を小さくする。つまり音量の増大に伴ってダイナミックレンジ圧縮率を増大させる。
　これによって、音声再生装置の音量が大きくなっても、再生される最大音圧のレベルが一定レベル以下（本例では、音量ｍａｘで７０ｄＢＳＰＬ付近以下）に抑えられ、高齢者が煩わしさを感じることなく、再生音声を聞くことができる。

　また、高齢者向けの再生音声のダイナミックレンジは、図６に示すように下限値についても若年者向けよりも高く設定する。これは、小さい音量の音声信号が入力した場合にも、出力値を持ち上げて高めの音圧で再生することを意味する。この下限値の設定は、図８の増幅・減衰器３２に対するゲイン設定により行う。この場合、入力音声信号の信号振幅に異存しない固定値を設定しておくことで、ダイナミックレンジの下限値の音圧レベルを持ち上げるようにする。
　このように本実施形態では、ダイナミックレンジ圧縮器３１に対する閾値選択によって、ダイナミックレンジの上限値を押さえ込むことで、再生装置の音量増大に伴ってダイナミックレンジの圧縮率を増大させ、そして増幅・減衰器３２へのゲイン設定によってダイナミックレンジの下限値を持ち上げるようにする。この結果、高齢者にとって最適なダイナミックレンジで音声再生を実行することができるようになる。

［実施形態３］
　本実施形態の音声再生装置は、入力音声の複数のチャンネルから共通成分を抽出し、各チャンネル成分から共通成分を減算して共通成分以外の成分を算出し、抽出した共通成分と共通成分以外の成分との割合を変更してミキシングする装置として構成される。
　この構成によって、例えば、人の声の音声信号を共通成分として取り出すようにする。人の声の音声信号は、例えば集音マイクで集音することで中央に低位するように録音され、ＬチャンネルとＲチャンネルとに振り分けられる。このような音声信号からＬチャンネルとＲチャンネルとの共通成分を取り出すことで、人の声を含む共通成分を得ることができる。

　本実施形態は、人の声を含む共通成分と、共通成分以外の成分との割合を高齢者向けに最適化したものである。特に、人の声を含む共通成分と共通成分以外の成分との割合及びゲインを、音声再生装置の音量に応じて変更する。具体的には、記録再生装置の音量が小さいときには、共通成分のゲインを大きくすることによって、共通成分の混合割合を高くし、人の声を含む共通成分を強調する。これにより、小さい音量では人の声が聞き取りやすくなる。また、記録再生装置の音量が大きくなったときには、人の声を含む共通成分のゲインを小さくしていくことにより、共通成分以外の成分との割合が均等になるように変更し、大音量時の過補充現象に起因する煩わしさを感じにくくすることができる。

　図１１は、本発明に係る音声再生装置の第３の実施形態を示すブロック図である。本実施形態に係る音声再生装置は、入力音声を共通成分と共通成分以外の成分とに分離し、これらの成分の混合比とゲインを調整する機能を有する音声信号変換部４０を備えている。
　音声信号変換部４０は、スペクトル変換部４２（４２ａ，４２ｂ）、共通成分抽出部４３、乗算部４４（４４ａ，４４ｂ，４４ｃ）、逆変換部４５（４５ａ，４５ｂ，４５ｃ）、減算器４７，４８、入力端子４１ａ，４１ｂ、出力端子４６ａ，４６ｂ、および加算器４９，５０を備えている。

　音声信号変換部４０には、複数のチャンネルにそれぞれ対応する複数の音声信号が入力する。この例では、音声信号変換部４０には、ＰＣＭ（Pulse Code Modulation）によってデジタル符号化された２チャンネルの音声信号が入力される。２チャンネルの音声入力信号としては、例えば、テレビ放送におけるステレオ音声信号などがある。ステレオ放送などでは、通常、入力された２チャンネルの音声信号に基づいてテレビなどの音声再生装置に備えられている左右のスピーカに対して異なる音声信号が供給され、各スピーカから異なる音声が出力される。左チャンネルに対応する左側音声信号、および右チャンネルに対応する右側音声信号は、それぞれ、入力端子４１ａ，４１ｂから音声信号変換部４０に入力され、音声信号変換部４０から出力された音声は、左右スピーカによって音声出力される。

　スペクトル変換部４２ａは、入力端子４１ａを介して入力された右側音声信号を、例えば１フレームあたり１０２４サンプルに分割する。音声信号のサンプリング周波数が４４.１ｋＨｚの場合、１フレームあたりの時間は、２３ｍｓ（＝（１÷４４１００）×１０２４）となる。次に、スペクトル変換部４２ａは、フレーム分割された音声信号に対し、ハニング窓などの窓関数を掛ける。窓関数を適用することにより、フレーム分割された音声信号についての周波数解析の誤差を低減できる。本実施形態に適用する窓関数としては、ハニング窓に限定されることはない。

　次に、スペクトル変換部４２ａは、フレームごとに、窓関数が適用された音声信号に対して高速フーリエ変換（ＦＦＴ：Fast Fourier Transform）を行い、時間領域の音声信号を周波数領域のデータ、すなわち、スペクトル（以下では、右側音声信号スペクトルと呼ぶ）に変換して、共通成分抽出部４３と減算器４７に出力する。

　また、スペクトル変換部４２ｂは、スペクトル変換部４２ａと同様の処理により、入力端子４１ｂを介して入力された左側音声信号のスペクトル（以下では、左側音声信号スペクトルと呼ぶ）を算出し、共通成分抽出部４３と減算器４８とに出力する。
　ここでは、ＦＦＴに代えて修正離散コサイン変換（ＭＤＣＴ：Modified Discrete Cosine Transform）によって周波数スペクトルを算出する構成であってもよく、スペクトル変換の手法は特に限定はされない。

　共通成分抽出部４３は、右側音声信号スペクトルと左側音声信号スペクトルとの共通成分を抽出する。図１２は、共通成分を説明するための図で、図１２（Ａ）は右側音声信号スペクトルと左側音声信号スペクトルとの共通成分を示す図であり、図１２（Ｂ）は共通成分のみを示す図である。共通成分抽出部４３は、共通成分スペクトルＣ（ｋ）をＣ（ｋ）＝ＭＩＮ（ＸＬ（ｋ），ＸＲ（ｋ））（ＸＬ（ｋ）は左側音声信号スペクトル、ＸＲ（ｋ）は右側音声信号スペクトル）によって算出し、減算器４７，４８、および乗算部４４ｂに出力する。ここでは、共通成分抽出部４３は、ＸＲ（ｋ）とＸＬ（ｋ）との小さいほうのスペクトルを共通成分として抽出している。

　上述したように、音声信号変換部４０には、ステレオ放送の番組などにおける２チャンネルの入力信号が入力される。一般的なステレオ放送の番組では、音声は音声収録用の１チャンネルマイクによって収録され、ボーカルを除くＢＧＭや効果音等は、予め左右の２つのマイク（ステレオ）で収録されている。これら３つのマイクによって録音された番組を２チャンネルでステレオ放送する場合、３チャンネルの信号を２チャンネルにダウンミックスすることになる。すなわち、音声収録用の１チャンネルマイクによって録音された人の声の音声信号は、左右の２つのマイクによって録音された周囲の音の信号とミックスされて、２チャンネルの音声信号が送出されることになる。

　このとき、人の声の信号と周囲の音の信号とをミックスする比率は、放送局において設定される。この場合、右側音声信号は、右マイクおよび音声収録用の１チャンネルマイクによって録音された音声をミックスした音声信号である。また、上記の左側音声信号は、左マイクおよび音声収録用の１チャンネルマイクによって録音された音声をミックスした音声信号である。そのため、人の声を表す音声信号は、左側音声信号、および右側音声信号に共通して含まれる。なお、ボーカルを含む音楽の場合、音声収録用の１チャンネルマイクによってボーカルが収録され、楽器音は左右の２つのマイク（ステレオ）で収録された後、２チャンネルにダウンミックスされる。
　共通成分抽出部４３は、上記のような右側音声信号と左側音声信号に共通して含まれている主として人の声を表す音声信号の成分を、共通成分として抽出する。

　減算器４７は、スペクトル変換部４２ａから出力された右側音声信号スペクトルＸＲ（ｋ）から、共通成分抽出部４３から出力された共通成分スペクトルＣ（ｋ）を減算して、右成分スペクトルＸＲ’（ｋ）を算出し、乗算部４４ａに出力する。同様に減算器４８は、スペクトル変換部４２ｂから出力された左側音声信号スペクトルＸＬ（ｋ）から、共通成分抽出部４３から出力された共通成分スペクトルＣ（ｋ）を減算して、左成分スペクトルＸＬ’（ｋ）を算出し、乗算部４４ｃに出力する。

　乗算部４４ａは、減算器４７から出力されたＸＲ’（ｋ）にゲインＧ１を乗じてＸＲ”（ｋ）（＝Ｇ１×ＸＲ’（ｋ））を算出し、逆変換部４５ａに出力する。また、乗算部４４ｂは、共通成分抽出部４３から出力されたＣ（ｋ）にゲインＧ２を乗じてＣ”（ｋ）（＝Ｍ２×Ｃ（ｋ））を算出し、逆変換部４５ｂに出力する。さらに、乗算部４４ｃは、減算器４８から出力されたＸＬ’（ｋ）にゲインＧ３を乗じてＸＬ”（ｋ）（＝Ｍ１×ＸＬ’（ｋ））を算出し、逆変換部４５ｃに出力する。

　逆変換部４５ｂは、乗算部４４ｂから出力された共通成分Ｃ”（ｋ）を逆ＦＦＴによって時間領域の信号波形に変換し、加算器４９，５０に振り分けて出力させる。
　逆変換部４５ａは、周波数領域の情報である右成分出力スペクトルＸＲ”（ｋ）を逆ＦＦＴによって時間領域の信号波形に変換して出力する。加算器４９は、逆ＦＦＴされた右成分と、逆変換部４５ｂから出力された共通成分とを加算して、右のスピーカに出力する音声出力信号として出力する。
　同様に、逆変換部４５ｃは、周波数領域の情報である左成分出力スペクトルＸＬ”（ｋ）を逆ＦＦＴによって時間領域の信号波形に変換して出力する。加算器５０は、逆ＦＦＴされた左成分と、逆変換部４５ｂから出力された共通成分とを加算して、左のスピーカに出力する音声出力信号として出力する。

　ここでは、共通成分スペクトルに適用するゲインＧ２は、１≦Ｍ１を満足する値であり、共通成分以外の成分スペクトル（右成分スペクトルＸＲ´（ｋ），左成分スペクトルＸＬ´（ｋ））に適用するゲインＧ１，Ｇ３は、０≦Ｍ１≦１を満足する値である。各乗算部４４ａ，４４ｂ，４４ｃでは、これらのゲインを乗算値として入力成分のスペクトルに乗算することで、共通成分スペクトルと、共通成分以外のスペクトルとの混合割合とゲインを変更させることができる。

　各乗算部４４ａ，４４ｂ，４４ｃに設定するゲインは、ゲイン選択部５１によって選択する。ゲイン選択部５１で選択するゲインの値は、メモリ等の記憶手段に予めゲインテーブル５２として記憶保持する。ゲインテーブル５２には、再生機最大出力のレベルごとに、音量に応じたゲインが設定されている。
　図１３は、ゲインテーブルの設定例を示す図である。ここでは、再生機最大出力レベル１のとき、音量１では乗算部４４ａ（乗算部（１）とする）のゲインは０.７、乗算部４４ｂ（乗算部（２）とする）のゲインは１.５、乗算部４４ｃ（乗算部（３）とする）のゲイン０.７に設定されている。音量２以降についても、同様にそれぞれの乗算部４４ａ～４４ｃで乗算すべきゲインが設定されている。音量１～６０は、単に音声出力レベルを６０段階に設定したものを表している。また、再生機最大出力レベル１、２・・についても予め定めたレベルに相当する固有の番号を割り当てたものを示している。

　ゲイン選択部５１は、音声再生装置の音量情報と、音声再生装置の最大出力音圧情報とを入力し、ゲインテーブルを参照して該当するゲイン値を抽出して、各乗算部４４ａ～４４ｃに設定する。これにより、共通成分スペクトルと、共通成分以外のスペクトルとの混合割合とゲインを音声再生装置の音量に応じた値とすることができる。

　ゲインテーブル５２に設定されたゲインは、音声再生装置の音量が小さいときには、人の声を含む共通成分の割合を高くし、かつゲインによって共通成分が強調される値となっている。また、音声再生装置の音量が大きくなるに従って、人の声を含む共通成分のゲインを小さくし、共通成分以外の成分のゲイン大きくしていくことで、共通成分のゲインと共通成分以外の割合が徐々に均等になるように変更し、再生させるようにしている。

　例えば図１３の例では、小音量の音量１のときには、共通成分以外の乗算部４４ａ，４４ｃのゲインは０.７であり、共通成分の乗算部４４ｂのゲインは１.５である。これにより、乗算部４４から出力される共通成分と、共通成分以外の成分との比が１.５：０.７となる。これは共通成分の割合が大きく、共通成分のゲインが１.５になって強調されて出力されることを意味する。
　一方、図１３の例で音量６０のときには、共通成分以外の乗算部４４ａ，４４ｃ、および共通成分の乗算部４４ｂのゲインは全て１.０である。これにより、共通成分と共通成分以外の成分とが同じ割合で出力される。また、共通成分のゲインは１.０であり、強調されていた共通成分のゲインも他の成分と同じレベルに低下している。

　本発明に係る実施形態では、小音量では共通成分のゲインを１以上とし、音声再生装置の音量の増大に応じて、共通成分のゲインを小さくすることにより、共通成分と共通成分以外の成分の混合割合を徐々に均等にする制御を行うことが好ましい。
　このように本実施形態では、小音量では、共通成分の割合とゲインを大きくすることで共通成分に含まれる人の声が聞き取りやすくなり、大音量になったときには、共通成分と共通成分以外の成分とを均等に出力し、かつ共通成分のゲインを低下させていくことで、過補充現象に起因する煩わしさを感じにくくすることができ、高齢者にとって最適な音声出力制御を行うことができる。
　また、上記各実施形態と同様に、高齢者用の再生モードと若年者用の再生モードとを用意し、高齢者用の再生モードがユーザ操作によって選択されたときに、上記のように音量の増大に応じて共通成分とそれ以外の成分の割合及びゲインを変更する制御を行うようにしてもよい。

　本発明の音声再生装置で動作するプログラムは、本発明に係る各手段（あるいは各手段の一部）の機能を実現するようにＣＰＵ等を制御するプログラム（コンピュータを機能させるプログラム）である。このプログラムは、音声再生装置をユーザが使用する際に容易となるように、表示装置用のグラフィカルユーザインタフェース（ＧＵＩ）を備えるようにするとよい。そして、音声再生装置で取り扱われる情報は、その処理時に一時的にＲＡＭに蓄積され、その後、各種ＲＯＭやＨＤＤに格納され、必要に応じてＣＰＵによって読み出し、修正・書き込みが行われる。

　プログラムを格納する記録媒体としては、半導体媒体（例えば、ＲＯＭ、不揮発性メモリカード等）、光記録媒体（例えば、ＢＤ、ＤＶＤ，ＭＯ、ＭＤ、ＣＤ、ＢＤ等）、磁気記録媒体（例えば、磁気テープ、フレキシブルディスク等）等のいずれであってもよい。
　また、ロードしたプログラムを実行することにより、上述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステムあるいは他のアプリケーションプログラム等と共同して処理することにより、本発明の機能が実現される場合もある。また、市場に流通させる場合には、可搬型の記録媒体にプログラムを格納して流通させたり、インターネット等のネットワークを介して接続されたサーバコンピュータに転送することができる。

　本発明に係る音声信号変換装置は、放送中や再生中のコンテンツのボーカルやセリフなどの人の声を強調することができるため、テレビ受像装置などにおいて好適に利用できる。

１０…イコライザ部、１１ａ，１１ｂ，１１ｃ…バイクアッドデジタルフィルタ、１２，１３…混合器、１４…遅延素子、１４，１５…遅延器、１５…遅延素子、２１…第１の係数ａ１～ｂ２選択部、２２…第１の係数ａ１～ｂ２係数テーブル、２３…第２の係数ａ１～ｂ２選択部、２４…第２の係数ａ１～ｂ２係数テーブル、３１…ダイナミックレンジ圧縮器、３２…増幅・減衰器、３３…ＤＲＣ閾値選択部、３４…ゲイン選択部、３５…ＤＲＣ閾値テーブル、３６…ゲインテーブル、４０…音声信号変換部、４１ａ，４１ｂ…入力端子、４２…スペクトル変換部、４２ａ…スペクトル変換部、４２ｂ…スペクトル変換部、４３…共通成分抽出部、４４…乗算部、４４ａ，４４ｂ，４４ｃ…乗算部、４５…逆変換部、４５ａ…逆変換部、４５ｂ…逆変換部、４５ｃ…逆変換部、４６ａ，４６ｂ…出力端子、４７，４８…減算器、４９，５０…加算器、５１…ゲイン選択部、５２…ゲインテーブル。

Claims

　入力した音声信号の周波数特性を設定する周波数特性設定手段と、音声信号を音声出力する際の音量を可変制御する音量設定手段とを有する音声再生装置であって、
　前記周波数特性設定手段は、人の声の帯域を含む音声帯域を強調し、または、前記音声帯域以外の帯域を減衰し、
　前記音量設定手段は、ダイナミックレンジを圧縮することを特徴とする音声再生装置。
　入力した音声信号の周波数特性を設定する周波数特性設定手段と、音声信号を音声出力する際の音量を可変制御する音量設定手段とを有する音声再生装置であって、
　前記周波数特性設定手段は、前記音量設定手段より設定される音量の増大に応じて、人の声の帯域を含む音声帯域が強調された周波数特性から、周波数に応じたゲインの特性が徐々に平坦となる周波数特性に変更することを特徴とする音声再生装置。
　請求項２に記載の音声再生装置において、前記音声帯域は、略１ｋＨｚ～８ｋＨｚの範囲とすることを特徴とする音声再生装置。
　請求項２または３に記載の音声再生装置において、聴取者が高齢者か若年者かをユーザ操作に応じて選択する聴取者選択手段を有し、前記高齢者が選択されている場合に、前記音量設定手段により設定された音量の増大に応じて、前記周波数特性を変更することを特徴とする音声再生装置。
　入力した音声信号のダイナミックレンジを設定するダイナミックレンジ設定手段と、音声信号を音声出力する際の音量を可変制御する音量設定手段とを有する音声再生装置であって、
　前記ダイナミックレンジ設定手段は、前記音量設定手段より設定される音量の増大に応じて、ダイナミックレンジの圧縮率が徐々に高くなるように変更することを特徴とする音声再生装置。
　請求項５に記載の音声再生装置において、聴取者が高齢者か若年者かをユーザ操作に応じて選択する聴取者選択手段を有し、前記高齢者が選択されている場合に、前記音量設定手段により設定された音量の増大に応じて、前記ダイナミックレンジの圧縮率を変更することを特徴とする音声再生装置。
　複数のチャンネルにそれぞれ対応する複数の音声信号から、共通成分を抽出する手段と、前記複数の音声信号のそれぞれから前記共通成分を減算して、前記共通成分以外の成分を抽出する手段と、抽出した前記共通成分と前記共通成分以外の成分のゲインを変更して混合する手段と、音声信号を音声出力する際の音量を可変制御する音量設定手段とを有する音声再生装置であって、
　前記音量設定手段より設定される音量の増大に応じて、前記共通成分のゲインを小さくすることを特徴とする音声再生装置。
　請求項７に記載の音声再生装置において、聴取者が高齢者か若年者かをユーザ操作に応じて選択する聴取者選択手段を有し、前記高齢者が選択されている場合に、前記音量設定手段により設定された音量の増大に応じて、前記音量設定手段により設定された音量の増大に応じて、前記ゲインを変更することを特徴とする音声再生装置。
　入力した音声信号の周波数特性を設定し、音声信号を音声出力する際の音量を可変制御する音声再生装置により実行される音声再生方法であって、
　前記音声再生装置が、人の声の帯域を含む音声帯域を強調し、または、前記音声帯域以外の帯域を減衰し、ダイナミックレンジを圧縮するステップを有することを特徴とする音声再生方法。
　入力した音声信号の周波数特性を設定し、音声信号を音声出力際の音量を可変制御する音声再生装置により実行される音声再生方法であって、
　前記音声再生装置が、前記音声出力の際に設定される音量の増大に応じて、人の声の帯域を含む音声帯域が強調された周波数特性から、周波数に応じたゲインの特性が徐々に平坦となる周波数特性に変更するステップを有することを特徴とする音声再生方法。
　入力した音声信号のダイナミックレンジを設定し、音声信号を音声出力際の音量を可変制御する音声再生装置によって実行する音声再生方法であって、
　前記音声再生装置が、音声出力の際に設定される音量の増大に応じて、ダイナミックレンジの圧縮率が徐々に高くなるように変更するステップを有することを特徴とする音声再生方法。
　複数のチャンネルにそれぞれ対応する複数の音声信号から、共通成分を抽出し、前記複数の音声信号のそれぞれから前記共通成分を減算して、前記共通成分以外の成分を抽出し、抽出した前記共通成分と前記共通成分以外の成分のゲインを変更して混合することで、音声信号を音声出力する際の音量を可変制御する音声再生装置により実行する音声再生方法であって、
　前記音声再生装置が、設定される音量の増大に応じて、前記共通成分のゲインを小さくするステップを有することを特徴とする音声再生方法。
　請求項１～８のいずれか１に記載の音声再生装置の機能をコンピュータにより実現させるためのプログラム。