JP2008527882A - 音声信号の音響レベルを周波数に依存して増幅する信号処理装置及び音声システム及びその方法 - Google Patents

音声信号の音響レベルを周波数に依存して増幅する信号処理装置及び音声システム及びその方法 Download PDF

Info

Publication number
JP2008527882A
JP2008527882A JP2007550887A JP2007550887A JP2008527882A JP 2008527882 A JP2008527882 A JP 2008527882A JP 2007550887 A JP2007550887 A JP 2007550887A JP 2007550887 A JP2007550887 A JP 2007550887A JP 2008527882 A JP2008527882 A JP 2008527882A
Authority
JP
Japan
Prior art keywords
audio signal
frequency
amplification
threshold
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007550887A
Other languages
English (en)
Inventor
ウルマン,パオル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008527882A publication Critical patent/JP2008527882A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F3/00Amplifiers with only discharge tubes or only semiconductor devices as amplifying elements
    • H03F3/68Combinations of amplifiers, e.g. multi-channel amplifiers for stereophonics
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03FAMPLIFIERS
    • H03F2200/00Indexing scheme relating to amplifiers
    • H03F2200/39Different band amplifiers are coupled in parallel to broadband the whole amplifying circuit

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

本発明な、音声信号の音響レベルの周波数に依存する増幅方法に関する。当該方法では音声信号(Sig(f))は少なくとも特定の周波数範囲において複数(n)の周波数帯(f1...f10)に分割され、及び特定の可聴閾値(Th(f1)...Th(f10))は周波数帯(f1...f10)毎に指定され、及び各周波数帯では音響レベルは個々の可聴閾値と比較され、音声信号(Sig(f2)、Sig(f3)、Sig(f4))は、少なくとも、音響レベルが個々の可聴閾値(Th(f2)、Th(f3)、Th(f4))の直下にある周波数帯内で増幅される。本発明は、当該方法を実施する信号処理装置、及び当該信号処理装置を備えた音声システムに更に関する。

Description

本発明は、音声信号の音響レベルの周波数に依存した増幅の方法に関する。
本発明は、当該方法を実施する信号処理装置に更に関する。
本発明は、当該信号処理装置を備えた音声システムに更に関する。
人間の可聴閾値は、周波数の関数であり、約300Hz乃至3kHzの周波数において人間の耳の最大感度の範囲を有することが知られている。可聴閾値は、低周波数において比較的高く(高い音圧が必要である)、より高い周波数では急に可聴上限が達せられるまで僅かに上昇を示す。可聴閾値は若い人々では約18kHzにあり、加齢と共に下降する。
更に、高調波の知覚は、音響又は音響を生成する機器の自然な知覚のために決定的に重要であることが知られている。
明らかな現象は、例えば低音響レベルの音楽のような音響イベントの再生において、音響パターンの成分、言い換えると特定の高調波は、可聴閾値より下に弱められる。聞き手は、「何か足りないもの」を有する、音楽が音楽の雰囲気を何か失っているとして音響パターンを経験し、そして音響は鈍く思える。これらの要因は、音楽が「非常に静かに」聞こえるという印象を生じる。
音楽の再生に関し、更にただ1つの真に正しい音響レベル、つまり実際のイベント、例えば音楽の録音に対応する音響レベルが存在する。しかしながら、再生状況ではしばしば(例えば他者を邪魔することを回避するため)一般に正しい音量より低い音量を選択する傾向にあるので、人は自然度に関し(つまり雰囲気に関し)妥協する。
この制約を是正するため、多くの音声及び音声/ビデオ機器では、所謂「ラウドネス」機能が利用される。このラウドネス機能は、イコライザーのある種の事前選択を表す。イコライザーでは、低周波数にある音響は強く増幅され、高周波数の音響は少し増幅され、及び中位の周波数範囲にある音響は全く増幅されない。このように、低及び高周波数部分は、低音量でも聞こえる。このラウドネス機能に対応する音量制御のための回路は、例えば非特許文献1に記載されている。
このラウドネス機能は、根本的に既に音響パターンの改善をもたらしているが、完全な又は完全に近い音響パターンをユーザーのために生成可能であることからはほど遠い。問題は、高い及び低い音響の音響レベルがそれぞれ固定の所定量により変更され、それを通じ如何なる最適な自然度の音響パターンも達成されないという事実にある。
図1は、既に冒頭で議論された、通常の聴覚を有する若い人の可聴閾値の経過を周波数の関数として図示する。音圧p[dB]は、周波数f[Hz]の関数として示される。
既に冒頭に記載された良く知られたラウドネス機能の場合、この可聴閾値の個人的経過は考慮されない。要するに、従来のラウドネス機能は以下を考慮しないと言える。
a)ユーザーの実際の可聴閾値。特にこの可聴閾値は周波数の関数としてではない(例えば図1を参照)、b)ユーザーの左右の耳の間の可聴閾値の差、
c)現在の絶対音圧にユーザーのどちらの耳が晒されているか、
d)音響の異なるスペクトル成分。
a)に関し、可聴閾値は、時間、言い換えるとユーザーの年齢と共に、同様に左右の耳の間で変化する。可聴閾値に作用する他の影響は、遺伝性素因及び/又は長い時間期間にわたりユーザーに作用する雑音である。しかしながら、特に耳が感度を失い始める時間点に関し如何なる一般的言明もし得ない。図2は、異なる人々(Mx:Mは男性、xは年齢;Wx;Wは女性、xは年齢)の標準的な可聴閾値の経過を周波数の関数として1kHz−6kHzの範囲で図示する。
概して、耳の感度は、女性より男性の場合に早く低下し始める。これは特に男性の方が雑音の多い仕事場で雇用されることが多いという事実により説明され得る。しかしながら、既に示されたように、個人的値の分散範囲は、非常に高い。
b)に関し、同様の考察はユーザーの左右の耳の間の差にも適用される。若く健康な人々の場合、両耳は同様の感度であるが、時間と共に耳の間の差が発展し得る。左右の耳の可聴閾値は、中年の人で最大10dB−20dBだけ異なり得る。
c)に関し、図2で、平均的な60歳男性の可聴閾値を見ると、4kHzの音響の場合、耳は約40dBの平均音圧pに晒されている。この人が音響源から少し離れて位置し、及び音圧レベルが例えば30dBだけであると、この人はもはや音響が聞こえない。
可能な限り現実に忠実な補正のため、音源信号に依存する絶対音圧、場合によっては低音及び最高音部の増幅、音響プロセッサー、例えばサラウンドサウンドの設定、同様に拡声器の効率、聞き手からの拡声器の距離、部屋の音響状況(反射がSPLを増大する)等に基づき音響補正を実行することが必要である。更に、例えば聞き手がヘッドホンを用いるか否かも考慮しなければならない。
良く知られたラウドネス機能の場合、しかしながら、これは如何なる方法でも考慮されない。なぜならここで増幅は相対原則でのみ、つまり音響イベントの音響レベルに依存してのみ実行されるからである。
d)に関し、良く知られたラウドネス機能は、特定の周波数範囲において音響を増幅する。これは、音響が最も多くの多様な強度を有する多くの成分を有し得ることを無視している。例えば5kHzにおける弱い音調と一緒にある音調が4kHzにおいて生じるとすると、ラウドネス機能の場合、4kHzの音調は増幅しなくても容易に聞き取れるが、両方の音調は特定の固定量だけ増幅される。これは好ましくない。なぜならこのような増幅は不自然且つ奇妙に思えるからである。
ザストロー、ペーター(Zastrow,Peter)、フォノテクニック(Phonotechnik)、フランクフルト・ファッハバーラグ(Frankfurter Fachverlag)、1979年、第1版、p.132−139
本発明の目的は、最初の段落に記載された種類に従う方法、第2段落に記載された種類に従う信号処理装置、及び第3段落に記載された種類に従う音声システムを作成することである。当該システムでは、音響パターンの有意に良好な変更が達成される。当該変更は完全又はほぼ完全であり、言い換えると有意により自然な音響パターンが達成される。
上述の目的を達成するため、本発明による方法の場合、本発明による特徴は、本発明による方法が以下に記載されるように特徴付けられ得るよう提供される。
音声信号の音響レベルの周波数に依存する増幅方法であって、当該方法では音声信号は少なくとも特定の周波数範囲において複数の周波数帯に分割され、及び特定の可聴閾値は周波数帯毎に指定され、及び各周波数帯では周波数帯内の音声信号の音響レベルは個々の指定された可聴閾値と比較され、音響レベルが個々の可聴閾値の直下にある周波数帯内の音声信号は、当該周波数帯内の増幅信号の音響レベルが当該可聴閾値より上にあるよう増幅される。
上述の目的を達成するため、本発明による信号処理装置は、当該方法を実施する手段を有する。
更に、上述の目的を達成するため、本発明による音声システムは、上述のように、信号処理装置を有する。
本発明による特徴を通じ、本発明による音声信号の増幅の場合、周波数に依存するユーザーの可聴閾値が考慮され、及び音声信号の選択的増幅が個々の可聴閾値に依存する特定の周波数帯域で実行され、それを通じて、ユーザーは上述の良く知られたラウドネス機能の場合より有意に良好な音響パターンを提供される、という利点が達成される。当該増幅は、固定の所定の周波数範囲でのみ実行される。
原則的に、音声信号は1つだけの特定周波数範囲に又は可聴スペクトルの複数の周波数範囲において周波数帯に分割されて良い。また必要ならば増幅が行われる。最適に増幅された音声信号を除き、基本的にスペクトルの全可聴範囲が対応する周波数帯に分離され及び対応する増幅が行われるならば、有利である。
ここで更に指摘されるべき点は、「周波数帯内の音響レベル」の概念では、代案として周波数帯内のスペクトルエネルギーの概念も使用され得ることである。
原則的に、本発明の目的では、音声信号が個々の可聴閾値の「直」下にある場合、可聴閾値より上に増幅されれば十分である。根本的に、勿論、個々の可聴閾値の更に下にある音声信号を増幅することも同様に可能である。この場合、これらの音声信号は可聴閾値の上に増幅されず、さもなければ音響パターンの自然度が被害を受け得ることに注意しなければならない。
望ましくは、しかしながら、特に自然な音響パターンを達成するため、請求項2の特徴が更に提供される。
本発明の場合、請求項3の方策が実現されれば特に有利である。当該方策を通じ、種々の周波数帯に対し音声信号の個々の音響レベルに応じ及び可聴閾値を考慮して個々の増幅が行われるので、有意に最適化された増幅が行われる。
特に、請求項4の方策が提供されれば有利である。当該方策を通じ、例えばこの方法ではユーザーの耳の感度の違いをより良好に考慮し得るので、再度有意により正確な増幅が行われ得る。
音声信号の、特に如何なる場合も良く聞こえる音声信号の各チャンネルの、周波数範囲の如何なる増幅もないよう、請求項5の方策が更に提供される。
可能な限り自然な音響パターンを得るため、種々の周波数範囲における増幅は、当該周波数帯の音響レベル、可聴閾値及び閾値の間の関係に最良の可能な許容差を作ることが必要である。これは、請求項6の方策により最適な方法で考慮される。
これと関連して、請求項7の方策が更に提供される。
全体の音声信号の音響レベル(チャンネル毎に)に大き過ぎる変更をしないために、請求項8及び特に請求項9の方策が更に提供される。同時にこれら方策を通じ、全体の特性は音声信号の「新たな」増幅された音響パターンに対応し続け、均一な低下を通じ「新たな」音声信号の全体の音響レベルが低下する。特に請求項9の方策を通じ、「新たな」音声信号の大体の元の音響レベルへの標準化が行われる。これを通じ、元の及び新たな、変更された音声信号の音響レベルは、殆ど異ならない又は全く異ならない。
当該方策は、通常の場合、(問題のチャンネルの)音声信号の全音響レベルは可聴閾値の明らかに上にあるスペクトル部分に由来するという事実に基づく。他方で、境界領域の信号の増幅は、全音響レベルに如何なる有意な貢献も成さない。これは、この「通常」状態では、上述の全体の増幅が重要でない程度まで減少されるだけで十分であることを意味する。
他方で、スペクトル全体が処理前に静か過ぎる場合、及び従って如何なる主要なスペクトル範囲も存在しない場合(例えば沈黙、静かな暗雑音、拍手など)、増幅の全ての帯域への割り当てが生じ得る。そしてこれは従って基本的に標準化段階で反転される。しかしながら、これは聴覚にとって正しく望ましい。
周波数帯域の幅の選択は、特定の場合に個々に適応され得る。そしてこれに対する種々の可能性が記載される。しかしながら、請求項10の方策を有すれば特に有利である。請求項10の方策を通じ、異なる音量の隣接する音調の特に良好な異なる扱いが可能になる。
最高の可能なレベルの自然度を達成するため、請求項11の方策が更に提供される。当該方策によると、音響イベントが元の音響イベントの元の音響レベルより低い音響レベルを示す場合のみ音声信号は増幅され、一方、元の音響レベル又はそれより上の場合に増幅が必要ない。
原則的に、本発明による方法では、ユーザーの標準的な可聴閾値が指定され得る。しかしながら、本発明による方法は、請求項12の方策が適用される場合、特にユーザーに良好に及び個々に適応され得る。
既に上述のように、音声信号の各チャンネルが別個に増幅されれば有利である。従って、更に請求項13の方策が提供される場合、従って音声信号の各チャンネルに加え、ユーザーのそれぞれの関連する個人的可聴閾値も当該チャンネルに考慮されるので、特に有利である。
ここで、可聴閾値は、最終的に請求項14の方策が提供されるので、最良に設定され得る。
始めに説明された音声システムでは、請求項17の方策が実現されれば、更に有利である。この種類の音声システムでは、全体の発明は、単一のシステム内に小型に実現され得る。また如何なる別個の構成要素も必要ない。
本発明の上述の及び他の態様は、本願明細書に記載される実施例から明らかであり、及び当該実施例を参照して説明される。
以下では、本発明は、非限定的な図に示される設計例に基づき説明される。
本発明では、上述の不利点は大きく又は全体的に回避される。何故なら、音声信号の増幅の場合、個人の個人的可聴閾値が考慮され、及び音声信号の選択的増幅が個々の可聴閾値に依存する特定の周波数帯域で実行され、従って上述の良く知られているラウドネス機能の場合より有意に良好な音響パターンをユーザーのために生じ、当該増幅は固定の所定の周波数範囲でのみ実行されるからである。
音声システムSYS(図6を参照)の各チャンネルが考慮されるならば特に有利である。何故なら、例えばこの方法ではユーザーの耳の間の感度の差をより考慮に入れることが可能なので、当該方策を通じ、再び、有意に精細な増幅を行うことが可能であるからである。
この時点で指摘されるべき点は、用語「音声システム」が、音声信号を再生する如何なるシステム又は装置、特にオーディオ/ビデオシステム(A/Vシステム)を意味するとして理解されるべきであることである。このような音声システムSYSは、図6に例としてより詳細に示される。
本発明による方法は、図3乃至5に基づき以下に詳細に説明される。図3乃至5及び以下の詳細な記載では、以下に与えられる定義が用いられる。全ての変数はデシベル(dB)単位である。
Th(f):ヘッドホン又は拡声器を有する、特定のチャンネル(左、右、サラウンド、...)に関連する、特定の周波数fの(又は周波数f近くの特定の周波数帯の)、音量制御の効果もまた考慮に入れられる音声又はオーディオビデオシステムの(ランダムな)dBスケールに関する、個人の個人的可聴閾値、
Sig(f):周波数f又は周波数f近くの周波数帯における、音声又はオーディオビデオシステムのdBスケールの音量制御後の、(当該特定チャンネルの)音声信号の信号レベル(スペクトルエネルギー)、
MA:最大許容増幅、単位dB(例えば増幅「オフ」、10dB、20dB、30dB)、
ML:閾値。結果として生じる閾値Th(f)+MLは、依然として増幅されている音声信号Sig(f)の最大信号強度を表す(この変数は、追加増幅がゼロになる所謂「フェードアウトポイント」を定める)、
Amp(f):周波数fにより定められる周波数帯の(あるチャンネルの)音声信号の追加(非補正)増幅、
AmpC(f):周波数f又は周波数fにより定められる周波数帯の(あるチャンネルの)音声信号の追加の補正増幅、
SE:本発明による増幅を有さないユーザーにより知覚され、全周波数帯にわたり平均された、全スペクトルエネルギー(音声信号、ここでは1つのチャンネルの、全音響レベルに対応する)、
SEU:本発明による非補正増幅を有する、全周波数帯にわたり平均された、ユーザーにより知覚される周波数帯当たりの全スペクトルエネルギー、
根本的に、本発明は、音声信号の音響レベルSif(f)の周波数に依存する増幅では、音声信号Sig(f)がn個の周波数帯f1...f10に分割され、及び各周波数帯f1...f10では特定の可聴閾値Th(f)が指定されるという事実に基づく。更に、各周波数帯f1...f10では、音響レベルは個々の指定された可聴閾値Th(f1)...Th(f10)と比較され、及び音声信号は音響レベルが個々の可聴閾値の近くにある周波数帯内で増幅される。
図3は、音声システムの図示されたチャンネルの音声信号Sig(f)の経過を、周波数fの関数として示す。つまり増幅を有さない当該チャンネルSig(f)の周波数fの関数としての現在のスペクトルである。ここで、周波数fは対数スケールで20Hz乃至20kHzの間の範囲に記入される。y軸には、信号レベル又はスペクトルエネルギー(単位は周波数当たりの音量)が記入される。図3はまた、ユーザーの個人的可聴閾値Th(f)を当該チャンネルに対し周波数fの関数として示す。本発明によると、周波数範囲は、特定の数n個の(狭い)周波数帯f1...f10に分割される。標準的な値は、例えばn=200である。
標準的に、最も単純な場合には、対数スケールの(対数的に見える)周波数帯は等しい幅を有する。なぜならこれは耳の生理学に近いからである。つまりf(帯域の終わり)=c*f(帯域の始め)である。ここで因子cは全可聴範囲にわたり一定のままである。c=2の場合、各場合において(不適当に)1オクターブが1つの帯域に結合される。c=1.0595...(2の12乗根)では、1つの帯域は、それぞれ感知可能な分解能を表す1つの半音段階に対応する。
或いは、周波数帯は、人間の耳が最も敏感に反応する、言い換えると約200Hz乃至3kHzの間の周波数範囲に密集して保たれる、ということが提供され得る。3kHzより上、及び200Hzより下では、周波数帯は都合上、いくらか広く選択され得る。
原則的に、分解は、事実上周波数帯が1つのみの具体的な周波数を有する狭い周波数帯内で提供され得る。この状況、言い換えると非常に具体的な周波数の場合、Sig(f)の及び可聴閾値Th(f)の比較が行われ、及び場合によっては増幅も「周波数帯」の形成に含まれる。しかしながら、利用可能な計算能力を人間の耳の限られた周波数分解能力と同様に考慮に入れると、「周波数帯」が実際に1つの周波数だけでなく周波数の範囲を有するならば都合が良い。
更に与えられる記載及び式では、明確化を目的とし、(対数的スケールにおいて)等しい幅の周波数帯を想定する。更に図3では、表現を非常に明確にするため、n=10の周波数帯f1...f10のみが想定される。
音声信号Sig(f)を周波数範囲f1...f10へ分割することは、上述のように音声システムSYS(図6を参照)のデジタル信号プロセッサーDSP、又は例えば既存の圧縮音声信号を扱う場合には既に存在する対応する形式、の何れかで行われる。
既に述べられたように、図3は、個人の可聴閾値Th(f)の連続的な経過を示す。通常は、しかしながら、この経過は示されるように量子化形式Th(f1)...Th(f10)で既に存在する。当該形式は、以下に詳細に説明されるように、例えば1つのチャンネルに対しユーザーの可聴閾値の決定に帰着する。
個々の周波数帯では、音声信号Sig(f)が個々の可聴閾値Th(f)に近いか否かが検査され、そして必要ならば音声信号Sig(f)は、図3に示されるように例として周波数範囲f2、f3、f4に対し対応する周波数帯で増幅される。
可聴閾値Th(f)に関連する用語「近い」は、基本的に、信号Sig(f)が可聴閾値より下にある周波数範囲fで、最大でも最大増幅の値MAだけ増幅が行われるものと理解されるべきである。望ましくは、特に自然な音響パターンを得るため、増幅はまた、値がまさに可聴閾値Th(f)にある又は可聴閾値より上で「近く」にある信号Sig(f)を提供される。上方に、用語「近い」により定められたウインドウは、同様に値MAにより制限され得る。従って原則的に用語「近い」は、Sig(f)の値がほぼTh(f)−MAとTh(f)+MAとの間にあることを特徴とし得る。
以下に更に詳細に記載されるように、「近い」の上限値は、以下に更に詳細に説明されるように閾値MLにより依然として良好に定められ得る。
この時点で言及すべき点は、原則的にこのような可聴閾値より下にあるようなSig(f)の値を最大増幅MAより大きい分だけ増幅することも本来可能であることである。しかしながら、これは結果として生じる音響パターンに如何なる影響も有さない。なぜならこれらの周波数範囲では、音響レベルは当該増幅を通じ当該範囲の可聴閾値を超えて引き上げられないからである。
この時点で言及されるべき点は、通常この比較は全周波数帯に対し実行され、及び必要ならば対応する増幅が実行されることである。原則的に、しかしながら、対応する比較はただ1つの特定の周波数範囲で又は異なる周波数範囲で、及び比較も増幅も実現されない他の周波数範囲で実行されることである。
増幅Amp(f)の計算では、変数、この場合は閾値MLが設けられる。信号レベルSig(f)が可聴閾値を超えるMLと等しい又はMLより大きい場合、当該信号帯に対する如何なる増幅もない。図3には、結果として生じる閾値Th(f)+MLの量子化された経過が示される。閾値Th(f)+MLより上では、音声信号Sig(f)の如何なる更なる増幅も行われない。
周波数fの近くの周波数帯の追加非補正増幅Amp(f)は、具体的な実施例に対し次のように記載され得る。
Amp(f)=(Th(f)+ML-Sig(f))*MA/(ML+MA)
但しSig(f)<Th(f)+ML、及び
Amp(f)=0
但しSig(f)≧Th(f)+ML
非補正増幅信号の経過は、図3の対数的スケールにSig(f)+Amp(f)として示される。
以下に記載される標準化段階を実施する前の非補正増幅Amp(f)の経過は、図4に変化αとして示される。この変化αから分かるように、増幅は、Sig(f)の値に依存して、可聴閾値Th(f)において値MAに、そして結果として生じる閾値Th(f)+ML(結果として生じる閾値のSig(f)の値と同様に)においてゼロにある。
Sig(f)のより小さい信号レベルに向かって、Amp(f)の経過は連続的に上昇を示す。しかしながら図4の説明に反し、Sig(f)<Th(f)−MAでは、通常Amp(f)の値はゼロに設定されるか、又はAmp(f)の傾きは増幅信号Sig(f)+Amp(f)に対し音響レベルが可聴閾値Th(f)より上にないように選択されるべきである。
パラメーターMLはここで、チャンネルのスペクトルエネルギーを介し、ML=c1*SE+c2として、2個の定数c1及びc2を有し定められる。望ましくは、これらの定数は値c1=1及びc2=0であるとする。パラメーターMLは従って、元の信号、つまり本発明による増幅を有さない信号の知覚スペクトルエネルギーの関数である。
パラメーターMLはスペクトルエネルギーに依存するが、例えば全周波数の場合に可聴閾値の近く又は可聴閾値より下に位置する音声信号が増幅されない、従って楽曲内の沈黙又は静かな一節、又は2つの楽曲間のブレークは増幅されないか又は弱く増幅されるだけである。
示されたチャンネルの音声信号の全スペクトルエネルギーSE、及び従って当該チャンネルの結果として生じる音響レベルは、Sig(f)とTh(f)との間の差であり、全周波数帯にわたり合計され、次の通りである。
SE=Σx=1...n{[Sig(fx)-Th(fx)]/n}、
但しSig(fx)≧Th(fx)、及び
SE=0、
但しSig(fx)<Th(fx)
ここでnは元の信号のスペクトルが分割される周波数帯の数を示し、及びfは個々の周波数帯の特性を示す。SEの値は、図3に斜線領域により示される。
最後に、増幅は更に、増幅信号が全周波数帯で同一の値だけ減少されるので、ユーザーにより知覚される全スペクトルエネルギーが増幅の前後でほぼ同一であるよう標準化される。
補正(標準化)増幅は、従って次の結果を生じる。
AmpC(f)=Amp(f)+SE-SEU、
ここで
SEU=Σx=1...n{[Sig(fx)+Amp(fx)-Th(fx)]/n}、
但しSig(fx)+Amp(fx)≧Th(fx)、及び
SEU=0、
但しSig(fx)+Amp(fx)<Th(fx)
選択された対数的表現では、増幅された、補正された信号は従って結果としてSig(f)+AmpC(f)である。
この処理方法では、比較的小さい補正が達成される。当該補正を通じ、反復計算を用いる増幅の新たな計算はもはや必要ない。さもなければ、補正が強すぎる場合、増幅は再び大きく減少され得る。
上述の、(音声信号のチャンネルの)音声信号の増幅Amp(f)の、同様に補正された標準化された増幅AmpC(f)の決定により、非常に良好な音響結果が達成される。
原則的に、複数チャンネル音声システムの場合、1つだけ又は上述のように少数のチャンネルを増幅することが可能である。本来、しかしながら、最適で自然な結果は、音声信号の増幅で、特に全チャンネルが相応に変更される場合、及び特にチャンネル毎にユーザーの対応する個人的可聴閾値が考慮に入れられる場合、達成される。
図4に示される変化αに加え、増幅Amp(f)では、別の可能な変化βが示される。当該変化βの場合、Sig(f)=Th(f)−MAでは、増幅は値Amp(f)=MAを想定する。Th(f)−MAの上では、Amp(f)は線形にTh(f)+MAへ向かって減少し、そしてTh(f)+MLにおいて(及びそれより上の値では)増幅がゼロになる。
閾値Th(f)−MAより下で、図4によると増幅はAmp(f)=MAである。この範囲ではしかしながら、ユーザーにとってこの一定増幅MAは、もはや音響パターンに如何なる聴覚効果を有さない。従って通常この範囲では、増幅はもはや実行されず、及びそれに応じAmp(f)=0がSig(f)<Th(f)−MAに対し適用される。
ここに示されない、特性曲線Amp(f)の選択の別の変化は、上述のようにMLに依存する傾きを作る代わりに値MAから直接導出される。そしてTh(f)+MLより上の信号値の増幅は、再びゼロになる。Th(f)+MLより下ではしかしながら、Amp(f)の経過は、点Th(f)−MAにおいてAmp(f)がMAに等しいという条件により定められないが、傾きにより固定的方法で定められる。固定的方法では、当該傾きは=c*MAにより与えられ、cは任意の正の定数であり、従って傾きは、MAの最も高い可能な値の場合も決して−45°より急にならない。
本発明の更に有利な補足は、図5に基づき最後に詳細に説明される。これまで、音響イベント、例えば楽曲の「元の音響レベル」の概念は、考慮されていなかった。説明の導入で既に述べたように、聞き手は音響又は音響イベントが「元の音量」で(例えばコンサートホール内などで)再生された場合、当該音響又は音響イベントを「自然なもの」として知覚する。
従って、増幅が完全に自然に元の音響レベルで(及び元の音響レベルより上の音響レベルで)動作する本発明による音声信号の増幅の実施例は、特に有利である。これは以下を達成する。
現在、コンパクトディスク(CD)又は同様のものへの音楽録音の場合、私達は元の音響レベルに関する如何なる情報も有さない。当該情報が、勿論好んで利用可能であれば、当該元の音響レベルが用いられ得る。
当該情報が自動的に利用可能でない場合、聞き手は「元の音響レベル」を自ら定めなければならない。言い換えると、実際に音声システムの録音を聞く前に、有利なことに音の大きい一節が再生され(スペクトル処理を有さず)、及び聞き手は聴覚印象が聞き手にとって自然であるよう音量制御部を設定する。音の大きい一節は、音声システムにより、例えばピーク検索又はより速いアルゴリズムを通じ良く知られた方法で発見され得る。一節は、自然な音響レベルの信頼性ある選択を容易にするため、相対的に音が大きいだけである。しかしながら、絶対的に音の大きい場所であってはならない。ユーザーにより元の音響レベルVol(OL)に対し設定された値は、音声システムSYSにより格納される。
図5は、最大許容増幅のパラメーターMAを、音声システムSYSにより再生される現在の音響レベルVolの関数として示す。始めに決定された元の音響レベルVol(OL)、及びそれより上の場合、最大可能増幅MAはゼロになる。より低い音量では、最大増幅MAは所定の最大値MAmaxまで増大する。図5はこの上昇曲線の可能な経路を示す。
本発明の場合の主要目的は、可聴閾値Th(f)を周波数fの関数として考えることである。原則的に、可聴閾値Th(f)の標準的な経過は指定され得る。しかしながら、ユーザーに対し個々に決定される可聴閾値Th(f)を考慮に入れることは非常に望ましい。
根本的に可聴閾値は、音声システムSYSの個々のチャンネルと独立に決定され得る。しかしながら、ユーザーの可聴閾値Th(f)が音声システムの全チャンネルに対し設定され、及び増幅が本発明に従い全チャンネルに対し別個に実行されるならば、明らかにより良好な音響結果が達成されるので、非常に望ましい。ここで、可聴閾値の決定は、望ましくはユーザーにより(例えば家庭で)音声システムSYSに実行され得る。
各チャンネルに割り当てられた周波数に依存する可聴閾値を決定するため、ユーザーが後に聞きたい場所にいるならば、特に有利である。このように、有利なことに、部屋の音響、音響陰影及びユーザーと拡声器システムとの間の距離の影響は、決定される閾値に供給される。
以下では、可聴閾値の決定がより詳細に纏めて説明される。音声システムSYSを介し、一連の試験音響がユーザーに対し再生される。ユーザーは当該試験音響に応答しなければならない。この場合、音声システムSYSの全チャンネルの間で区別がなされる。例えば、図6に示される音声システムSYSでは、6個の拡声器SPEの間の区別がなされる。又は音響がヘッドホンHPHを介して再生される場合は、ヘッドホンHPHの左右のスピーカーの間の区別がなされる。言い換えると、試験音響のシーケンスは、存在するチャンネル毎に繰り返される。
試験シリーズはまた、ユーザーの応答の妥当性を検査する音響を有する。このような可聴閾値を決定する試験は、原則的に医療分野で良く知られている。
任意的に、複数のデータセットが再生され、ユーザーに例えば本発明による増幅機能を種々の聴取場所に対し、言い換えるとユーザーが例えば一定の品質で音楽を聴く異なる場所で利用可能にするよう求めて良い。この場合、本願明細書に記載された周波数に依存する増幅機能を起動するとき、ユーザーはまた関連する聴取場所を提示する。或いは、音声システムは、例えば起動が実行されるリモコンを位置特定し得る範囲で、聴取場所自体を推定して良い。
各場合で、測定された値はユーザー毎に格納される。システムのユーザー毎に1つ以上のデータ記録を設定することは、特に有利である。この場合、ユーザーはまた、本願明細書に記載された周波数に依存する増幅機能を起動する時、自身を識別しなければならない。
可聴閾値を決定する場合、アルゴリズムで用いられるそれぞれ個々の周波数帯を検査する必要はない。いくつかの基準点を記録し、及び残りを推定すれば十分である。
このような推定の特別な形式として、耳音響放射の評価が適用され得る。この方法の利点は、人間からの如何なる積極的応答も必要なく良好な周波数分解能が達成され得ることである。当該方法は、医療分野から良く知られており、及び従って本願明細書で更なる説明を必要としない。耳管にあるマイクロホンを備えられた密接したヘッドホンを必要とする。
図6は、音声システムSYS又はA/Vシステムの概略ブロック図を示す。この場合、6個の拡声器SPEを有する6チャンネル(ドルビー5.1)を介した、又はステレオヘッドホンHPH(2チャンネル)を介した音響再生が図示される。原則的に、本発明は、如何なる数のチャンネルにも用いられ得る。
ここに示される音声システムSYSは、全てがこの組み合わせで存在する必要はなく、及び特定の場合には個別にのみ存在し得る一連の構成要素を有する。
対応するメモリーRAM、ROMを備えたセット制御ユニットSETは、基本的制御タスクを受け継ぎ、及び音声システムSYSの入力ユニットINPと同様にリモコンとの通信のための赤外線受信機IRと接続される。セット制御ユニットSETはまた、音声システムSYSのディスプレイDISを作動させる。
セット制御ユニットSETはまた、ユーザー固有の可聴閾値Th(f)をチャンネル毎に決定するアルゴリズム、及び元の音響レベル設定Vol(OL)を上述のように制御する。
また、例えばチューナー、インターネット等のようなリアルタイムデータ源RTDが示される。更に例えばCD、DVD、ハードディスク、ミニディスク等のための再生ユニットのようなデータ源DSTも示される。セット制御ユニットSETは、同様に2個のデータ源RTD及びDSTを起動させる。
これら2個のデータ源RTD、DSTは、更に示される外付けマイクロホンEMIのように(後者はマイクロホン増幅器MAMを介する)、データ源を選択するユニットSSEと接続される。
当該ユニットSSEはまた、A/DコンバーターKONを介しデジタルデータ又はアナログ信号のために、デジタル信号処理装置DSPと直接接続される。デジタル信号処理装置DSPは、ここではデジタル信号プロセッサーの形式であり、当該信号プロセッサーは増幅器AMPを介し6個の拡声器SPEへ、又は更なる増幅器AHPを介しヘッドホンHPHへ音声信号を供給する。
上述の本発明による音声信号Sig(f)の増幅のためのアルゴリズムは、ここでデジタル信号処理装置DSPにより実行される。当該信号処理装置DSPは、このために相応に設定されている。
セット制御ユニットSETにより決定される、可聴閾値Th(f)に関する必要なデータは、有利なことにセット制御ユニットSETのメモリーRAMに格納される。或いは、当該データは勿論、信号処理装置DSPのメモリーRAMに、又は音声システムSYSの別のアクセス可能なメモリーに格納され得る。インターネットに接続され得る音声システムSYSの場合、例えば従って音声ファイルを音声システムSYSにダウンロードするため、可聴閾値Th(f)に関連する対応するデータは、音声システムSYSへ、インターネットを介しアクセス可能なメモリーから読み込まれる。
図6に示された音声システムSYSの場合、「従来の」良く知られた音声システムであって、従って本発明の実現のために、原則的に音声信号の増幅と同様に可聴閾値を決定するための試験シーケンスの生成のためのデジタル信号処理装置DSPのソフトウェア変更、及び特に試験手順を制御するため及びユーザーインターフェースに関連するセット制御ユニットSETへの変更「のみ」が必要であることが分かる。上述の方法を実行する信号処理装置DSPの、音声信号を増幅する手段は、従って専用ソフトウェア又は既存ソフトウェアの拡張である。
原則的に、本発明は、既に述べられたように、A/Vシステムの場合を含み、音声信号の再生のための如何なるシステムの場合にも用いられ得る。信号処理装置DSPが音声システムSYSの構成要素であるならば望ましい。
原則的に、本発明によるアルゴリズムを実施する信号処理装置が、音声システムと別個に、別個の又は外付けユニットとして設計され得る場合、この外付けユニットは、従って本発明の目的のため音声システムと接続される。便宜上、この外付けユニットは従って、ユーザーの個人的可聴閾値を決定するために更に設定される。
後者の場合、図6に基づき簡単に説明される種々の可能性が考えられる。
a)本発明による方法のための外付けユニットは、示されるようにシステムSYSを有する。システムSYSではしかしながら、データ源RTD、DSTは除かれ、従来の音声システム又はA/Vシステムが接続され得るアナログ及び/又はデジタル入力により置き換えられる。
b)a)に基づき記載された変形は、増幅ユニットAMP、AHPも除かれ、更に縮小され得る。この場合、デジタル信号処理装置DSPの出力は、例えば既存の音声増幅器の入力と接続される。
ここで重要なことは、音量制御が既存の増幅器を介さず外付けユニットを介し影響されることである。
c)b)に記載された変形は、ユニットDST、RTD及びSSEが除外され、携帯ヘッドホンで動作する装置に最適化され得る。その代わり、外付けユニットは携帯音声装置のヘッドホン出力(又は存在すれば望ましくはデジタル出力)と接続される。この実施例の場合、増幅器ユニットAMPは適用されない。しかしながら、デジタル信号処理装置DSPの下流はヘッドホン増幅器AHPであり、従ってヘッドホンHPHは外付けユニットと直接接続され得る。
通常の聴覚を有する若い人の可聴閾値の経過を周波数の関数として図示する。 異なる人々の標準的な可聴閾値の経過を周波数の関数として1kHz−6kHzの範囲で図示する。 可聴閾値、信号レベル(音量)及び音声信号のチャンネルの結果として生じる閾値の間の関係を、簡略化した例に基づき図示する。 本発明による音声信号の追加増幅の例である経過を示す。 音声信号の最大許容増幅の経過の例を、音声信号の現在の音響レベルの関数として示す。 本発明による音声システムの概略ブロック図を示す。

Claims (17)

  1. 方法であって、音声信号の音響レベルを周波数に依存して増幅し、前記方法では、
    前記音声信号は少なくとも特定の周波数範囲において複数の周波数帯に分割され、及び
    個々の可聴閾値は周波数帯毎に指定され、及び
    各周波数帯では前記周波数帯内の音声信号の音響レベルは所定の可聴閾値と比較され、及び
    前記音響レベルが前記個々の可聴閾値の直下にある周波数帯内の音声信号は、前記周波数帯内の増幅信号の音響レベルが前記可聴閾値より上にあるよう増幅される、方法。
  2. 更に、音響レベルが前記個々の可聴閾値にある又は前記個々の可聴閾値の直上にある周波数帯内の音声信号は増幅される、請求項1記載の方法。
  3. 異なる周波数帯内の音声信号は、事実上、前記可聴閾値に関連する音声信号の音響レベルに依存して増幅される、請求項1又は2記載の方法。
  4. 音声信号の各チャンネル毎に、対応する可聴閾値が指定され、及び前記音声信号の増幅はチャンネル毎に別個に実行される、請求項1乃至3の何れか1項記載の方法。
  5. 前記音声信号は、音響レベルが結果として生じる閾値より下にある全ての周波数帯内で増幅される、請求項1乃至4の何れか1項記載の方法。
  6. 前記音声信号は、音響レベルが明らかに結果として生じる閾値より下である周波数帯内で最も強く増幅され、及び前記増幅は、前記結果として生じる閾値と周波数帯内の音声信号の音響レベルとの差の減少とともに減少する、請求項5記載の方法。
  7. 前記音声信号の増幅は、周波数帯内の可聴閾値が次第に超過されるにつれ減少し、及び結果として生じる閾値が達成され及び超過される場合にゼロになる、請求項6記載の方法。
  8. 特定の周波数帯範囲内の前記音声信号の選択的増幅が実行された後、前記増幅信号の均一な減少が全ての周波数範囲内で実行される、請求項1乃至7の何れか1項記載の方法。
  9. 前記増幅信号の減少は、ユーザーにより知覚される前記音声信号の全スペクトルエネルギーが基本的に増幅の前後で同一の値であるとされるように、選択される、請求項8記載の方法。
  10. 前記周波数範囲の幅は、人間の耳の周波数分解能力の大きさの程度にあるよう選択される、請求項1乃至9の何れか1項記載の方法。
  11. 前記音声信号の最大増幅は、前記音声信号の元の音響レベルにおいて及び元の音響レベルより上でゼロであり、及び前記音声信号のより低い音響レベルにおいて最大増幅は、最大増幅の所定の最大値へ上昇する、請求項1乃至10の何れか1項記載の方法。
  12. 異なる周波数範囲の前記所定の可聴閾値は、個人の個人的可聴閾値を決定することにより設定される、請求項1乃至11の何れか1項記載の方法。
  13. 前記個人的可聴閾値は、前記音声信号のチャンネル毎に別個に決定される、請求項12記載の方法。
  14. 前記個人的可聴閾値を周波数の関数として決定する場合、耳音響反射も考慮に入れられる、請求項12又は13記載の方法。
  15. 信号処理装置であって、請求項1乃至14の何れか1項記載の方法を実施する手段を有する信号処理装置。
  16. 音声システムであって、請求項15記載の信号処理装置を有する音声システム。
  17. ユーザーの前記可聴閾値を決定する手段を有する、請求項16記載の音声システム。
JP2007550887A 2005-01-14 2006-01-05 音声信号の音響レベルを周波数に依存して増幅する信号処理装置及び音声システム及びその方法 Pending JP2008527882A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP05100211 2005-01-14
PCT/IB2006/050040 WO2006075264A1 (en) 2005-01-14 2006-01-05 Signal processing arrangement and audio system for and method of frequency-dependent amplifying of the sound level of audio signals

Publications (1)

Publication Number Publication Date
JP2008527882A true JP2008527882A (ja) 2008-07-24

Family

ID=36097089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007550887A Pending JP2008527882A (ja) 2005-01-14 2006-01-05 音声信号の音響レベルを周波数に依存して増幅する信号処理装置及び音声システム及びその方法

Country Status (3)

Country Link
JP (1) JP2008527882A (ja)
CN (1) CN101103525A (ja)
WO (1) WO2006075264A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101356206B1 (ko) * 2007-02-01 2014-01-28 삼성전자주식회사 자동 오디오 볼륨 기능을 갖는 오디오 재생 방법 및 장치
CN101937682B (zh) * 2010-09-16 2012-11-21 华为终端有限公司 一种处理接听语音的方法和装置
WO2014057629A1 (ja) * 2012-10-09 2014-04-17 パナソニック株式会社 不快音圧推定システム、不快音圧推定プロセッサ、不快音圧推定方法およびそのコンピュータプログラム
CN104332050B (zh) * 2014-10-27 2017-10-10 浙江省环境保护科学设计研究院 一种智能环境噪声与振动监测装置及监测方法
CN105450871A (zh) * 2015-12-03 2016-03-30 广东欧珀移动通信有限公司 一种移动终端通话模式的切换方法和装置
DE102017218483A1 (de) * 2017-10-16 2019-04-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur einstellung von parametern zur individuellen anpassung eines audiosignals
NL2020909B1 (en) 2018-05-09 2019-11-18 Audus B V Method for personalizing the audio signal of an audio or video stream
CN110960224B (zh) * 2019-12-31 2021-08-10 杭州耳青聪科技有限公司 听力阈值和/或听力状态检测系统及方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0080538A1 (en) * 1981-11-26 1983-06-08 A.R.D. Technical Assistance And Engineering Services International Anstalt Amplifier printed circuit board and mounting system therefor
JPH01137710A (ja) * 1987-11-24 1989-05-30 Sumitomo Electric Ind Ltd 広帯域増幅器
US5717773A (en) * 1993-04-28 1998-02-10 Night Technologies International Sound system gain and equalization circuit
JP2002141816A (ja) * 2000-11-01 2002-05-17 Nec Corp 並列信号受信回路
EP1487100A1 (en) * 2003-06-09 2004-12-15 STMicroelectronics S.r.l. Multi-channel power amplifier with channels independently self-configuring bridge or single-ended output, particulary for audio applications

Also Published As

Publication number Publication date
CN101103525A (zh) 2008-01-09
WO2006075264A1 (en) 2006-07-20

Similar Documents

Publication Publication Date Title
US9966916B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI580180B (zh) 用於改進感知頻譜失衡之音訊信號動態補償技術
US9943253B2 (en) System and method for improved audio perception
KR100636213B1 (ko) 실시간 주파수 특성 보정 방법 및 그를 적용한 사운드재생 장치
US9093968B2 (en) Sound reproducing apparatus, sound reproducing method, and recording medium
JP2008527882A (ja) 音声信号の音響レベルを周波数に依存して増幅する信号処理装置及び音声システム及びその方法
JP2002084154A (ja) 音量に基づくラウドネス補償回路、システム、および方法
TW200919953A (en) Automatic gain control device and method
TWI397901B (zh) 控制音訊信號比響度特性之方法及其相關裝置與電腦程式
JP3284176B2 (ja) オーディオ装置
JP5058844B2 (ja) 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
JP4791613B2 (ja) 音声調整装置
JP5202021B2 (ja) 音声信号変換装置、音声信号変換方法、制御プログラム、および、コンピュータ読み取り可能な記録媒体
JP2009077378A (ja) 音声信号処理装置及び方法
JP2012213114A (ja) 音響信号処理装置及び音響信号処理方法
JP2000134051A (ja) コンプレッサ
WO2020255601A1 (ja) 出力音制御装置、および出力音制御方法、並びにプログラム
JP2011141540A (ja) 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体
JP6807769B2 (ja) 音響装置及び音質調整方法
JPH10341123A (ja) 音響再生装置
CN116778949A (zh) 个性化响度补偿方法、装置、计算机设备和存储介质
JP4241828B2 (ja) テスト信号発生装置および音響再生システム
JPH10214023A (ja) 高齢者聴覚疑似体験装置
Myöhänen Loudness Compensation