JP5632532B2 - 入力オーディオ信号の修正装置及び修正方法 - Google Patents

入力オーディオ信号の修正装置及び修正方法 Download PDF

Info

Publication number
JP5632532B2
JP5632532B2 JP2013505480A JP2013505480A JP5632532B2 JP 5632532 B2 JP5632532 B2 JP 5632532B2 JP 2013505480 A JP2013505480 A JP 2013505480A JP 2013505480 A JP2013505480 A JP 2013505480A JP 5632532 B2 JP5632532 B2 JP 5632532B2
Authority
JP
Japan
Prior art keywords
subband
excitation parameter
excitation
subbands
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013505480A
Other languages
English (en)
Other versions
JP2013537726A (ja
Inventor
ウーレ、クリスチャン
ヘレ、ユルゲン
ヘルムート、オリバー
フィナオアー、ステファン
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2013537726A publication Critical patent/JP2013537726A/ja
Application granted granted Critical
Publication of JP5632532B2 publication Critical patent/JP5632532B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers without distortion of the input signal
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明に係る実施形態はオーディオ信号処理、特に、入力オーディオ信号の修正装置及び修正方法に関する。
ラウドネスを測定するための満足のいく客観的な方法を開発するために、様々な試みが成されてきた。フレッチャー(Fletcher)とマンソン(Munson)は1933年に、人間の聴覚は、低周波数及び高周波数に対しては中間(または声の)周波数に対するほども敏感ではないことを発見した。彼らはまた、サウンドレベルが増すにつれて感覚の相対的変化は小さくなることを発見した。初期のラウドネス計測器は、マイク、増幅器、計測器、及び低サウンドレベル、中間サウンドレベル、高サウンドレベルでの聴覚の周波数応答をおおよそ再現できるよう設計されたフィルターの組み合わせとから成っていた。
このような装置は単独で一定のレベルで独立した音色のラウドネスを測定することはできたが、より複雑な音の計測結果はラウドネスに対する主観的な印象とはあまり一致していなかった。この種のサウンドレベルメータは標準化されてきたが、モニタリングや工場騒音の制御のような特別な課題のためにだけ使用されている。
1950年代の初期に、とりわけ、ツウィッカー(Zwicker)とスティーブンズ(Stevens)は、フレッチャー(Fletcher)とマンソン(Munson)の研究を、ラウドネス感覚処理のより現実的なモデルを開発する際に拡大適用した。スティーブンズ(Stevens)は、1956年の米国音響学会誌で「複雑な騒音のラウドネス計算」のための方法を発表し、ツウィッカー(Zwicker)は、1958年にAcousticaで彼の「ラウドネスの心理学的系統的原理」という記事を載せた。1959年、ツウィッカー(Zwicker)はラウドネス計算のための図表による方法を発表し、その後まもなくいくつかのよく似た記事を載せた。これらのスティーブンズ(Stevens)とツウィッカー(Zwicker)の方法は、ISO532のそれぞれパートA,Bとして規格化された。どちらの方法も類似のステップを含んでいる。
最初に、内耳の基底膜に沿ったエネルギーの時間変動分布(励振と称される)が、オーディオを、中央周波数を等間隔で配置したバンドパス聴覚フィルターバンクを通すことによって、臨界帯域評価尺度でシミュレーションされる。各聴覚フィルターは、内耳の基底膜に沿った特定の位置での周波数応答をシミュレートするように、このフィルターの中央周波数がこの位置に相当するよう設計されている。臨界帯域幅は、一つのこのようなフィルターの帯域幅として定義される。これらの聴覚フィルターの臨界帯域幅はHzの単位で測定されるが、中央周波数が上がるにつれて増大する。従って、歪んだ周波数尺度を、この歪んだ尺度で測定された全ての聴覚フィルターの臨界帯域幅が一定のものとなるように規定することが有効である。このような歪んだ尺度は臨界帯域評価尺度と称され、広い範囲の心理音響的現象を理解し、シミュレートするのに非常に有効なものである。例えば、E.ツウィッカー(Zwicker)とH.ファストル(Fastl)による「心理音響的事実とモデル」(スプリンガーフェルラーク、ベルリン、1990年)を参照してください。スティーブンズ(Stevens)とツウィッカー(Zwicker)の方法は、バルク尺度と称される臨界帯域評価尺度を使用しており、臨界帯域幅は500Hz以下では一定であり、500Hzより上では増加する。それよりも最近では、ムーア(Moore)とグラスバーグ(Glasberg)が臨界帯域評価尺度を規定し、彼らはそれを均等矩形帯域(ERB)尺度と名付けた(B.C.J.ムーア(Moore)、B.グラスバーグ(Glasberg)、T.ベーア(Baer)による「閾値、ラウドネス及び部分的ラウドネスの予見のためのモデル」(オーディオ技術学会会報、Vol.45,No.4、1997年4月、224〜240ページ)。ノッチ雑音マスカーを使用した音響的実験を通して、ムーア(Moore)とグラスバーグ(Glasberg)は、バルク尺度では臨界帯域幅はずっと一定であるのに対して、臨界帯域幅は500Hz以下では減少し続けることを示した。
「臨界帯域」という言葉は、1938年にハーベイ・フレッチャー(Harvey Fretcher)が行った付随信号による音の感覚のマスキングに関する研究(J.B.アレン(Allen)による「電話精神物理学の小史」オーディオ技術学会会議、1997年)に遡る。臨界帯域は、1961年にツウィッカー(Zwicker)が提案したバルク尺度を使用して表すことができ、それぞれの臨界帯域は1バルク(ハインリッヒ・バルクハウゼンの名前を取った単位)の幅を有している。人間の聴覚を模倣するフィルターバンクの後に、例えば均等矩形帯域(ERB)尺度が存在する(B.C.J.ムーア(Moore)、B.グラスバーグ(Glasberg)及びT.ベーア(Baer)による「閾値、ラウドネス及び部分的ラウドネスの予見のためのモデル」(オーディオ技術学会会報、Vol.45,No.4、1997年4月)。
「特定ラウドネス」という言葉は、臨界帯域で測定されるある周波数帯域幅に対して基底膜のある部分での信号によって引き起こされるラウドネス感覚を説明している。これは、ソーン/バルクという単位で測定される。「臨界帯域」という言葉は、人間の聴覚の周波数分解能を模倣するように設計された不均一なバンドパスフィルターバンクを含む聴覚フィルターバンクの周波数帯域に関連するものである。音の全体的なラウドネスは全ての臨界帯域を越えた特定ラウドネスの合計/全体に等しい。
オーディオ信号の処理方法は、A.J.シーフェルト(Seefeldt)による「知覚されたラウドネス及び/またはオーディオ信号の知覚されたスペクトルバランスの計算と調整」(米国特許出願公報2009/0097676、2009年)に説明されている。この方法は、音量調節、ダイナミックレンジ制御、動的平衡及び背景雑音補償への応用と共に、オーディオ信号の特定ラウドネスの制御を目標にしている。この明細書において、入力オーディオ信号(通常は周波数領域のもの)が、その特定ラウドネスが目標特定ラウドネスと一致するように修正される。
A.J.シーフェルト(Seefeldt)による「知覚されたラウドネス及び/またはオーディオ信号の知覚されたスペクトルバランスの計算と調整」(米国特許出願公報2009/0097676、2009年)で提示されたような処理の利点を説明するために、オーディオ信号の音量調節について考える。オーディオ信号の音の再生におけるレベルの変化は、通常、その知覚されるラウドネスの変化を目標とする。言い換えると、ラウドネスのコントロールは、伝統的にサウンドレベルの制御として実施されている。しかし、我々の日常の経験と心理音響的知識は、これが最適ではないことを示している。
人間の聴覚は周波数とレベルの両方に伴って変化し、サウンド強度レベルの低下に伴い、中間周波数(例えば2000〜4000Hz)に対する感覚よりも低い周波数及び高い周波数(例えば約100Hz及び約1000Hz)に対する感覚がより低下する。再生レベルを「心地よい音量の」レベル(例えば75〜80dBA)から例えば18dB低下させると、オーディオ信号の感覚的スペクトルバランスが変化する。これは、公知の等ラウドネス曲線で示されており、等ラウドネス曲線はしばしばフレッチャー・マンソン・カーブと称される(1933年に最初に等ラウドネス曲線を測定した研究者の名を取って)。等ラウドネス曲線は、純音が与えられた場合にリスナーが一定のラウドネスであると感じる、周波数スペクトルに対する音圧レベル(SPL)を示す。
等ラウドネス曲線は、例えばB.C.J.ムーア(Moore)、B.グラスバーグ(Glasberg)及びT.ベーア(Baer)による「閾値、ラウドネス及び部分的ラウドネスの予見のためのモデル」(オーディオ技術学会会報、1997年)の232ページの図13に示されている。修正測定は2003年にISO226:2003として規格化された。
結果的に、従来のラウドネス制御はラウドネスを変更するだけでなく、音色も変更する。この効果の大きさは、SPLに依存するが(SPLを86dBAから68dBAへ変更する際には、76dBAから58dBAへの変更の場合ほど目立たない)、全てのクラスにおいてこれは望ましいことではない。
これは、A.J.シーフェルト(Seefeldt)による「知覚されたラウドネス及び/またはオーディオ信号の知覚されたスペクトルバランスの計算と調整」(米国特許出願公報2009/0097676、2009年)に記載されているような処理によって補償される。
図7は、A.J.シーフェルト(Seefeldt)による「知覚されたラウドネス及び/またはオーディオ信号の知覚されたスペクトルバランスの計算と調整」(米国特許出願公報2009/0097676、2009年)に記載されている方法700のフローチャートを示している。
出力信号は、励振信号を算出し(710)、特定ラウドネスを算出し(720)、目標特定ラウドネスを算出し(730)、目標励振信号を算出し(740)、スペクトルの重みを算出し(750)、そしてスペクトルの重みを入力信号に適用し(760)出力信号を再合成することにより、処理される。
スペクトルの重みHは、入力信号の特定ラウドネスと目標特定ラウドネスによって決まる周波数帯域の重み付けである。A.J.シーフェルト(Seefeldt)による「知覚されたラウドネス及び/またはオーディオ信号の知覚されたスペクトルバランスの計算と調整」(米国特許出願公報2009/0097676、2009年)に記載されているように、これらの計算は、特定ラウドネスの算出と、目標特定ラウドネスに適用される特定ラウドネス算出の逆の処理を含む。
どちらの処理ステップも大きな計算量を必要とする。特定ラウドネス算出のための方法は、E.ツウィッカー(Zwicker)、H.ファストル(Fastl)、U.ヴィドマン(Widmann)、K.クラカワ、S.クワノ、S.ナンバによる「DIN45631(ISO532B)に準じたラウドネスの算出方法」(日本音響学会誌(E)、VOl.12、1991年)、及びB.C.J.ムーア(Moore)、B.R.グラスバーグ(Glasberg)、T.ベーア(Baer)による「閾値、ラウドネス及び部分的ラウドネスの予見のためのモデル」(オーディオ技術学会会報、1997年)で、提示されてきた。
本発明の目的は、少ない計算量で効率的な実施を可能にするために、オーディオ信号を修正するための改良された概念を提供することである。
この目標は、請求項1に係る装置または請求項20に係る方法により達成される。
本発明の一実施形態は、励振決定装置と記憶装置と信号修正装置を含む入力オーディオ信号修正装置を提供する。励振決定装置は、入力オーディオ信号の複数のサブバンドのうちの一つのサブバンドの励振パラメータ値を、そのサブバンド信号のエネルギー量に基づき決定するよう構成されている。記憶装置は、複数のスペクトル重み付け係数を含む参照表を記憶するよう構成されている。複数のスペクトル重み付け係数のうちの一つのスペクトル重み付け係数は、予め定められた一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連するものである。さらに、この記憶装置は、決定された励振パラメータ値に対応し、この励振パラメータ値が決定されたサブバンドに対応するスペクトル重み付け係数を出力するよう構成されている。信号修正装置は、修正サブバンドを出力するために、入力オーディ信号のうちのその励振パラメータが決定されたサブバンドの内容を、与えられたスペクトル重み付け係数に基づき修正するよう構成されている。
本発明に係るいくつかの実施形態は、オーディオ信号のサブバンドは、スペクトル重み付け係数を含む参照表を使用して簡単に修正することができるという中心思想に基づくものである。スペクトル重み付け係数は、それぞれのサブバンドとそのサブバンドの励振パラメータに応じて選択されてもよい。このために、参照表は、複数のサブバンドのうちの少なくとも一つの特定のサブバンドに関して、複数個の励振パラメータ既定値に対するスペクトル重み付け係数を含んでいる。この参照表を使用することにより、明示的計算(ラウドネスの算出と修正、及びラウドネス計算の逆の処理)が不必要となるので、計算量をかなり軽減することができる。従って、効率的な実施が可能となる。
本発明のいくつかの実施形態では、励振決定装置は複数のサブバンド全てに関して励振パラメータ値を決定するわけではない。さらに、参照表は、励振パラメータ値が決定されるサブバンドに関連するスペクトル重み付け係数だけを含む。このようにして、参照表のための格納スペースと励振決定装置に関する計算量を減少してもよい。
本発明に係るいくつかの実施形態は、励振パラメータ既定値と複数のサブバンドのうちのサブバンドと予め定められた複数個の外部修正パラメータ既定値とに関連する正に三次元の参照表に関するものである。
本発明のさらにいくつかの実施形態は、励振パラメータ既定値と複数のサブバンドのうちのサブバンドと外部修正パラメータ既定値と予め定められた複数個の背景雑音パラメータ既定値とに関連する正に四次元の参照表に関するものである。
入力オーディオ信号の修正装置のブロック図である。 等ラウドネス曲線の概略図である。 透過フィルターによって正規化された等ラウドネス曲線の概略図である。 入力オーディオ信号の修正装置のブロック図である。 入力オーディオ信号の修正方法のフローチャートである。 入力オーディオ信号の修正方法のフローチャートである。 入力オーディオ信号の公知の修正方法のフローチャートである。
以上のような添付図面を参照し、本発明の実施形態を説明する。
以下の説明において、同じまたは類似の機能特性を有する物体や機能ユニットに対して同じ参照符号が一部使用され、実施形態の説明における冗長を減らすために、一つの図面を参照しての説明を他の図面にも適用する。
図1は、本発明の一実施形態に係る入力オーディ信号修正措置100のブロック図を示す。この装置100は、励振決定装置110と記憶装置120と信号修正装置130を含む。励振決定装置110は記憶装置120に接続され、記憶装置120は信号修正装置130に接続されている。励振決定装置110は、入力オーディオ信号102の複数のサブバンドのうちの一つのサブバンド102の励振パラメータの値112を、そのサブバンド102のエネルギー量に基づき決定する。記憶装置120は複数のスペクトル重み付け係数を含む参照表を格納しており、その参照表において、複数のスペクトル重み付け係数のうちの一つのスペクトル重み付け係数124は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連する。さらに、記憶装置120は、励振パラメータ決定値112に対応し、その励振パラメータ値112が決定されたサブバンド102に対応するスペクトル重み付け係数124を出力する。信号修正装置130は、修正サブバンド132を出力するために、入力オーディオ信号のうちのその励振パラメータ値112が決定されたサブバンド102の内容を、出力されたスペクトル重み付け係数124に基づき修正する。
入力オーディオ信号を修正するためにスペクトル重み付け係数124の参照表を使用することにより、公知の方法に比較して、計算量をかなり軽減することができる。
励振決定装置110は、励振パラメータ値112をサブバンド102のエネルギー量に基づき決定する。これは例えば、サブバンド102に対する励振パラメータ値112を決定するために、サブバンド102のエネルギー量を測定することにより行われてもよい。この場合、エネルギー量は時間により及び/またはサブバンドにより異なるので、励振パラメータはサブバンドごとのパワーの大きさまたは特定のサブバンド内の短時間エネルギーを表すものであり得る。あるいは、励振パラメータ値はサブバンドの短時間エネルギーの(特有の、単射の、全単射の)関数(例えば指数関数、対数関数または一次関数)に基づき決定してもよい。例えば、量子化関数が使用されてもよい。この例では、励振決定装置110はサブバンドのエネルギー量を測定し、励振パラメータ値が励振パラメータ既定値のうちの一つと等しくなるように、測定したエネルギー量を量子化してもよい。換言すれば、測定したエネルギー値は励振パラメータの一つの既定値(例えば最も近似の励振パラメータ既定値)に割り当てられてもよい。あるいは、励振パラメータ値はエネルギー量の測定値を直接示し、記憶装置120がその励振パラメータ決定値を一つの励振パラメータ既定値に割り当ててもよい。
入力オーディオ信号のサブバンドは、入力オーディオ信号の様々な周波数帯域を表すものであってもよい。サブバンドは周波数帯域の感覚的な分布を考慮して割り振られてもよい。例えばERB尺度、バルク尺度、または人間の耳の周波数分解能を模倣する何か別の周波数間隔に準じて、割り振られてもよい。換言すれば、入力オーディオ信号の複数のサブバンドはERB尺度またはバルク尺度に準じて区分されていてもよい。
記憶装置120は、励振パラメータ(励振信号)と、その励振パラメータ値112が決定されたサブバンド102を示すサブバンド指標の入力部を含む。あるいは、記憶装置120はさらに別のパラメータのために、一つまたはそれ以上の別の入力部をさらに含んでいてもよい。
記憶装置120は、例えばROM、ハードディスク、CD、DVDや他の何らかの種類の不揮発性メモリー、あるいはRAMなどのデジタル記憶媒体であってもよい。
参照表は、複数のスペクトル重み付け係数を含む少なくとも二次元のマトリクスを表すものである。参照表に含まれる一つのスペクトル重み付け係数124は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに一義的に関連している。換言すれば、参照表に含まれる各スペクトル重み付け係数124は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連し得る。記憶装置120は、励振パラメータ決定値112に最も近い一つの励振パラメータ既定値に関連するスペクトル重み付け係数124を出力してもよい。あるいは、例えば、記憶装置120は、励振パラメータ決定値112に最も近い二つの励振パラメータ既定値に関連する二つのスペクトル重み付け係数124を直線的にまたは対数的に補完してもよい。
励振パラメータ既定値は、直線的にまたは対数的に割り振られてもよい。
信号修正装置130は、例えば、その励振パラメータ値112が決定されたサブバンド102の内容を、与えられたスペクトル重み付け係数によって増幅するかまたは減衰させてもよい。
上記の概念を使用することにより、例えば、オーディオ信号の音の強さのレベルの増大または減少によって引き起こされた低周波、中間周波及び高周波によって変化する人間の聴覚的な減衰が簡単に補償され得る。例えば、再生レベルをあるレベルから別のレベルに下げた場合、オーディオ信号の知覚されるスペクトルバランスは変化する。これは、等ラウドネス曲線を示している図2,3によって説明される。特に低周波域に関して、別々の等ラウドネス曲線は互いに平行ではない。低周波帯域の増幅または減衰は、中間周波数及び/または高周波数帯域とは違い、等ラウドネス曲線のカーブと同じにしてもよく、これにより、別々の等ラウドネス曲線は平行に、またはそうする前よりもより平行になる。このようにして、知覚的なスペクトルバランスの変化は、前述の概念を使用することにより、補償されるかまたはほぼ補償され得る。
図2の等ラウドネス曲線と図3の等ラウドネス曲線との違いは、透過フィルターによる規格化である。この透過フィルターは、外耳から内耳によるオーディオ伝送のフィルタリング効果をモデル化したものであってもよい。このような透過フィルターは、入力オーディオ信号を励振決定装置110に与える前にそれをフィルタリングするために、図1の装置に任意に備えられてもよい。
入力オーディオ信号のより連続的な修正のために、励振決定装置110は複数のサブバンドのうちの二つ以上のサブバンドに対して一つの励振パラメータ値112を決定してもよい。その後、記憶装置120が、励振パラメータ値112が決定された各サブバンド102に対してスペクトル重み付け係数124を与えてもよい。そして、信号修正装置130は励振パラメータ値112が決定された各サブバンド102の内容を、それぞれ対応するスペクトル重み付け係数124に基づき修正してもよい。
入力オーディオ信号の複数のサブバンドはメモリーユニットによって与えられてもよく、あるいは解析フィルターバンクによって生成されてもよい。
励振パラメータは、複数のサブバンドのうちの一つのサブバンドに対して決定してもよいし、二つ以上のサブバンドに対して決定してもよいし、あるいは全てのサブバンドに対して決定してもよい。このために、装置100は励振決定装置110を一つだけ有し、その装置110が一つの励振パラメータ値、二つ以上の励振パラメータ値または全ての励振パラメータ値を決定してもよい。あるいは、装置100は、励振パラメータ値112が決定されるサブバンド102に対してそれぞれ一つの励振決定装置110を備えていてもよい。さらに、装置100は、励振パラメータが決定される一つまたはそれ以上のサブバンドに対して一つの信号修正装置130を備えていてもよいし、またはそれ以上の信号修正装置130を備えていてもよい。しかし、励振パラメータ値112が決定される全てのサブバンド102に関して、一つの参照表(と記憶装置)を使用するだけで十分である。
励振決定装置110と記憶装置120と信号修正装置は、それぞれ独立したハードウェアユニット、コンピュータ、マイクロコントローラまたはデジタル信号プロセッサの一部であってもよく、また、コンピュータ、マイクロコントローラまたはデジタル信号プロセッサで動作するよう構成されたコンピュータプログラムまたはソフトウェア製品であってもよい。
図4は、本発明の一実施形態に係る入力オーディオ信号の修正装置400のブロック図である。装置400は図1に示した装置と類似しているが、解析フィルターバンク410と合成フィルターバンク420をさらに含んでいる。解析フィルターバンク410は、入力オーディオ信号を複数のサブバンドに分ける。そして、励振決定装置110は、複数のサブバンドのうちの一つまたはそれ以上のサブバンドに対して励振パラメータ値を決定する(特性を算出する)。その後、記憶装置120は、対応する一つまたはそれ以上のスペクトル重み付け係数を一つまたはそれ以上の信号修正装置130に送る。最後に、合成フィルターバンク420は、修正オーディオ信号(または出力オーディオ信号)を得てそれを出力するために、少なくとも一つの修正サブバンドを含む複数のサブバンドを結合する。
図4に示されている例は、ここで提案する方法の一般的な場合の応用である。n番目のサブバンド信号(n番目のサブバンド)に対するものとして示されている処理は、他の全てのサブバンド信号(または、励振パラメータ値が決定されるサブバンド全て)にも同じように適用され得る。
参照表に含まれているスペクトル重み付け係数は、図4において点線で示されているように、一つの外部修正パラメータ既定値にも関連している(図1の装置にも適用可能である)。外部修正パラメータ(または単に、修正パラメータ)は、例えばユーザーインターフェースの入力値(例えば音量及び/または雰囲気の設定)を表すものであってもよい。この場合、結果的に、記憶装置120は外部修正パラメータ値に対応するスペクトル重み付け係数を出力し得る。例えば、ユーザーが音量設定を増大させるか低下させた場合、外部修正パラメータ値が変わり、記憶装置120はそれに対応する別のスペクトル重み付け係数を出力してもよい。要約すると、記憶装置120は、サブバンドの励振パラメータの決定値に対応し、励振パラメータ値が決定されたサブバンドに対応し、そして外部修正パラメータ値に対応するスペクトル重み付け係数を出力してもよい。
この例では、参照表は、励振パラメータの既定値に関連し、複数のサブバンドのそれぞれのサブバンドに関連し、外部修正パラメータの既定値に関連する正に三次元のものである。これは、参照表に含まれる各スペクトル重み付け係数は、一つの特定の励振パラメータ既定値と、複数のサブバンドのうちの一つのサブバンドと、一つの特定の外部修正パラメータ既定値とに関連しているということを意味している。換言すれば、参照表は、一つの励振パラメータ既定値と一つのサブバンドと一つの外部修正パラメータ既定値の組み合わせに対して、一つのスペクトル重み付け係数を含むものである。外部修正パラメータ既定値は、外部修正パラメータの可能範囲内全体に、例えば線形的にまたは対数的に分配されていてもよい。
いくつかの実施形態において、参照表に含まれるスペクトル重み付け係数はまた背景雑音パラメータの既定値と関連していてもよい。背景雑音パラメータは入力オーディオ信号の背景雑音のレベルを表すものであってもよい。このようにして、例えば、背景雑音の存在下でのオーディオ信号の部分的マスキング効果の補償が実現できる。この場合、記憶装置は背景雑音パラメータ値に対応するスペクトル重み付け係数を出力し得る。これは、上述した外部修正パラメータの考慮に加えてさらに、またはそれに代わるものとして実施され得る。これらの両方を考慮する場合、記憶装置は、サブバンドの励振パラメータの決定値に対応し、励振パラメータ値が決定されたサブバンドに対応し、外部修正パラメータ値に対応し、そして背景雑音パラメータ値に対応するスペクトル重み付け係数を出力してもよい。背景雑音パラメータ既定値は、背景雑音パラメータの可能範囲内全体に、例えば線形的にまたは対数的に分配されていてもよい。
背景雑音パラメータは背景雑音検知器によって決定されてもよい。これは、入力オーディオ信号全体に関して、サブバンドに分けられる前に行われてもよいし、あるいは、一つのサブバンド、それ以上のサブバンドまたは全ての個々のサブバンドに関して、サブバンドレベルで行われてもよい。または、入力オーディオ信号の複数のサブバンドがメモリーユニットに格納され、それによって与えられる場合には、背景雑音パラメータもまたメモリーユニットによって与えられてもよい。
いずれの場合にも、参照表に含まれるスペクトル重み付け係数は特定ラウドネスパラメータまたは目標特定ラウドネスパラメータに基づき算出され得るが、記憶装置は特定ラウドネスパラメータや目標特定ラウドネスパラメータのための入力部を有してはいない。スペクトル重み付け係数の計算は外部で行われ、その後記憶装置に格納されてもよい。従って、上述の概念によって実現できる装置においてはスペクトル重み付け係数の明示的計算は不必要であるので、この装置の計算量は公知の装置と比較してかなり軽減できる。
スペクトル重み付け係数は例えば以下のように算出され、記憶装置に格納される。
オーディオ処理はデジタル領域で実行されてもよい。従って、オーディオ入力信号は、オーディオソースからサンプリング周波数fcでサンプリングされた離散時間シーケンスx[n]によって示される。このシーケンスx[n]は、以下の式によって与えられるデシベルで表されるx[n]のRMSがリスナーによって知覚されるそのオーディオの音圧レベル(dB)に等しくなるように、適切にスケーリングされたものであると仮定できる。さらに、説明を単純化するために、オーディオ信号はモノフォニックであると仮定してもよい。
Figure 0005632532
オーディオ入力信号は解析フィルターバンクまたはフィルターバンク関数(「解析フィルターバンク」)に適用される。解析フィルターバンクの各フィルターは内耳の基底膜に沿った特定の位置における周波数応答をシミュレートするよう設計されている。このフィルターバンクは一組の線形フィルターを含んでいてもよく、それらの帯域幅と感覚は、B.C.J.ムーア(Moore)、B.グラスバーグ(Glasberg)及びT.ベーア(Baer)によって規定されたような(B.C.J.ムーア(Moore)、B.グラスバーグ(Glasberg)及びT.ベーア(Baer)による「閾値、ラウドネス及び部分的ラウドネスの予見のためのモデル」参照)ERB周波数尺度において一定のものである。
ERB周波数尺度は人間の感覚とより厳密に一致し、主観的なラウドネス結果に一致する客観的なラウドネス測定結果の出力の際に改善された性能を示すが、バルク周波数尺度は低い性能で用いられ得る。
ヘルツで示される中心周波数fに関して、ヘルツで示される一つのERB帯域の幅は以下のように概算される。
Figure 0005632532
この関係から、歪んだ尺度のどの点においても、その歪んだ尺度を単位にした対応するERBは1であるように、歪んだ周波数尺度が規定される。ヘルツで示される線形周波数からこのERB周波数尺度に変換するための関数は、以下のように式1の逆数を積分することにより得られる。
Figure 0005632532
また、ERB尺度から線形周波数尺度に戻す変換は、以下のように式2aをfに関して解くことで表すことができる。
Figure 0005632532
上記式において、eはERB尺度の単位で表されている。
解析フィルターバンクは、ERB尺度に沿って等間隔に配置された中心周波数fc[1]…fc[B]で、サブバンドと称されるB個の聴覚フィルターを含んでいてもよい。詳しくは以下の通りである。
Figure 0005632532
b=2…Bの場合、
Figure 0005632532
Figure 0005632532
上記式において、Δは解析フィルターの所望のERB間隔であり、fminとfmaxはそれぞれ所望の最小中心周波数と最大中心周波数である。Δ=1を選択し、人間の耳が感知することのできる全ての周波数範囲を考慮して、fmin=50Hz及びfmax=20,000Hzと設定してもよい。このようなパラメータで、例えば上記式3a〜3cを適用すると、B=40個の聴覚フィルターという結果となる。
各聴覚フィルターの振幅周波数応答は、ムーア(Moore)とグラスバーグ(Glasberg)が提案したように、おおよその指数関数によって特徴付けることができる。特に、中心周波数f[b]のフィルターの振幅特性は以下のように算出されてもよい。
Figure 0005632532
Figure 0005632532
Figure 0005632532
解析フィルターバンクのフィルタリング演算は、一般的に短時間離散フーリエ変換(STDFT)と称される有限長さの離散フーリエ変換を使用した適切な近似値計算であってもよい。フルレート実施と称されるオーディオ信号のサンプリングレートでフィルターを作動する実施により、時間分解能は、正確なラウドネス測定のために必要なものよりも高くなると信じられている。
入力オーディオ信号x[n]のSTDFTは以下のように定義される。
Figure 0005632532
上記式において、kは周波数指標、tは時間ブロック指標、NはDFTのサイズ、Tは飛び越しサイズ、w[n]は以下のように規格化された長さNのウィンドウである。
Figure 0005632532
式5aの変数tは秒での時間の測定値ではなく、STDFTの時間ブロックを表す離散指標である。tの値が1増加することは、信号x[n]に沿ってT個のサンプル分を飛び越すことを表す。以下、指標tへの言及はこの定義を前提としている。実施の詳細に応じて様々なパラメータ設定とウィンドウ形状が使用できるが、fs=44100Hzの場合、N=2048とT=1024を選択し、w[n]をハンウィンドウとすることにより、時間と周波数分解能の適切なバランスが取れる。上述したSTDFTは、高速フーリエ変換(FFT)を使用することで、より効率的に実施できる。
STDFTの代わりに、修正離散余弦変換(MDCT)を解析フィルターバンクの実施のために使用してもよい。MDCTは感覚的オーディオコーダーで一般的に使用されている変換である。入力オーディオ信号x[n]のMDCTは以下の式により定められてもよい。
Figure 0005632532
一般的に、信号x[n]の完全な再生が可能となるように、飛び越しサイズTは変換長さNの正確に半分となるように選択される。
解析フィルターバンクの出力は、フィルターバンクの各バンドを外耳から中耳によるオーディオ伝送に従ってフィルタリングする透過フィルターまたは透過フィルター関数(「透過フィルター」)に適用される。
入力オーディオ信号のラウドネスを算出するためには、透過フィルターaの適用後の解析フィルターバンクの各フィルターでのオーディオ信号の短時間エネルギーの測定値が必要である。この時間・周波数変動測定値は励振と称される。解析フィルターバンクaの各フィルターの短時間エネルギー出力は、以下のように、周波数領域でのフィルター応答に入力信号のパワースペクトルを掛ける励振関数E[b,t]で概算してもよい。
Figure 0005632532
上記式において、bはサブバンド番号、tはブロック番号、Hb[k]とP[k]はそれぞれ、STDFTまたはMDCTのビン指標kに対応する周波数でサンプリングされた聴覚フィルターと透過フィルターの周波数応答である。聴覚フィルターの振幅特性のための形態は、式4a〜4cで特定されているもの以外に、式7で示されているものも同様の結果を得るために使用できることに留意すべきである。
つまり、励振関数の出力は、ERBバンドにおける期間tごとのエネルギーEの周波数領域表記である。
いくつかの応用のためには、励振E[b,t]を特定ラウドネスに変換する前に、それを平滑化することが望ましい場合がある。例えば、平滑化は以下の式に従う平滑化関数で再帰的に行われてもよい。
Figure 0005632532
上記式において、各バンドbにおける時定数λbは所望の応用に従い選択される。ほとんどの場合、時定数はバンドb内の人のラウドネス知覚の積分時間に比例するように有利に選択され得る。ワトソン(Watson)とゲンゲル(Gengel)は、この積分時間は低周波(125〜200Hz)で150〜175ms、高周波で40〜60msであることを示す実験を行った(チャールズ(Charles)S.ワトソン(Watson)とロイ(Roy)W.ゲンゲル(Gengel)による「聴覚感度に関連する信号期間と信号周波数」(米国音響学会誌、Vol.46、No.4(パート2)、1969年、989〜997ページ)。
変換関数(「特定ラウドネス」)において、励振の各周波数帯域は特定ラウドネスの成分に変換されてもよく、特定ラウドネスはERBごとのソーンで測定される。
最初に、特定ラウドネスを算出する際に、?[b,t]の各バンドにおける励振レベルを、例えば以下のような透過フィルターによって規格化された等ラウドネス曲線によって規定されるような1kHzでの透過励振レベルに変換してもよい。
Figure 0005632532
上記式において、T1kHz(E,f)は1kHzでのレベルを生成する関数であり、これは周波数fでのレベルEに等しいラウドネスである。1kHZでの透過レベルへの変換は以下のような特定ラウドネスの算出を簡単にする。
次に、各バンドにおける特定ラウドネスは以下のように算出されてもよい。
Figure 0005632532
上記式において、NNB[b,t]とNWB[b,t]はそれぞれ狭帯域信号モデルと広帯域信号モデルに基づく特定ラウドネス値である。値α[b,t]はオーディオ信号から算出される0と1の間にある補間係数である。
狭帯域特定ラウドネス値NNB[b,t]と広帯域特定ラウドネス値NWB[b,t]は、以下のような指数関数を使用した変換励振から推定してもよい。
Figure 0005632532
上記式において、TQ1kHzは1kHzの音色が聞こえなくなる閾値での励振レベルである。等ラウドネス曲線によると、TQ1kHzは4.2dBである。これらの特定ラウドネス関数のどちらも、励振レベルが聞こえなくなる閾値に等しい場合には0である。聞こえなくなる閾値よりも高い励振の場合には、どちらの関数も、スティーブンズの力の感覚の法則に従うべき法則で単調に増加する。狭帯域関数のための指数として、広帯域関数のためのものよりも大きいものが選択され、これにより、狭帯域関数は広帯域関数よりも急に増加する。狭帯域と広帯域のための指数βとゲインGは、音色と雑音のラウドネスの増大に関する実験的データに一致するように選択される。
励振が聴覚の閾値である場合には、特定ラウドネスは0ではなく、何らかの小さな値となってもよい。そして、励振が0に下がるにつれて、特定ラウドネスは単調に0まで下がる。これが適切である理由は、聴覚の閾値は確率的閾値(音の期間の50%を知覚するポイント)であることと、それぞれが閾値である複数の音が一緒に与えられると、それらの音がそれぞれ個別に与えられた場合よりも聴こえやすい音となり得るということである。励振が閾値以下の時に特定ラウドネスが0となるように規定された場合、ゲインを解決するための特有の方法は閾値以下の励振に対しては存在しない。他方、0以上の全ての励振の値に対して特定ラウドネスが単調に増加するように規定された場合、特有の解決法が存在する。1よりも大きいラウドネススケーリングは常に1よりも大きいゲインを生じさせ、その逆も同じである。式11a,11bの特定ラウドネス関数は以下のように所望の特性を有するように修正してもよい。
Figure 0005632532
上記式において、定数λは1よりも大きく、指数ηは1よりも小さく、定数K,Cは特定ラウドネス関数とその第1の導関数が以下のポイントで連続するように選択される。
Figure 0005632532
特定ラウドネスから、全体的または「合計」ラウドネスL[t]は、以下のように全てのバンドbに渡る特定ラウドネスの合計によって与えられる。
Figure 0005632532
特定ラウドネス修正関数(「特定ラウドネス修正」)において、?N[b,t]と称される目標特定ラウドネスは、様々な方法で特定ラウドネスから算出できる。以下に詳細に説明するように、目標特定ラウドネスは、例えば音量調整の場合にスケール係数αを使用して算出されてもよい(以下の式16とそれに関する説明を参照)。自動ゲイン制御(AGC)とダイナミックレンジ制御(DRC)の場合には、目標特定ラウドネスは、入力ラウドネスに対する所望の出力ラウドネスの比を使用して算出されてもよい(以下の式17,18とそれらに関する説明を参照)。ダイナミック均等化の場合には、目標特定ラウドネスは、式23とそれに関する説明に示されている関係を使用して算出されてもよい。
この例では、各バンドbと各時間間隔tのために、ゲイン解決関数は、平滑化された励振?[b,t]と目標特定ラウドネス?N[b,t]をその入力として取り、ゲインG[b,t]とも呼ばれるスペクトル重み付け係数を生成し、これらのスペクトル重み付け係数はその後オーディオを修正するために使用される。以下のように、関数Ψ{・}は励振から特定ラウドネスへの非直線的変換を表す。
Figure 0005632532
ゲイン解決法は以下のようにG[b,t]を発見する。
Figure 0005632532
ゲイン解決関数は、周波数変動及び時間変動ゲイン(スペクトル重み付け係数)を決定し、それらがオリジナルの励振に適用されると、理想的には所望の目標特定ラウドネスに等しい特定ラウドネスが得られる。実際には、ゲイン解決関数は、周波数変動及び時間変動ゲインを決定し、それらがオーディオ信号の周波数領域バージョンに適用されると、そのオーディオ信号の特定ラウドネスと目標特定ラウドネスとの間の差を減じるためにオーディオ信号を修正することになる。理想的には、この修正は、修正オーディオ信号が目標特性ラウドネスの近似値である特定ラウドネスを有するように行われる。式14aの解は様々な方法で求められる。例えば、Ψ-1{・}で表される特定ラウドネスの逆数のための閉形式数式が存在する場合、ゲインは式14aを以下のように配列し直すことにより直接算出できる。
Figure 0005632532
あるいはΨ-1{・}のための閉形式数式が存在しない場合には、反復アプローチが採用され、各反復のために、ゲインの現在の推定値を使用して式14aが概算される。その結果得られた特定ラウドネスは所望の目標と比較され、ゲインはその誤差に基づき更新される。ゲインが適切に更新されると、所望の解に収束する。前述したように、目標特定ラウドネスは以下のように特定ラウドネスのスケーリングによって表されてもよい。
Figure 0005632532
式13を式14cに、そして式14cを式14bに代入することにより、以下のような別のゲインのための式が得られる。
Figure 0005632532
算出されたスペクトル重み付け係数またはゲインは、記憶装置の参照表に保存される。
本発明のいくつかの実施形態において、励振決定装置は複数のサブバンドの全てに対して励振パラメータ値を決定するわけではない。この場合、参照表は、励振パラメータ値が決定されるサブバンドに関連するスペクトル重み付け係数だけを含むもので十分である。これにより、記憶装置の参照表のための格納スペースがかなり節約される。
等ラウドネス曲線のカーブは補償されるべきものであるが、それは低周波でより強くなっているので(図2,3参照)、低周波サブバンドに関してだけ、ラウドネス変異を補償するだけで十分である。従って、低周波サブバンドに関して励振パラメータを算出し、スペクトル重み付け係数を保存することは有効である。対照的に、高周波サブバンドに関する何の励振パラメータ値も決定されなくてもよいし、高周波サブバンドに関連する何のスペクトル係数も保存されていなくてもよい。換言すれば、励振パラメータ値が決定されるサブバンドは、何のパラメータ値も決定されないサブバンドよりも低い周波数を含む。
さらに、高周波サブバンドを修正する必要はない。つまり、励振決定装置が、あるサブバンドに対する励振パラメータ値を決定しない場合には、信号修正装置はそのサブバンドの内容を修正しなくてもよい。これは、外部修正パラメータや背景雑音パラメータのような他のいかなるパラメータをも考慮しない場合にのみ、当てはまる。
別の例では、記憶装置によって出力される一つのスペクトル重み付け係数は、信号修正装置によって一つ以上のサブバンドに対して使用されてもよい。換言すれば、信号修正装置は、何の励振パラメータ値も決定されないサブバンドの内容を、励振パラメータ値が決定されたサブバンドに対して与えられたスペクトル重み付け係数に基づき、修正してもよい。図2,3に示した等ラウドネス曲線の動きを考えると、高周波バンドは同じスペクトル重み付け係数に基づき修正することで十分である。このスペクトル重み付け係数は、励振パラメータ値が決定された全てのサブバンドのうちで最も高い周波数を含むサブバンドに対して与えられたスペクトル重み付け係数であってもよい。より一般的には、信号修正装置は、何の励振パラメータ値も決定されないサブバンドの内容を、励振パラメータ値が決定されたサブバンドのうち、他の全てのものよりも高い周波数を含むサブバンドに対して与えられたスペクトル重み付け係数に基づき、修正してもよい。例えば、励振決定装置は、複数のサブバンドのうちの5〜15個の(あるいは2〜20個の、7〜17個のまたは5個、6個、7個、8個、9個、10個、11個、12個のみ)のサブバンドに対してだけ、または複数のサブバンドのうちの1/4、1/3、半分または2/3以下に対してだけ励振パラメータ値を決定するだけで十分である。これらのサブバンドは、複数のサブバンドのうち、他のサブバンドよりも低い周波数を含むものであってもよい。さらに、信号修正装置は、これらのサブバンドの内容を、これらのサブバンドに対して記憶装置から与えられたスペクトル重み付け係数に基づき修正してもよい。
例えば、バルク尺度は25個の周波数帯域を含み、最も低いいくつかの周波数帯域が理想的な動きから最も大きく逸脱しているので、最も低い7個の周波数帯域を修正するだけで十分である。あるいは、ERB尺度の最も低いいくつかの帯域を修正してもよい。複数のサブバンドのうちの残りのサブバンドは、励振パラメータが決定された他の全てのサブバンドよりも高い周波数を含むサブバンドであるが、これらは修正しないままにしておいてもよいし、外部修正パラメータ及び/または背景雑音パラメータに基づき修正してもよいし、あるいは、励振パラメータ値が決定されたサブバンドに対して与えられたスペクトル重み付け係数に基づき修正してもよい。
図5は、本発明に係る入力オーディオ信号の修正方法500のフローチャートを示す。方法500は、入力オーディオ信号の複数のサブバンドのうちの一つのサブバンドの励振パラメータ値を、そのサブバンドのエネルギー量に基づき決定すること510を含む。方法500は、決定された励振パラメータ値に対応し、その励振パラメータ値が決定されたサブバンドに対応するスペクトル重み付け係数を出力すること520をさらに含む。スペクトル重み付け係数は、複数のスペクトル重み付け係数を含む参照表に保存される。複数のスペクトル重み付け係数のうちの一つのスペクトル重み付け係数は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連するものである。方法500は、最後に、修正サブバンドを出力するために、励振パラメータ値が決定されたサブバンドを、出力されたスペクトル重み付け係数に基づき修正することを含む。
換言すれば、方法500は、励振信号の算出510と、スペクトルの重み(スペクトル重み付け係数)の参照表からの取得520と、出力オーディオ信号の修正530を含む。方法500は、出力オーディオ信号の再合成(修正オーディオ信号を得るためにサブバンドを結合すること)を任意に含む。
これは、例えば効率的で一般的な信号修正方法であり得る。
さらに任意に、外部修正パラメータも上述したように考慮してもよい(点線で示されているように)。
背景雑音サブバンドレベル(背景雑音パラメータ)もさらに考慮することについては、図6の方法600で示されている。
本発明のいくつかの実施形態はオーディオ信号の知覚的処理の効率的な実現に関する。上述の概念は、周波数選択的オーディオ信号修正及び処理のための柔軟で高度に効率的な構成に関し、これにより、明示的な聴覚モデル化のための計算量の増加を被ることなく、心理音響的効果の特徴をこの処理に簡単に統合することができる。一例として、上述の構成に基づく知覚的ラウドネス制御のためのマルチバンドプロセッサの実現が考えられる。
これは、心理音響的ラウドネス制御の効率的な実現であるだろう。
上述の処理は、それぞれの聴覚的周波数帯域内の入力レベルによって制御されるフィルター特性を有する入力信号フィルタリングに匹敵する。
基本的に、ここで提案している方法は、特定ラウドネスの算出とそれに対応する逆算とを回避し、これにより、メモリー必要量のわずかな増加と引き換えに非常に多大な計算処理ステップを避けることができるものである。
単純な参照表(LUT)を使用し、場合により補間を伴う効率的な実施が可能である。
LUTは上述のような入力値と出力値を測定する処理によって算出される。LUTは例えば3次元のものである。入力励振と、修正パラメータと周波数帯域指標を考慮して、修正サブバンドまたは修正オーディオ信号を出力する。
例えば、LUTの機能性は低周波数帯域のためだけの周波数帯域指標に依存しているということを認識することにより、LUTは効率的に実施され得る。例えばバルク尺度に対応する分解能の聴覚フィルターバンクを使用した場合、そのフィルターバンクは25個のバンドパスフィルターを含み得る。LUTには最も低い7個の帯域のための変換関数を保存するだけで十分である。それより高い帯域の指標に関しては、帯域指標7の場合と同じ入力−出力関係が保持されるからである。
この効率的な処理は心理音響的な意味で正確な音量調整を実現する。他の応用、つまりダイナミックレンジ制御及び/またはダイナミック均等化は、LUTの適切な索引付けにより、上述のような効率的な処理で可能となる。
最後に、背景雑音補償(つまり背景雑音の存在下でのオーディオ信号の部分的マスキング効果の補償)は、LUTに背景雑音レベルを表す四つ目の次元を追加することにより達成できる。ここで提案する雑音補償のための処理のブロック図を図6に示す。
これまで説明してきた処理は心理音響的ラウドネススケーリングアルゴリズムのエミュレーションを目指すものである一方、図1または図4に示されている構成は、LUT以降に心理音響的ラウドネススケーリングアルゴリズムで得られるようなものよりもずっと豊かな音修正スペクトルを生成することができる。さらにもっと多くの要因(例えばユーザー選択設定や他の時間変動要因など)に依存させることも可能である。閉形式数式として与えられる関数によって提供される特徴を超えて、リスナーの主観的な好みに応じて自由に「調節」可能である。
つまり、本発明は周波数選択的オーディオ信号修正処理のための柔軟で高度に効率的な構成に関し、この構成は、明示的聴覚モデル化のための計算量の増加を伴うことなく、心理音響的効果の特徴をその処理に簡単に組み込むことができる。
要約すると、ここで提案した効率的な処理は以下のステップを含む。入力信号に基づき、一つまたはそれ以上の特性値(励振パラメータ値を含む)が複数個の周波数帯域(例えば臨界帯域)に関して算出される。これらの特性値(及び場合によっては他の情報も)に基づき、これらの周波数帯域のそれぞれに関して、表を参照して、一つまたはいくつかの出力パラメータ(スペクトル重み付け係数)を決定する。これらの表に基づく出力パラメータはその後、それぞれ対応する周波数帯域内の入力信号の修正(例えば乗法スケーリング)を決定するのに使用される。
周波数帯域内のオーディオ信号処理は、通常、フィルターバンクの使用を意味している。つまり、入力信号は解析フィルターバンクによっていくつかの周波数帯域(サブバンド)に分けられ、そして、修正サブバンド信号を合成フィルターバンクに送ることによって最終的な出力信号が得られる。解析及び合成フィルターバンクは、入力信号を完全にまたはほぼ完全に再生するよう協働する。
周波数帯域の典型的な個数は4〜40である。特性値に基づく表の参照は、通常、それらの特性値を表内の参照指標として使用できる限られた値の集合に量子化することを伴う。さらに、量子化の刻み幅を粗く設定し、表から取り出した(二つまたはそれ以上の)隣接する出力パラメータ値の間を補完することにより、参照表のサイズを小さくすることができる。パラメータ出力値算出のためのいくつかの入力特性値を考慮するために、例えば、励振指標と音色指標と周波数指標を含む修正係数LUTのような何次元かの参照表が使用できる。非常に簡単な(そして効率的な)場合には、出力パラメータ値は、出力サブバンド信号を決定するために入力サブバンドに適用される係数を直接表している。これは、例えば図4に示されている。
上述の概念のいくつかの側面を装置に関して説明してきたが、これらの側面は相応する方法の説明でもあることは明白であり、ブロックや装置は方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップに関して説明した側面は、相応の装置の対応するブロックやアイテムまたは特徴の説明でもある。
実施条件により、本発明はハードウェアまたはソフトウェアで実施可能である。この実施形態は、例えばフロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMやFLASHメモリーなどの、電子読み取り制御可能な信号が中に保存されたデジタル記憶媒体を使用して実施することができ、これらの電子読み取り制御可能な信号は、それぞれの方法が実行できるように、プログラム可能なコンピュータシステムと協働する(または協働可能である)。従って、このようなデジタル記憶媒体はコンピュータ読み取り可能なものであってもよい。
本発明の他の実施形態は、電子読み取り制御可能な信号を有する持続的または実体的なデータキャリアを含み、これらの電子読み取り制御可能な信号は、ここで説明した方法のうちの一つを実行できるように、プログラム可能なコンピュータシステムと協働可能である。
一般的に、本発明の実施形態は、プログラムコードを備えたコンピュータプログラム製品として実施でき、このプログラム製品がコンピュータで動作した際、このプログラムコードは前述の方法のうちの一つを実行するためのものである。このようなプログラムコードは、例えば機械読み取り可能なキャリアに保存されていてもよい。
他の実施形態は、ここで説明した方法のうちの一つを実行するためのものであり、機械読み取り可能なキャリアに保存されているコンピュータプログラムを含む。
換言すれば、本発明の方法の一実施形態は、従って、コンピュータで動作した際、前述の方法のうちの一つを実行するためのプログラムコードを有するコンピュータプログラムである。
本発明の方法の別の実施形態は、従って、前述の方法のうちの一つを実行するためのコンピュータプログラムを格納しているデータキャリア(またはデジタル媒体またはコンピュータ読み取り可能な媒体)である。
本発明の方法の別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。このデータストリームまたは一連の信号は、例えばインターネットのようなデータ通信接続を介して送信されるように構成されていてもよい。
さらに別の実施形態は、ここで説明した方法のうちの一つを実行するように構成された、例えばコンピュータやプログラム可能な論理装置のような処理手段を含む。
本発明のさらに別の実施形態は、ここで説明した方法のうちの一つを実行するためのコンピュータプログラムがインストールされているコンピュータを含む。
いくつかの実施形態において、ここで説明した方法の機能性のうちのいくつかまたは全てを実行するために、プログラム可能な論理装置(例えばフィールドプログラマブルゲートアレイ)を使用してもよい。いくつかの実施形態において、ここで説明した方法のうちの一つを実行するために、フィールドプログラマブルゲートアレイがマイクロプロセッサと協働してもよい。一般的に、これらの方法は何らかのハードウェア装置によって実行されることが好ましい。
上述の実施形態は単に本発明の原理を説明しているにすぎない。ここで説明した配置や詳細に関して様々な修正や変更が当業者には明らかであろう。従って、本発明は以下の特許請求項の範囲によってのみ制限され、上述の実施形態で示された詳細によっては制限されない。

Claims (20)

  1. 入力オーディオ信号を修正するための装置(100)であり、
    入力オーディオ信号の複数のサブバンドのうちの一つのサブバンド(102)の励振パラメータ値(112)を、そのサブバンド(102)のエネルギー量に基づき決定するよう構成された励振決定装置(110)であり、励振パラメータ値(112)はそのサブバンドのオーディオ信号のパワー、そのサブバンドのオーディオ信号の短時間エネルギーまたはそのサブバンドのオーディオ信号の短時間エネルギーの量子化値を示すものである励振決定装置(110)と、
    複数のスペクトル重み付け係数を含む参照表を格納している記憶装置(120)であり、複数のスペクトル重み付け係数のうちの一つのスペクトル重み付け係数は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連し、記憶装置は、励振パラメータの決定値(112)とその励振パラメータ値(112)が決定されたサブバンド(102)に対応するスペクトル重み付け係数(124)を出力するよう構成された記憶装置(120)と、
    修正サブバンド(132)を出力するために、入力オーディオ信号のうちの励振パラメータ値(112)が決定されたサブバンド(102)の内容を、オーディオ信号のそのサブバンドを参照表から与えられたスペクトル重み付け係数で乗法スケーリングを行うことにより、出力されたスペクトル重み付け係数(124)に基づき修正するよう構成された信号修正装置(130)を含み、
    信号修正装置(130)は、何の励振パラメータ値も決定されないサブバンドの内容を、励振パラメータ値(112)が決定されたサブバンド(102)に対して出力されたスペクトル重み付け係数(124)に基づき修正するよう構成されている
  2. 請求項1に記載の装置であり、
    励振決定装置(110)は複数のサブバンドのうちの二つ以上のサブバンド(102)に関して一つの励振パラメータ値(112)を決定するよう構成され、
    記憶装置(120)は、励振パラメータ値(112)が決定された各サブバンド(102)に対してスペクトル重み付け係数(124)を出力するよう構成され、
    信号修正装置(130)は、励振パラメータ値(112)が決定された各サブバンド(102)の内容を、それぞれに対応して出力されたスペクトル重み付け係数(124)に基づき修正するよう構成されている。
  3. 請求項1または2に記載の装置であり、
    入力オーディオ信号を複数のサブバンドに分けるよう構成された解析フィルターバンク(410)と、
    修正オーディオ信号を出力するために、少なくとも一つの修正サブバンド(132)を含む複数のサブバンドを結合するよう構成された合成フィルターバンク(420)をさらに含む。
  4. 請求項1、2または3に記載の装置であり、参照表に含まれる各スペクトル重み付け係数は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連する。
  5. 請求項1、2、3または4に記載の装置であり、入力オーディオ信号の複数のサブバンドのうちの一つのサブバンドは、ERB尺度、バルク尺度または人間の耳の周波数分解能を模倣している別の周波数間隔に従って分けられる。
  6. 請求項1、2、3、4または5に記載の装置であり、
    励振決定装置(110)は、複数のサブバンド全てに対して励振パラメータ値(112)を決定するよう構成されているわけではなく、
    参照表は、励振パラメータ値(112)が決定されるサブバンドに関連するスペクトル重み付け係数だけを含む。
  7. 請求項6に記載の装置であり、励振パラメータ値(112)が決定されるサブバンド(102)は、何の励振パラメータ値も決定されないサブバンドよりも低い周波数を含む。
  8. 請求項6または7に記載の装置であり、励振決定装置(110)が入力オーディオ信号の一つのサブバンドに対して励振パラメータ値(112)を決定しない場合、このサブバンドの内容は信号修正装置(130)によっては修正されない。
  9. 請求項1、2、3、4、5、6、7または8に記載の装置であり、
    励振決定装置(110)は、複数のサブバンドのうちの1/3以下のサブバンドに対してのみ励振パラメータ値(112)を決定するよう構成され、
    信号修正装置(130)は、励振パラメータ値が決定されたサブバンドの内容を、それぞれに対応して出力されたスペクトル重み付け係数に基づき修正するよう構成され、
    励振パラメータ値が決定されるこれらのサブバンドは、複数のサブバンドのうちの他の全てのサブバンドよりも低い周波数を含む。
  10. 請求項に記載の装置であり、信号修正装置(130)は、何の励振パラメータ値も決定されないサブバンドの内容を、励振パラメータ値(112)が決定されたサブバンド(102)であり、励振パラメータ値(112)が決定されたサブバンド(102)のうちで他の全てのサブバンド(102)よりも高い周波数を含むサブバンド(102)に対して出力されたスペクトル重み付け係数(124)に基づき、修正するよう構成されている。
  11. 入力オーディオ信号を修正するための装置(100)であり、
    入力オーディオ信号の複数のサブバンドのうちの一つのサブバンド(102)の励振パラメータ値(112)を、そのサブバンド(102)のエネルギー量に基づき決定するよう構成された励振決定装置(110)であり、励振パラメータ値(112)はそのサブバンドのオーディオ信号のパワー、そのサブバンドのオーディオ信号の短時間エネルギーまたはそのサブバンドのオーディオ信号の短時間エネルギーの量子化値を示すものである励振決定装置(110)と、
    複数のスペクトル重み付け係数を含む参照表を格納している記憶装置(120)であり、複数のスペクトル重み付け係数のうちの一つのスペクトル重み付け係数は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連し、記憶装置は、励振パラメータの決定値(112)とその励振パラメータ値(112)が決定されたサブバンド(102)に対応するスペクトル重み付け係数(124)を出力するよう構成された記憶装置(120)と、
    修正サブバンド(132)を出力するために、入力オーディオ信号のうちの励振パラメータ値(112)が決定されたサブバンド(102)の内容を、オーディオ信号のそのサブバンドを参照表から与えられたスペクトル重み付け係数で乗法スケーリングを行うことにより、出力されたスペクトル重み付け係数(124)に基づき修正するよう構成された信号修正装置(130)を含み、
    参照表に含まれている一つのスペクトル重み付け係数は、一つの外部修正パラメータ既定値にさらに関連し、
    記憶装置(120)は、一つのサブバンド(102)の励振パラメータ決定値(112)に対応し、その励振パラメータ値(112)が決定されたそのサブバンド(102)に対応し、そして外部修正パラメータの一つの値に対応した一つのスペクトル重み付け係数(124)を出力するよう構成され、
    信号修正装置(130)は、何の励振パラメータ値も決定されないサブバンドの内容を、励振パラメータ値(112)が決定されたサブバンド(102)に対して出力されたスペクトル重み付け係数(124)に基づき修正するよう構成されている
  12. 請求項11に記載の装置であり、参照表は励振パラメータ既定値と複数のサブバンドのうちのサブバンドと外部修正パラメータ既定値とに関連する正に三次元のものである。
  13. 請求項1、2、3、4、5、6、7、8、9、10、11または12に記載の装置であり、
    参照表に含まれる一つのスペクトル重み付け係数は、一つの背景雑音パラメータ既定値にさらに関連し、
    記憶装置(120)は、サブバンド(102)の励振パラメータ決定値(112)に対応し、その励振パラメータ値(112)が決定されたそのサブバンド(102)に対応し、そして背景雑音パラメータの一つの値に対応した一つのスペクトル重み付け係数(124)を出力するよう構成されている。
  14. 請求項13に記載の装置であり、参照表は励振パラメータ既定値と複数のサブバンドのうちのサブバンドと外部修正パラメータ既定値と背景雑音パラメータ既定値とに関連する正に四次元のものである。
  15. 請求項1、2、3、4、5、6、7、8、9、10、11、12、13または14に記載の装置であり、記憶装置(120)は特定ラウドネスパラメータまたは目標特定ラウドネスパラメータのための入力部を含まない。
  16. 請求項1、2、3、4、5、6、7、8、9、10、11、12、13、14または15に記載の装置であり、
    記憶装置(120)に格納されている参照表は、入力オーディオ信号修正装置のためだけの参照表である。
  17. 請求項1、2、3、4、5、6、7、8、9、10、11、12、13、14、15または16に記載の装置であり、励振決定装置(110)はサブバンド(102)のエネルギー量を測定するよう構成され、一つの励振パラメータ既定値に等しい励振パラメータ値を得るために、測定されたサブバンドのエネルギー量を量子化するよう構成されている。
  18. 入力オーディオ信号を修正する方法(500,600)であり、
    入力オーディオ信号の複数のサブバンドのうちの一つのサブバンドの励振パラメータ値を、そのサブバンドのエネルギー量に基づき決定すること(510)であり、励振パラメータ値(112)はそのサブバンドのオーディオ信号のパワー、そのサブバンドのオーディオ信号の短時間エネルギーまたはそのサブバンドのオーディオ信号の短時間エネルギーの量子化値を示すものであることと、
    励振パラメータの決定値とその励振パラメータ値(112)が決定されたサブバンドに対応するスペクトル重み付け係数を出力すること(520)であり、この重み付け係数は、複数のスペクトル重み付け係数を含む参照表に保存されており、複数のスペクトル重み付け係数のうちの一つのスペクトル重み付け係数は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連していることと、
    修正サブバンドを出力するために、励振パラメータ値が決定されたサブバンドを、オーディオ信号のそのサブバンドを参照表から与えられたスペクトル重み付け係数で乗法スケーリングを行うことにより、出力されたスペクトル重み付け係数に基づき修正すること(530)を含み、
    何の励振パラメータ値も決定されないサブバンドの内容は、励振パラメータ値(112)が決定されたサブバンド(102)に対して出力されたスペクトル重み付け係数(124)に基づき修正される
  19. 入力オーディオ信号を修正する方法(500,600)であり、
    入力オーディオ信号の複数のサブバンドのうちの一つのサブバンドの励振パラメータ値を、そのサブバンドのエネルギー量に基づき決定すること(510)であり、励振パラメータ値(112)はそのサブバンドのオーディオ信号のパワー、そのサブバンドのオーディオ信号の短時間エネルギーまたはそのサブバンドのオーディオ信号の短時間エネルギーの量子化値を示すものであることと、
    励振パラメータの決定値とその励振パラメータ値(112)が決定されたサブバンドに対応するスペクトル重み付け係数を出力すること(520)であり、この重み付け係数は、複数のスペクトル重み付け係数を含む参照表に保存されており、複数のスペクトル重み付け係数のうちの一つのスペクトル重み付け係数は、一つの励振パラメータ既定値と複数のサブバンドのうちの一つのサブバンドに関連していることと、
    修正サブバンドを出力するために、励振パラメータ値が決定されたサブバンドを、オーディオ信号のそのサブバンドを参照表から与えられたスペクトル重み付け係数で乗法スケーリングを行うことにより、出力されたスペクトル重み付け係数に基づき修正すること(530)を含み、
    参照表に含まれている一つのスペクトル重み付け係数は、一つの外部修正パラメータ既定値にさらに関連し、
    一つのサブバンド(102)の励振パラメータ決定値(112)に対応し、その励振パラメータ値(112)が決定されたそのサブバンド(102)に対応し、そして外部修正パラメータの一つの値に対応した一つのスペクトル重み付け係数(124)が出力され、
    何の励振パラメータ値も決定されないサブバンドの内容は、励振パラメータ値(112)が決定されたサブバンド(102)に対して出力されたスペクトル重み付け係数(124)に基づき修正される
  20. コンピュータまたはマイクロコンピュータで起動された際、請求項18または19に記載の方法をそのコンピュータまたはマイクロコンピュータに実行させるプログラムコードを有するコンピュータプログラム。
JP2013505480A 2010-04-22 2011-04-20 入力オーディオ信号の修正装置及び修正方法 Active JP5632532B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP10160679.6A EP2381574B1 (en) 2010-04-22 2010-04-22 Apparatus and method for modifying an input audio signal
EP10160679.6 2010-04-22
PCT/EP2011/056355 WO2011131732A1 (en) 2010-04-22 2011-04-20 Apparatus and method for modifying an input audio signal

Publications (2)

Publication Number Publication Date
JP2013537726A JP2013537726A (ja) 2013-10-03
JP5632532B2 true JP5632532B2 (ja) 2014-11-26

Family

ID=42570834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013505480A Active JP5632532B2 (ja) 2010-04-22 2011-04-20 入力オーディオ信号の修正装置及び修正方法

Country Status (14)

Country Link
US (1) US8812308B2 (ja)
EP (1) EP2381574B1 (ja)
JP (1) JP5632532B2 (ja)
KR (1) KR101469339B1 (ja)
CN (1) CN102986136B (ja)
AU (1) AU2011244268B2 (ja)
BR (1) BR112012026984B1 (ja)
CA (1) CA2796948C (ja)
ES (1) ES2526761T3 (ja)
HK (1) HK1161443A1 (ja)
MX (1) MX2012012113A (ja)
PL (1) PL2381574T3 (ja)
RU (1) RU2573246C2 (ja)
WO (1) WO2011131732A1 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101261212B1 (ko) 2004-10-26 2013-05-07 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 신호 처리 방법 및 장치
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN112185397A (zh) 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
CN103730131B (zh) * 2012-10-12 2016-12-07 华为技术有限公司 语音质量评估的方法和装置
KR20240055146A (ko) 2013-01-21 2024-04-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
KR20230011500A (ko) 2013-01-21 2023-01-20 돌비 레버러토리즈 라이쎈싱 코오포레이션 예약된 데이터 공간에 위치된 메타데이터 컨테이너를 갖는 인코딩된 오디오 비트스트림의 디코딩
WO2014130585A1 (en) * 2013-02-19 2014-08-28 Max Sound Corporation Waveform resynthesis
CN105074818B (zh) 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
EP2981910A1 (en) 2013-04-05 2016-02-10 Dolby Laboratories Licensing Corporation Acquisition, recovery, and matching of unique information from file-based media for automated file detection
EP2992605B1 (en) 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
WO2015038475A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
JP6506764B2 (ja) 2013-09-12 2019-04-24 ドルビー ラボラトリーズ ライセンシング コーポレイション ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
CN110808723A (zh) 2014-05-26 2020-02-18 杜比实验室特许公司 音频信号响度控制
JP6727194B2 (ja) * 2014-10-01 2020-07-22 ドルビー・インターナショナル・アーベー 効率的なdrcプロファイル伝送
EP3518236B8 (en) 2014-10-10 2022-05-25 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
EP3089364B1 (en) 2015-05-01 2019-01-16 Nxp B.V. A gain function controller
EP3171614B1 (en) 2015-11-23 2020-11-04 Goodix Technology (HK) Company Limited A controller for an audio system
JP2019522825A (ja) * 2016-05-20 2019-08-15 ケンブリッジ サウンド マネジメント, インコーポレイテッド サウンドマスキングのための自給式ラウドスピーカ
JP6844383B2 (ja) * 2017-03-31 2021-03-17 株式会社アドヴィックス 車両の制動装置
US10762910B2 (en) * 2018-06-01 2020-09-01 Qualcomm Incorporated Hierarchical fine quantization for audio coding
US11205414B2 (en) * 2019-02-15 2021-12-21 Brainfm, Inc. Noninvasive neural stimulation through audio
CN110010154B (zh) * 2019-03-26 2021-04-09 北京雷石天地电子技术有限公司 一种音量均衡方法及装置
EP3840222A1 (en) * 2019-12-18 2021-06-23 Mimi Hearing Technologies GmbH Method to process an audio signal with a dynamic compressive system
EP3840404B8 (en) * 2019-12-19 2023-11-01 Steelseries France A method for audio rendering by an apparatus
US11392345B1 (en) 2021-12-20 2022-07-19 Brainfm, Inc. Extending audio tracks while avoiding audio discontinuities
US11957467B2 (en) 2021-07-02 2024-04-16 Brainfm, Inc. Neural stimulation through audio with dynamic modulation characteristics
US11966661B2 (en) 2021-10-19 2024-04-23 Brainfm, Inc. Audio content serving and creation based on modulation characteristics

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4641361A (en) * 1985-04-10 1987-02-03 Harris Corporation Multi-band automatic gain control apparatus
US5255323A (en) 1990-04-02 1993-10-19 Pioneer Electronic Corporation Digital signal processing device and audio apparatus using the same
JPH0738553B2 (ja) * 1990-04-13 1995-04-26 パイオニア株式会社 音響装置のラウドネスコントロール回路
JP3119677B2 (ja) * 1991-06-10 2000-12-25 ローム株式会社 信号処理回路
JPH05206772A (ja) * 1992-01-30 1993-08-13 Alpine Electron Inc ラウドネス装置
JPH06177688A (ja) * 1992-10-05 1994-06-24 Mitsubishi Electric Corp オーディオ信号処理装置
JPH07122953A (ja) * 1993-10-22 1995-05-12 Matsushita Electric Ind Co Ltd 信号レベル圧縮装置
JP3322479B2 (ja) * 1994-05-13 2002-09-09 アルパイン株式会社 オーディオ装置
US6041297A (en) * 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
JPH11166835A (ja) * 1997-12-03 1999-06-22 Alpine Electron Inc ナビゲーション音声補正装置
JP3505085B2 (ja) * 1998-04-14 2004-03-08 アルパイン株式会社 オーディオ装置
US6351529B1 (en) * 1998-04-27 2002-02-26 3Com Corporation Method and system for automatic gain control with adaptive table lookup
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
JP4522509B2 (ja) * 1999-07-07 2010-08-11 アルパイン株式会社 オーディオ装置
IL147856A0 (en) * 1999-07-28 2002-08-14 Clear Audio Ltd Filter banked gain control of audio in a noisy environment
US7072477B1 (en) * 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP2002429B1 (en) * 2006-04-04 2012-11-21 Dolby Laboratories Licensing Corporation Controlling a perceived loudness characteristic of an audio signal
DE102006047197B3 (de) * 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
JP4706666B2 (ja) * 2007-05-28 2011-06-22 日本ビクター株式会社 音量制御装置及びコンピュータプログラム
KR101597375B1 (ko) * 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템

Also Published As

Publication number Publication date
HK1161443A1 (en) 2012-08-24
KR20130008609A (ko) 2013-01-22
RU2012149697A (ru) 2014-05-27
RU2573246C2 (ru) 2016-01-20
EP2381574A1 (en) 2011-10-26
ES2526761T3 (es) 2015-01-15
US8812308B2 (en) 2014-08-19
CN102986136B (zh) 2016-02-10
AU2011244268B2 (en) 2014-07-24
KR101469339B1 (ko) 2014-12-04
BR112012026984B1 (pt) 2021-06-08
CA2796948C (en) 2016-10-18
WO2011131732A1 (en) 2011-10-27
BR112012026984A2 (pt) 2017-10-03
JP2013537726A (ja) 2013-10-03
US20130046546A1 (en) 2013-02-21
MX2012012113A (es) 2013-02-26
CN102986136A (zh) 2013-03-20
PL2381574T3 (pl) 2015-05-29
CA2796948A1 (en) 2011-10-27
EP2381574B1 (en) 2014-12-03

Similar Documents

Publication Publication Date Title
JP5632532B2 (ja) 入力オーディオ信号の修正装置及び修正方法
US9705461B1 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP2614586B1 (en) Dynamic compensation of audio signals for improved perceived spectral imbalances
JP4486646B2 (ja) オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム
AU2011244268A1 (en) Apparatus and method for modifying an input audio signal
EP2002429B1 (en) Controlling a perceived loudness characteristic of an audio signal
US8199933B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP1835487B1 (en) Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
WO2024008928A1 (en) Masking threshold determinator, audio encoder, method and computer program for determining a masking threshold information

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140218

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20140509

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20140516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140909

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141009

R150 Certificate of patent or registration of utility model

Ref document number: 5632532

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250