JP2008536192A - コード化されたオーディオの経済的な音量計測 - Google Patents

コード化されたオーディオの経済的な音量計測 Download PDF

Info

Publication number
JP2008536192A
JP2008536192A JP2008506480A JP2008506480A JP2008536192A JP 2008536192 A JP2008536192 A JP 2008536192A JP 2008506480 A JP2008506480 A JP 2008506480A JP 2008506480 A JP2008506480 A JP 2008506480A JP 2008536192 A JP2008536192 A JP 2008536192A
Authority
JP
Japan
Prior art keywords
audio
power spectrum
approximate value
volume
volume measurement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008506480A
Other languages
English (en)
Other versions
JP5219800B2 (ja
JP2008536192A5 (ja
Inventor
クロケット、ブレット・グラハム
スミサーズ、マイケル・ジョン
シーフェルト、アラン・ジェフリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36636608&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2008536192(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2008536192A publication Critical patent/JP2008536192A/ja
Publication of JP2008536192A5 publication Critical patent/JP2008536192A5/ja
Application granted granted Critical
Publication of JP5219800B2 publication Critical patent/JP5219800B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems

Abstract

オーディオを完全にデコーディングしないでそのビットストリームからオーディオのパワースペクトルの近似値を導き出し、オーディオのパワースペクトルの近似値に則してオーディオの音量の近似値を求めることにより、そこからオーディオを完全にデコーディングすることなくオーディオのパワースペクトルの近似値を導き出すことのできるデータが含まれるビットストリーム中にエンコードされたオーディオの音量計測する。このデータには、そのオーディオの粗い表現と、付随するそのオーディオの細かい表現とが含まれ、オーディオのパワースペクトルの近似値はそのオーディオの粗い表現から導き出すことができる。サブ帯域でエンコードされたオーディオの場合は、オーディオの粗い表現はスケールファクターを具備し、付随するオーディオの細かい表現は各スケールファクターに付随するサンプルデータを具備する。

Description

本発明はオーディオ信号処理に関する。さらに詳細には、ドルビーデジタル(AC−3)、ドルビーデジタルプラス、又はドルビーEを用いたコード化されたオーディオのような低ビットレートでコード化されたオーディオの客観的な音量計測の経済的な算出に関する。「ドルビー」、「ドルビーデジタル」、「ドルビーデジタルプラス」及び「ドルビーE」はドルビー・ラボラトリーズ・ライセンシング・コーポレーションの登録商標である。本発明の特徴は他の形式のオーディオコーディングにも用いることができる。
ドルビーデジタルコーディングの詳細は以下の参考文献に記載されている。
ATSC標準A52/A:ディジタルオーディオ圧縮標準(AC−3)、改定A、次世代テレビジョン方式協会、2001年8月20日。このA52書面はワールドワイドウェブhttp://www.atsc.org/standards.htmlで利用可能である。
Craig C. Todd、他による、Audio Engineering Societyの96回会議、1994年2月26日、予稿3796の「オーディオの伝送及び記憶のためのフレキシブルな知覚コーディング」。
Steve Vernonによる、IEEE Trans. Consumer Electronics, Vol.41, No.3 1995年8月の「AC−3コーダーの設計及び実施」。
Mark DavisによるAudio Engineering Societyの95回会議、1993年10月、予稿3774の「AC−3マルチチャンネルコーダー」。
Bosi、他による、Audio Engineering Societyの93回会議、1992年10月、予稿3365の「伝送及びマルチメディアに応用するための、高品質、低レートのオーディオ変換コーディング」。
米国特許番号5,583,962、5,632,005、5,633,981、5,727,119、5,909,664、及び6,021,386。
ドルビーデジタルプラスコーディングの詳細は、117回AES会議、2004年10月28日、AES Convention論文6196の「ドルビーデジタルコーディングシステムを強化した、ドルビーデジタルプラスの手引き」に記載されている。
ドルビーE コーディングの詳細は、107回AES会議、1999年8月、予稿5068の「オーディオ配給システムにおける効率的なビット割り付け、量子化、及びコーディング」並びに107回AES会議、1999年8月、予稿5033の「画像と共に用いるために最適化された専門的なオーディオコーダー」に記載されている。
種々のドルビーエンコーダ、MPEGエンコーダその他を含む、知覚コーダーの概要は、Karlheinz Brandenburg、及び、Marina Bosiによる、J. Audio Eng. Soc, Vol.45, No.1/2, 1997年1/2月の「MPEGオーディオの概要:低ビットレートオーディオコーディングの現在及び将来の標準」に記載されている。
全ての上記参考文献は、参照としてそれぞれのすべてが本明細書に組み込まれる。
オーディオ信号の知覚音量を客観的に計測する多くの方法が存在する。その方法の例として、「音響学‐音量レベルの計算のための方法」ISO532(1975)のような心理音響に基づく音量計測のみならず、(等価騒音レベルLeqA,LeqB,LeqCのような)重み付けを行った出力計測が含まれる。重み付け音量出力計測は、知覚感度の低い周波数に重きを置かない一方知覚感度の大きい周波数に重点を置いた所定のフィルターを入力オーディオ信号に適用し、所定の時間に亘ってこのフィルターされた信号の出力を平均化することで行う。心理音響による方法は、一般に複雑であり、人間の耳の仕組みをうまくモデル化することを狙っている。これは、オーディオ信号を、耳の周波数応答と耳の感度を模倣した周波数帯域に分割し、周波数や時間によりマスキングのような心理音響的現象及び、信号強度の大きさの感知における非線形性を考慮に入れながらこれらの帯域を統合する。全ての客観的な音量計測方法の目的は、1つのオーディオ信号に対する大きさの客観的な知覚音量に近似する音量の数値的な計測を導き出すことである。
知覚コーディング又は低ビットレートオーディオコーディングは、ディジタルテレビジョンの放送や音楽のインターネット販売のような応用例において効率的な記憶、伝送、及び配信のためのオーディオ信号のデータ圧縮に一般的に用いられる。知覚コーディングは、オーディオ信号を、重複部分及び心理音響的にマスクされた信号成分の両方を簡単に廃棄することのできる情報空間に効率的に変換することにより、このことを効率的に行う。他の情報はディジタル情報のストリーム又はファイルにパックされる。一般に、低ビットレートでコード化されたオーディオの音量の計測には、そのオーディオをデコーディングして時間領域に戻すことが必要になり、これはコンピュータに大きな負担になることがある。しかし、低ビットレートで知覚コード化された信号には音量計測方法に有用な情報が含まれており、それにより、そのオーディオを完全にディジタルコーディングするための計算コストを削減することができる。ドルビーデジタル(AC−3)、ドルビーデジタルプラス、及びドルビーEは、そのようなオーディオコーディングシステムである。
ドルビーデジタル、ドルビーデジタルプラス、及びドルビーEの低ビットレート知覚オーディオコーダーは、周波数領域での表現形式に変換された、重複し、窓処理された時間セグメント(又はオーディオコーディングブロック)にオーディオ信号を分割する。このスペクトル係数である周波数領域での表現形式は、指数と仮数のセットからなる指数表現で表される。スケールファクターとして機能する指数は、コード化されたオーディオストリームにパックされる。仮数は、この指数により正規化された後のスペクトル成分を表す。この指数は聴覚の知覚モデルを介して、量子化のため及び仮数をコード化されたオーディオストリームにパックするために用いられる。デコーディングにおいて、この指数はコード化されたオーディオストリームからアンパックされ、同じ知覚モデルを介してどのように仮数をアンパックするかを決定する。次いで、この仮数はアンパックされ、指数と結合させて、その後デコードされ時間領域表現に変換されるオーディオの周波数領域表現を作り出す。
多くの音量計測には出力とパワースペクトルの計算が含まれるので、計算量の削減は、単に、低ビットレートでコード化されたオーディオを部分的にデコーディングし、(パワースペクトルのような)部分的にデコードされた情報を音量計測にまわすことにより達成できるかもしれない。本発明は、オーディオの音量を計測する必要があるがオーディオをデコーディングする必要がない時に有用である。これは、音量計測では、通常聴取には適しないような近似により近似したオーディオを活用することができるという事実を利用する。本発明の特徴によれば、多くのオーディオコーディングシステムにおけるビットストリームを完全にデコーディングしなくても有効となる、粗いオーディオ表現を認識することで、そのオーディオの音量計測に有用なオーディオスペクトルの近似ができる。ドルビーデジタル、ドルビーデジタルプラス、及びドルビーEオーディオコーディングにおいて、指数はそのオーディオのパワースペクトルを近似する。同様に、他のコーディングシステムにおいても、スケールファクター、スペクトルエンベロープ、及び線形予測係数がそのオーディオのパワースペクトルを近似することがある。本発明のこれらの利点及び他の利点は、本発明の以下の開示及び説明を読み理解することによりよく理解できるであろう。
本発明は、低ビットレートでコード化されたオーディオの知覚音量の、コンピュータ的に経済的な計測をおこなう。これは、ただ、オーディオ素材を部分的にデコーディングしこの部分的にデコーディングした情報を音量計測にまわすことによって達成される。この方法は、ドルビーデジタル、ドルビーデジタルプラス、及びドルビーEオーディオコーディングにおける指数のような部分的にデコーディングされたオーディオの特有の特徴を巧みに利用するものである。
本発明の第1の特徴によれば、オーディオを完全にデコーディングしないでそのビットストリームからオーディオのパワースペクトルの近似値を導き出し、オーディオのパワースペクトルの近似値に則してオーディオの音量の近似値を求めることにより、そこからオーディオを完全にデコーディングすることなくオーディオのパワースペクトルの近似値を導き出すことのできるデータが含まれるビットストリーム中にエンコードされたオーディオの音量を計測するものである。
本発明の他の特徴によれば、このデータには、そのオーディオの粗い表現と、付随するそのオーディオの細かい表現とが含まれ、この場合オーディオのパワースペクトルの近似値はそのオーディオの粗い表現から導き出すことができる。
本発明のさらなる特徴によれば、ビットストリームにエンコードされたオーディオは、複数の周波数サブ帯域を有するエンコードされたオーディオのサブ帯域であり、各サブ帯域は、スケールファクターとそれに関連するサンプルデータとを有し、ここで、オーディオの粗い表現はスケールファクターを具備し、付随するオーディオの細かい表現は各スケールファクターに付随するサンプルデータを具備する。
さらなる本発明の特徴によれば、各サブ帯域のスケールファクターとサンプルデータとは、このスケールファクターが指数からなり、それに付随するサンプルデータが仮数からなる指数表現により、サブ帯域中のスペクトル係数を表現することができる。
さらなる本発明の特徴によれば、ビットストリームにエンコードされたオーディオは、オーディオの粗い表現が線形予測係数を具備しオーディオの細かい表現が線形予測係数に関連するエキサイテーション情報を具備する線形予測コード化されたオーディオであることができる。
本発明のさらなる特徴によれば、オーディオの粗い表現は少なくとも1つのスペクトルエンベロープを具備し、オーディオの細かい表現は少なくとも1つのスペクトルエンベロープに関連するスペクトル成分を具備することができる。
さらなる本発明の特徴によれば、オーディオのパワースペクトルの近似値に則してオーディオの音量の近似値を求めるステップには、重み付けられた出力音量計測を適用するステップを含むことができる。この重み付けられた出力音量計測には、ほとんど知覚できない周波数を強調せず、フィルターされたオーディオの出力を時間で平均するフィルターを採用することができる。
本発明のさらに他の特徴によれば、オーディオのパワースペクトルの近似値に則してオーディオの音量の近似値を求めるステップには、心理音響に基づく音量計測を適用するステップを含むことができる。この、心理音響に基づく音量計測では、人間の耳の臨界帯域に類似する複数の周波数帯域の各々における特定ラウドネスを決定するための人間の耳のモデルを採用することができる。サブ帯域コーダー環境において、このサブ帯域は、人間の耳の臨界帯域に近似させることができ、心理音響に基づく音量計測では、各サブ帯域で特定ラウドネスを決定するために人間の耳のモデルを採用することができる。
本発明の特徴には、上記機能を実行する方法、上記機能を実行する手段、この方法を実行する装置、及び上記機能を実行する方法をコンピュータで実行させるためのコンピュータ読み取り可能な媒体に保存されたコンピュータプログラムが含まれる。
本発明の利点は、そのオーディオをPCMに完全にディジタルコーディングすることなく、低ビットレートでコード化されたオーディオの音量を計測することである。ここで、デコーディングには、ビット配分、逆量子化、逆変換、等のような高価なデコーディング処理が含まれる。本発明の特徴は、一般に、処理に必要なもの(計算経費)を削減することである。このアプローチは、音量計測は必要であるが、デコーディングされたオーディオは必要ないときに有益である。
本発明の特徴は、例えば、(1)Smithers等による、2004年7月1日出願の係属中の米国正規特許出願S.N.10/884,177、表題「再生音量及びオーディオ情報のダイナミックレンジに影響を与えるメタデータを修正する方法」、(2)Brett Graham Crockettによる、Attorneys' Docket DOL150の本願と同時に出願した米国仮出願S.N.60/xxx,xxx、表題「オーディオメタデータの検証」、に開示されたような環境、及び(3)デコーディングされたオーディオにアクセスする必要もその要求もない、放送での記憶又は伝送の連鎖において音量計測と修正を行う場合、のよう環境において使用可能である。上記S.N.10/884,177と、Attorneys' Docket DOL150はその全てを参照として本願に組み込まれる。
本発明の特徴によりもたらされる保存処理はまた、多くの低ビットレートでデータ圧縮されたオーディオ信号をリアルタイムに音量計測し、そしてメタデータの修正(例えば、DIALNORMパラメータを正しい値にする)を行うことを可能にする。しばしば、多くの低ビットレートでコード化されたオーディオ信号は多重化され、MPEG伝送ストリームで伝送される。本発明の特徴による音量計測は、圧縮されたオーディオ信号を完全にPCMにデコーディングして音量計測することを必要とする場合に比べて、多くの圧縮されたオーディオ信号をリアルタイムに音量計測することをより便利にする。
図1は、コード化されたオーディオの音量を計測するための従来技術による構成を示す。低ビットレートでエンコードされたオーディオのようなコード化されたディジタルオーディオデータ又は情報101は、デコーダー又はデコーディング機能(「デコード」)102により、例えばPCMオーディオ信号103にデコーディングされる。次いでこの信号は、計測された音量値105を生成する音量計測器又は音量計測方法又は音量計測アルゴリズム(「音量計測」)104に入力される。
図2は、デコード102の一例を示す従来技術による構成又は機能ブロック図を示す。示された構成又は機能は、ドルビーデジタル、ドルビーデジタルプラス、及びドルビーEデコーダーを表している。コード化されたオーディオデータ101のフレームは、入力されたデータを指数データ203、仮数データ204、及び他の雑多なビット配置情報207にアンパックする、データアンパッカー又はアンパッキング機能(「フレーム同期、エラー検出、及びフレームデフォーマット」)202に入力される。指数データ203は、装置又は機能(「対数パワースペクトル」)205により対数パワースペクトル206に変換され、この対数パワースペクトルは、ビット配置装置又はビット配置機能(「ビット配置」)208で、ビットで示した量子化された仮数の長さ信号209の計算を行うのに用いられる。この仮数は逆量子化され、装置又は機能(「仮数の逆量子化」)210により指数と結合され、そして、逆フィルターバンク装置又は機能(「逆フィルターバンク」)212により変換されて時間領域に戻される。逆フィルターバンク212はまた、(時間をあわせて)先の逆フィルターバンクによる結果と現在の逆フィルターバンクによる結果の一部とを重複させ加算してデコーディングされたオーディオ信号103を作り出す。実際のデコーダーの実施の形態では、ビット配置、仮数の逆量子化、逆フィルターバンク装置又は機能で多大な計算資源を必要とする。デコーディングプロセスの詳細については、先に引用した文献でみることができる。
図3a及び3bは、オーディオ信号の客観的な音量計測の、先行技術による構成を示す。これらは音量計測104(図1)の変形を示している。図3a及び3bは例示であり、それぞれ客観的な音量計測技術の2つの種類を示しているが、特定の客観的な音量計測技術を選択することは本発明では重要ではなく、他の客観的な音量計測技術を採用してもよい。
図3aは、音量計測で一般的に用いられる重み付けされた出力計測構成の一例を示す。オーディオ信号103は、知覚感度の低い周波数を強調しない一方、知覚感度の高い周波数を強調するよう設計された重み付けフィルター又はフィルター機能(「重み付けフィルター」)302を経由する。フィルターされた信号303の出力305は装置又は機能(「出力」)304により計算され、装置又は機能(「平均」)306で一定の時間間隔で平均化されて音量値105を作り出す。多くの標準的なフィルター特性が存在しその一般的な例を図4に示す。実際には、図3aの構成を修正したものがしばしば用いられ、その修正は、例えば、無音期間が平均化に含まれるのを避けるようになっている。
心理音響に基づく技術もまた音量計測にしばしば用いられる。図3bは、このような心理音響に基づく、先行技術による典型的な構成を示す。オーディオ信号103は、外耳及び中耳の、周波数による振幅変動についての応答を表す伝達フィルター又はフィルター機能(「伝達フィルター」)312によりフィルターされる。次いで、フィルターされた信号313は、聴覚フィルターバンク又はフィルターバンク機能(「聴覚フィルターバンク」)314により、聴覚臨界帯域と等価又は狭い周波数帯域に分割される。これは、(例えば、離散周波数変換(DFT)により実行されるような)高速フーリエ変換(FFT)を行うことにより実行し、そして、直線的な間隔の帯域を(ERBスケール又はBarkスケールのような)耳の臨界帯域を近似させた帯域にグループ化してもよい。あるいは、これは各ERB帯域又はBark帯域の単一の帯域通過フィルターにより実行することもできる。各帯域は、次いで、装置又は機能(「エキサイテーション」)316により、その帯域内で耳が感じる刺激又はエキサイテーション信号317に変換される。次に、各帯域の知覚音量又は特定ラウドネスは、装置又は機能(「特定ラウドネス」)318によりエキサイテーションから算出され、音量105の単一計測値を出すために積算器又は積算機能(「積算」)320により、すべての帯域に亘って特定ラウドネスが積算される。この積算プロセスでは、例えば周波数マスキングなど様々な知覚効果を考慮に入れることができる。実際の実施の形態では、これらの知覚的方法では、伝達フィルター及び聴覚フィルターバンクに多大な計算原資が必要となる。
図5は、本発明のブロック図を示す。コード化されたディジタルオーディオ信号101は装置又は機能(「部分デコード」)502により部分的にデコーディングされ、装置又は機能(「音量計測」)504により、部分的にデコーディングされた情報503から音量が計測される。どのようにデコーディングが行われたかにより、音量計測結果505は、完全にデコーディングされたオーディオ信号103(図1)から計算した音量計測105と正確に同じではないが、非常に近似するものとなる。本発明の実施の形態でのドルビーデジタル、ドルビーデジタルプラス、及びドルビーEの文脈において、部分デコーディングには、図2の例に示すような、ビット配置や、仮数の逆量子化や、逆フィルターバンクの装置又は機能を省略する場合が含まれる。
図6aと6bは、図5の一般構成の2つの実施の形態の例を示す。両方とも部分デコード502の機能又は装置を採用することができるが、それぞれ異なった音量計測504機能を持つことができる。すなわち、図6aの例では図3aに似た例であり、図6aの例では図6bの例に似た例である。両方の例において、部分デコード502は、コード化されたオーディオストリームから指数203のみを抽出しこの指数をパワースペクトル206に変換する。このような抽出は、図2の例のような装置又は機能(「フレーム同期、エラー検出、及びフレームデフォーマッティング」)202により行い、このような変換は、図2の例のような装置又は機能(「対数パワースペクトル」)により行うことができる。図2の例のデコーディングに示したような、仮数を逆量子化し、ビット配置を行いそして逆フィルターバンクを行う必要性はない。
図6aの例には、音量計測504が含まれ、この音量計測は、図3aの音量計測器又は音量計測機能の修正版とすることができる。この例において、修正された重み付けフィルター機能は、重み付けフィルター又は重み付けフィルター機能(「修正された重み付けフィルター」)601により、各帯域において出力値を増減させることにより周波数領域に適用される。一方、図3aの例は時間領域において重み付けフィルター機能を適用する。周波数領域において動作するが、修正された重み付けフィルターは、図3aの時間領域における重み付けフィルターと同じようにオーディオに影響を与える。フィルター601は、線形値ではなく対数振幅で動作し、線形周波数スケールではなく非線形で動作する点で、図3aのフィルター302を「修正」したものである。次いで、周波数で重み付けしたパワースペクトル602は、例えば、下記の式(5)に例示するように、装置又は機能(「変換、積算、及び平均化」)603を適用することにより、線形出力に変換され、周波数を横切って積算され、時間を横切って平均化される。この出力は客観的な音量値505となる。
図6bの例には、音量計測504が含まれ、この音量計測は、図3bの音量計測器又は音量計測機能の修正版とすることができる。この例において、修正された伝達フィルター又はフィルター機能(「修正された伝達フィルター」)611は、各帯域における対数出力値を増減することにより直接周波数領域に適用される。一方、図3bの例は時間領域において重み付けフィルター機能を適用する。周波数領域において動作するが、修正された伝達フィルターは、図3bの時間領域における時間領域伝達フィルターと同じようにオーディオに影響を与える。修正された聴覚フィルターバンク又はフィルターバンク機能(「修正された聴覚フィルターバンク」)613は、入力とし周波数帯域の間隔を直線的にした対数パワースペクトルを受け取り、これらの直線的な間隔の帯域を分割又は結合して臨界帯域の間隔にした(例えばERB帯域又はBark帯域)フィルターバンク出力315にする。修正された聴覚フィルターバンク613はまた、次のエキサイテーション装置又は機能(「エキサイテーション」)316のために、対数領域出力信号を線形信号に変換する。修正された聴覚フィルターバンク613は、線形値ではなく対数振幅で動作し、この対数振幅を線形値に変換する点で、図3bの聴覚フィルターバンク314を「修正」したものである。あるいは、ERB帯域又はBark帯域へグループ化する処理は、修正された伝達フィルター611ではなく修正された聴覚フィルターバンク613で行ってもよい。図6bの例には、図3bの例のような各帯域の特定ラウドネス318と積算320とが含まれる。
図6aと6bに示した構成では、デコーディングにおいてビット配置や、仮数の逆量子化や、逆フィルターバンクを必要としないので、多大な計算原資の節約が達成される。しかし、図6aと6bの構成では、客観的な音量計測の結果は、完全にデコーディングされたオーディオから計算された計測値と完全に同じでないかもしれない。これは、オーディオ情報のいくつかが廃棄されるため、計測に用いられるオーディオ情報が不完全だからである。本発明をドルビーデジタル、ドルビーデジタルプラス、又はドルビーEに適用したとき、仮数の情報は廃棄され、粗く量子化された指数値だけが残る。ドルビーデジタル及びドルビーデジタルプラスについては、値は6dB増加させて量子化され、ドルビーEについては、3dB増加させて量子化される。ドルビーEにおける、小さな量子化ステップでは、細かく量子化された指数値となり、したがって、より正確なパワースペクトルの推定がなされる。
知覚コーダーはしばしば、オーディオ信号の特性にあわせて、ブロックサイズとも呼ばれる、重複時間セグメントの長さを変更するよう設計されている。例えばドルビーデジタルでは、2つのブロックサイズを用いる。すなわち、変化の少ないオーディオ信号には主として512サンプルの長いブロックを用い、過渡的なオーディオ信号には256サンプルの短いブロックを用いる。その結果、周波数帯域の数と対応する対数パワースペクトル値206はブロック毎に異なる。ブロックサイズが512サンプルのとき、256の帯域があり、ブロックサイズが256サンプルのとき、128の帯域がある。図6aと6bに提案した方法はブロックサイズを変化させるよう処理する多くの方法があり、それぞれの方法で同じような音量計測が得られる。例えば対数パワースペクトル205は、多くの小さなブロックを結合又は平均化して大きなブロックにし、小さな数の帯域から大きな数の帯域にその出力を広げることにより、一定のブロックレートで出力が常に一定の帯域になるよう修正することができる。あるいは、この音量計測は、ブロックサイズの変化を受け入れ、それにあわせて、例えば時定数を調整することにより、フィルター機能、エキサイテーション、特定ラウドネス、平均化、及び積算プロセスを調整することができる。
(重み付けられた出力計測の例)
本発明の一例として、重み付けられた出力計測方法の極めて経済的なものは、ドルビーデジタルビットストリームと重み付けられた出力音量計測LeqAを用いることができる。この極めて経済的な例では、ドルビーデジタルビットストリームに含まれる量子化された指数のみが、音量計測を行うためのオーディオ信号スペクトルの推定値として用いられる。これにより、さもなければほんの少し正確な信号スペクトルの推定値が得られるだけの、仮数情報を再構成するためのビット配置を行う余計な計算要求を回避することができる。
図5及び6aに示されている通り、ドルビーデジタルビットストリームは部分的にデコーディングされて、このビットストリームに含まれている量子化された指数データから、対数パワースペクトルを再現し抽出する。ドルビーデジタルでは、連続した窓512によりMDCT変換を行うことで、PCMオーディオサンプルを50%重複させて低ビットレートオーディオエンコーディングを行い、低ビットレートでコード化されたオーディオ
ストリームを作り出すのに用いられる256個のMDCT係数とする。図5及び6aで行われた部分的デコーディングにより、指数データE(k)がアンパックされ、このアンパックされたデータが、オーディオ信号の粗いスペクトル表現となる、256個の量子化された対数パワースペクトル値P(k)に変換される。対数パワースペクトル値P(k)はdBの単位を持つ。変換は下式の通りである。
Figure 2008536192
ここでN=256は、ドルビーデジタルビットストリーム中の各ブロックについての変換係数の数である。音量の重み付けられた出力計測の計算において対数パワースペクトルを用いるために、この対数パワースペクトルは、図4に示したA重み付け曲線、B重み付け曲線、又はC重み付け曲線のような適切な音量曲線で重み付けられる。この場合、LeqA出力計測が算出されるので、A重み付け曲線が適切である。対数パワースペクトル値P(k)は、dB単位であり、以下のように離散的なA重み付け周波数値Aw(k)に加えることにより重み付けられる。
Figure 2008536192
離散的なA重み付け周波数値A(k)は、離散的な周波数fdiscreteにA重み付けゲインを計算することにより作られる。ここで、
Figure 2008536192
ここで、
Figure 2008536192
ここで、サンプリング周波数Fは、一般的にドルビーデジタルでは48kHzである。対数パワースペクトル値P(k)の各セットは、次いで、dBから線形出力に変換され、積算されて、以下のように、512個のオーディオサンプルのA重み付け出力推定値PPOWを生成する。
Figure 2008536192
先に述べたように、各ドルビーデジタルビットストリームは、512個のPCMサンプルを50%重複させて窓化し、MDCT変換を行うことにより生成された連続的な変換が含まれる。したがって、ドルビーデジタルビットストリーム中で低ビットレートエンコードされたオーディオのA重み付け出力PTOTの合計の近似値は、以下のように、ドルビーデジタルビットストリーム中の全ての変換にわたって出力値を平均化することにより計算することができる。
Figure 2008536192
ここでMは、ドルビーデジタルビットストリーム中含まれる変換の総数に等しい。平均出力は、以下のようにdB単位に変換される。
Figure 2008536192
ここでCは、ドルビーデジタルビットストリームのエンコーディング中の変換プロセスで行なわれるレベル変化に起因する一定の補正量である。
(心理音響に基づく計測の例)
本発明の他の例として、重み付けられた出力音量計測方法の極めて経済的なものは、ドルビーデジタルビットストリームと心理音響に基づく音量計測を用いることができる。この極めて経済的な例では、先の例と同様に、ドルビーデジタルビットストリームに含まれる量子化された指数のみが、音量計測を行うためのオーディオ信号スペクトルの推定値として用いられる。他の例のように、これにより、さもなければほんの少し正確な信号スペクトルの推定値が得られるだけの、仮数情報を再構成するためのビット配置を行う余計な計算要求を回避することができる。
2004年12月23日にWO2004/111994A2として国際公開、米国を指定国とする、Seefeldt他により2004年5月27日に出願された国際特許出願番号PCT/US2004/016964には、とりわけ、心理音響的モデルに基づく知覚音量の客観的な計測について開示されている。この出願はここにその全てを参照として本明細書に組み込まれる。ドルビーデジタルビットストリームの部分的デコーディングから導き出される対数パワースペクトル値P(k)は、元のPCMオーディオとは違い、同じような心理音響に基づく計測と同様に、この国際出願にあるような技術の入力に役立つ。このような構成は図6bの例に示されている。前記PCT出願から用語と記号を借用して、臨界帯域bで内耳基底膜に沿うエネルギーの分配を近似したエキサイテーション信号E(b)は、以下のように対数パワースペクトルから近似することができる。
Figure 2008536192
ここで、T(k)は、伝達フィルターの周波数応答を表し、H(k)は臨界帯域bに対応する位置での基底膜の周波数応答を表し、両方の応答は、変換ビンkに対応する周波数でサンプルされたものである。次に、ドルビーデジタルビットストリームの全ての変換に対応するエキサイテーションは平均化されて、以下のトータルエキサイテーションを生成する。
Figure 2008536192
Figure 2008536192
ここで、TQ1kHzは、1kHzで静音となる閾値であり、定数Gとαは、音量の成長を記述する心理音響的実験から生成されたデータに適合するよう選択される。最終的に、トータル音量Lは、ソーンの単位で表され、全帯域に亘って特定ラウドネスを積算することにより計算される。すなわち、
Figure 2008536192
Figure 2008536192
(他の知覚オーディオコーデック)
本発明は、ドルビーデジタル、ドルビーデジタルプラス、及びドルビーEのコーディングシステムに限られるものではない。オーディオのパワースペクトルの近似値が、オーディオを作り出すためにビットストリームを完全にデコーディングすることなくエンコードされたビットストリームから再生することができる、例えば、スケールファクター、スペクトルエンベロープ、及び線形予測係数で与えられる、他のコーディングシステムもまた本発明の恩恵に浴することができる。
(ドルビーデジタルから指数を計算するときの誤差)
ドルビーデジタルの指数E(k)は、MDCTスペクトル係数の対数の粗い量子化を表している。これらの値を粗いパワースペクトルとして用いたとき、数多くの誤差の原因が存在する。
第1に、ドルビーデジタルにおいて、指数(前記式(1)参照)から生じたパワースペクトルの値とMDCT係数から直接計算した出力値と比較したとき、量子化処理自身で約2.7dBの平均誤差が生じる結果となる。実験的に得られたこの平均誤差は、前記式(7)の一定の補正量Cに組み込むことができる。
第2に、ある信号状態において、過渡値、指数値のような値は全周波数に亘ってグループ分けされる(前記引例A/52A書面では「D25」及び「D45」モードと称される)。全周波数に亘るこのグループ分けは、平均指数誤差の予想を難しくし、式(7)の定数Cに組み込むことにより説明することがより難しくなる。実際には、このグループ分けによる誤差は2つの理由により無視することができる。すなわち(1)このグループ分けはめったに用いられない、(2)グループ分けのために用いられる信号の性質から、計測される平均誤差は平均化されない場合に類似する、からである。
(実施の形態)
本発明は、ハードウェア又はソフトウェア又は両方を組み合わせたもの(例えば、プログラマブルロジックアレー)で実施することができる。他に記載がない限り、本発明の1部に含まれるアルゴリズム又はプロセスは、特定のコンピュータ又は特定の装置に本質的に関連するようなものではない。とりわけ、種々の汎用機をここの記載に従って書かれたプログラムと共に用いてもよい、あるいは、要求の方法を実行するために、より特化した装置(例えば、集積回路)を構成することが便利かもしれない。このように、本発明は、それぞれ少なくとも1つのプロセッサ、少なくとも1つの記憶システム(揮発性及び非揮発性メモリー及び/又は記憶素子を含む)、少なくとも1つの入力装置又は入力ポート、及び少なくとも1つの出力装置又は出力ポートを具備する、1つ以上のプログラマブルコンピュータシステム上で実行される1つ以上のコンピュータプログラムにより実現することができる。ここに記載した機能を遂行し、出力情報を出力させるために入力データにプログラムコードを適用する。この出力情報は、公知の方法で、1以上の出力装置に適用される。
このようなプログラムの各々は、コンピュータシステムとの通信のために、必要とされるどんなコンピュータ言語(機械語、アセンブリ、又は、高級な、手続言語、論理型言語、又は、オブジェクト指向言語を含む)ででも実現することができる。いずれにせよ、言語はコンパイル言語であってもインタープリタ言語であってもよい。
当然のことながら、説明用図面に示したいくつかのステップと機能は、多くのサブステップを行い、1つのステップ又は機能ではなく複数のステップと機能で示すこともできる。これも当然のことながら、ここに種々の実施例として記載したさまざまな装置、機能、ステップ、及びプロセスは、図に示したのとは異なる方法で、結合又は分割して示すことができる。例えば、コンピュータソフトウェアによる指令シーケンスにより実行されたとき、模範図における種々の機能及びステップは、適切な信号処理ハードウェアで走るマルチスレッドのソフトウェアによる指令シーケンスにより実行することができ、この場合、図に例示された様々な装置及び機能は、このソフトウェアによる指令の一部に対応できる。
このようなコンピュータプログラムの各々は、ここに記載の手順を実行するために、コンピュータにより記憶媒体又は記憶装置を読み込んだとき、コンピュータを設定し動作させるための、汎用プログラマブルコンピュータ又は専用プログラマブルコンピュータにより、読み込み可能な記憶媒体又は記憶装置(例えば、半導体メモリー又は半導体媒体、又は磁気又は光学媒体)に保存又はダウンロードすることが好ましい。本発明のシステムはまた、コンピュータプログラムにより構成されるコンピュータにより読み込み可能な記憶媒体として実行することを考えることもできる。ここで、この記憶媒体は、コンピュータシステムを、ここに記載した機能を実行するために、具体的にあらかじめ定めた方法で動作させる。
本発明の多くの実施の形態について記載した。しかしながら、本発明の精神と技術範囲を逸脱することなく多くの修正を加えることができることは明らかであろう。例えば、ここに記載したステップのいくつかの順序は独立であり、従って、記載とは異なる順序で実行することができる。
低ビットレートでコード化されたオーディオの音量計測のための一般的構成の概略機能ブロックダイアグラムを示す。 ドルビーデジタル、ドルビーデジタルプラス、及びドルビーEデコーダーの一般化した概略機能ブロックダイアグラムを示す。 重み付けした出力計測を用いた客観的な音量計測を行う一般的構成の概略機能ブロックダイアグラムを示す。 心理音響に基づく計測を用いた客観的な音量計測を行う一般的構成の概略機能ブロックダイアグラムを示す。 図3aに例示した構成による音量計測を行ったときの一般的な重み付けを示す。 本発明の特徴による、コード化されたオーディオの音量を計測するためのより経済的な一般的構成を示す概略機能ブロックダイアグラムである。 図3aに例示した構成による音量構成に本発明の特徴を適用した、音量を計測するためのより経済的な構成の概略機能ブロックダイアグラム。 図3bに例示した構成による音量構成に本発明の特徴を適用した、音量を計測するためのより経済的な構成の概略機能ブロックダイアグラム。

Claims (28)

  1. オーディオを完全にデコーディングすることなく該オーディオのパワースペクトルの近似値を導き出すことのできるデータが含まれるビットストリーム中にエンコードされたオーディオの音量を計測する方法であって、
    前記オーディオを完全にデコーディングしないで前記ビットストリームから前記オーディオのパワースペクトルの前記近似値を導き出すステップと、
    前記オーディオのパワースペクトルの前記近似値に則してオーディオの音量の近似値を求めるステップと
    を具備することを特徴とする方法。
  2. 前記データには、前記オーディオの粗い表現と、付随する該オーディオの細かい表現とが含まれ、前記オーディオのパワースペクトルの前記近似値は前記オーディオの粗い表現から導き出すことを特徴とする請求項1に記載の方法。
  3. ビットストリームにエンコードされた前記オーディオは、複数の周波数サブ帯域を有するエンコードされたオーディオのサブ帯域であり、各サブ帯域は、スケールファクターとそれに関連するサンプルデータとを有し、ここで、前記オーディオの前記粗い表現はスケールファクターを具備し、前記付随するオーディオの前記細かい表現は各スケールファクターに付随するサンプルデータを具備することを特徴とする請求項2に記載の方法。
  4. 各サブ帯域のスケールファクターとサンプルデータとは、このスケールファクターが指数からなり、それに付随するサンプルデータが仮数からなる指数表現により、サブ帯域中のスペクトル係数を表現することを特徴とする請求項3に記載の方法。
  5. 前記ビットストリームはAC−3でエンコードされたことを特徴とする請求項1乃至請求項4のいずれか1項に記載の方法。
  6. ビットストリームにエンコードされた前記オーディオは、前記オーディオの粗い表現が線形予測係数を具備し前記オーディオの細かい表現が該線形予測係数に関連するエキサイテーション情報を具備することを特徴とする請求項2に記載の方法。
  7. 前記オーディオの粗い表現は少なくとも1つのスペクトルエンベロープを具備し、前記オーディオの細かい表現は少なくとも1つの該スペクトルエンベロープに関連するスペクトル成分を具備することを特徴とする請求項2に記載の方法。
  8. 前記オーディオのパワースペクトルの前記近似値に則して該オーディオの音量の近似値を求めるステップには、重み付けられた出力音量計測を適用するステップを含むことを特徴とする請求項1乃至請求項7のいずれか1項に記載の方法。
  9. 前記重み付けられた出力音量計測は、ほとんど知覚できない周波数を強調せず、フィルターされたオーディオの出力を時間で平均するフィルターを採用することを特徴とする請求項8に記載の方法。
  10. 前記オーディオのパワースペクトルの前記近似値に則して該オーディオの音量の近似値を求めるステップには、心理音響に基づく音量計測を適用するステップが含まれることを特徴とする請求項1乃至請求項7のいずれか1項に記載の方法。
  11. 前記心理音響に基づく音量計測は、人間の耳の臨界帯域に類似する複数の周波数帯域の各々における特定ラウドネスを決定するための人間の耳のモデルを採用することを特徴とする請求項10に記載の方法。
  12. 前記オーディオのパワースペクトルの前記近似値に則して該オーディオの音量の近似値を求めるステップには、心理音響に基づく音量計測を適用するステップが含まれることを特徴とする請求項3乃至請求項5のいずれか1項に記載の方法。
  13. 前記サブ帯域は人間の耳の臨界帯域に近似し、前記心理音響に基づく音量計測は、各サブ帯域で特定ラウドネスを決定するために人間の耳のモデルを採用することを特徴とする請求項12に記載の方法。
  14. オーディオを完全にデコーディングすることなく該オーディオのパワースペクトルの近似値を導き出すことのできるデータが含まれるビットストリーム中にエンコードされたオーディオの音量を計測する装置であって、
    前記オーディオを完全にデコーディングしないで前記ビットストリームから前記オーディオのパワースペクトルの前記近似値を導き出す手段と、
    前記オーディオのパワースペクトルの前記近似値に則してオーディオの音量の近似値を求める手段と
    を具備することを特徴とする装置。
  15. 前記データには、前記オーディオの粗い表現と、付随する該オーディオの細かい表現とが含まれ、前記オーディオのパワースペクトルの前記近似値は前記オーディオの粗い表現から導き出すことを特徴とする請求項14に記載の装置。
  16. ビットストリームにエンコードされた前記オーディオは、複数の周波数サブ帯域を有するエンコードされたオーディオのサブ帯域であり、各サブ帯域は、スケールファクターとそれに関連するサンプルデータとを有し、ここで、前記オーディオの前記粗い表現はスケールファクターを具備し、前記付随するオーディオの前記細かい表現は各スケールファクターに付随するサンプルデータを具備することを特徴とする請求項15に記載の装置。
  17. 各サブ帯域のスケールファクターとサンプルデータとは、このスケールファクターが指数からなり、それに付随するサンプルデータが仮数からなる指数表現により、サブ帯域中のスペクトル係数を表現することを特徴とする請求項16に記載の装置。
  18. 前記ビットストリームはAC−3でエンコードされたことを特徴とする請求項14乃至請求項17のいずれか1項に記載の装置。
  19. ビットストリームにエンコードされた前記オーディオは、前記オーディオの粗い表現が線形予測係数を具備し前記オーディオの細かい表現が該線形予測係数に関連するエキサイテーション情報を具備することを特徴とする請求項15に記載の装置。
  20. 前記オーディオの粗い表現は少なくとも1つのスペクトルエンベロープを具備し、前記オーディオの細かい表現は少なくとも1つの該スペクトルエンベロープに関連するスペクトル成分を具備することを特徴とする請求項15に記載の装置。
  21. 前記オーディオのパワースペクトルの前記近似値に則して該オーディオの音量の近似値を求める手段には、重み付けられた出力音量計測を適用する手段を含むことを特徴とする請求項14乃至請求項20のいずれか1項に記載の装置。
  22. 前記重み付けられた出力音量計測は、ほとんど知覚できない周波数を強調せず、フィルターされたオーディオの出力を時間で平均するフィルターを採用することを特徴とする請求項21に記載の装置。
  23. 前記オーディオのパワースペクトルの前記近似値に則して該オーディオの音量の近似値を求める手段には、心理音響に基づく音量計測を適用する手段が含まれることを特徴とする請求項14乃至請求項20のいずれか1項に記載の装置。
  24. 前記心理音響に基づく音量計測は、人間の耳の臨界帯域に類似する複数の周波数帯域の各々における特定ラウドネスを決定するための人間の耳のモデルを採用することを特徴とする請求項23に記載の装置。
  25. 前記オーディオのパワースペクトルの前記近似値に則して該オーディオの音量の近似値を求める手段には、心理音響に基づく音量計測を適用する手段が含まれることを特徴とする請求項16乃至請求項18のいずれか1項に記載の装置。
  26. 前記サブ帯域は人間の耳の臨界帯域に近似し、前記心理音響に基づく音量計測は、各サブ帯域で特定ラウドネスを決定するために人間の耳のモデルを採用することを特徴とする請求項25に記載の装置。
  27. 請求項1乃至請求項13のいずれか1項に記載の方法を実行するための装置。
  28. 請求項1乃至請求項13のいずれか1項に記載の方法をコンピュータに実行させるための、コンピュータが読み取り可能な媒体に記憶させたコンピュータプログラム。
JP2008506480A 2005-04-13 2006-03-23 コード化されたオーディオの経済的な音量計測 Active JP5219800B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67138105P 2005-04-13 2005-04-13
US60/671,381 2005-04-13
PCT/US2006/010823 WO2006113047A1 (en) 2005-04-13 2006-03-23 Economical loudness measurement of coded audio

Publications (3)

Publication Number Publication Date
JP2008536192A true JP2008536192A (ja) 2008-09-04
JP2008536192A5 JP2008536192A5 (ja) 2009-05-07
JP5219800B2 JP5219800B2 (ja) 2013-06-26

Family

ID=36636608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008506480A Active JP5219800B2 (ja) 2005-04-13 2006-03-23 コード化されたオーディオの経済的な音量計測

Country Status (16)

Country Link
US (1) US8239050B2 (ja)
EP (1) EP1878307B1 (ja)
JP (1) JP5219800B2 (ja)
KR (1) KR101265669B1 (ja)
CN (1) CN100589657C (ja)
AT (1) ATE527834T1 (ja)
AU (1) AU2006237476B2 (ja)
BR (1) BRPI0610441B1 (ja)
CA (1) CA2604796C (ja)
ES (1) ES2373741T3 (ja)
HK (1) HK1113452A1 (ja)
IL (1) IL186046A (ja)
MX (1) MX2007012735A (ja)
MY (1) MY147462A (ja)
TW (1) TWI397903B (ja)
WO (1) WO2006113047A1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
ATE390683T1 (de) 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
US8090120B2 (en) 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
WO2006132857A2 (en) 2005-06-03 2006-12-14 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
MY141426A (en) 2006-04-27 2010-04-30 Dolby Lab Licensing Corp Audio gain control using specific-loudness-based auditory event detection
US8849433B2 (en) 2006-10-20 2014-09-30 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
JP4862136B2 (ja) * 2006-12-08 2012-01-25 株式会社Jvcケンウッド 音声信号処理装置
US8275153B2 (en) * 2007-04-16 2012-09-25 Evertz Microsystems Ltd. System and method for generating an audio gain control signal
BRPI0813723B1 (pt) 2007-07-13 2020-02-04 Dolby Laboratories Licensing Corp método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
ATE552651T1 (de) * 2008-12-24 2012-04-15 Dolby Lab Licensing Corp Audiosignallautheitbestimmung und modifikation im frequenzbereich
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI409802B (zh) * 2010-04-14 2013-09-21 Univ Da Yeh 音頻特徵處理方法及其裝置
US8731216B1 (en) * 2010-10-15 2014-05-20 AARIS Enterprises, Inc. Audio normalization for digital video broadcasts
TWI800092B (zh) * 2010-12-03 2023-04-21 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
US9620131B2 (en) 2011-04-08 2017-04-11 Evertz Microsystems Ltd. Systems and methods for adjusting audio levels in a plurality of audio signals
JP6185457B2 (ja) * 2011-04-28 2017-08-23 ドルビー・インターナショナル・アーベー 効率的なコンテンツ分類及びラウドネス推定
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN104781878B (zh) * 2012-11-07 2018-03-02 杜比国际公司 音频编码器和方法、音频转码器和方法、以及转换方法
DE13750900T1 (de) * 2013-01-08 2016-02-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verbesserung der Sprachverständlichkeit bei Hintergrundrauschen durch SII-abhängige Amplifikation und Kompression
UA122050C2 (uk) 2013-01-21 2020-09-10 Долбі Лабораторіс Лайсензін Корпорейшн Аудіокодер і аудіодекодер з метаданими гучності та границі програми
CN107257234B (zh) * 2013-01-21 2020-09-15 杜比实验室特许公司 解码具有保留数据空间中的元数据容器的编码音频比特流
US20160049914A1 (en) * 2013-03-21 2016-02-18 Intellectual Discovery Co., Ltd. Audio signal size control method and device
CN104681034A (zh) * 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
WO2016057530A1 (en) 2014-10-10 2016-04-14 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
EP3240303B1 (en) * 2014-12-24 2020-04-08 Hytera Communications Corp., Ltd. Sound feedback detection method and device
KR101712334B1 (ko) 2016-10-06 2017-03-03 한정훈 화음 음정 정확도 평가 방법 및 장치
US10375131B2 (en) 2017-05-19 2019-08-06 Cisco Technology, Inc. Selectively transforming audio streams based on audio energy estimate
WO2019063547A1 (en) * 2017-09-26 2019-04-04 Sony Europe Limited METHOD AND ELECTRONIC DEVICE FOR ATTENUATION / AMPLIFICATION OF FORMER
WO2019161191A1 (en) * 2018-02-15 2019-08-22 Dolby Laboratories Licensing Corporation Loudness control methods and devices
CN111045633A (zh) * 2018-10-12 2020-04-21 北京微播视界科技有限公司 用于检测音频信号的响度的方法和装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06324093A (ja) * 1993-05-14 1994-11-25 Sony Corp オーディオ信号のスペクトル表示装置
JPH09500503A (ja) * 1993-07-16 1997-01-14 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 適応ビット配分符号化装置及び方法
JPH09261064A (ja) * 1996-03-26 1997-10-03 Mitsubishi Electric Corp 符号器及び復号器
JP2000075897A (ja) * 1998-08-28 2000-03-14 Nippon Telegr & Teleph Corp <Ntt> 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体
JP2001141748A (ja) * 1999-11-17 2001-05-25 Sony Corp 信号レベル表示装置
JP2001202097A (ja) * 1999-12-08 2001-07-27 Fr Telecom 符号化二進オーディオ処理方法
JP2002094655A (ja) * 2000-09-12 2002-03-29 Mitsubishi Electric Corp 電話装置
JP2002268687A (ja) * 2001-03-07 2002-09-20 Matsushita Electric Ind Co Ltd 情報量変換装置及び情報量変換方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4953112A (en) * 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
EP0520068B1 (en) 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
GB2272615A (en) * 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
US6430533B1 (en) * 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
US6185309B1 (en) * 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
WO1999012292A1 (en) * 1997-08-29 1999-03-11 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Fast synthesis sub-band filtering method for digital signal decoding
WO1999012386A1 (en) * 1997-09-05 1999-03-11 Lexicon 5-2-5 matrix encoder and decoder system
US6778966B2 (en) * 1999-11-29 2004-08-17 Syfx Segmented mapping converter system and method
AUPQ952700A0 (en) * 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
GB2385420A (en) * 2002-02-13 2003-08-20 Broadcast Project Res Ltd Measuring the perceived loudness of an audio signal
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
CN2582311Y (zh) * 2002-11-29 2003-10-22 张毅 音调响度测试仪
CN1739141A (zh) 2003-02-06 2006-02-22 杜比实验室特许公司 连续的备份音频
JP4486646B2 (ja) 2003-05-28 2010-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム
US7912226B1 (en) * 2003-09-12 2011-03-22 The Directv Group, Inc. Automatic measurement of audio presence and level by direct processing of an MPEG data stream

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06324093A (ja) * 1993-05-14 1994-11-25 Sony Corp オーディオ信号のスペクトル表示装置
JPH09500503A (ja) * 1993-07-16 1997-01-14 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 適応ビット配分符号化装置及び方法
JPH09261064A (ja) * 1996-03-26 1997-10-03 Mitsubishi Electric Corp 符号器及び復号器
JP2000075897A (ja) * 1998-08-28 2000-03-14 Nippon Telegr & Teleph Corp <Ntt> 符号化された音声データの削減方法、及び装置、及びそのプログラムを格納した記録媒体
JP2001141748A (ja) * 1999-11-17 2001-05-25 Sony Corp 信号レベル表示装置
JP2001202097A (ja) * 1999-12-08 2001-07-27 Fr Telecom 符号化二進オーディオ処理方法
JP2002094655A (ja) * 2000-09-12 2002-03-29 Mitsubishi Electric Corp 電話装置
JP2002268687A (ja) * 2001-03-07 2002-09-20 Matsushita Electric Ind Co Ltd 情報量変換装置及び情報量変換方法

Also Published As

Publication number Publication date
JP5219800B2 (ja) 2013-06-26
EP1878307A1 (en) 2008-01-16
EP1878307B1 (en) 2011-10-05
KR20070119683A (ko) 2007-12-20
US8239050B2 (en) 2012-08-07
CN100589657C (zh) 2010-02-10
TW200641797A (en) 2006-12-01
MY147462A (en) 2012-12-14
KR101265669B1 (ko) 2013-05-23
AU2006237476A1 (en) 2006-10-26
AU2006237476B2 (en) 2009-12-17
CA2604796C (en) 2014-06-03
IL186046A0 (en) 2008-02-09
WO2006113047A1 (en) 2006-10-26
IL186046A (en) 2011-11-30
ES2373741T3 (es) 2012-02-08
BRPI0610441B1 (pt) 2019-01-02
MX2007012735A (es) 2008-01-11
CA2604796A1 (en) 2006-10-26
HK1113452A1 (en) 2008-10-03
TWI397903B (zh) 2013-06-01
CN101161033A (zh) 2008-04-09
US20090067644A1 (en) 2009-03-12
BRPI0610441A2 (pt) 2010-06-22
ATE527834T1 (de) 2011-10-15

Similar Documents

Publication Publication Date Title
JP5219800B2 (ja) コード化されたオーディオの経済的な音量計測
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
KR101278546B1 (ko) 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
EP2207170B1 (en) System for audio decoding with filling of spectral holes
KR101518532B1 (ko) 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
CN110197667B (zh) 对音频信号的频谱执行噪声填充的装置
EP2490215A2 (en) Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
EP1514263A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR101259120B1 (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090323

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120210

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160315

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5219800

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250