JP2013152470A - 過渡状態検出器およびオーディオ信号の符号化を支援する方法 - Google Patents
過渡状態検出器およびオーディオ信号の符号化を支援する方法 Download PDFInfo
- Publication number
- JP2013152470A JP2013152470A JP2013030367A JP2013030367A JP2013152470A JP 2013152470 A JP2013152470 A JP 2013152470A JP 2013030367 A JP2013030367 A JP 2013030367A JP 2013030367 A JP2013030367 A JP 2013030367A JP 2013152470 A JP2013152470 A JP 2013152470A
- Authority
- JP
- Japan
- Prior art keywords
- transient state
- frame
- transient
- audio signal
- hangover
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000007704 transition Effects 0.000 title abstract description 7
- 206010019133 Hangover Diseases 0.000 claims abstract description 67
- 230000005540 biological transmission Effects 0.000 claims abstract description 12
- 230000001052 transient effect Effects 0.000 claims description 206
- 230000008569 process Effects 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000004904 shortening Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 20
- 238000001514 detection method Methods 0.000 description 16
- 230000003595 spectral effect Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 9
- 230000007774 longterm Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000011664 signaling Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Abstract
【課題】オーディオ信号に作用する過渡状態を検出し次のフレームn+1の適切な符号化を可能にする過渡状態検出器およびオーディオ符号化を支援する方法を提供する。
【解決手段】過渡状態検出器100は入力オーディオ信号の所定のフレームnを分析し、前記所定のフレームnのオーディオ信号特性に基づいて、次のフレームn+1のための過渡状態ハングオーバ指標を決定する分析器110と、決定した過渡状態ハングオーバ指標を関連のオーディオ符号化器10に信号を伝達する伝送手段120とを有する。
【選択図】図2
【解決手段】過渡状態検出器100は入力オーディオ信号の所定のフレームnを分析し、前記所定のフレームnのオーディオ信号特性に基づいて、次のフレームn+1のための過渡状態ハングオーバ指標を決定する分析器110と、決定した過渡状態ハングオーバ指標を関連のオーディオ符号化器10に信号を伝達する伝送手段120とを有する。
【選択図】図2
Description
本発明はオーディオ信号に作用する過渡状態検出器およびオーディオ信号の符号化を支援する方法に関する。
エンコーダは、オーディオ信号などの信号を分析し、符号化した形式で信号を出力することが可能な、装置、回路、あるいはコンピュータ・プログラムである。結果として得られる信号は、送信、蓄積および/または暗号化の目的に使用されることが多い。他方、デコーダは、符号化した信号を受信し、復号化した信号を出力するに際し、符号化処理と逆の処理を行うことが可能な、装置、回路、あるいはコンピュータ・プログラムである。
現在のオーディオ符号化器などの多くのエンコーダにおいては、入力信号の各フレームを周波数領域で分析する。この分析の結果を量子化し、符号化し、次にアプリケーションに依存して送信または蓄積する。受信側では(または蓄積した符号化信号を使用する場合には)、後に合成手順が続く対応する復号手順により、時間領域で信号を復元することが可能となる。
帯域制限された通信チャネルを介して効率的な伝送を行うため、オーディオデータ、ビデオのデータのような情報の圧縮/伸張に、コーデックが用いられることが多い。
特に、高いオーディオ品質を維持しながら低ビットレートでオーディオ信号を送信し蓄積することについては、高い市場ニーズがある。例えば、伝送リソースまたは記憶装置が制限される場合、低ビットレート動作が本質的なコスト要因である。これは典型的には、例えば、移動通信システムにおけるストリーミングやメッセージングに応用する場合である。
オーディオ符号化、復号化を使用するオーディオ送信システムの一般的な例を図1に示す。全体のシステムは、基本的に、送信側にオーディオ符号化器10と送信モジュール(TX)20を、受信側に受信モジュール(RX)30とオーディオ復号化器40を備える。
オーディオ信号は準定常と考えられ、すなわち、短い時間区間においては定常と考えることができる。例えば、変換オーディオ・コーデックは、信号を短い時間区間に分割し、高効率な圧縮を達成するため準定常を仮定している。
オーディオ信号は、周波数および振幅において多くの急激な変化、いわゆる過渡状態を含む可能性がある。例えば、過渡状態が変換オーディオ・コーデックにおいて生じる可能性のある、耳に聴こえる歪み(例えば、プリエコー効果、即ち、時間的に拡散する量子化雑音)を回避するためにオーディオ・コーデックが適切に動作するよう、これらの過渡状態を検出することが望まれる。
この理由で、オーディオ・コーデックと結合して、過渡状態検出器が使用される。過渡状態検出器はオーディオ信号を分析し、検出過渡状態をエンコーダに信号伝達することに関与する。時間領域で動作する過渡状態検出器と、同じく周波数領域で動作する過渡状態検出器がある。
例えば、過渡状態検出器は、窓切換モジュールへの入力として、オーディオ・コーデックに含められるのが普通である(非特許文献1,2)。
ISO/IEC JTC/SC29/WG 11, CD 11172-3, "CODING OF MOVING PICTURES AND ASSOCIATED AUDIO FOR DIGITAL STORAGE MEDIA AT UP TO ABOUT 1.5MBIT/s, Part3 AUDIO", 1993
ISO/TEC 13818-7, "MPEG-2 Advanced Audio Coding, AAC", 1997
しかしながら、より効率的なオーディオ符号化と、過渡状態検出器を含むオーディオ符号化を支援する改良された手法、その実現に対する一般的な要求がある。
オーディオ信号に作用する改良された過渡状態検出器を提供することが、本発明の一般的な目的である。
また、オーディオ信号の符号化を支援する方法を提供することが目的である。
これらおよびその他の目的は、添付の請求の範囲により定められる本発明により満たされる。
発明者が認識したことは、時間領域で過渡状態検出器を実行し、コーデックが重複変換(lapped transform)に基づいて動作する場合、所定のフレームの過渡状態もまた、次のフレームの符号化に影響を及ぼすだろう、ということである。従って、本発明の基本的着想は、入力オーディオ信号の所定のフレームnを分析し、その所定のフレームnのオーディオ信号特性に基づいて、次のフレームn+1のために過渡状態ハングオーバ指標を決定し、決定した過渡状態ハングオーバ指標を関連のオーディオ符号化器に伝送し、後続フレームn+1の適切な符号化を可能とすることである。
好ましくは、所定のフレームnのオーディオ信号特性が過渡状態を表す特性を含んでいる場合は、後続フレームn+1のための過渡状態ハングオーバ指標を過渡状態であることを示す値に決定する。
実際には、それ故、過渡状態が検出され、現在のフレームのためにコーデックにそれが伝送されると、過渡状態検出器は、次のフレームに関連のある過渡状態ハングオーバも伝送する、というように、過渡状態検出器を構成することができる。
このようにして、コーデックが重複変換に基づいて動作する場合、次のフレームのためにも適切な符号化動作を行うことを保証し得る。
本発明は、過渡状態検出器およびオーディオ信号の符号化を支援する方法の両方を対象とする。
本発明の実施形態についての下記の説明を読めば、本発明が提供する更なる利点が認識されよう。
本発明については、以下の添付の図面ならびに下記の説明を参照することにより、その更なる目的および利点とともに、最もよく理解されるであろう。
図面を通して、対応する、または類似の要素には、同じ参照文字を使用する。
前述したように、例えば、過渡状態が変換オーディオ・コーデックおよび、より一般的には、重複変換に基づいて動作する符号化器において原因となる可能性のある、耳に聴こえる歪み(例えば、プリエコー効果)を回避するため、オーディオ・コーデックが適切な動作をするように、オーディオ信号の過渡状態を検出することが望ましい。一般的に、低エネルギ領域の直後の変換ブロックの終了近くで急激な立上りの信号が始まると、プリエコーが生じる。通常、時間および/または周波数領域で測定した振幅および/またはパワーのようなオーディオ信号特性における突然の変化により、過渡状態を特徴付ける。好ましくは、入力フレームのために過渡状態を検出した場合、過渡状態のために特別に採用した変換符号化(過渡状態符号化モード)を実行するよう、オーディオ符号化器を構成する。過渡状態を符号化するために、多くの異なる従来の方法がある。
しかしながら、時間領域で過渡状態検出を実行し、コーデックが重複変換(lapped transform)に基づいて動作する場合、所定のフレームの過渡状態はまた、次のフレームの符号化に影響を及ぼすだろう、ということを発明者は認識していた。重複変換コーデックの動作に対するこの洞察に基づき、新しい検出器を取り入れる。
図2は、本発明の典型的な実施形態による、オーディオ符号化器と関連する新規な過渡状態検出器を示す概略ブロック図である。図2の過渡状態検出器100には、基本的に、分析器110とシグナリングモジュール120を含む。関連のオーディオ符号化器10によって符号化すべきオーディオ信号はまた、入力として過渡状態検出器100に転送される。通常、オーディオ信号の現在の入力フレームにおける過渡状態を検出するために、および現在のフレームの正しい符号化のためにオーディオ符号化器に過渡状態を伝送するために、過渡状態検出器が動作可能である。この例では、オーディオ符号化器10は、好ましくは、重複変換を使用する変換符号化器(transform-based encoder)である。
分析器110は受信したオーディオ信号に基づいて適切な信号分析を実行する。好ましくは、過渡状態検出器100は、オーディオ信号の所定のフレームnを分析し、その所定のフレームnのオーディオ信号特性に基づいて、分析器110の新規なハングオーバ指標モジュール112における次のフレームn+1のために、過渡状態ハングオーバ指標(transient hangover indicator)を決定する。決定した過渡状態ハングオーバ指標を関連のオーディオ符号化器に伝送し、シグナリングモジュール120は、決定した過渡状態ハングオーバ指標を関連のオーディオ符号化器10に伝送するよう動作可能であり、後続フレームn+1の適切な符号化を可能とする。短期エネルギ対長期エネルギ比のような任意の適当な過渡状態検出測度を使用することができる。
それ故、現在のフレームnの分析に基づいて、過渡状態検出器100は、現在のフレームnのための過渡状態のみならず、後続フレームn+1のための過渡状態ハングオーバ指標をも信号伝達可能である。
図3A−Bに示すように、エンコーダが重複変換に基づいて動作する場合、所定の入力フレームにおける過渡状態は次のフレームの符号化に影響を及ぼす可能性がある。
例えば、通常、DCT(離散コサイン変換)、修正離散コサイン変換(MDCT)またはMDCT以外の重複変換のような時間対周波数領域変換を中心にして、変換オーディオ符号化器を構築する。変換オーディオ符号化器の共通の特性は、サンプルの重複したブロック、すなわちオーバラップ・フレームに作用することである。
図3A−Bは,オーディオ信号の入力フレームと、オーディオ符号化器への入力として使用するいわゆるオーバラップ・フレームとを示す。
図3Aでは、2個の連続したオーディオ入力フレーム、フレームn−1およびフレームnを示す。入力フレームnに関する変換オーディオ符号化のための入力は、フレームnおよびn−1によって形成される。この例では、入力フレームnは過渡状態を含み、変換オーディオ符号化のための入力にもまた、自然に過渡状態を含むであろう。
図3Bでは、2個の連続したオーディオ入力フレーム、フレームnおよびフレームn+1を示す。入力フレームn+1に関する変換オーディオ符号化のための入力は、フレームnとn+1によって形成される。図3Bから分かるように、フレームnにおける過渡状態は、フレームn+1に関する符号化のための変換への入力にも存在する。
注意すべきことは、フレームnを符号化するための変換への入力およびフレームn+1を符号化するための変換への入力はオーバラップしている、ということである。従って、これが、これらのより大きな変換入力ブロックをオーバラップ・フレームと呼ぶ理由である。
もし時間領域で過渡状態検出を実行し、コーデックが、修正離散コサイン変換(MDCT)のような重複変換で動作するなら、入力フレームの過渡状態はまた、次のフレームに現れるだろう。
それを検出するフレームにおいてのみならず、次のフレームにおいても過渡状態を符号化するので、過渡状態検出器にハングオーバを導入することが考えられる。ハングオーバは、現フレームで過渡状態が検出され、コーデックに伝送されると、過渡状態検出器はまた、次のフレームで過渡状態が検出されたことをコーデックに伝送するだろう、ということを意味する。
このようにして、後続フレームのためにも適切な符号化動作が行われることが保証され得る。過渡状態を示すハングオーバ指標を、過渡状態検出器100のシグナリングモジュール120からオーディオ符号化器10に信号伝達する場合、エンコーダ10はフレームn+1のいわゆる過渡状態符号化を実行する。即ち、過渡状態を含むオーバラップ・フレーム・ブロックの符号化のため採用した、いわゆる過渡状態符号化モードを使用する。
いわゆる過渡状態符号化モードにおける適切な符号化動作は、例えば、周波数分解能の低下と引き替えに時間分解能を向上させるため、変換長さを短縮させることができる。これは、例えば、対応する時間領域エイリアシングされたフレームを生成するため、オーバラップ・フレームに基づいて時間領域エイリアシング(TDA)を実行することにより達成されてもよく、少なくとも2個の、サブフレームとも言われるセグメントを生成するため、時間領域エイリアシングされたフレームに基づいて時間でセグメンテーションを実行してもよい。次に、これらのセグメントに基づいて、各セグメントのためにセグメントの周波数成分を表す係数を獲得するため、変換スペクトル分析を実行してもよい。
理解すべきことは、入力フレームn+1(図3B参照)のオーディオ信号特性に基づいて過渡状態検出器100が過渡状態を全く検出しない場合でも、とにかく、フレームnで検出した過渡状態に由来するハングオーバに基づいて、オーディオ符号化器10に過渡状態ハングオーバ指標を信号伝達してもよい。これは、過渡状態検出器が考慮する最も新しく入力されたフレームのオーディオ信号特性に基づく従来の過渡状態検出だけに頼るという、従来技術のトレンドの主流に逆行する。従来技術による過渡状態検出では、フレームn+1(図3B)のためには全く過渡状態を検出しないだろうし、従って、関連のオーディオ符号化器は過渡状態符号化モードを使用しないであろうし、その結果、耳障りなプリエコーのような耳に聴こえる歪みをもたらすことになる。
図4の典型的な概略的フロー図を参照して、高効率なオーディオ符号化のための改善された支援について、以下のとおり要約することができる。
ステップS1で、オーディオ信号を受信する。ステップS2で、所定のフレームnを分析し、所定のフレームnのオーディオ信号特性に基づいて、次のフレームn+1のために過渡状態ハングオーバ指標を決定する。ステップS3で、関連のオーディオ符号化器にその過渡状態ハングオーバ指標を信号伝達し、オーディオ信号の次のフレームn+1に関する適切な符号化動作を可能にする。
上記したように、分析中の所定の入力フレームn内の過渡状態を表すオーディオ信号特性の存在に依存して、過渡状態ハングオーバ指標の値を決定するのが好ましい。真/偽、1/0、+1/−1あるいはその他の多くの等価な表現を含めて、多くの異なる方法でハングオーバ指標の値を表現することができる。
本発明のより良い理解のため、信号分析および検出メカニズムの更に詳しい例について、ここで説明する。
(ブロック単位のエネルギ計算)
例として、過渡状態検出器は、オーディオ信号のパワーの変動に基づくことができる。例えば、図5に示すように、符号化するオーディオ・フレームを数個のブロックに分割可能である。各ブロックiにおいて、短期パワーPst(i)を計算する。
例として、過渡状態検出器は、オーディオ信号のパワーの変動に基づくことができる。例えば、図5に示すように、符号化するオーディオ・フレームを数個のブロックに分割可能である。各ブロックiにおいて、短期パワーPst(i)を計算する。
長期パワーPlt(i)は、簡単なIIRフィルタで、Plt(i)=αPlt(i−1)+(1−α)Pst(i)と計算できる。ここでαは忘却係数である。
Pst(i)/Plt(i−1)が、あるしきい値を超えると、過渡状態検出器は、ブロックiで過渡状態が検出されたことを信号伝達する。
エネルギの用語で表現して、各ブロックに対して、短期エネルギE(n)と長期エネルギELT(n)との間の比較を実行する。エネルギ比が、あるしきい値以上の場合は、過渡状態を検出したと判断する。
E(n)≧RATIO×ELT(n)、
ここで、RATIOは、例えば7.8dBといった、適当な値に設定しうる、エネルギ比しきい値である。
E(n)≧RATIO×ELT(n)、
ここで、RATIOは、例えば7.8dBといった、適当な値に設定しうる、エネルギ比しきい値である。
これは単なる一つの検出測度の例であり、本発明はこれに限定されない。
(ハイパスフィルタおよびゼロ交差)
オーディオ・フレームのブロックは短いので、上記の過渡状態検出器は、定常信号に対して、低周波サイン関数の変動によって急激なパワー変化があったと判断されてしまうリスクがある。
オーディオ・フレームのブロックは短いので、上記の過渡状態検出器は、定常信号に対して、低周波サイン関数の変動によって急激なパワー変化があったと判断されてしまうリスクがある。
この問題は、図6の例に示すように、パワー計算の前にハイパスフィルタを追加することにより、回避できる。図6の過渡状態検出器100には、ハイパスフィルタ113、ブロック・エネルギ計算モジュール114、長期平均モジュール115およびしきい値比較モジュール116を備え、フレームnのためにIsTransient(過渡状態あり)表示を提供する。ハイパスフィルタ113は低周波数を取り除き、高周波数のみのパワー計算を可能にする。
上記の問題に対するもう一つの可能な解決策は、分析ブロックのゼロ交差数を計算することである。ゼロ交差の数が低い場合、信号は低い周波数のみを含み、過渡状態検出器は、しきい値を増加するよう、またはそのブロックには過渡状態がないと決定することができるであろうと、仮定する。
図7は、本発明の典型的実施形態による、過渡状態ハングオーバ検査を有する過渡状態検出器の例を示す概略的な図である。図7の過渡状態検出器100には、ハイパスフィルタ113、ブロック・エネルギ計算モジュール114、長期平均モジュール115、しきい値比較モジュール116および過渡状態ハングオーバを検査するためのモジュール112を備え、次のフレームn+1のためにIsTransient(過渡状態あり)ハングオーバ指標を提供する。
(窓関数および/または位置に依存する過渡状態/ハングオーバ検出)
オプションとして、過渡状態の存在に依存するだけでなく、所定の窓関数および/または分析フレーム内の過渡状態の位置にも依存して、過渡状態ハングオーバ指標の値を決定するよう、過渡状態検出器の信号分析器を構成することができる。
オプションとして、過渡状態の存在に依存するだけでなく、所定の窓関数および/または分析フレーム内の過渡状態の位置にも依存して、過渡状態ハングオーバ指標の値を決定するよう、過渡状態検出器の信号分析器を構成することができる。
オーディオ符号化器における変換の前に、通常、窓関数でオーディオ信号を乗算する。修正離散コサイン変換(MDCT)に基づくコーデックの場合、窓関数は、いわゆるサイン窓であることが多いが、Kaiser−Bessel窓あるいは幾つかのその他の窓関数であってもよい。
一般的に、窓関数は現在のフレームの開始時点および前フレームの終了時点で最大値を持ち、一方、現在のフレームの終了および前フレームの開始はゼロに近い。
このことは、現在のフレームの終了近くの過渡状態は窓関数で圧縮され、従って符号化器への信号伝達には重要さが殆んどないであろう。過渡状態が十分圧縮されるなら、過渡状態が検出されたことを符号化器に信号伝達しないことは、有益でさえあり得る。
しかしながら、後続フレームを符号化すべきである場合、過渡状態は前フレームの終端部にある。即ち、窓関数の最大値に近くに位置するだろうが、従って、過渡状態を検出したということを符号化器に信号伝達することは、本質的なことである。
したがって、フレームの終端近くの過渡状態は、ハングオーバを1(または等価な表現)に設定し、一方、符号化器には、過渡状態が全く検出されなかったことを信号伝達する。このように、過渡状態検出器は、後続フレームで過渡状態が検出されることを信号伝達する。
同様に、フレームの始端部で過渡状態を検出したなら、過渡状態検出器は、過渡状態が検出されたことを信号伝達すべきであるが、後続フレームを符号化する場合、窓関数が過渡状態を圧縮するだろうから、ハングオーバを0(または等価な表現)に設定すべきである。
フレームの中央部に位置する過渡状態は、現フレームと後続フレームの両方に現れるであろう。従って、“過渡状態検出”が、信号伝達され、ハングオーバを1に設定すべきである。
窓関数に関して、“フレームの開始”、“フレームの中心”および“フレームの終了”間の境界が厳密に選ばれることが好ましい。
また、理解すべきことであるが、表1の1/0の表現は、単に例として使用している。実際、ハングオーバ/非ハングオーバを表示するため、真/偽および+1/−1を含む任意の適当な表現を使用してもよい。確率的表現のような非二値表現を使用することも可能である。
言い換えれば、所定の窓関数に基づく窓動作の後、フレームnの過渡状態を表すオーディオ信号特性が検出可能であれば、後続フレームn+1のための、過渡状態を表示する過渡状態ハングオーバ指標を決定するように過渡状態検出器を構成することができる。また、その窓関数に基づく窓動作の後、フレームnの過渡状態を表すオーディオ信号特性が圧縮される場合には、次のフレームn+1のために、過渡状態を示さない過渡状態ハングオーバ指標に決定するよう、過渡状態検出器を構成することができる。一般的に、下記に説明するように、窓関数は関連のオーディオ符号化器のフレームnの変換符号化に使用されるが、時間的に1フレーム分前方にシフトした窓関数(少なくとも2フレームに及ぶ)に対応する。
この発明は、オーバラップ・フレームに対処するよう決定を調整するため、最初の過渡状態検出を修正する決定論理を導入する。これは、時間的発生に依存するある過渡状態は特別の方法で処理する必要は無い、という事実に基づいている。そのような場合に対して、本発明は最初の決定を無効にして、過渡状態が無いということを信号伝達する。一般に、本発明は、特定のアプリケーションに基づいて決定を調整するため、最初の過渡状態検出を修正する可能性がある。
図8A−Bは、本発明の典型的実施形態による、過渡状態と、ハングオーバ指標のための過渡状態および/または窓関数の位置の効果の第一の例を示す概略的な図である。
図8Aは、変換を適用する前に使用する典型的な窓関数と一緒に、変換への入力として使用するフレームn−1とフレームnを示す。過渡状態はフレームn(フレームの中心)にあり、選択した窓関数を使用する窓動作の後、過渡状態は、この特別な例ではまだ検出可能である。従って、過渡状態検出指標TDは値1に設定される。
ハングオーバ指標のため、フレームnを分析フレームとして使用するが、図8Bに示すように、窓関数を1フレーム前方にシフトする。この特別な例では、シフトした窓関数で窓をかけた後でも、フレームnにおける過渡状態は検出可能であり、従って、ハングオーバ指標HOは値1に設定される。
図9A−Bは、本発明の典型的実施形態による、過渡状態と、ハングオーバ指標のための過渡状態および/または窓関数の位置の効果の第二の例を示す概略的な図である。
選択した窓関数を使用する窓動作の後、図9Aの例では、フレームn(フレームの開始)における過渡状態が検出可能である。従って、過渡状態検出指標TDは値1に設定される。
図9Bの例では、フレームnの過渡状態は、シフトした窓関数によって圧縮され、従って、ハングオーバ指標HOは値0に設定される。
図10A−Bは、本発明の典型的実施形態による、過渡状態と、ハングオーバ指標のための過渡状態および/または窓関数の位置の効果の第三の例を示す概略的な図である。
図10Aの例では、フレームn(フレームの終了)の過渡状態は、変換窓関数によって圧縮され、従って、過渡状態検出指標TDは0に設定される。
図10Bの例に示すように、フレームnの過渡状態は、シフトした窓関数により、窓かけの後検出され、従って、ハングオーバ指標HOは1に設定される。
過渡状態検出を選択した窓関数に採用することにより、上記の概念は更にさらに改善可能であろう。
本発明の典型的な実施形態で、短期エネルギを長期エネルギで割算し、その商をしきい値と比較する前に、現在のブロックで、窓関数で短期エネルギをスケーリングすることが可能である。それにもかかわらず、スケーリングされない短期エネルギで長期エネルギを更新する。もし長期エネルギで割算したスケーリングの短期エネルギがしきい値を超えるなら、過渡状態検出器は、過渡状態を検出したと信号伝達する。
同様に、1フレーム長シフトしたブロックの位置(次のフレームを符号化する場合のブロックの位置)で、窓関数により短期エネルギをスケーリングする。もし長期エネルギで割算したスケーリングの短期エネルギがしきい値を超えるなら、過渡状態検出器はハングオーバを1に設定し、そうでなければ0に設定する。
本発明の好ましい典型的実施形態において、過渡状態検出器には、第一のスケーリングしたフレームを生成するため、選択した窓関数でフレームnをスケーリングする手段と、第一のスケーリングしたフレームに基づいてフレームnのために過渡状態指標を決定する手段と、第二のスケーリングしたフレームを生成するため、時間で1フレーム前方にシフトした窓関数によりフレームnをスケーリングする手段と、第二のスケーリングしたフレームに基づいて次のフレームn+1のために過渡状態ハングオーバ指標を決定する手段とを備える。
以下では、“ITU−T G.722.1フルバンド・コーデック拡張”(現在はITU−T G.719標準に改称)に適する特定の例で非制限的なコーデック実現に関連して、本発明について説明する。この特定の例では、低演算量の変換オーディオ・コーデックとして本コーデックを示し、これは望ましくは48kHzのサンプルレートで動作し、20Hzから20kHzまでの範囲のフル・オーディオ帯域幅を提供する。符号化器は20msのフレームで入力16ビットリニアPCM信号の入力を処理し、コーデックの総遅延は40msである。符号化アルゴリズムは、望ましくは、適応時間分解能、適応ビット配分、低演算量のラティスベクトル量子化を有する変換符号化に基づく。加えて、復号化器は、信号適応ノイズフィル(noise−fill)または帯域幅拡張のどちらかで、非符号化スペクトル成分を置換してもよい。
図11は、フルバンド信号のために適切な符号化器のブロック図である。48kHzでサンプルした入力信号を過渡状態検出器で処理する。過渡状態の検出に依存して、入力信号フレームに高周波数分解能または低周波数分解能(高時間分解能)変換を適用する。適応変換は、定常フレームの場合には、修正離散コサイン変換(MDCT)に基づくのが望ましい。非定常フレームに対しては、追加遅延の必要が無く、演算量で少しだけのオーバヘッドがある、より高い時間分解能変換(時間領域エイリアシングおよび時間セグメンテーションに基づく)を使用する。非定常フレームは、5msフレームに相当する時間分解能(任意の分解能をどれでも選択できるが)を持つのが望ましい。
あるフレームにおける過渡状態検出器はまた、次のフレームでに過渡状態をトリガするであろう。過渡状態検出器の出力は、例えば、IsTransient(過渡状態あり)と表示するフラグである。過渡状態を検出したなら、値1または論理値TRUE(真)または等価な表現にフラグを設定するか、そうでなければ(もし過渡状態を検出しないなら)値0または論理値FALSE(偽)または等価な表現にフラグを設定する。
取得したスペクトル係数を等しくない長さのバンドにグループ分けするのが有益である。各バンドのノルムを推定し、全バンドのノルムからなる結果のスペクトル包絡を量子化し、符号化する。次に、量子化ノルムで係数を正規化する。適応スペクトル重み付けに基づき、量子化ノルムを更に調整し、ビット割当てのための入力として使用する。正規化スペクトル係数は、各周波数バンドに割り当てられたビットに基づいて量子化し、符号化したラティスベクトルである。非符号化スペクトル係数のレベルを推定し、符号化して復号化器に送信する。符号化スペクトル係数と符号化ノルムの両方の量子化指数に、ハフマン符号化を適用するのが望ましい。
図12は、フルバンド信号のために適切な復号化器のブロック図である。まず、過渡状態フラグを復号化し、フレーム構成、即ち、定常か過渡かを示す、スペクトル包絡を復号化し、同じで、ビットイグザクトな、ノルム調整およびビット割当てアルゴリズムを復号化器で使用し、正規化変換係数の量子化指数を復号化するのに本質的なビット割当てを再計算する。
逆量子化の後、望ましくは受信したスペクトル係数(非ゼロビット配分を有するスペクトル係数)から構築したスペクトルフィル・コードブック(spectral−fill codebook)を使用して、低周波数の非符号化スペクトル係数(ゼロビットを配分した)を再生成する。
再生成した係数のレベルを調整するため、雑音レベル調整指数を使用してもよい。帯域幅拡張を使用して、高い周波数の非符号化スペクトル係数を再生成するのが望ましい。
復号化スペクトル係数および再生成スペクトル係数を合成し、正規化スペクトルとする。復号化スペクトル包絡を適用し、復号化フルバンド・スペクトルとする。
最終的には、逆変換を適用し、時間領域復号化信号を再生する。定常モードには逆修正離散コサイン変換(IMDCT)、または過渡モードにはより高い時間分解能変換の逆のどちらかを適用して、これを実行するのが好ましい。
フルバンド拡張に採用するアルゴリズムは、適応型変換−符号化技術に基づく。それは、入力および出力オーディオの20msフレームに作用する。変換窓(基底関数長)は40msであり、連続する入力および出力フレーム間で、50パーセントオーバラップを使用するので、実効ルックアヘッド・バッファ・サイズは20msである。従って、アルゴリズム総遅延は40msであり、これは、フレーム・サイズにルックアヘッド・サイズを加えた和である。ITU−TG.719コーデックの使用において経験するその他の全ての追加=遅延は、コンピュータの計算、および/または、ネットワーク送信遅延のどちらかによるものである。
本発明の利点には、低演算量、時間領域計算(スペクトル計算を全く必要としない)および/またはハングオーバ値に基づく重複変換との両立性を含む。
上記の実施形態は単に例として与えたものであり、本発明はこれに限定されないということを理解すべきである。本明細書で開示し、特許請求の範囲に記載される基本的な根底の原理を保持する、更なる修正、変更および改善は、本発明の範囲に含まれる。
Claims (23)
- オーディオ信号に対して動作する過渡状態検出器であって、
前記オーディオ信号の所定のフレームnを分析して、前記所定のフレームnのオーディオ信号特性に基づいて、後続フレームn+1のための過渡状態ハングオーバ指標を決定する分析手段と、
前記後続フレームn+1の適切な符号化が可能になるよう、前記決定された過渡状態ハングオーバ指標をオーディオ符号化器に伝送する伝送手段と、
を有することを特徴とする過渡状態検出器。 - 前記分析手段は、前記所定のフレームnにおける過渡状態を表すオーディオ信号特性に依存して前記後続フレームn+1のための前記過渡状態ハングオーバ指標の値を決定することを特徴とする請求項1に記載の過渡状態検出器。
- 前記分析手段は、前記所定のフレームnの前記オーディオ信号特性が過渡状態を表す特性を含んでいる場合は、前記後続フレームn+1のための過渡状態ハングオーバ指標を過渡状態であることを示す値に決定することを特徴とする請求項2に記載の過渡状態検出器。
- 前記分析手段は、所定の窓関数にも依存して、前記後続フレームn+1のための前記過渡状態ハングオーバ指標の値を決定することを特徴とする請求項2に記載の過渡状態検出器。
- 前記分析手段は、前記窓関数に基づく窓掛け処理後に前記所定のフレームnにおける過渡状態を表すオーディオ信号特性が検出可能である場合は、前記後続フレームn+1のための過渡状態ハングオーバ指標を過渡状態であることを示す値に決定することを特徴とする請求項4に記載の過渡状態検出器。
- 前記分析手段は、前記窓関数に基づく窓掛け処理後に前記所定のフレームnにおける過渡状態を表すオーディオ信号特性が抑圧された場合は、前記後続フレームn+1のための過渡状態ハングオーバ指標を過渡状態であることを示さない値に決定することを特徴とする請求項4に記載の過渡状態検出器。
- 前記窓関数は、前記オーディオ符号化器において前記オーディオ信号の前記所定のフレームnの変換符号化に使用される窓関数に対応するものであり、時間的に1フレーム分前方にシフトされていることを特徴とする請求項4に記載の過渡状態検出器。
- 前記オーディオ符号化器は、フレームを符号化するために、重複変換と、少なくとも2つのフレームを用いる窓関数とに基づいて動作することを特徴とする請求項7に記載の過渡状態検出器。
- 前記窓関数によって前記所定のフレームnをスケーリングして第1のスケーリングされたフレームを生成する手段と、
前記第1のスケーリングされたフレームに基づいて前記所定のフレームnの過渡状態指標を決定する手段と、
前記時間的に1フレーム分前方にシフトされた窓関数によって前記所定のフレームnをスケーリングして第2のスケーリングされたフレームを生成する手段と、
前記第2のスケーリングされたフレームに基づいて前記後続フレームn+1のための過渡状態ハングオーバ指標を決定する手段と、
を含むことを特徴とする請求項4に記載の過渡状態検出器。 - 前記分析手段は、前記所定のフレームnにおける過渡状態の位置にも依存して、前記後続フレームn+1のための前記過渡状態ハングオーバ指標の値を決定することを特徴とする請求項2に記載の過渡状態検出器。
- 前記分析手段は、前記過渡状態が前記所定のフレームnの中央部または後端部に位置している場合は、前記後続フレームn+1のための過渡状態ハングオーバ指標を過渡状態であることを示す値に決定することを特徴とする請求項10に記載の過渡状態検出器。
- 前記分析手段は、前記過渡状態が前記所定のフレームnの始端部に位置している場合は、前記後続フレームn+1のための過渡状態ハングオーバ指標を過渡状態であることを示さない値に決定することを特徴とする請求項10に記載の過渡状態検出器。
- 前記過渡状態検出器は、重複変換を用いた変換オーディオ符号化器とともに動作するためのものであることを特徴とする請求項1乃至12のいずれか1項に記載の過渡状態検出器。
- 前記後続フレームn+1の適切な符号化は、過渡状態を示す過渡状態ハングオーバ指標が伝送されてきたときの過渡状態符号化を含むことを特徴とする請求項1に記載の過渡状態検出器。
- オーディオ信号の符号化を支援するための方法であって、
前記オーディオ信号を受信する受信ステップと、
前記オーディオ信号の所定のフレームnを分析して、前記所定のフレームnのオーディオ信号特性に基づいて、後続フレームn+1のための過渡状態ハングオーバ指標を決定する分析ステップと、
前記オーディオ信号の前記後続フレームn+1の適切な符号化が可能になるよう、前記過渡状態ハングオーバ指標をオーディオ符号化器に伝送する伝送ステップと、
を有することを特徴とする方法。 - 前記分析ステップは、前記所定のフレームnにおける過渡状態を表すオーディオ信号特性に依存して前記後続フレームn+1のための前記過渡状態ハングオーバ指標の値を決定するステップを含むことを特徴とする請求項15に記載の方法。
- 前記分析ステップは、前記所定のフレームnの前記オーディオ信号特性が過渡状態を表す特性を含んでいる場合に、前記後続フレームn+1のための過渡状態ハングオーバ指標を過渡状態であることを示す値に決定するステップを含むことを特徴とする請求項15に記載の方法。
- 前記分析ステップは、所定の窓関数にも依存して、前記後続フレームn+1のための前記過渡状態ハングオーバ指標の値を決定することを特徴とする請求項16に記載の方法。
- 前記窓関数は、前記オーディオ符号化器において前記オーディオ信号の前記所定のフレームnの変換符号化に使用される窓関数に対応するものであり、時間的に1フレーム分前方にシフトされていることを特徴とする請求項18に記載の方法。
- 前記分析ステップは、前記所定のフレームnにおける過渡状態の位置にも依存して、前記後続フレームn+1のための前記過渡状態ハングオーバ指標の値を決定することを特徴とする請求項16に記載の方法。
- 前記伝送ステップにおける前記過渡状態ハングオーバ指標の伝送によって、前記オーディオ符号化器は、過渡状態を示す過渡状態ハングオーバ指標が伝送されてきたときに、過渡状態を含むフレームの符号化を行う符号化モードで前記後続フレームn+1の符号化を行うことが可能になることを特徴とする請求項15に記載の方法。
- 前記符号化の動作は、過渡状態を示す過渡状態ハングオーバ指標が伝送されてきたときに、変換の時間解像度を向上させるために変換長を短縮するステップを含むことを特徴とする請求項21に記載の方法。
- 前記オーディオ符号化器は、重複変換を用いた変換符号化器であることを特徴とする請求項15に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US96822907P | 2007-08-27 | 2007-08-27 | |
US60/968,229 | 2007-08-27 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010522866A Division JP5209722B2 (ja) | 2007-08-27 | 2008-08-25 | 過渡状態検出器およびオーディオ信号の符号化を支援する方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015079609A Division JP6117269B2 (ja) | 2007-08-27 | 2015-04-08 | 過渡状態検出器およびオーディオ信号の符号化を支援する方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013152470A true JP2013152470A (ja) | 2013-08-08 |
Family
ID=40387558
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010522866A Active JP5209722B2 (ja) | 2007-08-27 | 2008-08-25 | 過渡状態検出器およびオーディオ信号の符号化を支援する方法 |
JP2013030367A Pending JP2013152470A (ja) | 2007-08-27 | 2013-02-19 | 過渡状態検出器およびオーディオ信号の符号化を支援する方法 |
JP2015079609A Active JP6117269B2 (ja) | 2007-08-27 | 2015-04-08 | 過渡状態検出器およびオーディオ信号の符号化を支援する方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010522866A Active JP5209722B2 (ja) | 2007-08-27 | 2008-08-25 | 過渡状態検出器およびオーディオ信号の符号化を支援する方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015079609A Active JP6117269B2 (ja) | 2007-08-27 | 2015-04-08 | 過渡状態検出器およびオーディオ信号の符号化を支援する方法 |
Country Status (9)
Country | Link |
---|---|
US (4) | US9495971B2 (ja) |
EP (1) | EP2186090B1 (ja) |
JP (3) | JP5209722B2 (ja) |
CN (1) | CN101790756B (ja) |
CA (1) | CA2697920C (ja) |
ES (1) | ES2619277T3 (ja) |
PL (1) | PL2186090T3 (ja) |
PT (1) | PT2186090T (ja) |
WO (1) | WO2009029033A1 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101939782B (zh) | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
US9495971B2 (en) | 2007-08-27 | 2016-11-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Transient detector and method for supporting encoding of an audio signal |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102214464B (zh) * | 2010-04-02 | 2015-02-18 | 飞思卡尔半导体公司 | 音频信号的瞬态检测方法以及基于该方法的时长调整方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN102971788B (zh) * | 2010-04-13 | 2017-05-31 | 弗劳恩霍夫应用研究促进协会 | 音频信号的样本精确表示的方法及编码器和解码器 |
CA3203400C (en) | 2010-07-19 | 2023-09-26 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
JP6075743B2 (ja) * | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US8489391B2 (en) * | 2010-08-05 | 2013-07-16 | Stmicroelectronics Asia Pacific Pte., Ltd. | Scalable hybrid auto coder for transient detection in advanced audio coding with spectral band replication |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5807453B2 (ja) * | 2011-08-30 | 2015-11-10 | 富士通株式会社 | 符号化方法、符号化装置および符号化プログラム |
JP5898534B2 (ja) * | 2012-03-12 | 2016-04-06 | クラリオン株式会社 | 音響信号処理装置および音響信号処理方法 |
EP2709106A1 (en) | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
WO2014118179A1 (en) * | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, systems, methods and computer programs using an increased temporal resolution in temporal proximity of onsets or offsets of fricatives or affricates |
EP2959481B1 (en) | 2013-02-20 | 2017-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an encoded audio or image signal or for decoding an encoded audio or image signal in the presence of transients using a multi overlap portion |
WO2015041070A1 (ja) | 2013-09-19 | 2015-03-26 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
US9148520B2 (en) | 2013-12-09 | 2015-09-29 | Intel Corporation | Low complexity tone/voice discrimination method using a rising edge of a frequency power envelope |
KR20230042410A (ko) | 2013-12-27 | 2023-03-28 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
KR102354331B1 (ko) * | 2014-02-24 | 2022-01-21 | 삼성전자주식회사 | 신호 분류 방법 및 장치, 및 이를 이용한 오디오 부호화방법 및 장치 |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
CN110870006B (zh) | 2017-04-28 | 2023-09-22 | Dts公司 | 对音频信号进行编码的方法以及音频编码器 |
WO2019172811A1 (en) * | 2018-03-08 | 2019-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for handling antenna signals for transmission between a base unit and a remote unit of a base station system |
CN110503973B (zh) * | 2019-08-28 | 2022-03-22 | 浙江大华技术股份有限公司 | 音频信号瞬态噪音抑制方法、系统以及存储介质 |
CN114586034A (zh) | 2019-11-19 | 2022-06-03 | 谷歌有限责任公司 | 时钟波动下的电压变化检测 |
CN112291676B (zh) * | 2020-05-18 | 2021-10-15 | 珠海市杰理科技股份有限公司 | 抑制音频信号拖尾的方法及系统、芯片、电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001127641A (ja) * | 1999-10-25 | 2001-05-11 | Victor Co Of Japan Ltd | オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体 |
JP2003195881A (ja) * | 2001-12-28 | 2003-07-09 | Victor Co Of Japan Ltd | 周波数変換ブロック長適応変換装置及びプログラム |
JP2006201375A (ja) * | 2005-01-19 | 2006-08-03 | Toshiba Corp | オーディオ符号化方法およびオーディオ符号化装置 |
JP2010501153A (ja) * | 2006-08-18 | 2010-01-14 | デジタル ライズ テクノロジー シーオー.,エルティーディー. | フレーム型データの可変分解能処理 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE507370C2 (sv) * | 1996-09-13 | 1998-05-18 | Ericsson Telefon Ab L M | Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare |
US6202046B1 (en) * | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
JPH10341256A (ja) * | 1997-06-10 | 1998-12-22 | Logic Corp | 音声から有音を抽出し、抽出有音から音声を再生する方法および装置 |
FR2768545B1 (fr) * | 1997-09-18 | 2000-07-13 | Matra Communication | Procede de conditionnement d'un signal de parole numerique |
US5991718A (en) * | 1998-02-27 | 1999-11-23 | At&T Corp. | System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments |
CA2246532A1 (en) | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
US6266644B1 (en) | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
CA2358203A1 (en) * | 1999-01-07 | 2000-07-13 | Tellabs Operations, Inc. | Method and apparatus for adaptively suppressing noise |
US6226608B1 (en) | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
US6597961B1 (en) * | 1999-04-27 | 2003-07-22 | Realnetworks, Inc. | System and method for concealing errors in an audio transmission |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6662155B2 (en) * | 2000-11-27 | 2003-12-09 | Nokia Corporation | Method and system for comfort noise generation in speech communication |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US6889187B2 (en) * | 2000-12-28 | 2005-05-03 | Nortel Networks Limited | Method and apparatus for improved voice activity detection in a packet voice network |
US7069208B2 (en) * | 2001-01-24 | 2006-06-27 | Nokia, Corp. | System and method for concealment of data loss in digital audio transmission |
AU2002307533B2 (en) * | 2001-05-10 | 2008-01-31 | Dolby Laboratories Licensing Corporation | Improving transient performance of low bit rate audio coding systems by reducing pre-noise |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US7460993B2 (en) * | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
US7328150B2 (en) * | 2002-09-04 | 2008-02-05 | Microsoft Corporation | Innovations in pure lossless audio compression |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
KR100467617B1 (ko) * | 2002-10-30 | 2005-01-24 | 삼성전자주식회사 | 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치 |
US8073689B2 (en) * | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
RU2005135650A (ru) * | 2003-04-17 | 2006-03-20 | Конинклейке Филипс Электроникс Н.В. (Nl) | Синтез аудиосигнала |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US7283968B2 (en) * | 2003-09-29 | 2007-10-16 | Sony Corporation | Method for grouping short windows in audio encoding |
ATE390683T1 (de) * | 2004-03-01 | 2008-04-15 | Dolby Lab Licensing Corp | Mehrkanalige audiocodierung |
US7937271B2 (en) * | 2004-09-17 | 2011-05-03 | Digital Rise Technology Co., Ltd. | Audio decoding using variable-length codebook application ranges |
KR20070068424A (ko) * | 2004-10-26 | 2007-06-29 | 마츠시타 덴끼 산교 가부시키가이샤 | 음성 부호화 장치 및 음성 부호화 방법 |
US7386445B2 (en) * | 2005-01-18 | 2008-06-10 | Nokia Corporation | Compensation of transient effects in transform coding |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
US7565289B2 (en) * | 2005-09-30 | 2009-07-21 | Apple Inc. | Echo avoidance in audio time stretching |
DE102006017280A1 (de) * | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
US20080005920A1 (en) * | 2006-07-05 | 2008-01-10 | Deanda Jacqulyn L Majors | Hair dryer hood adjuster |
US7642424B2 (en) * | 2006-07-10 | 2010-01-05 | Barenbrug Usa, Inc. | Tall fescue endophyte E34 |
US7459962B2 (en) * | 2006-07-26 | 2008-12-02 | The Boeing Company | Transient signal detection algorithm using order statistic filters applied to the power spectral estimate |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US8417532B2 (en) * | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US9495971B2 (en) * | 2007-08-27 | 2016-11-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Transient detector and method for supporting encoding of an audio signal |
US20110035212A1 (en) * | 2007-08-27 | 2011-02-10 | Telefonaktiebolaget L M Ericsson (Publ) | Transform coding of speech and audio signals |
ES2658942T3 (es) * | 2007-08-27 | 2018-03-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable |
US8704209B2 (en) * | 2009-08-18 | 2014-04-22 | The United States Of America As Represented By The Secretary Of The Army | Photodetectors using resonance and method of making |
EP2721610A1 (en) * | 2011-11-25 | 2014-04-23 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
EP2874149B1 (en) * | 2012-06-08 | 2023-08-23 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame error and method and apparatus for audio decoding |
-
2008
- 2008-08-25 US US12/673,862 patent/US9495971B2/en active Active
- 2008-08-25 CN CN2008801048335A patent/CN101790756B/zh active Active
- 2008-08-25 JP JP2010522866A patent/JP5209722B2/ja active Active
- 2008-08-25 CA CA2697920A patent/CA2697920C/en active Active
- 2008-08-25 PL PL08828880T patent/PL2186090T3/pl unknown
- 2008-08-25 ES ES08828880.8T patent/ES2619277T3/es active Active
- 2008-08-25 WO PCT/SE2008/050960 patent/WO2009029033A1/en active Application Filing
- 2008-08-25 EP EP08828880.8A patent/EP2186090B1/en active Active
- 2008-08-25 PT PT88288808T patent/PT2186090T/pt unknown
-
2013
- 2013-02-19 JP JP2013030367A patent/JP2013152470A/ja active Pending
-
2015
- 2015-04-08 JP JP2015079609A patent/JP6117269B2/ja active Active
-
2016
- 2016-10-18 US US15/296,600 patent/US10311883B2/en active Active
-
2019
- 2019-04-17 US US16/386,863 patent/US11830506B2/en active Active
-
2023
- 2023-10-17 US US18/381,142 patent/US20240119951A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001127641A (ja) * | 1999-10-25 | 2001-05-11 | Victor Co Of Japan Ltd | オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体 |
JP2003195881A (ja) * | 2001-12-28 | 2003-07-09 | Victor Co Of Japan Ltd | 周波数変換ブロック長適応変換装置及びプログラム |
JP2006201375A (ja) * | 2005-01-19 | 2006-08-03 | Toshiba Corp | オーディオ符号化方法およびオーディオ符号化装置 |
JP2010501153A (ja) * | 2006-08-18 | 2010-01-14 | デジタル ライズ テクノロジー シーオー.,エルティーディー. | フレーム型データの可変分解能処理 |
Non-Patent Citations (1)
Title |
---|
JPN7013004441; Ye WANG, et al.: 'The Modified Discrete Cosine Transform: Its Implications for Audio Coding and Error Concealment' Proc. AES 22nd International Conference on Virtual, Synthetic and Entertainment Audio Paper 000258, 20020601, pp.1-10, AES * |
Also Published As
Publication number | Publication date |
---|---|
JP5209722B2 (ja) | 2013-06-12 |
CA2697920C (en) | 2018-01-02 |
US10311883B2 (en) | 2019-06-04 |
US11830506B2 (en) | 2023-11-28 |
JP2015163974A (ja) | 2015-09-10 |
US20190244625A1 (en) | 2019-08-08 |
US9495971B2 (en) | 2016-11-15 |
JP6117269B2 (ja) | 2017-04-19 |
EP2186090A4 (en) | 2013-12-25 |
JP2010538315A (ja) | 2010-12-09 |
ES2619277T3 (es) | 2017-06-26 |
CN101790756B (zh) | 2012-09-05 |
PL2186090T3 (pl) | 2017-06-30 |
PT2186090T (pt) | 2017-03-07 |
WO2009029033A1 (en) | 2009-03-05 |
CA2697920A1 (en) | 2009-03-05 |
EP2186090A1 (en) | 2010-05-19 |
US20170040024A1 (en) | 2017-02-09 |
US20240119951A1 (en) | 2024-04-11 |
EP2186090B1 (en) | 2016-12-21 |
CN101790756A (zh) | 2010-07-28 |
US20110046965A1 (en) | 2011-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6117269B2 (ja) | 過渡状態検出器およびオーディオ信号の符号化を支援する方法 | |
US7181404B2 (en) | Method and apparatus for audio compression | |
KR101001170B1 (ko) | 오디오 코딩 | |
US9728196B2 (en) | Method and apparatus to encode and decode an audio/speech signal | |
US8086446B2 (en) | Method and apparatus for non-overlapped transforming of an audio signal, method and apparatus for adaptively encoding audio signal with the transforming, method and apparatus for inverse non-overlapped transforming of an audio signal, and method and apparatus for adaptively decoding audio signal with the inverse transforming | |
EP2122615B1 (en) | Apparatus and method for encoding an information signal | |
KR101562281B1 (ko) | 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법 | |
US11705142B2 (en) | Signal encoding method and device and signal decoding method and device | |
WO2009039645A1 (en) | Method and device for efficient quantization of transform information in an embedded speech and audio codec | |
US8566107B2 (en) | Multi-mode method and an apparatus for processing a signal | |
CN111357050A (zh) | 使用尺度参数的降采样或内插对音频信号进行编码及解码的装置及方法 | |
KR101655913B1 (ko) | 디지털 오디오 신호에서의 프리-에코 감쇠 | |
US20080255860A1 (en) | Audio decoding apparatus and decoding method | |
CN116114016A (zh) | 音频量化器和音频去量化器以及相关方法 | |
KR101449432B1 (ko) | 신호 부호화 및 복호화 방법 및 장치 | |
JP2022532094A (ja) | コーディングされる音声信号内のアタックを検出し、検出されたアタックをコーディングするための方法およびデバイス |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140304 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20141208 |