JP5183741B2 - ノイズ補充と帯域拡張との間の遷移周波数の適合 - Google Patents

ノイズ補充と帯域拡張との間の遷移周波数の適合 Download PDF

Info

Publication number
JP5183741B2
JP5183741B2 JP2010522869A JP2010522869A JP5183741B2 JP 5183741 B2 JP5183741 B2 JP 5183741B2 JP 2010522869 A JP2010522869 A JP 2010522869A JP 2010522869 A JP2010522869 A JP 2010522869A JP 5183741 B2 JP5183741 B2 JP 5183741B2
Authority
JP
Japan
Prior art keywords
frequency
spectral
transition
transition frequency
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010522869A
Other languages
English (en)
Other versions
JP2010538318A (ja
Inventor
グスタフ ウルベルイ,
マヌエル ブリアンド,
アニセ タレブ,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40387561&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP5183741(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2010538318A publication Critical patent/JP2010538318A/ja
Application granted granted Critical
Publication of JP5183741B2 publication Critical patent/JP5183741B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、一般にオーディオ信号の符号化及び復号化を行なう方法及び装置に関し、特に、スペクトル補充における方法及び装置に関するものである。
オーディオ信号が格納及び/又は送信される場合、今日の標準的な方法は、種々の方式に従ってオーディオ信号をデジタル表現に符号化することである。記憶容量及び送信容量の少なくとも一方を節約するために、一般に十分な知覚品質のオーディオ信号の再構成を可能にするのに必要とされるデジタル表現のサイズを減少することが望ましい。符号化信号のサイズと信号品質との間のトレードオフは、実際のアプリケーションに依存する。
オーディオ・コーダに基づく変換は、変換係数の量子化によるオーディオ信号を含む。より低いビットレートを可能にするために、量子化器は、最もエネルギーがあり、知覚的な関連のある係数に利用可能なビットを集中させ、周波数スペクトルにおいて量子化されない係数の”スペクトル・ホール”を除いてそれらのみを送信する。
非特許文献1において説明されるスペクトル帯域複製(SBR)技術は、従来の知覚コーダの帯域制限された信号と、約15kHzの可聴の帯域幅との間のギャップを埋める。SBRの背景となる一般的な考えは、知覚的に正確な方法において復号化信号の損失高周波数の成分を再生成することにある。15kHzより上の周波数は、心理音響的な観点からさほど重要ではないが、再構成してもよい。しかしながら、SBRは単独のコーデックとしては使用することができない。SBRは常に従来の波形コーデック、いわゆるコア・コーデックとともに動作する。従来の波形復号器のように主に後処理を行うSBR復号器が転送されない周波数範囲を再構成する一方で、コア・コーデックは元のスペクトルのより低い部分の送信に関与する。高帯域のスペクトル値は、従来のコーデックのように直接的には送信されない。上記結合システムは、コア・コーデック単独の利得よりも優れた符号化利得をもたらす。
SBR手法は、符号化された知覚的に関連のある低周波数の低帯域と、符号化されない関連のない高周波数の高帯域との間の固定の遷移周波数の定義に依存する。しかしながら、特に、当該遷移周波数は、元の信号のオーディオの成分に依存する。言い換えると、1つの信号から別の信号へ、適切な遷移周波数へ多様に変化することができる。これは、例えば、きれいな音声信号とフル帯域の音楽信号とを比較する場合である。
復号化されたスペクトルの”スペクトル・ホール”は2種類に区別することができる。1つ目は、非特許文献2に記載のように、瞬間的なマスキングの効果に起因した、より低い周波数での小さいホールである。2つ目は、聴覚の絶対閾値と非特許文献2に記載のマスキングの追加とによる飽和状態の結果として、高周波数でのより大きなホールである。SBRは主に2つ目にあたる。
さらに、”スペクトル・ホール”、即ち、高周波数における符号化されない係数、つまり、上記2つ目の”スペクトル・ホール”を補充することを目的とするそのような方法に基づく一般的なオーディオ・コーデックは、全体スペクトルにわたってスペクトル・ホールを補充することができるべきである。実際には、SBRコーデックがフル帯域幅のオーディオ信号を配信できたとしても、再構成された高周波数は、低帯域、即ち、知覚的に関連のある低周波数の符号化、即ち、量子化によって導入されるアノイイング・アーチファクト(the annoying artefacts)がマスクされていないであろう。
3GPP TS 26.404 V6.0.0(2004〜09年)の「Enhanced aacPlus general audio codec - encoder SBR part (Release 6)」2004年 J.D. Johnstonの「Transform coding of audio signals using perceptual noise criteria」IEEE J. Select. Areas Commun.、vol. 6、314〜323ページ、1988年
本発明の一般的な目的は、フル帯域のオーディオ信号にわたってスペクトル・ホールに起因する知覚的なアーチファクト抑制効果を可能にする方法及び装置を提供することである。
上述の目的は、開示される請求の範囲に係る方法及び装置により達成される。一般に、第1の態様において、オーディオ信号のスペクトル復号化におけるスペクトル再生のための方法であって、オーディオ信号を表すスペクトル係数の初期集合を取得するステップと、遷移周波数を決定するステップとを備える。遷移周波数は、オーディオ信号のスペクトル成分に適合される。遷移周波数より下のスペクトル係数の初期集合におけるスペクトル・ホールはノイズ補充され、遷移周波数より上のスペクトル係数の初期集合は帯域幅拡張される。
第2の態様において、オーディオ信号のスペクトル符号化において使用する方法であって、オーディオ信号を表すスペクトル係数の初期集合に対する遷移周波数を決定するステップを備える。遷移周波数は、オーディオ信号のスペクトル成分に適合される。遷移周波数は、スペクトル・ホールのノイズ補充の対象となることを意図する周波数範囲間の境界と、帯域幅拡張の対象となることを意図する周波数範囲を定義する。
第3の態様において、オーディオ信号のスペクトル復号化における復号器であって、オーディオ信号を表すスペクトル係数の初期集合を取得する入力部と、遷移周波数を決定する遷移決定回路とを備える。遷移周波数は、オーディオ信号のスペクトル成分に適合される。復号器は、遷移周波数より下のスペクトル係数の前記初期集合におけるスペクトル・ホールのノイズ補充を行うノイズ補充器と、遷移周波数より上のスペクトル係数の初期集合の帯域幅拡張を行う帯域幅拡張器とを備える。
第4の態様において、オーディオ信号のスペクトル符号化における符号器(20)であって、オーディオ信号を表すスペクトル係数の初期集合に対する遷移周波数を決定する遷移決定回路を備える。遷移周波数は、オーディオ信号のスペクトル成分に適合される。遷移周波数は、オーディオ信号のスペクトル成分に適合される。遷移周波数は、スペクトル・ホールのノイズ補充の対象となることを意図する周波数範囲間の境界と、帯域幅拡張の対象となることを意図する周波数範囲を定義する。
本発明は多くの利点を有する。1つの利点は、遷移周波数の使用がノイズ補充と帯域幅拡張との両方を用いた組み合わされたスペクトル補充の使用を許容するという点である。さらに、遷移周波数は、例えば使用される符号化手法、例えば、周波数分解能に依存するスペクトル補充に応じて適合的に定義される。本方法を用いる任意の音声及びオーディオの少なくとも一方のコーデックは、高品質、即ち、アノイイング・アーチファクトを低減し、フル帯域幅のオーディオ信号を配信することができる。本方法は、任意の種類の周波数表現(DCT、MDCT等)又はフィルタ・バンクを組み合わせることができ、即ち、任意のコーデック(知覚的な手法、パラメトリックな手法等)を組み合わせることができるという意味で柔軟性を有する。
添付の図面と共に以下の説明を参照することにより、本発明は、本発明の更なる目的及び利点と共に最もよく理解されるだろう。
コーデックシステムを示す概略ブロック図である。 本発明に係るオーディオ信号符号器の一実施形態を示す概略ブロック図である。 スペクトル係数、そのグループ及び周波数帯域を概略的に示す図である。 本発明に係るオーディオ信号復号器の一実施形態を示す概略ブロック図である。 遷移周波数を決定する原理の実施形態を示す図である。 本発明に係る方法の実施形態におけるステップを示すフローチャートである。 本発明に係る信号処理方法の実施形態におけるステップを示すフローチャートである。
図中、同一の図中符号は同様の要素又は対応する要素に対して使用される。
オーディオ信号に対する一般的なコーデックシステムの一実施形態を図1に概略的に示す。オーディオ・ソース10は、オーディオ信号15を生成する。オーディオ信号15は符号器20で扱われ、符号器20は、オーディオ信号15を表すデータを含むバイナリ・フラックス25を生成する。バイナリ・フラックス25は、例えばマルチメディア通信の場合のように、送信/格納部(送信及び/又は格納部)30により送信されてもよい。送信/格納部30は、オプションとしてある記憶容量を含んでもよい。バイナリ・フラックス25は、送信/格納部30に格納のみ行なわれてもよく、バイナリ・フラックスの利用時に時間遅延を導入する。送信/格納部30は、バイナリ・フラックス25の再空間位置付け又は時間遅延のうちの少なくとも一方を導入する構成である。バイナリ・フラックス25は、使用される際に復号器40で扱われ、復号器40は、バイナリ・フラックスに含まれるデータからオーディオ出力35を生成する。一般にオーディオ出力35は、可能性として特定の制約下と同様の元のオーディオ信号15に近似すべきである。
多くのリアルタイム・アプリケーションにおいて、一般に元のオーディオ信号15の生成と生成されたオーディオ出力35との間の時間遅延は、ある特定の時間を超えてはならない。同時に送信資源が制限される場合、一般に利用可能なビットレートも低い。可能な限り最適な方法で利用可能なビットレートを利用するために、知覚オーディオ符号化が開発された。したがって、知覚オーディオ符号化は、今日の多くのマルチメディア・サービスに対して重要な部分になっている。基本原理は、オーディオ信号を周波数領域のスペクトル係数に変換し、知覚モデルを使用してスペクトル係数の周波数及び時間依存マスキングを判定することである。
図2は、本発明に係るオーディオ符号器20の一実施形態を示す。この特定の実施形態において、知覚オーディオ符号器20は、知覚変換器又はフィルタバンクに基づくスペクトル符号器である。オーディオ・ソース15は、オーディオ信号x[n]のフレームを含んで受信される。
一般的なスペクトル符号器において、コンバータ21は、オーディオ信号15の時間領域を、周波数領域のスペクトル係数X[n]の集合24へ変換するように構成される。一般的な変換符号器において、変換は、例えば、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、又は、修正離散コサイン変換(MDCT)によって実行されうる。したがって、コンバータ21は、一般的にスペクトル変換器によって構成されてもよい。実際の変換の詳細は、本発明の基本的な考えに対して特に重要ではないため、詳細な説明については省略する。
スペクトル係数、即ち、入力オーディオ信号の周波数表現の集合24は、スペクトル係数が量子化され符号化される量子化/符号化部28へ提供される。一般的には、量子化は、最もエネルギーがあり、知覚的に関連のある係数に利用可能なビットを集中させるために動作する。これは、例えば、異なる種類のマスキング閾値又は帯域幅の縮小を用いて実行されてもよい。当該結果として、一般的には、周波数スペクトルにおける量子化係数の”スペクトル・ホール”となるであろう。言い換えると、係数のいくつかは、知覚的に重要でないため、他の目的としてより必要とされる転送資源を占有しないための目的からかけ離れている。したがって、そのようなスペクトル・ホールは、異なる再構成手法によって、復号器側で修正されるか又は再構成されてもよい。一般的には、2つの種類のスペクトル・ホールが現れる。1つ目の種類は、低周波数領域で主に異なる位置で発生する単一のスペクトル・ホール又は僅かの隣接したスペクトル・ホールを含む。2つ目の種類は、スペクトルの高周波数側での多かれ少なかれ連続したグループのスペクトル・ホールである。
本発明によれば、可能な限り効果的なスペクトル補充を達成するために、異なる方法でそれらの2つの異なる種類のスペクトル・ホールを取り扱うのに有益である。決定する1つのパラメータは、異なる補充アプローチに合う、いわゆる遷移周波数である。異なる種類のオーディオ信号間でスペクトル・ホールの分布が異なるため、遷移周波数の最適な選択も異なる。本発明によれば、遷移周波数は、オーディオ信号の現在のフレームにおけるスペクトルの成分に適合するが、遷移周波数は、オーディオ信号の1つ前のフレームにおけるスペクトルの成分に依存してもよい。厳しい遅延要件がなければ、遷移周波数は、オーディオ信号のさらに他のフレームにおけるスペクトルの成分に依存してもよい。この適合は、一般的に量子化/符号化部28に実装される遷移決定回路60によって符号器側で実行されうる。しかしながら、代替の実施形態において、遷移決定回路60は、分けられた動作部として設けられてもよく、これにより、遷移周波数を表現する唯一のパラメータは符号器20の異なる機能部に提供される。遷移周波数は、符号器側で、例えば、遷移周波数の異なるサイドで周波数間隔に対する適切なエンベロープ符号化を提供するために用いられてもよい。
量子化/符号化部28は、さらに、追加のサイド情報とともに符号化されたスペクトル係数を使用される送信標準又は記憶標準に従ったビット・ストリームへパッキングするように構成される。これにより、スペクトル係数の集合を表現するデータを有するバイナリ・フラックス(binary flux)25は、量子化/符号化部28から出力される。遷移周波数がオーディオ信号のスペクトル成分から直接的に導出されるため、同じ導出が、送信インタフェースの両サイド、即ち、符号器及び復号器の両方で、実行される。これは、必ずしも遷移周波数として必要のない値が追加のサイド情報の中で送信されるべきであることを意味する。しかしながら、もちろん利用可能なビットレートのキャパシティがあれば、それらの値に関しても上記両サイドで実行されてもよい。
特定の実施形態において、MDCT変換器が使用される。心理音響モデルによって実行される重み付け処理の後に、MDCT係数は、ベクトル量子化を用いて量子化される。ベクトル量子化VQにおいて、スペクトル係数は、小さいグループに分割される。上記係数の各グループは単一のベクトルとして見られ、各ベクトルは個別に量子化される。
例えば、ビットレートの厳しい制限のために、量子化器は、最もエネルギーがあり、知覚的に関連のあるグループに利用可能なビットを集中させ、結果として、いくつかのグループにはゼロが設定される。それらのグループは、量子化スペクトルにおいてスペクトル・ホールを形成する。これを図3に示す。本実施形態において、グループ70は、同一のスペクトル係数71、ここでは4つのスペクトル係数71を含む。しかしながら、代替の実施形態において、異なる数のスペクトル係数を含むグループであっても可能である。1つの特定の実施形態において、全てのグループは、それぞれ1つのスペクトル係数のみを含み、即ち、グループは同一のスペクトル係数を有する。量子化グループ72は白抜きの矩形で示され、ゼロに設定されるグループ73は黒の矩形で示される。一般的に、量子化グループ72のみが任意のエンドユーザに送信される。
複数の係数のグループ70は、異なる周波数帯域74へ順に分割される。当該分割は、いくつかの心理音響基準に従って実行されることが望ましい。したがって、本質的に同様の心理音響特性を有するグループは、合わせて処理されてもよい。これにより、各周波数帯域74のメンバの数、即ち、周波数帯域74に関連するグループ70の数は、異なってもよい。多くの周波数部分が同様の特性を有していれば、それらの周波数をカバーする周波数帯域は、広い周波数範囲を有するかもしれない。心理音響特性が周波数上で高速に変更される場合、これは、代わりに、狭い周波数範囲の周波数帯域へ発呼される。スペクトル補充のルーチンは、以下で詳細に説明するように、補充するべき周波数帯域に依存することが望ましい。
復号化の段階において、逆の動作が基本的に行われる。図4において、本発明に係るオーディオ復号器40の一実施形態を示す。上述した符号器に起因する特性を有するバイナリ・フラックス25が受信される。受信したバイナリ・フラックス25、例えば、ビット・ストリームの逆量子化及び復号化がスペクトル係数復号器41において実行される。スペクトル係数復号器41は、バイナリ・フラックスから再生されたスペクトル係数を、周波数グループX [n]においてグループ化可能なスペクトル係数42の初期集合の復号化されたスペクトル係数X[n]へ復号化するように構成される。スペクトル係数42の初期集合は、マスキング閾値又は帯域幅の縮小などの後処理後において、可能な限り、復号器側のコンバータによって提供されるスペクトル係数の集合に近似することが望ましい。
上述したように、復号器でのマスキング閾値又は帯域幅の縮小のアプリケーションは、スペクトル係数42がいわゆる”スペクトル・ホール”を含むという意味で不完全である結果をもたらす。”スペクトル・ホール”はバイナリ・フラックスにおいて受信されないスペクトル係数に対応する。言い換えると、当該スペクトル・ホールは、定義されない若しくは符号化されないスペクトル係数X[n]、又は、スペクトル係数復号器41によって予め定められた値、通常ゼロに自動的に設定されるスペクトル係数である。可聴のアーチファクトを避けるために、それらの係数は復号器で概算値(補充される)によって置き換えられるべきである。
スペクトル・ホールには頻繁に2つのタイプが含まれる。スモール・スペクトル・ホールは通常、低周波数で発生し、1つ又は数個のビッグ・スペクトル・ホールは通常、高周波数で発生する。
復号化されたオーディオ信号内のアーチファクトを最小化するために、復号器は、係数の概算値でスペクトル内のスペクトル・ホールを置き換えることによって、スペクトルを”補充する”。それらの概算値は、復号器によって送信されるサイド情報に基づくか、信号自身に依存するかの少なくとも一方であってもよい。有用なサイド情報の一例は、スペクトルの電力エンベロープや損失係数の調性、即ち、スペクトル平面の測定値であってもよい。
2つの異なる方法が異なる種類のスペクトル・ホールを補充するために使用されうる。低周波数におけるスペクトル・ホールには”ノイズ補充”が良いが、高周波数では”帯域幅拡張”がより適切である。本発明は、それぞれで使用されるべきノイズ補充及び帯域幅拡張の決定方法について説明する。
本発明は、スペクトルの低周波数の関連部分と、高周波数の関連部分との間の遷移周波数の定義に関わる。当該情報に基づいて、高品質の”ノイズ補充”手法による従来の符号化アルゴリズムは、低レートで発生する符号化アーチファクトを低減でき、”帯域幅拡張”に基づくあまり複雑でない手法とともに、低レートであっても全帯域幅のオーディオ信号を再生することができる。
通常、所定量のスペクトル・ホールを含む、スペクトル係数復号器41からのスペクトル係数42の初期集合は、遷移決定回路60へ提供される。遷移決定回路60は、遷移周波数fを決定するように構成される。
スペクトル係数復号器41からのスペクトル係数42の初期集合は、スペクトル補充器43にも提供される。スペクトル補充器43は、再構成されたスペクトル係数X’[n]の完全集合44を生じさせるべく、スペクトル係数42の初期集合をスペクトル補充するように構成される。再構成されたスペクトル係数の完全集合44は、通常、予め定められた周波数範囲内の全てのスペクトル係数を含む。
スペクトル補充器43は、まず、ノイズ補充器50を含む。ノイズ補充器50は、好ましくは低周波数領域、即ち、遷移周波数fより下の周波数において、スペクトル・ホールのノイズ補充を行うための処理を提供するように構成される。これにより、結果として受信された符号化ビット・ストリームに含まれない”損失する”遷移周波数以下の、スペクトル係数の初期集合におけるスペクトル係数へ値が割り当てられる。この目的を達成するために、遷移周波数に関連付けられた情報を提供する、遷移決定回路60からの出力65は、ノイズ補充器50に接続される。
スペクトル補充器43はさらに、再構成されたスペクトル係数の完全集合44を生成するために、遷移周波数より上のスペクトル係数の初期集合を帯域幅拡張するように構成される帯域幅拡張器55を備える。したがって、遷移決定回路60からの出力65は、帯域幅拡張器55にも接続される。
上述したように、スペクトル補充器43からの結果出力は、予め定められた周波数範囲内の全てのスペクトル係数を含む、再構成されたスペクトル係数X’[n]の完全集合44となる。
再構成されたスペクトル係数の完全集合44は、スペクトル補充器43に接続されたコンバータ45に提供される。コンバータ45は、周波数領域のスペクトル係数の完全集合44を時間領域のオーディオ信号46に変換するように構成される。コンバータ45は、本実施形態において、図2の符号器20に使用される変換技術に対応する、知覚変換器に基づく。特定の実施形態において、信号は、例えば、逆MDCT(IMDCT)又は逆DFT(IDFT)等の逆変換により時間領域へ戻される。他の実施形態において、逆フィルタ・バンクが利用されてもよい。符号器側と同様に、コンバータ45などの技術は、既知の技術であり、詳細な説明は省略する。最終の知覚的に再構成されたオーディオ信号34x’[n]は場合により後続の処理ステップへオーディオ信号の出力35により提供される。
当該コーデックは、どの周波数帯域にノイズ補充を使用するかと、どの周波数帯域に帯域幅拡張を使用するかとを決定しなければならない。補充されるべき周波数帯域のグループの多くが量子化され、帯域に一部のスペクトル・ホールが存在する場合にノイズ補充は最良の結果をもたらす。帯域幅拡張は、高周波数における信号の大部分が量子化されない場合に好適である。
1つの基本的な方法として、ノイズ補充と帯域幅拡張との間で固定の遷移周波数が決定されてもよい。当該遷移周波数より下の周波数帯域又はグループにおけるスペクトル・ホールはノイズ補充によって補充され、当該遷移周波数より上のグループ又は周波数帯域におけるスペクトル・ホールは帯域幅拡張によって補充される。
しかしながら、当該アプローチの問題は最適の遷移周波数が全てのオーディオ信号で同一ではないということである。いくつかの信号が低周波数に集中したエネルギーの大部分を有し、信号の大部分が帯域幅拡張の対象となる。他の信号はスペクトル上でより均一に拡散するそれらのエネルギーを有し、それらの信号はノイズ補充のみを使用することから利益を得る。
本発明に係る方法の一実施形態によれば、遷移周波数は、スペクトル係数の初期集合においてスペクトル・ホールの分布に適合的に依存する。適切な遷移周波数を決定するためのルーチンは最大値(BN)から開始して1に至るまで全ての周波数帯域を通じて実行されうる。現在の帯域に量子化される係数がなければ、帯域幅拡張によって補充されるであろう。現在の帯域に量子化される係数があれば、それ以下の帯域と同様に当該帯域のホールはノイズ補充を用いて補充される。このように、遷移周波数は、量子化される係数を含む高周波数側から参照した第1周波数帯域の上限値に設定される。これを図5Aに示す。したがって、帯域N、即ち、遷移周波数fより上の周波数のスペクトル・ホール77は、帯域幅拡張手法により補充される。遷移周波数fより下の周波数のスペクトル・ホール76は代わりにノイズ補充によって補充される。
代替の実施形態を図5Bに示す。ここでは、遷移周波数の定義は周波数帯域分割を無視して、直接的にグループ70に基づく。ここで、帯域幅拡張は、最も高い周波数から第1の量子化グループ78の直前のグループに至るまでの全てのグループに用いられる。遷移周波数fより下のスペクトル・ホール76には代わりにノイズ補充によって補充される。
これらの方法は、オーディオ信号及び量子化器、即ち、符号化手法により適合的であるが、例えば、図5Cのように信号が量子化される場合に小さな問題がある。ここで、信号の高周波数における大部分はゼロに設定され、帯域幅拡張が帯域B9から帯域B12までに好適に使用されるべきである。しかしながら、周波数帯域B11において、信号符号化された量子化グループが存在するため、量子化グループ79より下では完全に無効であり、当該量子化グループ79までの全てのグループでノイズ補充が使用されるであろう。
この問題を避けるために、遷移周波数fが周波数帯域におけるスペクトル・ホールの割合に依存して選択される他の実施形態も提案される。前の実施形態と同様に、コーデックは、最大値から開始して1に至るまで、複数の周波数帯域を通じて行われる。周波数帯域ごとに、符号化されたスペクトル係数又はグループの数がカウントされる。スペクトル係数又はグループの総数によって分割された符号化されたスペクトル係数又はグループの数、即ち、周波数帯域の符号化されたスペクトル係数の割合が所定の閾値を超える場合、当該周波数帯域及びそれに続く周波数帯域のスペクトル・ホールはノイズ補充で補充される。それ以外には帯域幅拡張が使用される。同様に、周波数帯域におけるスペクトル・ホールの割合を監視してもよい。言い換えると、スペクトル・ホールの割合が第1の閾値よりも低い最も高い周波数帯域である遷移周波数帯域が決定されるべきである。遷移周波数帯域を選択する代替の基準もある。1つの可能性として周波数に依存してそれ自身の閾値を導出することも考えられる。そのような方法において、スペクトル・ホールの所定の割合が、低周波数部分ではないが、いまだに帯域幅拡張技術を使用する高周波数部分において受け入れられてもよい。当業者には、適切な基準の選択が種々の方法、例えば、他の信号関連特性又は他のサイド情報に依存する方法に変更できることが理解されるであろう。
一実施形態において、遷移周波数は、遷移周波数帯域の上限周波数に依存して設定され、より好ましくは当該上限周波数に等しくなる。しかしながら、種々の代替案がある。1つの代替案は、最も高い周波数の符号化されたスペクトル係数又はグループに対して検索し、当該グループの高周波数側で遷移周波数を設定することである。
上述の実施形態のアルゴリズムを以下の擬似コードを用いて説明する。
For currentBand=N to 1
ratio=numCodedCoeffInBand(currentBand)/numCoeffInBand(currentBand)
If ratio>threshould
Transition is between currentBand and currentBand+1
Return
End if
Next
Transition is at the start of band 1
遷移周波数が連続したフレーム間でほとんど変化しないことが望ましい。大きすぎる変化は、雑音として知覚されうる。したがって、一実施例において、遷移周波数は、さらに、使用する遷移周波数の前の遷移周波数に依存する。例えば、予め定められた絶対値、又は2つの連続するフレーム間での相対量以上に変化する遷移周波数を禁止する可能性があるであろう。代替的に、仮の遷移周波数が前回の遷移周波数とともに、それほど大きな変化のない値を有する修正遷移周波数を与える値としてフィルタに入力される。その結果、遷移周波数は、さらに1つ前の遷移周波数に依存するであろう。
これらのルーチンは、通常、遷移決定回路60において実行され、より好ましくは符号器の量子化/符号化部や復号器のそれぞれにおいて実行される。
図6は、本発明に係る方法の一実施形態のステップを示すフローチャートである。オーディオ信号のスペクトル復号化におけるスペクトル再生における方法はステップ200において開始される。ステップ210において、オーディオ信号を表すスペクトル係数の初期集合が取得される。ステップ212において、遷移周波数が決定される。遷移周波数は、オーディオ信号のスペクトル成分に適合される。ステップ214において、遷移周波数より下のスペクトル係数の初期集合におけるスペクトル・ホールのノイズ補充が実行される。ステップ216において、遷移周波数より上のスペクトル係数の初期集合における帯域幅拡張が実行される。ステップ249において処理を終了する。
同様に、図7は、本発明に係る方法の一実施形態のステップを示すフローチャートである。オーディオ信号のスペクトル符号化において使用する方法がステップ200において開始される。ステップ212において、遷移周波数が決定される。オーディオ信号を表すスペクトル係数の初期集合に対する遷移周波数がオーディオ信号のスペクトル成分に適合される。遷移周波数はスペクトル・ホールのノイズ補充の対象となることを意図する周波数範囲間の境界と、帯域幅拡張の対象となることを意図する周波数範囲を定義する。
本発明は使用される符号化手法に係る遷移周波数の適応した定義によって多くの利益を得ることができる。適合した遷移周波数はノイズ補充及び帯域幅拡張の両方を使用する組み合わされたスペクトル補充の効果的な使用を許容する。本方法を用いる、任意の音声及びオーディオの少なくとも一方のコーデックは、高品質で、アノイイング・アーチファクトを低減したフル帯域幅のオーディオ信号を配信することができる。本方法は、任意の種類の周波数表現(DCT、MDCT等)又はフィルタ・バンクを組み合わせることができ、即ち、任意のコーデック(知覚的な手法、パラメトリックな手法等)を組み合わせることができるという意味で柔軟性を有する。
上述の実施形態については、本発明のいくつかの図示する例として理解される。本発明の範囲を逸脱せずに、種々の変形、組合せ及び変更が実施形態に対して行なわれてもよいことが当業者には理解されるだろう。特に、種々の実施形態における種々の部分解決策は、技術的に可能であれば他の構成で組み合わされてもよい。しかし、本発明の範囲は添付の請求の範囲により規定される。

Claims (17)

  1. オーディオ信号のスペクトル復号化におけるスペクトル再生のための方法であって、
    前記オーディオ信号を表すスペクトル係数の初期集合(42)を取得するステップ(210)と、
    遷移周波数(f)を決定するステップ(212)と、
    前記遷移周波数(f)より下のスペクトル係数の前記初期集合(42)におけるスペクトル・ホールのノイズ補充を行うステップ(214)と、
    前記遷移周波数(f)より上のスペクトル係数の前記初期集合(42)の帯域幅拡張を行うステップ(216)と
    を含み、
    前記遷移周波数(f)は、前記オーディオ信号のスペクトル内容に適合され、スペクトル係数の前記初期集合(42)におけるスペクトル・ホールの分布に適合的に依存することを特徴とする方法。
  2. 前記遷移周波数(f)を決定する前記ステップは、順に、
    前記スペクトル係数の前記初期集合(42)を複数の周波数帯域(74)に分割するステップと、
    前記周波数帯域(74)におけるスペクトル・ホールの割合に依存して前記遷移周波数(f)を選択するステップと
    を含むことを特徴とする請求項に記載の方法。
  3. 前記周波数帯域(74)は一定の周波数幅を有することを特徴とする請求項に記載の方法。
  4. 少なくとも2つの前記周波数帯域(74)は異なる周波数幅を有することを特徴とする請求項に記載の方法。
  5. 前記遷移周波数(f)を選択する前記ステップは、
    前記割合が第1の閾値よりも低く、最も高い周波数帯域となる遷移周波数帯域を決定するステップを含むことを特徴とする請求項2乃至4の何れか1項に記載の方法。
  6. 前記遷移周波数(f)を選択する前記ステップは、さらに、
    前記遷移周波数帯域の上限周波数に依存して前記遷移周波数(f)を設定するステップを含むことを特徴とする請求項に記載の方法。
  7. 前記遷移周波数(f)を設定する前記ステップは、さらに、前回使用された遷移周波数に依存することを特徴とする請求項5又は6に記載の方法。
  8. 前記遷移周波数(f)を設定する前記ステップは、さらに、前記前回使用された遷移周波数のさらに1つ前に使用された遷移周波数に依存することを特徴とする請求項に記載の方法。
  9. 前記遷移周波数(f)は、予め定められた絶対値、又は、2つの連続するフレーム間の相対量より大きい変化が禁止されることを特徴とする請求項7又は8に記載の方法。
  10. オーディオ信号のスペクトル符号化において使用する方法であって、
    前記オーディオ信号を表すスペクトル係数の初期集合(24)に対する遷移周波数(f)を決定するステップ(212)を含み、
    前記遷移周波数(f)は、スペクトル・ホールのノイズ補充の対象となることを意図する周波数範囲と、帯域幅拡張の対象となることを意図する周波数範囲との間の境界を定義し、前記オーディオ信号のスペクトル成分に適合され、スペクトル係数の前記初期集合(24)におけるスペクトル・ホールの分布に適合的に依存することを特徴とする方法。
  11. オーディオ信号のスペクトル復号化における復号器(40)であって、
    前記オーディオ信号を表すスペクトル係数の初期集合(42)を取得する入力部と、
    遷移周波数(f)を決定する遷移決定回路(60)と、
    前記遷移周波数(f)より下のスペクトル係数の前記初期集合(42)におけるスペクトル・ホールのノイズ補充を行うノイズ補充器(50)と、
    前記遷移周波数(f)より上のスペクトル係数の前記初期集合(42)の帯域幅拡張を行う帯域幅拡張器(55)と
    を備え、
    前記遷移周波数(f)は、前記オーディオ信号のスペクトル内容に適合され
    前記遷移決定回路(60)は、スペクトル係数の前記初期集合(42)におけるスペクトル・ホールの分布に依存して前記遷移周波数(f )を適合的に決定することを特徴とする復号器。
  12. 前記遷移決定回路(60)は、さらに、
    スペクトル係数の前記初期集合(42)の前記スペクトル係数を複数の周波数帯域(74)に分割し、
    前記周波数帯域(74)におけるスペクトル・ホールの割合に依存して前記遷移周波数(f)を選択するように構成されることを特徴とする請求項11に記載の復号器。
  13. 前記周波数帯域(74)は一定の周波数幅を有することを特徴とする請求項12に記載の復号器。
  14. 少なくとも2つの前記周波数帯域(74)は異なる周波数幅を有することを特徴とする請求項12に記載の復号器。
  15. 前記遷移決定回路(60)は、さらに、
    前記割合が第1の閾値よりも低く、最も高い周波数帯域となる遷移周波数帯域を決定するように構成されることを特徴とする請求項12乃至14の何れか1項に記載の復号器。
  16. 前記遷移決定回路(60)は、さらに、
    前記遷移周波数帯域の上限周波数に依存して前記遷移周波数(f)を設定するように構成されることを特徴とする請求項15に記載の復号器。
  17. オーディオ信号のスペクトル符号化における符号器(20)であって、
    前記オーディオ信号を表すスペクトル係数の初期集合(24)に対する遷移周波数(f)を決定する遷移決定回路(60)を備え、
    前記遷移周波数(f)は、スペクトル・ホールのノイズ補充の対象となることを意図する周波数範囲と、帯域幅拡張の対象となることを意図する周波数範囲との間の境界を定義し、前記オーディオ信号のスペクトル成分に適合され、
    前記遷移決定回路(60)は、スペクトル係数の前記初期集合(24)におけるスペクトル・ホールの分布に依存して前記遷移周波数(f)を適合的に決定することを特徴とする符号器。
JP2010522869A 2007-08-27 2008-08-26 ノイズ補充と帯域拡張との間の遷移周波数の適合 Active JP5183741B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US96813407P 2007-08-27 2007-08-27
US60/968,134 2007-08-27
PCT/SE2008/050969 WO2009029037A1 (en) 2007-08-27 2008-08-26 Adaptive transition frequency between noise fill and bandwidth extension

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013004910A Division JP5458189B2 (ja) 2007-08-27 2013-01-15 ノイズ補充と帯域拡張との間の遷移周波数の適合

Publications (2)

Publication Number Publication Date
JP2010538318A JP2010538318A (ja) 2010-12-09
JP5183741B2 true JP5183741B2 (ja) 2013-04-17

Family

ID=40387561

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010522869A Active JP5183741B2 (ja) 2007-08-27 2008-08-26 ノイズ補充と帯域拡張との間の遷移周波数の適合
JP2013004910A Active JP5458189B2 (ja) 2007-08-27 2013-01-15 ノイズ補充と帯域拡張との間の遷移周波数の適合

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013004910A Active JP5458189B2 (ja) 2007-08-27 2013-01-15 ノイズ補充と帯域拡張との間の遷移周波数の適合

Country Status (12)

Country Link
US (5) US9269372B2 (ja)
EP (2) EP2186086B1 (ja)
JP (2) JP5183741B2 (ja)
CN (1) CN101939782B (ja)
BR (1) BRPI0815972B1 (ja)
DK (1) DK2571024T3 (ja)
ES (2) ES2403410T3 (ja)
HK (1) HK1143239A1 (ja)
MX (1) MX2010001394A (ja)
PL (1) PL2186086T3 (ja)
PT (1) PT2571024E (ja)
WO (1) WO2009029037A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013117730A (ja) * 2007-08-27 2013-06-13 Telefon Ab L M Ericsson ノイズ補充と帯域拡張との間の遷移周波数の適合

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2186089B1 (en) * 2007-08-27 2018-10-03 Telefonaktiebolaget LM Ericsson (publ) Method and device for perceptual spectral decoding of an audio signal including filling of spectral holes
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
ES2642906T3 (es) * 2008-07-11 2017-11-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
JPWO2011121955A1 (ja) * 2010-03-30 2013-07-04 パナソニック株式会社 オーディオ装置
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
EP2614586B1 (en) * 2010-09-10 2016-11-09 DTS, Inc. Dynamic compensation of audio signals for improved perceived spectral imbalances
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2631905A4 (en) * 2010-10-18 2014-04-30 Panasonic Corp DEVICE FOR TONE CODING AND TONE DECODING
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
US8731949B2 (en) 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
CN106157968B (zh) * 2011-06-30 2019-11-29 三星电子株式会社 用于产生带宽扩展信号的设备和方法
JP5416173B2 (ja) * 2011-07-07 2014-02-12 中興通訊股▲ふん▼有限公司 周波数帯コピー方法、装置及びオーディオ復号化方法、システム
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
CN110706715B (zh) 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9881616B2 (en) * 2012-06-06 2018-01-30 Qualcomm Incorporated Method and systems having improved speech recognition
WO2014042439A1 (ko) * 2012-09-13 2014-03-20 엘지전자 주식회사 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
KR101877906B1 (ko) * 2013-01-29 2018-07-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 노이즈 채움 개념
KR102243688B1 (ko) 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
US9570083B2 (en) 2013-04-05 2017-02-14 Dolby International Ab Stereo audio encoder and decoder
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
EP3063761B1 (en) * 2013-10-31 2017-11-22 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
MX2018010753A (es) * 2016-03-07 2019-01-14 Fraunhofer Ges Forschung Método de ocultamiento híbrido: combinación de ocultamiento de pérdida paquete de dominio de frecuencia y tiempo en códecs de audio.
EP3443557B1 (en) 2016-04-12 2020-05-20 Fraunhofer Gesellschaft zur Förderung der Angewand Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band
CN110493890B (zh) 2017-03-18 2020-11-10 华为技术有限公司 一种连接恢复方法、接入和移动性管理功能实体、通信装置及系统
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5583961A (en) * 1993-03-25 1996-12-10 British Telecommunications Public Limited Company Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
US5664057A (en) * 1993-07-07 1997-09-02 Picturetel Corporation Fixed bit rate speech encoder/decoder
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
KR100871999B1 (ko) * 2001-05-08 2008-12-05 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US6493668B1 (en) * 2001-06-15 2002-12-10 Yigal Brandman Speech feature extraction system
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
DE60214027T2 (de) * 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
GB2388502A (en) * 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
JP2004134900A (ja) * 2002-10-09 2004-04-30 Matsushita Electric Ind Co Ltd 符号化信号復号化装置および復号化方法
FR2852172A1 (fr) 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7548852B2 (en) * 2003-06-30 2009-06-16 Koninklijke Philips Electronics N.V. Quality of decoded audio by adding noise
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
JP2006087018A (ja) * 2004-09-17 2006-03-30 Matsushita Electric Ind Co Ltd 音響処理装置
JP2008513845A (ja) * 2004-09-23 2008-05-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声データを処理するシステム及び方法、プログラム要素並びにコンピュータ読み取り可能媒体
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
DE602006002381D1 (de) * 2006-04-24 2008-10-02 Nero Ag Erweiterte vorrichtung zur kodierung digitaler audiodaten
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US9495971B2 (en) * 2007-08-27 2016-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
ES2658942T3 (es) * 2007-08-27 2018-03-13 Telefonaktiebolaget Lm Ericsson (Publ) Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
EP2186089B1 (en) * 2007-08-27 2018-10-03 Telefonaktiebolaget LM Ericsson (publ) Method and device for perceptual spectral decoding of an audio signal including filling of spectral holes
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013117730A (ja) * 2007-08-27 2013-06-13 Telefon Ab L M Ericsson ノイズ補充と帯域拡張との間の遷移周波数の適合

Also Published As

Publication number Publication date
MX2010001394A (es) 2010-03-10
US20210110836A1 (en) 2021-04-15
US20110264454A1 (en) 2011-10-27
ES2526333T3 (es) 2015-01-09
BRPI0815972A2 (pt) 2015-09-29
EP2571024A1 (en) 2013-03-20
ES2403410T3 (es) 2013-05-17
US20190122680A1 (en) 2019-04-25
US11990147B2 (en) 2024-05-21
CN101939782B (zh) 2012-12-05
EP2571024B1 (en) 2014-10-22
PL2186086T3 (pl) 2013-07-31
JP5458189B2 (ja) 2014-04-02
WO2009029037A1 (en) 2009-03-05
DK2571024T3 (en) 2015-01-05
US10878829B2 (en) 2020-12-29
EP2186086A4 (en) 2012-01-25
JP2013117730A (ja) 2013-06-13
BRPI0815972A8 (pt) 2017-11-14
PT2571024E (pt) 2014-12-23
US20170301358A1 (en) 2017-10-19
US9711154B2 (en) 2017-07-18
US9269372B2 (en) 2016-02-23
EP2186086B1 (en) 2013-01-23
JP2010538318A (ja) 2010-12-09
US20160086614A1 (en) 2016-03-24
BRPI0815972B1 (pt) 2020-02-04
US10199049B2 (en) 2019-02-05
HK1143239A1 (en) 2010-12-24
EP2186086A1 (en) 2010-05-19
CN101939782A (zh) 2011-01-05

Similar Documents

Publication Publication Date Title
JP5458189B2 (ja) ノイズ補充と帯域拡張との間の遷移周波数の適合
JP5255638B2 (ja) ノイズ補充の方法及び装置
JP6407928B2 (ja) オーディオ処理システム
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
US8639519B2 (en) Method and apparatus for selective signal coding based on core encoder performance
US20060031075A1 (en) Method and apparatus to recover a high frequency component of audio data
CN101836252A (zh) 用于在音频代码化系统中生成增强层的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110815

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130115

R150 Certificate of patent or registration of utility model

Ref document number: 5183741

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250