JP2017514163A - 高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置 - Google Patents

高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置 Download PDF

Info

Publication number
JP2017514163A
JP2017514163A JP2016558776A JP2016558776A JP2017514163A JP 2017514163 A JP2017514163 A JP 2017514163A JP 2016558776 A JP2016558776 A JP 2016558776A JP 2016558776 A JP2016558776 A JP 2016558776A JP 2017514163 A JP2017514163 A JP 2017514163A
Authority
JP
Japan
Prior art keywords
band
envelope
subband
bit allocation
allocation information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016558776A
Other languages
English (en)
Other versions
JP6616316B2 (ja
Inventor
チュー,キ−ヒョン
オ,ウン−ミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017514163A publication Critical patent/JP2017514163A/ja
Application granted granted Critical
Publication of JP6616316B2 publication Critical patent/JP6616316B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

帯域幅拡張のための高帯域符号化/復号方法及びその装置に係り、該高帯域符号化方法は、全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成する段階、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定する段階、及び決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを生成する段階を含む。該高帯域復号方法は、全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成する段階、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定する段階、及び決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを復号してエンベロープをアップデートする段階を含む。

Description

本発明は、オーディオ符号化及びオーディオ復号に係り、さらに詳細には、帯域幅拡張のための高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置に関する。
G.719のコーディングスキームは、テレカンファレンシングの目的で開発及び標準化されたものであり、MDCT(modified discrete cosine transform)を行って周波数ドメイン変換を行い、ステーショナリ(stationary)フレームである場合には、MDCTスペクトルを即座にコーディングする。ノンステーショナリ(non-stationary)フレームは、時間ドメインアライアシング順序(time domain aliasing order)を変更することにより、時間的な特性を考慮するように変更する。ノンステーショナリフレームに対して得られたスペクトルは、ステーショナリフレームと同一フレームワークでコーデックを構成するために、インターリービングを行い、ステーショナリフレームと類似した形態によって構成される。かように構成されたスペクトルのエネルギーを求め、正規化を行った後で量子化を行う。一般的に、エネルギーは、RMS値で表現され、正規化されたスペクトルは、エネルギー基盤のビット割り当てを介して、バンド別に必要なビットを生成し、バンド別ビット割り当て情報を基に、量子化及び無損失符号化を介してビットストリームを生成する。
G.719のデコーディングスキームによれば、コーディング方式の逆過程において、ビットストリームでエネルギーを逆量子化し、逆量子化されたエネルギーを基に、ビット割り当て情報を生成し、スペクトルの逆量子化を行い、正規化された逆量子化されたスペクトルを生成する。このとき、ビットが不足した場合、特定バンドには、逆量子化したスペクトルがないことがある。かような特定バンドに対して、ノイズを生成するために、低周波数の逆量子化されたスペクトルを基に、ノイズコードブックを生成し、伝送されたノイズレベルに合わせてノイズを生成するノイズフィリング方式が適用される。
一方、特定周波数以上のバンドについては、低帯域信号をホールディングして高帯域信号を生成する帯域幅拡張技法が適用される。
本発明が解決しようとする課題は、復元音質を向上させることができる帯域幅拡張のための高帯域符号化方法及びその装置、高帯域復号方法及びその装置、並びにそれを採用するマルチメディア機器を提供するところにある。
前記課題を解決するための一実施形態による高帯域符号化方法は、全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成する段階と、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定する段階と、前記決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを生成する段階と、を含んでもよい。
前記課題を解決するための一実施形態による高帯域符号化装置は、全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成し、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定し、前記決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを生成する少なくとも1つのプロセッサを含んでもよい。
前記課題を解決するための一実施形態による高帯域復号方法は、全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成する段階と、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定する段階と、前記決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを復号してエンベロープをアップデートする段階と、を含んでもよい。
前記課題を解決するための一実施形態による高帯域復号装置は、全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成し、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定し、前記決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを復号してエンベロープをアップデートする少なくとも1つのプロセッサを含んでもよい。
本発明による高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置によれば、高帯域で重要なスペクトル情報を含んでいる少なくとも1つのサブバンドは、Normに対応する情報を表現することにより、復元音質を向上させることができる。
一実施形態によって、低帯域及び高帯域のサブバンド構成の例について説明する図面である。 一実施形態によって、R0帯域及びR1帯域を選択されたコーディング方式に対応し、R2及びR3、R4及びR5に区分した図面である。 一実施形態によって、R0帯域及びR1帯域を選択されたコーディング方式に対応し、R2及びR3、R4及びR5に区分した図面である。 一実施形態によって、R0帯域及びR1帯域を選択されたコーディング方式に対応し、R2及びR3、R4及びR5に区分した図面である。 一実施形態による高帯域のサブバンド構成の例について説明する図面である。 一実施形態による高帯域符号化方法の概念について説明する図面である。 一実施形態によるオーディオ符号化装置の構成を示したブロック図である。 一実施形態によるBWEパラメータ生成部の構成を示したブロック図である。 一実施形態による高周波符号化装置の構成を示したブロック図である。 図7に図示されたエンベロープリファインメント部の構成を示したブロック図である。 図5に図示された低周波符号化装置の構成を示したブロック図である。 一実施形態によるオーディオ復号装置の構成を示したブロック図である。 一実施形態による高周波復号部の一部構成を示したブロック図である。 図11に図示されたエンベロープリファインメント部の構成を示したブロック図である。 図10に図示された低周波復号装置の構成を示したブロック図である。 図10に図示された結合部の構成を示したブロック図である。 一実施形態による符号化モジュールを含むマルチメディア機器の構成を示したブロック図である。 一実施形態による復号モジュールを含むマルチメディア機器の構成を示したブロック図である。 一実施形態による符号化モジュール及び復号モジュールを含むマルチメディア機器の構成を示したブロック図である。 一実施形態によるオーディオ符号化方法の動作について説明するためのフローチャートである。 一実施形態によるオーディオ復号方法の動作について説明するためのフローチャートである。
本発明は、多様な変換を加えることができ、さまざまな実施形態を有することができるが、特定実施形態を図面に例示し、詳細な説明によって具体的に説明する。しかし、それらは、本発明を、特定の実施形態について限定するものではなく、本発明の技術的思想及び技術範囲に含まれる全ての変換、均等物ないし代替物を含むものであると理解される。本発明についての説明において、関連公知技術についての具体的な説明が、本発明の要旨を不明確にすると判断される場合、その詳細な説明を省略する。
第1、第2のような用語は、多様な構成要素についての説明に使用されるが、構成要素は、用語によって限定されるものではない。該用語は、1つの構成要素を他の構成要素から区別する目的のみに使用される。
本発明で使用した用語は、ただ特定の実施形態についての説明に使用されたものであり、本発明を限定する意図ではない。本発明で使用した用語は、本発明での機能を考慮しながら、可能な限り、現在広く使用される一般的な用語を選択したが、それは、当該分野の当業者の意図、判例、または新たな技術の出現などによって異なる。また、特定の場合は、出願人が任意に選定した用語もあり、その場合、当該発明の説明部分で詳細にその意味を記載する。従って、本発明で使用される用語は、単純な用語の名称ではない、その用語が有する意味と、本発明の全般にわたった内容とを基に定義されなければならない。
単数の表現は、文脈上明白に異なって意味しない限り、複数の表現を含む。本発明において、「含む」または「有する」というような用語は、明細書上に記載された特徴、数字、段階、動作、構成要素、部品、またはそれらの組み合わせが存在するということを指定するものであり、1またはそれ以上の他の特徴、数字、段階、動作、構成要素、部品、またはそれらの組み合わせの存在可能性または付加可能性をあらかじめ排除するものではないと理解されなければならない。
以下、本発明の実施形態について、添付図面を参照し、詳細に説明するが、添付図面を参照しての説明において、同一であるか対応する構成要素は、同一図面番号を付し、それに係わる重複説明は省略する。
図1は、一実施形態によって、低帯域及び高帯域のサブバンド構成の例について説明する図面である。一実施形態によれば、サンプリングレートは、32kHzであり、640個のMDCT(modified discrete cosine transform)スペクトル係数を、22個のバンドによって構成し、具体的には、低帯域について、17個のバンド、高帯域について、5個のバンドから構成される。例えば、高帯域の開始周波数は、241番目のスペクトル係数であり、0〜240までのスペクトル係数は、低周波コーディング方式、すなわち、コアコーディング(core coding)方式によってコーディングされる領域であり、R0と定義することができる。また、241〜639までのスペクトル係数は、帯域幅拡張(BWE)が行われる高帯域であり、R1と定義することができる。一方、R1領域には、ビット割り当て情報により、低周波数コーディング方式によってコーディングされるバンドも存在する。
図2Aないし図2Cは、図1のR0領域及びR1領域を、選択されたコーディング方式によって、R2、R3、R4、R5に区分した図面である。まず、BWE領域であるR1領域は、R2及びR3に区分され、低周波数コーディング領域であるR0領域は、R4及びR5に区分される。R2は、低周波数コーディング方式、例えば、周波数ドメインコーディング方式で、量子化及び無損失符号化される信号を含んでいるバンドを示し、R3は、低周波数コーディング方式によってコーディングされる信号がないバンドを示す。一方、R2がビットが割り当てられ、低周波数コーディング方式によってコーディングされると決定されても、ビットが不足する場合、R3と同一方式によってバンドが生成される。R5は、ビットが割り当てられ、低周波数コーディング方式によってコーディングが行われるバンドを示し、R4は、ビット余裕分がなく、低帯域信号であるにもかかわらず、コーディングになされなかったり、ビットが少なく割り当てられたりし、ノイズを付加しなければならないバンドを示す。従って、R4及びR5の区分は、ノイズ付加いかんによって判断され、それは、低周波数コーディングされたバンド内スペクトル個数の比率によって決定され、またはFPCを使用した場合には、バンド内パルス割り当て情報に基づいて決定することができる。R4及びR5のバンドは、復号過程においてノイズを付加するときに区分されるために、符号化過程においては、明確に区分されない。R2〜R5のバンドは、符号化される情報が互いに異なるだけではなく、デコーディング方式が異なるように適用される。
図2Aに図示された例の場合、低周波数コーディング領域R0において、170〜240までの2個バンドがノイズを付加するR4であり、BWE領域R1において、241〜350までの2個バンド、及び427〜639までの2個バンドが低周波数コーディング方式によってコーディングされるR2である。図2Bに図示された例の場合、低周波数コーディング領域R0において、202〜240までの1個バンドがノイズを付加するR4であり、BWE領域R1において、241〜639までの5個バンドいずれも低周波数コーディング方式によってコーディングされるR2である。図2Cに図示された例の場合、低周波数コーディング領域R0において、144〜240までの3個バンドがノイズを付加するR4であり、BWE領域R1において、R2は存在しない。低周波数コーディング領域R0において、R4は、一般的に高周波数部分に分布されるが、BWE領域R1において、R2は、特定周波数部分に制限されるものではない。
図3は、一実施形態による広帯域(WB)の高帯域サブバンド構成の例について説明する図面である。ここで、32KHzサンプリングレートは、32kHzであり、640個のMDCTスペクトル係数を、中高帯域に対して14個のバンドによって構成される。100Hzには、4個のスペクトル係数が含まれ、従って、400Hzである最初のバンドには、16個のスペクトル係数が含まれてもよい。参照符号310は、6.4〜14.4KHzの高帯域、参照符号330は、8.0〜16.0KHzの高帯域に係わるサブバンド構成をそれぞれ示す。
一実施形態によれば、全帯域(full band)のスペクトル符号化において、低帯域及び高帯域のスケールファクタを互いに異なるように表現することができる。ここで、該スケールファクタは、エネルギー、エンベロープ、平均電力あるいはNormによって表現される。例えば、全帯域において、低帯域は、精密に表現するために、Normあるいはエンベロープを求め、スカラー量子化及び無損失符号化を行い、高帯域は、効率的に表現するために、Normあるいはエンベロープを求め、ベクトル量子化を行うことができる。そのとき、高帯域中、重要なスペクトル情報を含んでいるサブバンドについては、低周波数コーディング方式を利用して、Normに対応する情報を表現することができる。かように、高帯域において、低周波数コーディング方式に基づいて、符号化を行うサブバンドに対して、追加して高周波Normを補償するためのリファインメントデータ(refinement data)をビットストリームに含めて伝送することができる。その結果、高帯域の意味あるスペクトル成分が正確に表現されるために、復元音質向上に寄与することができる。
図4は、一実施形態による、全帯域のスケールファクタを表現する方法を示した図面である。図4を参照すれば、低帯域410は、Normで表現し、高帯域430は、エンベロープ(envelope)、及び必要な場合、追加してNormとのデルタ(delta)で表現することができる。低帯域410のNormは、スカラー量子化され、高帯域430のエンベロープは、ベクトル量子化される。高帯域において、Normとのデルタによって表現される場合は、重要なスペクトル成分を含んでいると判断されるサブバンド450が該当する。そのとき、低帯域は、全帯域のバンド分割情報Bfbに基づいて、サブバンドが構成され、高帯域は、高帯域のバンド分割情報Bbに基づいて、サブバンドが構成される。全帯域のバンド分割情報Bfbと、高帯域のバンド分割情報Bhbは、同じであってもよく、異なっていてもよい。全帯域のバンド分割情報Bfbと高帯域のバンド分割情報Bhbとが異なる場合、マッピング過程を介して、高帯域のNormを表現することができる。
下記表1は、全帯域のバンド分割情報Bfbによって、低帯域のサブバンドが構成される例を示す。全帯域のバンド分割情報Bfbはビットレートにかかわらず同一である。ここで、pは、サブバンドインデックス、Lは、サブバンド内スペクトル数、sは、サブバンドの開始周波数インデックス、eは、サブバンドの終了周波数インデックスをそれぞれ示す。
Figure 2017514163
表1のように構成された各サブバンドに対して、Normあるいはスペクトルエネルギーを算出することができる。そのとき、例えば、下記数式(1)を利用することができる。
Figure 2017514163
ここで、y(k)は、時間・周波数変換を介して得られるスペクトル係数であり、例えば、MDCTスペクトル係数でもある。
一方、エンベロープも、Normと同一方式に基づいて求められ、バンド構成に合わせ、各サブバンド別に求められたNormを、エンベロープと定義することができる。Normとエンベロープは、同じ概念で使用される。
求められた低帯域のNormあるいは低周波数Normは、スカラー量子化された後で無損失符号化される。Normのスカラー量子化は、例えば、下記表2のテーブルを利用して行われる。
Figure 2017514163
一方、求められた高帯域のエンベロープは、ベクトル量子化される。量子化されたエンベロープは、E(p)と定義される。
下記の表3及び表4は、それぞれビットレート24.4kbpsと32kbpsとの場合での高帯域のバンド構成を示す。
Figure 2017514163
図5は、一実施形態によるオーディオ符号化装置の構成を示したブロック図である。図5に図示されたオーディオ符号化装置は、BWEパラメータ生成部510、低周波符号化部530、高周波符号化部550及び多重化部570を含んでもよい。各構成要素は、少なくとも1つのモジュールに一体化され、少なくとも1つのプロセッサ(図示せず)によって具現される。ここで、入力信号は、音楽あるいは音声、あるいは音楽と音声との混合信号を意味し、大きく見て、音声信号と異なる一般的な信号に分けることもできる。以下では、説明の便宜のために、オーディオ信号とする。
図5を参照すれば、BWEパラメータ生成部510は、帯域幅拡張のためのBWEパラメータを生成することができる。ここで、BWEパラメータは、励起クラス(excitation class)に該当する。一方、具現方式により、BWEパラメータは、励起クラスと異なるパラメータを含んでもよい。BWEパラメータ生成部510は、フレーム単位で、信号特性に基づいて、励起クラスを生成することができる。具体的には、入力信号が、音声特性を有するか、あるいはトーナル特性を有するかということを判断し、判断結果に基づいて、複数の励起クラスのうち一つを決定することができる。複数の励起クラスは、音声と係わる励起クラス、トーナルミュージックと係わる励起クラス、及びノントーナルミュージックと係わる励起クラスを含んでもよい。決定された励起クラスは、ビットストリームに含まれて伝送される。
低周波符号化部530は、低帯域信号に対して符号化を行い、符号化されたスペクトル係数を生成することができる。また、低周波符号化部530は、低帯域信号のエネルギーと係わる情報を符号化することができる。一実施形態によれば、低周波符号化部530は、低帯域信号を周波数ドメインに変換し、低周波スペクトルを生成し、低周波スペクトルに対して量子化し、量子化されたスペクトル係数を生成することができる。ドメイン変換のために、MDCTを使用することができるが、それに限定されるものではない。量子化のために、PVQ(pyramid vector quantization)を使用することができるが、それに限定されるものではない。
高周波符号化部550は、高帯域信号に対して符号化を行い、デコーダ端での帯域幅拡張に必要なパラメータ、あるいはビット割り当てに必要なパラメータを生成することができる。帯域幅拡張に必要なパラメータは、高帯域信号のエネルギーと係わる情報と、付加情報とを含んでもよい。ここで、該エネルギーは、エンベロープ、スケールファクタ、平均電力あるいはNormによって表現される。該付加情報は、高帯域で重要なスペクトル成分を含むバンドに係わる情報であり、高帯域において、特定バンドに含まれたスペクトル成分と係わる情報でもある。高周波符号化部550は、高帯域信号を周波数ドメインに変換し、高周波スペクトルを生成し、高周波スペクトルのエネルギーと係わる情報を量子化することができる。ドメイン変換のために、MDCTを使用することができるが、それに限定されるものではない。量子化のために、ベクトル量子化を使用することができるが、それに限定されるものではない。
多重化部570は、BWEパラメータ、すなわち、励起クラス、帯域幅拡張に必要なパラメータ、低帯域の量子化されたスペクトル係数を含み、ビットストリームを生成することができる。該ビットストリームは、伝送されたり保存されたりする。ここで、帯域幅拡張に必要なパラメータは、高帯域のエンベロープ量子化インデックスと、高帯域のリファインメントデータとを含んでもよい。
周波数ドメインのBWE方式は、時間ドメインコーディングパートと結合されて適用される。時間ドメインコーディングには、主にCELP(code excited linear prediction)方式が使用され、CELP方式で低帯域をコーディングし、周波数ドメインでのBWEではない時間ドメインでのBWE方式と結合されるように具現される。かような場合、全体的に、時間ドメインコーディングと周波数ドメインコーディングとの適応的コーディング方式決定に基づいて、コーディング方式を選択的に適用することができる。適切なコーディング方式を選択するために、信号分類を必要とし、一実施形態によれば、信号分類結果を優先的に利用して、フレーム別励起クラスを決定することができる。
図6は、一実施形態によるBWEパラメータ生成部510(図5)の構成を示したブロック図であり、信号分類部610及び励起クラス生成部630を含んでもよい。図6を参照すれば、信号分類部610は、信号特性をフレーム単位で分析し、現在フレームが音声信号であるか否かということを分類し、分類結果によって、励起クラスを決定することができる。信号分類処理は、公知された多様な方法、例えば、短区間特性及び/または長区間特性を利用して行われる。短区間特性及び/または長区間特性は、周波数ドメイン特性あるいは時間ドメイン特性でもある。現在フレームが、時間ドメインコーディングが適切な方式である音声信号と分類される場合、高帯域信号の特性に基づいた方式より、固定された形態の励起クラスを割り当てる方式が音質向上に役に立つ。ここで、信号分類処理は、以前フレームの分類結果を考慮せずに、現在フレームに対して行われる。すなわち、たとえ現在フレームが行オーバーを考慮し、最終的には、周波数ドメインコーディングと決定されるが、現在フレーム自体が時間ドメインコーディングが適切な方式であると分類された場合には、固定された励起クラスを割り当てることができる。例えば、現在フレームが、時間ドメインコーディングが適切な音声信号と分類される場合、励起クラスは、音声特性と係わる第1励起クラスに設定される。
励起クラス生成部630は信号分類部610の分類結果、現在フレームが音声信号と分類されない場合、少なくとも1以上の閾値を利用して、励起クラスを決定することができる。実施形態によれば、励起クラス生成部630は、信号分類部610の分類結果、現在フレームが音声信号と分類されない場合、高帯域のトーナリティ値を算出し、トーナリティ値を閾値と比較し、励起クラスを決定することができる。励起クラスの個数により、複数個の閾値が使用される。1つの閾値が使用される場合、トーナリティ値が閾値より大きい場合、トーナルミュージック信号と分類し、トーナリティ値が閾値より小さい場合、ノントーナルミュージック信号、例えば、ノイジ信号と分類することができる。現在フレームがトーナルミュージック信号と分類される場合、励起クラスは、トーナル特性と係わる第2励起クラス、ノイジ信号と分類される場合、ノントーナル特性と係わる第3励起クラスと決定される。
図7は、一実施形態による高帯域符号化装置の構成を示したブロック図である。図7に図示された高帯域符号化装置は、第1エンベロープ量子化部710、第2エンベロープ量子化部730及びエンベロープリファインメント部750を含んでもよい。各構成要素は、少なくとも1つのモジュールに一体化され、少なくとも1つのプロセッサ(図示せず)によって具現される。
図7を参照すれば、第1エンベロープ量子化部710は、低帯域のエンベロープを量子化することができる。実施形態によれば、低帯域のエンベロープは、ベクトル量子化される。
第2エンベロープ量子化部730は、高帯域のエンベロープを量子化することができる。一実施形態によれば、高帯域のエンベロープは、ベクトル量子化される。一実施形態によれば、高帯域エンベロープに対して、エネルギー制御が行われる。具体的には、本来のスペクトルによって生成される高帯域スペクトルのトーナリティと、本来のスペクトルのトーナリティ間差からエネルギー制御要素を求め、エネルギー制御要素に基づいて、高帯域エンベロープに対してエネルギー制御を行い、エネルギー制御が行われた高帯域エンベロープを量子化することができる。
量子化の結果として得られる高帯域のエンベロープ量子化インデックスは、ビットストリームに含まれるか、あるいは保存される。
エンベロープリファインメント部750は、低帯域のエンベロープと高帯域のエンベロープとから得られる全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成し、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定し、決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを生成することができる。ここで、全帯域エンベロープは、高帯域エンベロープのバンド構成を低帯域エンベロープのバンド構成にマッピングし、マッピングされた高帯域エンベロープを、前記低帯域エンベロープと結合して得られる。エンベロープリファインメント部750は、高帯域でビットが割り当てられたサブバンドを、エンベロープアップデート及びリファインメントデータを伝送するサブバンドと決定することができる。エンベロープリファインメント部750は、決定されたサブバンドに対して、リファインメントデータを表現するのに使用されたビット数に基づいて、ビット割り当て情報をアップデートすることができる。アップデートされたビット割り当て情報は、スペクトル符号化に使用される。リファインメントデータは、必要ビット、最小値、及びNormのデルタ値を含んでもよい。
図8は、図7に図示されたエンベロープリファインメント部750の詳細的な構成を示したブロック図である。
図8に図示されたエンベロープリファインメント部730は、マッピング部810、結合部820、第1ビット割り当て部830、デルタ符号化部840、エンベロープアップデート部850及び第2ビット割り当て部860を含んでもよい。各構成要素は、少なくとも1つのモジュールに一体化され、少なくとも1つのプロセッサ(図示せず)によって具現される。
図8を参照すれば、マッピング部810は、周波数マッチングのために、高帯域のエンベロープを、全帯域のバンド分割情報に対応するバンド構成にマッピングさせることができる。一実施形態によれば、第2エンベロープ量子化部730から提供される量子化された高帯域のエンベロープを逆量子化し、逆量子化されたエンベロープから、高帯域のマッピングされたエンベロープを得ることができる。説明の便宜上、高帯域の逆量子化されたエンベロープをE’(p)とし、高帯域のマッピングされたエンベロープをN(p)とする。もし全帯域のバンド構成と、高帯域のバンド構成とが同一であれば、高帯域の量子化されたエンベロープE(p)をそのままスカラー量子化する。一方、全帯域のバンド構成と、高帯域のバンド構成とが異なれば、高帯域の量子化されたエンベロープE(p)を全帯域のバンド構成、すなわち、低帯域のバンド構成に合わせなければならない必要がある。それは、低帯域サブバンドに含まれている高帯域サブバンドのスペクトル個数を基準に行われる。一方、全帯域のバンド構成と、高帯域のバンド構成との間にオーバーラップがある場合、オーバーラップされるバンドを基準に、低周波数コーディング方式を設定することができる。一例として挙げれば、下記のように、マッピング過程が遂行される。
(30)=E’(1)
(31)={E’(2)*2+E’(3)}/3
(32)={E’(3)*2+E’(4)}/3
(33)={E’(4)+E’(5)*2}/3
(34)={E’(5)+E’(6)*2}/3
(35)=E’(7)
(36)={E’(8)*3+E’(9)}/4
(37)={E’(9)*3+E’(10)}/4
(38)={E’(10)+E’(11)*3}/4
(39)=E’(12)
(40)={E’(12)+E’(13)*3}/4
(41)={E’(13)+E’(14)}/2
(42)=E’(14)
(43)=E’(14)
低帯域のエンベロープは、低周波と高周波とのオーバーラップが存在するサブバンド、すなわち、p=29まで求められ、高帯域のマッピングされたエンベロープは、サブバンドp=30〜43まで求められる。一方、前記表1及び表4を例として挙げれば、サブバンドの終端周波数インデックスが639で終わる場合、スーパーワイドバンド(32Kサンプリングレート)であり、それが799で終わる場合、フルバンド(48Kサンプリングレート)までのバンド割り当てを意味する。
前述のように、高帯域のマッピングされたエンベロープN(p)は、さらに量子化される。そのとき、スカラー量子化が使用される。
結合部820は、量子化された低帯域のエンベロープN(p)と、量子化された高帯域のマッピングされたエンベロープN(p)とを結合し、全帯域のエンベロープN(p)を得ることができる。
第1ビット割り当て部830は、全帯域のエンベロープN(p)に基づいて、サブバンド単位でスペクトル量子化を行うための初期ビット割り当てが行われる。そのとき、初期ビット割り当ては、全帯域のエンベロープから得られるNormに基づいて、Normが大きい場合、さらに多くのビットを割り当てることができる。得られた初期ビット割り当て情報に基づいて、現在フレームに対するエンベロープリファインメント処理いかんを決定することができる。もし高帯域でビットが割り当てられたサブバンドが存在する場合、高帯域のエンベロープをリファインするために、デルタコーディングが行われる必要がある。すなわち、高帯域に重要なスペクトル成分が存在するならば、さらに微細なスペクトルエンベロープを提供するために、リファインメントが行われる。高帯域でビットが割り当てられたサブバンドを、エンベロープアップデートを必要とするサブバンドと決定することができる。一方、高帯域でビットが割り当てられたサブバンドが存在しない場合、エンベロープリファインメント処理は、不要であり、初期ビット割り当て情報を、低帯域のスペクトル符号化及び/またはエンベロープ符号化に使用することができる。第1ビット割り当て部830で得られる初期ビット割り当て情報により、デルタ符号化部840、エンベロープアップデート部850及び第2ビット割り当て部860の動作いかんが決定される。第1ビット割り当て部830は、小数点単位のビット割り当てを行うことができる。
デルタ符号化部840は、エンベロープアップデートを必要とするサブバンドに対して、マッピングされたエンベロープN(p)と、本来のスペクトルを使用して量子化されたエンベロープN(p)との差、すなわち、デルタを求めて符号化することができる。一例を挙げれば、デルタは、下記数式(2)のように示すことができる。
Figure 2017514163
デルタ符号化部840は、デルタの最小値及び最大値を調査し、情報伝送のために必要なビットを計算することができる。例えば、最大値が3より大きく、7より小さい場合、必要ビットは、4ビットと決定しながら、−8〜7までのデルタを伝送することができる。すなわち、最小値は、min=−2(B−1)であり、最大値は、max=2(B−1)−1で設定し、Bは、必要ビットを意味する。一方、必要ビットの表現において、制約が存在するために、制約を超える場合には、最大値と最小値とに制限を加えることができる。制限が加えられた最大値(maxl)と最小値(minl)とを利用して、デルタを下記数式(3)のように再計算することができる。
Figure 2017514163
デルタ符号化部840は、Normアップデート情報、すなわち、リファインメントデータを生成することができる。一実施形態によれば、必要ビットは、2ビットで表現し、必要なデルタ値をビットストリームに含めることができる。必要ビットを2ビットで表現するために、4種を表現することができる。2ビットないし5ビットまで必要ビットを表現することができ、それぞれ0、1、2、3を活用することができる。最小値(min)を活用し、伝送するデルタ値は、D(p)=D(p)−minと計算することができる。リファインメントデータは、必要ビット、最小値、デルタ値を含んでもよい。
エンベロープアップデート部850は、デルタ値を利用して、Norm値、すなわち、エンベロープをアップデートさせることができる。
Figure 2017514163
第2ビット割り当て部860は、伝送されるデルタ値を表現するために、活用したビットほぼバンド別ビット割り当て情報をアップデートさせることができる。一実施形態によれば、デルタ値を符号化するための十分なビットを提供するために、低周波から高周波に、あるいは高周波から低周波にバンドを変更しながら、特定ビット数以上が割り当てられた場合、1ビットずつ減少させることができる。かようにアップデートされたビット割り当て情報は、スペクトル量子化に使用される。
図9は、図5に図示された低周波符号化装置の構成を示したブロック図であり、量子化部910を含んでもよい。図9を参照すれば、量子化部910は、第1ビット割り当て部830あるいは第2ビット割り当て部860から提供されるビット割り当て情報に基づいて、スペクトル量子化を行うことができる。一実施形態によれば、PVQ(pyramid vector quantization)を使用することができるが、それに限定されるものではない。一方、量子化部910は、アップデートされたエンベロープ、すなわち、Norm値に基づいて正規化を行い、正規化されたスペクトルに対して、量子化を行うことができる。スペクトル量子化時、復号端において、ノイズフィリング処理時に必要とするノイズレベル情報を追加して計算し、符号化することができる。
図10は、一実施形態によるオーディオ復号装置の構成を示したブロック図である。図10に図示されたオーディオ復号装置は、逆多重化部1010、BWEパラメータ復号部1030、高周波復号部1050、低周波復号部1070及び結合部1090を含んでもよい。図示されていないが、オーディオ復号装置は、逆変換部をさらに含んでもよい。各構成要素は、少なくとも1つのモジュールに一体化され、少なくとも1つのプロセッサ(図示せず)によって具現される。ここで、入力信号は、音楽あるいは音声、あるいは音楽と音声との混合信号を意味し、大きく見て、音声信号と異なる一般的な信号に分けることもできる。以下では、説明の便宜のために、オーディオ信号とする。
図10を参照すれば、逆多重化部1010は、受信されるビットストリームをパージングし、復号に必要なパラメータを生成することができる。
BWEパラメータ復号部1030は、ビットストリームから、BWEパラメータを復号することができる。BWEパラメータは、励起クラスに該当する。一方、BWEパラメータは、励起クラスと異なるパラメータを含んでもよい。
高周波復号部1050は、復号された低周波スペクトルと励起クラスとを利用して、高周波励起スペクトルを生成することができる。他の実施形態によれば、高周波復号部1050は、ビットストリームから、帯域幅拡張に必要なパラメータ、あるいはビット割り当てに必要なパラメータを復号し、帯域幅拡張に必要なパラメータ、あるいはビット割り当てに必要なパラメータと、復号された低帯域信号のエネルギーと係わる情報とを高周波励起スペクトルに適用することができる。
帯域幅拡張に必要なパラメータは、高帯域信号のエネルギーと係わる情報と、付加情報とを含んでもよい。該付加情報は、高帯域で重要なスペクトル成分を含むバンドに係わる情報であり、高帯域で特定バンドに含まれたスペクトル成分と係わる情報でもある。高帯域信号のエネルギーと係わる情報は、ベクトル逆量子化される。
低周波復号部1070は、ビットストリームから、低帯域の符号化されたスペクトル係数を復号し、低周波スペクトルを生成することができる。一方、低周波復号部1070は、低帯域信号のエネルギーと係わる情報を復号することができる。
結合部1090は、低周波復号部1070から提供されるスペクトルと、高周波復号部1050から提供されるスペクトルとを結合することができる。逆変換部(図示せず)は、結合されたスペクトルを時間ドメインに逆変換することができる。ドメイン逆変換のために、IMDCT(inverse MDCT)を使用することができるが、それに限定されるものではない。
図11は、一実施形態による高周波復号部1050の一部構成を示したブロック図である。図11に図示された高周波復号部1050は、第1エンベロープ逆量子化部1110、第2エンベロープ逆量子化部1130及びエンベロープリファインメント部1150を含んでもよい。各構成要素は、少なくとも1つのモジュールに一体化され、少なくとも1つのプロセッサ(図示せず)によって具現される。
図11を参照すれば、第1エンベロープ逆量子化部1110は、低帯域のエンベロープを逆量子化することができる。一実施形態によれば、低帯域のエンベロープは、ベクトル逆量子化される。
第2エンベロープ逆量子化部1130は、高帯域のエンベロープを逆量子化することができる。一実施形態によれば、高帯域のエンベロープは、ベクトル逆量子化される。
エンベロープリファインメント部1150は、低帯域のエンベロープと、高帯域のエンベロープとから得られる全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成し、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定し、決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを復号し、エンベロープをアップデートすることができる。ここで、全帯域エンベロープは、高帯域エンベロープのバンド構成を、低帯域エンベロープのバンド構成にマッピングし、マッピングされた高帯域エンベロープを、前記低帯域エンベロープと結合して得られる。エンベロープリファインメント部1150は、高帯域でビットが割り当てられたサブバンドを、エンベロープアップデート及びリファインメントデータを復号するサブバンドと決定することができる。エンベロープリファインメント部1150は、決定されたサブバンドに対して、前記リファインメントデータの表現に使用されたビット数に基づいて、ビット割り当て情報をアップデートすることができる。アップデートされたビット割り当て情報は、スペクトル復号に使用される。一方、リファインメントデータは、必要ビット、最小値、及びNormのデルタ値を含んでもよい。
図12は、図11に図示されたエンベロープリファインメント部1150の構成を示したブロック図である。図12に図示されたエンベロープリファインメント部1150は、マッピング部1210、結合部1220、第1ビット割り当て部1230、デルタ復号部1240、エンベロープアップデート部1250及び第2ビット割り当て部1260を含んでもよい。各構成要素は、少なくとも1つのモジュールに一体化され、少なくとも1つのプロセッサ(図示せず)によって具現される。
図12を参照すれば、マッピング部1210は、周波数マッチングのために、高帯域のエンベロープを、全帯域のバンド分割情報に対応するバンド構成にマッピングさせることができる。マッピング部1210は、図8のマッピング部810と同一に動作することができる。
結合部1220は、逆量子化された低帯域のエンベロープN(p)と、逆量子化された高帯域のマッピングされたエンベロープN(p)とを結合し、全帯域のエンベロープN(p)を得ることができる。結合部1220は、図8の結合部820と同一に動作することができる。
第1ビット割り当て部1230は、全帯域のエンベロープN(p)に基づいて、サブバンド単位でスペクトル逆量子化を行うための初期ビット割り当てが行われる。第1ビット割り当て部1230は、図8の第1ビット割り当て部830と同一に動作することができる。
デルタ復号部1240は、ビット割り当て情報に基づいて、エンベロープアップデートを必要とするか否かということ、及びいかなるサブバンドがアップデートされる必要があるかということを決定し、決定されたサブバンドに対して、符号化端から伝送されたアップデート情報、すなわち、リファインメントデータを復号することができる。一実施形態によれば、2ビットの必要ビット、Delta(0)、Delta(1)、…のように表現されたリファインメントデータから必要ビットを抽出し、最小値を計算し、デルタ値D(p)を抽出することができる。ここで、必要ビットは、2ビットを利用するために、4種を表現することができる。2ビットないし5ビットまでを、それぞれ0、1、2、3を活用して表現するために、例えば、0である場合、2ビット、3である場合、5ビットのように必要ビットを設定することができる。必要ビットによって、最小値(min)を計算した後、最小値を基準に、D(p)=D(p)+minに基づいて、D(p)を抽出することができる。
エンベロープアップデート部1250は、抽出されたデルタ値D(p)に基づいて、Norm値、すなわち、エンベロープをアップデートさせることができる。エンベロープアップデート部1250は、図8のエンベロープアップデート部850と同一に動作することができる。
第2ビット割り当て部1260は、抽出されたデルタ値を表現するために、活用されたビットほどバンド別ビット割り当て情報をさらに求めることができる。第2ビット割り当て部1260は、図8の第2ビット割り当て部860と同一に動作することができる。
アップデートされたエンベロープと、最終的に求められたビット割り当て情報は、低周波復号部1070に提供される。
図13は、図10に図示された低周波復号装置の構成を示したブロック図であり、逆量子化部1310及びノイズフィリング部1330を含んでもよい。
図13を参照すれば、逆量子化部1310は、ビットストリームに含まれたスペクトル量子化インデックスを、ビット割り当て情報に基づいて、逆量子化することができる。その結果、低帯域と、一部重要な高帯域とのスペクトルを生成することができる。
ノイズフィリング部1330は、逆量子化されたスペクトルに対して、ノイズフィリング処理を行うことができる。ノイズフィリング処理は、低帯域に対してのみ行われる。ノイズフィリング処理が、逆量子化されたスペクトルにおいて、全部ゼロに逆量子化されたサブバンド、あるいは各スペクトル係数に割り当てられた平均ビットが、所定基準値より小さいサブバンドに対して行われる。ノイズフィリングされたスペクトルは、結合部1090(図10)に提供される。さらに、ノイズフィリングされたスペクトルに対して、アップデートされたエンベロープに基づいて、逆正規化が行われる。ノイズフィリング部1330で生成されたスペクトルは、さらにアンチスパスニス処理が行われた後、励起クラスに基づいて振幅が調節され、高周波スペクトル生成に使用される。アンチスパスニス処理は、ノイズフィリングされたスペクトルにおいて、ゼロとして残っている部分に追加してランダム符号及び決定された振幅を有する信号を付加することを意味する。
図14は、図10に図示された結合部1090の構成を示したブロック図であり、スペクトル結合部1410を含んでもよい。図14を参照すれば、スペクトル結合部1410は、復号された低帯域スペクトルと、生成された高帯域スペクトルとを結合することができる。低帯域スペクトルはノイズフィリングされたスペクトルでもある。高帯域スペクトルは、復号された低帯域スペクトルのダイナミックレンジあるいは振幅を、励起クラスに基づいて調節して得られた変形された低帯域スペクトルを利用して生成される。例えば、変形された低帯域スペクトルを、高帯域にパッチング、例えば、転写、コピー、ミラーリングあるいはホールディングし、高帯域スペクトルを生成することができる。
スペクトル結合部1410は、エンベロープリファインメント部750から提供されるビット割り当て情報に基づいて、復号された低帯域スペクトルと、生成された高帯域スペクトルとを選択的に結合することができる。ここで、ビット割り当て情報は、初期ビット割り当て情報あるいは最終ビット割り当て情報でもある。一実施形態によれば、低帯域及び高帯域の境界に位置したサブバンドにおいてビット割り当てされている場合、ノイズフィリングされたスペクトルに基づいて結合を行い、ビット割り当てされていない場合、ノイズフィリングされたスペクトルと、生成された高帯域スペクトルとに対してオーバーラップアド処理を行うことができる。
スペクトル結合部1410は、サブバンド別ビット割り当て情報に基づいて、ビットが割り当てられたサブバンドである場合、ノイズフィリングされたスペクトルを利用して、ビットが割り当てられていないサブバンドの場合、生成された高帯域スペクトルを利用することができる。ここで、サブバンドの構成は、全帯域のバンド構成に基づく。
図15は、本発明の一実施形態による符号化モジュールを含むマルチメディア機器の構成を示したブロック図である。図15に図示されたマルチメディア機器1500は、通信部1510と符号化モジュール1530とを含んでもよい。また、符号化の結果として得られるオーディオビットストリームの用途によって、オーディオビットストリームを保存する保存部1550をさらに含んでもよい。また、マルチメディア機器1500は、マイクロフォン1570をさらに含んでもよい。すなわち、保存部1550とマイクロフォン1570は、オプションとして具備される。一方、図15に図示されたマルチメディア機器1500は、任意の復号モジュール(図示せず)、例えば、一般的な復号機能を遂行する復号モジュール、あるいは本発明の一実施形態による復号モジュールをさらに含んでもよい。ここで、符号化モジュール1530は、マルチメディア機器1500に具備される他の構成要素(図示せず)と共に一体化され、少なくとも1以上のプロセッサ(図示せず)によっても具現される。
図15を参照すれば、通信部1510は、外部から提供されるオーディオと、符号化されたビットストリームとのうち少なくとも一つを受信するか、復元されたオーディオと、符号化モジュール1530の符号化の結果として得られるオーディオビットストリームとのうち少なくとも一つを送信することができる。
通信部1510は、無線インターネット、無線イントラネット、無線電話網、無線LAN(local area network)、Wi−Fi(wireless fidelity)、WFD(Wi−Fi direct)、3G(3rd generation)、4G(4th generation)、ブルートゥース(登録商標(Bluetooth))、赤外線通信(IrDA:infrared data association)、RFID(radio frequency identification)、UWB(ultra wideband)、ジグビー(登録商標(Zigbee))、NFC(near field communication)のような無線ネットワーク;または有線電話網、有線インターネットのような有線ネットワークを介して、外部のマルチメディア機器とデータを送受信することができるように構成される。
符号化モジュール1530は、一実施形態によれば、通信部1510あるいはマイクロフォン1570を介して提供される時間ドメインのオーディオ信号を、周波数ドメインに変換し、周波数ドメイン信号から得られる全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成し、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定し、決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを生成することができる。
保存部1550は、符号化モジュール1530で生成される符号化されたビットストリームを保存することができる。一方、保存部1550は、マルチメディア機器1500の運用に必要な多様なプログラムを保存することができる。
マイクロフォン1570は、ユーザあるいは外部のオーディオ信号を符号化モジュール1530に提供することができる。
図16は、本発明の一実施形態による復号モジュールを含むマルチメディア機器の構成を示したブロック図である。図16に図示されたマルチメディア機器1600は、通信部1610及び復号モジュール1630を含んでもよい。また、復号の結果として得られる復元されたオーディオ信号の用途によって、復元されたオーディオ信号を保存する保存部1650をさらに含んでもよい。また、マルチメディア機器1600は、スピーカ1670をさらに含んでもよい。すなわち、保存部1650とスピーカ1670は、オプションとして具備される。一方、図16に図示されたマルチメディア機器1600は、任意の符号化モジュール(図示せず)、例えば、一般的な符号化機能を遂行する符号化モジュール、あるいは本発明の一実施形態による符号化モジュールをさらに含んでもよい。ここで、復号モジュール1630は、マルチメディア機器1600に具備される他の構成要素(図示せず)と共に一体化され、少なくとも1つの以上のプロセッサ(図示せず)によっても具現される。
図16を参照すれば、通信部1610は、外部から提供される符号化されたビットストリームと、オーディオ信号とのうち少なくとも一つを受信するか、あるいは復号モジュール1630の復号結果として得られる復元されたオーディオ信号と、符号化結果として得られるオーディオビットストリームとのうち少なくとも一つを送信することができる。一方、通信部1610は、図15の通信部1510と実質的に類似しても具現される。
復号モジュール1630は、、一実施形態によれば、通信部1610を介して提供されるビットストリームを受信し、全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成し、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定し、決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを復号し、エンベロープをアップデートすることができる。
保存部1650は、復号モジュール1630で生成される復元されたオーディオ信号を保存することができる。一方、保存部1650は、マルチメディア機器1600の運用に必要な多様なプログラムを保存することができる。
スピーカ1670は、復号モジュール1630で生成される復元されたオーディオ信号を外部に出力することができる。
図17は、本発明の一実施形態による符号化モジュール及び復号モジュールを含むマルチメディア機器の構成を示したブロック図である。図17に図示されたマルチメディア機器1700は、通信部1710、符号化モジュール1720及び復号モジュール1730を含んでもよい。また、符号化結果として得られるオーディオビットストリーム、あるいは復号結果として得られる復元されたオーディオ信号の用途によって、オーディオビットストリーム、あるいは復元されたオーディオ信号を保存する保存部1740をさらに含んでもよい。また、マルチメディア機器1700は、マイクロフォン1750あるいはスピーカ1760をさらに含んでもよい。ここで、符号化モジュール1720と復号モジュール1730は、マルチメディア機器1700に具備される他の構成要素(図示せず)と共に一体化され、少なくとも1以上のプロセッサ(図示せず)によっても具現される。
図17に図示された各構成要素は、図15に図示されたマルチメディア機器1500の構成要素、あるいは図16に図示されたマルチメディア機器1600の構成要素と重複するので、その詳細な説明は省略する。
図15ないし図17に図示されたマルチメディア機器1500,1600,1700には、電話、モバイルフォンなどを含む音声通信専用端末;TV(television)、MP3プレーヤなどを含む放送専用装置あるいは音楽専用装置;あるいは音声通信専用端末と、放送専用装置あるいは音楽専用装置との融合端末装置が含まれてもよいが、それらに限定されるものではない。また、マルチメディア機器1500,1600,1700は、クライアント、サーバ、あるいはクライアントとサーバとの間に配置される変換器としても使用される。
一方、マルチメディア機器1500,1600,1700が、例えば、モバイルフォンである場合、図示されていないが、キーパッドのようなユーザ入力部、ユーザインターフェース、あるいはモバイルフォンで処理される情報をディスプレイするディスプレイ部、モバイルフォンの全般的な機能を制御するプロセッサをさらに含んでもよい。また、該モバイルフォンは、撮像機能を有するカメラ部と、モバイルフォンで必要となる機能を遂行する少なくとも1以上の構成要素をさらに含んでもよい。
一方、マルチメディア機器1500,1600,1700が、例えば、TVである場合、図示されていないが、キーパッドのようなユーザ入力部、受信された放送情報をディスプレイするディスプレイ部、TVの全般的な機能を制御するプロセッサをさらに含んでもよい。また、TVは、TVで必要とする機能を遂行する少なくとも1以上の構成要素をさらに含んでもよい。
図18は、一実施形態によるオーディオ符号化方法の動作について説明するためのフローチャートである。図18に図示された方法は、図5、図7、図8あるいは図9の対応する構成要素において遂行されるか、あるいは別途のプロセッサによっても遂行される。
図18を参照すれば、1800段階においては、入力信号に対して、MDCTのような時間−周波数変換を行うことができる。
1810段階においては、MDCTスペクトルに対して、低周波帯域のNormを計算して量子化することができる。
1820段階においては、MDCTスペクトルに対して、高周波エンベロープを計算して量子化することができる。
1830段階においては、高周波帯域の拡張パラメータを抽出することができる。
1840段階においては、高周波帯域に対してNorm値マッピングを介して、全帯域の量子化されたNorm値を獲得することができる。
1850段階においては、バンド別ビット割り当て情報を生成することができる。
1860段階においては、バンド別ビット割り当て情報に基づいて、高周波帯域で重要スペクトル情報が量子化される場合、高周波帯域のNormアップデート情報を生成することができる。
1870段階においては、高周波帯域のNormアップデートを介して、全帯域の量子化されたNorm値をアップデートさせることができる。
1880段階においては、アップデートされた全帯域の量子化されたNorm値に基づいて、スペクトルを正規化して量子化することができる。
1890段階においては、量子化されたスペクトルを含むビットストリームを生成することができる。
図19は、一実施形態によるオーディオ復号方法の動作について説明するためのフローチャートである。図19に図示された方法は、図10ないし図14の対応する構成要素で遂行されるか、別途のプロセッサによっても遂行される。
図19を参照すれば、1900段階においては、ビットストリームをパージングすることができる。
1905段階においては、ビットストリームに含まれた低周波帯域のNormを復号することができる。
1910段階においては、ビットストリームに含まれた高周波エンベロープを復号することができる。
1915段階においては、高周波帯域の拡張パラメータを復号することができる。
1920段階においては、高周波帯域に対して、Norm値マッピングを介して、全帯域の逆量子化されたNorm値を獲得することができる。
1925段階においては、バンド別ビット割り当て情報を生成することができる。
1930段階においては、バンド別ビット割り当て情報に基づいて、高周波帯域で重要スペクトル情報が量子化された場合、高周波帯域のNormアップデート情報を復号することができる。
1935段階においては、高周波帯域のNormアップデートを介して全帯域の量子化されたNorm値をアップデートさせることができる。
1940段階においては、アップデートされた全帯域の量子化されたNorm値に基づいて、スペクトルを逆量子化して逆正規化し、復号されたスペクトルを生成することができる。
1945段階においては、復号されたスペクトルに基づいて、帯域拡張復号を行うことができる。
1950段階においては、復号されたスペクトルと、帯域拡張復号されたスペクトルとを選択的に併合することができる。
1955段階においては、選択的に併合されたスペクトルに対して、IMDCTのような時間−周波数逆変換を行うことができる。
前記実施形態による方法は、コンピュータで実行されるプログラムに作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。また、前述の本発明の実施形態で使用されるデータ構造、プログラム命令あるいはデータファイルは、コンピュータで読み取り可能な記録媒体に、多様な手段を介して記録される。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存される全種の保存装置を含んでもよい。コンピュータで読み取り可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体(magnetic media);CD−ROM(compact disc read only memory)、DVD(digital versatile disc)のような光記録媒体(optical media);フロプティカルディスク(floptical disk)のような磁気−光媒体(magneto-optical media);及びROM(read only memory)、RAM(random access memory)、フラッシュメモリのようなプログラム命令を保存して遂行するように特別に構成されたハードウェア装置が含まれてもよい。また、コンピュータで読み取り可能な記録媒体は、プログラム命令、データ構造などを指定する信号を伝送する伝送媒体でもある。プログラム命令の例としては、コンパイラによって作われるような機械語コードだけではなく、インタープリタなどを使用して、コンピュータによって実行される高級言語コードを含んでもよい。
以上のように、本発明の一実施形態は、たとえ限定された実施形態及び図面によって説明されたとしても、本発明の一実施形態は、前述の実施形態に限定されるものではなく、本発明が属する分野で当業者であるならば、かような記載から多様な修正及び変形が可能であろう。従って、本発明のスコープは、前述の説明ではなく、特許請求の範囲に示されており、それと均等または等価的な変形は、いずれも本発明技術的思想の範疇に属するものとするのである。

Claims (16)

  1. 全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成する段階と、
    サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定する段階と、
    前記決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを生成する段階と、を含む高周波符号化方法。
  2. 前記全帯域エンベロープは、高帯域エンベロープのバンド構成を低帯域エンベロープのバンド構成にマッピングし、マッピングされた高帯域エンベロープを、前記低帯域エンベロープと結合して得られることを特徴とする請求項1に記載の高周波符号化方法。
  3. 前記方法は、前記高帯域の信号特性に基づいて、励起クラスを生成して符号化する段階をさらに含むことを特徴とする請求項1に記載の高周波符号化方法。
  4. 前記決定段階は、高帯域でビットが割り当てられたサブバンドを、エンベロープアップデート及びリファインメントデータを伝送するサブバンドと決定することを特徴とする請求項1に記載の高周波符号化方法。
  5. 前記方法は、前記決定されたサブバンドに対して、前記リファインメントデータの表現に使用されたビット数に基づいて、前記ビット割り当て情報をアップデートする段階をさらに含むことを特徴とする請求項1に記載の高周波符号化方法。
  6. 前記アップデートされたビット割り当て情報は、スペクトル符号化に使用するために提供されることを特徴とする請求項5に記載の高周波符号化方法。
  7. 前記リファインメントデータは、必要ビット、最小値、及びNormのデルタ値を含むことを特徴とする請求項1に記載の高周波符号化方法。
  8. 全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成する段階と、
    サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定する段階と、
    前記決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを復号してエンベロープをアップデートする段階と、を含む高周波復号方法。
  9. 前記全帯域エンベロープは、高帯域エンベロープのバンド構成を低帯域エンベロープのバンド構成にマッピングし、マッピングされた高帯域エンベロープを、前記低帯域エンベロープと結合して得られることを特徴とする請求項8に記載の高周波復号方法。
  10. 前記方法は、励起クラスを復号する段階をさらに含むことを特徴とする請求項8に記載の高周波復号方法。
  11. 前記決定段階は、高帯域でビットが割り当てられたサブバンドを、エンベロープアップデート及びリファインメントデータを復号するサブバンドと決定することを特徴とする請求項8に記載の高周波復号方法。
  12. 前記方法は、前記決定されたサブバンドに対して、前記リファインメントデータの表現に使用されたビット数に基づいて、前記ビット割り当て情報をアップデートする段階をさらに含むことを特徴とする請求項8に記載の高周波復号方法。
  13. 前記アップデートされたビット割り当て情報は、スペクトル復号に使用するために提供されることを特徴とする請求項12に記載の高周波復号方法。
  14. 前記リファインメントデータは、必要ビット、最小値、及びNormのデルタ値を含むことを特徴とする請求項8に記載の高周波復号方法。
  15. 全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成し、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定し、前記決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを生成する少なくとも1つのプロセッサを含む高周波符号化装置。
  16. 全帯域エンベロープに基づいて、サブバンド別ビット割り当て情報を生成し、サブバンド別ビット割り当て情報に基づいて、高帯域でエンベロープアップデートを必要とするサブバンドを決定し、前記決定されたサブバンドに対して、エンベロープアップデートと係わるリファインメントデータを復号してエンベロープをアップデートする少なくとも1つのプロセッサを含む高周波復号装置。
JP2016558776A 2014-03-24 2015-03-24 高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置 Active JP6616316B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461969368P 2014-03-24 2014-03-24
US61/969,368 2014-03-24
US201462029718P 2014-07-28 2014-07-28
US62/029,718 2014-07-28
PCT/IB2015/001365 WO2015162500A2 (ko) 2014-03-24 2015-03-24 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2017514163A true JP2017514163A (ja) 2017-06-01
JP6616316B2 JP6616316B2 (ja) 2019-12-04

Family

ID=54333371

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016558776A Active JP6616316B2 (ja) 2014-03-24 2015-03-24 高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置

Country Status (7)

Country Link
US (3) US10468035B2 (ja)
EP (2) EP3128514A4 (ja)
JP (1) JP6616316B2 (ja)
KR (3) KR102653849B1 (ja)
CN (2) CN111105806B (ja)
SG (2) SG10201808274UA (ja)
WO (1) WO2015162500A2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015162500A2 (ko) * 2014-03-24 2015-10-29 삼성전자 주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
US10580424B2 (en) * 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
KR20210003514A (ko) 2019-07-02 2021-01-12 한국전자통신연구원 오디오의 고대역 부호화 방법 및 고대역 복호화 방법, 그리고 상기 방법을 수하는 부호화기 및 복호화기

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013511054A (ja) * 2009-11-27 2013-03-28 ゼットティーイー コーポレーション 階層的オーディオ符号化、復号化方法及びシステム

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8421498D0 (en) 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
JP3278900B2 (ja) 1992-05-07 2002-04-30 ソニー株式会社 データ符号化装置及び方法
JP3237089B2 (ja) * 1994-07-28 2001-12-10 株式会社日立製作所 音響信号符号化復号方法
JP3344944B2 (ja) * 1997-05-15 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
CN100372270C (zh) 1998-07-16 2008-02-27 尼尔逊媒介研究股份有限公司 广播编码的系统和方法
US6272176B1 (en) 1998-07-16 2001-08-07 Nielsen Media Research, Inc. Broadcast encoding system and method
JP3454206B2 (ja) 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
EP1470550B1 (en) 2002-01-30 2008-09-03 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
WO2003091989A1 (en) * 2002-04-26 2003-11-06 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
EP2991075B1 (en) 2004-05-14 2018-08-01 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
CN102280109B (zh) * 2004-05-19 2016-04-27 松下电器(美国)知识产权公司 编码装置、解码装置及它们的方法
DE602004020765D1 (de) 2004-09-17 2009-06-04 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten Tonsignalen
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
ATE501505T1 (de) 2006-04-27 2011-03-15 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
CN101089951B (zh) 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US20080071550A1 (en) 2006-09-18 2008-03-20 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode audio signal by using bandwidth extension technique
KR101346358B1 (ko) 2006-09-18 2013-12-31 삼성전자주식회사 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
KR101375582B1 (ko) 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
CN101197130B (zh) 2006-12-07 2011-05-18 华为技术有限公司 声音活动检测方法和声音活动检测器
US8560328B2 (en) * 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
US8392198B1 (en) * 2007-04-03 2013-03-05 Arizona Board Of Regents For And On Behalf Of Arizona State University Split-band speech compression based on loudness estimation
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
PT3550564T (pt) 2007-08-27 2020-08-18 Ericsson Telefon Ab L M Análise/síntese espectral de baixa complexidade utilizando resolução temporal selecionável
EP2259253B1 (en) 2008-03-03 2017-11-15 LG Electronics Inc. Method and apparatus for processing audio signal
EP2104096B1 (en) * 2008-03-20 2020-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN101609674B (zh) * 2008-06-20 2011-12-28 华为技术有限公司 编解码方法、装置和系统
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
CN101751926B (zh) 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
KR101301245B1 (ko) 2008-12-22 2013-09-10 한국전자통신연구원 스펙트럼 계수의 서브대역 할당 방법 및 장치
EP2210944A1 (en) * 2009-01-22 2010-07-28 ATG:biosynthetics GmbH Methods for generation of RNA and (poly)peptide libraries and their use
WO2010111876A1 (zh) 2009-03-31 2010-10-07 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
EP2273493B1 (en) * 2009-06-29 2012-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Bandwidth extension encoding and decoding
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
US8386266B2 (en) * 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
JP5651980B2 (ja) 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US8342486B2 (en) * 2010-08-09 2013-01-01 Robert S Smith Durable steam injector device
EP2631905A4 (en) * 2010-10-18 2014-04-30 Panasonic Corp DEVICE FOR TONE CODING AND TONE DECODING
CA2981539C (en) * 2010-12-29 2020-08-25 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high-frequency bandwidth extension
CN103460286B (zh) 2011-02-08 2015-07-15 Lg电子株式会社 带宽扩展的方法和设备
US10121481B2 (en) * 2011-03-04 2018-11-06 Telefonaktiebolaget Lm Ericsson (Publ) Post-quantization gain correction in audio coding
RU2464649C1 (ru) 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
BR112013033900B1 (pt) 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9384749B2 (en) 2011-09-09 2016-07-05 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device, encoding method and decoding method
KR20140085453A (ko) 2011-10-27 2014-07-07 엘지전자 주식회사 음성 신호 부호화 방법 및 복호화 방법과 이를 이용하는 장치
WO2013066238A2 (en) * 2011-11-02 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal
CN104321815B (zh) 2012-03-21 2018-10-16 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
WO2013183977A1 (ko) * 2012-06-08 2013-12-12 삼성전자 주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
CN107481725B (zh) * 2012-09-24 2020-11-06 三星电子株式会社 时域帧错误隐藏设备和时域帧错误隐藏方法
CN106847297B (zh) * 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
KR102023138B1 (ko) * 2013-12-02 2019-09-19 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치
WO2015133795A1 (ko) 2014-03-03 2015-09-11 삼성전자 주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
WO2015162500A2 (ko) * 2014-03-24 2015-10-29 삼성전자 주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
AU2015291897B2 (en) 2014-07-25 2019-02-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Acoustic signal encoding device, acoustic signal decoding device, method for encoding acoustic signal, and method for decoding acoustic signal

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013511054A (ja) * 2009-11-27 2013-03-28 ゼットティーイー コーポレーション 階層的オーディオ符号化、復号化方法及びシステム

Also Published As

Publication number Publication date
WO2015162500A3 (ko) 2016-01-28
EP3913628A1 (en) 2021-11-24
US20210118451A1 (en) 2021-04-22
CN106463133B (zh) 2020-03-24
US10909993B2 (en) 2021-02-02
KR20220070549A (ko) 2022-05-31
EP3128514A2 (en) 2017-02-08
EP3128514A4 (en) 2017-11-01
US20180182400A1 (en) 2018-06-28
US11688406B2 (en) 2023-06-27
KR102653849B1 (ko) 2024-04-02
US10468035B2 (en) 2019-11-05
SG10201808274UA (en) 2018-10-30
KR102400016B1 (ko) 2022-05-19
KR20240046298A (ko) 2024-04-08
JP6616316B2 (ja) 2019-12-04
US20200035250A1 (en) 2020-01-30
WO2015162500A2 (ko) 2015-10-29
CN111105806B (zh) 2024-04-26
KR20160145559A (ko) 2016-12-20
CN106463133A (zh) 2017-02-22
SG11201609834TA (en) 2016-12-29
CN111105806A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
US11355129B2 (en) Energy lossless-encoding method and apparatus, audio encoding method and apparatus, energy lossless-decoding method and apparatus, and audio decoding method and apparatus
JP6616316B2 (ja) 高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置
KR20200010540A (ko) 대역폭 확장을 위한 고주파수 부호화/복호화 방법 및 장치
JP2019168699A (ja) ビット割り当て装置
CN111179946B (zh) 无损编码方法和无损解码方法
US11676614B2 (en) Method and apparatus for high frequency decoding for bandwidth extension
KR102491177B1 (ko) 대역폭 확장을 위한 고주파 복호화 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191107

R150 Certificate of patent or registration of utility model

Ref document number: 6616316

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250