JP2009513992A - オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法 - Google Patents

オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法 Download PDF

Info

Publication number
JP2009513992A
JP2009513992A JP2006516049A JP2006516049A JP2009513992A JP 2009513992 A JP2009513992 A JP 2009513992A JP 2006516049 A JP2006516049 A JP 2006516049A JP 2006516049 A JP2006516049 A JP 2006516049A JP 2009513992 A JP2009513992 A JP 2009513992A
Authority
JP
Japan
Prior art keywords
encoder
audio signal
signal
output signal
transform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006516049A
Other languages
English (en)
Inventor
ホーリック ホルゲル
シュグ ミハエル
ノイシンガー マティアス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2009513992A publication Critical patent/JP2009513992A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

オーディオ信号を符号化する際、前記オーディオ信号はまず第1のエンコーダ(12)で符号化され、第1のエンコーダ出力信号を取得する。この第1のエンコーダ出力信号は、ビットストリームに書きこまれる。更に、この出力信号は、デコーダ(18)によって復号化され、復号化オーディオ信号を供給する。前記復号化オーディオ信号と原オーディオ信号とを比較し(22)残差信号を取得する。次に、この残差信号は第2のエンコーダ(26)を介して符号化され、第2のエンコーダ出力信号を取得する。この出力信号もまたビットストリーム(30)に書き込まれる。第1のエンコーダは、第1の時間分解能または第1の周波数分解能を有する。第2のエンコーダは、第2の時間分解能または第2の周波数分解能を有する。高い時間分解能と高い周波数分解能を有するオーディオ信号を各デコーダから取り出すことができるように、第1の分解能は第2の分解能と異なっている。
【選択図】 1

Description

本発明は、符号化技術、特にオーディオ符号化技術に関する。
近年、オーディオエンコーダ、特に「mp3」、「AAC」または「mp3PRO」といったキーワードで知られるエンコーダが広く受け入れられるようになった。オーディオ信号は膨大な量のデータを要するが、例えば、そのオーディオ信号がPCM方式でオーディオ用CDに記録されている場合、これらのエンコーダによって、帯域幅の限られているチャネル間でオーディオ信号を転送するのに適した「許容できる」データ転送速度で、オーディオ信号を圧縮することができる。PCM方式でデータを転送するには、最大1.4Mbit/sのデータ転送速度を要する。「mp3」で符号化されたオーディオデータは、既に128kbit/sのデータ転送速度を有する高品質なステレオサウンドを達成している。
さらに、周知のスペクトル帯域複製(SBR)により、既存の可聴範囲適応型知覚オーディオエンコーダの効率が大幅に上がっている。このSBR技術については、WO98/57436に記載されており、「mp3PRO」方式として実施されてもいる。ここでも、良好なステレオ音質が実現されており、データ転送速度は、64kbit/sである。
欧州特許番号EP0846375(B1)(特許文献1)には、オーディオ信号をスケーラブル(拡張可能)に符号化する方法および装置が開示されている。オーディオ信号は、第1のエンコーダにより符号化され、第1のエンコーダのビットストリームを取得する。次に、この信号は、第1のエンコーダに適応するデコーダにより再び復号化される。このデコーダからの出力信号は、遅延された原オーディオ信号と共に、差分信号を生成する差分ステージに供給される。この差分信号は、原オーディオ信号と帯域ごとに比較され、スペクトル帯域の差分信号のエネルギーがオーディオ信号のエネルギーより大きいかどうかを判断する。差分信号のエネルギーがオーディオ信号のエネルギーより大きい場合、原オーディオ信号が第2のエンコーダに供給され、差分信号のエネルギーがオーディオ信号のエネルギーより小さい場合、差分信号が第2のエンコーダに供給される。この第2のエンコーダは、心理音響モデルを基に動作する変換エンコーダである。第1のエンコーダのビットストリームと同様に、第2のエンコーダの出力側のビットストリームも、ビットストリームマルチプレクサに与えられ、その出力側において、いわゆるスケーラブルな(拡張された)ビットストリームを供給する。ここで、スケーラビリティ(拡張性)とは、デコーダの設計を変更することにより、デコーダ側のビットストリームから第1のエンコーダのビットストリームのみを抽出、または第1のエンコーダのビットストリームと第2のエンコーダのビットストリームの両方を抽出できることを意味する。第1のエンコーダのビットストリームのみを抽出する第1のケースでは、質的に劣る原オーディオ信号の複製を、また、両方のビットストリームを抽出する第2のケースでは、高品質な原オーディオ信号の複製を取得する。
典型的な変換型エンコーダを図4(a)に示す。オーディオ信号は、分析フィルタバンク400に送られる。この分析フィルタバンクは、入力時に、ブロック化および窓かけをそれぞれ行い、サンプル値のストリームからある特定数のオーディオ信号のサンプルを有する1つのブロックを形成し、このブロックをスペクトル表現に変換する。分析フィルタバンクの出力時に生成されるスペクトル係数とサブバンド信号はそれぞれ、量子化される。量子化ステップ幅は、さまざまな要因によって変わるが、中でも重要なのは、原オーディオ信号から、心理音響モデル402によって算出される心理音響マスキング閾値である。「量子化および符号化404」ブロックの量子化器は、常に、できるだけ粗く量子化を行い、大量圧縮を行うようになっている。その反面、周知のとおり、量子化器は、量子化によって発生する量子化ノイズがブロック402によって与えられた心理音響マスキング閾値を下回るように、できるだけ細かく量子化を行うようにもなっている。このように量子化されたスペクトル値は、次に、エントロピー符号化にかけられるが、一般的にエントロピー符号化としてハフマン符号化が用いられ、通常、既定のハフマンコードブックおよびハフマンコードテーブルをそれぞれ用いて操作する。次に、エントロピー符号化された量子化スペクトル値は、ブロック404の出力に供給され、ブロック406を介して、復号化に必要なサイド情報と共に、ビットストリーム408に書き換えられる。このビットストリームは、適用分野により、格納されたり、または伝送チャネルを通って図4(b)に示すデコーダに送信される。まず、デコーダは、ビットストリームを読み出し、ビットストリームから、一方でサイド情報、もう一方でエントロピー符号化された量子化スペクトル値を抽出するブロック410を備える。次に、エントロピー符号化された量子化スペクトル値は、最初にエントロピー復号化へ送られ、次に逆量子化に送られ、逆量子化されたスペクトル値を取得し(ブロック412)、このスペクトル値は次に分析フィルタバンク400に適応する合成フィルタバンク414を介して送られ、出力側で時間離散型復号化オーディオ信号を取得する。この合成フィルタバンクの出力側の時間離散型オーディオ信号は、内挿法およびデジタル/アナログ変換、必要ならば、増幅を適宜行った後に、ラウドスピーカーに送ることもでき、これによって聴取可能になる。
図4の(a)および(b)に示す、周知のシナリオに用いられているように、ブロック化ベースのエンコーダ/デコーダは、複数のサンプルからなる1つのブロック、例えば、周知のMDCT(変形離散コサイン変換)で重複加算(Overlap and Add)法を用いた、オーディオ信号の1024個および2048個の時間離散サンプルからなるブロックがスペクトル域に変換されるという事実に基づいている。たとえ、64チャネルのSBRフィルタバンクのような、周波数分解の少ないフィルタバンクを用いる場合でも、ある一定数のサンプルを有するブロックであれば、常に用いて、スペクトル表現に変換される。つまり、ここでは個別のサブバンド信号である。以上、説明したように、周知の方法で心理音響マスキング閾値を算出する心理音響モデルを通常利用して、スペクトル表現が量子化される。
このような変換は、それぞれ固有に、ある特定の時間/周波数分解能を有する。つまり、1つのブロックに多数のサンプルが挿入されている場合、このブロックに適用される変換は固有に高い周波数分解能を有することを意味する。ただし、それにともなって時間分解能は低下する。オーディオ信号の短い部分がスペクトル域に変換されて時間分解能が上昇したとすると、これに伴って周波数分解は低下することになる。
したがって、問題となるのは、オーディオ信号の定常期が非常に短いとしか考えられないことである。確かに、オーディオ信号が定常でない間、過渡と呼ばれる短期間の強いエネルギー増加がみられる。
この時間/周波数分解能の問題に対処するために、過渡検出器により制御されるブロック切り替えが、例えば、AACエンコーダ(AAC=advanced audio coding)に用いられている。ここで、符号化されるオーディオ信号は、窓掛けおよびブロック処理をそれぞれ行う前に調べられ、オーディオ信号が過渡を有するか否かを判断される。過渡があると判断されると、短いブロックを用いて符号化が行われる。しかし、過渡のない信号部分が検出されると、長いブロック長が用いられる。このように、前記一般的な変換符号化方法では、ブロック切り替えを用いて、変換長を信号に適応させる。特に、低いビットレートを得ることになっている場合、ページ情報と役に立つ情報の比率は、通常、ブロック長とは比較的無関係なので、非常に長い変換長を使用するのが好ましい。これは、ブロックがオーディオ信号の多数の時間サンプルを表しているかどうか、またはブロックが短い、つまり少数のサンプルを表しているかどうかという事実とは関係なく、ページ情報の量はほぼ同じであるということを意味する。したがって、符号化効率を上げるために、できるだけ長いブロック長と、長い変換長をそれぞれ変換エンコーダで用いるようにする。
一方、過渡を検出し、オーディオ信号の非定常領域が現れたとき短い窓に切り替えるために、ある種の処理労力を要することは仕方ないが、それでもなお、その符号化形式の信号が、良好な周波数分解能のみ、または良好な時間分解能のみを有するという事実に変わりはない。
欧州特許番号EP0846375(B1)
本発明の目的は、高品質、なおかつ効率的にオーディオ符号化/復号化を行う符号化および復号化を改善する概念を提供することである。
この目的は、請求項1によるオーディオ信号を符号化する装置、請求項7によるオーディオ信号を符号化する方法、請求項8による符号化されたオーディオ信号を復号化する装置、請求項9による符号化されたオーディオ信号を復号化する方法、または請求項10によるコンピュータプログラムによって達成される。
本発明は、スケーラビリティ概念という意味で、第1のエンコーダが第1の時間/周波数分解を有し、第2のエンコーダが前記第1の時間/周波数分解とは互いに異なる第2の時間/周波数分解能を有し、これにより前記第1のエンコーダがある特定の分解能で原オーディオ信号を符号化し、次に前記第2のエンコーダが時間および周波数の点でそれぞれ異なるある特定の分解能で動作し、これにより2つのデータストリームを取得し、この2つのデータストリームを一緒に考慮すると、良好な時間分解能および良好な周波数分解能の両方を表すこととなり、良好な周波数分解能および良好な時間分解能の両方を備える良好な符号化品質を達成することができるという認識に基づいている。
また、第2のエンコーダに原オーディオ信号は送られず、原オーディオ信号と第1のエンコーダ/デコーダで符号化および再復号化された結果との差が送られる。第1のエンコーダで生じた分解能誤差は、差の形成等により取得される残差信号に自動的に現れる。例えば、第1のエンコーダ/デコーダ経路の時間分解能が不良である場合、この残差信号には通常誤差がでる。逆に、第1のエンコーダ/デコーダ経路の周波数分解能は良好なはずなので、残差信号が各周波数誤差を有することはまずない。したがって、高い時間分解能を有するエンコーダ(したがって、各周波数分解能は不良)を用いて残差信号を簡単に符号化することができ、第2の符号化出力信号として、時間分解能は良好だが周波数分解能は不良な信号を得ることができる。しかし、周波数分解能が不良であっても問題にはならない。というのも、第1のエンコーダ出力信号は、既に良好な周波数分解能を有しており、これにより、オーディオ信号の周波数ごとに考慮された構造をうまく再生するからである。
本発明の好適な実施形態において、第1のエンコーダと第2のエンコーダは、ともに変換エンコーダである。さらに、第1のエンコーダを高い周波数分解能(したがって、時間分解能は不良)、つまり高い変換長で動作させ、第2のエンコーダを高い時間分解能(したがって、周波数分解能は不良)で動作させることが好ましい。
本発明によると、時間領域のアーティファクト、つまり時間分解能が悪いために生じるアーティファクトの方が、周波数領域のアーティファクト、つまり周波数分解能が悪いために生じるアーティファクトよりも、多くの場合容認されるという事実がわかった。したがって、第1のエンコーダを高い周波数分解能で動作させることが好ましい。その理由は、各デコーダからの第1のエンコーダ出力信号だけでも、スケーラビリティの概念に準ずるかなり良好なオーディオ出力を取得するのに十分だからである。
本発明によると、第1のエンコーダ/デコーダ経路の出力信号と原オーディオ信号の差を形成し、その結果として得られる残差信号を、良好な時間分解能を有する第2のエンコーダで符号化することにより、第1のエンコーダ方法の品質は、第2のエンコーダによって向上される。この符号化方法は、特に残差信号に都合がよい。その理由は、第1の符号化方法によって、音色成分が既に非常に良好に、かつ効率的に取り込まれているので、残差信号には音色成分がもうほとんど含まれていないからである。
しかしながら、この残差信号の重大な欠点は、過渡現象の前後に発生するノイズ、つまりプレエコーまたはポストエコーの発生時に現れる不良時間分解能である。プレエコーは被験者にとって容易に検出できるので、ポストエコーより煩わしい。いわば、このノイズは、過渡現象の量子化ノイズであり、そのスペクトル内容においては主に過渡現象の一つに相当し、音色ではない。したがって、短いブロック、つまり高い時間分解能で変換符号化方法を用いることにより、時間分解能は、効率的なかたちで、かなり向上する。
このように、本発明によると、オーディオ信号の音色部分、またはどちらかというと音色的な部分を、長い変換長を有する周波数選択型変換符号化方法を用いて検出する一方で、短い変換長を用いるダウンストリーム符号化方法によって残差信号の時間分解能を高くし、高品質および最高品質を備えるオーディオ符号化方法を得られる。
下記に、本発明の好適な実施形態について、添付の図面を参照して詳細に説明する。
図1は、オーディオ信号の符号化装置を示し、オーディオ信号が入力10を介して供給されている。まず、このオーディオ信号は、第1の時間/周波数分解能を有する第1のエンコーダ12に与えられる。第1のエンコーダ12は、出力14において、第1のエンコーダ出力信号を生成するよう構成されている。第1のエンコーダ12の出力14における第1のエンコーダ出力信号は、一方でマルチプレクサ16へ、またもう一方でデコーダ18へ送られる。このデコーダは、第1のエンコーダと適合しており、第1のエンコーダ出力信号を復号し、復号化されたオーディオ信号をデコーダ18の出力20に供給する。復号化された出力信号20は、原オーディオ信号10と共に比較器22に送られる。比較器22は、入力10のオーディオ信号と、復号化オーディオ信号、つまり第1のエンコーダ12およびデコーダ18を通過した出力20のオーディオ信号とを比較するよう構成されている。比較器22は特に、オーディオ信号と復号化オーディオ信号の差分からなる残差信号を出力24の1つにおいて供給するように構成されている。この残差信号24は、第2のエンコーダ26に送られる。ここで、比較器22の出力24における残差信号は符号化され、第2のエンコーダ出力信号の出力28に供給され、これもまたマルチプレクサ16に送られる。マルチプレクサ16は、第1のエンコーダ出力信号と第2のエンコーダ出力信号を結合し、この結合信号から符号化されたオーディオ信号を出力30において生成するよう構成されている。必要ならば、対応するサイド情報およびビットストリーム構文規則を考慮する。
本発明によると、第1のエンコーダは第1の時間分解能または第1の周波数分解能を有し、第2のエンコーダは第2の時間分解能または第2の周波数分解能を有する。本発明によると、第1のエンコーダ出力信号は、時間または周波数について良好に符号化され、第2のエンコーダ出力信号が周波数または時間について良好に符号化されるように、第1のエンコーダの第1の分解能と第2のエンコーダの第2の分解能が異なっており、マルチプレクサ16の出力において符号化されたオーディオ信号が高い時間分解能および高い周波数分解能の両方を有するようになっている。
以下、本発明の好適な実施形態につき、図2を参照して説明する。ここで、オーディオ信号10は、図2において差装置として図示される比較器22に送られる前に、遅延装置32により遅延される。これにより、図2の好適な実施形態において、差装置22により、デコーダ18の出力における復号化されたオーディオ信号と遅延装置32の出力における(遅延された)オーディオ信号のサンプルごとの差をリアルタイムに設けることができる。
図2に示す実施形態において、さらに、第1のエンコーダ、つまり図2のエンコーダ12、および図2において差エンコーダと呼ばれる第2のエンコーダ26が、変換符号化を実行するように構成されている。
さらに、第1のエンコーダ12が、長い変換長、つまり高い周波数分解能かつ低い時間分解能を用いて符号化を行い、第2のエンコーダ26が、短い変換長、つまり高い時間分解能、およびこれに伴う低い周波数分解能を用いて符号化を行うのが好ましい。
原則として、第1のエンコーダも短い変換長で動作可能であるし、差エンコーダも長い変換長で動作可能であるが、既に説明したように、聴取者にとっては時間的なアーティファクトの方が周波数的なアーティファクトよりもあまり問題にならないため、第1のエンコーダが長い変換長で動作するほうが好ましい。このように、第1のエンコーダが長い変換長で動作し、次に第1のエンコーダが短い変換長で機能する場合、出力14の第1のエンコーダ出力信号を処理できるエンコーダが1つあれば、出力28の第2のエンコーダ出力信号を処理できなくとも、より好ましい複製を生成することができる。
図2の第1のエンコーダおよび/または第2のエンコーダ内で変換アルゴリズムとして、フーリエ変換、離散フーリエ変換、高速フーリエ変換、離散コサイン変換、変形離散コサイン変換など、時間サンプルのブロックをスペクトル表現に変換するあらゆる手段を用いることができる。また、64チャネルのフィルタバンク、128チャネルのフィルタバンク、またはそれらと大体同数のチャネルを有するフィルタバンクなど、チャネル数の少ないフィルタバンクを用いることもできる。
本発明の別の実施形態において、第1のエンコーダ12は、SBRエンコーダでもよい。このSBRエンコーダは、遮断周波数以下の情報のみからなる第1のエンコーダ出力信号を供給するよう構成されており、この遮断周波数は、オーディオ入力10におけるオーディオ信号の遮断周波数より小さい。代表的なSBRエンコーダは、SBRデコーダで高い周波数を再構成するために利用できるサイド情報をオーディオ信号から取り出して、第1のエンコーダ出力信号の遮断周波数を超えるオーディオ信号の高い帯域を、できる限り高品質で再構成する。しかしながら、図2のデコーダ18は、そのような高周波数を再構成するSBRデコーダではなく、第1のエンコーダ12に適合する一般的な変換デコーダである。この変換デコーダは、同帯域が制限されるという事実に関係なく、単にエンコーダ出力信号を復号化し、出力20におけるデコーダ18の出力信号も原オーディオ信号よりも低い遮断周波数を有するようにする。
その場合、残差信号は、遮断周波数以下ではエンコーダ12およびデコーダ経路のエンコーダ/デコーダ誤差を含むこととなるが、遮断周波数以上では完璧なオーディオ信号になる。
その場合、この残差信号は、第1のエンコーダ出力信号の遮断周波数以上では原オーディオ信号に相当するので、短い変換長を用いる差エンコーダ26によっても符号化することもできる。一方ではしかし、第1のエンコーダ出力信号の遮断周波数以下の残差信号のスペクトル域だけが差エンコーダ26によって符号化されるので、オーディオ信号の高周波部分でも高い周波数分解能を得るためには、長い変換長を有する第1のエンコーダ12によって残差信号の高周波部分を再び符号化しなければならない。
エンコーダ12の出力信号の高周波帯域については、原オーディオ信号のそれぞれの帯域と再び比較され、その差信号を再び差エンコーダ26で符号化し、4つのデータストリームがマルチプレクサ16に送られる。そこで、この4つのデータストリームが合わせて復号化され、トランスペアレントな(符号化されたことがわからない)複製、つまり、アーティファクトのない複製が可能となる。
本発明によると、第1のエンコーダと第2のエンコーダの両方が心理音響モデルを利用して動作することは重要でない。しかしながら、データ効率を高めるために、少なくとも第1のエンコーダ12が心理音響モデルを利用して動作することが好ましい。リソースによっては、第2のエンコーダでも損失なく符号化を行うことができ、各伝送チャネルリソースがあれば、完全にトランスペアレントな複製を達成できる。また、第2のエンコーダも心理音響モデルを用いて動作することができる。その場合、第2のエンコーダ用に再度心理音響モデルを完全に演算することはせず、第2のエンコーダに対する第1のエンコーダの各種変換長を考慮して、心理音響モデルの少なくとも数箇所と全心理音響マスキング閾値をそれぞれ「再利用」できることが好ましい。例えば、これは、第1のエンコーダが、第2のエンコーダ用に心理音響マスキング閾値を即時演算することにより行われる。ただし、第2のエンコーダが短い変換長を用いることを考慮して、例えば「保障分」として仮に3dBを用い、第2のエンコーダ用の心理音響マスキング閾値が、第1のエンコーダ12の心理音響マスキング閾値より、例えば3dB、または他の所定値だけ小さくなるようにする。
変換長に関し、第1のエンコーダの変換長は、第2のエンコーダの変換長の整数倍数であることが好ましい。そうすると、第1のエンコーダの変換長は、第2のエンコーダ26の変換長よりも、例えば2倍、3倍、4倍、または5倍多いオーディオ信号のサンプルからなる可能性がある。したがって、この第1のエンコーダの変換長と第2のエンコーダの変換長が整数関係にあるのは好ましいことであり、これにより第1のエンコーダのエンコーダデータを第2のエンコーダ用として比較的良好に再利用することが可能になる。しかし、変換長の関係が整数でなくてもそれほど問題ではない。その理由は、変換長がデコーダに報告されてデコーダが正しいサンプルの合計を出している間、つまり、図2の素子22においてサンプルごとの差の逆数を生成している間、第1のエンコーダ12と第2のエンコーダ26は互いに同期して作動することはできないからである。
図3は、本発明により、符号化されたオーディオ信号を復号化するデコーダを示す。図1および図2それぞれの出力30で出力された符号化オーディオ信号は、送信、格納等を経て、図3に示すデコーダの入力40に送られる。入力40はまず、ビットストリームデマルチプレクサの機能を有する抽出器42に連結し、最初に第1のエンコーダ出力信号を符号化オーディオ信号から抽出して出力44に供給する。また更にこの抽出器42は、各符号化された残差信号と差信号、また第2の符号化オーディオ信号を出力46に供給するよう構成されている。第1のエンコーダ出力信号は、図1に示す本発明の符号化装置である第1のエンコーダ12に適合し、また基本的には図1のデコーダ18と同一である第1のデコーダに送られる。これは、第1のデコーダ48は、再度同じ時間/周波数分解能を有する、つまり、例えば図1のエンコーダ12と同じ変換長で動作することを意味する。抽出器の出力46の第2のエンコーダ出力信号は、図1の第2のエンコーダ26に適合し、第2の時間/周波数分解能を有する第2のデコーダ50に送られる。この第2の時間/周波数分解能は、図1に示す第2のエンコーダ26の時間/周波数分解能と同じである。
出力側では、第1のエンコーダ48が、図2の出力20の信号と同一であるはずの復号化されたオーディオ信号を供給する。同様に、第2のデコーダ50は、出力側で復号化された残差信号を供給する。両デコーダは原則的に、図4bを参照して例示されているように形成することが出来るが、両デコーダの変換長およびこれにともない使用される合成フィルタバンクについては異なる可能性があることに留意されたい。
図3の出力52の復号化されたオーディオ信号と図3の出力54の復号化された残差信号は共に結合器56に送られ、そこで本発明の好適な実施形態におけるサンプルごとの合算を実行する。これは、一般的に、図1の素子22のエンコーダが行った比較動作とは逆の動作である。出力側において、結合器56は図3のデコーダ装置の出力58に出力信号を供給する。この出力信号は、良好な時間分解能および良好な周波数分解能の両方を用いる本発明によって、卓越した信号、つまり周波数的アーティファクトおよび時間的アーティファクトがほとんどない信号である。
状況により、図1に関連して例示されるような本発明の符号化方法、または図3に関連して例示されるような本発明の復号化方法は、ハードウェアまたはソフトウェアで実行可能である。この各方法が実行できるようにプログラム制御できるコンピュータシステムと対話できるデジタル記憶媒体、特に、電子的に読み取り可能な制御信号を備えるディスクまたはCDにおいて、この方法を実行することができる。このように、本発明は、コンピュータ上でコンピュータプログラム製品が動作する際に、本発明を実行するために、一般的に機械読み取りキャリアに格納されたプログラムコードを備えたコンピュータプログラム製品である。言い換えると、本発明は、コンピュータプログラムがコンピュータ上で動作する際に、本方法を実行するプログラムコードを備えるコンピュータプログラムとして実現することも可能である。
本発明の符号化概念のブロック図である。 本発明の好適な実施形態による本発明の符号化概念のブロック図である。 本発明のデコーダの概念を示すブロック図である。 (a)は、従来の変換エンコーダであり、(b)は、従来の変換デコーダである。

Claims (10)

  1. オーディオ信号から第1のエンコーダ出力信号を生成する第1の変換エンコーダ(12)であり、前記オーディオ信号の第1の時間サンプル数を有するブロックをスペクトル表現に変換し、前記第1のエンコーダ出力信号を取得する前記第1の変換エンコーダ(12)と、
    前記第1のエンコーダ(12)に適合し、前記第1のエンコーダ出力信号を復号化して復号化オーディオ信号を供給するデコーダ(18)と、
    前記オーディオ信号と前記復号化オーディオ信号を比較し、前記オーディオ信号と前記復号化オーディオ信号の差からなる残差信号を供給する比較器(22)と、
    前記残差信号を符号化して第2のエンコーダ出力信号を供給し、前記第2のエンコーダ出力信号を取得するために、前記オーディオ信号の第2の時間サンプル数を有するブロックをスペクトル表現に変換する第2の変換エンコーダ(26)であり、前記オーディオ信号の第1の時間サンプル数が前記オーディオ信号の第2の時間サンプル数より多く、前記第1のエンコーダ(12)が低い時間分解能と高い周波数分解能を有し、前記第2のエンコーダ(26)が高い時間分解能と低い周波数分解能を有するように、前記第1の変換エンコーダおよび前記第2の変換エンコーダが適応させられている、第2の変換エンコーダ(26)と、
    前記第1のエンコーダ出力信号と前記第2のエンコーダ出力信号を結合させて符号化オーディオ信号を取得するマルチプレクサ(16)と、を備えるオーディオ信号符号化装置。
  2. 前記第1のエンコーダ(12)と前記第2のエンコーダ(26)がフィルタバンク、またはフーリエ変換、離散フーリエ変換、高速フーリエ変換、離散コサイン変換または変形コサイン変換からなる変換アルゴリズムを有している、請求項1に記載のオーディオ信号符号化装置。
  3. 前記デコーダ(18)は、サンプルシーケンスを有する時間離散的に復号化されたオーディオ信号を供給し、
    前記オーディオ信号は、サンプルシーケンスを有する時間離散オーディオ信号であり、
    前記比較器(22)は、サンプルごとに差を形成して、前記残差信号を取得する、請求項1または請求項2に記載のオーディオ信号符号化装置。
  4. 前記オーディオ信号を遅延させる遅延装置(32)であり、前記第1のエンコーダ(12)および前記デコーダ(18)に関連する遅延に依存する遅延を有する遅延装置(32)を更に備える請求項1から3のいずれかに記載のオーディオ信号符号化装置。
  5. 前記マルチプレクサ(16)は、前記第1のエンコーダ出力信号が前記第2のエンコーダ出力信号とは関係なく復号化できるように符号化オーディオ信号を生成する、請求項1から4のいずれかに記載のオーディオ信号符号化装置。
  6. 前記第1のエンコーダ(12)は、前記第1のエンコーダ出力信号の遮断周波数の上限が前記オーディオ信号の遮断周波数の上限より低くなるように、前記オーディオ信号に帯域制限をかけ、
    前記比較器(22)は、前記第1のエンコーダ出力信号の遮断周波数の上限を上回るオーディオ信号に相当する残差信号を供給し、前記第2のエンコーダ(26)は、第1のエンコーダの遮断周波数の上限を上回る前記残差信号の一部を、第2の分解能と不等もしくは同等である時間分解能または周波数分解能で符号化する、請求項1から5のいずれかに記載のオーディオ信号符号化装置。
  7. オーディオ信号から第1の時間分解能または第1の周波数分解能で第1の出力信号を生成する工程(12)であり、前記オーディオ信号の第1の時間サンプル数を有するブロックをスペクトル表現に変換して第1の出力信号を取得する工程を含む前記生成工程(12)と、
    復号化オーディオ信号を供給するために、前記第1のエンコーダ出力信号を復号化する工程と、
    前記オーディオ信号と前記復号化オーディオ信号の差からなる残差信号を供給するために、前記オーディオ信号と前記復号化オーディオ信号を比較する工程(22)と、
    第2の出力信号を供給するために、前記残差信号を、第2の時間分解能または第2の周波数分解能で符号化し、オーディオ信号の第2の時間サンプル数を有するブロックをスペクトル表現に変換して第2の出力信号を取得する工程を含む符号化工程(26)であって、前記オーディオ信号の第1の時間サンプル数が前記オーディオ信号の第2の時間サンプル数より多く、前記第1の出力信号が低い時間分解能と高い周波数分解能を有し、前記第2の出力信号が高い時間分解能と低い周波数分解能を有するように、前記生成工程(12)と前記符号化工程(26)が適応させられている、符号化工程(26)と、
    符号化オーディオ信号を取得するために、前記第1のエンコーダ出力信号と前記第2のエンコーダ出力信号を結合する工程(16)と、を備えるオーディオ信号符号化方法。
  8. 出力信号を取得するために符号化されたオーディオ信号の復号化装置であり、前記符号化オーディオ信号は、高い時間分解能と低い周波数分解能で符号化された第1のエンコーダ出力信号を有し、前記符号化オーディオ信号はさらに、高い時間分解能と低い周波数分解能で符号化され、原オーディオ信号と復号化オーディオ信号の差を表す残差信号である第2のエンコーダ出力信号を有し、前記第1のエンコーダ出力信号を復号化することによって復号化オーディオ信号を取得することができ、前記第1のエンコーダ出力信号は、第1の変換エンコーダを用いて生成されており、前記第1の変換エンコーダはオーディオ信号の時間サンプル数が多いブロックをスペクトル表現に変換して前記第1のエンコーダ出力信号を取得し、前記第2のエンコーダ出力信号は第2の変換エンコーダを用いて生成されており、前記第2の変換エンコーダは、前記オーディオ信号の時間サンプル数が少ないブロックをスペクトル表現に変換して前記第2のエンコーダ出力信号を取得し、
    前記符号化オーディオ信号から前記第1のエンコーダ出力信号および前記第2のエンコーダ出力信号を抽出する抽出器(42)と、
    前記第1の変換エンコーダに適合し、前記第1のエンコーダ出力信号を復号化して前記復号化オーディオ信号を取得する第1の変換デコーダ(48)であり、低い時間分解能および高い周波数分解能で動作し、第1の数のスペクトル値を有するブロックを時間表現に変換する第1の変換デコーダ(48)と、
    前記第2の変換エンコーダに適合しており、前記第2のエンコーダ出力信号を復号化して復号化された残差信号を取得する第2の変換デコーダ(50)であり、高い時間分解能および低い周波数分解能で動作し、前記第1の数より少ない第2の数のスペクトル値を有するブロックを時間表現に変換する第2の変換デコーダ(50)と、
    前記復号化オーディオ信号および前記復号化残差信号を結合して出力信号を取得する結合器(56)と、を備える符号化オーディオ信号の復号化装置。
  9. 出力信号を取得するために符号化されたオーディオ信号の復号化装置であり、前記符号化オーディオ信号は、高い時間分解能と低い周波数分解能で符号化された第1のエンコーダ出力信号を有し、前記符号化オーディオ信号はさらに、高い時間分解能と低い周波数分解能で符号化され、原オーディオ信号と復号化オーディオ信号の差を表す残差信号である第2のエンコーダ出力信号を有し、前記第1のエンコーダ出力信号を復号化することによって復号化オーディオ信号を取得することができ、前記第1のエンコーダ出力信号は、第1の変換エンコーダを用いて生成されており、前記第1の変換エンコーダはオーディオ信号の時間サンプル数が多いブロックをスペクトル表現に変換して前記第1のエンコーダ出力信号を取得し、前記第2のエンコーダ出力信号は第2の変換エンコーダを用いて生成されており、前記第2の変換エンコーダは、前記オーディオ信号の時間サンプル数が少ないブロックをスペクトル表現に変換して前記第2のエンコーダ出力信号を取得する、前記方法は、
    前記符号化オーディオ信号から前記第1のエンコーダ出力信号および前記第2のエンコーダ出力信号を抽出する工程(42)と、
    前記第1の変換エンコーダに適合し、前記復号化オーディオ信号を取得するために前記第1のエンコーダ出力信号を復号化する工程(48)であり、低い時間分解能および高い周波数分解能で動作し、第1の数のスペクトル値を有するブロックを時間表現に変換する復号化工程(48)と、
    前記第2の変換エンコーダに適合し、前記復号化残差信号を取得するために前記第2のエンコーダ出力信号を復号化する工程(50)であり、高い時間分解能と低い周波数分解能で動作し、前記第1の数よりも小さい第2の数のスペクトル値を有するブロックを時間表現に変換する復号化工程(50)と、
    出力信号を取得するために、前記復号化オーディオ信号および前記復号化残差信号を結合する工程(56)と、を備える、復号化オーディオ信号の復号化装置。
  10. コンピュータ上でプログラムを動作させる際に、請求項7または9による方法を実行するためのプログラムコードを有するコンピュータプログラム。
JP2006516049A 2003-06-25 2004-06-24 オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法 Pending JP2009513992A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10328777A DE10328777A1 (de) 2003-06-25 2003-06-25 Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
PCT/EP2004/006850 WO2005001813A1 (en) 2003-06-25 2004-06-24 Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal

Publications (1)

Publication Number Publication Date
JP2009513992A true JP2009513992A (ja) 2009-04-02

Family

ID=33546670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006516049A Pending JP2009513992A (ja) 2003-06-25 2004-06-24 オーディオ信号を符号化する装置と方法および符号化されたオーディオ信号を復号化する装置と方法

Country Status (7)

Country Link
US (1) US7275031B2 (ja)
EP (1) EP1636791B1 (ja)
JP (1) JP2009513992A (ja)
CN (1) CN1809872B (ja)
DE (2) DE10328777A1 (ja)
HK (1) HK1083664A1 (ja)
WO (1) WO2005001813A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098759A (ja) * 2005-06-17 2012-05-24 Dts (Bvi) Ltd スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7539870B2 (en) * 2004-02-10 2009-05-26 Microsoft Corporation Media watermarking by biasing randomized statistics
RU2393552C2 (ru) * 2004-09-17 2010-06-27 Конинклейке Филипс Электроникс Н.В. Комбинированное аудиокодирование, минимизирующее воспринимаемое искажение
EP1851866B1 (en) 2005-02-23 2011-08-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive bit allocation for multi-channel audio encoding
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US8321230B2 (en) 2006-02-06 2012-11-27 France Telecom Method and device for the hierarchical coding of a source audio signal and corresponding decoding method and device, programs and signals
EP1855271A1 (en) * 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for re-encoding signals
GB2443911A (en) * 2006-11-06 2008-05-21 Matsushita Electric Ind Co Ltd Reducing power consumption in digital broadcast receivers
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
EP2143101B1 (en) * 2007-03-30 2020-03-11 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
RU2474887C2 (ru) * 2007-10-17 2013-02-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудиокодирование с использованием повышающего микширования
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
CN101527138B (zh) * 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
EP2139000B1 (en) * 2008-06-25 2011-05-25 Thomson Licensing Method and apparatus for encoding or decoding a speech and/or non-speech audio input signal
KR101456641B1 (ko) * 2008-07-11 2014-11-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더 및 오디오 디코더
KR101670063B1 (ko) * 2008-09-18 2016-10-28 한국전자통신연구원 Mdct 기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치
CN101729198B (zh) * 2008-10-27 2014-04-02 华为技术有限公司 一种编解码方法、装置及系统
RU2523035C2 (ru) * 2008-12-15 2014-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудио кодер и декодер, увеличивающий полосу частот
HUE064653T2 (hu) 2008-12-15 2024-04-28 Fraunhofer Ges Forschung Audió sávszélesség kiterjesztés dekódoló, megfelelõ eljárás és számítógépi program
PL4152320T3 (pl) * 2009-10-21 2024-02-19 Dolby International Ab Nadpróbkowanie w banku filtrów połączonym z modułem transpozycji
AU2010332925B2 (en) 2009-12-16 2013-07-11 Dolby International Ab SBR bitstream parameter downmix
WO2011087061A1 (ja) 2010-01-15 2011-07-21 三菱化学株式会社 単結晶基板、それを用いて得られるiii族窒化物結晶及びiii族窒化物結晶の製造方法
CN102263771B (zh) * 2010-05-26 2014-03-19 中国移动通信集团公司 移动终端、适配器及多媒体数据的播放方法和系统
CN105244035B (zh) 2010-07-02 2019-03-12 杜比国际公司 选择性低音后置滤波器
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
EP2688066A1 (en) * 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
CN116741187A (zh) 2013-04-05 2023-09-12 杜比国际公司 立体声音频编码器和解码器
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
WO2019089341A1 (en) * 2017-11-02 2019-05-09 Bose Corporation Low latency audio distribution
CN111444382B (zh) * 2020-03-30 2021-08-17 腾讯科技(深圳)有限公司 一种音频处理方法、装置、计算机设备以及存储介质
CN112104952B (zh) * 2020-11-19 2021-05-11 首望体验科技文化有限公司 应用于720度球幕全景影院的全景声音频系统
US20220276094A1 (en) * 2021-03-01 2022-09-01 The Boeing Company Combined magnitude and phase spectrograms
EP4303872A1 (de) * 2022-07-07 2024-01-10 Technische Universität München Kodierungsvorrichtung und kodierungsverfahren zur mehrkanalkodierung von vibrotaktilen signalen sowie dekodierung und dekodierungsverfahren

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143735A (ja) * 1988-11-25 1990-06-01 Victor Co Of Japan Ltd 音声多段符号化伝送方式
JPH07261799A (ja) * 1994-03-18 1995-10-13 Pioneer Electron Corp 直交変換符号化装置及び方法
JPH07273665A (ja) * 1994-04-01 1995-10-20 Sony Corp データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JP2001519552A (ja) * 1997-10-02 2001-10-23 シーメンス アクチエンゲゼルシヤフト ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
JP2001318684A (ja) * 2000-05-08 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 楽音符号化方法および楽音復号化方法およびこれらの方法を実行するプログラムを記録した記録媒体

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5732391A (en) * 1994-03-09 1998-03-24 Motorola, Inc. Method and apparatus of reducing processing steps in an audio compression system using psychoacoustic parameters
DE19549621B4 (de) * 1995-10-06 2004-07-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Codieren von Audiosignalen
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
US6092041A (en) * 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
CN1322347A (zh) * 1999-09-20 2001-11-14 皇家菲利浦电子有限公司 校正音频信号的处理电路、接收机、通信系统、移动设备及其方法
US6377916B1 (en) * 1999-11-29 2002-04-23 Digital Voice Systems, Inc. Multiband harmonic transform coder
US7171355B1 (en) * 2000-10-25 2007-01-30 Broadcom Corporation Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
DE10102159C2 (de) * 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02143735A (ja) * 1988-11-25 1990-06-01 Victor Co Of Japan Ltd 音声多段符号化伝送方式
JPH07261799A (ja) * 1994-03-18 1995-10-13 Pioneer Electron Corp 直交変換符号化装置及び方法
JPH07273665A (ja) * 1994-04-01 1995-10-20 Sony Corp データ圧縮符号化方法、データ圧縮符号化装置及びデータ記録媒体
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JP2001519552A (ja) * 1997-10-02 2001-10-23 シーメンス アクチエンゲゼルシヤフト ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
JP2001318684A (ja) * 2000-05-08 2001-11-16 Nippon Telegr & Teleph Corp <Ntt> 楽音符号化方法および楽音復号化方法およびこれらの方法を実行するプログラムを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012098759A (ja) * 2005-06-17 2012-05-24 Dts (Bvi) Ltd スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック

Also Published As

Publication number Publication date
WO2005001813A1 (en) 2005-01-06
US7275031B2 (en) 2007-09-25
US20060167683A1 (en) 2006-07-27
CN1809872B (zh) 2010-06-02
EP1636791B1 (en) 2007-03-07
DE10328777A1 (de) 2005-01-27
DE602004005197T2 (de) 2007-06-28
EP1636791A1 (en) 2006-03-22
DE602004005197D1 (de) 2007-04-19
HK1083664A1 (en) 2006-07-07
CN1809872A (zh) 2006-07-26

Similar Documents

Publication Publication Date Title
US7275031B2 (en) Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
KR100608062B1 (ko) 오디오 데이터의 고주파수 복원 방법 및 그 장치
JP6208725B2 (ja) 帯域幅拡張復号化装置
JP5302980B2 (ja) 複数の入力データストリームのミキシングのための装置
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
KR20080005325A (ko) 적응적 부호화/복호화 방법 및 장치
TWI390502B (zh) 編碼信號之處理方法
CA2489443C (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR20230020553A (ko) 스테레오 오디오 인코더 및 디코더
KR102649124B1 (ko) 후처리 지연을 저감시킨 고주파 재구성 기술의 통합
KR102622804B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
KR100378796B1 (ko) 디지탈 오디오 부호화기 및 복호화 방법
JP2003523535A (ja) 複数のデータ圧縮フォーマット間でのオーディオ信号の変換方法及び装置
KR20050027179A (ko) 오디오 데이터 복원 방법 및 그 장치
US20070071277A1 (en) Apparatus and method for embedding a watermark using sub-band filtering
JP2006293400A (ja) 符号化装置および復号化装置
AU2012202581B2 (en) Mixing of input data streams and generation of an output data stream therefrom
IL216068A (en) An audio broadcast system that uses decoded signal properties to coordinate synthesized spectral components

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090825

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091116

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091214

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091221

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100114

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100121

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100219

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100406