JP2016527557A - 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム - Google Patents

符号化オーディオ信号の復号装置、方法およびコンピュータプログラム Download PDF

Info

Publication number
JP2016527557A
JP2016527557A JP2016528417A JP2016528417A JP2016527557A JP 2016527557 A JP2016527557 A JP 2016527557A JP 2016528417 A JP2016528417 A JP 2016528417A JP 2016528417 A JP2016528417 A JP 2016528417A JP 2016527557 A JP2016527557 A JP 2016527557A
Authority
JP
Japan
Prior art keywords
frequency
signal
spectral
spectrum
tile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016528417A
Other languages
English (en)
Other versions
JP6400702B2 (ja
JP2016527557A5 (ja
Inventor
ディッシュ,ザッシャ
ガイガー,ラルフ
ヘルムリッヒ,クリスティアン
ナゲル,フレデリク
ノイカム,クリスティアン
シュミット,コンスタンティン
フィッシャー,ミヒャエル
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2016527557A publication Critical patent/JP2016527557A/ja
Publication of JP2016527557A5 publication Critical patent/JP2016527557A5/ja
Application granted granted Critical
Publication of JP6400702B2 publication Critical patent/JP6400702B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Abstract

【課題】【解決手段】 符号化コア信号とパラメトリックデータとを含む符号化オーディオ信号を復号する復号装置であり、符号化コア信号を復号して復号化コア信号を得るコアデコーダ(600)と、周波数再生動作の前または後に復号化コア信号を解析して解析結果(603)を得るアナライザ(602)と、復号化コア信号のスペクトル部、パラメトリックデータ(605)および解析結果(603)を使用して、復号化コア信号に含まれないスペクトル部を再生成する周波数再生成器とを備える復号装置。【選択図】図6A

Description

本発明は、オーディオ符号化および復号化に関し、特に、IGF(Intelligent gap filling)を用いるオーディオ符号化に関する。
オーディオ符号化は信号圧縮の一分野であり、音響心理学の知識を用いて、オーディオ信号における冗長性および非関連性を利用する処理を行う。今日において、オーディオコーデックは、典型的には、ほぼ全ての種のオーディオ信号の知覚的に透明な符号化のために、チャネルあたり60kbps程度を要する。さらに新しいコーデックは、帯域幅拡張(BWE)などの技術を用いて、信号におけるスペクトルの類似性を活用して、符号化ビットレートの削減を試みている。あるBWEスキームにおいては、オーディオ信号の高周波数(HF)成分を示すよう設定された低ビットレートパラメータが用いられる。HFスペクトルは、低周波数(LF)域からのスペクトルコンテンツによって充足され、スペクトルの形状、傾きおよび時間的連続性が、オリジナル信号の音質および色彩を保つよう調整される。そのようなBWE手法によって、オーディオコーデックは、チャネルあたり24kbps程度の低ビットレートであっても、良好な品質を保つことができる。
独創的なオーディオ符号化システムは、広範囲のビットレートにより、任意のオーディオ信号を効率的に符号化する。ここで、高ビットレートにおいては、独創的なシステムは、透明性に集中する一方、低ビットレートにおいては、知覚的な不快感が最小限化される。したがって、利用可能なビットレートの主要な部分は、エンコーダにおいて、知覚的にもっとも適切な信号構造に波形符号化することに用いられる。そして、その結果としてのスペクトルギャップは、デコーダにおいて、元来のスペクトルに大まかに近接した信号コンテンツによって充填される。エンコーダからデコーダに対して送信される専用のサイド情報によって、相当に限られたビット配分のみが、パラメータ駆動されるいわゆるスペクトルインテリジェントギャップ充填(IGF)を制御するのに消費される。
オーディオ信号の蓄積または送信については、厳格なビットレート制限が適用されることがよくある。過去においては、極めて低ビットレートしか利用可能でない場合には、符号化する側において、強制的に、送信オーディオ帯域幅を大幅に低減させられていた。
今日における近代オーディオコーデックは、帯域幅拡張(BWE)法を用いて、広帯域信号を符号化できる(非特許文献1)。これらのアルゴリズムは、高周波数コンテンツ(HF)のパラメータ表現に依拠している。このパラメータ表現は、復号信号の波形符号化された低周波数部(LF)から、HFスペクトル領域に移転(「パッチング」)させて、パラメータ駆動の後処理を行うことにより、生成される。BWEスキームにおいては、所与のいわゆるクロスオーバー周波数の上へのHFスペクトル領域の再構築が、しばしば、スペクトルパッチングに基づいて行われる。一般的に、HF領域は、複数の近接パッチから構成され、これらのパッチのそれぞれは、所与のクロスオーバー周波数より下のLFスペクトルのバンドパス(BP)領域から供給される。最新のシステムは、例えば、近接するサブバンド係数一式をソースから対象領域にコピーすることによって、直交ミラーフィルタバンク(QMF)などのフィルタバンク表現内において、パッチングを効率的に実施する。
今日のオーディオコーデックに見られる、圧縮効率を向上させかつ低ビットレートでオーディオ帯域幅を拡張する別の技術としては、オーディオスペクトルの適宜な部分を、パラメータ駆動により合成置換する技術が挙げられる。例えば、オリジナルのオーディオ信号におけるノイズ様の信号部分は、デコーダ内で生成され副情報パラメータによりスケーリングされた人工ノイズによって、主観的品質を実質的に損なうことなく置換される。一例としては、MPEG−4アドバンストオーディオコーディング(AAC)に含まれる、知覚的ノイズ置換(PNS)ツールが挙げられる(非特許文献5)。
低ビットレートでオーディオ帯域幅を拡張する他の規定としては、MPEG−Dの音声音響統合符号化方式(USAC)に含まれる、ノイズ充填技術が挙げられる(非特許文献7)。粗すぎる量子化による量子化装置のデッドゾーンから推測されるスペクトルギャップ(ゼロ)は、デコーダにおける人工ノイズにより事後に充填され、パラメータによって決定される事後処理によってスケーリングされる。
別の最新システムは、精密スペクトル置換(ASR)と称される(非特許文献2−4)。波形コーデックに加えて、ASRは、専用の信号合成段階を採用し、この信号合成段階によって、信号内の知覚的に重要な正弦部分が、デコーダにより復元される。また、非特許文献5に記載のシステムは、波形符号器のHF領域における正弦モデリングに依拠して、低ビットレートでも相当の知覚品質を有する拡張オーディオ帯域幅を実現している。これらの方法は全て、変形離散コサイン変換(MDCT)とは別の第2領域へのデータ変換を含み、また、HF正弦成分の保存のためのかなり複雑な解析/合成段階を含む。
図13Aは、例えば、高効率アドバンストオーディオコーディング(HE−AAC)において使用されている帯域幅拡張技術用の、オーディオエンコーダの概略図である。ライン1300上のオーディオ信号は、ローパス1302およびハイパス1304からなるフィルタシステムに入力される。ハイパスフィルタ1304から出力された信号は、パラメータ抽出器/符号器1306に入力される。パラメータ抽出器/符号器1306は、例えば、スペクトル包絡線パラメータやノイズ付加パラメータ、欠落高調波パラメータ、逆フィルタリングパラメータなどのパラメータを計算し、符号化するよう構成される。これらの抽出パラメータは、ビットストリーム多重変換器1308に入力される。ローパス出力信号は、ダウンサンプラ1310およびコア符号器1312の機能を一般的に有する処理器に入力される。ローパス1302は、帯域幅を制限して、ライン1300上のオリジナル入力オーディオ信号よりも、相当に狭い帯域幅に符号化されるようにする。コア符号器において生じる全ての機能が、削減された帯域の信号上で機能すれば良いといという事実により、かなりの符号化利得が得られる。例えば、ライン1300上のオーディオ信号の帯域幅が20キロヘルツであり、かつローパスフィルタ1302が仮に4キロヘルツの帯域幅を有しているとすると、サンプリング定理を満たすためには、ダウンサンプラの後段の信号が8キロヘルツのサンプリング周波数を有することで理論上は十分であり、これは、オーディオ信号1300において必要となる少なくとも40キロヘルツのサンプリングレートの、実質的削減である。
図13Bは、対応する帯域幅拡張デコーダの概略図である。デコーダは、ビットストリーム多重変換器1320を有する。ビットストリーム多重分離器1320は、コアデコーダ1322用の入力信号、およびパラメトリックデコーダ1324用の入力信号を抽出する。コアデコーダ出力信号は、上述の例においては、8キロヘルツのサンプリングレートを有し、したがって、4キロヘルツの帯域幅を有する。一方、完全な帯域幅再構築のためには、高周波数再構築器1330の出力信号は、少なくとも40キロヘルツのサンプリングレートを要する20キロヘルツでなければならない。これを可能にするためには、デコーダ処理器が、アップサンプラ1325およびフィルタバンク1326の機能を有することが必要となる。そして高周波数再構築器1330は、フィルタバンク1326より出力され周波数解析された低周波数信号を受信して、図13Aのハイパスフィルタ1304によって定義された周波数範囲を、周波数帯域のパラメータ表現を用いて再構築する。高周波数再構築器1330は、低周波数範囲におけるソース範囲を利用して上位の周波数範囲を再生成したり、スペクトル包絡線を調整したり、ノイズを付与するなど、様々な機能を有している。また、高周波数再構築器1330には、欠落高調波を上位の周波数範囲に導入する機能や、図13Aの符号器において適用され算出された場合には逆フィルタを行い、高周波数範囲が一般的には低周波数範囲ほど音調がないという事実に対処する機能がある。HE−AACにおいては、デコーダ側において欠落高調波が再合成され、再構築帯域のちょうど真ん中に配置される。したがって、所定の再構築帯域において決定された全ての欠落高調波線は、オリジナル信号で配置されていた周波数値には配置されない。その代わりに、これらの欠落高調波線は、所定帯域の中心周波数に配置される。よって、オリジナル信号中の欠落高調波線が、オリジナル信号中の再構築帯域の境界に非常に近接して配置されると、この欠落高調波線を再構築信号において帯域の中心に配置することにより生じる周波数エラーは、個別の再構築帯域の50%近くになり、これについてパラメータが生成され送られる。
さらに、一般的なオーディオコア符号器は、スペクトル領域で機能するにも関わらず、コアデコーダはなお時間領域信号を生成し、この時間領域信号が、再びフィルタバンク1326機能によりスペクトル領域に変換される。これによって追加的な処理遅延が発生し、またまずスペクトル領域から周波数領域に変形し、そして一般的には再び異なる周波数領域へと変形する直列処理によって、アーティファクトが発生する恐れがある。もちろん、これによって、計算が相当程度複雑になり、相当量の電力が必要となる。この電力の問題は、帯域幅拡張技術が携帯電話やタブレット、ノートパソコンなどの携帯機器に適用された場合、特に問題となる。
現在のオーディオコーデックは、符号化スキームの不可分の一部として、BWEを用いて低ビットレートオーディオ符号化を実施する。しかしながら、BWE技術は、高周波数(HF)コンテンツのみを置換することに限定されている。さらに、BWE技術は、所定のクロスオーバー周波数より上の、知覚的に重要なコンテンツを、波形符号化することはできない。したがって、現代のオーディオコーデックは、信号の音の高調波の正確な配列がほとんどのシステムにおいて考慮されないため、BWEが実行されると、HFの詳細または音質のいずれかが喪失される。
BWEシステムの現代技術に関する別の課題としては、オーディオ信号を、BWEを実行するための新たな領域に変換する必要があることである(例:MDCTからQMF領域への変換)。これによって、同期性の煩雑化、追加的計算の煩雑性およびメモリ要件の増加などにつながる。
オーディオ信号の蓄積または送信については、厳格なビットレート制限が適用されることが多い。過去において、符号器は、相当な低ビットレートしか利用可能でない場合には、送信オーディオ帯域を徹底的に削減することを強制されていた。今日において、近代的なオーディオコーデックは、帯域幅拡張(BWE)方法を使って、広帯域信号を符号化することができる(非特許文献1,2)。これらのアルゴリズムは、HFスペクトル領域への転換(「パッチング」)およびパラメータ駆動の後処理によって復号信号の波形符号化された低周波数部分(LF)から生成される、高周波数コンテンツ(HF)のパラメータ表現に依存している。
BWEスキームにおいて、いわゆる所定のクロスオーバー周波数より上のHFスペクトル領域は、スペクトルパッチングに基づき再構築されることが多い。スペクトルギャップを充填する他のスキーム、例えばインテリジェントギャップ充填(IGF)は、隣接するいわゆるスペクトルタイルを使用して、オーディオ信号HFスペクトル部分を再生する。典型的に、HF領域は、複数の近接パッチから構成され、これらの各パッチは、所定のクロスオーバー周波数よりも下のLFスペクトルのバンドパス(BP)から供給される。従来のシステムは、近接するサブバンド係数のセットをソースから対象領域にコピーすることにより、フィルタバンク表現内において、効率的にパッチング、すなわちタイル張り、を実施する。ただし、信号コンテンツによっては、LF帯域と隣接するHF帯域内のパッチから再構成された信号の組合せが、ビーティング、不協和音と、および聴覚的粗さを引き起こすことがある。
そこで、特許文献1には、不協和音ガード帯域フィルタリングのコンセプトが、フィルタバンクを基礎とするBWEシステムの文脈で提示されている。LFとBWE再生されたHFとの間のクロスオーバー周波数で約1バーク帯域のノッチフィルタを有効に適用して、不協和音の可能性を除去し、スペクトルコンテンツをゼロまたは雑音に置き換えることが示唆されている。
しかし、特許文献1に提案された解法は、いくつかの欠点を有している。第一に、ゼロまたは雑音でスペクトルコンテンツの厳格な置き換えは、信号の知覚品質も損なう可能性がある。さらに、提案された処理は、信号適応的ではなく、そのため、ある場合には知覚品質を害する可能性がある。例えば、信号コンテンツが遷移する場合、これが、前または後エコーを引き起こす可能性がある。
第二に、不協和音はまた、連続的なHFパッチの間の遷移でも生じる可能性がある。特許文献1で提案された解決策は、単に機能的に、LFとBWE再生されたHFとの間のクロスオーバー周波数で発生する不協和音を是正するだけである。
最後に、特許文献1に提案されたようなフィルタバンクを基本とするシステムとは反対に、BWEシステムは、修正離散コサイン変換(MDCT)のような変換に基づく実装でも実現される。MDCTのような変換は、「さえずりwarbling」(非特許文献19)あるいはリンギングといったアーティファクト(人工的な音)を生じる傾向がある。このようなアーティファクトは、スペクトル係数の帯域通過領域がコピーされる場合、またはスペクトル係数が特許文献1のようにゼロに設定される場合に生じるものである。
特に、特許文献1は、フィルタバンクを基本とする変換または畳み込みにおいて、ゼロに設定された1または幾つかのサブバンドチャネルで構成されて挿入される「ガード帯域」の使用を開示している。ある数のフィルタバンクチャネルがガード帯域として使用され、ひとつのガード帯域の帯域幅は0.5バークである。これらの不協和音ガード帯域は、ランダム白雑音信号を用いて、すなわちサブバンドにゼロの代わりに白雑音を供給して、部分的に再構成される。ガード帯域は、処理される現在の信号に関わりなく挿入される。
本発明は、符号化オーディオ信号を復号する改善された概念を提供することを目的とする。
この目的は、請求項1に記載の符号化オーディオ信号を復号する復号装置、請求項16に記載の符号化オーディオ信号を復号する復号方法または請求項19に記載のコンピュータプログラムによって達成される。
本発明によると、アナライザを用いるデコーダ側の信号解析が、周波数再生の実行の前または後に、復号化コア信号を解析するために行われ、解析結果が提供される。このとき、この解析結果は、周波数再生器により、復号化コア信号に含まれないスペクトル部を再生するために用いられる。
したがって、パッチングまたは周波数タイリングが固定されて実行される場合、すなわち、ある特定のソースレンジがコア信号からとり出され、ある特定の固定された周波数境界が、ソースレンジと再構築レンジとの間の周波数の設定、または再構築レンジ内の2つの隣接する周波数パッチまたはタイルの間の周波数境界の設定のいずれかに適用される固定されたデコーダ設定とは異なり、信号依存パッチングまたはタイリングが実行され、このとき、コアレンジは、コアレンジの周波数境界がコア信号スペクトルの局所極小に一致するように選択される。
これとは別に、あるいは追加的に、信号解析が、予備再生信号または予備周波数パッチまたはタイルされた信号で実行されることもできる。ここで、予備周波数再生手続きの後で、コアレンジと再構築レンジの境界が解析され、互いに非常に近接していて再構築されたときにうなりアーティファクトを生じる問題のあるトーン部のような、あらゆるアーティファクトが作り出した信号部を検出する。これとは別に、あるいは追加的に、境界を解析して、トーン部の途中でのクリッピングを検出することもできる。このようなトーン部のクリッピングは、そのまま再構築されたときに、アーティファクトを作り出すかもしれない。これらの手続きを避けるため、再構築レンジおよび/またはソースレンジおよび/または再構築レンジ内の2つの個別の周波数タイルまたはパッチの間の周波数境界を信号マニピュレータにより修正し、再度、新しく設定された境界で再構築を実行することもできる。
追加的に、または代替として、周波数再生が解析結果に基づく再生成であり、周波数境界がそのまま残り、ソースレンジと再構築レンジとの間、または再構築レンジ内の2つの個別の周波数タイルまたはパッチの間の周波数境界に近接する問題のあるトーン部の除去または少なくとも減衰が行われる。このようなトーン部は近接したトーン部であり、アーティファクトを生じるか、あるいは途中でクリップされたトーン部である。
特に、MDCTのような非エネルギ保存変換を用いる場合、単一トーンは、直接には単一スペクトル線にマッピンクされない。その代わり、単一トーンは、トーンの位相に依存するある特定強度の一群のスペクトル線にマッピングされる。パッチング動作がこのトーン部をクリップすると、そのとき、MDCT再構築器内のような完全な再構築が適用されたても、再構築後にアーティファクトが生じる。これは、MDCT再構築器が、最終的に正しいトーンを再構築するためには、そのトーンに対する完全なトーンパターンを必要とするからである。クリッピングが前に行われていることから、完全なトーンパターンをもはや可能ではなく、したがって、時間変化するさえずりアーティファクトが作り出される。本発明による解析に基づいて、周波数再生器は、アーティファクトを作り出す完全なトーン部を減衰させることにより、あるいは、上述したように、対応する境界周波数を変更することにより、またはそれらの双方を適用することにより、またはそのようなトーンパターンについてのある特定の予見に基づいてクリップされた部分を再構築することによって、上述のような状況を取り除く。
付加的に、または代替として、クロスオーバーフィルタリングを、符号化コア信号と、ギャップ充填周波数から最初のタイル停止周波数に延びる周波数を有する最初の周波数タイルとを、スペクトル上でクロスオーバーフィルタリングするため、あるいは最初の周波数タイルと第2の周波数タイルとをスペクトル上でクロスオーバーフィルタリングするため用いることができる。
このクロスオーバーフィルタリングは、いわゆるフィルタリンギングの削減に有用である。
本発明のアプローチは、主に、MDCTのような変換に基づくBWEで適用される。
本発明のアプローチは、聴覚的な粗さ、うねりおよび不調和は、遷移点(クロスオーバー周波数またはパッチ境界のような)に近接しているスペクトル領域の信号内容がまさしくトーンである場合にのみ生じる、という観測に基づいている。したがって、従来見出されていた問題点に対して、ここで提案された解決手段は、遷移領域のトーン成分の信号適応的検出と、それに続くそれらの成分の減衰または除去とからなる。それらの成分の減衰または除去は、望ましくは、そのような成分の足から足へのスペクトル内挿により、または代替的にはゼロまたは雑音の内挿により、完遂される。これとは別に、遷移アーティファクトが最小化されるように、遷移のスペクトル位置を信号適応的に選択することもできる。
さらに、この技術は、フィルタリンギングの減少または除去に使用できる。特に過渡的な信号に対して、リンギングは可聴の耳に障るアーティファクトである。フィルタリンギングアーティファクトは、遷移帯域のいわゆるレンガ壁特性(カットオフ周波数における通過帯域から阻止帯域への急峻な遷移)により生じる。このようなフィルタは、時間周波数変換の周波数領域で1つの係数または係数のグループをゼロに設定することにより、効果的に実現される。そのため、BWEの場合、出願人は、リンギング効果を削減するため、クロスオーバーフィルタを、パッチ間、またはコア帯域と最初のパッチとの間の各遷移周波数に適用することを提案する。クロスオーバーフィルタは、適切な利得関数を採用して、変換領域にスペクトル重み付けを行うことにより実現される。
本発明のさらなる見地によると、符号化オーディオ信号を復号する復号装置は、コアデコーダと、符号化コア信号のスペクトル部を用いて、符号化コア信号に含まれない周波数をもつ1以上のスペクトルタイルを生成するタイル生成器と、符号化コア信号と、ギャップ充填周波数から最初のタイル停止周波数に延びる周波数を有する最初の周波数タイルとを、スペクトル上でクロスオーバーフィルタリングするため、あるいは、ひとつの周波数タイルと、その周波数タイルの上側境界周波数に周波数上で隣接する下側境界周波数を有するさらなる周波数タイルとを、スペクトル上でクロスオーバーフィルタリングするクロスオーバーフィルタと備える。
望ましくは、この手続きは、MDCTのような変換に基づく帯域幅拡張で適用することが意図されている。しかしながら、本発明は、一般に適用でき、特に、交ミラーフィルタバンク(QMF)に頼る帯域幅拡張シナリオ、特に、システムが決定的に標本化される場合、例えば時間周波数変換または周波数時間変換として実値QMF表現がある場合に、適用できる。
本発明の実施は、過渡的な信号に対して特に有用である。その理由は、そのような過渡的な信号に対しては、リングングが可聴で耳障りなアーティファクトだからである。フィルタリンギングアーティファクトは、遷移帯域におけるフィルタのいわゆるレンガ壁特性、すなわちカットオフ周波数での通過帯域から阻止帯域への急峻な遷移により生じる。このようなフィルタは、時間周波数変換の周波数領域で1つの係数または係数のグループをゼロに設定することにより、効果的に実現される。したがって、本発明は、このリングングアーティファクトを削減するため、パッチ/タイル間、またはコア帯域と最初のパッチ/タイルとの間の各遷移周波数のクロスオーバーフィルタに依存する。クロスオーバーフィルタは、変換領域での適当な利得関数を採用するスペクトル重み付けにより実現されることが望ましい。
望ましくは、クロスオーバーフィルタは、信号適応的であり、2つのフィルタ、すなわち、低スペクトル領域に適用されるフェードアウトフィルタと、高スペクトル領域に適用されるフェードインフィルタとを含む。
さらなる態様として、周波数タイルまたは周波数パッチは、クロスオーバーフルタリングを目的とするものだけでなく、タイル生成器は、望ましくは、クロスオーバーフィルタリングを実行する前に、周波数境界のスペクトル極小への設定を含むパッチ適応、および遷移周波数の周囲の遷移領域に残るトーン部の除去または減衰を実行する。
本発明の好適な実施形態を、以下、添付図面を参照して説明する。
図1Aは、オーディオ信号を符号化する装置を示す図である。 図1Bは、図1Aのエンコーダと整合する符号化されたオーディオ信号を復号するデコーダを示す図である。 図2Aは、デコーダの好適な実施形態を示す図である。 図2Bは、エンコーダの好適な実施形態を示す図である。 図3Aは、図1Bのスペクトル領域デコーダによって生成されたスペクトル表現を示す概略図である。 図3Bは、換算係数帯域用の換算係数と、再構築帯域用のエネルギと、ノイズ充填帯域用のノイズ充填情報との関係を示す表である。 図4Aは、スペクトル部の選択を第1および第2セットのスペクトル部に対して適用するスペクトル領域エンコーダの機能を示す図である。 図4Bは、図4Aの機能の実施形態を示す図である。 図5Aは、MDCTエンコーダの機能を示す図である。 図5Bは、MDCT技術とデコーダの機能を示す図である。 図5Cは、周波数再生器の実施形態を示す図である。 図6Aは、本発明の一実施形態により符号化オーディオ信号復号装置を示す図である。 図6Bは、符号化オーディオ信号復号装置のさらなる実施形態を示す図である。 図7Aは、図6Aまたは図6Bの周波数再生器の望ましい実施形態を示す図である。 図7Bは、アナライザと周波数再生器の協働のさらなる実施形態を示す図である。 図8Aは、周波数再生器のさらなる実施形態を示す図である。 図8Bは、本発明のさらなる実施形態を示す図である。 図9Aは、エネルギ値を再生周波数範囲に使用する周波数生成技術を有するデコーダを示す図である。 図9Bは、図9Aの周波数再生器のさらに詳細なる実施形態を示す図である。 図9Cは、図9Bの機能を概略的に示す図である。 図9Dは、図9Aのデコーダのさらなる実施形態を示す図である。 図10Aは、図9Aのデコーダと整合するエンコーダのブロック図である。 図10Bは、図10Aのパラメータ計算器のさらなる機能の実施形態を示すブロック図である。 図10Cは、図10Aのパラメータ計算器のさらなる機能の実施形態を示すブロック図である。 図10Dは、図10Aのパラメータ計算器のさらなる機能の実施形態を示すブロック図である。 図11Aは、遷移の周囲のフィルタリンギングのスペクトル示す図である。 図11Bは、帯域幅拡張を適用した後の遷移のスペクトル図を示す。 図11Cは、フィルタリンギング削減を伴う帯域幅拡張を適用した後の遷移のスペクトル図を示す。 図12Aは、符号化オーディオ信号復号装置のブロック図である。 図12Bは、トーン信号、パッチ/タイル適用なしのコピー、変化した周波数境界のコピー、およびアーティファクトが作り出したトーン部の付加的除去の強度スペクトル(様式化された)を示す図である。 図12Cは、クロスフェード関数の一例を示す図である。 図13Aは、帯域幅拡張を有する従来の符号器を示す図である。 図13Bは、帯域幅拡張を有する従来のデコーダを示す図である。 図14Aは、クロスオーバーフィルタを用いるさらなる符号化オーディオ信号復号装置を示す図である。 図14Bは、典型的クロスオーバーフィルタのより詳細を説明する図である。
図6Aは、符号化コア信号とパラメトリックデータとを含む符号化オーディオ信号を復号する装置を示す。この装置は、符号化コア信号を復号して復号化コア信号を得るコアデコーダ600と、周波数再生動作を実行する前または後に復号化コア信号を解析するアナライザ602とを備える。アナライザ602は、解析結果603を出力するように構成される。周波数再生成器604は、復号化コア信号のスペクトル部分、消失したスペクトル部に対する包絡線データ605および解析結果603を使用して、復号化コア信号に含まれないスペクトル部分を再生成する。したがって、従来のものと比較すると、周波数再生成が、デコーダ側の信号に依存せずに実行されるのではなく、信号依存で実行される。これは、何も問題無い場合には、周波数再生成がそのまま実行されるが、問題となる信号部分が存在するときには、これが解析結果603により検出され、そのとき周波数再生成器604が適応的な方法で周波数再生成を実行することができるという利点がある。周波数再生成は、例えば、コア領域と再構築帯域との間の初期周波数境界の変化でもよく、再構築帯域内の2つの別々のタイル/パッチの間の周波数境界の変化でもよい。ガード帯域の導入とは逆に、これは、必要なときもそうでない時も、常に、どのような信号依存も無しに、特定の手続きが実行されるだけであるという利点がある。
望ましくは、コアデコーダ600は、図6Bに示すように、エントロピー(例えばハフマンまたは算術デコーダ)復号化・逆量子化段612として実現される。コアデコーダ600はコア信号スペクトルを出力し、このスペクトルは、スペクトルアナライザ614により解析される。図6Aのアナライザ602は、時間領域の信号も解析できるアナライザであるが、そのような任意のアナライザではなくスペクトルアナライザであってもよく、その場合は、スペクトルアナライザ614は図6Aのアナライザ602と全く同じになる。図6Bの実施形態では、スペクトルアナライザがスペクトル信号を解析するように構成され、これにより、ソース帯域および/またはターゲット帯域内の、すなわち周波数パッチまたは周波数タイル内の、局所極小が判定される。周波数再生成器604は、参照番号616として示すように周波数再生成を実行し、パッチ境界が、ソース帯域および/またはターゲット帯域の極小に置かれる。
続いて、図7Aを参照して、図6Aの周波数再生成器604の望ましい実施例を説明する。予備信号再生成器702は、入力として、ソース帯域からのソースデータと、追加的に、予備境界周波数のような予備パッチ情報とを受け取る。その結果、予備再生成信号703が生成され、これが、予備再生成信号703内のトーン成分を検出すための検出器704により検出される。これとは別に、あるいは付加的に、ソースデータ705は、図6Aのアナライザ602に相当する検出器により解析されてもよい。このとき、予備信号再生成ステップは必要ないかもしれない。ソースデータから再構築データへの明確に定義されたマッピングがある場合には、ソースデータのみを考慮するだけで、極小またはトーンが、コアレンジの上側境界の近くにあるか、または図12Bを参照して後述する2つの個別に生成された周波数タイル領域の間の周波数境界にあるか、を検出できる。
問題のあるトーン成分が周波数境界の近くで発見された場合には、遷移周波数調整器706が、コア帯域と再構築帯域との間、または再構築帯域の全く同一のソースデータにより生成された別個の周波数部の間の遷移周波数またはクロスオーバー周波数またはギャップ充填開始周波数のような、遷移周波数の調整を実行する。ブロック706の出力信号は、境界のトーン成分を除去する除去器708に送られる。除去器は、ブロック706による遷移周波数調整の後にもそこに残っている残留トーン成分を除去するように構成されている。除去器708の結果は、続いて、フィルタリンギング問題に対処するためのクロスオーバーフィルタ701に送られ、クロスオーバーフィルタ701の結果が、再構築帯域内でスペクトル包絡線整形を行う包絡線整形ブロック712に入力される。
図7Aを参照して説明したように、ブロック704内でのトーン成分の検出は、ソースデータ705と予備再構築信号703のどちらでも実行される。この実施形態は図7Bに示したもので、予備再構築信号が、ブロック718で示されるように作り出される。図7Aの信号成分が続いて検出器720に送られ、検出器720は、アーティファクトが作り出した成分を検出する。検出器720は図7Aに示すように、周波数境界でトーン成分を検出するための検出器として構成されるが、検出器が他のアーティファクトが作り出した成分を検出するような構成とすることもできる。そのようなスペクトル成分は、トーン成分以外の成分でも良く、アーティファクトが作り出されているかの検出が、異なる再構築を試み、この異なる再構築結果を比較して、どちらがアーティファクトが作り出した成分かを見出すことにより実行されてもよい。
検出器720はここで、信号すなわち予備再生成信号を操作するためのマニピュレータ722を制御する。この制御は、線723により予備再生成信号を実際に処理することにより行われてもよく、例えば線724により示される修正された遷移周波数を用いた新たな再生成を実行することにより行われてもよい。
操作手続きのひとつの実施形態では、遷移周波数が、図7Aに706で示すように調整される。さらなる実施形態が、図8Aに示される。この実施形態は、図7Aのブロック706あるいはブロック706を含む構成の代わりに実行される。検出器802が、問題のあるトーン部の開始および終了周波数を検出するために設けられる。内挿器804が、スペクトルレンジ内のトーン部の開始および終了の間に、内挿、望ましくは複素内挿するように構成される。このとき、図8Aにブロック806で示すように、トーン部は、内挿結果により置き替えられる。
別の実施形態を、図8Aに、ブロック808,810で示す。内挿を行う代わりに、トーン部の開始と終了との間で、スペクトル線808のランダム生成が実行される。続いて、ランダム生成されたスペクトル線のエネルギ調整が、810で示されるように行われ、ランダム生成されたスペクトル線のエネルギが、隣接する非トーンスペクトル部と同じになるように設定される。続いて、トーン部が、包絡線調整されたランダムに生成されたスペクトル線により置き替えられる。スペクトル線は、可能な限りアーティファクトの無い置き替え信号を提供するために、ランダムに、あるいは擬似ランダムに生成される。
さらなる実施形態を、図8Bに示す。図6Aの周波数再生成器604内に配置される周波数タイル生成器を、ブロック820で示す。このとき、アナライザは、周波数タイル生成器により生成された信号を解析する。周波数タイル生成器820は、望ましくは、多タイリング(タイル貼り)を実行して、多数の周波数タイルを生成する構成である。続いて、図8Bのマニピュレータ824は、周波数タイル生成器の結果を、アナライザ822による解析結果出力にしたがって操作する。この操作は、周波数境界の変更、または個々の部分の減衰である。続いて、スペクトル包絡線調整器826が、図6Aを参照して説明したように、パラメトリック情報605を用いて、スペクトル包絡線調整を実行する。
続いて、ブロック826によるスペクトル調整された信号出力は、周波数時間変換器828に入力される。周波数時間変換器828は、加えて、第1周波数部、すなわちコアデコーダ600の出力信号のスペクトル表現を受け取る。周波数時間変換器828の出力は、蓄積のために使用されるか、あるいは、オーディオレンダリングのためラウドスピーカに送られる。
本発明は、図13A,13Bに示すような既知の周波数再生手続きにも適用でき、望ましくは、図1Aから5B,9Aから10Dを参照して後述するインテリジェントギャップ充填のいずれにも適用できる。
図1Aは、オーディオ信号99を符号化する装置を示す。オーディオ信号99は、あるサンプリングレートを有するオーディオ信号をスペクトル表現101へと変換する時間スペクトル変換器100に入力され、変換されたスペクトル表現101が、時間スペクトル変換器により出力される。スペクトル101は、スペクトル表現101を解析するスペクトル解析器102に入力される。スペクトル解析器101は、第1スペクトル解像度により符号化されるべき第1セットの第1スペクトル部103(第1スペクトル部の集合)と、第2スペクトル解像度により符号化されるべき別の第2セットの第2スペクトル部105(第2スペクトル部の集合)とを決定するよう構成される。第2スペクトル解像度は、第1スペクトル解像度よりも小さい。第2セットの第2スペクトル部105は、第2スペクトル解像度を有するスペクトル包絡線情報を計算するパラメータ計算器すなわちパラメトリック符号器104に入力される。さらに、第1スペクトル解像度を有する第1セットの第1スペクトル部の第1符号化表現107を生成するために、スペクトル領域オーディオコーダ106が設けられる。また、パラメータ計算器すなわちパラメトリック符号器104は、第2セットの第2スペクトル部の第2符号化表現109を生成するよう構成される。第1符号化表現107と第2符号化表現109とは、ビットストリーム多重変換装置またはビットストリーム形成器108に入力され、ビットストリーム形成器108は、最終的に、送信または蓄積装置における蓄積のために、符号化されたオーディオ信号を出力する。
一般的に、図3Aの306などの第1スペクトル部は、307aや307bのような2つの第2スペクトル部によって取り囲まれている。コア符号化周波数範囲が帯域的に制限されているHE AACの場合には、この限りではない。
図1Bは、図1Aのエンコーダと整合するデコーダを示す。第1符号化表現107は、第1セットの第1スペクトル部の第1復号化表現を生成するスペクトル領域オーディオデコーダ112に入力される。さらに、第2符号化表現109は、第1スペクトル解像度よりも低い第2スペクトル解像度を有する第2セットの第2スペクトル部の第2復号化表現を生成するパラメトリックデコーダ114に入力される。
デコーダは、第1解像度を有する再構築第2スペクトル部を、第1スペクトル部を使って再生する周波数再生器116をさらに有する。周波数再生器116は、タイル充填手順を実行する。つまり、第1セットの第1スペクトル部のタイルまたは部分を使って、第1セットの第1スペクトル部を、第2スペクトル部を有する再構築レンジまたは再構築帯域にコピーする。そして、一般的には、パラメトリックデコーダ114により出力された復号された第2表現により示されるように、すなわち、第2セットの第2スペクトル部に関する情報を使って、スペクトル包絡線整形処理、またはその他の手順を実行する。復号化された第1セットの第1スペクトル部と、線117上の周波数再生器116の出力に示される再構築された第2セットのスペクトル部とは、スペクトル時間変換器118に入力される。このスペクトル時間変換器118は、第1復号表現と再構築された第2スペクトル部とを、所定の高サンプリングレートを有する時間表現119に変換するよう構成される。
図2Bは、図1Aのエンコーダの実施形態を示す。オーディオ入力信号99は、図1Aの時間スペクトル変換器100に対応する解析フィルタバンク220に入力される。そして、TNSブロック222において、時間ノイズ整形処理が実行される。したがって、図2Bのブロック音調マスク226に対応する図1Aのスペクトル解析器102は、時間ノイズ整形/時間タイル整形処理が適用されないときには、全スペクトル値となり、図2Bのブロック222に示すTNS処理が適用されるときには、スペクトル残差値となる。2チャンネル信号または多チャンネル信号の場合、ジョイントチャンネル符号化228が追加的に実施されてもよく、図1Aのスペクトル領域エンコーダ106には、ジョイントチャンネル符号化ブロック228が含まれてもよい。さらに、可逆データ圧縮を実施するエントロピー符号器232が設けられ、これは、図1Aのスペクトル領域エンコーダ106の一部となる。
スペクトル解析器/音調マスク226は、TNSブロック222の出力を、コア帯域と、第1セットの第1スペクトル部103に対応する音調成分と、図1Aの第2セットの第2スペクトル部105に対応する残留成分とに分別する。IGFパラメータ抽出符号化手順として表示されるブロック224は、図1Aのパラメトリック符号器104に対応し、ビットストリーム多重変換装置230は、図1Aのビットストリーム多重変換装置108に対応する。
解析フィルタバンク222がMDCT(変更離散コサイン変換フィルタバンク)として実施され、MDCTを使って、変更離散コサイン変換を周波数解析ツールとして機能させて、信号99を時間−周波数領域に変換することが好ましい。
スペクトル解析器226は、音調マスクを適用することが好ましい。この音調マスク推定段階は、信号中のノイズ様成分から音調成分を分別するのに用いられる。これによって、コア符号器228が全ての音調成分を心理音響モジュールによって符号化することができる。音調マスク推定段は、いくつもの異なる方法によって実施されてもよく、音声/オーディオ符号化(非特許文献8,9)用の正弦およびノイズモデリング、または非特許文献10に記載されるHILNモデル系オーディオコーダにおいて用いられる正弦トラック推定段と機能的に同様に実施されるのが好ましい。実施形態としては、生死軌跡を維持する必要なく簡単に実施できることが好ましいが、その他の音調またはノイズ検知器を用いてもよい。
IGFモジュールは、ソース領域と対象領域との間に存在する類似性を計算する。対象領域は、ソース領域からのスペクトルにより表現される。ソース領域と対象領域との類似点を測ることは、クロス相関性アプローチを用いて行われる。対象領域は、非オーバーラップ周波数タイルnTarに分解される。対象領域における全てのタイルについて、固定開始周波数からソースタイルnSrcが整形される。これらのソースタイルは、0および1の間の要素によってオーバーラップし、ここで0とは0%のオーバーラップを、1とは100%のオーバーラップを意味する。これらのソースタイルのそれぞれは、対象タイルに最もマッチするソースタイルを見つけるための様々な遅延において、対象タイルと相関性を有する。最もマッチするタイルの数は、tileNum[idxtar]に記憶され、対象と最も相関性を有する遅延は、xcorrlag[idxtar][idxsrc]に記憶され、相関性のサインは、xcorrsign[idxtar][idxsrc]に記憶される。相関性が極めて否定的な場合には、ソースタイルは、デコーダにおけるタイル充填処理の前に、−1を乗じる必要がある。IGFモジュールはまた、音調成分が音調マスクを使って保存されていないため、スペクトルにおける音調成分を上書きしないよう注意する必要がある。帯域側のエネルギパラメータは、対象領域のエネルギを蓄積するのに用いられ、これによってスペクトルを正確に再構築することができる。
この方法は、正弦曲線間のギャップがソース領域からの最も整合する「整形ノイズ」により充填される一方、マルチ音調信号の倍音グリットがコア符号器によって保存されるという点で、伝統的なSBR(非特許文献1)に対して利点がある。ASR(精密スペクトル置換)(非特許文献2−4)と比べて、このシステムの別の利点としては、デコーダにおいて信号の重要部分を作り出する信号合成段がないということが挙げられる。その代わり、この作業はコア符号器によって実行される。よって、スペクトルの重要性分を保存できる。提案システムの別の利点としては、その機能が提案する継続的なスケーラビリティが挙げられる。全てのタイルについて単にtileNum[idxtar]とxcorrlag=0とを使用することは、総粒度マッチングと称され、低ビットレートに使用することができる。一方、可変的なxcorrlagを全てのタイルに使用すると、対象スペクトルとソーススペクトルの整合性がより良くなる。
さらに、トリリングやミュージカルノイズなどの周波数領域アーティファクトを除去するタイル選択安定化技術が提案されている。
ステレオチャンネルのペアの場合には、追加的ジョイントステレオ処理が適用される。この処理は必要であり、というのも、ある目標レンジにおいては、信号が高い相関性を有する定位音源である場合があるためである。この特定の領域について選択された音源領域があまり相関を有しない場合には、目標領域についてエネルギが整合していても、相関しない音源領域によって空間像が悪化する場合がある。エンコーダは、一般的にはスペクトル値のクロス相関処理をして、各目標領域のエネルギ帯域を解析して、もし所定の閾値を超過している場合には、このエネルギ帯域にジョイントフラグを設定する。デコーダにおいて、左右チャンネルのエネルギ帯域は、このジョイントステレオフラグが設定されていない場合、個別に処理される。ジョイントステレオフラグが設定されている場合、両方のエネルギおよびパッチングがジョイントステレオ領域において実行される。IGF領域におけるジョイントステレオ情報は、コア符号処理におけるジョイントステレオ情報と同様に信号化され、予測の場合には、予測の方向性がダウンミックスからの残差なのか、それともその逆なのか、を示すフラグが含まれる。
エネルギは、L/R領域の送信済エネルギから計算することができる。
midNrg[k]=leftNrg[k]+rightNrg[k];
sideNrg[k]=eftNrg[k]−rightNrg[k];
ここで、kは変形領域における周波数指数である。
その他の解決としては、ジョイントステレオが積極的な帯域については、ジョイントステレオ領域において直接エネルギを計算および送信し、デコーダ側にける追加的エネルギ変形を不要とすることが挙げられる。
ソースタイルは、常に、ミッド/サイドマトリック:
midTile[k]=0.5・(leftTile[k]+rightTile[k]
sideTile[k]=0.5・(leftTile[k]−rightTile[k]
エネルギ調整:
midTile[k]=midTile[k]*midNrg[k];
sideTile[k]=sideTile[k]*sideNrg[k];
ジョイントステレオ→LR変換:
何ら追加的予測パラメータが符号化されていない場合:
leftTile[k]=midTile[k]+sideTile[k]
rightTile[k]=midTile[k]−sideTile[k]
追加的な予測パラメータが必要な場合で、信号化された方向性がミッドからサイドの場合:
sideTile[k]=sideTile[k]−predictionCoeff・midTile[k]
leftTile[k]=midTile[k]+sideTile[k]
rightTile[k]=midTile[k]−sideTile[k]
信号化された方向性がサイドからミッドの場合:
midTile1[k]=midTile[k]−predictionCoeff・sideTile[k]
leftTile[k]=midTile1[k]−sideTile[k]
rightTile[k]=midTile1[k]+sideTile[k]
に従って生成される。
この処理によって、相関性の高い目標領域と定位目標領域とを再生するのに用いられたタイルから生じた左右チャンネルが、たとえ音源領域が相関を有しないとしても、当該領域のステレオイメージを保存し、相関性を有する定位音源を示すよう確保できる。
つまり、ビットストリームにおいては、例えばL/RまたはM/Sのいずれを総合ジョイントステレオ符号化処理に用いるべきかを示すジョイントステレオフラグが送信される。デコーダにおいては、まずコア帯域についてジョイントステレオフラグの示す通り、コア信号が復号される。第二に、コア信号は、L/RおよびM/S表現の両方に蓄積される。IGFタイル充填について、ソースタイル表現が選択され、IGF帯域に関するジョイントステレオ情報の示す対象タイル表現に合うようされる。
時間ノイズ整形(TNS)は、標準技術であり、AAC(非特許文献11−13)の一部である。TNSは、知覚符号化の基本スキームを延長したものと考えられ、フィルタバンクと量子化段の間に、オプションとしての処理工程を挿入する。TNSモジュールのメイン作業は、過渡的な信号の時間的マスキング領域において、生成された量子化ノイズを隠すことであり、これによって、効率的な符号化スキームとなる。まず、TNSは、例えばMDCTのような変形領域において、「前方予測」を用いて予測係数セットを算出する。そして、これらの係数は、信号の時間的包絡線をフラット化するのに用いられる。量子化によってTNSフィルタスペクトルが影響を受けるため、量子化ノイズも一時的にフラットである。デコーダ側において、逆TNSフィルタリングを適用することで、量子化ノイズがTNSフィルタの時間的包絡線に従って整形され、よって量子化ノイズがその過渡性によりマスクされる。
IGFは、MDCT表現に基づく。効率的符号化のためには、好ましくは、約20msの長ブロックを用いなければならない。このような長ブロック内における信号が過渡を含む場合、IGFスペクトル帯域において、タイル充填により、可聴のプリ・ポストエコーが発生する。図7Cは、過渡開始前の、IGFによる一般的なプリエコー効果を示す。左側において、オリジナル信号のスペクトル写真が示され、右側において、TNSフィルタリングなしで拡張された帯域幅のスペクトル写真が示される。
このプリエコー効果は、IGF環境においてTNSを用いることにより低減される。ここでTNSは、デコーダにおけるスペクトル再生がTNS残差信号に対して実行されるため、時間タイル整形ツール(TTS)として用いられている。必要となるTTS予測係数は、通常通り、エンコーダ側における全スペクトルを用いて計算され、適用される。TNS/TTS開始および停止周波数は、IGFツールのIGF開始周波数fIGFsrartによって影響されない。伝統的なTNSと比較して、TTS停止周波数は、fIGFsrartよりも高いIGFツールの停止周波数まで増加される。デコーダ側において、TNS/TTS係数が再び全スペクトルにて適用される。つまり、コアスペクトル+再生スペクトル+音調マップからの音調成分である(図7eを参照)。TTSの適用は、再生スペクトルの時間包絡線がオリジナル信号の包絡線と整合するよう形成するのに必要である。したがって、示されたプリエコーは低減される。さらに、TNSには通常のことではあるが、それによってfIGFsrartより下の信号における量子化ノイズが依然として形成される。
伝統的なデコーダにおいては、オーディオ信号に対するスペクトルパッチングは、パッチ境界におけるスペクトル相関を害する。それによって、分散が生じ、オーディオ信号の時間包絡線が害される。よって、残差信号に対してIGFタイル充填を実施する別のメリットとしては、整形フィルタを適用した後、タイル境界がシームレスに相関し、信号をより忠実に時間的に再生することができることが挙げられる。
発明に係るエンコーダにおいては、TNS/TTSフィルタリング処理、音調マスク処理およびIGFパラメータ予測処理を経たスペクトルは、音調成分を除き、IGF開始周波数より上の信号は存在しない。まばらなスペクトルが今、算術符号化および予測符号化の原則によって、コア符号器により符号化される。これらの符号化成分は、信号のビットとともに、オーディオのビットストリームを形成する。
図2Aは、対応するデコーダの実施形態を示す。符号化オーディオ信号に相当する図2Aのビットストロームは、図1Bであればブロック112および114に接続される多重分離装置/デコーダに入力される。ビットストリーム多重分離装置は、入力オーディオ信号を、図1Bの第1符号化表現107と図1Bの第2符号化表現109とに分離する。第1セットの第1スペクトル部を有する第1符号化表現は、図1Bのスペクトル領域デコーダ112に対応するジョイントチャンネル復号ブロック204に入力される。第2符号化表現は、図2Aに図示されないパラメトリックデコーダ114に入力され、そして図1Bの周波数再生器116に対応するIGFブロック202に入力される。周波数再生に必要な第1セットの第1スペクトル部は、線203を経てIGFブロック202に入力される。さらに、ジョイントチャンネル復号処理204の後、音調マスクブロック206において、音調マスク206の出力がスペクトル領域符号器112の出力と対応するよう、特定のコア復号処理が適用される、そして、合成器208による合成が実行され、合成器208の出力がフルレンジのスペクトルを有するが、それでいて、TNS/TTSフィルタ領域内にあるというフレーム構成が作成される。そして、ブロック210において、逆TNS/TTS処理が、線109を介して供給されるTNS/TTSフィルタ情報を用いて実行される。つまり、好ましくは、TTSサイド情報が、スペクトル領域エンコーダ106によって生成される第1符号化表現に含まれる。スペクトル領域エンコーダ106は、例えば、直接的なAACまたはUSACコアエンコーダであってもよく、あるいは第2符号化表現に含まれてもよい。ブロック210の出力において、最大周波数までの全スペクトルを得ることができ、これはオリジナル入力信号のサンプリングレートによって定められるフルレンジの周波数である。そして、スペクトル/時間変換が合成フィルタバンク212において実行され、オーディオ出力信号が最終的に得られる。
図3Aは、スペクトル表現を表す概略図である。スペクトルは、スケールファクタ帯域SCBに分割され、図3Aにおける図示例においては、7つのスケールファクタ帯域SCB1〜SCB7がある。スケールファクタ帯域は、AAC規格に定められるAACスケールファクタ帯域であってもよく、図3Aにその概略が図示される通り、上側の周波数まで増加する帯域を有してもよい。スペクトルの当初から(つまり低周波数から)インテリジェントギャップ充填を実行するのではなく、IGF手順を309にて図示するIGF開始周波数で開始することが好ましい。したがって、コア周波数帯域は、最低周波数からIGF開始周波数まで存在する。IGF開始周波数より上においては、スペクトル解析を適用して、高解像度のスペクトル成分304、305、306、307(第1セットの第1スペクトル部)を、第2セットの第2スペクトル部の示す低解像度成分から分離する。図3Aは、スペクトル領域エンコーダ106またはジョイントチャンネル符号器228に例示的に入力されるスペクトルを示し、つまりコアエンコーダがフルレンジで機能しているが、相当量のスペクトル値0を符号化している。これらのスペクトル値0は、ゼロに量子化されるか、または量子化の前または後にゼロに設定される。いずれにせよ、エンコーダは、フルレンジで動作し、スペクトルがその通り表現されているかのように、すなわち、いずれのインテリジェントギャップ充填についても、第2セットの第2スペクトル部の符号化が低スぺクトル解像度で符号化されていることも、知る必要なしに動作する。
好適には、高解像度は、MDCT線のようなスペクトル線の線単位の符号化によって定義づけられ、一方、第2解像度または低解像度は、例えばいくつもの周波数線を対象とするスケールファクタ帯域について、そのスケールファクタ帯域あたりの単一スペクトル値のみを計算することにより定義づけられる。したがって、第2低解像度は、スペクトル解像度については、一般にAACやUSACコアエンコーダなどのコアエンコーダによって適用される線単位符号化によって定義される第1または高解像度よりも、ずっと低い。
スケールファクタまたはエネルギ計算について、その状況が図3Bに図示される。エンコーダがコアエンコーダであるという事実、および各帯域において第1セットのスペクトル部の成分が含まれ得る(ただし、必ずしも含まれる必要はない)という事実に伴い、コアエンコーダは、IGF開始周波数309より下のコア範囲のみならず、IGF開始周波数より上の最大周波数fIGFstop(これはサンプリング周波数、つまりfs/2の半分以下である)に達するまでの帯域について、IGF開始周波数各帯域についてスケールファクタを計算する。よって、本実施形態において、図3Aにおける符号化音調部302、304、305、306、307は、スケールファクタSCB1〜SCB7とともに、高解像度スペクトルデータに対応する。低解像度スペクトルデータは、IGF開始周波数から開始して計算され、スケールファクタSF4〜SF7とともに送信される、エネルギ情報値E、E、E、Eに対応する。
特に、コアエンコーダが低ビットレート状況下にある場合、コア帯域、つまりIGF開始周波数よりも低い周波数(スケールファクタ帯域SCB1〜SCB3)において、追加的ノイズ充填手順が適用されてもよい。ノイズ充填においては、ゼロに量子化されたいくつもの近接するスペクトル線が存在する。デコーダ側においては、これらのゼロに量子化されたスペクトル値は再度合成され、この合成されたスペクトル値について、図3Bに308として示されるNFなどのノイズ充填エネルギを用いて、その大きさが調整される。特に、USACのように、スケールファクタについて絶対ベースまたは相対ベースで設定され得るノイズ充填エネルギは、ゼロに量子化されたスペクトル値のセットのエネルギに対応する。これらのノイズ充填スペクトル線はまた、第3セットの第3スペクトル部と考えられ、直接的なノイズ充填合成により、ソースレンジおよびエネルギ情報値E、E、E、Eからのスペクトル値を用いた周波数タイルを再構築するためのその他の周波数からの周波数タイルを用いた周波数再生に依拠する周波数タイルIGF手順を適用せずに、再生される。
エネルギ情報が計算される帯域は、スケールファクタ帯域と一致することが好ましい。別の実施形態においては、例えばスケールファクタ帯域4および5について単一のエネルギ情報値のみが送信されるよう、エネルギ情報値のグループ分けが適用されるが、この実施形態においても、グループ分けされた再構築帯域は、スケールファクタ帯域の境界と一致する。もし異なる帯域分別が適用された場合には、所定の再計算または同期化計算を適用してもよく、所定の実施形態によってはこれが合理的である。
図1Aのスペクトル領域エンコーダ106は、図4Aに図示されるような心理音響的に駆動されるエンコーダであることが好ましい。一般的には、例えばMPEG2/4のAAC規格またはMPEG1/2レイヤ3規格に示される通り、スペクトル範囲(図4Aの401)に変換された後の符号化対象のオーディオ信号は、スケールファクタ算出器400に転送される。スケールファクタ算出器は、心理音響モデルによる制御により、量子化対象のオーディオ信号をさらに受信するか、またはMPEG1/2レイヤ3規格またはMPEGAAC規格の通り、オーディオ信号の復号スペクトル表現を受信する。心理音響モデルは、各スケールファクタ帯域について、心理音響閾値を表現するスケールファクタを算出する。さらに、スケールファクタは、公知の内側および外側反復ループの連携により、またはその他適切なエンコーディング手順により、所定のビットレート条件が満たされるよう調整される。そして、量子化対象スペクトル値と算出スケールファクタとが量子化処理器404に入力される。直接的なオーディオ符号化動作においては、量子化対象スペクトル値は、スケールファクタによって重み付けされ、この重み付けされたスペクトル値が、一般的に上位の振幅範囲まで圧縮する機能を有する固定量子化装置に入力される。そして、量子化処理器の出力においては、エントロピーエンコーダに転送される量子化インデックスが確かに存在する。一般的に、このエントロピーエンコーダは、近接する周波数値のためのゼロ量子化インデックスまたは当該分野におけるいわゆるゼロ値「ラン」のために、特定のかつ相当に効率のよい符号機能を有する。
しかしながら、図1Aのオーディオエンコーダにおいては、量子化処理器は、一般的に、スペクトル解析器から第2スペクトル部に関する情報を受信する。したがって、量子化処理器404は、その出力において、スペクトル解析器102によって識別された第2スペクトル部がゼロであるか、またはエンコーダもしくはデコーダによってゼロ表現であると認められた表現(特にスペクトルにゼロ値の「ラン」が存在する場合に、相当に効率的に符号化できる表現)を有するよう確保する。
図4Bは、量子化処理器の実施形態を図示する。MDCTスペクトル値は、ゼロ設定ブロック410に入力することができる。そして、ブロック412におけるスケールファクタによる重み付けが実施される前に、第2スペクトル部が既にゼロに設定される。追加的実施形態においては、ブロック410が設けられず、重み付けブロック412の後に、ブロック418においてゼロ設定の連携が実施される。さらに別の実施形態においては、量子化ブロック420における量子化の後に、ゼロ設定ブロック422においてゼロ設定手順が実施されてもよい。この実施形態においては、ブロック410および418は存在しない。概して、ブロック410、418および422のうち少なくとも1つが、具体的な実施形態に応じて設けられる。
そして、ブロック422の出力において、図3Aに図示されるものに対応する量子化スペクトルが得られる。そして、この量子化スペクトルは、図2Bにおける232のようなエントロピー符号器に入力される。このエントロピー符号器は、例えばUSAC規格に定義されるハフマン符号器または演算符号器であってもよい。
ゼロ設定ブロック410、418および422は、互いに交互に、または並列に設けられるが、スペクトル解析器424によって制御される。スペクトル解析器は、公知の音調検知器を有することが好ましく、またはスペクトルを高解像度で符号化される成分と低解像度で符号化される成分とに分別することができる異なる種の検知器を有することが好ましい。その他スペクトル解析器において実行されるアルゴリズムは、異なるスペクトル部に関する解像度要件を、スペクトル情報または関連メタデータに応じて決定する音声活動検出器、ノイズ検出器、音声検出器、その他検出器であってもよい。
図5Aは、例えばAACやUSACにおいて実施される、図1Aの時間スペクトル変換器100の好ましい実施形態を図示する。時間スペクトル変換器100は、過渡検知器504によって制御される窓回路502を有する。過渡検知器504が過渡を検知すると、長い窓から短い窓への切り替えが窓回路502に対して指示される。そして、窓回路502は、オーバーラップしているブロックについて、各窓フレームが一般的に2048値のような2つのN値を有する場合には、窓フレームを計算する。その後、ブロック変換器506内での変換が実施され、このブロック変換器が追加的デシメーションを提供する。そして、デシメーション/変換の結合が実行され、MDCTスペクトル値などのN値を有するスペクトルフレームが得られる。そのため、長窓動作については、ブロック506の入力におけるフレームが、例えば2048値のような2つのN値を有し、そしてスペクトルフレームが1024値を有する。しかしながら、その後、長窓と比較して各短ブロックが1/8の窓時間領域値しか有さず、かつ各スペクトルブロックが長ブロックと比較して1/8のスペクトル値しか有さない場合に8つの短ブロックが実行されたときには、短ブロックに対する切替が実行される。そのため、このデシメーションが窓回路の50%オーバーラップ動作と結合したとき、スペクトルは、時間領域オーディオ信号99のクリティカルサンプルバージョンである。
続いて、図1Bの周波数再生器116およびスペクトル時間変換器118の特定の実施形態、または図2Aのブロック208および212の結合動作の具体的実施形態を示す図5Bを参照する。図5Bにおいて、特定の再構築帯域が、図3Aのスケールファクタ帯域6のように考慮される。この再構築帯域における第1スペクトル部(つまり図3Aの第1スペクトル部306)は、フレーム構築/調整ブロック510に入力される。その上、スケールファクタ帯域6のための再構築第2スペクトル部も、フレーム構築器/調整器510に入力される。また、図3BにおけるEのような、スケールファクタ帯域6のためのエネルギ情報もまた、ブロック510に入力される。再構築帯域における再構築第2スペクトル部は、ソースレンジを使って周波数タイル充填により既に生成されており、この再構築帯域が対象レンジに対応する。ここで、フレームのエネルギ調整を実行し、例えば、図2Aの結合器208の出力において得られる、N値を有する完全な再構築フレームを最終的に得る。そして、ブロック512において、逆ブロック変換/補間処理を実行して、例えば、ブロック512の入力における124スペクトル値について、248時間領域値を得る。その後、ブロック514において合成窓処理が実行され、これもまた、符号化されたオーディオ信号においてサイド情報として送信される長窓/短窓指示により制御される。そして、ブロック516において、前回時間フレームとのオーバーラップ/加算処理が実行される。各新規の時間フレームが2N値の場合、Nの時間領域値が最終的に出力されるよう、MDCTは、50%オーバーラップ処理を適用することが好ましい。50%オーバーラップ処理によってクリティカルサンプルが提供され、あるフレームから次のフレームへの継続的クロスオーバーが、ブロック516におけるオーバーラップ/加算処理により提供されるという事実からすると、50%オーバーラップ処理が特に好ましい。
図3Aの301に示す通り、ノイズ充填処理は、IGF開始周波数より下で追加的に適用されるのみならず、図3Aのスケールファクタ帯域6と合致する対象再構築帯域などのような、IGF開始周波数より上においても追加的に適用されてもよい。そして、ノイズ充填スペクトル値も、フレーム構築器/調整器510に入力されてもよく、ノイズ充填スペクトル値がこのブロック内にて調整されてもよい。あるいは、ノイズ充填スペクトル値は、フレーム構築器/調整器510に入力されるよりも前に、ノイズ充填エネルギを用いて既に調整されていてもよい。
好ましくは、IGF処理(つまりその他の部分からのスペクトル値を使った周波数タイル充填処理)は、全スペクトルに対して適用されてもよい。したがって、スペクトルタイル充填処理は、IGF開始周波数より上の高帯域のみならず、低帯域においても適用されてもよい。また、周波数タイル充填によらないノイズ充填もまた、IGF開始周波数より下のみならず、IGF開始周波数より上でも適用されてもよい。但し、ノイズ充填処理がIGF開始周波数よりも下に限定され、かつ図3Aに示される通り、周波数タイル充填処理がIGF開始周波数よりも上に限定されているときに、高品質および高効率のオーディオエンコーディングが得られることが判明している。
対象タイル(TT)(IGF開始周波数より大きい周波数を有する)は、フルレート符号器のスケールファクタ帯域境界に結合させることが好ましい。ソースタイル(ST)は、ここから情報を得られるが、IGF開始周波数よりも低周波数であり、スケールファクタ帯域境界と結合していない。STの大きさは、関連するTTの大きさに対応すべきである。これを以下の例を使って示す。TT[0]は、10MDCTビンの長さを有する。これはまさに、2つの後続のSCBの長さ(例えば4+6)に相当する。そして、TT[0]と相関性を有する可能性のある全てのSTもまた、10ビンの長さを有する。TT[0]に近接する第2対象タイルTT[1]は、15ビンの長さを有する(7+8の長さを有するSCB)。そして、そのSTは、TT[0]用の10ビンではなく、15ビンの長さを有する。
対象タイルの長さを有するSTについて、TTを見つけられない場合が生じたとき(例えば、TTの長さが利用可能なソースレンジよりも大きいとき)には、相関性は計算されず、対象タイルTTが完全に充填されるまで、ソースレンジが何度もこのTTにコピーされる(このコピーは、第2コピーの最も低い周波数を有する周波数線が、第1コピーの最も高い周波数を有する周波数線の直後に周波数的に来るよう、次から次になされる。)。
そして、図1Bの周波数生成器116または図2AのIGFブロック202のさらなる好適実施形態を示す図5Cを参照する。ブロック522は、対象帯域IDのみならず、さらにソース帯域IDをも受信する周波数タイル生成器である。例示的に、エンコーダ側において、図3Aのスケールファクタ帯域3がスケールファクタ帯域7の再構築にかなり適していると決定されている。したがって、ソース帯域IDは2であり、対象帯域IDは7である。この情報に基づき、周波数タイル生成器522は、スペクトル成分523の生の第2部を生成するために、コピー処理や倍音タイル充填処理、その他タイル充填処理を適用する。スペクトル成分の生の第2部は、第1セットの第1スペクトル部に含まれる周波数解像度と同じ周波数解像度を有している。
そして、図3Aの307などのような再構築帯域の第1スペクトル部は、フレーム構築器524に入力され、生の第2部523もフレーム構築器524に入力される。その後、再構築されたフレームは、ゲイン係数算出器528によって算出された再構築帯域のゲイン係数を利用して、調整器526により調整される。ただし、重要な点としては、フレームにおける第1スペクトル部は、調整器526による影響を受けず、再構築フレームのための生の第2部のみが調整器526の影響を受けることである。このため、ゲイン係数算出器528は、ソース帯域または生の第2部523を解析し、さらに、スケールファクタ帯域7が想定される場合には、調整器526によって出力される調整後フレームのエネルギがエネルギEを有するよう、再構築帯域における第1スペクトル部を追加的に解析して、正しいゲイン係数527を最終的に見出す。
この意味では、HE−AACと比べて、本発明による周波数再構築の正確性が高いことを評価することが非常に重要である。これは、図3Aにおけるスケールファクタ帯域7について説明される。図13Aに図示される従来のエンコーダは、高解像度で符号化されるべきスペクトル部307を「欠落倍音」として検知する。そして、このスペクトル成分のエネルギが、スケールファクタ帯域7などの再構築帯域に関するスペクトル包線絡情報とともに、デコーダに送信される。その後、デコーダが欠落倍音を再生する。しかしながら、欠落倍音307が図13Aに示す従来のデコーダによって再構築されるスペクトル値が、再構築周波数390によって示される周波数における帯域7の中央に存在する。よって、本発明は、図13Dの従来のデコーダによって生じる周波数エラー391を避けることができる。
一実施形態において、スペクトル解析器を実行して、第1スペクトル部と第2スペクトル部の類似性を算出し、算出された類似性に基づき、再構築範囲の第2スペクトル部について、この第2スペクトル部とできる限りマッチする第1スペクトル部を決定する。そして、可変的ソース範囲/対象範囲の実行において、パラメトリックコーダは、第2符号化表現において、各対象範囲について整合する対象範囲を表現する整合情報を追加的に導入する。デコーダ側において、この情報は、図5Cの周波数タイル生成器522によって用いられる。図5Cは、ソース帯域IDおよび対象帯域IDに基づく生の第2部523の生成を図示する。
さらに、図3Aに示す通り、スペクトル解析器は、最大限の解析周波数まで、スペクトル表現を解析するよう構成される。この最大限の解析周波数は、サンプリング周波数の半分を少しだけ下回り、少なくともサンプリング周波数の1/4かまたは一般的にはこれより高い方が好ましい。
図示される通り、エンコーダは、低解像度処理をすることなく動作し、またデコーダは、高解像度処理をすることなく動作する。つまり、スペクトル領域オーディオコーダは、オリジナルの入力オーディオ信号のサンプリングレートにより定義されるナイキスト周波数を有するスペクトル表現を生成するよう構成される。
さらに、図3Aに図示される通り、スペクトル解析器は、ギャップ充填開始周波数から開始し、スペクトル表現に含まれる最大周波数に示される最大周波数で終了するスペクトル表現を解析するよう構成される。そして、最大周波数からギャップ充填開始周波数までのスペクトル部が第1セットのスペクトル部に属し、例えば304、305、306、307などのギャップ充填周波数より上の周波数値を有するさらなるスペクトル部が、第1セットの第1スペクトル部に追加的に含まれている。
上述の通り、スペクトル領域オーディオデコーダ112は、第1復号表現のスペクトル値によって示される最大周波数が、サンプリングレートを有する時間表現に含まれる最大周波数と等しくなるよう構成され、第1セットの第1スペクトル部における最大周波数のスペクトル値が、ゼロまたはゼロとは異なる値である。いずれにせよ、スペクトル成分の第1セットにおけるこの最大周波数については、スケールファクタ帯域のスケールファクタが存在する。このスケールファクタは、図3Aおよび3Bの関係で議論された通り、このスケールファクタ帯域における全てのスペクトル値がゼロに設定されたか否かを問わず、生成され送信される。
したがって、本発明は、ノイズ置換やノイズ充填(これらの技術は、ローカル信号コンテンツのようなノイズの効率的表現に特化している)などのような圧縮効率を向上させるその他のパラメータ技術について、本発明によると音調成分の正確な周波数再生が可能であるという利点を有する。今日まで、いずれの従来技術も、低帯域(LF)と高帯域(HF)における固定された演繹分割の制限のない、スペクトルギャップ充填による任意の信号コンテンツの効率的パラメトリック表現について、提案していない。
本発明のシステムの実施形態は、従来技術のアプローチを改善し、高圧縮効率を実現し、知覚的な不快感をほとんどなくし、低ビットレートであっても全オーディオ帯域を提供する。
一般的なシステムは、下記から構成される。
・全帯域コア符号化
・インテリジェントギャップ充填(タイル充填またはノイズ充填)
・音調マスクにより選択されたコア内におけるまばらな音調部分
・充填を含む、全帯域のためのジョイントステレオペア符号化
・タイル上のTNS
・IGFレンジにおけるスペクトル白色化
より効率的なシステムに向かっての第1ステップとしては、スペクトルデータを、コア符号器の1つとは異なる第2変形領域に変換する必要性を除去することである。例えばAACなどの多くのオーディオコーデックは、MDCTを基本的な変換として用いているので、MDCT領域においてBWEも実行できると便利である。BWEシステムの第2要件としては、音調グリッドを保存する必要性がある。これによって、HF音調成分が保存され、符号化オーディオの質が既存のシステムよりも優れたものになる。BWEスキームについて、上記の要件の両方に対処するために、インテリジェントギャップ充填(IGF)と称される新システムが提案されている。図2Bは、エンコーダ側における提案システムのブロック図を示し、図2Aは、デコーダ側におけるシステムを示す。
図9Aは、符号化オーディオ信号を復号する装置を示す。このオーディオ信号は、第1セットの第1スペクトル部の符号化表現、および第2セットの第2スペクトル部についてのスペクトルエネルギを示すパラメトリックデータの符号化表現を含んでいる。第1セットの第1スペクトル部は、図9Aにおいて901aで示され、パラメトリックデータの符号化表現は、図9Aの901bで示される。オーディオデコーダ900は、第1セットの第1スペクトル部の符号化表現901aを復号して、復号化された第1セットの第1スペクトル部904を得るよう設けられる。また、オーディオデコーダ900は、パラメトリックデータの符号化表現を復号して、個別の再構築帯域について個別のエネルギを示す第2セットの第2スペクトル部についての復号パラメトリックデータ902を得る。ここで、第2スペクトル部は、再構築帯域内に存在している。さらに、周波数再生器906は、第2スペクトル部を有する再構築帯域のスペクトル値を再構築するために設けられる。さらに、周波数再生器906は、第1セットの第1スペクトル部に含まれる第1スペクトル部と、再構築帯域に係る個別のエネルギ情報を用いる。ここで、再構築帯域には、第1スペクトル部と第2スペクトル部が含まれる。周波数再生器906は、残存エネルギ情報を決定する算出器912を有する。この残存エネルギ情報には、再構築帯域内に周波数を有する第1スペクトル部の累積エネルギが含まれる。さらに、周波数再生器906は、再構築帯域のさらなるスペクトル部のタイルエネルギ情報を決定し、第1スペクトル部とは異なる周波数値のための計算器918を有する。これらの周波数値は、再構築帯域に周波数を有するものであり、さらなるスペクトル部は、再構築帯域の第1スペクトル部とは異なる第1スペクトル部を用いて、周波数再構築により生成されるものである。
周波数再生器906は、再構築帯域における欠落エネルギのための計算器914をさらに有する。この計算器914は、再構築帯域についての個別エネルギおよびブロック912により生成された残存エネルギを用いて動作する。さらに、周波数再生器906は、欠落エネルギ情報、およびブロック918により生成されたタイルエネルギ情報に基づき、再構築帯域におけるさらなるスペクトル部を調整するスペクトル包絡線調整器916を有する。
再構築帯域920の一例を示す図9Cを参照する。再構築帯域は、図3Aにおける第1スペクトル部306などの再構築帯域における第1スペクトル部を有し、これは921としてその概略が示される。さらに、再構築帯域920における残りのスペクトル値は、例えば、図3Aのインテリジェントギャップ充填開始周波数309より下のスケールファクタ帯域1、2、3からのソース領域を用いて生成されることとなる。周波数生成器906は、第2スペクトル部922および923のための生スペクトル値を生成するよう構成される。そして、図9Cに示される通り、周波数帯域922および923におけるスペクトル値を最終的に調整するために、そして再構築帯域920における再構築および調整第2スペクトル部を得るために、ゲインファクタgが計算される。これらの第2スペクトル部は、第1スペクトル部921と同じスペクトル解像度、つまり同じ線距離を有している。図9Cにおいて921で示される再構築帯域における第1スペクトル部は、オーディオデコーダ900によって復号され、図9Bのブロック916の実施する包絡線調整によっては影響を受けないことを理解することが重要である。その代わり、921で示される再構築帯域における第1スペクトル部は、線904を介して、全帯域または全レートのオーディオデコーダ900により出力されるため、そのままに放置される。
以下において、実数を用いた一例について説明する。ブロック912により算出された残りの残存エネルギは、例えば5エネルギ単位だとする。このエネルギは、第1フペクトル部921において例示的に示された4つのスペクトル線のエネルギである。
さらに、図3Bまたは図3Aのスケールファクタ帯域6に対応する再構築帯域に係るエネルギ数E3は、10単位に等しい。重要なこととしては、エネルギ値には、スペクトル部922および923のエネルギのみならず、エンコーダ側で算出された再構築帯域920の全エネルギ(つまり、例えば、音調マスクを用いてスペクトル解析を実行する前のもの)も含まれる。したがって、10エネルギ単位は、再構築帯域における第1および第2スペクトル部を対象とする。そして、ブロック922、923のソースレンジデータのエネルギまたはブロック922、923用の生の対象レンジデータのエネルギは、8エネルギ単位であるという前提とする。よって、5単位の欠落エネルギが計算される。
タイルエネルギtEkにより分割された欠落エネルギに基づき、0.79のゲインファクタが計算される。そして、第2フペクトル部922、923の生のスペクトルラインに対して、算出されたゲインファクタを乗じる。よって、第2スペクトル部922、923のスペクトル値のみが調整され、第1スペクトル部921のスペクトル線は、この包絡線調整によって影響を受けない。第2スペクトル部922、923について生のスペクトル値を乗じた後、完全なる再構築帯域が計算される。これは、再構築帯域における第1スペクトル部から構成され、再構築帯域920における第2スペクトル部922、923のスペクトル線から構成される。
帯域922、923の生のスペクトルデータを生成するためのソースレンジは、周波数について、IGF開始周波数309より下であり、再構築帯域920はIGF開始周波数309よりも上であることが好ましい。
さらに、再構築帯域境界がスケールファクタ帯域境界と一致することが好ましい。よって、一実施形態において、再構築帯域は、コアオーディオデコーダの対応スケールファクタ帯域の大きさを有するか、またはエネルギペアリングが適用されたとき、再構築帯域のエネルギ値が整数2以上のスケールファクタ帯域のエネルギを提供する大きさを有する。したがって、スケールファクタ帯域4、スケールファクタ帯域5およびスケールファクタ帯域6についてエネルギ蓄積が実施されるとの前提の場合には、再構築帯域920の低周波数境界は、スケールファクタ帯域4の下限境界と等しくなり、再構築帯域920の高周波数境界は、スケールファクタ帯域6の上限境界と一致する。
以下において、図9Aのデコーダのさらなる機能を示すために、図9Dについて説明する。オーディオデコーダ900は、第1セットのスペクトル部の第1スペクトル部に対応する逆量子化スペクトル値を受信する。そして、図3Bに示すようなスケールファクタ帯域のためのスケールファクタが、追加的に逆スケールブロック940に提供される。逆スケールブロック940は、図3AのIGF開始周波数309より下の全ての第1セットの第1スペクトル部を提供し、さらにIGF開始周波数より上の第1スペクトル部(つまり、図3Aの第1スペクトル部304、305、306、307であり、これらは全て図9Dの941に示す通り、再構築帯域内に位置している)を提供する。さらに、再構築帯域における周波数タイル充填に用いられるソース帯域の第1スペクトル部は、包絡線調整器/計算器942に提供され、このブロックは、図9Dにおいて943で示す通り、符号化されたオーディオ信号に対してパラメータサイド情報として提供された再構築帯域のエネルギ情報を追加的に受信する。そして、包絡線調整器/計算器942は、図9Bおよび9Cの機能を提供し、再構築帯域における第2スペクトル部のために、調整されたスペクトル値を最終的に出力する。再構築帯域における第2スペクトル部に係るこれらの調整スペクトル値922、923、並びに図9Dにおいて線941により示される再構築帯域の第1スペクトル部921は、統合すると、再構築帯域の全スペクトル表現をなしている。
以下において、符号化されたオーディオ信号を提供または生成するために、オーディオ信号を符号化するオーディオエンコーダの好適実施形態を説明する図10Aおよび10Bを参照する。このエンコーダは、スペクトル解析器1004に供給する時間/スペクトル変換器1002を有し、このスペクトル解析器1004は、パラメータ計算器1006に接続する一方、オーディオエンコーダ1008にも他方で接続する。オーディオエンコーダ1008は、第1セットの第1スペクトル部の符号化表現を提供し、第2セットの第2スペクトル部を対象としない。一方で、パラメータ計算器1006は、第1および第2スペクトル部を対象とする再構築帯域のエネルギ情報を提供する。さらに、オーディオエンコーダ1008は、第1スペクトル解像度を有する第1スペクトル部の第1セットの第1符号化表現を生成するよう構成される。ここで、オーディオエンコーダ1008は、ブロック1002によって生成されるスペクトル表現の全ての帯域に係るスケールファクタを提供する。これに加えて、図3Bに示す通り、エンコーダは、図3Aに示すIGF開始周波数309よりも上の周波数に位置する再構築帯域については少なくとも、エネルギ情報を提供する。したがって、再構築帯域がスケールファクタ帯域またはスケールファクタ帯域群と好適に一致しているので、オーディオエンコーダ1008からの対応スケールファクタと、パラメータ計算器1006によって出力されるエネルギ情報という2つの値が与えられる。
オーディオエンコーダは、異なる周波数帯域幅を有する(つまり異なる数のスペクトル値を有する)スケールファクタ帯域を有することが好ましい。したがって、パラメータ計算器は、特定の再構築帯域の帯域幅について、異なる帯域幅のためのエネルギを正規化する正規化器1012を有する。このため、正規化器1012は、入力として、帯域におけるエネルギと、帯域におけるいくつものスペクトル値を受信し、再構築/スケールファクタ帯域毎に正規化されたエネルギを出力する。
さらに、図10Aのパラメータ計算器1006aは、図10Aにおける線1007により示されるコアまたはオーディオエンコーダ1008から制御情報を受信するエネルギ値計算器を有する。この制御信号には、オーディオエンコーダによって使用される長/短ブロックに関する情報、および/またはグループ化情報が含まれる場合がある。したがって、長/短ブロックに関する情報および短窓に関するグループ化情報が「時間」グループ分けに関するものである一方、グループ化情報はまた、スペクトルグループ分け(つまり、2つのスケールファクタ帯域を単一の再構築帯域にグルース分けすること)に言及してもよい。よって、エネルギ値計算器1014は、フペクトル部のみがグループ分けされているとき、第1予備第2スペクトル部を対象とするグループ分けされた各帯域について、単一のエネルギ値を出力する。
図10Dは、スペクトルグループ分けを実施するためのさらなる実施形態を示す。このため、ブロック1016は、2つの近接帯域のエネルギ値を計算するよう構成される。そして、ブロック1018において、近接する帯域のエネルギ値を比較し、エネルギ値がそれほど異ならない場合、または例えば、閾値で規定したほど異ならない場合には、ブロック1020に示すように、両方の帯域について、単一の(正規化された)値が生成される。線1019に示す通り、ブロック1018を迂回してもよい。さらに、ブロック1020により実行される2つ以上の帯域に係る単一値の生成は、エンコーダビットレート制御1024により制御されてもよい。このため、ビットレートを低減する必要がある場合には、ブロック1018における比較において、エネルギ情報値のグループ分けが許されない場合であったとしても、符号化されたビットレート制御処理1024により、ブロック1020を制御して、2つ以上の帯域について単一の正規化値を生成させる。
オーディオエンコーダが2つ以上の短窓のグループ分けを行っているときには、このグループ分けがエネルギ情報についても適用される。コアエンコーダが2つ以上の短ブロックのグループ分けを行うときには、これら2つ以上のブロックについて、スケールファクトの単一セットのみを計算し送出する。デコーダ側においては、オーディオデコーダは、スケールファクタの同じセットを両方のグループ分けされた窓に適用する。
エネルギ情報計算に関して、再構築帯域におけるスペクトル値が2つ以上の短窓に対して蓄積される。つまり、短ブロックおよび後続の短ブロックについての所定の再構築帯域におけるスペクトル値は一緒に蓄積され、2つの短ブロックを対象とするこの再構築帯域については、単一のエネルギ情報値しか送信されないことを意味する。そして、デコーダ側においては、図9Aないし9Dに関して説明された包絡線調整は、各短ブロックについて個別には実施されず、グループ分けされた短窓のセットについて一緒に実施される。
周波数におけるグループ分けまたは時間におけるグループ分けが実施された場合であっても、正規化によって、デコーダ側のエネルギ値情報計算について、一方のエネルギ情報値と再構築帯域またはグループ分けされた再構築帯域のセットにおけるスペクトルライン量のみが簡単に知られるよう、対応する正規化が再び実施される。
さらに、スペクトルエネルギの情報、個別エネルギの情報または個別のエネルギ情報、残存エネルギの情報または残存エネルギ情報、タイルエネルギの情報またはタイルエネルギ情報、あるいは欠落エネルギの情報または欠落エネルギ情報は、エネルギ値だけでなく、振幅値(例えば絶対値)、レベル値、あるいは他の値であって、そこから最終的なエネルギ値を導き出すことのできるどのような値も含むことができる。したがって、エネルギの情報は、例えば、エネルギ値それ自身、および/または、レベルおよび/または振幅および/または絶対振幅の値を含むことができる。
図12Aは、復号装置のさらなる実施形態を示す。ビットストリームを、例えばAACデコーダのようなコアデコーダ1200により受け取る。結果は、例えば周波数再生成器604に相当する帯域幅拡張パッチングまたはタイリング1202の実行段に送られる。そして、パッチ/タイル適応および後処理が実行され、パッチ適応が実行されると、周波数再生成器1202が、さらなる周波数再生成を実行するように制御されるが、今回は、例えば調整された周波数境界を用いる。さらに、パッチ処理がトーン線の除去または減衰などにより実行されるとき、その結果が、続いてブロック1206に送られ、例えばブロック712または826を参照して説明したように、パラメータ駆動帯域包絡線整形が実行される。その結果は、続いて、例えば図12Aに示すPCM出力ドメインのような最終出力ドメインへの変換行う合成変換ブロック1208に送られる。
本発明の実施形態の主な特徴は、以下の通りである。
望ましい実施形態はMDCTに基づくものであり、MDCTは、トーンスペクトル領域がクロスオーバー周波数および/またはせパッチマージンの不運な選択により切り取られた場合、またはトーン成分がパッチ境界近傍に近接しすぎて配置された場合に、上述したさえずりアーティファクトを生じる。
図12Bは、新たに提案される技術が、最新のBWE法で生じるアーティファクトをいかに削減するかを示す。図12Bのパネル2において、従来のBWE法の出力の定型化されたマグニチュードスペクトルを示す。この例では、信号は、2つの隣接トーンによるうなり(beating)により、また、トーンの分離により、知覚的に劣化している。双方の問題のあるスペクトル領域は、それぞれ円により印付けられている。
これらの問題を解決するため、この新しい技術は、最初に、信号に含まれるトーン成分のスペクトル位置を検出する。次に、本発明のひとつの見地によると、LFとすべてのパッチとの間の遷移周波数を、トーン成分の分離またはうなりが最小化されるように、個別のシフト(所定の限度内で)により調整しようとする。この目的のため、遷移周波数が、局所スペクトルの極小に一致することが望ましい。このステップは、図12Bのパネル2およびパネル3に示し、ここで、遷移周波数fx2がより高いい周波数に向かってシフトさせられ、f’x2となっている。
本発明の他の見地によると、遷移領域に問題のあるスペクトルコンテンツが残っている場合には、少なくともひとつの間違って置かれたトーン成分を除去して、遷移周波数のうなりアーティファクトまたはさえずりのいずれかを削減する。これは、図2パネル3に示すように、スペクトル外挿または内挿/フィルタリングを介して行われる。トーン成分は、これにより、足点から足点、すなわちその左局所極小から右局所極小に取り除かれる。本発明の技術を適用した後の結果スペクトルを図12Bパネル4に示す。
言い換えると、図12Bは、左上欄、すなわちパネル1に、オリジナルの信号を示す。右上欄、すなわちパネル2に、長円1220,1221で示された問題のある領域をもつ対照帯域幅拡張信号が示される。左下欄、すなわちパネル3に、2つの望ましいパッチまたは周波数タイル処理が示される。トーン部の分離が周波数境界f′x2を増加させることにより対処され、対応するトーン部のクリッピングが、もはやそこには存在しなくなる。さらに、トーン部1031を除去するための利得関数1030,1032が適用され、あるいは、代替的に、1033で示される内挿が示される。最後に、図12Bの右下欄、すなわちパネル4は、一方でのタイル/パッチ周波数調整と問題のあるトーン部の除去または少なくとも減衰との組み合わせから得られる改善された信号を示す。
図12Bのパネル1は、前述したように、オリジナルのスペクトルを示す。このオリジナルのスペクトルは、クロスオーバーまたはギャップ充填の開始周波数fx1までのコア周波数を有する。
したがって、周波数fx1は、ソースレンジ1252と、境界周波数1250とナイキスト周波数fNyquist以下最大周波数との間に延びる再構築レンジ1254との間の境界周波数1250を示す。エンコーダ側では、信号はfx1で帯域制限されていると仮定される、あるいは、インテリジェントギャップ充填についての技術が適用される場合には、fx1が図3Aのギャップ充填開始周波数309に相当していると仮定される。この技術に依存して、fx1を超える再構築レンジは、空となるか(図13A,13Bの実施形態の場合)、あるいは、図3Aを参照して説明するような高解像度で符号化されるべきある第1周波数部からなる。
図12B、パネル2は、予備再生成された信号を示す。この信号は、例えば図7Aのブロック702により生成された信号であり、2つの問題のある部分を含む。問題のある部分のひとつを、1220で示す。1220aで示すコア領域内のトーン部と1220bで示す周波数タイルの開始のトーン部との周波数距離は小さすぎ、このため、うなりアーティファクトが作り出される。さらなる問題は、1225で示す最初のパッチ操作または周波数タイル操作により生成された第1周波数タイルの上側境界が、途中でクリップされた、分離したトーン部1226であることである。このトーン部1226を図12Bの他のトーン部と比較するとき、幅が典型的なトーン部の幅より小さいことが明らかであり、これが、このトーン部が、第1周波数タイル1225と第2周波数タイル1227との間の周波数境界が、ソースレンジ1252内の間違った場所に設定されることにより、このトーン部が分離されていることを意味する。この発生に対処するため、図12Bのパネル3に示すように、境界周波数fx2を修正して少し大きくする。これにより、トーン部のクリッピングは生じない。
一方、f’x2が変化させられるこの手続きは、うなりの問題には有効には対処していない。この問題は、したがって、図7Aのブロック708を参照して説明したフィルタリングによるトーン成分の除去または内挿または他のいずれかの手続きにより対処される。図12Bは、遷移周波数調整706と、708で示す境界でのトーン成分の除去との順次適用示す。
他の選択肢として、遷移周波数fx1を少し低く設定して、トーン部1220aがもはやコアレンジには無いようにすることもできる。このとき、トーン部1220aは、遷移周波数fx1を少し低く設定することにより、除去される。
この手続きはまた、問題のあるトーン成分1032の発生への対処にも作用する。f’x2 をさらに高く設定することで、トーン部1032が置かれているスペクトル部が、第1パッチング動作1225内で再生成され、したがって、2つの隣接するトーン部が発生することはない。
基本的にうなりの問題は、隣接するトーン部の周波数の強度と距離に依存する。検出器704,720、あるいはより一般的にはアナライザ602が、どのトーン成分も配置されるため、fx1, fx2, f′x2のような遷移周波数より救い周波数に配置される低周波数部を解析するように構成されることが望ましい。さらに、遷移周波数より上のスペクトルレンジも、トーン成分を検出するために解析される。2つのトーン成分、ひとつは周波数に対して遷移周波数の左、もうひとつは右(高くなる周波数)が検出されたとき、図7Aに708で示す境界のトーン成分の除去器が動作する。トーン成分の検出が、ある検出範囲、対応する帯域の帯域幅に対して遷移周波数から両方向に少なくとも20%延びる範囲、望ましくは、対応する帯域の帯域幅に対して遷移周波数の左の低域、および遷移周波数の右に高域に10%だけ延びる範囲、すなわち、一方ではソースレンジの帯域幅で、他方では再構築レンジ、または、遷移周波数が2つの周波数タイル1225,1227の間の遷移周波数の場合には、対応する周波数タイルの10%の範囲で行われる。さらなる実施形態では、あらかじめ定められた検出帯域幅が1バークである。パッチ境界の周囲の1バークの範囲内でトーン部を除去することができ、これにより、完全な検出範囲が2バーク、すなわち、低帯域に1バーク、高帯域に1バークとなる。ここで、低帯域の1バークは、高帯域の1バークに直に隣接する。
本発明の他の見地によると、フィルタリンギングアーティファクトの削減のため、周波数領域のクロスオーバーフィルタが、2つの連続するスペクトル領域、すなわちコア帯域と第1パッチとの間、または2つのパッチの間に適用される。クロスオーバーフィルタは、信号適応的であることが望ましい。
クロスオーバーフィルタは、2つのフィルタ、低スペクトル領域周に適用されるフェードアウトフィルタhoutと、高スペクトル領域に適用されるフェードインフィルタhinとからなる。
各フィルタは、長さNを有する。
加えて、双方のフィルタの傾斜は、クロスオーバーフィルタのノッチ特性を決定する信号適応値Xbias
により特徴付けられる。ここで、0≦Xbias≦Nであり、
bias=0のとき、双方のフィルタの合計が1に等しく、そのフィルタにはノッチフィルタ特性はない。
bias=Nのとき、双方のフィルタは完全に零である。
ここで、k=0,1,...,N-1は周波数インデックスである。図12Cは、そのようなクロスオーバーフィルタの一例を示す。
この例において、フィルタhoutを生成するために、以下の式を使用する。
以下の式が、フィルタhin,houtがどのように適用されるかを説明する。
ここで、Yは、組み立てられたスペクトル,kは遷移周波数、LFは低周波数コンテンツ、HFは高周波数コンテンツである。
次に、この技術が役に立つことの説明を提示する。以下の例のオリジナル信号は過渡信号であり、特に、カットオフ周波数22kHzで低域通過濾波されたものである。最初に、この過渡信号が、変換領域で6kHzに帯域制限される。続いて、低域通過濾波されたオリジナル信号の帯域が、24kHzに拡張される。帯域の拡張は、LF帯域を3回コピーすることにより達成され、変換により6kHzを超えて得られる周波数レンジを完全に充填する。
図11Aは、この信号のスペクトル示す。このスペクトルは、上述した変換のレンガ壁特性(音声ピーク1100)による、過渡信号をスペクトル的に取り囲むフィルタリンギングアーティファクトの典型的なスペクトルと考えられる。本発明のアプローチを適用することにより、フィルタリンギングが、各過渡周波数毎に、ほぼ20dB削減される(音声ピークが削減される)。
同じ効果が、異なる図面の図11B,11Cにも示される。図11Bは、過渡信号のスペクトル図を示す。この過渡信号は、どのようなフィルタリンギング削減もしない、上述のBWEを適用した後の、過渡に一時的に前後する上述したフィルタリンギングアーティファクトを有する。水平線はそれぞれ、連続するパッチの間の遷移周波数におけるフルタリンギングを示す。図6は、BWEに本発明のアプローチを適用した後の、同じ信号を示す。フィルタリンギングは、前の図に示した信号に比較し、ほぼ20dB削減されている。
次に、図14A,14Bを参照して、クアナライザ特性について既に説明した、クロスオーバーフィルタの発明の見地についてさらに説明する。しかしながら、クロスオーバーフィルタ710は、図6Aから図7Bを参照して説明した本発明とは独立に実施することもできる。
図14Aは、符号化されたコア信号とパラメトリックデータの情報とを含む符号化オーディオ信号を復号する復号装置を示す。この復号装置は、符号化されたコア信号を復号して復号コア信号を得るコアデコーダ1400を備える。復号コア信号が、帯域幅が図13A、図13Bを参照した説明したように帯域制限されていてもよく、また、コアデコーダが、図1から図5Cまたは図9Aから図10Dを参照して説明した全周波数範囲すなわちフルレートの符号器であってもよい。
さらに、タイル生成器1404が、復号コア信号のスペクトル部を用いて、復号コア信号に含まれない周波数を有する1以上のスペクトルタイルを再生する。タイルは、例えば図3Aを参照して説明したような、再構築帯域に再構築された第2スペクトル部でもよく、または、高解像度で再構築される第1スペクトル部を含むこともできるが、代替的に、エンコーダが図13Aに示すような強い帯域制限を実行するときには、スペクトルタイルは完全に空の周波数帯域でもよい。
さらに、クロスオーバーフィルタ1406は、復号コア信号と、ギャップ充填周波数309から第1タイル停止周波数に延びる周波数を有する第1周波数タイルと、を周波数上でクロスオーバーフィルタリングするために、あるいは、第1周波数タイル1225と、第1周波数タイル1225の上側境界周波数に周波数隣接する下側境界周波数を有する第2周波数タイルと、を周波数上でクロスオーバーフィルタリングするために、設けられる。
さらなる実施形態では、クロスオーバーフィルタ1406の出力信号が、包絡線調整器1408に入力される。包絡線調整器1408は、復号オーディオ信号に含まれるパラメトリックスペクトル包絡線情報をパラメトリック付帯情報として適用し、最終的に包絡線調整された再生信号を得る。要素1404,1406,1408は、例えば図13B、図1Bまたは図6Aに示した周波数再生器として実現される。
図14Bは、クロスオーバーフィルタ1406のさらなる実現形態を示す。クロスオーバーフィルタ1406は、第1入力信号IN1を受け取るフェードアウトサブフィルタ1420と、第2入力信号IN2を受け取るフェードインサブフィルタ1422と、を備える。双方のフィルタ1420,1422の結果、すなわち出力は、結合器1424に供給される。結合器1424は、例えば加算器である。結合器1424は、周波数ビンのための周波数値を出力する。図12Cは、フェードアウトサブフィルタ特性1420aと、フェードインサブフィルタ特性1422aと、を含むクロスフェード関数の一例を示す。2つのフィルタは、ある周波数オーバーラップを有する。図12Cの例では、この周波数オーバーラップは、12に等しい、すなわちN=12である。したがって、例えばソースレンジ1252などの他の周波数値は、影響を受けない。ソースレンジ1252の最も高い周波数ビン21だけが、フェードアウト関数1420aの影響を受ける。
一方、周波数タイル1225の最も低い21周波数線だけは、フェードイン関数1422の影響を受ける。
さらに、クロスフェード関数から、9と13の間の周波数線が影響を受けるが、フェードイン関数は実際には1と9の間の周波数には影響せず、フェードアウト関数1420aは13と21の間の周波数線に影響しないことが明らかである。これは、オーバーラップが周波数線9および13の間に必要なだけで、fx1のようなクロスオーバー周波数は、周波数標本すなわち周波数ビン11に配置されることになる。したがって、ソースレンジと最初の周波数タイルとの間の2つの周波数ビンまたは周波数値のオーバーラップは、クロスオーバーまたはクロスフェード関数を実現するために必要なだけである。
特定の実施形態に依存して、より高いまたはより低いオーバーラップが適用でき、付加的に、コサイン関数ではない他のフェージング関数を用いることもできる。さらに、図12Cに示すように、ある特定のノッチをクロスオーバーレンジ内に適用することが望ましい。別の言い方をすれば、境界領域のエネルギは、ノッチの無いクロスフェード関数の場合と同様に、双方のフィルタ関数が1に加算されることがないという事実により削減される。この周波数タイルすなわち最初の周波数タイルの境界に対するエネルギ損失は、低側境界および高側境界で減衰する。しかしながら、クロスオーバーフィルタによる処理に続いてスペクトル包絡線調整を行うことで、全体の周波数には触れられず、図3Aを参照して説明した対応するスケールファクタのような、スペクトル包絡線データにより定義される。言い換えると、図9Bの計算器918がこのとき、「既に生成された生ターゲットレンジ」を計算し、これがクロスオーバーフィルタの出力となる。さらに、内挿によるトーン部の除去によるエネルギ損失は、この除去が次に低側タイルエネルギを引き起こし、完全再構築帯域に対する利得ファクタが高くなるという事実により相殺される。その一方で、しかしながら、クロスオーバー周波数はさらなるエネルギ集中を主端数タイルの中間に引き起こし、これが最終的に、特に図11Aから図11Cを参照して説明した過渡により生じるアーティファクトを有効に削減する。
図14Bは、異なる入力組み合わせを示す。ソース周波数レンジと周波数タイルとの間の境界のフィルタリングのため、入力1はコアレンジの上側スペクトル部であり、入力2は、最初の周波数タイル、または単一周波数タイルだけが存在する場合にはそのタイルの、下側スペクトル部である。さらに、入力は最初の周波数タイルでもよく、遷移周波数は最初のタイルの上側周波数境界でもよく、サブフィルタ1422への入力は、2番目の周波数タイルの低側部とする。付加的な3番目の周波数タイルが存在する場合には、さらなる遷移周波数が、2番目の周波数タイルと3番目の周波数タイルとの間の周波数境界となり、フェードアウトサブフィルタ1420への入力は、図12Cの特性を使用する場合、フィルタパラメータにより定義されるように、2番目の周波数タイルの上側周波数レンジであり、フェードインサブフィルタ1422への入力は、3番目の周波数タイルの低側部で、図12Cの例では、最も下側の21スペクトル線となる。
図12Aに示すように、フェードアウトサブフィルタおよびフェードインサブフィルタに対して、等しいパラメータNを有することが望ましい。しかしながら、これは必須ではない。Nの値は変化させることができ、そのとき、結果として、フィルタ「ノッチ」が下側と上側のレンジ間で非対称となる。さらに、フェードイン/フェードアウト関数は、必ずしも図12Aのように同じ特性である必要はない。代わりに、非対称特性を使用することもできる。
さらに、クロスオーバーフィルタ特性を、信号適応的とすることが望ましい。したがって、信号解析に基づいて、フィルタ特性が適応化される。クロスオーバーフィルタは特に過渡信号に有効であることから、過渡信号が発生しているかが検出される。過渡信号が発生しているときには、図12Cに示すようなフィルタ特性を用いることができる。しかし、非過渡信号が検出されたときには、フィルタ特性を変更して、クロスオーバーフィルタの影響を削減することが望ましい。これは、例えば、Nをゼロに設定するか、あるいはXbiasをゼロに設定し、これにより、双方のフィルタの合計を1にする、すなわち、結果として得られるフィルタを無ノッチフィルタ特性とする。しかしながら、望ましくは、急激なフィルタ特性の変化によるアーティファクトを防止するために、パラメータN、Xbiasを変更して比較的遅い変化特性とすることがよい。さらに、信号がある特定の過渡/トーン性検出器により検出されるようなより急速に変化する場合でも、比較的小さなフィルタ特性変化を許容するために、低域通過フィルタが望ましい。検出器は、図14Aに1405で示される。検出器1405は、タイル生成器1404への入力信号またはタイル生成器1404の出力信号を受け取ることもでき、また、AAC復号化からのショートブロックインディケーションのような過渡/非過渡情報を受け取るため、コアデコーダ1400に接続されることもできる。当然、図12Cに示す物以外のどのようなクロスオーバーフィルタでも、同様に使用することができる。
このように、過渡検出に基づいて、またはトーン性検出あるいは他のいずれかの信号特性検出に基づいて、クロスオーバーフィルタ1406の特性が、上述のように変更される。
一部の側面については、エンコーディングまたは復号化の装置の文脈において説明されたが、これらの側面は、対応する方法の記載も示すことは明らかであり、ブロックや装置は、方法ステップまたは方法ステップの特徴に対応する。同様に、方法の観点から説明された側面もまた、対応するブロックもしくは物品または対応する装置の特徴の説明としても機能するものである。一部のまたは全ての方法ステップは、例えば、マイクロプロセッサ、プログラム可能なコンピュータ、または電子回路などのハードウェア装置によって(またはこれを用いて)実行されてもよい。一部の実施形態において、最も重要な方法ステップの1つ以上がこのような装置によって実行されてもよい。
所定の実施に係る要件次第では、発明の実施形態は、ハードウェアで実行されてもよいし、ソフトウェアで実行されてもよい。実施は、例えばフレキシブルディスク、ハードディスクドライブ(HDD)、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROM(登録商標)、またはフラッシュメモリなどのような、電子的に読み取り可能な制御信号が蓄積されたデジタル蓄積媒体を用いてすることができ、当該方法が実行されるようこれらのデジタル蓄積媒体がプログラム可能なコンピュータシステムと連携する(または連携することできる)。したがって、デジタル蓄積媒体は、コンピュータに読み取り可能である。
本発明による一部の実施形態では、電子的に読み取り可能な制御信号を有するデータキャリアを含み、当該キャリアは、開示される方法のいずれかが実施されるよう、プログラム可能なコンピュータシステムと連携することができる。
概して、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実行されてもよく、このようなプログラムコードは、コンピュータプログラム製品がコンピュータにおいて実行されるとき、上記方法のいずれかを実施するよう動作する。このプログラムコードは、例えば機械で読み取り可能なキャリアに蓄積されてもよい。
その他の実施形態においては、開示されるいずれかの方法を実行する、機械で読み取り可能なキャリアに蓄積されたコンピュータプログラムを有する。
つまり、本発明に係る方法は、その一実施形態においては、コンピュータプログラムがコンピュータで実行されたとき、開示されるいずれかの方法を実行するプログラムコードを有するコンピュータプログラムとして構成される。
本発明に係る方法のさらなる実施形態は、したがって、開示される方法のいずれかを実施するコンピュータプログラムが蓄積されたデータキャリア(またはデジタル蓄積媒体またはコンピュータに読み取り可能な媒体)として構成される。データキャリア、デジタル蓄積媒体、または蓄積媒体は、一般的には有形でおよび/または固定的である。
本発明に係る方法のさらなる実施形態は、したがって、開示される方法のいずれかを実施するコンピュータプログラムを示すデータストリームまたは信号シーケンスとして構成される。このデータストリームまたは信号シーケンスは、例えば、データコミュニケーション接続(例えばインターネットなど)を介して送られるよう構成されてもよい。
その他の実施形態においては、開示されるいずれかの方法を実行するよう構成または適応された処理手段、例えばコンピュータ、プログラム可能な論理機構を有する。
その他の実施形態においては、開示されるいずれかの方法を実行するコンピュータプログラムをインストールしたコンピュータを有する。
本発明によるその他の実施形態においては、開示されるいずれかの方法を実行するコンピュータプログラムを、受信器に対して移動(例えば電子的にまたは選択的に)させるよう構成された装置またはシステムを有する。受信器は、例えばコンピュータや携帯機器、メモリ機器などであってもよい。装置またはシステムは、例えば、コンピュータプログラムを受信器側に移動させるファイルサーバを有してもよい。
一部の実施形態においては、開示される方法の機能の一部または全部を実行するために、プログラム可能な論理機構(例えば、フィールドプログラマブルゲートアレイ)を用いてもよい。一部の実施形態においては、開示される方法のいずれかを実行するために、フィールドプログラマブルゲートアレイとマイクロプロセッサとを連携させてもよい。一般に、これらの方法はハードウェア装置によって実行されることが好ましい。
上述の実施形態は、本発明の原理を単に示すに過ぎない。この明細書に開示する構成や詳細に対して変更または変形を施すことができることは、当業者にとって明らかであると理解される。したがって、次に続く特許請求の範囲によってのみ制限される趣旨であり、実施形態の記載または説明によってなされた特定の詳細によっては、何ら限定されない。
US 8,412,365 B:Liljeryd, Lars; Ekstrand, Per; Henn, Fredrik; Kjorling, Kristofer: Spectral translation/folding in the subband domain, April 2, 2013.
Dietz, L. Liljeryd, K. Kjoerling and O. Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002. Ferreira, D. Sinha, "Accurate Spectral Replacement", Audio Engineering Society Convention, Barcelona, Spain 2005. D. Sinha, A. Ferreira1 and E. Harinarayanan, "A Novel Integrated Audio Bandwidth Extension Toolkit (ABET)", Audio Engineering Society Convention, Paris, France 2006. R. Annadana, E. Harinarayanan, A. Ferreira and D. Sinha, "New Results in Low Bit Rate Speech Coding and Bandwidth Extension", Audio Engineering Society Convention, San Francisco, USA 2006. T. Zernicki, M. Bartkowiak, "Audio bandwidth extension by frequency scaling of sinusoidal partials", Audio Engineering Society Convention, San Francisco, USA 2008. J. Herre, D. Schulz, Extending the MPEG−4 AAC Codec by Perceptual Noise Substitution, 104th AES Convention, Amsterdam, 1998, Preprint 4720. M. Neuendorf, M. Multrus, N. Rettelbach, et al., MPEG Unified Speech and Audio Coding−The ISO/MPEG Standard for High−Efficiency Audio Coding of all Content Types, 132nd AES Convention, Budapest, Hungary, April, 2012. McAulay, Robert J., Quatieri, Thomas F. "Speech Analysis/Synthesis Based on a Sinusoidal Representation". IEEE Transactions on Acoustics, Speech, And Signal Processing, Vol 34(4), August 1986. Smith, J.O., Serra, X. "PARSHL: An analysis/synthesis program for non−harmonic sounds based on a sinusoidal representation", Proceedings of the International Computer Music Conference, 1987. Purnhagen, H.; Meine, Nikolaus, "HILN−the MPEG−4 parametric audio coding tools", Circuits and Systems, 2000. Proceedings. ISCAS 2000 Geneva. The 2000 IEEE International Symposium on , vol.3, no., pp.201,204 vol.3, 2000 International Standard ISO/IEC 13818−3, "Generic Coding of Moving Pictures and Associated Audio: Audio", Geneva, 1998. M. Bosi, K. Brandenburg, S. Quackenbush, L. Fielder, K. Akagiri, H. Fuchs, M. Dietz, J. Herre, G. Davidson, Oikawa: "MPEG−2 Advanced Audio Coding", 101st AES Convention, Los Angeles 1996 J. Herre, "Temporal Noise Shaping, Quantization and Coding methods in Perceptual Audio Coding: A Tutorial introduction", 17th AES International Conference on High Quality Audio Coding, August 1999 J. Herre, "Temporal Noise Shaping, Quantization and Coding methods in Perceptual Audio Coding: A Tutorial introduction", 17th AES International Conference on High Quality Audio Coding, August 1999 International Standard ISO/IEC 23001−3:2010, Unified speech and audio coding Audio, Geneva, 2010. International Standard ISO/IEC 14496−3:2005, Information technology − Coding of audio−visual objects − Part 3: Audio, Geneva, 2005. P. Ekstrand, "Bandwidth Extension of Audio Signals by Spectral Band Replication", in Proceedings of 1st IEEE Benelux Workshop on MPCA, Leuven, November 2002 F. Nagel, S. Disch, S. Wilde, A continuous modulated single sideband bandwidth extension, ICASSP International Conference on Acoustics, Speech and Signal Processing, Dallas, Texas (USA), April 2010 Daudet, L.; Sandler, M.; "MDCT analysis of sinusoids: exact results and applications to coding artifacts reduction," Speech and Audio Processing, IEEE Transactions on , vol.12, no.3, pp. 302− 312, May 2004.

Claims (17)

  1. 符号化コア信号とパラメトリックデータとを含む符号化オーディオ信号を復号する復号装置において、
    前記符号化コア信号を復号して復号化コア信号を得るコアデコーダ(600)と、
    周波数再生動作の前または後に前記復号化コア信号を解析して解析結果(603)を得るアナライザ(602)と、
    前記復号化コア信号のスペクトル部、前記パラメトリックデータ(605)および前記解析結果(603)を使用して、前記復号化コア信号に含まれないスペクトル部を再生成する周波数再生成器と
    を備える復号装置。
  2. 請求項1に記載の復号装置において、
    前記アナライザ(614)は、周波数再生動作の前または後の前記復号化コア信号を解析して、前記復号化コア信号内に1以上の局所スペクトル極小を見つけ、その局所スペクトル極小を識別する解析結果(603)を提供する構成であり、
    前記周波数再生成器(504,616)は、スペクトル部を再生する構成であり、
    復号化信号のスペクトル部内または再生スペクトル部内の周波数タイルの境界が、前記1以上の局所スペクトル極小に設定される
    ことを特徴とする復号装置。
  3. 請求項1に記載の復号装置において、
    前記周波数再生成器(604)は、予備再生信号(703)を生成する構成であり、
    前記アナライザ(602)は、前記予備再生信号を解析して、アーティファクトが作り出した信号部を検出する構成であり、
    前記周波数再生成器(604)はさらに、前記予備再生信号に含まれる前記アーティファクトが作り出した信号部を削減または除去するため、前記予備再生信号を操作、または前記予備再生信号のパラメータとは異なるパラメータを用いてさらに再生を実行するマニピュレータ(722)を有する
    ことを特徴とする復号装置。
  4. 請求項1から3のいずれか1項に記載の復号装置において、
    前記周波数再生成器(604)は、前記復号化コア信号のスペクトル部を用いて前記復号化コア信号内に含まれないスペクトル部を有する予備再生信号(703)を再生して、再生スペクトル部を得る構成であり、
    前記周波数再生成器(604)は、前記復号化コア信号と前記再生スペクトル部との間の周波数境界の近くの、または前記周波数再生成器(604)を用いて生成された2つの再生スペクトル部または前記復号化コア信号の異なるスペクトル部の間の周波数境界の近くの、アーティファクトが作り出した信号部を検出する構成であり、
    前記周波数再生成器(604)はさらに、前記予備再生信号生成するために使用する制御データとは異なる操作された制御データを使用して再生信号を新たに生成するため、前記予備再生信号または制御データを操作するマニピュレータ(722)を有する
    ことを特徴とする復号装置。
  5. 請求項4に記載の復号装置において、
    前記周波数再生成器(604)は、前記復号化コア信号の1以上のスペクトル部を用いて前記スペクトル部を引き出し、生のスペクトル部を得るタイル生成器(820)を有し、
    前記マニピュレータ(824)は、前記生のスペクトル部または前記周波数タイル生成器(820)を操作して、操作されたスペクトル部を得るように構成され、
    前記周波数再生成器(604)はさらに、前記パラメトリックデータ(605)を用いて前記操作されたスペクトル部の包絡線調整を行うように構成されたスペクトル包絡線調整器(826)を有する
    ことを特徴とする復号装置。
  6. 請求項1から5のいずれか1項に記載の復号装置において、
    前記アナライザ(602)は、周波数検出範囲内にあるトーン信号部を検出する構成であり、その周波数検出範囲は、再構築範囲の周波数境界から所定の帯域幅だけ延びる、または再構築範囲内の隣接周波数タイルの間の、所定の帯域幅の範囲であり、この所定の帯域幅は、ソース周波数レンジまたは再構築周波数レンジの帯域幅の20%未満、または1バークである
    ことを特徴とする復号装置。
  7. 請求項6に記載の復号装置において、前記マニピュレータ(824)は、前記所定の帯域幅内で、前記再生信号内のトーン部を含むスペクトル部を減衰させる、または取り除く(708)ように構成されていることを特徴とする復号装置。
  8. 請求項7に記載の復号装置において、前記マニピュレータ(722,824)は、前記トーン信号(802)の開始周波数にある開始スペクトル部と、前記トーン信号(802)の終了周波数にある終了スペクトル部と、を判定し、前記開始周波数と前記終了周波数との間に内挿(804)して内挿信号部を取得し、前記開始周波数と前記終了周波数との間のトーン部を前記内挿信号部(806)で置き替えることを特徴とする復号装置。
  9. 請求項7に記載の復号装置において、前記マニピューレータ(822)は、ランダムに、または非ランダムに、前記復号化コア信号の非トーン信号部または前記再生スペクトル部(810)の非トーン信号部により決定されるエネルギを有するスペクトル線(808)を生成することを特徴とする復号装置。
  10. 請求項4から9のいずれか1項に記載の復号装置において、
    前記アナライザは、ある特定の周波数のアーティファクトが作り出した信号部を検出する構成であり、
    前記マニピュレータ(722,824)は、タイル生成器が前記復号化コア信号のスペクトル部の周波数境界または再生スペクトル部の周波数境界を変化させるように前記タイル生成器を制御して、アーティファクトが作り出した信号部がアーティファクトをほとんど、または全く、引き起こさないようにする
    ことを特徴とする復号装置。
  11. 請求項1から10のいずれか1項に記載の復号装置において、
    前記アナライザ(602)は、前記復号化コア信号のスペクトル部内または再生信号内のピーク部の中間スプリットを、前記復号化コア信号の周波数境界、またはそれを用いて生成された2つの再生スペクトル部または前記復号化コア信号の異なるスペクトル部または前記再生され前記再生信号の異なるスペクトル部の間の周波数境界で検出する構成であり、
    前記周波数再生成器は、前記復号化コア信号と前記再生信号との間の周波数境界、またはそれを用いて生成された2つの再生スペクトル部または前記復号化コア信号の異なるスペクトル部の間の周波数境界を変更するか、または、最大周波数を変更し、スプリッティングを削減または除去する構成である
    ことを特徴とする復号装置。
  12. 請求項1から11のいずれか1項に記載の復号装置において、
    前記周波数再生器(604)は、前記復号化コア信号の同じまたは異なるスペクトル部を用いて、前記復号化コア信号の第1スペクトル部に対する第1周波数タイルおよび第2スペクトル部に対する第2周波数タイルを生成するタイル生成器(820)を有し、
    前記アナライザ(602)は、ピークスペクトル部が前記第2周波数タイルの下側周波数境界によりクリップされているか、あるいは前記第1周波数タイルの上側周波数境界によりクリップされているか、あるいは前記第1周波数タイルと前記復号化コア信号の所定のギャップ充填開始周波数(309)との下側周波数境界によりクリップされているかを検出する構成であり、
    前記マニピュレータ(824)は、クリッピングが削減または除去されるように修正された開始または停止周波数境界を有する修正周波数タイルを生成するように、前記タイル生成器(820)を制御する構成である
    ことを特徴とする復号装置。
  13. 請求項1から12のいずれか1項に記載の復号装置において、
    前記コアデコーダは、ゼロ表現とは異なるスペクトル値により表現される第1セットの第1スペクトル部を含む周波数領域復号化スペクトル部を得る構成であり、
    第2セットの第2スペクトル部はスペクトル値に対してゼロ表現により表現され、
    パラメトリック情報が前記第2セットの前記第2スペクトル部に対して提供され、
    前記周波数再生器(604)は、前記第1セットのスペクトル部から復号化されたスペクトル部を用いて、前記第1セットのスペクトル部に含まれない再構築帯域内のスペクトル部を再生するように構成され、
    前記復号装置はさらに、再生されたスペクトル部と前記復号化コア信号のスペクトル部とを時間表現に変換する周波数時間変換器(828)を備える
    ことを特徴とする復号装置。
  14. 請求項1から13のいずれか1項に記載の復号装置において、
    前記コアデコーダ(600)は、修正離散コサイン変換(MDCT)スペクトル値を出力する構成であり、
    前記周波数時間変換器(828)は、オーバーラップ加算処理をその後に得られるMDCTフレームに加える逆MDCT変換((512,514,516)を実行するためのプロセッサを備える
    ことを特徴とする復号装置。
  15. 請求項1から14のいずれか1項に記載の復号装置において、
    前記周波数再生器(604)は、予備再生された信号を生成(702)する構成であり、
    前記周波数再生器(604)は、前記予備再生された信号内のトーン成分を検出(704)する構成であり、
    前記周波数再生器は、ソースレンジと再構成レンジとの間、または再構成されたレンジ内の隣接周波数タイル間の遷移周波数を、前記検出(704)の結果に基づいて調整し、再生信号を生成する構成であり、
    前記再生器はさらに、前記遷移周波数の周りの検出レンジ内にあるトーン成分を除去する(708)構成であり、
    前記周波数再生器はさらに、前記パラメトリックデータ(605)を用いるクロスフィルタの結果をスペクトル包絡線整形するスペクトル波形整形器(712)を有する
    ことを特徴とする復号装置。
  16. 符号化コア信号とパラメトリックデータとを含む符号化オーディオ信号を復号する方法において、
    周波数再生操作を実行する前または後に前記符号化コア信号を解析(604)して解析結果(603)を提供し、
    前記復号化コア信号のスペクトル部、前記パラメトリックデータ(605)、および前記解析結果(603)を用いて、前記復号化コア信号に含まれないスペクトル部を再生(604)する
    復号方法。
  17. コンピュータまたはプロセッサで動作するとき、請求項16に記載の方法を実行するコンピュータプログラム。
JP2016528417A 2013-07-22 2014-07-15 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム Active JP6400702B2 (ja)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
EP13177346.7 2013-07-22
EP13177346 2013-07-22
EP13177350.9 2013-07-22
EP13177353 2013-07-22
EP13177350 2013-07-22
EP13177348.3 2013-07-22
EP13177353.3 2013-07-22
EP13177348 2013-07-22
EP13189382.8 2013-10-18
EP13189382.8A EP2830063A1 (en) 2013-07-22 2013-10-18 Apparatus, method and computer program for decoding an encoded audio signal
PCT/EP2014/065118 WO2015010953A1 (en) 2013-07-22 2014-07-15 Apparatus, method and computer program for decoding an encoded audio signal

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017216774A Division JP6568566B2 (ja) 2013-07-22 2017-11-09 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2016527557A true JP2016527557A (ja) 2016-09-08
JP2016527557A5 JP2016527557A5 (ja) 2016-10-27
JP6400702B2 JP6400702B2 (ja) 2018-10-03

Family

ID=49385156

Family Applications (12)

Application Number Title Priority Date Filing Date
JP2015544509A Active JP6144773B2 (ja) 2013-07-22 2014-07-15 時間雑音/パッチ整形を用いる符号化オーディオ信号の符号化および復号化装置および方法
JP2016528414A Active JP6389254B2 (ja) 2013-07-22 2014-07-15 復号装置、復号方法およびコンピュータプログラム
JP2016528413A Active JP6321797B2 (ja) 2013-07-22 2014-07-15 符号化装置、符号化方法およびコンピュータプログラム
JP2016528416A Active JP6186082B2 (ja) 2013-07-22 2014-07-15 オーディオ信号を適応スペクトルタイル選択を用いて復号化および符号化する装置および方法
JP2016528412A Active JP6310074B2 (ja) 2013-07-22 2014-07-15 インテリジェントギャップ充填フレームワーク内の2チャネル処理を用いるオーディオ符号器、オーディオ復号器およびその方法
JP2016528415A Active JP6306702B2 (ja) 2013-07-22 2014-07-15 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
JP2016528417A Active JP6400702B2 (ja) 2013-07-22 2014-07-15 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
JP2017182327A Active JP6705787B2 (ja) 2013-07-22 2017-09-22 復号装置、復号方法およびコンピュータプログラム
JP2017216774A Active JP6568566B2 (ja) 2013-07-22 2017-11-09 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
JP2017234677A Active JP6691093B2 (ja) 2013-07-22 2017-12-06 オーディオエンコーダ、符号化方法およびコンピュータプログラム
JP2020000087A Active JP7092809B2 (ja) 2013-07-22 2020-01-06 再構築帯域に対するエネルギ情報を用いてオーディオ信号を復号化または符号化する装置および方法
JP2022097243A Pending JP2022123060A (ja) 2013-07-22 2022-06-16 符号化オーディオ信号を復号する復号装置および復号方法

Family Applications Before (6)

Application Number Title Priority Date Filing Date
JP2015544509A Active JP6144773B2 (ja) 2013-07-22 2014-07-15 時間雑音/パッチ整形を用いる符号化オーディオ信号の符号化および復号化装置および方法
JP2016528414A Active JP6389254B2 (ja) 2013-07-22 2014-07-15 復号装置、復号方法およびコンピュータプログラム
JP2016528413A Active JP6321797B2 (ja) 2013-07-22 2014-07-15 符号化装置、符号化方法およびコンピュータプログラム
JP2016528416A Active JP6186082B2 (ja) 2013-07-22 2014-07-15 オーディオ信号を適応スペクトルタイル選択を用いて復号化および符号化する装置および方法
JP2016528412A Active JP6310074B2 (ja) 2013-07-22 2014-07-15 インテリジェントギャップ充填フレームワーク内の2チャネル処理を用いるオーディオ符号器、オーディオ復号器およびその方法
JP2016528415A Active JP6306702B2 (ja) 2013-07-22 2014-07-15 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム

Family Applications After (5)

Application Number Title Priority Date Filing Date
JP2017182327A Active JP6705787B2 (ja) 2013-07-22 2017-09-22 復号装置、復号方法およびコンピュータプログラム
JP2017216774A Active JP6568566B2 (ja) 2013-07-22 2017-11-09 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
JP2017234677A Active JP6691093B2 (ja) 2013-07-22 2017-12-06 オーディオエンコーダ、符号化方法およびコンピュータプログラム
JP2020000087A Active JP7092809B2 (ja) 2013-07-22 2020-01-06 再構築帯域に対するエネルギ情報を用いてオーディオ信号を復号化または符号化する装置および方法
JP2022097243A Pending JP2022123060A (ja) 2013-07-22 2022-06-16 符号化オーディオ信号を復号する復号装置および復号方法

Country Status (20)

Country Link
US (24) US10332539B2 (ja)
EP (20) EP2830063A1 (ja)
JP (12) JP6144773B2 (ja)
KR (7) KR101822032B1 (ja)
CN (12) CN105518777B (ja)
AU (7) AU2014295295B2 (ja)
BR (10) BR122022011238B1 (ja)
CA (8) CA2918835C (ja)
ES (9) ES2667221T3 (ja)
HK (1) HK1211378A1 (ja)
MX (7) MX362036B (ja)
MY (5) MY180759A (ja)
PL (8) PL3025337T3 (ja)
PT (7) PT3025328T (ja)
RU (7) RU2643641C2 (ja)
SG (7) SG11201600422SA (ja)
TR (1) TR201816157T4 (ja)
TW (7) TWI541797B (ja)
WO (7) WO2015010953A1 (ja)
ZA (5) ZA201502262B (ja)

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2725416C1 (ru) 2012-03-29 2020-07-02 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
CN110890101B (zh) * 2013-08-28 2024-01-12 杜比实验室特许公司 用于基于语音增强元数据进行解码的方法和设备
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
BR112016020988B1 (pt) 2014-03-14 2022-08-30 Telefonaktiebolaget Lm Ericsson (Publ) Método e codificador para codificação de um sinal de áudio, e, dispositivo de comunicação
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
BR112017010911B1 (pt) * 2014-12-09 2023-11-21 Dolby International Ab Método e sistema de decodificação para ocultar erros em pacotes de dados que devem ser decodificados em um decodificador de áudio baseado em transformação de cosseno discreto modificado
TWI693594B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
GB201504403D0 (en) 2015-03-16 2015-04-29 Microsoft Technology Licensing Llc Adapting encoded bandwidth
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
EP3171362B1 (en) * 2015-11-19 2019-08-28 Harman Becker Automotive Systems GmbH Bass enhancement and separation of an audio signal into a harmonic and transient signal component
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
BR112018014799A2 (pt) 2016-01-22 2018-12-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. aparelho e método para estimativa de uma diferença de tempo entre canais
CA3011883C (en) * 2016-01-22 2020-10-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for mdct m/s stereo with global ild to improve mid/side decision
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
DE102016104665A1 (de) 2016-03-14 2017-09-14 Ask Industries Gmbh Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals
US10741196B2 (en) 2016-03-24 2020-08-11 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
US9984701B2 (en) 2016-06-10 2018-05-29 Apple Inc. Noise detection and removal systems, and related methods
US10770082B2 (en) 2016-06-22 2020-09-08 Dolby International Ab Audio decoder and method for transforming a digital audio signal from a first to a second frequency domain
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10812550B1 (en) * 2016-08-03 2020-10-20 Amazon Technologies, Inc. Bitrate allocation for a multichannel media stream
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US9679578B1 (en) 2016-08-31 2017-06-13 Sorenson Ip Holdings, Llc Signal clipping compensation
EP3306609A1 (en) 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information
US10362423B2 (en) * 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
EP3324406A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
US10304468B2 (en) 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
US10090892B1 (en) * 2017-03-20 2018-10-02 Intel Corporation Apparatus and a method for data detecting using a low bit analog-to-digital converter
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382703A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
WO2018211050A1 (en) 2017-05-18 2018-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Managing network device
US11188422B2 (en) 2017-06-02 2021-11-30 Apple Inc. Techniques for preserving clone relationships between files
JP6906876B2 (ja) * 2017-06-19 2021-07-21 アールティーエックス アー/エス オーディオ信号の符号化および復号化
EP3649640A1 (en) 2017-07-03 2020-05-13 Dolby International AB Low complexity dense transient events detection and coding
EP3701527B1 (en) * 2017-10-27 2023-08-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating a bandwidth-enhanced audio signal using a neural network processor
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
WO2019091573A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
TWI809289B (zh) 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
JPWO2019155603A1 (ja) * 2018-02-09 2020-06-11 三菱電機株式会社 音響信号処理装置及び音響信号処理方法
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3576088A1 (en) * 2018-05-30 2019-12-04 Fraunhofer Gesellschaft zur Förderung der Angewand Audio similarity evaluator, audio encoder, methods and computer program
RU2769788C1 (ru) * 2018-07-04 2022-04-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, многосигнальный декодер и соответствующие способы с использованием отбеливания сигналов или постобработки сигналов
CN109088617B (zh) * 2018-09-20 2021-06-04 电子科技大学 比率可变数字重采样滤波器
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
EP3671741A1 (en) * 2018-12-21 2020-06-24 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Audio processor and method for generating a frequency-enhanced audio signal using pulse processing
WO2020146870A1 (en) * 2019-01-13 2020-07-16 Huawei Technologies Co., Ltd. High resolution audio coding
JP7262593B2 (ja) * 2019-01-13 2023-04-21 華為技術有限公司 ハイレゾリューションオーディオ符号化
EP3928315A4 (en) * 2019-03-14 2022-11-30 Boomcloud 360, Inc. SPATIALLY SENSITIVE MULTIBAND COMPRESSION SYSTEM WITH PRIORITY
CN110265043B (zh) * 2019-06-03 2021-06-01 同响科技股份有限公司 自适应有损或无损的音频压缩和解压缩演算方法
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
US11527252B2 (en) 2019-08-30 2022-12-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. MDCT M/S stereo
TWI702780B (zh) * 2019-12-03 2020-08-21 財團法人工業技術研究院 提升共模瞬變抗擾度的隔離器及訊號產生方法
CN111862953B (zh) * 2019-12-05 2023-08-22 北京嘀嘀无限科技发展有限公司 语音识别模型的训练方法、语音识别方法及装置
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
JP2023509201A (ja) * 2020-01-13 2023-03-07 ホアウェイ・テクノロジーズ・カンパニー・リミテッド オーディオ符号化及び復号方法、並びにオーディオ符号化及び復号デバイス
WO2021154211A1 (en) * 2020-01-28 2021-08-05 Hewlett-Packard Development Company, L.P. Multi-channel decomposition and harmonic synthesis
CN111199743B (zh) * 2020-02-28 2023-08-18 Oppo广东移动通信有限公司 音频编码格式确定方法、装置、存储介质及电子设备
CN111429925B (zh) * 2020-04-10 2023-04-07 北京百瑞互联技术有限公司 一种降低音频编码速率的方法及系统
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备
CN111371459B (zh) * 2020-04-26 2023-04-18 宁夏隆基宁光仪表股份有限公司 一种适用于智能电表的多操作高频替换式数据压缩方法
CN113808597A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113808596A (zh) * 2020-05-30 2021-12-17 华为技术有限公司 一种音频编码方法和音频编码装置
CN113113033A (zh) * 2021-04-29 2021-07-13 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、设备及可读存储介质
CN113365189B (zh) * 2021-06-04 2022-08-05 上海傅硅电子科技有限公司 多声道无缝切换方法
CN115472171A (zh) * 2021-06-11 2022-12-13 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序
CN113593604A (zh) * 2021-07-22 2021-11-02 腾讯音乐娱乐科技(深圳)有限公司 检测音频质量方法、装置及存储介质
TWI794002B (zh) * 2022-01-28 2023-02-21 緯創資通股份有限公司 多媒體系統以及多媒體操作方法
CN114582361B (zh) * 2022-04-29 2022-07-08 北京百瑞互联技术有限公司 基于生成对抗网络的高解析度音频编解码方法及系统
WO2023224665A1 (en) * 2022-05-17 2023-11-23 Google Llc Asymmetric and adaptive strength for windowing at encoding and decoding time for audio compression

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
US20040028244A1 (en) * 2001-07-13 2004-02-12 Mineo Tsushima Audio signal decoding device and audio signal encoding device
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
JP2010538318A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充と帯域拡張との間の遷移周波数の適合
JP2013521538A (ja) * 2010-03-09 2013-06-10 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. パッチ境界整合を用いてオーディオ信号を処理するための装置および方法

Family Cites Families (259)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
US6289308B1 (en) 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
KR100458969B1 (ko) 1993-05-31 2005-04-06 소니 가부시끼 가이샤 신호부호화또는복호화장치,및신호부호화또는복호화방법
JP3465697B2 (ja) * 1993-05-31 2003-11-10 ソニー株式会社 信号記録媒体
TW272341B (ja) * 1993-07-16 1996-03-11 Sony Co Ltd
GB2281680B (en) 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
BE1007617A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5502713A (en) * 1993-12-07 1996-03-26 Telefonaktiebolaget Lm Ericsson Soft error concealment in a TDMA radio system
JPH07336231A (ja) * 1994-06-13 1995-12-22 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
WO1996032710A1 (en) 1995-04-10 1996-10-17 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
JP3747492B2 (ja) 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6253172B1 (en) * 1997-10-16 2001-06-26 Texas Instruments Incorporated Spectral transformation of acoustic signals
US5913191A (en) 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6061555A (en) 1998-10-21 2000-05-09 Parkervision, Inc. Method and system for ensuring reception of a communications signal
US6400310B1 (en) * 1998-10-22 2002-06-04 Washington University Method and apparatus for a tunable high-resolution spectral estimator
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6978236B1 (en) 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
WO2001037263A1 (en) * 1999-11-16 2001-05-25 Koninklijke Philips Electronics N.V. Wideband audio transmission system
US7742927B2 (en) 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
BRPI0113271B1 (pt) * 2000-08-16 2016-01-26 Dolby Lab Licensing Corp método para modificar a operação da função codificadora e/ou da função decodificadora de um sistema de codificação perceptual de acordo com informação suplementar
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US20040054525A1 (en) 2001-01-22 2004-03-18 Hiroshi Sekiguchi Encoding method and decoding method for digital voice data
JP2002268693A (ja) 2001-03-12 2002-09-20 Mitsubishi Electric Corp オーディオ符号化装置
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US6934676B2 (en) 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2005506584A (ja) * 2001-10-25 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 減少された帯域幅の伝送路上での広帯域オーディオ信号の伝送方法
JP3923783B2 (ja) * 2001-11-02 2007-06-06 松下電器産業株式会社 符号化装置及び復号化装置
JP4308229B2 (ja) 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
JP3870193B2 (ja) * 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
DE60323331D1 (de) 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
AU2003209957A1 (en) 2002-04-10 2003-10-20 Koninklijke Philips Electronics N.V. Coding of stereo signals
US20030220800A1 (en) * 2002-05-21 2003-11-27 Budnikov Dmitry N. Coding multichannel audio signals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US20050157891A1 (en) 2002-06-12 2005-07-21 Johansen Lars G. Method of digital equalisation of a sound from loudspeakers in rooms and use of the method
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
ES2297083T3 (es) * 2002-09-04 2008-05-01 Microsoft Corporation Codificacion entropica por adaptacion de la codificacion entre modos por longitud de ejecucion y por nivel.
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
RU2244386C2 (ru) 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
ES2281795T3 (es) 2003-04-17 2007-10-01 Koninklijke Philips Electronics N.V. Sintesis de señal de audio.
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
WO2005027094A1 (fr) * 2003-09-17 2005-03-24 Beijing E-World Technology Co.,Ltd. Procede et dispositif de quantification de vecteur multi-resolution multiple pour codage et decodage audio
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
BR122018007834B1 (pt) 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004007191B3 (de) * 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007184B3 (de) 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
ATE527654T1 (de) 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
US7739119B2 (en) 2004-03-02 2010-06-15 Ittiam Systems (P) Ltd. Technique for implementing Huffman decoding
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
CN1677491A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
CN1677492A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
BRPI0509100B1 (pt) * 2004-04-05 2018-11-06 Koninl Philips Electronics Nv Codificador de multicanal operável para processar sinais de entrada, método paracodificar sinais de entrada em um codificador de multicanal
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
EP1755109B1 (en) * 2004-04-27 2012-08-15 Panasonic Corporation Scalable encoding and decoding apparatuses and methods
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
KR20070012832A (ko) * 2004-05-19 2007-01-29 마츠시타 덴끼 산교 가부시키가이샤 부호화 장치, 복호화 장치 및 이들의 방법
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
CN1981326B (zh) * 2004-07-02 2011-05-04 松下电器产业株式会社 音频信号解码装置和方法及音频信号编码装置和方法
US7465389B2 (en) 2004-07-09 2008-12-16 Exxonmobil Research And Engineering Company Production of extra-heavy lube oils from Fischer-Tropsch wax
US6963405B1 (en) 2004-07-19 2005-11-08 Itt Manufacturing Enterprises, Inc. Laser counter-measure using fourier transform imaging spectrometers
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
US7769584B2 (en) 2004-11-05 2010-08-03 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
KR20070084002A (ko) * 2004-11-05 2007-08-24 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 복호화 장치 및 스케일러블 부호화 장치
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
JP4903053B2 (ja) * 2004-12-10 2012-03-21 パナソニック株式会社 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CN101185124B (zh) * 2005-04-01 2012-01-11 高通股份有限公司 用于语音信号的分割频带编码的方法和设备
RU2376657C2 (ru) 2005-04-01 2009-12-20 Квэлкомм Инкорпорейтед Системы, способы и устройства для высокополосного предыскажения шкалы времени
ATE421845T1 (de) * 2005-04-15 2009-02-15 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
US7983922B2 (en) 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
TWI317933B (en) * 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
US7698143B2 (en) 2005-05-17 2010-04-13 Mitsubishi Electric Research Laboratories, Inc. Constructing broad-band acoustic signals from lower-band acoustic signals
JP2006323037A (ja) * 2005-05-18 2006-11-30 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置
WO2006126859A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8108219B2 (en) * 2005-07-11 2012-01-31 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
JP4640020B2 (ja) 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
CN100539437C (zh) * 2005-07-29 2009-09-09 上海杰得微电子有限公司 一种音频编解码器的实现方法
WO2007055464A1 (en) 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
KR100866885B1 (ko) * 2005-10-20 2008-11-04 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
US8620644B2 (en) 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
KR20070046752A (ko) 2005-10-31 2007-05-03 엘지전자 주식회사 신호 처리 방법 및 장치
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
RU2402872C2 (ru) * 2006-01-27 2010-10-27 Коудинг Текнолоджиз Аб Эффективная фильтрация банком комплексно-модулированных фильтров
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
EP3985873A1 (en) * 2006-07-04 2022-04-20 Dolby International AB Filter system comprising a filter converter and a filter compressor and method for operating the filter system
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
JP2010503881A (ja) 2006-09-13 2010-02-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声・音響送信器及び受信器のための方法及び装置
CN103400583B (zh) 2006-10-16 2016-01-20 杜比国际公司 多声道下混对象编码的增强编码和参数表示
PL3288027T3 (pl) 2006-10-25 2021-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania wartości podpasm audio o wartościach zespolonych
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
JP5231243B2 (ja) * 2006-11-28 2013-07-10 パナソニック株式会社 符号化装置及び符号化方法
WO2008072524A1 (ja) 2006-12-13 2008-06-19 Panasonic Corporation オーディオ信号符号化方法及び復号化方法
US8200351B2 (en) 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
TR201906713T4 (tr) 2007-01-10 2019-05-21 Koninklijke Philips Nv Audio kod çözücü.
KR20090123921A (ko) * 2007-02-26 2009-12-02 퀄컴 인코포레이티드 신호 분리를 위한 시스템, 방법 및 장치
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP5294713B2 (ja) 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
WO2008153944A1 (en) 2007-06-08 2008-12-18 Dolby Laboratories Licensing Corporation Hybrid derivation of surround sound audio channels by controllably combining ambience and matrix-decoded signal components
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8428957B2 (en) * 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
CA2698031C (en) * 2007-08-27 2016-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling
DE102007048973B4 (de) 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
US9177569B2 (en) * 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
CN101868821B (zh) 2007-11-21 2015-09-23 Lg电子株式会社 用于处理信号的方法和装置
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
WO2009084918A1 (en) * 2007-12-31 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
ATE518224T1 (de) * 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
US20090180531A1 (en) 2008-01-07 2009-07-16 Radlive Ltd. codec with plc capabilities
KR101413967B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
US8442836B2 (en) 2008-01-31 2013-05-14 Agency For Science, Technology And Research Method and device of bitrate distribution/truncation for scalable audio coding
EP2248352B1 (en) 2008-02-14 2013-01-23 Dolby Laboratories Licensing Corporation Stereophonic widening
WO2009109373A2 (en) 2008-03-04 2009-09-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
US8401845B2 (en) * 2008-03-05 2013-03-19 Voiceage Corporation System and method for enhancing a decoded tonal sound signal
ES2898865T3 (es) 2008-03-20 2022-03-09 Fraunhofer Ges Forschung Aparato y método para sintetizar una representación parametrizada de una señal de audio
KR20090110244A (ko) 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
PL2301017T3 (pl) 2008-05-09 2017-05-31 Nokia Technologies Oy Urządzenie akustyczne
US20090319263A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
BRPI0910792B1 (pt) * 2008-07-11 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. "sintetizador de sinal de áudio e codificador de sinal de áudio"
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
MY155538A (en) 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
EP2410522B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
PL3246918T3 (pl) 2008-07-11 2023-11-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio, sposób dekodowania sygnału audio oraz program komputerowy
EP4224471A3 (en) * 2008-07-11 2023-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
US8788276B2 (en) 2008-07-11 2014-07-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
WO2010028292A1 (en) 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8463603B2 (en) 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
JP5295372B2 (ja) * 2008-09-17 2013-09-18 フランス・テレコム デジタルオーディオ信号におけるプリエコーの減衰
US8831958B2 (en) * 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
PL4053838T3 (pl) 2008-12-15 2023-11-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
PL3598447T3 (pl) 2009-01-16 2022-02-14 Dolby International Ab Transpozycja harmonicznych rozszerzona o iloczyn wektorowy
JP4977157B2 (ja) 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
BRPI1009467B1 (pt) * 2009-03-17 2020-08-18 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
US8391212B2 (en) 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
EP2249333B1 (en) * 2009-05-06 2014-08-27 Nuance Communications, Inc. Method and apparatus for estimating a fundamental frequency of a speech signal
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
WO2011047887A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
TWI591625B (zh) 2009-05-27 2017-07-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
PL2273493T3 (pl) 2009-06-29 2013-07-31 Fraunhofer Ges Forschung Kodowanie i dekodowanie z rozszerzaniem szerokości pasma
WO2011003145A1 (en) 2009-07-07 2011-01-13 Xtralis Technologies Ltd Chamber condition
US8793617B2 (en) * 2009-07-30 2014-07-29 Microsoft Corporation Integrating transport modes into a communication stream
US9031834B2 (en) 2009-09-04 2015-05-12 Nuance Communications, Inc. Speech enhancement techniques on the power spectrum
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
BR112012007803B1 (pt) * 2009-10-08 2022-03-15 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio multimodal, codificador de sinal de áudio multimodal e métodos usando uma configuração de ruído com base em codificação de previsão linear
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
MY166169A (en) * 2009-10-20 2018-06-07 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for encoding or decoding an audio signal using an aliasing-cancellation
CA2778240C (en) 2009-10-20 2016-09-06 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio codec and celp coding adapted therefore
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
CN102714041B (zh) 2009-11-19 2014-04-16 瑞典爱立信有限公司 改进的激励信号带宽扩展
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
MX2012005723A (es) 2009-12-07 2012-06-13 Dolby Lab Licensing Corp Metodo y aparato para decodificar un cuadrado de una señal de audio digital codificada y medio de almacenamiento que graba un programa de instrucciones.
KR101764926B1 (ko) 2009-12-10 2017-08-03 삼성전자주식회사 음향 통신을 위한 장치 및 방법
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
KR101423737B1 (ko) 2010-01-21 2014-07-24 한국전자통신연구원 오디오 신호의 디코딩 방법 및 장치
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
EP2369861B1 (en) 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
BR112012025878B1 (pt) * 2010-04-09 2021-01-05 Dolby International Ab sistema decodificador, sistema codificador, método de decodificação e método de codificação.
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
KR101430118B1 (ko) * 2010-04-13 2014-08-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 또는 비디오 인코더, 오디오 또는 비디오 디코더 그리고 가변적인 예상 방향을 이용하여 멀티-채널 오디오 또는 비디오 신호들을 프로세싱하기 위한 관련 방법들
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
TR201904117T4 (tr) 2010-04-16 2019-05-21 Fraunhofer Ges Forschung Kılavuzlu bant genişliği uzantısı ve gözü kapalı bant genişliği uzantısı kullanılarak bir geniş bantlı sinyal üretilmesine yönelik aparat, yöntem ve bilgisayar programı.
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
JP5243620B2 (ja) 2010-06-09 2013-07-24 パナソニック株式会社 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8489403B1 (en) 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
EP2676262B1 (en) 2011-02-14 2018-04-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
WO2012146757A1 (en) 2011-04-28 2012-11-01 Dolby International Ab Efficient content classification and loudness estimation
CN103548077B (zh) * 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
US9311923B2 (en) 2011-05-19 2016-04-12 Dolby Laboratories Licensing Corporation Adaptive audio processing based on forensic detection of media processing history
DE102011106033A1 (de) * 2011-06-30 2013-01-03 Zte Corporation Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels
MX350162B (es) 2011-06-30 2017-08-29 Samsung Electronics Co Ltd Aparato y método para generar señal extendida de ancho de banda.
US20130006644A1 (en) 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
KR20130022549A (ko) 2011-08-25 2013-03-07 삼성전자주식회사 마이크 노이즈 제거 방법 및 이를 지원하는 휴대 단말기
CN103718240B (zh) 2011-09-09 2017-02-15 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
EP2761618B1 (en) 2011-09-29 2016-11-30 Dolby International AB High quality detection in fm stereo radio signals
PL2772913T3 (pl) * 2011-10-28 2018-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie kodujące i sposób kodowania
ES2592522T3 (es) * 2011-11-02 2016-11-30 Telefonaktiebolaget L M Ericsson (Publ) Codificación de audio basada en representación de coeficientes auto-regresivos
WO2013079524A2 (en) * 2011-11-30 2013-06-06 Dolby International Ab Enhanced chroma extraction from an audio codec
CN103165136A (zh) 2011-12-15 2013-06-19 杜比实验室特许公司 音频处理方法及音频处理设备
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9390721B2 (en) 2012-01-20 2016-07-12 Panasonic Intellectual Property Corporation Of America Speech decoding device and speech decoding method
KR101398189B1 (ko) 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
EP3220390B1 (en) * 2012-03-29 2018-09-26 Telefonaktiebolaget LM Ericsson (publ) Transform encoding/decoding of harmonic audio signals
RU2725416C1 (ru) * 2012-03-29 2020-07-02 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
CN102750955B (zh) * 2012-07-20 2014-06-18 中国科学院自动化研究所 基于残差信号频谱重构的声码器
US9589570B2 (en) 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
CN104885149B (zh) 2012-09-24 2017-11-17 三星电子株式会社 用于隐藏帧错误的方法和设备以及用于对音频进行解码的方法和设备
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
US9135920B2 (en) 2012-11-26 2015-09-15 Harman International Industries, Incorporated System for perceived enhancement and restoration of compressed audio signals
EP3054446B1 (en) 2013-01-29 2023-08-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
US20040028244A1 (en) * 2001-07-13 2004-02-12 Mineo Tsushima Audio signal decoding device and audio signal encoding device
JP2010538318A (ja) * 2007-08-27 2010-12-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) ノイズ補充と帯域拡張との間の遷移周波数の適合
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
JP2013521538A (ja) * 2010-03-09 2013-06-10 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. パッチ境界整合を用いてオーディオ信号を処理するための装置および方法

Also Published As

Publication number Publication date
EP2830061A1 (en) 2015-01-28
PL3025337T3 (pl) 2022-04-11
SG11201600422SA (en) 2016-02-26
US11257505B2 (en) 2022-02-22
US20200082841A1 (en) 2020-03-12
JP2020060792A (ja) 2020-04-16
US20220157325A1 (en) 2022-05-19
MY180759A (en) 2020-12-08
AU2014295298A1 (en) 2016-03-10
WO2015010953A1 (en) 2015-01-29
CA2918524C (en) 2018-05-22
CA2973841A1 (en) 2015-01-29
EP3506260B1 (en) 2023-08-16
PL3407350T3 (pl) 2020-12-28
RU2016105618A (ru) 2017-08-28
JP6705787B2 (ja) 2020-06-03
BR122022010960B1 (pt) 2023-04-04
ES2959641T3 (es) 2024-02-27
BR112016000947B1 (pt) 2022-06-21
TW201517023A (zh) 2015-05-01
US20210217426A1 (en) 2021-07-15
AU2014295297A1 (en) 2016-03-10
EP3017448A1 (en) 2016-05-11
TWI541797B (zh) 2016-07-11
CN105453175A (zh) 2016-03-30
AU2014295296A1 (en) 2016-03-10
EP3506260C0 (en) 2023-08-16
MX2016000857A (es) 2016-05-05
PL3025328T3 (pl) 2019-02-28
MX340575B (es) 2016-07-13
ZA201601011B (en) 2017-05-31
MX355448B (es) 2018-04-18
PL3025340T3 (pl) 2019-09-30
EP3407350B1 (en) 2020-07-29
EP2830054A1 (en) 2015-01-28
SG11201600464WA (en) 2016-02-26
EP2830063A1 (en) 2015-01-28
BR122022010965B1 (pt) 2023-04-04
BR112016001072B1 (pt) 2022-07-12
US20160140979A1 (en) 2016-05-19
US10276183B2 (en) 2019-04-30
WO2015010947A1 (en) 2015-01-29
CA2886505A1 (en) 2015-01-29
EP2883227A1 (en) 2015-06-17
MX353999B (es) 2018-02-07
CA2918701A1 (en) 2015-01-29
EP3025337A1 (en) 2016-06-01
WO2015010954A1 (en) 2015-01-29
US20190043522A1 (en) 2019-02-07
EP4246512A2 (en) 2023-09-20
US10593345B2 (en) 2020-03-17
ZA201502262B (en) 2016-09-28
JP6310074B2 (ja) 2018-04-11
AU2014295301B2 (en) 2017-05-25
JP6144773B2 (ja) 2017-06-07
RU2015112591A (ru) 2016-10-27
MX354657B (es) 2018-03-14
CA2886505C (en) 2017-10-31
AU2014295295B2 (en) 2017-10-19
CN111554310B (zh) 2023-10-20
SG11201600494UA (en) 2016-02-26
EP2830059A1 (en) 2015-01-28
US20230352032A1 (en) 2023-11-02
MY175978A (en) 2020-07-19
PT3017448T (pt) 2020-10-08
US20160140980A1 (en) 2016-05-19
US10347274B2 (en) 2019-07-09
AU2014295301A1 (en) 2016-03-10
BR112016000947A2 (ja) 2017-08-22
BR112015007533B1 (pt) 2022-09-27
CN110660410A (zh) 2020-01-07
PT2883227T (pt) 2016-11-18
JP6400702B2 (ja) 2018-10-03
EP3506260A1 (en) 2019-07-03
MX362036B (es) 2019-01-04
US11922956B2 (en) 2024-03-05
ES2827774T3 (es) 2021-05-24
WO2015010949A1 (en) 2015-01-29
US20170154631A1 (en) 2017-06-01
ES2599007T3 (es) 2017-01-31
US20190371355A1 (en) 2019-12-05
TWI555009B (zh) 2016-10-21
CN105518777A (zh) 2016-04-20
US11735192B2 (en) 2023-08-22
PT3025340T (pt) 2019-06-27
JP6568566B2 (ja) 2019-08-28
BR112016001072A2 (ja) 2017-08-22
TWI545558B (zh) 2016-08-11
US20220139407A1 (en) 2022-05-05
EP4246512A3 (en) 2023-12-13
JP6306702B2 (ja) 2018-04-04
MX354002B (es) 2018-02-07
JP2018013796A (ja) 2018-01-25
CN104769671B (zh) 2017-09-26
JP2018041100A (ja) 2018-03-15
KR101809592B1 (ko) 2018-01-18
BR122022010958B1 (pt) 2024-01-30
AU2014295302B2 (en) 2016-06-30
ZA201601010B (en) 2017-11-29
CA2918807C (en) 2019-05-07
CN110310659A (zh) 2019-10-08
MX2015004022A (es) 2015-07-06
RU2635890C2 (ru) 2017-11-16
RU2651229C2 (ru) 2018-04-18
EP3025340B1 (en) 2019-03-27
CN112466312A (zh) 2021-03-09
US11289104B2 (en) 2022-03-29
US10147430B2 (en) 2018-12-04
MX2016000935A (es) 2016-07-05
TWI555008B (zh) 2016-10-21
CA2918701C (en) 2020-04-14
BR112016000852A2 (pt) 2017-08-22
CN105556603A (zh) 2016-05-04
CA2918804A1 (en) 2015-01-29
AU2014295295A1 (en) 2016-03-10
JP2016525713A (ja) 2016-08-25
SG11201600506VA (en) 2016-02-26
US20180102134A1 (en) 2018-04-12
CN105580075B (zh) 2020-02-07
AU2014295296B2 (en) 2017-10-19
TW201517019A (zh) 2015-05-01
CN105518777B (zh) 2020-01-31
JP6321797B2 (ja) 2018-05-09
KR20160030193A (ko) 2016-03-16
EP3025343A1 (en) 2016-06-01
SG11201600496XA (en) 2016-02-26
CN110660410B (zh) 2023-10-24
MX2016000943A (es) 2016-07-05
TW201523590A (zh) 2015-06-16
TW201517024A (zh) 2015-05-01
WO2015010948A1 (en) 2015-01-29
CN105453176B (zh) 2019-08-23
TW201513098A (zh) 2015-04-01
ZA201601111B (en) 2017-08-30
MY184847A (en) 2021-04-27
CN104769671A (zh) 2015-07-08
MX2016000854A (es) 2016-06-23
TWI545561B (zh) 2016-08-11
US10332539B2 (en) 2019-06-25
CA2918810A1 (en) 2015-01-29
JP2016529546A (ja) 2016-09-23
EP3025340A1 (en) 2016-06-01
RU2640634C2 (ru) 2018-01-10
RU2016105473A (ru) 2017-08-23
MY187943A (en) 2021-10-30
CN111554310A (zh) 2020-08-18
RU2016105759A (ru) 2017-08-25
KR20160034975A (ko) 2016-03-30
KR20160042890A (ko) 2016-04-20
US20150287417A1 (en) 2015-10-08
EP3025343B1 (en) 2018-02-14
BR112016001125A2 (ja) 2017-08-22
CN105556603B (zh) 2019-08-27
JP2022123060A (ja) 2022-08-23
US20220270619A1 (en) 2022-08-25
JP6691093B2 (ja) 2020-04-28
PT3407350T (pt) 2020-10-27
US10573334B2 (en) 2020-02-25
ES2728329T3 (es) 2019-10-23
EP3025328B1 (en) 2018-08-01
TR201816157T4 (tr) 2018-11-21
ES2698023T3 (es) 2019-01-30
AU2014295302A1 (en) 2015-04-02
KR101764723B1 (ko) 2017-08-14
BR112016001125B1 (pt) 2022-01-04
EP3025337B1 (en) 2021-12-08
US20190074019A1 (en) 2019-03-07
CA2918835C (en) 2018-06-26
EP3025344A1 (en) 2016-06-01
MX356161B (es) 2018-05-16
CA2918807A1 (en) 2015-01-29
US20210065723A1 (en) 2021-03-04
US20210295853A1 (en) 2021-09-23
CA2918810C (en) 2020-04-28
MX2016000940A (es) 2016-04-25
CN105453175B (zh) 2020-11-03
US10515652B2 (en) 2019-12-24
KR101681253B1 (ko) 2016-12-01
EP3975180A1 (en) 2022-03-30
KR20160041940A (ko) 2016-04-18
JP6389254B2 (ja) 2018-09-12
EP3017448B1 (en) 2020-07-08
AU2014295297B2 (en) 2017-05-25
JP2016530556A (ja) 2016-09-29
ES2667221T3 (es) 2018-05-10
TWI545560B (zh) 2016-08-11
TWI549121B (zh) 2016-09-11
US20180268842A1 (en) 2018-09-20
KR101822032B1 (ko) 2018-03-08
EP2830064A1 (en) 2015-01-28
US11769512B2 (en) 2023-09-26
US20180144760A1 (en) 2018-05-24
KR20150060752A (ko) 2015-06-03
MX2016000924A (es) 2016-05-05
JP6186082B2 (ja) 2017-08-23
EP3025344B1 (en) 2017-06-21
PL3025343T3 (pl) 2018-10-31
PL3506260T3 (pl) 2024-02-19
SG11201502691QA (en) 2015-05-28
JP2016527556A (ja) 2016-09-08
US20190198029A1 (en) 2019-06-27
HK1211378A1 (en) 2016-05-20
US10332531B2 (en) 2019-06-25
US10311892B2 (en) 2019-06-04
PT3025337T (pt) 2022-02-23
KR101826723B1 (ko) 2018-03-22
PT3025343T (pt) 2018-05-18
EP3025328A1 (en) 2016-06-01
BR112016000740A2 (pt) 2017-08-22
ES2908624T3 (es) 2022-05-03
JP2018077487A (ja) 2018-05-17
US10984805B2 (en) 2021-04-20
ZA201601046B (en) 2017-05-31
ES2813940T3 (es) 2021-03-25
EP2883227B1 (en) 2016-08-17
US11769513B2 (en) 2023-09-26
US10002621B2 (en) 2018-06-19
AU2014295300B2 (en) 2017-05-25
JP2015535620A (ja) 2015-12-14
RU2643641C2 (ru) 2018-02-02
US20190251986A1 (en) 2019-08-15
EP2830056A1 (en) 2015-01-28
KR101807836B1 (ko) 2018-01-18
BR112015007533A2 (ja) 2017-08-22
CA2918524A1 (en) 2015-01-29
AU2014295298B2 (en) 2017-05-25
BR112016000740B1 (pt) 2022-12-27
KR20160046804A (ko) 2016-04-29
TW201514974A (zh) 2015-04-16
US20160140981A1 (en) 2016-05-19
US20160210974A1 (en) 2016-07-21
US20160140973A1 (en) 2016-05-19
KR101774795B1 (ko) 2017-09-05
RU2607263C2 (ru) 2017-01-10
MY182831A (en) 2021-02-05
RU2016105610A (ru) 2017-08-25
TW201523589A (zh) 2015-06-16
EP3742444A1 (en) 2020-11-25
US10134404B2 (en) 2018-11-20
EP3723091A1 (en) 2020-10-14
CA2918835A1 (en) 2015-01-29
CN111179963A (zh) 2020-05-19
CN110310659B (zh) 2023-10-24
US11049506B2 (en) 2021-06-29
RU2646316C2 (ru) 2018-03-02
PL2883227T3 (pl) 2017-03-31
PT3025328T (pt) 2018-11-27
RU2649940C2 (ru) 2018-04-05
ES2638498T3 (es) 2017-10-23
RU2016105619A (ru) 2017-08-23
US10847167B2 (en) 2020-11-24
EP3407350A1 (en) 2018-11-28
BR122022011238B1 (pt) 2023-12-19
WO2015010952A9 (en) 2017-10-26
AU2014295300A1 (en) 2016-03-10
CN105580075A (zh) 2016-05-11
KR20160024924A (ko) 2016-03-07
WO2015010952A1 (en) 2015-01-29
PL3017448T3 (pl) 2020-12-28
RU2016105613A (ru) 2017-08-28
CN105518776A (zh) 2016-04-20
WO2015010950A1 (en) 2015-01-29
EP2830065A1 (en) 2015-01-28
BR122022011231B1 (pt) 2024-01-30
CN105453176A (zh) 2016-03-30
JP2016529545A (ja) 2016-09-23
US11250862B2 (en) 2022-02-15
CN105518776B (zh) 2019-06-14
US20160133265A1 (en) 2016-05-12
CA2973841C (en) 2019-08-20
US11222643B2 (en) 2022-01-11
CA2918804C (en) 2018-06-12
SG11201600401RA (en) 2016-02-26
JP7092809B2 (ja) 2022-06-28

Similar Documents

Publication Publication Date Title
JP6568566B2 (ja) 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160908

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170509

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180905

R150 Certificate of patent or registration of utility model

Ref document number: 6400702

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250