TW201505024A - 音頻編碼器及解碼器 - Google Patents

音頻編碼器及解碼器 Download PDF

Info

Publication number
TW201505024A
TW201505024A TW103109074A TW103109074A TW201505024A TW 201505024 A TW201505024 A TW 201505024A TW 103109074 A TW103109074 A TW 103109074A TW 103109074 A TW103109074 A TW 103109074A TW 201505024 A TW201505024 A TW 201505024A
Authority
TW
Taiwan
Prior art keywords
signals
frequency
phase
waveform
downmix
Prior art date
Application number
TW103109074A
Other languages
English (en)
Other versions
TWI546799B (zh
Inventor
Kristofer Kjoerling
Heiko Purnhagen
Harald H Mundt
Karl J Roeden
Leif Sehlstrom
Original Assignee
Dolby Int Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Int Ab filed Critical Dolby Int Ab
Publication of TW201505024A publication Critical patent/TW201505024A/zh
Application granted granted Critical
Publication of TWI546799B publication Critical patent/TWI546799B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

本發明提供用於依據一輸入訊號而重建一多聲道音頻訊號的方法、裝置及電腦程式產品。本發明同時使用參數立體聲編碼以及經處理之多聲道音頻訊號的分立式表現的混合方式,而改進特定位元率的經編碼及經解碼的音頻品質。

Description

音頻編碼器及解碼器 [相關申請案的交互參照]
本申請案主張2013年4月5日的美國臨時申請案號61/808680的權利,其全文內容為經結合而作為參考。
本發明大致關於多聲道音頻之編碼。特別是關於一種編碼器與解碼器,用於執行包含參數編碼(parametric coding)及分立式多聲道編碼(discrete multi-chanel coding)的混合編碼。
在習知的多聲道音頻編碼中,可行的編碼方案包括分立式多聲道編碼或參數編碼,例如MPEG環繞(MPEG Surround)。所使用的方案則依該音頻系統的頻寬而定。參數編碼方法以其為可擴充及對聆聽品質的效益而週知,使其在低位元率的應用上特別受到青睞。在高位元率的應用中,通常使用分立式多聲道編碼。現有的普及 率或處理格式以及相關的編碼技術會就頻寬效益的觀點而改進,尤其是在具有低位元率及高位元率之間的位元率的應用中。
美國專利第7292901號(Kroon等人)為關於 一種混合式編碼方法,其中,一混合音頻訊號係由至少一個降混頻譜組件及至少一個上混頻譜組件而形成。該應用所揭示之方法可增加一具有一特定位元率的應用的容量,但要進一步增加一音頻處理系統的功效,則需要進一步的改善。
解碼器概觀
本說明書所使用之術語「音頻訊號(audio signal)」可為一純粹的音頻訊號、一視聽訊號或多媒體訊號的音頻部分,或以上任何項目與元資料(metadata)的組合。
本說明書所使用之術語「降混(downmixing)」多個訊號,表示結合該多個訊號,例如藉由形成線性組合以獲取較少數量的訊號。降混的反向操作稱為上混(upmixing),其為對較少數量的訊號執行一操作,以獲取較多數量的訊號。
根據本發明一第一觀點,多個範例實施例提述多種基於一輸入訊號而重建一多聲道音頻訊號的方法、裝置及電腦程式產品。所提述的多個方法、裝置及電腦程 式產品可概括性地具有相同的特徵及優點。
根據多個範例實施例,本發明提供一種多聲 道音頻處理系統的解碼器,以重建M個編碼聲道(其中M>2)。該解碼器包含一第一接收階段,經設置而接收N個波形編碼降混訊號,該N個波形編碼降混訊號包含對應於一第一交叉頻率及一第二交叉頻率之間的多個頻率的頻譜係數,其中1<N<M。
該解碼器更包含一第二接收階段,經設置而 接收M個編碼波形降混訊號,該M個編碼波形降混訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數,該M個編碼波形降混訊號中的每一個訊號分別對應於該M個編碼聲道中的一個聲道。
該解碼器更包含一降混階段,其為該第二接 收階段的下行階段,經設置而降混該M個波形編碼訊號成為N個降混訊號,該N個降混訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數。
該解碼器更包含一第一結合階段,其為該第 一接收階段及該降混階段的下行階段,經設置而將該第一接收階段所接收的該N個降混訊號中的每一個,與得自該降混階段的該N個降混訊號中對應的一個予以結合,而成為N個經結合的降混訊號。
該解碼器更包含一高頻率重建階段,其為該 第一結合階段的下行階段,經設置而對得自該結合階段的該N個經結合的降混訊號執行高頻率重建而擴張該N個 經結合的降混訊號的每一個至一高於該第二交叉頻率的頻率範圍;該解碼器更包含一上混階段,其為該高頻率重建階段的下行階段,經設置而對得自該高頻率重建階段的該N個經擴張的頻率訊號執行一參數上混,M個上混訊號,該M個上混訊號包含對應高於該第一交叉頻率之頻率的頻譜係數,該M個上混訊號的每一個為對應於該M個編碼聲道的其中一個。
該解碼器更包含一第二結合階段,其為該上 混階段及該第二接收階段的下行階段,該第二結合階段經設置而將得自該上混階段的該M個上混訊號及該第二接收階段所接收的M個波形編碼訊號予以結合。
該M個波形編碼訊號係為經純粹地波形編碼 的訊號,未混合參數訊號,亦即,該M個波形編碼訊號係為該經處理之多聲道音頻訊號的一非降混分立式表現(non-downmixed discrete representation)。以該些經波形編碼的訊號重現該較低的頻率的一項優點是,人類的聽覺對音頻訊號中具有較低頻率的部分較為敏感。藉由將此部分編碼成較佳品質,可增加該經解碼的音頻的整體感受(overall impression)。
具有至少二個降混訊號的優點是,相較於僅 具有一個降混聲道的系統,本實施例給予該些降混訊號更多空間次元(dimensionality)。根據本實施例,可因此而提供一較佳的經解碼的音頻品質,遠勝於一單一降混訊號 系統所提供的位元率增益。
使用包含參數降混及分立式多聲道編碼的混 合編碼的一項優點是,相較於使用習知的參數編碼方法(亦即,具備高效進階音訊編碼的MPEG環繞(MPEG Surround with HE-AAC)),該混合編碼方式可改進特定位元率的經解碼的音頻訊號的品質,在每秒72千位元(kbps)的位元率狀態下,習知的參數編碼類型可變得飽和,亦即,該經編碼的音頻訊號的品質係受限於該參數類型的缺陷,而非受限於用於編碼的位元之不足。於是,對於每秒72千位元(kbps)的位元率,使用分立式地波形編碼的較低頻率的位元可為較有益。同時,相較於使用所有位元皆使用波形編碼較低的頻率以及使用頻譜帶複製(spectral band replication,SBR)的方法,使用一參數降混及分立式多聲道編碼的該混合方法,可改進特定位元率的經解碼音頻的品質,例如,在128kbps或更低的位元率。
具有僅包含對應於該第一交叉頻率及該第二 交叉頻率之間頻率的頻譜資料的N個波形編碼降混訊號的一項優點在於:可減少該音頻訊號處理系統所需的位元傳輸率。另外,藉由將一頻帶使通過經濾波的降混訊號所儲存的位元,可用於對較低的頻率進行波形編碼,例如,該些頻率的取樣頻率可為較高,或該些第一交叉頻率可被增加。
如前所述,由於人類聽覺對音頻訊號中具有 低頻的部分較為敏感,高頻率如該音頻訊號中具有高於該第二交叉頻率的部分,可藉由高頻率重建重新產生,而不會降低該經解碼的音頻訊號的感知音質(perceived audio quality)。
本實施例的另一優點為,由於在該上混階段 中所執行的該參數上混僅在對應於高於該第一交叉頻率之頻率的頻譜係數運作,故降低該上混的複雜性。
根據另一實施例,在該第一結合階段所執行 的結合,其中包含對應於在一第一交叉頻率及一第二交叉頻率之間的多個頻率的頻譜係數的該N個波形訊號中的每一個,係與包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數的該N個降混訊號中對應的每一個,結合而成為N個經結合的降混訊號,該結合步驟係在一頻域(frequency domain)中執行。
該實施例的一項優點為,該M個波形編碼訊 號及該N個波形編碼降混訊號可藉由一波形編碼器(waveform coder)使用重疊加窗轉換而個別地對該M個波形編碼訊號及該N個波形編碼降混訊號加窗,且該些訊號仍可被該解碼器解碼。
根據另一實施例,在該高頻重建階段中將該 N個經結合的降混訊號中的每一個擴張至一高於該第二交叉頻率的頻率範圍之步驟,係在一頻域中執行。
根據又另一實施例,在該第二結合步驟中實 施的結合,亦即,包含對應於高於該第一交叉頻率的多個 頻率的頻譜係數的M個上混訊號以及包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數的M個波形編碼訊號之結合,係在一頻域中執行。如前所述,在正交鏡像濾波(Quadrature Mirror Filters,QMF)域中結合該些訊號的優點為,可使用重疊加窗轉換的個別加窗而在該MDCT域中對該些訊號進行編碼。
根據另一實施例,在該上混階段中對該N個 經擴張頻率結合的降混訊號所執行的一參數上混,使其成為包含多個頻譜係數的M個上混訊號之步驟,係在一頻域中執行。
根據又另一實施例,將該M個波形編碼訊號 降混為N個降混訊號之步驟,係在一頻域中執行,該N個降混訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數。
根據一實施例,該頻域為一正交鏡像濾波頻 (QMF)域。
根據另一實施例,在該降混階段中所執行的 降混步驟,其中將該M個波形編碼訊號降混為該N個降混訊號之步驟,係在一時域(time domain)中執行,該N個降混訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數。
根據又一實施例,該第一交叉頻率為依據該 多聲道音頻處理系統的一位元傳輸率而定。如此可達到運用可用的頻寬而改進該經解碼音頻訊號的品質,因為該音 頻訊號中具有低於該第一交叉頻率之頻率的部分係經純粹地波形編碼。
根據另一實施例,藉由在該高頻率重建階段 執行高頻率重建而擴張該N個經結合的降混訊號的每一個至一高於該第二交叉頻率的頻率範圍,係使用高頻率重建參數而執行。該高頻率重建參數可由該解碼器接收,例如,在該接收階段接收,然後傳送至一高頻率重建階段。 該高頻率重建的步驟可包含,舉例而言,執行頻譜帶複製。
根據另一實施例,在該上混階段中的該參數 上混,係使用上混參數而完成。該些上混參數係由該編碼器所接收,例如,在該接收階段接收,然後傳送至一上混階段。產生一經分頻(decorrelated)版本的該N個經頻率擴張的經結合降混訊號,並使該N個經頻率擴張的經結合降混訊號以及該些經分頻版本的N個經頻率擴張的經結合降混訊號接收一矩陣操作(matrix operation)。該矩陣操作的參數係由該上混參數所給定。
根據另一實施例,在該第一接收階段所接收 到的該N個波形編碼降混訊號及在該第二接收階段所收到的該M個波形編碼訊號係使用分別加窗的重疊加窗轉換而對該N個波形編碼降混訊號及該M個波形編碼訊號予以編碼。
此編碼方式的一項優點為,藉此得以改善編 碼品質,並因而改善該經解碼的多聲道音頻訊號的品質。 舉例而言,若在一特定時間點,在該較高頻率波段中偵測到一瞬時波(transient),該波形編碼器可以一較短的窗序列(window sequence)而編碼該特定時段,而同時對較低頻率波段維持預設的窗序列。
根據多個實施例,該解碼器可包含一第三接 收階段,經設置而接收又一波形編碼訊號,該頻譜係數包含對應於高於該第一交叉頻率的多個頻率的一子集的頻譜係數。該解碼器更可包含一交錯放置階段,為該上混階段的下行階段。該交錯放置階段可經設置而將該進一步波形編碼訊號與該M個上混訊號的其中一個予以交錯。該第三接收階段更可經設置而接收另外複數個波形編碼訊號,且該交錯階段更可經設置而將該另外複數個波形編碼訊號及複數個M個上混訊號予以交錯。
此步驟的優點為在高於該第一交叉頻率的該 些該頻率範圍中,難以從該些降混訊號參數地重建的特定部分可以波形編碼的方式而提供,而用於與該經參數重建的上混訊號交錯。
在一範例實施例中,該交錯步驟係以將該另 外的波形編碼訊號加入該M個上混訊號中的一個之方式而執行。根據另一範例實施例,將該進一步波形編碼訊號與該M個上混訊號的其中一個予以交錯之步驟,包含在對應於該另一個波形編碼訊號之頻譜係數的該高於第一交叉頻率之該頻率的子集中,以該另一個波形編碼訊號取代該M個上混訊號中的其中一個。
根據多個範例實施例,該解碼器更可經設置而接收一控制訊號,例如,藉由該第三接收階段而接收。該控制訊號可指出如何將該進一步波形編碼訊號與該M個上混訊號中的一個予以交錯,其中將該另一個波形編碼訊號與該M個上混訊號中的一個予以交錯的步驟係基於該控制訊號。具體而言,該控制訊號可指出一頻率範圍及一時間範圍,例如在一正交鏡像濾波域中的一或多個時頻網格(time/frequency tile);在此該另一個波形編碼訊號將會與該M個上混訊號中的一個交錯。據此,可在一個聲道內的時間及頻率中進行交錯。
接收該控制訊號的一項優點為,能夠選擇時間範圍及頻率範圍,而不會因對該些波形編碼訊號使用該重疊加窗轉換而編碼,產生疊頻或起始/淡出問題。
編碼器概觀
根據本發明一第二觀點,範例實施例提述多個方法、裝置及電腦程式產品,用於依據一輸入訊號而重建一多聲道音頻訊號。
所提述的多個方法、裝置及電腦程式產品可概括性地具有相同的特徵及優點。
如前述解碼器概觀所揭示之特徵及設置的相關優點,大致可適用於該編碼器的對應特徵及設置。
根據該些範例實施例,本發明提供在多聲道音頻處理系統中編碼M個編碼聲道(其中M>2)的一編 碼器。
該編碼器包含一接收階段,經設置而接收對 應於欲編碼的該M個聲道的M個訊號。
該編碼器更包含一第一波形編碼階段,經設 置而自該接收階段接收該M個訊號,及藉由將該M個訊號波形編碼為最高至該第一交叉頻率的一頻率範圍而產生M個波形編碼訊號,據此使該M個波形編碼訊號包含多個對應於一最高至該第一交叉頻率之頻率的頻譜係數。
該編碼器更包含一降混階段,經設置而自該 接收階段接收該M個訊號,及將該M個訊號降混為N個降混訊號,其中1<N<M。
該編碼器更包含一高頻率重建編碼階段,經 設置而自該降混階段接收該N個降混訊號,及使該N個降混訊號接受高頻率重建編碼,據此該高頻率重建編碼階段係為經設置而擷取高頻率重建參數,該參數使該N個降混訊號得以被高頻率重建為高於一第二交叉頻率。
該編碼器更包含一參數編碼階段,其經設置 而自該接收階段接收該M個訊號並自該降混階段接收該N個降混訊號,以及使該M個訊號接受參數編碼,用於對應於高於該第一交叉頻率的該頻率範圍,據此該參數編碼階段係為經設置而擷取複數個上混參數,該些參數使該N個降混訊號得以上混為M個經重建的訊號,該M個經重建的訊號為對應於高於該第一交叉頻率的該頻率範圍的M個聲道。
該編碼器更包含一第二波形編碼階段,經設 置而自該降混階段接收該N個降混訊號,及藉由將對應於在該第一及該第二交叉頻率之間頻率的頻率範圍的N個降混訊號波形編碼,而產生N個波形編碼降混訊號,據此該N個波形編碼降混訊號包含對應於在該第一及該第二交叉頻率之間的多個頻率的頻譜係數。
根據一實施例,在該高頻率重建編碼階段中 使該N個降混訊號接受高頻率重建編碼的步驟係於一頻域中執行,較佳地,為一正交鏡像濾波器頻域。
根據另一實施例,在該參數編碼階段中使該 M個訊號接受參數編碼的步驟係於一頻域中執行,較佳地,為一正交鏡像濾波器頻域。
根據又一實施例,在該第一波形編碼階段 中,藉由將該M個訊號個別地波形編碼而產生M個波形編碼訊號的步驟,包含對該M個訊號套用一重疊加窗轉換,其中該M個訊號中的至少二個訊號使用不同的重疊加窗順序。
根據多個實施例,該編碼器更可包含一第三 波形編碼階段,經設置而藉由將該M個訊號的其中一個波形編碼為對應高於該第一交叉頻率的該頻率範圍的子集的一頻率範圍,而產生一經進一步波形編碼訊號。
根據多個實施例,該編碼器可包含一控制訊號產生階段。該控制訊號產生階段為經配置而產生一控制訊號,指出如何將該進一步波形編碼的訊號及一解碼器中 的M個訊號中的一個的參數重建予以交錯。舉例而言,該控制訊號可指出一頻率範圍及一時間範圍以供對該進一步波形編碼訊號要該M個上混訊號中的一個予以交錯。
100‧‧‧解碼器
100'‧‧‧解碼器
200‧‧‧概念性部分
200'‧‧‧概念性部分
201a‧‧‧波形編碼訊號
201e‧‧‧波形編碼訊號
202‧‧‧位元流
208‧‧‧波形編碼降混訊號
208a‧‧‧波形編碼降混訊號
208b‧‧‧波形編碼降混訊號
210‧‧‧波形編碼訊號
210a‧‧‧波形編碼訊號
210e‧‧‧波形編碼訊號
212‧‧‧第一接收階段
214‧‧‧第二接收階段
216‧‧‧逆改進的離散式餘弦轉換
218‧‧‧正交鏡像濾波轉換
300‧‧‧解碼器100的概念性部分
300'‧‧‧解碼器100'的概念性部分
302a‧‧‧經結合的降混訊號
302b‧‧‧經結合的降混訊號
304‧‧‧高頻率擴張降混訊號
304a‧‧‧經頻率擴張的經結合降混訊號
304b‧‧‧經頻率擴張的經結合降混訊號
308‧‧‧降混階段
310‧‧‧降混訊號
312‧‧‧降混訊號
314‧‧‧高頻率重建階段
316‧‧‧高頻率重建範圍
318‧‧‧高頻率重建範圍
320‧‧‧第一結合階段
322‧‧‧第一結合階段
400'‧‧‧解碼器100'的概念性部分
400‧‧‧解碼器100的概念性部分
402‧‧‧上混階段
404‧‧‧上混訊號
404a‧‧‧上混訊號
404c‧‧‧上混訊號
404e‧‧‧上混訊號
412‧‧‧延遲階段
414‧‧‧逆正交鏡像濾波轉換
416‧‧‧第二結合階段
418‧‧‧第二結合階段
420‧‧‧逆正交鏡像濾波轉換
422‧‧‧經結合的訊號
500‧‧‧編碼器
502、504‧‧‧輸入訊號
506‧‧‧第一波形編碼階段
508‧‧‧第二波形編碼階段
518‧‧‧波形編碼訊號
520‧‧‧量化階段
522‧‧‧經量化的訊號
524‧‧‧位元流生成階段(位元流多工器)
526‧‧‧正交鏡像濾波分析階段
530‧‧‧參數編碼階段
532‧‧‧高頻率重建編碼階段
534‧‧‧降混階段
536‧‧‧參數訊號
538‧‧‧參數訊號
544‧‧‧降混訊號
546‧‧‧降混訊號
548‧‧‧經編碼及量化的降混訊號
550‧‧‧經編碼及量化的降混訊號
552‧‧‧位元流
554‧‧‧逆正交鏡像濾波轉換
616‧‧‧第三接收階段
704‧‧‧交錯訊號
710‧‧‧進一步波形編碼訊號
710a‧‧‧進一步波形編碼訊號
710e‧‧‧進一步波形編碼訊號
712‧‧‧延遲階段
714‧‧‧交錯階段
722‧‧‧輸出訊號
800‧‧‧編碼器
802‧‧‧交錯偵測階段
804‧‧‧經辨識的頻率及時間子集
806‧‧‧經辨識的頻率及時間子集
808‧‧‧進一步波形編碼訊號
810‧‧‧控制訊號
846‧‧‧位元流
範例實施例將搭配參照附呈圖式而予以說明,其中:圖1顯示根據本發明一範例實施例的一個解碼系統的概括方塊圖;圖2顯示圖1中的該解碼系統的一第一部分;圖3顯示圖1中的該解碼系統的一第二部分;圖4顯示圖1中的該解碼系統的一第三部分;圖5顯示根據本發明一範例實施例的一編碼系統的概括方塊圖;圖6顯示根據本發明一範例實施例的一解碼系統的概括方塊圖;圖7顯示圖6中的該解碼系統的一第三部分;以及圖8顯示根據本發明一範例實施例的一編碼系統的概括方塊圖;所有圖式皆為示意性並概括性地僅顯示必要的部分,以闡述本發明,因此其他部分將予以略過或僅以提述方式說明。除非另有說明,否則不同圖示中的相同參照號碼皆指涉相同的部件。
圖1顯示一解碼器100的概括方塊圖,該解碼器100在一多聲道音頻處理系統中用於重建M個經編碼的聲道。該解碼器100包含三個概念性部分200、300、400,其較詳細的細節將在以下搭配第2-4圖予以說明。在第一概念性部分200中,該編碼器接收代表欲解碼多聲道音頻訊號的N個波形編碼降混訊號以及M個波形編碼訊號,其中1<N<M。在描述的該範例中,N設定為2。在第二概念性部分300中,該M個波形編碼訊號為經降混並與該N個波形編碼降混訊號結合。然後即會對該些經結合的降混訊號執行高頻率重建(HFR)。在第三概念性部分400中,該些經高頻率重建的訊號為經過上混,且該M個波形編碼訊號與該些上混訊號結合,而重建M個編碼聲道。
在搭配圖2至4而說明的該範例性實施例中,將說明一編碼5.1環繞聲道的重建。可注意到的是,該實施例或該些圖式,並未提述該低頻效果的訊號。這並不表示有任何低頻效果被忽略。該些低頻效果(low frequency effect,Lfe)可由熟悉本領域技藝者以任何適合的習知方式加入至該些經重建的5個聲道。另外亦可注意到的是,該所述的解碼器同樣地適用於其他類型的編碼環繞聲道,例如7.1或9.1環繞聲道。
圖2顯示圖1中的該解碼器100的該第一概念性部分200。該解碼器包含二個接收階段212及214。 在該第一接收階段212中,一位元流202經解碼及解量化而成為二個波形編碼降混訊號208a及208b。該二個波形編碼降混訊號208a及208b的每一個包含對應於第一交叉頻率ky及一第二交叉頻率kx之間的頻率的頻譜係數。
在該第二接收階段212中,該位元流202經 解碼及解量化而成為五個波形編碼降混訊號210a至210e。該五個波形編碼降混訊號210a至210e的每一個包含對應於最高至該第一交叉頻率kx的頻率的頻譜係數。
舉例而言,該些訊號210a至210e包含二組 雙聲道元件以及一個單聲道元件位於中央。該些雙聲道元件,舉例而言,可為該前置左訊號及該環繞左訊號的一組合,以及該前置右訊號及該環繞右訊號的一組合。另一個範例為,該前置左訊號及該前置右訊號的一組合,以及該環繞左訊號及該環繞右訊號的一組合。該些雙聲道組合元件,舉例而言,可以一和與差格式而予以編碼。該五個訊號210a至210e全部皆可以個別加窗方式使用重疊加窗轉換編碼,而仍可透過該解碼器解碼。藉此得以改善編碼品質,並因而改善該經解碼的訊號的品質。
舉例而言,該第一交叉頻率ky為1.1kHz。舉例而言,該第二交叉頻率kx為在5.6至8kHz的範圍內。應注意的是,該第一交叉頻率ky為可變動,甚至可以基於個別訊號而變動,亦即,該編碼器可偵測出在一特定輸出訊號中的一訊號組成,並未完全由該些立體聲降混訊號208a至208b重現,而能在該特定時間下增加頻寬,亦即 相關的波形編碼訊號(即210a至210e)的該第一交叉頻率ky,以對該訊號組成進行正確的波形編碼。
本說明書後續將敘述該編碼器100的其餘階 段,該些階段通常為在該正交鏡像濾波頻(QMF)域中運作。因此,由該第一及第二接收階段212及214所接收的經改進的離散式餘弦轉換(modified discrete cosine transform,MDCT)格式的該些訊號208a至208b以及210a至210e,係套用一逆改進的離散式餘弦轉換(inverse MDCT)216而轉換為該時域。然後每個訊號則藉由套用一正交鏡像濾波轉換218而轉換回該頻域。
在圖3中,該五個波形編碼訊號210在一降混階段308被降混為二個降混訊號310及312,其包含對應於最高至該第一交叉頻率ky的該些頻率的頻譜係數。可藉由使用圖2所示的相同降混方式(在一編碼器生成該二個降混訊號208a及208b),在該些低通多聲道訊號210a至210e執行降混而形成該些降混訊號310及312。
然後,該二個新的降混訊號310及312與該些對應的降混訊號208a及208b在一第一結合階段320、322中結合而形成經結合的降混訊號302a及302b。該些經結合的降混訊號302a及302b中的每一個,因此而包含以下頻譜係數:1)源於該些降混訊號310及312且對應於最高至該第一交叉頻率ky的頻率的頻譜係數,以及2)源於在該第一接收階段212(如圖2所示)所接收之該二個波形編碼降混訊號208a及208b,且對應於該第一交叉 頻率ky與該第二交叉頻率kx之間的頻率之頻譜係數。
該編碼器更包含一高頻率重建(HFR)階段 314。該高頻率重建階段經設置而藉由執行高頻率重建,而將得自該結合階段的該二個經結合的降混訊號302a及302b的每一個,擴張至一高於該第二交叉頻率的頻率範圍。所執行的該高頻率重建可根據某些實施例而包含執行頻譜帶複製(SBR)。該高頻率重建可藉由使用高頻率重建參數而完成,該些參數可以任何適當的方式而藉由該高頻率重建階段314接收。
該高頻率重建階段314所輸出者為二個訊號 304a及304b,該二個訊號包含已套用該高頻率重建擴張316及318的該些降混訊號208a及208b。如前所述,該高頻率重建階段314中的高頻率重建係基於來自該第二接收階段214(如圖2所示)的該些輸入訊號210a至210e中的頻率與該二個降混訊號208a及208b結合而執行。簡而言之,該高頻率重建範圍316、318包含來自於經複製到該高頻率重建範圍316、318的該些降混訊號310及312的部分頻譜係數。因此,該五個波形編碼訊號210a至210e的部分將會出現在來自該高頻率重建階段314的輸出304的該高頻率重建範圍316及318中。
應注意的是,該降混階段308中的降混步驟 以及該高頻率重建階段314之前的該第一結合階段320及322中的該結合步驟,可在該時域中完成;亦即,在每一個訊號皆已藉由套用一逆改進離散餘弦轉換216而被轉換 至該時域中之後(如圖2所示)。然而,鑒於該些波形編碼210a至210e以及該些波形編碼降混訊號208a及208b能夠藉由一波形編碼器使用個別加窗而重疊加窗轉換的方式而編碼,該些訊號210a至210e以及208a及208b不會無縫地在一時域中結合。因此,若至少在該第一結合階段320、322中的結合步驟是在該正交鏡像濾波頻域完成,則可達成一較好的控制狀況。
圖4顯示該編碼器100的第三及最後的概念 性部分400。來自該高頻率重建階段314的輸出304,構成對於一上混階段402的輸入。該上混階段402藉由在該些頻率擴張訊號304a至304b上執行參數上混,而輸出五個訊號404a至404e。該五個上混訊號404a至404e的每一個,對應於用於比該第一交叉頻率ky之頻率高的5.1環繞聲道中的五個編碼聲道中的其中一個。該上混階段402更產生該二個經頻率擴張結合的降混訊號304a及304b的經分頻的版本。該上混階段402更使該二個經頻率擴張的經結合降混訊號304a及304b以及該二個經分頻版本的經頻率擴張的經結合降混訊號304a及304b的接受一矩陣操作,其中該矩陣操作的參數,係由該些上混參數所給定。 另外,亦可套用該領域習知的其他參數上混方式。可用的參數上混步驟示例,詳述於〈MPEG環繞:兼具效率及相容性的多聲道音頻編碼的ISO/MPEG標準〉(Herre等人,音頻工程學會期刊,2008年11月,第56卷,第11期)。
來自該上混階段402的該些輸出404a至404e 因而不包含低於該第一交叉頻率ky的頻率。其餘對應於最高至該第一交叉頻率ky之多個頻率的頻譜係數,係存在於該五個波形編碼訊號210a至210e之中,該五個訊號已於一延遲階段412經延遲以符合該些上混訊號404的時間。
該編碼器100更包含一第二結合階段416及 418。該第二結合階段416及418係經設置而將該五個上混訊號404a至404e與該第二接收階段214所接收的該五個波形編碼訊號210a至210e予以結合(如圖2所示)。
可注意的是,任何目前的Lfe訊號皆可作為 一分別的訊號而加入至該經結合的訊號422。然後,藉由套用一逆正交鏡像濾波轉換420,而將該些訊號422的每一個轉換至該時域。該逆正交鏡像濾波轉換414因此即輸出經完整編碼的5.1聲道音頻訊號。
圖6顯示一解碼系統100',其為圖1中的該 解碼系統100之修改。該解碼系統100'具有概念性部分200'、300'及400',對應於圖1中的該些概念性部分100、200及300。圖6的該解碼系統100'與圖1的該解碼系統的差異之處為,該概念性部分200'中具有一第三接收階段616,而該第三概念性部分400'具有一交錯放置階段714。
該第三接收階段616經設置而接收一進一步 波形編碼訊號。該進一步波形編碼訊號包含對應於一高於 該第一交叉頻率之頻率子集的頻譜係數。該進一步波形編碼訊號可藉由套用一逆改進的離散式餘弦轉換216而轉換至時域。然後可藉由套用一正交鏡像濾波轉換218而轉換回該頻域。
應理解的是,該進一步波形編碼訊號可作為 一分別的訊號而被接收。然而,該進一步波形編碼訊號亦可形成該五個波形編碼訊號210a至210e中的一或多個的一部分。換言之,該進一步波形編碼訊號可與該五個波形編碼訊號210a至210e中的一或多個共同被編碼,例如,使用相同的改進的分立式餘弦轉換。若如此,該第三接收階段616則對應於該第二接收階段,亦即,該進一步波形編碼訊號係與該五個波形編碼訊號210a至210e共同被該第二接收階段214接收。
圖7顯示圖6的該解碼器100'的該第三概念 性部分300'的更多細節。在該些高頻率擴張降混訊號304a至304b及該五個波形編碼訊號210a至210e之外,另外加入了該進一步波形編碼訊號710至該第三概念性部分400'。在所示的範例中,該進一步波形編碼訊號710對應於該五個訊號中的第三聲道。該進一步波形編碼訊號710更包含對應於自該第一交叉頻率ky起始的一頻率間隔的頻譜係數。然而,該進一步波形編碼訊號710所涵蓋之該高於該第一交叉頻率的頻率範圍之子集的形式,在不同實施例中亦可有所變動。同時應注意的是,可接收複數個波形編碼訊號710a至710e,其中該些不同的波形編碼訊 號可對應於不同的輸出聲道。該複數個進一步波形編碼訊號710a至710e所涵蓋之頻率範圍的子集亦可在該複數個進一步波形編碼訊號710a至710e的不同個之間變動。
該進一步波形編碼訊號710可於一延遲階段 712延遲,以符合該上混階段402所輸出的該些上混訊號404的時間。然後,該些上混訊號404及該進一步波形編碼訊號710即會輸入至一交錯階段714。該交錯放置階段714執行交錯,亦即,結合該上混訊號404與該進一步波形編碼訊號710而產生一交錯訊號704。在所述範例中,該交錯階段714藉此將該些第三上混訊號404c與該進一步波形編碼訊號710予以交錯。該交錯可藉由將兩個訊號加在一起而執行。然而,通常該交錯係在該些訊號重疊的該頻率範圍和時間範圍中以該進一步波形編碼訊號710取代該些上混訊號404而執行。
然後該經交錯訊號704即會被輸入至該第二 結合階段416及418,在此該經交錯訊號704與該些波形編碼訊號201a至201e結合,以參照圖4所述之相同方式,而產生一輸出訊號722。應注意的是,該交錯階段714及該第二結合階段416及418可以反序而操作,在該交錯階段前執行該結合步驟。
再者,在該進一步波形編碼訊號710形成該 五個波形編碼訊號210a至210e其中的一或多個的部分之情況下,該第二結合階段416及418,以及該交錯階段714,可結合成一單一階段。具體而言,此一結合階段將 使用該五個波形編碼訊號210a至210e的頻譜內容而用於最高至該第一交叉頻率ky的該些頻率。針對高於該第一交叉頻率的頻率,該結合階段將使用該些上混訊號404而與該進一步波形編碼訊號710予以交錯。
該交錯階段714可在一控制訊號的控制下操 作。針對此目的,舉例而言,該解碼器100'可經由該第三接收階段616而接收一控制訊號,該控制訊號指出如何將該進一步波形編碼訊號與該M個上混訊號中的一個予以交錯。舉例而言,該控制訊號可指出將該進一步波形編碼訊號710與該些上混訊號404中的一個予以交錯的該頻率範圍及該時間範圍。例如,該頻率範圍及該時間範圍可以時頻網格表示要進行何種交錯。該些時頻網格可為進行該交錯的該正交鏡像濾波頻域的時頻網格。
該控制訊號可使用多個向量,例如二元向 量,以指出要進行交錯的該些時頻網格。具體而言,可具有相關於一頻率方向的一第一向量,該向量指出要執行交錯的頻率。舉例而言,該指示可藉由替該第一向量中的該對應的頻率間隔指出一邏輯一而進行。亦可具有一相關於一時間方向的第二向量,該向量指出要執行交錯的時間間隔。舉例而言,該指示可藉由替該第一向量中的該對應的時間間隔指出一邏輯一而進行。針對此目標,一時間框架通常被分隔成複數個時間槽,以使該時間指示可基於子框架而執行。透過使該第一與第二向量交叉,即可建立一時頻矩陣。舉例而言,該時頻矩陣可為一二元矩陣,包含每 個時頻網格的一邏輯一,用於使該第一及第二向量指出一邏輯一。然後該交錯階段714可隨執行交錯時使用該時頻矩陣,以對該些被指出(例如由該時頻矩陣中的一個邏輯一所指出)的時頻網格以該進一步波形編碼訊號710取代該些上混訊號704。
應注意的是,該些向量可使用二元向量以外 的其他方案,以指出要進行交錯的該些時頻網格。舉例而言,該些向量可藉由一第一值,例如一零值而指出不進行交錯;而藉由第二值表示要針對該第二值所辨識出的特定聲道進行交錯。
圖5以例示方式顯示一多聲道音頻處理系統 之編碼系統500的概括性方塊圖,該編碼系統500為根據一實施例而用於編碼M個聲道。
在圖5所描述的該範例性實施例中,將說明一編碼5.1環繞聲道的重建。因此,在所描述的該範例中,M設為五。可注意的是,在該實施例或該些圖式中,並未提述該低頻效果的訊號。這並不表示有任何低頻效果被忽略。該些低頻效果(Lfe)可由熟悉本領域技藝者以任何適合的習知方式加入至該位元流552。另外亦可注意的是,所述的該編碼器同樣地適用於對其他類型的環繞聲道編碼,例如7.1或9.1環繞聲道。在該編碼器500中,在一接收階段(圖未示)中接收了五個訊號502至504。該編碼器500包含一第一波形編碼階段506,其經設置而從該接收階段接收該五個訊號502至504,並藉由個別地 為該五個訊號502至504進行波形編碼而產生五個波形編碼訊號518。該波形編碼階段506,舉例而言,可使該五個接收的訊號502至504接受一改進的分立式餘弦轉換(MDCT)。如針對解碼器所述,該編碼器可選擇對該五個接收的訊號502至504的每一個,以個別加窗的方式,使用一改進的分立式餘弦轉換而進行編碼。藉此得以改善編碼品質,並因此改善該解碼訊號的品質。
該五個波形編碼訊號518為經波形編碼,用 於對應於在最高至一第一交叉頻率之多個頻率的頻率範圍。因此,該五個波形編碼訊號518,包含多個對應於在多個最高至該第一交叉頻率之頻率的頻譜係數。此可藉由使該五個波形編碼訊號518的每一個接受一低通濾波而達成。然後該五個波形編碼訊號518根據一人耳聲學模型(Psychoacoustic model)量化為520。考量該多聲道音頻觸理系統的可用位元率,該人耳聲學模型設置為儘可能地準確,而在該系統的一解碼端上解碼時,可以有如一聽者所感受到的結果而重現該經編碼的訊號。
如前所述,該編碼器500執行混合式的編 碼,其包含分立式多聲道編碼以及參數編碼。該分立式多聲道編碼係在該波形編碼階段506中,如前所述,對該些輸入訊號502至504的每一個的最高至該第一交叉頻率的該些頻率而執行。該參數編碼係經執行而得以在一解碼器端,自N個降混訊號對該些高於第一交叉頻率的頻率重建該五個輸入訊號502至504。在圖5所描述的範例中,N 設為2。該五個輸入訊號502至504的降混係在一降混階段534中執行。該降混階段534優選地為在一正交鏡像濾波頻域中運作。因此,在被輸入至該降混階段534之前,該五個訊號502至504係透過一正交鏡像濾波分析階段526而被轉換至一正交鏡像濾波頻域。該降混階段對該五個訊號502至504執行一線性降混,而輸出二個降混訊號544及546。
在該些二個降混訊號544及546藉由接受一 逆正交鏡像濾波轉換554而被轉換回該時域之後,由一第二波形編碼階段508所接收。該第二波形編碼階段508,藉由將該二個降混訊號544及546波形編碼而產生二個波形編碼降混訊號,用於對應於在該第一及該第二交叉頻率之間的頻率之一頻率範圍。舉例而言,該波形編碼階段508可使該二個降混訊號接受一改進的離散式餘弦轉換。 該二個波形編碼降混訊號因而包含對應於在該第一及該第二交叉頻率之間的頻率之一頻率範圍的頻譜係數。然後該二個波形編碼訊號為根據該人耳聲學模型而量化為522。
為能在一解碼器端重建高於該第二交叉頻率 的該些頻率,從該二個降混訊號544及546中擷取出高頻率重建(HFR)參數538。該些參數係在一高頻率重建編碼階段532而擷取。
為能在一解碼器端從該二個降混訊號544及 546重建該五個訊號,該五個輸入訊號502至504係由該參數編碼階段530接收。該五個輸入訊號502至504接受 對應於在最高至該第一交叉頻率之該些頻率的頻率範圍的參數編碼。然後,該參數編碼階段530經設置而擷取該些上混參數536,該些參數允許該二個降混訊號544及546上混為五個重建訊號,該些重建訊號為對應於高於該第一交叉頻率的該頻率範圍的該五個輸入訊號502至504(亦即,該經編碼的5.1環繞聲道的該五個聲道)。應注意的是,該些上混參數536的擷取係僅為用於高於該第一交叉頻率的該些頻率。如此可減少該參數編碼階段530的複雜度,以及該對應的參數資料的該位元率。
應注意的是,該降混534可在該時域完成。 在此情況下,該正交鏡像濾波分析階段526應被置於該降混階段534之下行,位於該高頻率重建編碼階段532之前,因為該高頻率重建編碼階段532通常為在該正交鏡像濾波頻域中運作。在此情況下,可略過該逆正交鏡像濾波階段554。
該編碼器500更包含一位元流生成階段,亦 即,位元流多工器(bitstream multiplexer)524。根據該編碼器500的範例實施例,該位元流生成階段為經設置而接收該五個經編碼及量化的訊號548、該二個參數訊號536及538,以及該二個經編碼及量化的降混訊號550。 該些訊號由該位元流生成階段524轉換成一位元流552,進而在該多聲道音頻系統中發送。
在所述的該多聲道音頻系統中,通常存在一最大可用位元率(maximum available bit rate),舉例而 言,通過網際網路傳送串流的音頻時。由於該些輸入訊號502至504的每一個時間框架的特性有所不同,故不可使用該五個波形編碼訊號548以及該二個降混波形編碼550之間完全相同的位元位置。除此之外,個別訊號548及550的每一個或多或少需要經定位的位元,以使該些訊號能夠根據該人耳聲學模型而被重建。根據一範例實施例,該第一及該第二波形編碼階段506及508共用一個位元儲存分配器(bit reservoir)。每個編碼框架中可用的該些位元會先在該第一及該第二波形編碼階段506及508之間發送,視該些要編碼的訊號的特性及現有之人耳聲學模型而定。接著該些位元則如前所述,在該些個別訊號548及550之間發送。發送可用的位元時,當然亦需考慮到該高頻率重建參數538及該上混參數536所使用的位元數。該人耳聲學模型經處理調整而用於該第一及該第二波形編碼階段506及508,以位於該特定時間框架的該位元數,而在該第一交叉頻率周圍順利傳輸。
圖8顯示一編碼系統800的其他實施例。圖8 的該編碼系統800與圖5的該編碼系統500之間的差異在於,該編碼器800為經安排而藉由將該些輸入訊號502至504中的一或多個波形編碼,而產生一進一步波形編碼訊號,用於對應高於該第一交叉頻率之頻率範圍的一子集的一頻率範圍。
針對此目的,該編碼器800包含一交錯偵測 階段802。該交錯偵測階段802經設置而辨識出該些輸入 訊號502至504中未透過該參數重建完整地重建而隨即由該參數編碼階段530以及該高頻率重建編碼階段532所編碼的部分。例如,該交錯偵測階段802可對該些輸入訊號502至504與藉由該參數編碼階段530以及該高頻率重建編碼階段532所定義之該些輸入訊號502至504的一參數重建進行比較。依據該比較,該交錯偵測階段802可辨識高於該第一交叉頻率的該頻率範圍的欲進行波形編碼的一子集804。該交錯偵測階段802亦可辨識高於該第一交叉頻率的該頻率範圍的該經辨識的子集804之欲進行波形編碼的時間範圍。該些經辨識的頻率及時間子集804及806可被輸入至該第一波形編碼階段506。基於該些經辨識的頻率及時間子集804及806,該第一波形編碼階段506藉由將該些輸入訊號502至504波形編碼而產生一進一步波形編碼訊號808,用於該些子集804及806所辨識出的該些時間與頻率範圍。然後,該進一步波形編碼訊號808可透過階段520而被編碼及量化,並加入至該位元流846。
該交錯偵測階段802更可包含一控制訊號產生階段。該控制訊號產生階段為經配置而產生一控制訊號810,指出如何將該進一步波形編碼訊號及一解碼器中的該些輸入訊號502及504中的一個之參數重建予以交錯。舉例而言,該控制訊號可指出該進一步波形編碼訊號要與一參數重建交錯的一頻率範圍及一時間範圍,如圖7。該控制訊號可加入至位元流846。
等同項目、擴展項目、替代項目以及雜項
對熟知本領域技藝者而言,在詳閱上述說明之後,本發明的進一步實施例可為顯而易見。雖然本說明書及圖式揭示了多個實施例及範例,本發明並不受限於該些特定範例。多種修改及變動可予以實施而不會偏離本發明在附呈的申請專利範圍中所定義的範圍。任何出現在申請專利範圍中的參考標誌皆不可理解為對該些申請專利範圍的限制。
此外,所揭示的實施例的變動,可由熟知技藝者在實施本發明時透過研究該些圖式、本申請案以及所附之申請範圍理解並實現。在申請範圍中,「包含」字樣並不排除其他元件或步驟,而量詞「一」或「一個」並不排除複數。事實上,彼此相異的附屬項中所引用的特定計算,並不表示不可使用該些技術的組合而取得優點。
本文前述所揭示的該些系統及方法,可以作為軟體、韌體、硬體或其組合而實施。在一硬體的實施中,前述說明所提述的該些功能單元之間的工作分配並不一定對應於實體單元的分配;相對地,一個實體構件可具有多數功能,而一個工作可能由數個實體構件共同進行。特定構件或所有的構件可作為軟體而由一數位訊號處理器或微處理器實施,或作為硬體或作為一個特定應用的積體電路而實施。此類軟體可發佈至電腦可讀取媒體上,該媒體可包含電腦儲存媒體(或非暫時性媒體)以及通訊媒體(或暫時性媒體)。如熟知本領域技藝者所週知,該術語 「電腦儲存媒體」包括揮發性及非揮發性、可卸式及不可卸式的媒體,以任何方法或技術實施而儲存資訊,例如電腦可讀取之指令、資料結構、程式模組或其他資料。電腦儲存媒體包括,但不限於:隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電子可擦除唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、CD-ROM、數位多功能影音光碟(DVD)或其他光學磁碟儲存空間、磁性卡帶、磁帶、磁碟儲存空間或其他磁性儲存裝置,或任何可用於儲存想要的資訊且可由一電腦存取的其他媒體。此外,如熟知本領域技藝者所週知,通訊媒體通常實施多種電腦可讀取的指令、資料結構、程式模組或其他模組化資料訊號形式的資料,例如一載波或其他傳輸機制,並包括任何傳遞資訊的媒體。
100‧‧‧解碼器
200‧‧‧解碼器100的概念性部分
300‧‧‧解碼器100的概念性部分
400‧‧‧解碼器100的概念性部分

Claims (29)

  1. 一種多聲道音頻處理系統中的解碼方法,用於重建M個編碼聲道,其中M>2,該解碼方法包含下列步驟:接收N個波形編碼降混訊號,該N個波形編碼降混訊號包含對應於在一第一交叉頻率及一第二交叉頻率之間的多個頻率之頻譜係數,其中1<N<M;接收M個波形編碼訊號,該M個波形編碼訊號包含對應於最高至該第一交叉頻率的多個頻率之頻譜係數,該M個波形編碼訊號中的每一個對應於該M個編碼聲道中的各別的一個聲道;將該M個波形編碼訊號降混為N個降混訊號,該N個降混訊號包含對應於最高至該第一交叉頻率的多個頻率之頻譜係數;將該N個波形編碼降混訊號中的每一個與該N個降混訊號中的對應的一個予以結合成為N個經結合的降混訊號,該N個波形編碼降混訊號包含對應於在一第一交叉頻率及一第二交叉頻率之間的多個頻率之頻譜係數,該N個降混訊號包含對應於最高至該第一交叉頻率的多個頻率之頻譜係數;對該N個經結合的降混訊號執行高頻率重建而擴張該N個經結合的降混訊號中的每一個至一高於該第二交叉頻率的頻率範圍;對該N個經擴張頻率的經結合降混訊號執行一參數上 混,而成為M個上混訊號,該M個上混訊號包含對應於高於該第一交叉頻率之多個頻率的頻譜係數,該M個上混訊號中的每一個為對應於該M個編碼聲道中的一個;以及將該M個上混訊號與該M個波形編碼訊號予以結合,該M個上混訊號包含對應於高於該第一交叉頻率之多個頻率的頻譜係數,該M個波形編碼訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數。
  2. 如申請專利範圍第1項所述的解碼方法,其中將該N個波形編碼降混訊號中的每一個與該N個降混訊號中的對應的一個予以結合成N個經結合降混訊號之步驟,係在一頻域中執行,該N個波形編碼降混訊號包含對應於在第一交叉頻率及第二交叉頻率之間的頻率之頻譜係數,該N個降混訊號包含對應於最高至該第一交叉頻率之多個頻率之頻譜係數。
  3. 如申請專利範圍第1項所述的解碼方法,其中擴張該N個經結合的降混訊號中的每一個至一高於該第二交叉頻率的頻率範圍之步驟,係在一頻域中執行。
  4. 如申請專利範圍第1項所述的解碼方法,其中將該M個上混訊號與該M個波形編碼訊號予以結合之步驟,係在一頻域中執行,該M個上混訊號包含對應於高於該第一交叉頻率的多個頻率之頻譜係數,該M個波形編碼訊號包含對應於最高至該第一交叉頻率的多個頻率之頻譜係數。
  5. 如申請專利範圍第1項所述的解碼方法,其中對該N個經頻率擴張的經結合降混訊號執行一參數上混,而成為M個上混訊號之步驟,係在一頻域中執行。
  6. 如申請專利範圍第1項所述的解碼方法,其中將該M個波形編碼訊號降混為N個降混訊號之步驟,係在一頻域中執行,該N個降混訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數。
  7. 如申請專利範圍第2至6項中任一項所述的解碼方法,其中該頻域為一正交鏡像濾波(QMF)頻域。
  8. 如申請專利範圍第1項所述的解碼方法,其中將該M個波形編碼訊號降混為該N個降混訊號之步驟,係在一時域中執行,該N個降混訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數。
  9. 如申請專利範圍第1項所述的解碼方法,其中該第一交叉頻率為依據該多聲道音頻處理系統的一位元傳輸率而定。
  10. 如申請專利範圍第1項所述的解碼方法,其中藉由執行高頻率重建而擴張該N個經結合降混訊號中的每一個至一高於該第二交叉頻率的頻率範圍之步驟包含:接收高頻率重建參數;以及藉由使用該高頻率重建參數執行高頻率重建而擴張該N個經結合降混訊號的每一個至一高於該第二交叉頻率的頻率範圍。
  11. 如申請專利範圍第10項所述的解碼方法,其中 藉由執行高頻率重建而擴張該N個經結合降混訊號中的每一個至一高於該第二交叉頻率的頻率範圍之步驟,包含執行一頻譜帶複製(SBR)。
  12. 如申請專利範圍第1項所述的解碼方法,其中對該N個經頻率擴張的經結合降混訊號執行一參數上混,而成為M個上混訊號之步驟包含:接收上混參數;產生經分頻版本的該N個經頻率擴張的經結合降混訊號;以及使該N個經頻率擴張的經結合降混訊號以及該經分頻版本的N個經頻率擴張的經結合降混訊號接受一矩陣操作,其中該矩陣操作的參數係由該上混參數所給定。
  13. 如申請專利範圍第1項所述的解碼方法,其中該接收到的N個波形編碼降混訊號及該接收到的M個波形編碼訊號係經使用分別加獨立窗的重疊加窗轉換而對於該N個波形編碼降混訊號及該M個波形編碼訊號予以編碼。
  14. 如申請專利範圍第1項所述的解碼方法,更包含下列步驟:接收一經進一步波形編碼的訊號,該經進一步波形編碼的訊號包含對應於高於該第一交叉頻率之多個頻率的一子集的頻譜係數;以及將該進一步波形編碼的該訊號與該M個上混訊號中的一個予以交錯。
  15. 如申請專利範圍第14項所述的解碼方法,其中將該進一步波形編碼的該訊號與該M個上混訊號的其中一個予以交錯之步驟,包含將該經進一步波形編碼的訊號與該M個上混訊號中的一個予以相加。
  16. 如申請專利範圍第14項所述的解碼方法,其中將該進一步波形編碼訊號與該M個上混訊號的其中一個予以交錯之步驟,包含以對應於該進一步波形編碼訊號之頻譜訊號的該高於第一交叉頻率之多個頻率的該子集中的該進一步波形編碼訊號取代該M個上混訊號中的一個。
  17. 如申請專利範圍第14至16項中任一項所述的解碼方法,更包含接收一控制訊號,該控制訊號指出如何將該經進一步波形編碼的訊號與該M個上混訊號中的一個予以交錯,其中將該進一步波形編碼的訊號與該M個上混訊號中的一個予以交錯的步驟,為基於該控制訊號。
  18. 如申請專利範圍第17項所述的解碼方法,其中該控制訊號指出一頻率範圍及一時間範圍以供該經進一步波形編碼的訊號與該M個上混訊號中的一個予以交錯。
  19. 一電腦程式產品,包含一電腦可讀取媒體,其具有執行如申請專利範圍第1至18項中任一項所述的解碼方法的指令。
  20. 一種多聲道音頻處理系統的解碼器,用於重建M個編碼聲道,其中M>2,該解碼器包含:一第一接收階段,經設置而接收N個波形編碼降混訊號,該N個波形編碼降混訊號包含對應於在一第一交叉頻 率及一第二交叉頻率之間的多個頻率之頻譜係數,其中1<N<M;一第二接收階段,經設置而接收M個波形編碼訊號,該M個波形編碼訊號包含對應於最高至該第一交叉頻率的多個頻率之頻譜係數,該M個波形編碼訊號中的每一個對應於該M個編碼聲道中的各別一個聲道;一降混階段,為該第二接收階段的下行階段,該降混階段經設置而將該M個波形編碼訊號降混為N個降混訊號,該N個降混訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數;一第一結合階段,為該第一接收階段及該降混階段的下行階段,該第一結合階段經設置而將該第一接收階段所接收的該N個降混訊號中的每一個與得自該降混階段的該N個降混訊號中的對應的一個予以結合,而成為N個經結合的降混訊號;一高頻率重建階段,為該第一結合階段的下行階段,該高頻率重建階段經設置而對得自該結合階段的該N個經結合的降混訊號執行高頻率重建而擴張該N個經結合的降混訊號中的每一個至一高於該第二交叉頻率的頻率範圍;一上混階段,為該高頻率重建階段的下行階段,該上混階段經設置而對得自該高頻率重建階段的該N個經擴張頻率的訊號執行一參數上混,而成為M個上混訊號,該M個上混訊號包含對應於高於該第一交叉頻率之頻率的頻譜係數,該M個上混訊號的每一個為對應於該M個編碼 聲道的其中一個;以及一第二結合階段,為該上混階段及該第二接收階段的下行階段,該第二結合階段經設置而將得自該上混階段的該M個上混訊號及該第二接收階段所接收的M個波形編碼訊號予以結合。
  21. 一種編碼方法,用於編碼一多聲道音頻處理系統中的M個聲道,其中M>2,包含下列步驟:接收對應於欲編碼的該M個聲道的M個訊號;藉由將該M個訊號個別地波形編碼為對應於最高至第一交叉頻率之多個頻率的一頻率範圍,而產生M個波形編碼訊號,據此使該M個波形編碼訊號包含對應於最高至該第一交叉頻率的多個頻率的頻譜係數。將該M個訊號降混為N個降混訊號,其中1<N<M;使該N個降混訊號接受高頻率重建編碼,據此擷取高頻率重建參數,該參數使該N個降混訊號得以被高頻率重建為高於一第二交叉頻率;使該M個訊號接受參數編碼而成為對應於高於該第一交叉頻率之多個頻率的該頻率範圍,據此擷取上混參數,該參數使該N個降混訊號得以上混為M個經重建的訊號,該M個經重建的訊號為對應於高於該第一交叉頻率的該頻率範圍的M個聲道;以及藉由將對應於在該第一及該第二交叉頻率之間多個頻率之頻率範圍的N個降混訊號進行波形編碼,而產生N個波形編碼降混訊號,據此該N個波形編碼降混訊號包含 對應於在該第一及該第二交叉頻率之間的多個頻率之頻譜係數。
  22. 如申請專利範圍第21項所述的編碼方法,其中使該N個降混訊號接受高頻率重建編碼的步驟係於一頻域中執行,較佳地,為一正交鏡像濾波器(QMF)頻域。
  23. 如申請專利範圍第21項所述的編碼方法,其中使該M個訊號接受參數編碼的步驟係於一頻域中執行,較佳地,為一正交鏡像濾波器(QMF)頻域。
  24. 如申請專利範圍第21項所述的編碼方法,其中藉由將該M個訊號個別地波形編碼,而產生M個波形編碼訊號的步驟,包含對該M個訊號套用一重疊加窗轉換,其中該M個訊號中的至少二個使用不同的重疊加窗順序。
  25. 如申請專利範圍第21項所述的解碼方法,更包含下列步驟:藉由將該M個訊號的其中一個波形編碼為對應於高於該第一交叉頻率的一頻率範圍子集之一頻率範圍,而產生一經進一步波形編碼的訊號。
  26. 如申請專利範圍第25項所述的解碼方法,更包含產生一控制訊號,該控制訊號指出如何將該經進一步波形編碼的訊號以及一解碼器中的M個訊號中的一個之一參數重建予以交錯。
  27. 如申請專利範圍第26項所述的解碼方法,其中該控制訊號指出一頻率範圍及一時間範圍以供對該經進一 步波形編碼的訊號與該M個上混訊號中的一個予以交錯。
  28. 一電腦程式產品,包含一電腦可讀取媒體,其具有執行申請專利範圍第21至27項中任一項之方法的指示。
  29. 一多聲道音頻處理系統的一編碼器,用於編碼M個聲道,其中M>2,包含下列步驟:一接收階段,經設置而接收對應於欲編碼的該M個聲道的M個訊號;一第一波形編碼階段,經設置而自該接收階段接收該M個訊號,及藉由將該M個訊號波形編碼為對應於最高至第一交叉頻率之多個頻率的一頻率範圍,而產生M個波形編碼訊號,據此使該M個波形編碼訊號包含對應於最高至該第一交叉頻率之多個頻率的頻譜係數。一降混階段,經設置而自該接收階段接收該M個訊號,及降混該M個訊號成為N個降混訊號,其中1<N<M;一高頻率重建編碼階段,經設置而自該降混階段接收該N個降混訊號,及使該N個降混訊號接受高頻率重建編碼,據此該高頻率重建編碼階段係為經設置而擷取高頻率重建參數,該參數使該N個降混訊號得以被高頻率重建為高於一第二交叉頻率;一參數編碼階段,經設置而自該接收階段接收該M個訊號,及使該M個訊號接受對應於高於該第一交叉頻 率之多個頻率的該頻率範圍的參數編碼,據此該參數編碼階段經設置而擷取上混參數,該參數使該N個降混訊號得以上混為M個經重建的訊號,該M個經重建的訊號為對應於用於高於該第一交叉頻率的該頻率範圍的M個聲道;以及一第二波形編碼階段,經設置而自該降混階段接收該N個降混訊號,及藉由將對應於該第一及該第二交叉頻率之間多個頻率之頻率範圍的N個降混訊號進行波形編碼,而產生N個波形編碼降混訊號,據此該N個波形編碼降混訊號包含對應於在該第一及該第二交叉頻率之間的多個頻率之頻譜係數。
TW103109074A 2013-04-05 2014-03-13 音頻編碼器及解碼器 TWI546799B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201361808680P 2013-04-05 2013-04-05

Publications (2)

Publication Number Publication Date
TW201505024A true TW201505024A (zh) 2015-02-01
TWI546799B TWI546799B (zh) 2016-08-21

Family

ID=50439393

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103109074A TWI546799B (zh) 2013-04-05 2014-03-13 音頻編碼器及解碼器

Country Status (21)

Country Link
US (6) US9489957B2 (zh)
EP (3) EP3171361B1 (zh)
JP (7) JP6031201B2 (zh)
KR (7) KR20240038819A (zh)
CN (2) CN109410966B (zh)
AU (1) AU2014247001B2 (zh)
BR (7) BR112015019711B1 (zh)
CA (1) CA2900743C (zh)
DK (1) DK2954519T3 (zh)
ES (2) ES2748939T3 (zh)
HK (1) HK1213080A1 (zh)
HU (1) HUE031660T2 (zh)
IL (1) IL240117A0 (zh)
MX (4) MX369023B (zh)
MY (3) MY185848A (zh)
PL (1) PL2954519T3 (zh)
RU (2) RU2641265C1 (zh)
SG (1) SG11201506139YA (zh)
TW (1) TWI546799B (zh)
UA (1) UA113117C2 (zh)
WO (1) WO2014161992A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI613643B (zh) * 2015-03-09 2018-02-01 弗勞恩霍夫爾協會 用於編碼多聲道信號的音訊編碼器與方法、用於解碼經編碼音訊信號的音訊解碼器與方法及相關電腦程式
TWI726337B (zh) * 2018-06-22 2021-05-01 弗勞恩霍夫爾協會 多聲道音訊寫碼技術

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
WO2015007774A1 (de) 2013-07-18 2015-01-22 Basf Se Vereinzelung einer polyarylenetherlösung
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
KR20240050483A (ko) 2015-06-17 2024-04-18 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
PL3405949T3 (pl) 2016-01-22 2020-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób szacowania międzykanałowej różnicy czasowej
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
US10354667B2 (en) 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5459B2 (zh) 1973-12-20 1979-01-05
IT1044736B (it) * 1975-04-23 1980-04-21 Cselt Centro Studi Lab Telecom Sistema numerico per la trasmissione dei canali di due fasci modulati a impulsi codificati alla velocita di un solo fascio
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP3677185B2 (ja) * 1999-11-29 2005-07-27 株式会社東芝 符号分割多重伝送方式と送信装置及び受信装置
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030220800A1 (en) 2002-05-21 2003-11-27 Budnikov Dmitry N. Coding multichannel audio signals
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
WO2005098824A1 (en) 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
DE602005011439D1 (de) 2004-06-21 2009-01-15 Koninkl Philips Electronics Nv Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen
US7756713B2 (en) * 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
CN101151660B (zh) 2005-03-30 2011-10-19 皇家飞利浦电子股份有限公司 多通道音频编码器、解码器以及相应方法
JP2006323037A (ja) * 2005-05-18 2006-11-30 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
WO2007046659A1 (en) * 2005-10-20 2007-04-26 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
WO2008031458A1 (en) * 2006-09-13 2008-03-20 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
KR101405972B1 (ko) 2007-07-02 2014-06-12 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
RU2443075C2 (ru) 2007-10-09 2012-02-20 Конинклейке Филипс Электроникс Н.В. Способ и устройство для генерации бинаурального аудиосигнала
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
AU2008339211B2 (en) 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2009084916A1 (en) * 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2260487B1 (en) * 2008-03-04 2019-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
MX2011000370A (es) * 2008-07-11 2011-03-15 Fraunhofer Ges Forschung Un aparato y un metodo para decodificar una señal de audio codificada.
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
TWI413109B (zh) * 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
WO2010097748A1 (en) 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
US20100223061A1 (en) 2009-02-27 2010-09-02 Nokia Corporation Method and Apparatus for Audio Coding
BR122019023924B1 (pt) * 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
BRPI1004215B1 (pt) 2009-04-08 2021-08-17 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para upmixagem de sinal de áudio downmix utilizando uma atenuação de valor de fase
KR20110018107A (ko) 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
ES2644520T3 (es) * 2009-09-29 2017-11-29 Dolby International Ab Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
MX2012004648A (es) * 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
US9026236B2 (en) * 2009-10-21 2015-05-05 Panasonic Intellectual Property Corporation Of America Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
RU2683175C2 (ru) * 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
PL3779979T3 (pl) 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
RU2573774C2 (ru) 2010-08-25 2016-01-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
FR2973551A1 (fr) 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
EP2702589B1 (en) 2011-04-28 2017-04-05 Dolby International AB Efficient content classification and loudness estimation
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
US9166864B1 (en) * 2012-01-18 2015-10-20 Google Inc. Adaptive streaming for legacy media frameworks
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI613643B (zh) * 2015-03-09 2018-02-01 弗勞恩霍夫爾協會 用於編碼多聲道信號的音訊編碼器與方法、用於解碼經編碼音訊信號的音訊解碼器與方法及相關電腦程式
US10388287B2 (en) 2015-03-09 2019-08-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US10395661B2 (en) 2015-03-09 2019-08-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US10777208B2 (en) 2015-03-09 2020-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11107483B2 (en) 2015-03-09 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11238874B2 (en) 2015-03-09 2022-02-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11741973B2 (en) 2015-03-09 2023-08-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11881225B2 (en) 2015-03-09 2024-01-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
TWI726337B (zh) * 2018-06-22 2021-05-01 弗勞恩霍夫爾協會 多聲道音訊寫碼技術
US11978459B2 (en) 2018-06-22 2024-05-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multichannel audio coding

Also Published As

Publication number Publication date
JP6377110B2 (ja) 2018-08-22
BR122022004786A8 (pt) 2022-09-06
PL2954519T3 (pl) 2017-06-30
US9728199B2 (en) 2017-08-08
BR122020017065B1 (pt) 2022-03-22
US11830510B2 (en) 2023-11-28
BR112015019711A2 (pt) 2017-07-18
US20240153517A1 (en) 2024-05-09
RU2602988C1 (ru) 2016-11-20
DK2954519T3 (en) 2017-03-20
EP3171361B1 (en) 2019-07-24
BR122021004537B1 (pt) 2022-03-22
BR122022004787A8 (pt) 2022-09-06
KR102142837B1 (ko) 2020-08-28
US9489957B2 (en) 2016-11-08
EP3171361A1 (en) 2017-05-24
JP6808781B2 (ja) 2021-01-06
CN105308680A (zh) 2016-02-03
MX2019012711A (es) 2019-12-16
BR122022004784B1 (pt) 2022-06-07
ES2748939T3 (es) 2020-03-18
BR122022004786A2 (zh) 2017-07-18
EP2954519B1 (en) 2017-02-01
KR20150113976A (ko) 2015-10-08
MY185848A (en) 2021-06-14
JP7033182B2 (ja) 2022-03-09
JP2018185536A (ja) 2018-11-22
MX2022004397A (es) 2022-06-16
CA2900743C (en) 2016-08-16
KR20200033988A (ko) 2020-03-30
UA113117C2 (xx) 2016-12-12
CN109410966B (zh) 2023-08-29
BR122022004787B1 (pt) 2022-10-18
US20160343383A1 (en) 2016-11-24
WO2014161992A1 (en) 2014-10-09
BR112015019711B1 (pt) 2022-04-26
BR122017006819B1 (pt) 2022-07-26
AU2014247001A1 (en) 2015-08-13
JP2016513287A (ja) 2016-05-12
MY183360A (en) 2021-02-18
JP2021047450A (ja) 2021-03-25
KR20220044609A (ko) 2022-04-08
KR20200096328A (ko) 2020-08-11
JP7413418B2 (ja) 2024-01-15
CA2900743A1 (en) 2014-10-09
KR101763129B1 (ko) 2017-07-31
US20170301362A1 (en) 2017-10-19
KR102094129B1 (ko) 2020-03-30
US20220059110A1 (en) 2022-02-24
CN109410966A (zh) 2019-03-01
AU2014247001B2 (en) 2015-08-27
KR20170087529A (ko) 2017-07-28
KR20210005315A (ko) 2021-01-13
BR122017006819A2 (pt) 2019-09-03
HK1213080A1 (zh) 2016-06-24
RU2641265C1 (ru) 2018-01-16
ES2619117T3 (es) 2017-06-23
IL240117A0 (en) 2015-09-24
BR122022004786B1 (pt) 2022-10-04
JP2022068353A (ja) 2022-05-09
KR102201951B1 (ko) 2021-01-12
CN105308680B (zh) 2019-03-19
US11114107B2 (en) 2021-09-07
JP6537683B2 (ja) 2019-07-03
KR102380370B1 (ko) 2022-04-01
MX2015011145A (es) 2016-01-12
BR122022004784B8 (pt) 2022-09-13
JP2024038139A (ja) 2024-03-19
EP2954519A1 (en) 2015-12-16
US10438602B2 (en) 2019-10-08
KR20240038819A (ko) 2024-03-25
US20160012825A1 (en) 2016-01-14
JP2019191596A (ja) 2019-10-31
JP6031201B2 (ja) 2016-11-24
SG11201506139YA (en) 2015-09-29
TWI546799B (zh) 2016-08-21
MY196084A (en) 2023-03-14
BR122022004787A2 (zh) 2017-07-18
MX369023B (es) 2019-10-25
EP3627506A1 (en) 2020-03-25
JP2017078858A (ja) 2017-04-27
MX347936B (es) 2017-05-19
US20200098381A1 (en) 2020-03-26
HUE031660T2 (en) 2017-07-28

Similar Documents

Publication Publication Date Title
TWI546799B (zh) 音頻編碼器及解碼器