TWI480860B - 音訊編碼中之訊框元件長度傳輸技術 - Google Patents

音訊編碼中之訊框元件長度傳輸技術 Download PDF

Info

Publication number
TWI480860B
TWI480860B TW101109346A TW101109346A TWI480860B TW I480860 B TWI480860 B TW I480860B TW 101109346 A TW101109346 A TW 101109346A TW 101109346 A TW101109346 A TW 101109346A TW I480860 B TWI480860 B TW I480860B
Authority
TW
Taiwan
Prior art keywords
frame
component
payload
length
sequence
Prior art date
Application number
TW101109346A
Other languages
English (en)
Other versions
TW201243827A (en
Inventor
Max Neuendorf
Markus Multrus
Stefan Doehla
Heiko Purnhagen
Bont Frans De
Original Assignee
Fraunhofer Ges Forschung
Dolby Int Ab
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Dolby Int Ab, Koninkl Philips Electronics Nv filed Critical Fraunhofer Ges Forschung
Publication of TW201243827A publication Critical patent/TW201243827A/zh
Application granted granted Critical
Publication of TWI480860B publication Critical patent/TWI480860B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Communication Control (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

音訊編碼中之訊框元件長度傳輸技術
本發明係有關於音訊編碼,諸如所謂的USAC編解碼器(USAC=統一語音與音訊編碼),及更明確言之訊框元件長度傳輸。
近年來已有數種音訊編解碼器可資利用,各個音訊編解碼器係特別地設定來匹配專用應用用途。此等音訊編解碼器多半可並行地編碼多於一個音訊聲道或音訊信號。有些音訊編解碼器藉由將音訊內容的音訊聲道或音訊物件差異地分組且將此等組群接受差異音訊編碼原理而甚至適合用於差異編碼音訊內容。更有甚者,若干此等音訊編解碼器許可將擴延資料插入位元串流,因而因應音訊編解碼器的未來擴延/發展。
此種音訊編解碼器之一個實例為如ISO/IEC CD 23003-1定義的USAC編解碼器。本標準命名為「資訊技術-MPEG音訊技術-第三部分:統一語音與音訊編碼」以細節描述基於統一語音與音訊編碼協定之呼叫的參考模型之功能區塊。
第5a及5b圖例示說明編碼器及解碼器之方塊圖。於後文中,簡明地解說個別方塊的一般功能。此處將全部所得語法部分放在一起成為位元串流的問題係就第6圖做說明。
第5a及5b圖例示說明編碼器及解碼器之方塊圖。USAC編碼器及解碼器之方塊圖反映出MPEG-D USAC編碼結 構。一般結構可描述成例如如下:首先,有個共用前/後-處理,包含:MPEG環繞(MPEGS)功能單元來處置立體聲或多聲道處理,及加強式SBR(eSBR)單元其處置輸入信號中之較高音訊頻率之參數表示型態。然後,有二分支,一者包含改良之高階音訊編碼(AAC)工具路徑,及另一者包含以線性預測編碼(LP或LPC定義域)為基礎之路徑,其又轉而決定LPC殘差之頻域表示型態或時域表示型態。AAC及LPC二者之全部傳輸頻譜在量化與算術編碼後係表示於MDCT定義域。時域表示型態使用代數代碼激勵線性預測編碼器(ACELP)激勵編碼方案。
MPEG-D USAC之基本結構係顯示於第5a圖及第5b圖。本圖之資料流係從左至右,從上到下。解碼器功能係找出位元串流酬載中之量化音訊頻譜或時域表示型態之描述,及解碼量化值及其它重建資訊。
以傳輸頻譜資訊為例,解碼器應重建量化頻譜,透過作用態的任一種工具處理位元串流酬載中之重建頻譜來到達如藉輸入位元串流酬載描述的實際信號頻譜,及最後,將頻域頻譜變換成時域。在頻譜重建的初始重建與定標後,有選擇性的工具來改良頻譜中之一或多者而提供更有效編碼。
以傳輸時域信號表示型態為例,解碼器應重建量化時間信號,透過作用態的任一種工具處理位元串流酬載中之重建時間信號來到達如藉輸入位元串流酬載描述的實際時域信號。
針對在信號資料上操作的各個選擇性工具,保留「傳送通過」選項,於處理被刪除之全部情況下,在其輸入的頻譜及時間樣本係未經修改而直接傳送通過該工具。
於資料串流的信號表示型態從時域改成頻域表示型態、或從LP域改成非LP域、或反之亦然之情況下,解碼器應協助利用適當過渡重疊加法開窗來從一個定義域變換至另一個定義域。
過渡處置後,eSBR及MPEGS處理係以相同方式施加至兩條編碼路徑。
位元串流酬載解多工器工具之輸入為MPEG-D USAC位元串流酬載。解多工器將位元串流酬載分開成針對各個工具之部分,及對各工具提供以與該工具有關的位元串流酬載資訊。
位元串流酬載解多工器工具之輸出為:
●取決於目前訊框之核心編碼型別,或為:
○由下列表示之量化的且無雜訊地編碼頻譜
○標度因數資訊
○算術編碼頻譜線
●或為:線性預測(LP)參數連同由下列中之任一者表示之一激勵信號:○量化且經算術編碼之頻譜線(變換編碼激勵(TCX))或○ACELP編碼時域激勵
●頻譜雜訊填補資訊(選擇性)
●M/S決定資訊(選擇性)
●時間性雜訊塑形(TNS)資訊(選擇性)
●濾波器組控制資訊
●時間展開(TW)控制資訊(選擇性)
●加強式頻譜帶寬擴延(eSBR)控制資訊(選擇性)
●MPEG環繞(MPEGS)控制資訊。
標度因數無雜訊解碼工具從該位元串流酬載解多工器取得資訊,剖析該資訊,及決定霍夫曼及DPCM編碼標度因數。
標度因數無雜訊解碼工具之輸入為:
●該無雜訊編碼頻譜之標度因數資訊
標度因數無雜訊解碼工具之輸出為:
●該等標度因數之解碼整數表示型態。
頻譜無雜訊解碼工具從該位元串流酬載解多工器取得資訊,剖析該資訊,解碼該算術編碼資料,及重建量化頻譜。此種無雜訊解碼工具之輸入為:
●該無雜訊編碼頻譜
此種無雜訊解碼工具之輸出為:
●該頻譜之量化值。
反量化器工具取得該頻譜之量化值,及將整數值變換成未經定標之已重建頻譜。此種量化器為伸縮量化器,其伸縮因數係取決於所選核心編碼模式。
反量化器工具之輸入為:
●該頻譜之量化值
反量化器工具之輸出為:
●未經定標之反量化頻譜。
雜訊填補工具係用來填補解碼頻譜中之頻譜間隙,出現在頻譜值係經量化為零時,例如由於編碼器的位元需求之強力限制。雜訊填補工具的使用為選擇性。
雜訊填補工具之輸入為:
●未經定標的反量化頻譜
●雜訊填補參數
●已解碼標度因數之整數表示型態
雜訊填補工具之輸出為:
●針對先前已量化為零之頻譜線之未經定標的反量化頻譜值
●已修改標度因數之整數表示型態。
重新定標工具將標度因數之整數表示型態變換成實際值,及將未經定標的反量化頻譜乘以相關的標度因數。
標度因數工具之輸入為:
●已解碼標度因數之整數表示型態
●未經定標的反量化頻譜
標度因數工具之輸出為:
●經定標的反量化頻譜。
有關M/S工具之綜論,請參考ISO/IEC 14496-3:2009,4.1.1.2。
有關時間性雜訊塑形(TNS)工具之綜論,請參考ISO/IEC 14496-3:2009,4.1.1.2。
濾波器組/區塊交換工具施加在編碼器進行的頻率對 映之反對映。修正離散餘弦反變換(IMDCT)係用於該濾波器組工具。IMDCT可經組配來支援120、128、240、256、480、512、960或1024頻譜係數。
濾波器組工具之輸入為:
●(反量化)頻譜
●濾波器組控制資訊
濾波器組工具之輸出為:
●時域重建音訊信號。
當時間包繞模式被致能時,時間包繞式濾波器組/區塊交換工具置換普通濾波器組/區塊交換工具。濾波器組係與普通濾波器組相同(IMDCT),此外地,開窗時域樣本係藉時間改變重新取樣而從包繞時域對映至線性時域。
時間包繞式濾波器組工具之輸入為:
●反量化頻譜
●濾波器組控制資訊
●時間包繞式控制資訊
濾波器組工具之輸出為:
●線性時域重建音訊信號。
加強式SBR(eSBR)工具重新產生音訊信號之高帶。係植基於編碼期間截頭的諧波序列。調整所產生的高帶之頻譜波封及施加反濾波,及加上雜訊及S形成分檢重新產生原先信號之頻譜特性。
eSBR工具之輸入為:
●量化波封資料
●其它控制資料
●來自頻域核心解碼器或ACELP/TCX核心解碼器之時域信號
eSBR工具之輸出為:
●時域信號或
●使用信號之QMF域表示型態例如於MPEG環繞工具。
MPEG環繞(MPEGS)工具藉施加複雜的上混程序至由適當空間參數所控制的輸入信號而從一或多個輸入信號產生多個信號。於USAC脈絡中,MPEGS係藉傳輸參數側邊資訊連同所傳輸的下混信號而用以編碼多通道信號。
MPEGS工具之輸入為:
●下混時域信號或
●得自eSBR工具之QMF域表示型態
MPEGS工具之輸出為:
●多聲道時域信號。
信號分類器工具分析原先輸入信號及從其中產生控制資訊,觸發不同編碼模式的選擇。輸入信號的分析為體現相依性,且將試圖選擇一給定輸入信號框架之最佳核心編碼模式。信號分類器之輸出(選擇性地)也可用來影響其它工具的表現,例如MPEG環繞、加強式SBR、時間包繞式濾波器組及其它。
信號分類器工具之輸入為:
●原先未修正輸入信號
●額外體現相依性參數
信號分類器工具之輸出為:
●控制信號來控制核心編解碼器之選擇(非LP濾波頻域編碼、LP濾波頻域編碼、或LP濾波時域編碼)。
ACELP工具藉組合長期預測器(適應性碼字組)與脈衝樣序列(創新碼字組)而提供有效地表示時域激勵信號之方式。重建激勵係透過LP合成濾波器發送而形成一時域信號。
ACELP工具之輸入為:
●適應性及創新碼簿指數
●適應性及創新代碼增益值
●其它控制資料
●反量化與內插LPC濾波係數
ACELP工具之輸出為:
●時域重建音訊信號。
以MDCT為基礎之TCX解碼工具係用來將已加權LP殘差表示型態從MDCT域變換回時域信號,及輸出包含已加權LP合成濾波之一時域信號。IMDCT可經組配來支援256、512或1024頻譜係數。
TCX工具之輸入為:
●(反量化)MDCT頻譜
●反量化與內插LPC濾波係數
TCX工具之輸出為:
●時域重建音訊信號。
ISO/IEC CD 23003-3,以引用方式併入此處,揭示的技術許可定義聲道元件,例如只含單一聲道之酬載的單聲道 元件,或包括二聲道之酬載的聲道對元件,或包括LFE(低頻加強式)聲道之酬載的LFE聲道元件。
當然USAC編解碼器並非能夠在多於一或二個音訊聲道或音訊物件的較為複雜的音訊編解碼器上編碼與傳送資訊的唯一編解碼器。因此USAC編解碼器只是用作為一個具體實施例。
第6圖顯示編碼器及解碼器分別的較為通俗實例,二者係以一個共通場景闡釋,於該處編碼器將音訊內容10編碼成一位元串流12,解碼器從該位元串流12中解碼該音訊內容或至少其中一部分。解碼結果亦即重建係指示於14。如第6圖所示,音訊內容10可由多個音訊信號16組成。舉例言之,音訊內容10可以是由多個音訊信號16所組成的一空間音訊場景。另外,音訊內容10可表示音訊信號16的聚集,音訊信號16個別地及/或成組地表示個別音訊物件,可依解碼器的使用者裁量而放在一起於一個音訊場景,因而獲得音訊內容10之組態控制器14,例如呈特定揚聲器組態之空間音訊場景。編碼器係以連續時間週期為單位而編音訊內容10。此種時間週期係舉例顯示於第6圖的18。編碼器使用相同方式編碼音訊內容10之連續週期18:換言之,編碼器將每個時間週期18一個訊框20插入該位元串流12內。如此進行時,編碼器將個別時間週期18內部的音訊內容分解成訊框元件,其數目及意義/型別針對各個時間週期18及訊框20個別地為相同。至於前文摘述之USAC編解碼器,舉例言之,編碼器將在每個時間週期18內的同一對音訊信號16編 碼成訊框20之元件22中之一個聲道對元件,而運用另一個編碼原理,諸如對另一音訊信號16的單聲道編碼來獲得單聲道元件22等等。用以從如藉一或多個訊框元件22所定義的下混音訊信號中之音訊信號獲得上混的參數側邊資訊係經收集來在訊框20內部形成另一個訊框元件。於該種情況下,傳遞此項側邊資訊的訊框元件係有關於或形成一種用於其它訊框元件的擴延資料。當然此種擴延並不限於多聲道或多物件側邊資訊。
一項可能係指出在各個訊框元件22內部個別訊框元件屬於哪個型別。優異地,此種程序許可因應位元串流語法之未來擴延。無法處理某些訊框元件型別的解碼器唯有藉由探勘此等訊框元件內部的個別長度資訊來跳過個別訊框元件。又復,可能許可標準隨順於不同型別的解碼器:有些能瞭解第一型別集合,而其它瞭解且可處理另一型別集合;另外的元件型別將單純由個別解碼器忽視不理。此外,編碼器將以其裁量來分類訊框元件,使得能夠處理此等額外訊框元件之解碼器可以例如最小化解碼器內部的緩衝需求的一種順序來饋給訊框20內部的訊框元件。但不利地,位元串流將須傳遞每個訊框元件之訊框元件型別資訊,該項需要又轉而一方面對位元串流12之壓縮率造成負面影響,及另一方面負面影響解碼複雜度,原因在於各個訊框元件內部出現檢視個別訊框元件型別資訊的剖析額外負擔。
此外,為了許可跳過欲被跳過的訊框元件,位元串流12必須傳遞有關潛在地欲被跳過的訊框元件之前述長度資 訊。此項傳輸轉而減低壓縮效率。
當然可能以其它方式固定訊框元件22間之順序,諸如依照慣用順序,但此種程序妨礙編碼器具有重排訊框元件的自由度,原因在於例如未來擴延訊框元件的特定性質需要或提示例如在訊框元件間有不同的順序。
又復,若長度資訊的傳輸可以更有效地執行則更有利。
因此需要有位元串流、編碼器及解碼器分別的另一構想。
據此,本發明之目的係提出解決前文方才摘述之問題及允許獲得長度資訊傳輸之更有效方式的位元串流、編碼器及解碼器。
此項目的係藉正在審查中之申請專利範圍獨立項之主旨達成。
本發明係植基於發現將變成可用於跳過的訊框元件可藉下述方式而更有效地傳輸,藉由安排一內設酬載長度資訊係在一組態區塊內部分開地傳輸,在該等訊框元件內部的該長度資訊又轉而被細分成一內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著為明確地編碼該個別訊框元件之該酬載長度的一酬載長度值。若該內設酬載長度旗標係經設定,則可避免該酬載長度之明確傳輸。反而其內設擴延酬載長度旗標係經設定的任一個訊框元件係具有該內設酬載長度,及其內設擴延酬載長度旗標係未經設定的任一個訊框元件係具有相對應於酬載長度值的一酬載長度。藉此手段提高傳輸功效。
依據本案之一實施例,該位元串流語法係進一步設計來利用發現一方面位元串流及解碼額外負擔過高與另一方面訊框元件定位彈性間的較佳折衷可藉下述安排而獲得,該位元串流之該訊框序列各自係包含一序列N個訊框元件,及另一方面,該位元串流包含一組態區塊含有指示該元件數目N之一欄位,及一型別指示語法部分,該型別指示語法部分係針對該序列N個元件位置中之各個元件位置,指示多個元件型別中之一元件型別,於該等訊框之該等序列N個訊框元件中,針對該個別訊框元件係定位在該位元串流中之該個別訊框之該序列N個訊框元件內部之該個別元件位置,各個訊框元件係屬由該型別指示部分所指示的元件型別。如此,該等訊框係等效地結構化,在於各個訊框包含由該型別指示語法部分所指示的該訊框元件型別之該相同序列N個訊框元件係以相同的循序順序而定位在該位元串流內部。藉使用針對該序列N個元件位置中之各個元件位置,指示多個元件型別中之一元件型別的該型別指示語法部分,可針對該訊框序列共同地調整此項循序順序。
藉此措施,訊框元件型別可排列成任何順序,諸如依編碼器之裁量決定,因而選用例如最適合用於所使用的該等訊框元件型別之該順序。
該等多個訊框元件型別例如可包括一擴延元件型別,而只有該擴延元件型別之訊框元件係包含有關該個別訊框元件之長度的長度資訊,使得不支援該特定擴延元件型別的解碼器可使用該長度資訊作為跳過區間長度而跳過該擴 延元件型別之此等訊框元件。另一方面,可處置該擴延元件型別之此等訊框元件之解碼器據此而處理該內容或其酬載部分。其它元件型別之訊框元件包含此種長度資訊。依據剛才敘述之更特定實施例,若該編碼器係能將該擴延元件型別之此等訊框元件自由地定位在該等訊框之該序列訊框元件內部,則藉適當地選擇該訊框元件型別順序及在該型別指示語法部分內部傳訊該順序,可將在解碼器的緩衝額外負擔減至最低。
本發明之實施例的優異體現乃申請專利範圍附屬項之主旨。
又復,本案之較佳實施例係參考附圖描述如下,附圖中:第1圖顯示依據一實施例編碼器及其輸入及輸出之示意方塊圖;第2圖顯示依據一實施例解碼器及其輸入及輸出之示意方塊圖;第3圖示意地顯示依據一實施例的位元串流;第4a至z及za至zc圖顯示依據一實施例例示說明位元串流之一具體語法之假代碼表;及第5a及b圖顯示USAC編碼器及解碼器之方塊圖;及第6圖顯示典型成對編碼器及解碼器。
第1圖顯示依據一實施例之編碼器24。該編碼器24係用以將音訊內容10編碼成位元串流12。
如本案說明書之引言部分所述,音訊內容10可以是數 個音訊信號16之聚集。該等音訊信號16例如表示空間音訊場景的個別音訊聲道。另外,音訊信號16形成一起界定一音訊場景的一音訊物件集合中之音訊物件用以在解碼端自由地混合。如26之例示說明,音訊信號16係定義在共通時間基準t。換言之,音訊信號16可與相同時間區間有關,及據此可相對於彼此時間排齊。
編碼器24係經組配來將該音訊內容10之連續時間週期18編碼成一序列訊框20,使得各個訊框20表示音訊內容10之該等時間週期18中之個別一者。就某些意義而言,編碼器24係經組配來以相同方式編碼各個時間週期,使得各個訊框20包含一序列元件數目N個訊框元件。在各個訊框20內部,各個訊框元件22係屬多個元件型別中之個別一者係為真。更明確言之,該訊框20序列為N個訊框元件22序列之一組成,而各個訊框元件22係屬多個元件型別中之個別一者,使得各個訊框20分別地包含N個訊框元件22序列中之各者中之一個訊框元件22,及針對訊框元件22之各個序列,該等訊框元件22係屬彼此相同元件型別。於容後詳述之實施例中,在各個訊框20內部之該等N個訊框元件係排列在該位元串流12內部使得定位在某個元件位置的訊框元件22係屬相同或相等元件型別,且形成N個訊框元件序列中之一者,下文中偶爾稱作為子串流。換言之,在訊框20中的第一訊框元件22係屬相同元件型別且形成第一序列(或子串流)訊框元件;全部訊框20中的第二訊框元件22係屬彼此相等的元件型別且形成第二序列訊框元件等。但須強調下列 實施例之此一構面僅為選擇性,及隨後摘述之全部實施例就此方面而言可經修正:舉例言之,替代維持各個訊框20內部的N個子串流之該等訊框元件間之順序為恆定,移轉有關在該組態區塊內部之該等子串流的元件型別資訊,全部隨後解說的實施例皆可經修正,該等訊框元件之一個別元件型別係含在該訊框元件語法本身內部,使得在各個訊框20內部的該等子串流間之順序可在不同訊框間改變。當然,此種修正將犧牲放棄有關傳輸功效的優點,容後詳述。又復,該順序可以是固定,但偶爾藉習慣用法預先界定,使得不需要組態區塊內部的指示。
後文將以進一步細節摘述,藉該序列訊框20傳遞的子串流係傳遞資訊使得解碼器重建音訊內容。雖然有些子串流可能無可或缺,但其它子串流偶爾為選擇性,且可由有些解碼器跳過。舉例言之,有些子串流可表示相對於其它子串流的側邊資訊及例如可有可無。容後以進一步細節解釋。但為了允許解碼器跳過有些訊框元件,更精確言之,該等訊框元件序列中之該至少一者的該等訊框元件,亦即子串流,編碼器24係經組配來將組態區塊28寫入位元串流12,該組態區塊28包含有關內設酬載長度之內設酬載長度資訊。又,編碼器針對此至少一個子串流之各個訊框元件22將長度資訊寫入位元串流12,針對此至少一個子串流之該等訊框元件22的至少一個子集,包含一內設酬載長度旗標,若該內設酬載長度旗標為未經設定,則接著為一酬載長度值。該等訊框元件22序列中之該至少一者的任一個訊 框元件其內設擴延酬載長度旗標為經設定者,具有該內設酬載長度;該等訊框元件22序列中之該至少一者的任一個訊框元件其內設擴延酬載長度旗標64為未經設定者,具有相對應於該酬載長度值之一酬載長度。藉此手段,可避開針對一可跳過的子串流之各個訊框元件該酬載長度的明確傳輸。反而,取決於藉此等訊框元件傳遞的酬載型別,酬載長度之統計資料可以藉參考該內設酬載長度,而非一再重複地針對各個訊框元件明確地傳輸該酬載長度而使得傳輸功效大增。
如此已經相當概括地描述位元串流,後文中將就更為特定實施例以進一步細節說明。如前述,於此等實施例中,在連續訊框20內部在該等子串流間之恆定但可調整的順序只表示一項選擇性特徵,而於此等實施例中可加以改變。
依據一實施例,例如編碼器24係經組配來使得該等多個元件型別包含下列:
a)例如單聲道元件型別之訊框元件可藉編碼器24產生來表示一個單一音訊信號。因此,在訊框20內部在某個元件位置的該序列訊框元件22,例如第i個元件訊框,0>i>N+1,因而形成訊框元件之第i個子串流,將一起表示此種單一音訊信號的連續時間週期18。如此表示的音訊信號可直接相對應於音訊內容10之音訊信號16中之任一者。但另外及容後詳述,此種表示的音訊信號可以是下混信號中之一個聲道,其連同定位在訊框20內部的另一個元件位置之另一訊框元件型別之訊框元件的酬載資料,獲得該音 訊內容10之音訊信號16之一數目,該數目係高於剛才敘述的下混信號之聲道數目。於容後詳述之實施例之情況中,此種單聲道元件型別之訊框元件係標示為UsacSingleChannelElement。例如於MPEG環繞及SAOC之情況下,只有單一下混信號,可以是單聲、立體聲,或於MPEG環繞之情況下甚至為多聲道。後述情況下,例如5.1下混包含兩個聲道對元件及一個單聲道元件。於此種情況下,單聲道元件及兩個聲道對元件只是下混信號的一部分。於立體聲下混之情況下,將使用一個聲道對元件。
b)聲道對元件型別之訊框元件可藉編碼器24產生來表示立體聲成對音訊信號。換言之,定位在訊框20內部的共通元件位置的該型別訊框元件22將一起形成訊框元件之個別子串流,表示此種立體聲音訊對的連續時間週期18。如此表示的立體聲成對音訊信號可直接地為音訊內容10之任一對音訊信號16,或可表示例如下混信號,其連同定位在另一個元件位置的另一個元件型別之訊框元件的酬載資料,獲得高於2的該音訊內容10之音訊信號16之一數目。於容後詳述之實施例中,此種聲道對元件型別之訊框元件係標示為UsacChannelPairElement。
c)為了傳輸需要較少帶寬的該音訊內容10之音訊信號16上資訊諸如重低音聲道等,編碼器24可以此種型別的訊框元件支援特定型別的訊框元件,係定位在一共通元件位置例如表示單一音訊信號之連續時間週期18。此種音訊信號可以是直接地該音訊內容10之音訊信號16中之任一者, 或者可以是前文就單聲道元件型別及聲道對元件型別所述的下混信號之一部分。於容後詳述之實施例中,此種特定訊框元件型別的訊框元件係標示為UsacLfeElement。
d)擴延元件型別之訊框元件可藉編碼器24產生,因而連同位元串流傳輸側邊資訊,而允許解碼器上混由型別a、b及/或c中之任一者的訊框元件所表示的任一個音訊信號,獲得較高數目的音訊信號。定位在訊框20內部的某個共通元件位置之此種擴延元件型別之訊框元件將據此傳輸與該連續時間週期18有關的側邊資訊,許可踏混由其它訊框元件中之任一者所表示的一或多個音訊信號之個別時間週期,因而獲得具有更高音訊信號數目的個別時間週期,其中該等後述者可相對應於該音訊內容10之原先音訊信號16。此種側邊資訊之實例例如為參數側邊資訊,例如MPS或SAOC側邊資訊。
依據容後詳述之實施例,可用元件型別只係由前文摘述的四個元件型別組成,但其它元件型別也可利用。另一方面,元件型別a至c中只有一或二者為可利用。
如從前文討論顯然易知,從該位元串流12刪除該擴延元件型別之訊框元件22,或在解碼中忽略此等訊框元件不會完全地使得音訊內容10的重建變不可能:至少其它元件型別的剩餘訊框元件傳遞足夠資訊來獲得音訊信號。此等音訊信號並不必要相對應於該音訊內容10之原先音訊信號或其適當子集,但可表示音訊內容10的一種「結合體」。換言之,擴延元件型別之訊框元件可傳遞資訊(酬載資料),該 資訊係表示相對於定位在訊框20內部的不同元件位置之一或多個訊框元件的側邊資訊。
但於後述實施例中,擴延元件型別之訊框元件並不限於此種側邊資訊傳遞。反而於下文中,擴延元件型別之訊框元件係標示為UsacExtElement,且係定義來彷輸酬載資料連同長度資訊,其中該後述長度資訊許可解碼器接收位元串流12,因而例如於解碼器無法處理此等訊框元件內部的個別酬載資料之情況下,跳過擴延元件型別之此等訊框元件。此點容後詳述。
但在進行第1圖之編碼器的描述之前,須注意有數項前述元件型別的替代方案可能。此點對前述擴延元件型別尤為如此。更明確言之,以擴延元件型別係經組配來使得其酬載資料可被例如無法處理個別酬載資料的解碼器跳過為例,擴延元件型別訊框元件的酬載資料可以是任一型酬載資料。就其它訊框元件型別的其它訊框元件而言,此種酬載資料可形成側邊資訊,或例如可形成表示另一個音訊信號之自容式酬載資料。此外,即便於該擴延元件型別訊框元件的酬載資料表示其它訊框元件型別的訊框元件之酬載資料的側邊資訊之情況下,此等擴延元件型別訊框元件的酬載資料不限於剛才描述的種類,亦即多聲道側邊資訊或多物件編碼側邊資訊。多聲道側邊資訊酬載例如伴隨其它元件型別的任一個訊框元件所表示的下混信號以空間提示,諸如雙耳提示編碼(BCC)參數,諸如聲道間同調值(ICC)、聲道間位準差(ICLD)、及/或聲道間時間差(ICTD), 及選擇性地聲道預測係數,該等參數從例如MPEG環繞標準為技藝界所已知。剛才所述空間提示參數例如可以時/頻解析度而在擴延元件型別訊框元件的酬載資料內部傳輸,亦即每個時/頻格網的時/頻拼貼片有一個參數。於多物件編碼側邊資訊之情況下,擴延元件型別訊框元件的酬載資料可包含相似的資訊,諸如物件間交互相關性(IOC)參數、物件位準差(OLD),以及下混參數揭示原先音訊信號已經如何下混至由另一個元件型別之任一個訊框元件所表示的下混信號聲道。後述參數例如從SAOC標準為技藝界所已知。但擴延元件型別訊框元件的酬載資料可表示的一個不同側邊資訊實例為例如SBR資料,用以參數地編碼由定位在訊框20內部不同元件位置的其它元件型別的任一個訊框元件所表示的音訊信號之高頻部分之一波封,及許可藉使用如從後述音訊信號所得低頻部分的例如頻帶複製作為高頻部分之基礎,然後形成藉SBR資料之波封如此所得高頻部分之波封。更加概略言之,擴延元件型別訊框元件的酬載資料可傳遞側邊資訊用以修正由定位在訊框20內部不同元件位置的其它元件型別的任一個訊框元件所表示的音訊信號,或於時域,或於頻域,其中該頻域例如可以是QMF域或若干其它濾波器組域或變換域。
進一步對第1圖之編碼器24的功能作描述,編碼器24係經組配來將一組態區塊28編碼成位元串流12,該組態區塊28包含一欄位指示一元件數目N,及一型別指示語法部分係針對一序列N個元件位置中之各個元件位置,指示該個別元 件型別。據此,編碼器24係經組配來針對各個訊框20,將該序列N個訊框元件22編碼成該位元串流12,使得定位在該位元串流12中之該序列N個訊框元件22內部之一個別元件位置的該序列N個訊框元件之各個訊框元件,具有針對該個別元件位置由該型別指示部分所指示的該元件型別。換言之,編碼器24形成N個子串流,其各自為個別元件型別之一序列訊框元件22。換言之,針對全部此等N個子串流,訊框元件22係屬相等元件型別,而不同子串流的訊框元件可屬不同元件型別。編碼器24係經組配來藉由級聯(concatenate)有關一個共通時間週期18的此等子串流之全部N個訊框元件來形成一個訊框20而將全部此等訊框元件多工化成為位元串流12。據此,於位元串流12中,此等訊框元件22係排列成訊框20。在各個訊框20內部,N個子串流之表示型態,亦即有關相同時間週期18的N個訊框元件係排列成靜態循序順序,該順序係由元件位置的順序及在組態區塊28的型別指示語法部分分別地界定。
藉由使用型別指示語法部分,編碼器24可自由地選擇順序,N個子串流之訊框元件22係使用該順序排列在訊框20內部。藉此措施,編碼器24可將在解碼端的緩衝額外負擔維持儘可能地低。舉例言之,傳遞另一個子串流(基本子串流)的訊框元件之側邊資訊的該擴延元件型別之訊框元件之一子串流,係屬非擴延元件型別,可定位在訊框20內部之一元件位置,緊接在此等基本子串流訊框元件定位在訊框20的該元件位置後方。藉此手段,解碼端必須緩衝基本 子串流的解碼用以將側邊資訊施加於其上的結果或中間結果的緩衝時間維持為低,及可減少緩衝額外負擔。於一子串流之訊框元件的酬載資料之側邊資訊係屬擴延元件型別由訊框元件22之另一子串流(基本子串流)所表示的音訊信號之中間結果諸如頻域之情況下,訊框元件22之擴延元件型別之子串流定位使得該子串流緊接在該基本子串流後方,確實不僅最小化緩衝額外負擔,同時也最小化解碼器必須中斷所表示的音訊信號之進一步處理的時間長度,原因在於例如擴延元件型別訊框元件的酬載資料係將相對於基本子串流的表示型態修正音訊信號之重建。但也可能有利地將相依性擴延子串流定位在該擴延子串流所指稱的表示一音訊信號之其基本子串流前方。舉例言之,編碼器24可自由地將擴延酬載子串流定位在位元串流內部相對於聲道元件型別子串流的上游。舉例言之,子串流i之擴延酬載可傳遞動態範圍控制(DRC)資料,且係諸如透過頻域(FD)編碼而相對於例如在聲道子串流內部在元件位置i+1的相對應音訊信號之編碼而在之前或在更早的元件位置i傳輸。然後,當解碼與重建由非擴延型別子串流i+1所表示的音訊信號時,解碼器能夠即刻地使用該DRC。
至目前為止所描述的編碼器24表示本案之可能實施例。但第1圖也顯示編碼器的可能內部結構,須瞭解僅供例示說明。如第1圖所示,編碼器24可包含分配器30及排序器32,介於其間有多個編碼模組34a-e以容後詳述方式連結。更明確言之,分配器30係經組配來接收音訊內容10之音訊 信號16,且將之分配至個別的編碼模組34a-e上。分配器30將音訊信號16的連續時間週期18分配至編碼模組34a至34e之方式為靜態。更特別地,分配可以是各個音訊信號16係排它地前傳至編碼模組34a至34e中之一者。例如,饋至LFE編碼器34a的音訊信號係藉LFE編碼器34a編碼成型別c(參見上文)的訊框元件22之一子串流。例如,饋至單聲道編碼器34b之輸入端的音訊信號係藉後者編碼成型別a(參見上文)的訊框元件22之一子串流。同理例如,饋至聲道對編碼器34c之輸入端的一對音訊信號係藉後者編碼成型別d(參見上文)的訊框元件22之一子串流。剛才提及的編碼模組34a至34c係以其輸入及輸出而連結在一方面分配器30與另一方面排序器32間。
但如第1圖所示,編碼模組34a至34e之輸入不只是連結至分配器30的輸出介面。反而也可藉編碼模組34d及34e中之任一者的輸出信號饋給。後述編碼模組34d及34e乃下述編碼模組之實例,該等編碼模組係經組配來將多個輸入音訊信號編碼成一方面較少數目下混聲道之一下混信號,及另一方面編碼成型別d(參見上文)的訊框元件22之一子串流。從前文討論顯然易知,編碼模組34d可以是SAOC編碼器,而編碼模組34e可以是MPS編碼器。下混信號係前傳至編碼模組34b及34c中之任一者。由編碼模組34a至34e所產生的子串流係前傳給排序器32,排序器32係將該等子串流排序成剛才所述的位元串流12。據此,編碼模組34d及34e具有其音訊信號數目之輸入係連結至分配器30的輸出介 面,而其子串流輸出係連結至排序器32的輸入介面,及其下混輸出係連結至編碼模組34b及/或34c個別的輸入。
須注意依據前文說明,多物件編碼器34d及多聲道編碼器34e的存在僅係選用於例示說明目的,及例如此等編碼模組34e及34e中之任一者可被移除或由另一編碼模組置換。
已經描述編碼器24及其可能的內部結構後,就第2圖說明相對應解碼器。第2圖之解碼器通常係以元件位置36指示,且具有一輸入來接收位元串流12,及具有一輸出來輸出音訊內容10之重建版本38或其結合體。據此,解碼器36係經組配來解碼位元串流12,位元串流12包含第1圖所示組態區塊28及訊框20序列,及針對個別訊框元件22係定位在位元串流12中的個別訊框20之該N個訊框元件22序列內部之該個別元件位置,依據由型別指示部分所指示的元件型別而解碼訊框元件22。換言之,解碼器36係經組配來取決於其在目前訊框20內部的元件位置,而非在訊框元件本身內部的任何資訊,分派各個訊框元件22給可能的元件型別中之一者。藉此手段,解碼器36獲得N個子串流,第一子串流係由訊框20中之第一訊框元件22組成,第二子串流係由訊框20中之第二訊框元件22組成,第三子串流係由訊框20中之第三訊框元件22組成等等。
在以進一步細節就擴延元件型別之訊框元件描述解碼器36的功能前,以進一步細節解釋第2圖之解碼器36的可能內部結構來相對應於第1圖之編碼器24的內部結構。如就編碼器24之描述,須瞭解內部結構係僅供例示說明目的。
更明確言之,如第2圖所示,解碼器36內部可包含一分配器40及一排列器42,介於其間連結解碼模組44a至44e。各個解碼模組44a至44e負責解碼某個訊框元件型別之一訊框元件22子串流。據此,分配器40係經組配來將位元串流12的N個子串流相對應地分配至解碼模組44a至44e上。解碼模組44a例如為LFE解碼器,其解碼型別c(參見上文)之一訊框元件22子串流來在其輸出獲得窄帶(舉例)音訊信號。同理,單聲道解碼器44b解碼型別a(參見上文)之一輸入訊框元件22子串流來在其輸出獲得單一音訊信號,及聲道對解碼器44c解碼型別b(參見上文)之一輸入訊框元件22子串流來在其輸出獲得一對音訊信號,解碼模組44a至44c係以其輸入及輸出而連結在一方面分配器40的輸出介面與另一方面排列器42的輸入介面間。
解碼器36可能只有解碼模組44a至44c。其它解碼模組44e及44d係負責擴延元件型別之訊框元件,及因而考慮音訊編解碼器之構型為選擇性。若此等擴延模組44e及44d中之二者或任一者為不存在,則分配器40係經組配來跳過位元串流12中的個別擴延元件型別子串流,容後詳述,及音訊內容10之重建版本38只是具有音訊信號16之原先版本的結合體。
但若存在時,亦即若解碼器36支援SAOC及/或MPS擴延訊框元件時,多聲道解碼器44e可經組配來解碼由編碼器34e所產生的子串流,而多物件解碼器44d係負責解碼由多物件編碼器34d所產生的子串流。據此,若存在有解碼模組 44e及/或44d,則開關46可連結解碼模組44c及44b中之任一者的輸出與解碼模組44e及/或44d之下混信號輸入。多聲道解碼器44e可經組配來使用得自分配器40的輸入子串流內部之側邊資訊,來上混輸入下混信號而在其輸出獲得增加數目的音訊信號。多物件解碼器44d可以多物件解碼器44d處理個別音訊信號為音訊物件,而多聲道解碼器44e處理在其輸出的該等音訊信號為音訊聲道的該差值據此而動作。
如此經重建的音訊信號係前傳至排列器42,排列器42排列該等音訊信號而形成重建38。排列器42額外地可藉使用者輸入48控制,該使用者輸入例如指示可用揚聲器組態或許可重建38之最高聲道數目。取決於使用者輸入48,排列器42可去能解碼模組44a至44e中之任一者例如解碼模組44d及44e中之任一者,即使存在及即便擴延元件型別係存在於位元串流12中。
概略言之,解碼器36可經組配來基於該等訊框元件序列之一子集亦即子串流而剖析該位元串流12及重建音訊內容,及就不屬於該等訊框元件序列之該子集的該等訊框元件22序列中之至少一者而言,讀取該等訊框元件22序列中之該至少一者的組態區塊28,包括酬載長度上的內設酬載長度資訊;及針對該等訊框元件22序列中之該至少一者的各個訊框元件22,從該位元串流12中讀取一長度資訊,該長度資訊的讀取包含針對該等訊框元件22序列中之該至少一者的訊框元件22之至少一個子集,讀取一內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著讀取酬 載長度值。在剖析位元串流12中,然後,使用該內設酬載長度作為跳過區間長度,解碼器36可跳過該等訊框元件序列中之該至少一者的任一個訊框元件,該元件的內設擴延酬載長度旗標係經設定者;及使用相對應於酬載長度值的酬載長度作為跳過區間長度,解碼器36可跳過該等訊框元件序列中之該至少一者的任一個訊框元件,其內設擴延酬載長度旗標係未經設定者。
於容後詳述之實施例中,此一機制係只限於擴延元件型別子串流,但當然此一機制或語法部分可應用於多於一個元件型別。
在分別地描述解碼器、編碼器及位元串流之進一步可能細節前,須注意由於編碼器有能力將係屬擴延元件型別之子串流的訊框元件穿插在不屬擴延元件型別之子串流的訊框元件間,故藉由編碼器24分別地妥適地選擇子串流間之順序及在各個訊框20內部的子串流之訊框元件間之順序,可降低解碼器36之緩衝額外負擔。例如假設進入聲道對解碼器44c的子串流將置於訊框20內部第一元件位置,而多聲道解碼器44e將置於各個訊框的結束。於該種情況下,解碼器36將必須緩衝表示多聲道解碼器44e的下混信號之該中間音訊信號歷經橋接在各個訊框20的第一訊框元件及最末訊框元件分別到達時間間之一時間週期。唯有此時,多聲道解碼器44e才能開始其處理。此種耽擱可藉編碼器24將專用於多聲道解碼器44e的該子串流排列在訊框20之第二元件位置(舉例)而予避免。另一方面,分配器40無需就其 與子串流中之任一者的成員關係檢視各個訊框元件。反而,分配器40能夠只從組態區塊及其中所含型別指示語法部分而推定一目前訊框20之一目前訊框元件22對N個子串流中之任一者的成員關係。
現在參考第3圖顯示一位元串流12,如前文已述,位元串流12包含一組態區塊28及一序列訊框20。觀察第3圖,右方的位元串流部分係在左方的其它位元串流部分位置之後。例如以第3圖為例,組態區塊28係在第3圖所示訊框20前方,其中僅供例示說明之用,第3圖只完整顯示三個訊框20。
又須注意組態區塊28可以週期性或間歇性基準,插入位元串流12內在訊框20間來允許串流化傳輸應用的隨機存取點。概略言之,組態區塊28可以是位元串流12的單純連結部分。
如前述組態區塊28可包含一欄位50指示元件數目N,亦即如前述在各個訊框20內部的訊框元件數目N及多工化至位元串流12的子串流數目。敘述位元串流12之具體語法之一實施例的如下實施例中,於如下第4a-z圖及za-zc之特定語法實例中,欄位50係標示為numElements,及組態區塊28係稱作UsacConfig。又復,組態區塊28包含型別指示語法部分52。如前文已述,此一部分52針對各個元件位置指示多個元件型別中之一個元件型別。如第3圖所示,且如同有關下述特定語法實例之情況下,型別指示語法部分52可包含一序列N個語法元件54,針對個別語法元件54定位在型別指示語法部分52內部的個別元件位置,各個語法元件54指 示元件型別。換言之,部分52內部的第i個語法元件54可分別地指示第i個子串流之元件型別及各個訊框20之第i個訊框元件。於隨後具體語法實例中,語法元件係標示為UsacElementType。但型別指示語法部分52可含在位元串流12內部作為位元串流12之單純連結或連續部分,第3圖中例示顯示其元件54係與針對N個元件位置各自個別地存在的組態區塊28之其它語法元件部分交織。於後文摘述之實施例中,此一交織語法部分係有關特定子串流組態資料55,其意義容後詳述。
如前文已述,各個訊框20係由一序列N個訊框元件22組成。此等訊框元件22之元件型別係不藉訊框元件22本身內部的個別型別指標傳訊。反而,訊框元件22之元件型別係藉其在各個訊框20內部的元件位置定義。第3圖中標示為訊框元件22a的首先出現在訊框20的訊框元件22具有第一元件位置,因而係屬由組態區塊28內部的語法部分52針對第一元件位置指示的元件型別。同理適用於隨後之訊框元件22。舉例言之,緊接出現在位元串流12內部第一訊框元件22a後方的亦即具有元件位置2的訊框元件22b係具有型別指示語法部分52指示的元件型別。
依據特定實施例,語法元件54係以所參照的訊框元件22之相同順序排列在位元串流12內部。換言之,第一語法元件54亦即出現在位元串流12第一者且係定位在第3圖最左端者指示各個訊框20之第一出現訊框元件22a的元件型別,第二語法元件54指示第二訊框元件22b的元件型別等 等。當然,語法元件54在位元串流12內部及語法部分52的循序順序或排列可相對於在訊框20內部之訊框元件22的循序順序交換。其它排列移位也可行但較不佳。
針對解碼器36,如此表示解碼器36可經組配來從型別指示語法部分52讀取此一序列N個語法元件54。更精確言之,解碼器36讀取欄位50,故解碼器36知曉有關欲從位元串流12讀取的語法元件54數目N。恰如前述,解碼器36可經組配來聯結語法元件及藉此指示的元件型別與在訊框20內部之訊框元件22,使得第i個語法元件54係與第i個訊框元件22相聯結。
除了前文說明外,組態區塊28可包含一序列55N個組態元件56,各個組態元件56包含針對個別組態元件56係定位在N個組態元件56之該序列55中之個別元件位置的該元件型別的組態資訊。更明確言之,組態元件56之序列寫入位元串流12(及藉解碼器36讀取自位元串流12)之順序可以是分別地用於訊框元件22及/或語法元件54之相同順序。換言之,第一個出現在位元串流12的組態元件56可包含第一訊框元件22a之組態資訊,第二組態元件56包含訊框元件22b之組態資訊等等。如前文已述,型別指示語法部分52及特定元件位置組態資料55在第3圖之實施例中係顯示為彼此交插,有關元件位置i的組態元件56係定位在位元串流12在元件位置i與元件位置i+1的型別指標54間。甚至換言之,組態元件56及語法元件54係交錯地排列在位元串流中,及藉解碼器36從其中交錯地讀取,但此一資料在區塊28內部 的位元串流12中的其它定位亦屬可行,如前文所述。
藉傳遞組態區塊28中各個元件位置1...N分別的組態元件56,位元串流許可屬於不同子串流及元件位置分別的不同組配訊框元件,但係屬相同元件型別。舉例言之,位元串流12可包含兩個單聲道子串流,及據此包含在各個訊框20內部單聲道元件型別之二訊框元件。但二子串流的組態資訊可在位元串流12差異地調整。如此又轉而表示第1圖之編碼器24許可針對此等不同子串流差異地設定在組態資訊內部之編碼參數,及解碼器36之單聲道解碼器44b當解碼此二子串流時係使用此等差異編碼參數控制。此點對其它解碼模組亦為真。更加概略言之,解碼器36係經組配來從組態區塊28讀取該序列N個組態元件56,及依據第i個語法元件54指示的元件型別,及使用由第i個組態元件56所包含組態資訊而解碼第i個訊框元件22。
為了舉例說明目的,於第3圖假設第二子串流,亦即出現在各個訊框20內部的第二元件位置的訊框元件22b所組成的子串流,具有由擴延元件型別之訊框元件22b所組成的擴延元件型別子串流。當然此僅供例示說明目的。
又復,僅供例示說明目的,該位元串流或組態區塊28包含每個元件位置一個組態元件56,而與藉語法部分52針對該元件位置所指示的元件型別獨立無關。例如依據另一個實施例,可以有一或多個元件型別,對其並無組態元件係由組態區塊28所包含,因此於後述情況下,取決於分別出現在語法部分52及訊框20的此等元件型別的訊框元件數 目,在組態區塊28內部的組態元件56數目可小於N。
總而言之,第3圖顯示用以建立有關擴延元件型別之組態元件56的又一實例。於後文解說的特定語法實施例中,此等組態元件56係標示為UsacExtElementConfig。只是為求完整,注意於後文解說的特定語法實施例中,其它元件型別的組態元件係標示為UsacSingleChannelElementConfig、UsacChannelPairElementConfig及UsacLfeElementConfig。
但在敘述擴延元件型別之組態元件56的可能結構前,參考第3圖顯示擴延元件型別之訊框元件的可能結構部分,此處以第二訊框元件22b例示說明。如圖所示,擴延元件型別之訊框元件可包含有關個別訊框元件22b之長度的長度資訊58。解碼器36係經組配來從每個訊框20之擴延元件型別之各個訊框元件22b,讀取此一長度資訊58。若解碼器36無法或由使用者輸入指令不處理擴延元件型別之此一訊框元件所屬的子串流,則解碼器36使用長度資訊58作為跳過區間長度,亦即欲跳過的該位元串流部分之長度,而跳過此一訊框元件22b。換言之,解碼器36可使用長度資訊58來計算直到存取或訪視目前訊框20內部的下個訊框元件或下個接續訊框20起始,欲跳過的位元組數目或任何其它用以界定位元串流區間長度之適當度量,因而更進一步執行讀取位元串流12。
容後詳述,擴延元件型別之訊框元件可經組配來因應音訊編解碼器的未來或替代擴延或發展,及據此,擴延元件型別之訊框元件可具有不同統計長度分布。為了下述可 能,依據若干應用某個子串流之擴延元件型別之訊框元件係具有恆定長度,或具有極窄的統計長度分布,依據本案之若干實施例,擴延元件型別之組態元件56可包含內設酬載長度資訊60,如第3圖所示。於該種情況下,個別子串流之該擴延元件型別之訊框元件22b參考含在個別子串流的個別組態元件56內部的此一內設酬載長度資訊60,替代明確地傳輸酬載長度。更明確言之,如第3圖所示,於該種情況下,長度資訊58可包含呈內設擴延酬載長度旗標64形式的一條件語法部分62,若該內設酬載長度旗標64係未經設定,則接著為一擴延酬載長度值66。於擴延元件型別之訊框元件22b的長度資訊62之內設擴延酬載長度旗標64係經設定之情況下,該擴延元件型別之任何訊框元件22b具有內設擴延酬載長度;於擴延元件型別之訊框元件22b的長度資訊62之內設擴延酬載長度旗標64係未經設定之情況下,具有擴延酬載長度係相對應於於擴延元件型別之訊框元件22b的長度資訊58之擴延酬載長度值66。換言之,每當可能只參考如在組態元件56內部具有相對應子串流及元件位置的內設酬載長度資訊60所指示的內設擴延酬載長度時,擴延酬載長度值66之明確編碼可藉編碼器24而予避免。解碼器36之動作如下述。在組態元件56之讀取期間,解碼器36讀取內設酬載長度資訊60。當讀取相對應子串流之訊框元件22b時,解碼器36在讀取此等訊框元件之長度資訊中,讀取內設擴延酬載長度旗標64及檢查旗標64是設定與否。若內設酬載長度旗標64係未經設定,則解碼器進行從位元串 流讀取條件語法部分62之擴延酬載長度值66,因而獲得個別訊框元件之擴延酬載長度。但若內設酬載旗標64係經設定,則解碼器36設定個別訊框的擴延酬載長度等於從資訊60推衍出的內設擴延酬載長度資訊。然後解碼器36之跳過涉及使用剛才決定的擴延酬載長度為跳過區間長度,亦即欲跳過的位元串流12之一部分長度,跳過目前訊框元件之酬載區段68,因而存取目前訊框20之下個訊框元件22或下個訊框20的起始。
據此,如先前所述,每當此等訊框元件之酬載長度的變化相當低時,運用旗標機制64可避免某個子串流之擴延元件型別之訊框元件的酬載長度之逐一訊框重複傳輸。
但因並非先驗明瞭藉某個子串流之擴延元件型別之訊框元件所傳遞的酬載是否具有有關訊框元件之酬載長度的此種統計資料,及據此是否值得在此種子串流之擴延元件型別之訊框元件的組態元件中明確地傳輸內設酬載長度,依據額外實施例,內設酬載長度資訊60也係藉條件語法部分體現,該條件語法部分包含一旗標60a在如下特定語法實例中稱呼UsacExtElementDefaultLengthPresent,及指示內設酬載長度是否進行明確傳輸。只有若設定時,條件語法部分包含內設酬載長度之明確傳輸60b,在如下特定語法實例中稱呼UsacExtElementDefaultLength。否則內設酬載長度係藉內設設定為0。於後述情況下,由於避免內設酬載長度之明確傳輸,故位元串流的位元耗用節省。換言之,解碼器36(及分配器40,分配器40負責前文及後文所述全部讀取程 序)可經組配來在讀取內設酬載長度資訊60中,從位元串流12讀取內設酬載長度存在旗標60a,檢查內設酬載長度存在旗標60a是否經設定,及若內設酬載長度存在旗標60a係經設定,則設定內設擴延酬載長度為零;而若內設酬載長度存在旗標60a係未經設定,則從位元串流12明確地讀取內設擴延酬載長度60b(亦即在旗標60a之後的欄位60b)。
除了內設酬載長度機制之外或另外,長度資訊58可包含擴延酬載存在旗標70,其中長度資訊58之擴延酬載存在旗標70係未經設定,該擴延元件型別之任何訊框元件22b只由擴延酬載存在旗標組成。換言之,不含酬載區段68。另一方面,其長度資訊58之擴延酬載存在旗標70係經設定,該擴延元件型別之任何訊框元件22b之長度資訊58進一步包含語法部分62或66指示個別訊框22b之擴延酬載長度,亦即其酬載區段68之長度。除了內設酬載長度機制之外,亦即組合內設擴延酬載長度旗標64,擴延酬載存在旗標70允許對擴延元件型別之各個訊框元件提供以兩個可有效地編碼的酬載長度,亦即一方面為0,及另一方面為內設酬載長度,亦即最可能的酬載長度。
於剖析或讀取擴延元件型別之目前訊框元件22b的長度資訊58中,解碼器36從位元串流12讀取擴延酬載存在旗標70,檢查擴延酬載存在旗標70是否經設定,及若擴延酬載存在旗標70係未經設定,則停止讀取個別訊框元件22b,且進行目前訊框20的另一個、下一個訊框元件22之讀取,或開始讀取或剖析下個訊框20。而若擴延酬載存在旗標70 係經設定,則解碼器36讀取語法部分62或至少部分66(若旗標64為不存在,因為此一機制無法利用)及若目前訊框元件22的酬載欲被跳過,則藉使用擴延元件型別之個別訊框元件22b的擴延酬載長度作為跳過區間長度而跳過酬載區段68。
如前述,可設有擴延元件型別之訊框元件來因應音訊編解碼器之未來擴延,或目前解碼器不適合使用的其它擴延,因此,擴延元件型別之訊框元件須為可組配。更明確言之,依據一實施例,針對型別指示部分52指示擴延元件型別之各個元件位置,組態區塊28包含一組態元件56,該組態元件56包含擴延元件型別之組態資訊,其中除了前文摘述之組件外或另外,該組態資訊包含一擴延元件型別欄位72指示多個酬載資料型別中之一個酬載資料型別。依據一個實施例,多個酬載資料型別可包含一多聲道側邊資訊型別及一多物件編碼側邊資訊,此外有其它資料型別例如保留供未來發展之用。依據指示的酬載資料型別,組態元件56額外地包含特定酬載資料型別組態資料。因此在相對應元件位置及個別子串流的訊框元件22b於其酬載區段68中傳遞相對應於所指示的酬載資料型別之酬載資料。為了許可特定酬載資料型別組態資料74之長度調整適應於酬載資料型別,及許可保留用於其它酬載資料型別之未來發展,後述特定語法實施例具有擴延元件型別之組態元件56額外地包含一組態元件長度值,稱作UsacExtElementConfigLength,使得不知曉對目前子串流指示的酬載資料型別之解碼器36可跳過該組態元件56及其特 定酬載資料型別組態資料74來存取緊接其後的位元串流12部分,諸如下個元件位置的元件型別語法元件54(或於圖中未顯示的其它實施例中,下個元件位置的組態元件,或接在組態區塊28或若干其它資料後方的第一訊框之起始,如將就第4a圖顯示。更明確言之,於如下語法之特定實施例中,多聲道側邊資訊組態資料係含在SpatialSpecificConfig,而多物件側邊資訊組態資料係含在SaocSpecificConfig。
依據後述構面,解碼器36將被組配來在讀取組態區塊28中,針對其型別指示部分52指示擴延元件型別的各個元件位置或子串流,執行下列步驟:讀取組態元件56,包括讀取擴延元件型別欄位72指示多個可用酬載資料型別中之該酬載資料型別。
若擴延元件型別欄位72指示多聲道側邊資訊型別,則從位元串流12讀取多聲道側邊資訊組態資料74作為組態資訊之一部分;而若擴延元件型別欄位72指示多物件側邊資訊,則從位元串流12讀取多物件側邊資訊組態資料74作為組態資訊之一部分。
然後,在解碼相對應訊框元件22b中,亦即具有相對應元件位置及子串流者,若酬載資料型別指示多聲道側邊資訊型別,則解碼器36將使用多聲道側邊資訊組態資料74組配多聲道解碼器44e,同時對如此組配的多聲道解碼器44e饋給個別訊框元件22b的酬載資料68作為多聲道側邊資訊;及若酬載資料型別指示多物件側邊資訊型別,則解碼 器36藉使用多物件側邊資訊組態資料74組配多物件解碼器44d,同時對如此組配的多物件解碼器44d饋給個別訊框元件22b的酬載資料68。
但若未知酬載資料型別係藉欄位72指示,則解碼器36將運用也由目前組態元件所包含的前述組態長度值而跳過特定酬載資料型別組態資料74。
舉例言之,解碼器36可經組配來,針對型別指示部分52指示擴延元件型別的任一個元件位置,從該位元串流12中讀取組態資料長度欄位76作為針對個別元件位置的組態元件56之組態資訊的一部分,因而獲得組態資料長度,及檢查針對個別元件位置的組態元件之組態資訊的擴延元件型別欄位72所指示的酬載資料型別是否屬於多個酬載資料型別中之一子集的酬載資料型別之一預定集合。若藉針對個別元件位置之該組態元件之組態資訊的擴延元件型別欄位72指示的酬載資料型別屬於酬載資料型別之預定集合,則解碼器36將從該位元串流12中讀取酬載資料相依性組態資料74作為針對個別元件位置之該組態元件之組態資訊的一部分,及使用酬載資料相依性組態資料74解碼在訊框20中在個別元件位置的擴延元件型別之訊框元件。若藉針對個別元件位置之該組態元件之組態資訊的擴延元件型別欄位72指示的酬載資料型別並不屬於酬載資料型別之預定集合,則解碼器將使用組態資料長度跳過酬載資料相依性組態資料74,及使用其中的長度資訊58跳過在訊框20中之個別元件位置的擴延元件型別之訊框元件。
前述機制除外或另外,某個子串流之訊框元件可經組配來以片段傳輸而非一次完全整個訊框。舉例言之,擴延元件型別之組態元件可包含分段使用旗標78,解碼器可經組配來,在讀取定位在下述任何元件位置的訊框元件22中,該元件位置的型別指示部分指示擴延元件型別,及該元件位置的組態元件之分段使用旗標78係經設定,從該位元串流12中讀取片段資訊80,及使用該片段資訊來將連續訊框的此等訊框元件之酬載資料放置在一起。於如下特定語法實例中,分段使用旗標78係經設定的一子串流之各個擴延型別訊框元件係經設定,包含一對旗標,指示該子串流之酬載起始之一起始旗標,及指示該子串流之酬載結束之一終止旗標。於如下特定語法實例中此等旗標係稱作為UsacExtElementStart及UsacExtElementStop。
又復,除了前述機制外或另外,相同可變長度代碼可用來讀取長度資訊80、擴延元件型別欄位72、及組態資料長度欄位76藉此降低複雜度例如來體現解碼器,及節省位元,只有在罕見出現的情況下才需要額外位元,諸如未來擴延元件型別、更大的擴延元件型別長度等等。於隨後解釋的特例中,此種可變長度代碼(VLC)係從第4m圖推衍出。
綜上所述,下列可應用於解碼器功能:
(1)讀取組態區塊28,及
(2)讀取/剖析訊框20之該序列。步驟1及2係藉解碼器36及更精確地係藉分配器40執行。
(3)音訊內容的重建係限於該等子串流,亦即限於在元 件位置的該等訊框元件之序列,其解碼係藉解碼器36支援。步驟3係在解碼器36內部例如其解碼模組執行(參考第2圖)。
據此,於步驟1中,解碼器36讀取子串流數目50,及每個訊框20的訊框元件22數目,以及型別指示語法部分52揭示此等子及元件位置各自的元件型別。於步驟2中為了剖析位元串流,解碼器36然後循環地從該位元串流12中讀取該序列訊框20的訊框元件22。如此進行時,如前文已述藉使用長度資訊58,解碼器36跳過訊框元件或其剩餘/酬載部分。於第三步驟中,解碼器36藉解碼未被跳過的訊框元件而執行重建。
於第二步驟決定哪些元件位置及子串流欲被跳過中,解碼器36可檢視組態區塊28內部的組態元件56。為了達成此項目的,解碼器36可經組配來以與用在元件型別指標54及訊框元件22本身的相同順序,而從位元串流12的組態區塊28循環地讀取組態元件56。如前記,組態元件56之循環讀取可穿插語法元件54的循環讀取。更明確言之,解碼器36可檢視擴延元件型別子串流之組態元件56內部的擴延元件型別欄位72。若該擴延元件型別非被支援者,則解碼器36跳過個別子串流及在訊框20內部在個別訊框元件位置的相對應訊框元件22。
於步驟1中,為了容易達成傳輸長度資訊58需要的位元率,解碼器36係經組配來檢視擴延元件型別子串流之組態元件56,及特別其內設酬載長度資訊60。於第二步驟中,解碼器36檢視欲被跳過的訊框元件22之長度資訊58。更明 確言之,首先,解碼器36檢視旗標64。若經設定,則解碼器36使用藉內設酬載長度資訊60針對個別子串流所子示的內設長度作為欲跳過的剩餘酬載長度,來進行訊框之訊框元件的循環讀取/剖析。但若旗標64係未經設定,則解碼器36明確地從該位元串流12中讀取酬載長度66。雖然前文並未明確地解釋,但須明瞭解碼器36可推衍欲跳過的位元或位元組數目,來藉若干額外計算而存取目前訊框的下個訊框元件或下個訊框。舉例言之,解碼器36可考慮分段機制是否經作動,如前文就旗標78解說。若經作動,則解碼器36可考慮子串流的訊框元件已經設定旗標78,總而言之具有片段資訊80,及因而酬載資料68將比分段旗標78係未經設定的情況更延遲開始。
於步驟3之解碼中,解碼器如常動作:換言之,個別子串流係接受個別解碼機制或解碼模組,如第2圖所示,其中若干子串流可相對其它子串流形成側邊資訊,如前文已經就擴延子串流之特例解釋。
考慮有關解碼器功能之其它可能細節,參考前文討論。只為了求完整,須注意解碼器36也可於步驟1跳過組態元件56之進一步剖析,換言之針對欲被跳過的該等元件位置,原因在於例如藉欄位72指示的擴延元件型別不匹配擴延元件型別的經支援的集合。然後,解碼器36可使用組態資料長度資訊76來在循環地讀取/剖析組態元件56中跳過個別組態元件,換言之,跳過個別位元/位元組數目,來存取下個位元串流語法元件,諸如下個元件位置的型別指標54。
在進行前述特定語法實施例前,須注意本發明並不限於使用統一語音與音訊編碼(USAC)及其構面體現,例如使用混合來切換核心編碼,或使用參數編碼(ACELP)及變換編碼(TCX)來在AAC間切換例如頻域編碼及LP編碼。反而,前述子串流可運用任一種編碼方案而表示音訊信號。此外,雖然於後文摘述的特定語法實施例中,假設頻譜帶寬擴延(SBR)為核心編碼器用來運用單聲道及聲道對元件型別子串流表示音訊信號之一編碼選項,但SBR也可以不是後述元件型別的選項,反而只是可運用擴延元件型別。
後文中,解說位元串流12之特定語法實例。須注意特定語法實例表示針對第3圖實施例的可能體現,第3圖之如下語法的語法元件與位元串流結構間之一致性係從第3圖之個別註記及第3圖之描述中指示或推衍而得。現在摘述下述特例的基本構面。就此點而言,須注意除了前文就第3圖已述者外,任何額外細節須瞭解為第3圖實施例的可能擴延。全部此等擴延可個別地建立成第3圖之實施例。作為最後一者初步註釋,須瞭解下述特定語法實例明確地分明係指第5a圖及第5b圖之解碼器及編碼器環境。
有關所含音訊內容之高階資訊例如取樣率、確切聲道組態係存在於該音訊位元串流。如此使得該位元串流更加自容式,及當嵌置於轉送方案而該方案不具任何手段來明確地傳輸此項資訊時,使得組態及酬載的轉送更為容易。
組態結構含有訊框長度與頻譜帶寬擴延(SBR)取樣率比之組合指數(coreSbrFrameLengthIndex)。如此保證二值的 有效傳輸,及確保訊框長度與SBR比之非有意義組合無法傳訊。後者簡化了解碼器的體現。
該組態可利用專用組態延伸機制擴延。如此將避免如從MPEG-4 AudioSpecificConfig()已知的組態擴延之龐大與傳輸無效率。
組態許可與各個被傳輸的音訊聲道相聯結的揚聲器位置之自由傳訊。常用聲道對揚聲器對映之傳訊可利用聲道組態指數(channelConfigurationIndex)有效地傳訊。
各個聲道元件之組態係含在一分開結構使得各個聲道元件可獨立地組配。
SBR組態資料(「SBR標頭」)係分裂成SbrInfo()及SbrHeader()。針對SbrHeader()界定內設版本(SbrDfltHeader()),可在位元串流中有效地參照。如此在需要重新傳輸SBR組態資料之處減少位元需求。
藉助於SbrInfo()語法元件,可有效地傳訊更常施加至SBR的組態變化。
頻譜帶寬擴延(SBR)及參數立體聲編碼工具(MPS212又稱MPEG環繞2-1-2)係緊密地整合入USAC組態結構。如此表示兩種技術實質上在標準上採用之遠更佳方式。
語法特徵為擴延機制,允許傳輸既有的及未來的擴延給編解碼器。
擴延可以聲道元件以任一種順序配置(亦即交插)。如此允許在須施加擴延的特定聲道元件之前或之後需要讀取擴延。
內設長度可針對語法擴延定義,使得恆定長度擴延之 傳輸極為有效,原因在於擴延酬載之長度無需每次傳輸。
若有所需借助於逃逸機制來擴延數值範圍而傳訊一值的常見情況係經調變成專用真實語法元件(escapedValue()),該元件有足夠彈性來涵蓋全部期望的逃逸值信號線圖及位元欄位擴延。
位元串流組態 UsacConfig() (第4a圖)
係經擴延來含有有關所含音訊內容之資訊以及完整解碼器設定所需的每個資訊。有關音訊的頂階資訊(取樣率、聲道組態、輸出訊框長度)係在起始收集以便容易從更高層(應用層)存取。
UsacChannelConfig() (第4b圖)
此等元件給予有關所含位元串流元件及其對映至揚聲器之資訊。channelConfigurationIndex許可容易且方便的方式來傳訊被視為實際上相關的一定範圍經預先界定的單聲、立體聲或多聲道組態中之一者。
用於channelConfigurationIndex所不涵蓋的更精製組態,UsacChannelConfig()許可自由分派元件給32揚聲器位置之一列表中的揚聲器位置,該列表涵蓋用於家庭或劇院環繞再生之全部已知揚聲器配置中之全部目前已知之揚聲器位置。
此一揚聲器位置之列表為MPEG環繞標準中之特徵列表之超集(參考ISO/IEC 23003-1的表1及第1圖)。已經增加四個額外揚聲器位置來涵蓋晚近問世的22.2揚聲器配置(參 考第3a、3b、4a及4b圖)。
UsacDecoderConfig() (第4c圖)
此一元件係在解碼器組態的重要位置,如此含有解碼器解譯位元串流所需的全部額外資訊。
更明確言之,該位元串流之結構係藉明確地起始在位元串流中的元件編碼及其順序而在此定義。
然後迴圈通過全部元件許可全部型別(單一、成對、lfc、擴延)的全部元件組態。
UsacConfigExtension() (第41圖)
為了考慮未來擴延,該組態決定強而有力之機制特徵來擴延該組態用於目前尚未存在的USAC組態擴延。
UsacSingleChannelElementConfig() (第4d圖)
此一元件組態含有組配解碼器來解碼單一聲道所需的全部資訊。主要地此乃核心編碼器相關資訊,及若使用SBR,則為SBR相關資訊。
UsacChannelPairElementConfig() (第4e圖)
類似前文所述,此一元件組態含有組配解碼器來解碼一個聲道對所需的全部資訊。除了前述核心組態及SBR組態外,如此包含立體聲特定組態,例如所施加的立體聲編碼的確切類別(含或不含MPS212、殘差等)。注意此一元件涵蓋在USAC中可用的立體聲編碼之全部選項類別。
UsacLfeElementConfig() (第4f圖)
因LFE元件具有靜態組態,故LFE元件組態不含組態資料。
UsacExtElementConfig() (第4k圖)
此一元件組態可用以組配任何類別之既有的或未來的編解碼器擴延。各個擴延元件型別具有其本身專用的ID值。含括長度欄位來方便地跳過解碼器所未知的組態擴延。內設酬載長度之選擇性定義更進一步提高存在於實際位元串流中的擴延酬載之編碼效率。
已知涵蓋來與USAC組合的擴延包含:MPEG環繞、SAOC、及某種從MPEG-4 AAC為已知的FIL元件。
UsacCoreConfig() (第4g圖)
此一元件含有對核心編碼器配置有影響的組態資料。目前此等資料為用於時間包繞工具及雜訊填補工具之切換。
SbrConfig() (第4h圖)
為了減少由sbr_header()的頻繁重新傳輸所產生的位元額外負擔,典型地維持恆定的sbr_header()元件之內設值現在係攜載於組態元件SbrDfltHeader()。此外,靜態SBR組態元件也攜載於SbrConfig()。此等靜態位元包含致能或去能加強型SBR之特定特徵的旗標,例如諧波轉位或交互TES。
SbrDfltHeader() (第4i圖)
此元件攜載典型地維持恆定的sbr_header()元件。影響元件之狀況例如幅值解析度、交叉頻帶、頻譜預平坦化現在攜載於SbrInfo(),許可該等狀況在行進間動態有效地改變。
Mps212Config() (第4j圖)
類似前述SBR組態,針對MPEG環繞2-1-2工具的全部配置參數係於本組態中組裝。與本脈絡不相關或冗餘的來 自SpatialSpecificConfig()的全部元件皆被移除。
位元串流酬載 UsacFrame() (第4n圖)
此乃環繞USAC位元串流酬載之最外側包繞器及表示USAC存取單元。如於config部分傳訊,其含有迴圈通過全部所含聲道元件及擴延元件。如此使得位元串流格式就所含而言更具彈性,且係任何未來擴延的未來保證。
UsacSingleChannelElement() (第4o圖)
本元件含有解碼單聲串流的全部資料。該內容係分裂成核心編碼器相關部分及eSBR相關部分。後者現在已經遠更緊密地連結至核心,也遠更佳地反映該資料為解碼器所需的順序。
UsacChannelPairElement() (第4p圖)
本元件涵蓋編碼立體聲對的全部可能方式之資料。更明確言之,借助於MPEG環繞2-1-2,涵蓋全部統一立體聲編碼風格,從舊式以M/S為基礎之編碼至全然參數立體聲編碼。stereoConfigIndex指示實際上使用哪個風格。於此元件發送適當eSBR資料及MPEG環繞2-1-2資料。
UsacLfeElement() (第4q圖)
前述lfe_channel_element()僅重新命名來遵守一致的命名體系。
UsacExtElement() (第4r圖)
擴延元件係經審慎設計來具有最大彈性,但同時具最大效率,即便對具有小型(或經常絲毫也沒有)酬載的擴延亦 復如此。針對無知解碼器傳訊擴延酬載長度來跳過之。使用者界定的擴延可利用擴延型別之保留範圍傳訊。擴延可以元件順序自由地定位。一定範圍之擴延元件已經被考慮包含寫入填補位元的機制。
UsacCoreCoderData() (第4s圖)
此一新元件摘述影響核心編碼器的全部資訊,因此也含有fd_channel_stream()及lpd_channel_stream()。
StereoCoreToolInfo() (第4t圖)
為了容易化語法的可讀性,全部立體聲相關資訊係捕集於此一元件。處理立體聲編碼模式中的無數位元相依性。
UsacSbrData() (第4x圖)
可定標性音訊編碼之CRC功能元件及舊式描述元件係從用來成為sbr_extension_data()元件中移除。為了減少因SBR資訊及標頭資料的頻繁重新傳輸造成的額外負擔,可明確地傳訊此等的存在。
SbrInfo() (第4y圖)
經常在行進間動態修改之SBR組態資料。本表包含控制下列之元件,例如幅值解析度、交叉頻帶、頻譜預平坦化,先前對完整sbr_header()之傳輸所需。(參考[N11660]中之6.3,「效率」)。
SbrHeader() (第4z圖)
為了維持SBR在行進間動態改變sbr_header()值的能力,於應使用SbrDfltHeader()發送的數值以外之該等值的情況下,現在可能將SbrHeader()攜載於UsacSbrData()內部。 bs_header_extra機制係經維持來對大部分常見情況將額外負擔維持儘可能地低。
sbr_data() (第4za圖)
再度SBR可定標編碼之餘部被移除,原因在於其不適用於USAC脈絡。取決於聲道數目,sbr_data()含有一個sbr_single_channel_element()或一個sbr_channel_pair_element()。
usacSamplingFrequencyIndex
本表為用在MPEG-4來傳訊音訊編解碼器之取樣頻率之表的超集。本表更進一步擴延來也含括目前用在USAC操作模式的取樣率。也加入取樣頻率之某些倍數。
channelConfigurationIndex
本表為用在MPEG-4來傳訊channelConfiguration之表的超集。本表更進一步擴延來許可常用的且涵蓋的未來揚聲器配置傳訊。本表的指數係以5位元傳訊來許可未來擴延。
usacElementType
只存在有四型元件。四個基本位元串流元件各有一型:UsacSingleChannelElement()、UsacChannelPairElement()、UsacLfeElement()、UsacExtElement()。此等元件提供所需頂階結構同時維持全部需要的彈性。
usacExtElementType
在UsacExtElement()內部,本表許可傳訊大量擴延。為了未來有保證,位元欄位係經選擇夠大來允許全部可感知 的擴延。除了目前已知之擴延外,已提示少數欲考慮的擴延:填補元件、MPEG環繞、及SAOC。
usacConfigExtType
若在某一點需要擴延組態,則可利用UsacConfigExtension()處置,則此時本表將允許分派一型別給各個新組態。目前可傳訊的唯一型別為該組態之填補機制。
coreSbrFrameLengthIndex
本表將傳訊解碼器之多個組態構面。更明確言之,此等為輸出訊框長度、SBR比、及所得核心編碼器訊框長度(ccfl)。同時指示用在SBR的QMF分析及合成帶數目。
stereoConfigIndex
本表決定UsacChannelPairElement()之內部結構。無論適用立體聲SBR,及無論殘差編碼係適用於MPS212,本表指示使用單聲或立體聲核心,使用MPS212。
藉將大部分eSBR標頭欄位移動至內設標頭,利用內設標頭旗標可參考該內設標頭,發送eSBR控制資料的位元需求大減。在實體世界系統中被視為最可能改變的先前sbr_header()位元欄位現在是外包給sbrInfo()元件,而非現在係由4元位涵蓋至多8位元組成。比較sbr_header()由至少18位元組成,如此節省10位元。
更難以評估此項變化對總位元率的影響,原因在於總位元率係大為取決於sbrInfo(),eSBR控制資料之傳輸率。但已經對常用情況而言,於該處在一位元串流中的sbr交叉變更,每次當發送sbrInfo()替代完整傳輸的sbr_header() 時,位元節省可高達22位元。
USAC解碼器之輸出又更進一步藉MPEG環繞(MPS)(ISO/IEC 23003-1)或SAOC(ISO/IEC 23003-2)處理。若USAC中的SBR工具為作用態,則USAC解碼器典型地有效地組合接續MPS/SAOC解碼器,藉於ISO/IEC 23003-1 4.4中針對HE-AAC描述之相同方式連結於QMF域。若在QMF域的連結為不可能,則需連結於時域。
若利用usacExtElement機制(usacExtElementType為ID_EXT_ELE_MPEGS或ID_EXT_ELE_SAOC)MPS/SAOC側邊資訊被嵌入USAC位元串流,則USAC資料與MPS/SAOC資料間之時間排齊獲得USAC解碼器與MPS/SAOC解碼器間之最有效連結。若在USAC的SBR工具為作用態及若MPS/SAOC採用64帶QMF域表示型態(參考ISO/IEC 23003-1 6.6.3),則最有效連結係在QMF域。否則最有效連結係在時域。如此相對應於HE-AAC與MPS之組合的時間排齊,如ISO/IEC 23003-1 4.4、4.5及7.2.1之定義。
於USAC解碼後,藉加上MPS解碼所導入的額外延遲係由ISO/IEC 23003-1 4.5所給定,及取決於使用HQ MPS或LP MPS,及MPS是否係連結至QMF域或時域的USAC。
ISO/IEC 23003-1 4.4澄清USAC系統與MPEG系統間之介面。從系統介面遞送給音訊解碼器的每個存取單元將導致從該音訊解碼器輸送至系統介面的一個相對應組合單元亦即組合器。此將包含起始狀況及關斷狀況,亦即存取單元為一有限序列之存取單元的第一者或最末者。
針對音訊組合單元,ISO/IEC 14496-1 7.1.3.5組合時間戳記(CTS)載明施加至組合單元內部第n個音訊樣本的組合時間。對USAC而言n值經常性地為1。注意如此施加至USAC解碼器本身輸出。於USAC解碼器例如係組合MPS解碼器之情況下,須考慮在MPS解碼器的輸出遞送之組合單元。
若利用usacExtElement機制(usacExtElementType為ID_EXT_ELE_MPEGS或ID_EXT_ELE_SAOC)MPS/SAOC側邊資訊被嵌入USAC位元串流,則選擇性地可適用下列限制:
●MPS/SAOC sacTimeAlign參數(參考ISO/IEC 23003-1 7.2.5)須具有值0。
●MPS/SAOC之取樣頻率須與USAC之輸出取樣頻率相同。
●MPS/SAOC bsFrameLength參數(參考ISO/IEC 23003-1 5.2)須具有預定列表之容許值中之一者。
USAC位元串流酬載語法係顯示於第4n圖至第4r圖,及附屬酬載元件之語法係顯示於第4s-w圖,及加強式SBR酬載語法係顯示於第4x至第4zc圖。
資料元件之簡短描述
UsacConfig()
UsacConfig()含有有關輸出取樣頻率及聲道組態之資訊。此一資訊須與在此元件外側例如在MPEG-4 AudioSpecificConfig()傳訊的資訊相同。
Usac輸出取樣頻率
若取樣率非為表1右欄列舉的比率中之一者,則須推定取樣頻率相依性表(代碼表、標度因數帶表等)以便剖析位元串流酬載。因一給定取樣頻率係只與一個取樣頻率表相聯結,且因在可能的取樣頻率範圍期望最大彈性,故下表應用來聯結取樣頻率與取樣頻率相依性表。
UsacChannelConfig()
聲道組態表涵蓋大部分常用揚聲器位置。為了獲得進一步彈性,聲道可對映至近代揚聲器設施在各項應用所見32個揚聲器位置的總體選擇(參考第3a、3b圖)。
針對含在位元串流的各個聲道元件,UsacChannelConfig()載明此一特定聲道應對映的相聯結的揚聲器位置。由bsOutputChannelPos所檢索的揚聲器位置係 列舉於表X。以多聲道元件為例,bsOutputChannelPos[i]的指數i指示該聲道出現在位元串流之位置。第Y圖顯示揚聲器位置相對於收聽者之綜覽。
更明確言之,聲道係以其出現在位元串流之順序循序編碼,始於0(零)。於UsacSingleChannelElement()或UsacLfeElement()之普通情況下,聲道號碼係分派給該聲道,聲道計數值遞增1。以UsacChannelPairElement()為例,該元件中的第一聲道(具有指數ch==0)係編為1號,而該元件中的第二聲道(具有指數ch==1)接受下個更高數字,聲道計數遞增2。
接著numOutChannels應等於或小於位元串流中所含全部聲道之累積和。全部聲道之累積和係等於全部UsacSingleChannelElement()數目加全部UsacLfeElement()數目加兩倍全部UsacChannelPairElement()數目。
陣列bsOutputChannelPos中的全部分錄須彼此分開來避免位元串流中揚聲器位置的雙重分派。
於特定情況下,channelConfigurationIndex為0及numOutChannels係小於位元串流所含全部聲道的累積和,則非分派聲道之處置係在本說明書之範圍以外。有關此項資訊例如可藉於較高應用層的合宜手段或藉特別設計的(私密)擴延酬載而傳遞。
UsacDecoderConfig()
UsacDecoderConfig()含有解碼器要求解譯位元串流所需的全部額外資訊。首先,sbrRatioIndex之值決定核心編碼 器訊框長度(ccfl)與輸出訊框長度間之比。其後,sbrRatioIndex迴圈通過在本位元串流中的全部聲道元件。針對各次迭代重複,元件型別係在usacElementType[]中傳訊,緊接著為其相對應組態結構。各個元件存在於UsacDecoderConfig()之順序須與UsacFrame()中的相對應酬載之順序相同。
一個元件之各個情況可獨立地組配。當讀取UsacFrame()中之各個聲道元件時,針對各個元件應使用該種情況之相對應組態,亦即具有相同elemIdx。
UsacSingleChannelElementConfig()
UsacSingleChannelElementConfig()含有組配解碼器來解碼一個單聲道所需全部資訊。SBR組態資料係唯有實際上採用SBR時才傳輸。
UsacChannelPairElementConfig()
UsacChannelPairElementConfig()含有核心編碼器相關組態資料,以及取決於SBR之使用的SBR組態資料。立體聲編碼演算法之確切型別係藉stereoConfigIndex指示。於USAC中,聲道對可以多個方式編碼。包括:
1.立體聲核心編碼器對使用傳統聯合立體聲編碼技術,藉於MDCT域中的複合預測可能性擴延。
2.單聲核心編碼器聲道組合以MPEG環繞為基礎的MPS212用於完整參數立體聲編碼。單聲SBR處理係施加至核心信號上。
3.立體聲核心編碼器對組合以MPEG環繞為基礎的 MPS212,於該處第一核心編碼器聲道攜載下混信號及第二聲道攜載殘差信號。殘差可以是頻帶有限來實現部分殘差編碼。單聲SBR處理係只在MPS212處理前施加至下混信號上。
4.立體聲核心編碼器對組合以MPEG環繞為基礎的MPS212,於該處第一核心編碼器聲道攜載下混信號及第二聲道攜載殘差信號。殘差可以是頻帶有限來實現部分殘差編碼。立體聲SBR係在MPS212處理後施加至重建立體聲信號上。
在核心編碼器後,選項3及4可進一步與假LR聲道旋轉組合。
UsacLfeElementConfig()
因LFE聲道係不許可使用時間包繞式MDCT及雜訊填補,故無需對此等工具發射尋常核心編碼器旗標。取而代之應設定為零。
也在LFE脈絡中不允許使用SBR也無意義。故未發送SBR組態資料。
UsacCoreConfig()
UsacCoreConfig()只含有旗標來致能或去能時間包繞式MDCT及頻譜雜訊填補用在通用位元串流層面之用途。若tw_mdct係設定為零,則不應施加時間包繞。若noiseFilling係設定為零,則不應施加頻譜雜訊填補。
SbrConfig()
SbrConfig()位元串流元件用於傳訊確切eSBR配置參數 之目的。一方面SbrConfig()傳訊eSBR工具之一般部署。另一方面,含有SbrHeader()的內設版本,亦即SbrDfltHeader()。若在位元串流中未傳輸不同的SbrHeader(),則應假設此內設標頭值。此機制之背景為在一個位元串流中只施加SbrHeader()值之一個集合。然後SbrDfltHeader()之傳輸允許藉只使用一個位元於位元串流中來極為有效地參考此內設值集合。藉允許在位元串流本身頻帶內傳輸新SbrHeader,仍然保有在行進間動態變更SbrHeader值的可能。
SbrDfltHeader()
SbrDfltHeader()乃所謂的基本SbrHeader()樣板,且應含有主要使用的eSBR組態之值。於位元串流中,藉設定sbrUseDfltHeader()旗標可參考此一組態。SbrDfltHeader()之結構係與SbrHeader()之結構相同。為了能夠區別SbrDfltHeader()與SbrHeader()之值,SbrDfltHeader()中的位元欄位係加「dflt_」前綴而非「bs_」。若適用SbrDfltHeader(),則SbrHeader()位元欄位應假設相對應SbrDfltHeader()之值,亦即bs_start_freq=dflt_start_freq;bs_stop_freq=dflt_stop_freq;etc.
(continue for all elements in SbrHeader(),like:bs_xxx_yyy=dflt_xxx_yyy;
Mps212Config()
Mps212Config()類似MPEG環繞的 SpatialSpecificConfig()且大部分係從其中推定。但其程度減少成只含USAC脈絡中單聲或立體聲上混的相關資訊。結果,MPS212只組配一個OTT框。
UsacExtElementConfig()
UsacExtElementConfig()乃USAC之擴延元件的組態資料之一般容器。各個USAC擴延具有一個獨一無二型別的識別符亦即usacExtElementType,係定義於表X。針對各個UsacExtElementConfig(),所含擴延組態之長度係在變數usacExtElementConfigLength中傳輸,且許可解碼器安全地跳過其usacExtElementType為未知的擴延元件。
用於典型地具有恆定酬載長度的USAC擴延,UsacExtElementConfig()許可usacExtElementDefaultLength的傳輸。定義組態中的內設酬載長度允許在UsacExtElement()內部usacExtElementPayloadLength的高度有效傳訊,於該處位元耗用須維持為低。
以USAC擴延為例,於該處累積大量資料,非以每個訊框基礎傳輸,反而只以每隔一個訊框或甚至更稀疏地傳輸,此一資料可以展布在若干USAC訊框的片段或節段中傳輸。如此有助於維持位元貯藏處更為相等。此一機制的使用係藉旗標usacExtElementPayloadFrag旗標傳訊。分段機制更進一步解釋於6.2.X中usacExtElement的描述中。
UsacConfigExtension()
UsacConfigExtension()乃UsacConfig()擴延之一般容器。提供修正或擴延在解碼器初始化或配置設定時交換的 資訊之方便方式。組態擴延的存在係藉usacConfigExtensionPresent指示。若組態擴延係存在(usacConfigExtensionPresent==1),則在位元欄位numConfigExtensions中接著為此等擴延的確切數目。各個組態擴延具有一個獨一無二型別的識別符usacConfigExtType,其係定義於表X。針對各個UsacConfigExtension,所含組態擴延之長度係在變數usacConfigExtLength中傳輸,及允許組態位元串流剖析器安全地跳過其usacConfigExtType為未知的組態擴延。
針對音訊物件型別USAC之頂階酬載 術語及定義
UsacFrame()之解碼
一個UsacFrame()形成USAC位元串流之一個存取單元。依據從表X所決定的outputFrameLength,各個UsacFrame解碼成768、1024、2048或4096個輸出樣本。
UsacFrame()中的第一位元為usacIndependencyFlag,決定是否可未知曉任何先前訊框而解碼一給定訊框。若usacIndependencyFlag係設定為0,則與前一訊框之相依性可能存在於目前訊框之酬載。
UsacFrame()更係由一或多個語法元件組成,該等語法元件須以其相對應組態元件於UsacDecoderConfig()的相同順序而出現在該位元串流。各個元件在全部元件串列中的位置係藉elemIdx指數索引。針對各個元件,應使用該種情況如在UsacDecoderConfig()中傳輸時的相對應組態亦即具有相同elemIdx。
此等語法元件係屬四個型別中之一者,列舉於表X中。此等元件各自之型別係藉usacElementType決定。可能有多個相同型別的元件。出現在不同訊框的相同位置elemIdx之元件應屬相同串流。
若此等位元串流酬載欲透過恆定比率聲道傳輸,則可能包含具有ID_EXT_ELE_FILL之usacExtElementType之一擴延酬載元件來調整瞬時位元率。於此種情況下,編碼立體聲信號之實例為:
UsacSingleChannelElement()之解碼
UsacSingleChannelElement()之簡單結構係由UsacCoreCoderData()之一例所組成,具有nrCoreCoderChannels設定為1。取決於此一元件的sbrRatioIndex,一UsacSbrData()元件接著為nrSbrChannels也設定為1。
UsacExtElement()之解碼
在一位元串流中的UsacExtElement()結構可藉USAC解碼器解碼或跳過。每個擴延係藉在與UsacExtElement()相聯結的UsacExtElementConfig()中傳遞的usacExtElementType識別。針對各個usacExtElementType,可存在有特定解碼器。
若擴延用之解碼器為USAC解碼器所可用,則恰在UsacExtElement()已經藉USAC解碼器剖析後即刻,擴延之酬載前傳至擴延解碼器。
若無任何擴延用之解碼器為USAC解碼器所可用,則在位元串流內部提供最小結構,使得擴延可被USAC解碼器忽略。
擴延元件長度係藉內設長度載明,單位為八重元組,可在相對應UsacExtElementConfig()內部傳訊且可在UsacExtElement()變更;或使用語法元件escapedValue(),藉在UsacExtElement()中明確地提供的長度資訊載明,其為1至3八重元組長。
跨據一或多個UsacFrame()之擴延酬載可被分段,其酬載分散在數個UsacFrame()間。於此種情況下,usacExtElementPayloadFrag旗標係設定為1,解碼器須收集從具有usacExtElementStart設定為1的UsacFrame()直至且含具有usacExtElementStop設定為1的UsacFrame()的全部片段。當usacExtElementStop設定為1時,擴延被視為完整及傳送至擴延解碼器。
注意本說明書不提供分段擴延酬載的完整性保護,須使用其它手段來確保擴延酬載的完整。
注意全部擴延酬載資料係假設為位元組排齊。
各個UsacExtElement()應遵守使用usacIndependencyFlag之要求。更明確言之,若usacIndependencyFlag係經設定(==1),則UsacExtElement()應可未知曉前一訊框(及其中可能含有的擴延酬載)即可解碼。
解碼處理
在UsacChannelPairElementConfig()中發送的stereoConfigIndex決定施加於給定CPE的立體聲編碼之確切型別。取決於此型立體聲編碼,一或二個核心編碼器聲道實際上係在位元串流傳輸,及變數nrCoreCoderChannels須據此而予設定。然後語法元件UsacCoreCoderData()提供一或二個核心編碼器聲道之資料。
同理,取決於立體聲編碼型別及eSBR之使用(亦即若sbrRatioIndex>0),可有資料可供一或二個聲道使用。nrSbrChannels之值須據此設定,及語法元件UsacSbrData()提供一或二個聲道之資料。
最後,Mps212Data()係取決於stereoConfigIndex之值傳輸。
低頻加強式(LFE)聲道元件,UsacLfeElement() 概論
為了維持解碼器的規則結構,UsacLfeElement()係定義為標準fd_channel_stream(0,0,0,0,x)元件,亦即係等於使用頻域編碼器之UsacCoreCoderData()。如此使用解碼UsacCoreCoderData()-元件的標準程序可進行解碼。
但為了配合LFE解碼器之更高位元率及硬體有效體 現,對用來編碼此一元件的選項施加若干限制:
●window_sequence欄位經常性地設定為0(ONLY_LONG_SEQUENCE)
●只有任何LFE之最低24頻譜係數可以為非零
●不使用時間性雜訊塑形,亦即tns_data_present係設定為0
●時間包繞未經作動
●未施加雜訊填補
UsacCoreCoderData()
UsacCoreCoderData()含有解碼一或二個核心編碼器聲道的全部資訊。
解碼順序為:
●取得各聲道的core_mode[]
●於兩個核心編碼器聲道(nrChannels==2)之情況下,剖析StereoCoreToolInfo()及決定全部立體聲相關參數
●取決於所傳訊的core_modes,針對各個聲道傳輸lpd_channel_stream()或fd_channel_stream()
從以上列表可知,一個核心編碼器聲道(nrChannels==1)之解碼結果導致獲得core_mode位元,接著為取決於core_mode的一個lpd_channel_stream或fd_channel_stream。
於二個核心編碼器聲道中,可探討聲道間的若干傳訊冗餘,特別若二聲道的core_mode為0時尤為如此。細節請參考6.2.X(StereoCoreToolInfo()之解碼)。
StereoCoreToolInfo()
StereoCoreToolInfo()許可有效地編碼參數,於二聲道係以FD模式編碼(core_mode[0,1]==0)之情況下,其值可橫過CPI的核心編碼器聲道共享。更明確言之,當位元串流中的合宜旗標係設定為1時,共享下列資料元件。
若不設定合宜旗標,則資料元件係針對各個核心編碼器聲道個別地傳輸,或於StereoCoreToolInfo()(max_sfb、max_sfb1)或於UsacCoreCoderData()中接在StereoCoreToolInfo()之後的fd_channlel_stream()。
以common_window==1為例,StereoCoreToolInfo()也含有有關M/S立體聲編碼資訊及MDCT域中的複雜預測資料(參考7.7.2)。
USAC之SBR酬載
於USAC中SBR酬載係在UsacSbrData()中傳輸,此乃各 個單一聲道元件或聲道對元件之整合一體部分。UsacSbrData()緊接在UsacCoreCoderData()之後。不含針對LFE聲道的SBR酬載。
numSlots於一Mps212Data訊框中的時槽數目。
雖然已經以設備脈絡描述若干構面,但顯然此等構面也表示相對應方法的描述,於該處一方塊或一裝置係相對應於一方法步驟或一方法步驟之特徵。同理,以方法步驟之脈絡描述的構面也表示相對應裝置之相對應方塊或項或特徵結構之描述。
取決於某些體現要求,本發明之實施例可於硬體或於軟體體現。體現可使用數位儲存媒體執行,例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,具有可電子讀取控制信號儲存於其上,該等信號與可程式規劃電腦系統協作(或可與協作),因而執行個別方法。
依據本發明之若干實施例包含具有可電子式讀取控制信號的非過渡資料載體,該等控制信號可與可程式規劃電腦系統協作,因而執行此處所述方法中之一者。
編碼音訊信號可透過有線或無線傳輸媒體傳輸,或可儲存在機器可讀取載體或非過渡儲存媒體上。
大致言之,本發明之實施例可體現為具有程式代碼的電腦程式產品,該程式代碼係當電腦程式產品在電腦上跑時可執行該等方法中之一者。該程式代碼例如可儲存在機器可讀取載體上。
其它實施例包含儲存在機器可讀取載體上的用以執行 此處所述方法中之一者的電腦程式。
換言之,因此,本發明方法之實施例為一種具有一程式代碼之電腦程式,該程式代碼係當該電腦程式於一電腦上跑時用以執行此處所述方法中之一者。
因此,本發明方法之又一實施例為資料載體(或數位儲存媒體或電腦可讀取媒體)包含用以執行此處所述方法中之一者的電腦程式記錄於其上。
因此,本發明方法之又一實施例為表示用以執行此處所述方法中之一者的電腦程式的資料串流或信號序列。資料串流或信號序列例如可經組配來透過資料通訊連結,例如透過網際網路轉移。
又一實施例包含處理構件例如電腦或可程式規劃邏輯裝置,其係經組配來或適用於執行此處所述方法中之一者。
又一實施例包含一電腦,其上安裝有用以執行此處所述方法中之一者的電腦程式。
於若干實施例中,可程式規劃邏輯裝置(例如可現場程式規劃閘陣列)可用來執行此處描述之方法的部分或全部功能。於若干實施例中,可現場程式規劃閘陣列可與微處理器協作來執行此處所述方法中之一者。大致上該等方法較佳係藉任何硬體裝置執行。
前述實施例係僅供舉例說明本發明之原理。須瞭解此處所述配置及細節之修改及變化將為熟諳技藝人士顯然易知。因此,意圖僅受審查中之專利申請範圍所限而非受藉以描述及解說此處實施例所呈示之特定細節所限。
10‧‧‧音訊內容
12‧‧‧位元串流
16‧‧‧音訊信號
18‧‧‧時間週期
20‧‧‧訊框
22、22a-b‧‧‧訊框元件
24‧‧‧編碼器
26‧‧‧共通時間基準t
28‧‧‧組態區塊
30、40‧‧‧分配器
32‧‧‧排序器
34a-c‧‧‧編碼模組
34a‧‧‧LFE編碼器
34b‧‧‧單聲道編碼器
34c‧‧‧聲道對編碼器
34d‧‧‧多物件編碼器
34e‧‧‧多聲道編碼器
36‧‧‧解碼器
38‧‧‧重建版本
42‧‧‧排列器
44a-e‧‧‧解碼模組
44a‧‧‧LFE解碼器
44b‧‧‧單聲道解碼器
44c‧‧‧聲道對解碼器
44d‧‧‧多物件解碼器
44e‧‧‧多聲道解碼器
46‧‧‧開關
48‧‧‧使用者輸入
50‧‧‧欄位
52‧‧‧型別指示語法部分
54‧‧‧語法元件、型別指標
55‧‧‧特定子串流組態資料、特定元件位置組態資料、序列
56‧‧‧組態元件
58‧‧‧長度資訊
60‧‧‧內設酬載長度資訊
60a‧‧‧內設酬載長度存在旗標
60b‧‧‧內設擴延酬載長度
62‧‧‧條件語法部分
64‧‧‧內設酬載長度旗標
66‧‧‧擴延酬載長度值
68‧‧‧酬載區段
70‧‧‧擴延酬載存在旗標
72‧‧‧擴延元件型別欄位
74‧‧‧特定酬載資料型別組態資料、酬載資料相依性組態資料、多聲道側邊資訊組態資料、多物件側邊資訊組態資料
76‧‧‧組態資料長度欄位
78‧‧‧分段使用旗標
80‧‧‧長度資訊、片段資訊
第1圖顯示依據一實施例編碼器及其輸入及輸出之示意方塊圖;第2圖顯示依據一實施例解碼器及其輸入及輸出之示意方塊圖;第3圖示意地顯示依據一實施例的位元串流;第4a至z及za至zc圖顯示依據一實施例例示說明位元串流之一具體語法之假代碼表;及第5a及b圖顯示USAC編碼器及解碼器之方塊圖;及第6圖顯示典型成對編碼器及解碼器。
10‧‧‧音訊內容
12‧‧‧位元串流
16‧‧‧音訊信號
18‧‧‧時間週期
20‧‧‧訊框
22‧‧‧訊框元件
24‧‧‧編碼器
26‧‧‧共通時間基準t
28‧‧‧組態區塊
30‧‧‧分配器
32‧‧‧排序器
34a‧‧‧LFE編碼器
34b‧‧‧單聲道編碼器
34c‧‧‧聲道對編碼器
34d‧‧‧多物件編碼器
34e‧‧‧多聲道編碼器

Claims (25)

  1. 一種包含一組態區塊及個別地表示一音訊內容之連續時間週期的一訊框序列之位元串流,其中該訊框序列係為N個訊框元件序列之一組成,而各個訊框元件係屬多個元件型別中之個別一者使得各個訊框分別包含N個訊框元件序列中之一個訊框元件,及針對訊框元件之各個序列,該等訊框元件係屬彼此相同元件型別,其中針對該等訊框元件序列中之至少一者,該組態區塊係包含有關一內設酬載長度之一內設酬載長度資訊,及其中該等訊框元件序列中之該至少一者的各個訊框元件係包含一長度資訊,針對該等訊框元件序列中之該至少一者的該等訊框元件之至少一子集,該長度資訊係包含一內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著一酬載長度值,其中該等訊框元件序列中之該至少一者的任一個訊框元件,其內設擴延酬載長度旗標係經設定者,具有該內設酬載長度;及該等訊框元件序列中之該至少一者的任一個訊框元件,其內設擴延酬載長度旗標係未經設定者,具有相對應於該酬載長度值之一酬載長度。
  2. 如申請專利範圍第1項之位元串流,其中該組態區塊係包含一欄位,指示一元件數目N,及一型別指示語法部分,係針對一序列N個元件位置 中之各個元件位置,指示多個元件型別中之一元件型別;其中針對該個別訊框元件係定位在該位元串流中之該個別訊框的該序列N個訊框元件內部之該個別元件位置,各個訊框元件係屬由該型別指示語法部分所指示的該元件型別。
  3. 如申請專利範圍第2項之位元串流,其中該型別指示語法部分係包含一序列N個語法元件,各個語法元件係針對該個別語法元件係定位在該型別指示語法部分內部的個別元件位置而指示該元件型別。
  4. 如申請專利範圍第1至3項中任一項之位元串流,其中該組態區塊係包含每個訊框元件之序列一個組態元件,包含針對該訊框元件之個別序列中之該等訊框元件係屬哪個元件型別的組態資訊。
  5. 如申請專利範圍第4項之位元串流,其中該型別指示語法部分係包含一序列N個語法元件,各個語法元件係針對該個別語法元件係定位在該型別指示語法部分內部的個別元件位置而指示該元件型別,及該等組態元件及該等語法元件係交替地排列在該位元串流中。
  6. 如申請專利範圍第5項之位元串流,其中針對該至少一個訊框元件序列中之各個訊框元件,該長度資訊係包含一擴延酬載存在旗標,其中其長度資訊的該擴延酬載存在旗標係未經設定的任一個訊框元件只係由該擴延酬載存在旗標所組成;及其長度資訊的該擴延酬載存在旗 標係經設定的任一個訊框元件之該長度資訊進一步包含該內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著該酬載長度值。
  7. 如申請專利範圍第1至3項中任一項之位元串流,其中針對該等訊框元件序列中之該至少一者,該組態區塊係包含含有組態資訊之一組態元件,其中該組態資訊包含一擴延元件型別欄位,該欄位指示多個酬載資料型別中之一酬載資料型別,其中該等多個酬載資料型別係包含一多聲道側邊資訊型別及一多物件編碼側邊資訊型別,其中其擴延元件型別欄位係指示該多聲道側邊資訊的該組態資訊係也包含多聲道側邊資訊組態資料;及其擴延元件型別欄位係指示該多物件側邊資訊型別的該組態資訊係也包含多物件側邊資訊組態資料;及該至少一個訊框元件序列之該等訊框元件係傳遞由針對個別訊框元件序列之該組態元件的組態資訊中該擴延元件型別欄位所指示的該酬載資料型別之酬載資料。
  8. 一種用以解碼包含一組態區塊及個別地表示一音訊內容之連續時間週期的一訊框序列之一位元串流之解碼器,其中該訊框序列係為N個訊框元件序列之一組成,而各個訊框元件係屬多個元件型別中之個別一者使得各個訊框分別包含N個訊框元件序列中之一個訊框元件,及針對訊框元件之各個序列,該等訊框元件係屬彼此相同元件型別,其中該解碼器係經組配來基於該等訊框元件序列 之一子集,剖析該位元串流及重建該音訊內容,及就該等訊框元件序列中之至少一者,係不屬於該等訊框元件序列之該子集,針對該等訊框元件序列中之該至少一者,從該組態區塊讀取有關一內設酬載長度的一內設酬載長度資訊,及針對該等訊框元件序列中之該至少一者的各個訊框元件,從該位元串流中讀取一長度資訊,針對該等訊框元件序列中之該至少一者的該等訊框元件之至少一子集,該長度資訊的讀取係包含讀取一內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著讀取一酬載長度值,於剖析該位元串流中,其內設擴延酬載長度旗標係經設定者,使用該內設酬載長度作為跳過區間長度,跳過該等訊框元件序列中之該至少一者的任一個訊框元件;及其內設擴延酬載長度旗標係未經設定者,使用相對應於該酬載長度值之一酬載長度作為跳過區間長度,跳過該等訊框元件序列中之該至少一者的任一個訊框元件。
  9. 如申請專利範圍第8項之解碼器,其中該解碼器係經組配來在讀取該組態區塊中,讀取指示該元件數目N的一欄位,及針對一序列N個元件位置中之各個元件位置指示多個元件型別中之一元件型別之一型別指示語法部分,其中該解碼器係經組配來藉下述方式解碼各個訊框 針對該個別訊框元件係定位在該位元串流中之該個別訊框之該序列N個訊框元件內部之該個別元件位置,依據由該型別指示語法部分所指示的元件型別而解碼各個訊框元件。
  10. 如申請專利範圍第9項之解碼器,其中該解碼器係經組配來從該型別指示語法部分讀取一序列N個語法元件,各個元件係就該個別語法元件定位在該序列N個語法元件中之個別元件位置指示該元件型別。
  11. 如申請專利範圍第8至10項中任一項之解碼器,其中該解碼器係經組配來從該組態區塊中讀取各序列訊框元件之一組態元件,各個組態元件包含該個別序列訊框元件之組態資訊,其中該解碼器係經組配來在基於該等訊框元件序列之一子集而重建該音訊內容中,使用該個別組態元件之該組態資訊而解碼該等訊框元件序列之該子集的各個訊框元件。
  12. 如申請專利範圍第11項之解碼器,其中該型別指示語法部分係包含一序列N個語法元件,各個語法元件係就該個別語法元件在該型別指示語法部分內部之該各別元件位置指示該元件型別,該解碼器係經組配來從該位元串流交替地讀取該等組態元件及該等語法元件。
  13. 如申請專利範圍第8至10項中任一項之解碼器,其中該解碼器係經組配來在讀取該至少一個訊框元件序列中之任一個訊框元件的該長度資訊中,從該位元串流中讀取一擴延酬載存在旗標,檢查該擴延酬載存在旗 標是否經設定,及若該擴延酬載存在旗標係未經設定,則停止讀取該個別訊框元件及進而讀取一目前訊框之另一個訊框元件或一隨後訊框之一訊框元件;及若該擴延酬載存在旗標係經設定,則進而從該位元串流中讀取該內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著讀取該酬載長度值;以及進而跳過。
  14. 如申請專利範圍第8至10項中任一項之解碼器,其中該解碼器係經組配來在讀取該內設酬載長度資訊中,從該位元串流中讀取一內設酬載長度存在旗標,檢查該內設酬載長度存在旗標是否經設定,若該內設酬載長度存在旗標係未經設定,則將該內設擴延酬載長度設定為零,及若該內設酬載長度存在旗標係經設定,則從該位元串流中明確地讀取該內設擴延酬載長度。
  15. 如申請專利範圍第8至10項中任一項之解碼器,其中該解碼器係經組配來針對該至少一個訊框元件序列中之各個訊框元件序列,在讀取該組態區塊中,從該位元串流中讀取包含一擴延元件型別之組態資訊的一組態元件,其中該組態資訊包含指示多個酬載資料型別中之一酬載資料型別的一擴延元件型別欄位。
  16. 如申請專利範圍第15項之解碼器,其中該等多個酬載資料型別係包含一多聲道側邊資訊型別及一多物件編碼側邊資訊型別, 該解碼器係經組配來,針對該至少一個訊框元件序列中之各者,在讀取該組態區塊中,若該擴延元件型別欄位係指示該多聲道側邊資訊型別,則從該資料串流中讀取多聲道側邊資訊組態資料作為該組態資訊之一部分;若該擴延元件型別欄位係指示該多物件側邊資訊型別,則從該資料串流中讀取多物件側邊資訊組態資料作為該組態資訊之一部分;及該解碼器係經組配來在解碼各個訊框中,針對其組態元件之該擴延元件型別係指示該多聲道側邊資訊型別者,藉由使用該多聲道側邊資訊組態資料而組配一多聲道解碼器,及對如此經組配的多聲道解碼器,饋給該個別訊框元件序列之該等訊框元件的酬載資料作為多聲道側邊資訊來解碼該至少一個訊框元件序列中之任一者的該等訊框元件,及針對其組態元件之該擴延元件型別係指示該多物件側邊資訊型別者,藉由使用該多物件側邊資訊組態資料而組配一多物件解碼器,及對如此經組配的多物件解碼器,饋給該個別訊框元件序列之該等訊框元件的酬載資料來解碼該至少一個訊框元件序列中之任一者的該等訊框元件。
  17. 如申請專利範圍第16項之解碼器,其中針對該至少一個訊框元件序列中之任一者,該解碼器係經組配來從該位元串流中讀取一組態資料長度欄位作為該 個別訊框元件序列之該組態元件之該組態資訊的一部分,檢查由針對該個別訊框元件序列之該組態元件之該組態資訊的擴延元件型別欄位所指示的酬載資料型別是否屬於係為該等多個酬載資料型別之一子集的一預定酬載資料型別集合,若藉針對該個別訊框元件序列之該組態元件之該組態資訊的擴延元件型別欄位所指示的酬載資料型別係屬該預定酬載資料型別集合,則從該位元串流中讀取酬載資料相依性組態資料作為針對該個別訊框元件序列之該組態元件之該組態資訊的一部分,及使用該酬載資料相依性組態資料,解碼於該等訊框中該個別訊框元件序列之該等訊框元件,及若藉針對該個別訊框元件序列之該組態元件之該組態資訊的擴延元件型別欄位所指示的酬載資料型別係不屬於該預定酬載資料型別集合,則使用該組態資料長度,跳過該酬載資料相依性組態資料,及使用其中的長度資訊,跳過在該等訊框中該個別訊框元件序列之該等訊框元件。
  18. 如申請專利範圍第8至10項中任一項之解碼器,其中該解碼器係經組配來針對該至少一個訊框元件序列中之各者,在讀取該組態區塊中, 從該位元串流中讀取包含擴延元件型別之組態資訊的一組態元件,其中該組態資訊係包含一分段使用旗標,及該解碼器係經組配來針對該組態元件之該分段使用旗標係經設定,在讀取任何訊框元件序列的訊框元件中,從該位元串流中讀取一片段資訊,及使用該片段資訊來將連續訊框之此等訊框元件的酬載資料置放在一起。
  19. 如申請專利範圍第8至10項中任一項之解碼器,其中該解碼器係經組配來使得該解碼器從係屬一單聲道元件型別的該等訊框元件序列之該子集中之一者的訊框元件重建一音訊信號。
  20. 如申請專利範圍第8至10項中任一項之解碼器,其中該解碼器係經組配來使得該解碼器從係屬一聲道對元件型別的該等訊框元件序列之該子集中之一者的訊框元件重建一音訊信號。
  21. 如申請專利範圍第8至10項中任一項之解碼器,其中該解碼器係經組配來使用相同的可變長度代碼而讀取該長度資訊、該擴延元件型別欄位、及該組態資料長度欄位。
  22. 一種用以將一音訊內容編碼成一位元串流之編碼器,該編碼器係經組配來將該音訊內容之連續時間週期編碼成分別地表示 該音訊內容之該連續時間週期的一序列訊框,使得該訊框序列為N個訊框元件序列之一組成,而各個訊框元件係屬多個元件型別中之個別一者使得各個訊框分別包含N個訊框元件序列中之一個訊框元件,及針對訊框元件之各個序列,該等訊框元件係屬彼此相同元件型別,將針對該等訊框元件序列中之至少一者,包含有關一內設酬載長度之一內設酬載長度資訊的一組態區塊編碼進該位元串流,及將該等訊框元件序列中之該至少一者的各個訊框元件編碼進該位元串流,使得該位元串流包含一長度資訊,針對該等訊框元件序列中之該至少一者的該等訊框元件之至少一子集,該長度資訊包含一內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著一酬載長度值;及使得該等訊框元件序列中之該至少一者的任一個訊框元件,其內設擴延酬載長度旗標係經設定者,具有該內設酬載長度;及該等訊框元件序列中之該至少一者的任一個訊框元件,其內設擴延酬載長度旗標係未經設定者,具有相對應於該酬載長度值之一酬載長度。
  23. 一種用以解碼包含一組態區塊及個別地表示一音訊內容之連續時間週期的一訊框序列之位元串流之方法,其中該訊框序列為N個訊框元件序列之一組成,而各個訊框元件係屬多個元件型別中之個別一者使得各個訊框分別包含N個訊框元件序列中之一個訊框元件,及針對各個訊框元件序列,該等訊框元件係屬彼此相同元件型 別,其中該方法係包含基於該等訊框元件序列之一子集剖析該位元串流及重建該音訊內容,且就該等訊框元件序列中之至少一個訊框而不屬於該等訊框元件序列之該子集,針對該等訊框元件序列中之該至少一者,從該組態區塊讀取有關一內設酬載長度的一內設酬載長度資訊,及針對該等訊框元件序列中之該至少一者的各個訊框元件,從該位元串流中讀取一長度資訊,針對該等訊框元件序列中之該至少一者的該等訊框元件之至少一子集,該長度資訊的讀取係包含讀取一內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著讀取一酬載長度值,於剖析該位元串流中,其內設擴延酬載長度旗標係經設定者,使用該內設酬載長度作為跳過區間長度,跳過該等訊框元件序列中之該至少一者的任一個訊框元件;及,其內設擴延酬載長度旗標係未經設定者,使用相對應於該酬載長度值之一酬載長度作為跳過區間長度,跳過該等訊框元件序列中之該至少一者的任一個訊框元件。
  24. 一種用以將一音訊內容編碼成一位元串流之方法,該方法係包含將該音訊內容之連續時間週期編碼進分別地表示該音訊內容之該連續時間週期的一序列訊框,使得該訊 框序列為N個訊框元件序列之一組成,而各個訊框元件係屬多個元件型別中之個別一者使得各個訊框分別包含N個訊框元件序列中之一個訊框元件,及針對訊框元件之各個序列,該等訊框元件係屬彼此相同元件型別,將針對該等訊框元件序列中之至少一者,包含有關一內設酬載長度之一內設酬載長度資訊的一組態區塊編碼進該位元串流,及將該等訊框元件序列中之該至少一者的各個訊框元件編碼進該位元串流,使得該位元串流包含一長度資訊,針對該等訊框元件序列中之該至少一者的該等訊框元件之至少一子集,該長度資訊包含一內設酬載長度旗標,若該內設酬載長度旗標係未經設定,則接著一酬載長度值;及使得該等訊框元件序列中之該至少一者的任一個訊框元件,其內設擴延酬載長度旗標係經設定者,具有該內設酬載長度;及該等訊框元件序列中之該至少一者的任一個訊框元件,其內設擴延酬載長度旗標係未經設定者,具有相對應於該酬載長度值之一酬載長度。
  25. 一種用以當於一電腦上運行時執行如申請專利範圍第23或24項之方法之電腦程式。
TW101109346A 2011-03-18 2012-03-19 音訊編碼中之訊框元件長度傳輸技術 TWI480860B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201161454121P 2011-03-18 2011-03-18

Publications (2)

Publication Number Publication Date
TW201243827A TW201243827A (en) 2012-11-01
TWI480860B true TWI480860B (zh) 2015-04-11

Family

ID=45992196

Family Applications (3)

Application Number Title Priority Date Filing Date
TW101109344A TWI488178B (zh) 2011-03-18 2012-03-19 表示音訊內容之位元串流之訊框中的訊框元件定位技術
TW101109343A TWI571863B (zh) 2011-03-18 2012-03-19 具有彈性組態功能之音訊編碼器及解碼器
TW101109346A TWI480860B (zh) 2011-03-18 2012-03-19 音訊編碼中之訊框元件長度傳輸技術

Family Applications Before (2)

Application Number Title Priority Date Filing Date
TW101109344A TWI488178B (zh) 2011-03-18 2012-03-19 表示音訊內容之位元串流之訊框中的訊框元件定位技術
TW101109343A TWI571863B (zh) 2011-03-18 2012-03-19 具有彈性組態功能之音訊編碼器及解碼器

Country Status (16)

Country Link
US (5) US9524722B2 (zh)
EP (3) EP2686849A1 (zh)
JP (3) JP6007196B2 (zh)
KR (7) KR101742136B1 (zh)
CN (5) CN103703511B (zh)
AR (3) AR085446A1 (zh)
AU (5) AU2012230442B2 (zh)
BR (1) BR112013023949A2 (zh)
CA (3) CA2830631C (zh)
HK (1) HK1245491A1 (zh)
MX (3) MX2013010536A (zh)
MY (2) MY163427A (zh)
RU (2) RU2589399C2 (zh)
SG (2) SG193525A1 (zh)
TW (3) TWI488178B (zh)
WO (3) WO2012126893A1 (zh)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012004349A1 (en) * 2010-07-08 2012-01-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coder using forward aliasing cancellation
AU2011311659B2 (en) * 2010-10-06 2015-07-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC)
EP3544006A1 (en) * 2011-11-11 2019-09-25 Dolby International AB Upsampling using oversampled sbr
CN108806706B (zh) * 2013-01-15 2022-11-15 韩国电子通信研究院 处理信道信号的编码/解码装置及方法
WO2014112793A1 (ko) 2013-01-15 2014-07-24 한국전자통신연구원 채널 신호를 처리하는 부호화/복호화 장치 및 방법
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
WO2014126689A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
CN116665683A (zh) 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
CN103336747B (zh) * 2013-07-05 2015-09-09 哈尔滨工业大学 VxWorks操作系统下CPCI总线数字量输入与开关量输出可配置驱动器及驱动方法
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830058A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
TWI847206B (zh) 2013-09-12 2024-07-01 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
RU2665281C2 (ru) 2013-09-12 2018-08-28 Долби Интернэшнл Аб Временное согласование данных обработки на основе квадратурного зеркального фильтра
EP2928216A1 (en) * 2014-03-26 2015-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for screen related audio object remapping
US9847804B2 (en) * 2014-04-30 2017-12-19 Skyworks Solutions, Inc. Bypass path loss reduction
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP3258467B1 (en) * 2015-02-10 2019-09-18 Sony Corporation Transmission and reception of audio streams
RU2681958C1 (ru) 2015-03-09 2019-03-14 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Выровненное по фрагменту аудиокодирование
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016204580A1 (ko) * 2015-06-17 2016-12-22 삼성전자 주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
WO2016204581A1 (ko) 2015-06-17 2016-12-22 삼성전자 주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
WO2016204579A1 (ko) * 2015-06-17 2016-12-22 삼성전자 주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
US10607622B2 (en) 2015-06-17 2020-03-31 Samsung Electronics Co., Ltd. Device and method for processing internal channel for low complexity format conversion
US10008214B2 (en) * 2015-09-11 2018-06-26 Electronics And Telecommunications Research Institute USAC audio signal encoding/decoding apparatus and method for digital radio services
EP3539126B1 (en) 2016-11-08 2020-09-30 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
ES2853936T3 (es) 2017-01-10 2021-09-20 Fraunhofer Ges Forschung Decodificador de audio, codificador de audio, método para proporcionar una señal de audio decodificada, método para proporcionar una señal de audio codificada, flujo de audio, proveedor de flujos de audio y programa informático que utiliza un identificador de flujo
US10224045B2 (en) 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding
ES2965741T3 (es) 2017-07-28 2024-04-16 Fraunhofer Ges Forschung Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US11032580B2 (en) 2017-12-18 2021-06-08 Dish Network L.L.C. Systems and methods for facilitating a personalized viewing experience
WO2019121982A1 (en) * 2017-12-19 2019-06-27 Dolby International Ab Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
TWI702594B (zh) 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
US10365885B1 (en) * 2018-02-21 2019-07-30 Sling Media Pvt. Ltd. Systems and methods for composition of audio content from multi-object audio
CN110505425B (zh) * 2018-05-18 2021-12-24 杭州海康威视数字技术股份有限公司 一种解码方法、解码装置、电子设备和可读存储介质
SG11202007629UA (en) * 2018-07-02 2020-09-29 Dolby Laboratories Licensing Corp Methods and devices for encoding and/or decoding immersive audio signals
US11081116B2 (en) * 2018-07-03 2021-08-03 Qualcomm Incorporated Embedding enhanced audio transports in backward compatible audio bitstreams
CN109448741B (zh) * 2018-11-22 2021-05-11 广州广晟数码技术有限公司 一种3d音频编码、解码方法及装置
EP3761654A1 (en) * 2019-07-04 2021-01-06 THEO Technologies Media streaming
KR102594160B1 (ko) * 2019-11-29 2023-10-26 한국전자통신연구원 필터뱅크를 이용한 오디오 신호 부호화/복호화 장치 및 방법
TWI772099B (zh) * 2020-09-23 2022-07-21 瑞鼎科技股份有限公司 應用於有機發光二極體顯示器之亮度補償方法
CN112422987B (zh) * 2020-10-26 2022-02-22 眸芯科技(上海)有限公司 适用于avc的熵解码硬件并行计算方法及应用
US11659330B2 (en) * 2021-04-13 2023-05-23 Spatialx Inc. Adaptive structured rendering of audio channels

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201007698A (en) * 2008-07-11 2010-02-16 Fraunhofer Ges Forschung Audio encoder and audio decoder
WO2010087614A2 (ko) * 2009-01-28 2010-08-05 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
TW201032218A (en) * 2009-01-28 2010-09-01 Fraunhofer Ges Forschung Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
EP2242048A2 (en) * 2008-01-09 2010-10-20 LG Electronics Inc. Method and apparatus for identifying frame type
WO2011010876A2 (ko) * 2009-07-24 2011-01-27 한국전자통신연구원 Mdct 프레임과 이종의 프레임 연결을 위한 윈도우 처리 방법 및 장치, 이를 이용한 부호화/복호화 장치 및 방법

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09146596A (ja) * 1995-11-21 1997-06-06 Japan Radio Co Ltd 音声信号合成方法
US6256487B1 (en) * 1998-09-01 2001-07-03 Telefonaktiebolaget Lm Ericsson (Publ) Multiple mode transmitter using multiple speech/channel coding modes wherein the coding mode is conveyed to the receiver with the transmitted signal
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
FI120125B (fi) * 2000-08-21 2009-06-30 Nokia Corp Kuvankoodaus
EP1430726A2 (en) * 2001-09-18 2004-06-23 Koninklijke Philips Electronics N.V. Video coding and decoding method, and corresponding signal
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
EP1427252A1 (en) * 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
EP1576602A4 (en) 2002-12-28 2008-05-28 Samsung Electronics Co Ltd METHOD AND DEVICE FOR MIXING AUDIO SEQUENCE AND INFORMATION RECORDING MEDIUM
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7684521B2 (en) * 2004-02-04 2010-03-23 Broadcom Corporation Apparatus and method for hybrid decoding
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US8131134B2 (en) * 2004-04-14 2012-03-06 Microsoft Corporation Digital media universal elementary stream
CA2566368A1 (en) * 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
DE102005014477A1 (de) 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
KR101271069B1 (ko) 2005-03-30 2013-06-04 돌비 인터네셔널 에이비 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
EP1905004A2 (en) * 2005-05-26 2008-04-02 LG Electronics Inc. Method of encoding and decoding an audio signal
WO2006126844A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988716B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7966190B2 (en) * 2005-07-11 2011-06-21 Lg Electronics Inc. Apparatus and method for processing an audio signal using linear prediction
RU2380767C2 (ru) 2005-09-14 2010-01-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
KR100851972B1 (ko) * 2005-10-12 2008-08-12 삼성전자주식회사 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치
CA2636330C (en) 2006-02-23 2012-05-29 Lg Electronics Inc. Method and apparatus for processing an audio signal
WO2008039038A1 (en) 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
WO2008046530A2 (en) 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
CN101197703B (zh) 2006-12-08 2011-05-04 华为技术有限公司 对Zigbee网络进行管理的方法及系统及设备
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
DE102007018484B4 (de) * 2007-03-20 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen
EP2137973B1 (en) * 2007-04-12 2019-05-01 InterDigital VC Holdings, Inc. Methods and apparatus for video usability information (vui) for scalable video coding (svc)
US7778839B2 (en) * 2007-04-27 2010-08-17 Sony Ericsson Mobile Communications Ab Method and apparatus for processing encoded audio data
KR20090004778A (ko) * 2007-07-05 2009-01-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR101461685B1 (ko) 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP4407610A1 (en) 2008-07-11 2024-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
CN102089814B (zh) * 2008-07-11 2012-11-21 弗劳恩霍夫应用研究促进协会 对编码的音频信号进行解码的设备和方法
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
KR101108060B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010053287A2 (en) * 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101751925B (zh) * 2008-12-10 2011-12-21 华为技术有限公司 一种语音解码方法及装置
WO2010090427A2 (ko) * 2009-02-03 2010-08-12 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR20100090962A (ko) * 2009-02-09 2010-08-18 주식회사 코아로직 멀티채널 오디오 디코더, 그 디코더를 포함한 송수신 장치 및 멀티채널 오디오 디코딩 방법
US8780999B2 (en) * 2009-06-12 2014-07-15 Qualcomm Incorporated Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems
US8411746B2 (en) * 2009-06-12 2013-04-02 Qualcomm Incorporated Multiview video coding over MPEG-2 systems
EP3764356A1 (en) 2009-06-23 2021-01-13 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2242048A2 (en) * 2008-01-09 2010-10-20 LG Electronics Inc. Method and apparatus for identifying frame type
TW201007698A (en) * 2008-07-11 2010-02-16 Fraunhofer Ges Forschung Audio encoder and audio decoder
WO2010087614A2 (ko) * 2009-01-28 2010-08-05 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
TW201032218A (en) * 2009-01-28 2010-09-01 Fraunhofer Ges Forschung Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
WO2011010876A2 (ko) * 2009-07-24 2011-01-27 한국전자통신연구원 Mdct 프레임과 이종의 프레임 연결을 위한 윈도우 처리 방법 및 장치, 이를 이용한 부호화/복호화 장치 및 방법

Also Published As

Publication number Publication date
BR112013023945A2 (pt) 2022-05-24
US20170270938A1 (en) 2017-09-21
KR20140018929A (ko) 2014-02-13
US9972331B2 (en) 2018-05-15
SG193525A1 (en) 2013-10-30
MX2013010537A (es) 2014-03-21
WO2012126866A1 (en) 2012-09-27
US9524722B2 (en) 2016-12-20
AU2012230440C1 (en) 2016-09-08
TWI488178B (zh) 2015-06-11
SG194199A1 (en) 2013-12-30
WO2012126891A1 (en) 2012-09-27
US9779737B2 (en) 2017-10-03
US10290306B2 (en) 2019-05-14
RU2013146528A (ru) 2015-04-27
TW201246190A (en) 2012-11-16
CN107342091A (zh) 2017-11-10
MY163427A (en) 2017-09-15
JP6007196B2 (ja) 2016-10-12
HK1245491A1 (zh) 2018-08-24
KR20140000337A (ko) 2014-01-02
CN103703511B (zh) 2017-08-22
KR20160058191A (ko) 2016-05-24
CN103703511A (zh) 2014-04-02
AR088777A1 (es) 2014-07-10
AU2012230440B2 (en) 2016-02-25
JP5820487B2 (ja) 2015-11-24
AU2012230440A1 (en) 2013-10-31
AU2016203416A1 (en) 2016-06-23
KR101748756B1 (ko) 2017-06-19
MX2013010536A (es) 2014-03-21
AU2012230442B2 (en) 2016-02-25
CN103620679A (zh) 2014-03-05
TW201303853A (zh) 2013-01-16
AU2016203419A1 (en) 2016-06-16
MY167957A (en) 2018-10-08
KR101767175B1 (ko) 2017-08-10
CN107342091B (zh) 2021-06-15
RU2589399C2 (ru) 2016-07-10
BR112013023949A2 (pt) 2017-06-27
AU2012230415B2 (en) 2015-10-29
JP2014512020A (ja) 2014-05-19
CA2830439C (en) 2016-10-04
CN103620679B (zh) 2017-07-04
KR20160056952A (ko) 2016-05-20
KR20140000336A (ko) 2014-01-02
CA2830631A1 (en) 2012-09-27
AU2012230415A1 (en) 2013-10-31
CA2830439A1 (en) 2012-09-27
KR20160056953A (ko) 2016-05-20
KR101712470B1 (ko) 2017-03-22
AU2012230442A8 (en) 2013-11-21
US20180233155A1 (en) 2018-08-16
KR101742136B1 (ko) 2017-05-31
CA2830631C (en) 2016-08-30
WO2012126893A1 (en) 2012-09-27
JP2014509754A (ja) 2014-04-21
EP2686849A1 (en) 2014-01-22
EP2686847A1 (en) 2014-01-22
US20140016787A1 (en) 2014-01-16
TW201243827A (en) 2012-11-01
CN103562994A (zh) 2014-02-05
CN107516532A (zh) 2017-12-26
RU2013146526A (ru) 2015-04-27
RU2013146530A (ru) 2015-04-27
KR101748760B1 (ko) 2017-06-19
AU2016203417B2 (en) 2017-04-27
JP2014510310A (ja) 2014-04-24
MX2013010535A (es) 2014-03-12
US9773503B2 (en) 2017-09-26
AU2016203416B2 (en) 2017-12-14
AR085445A1 (es) 2013-10-02
CA2830633A1 (en) 2012-09-27
KR101854300B1 (ko) 2018-05-03
AU2012230442A1 (en) 2013-10-31
AU2016203417A1 (en) 2016-06-23
TWI571863B (zh) 2017-02-21
CN103562994B (zh) 2016-08-17
KR101742135B1 (ko) 2017-05-31
CA2830633C (en) 2017-11-07
AR085446A1 (es) 2013-10-02
AU2016203419B2 (en) 2017-12-14
KR20160056328A (ko) 2016-05-19
US20140016785A1 (en) 2014-01-16
RU2571388C2 (ru) 2015-12-20
EP2686848A1 (en) 2014-01-22
US20140019146A1 (en) 2014-01-16
JP5805796B2 (ja) 2015-11-10
CN107516532B (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
TWI480860B (zh) 音訊編碼中之訊框元件長度傳輸技術
BR112013023945B1 (pt) Posicionamento do elemento de estrutura em estruturas de um fluxo contínuo de dados representando o conteúdo de áudio