TW201222530A - Apparatus and method for level estimation of coded audio frames in a bit stream domain - Google Patents

Apparatus and method for level estimation of coded audio frames in a bit stream domain Download PDF

Info

Publication number
TW201222530A
TW201222530A TW100136485A TW100136485A TW201222530A TW 201222530 A TW201222530 A TW 201222530A TW 100136485 A TW100136485 A TW 100136485A TW 100136485 A TW100136485 A TW 100136485A TW 201222530 A TW201222530 A TW 201222530A
Authority
TW
Taiwan
Prior art keywords
value
codebook
level
sequence
codeword group
Prior art date
Application number
TW100136485A
Other languages
English (en)
Other versions
TWI489449B (zh
Inventor
Manfred Lutzky
Ralf Geiger
Markus Schnell
Marco Diatschuk
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201222530A publication Critical patent/TW201222530A/zh
Application granted granted Critical
Publication of TWI489449B publication Critical patent/TWI489449B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

201222530 六、發明說明: 【發明所屬之技彳标領域】 本發明係有關於音訊處理及更明確言之,係有關於編 碼音ifUs號於位元串流定義域之位準估計之裝置及方法。 C先前椅;3 音訊處理就多方面而言已經進階且成為許多研究如何 有效地編碼與解碼音訊資料信號的主題。有效編碼例如係 由]\^^八八(:所提供(]^£0=動晝專家群;八八€=高階音訊 編碼)。 依據MPEG AAC,音訊信號的頻譜值係採用定標因 數、量化及碼薄編碼,更特別係霍夫曼碼薄。 在進行霍夫曼編碼前,編碼器將欲編碼至不同區段的 多個頻譜係數集結成群。針對縣係數之各個區段,^ 器選擇霍夫曼碼_於霍夫曼編碼。MPEG aac提供_ 不同頻譜霍夫曼碼_以編侧譜㈣,從該等碼薄中, 編碼㈣擇最適合絲編料區段的頻譜係數。編碼器提 =薄識別符,該碼薄識別符識別用來該區段的頻譜係數 之霍夫曼編碼的碼薄作為側邊資訊。 ’、 "、听則上,解石馬 =個頻譜霍夫曼碼薄中的哪—個業已用來編碼決定 »a值解碼器基於有關採用來編碼欲藉解 °°頻 段之頻譜係數之霍夫曼碼薄_«簡行的該區 在霍夫曼解碼後,在解石馬器獲得多個 又解码。 碼器然後進行反量化來將已經藉編碼器進行的:::二: 3 201222530 反相。藉此方式,在解碼器獲得反量化頻譜值。 但反量化頻譜值仍然可能未經定標。導出的未經定標 頻譜值已經集結成定標因數帶,各個定標因數帶有個共^ 定標因數。針對各個定標因數帶的定標因數係可由解碼^ 利用作為編碼11所提供的側邊資訊。運用此項資訊,解碼 器將定標因數帶的未經定標頻譜值乘以其定標因數。藉此 方式獲得定標頻譜值。 現在參考第7至1〇圖解說依據技藝界現況對頻譜值之 編碼及解碼。 第7圖例示說明依據技藝界現況之編碼器。該編碼器包 含T/F濾波器排組71〇 ’該排組用以將應經編碼的音訊信號 AS從時域變換至頻域來獲得頻域音訊信號。頻域音訊信號 饋入定標因數單元720用以決定定標因數。定標因數單元 720係適用於將頻域音訊信號的頻譜係數劃分成共享―個 定標因數之數組頻譜係數,稱作定標因數帶。定標因數表 示用來變更在個別定標因數帶中全部頻譜係數振幅之—增 益值。此外,定標因數單元720適用於產生及輸出頻域音訊 信號之未經定標頻譜係數。 又復,第7圖之編碼器用來量化該頻域音訊信號之未經 定標頻譜係數之量化器。量化器730可以是非一致量化号。 量化後,經量化的音訊信號之未經定標頻譜係镇入霍 夫曼編碼器740用以接受霍夫曼編碼。霍夫曼編碼係用來、咸 少音訊信號之量化頻譜的冗餘。多個未經定標之量化頻谱 係數集結成區段。雖然於MPEG-AAC提供11個可能的石馬 201222530 簿,但一個區段之全部頻譜係數係藉相同霍夫曼碼簿編碼。 編碼器將選出11個可能霍夫曼碼簿中之一者,該碼薄 係特別適合用來編碼該區段之頻譜係數。藉此方式,針對 一特定區段編碼器之霍夫曼碼薄的選擇係取決於該特定區 段之頻譜值。然後該霍夫曼編碼頻譜係數可連同側邊資訊 發射至解碼器,該侧邊資訊例如包含曾經用來編碼一頻譜 係數區段的霍夫曼碼薄、曾經用於特定定標因數帶之定標 因數等的相關資訊。 二或四個頻譜係數係藉採用來霍夫曼編碼該區段之頻 譜係數的霍夫曼碼薄之一碼字組編碼。編碼器連同下列資 訊發射表示該編碼頻譜係數之碼字組給解碼器,該等資訊 包括包含'一區段長度之側邊貢訊,以及有關用以編碼該區 段之頻譜係數的霍夫曼碼薄資訊。 於MPEG AAC中,提供11個頻譜霍夫曼碼薄用來編碼 該音訊信號之頻譜資料。不同頻譜霍夫曼碼薄可藉其碼薄 指數(1至11間之值)加以識別。霍夫曼碼薄維度指示多少個 頻譜係數係藉所考慮的霍夫曼碼薄之碼字組編碼。於Μ P E G AAC中,霍夫曼碼薄的大小為2或4,指示碼字組編碼二或 四個音訊信號之頻譜值。 但不同霍夫曼碼薄有關其它性質也有別。舉例言之, 可由霍夫曼碼薄編碼之頻譜係數最大絕對值係依碼薄而 異,且可以是例如1、2、4、7、12或以上。此外,所考慮 的霍夫曼碼薄可適用來編碼有符號值與否。. 採用霍夫曼編碼,頻譜係數係藉不等長度的碼字組編 201222530 碼。MPEGAAC提供具有最大絕軸的兩個不同霍夫曼碼 薄,具有最大絕對值2的兩個不同霍夫曼碼薄,具有最大絕 對值4的兩個不同霍夫曼碼薄,具有最大絕對值7的兩個不 同霍夫曼碼薄,及具有最大絕對值12的兩個不同霍夫曼碼 薄,其中各個霍夫曼碼薄表示分開的機率分布函數。霍夫 曼編碼器將經常性地選擇最佳匹配來編碼頻譜係數的霍夫 曼碼薄。 第8圖例示說明依據技藝界現況之解碼器。霍夫曼編碼 頻譜值係由霍夫曼解碼器75G接收。霍夫曼解碼器75〇也接 收針對各區段頻譜值,絲編碼頻譜值之有關霍夫曼碼薄 資訊作為側邊資訊。然後霍夫曼解碼器75〇執行霍夫曼解碼 來獲得未經定標的量化頻譜值。該未經定標的量化頻譜值 係饋入反量化器760。該反量化器執行反量化來獲得經反量 化之未經定標的頻譜值,該值饋入定標器77〇。定標器77〇 也接收定標因數作為各個定標因數帶之側邊資訊。基於所 接收的定標因數,定標器770將該未經定標的經反量化之頻 谱值定標而獲得該經定標的經反量化之頻譜值。然後ργτ、虎 波器排組780將該頻域音訊信號之經定標的經反量化頻级 值從頻域變換至時域來獲得時域音訊信號之樣本值。 第9圖例示說明依據技藝界現況之編碼器,該編碼器與 第7圖編碼器之差異在於第9圖編碼器更進一步包含編碑器 端TNS單元(TNS=時間性雜訊整形)。時間性雜訊整形可採 用來就該音訊信號之頻譜資料部分進行濾波處理而控制量 化雜訊之時間性形狀。編碼器端TNS單元715決定就欲編瑪 201222530 的頻域音訊信號之頻譜係數,進行線性預測編碼(LPC)計 算。從LPC計算所得者包括反射係數,又稱PARCOR係數。 若也藉LPC計算而導出的預測增益係不超過某個臨界值, 則不使用時間性雜訊整形。但若預測增益係大於該臨界 值’則使用時間性雜訊整形。編瑪器端TNS單元去除小於 某個臨界值之全部反射係數。其餘反射係數係轉換成線性 預測係數且係用在編碼器作為雜訊整形濾波係數。然後編 碼器端TNS單元針對該等頻譜係數執行濾波操作,對此採 用TNS來獲得音訊信號之經處理的頻譜係數。指示丁資★凡 之側邊資訊例如反射係數(PARCOR係數)係發射至解碼器。 第10圖例示說明依據技藝界現況之解碼器,該解碼器 與第8圖例示說明之解碼器差異在於第10圖之解碼器額外 包含解碼器端TNS單元775。解碼器端TNS單元接收音訊作 號之反量化定標頻譜,及也接收TNS資訊,例如指示反射 係數(PARCOR係數)的資訊。解碼器端TNS單元775處理音 訊h號之反量化頻譜來獲得音訊信號之經處理的反量化頻 譜。 針對多項應用’要緊地須測定或估計編碼音訊信號之 位準例如能、振幅、或響度。此點對電傳會議系統特別為 真。由在不同位置所在的數個參與者所進行的電傳會儀( 藉多點控制單元(MOJ)掌控。其目的係、為了混合多個輸^ 及輸出_流,此處該音訊資料係呈示於編碼格式。 依據技藝界現況,全部輸入串流係在MCu解碼,然1 音訊資料進一步分析來識別混合至輸出串流的最主要串 201222530 流。如此表示依據技藝界現況,全部輸入串流係經霍夫曼 解碼、反量化、及定標用於隨後進一步分析輸入串流而識 別最主要串流,例如具最高位準例如具最大能的串流。估 計一個定標因數帶之位準例如能的技藝界現況辦法係針對 全部頻譜值進行霍夫曼解碼及反量化,及藉加總全部反量 化頻譜值平方而計算能。 【發明内容】 本發明之目的係提供針對編碼音訊信號之位準估計提 供改良構思。本發明之目的係係藉如申請專利範圍第1項之 裝置、如申請專利範圍第12項之方法、如申請專利範圍第 14項之方法、及如申請專利範圍第15項之電腦程式解決。 提出一種用於編碼音訊信號之位準估計之裝置。該裝 置係包含碼薄決定器用以從多個碼薄中決定碼薄作為經識 別碼簿,其中該音訊信號已經藉採用該經識別碼薄編碼。 該裝置係更進一步包含估計單元係經組配來用以導算出與 該經識別碼薄聯結之位準值作為導出位準值。又復,該估 計單元係適用以使用該導出位準值估計該音訊信號之位準 估值。 於一實施例中,該導出位準值可以是導出能值,及該 用於位準估計的裝置可適用於進行能估計作為位準估計。 於另一實施例中,該導出位準值可以是導出振幅值,及該 用於位準估計的裝置可適用於進行振幅估計作為位準估 計。於又一實施例中,該導出位準值可以是導出響度值, 及該用於位準估計的裝置可適用於進行響度估計作為位準 201222530 估計。 本發明係植基於發現為了減低全部解碼步驟的複雜 度,例如能、振幅或響度等位準可從位元串流參數直接估 計用來識別最主要串流。位準估計例如能估計、振幅估計 或響度估計可植基於位元串流資訊,例如位元串流成分例 如霍夫曼碼薄、定標因數、及例如TNS濾波係數。此等位 元串流成分可用來估計依據AAC-ELD串流之位準 (AAC-ELD ;高階音訊編碼-力口強低延遲)。如此,依據本發 明並非必要完全解碼音訊位元串流,反而係藉基於決定已 經採用來編碼音訊信號之碼簿而提供位準估計,係藉導出 與該經識別之碼薄聯結之位準值,及藉使用該位準值估計 該音訊信號之位準估值。 於一實施例中,估計單元包含定標單元。該定標單元 係適用於導算出與該編碼音訊信號或該編碼音訊信號之一 部分有關的定標因數作為導出定標因數。該定標單元係適 用於基於該定標因數及該導出位準值而獲得定標位準值, 例如定標能、振幅、或響度值。此外,該估計單元係適用 於使用該定標位準值而估計該音訊信號之位準估值。。依 據此一實施例,該位準估值係基於有關已經用來編碼該音 訊信號之資訊提供,亦即與該經識別之碼薄及定標因數聯 結之位準值。 於一實施例中,該導出位準值為能值,及該定標單元 係適用於將該導出定標因數施加至該導出能值,而藉將該 導出能值乘以該導出定標因數的平方而獲得定標位準值。 201222530 藉此方式’以定標因數施加至依據MPEG-2 AAC的解石馬器 中未經定標經反量化頻譜係數的相似方式,導出的定標因 數係施加在導出能上,但無需解碼頻譜係數。 於另一實施例中,導出能值為振幅值,及該定標單元 係適用於將該導出定標因數施加至該導出振幅值而藉將該 導出振幅值乘以該導出定標因數來獲得定標位準值。 〇於又一實施例中,該導出位準值為響度值,及該定標 單元係適用於將該導出定標因數變換至導出響度值,藉將 該導出響度值乘以導出定標因數之立方而獲得定標響声 ^。t在有替代之道㈣㈣度,諸如藉減%計算β Γ 域當導出位準值為響度值時,定標因數須變換為響 於另一實施例中,估計單元係 值作為導出位準值來估心〜 I使用特讀準 該估計單日則§狀位準純。如此, 位準估算_特別經組配來基於特賴別的位準值而進行 導出能值, 及該估計單 元係經組 於一實施例中,導出位準值為 作為該音訊二=碼薄位準值作為碼薄能值而估計能估值 碼薄的全部二碼簿能值係以該經識別 均機率加權和奸-率力㈣能和值中之和。各個平 和值對與該碼薄聯:趣識別碼薄之碼字組之機率加權能 指示該經識別碼薄之個機率加權能和值 該經識別巧笼 一、碼字組之—能和值乘以與 4之㈣考慮的碼字組聯結之1率值之^ 10 201222530 積。各個能和值指示經識別碼薄的碼字組一序列能值之數 值。各序列能值指示針對該碼薄之各個碼字組,針對一碼 字組之一序列數值的一序列反量化數值中之各值之一平方 值。各序列數值為藉該碼薄之一碼字組編碼的一序列數值。 於又一實施例中,該估計單元進一步包含位準值導出 器。該位準值導出器係適用於藉詢查在一記憶體中與該經 識別之碼薄聯結的該位準值而導出該導出位準值。於又一 實施例中,該位準值導出器係適用於從一本地資料庫請求 與該經識別之碼薄聯結之該位準值。於又另一實施例中, 該位準值導出器係適用於從一遠端電腦請求與該經識別之 碼薄聯結之該位準值。 於另一實施例中,該裝置進一步包含一記憶體或一資 料庫,其中業已儲存多個碼薄位準記憶體值,該等值指示 一位準值係與一碼薄聯結,其中該等多個碼薄各自具有與 其聯結之一碼薄位準記憶體值儲存在該記憶體或資料庫。 該位準值導出器係經組配來藉從該記憶體或從該資料庫導 出與該經識別之碼薄聯結之一碼薄位準記憶體值而導出與 該經識別之碼薄聯結之該位準值作為該位準值。 於一實施例中,該記憶體或資料庫已經於其中儲存多 個碼薄能記憶體值作為碼薄位準記憶體值,其中各個碼薄 能記憶體值指示該經識別碼薄之全部碼字組的平均機率加 權能和值的和。各個能和值指示該經識別碼薄之一碼字組 的一序列能值數值。此外,各序列能值指示針對該碼薄之 各個碼字組,一碼字組的一序列能值之一序列反量化數值 201222530 中各值的平方值。各序列此值為由該碼薄之一碼字組所儲 存的一序列數值。本實施例提出記憶體或資料庫,已經於 其中儲存聯結特定碼薄之多個碼薄能記憶體值,其中該所 儲存的碼薄能記憶體值具有特別適合用於能估計之特殊性 質。 於另一實施例中,該記憶體或資料庫已經於其中儲存 多個振幅值作為碼簿記憶體位準值。於又一實施例中,該 記憶體或資料庫已經於其中儲存多個響度值作為瑪薄記憶 體位準值》 一 於另-實施例中,該估計單元進一步包含預測渡波器 調整器。該預職波器難器係適祕導出與該編碼音訊 信號或該編碼音訊信號之—部分有關的—或多個預_波 器係數作為導出預職波器係數。又復,耗職波器調 整器係適用於基於該預職波器係數及料出位準值而獲 得預測滤波||難位準值。此外,該料單元係適用於使 用該預測it波H調整位準值而估計該音訊信號之位準估 值。 依據另一 ™,提出-種針對一電傳會議系統的多 個參與者產生背向資料串流之裝置。該裝置包含用以接收 多個參與者資料$流包含來自該等多個參與者之音訊信號 的接收器介面。此外,制以產生背向資料串流之裝置包 ㈣财之-者—音訊«之位準估計 的裝置。祕準估料置係配置用以針對各個 串流進行位料㈣完全軸
12 201222530 以產生背向資料串流之裝置包含決定器,該決定器係用來 基於該位準估計,判定參與者資料串流是否將含括於該背 向資料串流。此外,該用以產生背向資料串流之裝置包含 混合器,該混合器係用以只混合欲含括於該背向資料串流 的該參與者資料串流及不含括決定為不含括的該參與者資 料串流。該用以產生背向資料串流之裝置係經組配來不會 完全解碼判定為不含括於該背向資料串流的參與者資料串 流。於一實施例中,該決定器係適用於當所考慮參與者資 料串流之位準估計係低於臨界值時,決定該所考慮參與者 資料串流係不含括於該背向資料串流。於又一實施例中, 該決定器係適用於決定唯有含括於該背向資料串流之資料 串流為有關特定定標因數帶,具有全部參與者資料率流之 位準估計中的最高位準估計之該資料串流。 依據一實施例,提出一種產生聯結碼薄之位準值之方 法。該方法包含:針對該碼薄之各個碼字組,決定與該碼 薄之一碼字組聯結的一序列數值。針對該碼薄之各個碼字 組,藉施加一反量化器至一碼字組的該序列數值之該等數 值,而對該碼薄之各個碼字組決定一反量化數值序列。針 對該碼薄之各個碼字組,藉求取一碼字組之反量化數值序 列中之各值平方而對該碼簿之各個碼字組計算一序列位準 值。藉針對該碼薄之各個碼字組加總該序列位準值,計算 針對該碼薄之各個碼字組之一位準和值。針對該碼薄之各 個碼字組,藉將一碼字組之該位準和值乘以與該碼字組聯 結之一機率值而決定該碼薄之各個碼字組之一機率加權位 13 201222530 準和值。針對_薄之各個碼字組,藉將―碼字組之機率 加權位準和值除以與該碼薄騎之—維度值而決定該碼薄 之各個碼Μ之-平均機率加權位準和值,及藉加總全部 碼字組之平均機率加權位準和值而計算該碼薄之位準值。 圖式簡單說明 參考附圖解釋較佳實施例,附圖令 第1圖顯示依據一實施例用於位準估計之裝置, 第2圖顯示依據一實施例之估計單元, 第3圖顯示依據另一實施例之估計單元, 第4a及4b圖顯示用以產生位準值之方法, 第5圖顯示依據又一實施例之估計單元,包含預測濾波 器調整器, 第6圖顯示用以產生背向資料串流之裝置, 第7圖顯示依據技藝界現況之編碼器, 第8圖顯示依據技藝界現況之解碼器, 第9圖顯示依據技藝界現況之另一編碼器,及 第10圖顯示依據技藝界現況之又一解碼器。 C實施方式3 第1圖例示說明依據一實施例之裂置。該裝置包含碼薄 決定器110及估計單元120。碼簿決定器no係適用於從多個 碼薄中決定一個碼薄來作為經識別之碼薄,其中該音訊信 號已經藉採用經識別之碼簿而編碼。估計單元120係適用於 導出與該經識別之碼薄聯結之位準值諸如能值、振幅值或 響度值作為導出位準值。此外,估計單元120係適用於使用 14 δ 201222530 所導出的位準值而估計音訊信號之位準估m,例如能估 值、振幅估值或響度估值。舉例言之,碼薄決定器ιι〇可藉 接收連同該編瑪音訊信號—起發射的側邊f訊而決定碼 薄,該碼薄已經由編碼器用來編碼音訊信號。更明確言之, 側邊資訊可包含用以編碼所考慮之該音訊信號區段的碼薄 之識別育訊。此種資訊例如可從編碼器發射至解碼器作為 識別用於編碼所考慮之該音訊信號區段的霍夫曼碼薄的數 字。 第2圖例示說明依據一實施例之估計單元。該估計單元 包含位準值導出器210及定標單元22〇。該位準值導出器係 適用於藉詢查於記㈣的位準值,藉從本地資料庫請求位 準值,或藉從遠端電腦請求與該經識別之碼薄聯結之該位 準值而導出與該經識別之碼薄聯結之位準值,亦即用來藉 編碼器編碼頻譜資料之碼薄。於一實施例中,由位準值導 出器詢查或請求的位準值可以是平均位準值,該平均位準 值指示藉使用經識別之碼薄而編碼之經編碼未經定標頻譜 值之平均位準。 藉此方式,導出位準值係非從實際頻譜值求出,反而 係使用只取決於所採用的碼薄之平均位準值。如前文解 釋’編石馬器通常係適用於從多個碼簿中選出最佳匹配來編 碼音汛信號之一區段的個別頻譜資料之該碼薄。例如就可 編碼的最大絕對值而言,因碼薄不同,故藉霍夫曼碼薄所 編碼的平均值因碼薄而異,及因此,藉特定碼薄編碍的編 碼頻错係、數之平均位準值因碼薄而異。 15 201222530 如此,依據一實施例,採用特定霍夫曼碼薄用以編碼 音訊信號之頻譜係數的平均位準值可針對各個霍夫曼碼簿 決定,且例如可儲存在記憶體、資料庫或遠端電腦。然後 位準值導出器單純只須詢查或請求已經採用來編碼頻譜資 料的與該經識別之碼薄聯結之該位準值,來獲得與該經識 別之碼薄聯結之該導出位準值。 但須考慮霍夫曼碼薄經常運用來編碼未經定標的頻譜 值,如同MPEG AAC之情況。但然後當進行位準估計時, 須將定標列入考慮。因此,第2圖之估計單元也包含定標單 元220。定標單元係適用於導算出與該編碼音訊信號或該編 碼音訊信號之一部分有關的定標因數作為導出定標因數。 舉例言之,至於解碼器,定標單元220將針對各個定標因數 帶決定一定標因數。舉例言之,藉接收從編碼器發射至解 碼器的側邊資訊,定標單元220可接收有關定標因數帶之定 標因數的資訊。又復,定標單元220係適用於基於定標因數 及導出位準值而決定定標位準值。 於一實施例中,此處導出位準值為導出能值,定標單 元係適用於施加定標因數於導出能值,藉將導出能值乘以 導出定標因數之平方而獲得定標位準值。 於另一實施例中,此處導出位準值為導出振幅值,定 標單元係適用於施加定標因數於導出振幅值,藉將導出振 幅值乘以導出定標因數而獲得定標位準值。 於又一實施例中,此處導出位準值為導出響度值,定 標單元(220)係適用於施加定標因數於導出響度值,藉將導
16 201222530
出響度值乘以導出定標因數的立方而獲得定襟位準值。存 在有其它辦法來計算響度,諸如藉指數3/2。—加I 为又而言,當 導出位準值為響度值時,定標因數必須變換至響度定義域。 此等實施例考慮能值係基於音訊信號之頰譜係數的平 方測定,振幅值係基於音訊信號之頻譜係數的絕對值測 定,及響度值係基於已經變換至響度定義域的音訊俨號之 頻譜係數測定。 °~ 口丨千几你題用於便用足標位準值來估計立1疒。虎之 位準估值。於第2圖之實施例中’估計單元係適用於輸出°定 標位準值作為位準估值。於此種情況下,未進行^^ 值之後處理。但如於第3圖之實施例中例示說 :沖一
墨 ^ ΊαΓ aT 也可係適用於進行後處理。因此,第3圖之 ^ 叶單元包含後 處理器23G用以後處理_或多個定標位準值用來 估值。藉測定多個定標位準值之平均 ' %叶早元之位準 估值可藉後處理器230測定。此一平均值可由 作為位準估值。 τ早兀鞠出 與所呈示之實施例相反,估 的技藝界現況_十對全部頻譜值:::= 量化/藉加總全部反量化__平 但於所提示之實施例中,此種計复卜值 況處理程料由平均料純 技藝# ^ 奐,5亥估值只取決於定 ‘因數及碼减用而不依實際量化值決定。 本發明之實施例採用下述事 來遵照專用統計學喊供最佳編碼鱗係經設計 如此表示碼薄已經依 17 201222530 據資料之機率設計,例如AAC-ELD (AAC-ELD ;高階音訊 編碼-加強低延遲):頻譜線。此一處理程序可經顛倒來獲得 依據該碼薄之資料機率。在碼薄内部之各個資料分錄(指數) 之機率係藉碼字組長度給定。舉例言之, p(指數)=2Λ-長度(碼字組) 亦即 Ρ(指數)=2·*度(碼字組) 其中Ρ(指數)為碼簿内部之資料分錄(指數)之機率。 植基於此,預期位準可以下述方式預先計算及儲存: 各個指數表示一序列整數值(X),例如頻譜線,此處該序列 長度係取決於碼薄維度,例如針對AAC-ELD為2或4。 第4a及4b圖例示說明依據一實施例,一種用以產生與 一碼薄聯結之位準值,例如能值、振幅值或響度值之方法。 該方法包含: 針對該碼薄之各個碼字組,決定與一碼薄之碼字組聯 結的一序列數值(步驟410)。如前文已經解說,碼簿藉該碼 薄之碼字組編碼一序列數值,例如2或4數值。該碼薄包含 多個碼薄來編碼多序列數值。所決定之該序列數值為藉所 考慮之該碼薄之碼字組編碼之該序列數值。步驟410係針對 碼薄之各個碼字組進行。舉例言之,若碼薄包含81碼字組, 則於步驟410決定81數值序列。 於步驟420,針對該碼薄之各個碼字組,藉施加反量化 器至該數值序列的數值而針對該碼薄之各個碼字組決定反 量化數值序列。如前文已經解釋,當編碼音訊信號之頻譜
18 201222530 值時,編碼器通常採用量化,例如非線性量化。結果,此 種量化須在解碼器反相。 隨後,於步驟430,針對該碼薄之各個碼字組決定一序 列位準值。 若欲產生能值作為碼薄位準值,則針對各個碼字組決 定一序列能值,及針對該碼簿之各個碼字組,計算反量化 數值序列的各值平方。 但若欲產生振幅值作為碼簿位準值,則針對各個碼字 組決定一序列振幅值,及針對該碼薄之各個碼字組,計算 反量化數值序列的各值絕對值。 但若欲產生響度值作為碼薄位準值,則針對各個碼字 組決定一序列響度值,及針對該碼薄之各個碼字組,計算 反量化數值序列的各值立方。存在有替代之道來計算響 度,諸如藉指數3/2計算。一般而言,當產生響度值作為碼 薄位準值時,反量化數值序列之值須變換為響度定義域。 隨後,於步驟440,針對該碼薄之各個碼字組,係藉加 總該數值序列之各值而求出針對該碼薄之各個碼字組的位 準和值。 然後,於步驟450,針對該碼薄之各個碼字組,藉將一 碼字組的位準和值乘以與該碼字組聯結之機率值,決定針 對該碼薄之各個碼字組的機率加權位準和值。藉此方式, 考慮該數值序列中之部分例如頻譜係數序列將不如其它頻 譜係數序列般頻仍出現。與該碼字組聯結之機率值將此點 列入考慮。當採用霍夫曼編碼時,此種機率值可從碼字組 19 201222530 長度導出,原因在於較可能出現的碼字組係藉使用具有較 短長度的碼字組編碼,而其它較不可能出現的碼字組將藉 使用具有較長長度的碼字組編碼。 於步驟460’針對該碼薄之各個碼字組,藉將一碼字組 的機率加權位準和值除以與該碼字組聯結之維度值,將決 定針對該碼薄之各個碼字組的平均機率加權位準和值。維 度值指不藉該碼薄之一碼字組編碼的頻譜值數字。藉此方 式’決定平均_加權料和值’該值表示針對藉該碼字 組編碼之頻譜係數的位準值(機率加權)。 然後,於步驟470’藉加總全部碼字組的平均機率加權 位準和值而求出該碼薄之位準值。 須注意此種位準值的產生確實只須對碼薄進行一次。 若決定簡之位準值,職值單純_查且例如依據前述 實施例藉裝置用於位準估計。 後文中,呈不依據-實施例用以產生與該碼薄聯結之 此值之方法。為了估計以給定碼薄編碼之資料的預期能 值,針對碼簿之各個指數,下列步驟只須進行一次: A)施加反量化器至該序列之整數值(例如aac eld : χΛ(4/3)) Β)藉計算Α)序列各值的平方求得能 C) 建立B)序列之和 D) C)乘以該指數之給定機率 E) 除以碼簿維度來獲得每一頻譜線之預期能 最後’藉E)求出的全部值須經加總來獲得完整碼薄之
20 201222530 預期能。 此等步驟之輸出儲存於表中後,單純基於碼薄指數, 亦即取決於使用哪個碼薄,可詢查估計能值。針對此—估 計,實際頻譜值無須為霍夫曼解碼。 了估ΛΛ框的頻譜資料之總能,須考慮定 標因數。科鮮量_度,定標隨可跡自位元串流。 在β力至預期⑭之别,疋標因數可經修改,例如可算出所 使用的定標隨平方。__能乘以所使用較標因數 平方。 依據則述實&例’可估計針對各個定標因數帶之頻譜 位準而未解碼霍夫曼編賴譜值。該位準雜可用來識別 ”有低位準’例如具低功率之串流,其係與隨後混合程序 無關。因此可避免此等串流的完整解碼。 依據一貫施例,一種用於位準估計之裝置進一步包含 記憶體或資料庫’其中儲存多個碼薄位準記顏值,指示 與一碼薄聯結之位準值,其中多個碼料之各者具有聯結 的碼薄位準記憶體值儲存在記憶體或資料庫。此外,位準 值導出器係經組配來用以藉從記憶體或從資料庫導出與經 識別之碼薄聯結之碼薄位準記憶體值而導出與經識別之碼 薄聯結之位準值。 若進一步處理步驟作為預測,諸如預測濾波係施加於 編解碼器,例如用於AAC-ELD TNS(時間性雜訊整形)濾 波’則可改變依據前述實施例估計之位準。此處,預測係 數係在位元串流内部傳輸,例如針對TNS用作為parc〇r 21 201222530 係數。 第5圖例示說明一實施例,其中該估計單元進一步包含 預測濾波器調整器240。該預測濾波器調整器係適用於導出 與編碼音訊信號或編碼音訊信號之一部分有關的一或多個 預測濾波係數。該預測濾波器調整器係適用於基於預測遽 波係數及導出位準值而獲得預測濾波器調整位準值。此 外,估計單元係適用於使用該預測濾波器調整位準值而估 計該音訊信號之位準估值。 於一實施例中’TNS之PARCOR係數係用作為預測漶波 器係數。濾波處理之預測增益可以極為有效方式而從該等 係數決定。有關TNS,預測增益可依下式計算:增益 = l/prod(l-parcorA2)。 舉例言之,若考慮三個PARCOR係數例如parcor,、 parcor2、及parcor3 ’增益係依下式計算: 增益=γτ--!-rnr-Λ 1^1 - parcor, j (I - parcor22 J (l - parcor32 j 至於n個PARCOR係數例如parcori、parcor〗、…及 parcorn,適用下式: 增益 ‘—— _】 ' , 曰 v * Parcor,2 j(l - parcor22)...(l - parcorn2) 如此表示可估計通過濾波的音訊信號的放大而未施加 濾波操作本身。 依據前述實施例中之一者,位準估計裝置可採用於電 傳會議系統’例如用於多點控制單元(MCU)。
22 201222530 二示說明依據一實施例,用以針對電傳會議系統 中的多個參與者產生背向資料串流之裝置。料置包含接 收器介面6_以接收多個參與者資料串流心p2、卜 參與者資料串流ρι、ρ2、·..ρη包含來自多個參L的Γ訊 Ϊ:=’用:產生背向資料串流之裝置包含依據前述 貫域中之—者用於編碼音訊信號的位準估計之裝置 620’其巾祕位準輯u置咖係配置來對各個來轉 資料串流進行位準估計,而未完全解碼㈣串^如第_ 例不㈣’用於位準估計之裝置接收音訊資料串流pl、 Ρ2、···Ρη’及針對包含音訊信號的所接收之音訊資料串流 Pi、Ρ2、...ρη各自進行位準估計。裳置62〇輸送 串流 Pl、P2、...K___ee,、ee2、ee^3 630。決定器_係適用於基於各個參與者資料串流的位準 估計,蚊參與者資料争流是否將含括於背向資料串流。 依據特定資料串流ρΐ、ρ2、···ρη是否含括於背向 決定器530然後遞送決定deCl、deC2、…^給各參與者^料 串流之混合器64G。混合器64〇也係適用於接收參與者資料 串流pi、p2、...pn。基於決定deCi、如2、』%,混合器 640只混合欲含括於背向資料串流的參與者資料串流,而不 包括決定不含括的參與者資料串流。 用以產生背向資料串流之裝置係經組配來不完整解碼 不欲含括於背向資料串流的參與者資料串流。 於一實施例中,決定器630係適用於當所考慮之參與者 資料串流的位準估計係低於臨界值時,決定該所考慮之參 23 201222530 與者資料串流係不含括於背向資料串流。 於一實施例中,用以產生背向資料串流之裝置係適用 於以逐一訊框為基礎,決定參與者資料_流是否欲含括於 背向資料_流,例如針對各個音訊訊框,決定該參與者資 料串流的整個音訊訊框是否將含括於背向資料串流。 於另一實施例中,用以產生背向資料串流之裝置係適 用於以定標因數帶為基礎,決定參與者資料串流是否欲含 括於背向資料申流,例如針對音訊訊框之不同定標因數 帶,決定定標因數帶是否含括於背向資料串流的決策可以 不同。 於又一實施例中,決定器630係適用於決定唯有含括於 該背向資料串流之資料串流為有關一特定定標因數帶,具 有全部參與者資料串流之位準估計中的最高位準估計之該 資料串流。 於另一實施例中,決定器630係適用於決定含括於該背 向資料串流之唯二資料串流為有關一特定定標因數帶,具 有全部參與者資料串流之位準估計中的兩個最高位準估計 之該資料串流。 於又一實施例中,第6圖中用於位準估計之裝置620並 非針對音訊信號各者估計位準估值的單一位準估計裝置, 反而裝置620包含多數η個用於位準估計之裝置,各個用於 位準估計之裝置針對η個音訊信號串流中之一者提供位準 估值。 用於位準估計之裝置也可應用於多個其它裝置。於一 24 201222530 實施例中,提供用於緩衝器管理之裝置。該用於緩衝器管 理之裝置包含用以存取一緩衝器之緩衝器音訊資料作為存 取緩衝器音訊資料之一緩衝器存取單元,其中該緩衝器音 訊資料包含一編碼音訊信號。此外,該用於緩衝器管理之 裝置包含依據前述實施例中之一者用於編碼音訊信號之位 準估計之裝置。又復,該用於緩衝器管理之裝置包含一決 定器用以基於該編碼音訊信號之位準估計,決定該存取緩 衝器音訊資料係將從該緩衝器刪除與否。 此種用於緩衝器管理之裝置係特別適合用於管理抖動 緩衝器,例如採用於VoIP(透過網際網路協定之語音)者。依 據一實施例,用於緩衝器管理之裝置係適用於將重要音訊 訊框維持於緩衝器,及當緩衝器係在存在有緩衝器過度運 轉狀態風險時,係適用於從該緩衝器刪除較不重要的訊 框。舉例言之,緩衝器的整個音訊資料内容可經檢驗,及 基於位準估計,用於緩衝器管理之裝置決定音訊資料内容 (緩衝器音訊資料)是否欲從該緩衝器删除。 於一實施例中,用以儲存輸入資料之裝置係適用於以 逐一訊框為基礎,決定音訊資料係將被儲存或捨棄,例如 針對各個音訊訊框,決定整個音訊訊框係將被儲存或捨棄。 雖然已經於裝置脈絡描述若干構面,但顯然此等構面 也表示相對應方法之描述,此處區塊或裝置係相對應於方 法步驟或方法步驟的特徵結構。同理,描述於方法步驟脈 絡的構面也表示相對應裝置之相對應方塊或項目或特徵結 構之描述。 25 201222530 取決於某些體現要求’本發明之實施例可在硬體或軟 體中體現。體現可運用具有可電子式讀取控制信號儲存於 其上且與可規劃電腦系統協作(或可協作)來執行個別方法 的數位儲存媒體執行,例如軟碟、DVD、CD、ROM、PROM、 EPROM、EEPROM或快閃記憶體。 依據本發明之若干實施例包含具有可電子式讀取控制 信號之非暫時性資料載體,該載體可與可規劃電腦系統協 作來執亍此處所述方法中之_者。 一般而言’本發明之實施例可體現為一種具有程式代 碼的電腦程式產品,當該電腦程式產品係在電腦上跑時, 5亥程式代碼可操作用以執行該等方法中之一者。程式代碼 例如可儲存在機器可讀取載體上。 其它實施例包含儲存在機器可讀取載體上用以執行此 處所述方法中之一者的電腦裎式。 換言之’因此本發明方法之實施例為具有程式代碼的 電腦程式’當該電腦程式係在電腦上跑時該程式代碼可用 以執行此處所述方法中之一者。 因此本發明方法之又一實施例為資料載體(或數位儲 存媒體’或電腦可讀取媒體)包含用以執行此處所述方法中 之一者的電腦程式。 因此本發明方法之又一實施例為資料串流或一序列信 號’表示用以執行此處所述方法中之一者的電腦程式。該 資料串流或信號序列例如可經組配來透過資料通訊連結, 例如透過網際網路轉移。
26 201222530 又—實施例包含處理穿署 置,其係經組配來或係適心執例如電腦或可規劃邏輯裝 、執仃此處所述方法中之一者。 二:施例包含電腦’該電腦上安裝有用以執行此處 所述方法中之一者的電腦程式。 陣列二干實知例巾可規劃邏輯裝置(例如可現場規劃閘 實喊輯方料部料全部魏。於若干 ::二可T劃閘陣列可與微電腦協定來執行此處 2方法中之-者。通常該等方法較佳係藉任何硬體裝置 2實補僅供舉例制本發明之原理。須瞭解此處 相置及細節的修改與變化為熟諳技藝人士顯秋易知。 :此意圖只受審查中之申請專利範圍之範圍所限:、而非受 藉描述與解說此處實施制呈示㈣定細節所限。 【圖式簡單說明】 第1圖顯示依據一實施例用於位準估計之事置 第2圖顯示依據一實施例之估計單元, 第3圖顯示依據另一實施例之估計單元, 第4a及4b圖顯示用以產生位準值之方法, 第5圖顯雜據又-實施狀估計單元,包含預測渡波 器調整器, 第6圖顯示用以產生背向資料串流之裝置, 第7圖顯示依據技藝界現況之編碼器, 第8圖顯示依據技藝界現況之解碼器, 第9圖顯示依據技藝界現況之另一編碼器,及 27 201222530 第ίο圖顯示依據技藝界現況之又一解碼器。 【主要元件符號說明】 110...碼薄決定器 710...T/F濾波器排組 120...估計單元 715...編碼器端TNS單元 210...位準值導出器 720...定標因數單元 220...定標單元 730...量化器 230...後處理器 740...霍夫曼編碼器 240...預測濾波器調整器 750...霍夫曼解碼器 410-470...步驟 760...反量化器 610...接收器介面 770...定標器 620...位準估計裝置 775...解碼器端TNS單元 630.. .決定器 640.. .混合器 780...F/T濾波器排組 28

Claims (1)

  1. 201222530 七、申請專利範圍: 1. 一種用於一編碼立外 馬曰汛k说之位準估計之裝置,其係包 含: ^ 定11 ’該碼薄決定器用以從多個碼薄中決 定-碼薄作為—經朗碼薄,其中該音訊信號已經藉採 用δ亥經識別碍薄編碼,及 十單元,忒估計單元係經組配來用以導算出與 該經識別碼_結之—位準值作為—導出位準值,及用 以使用该導出位準值估計該音訊信號之一位準估值。 士申叫專㈣圍第旧之裝置,其中該估計單元包含一 定標單元, …其中該定標單元係適詩導算出與該編碼音訊信 唬或4編碼音訊信號之一部分有關的-定標因數作為 一導出定標因數, 八中°亥疋標單元係適用於基於該定標因數及該導 出位準值而獲得一定標位準值, 及其中該估計單元係適用於使用該定標位準值而 估汁該音訊信號之一位準估值。 3.如申請專利範圍第2項之裝置, 一其中該導出位準值為一導出能值,及其中該定標單 凡係適用於將該導出定標因數施加至該導出能值而藉 將該導出能值乘以該導出定標因數的平方而獲得一定 才示位準值,或 其中该導出位準值為一導出振幅值,及其申該定標 29 201222530 2係適用於將該導出定標因數施加至該導出振幅值 曰將料出_值細料以_ 標位準值,或 & 在.*、中轉出位準值為—導出響度值,及較標單元 :用於將料出定標因數㈣至響度定義域且施加 定標因數至該導出響度㈣獲得-定標位準 值0 4. ΐ前述巾料·财任—項之裝置,其中該估計 :⑽心配來❹—碼薄位準值估計該音訊信號之 —位準估值,該料位準㈣__ 碼字組之平均機率加權位準和值中之—和, 2中各解均機率加權位準和值指㈣經識別碼 〉之一碼字組之一機率加權位準和值對與該碼薄聯結 之—維度值之一比, —其中各個機率加權位準和值指示該經識別碼薄之 /考慮的碼子組之_位準和值乘以與該經識別碼薄 之遠所考慮的碼字組聯結之—機率值之乘積, 其中各個位準和值指示該經識別碼簿之一碼字组 的一序列位準值之數值, 、中田碼薄位準值為—能值時,針對該碼薄之各 個碼字組,各序顺準值指讀對—碼字組之—序列數 序舰量化數財之各值之—付值;或當該碼 準值為'振幅值時,針對該碼薄之各個碼字組,各 序列位準值^不針對1字組之-序列數值的—序列
    30 201222530 反里化數值巾之各值之—絕對值;或*t該碼薄位準值為 i度值時’針_碼薄之各個碼字組,各序列位準值 指示針對-碼字組之—序列數值的—序列反量化數值 中之各值之一值被變換至一響度定義域及 其中各序列數值為藉該碼薄之一碼字組所編碼之 一序列數值。 項之裝置,其中該估計 5.如前述申請專利範圍各項中任一 單元進一步包含-位準值導出器 其中該位準值導出 中與該經識別之碼薄聯 準值, 器係適用於藉詢查在_ 結的該位準值而導出該 記憶體 導出位 再史該位準值導出器係適用於從一本 求與該經識別之碼薄聯結之該位準值,或4庫明 血兮/中雜準值導出器係適料從—遠端電腦請求 ”該經識狀碼_結之該位準值。 “==第5項之裝置,進-步包含-_或 等於一_、於其中错存多個碼薄位準記憶體值,該 各自二:=與—碼薄聯結,其中該等多個碼薄 憶體或資料庫,;碼薄位準記憶體值儲存在該記 其中該位準值導出 從該資料庫導出與該經 記憶體值而導出與該經 為該位準值。 器係經組配來藉從該記憶體或 識別之碼薄聯結之一碼薄位準 識別之碼薄聯結之該位準值作 31 201222530 7.如申請專利範圍第6項之裝置,該記憶體或資料庫已經 儲存多個碼薄位準記憶體值於其中, 其中各個碼薄位準記憶體值指示一相聯結碼薄的 全部碼字組之平均機率加權位準和值之一和,其中該相 聯結碼薄係與該碼薄位準記憶體值聯結, 其中各個平均機率加權位準和值指示該相聯結碼 簿之一碼字組的機率加權位準和值對與該相聯結碼薄 聯結之一維度值之一比, 其中各個機率加權位準和值指示該相聯結碼薄之 一所考慮的碼字組之一位準和值乘以與該相聯結碼薄 之該所考慮的碼字組聯結之一機率值之乘積, 其中各個位準和值指示該相聯結碼薄之一碼字組 的一序列位準值之數值, 其中當該碼簿位準記憶體值為一能值時,針對該相 聯結碼薄之各個碼字組,各序列位準值指示針對一碼字 組之一序列數值的一序列反量化數值中之各值之一平 方值;或當該碼簿位準記憶體值為一振幅值時,針對該 相聯結碼薄之各個碼字組,各序列位準值指示針對一碼 字組之一序列數值的一序列反量化數值中之各值之一 絕對值;或當該碼薄位準記憶體值為一響度值時,針對 該相聯結碼薄之各個碼字組,各序列位準值指示針對一 碼字組之一序列數值的一序列反量化數值中之各值之 一值被變換至一響度定義域,及 其中各序列數值為藉該相聯結碼薄之一碼字組所
    32 201222530 編碼之一序列數值。 8·=述巾請專利範圍各射任—項之裝置,其中該估計 單凡進一步包含一預測濾波器調整器, 立)其中該預測遽波器調整器係適用於導出與該編碼 音訊信號或該編碼音訊信號之一部分有關的一或多個 預測據波器係數作為導出預測遽波器係數, 。其中該預_,波器調整器係適用於基於該預測遽 波器係數及該導出位準值而獲得一預測滤波器調整位 準值, 及其中違估δ十單7C係適用於使用該預測渡波器調 整位準值而估計該音訊信號之一位準估值。 9‘ 一種用以從輸人資料產生—輸出資料串流之裝置, 包含: 〃 -接收器介面用以接收包含-編碼音訊信號之該 輸入資料, 立/:前述申請專利範圍各項中任一項之用於該編碼 曰汛仏號之位準估計之一裝置, 、定器用以基於針對該輪出資料_流部分的位 準估計,決定該編碼音訊作 唬之—部分是否將含括於該 輸出資料串流與否。 卬.如申請專利範圍第9項之裝 一混合器, 其中該裝置進-步包含 裝置係適用於針對1傳會議系統的多個 參與者產生一背向資料串流作為一輪出資料串流, 33 201222530 其中該接收器係適用於接收包含來自該等多個參 與者之音訊信號之多個參與者資料串流, 其中該決定器係適用於基於針對各個參與者資料 串流的位準估計而決定一參與者資料串流是否係含括 於該背向資料串流,及 ’ 一混合器用以只混合欲含括於該背向資料串流的 該參與者資料申流及不含括決定為不含括的該參與者 資料率流。 11. 如申請專利範圍第10項之裝置,其中該決定器係適用於 當一所考慮參與者資料串流之位準估計係低於一臨界 值時,決定該所考慮參與者資料串流係不含括於該背向 資料串流。 12. 如申請專利範圍第10項之裝置,其中該決定器係適用於 決定唯有含括於該背向資料串流之資料串流為有關一 特定定標因數帶,具有全部參與者資料串流之位準估計 中的最rlj位準估計之該資料串流。 13. —種用於緩衝器管理之裝置: 用以存取一緩衝器之緩衝器音訊資料作為存取緩 衝器音訊資料之一緩衝器存取單元,其中該緩衝器音訊 資料包含一編碼音訊信號, 如前述申請專利範圍各項中任一項之用於該編碼 音訊信號之位準估計之一裝置, 一決定器用以基於該編碼音訊信號之位準估計,決 定該存取緩衝器音訊資料係將從該緩衝器刪除與否。
    34 201222530 14. 一種用以產生與一碼薄聯結之一碼薄位準值之方法,該 方法係包含: 針對該碼薄之各個碼字組,決定與該碼薄之一碼字 組聯結的一序列數值, 針對該碼薄之各個碼字組,藉施加一反量化器至一 碼字組的該序列數值之該等數值,而對該碼薄之各個碼 字組決定一反量化數值序列, 當一能值係產生作為碼薄位準值時,針對該碼薄之 各個碼字組,藉決定一碼字組之反量化數值序列中之各 值平方而對該碼薄之各個碼字組決定一序列位準值;或 當一振幅值係產生作為碼薄位準值時,針對該碼薄之各 個碼字組,藉決定一碼字組之反量化數值序列中之各值 絕對值而對該碼薄之各個碼字組決定一序列位準值;或 當一響度值欲決定作為碼薄位準值時,針對該碼薄之各 個碼字組,藉將一碼字組之反量化數值序列中之各值變 換至一響度定義域, 針對該碼薄之各個碼字組,藉加總該序列位準值之 數值而計算該碼薄之各個碼字組之一位準和值, 針對該碼薄之各個碼字組,藉將一碼字組之該位準 和值乘以與該碼字組聯結之一機率值而決定該碼薄之 各個碼字組之一機率加權位準和值, 針對該碼薄之各個碼字組,藉將一碼字組之機率加 權位準和值除以與該碼薄聯結之一維度值而決定該碼 薄之各個碼字組之一平均機率加權位準和值,及 35 201222530 藉加總全部碼字組之該等平均機率加權位準和值 而計算該碼薄位準值。 15. 如申請專利範圍第14項之方法,其中與該碼字組聯結之 機率值係依據下式計算: ^-(長度(碼字組)) 其中長度(碼字組)指示該碼字組長度。 16. —種用於一編碼音訊信號之位準估計之方法,該方法係 包含: 從多個碼簿決定一碼薄作為一經識別之碼薄,其中 該音訊信號已經藉採用該經識別之碼薄加以編碼, 導出與該經識別之碼簿聯結之一位準值,及 使用該位準值,估計該音訊信號之一位準估值。 17. —種用於從輸入資料產生一輸出資料之方法,該方法係 包含: 接收包令—編碼音訊信號之該輸入資料, 從多個碼簿決定一碼簿作為一經識別之碼薄,其中 該音訊信號已經藉採用該經識別之碼薄加以編碼, 導出與該經識別之碼簿聯結之一位準值,及 使用該位準值,估計該音訊信號之一位準估值, 基於針對該輸出資料串流該部分之位準估值,決定 該編碼音訊信號之一部分是否係含括於該輸出資料串 流。 18. —種用於儲存包含一編碼音訊信號之輸入資料於一緩 衝器之方法,該方法係包含: 36 201222530 接收包含一編碼音訊信號之該輸入資料, 從多個碼薄決定一碼簿作為一經識別之碼薄,其中 該音訊信號已經精採用該經識別之碼薄加以編碼’ 導出與該經識別之碼簿聯結之一位準值,及 使用該位準值,估計該音訊信號之一位準估值, 基於針對該輸出資料串流該部分之位準估值,決定 該編碼音訊信號之一部分是否係儲存於該緩衝器。 19. 一種當藉一電腦或一信號處理器執行時體現如申請專 利範圍第14至18項中任一項之方法的電腦程式。 37
TW100136485A 2010-10-07 2011-10-07 用於編碼音訊信號之位準估計之裝置及方法、用以產生輸出資料串流之裝置及方法、用於緩衝器管理之裝置、用以產生碼簿位準值之方法、用以儲存輸入資料之方法、及電腦程式 TWI489449B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US39073910P 2010-10-07 2010-10-07
PCT/EP2011/067466 WO2012045816A1 (en) 2010-10-07 2011-10-06 Apparatus and method for level estimation of coded audio frames in a bit stream domain

Publications (2)

Publication Number Publication Date
TW201222530A true TW201222530A (en) 2012-06-01
TWI489449B TWI489449B (zh) 2015-06-21

Family

ID=44741342

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100136485A TWI489449B (zh) 2010-10-07 2011-10-07 用於編碼音訊信號之位準估計之裝置及方法、用以產生輸出資料串流之裝置及方法、用於緩衝器管理之裝置、用以產生碼簿位準值之方法、用以儲存輸入資料之方法、及電腦程式

Country Status (15)

Country Link
US (1) US11238873B2 (zh)
EP (1) EP2625687B1 (zh)
JP (1) JP5792821B2 (zh)
KR (1) KR101412115B1 (zh)
CN (1) CN103250206B (zh)
AR (1) AR083368A1 (zh)
AU (1) AU2011311543B2 (zh)
BR (1) BR112013008462B1 (zh)
CA (1) CA2813898C (zh)
ES (1) ES2600313T3 (zh)
HK (1) HK1188327A1 (zh)
MX (1) MX2013003803A (zh)
RU (1) RU2553084C2 (zh)
TW (1) TWI489449B (zh)
WO (1) WO2012045816A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI581257B (zh) * 2013-06-21 2017-05-01 弗勞恩霍夫爾協會 使用品質控制之時間定標器、音訊解碼器、方法和電腦程式
US9997167B2 (en) 2013-06-21 2018-06-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101412115B1 (ko) 2010-10-07 2014-06-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 비트 스트림 도메인 내의 코딩된 오디오 프레임들의 레벨 추정을 위한 장치 및 방법
RU2628900C2 (ru) 2012-08-10 2017-08-22 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
WO2015038475A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Dynamic range control for a wide variety of playback environments
EP3518236B8 (en) 2014-10-10 2022-05-25 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
GB2578625A (en) * 2018-11-01 2020-05-20 Nokia Technologies Oy Apparatus, methods and computer programs for encoding spatial metadata

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
US6553535B1 (en) * 1998-08-21 2003-04-22 Massachusetts Institute Of Technology Power-efficient communication protocol
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
US6975254B1 (en) 1998-12-28 2005-12-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Methods and devices for coding or decoding an audio signal or bit stream
JP3372908B2 (ja) * 1999-09-17 2003-02-04 エヌイーシーマイクロシステム株式会社 マルチパルス探索処理方法と音声符号化装置
US6944236B2 (en) * 2000-08-11 2005-09-13 Lucent Technologies Inc. Method of multiple-antenna wireless communication using space-time codes
US7106794B2 (en) * 2000-08-11 2006-09-12 Broadcom Corporation System and method for Huffman shaping in a data communication system
AU2003219198A1 (en) * 2002-04-02 2003-10-13 Nokia Corporation Coding transform coefficients in image / video encoder and/or decoders
US7617094B2 (en) * 2003-02-28 2009-11-10 Palo Alto Research Center Incorporated Methods, apparatus, and products for identifying a conversation
EP1521241A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Transmission of speech coding parameters with echo cancellation
US8725501B2 (en) 2004-07-20 2014-05-13 Panasonic Corporation Audio decoding device and compensation frame generation method
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US8091006B2 (en) * 2006-06-02 2012-01-03 Nec Laboratories America, Inc. Spherical lattice codes for lattice and lattice-reduction-aided decoders
US20090094026A1 (en) * 2007-10-03 2009-04-09 Binshi Cao Method of determining an estimated frame energy of a communication
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
CN101609674B (zh) * 2008-06-20 2011-12-28 华为技术有限公司 编解码方法、装置和系统
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
US8565064B2 (en) * 2008-12-15 2013-10-22 Futurewei Technologies, Inc. System and method for employing six-bit rank 1 and 2 codebooks for four transmit antennas
CN102341844B (zh) * 2009-03-10 2013-10-16 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置
KR101412115B1 (ko) 2010-10-07 2014-06-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 비트 스트림 도메인 내의 코딩된 오디오 프레임들의 레벨 추정을 위한 장치 및 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI581257B (zh) * 2013-06-21 2017-05-01 弗勞恩霍夫爾協會 使用品質控制之時間定標器、音訊解碼器、方法和電腦程式
US9997167B2 (en) 2013-06-21 2018-06-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
US10204640B2 (en) 2013-06-21 2019-02-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time scaler, audio decoder, method and a computer program using a quality control
US10714106B2 (en) 2013-06-21 2020-07-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
US10984817B2 (en) 2013-06-21 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time scaler, audio decoder, method and a computer program using a quality control
US11580997B2 (en) 2013-06-21 2023-02-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Jitter buffer control, audio decoder, method and computer program
US12020721B2 (en) 2013-06-21 2024-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Time scaler, audio decoder, method and a computer program using a quality control

Also Published As

Publication number Publication date
WO2012045816A1 (en) 2012-04-12
CN103250206B (zh) 2015-07-15
TWI489449B (zh) 2015-06-21
EP2625687A1 (en) 2013-08-14
RU2013120547A (ru) 2014-11-20
BR112013008462A2 (pt) 2016-08-09
JP2013543146A (ja) 2013-11-28
JP5792821B2 (ja) 2015-10-14
KR20130112893A (ko) 2013-10-14
US11238873B2 (en) 2022-02-01
AU2011311543B2 (en) 2015-05-21
CA2813898C (en) 2017-05-23
HK1188327A1 (zh) 2014-04-25
CN103250206A (zh) 2013-08-14
MX2013003803A (es) 2013-06-03
KR101412115B1 (ko) 2014-06-26
CA2813898A1 (en) 2012-04-12
EP2625687B1 (en) 2016-08-10
BR112013008462B1 (pt) 2021-11-16
AU2011311543A1 (en) 2013-05-02
RU2553084C2 (ru) 2015-06-10
ES2600313T3 (es) 2017-02-08
AR083368A1 (es) 2013-02-21
US20130226596A1 (en) 2013-08-29

Similar Documents

Publication Publication Date Title
TW201222530A (en) Apparatus and method for level estimation of coded audio frames in a bit stream domain
TWI466106B (zh) 音訊或視訊編碼器、音訊或視訊解碼器及用以利用可變預測方向來處理多頻道音訊或視訊信號的相關方法
ES2380591T3 (es) Codificación de señal de información
TWI488177B (zh) 使用頻譜域雜訊整形之基於線性預測的編碼方案
US8909521B2 (en) Coding method, coding apparatus, coding program, and recording medium therefor
KR20130014561A (ko) 복소 예측을 이용한 다중 채널 오디오 신호를 처리하기 위한 오디오 인코더, 오디오 디코더, 및 관련 방법
WO2015154397A1 (zh) 一种噪声信号的处理和生成方法、编解码器和编解码系统
JP6494741B2 (ja) 符号化及び復号化のための符号化装置、復号化装置、システム及び方法
WO2009109120A1 (zh) 一种音频信号的编解码方法和装置
WO2013078974A1 (zh) 非激活音信号参数估计方法及舒适噪声产生方法及系统
KR20230018533A (ko) 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품
US8380495B2 (en) Transcoding method, transcoding device and communication apparatus used between discontinuous transmission
JPWO2010140350A1 (ja) ダウンミックス装置、符号化装置、及びこれらの方法
TW200818124A (en) Encoding an audio signal
TW202215417A (zh) 多聲道信號產生器、音頻編碼器及依賴混合噪音信號的相關方法
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP5336942B2 (ja) 符号化方法、復号方法、符号化器、復号器、プログラム
TW201923747A (zh) 控制編碼器及/或解碼器中頻寬之技術
WO2019037714A1 (zh) 立体声信号的编码方法和编码装置
KR20200035306A (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
CN110709925A (zh) 音频编码
JP2021529340A (ja) ステレオ信号符号化方法および装置、ならびにステレオ信号復号方法および装置
WO2019037710A1 (zh) 立体声信号编码时重建信号的方法和装置
TWI840892B (zh) 音頻編碼器、音頻編碼方法、電腦程式及編碼的多聲道音頻信號
CN110660400B (zh) 立体声信号的编码、解码方法、编码装置和解码装置