TWI758556B - 調適最低有效位元編碼與解碼之音訊編碼器、音訊解碼器、方法及電腦程式 - Google Patents
調適最低有效位元編碼與解碼之音訊編碼器、音訊解碼器、方法及電腦程式 Download PDFInfo
- Publication number
- TWI758556B TWI758556B TW107139705A TW107139705A TWI758556B TW I758556 B TWI758556 B TW I758556B TW 107139705 A TW107139705 A TW 107139705A TW 107139705 A TW107139705 A TW 107139705A TW I758556 B TWI758556 B TW I758556B
- Authority
- TW
- Taiwan
- Prior art keywords
- bits
- spectral values
- significant
- bit
- spectral
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3059—Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3066—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction by means of a mask or a bit-map
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6011—Encoder aspects
Abstract
一種用於基於一經編碼音訊資訊提供一經解碼音訊資訊之音訊解碼器經組配以基於表示頻譜值之一經編碼資訊獲得經解碼頻譜值。該音訊解碼器經組配以使用一算術解碼,針對一組頻譜值基於各別符號碼來聯合地解碼每頻譜值二個或多於二個最高有效位元,其中一各別符號碼表示針對一或多個頻譜值之每頻譜值二個或多於二個最高有效位元。該音訊解碼器經組配以取決於多少最低有效位元資訊可用而解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不解碼針對解碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元。該音訊解碼器經組配以使用該等頻譜值來提供該經解碼音訊資訊。該音訊解碼器之修改係可能的。亦描述了一種音訊編碼器。
Description
發明領域
根據本發明之實施例係關於用於基於經編碼音訊資訊提供經解碼音訊資訊之音訊解碼器。
根據本發明之其他實施例係關於用於基於輸入音訊資訊提供經編碼音訊資訊之音訊編碼器。
根據本發明之其他實施例係關於用於基於經編碼音訊資訊提供經解碼音訊資訊之方法。
根據本發明之其他實施例係關於用於基於輸入音訊資訊提供經編碼音訊資訊之方法。
根據本發明之其他實施例係關於各別電腦程式。
根據本發明之實施例係關於算術編碼音訊資料之經改良截斷。
發明背景
在過去,已開發出音訊內容之編碼及解碼之許多不同概念。
舉例而言,新藍芽編解碼器(NBC)為極類似於在3GPPEVS標準[1]中使用之基於MDCT之TCX音訊編解碼器的音訊編解碼器。此二者皆採用純量量化及基於脈絡之算術編碼(例如,參考[2]至[4])來寫碼MDCT資料。
純量量化器為簡單的均勻量化器(具有額外死區),其步長由唯一的全局增益(其例如作為旁側資訊被發送至解碼器)控制。此全局增益控制由純量量化器引入之失真以及由算術編碼器消耗之位元之數目二者。全局增益愈高,失真就愈高,且由算術編碼器消耗之位元之數目就愈小。
在EVS中,如同在大多數其他通訊編解碼器中一樣,編解碼器位元速率係恆定的,亦即,存在有限數目個可用於編碼MDCT資料之位元(位元預算)。
因此,編碼器應尋找(或必須尋找)不過低的全局增益,否則由算術編碼器消耗之位元之數目會超出位元預算。並且,其應(或必須)尋找不過高的全局增益,否則由量化引入之失真會較高,從而導致經解碼輸出信號之感知品質較差。
理想地,編碼器應在每一訊框處尋找最佳全局增益:賦予最小失真同時產生少於位元預算之數個位元的全局增益。
此目標可例如使用迭代方法來達成,該迭
代方法亦已知為速率迴路:在迴路之每次迭代時,重新量化MDCT資料,估計由算術編碼器消耗之位元之數目,且隨位元數目及/或失真變化調整全局增益。
然而,速率迴路在計算上較為複雜,且為了降低複雜性,通常使用小數目之迭代。此與要求極低計算複雜性之極低功率通訊編解碼器(例如,新藍芽編解碼器)特別相關。因此,實務上,通常發現次最佳的全局增益。
已發現,在一些狀況下,所發現之全局增益過高,從而導致所消耗之位元數目顯著低於位元預算。在此狀況下,存在數個未使用之位元。此等位元實際上可由稱為「殘差量化/寫碼」(其例如用於EVS及NBC中)之額外工具使用。此工具使用一個位元pro係數來細化經量化非零係數,且幫助獲得即使在全局增益過高時亦不會過高之失真。
此外,已發現,在一些其他狀況下,所發現之全局增益過低,從而導致所消耗之位元數目超出位元預算。在此狀況下,經量化資料無法被完全編碼。換言之,必須省略資料之一部分以便保持在位元預算之內。在EVS標準中(且當前亦在NBC中)採用之方案為藉由將高頻率非零係數設定成零來將其截斷。由於算術編碼器不編碼高頻率零係數之部分(藉由使用最末非零係數指數),因此,此方法允許節省位元,且若足夠的高頻率非零係數被截斷,則此方法允許保持在位元預算之內。
已發現,此方法在低位元速率下產生良好
結果,此係因為高頻率係數在感知上不太重要,且其可由無規雜訊替換(使用雜訊填充工具,參見例如EVS[1])而無感知品質之顯著損失。
然而,亦已發現,在高位元速率下,此方法可能使編解碼器效能嚴重降級。
鑒於此情形,需要有允許在音訊品質、複雜性與位元速率之間進行經改良權衡之概念。
發明概要
根據本發明之實施例產生一種用於基於一經編碼音訊資訊提供一經解碼音訊資訊之音訊解碼器。該音訊解碼器經組配以基於表示此等頻譜值之一經編碼資訊獲得經解碼頻譜值。該音訊解碼器經組配以使用一算術解碼,針對一組頻譜值基於各別符號碼來聯合地解碼每頻譜值(例如,每經量化頻譜值)二個或多於二個最高有效位元。一各別符號碼表示針對一或多個頻譜值之每頻譜值二個或多於二個最高有效位元。該音訊解碼器經組配以取決於多少最低有效位元資訊可用而解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得解碼與該等頻譜值(其可例如為經量化頻譜值)中之一或多者相關聯的一或多個最低有效位元,而不解碼針對已解碼二個或多於二個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該二個或多於二個最高有效位元之位元。此外,該音訊解碼器經組配以使用該等(經解碼)
頻譜值來提供該經解碼音訊資訊。
此音訊解碼器允許在音訊品質、複雜性與位元速率之間提供良好權衡之高效編碼/解碼概念。舉例而言,音訊解碼器可較好地處置位元預算不足以在給定位元預算約束下編碼音訊編碼器側處之所有(經量化)頻譜值的狀況。
該音訊解碼器係基於如下發現:對於給定位元預算,若針對許多頻譜值(或甚至針對所有非零頻譜值)編碼(及解碼)一或多個最高有效位元,同時省略(經量化)頻譜值中之一些之最低有效位元的編碼(及解碼),則可達成相對良好的音訊品質。換言之,本發明之關鍵想法在於,在位元預算不足(例如,針對經量化頻譜值之完整編碼)之狀況下,若省略一些最低有效位元之編碼及解碼,則相比於省略完整頻譜值之編碼的方案,音訊品質之降級通常較小。換言之,已發現,相比於完全省略相對較少量之頻譜值之編碼,省略許多頻譜值之最低有效位元之編碼通常仍為減少位元需求(以保持在位元預算之內)之較佳方案(即使僅省略高頻率區中之頻譜值亦如此)。換言之,本發明係基於如下發現:(選擇性地)省略解碼針對已解碼一或多個最高有效位元所針對之頻譜值的最低有效位元為減少位元需求之良好方式,相比於省略高頻率範圍內之頻譜值之編碼及解碼,該方式帶來較少失真。
因此,此處所描述之音訊解碼器通常不會導致位元預算不足以對經量化頻譜值進行完整無損編碼之訊
框中的嚴重信號雜訊比降級。
此外,已發現,該概念在聯合地編碼及解碼每頻譜值二個或多於二個最高有效位元之狀況下特別高效,此係因為在此狀況下,最高有效位元攜載足夠有意義的資訊,以即使在不編碼及解碼最低有效位元之狀況下亦允許進行良好的音訊表示。換言之,藉由聯合地解碼每頻譜值二個或多於二個最高有效位元,可確保不存在過多假影,該等假影會例如藉由引入編碼有高頻率區中之少於二個位元的音訊內容來產生。換言之,已發現,本文中所提及之概念實現位元速率、複雜性與音訊品質之間的良好構成。
在一較佳實施例中,該音訊解碼器經組配以將一算術編碼表示之一個符號映射至至少一個頻譜值之至少二個最高有效位元上,該符號表示該至少一個頻譜值之該至少二個最高有效位元。因此,可達成由算術編碼表示(其為經編碼音訊資訊之部分)之單一符號表示二個或多於二個最高有效位元,此允許良好地考慮編碼/解碼脈絡及鄰近(經量化)頻譜值之間的統計相依性。
在一較佳實施例中,該算術解碼經組配以判定該至少二個最高有效位元(例如,在本文中指定為「numbits」及「numbits-1」)之位元位置(例如,位元權重)且將由該算術編碼表示之一符號判定的該至少二個最高有效位元分配至經判定位元位置。位元位置可例如基於數個所謂的「逸出符號」來判定,該等逸出符號亦可指定為
「VAL_ESC」。舉例而言,可個別地針對算術編碼表示之不同符號判定位元位置。因此,可將恰當的數值權重分配至最高有效位元,且亦可發現一或多個最低有效位元及一或多個中間位元(其位元位置在一或多個最低有效位元與二個或多於二個最高有效位元之間)是否與頻譜值相關聯。因此,可決定是否仍應存在針對各別頻譜值之一或多個最低有效位元(及任選地針對各別頻譜值之一或多個中間位元)的解碼。另外,藉由使用此概念,有可能避免針對二個或多於二個最高有效位元足以完全表示頻譜值所針對之此等頻譜值來編碼及解碼最低有效位元。舉例而言,此對於處於0與3之間的範圍內之頻譜值係真實的(在存在二個最高有效位元之狀況下)。
在一較佳實施例中,該音訊解碼器經組配以針對已解碼二個或多於二個最高有效位元所針對之所有頻譜值解碼一或多個中間位元,該等頻譜值包含多於該二個或多於二個最高有效位元及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該二個或多於二個最高有效位元之間。因此,有可能解碼經量化頻譜值之二進位數表示之除最低有效位元以外的所有位元。舉例而言,對於所有非零頻譜值,有可能解碼所有頻譜值之二進位(且可能帶記號)數表示之除最低有效位元以外的所有位元。因此,可獲得良好的頻譜表示,其中獨立於針對各別頻譜值之最低有效位元之經編碼表示歸因於位元速率約束是否可包括至經編碼音訊表示中的問題,各頻譜值
之最大誤差限於最低有效位元得以確保。
在一較佳實施例中,該音訊解碼器經組配以在一第一解碼階段(例如,解碼步驟3)中解碼每頻譜值二個或多於二個最高有效位元,且針對解碼二個或多於二個最高有效位元所針對之所有頻譜值解碼一或多個中間位元,該等頻譜值包含多於該二個或多於二個最高有效位元(其經聯合地解碼)及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該二個或多於二個最高有效位元之間。此外,在該第一解碼階段中,針對解碼二個或多於二個最高有效位元所針對的且該二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下指出一非零值所針對的所有頻譜值,解碼記號。此外,該音訊解碼器經組配以在該第一解碼階段中選擇性地省略針對該二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下指出一零值所針對的頻譜值之一記號的一解碼。此外,該音訊解碼器經組配以在該第一解碼階段之後的一第二解碼階段(例如,解碼步驟6)中選擇性地獲得頻譜值之記號資訊,二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下針對該等頻譜值指出一零值,且一最低有效位元資訊針對該等頻譜值指出一非零值。
因此,若在第一階段中解碼之彼等位元(亦即,可能存在之二個或多於二個最高有效位元及任何中間位元)指出頻譜值之絕對值不大於最低有效位元之貢獻,則
在第一階段中不執行記號解碼。因此,記號之解碼被推遲,直至最低有效位元進行實際解碼為止。此程序係有利的,因為可避免「過早」且徒勞地解碼記號,若對應於各別頻譜值之最低有效位元歸因於位元預算耗盡而不包括於位元流中,則可能出現此狀況。
在一較佳實施例中,該音訊解碼器經組配以依序使用一最低有效位元資訊位元序列(例如,lsbs[])之後續位元,以便獲得與該等頻譜值相關聯之最低有效位元值。因此,可達成存在表示最低有效位元(任何記號,在有必要之情況下)之連續位元序列。藉由縮短此位元序列(例如,lsbs[]),可容易地在音訊編碼器側處調整傳輸經編碼音訊表示所需之位元速率,且可極容易地且在無複雜位元映射之情況下將音訊解碼器調適成位元速率之此調整(或可變長度或lsbs[])。
在一較佳實施例中,該音訊解碼器經組配以針對各別頻譜值使用該最低有效位元資訊位元序列(例如,lsbs[])之一單一位元(例如,步驟6,bit0),二個或多於二個最高有效位元值及任何中間位元在中間位元存在之情況下針對該等各別頻譜值指出一非零值,其中在此狀況下,該最低有效位元資訊位元序列之該單一位元用以獲得一最低有效位元值。此外,該音訊解碼器經組配以針對各別頻譜值使用該最低有效位元資訊位元序列之一單一位元(例如,step6,bit0),該二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下針對該等各別頻譜值指
出一零值,且該最低有效位元資訊位元序列之所用單一位元針對該等各別頻譜值確認該零值(例如,步驟6中之位元0之值「0」)。此外,該音訊解碼器經組配以針對各別頻譜值使用該最低有效位元資訊位元序列之二個後續位元(例如,步驟6中之位元0及位元1),二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針對該等各別頻譜值指出一零值,且該最低有效位元資訊位元序列之所用位元中之一第一者針對該等各別頻譜值指出與該零值偏離一最低有效位元值(步驟6中之bit0之值「1」),其中該最低有效位元資訊位元序列之所用位元(例如,步驟6中之bit1)中之一第二者判定該各別頻譜值之一記號。
藉由使用此類機制,可達成高位元速率效率。對於最低有效位元之編碼及解碼,僅存在一個連續位元序列(例如,lsbs[]),其中此一個連續位元序列亦選擇性地含有僅與零值偏離最低有效位元值(亦即,二個或多於二個最高有效位元及任何中間位元(在中間位元存在之情況下)針對此等頻譜值指出零值)的此等頻譜值之記號資訊。
在一較佳實施例中,該音訊解碼器經組配以解碼始於與一最低頻率頻譜值相關聯之一最低有效位元且朝向與愈來愈高的頻率相關聯之頻譜值行進的最低有效位元,使得頻譜值(例如,包含多於二個或多於二個最高有效位元之位元的所有頻譜值)由一最低有效位元資訊在自一最低頻率頻譜值直至一最末最低有效位元資訊可用於之一頻譜值的一範圍內細化,且使得相關聯頻率大於與該最末
最低有效位元資訊可用於之該頻譜值相關聯之一頻率的(例如,所有)頻譜值(例如,甚至包含多於該二個或多於二個最高有效位元之位元的經解碼頻譜值)保持未細化。換言之,使用最低有效位元資訊來細化較小頻率範圍(自最低頻率頻譜值直至使最末最低有效位元資訊相關聯之頻譜值)內之頻譜值,而與較高頻率相關聯之頻譜值皆保持未細化。因此,藉由使用最低有效位元細化來增加感知上較重要的低頻率範圍之解析度,而僅在感知上不太重要的較高頻率範圍內使用二個或多於二個最高有效位元(及中間位元,若可用)。因此,可基於可用位元速率獲得最佳可能聽覺印象,其中亦存在向哪些頻譜值提供最低有效位元資訊之簡單機制。此外,頻譜值可自最低頻率頻譜值直至最末最低有效位元資訊相關聯之頻譜值細化。
在一較佳實施例中,該音訊解碼器經組配成可在一第一模式與一第二模式之間切換,在該第一模式中,回應於來自該編碼器之一信令而省略(例如,完全省略)一較高頻率範圍內之頻譜值之一解碼,且解碼針對解碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,在該第二模式中,解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不解碼針對解碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元。
換言之,該音訊解碼器可在二個模式之間切
換,該等模式使用顯著不同的機制來處置位元預算之耗盡。
在第一模式中,完全編碼(及解碼)較低頻率範圍內之所有頻譜值,包括最低有效位元,而由編碼器完全丟棄較高頻率範圍內之所有頻譜值,即使其為非零的且因此不在解碼器側處被解碼亦如此。在第二模式中,至少針對所有非零頻譜值編碼(且因此亦解碼)最高有效位元,但若仍存在可用的位元預算,則僅編碼(及解碼)最低有效位元。
然而,已發現,在二個不同模式之間切換的可能允許音訊解碼器調適成變化的傳輸條件。舉例而言,已發現,第一模式有時比第二模式更有利,例如在僅極小的位元速率可用之情況下。另一方面,亦已發現,在存在足夠高的位元速率之情況下,第一模式不提供良好結果,其中許多頻譜值之二進位表示包含除二個或多於二個最高有效位元之外的最低有效位元。因此,在僅存在若干最低有效位元之情況下及在存在相對大數目之最低有效位元的情況下,音訊解碼器用良好結果進行操作(其中第二模式中之操作在第一種狀況下通常成問題,而第二模式中之操作在第二種狀況下通常極有利)。
在一較佳實施例中,該音訊解碼器經組配以評估包括於該經編碼音訊表示中之一位元流旗標,以便決定該音訊編碼器係在該第一模式中抑或在該第二模式中操作。因此,第一模式與第二模式之間的切換可由音訊編碼器控制,該音訊編碼器通常包含關於哪一模式最有利的良
好知識。另外,可降低音訊解碼器之複雜性,此係因為音訊解碼器無需自行決定是否使用第二模式之第一模式。
在另一實施例中,該音訊解碼器經組配以針對至少二個頻譜值基於各別符號碼聯合地解碼每頻譜值二個或多於二個最高有效位元,其中一各別符號碼表示針對至少二個頻譜值之每頻譜值二個或多於二個最高有效位元。其中二個或多於二個頻譜值由算術編碼表示之單一符號表示的對頻譜值之此分組亦特別高效,此係因為在鄰近頻譜值之間通常存在一定相關性,且不必針對二個最高有效位元中之每一者個別地編碼位元位置。然而,可能自然地發生頻譜值中之一者之「最高有效位元」皆為「零」的情況,此係因為位元位置通常由具有較大絕對值之頻譜值判定。
根據本發明之實施例產生一種用於基於一經編碼音訊資訊提供一經解碼音訊資訊之音訊解碼器。該音訊解碼器經組配以基於表示經解碼頻譜值之一經編碼資訊獲得經解碼頻譜值。該音訊解碼器經組配以針對多個頻譜值基於各別符號碼解碼一或多個最高有效位元,且針對該等頻譜值中之一或多者解碼一或多個最低有效位元。詳言之,該音訊解碼器經組配成可在一第一模式與一第二模式之間切換,在該第一模式中,回應於來自該編碼器之一信令而省略(例如,完全省略)一較高頻率範圍內之頻譜值之一解碼,且解碼針對解碼(或已解碼)一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包
含多於該等最高有效位元之位元,在該第二模式中,解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不解碼針對解碼(或已解碼)一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元。此外,該音訊解碼器經組配以使用該等頻譜值來提供該經解碼音訊資訊。
此實施例係基於以下想法:取決於情況,第一模式或第二模式在複雜性、位元速率與音訊品質之間的權衡方面可能更有利。音訊解碼器可處置針對處理位元預算耗盡之二種不同方法。當在第一模式中操作時,音訊解碼器可處置音訊編碼器省略較高頻率範圍內之頻譜值之編碼而低頻率範圍內之頻譜值(包括最低有效位元)被完全編碼的情形。在第二模式中,音訊解碼器處置經編碼音訊資訊,其中針對頻譜值中之一些選擇性地省略最低有效位元,即使針對所有頻譜值編碼一或多個最高有效位元亦如此。如上文已提及,二種方法之優點取決於一些其他系統參數(例如,可用位元速率),且此處所描述之音訊解碼器可因此在變化條件下提供良好結果。
此音訊解碼器亦可由上文所提及之音訊解碼器之特徵及功能性中之任一者補充。
在一較佳實施例中,該音訊解碼器經組配以在該第一模式中自一連續位元序列獲得中間位元及與一給定頻譜值相關聯之該最低有效位元,該等中間位元之位元
位置在該最低有效位元與該一或多個最高有效位元之間。此外,該音訊解碼器經組配以在該第二模式中自一單獨位元序列或自一位元序列之單獨非連續位元位置獲得中間位元及與一給定頻譜值相關聯之該最低有效位元,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。
換言之,在第一模式中,可存在編碼中間位元(在中間位元存在之情況下)及最低有效位元二者之單一連續位元序列。此連續位元序列在位元速率預算減少之狀況下可容易地縮短,該連續位元序列包含關於中間位元之資訊及關於最低有效位元之資訊二者(但其通常不包含關於一或多個最高有效位元之資訊)。另一方面,在第二模式中,表示最低有效位元之資訊及表示中間位元之資訊含於單獨位元序列或位元序列之單獨子序列中。因此,存在獲得關於中間位元之資訊(及任選地記號資訊)的一個位元序列,且存在包含關於最低有效位元之資訊(及任選地關於極接近零之值之記號的資訊)的一個序列。因此,由於在第二模式中操作時關於最低有效位元之資訊處於單獨序列中,因此包含最低有效位元之序列易於移除或縮短,以藉此降低所需之位元速率。該音訊解碼器可容易地調適成變化長度的包含最低有效位元之序列,原因在於頻譜值之最低有效位元細化取決於表示最低有效位元之序列中含有多少位元而應用於較多或較少頻譜值。
根據本發明之實施例產生一種用於基於一
輸入音訊資訊提供一經編碼音訊資訊之音訊編碼器。該音訊編碼器經組配以獲得表示該輸入音訊資訊之一音訊內容的頻譜值。該音訊編碼器亦經組配以編碼至少多個該等頻譜值,以便獲得表示該等頻譜值之一經編碼資訊(其可為經編碼音訊資訊之一部分)。此外,該音訊編碼器經組配以使用一算術編碼,針對一組頻譜值聯合地編碼每頻譜值二個或多於二個最高有效位元,以獲得各別符號碼。一各別符號碼可表示針對一或多個頻譜值之每頻譜值二個或多於二個最高有效位元。
該音訊解碼器亦經組配以取決於可用的一位元預算而編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼二個或多於二個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該二個或多於二個最高有效位元之位元。此外,該音訊編碼器經組配以使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
此音訊編碼器係基於以下想法:可藉由選擇性地省略針對使用算術編碼來編碼二個或多於二個最高有效位元所針對之頻譜值編碼一或多個最低有效位元來達成複雜性、位元速率與音訊品質之間的良好權衡。已發現,在存在被編碼之至少二個最高有效位元的狀況下,省略一或多個最低有效位元之編碼並非特別不利。
詳言之,已發現,相比於全部省略一些頻譜值之編碼以保持在位元預算之內,省略針對編碼最高有效位元所針對之一或多個(經量化)頻譜值編碼最低有效位元致使音訊品質之小得多。
在一較佳實施例中,該算術編碼經組配以例如個別地針對算術編碼表示之不同符號,判定至少二個最高有效位元(例如,numbits及numbits-1)之位元位置(例如,位元權重),且將描述該等位元位置之一資訊包括至算術編碼表示中,該資訊例如包含一或多個「VAL_ESC」符號之一逸出序列。因此,二個或多於二個最高有效位元之位元位置或位元權重可調適成實際頻譜值,其中對於相對大的頻譜值,最高有效位元可具有大的位元權重,且其中對於相對較小的頻譜值,最高有效位元可具有相對小的位元權重。因此,可使用二個或多於二個最高有效位元來完全編碼一些經量化頻譜值,其中不存在剩餘之最低有效位元(或中間位元)。相比之下,可使用二個或多於二個最高有效位元且使用至少一個最低有效位元來編碼其他相對較大的頻譜值。對於除二個或多於二個最高有效位元之外亦存在至少一個最低有效位元所針對的此等相對大的頻譜值,編碼器可取決於可用位元預算是否耗盡,靈活地決定是否編碼最低有效位元。然而,量化解析度愈高,除二個或多於二個最高有效位元之外亦包含一或多個最低有效位元的頻譜值之數目就愈大。因此,對於精細量化,藉由不編碼最低有效位元來節省位元之可能性特別高。
在一較佳實施例中,該音訊編碼器經組配以將至少一個頻譜值之至少二個最高有效位元映射至算術編碼表示之一個符號上,該符號表示該至少一個頻譜值之該至少二個最高有效位元。已發現,使用算術編碼表示之一個符號來聯合地編碼二個或多於二個最高有效位元特別高效,此係由於例如在判定算術編碼之脈絡時可利用鄰近頻譜值之最高有效位元之間的相關性。
在一較佳實施例中,該音訊編碼器經組配以針對編碼二個或多於二個最高有效位元所針對之所有頻譜值編碼一或多個中間位元,該等頻譜值包含多於該二個或多於二個最高有效位元及該最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該二個或多於二個最高有效位元之間。因此,編碼二個或多於二個最高有效位元所針對之所有頻譜值實際上係以良好解析度編碼。對於此等頻譜值,始終編碼除最低有效位元以外的所有位元,此帶來良好解析度且具有在位元預算耗盡之狀況下僅最低有效位元受影響之效果。因此,可維持極佳聽覺印象。
在一較佳實施例中,該音訊編碼器經組配以在一第一編碼階段中編碼每頻譜值二個或多於二個最高有效位元,且亦在該第一編碼階段中針對編碼二個或多於二個最高有效位元所針對之頻譜值編碼一或多個中間位元,該等頻譜值包含多於該二個或多於二個最高有效位元(其經聯合地編碼)及一最低有效位元之位元,該一或多個中間
位元之位元位置在該最低有效位元與該二個或多於二個最高有效位元之間。此外,該編碼器經組配以在該第一編碼階段中,針對編碼二個或多於二個最高有效位元所針對的且二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下指出一非零值所針對的所有頻譜值編碼記號。然而,該音訊編碼器經組配以在該第一編碼階段中選擇性地省略針對二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下指出一零值所針對的頻譜值之一記號的一編碼。因此,在第一編碼階段中,編碼最高有效位元及中間位元(在中間位元存在於最高有效位元與最低有效位元之間的情況下)。然而,在第一編碼階段中,若二個或多於二個最高有效位元及中間位元指出非零值,則僅編碼記號。換言之,在第一編碼階段中,若頻譜值極小以使得其僅與零相差最低有效位元值,則不編碼記號(其為二個或多於二個最高有效位元之位元權重經選擇使得最高有效位元皆為零的狀況,此狀況可能例如在給定頻譜值之位元權重受大於給定頻譜值之一或多個鄰近頻譜值影響時發生)。
此外,該音訊編碼器經組配以在該第一解碼階段之後的一第二編碼階段中,選擇性地編碼頻譜值之記號資訊,二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下針對該等頻譜值指出一零值,且一最低有效位元資訊針對該等頻譜值指出一非零值。換言之,對於僅與零相差最低有效位元值之極小頻譜值,僅在第二
編碼階段中編碼記號,其中是否針對給定頻譜值實際上執行(或完成)第二編碼階段(亦即,最低有效位元資訊是否包括至經編碼音訊資訊中)之決定係取決於位元預算。因此,第一編碼階段為精簡的,且僅在第二編碼階段中編碼記號資訊(例如,包括至經編碼音訊資訊中),除非已自最高有效位元及任何中間位元(在存在任何中間位元之情況下)之編碼明確,記號資訊在任何狀況下皆為必要的。由於開始時未明確將針對哪些頻譜值執行第二編碼階段,因此避免了不必要資訊之編碼且使效率最大化。僅當已知最高有效位元及任何中間位元之解碼需要多少位元且多少位元已由其他最低有效位元之編碼使用時,可做出關於是否將執行第二編碼階段之最終決定。
在一較佳實施例中,該音訊編碼器經組配以在實際上編碼此等頻譜值之最低有效位元(將其包括於經編碼音訊表示中)的情況下,針對僅與零相差一最低有效位元之頻譜值,僅將一記號資訊包括至經編碼音訊表示中。因此,可避免將不必要資訊包括至經編碼音訊資訊(或經編碼音訊表示)中。換言之,對於即使在不考慮最低有效位元時亦為非零的所有頻譜值,包括記號資訊。對於僅在考慮最低有效位元時為非零的頻譜值,若最低有效位元資訊實際上包括於經編碼音訊表示中,則僅將記號資訊包括至經編碼音訊表示中。
在一較佳實施例中,該音訊編碼器經組配以依序提供一最低有效位元資訊位元序列之後續位元,以便
編碼與該等頻譜值相關聯之最低有效位元值。因此,提供連續位元序列或位元流,其僅包含最低有效位元資訊,且可能包含僅當考慮最低有效位元時為非零的此等頻譜值之一些記號資訊。因此,存在最低有效位元資訊(包括相關聯記號資訊)之單獨序列,其可經縮短或省略而不會影響最高有效位元及中間位元(及即使在不考慮最低有效位元時亦相關的任何記號資訊)之編碼。
在一較佳實施例中,該音訊編碼器經組配以針對該二個或多於二個最高有效位元值及任何中間位元在中間位元存在之情況下指出一非零值所針對的各別頻譜值,提供該最低有效位元資訊位元序列之一單一位元,其中該最低有效位元資訊位元序列之所用單一位元用以編碼一最低有效位元值。此外,該音訊編碼器經組配以針對各別頻譜值提供該最低有效位元資訊位元序列之一單一位元,二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針對該等各別頻譜值指出一零值,且該最低有效位元資訊位元序列之所提供單一位元針對該等各別頻譜值確認該零值。此外,該音訊編碼器經組配以針對各別頻譜值提供該最低有效位元資訊位元序列之二個後續位元,該二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下針對該等各別頻譜值指出一零值,且該最低有效位元資訊位元序列之所提供位元中之一第一者針對該等各別頻譜值指出與該零值偏離一最低有效位元值,其中該最低有效位元資訊位元序列之所提供位元中之
一第二者編碼該各別頻譜值之一記號。換言之,最低有效位元資訊位元序列通常包含每頻譜值一個位元,但在頻譜值僅與零值偏離最低有效位元值之情況下包含每頻譜值二個位元。在後一狀況下,記號資訊包括至最低有效位元資訊位元序列中,此係因為其僅在最低有效位元資訊之各別部分實際上被編碼或實際上傳輸至音訊解碼器或實際上由音訊解碼器評估的情況下被需要。
換言之,針對最高有效位元及任何中間位元(若存在)指出零值所針對的且最低有效位元資訊指出非零值(僅與零值偏離最低有效位元值)所針對的頻譜值,將記號選擇性地包括至最低有效位元資訊位元序列中。
在一較佳實施例中,該音訊編碼器經組配以編碼始於與一最低頻率頻譜值相關聯之一最低有效位元且朝向與愈來愈高的頻率相關聯之頻譜值行進的最低有效位元。因此,供最低有效位元資訊用於細化頻譜值(例如,用於細化包含多於一或多個最高有效位元之位元的所有頻譜值)之經編碼資訊提供於自最低頻率頻譜值直至提供「最末」最低有效位元資訊所針對之頻譜值的範圍內。此外,對於相關聯頻率大於與提供最末最低有效位元資訊所針對之頻譜值相關聯之頻率的(所有)頻譜值(甚至對於包含多於二個或多於二個最高有效位元之位元的經編碼頻譜值),不提供由最低有效位元資訊用於細化頻譜值之經編碼資訊。換言之,使用位元預算之未使用位元以由最低有效位元資訊細化低頻率區中之頻譜值,直至位元預算耗盡。若
位元預算耗盡,則較高頻率區中之頻譜值不由最低有效位元資訊細化。此程序使得在提供最低有效位元資訊時,較低頻率部分中之頻譜值優於較高頻率部分中之頻譜值。此與音質(psycho-acoustic)要求一致,此係由於相比於較低頻率區中之不準確,由較高頻率區中之不準確造成的聽覺印象失真較少。因此,音訊編碼器可基於位元預算靈活地決定,直至存在取決於位元預算使用最低有效位元資訊來細化頻譜值之頻率(提供最末最低有效位元資訊所針對之頻譜值)。
在一較佳實施例中,該音訊編碼器經組配成可在一第一模式與一第二模式之間切換,在該第一模式中,在一可用位元預算由一較低頻率範圍內之頻譜值之一編碼用完(耗盡)的狀況下省略(例如,完全省略)一較高頻率範圍內之非零頻譜值之一編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,在該第二模式中,編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元。
如上文已提及,能夠在此等模式之間切換允許在不同環境中及在不同位元速率約束下進行高效寫碼。在第一模式中,經編碼之頻譜值之數目可變化,且較高頻率範圍內之非零頻譜值之編碼可回應於位元預算耗盡而省
略。因此,高頻率範圍內之聽覺印象降級,但此在一些情況下可接受,例如在低位元速率環境中。另一方面,在第二模式中,當針對所有頻譜值(甚至在高頻率區中)至少編碼最高有效位元時,音訊編碼器可針對取決於位元預算編碼多少頻譜值而變化最低有效位元。因此,在第二模式中,當未全部省略高頻率區中之非零(經量化)頻譜值時,在一些狀況下甚至可降低較低頻率之編碼精確度。第二操作模式可例如在較高位元速率條件下導致聽覺印象經改良,若高頻率區中之非零頻譜值將被全部省略,則此聽覺印象受到顯著降級。因此,音訊編碼器可以靈活方式,藉由可在第一模式與第二模式之間切換來適於不同情形及位元速率要求。
在一較佳實施例中,該音訊編碼器經組配以提供包括於該經編碼音訊資訊(或經編碼音訊表示)中之一位元流旗標,以便指出該音訊編碼器係在該第一模式中抑或在該第二模式中操作。因此,音訊解碼器易於辨識應使用第一解碼模式抑或第二解碼模式。對此信號使用位元流旗標係合理的,此係由於音訊編碼器通常相比於音訊解碼器具有更多關於特定情況之知識。
在一較佳實施例中,該音訊編碼器可經組配以針對至少二個頻譜值使用各別符號碼來聯合地編碼每頻譜值二個或多於二個最高有效位元。因此,一各別符號碼可表示針對至少二個頻譜值之每頻譜值二個或多於二個最高有效位元。已發現,此編碼特別高效,此係由於可利用
頻譜上鄰近的頻譜值之間的相依性及相關性。另外,可基於二個頻譜值判定最高有效位元之位元權重,其中具有較大絕對值之頻譜值可針對二個頻譜值就最高有效位元之共同位元權重做出決定。因此,可減少對最高有效位元之位元權重發信的信令額外負荷,此係因為該位元權重可針對二個或多於二個頻譜值聯合地發信。
在一較佳實施例中,該音訊編碼器經組配以判定一實際最高頻率非零頻譜值(例如,而不截斷頻譜值)且編碼所有非零(經量化)頻譜值組之所有非零(經量化)頻譜值之至少二個或多於二個最高有效位元。因此,可確保所有非零(經量化)頻譜值之至少最高有效位元被編碼,此通常導致聽覺印象良好。
在一較佳實施例中,該音訊編碼器經組配以編碼除所有非零(經量化)頻譜值之一最低有效位元以外的所有位元。此外,該音訊編碼器經組配以編碼頻譜值之最低有效位元,直至一位元預算耗盡(例如,始於一最低頻率頻譜值且朝向較高頻率頻譜值行進)。因此,可達成良好聽覺印象,且取決於位元預算,在編碼時將僅跳過可變數目個最低有效位元。
在一較佳實施例中,該音訊編碼器經組配以獲得一全局增益資訊,該全局增益資訊判定頻譜值之一量化的量化步階,且判定經量化頻譜值之編碼的一位元需求。已發現,此(全局)增益資訊之使用可有助於調整量化步階。然而,亦已認識到,在使用全局增益資訊時微調位元需求
並不容易實現。因此,可使用選擇性地省略針對一些頻譜值編碼最低有效位元之概念來補償位元需求之調整中的不準確,此不準確係由全局增益資訊之使用造成。然而,已發現,全局增益資訊之使用與本文中所描述之編碼概念的組合產生一種具有相對低計算複雜度且仍允許在音訊品質與位元速率之間進行良好權衡的系統。詳言之,即使在全局增益資訊之低複雜性調整的情況下,亦可藉由靈活地決定應編碼多少最低有效位元來完全利用給定固定位元速率。
根據本發明之實施例產生一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之音訊編碼器。該音訊編碼器經組配以獲得表示該輸入音訊資訊之一音訊內容的頻譜值。該音訊編碼器經組配以編碼至少多個該等頻譜值,以便獲得表示該等頻譜值之一經編碼資訊。該音訊編碼器經組配以針對多個該等頻譜值使用各別符號碼編碼一或多個最高有效位元,且針對該等頻譜值中之一或多者編碼一或多個最低有效位元,其中一各別符號碼表示針對一或多個頻譜值之一或多個最高有效位元值。該音訊編碼器經組配成可在一第一模式與一第二模式之間切換,在該第一模式中,在一可用位元預算由一較低頻率範圍內之經編碼頻譜值用完(例如,耗盡)的狀況下(例如,完全)省略一較高頻率範圍內之非零頻譜值之一編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,在該
第二模式中,編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元。該音訊編碼器經組配以使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
此音訊編碼器係基於上文所提及之對類似音訊編碼器以及對類似音訊解碼器的考慮。詳言之,當可在第一模式與第二模式之間切換時,音訊編碼器可適於不同編碼情形及位元速率要求。
在一較佳實施例中,該音訊編碼器經組配以在該第二模式中編碼所有非零頻譜值或所有非零頻譜值組之一或多個最高有效位元。因此,可達成良好聽覺印象。
在一較佳實施例中,該音訊編碼器經組配以當在該第一模式中操作時,在一位元預算不足之狀況下限制編碼該等頻譜值所針對之一頻率範圍,使得在編碼頻譜值時不考慮一或多個頻譜值(例如,在一高頻率範圍內)。因此,取決於位元預算,在第一模式中使用頻率範圍之選擇性限制,其中頻率範圍之限制有助於節省位元。
在一較佳實施例中,該音訊編碼器經組配以當在該第一模式中操作時判定一最大頻率值,且當在該第一模式中操作時編碼頻譜值直至最大頻率,且當在該第一模式中操作時不編碼高於該最大頻率之頻譜值,即使該等頻譜值非零(或具有非零最高有效位元)亦如此。此外,該
音訊編碼器經組配以當在該第一模式中操作時,取決於對編碼所有頻譜值之一位元需求的一計算或估計選擇該最大頻率值,使得在經計算或經估計位元需求超出一位元預算之情況下,待編碼之頻譜值之一數目減小。此外,該音訊編碼器經組配以當在該第二模式中操作時判定該最大頻率值(例如,判定為等於一實際最大頻率值),且當在該第二模式中操作時編碼頻譜值直至最大頻率,且當在該第二模式中操作時不編碼高於該最大頻率之頻譜值。當在該第二模式中操作時,選擇該最大頻率值,使得所有非零頻譜值或所有非零頻譜值組的至少一或多個最高有效位元被編碼,且使得最多零值頻譜值未被編碼。換言之,音訊編碼器在不同模式中針對最大頻率值之選擇使用不同準則。在第一模式中,取決於位元需求選擇最大頻率值,其中在位元預算過小之狀況下,不編碼非零(經量化)頻譜值。另一方面,在第二模式中,選擇最大頻率值以使得針對經量化成非零值之所有頻譜值至少編碼一或多個最高有效位元。因此,使用不同概念來處理位元預算之耗盡。在第一模式中,藉由減小最大頻率值來處置位元預算之耗盡。在第二模式中,藉由省略編碼最高有效位元所針對之一或多個頻譜值之最低有效值的編碼來處置位元預算之耗盡。
在一較佳實施例中,該音訊編碼器經組配以將描述該最大頻率之一資訊包括至該經編碼音訊資訊中。因此,音訊解碼器已知應解碼多少頻譜值。描述最大頻率之資訊可用於歸因於位元預算耗盡而限制經編碼(及解碼)
頻譜值之數目,且亦用於發信高於最大頻率之所有頻譜值為零(例如,即使無截斷亦實際上為零)。
在一較佳實施例中,該音訊編碼器經組配以取決於一可用位元速率做出使用該第一模式抑或該第二模式之一模式決定(例如,使得該第一模式用於相對較小的位元速率且使得該第二模式用於相對較高的位元速率)。
此類機制係適用的,此係由於第二模式較適合於在較高位元速率之狀況下處理位元預算之耗盡。相比之下,第一模式有時在相對低的位元速率之狀況下產生優於第二模式之結果。
在另一較佳實施例中,該音訊編碼器經組配以取決於關於頻譜值或頻譜值組之一數目的一資訊做出使用該第一模式抑或該第二模式之一模式決定,該等頻譜值包含除在一最高有效位元編碼步驟中編碼之一或多個最高有效位元之外的一或多個最低有效位元,該一或多個最低有效位元之一編碼可取決於一位元需求及一位元預算選擇性地省略。此概念係有幫助的,此係由於第二模式較適合於存在(在量化之後)大量最低有效位元之狀況。此等大量最低有效位元例如在高位元速率之狀況下存在,在此狀況下可以高解析度(且其中可使用精細量化)完成編碼。
在一較佳實施例中,該音訊編碼器經組配以將一位元流旗標包括至指出該音訊編碼器係在該第一模式中抑或在該第二模式中操作之該經編碼音訊資訊。因此,可向音訊解碼器告知使用哪一解碼模式。
在一較佳實施例中,該音訊編碼器經組配以在該第一模式中將中間位元及與一給定頻譜值相關聯之一最低有效位元編碼至一連續位元序列中,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。此外,該音訊編碼器經組配以在該第二模式中將中間位元及與一給定頻譜值相關聯之該最低有效位元編碼至單獨位元序列或一位元序列之單獨非連續位元位置(或位元流部分)中,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。因此,當在第一模式中操作時,存在表示中間位元及最低有效位元二者之連續位元序列。相比之下,當在第二模式中操作時,在單獨序列中提供中間位元及最低有效位元(或提供至共同序列之單獨部分中),此允許僅僅縮短表示最低有效位元之序列。因此,對位元預算之調適係容易實現的,即使在完成編碼之後亦如此。此促成對位元預算之調適。
在一較佳實施例中,該音訊編碼器經組配以當在該第一模式中操作時,在與中間位元相關聯之一位元序列中編碼與一頻譜值相關聯之一記號資訊及最低有效位元,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。此外,該音訊編碼器經組配以當在該第二模式中操作時,在與中間位元相關聯之一位元序列中,或在與最低有效位元(及記號資訊)相關聯之一位元序列中,選擇性地編碼與一頻譜值相關聯之一記號資訊,使得僅與零偏離一最低有效位元值之頻譜值之記號資訊在
與最低有效位元(及記號資訊)相關聯之該位元序列中被編碼,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。因此,在評估最低有效位元資訊時僅需要記號資訊之狀況下,記號資訊置放於與最低有效位元(及記號資訊)相關聯之位元序列內。因此,始終包括至經編碼音訊表示中之資訊,亦即與中間位元及記號資訊相關聯之位元序列,不包含在省略最低有效位元資訊之狀況下為不必要的任何資訊。此簡化了位元速率之可擴縮性。
根據本發明之實施例產生一種用於基於一輸入音訊資訊提供一經編碼音訊資訊之音訊解碼器。該音訊編碼器經組配以獲得表示該輸入音訊資訊之一音訊內容的頻譜值(例如,使用MDCT變換)。該音訊編碼器經組配以編碼至少多個該等頻譜值,以便獲得表示該等頻譜值之一經編碼資訊。該音訊編碼器經組配以獲得一(全局)增益資訊,該增益資訊判定頻譜值之一量化的量化步階,且判定對編碼經量化頻譜值之一位元需求。該音訊編碼器經組配以使用一算術編碼,針對多個該等頻譜值使用各別符號碼編碼一或多個最高有效位元,且針對該等頻譜值中之一或多者編碼一或多個最低有效位元,其中一各別符號碼表示針對一或多個頻譜值之每頻譜值一或多個最高有效位元。該音訊編碼器經組配以取決於可用的一位元預算而編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼一或多個最高有效
位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元。此外,該音訊編碼器經組配以使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
此音訊編碼器係基於增益資訊(或全局增益資訊)之使用適用於定義量化的發現。另外,選擇性地編碼最低有效位元之概念與此概念的組合極為高效。詳言之,亦參考以上論述。
在一較佳實施例中,該音訊編碼器經組配以基於頻譜值(例如,MDCT係數)組之一能量獲得該增益資訊之一第一估計值。此外,該音訊編碼器經組配以使用該增益資訊之該第一估計值來量化一組頻譜值(例如,一MDCT頻譜)。此外,該音訊編碼器經組配以計算或估計編碼該組頻譜值所需之一位元數目,該組頻譜值係使用該增益資訊之該第一估計值或使用一經細化增益資訊來量化。此外,該音訊編碼器經組配以取決於所需之一位元數目而決定使用該第一模式抑或該第二模式。因此,可以高效方式做出關於量化之決定以及使用哪一模式之決定。取決於是否選擇迭代程序,可使用取決於增益資訊之第一估計值的量化或使用取決於迭代地細化之增益資訊的量化來估計編碼該組頻譜值所需的位元數目。因此,量化準確度之判定的複雜性可保持相當小。
在一較佳實施例中,該音訊編碼器經組配成可在上文所提及之該第一模式與該第二模式之間切換。詳
言之,該音訊編碼器經組配以取決於所需之一位元數目且取決於指出多少頻譜值包含多於該一或多個最高有效位元之位元的準則而決定使用該第一模式抑或該第二模式。詳言之,可在就待使用之增益資訊(第一估計值或經細化增益資訊)做出決定之後判定的所需位元數目可與位元預算相比較,且可取決於此比較且取決於指出多少頻譜值包含多於該一或多個最高有效位元之位元的準則而做出使用哪一模式之決定。因此,若存在除一或多個最高有效位元之外亦包含一或多個較低有效位元的許多頻譜值,則可使用第二模式。
在一較佳實施例中,該音訊編碼器經組配成可在上文所提及之該第一模式與該第二模式之間切換。在此狀況下,該音訊編碼器可經組配以取決於所需之該位元數目且取決於一位元速率而決定使用該第一模式抑或該第二模式,使得在該位元速率大於或等於一臨限位元速率之情況下及在編碼該組頻譜值所需之一經計算或經估計位元數目大於一位元預算的情況下選擇該第二模式。已展示,第二模式之使用在該狀況下特別有幫助。
此外,音訊編碼器亦可由先前提及之其他特徵中之任一者補充。先前論述之相同優勢亦適用。
根據本發明之其他實施例產生用於基於一經編碼音訊資訊提供一經解碼音訊資訊之方法及用於基於一輸入音訊資訊提供一經編碼音訊資訊之方法。此等方法對應於各別音訊解碼器及各別音訊編碼器,且可由本文中
關於對應音訊解碼器或音訊編碼器所論述之特徵及功能性中之任一者補充。
根據本發明之其他實施例包含一種用於執行本文所描述之任一方法的電腦程式。
另一實施例包含位元流,該位元流係基於上文所論述之相同考慮且可由如本文中所提及之待編碼及解碼之資訊項中的任一者補充。
100、200、700:音訊解碼器
110、210、312、412、512、620、710:經編碼音訊資訊
112、212、712:經解碼音訊資訊
130、230、350、450、550、630:經編碼資訊
132、232:經解碼頻譜值
300、400、500、600:音訊編碼器
310、410、510、610:輸入音訊資訊
330、430、530、622、632、672:頻譜值
560:增益資訊
612:經編碼音訊表示
640:預處理
642:經預處理頻譜值
650、740:縮放
652:經縮放頻譜值
660:量化
662、722:經量化頻譜值
670:編碼
680、750、770:後處理
720:解碼
730:反量化器
732:經反量化頻譜值
742:經反量化且經縮放之頻譜值
752:經後處理頻譜值
760:譜域至時域轉換
762:時域音訊表示
800:流程圖/功能性
810、814、818、822、830、840、844、848、852、856、860、864、868、869、870、874、878、882、886、890、892、894、896、898、900、910、914、916、918、930、934、938、942、
944、948、950、954、958、962、968、972、980、1000a、1010a、1010b、1010c、1010d、1010e、1010f、1011a、1011b、1011c、1011d、1011e、1011f、1020a、1040a、1040b、1040c、1040d、1050a、1050b、1050c、1060a、1060b、1060c、1061a、1061b、1061c、1110a、1110b、1110c、1110d、1110e、1110f、1110g、1120a、1120b、1120c、1120d、1120e、1130a、1130b、1130c、1130d、1131a、1131b、1131c、1131d、1140a、1140b、1140c、1140d、1140e、1140f、1140g、1140h、1140i、1140j、1141d、1141e、1141f、1141g、1141h、1141i、1141j:功能性/步驟
隨後將參考所附圖式描述根據本發明的實施例,在該等圖式中:圖1展示根據本發明之實施例的音訊解碼器之示意方塊圖;圖2展示根據本發明之另一實施例的音訊解碼器之示意方塊圖;圖3展示根據本發明之實施例的音訊編碼器之示意方塊圖;圖4展示根據本發明之實施例的音訊編碼器之示意方塊圖;圖5展示根據本發明之實施例的音訊編碼器之示意方塊圖;圖6展示根據本發明之實施例的另一音訊編碼器之示意方塊圖;圖7展示根據本發明之另一實施例的音訊解碼器之示意方塊圖;
圖8展示根據本發明之實施例的音訊編碼器之功能性之流程圖;圖9展示根據本發明之實施例的音訊解碼器之功能性之流程圖;圖10a至圖10f展示根據本發明之實施例的音訊編碼器之功能性之偽程式碼表示。
圖11a至圖11d展示根據本發明之實施例的音訊解碼器之功能性之偽程式碼表示。
圖12展示由習知音訊編碼器/解碼器產生之信雜比的圖形表示;圖13展示由根據本發明之音訊編碼器/解碼器提供的信雜比之圖形表示;且圖14至圖18展示根據本發明之實施例的用於音訊編碼及音訊解碼之方法之流程圖。
1).根據圖1之音訊解碼器
圖1展示根據本發明之實施例的音訊解碼器100之示意方塊圖。
音訊解碼器100經組配以接收經編碼音訊資訊110且基於其而提供經解碼音訊資訊112。音訊解碼器100經組配以基於表示頻譜值之經編碼資訊130獲得經解碼頻譜值132,其中經編碼資訊130可為經編碼音訊資訊110之部分。另外,經編碼音訊資訊110可任選地包含其他資訊,如雜訊整形資訊、控制資訊及其類似者。
音訊解碼器經組配以使用算術解碼,針對一組頻譜值基於各別符號碼(例如,最高有效位元之算術編碼表示之符號碼)來聯合地解碼每頻譜值(例如,每經量化頻譜值)二個或多於二個最高有效位元。一各別符號碼可表示針對一或多個頻譜值之每頻譜值二個或多於二個最高有效位元。算術編碼符號碼可例如為表示頻譜值之經編碼資訊130的部分。
此外,音訊解碼器經組配以取決於多少最低有效位元資訊可用而解碼與一或多個頻譜值相關聯之一或多個最低有效位元。可被視為最低有效位元之表示的最低有效位元資訊亦可為表示頻譜值之經編碼資訊130的部分。
詳言之,音訊解碼器可經組配以取決於多少最低有效位元資訊可用而解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得解碼與該等(經量化)頻譜值中之一或多者相關聯的一或多個最低有效位元,而不解碼針對解碼(或已解碼)一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元。
換言之,音訊解碼器可經組配以針對已解碼二個或多於二個最高有效位元所針對之頻譜值中之一些解碼最低有效位元,且音訊解碼器可省略針對已解碼一或多個最高有效位元所針對之一些其他頻譜值的一或多個最低有效位元之解碼。
又換言之,音訊解碼器可例如僅細化已解碼最高有效位元所針對之頻譜值的真子集,其中由最低有效位元細化之頻譜值的數目取決於多少最低有效位元資訊可用(例如,鑒於位元預算約束,多少最低有效位元資訊由音訊解碼器包括於經編碼音訊資訊110中)。
音訊解碼器100可任選地由本文中所描述之特徵、功能性及細節中之任一者個別地或組合地補充。
2).根據圖2之音訊解碼器
圖2展示根據本發明之實施例的音訊解碼器200之示意方塊圖。
音訊解碼器200經組配以接收及經編碼音訊資訊210且基於其而提供經解碼音訊資訊212。
經編碼音訊資訊210可例如包含表示頻譜值之經編碼資訊230,其中表示頻譜值之經編碼資訊230可例如包含表示一或多個最高有效位元之算術編碼符號碼及記號之最低有效位元之表示。經編碼音訊資訊210可任選地包含其他資訊,如雜訊整形資訊之控制資訊。任選的其他資訊亦可用於解碼程序中,但對於本發明並非必需的。
音訊解碼器經組配以基於表示頻譜值之經編碼資訊230獲得經解碼頻譜值232。
音訊解碼器經組配以針對多個頻譜值基於各別符號碼(例如,基於算術編碼符號碼)解碼一或多個最高有效位元,且針對頻譜值中之一或多者解碼一或多個最低有效位元。舉例而言,音訊解碼器可使用可包括於經編
碼資訊130中之算術編碼符號碼及最低有效位元之表示。
音訊解碼器200經組配以可在第一模式與第二模式之間切換,在該第一模式中,回應於來自編碼器之信令而省略(例如,完全省略)較高頻率範圍內之頻譜值之解碼,且解碼針對已解碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,在該第二模式中,解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不解碼針對已解碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元。換言之,在第一模式中,音訊解碼器200可例如僅解碼較低頻率範圍(例如,直至由音訊編碼器判定及發信的頻率)內之頻譜值,而省略較高頻率範圍(例如高於由編碼器指定之頻率)內之頻譜值的解碼。然而,在第一模式中,可針對較低頻率範圍內之所有頻譜值解碼頻譜值之完整數表示,使得最高有效位元、任何中間位元及任何最低有效位元針對較低頻率範圍內之所有頻譜值被解碼。相比之下,在第二模式中,音訊解碼器可僅針對解碼一或多個最高有效位元所針對之頻譜值中之一些,而非針對解碼一或多個最高有效位元所針對之所有頻譜值解碼最低有效位元。因此,在第二模式中,可在一個頻率區而非另一頻率區中(例如,在較高頻率區中)解碼最低有效位元。
此外,音訊解碼器200經組配以使用頻譜值
232來提供經解碼音訊資訊212。舉例而言,音訊解碼器200可包含經解碼頻譜值232之另一處理,然而,此處理之細節與本發明之標的物不具有特定關聯性。
此外,應注意,音訊解碼器200可由本文中所描述之特徵、功能性及細節中之任一者個別地或組合地補充。
3).根據圖3之音訊編碼器
圖3展示根據本發明之實施例的音訊編碼器300之示意方塊圖。音訊編碼器300經組配以接收輸入音訊資訊310,且可提供經編碼音訊資訊312(其可對應於經編碼音訊資訊110、210)。音訊編碼器300經組配以獲得表示輸入音訊資訊310之音訊內容的頻譜值330。舉例而言,音訊解碼器300可任選地包含任何形式之預處理,例如時域至譜域轉換(例如,MDCT)及/或頻譜塑形(在時域中及/或在譜域中),以便獲得頻譜值330。
頻譜值330可例如為帶記號二進位數表示之經量化(較佳整數)值。此外,音訊編碼器經組配以編碼至少多個頻譜值330,以便獲得表示頻譜值330之經編碼資訊350。音訊編碼器300可例如經組配以使用表示頻譜值之經編碼資訊350來提供經編碼音訊資訊312。然而,音訊編碼器300亦可任選地提供其他資訊,如控制資訊或雜訊整形資訊,該等資訊亦包括於經編碼音訊資訊312中(但其細節與本發明不具有特定關聯性)。
音訊編碼器300經組配以使用算術編碼,針
對一組頻譜值聯合地編碼每頻譜值二個或多於二個最高有效位元,以獲得各別符號碼。各別符號碼可例如表示針對一或多個頻譜值之每頻譜值二個或多於二個最高有效位元。
音訊編碼器進一步經組配以取決於位元預算而編碼與頻譜值330中之一或多者相關聯的一或多個最低有效位元,使得編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼二個或多於二個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該二個或多於二個最高有效位元之位元。
舉例而言,音訊編碼器300可僅針對較低頻率部分中之頻譜值,而非較高頻率部分中之頻譜值提供經編碼最低有效位元。藉由選擇向最低有效位元提供之頻譜值,位元數目可調適成位元預算。
此外,應注意,根據圖3之音訊編碼器可使用本文中所描述之特徵、功能性及細節中之任一者個別地或組合地補充。
4).根據圖4之音訊編碼器
圖4展示根據本發明之實施例的音訊編碼器400之示意方塊圖。
音訊編碼器400經組配以接收輸入音訊資訊410且基於其而提供經編碼音訊資訊412。音訊編碼器經組配以獲得表示輸入音訊資訊410之音訊內容的頻譜值330
(其可例如為帶記號二進位數表示中之經量化(較佳整數)頻譜值)。舉例而言,可使用任選的預處理,其可例如包含時域至頻域轉換及/或雜訊塑形。此外,可任選地使用量化來獲得頻譜值430。
音訊編碼器進一步經組配以編碼至少多個頻譜值430,以便獲得表示該等頻譜值之經編碼資訊450。音訊編碼器經組配以針對多個頻譜值使用各別符號碼來編碼(頻譜值之)一或多個最高有效位元,且針對頻譜值中之一或多者編碼一或多個最低有效位元。各別符號碼可例如表示針對一或多個頻譜值之一或多個最高有效位元值。音訊編碼器可經組配成可在第一模式與第二模式之間切換,在該第一模式中,在可用位元預算由較低頻率範圍內之頻譜值之編碼用完(耗盡)的狀況下省略(例如,完全省略)較高頻率範圍內之非零頻譜值之編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,在該第二模式中,編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元。
換言之,在第一模式中,音訊編碼器可例如編碼相對較小數目(例如,並非所有非零頻譜值),但經編碼之彼等頻譜值係以完整準確度編碼(包括最低有效位
元)。相比之下,在第二模式中,音訊編碼器可例如至少編碼所有非零頻譜值之最高有效位元,但可以降低之解析度編碼頻譜值中之一些(例如,不編碼對應最低有效位元)。因此,編碼器可例如在提供用於將位元數目調適成位元預算之二個模式之間切換,其中第一模式依賴於省略較高頻率範圍內之頻譜值之編碼以減少位元數目,且其中第二模式依賴於省略一些頻譜值(僅針對其編碼最高有效位元且可能編碼一些中間位元,且其被「部分地編碼」)之最低有效位元。
根據圖4之音訊編碼器400可由本文中所描述之任何特徵、功能性及細節個別地或組合地補充。
5).根據圖5之音訊編碼器
圖5展示根據本發明之實施例的音訊編碼器500之示意方塊圖。音訊編碼器500經組配以接收輸入音訊資訊510且基於其而提供經編碼音訊資訊512。音訊編碼器經組配以獲得表示輸入音訊資訊510之音訊內容的頻譜值530。舉例而言,音訊編碼器可使用修正離散餘弦變換(MDCT)來獲得頻譜值530。一般而言,音訊編碼器500可任選地使用任何類型之預處理,如時域至頻域轉換及雜訊塑形,且音訊編碼器500亦可任選地使用量化。舉例而言,頻譜值530為經量化頻譜值,或可為經雜訊塑形且經量化之MDCT係數。
音訊編碼器經組配以編碼至少多個頻譜值530,以便獲得表示該等頻譜值之經編碼資訊550。經編碼
資訊550可為經編碼音訊資訊512之一部分。然而,經編碼音訊資訊512亦可任選地包含其他資訊,如控制資訊或頻譜整形資訊。
音訊編碼器500亦經組配以獲得增益資訊(例如,全局增益資訊)560,增益資訊560判定頻譜值之量化的量化步階,且判定對編碼經量化頻譜值之位元需求。
音訊編碼器500經組配以使用算術編碼,針對多個(經量化)頻譜值使用各別符號碼編碼(經量化頻譜值之)一或多個最高有效位元,且針對(經量化)頻譜值中之一或多者編碼一或多個最低有效位元。各別符號碼可例如表示針對一或多個頻譜值之每頻譜值一或多個最高有效位元。
該音訊編碼器經組配以取決於可用的一位元預算而編碼與該等(經量化)頻譜值中之一或多者相關聯的一或多個最低有效位元,使得編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元。舉例而言,音訊編碼器可僅針對頻譜值中之一些提供經編碼最低有效位元,而不針對其他頻譜值提供經編碼最低有效位元,此亦將受益於最低有效位元細化。
此外,音訊編碼器500經組配以使用表示頻譜值之經編碼資訊550來提供經編碼音訊資訊512。
應注意,音訊編碼器500可由本文中所描述之特徵、功能性及細節中之任一者個別地或組合地補充。
6).圖6之音訊編碼器
圖6展示根據本發明之實施例的音訊編碼器之示意方塊圖。
根據圖6之音訊編碼器之整體以600指定。
音訊編碼器600經組配以接收輸入音訊資訊610且基於其而提供經編碼音訊表示612。
音訊編碼器600可包含任選的預處理620,其可將某一類型之預處理(例如,濾波、頻寬限制、時域雜訊塑形或其類似者)應用於輸入音訊信號。
音訊編碼器600可任選地包含時域至譜域轉換630,時域至譜域轉換630可例如執行修正離散餘弦變換或類似變換,如低延遲修正離散餘弦變換。時域至譜域轉換630可例如接收輸入音訊資訊610或其經預處理版本622,且提供頻譜值632。
音訊編碼器600可任選地包含(其他)預處理,該預處理接收頻譜值632,且可例如執行雜訊塑形。舉例而言,(其他)預處理640可執行頻譜雜訊塑形及/或時間雜訊塑形。任選地,預處理640可例如應用比例因數以根據頻帶之音質關聯性(其可例如由音質模型判定)縮放不同頻帶(「比例因數帶」)。因此,可獲得經預處理頻譜值642。
音訊編碼器600可任選地包含縮放650,縮放650可例如縮放頻譜值632或經預處理頻譜值642。舉例而
言,縮放650可使用全局增益來縮放頻譜值632或經預處理頻譜值642,以藉此提供經縮放頻譜值652。
音訊編碼器600亦包含量化(或量化器)660,量化660可接收頻譜值632、經預處理頻譜值642或經縮放頻譜值652。量化660可例如量化頻譜值632或經預處理頻譜值642或經縮放頻譜值652,以藉此獲得經量化頻譜值662,經量化頻譜值662可例如為帶記號整數值,且可例如以二進位表示(例如,以二的補碼表示)來表示。經量化頻譜值662可例如以Xq指定。舉例而言,每訊框可提供預定數目256、512、1024或2048個經量化頻譜值,其中不同頻率與經量化頻譜值相關聯。
編碼器600亦可包含編碼670,編碼670接收經量化頻譜值662(Xq)且可基於其提供表示(經量化)頻譜值672之經編碼資訊。
應注意,經量化頻譜值662可對應於頻譜值330、430、530,且表示頻譜值之經編碼資訊672可對應於表示頻譜值之經編碼資訊350、450、550。此外,應注意,編碼670可例如執行關於編碼器300、400、500所描述之功能性。然而,編碼670亦可包含下文(例如參考圖8)所描述之功能性,或該功能性之至少部分。
音訊編碼器600亦任選地包含後處理680,後處理680可將後處理應用於經編碼資訊672。
因此,提供經編碼表示612,其通常包含經編碼資訊672。然而,經編碼音訊表示612亦可任選地包含額
外資訊,如控制資訊及關於雜訊塑形之資訊(如比例因數資訊、線性預測係數或其類似者)。經編碼音訊表示亦可任選地包含全局增益資訊及/或編碼模式資訊/解碼模式資訊及/或「lastnz」資訊。
總而言之,本文中所揭示之頻譜值之編碼的概念可例如實施於音訊編碼器600中,其中僅本文中所描述之比例因數編碼之特徵中的一些或所有可併入音訊編碼器600中。
7).根據圖7之音訊解碼器
圖7展示根據本發明之實施例的音訊解碼器700之示意方塊圖。音訊解碼器700經組配以接收經編碼音訊資訊710(其可例如對應於經編碼音訊表示612)且可基於其而提供經解碼音訊資訊712。音訊編碼器700可例如包含解碼720,解碼720接收經編碼音訊資訊或其一部分,且基於其而提供經量化頻譜值722(亦以Xq指定)。舉例而言,解碼720可以二進位表示(例如,以二的補碼表示)提供帶記號整數值。
音訊解碼器700任選地包含反量化器730,反量化器730接收經量化頻譜值且可執行反量化。舉例而言,反量化器730可使用全局增益資訊來調整由反量化執行之映射。
音訊解碼器700任選地包含縮放740,縮放740可接收由反量化器提供之經反量化頻譜值732且可執行縮放,以藉此獲得經反量化且經縮放之頻譜值742。縮放
可任選地取決於全局增益。
音訊解碼器700亦可任選地包含後處理750,後處理750可接收經反量化頻譜值730或經反量化且經縮放之頻譜值742且可執行頻譜塑形。舉例而言,頻譜塑形可為頻譜雜訊塑形,及/或可基於使用比例因數的不同頻帶之縮放,及/或可基於使用線性預測係數之頻譜塑形(其中控制頻譜塑形之資訊可包括於經編碼音訊資訊中)。
音訊解碼器700亦可任選地包含譜域至時域轉換760,譜域至時域轉換760可接收經反量化頻譜值732、經反量化且經縮放之頻譜值742或由後處理750提供之經後處理(例如,光譜塑形)頻譜值752。譜域至時域轉換可例如執行反修正離散餘弦變換,或低延遲反修正離散餘弦變換,或任何其他譜域至時域轉換,以藉此基於由譜域至時域轉換接收到之輸入資訊獲得時域音訊表示762。
時域音訊表示762可例如輸入至(任選的)後處理770中,後處理770可執行一或多個後處理步驟,且亦可例如執行時域頻譜塑形(例如,在譜域中不執行頻譜塑形之狀況下,例如使用LPC濾波)。
因此,經解碼音訊資訊712可基於譜域至時域轉換762之輸出而提供,且可能使用某一形式之後處理及/或訊框鏈接(如重疊運算及加法運算)來獲得。
總而言之,音訊解碼器700可執行某一音訊解碼功能性,其中例如關於雜訊塑形或頻譜塑形之細節可根據實施顯著變化。頻譜塑形或雜訊塑形可在譜域中(亦
即,在譜域至時域轉換之前)及/或在時域中(例如,在譜域至時域轉換之後)執行。
然而,應注意,經編碼音訊資訊710可對應於經編碼音訊資訊110、210,且經編碼音訊資訊710可包含額外控制資訊及用於調整頻譜塑形之資訊。此外,經量化頻譜值722可例如對應於經解碼頻譜值132、232。
另外,解碼720可執行關於音訊解碼器100、200所描述之功能性中之一些或所有。
另外,解碼720可由本文中關於本文中所揭示之頻譜值(或頻譜係數)之解碼所描述之特徵、功能性及細節中之任一者個別地或組合地補充。
8).根據圖8之音訊編碼(頻譜值編碼)
圖8展示可由本文中所描述之音訊編碼器中之任一者執行的功能性之流程圖。
應注意,參考圖8(且亦關於下圖)所描述之功能性中之一些或所有可併入圖3、圖4、圖5及圖6之音訊編碼器中。
亦應注意,圖8聚焦於頻譜值之編碼,頻譜值通常可為經量化頻譜值。較佳地,但非必要,頻譜值為由二進位二的補碼表示所表示之帶記號整數值。
如流程圖800中所展示之功能性包含對全局增益之第一估計810。此估計可例如基於一組頻譜值來進行,該組頻譜值可與音訊內容之訊框相關聯,且亦可考慮位元預算(或等效地,位元速率預算)。
如圖8中所展示,音訊編碼器或音訊編碼之功能性亦包含使用全局增益之第一估計值或使用全局增益之經細化估計值(其可以迭代方式獲得)的頻譜係數(或等效地,頻譜值)之量化814。在步驟814中,計算或估計編碼經量化頻譜(其可由經量化頻譜係數或經量化頻譜值表示)所需之位元數目。
基於在步驟818中執行的對所需位元數目之此計算或估計,可任選地在步驟822中調整或細化全局增益,以藉此獲得全局增益之經改良估計值。
因此,藉由執行步驟810、814及818及任選地步驟822,可獲得「全局增益資訊」(或一般而言描述頻譜值之量化的資訊),此產生量化,使得位元之預期數目至少大致適配位元預算。然而,應注意,鑒於複雜性約束,全局增益資訊可能並不完全適當,使得取決於全局增益資訊而量化之頻譜值之編碼相比於位元預算仍可能消耗較多或較少位元。
應注意,關於全局增益之計算或關於量化的任何細節對於本發明並非必需的。實際上,根據本發明之實施例將與提供經量化頻譜值之任何機制一起作用,使得頻譜值可在不過度違反位元預算之情況下被編碼。
功能性800進一步包含執行模式決定830。然而,執行模式決定可被視為任選的,此係由於僅使用一個模式(在本文中指定為「第二模式」)之音訊編碼器亦係可能的。模式決定830任選地包含最末編碼係數之模式相依
識別。取決於模式決定,可以不同方式執行最末編碼係數之判定。
若使用「第一模式」,則可決定不編碼一些非零頻譜值,以便節省位元(且保持在位元預算之內)。在此狀況下,與最末編碼頻譜係數相關聯之頻率可選擇為小於存在非零頻譜值所處之最大頻率。因此,高頻率區中之一些非零頻譜值可能並非在第一模式中編碼。
相比之下,在第二模式中,針對所有非零頻譜係數至少編碼最高有效位元。因此,最末編碼係數可例如選擇為最高頻率非零頻譜值。
在第一模式及第二模式二者中提供描述將被編碼之最高頻率頻譜值的指數作為控制資訊「lastnz」。
在下文中,將描述「第一模式」中之操作,從而參考功能性840至869。
第一模式中之操作包含算術編碼器初始化840。在此步驟中,將初始化算術編碼器之狀態及脈絡。
在步驟844中,將編碼一些旁側資訊,如指出第一模式之使用的模式資訊、全局增益及識別最末編碼係數之資訊(lastnz)。
針對各頻譜值,或針對各組頻譜值重複功能性848至864。應注意,在一較佳實施例中,將編碼包含二個頻譜值之組。然而,個別頻譜值之編碼亦係可能的。
頻譜值之實際編碼包含對一頻譜係數或對一組頻譜係數之最高有效位元權重判定。舉例而言,檢查
一個或二個頻譜係數之數表示,且識別哪一者為包含「1」之最高值位元位置。舉例而言,二進位值「00010000」包含其在位元位置5處之最高有效位元,具有位元權重16。若考慮待一起編碼之一對頻譜值,則判定該二個頻譜值之最高有效位元位置之最大值。對於任選細節,參考下文待提供之「步驟7a」之描述(參見圖10a之描述)。
在步驟852中,將編碼最高有效位元權重,此可例如藉由提供特定經編碼符號之序列來進行,其中特定經編碼符號之數目指出位元位置(或等效地,位元權重)。舉例而言,可使用算術寫碼中已知的所謂「逸出符號」。對於關於功能性852之任選細節,例如參考下文所提供之「步驟7b」之論述(參見圖10c)。
隨後,執行最高有效位元編碼856。在此步驟中,編碼所識別之最高有效位元位元位置處(或鄰近於所識別之最高有效位元位元位置)之一或多個位元(例如,二個位元)。舉例而言,若在步驟848中識別出具有位元權重16之位元位置5,則具有第一頻譜值之位元位置5及4(位元權重16及8)之位元可與第二頻譜值之位元位置5及4(具有位元權重16及8)處之位元一起編碼。因此,在實例中,總計四個位元可一起編碼,其中通常二個頻譜值中之至少一者將具有位元位置5(位元權重16)處之「1」。舉例而言,可使用基於脈絡之算術寫碼將四個所提及位元映射至符號「sym」上。對於任選細節,例如參考下文所提供之「步驟7c」之描述(參見圖10d)。
在步驟860中,對剩餘位元進行編碼。在步驟860中,可例如針對已在步驟856中編碼且包含多於一或多個最高有效位元之位元(例如,numbits>2)的所有頻譜值編碼(所有)較低有效位元(包括一或多個最低有效位元)。
換言之,對於已部分地(但非完全)在步驟856中編碼(此係因為一或多個最高有效位元之編碼不足以表示具有完整準確度之頻譜值,下至具有位元權重1之位元)之各頻譜值,將編碼所有較低有效位元。
參考以上實例,若已在步驟856中針對第一頻譜值及針對第二頻譜值編碼位元5及4,則將在步驟860中針對第一頻譜值及針對第二頻譜值編碼位元1、2及3。
對於任選細節,參考習知方法之步驟7d之描述。
在步驟864中,對已編碼一或多個最高有效位元所針對之所有非零頻譜值進行記號編碼。對於任選細節,參考步驟7e之描述(參見圖10f)。
如先前所提及,針對各頻譜值或針對各組頻譜值重複步驟848至864,該等頻譜值之最高有效位元被一起編碼。
在步驟868中,判定所用位元之數目,且在步驟869中,任選地,在仍存在未使用的可用位元之情況下對細化資訊編碼。
總而言之,當在第一模式中操作時,在編碼時跳過一些非零頻譜值,但實際上編碼之所有頻譜值皆以
完整解析度(直至最低有效位元)編碼。因此,可藉由決定不編碼多少頻譜值(在編碼時跳過)來變化所需位元速率。
在下文中,將參考功能性870至898描述第二模式中之操作,在一些實施例中,第二模式可為唯一模式。
第二模式中之編碼包含算術編碼器初始化870,在算術編碼器初始化870中將初始化算術編碼之脈絡中之狀態。
在步驟874中,將編碼一些旁側資訊,如全局增益資訊、「lastnz」及指出使用第二模式之模式資訊(假設編碼器可在第一模式與第二模式之間切換)。
針對待編碼之各頻譜值,或針對待聯合地編碼之各組頻譜值執行功能性878至894。
在步驟878中,對頻譜係數(或頻譜值)或對數組頻譜係數(或頻譜值)進行最高有效位元權重判定。對於任選細節,參考關於功能性848之解釋且亦參考以下「步驟7a」之描述(參見圖10a)。
在步驟882中,進行最低有效位元消除及最低有效位元資訊處理。舉例而言,在此等頻譜值之數表示中消除最低有效位元資訊,該等頻譜值包含一或多個最高有效位元及最低有效位元二者(numbits>2)。舉例而言,所有奇數頻譜值可設定成下一(鄰近)偶數值,偶數值之絕對值小於奇數值之絕對值。舉例而言,值1可設定成0,值3可設定成2,值-1可設定成0,且值-3可設定成-2。對於任選細節,參見下文提及之步驟1010f、1011f。
然而,關於最低有效位元之資訊以及關於頻譜值之記號之資訊(若頻譜值自+1設定成0或自-1設定成0)可儲存於最低有效位元資訊位元流(例如,lsbs[])中。對於細節,例如參考下文描述之「步驟7a之二」(參見圖10b)。
此外,存在最高有效位元權重編碼886,其可等於最高有效位元權重編碼852。對於任選細節,參見步驟7b(圖10c)之描述。
另外,存在最高有效位元編碼890,其可等同於最高有效位元編碼856,除了使用在步驟882中修改之頻譜值(其中最低有效位元值被移除)。對於任選細節,參看步驟7c及圖10d之描述。
此外,存在較低有效位元編碼892。在較低有效位元編碼892中,存在除一或多個最低有效位元以外的較低有效位元之編碼。換言之,可例如藉由將最低有效位元與在步驟890中編碼之一或多個最高有效位元之間的位元寫入至位元流中來對其編碼。對於任選細節,參考「步驟7d-新版本」之以下描述(參見圖10e)。
此外,存在記號編碼894,其與記號編碼864實質上相同,除了該記號係基於如步驟882中修改之頻譜值而判定。
舉例而言,若最初(經量化)頻譜值為+1,則頻譜值已在步驟882中變成0,且在步驟894中不存在記號編碼,此係因為此記號僅針對非零值編碼。類似地,若頻譜值最初為-1(在量化之後),則在步驟882中將頻譜值修
正成0,且在步驟894中不編碼記號(此係因為不針對零值編碼記號)。
對於關於記號編碼之任選細節,參考步驟7e(圖10f)之描述。
針對所有頻譜值或所有組頻譜值重複步驟878至894,該等頻譜值之最高有效位元被聯合地編碼。
在步驟896中,判定可用於編碼最低有效位元之位元的數目。此數目例如以nlsbs指定,且可例如指定未使用之位元之數目。
在步驟898中,將未使用之位元(其數目係在步驟896中判定)用於最低有效位元之「實際」編碼(將在步驟882中獲得之最低有效位元資訊或其部分包括至經編碼音訊表示中)。舉例而言,將在步驟882中判定之位元序列或其一部分添加至經編碼音訊表示。此位元序列包含藉由消除最低有效位元而已變成零之彼等頻譜值的最低有效位元及記號。
因此,在第二模式中,提供表示一或多個最高有效位元之符號、表示除一或多個最低有效位元以外之較低有效位元(及一些記號資訊)的位元序列,及表示最低有效位元(及一些記號資訊)之位元序列。在表示較低有效位元之序列中,可逐頻譜值(spectral-value-by-spectral-value)或針對經聯合地編碼之頻譜值對依序包括較低有效位元(及記號)。另外,在表示最低有效位元之位元序列中,逐頻譜值包括最低有效位元。
應注意,下文將描述關於編碼800之其他任選細節。亦應注意,對步驟之偽程式碼表示之參考包括於圖8中。偽程式碼表示中所描述之細節並非必需的,但可任選地針對圖8中所展示之步驟中之每一者個別地包括。
9.根據圖9之音訊解碼(頻譜值解碼)
圖9展示可由如本文中所描述之音訊解碼器執行的功能性之示意性表示。
應注意,圖9中所描述之功能性中之一些或所有由音訊解碼器執行。應注意,個別地實施圖9中所描述之功能性中之一者或數者係足夠的,但較佳實施完整功能性。詳言之,圖9中所揭示之功能性係關於基於表示頻譜值之經編碼資訊提供經解碼頻譜值。如圖9中所展示之功能性可例如實施於音訊解碼器700之解碼720中。
功能性900包含步驟910中對算術解碼器狀態之初始化及對算術解碼器所使用之脈絡c之初始化。對於任選細節,例如參考如下文所描述之解碼之「步驟1」。
功能性900亦包含全局增益或全局增益資訊之解碼914、用於模式選擇(模式1或模式2之選擇)之信令位元的解碼916,及關於最末非零編碼係數之資訊(「lastnz」)的解碼918。應注意,步驟916及918應被視為任選的,且步驟914可由定義量化之任何其他資訊的解碼來代替。
功能性900包含步驟930至948中所展示的第一模式中之解碼及步驟950至972中所展示的第二模式
中之解碼。應注意,如步驟930至948中所描述,第一模式中之操作應被視為任選的。換言之,音訊解碼可在由步驟950至972描述之第二模式中操作亦係足夠的,即使在二個模式之間切換之可能性擴展了功能性且帶來一些優點亦如此。
此外,功能性900亦包含執行經解碼頻譜值之反量化980,反量化980可例如由解碼器700中之區塊730執行。
在下文中,將描述第一模式中之操作。
第一模式中之解碼包含最高有效位元解碼930,其可例如包含二個係數之一個、二個或多於二個最高有效位元的聯合解碼,該等係數可以Xq(n)及Xq(n+1)指定。最高有效位元解碼930可例如包含判定係數之全部(經編碼)位元(例如,numbits)之數目,或係數之在經聯合編碼最高有效位元之後的較低有效位元之數目。
舉例而言,可由解碼器辨識(例如,基於經編碼音訊表示中之信令資訊),在一起解碼之二個頻譜係數中之一者包含第五位元位置(具有位元權重16)處之非零值(最高有效位元)。因此,位置4及5(具有位元權重8及16)處之位元將針對一起解碼(作為一組)之二個頻譜值聯合地解碼。可例如使用在算術編碼及解碼領域中已知的「逸出符號機制」來編碼最高有效位元之位元位置。對於任選細節,例如參考以下「步驟3a」之描述(圖11a)。
第一模式中之解碼進一步包含較低有效位
元解碼934。舉例而言,可存在已解碼一或多個最高有效位元所針對之所有頻譜值之(所有)較低有效位元的解碼,該等較低有效位元包括一或多個最低有效位元。舉例而言,較低有效位元可自位元序列讀取。對於細節,例如參考如下文所描述之「步驟3b,習知方法」。
第一模式中之解碼包含記號解碼938,在記號解碼938中可針對已在步驟930、934中解碼非零值所針對之所有頻譜值解碼記號。對於細節,例如參考「步驟3c」之以下論述(參見圖11c)。
第一模式中之解碼包含未經寫碼頻譜係數之調零942。舉例而言,頻率高於已自編碼器發信至解碼器之某一頻率的所有頻譜係數可設定成零。對於細節,例如參考「步驟4」之以下描述。
第一模式中之解碼亦包含對未使用之位元之數目的判定944。舉例而言,可判定總位元預算之多少位元尚未用於前述解碼步驟。
第一模式中之解碼可任選地進一步包含細化948,在細化948中,例如,可進一步細化已解碼之頻譜值。對於細節,例如參考「步驟6」之以下描述。
因此,在第一模式中,將完全解碼(自最高有效位元至最低有效位元)直至由關於最末非零經編碼係數資訊之資訊定義之最大頻率的頻譜值,包括記號之解碼。
然而,應注意,在此等步驟中可任選地引入如下文參考「步驟3a」至「步驟6」所描述之細節。然而,
應注意,引入下文所描述之所有細節並非必需的,且在一些實施例中,僅在步驟中之一者或步驟中之一些中保持以下細節係足夠的。
在下文中,將參考步驟950至972描述第二模式中之解碼。
第二模式中之解碼包含最高有效位元解碼950,其可例如包含一或多個最高有效位元之算術解碼。舉例而言,最高有效位元解碼950可包含判定係數之總位元之數目,或係數之較低有效位元之數目,或一或多個最高有效位元之位元位置(或位元權重)。此外,最高有效位元解碼950可包含二個頻譜係數或頻譜值Xq(n)、Xq(n+1)之一個、二個或多於二個最高有效位元的聯合解碼。
對於任選細節,例如參考以下「步驟3a」之描述(圖11a)。
第二模式中之解碼亦包含較低有效位元解碼954,其可被視為任選的。在較低有效位元解碼954中,進行除一或多個最低有效位元以外之較低有效位元的解碼。較低有效位元解碼954可類似於較低有效位元解碼934,除了在較低有效位元解碼954中省略了一最低有效位元或多個最低有效位元。對於任選細節,例如參考「步驟3b」(新版本)之以下描述(圖11b)。
第二模式中之解碼亦包含記號解碼958,在記號解碼958中解碼在步驟950、954中解碼之頻譜值之記號,只要在步驟950、954中解碼之頻譜值之經解碼部分(其
不包含一或多個最低有效位元)指出非零值即可。對於任選細節,例如參考「步驟3c」之以下描述(圖11c)。
應注意,針對所有待解碼之頻譜值,或針對所有組待解碼之頻譜值重複步驟950、954、958,其中待解碼之頻譜值之數目可例如由編碼器所提供之最末非零編碼係數資訊指出。
第二模式中之解碼亦包含未經寫碼頻譜係數之調零962,該等未經寫碼頻譜係數尚未由編碼器提供,且鑒於最末非零編碼係數資訊而尚未解碼。對於任選細節,參看步驟4之以下描述。
此外,存在對可用於最低有效位元解碼之位元之數目的判定968。換言之,判定未使用位元(尚未用於解碼步驟950、954、958的位元預算之位元)之數目。對於細節,例如參考「步驟5」之以下描述。
第二模式中之解碼亦包含針對具有多於一或多個最高有效位元之位元的係數對一或多個最低有效位元進行選擇性解碼972。換言之,可僅針對已在步驟950、954、958中解碼之頻譜值中之一些解碼一或多個最低有效位元,使得僅該等頻譜值中之一些(但非所有)由最低有效位元資訊細化。步驟972可例如包括已在步驟950及954中解碼(使得在步驟958中尚未解碼記號)之零值所針對的且最低有效位元資訊指出非零值所針對的此等頻譜值之記號考慮。因此,頻譜值(或頻譜係數)將由來自包含最低有效位元及記號資訊之位元序列的最低有效位元資訊細化。將
被細化之頻譜值之數目取決於可用於最低有效位元之位元之數目之判定968的結果。
因此,第二模式中之解碼將以完整精確度提供一些頻譜值(包括最低有效位元)且以減小之精確度提供一些頻譜值(無最低有效位元)。
應注意,可任選地使用下文針對「步驟3a」至「步驟6」所描述之細節。然而,下文針對「步驟3a」至「步驟6」所描述之細節不應被視為必需的。另外,應注意,可針對個別步驟引入細節,而不會增加對使用下文參考「步驟3a」至「步驟6」所描述之所有細節的需要。
此外,功能性900亦包含執行反量化980,其中在第一模式中解碼之頻譜值及/或在第二模式中解碼之頻譜值將被反量化。在反量化中,可應用在步驟914中解碼之全局增益資訊。然而,亦可使用用於設定反量化之不同可能性。
10).根據圖10a至圖10f之編碼方法
在下文中,將描述量化及編碼MDCT頻譜X(n),0n<N之步驟的實例實施。該方法可例如用於音訊編碼器300、400、500(或由其執行)或用於音訊編碼器600。本文中所描述之特徵亦可個別地或組合地併入功能性800。詳言之,將聚焦於模式2上之操作,在一些實施例中,模式2可為唯一模式。
在下文中,將描述第一步驟。第一步驟包含全局增益之第一估計。此第一估計例如不量化頻譜,亦不
計算由算術編碼器消耗之位元之數目。其僅基於MDCT係數組之能量及獲得全局增益之第一粗略估計的低複雜性迭代方法。舉例而言,參考NBC規範中之第1.3.8.2章節。
在下文中,將描述第三步驟。第三步驟包含計算編碼經量化頻譜Xq(n)所需之位元的數目。另外,此步驟亦可做出使用習知方法(亦指定為「第一模式」)抑或新方法(亦指定為「第二模式」)的決定。舉例而言,該步驟可設定本文中所提及之信令位元(例如,用信號表示應使用第一模式抑或第二模式之信令位元)。舉例而言,若所消耗位元之數目高於位元預算且滿足一些準則(例如,使用高位元速率),則可使用新方法(第二模式)。若所消耗位元之數目低於位元預算或不滿足準則(例如,用於第二模式之使用的準則),則可使用習知方法(第一模式)。
最後,第三步驟發現最末非零編碼係數lastnz。如習知方法之描述中所描述(亦即,為了截斷頻譜),其僅當選擇習知方法時才被發現(「步驟發現最末非零編碼係數lastnz之指數,使得經截斷頻譜之所消耗位元數目可適配於位元預算內,參看NBC規範中之第1.3.8.4章節」)。若選擇新方法(第二模式),則不截斷頻譜,且lastnz隨後僅對應於最末非零係數(例如,對應於最高頻率非零頻
譜係數)。
在下文中,將描述步驟4。第四步驟包含隨在步驟3中計算之位元數目變化而調整全局增益。若位元數目過高,則全局增益增大。若位元數目過低,則全局增益減小。隨後,任選地重新進行步驟2及3。可若干次地重複步驟4,直至發現最佳全局增益為止。然而,若需要低複雜性,則步驟4可不執行,或可僅執行一次(例如在NBC中,參看NBC規範中之第1.3.8.6章節)。
在下文中,將描述步驟5。步驟5包含算術編碼器狀態之初始化,及由算術編碼器使用之脈絡c之初始化。
在下文中,將描述步驟6。步驟6包含編碼全局增益及最末非零編碼係數lastnz作為旁側資訊。另外,此步驟亦編碼信令位元(例如,指出使用第一模式抑或第二模式之信令位元)作為旁側資訊。
在下文中,將描述步驟7。然而,步驟7包含針對所有重複子步驟7a至7e(n=0;n<lastnz;n+=2)。換言之,只要n小於lastnz,即自n=0開始重複步驟7a至7e,其中n在每次迭代中遞增二。在每次迭代中處理二個頻譜值,且通常將處理所有非零頻譜值(此係由於在模式2中,將選擇lastnz以使得將針對所有非零頻譜值至少編碼最高有效位元)。
在下文中,將描述步驟7a。步驟7a包含計算表示二個係數Xq(n)及Xq(n+1)(其較佳為整數值)之幅值
(或量值,或絕對值)所需的最小位元數目。對於關於實例實施之細節,參考圖10a之偽程式碼(參見參考標號1000a)。具有較大絕對值之係數判定表示二個係數之幅值(量值,絕對值)所需的最小位元數目。
在下文中,將描述步驟7a之二,其可例如在步驟7a與7b之間執行。換言之,步驟7a之二為剛好在步驟7a之後的額外步驟,其係在numbits大於二(numbits>2)之情況下執行。換言之,步驟7a之二係在需要多於二個最高有效位元之位元來表示Xq(n)及/或Xq(n+1)之情況下執行。在步驟7a之二中,保存各係數之最低有效位元,且隨後修改係數,使得其最低有效位元現在為零。在係數最初為非零的且在將其最低有效位元設定成零之後變成零的狀況下,亦保存係數之記號。
對於關於此功能性之細節,例如參考圖10b中所展示之偽程式碼表示。
如在參考標號1010a處可見,絕對值Xq[n]之最低有效位元被擷取且保存於由運行變數nlsbs指出之位置處的位元序列lsbs中(參見:參考符號1010b)。運行變數nlsbs隨後增大以參考位元序列lsbs內下一未使用之位元。若已發現Xq為+1或-1(參考標號1010c處之條件),則在Xq[n]大於0之情況下將記號位元設定成0,且在Xq小於0之情況下將記號位元設定成1,如在參考標號1010d處可見。另外,若Xq為+1或-1,則將記號位元作為下一位元保存於位元序列中,此展示於參考標號1010e處。此外,隨後修正
帶記號之頻譜值Xq,原因在於非偶數值被設定成鄰近具有較小量值之偶數值。此功能性展示於參考標號1010f處。
然而,應注意,可改變處理步驟1010a至1010f之次序,只要總功能性保持不變即可。當然,亦有可能儲存中間量。.
此外,應注意,亦對頻譜值Xq[n+1]執行相同功能性,其展示於元件符號1011a至1011f處。
因此,步驟7a之二提供位元序列lsbs,其表示numbits大於二所針對之所有頻譜值之最低有效位元,其中記號位元包括於numbits大於二所針對之頻譜值之位元序列lsbs中,該等頻譜值採用值+1或-1(例如,因為其在具有較大頻譜值之組中)。序列lsbs中之位元在頻譜值之序列中排序,但在numbits不大於二所針對之此等頻譜值(亦即,其完全由二個最高有效位元表示)之序列lsbs中不存在位元。
在下文中,將描述步驟7b。在此步驟7b中,將編碼關於值「numbits」之資訊(當numbits在步驟7a中被判定且描述針對一頻譜值或一組頻譜值編碼之最高有效位元之位元權重時)。舉例而言,步驟7b包含在numbits大於2之情況下編碼numbits-2逸出值(例如,由VAL_ESC=16表示)。對於細節,參考圖10c(參考標號1020a)。舉例而言,使用算術編碼來編碼逸出值,其中評估脈絡以獲得算術編碼之概率。藉由算術編碼使用概率p來編碼逸出符號。此外,更新脈絡。
然而,此步驟之任何細節對於本發明並非必需的。
在下文中,將描述步驟7c。步驟7c包含編碼各係數Xq(n)及Xq(+1)之二個最高有效位元作為單一符號sym(其值介於0與15之間)。在步驟1040a中,基於值numbits,判定Xq[n]及Xq[n+1]之(二進位)數表示(如在numbits>2之狀況下在步驟7a之二中修改的)將向右側移位多少位元。此展示於參考標號1040a處且可被視為任選的。在步驟1040b中,處理Xq[n],使得位元位置處由numbits判定之位元儲存於變數a中。在步驟1040c中,處理Xq[n+1],使得位元位置處由numbits判定之位元併入變數b中。換言之,位元位置處被視為二個最高有效位元之位元併入變數a及b中。
因此,判定組合Xq[n]及Xq[n+1]之二個最高有效位元的四位元值,如參考標號1040d處所展示。變數sym隨後表示四位元符號,其包含待一起編碼之二個頻譜值中之每一者的二個最高有效位元。隨後,自算術編碼之脈絡c判定算術編碼之概率,且使用算術編碼且考慮自脈絡判定之概率p來編碼符號sym。隨後,更新脈絡。
因此,獲得表示待聯合地編碼之二個頻譜值之二個最高有效位元的符號sym之算術編碼表示。
在下文中,將描述步驟7d。步驟7d包含除最低有效位元以外之剩餘位元(亦指定為「中間位元」或「較低有效位元」之編碼。對於細節,參考圖10e,其展示偽程
式碼表示。如可見,運行變數b自b=1運行至numbits-3。因此,假設在步驟7c中一起編碼之二個最高有效位元至少在位元位置3及4(具有位元值4及8)處或在較高位元位置處,則自位元位置2(具有位元值2)開始編碼位元。因此,編碼頻譜值Xq[n]及Xq[n+1]之絕對值之位元位置(b+1)處的位元作為旁側資訊。因此,在步驟7d中編碼最低有效位元與二個最高有效位元之間的任何位元作為旁側資訊,假設此等位元存在(其取決於如由numbits定義之最高有效位元之位元位置)。
舉例而言,自b=1至b=numbits-3(假設numbits大於或等於4)執行在參考標號1050a處展示之迴路。如在參考標號1050b處可見,編碼Xq[n]之絕對值之位元位置b+1處的位元作為旁側資訊。如在參考標號1050c處可見,向Xq[n+1]之絕對值之位元位置b+1處的位元編碼旁側資訊。重複步驟1050b及1050c,直至運行變數b達至numbits-2。
在下文中,將描述步驟7e。步驟7e包括編碼各係數(或頻譜值)之記號,除非係數為0。應注意,在步驟7e中,考慮在步驟7a之二中修改之係數。換言之,若Xq之初始值(在步驟7a之二中之修改之前)大於或等於2或者小於或等於-2,則將編碼頻譜值Xq之記號。相比之下,若Xq[n]最初等於0或在步驟7a之二中設定成0,則在步驟7e中不存在記號之編碼。關於(經修改)頻譜值Xq[n]是否等於0之檢查在參考標號1060a處可見,且Xq[n]之正值之記號
位元「0」及Xq[n]之負值之記號位元「1」的提供在參考標號1060b處可見。作為旁側資訊之記號值之編碼展示於參考標號1060c處。
亦對Xq[n+1]執行類似功能性,其展示於元件符號1061a、1061b及1061c處。
在下文中,將描述步驟8。步驟8包含完成算術編碼器及計算未使用之位元之數目。舉例而言,可計算總位元預算之多少位元在步驟7b、7c、7d及7e中保持未使用。
在下文中,將描述步驟9。在步驟9中,(若選擇新方法,或若選擇第二模式,或若編碼器僅使用第二模式)不使用殘差量化/編碼(如在習知概念中)。若存在未使用之位元,則此等位元用於編碼保存於lsbs[]中之nlsbs位元(參看步驟7a之二)。換言之,若例如在完成步驟7a至7e之後發現尚未使用位元預算之所有位元,則在步驟7a之二中提供之位元序列lsbs之數個位元將包括至位元流中(或大體而言包括至經編碼音訊表示中)。包括至經編碼音訊表示中之位元序列lsbs之位元數目可例如由未使用之位元之數目判定,使得位元預算被完全使用(例如,直至1或2個位元,或甚至全部)。
總而言之,應注意,當執行圖8之功能性時,可使用本文中所描述之步驟或其細節。舉例而言,可使用此處所描述之步驟1至4或其細節來實施功能性810、814、818、830。
此外,可使用此處所描述之步驟5至9來實施功能性870、874、878、882、886、890、892、894、896及898。然而,應注意,本文中所描述之細節可個別地併入功能性800之步驟中。
11).根據圖11a至圖11d之音訊解碼
在下文中,將參考圖11a至11d描述音訊解碼功能性。此處所描述之解碼功能性可用以基於表示頻譜值之經編碼資訊提供經解碼頻譜值。此處所描述之功能性可例如用於根據圖1及圖2之音訊解碼器及根據圖7之音訊解碼器700(例如,以實施解碼720)。此處所描述之步驟亦可用於功能性900,例如以實施功能性910、950、954、958、962、968、972。
在下文中,將逐步(聚焦於「第二模式」中之解碼或在僅使用第二模式之狀況下)描述用於解碼頻譜值之功能性。
在下文中,將描述第一步驟。第一步驟包含算術解碼器狀態之初始化及由算術解碼器使用之脈絡c之初始化。
在下文中,將描述第二步驟。第二步驟包含解碼全局增益(或全局增益資訊,或描述反量化之任何其他資訊)及最末非零編碼係數資訊「lastnz」。換言之,第二步驟包含解碼一些旁側資訊或控制資訊。另外,第二步驟亦解碼信令位元(例如,定義應使用第一模式抑或第二模式之信令位元)。
在下文中,將描述步驟3。舉例而言,步驟3包含針對所有重複步驟3a至3c(n=0;n<lastnz;n+=2)。換言之,將針對所有待解碼之頻譜值(如由lastnz定義)重複步驟3a至3c,其中將一起處理數組二個頻譜值。
在下文中,將描述步驟3a。步驟3a包含解碼係數(或頻譜值)Xq(n)及Xq(n+1)二者之二個最高有效位元。關於步驟3a之細節展示於圖11a中。
步驟3a包含對變數numbits之判定,其描述二個待解碼之最高有效位元之位元位置。在參考標號1110a處,將變數numbits初始化成1。隨後,在步驟1110b中自脈絡(哪個已在之前初始化)獲得概率p,且在步驟1110c中使用算術解碼且使用概率p來解碼符號sym。隨後,在步驟1110d中更新脈絡,且在步驟1110e中將變數numbits增加1。然而,若經解碼符號sym為逸出符號,則重複步驟1110b、1110c、1110d、1110e。因此,若第一經解碼符號並非逸出符號,則numbits被設定成等於2且待解碼之最高有效位元位置將定義位元位置1及2(具有位元值1及2)處之位元。然而,若藉由算術解碼識別一或多個逸出符號,則變數numbits進一步增大,從而指出待解碼之最高有效位元之較高位元權重,此亦指出有地方置放一或多個最低有效位元。然而,一旦發現最末解碼符號並非逸出符號,就基於經解碼符號判定具有由變數numbits定義之位元權重的最高有效值。舉例而言,若符號由四位元值表示,則使用四個位元值之二個位元來定義頻譜值Xq[n]之
二個最高有效位元,且使用四個位元值之二個位元來定義頻譜值Xq[n+1]之二個最高有效位元。細節在元件符號1110f及1110g處可見。因此,藉由算術解碼來解碼之0、1或更多個逸出符號判定最高有效位元之位元權重,且並非逸出符號之符號定義二個頻譜值之最高有效位元的位元值。
在下文中,將描述步驟3a之二。步驟3a之二為剛好在步驟3a之後的額外步驟。此步驟將numbits保存於陣列numbits[n]中,使得其可稍後在步驟6中再使用。換言之,針對所有對經解碼之頻譜值維持變數numbits之值以供稍後使用。然而,此僅為輔助步驟。
在下文中,將描述步驟3b。步驟3b包含解碼除最低有效位元以外之剩餘位元。對於細節,參考圖11b。應注意,在此處,若numbits大於或等於4,亦即,若頻譜值(或來自一起處理之一對頻譜值之至少一個頻譜值)之二進位數表示包含多於二個最高有效位元及一個最低有效位元之位元(亦即,至少4個位元),則步驟3b僅解碼剩餘位元。隨後,自具有位元位置2之位元開始且朝向具有較高位元位置(若存在)之位元行進,解碼位元位置在最低有效位元與二個最高有效位元之間的此等位元。出於此目的,將運行變數b初始化成1,且只要b小於numbits-2,即執行位元解碼。迴路功能性展示於參考標號1120a處,針對第一頻譜值Xq解碼位元展示於參考標號1120b處,將以位元之位元權重加權的位元添加至第一頻譜值展示於參考標號1120c
處,針對第二頻譜值Xq[n+1]解碼位元展示於參考標號1120d處,且添加由位元之位元權重加權的位元展示於參考標號1120e處。
在下文中,將描述步驟3c。步驟3c包含解碼各係數之記號,除非係數(或頻譜值)為0。
舉例而言,檢查目前為止經解碼之頻譜係數(在步驟3a及3b中,而不考慮最低有效位元)是否等於0(參看參考標號1130a)。若頻譜值Xq[n]不同於0,則解碼記號位元(步驟1130b),且若記號位元等於1(其係在參考標號1130c處檢查),則反轉Xq[n]之記號(參見:參考標號1130d)。對第二頻譜值執行類似功能性,如在元件符號1131a至1131d處所展示。
在下文中,將描述步驟4。在步驟4中,將指數n較大或等於lastnz之所有係數(或頻譜值)設定成0。因此,將尚未由編碼器(其由旁側資訊「lastnz」發信)編碼之彼等頻譜係數設定成定義明確的值(0)。
在下文中,將描述步驟5。
步驟5包含完成算術解碼器及計算未使用之位元之數目。舉例而言,可計算在步驟3a、3b及3c中已解碼多少位元,且可接著推斷總位元預算之多少位元目前為止尚未使用。
在下文中,將描述步驟6。在第6步驟中,若存在未使用之位元,則解碼nlsbs位元且將其儲存於lsbs[]中。換言之,將使用nlsbs位元之序列來進行最低有效位元
細化,其中該等位元可直接使用或可儲存於中間資料結構中,如陣列lsbs[]。隨後,若numbits[n]大於2(對於具有指數n及n+1之各別頻譜值),則使用經解碼lsb位元(或最低有效位元位元)細化係數(n、n+1)(或頻譜值Xq[n]及Xq[n+1])。
對於細節,參考圖11d。
如在參考標號1140a處可見,將運行變數k初始化成0。隨後,對所有對頻譜值運行迴路處理,其中迴路定義在參考標號1140b處可見。然而,應注意,在迴路處理中跳過不包含多於二個最高有效位元之位元的任何對頻譜值。當前處理之頻譜值對是否包含多於最高有效位元之位元的檢查在參考標號1140c處可見。另外,應注意,在經處理位元之數目達到可用於最低有效位元細化之位元之總數目nlsbs的任何狀況下(即使尚未考慮多於二個最高有效位元之位元的所有頻譜值),停止處理(例如,使用最低有效位元資訊對頻譜值進行細化)。迴路處理之中止例如係由命令「中斷」來實現,且可見的是,通常存在關於可用於最低有效位元之細化的最大位元數目是否在評估來自位元序列或陣列lsbs之新位元之前達成的評估。舉例而言,在參考標號1140d處存在是否已評估所有可用位元之檢查,此檢查在讀取來自位元序列或陣列lsbs之新位元之前,該讀取在參考標號1140e處可見。在自位元序列或陣列lsbs讀取位元(在參考標號1140e處)之後,取決於位元值且亦取決於先前解碼之頻譜值Xq[n]之值而採取不同動作。若在
步驟1140e中讀取之細化位元之值為零,則不採取進一步動作(因為位元指出不需要對先前解碼之值進行修正)。相比之下,若在步驟1140e中讀取之細化位元之值為「1」,則所採取之動作係取決於頻譜值Xq[n]之實際值。若頻譜值Xq大於零且若在步驟1140e中讀取之位元為「1」,則頻譜值Xq[n]增加1(亦即,增加最低有效位元值),此在參考標號1140f處可見。若頻譜值Xq[n]為負且在步驟1140e中讀取之位元值為「1」,則頻譜值Xq[n]減少1(亦即,減少最低有效位元值)。
然而,若值Xq為0且在步驟1140e中讀取之位元之位元值為「1」,則自位元序列或陣列lsbs讀取另一位元,如在參考號1140i處所展示,其中步驟1140i中對另一位元之讀取係在可用位元之總數目是否已達成(此導致由「中斷」命令中止迴路)的檢查之後。隨後,取決於在步驟1140i中讀取之「記號位元」之值選擇性地將Xq[n]之值設定成+1或-1,此展示於參考標號1140j處。隨後,針對第二頻譜值Xq[n+1]重複步驟1140d至1140j。
總而言之,只要可用於細化最低有效位元的位元序列或陣列lsbs之位元並未完全用完,即存在對來自該位元序列或陣列lsbs之「細化位元」的處理。若先前解碼之頻譜值Xq[n]、Xq[n+1]不同於0,則取決於自位元序列或陣列lsbs讀取之「細化位元」將該頻譜值之量值增加最低有效位元值。若先前解碼之頻譜值Xq[n]、Xq[n+1]為0,則另外自位元序列或陣列lsbs擷取「記號位元」,且在先
前(第一)細化位元指出頻譜值應由最低有效位元值修改的狀況下,記號位元決定頻譜值Xq[n]、Xq[n+1]應設定成+1抑或-1。相比之下,若細化位元指出頻譜值Xq[n]、Xq[n+1]之值應保持不變,則不使用記號位元。
換言之,與頻譜值相關聯之第一細化位元可被視為指出頻譜值之量值是否應增加一個最低有效位元值的位元,且僅在先前解碼之頻譜值為0的狀況下使用第二細化位元(記號位元)。
因此,存在關於細化之極高效概念,其中頻譜值之最低有效位元細化通常僅需要一個位元,且其中僅在先前解碼之頻譜值為0的狀況下需要二個位元(決定是否應存在細化之位元及決定記號之位元)。
應注意,此處所描述之功能性可例如用於解碼功能性900。
此處參考偽程式碼詳細論述之特徵可個別地或組合地引入至如圖9中所展示之功能性中。然而,應注意,不必包括各細節及每一細節,且此處所描述之細節在個別地採用時可為有利的。
11).結論
11.1)綜述
在下文中,將概述本發明之一些基本想法。詳言之,本文中所提及之態樣可個別地或與其他態樣組合地實施至本發明之實施例中。
根據本發明之實施例係基於如下發現:在較
低位元速率下,習知方法可能使寫碼效能嚴重降級。已發現,在高位元速率下,高位元預算允許以高精確度量化完整頻譜,甚至高頻率係數。亦已發現,將高頻率係數中之一些設定成0會對高頻率添加大量失真,此會阻礙經解碼輸出信號之透明品質。在圖12中,針對音訊信號之每一訊框且針對低位元速率32kbps及高位元速率128kbps此二個位元速率標繪MDCT頻譜SNR。32kbps下之SNR似乎一致,但128kbps下之SNR有大程度下降。此等下降對應於高頻率係數被截斷之訊框,此係因為所消耗之位元數目超出位元預算。
11.2).習知方法之逐步描述
編碼器
‧步驟1:全局增益之第一估計。此第一估計不量化頻譜亦不計算由算術編碼器消耗之位元之數目。其僅基於MDCT係數組之能量及獲得全局增益之第一粗略估計的低複雜性迭代方法。(參看NBC規範中之第1.3.8.2章節)
‧步驟3:計算編碼經量化頻譜X q (n)所需之位元數目。若位元數目超出位元預算,則此步驟亦發現最末非零編碼係數lastnz之指數,使得經截斷頻譜之所消耗之位元數目
可適配於位元預算內。(參看NBC規範中之第1.3.8.4章節)。
‧步驟4:隨在步驟3中計算之位元數目變化而調整全局增益:若位元數目過高,則增大全局增益;若位元數目過低,則減小全局增益。隨後,重新進行步驟2及3。可若干次地重複步驟4,直至發現最佳全局增益為止。若需要低複雜性,則不執行步驟4,或可僅執行一次(如在NBC中,參看NBC規範中之第1.3.8.6章節)。
‧步驟5:初始化算術編碼器狀態;初始化脈絡c。
‧步驟6:編碼全局增益及最末非零編碼係數lastnz作為旁側資訊。
‧步驟7:針對所有重複以下子步驟(n=0;n<lastnz;n+=2):
o 步驟7a:計算表示二個係數X q (n)及X q (n+1)之幅值所需的最小位元數目
o 步驟7b:若numbits>2,則編碼numbits-2逸出值(VAL_ESC=16)
o 步驟7c:編碼二個係數X q (n)及X q (n+1)之2個最高有效位元作為單一符號sym(其值介於0與15之間)
o 步驟7d:若numbits>2,則編碼剩餘位元
o 步驟7e:編碼各係數之記號,除非係數為零
‧步驟8:完成算術編碼器且計算未使用之位元之數目。
‧步驟9:若存在未使用之位元,則編碼由殘差量化器給出之殘差位元(參看NBC規範中之第1.3.9章節)。
解碼器
‧步驟1:初始化算術解碼器狀態;初始化脈絡c。
‧步驟2:解碼全局增益及最末非零編碼係數lastnz。
‧步驟3:針對所有重複以下子步驟(n=0;n<lastnz;n+=2):
o 步驟3a:解碼二個係數X q (n)及X q (n+1)之2個最高有效位元
o 步驟3b:若numbits>2,則解碼剩餘位元
o 步驟3c:解碼各係數之記號,除非係數為零
‧步驟4:將所有係數n>=lastnz設定成零
‧步驟5:完成算術解碼器且計算未使用之位元之數目。
‧步驟6:若存在未使用之位元,則解碼殘差位元。應用使用殘差位元來細化非零係數之反殘差量化器(參看NBC規範中之第1.4.3章節)。
‧步驟7:反量化:用經解碼MDCT係數乘以全局增益
應注意,如本發明之章節「習知方法之逐步描述」中所描述之步驟1至9可用於習知音訊編碼器及解碼器,且亦可用於根據本發明之音訊編碼器或解碼器在第一編碼模式中操作的情況。
舉例而言,習知方法之逐步描述中所描述之編碼器步驟1至9可用以實施功能性810、814、818、840、844、848、852、856、860、864、868及869。上文在習知方法之逐步描述中所描述之編碼器步驟1、2、4、5、6、7a、7c、7e及8亦可用於根據本發明之實施例的音訊編碼器,例如以實施功能性810、814、818、822、870、874、878、886、890、894及896(例如,當在新的第二模式中工作時)。
當在「第一模式」中操作時,解碼器步驟1、2、3、3a、3b、3c、4、5、6、7亦可用於根據本發明之音訊解碼,例如以實施步驟910、914、918、930、934、938、942、944、948、980。
此外,解碼器步驟1、2、3、3a、3c、4、5及7亦可用以在本發明之解碼器中實施功能性910、914、918、950、958、962、968及980(例如,當在「第二模式」中操作時)。
11.3).所提出之發明之態樣
在下文中,將描述對習知方法中所使用之編碼器步驟及解碼器步驟的改良及擴展。
已發現,在高位元速率下,在編碼器步驟1至4中計算之經量化MDCT頻譜Xq[n]含有具高幅值之係數。已發現,表示此等係數(編碼器步驟7a)之幅值所需的最小位元數目因此較高,且在大多數狀況下大於2。因此,在大多數狀況下,存在每係數至少一個最低有效位元(LSB),其作為旁側資訊被編碼,如編碼器步驟7d中所描述。此等最低有效位元(LSB)為不太重要的資訊,且已發現,該等最低有效位元可經移除而對SNR之影響相對較小。已發現,實際上,相比於在習知方法中將整個係數設定成0(亦即,將最高有效位元MSB及最低有效位元LSB二者設定成0),該影響小得多。
根據所提出之發明之實施例因此係基於如下想法:當編碼經量化MDCT資料所消耗之位元之數目超出位元預算時,截斷最低有效位元LSB比截斷高頻係數更高效。然而,此僅在經量化MDCT頻譜係數具有高幅值因此處於高位元速率下時係有利的(或可能的)。因此,所提出之發明將一個信令位元作為旁側資訊添加至位元流(其
中該信令位元可例如描述使用「第一模式」抑或「第二模式」)。此位元用信號表示使用習知方法(例如,如習知方法之逐步描述章節中所描述)抑或新方法(如例如在所提出之發明之實施例的逐步描述章節中所描述)。應注意,在所消耗之位元數目低於位元預算之狀況下,不需要新方法,且信令位元可經設定以觸發習知方法。舉例而言,僅在所消耗之位元數目超出位元預算且滿足一些準則(例如,高位元速率)時使用新方法。
在圖13中,進行與先前圖式(圖12)相同的實驗,除了根據所提出之發明之實施例係用於128kbps之高位元速率狀況。128kbps下之SNR現在似乎一致得多,所有下降皆已消失。
11.4).所提出之發明之實施例的逐步描述
在下文中,將逐步描述根據本發明之實施例。在此描述中,亦將參考章節11.2中所提供之習知方法之逐步描述,此係由於可併入習知方法之若干步驟。
換言之,章節11.2中所描述之此等步驟中之大多數在此處相同。因此,此處將僅描述不同的步驟。
編碼器
‧步驟3:此步驟仍計算編碼經量化頻譜X q (n)所需之位元數目。另外,此步驟亦必須做出使用先前技術方法抑或新方法之決定(亦即,設定先前章節中所提及之信令位元)
在以下情況下使用新方法:所消耗位元高於位元預
算且滿足一些準則(例如,高位元速率)
在以下情況下使用先前技術:所消耗位元低於位元預算,或不滿足準則
最後,該步驟發現最末非零編碼係數lastnz。已發現其僅在選擇先前技術方法時才類似於章節11.2中所描述之情況(亦即,以便截斷頻譜)。若選擇新方法,則不截斷頻譜且lastnz隨後僅僅對應於最末非零係數。
‧步驟6:另外,此步驟現在亦編碼信令位元作為旁側資訊
若選擇先前技術方法,則其他編碼器步驟相同。若選擇新方法,則添加/修改以下步驟。
o 步驟7a之二:此為剛好在步驟7a之後的額外步驟,其係在numbits>2之情況下執行。保存各係數之最低有效位元且隨後修改係數,使得其LSB現在為零。在係數最初為非零的且在將其LSB設定成零之後變成零的狀況下,亦保存係數之記號。
o 步驟7d:編碼除最低有效位元以外之剩餘位元
‧步驟9:若選擇新方法,則不使用殘差量化/編碼。若存在未使用之位元,則使用此等位元來編碼保存於lsbs[]中之nlsbs位元(參看步驟7a之二)。
解碼器
‧步驟2:另外,此步驟現在亦解碼信令位元
若選擇先前技術方法,則其他解碼器步驟相同。若選擇新方法,則添加/修改以下步驟。
o 步驟3a之二:此為剛好在步驟3a之後額外步驟。其將numbits保存於numbits[n]中,因此其可稍後在步驟6中再使用。
o 步驟3b:解碼除最低有效位元以外之剩餘位元
‧步驟6:若存在未使用之位元,則解碼nlsbs位元且將其儲存於lsbs[]中。若numbits[n]>2,則使用經解碼LSB位元細化係數(N,n+1)。
12.根據圖14至圖18之方法
圖14至圖15展示根據本發明之實施例的用於音訊解碼之方法之流程圖。
圖16至圖18展示根據本發明之實施例的用於音訊解碼之方法之流程圖。
應注意,該等方法可由本文中關於對應設備所描述之特徵及功能性中之任一者且由所提及功能性中之任一者個別地或組合地補充。
13.實施替代方案
儘管已在設備之脈絡中描述一些態樣,但顯然,此等態樣亦表示對應方法之描述,其中區塊或裝置對應於方法步驟或方法步驟之特徵。類似地,方法步驟之脈絡中所描述的態樣亦表示對應區塊或項目或對應設備之特
徵的描述。可由(或使用)硬體設備(比如微處理器、可程式化電腦或電子電路)執行方法步驟中之一些或全部。在一些實施例中,可由此設備執行最重要的方法步驟中之一或多者。
本發明之經編碼音訊信號可儲存於數位儲存媒體上或可在諸如無線傳輸媒體之傳輸媒體或諸如網際網路之有線傳輸媒體上傳輸。
取決於某些實施要求,本發明之實施例可在硬體或軟體中實施。可使用其上儲存有與可程式化電腦系統協作(或能夠協作)之電子可讀控制信號以使得執行各別方法之數位儲存媒體(例如,軟碟、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體)來執行實施。因此,數位儲存媒體可為電腦可讀的。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等控制信號能夠與可程式化電腦系統協作,使得執行本文中所描述之方法中之一者。
大體而言,本發明之實施例可實施為具有程式碼之電腦程式產品,當電腦程式產品運行於電腦上時,程式碼操作性地用於執行該等方法中之一者。程式碼可例如儲存於機器可讀載體上。
其他實施例包含儲存於機器可讀載體上的用於執行本文中所描述之方法中之一者的電腦程式。
換言之,本發明方法之實施例因此為電腦程式,其具有用於在電腦程式於電腦上運行時執行本文中所
描述之方法中之一者的程式碼。
因此,本發明方法之另一實施例為資料載體(或數位儲存媒體,或電腦可讀媒體),其包含記錄於其上的用於執行本文中所描述之方法中之一者的電腦程式。資料載體、數位儲存媒體或所記錄媒體通常係有形的及/或非瞬變的。
因此,本發明方法之另一實施例為表示用於執行本文中所描述之方法中的一者之電腦程式之資料串流或信號序列。資料串流或信號序列可(例如)經組配以經由資料通訊連接,例如經由網際網路而傳送。
另一實施例包含處理構件,例如經組配或經調適以執行本文中所描述之方法中之一者的電腦或可程式化邏輯裝置。
另一實施例包含上面安裝有用於執行本文中所描述之方法中之一者的電腦程式之電腦。
根據本發明之另一實施例包含經組配以(例如,電子地或光學地)將用於執行本文中所描述之方法中之一者的電腦程式傳送至接收器的設備或系統。接收器可(例如)為電腦、行動裝置、記憶體裝置或類似者。設備或系統可(例如)包含用於將電腦程式傳送至接收器之檔案伺服器。
在一些實施例中,可程式化邏輯裝置(例如,場可程式化閘陣列)可用以執行本文中所描述之方法的功能性中之一些或全部。在一些實施例中,場可程式化閘陣
列可與微處理器協作,以便執行本文中所描述之方法中之一者。通常,該等方法較佳地由任何硬體設備來執行。
本文中所描述之設備可使用硬體設備或使用電腦或使用硬體設備與電腦之組合來實施。
本文中所描述之設備或本文中所描述之設備的任何組件可至少部分地以硬體及/或以軟體來實施。
本文中所描述之方法可使用硬體設備或使用電腦或使用硬體設備與電腦的組合來進行。
本文中所描述之方法或本文中所描述之設備的任何組件可至少部分地由硬體及/或由軟體來執行。
上述實施例僅說明本發明之原理。應理解,對本文中所描述之配置及細節的修改及變化將對本領域熟習此項技術者顯而易見。因此,意圖為僅受到接下來之申請專利範圍之範疇限制,而不受到藉由本文中之實施例之描述及解釋所呈現的特定細節限制。
100‧‧‧音訊解碼器
110‧‧‧經編碼音訊資訊
112‧‧‧經解碼音訊資訊
130‧‧‧經編碼資訊
132‧‧‧經解碼頻譜值
Claims (72)
- 一種用於基於經編碼音訊資訊提供經解碼音訊資訊之音訊解碼器,其中該音訊解碼器組配來基於表示頻譜值之一經編碼資訊獲得經解碼的該等頻譜值,其中該音訊解碼器組配來使用一算術解碼,針對一組頻譜值基於個別符號碼聯合地解碼每頻譜值二個或多於二個最高有效位元,其中一個別符號碼表示針對一或多個頻譜值之每頻譜值二個或多於二個最高有效位元,其中該音訊解碼器組配成取決於有多少最低有效位元資訊可用而解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被解碼,而不解碼針對一或多個最高有效位元被解碼所針對之一或多個其他頻譜值的最低有效位元,且該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元;以及其中該音訊解碼器組配成使用該等頻譜值來提供該經解碼音訊資訊。
- 如請求項1之音訊解碼器,其中該音訊解碼器組配來將一算術編碼表示型態之一個符號映射到至少一個頻譜值之至少二個最高有效位元上,該符號表示該至少一個頻譜值之該至少二個最高有效位元。
- 如請求項1之音訊解碼器,其中該算術解碼組配來判定該至少二個最高有效位元之位元位置、且將由該算術編碼表示型態之一符號決定的該至少二個最高有效位元分配予經判定位元位置。
- 如請求項1之音訊解碼器,其中該音訊解碼器組配來針對已解碼二個或多於二個最高有效位元所針對之所有頻譜值解碼一或多個中間位元,該等頻譜值包含多於該二個或多於二個最高有效位元及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該二個或多於二個最高有效位元之間。
- 如請求項1之音訊解碼器,其中該音訊解碼器組配來在一第一解碼階段中:解碼每頻譜值二個或多於二個最高有效位元,以及針對解碼二個或多於二個最高有效位元所針對之所有頻譜值,解碼一或多個中間位元,該等頻譜值包含多於該二個或多於二個最高有效位元及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該二個或多於二個最高有效位元之間,以及針對解碼二個或多於二個最高有效位元所針對的且該二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下指出一非零值所針對的所有頻譜值,解碼記號;且其中該音訊解碼器組配來在該第一解碼階段中選擇性地省略針對該二個或多於二個最高有效位元及任何中間位 元在中間位元存在之情況下指出一零值所針對的頻譜值之一記號的一解碼,且其中該音訊解碼器組配來在該第一解碼階段之後的一第二解碼階段中選擇性地獲得頻譜值之記號資訊,二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針對該等頻譜值指出一零值,且一最低有效位元資訊針對該等頻譜值指出一非零值。
- 如請求項1之音訊解碼器,其中該音訊解碼器組配來依序使用一最低有效位元資訊位元序列之後續位元,以便獲得與該等頻譜值相關聯之最低有效位元值。
- 如請求項6之音訊解碼器,其中該音訊解碼器組配來針對個別頻譜值使用該最低有效位元資訊位元序列之一單一位元,該二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一非零值,其中該最低有效位元資訊位元序列之所用單一位元用以獲得一最低有效位元值;且其中該音訊解碼器組配來針對個別頻譜值使用該最低有效位元資訊位元序列之一單一位元,該二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一零值,且該最低有效位元資訊位元序列之所用單一位元針對該等個別頻譜值確認該零值;且其中該音訊解碼器組配來針對個別頻譜值使用該最低有效位元資訊位元序列之二個後續位元,該二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針 對該等個別頻譜值指出一零值,且該最低有效位元資訊位元序列之所用位元中之一第一者針對該等個別頻譜值指出與該零值偏離一最低有效位元值,其中該最低有效位元資訊位元序列之所用位元中之一第二者決定該個別頻譜值之一記號。
- 如請求項1之音訊解碼器,其中該音訊解碼器組配來解碼始於與一最低頻率頻譜值相關聯之一最低有效位元且朝向與愈來愈高的頻率相關聯之頻譜值行進的最低有效位元,使得頻譜值由最低有效位元資訊在自一最低頻率頻譜值直至有一最末最低有效位元資訊可用之一頻譜值的一範圍內細化,且使得相關聯頻率大於與有該最末最低有效位元資訊可用之該頻譜值相關聯之一頻率的頻譜值保持未細化。
- 如請求項1之音訊解碼器,其中該音訊解碼器組配成可在以下各者之間切換:一第一模式,在該第一模式中,回應於來自編碼器之一信令而省略一較高頻率範圍內之頻譜值之一解碼,且解碼針對解碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及一第二模式,在該第二模式中,解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不解碼針對解碼一或多個最高有效位元所針對之一或多個其他頻 譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元。
- 如請求項9之音訊解碼器,其中該音訊解碼器組配來評估包括於該經編碼音訊資訊中之位元串流旗標,以便決定該音訊解碼器係在該第一模式中抑或在該第二模式中操作。
- 如請求項1之音訊解碼器,其中該音訊解碼器組配來針對至少二個頻譜值基於個別符號碼聯合地解碼每頻譜值二個或多於二個最高有效位元,其中一個別符號碼表示針對至少二個頻譜值之每頻譜值二個或多於二個最高有效位元。
- 如請求項1之音訊解碼器,其中該音訊解碼器組配來根據以下演算法解碼頻譜值:根據以下程序來解碼二個係數X q (n)及X q (n+1)之2個最高有效位元:numbits=1;do{自脈絡c獲得概率p用算術解碼及概率p解碼符號sym更新脈絡c numbits++;}while(sym==VAL_ESC)Xq[n]=(sym & 3)<<(numbits-2);Xq[n+1]=(sym>>2)<<(numbits-2);若存在任何剩餘位元,則根據以下程序解碼除了最低 有效位元以外之剩餘位元:for(b=1;b<numbits-2;b++){解碼bit0 Xq[n]+=bit0<<b解碼bit1 Xq[n+1]+=bit1<<b}根據以下程序解碼各係數之記號,除非最高有效位元為零且剩餘位元為零:if(Xq[n]!=0){解碼bit0 if(bit0==1){Xq[n]=-Xq[n];}}if(Xq[n+1]!=0){解碼bit1 if(bit1==1){Xq[n+1]=-Xq[n+1];}}將所有係數n>=lastnz設定成零,其中lastnz係基於自經編碼音訊表示型態獲得之一旁側資訊來獲得;完成該算術解碼且計算未使用位元的數目; 若存在未使用之位元,則解碼nlsbs位元且將其儲存於資料結構lsbs[]中;若numbits[n]>2,則根據以下程序使用經解碼LSB來細化該等係數(X q (n),X q (n+1)):
- 一種用於基於經編碼音訊資訊提供經解碼音訊資訊之音訊解碼器,其中該音訊解碼器組配來基於表示頻譜值之一經編碼資訊獲得經解碼的該等頻譜值, 其中該音訊解碼器組配來針對多個頻譜值基於個別符號碼解碼一或多個最高有效位元,且針對該等頻譜值中之一或多者解碼一或多個最低有效位元,其中該音訊解碼器組配成可在以下各者之間切換:一第一模式,在該第一模式中,回應於來自編碼器之一信令而省略一較高頻率範圍內之頻譜值之一解碼,且解碼針對解碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,且該等頻譜值包含多於該等最高有效位元之位元,以及一第二模式,在該第二模式中,解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不解碼針對已解碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,且該一或多個其他頻譜值包含多於該等最高有效位元之位元;以及其中該音訊解碼器組配成使用該等頻譜值來提供該經解碼音訊資訊。
- 如請求項13之音訊解碼器,其中有算術解碼組配來判定該一或多個最高有效位元之位元位置且將由算術編碼表示型態之一符號決定的該一或多個最高有效位元分配予所決定位元位置。
- 如請求項13之音訊解碼器,其中該音訊解碼器組配來針對已解碼一或多個最高有效位元所針對之所有頻譜值解碼一或多個中間位元,該等頻譜值包含多於該一或多個最高有效位元及一最低有效位元之位元,該 一或多個中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。
- 如請求項13之音訊解碼器,其中該音訊解碼器組配成當在該第二模式中操作時,在一第一解碼階段中:解碼每頻譜值一或多個最高有效位元,以及針對解碼一或多個最高有效位元所針對之所有頻譜值,解碼一或多個中間位元,該等頻譜值包含多於該一或多個最高有效位元及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間,以及針對解碼一或多個最高有效位元所針對的且該一或多個最高有效位元及任何中間位元在中間位元存在之情況下指出一非零值所針對的所有頻譜值,解碼記號;且其中該音訊解碼器組配成當在該第二模式中操作時,在該第一解碼階段中選擇性地省略針對該一或多個最高有效值及任何中間位元在中間位元存在之情況下指出一零值所針對的頻譜值之一記號的一解碼,且其中該音訊解碼器組配成當在該第二模式中操作時,在該第一解碼階段之後的一第二解碼階段中,選擇性地獲得頻譜值之記號資訊,該一或多個最高有效值及任何中間位元在中間位元存在之情況下針對該等頻譜值指出一零值,且一最低有效位元資訊針對該等頻譜值指出一非零值。
- 如請求項13之音訊解碼器,其中該音 訊解碼器組配成當在該第二模式中操作時,依序使用一最低有效位元資訊位元序列之後續位元,以便獲得與該等頻譜值相關聯之最低有效位元值。
- 如請求項17之音訊解碼器,其中該音訊解碼器組配成當在該第二模式中操作時,針對個別頻譜值使用該最低有效位元資訊位元序列之一單一位元,該一或多個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一非零值,其中該最低有效位元資訊位元序列之所用單一位元用以獲得一最低有效位元值;且其中該音訊解碼器組配成當在該第二模式中操作時,針對個別頻譜值使用該最低有效位元資訊位元序列之一單一位元,該一或多個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一零值,且該最低有效位元資訊位元序列之所用單一位元針對該等個別頻譜值確認該零值;且其中該音訊解碼器組配成當在該第二模式中操作時,針對個別頻譜值使用該最低有效位元資訊位元序列之二個後續位元,該一或多個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一零值,且該最低有效位元資訊位元序列之所用位元中之一第一者針對該等個別頻譜值指出與該零值偏離一最低有效位元值,其中該最低有效位元資訊位元序列之所用位元中之一第二者決定該個別頻譜值之一記號。
- 如請求項13之音訊解碼器,其中該音訊解碼器組配成當在該第二模式中操作時,解碼始於與一最低頻率頻譜值相關聯之一最低有效位元且朝向與愈來愈高的頻率相關聯之頻譜值行進的最低有效位元,使得頻譜值由最低有效位元資訊在自一最低頻率頻譜值直至有一最末最低有效位元資訊可用之一頻譜值的一範圍內細化,且使得相關聯頻率大於與有該最末最低有效位元資訊可用之該頻譜值相關聯之一頻率的頻譜值保持未細化。
- 如請求項13之音訊解碼器,其中該音訊解碼器組配來評估包括於該經編碼音訊資訊中之一位元串流旗標,以便決定該音訊解碼器係在該第一模式中抑或在該第二模式中操作。
- 如請求項13之音訊解碼器,其中該音訊解碼器組配來在該第一模式中自一連續位元序列獲得中間位元及與一給定頻譜值相關聯之該最低有效位元,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間,且其中該音訊解碼器組配來在該第二模式中自分別位元序列或自一位元序列之分別非連續位元位置獲得中間位元及與一給定頻譜值相關聯之該最低有效位元,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。
- 如請求項13之音訊解碼器,其中該音 訊解碼器組配成取決於該一或多個最高有效位元、該中間位元及該最低有效位元是否指出一零值,僅于該第一模式中在該一或多個最高有效位元、任何中間位元及與一給定頻譜值相關聯之該最低有效位元之一解碼之後,選擇性地獲得與一頻譜值相關聯之一記號資訊,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間,且其中該音訊解碼器組配成取決於該一或多個最高有效位元及該中間位元是否指出一零值,在該一或多個最高有效位元及任何中間位元之一解碼之後,但在該第二模式中解碼與一給定頻譜值相關聯之一最低有效位元之前,選擇性地獲得與一頻譜值相關聯之一記號資訊,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。
- 一種用於基於輸入音訊資訊提供經編碼音訊資訊之音訊編碼器,其中該音訊編碼器組配來獲得表示該輸入音訊資訊之一音訊內容的頻譜值,且其中該音訊編碼器組配來編碼至少多個該等頻譜值,以便獲得表示該等頻譜值之一經編碼資訊;其中該音訊編碼器組配來使用一算術編碼,針對一組頻譜值聯合地編碼每頻譜值二個或多於二個最高有效位元,以獲得個別符號碼,其中一個別符號碼表示針對一或多個頻譜值之每頻譜 值二個或多於二個最高有效位元,其中該音訊編碼器組配成取決於可用的位元預算而編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被編碼,而不編碼針對編碼二個或多於二個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,且該一或多個其他頻譜值包含多於該二個或多於二個最高有效位元之位元;以及其中該音訊編碼器組配成使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
- 如請求項23之音訊編碼器,其中該算術編碼組配來判定至少二個最高有效位元之位元位置,且將描述該等位元位置之一資訊包括於算術編碼表示型態中。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來將至少一個頻譜值之至少二個最高有效位元映射至一算術編碼表示型態之一個符號上,該符號表示該至少一個頻譜值之該至少二個最高有效位元。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來針對編碼二個或多於二個最高有效位元所針對之所有頻譜值編碼一或多個中間位元,該等頻譜值包含多於該二個或多於二個最高有效位元及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位 元與該二個或多於二個最高有效位元之間。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來在一第一編碼階段中:編碼每頻譜值二個或多於二個最高有效位元,以及針對編碼二個或多於二個最高有效位元所針對之所有頻譜值,編碼一或多個中間位元,該等頻譜值包含多於該二個或多於二個最高有效位元及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該二個或多於二個最高有效位元之間,以及針對編碼二個或多於二個最高有效位元所針對的且該二個或多於二個最高有效位元及任何中間位元在中間位元存在之情況下指出一非零值所針對的所有頻譜值,編碼記號;且其中該音訊編碼器組配來在該第一編碼階段中選擇性地省略針對二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下指出一零值所針對的頻譜值之一記號的一編碼,且其中該音訊編碼器組配成在一第二編碼階段中,選擇性地編碼頻譜值之記號資訊,該二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針對該等頻譜值指出一零值,且一最低有效位元資訊針對該等頻譜值指出一非零值。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配成在編碼此等頻譜值之最低有效位元的情況 下,針對僅與零相差一最低有效位元之頻譜值,僅將一記號資訊包括於經編碼音訊表示型態中。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來依序提供一最低有效位元資訊位元序列之後續位元,以便編碼與該等頻譜值相關聯之最低有效位元值。
- 如請求項29之音訊編碼器,其中該音訊編碼器組配來針對該二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下指出一非零值所針對的個別頻譜值,提供該最低有效位元資訊位元序列之一單一位元,其中該最低有效位元資訊位元序列之所用單一位元用以編碼一最低有效位元值;且其中該音訊編碼器組配來針對個別頻譜值提供該最低有效位元資訊位元序列之一單一位元,該二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一零值,且該最低有效位元資訊位元序列之所提供單一位元針對該等個別頻譜值確認該零值;且其中該音訊編碼器組配來針對個別頻譜值提供該最低有效位元資訊位元序列之二個後續位元,該二個或多於二個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一零值,且該最低有效位元資訊位元序列之所提供位元中之一第一者針對該等個別頻譜值指出與該零值偏離一最低有效位元值,其中該最低有效位元 資訊位元序列之所提供位元中之一第二者編碼該個別頻譜值之一記號。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來編碼始於與一最低頻率頻譜值相關聯之一最低有效位元且朝向與愈來愈高的頻率相關聯之頻譜值行進的最低有效位元,使得供最低有效位元資訊用於細化頻譜值之經編碼資訊提供於自一最低頻率頻譜值直至提供一最末最低有效位元資訊所針對之一頻譜值的一範圍內,且使得對於相關聯頻率大於與提供該最末最低有效位元資訊所針對之頻譜值相關聯之一頻率的頻譜值,不提供由最低有效位元資訊用於細化頻譜值之經編碼資訊。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配成可在以下各者之間切換:一第一模式,在該第一模式中,在可用位元預算由一較低頻率範圍內之頻譜值之一編碼用完的狀況下省略一較高頻率範圍內之非零頻譜值之一編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及一第二模式,在該第二模式中,編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元。
- 如請求項32之音訊編碼器,其中該音訊編碼器組配來提供包括於該經編碼音訊資訊中之一位元串流旗標,以便指出該音訊編碼器係在該第一模式中抑或在該第二模式中操作。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來針對至少二個頻譜值使用個別符號碼聯合地編碼每頻譜值二個或多於二個最高有效位元,其中一個別符號碼表示針對至少二個頻譜值之每頻譜值二個或多於二個最高有效位元。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來判定一最高頻率非零頻譜值,且編碼所有非零頻譜值或所有非零頻譜值組之所有非零頻譜值之至少二個或多於二個最高有效位元。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來編碼除所有非零頻譜值之一最低有效位元以外的所有位元,且其中該音訊編碼器組配來編碼頻譜值之最低有效位元,直至位元預算耗盡。
- 如請求項23之音訊編碼器,其中該音訊編碼器組配來獲得一增益資訊,該增益資訊決定頻譜值之量化的量化步階,且決定對編碼經量化頻譜值之位元需求。
- 一種用於基於輸入音訊資訊提供經編碼音訊資訊之音訊編碼器, 其中該音訊編碼器組配來獲得表示該輸入音訊資訊之一音訊內容的頻譜值,以及其中該音訊編碼器組配來編碼至少多個該等頻譜值,以便獲得表示該等頻譜值之一經編碼資訊;其中該音訊編碼器組配成針對多個該等頻譜值編碼一或多個最高有效位元以獲得個別符號碼,及針對該等頻譜值中之一或多者編碼一或多個最低有效位元,其中一個別符號碼表示針對一或多個頻譜值之一或多個最高有效位元值,其中該音訊編碼器組配成可在以下各者之間切換:一第一模式,在該第一模式中,在可用位元預算由一較低頻率範圍內之頻譜值之一編碼用完的狀況下省略一較高頻率範圍內之非零頻譜值之一編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及一第二模式,在該第二模式中,編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元;其中該音訊編碼器組配來使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來在該第二模式中編碼所有非零頻譜值或所 有非零頻譜值組之至少一或多個最高有效位元。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配成當在該第一模式中操作時,在位元預算不足之狀況下限制編碼頻譜值所針對之一頻率範圍,使得在編碼頻譜值時不考慮一或多個頻譜值。
- 如請求項40之音訊編碼器,其中該音訊編碼器組配成當在該第一模式中操作時決定一最大頻率值,及當在該第一模式中操作時編碼頻譜值直至該最大頻率,且當在該第一模式中操作時不編碼高於該最大頻率之頻譜值,即使該等頻譜值非零亦如此,其中該音訊編碼器組配成當在該第一模式中操作時,取決於對編碼所有頻譜值之位元需求的一計算或估計來選擇該最大頻率值,使得在經計算或經估計位元需求超出位元預算之情況下,待編碼之頻譜值數目減小,且其中該音訊編碼器組配成當在該第二模式中操作時決定該最大頻率值,且當在該第二模式中操作時編碼頻譜值直至該最大頻率,且當在該第二模式中操作時不編碼高於該最大頻率之頻譜值,其中該音訊編碼器組配成當在該第二模式中操作時,選擇該最大頻率值,使得所有非零頻譜值或所有非零頻譜值組的至少一或多個最高有效位元被編碼,且使得至多零值頻譜值未被編碼。
- 如請求項40之音訊編碼器,其中該音訊編碼器組配來將描述該最大頻率之一資訊包括於該經編 碼音訊資訊中。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配成取決於一可用位元速率做出使用該第一模式抑或該第二模式之一模式決定。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配成取決於頻譜值或頻譜值組之一數目做出使用該第一模式抑或該第二模式之一模式決定,該等頻譜值或頻譜值組包含除在一最高有效位元編碼步驟中編碼之一或多個最高有效位元之外的一或多個最低有效位元,該一或多個最低有效位元之一編碼可取決於位元需求及位元預算選擇性地省略。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來將一位元串流旗標包括於該經編碼音訊資訊中指出該音訊編碼器係在該第一模式中抑或在該第二模式中操作。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配成在該第一模式中將中間位元及與一給定頻譜值相關聯之最低有效位元編碼入一連續位元序列中,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間,且其中該音訊編碼器組配成在該第二模式中將中間位元及與一給定頻譜值相關聯之該最低有效位元編碼入分別位元序列或位元序列之分別非連續位元位置中,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位 元之間。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配成當在該第一模式中操作時,在與中間位元相關聯之位元序列中編碼與一頻譜值相關聯之一記號資訊及最低有效位元,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間,且其中該音訊編碼器組配成當在該第二模式中操作時,在與中間位元及記號資訊相關聯之一位元序列中,或在與最低有效位元及記號資訊相關聯之一位元序列中,選擇性地編碼與一頻譜值相關聯之一記號資訊,使得僅與零偏離一最低有效位元值之頻譜值所針對之記號資訊被編碼在與最低有效位元及記號資訊相關聯之該位元序列中,該等中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。
- 如請求項38之音訊編碼器,其中該算術編碼組配來決定該一或多個最高有效位元之位元位置,且將描述該等位元位置之一資訊包括於算術編碼表示型態中。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來將至少一個頻譜值之至少二個最高有效位元映射至一算術編碼表示型態之一個符號上,該符號表示該至少一個頻譜值之該至少二個最高有效位元。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來針對編碼一或多個最高有效位元所針對之 所有頻譜值編碼一或多個中間位元,該等頻譜值包含多於該一或多個最高有效位元及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來在一第一編碼階段中:編碼每頻譜值一或多個最高有效位元,以及針對編碼一或多個最高有效位元所針對之所有頻譜值,編碼一或多個中間位元,該等頻譜值包含多於該一或多個最高有效位元及一最低有效位元之位元,該一或多個中間位元之位元位置在該最低有效位元與該一或多個最高有效位元之間,以及針對編碼一或多個最高有效位元所針對的且該一或多個最高有效位元及任何中間位元在中間位元存在之情況下指出一非零值所針對的所有頻譜值,編碼記號;以及其中該音訊編碼器組配來在該第一編碼階段中選擇性地省略一或多個最高有效值及任何中間位元在中間位元存在之情況下指出一零值所針對的頻譜值之一記號的一編碼,且其中該音訊編碼器組配來在該第一編碼階段之後的一第二編碼階段中,選擇性地編碼頻譜值之記號資訊,該一或多個最高有效值及任何中間位元在中間位元存在之情況下針對該等頻譜值指出一零值,且一最低有效位元資訊針對該等頻譜值指出一非零值。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來針對僅與零相差一最低有效位元之頻譜值,在編碼此等頻譜值之最低有效位元的情況下,僅將一記號資訊包括於經編碼音訊表示型態中。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來依序提供一最低有效位元資訊位元序列之後續位元,以便編碼與該等頻譜值相關聯之最低有效位元值。
- 如請求項53之音訊編碼器,其中該音訊編碼器組配來針對該一或多個最高有效值及任何中間位元在中間位元存在之情況下指出一非零值所針對的個別頻譜值,提供該最低有效位元資訊位元序列之一單一位元,其中該最低有效位元資訊位元序列之所用單一位元用以編碼一最低有效位元值;且其中該音訊編碼器組配來針對個別頻譜值提供該最低有效位元資訊位元序列之一單一位元,該一或多個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一零值,且該最低有效位元資訊位元序列之所提供單一位元針對該等個別頻譜值確認該零值;且其中該音訊編碼器組配來針對個別頻譜值提供該最低有效位元資訊位元序列之二個後續位元,該一或多個最高有效值及任何中間位元在中間位元存在之情況下針對該等個別頻譜值指出一零值,且該最低有效位元資訊位元序列之所提供位元中之一第一者針對該等個別頻譜值指出與該 零值偏離一最低有效位元值,其中該最低有效位元資訊位元序列之所提供位元中之一第二者編碼該個別頻譜值之一記號。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來編碼始於與一最低頻率頻譜值相關聯之一最低有效位元且朝向與愈來愈高的頻率相關聯之頻譜值行進的最低有效位元,使得供最低有效位元資訊用於細化頻譜值之經編碼資訊提供於自一最低頻率頻譜值直至提供一最末最低有效位元資訊所針對之一頻譜值的一範圍內,且使得對於相關聯頻率大於與提供該最末最低有效位元資訊所針對之頻譜值相關聯之一頻率的頻譜值,不提供由最低有效位元資訊用於細化頻譜值之經編碼資訊。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配成可在以下各者之間切換:一第一模式,在該第一模式中,在可用位元預算由一較低頻率範圍內之經編碼頻譜值用完的狀況下省略一較高頻率範圍內之非零頻譜值之一編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及一第二模式,在該第二模式中,與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被編碼,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於 該最高有效位元之位元。
- 如請求項56之音訊編碼器,其中該音訊編碼器組配來提供包括於該經編碼音訊資訊中之一位元串流旗標,以便指出該音訊編碼器係在該第一模式中抑或在該第二模式中操作。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來針對至少二個頻譜值使用個別符號碼聯合地編碼每頻譜值一或多個最高有效位元,其中一個別符號碼表示針對至少二個頻譜值之每頻譜值一或多個最高有效位元。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配成當在該第二模式中操作時判定一最高頻率非零頻譜值,且編碼所有非零頻譜值或所有非零頻譜值組之至少一或多個最高有效位元。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來當在該第二模式中操作時,編碼除所有非零頻譜值之一最低有效位元以外之所有位元,且其中該音訊編碼器組配來編碼頻譜值之最低有效位元,直至位元預算耗盡。
- 如請求項38之音訊編碼器,其中該音訊編碼器組配來獲得一增益資訊,該增益資訊決定頻譜值之量化的量化步階,且決定對經量化頻譜值之編碼的位元需求。
- 一種用於基於輸入音訊資訊提供經編 碼音訊資訊之音訊編碼器,其中該音訊編碼器組配來獲得表示該輸入音訊資訊之一音訊內容的頻譜值,以及其中該音訊編碼器組配來編碼至少多個該等頻譜值,以便獲得表示該等頻譜值之一經編碼資訊;其中該音訊編碼器組配來獲得一增益資訊,該增益資訊決定頻譜值之量化的量化步階,且決定對編碼經量化頻譜值之位元需求;其中該音訊編碼器組配來使用一算術編碼,針對多個該等頻譜值使用個別符號碼編碼一或多個最高有效位元,及針對該等頻譜值中之一或多者編碼一或多個最低有效位元,其中一個別符號碼表示針對一或多個頻譜值之每頻譜值一或多個最高有效位元,其中該音訊編碼器組配成取決於可用的位元預算而編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被編碼,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元;且其中該音訊編碼器組配來使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
- 如請求項62之音訊編碼器,其中該音訊編碼器組配來基於頻譜值組之一能量獲得該增益資訊之一第一估計值,使用增益資訊之該第一估計值來量化一組頻譜值,計算或估計編碼該組頻譜值所需之位元數目,該組頻譜值係使用增益資訊之該第一估計值或使用一經細化增益資訊來量化,且取決於所需之位元數目而決定使用該第一模式抑或該第二模式。
- 如請求項62之音訊編碼器,其中該音訊編碼器組配成可在以下各者之間切換:一第一模式,在該第一模式中,在可用位元預算由一較低頻率範圍內之經編碼頻譜值用完的狀況下省略一較高頻率範圍內之非零頻譜值之一編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及一第二模式,在該第二模式中,與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被編碼,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元;且其中該音訊編碼器組配成取決於所需之位元數目且取決於指出有多少頻譜值包含多於該一或多個最高有效位元之位元的準則而決定使用該第一模式抑或該第二模式。
- 如請求項62之音訊編碼器,其中該音訊編碼器組配成可在以下各者之間切換:一第一模式,在該第一模式中,在可用位元預算由一較低頻率範圍內之經編碼頻譜值用完的狀況下省略一較高頻率範圍內之非零頻譜值之一編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及一第二模式,在該第二模式中,與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被編碼,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元;且其中該音訊編碼器組配成取決於所需之該位元數目且取決於位元速率而決定使用該第一模式抑或該第二模式,使得在位元速率大於或等於一臨界位元速率之情況下及在編碼該組頻譜值所需之一經計算或經估計位元數目大於位元預算的情況下選擇該第二模式。
- 一種用於基於經編碼音訊資訊提供經解碼音訊資訊之方法,其中該方法包含基於表示頻譜值之一經編碼資訊獲得經解碼頻譜值,其中該方法包含使用一算術解碼,針對一組頻譜值基於個別符號碼聯合地解碼每頻譜值二個或多於二個最高有效位元,其中一個別符號碼表示針對一或多個頻譜值之每頻譜 值二個或多於二個最高有效位元,其中該方法包含取決於有多少最低有效位元資訊可用而解碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被解碼,而不解碼針對解碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元;且其中該方法包含使用該等頻譜值來提供該經解碼音訊資訊。
- 一種用於基於經編碼音訊資訊提供經解碼音訊資訊之方法,其中該方法包含基於表示頻譜值之一經編碼資訊獲得經解碼頻譜值,其中該方法包含針對多個頻譜值基於個別符號碼解碼一或多個最高有效位元,以及針對該等頻譜值中之一或多者解碼一或多個最低有效位元,其中該方法包含在以下各項之間進行選擇:一第一模式,在該第一模式中,回應於來自編碼器之一信令而省略一較高頻率範圍內之頻譜值之一解碼,且解碼針對解碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及 一第二模式,在該第二模式中,與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被解碼,而不解碼針對已解碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元;且其中該方法包含使用該等頻譜值來提供該經解碼音訊資訊。
- 一種用於基於輸入音訊資訊提供經編碼音訊資訊之方法,其中該方法包含獲得表示該輸入音訊資訊之一音訊內容的頻譜值,且其中該方法包含編碼至少多個頻譜值,以便獲得表示該等頻譜值之一經編碼資訊;其中該方法包含使用一算術編碼,針對一組頻譜值聯合地編碼每頻譜值二個或多於二個最高有效位元,以獲得個別符號碼,其中一個別符號碼表示針對一或多個頻譜值之每頻譜值二個或多於二個最高有效位元,其中該方法包含取決於可用的位元預算而編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被編碼,而不編碼針對編碼二個或多於二個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該二個或多於二個最 高有效位元之位元;且其中該方法包含使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
- 一種用於基於輸入音訊資訊提供經編碼音訊資訊之方法,其中該方法包含獲得表示該輸入音訊資訊之一音訊內容的頻譜值,且其中該方法包含編碼至少多個頻譜值,以便獲得表示該等頻譜值之一經編碼資訊;其中該方法包含針對多個該等頻譜值編碼一或多個最高有效位元以獲得個別符號碼,以及針對該等頻譜值中之一或多者編碼一或多個最低有效位元,其中一個別符號碼表示針對一或多個頻譜值之一或多個最高有效位元值,其中該方法包含在以下各項之間進行選擇:一第一模式,在該第一模式中,在可用位元預算由一較低頻率範圍內之頻譜值之一編碼用完的狀況下省略一較高頻率範圍內之非零頻譜值之一編碼,且編碼針對編碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及一第二模式,在該第二模式中,與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被編碼,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於 該等最高有效位元之位元;其中該方法包含使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
- 一種用於基於輸入音訊資訊提供經編碼音訊資訊之方法,其中該方法包含獲得表示該輸入音訊資訊之一音訊內容的頻譜值,且其中該方法包含編碼至少多個頻譜值,以便獲得表示該等頻譜值之一經編碼資訊;其中該方法包含獲得一增益資訊,該增益資訊決定頻譜值之量化的量化步階,且決定對編碼經量化頻譜值之位元需求;其中該方法包含使用一算術編碼針對多個該等頻譜值使用個別符號碼來編碼一或多個最高有效位元,以及針對該等頻譜值中之一或多者編碼一或多個最低有效位元,其中一個別符號碼表示針對一或多個頻譜值之每頻譜值一或多個最高有效位元,其中該方法包含取決於可用的位元預算而編碼與該等頻譜值中之一或多者相關聯的一或多個最低有效位元,使得與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被編碼,而不編碼針對編碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該一或多個最高有效位元之位元;且 其中該方法包含使用表示該等頻譜值之該經編碼資訊來提供該經編碼音訊資訊。
- 一種電腦程式,其用於在該電腦程式於一電腦上運行時執行如請求項66至70中任一項之方法。
- 一種儲存有經編碼音訊表示型態之數位儲存媒體,該經編碼音訊表示型態包含:表示頻譜值之一經編碼資訊;以及一旗標,其指出一音訊解碼器應在一第一模式中抑或在一第二模式中工作:在該第一模式中,回應於來自編碼器之一信令而省略一較高頻率範圍內之頻譜值之一解碼,且解碼針對解碼一或多個最高有效位元所針對之所有頻譜值的最低有效位元,該等頻譜值包含多於該等最高有效位元之位元,以及在該第二模式中,與該等頻譜值中之一或多者相關聯的一或多個最低有效位元被解碼,而不解碼針對已解碼一或多個最高有效位元所針對之一或多個其他頻譜值的最低有效位元,該一或多個其他頻譜值包含多於該等最高有效位元之位元。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
WOPCT/EP2017/078959 | 2017-11-10 | ||
PCT/EP2017/078959 WO2019091576A1 (en) | 2017-11-10 | 2017-11-10 | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201923738A TW201923738A (zh) | 2019-06-16 |
TWI758556B true TWI758556B (zh) | 2022-03-21 |
Family
ID=60293975
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107139705A TWI758556B (zh) | 2017-11-10 | 2018-11-08 | 調適最低有效位元編碼與解碼之音訊編碼器、音訊解碼器、方法及電腦程式 |
Country Status (15)
Country | Link |
---|---|
US (3) | US11386909B2 (zh) |
EP (3) | EP3707710B1 (zh) |
JP (3) | JP7104785B2 (zh) |
KR (3) | KR102492554B1 (zh) |
CN (3) | CN111656443B (zh) |
AR (1) | AR113482A1 (zh) |
AU (3) | AU2018365309B2 (zh) |
BR (3) | BR112020009325A2 (zh) |
CA (3) | CA3148963A1 (zh) |
MX (3) | MX2020004770A (zh) |
RU (3) | RU2769218C2 (zh) |
SG (3) | SG11202004287YA (zh) |
TW (1) | TWI758556B (zh) |
WO (2) | WO2019091576A1 (zh) |
ZA (3) | ZA202003441B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020253941A1 (en) * | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
CN112735446B (zh) * | 2020-12-30 | 2022-05-17 | 北京百瑞互联技术有限公司 | 在lc3音频码流中添加额外信息的方法、系统及介质 |
CN112992166B (zh) * | 2021-05-08 | 2021-08-20 | 北京百瑞互联技术有限公司 | 一种动态调整lc3音频编码速率的方法、装置及存储介质 |
CN114550732B (zh) * | 2022-04-15 | 2022-07-08 | 腾讯科技(深圳)有限公司 | 一种高频音频信号的编解码方法和相关装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110238426A1 (en) * | 2008-10-08 | 2011-09-29 | Guillaume Fuchs | Audio Decoder, Audio Encoder, Method for Decoding an Audio Signal, Method for Encoding an Audio Signal, Computer Program and Audio Signal |
US20120022881A1 (en) * | 2009-01-28 | 2012-01-26 | Ralf Geiger | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
US20130226594A1 (en) * | 2010-07-20 | 2013-08-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using an optimized hash table |
US20150081312A1 (en) * | 2010-01-12 | 2015-03-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value |
US20150154969A1 (en) * | 2012-06-12 | 2015-06-04 | Meridian Audio Limited | Doubly compatible lossless audio bandwidth extension |
Family Cites Families (186)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
JPH0811644A (ja) | 1994-06-27 | 1996-01-16 | Nissan Motor Co Ltd | ルーフモール取付構造 |
US6167093A (en) | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
KR100322706B1 (ko) * | 1995-09-25 | 2002-06-20 | 윤종용 | 선형예측부호화계수의부호화및복호화방법 |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
WO1999016050A1 (en) | 1997-09-23 | 1999-04-01 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
KR100335609B1 (ko) * | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
JP3344962B2 (ja) | 1998-03-11 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置、及びオーディオ信号復号化装置 |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6992626B2 (en) * | 1999-03-05 | 2006-01-31 | Rannoch Corporation | Method and apparatus to correlate aircraft flight tracks and events with relevant airport operations information |
EP1139665A1 (en) | 2000-03-29 | 2001-10-04 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for changing the output delay of audio or video data encoding |
US7099830B1 (en) | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6735561B1 (en) | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6665638B1 (en) | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
US7395209B1 (en) * | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
AU2001270365A1 (en) | 2001-06-11 | 2002-12-23 | Ivl Technologies Ltd. | Pitch candidate selection method for multi-channel pitch detectors |
US7512535B2 (en) | 2001-10-03 | 2009-03-31 | Broadcom Corporation | Adaptive postfiltering methods and systems for decoding speech |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
DE10217297A1 (de) * | 2002-04-18 | 2003-11-06 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4728568B2 (ja) * | 2002-09-04 | 2011-07-20 | マイクロソフト コーポレーション | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
JP4431568B2 (ja) | 2003-02-11 | 2010-03-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声符号化 |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
US20040162866A1 (en) | 2003-02-19 | 2004-08-19 | Malvar Henrique S. | System and method for producing fast modulated complex lapped transforms |
KR100923301B1 (ko) * | 2003-03-22 | 2009-10-23 | 삼성전자주식회사 | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
KR101063562B1 (ko) | 2003-06-17 | 2011-09-07 | 파나소닉 주식회사 | 수신 장치, 전송 장치 및 송신 시스템 |
CN100508030C (zh) | 2003-06-30 | 2009-07-01 | 皇家飞利浦电子股份有限公司 | 一种编码/解码音频信号的方法及相应设备 |
US7620545B2 (en) * | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
KR100550003B1 (ko) | 2003-07-11 | 2006-02-08 | 학교법인연세대학교 | 상호부호화기에서 개회로 피치 추정 방법 및 그 장치 |
WO2005027096A1 (en) * | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
KR20050087956A (ko) * | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
DE102004009954B4 (de) | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
ATE390683T1 (de) | 2004-03-01 | 2008-04-15 | Dolby Lab Licensing Corp | Mehrkanalige audiocodierung |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
KR100561869B1 (ko) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
US7392195B2 (en) * | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
MX2007012187A (es) | 2005-04-01 | 2007-12-11 | Qualcomm Inc | Sistemas, metodos y aparatos para deformacion en tiempo de banda alta. |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
KR20070037945A (ko) | 2005-10-04 | 2007-04-09 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US20070118361A1 (en) | 2005-10-07 | 2007-05-24 | Deepen Sinha | Window apparatus and method |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
WO2007070007A1 (en) | 2005-12-14 | 2007-06-21 | Matsushita Electric Industrial Co., Ltd. | A method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
CN101395661B (zh) | 2006-03-07 | 2013-02-06 | 艾利森电话股份有限公司 | 音频编码和解码的方法和设备 |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
DE602007003023D1 (de) | 2006-05-30 | 2009-12-10 | Koninkl Philips Electronics Nv | Linear-prädiktive codierung eines audiosignals |
CN1983909B (zh) | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
CN101501761B (zh) | 2006-08-15 | 2012-02-08 | 杜比实验室特许公司 | 无需边信息对时域噪声包络的任意整形 |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
US7752038B2 (en) | 2006-10-13 | 2010-07-06 | Nokia Corporation | Pitch lag estimation |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
US20100010810A1 (en) | 2006-12-13 | 2010-01-14 | Panasonic Corporation | Post filter and filtering method |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
JP5618826B2 (ja) | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US10795949B2 (en) | 2007-07-26 | 2020-10-06 | Hamid Hatami-Hanza | Methods and systems for investigation of compositions of ontological subjects and intelligent systems therefrom |
JP4981174B2 (ja) * | 2007-08-24 | 2012-07-18 | フランス・テレコム | 確率テーブルの動的な計算によるシンボルプレーン符号化/復号化 |
US20110035212A1 (en) | 2007-08-27 | 2011-02-10 | Telefonaktiebolaget L M Ericsson (Publ) | Transform coding of speech and audio signals |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
KR101290622B1 (ko) | 2007-11-02 | 2013-07-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 복호화 방법 및 장치 |
WO2009066869A1 (en) | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
RU2439718C1 (ru) | 2007-12-31 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
RU2475868C2 (ru) | 2008-06-13 | 2013-02-20 | Нокиа Корпорейшн | Способ и устройство для маскирования ошибок кодированных аудиоданных |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2311034T3 (pl) | 2008-07-11 | 2016-04-29 | Fraunhofer Ges Forschung | Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio |
KR101518532B1 (ko) * | 2008-07-11 | 2015-05-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램 |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
WO2010031049A1 (en) | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
BRPI0914056B1 (pt) | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificação/decodificação de áudio comutado multi-resolução |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US20100223061A1 (en) * | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
US8352252B2 (en) | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
AU2010305383B2 (en) | 2009-10-08 | 2013-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
EP3693964B1 (en) | 2009-10-15 | 2021-07-28 | VoiceAge Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
CN102667921B (zh) * | 2009-10-20 | 2014-09-10 | 弗兰霍菲尔运输应用研究公司 | 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法 |
PL2473995T3 (pl) * | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
US8207875B2 (en) * | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
US7978101B2 (en) * | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
US9020812B2 (en) | 2009-11-24 | 2015-04-28 | Lg Electronics Inc. | Audio signal processing method and device |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
SG10201604880YA (en) | 2010-07-02 | 2016-08-30 | Dolby Int Ab | Selective bass post filter |
KR101676477B1 (ko) * | 2010-07-21 | 2016-11-15 | 삼성전자주식회사 | 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법 |
US9082416B2 (en) | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
JP5625126B2 (ja) | 2011-02-14 | 2014-11-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
EP2686848A1 (en) | 2011-03-18 | 2014-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frame element positioning in frames of a bitstream representing audio content |
CN105336337B (zh) | 2011-04-21 | 2019-06-25 | 三星电子株式会社 | 针对语音信号或音频信号的量化方法以及解码方法和设备 |
US8891775B2 (en) | 2011-05-09 | 2014-11-18 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
US9363339B2 (en) | 2011-07-12 | 2016-06-07 | Hughes Network Systems, Llc | Staged data compression, including block level long range compression, for data streams in a communications system |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
CN103493130B (zh) | 2012-01-20 | 2016-05-18 | 弗劳恩霍夫应用研究促进协会 | 用以利用正弦代换进行音频编码及译码的装置和方法 |
KR101621287B1 (ko) | 2012-04-05 | 2016-05-16 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 다채널 오디오 신호 및 다채널 오디오 인코더를 위한 인코딩 파라미터를 결정하는 방법 |
US20130282373A1 (en) | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9026451B1 (en) | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
EP2874149B1 (en) | 2012-06-08 | 2023-08-23 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame error and method and apparatus for audio decoding |
FR2992766A1 (fr) | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
CN104885149B (zh) | 2012-09-24 | 2017-11-17 | 三星电子株式会社 | 用于隐藏帧错误的方法和设备以及用于对音频进行解码的方法和设备 |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9318116B2 (en) | 2012-12-14 | 2016-04-19 | Disney Enterprises, Inc. | Acoustic data transmission based on groups of audio receivers |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
KR102238376B1 (ko) | 2013-02-05 | 2021-04-08 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치 |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
PL3011555T3 (pl) | 2013-06-21 | 2018-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Rekonstrukcja ramki sygnału mowy |
EP2830065A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
RU2638734C2 (ru) | 2013-10-18 | 2017-12-15 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодирование спектральных коэффициентов спектра аудиосигнала |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
KR101854296B1 (ko) | 2013-10-31 | 2018-05-03 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 |
JP6396459B2 (ja) | 2013-10-31 | 2018-09-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張 |
MX356164B (es) * | 2013-11-13 | 2018-05-16 | Fraunhofer Ges Forschung | Codificador para codificar una señal de audio, sistema de audio de transmisión y método para determinar valores de corrección. |
JP6633547B2 (ja) * | 2014-02-17 | 2020-01-22 | サムスン エレクトロニクス カンパニー リミテッド | スペクトル符号化方法 |
GB2524333A (en) | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
LT3511935T (lt) | 2014-04-17 | 2021-01-11 | Voiceage Evs Llc | Būdas, įrenginys ir kompiuteriu nuskaitoma neperkeliama atmintis garso signalų tiesinės prognozės kodavimui ir dekodavimui po perėjimo tarp kadrų su skirtingais mėginių ėmimo greičiais |
US9396733B2 (en) * | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (zh) | 2014-05-15 | 2018-06-09 | ||
EP2963648A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using vertical phase correction |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
JP6086999B2 (ja) | 2014-07-28 | 2017-03-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法 |
CN112216288A (zh) | 2014-07-28 | 2021-01-12 | 三星电子株式会社 | 用于音频信号的时域数据包丢失隐藏的方法 |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US10296959B1 (en) | 2015-03-30 | 2019-05-21 | Audible, Inc. | Automated recommendations of audio narrations |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
US10049684B2 (en) | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) * | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
KR20180040716A (ko) | 2015-09-04 | 2018-04-20 | 삼성전자주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10219147B2 (en) | 2016-04-07 | 2019-02-26 | Mediatek Inc. | Enhanced codec control |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107103908B (zh) | 2017-05-02 | 2019-12-24 | 大连民族大学 | 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 |
-
2017
- 2017-11-10 WO PCT/EP2017/078959 patent/WO2019091576A1/en active Application Filing
-
2018
- 2018-11-08 KR KR1020207016424A patent/KR102492554B1/ko active IP Right Grant
- 2018-11-08 CN CN201880085999.0A patent/CN111656443B/zh active Active
- 2018-11-08 SG SG11202004287YA patent/SG11202004287YA/en unknown
- 2018-11-08 RU RU2020120256A patent/RU2769218C2/ru active
- 2018-11-08 CA CA3148963A patent/CA3148963A1/en active Pending
- 2018-11-08 KR KR1020207016503A patent/KR102492557B1/ko active IP Right Grant
- 2018-11-08 MX MX2020004770A patent/MX2020004770A/es unknown
- 2018-11-08 EP EP18796482.0A patent/EP3707710B1/en active Active
- 2018-11-08 CN CN202010749863.4A patent/CN111933159B/zh active Active
- 2018-11-08 MX MX2020004768A patent/MX2020004768A/es unknown
- 2018-11-08 JP JP2020526094A patent/JP7104785B2/ja active Active
- 2018-11-08 BR BR112020009325-4A patent/BR112020009325A2/pt unknown
- 2018-11-08 EP EP23218364.0A patent/EP4336503A2/en active Pending
- 2018-11-08 CN CN202010749865.3A patent/CN111933160B/zh active Active
- 2018-11-08 KR KR1020207016504A patent/KR102492558B1/ko active IP Right Grant
- 2018-11-08 EP EP23218359.0A patent/EP4336502A2/en active Pending
- 2018-11-08 TW TW107139705A patent/TWI758556B/zh active
- 2018-11-08 RU RU2020119054A patent/RU2767286C2/ru active
- 2018-11-08 WO PCT/EP2018/080698 patent/WO2019092155A1/en active Application Filing
- 2018-11-08 SG SG11202004279TA patent/SG11202004279TA/en unknown
- 2018-11-08 BR BR122020009464-8A patent/BR122020009464A2/pt unknown
- 2018-11-08 AU AU2018365309A patent/AU2018365309B2/en active Active
- 2018-11-08 CA CA3082282A patent/CA3082282C/en active Active
- 2018-11-08 RU RU2020120251A patent/RU2769255C2/ru active
- 2018-11-08 CA CA3148999A patent/CA3148999C/en active Active
- 2018-11-08 SG SG11202004285TA patent/SG11202004285TA/en unknown
- 2018-11-08 MX MX2020004772A patent/MX2020004772A/es unknown
- 2018-11-08 BR BR122020009462-1A patent/BR122020009462A2/pt unknown
- 2018-11-09 AR ARP180103274A patent/AR113482A1/es active IP Right Grant
-
2020
- 2020-05-08 US US16/870,396 patent/US11386909B2/en active Active
- 2020-05-08 US US16/870,419 patent/US11315583B2/en active Active
- 2020-05-08 US US16/870,361 patent/US11380339B2/en active Active
- 2020-05-10 AU AU2020203074A patent/AU2020203074B2/en active Active
- 2020-05-10 AU AU2020203075A patent/AU2020203075B2/en active Active
- 2020-06-09 ZA ZA2020/03441A patent/ZA202003441B/en unknown
- 2020-07-08 ZA ZA2020/04584A patent/ZA202004584B/en unknown
- 2020-07-08 ZA ZA2020/04583A patent/ZA202004583B/en unknown
- 2020-07-10 JP JP2020118838A patent/JP7104749B2/ja active Active
- 2020-07-10 JP JP2020118837A patent/JP7277065B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110238426A1 (en) * | 2008-10-08 | 2011-09-29 | Guillaume Fuchs | Audio Decoder, Audio Encoder, Method for Decoding an Audio Signal, Method for Encoding an Audio Signal, Computer Program and Audio Signal |
US20120022881A1 (en) * | 2009-01-28 | 2012-01-26 | Ralf Geiger | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
US20150081312A1 (en) * | 2010-01-12 | 2015-03-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value |
US20130226594A1 (en) * | 2010-07-20 | 2013-08-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using an optimized hash table |
US20150154969A1 (en) * | 2012-06-12 | 2015-06-04 | Meridian Audio Limited | Doubly compatible lossless audio bandwidth extension |
Non-Patent Citations (2)
Title |
---|
Aziz Makandar and Vanishree Pattar, "Least Significant Bit Coding Analysis for Audio Steganography", Journal of Future Generation Computing, Vol. 2, No. 3, Mar. 2018 * |
Muhammad Asad, Junaid Gilani, and Adnan Khalid, "An enhanced least significant bit modification technique for audio steganography", International Conference on Computer Networks and Information Technology, 11-13 July 2011; * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI758556B (zh) | 調適最低有效位元編碼與解碼之音訊編碼器、音訊解碼器、方法及電腦程式 | |
JP2021153305A (ja) | 符号化及び復号化のための符号化装置、復号化装置、システム及び方法 |