TWI585750B - 用於音頻編碼與解碼的方法、設備及非暫態性媒體 - Google Patents

用於音頻編碼與解碼的方法、設備及非暫態性媒體 Download PDF

Info

Publication number
TWI585750B
TWI585750B TW102105591A TW102105591A TWI585750B TW I585750 B TWI585750 B TW I585750B TW 102105591 A TW102105591 A TW 102105591A TW 102105591 A TW102105591 A TW 102105591A TW I585750 B TWI585750 B TW I585750B
Authority
TW
Taiwan
Prior art keywords
data
index
value
quantization
audio
Prior art date
Application number
TW102105591A
Other languages
English (en)
Other versions
TW201351395A (zh
Inventor
費南 梅寇特
查爾斯 羅賓森
Original Assignee
杜比實驗室特許公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 杜比實驗室特許公司 filed Critical 杜比實驗室特許公司
Publication of TW201351395A publication Critical patent/TW201351395A/zh
Application granted granted Critical
Publication of TWI585750B publication Critical patent/TWI585750B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/14Conversion to or from non-weighted codes
    • H03M7/24Conversion to or from floating-point codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

用於音頻編碼與解碼的方法、設備及非暫態性媒體
本揭露關於編碼音頻信號或解碼編碼之音頻信號。尤其,本揭露關於量化及反向量化程序。
用於音頻及視訊資料之數位編碼及解碼程序的發展持續以具有娛樂內容之傳遞上的顯著效果。儘管記憶體裝置之容量增加並以愈來愈高之頻寬廣泛傳遞可用資料,存在使儲存及/或傳輸之資料量最小化的持續壓力。音頻及視訊資料通常一起遞送,且用於音頻資料之頻寬通常藉由視訊部分之需求抑制。
因此,音頻資料通常以高壓縮因子編碼,有時以30:1或更高壓縮因子。因為信號失真隨著施加之壓縮量而增加,解碼之音頻資料的保真度及儲存及/或傳輸編碼之資料的效率之間可進行折衷。
再者,希望降低編碼及解碼演算法的複雜性。編碼有關編碼程序之額外資料可簡化解碼程序,但以 儲存及/或傳輸額外編碼之資料為代價。因此,在參數向後調適方法中,用於每一尾數之位元配置資料未編碼。相反地,解碼器必須重新計算來自其他編碼之資訊的位元配置資料。該等方法允許編碼較少資料,但在解碼器端包含相對較大複雜性。類似地,雖然有損尾數編碼程序允許顯著資料壓縮,有關最初尾數值之若干資訊於編碼程序中丟失,尤其是在尾數量化程序期間。儘管現有音頻編碼及解碼方法大體上令人滿意,但希望改進之方法。
本揭露中所說明之主題的若干方面可以編碼或解碼方法實施。若干該等方法可包含接收編碼之音頻資料的訊框,其包括轉換係數資料。轉換係數資料可包括指數資料及尾數資料。尾數資料可包括尾數值,其係以量化間隔之均勻或非均勻邊界編碼。尾數值可至少部分根據有關指數之資訊重建。該等資訊文中可稱為指數設定檔資料。根據指數設定檔資料,可推斷有關預量化尾數值之統計。
依據若干實施,指數設定檔資料可包括指數微分資料。若干該等指數微分資料可為指數差異對,儘管二個以上指數微分資料點可於替代實施中評估。在每一頻率區間,可於指數微分資料上,例如在指數差異對上,調節尾數值重建。
文中所說明之若干方法包含接收編碼之訊框,其包括音頻資料,及回應於從該編碼之訊框提取之資 訊,判定量化器解析度資料。該量化器解析度資料可對應於在量化用於該編碼之訊框之該音頻資料之轉換係數的尾數值之程序期間使用的若干量化間隔。該方法可包含判定來自該編碼之訊框之轉換係數的指數設定檔資料,及至少部分根據該量化器解析度資料及該指數設定檔資料而判定用於該編碼之訊框之該尾數值的複數解量化方法。該方法亦可包含依據該解量化方法解量化該尾數值。
該指數設定檔資料可包括指數微分資料。在若干該等實施中,該指數微分資料可對應於5微分狀態。該指數微分資料可包括例如指數差異對。解量化該尾數值可包含依據對應於一頻率之指數差異對的解量化方法,解量化該頻率之尾數值。該頻率之該指數差異對可包括相對於較低頻率之指數的第一指數差異及相對於較高頻率之指數的第二指數差異。
在若干實施中,於量化尾數值之該程序期間使用的該量化間隔可為均勻量化間隔。然而,在其他實施中,量化間隔可不為均勻量化間隔。在若干實施中,於量化尾數值之該程序期間使用的量化值可對應於量化間隔之邊界之間之中點。然而,至少若干解量化值可未對應於量化間隔之該邊界之間之中點。
至少若干該解量化方法可包含與量化該編碼之訊框之尾數值的該程序期間使用的該量化值不同之解量化值的應用。在若干實施中,該指數設定檔資料可包括該編碼之訊框中無對應尾數值之指數的資料。
文中所說明之若干實施提供一種設備,其包括一或多個介面及邏輯系統。該邏輯系統可包括通用單一或多晶片處理器、數位信號處理器(DSP)、專用積體電路(ASIC)、場可編程閘陣列(FPGA)或其他可編程邏輯裝置、分立閘或電晶體邏輯、或分立硬體組件之一或多者。該邏輯系統可經組配用於從該介面接收編碼之訊框,其包括音頻資料,及用於回應於從該編碼之訊框提取之資訊,判定量化器解析度資料。該編碼之訊框可為各式格式之一者,諸如AC-3格式或增強AC-3格式。該量化器解析度資料可對應於在量化用於該編碼之訊框之該音頻資料之轉換係數的尾數值之程序期間使用的若干量化間隔。
該邏輯系統亦可經組配用於判定來自該編碼之訊框之轉換係數的指數設定檔資料。該邏輯系統可經組配用於至少部分根據該量化器解析度資料及該指數設定檔資料而判定用於該編碼之訊框之該尾數值的複數解量化方法。該邏輯系統亦可經組配用於依據該解量化方法解量化該尾數值。
該設備可包括記憶體裝置。該介面可為邏輯系統及記憶體裝置間之介面。另一方面或此外,介面包含網路介面。
在若干實施中,指數設定檔資料可包括指數微分資料。例如,該指數微分資料包括對應於複數頻率之每一者的指數差異對。在若干該等實施中,該設備包括具有儲存於其上之資料結構的記憶體。該資料結構可包括複 數解量化方法及對應指數微分資料。該邏輯系統可經組配用於藉由參照該資料結構判定對應於指數微分資料之解量化方法。
文中所說明之若干實施可以非暫態性媒體實施,其具有儲存於其上之軟體。該軟體可包括指令用於控制解碼設備以接收編碼之訊框,其包括音頻資料,及回應於從該編碼之訊框提取之資訊,判定量化器解析度資料。該量化器解析度資料可對應於在量化用於該編碼之訊框之該音頻資料之轉換係數的尾數值之程序期間使用的若干量化間隔。
該軟體可包括指令,用於控制解碼設備以判定來自該編碼之訊框之轉換係數的指數設定檔資料,及至少部分根據該量化器解析度資料及該指數設定檔資料而判定用於該編碼之訊框之該尾數值的複數解量化方法。該軟體可包括指令,用於控制解碼設備以依據該解量化方法解量化該尾數值。
文中提供替代方法。若干該等方法可包含接收時域中之第一音頻資料,並將該第一音頻資料轉換為頻域中之第二音頻資料。該第二音頻資料可包括轉換係數。該方法可包含從該轉換係數判定指數資料,其包括指數設定檔資料,及回應於該指數資料判定量化器解析度資料。該量化器解析度資料可對應於量化該轉換係數之尾數值之程序期間使用的若干量化間隔。該方法可包含至少部分根據該量化器解析度資料及該指數設定檔資料而判定用於該 轉換係數之該尾數值的複數解量化方法。該方法可包含依據該解量化方法量化該尾數值。
該方法可包含形成編碼之訊框,其包括該第二音頻資料、該指數資料及該量化尾數值。在若干實施中,於量化尾數值之該程序期間使用的一或多個量化值可未對應於量化間隔之邊界之間之中點。該量化方法之一或多者可使用量化間隔,且邊界未均勻地隔開。
本揭露之替代方面可以一種設備實施,其包括至少一介面及邏輯系統。該邏輯系統可經組配用於從該介面接收編碼之訊框,其包括頻域中之第一音頻資料、指數資料及量化尾數值。該量化尾數值可依據至少部分根據量化器解析度資料及從該指數資料判定之指數設定檔資料的量化方法來判定。
該邏輯系統可經組配用於從該量化尾數值判定解量化尾數值,用於至少部分根據該解量化尾數值來判定轉換係數,及用於使用該轉換係數實施反轉換作業以產生該時域中之第二音頻資料。
附圖及以下說明中提出本說明書中所說明之主題之一或多個實施的細節。從說明、圖式及申請項,其他特徵、方面、及優點將變成顯而易見。請注意,下列圖式之相關尺寸可不依比例尺。
100‧‧‧音頻編碼程序
102‧‧‧輸入樣本
104‧‧‧轉換程序
106、106a、106b‧‧‧轉換係數
108、128‧‧‧程序
110、110a、110b、110c‧‧‧指數值
112a、112b‧‧‧尾數值
114、404‧‧‧位元配置程序
116‧‧‧尾數量化程序
118‧‧‧位元配置參數
120‧‧‧指數資料
122、320‧‧‧量化值
122a、122c、122d、122e、122f、122g‧‧‧量化尾數值
130‧‧‧編碼之訊框
220、250、300、600、700、800‧‧‧圖
225、225a、225b、225c、225i、225j、725、725a、 725b、725c、725f、725g、725h、725i‧‧‧頻率區間
255、255a、255b、255i‧‧‧微分指數值
305、305a、305b、305c、305d、305e、305f、305g‧‧‧量化間隔
310、310a、310c、310d、310e、310f、310g‧‧‧中點
315、315a、315b‧‧‧邊界
400、500‧‧‧音頻解碼程序
402‧‧‧位元流未封裝程序
406‧‧‧尾數解量化程序
408‧‧‧方塊浮點解碼程序
410‧‧‧反轉換程序
412‧‧‧解碼之樣本
505、510、515、520、525、530、535、540、905、910、 915、920、925、930‧‧‧方塊
605、810、815‧‧‧軸
805‧‧‧垂直軸
825‧‧‧點
900‧‧‧方法
1000‧‧‧裝置
1005‧‧‧介面系統
1010‧‧‧邏輯系統
1015‧‧‧記憶體系統
1020‧‧‧揚聲器
1025‧‧‧麥克風
1030‧‧‧顯示系統
1035‧‧‧使用者輸入系統
1040‧‧‧電力系統
圖1為流程圖,描繪音頻編碼程序之範例。
圖2A顯示絕對指數值上指數遮罩程序之一範例。
圖2B顯示微分指數值。
圖3A描繪3級對稱量化程序之範例。
圖3B描繪4級不對稱量化程序之範例。
圖4為流程圖,描繪音頻解碼程序之範例。
圖5為流程圖,描繪包含條件式反向量化器之替代音頻解碼程序之範例。
圖6A顯示轉換係數值之可能性密度函數之範例。
圖6B至6D為圖6A之轉換係數之尾數的可能性密度函數及選擇之指數值。
圖7指出各式頻率之指數值之範例。
圖8描繪依據向後指數微分及向前指數微分之正規化尾數變異之範例。
圖9為流程圖,顯示以條件式反向量化器建立用於音頻解碼方法之參數之程序範例。
圖10為方塊圖,提供編碼器或解碼器設備之組件範例。
在各式圖式中類似代號及命名表示相似元件。
下列說明指向為說明本揭露之若干創新方面 的某實施,以及其中可實施該些創新方面之上下文的範例。然而,文中所述可以各式不同方式應用。儘管本申請案中所提供之範例主要係以AC-3音頻編解碼器(亦已知為「杜比數位」)及增強AC-3音頻編解碼器(亦已知為「杜比數位+」)說明,文中所提供之概念施加於其他音頻編解碼器,包括但不侷限於MPEG-2 AAC及MPEG-4 AAC。再者,所說明之實施可以各式音頻編碼器及/或解碼器實施,其可包括於行動電話、智慧手機、桌上型電腦、手持式或可攜式電腦、輕省筆電(netbook)、筆記型電腦、智慧本(smartbook)、平板電腦、立體聲系統、電視、DVD播放器、數位記錄裝置及各類其他裝置。因此,本揭露所述不希望侷限於圖式及/或文中說明中所示實施,而是具有廣泛適用性。
圖1為流程圖,描繪音頻編碼程序之範例。音頻編碼程序100之作業與所示其他程序及/或文中所說明者相似,不一定以所指出之順序實施。再者,文中所提供之程序可包括較所示及/或說明者更多或更少方塊。音頻編碼程序100及文中所說明之其他音頻編碼及解碼程序可至少藉由可經由硬體、韌體、非暫態性媒體上記錄之軟體等實施之音頻編碼器及/或解碼器予以實施。若干範例於文中別處說明。
在音頻編碼程序100中,時域中之輸入樣本102於轉換程序104中被轉換為頻域。輸入樣本102可分組為於每一訊框中具有多方塊之音頻資料訊框。在若干該 等範例中,轉換程序104包含輸入樣本102之修改之離散餘弦轉換(MDCT)以產生轉換係數106a。然而,其他轉換方法(諸如快速傅立葉轉換或各式分析濾波器組,即正交鏡濾波器組(QMF))可用於替代實施。輸入樣本102之方塊可為視窗及重疊。來自轉換程序104之輸出可抑制於某值內。例如,MDCT之輸出可為「小數表示」,其被抑制於-1.0及1.0之間。
在程序108中,小數表示被轉變為浮點表示用於後續處理。在若干實施中,程序108之輸出可為具有尾數值及指數值之轉換係數。在若干該實施中,程序108之輸出可為下列形式:X=Y2-k [方程式1]
在方程式1中,X代表轉換係數106a,Y代表尾數值112a及k代表指數值110(詳圖1)。在若干實施中,尾數值112a及指數值110可經抑制落於預定範圍內。例如,對於使用AC-3音頻編解碼器之編碼而言,指數值110可大於或等於零。尾數值112a可經抑制以大於或等於0.5及小於或等於1.0。
在程序128之前,可以各種方式處理指數值110,其中,指數值110係包括於音頻資料之編碼之訊框130中。在若干實施中,指數值110可跨越時間及/或頻率分組。當指數值110在時間上相對緩慢改變及/或跨越頻率時,該等分組更加需要。
例如,指數值110可以用於每一頻率組件之 單一指數值110編碼(文中亦稱為「區間(bin)」或「頻率區間(frequency bin)」),其可代表頻率範圍。另一方面,指數值110可以用於多區間之單一指數值110編碼(例如,用於2、4或更多區間)。若指數值110跨越多頻率區間分組,對應於若干區間之指數值110可能需要改變。若然,可改變對應尾數值112a以便維持相等值之每一轉換係數106a。
類似地,指數值110可或不可跨越時間分組。若否,則不同指數值110可編碼用於每一方塊。然而,若單一指數值110跨越多方塊共用,則在其他方塊中之若干指數值110可能需要改變。若然,則可改變對應尾數值112a以便維持相等值用於每一轉換係數106a。
當依據指數值110中之改變而改變尾數值112a時,希望以無損耗的方式進行。在若干實施中,若當對應指數值110改變而尾數值112a被調整高於定限值,尾數值112a將被「剪輯」至最大值(諸如1.0)。該等「剪輯」引發信號失真。因此,當對應指數值110改變時,取代調整尾數值112a高於定限值,較佳的是編碼轉換係數106a之相等值,其具有較低尾數值112a。
圖2A顯示絕對指數值之指數遮罩程序之一範例的結果。在此範例中,圖220描繪一連串絕對指數值110及對應頻率區間225。在本範例中,鄰近指數值110間之微分被抑制為小於±12dB。此處,鄰近區間225i及225j中指數值110a及110b間之微分分別超過12dB。因 此,區間225j之指數值從110b降至110c,作為此指數遮罩程序之結果。在本範例中,調整對應尾數值112a以便維持對應轉換係數106a之相等值。
圖2B顯示微分指數值。圖2B之圖250中所示之微分指數值255對應於指數遮罩程序後圖2A之絕對指數值間之差異。例如,微分指數值255a(-1)對應於區間225b之指數值110及區間225a之指數值110間之差異。微分指數值255b(-2)對應於區間225c之指數值110及區間225b之指數值110間之差異。
在本範例中,微分指數值255被抑制而落於-2至2之範圍內,並具有5可能狀態:-2、-1、0、1或2。因此,微分指數值255i(對應於區間225j之指數值110及區間225i之指數值110間之差異)已從3降至2。再次參照圖1,該些微分指數值255於位元流封裝程序128期間可包括於編碼之訊框130的指數資料120中。指數資料120可包括文中所謂指數設定檔資料。在若干實施中,指數設定檔資料可源自指數資料120。以下說明使用指數設定檔資料之若干範例。
現在將說明編碼尾數值112a之若干範例。位元配置程序114可包括判定每一尾數值112a之最佳量化器解析度。例如,附加信息、指數編碼等所需位元數可從每一訊框可用總位元數扣除。用於每一區間之功率譜密度、頻譜能量估計可從指數值110或藉由使用參考指數值及微分指數值255計算。
可計算及比較每一區間之功率譜密度的考量人類聽覺心理聲學特性之掩蔽曲線。在若干該等實施中,掩蔽曲線將施加於複數頻帶之每一者。亦可施加人類聽覺之絕對定限。
可計算信號遮罩比,其代表每一區間之功率譜密度及對應遮罩值間之差異。在若干實施中,量化器解析度可根據信號遮罩比。例如,於尾數量化程序116期間施加之量化器解析度可與信號遮罩比成比例。在若干實施中,編碼之訊框130中所包括之位元配置參數118可與量化器解析度對應。因此,編碼之訊框130的位元配置參數118可包括量化器解析度資料,其與尾數量化程序116期間使用之若干量化間隔對應。然而,在替代實施中,位元配置參數118並未包括於編碼之訊框130中。在諸如杜比數位及杜比數位+之參數向後調適實施中,可藉由解碼器從編碼之訊框中所包括之指數資料、掩蔽曲線偏移資料等,計算位元配置參數118(或與量化器解析度對應之其他資料)。該等方法允許編碼較少資料,但在解碼器端包含相對較大複雜性。
在若干實施中,編碼之訊框130中將僅包括對應於該些功率譜密度值之位元,其超過每一區間之掩蔽曲線值(或人類聽覺之絕對定限)。然而,功率譜密度值超過掩蔽曲線值之程度實質上可隨時間改變。因此,可能編碼之對應位元數實質上亦可隨時間改變。
為補償該等變化,若干編碼器實施包含疊代 搜索以使可用位元數之信號遮罩比最佳化。在若干該等實施中,若可能編碼之位元數超過可用位元數,掩蔽曲線可上移。若可能編碼之位元數小於可用位元數,掩蔽曲線可下移。可判定最佳掩蔽曲線偏移,其導致使用許多位元而未超過可用位元數。
現在將說明尾數量化程序116之若干範例。如以上所注意,尾數量化程序116之量化器解析度可根據信號遮罩比。若干編碼實施可包含顯著數量的可能量化器解析度。
例如包括16可能量化器解析度之杜比數位,各對應於位元配置指標值。因為功率譜密度值落至掩蔽曲線或絕對聽覺定限之位準以下,零之位元配置指標與無尾數值針對樣本編碼之狀況對應。1之位元配置指標與3級對稱量化程序對應。2至5之位元配置指標與5級、7級、11級及15級對稱量化程序對應。6至16之位元配置指標與2n級不對稱量化程序對應,其中n可為5至12、14或16範圍之整數。
圖3A描繪3級對稱量化程序之範例。在此範例中,量化間隔305一致:量化間隔305a、305b及305c各為2/3。可參照量化間隔305之邊界315判定中點310。例如,中點310a為量化間隔305a之邊界315a及315b間之中途。
在圖300中,於尾數量化程序116期間施加之量化值122對應於量化間隔305之中點310。例如,量 化間隔305a之中點310a為-2/3,其對應於量化尾數值122a。類似地,量化間隔305c之中點310c為2/3,其對應於量化尾數值122c。
替代量化程序116可或不可包含均勻量化間隔305之應用。再者,替代量化程序116可或不可包含量化值320及量化間隔305之中點310間之對應。圖3B中顯示一該等替代量化程序116之參數。
圖3B描繪4級不對稱量化程序之範例。在此範例中,量化間隔305介於1/4(詳量化間隔305d)至3/4(詳量化間隔305g)。在此範例中,量化間隔305e及305f為1/2。對量化間隔305e及305f而言,中點310e及310f與量化尾數值122e及122f對應。然而,量化間隔305d及305g之中點310d及310g不與量化尾數值122d及122g對應。
若干替代非均勻量化程序116包含向量量化。若干向量量化方法允許藉由單一碼字代表之多維資料向量。碼字可與向量之預定義資料結構(例如表)之特定向量對應。碼字之長度可取決於資料結構中之向量數:相對較多向量可與相對較長碼字對應。
例如,杜比數位+之若干量化程序116包含向量量化,其中,碼字可介於2及9位元。單一碼字可用以代表每一尾數向量。杜比數位+編碼器可根據尾數向量之信號遮罩比選擇適當向量表。在表內,編碼器可判定哪一向量最密切匹配尾數向量。與最佳匹配向量之表索引對應 之碼字可包括於編碼之訊框130中。使用碼字,藉由從適當表提取對應於碼字之向量,解碼器可恢復量化尾數值。以下將說明尾數量化程序116之額外實施。
圖4為流程圖,描繪音頻解碼程序之範例。從廣義上講,音頻解碼程序400包含取消音頻編碼程序100期間所實施者。在若干實施中,音頻解碼程序400實質上為音頻編碼程序100之鏡像。
當解碼器接收編碼之訊框130時,音頻解碼程序400開始。例如,當解碼裝置經由諸如網路介面之介面接收複數編碼之訊框130時,程序開始。另一方面或此外,解碼裝置之邏輯系統可經由邏輯系統及記憶體裝置間之介面接收編碼之訊框130。
在位元流未封裝程序402期間,從編碼之訊框130提取指數資料120及量化尾數值122。在若干實施中,編碼之訊框130中亦包括位元配置參數118(或與量化器解析度對應之其他資料)。在位元配置程序404中可從位元配置參數118計算位元配置值。於尾數解量化程序406中解量化量化尾數值122以產生尾數值112b。位元配置參數118可包括量化器解析度資料,其指出於尾數解量化程序406期間將使用之若干量化間隔。然而,在若干實施中,編碼之訊框130中未包括位元配置參數118。可藉由解碼器從編碼之訊框中所包括之指數資料、掩蔽曲線偏移資料等計算位元配置參數118(或與量化器解析度對應之其他資料)。因為尾數量化程序116為有損程序,尾數 值112b不一定與輸入尾數量化程序116之尾數值112a相同。以下將說明尾數解量化程序406之若干新穎變化。
在方塊浮點解碼程序408期間,尾數值112b及對應指數值110從浮點表示轉變為轉換係數106b之小數表示。方塊浮點解碼程序408之輸出可抑制於某值內。例如,轉換係數106b之值可抑制於-1.0及1.0之間。
在反轉換程序410中,頻域中之轉換係數106b被轉換為時域中之解碼之樣本412。在若干該等範例中,反轉換程序410包含轉換係數106b之反向MDCT以產生解碼之樣本412。然而,替代實施可包含其他反轉換方法,諸如快速傅立葉轉換或合成濾波器組(即反向QMF)。
圖5為流程圖,描繪包含條件式反向量化器之替代音頻解碼程序的範例。在若干實施中,音頻解碼程序500可類似於以上所說明之音頻解碼程序400。然而,音頻解碼程序500包含新穎解量化方法及相關程序。正如文中所說明之其他方法,音頻解碼程序500之方塊可或不可於所指出之序列中實施。例如,在若干實施中,方塊515可於方塊510之前實施,或方塊510及515實質上可於相同時間實施。
在此範例中,當藉由解碼器接收包括音頻資料之一或多個編碼之訊框時音頻解碼程序500開始(方塊505)。例如,當解碼裝置經由介面接收編碼之訊框(或複數編碼之訊框)時程序可開始。在若干實施中,編碼之 訊框可實質上類似於以上所說明之編碼之訊框130,並可為AC-3格式、增強AC-3格式或本技藝中一般技術之人士所熟知之另一音頻編解碼器。然而,如以下所討論,在若干實施中,編碼之訊框可依據文中所說明之新穎程序編碼。依據若干該等實施,可於指數資訊上調節尾數重建。
接收編碼之訊框的介面可為網路介面。另一方面或此外,邏輯系統可經由邏輯系統及記憶體裝置間之介面接收編碼之訊框。圖10中顯示且以下將說明編碼器或解碼器設備之組件的範例。
在方塊510,從編碼之訊框提取或回應於訊框中所包括之其他資訊而判定量化器解析度資料。量化器解析度資料可對應於用於編碼之訊框之音頻資料的量化轉換係數之尾數值的程序期間使用之若干量化間隔。量化間隔可或不可為均勻量化間隔,取決於尾數量化程序。類似地,尾數量化程序期間使用之量化值可或不可對應於量化間隔邊界間之中點,取決於尾數量化程序。
如以上參照圖1所注意,於尾數量化程序116期間施加之量化器解析度可與信號遮罩比成比例。編碼之訊框130中所包括之位元配置參數118可與此量化器解析度對應。因此,編碼之訊框130之位元配置參數118可包括量化器解析度資料,其與尾數量化程序116期間使用之量化間隔數對應。
在若干實施中,量化器解析度資料可包括位元配置指標。如以上所注意,杜比數位包括16可能量化 器解析度,每一者對應於回應於編碼之訊框130中之資料而判定之位元配置指標。因為功率譜密度值落至掩蔽曲線或絕對聽覺定限之位準以下,零之位元配置指標與無尾數值針對樣本編碼之狀況對應。1之位元配置指標與3級對稱量化程序對應。2至5之位元配置指標與5級、7級、11級及15級對稱量化程序對應。6至16之位元配置指標與2n級不對稱量化程序對應,其中n可為5至12、14或16範圍之整數。
在方塊515中,從編碼之訊框提取或依據訊框中所包括之指數資訊而判定轉換係數之指數設定檔資料。在若干實施中,指數設定檔資料將包括指數微分資料。在該等實施中,實質上如以上參照微分指數值255所說明,可判定指數微分資料(詳圖2A及2B及對應討論)。在若干該等實施中,可抑制微分指數值255以落至-2至2之範圍內,並可具有5可能狀態:-2、-1、0、1或2。
在方塊520中,至少部分依據量化解析度資料及指數設定檔資料判定用於編碼之訊框之尾數值的解量化方法。在若干實施中,至少若干解量化方法可包含解量化值之應用,其與編碼之訊框之尾數值的量化程序期間使用的量化值不同。例如,即使於量化程序期間使用之量化值為量化間隔邊界間之中點,至少若干解量化方法可包含解量化值之應用,其未對應於量化間隔邊界間之中點。現在將參照圖6A至6D說明該等實施背後之推理。
圖6A顯示轉換係數值之可能性密度函數的範例。在圖600中,軸605代表轉換係數106之每一對應值的可能性密度px(x)。最高可能性密度值與轉換係數106之零值對應。在此範例中,可能性密度值隨著轉換係數106之絕對值增加而下降。在此範例中,轉換係數106之絕對值為小於或等於1。
圖6B至6D為圖6A之轉換係數之尾數及選擇之指數值的可能性密度函數。該些圖之每一者係根據源自圖6A之pdf範例下列方程式:
在方程式2中,Py|k(y|k)代表於指數值k上調節之尾數y的可能性密度函數。如以上方程式1之討論中所注意,尾數值(在此處)可抑制為大於或等於0.5及小於或等於1.0。
在圖6B中k=0,反之,在圖6C中k=2,及在圖6D中k=7。首先參照圖6B,可見到當k=0時,通常為設定量化值(或解量化值)作為量化間隔邊界間之中點並非最佳之狀況,其中並未導致誤差度量最小化,諸如最小均方量化誤差。然而,隨著k值增加,量化器間隔內之尾數統計變成充分均勻,量化器間隔之最佳(在使均方誤差最小化方面)重建幾乎與其終點相同,即因設定重建做為間隔中點之平均量化誤差幾乎與在使均方誤差最小化方面 設定重建至其最佳值相同。可使用其他誤差度量,諸如平均絕對量化誤差。
上述分析建議對特定量化器解析度資料值而言,不同k值可指出解量化值是否應與量化間隔邊界間之中點對應。然而,音頻資料通常隨時間而高度變化,因此px(x)通常隨時間而高度變化。音頻資料可具有頻譜上之類似變化。因此,絕對指數值並非尾數統計之一致且可靠地指標。
為考慮在時間及頻率中之該等變化,在若干實施中,每一頻率區間之尾數解量化方法可至少部分根據微分指數值及/或指數值之傾向。該等傾向可藉由比較連續頻率區間之二或更多微分指數值而予判定。依據若干該等實施,可依據量化解析度資料及指數差異對判定每一頻率區間之尾數解量化方法。現在將參照圖7說明若干該等實施。
圖7指出各式頻率之指數值範例。因為轉換係數值與指數值成反比,在圖700中k沿向下方向增加。顯示各式頻率區間725之k值。在若干實施中,每一頻率區間725之指數差異對將為相對於較低頻率之指數的第一指數差異及相對於較高頻率之指數的第二指數差異。
例如,頻率區間725b之指數差異對將為相對於頻率區間725a之指數值的第一指數差異及相對於頻率區間725c之指數值的第二指數差異。第一指數差異文中可稱為「向後指數diff」及第二指數差異文中可稱為「向 前指數diff」。「diff」及「差異」用詞文中可交換使用。
藉由考量至少每一頻率區間之向後指數diff及向前指數diff,可判定指數值之傾向。例如,頻率區間725b及725i之向後指數diff及向前指數diff指出向上傾斜,其中,k值減少。頻率區間725c之向後指數diff及向前指數diff指出譜峰,其對應於頻率區間725c之轉換係數的局部最大值。對該值而言,尾數之分佈傾向於歪斜。因此(如以上參照圖6B所說明之狀況,其中,k=0),設定解量化值為量化間隔邊界間之中點通常將非最佳。
頻率區間725f及725g之向後指數diff及向前指數diff指出向下傾斜。頻率區間725h之向後指數diff及向前指數diff指出谷或槽。正如譜峰,該等指數資料中之傾向亦可與尾數統計對應。
圖8描繪依據向後指數微分及向前指數微分之實際音頻資料之正規化尾數變異的範例。圖800中所描繪之結果代表迄今使用之特定類型音頻資料的結果。在此範例中,圖800之垂直軸805指出正規化尾數變異(分貝)。軸810指出向前指數diff及軸815指出向後指數diff。在此範例中,指數微分資料具有5不同狀態,包括對應於介於-2.0至2.0範圍之整數。因此,指數對包括25不同可能組合。
點820對應於(-2,2)之指數差異對,其依 次對應於尖銳譜峰。在此範例中,點820對應於約-2.5dB之常態化尾數變異,指數差異對之任一者的最低變異。在圖800中,較低變異對應於跨越可能尾數值之範圍之可能性密度值的相對較少一致分佈。較少均勻分佈更有可能尾數值將相對更歪斜。因此,設定解量化值為量化間隔邊界間之中點通常將非最佳。
在其他極端,點825對應於(2,-2)之指數差異對,其對應於尖銳的譜谷。在此範例中,點825具有約1.7dB之常態化尾數變異,指數差異對之任一者的最高變異。在圖800中,較高變異對應於跨越可能尾數值之範圍之可能性密度值的相對較多一致分佈。可能性密度值之更多均勻分佈表示設定解量化值為量化間隔邊界間之中點,更可能提供滿意結果。
再次參照圖5,在若干實施中,方塊520中,可依據量化解析度資料及對應於頻率區間之指數差異對,(至少部分)判定每一頻率區間之尾數解量化方法。方塊520可包含判定指數差異對,包括每一頻率區間之向後指數diff及向前指數diff。在若干實施中,從編碼之訊框提取之指數設定檔資料(詳方塊515)可包括微分指數值。該等實施進一步精簡判定指數差異對之程序。
每一指數差異對可與解量化方法對應。方塊520可包含藉由參照指數差異對之資料結構及對應解量化方法而獲得特定頻率區間之解量化方法。方塊520可包含從資料結構擷取與頻率區間之指數差異對對應之解量化方 法的指示。在若干實施中,資料結構將與頻率區間之量化解析度資料對應。例如,資料結構可與特定位元配置指標值對應。
從編碼之訊框提取之指數設定檔資料(詳方塊515)可包括編碼之訊框中無對應尾數值之指數值。例如,零位元可於尾數量化程序期間配置至該尾數值。然而,在若干實施中,相關指數資料可用以判定對應尾數值之解量化方法。取代指定隨機尾數值,可依據與指數差異對及頻率區間之量化解析度資料對應之解量化方法重建頻率區間之尾數值。
在方塊525中,依據方塊525中所判定之解量化方法及對應量化解析度資料解量化對應於每一頻率區間之尾數值。至少若干該些解量化方法可與編碼程序中使用之量化方法不同。例如,編碼程序中所使用之量化值可為量化間隔邊界間之中點,反之,方塊520中所判定及方塊525中所應用之至少若干該些解量化方法可不包含施加對應於量化間隔邊界間之中點之解量化值。然而,在文中所說明之若干編碼方法中,量化值不一定為量化間隔邊界間之中點。
在方塊530中,訊框之解碼程序完成。方塊530可包含重建對應於解量化之尾數值的絕對指數值。方塊530可包含方塊浮點解碼程序,其中,解量化尾數值及對應指數值從浮點表示被轉變為轉換係數之小數表示。方塊530可包含反轉換程序,其中,頻域中之轉換係數被轉 變為時域中之解碼之樣本。
在方塊535中,判定是否需處理任何剩餘編碼之訊框。若然,在此範例中,程序還原至方塊505。若否,程序終止(方塊540)。
圖9為流程圖,顯示以條件式反向量化器建立音頻解碼方法之參數之程序的範例。方法900於方塊905開始,其中,收集尾數訓練資料。該等訓練資料可包括各式類型音頻資料,諸如各類不同音樂風格之音頻資料、各式電影聲軌之音頻資料、觀眾掌聲資料、周圍音頻資料、其組合等。
在方塊910中,尾數訓練資料劃分為指數差異對組。例如,尾數訓練資料可從時域轉換為頻域。方塊浮點編碼程序可施加於資料以產生尾數值及對應絕對指數值。可計算微分指數值用於絕對指數值。微分指數值對可與複數頻率區間之每一者的尾數值相關。
接著可判定解量化方法用於每一指數差異對(方塊915)。量化方法亦可對應於特定量化解析度。例如,可依據3級對稱量化方法、5級對稱量化方法、7級對稱量化方法及/或其他量化方法判定不同解量化方法用於尾數量化。若干等解量化方法可包含施加解量化值,其未與該些量化方法中使用之量化間隔邊界間之中點對應。相反地,解量化值可與從尾數訓練資料判定之統計對應。然而,其他解量化方法可包含施加與該等中點對應之解量化值。
在方塊920中,填充資料結構用於每一量化解析度。資料結構可包括解量化方法及對應指數差異對。資料結構可儲存於記憶體中。在方塊925中,判定是否將判定解量化方法用於額外量化解析度。若然,程序可還原至方塊915或920。若否,程序終止(方塊930)。
應注意的是程序900僅為條件式反向量化器之設計程序之一範例。在此範例中,於其上調節反向量化器之指數設定檔資料包含指數差異對組。然而,如文中他處所注意,在替代實施中,反向量化器可於其他類型指數設定檔資料上調節。例如,在替代實施中,指數設定檔資料可包括每一頻率區間之二個以上指數差異值。當於不同類型指數設定檔資料上調節反向量化器時,將因此修改圖9之步驟。例如,在方塊910中,訓練資料可劃分為較小群組,各對應於替代指數設定檔資料之特定值。
文中所說明之各式解碼方法可用於已依據現有編解碼器編碼之音頻資料,包括但不侷限於杜比數位及杜比數位+。然而,文中所揭露之若干實施提供新穎量化及解量化方法。
依據若干該等實施,量化間隔邊界及/或量化值之選擇可改變,甚至針對相同量化解析度。在若干該等實施中,可於指數資訊上調節編碼裝置之量化間隔邊界及/或量化值的選擇,諸如特定頻率區間之指數差異對。編碼裝置可依據尾數訓練資料判定與指數差異對相關之量化間隔邊界及/或量化值,其可根據實際音頻資料。解碼 裝置例如可依據對應解量化間隔邊界及/或解量化值解量化編碼之音頻資料。
文中所說明之新穎編碼器之條件式量化器的設計可包含類似於以上參照圖9說明之程序900的程序。然而,在該等實施中,除了解量化方法以外,可適當修改步驟915以判定量化方法。依據若干該等實施,可修改步驟920以填充資料結構,除了解量化方法以外,其包括量化方法。
該等新穎編碼技術提供編碼之音頻資料,其適於不僅藉由文中所說明之新穎解碼裝置使用,亦藉由舊有解碼裝置使用。
圖10為方塊圖,其提供編碼器或解碼器設備之組件範例。裝置1000可為行動電話、智慧手機、桌上型電腦、手持式或可攜式電腦、輕省筆電、筆記型電腦、智慧本、平板電腦、立體聲系統、電視、DVD播放器、數位記錄裝置、或各類其他裝置。
在此範例中,裝置包括介面系統1005。介面系統1005可包括網路介面,諸如無線網路介面。另一方面或此外,介面系統1005可包括通用串列匯流排(USB)介面或另一該等介面。
裝置1000包括邏輯系統1010。邏輯系統1010可包括處理器,諸如通用單一或多晶片處理器。邏輯系統1010可包括數位信號處理器(DSP)、專用積體電路(ASIC)、場可編程閘陣列(FPGA)或其他可編程 邏輯裝置、分立閘或電晶體邏輯、或分立硬體組件、或其組合。邏輯系統1010可經組配以控制裝置1000之其他組件。儘管圖10中顯示裝置1000之組件之間無介面,邏輯系統1010可經組配而與其他組件通訊。其他組件可或不可經適當組配而相互通訊。
邏輯系統1010可經組配以實施編碼器及/或解碼器功能,包括但不侷限於文中所說明之編碼器及/或解碼器功能類型。在若干該等實施中,邏輯系統1010可經組配以(至少部分)依據儲存於一或多個非暫態性媒體上之軟體操作。非暫態性媒體可包括與邏輯系統1010相關之記憶體,諸如隨機存取記憶體(RAM)及/或唯讀記憶體(ROM)。非暫態性媒體可包括記憶體系統1015之記憶體。記憶體系統1015可包括一或多個適合類型之非暫態性儲存媒體,諸如快閃記憶體、硬碟等。
例如,邏輯系統1010可經組配以經由介面系統1005接收編碼之音頻資料的訊框,並依據文中所說明之解碼器方法解碼編碼之音頻資料。另一方面或此外,邏輯系統1010可經組配以經由記憶體系統1015及邏輯系統1010間之介面接收編碼之音頻資料的訊框。邏輯系統1010可經組配以依據解碼之音頻資料控制揚聲器1020。在若干實施中,邏輯系統1010可經組配以依據習知編碼方法及/或依據文中所說明之編碼方法而編碼音頻資料。邏輯系統1010可經組配以經由麥克風1025、經由介面系統1005等接收該等音頻資料。
顯示系統1030可包括一或多個適合類型顯示器,取決於裝置1000之操縱。例如,顯示系統1030可包括液晶顯示器、電漿顯示器、雙穩態顯示器等。
使用者輸入系統1035可包括一或多個裝置經組配以接受來自使用者之輸入。在若干實施中,使用者輸入系統1035可包括觸控螢幕,其覆蓋顯示系統1030之顯示。使用者輸入系統1035可包括按鈕、鍵盤、開關等。在若干實施中,使用者輸入系統1035可包括麥克風1025:使用者可經由麥克風1025提供裝置1000之語音命令。邏輯系統可經組配以依據該等語音命令而進行語音識別及進行控制裝置1000之至少若干作業。
電力系統1040可包括一或多個合適能量儲存裝置,諸如鎳鎘電池或鋰離子電池。電力系統1040可經組配以接收來自電源插座之電力。
對於本技藝中一般技術之人士而言,本揭露中所說明之實施的各式修改是顯而易見的。文中所界定之一般原理可施加於其他實施而未偏離本揭露之精神或範圍。例如,雖然已以指數差異對說明各式實施,替代實施可包含用於每一頻率區間之二個以上指數差異值。再者,雖然已以杜比數位及杜比數位+說明各式實施,文中所說明之方法可結合其他音頻編解碼器實施。因而,不希望申請項侷限於文中所示實施,而是符合與本揭露、文中所揭露之原理及新穎特徵一致之最寬範圍。
100‧‧‧音頻編碼程序
102‧‧‧輸入樣本
104‧‧‧轉換程序
106a‧‧‧轉換係數
108、128‧‧‧程序
110‧‧‧指數值
112a‧‧‧尾數值
114‧‧‧位元配置程序
116‧‧‧尾數量化程序
118‧‧‧位元配置參數
120‧‧‧指數資料
122‧‧‧量化值
130‧‧‧編碼之訊框

Claims (31)

  1. 一種用於音頻解碼的方法,包含:接收編碼之訊框,其包括音頻資料;回應於從該編碼之訊框提取之資訊,判定量化器解析度資料,該量化器解析度資料對應於在量化用於該編碼之訊框之該音頻資料之轉換係數的尾數值之程序期間使用的若干量化間隔;判定來自該編碼之訊框之轉換係數的指數設定檔資料;至少部分根據該量化器解析度資料及該指數設定檔資料而判定用於該編碼之訊框之該尾數值的複數解量化方法;以及依據該些解量化方法解量化該尾數值。
  2. 如申請專利範圍第1項之方法,其中,該指數設定檔資料包括指數微分資料。
  3. 如申請專利範圍第2項之方法,其中,該指數微分資料對應於5種微分狀態。
  4. 如申請專利範圍第2項之方法,其中,該指數微分資料包括指數差異對。
  5. 如申請專利範圍第4項之方法,其中,解量化該尾數值包含依據對應於一頻率之指數差異對的解量化方法,解量化該頻率之尾數值。
  6. 如申請專利範圍第5項之方法,其中,該頻率之該指數差異對包括相對於較低頻率之指數的第一指數差異及 相對於較高頻率之指數的第二指數差異。
  7. 如申請專利範圍第1至6項任一項之方法,其中,於量化尾數值之該程序期間使用的該量化間隔為均勻量化間隔。
  8. 如申請專利範圍第1項之方法,其中,於量化尾數值之該程序期間使用的量化值對應於量化間隔之邊界之間之中點,且其中,至少若干解量化值未對應於量化間隔之該邊界之間之中點。
  9. 如申請專利範圍第1項之方法,其中,至少若干該解量化方法包含與量化該編碼之訊框之尾數值的該程序期間使用的該量化值不同之解量化值的應用。
  10. 如申請專利範圍第1項之方法,其中,該指數設定檔資料包括該編碼之訊框中無對應尾數值之指數的資料。
  11. 一種用於音頻解碼的設備,包含:介面;以及邏輯系統,經組配用於:從該介面接收編碼之訊框,其包括音頻資料;回應於從該編碼之訊框提取之資訊,判定量化器解析度資料,該量化器解析度資料對應於在量化用於該編碼之訊框之該音頻資料之轉換係數的尾數值之程序期間使用的若干量化間隔;判定來自該編碼之訊框之轉換係數的指數設定檔資料; 至少部分根據該量化器解析度資料及該指數設定檔資料而判定用於該編碼之訊框之該尾數值的複數解量化方法;以及依據該些解量化方法解量化該尾數值。
  12. 如申請專利範圍第11項之設備,其中,該編碼之訊框為AC-3格式或增強AC-3格式。
  13. 如申請專利範圍第11或12項之設備,其中,該邏輯系統包括至少通用單一或多晶片處理器、數位信號處理器(DSP)、專用積體電路(ASIC)、場可編程閘陣列(FPGA)或其他可編程邏輯裝置、分立閘或電晶體邏輯、或分立硬體組件之一者。
  14. 如申請專利範圍第11項之設備,進一步包含記憶體裝置,其中,該介面包含該邏輯系統及該記憶體裝置之間之介面。
  15. 如申請專利範圍第11項之設備,其中,該介面包含網路介面。
  16. 如申請專利範圍第11項之設備,其中,該指數設定檔資料包括指數微分資料。
  17. 如申請專利範圍第16項之設備,其中,該指數微分資料包括對應於複數頻率之每一者的指數差異對。
  18. 如申請專利範圍第16或17項之設備,進一步包含具有儲存於其上之資料結構的記憶體,該資料結構包括複數解量化方法及對應指數微分資料。
  19. 如申請專利範圍第18項之設備,其中,該邏輯系 統經組配用於藉由參照該資料結構判定對應於指數微分資料之解量化方法。
  20. 一種用於音頻解碼的非暫態性媒體,具有儲存於其上之軟體,該軟體包括指令用於控制解碼設備以:接收編碼之訊框,其包括音頻資料;回應於從該編碼之訊框提取之資訊,判定量化器解析度資料,該量化器解析度資料對應於在量化用於該編碼之訊框之該音頻資料之轉換係數的尾數值之程序期間使用的若干量化間隔;判定來自該編碼之訊框之轉換係數的指數設定檔資料;至少部分根據該量化器解析度資料及該指數設定檔資料而判定用於該編碼之訊框之該尾數值的複數解量化方法;以及依據該些解量化方法解量化該尾數值。
  21. 一種用於音頻編碼的方法,包含:接收時域中之第一音頻資料;將該第一音頻資料轉換為頻域中之第二音頻資料,該第二音頻資料包括轉換係數;從該轉換係數判定指數資料,其包括指數設定檔資料;回應於該指數資料判定量化器解析度資料,該量化器解析度資料對應於量化該轉換係數之尾數值之程序期間使用的若干量化間隔; 至少部分根據該量化器解析度資料及該指數設定檔資料而判定用於該轉換係數之該尾數值的複數解量化方法;以及依據該些解量化方法量化該尾數值。
  22. 如申請專利範圍第21項之方法,進一步包含形成編碼之訊框,其包括該第二音頻資料、該指數資料及該量化尾數值。
  23. 如申請專利範圍第21項或第22項之方法,其中,於量化尾數值之該程序期間使用的一或多個量化值未對應於量化間隔之邊界之間之中點。
  24. 如申請專利範圍第21項之方法,其中,該量化方法之一或多者使用量化間隔,且邊界未均勻地隔開。
  25. 一種用於音頻編碼的設備,包含:介面;以及邏輯系統,經組配用於:從該介面接收編碼之訊框,其包括頻域中之第一音頻資料、指數資料及量化尾數值,該量化尾數值係依據至少部分根據量化器解析度資料及從該指數資料判定之指數設定檔資料的量化方法來判定;從該量化尾數值判定解量化尾數值;至少部分根據該解量化尾數值來判定轉換係數;以及使用該轉換係數實施反轉換作業以產生該時域中之第二音頻資料。
  26. 如申請專利範圍第25項之設備,其中,該編碼之訊框為AC-3格式或增強AC-3格式。
  27. 如申請專利範圍第25項或第26項之設備,其中,該邏輯系統包括至少通用單一或多晶片處理器、數位信號處理器(DSP)、專用積體電路(ASIC)、場可編程閘陣列(FPGA)或其他可編程邏輯裝置、分立閘或電晶體邏輯、或分立硬體組件之一者。
  28. 如申請專利範圍第25項之設備,進一步包含記憶體裝置,其中,該介面包含該邏輯系統及該記憶體裝置之間之介面。
  29. 如申請專利範圍第25項之設備,其中,該介面包含網路介面。
  30. 如申請專利範圍第25項之設備,其中,該量化方法之一或多者使用量化間隔,且邊界未均勻地隔開。
  31. 如申請專利範圍第25項之設備,其中,該量化方法之一或多者使用量化值未對應於量化間隔之邊界之間之中點。
TW102105591A 2012-04-25 2013-02-18 用於音頻編碼與解碼的方法、設備及非暫態性媒體 TWI585750B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261638090P 2012-04-25 2012-04-25
US13/560,144 US8401863B1 (en) 2012-04-25 2012-07-27 Audio encoding and decoding with conditional quantizers

Publications (2)

Publication Number Publication Date
TW201351395A TW201351395A (zh) 2013-12-16
TWI585750B true TWI585750B (zh) 2017-06-01

Family

ID=47844802

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102105591A TWI585750B (zh) 2012-04-25 2013-02-18 用於音頻編碼與解碼的方法、設備及非暫態性媒體

Country Status (6)

Country Link
US (1) US8401863B1 (zh)
EP (1) EP2842126B1 (zh)
JP (1) JP5970602B2 (zh)
CN (1) CN104246875B (zh)
TW (1) TWI585750B (zh)
WO (1) WO2013162679A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396119B1 (en) * 2009-09-30 2013-03-12 Ambarella, Inc. Data sample compression and decompression using randomized quantization bins
US11609784B2 (en) * 2018-04-18 2023-03-21 Intel Corporation Method for distributing a computational process, workload distribution device and system for distributing a computational process
US10769819B2 (en) * 2018-09-24 2020-09-08 Qualcomm Incorporated Floating-point data compression
US11586883B2 (en) * 2018-12-14 2023-02-21 Microsoft Technology Licensing, Llc Residual quantization for neural networks
US12045724B2 (en) 2018-12-31 2024-07-23 Microsoft Technology Licensing, Llc Neural network activation compression with outlier block floating-point
US11562247B2 (en) * 2019-01-24 2023-01-24 Microsoft Technology Licensing, Llc Neural network activation compression with non-uniform mantissas

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090048847A1 (en) * 2005-09-27 2009-02-19 Lg Electronics, Inc. Method and Apparatus for Encoding/Decoding Multi-Channel Audio Signal
US20110099295A1 (en) * 2009-10-23 2011-04-28 Samplify Systems, Inc. Block floating point compression of signal data

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
EP1228569A1 (en) * 1999-10-30 2002-08-07 STMicroelectronics Asia Pacific Pte Ltd. A method of encoding frequency coefficients in an ac-3 encoder
US6807528B1 (en) * 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
JP4212591B2 (ja) * 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
CN101427307B (zh) * 2005-09-27 2012-03-07 Lg电子株式会社 编码/解码多声道音频信号的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090048847A1 (en) * 2005-09-27 2009-02-19 Lg Electronics, Inc. Method and Apparatus for Encoding/Decoding Multi-Channel Audio Signal
TW200932030A (en) * 2005-09-27 2009-07-16 Lg Electronics Inc Method and apparatus for encoding/decoding multi-channel audio signal
US20110099295A1 (en) * 2009-10-23 2011-04-28 Samplify Systems, Inc. Block floating point compression of signal data
CN102597948A (zh) * 2009-10-23 2012-07-18 信飞系统公司 信号数据的块浮点压缩

Also Published As

Publication number Publication date
CN104246875A (zh) 2014-12-24
WO2013162679A1 (en) 2013-10-31
JP2015512532A (ja) 2015-04-27
US8401863B1 (en) 2013-03-19
CN104246875B (zh) 2016-08-24
EP2842126A1 (en) 2015-03-04
EP2842126B1 (en) 2016-05-04
JP5970602B2 (ja) 2016-08-17
TW201351395A (zh) 2013-12-16

Similar Documents

Publication Publication Date Title
JP6612837B2 (ja) オーディオ符号化装置、オーディオ復号化方法及び記録媒体
TWI585750B (zh) 用於音頻編碼與解碼的方法、設備及非暫態性媒體
TWI606441B (zh) 解碼裝置
US20200294514A1 (en) Energy lossless coding method and apparatus, signal coding method and apparatus, energy lossless decoding method and apparatus, and signal decoding method and apparatus
CN107025909B (zh) 能量无损编码方法和设备以及能量无损解码方法和设备
US8086446B2 (en) Method and apparatus for non-overlapped transforming of an audio signal, method and apparatus for adaptively encoding audio signal with the transforming, method and apparatus for inverse non-overlapped transforming of an audio signal, and method and apparatus for adaptively decoding audio signal with the inverse transforming
US8838442B2 (en) Method and system for two-step spreading for tonal artifact avoidance in audio coding
KR102401002B1 (ko) 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
KR20190040063A (ko) 인덱스 코딩 및 비트 스케줄링을 갖는 양자화기
TWI438770B (zh) 使用通道間及時間冗餘減少之音訊信號編碼
AU2017272204B2 (en) Signal processing method and device
US9425820B2 (en) Vector quantization with non-uniform distributions
JP2020518030A (ja) デジタルオーディオ信号における差分データ
AU2014286765B2 (en) Signal encoding and decoding methods and devices
CN102708872B (zh) 3d音频中水平方位参数码本获取方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees