TWI405475B - 音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構 - Google Patents

音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構 Download PDF

Info

Publication number
TWI405475B
TWI405475B TW095132070A TW95132070A TWI405475B TW I405475 B TWI405475 B TW I405475B TW 095132070 A TW095132070 A TW 095132070A TW 95132070 A TW95132070 A TW 95132070A TW I405475 B TWI405475 B TW I405475B
Authority
TW
Taiwan
Prior art keywords
time slot
information
bits
parameter
parameter set
Prior art date
Application number
TW095132070A
Other languages
English (en)
Other versions
TW200715900A (en
Inventor
Hee Suk Pang
Hyen O Oh
Dong Soo Kim
Jae Hyun Lin
Yang Won Jung
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060004062A external-priority patent/KR20070037974A/ko
Priority claimed from KR1020060004051A external-priority patent/KR20070025903A/ko
Priority claimed from KR1020060004063A external-priority patent/KR20070025907A/ko
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Publication of TW200715900A publication Critical patent/TW200715900A/zh
Application granted granted Critical
Publication of TWI405475B publication Critical patent/TWI405475B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構
本發明係關於音頻訊號處理。
對多頻道音頻的感知編碼的研究和開發所做的努力目前正在進行,多頻道音頻即通常稱為的空間音頻編碼(Spatial Audio Coding,SAC)。空間音頻編碼允許多頻道音頻以低位元速率傳輸,這使空間音頻編碼適合於多種普遍的音頻訊號應用(如網路串流、音樂下載)。
與進行獨立音頻輸入頻道的不連續編碼不同,空間音頻編碼以緊湊的參數集(a compact set of parameter)的形式捕捉多頻道音頻訊號的空間影像。這些參數可被傳輸至解碼器,在解碼器中參數用於分析或著重組音頻訊號的空間特性。
在某些空間音頻編碼應用中,空間參數做為部份位元流被傳輸至解碼器。位元流包含空間框,空間框包含有序組(ordered set)的時間槽,空間參數集(parameter set)可加載至時間槽。位元流也包含解碼器使用的位置資訊,以識別加載給定參數集的正確的時間槽。
某些空間音頻編碼應用在編碼/解碼路徑中使用概念元件(conceptual element)。一個元件通常指一到二(One-To-Two,OTT),另一元件通常指二到三(Two-To-Three,TTT),其中這些名稱分別代表相應解碼器元件的輸入和輸出通道的數量。一到 二編碼器元件提取兩個空間參數並生成下混訊號和殘餘訊號。二到三元件下混三個音頻訊號至身厲聲下混訊號加殘餘訊號。這些元件可組合以提供空間音頻環境的各種結構(如環繞聲)。
某些空間音頻編碼應用可在非導向操作模式下操作,其中只有身厲聲下混訊號可從編碼器傳輸至解碼器而無需空間參數傳輸。解碼器從下混訊號合成空間參數並使用這些參數生成多頻道音頻訊號。
鑒於以上的問題,本發明的主要目的在於提供一種音頻訊號編碼技術以降低轉移資料的量。
因此,為達上述優點及依照本發明之目的,本發明所揭露與音頻訊號相關的空間資訊被解碼為位元流,且位元流可被傳輸至解碼器或記錄於儲存媒體中。位元流包含與時序、頻域和空間域相關的不同的結構。在某些實施例中,位元流包含一種或多種資料結構(如框),這些資料結構包含加載有參數的槽的有序組。資料結構可為固定的或可變的。資料結構類型指標可插入位元流中以驅動解碼器確定資料結構類型並調用適合的解碼處理。資料結構可包含位置資訊,解碼器可使用位置資訊可識別加載有給定參數集的正確的槽。槽位置資訊依照資料結構類型指標所示的資料結構類型由固定數量之位元或可變數量之位元編碼。對於可變資料結構類型,槽位置資訊可依照槽有序組中的槽位置由可變數量 之位元編碼。
本發明所揭露之一種音頻訊號編碼方法,包含有:確定複數個時間槽之數量和複數個參數集之數量,參數集包含一個或多個參數;生成表示至少一個時間槽位置的資訊於加載有參數集的複數個時間槽之有序組中;編碼音頻訊號為包含框之位元流,框包含複數個時間槽之有序組;以及插入可變數量之位元於位元流中,可變數量之位元代表複數個時間槽之有序組中的時間槽位置,其中可變數量之位元由時間槽位置確定。
本發明所揭露之一種音頻訊號解碼方法,包含有:接收代表音頻訊號之位元流,位元流包含框;自位元流中確定複數個時間槽之數量和複數個參數集之數量,參數集包含一個或多個參數;自位元流確定位置資訊,位置資訊係表示加載有參數集之複數個時間槽之有序組中時間槽的位置,其中複數個時間槽之有序組包含於框內;以及依照複數個時間槽之數量、複數個參數集之數量及位置資訊解碼音頻訊號;以及其中依照時間槽位置,位置資訊由可變數量之位元表示。
其中時間槽位置編碼的其它實施例係關於系統、方法、裝置、資料結構和電腦可讀取媒體。
有關本發明的特徵與實作,茲配合圖式作最佳實施例詳細說明如下。
「第1圖」所示為本發明實施例生成空間資訊的原理。多頻道音頻訊號的感知編碼方案係依照人類可透過三維空間感知音頻訊號這一事實。可利用空間資訊代表音頻訊號的三維空間,空間資訊包含下述習知的空間參數:頻道位準差(channel level difference,CLD)、頻道間相關性/同調(inter channel correlateion/coherence,ICC)、頻道時序差(channel time difference,CTD)和頻道預測係數(channel prediction coefficient,CPC)等,但不僅限於此。頻道位準差參數代表兩個音頻頻道之間的能階(位準)差。頻道間相關性/同調參數代表兩個音頻頻道之間的相關性或同調的量,頻道時序差參數代表兩個頻道之間的時序差。
「第1圖」所示為頻道時序差參數和頻道位準差參數的生成。遠處聲源101發出的第一直達聲波103到達人的左耳107,第二直達聲波102在繞著人腦繞射後到達人的右耳106。直達聲波102和103彼此的到達時間和能階均不同。頻道時序差參數和頻道位準差參數可分別依照聲波102和103的到達時間和能階差產生。而且,反射的聲波104和105分別到達耳朵106和107,並且相互沒有關係。頻道間相關性/同調參數可依照聲波104和105之間的關係生成。
在編碼器處,從多頻道音頻輸入訊號中提取空間資訊(如空間參數),並生成下混訊號。下混訊號和空間參數被轉移至解碼器。對於下混訊號可使用任何數量的音頻頻道,下混訊號包含: 單聲道訊號、身歷聲訊號或多頻道音頻訊號,但不僅限於此。在解碼器處,多頻道上混訊號生成自下混訊號和空間參數。
「第2圖」所示為本發明實施例用於編碼音頻訊號的編碼器的示意圖。編碼器包含下混單元202、空間資訊生成單元203、下混訊號編碼單元207和多工單元209。編碼器的其它結構也可。編碼器可透過硬體、軟體或軟體與硬體的結合實現。編碼器可透過積體電路晶片、晶片組、系統晶片(SoC)、數位訊號處理器、通用處理器和各種數位和類比裝置實現。
下混單元202自多頻道音頻訊號201生成下混訊號204。在「第2圖」中,x1、x2…xn代表輸入音頻頻道。如上所述,下混訊號204可為單聲道訊號、身歷聲訊號或多頻道音頻訊號。在圖示的實施例中,x1′…xm′代表下混訊號204的頻道數量。在某些實施例中,編碼器處理外部提供的下混訊號205(即有藝術形狀的下混訊號)而非下混訊號204。
空間資訊生成單元203自多頻道音頻訊號201中提取空間資訊。此時,〞空間資訊〞代表與在解碼器中將下混訊號204上混為多頻道音頻訊號時使用的音頻訊號頻道相關的資訊。下混訊號204透過下混多頻道音頻訊號生成。空間資訊被編碼以提供被編碼的空間資訊訊號206。
下混訊號編碼單元207透過編碼下混單元202生成的下混訊號204生成被編碼的下混訊號208。
多工單元209生成位元流210,位元流210包含被編碼的下混訊號208和被編碼的空間資訊訊號206。位元流210可被傳輸至下遊解碼器和/或被記錄在儲存媒體中。
「第3圖」所示為本發明實施例用於解碼被編碼的音頻訊號的解碼器的示意圖。解碼器包含解多工單元302、下混訊號解碼單元305、空間資訊解碼單元307和上混單元309。解碼器可透過硬體、軟體或軟體與硬體的結合實現。解碼器可透過積體電路晶片、晶片組、系統晶片(SoC)、數位訊號處理器、通用處理器和各種數位和類比裝置實現。
在某些實施例中,解多工單元302接收代表音頻訊號的位元流301,然後自位元流301分離被編碼的下混訊號303和被編碼的空間資訊訊號304。在「第3圖」中,x′1…x′m代表下混訊號303的頻道。下混訊號解碼單元305透過解碼被編碼的下混訊號303輸出被解碼的下混訊號306。如果解碼器無法輸出多頻道音頻訊號,那麼下混訊號解碼單元305可直接輸出下混訊號306。在「第3圖」中,y′1…y′m代表下混訊號解碼單元305的直接輸出頻道。
空間資訊訊號解碼單元307自被編碼的空間資訊訊號304提取空間資訊訊號的結構資訊,然後利用提取的結構資訊解碼空間資訊訊號304。
上混單元309可利用提取的空間資訊308上混下混訊號306至多頻道音頻訊號310。在「第3圖」中,y1…yn代表上混單元309 的輸出頻道的數量。
「第4圖」所示為包含於「第3圖」中解碼器的上混單元309的頻道變換模組的示意圖。在某些實施例中,上混單元309可包含複數個頻道變換模組。頻道變換模組為概念裝置,其可利用特殊資訊區分輸入頻道的數量和輸出頻道的數量。
在某些實施例中,頻道變換模組可包含一到二(OTT)裝置和二到三(TTT)裝置,一到二裝置用於變換一個頻道至兩個頻道,反之亦然,二到三裝置用於變換兩個頻道至三個頻道,反之亦然。一到二裝置和/或二到三裝置可依照多個有益結構排佈。例如,「第3圖」中的上混單元309可包含5-1-5結構、5-2-5結構、7-2-7結構和7-5-7結構等。在5-1-5結構中,具有一個頻道的下混訊號係透過下混五個頻道至一個頻道生成,隨後一個頻道可被上混為五個頻道。也可依照相同的方式利用一到二裝置與二到三裝置的各種組合形成其它結構。
如「第4圖」所示,為上混單元400的5-2-5結構示意圖。在5-2-5結構中,具有兩個頻道的下混訊號401被輸入上混單元400。在圖示中,提供有左側頻道(L)和右側頻道(R)以輸入至上混單元400。在本實施例中,上混單元400包含一個二到三裝置402和三個一到二裝置406、407、408。具有兩個頻道的下混訊號401可輸入至二到三裝置(TTTo)402,後者可處理下混訊號401並提供做為輸出的三個頻道403、404、405。一個或多個空間 參數(如頻道預測係數,頻道位準差,頻道間相關性/同調)可輸入二到三裝置402,並用於處理下混訊號401,如下文描述。在某些實施例中,殘餘訊號可選擇性地輸入至二到三裝置402。在這種情況下,頻道預測係數可做為預測係數以從兩個頻道生成三個頻道。
做為二到三裝置402的輸出的頻道403係為一到二裝置406的輸入,一到二裝置406利用一個或多個空間參數生成兩個輸出頻道。在圖示中,在如環繞聲環境中兩個輸出頻道代表左前(FL)和左後(BL)揚聲器位置。頻道404做為一到二裝置407的輸入,一到二裝置407利用一個或多個空間參數生成兩個輸出頻道。在圖示中,兩個輸出頻道代表右前(FR)和右後(BR)揚聲器位置。頻道405做為一到二裝置408的輸入,一到二裝置408可生成兩個輸出頻道。在圖示中,兩個輸出頻道代表中央(C)揚聲器位置和低頻部份增強(LEF)頻道。在這種情況下,空間資訊(即頻道位準差,頻道間相關性/同調)可做為每個一到二裝置的輸入。在某些實施例中,殘餘訊號(Res1,Res2)可做為一到二裝置406和407的輸入。在這種實施例中,殘餘訊號可不做為一到二裝置408的輸入,其中一到二裝置408可輸出中央頻道和低頻部份增強頻道。
「第4圖」所示的結構為頻道變換模組的結構實施例。也可採用頻道變換模組的其它結構,其包含一到二裝置和二到三裝置 的各種組合。由於每個頻道變換模組可在頻域中操作,因此可定義加載至每個頻道變換模組的參數帶的數量。參數帶代表可適用於一個參數的至少一個頻帶。參數帶的數量如「第6B圖」所示。
「第5圖」所示為本發明實施例配置音頻訊號的位元流的方法的示意圖。「第5圖」(a)部份所示為僅包含空間資訊訊號的音頻訊號的位元流,「第5圖」(b)部份和(c)部份所示為包含下混訊號和空間資訊訊號的音頻訊號的位元流的示意圖。
如「第5圖」(a)部份所示,音頻訊號的位元流包含結構資訊501和框503。框503可在位元流中重複,並且在某些實施例中,框503可包含單獨的空間框502,空間框502包含空間音頻資訊。
在某些實施例中,結構資訊501包含描述一個空間框502內時間槽總數量的資訊、跨越音頻訊號頻率範圍的參數帶的總數量的資訊、一到二裝置中參數帶的數量資訊、二到三裝置中參數帶的數量資訊和殘餘訊號中參數帶的數量資訊。結構資訊501中也可包含其它所需的資訊。
在某些實施例中,空間框502包含一個或多個空間參數(頻道位準差,頻道間相關性/同調)、框類型、一個框內的參數集數量和加載參數集的時間槽。空間框502中也可包含其它所需的資訊。結構資訊501的意義和用途以及空間框502內包含的資訊將依照「第6A圖」、「第6B圖」、「第7A圖」、「第7B圖」、「第8A圖」、「第8B圖」、「第9A圖」、「第9B圖」、「第10A圖」、「第10B 圖」、「第10C圖」和「第10D圖」描述。
如「第5圖」(b)部份所示,音頻訊號的位元流可包含結構資訊504、下混訊號505和空間框506。在這種情況下,一個框507可包含下混訊號505和空間框506,並且框507可在位元流中重複。
如「第5圖」(c)部份所示,音頻訊號的位元流包含下混訊號508、結構資訊509和空間框510。在這種情況下,一個框511可包含結構資訊509和空間框510,並且框511可在位元流中重複。如果結構資訊509插入每個框511中,那麼音頻訊號可被任意位置之回放裝置回放。
儘管「第5圖」(c)部份圖示了結構資訊509透過框511插入位元流中,但顯然結構資訊509可透過周期性或非周期性重複的複數個框插入位元流中。
「第6A圖」和「第6B圖」所示為本發明實施例參數集、時間槽和參數帶之間的關係的示意圖。參數集代表加載至時間槽的一個或多個空間參數。空間參數可包含空間資訊,如頻道位準差、頻道間相關性/同調、頻道預測係數等。時間槽代表加載空間參數的音頻訊號的時間間隔。一個空間框可包含一個或多個時間槽。
如「第6A圖」所示,多個參數集1…P可用於空間框中,每個參數集可包含一個或多個資料域1…Q-1。參數集可加載至音頻訊號的所有頻率範圍,並且參數集中的每個空間參數可加載至頻帶的一個或多個部份。例如,如果參數集包含20個空間參數, 那麼音頻訊號的所有頻帶可分為20個區域(以下稱之為〞參數帶〞),並且參數集的20個空間參數可加載至20個參數帶。參數可依照需要加載至參數帶。例如,空間參數可密集地加載至低頻參數帶並且稀疏地加載至高頻參數帶。
如「第6B圖」所示,為參數集與時間槽之間關係的時間/頻率圖。如圖所示,三個參數集(參數集1、參數集2和參數集3)加載至單獨空間框中的12個時間槽的有序組。在這種情況下,音頻訊號的所有頻率範圍可分為9個參數帶。因此水平軸代表時間槽的數量,垂直軸代表參數帶的數量。三個參數集中每個參數集都加載至特定時間槽。例如,第一參數集(參數集1)加載至時間槽#1,第二參數集(參數集2)加載至時間槽#5,第三參數集(參數集3)加載至時間槽#9。透過添加和/或複製參數集至其它時間槽可使參數集加載至這些時間槽。通常,參數集的數量等於或小於時間槽的數量,並且參數帶的數量等於或小於音頻訊號的頻帶的數量。透過編碼音頻訊號的部份時間-頻率域而非全部的時間-頻率域的空間資訊,可減少從編碼器發送至解碼器的空間資訊的量。這種資料減少是可能的,因為依照感知音頻編碼的習知理論,時間-頻率域的稀疏的資訊通常足夠用於人類的聽知覺。
上述實施例的一個重要特徵係時間槽位置的編碼和解碼,這些時間槽係利用固定或可變數量的位元加載參數集。參數帶的數量也可透過固定數量的位元或可變數量的位元代表。可變位元編 碼方案也可用於空間音頻編碼中使用的其它資訊,其包含時間相關資訊、空間和/或頻域(如用於濾波帶輸出的多個子頻帶)相關資訊,但不僅限於此。
「第7A圖」所示為本發明實施例代表空間資訊訊號的結構資訊的結構圖。結構資訊包含複數個區域701至718,位元數量可被分配至區域701至718。
〞bsSamplingFrequencyIndex〞區域701代表從音頻訊號的取樣過程中獲得的取樣頻率。為了描述取樣頻率,4個位元被分配至〞bsSamplingFrequencyIndex〞區域701。如果〞bsSamplingFrequencyIndex〞區域701的值為15,也就是1111的二進制數字,那麼增加〞bsSamplingFrequency〞區域702以代表取樣頻率。在這種情況下,24個位元被分配至〞bsSamplingFrequency〞區域702。
〞bsFrameLength〞區域703代表一個空間框內時間槽的總數(下稱為〞時間槽數量〞(numSlots)),並且〞時間槽數量〞和〞bsFrameLength〞區域703之間存在時間槽數量=bsFrameLength+1的關係。
〞bsFreqRes〞區域704代表跨越音頻訊號的所有頻域的參數帶的總數。〞bsFreqRes〞區域704將在「第7B圖」中說明。
〞bsTreeConfig〞區域705代表樹狀結構資訊,樹狀結構包含複數個頻道變換模組,如「第4圖」中所示。樹狀結構資訊包含 如頻道變換模組的類型資訊、頻道變換模組的數量資訊、頻道變換模組中所用的空間資訊的類型和音頻訊號的輸入/輸出頻道的數量等。
依照頻道變換模組的類型或頻道的數量,樹狀結構具有5-1-5結構、5-2-5結構、7-2-7結構和7-5-7結構等其中之一。樹狀結構的5-2-5結構如「第4圖」中所示。
〞bsQuantMode〞區域706代表空間資訊的量化模式資訊。
〞bsOneIcc〞區域707代表一個頻道間相關性/同調子參數集是否用於所有一到二裝置。在這種情況下,子參數集代表加載至特定時間槽和特定頻道變換模組的參數集。
〞bsArbitraryDownmix〞區域708代表隨機下混增益的存在或不存在。
〞bsFixedGainSur〞區域709代表加載至環繞頻道如左環繞(LS)或右環繞(RS)的增益。
〞bsFixedgainLF〞區域710代表加載至低頻部份增強(LFE)頻道的增益。
〞bsFxiedGainDM〞區域711代表加載至下混訊號的增益。
〞bsMatrixMode〞區域712代表陣列相容身厲聲下混訊號是否生成自編碼器。
〞bsTempShapeConfig〞區域713代表解碼器中時域重整(temporal shaping)(如時域包跡重整(TES)和/或時域重整 (TP))的操作模式。
〞bsDecorrConfig〞區域714代表解碼器的解聯器的操作模式。
〞bs3DaudioMode〞區域715代表下混訊號是否被編碼為3D訊號並且是否使用反向頭部關聯傳輸功能(HRTF)處理。
在解碼器/編碼器中確定/提取每個區域的資訊後,在解碼器/編碼器中確定/提取加載至頻道變換模組的參數帶數量資訊。首先確定/提取加載至一到二裝置的參數帶數量(716),然後確定/提取加載至二到三裝置的多參數帶數量(717)。加載至一到二裝置和/或二到三裝置的參數帶數量將結合「第8A圖」、「第8B圖」、「第9A圖」和「第9B圖」描述。
在擴展框存在的情況下,〞spatialExtensionConfig〞區域718包含擴展框的結構資訊。包含在〞spatialExtensionConfig〞區域718中的資訊將結合「第10A圖」、「第10B圖」、「第10C圖」和「第10D圖」描述。
「第7B圖」所示為本發明實施例空間資訊訊號的參數帶數量的表圖。〞帶數量(numBands)〞代表音頻訊號所有頻域的參數帶數量,〞bsFreqRes〞代表參數帶數量的指數資訊。例如音頻訊號的所有頻域可被參數帶數量分割(如4、5、7、10、14、20、28等)。
在某些實施例中,一個參數可應用於每個參數帶。例如,如果〞帶數量〞為28,那麼音頻訊號的所有頻域可被分為28個參數 帶,並且28個參數中每個參數均可應用於28個參數帶中每個參數帶。在另一實施例中,如果〞帶數量〞為4,那麼給定音頻訊號的所有頻域被分為4個參數帶,並且4個參數中每個參數可應用於4個參數帶中每個參數帶。在「第7B圖」中,〞保留〞一詞代表給定音頻訊號的所有頻域的參數帶數量未被確定。
需要指出的是人類聽覺器官對編碼方案中的參數帶數量並不敏感。因此,使用少量參數帶可提供聽著與使用大量參數帶相似的空間音頻影響。
不同於〞帶數量〞,「第7A圖」中〞bsFramelength〞區域703代表的〞時間槽數量〞可代表所有值。然而,如果一個空間框內的取樣數量是可被〞時間槽數量〞精確地分割的,那麼可限定〞時間槽數量〞的值。因此,如果將被充分描述的〞時間槽數量〞的最大值為b,那麼〞bsFramelength〞區域703的每個值可透過ceil{log2(b)}位元(s)代表。在這種情況下,〞ceil(x)〞代表大於或等於〞x〞值的最小整數。例如,如果一個空間框包含72個時間槽,那麼ceil{log2(72)}=7位元可被分配至〞bsFrameLength〞區域703,並且加載至頻道變換模組的參數帶的數量可在〞帶數量〞內確定。
「第8A圖」所示為本發明實施例由固定數量的位元表示加載至一到二裝置的參數帶數量的結構圖。如「第7A圖」和「第8A圖」所示,〞i〞值具有從0至numOttBoxes-1的值,其中〞 numOttBoxes〞為一到二裝置的總數。也就是〞i〞值代表每個一到二裝置,加載至每個一到二裝置的參數帶的數量係依照〞i〞值表示。如果一到二裝置具有低頻部份增強(LFE)頻道模式,那麼加載至一到二裝置的低頻部份增強(LFE)頻道的參數帶(下稱為〞bsOttBands〞)的數量可利用固定數量的位元代表。在「第8A圖」所示的實施例中,5位元被分配至〞bsOttBands〞區域801。如果一到二裝置沒有低頻部份增強(LFE)頻道模式,那麼所有數量的參數帶(帶數量)可加載至一到二裝置的頻道。
「第8B圖」所示為本發明實施例由可變數量的位元代表加載至一到二裝置的參數帶數量的結構圖。在與「第8A圖」相似的「第8B圖」中,與「第8A圖」不同之處在於「第8B圖」中的〞bsOttBands〞區域802由可變數量的位元代表。尤其是具有等於或小於〞帶數量〞的值的〞bsOttBands〞區域802可利用〞帶數量〞由可變數量的位元代表。
如果〞帶數量〞位於等於或大於2^(n-1)且小於2^(n)的範圍內,那麼〞bsOttBands〞區域802可由可變n位元代表。
例如:(a)如果〞帶數量〞為40,〞bsOttBands〞區域802可由6位元代表;(b)如果〞帶數量〞為28或20,〞bsOttBands〞區域802可由5位元代表;(c)如果〞帶數量〞為14或10,〞bsOttBands〞區域802可由4位元代表;(d)如果〞帶數量〞為7、5或4,〞bsOttBands〞區域802可由3位元代表。
如果〞帶數量〞位於大於2^(n-1)且小於等於2^(n)的範圍內,那麼〞bsOttBands〞區域802可由可變n位元代表。
例如:(a)如果〞帶數量〞為40,〞bsOttBands〞區域802可由6位元代表;(b)如果〞帶數量〞為28或20,〞bsOttBands〞區域802可由5位元代表;(c)如果〞帶數量〞為14或10,〞bsOttBands〞區域802可由4位元代表;(d)如果〞帶數量〞為7或5,〞bsOttBands〞區域802可由3位元代表;(e)如果〞帶數量〞為4,〞bsOttBands〞區域802可由2位元代表。
〞bsOttBands〞區域802可透過將〞帶數量〞做為變量的取整最接近整數的四捨五入函數(下稱為ceil函數)藉由可變數量的位元代表。
尤其是,i)在0<bsOttBands帶數量或者0bsOttBands<帶數量的情況下,〞bsOttBands〞區域802可由ceil(log2(帶數量))的值對應的位元數代表,或者ii)在0bsOttBands帶數量的情況下,〞bsOttBands〞區域802可由ceil(log2(帶數量+1))位元代表。
如果隨機確定等於或小於〞帶數量〞的值(下稱為〞帶數目(numberBands)〞),那麼〞bsOttBands〞區域802可透過將〞帶數目〞做為變量的四捨五入函數藉由可變數量的位元表示。
尤其是,i)在0<bsOttBands帶數目或者0bsOttBands<帶數目的情況下,〞bsOttBands〞區域802可由ceil(log2(帶數目)) 位元代表,或者ii)在0bsOttBands帶數目的情況下,〞bsOttBands〞區域802可由ceil(log2(帶數目+1))位元代表。
如果使用不只一個一到二裝置,那麼〞bsOttBands〞的組合可使用下述公式1表示:
其中bsOttBandsi代表第i個〞bsOttBands〞。例如,假設〞bsOttBands〞區域802有三個一到二裝置,並且具有三個值(N=3)。那麼在本實施例中,分別加載至三個一到二裝置的〞bsOttBands〞區域802的三個值每個均可用2位元代表。因此,總共需要6位元表示值a1、a2、a3。然而如果a1、a2、a3由群組代表,那麼出現27(3×3×3)的情況,其可由5位元代表,那麼節省了一位元。如果〞帶數量〞為3,並且5位元代表的群組值為15,那麼群組值可表示為15=1×(3^2)+2*(3^1)+0*(3^0)。因此,解碼器可從群組值15確定,其中透過公式1的反函數〞bsOttBands〞區域802的三個值a1、a2、a3分別為1、2、0。
在具有多個一到二裝置的情況下,〞bsOttBands〞的組合可由利用〞帶數目〞的下述公式2、3和4的其中之一代表(下文將描述)。由於利用〞帶數目〞表示的〞bsOttBands〞與利用公式1中利用〞帶數量〞表示相似,因此將省略對其的詳細解釋,並在下文僅給出公式。
【公式2】
「第9A圖」所示為本發明實施例由固定數量的位元表示加載至二到三裝置的參數帶數量的結構圖。如「第7A圖」和「第9A圖」所示,〞i〞值具有從0至numTttBoxes-1的值,其中〞numTttBoxes〞為所有二到三裝置的數量。也就是說,〞i〞值代表每個二到三裝置。加載至每個二到三裝置的參數帶的數量可依照〞i〞值表示。在某些實施例中,二到三裝置可分為低頻帶範圍和高頻帶範圍,並且對低頻帶範圍和高頻帶範圍可採用不同的處理。也可使用其它區分。
〞bsTttDualMode〞區域901代表對於低頻帶範圍和高頻帶範圍給定的二到三裝置是否分別操作於不同的模式下(下稱為雙模式)。例如,如果〞bsTttDualMode〞區域901的值為0,那麼所有頻帶範圍可使用一個模式,而不用在低頻帶範圍和高頻帶範圍之間區別。如果〞bsTttDualMode〞區域901的值為1,那麼低頻帶範圍和高頻帶範圍可分別使用不同的模式。
〞bsTttModeLow〞區域902表示給定的二到三裝置的操作模 式,給定的二到三裝置可具有各種操作模式。例如,二到三裝置可具有使用如頻道預測係數和頻道間相關性/同調參數的預設模式、使用頻道位準差參數的以能量為基礎的模式等。如果二到三裝置具有雙模式,那麼需要關於高頻帶範圍的其它資訊。
〞bsTttModeHigh〞區域903代表在二到三裝置具有雙模式的情況下高頻帶範圍的操作模式。
〞bsTttBandsLow〞區域904代表加載至二到三裝置的參數帶數量。
〞bsTttBandsHigh〞區域905具有〞帶數量〞。
如果二到三裝置具有雙模式,那麼低頻帶範圍可等於或大於0並小於〞bsTttBandsLow〞,而高頻帶範圍可等於或大於〞bsTttBandsLow〞並小於〞bsTttBandsHigh〞。
如果二到三裝置不具有雙模式,那麼加載至二到三裝置的參數帶數量可等於或大於0並小於〞帶數量〞(907)。
〞bsTttBandsLow〞區域904可由固定數量的位元代表。例如「第9A圖」所示,可分配5位元以代表〞bsTttBandsLow〞區域904。
「第9B圖」所示為本發明實施例由可變數量位元代表的加載至二到三裝置的參數帶數量的結構圖。「第9B圖」與「第9A圖」相似,但二者差別在於「第9B圖」中的〞bsTttBandsLow〞區域907可由可變位元代表,而「第9A圖」中〞bsTttBandsLow〞區 域904由固定位元代表。尤其是由於〞bsTttBandsLow〞區域907具有等於或小於〞帶數量〞的值,所以〞bsTttBandsLow〞區域907可利用〞帶數量〞由可變數量的位元表示。
尤其是在〞帶數量〞等於或大於2^(n-1)並小於2^(n)的情況下,〞bsTttBandsLow〞區域907可由n位元表示。
例如,i)如果〞帶數量〞為40,那麼〞bsTttBandsLow〞區域907可由6位元表示;ii)如果〞帶數量〞為28或20,那麼〞bsTttBandsLow〞區域907可由5位元表示;iii)如果〞帶數量〞為14或10,那麼〞bsTttBandsLow〞區域907可由4位元表示;iv)如果〞帶數量〞為7、5或4,那麼〞bsTttBandsLow〞區域907可由3位元表示。
如果〞帶數量〞處於大於2^(n-1)並等於或小於2^(n)的範圍內,那麼〞bsTttBandsLow〞區域907可由n位元表示。
例如,i)如果〞帶數量〞為40,那麼〞bsTttBandsLow〞區域907可由6位元表示;ii)如果〞帶數量〞為28或20,那麼〞bsTttBandsLow〞區域907可由5位元表示;iii)如果〞帶數量〞為14或10,那麼〞bsTttBandsLow〞區域907可由4位元表示;iv)如果〞帶數量〞為7或5,那麼〞bsTttBandsLow〞區域907可由3位元表示;v)如果〞帶數量〞為4,那麼〞bsTttBandsLow〞區域907可由2位元表示。
〞bsTttBandsLow〞區域907可透過由〞帶數量〞做為變量的 四捨五入函數確定的位元數量表示。
例如,i)在0<bsOttBandsLow帶數量或者0bsOttBandsLow<帶數量的情況下,〞bsTttBandsLow〞區域907可由依照ceil(log2(帶數量))值的位元數量代表,或者ii)在0bsOttBandsLow帶數量的情況下,〞bsTttBandsLow〞區域907可由ceil(log2(帶數量+1))表示。
如果隨機確定等於或小於〞帶數量〞的值即〞帶數目〞,那麼〞bsTttBandsLow〞區域907可利用〞帶數目〞由可變數量的位元表示。
尤其是,i)在0<bsOttBandsLow帶數目或者0bsOttBandsLow<帶數目的情況下,〞bsTttBandsLow〞區域907可由依照ceil(log2(帶數目))值的位元數量代表,或者ii)在0bsOttBandsLow帶數目的情況下,〞bsTttBandsLow〞區域907可由依照ceil(log2(帶數目+1))的值的位元數量代表。
如果採用多個二到三裝置,那麼〞bsTttBandsLow〞的組合可表示為下述的公式5。
在這種情況下,bsTttBandsLowi表示第i個〞bsTttBandsLow〞。由於公式5的意義與公式1相似,因此下文將省略對公式5的詳述。
在採用多個二到三裝置的情況下,〞bsTttBandsLow〞的組合可由利用〞帶數目〞的公式6、7和8中的一個表示。由於公式6、7和8的意義與公式2、3和4相同,因此下文將省略對公式6、7和8的詳述。
加載至頻道變換模組(即一到二裝置和/或二到三裝置)的參數帶的數量可由〞帶數量〞的分度值(division value)表示。在這情況下,分度值使用〞帶數量〞的半值(half value)或從〞帶數量〞除以一個特定值的結果獲得。
一旦加載至一到二裝置和/或二到三裝置的參數帶的數量被確定,可在參數帶的數量範圍內確定加載至每個一到二裝置和/或二到三裝置的參數集。每個參數集可透過時間槽單元加載至每個一到二裝置和/或每個二到三裝置。也就是說,一個參數集可被加載至一個時間槽。
據上所述,一個空間框可包含複數個時間槽。如果空間框具有固定的框類型,那麼參數集可在相等的間隔內加載至複數個時 間槽。如果框具有可變框類型,那麼則需要加載有參數集的時間槽的位置資訊。下文將依照「第13A圖」、「第13B圖」和「第13C圖」詳述。
「第10A圖」所示為本發明實施例空間擴展框的空間擴展結構資訊的結構圖。空間擴展結構資訊可包含〞bsSacExtType〞區域1001、〞bsSacExtLen〞區域1002、〞bsSacExtLenAdd〞區域1003、〞bsSacExtLenAddAdd〞區域1004和〞bsFillBits〞區域1007。也可有其它區域。
〞bsSacExtType〞區域1001表示空間擴展框的資料類型。例如,空間擴展框可由0、殘餘訊號資料、隨機下混殘餘訊號資料或隨機樹狀資料填滿。
〞bsSacExtLen〞區域1002表示空間擴展結構資訊的字節數量。
如果空間擴展結構資訊的字節數量等於或大於例如15,那麼〞bsSacExtLenAdd〞區域1003表示空間擴展結構資訊的附加字節數量。
如果空間擴展結構資訊的字節數量等於或大於例如270,那麼〞bsSacExtLenAddAdd〞區域1004表示空間擴展結構資訊的附加字節數量。
在從編碼器/解碼器確定/提取各個區域後,可確定包含在空間擴展框內的資料類型的結構資訊。
如上所述,殘餘訊號資料、隨機下混殘餘訊號資料、樹狀結 構資料等可包含在空間擴展框中。
接著,計算空間擴展結構資訊的長度的未被使用的位元的數量。
〞bsFillBits〞區域1007表示可被忽略以組成未使用位元的資料的位元數量。
「第10B圖」和「第10C圖」所示為本發明實施例在殘餘訊號包含於空間擴展框時殘餘訊號的空間擴展結構資訊的結構圖。
如「第10B圖」所示,〞bsResidualSamplingFrequency Index〞區域1008表示殘餘訊號的取樣頻率。
〞bsResidualFramesPerSpatialFrame〞區域1009表示每個空間框的殘餘框的數量。例如,一個空間框中可包含1、2、3或4個殘餘框。
〞ResidualConfig〞區塊1010表示加載至每個一到二裝置和/或二到三裝置的殘餘訊號的參數帶的數量。
如「第10C圖」所示,〞bsResidualPresent〞區域1011表示殘餘訊號是否加載至每個一到二裝置和/或二到三裝置。
如果殘餘訊號存在於每個一到二和/或二到三裝置中,那麼〞bsResidualBands〞區域1012代表存在於每個一到二和/或二到三裝置中的殘餘訊號的參數帶數量。殘餘訊號的參數帶數量可由固定數量的位元或可變數量的位元代表。在參數帶數量由固定數量的位元代表的情況下,殘餘訊號可具有等於或小於音頻訊號的參 數帶總數的值。所以可分配代表所有參數帶數量所需的位元數量(即「第10C圖」中的5位元)。
「第10D圖」所示為本發明實施例由可變數量位元表示的殘餘訊號的參數帶數量的結構圖。〞bsResidualBands〞區域1014可利用〞帶數量〞由可變數量的位元表示。如果帶數量等於或大於2^(n-1)並小於2^(n),那麼〞bsResidualBands〞區域1014可由n位元表示。
例如,i)如果〞帶數量〞為40,那麼〞bsResidualBands〞區域1014可由6位元表示;ii)如果〞帶數量〞為28或20,那麼〞bsResidualBands〞區域1014可由5位元表示;iii)如果〞帶數量〞為14或10,那麼〞bsResidualBands〞區域1014可由4位元表示;iv)如果〞帶數量〞為7、5或4,那麼〞bsResidualBands〞區域1014可由3位元表示。
如果帶數量大於2^(n-1)並等於或小於2^(n),那麼殘餘訊號的參數帶的數量可由n位元表示。
例如,i)如果〞帶數量〞為40,那麼〞bsResidualBands〞區域1014可由6位元表示;ii)如果〞帶數量〞為28或20,那麼〞bsResidualBands〞區域1014可由5位元表示;iii)如果〞帶數量〞為14或10,那麼〞bsResidualBands〞區域1014可由4位元表示;iv)如果〞帶數量〞為7或5,那麼〞bsResidualBands〞區域1014可由3位元表示;v)如果〞帶數量〞為4,那麼〞bsResidualBands〞 區域1014可由2位元表示。
而且〞bsResidualBands〞區域1014可由透過將〞帶數量〞做為變量的取整最接近整數的四捨五入函數確定的位元數量表示。
尤其是,i)在0<bsResidualBands帶數量或者0bsResidualBands<帶數量的情況下,〞bsResidualBands〞區域1014可由ceil{log2(帶數量)}位元代表,或者ii)在0bsResidualBands帶數量的情況下,〞bsResidualBands〞區域1014可由ceil(log2(帶數量+1))位元表示。
在某些實施例中,〞bsResidualBands〞區域1014可利用等於或小於帶數量的值(帶數目)表示。
尤其是,i)在0<bsResidualBands帶數目或者0bsResidualBands<帶數目的情況下,〞bsResidualBands〞區域1014可由ceil{log2(帶數目)}位元代表,或者ii)在0bsResidualBands帶數目的情況下,〞bsResidualBands〞區域1014可由ceil(log2(帶數目+1))位元表示。
如果存在複數個殘餘訊號(N),那麼〞bsResidualBands〞的組合可由下述的公式9表示。
在這種情況下,bsResidualBandsi表示第i個〞bsResidualBands〞。由於公式9的涵義與公式1相似,因此下文不 再對公式9詳細說明。
如果有多個殘餘訊號,〞bsResidualBands〞的組合可由利用〞帶數目〞的公式10、11或12中的一個表示。由於利用〞帶數目〞的公式10、11和或12與公式2、3和4相似,因此下文不再對其詳述。
殘餘訊號的參數帶數量可由〞帶數量〞的分度值表示。在這情況下,分度值使用〞帶數量〞的半值或從〞帶數量〞除以一個特定值的結果獲得。
殘餘訊號可與下混訊號和空間資訊訊號一同包含在音頻訊號的位元流中,並且位元流可被轉移至解碼器。解碼器可自位元流中提取下混訊號、空間資訊訊號和殘餘訊號。
接著,下混訊號利用空間資訊被上混。同時,殘餘訊號在上混過程中被加載至下混訊號。尤其是下混訊號在複數個頻道變換模組中利用空間資訊被上混。在上混時,殘餘訊號被加載至頻道 變換模組。據上所述,頻道變換模組具有複數個參數帶,並且參數集透過時間槽被加載至頻道變換模組。當殘餘訊號被加載至頻道變換模組時,需要殘餘訊號更新加載有殘餘訊號的音頻訊號的通道間相關性資訊。接著,在上混過程中使用已經更新的頻道間相關性資訊。
「第11A圖」所示為本發明實施例用於非導向性編碼的解碼器的示意圖。非導向性編碼代表空間資訊並未包含於音頻訊號的位元流中。
在某些實施例中,解碼器包含解析濾波器組(analysis filterbank)1102、解析單元1104、空間合成單元1106和合成濾波器組(synthesis filterbank)1108。儘管身厲聲訊號類型中的下混訊號如「第11A圖」所示,但也可使用其它類型的下混訊號。
在操作中,解碼器接收下混訊號1101,解析濾波器組1102將接收到的下混訊號1101變為頻域訊號1103。解析單元1104從變化的下混訊號1103生成空間資訊。解析單元1104透過槽單元進行處理,並且每複數個槽均生成空間資訊1105。在這種情況下,槽包含時間槽。
空間資訊可在兩個步驟中生成。首先,下混參數自下混訊號生成。第二,下混參數變為空間資訊,如空間參數。在某些實施例中,下混參數可透過下混訊號的矩陣計算生成。
空間合成單元1106透過將下混訊號1103與生成的空間資訊 1105合成生成多頻道音頻訊號1107。生成的多頻道音頻訊號1107透過合成濾波器組1108變為時域音頻訊號1109。
空間資訊可在一些預設槽位置生成。這些位置之間的距離相等(即等距)。例如,空間資訊可在每四個槽生成。空間資訊也可在變化的槽位置生成。在這種情況下,從中生成空間資訊的槽位置資訊可從位元流中提取。位置資訊可由可變數量的位元代表。位置資訊可由絕對值和與前一槽位置資訊不同的差異值表示。
在使用非導向性編碼的情況下,音頻訊號的每個頻道的參數帶數量(下稱為〞bsNumguidedBlindBands〞)可由固定數量的位元表示。〞bsNumguidedBlindBands〞可利用〞帶數量〞由可變數量的位元表示。例如,如果〞帶數量〞等於或大於2^(n-1)並小於2^(n),那麼〞bsNumguidedBlindBands〞可由可變n位元表示。
尤其是,(a)如果〞帶數量〞為40,那麼〞bsNumguidedBlindBands〞可由6位元表示;(b)如果〞帶數量〞為28或20,那麼〞bsNumguidedBlindBands〞可由5位元表示;(c)如果〞帶數量〞為14或10,那麼〞bsNumguidedBlindBands〞可由4位元表示;(d)如果〞帶數量〞為7、5或4,那麼〞bsNumguidedBlindBands〞可由3位元表示。
如果〞帶數量〞大於2^(n-1)並等於或小於2^(n),那麼〞bsNumguidedBlindBands〞可由可變n位元表示。
例如,(a)如果〞帶數量〞為40,那麼〞bsNumguidedBlindBands〞 可由6位元表示;(b)如果〞帶數量〞為28或20,那麼〞bsNumguidedBlindBands〞可由5位元表示;(c)如果〞帶數量〞為14或10,那麼〞bsNumguidedBlindBands〞可由4位元表示;(d)如果〞帶數量〞為7或5,那麼〞bsNumguidedBlindBands〞可由3位元表示;(e)如果〞帶數量〞為4,那麼〞bsNumguidedBlindBands〞可由2位元表示。
此外,〞bsNumguidedBlindBands〞可利用將〞帶數量〞做為變量的四捨五入函數由可變數量的位元表示。
例如,i)在0<bsNumguidedBlindBands帶數量或者0bsNumguidedBlindBands<帶數量的情況下,〞bsNumguidedBlindBands〞可由ceil{log2(帶數量)}位元代表,或者ii)在0bsNumguidedBlindBands帶數量的情況下,〞bsNumguidedBlindBands〞可由ceil(log2(帶數量+1))位元表示。
如果隨機確定等於或小於〞帶數量〞的值,即〞帶數目〞(numberBands),〞bsNumguidedBlindBands〞可由下文表示。
尤其是,i)在0<bsNumguidedBlindBands帶數目或者0bsNumguidedBlindBands<帶數目的情況下,〞bsNumguidedBlindBands〞可由ceil{log2(帶數目)}位元表示,或者ii)在0bsNumguidedBlindBands帶數目的情況下,〞bsNumguidedBlindBands〞可由ceil(log2(帶數目+1))位元表示。
如果存在多個頻道(N),那麼〞bsNumguidedBlindBands〞的 組合可由公式13表示。
在這種情況下,〞bsNumguidedBlindBandsi〞表示第i個〞bsNumguidedBlindBands〞。由於公式13的意義與公式1的意義相似,因此下文不再對公式13詳述。
如果有複數個頻道,〞bsNumguidedBlindBands〞可利用〞帶數目〞由公式14、15和16的其中之一表示。由於利用〞帶數目〞表示〞bsNumguidedBlindBands〞與公式2、3和4表示相似,因此下文將省略對公式14、15和16的詳述。
「第11B圖」所示為本發明實施例將參數帶的數量表示為群組的方法的示意圖。在使用非導向性編碼的情況下,參數帶的數量包含加載至頻道變換模組的參數帶的數量資訊、加載至殘餘訊號的參數帶的數量資訊和音頻訊號的每個頻道的參數帶的數量資訊。在存在複數個參數帶數量資訊的情況下,這些數量資訊(即〞 bsOttBands〞、〞bsTttBands〞、〞bsResidualBand〞和/或〞bsNumguidedBlindBands〞)可由至少一個或多個群組表示。
如「第11B圖」所示,如果有Kn+1個參數帶數量資訊,並且如果需要Q位元表示參數帶的每個數量資訊,那麼參數帶的複數個數量資訊可由下面的群組表示。在這種情況下,〞k〞和〞N〞表示非0的隨機整數,〞L〞為滿足0L<N的隨機整數。
群組方法包含下述步驟:透過組合(binding)參數帶的N個數量資訊生成k群組,並透過組合最後L個數量資訊生成最終群組。k群組可由M位元表示,最終群組可由p位元表示。在這種情況下,M位元最好小於未組成群組前表示參數帶的每個數量資訊所使用的N*Q位元。p位元最好等於或小於未組成群組前表示參數帶的每個數量資訊所使用的L*Q位元。
例如,假設參數帶的兩個數量資訊分別為b1和b2。如果b1和b2均可具有5個值,那麼需要3位元表示b1和b2。在這種情況下,即使3位元可以表示8個值,但實際需要5個值。因此b1和b2均具有3個冗餘。但是,在透過結合b1和b2以將b1和b2為表示群組的情況下,可使用5位元而非6位元(=3位元+3位元)。尤其是由於b1和b2的所有組合包含25(=5*5)個類型,因此b1和b2的群組可由5位元表示。由於5位元可以代表32個值,因此在群組表示的情況下產生7個冗餘。但是,在透過將b1和b2組成群組表示時,冗餘小於將b1和b2均表示為3位元的情況。 將參數帶的複數個數量資訊利用群組表示的方法可透過下述各種方式實現。
如果參數帶的複數個數量資訊的每個值均具有40個類別,那麼k群組可利用2、3、4、5或6做為N生成。k群組可分別由11、16、22、27和32個位元表示。或者,k群組可透過組合各種情況表示。
如果參數帶的複數個數量資訊的值均具有28個類別,那麼k群組可利用6做為N生成,並且k群組可由29位元表示。
如果參數帶的複數個數量資訊的值均具有20個類別,那麼k群組可利用2、3、4、5、6或7做為N生成。k群組可分別由9、13、18、22、26和31個位元表示。或者,k群組可透過組合各種情況表示。
如果參數帶的複數個數量資訊的值均具有14個類別,那麼k群組可利用6做為N生成,並且k群組可由23位元表示。
如果參數帶的複數個數量資訊的值均具有10個類別,那麼k群組可利用2、3、4、5、6、7、8或9做為N生成。k群組可分別由7、10、14、17、20、24、27和30個位元表示。或者,k群組可透過組合各種情況表示。
如果參數帶的複數個數量資訊的值均具有7個類別,那麼k群組可利用6、7、8、9、10或11做為N生成。k群組可分別由17、20、23、26、29和31個位元表示。或者,k群組可透過組合 各種情況表示。
如果參數帶的複數個數量資訊的值均具有例如5個類別,那麼k群組可利用2、3、4、5、6、7、8、9、10、11、12或13做為N生成。k群組可分別由5、7、10、12、14、17、19、21、24、26、28和31個位元表示。或者,k群組可透過組合各種情況表示。
此外,參數帶的複數個數量資訊的結構可由上述的群組表示,或透過將參數帶的每個數量資訊變為獨立的位元序列表示。
「第12圖」所示為本發明實施例表示空間框的結構資訊的結構圖。空間框包含〞FramingInfo〞區塊1201、〞bsIndependencyfield〞區塊1202、〞OttData〞區塊1203、〞TttData〞區塊1204、〞SmgData〞區塊1205和〞tempShapeData〞區塊1206。
〞FramingInfo〞區塊1201包含參數集的數量資訊和加載有每個參數集的時間槽的資訊。〞FramingInfo〞區塊1201將在「第13A圖」中詳細講述。
〞bsIndependencyfield〞1202表示在不瞭解前一框時當前框是否可被解碼。
〞OttData〞區塊1203包含所有一到二裝置的所有空間參數資訊。
〞TttData〞區塊1204包含所有二到三裝置的所有空間參數資訊。
〞SmgData〞區塊1205包含加載至非量子化空間參數的瞬時 平滑資訊。
〞tempShapeData〞區塊1206包含加載至去相關訊號的瞬時包跡形狀資訊。
「第13A圖」所示為本發明實施例代表加載有參數集的時間槽位置資訊的結構圖。〞bsFramingType〞區域1301表示音頻訊號的空間框是固定框類型還是可變框類型。固定框代表參數集加載至預設時間槽的框。例如,參數集加載至預設有等間隔的時間槽。可變框表示單獨接收加載有參數集的時間槽資訊的框。
〞bsNumParamSets〞區域1302表示一個空間框內參數集的數量(下稱為〞參數集數量〞(numParamSets)),以及〞參數集數量〞與〞bsNumParamSets〞之間存在的〞參數集數量=bsNumparamSets+1〞的關係。
由於在「第13A圖」中可分配3位元至〞bsNumParamSets〞區域1302,因此在一個空間框可提供最多8個參數集。由於對分配位元的數量沒有限制,因此可在一個空間框內提供更多的參數集。
如果空間框為固定框類型,那麼加載有參數集的時間槽的位置資訊可依照預設規則被確定,並且加載有參數集的時間槽的其它位置資訊是非必須的。然而,如果空間框是可變框類型,那麼需要加載有參數集的時間槽的位置資訊。
〞bsParamSlot〞區域1303表示加載有參數集的時間槽的位置 資訊。〞bsParamSlot〞區域1303可由利用一個空間框內時間槽數量即〞時間槽數量〞的可變數量的位元表示。尤其是在〞時間槽數量〞等於或大於2^(n-1)且小於2^(n)的情況下,〞bsParamSlot〞區域1303可由n位元表示。
例如,(i)如果〞時間槽數量〞介於64至127之間,那麼〞bsParamSlot〞區域1303可由7位元表示;(ii)如果〞時間槽數量〞介於32至63之間,那麼〞bsParamSlot〞區域1303可由6位元表示;(iii)如果〞時間槽數量〞介於16至31之間,那麼〞bsParamSlot〞區域1303可由5位元表示;(iv)如果〞時間槽數量〞介於8至15之間,那麼〞bsParamSlot〞區域1303可由4位元表示;(v)如果〞時間槽數量〞介於4至7之間,那麼〞bsParamSlot〞區域1303可由3位元表示;(vi)如果〞時間槽數量〞介於2至3之間,那麼〞bsParamSlot〞區域1303可由2位元表示;(vii)如果〞時間槽數量〞為1,那麼〞bsParamSlot〞區域1303可由1位元表示;並且(viii)如果〞時間槽數量〞為0,那麼〞bsParamSlot〞區域1303可由0位元表示。同樣,如果〞時間槽數量〞介於64至127之間,那麼〞bsParamSlot〞區域1303可由7位元表示
如果有多個參數集(N),那麼〞bsParamSlot〞的組合可依照公式9表示。
在這種情況下,〞bsParamSlotsi〞表示加載第i個參數集的時間槽。例如,假設〞時間槽數量〞為3,並且〞bsParamSlot〞區域1303可具有10個值。在這種情況下,需要〞bsParamSlot〞區域1303的三個資訊(下分別稱為c1、c2和c3)。由於需要4位元代表每個c1、c2和c3,因此總共需要12(=4*3)位元。在透過將三者結合以將c1、c2和c3由群組表示的情況下,具有1000(=10*10*10)種情況,其可由10位元表示,因此節省2位元。如果〞時間槽數量〞為3且做為5位元讀取的值為31,那麼這個值可表示為31=1x(3^2)+5*(3^1)+7*(3^0)。解碼器裝置可透過計算公式9的反函數確定c1、c2和c3分別為1、5和7。
「第13B圖」所示為本發明實施例表示時間槽位置資訊的結構圖,其中時間槽加載有作為絕對值和差異值的參數集。如果空間框為可變框類型,那麼利用〞bsParamSlot〞資訊無單純增加的事實,「第13A圖」中的〞bsParamSlot〞區域1303可由絕對值和差異值代表。
例如,(i)加載有第一參數集的時間槽的位置可被生成為絕對值,也就是〞bsParamSlot[0]〞;(ii)加載有第二參數集或更高參數集的時間槽的位置可被生成為差異值,也就是〞bsParamSlot[ps]〞與〞bsParamslot[ps-1]〞之間的〞差異值〞或〞差異值-1〞(下稱為〞bsDiffParamSlot[ps]〞)。在這種情況下,〞ps〞代表參數集。
〞bsParamSlot[0]〞區域1304可由位元數量表示(下稱為〞 nBitsParamSlots(0)〞),其中位元數量利用〞時間槽數量〞和〞參數集數量〞計算得出。
〞bsDiffParamSlot[ps]〞區域1305可由位元數量(下稱為〞nBitParamSlot(ps)〞)表示,其中位元數量利用〞時間槽數量〞、〞參數集數量〞和加載前一參數集也就是〞bsParamslot[ps-1]〞的時間槽位置計算得出。
尤其是為了用位元的最小數量表示〞bsParamSlot[ps]〞,表示〞bsParamSlot[ps]〞的位元數量可依照下述規則確定:(i)在遞增列(ascending series)中增加複數個〞bsParamSlot[ps]〞(bsParamSlot[ps]>bsParamSlot[ps-1]);(ii)〞bsParamSlot[0]〞的最大值為〞時間槽數量-參數集數量〞;(iii)在0<ps<參數集數量的情況下,〞bsParamSlot[ps]〞可僅具有〞bsParamSlot[ps-1]+1〞與〞時間槽數量-參數集數量+ps〞之間的值。
例如,如果〞時間槽數量〞為10且〞參數集數量〞為3,那麼由於〞bsParamSlot[ps]〞在遞增列中增加,所以〞bsParamSlot[0]〞的最大值變為〞10-3=7〞。就是說,〞bsParamSlot[0]〞可從0至7的值中選擇。這是因為如果〞bsParamSlot[0]〞具有大於7的值,則剩餘參數集(如,如果ps為1或2)的時間槽的數量不夠。
如果〞bsParamSlot[0]〞為5,第二參數集的時間槽位置bsParamSlot[1]應從〞5+1=6〞與〞10-3+1=8〞之間選擇。
如果〞bsParamSlot[1]〞為7,〞bsParamSlot[2]〞可為8或9。 如果〞bsParamSlot[1]〞為8,那麼〞bsParamSlot[2]〞可為9。
因此,〞bsParamSlot[ps]〞可由利用上述特徵的可變數量的位元表示而非固定數量的位元。
在位元流中設置〞bsParamSlot[ps]〞時,如果〞ps〞為0,那麼〞bsParamSlot[0]〞可利用與〞nBitsParamSlot(0)〞對應的位元數量被表示為絕對值。如果〞ps〞大於0,那麼〞bsParamSlot[ps]〞可利用與〞nBitsParamSlot[ps]〞對應的位元數量被表示為差異值。在從位元流中讀取具有上述結構的〞bsParamSlot[ps]〞時,每個資料的位元流長度也就是〞nBitsParamSlot[ps]〞可利用公式10獲得。
尤其是〞nBitsParamSlot[ps]〞可由nBitsParamSlot[0]=fb(時間槽數量-參數集數量+1)獲得。如果0<ps<參數集數量,〞nBitsParamSlot[ps]〞可由nBitsParamSlot[ps]=fb(時間槽數量-參數集數量+ps-bsParamSlot[ps-1])獲得。〞nBitsParamSlot[ps]〞可利用公式11獲得,公式11將公式10增加至7位元。
【公式11】
下文將說明函數fb(x)的實施例。如果〞時間槽數量〞為15且〞參數集數量〞為3,那麼函數可由nBitsParamSlot[0]=fb(15-3+1)=4位元計算出。
如果由4位元表示的〞bsParamSlot[0]〞為7,那麼函數可由nBitsParamSlot[1]=fb(15-3+1-7)=3位元計算得出。在這種情況下,〞bsDiffParamSlot[1]〞區域1305可由3位元表示。
如果由3位元表示的值為3,〞bsParamSlot[1]〞變為7+3=10。因此變為nBitsParamSlot[2]=fb(15-3+2-10)=2位元。在這種情況下,〞bsDiffParamSlot[2]〞區域1305可由2位元表示。如果剩餘時間槽的數量等於剩餘參數集的數量,可將0位元分配至〞bsDiffParamSlot[ps]〞區域。換言之,無需其它資訊表示加載參數集的時間槽的位置。
因此〞bsParamSlot[ps]〞的位元數量是被可變確定的。解碼器中〞bsParamSlot[ps]〞的位元數量可利用函數fb(x)從位元流中讀取。在某些實施例中,函數fb(x)可包含函數ceil(log2(x))。
在解碼器中自位元流讀取表示為絕對值和差異值的〞bsParamSlot[ps]〞資訊時,首先可從位元流中讀取〞 bsParamSlot[0]〞,然後讀取適合於0<ps<參數集數量的〞bsDiffParamSlot[ps]〞。接著可利用〞bsParamSlot[0]〞和〞bsDiffParamSlot[ps]〞確定適合0ps<參數集數量的〞bsParamSlot[ps]〞。例如「第13B圖」所示,〞bsParamSlot[ps]〞可透過〞bsParamSlot[ps-1]〞與〞bsParamSlot[ps]+1〞計算得出。
「第13C圖」所示為本發明實施例表示時間槽的位置資訊的結構圖,其中參數集作為群組加載至時間槽。在存在複數個參數集的情況下,複數個參數集的複數個〞bsParamSlot〞1307可由至少一個或多個群組表示。
如果〞bsParamSlot〞1307的數量為(kN+L),且需要Q位元表示每個〞bsParamSlot〞1307,那麼〞bsParamSlot〞1307可由下述群組表示。在這種情況下,〞k〞和〞N〞為隨機非0整數,〞L〞為滿足0L<N的隨機整數。
群組方法可包含下述步驟:組合N個〞bsParamSlot〞1307的每個以生成k群組;組合最後L個〞bsParamSlot〞1307以生成最終群組。k群組可由M位元表示,最終群組可由p位元表示。在這種情況下,M位元最好小於未將〞bsParamSlot〞1307組成群組前表示每個〞bsParamSlot〞1307所使用的N*Q位元。p位元最好等於或小於未將〞bsParamSlot〞1307組成群組前表示每個〞bsParamSlot〞1307所使用的L*Q位元。
例如,假設兩個參數集的一對〞bsParamSlot〞1307分別為d1 和d2。如果d1和d2可具有5個值,那麼需要3位元表示每個d1和d2。在這種情況下,即使3位元能夠代表8個值,但實際僅需要5個值。因此d1和d2均具有三個冗餘。但是,在透過組合d1和d2以將d1和d2表示為群組的情況下,可使用5位元而非6位元(=3位元+3位元)。尤其是由於d1和d2的所有組合包含25種類型(=5*5),因此d1和d2的群組可僅由5位元表示。由於5位元能夠代表32個值,因此在採用群組表示的情況下生成7個冗餘。但是,在將d1和d2組成群組表示的情況下,冗餘小於由3位元表示每個d1和d2的情況。
在組成群組時,群組的資料的設定可利用起始值的〞bsParamSlot[0]〞和第二或更高值的一對〞bsParamSlot[ps]〞之間的差異值。
在組成群組時,如果參數集的數量為1,位元可直接分配而無需組成群組,如果參數集的數量為2或大於2,則組成群組後分配位元。
「第14圖」所示為本發明實施例編碼方法的流程圖。以下將描述本發明編碼音頻訊號的方法和編碼器的操作。
首先,確定一個空間框內時間槽的總數量(時間槽數量)和音頻訊號的參數帶的總數量(帶數量(numBands))(S1401)。
接著,確定加載至頻道變換模組(一到二裝置和/或二到三裝置)和/或殘餘訊號的參數帶的數量(S1402)。
如果一到二裝置具有低頻部份增強(LFE)頻道模式,那麼加載至一到二裝置的參數帶數量可單獨確定。
如果一到二裝置不具有低頻部份增強(LFE)頻道模式,那麼可用〞帶數量〞表示加載至一到二裝置的參數帶數量。
然後,確定空間框的類型。在這種情況下,將空間框分類為固定框類型和可變框類型。
如果空間框為可變框類型(S1403),那麼確定一個空間內使用的參數集數量(S1406)。此時,參數集可透過時間槽單元加載至頻道變換模組。
隨後,確定加載有參數集的時間槽的位置(S1407)。此時,加載有參數集的時間槽的位置可由絕對值或差異值表示。例如,加載有第一參數集的時間槽位置可由絕對值表示,加載有第二或更高參數集的時間槽位置可由區別於前一時間槽的差異值表示。此時,加載有參數集的時間槽位置可由可變數量的位元表示。
尤其是加載有第一參數集的時間槽位置可由利用參數集的總數和時間槽的總數計算出的位元數量表示。加載有第二或更高參數集的時間槽位置可由時間槽總數、參數集總數和加載有前一參數集的時間槽位置計算出的位元數量表示。
如果空間框為固定框類型,則確定一個空間框內使用的參數集數量(S1404)。此時,利用預設規則確定加載有參數集的時間槽位置。例如,確定加載有參數集的時間槽位置,以具有與加載 有前一參數集的時間槽位置相等的間隔(S1405)。
隨後,利用上文確定的時間槽總數、參數帶總數、加載至頻道變換模組的參數帶數量、一個空間框內的參數集總數和加載有參數集的時間槽的位置資訊,下混單元和空間資訊生成單元分別生成下混訊號和空間資訊。
最後,多工單元生成包含下混訊號和空間資訊的位元流(S1408),然後將生成的位元流轉移至解碼器(S1409)。
「第15圖」所示為本發明實施例解碼方法的流程圖。以下將描述本發明解碼音頻訊號的方法和解碼器的操作。
首先,解碼器接收音頻訊號的位元流(S1501)。解多工單元自接收到的位元流分離下混訊號和空間資訊訊號(S1502)。接著,空間資訊訊號解碼單元自空間資訊訊號的結構資訊中提取一個空間框內時間槽總數的資訊、參數帶的總數資訊和加載至頻道變換模組的參數帶數量資訊(S1503)。
如果空間框為可變框類型(S1504),自空間框提取一個空間框內的參數集數量和加載有參數集的時間槽的位置資訊(S1505)。時間槽的位置資訊可由固定或可變數量的位元表示。在這種情況下,加載有第一參數集的時間槽的位置資訊可由絕對值表示,加載有第二或更高參數集的時間槽的位置資訊可有差異值表示。加載有第二或更高參數集的時間槽的實際位置資訊可透過差異值與加載有前一參數集的時間槽的位置資訊相加獲得。
最後,下混訊號利用提取的資訊變為多頻道音頻訊號(S1506)。
上文揭露的實施例提供了優於習知技術音頻編碼方案的多個優點。
首先,在利用可變數量位元表示加載有參數集的時間槽的位置以進行編碼多頻道音頻訊號時,揭露的實施例可降低轉移資料的量。
其次,透過用絕對值表示加載有第一參數集的時間槽的位置,並且透過用差異值表示加載有第二或更高參數集的時間槽位置,揭露的實施例可降低轉移資料的量。
再次,透過由固定或可變數量的位元表示加載至頻道變換一到二裝置和/或二到三裝置的參數集數量,揭露的實施例可降低轉移資料的量。在這種情況下,加載有參數集的時間槽的位置可利用上述原理表示,其中參數集可存在於參數帶的數量範圍內。
「第16圖」所示為實現「第1圖」、「第2圖」、「第3圖」、「第4圖」、「第5圖」、「第6圖」、「第7圖」、「第8圖」、「第9圖」、「第10圖」、「第11圖」、「第12圖」、「第13圖」、「第14圖」和「第15圖」中所示的音頻解碼器/編碼器的裝置結構1600的示意圖。裝置結構1600適用於各種裝置,包含個人電腦、伺服器電腦、消費電子裝置、移動電話、個人數位助理(PDA)、電子標牌(electronic tablet)、電視系統、電視機機上盒(television set-top box)、遊戲 機(ganme console)、媒體播放器、音樂播放器、導航系統和其它可解碼音頻訊號的裝置,但不僅限於此。這些裝置中的部份可利用硬體與軟體的結合實現調整後的結構。
裝置結構1600包含一個或多個處理器1602(例如PowerPC®、Intel Pentium® 4等)、一個或多個顯示裝置1604(例如陰極射線管顯示器、液晶顯示器)、音頻子系統1606(例如音頻硬體/軟體)、一個或多個網路界面1608(例如乙太網路、FireWire®、通用串列匯流排等)、輸入裝置1610(例如鍵盤、滑鼠等)和一個或多個電腦可讀取媒體1612(例如隨機存取記憶體(RAM)、唯讀記憶體(ROM)、同步動態隨機存取記憶體(SDRAM)、硬碟、光碟和快閃記憶體等)。這些元件可藉由一條或多條總線1614(如擴展工業標準結構(EISA)、周邊元件元件連接介面(Peripheral Component Interconnect,PCI)和高速周邊元件元件連接介面(PCI Express)等)交換通訊和資料。
〞電腦可讀取媒體〞一詞代表任何參與向處理器1602提供執行指令的媒體,包含非易失性媒體(例如光碟或磁碟)、易失性媒體(如記憶體)以及傳輸媒體,但不僅限於此。傳輸媒體包含同軸電纜、銅線和光學纖維,但不僅限於此。傳輸媒體也可採用聲學、光或無線頻率波的形式。
電腦可讀取媒體1612更包含操作系統1616(例如Mac OS®、Windows®、Linux等)、網路通訊模組1618、音頻編解碼器1620 和一個或多個應用軟體(application)1622。
操作系統1616可為多使用者(multi-user)、多處理(multiprocessing)、多任務(multitasking)、多線(multithreading)和實時等。操作系統1616進行基礎的任務,包含:從輸入裝置1610識別輸入;向顯示裝置1604和音頻子系統1606發送輸出;瞭解電腦可讀取媒體1612(如記憶體或儲存裝置)上的文件和目錄;控制外圍裝置(如硬盤驅動、印表機等)以及管理一條或多條總線1614上的通訊量,但不僅限於此。
網路通訊模組1618包含各種建立和保持網路連接的元件(如實現通訊協議的軟體如傳輸控制協定/網際網路協定(TCP/IP)、HTTP和乙太網路等)。網路通訊模組1618包含實現裝置結構1600的操作者搜索網路(如互聯網)資訊(如音頻內容)的瀏覽器。
音頻編解碼器1620用於實現「第1圖」、「第2圖」、「第3圖」、「第4圖」、「第5圖」、「第6圖」、「第7圖」、「第8圖」、「第9圖」、「第10圖」、「第11圖」、「第12圖」、「第13圖」、「第14圖」和「第15圖」中所示的部份或全部解碼器/編碼器處理。在某些實施例中,依照本發明的描述,音頻編解碼器與硬體(如處理器1602和音頻子系統1606)共同工作以處理音頻訊號,包含編碼/解碼音頻訊號。
應用軟體1622包含任何與音頻內容相關和/或音頻內容被編 /解碼處相關的軟體應用,音頻內容被編/解碼處包含媒體播放器、音樂播放器(如MP3播放器)、移動電話應用、個人數位助理(PDA)、電視系統和機頂盒等,但不僅限於此。在某些實施例中,應用伺服提供者可使用音頻編解碼器以藉由網路(如互聯網)提供編/解碼服務。
在上述描述中,為了解釋進行了各種詳細描述以提供對本發明詳盡的理解。然而,顯然本領域技術人員可實現本發明而無需上述解釋。另外,附圖中的結構和裝置係用於解釋本發明。
尤其是本領域技術人員應瞭解也可使用其它結構和附圖環境,並且本發明可透過不同於前述的繪圖工具或產品實現。尤其是客戶端/伺服器方案僅僅是用於提供本發明的可見功能(dashboard functionality)的結構的一個例子;本領域技術人員應當瞭解也可使用其它非客戶端/伺服器方案。
部份詳細描述係關於電腦記憶體內資料位元的操作的運算法則和符號表示。這些運算法則描述和表示為資料處理領域技術人員所使用的方法,用於將其工作內容最有效的傳遞給本領域其它技術人員。此處運算法則通常指實現所需結果的步驟的自相容序列。這些步驟為物理量的所需物理操作。通常,儘管為非必須,但這些量採用可儲存、轉移、結合、比較和其它操作的電訊號或磁訊號的形式。主要為了正常使用的原因,已經證明有時將這些訊號表示為位元、值、元件、符號、字符、項(term)和數字等更 方便。
【工業應用】
然而,需要明瞭的是所有這些和類似的詞彙均與適合的物理量相關,並且僅為方便表述這些物理量。除非特定指明,否則可從描述中顯然得知,在電腦系統或類似的電子計算系統的處理或動作中,所有說明中描述所使用的詞彙如〞處理〞或〞用電腦計算〞或〞計算〞或〞確定〞或〞顯示〞等為佳,其中操作或轉換電腦系統的寄存器和記憶體內作為物理(電子)量表示的資料至類似其它電腦系統的寄存器或記憶體或其它資訊儲存、傳輸或顯示裝置內作為物理量表示的資料。
本發明還關於實現操作的裝置。此裝置可具有特定結構以用於所需用途,或包含由儲存在電腦內的電腦程式選擇性啟動或重組的通用電腦。這些電腦程式可儲存在電腦可讀儲存媒體中如包含軟磁碟、光碟、唯讀光碟(CDROM)和磁-光碟的任何類型的碟片,以及唯讀記憶體(ROM)、隨機存取記憶體(RAM)、可抹除可程式化唯讀記憶體(EPROM)、電可除程式化唯讀記憶體(EEPROM)、磁卡或光卡或任何適於儲存電子指令的媒體,但不僅限於此,以上元件均與電腦系統總線連接。
此處的運算法則和模組並不僅與任何特定電腦或其它裝置相關。依照此處的講述各種通用系統可與程式使用,或者更便於製造特定裝置以實現上述方法的步驟。下文將描述各種系統的所需 結構。而且,本發明不會結合任何特定程式語言進行描述。可使用各種程式語言實現本發明所述的內容。此外,相關領域技術人員可知本發明的模組、特徵、屬性、方法和其它方面可透過軟體、硬體、韌體或上述三者的結合實現。當然,本發明透過軟體實現的部份也可由獨立的程式、部份較大的程式、複數個單獨的程式、靜態或動態鏈接的公用程式、核心可載模組(kernel loadable module)、裝置驅動器和/或電腦程式領域技術人員目前習知的或將來瞭解的任何以及每一種方法或實現。此外,實現本發明並不限於任何特定的操作系統或環境。
雖然本發明以前述之較佳實施例揭露如上,然其並非用以限定本發明,任何熟習相像技藝者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,因此本發明之專利保護範圍須視本說明書所附之申請專利範圍所界定者為準。
101‧‧‧遠處聲源
102、103‧‧‧直達聲波
104、105‧‧‧反射的聲波
106‧‧‧右耳
107‧‧‧左耳
201、310、1107‧‧‧多頻道音頻訊號
202‧‧‧下混單元
203‧‧‧空間資訊生成單元
204、208、401、505、508、
1101‧‧‧下混訊號
205‧‧‧外部提供的下混訊號
206、304‧‧‧被編碼的空間資訊訊號
207‧‧‧下混訊號編碼單元
209‧‧‧多工單元
210、301‧‧‧位元流
302‧‧‧解多工單元
303‧‧‧被編碼的下混訊號
305‧‧‧下混訊號解碼單元
306‧‧‧被解碼的下混訊號
307‧‧‧空間資訊解碼單元
308、1105‧‧‧空間資訊
309、400‧‧‧上混單元
402‧‧‧二到三裝置
403、404、405‧‧‧頻道
406、407、408‧‧‧一到二裝置
501、504、509‧‧‧結構資訊
502、506、510‧‧‧空間框
503、507、511‧‧‧框
701‧‧‧〞bsSamplingFrequencyIndex〞區域
702‧‧‧〞bsSamplingFrequency〞區域
703‧‧‧〞bsFrameLength〞區域
704‧‧‧〞bsFreqRes〞區域
705‧‧‧〞bsTreeConfig〞區域
706‧‧‧〞bsQuantMode〞區域
707‧‧‧〞bsOneIcc〞區域
708‧‧‧〞bsArbitraryDownmix〞區域
709‧‧‧〞bsFixedGainSur〞區域
710‧‧‧〞bsFixedgainLF〞區域
711‧‧‧〞bsFxiedGainDM〞區域
712‧‧‧〞bsMatrixMode〞區域
713‧‧‧〞bsTempShapeConfig〞區域
714‧‧‧〞bsDecorrConfig〞區域
715‧‧‧〞bs3DaudioMode〞區域
716‧‧‧參數帶數量
717‧‧‧多參數帶數量
718‧‧‧〞spatialExtensionConfig〞區域
801、802‧‧‧〞bsOttBands〞區域
901‧‧‧〞bsTttDualMode〞區域
902‧‧‧〞bsTttModeLow〞區域
903‧‧‧〞bsTttModeHigh〞區域
904‧‧‧〞bsTttBandsLow〞區域
905‧‧‧〞bsTttBandsHigh〞區域
907‧‧‧〞bsTttBandsLow〞區域
1001‧‧‧〞bsSacExtType〞區域
1002‧‧‧〞bsSacExtLen〞區域
1003‧‧‧〞bsSacExtLenAdd〞區域
1004‧‧‧〞bsSacExtLenAddAdd〞區域
1007‧‧‧〞bsFillBits〞區域
1008‧‧‧〞bsResidualSamplingFrequency Ind-ex〞區域
1009‧‧‧〞bsResidualFramesPerSpatialFrame〞區域
1010‧‧‧〞ResidualConfig〞區塊
1011‧‧‧〞bsResidualPresent〞區域
1012‧‧‧〞bsResidualBands〞區域
1014‧‧‧〞bsResidualBands〞區域
1102‧‧‧解析濾波器組
1103‧‧‧頻域訊號
1104‧‧‧解析單元
1106‧‧‧空間合成單元
1108‧‧‧合成濾波器組
1109‧‧‧時域音頻訊號
1201‧‧‧〞FramingInfo〞區塊
1202‧‧‧〞bsIndependencyfield〞
1203‧‧‧〞OttData〞區塊
1204‧‧‧〞TttData〞區塊
1205‧‧‧〞SmgData〞區塊
1206‧‧‧〞tempShapeData〞區塊
1301‧‧‧〞bsFramingType〞區域
1302‧‧‧〞bsNumParamSets〞區域
1303‧‧‧〞bsParamSlot〞區域
1304‧‧‧〞bsParamSlot[0]〞區域
1305‧‧‧〞bsDiffParamSlot[ps]〞區域
1307‧‧‧〞bsParamSlot〞
1600‧‧‧裝置結構
1602‧‧‧處理器
1604‧‧‧顯示裝置
1606‧‧‧音頻子系統
1608‧‧‧網路界面
1610‧‧‧輸入裝置
1612‧‧‧電腦可讀取媒體
1614‧‧‧總線
1616‧‧‧操作系統
1618‧‧‧網路通訊模組
1620‧‧‧音頻編解碼器
1622‧‧‧應用軟體
步驟1401‧‧‧確定所有時間槽的數量和所有參數帶的數量
步驟1402‧‧‧確定頻道變換模組和/或殘餘訊號的參數帶的數量
步驟1403‧‧‧是否為可變框類型
步驟1404‧‧‧確定參數集數量
步驟1405‧‧‧確定加載有相等間隔參數集的時間槽的位置
步驟1406‧‧‧確定參數集數量
步驟1407‧‧‧確定加載有參數集的時間槽位置
步驟1408‧‧‧生成下混訊號和空間資訊
步驟1409‧‧‧生成位元流並轉移位元流
步驟1501‧‧‧接收位元流
步驟1502‧‧‧分離下混訊號和空間資訊訊號
步驟1503‧‧‧提取時間槽數量和參數集數量
步驟1504‧‧‧是否為可變框類型
步驟1505‧‧‧提取參數集數量和加載有參數集的時間槽的位置資訊
步驟1506‧‧‧將下混訊號變為多頻道音頻訊號
第1圖為本發明實施例生成空間資訊的原理的示意圖;第2圖為本發明實施例編碼音頻訊號的編碼器的示意圖;第3圖為本發明實施例解碼音頻訊號的解碼器的示意圖;第4圖為本發明實施例解碼器之上混單元包含的頻道變換模組的示意圖;第5圖為本發明實施例設置音頻訊號的位元流的方法的示意圖; 第6A圖和第6B圖分別為本發明實施例解釋參數集、時間槽和參數帶之間關係的表圖和時間/頻率示意圖;第7A圖為本發明實施例表示空間資訊訊號的結構資訊的結構圖;第7B圖為本發明實施例空間資訊訊號的參數帶數量的表圖;第8A圖為本發明實施例由固定數量的位元表示加載至一到二裝置的參數帶數量的結構圖;第8B圖為本發明實施例由可變數量的位元代表加載至一到二裝置的參數帶數量的結構圖;第9A圖為本發明實施例由固定數量的位元表示加載至二到三裝置的參數帶數量的結構圖;第9B圖為本發明實施例由可變數量位元代表的加載至二到三裝置的參數帶數量的結構圖;第10A圖為本發明實施例空間擴展框的空間擴展結構資訊的結構圖;第10B圖和第10C圖為本發明實施例在殘餘訊號包含於空間擴展框時殘餘訊號的空間擴展結構資訊的結構圖;第10D圖為本發明實施例由表示的殘餘訊號的參數帶數量的方法的示意圖;第11A圖為本發明實施例用於非導向性編碼的解碼器的示意圖; 第11B圖為本發明實施例將參數帶的數量表示為群組的方法的示意圖;第12圖為本發明實施例表示空間框的結構資訊的結構圖;第13A圖為本發明實施例代表加載有參數集的時間槽位置資訊的結構圖;第13B圖為本發明實施例表示時間槽位置資訊的結構圖,其中時間槽加載有作為絕對值和差異值的參數集;第13C圖為本發明實施例表示時間槽的位置資訊的結構圖,其中參數集作為群組加載至時間槽;第14圖為本發明實施例編碼方法的流程圖;第15圖為本發明實施例解碼方法的流程圖;第16圖為本發明實施例實現第1圖至第15圖中所示的解碼和編碼處理的裝置結構示意圖。
1301‧‧‧〞bsFramingTypc〞區域
1302‧‧‧〞bsNumParamSets〞區域
1303‧‧‧〞bsParamSlot〞區域

Claims (8)

  1. 一種音頻訊號之解碼方法,該方法係透過一音頻編碼系統被完成,該音頻訊號包含至少一個框,該框包含至少一個時間槽以及至少一個參數集,該方法包含以下步驟:自該音頻訊號中擷取該時間槽之數量和該參數集之數量以識別時間槽資訊,該時間槽資訊用於表示加載有一參數集之一時間槽;確定被分配至該時間槽資訊之一位元長度,該位元長度可依照該時間槽之數量、該參數集之數量以及一前一參數集關聯之前一時間槽資訊而變化;根據該位元長度擷取該時間槽資訊;以及根據該時間槽資訊與對應之參數集解碼該音頻訊號;其中擷取的該時間槽資訊之數量等於該參數集之數量,並且該時間槽資訊包含一絕對值與一差異值,該絕對值用於表示加載有一第一參數集之一時間槽,該差異值用於表示加載有該第一參數集之一後續參數集之一時間槽。
  2. 如申請專利範圍第1項所述之音頻訊號之解碼方法,其中該時間槽資訊係為位置資訊,用於表示加載有一參數集之時間槽之一位置。
  3. 如申請專利範圍第1項所述之音頻訊號之解碼方法,其中加載有該後續參數集之該時間槽係透過增加該差異值至該前一時間槽而被確定。
  4. 如申請專利範圍第1項所述之音頻訊號之解碼方法,其中該絕對值被確定處於一第一最大範圍內,該第一最大範圍係使用該參數集之數量與該時間槽之數量被計算,並且其中該差異值被確定處於一第二最大範圍內,該第二最大範圍係依照該前一時間槽資訊被計算。
  5. 一種音頻訊號之解碼裝置,該音頻訊號包含一下混訊號與空間資訊,該空間資訊包含至少一個框,該框包含至少一個時間槽以及至少一個參數集,該音頻訊號之解碼裝置包含:一空間資訊解碼單元,用於自該音頻訊號中擷取該時間槽之數量與該參數集之數量以識別時間槽資訊,該時間槽資訊用於表示加載有一參數集之一時間槽,該空間資訊解碼單元用於確定被分配至該時間槽資訊之一位元長度,該位元長度可依照該時間槽之數量、該參數集之數量以及一前一參數集關聯之前一時間槽資訊而變化,並且根據該位元長度擷取該時間槽資訊,以及根據該時間槽資訊與對應之參數集解碼該空間資訊,其中擷取的該時間槽資訊之數量等於該參數集之數量,並且該時間槽資訊包含一絕對值與一差異值,該絕對值用於表示加載有一第一參數集之一時間槽,該差異值用於表示加載有該第一參數集之一後續參數集之一時間槽;一下混訊號解碼單元,用於解碼該下混訊號;以及一多通道產生單元,用於使用該被解碼之下混訊號與該被 解碼之空間資訊產生多通道訊號。
  6. 如申請專利範圍第5項所述之音頻訊號之解碼裝置,其中該時間槽資訊係為位置資訊,用於表示加載有一參數集之該時間槽之位置。
  7. 如申請專利範圍第5項所述之音頻訊號之解碼裝置,其中加載有該後續參數集之該時間槽係透過增加該差異值至前一時間槽而被確定。
  8. 如申請專利範圍第5項所述之音頻訊號之解碼裝置,其中該絕對值被確定處於一第一最大範圍內,該第一最大範圍係使用該參數集之數量與該時間槽之數量被計算,以及其中該差異值被確定處於一第二最大範圍內,該第二最大範圍係依照該前一時間槽資訊被計算。
TW095132070A 2005-08-30 2006-08-30 音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構 TWI405475B (zh)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
US71211905P 2005-08-30 2005-08-30
US71920205P 2005-09-22 2005-09-22
US72300705P 2005-10-04 2005-10-04
US72622805P 2005-10-14 2005-10-14
US72922505P 2005-10-24 2005-10-24
KR1020060004062A KR20070037974A (ko) 2005-10-04 2006-01-13 멀티채널 오디오 코딩에서 효과적인 넌가이디드 코딩의파라미터 밴드 수 비트스트림 구성방법
KR20060004065 2006-01-13
KR20060004055 2006-01-13
KR1020060004051A KR20070025903A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 레지듀얼 신호의파라미터 밴드 수 비트스트림 구성방법
KR1020060004063A KR20070025907A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 채널변환모듈에 적용될파라미터 밴드 수 비트스트림 구성방법
KR1020060004057A KR20070025904A (ko) 2005-08-30 2006-01-13 멀티채널 오디오 코딩에서 효과적인 lfe채널의 파라미터밴드 수 비트스트림 구성방법
US76253606P 2006-01-27 2006-01-27

Publications (2)

Publication Number Publication Date
TW200715900A TW200715900A (en) 2007-04-16
TWI405475B true TWI405475B (zh) 2013-08-11

Family

ID=43927883

Family Applications (2)

Application Number Title Priority Date Filing Date
TW095132070A TWI405475B (zh) 2005-08-30 2006-08-30 音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構
TW099128646A TWI425843B (zh) 2005-08-30 2006-08-30 音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW099128646A TWI425843B (zh) 2005-08-30 2006-08-30 音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構

Country Status (9)

Country Link
US (12) US7761303B2 (zh)
EP (7) EP1938311B1 (zh)
JP (7) JP5231225B2 (zh)
AT (2) ATE453908T1 (zh)
AU (1) AU2006285538B2 (zh)
BR (1) BRPI0615114A2 (zh)
CA (1) CA2620627C (zh)
TW (2) TWI405475B (zh)
WO (7) WO2007055460A1 (zh)

Families Citing this family (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2649240A (en) * 1947-10-13 1953-08-18 Clyde L Gilbert Blank for box production
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
KR101165640B1 (ko) * 2005-10-20 2012-07-17 엘지전자 주식회사 오디오 신호의 디코딩 및 인코딩 방법 및 그 장치
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
CN101433099A (zh) * 2006-01-05 2009-05-13 艾利森电话股份有限公司 多声道环绕声的个性化解码
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
TWI469133B (zh) * 2006-01-19 2015-01-11 Lg Electronics Inc 媒體訊號處理方法及裝置
KR20080110920A (ko) * 2006-02-07 2008-12-19 엘지전자 주식회사 부호화/복호화 장치 및 방법
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
CN101518103B (zh) * 2006-09-14 2016-03-23 皇家飞利浦电子股份有限公司 多通道信号的甜点操纵
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
UA94117C2 (ru) * 2006-10-16 2011-04-11 Долби Свиден Ав Усовершенстованное кодирование и отображение параметров многоканального кодирования микшированных объектов
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR20080082916A (ko) 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
CN101675472B (zh) * 2007-03-09 2012-06-20 Lg电子株式会社 用于处理音频信号的方法和装置
EP3712888B1 (en) * 2007-03-30 2024-05-08 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
US8983830B2 (en) * 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
US8532306B2 (en) 2007-09-06 2013-09-10 Lg Electronics Inc. Method and an apparatus of decoding an audio signal
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR100942142B1 (ko) * 2007-10-11 2010-02-16 한국전자통신연구원 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
EP2083585B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US8645400B1 (en) * 2008-08-01 2014-02-04 Marvell International Ltd. Flexible bit field search method
TWI475896B (zh) 2008-09-25 2015-03-01 Dolby Lab Licensing Corp 單音相容性及揚聲器相容性之立體聲濾波器
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
WO2011083979A2 (en) 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
KR101437896B1 (ko) 2010-04-09 2014-09-16 돌비 인터네셔널 에이비 Mdct-기반의 복소수 예측 스테레오 코딩
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
CN103220058A (zh) * 2012-01-20 2013-07-24 旭扬半导体股份有限公司 音频数据与视觉数据同步装置及其方法
CN104380376B (zh) * 2012-06-14 2017-03-15 杜比国际公司 解码系统、重构方法和设备、编码系统、方法和设备及音频发布系统
WO2014013070A1 (en) 2012-07-19 2014-01-23 Thomson Licensing Method and device for improving the rendering of multi-channel audio signals
WO2014013294A1 (en) * 2012-07-19 2014-01-23 Nokia Corporation Stereo audio signal encoder
KR102331129B1 (ko) 2013-01-21 2021-12-01 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
WO2014126689A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for controlling the inter-channel coherence of upmixed audio signals
TWI618051B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
JP6190947B2 (ja) * 2013-05-24 2017-08-30 ドルビー・インターナショナル・アーベー オーディオ・オブジェクトを含むオーディオ・シーンの効率的な符号化
US9136233B2 (en) * 2013-06-06 2015-09-15 STMicroelctronis (Crolles 2) SAS Process for fabricating a three-dimensional integrated structure with improved heat dissipation, and corresponding three-dimensional integrated structure
US9140959B2 (en) * 2013-07-12 2015-09-22 Canon Kabushiki Kaisha Dissipative soliton mode fiber based optical parametric oscillator
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
CN117037811A (zh) * 2013-09-12 2023-11-10 杜比国际公司 多声道音频内容的编码
TWI713018B (zh) * 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
CN105659320B (zh) 2013-10-21 2019-07-12 杜比国际公司 音频编码器和解码器
JP6479786B2 (ja) * 2013-10-21 2019-03-06 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成
US10547825B2 (en) * 2014-09-22 2020-01-28 Samsung Electronics Company, Ltd. Transmission of three-dimensional video
US11205305B2 (en) 2014-09-22 2021-12-21 Samsung Electronics Company, Ltd. Presentation of three-dimensional video
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
KR20160081844A (ko) 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2016162165A1 (en) * 2015-04-10 2016-10-13 Thomson Licensing Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation
US10725248B2 (en) * 2017-01-30 2020-07-28 Senko Advanced Components, Inc. Fiber optic receptacle with integrated device therein incorporating a behind-the-wall fiber optic receptacle
TW202341126A (zh) 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10652170B2 (en) 2017-06-09 2020-05-12 Google Llc Modification of audio-based computer program output
KR102471071B1 (ko) * 2017-06-09 2022-11-25 구글 엘엘씨 오디오 기반 컴퓨터 프로그램 출력의 수정
US11049218B2 (en) 2017-08-11 2021-06-29 Samsung Electronics Company, Ltd. Seamless image stitching
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
BR112021025265A2 (pt) 2019-06-14 2022-03-15 Fraunhofer Ges Forschung Sintetizador de áudio, codificador de áudio, sistema, método e unidade de armazenamento não transitória
CN112954581B (zh) * 2021-02-04 2022-07-01 广州橙行智动汽车科技有限公司 一种音频播放方法、系统及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW439055B (en) * 1998-06-10 2001-06-07 Koninkl Philips Electronics Nv A method for storing audio-centered information, a device for reading and/or storing such information, and a unitary record carrier containing information produced by the method
TW510142B (en) * 2001-12-14 2002-11-11 C Media Electronics Inc Rear-channel sound effect compensation device
US20020183010A1 (en) * 2001-06-05 2002-12-05 Catreux Severine E. Wireless communication systems with adaptive channelization and link adaptation
US20030125933A1 (en) * 2000-03-02 2003-07-03 Saunders William R. Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US20030236583A1 (en) * 2002-06-24 2003-12-25 Frank Baumgarte Hybrid multi-channel/cue coding/decoding of audio signals
TW200404222A (en) * 2002-08-07 2004-03-16 Dolby Lab Licensing Corp Audio channel spatial translation
US20050074127A1 (en) * 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
US20050157883A1 (en) * 2004-01-20 2005-07-21 Jurgen Herre Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal

Family Cites Families (151)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6096079A (ja) 1983-10-31 1985-05-29 Matsushita Electric Ind Co Ltd 多値画像の符号化方法
US4661862A (en) 1984-04-27 1987-04-28 Rca Corporation Differential PCM video transmission system employing horizontally offset five pixel groups and delta signals having plural non-linear encoding functions
US4621862A (en) 1984-10-22 1986-11-11 The Coca-Cola Company Closing means for trucks
JPS6294090A (ja) 1985-10-21 1987-04-30 Hitachi Ltd 符号化装置
US4725885A (en) 1986-12-22 1988-02-16 International Business Machines Corporation Adaptive graylevel image compression system
JPH0793584B2 (ja) * 1987-09-25 1995-10-09 株式会社日立製作所 符号化装置
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5243686A (en) * 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
US5221232A (en) * 1989-01-12 1993-06-22 Zero-Max, Inc. Flexible disc-like coupling element
CA2332407C (en) 1989-01-27 2002-03-05 Dolby Laboratories Licensing Corporation Method for defining coding information
DE3943880B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US6289308B1 (en) * 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
GB8921320D0 (en) 1989-09-21 1989-11-08 British Broadcasting Corp Digital video coding
JPH03250931A (ja) * 1990-02-28 1991-11-08 Iwatsu Electric Co Ltd 移動体通信の時間分割通信方法
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
ES2164640T3 (es) 1991-08-02 2002-03-01 Sony Corp Codificador digital con asignacion dinamica de bits de cuantificacion.
JPH05219582A (ja) * 1992-02-06 1993-08-27 Nec Corp ディジタル音声交換装置
DE4209544A1 (de) 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP3104400B2 (ja) 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3123286B2 (ja) 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
US5481643A (en) * 1993-03-18 1996-01-02 U.S. Philips Corporation Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component
US5563661A (en) * 1993-04-05 1996-10-08 Canon Kabushiki Kaisha Image processing apparatus
US5488570A (en) * 1993-11-24 1996-01-30 Intel Corporation Encoding and decoding video signals using adaptive filter switching criteria
US6125398A (en) 1993-11-24 2000-09-26 Intel Corporation Communications subsystem for computer-based conferencing system using both ISDN B channels for transmission
US5640159A (en) * 1994-01-03 1997-06-17 International Business Machines Corporation Quantization method for image data compression employing context modeling algorithm
RU2158970C2 (ru) 1994-03-01 2000-11-10 Сони Корпорейшн Способ кодирования цифрового сигнала и устройство для его осуществления, носитель записи цифрового сигнала, способ декодирования цифрового сигнала и устройство для его осуществления
JP3498375B2 (ja) 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
US6549666B1 (en) * 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08130649A (ja) 1994-11-01 1996-05-21 Canon Inc データ処理装置
KR100209877B1 (ko) * 1994-11-26 1999-07-15 윤종용 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치
JP3371590B2 (ja) 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
JP3484832B2 (ja) 1995-08-02 2004-01-06 ソニー株式会社 記録装置、記録方法、再生装置及び再生方法
KR100219217B1 (ko) 1995-08-31 1999-09-01 전주범 무손실 부호화 장치
US5723495A (en) * 1995-11-16 1998-03-03 The University Of North Carolina At Chapel Hill Benzamidoxime prodrugs as antipneumocystic agents
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US6047027A (en) 1996-02-07 2000-04-04 Matsushita Electric Industrial Co., Ltd. Packetized data stream decoder using timing information extraction and insertion
JP3088319B2 (ja) 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
GB9603454D0 (en) 1996-02-19 1996-04-17 Ea Tech Ltd Electric motor starting circuit
US6399760B1 (en) 1996-04-12 2002-06-04 Millennium Pharmaceuticals, Inc. RP compositions and therapeutic and diagnostic uses therefor
GB9609282D0 (en) * 1996-05-03 1996-07-10 Cambridge Display Tech Ltd Protective thin oxide layer
EP0827312A3 (de) 1996-08-22 2003-10-01 Marconi Communications GmbH Verfahren zur Änderung der Konfiguration von Datenpaketen
US5912636A (en) 1996-09-26 1999-06-15 Ricoh Company, Ltd. Apparatus and method for performing m-ary finite state machine entropy coding
US5893066A (en) 1996-10-15 1999-04-06 Samsung Electronics Co. Ltd. Fast requantization apparatus and method for MPEG audio decoding
TW429700B (en) 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6639945B2 (en) * 1997-03-14 2003-10-28 Microsoft Corporation Method and apparatus for implementing motion detection in video compression
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6356639B1 (en) 1997-04-11 2002-03-12 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
CN1137487C (zh) 1997-09-17 2004-02-04 松下电器产业株式会社 将视频数据记录在光盘的设备和方法
US6130418A (en) 1997-10-06 2000-10-10 U.S. Philips Corporation Optical scanning unit having a main lens and an auxiliary lens
US5966688A (en) 1997-10-28 1999-10-12 Hughes Electronics Corporation Speech mode based multi-stage vector quantizer
JP2005063655A (ja) 1997-11-28 2005-03-10 Victor Co Of Japan Ltd オーディオ信号のエンコード方法及びデコード方法
JP3022462B2 (ja) 1998-01-13 2000-03-21 興和株式会社 振動波の符号化方法及び復号化方法
DE69926821T2 (de) 1998-01-22 2007-12-06 Deutsche Telekom Ag Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
JPH11282496A (ja) * 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US6339760B1 (en) 1998-04-28 2002-01-15 Hitachi, Ltd. Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data
JPH11330980A (ja) 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
GB2340351B (en) 1998-07-29 2004-06-09 British Broadcasting Corp Data transmission
MY118961A (en) 1998-09-03 2005-02-28 Sony Corp Beam irradiation apparatus, optical apparatus having beam irradiation apparatus for information recording medium, method for manufacturing original disk for information recording medium, and method for manufacturing information recording medium
US6298071B1 (en) * 1998-09-03 2001-10-02 Diva Systems Corporation Method and apparatus for processing variable bit rate information in an information distribution system
US6148283A (en) 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
US6284759B1 (en) * 1998-09-30 2001-09-04 Neurogen Corporation 2-piperazinoalkylaminobenzo-azole derivatives: dopamine receptor subtype specific ligands
US6553147B2 (en) 1998-10-05 2003-04-22 Sarnoff Corporation Apparatus and method for data partitioning to improving error resilience
US6556685B1 (en) 1998-11-06 2003-04-29 Harman Music Group Companding noise reduction system with simultaneous encode and decode
US6757659B1 (en) 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
JP3346556B2 (ja) 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
US6195024B1 (en) * 1998-12-11 2001-02-27 Realtime Data, Llc Content independent data compression method and system
US6208276B1 (en) 1998-12-30 2001-03-27 At&T Corporation Method and apparatus for sample rate pre- and post-processing to achieve maximal coding gain for transform-based audio encoding and decoding
US6631352B1 (en) 1999-01-08 2003-10-07 Matushita Electric Industrial Co. Ltd. Decoding circuit and reproduction apparatus which mutes audio after header parameter changes
US6522342B1 (en) * 1999-01-27 2003-02-18 Hughes Electronics Corporation Graphical tuning bar for a multi-program data stream
US6378101B1 (en) * 1999-01-27 2002-04-23 Agere Systems Guardian Corp. Multiple program decoding for digital audio broadcasting and other applications
DE10007148C2 (de) * 1999-02-17 2003-06-18 Advantest Corp Hochgeschwindigkeits-Wellenformdigitalisierer mit einer Phasenkorrekturvorrichtung und Verfahren zur Phasenkorrektur
ES2208297T3 (es) 1999-04-07 2004-06-16 Dolby Laboratories Licensing Corporation Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal.
JP3323175B2 (ja) 1999-04-20 2002-09-09 松下電器産業株式会社 符号化装置
US6421467B1 (en) * 1999-05-28 2002-07-16 Texas Tech University Adaptive vector quantization/quantizer
KR100307596B1 (ko) 1999-06-10 2001-11-01 윤종용 디지털 오디오 데이터의 무손실 부호화 및 복호화장치
JP2001006291A (ja) * 1999-06-21 2001-01-12 Fuji Film Microdevices Co Ltd オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法
KR20010001991U (ko) 1999-06-30 2001-01-26 정몽규 토잉 브라켓과 토잉 후크의 결합구조
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
GB2359967B (en) * 2000-02-29 2004-05-12 Virata Ltd Qamd
US6937592B1 (en) * 2000-09-01 2005-08-30 Intel Corporation Wireless communications system that supports multiple modes of operation
US20020049586A1 (en) * 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20040244056A1 (en) * 2001-02-21 2004-12-02 Lorenz Kim E. System and method for providing direct, context-sensitive customer support in an interactive television system
JP4008244B2 (ja) 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
JP2002335230A (ja) 2001-05-11 2002-11-22 Victor Co Of Japan Ltd 音声符号化信号の復号方法、及び音声符号化信号復号装置
JP2003005797A (ja) 2001-06-21 2003-01-08 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
GB0119569D0 (en) * 2001-08-13 2001-10-03 Radioscape Ltd Data hiding in digital audio broadcasting (DAB)
EP1308931A1 (de) * 2001-10-23 2003-05-07 Deutsche Thomson-Brandt Gmbh Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist
EP1451809A1 (en) 2001-11-23 2004-09-01 Koninklijke Philips Electronics N.V. Perceptual noise substitution
KR100480787B1 (ko) 2001-11-27 2005-04-07 삼성전자주식회사 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및 장치
BR0206783A (pt) 2001-11-30 2004-02-25 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal, corrente de bits que representa um sinal codificado, meio de armazenagem, método e decodificador para decodificar uma corrente de bits que representa um sinal codificado, transmissor, receptor, e, sistema
TW569550B (en) 2001-12-28 2004-01-01 Univ Nat Central Method of inverse-modified discrete cosine transform and overlap-add for MPEG layer 3 voice signal decoding and apparatus thereof
EP1467569A4 (en) 2002-01-18 2007-11-14 Toshiba Kk METHOD AND APPARATUS FOR ENCODING IMAGES IN MOTION, DECODING METHOD AND APPARATUS
JP2003233395A (ja) 2002-02-07 2003-08-22 Matsushita Electric Ind Co Ltd オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
JP4039086B2 (ja) * 2002-03-05 2008-01-30 ソニー株式会社 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
WO2003077425A1 (fr) 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques
US8284844B2 (en) * 2002-04-01 2012-10-09 Broadcom Corporation Video decoding system supporting multiple standards
DE60307252T2 (de) 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
US7275036B2 (en) 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
US7428440B2 (en) * 2002-04-23 2008-09-23 Realnetworks, Inc. Method and apparatus for preserving matrix surround information in encoded audio/video
DE60317203T2 (de) 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
CN1669358A (zh) * 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
EP1439524B1 (en) 2002-07-19 2009-04-08 NEC Corporation Audio decoding device, decoding method, and program
JP2004120217A (ja) 2002-08-30 2004-04-15 Canon Inc 画像処理装置、画像処理方法、プログラムおよび記録媒体
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
TW567466B (en) 2002-09-13 2003-12-21 Inventec Besta Co Ltd Method using computer to compress and encode audio data
CN100401778C (zh) 2002-09-17 2008-07-09 弗拉迪米尔·切佩尔科维奇 具有高压缩率和最小必需资源的快速codec
TW549550U (en) 2002-11-18 2003-08-21 Asustek Comp Inc Key stroke mechanism with two-stage touching feeling
JP4084990B2 (ja) 2002-11-19 2008-04-30 株式会社ケンウッド エンコード装置、デコード装置、エンコード方法およびデコード方法
US7293217B2 (en) * 2002-12-16 2007-11-06 Interdigital Technology Corporation Detection, avoidance and/or correction of problematic puncturing patterns in parity bit streams used when implementing turbo codes
US6873559B2 (en) 2003-01-13 2005-03-29 Micron Technology, Inc. Method and apparatus for enhanced sensing of low voltage memory
JP2004220743A (ja) 2003-01-17 2004-08-05 Sony Corp 情報記録装置及び情報記録制御方法、並びに情報再生装置及び情報再生制御方法
DE602004002390T2 (de) 2003-02-11 2007-09-06 Koninklijke Philips Electronics N.V. Audiocodierung
EP2665294A2 (en) 2003-03-04 2013-11-20 Core Wireless Licensing S.a.r.l. Support of a multichannel audio extension
US20040199276A1 (en) * 2003-04-03 2004-10-07 Wai-Leong Poon Method and apparatus for audio synchronization
ATE359687T1 (de) 2003-04-17 2007-05-15 Koninkl Philips Electronics Nv Audiosignalgenerierung
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP4019015B2 (ja) 2003-05-09 2007-12-05 三井金属鉱業株式会社 ドアロック装置
JP2005086486A (ja) * 2003-09-09 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ処理方法
BR122018007834B1 (pt) 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
US20050137729A1 (en) 2003-12-18 2005-06-23 Atsuhiro Sakurai Time-scale modification stereo audio signals
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
US20050174269A1 (en) 2004-02-05 2005-08-11 Broadcom Corporation Huffman decoder used for decoding both advanced audio coding (AAC) and MP3 audio
US7392195B2 (en) 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
JP4579237B2 (ja) 2004-04-22 2010-11-10 三菱電機株式会社 画像符号化装置及び画像復号装置
JP2005332449A (ja) 2004-05-18 2005-12-02 Sony Corp 光学ピックアップ装置、光記録再生装置及びチルト制御方法
TWM257575U (en) 2004-05-26 2005-02-21 Aimtron Technology Corp Encoder and decoder for audio and video information
SE0401408D0 (sv) * 2004-06-02 2004-06-02 Astrazeneca Ab Diameter measuring device
JP2006012301A (ja) * 2004-06-25 2006-01-12 Sony Corp 光記録再生方法、光ピックアップ装置、光記録再生装置、光記録媒体とその製造方法及び半導体レーザ装置
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
JP2006120247A (ja) 2004-10-21 2006-05-11 Sony Corp 集光レンズ及びその製造方法、これを用いた露光装置、光学ピックアップ装置及び光記録再生装置
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7991610B2 (en) 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
KR20070025905A (ko) 2005-08-30 2007-03-08 엘지전자 주식회사 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
US7761303B2 (en) 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW439055B (en) * 1998-06-10 2001-06-07 Koninkl Philips Electronics Nv A method for storing audio-centered information, a device for reading and/or storing such information, and a unitary record carrier containing information produced by the method
US20030125933A1 (en) * 2000-03-02 2003-07-03 Saunders William R. Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US20020183010A1 (en) * 2001-06-05 2002-12-05 Catreux Severine E. Wireless communication systems with adaptive channelization and link adaptation
TW510142B (en) * 2001-12-14 2002-11-11 C Media Electronics Inc Rear-channel sound effect compensation device
US20030236583A1 (en) * 2002-06-24 2003-12-25 Frank Baumgarte Hybrid multi-channel/cue coding/decoding of audio signals
TW200404222A (en) * 2002-08-07 2004-03-16 Dolby Lab Licensing Corp Audio channel spatial translation
US20050074127A1 (en) * 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
US20050157883A1 (en) * 2004-01-20 2005-07-21 Jurgen Herre Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal

Also Published As

Publication number Publication date
EP1941497A4 (en) 2013-01-30
US7792668B2 (en) 2010-09-07
WO2007055460A1 (en) 2007-05-18
US8103513B2 (en) 2012-01-24
US20070203697A1 (en) 2007-08-30
US20070091938A1 (en) 2007-04-26
US20110044459A1 (en) 2011-02-24
US7765104B2 (en) 2010-07-27
WO2007055461A1 (en) 2007-05-18
US8060374B2 (en) 2011-11-15
EP1949759A1 (en) 2008-07-30
US8082158B2 (en) 2011-12-20
US20110044458A1 (en) 2011-02-24
EP1938311B1 (en) 2018-05-02
EP1920635A1 (en) 2008-05-14
TW201129968A (en) 2011-09-01
JP2009506372A (ja) 2009-02-12
AU2006285538A1 (en) 2007-03-08
US8165889B2 (en) 2012-04-24
EP1938311A4 (en) 2013-02-13
AU2006285538B2 (en) 2011-03-24
CA2620627A1 (en) 2007-03-08
JP5231225B2 (ja) 2013-07-10
JP2009506375A (ja) 2009-02-12
EP1938662A1 (en) 2008-07-02
JP2009506373A (ja) 2009-02-12
US8103514B2 (en) 2012-01-24
EP1949759A4 (en) 2010-11-17
EP1938662A4 (en) 2010-11-17
US20110085670A1 (en) 2011-04-14
JP2009506376A (ja) 2009-02-12
EP1938663A1 (en) 2008-07-02
US20070094037A1 (en) 2007-04-26
ATE455348T1 (de) 2010-01-15
US7761303B2 (en) 2010-07-20
US7822616B2 (en) 2010-10-26
JP5111376B2 (ja) 2013-01-09
EP1941497A1 (en) 2008-07-09
WO2007055463A1 (en) 2007-05-18
JP2009506377A (ja) 2009-02-12
US20070094036A1 (en) 2007-04-26
CA2620627C (en) 2011-03-15
WO2007055464A1 (en) 2007-05-18
EP1920635B1 (en) 2010-01-13
JP5108767B2 (ja) 2012-12-26
EP1938662B1 (en) 2016-09-28
US20110022401A1 (en) 2011-01-27
US7831435B2 (en) 2010-11-09
US20070071247A1 (en) 2007-03-29
US20110022397A1 (en) 2011-01-27
JP5111375B2 (ja) 2013-01-09
US7783493B2 (en) 2010-08-24
US7783494B2 (en) 2010-08-24
TW200715900A (en) 2007-04-16
JP5111374B2 (ja) 2013-01-09
EP1941497B1 (en) 2019-01-16
TWI425843B (zh) 2014-02-01
US20070078550A1 (en) 2007-04-05
ATE453908T1 (de) 2010-01-15
EP1920636B1 (en) 2009-12-30
BRPI0615114A2 (pt) 2011-05-03
EP1938311A1 (en) 2008-07-02
JP2009506374A (ja) 2009-02-12
JP2009506371A (ja) 2009-02-12
US20070201514A1 (en) 2007-08-30
WO2007027051A1 (en) 2007-03-08
WO2007055462A1 (en) 2007-05-18
JP5108768B2 (ja) 2012-12-26
WO2007027050A1 (en) 2007-03-08
EP1920636A1 (en) 2008-05-14
EP1938663A4 (en) 2010-11-17

Similar Documents

Publication Publication Date Title
TWI405475B (zh) 音頻訊號之編碼及解碼裝置及其方法、電腦可讀取媒體及其系統、及可代表該音頻訊號位元流中之資料結構
RU2473062C2 (ru) Способ кодирования и декодирования аудиосигнала и устройство для его осуществления
JP5319846B2 (ja) オーディオ信号をエンコーディング及びデコーディングするための装置とその方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees