TWI484477B - 參數性立體聲增混裝置、參數性立體聲解碼器、參數性立體聲降混裝置、參數性立體聲編碼器 - Google Patents

參數性立體聲增混裝置、參數性立體聲解碼器、參數性立體聲降混裝置、參數性立體聲編碼器 Download PDF

Info

Publication number
TWI484477B
TWI484477B TW098116731A TW98116731A TWI484477B TW I484477 B TWI484477 B TW I484477B TW 098116731 A TW098116731 A TW 098116731A TW 98116731 A TW98116731 A TW 98116731A TW I484477 B TWI484477 B TW I484477B
Authority
TW
Taiwan
Prior art keywords
signal
parametric stereo
difference
mono
component
Prior art date
Application number
TW098116731A
Other languages
English (en)
Other versions
TW201011736A (en
Inventor
Erik Gosuinus Petrus Schuijers
Original Assignee
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninkl Philips Electronics Nv filed Critical Koninkl Philips Electronics Nv
Publication of TW201011736A publication Critical patent/TW201011736A/zh
Application granted granted Critical
Publication of TWI484477B publication Critical patent/TWI484477B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

參數性立體聲增混裝置、參數性立體聲解碼器、參數性立體聲降混裝置、參數性立體聲編碼器
本發明係關於一種參數性立體聲增混裝置,其係用以基於空間參數從一單聲道降混信號產生一左信號及一右信號。本發明進一步關於一種包含參數性立體聲增混裝置的參數性立體聲解碼器;一種基於空間參數而從一單聲道降混信號產生一左信號及一右信號的方法;一種視訊播放器件;一種參數性立體聲降混裝置;一種參數性立體聲編碼器;一種用於產生一差異信號之一預測殘餘信號的方法以及一種電腦程式產品。
參數性立體聲(PS)係近幾年來音訊編碼中的主要進步之一。在《EURASIP J. Appl. Signal Process.》第9卷第1305-1322頁(2004),J. Breebaart、S. van de Par、A. Kohlrausch及E. Schuijers的「Parametric Coding of Stereo Audio」中解釋了參數性立體聲的基礎。與音訊信號的傳統之所謂離散編碼相較而言,如圖1中描繪之PS編碼器將一立體聲信號對(l、r )101、102變換為一單一單聲道降混信號104加上描述空間影像的少量參數103。此等參數包含聲道間強度差(iid )、聲道間相位(或時間)差異(ipd/itd )及聲道間同調性/相關性(icc )。在PS編碼器100中,立體聲輸入信號(l、r )的空間影像係經分析而產生iidipdicc 參數。較佳而言,該等參數係時間及頻率相關的。該等iidipdicc 參數係對於每一時間/頻率塊而決定。此等參數係經量化及編碼140而產生PS位元流。此外,該等參數通常用以控制如何產生立體聲輸入信號的降混。隨後使用一舊有單聲道音訊編碼器120而編碼所得的單聲道總和信號(s)104。最後合併所得之單聲道及PS位元流,以建構總立體聲位元流107。
在PS解碼器200中,立體聲位元流被分開為一單聲道位元流202及PS位元流203。單聲道音訊信號係經解碼而導致重新建構單聲道降混信號204。該單聲道降混信號係連同經解碼之空間影像參數205一起被饋送至PS增混230。接著,該PS增混產生輸出立體聲信號對(l、r )206、207。為了合成icc 提示,PS增混利用一所謂的經解相關之信號(s d ),即,從該單聲道音訊信號產生一信號,該產生之信號相對於單聲道輸入信號具有大略相同之頻譜及時間包絡但具有實質上零相關性。接著,基於空間影像參數,在PS增混內對於每一時間/頻率塊決定並應用一2×2矩陣:
其中H ij 代表一(i,j )增混矩陣H 項。H 矩陣項為PS參數iidicc 及(視需要為)ipd/opd 的函數。在當前最先進技術之PS系統中,若利用ipd/opd 參數,則可按如下分解增混矩陣H
其中左2×2矩陣代表相位旋轉,其為ipdopd 參數的一函數,及右2×2矩陣代表恢復iidicc 參數的部分。
在WO2003090206 A1中,提議將ipd 均等地分佈於解碼器中的左聲道及右聲道上。此外,提議藉由將左信號及右信號均相對於彼此旋轉經量測之ipd 的一半以獲得對準而產生一降混信號。實務上,在幾乎非同相信號之情況下,此導致對於編碼器中產生的降混及解碼器中產生的增混二者而言該ipd 隨時間稍微改變約180度,此係歸因於回繞(wrapping)可由一序列角度(諸如179、178、-179、177、-179、…)組成。由於此等跳躍,降混中的後續時間/頻寬塊展示出相位不連續性或換而言之相位不穩定性。因為固有之重疊-相加合成(overlap-add)結構,所以此導致可聽見之人為產物。
作為一實例,考慮降混,其中在一個時間/頻率塊中按如下產生該降混:
s =le j (π/2-ε) +re j (-π/2+ε) ,
其中ε係某一任意的小角度,表示被量測的ipd 係接近於180度,而對於下一時間-頻率塊,按如下產生該降混:
s =le j (-π/2+ε) +re j (π/2-ε) ,
意謂著所量測的ipd 係接近於-180度。使用典型的重疊-相加合成,在後續時間/頻率塊的中點之間將發生相位消除而產出人為產物。
如上文討論之參數性立體聲編碼的一主要缺點是PS解碼器中用於產生輸出立體聲對之雙耳間相位差(Interaural Phase Difference;ipd )提示之合成的不穩定性。此不穩定性係源於PS編碼器中為了產生降混及在PS解碼器中為了產生輸出信號而執行的相位修改。因為此不穩定性而經受輸出立體聲對的一較低音訊品質。
實務上,為了處理此相位不穩定性問題,常常放棄ipd合成。然而,此導致重新建構之立體聲信號的(空間)音訊品質降低。
當使用ipd 參數時應對此不穩定性問題的另一替代方案是,將所謂的總相位差(opd )併入於位元流中以對解碼器提供一相位參考。以此方式,可藉由容許共同的相位旋轉而增加時間/頻率塊上的連續性。然而,此係以增加位元率為代價而發生,且因此導致總系統效能的劣化。
本發明之一目的係提供一種用於從一單聲道降混信號產生一左信號及一右信號的增強型參數性立體聲增混裝置,其改良所產生之左信號及右信號的音訊品質而未增加額外之位元率,且未遭受到由雙耳間相位差(ipd )合成所推論出的不穩定性。
此目的係藉由一種參數性立體聲(PS)增混裝置達成,該PS增混裝置包含一預測構件,該預測構件係用於基於以一預測係數按比例調整的單聲道降混信號而預測包含介於左信號與右信號之間之一差異的一差異信號。該預測係數係從空間參數導出。該PS增混裝置進一步包含一算術構件,該算術構件係用於基於該單聲道降混信號及該差異信號的一總和及一差異而導出左信號及右信號。
所提議的PS增混裝置提供一種與已知之PS解碼器不同的方法以導出左信號及右信號。代替如已知之PS解碼器中進行的應用空間參數以恢復統計意義上的正確空間影像,所提議的PS增混裝置從單聲道降混信號及空間參數建構該差異信號。已知之PS及所提議之PS二者的目的均在於恢復正確的功率比(iid )、交叉相關性(icc )及相位關係(ipd )。然而,已知之PS解碼器並未盡力獲得最準確的波形匹配。而是,已知之PS解碼器確保所量測之編碼器參數在統計上匹配於所恢復的解碼器參數。在所提議之PS增混中,藉由應用至單聲道降混信號及經估計之差異信號的簡單算術運算(諸如總和及差異),獲得左信號及右信號。因為這種建構提供恢復信號之原始相位行為的一接近之波形匹配,所以給出重新建構之左信號及右信號的品質及穩定性的更好結果。
在一實施例中,該預測係數係基於降混信號於差異信號上的波形匹配。因為波形匹配固有地提供相位保護,因而波形匹配本身未遭受到如已知之PS解碼器中所使用之統計方法對於ipdopd 合成所遭受到的不穩定性問題。因此藉由使用作為一(複數值)按比例調整之單聲道降混信號導出的差異信號及基於波形匹配導出預測係數,可移除已知之PS解碼器的不穩定性來源。該波形匹配包含例如單聲道降混信號於該差異信號上的一最小平方匹配,按如下計算該差異信號:
d =α‧s ,
其中s 是降混信號,且α是預測係數。已熟知最小平方預測解式係藉由以下給定:
其中〈s ,d* 代表降混及差異信號之交叉相關性的共軛複數,且〈s ,s 〉代表降混信號之功率。
在一進一步實施例中,該預測係數係給定為空間參數之一函數:
其中iidipdicc 係空間參數,且iid 係一聲道間強度差,ipd 係一聲道間相位差,且icc 係一聲道間同調性。因為所需要的準確性取決於待重新建構之左音訊信號及右音訊信號的性質,所以一般難以在感知上有意義的情況下量化複數值預測係數α。因此,此實施例之優點在於,與複雜的預測係數α相比,空間參數所需的量化準確度從心理聲學係已為熟知的。因而,可將心理聲學知識之最佳用途用於有效地(即,以可能之最少步驟)量化該預測係數以降低位元率。此外,此實施例容許使用回溯相容之PS內容的增混。
在一進一步實施例中,用於預測差異信號之預測構件經配置以藉由增添一按比例調整之經解相關的單聲道降混信號而增強差異信號。因為一般不可能從單聲道降混信號來完全地預測原始的編碼器差異信號,所以引起一殘餘信號。此殘餘信號與降混信號沒有相關性,否則該殘餘信號將藉由預測係數而被納入考量。在許多情況下,該殘餘信號包含一記錄之一迴響聲場。可使用從單聲道降混信號導出之一經解相關的單聲道降混信號有效地合成該殘餘信號。
在一進一步實施例中,該經解相關之單聲道降混係藉由濾波該單聲道降混信號而獲得。此濾波之目的係有效地產生具有與該單聲道降混信號類似之頻譜及時間包絡,但具有一實質上接近於零之相關性的信號,使得該信號對應於編碼器中導出之殘餘分量之一合成變體。此可(例如)藉由全通濾波、延遲、格型迴響濾波器、回饋延遲網路或其組合而達成。另外,可對經解相關之信號應用功率正規化,以確保對於每一時間/頻率塊,該經解相關之信號的功率接近對應於單聲道降混信號的功率。以此方式,確保解碼器輸出信號將含有經解相關之信號功率的正確量。
在一進一步實施例中,設定應用於經解相關之單聲道降混之一按比例調整因數以補償一預測能量損耗。應用於經解相關之單聲道降混之該按比例調整因數確保解碼器側之左信號及右信號的總信號功率分別匹配編碼器側之左信號及右信號功率的信號功率。因而亦可將該按比例調整因數β解譯為一預測能量損耗補償因數。
在一進一步實施例中,應用於經解相關之單聲道降混之該按比例調整因數係給定為空間參數之一函數:
其中iidipdicc 係空間參數,且iid 係一聲道間強度差,ipd 係一聲道間相位差,且icc 係一聲道間同調性,且α係該預測係數。與預測係數之情況類似,將經解相關之按比例調整因數β表示為空間參數的函數,使得能夠利用此等空間參數之所需之量化準確性的有關知識。因而,可將心理聲學知識之最佳用途用於降低位元率。
在一進一步實施例中,該參數性立體聲增混具有差異信號之一預測殘餘信號作為一額外輸入,其中算術構件係經配置用以亦基於該差異信號的該預測殘餘信號而導出左信號及右信號。為了避免信號的長名稱,在本專利申請案之剩餘部分的各處,將預測殘餘信號用於表示差異信號的預測殘餘信號。該預測殘餘信號藉由其原始編碼器對應體而作為合成解相關信號的一替換而發揮作用。容許在解碼器中恢復原始立體聲信號。然而此係以額外之位元率為代價,此係因為該預測信號需要經解碼並傳輸至該解碼器。因此,該預測殘餘信號之頻寬通常受到限制。對於一給定的時間/頻率塊,該預測殘餘信號可完全地替換經解相關之單聲道降混信號或其可以一互補方式發揮作用。若預測殘餘信號僅經稀疏編碼,例如最有效之頻格(frequency bin)中僅一些被編碼,則後者(該預測殘餘信號以一互補方式發揮作用)可能是有益的。在該情況下,與編碼器情況相較而言,能量仍將丟失。此能量之缺失將由經解相關之信號填充。接著按如下計算一新的經解相關按比例調整因數β':
其中〈d res , cod ,d res , cod 〉係經編碼之預測殘餘信號的信號功率,且〈s,s 〉係單聲道降混信號之功率。此等信號功率可在解碼器側量測且因此不必一定要作為信號參數而傳輸。
本發明進一步提供包含該參數性增混裝置的一參數性立體聲解碼器及包含該參數性立體聲解碼器的一音訊播放器件。
本發明亦提供一參數性立體聲降混裝置及包含該參數性立體聲降混裝置的一參數性立體聲編碼器。
本發明進一步提供方法技術方案及使一可程式化器件執行根據本發明之方法的一電腦程式產品。
本發明之此等及其他態樣將參考圖中所示的實施例予以闡明,據此可獲深一層之了解。
貫穿各圖,相同參考數字指示類似或對應之特徵。圖中所指示之特徵的一些通常係以軟體實施,且因而代表軟體實體,諸如軟體模組或物件。
圖3繪示根據本發明的一參數性立體聲增混裝置300。該參數性立體聲增混裝置300基於空間參數205而從一單聲道降混信號204產生一左信號206及一右信號207。
該參數性立體聲增混裝置300包含:一預測構件310,其係用於基於以一預測係數321按比例調整的單聲道降混信號204而預測包含介於左信號206與右信號207之間之一差異的差異信號311,其中該預測係數321係在一單元320中從空間參數205導出;及一算術構件330,其係用於基於該單聲道降混信號204及該差異信號311的一總和及一差異而導出左信號206及右信號207。
較佳地如下重新建構左信號206及右信號207:
l =s +d,
r =s -d,
其中s為單聲道降混信號,且d為差異信號。此係基於假定按如下計算編碼器總和信號:
實務上,當建構左信號206及右信號207時經常應用增益正規化:
其中c係一增益正規化常數且係空間參數的一函數。增益正規化確保單聲道降混信號204的功率係等於左信號206及右信號207之功率的總和。在此情況下,按如下計算編碼器總和信號:
s =c‧(l +r)。
空間參數係事先在一編碼器中決定並被傳輸至包含一參數性立體聲增混300的解碼器。對於每一時間/頻率塊,在逐訊框基礎上被按如下決定該等空間參數:
其中iid 係聲道間強度差,icc 係聲道間同調性,ipd 係聲道間相位差,且〈l ,l 〉及〈r ,r 〉分別為左信號功率及右信號功率,且〈l ,r 〉代表左信號與右信號之間的非正規化複數值協方差係數。
對於一典型的複數值頻域諸如DFT(FFT),按如下量測此等功率:
其中k tile 代表對應於一參數頻帶的DFT區。應注意的是,亦可使用其他複數域表示法,舉例而言,諸如在2002年11月《Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio(MPCA-2002),Leuven,Belgium》第73-79頁,P. Ekstrand之「Bandwidth extension of audio signals by spectral band replication」中描述的複指數調變之QMF組。
對於低頻率,上述方程式保持至多1.5-2kHz。然而,對於較高頻率,ipd參數與感知是不相關的,且因此將其等設定為零值,導致:
或者,因為在較高頻率下,所以對於感知而言寬頻包絡比相位差係更重要的,按如下計算icc
按如下表示增益正規化常數c
因為由於左信號及右信號非同相而引起c可能接近於無限大,所以通常按如下限制增益正規化常數c之值:
其中c max 係最大放大因數,例如c max =2。
在一實施例中,該預測係數是基於使用波形匹配的從單聲道降混信號204估計差異信號311。該波形匹配包含例如單聲道降混信號204於該差異信號311上的一最小平方匹配,導致按如下提供差異信號:
d =αs
其中s 是單聲道降混信號204且α是預測係數321。
除最小平方匹配之外,可利用使用來自L2 範數之一不同範數的波形匹配。或者,例如,可感知加權p階範數誤差∥d -αs p 。然而,最小平方匹配係有利的,此係因為最小平方匹配導致從所傳輸之空間影像參數導出預測係數的相對簡單之計算。
已熟知預測係數α之最小平方預測解式係藉由以下給定:
其中〈s ,d 代表單聲道降混信號204及差異信號311之交叉相關性的共軛複數,且〈s ,s 〉代表單聲道降混信號之功率。
在一進一步實施例中,預測係數321係給定為空間參數之一函數:
在單元320中根據上式計算出該預測係數。
圖4繪示包含一預測構件310的參數性立體聲增混裝置300,該預測構件310係經配置以藉由增添一按比例調整之經解相關單聲道降混信號而增強差異信號。將單聲道降混信號204提供至單元340用以解相關。結果在該單元340之輸出提供經解相關單聲道降混信號341。在預測構件310中,藉由以預測係數321按比例調整該單聲道降混信號204而計算該差異信號之一第一部分。另外,在預測構件310中亦以按比例調整因數322按比例調整該經解相關之單聲道降混信號341。從而將該差異信號之一所得第二部分增添至該差異信號之第一部分而形成經增強之差異信號311。將該單聲道降混信號204及經增強之差異信號311提供至算術構件330,該算術構件330計算左信號206及右信號207。
一般而言,藉由僅以預測係數按比例調整是不可能從單聲道降混信號準確地預測差異信號的。此引起一殘餘信號d res =d -α‧s 。此殘餘信號與降混信號沒有相關性,否則該殘餘信號將藉由預測係數而被納入考量。在許多情況下,該殘餘信號包含一記錄的一迴響聲場。該殘餘信號係使用從單聲道降混信號導出的一經解相關單聲道降混信號有效地合成。該經解相關之信號係在預測構件310中計算出之差異信號的第二部分。
在一進一步實施例中,該解相關之單聲道降混341係藉由濾波該單聲道降混信號204而獲得。該濾波係於單元340中執行。此濾波產生具有與該單聲道降混信號204類似之頻譜及時間包絡但具有實質上接近於零之相關性的一信號,使得該信號對應於編碼器中導出之殘餘分量的一合成變體。此效果可藉由例如全通濾波、延遲、格型迴響濾波器、回饋延遲網路或其組合而達成。
在一進一步實施例中,設定應用於經解相關之單聲道降混341的一按比例調整因數322以補償一預測能量損耗。應用於經解相關之單聲道降混341的該按比例調整因數322確保參數性立體聲增混裝置300之輸出之左信號206及右信號207的總信號功率分別匹配於編碼器側之左信號功率及右信號功率的信號功率。因而將經進一步指示為β的該按比例調整因數322解譯為一預測能量損耗補償因數。接著可按如下表示差異信號d
d =α‧s +β‧s d ,
其中s d 係經解相關之單聲道降混信號。
可展現出,根據相對應於差異信號d 及單聲道降混信號s的信號功率,可按如下表示該按比例調整因數322:
在一進一步實施例中,應用於經解相關之單聲道降混信號341的按比例調整因數322係給定為空間參數205之一函數:
該按比例調整因數322係在單元320中導出。
若在編碼器中未應用降混正規化(即,按計算降混信號),則按如下表示左信號206及右信號207:
若應用降混正規化(即,按s =c (l +r )計算降混信號),則按如下表示左信號206及右信號207:
圖5繪示具有差異信號之一預測殘餘信號331作為一額外輸入的參數性立體聲增混裝置300。算術構件330係經配置用以基於單聲道降混信號204、差異信號311及該預測殘餘信號331而導出左信號206及右信號207。預測構件310基於以一預測係數321按比例調整之單聲道降混信號204而預測一差異信號311。該預測係數321係在單元320中基於空間參數205而導出。
分別按如下給定左信號206及右信號207:
l =s +d +d res ,
r =s -d -d res ,
其中d res 係預測殘餘信號。
或者,若對降混應用功率正規化,但對殘餘信號未應用功率正規化,可按如下導出左信號及右信號:
該預測殘餘信號331藉由其原始編碼器對應體而作為合成解相關信號341的一替換發揮作用。容許藉由該參數性立體聲增混裝置300恢復原始立體聲信號。對於一給定的時間/頻率塊,該預測殘餘信號331可完全地替換經解相關之單聲道降混信號341或其可以一互補方式發揮作用。若預測殘餘信號僅經稀疏編碼,例如最有效之頻格中僅一些被編碼,則後者(該預測殘餘信號以一互補方式發揮作用)是有益的。在此情況下,與編碼器預測殘餘信號相較而言,能量仍將丟失。此能量之缺失將由經解相關之信號341填充。接著按如下計算一新的經解相關按比例調整因數β':
其中〈d res , cod ,d res , cod 〉係經編碼之預測殘餘信號的信號功率,且〈s ,s 〉係單聲道降混信號204之功率。
該參數性立體聲增混裝置300可用於參數性立體聲解碼器的當前最先進技術之架構中而無需任何額外的調適。該參數性立體聲增混裝置300接著替換如圖2中描繪的增混單元230。當預測殘餘信號331被參數性立體聲增混400使用時,需要若干調適,該等調適係在圖6中描繪。
圖6繪示包含根據本發明之參數性立體聲增混裝置400的參數性立體聲解碼器。一參數性立體聲解碼器包含一解多工構件210,該解多工構件210係用於將輸入位元流分開為一單聲道位元流202、一預測殘餘位元流332及參數位元流203。一單聲道解碼構件220將該單聲道位元流202解碼為一單聲道降混信號204。該單聲道解碼構件經進一步組態以將該預測殘餘位元流332解碼為預測殘餘信號331。一參數解碼構件240將參數位元流203解碼為空間參數205。參數性立體聲增混裝置400基於空間參數205從單聲道降混信號204及預測殘餘信號331產生一左信號206及一右信號207。雖然單聲道降混信號204及預測殘餘信號的解碼係由解碼構件220執行,但該解碼可能是由用於待解碼之信號之每一者的一分離之解碼軟體及/或硬體執行。
圖7繪示根據本發明之基於空間參數而從單聲道降混信號204產生左信號206及右信號207之一方法的一流程圖。在一第一步驟710中,基於以一預測係數321按比例調整的單聲道降混信號204而預測包含介於該左信號206與該右信號207之間之一差異的一差異信號311,其中該預測係數係從空間參數205導出。在一第二步驟720中,基於該單聲道降混信號204與該差異信號311的一總和及一差異而導出該左信號206及該右信號207。
當預測殘餘信號在該第二步驟720中為可用時,繼該單聲道降混信號204及該差異信號211之後將該預測殘餘信號用於導出該左信號206及該右信號207。
當參數性立體聲解碼器中使用參數性立體聲增混300時,不需要對參數性立體聲編碼器做任何修改。可使用如先前技術中已知之參數性立體聲編碼器。
然而,當使用參數性立體聲增混400時,必須調適參數性立體聲編碼器以在位元流中提供預測殘餘信號。
圖8顯示根據本發明之一參數性立體聲降混裝置800,該參數性立體聲降混裝置基於空間參數而從左信號及右信號產生一單聲道降混信號。該參數性立體聲降混裝置800繼單聲道降混信號104之後輸出一額外信號801,該額外信號801為該預測殘餘信號。該參數性立體聲降混裝置800包含一進一步的算術構件810,該算術構件810係用於導出單聲道降混信號104及包含介於左信號101與右信號102之間之一差異之一差異信號811。該參數性立體聲降混裝置800進一步包含一進一步的預測構件820,該預測構件820係用於導出(該差異信號的)一預測殘餘信號801以作為介於該差異信號811與該單聲道降混信號104之間之一差異,該單聲道降混信號104係以從空間參數103導出之一預定之預測係數831而按比例調整。該預定之預測係數係在一單元830中決定。該預定之預測係數經選擇以提供正交於該單聲道降混信號104的預測殘餘信號801。另外,可利用降混信號的功率正規化(在圖8中未繪示)。
雖然相對應於單聲道降混及預測殘餘之信號的編號在參數性立體聲增混裝置及參數性立體聲降混裝置中具有不同的參考數字,應明白的是,單聲道降混信號204及104彼此相對應,且該預測殘餘信號331及801亦彼此相對應。
圖9繪示包含根據本發明之參數性立體聲降混裝置800的參數性立體聲編碼器。該參數性立體聲編碼器包含:
- 一估計構件130,用於從左信號101及右信號102導出空間參數103;
- 一根據本發明的參數性立體聲降混裝置110,用於基於空間參數103而從左信號101及右信號102導出一單聲道降混信號104;
- 一單聲道編碼構件120,用於將該單聲道降混信號104編碼為一單聲道位元流105,該單聲道編碼構件120經進一步配置以將該預測殘餘信號801編碼為一預測殘餘位元流802;
- 一參數編碼構件140,用於將空間參數103編碼為一參數位元流106;及
- 一多工構件150,用於將該單聲道位元流105、該參數位元流106及該預測殘餘位元流802合併為一輸出位元流107。
雖然由編碼構件120執行單聲道降混信號104及預測殘餘信號801的編碼,但可能由用於待編碼之信號之每一者之一分離的編碼軟體及/或硬體執行該編碼。
此外,雖然經個別地列出,但複數個構件、元件或方法步驟可由(例如)一單一單元或處理器實施。另外,雖然在不同請求項中可包括個別之特徵,但是可能可有利地組合此等特徵,且包括於不同請求項中並不暗示特徵之一組合是不可行及/或不利的。而且,一特徵包括在一個類別之請求項中並不暗示對此類別之一限制,而是指示若適當,則該特徵同樣可適用於其他請求項類別。此外,請求項中特徵的順序並不暗示該等特徵工作必須遵循的任何特定順序,且特定言之,在一方法請求項中之個別步驟的順序並不暗示該等步驟必須以此順序執行。確切言之,該等步驟可以任何適當之順序執行。另外,單數參考並不排除複數。因此,對「一」、「第一」、「第二」等等的參考並不排除複數個。請求項中之參考符號係僅作為一澄清實例而提供,且不應將其解讀為以任何方式限制申請專利範圍之範疇。
100...參數性立體聲(PS)編碼器
101...左信號
102...右信號
103...空間參數
104...單聲道降混信號
105...單聲道位元流
106...參數位元流
107...總立體聲位元流/輸出位元流
110...參數性立體聲降混裝置
120...單聲道編碼構件
130...估計構件
140...參數編碼構件
150...多工構件
200...PS解碼器
201...輸入位元流
202...單聲道位元流
203...參數位元流
204...單聲道降混信號
205...空間參數
206...左信號
207...右信號
210...解多工構件
220...單聲道解碼構件
230...參數性立體聲增混構件
240...參數解碼構件
300...參數性立體聲增混裝置
310...預測構件
311...差異信號
320...單元
321...預測係數
322...按比例調整因數
330...算術構件
331...預測殘餘信號
332...預測殘餘位元流
340...單元
341...經解相關之單聲道降混信號
400...參數性立體聲增混裝置
710...第一步驟
720...第二步驟
800...參數性立體聲降混裝置
801...額外信號/預測殘餘信號
802...預測殘餘位元流
810...算術構件
811...差異信號
820...預測構件
830...單元
831...預測係數
圖1示意性繪示一參數性立體聲編碼器之架構(先前技術);
圖2示意性繪示一參數性立體聲解碼器之架構(先前技術);
圖3繪示根據本發明的一參數性立體聲增混裝置,該參數性立體聲增混裝置基於空間參數而從一單聲道降混信號產生一左信號及一右信號;
圖4繪示包含一預測構件的參數性立體聲增混裝置,該預測構件係經配置用以藉由增添一按比例調整之經解相關單聲道降混信號而增強差異信號;
圖5繪示具有差異信號之一預測殘餘信號作為一額外輸入的參數性立體聲增混裝置;
圖6繪示包含根據本發明之參數性立體聲增混裝置的參數性立體聲解碼器;
圖7繪示根據本發明之基於空間參數而從單聲道降混信號產生左信號及右信號之一方法的一流程圖;
圖8繪示根據本發明的一參數性立體聲降混裝置,該參數性立體聲降混裝置基於空間參數而從左信號及右信號產生一單聲道降混信號;及
圖9繪示包含根據本發明之參數性立體聲降混裝置的參數性立體聲編碼器。
204...單聲道降混信號
205...空間參數
206...左信號
207...右信號
300...參數性立體聲增混裝置
310...預測構件
311...差異信號
320...單元
321...預測係數
330...算術構件

Claims (17)

  1. 一種參數性立體聲增混(upmix)裝置(300、400),其用以基於空間參數(205)而從一單聲道降(downmix)混信號(204)產生一左信號(206)及一右信號(207),該參數性立體聲增混裝置(300、400)之特徵為其包含:一預測構件(310),用於基於以一預測係數(321)按比例調整之該單聲道降混信號(204)而預測包含介於該左信號(206)與該右信號(207)之間之一差異之一差異信號(311),其中該預測係數係從該等空間參數(205)導出;及一算術構件(330),用於基於該單聲道降混信號(204)與該差異信號(311)之一總和及一差異而導出該左信號(206)及該右信號(207)。
  2. 如請求項1之參數性立體聲增混裝置,其中該預測係數(321)係基於該降混信號(204)於該差異信號(311)上的波形匹配。
  3. 如請求項2之參數性立體聲增混裝置,其中該預測係數(321)係給定為該等空間參數(205)之一函數: 其中iidipdicc 係該等空間參數,且iid 係一聲道間強度差,ipd 係一聲道間相位差,且icc 係一聲道間同調性。
  4. 如請求項1至3之任一項參數性立體聲增混裝置,其中用於預測該差異信號(311)之該預測構件(310)經配置用於藉 由增添一按比例調整之經解相關單聲道降混信號而增強該差異信號。
  5. 如請求項4之參數性立體聲增混裝置,其中該經解相關單聲道降混(341)係藉由濾波該單聲道降混信號(204)而獲得。
  6. 如請求項4之參數性立體聲增混裝置,其中應用於該經解相關單聲道降混(341)之按比例調整因數(322)經設定以補償一預測能量損耗。
  7. 如請求項6之參數性立體聲增混裝置,其中應用於該經解相關單聲道降混(341)之一按比例調整因數(322)係給定為該等空間參數之一函數: 其中iidipdicc 係該等空間參數,且iid 係一聲道間強度差,ipd 係一聲道間相位差,icc 係一聲道間同調性,且α係該預測係數(321)。
  8. 如請求項1之參數性立體聲增混裝置,其中該參數性立體聲增混(300、400)具有該差異信號之一預測殘餘信號(331)作為一額外輸入,其中該等算術構件(330)經配置用於基於該單聲道降混信號(204)、該差異信號(311)及該差異信號的該預測殘餘信號(331)而導出該左信號(206)及該右信號(207)。
  9. 一種參數性立體聲解碼器,其包含:一解多工構件 (210),用於將輸入位元流(201)分開為一單聲道位元流(202)及參數位元流(203);一單聲道解碼構件(220),用於將該單聲道位元流解碼為一單聲道降混信號(204);一參數解碼構件(240),用於將參該數位元流解碼為空間參數(205);及一參數性立體聲增混構件(230),用於基於該等空間參數(205)從一單聲道降混信號(204)產生一左信號(206)及一右信號(207),該參數性立體聲解碼器進一步包含如請求項1至7任一項的參數性立體聲增混裝置(300)。
  10. 一種參數性立體聲解碼器,其包含:一解多工構件(210),用於將該輸入位元流(201)分開為一單聲道位元流(202)及參數位元流(203);一單聲道解碼構件(220),用於將該單聲道位元流解碼為一單聲道降混信號(204);一參數解碼構件(240),用於將該參數位元流解碼為空間參數(205);及一參數性立體聲增混構件(230),用於基於該等空間參數(205)從一單聲道降混信號(204)產生一左信號(206)及一右信號(207);該參數性立體聲解碼器之特徵為:該解多工構件(210)經進一步配置以從該輸入位元流提取一預測殘餘位元流(332),該單聲道解碼構件(220)經進一步配置以從該預測殘餘位元流解碼該差異信號之一預測殘餘信號(331),且該參數立體聲增混構件(230)係如請求項8之參數性立體聲增混裝置。
  11. 一種用於基於空間參數而從一單聲道降混信號產生一左信號及一右信號的方法,其特徵為: 基於以一預測係數按比例調整之該單聲道降混信號而預測包含介於該左信號與該右信號之間之一差異之一差異信號,其中該預測係數係從該等空間參數導出;基於該單聲道降混信號與該差異信號之一總和及一差異而導出該左信號及該右信號。
  12. 如請求項11之用於基於空間參數而從一單聲道降混信號產生一左信號及一右信號的方法,其中導出該左信號及該右信號之該步驟亦係基於該差異信號之該預測殘餘信號。
  13. 一種包含如請求項9或10之一參數性立體聲解碼器的音訊播放器件。
  14. 一種參數性立體聲降混裝置(800),該參數性立體聲降混裝置(800)係用於基於空間參數(103)而從一左信號(101)及一右信號(102)產生一單聲道降混信號(104),該參數性立體聲降混裝置(800)之特徵為其具有一差異信號之一預測殘餘信號(801)作為一額外輸入,其中該參數性立體聲降混裝置包含:一進一步之算術構件(810),用於導出該單聲道降混信號(104)及包含介於該左信號與該右信號之間之一差異之一差異信號(811);及一進一步之預測構件(820),用於導出該差異信號之一預測殘餘信號(801)以作為介於該差異信號(811)與該單聲道降混信號(104)之間之一差異,以從該等空間參數(103)導出之一預定的預測係數(831)而按比例調整該單聲道降混信號(104)。
  15. 一種參數性立體聲編碼器,其包含:一估計構件(130), 用於從一左信號(101)及一右信號(102)導出空間參數(103);一參數性立體聲降混構件(110),用於基於該等空間參數而從該左信號及該右信號產生一單聲道降混信號(104);一單聲道編碼構件(120),用於將該單聲道降混信號編碼為一單聲道位元流(105);一參數編碼構件(140),用於將該等空間參數編碼為一參數位元流(106);及一多工構件(150),用於將該單聲道位元流及該參數位元流合併為一輸出位元流;該參數性立體聲編碼器之特徵為:該參數性立體聲降混構件(110)係如請求項14之參數性立體聲降混裝置,且該單聲道編碼構件(220)經進一步配置以將該差異信號之該預測殘餘信號(801)編碼為一預測殘餘位元流(802),且該多工構件(150)經進一步配置以將該預測位元流合併為該輸出流。
  16. 一種用於基於空間參數從一左信號及一右信號產生一差異信號之一預測殘餘信號的方法,該方法之特徵為:導出介於該左信號與該右信號之間之該差異信號;導出該差異信號之一預測殘餘信號以作為介於該差異信號與該單聲道降混信號之間之一差異,該單聲道降混信號係以從該等空間參數導出之一預測係數按比例調整。
  17. 一種用於執行請求項11、12或16之方法的電腦程式產品。
TW098116731A 2008-05-23 2009-05-20 參數性立體聲增混裝置、參數性立體聲解碼器、參數性立體聲降混裝置、參數性立體聲編碼器 TWI484477B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP08156801 2008-05-23

Publications (2)

Publication Number Publication Date
TW201011736A TW201011736A (en) 2010-03-16
TWI484477B true TWI484477B (zh) 2015-05-11

Family

ID=40943873

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098116731A TWI484477B (zh) 2008-05-23 2009-05-20 參數性立體聲增混裝置、參數性立體聲解碼器、參數性立體聲降混裝置、參數性立體聲編碼器

Country Status (10)

Country Link
US (6) US8811621B2 (zh)
EP (1) EP2283483B1 (zh)
JP (1) JP5122681B2 (zh)
KR (1) KR101629862B1 (zh)
CN (1) CN102037507B (zh)
BR (3) BRPI0908630B1 (zh)
MX (1) MX2010012580A (zh)
RU (1) RU2497204C2 (zh)
TW (1) TWI484477B (zh)
WO (1) WO2009141775A1 (zh)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4643453B2 (ja) 2006-01-10 2011-03-02 株式会社東芝 情報処理装置及び情報処理装置の動画像復号方法
JP5122681B2 (ja) * 2008-05-23 2013-01-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
MX2012003785A (es) * 2009-09-29 2012-05-22 Fraunhofer Ges Forschung Decodificador de señal de audio, codificador de señal de audio, metodo para proveer una representacion de señal de mezcla ascendente, metodo para proveer una representacion de señal de mezcla descendente, programa de computadora y cadena de bits usando un valor de parametro de correlacion-inter-objeto-comun.
TWI444989B (zh) 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
CN103811010B (zh) * 2010-02-24 2017-04-12 弗劳恩霍夫应用研究促进协会 产生增强下混频信号的装置和产生增强下混频信号的方法
EP2375410B1 (en) 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
AU2016222372B2 (en) * 2010-04-09 2018-06-28 Dolby International Ab Mdct-based complex prediction stereo coding
RU2559899C2 (ru) * 2010-04-09 2015-08-20 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
PL3779975T3 (pl) 2010-04-13 2023-12-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i powiązane sposoby przetwarzania wielokanałowych sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
CN102314882B (zh) * 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
JP2012100241A (ja) 2010-10-05 2012-05-24 Panasonic Corp 画像編集装置、画像編集方法、及び、そのプログラム
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
US8654984B2 (en) 2011-04-26 2014-02-18 Skype Processing stereophonic audio signals
US9552818B2 (en) 2012-06-14 2017-01-24 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
MX350690B (es) 2012-08-03 2017-09-13 Fraunhofer Ges Forschung Método y descodificador para un concepto paramétrico de codificación de objeto de audio espacial generalizado para casos de mezcla descendente/mezcla ascendente de multicanal.
CA3234476A1 (en) 2013-01-08 2014-07-17 Dolby International Ab Model based prediction in a critically sampled filterbank
EP3933834A1 (en) 2013-07-05 2022-01-05 Dolby International AB Enhanced soundfield coding using parametric component generation
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
KR101461110B1 (ko) * 2013-09-06 2014-11-12 광주과학기술원 스테레오 확장장치 및 스테레오 확장방법
WO2015059153A1 (en) 2013-10-21 2015-04-30 Dolby International Ab Parametric reconstruction of audio signals
AU2014339065B2 (en) 2013-10-21 2017-04-20 Dolby International Ab Decorrelator structure for parametric reconstruction of audio signals
CN103700372B (zh) * 2013-12-30 2016-10-05 北京大学 一种基于正交解相关技术的参数立体声编码、解码方法
EP3540732B1 (en) * 2014-10-31 2023-07-26 Dolby International AB Parametric decoding of multichannel audio signals
EP3405951B1 (en) 2016-01-22 2019-11-13 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
JP6817433B2 (ja) * 2016-11-08 2021-01-20 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 少なくとも2つのチャンネルをダウンミックスするためのダウンミキサおよび方法ならびにマルチチャンネルエンコーダおよびマルチチャンネルデコーダ
BR112019009315A2 (pt) * 2016-11-08 2019-07-30 Fraunhofer Ges Forschung aparelho e método para mixagem de redução ou mixagem de aumento de um sinal de múltiplos canais com o uso de compensação de fase
MX2019008008A (es) * 2017-01-04 2019-12-16 That Corp Arquitectura configurable de compresor multibanda con procesamiento de sonido envolvente avanzado.
US10877192B2 (en) 2017-04-18 2020-12-29 Saudi Arabian Oil Company Method of fabricating smart photonic structures for material monitoring
US10401155B2 (en) 2017-05-12 2019-09-03 Saudi Arabian Oil Company Apparatus and method for smart material analysis
CA3071208A1 (en) * 2017-07-28 2019-01-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for encoding or decoding an encoded multichannel signal using a filling signal generated by a broad band filter
CN109389984B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
CN114898761A (zh) * 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN117198302A (zh) * 2017-08-10 2023-12-08 华为技术有限公司 时域立体声参数的编码方法和相关产品
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
WO2019121980A1 (en) 2017-12-19 2019-06-27 Dolby International Ab Methods and apparatus systems for unified speech and audio decoding improvements
KR20200099560A (ko) 2017-12-19 2020-08-24 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템
ES2909343T3 (es) 2018-04-05 2022-05-06 Fraunhofer Ges Forschung Aparato, método o programa informático para estimar una diferencia de tiempo entre canales
EP3913626A1 (en) * 2018-04-05 2021-11-24 Telefonaktiebolaget LM Ericsson (publ) Support for generation of comfort noise
WO2020009082A1 (ja) 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
US10841689B2 (en) * 2018-10-02 2020-11-17 Harman International Industries, Incorporated Loudspeaker and tower configuration
BR112021010972A2 (pt) 2018-12-07 2021-09-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho e método para gerar uma descrição de campo de som
KR20220025107A (ko) * 2019-06-14 2022-03-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 매개변수 인코딩 및 디코딩
EP4120249A4 (en) 2020-03-09 2023-11-15 Nippon Telegraph And Telephone Corporation SOUND SIGNAL CODING METHOD, SOUND SIGNAL DECODING METHOD, SOUND SIGNAL CODING DEVICE, SOUND SIGNAL DECODING DEVICE, PROGRAM AND RECORDING MEDIUM
WO2021181746A1 (ja) * 2020-03-09 2021-09-16 日本電信電話株式会社 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
WO2021181473A1 (ja) * 2020-03-09 2021-09-16 日本電信電話株式会社 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
US20230319498A1 (en) 2020-03-09 2023-10-05 Nippon Telegraph And Telephone Corporation Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5717764A (en) * 1993-11-23 1998-02-10 Lucent Technologies Inc. Global masking thresholding for use in perceptual coding
US20050254446A1 (en) * 2002-04-22 2005-11-17 Breebaart Dirk J Signal synthesizing
TW200636677A (en) * 2004-11-30 2006-10-16 Agere Systems Inc Parametric coding of spatial audio with object-based side information
TW200643897A (en) * 2005-04-15 2006-12-16 Coding Tech Ab Adaptive residual audio coding

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8913758D0 (en) 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
WO2003085643A1 (en) * 2002-04-10 2003-10-16 Koninklijke Philips Electronics N.V. Coding of stereo signals
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
KR20060132697A (ko) * 2004-02-16 2006-12-21 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코더 및 트랜스코딩 방법
CN1938760B (zh) * 2004-04-05 2012-05-23 皇家飞利浦电子股份有限公司 多通道编码器
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
BRPI0517949B1 (pt) 2004-11-04 2019-09-03 Koninklijke Philips Nv dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
ES2433316T3 (es) * 2005-07-19 2013-12-10 Koninklijke Philips N.V. Generación de señales de audio de multiples canales
KR100923156B1 (ko) * 2006-05-02 2009-10-23 한국전자통신연구원 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
PL2068307T3 (pl) * 2006-10-16 2012-07-31 Dolby Int Ab Udoskonalony sposób kodowania i odtwarzania parametrów w wielokanałowym kodowaniu obiektów poddanych procesowi downmiksu
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
CN101809654B (zh) * 2007-04-26 2013-08-07 杜比国际公司 供合成输出信号的装置和方法
EP2023600A1 (en) 2007-07-27 2009-02-11 Thomson Licensing Method of color mapping from non-convex source gamut into non-convex target gamut
JP5122681B2 (ja) * 2008-05-23 2013-01-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5717764A (en) * 1993-11-23 1998-02-10 Lucent Technologies Inc. Global masking thresholding for use in perceptual coding
US20050254446A1 (en) * 2002-04-22 2005-11-17 Breebaart Dirk J Signal synthesizing
TW200636677A (en) * 2004-11-30 2006-10-16 Agere Systems Inc Parametric coding of spatial audio with object-based side information
TW200643897A (en) * 2005-04-15 2006-12-16 Coding Tech Ab Adaptive residual audio coding

Also Published As

Publication number Publication date
US20170134875A1 (en) 2017-05-11
RU2010152580A (ru) 2012-06-27
BRPI0908630A2 (pt) 2017-10-03
EP2283483B1 (en) 2013-03-13
US11871205B2 (en) 2024-01-09
BR122020009727B1 (pt) 2021-04-06
US20190058960A1 (en) 2019-02-21
TW201011736A (en) 2010-03-16
US10136237B2 (en) 2018-11-20
BRPI0908630A8 (pt) 2017-12-12
US8811621B2 (en) 2014-08-19
US20210274302A1 (en) 2021-09-02
WO2009141775A1 (en) 2009-11-26
RU2497204C2 (ru) 2013-10-27
KR20110020846A (ko) 2011-03-03
EP2283483A1 (en) 2011-02-16
BRPI0908630B1 (pt) 2020-09-15
MX2010012580A (es) 2010-12-20
US20240121567A1 (en) 2024-04-11
BR122020009732B1 (pt) 2021-01-19
JP2011522472A (ja) 2011-07-28
US20140321652A1 (en) 2014-10-30
JP5122681B2 (ja) 2013-01-16
CN102037507A (zh) 2011-04-27
US9591425B2 (en) 2017-03-07
US20110096932A1 (en) 2011-04-28
KR101629862B1 (ko) 2016-06-24
US11019445B2 (en) 2021-05-25
CN102037507B (zh) 2013-02-06

Similar Documents

Publication Publication Date Title
TWI484477B (zh) 參數性立體聲增混裝置、參數性立體聲解碼器、參數性立體聲降混裝置、參數性立體聲編碼器
JP7270096B2 (ja) フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法
RU2491657C2 (ru) Способы и устройства для эффективного использования поэтапно передаваемой информации в кодировании и декодировании звука
JP6196249B2 (ja) 複数のチャネルを有するオーディオ信号を符号化する装置と方法
TWI420512B (zh) 用以利用相位值平滑化方式來對向下混合音訊信號進行向上混合之裝置、方法和電腦程式
JP2016508617A (ja) 隠しオブジェクトを信号混合操作に使用する空間オーディオオブジェクト符号化の装置及び方法
Disch et al. A dedicated decorrelator for parametric spatial coding of applause-like audio signals
AU2015201672A1 (en) Apparatus for generating a decorrelated signal using transmitted phase information