TW201729180A - 使用一寬帶對準參數與複數窄帶對準參數編碼或解碼多通道信號之裝置及方法 - Google Patents
使用一寬帶對準參數與複數窄帶對準參數編碼或解碼多通道信號之裝置及方法 Download PDFInfo
- Publication number
- TW201729180A TW201729180A TW106102398A TW106102398A TW201729180A TW 201729180 A TW201729180 A TW 201729180A TW 106102398 A TW106102398 A TW 106102398A TW 106102398 A TW106102398 A TW 106102398A TW 201729180 A TW201729180 A TW 201729180A
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- channel
- parameter
- channels
- alignment
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 50
- 230000003595 spectral effect Effects 0.000 claims description 52
- 238000001228 spectrum Methods 0.000 claims description 44
- 238000004458 analytical method Methods 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 18
- 239000002131 composite material Substances 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000013139 quantization Methods 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 4
- 230000003111 delayed effect Effects 0.000 claims description 2
- 230000001419 dependent effect Effects 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 23
- 230000005540 biological transmission Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Radar Systems Or Details Thereof (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Control Of Eletrric Generators (AREA)
- Emergency Protection Circuit Devices (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
用於編碼具有至少兩個聲道的一多聲道信號的該設備,包含:一參數決定器用於自該多聲道信號決定一寬帶對準參數及複數窄帶對準參數;一信號對準器用於使用該寬帶對準參數及該等複數窄帶對準參數對準該等至少兩個聲道以獲得已對準之聲道;一信號處理器用於使用該等已對準之聲道計算一中間信號及一側邊信號;一信號編碼器用於編碼該中間信號以獲得一經編碼之中間信號及用於編碼該側邊信號以獲得一經編碼之側邊信號;及一輸出介面用於產生一經編碼之多聲道信號包含該經編碼之中間信號、該經編碼之側邊信號、該寬帶對準參數上之資訊、及該等複數窄帶對準參數上之資訊。
Description
此申請案係有關於立體聲處理,或概略言之,多聲道處理,於該處一多聲道信號具有二聲道,諸如以立體聲信號為例,一左聲道及一右聲道,或多於兩個聲道,諸如三、四、五或任何其它聲道數目。
立體聲語音及特別對話立體聲語音比起立體聲樂音的儲存及廣播受到遠較少的科學關注。確實,於語音通訊中今日大半仍使用單聲道發射。然而,隨著網路頻寬及容量的增加,預期基於立體聲技術之通訊將變成更普及且帶來更佳的收聽經驗。
立體聲音訊材料的有效寫碼已經長期就樂音的感官音訊寫碼用於有效儲存或廣播進行研究。於高位元率,於該處波形保留為關鍵性,已經長期採用稱作中間/側邊(M/S)立體聲的和-差立體聲。至於低位元率,已經問市強度立體聲及更為晚近參數立體聲寫碼。最新技術被採用於不同標準為HeAACv2及Mpeg USAC。其產生二聲道信號及相關聯的精簡空間邊帶資訊的縮混。
聯合立體聲寫碼通常建立在高頻率解析度上,亦即低時間解析度,信號之時間-頻率變換與在大部分語音寫碼器中進行的低延遲及時域處理不相容。再者,產生的位元率通常為高。
另一方面,參數立體聲採用一額外濾波器排組位在編碼器前端作為前處理器及在解碼器後端作為後處理器。因此,參數立體聲可使用於習知語音寫碼器,例如ACELP,原因在於其以MPEG USAC進行。再者,聽覺場景的參數化可以最少量邊帶資訊達成,其係適合用於低位元率。但如同例如於MPEG USAC,參數立體聲未經特別設計用於低延遲且針對不同對話景況不會傳遞一致的品質。於空間場景的習知參數表示型態中,立體聲影像之寬度係藉施加於二合成聲道上的解相關器人工複製,及藉由編碼器計算及發射的聲道間同調(ICs)參數加以控制。至於大部分立體聲語音,此種加寬立體聲影像之方式不適合用於重新再現屬於相當直接聲音的語音之自然環境,原因在於其係由位在該空間內一特定位置的單一音源產生(偶爾有些來自室內的混響)。相反地,樂器具有比語音遠更自然的寬度,其可藉將該等聲道解相關而更佳地模擬。
當語音係以不重合麥克風紀錄時,類似於A-B組態中,當麥克風彼此距離遠或用於雙耳紀錄或渲染時也成問題。該等景況可預期用於擷取電話會議中的語音或在多點控制單元(MCU)中以遙遠揚聲器產生虛擬聽覺場景。不似在重合麥克風上紀錄,例如X-Y(強度紀錄)或M-S(中間-側邊紀錄),信號的抵達時間因不同聲道而異。此等未經時間對準的二聲道之同調計算可能錯誤估計,使得人工環境合成失敗。
有關立體聲處理的先前技術參考文獻為US專利5,434,948或US專利8,811,621。
文件WO 2006/089570 A1揭示接近透明或透明多聲道編碼器/解碼器方案。多聲道編碼器/解碼器方案額外產生波形類型殘差信號。此殘差信號連同一或多個多聲道參數一起發射至解碼器。與純粹參數多聲道解碼器相反,因額外殘差信號故,加強式解碼器產生具有改良式輸出品質的多聲道輸出信號。在編碼器端上,左聲道及右聲道兩者皆藉分析濾波器排組濾波。然後,用於各個子頻帶信號,針對一子頻帶計算對準值及增益值。然後在進一步處理之前進行此種對準。在解碼器端上,進行解對準及增益處理,然後對應信號藉合成濾波器排組合成以便產生經解碼之左信號及經解碼之右信號。
發現此等先前技術程序未能給音訊信號提供優化,及特別針對有多於一個揚聲器的語音信號,亦即於會議景況或對話語音場景中尤為如此。
本發明之一目的係提出用於編碼或解碼多聲道信號的改良構想。
此目的係藉請求項1之用於編碼一多聲道信號的設備、請求項20之用於編碼一多聲道信號的方法、請求項21之用於解碼一經編碼之多聲道信號的設備、或請求項33之用於解碼一經編碼之多聲道信號的方法、或請求項34之電腦程式而予達成。
用於編碼具有至少兩個聲道的一多聲道信號的設備包含一參數決定器以決定一方面一寬帶對準參數及另一方面複數窄帶對準參數。此等參數由一信號對準器用來使用此等參數對準該等至少兩個聲道以獲得經對準的聲道。然後,一信號處理器使用該等經對準的聲道計算一中間信號及一側邊信號,該中間信號及該側邊信號隨後經編碼及前傳入一經編碼之輸出信號,其額外具有該寬帶對準參數及該等複數窄帶對準參數作為參數邊帶資訊。
在解碼器端上,一信號解碼器解碼經編碼之中間信號及經編碼之側邊信號以獲得經解碼之中間及側邊信號。然後此等信號藉一信號處理器處理用於計算一經解碼之第一聲道及一經解碼之第二聲道。然後此等經解碼之聲道使用涵括於經編碼之多聲道信號的寬帶對準參數上之資訊及複數窄帶對準參數上之資訊解對準而獲得經解碼之多聲道信號。
於一特定實施例中,寬帶對準參數為聲道間時間差參數及複數窄帶對準參數為聲道間相位差。
本發明係基於發現特別對有多於一個揚聲器的語音信號,但也對有數個音訊源的其它音訊信號,音訊源之不同位置皆對映入多聲道信號的兩個聲道,可考慮使用寬帶對準參數諸如聲道間時間差參數施加至一或二聲道之全頻譜。除了此寬帶對準參數之外,發現逐子頻帶不同的數個窄帶對準參數額外地導致於二聲道中信號的更佳對準。
因此,對應各子頻帶中相同時間延遲的寬帶對準連同針對不同子頻帶對應不同相位旋轉的相位對準,在此二聲道轉換成中間/側邊表示型態之前,導致二聲道的優化對準,該表示型態然後經進一步編碼。由於已獲得優化對準故,一方面中間信號之能儘可能地高,另一方面,側邊信號之能儘可能地小,因而可獲得針對某些位元率,具有最低可能位元率或最高可能音訊品質的優化寫碼結果。
特別針對對話語音材料,典型揚聲器在二不同位置為作用態。此外,情況為正常只有一個揚聲器自第一位置說話,及然後第二揚聲器自第二位置或地點說話。在二聲道諸如第一或左聲道及第二或右聲道上的不同位置之影響係藉不同的抵達時間反映,因此,因不同位置所致二聲道間之某個時間延遲,及此時間延遲因時間而異。通常,此影響係反映在二聲道信號當寬帶解對準時,其可藉寬帶對準參數解決。
另一方面,特別來自混響或進一步雜訊源的其它效應可藉用於個別頻帶的個別相位對準參數加以考慮,該等參數係疊加在寬帶不同抵達時間或二聲道之寬帶解對準上。
有鑑於此,兩者的使用,一寬帶對準參數及複數窄帶對準參數於該寬帶對準參數頂上導致編碼器端上之優化聲道對準用以獲得良好且極為精簡的中間/側邊表示型態,而另一方面,在解碼器端上在解碼之後的對應解對準導致用於某個位元率的良好音訊品質或用於某個要求的音訊品質之小位元率。
本發明之優點為其提出比較現有立體聲寫碼方案遠更適合用於立體聲語音對話的新穎立體聲寫碼方案。依據本發明,尤其於語音源之情況但也於其它音訊源的情況下,特別藉探勘於多聲道信號的聲道間出現的聲道間時間差而組合參數立體聲技術及聯合立體聲寫碼技術。
數個實施例提供有用的優點,容後詳述。
新穎方法為自習知M/S立體聲及參數立體聲的混成辦法混合元素。於習知M/S中,聲道被動地縮混而產生中間信號及側邊信號。該方法可進一步擴延在加總及微分聲道之前,使用卡羅變換(KLT)又稱主要組成分析(PCA)而旋轉聲道。中間信號係於主碼寫碼加以寫碼,而側邊信號傳遞至副寫碼器。演進M/S立體聲可藉於目前框或先前框中寫碼的中間聲道而進一步使用側邊信號的預測。旋轉及預測的主要目標係最大化中間信號之能,同時最小化側邊信號之能。M/S立體聲為波形保留,就此面向而言,對任何立體聲景況極為穩健,但就位元消耗而言可能極為昂貴。
為了於低位元率之最高效率,參數立體聲計算及寫碼參數,例如,聲道間位準差(ILD)、聲道間相位差(IPD)、聲道間時間差(ITD)及聲道間同調(IC)。其精簡地表示立體聲影像且為聽覺場景的線索(音源位置、汰選、立體聲寬度…)。目標係為了參數化立體聲場景及只寫碼可在解碼器的縮混信號,及借助於發射的立體聲線索再度被空間化。
本發明辦法混合兩種構想。首先,立體聲線索ITD及IPD經計算及施加至二聲道上。目標係表示出不同頻帶的寬帶的時間差及相位。然後二聲道於時間及相位對準,然後進行M/S寫碼。發現ITD及IPD用於模型化立體聲語音為有用的,且為於M/S中基於KLT旋轉的良好替代。不似純粹參數寫碼,周圍環境不再藉IC模型化,反而藉經寫碼的及/或預測的側邊信號直接模型化。發現尤其當處理語音信號時此種辦法更穩健。
ITD的計算及處理為本發明之關鍵部分。ITD已在先前技術雙耳線索寫碼(BCC)探勘,但一旦ITD隨時間改變時該技術無效。為了避免此項缺點,設計特定視窗化用於平滑化兩個不同ITD間之過渡,且能從一個揚聲器無縫切換至在不同位置的另一個揚聲器。
進一步實施例係有關下述程序,在編碼器端上,用來決定複數窄帶對準參數的參數決定係使用已經與稍早決定的寬帶對準參數對準的聲道進行。
對應地,在進行寬帶解對準之前,使用典型地單一寬帶對準參數進行在解碼器端上之窄帶解對準。
於進一步實施例中,較佳地,在編碼器端上但甚至更要緊地在解碼器端上,在全部對準之後,及尤其使用寬帶對準參數的時間對準之後,進行逐一區塊的某種視窗化及重疊加法操作或任一種交叉衰退。如此避免了當時間或寬帶對準參數逐一區塊改變時的任何可聽聞的假信號諸如卡嚓聲。
於其它實施例中,施加不同頻譜解析度。更明確言之,聲道信號接受具有高頻率解析度的時間-頻譜轉換,諸如DFT頻譜,而針對具有較低頻率解析度的參數頻帶決定參數諸如窄帶對準參數。典型地,參數頻帶具有比信號頻譜更多一個頻譜線,及典型地具有來自DFT頻譜的一組頻譜線。又復,參數頻帶自低頻增至高頻以便考慮聽覺心理學(音質)議題。
進一步實施例係有關於位準參數諸如位準間差或用於處理側邊信號的其它程序諸如立體聲填充參數等的額外使用。經編碼之側邊信號可藉實際側邊信號本身表示,或藉使用目前框或任何其它框進行的預測殘差信號表示,或於只有一子集之頻帶藉一側邊信號或一側邊預測殘差信號表示,及只針對其餘頻帶藉預測參數表示,或甚至針對沒有高頻解析度側邊信號資訊的全部頻帶藉預測參數表示。因此,於如上最末替代例中,針對各個參數頻帶或只有一子集之參數頻帶,經編碼之側邊信號只由一預測參數表示,使得針對其餘參數頻帶不存在有原先側邊信號上的任何資訊。
又復,較佳地有複數窄帶對準參數,並非用於反映寬帶信號之全頻寬的全部參數頻帶,反而只用於一集合之較低,諸如參數頻帶的較低50%。另一方面,立體聲填充參數不便用於數個較低頻帶,原因在於針對此等頻帶,發射側邊信號本身或預測殘差信號以便確保,至少針對較低頻帶,可得波形校正表示型態。另一方面,針對較高頻帶,側邊信號非以波形正確表示型態發射以便進一步減低位元率,反而側邊信號典型地係以立體聲填充參數表示。
又復,較佳地基於相同DFT頻譜在一個且同一個頻域內部進行整個參數分析及對準。為了達成該目的,進一步較佳地使用帶有相位變換的通用交叉關聯(GCC-PHAT)技術用於聲道間時間差決定用途。於本程序之一較佳實施例中,基於頻譜形狀資訊,該資訊較佳地為頻譜平坦度量,進行一相關頻譜的平滑化,以使得以雜訊狀信號為例平滑化將為弱,及以調性信號為例平滑化將變較強。
又復,較佳地,進行特定相位旋轉,於該處考慮聲道振幅。特別,相位旋轉係分布於二聲道間,用於編碼器上的對準目的,及當然,用於解碼器上的解對準目的,於該處具有較高振幅的聲道被考慮作為領先聲道且將較不受相位旋轉影響,亦即,將比具有較低振幅的聲道更少被旋轉。
又復,和-差計算係使用能定標進行,帶有定標因數自二聲道之能推衍,此外,受限於某個範圍,以便確保中間/側邊計算不會過度影響該能。然而,另一方面,注意為了本發明之目的,此種節能不如先前技術程序重要,因時間及相位事先對準故。因此,因自左及右的中間信號及側邊信號之計算(在編碼器端上)或因自中間及側邊的左及右信號之計算(在解碼器端上)所致之能起伏波動不如先前技術般顯著。
圖1例示用於編碼具有至少兩個聲道之多聲道信號的設備。多聲道信號10一方面輸入參數決定器100及另一方面輸入信號對準器200。一方面,參數決定器100決定寬帶對準參數,及另一方面,自多聲道信號決定複數窄帶對準參數。此等參數透過參數線路12輸出。又復,如圖例示,此等參數也透過又一參數線路14輸出至一輸出介面500。在參數線路14上,額外參數諸如位準參數自參數決定器100前傳至輸出介面500。信號對準器200係經組配,使用透過參數線路10接收的寬帶對準參數及複數窄帶對準參數,用於對準多聲道信號10之至少兩個聲道以在信號對準器200之輸出獲得已對準之聲道20。此等已對準之聲道20前傳至信號處理器300,其係經組配用於自透過線路接收的已對準之聲道20計算中間信號31及側邊信號32。用於編碼之設備包含用於自線路31編碼中間信號及自線路32編碼側邊信號的信號編碼器400以獲得於線路41上的編碼中間信號及於線路42上的編碼側邊信號。此等信號兩者前傳至輸出介面500用於在輸出線路50產生編碼多聲道信號。於輸出線路50的編碼信號包含得自線路41的編碼中間信號、得自線路42的編碼側邊信號、得自線路14的窄帶對準參數及寬帶對準參數、及選擇性地,得自線路14的位準參數,及此外選擇性地,由信號編碼器400產生的立體聲填充參數及透過參數線路43前傳至輸出介面500。
較佳地,信號對準器係經組配以,在參數決定器100實際上計算窄帶參數之前,使用寬帶對準參數而自多聲道信號對準聲道。因此,於此實施例中,信號對準器200透過連接線15將寬帶對準聲道發送回參數決定器100。然後,參數決定器100自相對於寬帶特性已對準的多聲道信號決定複數窄帶對準參數。然而,於其它實施例中,參數未使用此種特定程序順序決定。
圖4a例示一較佳實施例,於該處進行遭致連接線15的該特定步驟順序。於步驟16,寬帶對準參數係使用二聲道決定,獲得寬帶對準參數,諸如聲道間時差或ITD參數。然後,於步驟21,二聲道係藉圖1之信號對準器200使用寬帶對準參數加以對準。然後,於步驟17,窄帶參數係使用參數決定器100內部的已對準聲道決定,以決定複數窄帶對準參數,諸如用於多聲道信號之不同頻帶的多個聲道間相位差參數。然後,於步驟22,於各個參數頻帶中之頻譜值係使用針對此特定頻帶的對應窄帶對準參數加以對準。於步驟22,當針對各個聲道進行此程序時,對此有窄帶對準參數可用,然後藉圖1之信號處理器300用於進一步信號處理可用的第一及第二或左/右聲道。
圖4b例示圖1之多聲道編碼器的又一實施例,於該處於頻域進行數個程序。
更明確言之,多聲道編碼器進一步包含時間-頻譜轉換器150,其用於將時域多聲道信號轉換成頻域中之該等至少兩個聲道的頻譜表示型態。
又復,如於152例示,圖1中於100、200及300例示的參數決定器、信號對準器及信號處理器全部皆於頻域操作。
又復,多聲道編碼器及,特別地,信號處理器進一步包含一頻譜-時間轉換器154,用於至少產生中間信號的時域表示型態。
較佳地,頻譜-時間轉換器額外地也將藉由方塊152表示的程序所決定的側邊信號之頻譜表示型態轉換成時域表示型態,及然後,圖1之信號編碼器400經組配以,取決於圖1之信號編碼器400之特定實施例,進一步將中間信號及/或側邊信號編碼為時域信號。
較佳地,圖4b之時間-頻譜轉換器150係經組配以實施圖4c的步驟155、156及157。特別地,步驟155包含提供分析視窗在其一端具有至少一個零填補部,及特別地,例如,於後文中圖7例示的於初始視窗部的零填補部及於終結視窗部的零填補部。又復,分析視窗額外地具有於視窗的第一半部及於視窗的第二半部之重疊範圍或重疊部,及此外,較佳地,視情況而定,中間部分為非重疊範圍。
於步驟156,各個聲道使用具有重疊範圍之分析視窗加以視窗化。更明確言之,各個聲道使用分析視窗加以視窗化,使得獲得聲道之第一區塊。隨後,獲得該聲道之第二區塊,其具有與第一區塊的某個重疊範圍等等,使得例如接續於五次視窗化操作之後,可利用各個聲道之五個視窗化樣本區塊,然後如於圖4c中於157例示,個別被變換成頻譜表示型態。對其它聲道也進行相同程序,因而於步驟157結束時,一序列之頻譜值區塊及特別,可得複合頻譜值,諸如DFT頻譜值或複合子頻帶樣本。
於步驟158,其係藉圖1之參數決定器100進行,決定寬帶對準參數,及於步驟159,其係藉圖1之信號對準器200進行,使用寬帶對準參數進行圓形移位。於步驟160,再度藉圖1之參數決定器100進行,針對個別頻帶/子頻帶決定窄帶對準參數,及於步驟161,使用針對特定頻帶決定的對應窄帶對準參數而對各個頻帶旋轉已對準之頻譜值。
圖4d例示由信號處理器300進行的進一步程序。更明確言之,信號處理器300係經組配以計算中間信號及側邊信號,如於步驟301例示。於步驟302,可進行側邊信號之某種進一步處理,及然後於步驟303,各區塊的中間信號及側邊信號被變換回時域,及於步驟304,合成視窗施加至藉步驟303獲得的各個區塊,及於步驟305,一方面進行針對中間信號的重疊加法操作,及另一方面進行針對側邊信號的重疊加法操作,以最終進行時域中間/側邊信號。
更明確言之,步驟304及305之操作導致自一區塊的中間信號的一種交叉衰退,或進行下個區塊的中間信號及側邊信號中之側邊信號,使得即便當出現任何參數變化時,諸如出現聲道間時間差參數或聲道間相位差參數,雖言如此,此點將於圖4d中藉步驟305獲得的時域中間/側邊信號為無法稽核。
新穎低延遲立體聲寫碼為聯合中間/側邊(M/S)立體聲寫碼探勘有些空間線索,於該處中間聲道係藉主單聲道核心寫碼器寫碼,及側邊聲道係藉副核心寫碼器寫碼。編碼器及解碼器原理於圖6a、6b中描繪。
立體聲處理主要於頻域(FD)進行。選擇性地,在頻率分析之前,可於時域(TD)進行立體聲處理。此乃針對ITD計算的情況,其可在頻率分析之前計算及施加,用於在追求立體聲分析及處理之前的時間對準該等聲道。另外,ITD處理可於頻域直接進行。因尋常語音寫碼器例如ACELP不含任何內部時間-頻率分解,故立體聲寫碼在核心編碼器之前利用分析及合成濾波器排組增加額外複合經調變的濾波器排組及在核心解碼器之後增加分析-合成濾波器排組的另一階段。於較佳實施例中,採用具有低重疊區的過取樣DFT。然而,於其它實施例中,可使用具有相似的時間解析度的任何複合值時間-頻率分解。
立體聲處理包含計算空間線索:聲道間時間差(ITD)、聲道間相位差(IPD)、及聲道間位準差(ILD)。ITD及IPD使用在輸入立體聲信號上用於時間及相位上對準兩個聲道L及R。ITD係於寬帶或於時域計算,而IPD及ILD係針對參數頻帶中之各者或部分計算,其對應頻率空間的非一致分解。一旦兩個聲道對準,施加聯合M/S立體聲,於該處然後進一步自中間信號預測側邊信號。預測增益係自ILD推衍。
中間信號進一步藉主核心寫碼器寫碼。於較佳實施例中,主核心寫碼器為3GPP EVS標準,或自其推衍的寫碼可在語音寫碼模式ACELP與基於MDCT變換的樂音模式間切換。較佳地,ACELP及以MDCT為基礎的寫碼器係由時域頻寬擴延(TD-BWE)及或智能間隙填補(IGF)模組分別支援。
側邊信號首先係由中間聲道使用自ILD推衍的預測增益預測。殘差可進一步藉中間信號的延遲版本預測,或藉副核心寫碼器直接寫碼,於較佳實施例中,於MDCT域進行。在編碼器的立體聲處理可藉圖5摘述,容後詳述。
圖2例示用於解碼於輸入線路50接收的經編碼之多聲道信號之設備的一實施例的方塊圖。
更明確言之,信號由輸入介面600接收。連結至輸入介面600者為信號解碼器700及信號解對準器900。又復,信號處理器800一方面連結至信號解碼器700及另一方面連結至信號解對準器。
更明確言之,經編碼之多聲道信號包含經編碼之中間信號、經編碼之側邊信號、寬帶對準參數上之資訊、及複數窄帶對準參數上之資訊。因此,線路50上的經編碼之多聲道信號可恰為與由圖1之輸出介面500所輸出的相同信號。
然而,要緊地,此處須注意,與圖1中例示者相反地,涵括於某種形式的經編碼信號中之寬帶對準參數及複數窄帶對準參數可恰為如於圖1中由信號對準器200使用的對準參數,但另外,也可以是其逆值,亦即,恰由信號對準器200進行的相同操作但具有逆值,使得獲得解對準的參數。
如此,對準參數上之資訊可以是如由圖1中之信號對準器200使用的對準參數,或可以是其逆值,亦即,實際「解對準參數」。此外,此等參數典型地以某種形式量化,容後參考圖8討論。
圖2之輸入介面600分開得自經編碼之中間/側邊信號的寬帶對準參數及複數窄帶參數上之資訊,及透過參數線路610前傳此資訊至信號解對準器900。另一方面,經編碼之中間信號透過線路601前傳至信號解碼器700,及經編碼之側邊信號透過信號線路602前傳至信號解碼器700。
信號解碼器係經組配以解碼經編碼之中間信號及解碼經編碼之側邊信號而在線路701上獲得經解碼之側邊信號及在線路702上獲得經解碼之中間信號。此等信號由信號處理器800使用於,自經解碼之中間信號及經解碼之側邊信號,計算經解碼之第一聲道信號或經解碼之左信號及計算經解碼之第二聲道或經解碼之右聲道信號,及經解碼之第一聲道信號及經解碼之第二聲道分別於線路801、802上輸出。信號解對準器900係經組配以使用寬帶對準參數上的資訊解對準在線路801上的經解碼之第一聲道及經解碼之右聲道802,及此外,使用複數窄帶對準參數上之資訊以獲得經解碼之多聲道信號,亦即,在線路901及902上具有至少兩個已解碼且已解對準之聲道的解碼信號。
圖9a例示藉得自圖2之信號解對準器900進行的較佳步驟順序。更明確言之,步驟910接收已對準的左及右聲道,如自圖2在線路801、802上可得。於步驟910,信號解對準器900使用窄帶對準參數上之資訊而解對準個別子頻帶,以便於911a及911b獲得相位經解對準的經解碼之第一及第二或左及右聲道,於步驟912,該等聲道使用寬帶對準參數解對準,因此於913a及913b獲得相位及時間經解對準的聲道。
於步驟914,進行任何進一步處理,包含使用視窗化或重疊加法操作,或通常使用任何交叉衰退操作,以便於915a及915b獲得假信號縮減的或無假信號的解碼信號,亦即,至沒有任何假信號的經解碼之聲道,但一方面針對寬帶及另一方面針對複數窄帶典型地曾有時變解對準參數。
圖9b例示圖2中例示的多聲道解碼器之一較佳實施例。
特別,圖2之信號處理器800包含時間-頻譜轉換器810。
又復,信號處理器包含中間/側邊至左/右轉換器820以便自中間信號M及側邊信號S計算左信號L及右信號R。
然而,要緊地為了於方塊820中藉中間/側邊至左/右轉換計算L及R,非必要使用側邊信號S。取而代之,容後詳述,左/右信號初步只使用自聲道間位準差參數ILD推衍得之增益參數計算。一般而言,預測增益也可被考慮為一種ILD的形式。增益可自ILD推衍,但也可直接計算。較佳不再計算ILD,但直接計算預測增益及發射之,且使用預測增益於解碼器而非使用ILD參數。
因此,於此實施例中,側邊信號S只使用於聲道更新器830,如由旁通線路821例示,其操作以便使用被發射的側邊信號提供較佳的左/右信號。
因此,轉換器820使用透過位準參數輸入822獲得的位準參數操作,而未實際上使用側邊信號S,但然後聲道更新器830使用側邊821,及取決於特定實施例使用透過線路831接收的立體聲填充參數操作。然後信號對準器900包含相位解對準器及能定標器910。能定標係藉由定標因數計算器940推衍的定標因數控制。定標因數計算器940係由聲道更新器830之輸出饋入。基於透過輸入911接收的窄帶對準參數,進行相位解對準,及於方塊920,基於透過線路921接收的寬帶對準參數,進行時間解對準。最後,進行頻譜-時間轉換930以便最終獲得解碼信號。
圖9c例示於一較佳實施例中,於圖9b之方塊920及930內部典型進行之又一步驟順序。
更明確言之,窄帶解對準聲道輸入功能對應圖9b之方塊920的寬帶解對準內。於方塊931進行DFT或任何其它變換。實際計算時域樣本之後,進行使用合成視窗的選擇性合成視窗化。合成視窗較佳地恰與分析視窗相同,或自分析視窗推衍得,例如,內插或降取樣,但以某種方式取決於分析視窗。相依性較佳地為使得針對重疊範圍中之各點由兩個重疊視窗界定的乘數因子加總至1。如此,於方塊932中之合成視窗之後,進行重疊操作及隨後加法操作。另外,替代合成視窗及重疊/加法操作,針對各聲道進行在接續方塊間之任何交叉衰退,以便如圖9a之脈絡中已經討論,獲得假信號縮減的解碼信號。
當考慮圖6b時,清楚可知針對中間信號的實際解碼操作,亦即一方面「EVS解碼器」,及針對側邊信號,反向量量化VQ-1
及反MDCT操作(IMDCT)對應圖2之信號解碼器700。
又復,方塊810中之DFT操作對應圖9b中之元件810,及反信號處理器及反時移功能對應圖2之方塊800、900,及圖6b之反DFT操作930對應圖9b中之方塊930中之對應操作。
接著以進一步細節討論圖3。特別,圖3例示具有個別頻譜線的DFT頻譜。較佳地,DFT頻譜或圖3中例示的任何其它頻譜為複合頻譜,及各線為具有振幅及相位或具有真實部分及虛擬部分的複合頻譜線。
此外,頻譜也分割成不同參數頻帶。各個參數頻帶具有至少一個及較佳地多於一個頻譜線。此外,參數頻帶自低頻增至高頻。典型地,寬帶對準參數為用於整個頻譜,亦即,用於包含圖3中之具體實施例中之全部頻帶1至6的頻譜,的單一寬帶對準參數。
又復,提出複數窄帶對準參數,使得針對各個參數頻帶有單一對準參數。如此表示針對一頻帶的對準參數總是施加至對應頻帶內部的全部頻譜值。
又復,除了窄帶對準參數之外,位準參數也提供給各個參數頻帶。
與提供給頻帶1至頻帶6之各個及每個參數頻帶的位準參數相反地,較佳只提供複數窄帶對準參數給有限數目的較低頻帶,諸如頻帶1、2、3及4。
此外,立體聲填充參數提供給某個頻帶數目,較低頻帶除外,諸如於該具體實施例中頻帶4、5及6,但有用於較低參數頻帶1、2及3的側邊信號頻譜值,結果,針對此等較低頻帶不存在有立體聲填充參數,於該處使用側邊信號本身或表示側邊信號的預測殘差信號獲得波形匹配。
如已描述,諸如於圖3中之實施例中於較高頻帶存在有更多頻譜線,於參數頻帶6有七條頻譜線相較於參數頻帶2有三條頻譜線。然而,當然,參數頻帶數目、頻譜線數目、及一參數頻帶內部的頻譜線數目、及亦針對某些參數的不同極限將為不同。
雖言如此,圖8例示參數之分配及被提供參數的頻帶數目,於某個實施例中與圖3相反地,實際提供12頻帶。
如圖例示,提供位準參數ILD給12頻帶中之各者,且經量化至由每頻帶五位元表示的量化準確度。
又復,窄帶對準參數IPD只提供給較低頻帶至2.5 kHz的寬帶。此外,聲道間時間差或寬帶對準參數只提供為全頻譜的單一參數,但針對全頻帶由8位元表示有極高量化準確度。
又復,提出相當粗糙的量化立體聲填充參數,每頻帶由3位元表示,而非針對低於1 kHz的較低頻帶,原因在於針對較低頻帶涵括實際編碼側邊信號或側邊信號殘差頻譜值。
隨後,就圖5摘述在編碼器端上的較佳處理。於第一步驟中,進行左及右聲道的DFT分析。該程序對應圖4c之步驟155至157。於步驟158,計算寬帶對準參數,及特別較佳寬帶對準參數聲道間時間差(ITD)。如於170例示,進行頻域中L及R的時移。另外,也在時域進行此種時移。然後進行反DFT,於時域進行時移,及進行額外正DFT以便再度在使用寬帶對準參數對準之後具有頻譜表示型態。
ILD參數,亦即位準參數及相位參數(IPD參數)在經移位L及R表示型態上針對各個參數頻帶計算,如於步驟171例示。此步驟例如對應圖4c之步驟160。時移L及R表示型態以聲道間相位差參數之函數旋轉,如圖4c之步驟161或圖5例示。接著,如步驟301例示,計算中間及側邊信號,及較佳地,額外有能轉換操作,容後詳述。於接續步驟174中,使用M為ILD之函數及選擇性地使用過去M信號,亦即稍早時框的中間信號,進行S之預測。接著,進行中間信號及側邊信號的反DFT,其對應較佳實施例中圖4d的步驟303、304、305。
於最末步驟175,時域中間信號m及選擇性地,殘差信號係如於步驟175例示編碼。此程序對應由圖1中之信號編碼器400進行者。
於反立體聲處理中於解碼器,側邊信號係於DFT域產生,首先自中間信號預測為:於該處g為針對各個參數頻帶計算的增益且為發射的聲道間位準差(ILD)之函數。
然後,預測殘差可以兩個不同方式精製: -藉殘差信號之二次寫碼:於該處gcod
為針對全頻譜發射的全域增益 -藉殘差預測,稱作立體聲填充,以得自前一DFT框的先前解碼中間信號頻譜預測殘差側邊頻譜:於該處gpred
為針對各個參數頻帶發射的預測增益。
於相同DFT頻譜內可混合兩型寫碼精製。於較佳實施例中,殘差寫碼施加於較低參數頻帶上,而殘差預測施加至其餘頻帶上。於如圖1中描繪的較佳實施例中,殘差寫碼在時域合成殘差側邊信號及藉MDCT變換之後於MDCT域進行。不似DFT,MDCT係經臨界取樣且更適用於音訊寫碼。MDCT係數係藉晶格向量量化而直接地向量量化,但另可藉純量量化器接著熵寫碼器寫碼。另外,殘差側邊信號也於時域藉語音寫碼技術寫碼,或於DFT域直接寫碼。 1.時間-頻率分析:DFT
要緊地,自藉DFT進行的立體聲處理之額外時間-頻率分解允許良好聽覺場景分析,同時不會顯著增加寫碼系統的總延遲。藉由內設,使用10毫秒(核心寫碼器之20毫秒時框的兩倍)的時間解析度。分析及合成視窗為相同及對稱。視窗於圖7中以16 kHz的取樣率表示。可觀察得重疊區受限用以減少造成的延遲,及當施加ITD於頻域時,也加入零填補以逆平衡圓形移位,容後詳述。 2.立體聲參數
立體聲參數最大可以立體聲DFT的時間解析度發射。於最小值,可減少至核心寫碼器的時框解析度,亦即20毫秒。藉由內設,當未檢測得暫態時,歷2 DFT視窗每20毫秒計算參數。參數頻帶構成約略等效矩形頻寬(ERB)的兩倍或四倍之後的頻譜的非一致且非重疊分解。藉由內設,4售ERB尺規係使用於16 kHz頻帶寬度共12頻帶(32 kbps取樣率,超寬帶立體聲)。圖8摘述組態實例,對此立體聲邊帶資訊係以約5 kbps發射。 3.ITD之計算及聲道時間對準
ITD係使用帶有相位變換的通用交互關係(GCC-PHAT)藉估計到達時間延遲(TDOA)計算:於該處L及R分別為左及右聲道的頻譜。頻率分析可與使用於接續立體聲處理的DFT獨立進行或可分享。用於計算ITD的假碼如下:
圖4e例示用於實施稍早例示的假碼之流程圖,以便獲得聲道間時間差之穩健有效的計算作為寬帶對準參數之實例。
於方塊451,進行針對第一聲道(l)及第二聲道(r)的時域信號之DFT分析。此種DFT分析典型地將為例如於圖5或圖4c之步驟155至157之脈絡中已經討論者的相同DFT分析。
針對各個頻率倉進行交叉關聯,如方塊452例示。
如此,針對左及右聲道的全頻譜範圍獲得交叉關聯頻譜。
於步驟453,然後針對L及R之振幅頻譜計算頻譜平坦度量,及於步驟454,選取較大的頻譜平坦度量。然而,於步驟454的選擇並非必然需要選擇較大者,但自二聲道單一SFM的決定也可能是只有左聲道或只有右聲道的計算及選擇,或可以是二SFM值之加權平均的計算。
於步驟455,取決於頻譜平坦度量,然後交叉關聯頻譜隨著時間之推移而平滑化。
較佳地,頻譜平坦度量係由振幅頻譜之幾何平均除以振幅頻譜之算術平均計算。如此,SFM值限於0至1間。
於步驟456,然後平滑化的交叉關聯頻譜藉其振幅標準化,及於步驟457,計算已標準化之平滑化的交叉關聯頻譜的反DFT。於步驟458,較佳地進行某個時域濾波,但取決於實施例,此時域濾波也可不考慮但為較佳,容後詳述。
於步驟459,藉濾波通用交叉關係函數的峰值拾取及藉進行某個臨界化操作而進行ITD估計。
若未獲得某個臨界值,則IDT設定為零,及對此對應區塊未進行時間對準。
ITD計算也可摘述如下。取決於頻譜平坦度量,在被平滑化之前,於頻域計算交叉關聯。SFM限於0至1間。以類似雜訊信號為例,SFM將為高(亦即,約1)及平滑化將為弱。以類似調性信號為例,SFM將為低及平滑化將變強。然後,在變換回時域之前,平滑化的交叉關聯藉其幅值加以標準化。標準化對應交叉關聯的相位變換,且已知於低雜訊及相對高混響環境中,顯示比較正常交叉關聯更佳的效能。如此所得的時域功能首先經濾波用以達成更穩健的峰值拾取。對應最大幅值的指數對應左及右聲道間之時間差(ITD)估值。若最大幅值係低於給定臨界值,則ITD之估計不視為可靠且被設定為零。
若於時域施加時間對準,則於分開DFT分析計算ITD。移位進行如下:
要求於編碼器的額外延遲,其至多等於可處理的最大ITD絕對值。ITD隨時間之變化係藉DFT之分析視窗化加以平滑化。
另外,可於頻域施加時間對準。於此種情況下,ITD計算及圓形移位係在相同DFT域,與此種另一個立體聲處理分享的域。圓形移位係藉下式給定:
需要DFT視窗的零填補來以圓形移位模擬時移。零填補的大小對應可處理的ITD最大絕對值。於較佳實施例中,藉將3.125毫秒零加在兩端上,零填補一致分裂在分析視窗兩側上。可能ITD最大絕對值則為6.25毫秒。於A-B麥克風配置中,最惡劣情況係對應兩個麥克風間約2.15米之最大距離。ITD隨時間之變化係藉DFT之合成視窗化及重疊加法加以平滑化。
要緊地,時移之後接著已移位信號之視窗化。此乃與先前技術雙耳線索編碼(BCC)的主要區別,於該處時移施加至視窗化信號上,但於合成階段未進一步視窗化。結果,ITD隨時間之任何變化於解碼信號產生人造暫態/單擊。 4.IPD之計算及聲道旋轉
在時間對準二聲道之後,計算IPD及取決於立體聲組態,此點用於各個參數頻帶或至少高達給定ipd_max_band。然後,IPD施加至二聲道用以對準其相位:
於該處、、及b為屬於頻率指數k的參數頻帶指數。參數β負責二聲道間分配相位旋轉量同時使其相位對準。β取決於IPD但也取決於聲道之相對振幅位準ILD。若一聲道具有較高振幅,則將被視為領先聲道且比具有較低振幅的聲道將較不受相位旋轉的影響。 5.和-差及側邊信號寫碼
和差變換係在二聲道的時間及相位經對準的頻譜上進行,使得於中間信號節能。於該處限於1/1.2與1.2間,亦即-1.58至+1.58分貝。當調整M及S之能時,該項限制避免了假信號。值得注意者為當時間及相位經事先對準時,此種節能較不重要。另外,界限可予增減。
進一步以M預測側邊信號S:於該處,於該處。另外,藉由最小化殘差及由先前方程式推衍的ILD的均方差(MSE)可得最佳預測增益g。
殘差信號S’(f)可藉兩種手段模型化:或以M之延遲頻譜預測,或於MDCT域中直接於MDCT域寫碼。 6.立體聲解碼
中間信號X及側邊信號S首先轉換成左及右聲道L及R如下:於該處每個參數頻帶之增益g係自ILD參數推衍:。
針對低於cod_max_band的參數頻帶,該等二聲道係以經解碼的側邊信號更新:針對較高參數頻帶,側邊信號經預測及聲道更新為:最後,聲道乘以複合值,目標回復立體聲信號的原先能及聲道間相位:於該處於該處a係如前定義及如前定義畫界,及於該處,及於該處atan2(x,y)為x/y的四象限反正切。
最後,取決於被發射的ITD,聲道於時域或於頻域時移。時域聲道係藉反DFT及重疊加法合成。
本發明之特定特徵係與空間線索及和-差聯合立體聲寫碼之組合相關。更明確言之,空間線索IDT及IPD係經計算及施加於立體聲聲道(左及右)上。又復,和-差(M/S信號)經計算,及較佳地,以M施加S的預測。
於解碼器端上,寬帶及窄帶空間線索連同和-差聯合立體聲寫碼組合。更明確言之,使用至少一個空間線索諸如ILD預測側邊信號,及計算反和-差用以獲得左及右聲道,及此外,寬帶及窄帶空間線索施加於左及右聲道上。
較佳地,編碼器有一視窗及在使用ITD處理後,相對於時間對準聲道重疊-加法。又復,在施加聲道間時間差之後,解碼器額外有經移位的或經解對準的聲道版本之視窗化及重疊-加法操作。
使用GCC-Phat方法之聲道間時間差的計算乃特別穩健的方法。
新穎程序為優異的先前技術,原因在於以低延遲達成立體聲音訊或多聲道音訊的位元率寫碼。特別設計針對輸入信號之不同性質及多聲道或立體聲紀錄之不同配置為穩健。特別,本發明對位元率立體聲語音寫碼提供良好品質。
較佳程序可使用於全部類型立體聲音訊或多聲道音訊內部諸如語音及樂音的廣播分配在一給定低位元率具有恆定感官品質。此種應用區為數位無線電、網際網路串流、或音訊通訊應用。
發明編碼音訊信號可儲存於數位儲存媒體或非暫態儲存媒體上,或可在發射媒體諸如無線發射媒體或有線發射媒體諸如網際網路上。
雖然有些面向已經於設備之脈絡中描述,顯然此等面向也表示對應方法的描述,於該處一區塊或裝置對應方法步驟或方法步驟之特徵。類似地,於方法步驟之脈絡中描述的面向也表示對應區塊或對應設備之項目或特徵的描述。
取決於某些實施例要求,本發明之實施例可於硬體或軟體實施。實施例可使用數位儲存媒體進行,例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,具有儲存其上之電子可讀取控制信號,其與可規劃電腦系統協力(或能協力)因而進行個別方法。
依據本發明之若干實施例包含一種具有電子可讀取控制信號的資料載體,其可與可規劃電腦系統協力,因而進行本文描述的方法中之一者。
概略言之,本發明之實施例可實施為帶程式碼的電腦程式產品,當電腦程式產品在電腦上跑時,程式碼係針對進行方法中之一者操作。程式碼例如可儲存於機器可讀取載體上。
其它實施例包含儲存於機器可讀取載體上或非暫態儲存媒體上用於進行本文描述的方法中之一者的電腦程式。
換言之,因此,本發明方法之實施例為當電腦程式產品在電腦上跑時,具有用於進行本文描述的方法中之一者的程式碼之電腦程式。
因此,本發明方法之進一步實施例為包含用於進行本文描述的方法中之一者的電腦程式紀錄於其上的資料載體(或數位儲存媒體,或電腦可讀取媒體)。
因此,本發明方法之進一步實施例為表示用於進行本文描述的方法中之一者的電腦程式之一資料串流或一串列之信號。該資料串流或該串列之信號例如可經組配以透過資料通訊連結,例如透過網際網路移轉。
又一實施例包含處理構件,例如電腦,或可程式化邏輯裝置,經組配以或適用以進行本文描述的方法中之一者。
又一實施例包含具有用於進行本文描述的方法中之一者的電腦程式安裝於其上的電腦。
於若干實施例中,可程式化邏輯裝置(例如,現場可程式閘陣列)可使用以進行本文描述的方法之部分或全部功能。於若干實施例中,現場可程式閘陣列可與微處理器協力以便進行本文描述的方法中之一者。通常,該等方法較佳地係藉任何硬體設備進行。
前述實施例僅為本發明之實施例的原理之例示。須瞭解本文描述的配置及細節之修改及變化將為熟諳技藝人士顯然易知。因此意圖僅受隨附之申請專利範圍所限,而非藉由此處實施例之描述及解釋呈示的特定細節所限。
10‧‧‧多聲道信號
12、43、610‧‧‧參數線路
14‧‧‧又一參數線路
15‧‧‧連接線
16、17、21、22、155-161、171-175、301-305、451-459‧‧‧步驟
20‧‧‧已對準之聲道
31‧‧‧中間信號
32‧‧‧側邊信號
50‧‧‧輸出線路
100‧‧‧參數決定器
150、810‧‧‧時間-頻譜轉換器
152、451-459、820、920、931-933‧‧‧方塊
154、930‧‧‧頻譜-時間轉換器
200‧‧‧信號對準器
300、800‧‧‧信號處理器
400‧‧‧信號編碼器
500‧‧‧輸出介面
600‧‧‧輸入介面
601、701、702、801、802、901、902、911a-b、913a-b、915a-b、921‧‧‧線路
602‧‧‧信號線路
700‧‧‧信號解碼器
820‧‧‧中間/側邊至左/右轉換器
821‧‧‧旁通線路
822‧‧‧位準參數輸入
830‧‧‧聲道更新器
900‧‧‧信號解對準器
910‧‧‧相位解對準器及能定標器
911‧‧‧輸入
940‧‧‧定標因數計算器
隨後,參考附圖討論本發明之較佳實施例,附圖中: 圖1為用於編碼多聲道信號之一設備的一較佳實施例之方塊圖; 圖2為用於解碼一經編碼之多聲道信號之一設備的一較佳實施例; 圖3為針對某些實施例不同頻率解析度及其它頻率相關面向之例示; 圖4a為編碼設備用於對準聲道中進行的程序之流程圖; 圖4b例示於頻域中進行的程序之一較佳實施例; 圖4c例示使用具有零填補部及重疊範圍之一分析視窗,於編碼設備中進行的程序之一較佳實施例; 圖4d例示於編碼設備中進行的程序之一流程圖; 圖4e例示顯示聲道間時間差估計之一較佳實施例的一流程圖; 圖5例示一流程圖其例示於編碼設備中進行的程序之又一實施例; 圖6a例示編碼器之一實施例的方塊圖; 圖6b例示解碼器之一對應實施例的流程圖; 圖7例示具有低重疊正弦視窗的一較佳視窗情況,帶有零填補用於立體聲時間-頻率分析及合成; 圖8例示顯示不同參數值之位元消耗的一表; 圖9a例示於一較佳實施例中,藉用於解碼一經編碼之多聲道信號之一設備進行的程序; 圖9b例示用於解碼一經編碼之多聲道信號之設備的一較佳實施例;及 圖9c例示於一經編碼之多聲道信號的解碼情境中於寬帶解對準脈絡中進行的程序。
10‧‧‧多聲道信號
12、43‧‧‧參數線路
14‧‧‧又一參數線路
15‧‧‧連接線
20‧‧‧已對準之聲道
31‧‧‧中間信號
32‧‧‧側邊信號
41、42‧‧‧線路
50‧‧‧輸出線路
100‧‧‧參數決定器
200‧‧‧信號對準器
300‧‧‧信號處理器
400‧‧‧信號編碼器
500‧‧‧輸出介面
Claims (34)
- 一種用於編碼具有至少兩個聲道的一多聲道信號的設備,其包含: 一參數決定器用於自該多聲道信號決定一寬帶對準參數及複數窄帶對準參數; 一信號對準器用於使用該寬帶對準參數及該等複數窄帶對準參數對準該等至少兩個聲道以獲得已對準之聲道; 一信號處理器用於使用該等已對準之聲道計算一中間信號及一側邊信號; 一信號編碼器用於編碼該中間信號以獲得一經編碼之中間信號及用於編碼該側邊信號以獲得一經編碼之側邊信號;及 一輸出介面用於產生一經編碼之多聲道信號包含該經編碼之中間信號、該經編碼之側邊信號、該寬帶對準參數上之資訊、及該等複數窄帶對準參數上之資訊。
- 如請求項1之設備, 其中該參數決定器係經組配以使用該等至少兩個聲道之一寬帶表示型態決定該寬帶對準參數,該寬帶表示型態包含該等至少兩個聲道中之各者的至少兩個子頻帶,及 其中該信號對準器係經組配以進行該等至少兩個聲道之該寬帶表示型態的一寬帶對準以獲得該等至少兩個聲道之一經對準的寬帶表示型態。
- 如請求項1或2之設備, 其中該參數決定器係經組配以針對該等至少兩個聲道之一經對準的寬帶表示型態的至少一個子頻帶決定一分開窄帶對準參數,及 其中該信號對準器係經組配以使用針對一對應子頻帶的該窄帶參數個別地對準該經對準的寬帶表示型態的各個子頻帶以獲得包含針對該等至少兩個聲道中之各者的多個經對準的子頻帶之一經對準的窄帶表示型態。
- 如先前請求項中任一項之設備, 其中該信號處理器係經組配以使用針對該等至少兩個聲道中之各者的多個經對準的子頻帶計算用於該中間信號的該等多個子頻帶及用於該側邊信號的多個子頻帶。
- 如先前請求項中任一項之設備, 其中該參數決定器係經組配以計算針對該多聲道信號之多個子頻帶中之各者的一聲道間時間差參數作為該寬帶對準參數或一聲道間相位差作為該等複數窄帶對準參數。
- 如先前請求項中任一項之設備, 其中該參數決定器係經組配以針對該多聲道信號之多個子頻帶中之各者計算一預測增益或一聲道間位準差,及 其中該信號編碼器係經組配以使用一子頻帶中之該中間信號及使用該子頻帶之該聲道間位準差或該預測增益進行於該子頻帶中之該側邊信號的一預測。
- 如先前請求項中任一項之設備, 其中該信號編碼器係經組配以計算及編碼自該側邊信號推衍的一預測殘差信號、該等至少兩個聲道間之一預測增益或一聲道間位準差、該中間信號及一經延遲的中間信號,或其中於一子頻帶中之該預測增益係使用於該子頻帶中之該等至少兩個聲道間之該聲道間位準差計算,或 其中該信號編碼器係經組配以使用一語音寫碼器或一樂音/語音切換寫碼器或一時域頻寬擴延編碼器或一頻域間隙填充編碼器編碼該中間信號。
- 如先前請求項中任一項之設備,其進一步包含: 一時間-頻譜轉換器用於產生於一頻譜域中該等至少兩個聲道之一頻譜表示型態, 其中該參數決定器及該信號對準器及該信號處理器係經組配以於該頻譜域中操作,及 其中該信號處理器更進一步包含用於產生該中間信號之一時域表示型態的一頻譜-時間轉換器,及 其中該信號編碼器係經組配以編碼該中間信號之該時域表示型態。
- 如先前請求項中任一項之設備, 其中該參數決定器係經組配以使用一頻譜表示型態計算該寬帶對準參數, 其中該信號對準器係經組配以使用該寬帶對準參數將一圓形移位施加至該等至少兩個聲道之該頻譜表示型態以針對該等至少兩個聲道獲得寬帶經對準之頻譜值,或 其中該參數決定器係經組配以自該等寬帶經對準之頻譜值計算該等複數窄帶對準參數,及 其中該信號對準器係經組配以使用該等複數窄帶對準參數旋轉該等寬帶經對準之頻譜值。
- 如請求項8或9之設備, 其中該時間-頻譜轉換器係經組配以將一分析視窗施加至該等至少兩個聲道中之各者,其中該分析視窗在其一左側或一右側上具有一零填補部,其中該零填補部決定該寬帶對準參數之一最大值或 其中該分析視窗具有一初重疊區、一中非重疊區、及一尾重疊區或 其中該時間-頻譜轉換器係經組配以施加一串列之重疊視窗,其中一視窗之一重疊部的一長度與該視窗之一非重疊部的一長度一起等於該信號編碼器之一時框化的一分量。
- 如請求項8至10中任一項之設備, 其中該頻譜-時間轉換器係經組配以使用一合成視窗,該合成視窗係與由該時間-頻譜轉換器使用的該分析視窗相同或係自該分析視窗推衍。
- 如先前請求項中任一項之設備, 其中該信號處理器係經組配以計算該中間信號或該側邊信號的一時域表示型態,其中計算該時域表示型態包含: 視窗化該中間信號或該側邊信號的樣本之一目前區塊以獲得一視窗化目前區塊, 視窗化該中間信號或該側邊信號的樣本之一隨後區塊以獲得一視窗化隨後區塊,及 加總於一重疊範圍內該視窗化目前區塊之樣本及該視窗化隨後區塊之樣本以獲得針對該重疊範圍之該時域表示型態。
- 如先前請求項中任一項之設備, 其中該信號編碼器係經組配以編碼該側邊信號或於一第一集合之子頻帶中推衍自該側邊信號及該中間信號的一預測殘差信號,及 於與該第一集合之子頻帶不同的一第二集合之子頻帶中,編碼一增益參數推衍的側邊信號及於時間上稍早的一中間信號, 其中針對該第二集合之子頻帶該側邊信號或一預測殘差信號係未經編碼。
- 如請求項13之設備, 其中該第一集合之子頻帶具有於頻率上比於該第二集合之子頻帶中之頻率更低的子頻帶。
- 如先前請求項中任一項之設備, 其中該信號編碼器係經組配以使用一MDCT變換及一量化諸如一向量或一純量或該側邊信號之MDCT係數之任何其它量化而編碼該側邊信號。
- 如先前請求項中任一項之設備, 其中該參數決定器係經組配以針對具有頻寬之個別頻帶決定該等複數窄帶對準參數,其中具有一第一中心頻率的一第一頻帶之一第一頻寬係低於具有一第二中心頻率的一第二頻帶之一第二頻寬,其中該第二中心頻率係大於該第一中心頻率或 其中該參數決定器係經組配以只針對高達一邊界頻率的頻帶決定該等窄帶對準參數,該邊界頻率係低於該中間信號或該側邊信號之一最大頻率,及 其中該對準器係經組配以使用該寬帶對準參數只對準具有頻率高於該邊界頻率之頻率的子頻帶中之該等至少兩個聲道及使用該寬帶對準參數及該等窄帶對準參數對準具有頻率低於該邊界頻率之頻率的子頻帶中之該等至少兩個聲道。
- 如先前請求項中任一項之設備, 其中該參數決定器係經組配以使用一通用交叉關聯使用估計一到達時間延遲計算該寬帶對準參數,及其中該信號對準器係經組配以使用一時移於一時域或使用一圓形移位於一頻域施加該寬帶對準參數,或 其中該參數決定器係經組配以使用下列計算該寬帶參數: 計算該第一聲道與該第二聲道間之一交叉關聯頻譜; 針對該第一聲道或該第二聲道或二聲道計算一頻譜形狀上的一資訊; 取決於該頻譜形狀上的該資訊平滑化該交叉關聯頻譜; 選擇性地,標準化該經平滑化的交叉關聯頻譜; 決定該經平滑化的及該選擇性地標準化的交叉關聯頻譜的一時域表示型態;及 分析該時域表示型態以獲得該聲道間時間差作為該寬帶對準參數。
- 如先前請求項中任一項之設備, 其中該信號處理器係經組配以使用一能定標因數計算該中間信號及該側邊信號及其中該能定標因數係受限於至多2與至少0.5間,或 其中該參數決定器係經組配以藉決定於該頻帶內部之該等第一及第二聲道的頻譜值之積的一複合和的一角而針對一頻帶計算一標準化對準參數,或 其中該信號對準器係經組配以進行該窄帶對準使得該等第一及第二聲道兩者接受一聲道旋轉,其中具有一較高振幅之一聲道的一聲道旋轉係被旋轉達比具有一較小振幅之一聲道一更小程度。
- 一種用於編碼具有至少兩個聲道的一多聲道信號的方法,其包含: 自該多聲道信號決定一寬帶對準參數及複數窄帶對準參數; 使用該寬帶對準參數及該等複數窄帶對準參數對準該等至少兩個聲道以獲得已對準之聲道; 使用該等已對準之聲道計算一中間信號及一側邊信號; 編碼該中間信號以獲得一經編碼之中間信號及編碼該側邊信號以獲得一經編碼之側邊信號;及 產生一經編碼之多聲道信號包含該經編碼之中間信號、該經編碼之側邊信號、該寬帶對準參數上之資訊、及該等複數窄帶對準參數上之資訊。
- 一種經編碼之多聲道信號,其包含一經編碼之中間信號、一經編碼之側邊信號、一寬帶對準參數上之資訊、及複數窄帶對準參數上之資訊。
- 一種用於解碼包含一經編碼之中間信號、一經編碼之側邊信號、一寬帶對準參數上之資訊、及複數窄帶對準參數上之資訊的一經編碼之多聲道信號之設備,其包含: 一信號解碼器用於解碼該經編碼之中間信號以獲得一經解碼之中間信號及用於解碼該經編碼之側邊信號以獲得一經解碼之側邊信號; 一信號處理器用於自該經解碼之中間信號及該經解碼之側邊信號計算一經解碼之第一聲道及經解碼之第二聲道;及 一信號解對準器用於使用該寬帶對準參數上之該資訊及該等複數窄帶對準參數上之該資訊解對準該經解碼之第一聲道及該經解碼之第二聲道以獲得一經解碼之多聲道信號。
- 如請求項21之設備, 其中該信號解對準器係經組配以使用與該對應子頻帶相關聯的一窄帶對準參數解對準該等經解碼之第一及第二聲道之多個子頻帶中之各者以針對該第一及該第二聲道獲得一經解對準之子頻帶,及 其中該信號解對準器係經組配以使用該寬帶對準參數上之該資訊解對準該等第一及第二解碼聲道之該等經解對準之子頻帶的一表示型態。
- 如請求項21或22之設備, 其中該信號解對準器係經組配以使用下列計算該經解碼之第一聲道或該經解碼之第二聲道之一時域表示型態 視窗化該左聲道或該右聲道的樣本之一目前區塊以獲得一視窗化目前區塊, 視窗化該左聲道或該右聲道的樣本之一隨後區塊以獲得一視窗化隨後區塊,及 加總於一重疊範圍內該視窗化目前區塊之樣本及該視窗化隨後區塊之樣本以獲得針對該重疊範圍之該時域表示型態。
- 如請求項21或23中任一項之設備, 其中該信號解對準器係經組配以針對具有頻寬的個別子頻帶施加該等多個個別窄帶對準參數上之該資訊,其中具有一第一中心頻率的一第一頻帶之一第一頻寬係低於具有一第二中心頻率的一第二頻帶之一第二頻寬第二中心頻率,其中該第二中心頻率係大於該第一中心頻率,或 其中該信號解對準器係經組配以只針對高達一邊界頻率的頻帶施加用於個別頻帶之該等多個個別窄帶對準參數上之該資訊,該邊界頻率係低於該第一經解碼聲道或該第二經解碼聲道之一最大頻率,及 其中該信號解對準器係經組配以使用該寬帶對準參數上之該資訊只對準具有頻率高於該邊界頻率之頻率的子頻帶中之該等至少兩個聲道及使用該寬帶對準參數上之該資訊及使用該等窄帶對準參數上之該資訊對準具有頻率低於該邊界頻率之頻率的子頻帶中之該等至少兩個聲道。
- 如請求項21或24中任一項之設備, 其中該信號處理器包含: 一時間-頻譜轉換器用於計算及該經解碼之側邊信號的一頻域表示型態, 其中該信號處理器係經組配以計算於該頻域中之該經解碼之第一聲道及該經解碼之第二聲道,及 其中該信號解對準器包含一頻譜-時間轉換器用於將只使用該等複數窄帶對準參數上之該資訊或使用該等複數窄帶對準參數且使用該寬帶對準參數上之該資訊之經對準的信號轉換至一時域。
- 如請求項21或25中任一項之設備, 其中該信號解對準器係經組配以使用該寬帶對準參數上之該資訊進行於一時域的一解對準及使用時間經對準的聲道之時間隨後區塊進行一視窗化操作或一重疊及加法操作,或 其中該信號解對準器係經組配以使用該寬帶對準參數上之該資訊進行於一頻譜域的一解對準及使用該等經解對準聲道進行一頻譜-時間轉換及使用經解對準的聲道之時間隨後區塊進行一合成視窗化及一重疊及加法操作。
- 如先前請求項中任一項之設備, 其中該信號解碼器係經組配以產生一時域中間信號及一時域側邊信號, 其中該信號處理器係經組配以使用一分析視窗進行一視窗化來針對該中間信號或該側邊信號產生經視窗化樣本的隨後區塊, 其中該信號處理器包含一時間-頻譜轉換器用於轉換該等時間-隨後區塊以獲得頻譜值之隨後區塊;及 其中該信號解對準器係經組配以在頻譜值之該等區塊上使用該等窄帶對準參數上之該資訊及該寬帶對準參數上之該資訊進行該解對準。
- 如請求項21或27中任一項之設備, 其中該經編碼之信號包含多個預測增益或位準參數, 其中該信號處理器係經組配以使用該中間聲道之頻譜值及用於該等頻譜值相關聯的一頻帶的一預測增益或位準參數計算該左聲道及該右聲道之頻譜值,及 藉使用該經解碼之側邊信號的頻譜值。
- 如請求項21或28中任一項之設備, 其中該信號處理器係經組配以使用針對該等頻譜值相關聯的一頻帶的一立體聲填充參數計算該等左及右聲道之頻譜值。
- 如請求項21或29中任一項之設備, 其中該信號解對準器或該信號處理器係經組配以使用一定標因數針對一頻帶進行一能定標,其中該定標因數取決於該經解碼之該中間信號及該經解碼之該側邊信號之能,及 其中該定標因數係受限於至多2.0與至少0.5間。
- 如請求項28或30中任一項之設備, 其中該信號處理器係經組配以使用自該位準參數推衍的一增益因數計算該左聲道及該右聲道之該等頻譜值,及其中該增益因數係使用一非線性函數自該位準參數推衍得。
- 如請求項21或31中任一項之設備, 其中該信號解對準器係經組配以針對使用該第一及該第二聲道之頻譜值的一旋轉的該等聲道使用該窄帶對準參數上之該資訊而解對準該等經解碼之第一及第二聲道之一頻帶,其中具有一較高振幅之一個聲道的該頻譜值被旋轉比具有一較低振幅之另一個聲道的該頻帶之頻譜值更少。
- 一種用於解碼包含一經編碼之中間信號、一經編碼之側邊信號、一寬帶對準參數上之資訊、及複數窄帶對準參數上之資訊的一經編碼之多聲道信號之方法,其包含: 解碼該經編碼之中間信號以獲得一經解碼之中間信號及解碼該經編碼之側邊信號以獲得一經解碼之側邊信號; 自該經解碼之中間信號及該經解碼之側邊信號計算一經解碼之第一聲道及經解碼之第二聲道;及 使用該寬帶對準參數上之該資訊及該等複數窄帶對準參數上之該資訊解對準該經解碼之第一聲道及該經解碼之第二聲道以獲得一經解碼之多聲道信號。
- 一種電腦程式,用於當在一電腦或一處理器上跑時,進行如請求項19之方法或如請求項33之方法。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16152450 | 2016-01-22 | ||
??16152450.9 | 2016-01-22 | ||
EP16152453 | 2016-01-22 | ||
??16152453.3 | 2016-01-22 | ||
??PCT/EP2017/051205 | 2017-01-20 | ||
PCT/EP2017/051205 WO2017125558A1 (en) | 2016-01-22 | 2017-01-20 | Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201729180A true TW201729180A (zh) | 2017-08-16 |
TWI628651B TWI628651B (zh) | 2018-07-01 |
Family
ID=57838406
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106102409A TWI629681B (zh) | 2016-01-22 | 2017-01-23 | 使用頻譜域重新取樣來編碼或解碼多通道信號之裝置、方法及相關電腦程式 |
TW106102410A TWI643487B (zh) | 2016-01-22 | 2017-01-23 | 使用訊框控制同步化技術來編碼或解碼多通道信號之裝置及方法 |
TW106102398A TWI628651B (zh) | 2016-01-22 | 2017-01-23 | 用於編碼或解碼多通道信號的設備及方法、以及相關實體儲存媒體及電腦程式 |
TW106102408A TWI653627B (zh) | 2016-01-22 | 2017-01-23 | 用以估計通道間時間差的裝置及方法與相關電腦程式 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106102409A TWI629681B (zh) | 2016-01-22 | 2017-01-23 | 使用頻譜域重新取樣來編碼或解碼多通道信號之裝置、方法及相關電腦程式 |
TW106102410A TWI643487B (zh) | 2016-01-22 | 2017-01-23 | 使用訊框控制同步化技術來編碼或解碼多通道信號之裝置及方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106102408A TWI653627B (zh) | 2016-01-22 | 2017-01-23 | 用以估計通道間時間差的裝置及方法與相關電腦程式 |
Country Status (20)
Country | Link |
---|---|
US (7) | US10535356B2 (zh) |
EP (5) | EP3405951B1 (zh) |
JP (10) | JP6412292B2 (zh) |
KR (4) | KR102230727B1 (zh) |
CN (6) | CN107710323B (zh) |
AU (5) | AU2017208580B2 (zh) |
BR (4) | BR112017025314A2 (zh) |
CA (4) | CA3011914C (zh) |
ES (4) | ES2727462T3 (zh) |
HK (1) | HK1244584B (zh) |
MX (4) | MX2018008887A (zh) |
MY (4) | MY189205A (zh) |
PL (4) | PL3284087T3 (zh) |
PT (3) | PT3405949T (zh) |
RU (4) | RU2705007C1 (zh) |
SG (3) | SG11201806241QA (zh) |
TR (1) | TR201906475T4 (zh) |
TW (4) | TWI629681B (zh) |
WO (4) | WO2017125559A1 (zh) |
ZA (3) | ZA201804625B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI760593B (zh) * | 2018-02-01 | 2022-04-11 | 弗勞恩霍夫爾協會 | 使用混成式編碼器/解碼器空間分析之音訊場景編碼器、音訊場景解碼器及相關方法 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9773505B2 (en) * | 2008-09-18 | 2017-09-26 | Electronics And Telecommunications Research Institute | Encoding apparatus and decoding apparatus for transforming between modified discrete cosine transform-based coder and different coder |
EP3405951B1 (en) | 2016-01-22 | 2019-11-13 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
BR112019009315A2 (pt) | 2016-11-08 | 2019-07-30 | Fraunhofer Ges Forschung | aparelho e método para mixagem de redução ou mixagem de aumento de um sinal de múltiplos canais com o uso de compensação de fase |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
TWI708243B (zh) * | 2018-03-19 | 2020-10-21 | 中央研究院 | 於分散式語音辨識中基於小波轉換之語音特徵壓縮及重建系統與方法 |
ES2909343T3 (es) * | 2018-04-05 | 2022-05-06 | Fraunhofer Ges Forschung | Aparato, método o programa informático para estimar una diferencia de tiempo entre canales |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
EP3588495A1 (en) * | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
WO2020009082A1 (ja) * | 2018-07-03 | 2020-01-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置及び符号化方法 |
JP7092048B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 多地点制御方法、装置及びプログラム |
EP3719799A1 (en) | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
CN110459205B (zh) * | 2019-09-24 | 2022-04-12 | 京东科技控股股份有限公司 | 语音识别方法及装置、计算机可存储介质 |
CN110740416B (zh) * | 2019-09-27 | 2021-04-06 | 广州励丰文化科技股份有限公司 | 一种音频信号处理方法及装置 |
US20220156217A1 (en) * | 2019-11-22 | 2022-05-19 | Stmicroelectronics (Rousset) Sas | Method for managing the operation of a system on chip, and corresponding system on chip |
CN110954866B (zh) * | 2019-11-22 | 2022-04-22 | 达闼机器人有限公司 | 声源定位方法、电子设备及存储介质 |
CN111131917B (zh) * | 2019-12-26 | 2021-12-28 | 国微集团(深圳)有限公司 | 音频频谱实时同步方法、播放装置 |
TWI750565B (zh) * | 2020-01-15 | 2021-12-21 | 原相科技股份有限公司 | 真無線多聲道揚聲裝置及其多音源發聲之方法 |
CN111402906B (zh) * | 2020-03-06 | 2024-05-14 | 深圳前海微众银行股份有限公司 | 语音解码方法、装置、引擎及存储介质 |
US11276388B2 (en) * | 2020-03-31 | 2022-03-15 | Nuvoton Technology Corporation | Beamforming system based on delay distribution model using high frequency phase difference |
CN111525912B (zh) * | 2020-04-03 | 2023-09-19 | 安徽白鹭电子科技有限公司 | 一种数字信号的任意重采样方法及系统 |
CN113223503B (zh) * | 2020-04-29 | 2022-06-14 | 浙江大学 | 一种基于测试反馈的核心训练语音选择方法 |
WO2021260826A1 (ja) * | 2020-06-24 | 2021-12-30 | 日本電信電話株式会社 | 音信号復号方法、音信号復号装置、プログラム及び記録媒体 |
CN115917644A (zh) * | 2020-06-24 | 2023-04-04 | 日本电信电话株式会社 | 声音信号编码方法、声音信号编码装置、程序以及记录介质 |
AU2021317755B2 (en) * | 2020-07-30 | 2023-11-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for encoding an audio signal or for decoding an encoded audio scene |
MX2023003963A (es) | 2020-10-09 | 2023-05-25 | Fraunhofer Ges Forschung | Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando un suavizado de parametro. |
CA3194876A1 (en) | 2020-10-09 | 2022-04-14 | Franz REUTELHUBER | Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension |
JP2023549038A (ja) | 2020-10-09 | 2023-11-22 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | パラメータ変換を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム |
US20240064483A1 (en) * | 2021-01-18 | 2024-02-22 | Panasonic Intellectual Property Corporation Of America | Signal processing device and signal processing method |
WO2022262960A1 (en) | 2021-06-15 | 2022-12-22 | Telefonaktiebolaget Lm Ericsson (Publ) | Improved stability of inter-channel time difference (itd) estimator for coincident stereo capture |
CN113435313A (zh) * | 2021-06-23 | 2021-09-24 | 中国电子科技集团公司第二十九研究所 | 一种基于dft的脉冲频域特征提取方法 |
WO2023153228A1 (ja) * | 2022-02-08 | 2023-08-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、及び、符号化方法 |
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
WO2024053353A1 (ja) * | 2022-09-08 | 2024-03-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 信号処理装置、及び、信号処理方法 |
WO2024074302A1 (en) | 2022-10-05 | 2024-04-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Coherence calculation for stereo discontinuous transmission (dtx) |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
Family Cites Families (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
US5526359A (en) * | 1993-12-30 | 1996-06-11 | Dsc Communications Corporation | Integrated multi-fabric digital cross-connect timing architecture |
US6073100A (en) * | 1997-03-31 | 2000-06-06 | Goodridge, Jr.; Alan G | Method and apparatus for synthesizing signals using transform-domain match-output extension |
US5903872A (en) | 1997-10-17 | 1999-05-11 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
US6549884B1 (en) * | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
EP1199711A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
FI119955B (fi) * | 2001-06-21 | 2009-05-15 | Nokia Corp | Menetelmä, kooderi ja laite puheenkoodaukseen synteesi-analyysi puhekoodereissa |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
WO2003107591A1 (en) * | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
CN100481735C (zh) * | 2002-08-21 | 2009-04-22 | 广州广晟数码技术有限公司 | 用于从编码后的音频数据流中解码重建多声道音频信号的解码方法 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
EP1769491B1 (en) | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US20070055510A1 (en) | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
KR100712409B1 (ko) * | 2005-07-28 | 2007-04-27 | 한국전자통신연구원 | 벡터의 차원변환 방법 |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
WO2007052612A1 (ja) * | 2005-10-31 | 2007-05-10 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置およびステレオ信号予測方法 |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
MX2008010836A (es) * | 2006-02-24 | 2008-11-26 | France Telecom | Un metodo para codificacion binaria de indices de cuantificacion de una envoltura de señal, un metodo para descodificar una envoltura de señal, y modulos de codificacion y descodificacion correspondiente. |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
CN101903944B (zh) * | 2007-12-18 | 2013-04-03 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
CN101267362B (zh) * | 2008-05-16 | 2010-11-17 | 亿阳信通股份有限公司 | 一种性能指标值正常波动范围的动态确定方法及其装置 |
JP5122681B2 (ja) * | 2008-05-23 | 2013-01-16 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ |
US8355921B2 (en) * | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101400535B1 (ko) * | 2008-07-11 | 2014-05-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩 |
MX2011000361A (es) * | 2008-07-11 | 2011-02-25 | Ten Forschung Ev Fraunhofer | Un aparato y un metodo para generar datos de salida por ampliacion de ancho de banda. |
ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
US8504378B2 (en) * | 2009-01-22 | 2013-08-06 | Panasonic Corporation | Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
RU2542668C2 (ru) * | 2009-01-28 | 2015-02-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Звуковое кодирующее устройство, звуковой декодер, кодированная звуковая информация, способы кодирования и декодирования звукового сигнала и компьютерная программа |
KR101433701B1 (ko) | 2009-03-17 | 2014-08-28 | 돌비 인터네셔널 에이비 | 적응형으로 선택가능한 좌/우 또는 미드/사이드 스테레오 코딩과 파라메트릭 스테레오 코딩의 조합에 기초한 진보된 스테레오 코딩 |
US9111527B2 (en) * | 2009-05-20 | 2015-08-18 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, and methods therefor |
CN101989429B (zh) * | 2009-07-31 | 2012-02-01 | 华为技术有限公司 | 转码方法、装置、设备以及系统 |
JP5031006B2 (ja) | 2009-09-04 | 2012-09-19 | パナソニック株式会社 | スケーラブル復号化装置及びスケーラブル復号化方法 |
JP5405373B2 (ja) * | 2010-03-26 | 2014-02-05 | 富士フイルム株式会社 | 電子内視鏡システム |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
RU2559899C2 (ru) * | 2010-04-09 | 2015-08-20 | Долби Интернешнл Аб | Стереофоническое кодирование на основе mdct с комплексным предсказанием |
PL3779975T3 (pl) | 2010-04-13 | 2023-12-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i powiązane sposoby przetwarzania wielokanałowych sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji |
US8463414B2 (en) * | 2010-08-09 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus for estimating a parameter for low bit rate stereo transmission |
AU2011288406B2 (en) * | 2010-08-12 | 2014-07-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Resampling output signals of QMF based audio codecs |
BR112013008463B8 (pt) | 2010-10-06 | 2022-04-05 | Fraunhofer Ges Zur Foerderung Der Angewandten Forschubg E V | Aparelho e método para processar um sinal de áudio e para prover uma granularidade temporal maior para um codec de fala e áudio unificado combinado (usac) |
FR2966634A1 (fr) | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
WO2012105885A1 (en) * | 2011-02-02 | 2012-08-09 | Telefonaktiebolaget L M Ericsson (Publ) | Determining the inter-channel time difference of a multi-channel audio signal |
DK2671221T3 (en) * | 2011-02-03 | 2017-05-01 | ERICSSON TELEFON AB L M (publ) | DETERMINING THE INTERCHANNEL TIME DIFFERENCE FOR A MULTI-CHANNEL SIGNAL |
MY160265A (en) * | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion |
BR112013020482B1 (pt) * | 2011-02-14 | 2021-02-23 | Fraunhofer Ges Forschung | aparelho e método para processar um sinal de áudio decodificado em um domínio espectral |
EP2710592B1 (en) * | 2011-07-15 | 2017-11-22 | Huawei Technologies Co., Ltd. | Method and apparatus for processing a multi-channel audio signal |
EP2600343A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
EP3288033B1 (en) | 2012-02-23 | 2019-04-10 | Dolby International AB | Methods and systems for efficient recovery of high frequency audio content |
CN103366749B (zh) * | 2012-03-28 | 2016-01-27 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366751B (zh) * | 2012-03-28 | 2015-10-14 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
EP2834813B1 (en) | 2012-04-05 | 2015-09-30 | Huawei Technologies Co., Ltd. | Multi-channel audio encoder and method for encoding a multi-channel audio signal |
KR101621287B1 (ko) | 2012-04-05 | 2016-05-16 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 다채널 오디오 신호 및 다채널 오디오 인코더를 위한 인코딩 파라미터를 결정하는 방법 |
KR20150012146A (ko) * | 2012-07-24 | 2015-02-03 | 삼성전자주식회사 | 오디오 데이터를 처리하기 위한 방법 및 장치 |
WO2014043476A1 (en) * | 2012-09-14 | 2014-03-20 | Dolby Laboratories Licensing Corporation | Multi-channel audio content analysis based upmix detection |
EP2898506B1 (en) * | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
CN104885383B (zh) * | 2012-12-27 | 2017-08-29 | 松下电器(美国)知识产权公司 | 影像显示方法 |
WO2014128194A1 (en) | 2013-02-20 | 2014-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
EP2959479B1 (en) * | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830064A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
CN107113147B (zh) * | 2014-12-31 | 2020-11-06 | Lg电子株式会社 | 在无线通信系统中分配资源的方法和设备 |
WO2016108655A1 (ko) * | 2014-12-31 | 2016-07-07 | 한국전자통신연구원 | 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치 |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
EP3405951B1 (en) * | 2016-01-22 | 2019-11-13 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
US10224042B2 (en) | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
-
2017
- 2017-01-20 EP EP17701669.8A patent/EP3405951B1/en active Active
- 2017-01-20 AU AU2017208580A patent/AU2017208580B2/en active Active
- 2017-01-20 JP JP2018510479A patent/JP6412292B2/ja active Active
- 2017-01-20 BR BR112017025314-3A patent/BR112017025314A2/pt active Search and Examination
- 2017-01-20 WO PCT/EP2017/051208 patent/WO2017125559A1/en active Application Filing
- 2017-01-20 AU AU2017208575A patent/AU2017208575B2/en active Active
- 2017-01-20 KR KR1020187024171A patent/KR102230727B1/ko active IP Right Grant
- 2017-01-20 ES ES17700706T patent/ES2727462T3/es active Active
- 2017-01-20 MX MX2018008887A patent/MX2018008887A/es active IP Right Grant
- 2017-01-20 CA CA3011914A patent/CA3011914C/en active Active
- 2017-01-20 RU RU2018130151A patent/RU2705007C1/ru active
- 2017-01-20 AU AU2017208576A patent/AU2017208576B2/en active Active
- 2017-01-20 RU RU2018130272A patent/RU2711513C1/ru active
- 2017-01-20 PL PL17700706T patent/PL3284087T3/pl unknown
- 2017-01-20 CA CA3011915A patent/CA3011915C/en active Active
- 2017-01-20 PL PL19157001.9T patent/PL3503097T3/pl unknown
- 2017-01-20 TR TR2019/06475T patent/TR201906475T4/tr unknown
- 2017-01-20 RU RU2018130275A patent/RU2704733C1/ru active
- 2017-01-20 EP EP17700706.9A patent/EP3284087B1/en active Active
- 2017-01-20 ES ES17701669T patent/ES2768052T3/es active Active
- 2017-01-20 KR KR1020187024233A patent/KR102343973B1/ko active IP Right Grant
- 2017-01-20 WO PCT/EP2017/051212 patent/WO2017125562A1/en active Application Filing
- 2017-01-20 MX MX2018008890A patent/MX2018008890A/es active IP Right Grant
- 2017-01-20 ES ES17700707T patent/ES2773794T3/es active Active
- 2017-01-20 EP EP17700705.1A patent/EP3405948B1/en active Active
- 2017-01-20 CN CN201780002248.3A patent/CN107710323B/zh active Active
- 2017-01-20 MY MYPI2018001321A patent/MY189205A/en unknown
- 2017-01-20 ES ES17700705T patent/ES2790404T3/es active Active
- 2017-01-20 JP JP2018538601A patent/JP6626581B2/ja active Active
- 2017-01-20 CA CA3012159A patent/CA3012159C/en active Active
- 2017-01-20 JP JP2018538602A patent/JP6641018B2/ja active Active
- 2017-01-20 EP EP17700707.7A patent/EP3405949B1/en active Active
- 2017-01-20 MY MYPI2017001705A patent/MY181992A/en unknown
- 2017-01-20 CN CN201780019674.8A patent/CN108885879B/zh active Active
- 2017-01-20 CN CN202210761486.5A patent/CN115148215A/zh active Pending
- 2017-01-20 PL PL17701669T patent/PL3405951T3/pl unknown
- 2017-01-20 BR BR112018014799-0A patent/BR112018014799A2/pt active Search and Examination
- 2017-01-20 PT PT177007077T patent/PT3405949T/pt unknown
- 2017-01-20 PL PL17700707T patent/PL3405949T3/pl unknown
- 2017-01-20 CN CN201780018898.7A patent/CN108885877B/zh active Active
- 2017-01-20 PT PT177016698T patent/PT3405951T/pt unknown
- 2017-01-20 JP JP2018538633A patent/JP6730438B2/ja active Active
- 2017-01-20 SG SG11201806241QA patent/SG11201806241QA/en unknown
- 2017-01-20 WO PCT/EP2017/051205 patent/WO2017125558A1/en active Application Filing
- 2017-01-20 MY MYPI2018001318A patent/MY189223A/en unknown
- 2017-01-20 WO PCT/EP2017/051214 patent/WO2017125563A1/en active Application Filing
- 2017-01-20 CN CN201780018903.4A patent/CN108780649B/zh active Active
- 2017-01-20 BR BR112018014689-7A patent/BR112018014689A2/pt active Search and Examination
- 2017-01-20 BR BR112018014916-0A patent/BR112018014916A2/pt active Search and Examination
- 2017-01-20 SG SG11201806216YA patent/SG11201806216YA/en unknown
- 2017-01-20 MY MYPI2018001323A patent/MY196436A/en unknown
- 2017-01-20 SG SG11201806246UA patent/SG11201806246UA/en unknown
- 2017-01-20 PT PT17700706T patent/PT3284087T/pt unknown
- 2017-01-20 AU AU2017208579A patent/AU2017208579B2/en active Active
- 2017-01-20 MX MX2017015009A patent/MX371224B/es active IP Right Grant
- 2017-01-20 MX MX2018008889A patent/MX2018008889A/es active IP Right Grant
- 2017-01-20 KR KR1020177037759A patent/KR102083200B1/ko active IP Right Grant
- 2017-01-20 RU RU2017145250A patent/RU2693648C2/ru active
- 2017-01-20 CN CN202311130088.4A patent/CN117238300A/zh active Pending
- 2017-01-20 KR KR1020187024177A patent/KR102219752B1/ko active IP Right Grant
- 2017-01-20 CA CA2987808A patent/CA2987808C/en active Active
- 2017-01-20 EP EP19157001.9A patent/EP3503097B1/en active Active
- 2017-01-23 TW TW106102409A patent/TWI629681B/zh active
- 2017-01-23 TW TW106102410A patent/TWI643487B/zh active
- 2017-01-23 TW TW106102398A patent/TWI628651B/zh active
- 2017-01-23 TW TW106102408A patent/TWI653627B/zh active
- 2017-11-22 US US15/821,108 patent/US10535356B2/en active Active
-
2018
- 2018-03-20 HK HK18103855.8A patent/HK1244584B/zh unknown
- 2018-07-11 ZA ZA2018/04625A patent/ZA201804625B/en unknown
- 2018-07-12 US US16/034,206 patent/US10861468B2/en active Active
- 2018-07-13 US US16/035,456 patent/US10706861B2/en active Active
- 2018-07-13 US US16/035,471 patent/US10424309B2/en active Active
- 2018-07-17 ZA ZA2018/04776A patent/ZA201804776B/en unknown
- 2018-07-20 ZA ZA2018/04910A patent/ZA201804910B/en unknown
- 2018-09-27 JP JP2018181254A patent/JP6856595B2/ja active Active
-
2019
- 2019-04-04 US US16/375,437 patent/US10854211B2/en active Active
- 2019-08-09 AU AU2019213424A patent/AU2019213424B8/en active Active
- 2019-12-26 JP JP2019235359A patent/JP6859423B2/ja active Active
-
2020
- 2020-02-19 US US16/795,548 patent/US11410664B2/en active Active
- 2020-07-02 JP JP2020114535A patent/JP7053725B2/ja active Active
-
2021
- 2021-03-18 JP JP2021044222A patent/JP7258935B2/ja active Active
- 2021-03-25 JP JP2021051011A patent/JP7161564B2/ja active Active
-
2022
- 2022-03-31 JP JP2022057862A patent/JP7270096B2/ja active Active
- 2022-05-23 US US17/751,303 patent/US11887609B2/en active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI760593B (zh) * | 2018-02-01 | 2022-04-11 | 弗勞恩霍夫爾協會 | 使用混成式編碼器/解碼器空間分析之音訊場景編碼器、音訊場景解碼器及相關方法 |
US11361778B2 (en) | 2018-02-01 | 2022-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio scene encoder, audio scene decoder and related methods using hybrid encoder-decoder spatial analysis |
US11854560B2 (en) | 2018-02-01 | 2023-12-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio scene encoder, audio scene decoder and related methods using hybrid encoder-decoder spatial analysis |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI628651B (zh) | 用於編碼或解碼多通道信號的設備及方法、以及相關實體儲存媒體及電腦程式 | |
TWI714046B (zh) | 用於估計聲道間時間差的裝置、方法或計算機程式 | |
JP2019049745A (ja) | 復号装置および方法、並びにプログラム |