TW201637000A - 用於編碼多聲道信號的音訊編碼器及用於解碼經編碼音訊信號的音訊解碼器(二) - Google Patents

用於編碼多聲道信號的音訊編碼器及用於解碼經編碼音訊信號的音訊解碼器(二) Download PDF

Info

Publication number
TW201637000A
TW201637000A TW105106306A TW105106306A TW201637000A TW 201637000 A TW201637000 A TW 201637000A TW 105106306 A TW105106306 A TW 105106306A TW 105106306 A TW105106306 A TW 105106306A TW 201637000 A TW201637000 A TW 201637000A
Authority
TW
Taiwan
Prior art keywords
signal
channel
decoder
audio
encoder
Prior art date
Application number
TW105106306A
Other languages
English (en)
Other versions
TWI613643B (zh
Inventor
薩斯洽 迪斯曲
古拉米 福契斯
艾曼紐 拉斐里
克里斯汀 努克姆
康斯坦汀 史密特
康瑞德 班恩朵夫
安德烈斯 尼德梅耶
班傑明 休伯特
雷夫 蓋葛
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201637000A publication Critical patent/TW201637000A/zh
Application granted granted Critical
Publication of TWI613643B publication Critical patent/TWI613643B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

展示用於編碼一多聲道信號之音訊編碼器。該音訊編碼器包含:一降頻混頻器,其用於降混該多聲道信號以獲得一降混信號;一線性預測域核心編碼器,其用於編碼該降混信號,其中該降混信號具有一低頻帶及一高頻帶,其中該線性預測域核心編碼器經組配以施加一頻寬擴展處理以用於參數化編碼該高頻帶;一濾波器組,其用於產生該多聲道信號之一頻譜表示;以及一聯合多聲道編碼器,其經組配以處理包含該多聲道信號之該低頻帶及該高頻帶的該頻譜表示以產生多聲道資訊。

Description

用於編碼多聲道信號的音訊編碼器及用於解碼經編碼音訊信號的音訊解碼器(二) 發明領域
本發明係關於用於編碼多聲道音訊信號之音訊編碼器及用於解碼經編碼音訊信號之音訊解碼器。實施例係關於LPD模式中之多聲道寫碼,其使用用於多聲道處理之濾波器組(DFT),該濾波器組並非頻寬擴展中所使用之濾波器組。
發明背景
出於資料減少之目的以用於音訊信號之高效儲存或傳輸的此等信號之感知寫碼係廣泛使用之實務。詳言之,當最高效率將達成時,使用緊密適合於信號輸入特性的編碼解碼器。一個實例為MPEG-D USAC核心編碼解碼器,其可經組配以主要對語音信號使用代數碼激勵線性預測(ACELP,Algebraic Code-Excited Linear Prediction)寫碼、對背景雜訊及混頻信號使用變換寫碼激勵(TCX, Transform Coded Excitation)以及對音樂內容使用進階音訊寫碼(AAC,Advanced Audio Coding)。所有三個內部編碼解碼器組態可回應於信號內容而以信號自適應性方式立即切換。
此外,使用聯合多聲道寫碼技術(中間/側寫碼等)或為了最高效率而使用參數寫碼技術。參數寫碼技術基本上以再造感知相等音訊信號為目標,而非真實重建構給定波形。。實例包含雜訊填充、頻寬擴展以及空間音訊寫碼。
當在現有技術水平編碼解碼器中組合信號自適應性核心寫碼器與聯合多聲道寫碼或參數寫碼技術中任一者時,核心編碼解碼器經切換以匹配信號特性,但多聲道寫碼技術(諸如,M/S立體聲、空間音訊寫碼或參數立體聲)之選擇保持固定且獨立於信號特性。此等技術通常用以核心編碼解碼器以作為核心編碼器的預處理器及解碼器的後處理器,該等處理器兩者不知道編碼解碼器之實際選擇。
另一方面,選擇參數寫碼技術用於頻寬擴展有時係信號相依地做出。舉例而言,應用於時域中之技術對於語音信號更有效率,而頻域處理對於其他信號更相關。在此情況下,所採用的多聲道寫碼技術必須與兩個類型之頻寬擴展技術相容。
現有技術水平中之相關話題包含:
作為MPEG-D USAC核心編碼解碼器的預處理器/後處理器之PS及MPS
MPEG-D USAC標準
MPEG-H 3D音訊標準
在MPEG-D USAC中,描述可切換核心寫碼器。然而,在USAC中,多聲道寫碼技術經定義為整個核心寫碼器所共用之固定選擇,與寫碼原理之內部切換為ACELP或TCX(「LPD」)或AAC(「FD」)無關。因此,若需要切換式核心編碼解碼器組態,則編碼解碼器限於針對整個信號始終使用參數多聲道寫碼(parametric multichannel coding,PS)。然而,為了寫碼(例如)音樂信號,實際上使用聯合立體聲寫碼將更適當,聯合立體聲寫碼可根據頻帶及根據訊框在L/R(左/右)與M/S(中間/側)方案之間動態地切換。
因此,需要經改良之方法。
發明概要
本發明之目標為提供用於處理音訊信號之經改良概念。此目標係藉由獨立請求項之標的物解決。
本發明係基於使用多聲道寫碼器之(時域)參數編碼器對參數多聲道音訊寫碼有利的發現。多聲道寫碼器可為多聲道殘餘寫碼器,其與用於每一聲道之單獨寫碼相比可減小用於傳輸寫碼參數之頻寬。此可(例如)結合頻域聯合多聲道音訊寫碼器有利地使用。時域及頻域聯合多聲道寫碼技術可組合,以使得(例如)基於訊框之決策可引導當前訊框至基於時間或基於頻率之編碼週期。換言之,實施例展示一經改良概念,其用於將使用聯合多聲道寫碼及參數空間音訊寫碼之可切換核心編碼解碼器組合成完全可切換 的感知編碼解碼器,其允許視核心寫碼器之選擇而使用不同的多聲道寫碼技術。此概念係有利的,此係因為,與已經存在之方法相比,實施例展示多聲道寫碼技術,該技術可與核心寫碼器一起立即切換且因此緊密匹配於且適合於核心寫碼器之選擇。因此,可避免因多聲道寫碼技術之固定選擇所致而出現的所描繪問題。此外,啟用給定核心寫碼器及其相關聯且經調適之多聲道寫碼技術的完全可切換組合。舉例而言,此寫碼器(例如,使用L/R或M/S立體聲寫碼之AAC(進階音訊寫碼))能夠使用專用聯合立體聲或多聲道寫碼(例如,M/S立體聲)在頻域(FD)核心寫碼器中編碼音樂信號。此決策可分開地應用於每一音訊訊框中之每一頻帶。在(例如)語音信號之情況下,核心寫碼器可立即切換至線性預測性解碼(linear predictive decoding,LPD)核心寫碼器及其相關聯的不同技術(例如,參數立體聲寫碼技術)。
實施例展示對於單聲道LPD路徑而言唯一的立體聲處理,及基於立體聲信號之無縫切換方案,其組合立體聲FD路徑之輸出與來自LPD核心寫碼器及其專用立體聲寫碼之輸出。此情況係有利的,此係因為無偽訊的無縫編碼解碼器切換經啟用。
實施例係關於一種用於編碼一多聲道信號之編碼器。該編碼器包含一線性預測域編碼器及一頻域編碼器。此外,該編碼器包含一控制器,該控制器用於在該線性預測域編碼器與該頻域編碼器之間切換。此外,該線性預測域編碼器可包含:一降頻混頻器,其用於降混該多聲 道信號以獲得一降混信號;一線性預測域核心編碼器,其用於編碼該降混信號;以及一第一多聲道編碼器,其用於自該多聲道信號產生第一多聲道資訊。該頻域編碼器包含一第二聯合多聲道編碼器,該第二聯合多聲道編碼器用於自該多聲道信號產生第二多聲道資訊,其中該第二多聲道編碼器不同於該第一多聲道編碼器。該控制器經組配以使得該多聲道信號之一部分係由該線性預測域編碼器之一經編碼訊框表示或由該頻域編碼器之一經編碼訊框表示。該線性預測域編碼器可包含一ACELP核心編碼器及(例如)一參數立體聲寫碼演算法,以作為第一聯合多聲道編碼器。該頻域編碼器可包含(例如)一AAC核心編碼器,其使用(例如)L/R或M/S處理作為一第二聯合多聲道編碼器。該控制器可關於(例如)訊框特性(例如,語音或音樂)而分析多聲道信號,且用以針對每一訊框或訊框序列或該多聲道音訊信號之一部分,決定該線性預測域編碼器或該頻域編碼器是否應被用於編碼多聲道音訊信號之此部分。
實施例進一步展示一種用於解碼一經編碼音訊信號之音訊解碼器。該音訊解碼器包含一線性預測域解碼器及一頻域解碼器。此外,該音訊解碼器包含:一第一聯合多聲道解碼器,其用於使用該線性預測域解碼器之一輸出及使用一多聲道資訊而產生一第一多聲道表示;以及一第二多聲道解碼器,其用於使用該頻域解碼器之一輸出及一第二多聲道資訊而產生一第二多聲道表示。此外,該音訊解碼器包含一第一組合器,其用於組合該第一多聲道表 示及該第二多聲道表示以獲得一經解碼音訊信號。該組合器可在該第一多聲道表示為(例如)一線性預測多聲道音訊信號與該第二多聲道表示為(例如)一頻域經解碼多聲道音訊信號之間執行無縫無假影切換。
實施例展示可切換音訊寫碼器內的LPD路徑中之ACELP/TCX寫碼與頻域路徑中之專用立體聲寫碼及獨立AAC立體聲寫碼的組合。此外,實施例展示LPD與FD立體聲之間的無縫瞬時切換,其中另外實施例係關於用於不同信號內容類型的聯合多聲道寫碼之獨立選擇。舉例而言,針對主要使用LPD路徑寫碼之語音,使用參數立體聲,而對於在FD路徑中經寫碼之音樂,使用更自適應性立體聲寫碼,其可根據頻帶及根據訊框在L/R方案與M/S方案之間動態地切換。
根據實施例,針對主要使用LPD路徑來寫碼且通常位於立體聲影像之中心的語音,簡單參數立體聲係適當的,而在FD路徑中經寫碼之音樂通常具有更複雜的空間分佈且可獲益於更自適應性立體聲寫碼,其可根據頻帶及根據訊框在L/R方案與M/S方案之間動態地切換。
另外實施例展示該音訊編碼器包含:一降頻混頻器(12),其用於降混該多聲道信號以獲得一降混信號;一線性預測域核心編碼器,其用於編碼該降混信號;一濾波器組,其用於產生該多聲道信號之一頻譜表示;以及聯合多聲道編碼器,其用於自該多聲道信號產生多聲道資訊。該降混信號具有一低頻帶及一高頻帶,其中該線性預測域核 心編碼器經組配以施加一頻寬擴展處理以用於參數化編碼該高頻帶。此外,該多聲道編碼器經組配以處理包含該多聲道信號之該低頻帶及該高頻帶的該頻譜表示。此情況係有利的,此係因為每一參數寫碼可將其最佳時間-頻率分解用於得到其參數。此可(例如)使用代數碼激勵線性預測(ACELP)加上時域頻寬擴展(TDBWE)及利用外部濾波器組之參數多聲道寫碼(例如DFT)之組合來實施,其中ACELP可編碼音訊信號之低頻帶且TDBWE可編碼音訊信號之高頻帶。此組合特別有效率,此係因為已知用於語音之最佳頻寬擴展應在時域中且多聲道處理應在頻域中。由於ACELP+TDBWE不具有任何時間-頻率轉換器,因此外部濾波器組或如DFT之變換係有利的。此外,多聲道處理器之訊框化可與ACELP中所使用之訊框化相同。即使多聲道處理係在頻域中進行,用於計算其參數或降混之時間解析度應理想地接近於或甚至等於ACELP之訊框化。
所描述實施例係有益的,此係因為可應用用於不同信號內容類型之聯合多聲道寫碼的獨立選擇。
2、2'、2"‧‧‧音訊編碼器
4‧‧‧多聲道音訊信號/時域信號
4a‧‧‧多聲道信號之第一聲道
4b‧‧‧多聲道信號之第二聲道
6‧‧‧線性預測域編碼器
8‧‧‧頻域編碼器/FD路徑
10‧‧‧控制器
12‧‧‧降頻混頻器/降混計算
14‧‧‧降混信號
16‧‧‧線性預測域核心編碼器/LPD路徑
18‧‧‧第一聯合多聲道編碼器
20‧‧‧第一多聲道資訊/LPD立體 聲參數
22‧‧‧第二聯合多聲道編碼器
24‧‧‧第二多聲道資訊
26‧‧‧經編碼降混信號
28a、28b‧‧‧控制信號
30‧‧‧ACELP處理器
32‧‧‧TCX處理器
34‧‧‧經降頻取樣之降混信號
35‧‧‧降頻取樣器
36、126‧‧‧時域頻寬擴展處理器
38‧‧‧經參數化編碼之頻帶
40‧‧‧第一時間-頻率轉換器
42‧‧‧第一參數產生器
44‧‧‧第一量化器編碼器
46‧‧‧第一頻帶集合之第一參數表示
48‧‧‧第二頻帶集合的經量化之經編碼頻譜線之第一集合
50‧‧‧線性預測域解碼器
52‧‧‧經ACELP處理的經降頻取樣之降混信號
54‧‧‧經編碼且經解碼之降混信號
56‧‧‧多聲道殘餘寫碼器
58‧‧‧多聲道殘餘信號
60‧‧‧聯合編碼器側多聲道解碼器
62‧‧‧差處理器
64‧‧‧經解碼之多聲道信號
66‧‧‧第二時間-頻率轉換器
68‧‧‧第二參數產生器
70‧‧‧第二量化器編碼器
72a、72b‧‧‧頻譜表示
74‧‧‧第一頻帶集合
76‧‧‧第二頻帶集合
78‧‧‧第二頻帶集合之第二參數表示
80‧‧‧第一頻帶集合的經量化且經編碼之表示
82‧‧‧濾波器組/時間頻率轉換器
83‧‧‧多聲道音訊信號之參數表示
84a‧‧‧加權a
84b‧‧‧加權b
102、102'、102"‧‧‧音訊解碼器
103‧‧‧經編碼音訊信號
104‧‧‧線性預測域核心解碼器/LPD路徑
106‧‧‧頻域解碼器/FD路徑
108‧‧‧第一聯合多聲道解碼器
110‧‧‧第二多聲道解碼器
112‧‧‧第一組合器
114‧‧‧第一多聲道表示
116‧‧‧第二多聲道表示/時域信號
118‧‧‧經解碼音訊信號/最終輸出
120‧‧‧ACELP解碼器
122‧‧‧低頻帶合成器
124‧‧‧升頻取樣器
128‧‧‧第二組合器
130‧‧‧TCX解碼器
132‧‧‧智慧型間隙填充處理器/IGF模組
134‧‧‧全頻帶合成處理器
136‧‧‧交叉路徑/LP分析
138、148‧‧‧頻率-時間轉換器
140‧‧‧時域頻寬經擴展之高頻帶
142‧‧‧經解碼降混信號
144‧‧‧時間-頻率轉換器/分析濾波器組
145‧‧‧頻譜表示
146‧‧‧立體聲解碼器
150a‧‧‧第一聲道信號
150b‧‧‧第二聲道信號
152‧‧‧頻率-時間轉換器/濾波器組
800、900、1200、1300、2000、2100‧‧‧方法
805、810、815、905、910、915、920、925、1205、1210、1305、1310、2050、2100、2150、2200、2105、2110、2115、2120‧‧‧步驟
200a、200b‧‧‧停止視窗
202、218、220、222、234、236‧‧‧線
204、206、232‧‧‧訊框
208、226‧‧‧中間信號
210a、210b、210c、210d、212a、212b、212c、212d、238、240、244a、244b‧‧‧LPD立體聲視窗
214、216、241‧‧‧LPD分析視窗
224‧‧‧區域
228‧‧‧左聲道信號
230‧‧‧右聲道信號
242a、242b‧‧‧陡峭邊緣
246a、246b‧‧‧平面區段
250a‧‧‧左聲道
250b‧‧‧右聲道
300a、300b‧‧‧開始視窗
隨後將參看隨附圖式論述本發明之實施例,在該等圖式中:圖1展示用於編碼多聲道音訊信號之編碼器的示意性方塊圖;圖2展示根據一實施例之線性預測域編碼器的示意性方塊圖; 圖3展示根據一實施例之頻域編碼器的示意性方塊圖;圖4展示根據一實施例之音訊編碼器的示意性方塊圖;圖5a展示根據一實施例之主動式降頻混頻器的示意性方塊圖;圖5b展示根據一實施例之被動式降頻混頻器的示意性方塊圖;圖6展示用於解碼經編碼音訊信號之解碼器的示意性方塊圖;圖7展示根據一實施例之解碼器的示意性方塊圖;圖8展示編碼多聲道信號之方法的示意性方塊圖;圖9展示解碼經編碼音訊信號之方法的示意性方塊圖;圖10展示根據另一態樣之用於編碼多聲道信號之編碼器的示意性方塊圖;圖11展示根據另一態樣之用於解碼經編碼音訊信號之解碼器的示意性方塊圖;圖12展示根據另一態樣之用於編碼多聲道信號之音訊編碼方法的示意性方塊圖;圖13展示根據另一態樣之解碼經編碼音訊信號之方法的示意性方塊圖;圖14展示自頻域編碼至LPD編碼之無縫切換的示意性時序圖;圖15展示自頻域解碼至LPD域解碼之無縫切換的示意性時序圖;圖16展示自LPD編碼至頻域編碼之無縫切換的示意性 時序圖;圖17展示自LPD解碼至頻域解碼之無縫切換的示意性時序圖;圖18展示根據另一態樣之用於編碼多聲道信號之編碼器的示意性方塊圖;圖19展示根據另一態樣之用於解碼經編碼音訊信號之解碼器的示意性方塊圖;圖20展示根據另一態樣之用於編碼多聲道信號之音訊編碼方法的示意性方塊圖;圖21展示根據另一態樣之解碼經編碼音訊信號之方法的示意性方塊圖。在下文中,將更詳細地描述本發明之實施例。各別圖式中所示的具有相同或類似功能性之元件將與相同參考符號相關聯。
較佳實施例之詳細說明
圖1展示用於編碼多聲道音訊信號4之音訊編碼器2的示意性方塊圖。該音訊編碼器包含線性預測域編碼器6、頻域編碼器8以及用於在線性預測域編碼器6與頻域編碼器8之間切換的控制器10。該控制器可分析該多聲道信號且針對該多聲道信號之部分決定線性預測域編碼或頻域編碼是否有利。換言之,該控制器經組配以使得該多聲道信號之一部分係由該線性預測域編碼器之一經編碼訊框表示或由該頻域編碼器之一經編碼訊框表示。該線性預測域編碼 器包含降頻混頻器12,其用於降混多聲道信號4以獲得降混信號14。該線性預測域編碼器進一步包含用於編碼降混信號之線性預測域核心編碼器16,且此外,該線性預測域編碼器包含用於自多聲道信號4產生第一多聲道資訊20之第一聯合多聲道編碼器18,該第一多聲道資訊包含(例如)兩耳間位準差(interaural level difference,ILD)及/或兩耳間相位差(interaural phase difference,IPD)參數。該多聲道信號可為(例如)立體聲信號,其中該降頻混頻器將立體聲信號轉換為單聲道信號。該線性預測域核心編碼器可編碼單聲道信號,其中該第一聯合多聲道編碼器可產生經編碼單聲道信號之立體聲資訊以作為第一多聲道資訊。當與關於圖10及圖11所描述之另外態樣相比時,頻域編碼器及控制器係可選的。然而,為了時域編碼與頻域編碼之間的信號自適應性切換,使用頻域編碼器及控制器係有利的。
此外,頻域編碼器8包含第二聯合多聲道編碼器22,其用於自多聲道信號4產生第二多聲道資訊24,其中第二聯合多聲道編碼器22不同於第一多聲道編碼器18。然而,針對較佳藉由第二編碼器寫碼之信號,第二聯合多聲道處理器22獲得允許第二再現品質之第二多聲道資訊,第二再現品質高於藉由第一多聲道編碼器獲得之第一多聲道資訊之第一再現品質。
換言之,根據實施例,第一聯合多聲道編碼器18經組配以產生允許第一再現品質之第一多聲道資訊20,其中第二聯合多聲道編碼器22經組配以產生允許第二再現品 質之第二多聲道資訊24,其中第二再現品質高於第一再現品質。此情況至少與較佳藉由第二多聲道編碼器寫碼之信號(諸如,語音信號)相關。
因此,該第一多聲道編碼器可為參數聯合多聲道編碼器,其包含(例如)立體聲預測寫碼器、參數立體聲編碼器或基於旋轉之參數立體聲編碼器。此外,該第二聯合多聲道編碼器可為波形保持,諸如頻帶選擇性切換至中間/側或左/右立體聲寫碼器。如圖1中所描繪,經編碼降混信號26可傳輸至音訊解碼器且視情況伺服第一聯合多聲道處理器,在第一聯合多聲道處理器中,例如,經編碼降混信號可經解碼,且可計算在編碼之前及在解碼經編碼信號之後的來自多聲道信號之殘餘信號以改良解碼器側處之經編碼音訊信號的經解碼品質。此外,在判定用於多聲道信號之當前部分的合適編碼方案之後,控制器10可分別使用控制信號28a、28b來控制線性預測域編碼器及頻域編碼器。
圖2展示根據一實施例之線性預測域編碼器6的方塊圖。至線性預測域編碼器6之輸入為藉由降頻混頻器12降混之降混信號14。此外,該線性預測域編碼器包含ACELP處理器30及TCX處理器32。ACELP處理器30經組配以對經降頻取樣之降混信號34進行操作,降混信號可藉由降頻取樣器35降頻取樣。此外,時域頻寬擴展處理器36可參數化編碼降混信號14之一部分之頻帶,其自輸入至ACELP處理器30中的經降頻取樣之降混信號34移除。時域頻寬擴展處理器36可輸出降混信號14之一部分的經參數化編碼之頻帶 38。換言之,時域頻寬擴展處理器36可計算降混信號14之頻帶之參數表示,該降混信號可包含與降頻取樣器35之截止頻率相比較高的頻率。因此,降頻取樣器35可具有另外性質以將高於降頻取樣器之截止頻率的彼等頻帶提供至時域頻寬擴展處理器36,或將截止頻率提供至時域頻寬擴展(TD-BWE)處理器以使TD-BWE處理器36能夠計算用於降混信號14之正確部分的參數38。
此外,TCX處理器經組配以對降混信號進行操作,降混信號(例如)未經降頻取樣或以小於用於ACELP處理器之降頻取樣的程度經降頻取樣。當與輸入至ACELP處理器30的經降頻取樣之降混信號35相比時,可使用較高截止頻率對程度小於ACELP處理器之降頻取樣的降頻取樣進行降頻取樣,其中大量降混信號被提供至TCX處理器。TCX處理器可進一步包含第一時間-頻率轉換器40,諸如MDCT、DFT或DCT。TCX處理器32可進一步包含第一參數產生器42及第一量化器編碼器44。第一參數產生器42(例如,智慧型間隙填充(intelligent gap filling,IGF)演算法)可計算第一頻帶集合之第一參數表示46,其中第一量化器編碼器44(例如)使用TCX演算法來計算第二頻帶集合的經量化經編碼頻譜線之第一集合48。換言之,第一量化器編碼器可參數化編碼入埠信號之相關頻帶(諸如,音調頻帶),其中第一參數產生器將例如IGF演算法應用於入埠信號之剩餘頻帶以進一步減小經編碼音訊信號之頻寬。
線性預測域編碼器6可進一步包含線性預測域解 碼器50,其用於解碼降混信號14(例如,由經ACELP處理的經降頻取樣之降混信號52來表示)及/或第一頻帶集合之第一參數表示46及/或第二頻帶集合的經量化經編碼頻譜線之第一集合48。線性預測域解碼器50之輸出可為經編碼且經解碼之降混信號54。此信號54可輸入至多聲道殘餘寫碼器56,多聲道殘餘寫碼器可計算多聲道殘餘信號58且使用經編碼且經解碼之降混信號54來編碼多聲道殘餘信號,其中經編碼的多聲道殘餘信號表示使用第一多聲道資訊之經解碼多聲道表示與降混之前的多聲道信號之間的誤差。因此,多聲道殘餘寫碼器56可包含聯合編碼器側多聲道解碼器60及差處理器62。聯合編碼器側多聲道解碼器60可使用第一多聲道資訊20及經編碼且經解碼之降混信號54而產生經解碼多聲道信號,其中差處理器可形成經解碼多聲道信號64與降混之前的多聲道信號4之間的差異以獲得多聲道殘餘信號58。換言之,音訊編碼器內之聯合編碼器側多聲道解碼器可執行解碼操作,其有利地為在解碼器側上執行之相同解碼操作。因此,在聯合編碼器側多聲道解碼器中使用可在傳輸之後藉由音訊解碼器導出的第一聯合多聲道資訊,以用於解碼經編碼降混信號。差處理器62可計算經解碼聯合多聲道信號與原始多聲道信號4之間的差異。經編碼多聲道殘餘信號58可改良音訊解碼器之解碼品質,此係因為經解碼信號與原始信號之間的因(例如)參數編碼所致的差異可藉由瞭解此等兩個信號之間的差異來減小。此使第一聯合多聲道編碼器能夠以導出多聲道音訊信號之全頻 寬之多聲道資訊的方式操作。
此外,降混信號14可包含低頻帶及高頻帶,其中線性預測域編碼器6經組配以使用(例如)時域頻寬擴展處理器36來施加頻寬擴展處理以用於參數化編碼高頻帶,其中線性預測域解碼器6經組配以僅獲得表示降混信號14之低頻帶的低頻帶信號作為經編碼且經解碼之降混信號54,且其中經編碼多聲道殘餘信號僅具有在降混之前的多聲道信號之低頻帶內的頻率。換言之,頻寬擴展處理器可計算用於高於截止頻率之頻帶的頻寬擴展參數,其中ACELP處理器編碼低於截止頻率的頻率。解碼器因此經組配以基於經編碼低頻帶信號及頻寬參數38來重建構較高頻率。
根據另外實施例,多聲道殘餘寫碼器56可計算側信號,且其中降混信號為M/S多聲道音訊信號之對應中間信號。因此,多聲道殘餘寫碼器可計算並編碼經計算側信號(其可自藉由濾波器組82獲得之多聲道音訊信號之完全頻帶頻譜表示計算)與經編碼且經解碼之降混信號54的倍數之經預測側信號的差異,其中倍數可由成為多聲道資訊之部分的預測資訊表示。然而,降混信號僅包含低頻帶信號。因此,殘餘寫碼器可另外計算高頻帶之殘餘(或側)信號。此計算可(例如)藉由模擬時域頻寬擴展(如計算在線性預測域核心編碼器中所進行)或藉由預測側信號以作為經計算(完全頻帶)側信號與經計算(完全頻帶)中間信號之間的差異來執行,其中預測因數經組配以將兩個信號之間的差異減至最小。
圖3展示根據一實施例之頻域編碼器8的示意性方塊圖。頻域編碼器包含第二時間-頻率轉換器66、第二參數產生器68以及第二量化器編碼器70。第二時間-頻率轉換器66可將多聲道信號之第一聲道4a及多聲道信號之第二聲道4b轉換成頻譜表示72a、72b。第一聲道及第二聲道之頻譜表示72a、72b可經分析且各自分裂成第一頻帶集合74及第二頻帶集合76。因此,第二參數產生器68可產生第二頻帶集合76之第二參數表示78,其中第二量化器編碼器可產生第一頻帶集合74的經量化且經編碼之表示80。頻域編碼器或更具體言之第二時間-頻率轉換器66可針對第一聲道4a及第二聲道4b執行(例如)MDCT操作,其中第二參數產生器68可執行智慧型間隙填充演算法且第二量化器編碼器70可執行(例如)AAC操作。因此,如關於線性預測域編碼器已描述,頻域編碼器亦能夠以導出多聲道音訊信號之全頻寬之多聲道資訊的方式操作。
圖4展示根據一較佳實施例之音訊編碼器2的示意性方塊圖。LPD路徑16由含有「主動式或被動式DMX」降混計算12之聯合立體聲或多聲道編碼組成,降混計算指示LPD降混可為主動式(「頻率選擇性」)或被動式(「恆定混頻因數」),如圖5中所描繪。降混將另外由藉由TD-BWE模組或IGF模組中任一者支援的可切換單聲道ACELP/TCX核心來寫碼。應注意,ACELP對經降頻取樣之輸入音訊資料34進行操作。因切換所致的任何ACELP初始化可對經降頻取樣之TCX/IGF輸出執行。
由於ACELP不含有任何內部時間-頻率分解,因此LPD立體聲寫碼借助於LP寫碼之前的分析濾波器組82及LPD解碼之後的合成濾波器組來添加額外的複雜調變濾波器組。在該較佳實施例中,使用具有低重疊區域之過度取樣DFT。然而,在其他實施例中,可使用具有類似時間解析度之任何過度取樣之時間-頻率分解。接著可在頻域中計算立體聲參數。
參數立體聲寫碼係藉由「LPD立體聲參數寫碼」區塊18執行,該區塊將LPD立體聲參數20輸出至位元串流。視情況,隨後區塊「LPD立體聲殘餘寫碼」將向量量化之低通降混殘餘58添加至位元串流。
FD路徑8經組配以具有其自身的內部聯合立體聲或多聲道寫碼。關於聯合立體聲寫碼,該路徑再次使用其自身的臨界取樣及真實價值之濾波器組66,即(例如)MDCT。
提供至解碼器之信號可(例如)多工至單一位元串流。位元串流可包含經編碼降混信號26,該經編碼降混信號可進一步包含以下各者中的至少一者:經參數化編碼之時域頻寬經擴展頻帶38、經ACELP處理的經降頻取樣之降混信號52、第一多聲道資訊20、經編碼多聲道殘餘信號58、第一頻帶集合之第一參數表示46、第二頻帶集合之經量化經編碼頻譜線之第一集合48以及第二多聲道資訊24,該第二多聲道資訊包含第一頻帶集合的經量化且經編碼之表示80及第一頻帶集合之第二參數表示78。
實施例展示用於將可切換核心編碼解碼器、聯合多聲道寫碼以及參數空間音訊寫碼組合至完全可切換感知編碼解碼器中的經改良方法,其允許取決於核心寫碼器之選擇而使用不同多聲道寫碼技術。具體言之,在可切換音訊寫碼器內,組合原生頻率域立體聲寫碼與基於ACELP/TCX之線性預測性寫碼(其具有自身的專用獨立參數立體聲寫碼)。
圖5a及圖5b分別展示根據實施例之主動式降頻混頻器及被動式降頻混頻器。主動式降頻混頻器將(例如)時間頻率轉換器82用於將時域信號4變換成頻域信號而在頻域中操作。在降混之後,頻率-時間轉換(例如,IDFT)可將來自頻域之降混信號轉換成時域中之降混信號14。
圖5b展示根據一實施例之被動式降頻混頻器12。被動式降頻混頻器12包含加法器,其中第一聲道4a及第一聲道4b在分別使用權重a 84a及權重b 84b加權之後組合。此外,第一聲道對於4a及第二聲道4b在傳輸至LPD立體聲參數寫碼之前可輸入至時間-頻率轉換器82。
換言之,降頻混頻器經組配以將多聲道信號轉換成頻譜表示,且其中降混係使用頻譜表示或使用時域表示而執行,且其中第一多聲道編碼器經組配以使用頻譜表示來產生頻譜表示之個別頻帶的單獨第一多聲道資訊。
圖6展示根據一實施例之用於解碼經編碼音訊信號103之音訊解碼器102的示意性方塊圖。音訊解碼器102包含線性預測域解碼器104、頻域解碼器106、第一聯合多聲 道解碼器108、第二多聲道解碼器110以及第一組合器112。經編碼音訊信號103(其可為先前所描述的編碼器部分之經多工位元串流,諸如音訊信號之訊框)可由聯合多聲道解碼器108使用第一多聲道資訊20來解碼或由頻域解碼器106解碼,且由第二聯合多聲道解碼器110使用第二多聲道資訊24進行多聲道解碼。第一聯合多聲道解碼器可輸出第一多聲道表示114,且第二聯合多聲道解碼器110之輸出可為第二多聲道表示116。
換言之,第一聯合多聲道解碼器108使用線性預測域編碼器之輸出及使用第一多聲道資訊20而產生第一多聲道表示114。第二多聲道解碼器110使用頻域解碼器之輸出及第二多聲道資訊24而產生第二多聲道表示116。此外,第一組合器組合第一多聲道表示114及第二多聲道表示116(例如,基於訊框)以獲得經解碼音訊信號118。此外,第一聯合多聲道解碼器108可為參數聯合多聲道解碼器,其使用(例如)複雜預測、參數立體聲操作或旋轉操作。第二聯合多聲道解碼器110可為波形保持聯合多聲道解碼器,其使用(例如)頻帶選擇性切換至中間/側或左/右立體聲解碼演算法。
圖7展示根據另外實施例之解碼器102的示意性方塊圖。本文中,線性預測域解碼器102包含ACELP解碼器120、低頻帶合成器122、升頻取樣器124、時域頻寬擴展處理器126或第二組合器128,該第二組合器用於組合升頻取樣信號及頻寬經擴展信號。此外,線性預測域解碼器可包 含TCX解碼器132及智慧型間隙填充處理器132,該兩者在圖7中被描繪為一個區塊。此外,線性預測域解碼器102可包含全頻帶合成處理器134,其用於組合第二組合器128及TCX解碼器130及處理器132的輸出。如關於編碼器已展示,時域頻寬擴展處理器126、ACELP解碼器120以及TCX解碼器130並行地工作以解碼各別經傳輸音訊資訊。
可提供交叉路徑136,其用於使用自低頻帶頻譜-時間轉換(使用例如頻率-時間轉換器138)導出的來自TCX解碼器130及IGF處理器132之資訊來初始化低頻帶合成器。參看聲域之模型,ACELP資料可模型化聲域之形狀,其中TCX資料可模型化聲域之激勵。由低頻帶頻率-時間轉換器(諸如IMDCT解碼器)表示之交叉路徑136使低頻帶合成器122能夠使用聲域之形狀及當前激勵來重新計算或解碼經編碼低頻帶信號。此外,經合成低頻帶係藉由升頻取樣器124升頻取樣,且使用例如第二組合器128與時域頻寬經擴展的高頻帶140組合,以(例如)整形經升頻取樣之頻率以恢復(例如)每一經升頻取樣之頻帶的能量。
全頻帶合成器134可使用第二組合器128之全頻帶信號及來自TCX處理器130之激勵來形成經解碼降混信號142。第一聯合多聲道解碼器108可包含時間-頻率轉換器144,其用於將線性預測域解碼器之輸出(例如,經解碼降混信號142)轉換成頻譜表示145。此外,升頻混頻器(例如,實施於立體聲解碼器146中)可由第一多聲道資訊20控制以將頻譜表示升混成多聲道信號。此外,頻率-時間轉換器148 可將升混結果轉換成時間表示114。時間-頻率及/或頻率-時間轉換器可包含複雜操作或過取樣操作,諸如DFT或IDFT。
此外,第一聯合多聲道解碼器或更具體言之立體聲解碼器146可將多聲道殘餘信號58(例如,由多聲道經編碼音訊信號103提供)用於產生第一多聲道表示。此外,多聲道殘餘信號可包含比第一多聲道表示低的頻寬,其中第一聯合多聲道解碼器經組配以使用第一多聲道資訊重建構中間第一多聲道表示且將多聲道殘餘信號添加至中間第一多聲道表示。換言之,立體聲解碼器146可包含使用第一多聲道資訊20之多聲道解碼,且視情況包含在經解碼降混信號之頻譜表示已升混成多聲道信號之後,藉由將多聲道殘餘信號添加至經重建之多聲道信號的經重建多聲道信號之改良。因此,第一多聲道資訊及殘餘信號可能已對多聲道信號起作用。
第二聯合多聲道解碼器110可使用藉由頻域解碼器獲得之頻譜表示作為輸入。頻譜表示包含至少針對複數個頻帶的第一聲道信號150a及第二聲道信號150b。此外,第二聯合多聲道處理器110可應用於第一聲道信號150a及第二聲道信號150b之複數個頻帶。聯合多聲道操作(諸如遮罩)指示用於個別頻帶的左/右或中間/側聯合多聲道寫碼,且其中聯合多聲道操作為用於將由遮罩指示之頻帶自中間/側表示轉換為左/右表示的中間/側或左/右轉換操作,其為聯合多聲道操作之結果至時間表示之轉換以獲得第二多聲 道表示。此外,頻域解碼器可包含頻率-時間轉換器152,其為(例如)IMDCT操作或特定取樣操作。換言之,遮罩可包含指示(例如)L/R或M/S立體聲寫碼之旗標,其中第二聯合多聲道編碼器將對應立體聲寫碼演算法應用於各別音訊訊框。視情況,智慧型間隙填充可應用於經編碼音訊信號以進一步減小經編碼音訊信號之頻寬。因此,例如,音調頻帶可使用前面提及之立體聲寫碼演算法以高解析度編碼,其中其他頻帶可使用(例如)IGF演算法進行參數化編碼。
換言之,在LPD路徑104中,經傳輸單聲道信號係藉由(例如)由TD-BWE 126或IGF模組132支援之可切換ACELP/TCX 120/130解碼器重建構。因切換所致的任何ACELP初始化將對經降頻取樣之TCX/IGF輸出執行。ACELP之輸出係使用(例如)升頻取樣器124升頻取樣至全取樣速率。所有信號係使用(例如)混頻器128以高取樣速率在時域中混頻,且由LPD立體聲解碼器146進一步處理以提供LPD立體聲。
LPD「立體聲解碼」係由藉由應用經傳輸立體聲參數20操控的經傳輸降混之升混組成。視情況,降混殘餘58亦含於位元串流中。在此情況下,殘餘係藉由「立體聲解碼」146來解碼且包括於升混計算中。
FD路徑106經組配以具有其自身的獨立內部聯合立體聲或多聲道解碼。關於聯合立體聲解碼,該路徑再次使用其自身的臨界取樣及真實價值之濾波器組152,例如 (即)IMDCT。
LPD立體聲輸出及FD立體聲輸出係使用(例如)第一組合器112在時域中混頻,以提供完全切換寫碼器之最終輸出118。
儘管多聲道係關於相關圖式中之立體聲解碼來描述,但相同原理亦可大體上應用於關於兩個或兩個以上聲道之多聲道處理。
圖8展示用於編碼多聲道信號之方法800的示意性方塊圖。方法800包含:執行一線性預測域編碼的步驟805;執行一頻域編碼的步驟810;在該線性預測域編碼與該頻域編碼之間切換的步驟815,其中該線性預測域編碼包含降混該多聲道信號以獲得一降混信號、該降混信號之一線性預測域核心編碼以及自該多聲道信號產生第一多聲道資訊之一第一聯合多聲道編碼,其中該頻域編碼包含自該多聲道信號產生一第二多聲道資訊之一第二聯合多聲道編碼,其中該第二聯合多聲道編碼不同於該第一多聲道編碼,且其中該切換經執行以使得該多聲道信號之一部分係由該線性預測域編碼之一經編碼訊框或由該頻域編碼之一經編碼訊框表示。
圖9展示解碼經編碼音訊信號之方法900的示意性方塊圖。方法900包含:一線性預測域解碼的步驟905;一頻域解碼的步驟910;使用該線性預測域解碼之一輸出及使用一第一多聲道資訊來產生一第一多聲道表示之第一聯合多聲道解碼的步驟915;使用該頻域解碼之一輸出及一第 二多聲道資訊來產生一第二多聲道表示之一第二多聲道解碼的步驟920;以及組合該第一多聲道表示及該第二多聲道表示以獲得一經解碼音訊信號的步驟925,其中該第二第一多聲道資訊解碼不同於該第一多聲道解碼。
圖10展示根據另一態樣之用於編碼多聲道信號之音訊編碼器的示意性方塊圖。音訊編碼器2'包含線性預測域編碼器6及多聲道殘餘寫碼器56。線性預測域編碼器包含用於降混多聲道信號4以獲得降混信號14之降頻混頻器12、用於編碼降混信號14之線性預測域核心編碼器16。線性預測域編碼器6進一步包含聯合多聲道編碼器18,其用於自多聲道信號4產生多聲道資訊20。此外,線性預測域編碼器包含線性預測域解碼器50,其用於解碼經編碼降混信號26以獲得經編碼且經解碼之降混信號54。多聲道殘餘寫碼器56可使用經編碼且經解碼之降混信號54來計算及編碼多聲道殘餘信號。多聲道殘餘信號可表示使用多聲道資訊20之經解碼多聲道表示54與降混之前的多聲道信號4之間的誤差。
根據一實施例,降混信號14包含低頻帶及高頻帶,其中線性預測域編碼器可使用頻寬擴展處理器來施加頻寬擴展處理以用於參數化編碼高頻帶,其中線性預測域解碼器經組配以僅獲得表示降混信號之低頻帶的低頻帶信號作為經編碼且經解碼之降混信號54,且其中經編碼多聲道殘餘信號僅具有對應於在降混之前的多聲道信號之低頻帶的頻帶。此外,關於音訊編碼器2之相同描述可應用於音 訊編碼器2'。然而,省略編碼器2之另外頻率編碼。此省略簡化編碼器組態,且因此在以下情況下係有利的:編碼器僅用於僅包含可在時域中經參數化編碼而無明顯品質損失之信號的音訊信號,或經解碼音訊信號之品質仍在規範內。然而,專用殘餘立體聲寫碼對於增加經解碼音訊信號之再現品質係有利的。更具體言之,編碼之前的音訊信號與經編碼且經解碼之音訊信號之間的差異經導出且傳輸至解碼器以增加經解碼音訊信號之再現品質,此係因為經解碼音訊信號與經編碼音訊信號之差異係解碼器已知的。
圖11展示根據另一態樣之用於解碼經編碼音訊信號103之音訊解碼器102‘。音訊解碼器102'包含線性預測域解碼器104,及聯合多聲道解碼器108,該聯合多聲道解碼器用於使用線性預測域解碼器104之輸出及聯合多聲道資訊20來產生多聲道表示114。此外,經編碼音訊信號103可包含多聲道殘餘信號58,該多聲道殘餘信號可由多聲道解碼器使用以用於產生多聲道表示114。此外,與音訊解碼器102相關之相同解釋可應用於音訊解碼器102'。本文中,使用自原始音訊信號至經解碼音訊信號的殘餘信號且將其施加至經解碼音訊信號以至少幾乎達成與原始音訊信號相比相同品質的經解碼音訊信號,即使使用參數且因此有損之寫碼。然而,在音訊解碼器102'中省略關於音訊解碼器102所展示之頻率解碼部分。
圖12展示用於編碼多聲道信號之音訊編碼方法1200的示意性方塊圖。方法1200包含:線性預測域編碼的 步驟1205,其包含降混該多聲道信號以獲得一降混多聲道信號,以及一線性預測域核心編碼器自該多聲道信號產生多聲道資訊,其中該方法進一步包含對該降混信號進行線性預測域解碼以獲得一經編碼且經解碼之降混信號;以及多聲道殘餘寫碼的步驟1210,其使用該經編碼且經解碼之降混信號來計算一經編碼多聲道殘餘信號,該多聲道殘餘信號表示使用該第一多聲道資訊之一經解碼多聲道表示與降混之前的多聲道信號之間的一誤差。
圖13展示解碼經編碼音訊信號之方法1300的示意性方塊圖。方法1300包含線性預測域解碼的步驟1305,以及聯合多聲道解碼的步驟1310,其使用線性預測域解碼之一輸出及一聯合多聲道資訊來產生一多聲道表示,其中經編碼多聲道音訊信號包含一聲道殘餘信號,其中該聯合多聲道解碼將多聲道殘餘信號用於產生多聲道表示。
所描述實施例可在分佈所有類型之立體聲或多聲道音訊內容(語音及相似音樂,在給定低位元速率下具有恆定感知品質)的廣播(諸如關於數位無線電、網際網路串流及音訊通信應用)時使用。
圖14至圖17描述如何應用LPD寫碼與頻域寫碼之間及相反情況的所提議之無縫切換的實施例。通常,過去開視窗或處理係使用細線來指示,粗線指示切換施加所在的當前開視窗或處理,且虛線指示關於轉變或切換排他性地進行的當前處理。自LPD寫碼至頻率寫碼之切換或轉變
圖14展示指示頻域編碼至時域編碼之間的無縫切換之一實施例的示意性時序圖。若(例如)控制器10指示當前訊框較佳使用LPD編碼而非用於先前圖框之FD編碼來編碼,則此圖可能相關。在頻域編碼期間,停止視窗200a及200b可應用於每一立體聲信號(其可視情況擴展至兩個以上聲道)。停止視窗不同於在第一訊框204的開始202處衰落之標準MDCT重疊及添加。停止視窗之左邊部分可為用於使用(例如)MDCT時間-頻率變換來編碼先前訊框的經典重疊及添加。因此,切換之前的訊框仍被適當編碼。關於切換施加所在的當前訊框204,計算額外立體聲參數,即使用於時域編碼的中間信號之第一參數表示係針對隨後之訊框206計算。進行此等兩個額外立體聲分析以用於能夠產生中間信號208以用於LPD預看。不過,在該等兩個第一LPD立體聲視窗中(另外)傳輸該等立體聲參數。正常情況下,此等立體聲參數係延遲地隨兩個立體聲訊框發送。為了更新ACELP記憶體(諸如為了LPC分析或轉送頻疊取消(forward aliasing cancellation,FAC)),中間信號亦變得可用於過去。因此,在(例如)應用使用DFT之時間-頻率轉換之前,可在分析濾波器組82中施加用於第一立體聲信號之LPD立體聲視窗210a至210d及第二立體聲信號之LPD立體聲視窗212a至212d。中間信號在使用編碼時可包含典型交叉衰落斜坡,從而產生例示性LPD分析視窗214。若將ACELP用於編碼音訊信號(諸如單聲道低頻帶信號),則簡單地選擇LPC分析經應用的數個頻帶,藉由矩形LPD分析視窗216來指示。
此外,由垂直線218指示之時序展示:轉變施加所在的當前訊框包含來自頻域分析視窗200a、200b之資訊以及經計算中間信號208及對應立體聲資訊。在線202與線218之間的頻率分析視窗之水平部分期間,訊框204係使用頻域編碼完美地編碼。自線218至頻率分析視窗在線220處之結束,訊框204包含來自頻域編碼及LPD編碼兩者的資訊,且自線220至訊框204在垂直線222處之結束,僅LPD編碼有助於訊框之編碼。進一步注意編碼之中間部分,此係因為第一及最後(第三)部分僅自一個編碼技術導出而不具有頻疊。然而,對於中間部分,應在ACELP與TCX單聲道信號編碼之間區分。由於TCX編碼使用交叉衰落,如關於頻域編碼已應用,因此頻率經編碼信號之簡單淡出及TCX經編碼中間信號之淡入提供用於編碼當前訊框204之完整資訊。若將ACELP用於單聲道信號編碼,則可應用更複雜之處理,此係因為區域224可能不包含用於編碼音訊信號之完整資訊。所提議方法為轉送頻疊校正(forward aliasing correction,FAC),例如,在USAC規範中在章節7.16中所描述。
根據一實施例,控制器10經組配以在多聲道音訊信號之當前訊框204內自使用頻域編碼器8編碼一先前訊框切換至使用線性預測域編碼器解碼一即將來臨訊框。第一聯合多聲道編碼器18可自當前訊框之多聲道音訊信號計算合成多聲道參數210a、210b、212a、212b,其中第二聯合多聲道編碼器22經組配以使用停止視窗對第二多聲道信號 加權。
圖15展示對應於圖14之編碼器操作之解碼器的示意性時序圖。本文中,根據一實施例來描述當前訊框204之重建構。如在圖14之編碼器時序圖中已經看到,自停止視窗200a及200b經施加之先前訊框提供頻域立體聲頻道。如在單聲道情況下,自FD至LPD模式之轉變係首先對經解碼中間信號進行。轉變係藉由自以FD模式解碼之時域信號116人工建立中間信號226來達成,其中ccfl為核心碼訊框長度且L_fac表示頻率頻疊取消視窗或訊框或區塊或變換之長度。
x[n-ccfl/2]=0.5.l i-1[n]+0.5.r i-1[n],針對ccfl n<+L_fac
此信號接著被傳輸至LPD解碼器120以用於更新記憶體及應用FAC解碼,如在單聲道情況下針對FD模式至ACELP之轉變所進行。該處理在USAC規範[ISO/IEC DIS 23003-3,Usac]中在章節7.16中描述。在FD模式至TCX的情況下,執行習知重疊添加。LPD立體聲解碼器146接收經解碼(在頻域中,在應用時間-頻率轉換器144之時間-頻率轉換之後)中間信號作為輸入信號,例如,藉由將所傳輸的立體聲參數210及212用於立體聲處理,在轉變已經完成的情況下。立體聲解碼器接著輸出左聲道信號228及右聲道信號230,該等信號與以FD模式解碼之先前訊框重疊。該等信號(即,用於轉變經施加之訊框的FD經解碼時域信號及LPD經解碼時域信號)接著在每一聲道上交叉衰落(在組合器112中)以用於平滑左聲道及右聲道中之轉變:
在圖15中,使用M=ccfl/2來示意性地說明轉變。此外,組合器可執行僅使用FD或LPD解碼來解碼而無此等模式之間的轉變之連續訊框處的交叉衰落。
換言之,FD解碼之重疊及添加程序(尤其當將MDCT/IMDCT用於時間-頻率/頻率-時間轉換時)係由FD經解碼音訊信號及LPD經解碼音訊信號之交叉衰落來替換。因此,解碼器應計算用於FD經解碼音訊信號之淡出部分至LPD經解碼音訊信號之淡入部分的LPD信號。根據一實施例,音訊解碼器102經組配以在多聲道音訊信號之當前訊框204內自使用頻域解碼器106解碼一先前訊框切換至使用線性預測域解碼器104解碼一即將來臨訊框。組合器112可自當前訊框之第二多聲道表示116來計算合成中間信號226。第一聯合多聲道解碼器108可使用合成中間信號226及第一多聲道資訊20來產生第一多聲道表示114。此外,組合器112經組配以組合第一多聲道表示及第二多聲道表示以獲得多聲道音訊信號之經解碼當前訊框。
圖16展示用於在當前訊框232中執行使用LPD編碼至使用FD解碼之轉變之編碼器中的示意性時序圖。為了 自LPD切換至FD編碼,可對FD多聲道編碼施加開始視窗300a、300b。當與停止視窗200a、200b相比時,開始視窗具有類似功能性。在垂直線234與236之間的LPD編碼器之TCX經編碼單聲道信號的淡出期間,開始視窗300a、300b執行淡入。當使用ACELP替代TCX時,單聲道信號不執行平滑淡出。儘管如此,可使用(例如)FAC在解碼器中重建構正確音訊信號。LPD立體聲視窗238及240係預設地計算且參考ACELP或TCX經編碼單聲道信號(藉由LPD分析視窗241指示)。
圖17展示對應於關於圖16所描述的編碼器之時序圖的解碼器中之示意性時序圖。
對於自LPD模式至FD模式之轉變,額外訊框係藉由立體聲解碼器146來解碼。來自LPD模式解碼器的中間信號用零進行擴展以用於訊框索引i=ccfl/M。
如先前所描述之立體聲解碼可藉由保留上一立體聲參數及藉由切斷側信號反量化(亦即將code_mode設定至0)來執行。此外,不應用反DFT之後的右側開視窗,此導致額外LPD立體聲視窗244a、244b之陡峭邊緣242a、242b。可清晰地看到,形狀邊緣位於平面區段246a、246b處,其中訊框之對應部分之整個資訊可自FD經編碼音訊信號導出。因此,右側開視窗(無陡峭邊緣)可導致LPD資訊對FD資訊之非所需干擾且因此不應用。
接著藉由使用重疊添加處理(在TCX至FD模式的情況下)或藉由對每一聲道使用FAC(在ACELP至FD模式的情況下)將所得左及右(LPD經解碼)聲道250a、250b(使用由LPD分析視窗248指示的LPD經解碼中間信號及立體聲參數)組合至下一訊框之FD模式經解碼聲道。在圖17中描繪轉變之示意性說明,其中M=ccfl/2。
根據實施例,音訊解碼器102可在多聲道音訊信號之當前訊框232內自使用線性預測域解碼器104解碼一先前訊框切換至使用頻域解碼器106解碼一即將來臨訊框。立體聲解碼器146可使用先前訊框之多聲道資訊針對當前訊框自線性預測域解碼器之經解碼單聲道信號計算合成多聲道音訊信號,其中第二聯合多聲道解碼器110可針對當前訊框計算第二多聲道表示及使用開始視窗對第二多聲道表示加權。組合器112可組合合成多聲道音訊信號及經加權之第二多聲道表示以獲得多聲道音訊信號之經解碼當前訊框。
圖18展示用於編碼多聲道音訊信號4之編碼器2"的示意性方塊圖。音訊編碼器2"包含降頻混頻器12、線性預測域核心編碼器16、濾波器組82以及聯合多聲道編碼器18。降頻混頻器12經組配以用於降混多聲道信號4以獲得降混信號14。該降混信號可為單聲道信號,諸如M/S多聲道音訊信號之中間信號。線性預測域核心編碼器16可編碼降混信號14,其中降混信號14具有低頻帶及高頻帶,其中線性預測域核心編碼器16經組配以施加頻寬擴展處理以用於參數化編碼高頻帶。此外,濾波器組82可產生多聲道信號4之 頻譜表示,且聯合多聲道編碼器18可經組配以處理包含多聲道信號之低頻帶及高頻帶的頻譜表示以產生多聲道資訊20。多聲道資訊可包含ILD及/或IPD及/或兩耳間強度差異(IID,Interaural Intensity Difference)參數,從而使解碼器能夠自單聲道信號重新計算多聲道音訊信號。根據此態樣之實施例之其他態樣的更詳細圖式可在先前圖中、尤其在圖4中找到。
根據實施例,線性預測域核心編碼器16可進一步包含線性預測域解碼器,其用於解碼經編碼降混信號26以獲得經編碼且經解碼之降混信號54。本文中,線性預測域核心編碼器可形成M/S音訊信號之中間信號,其經編碼以傳輸至解碼器。此外,音訊編碼器進一步包含多聲道殘餘寫碼器56,其用於使用經編碼且經解碼之降混信號54來計算經編碼多聲道殘餘信號58。多聲道殘餘信號表示使用多聲道資訊20之經解碼多聲道表示與降混之前的多聲道信號4之間的誤差。換言之,多聲道殘餘信號58可為M/S音訊信號的側信號,其對應於使用線性預測域核心編碼器計算的中間信號。
根據另外實施例,線性預測域核心編碼器16經組配以施加頻寬擴展處理以用於參數化編碼高頻帶以及僅獲得表示降混信號之低頻帶的低頻帶信號以作為經編碼且經解碼之降混信號,且其中經編碼多聲道殘餘信號58僅具有對應於降混之前的多聲道信號之低頻帶的頻帶。另外或替代地,多聲道殘餘寫碼器可模擬在線性預測域核心編碼器 中應用於多聲道信號之高頻帶的時域頻寬擴展,且計算高頻帶之殘餘或側信號以使得能夠更準確解碼單聲道或中間信號從而導出經解碼多聲道音訊信號。模擬可包含相同或類似計算,計算係在解碼器中執行以解碼頻寬經擴展高頻帶。模擬頻寬擴展之替代或額外方法可為預測側信號。因此,多聲道殘餘寫碼器可自濾波器組82中之時間-頻率轉換之後的多聲道音訊信號4之參數表示83來計算全頻帶殘餘信號。可比較此全頻帶側信號與自參數表示83類似地導出的全頻帶中間信號之頻率表示。全頻帶中間信號可(例如)計算為參數表示83之左聲道及右聲道的總和,且全頻帶側信號可計算為左聲道及右聲道的差。此外,預測因此可計算全頻帶中間信號之預測因數,其將全頻帶側信號與預測因數及全頻帶中間信號之乘積的絕對差減至最小。
換言之,線性預測域編碼器可經組配以計算降混信號14以作為M/S多聲道音訊信號之中間信號之參數表示,其中多聲道殘餘寫碼器可經組配以計算對應於M/S多聲道音訊信號之中間信號的側信號,其中殘餘寫碼器可使用模擬時域頻寬擴展來計算中間信號之高頻帶,或其中殘餘寫碼器可使用發現預測資訊來預測中間信號之高頻帶,預測資訊將來自先前訊框的經計算側信號與經計算全頻帶中間信號之間的差異減至最小。
其他實施例展示包含ACELP處理器30之線性預測域核心編碼器16。ACELP處理器可對經降頻取樣之降混信號34進行操作。此外,時域頻寬擴展處理器36經組配以 參數化編碼降混信號的藉由第三降頻取樣自ACELP輸入信號移除之一部分之頻帶。另外或替代地,線性預測域核心編碼器16可包含TCX處理器32。TCX處理器32可對降混信號14進行操作,降混信號未經降頻取樣或以小於用於ACELP處理器之降頻取樣的程度經降頻取樣。此外,TCX處理器可包含第一時間-頻率轉換器40、用於產生第一頻帶集合之參數表示46的第一參數產生器42以及用於產生第二頻帶集合之經量化經編碼頻譜線之集合48的第一量化器編碼器44。ACELP處理器及TCX處理器可分開地執行(例如,使用ACELP編碼第一數目個訊框,且使用TCX編碼第二數目個訊框),或以ACELP及TCX兩者貢獻資訊以解碼一個訊框的聯合方式執行。
其他實施例展示不同於濾波器組82之時間-頻率轉換器40。濾波器組82可包含經最佳化以產生多聲道信號4之頻譜表示83的濾波器參數,其中時間-頻率轉換器40可包含經最佳化以產生第一頻帶集合之參數表示46的濾波器參數。在另一步驟中,必須注意,線性預測域編碼器在頻寬擴展及/或ACELP的情況下使用不同濾波器組或甚至不使用濾波器組。此外,濾波器組82可不依賴於線性預測域編碼器之先前參數選擇而計算單獨濾波器參數以產生頻譜表示83。換言之,LPD模式中之多聲道寫碼可使用用於多聲道處理之濾波器組(DFT),其並非頻寬擴展(時域用於ACELP且MDCT用於TCX)中所使用之濾波器組。此情況之優點為每一參數寫碼可將其最佳時間-頻率分解用於得到 其參數。例如,ACELP+TDBWE與利用外部濾波器組(例如,DFT)之參數多聲道寫碼的組合係有利的。此組合特別有效率,此係因為已知用於語音之最佳頻寬擴展應在時域中且多聲道處理應在頻域中。由於ACELP+TDBWE不具有任何時間-頻率轉換器,因此如DFT之外部濾波器組或變換係較佳的或甚至可能係必需的。其他概念始終使用相同濾波器組且因此不使用濾波器組,諸如:
- 在MDCT中用於AAC之IGF及聯合立體聲寫碼
- 在QMF中用於HeAACv2之SBR+PS
- 在QMF中用於USAC之SBR+MPS212
根據其他實施例,多聲道編碼器包含第一訊框產生器且線性預測域核心編碼器包含第二訊框產生器,其中第一訊框產生器及第二訊框產生器經組配以自多聲道信號4形成訊框,其中第一訊框產生器及第二訊框產生器經組配以形成具有類似長度之訊框。換言之,多聲道處理器之訊框化可與ACELP中所使用之訊框化相同。即使多聲道處理係在頻域中進行,用於計算其參數或降混之時間解析度應理想地接近於或甚至等於ACELP之訊框化。此情況下之類似長度可指ACELP之訊框化,其可等於或接近於用於計算用於多聲道處理或降混之參數的時間解析度。
根據其他實施例,音訊編碼器進一步包含線性預測域編碼器6(其包含線性預測域核心編碼器16及多聲道編碼器18)、頻域編碼器8以及控制器10,該控制器用於在線性預測域編碼器6與頻域編碼器8之間切換。頻域編碼器8可 包含用於自多聲道信號編碼第二多聲道資訊24之第二聯合多聲道編碼器22,其中第二聯合多聲道編碼器22不同於第一聯合多聲道編碼器18。此外,控制器10經組配以使得該多聲道信號之一部分係由該線性預測域編碼器之一經編碼訊框表示或由該頻域編碼器之一經編碼訊框表示。
圖19展示根據另一態樣之用於解碼經編碼音訊信號103之解碼器102"的示意性方塊圖,該經編碼音訊信號包含經核心編碼之信號、頻寬擴展參數以及多聲道資訊。音訊解碼器包含線性預測域核心解碼器104、分析濾波器組144、多聲道解碼器146以及合成濾波器組處理器148。線性預測域核心解碼器104可解碼經核心編碼之信號以產生單聲道信號。此信號可為M/S經編碼音訊信號之(全頻帶)中間信號。分析濾波器組144可將單聲道信號轉換成頻譜表示145,其中多聲道解碼器146可自單聲道信號之頻譜表示及多聲道資訊20產生第一聲道頻譜及第二聲道頻譜。因此,多聲道解碼器可使用多聲道資訊,其(例如)包含對應於經解碼中間信號的側信號。合成濾波器組處理器148經組配以用於對第一聲道頻譜進行合成濾波以獲得第一聲道信號且用於對第二聲道頻譜進行合成濾波以獲得第二聲道信號。因此,較佳地,與分析濾波器組144相比的反操作可應用於第一聲道信號及第二聲道信號,若分析濾波器組用途DFT,則反操作可為IDFT。然而,濾波器組處理器可使用(例如)同一濾波器組並行地或以連續次序來(例如)處理兩個聲道頻譜。關於此其他態樣之其他詳細圖式可在先前圖中、尤 其關於圖7看出。
根據其他實施例,線性預測域核心解碼器包含:頻寬擴展處理器126,其用於自頻寬擴展參數及低頻帶單聲道信號或經核心編碼之信號產生高頻帶部分140以獲得音訊信號之經解碼高頻帶140;低頻帶信號處理器,其經組配以解碼低頻帶單聲道信號;以及組合器128,其經組配以使用經解碼低頻帶單聲道信號及音訊信號之經解碼高頻帶來計算全頻帶單聲道信號。低頻帶單聲道信號可為(例如)M/S多聲道音訊信號之中間信號之基頻表示,其中頻寬擴展參數可應用以(在組合器128中)自低頻帶單聲道信號來計算全頻帶單聲道信號。
根據其他實施例,線性預測域解碼器包含ACELP解碼器120、低頻帶合成器122、升頻取樣器124、時域頻寬擴展處理器126或第二組合器128,其中第二組合器128經組配以用於組合經升頻取樣之低頻帶信號及頻寬經擴展高頻帶信號140以獲得全頻帶ACELP經解碼單聲道信號。線性預測域解碼器可進一步包含TCX解碼器130及智慧型間隙填充處理器132以獲得全頻帶TCX經解碼單聲道信號。因此,全頻帶合成處理器134可組合全頻帶ACELP經解碼單聲道信號及全頻帶TCX經解碼單聲道信號。另外,可提供交叉路徑136以用於使用來自TCX解碼器及IGF處理器的藉由低頻帶頻譜-時間轉換導出之資訊來初始化低頻帶合成器。
根據其他實施例,音訊解碼器包含:頻域解碼器106;第二聯合多聲道解碼器110,其用於使用頻域解碼器 106之輸出及第二多聲道資訊22、24來產生第二多聲道表示116;以及第一組合器112,其用於組合第一聲道信號及第二聲道信號與第二多聲道表示116以獲得經解碼音訊信號118,其中該第二聯合多聲道解碼器不同於該第一聯合多聲道解碼器。因此,音訊解碼器可在使用LPD之參數多聲道解碼或頻域解碼之間切換。已關於先前圖式詳細地描述此方法。
根據其他實施例,分析濾波器組144包含DFT以將單聲道信號轉換成頻譜表示145,且其中全頻帶合成處理器148包含IDFT以將頻譜表示145轉換成第一聲道信號及第二聲道信號。此外,分析濾波器組可將視窗施加於DFT轉換頻譜表示145上,以使得先前訊框之頻譜表示的右邊部分及當前訊框之頻譜表示的左邊部分重疊,其中先前訊框及當前訊框相連。換言之,交叉衰落可自一個DFT區塊應用至另一區塊以執行相連DFT區塊之間的平滑轉變及/或減少區塊假影。
根據其他實施例,多聲道解碼器146經組配以自單聲道信號獲得第一聲道信號及第二聲道信號,其中單聲道信號為多聲道信號之中間信號,且其中多聲道解碼器146經組配以獲得M/S多聲道經解碼音訊信號,其中多聲道解碼器經組配以自多聲道資訊計算側信號。此外,多聲道解碼器146可經組配以自M/S多聲道經解碼音訊信號來計算L/R多聲道經解碼音訊信號,其中多聲道解碼器146可使用多聲道資訊及側信號來計算低頻帶的L/R多聲道經解碼音訊信 號。另外或替代地,多聲道解碼器146可自中間信號來計算經預測側信號,且其中多聲道解碼器可經進一步組配以使用經預測側信號及多聲道資訊之ILD值來計算高頻帶的L/R多聲道經解碼音訊信號。
此外,多聲道解碼器146可經進一步組配以對L/R經解碼多聲道音訊信號執行複雜操作,其中多聲道解碼器可使用經編碼中間信號之能量及經解碼L/R多聲道音訊信號之能量來計算複雜操作之量值以獲得能量補償。此外,多聲道解碼器經組配以使用多聲道資訊之IPD值來計算複雜操作之相位。在解碼之後,經解碼多聲道信號之能量、位準或相位可不同於經解碼單聲道信號。因此,可判定複雜操作,以使得多聲道信號之能量、位準或相位經調整至經解碼單聲道信號之值。此外,相位可使用(例如)來自編碼器側處所計算之多聲道資訊的經計算IPD參數而調整至編碼之前的多聲道信號之相位之值。此外,經解碼多聲道信號之人類感知可適合於編碼之前的原始多聲道信號之人類感知。
圖20展示用於編碼多聲道信號之方法2000之流程圖的示意性說明。該方法包含:降混多聲道信號以獲得一降混信號的步驟2050;編碼該降混信號的步驟2100,其中該降混信號具有一低頻帶及一高頻帶,其中線性預測域核心編碼器經組配以施加一頻寬擴展處理以用於參數化編碼高頻帶;產生多聲道信號之一頻譜表示的步驟2150;以及處理包含多聲道信號之低頻帶及高頻帶之頻譜表示以產 生多聲道資訊的步驟2200。
圖21展示解碼經編碼音訊信號之方法2100之流程圖的示意性說明,經編碼音訊信號包含經核心編碼之信號、頻寬擴展參數以及多聲道資訊。該方法包含:解碼經核心編碼之信號以產生一單聲道信號的步驟2105;將該單聲道信號轉換成一頻譜表示的步驟2110;自該單聲道信號之頻譜表示及多聲道資訊產生第一聲道頻譜及第二聲道頻譜的步驟2115;以及對第一聲道頻譜進行合成濾波以獲得第一聲道信號及對第二聲道頻譜進行合成濾波以獲得第二聲道信號的步驟2120。
其他實施例描述如下。
位元串流語法變化
USAC規範[1]在章節5.3.2輔助有效負載中之表23應修改如下:
應添加下表:
應在章節6.2 USAC有效負載中添加以下有效負載描述。
6.2.x lpd_stereo_stream()
詳細解碼程序係在7.x LPD立體聲解碼章節中描述。
術語及定義
lpd_stereo_stream()資料元素,其用以關於LPD模式解碼立體聲資料
res_mode旗標,其指示參數頻帶之頻率解析度。
q_mode旗標,其指示參數頻帶之時間解析度。
ipd_mode位元欄位,其定義用於IPD參數之參數頻帶的最大值。
pred_mode旗標,其指示是否使用預測。
cod_mode位元欄位,其定義側信號經量化之參數頻帶的最大值。
Ild_idx[k][b]訊框k及頻帶b之ILD參數索引。
Ipd_idx[k][b]訊框k及頻帶b之IPD參數索引。
pred_gain_idx[k][b]訊框k及頻帶b之預測增益索引。
cod_gain_idx經量化側信號之全域增益索引。
協助程式元素
ccfl核心碼訊框長度。
M立體聲LPD訊框長度,如表7.x.1中所定義。
band_config()傳回經寫碼參數頻帶之數目的函數。該函數定義於7.x中
band_limits()傳回經寫碼參數頻帶之數目的函數。該函數定義於7.x中
max_band()傳回經寫碼參數頻帶之數目的函數。該函數定義於7.x中
ipd_max_band()傳回經寫碼參數頻帶之數目的函數。該函數
cod_max_band()傳回經寫碼參數頻帶之數目的函數。該函數
cod_L用於經解碼側信號之DFT線的數目。
解碼程序
LPD立體聲寫碼
工具描述
LPD立體聲為離散M/S立體聲寫碼,其中中間聲道係藉由單聲道LPD核心寫碼器來寫碼且側信號係在DFT域中寫碼。經解碼中間信號係自LPD單聲道解碼器輸出且接著由LPD立體聲模組來處理。立體聲解碼係在DFT域中進行,L及R聲道係在DFT域中解碼。兩個經解碼聲道在時域中變換返回且可接著在此域中與來自FD模式之經解碼聲道組合。FD寫碼模式使用其自身立體聲工具,亦即具有或不具複雜預測之離散立體聲。
資料元素
res_mode旗標,其指示參數頻帶之頻率解析 度。
q_mode旗標,其指示參數頻帶之時間解析度。
ipd_mode位元欄位,其定義用於IPD參數之參數頻帶的最大值。
pred_mode旗標,其指示是否使用預測。
cod_mode位元欄位,其定義側信號經量化之參數頻帶的最大值。
Ild_idx[k][b]訊框k及頻帶b之ILD參數索引。
Ipd_idx[k][b]訊框k及頻帶b之IPD參數索引。
pred_gain_idx[k][b]訊框k及頻帶b之預測增益索引。
cod_gain_idx經量化側信號之全域增益索引。
幫助元素
ccfl核心碼訊框長度。
M立體聲LPD訊框長度,如表7.x.1中所定義。
band_config()傳回經寫碼參數頻帶之數目的函數。該函數定義於7.x中
band_limits()傳回經寫碼參數頻帶之數目的函數。該函數定義於7.x中
max_band()傳回經寫碼參數頻帶之數目的函數。該函數定義於7.x中
ipd_max_band()傳回經寫碼參數頻帶之數目的函數。該函數
cod_max_band()傳回經寫碼參數頻帶之數目的函數。該函數
cod_L用於經解碼側信號之DFT線的數目。
解碼程序
在頻域中執行立體聲解碼。立體聲解碼充當LPD解碼器的後處理。立體聲生解碼自LPD解碼器接收單聲道中間信號之合成。接著在頻域中解碼或預測側信號。接著於在時域中重新合成之前在頻域中重建構聲道頻譜。獨立於LPD模式中所使用之寫碼模式,立體聲LPD對等於ACELP訊框之大小的固定訊框大小起作用。
頻率分析
自長度M之經解碼圖框x來計算訊框索引i之DFT頻譜。
其中N為信號分析之大小,w為分析視窗且x為來自LPD解碼器的經延遲DFT之重疊大小L之訊框索引i處的經解碼時間信號。M等於FD模式中所使用之取樣速率下的ACELP訊框之大小。N等於立體聲LPD訊框大小加DFT之重疊大小。該等大小視所使用LPD版本而定,如表7.x.1中所報告。
視窗w為正弦視窗,其經定義為:
參數頻帶之組態
DFT頻譜經劃分成被稱作參數頻帶的非重疊頻帶。頻譜之分割係不均勻的且模仿聽覺頻率分解。頻譜之兩個不同劃分可能具有遵照大致兩倍或四倍的等效矩形頻寬(ERB)的頻寬。
頻譜分割係藉由資料元素res_mod來選擇且由以下偽碼界定:
函數nbands=band_config(N,res_mod)
其中nbands為參數頻帶之總數目且N為DFT分析視窗大小。表band_limits_erb2及band_limits_erb4係在表7.x.2中定義。解碼器可每隔兩個立體聲LPD訊框適應性地改變頻譜之參數頻帶的解析度。
表7.x.2-關於DFT索引k之參數頻帶極限
用於IPD的參數頻帶之最大數目係在2位元欄位ipd_mod資料元素內發送:ipd_max_band=max_band[res_mod][ipd_mod]
用於側信號之寫碼的參數頻帶之最大數目係在2位元欄位cod_mod資料元素內發送:cod_max_band=max_band[res_mod][cod_mod]
表max_band[][]定義於表7.x.3中。
接著計算期望用於側信號的經解碼線之數目:cod_L=2.(band_limits[cod_max_band]-1)
立體聲參數之反量化
立體聲參數聲道間位準差(Interchannel Level Differencies,ILD)、聲道間相位差(Interchannel Phase Differencies,IPD)以及預測增益將視旗標q_mode而在每個訊框或每隔兩個訊框發送。若q_mode等於0,則在每個訊框更新該等參數。否則,僅針對USAC訊框內之立體聲LPD訊框之奇數索引i更新該等參數值。USAC訊框內之立體聲LPD訊框之索引i在LPD版本0中可在0與3之間且在LPD版本1中可在0與1之間。
ILD經解碼如下:ILD i [b]=ild_q[ild_idx[i][b]]針對0 b<nbands
針對前ipd_max_band個頻帶解碼IPD:,針對0 b<ipd_max_band
預測增益僅在pred_mode旗標設定至一時經解碼。經解碼增益因而為:
若pred_mode等於零,則所有增益經設定至零。
不依賴於q_mode之值,若code_mode為非零值,則側信號之解碼在每個訊框中執行。其首先解碼全域增益:cod_gain i =10 cod_gain_idx[i].20.127/90
側信號之經解碼形狀為USAC規範[1]中在章節中所描述的AVQ之輸出。
S i [1+8k+n]=kv[k][0][n],針對0 n<8及0 k<
反聲道映射
中間信號X及側信號S首先如下地轉換為左聲道L及右聲道R:L i [k]=X i [k]+gX i [k],針對band_limits[b] k<band_limits[b+1], R i [k]=X i [k]-gX i [k],針對band_limits[b] k<band_limits[b+1] 其中每個參數頻帶之增益g係自ILD參數導出: ,其中
對於低於cod_max_band之參數頻帶,用經解碼側信號 來更新兩個聲道:L i [k]=L i [k]+cod_gain i .S i [k],針對0 k<band_limits[cod_max_band],R i [k]=R i [k]-cod_gain i .S i [k]針對0 k<band_limits[cod_max_band]對於較高參數頻帶,預測側信號且聲道更新如下:L i [k]=L i [k]+cod_pred i [b].X i-1[k],針對band_limits[b] k<band_limits[b+1],R i [k]=R i [k]-cod_pred i [b].X i-1[k]針對band_limits[b] k<band_limits[b+1]最終,聲道倍增複數值,其目標為恢復信號之原始能量及聲道間相位:L i [k]=ae j2πβL i [k]
R i [k]=ae j2πβR i [k]
其中
其中c束縛於-12dB及12dB。
且其中β=atan2(sin(IPD i [b]),cos(IPD i [b])+c),其中atan2(x,y)為x相對於y的四象限反正切。
時域合成
自兩個經解碼頻譜LR,藉由反DFT來合成兩個時域信號lr,針對0 n<N
,針對0 n<N
最終,重疊及加法操作允許重建構M個樣本之訊框: 後處理
巴斯後處理係分開地應用於兩個聲道。處理用於兩個聲道,與[1]之章節7.17中所描述相同。
應理解,在本說明書中,線上之信號有時藉由該等線之參考數字來命名或有時藉由已經歸於該等線之參考數字本身來指示。因此,該記法使得具有某一信號之線指示信號本身。線在固線式實施中可為實體線。然而,在電腦化實施中,實體線並不存在,但由線表示之信號將自一個計算模組傳輸至另一計算模組。
儘管已在區塊表示實際或邏輯硬體組件之方塊圖的上下文中描述本發明,但本發明亦可由電腦實施方法來實施。在後一情況下,區塊表示對應方法步驟,其中此等步驟代表由由對應邏輯或實體硬體區塊執行之功能性。
儘管已在設備之上下文中描述一些態樣,但顯然,此等態樣亦表示對應方法之描述,其中區塊或裝置對應於方法步驟或方法步驟之特徵。類似地,方法步驟之上下文中所描述之態樣亦表示對應區塊或項目或對應設備之 特徵的描述。可由(或使用)硬體設備(類似於(例如)微處理器、可程式化電腦或電子電路)來執行方法步驟中之一些或全部。在一些實施例中,可由此設備來執行最重要方法步驟中的某一者或多者。
本發明的經傳輸或經編碼信號可儲存於數位儲存媒體上或可在諸如無線傳輸媒體之傳輸媒體或諸如網際網路之有線傳輸媒體上傳輸。
取決於某些實施要求,本發明之實施例可在硬體中或在軟體中實施。可使用上面儲存有電子可讀控制信號、與可程式化電腦系統協作(或能夠協作)以使得執行各別方法的數位儲存媒體(例如,軟碟、DVD、Blu-Ray、CD、ROM、PROM以及EPROM、EEPROM或快閃記憶體)來執行實施。因此,數位儲存媒體可係電腦可讀的。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,其能夠與可程式化電腦系統協作,以使得執行本文中所描述的方法中之一者。
通常,本發明之實施例可實施為具有程式碼之電腦程式產品,當電腦程式產品在電腦上執行時,程式碼操作性地用於執行該等方法中之一者。程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含儲存於機器可讀載體上的用於執行本文中所描述之方法中之一者的電腦程式。
換言之,因此,本發明方法之實施例為電腦程式,其具有用於在電腦程式運行於電腦上時執行本文中所 描述之方法中的一者的程式碼。
因此,本發明方法之另一實施例為包含資料載體(或諸如數位儲存媒體之非暫時性儲存媒體,或電腦可讀媒體),其包含記錄於其上的用於執行本文中所描述之方法中之一者的電腦程式。資料載體、數位儲存媒體或記錄媒體通常為有形的及/或非暫時性的。
因此,本發明方法之另一實施例為表示用於執行本文中所描述之方法中之一者的電腦程式之資料串流或信號序列。資料串流或信號序列可(例如)經組配以經由資料通信連接(例如,經由網際網路)來傳送。
另一實施例包含處理構件,例如,經組配或經調適以執行本文中所描述之方法中之一者的電腦或可規劃邏輯裝置。
另一實施例包含上面安裝有用於執行本文中所描述之方法中之一者的電腦程式之電腦。
根據本發明之另一實施例包含經組配以將用於執行本文中所描述之方法中之一者的電腦程式傳送(例如,用電子方式或光學方式)至接收器的設備或系統。接收器可(例如)為電腦、行動裝置、記憶體裝置或類似者。設備或系統可(例如)包含用於將電腦程式傳送至接收器之檔案伺服器。
在一些實施例中,可程式化邏輯裝置(例如,場可程式化閘陣列)可用以執行本文中所描述之方法之功能性中的一些或全部。在一些實施例中,場可規劃閘陣列可 與微處理器合作以便執行本文中所描述之方法中之一者。通常,該等方法較佳地由任何硬體設備來執行。
上述實施例僅說明本發明之原理。應理解,熟習此項技術者將顯而易見本文中所描述之配置及細節的修改及變化。因此,其僅意欲由接下來之申請專利範圍之範疇限制,而非由借助於本文中之實施例之描述及解釋所呈現的特定細節限制。
參考文獻
[1]ISO/IEC DIS 23003-3, Usac
[2]ISO/IEC DIS 23008-3, 3D音訊
2"‧‧‧音訊編碼器
4‧‧‧多聲道音訊信號/時域信號
12‧‧‧降頻混頻器
14‧‧‧降混信號
16‧‧‧線性預測域核心編碼器
20‧‧‧第一多聲道資訊
82‧‧‧濾波器組

Claims (21)

  1. 一種用於編碼一多聲道信號之音訊編碼器,其包含:一降頻混頻器,其用於降混該多聲道信號以獲得一降混信號,一線性預測域核心編碼器,其用於編碼該降混信號,其中該降混信號具有一低頻帶及一高頻帶,其中該線性預測域核心編碼器經組配以施加一頻寬擴展處理以用於參數化編碼該高頻帶;一濾波器組,其用於產生該多聲道信號之一頻譜表示;以及一聯合多聲道編碼器,其經組配以處理包含該多聲道信號之該低頻帶及該高頻帶的該頻譜表示以產生多聲道資訊。
  2. 如請求項1之音訊編碼器,其中該線性預測域核心編碼器進一步包含一線性預測域解碼器,該線性預測域解碼器用於解碼該經編碼降混信號以獲得一經編碼且經解碼之降混信號;且其中該音訊編碼器進一步包含一多聲道殘餘寫碼器,該多聲道殘餘寫碼器用於使用該經編碼且經解碼之降混信號來計算一經編碼的多聲道殘餘信號,該多聲道殘餘信號表示使用該多聲道資訊之一經解碼多聲道表示與降混之前的該多聲道信號之間的一誤差。
  3. 如請求項1或2之音訊編碼器, 其中該線性預測域核心編碼器經組配以施加一頻寬擴展處理以用於參數化編碼該高頻帶,其中該線性預測域解碼器經組配以僅獲得表示該降混信號之該低頻帶的一低頻帶信號,以作為該經編碼且經解碼之降混信號,且其中該經編碼多聲道殘餘信號僅具有對應於降混之前的該多聲道信號之該低頻帶的一頻帶。
  4. 如請求項1至3中任一項之音訊編碼器,其中該線性預測域核心編碼器包含一ACELP處理器,其中該ACELP處理器經組配以對一經降頻取樣之降混信號進行操作,且其中一時域頻寬擴展處理器經組配以參數化編碼該降混信號的藉由一第三降頻取樣自該ACELP輸入信號移除之一部分的一頻帶。
  5. 如請求項1至4中任一項之音訊編碼器,其中該線性預測域核心編碼器包含一TCX處理器,其中該TCX處理器經組配以對該降混信號進行操作,該降混信號未經降頻取樣或以小於用於該ACELP處理器之降頻取樣之一程度經降頻取樣,該TCX處理器包含一第一時間-頻率轉換器、用於產生一第一頻帶集合之一參數表示的一第一參數產生器以及用於產生一第二頻帶集合之經量化經編碼頻譜線之一集合的一第一量化器編碼器。
  6. 如請求項5之音訊編碼器,其中該時間-頻率轉換器不同於該濾波器組,其中該濾波器組包含經最佳化以產生該多聲道信號之一頻譜表示的濾波器參數,或其中該時間 -頻率轉換器包含經最佳化以產生一第一頻帶集合之一參數表示的濾波器參數。
  7. 如請求項1至6中任一項之音訊編碼器,其中該多聲道編碼器包含一第一訊框產生器且其中該線性預測域核心編碼器包含一第二訊框產生器,其中該第一訊框產生器及該第二訊框產生器經組配以自該多聲道信號形成一訊框,其中該第一訊框產生器及該第二訊框產生器經組配以形成具一類似長度之一訊框。
  8. 如請求項1至7中任一項之音訊編碼器,該音訊編碼器進一步包含:一線性預測域編碼器,其包含該線性預測域核心編碼器及該多聲道編碼器;一頻域編碼器;以及一控制器,其用於在該線性預測域編碼器與該頻域編碼器之間切換,其中該頻域編碼器包含用於自該多聲道信號編碼第二多聲道資訊之一第二聯合多聲道編碼器,其中該第二聯合多聲道編碼器不同於該第一聯合多聲道編碼器,且其中該控制器經組配以使得該多聲道信號之一部分係由該線性預測域編碼器之一經編碼訊框表示或由該頻域編碼器之一經編碼訊框表示。
  9. 如請求項1至8中任一項之音訊編碼器,其中該線性預測域編碼器經組配以計算該降混信 號,以作為一M/S多聲道音訊信號之一中間信號之一參數表示;其中該多聲道殘餘寫碼器經組配以計算對應於該M/S多聲道音訊信號之該中間信號的一側信號,其中該殘餘寫碼器經組配以使用模擬時域頻寬擴展來計算該中間信號之一高頻帶,或其中該殘餘寫碼器經組配以使用發現將一經計算側信號與來自該先前訊框之一經計算全頻帶中間信號之間的一差減至最小的一預測資訊來預測該中間信號之該高頻帶。
  10. 一種用於解碼一經編碼音訊信號之音訊解碼器,該經編碼音訊信號包含一經核心編碼之信號、頻寬擴展參數以及多聲道資訊,該音訊解碼器包含:一線性預測域核心解碼器,其用於解碼該經核心編碼之信號以產生一單聲道信號;一分析濾波器組,其用以將該單聲道信號轉換成一頻譜表示;一多聲道解碼器,其用於自該單聲道信號之該頻譜表示及該多聲道資訊產生一第一聲道頻譜及一第二聲道頻譜;以及一合成濾波器組處理器,其用於對該第一聲道頻譜進行合成濾波以獲得一第一聲道信號且用於對該第二聲道頻譜進行合成濾波以獲得一第二聲道信號。
  11. 如請求項10之音訊解碼器,其包含:其中該線性預測域核心解碼器包含一頻寬擴展處 理器,該頻寬擴展處理器用於自該等頻寬擴展參數及該低頻帶單聲道信號或該經核心編碼之信號產生一高頻帶部分以獲得該音訊信號之一經解碼高頻帶;其中該線性預測域核心解碼器進一步包含一低頻帶信號處理器,該低頻帶信號處理器經組配以解碼該低頻帶單聲道信號;其中該線性預測域核心解碼器進一步包含一組合器,該組合器經組配以使用該經解碼低頻帶單聲道信號及該音訊信號之該經解碼高頻帶來計算一全頻帶單聲道信號。
  12. 如請求項10或11之音訊解碼器,其中該線性預測域解碼器包含:一ACELP解碼器、一低頻帶合成器、一升頻取樣器、一時域頻寬擴展處理器或一第二組合器,其中該第二組合器經組配以用於組合一經升頻取樣之低頻帶信號及一頻寬經擴展高頻帶信號以獲得一全頻帶ACELP經解碼單聲道信號;一TCX解碼器及一智慧型間隙填充處理器,其用以獲得一全頻帶TCX經解碼單聲道信號;一全頻帶合成處理器,其用於組合該全頻帶ACELP經解碼單聲道信號及該全頻帶TCX經解碼單聲道信號,或其中一交叉路徑經提供以用於使用來自該TCX解碼器及該IGF處理器的藉由一低頻帶頻譜-時間轉換導 出之資訊來初始化該低頻帶合成器。
  13. 如請求項10或12之音訊解碼器,其進一步包含:一頻域解碼器;一第二聯合多聲道解碼器,其用於使用該頻域解碼器之一輸出及一第二多聲道資訊來產生一第二多聲道表示;以及一第一組合器,其用於組合該第一聲道信號及該第二聲道信號與該第二多聲道表示以獲得一經解碼音訊信號;其中該第二聯合多聲道解碼器不同於該第一聯合多聲道解碼器。
  14. 如請求項10至13中任一項之音訊解碼器,其中該分析濾波器組包含一DFT以將該單聲道信號轉換成一頻譜表示,且其中該全頻帶合成處理器包含一IDFT以將該頻譜表示轉換成該第一聲道信號及該第二聲道信號。
  15. 如請求項14之音訊解碼器,其中該分析濾波器組經組配以對該DFT轉換頻譜表示施加一視窗,以使得一先前訊框之該頻譜表示之一右邊部分及一當前訊框之該頻譜表示之一左邊部分重疊,其中該先前訊框及該當前訊框相連。
  16. 如請求項10至15中任一項之音訊解碼器,其中該多聲道解碼器經組配以自該單聲道信號獲得該第一聲道信號及該第二聲道信號,其中該單聲道信號為一多聲道信號之一中間信號,且其中該多聲道解碼 器經組配以獲得一M/S多聲道經解碼音訊信號,其中該多聲道解碼器經組配以自該多聲道資訊計算側信號。
  17. 如請求項16之音訊解碼器,其中該多聲道解碼器經組配以自該M/S多聲道經解碼音訊信號計算一L/R多聲道經解碼音訊信號,其中該多聲道解碼器經組配以使用該多聲道資訊及該側信號計算一低頻帶之該L/R多聲道經解碼音訊信號;或其中該多聲道解碼器經組配以自該中間信號計算一經預測側信號,且其中該多聲道解碼器經進一步組配以使用該經預測側信號及該多聲道資訊之一ILD值來計算一高頻帶之該L/R多聲道經解碼音訊信號。
  18. 如請求項16或17之音訊解碼器,其中該多聲道解碼器經進一步組配以對該L/R經解碼多聲道音訊信號執行一複雜操作;其中該多聲道解碼器經組配以使用該經編碼中間信號之一能量及該經解碼L/R多聲道音訊信號之一能量來計算該複雜操作之一量值以獲得一能量補償;且其中該多聲道解碼器經組配以使用該多聲道資訊之一IPD值來計算該複雜操作之一相位。
  19. 一種用於編碼一多聲道信號之方法,該方法包含:降混該多聲道信號以獲得一降混信號,編碼該降混信號,其中該降混信號具有一低頻帶及一高頻帶,其中該線性預測域核心編碼器經組配以施加 一頻寬擴展處理以用於參數化編碼該高頻帶;產生該多聲道信號之一頻譜表示;以及處理包含該多聲道信號之該低頻帶及該高頻帶的該頻譜表示以產生多聲道資訊。
  20. 一種解碼一經編碼音訊信號之方法,該經編碼音訊信號包含一經核心編碼之信號、頻寬擴展參數以及多聲道資訊,該方法包含解碼該經核心編碼之信號以產生一單聲道信號;將該單聲道信號轉換成一頻譜表示;自該單聲道信號之該頻譜表示及該多聲道資訊產生一第一聲道頻譜及一第二聲道頻譜;對該第一聲道頻譜進行合成濾波以獲得一第一聲道信號且對該第二聲道頻譜進行合成濾波以獲得一第二聲道信號。
  21. 一種電腦程式,其在執行於一電腦或一處理器上時用於執行如請求項19或請求項20之方法。
TW105106306A 2015-03-09 2016-03-02 用於編碼多聲道信號的音訊編碼器與方法、用於解碼經編碼音訊信號的音訊解碼器與方法及相關電腦程式 TWI613643B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
??15158233.5 2015-03-09
EP15158233 2015-03-09
EP15172599.1A EP3067887A1 (en) 2015-03-09 2015-06-17 Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
??15172599.1 2015-06-17

Publications (2)

Publication Number Publication Date
TW201637000A true TW201637000A (zh) 2016-10-16
TWI613643B TWI613643B (zh) 2018-02-01

Family

ID=52682621

Family Applications (2)

Application Number Title Priority Date Filing Date
TW105106305A TWI609364B (zh) 2015-03-09 2016-03-02 用於編碼多聲道信號的音訊編碼器及用於解碼經編碼音訊信號的音訊解碼器(一)
TW105106306A TWI613643B (zh) 2015-03-09 2016-03-02 用於編碼多聲道信號的音訊編碼器與方法、用於解碼經編碼音訊信號的音訊解碼器與方法及相關電腦程式

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW105106305A TWI609364B (zh) 2015-03-09 2016-03-02 用於編碼多聲道信號的音訊編碼器及用於解碼經編碼音訊信號的音訊解碼器(一)

Country Status (19)

Country Link
US (7) US10388287B2 (zh)
EP (9) EP3067886A1 (zh)
JP (6) JP6606190B2 (zh)
KR (2) KR102151719B1 (zh)
CN (6) CN112634913B (zh)
AR (6) AR103881A1 (zh)
AU (2) AU2016231283C1 (zh)
BR (4) BR122022025643B1 (zh)
CA (2) CA2978814C (zh)
ES (6) ES2910658T3 (zh)
FI (1) FI3958257T3 (zh)
MX (2) MX366860B (zh)
MY (2) MY186689A (zh)
PL (6) PL3910628T3 (zh)
PT (3) PT3268957T (zh)
RU (2) RU2679571C1 (zh)
SG (2) SG11201707343UA (zh)
TW (2) TWI609364B (zh)
WO (2) WO2016142337A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI726337B (zh) * 2018-06-22 2021-05-01 弗勞恩霍夫爾協會 多聲道音訊寫碼技術

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
KR102083200B1 (ko) 2016-01-22 2020-04-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼-도메인 리샘플링을 사용하여 멀티-채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
US10224045B2 (en) 2017-05-11 2019-03-05 Qualcomm Incorporated Stereo parameters for stereo decoding
JP7009509B2 (ja) 2017-05-18 2022-01-25 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ネットワーク装置の管理
US10431231B2 (en) * 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
US10475457B2 (en) 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
CN114898761A (zh) 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
US10535357B2 (en) 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10734001B2 (en) * 2017-10-05 2020-08-04 Qualcomm Incorporated Encoding or decoding of audio signals
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3729427A1 (en) * 2017-12-19 2020-10-28 Dolby International AB Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements
TWI812658B (zh) * 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
TWI760593B (zh) * 2018-02-01 2022-04-11 弗勞恩霍夫爾協會 使用混成式編碼器/解碼器空間分析之音訊場景編碼器、音訊場景解碼器及相關方法
EP3550561A1 (en) * 2018-04-06 2019-10-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value
CN111819627A (zh) * 2018-07-02 2020-10-23 杜比实验室特许公司 用于对沉浸式音频信号进行编码及/或解码的方法及装置
AU2019298307A1 (en) * 2018-07-04 2021-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multisignal audio coding using signal whitening as preprocessing
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
EP3719799A1 (en) * 2019-04-04 2020-10-07 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation
CN110267142B (zh) * 2019-06-25 2021-06-22 维沃移动通信有限公司 一种移动终端及控制方法
FR3101741A1 (fr) * 2019-10-02 2021-04-09 Orange Détermination de corrections à appliquer à un signal audio multicanal, codage et décodage associés
US11432069B2 (en) * 2019-10-10 2022-08-30 Boomcloud 360, Inc. Spectrally orthogonal audio component processing
CA3163373A1 (en) * 2020-02-03 2021-08-12 Vaclav Eksler Switching between stereo coding modes in a multichannel sound codec
CN111654745B (zh) * 2020-06-08 2022-10-14 海信视像科技股份有限公司 多声道的信号处理方法及显示设备
CN116324980A (zh) * 2020-09-25 2023-06-23 苹果公司 声道、对象和hoa音频内容的无缝可扩展解码
MX2023003965A (es) * 2020-10-09 2023-05-25 Fraunhofer Ges Forschung Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una extension de ancho de banda.
JPWO2022176270A1 (zh) * 2021-02-16 2022-08-25
CN115881140A (zh) * 2021-09-29 2023-03-31 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序产品
TW202334938A (zh) * 2021-12-20 2023-09-01 瑞典商都比國際公司 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1311059C (en) * 1986-03-25 1992-12-01 Bruce Allen Dautrich Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words
DE4307688A1 (de) 1993-03-11 1994-09-15 Daimler Benz Ag Verfahren zur Geräuschreduktion für gestörte Sprachkanäle
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3593201B2 (ja) * 1996-01-12 2004-11-24 ユナイテッド・モジュール・コーポレーション オーディオ復号装置
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
CN1266674C (zh) * 2000-02-29 2006-07-26 高通股份有限公司 闭环多模混合域线性预测语音编解码器和处理帧的方法
SE519981C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
KR20060131767A (ko) * 2003-12-04 2006-12-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 코딩
US7742912B2 (en) * 2004-06-21 2010-06-22 Koninklijke Philips Electronics N.V. Method and apparatus to encode and decode multi-channel audio signals
US7391870B2 (en) 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
KR20070092240A (ko) * 2004-12-27 2007-09-12 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
WO2007026763A1 (ja) * 2005-08-31 2007-03-08 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
WO2008035949A1 (en) 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
CN101067931B (zh) * 2007-05-10 2011-04-20 芯晟(北京)科技有限公司 一种高效可配置的频域参数立体声及多声道编解码方法与系统
WO2009007639A1 (fr) 2007-07-03 2009-01-15 France Telecom Quantification apres transformation lineaire combinant les signaux audio d'une scene sonore, codeur associe
CN101373594A (zh) * 2007-08-21 2009-02-25 华为技术有限公司 修正音频信号的方法及装置
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
KR20100086000A (ko) * 2007-12-18 2010-07-29 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US9659568B2 (en) * 2007-12-31 2017-05-23 Lg Electronics Inc. Method and an apparatus for processing an audio signal
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
JP5333446B2 (ja) 2008-04-25 2013-11-06 日本電気株式会社 無線通信装置
EP3002750B1 (en) 2008-07-11 2017-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
CN102105930B (zh) * 2008-07-11 2012-10-03 弗朗霍夫应用科学研究促进协会 用于编码采样音频信号的帧的音频编码器和解码器
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
JP5325293B2 (ja) * 2008-07-11 2013-10-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたオーディオ信号を復号化するための装置および方法
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
EP2146344B1 (en) * 2008-07-17 2016-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding/decoding scheme having a switchable bypass
WO2010013450A1 (ja) * 2008-07-29 2010-02-04 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
TWI520128B (zh) * 2008-10-08 2016-02-01 弗勞恩霍夫爾協會 多解析度切換音訊編碼/解碼方案(一)
EP2345027B1 (en) 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
MX2011009660A (es) * 2009-03-17 2011-09-30 Dolby Int Ab Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica.
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
RU2591661C2 (ru) * 2009-10-08 2016-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Многорежимный декодировщик аудио сигнала, многорежимный кодировщик аудио сигналов, способы и компьютерные программы с использованием кодирования с линейным предсказанием на основе ограничения шума
CA2778240C (en) * 2009-10-20 2016-09-06 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio codec and celp coding adapted therefore
KR101414305B1 (ko) * 2009-10-20 2014-07-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 저 지연 애플리케이션들에서 사용하기 위한 오디오 신호 인코더, 오디오 신호 디코더, 오디오 콘텐츠의 인코딩된 표현을 제공하는 방법, 오디오 콘텐츠의 디코딩된 표현을 제공하는 방법 및 컴퓨터 프로그램
EP4358082A1 (en) * 2009-10-20 2024-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
WO2011059254A2 (en) * 2009-11-12 2011-05-19 Lg Electronics Inc. An apparatus for processing a signal and method thereof
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US8166830B2 (en) * 2010-07-02 2012-05-01 Dresser, Inc. Meter devices and methods
JP5499981B2 (ja) * 2010-08-02 2014-05-21 コニカミノルタ株式会社 画像処理装置
KR101468458B1 (ko) * 2010-11-12 2014-12-03 폴리콤 인코포레이티드 멀티 포인트 환경에서의 스케일러블 오디오
CN107516532B (zh) * 2011-03-18 2020-11-06 弗劳恩霍夫应用研究促进协会 音频内容的编码和解码方法以及介质
CN104364842A (zh) * 2012-04-18 2015-02-18 诺基亚公司 立体声音频信号编码器
US9489962B2 (en) * 2012-05-11 2016-11-08 Panasonic Corporation Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
CN102779518B (zh) * 2012-07-27 2014-08-06 深圳广晟信源技术有限公司 用于双核编码模式的编码方法和系统
TWI618050B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
TWI579831B (zh) * 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
US20150159036A1 (en) 2013-12-11 2015-06-11 Momentive Performance Materials Inc. Stable primer formulations and coatings with nano dispersion of modified metal oxides
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI726337B (zh) * 2018-06-22 2021-05-01 弗勞恩霍夫爾協會 多聲道音訊寫碼技術

Also Published As

Publication number Publication date
ES2951090T3 (es) 2023-10-17
ES2958535T3 (es) 2024-02-09
CN112951248A (zh) 2021-06-11
PT3958257T (pt) 2023-07-24
PL3958257T3 (pl) 2023-09-18
EP3910628C0 (en) 2023-08-02
AR103881A1 (es) 2017-06-07
PT3268957T (pt) 2022-05-16
CN107430863A (zh) 2017-12-01
EP3268958B1 (en) 2021-11-10
CN112614497A (zh) 2021-04-06
AR123835A2 (es) 2023-01-18
PT3268958T (pt) 2022-01-07
JP2020074013A (ja) 2020-05-14
CA2978814A1 (en) 2016-09-15
US20220093112A1 (en) 2022-03-24
US11107483B2 (en) 2021-08-31
EP3268957A1 (en) 2018-01-17
US20170365263A1 (en) 2017-12-21
EP3879528C0 (en) 2023-08-02
BR122022025766B1 (pt) 2023-12-26
US20220139406A1 (en) 2022-05-05
TW201636999A (zh) 2016-10-16
ES2910658T3 (es) 2022-05-13
WO2016142336A1 (en) 2016-09-15
EP3067887A1 (en) 2016-09-14
CA2978812C (en) 2020-07-21
JP6606190B2 (ja) 2019-11-13
BR112017018441A2 (pt) 2018-04-17
EP3879528A1 (en) 2021-09-15
EP3910628A1 (en) 2021-11-17
CN112614496B (zh) 2024-04-09
JP2020038374A (ja) 2020-03-12
US20170365264A1 (en) 2017-12-21
AU2016231284B2 (en) 2019-08-15
JP2018511825A (ja) 2018-04-26
JP2018511827A (ja) 2018-04-26
FI3958257T3 (fi) 2023-06-27
AR103880A1 (es) 2017-06-07
CN107408389B (zh) 2021-03-02
CN112634913A (zh) 2021-04-09
MX2017011493A (es) 2018-01-25
US11238874B2 (en) 2022-02-01
ES2901109T3 (es) 2022-03-21
CN112634913B (zh) 2024-04-09
KR102151719B1 (ko) 2020-10-26
EP3879527A1 (en) 2021-09-15
EP4224470A1 (en) 2023-08-09
WO2016142337A1 (en) 2016-09-15
JP2023029849A (ja) 2023-03-07
MY186689A (en) 2021-08-07
EP3910628B1 (en) 2023-08-02
PL3910628T3 (pl) 2024-01-15
BR112017018439B1 (pt) 2023-03-21
EP3958257B1 (en) 2023-05-10
KR102075361B1 (ko) 2020-02-11
BR112017018439A2 (pt) 2018-04-17
JP6643352B2 (ja) 2020-02-12
EP3268957B1 (en) 2022-03-02
AU2016231283C1 (en) 2020-10-22
PL3268957T3 (pl) 2022-06-27
BR122022025643B1 (pt) 2024-01-02
RU2679571C1 (ru) 2019-02-11
MX366860B (es) 2019-07-25
KR20170126994A (ko) 2017-11-20
US20190221218A1 (en) 2019-07-18
US11881225B2 (en) 2024-01-23
KR20170126996A (ko) 2017-11-20
AU2016231284A1 (en) 2017-09-28
EP3268958A1 (en) 2018-01-17
JP7077290B2 (ja) 2022-05-30
AR123834A2 (es) 2023-01-18
EP3879527C0 (en) 2023-08-02
JP7469350B2 (ja) 2024-04-16
JP2022088470A (ja) 2022-06-14
AR123837A2 (es) 2023-01-18
PL3268958T3 (pl) 2022-03-21
EP3067886A1 (en) 2016-09-14
US10777208B2 (en) 2020-09-15
CA2978814C (en) 2020-09-01
US10388287B2 (en) 2019-08-20
ES2959910T3 (es) 2024-02-28
CA2978812A1 (en) 2016-09-15
JP7181671B2 (ja) 2022-12-01
SG11201707343UA (en) 2017-10-30
BR112017018441B1 (pt) 2022-12-27
EP3958257A1 (en) 2022-02-23
TWI609364B (zh) 2017-12-21
US11741973B2 (en) 2023-08-29
AU2016231283A1 (en) 2017-09-28
CN107430863B (zh) 2021-01-26
SG11201707335SA (en) 2017-10-30
ES2959970T3 (es) 2024-02-29
PL3879527T3 (pl) 2024-01-15
AR123836A2 (es) 2023-01-18
CN112614496A (zh) 2021-04-06
EP3879528B1 (en) 2023-08-02
MY194940A (en) 2022-12-27
MX2017011187A (es) 2018-01-23
EP3879527B1 (en) 2023-08-02
RU2680195C1 (ru) 2019-02-18
CN107408389A (zh) 2017-11-28
PL3879528T3 (pl) 2024-01-22
US10395661B2 (en) 2019-08-27
MX364618B (es) 2019-05-02
US20190333525A1 (en) 2019-10-31
AU2016231283B2 (en) 2019-08-22
TWI613643B (zh) 2018-02-01
US20200395024A1 (en) 2020-12-17

Similar Documents

Publication Publication Date Title
TWI609364B (zh) 用於編碼多聲道信號的音訊編碼器及用於解碼經編碼音訊信號的音訊解碼器(一)