TWI557726B - 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 - Google Patents

用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 Download PDF

Info

Publication number
TWI557726B
TWI557726B TW103125869A TW103125869A TWI557726B TW I557726 B TWI557726 B TW I557726B TW 103125869 A TW103125869 A TW 103125869A TW 103125869 A TW103125869 A TW 103125869A TW I557726 B TWI557726 B TW I557726B
Authority
TW
Taiwan
Prior art keywords
scale factor
band
frequency
factor band
bands
Prior art date
Application number
TW103125869A
Other languages
English (en)
Other versions
TW201521014A (zh
Inventor
皮爾 伊斯坦德
克里斯多福 科林
Original Assignee
杜比國際公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 杜比國際公司 filed Critical 杜比國際公司
Publication of TW201521014A publication Critical patent/TW201521014A/zh
Application granted granted Critical
Publication of TWI557726B publication Critical patent/TWI557726B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Description

用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 [與相關案的交叉引用]
本案請求對於2013年8月29日提出的美國臨時申請案U.S.61/871,575之優先權,該案的全部內容併入本文作為參照。
本文件係關於音頻編碼和解碼。尤其是,本文件係關於利用高頻重建(HFR)之音頻編碼方案。
HFR技術,諸如頻譜帶複製(SBR)技術,允許你顯著地改善傳統感知音頻編解碼器(稱為核心編碼器/解碼器)的編碼效率。與MPEG-4進階音頻編碼(AAC)結合一起,HFR形成非常有效的音頻編解碼器,其係使用於,例如,XM衛星無線電系統和數位無線電調幅聯盟,且亦在3GPP、DVD論壇和其它者內被標準化。用SBR之AAC的一實作係稱為杜比脈波(Dolby Pulse)。用SBR的AAC係MPEG-4標準的一部分,其中此被稱為高效 AAC配置(HE-AAC)。通常,HFR技術可以向前及向後相容方式和任何感知音頻(核心)編解碼器結合,因此提供使已建立的廣播系統,如Eureka DAB系統中所使用之MPEG Layer-2,升級之可能性。HFR方法亦可與語音編解碼器結合以允許在超低位元率之寬頻語音。
HFR背後的基本概念係觀察到,通常一信號的高頻範圍的特性和該同一信號的低頻範圍的特性之間的存在有強烈相關性。因此,一信號的原始輸入的高頻範圍的表示之良好近似可以透過從低頻範圍到高頻範圍之信號轉置而完成。
高頻重建可使用濾波器組或時域對頻域轉換,執行於時域或頻域中。過程通常涉及產生高頻信號的步驟,並接著使該高頻信號成形以近似原始高頻頻譜的頻譜包絡。產生高頻信號的步驟可以是例如基於單邊頻帶調變(SSB),其中將具有頻率ω的正弦信號映射到具有頻率ω+△ω的正弦信號,其中△ω係固定的頻移。換言之,透過低頻次頻帶(亦稱為低頻帶次頻帶高頻次頻帶(亦稱為高頻帶次頻帶))的“複製(copy-up)”操作,可以從低頻信號(亦稱為低頻帶信號)產生高頻信號(亦稱為高頻帶信號)。產生高頻信號之另一方法可能涉及低頻次頻帶的諧波轉置。T階的諧波轉置係典型地設計成將低頻信號的頻率ω的正弦波映射到高頻信號的具有頻率(T>1)的正弦波。
如上所示,在產生高頻信號之後,高頻信號的頻譜包絡形狀係依據原始音頻信號的高頻分量的頻譜形狀進行調 整。為這目的,用於複數比例因子頻帶的比例因子可自音頻編碼器傳輸到音頻解碼器。本文件以計算上且位元率有效的方式,解決致使音頻解碼器決定比例因子頻帶(其比例因子係提供自音頻編碼器)之技術問題。
依據態樣,描述一種配置用以決定音頻信號的高頻帶信號的主比例因子頻帶表之系統。該系統可以是音頻編碼器和/或解碼器之一部分。該主比例因子頻帶表可以使用於高頻重建(HFR)方案的情境中,用以從音頻信號的低頻帶信號產生音頻信號的高頻帶信號。該主比例因子頻帶表可以表示高頻帶信號的頻譜包絡的頻率解析度。特別的是,該主比例因子頻帶表可以表示複數比例因子頻帶。該複數比例因子頻帶可與對應的複數比例因子相關聯,其中比例因子頻帶的比例因子係表示比例因子頻帶內原始音頻信號的能量,或表示將應用到比例因子頻帶的樣本之增益因子,以便產生具有近似比例因子頻帶內的原始音頻信號的能量之能量之高頻帶信號。確切的說,該複數比例因子和該複數比例因子頻帶提供對該主比例因子頻帶表(或自其導出的比例因子頻帶表)的該複數比例因子頻帶所涵蓋的頻率範圍內之原始音頻信號的頻譜包絡的近似。
該系統可配置用以接收一組參數。該組參數可包含一或數個參數(例如,起始頻率參數和/或停止頻率參數),其表示預定的比例因子頻帶表的指標。再者,該組參數可 包含選擇參數(例如,主比例因子),其可使用來選擇複數不同預定的比例因子頻帶表的特定一者。
該系統可配置用以提供預定的比例因子頻帶表。特別的是,該系統可配置用以提供複數不同預定的比例因子頻帶表(例如,高位元率比例因子頻帶表和低位元率比例因子頻帶表)。該一或數個預定的比例因子頻帶表可儲存於該系統的記憶體中。替代的是,該一或數個預定的比例因子頻帶表可使用儲存於該系統內的預定公式或規則而產生(無需應用音頻編碼器所產生且傳遞之參數)。換言之,包含該系統的音頻解碼器可配置用以自主方式提供該一或數個預定的比例因子頻帶表(與對應的音頻編碼器無關)。
典型的是,該預定的比例因子頻帶表的該等比例因子頻帶的至少一者包含複數頻帶。可使用時域到頻域轉換或濾波器組(諸如正交鏡相濾波器(QMF)組)將音頻信號從時域轉換成頻域。特別的是,音頻信號可轉換成複數次頻帶信號用於對應的複數頻帶(例如,範圍為頻帶指標0到頻帶指標63的64個頻帶)。該等頻帶可分組成包含一、二、三、四或更多個頻帶的比例因子頻帶。包含在預定的比例因子頻帶表的比例因子頻帶內之頻帶數量可隨著增大的頻率而增加。特別的是,每比例因子頻帶中的頻帶數量可依據聲響心理考量而選定。經由實例,預定的比例因子頻帶表的比例因子頻帶可依據巴克(Bark)標度。
該系統可配置成透過使用該組參數來選定該預定的比例因子頻帶表的該等比例因子頻帶的一部分或全部,而決 定該主比例因子頻帶表。特別的是,該主比例因子頻帶表可透過使用來自該組參數的至少一個參數截斷該預定的比例因子頻帶表而決定。換言之,主比例因子頻帶表可包含該預定的比例因子頻帶表的的子集或全部比例因子頻帶(依據來自該組參數中的至少一參數)。確切的說,該主比例因子頻帶表可專有地包含該預定的比例因子頻帶表內所包含的比例因子頻帶。換言之,該主比例因子頻帶表可包含僅取自該預定的比例因子頻帶表的比例因子頻帶。
透過使用一或數個預定的比例因子頻帶表和一組參數用以自該一或數個預定的比例因子頻帶表的其中一者選定一或數個比例因子頻帶,該主比例因子頻帶表(其係使用於HFR方案的情境中)可以計算上有效的方式而決定。因此,可降低音頻解碼器的成本。再者,用於自音頻編碼器將該組參數傳遞到對應的音頻解碼器之信令負擔可保持小,因此提供位元率有效方案用於將該主比例因子頻帶表自音頻編碼器用信號傳遞到音頻解碼器。這允許該組參數以週期性方式(例如,用於每一訊框)被包括在自音頻編碼器傳遞到音頻解碼器之音頻位元流中,因此能夠致使廣播和/或編接應用。
如以上所指出的,該組參數可包含起始頻率參數,其係表示具有該主比例因子頻帶表的該等比例因子頻帶的最低頻率之該主比例因子頻帶表的比例因子頻帶。特別的是,該起始頻率參數可以表示對應於該主比例因子頻帶表的最低比例因子頻帶(關於頻率的最低)的下限之頻率分 格(frequency bin)。該起始頻率參數可包含採用例如0和7之間的值之3位元值。該系統可配置用以移除在用於決定該主比例因子頻帶表之該預定的比例因子頻帶表的較低頻率端之零、一或數個比例因子頻帶。特別的是,該系統可配置用以移除在該預定的比例因子頻帶表的較低頻率端之偶數的比例因子頻帶,其中該偶數係該起始頻率參數的二倍。確切的說,該起始頻率參數可被用來截斷該預定的比例因子頻帶表的較低頻率端,以便決定該主比例因子頻帶表。
替代的或此外,該組參數可包含停止頻率參數,其係表示具有該主比例因子頻帶表的該等比例因子頻帶的最高頻率之該主比例因子頻帶表的該比例因子頻帶。特別的是,該停止頻率參數可以表示對應於該主比例因子頻帶表的最高比例因子頻帶(關於頻率的最高)的上限之頻率分格。該停止頻率參數可包含採用例如0和3之間的值之2位元值。該系統可配置用以移除在用於決定該主比例因子頻帶表之該預定的比例因子頻帶表的較高頻率端之零、一或數個比例因子頻帶。特別的是,該系統可配置用以移除在該預定的比例因子頻帶表的較高頻率端之偶數的比例因子頻帶,其中該偶數係該停止頻率參數的二倍。確切的說,該停止頻率參數可被用來截斷該預定的比例因子頻帶表的較高頻率端,以便決定該主比例因子頻帶表。
如以上所指出的,該系統可配置用以提供複數預定的比例因子頻帶表。該複數預定的比例因子頻帶表可包含低 位元率比例因子頻帶表和高位元率比例因子頻帶表。特別的是,該系統可配置用以提供恰好二個預定的比例因子頻帶表,亦即,低位元率比例因子頻帶表和高位元率比例因子頻帶表。該組參數可包含主比例參數,其係表示該複數預定的比例因子頻帶表的(恰好)一者,其將使用來決定該主比例因子頻帶表。特別的是,該主比例因子頻帶表可包含採用例如0和1之間的值之1位元值,用以辨別該低位元率比例因子頻帶表和該高位元率比例因子頻帶表。使用複數不同預定的比例因子頻帶表可以是有利的,使HFR方案適合於編碼的音頻位元流的位元率。
該低位元率比例因子頻帶表可包含比該高位元率比例因子頻帶表的任一比例因子頻帶更低的頻率之一或數個比例因子頻帶。替代的或此外,該高位元率比例因子頻帶表可包含比該低位元率比例因子頻帶表的任一比例因子頻帶更高的頻率之一或數個比例因子頻帶。換言之,該低位元率比例因子頻帶表可包含在第一低頻率分格到第一高頻率分格的範圍內之一或數個比例因子頻帶。確切的說,該低位元率比例因子頻帶表可由第一低頻率分格和第一高頻率分格所約束。以類似方式,該高位元率比例因子頻帶表可包含在第二低頻率分格到第二高頻率分格的範圍內之一或數個比例因子頻帶。確切的說,該高位元率比例因子頻帶表可由第二低頻率分格和第二高頻率分格所約束。該第一低頻率分格可以在比該第二低頻率分格更低的頻率(或可具有更低的指標)。替代的或此外,該第二高頻率分格可 以在比該第一高頻率分格更高的頻率(或可具有更高的指標)。再者,包含在該高位元率比例因子頻帶表內之比例因子頻帶的數量可以是高於包含在該低位元率比例因子頻帶表內之比例因子頻帶的數量。因此,該預定的比例因子頻帶表可依據在相對低的位元率的例子中,由低頻帶信號涵蓋的頻率範圍係低於在相對高的位元率的例子之觀察進行設計。再者,該預定的比例因子頻帶表可依據在相對高的位元率的例子中,位元率和感知品質之間的改善取捨可透過擴大高頻帶信號的頻率範圍而達成之觀察進行設計。
音頻信號的低頻帶信號和高頻帶信號可涵蓋總共64個頻帶(例如,QMF頻帶或複合QMF(即CQMF)頻帶),在頻帶指標0到頻帶指標63的範圍。換言之,該等頻帶可相當於由具有在0到63的頻帶指標範圍之64個通道濾波器組所產生的頻帶。低位元率比例因子頻帶表包含以下的一部分或全部:自頻帶10上至頻帶20之比例因子頻帶,每一比例因子頻帶包含單一頻帶;自頻帶20上至頻帶32之比例因子頻帶,每一比例因子頻帶包含二個頻帶;自頻帶32上至頻帶38之比例因子頻帶,每一比例因子頻帶包含三個頻帶;和/或自頻帶38上至頻帶46之比例因子頻帶,每一比例因子頻帶包含四個頻帶。高位元率比例因子頻帶表包含以下的一部分或全部:自頻帶18上至頻帶24之比例因子頻帶,每一比例因子頻帶包含單一頻帶;自頻帶24上至頻帶44之比例因子頻帶,每一比例因子頻帶包含二個頻帶;和/或自頻帶44上至頻帶62之 比例因子頻帶,每一比例因子頻帶包含三個頻帶。
包含在該預定的比例因子頻帶表內的比例因子頻帶的數量和/或包含在該主比例因子頻帶表內的比例因子頻帶的數量可以是偶數。這可以透過使用包含偶數的比例因子頻帶之該預定的比例因子頻帶表以及透過用偶數的比例因子頻帶截斷該預定的比例因子頻帶表而達成。偶數的比例因子頻帶的使用係有利於HFR過程的情境,因為偶數的比例因子頻帶的使用確保低解析度頻帶表將是高解析度頻帶表的精確抽取。
該系統可配置成基於該主比例因子頻帶表,決定高解析度頻帶表和低解析度頻帶表。該高解析度頻帶表可與相對低的時序解析度(亦即,包含相對高數量的樣本之訊框)一起使用,以及該低解析度頻帶表可與相對高的時序解析度(亦即,包含相對低數量的樣本之訊框)一起使用。在這情境中,該組參數可包含交換頻帶參數,該參數係表示在該主比例因子頻帶表的較低頻率端之零、一或數個比例因子頻帶,其將自高頻重建排除。該交換頻帶參數可包含採用0和3或7之間的值之2或3位元值,用以指出在該主比例因子頻帶表的該較低頻率端之該0上至3或7個將被排除的比例因子頻帶。該系統可配置成根據該交換頻帶參數,透過排除在該主比例因子頻帶表的該較低頻率端之該零、一或數個比例因子頻帶,自該主比例因子頻帶表,決定該高解析度頻帶表和該低解析度頻帶表。特別的是,其中該高解析度頻帶表可相當於根據該交換頻帶參數予以 排除的,不具有在主比例因子頻帶表的較低頻率端之零、一或數個比例因子頻帶的主比例因子頻帶表。再者,該系統可配置成透過取樣(decimating)該高解析度頻帶表(例如,以2的倍數)用以決定該低解析度頻帶表。確切的說,使用預定的比例因子頻帶表和產生的具有偶數的比例因子頻帶之主比例因子頻帶表可有利於以計算上有效的方式產生低解析度頻帶表。
應注意到的是,該系統可進一步配置用以自該主比例因子頻帶表決定噪音頻帶表和/或限制器頻帶表(其亦可被使用於HFR方案的情境中)。再者,HFR方案中所使用的轉置之修補方案可基於該主比例因子頻帶表和/或基於該高和低解析度頻帶表而決定。
低頻帶信號和高頻帶信號可分段成一序列的訊框,其包含該音頻信號之預定數量的樣本。該系統可配置用以接收更新的一組參數,用於來自該序列的訊框之一組訊框。該組訊框可包含預定數量的訊框(例如,一、二或更多個訊框)。更新的一組參數可被接收用於每一組訊框(以週期性方式)。該系統可配置成如果影響該主比例因子頻帶表之更新的該組參數中的一或數個參數(例如,該起始頻率參數、該停止頻率參數和/或該主比例參數)保持不變,保持該主比例因子頻帶表不變。該主比例因子頻帶表可被用於執行該組訊框的所有訊框之HFR方案。另一方面,該系統可配置成如果影響該主比例因子頻帶表之更新的該組參數中的該一或數個參數(例如,該起始頻率參數、該 停止頻率參數和/或該主比例參數)改變,決定更新的主比例因子頻帶表。該更新的主比例因子頻帶表可被用於執行該組訊框的所有訊框之HFR方案,直到進一步更新的主比例因子頻帶表被決定(受到修正的一組參數的接收)。確切的說,該主比例因子頻帶表的修正可透過一或數個修正的參數以有效方式引發,該修正的參數影響該主比例因子頻帶表,亦即,透過傳遞例如修正的起始頻率參數、修正的停止頻率參數和/或修正的主比例參數。
依據進一步態樣,描述一種高頻重建(HFR)單元,配置用以自音頻信號的低頻帶信號產生該音頻信號的高頻帶信號。該高頻重建單元可包含分析濾波器組(例如,QMF組),配置用以決定一或數個低頻帶次頻帶信號。再者,該HFR單元可包含轉置單元,配置用以將該一或數個低頻帶次頻帶信號轉置到高頻帶頻率範圍,以產生轉置的次頻帶信號(例如,使用複製過程)。此外,該HFR單元可包含上述的系統,以便決定用於高頻帶信號的比例因子頻帶表,其中該比例因子頻帶表包含涵蓋高頻帶頻率範圍之複數比例因子頻帶。再者,該HFR單元或包含該HFR單元之音頻解碼器可包含包絡調整單元,其係配置用以分別接收該複數比例因子頻帶的複數比例因子。該包絡調整單元可進一步配置用以根據該複數比例因子頻帶,透過該複數比例因子,加權或按比例調整該等轉置的次頻帶信號,以產生按比例調整的次頻帶信號(亦稱為按比例調整的HFR次頻帶信號)。高頻帶可基於該按比例調整的次 頻帶信號而決定。為這目的,該HFR單元或包含該HFR單元之音頻解碼器可包含合成濾波器組(例如,反向的QMF濾波器組),配置用以決定來自該等加權的轉置次頻帶的該高頻帶信號。特別的是,該合成濾波器組可配置用以自該一或數個低頻帶次頻帶信號和自該按比例調整的HFR次頻帶信號,決定重建的音頻信號(於時域中)。
依據另一態樣,描述一種配置用以自位元流決定重建的音頻信號之音頻解碼器。該音頻解碼器包含核心解碼器(例如,AAC解碼器),配置用以透過解碼該位元流的數部分,決定該重建的音頻信號的低頻帶信號。再者,該音頻解碼器包含高頻重建單元,配置用以決定該重建的音頻信號的高頻帶信號。特別的是,上述的合成濾波器組可被用以從自該低頻帶信號所導出之低頻帶次頻帶信號和從按比例調整的次頻帶信號(表示該高頻帶信號),決定該重建的音頻信號。
依據另一態樣,描述一種配置用以決定且傳遞一組參數之音頻編碼器。該組參數可與表示音頻信號的低頻帶信號之位元流一起傳遞。該組參數能夠致使對應的音頻解碼器透過使用該組參數選定預定的比例因子頻帶表的比例因子頻帶的一部分或全部,而決定主比例因子頻帶表。該主比例因子頻帶表係使用於高頻重建方案的情境中,用以自音頻信號的低頻帶信號決定該音頻信號的高頻帶信號。
依據進一步態樣,描述一種表示音頻信號的低頻帶信號和一組參數之位元流。該組參數能夠致使音頻解碼器透 過使用該組參數選定預定的比例因子頻帶表的比例因子頻帶的一部分或全部,而決定主比例因子頻帶表。該主比例因子頻帶表係使用於高頻重建方案的情境中,用以自該音頻信號的該低頻帶信號決定該音頻信號的高頻帶信號。
依據另一態樣,描述一種用於決定音頻信號的高頻帶信號之主比例因子頻帶表之方法。該高頻帶信號將使用高頻重建方案,產生自該音頻信號的低頻帶信號。該主比例因子頻帶表可表示該高頻帶信號的頻譜包絡的頻率解析度。該方法可包含接收一組參數,以及提供預定的比例因子頻帶表。該預定的比例因子頻帶表的比例因子頻帶的至少一者可包含複數頻帶。該方法可進一步包含使用(僅)透過該組參數選定該預定的比例因子頻帶表的該等比例因子頻帶的一部分或全部,而決定該主比例因子頻帶表。確切的說,該主比例因子頻帶表可單獨地基於選擇操作而決定,無需進一步計算。因此,該主比例因子頻帶表可以計算上有效的方式來決定。
依據進一步態樣,描述一種軟體程式。該軟體程式可適用於處理器上的執行以及用於當實施在該處理器上時,執行本文件中所概述的方法步驟。
依據另一態樣,描述一種儲存媒體。該儲存媒體可包含可適用於處理器上的執行以及用於當實施在該處理器上時,執行本文件中所概述的方法步驟之軟體程式。
依據進一步態樣,描述一種電腦程式產品。該電腦程式可包含可執行指令,用於當執行在電腦上時,執行本文 件中所概述的方法步驟。
應注意的是,包括本專利申請案中所概述的較佳實施例之方法和系統可獨立地使用或與本文件中所揭示的其它方法和系統結合一起使用。再者,本專利申請案中所概述的方法和系統的所有態樣可任意地結合。特別的是,申請專利範圍的特徵可以任意方式相互結合。
10‧‧‧頻帶
18‧‧‧頻帶
20‧‧‧頻帶
24‧‧‧頻帶
32‧‧‧頻帶
38‧‧‧頻帶
44‧‧‧頻帶
46‧‧‧頻帶
50‧‧‧頻帶
62‧‧‧頻帶
100‧‧‧頻譜
101‧‧‧低頻帶信號
105‧‧‧高頻帶信號
110‧‧‧頻譜
111‧‧‧低頻帶信號
115‧‧‧高頻帶信號
130‧‧‧頻帶
200‧‧‧因子頻帶分割
201‧‧‧參照數字
202‧‧‧參照數字
210‧‧‧因子頻帶分割
211‧‧‧參照數字
212‧‧‧參照數字
220‧‧‧頻帶
300‧‧‧上半部
301‧‧‧線
302‧‧‧較低的菱形標記
303‧‧‧較高的菱形標記
310‧‧‧下半部
311‧‧‧線
312‧‧‧較低的菱形標記
313‧‧‧較高的菱形標記
320‧‧‧上半圖
321‧‧‧線
322‧‧‧較低的菱形標記
323‧‧‧較高的菱形標記
324‧‧‧頻帶
330‧‧‧下半圖
331‧‧‧線
332‧‧‧較低的菱形標記
333‧‧‧較高的菱形標記
334‧‧‧頻帶
400‧‧‧方法
401‧‧‧接收
402‧‧‧提供
403‧‧‧決定
以下參照附圖以示範性方式說明本發明,其中圖1顯示實例的低頻帶和高頻帶信號;圖2顯示實例的比例因子頻帶表;圖3a和3b顯示實例的主比例因子頻帶表的比較;及圖4顯示用於使用預定的比例因子頻帶表產生高頻帶信號之實例方法。
利用HFR(高頻重建)技術之音頻解碼器包含HFR單元用於自低頻音頻信號(稱為低頻帶信號)產生高頻音頻信號(稱為高頻帶信號)、及後續的頻譜包絡調整單元用於調整高頻音頻信號的頻譜包絡。
於圖1中,顯示在進入包絡調整器之前,文體上繪製之HFR單元的輸出的頻譜100、110。在上圖中,使用複製(copy-up)方法(具有二個修補),自低頻帶信號101產生高頻帶信號105,例如,MPEG-4 SBR(頻譜帶複製) 中所使用之複製方法,其係概述於”ISO/IEC 14496-3資訊技術-音頻-視頻物件的編碼-第3部分:音頻”中,且其以參考方式併入做為參考。複製方法將較低頻率101的部分轉譯到較高頻率105。在下圖中,使用諧波轉置方法(具有二個非重疊轉置順序),自低頻帶信號111產生高頻帶信號115,例如,MPEG-D USAC的諧波轉置方法,其係說明於”MPEG-D USAC:ISO/IEC 23003-3-統一的語音和音頻編碼”中,且以參考方式併入。於後續的包絡調整階段中,目標頻譜包絡係應用至高頻分量105、115。
除了頻譜100、110,圖1亦圖示表示目標頻譜包絡之頻譜包絡資料的實例頻帶130。這些頻帶130係稱為比例因子頻帶或目標間距。典型的是,目標能量值,亦即,比例因子能量(或比例因子),係指定用於每一目標間距,即用於每一比例因子頻帶。換言之,比例因子頻帶界定目標頻譜包絡的有效頻率解析度,因為典型地每目標間距僅有單一目標能量值。使用指定用於比例因子頻帶之比例因子或目標能量,後續的包絡調整器努力調整包頻帶信號,使得比例因子頻帶內之高頻帶信號的能量等於所接收頻譜包絡資料的能量,亦即,目標能量,用於各別的比例因子頻帶。
本文件係針對用於決定在音頻解碼器的頻帶表(其係表示將使用在HFR或SBR過程內之比例因子頻帶130)之有效方案。再者,本文件係針對減少自音頻編碼器將頻 帶表(稱為比例因子頻帶表)傳遞到對應的音頻解碼器的信令負擔。此外,本文件係針對簡化音頻編碼器的調諧。
用以決定在音頻解碼器之頻帶表(特別是主比例因子頻帶表)之可能方法係基於預界定的演算法,其利用已傳遞到音頻解碼器之參數。在運轉期間,執行預界定的演算法以基於所發送參數計算頻帶表。預界定的演算法提供所謂的”主表”(亦稱為主比例因子頻帶表)。所計算的”主表”可接著被用來導出正確地解碼所需之一組表,且應用對應於高頻重建演算法之參數資料(例如,高解析度頻帶表、低解析度頻帶表、噪音頻帶表和/或限制器頻帶表)。
上述之用於決定頻帶表的方案係不利的,因為它需要音頻解碼器所使用之參數的傳遞用以計算”主表”。再者,用以計算”主表”之預定演算法的執行需要音頻解碼器的計算資源,且因此增加音頻解碼器的成本。
在本文件中提出了,利用一或數個預定的、靜態的比例因子頻帶表。特別是,提出界定二個靜態比例因子頻帶表,第一表用於低位元率以及第二表用於高位元率。音頻解碼器重建高頻帶信號105所需的包括主表的其它表,可接著自靜態預界定表導出。其它表(特別是主比例因子頻帶表)的導出可透過以資料流(亦稱為位元流)內自音頻編碼器傳遞到音頻解碼器之參數,建立預界定的主比例因子頻帶表索引,以有效方式完成。
第一和第二靜態比例因子頻帶表可以Matlab符號界定為: ‧第一表:sfbTableLow=[(10:20)';(22:2:32)';(35:3:38)';(42:4:46)'];及‧第二表:sfbTableHigh=[(18:24)';(26:2:44)';(47:3:62)'];分別提供比例因子頻帶分割210和200,如圖2中(實線)所示。在上述的Matlab符號中,數字表示個別的頻帶220(例如,正交鏡相濾波器組(QMF)頻帶或複合值QMF(CQMF)頻帶)。第一表(亦即,低位元率比例因子頻帶表)起始於頻帶10(參照數字201),且上升到頻帶46(參照數字202)。第二表(亦即,高位元率比例因子頻帶表)起始於頻帶18(參照數字211),且上升到頻帶62(參照數字212)。確切的說,第一表(用於相對低位元率,例如,低於預定的位元率閾值)包含:‧自頻帶10至20之比例因子頻帶130,其每一者包含單一頻帶220,‧自頻帶20至32之比例因子頻帶130,其每一者包含二個頻帶220,‧自頻帶32至38之比例因子頻帶130,其每一者包含三個頻帶220,及‧自頻帶38至46之比例因子頻帶130,其每一者包含四個頻帶220。
以類似方式,第二表(用於相對高位元率,例如,高於預定的位元率閾值)包含:‧自頻帶18至24之比例因子頻帶130,其每一者 包含單一頻帶220,‧自頻帶24至44之比例因子頻帶130,其每一者包含二個頻帶220,及‧自頻帶44至62之比例因子頻帶130,其每一者包含三個頻帶220。
如可自圖2所看到的,低位元率比例因子頻帶表200起始於CQMF頻帶10且上升到頻帶46,具有多達20個比例因子頻帶130。高位元率比例因子頻帶表210支援多達22個比例因子頻帶130,其範圍自頻帶18至頻帶62。
為了自靜態比例因子頻帶表200、210導出將被用於解碼現行訊框的主表,可使用三個參數。這些參數可自音頻編碼器傳遞到音頻解碼器,以便能夠使音頻解碼器導出主表用於現行訊框(亦即,為了導出現行主表)。這些參數為:
1.起始頻率(startFreq)參數:起始頻率參數可具有3位元的長度且可採用0和7之間的值。起始頻率參數可以是預定的比例因子頻帶表200、210之指標,起始自各別比例因子頻帶表200、210的最低頻帶201、211(亦即,頻帶10或18)以二個比例因子頻帶130為階向上移動。因此對於高位元率比例因子頻帶表210,參數值startFreq=1將指向頻帶20。
2.停止頻率(stopFreq)參數:停止頻率參數可具有2位元的長度且可採用0和4之間的值。停止頻率參數可以是預定的比例因子頻帶表200、210之指標,起始自 最高頻帶(46或62),以二個比例因子頻帶130為階向下移動。因此對於高位元率比例因子頻帶表210,參數值stopFreq=2將指向頻帶50。
3.主比例(masterScale)參數:主比例參數可具有1位元的長度且可採用0和1之間的值。主比例參數可指出目前正使用該二個預定的比例因子頻帶表200、210的哪一個。經由實例,參數值masterScale=0可表示低位元率比例因子頻帶表200,以及參數值masterScale=1可表示高位元率比例因子頻帶表210。
以下的表1和2分別列出用於低位元率比例因子頻帶表200和用於高位元率比例因子頻帶表210之可能的起始和停止頻帶,其使用48000Hz的取樣頻率。
使用主比例參數,編碼器可對解碼器指出,預定的比例因子頻帶表200、210之哪一者將被使用來導出主比例因子頻帶表。使用起始頻率參數和停止頻率參數,如表1和2中所列出,可決定實際的主比例因子頻帶表。經由實例,對於masterScale=0、startFreq=1和stopFreq=2,主比例因子頻帶表包含來自低位元率比例因子頻帶表200之比例因子頻帶,其範圍自頻帶12至頻帶32。
主比例因子頻帶表可相當於被用來執行用於音頻信號的連續分段之HFR之高解析度頻帶表。低解析度頻帶表,可透過例如以2的倍數取樣(decimating)高解析度頻帶表,而導出自主比例因子頻帶表。低解析度頻帶表可被使用於音頻信號的瞬時分段(以便在頻率解析度被降低之情況下,允許時序解析度增加)。從表1和2可看到,用於高解析度頻帶表210之比例因子頻帶130的數量可以是 偶數。因此,低解析度頻帶表可以是以2的倍數對高解析度表的完美抽樣。再者,如從表1和2可看到,頻帶表一直是起始且結束在偶數的CQMF頻帶220。
影響現行使用的頻帶表之第四參數可以是交換頻帶(xOverBand)參數。交換頻帶參數可具有2或3位元的長度,且可採用0和3(7)之間的值。xOverBand參數可以是高解析度頻帶表(或主比例因子頻帶表)之指標,起始自第一分格,以一比例因子頻帶130為階向上移動。因此,使用xOverBand參數將有效地截斷高解析度頻帶表和/或主比例因子頻帶表的開頭。xOverBand參數可被用來擴大低頻帶信號101的頻率範圍和/或縮小高頻帶信號105的頻率範圍。因為xOverBand參數透過截斷現存的表來改變HFR頻寬,且特別的是,無需改變轉置器修補方案,xOverBand參數可被用來在運轉期間改變頻寬而不會有聽覺雜訊(audible artifact),或可被用來允許不同的HFR頻寬於多通道配置中,同時所有通道仍使用相同的修補方案。對於xOverBand參數的一些選擇,高和低解析度頻帶表的第一比例因子頻帶將是相同的(例如,如圖3b中可看到的)。
圖3a和3b顯示已基於預定的比例因子頻帶表200、210導出之主比例因子頻帶表,和已使用演算法途徑導出之主比例因子頻帶表的比較。圖3a顯示22kbps相對低位元率(單聲/參數立體聲)的情況。示意圖的上半部300顯示已使用靜態低位元率的比例因子頻帶表200導出之主比 例因子頻帶表,以及示意圖的下半部310顯示已使用演算法途徑導出之主比例因子頻帶表。線301、311表示各別主比例因子頻帶表的比例因子頻帶的界線。較低的菱形標記302、312表示高解析度比例因子頻帶表的界線,而較高的菱形標記303、313表示低解析度比例因子頻帶表的界線。可看到的是,使用靜態預定的比例因子頻帶表200、210導出之主比例因子頻帶表係實質上相同於使用演算法途徑導出之主比例因子頻帶表。
圖3b顯示具有76kb/s的位元率之相對高位元率立體聲的例子。在這例子中,高位元率比例因子頻帶表210已被使用以決定主比例因子頻帶表。同樣的,示意圖的上半圖320顯示已使用靜態低位元率的比例因子頻帶表210導出之主比例因子頻帶表,而示意圖的下半圖330顯示已使用演算法途徑導出之主比例因子頻帶表。線321、331表示各別主比例因子頻帶表的比例因子頻帶表的界線。較低的菱形標記322、332表示高解析度比例因子頻帶表的界線,而較高的菱形標記323、333表示低解析度比例因子頻帶表的界線。同樣的,可看到的是,使用靜態預定的比例因子頻帶表200、210導出之主比例因子頻帶表係實質上相同於使用演算法途徑導出之主比例因子頻帶表。
在圖3b的實例中,xOverBand參數已設定為不等於零的值。特別的是,針對算法途徑,xOverBand參數已設定為2,而針對已在本文件中描述的途徑,xOverBand參數已設定為1。由於使用xOverBand參數,等於 xOverBand參數之一些頻帶324、334被從高解析度表和低解析度表排除。
現行的主比例因子頻帶表(亦稱為現行主表)可以透過使用表3中所列出的虛擬碼之音頻解碼器而導出。
在表3的虛擬碼中,如果以下參數任一者已自先前訊框改變:主比例(masterScale)參數、起始頻率(startFreq)參數和/或停止頻率(stopFreq)參數,則參數masterReset被設定為1。確切的說,收到已改變的主比例參數、起始頻率參數和/或停止頻率參數引發在音頻解碼器之新的主表的決定。使用現行的主表直到新的(更新的)主表被決定(按照已改變的主比例參數、起始頻率參 數和/或停止頻率參數)。
在表3的虛擬碼中,(masterBandTable)為所導出的主比例因子頻帶表,以及nMfb為所導出的主比例因子頻帶表中之比例因子頻帶的數量。自所導出的主比例因子頻帶表,使用於HFR過程中之所有其它表(例如,高和低解析度頻帶表,噪音頻帶表和限制器頻帶表)可依據傳統SBR方法導出,該方法係定義於例如”ISO/IEC 14496-3資訊技術-音頻-視頻物件的編碼-第3部分:音頻”中,其係併入作為參考。
圖4顯示用於決定音頻信號的高頻帶信號105、115的主比例因子頻帶表之實例方法400的流程圖。換言之,方法400係針對決定主比例因子頻帶表(亦稱為主表),其係使用於HFR方案的情境中以自音頻信號的低頻帶信號101、111產生高頻帶信號105、115。主比例因子頻帶表表示高頻帶信號105、115的頻譜包絡的頻率解析度。方法400包含接收步驟,接收401一組參數(例如,起始頻率參數、停止頻率參數和/或主比例參數)。再者,方法400包含提供步驟402,提供預定的比例因子頻帶表200、210。此外,方法400包含決定步驟403,透過使用該組參數選定預定的比例因子頻帶表200、210的比例因子頻帶130的一部分或全部而決定主比例因子頻帶表。
在本文件中,描述導出用於HFR之比例因子頻帶表的有效方案。該方案利用一或數個預定的比例因子頻帶表,自該預定的比例因子頻帶表導出用於HFR(例如,用 於SBR)的主比例因子頻帶表。為了這目的,一組參數被插入從音頻編碼器傳輸到音頻解碼器之位元流中,因此能夠使音頻解碼器決定主比例因子頻帶表。主比例因子頻帶表的決定僅存在於表查詢操作,因此提供用於決定主比例因子頻帶表之計算上有效的方案。此外,插入位元流中之該組參數可以位元率有效方式進行編碼。
本文件中所述之方法和系統可實施作為軟體、韌體和/或硬體。某些組件可例如實施作為運作在數位信號處理器或微處理器上之軟體。其它組件可例如實施作為硬體和/或特定應用積體電路。上述方法和系統中所遇到的信號可儲存在諸如隨機存取記憶體或光學儲存媒體之媒體上。它們可以經由網路進行轉移,諸如無線電網路、衛星網路、無線網路或有線網路,例如,網際網路。利用本文件中所述之方法和系統之典型裝置是可攜式電子裝置或使用來儲存和/或提供音頻信號之其它消費者設備。
130‧‧‧頻帶
200‧‧‧因子頻帶分割
201‧‧‧參照數字
202‧‧‧參照數字
210‧‧‧因子頻帶分割
211‧‧‧參照數字
212‧‧‧參照數字
220‧‧‧頻帶

Claims (34)

  1. 一種配置用以決定音頻信號的高頻帶信號(105)的主比例因子頻帶表之系統,其將使用高頻重建方案產生自該音頻信號的低頻帶信號(101);其中該主比例因子頻帶表係表示該高頻帶信號(105)的頻譜包絡的頻率解析度;其中該系統係配置用以:接收一組參數;提供預定的比例因子頻帶表(200、210);其中該預定的比例因子頻帶表(200、210)的比例因子頻帶(130)的至少一者包含複數頻帶(220);及透過使用該組參數選定該預定的比例因子頻帶表(200、210)的該等比例因子頻帶(130)的一部分或全部,決定該主比例因子頻帶表。
  2. 如申請專利範圍第1項的系統,其中該主比例因子頻帶表係透過使用該組參數截斷該預定的比例因子頻帶表(200、210)而決定。
  3. 如申請專利範圍第1或2項的系統,其中該主比例因子頻帶表僅包含來自該預定的比例因子頻帶表(200、210)之比例因子頻帶(130)。
  4. 如申請專利範圍第1項的系統,其中該組參數包含起始頻率參數,其係表示具有該主比例因子頻帶表的該比例因子頻帶(130)的最低頻率之該主比例因子頻帶表的該比例因子頻帶(130);及該系統係配置用以移除在用於決定該主比例因子頻帶 表之該預定的比例因子頻帶表(200、210)的較低頻率端之零、一或數個比例因子頻帶(130)。
  5. 如申請專利範圍第4項的系統,其中該起始頻率參數包含採用0和7之間的值之3位元值。
  6. 如申請專利範圍第4或5項的系統,其中該系統係配置用以移除在該預定的比例因子頻帶表(200、210)的該較低頻率端之偶數的比例因子頻帶(130);及該偶數係該起始頻率參數的二倍。
  7. 如申請專利範圍第1項的系統,其中該組參數包含停止頻率參數,其係表示具有該主比例因子頻帶表的該比例因子頻帶(130)的最高頻率之該主比例因子頻帶表的該比例因子頻帶(130);及該系統係配置用以移除在用於決定該主比例因子頻帶表之該預定的比例因子頻帶表(200、210)的較高頻率端之零、一或數個比例因子頻帶(130)。
  8. 如申請專利範圍第7項的系統,其中該停止頻率參數包含採用0和3之間的值之2位元值。
  9. 如申請專利範圍第7或8項的系統,其中該系統係配置用以移除在該預定的比例因子頻帶表(200、210)的該較高頻率端之偶數的比例因子頻帶(130);及該偶數係該停止頻率參數的二倍。
  10. 如申請專利範圍第1項的系統,其中 該系統係配置用以提供複數預定的比例因子頻帶表(200、210);及該組參數包含主比例參數,其係表示該複數預定的比例因子頻帶表(200、210)的其中一者,其將被使用來決定該主比例因子頻帶表。
  11. 如申請專利範圍第10項的系統,其中該複數預定的比例因子頻帶表(200、210)包含低位元率比例因子頻帶表(200)和高位元率比例因子頻帶表(210);及該低位元率比例因子頻帶表(200)包含在比該高位元率比例因子頻帶表(210)的該等比例因子頻帶(130)的任一者更低的頻率之一或數個比例因子頻帶(130);和/或該高位元率比例因子頻帶表(210)包含在比該低位元率比例因子頻帶表(200)的該等比例因子頻帶(130)的任一者更高的頻率之一或數個比例因子頻帶(130)。
  12. 如申請專利範圍第11項的系統,其中該主比例參數包含採用0和1之間的值之1位元值,用以辨別該低位元率比例因子頻帶表(200)和該高位元率比例因子頻帶表(210)。
  13. 如申請專利範圍第11或12項的系統,其中該低位元率比例因子頻帶表(200)包含在第一低頻帶(201)到第一高頻帶(202)的範圍內之一或數個比例因子頻帶(130);及該高位元率比例因子頻帶表(210)包含在第二低頻帶 (211)到第二高頻帶(212)的範圍內之一或數個比例因子頻帶(130);及該第一低頻帶(201)係在比該第二低頻帶(211)更低的頻率;和/或該第二高頻帶(212)係在比該第一高頻帶(202)更高的頻率。
  14. 如申請專利範圍第11項的系統,其中包含在該高位元率比例因子頻帶表(210)內的比例因子頻帶(130)的數量係高於包含在該低位元率比例因子頻帶表(200)內的比例因子頻帶的數量。
  15. 如申請專利範圍第11項的系統,其中該等頻帶(220)相當於由64個通道濾波器組所產生的頻帶;及其中該等頻帶係在頻帶指標0到頻帶指標63的範圍內。
  16. 如申請專利範圍第15項的系統,其中該低位元率比例因子頻帶表(200)包含以下的一部分或全部:自頻帶10上至頻帶20之比例因子頻帶(130),每一者包含單一頻帶;自頻帶20上至頻帶32之比例因子頻帶(130),每一者包含二個頻帶;自頻帶32上至頻帶38之比例因子頻帶(130),每一者包含三個頻帶;和/或自頻帶38上至頻帶46之比例因子頻帶(130),每一者包含四個頻帶。
  17. 如申請專利範圍第15或16項的系統,其中該高 位元率比例因子頻帶表(210)包含以下的一部分或全部:自頻帶18上至頻帶24之比例因子頻帶(130),每一者包含單一頻帶;自頻帶24上至頻帶44之比例因子頻帶(130),每一者包含二個頻帶;和/或自頻帶44上至頻帶62之比例因子頻帶(130),每一者包含三個頻帶。
  18. 如申請專利範圍第1項的系統,其中包含在該預定的比例因子頻帶表(200、210)的該等比例因子頻帶(130)內的頻帶(220)的數量隨著增高的頻率而增加。
  19. 如申請專利範圍第1項的系統,其中包含在該預定的比例因子頻帶表(200、210)內的比例因子頻帶(130)的數量和/或包含在該主比例因子頻帶表內的比例因子頻帶(130)的數量係偶數。
  20. 如申請專利範圍第1項的系統,進一步配置成基於該主比例因子頻帶表,決定高解析度頻帶表和低解析度頻帶表。
  21. 如申請專利範圍第20項的系統,其中該組參數包含交換頻帶參數,該參數係表示在該主比例因子頻帶表的較低頻率端之零、一或數個比例因子頻帶(130),其將自高頻重建排除;及該系統係配置成透過根據該交換頻帶參數排除在該主比例因子頻帶表的該較低頻率端之該零、一或數個比例因子頻帶(130),自該主比例因子頻帶表決定該高解析度頻 帶表和該低解析度頻帶表。
  22. 如申請專利範圍第21項的系統,其中該交換頻帶參數包含採用0和3、或0和7之間的值之2、或3位元值,用以表示在該主比例因子頻帶表的該較低頻率端之將被排除的該0上至3個或0上至7個比例因子頻帶(130)。
  23. 如申請專利範圍第21或22項的系統,其中該高解析度頻帶表相當於該主比例因子頻帶表而無根據該交換頻帶參數被排除的在該主比例因子頻帶表的該較低頻率端之該零、一或數個比例因子頻帶(130)。
  24. 如申請專利範圍第20項的系統,進一步配置成透過取樣(decimating)該高解析度頻帶表而決定該低解析度頻帶表。
  25. 如申請專利範圍第1項的系統,其中該頻帶(220)相當於由正交鏡相濾波器組所產生的頻帶。
  26. 如申請專利範圍第1項的系統,其中低頻帶信號(101)和高頻帶信號(105)係分段成一序列的訊框,其包含該音頻信號之預定數量的樣本;該系統係配置成接收更新的一組參數,用於來自該序列的訊框之一組訊框;該系統係配置成如果影響該主比例因子頻帶表之更新的該組參數中的該一或數個參數保持不變,保持該主比例因子頻帶表不變;及該系統係配置成如果影響該主比例因子頻帶表之更新 的該組參數中的該一或數個參數改變,決定更新的主比例因子頻帶表。
  27. 如申請專利範圍第26項的系統,其中該系統係配置成接收更新的一組參數,用於該序列的訊框之每一訊框。
  28. 如申請專利範圍第1項的系統,進一步配置用以決定噪音頻帶表和/或限制器頻帶表和/或修補方案,用於自該主比例因子頻帶表和/或自該高與低解析度頻帶表之轉置。
  29. 一種高頻重建單元,配置用以自音頻信號的低頻帶信號(101)產生該音頻信號的高頻帶信號(105);其中該高頻重建單元包含申請專利範圍第1至28項中任一項的該系統,用以決定該高頻帶信號(105)的比例因子頻帶表;其中該比例因子頻帶表包含涵蓋高頻帶頻率範圍之複數比例因子頻帶(130);係配置用以將自該低頻帶信號(101)導出的一或數個低頻帶次頻帶信號轉置到該高頻帶頻率範圍,以產生轉置的次頻帶信號;係配置用以分別地接收該複數比例因子頻帶(130)的複數比例因子;及係配置成使用該複數比例因子,根據該複數比例因子頻帶(130),按比例調整該等轉置的次頻帶信號,以產生按比例調整的次頻帶信號;其中該等按比例調整的次頻帶 信號係表示該高頻帶信號(105)。
  30. 如申請專利範圍第29項的高頻重建單元,進一步包含分析濾波器組,配置用以自該低頻帶信號(101)決定該一或數個低頻帶次頻帶信號;及合成濾波器組,配置用以自該等按比例調整的次頻帶信號決定該高頻帶信號(105)。
  31. 一種音頻解碼器,配置用以自位元流決定重建的音頻信號;其中該音頻解碼器包含核心解碼器,配置用以透過解碼該位元流的一部分,決定該重建的音頻信號的低頻帶信號(101);及依據申請專利範圍第29至30項中任一項的高頻重建單元,配置成使用包含於該位元流的另一部分內的一組參數,決定該重建的音頻信號的高頻帶信號(105)。
  32. 一種音頻編碼器,配置用以決定且傳遞一組參數,該組參數能夠致使對應的音頻解碼器透過使用該組參數選定預定的比例因子頻帶表(200、210)的比例因子頻帶(130)的一部分或全部,決定主比例因子頻帶表;其中該主比例因子頻帶表係使用於高頻重建方案中,用以自音頻信號的低頻帶信號(101)產生該音頻信號的高頻帶信號(105)。
  33. 一種配置用以決定音頻信號的高頻帶信號的主比例因子頻帶表之系統,其包含位元流,係表示音頻信號的低頻帶信號(101)和一組參數;其中該組參數能夠致使音 頻解碼器透過使用該組參數選定預定的比例因子頻帶表(200、210)的比例因子頻帶(130)的一部分或全部,決定主比例因子頻帶表;其中該主比例因子頻帶表係使用於高頻重建方案中,用以自該音頻信號的該低頻帶信號(101)產生該音頻信號的高頻帶信號(105)。
  34. 一種用於決定音頻信號的高頻帶信號(105)之主比例因子頻帶表之方法(400),該主比例因子頻帶表將使用高頻重建方案,產生自該音頻信號的低頻帶信號(101);其中該主比例因子頻帶表係表示該高頻帶信號(105)的頻譜包絡的頻率解析度;其中該方法(400)包含接收(401)一組參數;提供(402)預定的比例因子頻帶表(200、210);其中該預定的比例因子頻帶表(200、210)的比例因子頻帶(130)的至少一者包含複數頻帶(220);及決定(403)該主比例因子頻帶表,其係透過使用該組參數選定該預定的比例因子頻帶表(200、210)的該等比例因子頻帶(130)的一部分或全部。
TW103125869A 2013-08-29 2014-07-29 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 TWI557726B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201361871575P 2013-08-29 2013-08-29

Publications (2)

Publication Number Publication Date
TW201521014A TW201521014A (zh) 2015-06-01
TWI557726B true TWI557726B (zh) 2016-11-11

Family

ID=51355520

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103125869A TWI557726B (zh) 2013-08-29 2014-07-29 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法

Country Status (24)

Country Link
US (1) US9842594B2 (zh)
EP (1) EP3008727B1 (zh)
JP (1) JP6392873B2 (zh)
KR (1) KR101786863B1 (zh)
CN (1) CN105556602B (zh)
AR (1) AR097454A1 (zh)
AU (1) AU2014314477B2 (zh)
BR (1) BR112016004157B1 (zh)
CA (1) CA2920816C (zh)
CL (1) CL2016000475A1 (zh)
DK (1) DK3008727T3 (zh)
ES (1) ES2634196T3 (zh)
HK (1) HK1219557A1 (zh)
HU (1) HUE033077T2 (zh)
IL (1) IL243961B (zh)
ME (1) ME02812B (zh)
MX (1) MX355259B (zh)
MY (1) MY183529A (zh)
PL (1) PL3008727T3 (zh)
RU (1) RU2650031C2 (zh)
SG (1) SG11201600830UA (zh)
TW (1) TWI557726B (zh)
UA (1) UA116572C2 (zh)
WO (1) WO2015028297A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10008214B2 (en) * 2015-09-11 2018-06-26 Electronics And Telecommunications Research Institute USAC audio signal encoding/decoding apparatus and method for digital radio services
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010027392A1 (en) * 1998-09-29 2001-10-04 William M. Wiese System and method for processing data from and for multiple channels
US20120275607A1 (en) * 2009-12-16 2012-11-01 Dolby International Ab Sbr bitstream parameter downmix

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE9903552D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
US6912424B2 (en) * 1999-12-01 2005-06-28 Meagan, Medical, Inc. Apparatus and method for coupling therapeutic and/or monitoring equipment to a patient
CN1187735C (zh) * 2000-01-11 2005-02-02 松下电器产业株式会社 多模式话音编码装置和解码装置
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
US7242784B2 (en) * 2001-09-04 2007-07-10 Motorola Inc. Dynamic gain control of audio in a communication device
DE60202881T2 (de) * 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
DE602004007786T2 (de) * 2003-05-01 2008-04-30 Nokia Corp. Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
RU2374703C2 (ru) * 2003-10-30 2009-11-27 Конинклейке Филипс Электроникс Н.В. Кодирование или декодирование аудиосигнала
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
WO2006107833A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) * 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP5065687B2 (ja) * 2007-01-09 2012-11-07 株式会社東芝 オーディオデータ処理装置及び端末装置
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
ES2372014T3 (es) * 2008-07-11 2012-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
TWI520128B (zh) * 2008-10-08 2016-02-01 弗勞恩霍夫爾協會 多解析度切換音訊編碼/解碼方案(一)
RU2523035C2 (ru) * 2008-12-15 2014-07-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудио кодер и декодер, увеличивающий полосу частот
PL3570278T3 (pl) 2010-03-09 2023-03-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rekonstrukcja wysokiej częstotliwości wejściowego sygnału audio przy użyciu kaskadowych banków filtrów
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
KR102632248B1 (ko) * 2010-07-19 2024-02-02 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010027392A1 (en) * 1998-09-29 2001-10-04 William M. Wiese System and method for processing data from and for multiple channels
US20120275607A1 (en) * 2009-12-16 2012-11-01 Dolby International Ab Sbr bitstream parameter downmix

Also Published As

Publication number Publication date
US20160210970A1 (en) 2016-07-21
KR101786863B1 (ko) 2017-10-18
AR097454A1 (es) 2016-03-16
MX2016002421A (es) 2016-06-10
ES2634196T3 (es) 2017-09-27
MY183529A (en) 2021-02-24
KR20160036670A (ko) 2016-04-04
EP3008727A1 (en) 2016-04-20
BR112016004157B1 (pt) 2022-05-17
CA2920816C (en) 2018-04-17
IL243961B (en) 2020-04-30
RU2650031C2 (ru) 2018-04-06
HUE033077T2 (en) 2017-11-28
BR112016004157A2 (zh) 2017-08-01
MX355259B (es) 2018-04-11
TW201521014A (zh) 2015-06-01
WO2015028297A1 (en) 2015-03-05
CN105556602B (zh) 2019-10-01
JP2016535870A (ja) 2016-11-17
HK1219557A1 (zh) 2017-04-07
AU2014314477B2 (en) 2016-11-24
RU2016111311A (ru) 2017-10-04
UA116572C2 (uk) 2018-04-10
CL2016000475A1 (es) 2016-09-23
IL243961A0 (en) 2016-04-21
JP6392873B2 (ja) 2018-09-19
ME02812B (me) 2018-01-20
DK3008727T3 (en) 2017-08-28
AU2014314477A1 (en) 2016-02-25
CA2920816A1 (en) 2015-03-05
CN105556602A (zh) 2016-05-04
EP3008727B1 (en) 2017-06-14
US9842594B2 (en) 2017-12-12
SG11201600830UA (en) 2016-03-30
PL3008727T3 (pl) 2017-10-31

Similar Documents

Publication Publication Date Title
JP6859394B2 (ja) インターリーブされた波形符号化のためのデコード方法、デコーダ、媒体およびエンコード方法
TWI702594B (zh) 用於音訊信號之高頻重建技術之回溯相容整合
JP7413334B2 (ja) オーディオ信号の高周波再構成のための高調波転換器の後方互換な統合
KR20240042120A (ko) 후처리 지연을 저감시킨 고주파 재구성 기술의 통합
TWI557726B (zh) 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
JP6663996B2 (ja) 符号化されたオーディオ信号を処理するための装置および方法
EA044947B1 (ru) Обратно совместимая компоновка гармонического транспозера для реконструкции высоких частот звуковых сигналов