TWI840892B - 音頻編碼器、音頻編碼方法、電腦程式及編碼的多聲道音頻信號 - Google Patents
音頻編碼器、音頻編碼方法、電腦程式及編碼的多聲道音頻信號 Download PDFInfo
- Publication number
- TWI840892B TWI840892B TW111127307A TW111127307A TWI840892B TW I840892 B TWI840892 B TW I840892B TW 111127307 A TW111127307 A TW 111127307A TW 111127307 A TW111127307 A TW 111127307A TW I840892 B TWI840892 B TW I840892B
- Authority
- TW
- Taiwan
- Prior art keywords
- channel
- noise
- frame
- data
- parameter
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 208
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000004590 computer program Methods 0.000 title claims description 12
- 230000000694 effects Effects 0.000 claims abstract description 46
- 238000003780 insertion Methods 0.000 claims description 124
- 230000037431 insertion Effects 0.000 claims description 124
- 239000013598 vector Substances 0.000 claims description 42
- 238000001228 spectrum Methods 0.000 claims description 38
- 230000003595 spectral effect Effects 0.000 claims description 14
- 238000009499 grossing Methods 0.000 claims description 2
- 108091006146 Channels Proteins 0.000 description 709
- 230000000875 corresponding effect Effects 0.000 description 26
- 230000005540 biological transmission Effects 0.000 description 17
- 239000003607 modifier Substances 0.000 description 17
- 238000010183 spectrum analysis Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 14
- 238000013139 quantization Methods 0.000 description 14
- 230000002596 correlated effect Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 13
- 230000001276 controlling effect Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000007493 shaping process Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000005284 excitation Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 4
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 3
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 3
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007667 floating Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 1
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereo-Broadcasting Methods (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuits Of Receivers In General (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本發明提供一種音頻編碼器,用於為包括活動幀及非活動幀的幀序列生成編碼的多聲道音頻信號,包括:一活動檢測器,分析多聲道信號以判斷幀序列中的一個幀是非活動幀;一噪音參數計算器,計算多聲道信號的第一及第二聲道的第一及第二參數噪音資料;一相關性計算器,計算指示在非活動幀中的第一與第二聲道之間的相關情況的相關性資料;及一輸出介面,產生編碼的多聲道音頻信號,其具有活動幀的編碼音頻資料,及非活動幀的第一參數噪音資料、第二參數噪音資料、及/或第一與第二參數噪音資料的第一及第二線性組合,以及相關性資料。
Description
本發明特別關於用於在立體聲編解碼器中致能不連續傳輸(DTX)的柔和噪音生成(CNG)。本發明亦關於多聲道信號產生器、音頻編碼器及相關方法,例如依賴混合噪音信號。本發明可以實現於裝置、設備、系統、方法、記錄有指令的非暫時性儲存單元、及在編碼的多聲道音頻信號中,其中,當電腦(處理器、控制器)執行上述指令時,能夠讓電腦(處理器、控制器)執行特定方法。
柔和噪音產生器通常用於音頻信號的非連續傳輸(DTX),尤其是包含語音的音頻信號。在這種模式下,音頻信號首先由語音活動檢測器(VAD)分為活動幀和非活動幀,根據VAD的結果,僅活動語音幀以標稱位元率進行編碼和傳輸。在僅存在背景噪音的長暫停期間,位元率被降低或歸零,並且使用靜音插入描述符幀(SID幀)對背景噪音進行參數化編碼,藉以明顯降低平均位元率。
噪音是在解碼器端的非活動幀期間由柔和噪音產生器(CNG)生成的,SID幀的大小在實際中非常有限,因此,描述背景噪音的參數數量必須盡可能小。為達此目的,噪音估計不直接應用於頻譜變換的輸出,相反地,其通過對頻帶組之間的輸入功率頻譜進行平均來應用於較低的頻譜解析度,例如,遵循巴克標度(Bark scale),平均步驟可以通過算術或幾何方法來實現。不幸的是,在SID幀中傳輸的有限數量的參數不允許獲取背景噪音的精細頻譜結構,因此,CNG只能再現噪音的平滑頻譜封包。當VAD觸發CNG幀時,重建的柔和噪音的平滑頻譜與實際背景噪音的頻譜之間的差異在活動幀和CNG幀之間的轉換處會變得非常明顯(涉及對信號中的噪音語音部分的常規編碼和解碼)。
一些典型的CNG技術可以在ITU-T建議書的G.729B [1]、G.729.1C [2]、G.718 [3],或是AMR [4]及AMR-WB [5]的3GPP規範中找到,所有這些技術都通過使用線性預測(LP)的分析/合成方法產生柔和噪音(CN)。
為了進一步降低傳輸速率,LTE [6]的增強型語音服務(EVS)的3GPP電信編解碼器配備了不連續傳輸(DTX)模式,用以對非活動幀應用柔和噪音生成(CNG),非活動幀亦即被判斷為僅由背景噪音組成的幀。對於這些幀,信號的低速率參數表示最多每8幀(160毫秒)由靜音插入描述符(SID)幀傳送,這允許解碼器中的CNG產生類似於實際背景噪音的人工噪音信號。在EVS中,根據背景噪音的頻譜特性,可以使用線性預測方案(LP-CNG)或頻域方案(FD-CNG)來實現CNG。
在EVS[7]中的LP-CNG方法在分帶基礎上運行,其編碼步驟包括低頻帶和高頻帶分析/合成編碼階段。與低頻帶編碼相反,沒有對高頻帶信號執行高頻帶噪音頻譜的參數建模,只有高頻帶信號的能量被編碼並傳輸到解碼器,而高頻帶噪音頻譜純粹在解碼器側產生。低頻帶和高頻帶CN都是通過合成濾波器過濾激勵來合成的,低頻帶激勵來源於接收到的低頻帶激勵能量和低頻帶激勵頻率封包。低頻帶合成濾波器是從接收到的線譜頻率(LSF)係數形式的LP參數中導出的,使用從低頻帶能量外推的能量獲得高頻帶激勵,並且從解碼器側LSF內插導出高頻帶合成濾波器,高頻帶合成在頻譜上翻轉並添加到低頻帶合成中,以形成最終的CN信號。
FD-CNG方法[8]、[9]是利用頻域噪音估計演算法,然後對背景噪音的平滑頻譜封包進行向量量化。解碼封包在解碼器中通過運行第二個頻域噪音估計器進行細化。由於在非活動幀期間使用純參數表示,因此在這種情況下,解碼器無法獲得噪音信號。在FD-CNG中,基於最小統計演算法在編碼器和解碼器端的每一幀(活動和非活動)中執行噪音估計。
在[10]中描述了一種在兩個(或更多)聲道的情況下產生柔和噪音的方法。在[10]中,描述了一種用於立體聲DTX和CNG的系統,該系統將單聲道SID與在編碼器中的兩個輸入立體聲聲道上計算的按頻帶相關性度量相結合。在解碼器處,從位元流中解碼出單聲道CNG資訊和相關性數值,並合成多個頻帶中的目標相關性。為了降低所得立體聲SID幀的位元率,使用預測方案對相關值進行編碼,然後是具有可變位元率的熵編碼。使用前面段落中描述的方法為每個聲道生成柔和噪音,然後使用基於SID幀中包含的傳輸頻帶相關值加權的公式對兩個CN進行頻帶混合。
動機
/
習知技術的缺點
在立體聲系統中,單獨生成背景噪音會導致完全不相關的噪音,這聽起來令人不快,並且與實際背景噪音非常不同,當我們切換到活動模式背景或從活動模式背景切換到DTX模式背景時,會導致突然的可聽轉換。此外,僅使用兩個完全不相關的噪音源不可能保留背景的立體圖像。最後,如果有背景噪音源並且講話者帶著手持設備圍繞該源移動,則背景噪音的空間圖像將隨時間變化,在為每個聲道獨立重建背景噪音時無法複製這種情況。因此,需要開發一種新的方法來解決立體聲信號的問題。
這也在[10]中得到解決,然而,在實施例中,為兩個聲道插入共同噪音源以模仿相關噪音來生成最終柔和噪音在模仿立體聲背景噪音記錄方面有著重要作用。
當前的通訊語音編解碼器通常僅編碼單聲道信號,因此,大多數現有的DTX系統都是為單聲道CNG設計的,簡單地在立體聲信號的兩個聲道上獨立應用DTX操作看起來很單純,但其包含幾個問題。首先,該方法需要傳輸描述兩個聲道中的兩個背景噪音信號的兩組參數,這將增加SID幀傳輸所需的資料率,從而減少降低網路負載的好處。另一個有問題的方面在於VAD決策,其必須在聲道之間同步以避免立體聲信號的空間圖像的怪異和失真,並優化系統的位元率降低。此外,當在接收端獨立地在兩個聲道上應用CNG時,兩個獨立的CNG演算法通常會產生兩個具有零或非常低相關性的隨機噪音信號,這將導致在生成的柔和噪音中產生非常寬的立體圖像。另一方面,僅應用噪音產生器並在兩個聲道中使用相同的柔和噪音信號會導致非常高的相關性和非常窄的立體圖像。然而,對於大多數立體聲信號而言,立體聲圖像及其空間印象將介於這兩個極端之間。因此,切換到活動幀或從活動幀切換到DTX模式會引入突然的可聽轉換。此外,如果存在背景噪音源並且講話者帶著手持設備圍繞該源移動,則背景噪音的空間圖像將隨時間變化,這在為每個聲道獨立重建背景噪音時無法複製,因此,需要一種新的方法來解決立體聲信號的問題。
在[10]中描述的系統通過傳輸單聲道CNG資訊以及用於在解碼器中重新合成背景噪音的立體聲圖像的參數值來解決這些問題。這種類型的DTX系統非常適合參數立體聲編碼器,這些編碼器在編碼和傳輸之前對兩個輸入聲道應用降混(downmix),從中可以導出單聲道CNG參數。然而,在離散立體聲編碼方案中,通常仍然以聯合方式對兩個聲道進行編碼,並且通常不會導出諸如細粒度相關性度量之類的升混(upmix)參數,因此,對於這些類型的立體聲編碼器,需要一種不同的方法。
本發明的實施態樣
本示例提供立體聲語音信號的有效傳輸。與僅傳輸一個音頻聲道(單聲道)相比,傳輸立體聲信號可以提高用戶體驗和語音清晰度,尤其是在強加背景噪音或其他聲音的情況下。立體聲信號可以以參數方式編碼,其中應用兩個立體聲聲道的單聲道降混,並且該單個降混聲道被編碼並與用於在解碼器中近似原始立體聲信號的輔助資訊一起傳輸到接收器。另一種方法是採用離散立體聲編碼,旨在通過一些信號預處理去除聲道之間的冗餘,以實現原始信號的更緊湊的雙聲道表示。然後對兩個處理過的聲道進行編碼和傳輸。在解碼器處,則應用逆處理。儘管如此,與立體聲處理相關的輔助資訊可以沿兩個聲道傳輸,因此,參數和離散立體聲編碼方法之間的主要區別在於傳輸聲道的數量。
通常,在對話中,有時並非所有說話者都在積極發言,因此,在這些期間輸入語音編碼器的信號主要由背景噪音或(接近)靜音組成。為了節省資料速率並降低傳輸網路的負載,語音編碼器嘗試區分包含語音的幀(活動幀)和主要包含背景噪音或靜音的幀(非活動幀)。對於非活動幀,資料速率可以通過不像在活動幀中那樣對音頻信號進行編碼來顯著降低,而是以靜音插入描述符(SID)幀的形式導出當前背景噪音的參數化低位元率描述。這個SID幀會周期性地傳輸到解碼器以更新描述背景噪音的參數,而對於中間的非活動幀,位元率會降低,甚至不傳輸任何資訊。在解碼器中,通過柔和噪音生成(CNG)演算法,使用SID幀中傳輸的參數對背景噪音進行重構,通過這種方式,可以降低或甚至將非活動幀的傳輸率歸零,而無需用戶將其解釋為連接中斷或結束。
我們描述了一種用於離散編碼立體聲信號的DTX系統,該系統由立體聲SID組成,以及一種CNG方法,該方法通過對兩個聲道中背景噪音的頻譜特徵以及他們之間的相關程度進行建模來生成立體聲柔和噪音,同時保持與單聲道應用相當的平均位元率。
根據一實施態樣,提供了一種用於產生具有一第一聲道及一第二聲道的一多聲道信號的多聲道信號產生器,包括:
一第一音頻源,用於產生一第一音頻信號;
一第二音頻源,用於產生一第二音頻信號;
一混合噪音源,用於產生一混合噪音信號;以及
一混合器,用於將混合噪音信號與第一音頻信號混合以獲得一第一聲道,以及將混合噪音信號與第二音頻信號混合以獲得一第二聲道。
依據一實施態樣,第一音頻源係為一第一噪音源且該第一音頻信號係為一第一噪音信號,或第二音頻源係為一第二噪音源且第二音頻信號係為一第二噪音信號,
其中,第一噪音源或第二噪音源係用以產生第一噪音信號或第二噪音信號,因此第一噪音信號或第二噪音信號係與混合噪音信號去相關。
依據一實施態樣,混合器係用以產生第一聲道以及第二聲道,俾使混合噪音信號在第一聲道中的量係等於混合噪音信號在第二聲道中的量,或是在混合噪音信號在第二聲道中的量的80%至120%的範圍內。
依據一實施態樣,混合器包括一控制輸入,用以接收一控制參數,其中混合器係用以依據控制參數控制混合噪音信號在第一聲道中及在第二聲道中的量。
依據一實施態樣,第一音頻源、第二音頻源及混合音頻源係分別為一高斯噪音源。
第一音頻源包括一第一噪音產生器,用以產生第一音頻信號以作為一第一噪音信號,第二音頻源包括一去相關器,用以去相關第一噪音信號藉以產生第二音頻信號以作為一第二噪音信號,及其中混合噪音源包括一第二噪音產生器,或
其中第一音頻源包括一第一噪音產生器,用以產生第一音頻信號以作為一第一噪音信號,第二音頻源包括一第二噪音產生器,用以產生第二音頻信號以作為一第二噪音信號,混合噪音源包括一去相關器,用以去相關第一噪音信號或第二噪音信號以產生混合噪音信號,或
其中第一音頻源、第二音頻源及混合噪音源其中之一包括一噪音產生器,用以產生一噪音信號,其中第一音頻源、第二音頻源及混合噪音源其中之另一包括一第一去相關器,用以去相關噪音信號,其中第一音頻源、第二音頻源及混合噪音源其中之又一包括一第二去相關器,用以去相關噪音信號,其中第一去相關器係不同於第二去相關器,因此第一去相關器與第二去相關器的輸出信號係彼此為去相關,或
其中第一音頻源包括一第一噪音產生器,第二音頻源包括一第二噪音產生器,混合噪音源包括一第三噪音產生器,其中第一噪音產生器、第二噪音產生器及第三噪音產生器係用以產生互相為去相關之噪音訊號。
依據一實施態樣,第一音頻源、第二音頻源及混合噪音源其中之一包括一偽亂數序列產生器,用以依據一種子生成一偽亂數序列,且其中第一音頻源、第二音頻源及混合噪音源其中的至少二係用以利用不同的種子初始化偽亂數序列產生器。
依據一實施態樣,第一音頻源、第二音頻源及混合噪音源其中之一係用以利用一預儲存噪音表進行操作,或
其中第一音頻源、第二音頻源及混合噪音源其中之一係用以針對一幀產生一複頻譜,其使用一第一噪音值作為一實部,並使用一第二噪音值作為一虛部,
其中,可選地,至少一個噪音產生器被配置為產生用於一頻率柱k的一複噪音頻譜值,其使用一索引k處的一第一隨機值作為實部及虛部其中之一,並使用一索引(k+M)處的一第二隨機值作為實部及虛部其中之另一,其中第一噪音值及第二噪音值包括在一噪音陣列中,例如從一亂數序列產生器、一噪音表或一噪音程序導出,其範圍從一起始索引到一結束索引,起始索引小於M,結束索引等於或小於2M,其中M和k是整數。
依據一實施態樣,混合器包括:
一第一振幅元件,用於影響第一音頻信號之振幅;
一第一加法器,用於將第一振幅元件的一輸出信號和混合噪音信號的至少一部分相加;
一第二振幅元件,用於影響第二音頻信號之振幅;
一第二加法器,用於將第二振幅元件的一輸出和混合噪音信號的至少一部分相加,
其中,第一振幅元件執行所得的一影響量與第二振幅元件執行所得的一影響量相等,或第二振幅元件執行所得的影響量與第一振幅元件執行所得的影響量的差異小於第一振幅元件執行所得的影響量的20%。
依據一實施態樣,混合器包括一第三振幅元件,用於影響混合噪音信號之振幅,
其中,第三振幅元件執行所得的一影響量係依據第一振幅元件執行所得的影響量或第二振幅元件執行所得的影響量而定,因此當第一振幅元件執行所得的影響量或第二振幅元件執行所得的影響量降低時,第三振幅元件執行所得的影響量增加。
依據一實施態樣,第三振幅元件執行所得的影響量是一預設值c
q的平方根,第一振幅元件執行所得的影響量及第二振幅元件執行所得的影響量分別是1和預設值c
q之差值的平方根。
依據一實施態樣,一輸入介面用以從一幀序列中接收一編碼音頻資料,幀序列包括一活動幀及跟隨在活動幀之後的一非活動幀;以及
一音頻解碼器,用以解碼活動幀之編碼音頻資料以產生活動幀的一解碼多聲道信號,
其中第一音頻源、第二音頻源、混合噪音源及混合器係在非活動幀中致動,以產生非活動幀的多聲道信號。
依據一實施態樣,活動幀的編碼音頻信號具有描述一第一頻率柱數量的多個第一係數;以及
非活動幀的編碼音頻信號具有描述一第二頻率柱數量的多個第二係數,
其中第一頻率柱數量大於第二頻率柱數量。
依據一實施態樣,非活動幀的編碼音頻資料包括一靜音插入描述符資料,其包括一柔和噪音資料,其針對該二聲道的每一個、或者對於第一聲道和第二聲道的一第一線性組合及第一聲道和第二聲道的一第二線性組合中的每一個,指示對於非活動幀的一信號能量,並且指示在非活動幀中的第一聲道及第二聲道之間的一相關性,以及
其中,該混合器係用以基於指示該相關性之柔和噪音資料,混合該混合噪音信號及該第一音頻信號或該第二音頻信號,以及
其中,該多聲道信號產生器更包括一信號修改器,用於修改該第一聲道及該第二聲道、該第一音頻信號、該第二音頻信號、或該混合噪音信號,其中該信號修改器被配置為由該柔和噪音資料所控制,其指示該第一音頻聲道及該第二音頻聲道的信號能量、或指示該第一音頻聲道及該第二音頻聲道的一第一線性組合與該第一音頻聲道及該第二音頻聲道的一第二線性組合的信號能量。
依據一實施態樣,用於該非活動幀之音頻資料包括:
用於該第一聲道的一第一靜音插入描述符幀及用於該第二聲道的一第二靜音插入描述符幀,
其中,第一靜音插入描述符幀包括
用於該第一聲道及/或該第一聲道與該第二聲道的一第一線性組合的一柔和噪音參數資料,及
用於該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,以及
其中,第二靜音插入描述符幀包括
用於該第二聲道及/或該第一聲道與該第二聲道的一第二線性組合的一柔和噪音參數資料,及
指示該非活動幀之該第一聲道與該第二聲道之間的一相關性的一相關性資訊,以及
其中,該多聲道信號產生器包括一控制器,用於使用該第一靜音插入描述符幀的該柔和噪音產生輔助資訊來控制該非活動幀中的該多聲道信號的生成,以決定用於該第一聲道與該第二聲道、及/或用於該第一聲道及該第二聲道的一第一線性組合以及該第一聲道及該第二聲道的一第二線性組合的一柔和噪音產生模式,使用該第二靜音插入描述符幀中的該相關性資訊來設定在該非活動幀中的該第一聲道和該第二聲道之間的一相關性,並使用來自該第一靜音插入描述符幀之該柔和噪音參數資料及來自該第二靜音插入描述符幀之該柔和噪音參數資料來設定該第一聲道之一能量情況與該第二聲道之一能量情況。
依據一實施態樣,用於該非活動幀之該音頻資料包括:
用於該第一聲道與該第二聲道的一第一線性組合及用於該第一聲道與該第二聲道的一第二線性組合的至少一靜音插入描述符幀,
其中,該至少一靜音插入描述符幀包括
用於該第一聲道與該第二聲道的該第一線性組合的一柔和噪音參數資料,及
用於該第一聲道與該第二聲道的該第二線性組合的一柔和噪音產生輔助資訊,
其中,該多聲道信號產生器包括一控制器,用於使用該第一聲道及該第二聲道的該第一線性組合以及該第一聲道及該第二聲道的該第二線性組合的該柔和噪音產生輔助資訊來控制該非活動幀中的該多聲道信號的生成,使用該第二靜音插入描述符幀中的該相關性資訊來設定在該非活動幀中的該第一聲道和該第二聲道之間的一相關性,並使用來自該至少一靜音插入描述符幀之該柔和噪音參數資料來設定該第一聲道之一能量情況,及使用來自該至少一靜音插入描述符幀之該柔和噪音參數資料來設定該第二聲道之一能量情況。
依據一實施態樣,一頻譜-時間轉換器用於將經過頻譜調整和相關性調整的一調整後第一聲道和一調整後第二聲道轉換為相應的時域表示,以與該活動幀之該解碼的多聲道信號的相應聲道的時域表示組合或串聯。
依據一實施態樣,用於該非活動幀之該音頻資料包括:
一靜音插入描述符幀,其中該靜音插入描述符幀包括用於該第一聲道及該第二聲道的一柔和噪音參數資料以及用於該第一聲道與該第二聲道,及/或用於該第一聲道與該第二聲道的一第一線性組合與用於該第一聲道與該第二聲道的一第二線性組合的一柔和噪音產生輔助資訊,以及指示該非活動幀之該第一聲道與該第二聲道之間的一相關性的一相關性資訊,以及
其中,該多聲道信號產生器包括一控制器,用於使用該靜音插入描述符幀的該柔和噪音產生輔助資訊來控制該非活動幀中的該多聲道信號的生成,以決定用於該第一聲道與該第二聲道的一柔和噪音產生模式,使用該靜音插入描述符幀中的該相關性資訊來設定在該非活動幀中的該第一聲道和該第二聲道之間的一相關性,並使用來自該靜音插入描述符幀之該柔和噪音參數資料來設定該第一聲道之一能量情況與該第二聲道之一能量情況。
依據一實施態樣,該非活動幀的該編碼音頻資料包括一靜音插入描述符資料,該靜音插入描述符資料包括指示在中/側表示之各聲道的一信號能量的一柔和噪音資料、以及指示在左/右表示之該第一聲道與該第二聲道之間的一相關性的一相關性資料,其中該多聲道信號產生器被配置為將該第一聲道與該第二聲道中,該中/側表示之該信號能量轉換為該左/右表示之該信號能量,
其中,該混合器被配置為基於該相關性資料將該混合噪音信號混合到該第一音頻信號與該第二音頻信號中,以便獲得該第一聲道及該第二聲道,以及
其中,該多聲道信號產生器更包括一信號修改器,其被配置用於通過基於該左/右領域中的該信號能量對該第一聲道及該第二聲道進行整形,以修改該第一聲道及該第二聲道。
依據一實施態樣,用於在該音頻資料包含指示該側聲道中的該能量小於一預定閾值的信令的情況下,將側聲道的係數歸零。
依據一實施態樣,該非活動幀的該音頻資料包括:
至少一靜音插入描述符幀,其中該至少一靜音插入描述符幀包括用於該中聲道及該側聲道之一柔和噪音參述資料以及用於該中聲道及該側聲道之一柔和噪音產生輔助資訊,以及指示該非活動幀之該第一聲道與該第二聲道之間的一相關性的一相關性資訊,以及
其中,該多聲道信號產生器包括一控制器,用於使用該靜音插入描述符幀的該柔和噪音產生輔助資訊來控制該非活動幀中的該多聲道信號的生成,以決定用於該第一聲道與該第二聲道的一柔和噪音產生模式,使用該靜音插入描述符幀中的該相關性資訊來設定在該非活動幀中的該第一聲道和該第二聲道之間的一相關性,並使用來自該靜音插入描述符幀之該柔和噪音參數資料或其處理版本來設定該第一聲道之一能量情況與該第二聲道之一能量情況。
依據一實施態樣,多聲道信號產生器更用以通過一增益資訊縮放該第一聲道與該第二聲道的信號能量係數,其係編碼於該第一聲道與該第二聲道的該柔和噪音參數資料。
依據一實施態樣,多聲道信號產生器更用以將生成的該多聲道信號從一頻域版本轉換為一時域版本。
依據一實施態樣,該第一音頻源為一第一噪音源且該第一音頻信號為一第一噪音信號,或者該第二音頻源為一第二噪音源且該第二音頻信號為一第二噪音信號,
其中,該第一噪音源或該第二噪音源被配置為產生該第一噪音信號或該第二噪音信號,使得該第一噪音信號或該第二噪音信號至少部分相關,及
其中,該混合噪音源被配置為產生具有一第一混合噪音部分與一第二混合噪音部分的該混合噪音信號,該第二混合噪音部分至少部分地與該第一混合噪音部分去相關;以及
其中,該混合器被配置為將該混合噪音信號的該第一混合噪音部分與該第一音頻信號混合以獲得該第一聲道,並且將該混合噪音信號的該第二混合噪音部分與該第二音頻信號混合以獲得該第二聲道。
依據一實施態樣,提供一種多聲道信號產生方法,用於產生具有一第一聲道及一第二聲道的一多聲道信號,包括:
利用一第一音頻源產生一第一音頻信號;
利用一第二音頻源產生一第二音頻信號;
利用一混合噪音源產生一混合噪音信號;以及
混合該混合噪音信號與該第一音頻信號以獲得該第一聲道,以及混合該混合噪音信號與該第二音頻信號以獲得該第二聲道。
依據一實施態樣,提供一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:
一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;
一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;
一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及
一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料。
依據一實施態樣,該相關性計算器被配置為計算一相關值,並對該相關值進行量化以獲得一量化的相關值,其中該輸出介面被配置為使用該量化的相關值作為該編碼的多聲道信號中的該相關性資料。
依據一實施態樣,該相關性計算器被配置為:
從該非活動幀的該第一聲道與該第二聲道的複頻譜值中計算一實中間值與一虛中間值;
計算該非活動幀的該第一聲道的一第一能量值和該第二聲道的一第二能量值;以及
使用該實中間值、該虛中間值、該第一能量值及該第二能量值計算該相關性資料,或
平滑該實中間值、該虛中間值、該第一能量值及該第二能量值其中的至少一,並使用至少一個平滑值計算該相關性資料。
依據一實施態樣,該相關性計算器被配置為計算該實中間值,其係為該非活動幀之該第一聲道與該第二聲道的對應頻率柱的複頻譜值的乘積的實部之和,或
計算該虛中間值,其係為該非活動幀之該第一聲道與該第二聲道的該對應頻率柱的該複頻譜值的該乘積的虛部之和。
依據一實施態樣,該相關性計算器被配置為對平滑的一實中間值求平方以及對平滑的一虛中間值求平方,並將該等平方值相加以獲得一第一分量數,
其中,該相關性計算器被配置為將平滑後的該第一能量值與該第二能量值相乘以獲得一第二分量數,並且將該第一分量數與該第二分量數結合以獲得該相關值的一結果數,該相關性資料係基於該結果數。
依據一實施態樣,該相關性計算器被配置為計算該結果數的平方根,以得到一相關值,該相關性資料係基於該相關值。
依據一實施態樣,該相關性計算器被配置為使用一均勻量化器對該相關值進行量化,以得到量化的該相關值,其係為一個n位元數以作為該相關性資料。
依據一實施態樣,該輸出介面被配置為生成該第一聲道的一第一靜音插入描述符幀和該第二聲道的一第二靜音插入描述符幀,其中該第一靜音插入描述符幀包括該第一聲道的一柔和噪音參數資料以及該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,並且其中該第二靜音插入描述符幀包括該第二聲道的一柔和噪音參數資料以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關性的一相關性資訊,或
其中,該輸出介面被配置為生成一靜音插入描述符幀,其中該靜音插入描述符幀包括該第一聲道與該第二聲道的一柔和噪音參數資料以及該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關性的一相關性資訊,或
其中,該輸出介面被配置為生成該第一聲道與該第二聲道的一第一靜音插入描述符幀,以及該第一聲道與該第二聲道的一第二靜音插入描述符幀,其中該第一靜音插入描述符幀包括該第一聲道與該第二聲道的一柔和噪音參數資料以及該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,該第二靜音插入描述符幀包括該第一聲道與該第二聲道的一柔和噪音參數資料,以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關性的一相關性資訊。
依據一實施態樣,該均勻量化器被配置為計算一n位元數,使得n的值等於該第一靜音插入描述符幀的該柔和噪音產生輔助資訊所佔用的一位元值。
依據一實施態樣,該活動檢測器被配置為,
分析該多聲道信號的該第一聲道以將該第一聲道分類為活動或非活動,及
分析該多聲道信號的該第二聲道以將該第二聲道分類為活動或非活動,以及
如果該第一聲道及該第二聲道皆被分類為非活動,則判斷該幀為非活動,否則判斷其為活動。
依據一實施態樣,該噪音參數計算器被配置為計算該第一聲道的一第一增益資訊以及該第二聲道的一第二增益資訊,並提供該參數噪音資料作為該第一聲道的該第一增益資訊以及該第二增益資訊。
依據一實施態樣,該噪音參數計算器被配置為將該第一參數噪音資料與該第二參數噪音資料中的至少一些從一左/右表示轉換為具有一中聲道及一側聲道的一中/側表示。
依據一實施態樣,該噪音參數計算器被配置為將該第一參數噪音資料與該第二參數噪音資料中的至少一些的該中/側表示重新轉換為一左/右表示,
其中,該噪音參數計算器被配置為根據重新轉換的該左/右表示計算該第一聲道的一第一增益資訊與該第二聲道的一第二增益資訊,以及提供包括在該第一參量噪音資料中的該第一聲道的該第一增益資訊,以及包括在該第二參量噪音資料中的該第二增益資訊。
依據一實施態樣,噪音參數計算器被配置為計算:
該第一增益資訊,其通過比較:
該第一聲道的該第一參數噪音資料從該中/側表示重新轉換為該左/右表示的一版本;與
該第一聲道的該第一參數噪音資料從該中/側表示轉換為該左/右表示之前的一版本;及/或
該第二增益資訊,其通過比較:
該第二聲道的該第二參數噪音資料從該中/側表示重新轉換為該左/右表示的一版本;與
該第二聲道的該第二參數噪音資料從該中/側表示轉換為該左/右表示之前的一版本。
依據一實施態樣,該噪音參數計算器被配置為比較該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的一能量與一預定能量閾值,並且:
當該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的該能量大於該預定能量閾值時,將側聲道噪音形狀向量的係數歸零;以及
當該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的該能量小於該預定能量閾值,保持該側聲道噪音形狀向量的係數。
依據一實施態樣,該音頻編碼器被配置為使用比編碼該第一參數噪音資料及該第二參數噪音資料之間的該第一線性組合的位元量少的一位元量對該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合進行編碼。
依據一實施態樣,該輸出介面被配置為:
使用用於一第一頻率柱數量的多個第一係數來生成具有該活動幀的一編碼音頻資料的一編碼的多聲道音頻信號;以及
使用用於描述一第二頻率柱數量的多個第二係數來生成該第一參數噪音資料、該第二參數噪音資料、或該第一參數噪音資料與該第二參數噪音資料的該第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的該第二線性組合,
其中,該第一頻率柱數量大於該第二頻率柱數量。
依據一實施態樣,提供一種音頻編碼方法,用於為包括一活動幀與一非活動幀的一幀序列生成一編碼的多聲道音頻信號,該方法包括:
分析一多聲道信號以判斷該幀序列中的一個幀為一非活動幀;
為該多聲道信號的一第一聲道、及/或該多聲道信號的該第一聲道與一第二聲道的一第一線性組合計算一第一參數噪音資料,並為該多聲道信號的該第二聲道、及/或該多聲道信號的該第一聲道與該第二聲道的一第二線性組合計算一第二參數噪音資料;
計算指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及
生成該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及該相關性資料。
依據一實施態樣,提供一種電腦程式,其係在運行於一電腦或一處理器時,執行上述或下述之方法。
依據一實施態樣,提供一種編碼的多聲道音頻信號,其係組織於一幀序列中,該幀序列包括一活動幀與一非活動幀,該編碼的多聲道音頻信號包括:
該活動幀的一編碼的音頻資料;
在該非活動幀中的一第一聲道的一第一參數噪音資料;
在該非活動幀中的一第二聲道的一第二參數噪音資料;以及
指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料。
依據一實施態樣,第一音頻源係為一第一噪音源且該第一音頻信號係為一第一噪音信號,或第二音頻源係為一第二噪音源且第二音頻信號係為一第二噪音信號,
其中,第一噪音源或第二噪音源係用以產生第一噪音信號或第二噪音信號,因此第一噪音信號或第二噪音信號係與混合噪音信號去相關。
依據一實施態樣,混合器係用以產生第一聲道以及第二聲道,俾使混合噪音信號在第一聲道中的量係等於混合噪音信號在第二聲道中的量,或是在混合噪音信號在第二聲道中的量的80%至120%的範圍內。
依據一實施態樣,混合器包括一控制輸入,用以接收一控制參數,其中混合器係用以依據控制參數控制混合噪音信號在第一聲道中及在第二聲道中的量。
依據一實施態樣,第一音頻源、第二音頻源及混合音頻源係分別為一高斯噪音源。
依據一實施態樣,
第一音頻源包括一第一噪音產生器,用以產生第一音頻信號以作為一第一噪音信號,第二音頻源包括一去相關器,用以去相關第一噪音信號藉以產生第二音頻信號以作為一第二噪音信號,及其中混合噪音源包括一第二噪音產生器,或
其中第一音頻源包括一第一噪音產生器,用以產生第一音頻信號以作為一第一噪音信號,第二音頻源包括一第二噪音產生器,用以產生第二音頻信號以作為一第二噪音信號,混合噪音源包括一去相關器,用以去相關第一噪音信號或第二噪音信號以產生混合噪音信號,或
其中第一音頻源、第二音頻源及混合噪音源其中之一包括一噪音產生器,用以產生一噪音信號,其中第一音頻源、第二音頻源及混合噪音源其中之另一包括一第一去相關器,用以去相關噪音信號,其中第一音頻源、第二音頻源及混合噪音源其中之又一包括一第二去相關器,用以去相關噪音信號,其中第一去相關器係不同於第二去相關器,因此第一去相關器與第二去相關器的輸出信號係彼此為去相關,或
其中第一音頻源包括一第一噪音產生器,第二音頻源包括一第二噪音產生器,混合噪音源包括一第三噪音產生器,其中第一噪音產生器、第二噪音產生器及第三噪音產生器係用以產生互相為去相關之噪音訊號。
依據一實施態樣,第一音頻源、第二音頻源及混合噪音源其中之一包括一偽亂數序列產生器,用以依據一種子生成一偽亂數序列,以及
其中第一音頻源、第二音頻源及混合噪音源其中的至少二係用以利用不同的種子初始化偽亂數序列產生器。
依據一實施態樣,第一音頻源、第二音頻源及混合噪音源其中之一係用以利用一預儲存噪音表進行操作,或
其中第一音頻源、第二音頻源及混合噪音源其中之一係用以針對一幀產生一複頻譜,其使用一第一噪音值作為一實部,並使用一第二噪音值作為一虛部,
其中,可選地,至少一個噪音產生器被配置為產生用於一頻率柱k的一複噪音頻譜值,其使用一索引k處的一第一隨機值作為實部及虛部其中之一,並使用一索引(k+M)處的一第二隨機值作為實部及虛部其中之另一,
其中,第一噪音值及第二噪音值包括在一噪音陣列中,例如從一亂數序列產生器、一噪音表或一噪音程序導出,其範圍從一起始索引到一結束索引,起始索引小於M,結束索引等於或小於2M,其中M和k是整數。
依據一實施態樣,混合器包括:
一第一振幅元件,用於影響第一音頻信號之振幅;
一第一加法器,用於將第一振幅元件的一輸出信號和混合噪音信號的至少一部分相加;
一第二振幅元件,用於影響第二音頻信號之振幅;
一第二加法器,用於將第二振幅元件的一輸出和混合噪音信號的至少一部分相加,
其中,第一振幅元件執行所得的一影響量與第二振幅元件執行所得的一影響量相等,或其差異小於第一振幅元件執行所得的影響量的20%。
依據一實施態樣,混合器包括一第三振幅元件,用於影響混合噪音信號之振幅,其中第三振幅元件執行所得的一影響量係依據第一振幅元件執行所得的影響量或第二振幅元件執行所得的影響量而定,因此當第一振幅元件執行所得的影響量或第二振幅元件執行所得的影響量降低時,第三振幅元件執行所得的影響量增加。
依據一實施態樣,該多聲道信號產生器更包括:
一輸入介面用以從一幀序列中接收一編碼音頻資料,幀序列包括一活動幀及跟隨在活動幀之後的一非活動幀;以及
一音頻解碼器,用以解碼活動幀之編碼音頻資料以產生活動幀的一解碼多聲道信號,
其中第一音頻源、第二音頻源、混合噪音源及混合器係在非活動幀中致動,以產生非活動幀的多聲道信號。
依據一實施態樣,非活動幀的編碼音頻資料包括一靜音插入描述符資料,其包括一柔和噪音資料,其指示對於該非活動幀的兩個聲道中的每一個聲道的一信號能量,並且指示在非活動幀中的第一聲道及第二聲道之間的一相關性,以及
其中,該混合器係用以基於指示該相關性之柔和噪音資料,混合該混合噪音信號及該第一音頻信號或該第二音頻信號,以及
其中,該多聲道信號產生器更包括一信號修改器,用於修改該第一聲道及該第二聲道、該第一音頻信號、該第二音頻信號、或該混合噪音信號,
其中,該信號修改器被配置為由該柔和噪音資料所控制,其指示該第一音頻聲道及該第二音頻聲道的信號能量。
依據一實施態樣,用於該非活動幀之音頻資料包括:
用於該第一聲道的一第一靜音插入描述符幀及用於該第二聲道的一第二靜音插入描述符幀,其中第一靜音插入描述符幀包括用於該第一聲道的一柔和噪音參數資料,及用於該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,其中第二靜音插入描述符幀包括用於該第二聲道的一柔和噪音參數資料,及指示該非活動幀之該第一聲道與該第二聲道之間的一相關性的一相關性資訊,以及
其中,該多聲道信號產生器包括一控制器,用於使用該第一靜音插入描述符幀的該柔和噪音產生輔助資訊來控制該非活動幀中的該多聲道信號的生成,以決定用於該第一聲道與該第二聲道的一柔和噪音產生模式,使用該第二靜音插入描述符幀中的該相關性資訊來設定在該非活動幀中的該第一聲道和該第二聲道之間的一相關性,並使用來自該第一靜音插入描述符幀之該柔和噪音參數資料及來自該第二靜音插入描述符幀之該柔和噪音參數資料來設定該第一聲道之一能量情況與該第二聲道之一能量情況。
依據一實施態樣,更包括一頻譜-時間轉換器,其用於將經過頻譜調整和相關性調整的一調整後第一聲道和一調整後第二聲道轉換為相應的時域表示,以與該活動幀之該解碼的多聲道信號的相應聲道的時域表示組合或串聯。
依據一實施態樣,用於該非活動幀之該音頻資料包括:
一靜音插入描述符幀,其中該靜音插入描述符幀包括用於該第一聲道及該第二聲道的一柔和噪音參數資料以及用於該第一聲道與該第二聲道,及用於該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,以及指示該非活動幀之該第一聲道與該第二聲道之間的一相關性的一相關性資訊,以及
其中,該多聲道信號產生器包括一控制器,用於使用該靜音插入描述符幀的該柔和噪音產生輔助資訊來控制該非活動幀中的該多聲道信號的生成,以決定用於該第一聲道與該第二聲道的一柔和噪音產生模式,使用該第二靜音插入描述符幀中的該相關性資訊來設定在該非活動幀中的該第一聲道和該第二聲道之間的一相關性,並使用來自該靜音插入描述符幀之該柔和噪音參數資料來設定該第一聲道之一能量情況與該第二聲道之一能量情況。
依據一實施態樣,該第一音頻源為一第一噪音源且該第一音頻信號為一第一噪音信號,或者該第二音頻源為一第二噪音源且該第二音頻信號為一第二噪音信號,
其中,該第一噪音源或該第二噪音源被配置為產生該第一噪音信號或該第二噪音信號,使得該第一噪音信號或該第二噪音信號至少部分相關,及
其中,該混合噪音源被配置為產生具有一第一混合噪音部分與一第二混合噪音部分的該混合噪音信號,該第二混合噪音部分至少部分地與該第一混合噪音部分去相關;以及
其中,該混合器被配置為將該混合噪音信號的該第一混合噪音部分與該第一音頻信號混合以獲得該第一聲道,並且將該混合噪音信號的該第二混合噪音部分與該第二音頻信號混合以獲得該第二聲道。
依據一實施態樣,用於產生具有一第一聲道及一第二聲道的一多聲道信號的多聲道信號產生方法包括:
利用一第一音頻源產生一第一音頻信號;
利用一第二音頻源產生一第二音頻信號;
利用一混合噪音源產生一混合噪音信號;以及
混合該混合噪音信號與該第一音頻信號以獲得該第一聲道,以及混合該混合噪音信號與該第二音頻信號以獲得該第二聲道。
依據一實施態樣,提供一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:
一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;
一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;
一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及
一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、以及該相關性資料。
依據一實施態樣,該相關性計算器被配置為計算一相關值,並對該相關值進行量化以獲得一量化的相關值,其中該輸出介面被配置為使用該量化的相關值作為該編碼的多聲道信號中的該相關性資料。
依據一實施態樣,該相關性計算器被配置為:
從該非活動幀的該第一聲道與該第二聲道的複頻譜值中計算一實中間值與一虛中間值;
計算該非活動幀的該第一聲道的一第一能量值和該第二聲道的一第二能量值;以及
使用該實中間值、該虛中間值、該第一能量值及該第二能量值計算該相關性資料,或
平滑該實中間值、該虛中間值、該第一能量值及該第二能量值其中的至少一,並使用至少一個平滑值計算該相關性資料。
依據一實施態樣,該相關性計算器被配置為計算該實中間值,其係為該非活動幀之該第一聲道與該第二聲道的對應頻率柱的複頻譜值的乘積的實部之和,或
計算該虛中間值,其係為該非活動幀之該第一聲道與該第二聲道的該對應頻率柱的該複頻譜值的該乘積的虛部之和。
依據一實施態樣,該相關性計算器被配置為對平滑的一實中間值求平方以及對平滑的一虛中間值求平方,並將該等平方值相加以獲得一第一分量數,
其中,該相關性計算器被配置為將平滑後的該第一能量值與該第二能量值相乘以獲得一第二分量數,並且將該第一分量數與該第二分量數結合以獲得該相關值的一結果數,該相關性資料係基於該結果數。
依據一實施態樣,提供一種音頻編碼器,其中該相關性計算器被配置為計算該結果數的平方根,以得到一相關值,該相關性資料係基於該相關值。
依據一實施態樣,該相關性計算器被配置為使用一均勻量化器對該相關值進行量化,以得到量化的該相關值,其係為一個N位元數以作為該相關性資料。
依據一實施態樣,提供一種音頻編碼器,
其中,該輸出介面被配置為生成該第一聲道的一第一靜音插入描述符幀和該第二聲道的一第二靜音插入描述符幀,其中該第一靜音插入描述符幀包括該第一聲道的一柔和噪音參數資料以及該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,並且其中該第二靜音插入描述符幀包括該第二聲道的一柔和噪音參數資料以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關性的一相關性資訊,或
其中,該輸出介面被配置為生成一靜音插入描述符幀,其中該靜音插入描述符幀包括該第一聲道與該第二聲道的一柔和噪音參數資料以及該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關性的一相關性資訊。
依據一實施態樣,該均勻量化器被配置為計算一N位元數,使得N的值等於該第一靜音插入描述符幀的該柔和噪音產生輔助資訊所佔用的一位元值。
依據一實施態樣,用於為包括一活動幀與一非活動幀的一幀序列生成一編碼的多聲道音頻信號的音頻編碼方法,該方法包括:
分析一多聲道信號以判斷該幀序列中的一個幀為一非活動幀;
為該多聲道信號的一第一聲道計算一第一參數噪音資料,並為該多聲道信號的該第二聲道計算一第二參數噪音資料;
計算指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及
生成該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及該相關性資料。
依據一實施態樣,該編碼的多聲道音頻信號係組織於一幀序列中,該幀序列包括一活動幀與一非活動幀,該編碼的多聲道音頻信號包括:
該活動幀的一編碼的音頻資料;
在該非活動幀中的一第一聲道的一第一參數噪音資料;
在該非活動幀中的一第二聲道的一第二參數噪音資料;以及
指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料。
在本說明書中,我們特別描述一種新技術,例如用於離散編碼立體聲信號的DTX和CNG,其並非操作立體聲信號的單聲道降混,而是導出、聯合編碼及傳輸兩個聲道的噪音參數。在解碼器中(或更一般地在多聲道產生器中),三個獨立的柔和噪音信號可以基於單一寬帶聲道間相關值進行混合,該相關值例如伴隨兩組噪音參數被傳輸。示例的一些態樣在部分示例中可以涵蓋以下態樣中的至少一個:
•解碼器中的CNG,例如通過混合三個獨立的噪音信號。在解碼立體聲SID並重構左右聲道的噪音參數後,可能會生成兩個噪音信號,例如作為相關和不相關噪音的混合。為此,可以將兩個聲道的一個共同噪音源(用作相關噪音源)和兩個單獨的噪音源(提供不相關噪音)混合在一起,混合過程可由立體聲SID中傳輸的聲道間相關值控制。混合後,兩個混合噪音信號分別使用左右聲道的重構噪音參數進行頻譜整形。
•噪音參數的聯合編碼可以從立體聲信號的兩個聲道中導出。為了保持立體聲SID的低位元率,可以在將噪音參數編碼到立體聲SID之前先進一步壓縮噪音參數,這可以例如通過將噪音參數的左/右聲道表示轉換為中/側表示,並用比中噪音參數少的位元數對側噪音參數進行編碼來達成。
•用於雙聲道DTX(立體聲SID)的SID。此SID可以包含立體聲信號的兩個聲道的噪音參數以及單一寬帶聲道間相關值和指示兩個聲道的相等噪音參數的旗標。
以下本說明書將顯示的示例可以在裝置、設備、系統、方法、控制器及儲存指令的非暫時性儲存單元中實現,當處理器執行所儲存的指令時,這些指令使處理器執行本說明書所述的技術(例如方法(如操作順序))。
特別地,以下方塊中的至少一個可以被控制器所控制。
示例
在詳細討論本示例的各種態樣之前,先快速概述一些最重要的態樣:
1) 圖3a-3f顯示用於產生多聲道音頻信號(例如在一解碼器)的多聲道信號產生器(例如由至少一個第一信號或聲道以及一個第二音頻信號或聲道所形成)的示例,多聲道音頻信號(最初以多個去相關聲道的形式)可能受到振幅元件的影響(例如縮放),影響量可以基於在編碼器處估計的第一及第二音頻信號之間的相關性資料,第一及第二音頻信號可以與共同混合信號(其也可以由相關性資料進行去相關和影響(如縮放))進行混合。對混合信號的影響量可以使得當混合信號按低權重(例如0或大於但例如接近於0)縮放時,第一及第二音頻信號按高權重縮放(例如,1或小於但例如接近於1),反之亦然。對混合信號的影響量可以使得在編碼器處測量的高相關性導致第一及第二音頻信號按低權重(例如0或大於但例如接近0)縮放,並且在編碼器處測量的高相關性導致第一及第二音頻信號按高權重(例如1或小於但例如接近1)縮放。如圖3a-3f所示之技術可用於實現柔和噪音產生器(CNG)。
2) 圖1、2及4顯示了編碼器的示例,編碼器可以將音頻幀分類為活動或非活動,若音頻幀為非活動,則在位元流中僅編碼一些參數噪音資料(例如,提供參數噪音形狀,其給出噪音形狀的參數表示,而無需提供噪音信號本身),並且 還可以提供兩個聲道之間的相關性資料。
3)圖2及4顯示了解碼器的示例,解碼器可以生成音頻信號(柔和噪音),例如通過:
a. 使用如圖3a-3f所示的技術之一(上述第1點)(特別是考慮到編碼器提供的相關值並將其作為權重應用於振幅元件);以及
b. 使用在位元流中編碼的參數噪音資料對生成的音頻信號(柔和噪音)進行整形。
值得注意的是,編碼器不必為非活動幀提供完整的音頻信號,而只需提供相關值以及噪音形狀的參數表示,從而減少要在位元流中編碼的位元量。
信號產生器
(
例如解碼器側
)
,
CNG
圖3a-3f顯示了CNG的示例,或更一般而言,一種多聲道信號產生器200,用於生成具有一第一聲道201以及一第二聲道203的一多聲道信號204(在本說明書中,生成的音頻信號221及223被認為是噪音,但也可能是非為噪音的不同類型的信號)。首先參考圖3f,其顯示一種一般性的示例,而圖3a-3e則顯示特定示例。
第一音頻源211可以是一第一噪音源,這裡可以指示生成第一音頻信號221,其可以是一第一噪音信號。混合噪音源212可以產生一混合噪音信號222。第二音頻源213可以產生一第二音頻信號223,其可以是一第二噪音信號。多聲道信號產生器200可將第一音頻信號(第一噪音信號)221與混合噪音信號222混合,將第二音頻信號(第二噪音信號)223與混合噪音信號222混合(另外或可替代地,第一音頻信號221可以與混合噪音信號222的一版本221a混合,且第二音頻信號223可以與混合噪音信號222的一版本221b混合,其中兩種版本221a和221b可以不同,例如,彼此相差20%;版本221a和221b中的每一個可以是例如共同信號222的放大及/或縮小的版本)。因此,可以從第一音頻信號(第一噪音信號)221和混合噪音信號222中獲得多聲道信號204的第一聲道201,類似地,可以通過混合噪音信號222與第二音頻信號223的混合,得到多聲道信號204的第二聲道203。需注意者,這裡的信號可以在頻域中,並且k表示特定索引或係數(與特定頻率柱相關聯)。
從圖3a-3f中可以看出,第一音頻信號221、混合噪音信號222和第二音頻信號223可以彼此去相關,這可以例如通過對相同信號去相關(例如在一去相關器處)及/或通過獨立生成噪音(如以下提供的示例)來獲得。
混合器208可以被實現用於將第一音頻信號221及第二音頻信號223與混合噪音信號222混合,此混合可以是加總信號的類型(例如在加法器階段206-1及206-3處),然後利用加權方式對第一音頻信號221、混合噪音信號222及第二音頻信號223進行縮放(例如在振幅元件208-1、208-2、208-3處)。混合的方法是“加權後再相加”的類型。圖3a-3f 顯示了實際信號處理,其用於生成噪音信號N
l[k]及N
r[k],其中加法(+)元件表示兩個信號的採樣加法(k是頻率柱的索引)。
振幅元件(或加權元件、縮放元件)208-1、208-2及208-3可以例如通過利用合適的係數來縮放第一音頻信號221、混合噪音信號222及第二音頻信號223而獲得,並且可以輸出第一音頻信號221的加權版本221'、混合噪音信號222的加權版本222'、及第二音頻信號223的加權版本223'。合適的係數可以是sqrt(coh)以及sqrt(1-coh),並且可以例如從在信令特定描述符幀中編碼的相關性資訊之中獲得(亦見於下文)(sqrt在此指平方根運算)。相關性“coh”將在下面詳細討論,並且可以是例如下面由“c”或“c
ind”或“c
q”所表示的,例如編碼在位元流232的相關性資訊404中(參見下文,結合圖2和4)。值得注意的是,混合噪音信號222例如可以通過以相關值的平方根為權重進行縮放,而第一音頻信號221和第二音頻信號222可以通過以相關性coh與1之互補值的平方根為權重進行縮放。然而,混合噪音信號222可以被認為是一共模信號,其一部分被混合到第一音頻信號221的加權版本221'和第二音頻信號223的加權版本223',以分別獲得多聲道信號204的第一聲道201和多聲道信號204的第二聲道203。在一些情況下,第一噪音源211或第二噪音源213可被配置為生成第一噪音信號221或第二噪音信號223,使得第一噪音信號221及/或第二噪音信號223與混合噪音信號222去相關(參見以下參考圖3b-3e之敘述)。
第一音頻源211、第二音頻源213和混合噪音源212中的至少一個(或每一個)可以是一高斯噪音源。
在如圖3a所示的示例中,第一音頻源211(在此以211a表示)可以包括或連接到一第一噪音產生器,第二音頻源213(213a)可以包括或連接到一第二噪音產生器,混合噪音源212(212a)可以包括或連接到一第三噪音產生器,第一噪音產生器211(211a)、第二噪音產生器213(213a)和第三噪音產生器212(212a)可以產生相互去相關的噪音信號。
在示例中,第一音頻源211(211a)、第二音頻源213(213a)和混合噪音源212(212a)中的至少一個可以使用一預儲存噪音表來操作,因此可以提供一隨機序列。
在一些示例中,第一音頻源211、第二音頻源213和混合噪音源212中的至少一個可以為一幀生成複頻譜,其使用第一噪音值作為實部,並使用第二噪音值作為虛部。可選地,至少一個噪音產生器可以為頻率柱k生成複噪音頻譜值(例如係數),其使用在索引k處的一第一隨機值作為實部和虛部的其中之一,並使用索引(k+M)處的一第二隨機值作為實部和虛部的其中之另一。第一噪音值和第二噪音值可以被包括在噪音陣列中,例如由亂數序列產生器、噪音表或噪音程序中導出,其範圍從起始索引到結束索引,起始索引小於M,結束索引等於或小於2×M(即M的兩倍),M和k可以是整數(k是信號的頻域表示中特定位元頻率柱的索引)。
每個音頻源211、212、213可以包括至少一個音頻源產生器(噪音產生器),其例如按照N
1[k]、N
2[k]、N
3[k]產生噪音。
圖3a-3f所示之多聲道信號產生器200可以例如用於一解碼器200a、200b(200'),特別地,多聲道信號產生器200可被視為如圖4所示之柔和噪音產生器(CNG)220的一部分。解碼器200通常可用於解碼已由編碼器編碼的信號,或通過產生信號,以便從位元流中獲得的能量資訊進行整形,從而產生與輸入到編碼器的原始輸入音頻信號相對應的音頻信號。在一些示例中,在具有語音(或通常為非空音頻信號)的幀和靜音插入描述符幀之間進行分類。如本說明書所解釋的,靜音插入描述符幀(SID)(亦稱“非活動幀308”,例如可以被編碼為SID幀241及/或243)一般以低位元率資訊提供,因此會比正常語音幀(所謂的“活動幀306”,亦見下文)更低頻率地提供。此外,存在於靜音插入描述幀(SID,非活動幀308)中的資訊通常是有限的(並且可以實質上對應於關於信號的能量資訊)。
儘管如此,應當理解可以用多聲道信號產生器產生的多聲道噪音204來補充SID幀的內容。基本上,音頻源211、212、213可以處理彼此獨立且不相關的信號(例如,噪音),儘管第一音頻信號221、混合噪音信號222和第二音頻信號223可以由編碼器提供並插入位元流中的相關性資訊以進行縮放,從圖3a-3f中可以看出,混合噪音信號222的相關值可以相同,為第一音頻信號221和第二音頻信號223提供共模信號,因此允許獲得第一聲道201和第二聲道203的多聲道信號204,相關性信號通常是0和1之間的值:
- 相關性等於0表示原始的第一音頻聲道(例如L,301)和第二音頻聲道(例如R,303)彼此完全不相關,並且混合噪音信號222的振幅元件208-2對混合噪音信號222的縮放為0,這將導致第一音頻信號221和第二音頻信號223不會與任何共模信號混合(通過與恆定為0的信號混合),以及輸出聲道201、203將與多聲道信號204的第一噪音信號221和第二噪音信號223基本相同。
- 相關性等於1表示原始的第一音頻聲道(例如L,301)和第二音頻聲道(例如R,303)應相同,並且振幅元件208-1和208-3對輸入信號的縮放為0,然後第一和第二聲道等於混合噪音信號222(其在振幅元件208-2處的縮放為1)。
- 介於0和1之間的相關性將導致上述兩種情況之間的中間混合。
現在討論混合器206及/或CNG 220的一些態樣和變化。
第一音頻源(211)可以是第一噪音源,第一音頻信號(221)可以是第一噪音信號,或者第二音頻源(213)可以是第二噪音源,第二音頻信號(223)可以是第二個噪音信號。第一噪音源(211)或第二噪音源(213)可用於產生第一噪音信號(221)或第二噪音信號(223),使得第一噪音信號(221)或第二噪音信號 (223)與混合噪音信號(222)去相關。
混合器(206)可以被配置為產生第一聲道(201)和第二聲道(203),使得在第一聲道(201)中的混合噪音信號(222)的量等於在第二聲道(203)中的混合噪音聲信號(222)的量,或者在第二聲道(203)中混合噪音信號(222)的量的80%到120%的範圍內(例如,其部分221a和221b是在80%到120%的範圍內彼此不同並且與原始混合噪音信號222不同)。
在某些情況下,
第一振幅元件(208-1)執行的影響量和第二振幅元件(208-3)執行的影響量彼此相等(例如,當部分221a和221b之間沒有區別時),或者
第二振幅元件(208-3)執行的影響量與第一振幅元件(208-1)執行的影響量的差異小於第一振幅元件(208-1)執行的影響量的20%(例如,當部分221a和221b之間的差異小於20%時)。
混合器(206)及/或CNG 220可以包括用於接收控制參數(404,c)的控制輸入,因此,混合器(206)可以被配置為響應於控制參數(404,c)以控制第一聲道(201)及第二聲道(203)中的混合噪音信號(222)的量。
參照圖3a-3f,其顯示出了混合噪音信號222經受一係數sqrt(coh),並且第一信號221和第二音頻信號223經受一係數sqrt(1-coh)。
如上所述,圖3a顯示一CNG 220a,其中第一音頻源211a(211)、第二音頻源213a(213)和混合噪音源212a(212)包括不同的產生器,但這不是絕對必要的,並且可以有多種變化。
更一般而言:
1. 第一種變化之CNG 220b(如圖3b):
a. 第一音頻源211b(211)可以包括一第一噪音產生器,用以產生第一音頻信號(221)作為第一噪音信號,
b. 第二音頻源213b(213)可以包括一去相關器,用於對第一噪音信號(221)進行去相關以生成第二音頻信號(213)作為第二噪音信號(例如,在經過去相關後從第一音頻信號中獲得的第二音頻信號),以及
c. 混合噪音源212b(212)可以包括一第二噪音產生器(其與第一噪音產生器本身不相關);
2. 第二種變化之CNG 220c(如圖3c):
a. 第一音頻源211c(211)可以包括一第一噪音產生器,用以產生第一音頻信號(221)作為第一噪音信號,
b. 第二音頻源213c(213)可以包括一第二噪音產生器,用以產生第二音頻信號(223)作為第二噪音信號(例如,第二噪音產生器與第一噪音產生器本身不相關),以及
c. 混合噪音源212c(212)可包括一去相關器,用於對第一噪音信號(221)或第二噪音信號(223)進行去相關以產生混合噪音信號(222);
3. 第三種變化之CNG 220d(如圖3d及3e):
a. 第一音頻源211d或211e(211)、第二音頻源213d或213e(213)及混合噪音源212d或212e(212)其中之一可以包括一噪音產生器,用以產生一噪音信號,
b. 第一音頻源211d或211e(211)、第二音頻源213d或213e(213)及混合噪音源212d或212e(212)其中之另一可以包括一第一去相關器,用於對噪音信號去相關,以及
c. 第一音頻源211d或211e(211)、第二音頻源213d或213e(213)及混合噪音源212d或212e(212)其中之又一可以包括一第二去相關器,用於對噪音信號去相關,
d. 第一去相關器和第二去相關器可以互不相同,使得第一去相關器和第二去相關器的輸出信號互不相關。
4. 第四種變化之CNG 220(如圖3a):
a. 第一音頻源211a(211)包括一第一噪音產生器,
b. 第二音頻源213a(213)包括一第二噪音產生器,
c. 混合噪音源212a (212)包括一第三噪音產生器,
d. 第一噪音產生器、第二噪音產生器及第三噪音產生器可以生成相互去相關的噪音信號(例如,三個產生器彼此本身不相關)。
5. 第五種變化:
a. 第一音頻源(211)、第二音頻源(213)及混合噪音源(212)其中之一可以包括一偽亂數序列產生器,用以依據一種子生成一偽亂數序列,
b. 第一音頻源(211)、第二音頻源(213)及混合噪音源(212)其中的至少二可以利用不同的種子來初始化偽亂數序列產生器。
6. 第六種變化:
a. 第一音頻源(211)、第二音頻源(213)及混合噪音源(212)其中的至少一個可以使用一預儲存噪音表進行操作,
b. 可選地,第一音頻源(211)、第二音頻源(213)及混合噪音源(212)其中的至少一個可以生成一幀的複頻譜,其使用一第一噪音值作為一實部,並使用一第二噪音值作為一虛部,
c. 可選地,至少一個噪音產生器被配置為產生用於一頻率柱k的一複噪音頻譜值,其使用一索引k處的一第一隨機值作為實部及虛部其中之一,並使用一索引(k+M)處的一第二隨機值作為實部及虛部其中之另一(第一噪音值及第二噪音值包括在一噪音陣列中,例如從一亂數序列產生器、一噪音表或一噪音程序導出,其範圍從一起始索引到一結束索引,起始索引小於M,結束索引等於或小於2×M,其中M和k是整數)。
如圖4所示,除了如圖3所示之CNG 220之外,解碼器200'(200a、200b)還可以包括一輸入介面210,用於從一幀序列中接收一編碼音頻資料,幀序列包括一活動幀及跟隨在活動幀之後的一非活動幀;以及一音頻解碼器,用以解碼活動幀之編碼音頻資料以產生活動幀的一解碼多聲道信號,其中第一音頻源211、第二音頻源213、混合噪音源212及混合器206是在非活動幀中致動,以產生非活動幀的多聲道信號。
需注意者,活動幀是那些被編碼器分類為具有語音(或任何其他類型的非噪音聲音)的幀,而非活動幀是那些被分類為具有靜音或只有噪音的幀。
CNG 220(220a-220e)的任何示例可由合適的控制器進行控制。
編碼器
現在討論編碼器,編碼器可以對活動幀和非活動幀進行編碼。對於非活動幀,編碼器可以編碼參數噪音資料(例如噪音形狀及/或相關值)但不完全編碼音頻信號。需要注意的是,可以相對於活動音頻幀減少對非活動音頻幀的編碼,以減少位元流中要編碼的資訊量。此外,與在活動幀中編碼的資訊相比,非活動幀的參數噪音資料(例如噪音形狀)對於每個頻帶可以具有更少的資訊及/或可以具有更少的柱。參數噪音資料可以在左/右域或另一個域(例如中/側域)中給出,例如通過提供第一和第二聲道的參數噪音資料之間的第一線性組合以及第一和第二聲道的參數噪音資料之間的第二線性組合(在某些情況下,還可以提供不與第一和第二線性組合相關聯的增益資訊,但在左/右域中給出),第一和第二線性組合通常彼此線性獨立。
編碼器可以包括活動檢測器,其係將一幀分類為活動還是非活動。
圖1、2及4顯示編碼器300a和300b(當不需要區分編碼器300a和編碼器300b時也稱為300)的示例,每個音頻編碼器300可以為一輸入信號304的幀序列生成編碼的多聲道音頻信號232,輸入信號304在此被認為可區分為一第一聲道301(也表示為左聲道或“l”,其中“l”的大寫英文字母為“L”,是英文“left”的第一個字母)以及一第二聲道303(或“r”,其中“r”的大寫英文字母為“R”,是英文“right”的第一個字母)。
編碼的多聲道音頻信號232可以定義於幀序列中,其可以例如在時域中(例如,每個樣本“n”可以指特定時刻並且一幀的樣本可以形成一序列,如輸入音頻信號的採樣序列或對輸入音頻信號進行濾波後的序列)。
編碼器300(300a、300b)可包括一活動檢測器380,其未在圖2及4中示出(儘管在其中部份示例中被實施),但在圖1中示出,圖1顯示輸入信號304的每一幀可被分類為“活動幀306”或“非活動幀308”,非活動幀308使得信號被認為是靜音的(且例如只有靜音或噪音),而活動幀306可能具有對無噪音音頻信號(例如語音、音樂等)的 一些檢測。
在由編碼器300編碼(例如位元流)的編碼多聲道音頻信號232中,關於該幀是一活動幀306還是一靜音幀308的資訊可以例如在所謂的“柔和噪音產生輔助資訊”402(p_frame)中進行信號發送,其亦稱為“輔助資訊”。
圖1顯示一預處理階段360,其可以判斷(例如分類)一幀是一活動幀306還是一靜音幀308。這裡要注意的是,輸入信號304的聲道301及303用大寫字母表示,如L(301,左聲道)和R(303,右聲道),用以表示他們在頻域中。從圖1中可以看出,可以應用一頻譜分析步驟階段370(第一頻譜分析370-1用於第一聲道301,L;以及第二階段370-3用於第二聲道303,R),頻譜分析階段370可以針對輸入信號304的每一幀執行並且可以例如基於諧波測量。值得注意的是,在一些示例中,由階段370對第一聲道301執行的頻譜分析可以與在同一幀中的第二聲道303執行的頻譜分析分開進行。
在一些情況下,頻譜分析階段370可以包括能量相關參數的計算,例如預定頻帶範圍的平均能量以及總平均能量。
可以進行一活動檢測階段380(在搜索語音的情況下可以將其視為語音活動檢測)。一第一活動檢測階段380-1可以應用於第一聲道301(並且特別地應用於在第一聲道上執行的測量),並且一第二活動檢測階段380-3可以應用於第二聲道303(並且特別地應用於在第二聲道上執行的測量)。在示例中,活動檢測階段380可以估計輸入信號304中的背景噪音的能量並且使用該估計來計算信噪比,將其與信噪比閾值進行比較以判斷該幀是被分類為活動幀還是非活動幀(即,計算的信噪比超過信噪比閾值表示該幀被分類為活動;且計算的信噪比低於信噪比閾值表示該幀被分類為非活動)。在示例中,階段380可以將分別由頻譜分析階段370-1和370-3獲得的諧波與一個或兩個諧波閾值(例如,第一聲道301的第一閾值和第二聲道303的第二閾值)進行比較,在這兩種情況下,不僅可以將每個幀分類,還可以將每個幀的每個聲道分類為活動聲道或非活動聲道。
可以執行判斷381,並且基於此判斷,可以判斷(如標識為開關381')是執行一離散立體聲程序306a還是執行一立體聲不連續傳輸程序(立體聲DTX)306b。值得注意的是,在活動幀(及離散立體聲程序306a)的情況下,可以根據任何策略或處理標準或程序來執行編碼,因此在此不進一步詳細分析。以下的大部分討論都將與立體聲DTX 306b相關。
值得注意的是,在示例中,僅當聲道301及303兩者分別被階段380-1及380-3分類為非活動時,該幀才被分類(在階段381)為非活動幀。因此,可以避免如上所述在活動檢測決策中的問題。特別地,沒有必要為每個幀的每個聲道用信號通知其活動/非活動的分類(從而減少信號通知),並且固有地獲得聲道之間的同步。此外,在本說明書所討論的解碼器中,可以利用第一聲道301及第二聲道303之間的相關性並生成一些噪音信號,這些噪音信號根據為信號304獲取之相關性進行相關或去相關。於此,將詳細討論用於編碼非活動幀的編碼器300(300a、300b)的元件,如所解釋的,可以使用任何其他技術來編碼活動幀308,因此這裡不討論。
一般而言,編碼器300a、300b(300)可以包括用於計算第一聲道301及第二聲道303的參數噪音資料401、403的噪音參數計算器3040,噪音參數計算器3040可以計算用於第一聲道301及第二聲道303的參數噪音資料401、403 (例如索引及/或增益),因此噪音參數計算器3040可以在幀序列中提供編碼音頻資料232,該幀序列可以包括活動幀306及非活動幀308(其可以跟隨在活動幀306之後)。特別地,在非活動幀308的情況下,編碼音頻資料232可以被編碼為一個或兩個靜音插入描述符幀(SID)241、243。在一些示例中(如圖2所示),只有單一個SID幀,在其他一些示例中,可以有兩個SID幀(如圖4所示)。
非活動幀308可以特別包括以下至少一項:
- 柔和噪音產生輔助資訊(例如,402、p_frame);
- 第一聲道301的柔和噪音參數資料401或第一聲道301的柔和噪音參數資料與第二聲道的柔和噪音參數資料的一第一線性組合(v
l,ind、v
m,indp_noise、增益g
l,q);
- 第二聲道303的柔和噪音參數資料403或第一聲道301的柔和噪音參數資料與第二聲道的柔和噪音參數資料的一第二線性組合(v
r,ind、v
s,indp_noise、增益g
r,q);
- 相關性資訊(相關性資料)(c,404)。
在一些示例中,一第一靜音插入描述符幀241可以包括以上列表的前兩項,並且一第二靜音插入描述符幀243可以包括特定資料領域中的最後兩個特徵,儘管如此,不同的協議可以提供不同的資料領域或不同的位元流組織,然而在某些情況下(如圖2所示),兩個聲道的噪音參數可能只有單一個非活動幀。
將表明者,相關性資訊(例如“靜音插入描述符”的一部分)可以包括指示相關性資訊(如相關性資料)的一個單一值(例如以幾個位元編碼,如四位元),例如同一非活動幀308的第一聲道301與第二聲道303之間的相關性。另一方面,柔和噪音參數資料401、403可以指示對於每個聲道301、303的非活動幀308的信號能量(例如,其可以實質上提供一封包),或者無論如何可以提供一噪音形狀資訊,封包或噪音形狀資訊的形式可以是頻率柱的多個係數和每個聲道的增益,可以在階段312(見下文)使用原始輸入聲道(301、303)來獲得噪音形狀資訊,然後對噪音形狀參數向量進行中/側編碼。將表明者,在解碼器中可能產生一些可能受相關性資訊404影響的噪音聲道(如圖3所示之201、203)。因此,由CNG 220( 220a-220)生成的噪音聲道201、203可以被由控制噪音資料(柔和噪音參數資料401、403、2312)所控制的信號修改器250修改,所述控制噪音資料指示用於第一音頻聲道L
out和第二音頻聲道R
out的信號能量。
音頻編碼器300(300a、300b)可以包括相關性計算器320,其可以獲得用於編碼在位元流(例如信號232、幀241或243)中的相關性資訊(404),相關性資訊(c,404)可以指示非活動幀308中的第一聲道301(如左聲道)與第二聲道303(如右聲道)之間的相關情況,其示例將討論於後。
編碼器300(300a、300b)可以包括一輸出介面310,其被配置用於生成多聲道音頻信號232(位元流),其具有活動幀306的編碼音頻資料和非活動幀308的第一參數資料(柔和噪音參數資料)401(p_noise,左)、第二參數噪音資料(p_noise,右、403)以及相關性資料c(404)。第一參數資料401可以是第一聲道(如左聲道)或第一與第二聲道的第一線性組合(例如中聲道)的參數資料,第二參數資料403可以是第二聲道(如右聲道)或第一與第二聲道的第二線性組合(例如側聲道)的參數資料,其中第二線性組合不同於第一線性組合。
在位元流232中,還可以有輔助資訊402,其包括當前幀是活動幀306還是非活動幀308的指示,例如通知解碼器要使用的解碼技術。
特別地,圖4顯示噪音參數計算器(計算噪音參數階段)3040,其包括用以計算第一聲道301的柔和噪音參數資料401的一第一噪音參數計算器階段304-1、以及用以計算第二聲道303的第二柔和噪音參數403的一第二噪音參數計算器階段304-3。圖2顯示了一個示例,其中噪音參數被聯合處理和量化,內部部分(例如將噪音形狀向量轉換為M/S表示)如圖 5所示。基本上,我們可能有第一聲道M的噪音形狀以及第二聲道S的噪音形狀,其可以編碼為中索引及側索引,而左聲道301的噪音形狀的增益和右聲道303的噪音形狀的增益也可以被編碼。
相關性計算器320可以計算指示第一聲道L和第二聲道R之間的相關情況的相關性資料(相關性資訊)c(404),在這種情況下,相關性計算器320可以在頻域中操作。
可以看出,相關性計算器320可以包括一計算聲道相關性階段320',其獲得一相關值c(404),接著,可以使用一統一量化器階段320”,因此可以獲得相關值c的量化版本c
ind。
以下將說明如何獲得相關性以及如何對其進行量化。
在一些示例中,相關性計算器320可以:
從非活動幀中的第一聲道與第二聲道(303)的複頻譜值計算一實中間值和一虛中間值;
計算非活動幀中的第一聲道的第一能量值以及第二聲道(303)的第二能量值;以及
使用實中間值、虛中間值、第一能量值和第二能量值計算相關性資料(404,c),及/或
平滑後的實中間值、虛中間值、第一能量值和第二能量值中的至少一個,並使用至少一個平滑值計算相關性資料。
相關性計算器320可以對平滑後的實中間值求平方,以及對平滑後的虛中間值求平方,並將平方值相加以獲得一第一分量數。相關性計算器320可以將平滑後的第一和第二能量值相乘以獲得一第二分量數,並且組合第一分量數與第二分量數以獲得相關值的結果數,相關性資料基於該結果數。相關性計算器320可以計算結果數的平方根以獲得作為相關性資料之基礎的相關值。以下提供數個公式的示例。
現在解釋如何獲得要在解碼器處呈現的噪音形狀(或其他信號能量)的形狀,將被編碼的基本上是原始輸入信號302的噪音的形狀(或與能量有關的其他資訊),其在解碼器處將被應用於生成的噪音203並將對其進行整形,以便呈現噪音252(輸出音頻信號),其類似於信號304的原始噪音。
首先,需注意者,上述信號304並未被編碼器編碼在位元流232中,然而,噪音資訊(如能量資訊、封包資訊)可被編碼在位元流232中,以便隨後產生具有由編碼器編碼的噪音形狀的噪音信號。
可以將獲得噪音形狀方塊312應用於編碼器的輸入信號304。“獲得噪音形狀”方塊312可以計算輸入信號304中噪音的頻譜封包的低解析度參數表示1312,這可以例如通過計算輸入信號304的頻域表示的頻帶中的能量值來完成;能量值可以被轉換成對數表示(如果需要)並且可以被壓縮成較低數量(N)的參數,這些參數稍後在解碼器中使用以生成柔和噪音。噪音的這些低解析度表示在此被稱為“噪音形狀”1312,因此,“獲得噪音形狀”方塊312的下游不應被理解為表示輸入信號304,而是表示其噪音形狀(在各別聲道中噪音頻譜封包的參數表示)。這很重要,因為編碼器可能只在SID幀中傳輸噪音頻譜封包的這種較低解析度的表示。因此,在圖2中,所有“噪音參數計算器”部分(3040)都可以理解為僅對這些與噪音相關的參數向量(例如標識為v
l、v
r、v
m,ind、及v
s,ind)進行操作,而不對信號304的信號表示進行操作。
圖5顯示“噪音參數計算器”部分3040(聯合噪音形狀量化)的示例,可以應用L/R到M/S轉換器階段314來獲得噪音形狀1312的中間聲道表示v
m(聲道L和R的噪音形狀的第一線性組合)和噪音形狀1312的側聲道表示v
r(聲道L和R的噪音形狀的第二線性組合)。以下將展示如何獲得它,因此,噪音形狀304可能會被分成兩個聲道v
m和v
r。
接著,在歸一化階段316,噪音形狀1312的中聲道表示v
m和噪音形狀1312的側聲道表示v
r中的至少一個可以被歸一化,以獲得噪音形狀1312的中聲道表示v
m的歸一化版本v
m,n,及/或噪音形狀1312的側聲道表示v
r的歸一化版本v
r,n。
接著,量化階段(例如向量量化,VQ)318可以應用於信號1304的歸一化版本,例如以噪音形狀1312的歸一化的中聲道表示v
m,n的量化版本v
m,ind和噪音形狀1312的歸一化的側聲道表示v
s,n的量化版本v
s,ind的形式。可以使用向量量化(例如,通過多階段向量量化器),因此,索引v
m,ind[k](k是特定頻率柱的索引)可以描述噪音形狀的中表示,並且索引v
s,ind[k]可以描述噪音形狀的側表示。因此,索引v
m,ind[k]和v
s,ind[k]可以在位元流232中編碼為第一聲道的柔和噪音參數資料和第二聲道的柔和噪音參數資料的第一線性組合以及第一聲道的柔和噪音參數資料和第二聲道的柔和噪音參數資料的第二線性組合。
在去量化階段322,可以對噪音形狀1312的歸一化中聲道表示v
m,n的量化版本v
m,ind和噪音形狀1312的歸一化側聲道表示v
s,n的量化版本v
s,ind執行去量化。
M/S到L/R轉換器324可以應用於噪音形狀1312的去量化的中表示v
m,q和側表示v
s,q的去量化版本,以獲得原始(左右)聲道v’
l和v’
r中的噪音形狀1312的版本。
隨後,在階段326,可以計算增益g
l和g
r,值得注意的是,增益對於同一非活動幀306的同一聲道(v’
l和v’
r)的噪音形狀的所有樣本都是有效的。增益g
l和g
r可以通過考慮噪音形狀表示v’
l和v’
r中的頻率柱的總體(或幾乎其總體)。
增益g
l可以通過比較以下兩者而得:
-在L/R域(L/R到M/S轉換器314的上游)中的第一聲道301的噪音形狀的頻率柱的值;與
-一旦在L/R域中被重新轉換,第一聲道301(M/S到L/R轉換器324的下游)的噪音形狀1312的頻率柱的值。
類似地,增益g
r可以通過比較以下兩者而得:
-L/R域(L/R到M/S轉換器314的上游)中的第二聲道303的噪音形狀的係數的值;與
-在L/R域中重新轉換的第二聲道303(M/S到L/R轉換器324的下游)的噪音形狀1312的係數的值。
下面提出如何獲得增益的示例。然而,在線性域中,增益可以例如與多個分數的幾何平均值成正比,每個分數是L/R域中特定聲道的噪音形狀的係數(上游到L/R到M/S轉換器314)和同一聲道在L/R域下游再次轉換到M/S到L/R轉換器324的係數之間的一分數。在對數域中,對於每個聲道,增益可被獲得為與代數平均值成正比,代數平均值為L/R域(L/R到M/S轉換器314的上游)中噪音形狀的FD版本的係數以及在L/R域下游重新轉換到M/S到L/R轉換器324的噪音形狀的係數之間的差值。通常,在對數或標量域中,增益可以提供L/R到M/S轉換和量化之前左或右聲道的噪音形狀的版本與在去量化和M/S到L/R重新轉換之後左或右聲道的噪音形狀的版本之間的關係。
量化階段328可以應用於增益g
l以獲得其標示為g
l,q的量化版本,且應用於增益g
r以獲得其標示為g
r,q的量化版本,其可以從非量化增益g
r獲得。增益g
l,q和g
r,q可以被編碼在位元流232中(例如,作為柔和噪音參數資料401及/或403)以被解碼器讀取。
在一些示例中,還可以將側聲道噪音形狀向量的能量(例如,在歸一化之前,如在階段314和316之間)與預定能量閾值α(其可以是正實數值)(在本示例中是0.1,但也可以是不同的值,例如介於0.05和0.15之間的值)進行比較。在比較方塊435中,可以判斷非活動幀308的噪音形狀的側表示v
s是否具有足夠的能量,如果噪音形狀的側表示v
s的能量小於能量閾值α,則將二元結果(“無側旗標”)以輔助資訊402的方式信令於位元流232中。這裡假設,如果噪音形狀的側表示v
s的能量小於能量閾值α,則無側旗標=1,如果噪音形狀的側表示v
s的能量大於能量閾值α,則無側旗標=0。在某些情況下,在能量正好等於能量閾值的情況下,根據特定應用,該旗標可以是1或0。方塊436否定無側旗標436’的二元值(如果方塊436的輸入為1,則輸出436'為0;如果方塊436的輸入為0,則輸出436'為1)。方塊436被顯示為用以提供旗標的相反值的輸出436'。因此,如果噪音形狀的側表示v
s的能量大於能量閾值,則值436'可以是1,如果噪音形狀的側表示v
s的能量小於預定閾值,那麼值436'是0,需注意者,去量化的值v
s,q可以乘以二元值436'。這只是獲得以下資訊的一種可能方式,如果噪音形狀的側表示的能量v
s小於預定能量閾值α,則噪音形狀的去量化側表示v
s,q的柱可被人為歸零(方塊437的輸出437'將為0)。另一方面,如果噪音形狀的側表示v
s的能量足夠大(>α),則方塊437(乘法器)的輸出437'可能與v
s,q完全相同。因此,如果噪音形狀的側表示的能量v
s小於預定能量閾值α,則不考慮噪音形狀的側表示v
s(特別是其去量化版本v
s,q),以獲得噪音形狀的左/右表示,(將表明者,另外或替代地,解碼器也可以具有將噪音形狀的側表示的係數歸零的類似機制)。需注意者,也可以在位元流232中編碼無側旗標作為輔助資訊402的一部分。
應注意者,噪音形狀的側表示的能量被顯示為在噪音形狀歸一化之前(在方塊316)所測量(由方塊435),並且在將其與閾值進行比較之前,能量未被歸一化。原則上,也可以在對噪音形狀進行歸一化之後,由方塊435進行測量(例如,方塊435可以由v
s,n輸入而不是由v
s輸入)。
參考用於比較噪音形狀的側表示的能量閾值α,此值為0.1,其在一些示例中可以任意選擇。在示例中,可以在實驗和調整(例如通過校準)之後選擇閾值α。在一些示例中,原則上可以使用適用於數字格式(浮點或定點)或個別實現的精度的任何數字,因此,閾值α可以是能夠在校準之後輸入的實現特定之參數。
需注意者,輸出介面(310)可以配置為:
使用用於第一頻率柱數量的多個第一係數來生成具有活動幀(306)的編碼音頻資料的編碼多聲道音頻信號(232);以及
使用用於描述第二頻率柱數量的多個第二係數來生成第一參數噪音資料、第二參數噪音資料、或第一參數噪音資料與第二參數噪音資料的第一線性組合以及第一參數噪音資料與第二參數噪音資料的第二線性組合,
其中第一頻率柱數量大於第二頻率柱數量。
事實上,可以對非活動幀使用降低的解析度,從而進一步減少用於編碼為元流的位元量,這同樣適用於解碼器。
編碼器的任何示例都可以由合適的控制器所控制。
解碼器
現在,討論根據示例的解碼器。解碼器可以包括例如以上討論的柔和噪音產生器220(220a-220e),如圖3a-3f所示,柔和噪音204(多聲道音頻信號)可以在信號修改器250處被整形,以獲得輸出信號252,我們在這裡感興趣的是顯示用於在非活動幀308中產生噪音的操作,而不是用於活動幀306。
圖4顯示解碼器200’的第一個例子,在此以200’(200b)表示,需注意者,解碼器200’包括柔和噪音產生器220,其可以包括根據圖3a-3f所示的任一個產生器220(220a-220e)。在產生器220(220a-220e)的下游,可以存在信號修改器250(未示出,但在圖4中示出),用以根據柔和噪音參數資料(401、403)中編碼的能量參數對生成的多聲道噪音204進行整形。通過解碼器輸入介面210,解碼器200'可以從位元流232中獲得柔和噪音參數資料(401、403),其可以包括描述信號能量的柔和噪音參數資料(例如,對於第一聲道與第二聲道,或者對於第一和第二聲道的第一線性組合與第二線性組合,第一和第二線性組合彼此線性獨立)。通過解碼器輸入介面210,解碼器200’可以獲得相關性一資料404,其指示不同聲道之間的相關性。圖4顯示在位元流232中,對於非活動幀的編碼,分別提供了兩個不同的靜音描述符幀241和243,但是有可能使用兩個以上的描述符幀,或者僅使用單一個描述符幀。解碼器200b的輸出是多聲道輸出。
參考圖2所示,現在討論作為解碼器200的一示例的解碼器200’(在此稱為200a),其可用於生成輸出信號252,例如其可以是噪音的形式。
首先,解碼器200a(200')可以包括輸入介面210,用於接收幀序列306、308中的編碼音頻資料232(位元流),其係例如由編碼器300a或300b編碼的。解碼器200a(200')可以是多聲道信號產生器200,或更一般地是多聲道信號產生器200的一部分,該多聲道信號產生器可以是或包括如圖3a-3f中任一個的柔和噪音產生器220(220a-220e)。
首先,圖2顯示出了立體聲柔和噪音產生器(CNG)220(220a-220e)。特別地,柔和噪音產生器220(220a-220e)可以類似於圖3a-3f所示的柔和噪音產生器或其變化之一,在此,從編碼器300a或300b獲得的相關性資訊404(例如,c,或更準確地說c
q,也可用“coh”或c
ind表示)可用於生成先前已經討論過的多聲道信號204(在聲道201、203)。由CNG 220(220a-220e)產生的多聲道信號204實際上可以被進一步修改,例如通過考慮柔和噪音參數資料401和403,例如待整形的多聲道信號的第一(左)聲道和第二(右)聲道的噪音形狀資訊。特別地,在此將顯示出可以獲得在階段316及/或318處由編碼器300a(並且特別地由噪音參數計算器3040)生成的中索引v
m,ind(401)和側索引v
s,ind(403),以及在階段326及/或328處獲得的增益g
l,q和g
r,q。
如圖2所示,輔助資訊402可以允許判斷當前幀是活動幀306還是非活動幀308。如圖2所示的元件指的是非活動幀308的處理,並且其意圖是可以使用任何技術來生成活動幀306中的輸出信號,因此它們不是本說明書的標的物。
如圖2所示,從位元流232中獲得柔和噪音資料的若干示例。如上所述,柔和噪音資料可以包括相關性資訊(資料)404、參數401和403(v
m,ind和v
s,ind)表示噪音形狀及/或增益(g
l,q和g
r,q)。
階段212-C可以對相關性資訊404的量化版本c
ind進行去量化,以獲得去量化的關性資訊c
q。
階段2120(聯合噪音形狀去量化)可以允許對從位元流232獲得的其他柔和噪音資料進行去量化。可以參考圖6,去量化階段212’由其他去量化階段形成,這裡以212-M、212-S、212-R、212-L表示。階段212-M可以對中聲道噪音形狀參數401和403進行去量化,以獲得去量化的噪音形狀參數v
m,q和v
s,q,階段212-S可以提供側聲道噪音形狀參數403(v
s,ind)的去量化版本v
s,q。在一些示例中,可以利用無側旗標,以便在噪音形狀向量v
s的能量被編碼器300a處的方塊435識別為小於預定閾值α,在能量小於預定閾值α並以無側旗標對其信令的情況下,噪音形狀向量v
s的去量化版本v
s,q可以被歸零(概念上顯示為乘以從方塊536所取得的旗標536’,其具有與編碼器的方塊436相同的功能,即使方塊536實際上讀取在位元流232的輔助資訊中編碼的無側旗標,而不執行與閾值α的任何比較)。因此,如果已確定編碼器處的側聲道的能量小於預定閾值α,則噪音形狀向量v
s的去量化版本v
s,q被人為地歸零,並且縮放器方塊537的輸出 537'處的值為零。否則,如果該能量大於預定閾值,則輸出537'與側聲道的噪音形狀的側索引403(v
s,ind)的量化版本v
s,q相同。換言之,在側聲道的能量低於預定能量閾值α的情況下,噪音形狀向量v
s,ind的值被忽略。
在M/S到L/R階段516,執行M/S到L/R轉換,以獲得參數資料(噪音形狀)的L/R版本v'
l、v'
r。隨後,可以使用增益階段518(由階段518-L與518-R形成),使得在階段518-L處聲道v'
l由增益g
l,d縮放,而在階段518-R處聲道 v'
r由增益g
r,q縮放。因此,可以獲得能量聲道v
l,q與v
r,q作為增益階段518的輸出。階段方塊518-L和518-R用“+”表示,因為值的轉換被想像為在對數域中,因此另外指示了值的縮放。然而,增益階段518指示重構的噪音形狀向量v
l,q和v
r,q被縮放,重建的噪音形狀向量v
l,q和v
r,q在這裡用2312複雜地指示並且是噪音形狀1312的重建版本,如最初由編碼器處的“獲得噪音形狀”方塊312獲得的。一般而言,對於相同非活動幀的相同聲道的所有索引(係數),每個增益是恆定的。
需注意者,索引v
m,ind、v
s,ind和增益g
l,q、g
r,q是噪音形狀的係數,並提供有關幀能量的資訊,其基本上是指與用於生成信號252的輸入信號304相關聯的參數資料,但不代表信號304或要生成的信號252。換句話說,噪音聲道v
r, q及v
l, q描述了要應用於由CNG 220 生成的多聲道信號204的封包。
回到圖2,在信號修改器250處使用的重構的噪音形狀向量v
l,q及v
r,q(2312),以通過對噪音204進行整形來獲得修改的信號252。特別地,生成的噪音204的第一聲道201可以在階段250-L處由聲道v
l,q整形,且生成的噪音204的聲道203可以在階段250-R處整形,以獲得輸出多聲道音頻信號252(L
out和R
out)。
在示例中,柔和噪音信號204本身不是在對數域中生成的:只有噪音形狀可以使用對數表示,可以執行從對數域到線性域的轉換(儘管圖未示)。
還可以執行從頻域到時域的轉換(儘管圖未示)。
解碼器200'(200a、200b)還可以包括頻譜-時間轉換器(例如信號修改器250),用於將經過頻譜調整和相關性調整的調整後第一聲道201和調整後第二聲道203轉換為相應的時域表示,以與活動幀之解碼的多聲道信號的相應聲道的時域表示組合或串聯。生成的柔和噪音轉換為時域信號的轉換發生在圖2所示之信號修改器方塊250之後。“組合或串聯”的部分基本上意味著在使用這些CNG技術之一的非活動幀之前或之後,也可以是活動幀之前或之後(圖1所示之其他處理路徑),並且為了生成沒有任何間隙或可聽聞之咔嗒聲等的連續輸出,需要正確串聯多個幀。
在一些示例中:
用於活動幀(306)的編碼音頻信號(232)具有描述第一頻率柱數量的多個第一係數;以及
用於非活動幀(308)的編碼音頻信號(232)具有描述第二頻率柱數量的多個第二係數。
第一頻率柱數量可以大於第二頻率柱數量。
解碼器的任何示例都可以由合適的控制器控制。
處理步驟:第一版本
在兩個聲道的兩個SID幀中編碼的噪音參數按照EVS [6]中的方法計算,例如LP-CNG或FD-CNG、或兩者,解碼器中噪音能量的整形也與EVS中的相同,例如LP-CNG或FD-CNG、或兩者。
在編碼器中,另外計算兩個聲道的相關性,使用四位元均勻量化並在位元流232中發送。在解碼器中,接著可以通過傳輸的相關值 404來控制CNG操作,可以使用如圖3a-3f所示的三個高斯噪音源N
1、N
2、N
3(211a、212a、213a;211b、212b、213b;211c、212c、213c;211d、212d、213d;211e、212e、213e如圖所示)。當聲道相關性高時,主要相關噪音可被添加到聲道221’與223’,而當相關性404低時,則添加更多不相關噪音。
對於所有非活動幀306,可以在編碼器(例如300、300a、300b)中不斷地估計用於柔和噪音生成的參數(噪音參數),例如,這可以通過應用頻域噪音估計演算法(例如[8])來完成,例如,如[6]中所述,分別在兩個輸入聲道(如301、303)上計算兩組噪音參數(如401、403),其也被解釋為參數噪音資料。此外,兩個聲道的相關性(c、404)可以如下計算(例如在相關性計算器320處):給定兩個輸入聲道
(L、R可以是301、303)的M點DFT-頻譜,可以計算四個中間值,例如
以及兩個聲道的能量
於此,其中M=256,
表示複數的實部,
表示複數的虛部,且
表示複共軛。接著可以例如使用上一幀的相應值來平滑這些中間值,:
該段落可以是編碼器處的“計算聲道相關性”方塊320'的一部分,這是內部參數的時間平滑,以避免幀之間參數的突然大跳躍。換句話說,這裡對參數應用了低通濾波器。
可以使用區間0.95±0.03和0.05∓0.03內的其他常數來代替常數0.95和0.05。
或者,可以定義:
其中,
,且
,例如β=0.95且γ=0.05。
然後可以計算相關性(c、404)(可能在0和1之間),其例如在相關性計算器(320)處計算如下
並且均勻量化(例如在量化器320”處)使用例如四位元,如下
兩個聲道的估計噪音參數1312、2312的編碼可以分別完成,例如,如[6]中所述,然後可以對兩個SID幀241、243進行編碼並發送到解碼器。第一個SID幀241可以包含聲道L的估計噪音參數401和數個位元(如四位元)的輔助資訊402,例如,如[6]中所述。在第二個SID幀243中,聲道R的噪音參數403可以與四位元量化的相關值c、404一起發送(在不同的示例中可以選擇不同的位元量)。
在解碼器(如200’、200a、200b)中,兩個SID幀的噪音參數(401、403)和第一個幀的輔助資訊402都可以被解碼,如[6]中所述,第二個幀中的相關值404可以在階段212-C中被去量化如下
(在圖2中,
被
取代)。
對於柔和噪音生成(例如,在產生器220或產生器220a-220e中的任一個,其可以包括圖3a-3e中的任一個),根據示例,可以使用如圖3所示的三個高斯噪音源211、212、213,噪音源 211、212、213可以例如基於相關值(c、404)自適應地相加在一起(例如在加法器階段206-1和206-3處),左及右聲道噪音信號
的DFT-頻譜可以計算如下
其中,
(這是特定頻率柱的索引,而每個聲道有M個頻率柱),
(即j是虛數單位),“×”是正常的乘法。於此,“頻率柱”分別指的是頻譜N
l和N
r中複數值的數量,M是所使用的FFT或DFT的變換長度,所以頻譜的長度為M。需要注意的是,實部插入的噪音和虛部插入的噪音可能不同。因此,對於頻譜長度M而言,我們需要從每個噪音源生成2×M個值(一個實數和一個虛數);或者,換句話說:N
l和N
r是長度為M的複數值向量,而N1、N2和N3是長度為2×M的實數值向量。
之後,兩個聲道中的噪音信號204使用從相應的SID幀中解碼的相應噪音參數(2312)進行頻譜整形(在如圖2中的階段250-L、250-R內),並隨後變換回時域(如[6]中所述),用於頻域柔和噪音生成。
處理的任何示例可以由合適的控制器執行。
處理步驟:第二個版本
如上所述的處理步驟的態樣可以與以下態樣中的至少一個整合,這裡主要參考圖2及5,但也可參考圖4。
編碼器的通用框架的方塊圖係如圖1所示,對於編碼器中的每一幀,如[6]中所述,通過在每個聲道上單獨運行VAD,可以將當前信號分類為活動或非活動,然後可以在兩個聲道之間同步VAD決定。在示例中,僅當兩個聲道都被分類為不活動時,一幀才被分類為不活動幀308;否則,該幀被歸類為活動的,並且兩個聲道都在基於MDCT的系統中使用[10]中描述的按頻帶M/S進行聯合編碼。當從活動幀切換到非活動幀時,信號可能會進入如圖3所示的SID編碼路徑。
可以在編碼器(如300、300a、300b)中為活動和非活動幀(306、308)不斷地估計用於柔和噪音生成的參數(如1312、401、403、q
l,q、g
r,q)(如噪音參數),這可以例如通過應用如[8]中討論的及/或[6]中描述的那樣的頻域噪音估計過程來完成,例如分別在兩個輸入聲道301、303上計算兩組噪音參數,其包括例如在每個聲道的對數域中的頻譜噪音形狀(M
i、401、及/或I
s或403)。
此外,兩個聲道的相關性(404、c)可以計算如下(例如在相關性計算器320中計算):給定兩個輸入聲道的M點DFT-頻譜
,四個中間值可以計算如下
以及兩個聲道的能量
於此,其中M=256(M可以使用其他值),
表示複數的實部,
表示複數的虛部,
表示複數共軛,接著在10毫秒子幀的基礎上平滑這些中間值,其中,
表示來自前一個子幀的相應值,平滑後的值可以計算如下:
可以使用區間0.95±0.03和0.05∓0.03內的其他常數來代替常數0.95和0.05。
或者,可以定義:
其中,
,且
,例如β=0.95且γ=0.05(β> γ,例如β> 3×γ、或β> 6×γ)。
然後可以計算相關性c ϵ [0,1](例如在320')如下
並使用四位元(但可能使用不同數量的位元)來統一量化(例如在320”)如下
其中,
表示向下舍入到最接近的整數(向下取整函數)。
兩個聲道的估計噪音形狀的編碼可以聯合完成。從左(v
l)和右(v
r)聲道噪音形狀,可以獲得不同的聲道(例如通過線性組合),例如可以計算中聲道(v
m)噪音形狀和側聲道(v
s)噪音形狀(例如在方塊314)如下
其中,例如在頻域中,N表示噪音形狀向量的長度(例如對於每個非活動幀308)。如EVS[6]中估計的,N表示噪音形狀向量的長度,其可以在17到24之間。噪音形狀向量可以看作是在一輸入幀中噪音的頻譜封包的更緊湊的表示。或者,更抽象地說,使用N個參數對噪音信號進行參數化頻譜描述,N與FFT或DFT的變換長度無關。
然後,這些噪音形狀可以被歸一化(例如在階段316)及/或量化,例如可以被向量量化(例如在階段318),例如使用多階段向量量化器(MSVQ)(在[6, p 442]中描述了一個示例)。
在階段318處用於量化v
m形狀(以獲得v
m,ind、401)的MSVQ可以具有6個階段(但也可能是其他數量的階段)及/或使用37位元(但也可能是其他數量的位元),如[6]中為單聲道實現者,而在階段318用於量化v
s形狀(以獲得v
s,ind403)的MSVQ可能已減少到4個階段(或在任何情況下,階段數量少於在階段318中所使用的階段數量),及/或總共使用25個位元(或在任何情況下,位元數量少於在階段318中所使用的用於編碼形狀v
m的位元數量)。
MSVQ的編碼書索引可以在位元流中傳輸(例如在資料232中,更具體地在柔和噪音參數資料401、403中),然後對索引進行去量化,以產生去量化的噪音形狀v
m, q和v
m, q。
在背景噪音是立體影像中心的單一噪音源的情況下,兩個聲道的估計噪音形狀 v
m、v
s預計非常相似,甚至相等,然後產生的S聲道噪音形狀將只包含零。然而,用於對當前實現進行量化的向量量化器(階段322)可能無法對全零向量進行建模,並且在去量化之後,去量化後的v
s噪音形狀(v
s,q)可能不再是全零,這可能會導致表示這種中心背景噪音的感知問題。為了規避向量量化器322的這個缺點,可以根據未量化v
s形狀向量的能量(例如在階段314之後及/或在階段316之前的v
s噪音形狀向量的能量)計算(並且也可以信令在位元流中)無側值(無側旗標),其中,無側旗標可能是:
舉例來說,能量閾值α可以是0.1或區間[0.05, 0.15]中的另一個值。然而,閾值α可以是任意的,並且在實現中可以取決於所使用的數字格式(例如,定點或浮點)及/或可能使用的信號歸一化。在示例中,可以使用正實數值,這取決於所採用的“靜音”S 聲道所採用之定義的嚴酷程度。因此,此區間可能是(0, 1)。無側值可用於指示是否應使用v
s噪音形狀來重建v
l和v
r聲道噪音形狀(例如在解碼器處),如果無側值為1,則去量化的v
s形狀設置為0(例如,通過將聲道v
s,q縮放為圖2中的436'值,這是一個邏輯值NOT(無側值))。無側值在位元流232中傳輸(信令),例如在輔助資訊402中傳輸。隨後,可以將逆M/S變換(例如階段324)應用於去量化的噪音形狀向量v
m, q和v
s, q(當能量為低時,後者被例如替換為0,因此在圖2中用437'表示),得到中間向量v'
l和v'
r如下:
使用這些中間向量v'
l和v'
r以及去量化的噪音形狀向量v
l和v
r,計算出兩個增益值如下:
然後可以將兩個增益值線性量化(例如在階段328)如下
(其他量化也是可能的)。
量化增益可以編碼在SID位元流中(例如作為柔和噪音參數資料401或403的一部分,更具體地,
可以是第一參數噪音資料的一部分,並且
可以是第二參數噪音資料的一部分),例如對增益值
使用七位元,及/或對增益值
使用七位元(對每個增益值也可以使用不同數量的位元)。
在解碼器(例如200'、200a、200b)中,量化的噪音形狀向量(例如,柔和噪音參數資料401或403的一部分,並且更具體地是第一參數噪音資料和第二參數噪音資料的一部分)可以例如是在階段212’去量化(特別地,在子階段212-M、212-S中的任何一個)。
增益值可以例如在階段212’被去量化(特別地,在子階段212-L、212-R中的任何一個)如下
(值45取決於量化,並且可能因不同的量化而不同),(在圖2中,使用g
l,d和g
r,d代替g
l,deq和g
r,deq)。
相關值404可以被去量化(例如在階段212-C)如下
如果無側旗標(在輔助資訊402中)為1,則在計算中間向量v’
l和v’
r之前(例如,在階段516),將去量化的v
s形狀v
s, q設置為0(值537’),然後將相應的增益值與相應的中間向量的所有元件相加以生成去量化的噪音形狀v
l, q和v
r, q,其以複數表示522,如下
(加法是因為我們在對數域中並且對應於與線性域中的因子的乘積。)
對於柔和噪音生成,如圖3a-3f中的任何一個所示(或可以使用任何其他技術),可以使用三個高斯噪音源
(例如,圖3a所示的211a、212a、213a,圖3b所示的211b、212b、212c等),當聲道相關性高時,主要向兩個聲道添加相關噪音,而如果相關性低,則添加更多不相關噪音。
使用三個噪音源時,左及右聲道噪音信號N
l(201)和N
r(203)的DFT頻譜可以計算如下
其中,
而且
,在此,M表示DFT的方塊長度。為了在複頻譜的實部和虛部生成獨立的噪音,每個噪音源必須在每幀生成2×M個值(一個頻率柱有兩個值)。因此,N
1、N
2和N
3(分別位於圖3f 中的211、212、213)可以看作是長度為2×M的實數值噪音向量,而N
r和N
k(分別位於201、203)是長度為M的複數值向量。
之後,兩個聲道中的噪音信號可以使用從位元流232解碼的其對應的噪音形狀(v
l, q或v
r, q)進行頻譜整形(例如在信號修改器252處),並隨後從對數域變換回標量域,並從頻域回到時域,如[6]中所述,以便生成立體聲柔和噪音信號。
本處理的任何示例可以由合適的控制器執行。
部分優點
本發明可以提供一種特別適用於離散立體聲編碼方案的立體聲柔和噪音生成技術,通過聯合編碼和傳輸兩個聲道的噪音形狀參數,可以應用立體聲CNG而無需單聲道降混。
與兩組獨立的噪音參數一起,由單一相關值控制的一個共同噪音源和兩個獨立噪音源的混合允許忠實地重建背景噪音的立體聲影像,而無需傳輸通常僅存在於參數音頻編碼器中的細粒度立體聲參數。由於只使用了這一個參數,SID的編碼是直接的,不需要複雜的壓縮方法,同時仍然保持SID幀在較低的大小。
部分重要態樣:
在一些示例中,可獲得以下態樣中的至少一個:
1. 通過混合三個高斯噪音源(每個聲道一個)和第三個共同噪音源來為立體聲信號生成柔和噪音,以創建相關的背景噪音。
2. 控制噪音源與隨SID幀傳輸的相關值的混合。
3. 通過以M/S方式聯合編碼噪音形狀,為兩個立體聲聲道傳輸獨立的噪音形狀參數,通過使用比M少的位元編碼S形狀來降低SID幀位元率。
其他技術
還可以實現一種產生具有第一聲道與第二聲道的多聲道信號的方法,包括:
利用一第一音頻源產生一第一音頻信號;
利用一第二音頻源產生一第二音頻信號;
利用一混合噪音源產生一混合噪音信號;以及
混合該混合噪音信號與第一音頻信號以獲得第一聲道,以及混合該混合噪音信號與第二音頻信號以獲得第二聲道。
還可以實現一種音頻編碼方法,用於為包括一活動幀與一非活動幀的一幀序列生成一編碼的多聲道音頻信號,該方法包括:
分析一多聲道信號以判斷該幀序列中的一個幀為一非活動幀;
為該多聲道信號的一第一聲道計算一第一參數噪音資料,並為該多聲道信號的一第二聲道計算一第二參數噪音資料;
計算指示在該非活動幀中的第一聲道與第二聲道之間的一相關情況的一相關性資料;以及
生成該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的第一參數噪音資料、第二參數噪音資料、及相關性資料。
本發明還可以在儲存指令的非暫時性儲存單元中實現,當這些指令被一電腦(或處理器、或控制器)執行時,使該電腦(或處理器、或控制器)執行上述方法。
本發明還可以在以幀序列組織的多聲道音頻信號中實現,該幀序列包括活動幀和非活動幀,編碼的多聲道音頻信號包括:
活動幀的編碼音頻資料;
非活動幀中的一第一聲道的一第一參數噪音資料;
非活動幀中的一第二聲道的一第二參數噪音資料;以及
指示非活動幀中的第一聲道與第二聲道之間的相關情況的相關性資料,多聲道音頻信號可以用以上及/或以下所揭露的技術其中之一來獲得。
實施例的優點
為兩個聲道插入一個共同噪音源以模擬相關噪音來產生最終的柔和噪音對於模擬立體聲背景噪音記錄具有重要作用。
本發明的實施例也可以被認為是通過混合三個高斯噪音源(每個聲道一個)和第三個共同噪音源,來為立體聲信號生成柔和噪音,以創建相關的背景噪音的過程,或者附加地或單獨地控制依據和SID幀一起傳輸的相關值來混合噪音源,或者附加地或單獨地,如下所示:在立體聲系統中,單獨生成背景噪音會導致完全不相關的噪音,這聽起來會令人不快,並且與實際背景非常不同,當我們切換到活動模式背景或從活動模式背景切換到DTX模式背景時,會導致突然的音頻轉換。在一實施例中,在編碼器側,除了噪音參數之外,兩個聲道的相關性被計算、均勻量化並添加到SID幀。在解碼器中,接著利用傳輸的相關值來控制CNG操作。使用三個高斯噪音源N_1、N_2、N_3;當聲道相關性高時,主要將相關噪音添加到兩個聲道,而當相關性低時 ,則添加更多不相關噪音。
這裡要提到的是,之前討論的所有替代方案或態樣以及由以下申請專利範圍中的獨立請求項定義的所有態樣都可以單獨使用,亦即,除了預期的替代方案、標的或獨立請求項外,沒有任何其他替代方案或標的。然而,在其他實施例中,兩個或更多個替代方案或態樣或獨立請求項可以彼此組合,並且在其他實施態樣中,所有態樣或替代方案和所有獨立請求項可以彼此組合。
本發明之編碼信號可以儲存在數位儲存媒體或非暫時性儲存媒體上,或者可以在諸如無線或有線傳輸媒體(如網際網路)之類的傳輸媒體上傳輸。
儘管已經在設備的說明中描述了一些態樣,但很明顯地,這些態樣也代表了相應方法的描述,其中方塊或裝置對應於方法步驟或方法步驟的特徵。類似地,在方法步驟的說明中描述的態樣也表示相應設備的相應方塊或項目或特徵的描述。
根據某些實施要求,本發明的實施例可以利用硬體或軟體來實現,該實現可以使用數位儲存媒體來執行,例如軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或FLASH記憶體,其具有儲存在其上的電子可讀控制信號,其協作或能夠協作於可編程計算機系統,從而執行相應的方法。
根據本發明的一些實施例包括具有電子可讀控制信號的一資料載體,所述電子可讀控制信號能夠與可編程計算機系統協作,從而執行本說明書所述的方法其中之一。
通常,本發明的實施例可以實現為具有程式碼的電腦程式產品,當電腦程式產品在電腦上運行時,該程式碼可操作用於執行所述方法其中之一,程式碼可以例如儲存在機器可讀載體上。
其他實施例包括用於執行本說明書描述的方法之一的電腦程式,其儲存在機器可讀載體或非暫時性儲存媒體上。
換句話說,本發明之方法的一實施例因此是具有程式碼的電腦程式,其係當該電腦程式在電腦上運行時,用於執行所述的方法其中之一。
因此,本發明之方法的另一實施例是一資料載體(或數位儲存媒體、或電腦可讀媒體),其記錄有用於執行所述的方法其中之一的電腦程式。
因此,本發明之方法的另一實施例是一資料流或信號序列,其表示用於執行所述之方法其中之一的電腦程式,資料流或信號序列可以例如被配置為經由資料通訊連接(如經由網際網路)來傳輸。
另一個實施例包括一處理裝置,例如電腦或可編程邏輯裝置,其被配置為或適合於執行所述之方法其中之一。
另一實施例包括一電腦,其安裝有用於執行所述之方法其中之一的電腦程式。
在一些實施例中,可編程邏輯裝置(例如現場可編程邏輯閘陣列)可用於執行所述之方法的一些或全部功能。在一些實施例中,現場可編程邏輯閘陣列可與微處理器協作以執行所述之方法其中之一,一般而言,這些方法較佳地由任意硬體設備執行。
另一實施例提供一種多聲道信號產生器(200),用於產生具有一第一聲道(201)及一第二聲道(203)的一多聲道信號(204),包括:一第一音頻源(211),用於產生一第一音頻信號(221);一第二音頻源(213),用於產生一第二音頻信號(223);一混合噪音源(212),用於產生一混合噪音信號(222);以及一混合器(206),用於將該混合噪音信號(222)與該第一音頻信號(221)混合以獲得該第一聲道(201),以及將該混合噪音信號(222)與該第二音頻信號(223)混合以獲得該第二聲道(203)。
另一實施例提供一種多聲道信號產生器,其中該第一音頻源(211)係為一第一噪音源且該第一音頻信號(221)係為一第一噪音信號,及/或該第二音頻源(213)係為一第二噪音源且該第二音頻信號(223)係為一第二噪音信號,其中該第一噪音源(211)及/或該第二噪音源(213)係用以產生該第一噪音信號(221)及/或該第二噪音信號(223),因此該第一噪音信號(221)及/或該第二噪音信號(223)係與該混合噪音信號(222)去相關。
另一實施例提供一種多聲道信號產生器,其中該混合器(206)係用以產生該第一聲道(201)以及該第二聲道(203),俾使該混合噪音信號(222)在該第一聲道(201)中的量係等於該混合噪音信號(222)在該第二聲道(203)中的量,或是在該混合噪音信號(222)在該第二聲道(203)中的量的80%至120%的範圍內。
另一實施例提供一種多聲道信號產生器,其中該混合器(206)包括一控制輸入,用以接收一控制參數(404, c),其中該混合器(206)係用以依據該控制參數(404, c)控制該混合噪音信號(222)在該第一聲道(201)中及在該第二聲道(203)中的量。
另一實施例提供一種多聲道信號產生器,其中該第一音頻源(211)、該第二音頻源(213)及該混合音頻源(212)係分別為一高斯噪音源。
另一實施例提供一種多聲道信號產生器,其中該第一音頻源(211)包括一第一噪音產生器,用以產生該第一音頻信號(221)以作為一第一噪音信號,其中該第二音頻源(213)包括一去相關器,用以去相關該第一噪音信號(221)藉以產生該第二音頻信號(213)以作為一第二噪音信號,及其中該混合噪音源(212)包括一第二噪音產生器,或其中該第一音頻源(211)包括一第一噪音產生器(211),用以產生該第一音頻信號(221)以作為一第一噪音信號,其中該第二音頻源(213)包括一第二噪音產生器(213),用以產生該第二音頻信號(223)以作為一第二噪音信號,其中該混合噪音源(212)包括一去相關器,用以去相關該第一噪音信號(221)或該第二噪音信號(223)以產生該混合噪音信號(222),或其中該第一音頻源(211)、該第二音頻源(213)及該混合噪音源(212)其中之一包括一噪音產生器,用以產生一噪音信號,其中該第一音頻源(211)、該第二音頻源(213)及該混合噪音源(212)其中之另一包括一第一去相關器,用以去相關該噪音信號,其中該第一音頻源(211)、該第二音頻源(213)及該混合噪音源(212)其中之又一包括一第二去相關器,用以去相關該噪音信號,其中該第一去相關器係不同於該第二去相關器,因此該第一去相關器與該第二去相關器的輸出信號係彼此為去相關,或其中該第一音頻源(211)包括一第一噪音產生器,該第二音頻源(213)包括一第二噪音產生器,該混合噪音源(212)包括一第三噪音產生器,其中該第一噪音產生器、該第二噪音產生器及該第三噪音產生器係用以產生互相為去相關之噪音訊號。
另一實施例提供一種多聲道信號產生器,其中該第一音頻源(211)、該第二音頻源(213)及該混合噪音源(212)其中之一包括一偽亂數序列產生器,用以依據一種子生成一偽亂數序列,且其中該第一音頻源(211)、該第二音頻源(213)及該混合噪音源(212)其中的至少二係用以利用不同的種子初始化該偽亂數序列產生器。
另一實施例提供一種多聲道信號產生器,其中該第一音頻源(211)、該第二音頻源(212)及該混合噪音源(213)其中之一係用以利用一預儲存噪音表進行操作,或其中該第一音頻源(211)、該第二音頻源(213)及該混合噪音源(212)其中之一係用以針對一幀產生一複頻譜,其使用一第一噪音值作為一實部,並使用一第二噪音值作為一虛部,其中,可選地,至少一個噪音產生器被配置為產生用於一頻率柱k的一複噪音頻譜值,其使用一索引k處的一第一隨機值作為該實部及該虛部其中之一,並使用一索引(k+M)處的一第二隨機值作為該實部及該虛部其中之另一,其中該第一噪音值及該第二噪音值包括在一噪音陣列中,例如從一亂數序列產生器、一噪音表或一噪音程序導出,其範圍從一起始索引到一結束索引,該起始索引小於M,該結束索引等於或小於2M,其中M和k是整數。
另一實施例提供一種多聲道信號產生器,其中該混合器(206)包括:一第一振幅元件(208-1),用於影響該第一音頻信號(221)之振幅;一第一加法器(206-1),用於將該第一振幅元件的一輸出信號(221)和該混合噪音信號(222)的至少一部分相加;一第二振幅元件(208-3),用於影響該第二音頻信號(223)之振幅;一第二加法器(206-3),用於將該第二振幅元件(208-3)的一輸出(223)和該混合噪音信號(222)的至少一部分相加,其中該第一振幅元件(208-1)執行所得的一影響量與該第二振幅元件(208-3)執行所得的一影響量相等,或該第二振幅元件(208-3)執行所得的該影響量與該第一振幅元件(208-1)執行所得的該影響量的差異小於該第一振幅元件(208-1)執行所得的該影響量的20%。
另一實施例提供一種多聲道信號產生器,其中該混合器(206)包括一第三振幅元件(208-2),用於影響該混合噪音信號(222)之振幅,其中該第三振幅元件(208-2)執行所得的一影響量係依據該第一振幅元件(208-1)執行所得的該影響量或該第二振幅元件(208-3)執行所得的該影響量而定,因此當該第一振幅元件(208-1)執行所得的該影響量或該第二振幅元件(208-3)執行所得的該影響量降低時,該第三振幅元件(208-2)執行所得的該影響量增加。
另一實施例提供一種多聲道信號產生器,其中該第三振幅元件(208-2)執行所得的該影響量是一預設值(c
q)的平方根,該第一振幅元件(208-1)執行所得的該影響量及該第二振幅元件(208-3)執行所得的該影響量分別是1和該預設值(c
q)之一差值的平方根。
另一實施例提供一種多聲道信號產生器,更包括:一輸入介面(210),用以從一幀序列(306、308)中接收一編碼音頻資料(232),該幀序列包括一活動幀(306)及跟隨在該活動幀(306)之後的一非活動幀(308);以及一音頻解碼器(200’、200a、200b),用以解碼該活動幀(306)之該編碼音頻資料以產生該活動幀的一解碼多聲道信號,其中該第一音頻源(211)、該第二音頻源(213)、該混合噪音源(212)及該混合器(206)係在該非活動幀(308)中致動,以產生該非活動幀的該多聲道信號(204)。
另一實施例提供一種多聲道信號產生器,其中該活動幀(306)的該編碼音頻信號(232)具有描述一第一頻率柱數量的多個第一係數;以及該非活動幀(308)的該編碼音頻信號(232)具有描述一第二頻率柱數量的多個第二係數,其中該第一頻率柱數量大於該第二頻率柱數量。
另一實施例提供一種多聲道信號產生器,其中該非活動幀(308)的該編碼音頻資料(232)包括一靜音插入描述符資料(p_noise, c),其包括一柔和噪音資料(c, p_noise),其針對該二聲道(301、303)的每一個、或者對於該第一聲道和該第二聲道的一第一線性組合及該第一聲道和該第二聲道的一第二線性組合中的每一個,指示對於該非活動幀的一信號能量(1312),並且指示在該非活動幀中的該第一聲道(301)及該第二聲道(303)之間的一相關性(404, c),以及其中該混合器(206、220)係用以基於指示該相關性(404, c)之該柔和噪音資料,混合(206-1、206-3)該混合噪音信號(222)及該第一音頻信號(221)或該第二音頻信號(223),以及其中該多聲道信號產生器(200、220、220a-220e)更包括一信號修改器(250),用於修改該第一聲道(201)及該第二聲道(203)、該第一音頻信號(221)、該第二音頻信號(223)、或該混合噪音信號(222),其中該信號修改器(250)被配置為由該柔和噪音資料(p_noise)所控制,其指示該第一音頻聲道(301)及該第二音頻聲道(303)的信號能量、或指示該第一音頻聲道及該第二音頻聲道的一第一線性組合與該第一音頻聲道及該第二音頻聲道的一第二線性組合的信號能量。
另一實施例提供一種多聲道信號產生器,其中用於該非活動幀之該音頻資料(232)包括:用於該第一聲道(201)的一第一靜音插入描述符幀(241)及用於該第二聲道(203)的一第二靜音插入描述符幀(243),其中,該第一靜音插入描述符幀(241)包括用於該第一聲道(201)及/或該第一聲道與該第二聲道(203)的一第一線性組合的一柔和噪音參數資料(p_noise),及用於該第一聲道與該第二聲道(203)的一柔和噪音產生輔助資訊(p_frame),以及其中該第二靜音插入描述符幀(243)包括用於該第二聲道(203)及/或該第一聲道與該第二聲道的一第二線性組合的一柔和噪音參數資料(p_noise),及指示該非活動幀之該第一聲道(201)與該第二聲道(203)之間的一相關性的一相關性資訊(404, c),以及其中該多聲道信號產生器包括一控制器,用於使用該第一靜音插入描述符幀(241)的該柔和噪音產生輔助資訊(p_frame)來控制該非活動幀中的該多聲道信號(204)的生成,以決定用於該第一聲道(201)與該第二聲道(203)、及/或用於該第一聲道及該第二聲道的一第一線性組合以及該第一聲道及該第二聲道的一第二線性組合的一柔和噪音產生模式,使用該第二靜音插入描述符幀(243)中的該相關性資訊(404, c)來設定在該非活動幀中的該第一聲道和該第二聲道之間的一相關性(404, c),並使用來自該第一靜音插入描述符幀(241)之該柔和噪音參數資料(p_noise)及來自該第二靜音插入描述符幀(243)之該柔和噪音參數資料(p_noise)來設定該第一聲道(301)之一能量情況(v
l, q)與該第二聲道(303)之一能量情況(v
r, q)。
另一實施例提供一種多聲道信號產生器,其中用於該非活動幀之該音頻資料(232)包括:用於該第一聲道與該第二聲道的一第一線性組合及用於該第一聲道與該第二聲道的一第二線性組合的至少一靜音插入描述符幀(241),其中該至少一靜音插入描述符幀(241)包括用於該第一聲道與該第二聲道的該第一線性組合的一柔和噪音參數資料(p_noise),及用於該第一聲道與該第二聲道的該第二線性組合的一柔和噪音產生輔助資訊(p_frame),其中該多聲道信號產生器包括一控制器,用於使用該第一聲道及該第二聲道的該第一線性組合以及該第一聲道及該第二聲道的該第二線性組合的該柔和噪音產生輔助資訊(p_frame)來控制該非活動幀中的該多聲道信號(204)的生成,使用該第二靜音插入描述符幀(243)中的該相關性資訊(404, c)來設定在該非活動幀中的該第一聲道(201)和該第二聲道(204)之間的一相關性(404, c),並使用來自該至少一靜音插入描述符幀(241)之該柔和噪音參數資料(p_noise)來設定該第一聲道(301)之一能量情況(v
l, q),及使用來自該至少一靜音插入描述符幀(243)之該柔和噪音參數資料(p_noise)來設定該第二聲道(303)之一能量情況(v
r, q)。
另一實施例提供一種多聲道信號產生器,更包括一頻譜-時間轉換器,用於將經過頻譜調整和相關性調整的一調整後第一聲道和一調整後第二聲道轉換為相應的時域表示,以與該活動幀之該解碼的多聲道信號的相應聲道的時域表示組合或串聯。
另一實施例提供一種多聲道信號產生器,其中用於該非活動幀之該音頻資料包括:一靜音插入描述符幀(241、243),其中該靜音插入描述符幀(241、243)包括用於該第一聲道(201)及該第二聲道(203)的一柔和噪音參數資料(p_noise)以及用於該第一聲道(201)與該第二聲道(203),及/或用於該第一聲道與該第二聲道的一第一線性組合與用於該第一聲道與該第二聲道的一第二線性組合的一柔和噪音產生輔助資訊(p-frame),以及指示該非活動幀之該第一聲道與該第二聲道之間的一相關性的一相關性資訊(404, c),以及其中該多聲道信號產生器(200)包括一控制器,用於使用該靜音插入描述符幀(241、243)的該柔和噪音產生輔助資訊(p_frame)來控制該非活動幀中的該多聲道信號(202)的生成,以決定用於該第一聲道(201)與該第二聲道(203)的一柔和噪音產生模式,使用該靜音插入描述符幀(241)中的該相關性資訊(404, c)來設定在該非活動幀中的該第一聲道(201)和該第二聲道(203)之間的一相關性(404, c),並使用來自該靜音插入描述符幀(241、243)之該柔和噪音參數資料(p_noise)來設定該第一聲道(301)之一能量情況(v
l, q)與該第二聲道(303)之一能量情況(v
r, q)。
另一實施例提供一種多聲道信號產生器,其中該非活動幀的該編碼音頻資料(232)包括一靜音插入描述符資料(p_noise),該靜音插入描述符資料(p_noise)包括指示在中/側表示之各聲道的一信號能量的一柔和噪音資料(c, p_noise)、以及指示在左/右表示之該第一聲道與該第二聲道之間的一相關性的一相關性資料(404, c),其中該多聲道信號產生器被配置為將該第一聲道(301)與該第二聲道(303)中,該中/側表示之該信號能量轉換為該左/右表示之該信號能量,其中該混合器(206、220)被配置為基於該相關性資料(404, c)將該混合噪音信號(222)混合(206-1、206-3)到該第一音頻信號(221)與該第二音頻信號(223)中,以便獲得該第一聲道(201)及該第二聲道(203),以及其中該多聲道信號產生器更包括一信號修改器(250),其被配置用於通過基於該左/右領域中的該信號能量對該第一聲道(201)及該第二聲道(203)進行整形,以修改該第一聲道(201)及該第二聲道(203)。
另一實施例提供一種多聲道信號產生器,用於在該音頻資料包含指示該側聲道中的該能量小於一預定閾值的信令的情況下,將側聲道(v
s, q)的係數歸零(337)。
另一實施例提供一種多聲道信號產生器,其中該非活動幀的該音頻資料包括:至少一靜音插入描述符幀(241、243),其中該至少一靜音插入描述符幀(241、243)包括用於該中聲道(v
m, q)及該側聲道(v
s, q)之一柔和噪音參述資料(p_noise, v
m, ind, q
l,q, q
r,q, v
s, ind)以及用於該中聲道(v
m, q)及該側聲道(v
s, q)之一柔和噪音產生輔助資訊(p_frame),以及指示該非活動幀之該第一聲道(201)與該第二聲道(203)之間的一相關性的一相關性資訊(404, c),以及其中該多聲道信號產生器(200)包括一控制器,用於使用該靜音插入描述符幀(241、243)的該柔和噪音產生輔助資訊(p_frane)來控制該非活動幀中的該多聲道信號(202)的生成,以決定用於該第一聲道(201)與該第二聲道(203)的一柔和噪音產生模式,使用該靜音插入描述符幀(241)中的該相關性資訊(404, c)來設定在該非活動幀中的該第一聲道(201)和該第二聲道(203)之間的一相關性(404, c),並使用來自該靜音插入描述符幀(241、243)之該柔和噪音參數資料(p_noise)或其處理版本來設定該第一聲道(301)之一能量情況(v
l, q)與該第二聲道(303)之一能量情況(v
r, q)。
另一實施例提供一種多聲道信號產生器,其更用以通過一增益資訊(g
l,q, q
r,q)縮放該第一聲道與該第二聲道的信號能量係數(1312, v’
l, v’
r),其係編碼於該第一聲道與該第二聲道的該柔和噪音參數資料(401、403)。
另一實施例提供一種多聲道信號產生器,其更用以將生成的該多聲道信號(252)從一頻域版本轉換為一時域版本。
另一實施例提供一種多聲道信號產生器,其中該第一音頻源(211)為一第一噪音源且該第一音頻信號(221)為一第一噪音信號,或者該第二音頻源(213)為一第二噪音源且該第二音頻信號(223)為一第二噪音信號,其中該第一噪音源或該第二噪音源被配置為產生該第一噪音信號(201)或該第二噪音信號(203),使得該第一噪音信號(201)或該第二噪音信號(203)至少部分相關,其中該混合噪音源(212)被配置為產生具有一第一混合噪音部分(221a)與一第二混合噪音部分(221b)的該混合噪音信號(222),該第二混合噪音部分(221b)至少部分地與該第一混合噪音部分(221a)去相關;以及其中該混合器(206)被配置為將該混合噪音信號(222)的該第一混合噪音部分(221a)與該第一音頻信號(221)混合以獲得該第一聲道(201),並且將該混合噪音信號(222)的該第二混合噪音部分(221b)與該第二音頻信號(223)混合以獲得該第二聲道(203)。
另一實施例提供一種多聲道信號產生方法,用於產生具有一第一聲道及一第二聲道(203)的一多聲道信號,包括:利用一第一音頻源(211)產生一第一音頻信號(221);利用一第二音頻源(213)產生一第二音頻信號(223);利用一混合噪音源(212)產生一混合噪音信號(222);以及混合(206)該混合噪音信號(222)與該第一音頻信號(221)以獲得該第一聲道(201),以及混合該混合噪音信號(222)與該第二音頻信號(223)以獲得該第二聲道(203)。
另一實施例提供一種音頻編碼器(300、300a、300b),用於為包括一活動幀(306)及一非活動幀(308)的幀序列生成一編碼的多聲道音頻信號(232),該音頻編碼器包括:一活動檢測器(380),用於分析一多聲道信號(304)以判斷(381)該幀序列中的一個幀是一非活動幀(308);一噪音參數計算器(3040),用於計算該多聲道信號(304)的一第一聲道(301、201)的一第一參數噪音資料(p_noise, v
m, ind),並用於計算該多聲道信號(304)的一第二聲道(303)的一第二參數噪音資料(p_noise, v
s, ind);一相關性計算器(320),用於計算指示在非活動幀(308)中的該第一聲道(301、201)與該第二聲道(303、203)之間的一相關情況的一相關性資料(404, c);以及一輸出介面(310),用於產生該編碼的多聲道音頻信號(232),其具有該活動幀(306)的一編碼音頻資料,以及該非活動幀(308)的該第一參數噪音資料(p_noise, v
m, ind)、該第二參數噪音資料(p_noise, v
s, ind)、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料(404, c)。
另一實施例提供一種音頻編碼器,其中該相關性計算器(320)被配置為計算(320’)一相關值(404, c),並對該相關值進行量化(320”)以獲得一量化的相關值(c
ind),其中該輸出介面(310)被配置為使用該量化的相關值(c
ind)作為該編碼的多聲道信號中的該相關性資料。
另一實施例提供一種音頻編碼器,其中該相關性計算器(320)被配置為:從該非活動幀的該第一聲道(301)與該第二聲道(303)的複頻譜值中計算一實中間值與一虛中間值;計算該非活動幀的該第一聲道(301)的一第一能量值和該第二聲道(303)的一第二能量值;以及使用該實中間值、該虛中間值、該第一能量值及該第二能量值計算該相關性資料(404, c),或平滑該實中間值、該虛中間值、該第一能量值及該第二能量值其中的至少一,並使用至少一個平滑值計算該相關性資料。
另一實施例提供一種音頻編碼器,其中該相關性計算器(320)被配置為計算該實中間值,其係為該非活動幀之該第一聲道與該第二聲道(303)的對應頻率柱的複頻譜值的乘積的實部之和,或計算該虛中間值,其係為該非活動幀之該第一聲道與該第二聲道(303)的該對應頻率柱的該複頻譜值的該乘積的虛部之和。
另一實施例提供一種音頻編碼器,其中該相關性計算器(320)被配置為對平滑的一實中間值求平方以及對平滑的一虛中間值求平方,並將該等平方值相加以獲得一第一分量數,其中該相關性計算器(320)被配置為將平滑後的該第一能量值與該第二能量值相乘以獲得一第二分量數,並且將該第一分量數與該第二分量數結合以獲得該相關值的一結果數,該相關性資料係基於該結果數。
另一實施例提供一種音頻編碼器,其中該相關性計算器被配置為計算該結果數的平方根,以得到一相關值,該相關性資料係基於該相關值。
另一實施例提供一種音頻編碼器,其中該相關性計算器(320)被配置為使用一均勻量化器(320”)對該相關值(404, c)進行量化,以得到量化的該相關值(c
ind),其係為一個n位元數以作為該相關性資料。
另一實施例提供一種音頻編碼器,其中該輸出介面(310)被配置為生成該第一聲道(301、L)的一第一靜音插入描述符幀(241)和該第二聲道(303、R)的一第二靜音插入描述符幀(243),其中該第一靜音插入描述符幀(241)包括該第一聲道(301、L)的一柔和噪音參數資料(p_noise)以及該第一聲道(301、L)與該第二聲道(303、R)的一柔和噪音產生輔助資訊(p_frame),並且其中該第二靜音插入描述符幀(243)包括該第二聲道(303)的一柔和噪音參數資料(p_noise)以及指示在該非活動幀中的該第一聲道與該第二聲道(303)之間的一相關性的一相關性資訊(404, c),或其中該輸出介面(310)被配置為生成一靜音插入描述符幀(241、243),其中該靜音插入描述符幀包括該第一聲道(301)與該第二聲道(303)的一柔和噪音參數資料(p_noise)以及該第一聲道(301、L)與該第二聲道(303、R)的一柔和噪音產生輔助資訊(p_frame),以及指示在該非活動幀中的該第一聲道(301、L)與該第二聲道(303、R)之間的一相關性的一相關性資訊(404, c),或其中該輸出介面(310)被配置為生成該第一聲道(301、L)與該第二聲道(303、R)的一第一靜音插入描述符幀(241),以及該第一聲道與該第二聲道(303、R)的一第二靜音插入描述符幀(243),其中該第一靜音插入描述符幀(241)包括該第一聲道與該第二聲道的一柔和噪音參數資料(p_noise)以及該第一聲道(301、L)與該第二聲道(303、R)的一柔和噪音產生輔助資訊(p_frame),該第二靜音插入描述符幀(243)包括該第一聲道與該第二聲道(303)的一柔和噪音參數資料(p_noise),以及指示在該非活動幀中的該第一聲道與該第二聲道(303)之間的一相關性的一相關性資訊(404, c)。
另一實施例提供一種音頻編碼器,其中該均勻量化器(320”)被配置為計算一n位元數,使得n的值等於該第一靜音插入描述符幀(241)的該柔和噪音產生輔助資訊(p_frame)所佔用的一位元值。
另一實施例提供一種音頻編碼器(300),其中該活動檢測器(380)被配置為,對該幀序列中的至少一幀,分析(370-1)該多聲道信號(304)的該第一聲道(301、L)以將該第一聲道(301、L)分類為活動或非活動,及分析(370-2)該多聲道信號(304)的該第二聲道(303、R)以將該第二聲道(303、R)分類為活動或非活動,以及如果該第一聲道(301、L)及該第二聲道(303、R)皆被分類為非活動,則判斷(381)該幀為非活動,否則判斷其為活動。
另一實施例提供一種音頻編碼器(300),其中該噪音參數計算器(3040)被配置為計算該第一聲道(301)的一第一增益資訊(g
l)以及該第二聲道(303)的一第二增益資訊(g
s),並提供該參數噪音資料作為該第一聲道(301)的該第一增益資訊(g
l)以及該第二增益資訊(g
s)。
另一實施例提供一種音頻編碼器(300),其中該噪音參數計算器(3040)被配置為將該第一參數噪音資料與該第二參數噪音資料中的至少一些從一左/右表示轉換為具有一中聲道及一側聲道的一中/側表示。
另一實施例提供一種音頻編碼器,其中該噪音參數計算器(3040)被配置為將該第一參數噪音資料與該第二參數噪音資料中的至少一些的該中/側表示(M、S)重新轉換為一左/右表示,其中該噪音參數計算器(3040)被配置為根據重新轉換的該左/右表示計算該第一聲道(301)的一第一增益資訊(g
l)與該第二聲道(303)的一第二增益資訊(g
r),以及提供包括在該第一參量噪音資料中的該第一聲道(301)的該第一增益資訊(g
l),以及包括在該第二參量噪音資料中的該第二增益資訊(g
r)。
另一實施例提供一種音頻編碼器(300),其中該噪音參數計算器(3040)被配置為計算:該第一增益資訊(g
l),其通過比較:該第一聲道(301)的該第一參數噪音資料從該中/側表示重新轉換為該左/右表示的一版本(v’
l);與該第一聲道(301)的該第一參數噪音資料從該中/側表示轉換為該左/右表示之前的一版本(v
l);及/或該第二增益資訊(g
r),其通過比較:該第二聲道(303)的該第二參數噪音資料從該中/側表示重新轉換為該左/右表示的一版本(v’
r);與該第二聲道(303)的該第二參數噪音資料從該中/側表示轉換為該左/右表示之前的一版本(v
r)。
另一實施例提供一種音頻編碼器,其中該噪音參數計算器(3040)被配置為比較該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的一能量與一預定能量閾值(α),並且:
當該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的該能量大於該預定能量閾值(α)時,將側聲道噪音形狀向量的係數歸零(437);以及當該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的該能量小於該預定能量閾值(α),保持該側聲道噪音形狀向量的係數。
另一實施例提供一種音頻編碼器,其被配置為使用比編碼該第一參數噪音資料及該第二參數噪音資料之間的該第一線性組合的一位元量少的一位元量對該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合進行編碼。
另一實施例提供一種音頻編碼器,其中該輸出介面(310)被配置為:使用用於一第一頻率柱數量的多個第一係數來生成具有該活動幀(306)的一編碼音頻資料的一編碼的多聲道音頻信號(232);以及使用用於描述一第二頻率柱數量的多個第二係數來生成該第一參數噪音資料、該第二參數噪音資料、或該第一參數噪音資料與該第二參數噪音資料的該第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的該第二線性組合,
其中,該第一頻率柱數量大於該第二頻率柱數量。
另一實施例提供一種音頻編碼方法,用於為包括一活動幀與一非活動幀的一幀序列生成一編碼的多聲道音頻信號,該方法包括:分析一多聲道信號以判斷該幀序列中的一個幀為一非活動幀;為該多聲道信號的一第一聲道、及/或該多聲道信號的該第一聲道與一第二聲道的一第一線性組合計算一第一參數噪音資料,並為該多聲道信號的該第二聲道(303)、及/或該多聲道信號的該第一聲道與該第二聲道的一第二線性組合計算一第二參數噪音資料;計算指示在該非活動幀中的該第一聲道與該第二聲道(303)之間的一相關情況的一相關性資料;以及生成該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及該相關性資料。
另一實施例提供一種電腦程式,其係在運行於一電腦或一處理器時,執行上述方法。
另一實施例提供一種編碼的多聲道音頻信號,其係組織於一幀序列中,該幀序列包括一活動幀與一非活動幀,該編碼的多聲道音頻信號包括:該活動幀的一編碼的音頻資料;在該非活動幀中的一第一聲道的一第一參數噪音資料;在該非活動幀中的一第二聲道(303)的一第二參數噪音資料;以及指示在該非活動幀中的該第一聲道與該第二聲道(303)之間的一相關情況的一相關性資料。
上述實施例僅用於說明本發明的原理。應當理解,對本領域技術人員而言,本說明書所描述的修改與變化的配置與細節是顯而易見的,因此,本發明之範圍係在後敘的申請專利範圍中,而非用僅限於所述實施例的描述與說明所呈現的具體細節。
在一些實施例中,可編程邏輯裝置(例如現場可編程邏輯閘陣列)可用於執行所述之方法的一些或全部功能。在一些實施例中,現場可編程邏輯閘陣列可與微處理器協作以執行所述之方法其中之一,一般而言,這些方法較佳地由任意硬體設備執行。
上述實施例僅用於說明本發明的原理。應當理解,對本領域技術人員而言,本說明書所描述的修改與變化的配置與細節是顯而易見的,因此,本發明之範圍係在後敘的申請專利範圍中,而非用僅限於所述實施例的描述與說明所呈現的具體細節。
參考書目或參考文獻
[1] | ITU-T G.729 Annex B A silence compression scheme for G.729 optimized for terminals conforming to ITU-T Recommendation V.70. International Telecommunication Union (ITU) Series G,2007. |
[2] | ITU-T G.729.1 Annex C DTX/CNG scheme. International Telecommunication Union (ITU) Series G,2008. |
[3] | ITU-T G.718 Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s. International Telecommunication Union (ITU) Series G,2008. |
[4] | Mandatory Speech Codec speech processing functions; Adaptive Multi-Rate (AMR) speech codec; Transcoding functions,3GPP Technical Specification TS 26.090, 2014. |
[5] | Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions,3GPP, 2014. |
[6] | 3GPP TS 26.445, Codec for Enhanced Voice Services (EVS); Detailed algorithmic description. |
[7] | Z. Wang and e. al, "Linear prediction based comfort noise generation in the EVS codec," in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brisbane, QLD, 2015. |
[8] | A. Lombard, S. Wilde, E. Ravelli, S. Döhla, G. Fuchs and M. Dietz, "Frequency-domain Comfort Noise Generation for Discontinuous Transmission in EVS," in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brisbane, QLD, 2015. |
[9] | A. Lombard, M. Dietz, S. Wilde, E. Ravelli, P. Setiawan and M. Multrus, "Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals". United States of America Patent 9583114B2, 19 June 2015. |
[10] | E. NORVELL and F. JANSSON, "SUPPORT FOR GENERATION OF COMFORT NOISE. AND GENERATION OF COMFORT NOISE". WO Patent WO 2019/193149 A1, 5 April 2019. |
200:多聲道信號產生器、解碼器
200a,200b,200':解碼器
201:第一聲道、輸出聲道
203:第二聲道、輸出聲道、噪音
204:多聲道信號、柔和噪音
206:混合器
206-1:加法器階段
206-3:加法器階段
208:混合器
208-1:振幅元件
208-2:振幅元件
208-3:振幅元件
210:輸入介面
211,211a,211b,211c,211d,211e:第一噪音產生器、第一音頻源、音頻源、噪音源
212,212a,212b,212c,212d,212e:第三噪音產生器、混合噪音源、音頻源、噪音源
212:去量化階段
2120:階段
212-C:階段
212-M,212-S,212-L,212-R: 階段、子階段
213,213a,213b,213c,213d,213e:第二噪音產生器、第二噪音源、音頻源、噪音源
220,220a,220b,220c,220d,220e:柔和噪音產生器(CNG)
221:第一噪音信號、第一音頻信號、音頻信號
221a,221b:部分、版本
221':加權版本
222:共同信號、混合噪音信號
222':加權版本
223:第二噪音信號、第二音頻信號
223':加權版本
232:多聲道音頻信號、位元流、編碼音頻資料、資料
241:靜音插入描述(SID)幀、第一靜音插入描述符幀
243:靜音插入描述(SID)幀、第二靜音插入描述符幀
250:信號修改器、信號修改器方塊
250-L,250-R:階段
252:噪音、輸出信號、信號、多聲道音頻信號
300,300a,300b:編碼器
301,L:第一音頻聲道、第一聲道、聲道、左聲道
302:輸入信號
303,R:第二音頻聲道、第二聲道、聲道、右聲道
304:信號、輸入信號
1304:信號
3040:噪音參數計算器、噪音參數計算器部分
304-1:第一噪音參數計算器階段
304-3:第二噪音參數計算器階段
306:活動幀
306a:離散立體聲程序
306b:立體聲不連續傳輸程序
308:非活動幀
310:輸出介面
312:獲得噪音形狀方塊、階段
1312:低解析度參數表示、噪音形狀、估計噪音參數
2312:估計噪音參數
314:L/R到M/S轉換器階段、階段
316:歸一化階段、階段、方塊
318:量化階段、階段
320:相關性計算器
320':計算聲道相關性階段、計算聲道相關性方塊
320”:統一量化器階段
322:去量化階段、向量量化器、階段
324:M/S到L/R轉換器
326:階段
328:量化階段、階段
360:預處理階段
370:頻譜分析步驟階段、頻譜分析階段、階段
370-1:第一頻譜分析、頻譜分析階段
370-3:第二階段、頻譜分析階段
380:活動檢測器、活動檢測階段、階段
380-1:第一活動檢測階段、階段
380-3:第二活動檢測階段、階段
381:判斷、階段
381':開關
401:參數噪音資料、第一參數資料、柔和噪音參數資料、參數、估計噪音參數
402:柔和噪音產生輔助資訊、輔助資訊
403:參數噪音資料、第二參數噪音資料、第二柔和噪音參數、參數、側索引、噪音參數、柔和噪音參數資料
404,c:相關性資訊
N
l[k]:噪音信號
435:比較方塊、方塊
436:方塊
436’:無側旗標、輸出、值
437:方塊
437':輸出
516:M/S到L/R階段、階段
518:增益階段
518-L:階段、階段方塊
518-R:階段、階段方塊
536:方塊
536’:旗標
537:縮放器方塊
537':輸出、值
M,L:第一聲道
S,R:第二聲道
圖1顯示一編碼器的示例,特別是將一幀分類為活動的或非活動的。
圖2顯示一編碼器及一解碼器的示例。
圖3a至3f顯示可以在解碼器中使用的多聲道信號發生器的示例。
圖4顯示一編碼器及一解碼器的示例。
圖5顯示一個噪音參數量化階段的示例。
圖6顯示一個噪音參數去量化階段的示例。
241:靜音插入描述(SID)幀、第一靜音插入描述符幀
243:靜音插入描述(SID)幀、第二靜音插入描述符幀
300,300a,300b:編碼器
301,L:第一音頻聲道、第一聲道、聲道、左聲道
303,R:第二音頻聲道、第二聲道、聲道、右聲道
304:信號、輸入信號
306:活動幀
306a:離散立體聲程序
306b:立體聲不連續傳輸程序
308:非活動幀
360:預處理階段
370:頻譜分析步驟階段、頻譜分析階段、階段
370-1:第一頻譜分析、頻譜分析階段
370-3:第二階段、頻譜分析階段
380:活動檢測器、活動檢測階段、階段
380-1:第一活動檢測階段、階段
380-3:第二活動檢測階段、階段
381:判斷、階段
381':開關
402:柔和噪音產生輔助資訊、輔助資訊
Claims (19)
- 一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料;其中該相關性計算器被配置為:從該非活動幀的該第一聲道與該第二聲道的複頻譜值中計算一實中間值與一虛中間值;計算該非活動幀的該第一聲道的一第一能量值和該第二聲道的一第二能量值;以及使用該實中間值、該虛中間值、該第一能量值及該第二能量值計算該相關性資料,或平滑該實中間值、該虛中間值、該第一能量值及該第二能量值其中的至少一,並使用至少一個平滑值計算該相關性資料。
- 如請求項1所述之音頻編碼器,其中該相關性計算器被配置為計算一相關值,並對該相關值進行量化以獲得一量化的相關值,其中該輸出介面被配置為使用該量化的相關值作為該編碼的多聲道信號中的該相關性資料。
- 如請求項1所述之音頻編碼器, 其中,該相關性計算器被配置為計算該實中間值,其係為該非活動幀之該第一聲道與該第二聲道的對應頻率柱的複頻譜值的乘積的實部之和,或計算該虛中間值,其係為該非活動幀之該第一聲道與該第二聲道的該對應頻率柱的該複頻譜值的該乘積的虛部之和。
- 如請求項1所述之音頻編碼器,其中,該相關性計算器被配置為對平滑的一實中間值求平方以及對平滑的一虛中間值求平方,並將該等平方值相加以獲得一第一分量數,其中,該相關性計算器被配置為將平滑後的該第一能量值與該第二能量值相乘以獲得一第二分量數,並且將該第一分量數與該第二分量數結合以獲得該相關值的一結果數,該相關性資料係基於該結果數。
- 如請求項4所述之音頻編碼器,其中該相關性計算器被配置為計算該結果數的平方根,以得到一相關值,該相關性資料係基於該相關值。
- 如請求項2所述之音頻編碼器,其中該相關性計算器被配置為使用一均勻量化器對該相關值進行量化,以得到量化的該相關值,其係為一個n位元數以作為該相關性資料。
- 如請求項6所述之音頻編碼器,其中該均勻量化器被配置為計算一n位元數,使得n的值等於該第一靜音插入描述符幀的該柔和噪音產生輔助資訊所佔用的一位元值。
- 一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、 及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料;其中該輸出介面被配置為生成該第一聲道的一第一靜音插入描述符幀和該第二聲道的一第二靜音插入描述符幀,其中該第一靜音插入描述符幀包括該第一聲道的一柔和噪音參數資料以及該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,並且其中該第二靜音插入描述符幀包括該第二聲道的一柔和噪音參數資料以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關性的一相關性資訊,或其中,該輸出介面被配置為生成一靜音插入描述符幀,其中該靜音插入描述符幀包括該第一聲道與該第二聲道的一柔和噪音參數資料以及該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關性的一相關性資訊,或其中,該輸出介面被配置為生成該第一聲道與該第二聲道的一第一靜音插入描述符幀,以及該第一聲道與該第二聲道的一第二靜音插入描述符幀,其中該第一靜音插入描述符幀包括該第一聲道與該第二聲道的一柔和噪音參數資料以及該第一聲道與該第二聲道的一柔和噪音產生輔助資訊,該第二靜音插入描述符幀包括該第一聲道與該第二聲道的一柔和噪音參數資料,以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關性的一相關性資訊。
- 一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及 一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料;其中該活動檢測器被配置為,對該幀序列中的至少一幀,分析該多聲道信號的該第一聲道以將該第一聲道分類為活動或非活動,及分析該多聲道信號的該第二聲道以將該第二聲道分類為活動或非活動,以及如果該第一聲道及該第二聲道皆被分類為非活動,則判斷該幀為非活動,否則判斷其為活動。
- 一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料;其中該噪音參數計算器被配置為計算該第一聲道的一第一增益資訊以及該第二聲道的一第二增益資訊,並提供該參數噪音資料作為該第一聲道的該第一增益資訊以及該第二增益資訊。
- 一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括: 一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料;其中該噪音參數計算器被配置為將該第一參數噪音資料與該第二參數噪音資料中的至少一些從一左/右表示轉換為具有一中聲道及一側聲道的一中/側表示。
- 如請求項11所述之音頻編碼器,其中該噪音參數計算器被配置為將該第一參數噪音資料與該第二參數噪音資料中的至少一些的該中/側表示重新轉換為一左/右表示,其中,該噪音參數計算器被配置為根據重新轉換的該左/右表示計算該第一聲道的一第一增益資訊與該第二聲道的一第二增益資訊,以及提供包括在該第一參量噪音資料中的該第一聲道的該第一增益資訊,以及包括在該第二參量噪音資料中的該第二增益資訊。
- 如請求項12所述之音頻編碼器,其中該噪音參數計算器被配置為計算:該第一增益資訊,其通過比較:該第一聲道的該第一參數噪音資料從該中/側表示重新轉換為該左/右表示的一版本;與該第一聲道的該第一參數噪音資料從該中/側表示轉換為該左/右表示之前的一版本;及/或 該第二增益資訊,其通過比較:該第二聲道的該第二參數噪音資料從該中/側表示重新轉換為該左/右表示的一版本;與該第二聲道的該第二參數噪音資料從該中/側表示轉換為該左/右表示之前的一版本。
- 一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料;其中該噪音參數計算器被配置為比較該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的一能量與一預定能量閾值,並且:當該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的該能量大於該預定能量閾值時,將側聲道噪音形狀向量的係數歸零;以及當該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合的該能量小於該預定能量閾值,保持該側聲道噪音形狀向量的係數。
- 一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀; 一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料;該音頻編碼器被配置為使用比編碼該第一參數噪音資料及該第二參數噪音資料之間的該第一線性組合的一位元量少的一位元量對該第一參數噪音資料及該第二參數噪音資料之間的該第二線性組合進行編碼。
- 一種音頻編碼器,用於為包括一活動幀及一非活動幀的幀序列生成一編碼的多聲道音頻信號,該音頻編碼器包括:一活動檢測器,用於分析一多聲道信號以判斷該幀序列中的一個幀是一非活動幀;一噪音參數計算器,用於計算該多聲道信號的一第一聲道的一第一參數噪音資料,並用於計算該多聲道信號的一第二聲道的一第二參數噪音資料;一相關性計算器,用於計算指示在非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及一輸出介面,用於產生該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及/或該第一參數噪音資料與該第二參數噪音資料的一第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的一第二線性組合,以及該相關性資料;其中,該輸出介面被配置為:使用用於一第一頻率柱數量的多個第一係數來生成具有該活動幀的一編碼音頻資料的一編碼的多聲道音頻信號;以及 使用用於描述一第二頻率柱數量的多個第二係數來生成該第一參數噪音資料、該第二參數噪音資料、或該第一參數噪音資料與該第二參數噪音資料的該第一線性組合以及該第一參數噪音資料與該第二參數噪音資料的該第二線性組合,其中,該第一頻率柱數量大於該第二頻率柱數量。
- 一種音頻編碼方法,用於為包括一活動幀與一非活動幀的一幀序列生成一編碼的多聲道音頻信號,該方法包括:分析一多聲道信號以判斷該幀序列中的一個幀為一非活動幀;為該多聲道信號的一第一聲道、及/或該多聲道信號的該第一聲道與一第二聲道的一第一線性組合計算一第一參數噪音資料,並為該多聲道信號的該第二聲道、及/或該多聲道信號的該第一聲道與該第二聲道的一第二線性組合計算一第二參數噪音資料;計算指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料;以及生成該編碼的多聲道音頻信號,其具有該活動幀的一編碼音頻資料,以及該非活動幀的該第一參數噪音資料、該第二參數噪音資料、及該相關性資料;其中該音頻編碼方法包括:從該非活動幀的該第一聲道與該第二聲道的複頻譜值中計算一實中間值與一虛中間值;計算該非活動幀的該第一聲道的一第一能量值和該第二聲道的一第二能量值;以及使用該實中間值、該虛中間值、該第一能量值及該第二能量值計算該相關性資料,或平滑該實中間值、該虛中間值、該第一能量值及該第二能量值其中的至少一,並使用至少一個平滑值計算該相關性資料。
- 一種電腦程式,其係在運行於一電腦或一處理器時,執行如請求項17之方法。
- 一種編碼的多聲道音頻信號,其係由如請求項1至16任一項所述之音頻編碼器所生成,該編碼的多聲道音頻信號組織於一幀序列中,該幀序列包括一活動幀與一非活動幀,該編碼的多聲道音頻信號包括:該活動幀的一編碼的音頻資料;在該非活動幀中的一第一聲道的一第一參數噪音資料;在該非活動幀中的一第二聲道的一第二參數噪音資料;以及指示在該非活動幀中的該第一聲道與該第二聲道之間的一相關情況的一相關性資料。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20193716.6 | 2020-08-31 | ||
EP20193716 | 2020-08-31 | ||
WOPCT/EP2021/068079 | 2021-06-30 | ||
PCT/EP2021/068079 WO2022042908A1 (en) | 2020-08-31 | 2021-06-30 | Multi-channel signal generator, audio encoder and related methods relying on a mixing noise signal |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202320057A TW202320057A (zh) | 2023-05-16 |
TWI840892B true TWI840892B (zh) | 2024-05-01 |
Family
ID=72432694
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111127307A TWI840892B (zh) | 2020-08-31 | 2021-08-23 | 音頻編碼器、音頻編碼方法、電腦程式及編碼的多聲道音頻信號 |
TW110131072A TWI785753B (zh) | 2020-08-31 | 2021-08-23 | 多聲道信號產生器、多聲道信號產生方法及電腦程式 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110131072A TWI785753B (zh) | 2020-08-31 | 2021-08-23 | 多聲道信號產生器、多聲道信號產生方法及電腦程式 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230206930A1 (zh) |
EP (1) | EP4205107A1 (zh) |
JP (1) | JP2023539348A (zh) |
KR (1) | KR20230058705A (zh) |
CN (1) | CN116075889A (zh) |
AU (2) | AU2021331096B2 (zh) |
BR (1) | BR112023003557A2 (zh) |
CA (1) | CA3190884A1 (zh) |
MX (1) | MX2023002238A (zh) |
TW (2) | TWI840892B (zh) |
WO (1) | WO2022042908A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024051955A1 (en) * | 2022-09-09 | 2024-03-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata |
WO2024051954A1 (en) * | 2022-09-09 | 2024-03-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder and encoding method for discontinuous transmission of parametrically coded independent streams with metadata |
TWI841229B (zh) * | 2023-02-09 | 2024-05-01 | 大陸商星宸科技股份有限公司 | 語音增強方法及執行語音增強方法的處理電路 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI359620B (en) * | 2006-10-16 | 2012-03-01 | Fraunhofer Ges Forschung | Apparatus and method for multi-channel parameter t |
US20170047072A1 (en) * | 2014-02-14 | 2017-02-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Comfort noise generation |
WO2019193156A1 (en) * | 2018-04-05 | 2019-10-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Support for generation of comfort noise |
TW202004734A (zh) * | 2018-04-05 | 2020-01-16 | 弗勞恩霍夫爾協會 | 用於估計聲道間時間差的裝置、方法或計算機程式 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY171106A (en) | 2012-12-21 | 2019-09-25 | Fraunhofer Ges Zur Forderung Der Angenwandten Forschung E V | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
CN104050969A (zh) * | 2013-03-14 | 2014-09-17 | 杜比实验室特许公司 | 空间舒适噪声 |
-
2021
- 2021-06-30 EP EP21739085.5A patent/EP4205107A1/en active Pending
- 2021-06-30 CN CN202180053712.8A patent/CN116075889A/zh active Pending
- 2021-06-30 KR KR1020237011262A patent/KR20230058705A/ko unknown
- 2021-06-30 WO PCT/EP2021/068079 patent/WO2022042908A1/en active Application Filing
- 2021-06-30 BR BR112023003557A patent/BR112023003557A2/pt unknown
- 2021-06-30 JP JP2023514100A patent/JP2023539348A/ja active Pending
- 2021-06-30 MX MX2023002238A patent/MX2023002238A/es unknown
- 2021-06-30 CA CA3190884A patent/CA3190884A1/en active Pending
- 2021-06-30 AU AU2021331096A patent/AU2021331096B2/en active Active
- 2021-08-23 TW TW111127307A patent/TWI840892B/zh active
- 2021-08-23 TW TW110131072A patent/TWI785753B/zh active
-
2023
- 2023-02-27 US US18/175,355 patent/US20230206930A1/en active Pending
- 2023-10-25 AU AU2023254936A patent/AU2023254936A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI359620B (en) * | 2006-10-16 | 2012-03-01 | Fraunhofer Ges Forschung | Apparatus and method for multi-channel parameter t |
US20170047072A1 (en) * | 2014-02-14 | 2017-02-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Comfort noise generation |
WO2019193156A1 (en) * | 2018-04-05 | 2019-10-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Support for generation of comfort noise |
TW202004734A (zh) * | 2018-04-05 | 2020-01-16 | 弗勞恩霍夫爾協會 | 用於估計聲道間時間差的裝置、方法或計算機程式 |
Also Published As
Publication number | Publication date |
---|---|
US20230206930A1 (en) | 2023-06-29 |
CN116075889A (zh) | 2023-05-05 |
TW202320057A (zh) | 2023-05-16 |
AU2023254936A1 (en) | 2023-11-16 |
MX2023002238A (es) | 2023-04-21 |
KR20230058705A (ko) | 2023-05-03 |
EP4205107A1 (en) | 2023-07-05 |
AU2021331096A1 (en) | 2023-03-23 |
WO2022042908A1 (en) | 2022-03-03 |
CA3190884A1 (en) | 2022-03-03 |
BR112023003557A2 (pt) | 2023-04-04 |
JP2023539348A (ja) | 2023-09-13 |
TW202215417A (zh) | 2022-04-16 |
AU2021331096B2 (en) | 2023-11-16 |
TWI785753B (zh) | 2022-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7244609B2 (ja) | ビットバジェットに応じて2サブフレームモデルと4サブフレームモデルとの間で選択を行うステレオ音声信号の左チャンネルおよび右チャンネルを符号化するための方法およびシステム | |
TWI840892B (zh) | 音頻編碼器、音頻編碼方法、電腦程式及編碼的多聲道音頻信號 | |
RU2667382C2 (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
JP5165559B2 (ja) | オーディオコーデックポストフィルタ | |
US9489962B2 (en) | Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method | |
RU2669079C2 (ru) | Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением | |
JP2013508761A (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
US20090180531A1 (en) | codec with plc capabilities | |
RU2809646C1 (ru) | Генератор многоканальных сигналов, аудиокодер и соответствующие способы, основанные на шумовом сигнале микширования | |
Abrahamsson | Compression of multi channel audio at low bit rates using the AMR-WB+ codec |