TW200926148A - An encoder - Google Patents
An encoder Download PDFInfo
- Publication number
- TW200926148A TW200926148A TW097142672A TW97142672A TW200926148A TW 200926148 A TW200926148 A TW 200926148A TW 097142672 A TW097142672 A TW 097142672A TW 97142672 A TW97142672 A TW 97142672A TW 200926148 A TW200926148 A TW 200926148A
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- audio signal
- shaping factor
- audio
- segments
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 191
- 238000007493 shaping process Methods 0.000 claims abstract description 126
- 238000000034 method Methods 0.000 claims description 65
- 239000002131 composite material Substances 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 15
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000013461 design Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 208000001613 Gambling Diseases 0.000 description 1
- 206010041235 Snoring Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
200926148 六、發明說明: t發明所屬之技術領域3 發明領域 本發明與編碼有關,特別是,但並不完全與語音或音 5 訊編碼有關。 【先前技術 發明背景 如語音或音樂的音訊信號被編碼,例如用於致能音訊 信號的高效傳輸或儲存。 ίο 音訊編碼器和解碼器被用來表示諸如音樂和背景雜訊 的基於音訊的信號。這些類型的編碼器典型地不使用用於 編碼程序的語音模型,而是其使用表示所有類型之音訊信 號(包括語音)的程序。 語音編碼器和解碼器(編碼解碼器)通常最佳地用於語 15 音信號,以及可在一固定位元率或一可變位元率操作。 一音訊編碼解碼器也受組配以以可變位元率操作。在 較低位元率,這樣的一音訊編碼解碼器可以一編碼率處理 語音信號,相當於一純語音編碼解碼器。在較高位元率, 該音訊編碼解碼器可以以較高的品質和性能編碼包括音 20 樂、背景雜訊及語音的任何信號。 在一些音訊編碼解碼器中,輸入信號被分成一有限數 目的頻帶。該等頻帶信號中的每一頻帶信號可被量化。從 心理聲學理論我們得知,頻譜中的最高頻率的知覺重要性 通常低於低頻。在一些音訊編碼解碼器中,這一點由較於 200926148 低頻信號,較少的位元被分s&給高齡_位元分配反映。 此外’ -些編媽解碼器使用-音訊信號之低頻與高頻 帶或區域之_相關性來提高該等編碼解碼器對應的編碼 效率。 5 例如,典型地,頻譜的較高頻帶-般與較低頻帶非常 類似,—些編碼解碼器可以只編碼較低頻帶,然後再現較 尚頻帶作為一比例較低頻帶複製。因此,僅透過使用一小 數量的額外控制資訊就可在編碼解碼器的總位元率中實現 大量節省。 1〇 此類用於編碼尚頻區域的技術被稱為高頻區域(HFR) 編碼方法。一種形式的高頻區域編碼是已透過編碼技術開 發的頻譜帶複製(SBR)。在SBR中,諸如動畫專家群MpEG_4 尚級聲頻編碼第皿層(Mp3)編碼器的一已 知音訊編碼器編碼低頻區域。高頻區域單獨地使用已編碼 15 的低頻區域產生。 在SBR中’高頻區域透過將低頻區域移位到較高頻率 來獲得。該移位基於具有32個頻帶的一正交鏡相濾波器 (QMF)滤波器組以及被執行以使其被預定義,每一高頻帶 樣本從這些頻帶樣本來構建。這獨立於輸入信號的特性來 20 完成。 該等較高頻帶基於額外的資訊來修改。該修改被完成 以使合成咼頻區域的特定特徵更加類似於原始的那些。諸 如正弦波(sinusoid)或雜訊的額外成分被加入到該高頻區 域,以增加與原始高頻區域的相似性。最後,波封被按照 200926148 原始高頻頻譜的波封進行調整。 被稱為刖回聲或後回聲失真的人工因素可能在使用知 覺編瑪規則的轉換編碼解碼器中發生。當具有一尖銳開始 的一信號跟隨在一部分低能量之後時,發生前回聲。前回 5聲在一典蜇的基於區塊的轉換編碼解碼器在頻域中執行量 化和編瑪這樣的情況下發生。為了達到遮蔽與一知覺測量 準則相關聯的臨界值,時頻不確定性要求一反向轉換將在 整個重建區塊中以均等時間傳播量化失真。這導致在位於 解碼信號中的較尚信號區域前面時間的整個低能量區域中 10 產生未遮蔽失真。 當在信號中有一突發性偏移量時,可察覺一類似效 應。在這種情況下,在編碼信號遭轉換到時域後,量化雜 訊被傳播到隨後的低能量區域。這種失真被稱為後回聲。 前回聲和後回聲可透過在存在瞬變的信號部分中選擇 15 -較小視窗大小來減小。_,在許多應时這通常是不 可能的,因為需要一固定延遲或轉換大小。另外一種用來 減小該前/後回聲失真效應的技術是時域雜訊整形(TNS), 藉此一適應預測分析濾波器適用於頻域係數。這具有整形 時域雜訊的效果,藉此將量化雜訊大部分集中在信號的高 20 能量區域。 這些方法已被發現對於控制編碼方案中的前回聲和後 回聲-般都有效,其中該編碼方案牌音訊信號編碼作為一 全頻帶信號(換言之,整個頻譜透過一單一方法編碼)或者要 解碼的音訊信號包含諸如在使用該分離頻帶(spUt band)或 5 200926148 S B R方法之一音訊編碼系統的低頻帶中所發現的那些的較 低頻率成分的一大部分。然而在要音訊編碼的一 SBR方法 的較高頻帶中的信號可顯示出非常不同於相對應的低頻帶 的信號特性,同樣地,該方法不產生有效的前回聲和後回 5 聲失真抑制。 【發明内容3 發明概要 本發明從以下考慮出發,即先前所述的用於控制前回 聲和後回聲的方法對於在要音訊編碼的一分離頻帶或SBR 10 方法中的高頻帶信號特性而言不是最佳的。 本發明之實施例的目的是解決以上問題。 根據本發明的一第一層面,本發明提供了一種編碼一 音訊信號的方法,其包含以下步驟:藉由一第一音訊信號 的一第一編碼和解碼從該第一音訊信號產生一第二音訊信 15 號;決定介於該第一音訊信號與該第二音訊信號之間的至 少一個能量差值;以及根據該至少一個能量差值計算至少 一個信號整形因數。 該方法可進一步包含將該第一音訊信號分成多個區段。 該等區段較佳地是以下區段中的至少一者:時間區 20 段;頻率區段;時間和頻率區段。 計算該至少一個信號整形因數可包含以下步驟:比較 該第二音訊信號的該等多個區段中的至少一個區段的該至 少一個能量差值與一臨界值;以及根據該第二音訊信號的 該等多個區段中的至少一個區段的該至少一個能量差值與 200926148 該臨界值的比較結果決定與該等多個區段中的該至少一個 區段相關聯的信號整形因數的一值。 決定至少一能量差值可進一步包含分別對於該第一音 訊信號的至少兩個連續區段以及該第二音訊信號的至少兩 5 個連續的相對應區段決定至少兩個連續的能量差值。 計算至少一個信號整形因數可進一步包含比較該至少 兩個能量差值與一臨界值,以決定該第二音訊信號的該等 多個區段中的至少一個區段的信號整形因數。 〇 該方法可進一步包含根據該第二音訊信的該等多個區 10 段的每一區段的信號整形因數產生一信號整形因數控制信號。 該能量差值較佳地根據來自該第一音訊信號的至少一 個區段的能量與來自該第二音訊信號的至少一個區段的能量。 該能量差值較佳地是該第一音訊信號的至少一個區段 的能量與該第二音訊信號的至少一個區段的能量之比。 15 該第一音訊信號較佳地是一未處理音訊信號,以及其 中該第二音訊信號較佳地是一合成音訊信號。 V 該第一音訊信號和該第二音訊信號較佳的是較高頻率 音訊信號。 根據本發明的一第二層面,本發明提供了一種解碼一 20 音訊信號的方法,其包含以下步驟:接收一編碼信號,該 編碼信號至少部分地包含一信號整形因數信號;解碼該編 碼信號以產生一合成音訊信號;從所接收的增益因數信號 決定該合成信號的至少一個信號整形因數;以及將該至少 一個信號整形因數施加到該合成音訊信號。 7 200926148 該方法可進一步包含將該合成音訊信號分成多個區段。 該區段較佳地是以下區段中的至少一者:一時間區 段;一頻率區段;一時間和頻率區段。 該決定至少一個信號整形因數可包含決定該合成信號 5 的該等多個區段中的每一區段的至少一個信號整形因數。 將該至少一個信號整形因數施加到該合成音訊信號可 包含將該等多個區段的每一區段的該至少一個信號整形因 數施加到該合成音訊信號。 決定該至少一個信號整形因數函數可包含以下步驟: 10 從該信號整形因數信號解碼至少一個信號整形因數;將該 至少一個信號整形因數加入到先前的至少一個信號整形因 數的一軌跡;以及用來自該信號整形因數執跡的該至少一 個先前的信號整形因數内插該至少一個信號整形因數;以 及用該至少一個信號整形因數内插該先前的信號整形因數。 15 該内插較佳地是一線性内插。 該内插較佳地是一非線性内插。 根據本發明的一第三層面,本發明提供了一種用於編 碼一音訊信號的編碼器,其包含:受組配以從一第一音訊 信號產生一第二音訊信號的一第一編碼器一解碼器;受組 20 配以決定介於該第一音訊信號與該第二音訊信號之間的至 少一個能量差值的一信號比較器;受組配以根據該至少一 個能量差值計算至少一個信號整形因數的一信號處理器。 該編碼器可進一步包含受組配以將該第一音訊信號分 成多個區段的一信號分配器(partitioner)。 200926148 該等區段較佳地是以下區段中的至少一者:時間區 段;頻率區段;時間和頻率區段。 該信號處理器較佳地進一步受組配以:比較該第二音 訊信號的該等多個區段中的至少一個區段的該至少一個能 5 量差值與一臨界值;以及根據該第二音訊信號的該等多個 區段中的至少一個區段的該至少一個能量差值與該臨界值 的該比較結果決定與該等多個區段的該至少一個區段相關 聯的信號整形因數的一值。 該信號比較器較佳地受組配以:分別對於該第一音訊 10 信號的至少兩個連續區段以及該第二音訊信號的至少兩個 連續的相對應區段決定至少兩個連續的能量差值。 該信號處理器較佳地進一步受組配以:比較該至少兩 個能量差值與一臨界值,以決定該第二音訊信號的該等多 個區段中的至少一個區段的信號整形因數。 15 該信號處理器較佳地進一步受組配以:根據該第二音 訊信號的該等多個區段中的每一區段的信號整形因數產生 一信號整形因數控制信號。 該能量差值較佳地根據來自該第一音訊信號的至少一 個區段的能量以及來自該第二音訊信號的至少一個區段的 20 能量。 該能量差值較佳地是該第一音訊信號的至少一個區段 的能量與該第二音訊信號的至少一個區段的能量之比。 該第一音訊信號較佳地是一未處理音訊信號,以及其 中該第二音訊信號較佳地是一合成音訊信號。 9 200926148 該第一音訊信號和該第二音訊信號較佳的是較高頻率 音訊信號。 根據本發明的一第四層面,本發明提供了一種用於解 碼一音訊信號的解碼器,其受組配以:接收一編碼信號, 5 該編碼信號至少部分地包含一信號整形因數信號;解碼該 編碼信號以產生一合成音訊信號;從所接收的信號整形因 數信號決定該合成信號的至少一個信號整形因數;以及將 該至少一個信號整形因數施加到該合成音訊信號。 該解碼器可進一步受組配以將該合成音訊信號分成多 10 個區段。 該等區段是以下區段中的至少一者:時間區段;頻率 區段,時間和頻率區段。 該解碼器較佳地受組配以透過決定該合成信號之該等 多個區段的每一區段的至少一個信號整形因數決定該至少 15 一個信號整形因數。 該解碼器較佳地受組配以透過將該等多個區段中的每 一區段的該至少一個信號整形因數施加到該合成音訊信號 來將該至少一個信號整形因數施加到該合成音訊信號。 該解碼器較佳地受組配以透過以下步驟決定該至少一 20 個信號整形因數函數:從該信號整形因數信號解碼至少一 個信號整形因數;將該至少一個信號整形因數加入到先前 的至少一個信號整形因數的一執跡;以及用來自該信號整 形因數軌跡的該至少一個先前的信號整形因數内插該至少 一個信號整形因數;以及用該至少一個信號整形因數内插 200926148 該先前的信號整形因數。 該内插較佳地是一線性内插。 該内插較佳地是一非線性内插。 裝置可包含如上所述的一編碼器。 5 裝置可包含如上所述的一解碼器。 一電子裝置可包含如上所述的一編碼器。 ' 一電子裝置可包含如上所述的一解碼器。 根據本發明的一第五層面,本發明提供了一種受組配 ❹ 以執行一種用於編碼一音訊信號之方法的電腦程式產品, 10 該方法包含以下步驟:藉由一第一音訊信號的一第一編碼 和解碼從該第一音訊信號產生一第二音訊信號;決定介於 該第一音訊信號與該第二音訊信號之間的至少一個能量差 值;以及根據該至少一個能量差值計算至少一個信號整形 因數。 15 根據本發明的一第六層面,本發明提供了一種受組配 以執行一種用於解碼一音訊信號之方法的電腦程式產品, _ 該方法包含以下步驟:接收一編碼信號,該編碼信號至少 部分地包含一信號整形因數信號;解碼該編碼信號以產生 一合成音訊信號;從所接收的增益因數信號決定該合成信 20 號的至少一個信號整形因數;以及將該至少一個信號整形 因數施加到該合成音訊信號。 根據本發明的一第七層面,本發明提供了一種用於編 碼一音訊信號的編碼器,其包含:用於從一第一音訊信號 產生一第二音訊信號的編碼解碼器裝置;受組配以決定介 11 200926148 於該第一音訊信號與該第二音訊信號之間的至少一個能量 差值的第一信號處理裝置;受組配以根據該至少一個能量 差值計算至少一個信號整形因數的第二信號處理裝置。 根據本發明的一第八層面,本發明提供了一種用於解 5 碼一音訊信號的解碼器,其包含:用於接收一編碼信號的 接收裝置,其中該編碼信號至少部分地包含一信號整形因 數信號;用於解碼該編碼信號以產生一合成音訊信號的解 碼裝置;用於從所接收的信號整形因數信號決定該合成信 號的至少一個信號整形因數的第一信號處理裝置;以及用 10 於將該至少一個信號整形因數施加到該合成音訊信號的第 二信號處理裝置。 圖式簡單說明 為了更好地理解本發明,現將透過舉例實現對所附圖 式的參考,其中在該等圖式中: 15 第1圖概要地顯示使用本發明之實施例的一電子裝置; 第2圖概要地顯示使用本發明之實施例的一音訊編碼 解碼器系統; 第3圖概要地顯示在第2圖中所示的音訊編碼解碼器系 統的一編碼器部分; 20 第4圖概要地顯示在第2圖中所示的音訊編碼解碼器系 統的一解碼器部分; 第5圖顯示如在本發明之實施例中所使用之增益軌跡 内插的一個例子; 第6圖顯示說明根據本發明的如在第3圖中所示的一音 200926148 訊編碼器實施例之操作的一流程圖;以及 第7圖顯示說明根據本發明的如在第3圖中所示的-音 訊解碼器實施例之操作的一流程圖。 【貧施方式】 , 5較佳實施例之詳細說明
下文盡可月匕更加詳細地描述用於在一音訊編碼解碼器 的—高頻帶信號成分中提供前回聲和後回聲控制的裝置與 機制。在這方面’首先實現對第丨圖的參考,第旧是一示 範性電子裝置1〇的-概要方塊圖,且其可併入根據本發明 之一實施例的一編碼解碼器。 該電子裝置10可以是,例如-無線通訊系統的-行動 終端機或使用者設備。 該電子裝置10包含-麥克風u,該麥克風叫由一類 15 髻 至數位轉換器14連接到_處理器21。該處理器21藉由一 =至類比轉換器32進_步連接到—揚聲器33。該處理器 、進步連接到-收發器(TX/RX)13、一使用者介面(即15 以及一記憶體22。 4處理器21可受組配以執行各種程式碼。所實施的程 。馬包含用於編瑪一音訊信號的一較低頻帶以及一音訊信 1的較尚頻帶的一音訊編碼碼。所實施的程式碼23進一 ,匕含一音訊解碼碼。該所實施的程式碼23可被儲存在, 憶體22巾綴在必要時由該處理抑棘。該記憶 22可進一步提供用於儲存資料的一區段24,該資料是, 如根據本發明編碼的資料。 13 200926148 該編碼與解碼碼可在本發明的實施例中用硬體或韌it 實施。 該使用者介面15使一使用者能夠,藉由例如一小鍵盤 將命令輸入到該電子裝置10,以及/或者藉由例如一顯禾器 5從該電子裝置獲取資訊。該收發器丨3能夠,藉由例如〆 無線通訊網絡與其他電子裝置通訊。 此外可理解的是,該電子裝置1〇的結構可以加以補 充’以及以許多不同的方式改變。 該電子裝置10的一使用者可使用用於輸入語音的麥克 10風11,其中該語音要被傳送至一些其他的電子裝置或要被 儲存在記憶體22的資料區段24。一相對應的應用程式為此 目的已藉由使用者介面15被該使用者啟動。可由處理器21 運行的該應用程式使該處理器21執行儲存在該記憶體22中 的編碼碼。 15 該類比至數位轉換器14將輸入類比音訊信號轉換成一 數位音訊信號,以及將該數位音訊信號提供給該處理器21。 然後該處理器21可以以如同參考第2圖及第3圖所述的 方式處理該數位音訊信號。 所產生的位元流遭提供給收發器13用於傳輸到另一電 子裝置。選擇性地’編碼資料可被儲存在該記憶體的該 貧料區段24中,例如用於猶後的傳輸或者用於由該同一電 子裝置10稍後表示。 該電子裝置10也可以藉由其收發器13從另一電子裝置 接收具有相對應編碼資料的-位元流。在這種情況下,該 200926148 5 Ο 10 15 20 處理器21可執行儲存在該記憶體22中的解碼程式碼。該處 理器21解碼已接收資料,以及將該已解碼資料提供給該數 位至類比轉換器32。該數位至類比轉換器32將該數位解碼 資料轉換成類比音訊資料,以及藉由該揚聲器33輸出該類 比音訊資料。該解碼程式碼的執行也可以被一應用程式觸 發’其中該應用程式藉由該使用者介面15被該使用者調用。 已接收編碼資料而不是一中間表示也可以藉由該揚聲 器33儲存在該記憶體22的該資料區段24中’例如用於致能 一稍後表示或到又一另外電子裝置的轉發。 可理解的是,在第2圖至第4圖中所述的概要結構以及 第6圖及第7圖中的方法步驟僅表示在第1圖中所示的電子 裝置中作為範例顯示實施的一完整音訊編碼解碼器之操作 的一部分。 本發明之實施例所使用的音訊編碼解碼器的一般操作 在第2圖中顯示。一般音訊編碼/解碼系統由如在第2圖中概 要說明的一編碼器和一解碼器組成。所說明的是具有一編 碼器104、一儲存器或媒體頻道106以及一解碼器1〇8的一系 統 102。 該編碼器104包含產生一位元流112的一輸入音訊信號 110,該位元流112透過一媒體頻道106遭儲存或傳送。該位 元流112可在該解碼器1 〇 8中被接收。該解碼器丨〇 8解壓縮該 位元流112以及產生一輸出音訊信號114。與該輸入信號n〇 有關的該位元流112的位元率以及該輸出音訊信號114的品 質是定義編碼系統102之性能的主要特徵。 15 200926148 第3圖概要地顯示根據本發明之一實施例的一編碼器 104。該編碼器1〇4包含受配置以接收一音訊信號的一輸入 203。 該輸入203連接到一頻帶分離器230,該分離器230將信 5 號分成一較高頻帶(也被稱為一較高頻率區域)以及一較低 頻帶(也被稱為一較低頻率區域)。該頻帶分離器的較低頻帶 ' 輸出連接到較低頻率區域編碼器(除此之外被稱為核心編 - 碼解碼)231。該車父低頻率區域編碼器231進一步連接到較 高頻率區域編碼器232,以及受組配以傳遞與該較高頻率區 ◎ 10 域編碼流程之較低頻率區域的編碼有關的資訊。 該頻帶分離器的較高頻帶輸出受配置以連接到該較高 頻率區域(HFR)編碼器232。該HFR編褐器受組配以輸出一 合成音訊信號,該合成信號受配置以連接到前/後回聲控制 處理器233的輸入端。 15 除了從該HFR編碼器接收一輸入外,該前/後回聲控制 處理器233進一步受配置以接收從該頻帶分離器23〇輸出的 原始較高頻帶信號作為一額外輸入。 〇 該較低頻率區域(LFR)編碼器231、該HFR編碼器232以 及該前/後回聲控制處理器受組配以輪出信號到位元流格 20式器234(在本發明的一些實施例中,其也被稱為位元流多 工器)。該位元流格式器234受組配以藉由輸出端2〇5輸出該 輸出位元流112。 這些元件的操作參考在顯示該編碼器104之操作的第6 圖中所示的流程圖被更加詳細的描述。 16 200926148 5 ❹ 10 15 ❹ 20 該音訊信號被編碼器10 4接收。在本發明的一第一實施 例中,該音訊信號是一數位取樣信號。在本發明的其他實 施例中,該音訊輸入可以是,例如來自一麥克風6的一類比 音訊信號,該類比音訊信號遭類比至數位(A/D)轉換。在本 發明的又一些實施例中,該音訊輸入從一脈衝碼調變數位 元信號遭轉換成振幅調變數位元信號。該音訊信號的接收 透過步驟601被顯示在第6圖中。 該頻帶分離器23 0接收該音訊信號以及將該信號分成 一較高頻帶信號以及一較低頻帶信號。在本發明的一些實 施例中,該音訊信號的較高頻帶信號及較低頻帶信號的劃 分可對該音訊信號採取低通濾波(以產生較低頻帶信號)以 及高通濾波(以產生較高頻帶信號)的形式,以完成信號劃分 成頻帶。 典型地,該流程可被各自的濾波信號的縮減取樣(d〇wn sampling)階段採用,以實現兩個基頻信號。例如,一個為 二的縮減取樣因數可被使用,以實現兩個具有相等帶寬的 基頻信號。 在本發明的又一些實施例中,信號的分離可透過使用 一正交鏡相濾波器(QMF)結構來完成,藉此由分析濾波階 段所引起的混疊(aliasing)成分於信號在該解竭器的合成階 段被重建之時彼此有效地抵消。 較咼頻帶和較低頻帶信號的信號劃分透過步驟603被 顯不在第6圖中。 如上所述的該較低頻率區域(LFR)編碼器231接收該較 17 200926148 低頻帶(以及選擇性地縮減取樣)音訊信號,以及對該信號施 加一合適的低頻編碼。在本發明的一實施例中,該較低頻 率區域編碼器231可將量化和霍夫曼編碼(Huffman Coding) 施加到該較低頻率區域音訊信號的子頻帶。在這些實施例 5中’該較低頻率區域編碼器231的輸入信號11〇可使用一分 析瀘、波器組結構分成子頻帶。每一子頻帶可使用由一心理 聲學模型提供的資訊來量化和編碼。該量化設定以及編碼 - 方案可根據該所施加的心理聲學模型來選定。 該量化、編碼資訊遭發送至該位元流格式器234用於產 © 10 生一位元流112。 此外,該低頻率編碼器231提供合成LFR信號的一頻域 體現。該頻域體現可遭傳遞到該HFR編碼器232,以完成較 高頻率區域的編碼。 該較低頻率編碼透過步驟606被顯示在第6圖中。 15 在本發明的其他實施例中,其他低頻編碼解碼器可被 使用,以產生輸出到該位元流格式器234的核心編碼輸出。 這些另外低頻編碼解碼器實施例的例子包括但不限於高級 〇 聲頻編碼(AAC)、MPEG第3層(MP3)、ITU-T嵌入式變速率 (EV-VBR)語音編碼基線編碼解碼器,以及ITU_TG.729.卜 2〇 然後來自該頻帶分離器230的較高頻帶信號輸出可被 該高頻率區域(HFR)編碼器232接收。在本發明的一第一實 施例中,該較高頻帶信號可用一頻譜帶複製類型演算法編 碼,其中來自該較低頻帶編碼的頻譜資訊被用來複製該較 高頻帶頻譜結構。在本發明的又一些實施例中,該較高頻 18 200926148 帶心號可用~較高頻率區域編碼器來編碼,該較高頻率區 域編碼器可能僅在該要編碼的較高頻帶信號上動作,並且 在該流程中不使用來自該較低頻帶的資訊進行輔助。 5玄尚頻率區域編碼階段被第6圖中的步驟607示範性地 5 描述。 作為該較尚頻帶編碼流程的一部分,該編碼解碼器可 產生一合成音訊信號輸出。這是已編碼信號的一表示或估 计,但疋在该編碼器本地產生。在本發明的一示範性實施 例中’該較高頻帶合成信號連同原始的較高頻帶信號可被 10分成區段。區段長度可任意選定,但是在通常情況下,其 將與信號的取樣頻率有關。該原始信號與該合成信號的該 分段透過第6圖中的步驟609描述。 該前/後回聲控制處理器233可決定該合成較高頻帶信 號與該原始較高頻帶信號之每一區段的一能量值。該階段 15在第6圖中透過步驟611表示。 此外’該前/後回聲控制處理器233使用該所決定的該 合成較高頻帶信號與該原始較高頻帶信號之每一區段的能 量值可決定該合成信號與該原始信號之相對應區段之間的 相對能量差異的一量值。該相對能量差異之量值的決定階 20段在第6圖中透過步驟613表示。 在本發明之實施例中,該前/後回聲控制處理器233也 可能橫跨連續的區段追蹤該所決定的該合成較高頻帶信號 與該原始較高頻帶信號的相對能量差異量值,以及比較該 所決定的量值與一預定臨界值,以確定在該原始信號與該 19 200926148 合成信號之間是否存在由於前回聲和後回聲引起的差異。 該追蹤過程在第6圖中透過步驟617顯示。 然後該前/後回聲控制處理器233可對每一區段將與該 能量差值與該臨界值之該比較有關的資訊傳遞到該位元流 5格式器234。這在第6圖中透過步驟619顯示。 該位元流格式器234接收該低頻編碼器231的輸出、該 咼頻率區域編碼器232的輸出以及該前/後回聲控制處理器 233的選擇輸出,以及格式化該位元流以產生位元流輸出。 在本發明的一些實施例中’該位元流格式器234可交錯所接 10收的輸入以及可產生要插入到該位元流輸出112中的錯誤 檢測碼和錯誤修正碼。 在下文所述的實施例中,本發明的編碼被相關一特定 範例示範性地描述,但是可理解的是,該範例不是限制性 的’且包括其是為了加強對本發明的理解。 15 在本發明之該編碼器示範性實施例中,⑻是原始較 南頻帶信號’以及Μ”)是本地產生的較高頻帶合成信號。 起初,兩個信號都可被分成Ν個樣本長度的區段。例如,一 合適區段長度被發現是2.5ms,以及對於一32kHz取樣信號 產生一80個樣本長度的分析訊框。然而,可理解的是,本 20發明的其他實施例可用不同長度的區段實施本發明。 在該範例中,該原始信號及該合成信號的第k個區段 分別被表示為和攻⑻,其中ne〇,...,N-l。 此外’該前/後回聲控制處理器233可根據每一樣本的 均方值決定該合成較高頻帶信號與該原始較高頻帶信號之 200926148 每一區段的一能量值。因此: κ,·^(χ»ϊ, ^ «=0 士 Σ(心⑻)2. 其中Eorig是該原始較高頻帶信號的能量’以及Esyn是 5 該合成較高頻帶信號的能量。然而’可理解的是,本發明 的又一些實施例可使用不同的能量量值,例如,一非限制 性列表可包括:頻帶信號之振幅的均方根值(RMS)或平均。 該前/後回聲控制處理器233可透過決定各自能量的比 決定該合成信號與該原始信號的相對應區段之間的相對能 10 量差值。因此,在該範例中,第k區段的相對差異量度七由 以下給出: dk = Κη· 然而可理解的是,其他差異能量量度可在本發明的又 一些實施例中使用。例如,一些實施例可將該差異能量量 15度實施為諸如能量振幅差值的一簡單差值。 然後該前/後回聲控制處理器233可橫跨區段追蹤該差 異能量量度dk ’以及根據該區段差異能量量度相關所定義 的基於兩個連續區段之能量比的差異能量臨界值j定義一 對數域增益參數〆,然後在表格1中所呈現的邏輯可在決定 20 使用。 表格1示範性地描述用於在本發明的一實施例中獲取 21 200926148 增益值〆的一虛擬竭邏輯。
For every k : If{dk<d and dk'x <
t A g =g λΑ-1 二 S =g } else { gk=〇 典型地,對於本發明的實施例,;和^是通過試驗選擇 的值。同樣地,在本發明的-些實施例中,#可被選定為一 5負值。值得注意的是,在本發明的這個實施例中,若目前 的能量差異量度^和先前的能量差異量度„!、於h則 先前區段的增益參數值,,也被修改。 在本發明的該特定實施例中,可能只是兩個值其中 的個值因此,在s亥範例中,只-位元可被提交給該解 10碼器以描述一區段yt中的〆值。 因此,在本發明之諸如以上所述實施例中的一個優點 是’這種改進較先前的控制前回聲和後回聲的方法僅需要 相當低的額外位元速率。 為了進一步幫助理解本發明,與本發明的實施例相關 15的該解碼器108的操作相關概要地顯示在第4圖中的解碼器 以及於第7圖中顯示該解碼器之操作範例的流程圖被顯示。 该解碼器包含-輸入端313,該編碼位元流112可從該 輸入端313接收。該輸入端313連接到位元流解封包程式 20 該位元流解封包程式將該編碼位元流112解多工八。, 22 200926148 或解封包成三個獨立的位元流。較低頻率區域編碼位元流 遭傳遞到較低頻率區域解碼器3〇3,較高頻率區域編碼位元 流遭傳遞到較鬲頻率區域重建器(rec〇nstruct〇r)/解碼器 307(也被稱為高鮮區域解碼器),以及回聲控制位元流遭 5傳遞到回聲控制信號修改處理器3〇5。 該解封包流程在第7圖中被步驟7〇1顯示。 該較低頻率區域解碼器303接收較低頻率區域編碼資 料以及透過對在該較低頻率區域編碼器231中所執行的流 程執打反向流程構建一合成較低頻率信號。若該較高頻率 10區域編碼解碼器使用_SBR類型的演算法,則該合成的較 低頻率區域信號可遭傳遞到該較高頻率區域解碼器/重建 器307。此外,該較低頻率區域解碼器的合成輸出可進一步 文配置以形成頻帶組合器/合成遽波器3〇9的其中一個輸入。 該較低頻率區域解碼流程在第7圖中被步驟術顯示。 15 該較高料區域解碼ϋ或重建㈣7在接收該較高頻 率區域編碼資料後即透過對在該高頻率區域編碼器加中 所執行的流程執行反向流程構建—合成高頻信號。 該較高頻率區域構建或解碼在第7圖中被步驟7〇5顯示。 然後該較高頻率區域解碼器的輸出受配置以傳遞到該 2〇前/後回聲控制信號修改單元3〇5。在接收該較高頻率區域 合成信號後,該回聲信號修改單元將剖析該合成信號之每 -相對應區段的回聲控制位元流,決定該區段的時間波封 是否需要被一增益因數修改。 此外’在本發明的-些實施例中,若信號修改增益被 23 200926148 認為在區段的邊界發生改變,則内插可橫跨該區段長度施 加到該增益因數。該可變增益功能以及先前所述的增益也 可以被稱為一信號整形功能,因為其產生一信號整形效 應。當該信號整形功能被施加時,其可具有消除從一區段 5到下一區段之時間波封視窗中的任何能量躍遷(energy transition)的效應。在本發明的一些實施例中,監控從一區 . 段到下一區段的信號修改增益軌跡可能是必要的,以決定 - 要橫跨該區段施加的精確的信號整形功能。 決定一特定區段是否需要回聲控制修改的流程透過第 © 10 7圖的步驟703描述。對該合成較高頻率區域信號部署信號 修改的機制透過第7圖的步驟709進一步描述。 該信號重建處理器309接收已解碼較低頻率區域信號 以及已解碼或已重建的較高頻率區域信號,以及透過使用 用以在該編碼器將該信號頻譜分成兩個頻帶或區域之流程 15 的反向來形成一全頻帶或頻譜信號’如通過230的示範性描 述。在本發明的一些實施例中’若在該編碼器使用等效分 析頻帶’則這可透過使用一合成濾波器組結構來實現。這 © 樣一個分析合成濾波器組結構的例子可以是一 QMF濾波器組。 將該信號重建成一全頻帶信號在第7圖中被步驟711顯示。 20 在本發明之一實施例的一範例中,該等增益參數可 受配置以在該解碼器形成一增益軌跡g(n)( 一信號整形因 數)。此外,若該增益/信號整形因數值被發現在區段邊界發 生改變,則線性内插可被使用,以消除橫跨區段時的增益 躍遷。這在第5圖中被示範性地描述。在第5圖中所示的範 24 200926148 5 ❹ 10 15 20 例中,一增益軌跡g(n)551被顯示用於—系列的連續區段。 這裡顯示了 4個區段-k_2區段501、k-Ι區段503、k區段5〇5 以及k+Ι區段507。在該範例中,該所示的k_2區段5〇1具有 一信號整形因數0,以及該k區段505具有一信號整形因數 0。為了使從5玄k-2區段到該k區段有一漸變改變,該中間區 段將一線性轉換施加到該k—丨區段中的每一樣本的增益函 數。換言之,在該k-Ι區段503中的第一樣本具有接近該k_2 區段之最後樣本511之值的一值,以及該k-1區段之最後樣 本513的值具有接近該]^區段505之第一樣本之值的一值。 可理解的是,在本發明的又一些實施例中,不同的内 插方案可被採用。例如,採用一非線性方案是可能的。 然後該合成信號‘⑻可透過使用該增益軌跡/信號整 形因數g(n)來修改。若一對數增益參數被使用,則可如下修 改该較南頻率區域合成信號: 其中V⑻疋已修改合成信號。此外,在本發明的該示範性 實施例中,可注意到的S,當g⑷為零肖,原始信號與合成 信號之間沒有能量差異,所以I⑻等於、㈨。 在本發明的一實施例中,時間波封整形技術可被用來 對頻率位元於7kHz到14kHz之區域内的—較高頻率區域合 成信號控制前回聲和後回聲’其中該編碼解碼器的總取樣 頻率是32kHz。對於該特定範例而言,該較高頻率區域編瑪 解碼器利用一 20ms或640個樣本大小的訊框。該訊框可被分 成8個區段,其中每-區段具有—8G個樣本長度。在該編碼 25 200926148 器,固定值可被選定為: dk=0.2 ^=-0.5 因為每-訊框有8個區段,8個位元可被使用以表示該 5訊框的回聲控制資訊。對於本發明之-實施例的該特定範 — 例而言,該回聲控制資訊將只導致一〇遍—負擔。 . 本發明力個優點是其提供了一種應對回聲控制時間 波封整形之問題的有效的、低複雜性及低位元率解決# 〇 案。該方法被發現特別適用於那些在大於職之一頻率範 10圍部署高頻帶編碼的音訊編碼解碼器架構。 儘管上述實施例已在藉此信號被分成一較高頻率 區域 和-較低頻率區域的-分離頻率區域/頻帶架構層面進行 了描述’但是可理解的是,本發明的又一些實施例可用不 同編碼架構中之不同數目的分離頻率區域部署。 15 _如’該較低料區域和該較高頻轉域中的每-區 域可進-步被再分成子區域或子頻帶,以及與一較高頻率 〇 子頻帶相關聯的一較低頻率子頻帶。在本發明的這些實施 例中’該等相關聯子頻帶被比較,以及對每-區段的每-子頻γ ’该等增益因數/整形因數被決定。儘管該進一步劃 20分增加了必須從編碼器傳遞到解碼器的資訊,但是其產生 了旨在幫助減小回聲錯誤的信號整形因數。 •在本發明的又-些實施例中,其可能橫跨信號的全頻 ▼檢查每&號區段,藉此消除對於一種把信號分成多個 26 200926148 5 頻帶之機制的需求。舉例來說,若信號特性 在一高頻帶中發現的特徵,則這可能會是進 若信號是非結構化的並且類似雜訊, 顯示出通常會 —步有利的。 諸如在一無音訊 (unvoiced _nd)中發現的那些,則這些彻支其中的一個例 子可能發生。 以上所述之本發明的實施例根據單獨的編碼器⑽與 解碼器108裝置描述了編碼解碼器,以幫助理解所涉及的流 程。然而可理解的是,該等裝置、結構和操作可被實施作 為一單一編碼器—解碼器裝置/結構/操作。此外,在本發明 10的一些實施例中,該編碼器與解碼器可共享一些/或所有的 共用元件。 儘管以上範例描述了在一電子裝置610中的一編碼解 碼器中操作的本發明的實施例,但是可理解的是如在下 文中所述的發明可被實施作為任何可變速率/適應速率音 15 訊(或語音)編碼解碼器的一部分。因此,例如,本發明的實 施例可在於固定或有線通訊路徑上實施音訊編碼的一音訊 編碼解碼器中實施。 因此,使用者設備可包含一音訊編碼解碼器,諸如在 本發明之以上實施例中所述的那些。 20 應理解的是,術語“使用者設備,,意欲涵蓋任何合適類 型的無線使用者設備’諸如行動電話、可攜式資料處理裝 置或可攜式網路瀏覽器。 此外,—公用地移動式網路(PLMN)的元件也可以包含 如上所述的音訊編碼解碼器。 27 200926148 一般而言,本發明的各種實施例可用硬體或專用電 路、軟體、邏輯或其任何組合來實施。例如,一些層面可 用硬體實施,而其他層面可用可由一控制器、微處理器戋 其他计算裝置執行的勒體或軟體實施,然而本發明不僅^ 5於此。儘管本發明的各個層面可被說明及描述作為方塊 圖、流程圖或使用一些其他的圖形表示,但是完全可理解 的是,於此所述的這些方塊、裝置、系統、技術或方法可 用硬體、軟體、勒體、專用電路或邏輯、通用硬體或控制 器或其他計算裝置或其一些組合(作為非限制性例子)來實I施。 10 本發明的實施例可由電腦軟體實施,該電腦軟體可由 諸如處理器實體中的一行動裝置資料處理器或者硬體或者 軟體與硬體的一組合執行。此外,在這方面應注意的是, 在該等圖式中的任何邏輯流程方塊可表示程式步驟或者 互連邏輯電路、方塊及功能,或者程式步驟及邏輯電路、 I5 方塊及功能的一組合。 記憶體可以是屬於適於本地技術環境的任何類型,以 及可使用任何合適的資料儲存技術實施,諸如基於半導體 的記憶體裝置、磁性記憶體裝置及系統、光學記憶體裝置 及系統、固定記憶體及可移式記憶體。資料處理器可以是 20適於本地技術環境的任何類型,以及可包括一個或多個= 用電腦、專用電腦、微處理器、數位信號處理器(Dsp)以及 基於多核心處理器架構的處理器,這些作為非限制性例子。 本發明的實施例可用諸如整合電路模組的各種元件實 施。整合電路的設計大體上是一高度自動化的過程。複雜 28 200926148 和強大的軟體工具可得用於將一邏輯層級設計轉換成由待 於在一半導體基材上蝕刻和形成的一半導體電路設計。 諸如由加利福尼亞州山景城(Mountain View)的新思科 技有限公司(Synopsys,Inc)以及加利福尼亞州聖何塞(San 5 Jose)的益華電腦(Cadence Design)提供的那些程式使用已 經建立的設計規則以及預先儲存的設計模組程式館來自動 " 地在一半導體晶片上安排導體以及設置元件。一旦完成— 半導體電路設計,所產生的(例如Opus、GDSII或諸如此類 © 之)以/標準電子格式的設計可遭傳送至一半導體製造工 10 廠或“製造廠(fab)”用於製造。 以上描述已作為範例和非限制性例子提供了對本發明 之示範性實施例的一全面及翔實的描述。然而,當結合所 附圖式以及附加申請專利範圍閱讀時,鑒於以上描述,各 種修改及適應性改變對於在本相關技術領域中的那些通常 15知識老而言可變得顯而易見。然而,對本發明之教示的所 有這些和類似的修改仍將落入在附加申請專利範圍中所定 ❹義之本發明的範圍内。 【_式簡皁稅明】 第1圖概要地顯示使用本發明之實施例的一電子裝置. 20 第2圖概要地顯示使用本發明之實施例的一音訊蝙碼 解碼器系統; 第3圖概要地顯示在第2圖中所示的音訊編碼解碼器系 統的一編碼器部分, ^ 第4圖概要地顯示在第2圖中所示的音訊編碼解蝎器系 29 200926148 統的一解碼器部分; 第5圖顯示如在本發明之實施例中所使用之增益軌跡 内插的一個例子; 第6圖顯示說明根據本發明的如在第3圖中所示的一音 5 訊編碼器實施例之操作的一流程圖;以及 第7圖顯示說明根據本發明的如在第3圖中所示的一音 訊解碼器實施例之操作的一流程圖。 【主要元件符號說明】
10…電子裝置 11…麥克風 13.. .收發器 14.. .類比至數位轉換器 15.. .使用者介面
21.. .處理器 22···記憶體 23·.·程式碼 24…資料區段 32.. .數位至類比轉換器 33.. .揚聲器 102.. .編碼系統 104·.·編碼器 106.. .儲存器/媒體頻道 30 200926148 108.. .解碼器 110…輸入音訊信號 112.. .位元流 114.. .輸出音訊信號 203.. .輸入 205.. .輸出端 230.. .頻帶分離器 231…低頻率區域編瑪器 232.. .較高頻率區域編碼器 233.. .前/後回聲控制處理器 234.. .位元流格式器 301.. .位元流解封包程式 303.. .較低頻率區域解碼器 305.. .前/後回聲控制信號修改單元/處理器 307.. .較高頻率區域重建器/解碼器 309.. .頻帶組合器/合成濾波器或信號重建處理器 313…輸入端 501.. .k-2 區段 503.. .k-l 區段 505.. .k 區段 507.. .k+l 區段 31 200926148 51卜513…樣本 551...增益軌跡/信號整形因數 601〜621,701〜711...流程步驟
32
Claims (1)
- 200926148 七、申請專利範圍: 1·—種編碼-音訊信號的方法,其包含以下步 藉由一第一音訊信號的—第 編碼和解碼從該第 句矾信號產生一第二音訊信號; 決定該第一音訊信號與該第 少—個能量差值;以及 根據該至少一個能量差值計算 T异至J —個信號整 二去 曰訊信號之間的至 因數 形7請專利範圍第i項所述之用於編碼—音訊信號的方 法’其進一步包含以下步驟: 將该第一音訊信號分成多個區段。 3. 如申請專利範圍第2項所述之用於編碼一音訊信號的方 法,其中該等區段是以下區段中的至少一者: 時間區段; 頻率區段; 時間和頻率區段。 4. 如申請專利範圍第2項及第3項所述之用於編碼一音訊 信號的方法,其中計算該至少一個信號整形因數包含以 下步驟: 比較該第二音訊信號的該等多個區段中的至少一 個區段的該至少一個能量差值與一臨界值;以及 根據該第二音訊信號的該等多個區段中的至少一 個區段的該至少一個能量差值與該臨界值之該比較的 結果,決定與該等多個區段中的該至少一個區段相關聯 33 200926148 的該信號整形因數的一值。 5. 如申請專利範圍第2項及第3項所述之用於編碼一音訊 信號的方法,其中決定至少一能量差值進一步包含以下 步驟: 分別對於該第一音訊信號的至少兩個連續區段以 及該第二音訊信號的至少兩個連續的相對應區段決定 至少兩個連續的能量差值。 6. 如申請專利範圍第5項所述之用於編碼一音訊信號的方 法,其中計算至少一個信號整形因數進一步包含以下步驟: 比較該至少兩個能量差值與一臨界值,以決定該第 二音訊信號的該等多個區段中的至少一個區段的該信 號整形因數。 7. 如申請專利範圍第2項至第6項所述之用於編碼一音訊 信號的方法,該方法進一步包含根據該第二音訊信的該 等多個區段中的每一區段的該信號整形因數產生一信 號整形因數控制信號。 8. 如申請專利範圍第2項至第6項所述之用於編碼一音訊 信號的方法,其中該能量差值根據來自該第一音訊信號 的至少一個區段的能量與來自該第二音訊信號的至少 一個區段的能量。 9. 如申請專利範圍第8項所述之用於編碼一音訊信號的方 法,其中該能量差值是該第一音訊信號的至少一個區段 的該能量與該第二音訊信號的至少一個區段的該能量 之比。 34 200926148 10. 如申請專利範圍第1項至第9項所述之用於編碼一音訊 信號的方法,其中該第一音訊信號是一未處理音訊信 號,以及其中該第二音訊信號是一合成音訊信號。 11. 如申請專利範圍第1項至第10項所述之用於編碼一音訊 信號的方法,其中該第一音訊信號和該第二音訊信號是 較高頻率音訊信號。 12. —種解碼一音訊信號的方法,其包含以下步驟:接收至少部分地包含一信號整形因數信號的一編 碼信號; 解碼該編碼信號以產生一合成音訊信號; 從該所接收的增益因數信號決定該合成信號的至 少一個信號整形因數;以及 將該至少一個信號整形因數施加到該合成音訊信號。 13. 如申請專利範圍第12項所述之解碼該音訊信號的方 法,其進一步包含以下步驟: 將該合成音訊信號分成多個區段。 14. 如申請專利範圍第13項所述之解碼該音訊信號的方 法,其中該區段是以下區段中的至少一者: 一時間區段; 一頻率區段; 一時間和頻率區段。 15. 如申請專利範圍第13項及第14項所述之解碼該音訊信 號的方法,其中該決定至少一個信號整形因數包含決定 該合成信號的該等多個區段中的每一區段的至少一個 35 200926148 信號整形因數。 16. 如申請專利範圍第13項至第15項所述之解碼該音訊信 號的方法,其中將該至少一個信號整形因數施加到該合 成音訊信號包含將該等多個區段中的每一區段的該至 少一個信號整形因數施加到該合成音訊信號。 17. 如申請專利範圍第12項至第16項所述之解碼該音訊信 號的方法,其中決定該至少一個信號整形因數函數包含 以下步驟: 從該信號整形因數信號解碼至少一個信號整形因數; 將該至少一個信號整形因數加入到先前的至少一 個信號整形因數的一軌跡;以及 用來自該信號整形因數軌跡的該至少一個先前的 信號整形因數内插該至少一個信號整形因數;以及用該 至少一個信號整形因數内插該先前的信號整形因數。 18. 如申請專利範圍第17項所述之解碼該音訊信號的方 法,其中該内插是一線性内插。 19. 如申請專利範圍第17項所述之解碼該音訊信號的方 法,其中該内插是一非線性内插。 20. —種用於編碼一音訊信號的編碼器,其包含: 受組配以從一第一音訊信號產生一第二音訊信號 的一第一編碼器一解碼器; 受組配以決定該第一音訊信號與該第二音訊信號 之間的至少一個能量差值的一信號比較器; 受組配以根據該至少一個能量差值計算至少一個 200926148 信號整形因數的一信號處理器。 21. 如申請專利範圍第20項所述之編碼器,其進一步包含受 組配以將該第一音訊信號分成多個區段的一信號分配器。 22. 如申請專利範圍第21項所述之編碼器,其中該等區段是 以下區段中的至少一者: 時間區段, 頻率區段; 時間和頻率區段。 23. 如申請專利範圍第21項及第22項所述之編碼器,其中該 信號處理器進一步受組配以: 比較該第二音訊信號的該等多個區段中的至少一 個區段的該至少一個能量差值與一臨界值;以及 根據該第二音訊信號的該等多個區段中的至少一 個區段的該至少一個能量差值與該臨界值之該比較的 結果,決定與該等多個區段中的該至少一個區段相關聯 的該信號整形因數的一值。 24. 如申請專利範圍第21項及第22項所述之編碼器,其中該 信號比較器受組配以:分別對於該第一音訊信號的至少 兩個連續區段以及該第二音訊信號的至少兩個連續的 相對應區段決定至少兩個連續的能量差值。 25. 如申請專利範圍第24項所述之編碼器,其中該信號處理 器進一步受組配以:比較該至少兩個能量差值與一臨界 值,以決定該第二音訊信號的該等多個區段中的至少一 個區段的該信號整形因數。 37 200926148 26. 如申請專利範圍第21項至第25項所述之編碼器,該信號 處理器進一步受組配以:根據該第二音訊信號的該等多 個區段中的每一區段的該信號整形因數產生一信號整 形因數控制信號。 27. 如申請專利範圍第21項至第25項所述之編碼器,其中該 能量差值根據來自該第一音訊信號的至少一個區段的 能量以及來自該第二音訊信號的至少一個區段的能量。 28. 如申請專利範圍第27項所述之編碼器,其中該能量差值 是該第一音訊信號的至少一個區段的該能量與該第二 音訊信號的至少一個區段的該能量之比。 29. 如申請專利範圍第20項至第28項所述之編碼器,其中該 第一音訊信號是一未處理音訊信號,以及其中該第二音 訊信號是一合成音訊信號。 30. 如申請專利範圍第20項至第29項所述之編碼器,其中該 第一音訊信號和該第二音訊信號是較高頻率音訊信號。 31. —種用於解碼一音訊信號的解碼器,其受組配以: 接收至少部分地包含一信號整形因數信號的一編 碼信號; 解碼該編碼信號以產生一合成音訊信號; 從該所接收的信號整形因數信號決定該合成信號 的至少一個信號整形因數;以及 將該至少一個信號整形因數施加到該合成音訊信號。 32. 如申請專利範圍第31項所述之解碼器,其進一步受組配 以將該合成音訊信號分成多個區段。 200926148 33_如申請專利範圍第32項所述之解碼器,其中該區段是以 下區段中的至少一者: * 時間區段, 一頻率區段; 一時間和頻率區段。 34. 如申請專利範圍第32項及第33項所述之解碼器,其中該 ' 解碼器受組配以透過決定該合成信號的該等多個區段 中的每一區段的至少一個信號整形因數決定該至少一 ® 健縣形因數。 35. 如申請專利範圍第32項至第34項所述之解碼器,其中該 解碼器受組配以透過將該等多個區段中的每一區段的 該至少一個信號整形因數施加到該合成音訊信號來將 該至少一個信號整形因數施加到該合成音訊信號。 36. 如申請專利範圍第31項至第35項所述之解碼器,其中該 解碼器受組配以透過以下步驟決定該至少一個信號整 形因數函數: - 從該信號整形因數信號解碼至少一個信號整形因數; _ 將該至少一個信號整形因數加入到先前的至少一 個信號整形因數的一軌跡;以及 用來自該信號整形因數軌跡的該至少一個先前的 信號整形因數内插該至少一個信號整形因數;以及用該 至少一個信號整形因數内插該先前的信號整形因數。 37. 如申請專利範圍第36項所述之解碼器,其中該内插是一 線性内插。 39 200926148 38. 如申請專利範圍第36項所述之解碼器,其中該内插是一 非線性内插。 39. —種包含如在申請專利範圍第20項至第30項中所述之 一編碼器的裝置。 40. —種包含如在申請專利範圍第31項至第38項中所述之 一解碼器的裝置。 41. 一種包含如在申請專利範圍第20項至第30項中所述之 一解碼器的電子裝置。42. —種包含如在申請專利範圍第31項至第38項中所述之 一解碼器的電子裝置。 4 3. —種受組配以執行編碼一音訊信號之一方法的電腦程 式產品,該方法包含以下步驟: 藉由一第一音訊信號的一第一編碼和解碼從該第 一音訊信號產生一第二音訊信號; 決定該第一音訊信號與該第二音訊信號之間的至 少一個能量差值;以及根據該至少一個能量差值計算至少一個信號整形 因數。 44. 一種受組配以執行解碼一音訊信號之一方法的電腦程 式產品,該方法包含以下步驟: 接收至少部分地包含一信號整形因數信號的一編 碼信號; 解碼該編碼信號以產生一合成音訊信號; 從該所接收的增益因數信號決定該合成信號的至 40 9 9200926148 少一個信號整形因數;以及 將該至少一個信號整形因數施加到該合成音訊信號。 45. —種用於編碼一音訊信號的編碼器,其包含: 用於從一第一音訊信號產生一第二音訊信號的編 碼解碼器裝置; 受組配以決定該第一音訊信號與該第二音訊信號 之間的至少一個能量差值的第一信號處理裝置; 受組配以根據該至少一個能量差值計算至少一個 信號整形因數的第二信號處理裝置。 46. —種用於解碼一音訊信號的解碼器,其包含: 用於接收至少部分地包含一信號整形因數信號之 一編碼信號的接收裝置; 用於解碼該編碼信號以產生一合成音訊信號的解 碼裝置; 用於從該所接收的信號整形因數信號決定該合成 信號的至少一個信號整形因數的第一信號處理裝置;以及 用於將該至少一個信號整形因數施加到該合成音 訊信號的第二信號處理裝置。 41
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2007/061916 WO2009059632A1 (en) | 2007-11-06 | 2007-11-06 | An encoder |
Publications (1)
Publication Number | Publication Date |
---|---|
TW200926148A true TW200926148A (en) | 2009-06-16 |
Family
ID=39539624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW097142672A TW200926148A (en) | 2007-11-06 | 2008-11-05 | An encoder |
Country Status (4)
Country | Link |
---|---|
US (1) | US20100250260A1 (zh) |
EP (1) | EP2227682A1 (zh) |
TW (1) | TW200926148A (zh) |
WO (1) | WO2009059632A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI484482B (zh) * | 2010-04-13 | 2015-05-11 | Sony Corp | Signal processing apparatus and method, coding apparatus and method, decoding apparatus and method, and signal processing program |
TWI820123B (zh) * | 2018-04-25 | 2023-11-01 | 瑞典商都比國際公司 | 具有減少後處理延遲之高頻重建技術之整合 |
TWI820333B (zh) * | 2019-06-10 | 2023-11-01 | 瑞典商安訊士有限公司 | 方法,電腦程式,編碼器和監控裝置 |
US11810590B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US8924220B2 (en) * | 2009-10-20 | 2014-12-30 | Lenovo Innovations Limited (Hong Kong) | Multiband compressor |
BR112013016350A2 (pt) * | 2011-02-09 | 2018-06-19 | Ericsson Telefon Ab L M | codificação/decodificação eficaz de sinais de áudio |
CN103280222B (zh) * | 2013-06-03 | 2014-08-06 | 腾讯科技(深圳)有限公司 | 音频编码、解码方法及其系统 |
CN107967921B (zh) * | 2017-12-04 | 2021-09-07 | 苏州科达科技股份有限公司 | 会议系统的音量调节方法及装置 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5144671A (en) * | 1990-03-15 | 1992-09-01 | Gte Laboratories Incorporated | Method for reducing the search complexity in analysis-by-synthesis coding |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
SE504397C2 (sv) * | 1995-05-03 | 1997-01-27 | Ericsson Telefon Ab L M | Metod för förstärkningskvantisering vid linjärprediktiv talkodning med kodboksexcitering |
US5797121A (en) * | 1995-12-26 | 1998-08-18 | Motorola, Inc. | Method and apparatus for implementing vector quantization of speech parameters |
US5825320A (en) * | 1996-03-19 | 1998-10-20 | Sony Corporation | Gain control method for audio encoding device |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
FI106325B (fi) * | 1998-11-12 | 2001-01-15 | Nokia Networks Oy | Menetelmä ja laite tehonsäädön ohjaamiseksi |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
EP1527442B1 (en) * | 2002-08-01 | 2006-04-05 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and audio decoding method based on spectral band replication |
FI118550B (fi) * | 2003-07-14 | 2007-12-14 | Nokia Corp | Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä |
JP4741476B2 (ja) * | 2004-04-23 | 2011-08-03 | パナソニック株式会社 | 符号化装置 |
EP1939862B1 (en) * | 2004-05-19 | 2016-10-05 | Panasonic Intellectual Property Corporation of America | Encoding device, decoding device, and method thereof |
US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
BRPI0607646B1 (pt) * | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
PL1875463T3 (pl) * | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
KR100803205B1 (ko) * | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
WO2007052088A1 (en) * | 2005-11-04 | 2007-05-10 | Nokia Corporation | Audio compression |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
WO2008045846A1 (en) * | 2006-10-10 | 2008-04-17 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
DE102006050068B4 (de) * | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
JPWO2008053970A1 (ja) * | 2006-11-02 | 2010-02-25 | パナソニック株式会社 | 音声符号化装置、音声復号化装置、およびこれらの方法 |
US20100280830A1 (en) * | 2007-03-16 | 2010-11-04 | Nokia Corporation | Decoder |
WO2009059633A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
KR101712101B1 (ko) * | 2010-01-28 | 2017-03-03 | 삼성전자 주식회사 | 신호 처리 방법 및 장치 |
US8000968B1 (en) * | 2011-04-26 | 2011-08-16 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
-
2007
- 2007-11-06 US US12/741,508 patent/US20100250260A1/en not_active Abandoned
- 2007-11-06 EP EP07847112A patent/EP2227682A1/en not_active Withdrawn
- 2007-11-06 WO PCT/EP2007/061916 patent/WO2009059632A1/en active Application Filing
-
2008
- 2008-11-05 TW TW097142672A patent/TW200926148A/zh unknown
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI484482B (zh) * | 2010-04-13 | 2015-05-11 | Sony Corp | Signal processing apparatus and method, coding apparatus and method, decoding apparatus and method, and signal processing program |
US11810592B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11810590B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11810591B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11810589B2 (en) | 2018-04-25 | 2023-11-07 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
TWI820123B (zh) * | 2018-04-25 | 2023-11-01 | 瑞典商都比國際公司 | 具有減少後處理延遲之高頻重建技術之整合 |
US11823695B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11823694B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11823696B2 (en) | 2018-04-25 | 2023-11-21 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11830509B2 (en) | 2018-04-25 | 2023-11-28 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
US11862185B2 (en) | 2018-04-25 | 2024-01-02 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
US11908486B2 (en) | 2018-04-25 | 2024-02-20 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
TWI820333B (zh) * | 2019-06-10 | 2023-11-01 | 瑞典商安訊士有限公司 | 方法,電腦程式,編碼器和監控裝置 |
Also Published As
Publication number | Publication date |
---|---|
EP2227682A1 (en) | 2010-09-15 |
US20100250260A1 (en) | 2010-09-30 |
WO2009059632A1 (en) | 2009-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9812136B2 (en) | Audio processing system | |
TWI324335B (en) | Methods of signal processing and apparatus for wideband speech coding | |
TW200926148A (en) | An encoder | |
JP4220461B2 (ja) | 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置 | |
CN110310659B (zh) | 用重构频带能量信息值解码或编码音频信号的设备及方法 | |
JP5859504B2 (ja) | 合成フィルターバンク、フィルタリング方法及びコンピュータプログラム | |
RU2236046C2 (ru) | Эффективное кодирование огибающей спектра с использованием переменного разрешения по времени и по частоте и переключения время/частота | |
KR101120911B1 (ko) | 음성신호 복호화 장치 및 음성신호 부호화 장치 | |
TWI317933B (en) | Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same | |
Ragot et al. | Itu-t g. 729.1: An 8-32 kbit/s scalable coder interoperable with g. 729 for wideband telephony and voice over ip | |
JP6381727B2 (ja) | 高調波転換 | |
JP5752134B2 (ja) | 最適化された低スループットパラメトリック符号化/復号化 | |
TW201214419A (en) | Systems, methods, apparatus, and computer program products for wideband speech coding | |
US20100292994A1 (en) | method and an apparatus for processing an audio signal | |
US20120134511A1 (en) | Multichannel audio coder and decoder | |
TW201207842A (en) | Apparatus and method for processing an input audio signal using cascaded filterbanks | |
TW201207840A (en) | Band enhancement method, band enhancement apparatus, program, integrated circuit and audio decoder apparatus | |
JP2012514224A (ja) | ピーク検出に基づく選択的スケーリングマスク計算 | |
US9230551B2 (en) | Audio encoder or decoder apparatus | |
TWI785753B (zh) | 多聲道信號產生器、多聲道信號產生方法及電腦程式 | |
JP6654236B2 (ja) | オーディオ変換コーディングにおけるオーバーラップ率の信号適応スイッチングのための符号化器、復号器および方法 | |
CN110249385B (zh) | 多信道解码 | |
JP2006072269A (ja) | 音声符号化装置、通信端末装置、基地局装置および音声符号化方法 |