TWI288915B - Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components - Google Patents

Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components Download PDF

Info

Publication number
TWI288915B
TWI288915B TW092112969A TW92112969A TWI288915B TW I288915 B TWI288915 B TW I288915B TW 092112969 A TW092112969 A TW 092112969A TW 92112969 A TW92112969 A TW 92112969A TW I288915 B TWI288915 B TW I288915B
Authority
TW
Taiwan
Prior art keywords
sub
components
band signal
synthesized
band
Prior art date
Application number
TW092112969A
Other languages
English (en)
Other versions
TW200400487A (en
Inventor
Grant Allen Davidson
Michael Mead Truman
Matthew Conrad Fellers
Mark Stuart Vinton
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/174,493 external-priority patent/US7447631B2/en
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of TW200400487A publication Critical patent/TW200400487A/zh
Application granted granted Critical
Publication of TWI288915B publication Critical patent/TWI288915B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

1288915 玖、發明說明: 【發明所屬《^技術領域2 發明領域 概略言之本發明係有關音頻編碼系統,更特別係有關 5 改良得自音頻編碼系統之音頻信號之接收品質。 t先前技術】 發明背景 音頻編碼系統用於將音頻信號編碼成為適合傳輸或儲 存的已編碼信號,隨後接收或取還該已編碼信號,且將其 10 解碼而獲得供回放用之原先音頻信號版本。知覺音頻編碼 系統嘗試將音頻信號編碼成為已編碼信號,該已編碼信號 具有比原先音頻信號更低的資訊容量需求,接著解碼已編 碼信號而提供一輸出信號,該輸出信號於知覺上無法與原 先之音頻信號區別。知覺音頻編碼系統之一例述於近接電 15 視系統委員會(ATSC)A/52A文件,名稱「修訂類比至數位 音頻壓縮(AC-3)標準」,2001年8月20日公開,稱作為杜比 數位。另一例述於Bosi等人,「ISO/IEC MPEG-2近接音頻編 碼」J_ AES,第45卷,第10期,1997年10月,789-814頁, 該項標準稱作為近接音頻編碼(AAC)。此二編碼系統以及多 20種其它知覺編碼系統中,分頻發射器將分析濾波器排組應 用於音頻信號來獲得排列成組或排列成頻帶之頻譜成分, 且根據心理聲學原理來產生已編碼信號。頻寬典型各異, 頻寬通常係匹配所謂人類聽覺系統臨界頻帶之頻寬。互補 分頻接收器接收且解碼已編碼信號來恢復頻譜成分,且應 1288915 形之前,去除或減少振幅的快速改變。接收器逆轉應用合 成轉形後之修改影響。不幸此項技術混淆輸入信號之真正 頻譜特性,因而造成有效知覺編碼需要的資訊失真,另一 項原因為發射器必須使用部分發射的信號來傳輸參數,而 5 接收器需要逆轉該項修改的影響。 第三種技術稱作時間雜訊成形技術,發射器應用預測 濾波器至得自分析濾波器排組之頻譜成分,傳輸預測錯誤 以及預測濾波器係數於被發射的信號,接收器應用反相預 測濾波器於該預測錯誤,俾回復頻譜成分。此項技術由於 10需要額外作業管理資訊來傳輸預測濾波器信號,故用於低 位元速率系統不合所需。 【發明内容3 發明概要 本發明之目的係提供可用於低位元速率音頻編碼系統 15來改良此種系統產生之音頻信號之知覺品質之技術。 根據本發明,已編碼音頻資訊之處理方式係經由接收 已編碼音頻資訊,獲得可表示部分但非全部音頻信號之頻 譜内容的子頻帶信號,檢查該子頻帶信號來獲得音頻信號 特性,產生合成頻譜成分其具有音頻信號特性,將合成頻 20譜成分與子頻帶信號積分而產生一組經修改之子頻帶信號 ,以及經由應用合成渡波器排組至經修改之子頻帶信號集 合來產生該音頻資訊。 本發明之各項特色以及較佳具體實施例經由參照後文 詳細說明及附圖將更為了解。後文討論内容及附圖僅供舉 1288915 仏兒月之用,;歸解絕非表示限制本發明之範圍。 圖式簡單說明 第1圖為於音頻編碼系統之發射器之示意方塊圖。 第2圖為於音頻編瑪系統之接收器之示意方塊圖。 5 10 15 第3圖為可用於貫作本發明之各方面之裝置之示意方塊圖。 【實施方式】 較佳實施例之詳細說明 A·綜論 本發明之各方面結合於多種信號處理方法及裝置包括 =如第认2圖所示之信號處理裝置。某些方面可只於接收 处里進行。而其匕方面則要求接收器與發射器進行協力 處理。可用於進行本發明之各方面之方法將於後文之用於 執行此等方法之典型裝置綜論之後說明。 第1圖為顯示分頻音頻發射器之實作,其中分析濾波器 触12由路#11接收総音頻㈣之音頻資訊,回應於此 =可表示音頻信號頻譜成分之頻率子頻帶信^各子頻 帶信號送至編碼n14,編碼器14產生子頻帶信號之編竭呈 現’且將該編碼呈現送至格式化器16。格式化㈣將該編 碼呈現组譯成為適合供傳輸或儲存的輸出信號, 肋而送出輸出信號。 、#路 碼器 第2圖顯示分頻音頻接收器之實作,其中解格式化器u 由路徑21接收—輸人信號,該輸人信號傳輪表示—音頻信 號頻譜成分的頻率子頻帶信號之編碼呈現。解格式化器2°2 由輸入信號獲得該編碼呈現,且將該編碼呈現送至解 20 1288915 24。解碼器24將編碼呈現解碼成為頻率子頻帶作號。分析 器25檢驗子頻帶信號獲得該子頻帶信號所呈現之音頻信號 之一或多項特性。特性之指示送至成分合成器26,成分合 成器26使用適合回應於该專特性之方法而產生合成頻譜成 5分。積分器27經由積分解碼器24提供的子頻帶信號與成分 合成恭26產生的合成頻譜成分而產生一組經修改的子頻帶 信號。回應於該組經修改之子頻帶信號,合成濾波器排組 28順著路徑29產生可表示音頻信號之音頻資訊。於該圖所 示之特定實作,分析器25以及成分合成器26皆未調整適合 10回應於藉解格式化器22而得自輸入信號之任何控制資訊作 處理。其它實作中,分析器25及/或成分合成器26可回應於 得自輸入信號之控制資訊。 第1及2圖所示裝置顯示三種頻率子頻帶之濾波器排組 。更多子頻帶用於典型實作,但其中只顯示三個子頻帶以 15求清晰。本發明並未對任何特定數目作特殊限制。 分析及合成濾波器排組大致上可藉任一種區塊轉形實 作,忒等區塊轉形包括離散富立葉轉形或離散餘弦轉形 (DCT)。於一種具有類似前文討論之發射器及接收器之音頻 、、為碼糸、、先刀析濾波器排組12及合成遽波器排組28係藉經 20過修改之1301實作,該經修改之DCT稱作為時間領域代號 抵消(TDAC)轉形,該TDAC轉形說明於princen等人,「使用 基於%間領域代號抵消之濾波器排組設計之子頻帶/轉形 編碼」’ ICASSP 1987會議議事錄,1987年5月,2161-64頁。 藉區塊轉形實作之分析濾波器排組將一區塊或一輸入 1288915 專、成為一組轉形係數,該組 號間隔之頻譜内容。係數表不該信 定頻率伟〜4S 夕舰鄰轉形係數表示於特 疋紫旱子頻π之頻譜内容,'特 之係數數目相稱。「子頻帶信號」頻寬與該組 鄰轉形係數,「贿成分」1表轉或多舰 本揭示文使用之「編碼器」及「 處理裝置及方法1等資料〜壯、’ ‘",」4詞表示資料 貝枓處理裝置及方 編碼之資訊呈現-音頻信號,而該編碼 2來以經過 10 15 20 求比音頻信號本身之資訊容量需求貝「°之身訊容量需 解碼」等詞表示可用來由編碼呈現;恢復f111」以及「 處理裝置及方法。有關減少資訊容量需2頻^之肓訊 美前述杜比數位標準以及AAC編碼標準 的編碼。本發未對編碼續觸型作特殊 B·接收器 本發明之各方面可於接收器進行,接收器無需任何得 自發射器之特殊處理或資訊。首先說明此等方面。 1·信號特性分析 本發明可用於以極低位元速率編碼信號來呈現音頻信 號之編碼系統。於極低位元速率系統m訊典型傳輸 子頻帶信號’其只表示該音頻信號之部分頻譜成分。分析 器25檢驗子頻帶信號,獲得一或多種該子頻帶信號所呈現 之音頻信號部分特性。-或多項特性的呈現送至成分合成 器26,且用來調積分成頻譜成分的生成。若干有用之特性 範例說明如後。 、 12 1288915 a) 振幅 多個編碼系統產生之編碼資訊呈現頻譜成分,該等頻 譜成分已經被量化至某種預定位元長度或量化解析度。具 有幅度小於量化成分之最低有效位元(LSB)呈現之位準,該 5 種小頻譜成分可由編碼貧訊刪除’或另外以某種形式呈現 ,該形式指示量化值為零或被視為零。對應於可藉編碼資 訊傳輸之量化頻譜成分之LSB之位準可視為小頻譜成分(由 編碼資訊中刪除之小頻譜成分)之幅度。 成为合成器26使用此種位準來限制合成用來替代遺失 10 頻譜成分之任一種成分振幅。 b) 頻譜形狀 藉編碼資訊傳輸之子頻帶信號之頻譜形狀可即刻得自 子頻帶信號本身;但其它環繞頻譜形狀之資訊也可經由應 用濾波益至頻率領域之子頻帶信號而導出。渡波器可為預 15測滤波器、低通渡波器、或大致上任何其它類型滿意的渡 波器。 " 頻譜形狀或濾、波器輸出之指示視需要而送至成分合成 器26。若有所需,也需傳送濾波器使用的指示。 c) 遮蓋 20彳應用知覺模式來估計子頻帶信號之頻譜成分之心理 聲學遮蓋效應。由於此種遮蓋效應係因頻率而異,故由— 種頻率之第-頻言普成分提供的遮蓋不一定對由另—頻率之 第二頻譜成分所提供的遮蓋效應相等遮蓋程度,即使第— 與第二頻譜成分有相等幅度亦如此。 13 1288915 估計遮蓋效應之指示送至成分合成器26,該指示控制 頻譜成分的合成,故合成後成分之估計遮蓋效應與子頻帶 信號之頻譜成分之估計遮蓋效應間具有滿意的關聯關係。 d)音調 5 子頻帶信號之音調可以多種方式評估,包括計算頻譜 平坦度測量值,頻譜平坦度測量值為子頻帶信號樣本之算 術平均除以子頻帶樣本之幾何平均之經過規度化的商數。 音調也可經由分析子頻帶信號之頻譜成分之排列或分布加 以評估。例如若數個大型頻譜成分係藉遠更小成分之長間 1〇隔隔開,則子頻帶信號可視為音調較高而非雜訊。又另一 項評估音調之方式係應用預測濾波器至子頻帶信號來決定 預測增盈。預測增益值較大,指示信號的音調較高。 音調之指示送至成分合成器26,成分合成H26控制合 成,故合成頻譜成分具有適當音調位準。其進行方式係形 成曰-周狀頻邊成分與雜訊狀合成成分之加權組合來達成 定音調位準。 e)時間形狀 子頻帶信號呈現之信號之時間形狀可由子頻帶作號直 20 接估計。日相綠料k實叙技減礎將以方程H 不之線性系統解說。 又 y(t)-h(t) · x(t) 此處y(t)=具有欲估計之時間形狀之信號; hO信號y(t)之時間形狀; 點號(·)表示乘法;以及 14 1288915 X(t)=信號y(t)之時間平坦版本。 本方程式可改寫為: Y[k]=H[k]*X[k] (2) 此處Y[k]=信號y(t)之頻率領域呈現; 5 H[k]=h⑴之頻率領域呈現; 星號(*)表示迴旋;以及 X[k]=信號X⑴之頻率領域呈現。 頻率領域呈現Y[k]係對應於藉解碼器24所得之〜或多 子頻帶信號。分析器25經由解出一組由Y[k]及x[k]之自我 10迴歸移動平均(ARMA)模式導出之該組方程式,獲得頰率領 域主現H[k]之時間形狀h(t)之估值。有關使用ARMA模式之 額外資訊可得自Proakis及Man〇lakis,「數位信號處理:原 理、演繹法則與應用」,麥克米蘭出版公司,紐約,198_ 。特別參考第818-821頁。 15 鮮領域呈現Y[k]制於轉形係數區塊。各區塊轉形 係數表示信號y⑴之短時間頻譜。頻率領域呈現x[k]也排列 成區塊。於頻率領域呈現X[k]之各係數區塊呈現時間平坦 信號樣本X⑴區塊,信號X⑴就廣義而言被推定為穩定。也 假設於X[k]呈現之各區塊係數係獨立分佈。藉由此等假設 20 ,信號可藉ARMA模式表示如下: Y[X] -1] = YbqX\_k ^ q] /=1 q=0 (3) 此處L=ARMA模式之自我迴歸部分長度;以及 Q=ARMA模式移動平均部分長度。 15 1288915 經由解出Y[k]之自我交互關聯,方程式3可解出a及b: 五{ ·取-m]} = -珥揪-1]·取-m]} + |6河雄〜仆取―叫}⑷ 此處E{}表示預測值函數。 方程式4可改寫為:
L Q 5
Ryy \ni\ = u}Ryy [m ~ 1] + ^ ^αΚχγ \pt — (5、 /=1 (7=0 V ’ 此處Ryy[h]表不Y[n]之自我關聯關係;以及 RxY[k]表示Y[k]與X[k]間之交互關聯。 若進一步假設H[k]呈現的線性系統只有自我迴歸,則 方程式5右側第二項可忽略。則方程式5可改寫為:
L 10 [/w] = CtyRyY \pi — 1J Π1〉0 //Γ\ 表示一組L線性方程式,該組L線性方程式可經解出而 獲得L係數七。 使用本說明今日可獲得使用頻率領域技術之時間形狀 估計器之實作範例。本實作中,時間形狀估計器接收一或 15多個子頻帶信號y⑴之頻率領域呈現Y[k],且對-Lgmg:L 求出自我修正順序RYY[m]。此等值用來建立一組線性方程 式,該組方程式經解出而獲得係數士,其表示如下方程式7 顯示之線性全磁極濾波器FRi磁極。 20 濾、波器可應用至任意時間平坦信號(例如雜訊狀信號) 16 1288915 之頻率領域呈現來獲得時間平坦信號版本之頻率領域呈現 ,該版本中時間平坦信號具有時間形狀實質等於信號y(t) 之時間形狀。 濾波器FR之磁極描述可送至成分合成器26,成分合成 5器26使用該濾波器來產生合成頻譜成分呈現具有預定時間 形狀之信號。 2. 合成成分之產生 成分合成器26可以多種方式產生合成頻譜成分。其中 兩種方式說明如後。可使用多種不同方式。例如可回應於 10 由子頻帶"is號導出之特性或呈頻率之函數而選用不同方式。 第一方式產生雜訊狀信號。例如多種時間-領域技術及 頻率領域技術中之大致任一項技術皆可用來產生雜訊狀信 號。 第二種方式使用稱作頻譜平移或頻譜複製之頻率領域 I5 技術,該項技術由一或多頻率子頻帶拷貝頻譜成分。較低 頻率頻譜成分通常拷貝至較高頻率頻譜成分,原因在於較 高頻率成分經常以某種方式而與較低頻率成分相關。但原 則上頻譜成分可拷貝至較高頻或較低頻。若有所需雜訊可 增加或攙混經平移之成分,振幅可視需要修正。較佳係視 2〇需要调整來消除或至少減少合成成分相位之非連續性。 頻譜成分之合成係由接收自分析器25之資訊控制,故 合成成分有一或多項得自子頻帶信號之特性。 3. 信號成分之積分 合成頻譜成分可以多種方式與子頻帶信號頻譜成分積 17 1288915 分。其中一種方式係使用合成成分為繫繩形式,組合個別 合成成分以及表示對應頻率之子頻帶成分而積分。另一種 方式係以一或多個合成成分取代存在於子頻帶信號之選定 的頻譜成分。又另一種方式係將合成成分與子頻帶信號成 5分合併來表示未存在於子頻帶信號之頻譜成分。此等及其 它方式可以多種不同組合使用。 c.發射器 前文說明之本發明之各方面可於接收器進行,無需發 射器來提供任何控制資訊,該控制資訊係超出本發明之特 10色之外當接收器接收及解碼子頻帶信號時所需的控制資訊 。若提供額外控制資訊則可提升本發明之此等方面。一範 例討論如後。 時間成形應用於合成成分之程度可藉編碼資訊中提供 的控制資訊調整。其中一種方式係透過使用參數点,如下 15 方程式所示。 ⑷=—ri- 對0$ 召 $ 1 當/5=0時,濾波器未提供時間成形。當時滤、皮器 提供一種時間成形程度,讓合成成分之時間形狀與^頻= h號之時間形狀間之交互關係最大化。其它石值提供中 2〇 時間成形程度。 θ 一實作中,發射器提供控制資訊,允許接收器將^設定 為八個值之一。 發射器可提供其它控制資訊,接收器使用該控制資訊 18 1288915 以任一種預定方式調整成分合成過程。 D.實作 本發明之各方面可以多種不同方式實作,包括於通用 用途電腦系統之軟體,或於若干其它裝置,該裝置包括更 5為特化之組成元件例如數位信號處理器(DSP)電路耦合至 類似通用用途電腦系統之組成元件。第3圖為可用於發射器 或接收器實作本發明之各方面之裝置7〇之方塊圖。Dsp 72 提供運异貧源。RAM 73為DSP 72用於信號處理之系統隨機 存取記憶體(RAM)。ROM 74表示某種形式之持久性儲存裝 10置(例如唯讀記憶體(R0M))供儲存操作裝置70所需程式,以 及進行本發明之各方面。1/〇控制裝置75表示透過通訊頻道 % ' 77接&及發射信號之介面電路。類比/數位轉器器以及 數位/類比轉換器可視需要含括於1/〇控制裝置乃,來接收及 /或發射類比音頻信號。所示具體實施例中,全部主要系統 15組成元件皆係連結至匯流排71,匯流排71表示多於一個實 體匯流排;但匯流排架構並非實作本發明所需。 、 於通用用途電腦系統實作之具體實施例^,可含括額 外組成元件供與裝置(例如鍵盤或滑鼠及顯示裝置)介面,以 及控制具有儲存媒體(例如磁帶或磁碟)或光學媒體之儲存 袭置。該儲存裝置可用於記錄系統、設備及應用程式操作 之指令程式’包括實作本發明各方面之程式之具體實施例。 —實施本發明之各方面所需功能可藉可以多種不同方式 貫作之組成元件執行’該等元件包括個別分開之邏輯組成 元件-或多個ASICs及/或程式控制處理器。此等組成元件 19 1288915 之貫作方式於本發明並無特殊限制。 本發明之軟體實作可藉多種機械可讀取媒體(例遍及 頻4包括由超音波至紫外光頻率之基頻或經調變之通訊路 徑)、或儲存媒體傳輸,該儲存媒體包括可使用大致上任_ 5種磁性或光性記錄技術而傳輸資訊之儲存媒體,包括磁 贡、磁碟及光碟。本發明之各方面也可於電腦系統70之各 組成元件藉處理電路實作,處理電路例如為ASICs、通用用 途積體電路、經由以ROM或RAM之各種形式具體實施之程 式控制之微處理器以及其它技術實施。 1〇【圖式簡單說明】 第1圖為於音頻編碼系統之發射器之示意方塊圖。 第2圖為於音頻編碼系統之接收器之示意方塊圖。 第3圖為可用於實作本發明之各方面之裝置之示意方塊圖。 【圖式之主要元件代表符號表】 11…路徑 27···積分器 12 ···分析濾波器排組 28···合成濾波器排組 14...編碼器 29...路徑 16···格式化器 70...電腦系統 17…路徑 71...匯流排 21…路徑 72...DSP,數位信號處理器 22...解格式化器 73...RAM,隨機存取記憶體 24...解碼器 74 …ROM 25…分析器 75…I/O控制裝置 26...成分合成器 76,77···通訊通道 20

Claims (1)

  1. 拾、申請專利範圍: 第92112969號申請案申請專利範圍修正本 96. 06. 15. 1. 一種用以處理已編碼音頻資訊之方法,其中該方法包含 下列步驟: 5 接收已編碼音頻資訊,獲得可表示部分但非全部音 頻信號之頻譜内容的子頻帶信號; 檢查該子頻帶信號來獲得音頻信號特性,其中該特 性係選自心理聲學遮蓋效應、音調及/或時間形狀之集 合中之任一者; 1〇 產生合成頻譜成分其具有音頻信號特性; 將合成頻譜成分與子頻帶信號積分而產生一組經 修改之子頻帶信號;以及 經由應用合成濾波器排組至經修改之子頻帶信號 集合來產生該音頻資訊。 15 2.如申請專利範圍第1項之方法,其中該特性為時間形狀 ;以及該方法係經由生成頻譜成分以及使用時間形狀之 頻率-領域呈現迴旋生成頻譜成分因而產生具有時間形 狀之經合成之頻譜成分。 3. 如申請專利範圍第2項之方法,其係經由計算子頻帶信 20 號之至少若干成分的自我交互關聯函數而獲得該時間 形狀。 4. 如申請專利範圍第1項之方法,其中該特性為時間形狀 ;以及該方法係經由生成頻譜成分以及應用濾波器至至 少部分生成的頻譜成分而生成經合成之頻譜成分。 21 1288915 •如申請專利範圍第4項之方法,其係由已編碼資訊獲得 控制資訊,且回應於該控制資訊而調適該濾波器。 6·如申請專利範圍第1、2、3、4或5項之方法,其係經由 合併合成之頻譜成分與子頻帶成分而生成經修改之子 頻帶信號集合。 7·如申請專利範圍第1、2、3、4或5項之方法,其係經由 組合經合成之頻譜成分與子頻帶之個別成分而生成該 經修改之子頻帶信號集合。 8·如申請專利範圍第丨、2、3、4或5項之方法,其係經由 以合成之頻譜成分取代子頻帶之個別成分而生成經修 改之子頻帶信號。 15 20 9·如申請專利範圍第1、2、3、4或5項之方法,其中: 係絚由檢查於頻譜第一部分之一或多個子頻帶信 號成分而獲得該音頻信號特性;以及 生成經合成之頻譜成分,採用之生成方式係經由拷 貝於部分之_或多個子頻帶信號成分至該 頻譜第二部分’俾形成合成之子解信號,以及修改拷 貝成分,讓合成之子頻帶信號具有該音頻信號特性。 ).:種:由一襄置讀取並載有指令程式之媒體,該指令程 式可由該裝置執行俾進行一種處 七^ ^ 已編碼音頻資訊之 方法,/、中该方法包含執行下列動作 m 令步驟·· 接收已編碼音頻資訊,獲得可表八i 頻信號之頻譜内容的子頻帶信號;分但非全部音 檢查該子頻帶信號來獲得音頻信 10 就特性, 其中该特 22 1288915 性係選自心理聲學遮蓋效應、音調及/或時間形狀之集 合中之任一者; 產生合成頻譜成分其具有音頻信號特性; 將合成頻譜成分與子頻帶信號積分而產生一組經 5 修改之子頻帶信號;以及 經由應用合成濾波器排組至經修改之子頻帶信號 集合來產生該音頻資訊。 11. 如申請專利範圍第10項之媒體,其中該特性為時間形狀 ;以及該方法係經由生成頻譜成分以及使用時間形狀之 10 頻率-領域呈現迴旋生成頻譜成分因而產生具有時間形 狀之經合成之頻譜成分。 12. 如申請專利範圍第11項之媒體,其中該方法係經由計算 子頻帶信號之至少若干成分的自我交互關聯函數而獲 得該時間形狀。 15 13.如申請專利範圍第10項之媒體,其中該特性為時間形狀 ;以及該方法係經由生成頻譜成分以及應用濾波器至至 少部分生成的頻譜成分而生成經合成之頻譜成分。 14. 如申請專利範圍第13項之媒體,其中該方法係由已編碼 資訊獲得控制資訊,且回應於該控制資訊而調適該濾波 20 器。 15. 如申請專利範圍第10、11、12、13或14項之媒體,其中 該方法係經由合併合成之頻譜成分與子頻帶成分而生 成經修改之子頻帶信號集合。 16. 如申請專利範圍第10、11、12、13或14項之媒體,其中 23 1288915 該方法係經由組合經合成之頻譜成分與子頻帶之個別 成分而生成該經修改之子頻帶信號集合。 17. 如申請專利範圍第10、11、12、13或14項之媒體,其中 該方法係經由以合成之頻譜成分取代子頻帶之個別成 5 分而生成經修改之子頻帶信號。 18. 如申請專利範圍第10、11、12、13或14項之媒體,其中 該方法: 係經由檢查於頻譜第一部分之一或多個子頻帶信 號成分而獲得該音頻信號特性;以及 10 生成經合成之頻譜成分’採用之生成方式係經由拷貝於該 頻譜第一部分之一或多個子頻帶信號成分至該頻譜第二部 分,俾形成合成之子頻帶信號,以及修改拷貝成分,讓合 成之子頻帶信號具有該音頻信號特性。 19. 一種用以處理已編碼音頻資訊之裝置,其中該裝置包含 15 ·· 一輸入終端,其接收該已編碼之音頻資訊; 記憶體;以及 處理電路,其係耦合至該輸入終端及該記憶體; 其中該處理電路經調整而適合用於: 20 接收已編碼音頻資訊,獲得可表示部分但非全部音 頻信號之頻譜内容的子頻帶信號; 檢查該子頻帶信號來獲得音頻信號特性,其中該特 性係選自心理聲學遮蓋效應、音調及/或時間形狀之集 合中之任一者; 24 1288915 產生合成頻譜成分其具有音頻信號特性; 將合成頻譜成分與子頻帶信號積分而產生一組經 修改之子頻帶信號;以及 經由應用合成濾波器排組至經修改之子頻帶信號 5 集合來產生該音頻資訊。 20.如申請專利範圍第19項之裝置,其中該特性為時間形狀 ;以及該處理電路經調整而適合經由生成頻譜成分以及 使用時間形狀之頻率-領域呈現迴旋生成頻譜成分因而 產生具有時間形狀之經合成之頻譜成分。 10 21.如申請專利範圍第20項之裝置,其中該處理電路經調整 而適合經由計算子頻帶信號之至少若干成分的自我交 互關聯函數而獲得該時間形狀。 22. 如申請專利範圍第19項之裝置,其中該特性為時間形狀 ;以及該處理電路經調整而適合經由生成頻譜成分以及 15 應用濾波器至至少部分生成的頻譜成分而生成經合成 之頻譜成分。 23. 如申請專利範圍第22項之裝置,其中該處理電路經調整 而適合由已編碼資訊獲得控制資訊,且回應於該控制資 訊而調適該濾波器。 20 24.如申請專利範圍第19、20、21、22或23項之裝置,其中 該處理電路經調整而適合經由合併合成之頻譜成分與 子頻帶成分而生成經修改之子頻帶信號集合。 25.如申請專利範圍第19、20、21、22或23項之裝置,其中 該處理電路經調整而適合經由組合經合成之頻譜成分 25 1288915 與子頻帶之個別成分而生成該經修改之子頻帶信號集 合。 26. 如申請專利範圍第19、20、21、22或23項之裝置,其中 該處理電路經調整而適合經由以合成之頻譜成分取代 5 子頻帶之個別成分而生成經修改之子頻帶信號。 27. 如申請專利範圍第19、20、21、22或23項之裝置,其中 該處理電路經調整而適合: 經由檢查於頻譜第一部分之一或多個子頻帶信號 成分而獲得該音頻信號特性;以及 10 生成經合成之頻譜成分,採用之生成方式係經由拷 貝於該頻譜第一部分之一或多個子頻帶信號成分至該 頻譜第二部分,俾形成合成之子頻帶信號,以及修改拷 貝成分,讓合成之子頻帶信號具有該音頻信號特性。 26
TW092112969A 2002-06-17 2003-05-13 Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components TWI288915B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/174,493 US7447631B2 (en) 2002-06-17 2002-06-17 Audio coding system using spectral hole filling
US10/238,047 US7337118B2 (en) 2002-06-17 2002-09-06 Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components

Publications (2)

Publication Number Publication Date
TW200400487A TW200400487A (en) 2004-01-01
TWI288915B true TWI288915B (en) 2007-10-21

Family

ID=29738991

Family Applications (1)

Application Number Title Priority Date Filing Date
TW092112969A TWI288915B (en) 2002-06-17 2003-05-13 Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components

Country Status (10)

Country Link
US (1) US20080140405A1 (zh)
EP (1) EP1514263B1 (zh)
JP (1) JP2005530206A (zh)
CN (1) CN1310210C (zh)
AU (1) AU2003243441C1 (zh)
CA (1) CA2489443C (zh)
MX (1) MXPA04012540A (zh)
PL (1) PL207861B1 (zh)
TW (1) TWI288915B (zh)
WO (1) WO2003107329A1 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2019391B1 (en) 2002-07-19 2013-01-16 NEC Corporation Audio decoding apparatus and decoding method and program
US7774707B2 (en) * 2004-12-01 2010-08-10 Creative Technology Ltd Method and apparatus for enabling a user to amend an audio file
US8392176B2 (en) * 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
WO2009029036A1 (en) 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for noise filling
ES2741963T3 (es) 2008-07-11 2020-02-12 Fraunhofer Ges Forschung Codificadores de señal de audio, métodos para codificar una señal de audio y programas informáticos
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
EP2489036B1 (en) * 2009-10-12 2015-04-15 Nokia Technologies OY Method, apparatus and computer program for processing multi-channel audio signals
BR122019025131B1 (pt) 2010-01-19 2021-01-19 Dolby International Ab sistema e método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
EP3288033B1 (en) * 2012-02-23 2019-04-10 Dolby International AB Methods and systems for efficient recovery of high frequency audio content
JP6200034B2 (ja) * 2012-04-27 2017-09-20 株式会社Nttドコモ 音声復号装置
US9607602B2 (en) 2013-09-06 2017-03-28 Apple Inc. ANC system with SPL-controlled output
US10090005B2 (en) * 2016-03-10 2018-10-02 Aspinity, Inc. Analog voice activity detection
CN113053351B (zh) * 2021-03-14 2024-01-30 西北工业大学 一种基于听觉感知的飞机舱内噪声合成方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP2563719B2 (ja) * 1992-03-11 1996-12-18 技術研究組合医療福祉機器研究所 音声加工装置と補聴器
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
JPH07225598A (ja) * 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
JP3254953B2 (ja) * 1995-02-17 2002-02-12 日本ビクター株式会社 音声高能率符号化装置
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体

Also Published As

Publication number Publication date
PL207861B1 (pl) 2011-02-28
PL371898A1 (en) 2005-07-11
WO2003107329A1 (en) 2003-12-24
CN1310210C (zh) 2007-04-11
CA2489443C (en) 2012-04-10
TW200400487A (en) 2004-01-01
EP1514263B1 (en) 2010-06-02
AU2003243441A1 (en) 2003-12-31
EP1514263A1 (en) 2005-03-16
JP2005530206A (ja) 2005-10-06
US20080140405A1 (en) 2008-06-12
AU2003243441C1 (en) 2009-07-30
CA2489443A1 (en) 2003-12-24
CN1662960A (zh) 2005-08-31
MXPA04012540A (es) 2005-04-28
AU2003243441B2 (en) 2008-12-11

Similar Documents

Publication Publication Date Title
TWI288915B (en) Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
EP2207169B1 (en) Audio decoding with filling of spectral holes
KR100954179B1 (ko) 근접-투명 또는 투명 멀티-채널 인코더/디코더 구성
TWI463790B (zh) 用於信號分析與合成之適應性混成變換技術(一)
CN103765509B (zh) 编码装置及方法、解码装置及方法
KR20110021803A (ko) 2개의 블록 변환으로의 중첩 변환의 분해
Thiagarajan et al. Analysis of the MPEG-1 Layer III (MP3) algorithm using MATLAB
US20050254586A1 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
Spanias et al. Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB
Chen et al. Real-time implementation of the MPEG-2 audio codec on a DSP
Ning Analysis and coding of high quality audio signals
IL165648A (en) An audio coding system that uses decoded signal properties to coordinate synthesized spectral components
IL216068A (en) An audio broadcast system that uses decoded signal properties to coordinate synthesized spectral components

Legal Events

Date Code Title Description
MK4A Expiration of patent term of an invention patent