TW200915300A - Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program - Google Patents

Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program Download PDF

Info

Publication number
TW200915300A
TW200915300A TW097137242A TW97137242A TW200915300A TW 200915300 A TW200915300 A TW 200915300A TW 097137242 A TW097137242 A TW 097137242A TW 97137242 A TW97137242 A TW 97137242A TW 200915300 A TW200915300 A TW 200915300A
Authority
TW
Taiwan
Prior art keywords
signal
value
frequency
gain value
band
Prior art date
Application number
TW097137242A
Other languages
English (en)
Other versions
TWI426502B (zh
Inventor
Christian Uhle
Juergen Herre
Stefan Geyersberger
Falko Ridderbusch
Andreas Walter
Oliver Moser
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW200915300A publication Critical patent/TW200915300A/zh
Application granted granted Critical
Publication of TWI426502B publication Critical patent/TWI426502B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Description

200915300 九、發明說明: 【發明所屬之技術領域】 根據本發明的實施例涉及用於提取環境信號的裝置, 並涉及用於獲得提取環境信號的加權係數的裝置。 根據本發明的一些實施例涉及用於提取環境信號的方 5 法,並涉及用於獲得加權係數的方法。 根據本發明的一些實施例的目的是從音頻信號中以低 複雜度提取前置信號(front signal)和環境信號(ambient signal)用於上混音(upmix )。 1〇【先前技術】 在消費者的家庭娛樂中,多聲道音頻素材正變得越來 越流行。這主要是由於這樣一個事實,即DVD上的電影提 供了 5.1多聲道聲音,因此,即使是通常安裝音頻重播系統 的家庭用戶’也能夠重現多聲道音頻。 15 例如’這樣的設置可以由3個前置揚聲器(L、C、I〇、 兩個後部的揚聲器(Ls、Rs)以及一個低頻音效聲 組成。為了方便,所給出的解釋涉及5.1系統。該解釋通過 很小的修改就可以適用於任何其他多聲道系統。 相比雙聲迢身歷聲重現,多聲道系統提供了多個眾所 2〇 周知的優點,例如: •優點1 .即使偏離最優(中心)收聽位置,也能改 進前置圖像的穩定性。由於中心聲道,“甜點(sweet_sp〇t ),, 被擴大了。術語甜點,’表示感知到最優聲音印象的收聽 位置的區域。 200915300 ‘ 參優點2 :後置聲道揚聲器創建了增大的“包圍,,和 空間體驗。 然而,存在大量遺留的具有兩個聲道(“身歷聲,,) 或甚至只有一個聲道(“單聲道”)的音頻内容了例如老 5電影和電視系列片。 , 進來’開發出了各種用於從具有較少聲道的音頻信號 產生多聲道k號的方法(見第2部分的相關傳統概念概 述)。從具有較少聲道的音頻信號產生多聲道信號的過程被 稱為“上混音”。 10 上混音的兩個概念廣為人知。 1.使用引導上混音過程的附加資訊的上混音。該附加 貝訊或者以指定的方式“編碼”在輪入信號中,或者可以 另外儲存。這個概念通常稱為“引導的上混音”。 / K、,2.冑上混音” ’其巾’完全從音頻信射獲得多聲 、 逼信號,而不需要任何附加資訊。 根據本發明的實施例涉及後者,即盲上混音過程。 、在文獻中,公開了用於上混音的備選分類法。上混音 2程可以遵循直射/環境(Dkect/Ambient)概念或“在樂隊 (lntheband)概念或兩者的混合。以下描述這兩種概 A直射/環境概念 直射聲源”是通過3個前置聲道以這樣一種方式來 現的’即在與原始的雙聲道版本相同的位置來感知。術 6 200915300 源(例毕種完全並直接來自一個分立聲 另外的聲音,㈣由於帶有很小或不帶有任何 音是提供以環境聲音(似環境聲音)。環境聲 的.虛擬的)收聽環境印象的聲音,包括房門 辦音(例如歡呼 訊。 ―日(例如乙烯的劈啪聲)和背景雜 二十的雙聲道版本的聲音圖像,第 音圖像。私直軸^概念進行上混音的版本的聲 ΰ在樂隊中”概念 15 (直二:念,每個聲音’或至少某些聲音 位置心其特二==二, 五圖不忍了“在樂隊中”概念的聲音®像。 ^據本發_裝置和方法涉及絲續馳念。以下部 m聲道的音頻信號上混音為具有n聲道的音頻 佗唬。、中m<n)的上下文中給出傳统概念的概述。 2.盲上混音的傳統概念 2.1單聲道錄音的上混音 7 20 200915300 2.U偽身歷聲處理 、請^數產生所謂“偽身歷聲”信號的技術不是信號自 意味著,、它.以相㈣方式處理任何單聲道信號, "^、令為何。這樣的系統通常使用簡單的滹波哭蛀 間延遲來…解相關輸出信號:皮;;構 梳狀濾波器來處理單聲道輸人信號的兩個拷貝 c ]。這樣的系統的全面的概述可以在[Fal〇5]中找到。、 2.U使用聲源形成的半自動單聲道至身歷聲上混音 1〇 雜者提出了-種演算法,用於朗屬於相同聲源的 並從而應當被組合在-起的信號分量(例如聲譜圖的時頻 點(tune-frequency bin)) [LMT〇7]。聲源形成演算法考慮 了流分離原理(由Gestalt原理導出):在時間上^續性了 在頻率上諧和相關性以及幅度相似性。使用聚簇方法(無 15監督學習)來識別聲源。使(a)物件的頻率範圍的資訊 和(b )音質相似性,將導出的“時頻'竊 (time-frequency-cluster) ’,進一步組合為更大的聲音流。、 作者公開了使用正弦建模演算法(即識別信號的正弦分量) 作為前端。 2〇 在聲源形成後,用戶選擇聲源並對其應用全景化權重 (panning weight)。應注意(根據一些傳統概念),在處理 一般複雜度的真實世界的信號時’許多已提出的方法(正 弦建模、流分離)不能可靠地執行。 200915300 2.1.3使用非負矩陣分解的環境信號提取 例如通過短期傅立葉變換,計算輸入信號的時頻分佈 (TFD)。通過非負矩陣分解的數值優化方法,導出直射传 號分量的TFD的估計。通過計算輸入信號的TFD與直射信 5號的TFD的估計的差’獲得環境信號的TFD的估計(即近 似殘差)。 使用輸入信號的相位聲譜圖來實施環境信號的時間信 號的重新合成。可選地’應用附加的後處理以改進所導出 的多聲道信號的收聽體驗[UWHH07]。 10 2.1.4 自適應頻譜全景化(panoramization) (ASP) [VZA06]描述了全景化單聲道信號以使用身歷聲系統 重播的方法。該處理結合了 STFT、用於重新合成左右聲道 信號的頻率點(frequency bin)的加權以及逆STFT。從由 I5子帶中的輸入信號的聲譜圖計算出的低級特徵中導出時變 加權因數。 2.2身歷聲錄音的上混音 2.2.1矩陣解碼器 2〇 無源矩陣解碼器使用輸入聲道信號的時不變線性組合 來計算多聲道信號。 有源矩陣解碼器(例如Dolby Pro Logic II [DreOO]、DTS NEO:6 [DTS]或 HarmanKardon/Lexicon Logic 7 [Kar])應用 了輸入信號的分解’並進行矩陣元素(即線性組合的權重) 200915300 的基於信號的自適應調整。這些解碼器使用聲道間差與信 號自適應調整機制來產生多聲道輸出信號。矩陣調整方法 的目的是檢測主要的源(例如對話)。該處理在時間域進 行0 〆 15 2.2.2將身歷聲轉換為多聲道聲音的方法 Irwan和Aarts提出了 -種將信驗身縣轉換為多聲 暹的方邮顧]。使用互相關技術(提出了—種相關係數的 迭代估计以減小計算負荷)來計算環繞聲道的信號。 使用主要分量分析(PCA)來獲得中心聲二 數。PCA適於計算指示主要信號方向的向量。—次只能檢 測出一個主要信號。使用迭代梯度下 ^ 使用觀測的協方差矩陣的特徵值分 從雙聲道晌咖㈣編m置= 的―自適麟波方* 通作者&出了一種與Irwan 進的演算法。原先提出的方 am,方法相比得到改 該作者假定主要信_的g於母個子帶_] ° 使用偽積分鏡像錢⑽或基於的正交性。
Irwan^ Mrts 自適應步長大⑽於(帛―)^的進—步擴展是使用 ^玉要分量的迭代計算。 10 20 200915300 信號多聲道音頻上混音的從身歷聲信號的環境
Av^ndano和jot s出了一種頻域技術,用於識別和提 取身歷聲棚錢巾的環境資訊。 #該方絲㈣道間相干係數和非祕映射函數的計 述非線性映射函數允許確定基本上由環境分量組成 、jT,區域。後,環境信號被合成並用於供給多聲道重 播系統的環繞聲道。 2.2.5基於描述符的空間化 、該1者描述了—_於1至η上混音的方法,該方法 可以由仏號的自動分類來控制[ΜΡΑ+〇5]。該論文存在-些 錯誤’因此’可能該作者的目的不同於在該論文中描述的 15 目的。 上混音處理使用3個處理模組:“上混音工具,,、人 工混響以及均衡。“上混音工具”由各種處理模組組成, 包括提取環境信號。用於提取環境信號的方法(“空間鑒 別器)是基於對記錄在空間域的身歷聲的左右信號的比 2〇較。為了上混音單聲道信號,使用人工混響。 該作者描述了 3個應用:1至2上混音、2至5上混音 和1至5上混音。 音頻信號的分類 分類過程使用無監管的學習方法:從音頻信號中提取 200915300 低級特徵’應用分類符將音頻信號分類為三類中的一類: 音樂、語音或任何其他聲音。 該分類過程的特殊性在於使用遺傳編程方法以找到: •最優特徵(作為不同操作的組成) 5 #所獲得的低級特徵的最優組合 •可用分類符集合中的最佳分類符 Γ φ對所選的分類符的最佳參數設置 1至2上混音 該上混音是使用混響和均衡來完成的。若信號包含語 10音,則使用均衡而不使用混響。否則,不使用均衡而使用 混響。不使用任何旨在抑制後置聲道中的語音的專門處理。 2至5上混音 該作者的目的是建立多聲道音執,通過使中心聲道不 發聲來減弱檢測到的語音。 ^ : 15 1至5上混音 使舰響、均衡和‘‘上混音工具,,(它由身歷聲信號 產生5.1信號。該身歷聲信號是混響的輸出以及對“上混音 工具”的輸入)來產生多聲道信號。對音樂、語音和所有 其他聲音使用不同的預設置。通過控制混響和均衡,建立 20 了多聲迢音執,該多聲道音轨將語音保持在中心聲道,而 將音樂和其他聲音保持在全部聲道中。 若#號包含語音,則不使用混響。否則使用混響。由 於後置聲道的提取依賴於身歷聲信號,當不使用混響時(這 是針對語音的情況)’不產生後置聲道的信號。 12 200915300 2.2.6基於環境信號的上混音
Soulodre提出了一種從身歷聲信號創建多聲道信號的 系統[Sou04]。信號被分解為所謂的“單源流”和“環境 5流”。基於這些流,所謂的“美學引擎,,合成多聲道輸出。 沒有給出該分解和合成步驟的進一步的技術細節。 2.3具有任意數目聲道的音頻信號的上混音 2.3.1多聲道環繞形式轉換和一般化的上混音 ίο 該作者描述了一種基於使用中間單聲道下混音 (downmix)的空間音頻編碼的方法,並介紹了一種不需: 中間下昆音的改進的方法。該改進的方法包括無源矩陣上 混音以及從空間音頻編碼中已知的原理。這種改進的取得 付出了增加中間音頻的資料速率的代價[GJ〇7a]。 15 2.3.2用於空間音頻編碼和增強的主要環境信號分解和 基於向量的定位 該作者提出,使用主要分量分解(PCA)將輸入信號 分離為主要(直射)信號和環境信號。 2〇 輸入信號被建模為主要(直射口)信號和環境信號之和。 假定直射信號本質上具有的能量比環境信號更大,而且兩 種信號不相關。 #該處理在麟it行。通過將輸入信號的 STFT係數投影 到第-主要分I上,獲得直射信號的STFT係數。環境信號 200915300 -2 係數疋由輸人信號和直射信號的STFT信號的差別 计鼻付到。 於'’要(第—)主要分量(即與最大特徵值相對 應的協方差矩陣的特徵向量),應用用於標準PCA的特徵 5值分解的具有計算效率的選擇性方法(是-種迭代近似)。 =樣’迭代地估計PCA分解所需的互相關。該直射和環境 ( 信號加起來是原始信號,即分解中沒有損失資訊。 【發明内容】 .K) ▲從以上的描述看來,需要一種低複雜度的從輸入音頻 #號中提取環境信號的方案。 根據本發明的-些實施例創建了一種裝置,該裝置美 於輸入音頻錢的_域(time如queney如ain)表示ς _環境信號’所述時頻域表示以描述多個頻帶的多個子 (I5奸號⑽式表讀人音頻信號。所述裝置包括增益值確 定器,所述增益值確定器被配置為根據輸入音頻信號,確 定針對輸入音齡號的時頻域表示的給定頻帶的時變環境 信號增益值序列。所述裝置包括加權器,所述加權器被配 置為使用所述時變增益值來加權表示所述時賴表示的給 2〇疋頻帶的-個子帶信號,以獲得加權的子帶信號。所述增 益值確定器被配置為獲得描述輸入音頻信號的一個或 特徵或特性的-個或更多量化特徵值(quamita細反伽e value),並根據所述-個或更多量化特徵值來提㈣益值, 使得所述增益值在數量上取決於所述量化特徵值。曰所 14 200915300 騎箱值,㈣一子帶信號 /、邦%境分|相比,強調環境分量。 根據本發明的一些實施例提供 獲得用於從輸入音頻信號中提取環=,所述裝置 =包括加權係數確定器,所
C 15 加權:吏得使用該加權係數來加權的(或由該 數確讀㈣& 魏純值的加餘合’近似於與㈣雜 入曰頻信號相關聯的期望增益值。 , ^本發日㈣―些實關提供了祕提料境信號和 用於獲件加權係數的方法。 j據本發_-些實_是基於的發現,即通過 確疋化特徵值,例如描述輸入音頻信號的一個或更多特 徵的量化特徵值相,由於可以通過有限的計算努力來提 i、這樣的里化特徵值,並且這樣的量化特徵值可以被有效 而靈活地轉換為增益值,因此,通過確定量化特徵值可以 以特別有效而靈活的方式從輸入音頻信號中提取環境信 號。通過以一個或更多量化特徵值序列的形式來描述一個 或更夕特徵,可以容易地獲得增益值,所述增益值在數量 上取決於所述量化特徵值。例如,可以使用簡單的數學映 射來從特徵值導出增益值。此外,通過提供增益值使得所 述增益值在數量上取決於所述特徵值,可以獲得從輸入信 號中經微調提取的環境分量。不是進行硬判決來判決輸入 信號的那些分量是環境分量而輸入信號的哪些分量是非環 15 20 200915300 兄刀里’而疋可以執行環境分量的逐步提取。 、此外,里化特徵值的使用允許描述不同特徵的特徵值 的特別有效崎確的組合。例如,可以根據數學處理規則’ 以線性或非祕的料對量化特徵值騎縮放或處理。 5 、λ在組合多個特徵值以獲得增益值的實施例中,例如通 過凋正各自的係數,可以容易地調整關於所述組合的細節 (例如關於不同特徵值的縮放的細節)。 以上概括為’包括確定量化特徵值也包括基於所述量 =特徵值確定增益值的用於提取環境信號的概念,這倘概 10心可以構成用於從輸入音頻信號中提取環境信號的有姝而 低複雜度的概念。 在根據本發明的一些實施例中,本發明的實施例|負系 出特別有效地對輸入音頻信號的時頻域表示的一個或更多 子帶信號進行加權。通過對所述時頻域表示的一個或更多 I5子常k號進行加權,可以實現從輸入音頻信號中頻率遂擇 性地或指定地提取環境信號分量。 根據本發明的一些實施例創建了一種裝置,所述装Ϊ 獲得用於從輸入音頻信號中提取環境信號的加權係數。 些貫施例疋基於這樣的發現,即可以基於係數球定 2〇輸入音頻信號來獲得用於提取環境信號的係數,在一毖實 施例中,所述係數確定輸入音頻信號可以被看作是“校率 信號”或“參考信號”。通過使用這樣的係數確定輸入音 頻信號,其中例如可以通過適當的努力知曉或獲得該信號 的期望增益值,可以獲得定義量化特徵值的組合的係數, 16 200915300 使得的組合產生近似於期望增益值的增益值。 得使==念’可_合適的加權係、數的集合,使 從與所述係數衫輸人充分好地執行 取環境信號U環_似的輸人音頻信號中提 震置實施例中,用於獲得加權係數的 ^的势i立取%境仏號的裝置有效地自適應於不同類 數=二信號。例如,基於“訓練信號’,,即用作係 10 戶 戶的:i日—號並可以自適應於環境信號提取器的用 偏好的給定的音齢號,可以獲得合適的加權係 _Γσ。此外,通過提供所述加權係數,可以對描述不 同特徵的可用量化特徵值進行最佳利用。
15 隨後將描述根據本發明的實施例的進一步的細節、效 果和優點。 【實施方式】 隨後將參照附圖描述根據本發明的實施例。 用於提取環境信號的裝置一—第一實施例 圖7^了餘從輸人音頻信號巾提取環境信號的 ^置的不意框®。第—_示的裝置其整體被標記為酬。 衣置100被配置為接收輸入音頻錢11〇,並基於該輸入音 頻信號提供至少-個加權的子帶信號,使得在加權的子帶 枱旒中,與非環境分量相比,強調環境分量。裝置100包 括增益值確定器120。該增益值確定器120被配置為接收輪 17 200915300 入3頻彳5號110 ’並根據輸入音頻信號lio提供時變環境信 號增益值(也被簡要標記為增益值)序列122。增益值確定 , 器120包括加權器130。加權器130被配置為接收輸入音頻 k號的日守頻域表示或其至少一個子帶信號。所述子帶信號 5可以描述輸入音頻信號的一個頻帶或一個子頻帶。加權器 130還被配置為根據子帶信號丨%,並根據時變環境信號增 f 益值序列122來提供加權的子帶信號112。 基於上述結構描述,以下將描述裝置1〇〇的功能。增 I值確疋器120被配置為接收輸入音頻信號並獲得一 10個或更多量化特徵值,所述量化特徵值描述該輸入音頻信 號的-個或更多特徵或特性。換言之,例如,增益值確定 器120可以被配置為獲得表徵輸入音頻信號的一個特徵或 特性的量化資訊。備選地,增益值確定器12〇可以被配置 為獲得描述輸入音頻信號的多個特徵的多 15 (或其序列)。㈣,可輯_人音·躺 也稱為特徵(或在一些實施例中稱為“低級特徵”),以提 供增益值序列。增益值確定器12〇還被配置為:根據_個 或更多量化特徵值(或其序列)’來提辦變環境信號辦兴 值序列122。 20 町’ “特徵”—詞有時被用於表示特徵或特性 便使描述簡略。 …在-些實施例中,增益值確定器m被配置為提供 變環境信號料值,騎益值在數量上取決於該量化特徵 值。換言之’在-些實施财,特徵值可以採取多個值^ 18 200915300 -些情況下多於兩個值,在—些情況下甚至多於 在-些情況下甚至是准連續數目的值),對應的 非線性的方式遵循(至少在特徵值的: 疋粑圍内)_徵值。因此,在—些實施例中,: 可以隨著-個歧多對應的量化特徵值之—的増大^ 地增大。在另—實施例中,增益值可以隨著—個或^ 應值之一的增大而單調地減小。 宁 在二實知例中,增盈值確定器可以被配置為產+ 述第一特徵的時間演進的量化特徵值序列。相應地,例如田 增益值確^器可以被配置為將描述第—特徵的特徵 映射到增益值序列。 15 在其他-些實施例中,增益值確定器可以被配 供或計算多個特徵值相’所述多個特徵值相描述了輸 入音頻信號11G的多個不同特徵的時間演進。相應地,^ 以將多個量化特徵值序列炚射到增益值序列。 以上概括為,增益值確定器可以以量化方 音頻信號的-個或更多贿,並提供基_特徵的增益值。 加權器m觀置為減時變環境信號增益值序列 122’對輸入音頻信號110的頻譜的一部分(或完整的頻譜) 進行加權。為了這個目的,加權器接收輪人音頻信號 頻域表示的至少-個子帶信號132 (或多個子帶作號)。 增益值確定器12〇可以被配置為以時域表示或;時頻 域表示來接收輸人音頻信號。然而,已經發現,若輸入信 號的加權是通過使用輸人音號11G _頻域的加權^ 19 20 200915300 來進行的二則可以以特別高效的方式進行環境信號的提取 過私。加權器130被配置為根據增益值丨22對輸入音頻作 號的至少一個子帶信號Π2進行加權。加權器13〇被配置 為對一個或更多子帶信號132應用增益值序列的增益值以 5縮放子帶乜號,以獲得一個或更多加權的子帶信號。 在一些實施例中,增益值確定器120被配置^計算輸 入音頻信號的特徵,所述特徵表徵了(或至少提供了一種 指示)輸入音頻信號110或其子帶(由子帶信號132表示) 可能表示音頻信號的環境分量還是非環境分量。然而,可 10以選擇由增益值確定器處理的特徵值,以提供關於輸入音 頻信號110内的環境分量和非環境分量之間的關係的量I 。例如,特徵值可以攜帶關於輸入音頻信號110中的 環境分量和非環境分量之間的關係的資訊(或至少一種指 示),或至少描述其估計的資訊。 15 相應地,增益值確定器130可以被配置為產生增益值 序列,使得在根據增益值122加權的加權子帶信號112中, 與非環境分量相比’強調環境分量。 以上概括為,裝置1〇〇的功能是基於描述輸入音頻信 號no的特徵的一個或更多量化特徵值序列來確定增益值 2〇序列。產生增益值序列,使得若特徵值指示各個時頻點的 相對大的環境相似度”,則使用大的增益值來縮放表示 輸入a頻信號110的頻帶的子帶信號132,若由增益值確定 器認定的—個或更多特徵指示各個時頻點的相對低的“環 境相似度”,則使用相對小的增益值來縮放輸入音頻信號 20 200915300 110的頻帶。 用於提取環境信號的裝置——第二實施例 現在參照第二圖,來描述第一圖所述的裝置1〇〇的可 5選擴展。第二圖示出了用於從輸入音頻信號中提取環境信 號的裝置的詳細示意框圖。第二圖所示的裝置其整體被標 記為200。 裝置200被配置為接收輸入音頻信號21〇,並提供多個 輸出子帶信號212a至212d,多個輸出子帶信號212a至212d ίο中的一些可以被加權。 例如,裝置200可以包括分析濾波器組216,分析濾波 器組216可以被認為是可選的。例如分析濾波器組216可 以被配置為接收時域表示的輸入音頻信號内容210,並提供 該輸入音頻信號的時頻域表示。例如,該輸入音頻信號的 15 時頻域表示可以以多個子帶信號218a至218d的方式描述 輸入音頻信號。例如,子帶信號218a至218d可以表示在 輸入音頻信號210的不同子頻帶或頻帶中存在的能量的時 間演進。例如,子帶信號218a至218d可以表示用於輸入 音頻信號210的後續(時間上)部分的快速傅立葉變換係 2〇數的序列。例如,第一子帶信號218a可以描述在後續時間 段中輸入音頻信號的給定子頻帶中存在的能量的時間演 進’所述後續時間段可以重疊或不重疊。類似地,其他子 帶信號218b至2l8d可以描述其他子帶中存在的能量的時 間演進。 21 200915300 —/曾益值確定器可以(可選地)包括多個量化特徵值確 定器250、252、254。在一些實施例中,量化特徵值確定器 250、252、254可以是增益值確定器22〇的一部分。然而, 在其他實施例中,量化特徵值確定器25〇、252、254可以 5在增ϋ值確疋器220的外部。在這種情況下,增益值確定 器220可以被配置為從外部量化特徵值確定器接收量化特 Γ 徵值。接收外部產生的量化特徵值和内部產生的量化特徵 值均被認為是“獲得,,量化特徵值。 例如,量化特徵值確定器250、252、254可以被配置 10為接收關於輸入音頻信號的資訊,並提供以量化方式描述 輸入音頻信號的不同特徵的量化特徵值250a、252a、254a。 在一些實施例中,量化特徵值確定器25〇、252、254 被選擇為,以對應的量化特徵值250a、252a、254a的形式 描述輸入音頻信號210的特徵,這些特徵提供了關於輸入 L 15音頻信號210的環境分量内容的指示,或關於輸入音頻信 唬210的環境分量内容與非環境分量内容之間的關係的指 示。 增益值確定器220還包括加權組合器26〇。加權組合器 260可以被配置為接收量化特徵值250a、252a、254a,並基 2〇於此提供增益值222 (或增益值序列)。加權器單元可以^ 用該增益值222 (或增益值序列)來加權一個或更多子帶信 號218a、218b、218c、218d。例如,加權器單元(有時也 簡稱為“加權器”)可以包括,多個單個的縮放器或單個 的加權态270a、270b、270c。例如,第一單個加權器27〇a 22 200915300 可以被配置為根據增益值(或增^值序列)222加權第-子 Φ信號2此。從而獲得第一加權子帶信號。在一些實 施例中’增益值(或增益值序列)222可以用於加權附加子 帶信號。在一個實施例中,可選的第二單個加權器270b可 5 =被配置為加權第二子帶信號鳩以獲得第二加權子帶信 ,212b it匕外’第二單個加權器27〇c可以被配置為加權第 f Ζ子帶錢施以獲得第三加權子帶信號2l2e。從以上的 討論中可以看出,可以使用增益值(或增益值序列)222 來加權以時頻域表示的形式表示輸入音頻信號的一個或更 • 10 多子帶信號 218a、218b、218c、218d。 量化特徵值確定器 以下,描述關於量化特徵值確定器25〇、252、254 各種細節。 (15 量化特徵值確定器250、252、254可以被配置為使用 .不同類型的輸入資訊。例如,如第二圖所示,第 徵值確定器25〇可以被配置為接收輸入音頻信號的時域表 不作為輪入資訊。備選地,第一量化特徵值確定器謂可 以被配置為接收描述輸人音頻信號的整 -訊:因此,在一些實施射,可以(可選地)基^^ 頻4號的時域表示或基於描述輸入音頻信號的整體(至少 在給定的時間段内)的其他表示,計算至少一個量化特徵 值 250a。 第二量化特徵值確定器252被配置為接收單個子帶信 23 200915300 號’例如第一子帶信號聽作為輸入資訊。因此,例如, 紅4化特徵值衫ϋ可以被崎為基於單舒帶信號提 ί、對應的里化特徵值252a。在只對單個子帶信號應用增益 值222 (或其序列)的實施例中,應用增益值222的子 5帶信號可以與第二量化特徵值確定器222所使用的子帶信 说相同。 f 例如’第三量化特徵值確定器254可以被配置為接收 多個子帶信號作為輸入資訊。例如,第三量化特徵值確定 器254被配置為接收第一子帶信號胤、第二子帶信號 .1〇 218b和第三子帶信號紙作為輸入資訊。因此,第三量化b 特徵值確定器254被配置為基於多個子帶信號提供量化特 徵值254a。在應用增益值222 (或其序列)以加權多個子 帶信號(例如子帶信號施、218b、218e)的實施例中, ^應用增盈值222的子帶信號可以與第三量化特徵值確 I I5疋益254所計鼻的子帶信號相同。 \..u 以上概括為,在一些實施例中,增益值確定器Μ〗可 以包括多個不同的量化特徵值確定器,所述量化特徵值確 被配置為計算不同的輸人資訊,以獲得多個不同的特 徵值250a、252a、254a。在-些實施例中’―個或更多特 2〇徵值確定器可以被配置為基於輸入音頻信號的寬頻表示 (例如,基於輸入音頻信號的時域表示)來計算特徵,而 其他特徵值確定器可以被配置為只計算輸入音頻信號训 的頻譜的一部分,或甚至只計算單個頻帶或子頻帶。" 24 200915300 加權 下文描述關於量化特徵值的加權的細節,所述加權是 由例如加權組合器260執行的。 加權組合器260被配置為,基於由量化特徵值確定器 5 250、252、254所提供的量化特徵值250a、252a、254a,獲 得增益值222。例如,該加權組合器可以被配置為線性縮放 由量化特徵值確定器所提供的量化特徵值。在一些實施例 中,加權組合器可以被考慮為形成量化特徵值的線性組 合,其中不同的權重(例如,所述權重可以由各自加權係 1〇數來描述)可以與量化特徵值相關聯。在一些實施例中, 加權組合器也可以被配置為以非線性的方式處理由量化特 徵值確定器所提供的特徵值。例如,非線性處理可以先於 組合而執行,或作為組合的一個整體部分。 在一些實施例中,加權組合器26()可以被配置為可調 15正的。換5之,在一些實施例中,加權組合器可以被配置 為,得與不同量化特徵值確定器的量化特徵值相關聯的權 重是可調整的。例如,加權組合器26〇可以被配置為接收 力士口權係數的集合,例如,該加權係數的集合將影響到量化 鈴徵值250a、252a、254a的非線性處理和/或影響到量化特 〇徵值250a、252a、254a的線性縮放。隨後將描述關於 過程的細節。 在-些實施例中,增益值確定器22〇可以包括可選的 選的加權調整器27〇可以被配置為調 正由加柘組合态260進行的對量化特徵值25如、252&、25如 25 200915300 的加權。例士灸 化特徵值⑽I/十四圖至2Q,隨後將描述關於用於量 ...、加柄的加權係數的確定的細節。例如, 權係數的確定可以士八私 ^所述加 270來執行。由刀離的裝置來執行或由加權調整器 用於提取環境信號的裝置——第三實施例 用於ίΖΪ根據本發明的另—個實施例。第三圖示出了 圖。、第^頻信號中提取環境信號的裝置的詳細示意框 圖所7^㈣置其整體被標記為300。 應注4,貫穿本說财的始終,選擇相同的附 ^己从記相同的裝置、信號或功能。 特別,與較細非常類似。然而,裝置300包括 将別同效的一組特徵值確定器。 15 值中可以看到的,取代第二圖中所示的增益 疋盗〇的增益值確定器320包括音調特徵值確定器 ^為第—量化特徵值確U。例如,音調特徵值確定器 /可以被配置為提供量化音簡徵值MM作為第一量化 特徵值。 ,外’增益值確定器32()包括能量特徵值確定器说 1化特徵值確定^,能量特徵值確定器352被配 置為提供能量特徵值352a作為第二量化特徵值。 此外’增益值確定器32〇可以包括頻譜質心(spec㈣ =mrold)特徵值確定器354作為第三量化特徵值確定器。 该_質坤徵值確定器可以被配置為提供描述輸入音頻 26 20 200915300 信號的頻譜或輸入音頻信號21〇的頻譜的一部分的質心的 頻譜質心特徵值作為第三量化特徵值。 相應地加權纟且合器26〇可以被配置為,以線性和/或 生加權的方式’組合音調特徵值350a (或其序列)、能 5置特徵值35M (或其序列)和頻譜質心特徵值354& (或其 序列),以獲得用於加權子帶信號218a、218b、218c、2i8d (或至少一個子帶信號)的增益值222。 用於提取環境信號的裝置——第四實施例 10 以下,參照第四圖,討論裝置300的可能的擴展。然 而’參照第四圖所描述的概念也可以獨立於第三圖所示的 配置而使用。 第四圖示出了用於提取環境信號的裝置的示意框圖。 第四圖所示的裝置其整體被標記為400。裝置400被配置為 I5接收多聲道輸入音頻信號410作為輸入信號。此外,裝置 400被配置為基於多聲道輸入音頻信號410提供至少一個 加權子帶信號412。 裝置400包括增益值確定器420。增益值確定器42〇 被配置為接收描述多聲道輸入音頻信號中的第一聲道41〇a 20和第二聲道410b的資訊。此外’增益值確定器420被配置 為基於描述多聲道輸入音頻信號中的第一聲道410a和第二 聲道410b的資訊,提供時變環境信號增益值序列422的序 列。例如,時變環境信號增益值422可等同於時變增益值 222。 27 200915300 此外’裝置400包括加權器430,加權器430被配置為 根據時變環境信號增益值422對描述多聲道輸入音頻信號 410的至少一個子帶信號進行加權。 例如,加權器430可以包括加權器130的功能,或各 5個加權器270a、270b、270c的功能。 現在參照增放值確定器420 ’例如,可以參照增益值確 疋益120、增益值確定器220或增益值確定器32〇來擴展增 益值確定器420’即增益值確定器42〇被配置為獲得一個或 更夕里化聲道關係特徵值。換言之,增益值確定器Go可 ίο以被配置為獲得描述多聲道輸入信號41〇的兩個或更多聲 道之間的關係的一個或更多量化特徵值。 、例如,增益值確定器420可以被配置為獲得描述多聲 道輸入音頻信號410的兩個聲道之間的相關性的資訊。備 认,*或附加地,增盈值碟定器42〇可以被配置為獲得描 15 =多,道輸入音頻信號41〇的第一聲道的信號強度與輸入 曰頻L號410的第二聲道的信號強度之間的難的量化特 徵值。 些實施例中,增益值確定器42〇可以包括一個或 更多聲道關係增益值確定器,這些聲道關係增益值破定器 20 1配置為提供描述—個或更多聲道關係特徵的—個或更多 4寸徵值(或特徵值序列)。在其他__些實施例中,聲道關係 特徵值確定器可以在增益值確定器420之外。 、^一些實施例巾,增益值確定器可以被配置為,例如 以加輕的方式,通過組合描述不同聲道關係的一個或更多 28 200915300 . *化聲道關係特徵值來確定增益值。在-些實施例中,辦 420可以被配置為僅基於—個或更多量化‘ '、寺徵值來確定時變環境信號增益值422的序列, 不考慮量化單聲道特徵值。然而,在其他一些實施例中,0 5增盈值確定1 420被配置為,例如以加權的方心將一個 或更多量化聲道關係特徵值(描述一個或更多不同聲道關 ( 係特徵)與—個或更多量化單聲道特徵值(描述—個 多單聲道特徵)組合。因此,在一些實施例中,可以同時 考慮基於多聲道輸入音頻信號的單個聲道的單聲道於 Η)徵以及描述多聲道輸入音頻信號41〇的兩個或更多聲道^ __道關雜徵,來確树變環境信號增益值。 时士因此,在根據本發明的一些實施例中,通過同時考慮 道特徵和聲道關係特徵’來獲得特別有意義的時變; 境信號增益值序列。相應地,時變環境信號增益值可以適 (I5狀要使㈣述增益絲加權的音頻㈣聲道,仍考慮先 前的資訊,可以通過計算多聲道之間的關係來獲得戶^增 盈值。 θ 增益值確定器的細節 以下參照第五圖,描述關於增益值確定器的細節 五圖示出了增Μ#11的詳細示意框圖。第五圖所示的 增益值確定H其整體被標記為5%。例如,該增酱確^ 可以取代此處描述的增益值確定器、12()、22()、32〇 ° 的功能。 29 20 200915300 非線性預處理器 15 增益值確定ϋ 包括(可選的)非線性預處理器 训。該非線性預處理器5料以被配置為接收一個或更多 輸入音頻信號的表示。例如,非線性預處理器51〇可以被 配置為接收輸入音頻信號的時頻域表示。然而,在一些實 靶例中’選擇性地或附加地,非線性預處理器可以被 配置為接收輸人音頻信號的時域表示。在另—些實施例 二非線性預處理器可以被配置為接收輸人音頻信號的第 一聲道的表*(例如喊絲树賴表示)以及輸入音 頻信號的第二聲道的表示。非線性預處理器可以進一步被 配置為向第-量化特徵值確定器別提供輸入音頻信號的 们或更夕聲道的經預處理的表示,或至少—部分(例如 頻譜部分)經預處理的表示。此外,非線性預處理器可以 被配置為向第二量化特徵值確定器522提供輸入音頻信號 的另-個經預處理的表示(或其部分)。提供給第一量化特 徵值確疋器520的輸入音頻信號的表示可以與提供給第二 置化特徵值確定器522的輸入音頻信號的表示相同或不同。 然而,應注意,第一量化特徵值確定器52〇和第二量 匕斗寸徵值確疋器可以被認為是表示兩個或更多特徵值確定 器’例如κ個特徵值確定器,其中κ>=1或κ>=2。換言之, 如此處所需並描述的,可以使用另外的量化特徵值確定器 來擴展第五圖所示的增益值確定器5〇〇。 以下描述關於非線性預處理器的功能的細節。然而, 30 20 200915300 應注意’所㈣處理可以包括確定輸人音頻錢或其頻譜 表示的幅度值、能量值、對數幅度值、對數能量值,或者 輸入音頻信號或其頻譜表示的其他非線性預處理。 特徵值後處理器 f 增益值確定器500包括第一特徵值後處理器53〇,第一 特徵值後處理H 53G被配置駿第—量化碰值確定器 520接收第-特徵值(或第—特徵值序列)。此外,第二特 徵值後處理器532可以與第二量化特徵值確定器切連 接,以從第二量化特徵值確定器522接收第二量化特徵值 (或第二量化特徵值序列)。例如,第—特徵 和=特徵值確定器522可以被配置為提供各自的經後處 理的置化特徵值。 15 :如,特徵值後處理器可以被配置為處理各自的量化 特徵值’以限制經後處理的特徵值的數值範圍。 加權組合器 540 定$ 5〇0還包括加權組合器540。加權組合器 特徵值,、^攸特徵值後處理器530、532接收經後處理的 亚土於此提供增益值560 (或增益值序列)。妗益 值560可以等同於 ’〜皿 增益值422 值122、增益值222、增益值您或 ⑽Γ下討論闕於加權組合器540的一些細節。在-此實 施例中,你丨,I p # 二貝 加#紐合器540可以包括第一非線性處理 31 20 200915300 以提供經非線性處二==實 性:;=0了可?括第二非線性處理器544,第二_ 生處544可以被配置為與第—非線性處理器⑷類 似。第二非線性處理器544可以被配置為將钱處理 線性映射至經非線性處理的特徵值5糾。在一 由非線性處理器542、⑽執行的非線性映射 的參數可啸據各自的舰來娜。例如,可贿用第^ 非線性加權係數來確定第一非線性處理器542的映射,可 線性加權係數來確定第二非線性處理器- 15
。一些實賴中’可以省略—個或更多特徵值後處理 =30、532。在其他實施例中,可以省略一個或全部非線 542、544。此外,在—些實施例中,對應的特徵 值後處理器530、532和非線性處理器542、544的功能可 以被融合到一個單元中。 加柘組合ϋ 540還包括帛一加權器或縮放器55〇。第一 2〇加權器550被配置為接收第一經非線性處理的量化特徵值 542a (或在省略非線性處理的情況下是第一量化特徵值), =根據第-線性加權健來縮放第—經非雜處理的量化 特徵值,以獲得第一經線性縮放的量化特徵值55〇a。加權 組合器540還包括第二加權器或縮放器552。第二加權器 32 200915300 552被配置為接收第二經非線性處理的量化特徵值⑽&(或 在省略非線性處理的情況下是第二量化特徵值),並根據第 二線性加權係數來紐所述值,以獲得第二經線性縮^ 里化特徵值552a。 5 15 、加權組合器540還包括組合器556。該組合器556被配 ,為接收第-經線性縮放的量化特徵值55〇a和第二經線性 縮放的量化特徵值552a。組合器556被配置為,基於所 ^來提供增益值56〇。例如,組合器556可以被配置為執行 弟-經線性紐的量化魏值55師第m缩放的量 化特徵值似的線性組合(例如求和或平均運算)。 户=上概括為,增益值確定器·可以被配置為提供由 夕^,特徵值確定器520、522確定的量化特徵值的線性 ίΐ们ίίί加權的線性組合之前’可以對量化特徵值執 =h乡非線性後處理步驟’例如_值的範圍和 修改小值和大值的相對加權。 減意,第五圖中所示的增益值確定器遍的結· ==:解而作為示範。然而,增益值確定器‘ 的功能可以在不同的電路結構中實現。例如, 的一些可以被組合到單個單元中。此外,參昭 ί使的功能可以在共用的單元中執行。例如,可 徵值後處理器’例如以時間共用的方式來 ^夕^化雜值確W所提供的缝值的後處理 =時間共用的方式,由單個非線性處理器來: 订非線性處理請、544的魏。料, = 33 20 200915300 權器來完成加權! 550、552的功能。 在-些實施例中,參照第五圖所描述的功能可以 任務或多工電腦程式來執行。換言之,在一些實施例中, 只要能夠獲得所需的功能,可以選擇完全不同的電路 5來實現所述增益值確定器。 i 直射信號的提取 ,以下將描述關於從輪人音頻信號中有效提取環境信號 和前^信號(也稱為“直射信號”)的—些進—步的細節: 1〇 Ϊ 了這個目^第六圖示出了根據本發明的實施例的加權 加權H早X的示意框圖。第六圖所示的加龍或加權 器單元其整體被標記為6〇〇。 例如,加權器或加權器單元6〇〇可以取代加權器, 以及各個純器270a、270b、270c或加權器430。 15 、,加權态600被配置為接收輸入音頻信號61〇的表示, =提供祕紐㈣的麵和前置信號或非環境信號或 二直射信號”㈣的表示。應注意,在—些實施例中,加權 裔6〇〇可以被配置為接收輸入音頻信號的時頻域表 不’亚提供壤境信號620和前置信號或非環境信號63〇的 20 時頻域表示。 然而’自然地,若需要的話,加權器_也可以包括 用於將時域輸入音頻信號轉換為時頻域表示的時域至時頻 域轉換器,和/或用於提供時域輸出信號的—個或更多時頻 域至時域轉換器。 34 200915300 例如,加權器600可以包括環境信號加權器64〇,環境 1號力:權器64G被配置為基於輸人音頻信號6ig的表示來 提,%境信號620的表示。此外,加權器6〇〇可以包括前 ,信,加權器650,前置信號加權器65〇被配置為基於輸入 5 9頻#號610的表示來提供前置信號630的表示。 € 15 ,加權器600被配置為接收環境信號增益值66〇的序 列=選地,加權器_可以被配置為也接收前置信號增 °然:而,在—些實施例中,加權器_可以被配 二攸%境信號增益值序射導出前置信 )廷將在以下討論。 加權=權器640被配置為根據環境信號增益僅來 由-個或更多子,二多頻T (例如’該頻帶可以 加權早可絲不),以獲得例如具有-個或更多 置作2㈣式的環境信號㈣的表示。類似地,前 榷器650被配置為對例如以 “ ,式表示的輸入音頻信號⑽的—個或 2 = T進行加權,以獲得例如具有—個或更 * ^子頻 形式的前置信號630的表示。’ 子號的 ’在一些實施例令,環境信號加權器640和兄罢 。儿加權器050可以被配置為 刖置 頻帶或子頻帶(例如由子帶信:互補,=式來加權給定的 的表示和前置信號63G的表示°。二以—生%<境信號620 環境信號增益值指示應在環境信“對定頻帶的 對高的權重,則在從輸入音卢=又頻帶給出相 机遽610的表示導出環境信 20 200915300 號620的表示時,以相對高的權重對該特定頻帶加權,而 在從輸入音頻信號610的表示導出前置信號'63〇的表示 時’以相對低的權重對該特定頻帶加權。類似地,若環境 信號增益值指示應在環境信號中對該特定頻帶給出相 5的權重,則在從輸入音頻信號610的表示導出環境信號6 2〇 的表示時,以相對低的權重對該特定頻帶加權,而在從輸 入音頻信號610的表示導出前置信號63〇的表示時,以相 對高的權重對該特定頻帶加權。 因此,在一些實施例中,加權器6〇〇可以被配置為, 1〇基^環境信號增益值66〇來獲得用於前置信號加權器’65〇 的則置is號增盈值652,使得前置信號增益值652隨著環境 信號增益值660的減小而增大,反之亦然。 二相應地,在一些實施例中,可以產生環境信號62〇和 珂置信號630,使得環境信號620和前置信號63〇的能量之 I5和等於(或正比於)輸入音頻信號61〇的能量。 後處理 現在參知、苐七圖描述後處理,例如,後處理可以被應 用於一個或更多加權子帶信號112、212a至212d、414。〜 Z〇 為了這個目的,第七圖示出了根據本發明的實施例的 後處理器的不意框圖。第七圖所示的後處理器其整體被標 記為700。 後處理器700被配置為接收一個或更多加權子帶信號 710或基於其的信號(例如,基於一個或更多加權子帶信號 36 200915300 的時域信號)作為輸入信號。後處理器7〇〇被進一步配置 為提供經後處理的信號72〇作為輪出信號。此處應注意, 後處理器700應被認為是可選的。 在些貫施例中,後處理器可以包括一個或更多以下 功能單it ’例如,這些魏單元可以是級聯的: 鲁選擇性衰減器730;
15
•非線性壓縮器732; φ延遲器734; *音色賦色補償器736; *瞬變抑制器738;以及 φ信號解相關器740。 =下描述關於後處理器的可能元件的功能的細節。 ❹應注意’可以在軟體中實現該後處理器的-個 次更夕功。此外,德處理哭^γΛΛ 的方式來實現。 $ 的—些魏可以以組合 念。 現在參照第八圖 Α和第八圖β,描述不同的後處理概 ㈣行時域後處理的電路部分的示音 路;分::二示的電路部分其整體被標記為_。電 匕括例如具有合成濾波器 域至時域轉換器。合成心,_ ㈣式的時頻 權子帶信號812,例如,;^[且810被配置為接收多個加 812 波器組_配置為提供時域環境信號8i4二= 20 200915300 的表示。此外,電路部分800可以包括時域後處理器82〇, 時域後處理器820被配置為從合成濾波器組81〇接收時域 環境彳§ 5虎814。此外,例如,時域後處理器82〇可以被配置 為執打第七圖所示的後處理器700的一個或更多功能。由 5此,後處理益820可以被配置為提供經後處理的時域環境 #唬822作為輸出信號,該信號可以被視為經後處理 境信號的表示》 以上概括為,在一些實施例中,若合適的話,可以在 時域執行後處理。 1〇 第八圖B示出了根據本發明的另一個實施例的電路部 分的示意框圖。第八圖B所示的電路部分其整體被標記為 請電路部分85〇包括頻域後處理器_,頻域後處理器 860被配置為接收一個或更多加權子帶信號862。例如,頻 域後處理器860可以被配置為接收一個或更多加權子帶信 15號112、212a至212d、412。此外,頻域後處理器86〇可以 被配置為執行後處理器的—個或更多功能。頻域 ^器_可以被配置為提供—個或更多經後處理的加權子 帶信號864。頻域後處理器_可以被配置為逐個處理一個 或更多加權子帶信號862。選擇性地,頻域後處理器_ 2〇可以被配置為對多個加權子帶信號862 一起進行後處理。 ^部分850還包括合成滤波器組87〇,合成濾波器組87〇 ,配置為接收多她後處理的加權子帶錢_,並基於此 提供經後處理的時域環境信號。 以上概括為’根據需要,可以如第八圖A所示在時域 38 200915300 執行後處理’或如第,B所示在頻域執行後處理。 特徵值的碟定 示出了用於獲得特徵值的不同 不弟九圖所示的示意表示其整體被標記為9⑽ 頻域==St出了輸人音頻信號的時頻域表示。時 St =間索引和順索^上的如 912: 時頻點,其中的兩個被標記為他、 頻帶!^xt何合適的形式,例如以多個子帶信號(每個 =時頻域表示•此處應注意,表示二 15 ^任何貝枓結構應被視為—個或更多子帶信號的表示。換 s之’表痛人音齡號的子頻帶㈣度(例如幅值或 量)的時間演進的任何資料結構應被視為子帶信號。 一因此’接絲*音頻錢的子鮮㈣度的時間演進 的資料結構應被視為接收子帶信號。 參照第九圖,可以看出,可以計算與不同時頻點相關 如的特徵值。例如,在—些實施例中,可以計算並組合盘 不同時頻點相關聯的不同特徵值。例如,可以計算頻率ς 徵值,所述頻率特徵值與不同頻率的同時的時頻點91如、 914b、914c相關聯。在一些實施例中,例如在組合器93〇 中可以組合描述不同頻帶的相同特徵的這些(不同的)特 徵值。相應地,可以獲得組合特徵值932,可以在加權組合 39 20 200915300 . 為中對組合特徵值932進行進一步處理(例如,與其他單 個或組合特徵值組合)。在一些實施例中,可以計算多個特 徵值,所述多個特徵值與相同頻帶(或子頻帶)的連續的 日寸頻點916a、916b、916c相關聯。例如’可以在組合器940 5中組合這些描述連續時頻點的相同特徵的特徵值。相應 地’可以獲得組合特徵值942。 ( 以上概括為,在一些實施例中,可能期望對與不同時 頻點相關聯的描述相同特徵的多個單個特徵值進行組合。 例如’可以組合與同時的時頻點相關聯的單個特徵值和/或 10與連續的時頻點相關聯的單個特徵值。 用於提取環境信號的裝置一—第五實施例 ^以下參照第十圖、第十一圖和第十二圖,描述根據本 發明的另一個實施例的環境信號提取器。 ί: 15 上混音概述 、弟十圖示出了上混音過程的框圖。例如,第十圖可以 被理解為環境信號提取器的示意框圖。選擇性地,第十圖 =被理解為用於從輸人音頻信射提取 號的方法 20的流程圖。 产作t從十圖中可以看到的’從輸入信號“X”計算出環 ^ a (或甚至多個環境信號)和前置信號“d” (或 信號),並將其路由至環鱗音錢的合適的輸出 不。己了輸出聲道以示意上混音至5 0環繞聲音格式的 40 200915300 / 己左,聲逼’ SR標記右環繞聲道、FL標記 工别接=^標記中心聲道以及FR標記右前置聲道。 、蓄沾私U十圖’田述了基於例如只包括-個或兩個聲 ‘:二υ括5個聲道的環繞信號。對輸入 r 由環境信號提取聊提供 ::厂中,例如,可以相對於輸入信號X的非似環境 =,„入信號Χ的似環境分量)被送至後處理刪。 :個或更多環境信號作為後處理刪的結果。由此,
或更多環境信號作為左環繞聲道信號SL和 作為右環繞聲道信號SR。 P 也可以將輸入信號x送至前置信號提取刪,以獲得 -個或更多前置信號d。例如,可以提供—個或更 ^作為左前置聲道錢FL、作為巾心聲道錢c和作^ 右剞置聲道信號FR。 15 然而’,注意。’例如’可以使用參照第六圖所描述的 概心,結合裱境仏號提取和前置信號提取。 =外’應注意’可以選擇不同的上混音配置。例如, 剧入信號X可以是單聲道錢或乡聲道錢。此外,可 =可變數目的輸出信號。例如,在—個非常簡單的實施 例中,可料略Η置信號提取删,從而只能產生 更多環境信號。例如,在—些實施例中,提供單個環境二 U足,了。— ’在—些實施例中,可以提供兩個或甚 =多環境信號,例如’這些信號可以被至少部分地解相 41 20 200915300 此外,從輸入信號X中提取的前置信號的數目可以取 決於應用。在一些實施例中,甚至可以省略前置信號的提 取’而在其他一些實施例中’可以提取多個前置信號。例 如,可以提取3個前置信號。在其他一些實施例中,甚至 5 可以提取5個或更多前置信號。 環境信號的提取 以下,參照第十一圖描述關於環境信號提取的細節。 第Ί 圖示出了提取環境信號和提取别置信號的過程的框 ίο圖。第Η 圖所示的框圖可以被視為用於提取環境信號的 裝置的示意框圖’或用於提取環境信號的方法的流程圖表 示。 第十一圖所示的框圖示出了輸入信號X的時頻域表示 的產生1110。例如,輸入輸出信號X的第一頻帶或子頻帶 (15可以由子帶資料結構或子帶信號X1來表示。輸入輸出信號 X的第N頻帶或子頻帶可以由子帶資料結構或子帶信號X 來表示。 Q & Μ 時域至時頻域轉換111〇提供了描述輸入音頻信號的不 同頻帶中的強度的多個錢。例如信號χ丨可以表示輸入音 頻域的第-解或子頻帶的強度的時間演進(以及,可 選地,附加相位資訊)。例如信號XI可以被表示為類比信 ,或表7F為值序列(例如,所述值序列可以彳續存在 载體中)。類似地,第N信號χΝ描述了輸入 的 Ν頻帶或子頻帶中的強度。信號χι也可以被標記為第 42 20 200915300 帶信號,信號XN可以被標記為第n子帶作號 第十一圖所示的過程還包括第一増益;二 增盈計真1122。例如,如此處所描述的 、〇和第— 增益值確定器來實現增益計算112〇、1122可以使用各自的 一圖所示,可以針對子頻帶單獨執行拇兴2二=如,如第十 其他一些實施例中,可以針對—組子丄厂然而,在 算。此外,可以基於單個子帶或基於行增益計 計算1120、1122。如從第十—圖可以看到的二,增益 算1120接收第一子帶信號Χι,並被 弟—増益計 增益值,。第二增益計算1122被^ 第N子帶信號χΝ來提供第N增益值 β如基於 過程也包括第-乘法或縮放113〇以:一,所示的 1132。在第-乘法113〇中,第 乘法或縮放 15 20 一增益計算112G提供的第nj*Xl被乘以由第 工册 皿值gi’以產生加楛沾笛 子帶信號。此外,在第二乘法113 力^的第一 被乘以第N增益值g,以μ 第Ν子帶信號χ 乐JN θ皿值gN,以獲得第Ν加權 Ν 可選地,過程_還包括加權 ;^ 14〇〇,以獲得經後處理的子帶伸V1 $ 的後處理 地,第-圖所示的過程包括時頻°域° =。此外,可選 時頻域至時域轉換⑽可以換⑽’例如, 此,基於輸入音頻信號的環境 水夏見因 YN,^得輸入音頻信號χ的環境分量的時域^二J1至 號也二=法1130、1132提供的加權子帶信 圖所不的過程的輸出信號。 43 200915300 增益值的確定 以下參照第十二圖描述增益計算過程。第十-圖干出 r _不_二:=;== :特徵來計算增益因數(例如標記為g)(=: 參=第十二圖’示出了多個低級特徵計算 第十二圖所示的實施例中 # 第η低級雜計算1212 1210和 Λ, 1/Λ 丞於輸入#號X來執行低級特徵 ㈣級二算it可Γ於時域輸人音頻信號來執 給二 次確疋。然、而’選擇性地,可以基於一 15 —5夕子可^口途XI i XN來執行低級特徵的計算或確 =此外’例如使用組合器1220 (例如可以是加權組 =組合從^特徵的計算或確定咖、1212所獲得的特徵 列如=化特徵值)。因此,可以基於低級特徵確定或低 、及特徵计算1210、1212的結果的組合來獲得增益值g。- 用於確定加權係數的概念 以下’描述用於獲得加權係數的概念,所述加權係數 用於加權多個舰值以獲得作為特徵值的加權組合的增益 值。 44 200915300 用於確定加權係㈣裝置―第—實施例 S IS出了用於獲得加權係數的裝置的示意框 圖弟十一圖所不的裝置其整體被標記為1300。 5 f 10 15 裝置測包括係數確定信號產生器跡係數 號產生器13Η)被配置為接絲礎信號ΐ3ΐ : 係數較韻1314。絲確定錢產u mo被配it 供係數確疋b虎1314,從而知道係數確定信號⑶4的 兄刀1和非量之__。在—些實施例中, t道這樣關於環境分量或非環境分量㈣訊的估計就足 夠了 〇 例如,餘確定信號產生器131Q可以被配置為 供係數確定信號1314之外,提供期望增益值資訊i3i6。例 如’期望增益值資訊1316直接地或間接地描述了係數 信號⑶4的環境分量和非環境分量之間的關係。換 =望增益值資訊1316可以被視為一種描述係數確定錄的 與每境分量相關的特性的輔助資訊。例如,期望增太 訊可以描述係數確定音頻信號中(例如針對係數^音二 ^途的多個時頻點)的環境分量的強度。選擇性地,期望 增益值資訊可以贿音頻信财的非環境分量㈣度’。在 二些實施射,增益值資訊可以描述環境分量^非環 兄分量的強紅比。在-㈣施财,望增錄資味可 ^描述環較量㈣度與總的信號強度(環境和非環境分 里之間的關係或非壤境分量的強度與總的信號強度之間 45 20 200915300 的關係。然而,可以提供從上述資訊中導出的其他資訊作 為期望增益值資訊。例如,可獲得以下定義的RAD(m,k)的 估計或G(m,k)的估計作為期望增益值資訊。 —裝置1300逛包括量化特徵值確定器132〇,量化特徵值 5確定器1320被配置為提供以量化的方式描述係數確定信號 U14的特徵的多個量化特徵值1322、1324。 装置1300還包括加權係數確定器133〇,例如,加權係 =定ϋ測可以被配置為接收期望增錄資訊i3i6和 置化特徵值確定器132〇提供的多個量化特徵值 、 ⑺ 1324 。 如以下詳細描述的,加權係數確定器132〇被配置為基 ;期望增盈值資訊1316和量化特徵值1322、13來 加權係數1332的集合。 术徒供 加權係數確定器,第一實施例 。。第十四圖示出了根據本發明的實施例的加權係數 态的示意框圖。 加權係數確定器1330被配置為接收期望增益值資訊 /3=多^量化特徵值1322、1324。然而,在—些實施例 ,里化特徵值確定H 132〇可以是加權魏確定器133〇 =部分。此外’加權係數確定^測被配置為提供加權 關於加權係數確定器1330的功能,一般而言,加權係 數確定器1330被配置為確定加權係數⑽,使得基於多個 46 200915300 里^寸徵值1322、1324 (描述可以被視為輸入音頻作 定信號1314的多個特徵)的加權組合,使用力^ ^ 增益值近似於與係數確定音頻信號 =盈值。例如,期望料值可以從期望增益值資^加 導出。 換言之’例如,加權係數確定器可以被配置為確定需 要哪個加權係數來加權量化特徵值1322、1324,使得 的結果近似於由·增益值資訊1316描述的慰增益值。 …換S之’例如’加權係數確定器可以被配置為確定加 1332,使得根據該加權係數1332來配置的增益值確 定益提供增益值,所述增益值與由滅增益值資訊⑶㈣ 述的期望增贿的偏差不多於預定最大容許偏差。 加權係數確定器,第二實施例 15 以下描述用於實現加權係數確定器1330的-些具體的 可能性。 立第十五® A示出了根據本發明的力口權係數確定器的示 意框圖。第十五圖A所示的加權係數確定器其整體記 為 1500。 20 例士加權係數確疋器丨5⑽包括加權組合器1510。例 如加權,、且口器151〇可以被配置為接收多個量化特徵值 1312、1324和加權係數1332的集合。此外,例如,加權組 口器1510可以被配置為,根據加權係數丨332,通過組合量 化特徵值1322、I%4來提供增益值咖(或其序列)。例 47 200915300 ^,加權組合器151G可以被配置為執行與 =如同的加權。在—些實施财,甚至可以使用加權 :且4 260來實現加權組合器151〇。因此,加權組合器⑸〇 被配置為提供增益值1512 (或其序列)。 5抑加權係數確定益1500還包括相似性確定器或差別確定 器1520。例如’相似性確定器或差別確定器152〇可以被配 置為接,描述期望增益值的期望增益值資訊咖以及由加 權組合器1510提供的增益值lsl2。例如,相似性確定器/ 差別確疋益1520可以被配置為確定相似性度量1522,相似 W性度里1522例如以定性或定量的方式描述由資訊⑶6所 描述的期望增益值與由加權組合器1510提供的增益值 1512之間的相似性。選擇性地,相似性確定器/差別^定器 1520 了以被配置為提供描述其間的偏差的偏差度量。 加權係數確定器1500包括加權係數調整器153〇,加權 15係數調整器1530被配置為接收相似性資訊1522,並基於此 確疋疋否萬要改變加權係數1332或加權係數1332是否應 保持恒定。例如,若由相似性確定器/差別確定器152〇提供 的相似性育訊1522指示了增益值1512與期望增益值1316 之間的差別或偏差低於預定偏差臨界值,則加權係數調整 20器1530可以認可加權係數Π32是被合適地選擇的並且應 當維持。然而,若相似性資訊1522指示增益值1512與期 望増益值1316之間的差別或偏差大於預定偏差臨界值,則 加權係數調整器1530可以改變加權係數1332,所述改變的 目的是減小增益值1512與期望增益值1316之間的差別。 48 200915300 =處應注意,針對加權係數1332的調整的不同概念是 可此的。例如’梯度下降齡可·於這個目的。選擇性 地,也可以進行加權係數的隨機改變。在—此 加權係數調整器⑽可以被配置為執行優化舰。例如, 所述優化可以基於迭代演算法。 r 15 以上概括為,在-些實施例中,可 饋概念來叙加權餘1332,以產生由 獲得的增益值⑸2與㈣增益值1316之間足夠;;^別。 加權係數確定器,第三實施例 一音五圖/示出了加權係數確定器的另-個實施例的 15^)。針五圖Β所示的加權係數確定器其整體被標 化門確定^⑽包括方㈣統解算器1560或優 解—》1560。方程系統解算器或 1560被配置為接收描 門喊解异: 增益值μ 胃⑽16,所述期望 51 ιαη 不。為^响_。方程系統解算器/優化問題解算 可以進—步被配㈣接收^量化特徵值1322、 解料/優彳刚解算器156G可以被配置為 棱供加榷係數1332的集合。 為m,疋计由#方私系統解算器1560接收的量化特徵值被標記 :’進f步假定加權係數被標記為例如七和^^,例 性:統解算器可以被配置為解算以下形式的方程 49 20 200915300 尽叫⑽心=[%气,,其中 /=1
Axpmw,/可以表示具有索引丨的時頻點的期望增益值。 W/,/表不具有索引1的時頻點的第“固特徵值。可以考慮乙 個多個時頻點用於解算該方程系統。 5 4目應地’通過解算方程系統,可以確定線性加權係备 仏和非線性加權係數(或指數加權係數)冷i。 ’、 、,選擇性的實施例中,可以執行優化。例如,可以、兩 過確,一組合適的加權係數A來最小化由 [ ^ \ ^^pected^l ^2ΐα^χ/1 /=1 ' κ g expected 丄—
v -1 J 10 所確定的值。此處,(·)表示期望增益值與通過加權牲 徵值气獲得的增益值之間的差向量。差向量的項目可以與 不同的時頻點相關,使用索引1=1,,L來標記。丨丨·丨丨表示數^ 上的距離度量,例如數學上的向量範數。 換5之,可以這樣確定加權係數,即使得期望增益值 I5 畺化特徵值1322、1324的加權組合獲得的増益值之間 的差別最小化。然而,應理解,術語“最小化”此處不應 被認為是以非常嚴格的方式。更合理地,術語最小化表示 將所述差別降至特定臨界值以下。 20 加權係數確定器,第四實施例 第十六圖示出了根據本發明的實施例的另—個加權係 50 200915300 數轉疋器的不意框圖。第十六圖所示的加權係數確定器其 整體被標記為1600。 加權係數確定器160〇包括神經網1610。例如,該神經 網1610可以被配置為接收描述期望增益值的資訊⑶&以 5及多個量化特徵值1322、1324。此外,例如,神經網刪 可以被配置為提供加權係冑1332。例如,神經網工㈣可以 被配置為學習加權係數,當所述加權係數應用於加權量化 特徵=1322、1324時產生增益值,所述增益值與由期望增 盈值貧訊1316·述的期望增益值充分近似。 10 隨後描述進一步的細節。 用於確定加權係數的裝置一一第二實施例 ^第十七圖示出了根據本發明的實施例的用於確定加權 係數的衣置的示意框圖。第十七圖所示的裝置與第十三圖 I5所不的裝置類似。相應地,使用相同的附圖標記來標記相 同的裝置和信號。 第十七圖所示的裝置1700包括包括係數確定信號產生 器。1310,係數確定信號產生器131〇可以被配置為基礎 信號1312。在一個實施例中,係數確定信號產生器i3i〇 20可以被配置為把基礎信號1312與環境信號相加,以獲得係 數確定信號1314。例如,係數確定信號1314可以以時域表 示或以時頻域表示而提供。 係數確定信號產生器可以進一步被配置為提供描述期 望增益值的期望增益值資訊1316。例如,係數確定信號產 51 200915300 生1310可以被配置為基於關於把基礎信號與環境信號相 加的内部知識來提供期望增益值資訊。 可選地,裝置1700可以進一步包括時域至時頻域轉換 器1316’時域至時頻域轉換器1316可以被配置為提供時頻 5域表示的係數確定信號1318。此外,裝置17〇〇包括量化特 ,值確定器1320’例如,量化特徵值確定器132〇可以包括 第-量化特徵值確定器132〇a和第二量化特徵值破定器 1320b。因此,量化特徵值確定器132〇可以被配置為提供 多個量化特徵值1322、1324。 10 係數確定信號產生器一—第一實施例 —以下描述提供係數確定信號13丨4的不同的概念。參照 第十八圖A、第权圖B、第十九圖和第二十圖所插述的 概心同時適用於信號的時域表示和時頻域表示。 15 ★第十八圖A示出了係數確定信號產生器的示意框圖。 第十八圖A所示的係數確定信號產生器其整體被標記為 1800。係數確定信號產生器18〇〇被配置為接收帶有可忽略 的環境信號分量的音頻信號作為輸入信號181〇。 此外,係數確定信號產生器18〇〇可以包括人工環境信 2〇旒產生器1820’人工環境信號產生器182〇被配置為基於音 頻信號1810提供人工環境信號。係數確定信號產生器18〇〇 也包括環境信號相加器1830,環境信號相加器183〇被配置 為接收音頻信號1810和人工環境信號1822,並把音頻信號 1810與人工環境信號1822相加,以獲得係數確定信號 52 200915300 1832。
此外’例如’係數確定信號產生器丨8 〇 〇可以被配置 基於用於產生人工魏紐1822的錄或驗將音頻^ mo與人工環境信號1822進行組合的參數來提供關= 5望增益值的資訊。換言之’使用關於人工環境信號的產生 的模態的知識和/或人工環境信號與音頻信號1810的租合 的知識來獲得期望增益值資訊1834。 、D 例如,人工環境k號產生器1820可以被配置為提供基 於音頻信號1810的混響信號作為人工環境信號1822。 10 係數確定信號產生器 第二實施例 第十八圖B示出了根據本發明的另一個實施例的係數 確定信號產生器的示意框圖。第十八圖B所示的係數確定 信號產生器其整體被標記為1850。 15 係數確定信號產生器1850被配置為接收帶有可忽略的 復境#號分量的音頻信號I860,此外還有環境信號1862。 係數確定信號產生器1850也可以包括環境信號相加器 1870,環境信號相加器1870被配置為將音頻信號186〇(具 有可忽略的環境信號分量)與環境信號1862組合。環境信 20號相加器1870被配置為提供係數確定信號1872。 此外,由於在係數確定信號產生器185〇中帶有可忽略 的環〗兄彳δ號分量的音頻信號與環境信號是以隔離的形式存 在的,因此,可以由它們導出期望增益值資訊1874。 例如,可以這樣導出期望增益值資訊1874,即使得期 53 200915300 望增益值資訊描述該音頻信號和壤境信號的幅度之比。例 如,期望增益值資訊可以描述針對係數確定信號1872 (或 音頻信號I860)的時頻域表示的多個時頻點的強度的比 值。選擇性地’期望增益值資訊1874可以包括關於多個時 5 頻點的環境信號1862的強度的資訊。 ί 係數確定信號產生器--第三實施例 參照第十九圖和第二十圖,插述了用於確定期望增益 值資訊的另一種途徑。第十九圖示出了根據本發明的 ίο Μ的係數確定信號產生器的示意框圖。第十九圖所示的係 數確定信號產生器其整體被標記為19〇〇。 ’、 係數確定信號產生器1900被配置為接收多聲道音頻俨 號。例如,係數確定信號產生器聰可以被配置為^收多5 聲道音頻信號的第一聲道1910和第二聲道體。此外,係 (15 定信號產生器测可以包括基於聲道關係的特徵值確 疋器,例如,基於相關性的特徵值確定器192〇。基於聲道 關係的特徵值確定器卿可以被配置為提供特徵值,、所述 特徵值是基於多聲道音頻信號的兩個或更多聲道之間的關 係。 2〇日在—些實施例中’這樣的基於聲道關係的特徵值可以 提供關於多聲道音頻信號的環境分量内容的充分可靠的資 需另外的贱知識。因此,由基於聲道關係的特徵 …確定器1920獲得的描述多聲道音頻信號的兩個或更多聲 逼之間的關係的資訊可以用作期望增益值資訊1922。此 54 200915300 外,在一些實施例中,可以使用多聲道音頻信號的單音頻 聲道作為係數確定信號1924。 係數確定信號產生器——第四實施例 5 隨後參照第二十圖描述類似的概念。第二十圖示出了 根據本發明的實施例的係數確定信號產生器的示意框圖。 第二十圖所示的係數確定信號產生器其整體被標記為 2000。 係數確定信號產生器2000與係數確定信號產生器 ίο 1900類似,因此,相同的信號使用相同的附圖標記來表示。 然而,係數確定信號產生器2000包括多聲道至單聲道 組合器2010,多聲道至單聲道組合器2010被配置為組合第 一聲道1910和第二聲道1912(基於聲道關係的特徵值確定 器1920使用第一聲道1910和第二聲道1912來確定基於聲 15 道關係的特徵值)來獲得係數確定信號1924。換言之,不 是使用多聲道音頻信號的單聲道信號,而是使用聲道信號 的組合來獲得係數確定信號1924。 參照第十九圖和第二十圖所描述的概念,可以注意 到,可以使用多聲道音頻信號來獲得係數確定信號。在典 20型的多聲道音頻信號中,各個聲道之間的關係提供了關於 多聲道音頻信號的環境分量内容的資訊。相應地,可以使 用多聲道音頻信號來獲得係數確定信號,並提供表徵該係 數確定信號的期望增益值資訊。因此,利用身歷聲信號或 不同類型的多聲道音頻信號,可以校準(例如通過確定各 55 200915300 個係數)增益值確定器,所述增益值確定器基於音頻信號 的單聲道來操作。因此,通過使用身歷聲信號或不同類型 的多聲道音頻信號’可以獲得用於環境信號提取器的係 數’該係數可以用於(例如在獲得該係數之後)處理單聲 道音頻信號。
15 用於提取環境信號的方法 一^第二十一圖示出了用於基於輸入音頻信號的時頻域表 不f提取環境信號的方法的流程圖,所述表示以描述多個 10頻帶的多個子帶信號的形式表示輸入音頻信號。第二十一 圖所示的方法其整體被標記為2100。 個或 方法2100包括獲得2110描述輸入音頻信號的 更多特徵的一個或更多量化特徵值。 a 去21GG還包括針對輸人音頻信制時賴表示的給 ’確定2120時變環境信號增益值序列作為一個或 徵值的函數’使得該增益值在數量上取決於該量 20 —方法2100還包括使用所述時變增益值來加 不該時頻域表示的給定頻帶的子帶信號。 萑130表 述的例中’方法2100可以被操作為執行此處描 用於獲得加權係數的方法 第二十二圖示出了用於獲得加權係數的方法的流程 56 200915300 圖’所述加權係數用於參數化用於從輸入音頻信號中提取 環境信號的增益值確定器。第二十二圖所示的方法其整體 被標記為2200。 方法2200包括獲得2210係數確定輸入音頻信號,從 5而知曉關於輸入音頻信號中出現的環境分量的資訊,或描 述環境分量和非環境分量之間的關係的資訊。 二方法2200還包括確定2220加權係數,使得基於根據 省;^權係數對描述係數確定輸入音頻信號的多個特徵的多 個量化特難的加餘合而麟的增益值,近似於與係數 1〇確定輸入音頻信號相關聯的期望增益值。 此處描述的方法可以由關於本發明的裝置來描述的任 何特徵和功能來補充。 15 根據本發明方法的特定實現要求,可
=見本發明的方法。可以使用具有電子可讀控= 存在其上的數位儲存介質,例如軟碟、編、CD =储 PROM > eprom . EEpR〇M ^ pLAsH 現’所述數位儲存介管鱼/ 、遛不進仃該實 明的方法。-般電?系統合作來執蝴 載體上的程式碼的電 存在機器可讀 電腦上運行時,產品,當所述電腦程式產品在 法,之,因此===本發明的方 _腦程式在電腦上運行時 20 200915300 的方法。 3.根據另一個實施例的方法的描述 3.1問題的描述 5 根據另一個實施例的方法的目的是提取適於音頻俨號 的盲上混音的前置信號和環境信號。可以通過為前置^ 提供前置信號以及為後置聲道提供環境信號來獲得少= 環繞聲音信號。 夂夕、 已經存在用於環境信號的提取的多種方法: 10 I使用NMF (見2.1.3部分) 2. 使用根據左和右輸入信號的相關性的時頻遮罩(見 2.2.4 部分) ' 3. 使用PCA和多聲道輸入信號(見2·3 2部分) 方法1依賴於迭代數值優化技術,一次處理幾秒長度 15 (例如2··.4秒)的-段。因此,該方法具有高計算複雜= Γ具有至少上述段長度的演算法延遲。相反,本發明的方 有低計算複雜度’並具有與方法1相比較低的演算法 2〇 士 I方法2和3依賴於輸人聲道錢之_顯著差別,即 =所有輸人聲道信號都相同或幾乎相同,則該方法 =適的環境錢。相反,本發_方法_處理 成+相同的單聲道信號或者多聲道信號。 及 概括而言,所提出的方法的優點如下: *低複雜度 58 200915300 • 低延遲 •對於單聲道或幾乎單聲道的輸入信號以及身 輸入信號都適用 a 5 3.2方法描述 通過從輸入信號中提取環境信號和前置信號,獲得多 聲道環繞信號(例如具有5.丨或7.丨格式)。環境俨^ 入後置聲道。制中心聲道來擴大甜點並重播前置^號或 原始輸入信號。其他前置聲道重播前置信號或原始輸入信 10號(即’左前置聲道重播原始左前置信號或原始左前置作 號的經處理的版本)。第十圖示出了該上混音過程的框圖: 環境信號的提取在時頻域實施。本發明的方法使用度 ,每個子帶信號的“環境相似度”的低級特徵(也被稱ς 量化特徵值)來计算每個子帶信號的時變權重 15增益值)。在錄合成之前制該㈣來計算環=== 前置信號計算互補權重。 °~ 環境聲音的典型特性的示例是: • ΐ直f聲音相比’環境聲音是相當安靜的聲音。 •環境聲音的音調少於直射聲音。 20 +用於檢測這樣的特性的合適的低級特徵在部分中 描述: #度量信號分量的安靜度的能量特徵 #度量信號分量的吵鬧度的音調特徵 使用例如方程!,從計算出的特徵m仏,q中導出帶 59 200915300 有子T索引f和時間索引r的時變增益因數g㈤,Τ ) g(^,T) = ^aim^,T)^ (1) /=1 其中K是特徵的數目,參數%和我用於不同特徵的加 # ° ( 5 r 10 15 0第十—圖不出了使用低級特徵提取的環境信號提取過 知,框圖。輸入信號X是單聲道音頻信號。為了處理具有 =夕ί道的可崎每個聲道分別㈣該處理。分析 =波裔組使用例如STFT (短期傅立葉變換)或數位遽波 =!輸入信號分離為1"個頻帶(n>i)。該分析濾波器 出是N個子帶信號Xi,。如第十―_示, 帶錢科算—麵更㈠眺雜胁合這也 特,值來獲得增益因數gi,。接著,使用增益因數 gi來加權每個子帶信號&。 替單:過程的一個優ί擴展是使用子帶信號組代 ,. JU 了以組合子帶信號以开i成子帶 此處所描述的處理可 ::于4唬組。 或更多子帶紳 使^子奸歧來執行’即從一個 計算出低級ϋ,包含—個或更多子帶信號) 的所=帶信幻mrm(㈣屬於特定組 獲得環境信權-個或更多子帶信號, 權重互補的權重,二;、的°二使用與用於環境信號的 信就的前置聲道的信‘、。以、;处理將要送至多聲道環繞 60 20 200915300 環境信號的附加重播產生了更多的環境信號分量(與 原始輸入信號相比)。計算用於前置信號的計算的權重,這 些權重與用於計算環境信號的權重成反比。由此,與對應 的原始輸入信號相比,每個產生的前置信號包含較少的環 5境k號分量和較多的直射信號分量。 如第十一圖所示,使用頻域中的附加後處理並使用分 Γ 析濾波器組的逆過程(即合成濾波器組)進行重新合成, 從而進一步(可選地)增強環境信號(關於所產生的環繞 聲音信號的感知品質)。 ' 10 第7部分詳細描述了後處理。應注意,一些後處理演 算法可以在頻域或時域中實施。 第十一圖示出了基於低級特徵提取的針對一個子帶 (或一組子帶信號)的增益計算過程的框圖。 各種低級特徵,以產生增益因數。 、、口 15 彳以使職態_和倾舰(_在_上和頻率 上)進一步對所產生的增益進行後處理。 、 以下部分描述適於表徵似環境信號品質一 2〇 土 ’所述特徵表徵音頻信號(寬頻)或 於二… 率區域(即子帶)或子帶:唬的特及 濾波器組或時頻變換。 中的特徵需要使 此處使用音頻信號难]的頻譜表示 計算,其中岐子帶索引,r是崎引。頻^ = 61 200915300 範圍)由Sk表示,其中k是頻 使用信號頻譜的特徵計管、 即幅度、能量、對數幅度广列的頻譜表示, 的頻譜(例如XG.23)。如*何其他經非線性處理 示為實數。 果π有料_,假定所述頻譜表 可以將相鄰子帶中計算 組’例如通過對這些子帶的特徵=類由^ 均值)頻譜的音調。 冲开出(例如通過計算其 希望所a十算的特徵的值範圍 間。以下描述的-些特徵ϋ不同的預定區 這些情況下,制合適的映 的值。在 映射到預定區間。用於映射函數的—個描= 徵的值 中給出 lu間早的不例在方程2 0, x<0 ^ = <|χ,0<χ<1 1, χ>1 15 (2) 例如’可以使用後處理器53G、532來執行所述映射 3.3.1音調特徵 將雜訊與聲音 此處’術语音調(Tonality)用於描述 的音質區分開的特徵”。 音調信號由非平坦信號頻譜來表徵 平坦的頻譜。由此,音哨e 雜號具有 雜訊比音調信號更隨機。因此, 可以以較小的_誤差, … 日翻舰雜訊信號更^,而 62 20 200915300 從在先信號值中預測出音調信號,而不能很好地預測雜訊 信號。 以下描述可以用於定量地描述音調的多個特徵。換言 之,此處描述的特徵可以用於確定量化特徵值,或可以用 5作量化特徵值。 f 頻譜平坦性度量: 頻譜平坦性度量(SFM)被計算為頻譜S的幾何均值 與算術均值之比。 10 SFM(S) =
選擇性地,可以使用方程4來產生相同的結果。 (Σ 二 log, SFM(S) = —.- (4)
可以從SFM (S)導出特徵值。 15 頻譜峰值因數
頻譜峰值因數(Spectral Crest Factor )被計算為頻譜X (或S)的最大值與均值之比。 max〇S)_ (5) 可以從SCF (S)導出量化特徵值。 63 20 200915300 使用峰值檢測的音調計算: 在ISO/IEC 11172-3MPEG-1心理聲學模型丨(針對層夏 和2而建議)[IS〇93]中描述了—種方法,用於在音調 曰调:i之間進行區分’ _方法用於確定感知音頻編碼的 ,罩臨界值。通職查錢譜紐&對應賴率周圍 率範圍△/内的頻譜值的水準,確定頻譜系數&的音調。^ &的能量超過其周圍值Si+k的能量,例如㈣七HU, 則檢測到峰值(即局部最大值)。若局部最大值超過其周圍 的值7dB歧多’則它被_為是音麵。否則,該局部 最大值被歸類為非音調的。 、曾可以導出描述最大值是否為音調的特徵值。同樣,可 以導出描述例如在給定的相祕域記紐在彡少音調時頻 點的特徵值。 15 使用轉線性處理的副本之間的比值的音調計算 程6所示’向量的料坦性被度量為頻譜S的經 非線性處理副本之間的比值,其中…。 (6) F(S) = - Μ 方程7以示出了兩個具體的實現。 HS) =
,〇<θ<ι Σ>;| (7) ,α>\ (8) 64 20 200915300 可以從F (S)導出量化特徵值。 使用經不同濾波的頻譜的比值的音調計算 以下音調度量在美國專利5,918,203[HEG+99]中描述。 針對頻率線k的譜系數s k的音調由頻譜S的兩個經渡 波的副本的比值Θ計算得到’其中’第一濾波器函數^具 有微分特性而第二濾、波器函數G具有積分特性或比第一豫 波器差的微分雜’ e和d是根據濾波!I參數而選擇的整= 常數,使得在每種情況下補償濾波器的延遲。 正 (9) 的傳=Γ。示出了—種具體的實現,其中H是微分渡波器 ®(k)=msk+c) (1〇) 可以從%或Θ(幻中導出量化特徵值。 15 使用週期函數的音調計算 65 20 200915300 高度相似性(或低差別)指示該信號具有週期r的強列 週期性。 週期函數的示例是自相關函數和平均幅度差函數 [dCK03]。方程η示出了信號x的自相關函數…,其中 5 積分視窗大小為W。 u 〃
t+IV = Σ xJxj,r (η) j=t+l 使用頻譜系數預測的音調計算 在ISO/IEC 11172-3 MPEG]心理聲學模型2 (針對層 3而建議)中描述了使躲據在先係數點&和& 2來預^ 複頻譜系數X;的音調估計。 “ —根據方程12和13,複頻譜系數f)的 幅度 〇和相位火队Γ)的當前值可以從先前的值估計卩 到。 °于 15
A ^〇(ω^) - Χ0(ω,τ -1) + (Χ0(ω,τ-1) - Χ〇(^>Γ __ (12) φ{ω, τ) = φ{ω^ r -1) + {φ{ω, r -1) - φ(ω, τ ~ 2)) (13) 估計的和實際測量的值之間的歸—化歐氏距離(如方 程14所示)是音調的度量,並可以用於導出量化特徵值。 Λ. (14) ο{ω,τ) = ί·^〇0,Ό-Ζ0〇,2·))2 + (^:Γ)-^^ 名)(必,Γ)+义〇 (仿,r) 從預測誤差P(岣也可以計算出針對一個譜系數的音調 (見方程15,其中z(iy,r)是複數值),大的預測誤差產生小 66 20 (15) 200915300 的音調值。 Ρ(ω) = Χ(ω,τ)-2Χ(ω,τ 使用時域預測的音調計曾 的作:m:’可μ從先前的樣本預測出時間索引為k r 15 p左二二:?®丨f ’對於週期信號預測誤差較小,而對於 =魏賴錄A。由此,刺減與信制音調成 反比。 相應地’可以從_衫中導出量化特徵值。 3.3.2能量特徵 量特徵度量子帶内的瞬變能量。當頻帶的能量内容 日^帛於頻帶的環境信號提取的加權因數將會較 _ L卜,,頻片(Ule)非常可能是直射信號分量。 子册=中^特徵也可以從同一子帶的相鄰(關於時間) :=:= =帶信號在較近的過去和未來 了-個示例。根據::應用 大值來計算特徵 <r<=内的相軒帶樣本的最 W㈣,其中τ確定了觀察視窗的大小。 从㈣,卿,·,γ + _ 门在較近的過去或未來夠量的瞬變子 的最大值被視為分_特=子帶能量 組合的不同參數)。 使用用於方程1所述的 67 20 200915300 以下描述對從用於、3立 取前置信號和環户h 1混音的音頻信號中以低複雜度提 所、+、被I 5虎的一些擴展。 所述擴展關係到特 徵中導出頻譜權重的^蛛取、特徵的後處理以及從特 3·3·3對特徵集合的擴展 ::下描,對上述特徵集合的可選擴展。 4b特徵是書描4 了音調特跡能量義的使用。這 一行做疋(例如)在短期傅立 > 而且是時間索引m和頻 =(STFT)域中计鼻的’ 域表示(例如通過STFT ^ ^的函數。信號咖的時頻 歷聲信號的情況下,左寫作X(m,k)。在處理身 被寫作X§號被寫作难],右聲道信號 破冩作峨。上標“*,,絲複共輕。 15 可選地’可以使用-個或更多町特徵: 3.3.3.U*計聲制相干或相關性的特徵 相干的定義 f兩個信號相等,可能具有不同的縮放比例和延遲, “相位差是常數,則兩個信號相干。 相關性的定義 ,兩個信號相等,可能具有不同的縮放比例,則兩個 就相關。 通常,通過歸-化互相_數r來度量每個長度為N 白勺兩個信號之間的相關性 68 20 (20) 200915300 兑中 變,在、:際;疋值。物虎特性隨時間的改 例如’啦卜@1=;>^用—階遞迴濾波器來代替求和操作, 4刀的計算可以由
15 (21) 被稱為動^中又是“遺忘因數,,。在下文中,該計算 冉二移土平均估計(mae),,,fmae(z)。 旦曰萌,而δ ’身歷聲錄音的左和右聲道中的環境信號分 、=::_的。當在混響室中使用身歷聲麥克風技術對聲 湄錄日日^ ’兩個麥克風信號是不同的’這是因為從聲 在人ί克Ϊ的路徑是不同的(主要因為反射模式的不同)。 =錄音中,通過人工身歷聲混響引入解相關。由此, 用於環境信號提取的合適特徵度量左和右 聲道信號之間的 相關性或相干。 在[AJ02]中描述的聲道間短時相干(ICSTC)函數是— 個合適的特徵。ICSTC Φ是由左和右聲道信號之間的互相 關①丨2的MAE以及左聲道能量φ„和右聲道能量φ ΜΑΕ計算得到的。 2、 (22) ^n(m,k)022(m,k) 其中 (m^) = fmE (^i k)K k)) (23) 69 200915300 事實上,[AJ02]中描述的ICSTC的方程幾乎與歸一化 互相關係數相同,其中唯一的區別在於沒有應用資料的令 • 心調整(centering)(中心調整是指移除均值,如方程2〇 所不.xcentered = X - J ° 5 在[AJ02]中’環境索引(這是“環境相似”程度的特徵 指示)是由非線性映射從ICSTC計算得到的,例如使用雙 广曲線切線(hyperbolic tangent)。 3.3.3.2聲道間水準差 基於聲道間水準差(ICLD)的特徵用於確定聲源在身 歷聲圖像(全景)内的突出位置。通過應用*景化(panning) 係數a,根據 '[灸]=(1-〇〇外介] (24) x2[k]-as[k] (25) 15 20 來加權5[幻和气[幻中s[y的幅度,從而將源s[k]向特定 的方向進行幅度全景化(d )。 插接在針對㈣㈣料算時,絲IGLD料轉遞了- =二,定在特定時獅中占優 C以及全景化係數α)。 引'^基於1⑽的特徵是如[AJ〇4]所描述的全景化索 70 (26)200915300 卜2_Χ^}η^)Χ*2(ηι^)_Λ ν ^ (w, k)X* (m, k) + X2 (m, k)X*2{m, k) y • sign{Xx(m,k)X*x (m,k) - X2(m,k)X*2{m,k)) 一種在計算上更有效率的用於計算上述全景化索引的 備選方法是使用
E(m,k) 2 ^ Xx{m,k)\- X2{m,k)\ ^ λ K X,(m,A:)| + X2{m,ki ) (27) 與Ψ〇,Αγ)相比,Ξ〇α)的附加優點在於,它完全等於全 景化係數α,而〒(讲女)只是近似於α。方程27中的公式是 通過離散變數xe卜叫的函數f(x)的質心(重力中心)的 計算以及/㈠=|不(叫幻|和/(1) = |尤2(所,免)|而產生。 3.3.3.3頻譜質心
幅度頻譜或長度為N的幅度頻譜|Sk|的範圍的頻譜質心 YI根據下式來計算: 、 (28) ύι=ΣΜ± Σ:ΛΙ 15 觸質心是—種與聲音的感知亮度相關(當在頻雄的 ^個頻率範圍上計算時)的低級賴。賴質㈣Ηζ曰产 量,或在對頻率範圍的最大值歸一化時是無量綱的。又 4.特徵組合 2〇 特徵組合是由要減小特徵的進—步處理的計算 或評估特徵在時間上的行進的要求而推動的。、σ 71 200915300 所描述的特徵是針對每個〃 立葉變換)和針對每個頻率B其中計鼻離散傅 的。從相鄰塊(通;二ίΐ或相鄰頻率點的集合來計算 5 15 合在-起,並由值可以被組 ::在-組相_(、’’)上物4= # 方差或標準差
(例如’—階或更高階微分、加權均值或里 他低通濾波) H • 傅立葉變換係數 例如’特徵組合可以由合併器930、940之-來執行。 5.使用監督衰退或分類的頻譜權重的計算 我們饭疋音頻㈣刺是由直射信號分量d[n] 和環境信號分量a[n]加性地組成 x[n] = d[ri\ +a[n] (29) 本^_譜權4的計算描料舰值與參數的組 所述參數可以是啟發式確定的參數(例如參照 =地,可錄據環境信齡量邮度與直射信號分 罝的幅度之比的估計來確定頻譜權重。病們宗踺 與直射錢㈣度之比、㈣)®油疋義从^ (30) 72 20 200915300 號 的巾备度之比的估計 RAD{fn,k) 使用環境信號與直射信 來計算環境信鱿。使用
—,,v/ (31) 頻譜3算科環境信號提取_譜權重G(m,k),並通過 r 15 % \A(m9k)\ = G(m,k)\X(m,k)\ (巧) 來導出壤境说的幅度聲譜圖。 這種方法類似於用於日減少語音信號的雜訊的頻譜加權 (或短期頻射減)’但^,觸權妓轉子帶中的時 SNR的估計而計算出來的’例如參見咏 主要的問題是^α)的估計。以下描述了兩種可能的 方法:⑴監督回歸,以及(2)監督分類。 應注意,這些方法能夠一起處理從頻率 包括頻率點的組)計算出的特徵。 ρ
例如:環境信號索引和全睪於去2,曰A 祈、、^ 厅、化索引疋針對每個頻率點 (barkband)而計算的。雖置疋針對巴克頻帶 ㈣产Pί 些特徵是使用不同的頻率 ° '疋b們都是使用相同的分 方法的過程。 J刀犬貝态/U坪 5.1回歸 73 20 200915300 應用神經網(多層感知器)對之,幻進行估計。有
彳 ΙΪΙ、阳 tS ^ J Λ:使用一個神經網來估計針對所有頻率點的 ⑽A ’或使用更多的神經網但是每個神經網估計針對一 们或更多領率點的4〇,幻。 5 ^每個特徵被送入一個輸入神經元。在第ό部分描述該 網的甽練。每個輸出神經元被分配給一個頻率點的 RAD{^k) 0 、‘’、的 5·2分類 1〇 '與回歸方法類似,通過神經網來完成使用分類方法 幻的估計。用於訓練的參考值被量化到任意大小的區 中每個區間表示一類(例如,一類可以包括區 ,的所有及,幻)。輸出神經元的數量相比於回歸方 法來說要大η倍,其中η是區間的數量。 15 6.訓練 對於訓練,主要問題是正確選擇參考值〜㈣)。 提出了兩個選項(然而,第一選項是優選的): 1. 使用從信號測量的參考值,在所述信號中, 2〇號和環境信號分離地可用 子k 2. 使用從身歷聲信號計算出的基於相關性的 為用於處理單聲道信號的參考值 、* ,作 6.1選項1 74 200915300 。亥選項需要帶有突出的直射信號分量和可忽略的環境 虎刀里的音頻信號(x[nhd[n]),例如在乾燥環境中錄音 的信號。 例如,音頻信號1810、1860可以被認為是這樣的帶有 5統治性的折射分量的信號。 通過混響處理器或通過與房間衝擊回應(RIR)迴旋, 產生人工混響信號a[n],所述房間衝擊回應可以在真實的 房間中採樣。選擇性地,可以使用其他環境信號,例如歡 呼、風、雨或其他環境雜訊的錄音。 10 接著’使用方程30 ’從d[n]和a[n]的STFT表示獲得 用於訓練的參考值。 在一些實施例中,基於直射信號分量和環境信號分量 的知識,可以根據方程30來確定幅度比。隨後,例如使用 方程31,可以基於幅度比來獲得期望增益值。這個期望增 益值可以用作期望增益值資訊1316、1834。 6.2選項2 基於身歷聲錄音的左和右聲道之間的相關性的特徵傳 遞了用於環境信號提取處理的強大提示。然而,在處理單 2〇聲道信號時,這些提示都不可用。本方法能夠處理^聲道 信號。 選擇用於訓練的參考值的有效選項是使用身歷聲信 號,從中計异基於相關性的特徵,並使用該特徵作 值(例如用於獲得期望增益值)。 …多 200915300 例如,可Μ駿料歸訊咖來描賴參考值, 或可以仗该參考值中導出期望增益值資訊192〇。 然後,可以把身歷聲錄音下混音至單聲道,以 5 =低級特徵,或可以從左和右聲道信Μ分別計算低級 -些ίϋ圖和第二十圖示出了應用本部分描述的概念的 -種備選解決方案是根據方程31從參考值 算權重G(m,l〇,並使用G(m,k)作為用於訓練的ς考值。 f這種情況下,分類器/回歸方法輸_譜權值的 G{m,k)。 1 環境信號的後處理 以下部分描述用於增強環境信號的感知品 15 後處理方法。 liil liL· ΛΑ- π_Κ . t is 質的合適的 在-些實施例中,可以由後處理器來執行後處理。 7.1子帶信號的非線性處理 含二=號(例如由加權子帶信號表示)不僅包 <兄刀s也包含直射信號分量 號的分離並不完美)。_ w A衣政#u和直射仏 境對直射比物後倾,以增強其環 盘直射聲立減 _射分量的數量比。注意到, 所#、h %<境聲音相#安靜,由此激發(福ivate) 1於在保持安靜聲音的同時衰減大的聲 76 20 200915300 音的方法是應用聲譜圖係數(例如加權子帶信號) 性壓縮曲線。 方程17給出了-種合適的壓縮曲線的示例,其中 臨界值’參數P決定壓縮度,其中〇<ρ<ι。 (17)
χ,χ < C
P(X-C) + C,X>C / 另-個用於非線性修改的示例是其中, 然而相對於較大的值,較小的值増加得更多…個 函數的不例是户^,例如’其中X可以表示加權子帶信^ 的值’ ”可以表讀後纽的加權子帶信號的值。 在-些實施例中’本部分描述的子帶信號的非線性處 理可以由非線性壓縮器732來執行。 t 15 7.2延遲的引入 义對環境4口號引入幾宅秒(例如14ms)的延遲(例如與 :置信號或直射信號相比)以改進前置圖像的穩定性。這 是優先效應的結果,如果這樣呈現兩個相同的聲音,即一 個聲音A的開始相對應另一個聲音㈣開始有所延遲,而 2〇且兩個聲音在不同的方向呈現(相對於收聽者),則發生所 述優先效應。只要該延遲在合適的範圍内 就如同來自^現聲音B的方向[LCYG99]。 通過對環境信號引入延遲,即使在環境信號中包含— 77 200915300 =直=信號分量,也能夠更好地將直射聲源定位在收聽者 的丽方。 在些只施例中,本部分描述的延遲的引入可以 遲器734中執行。 7.3信號自適應均衡 V 為了最小化環繞聲音信號的音色賦色,對環境信號(例 如以加權子帶信號的形式表示)進行均衡,以使其長期功 率譜密度(PSD)適應於輸入信號。這是在兩級過程中實施 10的。 使用Welch方法,估計輸入信號和環境信號a[k] 兩者的PSD。分別產生c(的和/:α(ω)。在重新合成之前,使 用因數
15 Η(ω) = (18) 信號自適應均衡是由這樣的觀察而激發的,即所提取 的環境信號趨於具有比輸入信號更小的頻譜傾斜的特徵, 即環境信號可能比輸入信號發聲更響亮。在許多錄音中, 2〇環境聲音主要是由房間混響產生的。由於許多用於錄音的 房間對較高頻率相對於較低頻率而言具有更短的混響時 間,因此,相應地對環境信號進行均衡是合理的。然而, 非正式收聽測試已經表明’對輸入信號的長期PSD的均衡 78 200915300 是一種有效的方法。 些實施例中,本部分描述的信號自適應均衡可以 • 由音色賦色補償器736來執行。 5 7·4瞬變抑制 ,在後置聲道信號中引入延遲(見72部分),如果出現 Γ 瞬變信號分量[购3]並且該延遲超過了信號相關
Uignal-dependem)值(回聲臨界值[LCYG99]),則引入延 遲將引起對兩個分離的聲音的感知(類似於回聲)。通過抑 ⑴㈣繞聲音信號或環境信號中的瞬變信號分量,可以衰減 該回聲。由於顯著減少了後置聲道中的可定位點源的表現 (aPpearance),通過瞬變抑制實現了前置圖像的額外的穩 定性。 ^ 考慮到理想的包絡環境聲音在時間上平滑地變化,合 (15 _瞬變抑制方法減少了瞬變分量,而不影響環境信號的 連續特性。滿足34個要求的一種方法在[WUD〇7]中提出並 在此描述。 *首先,檢測出現瞬變分量的時刻(例如,在以加權子 ^信號的形式表示的環境㈣巾)。隨後,屬於該檢測到的 2〇瞬變區域的幅度譜被該瞬變分量的出現之前的信號部分的 外插所取代。 因此超過運行均值〃⑻多於定義的最大偏差的戶斤有 值|x㈣Z·, )|被定義的變化區間内的Μω)的隨機變化所取代。 此處,下標t表示屬於瞬變區域的幀。 79 200915300 為了確保修改和未修改部分之間的平滑過渡,外 與原始值交又漸變。 [WUD07]中描述了其他瞬變抑制方法。 在二實知例中,本部分描述的瞬變抑制可以由祿蠻 5抑制器738來執行。 7.5解相關 士到達左耳和右耳的兩個信號之間的相關性影響可感知 的聲源寬度和環境印象。為了改進印象的空間感,應 10小=置聲道信號之間和/或後置聲道信號之Μ (例如在基於 所提取的環境信號的兩個後置聲道信號之間)的聲道^相 關性。 以下描述各種合適的用於對兩個信號進行解相關的方 法。 梳狀濾波: 丄通過使用—對互補梳狀濾波器[Sch57]處理單聲道輸入 ?虎的兩個田ij本’以獲得兩個解相關的信號。 全通遽波: 通過使用一對不同的全通濾波器處理單聲道輸入信號 的兩個副本’以獲得兩個解相_的信號。 帶有平坦傳遞函數的濾波: 80 200915300 的兩^二有平垣傳遞函數(例如衝擊回應具有白頻 Z,以#r _ Γ濾波器來處理單聲道輸人信號的兩個副 本,以獲件兩個解相關的信號。 传用確保了輸入信號的音色賦色較小。可以 t 生态亚對每個濾波器係數應用衰減增益因數 來構造合適的nR濾波器。 r 第十九圖不出了—個示例,其中^,k<N是遽波器係 數%疋白隨機過程的輸出,是確 絡的常
數,使得b^aN (19) K = rk(b ~ ak) 自適應頻譜全景化: 通過使用ASP[VZA06](見2.1.4部分)處理單聲道輸 15入#號的兩個副本來獲得兩個解相關的信號。[UWI07]中描 述了將ASP應用於後置聲道信號和前置聲道信號的解相 關。 延遲子帶信號: 20 通過將單聲道輸入信號的兩個副本分解為子帶(例如 使用STFT濾波器組),向子帶信號引入不同的延遲並從經 處理的子帶信號中重新合成時間信號,以獲得兩個解相關 的信號。 在一些實施例中’本部分描述的解相關可以由信號解 81 200915300 相關器740來執行。 以下,簡要概括根據本發明的 根據本發明的實施例創建了 t方面。 適於音頻信號的盲上混音的前置信梦用於提取 發明的方法的-些實施例的優點是多:J。根據本 、一,·η上混日的方法相比,根據本發明 上 低計算複雜度。與之前的用於 丄:士- ΓΓ、γ些方法即使在兩個輸人聲道信號相同 也方、、乎相同時也能成功執行。根據本發明的一 又於輸入聲道的數目,因此可以很好地適合輸 入聲道^任細己置。在收聽測試中,許多收聽者在收聽所 產生的環繞聲音信號時,更偏愛根據本發明的一些方法。 以上概括為,一些實施例涉及從音頻信號中以低複雜 度提取前置信號和環境信號用於上混音。 15 8.術語表
Asp自適應頻譜全景化 NMF非負矩陣分解 PCA主要分量分解 PSD功率譜密度 STFT短期傅立葉變換 TFD日頻分佈 82 200915300 參考文獻 [AJ02] Carlos Avendano and Jean-Marc Jot. Ambience extraction and synthesis from stereo signals for multi-channel audio upmix. In Proc. of the ICASSP, 2002.
5 [AJ04] Carlos Avendano and Jean-Marc Jot. A frequency-domain approaoch to multi-channel upmix. J. Audio Eng. Soc., 52, 2004.
[dCK03] Alain de Cheveigne and Hideki Kawahara. Yin, a fundamental frequency estimator for speech and music. Journal of i〇 the Acoustical Society of America, 111 (4): 1917-1930,2003.
[DerOO] R. Dressier. Dolby Surroud Pro Logic 2 Decoder: principles of operation. Dolby Laboratories Information, 2000.
[DTS] DTS. An overview of DTS NEo:6 multichannel. http://www.dts.com/media/uploads/pdfs/DTS%20Neo6%200vervi 15 ew.pdf.
[Fal05] C. Fallen Pseudostereophony revisited. In Proc. of the AES 188nd Convention, 2005.
[GJ07a] M. Goodwin and Jean-Marc Jot. Multichannel surround format conversion and generalized upmix. In Proc. of the 2〇 AES 30th conference, 2007.
[GJ07b] M. Goodwin and Jean-Marc Jot. Primary-ambient signal decomposition and vector-based localization for spatial audio coding and enhancement. In Proc. of the ICASSP, 2007.
[HEG+99] J. Herre, E. Eberlein, B. Grill, K. Brandenburg, 83 200915300 and H. Gerhauser. US-Patent 5,918,203, 1999.
[IA01] R. Irwan and R. M. Aarts. A method to convert stereo to multichannel sound. In Pore, of the AES 19th Conference, 2001.
[IS093] ISO/MPEG. ISO/IEC 11172-3 MPEG-1. 5 International Standard, 1993.
[Kar] Harman Kardon. Logic 7 explained. Technical report.
[LCYG99] R. Y. Litovsky, H. S. Colburn, W. A. Yost, and S. J. Guzman. The precedence effect. JAES, 1999.
[LD05] Y. Li and P. F. Driessen. An unsupervised adptive i〇 filtering approach of 2-to-5 channel upmix. In Proc. of the AES 119th Convention, 2005.
[LMT07] M. Lagrange, L.G. Martins, and G. Tzanetakis. Semi-automatic mono to stereo upmixing using sound source formation. In Proc. of the AES 122th Convention, 2007. 15 [MPA+05] J. Monceaux, F. Pachet, F. Armadu, P.Roy, and A.
Zils. Descriptor based spatialization. In Proc. of the AES 118th Convention, 2005.
[Sch04] G. Schmidt. Single-channel noise suppression based on spectral weighting. Eurasip Newsletter, 2004. 2〇 [Sch57] M. Schroeder. An artificial stereophonic effect obtained from using a single signal. JAES, 1957.
[Sou04] G. Soulodre. Ambience-based upmixing. In Workshop at the AES 117th Convention, 2004.
[UWHH07] C. Uhle, A. Walther, O. hellmuth, and J. Herre. 84 200915300
Ambience separation from mono recordings using Non-negative Matrix Factorization. In Proc. of the AES 30th Conference, 2007.
[UWI07] C. Uhle, A. walther, and M. Ivertowski. Blind one-to-n upmixing. In AudioMostly, 2007.
[VZA06] V. Verfaille, U. Zolzer, and D. Arfib. Adaptive digital audio effects (A-DAFx): A new class of sound transformations. IEEE Transactions on Audio, Speech, and Language Prosssing, 2006.
[WNR73] H. Wallach, E. B. Newman, and M. R. Rsenzweig. i〇 The precedence effect in sound localization. J. Audio Eng. Soc., 21:817-826, 1973.
[WUD07] A. Walther, C.Uhle, and S. Disch. Using transient suppression in blind multi-channel upmix algorithms. In Proc. of the AES 122nd Convention, 2007. 85 200915300 【圖式簡單說明】 第一圖示出了根據本發明的實施例的用於提取環境信 號的裝置的示意框圖; 第二圖示出了根據本發明的實施例的用於從輸入音頻 5信號中提取環境信號的裝置的詳細示意框圖; 第三圖示出了根據本發明的實施例的用於從輸入音頻 信號中提取環境信號的裝置的詳細示意框圖; 第四圖示出了根據本發明的實施例的用於從輸入音頻 信號中提取環境信號的裝置的示意框圖; 10 第五圖示出了根據本發明的實施例的增益值確定器的 示意框圖; 第六圖示出了根據本發明的實施例的加權器的示意框 圖; 第七圖示出了根據本發明的實施例的後處理器的示意 15 框圖; 第八圖A和第八圖B示出了從根據本發明的實施例的 用於提取環境信號的示意框圖中摘出的圖; 第九圖示出了從時頻域表示中提取特徵值的概念的圖 形表示; 20 第十圖示出了根據本發明的實施例的用於進行1至5 上混音的裝置或方法的框圖; 第十一圖示出了根據本發明的實施例的用於提取環境 信號的裝置或方法的框圖; 第十二圖示出了根據本發明的實施例的用於進行增益 86 200915300 計算的裝置或方法的框圖; 第十三圖示出了根據本發明的實施例的用於獲得加權 係數的裝置的示意框圖; 第十四圖示出了根據本發明的實施例的用於獲得加權 5 係數的另一裝置的示意框圖; 第十五圖A和第十五圖B示出了根據本發明的實施例 的用於獲得加權係數的裝置的示意框圖; 第十六圖示出了根據本發明的實施例的用於獲得加權 係數的裝置的示意框圖; 1〇 第十七圖示出了從根據本發明的實施例的用於獲得加 權係數的裝置的示意框圖中摘出的圖; 第十八圖A和第十八圖B示出了根據本發明的實施例 的係數確定信號產生器的示意框圖; 第十九圖示出了根據本發明的實施例的係數確定信號 15 產生器的示意框圖; 第二十圖示出了根據本發明的實施例的係數確定信號 產生器的示意框圖; 第二十一圖示出了根據本發明的實施例的用於從輸入 音頻信號中提取環境信號的方法的流程圖; 20 第二十二圖示出了根據本發明的實施例的用於確定加 權係數的方法的流程圖; 第二十三圖示出了示意身歷聲重播的圖形表示; 第二十四圖示出了示意直射/環境概念的圖形表示;以 及 87 200915300 第二十五圖示出了示意在樂隊中的概念的圖形表示。 【主要元件符號說明】 裝置100 輸入音頻信號110 5 子帶信號112 增益值序列122 增益值確定器120 加權器130 子帶信號132 ίο 裝置200 輸入音頻信號210 輸出子帶信號212a〜212d 分析濾波器組216 子帶信號218a〜218d 15 增益值確定器220 增益值222 量化特徵值確定器250、252、254 量化特徵值250a、252a、254a 加權組合器260 2〇 加權器 270a、270b、270c 加權調整器270 裝置300 增益值確定器320 音調特徵值確定器350 88 200915300 音調特徵值350a 能量特徵值確定器352 能量特徵值352a 頻譜質心特徵值確定器354 5 頻譜質心特徵值354a 裝置400 多聲道輸入音頻信號410 加權子帶信號412 增益值確定器420 1〇 聲道410a、聲道410b 時變環境信號增益值422 加權器430 增益值確定器500 非線性預處理器510 15 量化特徵值確定器520、522 特徵值後處理器530、532 加權組合器540 加權器550、552 增益值 560、122、222、322、422 2〇 非線性處理器542、544 特徵值 542a、544a、550a、552a 組合器556 加權器600 接收輸入音頻信號610 89 200915300 環境信號620 非環境信號630 環境信號加權器640 前置信號加權器650 5 前置信號增益值652 接收環境信號增益值660 後處理器700 更多加權子帶信號710 信號720 ίο 選擇性衰減器730 非線性壓縮器732 延遲器734 音色賦色補償器736 瞬變抑制器738 15 信號解相關器740 電路部分800 合成濾波器組810 加權子帶信號812 時域環境信號814、822、872 20 時域後處理器820 電路部分850 頻域後處理器860 加權子帶信號862 加權子帶信號864 90 200915300 合成濾波器組870 示意表示900 時頻域表示910 時頻點 912a、912b、914a、914b、914c、916a、916b、916c 5 組合器930、940 組合特徵值932、942 環境信號提取1010 後處理1020 前置信號提取1030 ίο 時域至時頻域轉換1110 增益計算1120、1122 乘法 1130、1132 後處理1400 時頻域至時域轉換1150 15 低級特徵計算1210、1212 組合器1220 裝置1300 係數確定信號產生器1310 接收基礎信號1312 2〇 係數確定信號1314 期望增益值資訊1316 係數確定信號1318 量化特徵值確定器1320、1320a、1320b 量化特徵值1322、1324 91 200915300 加權係數確定器1330 加權係數1332 加權係數確定器1500 加權組合器1510 5 增益值1512 相似性確定器/差別確定器1520 相似性度量1522 加權係數確定器1550 方程系統解算器/優化問題解算器1560 10 加權係數確定器1600 神經網1610 裝置1700 係數確定信號產生器1800 輸入信號1810 15 人工環境信號產生器1820 人工環境信號1822 環境信號相加器1830 係數確定信號1832 期望增益值資訊1834 2〇 係數確定信號產生器1850 音頻信號1860 環境信號1862 環境信號相加器1870 係數確定信號1872 92 200915300 期望增益值資訊1874 係數確定信號產生器1900 聲道 1910、1912 特徵值確定器1920 期望增益值資訊1922 係數確定信號1924 係數確定信號產生器2000 多聲道至單聲道組合器2010 93

Claims (1)

  1. 200915300 十、申請專利範圍: 味从!^種基於輪入音頻信號的時頻域表-* 5 15 =衣置,所述時頻域表示以描述多個:,取環境信 號的形式絲輸人音頻錢包^衫個子帶信 增益值確定器,_^ . :曰,,針對輸入音頻信號的時頻域:為.根據輸 帶,確定時變環境信號增益值序列; $的給定頻 加權器’所述加權器被配置為:使用所、" ^示所述時頻域絲的給定頻㈣ ^變增益值 榷,以獲得加權子帶信號; 現之〜進行加 其中’所騎益值確定H被配置為 =。的一個或更多特徵或特性的-個或更多二二:頻 述增益值在數量上取決於所述量_=、二及值’使得所 其中,所述增益值確定器被配置為:提供 2而在加權子帶信财,與㈣境分量相比,強調H分 2.依據申請專利範圍第丨項所述的裝 兑 增益值较賴配置絲讀人音趣號㈣頻域表. 確定時變增益值。 ' 3·依據申請專利範圍第丨項所述的裝置,其中,所述 增益值確定器被配置為獲得至少一個量化特徵值,所述^ 少一個量化特徵值描述了表示給定頻帶的子帶信號的 相似度。 、見 4.依據申請專利範圍第1項所述的裝置,其中,所述 94 200915300 增益值確定ϋ被配置紐得乡個Μ的量化賴值,所述 多個不同的量化特徵值描述了輸人音頻信號的多個不同特 ,或特性,所述增益值確定料觀置絲合所述不同的 里化特徵值以獲得時變增益值序列。 、、,5.依據申明專利範圍第4項所述的裝置,其中,所述 =值確定器被配置為根據加權係數對所述不同的量化特 徵值進行不同的加權。 專利範圍第4項所述咐置,其中,所述 ^徵值。^配置為轉雜的方式職所述不同的量 依據中專利範圍第4項所述的裝置,中,所述 增益值確定f被配置為使用關係式 = Σαί^,(ω,Γ)Α ϊ=1 15 t合:同的特徵值’以獲得增益值, 其中ω表示子帶索引, 其中τ表示時間索弓丨, 其中i表示運行變數, S二=要被組合的特徵值的數目’ 間索引=具有頻率索引⑴的子帶和具有時 Α中矣間的第1個特徵值, i中/?表; II對第1個特徵值的線性加權係數’ 心广'針對第i個特徵值的指數加權係數, ’)&不針對具有頻率索引ω的子帶和具有時 20 200915300 間索引τ的時間的增益值。 8.依據申請專利範圍第4項所述的裝置, 增益值確定器包括加權調整器,;;、所述 調整要被組合的不同特徵的權重。 °^被配置為 5 15 …9.依據申請專利範圍第4項所述的裝置, 確定器被配置為對描述輸人音頻信號的音調的至少 料輸人音頻錢的子料的能量的能 里特徵值進仃組合,以獲得增益值。 ^ 請專利範圍第9項所述的裝置,其中,所述 置為至少對音調特徵值、能量特徵值和 田处雨入曰頻域的頻譜或輸入音頻信號的一部分頻譜的 頻譜質心的賴質心特徵錢餘合,峨得增益值。 11.依據申請專利範圍第J項所述的裝置,其中,所述 ^盈值確ί器被配置為獲得描述單音頻信號聲道的特徵的 ^個里化單聲道特徵值’以使賴述單聲道特徵值來 提供增益值。 _ 12.依據申睛專利範圍第1項所述的裝置,其中,所述 增益值確定H被配置絲於單音騎道來提供增益值。 、、/13.依據申請專利範圍第i項所述的裝置,其中,所述 =曰盈值確定器被配置為獲得多頻帶特徵值,所述多頻帶特 徵值描述包括多個頻帶的頻率範圍上的輸入音頻信號。 ,214·依據申請專利範圍第1項所述的裝置,其中,所述 增ϋ值確定器被配置為獲得窄帶特徵值,所述窄帶特徵值 描述包括單頻帶的解範圍上的輸人音頻信號。 96 20 200915300 一15.依據申請專利範圍第1項所述的裝置,其中,所述 增益值確定碰配置為獲得寬簡徵值,所述寬頻特徵值 描述包括%頻域表示的整個頻帶的頻率範圍上的輸入 信號。 、 μ 16·依據申請專利範圍第1項所述的裝置,其中,所述 值確定器被配置為組合描述具有不同帶寬的輸入音頻 域的部分的不同龍值,以獲得增益值。 始2丨7.依據申請專利範圍第丨項所述的裝置,其中,所述 二確疋^被配置為以非線性的方式預處理輸入音頻信 =時頻域表示,並基於經賴理的 來獲得量 化特徵值。 掸、、18.依據申請專利範圍第1項所述的裝置,直中,所述 j值確定器被配置為以非線性的方式對所獲得的特微值 15 =後處理’以限制特徵值的數值_ 經後處 理的特徵值。 ㈣Lt據申請專利範圍第1項所述的裝置,其中’所述 被配置為對描述與時頻域表示的不同時頻點 組合射ϊί同特徵或特性的多個特徵值進行組合,以提供 20 增4確^據7專利範圍第1項所述的裝置,其中,所述 得描述輸入音頻信號的音調的量 述增2二項所述的裝置,其中,: m被配置為獲仔如下數值作為描述音調的重 97 200915300 化特徵值: 頻譜平坦性度量,或 頻譜峰值因數,或 頻信號的頻譜副本不同的非線性處理而 獲付的至少兩個頻譜值的比值,或 的至信號的賴副本·不_雜性濾波而獲得 的至J兩個頻譜值的比值,或 X侍 指示出現頻譜峰值的值, 榣述輸入音頻信號和輸入音頻信號 相似性的相似性值,或 W移版本之間的 也述時頻域表示的預測譜系數和 镨系數之_差別的預測誤差值。讀核不的實際 增益^據7__1項所述的裝置,其中,所述 15 能量的1,置為獲鄕述輸人音頻信號的子帶内的 至夕一個1化特徵值,以確定增益值。 、,23.依據申請專利範圍第22項所述的裝 速增讀確“被配£為較增益值 〔祕 述,頻點的增益值隨著給定時頻點;= :的:大给定時頻點的相鄰區域内的時頻:中‘能 、…,24.依據申請專利範圍第22項所述的裝置, 述增盈值確定馳配 較時頻 #、 頻點的預定i日物J此里和給定時 特徵。相㈣域内的最大㈣或平均能量看作分離的 98 20 200915300 25. 依據申請專利範圍第24項所述的裝置,其中,所 述增益值確定器被配置為獲得描述給定時頻點的能量的第 一量化特徵值以及描述給定時頻點的預定相鄰區域内的最 大能量或平均能量的第二量化特徵值,並組合第一量化特 5 徵值和第二量化特徵值以獲得增益值。 26. 依據申請專利範圍第1項所述的裝置,其中,所述 增益值確定器被配置為獲得描述輸入音頻信號的兩個或更 多聲道之間的關係的一個或更多量化聲道關係值。 27. 依據申請專利範圍第26項所述的裝置,其中,所 ίο述一個或更多量化聲道關係值之一描述輸入音頻信號的兩 個聲道之間的相關性或相干。 28. 依據申請專利範圍第26項所述的裝置,其中,所 述一個或更多量化聲道關係值之一描述聲道間短時相干。 29. 依據申請專利範圍第26項所述的裝置,其中,所 15述一個或更多量化聲道關係值之一基於輸入音頻信號的兩 個或更多聲道來描述聲源的位置。 30. 依據申請專利範圍第29項所述的裝置,其中,所 述一個或更多量化聲道關係值之一描述輸入音頻信號的兩 個或更多聲道之間的聲道間水準差。 2〇 31.依據申請專利範圍第26項所述的裝置,其中,所 述增益值確定器被配置為獲得全景化索引作為所述一個或 更多量化聲道關係值之一。 32.依據申請專利範圍第31項所述的裝置,其中,所 述增益值確定器被配置為確定針對給定時頻點的頻譜值差 99 200915300 和頻譜值和之間的比值,以獲得針對給定時頻點的全景化 索引。 33.依據申請專利範圍第1項所述的裝置,其中,所述 增益值確定器被配置為獲得頻譜質心特徵值,所述頻譜質 5心特徵值描述了輸入音頻信號的頻譜或輸入音頻信號的— 部分頻譜的頻譜質心。 、…34·依據申請專利範圍第1項所述的裝置,其中,所述 =盈值確定器被配置為根據由時頻域表示所表示的多個子 帶信號,提供用於對給定的一個子帶信號進行加權的增益 ίο值。 9皿 #35.依據申請專利範圍第1項所述的裝置,其中,所述 力-被配置為使用公共時變增益值序觸子帶信號組進 15 依據申請專利範圍第1項所述的裝置,其中,所述 = = 處理器,所述信號後處理器被配置為對 增強产产董 ^ 該加權子帶信號的信號進行後處理以 日U f直射比’亚㈣經後處理的 處理的信號中,所述環境對直射比得到增強。 工後 述^7後袖咖%摘料裝置,其中,所 基二=子帶信號中的大的聲音或 鱗安静的聲音進行•同時 述信所述峨,其中,所 置為向加㈣帶信號或基於該加權子 100 20 200915300 帶信號的信號應用非線性壓縮。 39.依據申請專利範圍第1項所述的裝置’其中,所述 裝置還包括信號後處理器,所述信號後處理器被配置為對 加權子帶信號或基於該加權子帶信號的信號進行後處理, 5以獲得經後處理的信號, f 10 15 其中,所述信號後處理器被配置為在2毫秒和7〇毫秒 之間的範圍内對加權子帶信號或基於該加權子帶信號的作 號進行延遲,以獲得前置信號和基於加權子帶信號的環= 就之間的延遲。 ^ 40.依據申請專利範圍第1項所述的裝置,直中,所述 f 括錢魏㈣,賴錢後處理轉配置為^ ===或基於該加權子帶信號的信號進行後處理, 以獲件經後處理的信號, 環境ί:表::後=器被配置為對基於加權子帶信號的 的音執仃頻率相關的均衡,以抵消環境信號表示 撕Τ岣寻利範圍第4〇項 20 述後處理器被配置為對基於加權子^裝置,其中’所 執行頻率相_均衡,^的環境信號表示 經後處理的環境信號表示,&均衡的環境信號表示作為 一中所述後處理器被配 :::衡的環境信號表示的長=;2=的均衡’ 曰頻“遽。 刀羊瑨密度適應於輸入 42.依據申請專利範圍第 、所述的裝置,其中,所述 101 200915300 裝置還包括信號後處理器,所述信號後處理斋被配置句. 加權子帶信號或基於該加權子帶信5虎的# 5虎進行後處理 以獲得經後處理的信號, 其中,所述信號後處理器被配置為減少加權子帶信號 或基於該加權子帶信號的信號中的瞬變。 43. 依據申請專利範圍第i項所述的裝置,其中,所述 裝置還包括信號後處理器,所述信號後處理器被配置為對 加權子帶信號或基於該加權子帶信號的信號進行後處理, 以獲得經後處理的信號, 其中,所述後處理器被配置為:根據加權子帶信號或 基於該加權子帶信號的信號,獲得左環境信號和右環境信 號,使得所述左環境信號和右環境信號至少部分上解相關°。 44. 依據申請專利範圍第丨項所述的裝置,其中 裝置被配置為還基於輸人音雜號提供前置信號, 15 « i. 值,對:示權器被配置為:使用時變前置信號增益 :加權以頻域表示的給定頻帶的子帶信號之-進 $ '加權前置信號子帶信號, 八中’所述加權器被配置為使 隨著環境錢㈣朗益值 45·依據申請專利範圍第44項 述加權器被配置為提供時、 、置、中’所 號增益值與環境信號增益值互補日讀,使得前置信 裝置包括日一====”,其中,所述 為所迷轉換器被配置為··基 102 20 200915300 於一 Γ7或加權子帶信號,提供環境信號的時域表示。 衣據申睛專利範㈣1項所述的裝置,其中,所述 Γ置二:單!道輸入她 音頻信财生裝置,基於—個歧 ’=曰'員信號來提供包括至少一個道: 號,所述裝置包括: j夕名道曰頻k 輸入d:。’、所述環境信號提取器被配置為基於 表干以/°:守頻域表示來提取環境信號,所述時頻域 個頻帶的多個子帶信號的形式來表示輸入音 所述環境信號提取器包括: 增盈值確定器,所述辦M — σσ 15 20 :音’針對輸入音頻信號的時二:二::: 〒確定時變環境信號增益值序列,以及 頻 ^權器,所述加權器被配置為使 =述時頻域表示的給定頻帶的-個或更多 仃加推,以獲得加權子帶錢,又夕十…口唬進 =二:更二:徵 所=分 103 200915300 述多聲道音難號 她置,其中,所 境信號作為-,多後供一個或更多環 “多聲道音頻置述的裳置,其中’所 人=信號來提供:,更多前置聲道音基 或更多輸 係數的裝置種進行參數化的加權 取環境信號,所述裝置包括:$於錢人音頻信號中提 加權係數確定器,所述加權 加權係數,使得基於使用所述力二配置為確定 ===:=逆= 望增益值。 頻l說相關聯的期 15 52· ^據申請專利範圍第5ι項所述狀置,1中 號產生器,所述係數確定繼生 信==忽略的環境信號分量的參考音頻 偏4Γ所述係數確定信號產生器被配置為:把史考音 =號和魏錢分量進她合,以獲得係數確定傾, 權係數確定器提供描述參考音頻信號的環境 射^=曰^或描34參考音頻㈣的環境信號分量愈直 紅號刀I之間的關係的資訊,以描述期望增益值, 104 20 200915300 、…53.依據申請專利範圍第52項所述的裝置,其中,所 ^係數確定信號產生器包括環境信號產生器,所述環境信 ^產生器被配置為基於參考音頻信號來提供環境信號分 量。 r 15 20 、+54.依據申請專利範圍第51項所述的裝置,其中,所 j衣置包括係數確定信號產生器,所述係數確定信號產生 裔被配置為:基於多聲道參考音頻信號來提供係數 號以^軸料益㈣資訊, ° 夕其中,所述係數確定信號產生器被配置為:確定描述 ^ 道> 考音頻信號的兩個或更多聲道之間的關 訊’以提供描述期望增益值的資訊。 、、 依據申請專利範圍第54項所述的裝置,其中 信號產生器被配置為··確找述多聲道參考音 就的-個聲道作為餘確定信號。 号曰頻t 述係㈣54項所述的裝置,其中,所 的兩個或更多聲道進行組合,以獲得係數確定信號號 58.依據申請專利範圍第51項所 配置為使用回歸方法、分射二: 采確疋加推健,所述係數確定信號被用作訓練信 105 200915300 號’所述期望增益㈣作參考值,而且所述係、數得 59. —種基於輸入音頻信號的時 疋 錢的方法,所述時頻域表示以描 形式絲示輸人音頻錢,所述方法包括f固子V 或更多特徵或特性的一 r 獲得描述輸入音頻信號的 個或更多量化特徵值; 根據所述一個或更多量化特徵值,針 的時頻域㈣的料解,確料 = Γ使得所述增益值在數量上取祕所料 使用所述時變增益值對表 帶的子帶信號進行加權。 《讀域表不的給定 個 頻信號 以 頻 60.- 15 2〇 數的方法,==值:定進行參數化的加權係 境信號,所述方法包括:&〜輸入音Μ信號中提取環 所述ί數確定:t遽或:吏:於環境分量的資訊出現在 之間的闕係的資訊;Μ曉描述環境分量和非環境分量 信號===?=係數對描购定 :的增益值近似於與所述係數;定:徵值的加權組合而 獲 號相關聯的期望增益 61. 、種儲存電腦程式的雷腦 式在電觸上運行時 嗔介質,當所述電腦程 執仃基於輪入音頻信號的時頻域表示 106 200915300 來提取環境信號的方法,所述時 的多個子㈤f號的戰絲輸人音、齡7^描料個頻帶 所述方法包括: ' °U 個或頻信號的—個或更多特徵或特性的- 根據所述一個或更多量化牯料 的時頻域表示的給定頻帶,確定’ ”輸。人音頻信號 =,使得所述增益值在數量上取‘所值: 帶的權益值對表示所述時頻域表示的給定頻 62. -種儲存電腦程式的電腦 15 20 得::益值確定進行參數化的二= 定料從以音頰錢愤取環境信 所述’使得關於環境分量的資訊出現在 之間2知曉描述環境分量和非環境分量 定户^力^餘,使得根據所述加權係數對描述係數確 獲;:t:特徵或特性的多個崎 益^。9现值近似於與所述係數確定信號相關聯的期望增 107
TW097137242A 2007-09-26 2008-09-26 用於獲得提取環境信號的加權係數的裝置和方法中的用於提取環境信號的裝置和方法以及電腦程式 TWI426502B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US97534007P 2007-09-26 2007-09-26
US12/055,787 US8588427B2 (en) 2007-09-26 2008-03-26 Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
PCT/EP2008/002385 WO2009039897A1 (en) 2007-09-26 2008-03-26 Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program

Publications (2)

Publication Number Publication Date
TW200915300A true TW200915300A (en) 2009-04-01
TWI426502B TWI426502B (zh) 2014-02-11

Family

ID=39591266

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097137242A TWI426502B (zh) 2007-09-26 2008-09-26 用於獲得提取環境信號的加權係數的裝置和方法中的用於提取環境信號的裝置和方法以及電腦程式

Country Status (8)

Country Link
US (1) US8588427B2 (zh)
EP (1) EP2210427B1 (zh)
JP (1) JP5284360B2 (zh)
CN (1) CN101816191B (zh)
HK (1) HK1146678A1 (zh)
RU (1) RU2472306C2 (zh)
TW (1) TWI426502B (zh)
WO (1) WO2009039897A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102438191A (zh) * 2010-09-08 2012-05-02 Akg声学有限公司 用于声学信号跟踪的方法
TWI485697B (zh) * 2012-05-30 2015-05-21 Univ Nat Central Environmental sound recognition method
TWI503817B (zh) * 2009-05-26 2015-10-11 Dolby Lab Licensing Corp 操作音訊信號處理裝置或操作處理系統之方法、預定義動態等化頻譜設定檔之提供系統及其之選擇和使用裝置、以及相關電腦可讀儲存媒體及處理系統
TWI509597B (zh) * 2009-05-26 2015-11-21 Dolby Lab Licensing Corp 音訊信號動態等化處理控制技術
TWI579836B (zh) * 2016-01-15 2017-04-21 Real - time music emotion recognition system
TWI587285B (zh) * 2013-07-22 2017-06-11 弗勞恩霍夫爾協會 使用解相關器輸入訊號之一預混合之多聲道解相關器、多聲道音源解碼器、多聲道音源編碼器之方法及其電腦程式
US10431227B2 (en) 2013-07-22 2019-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
TWI773286B (zh) * 2020-04-30 2022-08-01 大陸商華為技術有限公司 音頻訊號的比特分配方法和裝置
TWI801217B (zh) * 2022-04-25 2023-05-01 華碩電腦股份有限公司 訊號異常檢測系統及其方法

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI297486B (en) * 2006-09-29 2008-06-01 Univ Nat Chiao Tung Intelligent classification of sound signals with applicaation and method
US8270625B2 (en) * 2006-12-06 2012-09-18 Brigham Young University Secondary path modeling for active noise control
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
EP2395504B1 (en) * 2009-02-13 2013-09-18 Huawei Technologies Co., Ltd. Stereo encoding method and apparatus
EP2237271B1 (en) 2009-03-31 2021-01-20 Cerence Operating Company Method for determining a signal component for reducing noise in an input signal
KR20100111499A (ko) * 2009-04-07 2010-10-15 삼성전자주식회사 목적음 추출 장치 및 방법
US8705769B2 (en) * 2009-05-20 2014-04-22 Stmicroelectronics, Inc. Two-to-three channel upmix for center channel derivation
AU2010275711B2 (en) * 2009-07-22 2015-08-27 Stormingswiss Gmbh Device and method for improving stereophonic or pseudo-stereophonic audio signals
US20110078224A1 (en) * 2009-09-30 2011-03-31 Wilson Kevin W Nonlinear Dimensionality Reduction of Spectrograms
KR101567461B1 (ko) * 2009-11-16 2015-11-09 삼성전자주식회사 다채널 사운드 신호 생성 장치
GEP20146081B (en) * 2009-12-07 2014-04-25 Dolby Laboratories Licensing Corp Decoding of multichannel aufio encoded bit streams using adaptive hybrid transformation
EP2346028A1 (en) 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
JP4709928B1 (ja) * 2010-01-21 2011-06-29 株式会社東芝 音質補正装置及び音質補正方法
WO2011107951A1 (en) * 2010-03-02 2011-09-09 Nokia Corporation Method and apparatus for upmixing a two-channel audio signal
CN101916241B (zh) * 2010-08-06 2012-05-23 北京理工大学 一种基于时频分布图的时变结构模态频率辨识方法
US8515879B2 (en) 2010-08-11 2013-08-20 Seiko Epson Corporation Supervised nonnegative matrix factorization
US8805653B2 (en) 2010-08-11 2014-08-12 Seiko Epson Corporation Supervised nonnegative matrix factorization
US8498949B2 (en) 2010-08-11 2013-07-30 Seiko Epson Corporation Supervised nonnegative matrix factorization
CN102469350A (zh) * 2010-11-16 2012-05-23 北大方正集团有限公司 广告统计的方法、装置和系统
EP2458586A1 (en) * 2010-11-24 2012-05-30 Koninklijke Philips Electronics N.V. System and method for producing an audio signal
JP5817106B2 (ja) * 2010-11-29 2015-11-18 ヤマハ株式会社 オーディオチャンネル拡張装置
EP2541542A1 (en) 2011-06-27 2013-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal
US20120224711A1 (en) * 2011-03-04 2012-09-06 Qualcomm Incorporated Method and apparatus for grouping client devices based on context similarity
US8965756B2 (en) * 2011-03-14 2015-02-24 Adobe Systems Incorporated Automatic equalization of coloration in speech recordings
WO2012145176A1 (en) 2011-04-18 2012-10-26 Dolby Laboratories Licensing Corporation Method and system for upmixing audio to generate 3d audio
EP2523473A1 (en) 2011-05-11 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an output signal employing a decomposer
US9307321B1 (en) 2011-06-09 2016-04-05 Audience, Inc. Speaker distortion reduction
EP2544465A1 (en) 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator
US8503950B1 (en) * 2011-08-02 2013-08-06 Xilinx, Inc. Circuit and method for crest factor reduction
US8903722B2 (en) * 2011-08-29 2014-12-02 Intel Mobile Communications GmbH Noise reduction for dual-microphone communication devices
US20130065213A1 (en) * 2011-09-13 2013-03-14 Harman International Industries, Incorporated System and method for adapting audio content for karaoke presentations
US9253574B2 (en) * 2011-09-13 2016-02-02 Dts, Inc. Direct-diffuse decomposition
ITTO20120067A1 (it) * 2012-01-26 2013-07-27 Inst Rundfunktechnik Gmbh Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal.
CN102523553B (zh) * 2012-01-29 2014-02-19 昊迪移通(北京)技术有限公司 一种针对移动终端设备并基于声源内容的全息音频方法和装置
US9538306B2 (en) * 2012-02-03 2017-01-03 Panasonic Intellectual Property Management Co., Ltd. Surround component generator
US9986356B2 (en) * 2012-02-15 2018-05-29 Harman International Industries, Incorporated Audio surround processing system
ES2568640T3 (es) 2012-02-23 2016-05-03 Dolby International Ab Procedimientos y sistemas para recuperar de manera eficiente contenido de audio de alta frecuencia
JP2013205830A (ja) * 2012-03-29 2013-10-07 Sony Corp トーン成分検出方法、トーン成分検出装置およびプログラム
CN102629469B (zh) * 2012-04-09 2014-07-16 南京大学 一种时频域混合自适应有源噪声控制算法
US9532158B2 (en) 2012-08-31 2016-12-27 Dolby Laboratories Licensing Corporation Reflected and direct rendering of upmixed content to individually addressable drivers
US9549253B2 (en) 2012-09-26 2017-01-17 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Sound source localization and isolation apparatuses, methods and systems
US9955277B1 (en) * 2012-09-26 2018-04-24 Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) Spatial sound characterization apparatuses, methods and systems
US9554203B1 (en) 2012-09-26 2017-01-24 Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) Sound source characterization apparatuses, methods and systems
US10136239B1 (en) 2012-09-26 2018-11-20 Foundation For Research And Technology—Hellas (F.O.R.T.H.) Capturing and reproducing spatial sound apparatuses, methods, and systems
US20160210957A1 (en) 2015-01-16 2016-07-21 Foundation For Research And Technology - Hellas (Forth) Foreground Signal Suppression Apparatuses, Methods, and Systems
US10175335B1 (en) 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
US10149048B1 (en) 2012-09-26 2018-12-04 Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems
JP6054142B2 (ja) * 2012-10-31 2016-12-27 株式会社東芝 信号処理装置、方法およびプログラム
CN102984496B (zh) * 2012-12-21 2015-08-19 华为技术有限公司 视频会议中的视音频信息的处理方法、装置及系统
JP6173484B2 (ja) * 2013-01-08 2017-08-02 ドルビー・インターナショナル・アーベー 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測
US9344826B2 (en) * 2013-03-04 2016-05-17 Nokia Technologies Oy Method and apparatus for communicating with audio signals having corresponding spatial characteristics
ES2742853T3 (es) * 2013-03-05 2020-02-17 Fraunhofer Ges Forschung Aparato y procedimiento para la descomposición directa-ambiental de multicanal para el procesamiento de señales de audio
US9060223B2 (en) 2013-03-07 2015-06-16 Aphex, Llc Method and circuitry for processing audio signals
CN104240711B (zh) 2013-06-18 2019-10-11 杜比实验室特许公司 用于生成自适应音频内容的方法、系统和装置
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
WO2015074719A1 (en) * 2013-11-25 2015-05-28 Nokia Solutions And Networks Oy Apparatus and method for communication with time-shifted subbands
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN105336332A (zh) * 2014-07-17 2016-02-17 杜比实验室特许公司 分解音频信号
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US9948173B1 (en) * 2014-11-18 2018-04-17 The Board Of Trustees Of The University Of Alabama Systems and methods for short-time fourier transform spectrogram based and sinusoidality based control
CN105828271B (zh) * 2015-01-09 2019-07-05 南京青衿信息科技有限公司 一种将两个声道声音信号转换成三个声道信号的方法
CN105992120B (zh) 2015-02-09 2019-12-31 杜比实验室特许公司 音频信号的上混音
US10623854B2 (en) 2015-03-25 2020-04-14 Dolby Laboratories Licensing Corporation Sub-band mixing of multiple microphones
US9666192B2 (en) 2015-05-26 2017-05-30 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
US10559303B2 (en) * 2015-05-26 2020-02-11 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
KR101825949B1 (ko) * 2015-10-06 2018-02-09 전자부품연구원 음원 분리를 포함하는 음원 위치 추정 장치 및 방법
CN106817324B (zh) * 2015-11-30 2020-09-11 腾讯科技(深圳)有限公司 频响校正方法及装置
JP6535611B2 (ja) * 2016-01-28 2019-06-26 日本電信電話株式会社 音源分離装置、方法、及びプログラム
BR112019009424A2 (pt) 2016-11-08 2019-07-30 Fraunhofer Ges Forschung mixador de redução, método para mixagem de redução de pelo menos dois canais, codificador multicanal, método para codificar um sinal multicanal, sistema e método de processamento de áudio
EP3324406A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
US11416742B2 (en) * 2017-11-24 2022-08-16 Electronics And Telecommunications Research Institute Audio signal encoding method and apparatus and audio signal decoding method and apparatus using psychoacoustic-based weighted error function
KR102418168B1 (ko) * 2017-11-29 2022-07-07 삼성전자 주식회사 오디오 신호 출력 장치 및 방법, 이를 이용한 디스플레이 장치
CN110033781B (zh) * 2018-01-10 2021-06-01 盛微先进科技股份有限公司 音频处理方法、装置及非暂时性电脑可读媒体
EP3573058B1 (en) * 2018-05-23 2021-02-24 Harman Becker Automotive Systems GmbH Dry sound and ambient sound separation
US11586411B2 (en) 2018-08-30 2023-02-21 Hewlett-Packard Development Company, L.P. Spatial characteristics of multi-channel source audio
US10800409B2 (en) * 2018-09-04 2020-10-13 Caterpillar Paving Products Inc. Systems and methods for operating a mobile machine using detected sounds
US11902758B2 (en) 2018-12-21 2024-02-13 Gn Audio A/S Method of compensating a processed audio signal
KR102603621B1 (ko) 2019-01-08 2023-11-16 엘지전자 주식회사 신호 처리 장치 및 이를 구비하는 영상표시장치
CN109616098B (zh) * 2019-02-15 2022-04-01 嘉楠明芯(北京)科技有限公司 基于频域能量的语音端点检测方法和装置
CN113396456A (zh) * 2019-03-05 2021-09-14 索尼集团公司 信号处理装置、方法和程序
WO2020211004A1 (zh) * 2019-04-17 2020-10-22 深圳市大疆创新科技有限公司 音频信号处理方法、设备及存储介质
CN110413878B (zh) * 2019-07-04 2022-04-15 五五海淘(上海)科技股份有限公司 基于自适应弹性网络的用户-商品偏好的预测装置和方法
CN111210802A (zh) * 2020-01-08 2020-05-29 厦门亿联网络技术股份有限公司 一种生成混响语音数据的方法和系统
CN111669697B (zh) * 2020-05-25 2021-05-18 中国科学院声学研究所 一种多通道信号的相干声与环境声提取方法及系统
CN111711918B (zh) * 2020-05-25 2021-05-18 中国科学院声学研究所 一种多通道信号的相干声与环境声提取方法及系统
CN112097765B (zh) * 2020-09-22 2022-09-06 中国人民解放军海军航空大学 一种采用定常与时变前置角相结合的飞行器前置导引方法
US11694692B2 (en) 2020-11-11 2023-07-04 Bank Of America Corporation Systems and methods for audio enhancement and conversion
US20220400351A1 (en) * 2020-12-15 2022-12-15 Syng, Inc. Systems and Methods for Audio Upmixing
CN112770227B (zh) * 2020-12-30 2022-04-29 中国电影科学技术研究所 音频处理方法、装置、耳机和存储介质
CN112992190B (zh) * 2021-02-02 2021-12-10 北京字跳网络技术有限公司 音频信号的处理方法、装置、电子设备和存储介质
CN114171053B (zh) * 2021-12-20 2024-04-05 Oppo广东移动通信有限公司 一种神经网络的训练方法、音频分离方法、装置及设备
CN117153192B (zh) * 2023-10-30 2024-02-20 科大讯飞(苏州)科技有限公司 音频增强方法、装置、电子设备和存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4748669A (en) 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
JPH0212299A (ja) * 1988-06-30 1990-01-17 Toshiba Corp 音場効果自動制御装置
JP2971162B2 (ja) * 1991-03-26 1999-11-02 マツダ株式会社 音響装置
JP3412209B2 (ja) 1993-10-22 2003-06-03 日本ビクター株式会社 音響信号処理装置
US5850453A (en) * 1995-07-28 1998-12-15 Srs Labs, Inc. Acoustic correction apparatus
JP3364825B2 (ja) * 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
JP2001069597A (ja) * 1999-06-22 2001-03-16 Yamaha Corp 音声処理方法及び装置
US6321200B1 (en) * 1999-07-02 2001-11-20 Mitsubish Electric Research Laboratories, Inc Method for extracting features from a mixture of signals
US20010044719A1 (en) 1999-07-02 2001-11-22 Mitsubishi Electric Research Laboratories, Inc. Method and system for recognizing, indexing, and searching acoustic signals
EP1232495A2 (en) 1999-10-28 2002-08-21 AT&T Corp. Neural networks for detection of phonetic features
CN1160699C (zh) * 1999-11-11 2004-08-04 皇家菲利浦电子有限公司 语音识别系统
JP4419249B2 (ja) 2000-02-08 2010-02-24 ヤマハ株式会社 音響信号分析方法及び装置並びに音響信号処理方法及び装置
US7076071B2 (en) * 2000-06-12 2006-07-11 Robert A. Katz Process for enhancing the existing ambience, imaging, depth, clarity and spaciousness of sound recordings
JP3670562B2 (ja) 2000-09-05 2005-07-13 日本電信電話株式会社 ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
US6876966B1 (en) 2000-10-16 2005-04-05 Microsoft Corporation Pattern recognition training method and apparatus using inserted noise followed by noise reduction
WO2004002192A1 (en) 2002-06-21 2003-12-31 University Of Southern California System and method for automatic room acoustic correction
US7567675B2 (en) * 2002-06-21 2009-07-28 Audyssey Laboratories, Inc. System and method for automatic multiple listener room acoustic correction with low filter orders
US7363221B2 (en) 2003-08-19 2008-04-22 Microsoft Corporation Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation
US7412380B1 (en) * 2003-12-17 2008-08-12 Creative Technology Ltd. Ambience extraction and modification for enhancement and upmix of audio signals
WO2005066927A1 (ja) * 2004-01-09 2005-07-21 Toudai Tlo, Ltd. 多重音信号解析方法
EP1585112A1 (en) * 2004-03-30 2005-10-12 Dialog Semiconductor GmbH Delay free noise suppression
WO2006106479A2 (en) 2005-04-08 2006-10-12 Nxp B.V. A method of and a device for processing audio data, a program element and a computer-readable medium
DK1760696T3 (en) * 2005-09-03 2016-05-02 Gn Resound As Method and apparatus for improved estimation of non-stationary noise to highlight speech
JP4637725B2 (ja) * 2005-11-11 2011-02-23 ソニー株式会社 音声信号処理装置、音声信号処理方法、プログラム
TW200819112A (en) 2006-10-27 2008-05-01 Sun-Hua Pao noninvasive method to evaluate the new normalized arterial stiffness

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI503817B (zh) * 2009-05-26 2015-10-11 Dolby Lab Licensing Corp 操作音訊信號處理裝置或操作處理系統之方法、預定義動態等化頻譜設定檔之提供系統及其之選擇和使用裝置、以及相關電腦可讀儲存媒體及處理系統
TWI509597B (zh) * 2009-05-26 2015-11-21 Dolby Lab Licensing Corp 音訊信號動態等化處理控制技術
CN102438191A (zh) * 2010-09-08 2012-05-02 Akg声学有限公司 用于声学信号跟踪的方法
CN102438191B (zh) * 2010-09-08 2015-09-02 Akg声学有限公司 用于声学信号跟踪的方法
TWI485697B (zh) * 2012-05-30 2015-05-21 Univ Nat Central Environmental sound recognition method
US10448185B2 (en) 2013-07-22 2019-10-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
TWI587285B (zh) * 2013-07-22 2017-06-11 弗勞恩霍夫爾協會 使用解相關器輸入訊號之一預混合之多聲道解相關器、多聲道音源解碼器、多聲道音源編碼器之方法及其電腦程式
US10431227B2 (en) 2013-07-22 2019-10-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
US11115770B2 (en) 2013-07-22 2021-09-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel decorrelator, multi-channel audio decoder, multi channel audio encoder, methods and computer program using a premix of decorrelator input signals
US11240619B2 (en) 2013-07-22 2022-02-01 Fraunhofer-Gesellschaft zur Foerderang der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
US11252523B2 (en) 2013-07-22 2022-02-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
US11381925B2 (en) 2013-07-22 2022-07-05 Fraunhofer-Gesellschaft zur Foerderang der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
TWI579836B (zh) * 2016-01-15 2017-04-21 Real - time music emotion recognition system
TWI773286B (zh) * 2020-04-30 2022-08-01 大陸商華為技術有限公司 音頻訊號的比特分配方法和裝置
US11900950B2 (en) 2020-04-30 2024-02-13 Huawei Technologies Co., Ltd. Bit allocation method and apparatus for audio signal
TWI801217B (zh) * 2022-04-25 2023-05-01 華碩電腦股份有限公司 訊號異常檢測系統及其方法

Also Published As

Publication number Publication date
TWI426502B (zh) 2014-02-11
EP2210427B1 (en) 2015-05-06
US20090080666A1 (en) 2009-03-26
HK1146678A1 (zh) 2011-06-30
JP5284360B2 (ja) 2013-09-11
RU2472306C2 (ru) 2013-01-10
RU2010112892A (ru) 2011-10-10
US8588427B2 (en) 2013-11-19
CN101816191A (zh) 2010-08-25
JP2010541350A (ja) 2010-12-24
CN101816191B (zh) 2014-09-17
WO2009039897A1 (en) 2009-04-02
EP2210427A1 (en) 2010-07-28

Similar Documents

Publication Publication Date Title
TW200915300A (en) Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
TWI396188B (zh) 依聆聽事件之函數控制空間音訊編碼參數的技術
CA2583146C (en) Diffuse sound envelope shaping for binaural cue coding schemes and the like
AU2005299068B2 (en) Individual channel temporal envelope shaping for binaural cue coding schemes and the like
TWI352971B (en) Apparatus and method for generating an ambient sig
AU2008314183B2 (en) Device and method for generating a multi-channel signal using voice signal processing
JP5106115B2 (ja) オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング
KR101710544B1 (ko) 스펙트럼 무게 발생기를 사용하는 주파수-영역 처리를 이용하는 스테레오 레코딩 분해를 위한 방법 및 장치
Uhle et al. A supervised learning approach to ambience extraction from mono recordings for blind upmixing
Negru et al. Automatic Audio Upmixing Based on Source Separation and Ambient Extraction Algorithms