TW200841326A - Method and apparatus for enhancement of audio reconstruction - Google Patents

Method and apparatus for enhancement of audio reconstruction Download PDF

Info

Publication number
TW200841326A
TW200841326A TW097109730A TW97109730A TW200841326A TW 200841326 A TW200841326 A TW 200841326A TW 097109730 A TW097109730 A TW 097109730A TW 97109730 A TW97109730 A TW 97109730A TW 200841326 A TW200841326 A TW 200841326A
Authority
TW
Taiwan
Prior art keywords
audio
channel
source point
audio channel
parameter
Prior art date
Application number
TW097109730A
Other languages
English (en)
Other versions
TWI456569B (zh
Inventor
Ville Pulkki
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW200841326A publication Critical patent/TW200841326A/zh
Application granted granted Critical
Publication of TWI456569B publication Critical patent/TWI456569B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Laser Surgery Devices (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

200841326 九、發明說明: 【發明所屬之技術領域】 本發明涉及-種關於如何提高對重構音頻 方向的感知的技術。具體地,本發明提出了—種用 所記錄的音頻信號的設備和方法,使得可以相對於 5他方向的音頻信號對音頻源的可選方向進行強化或過加權 (over-weighted ) 〇 【先前技術】 通常,在多聲道再現和收聽中,收聽者被多個揚哭 Π)環繞。存在捕獲針對特定設置(勝up)的音頻信號的各^ 方法。再現中的-個通常目標是再現原始記錄的聲音事件 的空間合成,即,各個音頻源_點㈤gin),如管弦樂 隊内喇叭的位置。多個揚聲器設置是相當常見的,並且^ 以產生不同的空間感。不使用特殊的後生產技術,通常已 丨5知的兩聲道身歷聲設置可以僅在兩個揚聲器之間的線上重 〉 建聽覺事件。這主要通過所謂的“振幅_移動(panning),,來 、 貝現,其中取決於音頻源相對於揚聲器的位置,與一個音 頻源相關的信號的振幅分佈在兩個揚聲器之間。這通常在 退錄或後續的混音期間進行。即,來自相對於收聽位置較 2〇遠左側的音頻源將主要通過左揚聲器再現,而在收聽位置 m面的音頻源將通過這兩個揚聲器以相同的振幅(電平) 再現。然而,不能再現從其他方向發出的聲音。 因此,通過使用分佈在收聽者周圍的更多揚聲器,可 以覆盍更多方向,並且可以產生更加自然的空間感。可能 5 200841326 聲道揚聲11佈局是5.1標準(服跡υ,里 預先確定為0。、土30。和+ = = Γ聽位置的方位角 將信間’ 置的偏差將導致再現品料低。根據糾準的再現設 多個= = 的不同數9的揚聲器的 中)也包括不同高度的揚聲尤其在影院和聲音裝置 ίο 15 計並的再現設置,針對緒提及的揚聲器系統設 戈下如η右干不同的記錄枝,以便記錄和再現收聽情 t同記錄環境中所感知到的空間感。用於記錄針㈣ 選多笨道揚聲H系統的空_音的理 方 聲器個數相同的麥克風。在這種情況下 时量ttttern)也應與揚聲器佈局相對應,使得只使 咬立1克(或更多)來記錄來自任意的單方向的 耳曰°母個麥克風與特定揚聲肋關聯。越多的 於再現’麥克風的方向性圖案越窄。然而,窄方向麥^ 相當昂貴’並典型具有非平坦的頻率回應,以不期望的 式使所記錄的聲音的品質發生惡化。❹卜,由於總是使用 以比所需更多的麥克風來再現從單個方向發出的聲音,使 用具有過寬方向性圖案的多個麥克風作為多聲道再A的輸 入導致歪曲(colored)和模糊的聽覺感知,好似其是以^ 不同揚=相關聯的麥克風而記錄的。通常’當^用的 麥克風敢適於兩聲道的記錄和再現,即,這些麥克風並不 6 20 200841326 疋以再現J衣繞空間感的目標而設計的。 從麥克風設計的觀點來看,討論了各種方式以調整麥 克風的方向性圖案,以滿足空間.音頻_再現中的需求。通 $所有麥克風依據荦音到達麥克風的方向來有差別地捕 ,聲音。卩卩,麥克風具林敏度,這取決於所記錄 聲音的到達方向。在-些錢財,該影響是微小的,因 為這些麥克風捕獲的是與方向幾乎無關的聲音。這些麥克 ίο 15 風通常被稱為全向麥克風。在典型的麥克風設計中了將圓 形隔膜(circular diaphragm )附在小的氣密(airt 上。 如果隔膜沒有附在殼上’聲音等同地從每—側到達殼,其 方向性圖案具有兩罐瓣。g卩’這種麥克取相等的靈敏 度從隔膜的前後㈣聲音,然㈣性缺。這種麥克風並 不捕獲來自與隔膜平面垂直(即與最大靈敏度方向垂直) 的方向的聲音。這種方向性圖案被稱為偶極子或八字。 使用用於麥克風的非氣密殼,也可以將全向麥克風修 改為方向性麥克風。該殼_構造,使得允許聲波通過該 殼傳播並到賴膜,其巾-些傳龄向是優選的,從而這 種麥克風的方向性圖案成為全向和偶極子之_圖案。例 =,這些圖案可以具有兩個波瓣。然而,這些波瓣可以具 度…些通,知的麥克風具有僅僅單個波瓣的 圖案。取重要的讀疋心胗轉 表示為We,,θ是聲奸軸方向 依據方向來量化輸人聲音振幅中被捕獲的部分 先前討論的全向圖案也被稱為零階圖案,先前所提及 20 200841326 的其他圖案(偶極子和心形)被稱為一階圖案。所有先前 討論的麥克風設計不允許方向性圖案的任意成形,因為它 們的方向性圖案完全由其機械構造來確定。 為了部分地克服該問題,設計了一些專用聲學結構, 5可以用於產生比一階麥克風的方向性圖案更窄的方向性圖 • 案。例如,當將有孔的管附在全向麥克風上時,可以產生 Φ 具有窄方向性圖案的麥克風。這些麥克風被稱為徵槍或步 槍式麥克風。然而,它們典型不具有平坦的頻率回應,即 以所§己錄琴音的品質為代價來使方向性圖案變窄。此外, ίο該方向性圖案由幾何構造預先確定,因而以這種麥克風執 行的記錄的方向性圖案在該記錄後不能得到控制。 因此,提出了其他方法以部分地允許在實際記錄之後 改變方向性圖案。通常,這依賴於以全向或方向性麥克風 陣列圮錄聲音、並在之後應用信號處理的基本思想。近來 I5提出了各種這樣的技術。相當簡單的示例是使用彼此靠近 的兩個全向麥克風來記錄聲音,並從彼此中減去信號。這 產生了具有等同於偶極子的方向性圖案的虛擬麥克風俨 5虎。 ^其他更加複雜的方案中,也可以在將麥克風信號相 20加,前對其進行時延或滤波。使用波束形成(也是無心 域蘇中公知的技術),通過利甩棒 克風信號進行濾波,並在濾波之後將信號相加(濾波·求二 波束形成),來形成與窄波束相對應的信號。然而,這些技 術對於^號本身來說是隱蔽的(blind),即,它們不知道聲 200841326 音到達的方向。因而,必須定義預定的方向性圖案,這與 聲音源在預定方向的實際出現無關。通常,對聲音的“到 達方向”的估計是其自身的任務。 通常’可以使用以上的技術來形成各種不同的空間方 5向特性。然而,形成任意的空間選擇性靈敏度圖案(即, 形成窄的方向性圖案)需要多個麥克風。 產生多聲道記錄的可選方式是將麥克風定位在靠近要 記錄的每個聲源(例如,樂器)處,並通過在最終混音中 控制緊靠(cl〇se-up)麥克風信號的電平來重新產生空間 °感然而,這種系統在產生最終的下混音(downmix)的過 私中需要大量麥克風和許多用戶交互。 近來已經提出了克服上述問題的方法,被稱為方向性 音頻編碼(DirAC),這種方法可以與不同的麥克風系統一 起使用,並能夠記錄聲音以便使用任意揚聲器設置進行再 15現。DirAC的目的是使用具有任意幾何設置的多聲道揚聲 器系統,盡可能精確地再現現有聲學環境的空間感。在記 錄% i兄中,以全向麥克風(W)和允許測量聲音到達方向 乂及耳曰擴政的麥克風組來測置J辰境的回應(可以是連巧 記錄的聲音或脈衝回應)。在以下段落中以及在本申請中貝 2〇術語“擴散”應被理解為針對聲音的非方向性的^量。 即,以相等的強度從所有方向到達收聽或記錄位置的&音 是最大擴散的。量化擴散的通常方式是使用來自區間[0耳曰 的擴散值’其中,值1描述了最大擴散的聲音,以及’值·’〇 描述了理想的定向聲音,即僅從一個可清晰辨識的方内到 9 200841326 用盘=1彳目通常已知的測量聲音到達方向的方法是應 =i坐標軸對齊的3個人字麥克風(χγζ)。設計了 變雍夕^風(所明&琴場麥克風”),直接產生所有期望的 j絲然而,如以上所提及的,W、x、wz信號也可以 根據離散全向麥克風组來計算。
ίο
Dll:AC 77析巾’將所記錄的聲音信號分至與人類聽 見感知的頻率選擇性相對應的頻道(frequency channel)。 ^例如’號通過濾波驗或傅立葉變絲處理,以將 ^號刀、至夕個頻道,具有適於人類聽覺的頻率選擇性的帶 見。=後,分析頻帶信號以確定聲音源點的方向和針對具 有預定時間解析度(fesGlutiGn)的每個頻道 日=解析度並不需要是蚊的,並且#然可以適合於記錄 裒兄在DirAC中,與所分析的方向和擴散資料一起記錄 或傳輸一個或更多個音頻聲道。 15 在合成或解碼中,最終應用於揚聲器的音頻聲道可以 基於全向聲道W (由於所使用的麥克風的全向方向性圖案 而以南品質記錄),或者針對每個揚聲器的聲音可以被計算 為W、X、Y和z的加權和,因而形成針對每個揚聲器的 具有特疋方向特性的信號。與編碼相對應,將每個音頻聲 2〇道分為頻道’可選地,還依據所分析的擴散,將頻道分為 擴政或非擴政流。如果測墨擴散為—兩’則可以使甩產生聲 音擴散感知的技術(例如也用於身歷聲提示編碼中的去相 關技術)來再現擴散流。使用致力於產生類似點的虛擬音 頻源(位於在分析中發現的方向資料所指示的方向上)的 10 200841326 技術,即產生DirAC信號,來再現非擴散聲音。即,如在 現有技術中,並不使空間再現適合於一個特定的“理想,, 揚奪器設置(例如,5.1)。這尤其是以下情況··使用與用於 5 10 15 記錄的麥克風的方向性圖案有關的知識,根據方向參數(即 通過向量來描述)來確定聲音的源點。如已經討論的,以 ^率選,性方式來將3維空間中的聲音源點參數化。這樣, :、要揚耸器設置的幾何結構是已知的,便可以以高品 設置來魏方向感。因此,此AC並不限於 ^揚荦H幾何結構,並通常允許更加靈活的對聲音的空 間再現。 工 儘管已經開發了許多技術來再現多聲道音頻記錄,並 並=於之後的多聲道再_適合域,但是現有技術中 間信號產生影響’使得可以在再現期 獨晰,可峨來自-個 【發明内容】 頻聲個實施例,可以重構具有至少一個音 聲道的-部, 自1方:或來自多個特定方向度允許增強來 方向:在導:音=3:於記錄位置的期望源點 的該部分,使得相;重,分時’修改音頻聲道 于於/、有扣不遢離期望源點方向的源點 20 200841326 方向的方向參數的音頻聲道的其他部分,增大具有指示靠 近期望源點方向的源點方向的方向參數的音頻聲道的—部 分的強度。可以強化音頻聲道或多聲道信號的部分的源點 方向’從而允許對在記錄期間位於所選方向上的音頻物件 5 的更好感知。 根據本發明的另一實施例,用戶可以在重構期間選擇 應當強化哪個方向或哪些方向,從而強化與所選方向相關 聯的音頻聲道的部分或多個音頻聲道的部分,即相對於餘 下的部分增大其強度或振幅。根據實施例,可以使用比未 10實現方向參數的系統尖銳得多的空間解析度對來自特定方 向的聲音進行強化或衰減。根據本發明的另一 實施例,可 以指定任意的空間加權函數,該函數無法以常規麥克風實 現。此外,加權函數可以是隨時間和頻率而變化的,從而 可以以高靈活度使用本發明的其他實施例。此外,加權函 I5數非常易於實現和更新,因為僅需將它們載入系統而不是 更換硬體(例如,麥克風)。 根據本發明的另一實施例,對具有相關聯的擴散參數 (該擴散參數指示音頻聲道的一部分的擴散)進行重構, 使得相對於具有相關聯的較低擴散的音頻聲道的其他部 2〇刀’減小具有南擴散的音頻琴道的一部分的強度。 因此’在音頻彳§5虎的重構過程中,可以考慮音頻信號 的各個部分的擴散,以進一步增加重構信號的方向感知。 此外,相對於僅使用擴散聲音部分來增加信號的總擴散、 而非利用針對音頻源的更好重分佈的擴散資訊的技術,這 12 200841326 τ以增大音頻源的重分佈。應注意,本發明還允許相反地 強化具有擴散源點的所記錄聲音的部分,例如環境信號。 根據另一實施例,將至少一個音頻聲道上混音(upmix) 至夕個g頻笨道。多個音頻聲道可與可用於重播的揚聲器 5 ^數目相對應。可以使用任意揚聲器設置增強音頻源的重
分佈,同B寺可以保證總是盡可能好地使用現有設備再現音 頻源的方向,而不考慮可用揚聲器的數目。 根據本發明的另一實施例,甚至可以經由單聲道揚聲 仃再現。當然,在這種情況下,信號源點方向將是揚 10耸益的f際位置。然、而,通過選擇相對於記錄位置的信號 的期望源點方向,與簡單的下混音重播相比,可以顯著地 增大源於所選方向的信號的可聽性。 根據本發明的另一實施例,當將一個或更多個聲道上 此曰至與%聲益相對應的多個聲道時,可以精確地再現作 15號的源點方向。例如,通過使用振幅移動技術,可以盡可 能好地重構源點方向。為了進一步提高感知品質,也可以 依據所選方向引入附加相移。 另外,本發明的特定實施例可以減少用於記錄音頻作 號的麥克風被膜(capsule)的成本,而不會嚴重影響音頻 2〇品質,這是因為至少是用於確定方向/擴散估計的麥克 需具有平坦的頻率回應。 …、 【實施方式】 以下將參照附圖對本發明的若干實施例進行描述。 13 200841326
第一圖示出了用於重構音頻信號的方法實施例,該立 頻信號具有至少-個音頻聲道和指示相對於記錄位置的二 頻聲道的一部分的源點方向的相關聯的方向參數。在選二 步驟10中’針對重構音頻信號的重構部分,選擇相對於記 錄位置的期望源點方向,其巾重構部分與音頻聲道的 分相對應。即,針對要處理的信號部分來選擇源點方向°, 在重構之後應可從該賴額清楚地聽見該信制分。可 以直接通過用戶輸入或自動地做出該選擇,如下所述。 ίο
20 該部分可以是音頻聲道的時間部分、頻率部分或特定 頻率間隔的時間部分。在修改步驟12中,修改音頻聲道的 該部分,以導出重構音頻信號的重構部分,其中該修改包 括^目對於具有指示遠離期望的源點方向的源點方向的方 向麥數的音麟道的其他部分,增大具有指示靠近期望的 源點方向的義方向的方向參數的音頻聲道的—部分的強 度。即,通過增大強度或電平來強化音頻聲道的該部分, 例如’可以通馳驗隨與音鱗_該部分相乘而實 現。根據實關,把大_放因數乘以源自#近所選(期 望)方向的方向的部分,以在重構過程中触這些信號部 =,並提高收聽者所感興趣的這些音頻記錄㈣的可聽 2通常:在該申請的上T文中,應將信號或聲道強度的 二理解為使W呈現為更好的可聽性的任何措施。例 是增大信號振幅、增大信號所攜帶的能量,或 者把錢乘以大於單位Uunity)的縮放因數。,可 以減小競爭信號的響度以實現該效果。 14 200841326 在收聽地點,用戶可以通過用戶介面直接執行期望方 向的選擇。然而,根據可選實施例,該選擇可以自動地執 行,例如通過分析方向性參數而自動執行,從而強化了具 有大致相同源點的頻率部分,而抑制了音頻聲道的剩餘部 分。因此,可以使信號自動彙聚於主要音頻源處,而不需 要收聽端處的額外的用戶輸入。
20 根據其他實施例,由於已經設置了源點方向,所以省 略選擇步驟。即,增大具有指示靠近所設置方向的源點方 向的方向參數的音頻聲道的一部分的強度。例如,所設置 的方向可以是硬接線的(hardwired),即該方向可以是預定 1例如,如果僅對電話會議場景中的巾讀話者感興趣, 體。可選實施例可以從記憶 貝取叹置方向,_憶體也可以存儲多個待用作設置 取:例如,在打開本發明的設備時,可以讀 镜時施例’也可以在編抑侧(即,在記錄信 輪附方向的選擇’使得可以隨音頻信號-起傳 可能已二在:附加芩數指不用於再現的期望方向。因此, 道用侧選擇重構信號的空間感知,而無需知 &再現的特定揚聲器設置。 頰信號的方法獨立於意在再現重構音 道或身歷聲或多’所以可以將該方法應用於單聲 的工間感進仃後處理,明強信號的 15 200841326 於單聲道重播時, 成任意的方向性圖軸=將錢果解料q能夠形 以在接㈣(即在__2料記錄錢1而,可 無需=記錄設置做出任何改變)完全地獲得_果,而 實施例,即用於重構^構^頻信號的設備(解石馬器) 哭9Π白社士人.頻^虎的解碼 感知度。 當用 器20包括方向選二碼器_實施例:解: 圖的實施例,岭向;分修改11 24。极據第二 多聲道音頻輸入26,:八^分析^干麥克思所記錄的 部分的源點方向° 28導出指示音頻聲道- 15 向性參數。根據“明部分㈣點方向)的方 入射到麥克風的方向施例,選擇將大部分能量 位置。例如,母個特定錢科來確定記錄 I令與祖 可以使用先前所描述的DirAC-麥克風_ 八Si也可當然’基於所記錄的音頻資訊的其他方向性 二方命參數L以用於實現該分析。因此’方向分析器28導 S二26的1方八向參數3G指示音頻聲道的-部分或多 二二二點方向。此外,可以操作方向性 73 “ 蛤出針對每個信號部分(例如,針對信號的每 個頻率咖鱗個,貞)的擴散參數32。 將度參數30以及(可選地)擴散參數32傳輸至 構方向選擇器22實現用於針對重構音頻信 號的重心選擇闕於記錄位置的期望的源點方向。將與 期望方向有關的資訊傳輸至音頻部分修改器Μ。音頻部分 16 20 200841326 修改器24接收至少一個音頻聲道34,具有針對其導出方向 麥,的一部分。例如,通過音頻部分修改器修改的至少二 個耸迢可以是由傳統多聲道下混音演算法產生的多聲道俨 號^的下混音…擁其簡單的情況是乡聲道音頻輪3 的虎的直接求和。然而,因*本發明的實施例並 入聲運的個數而限定,因而在可選實施例中,音頻二 20可以同時處理所有音頻輸入聲道%。 、 ”、、為 ίο 15 音頻部分修改蒸24對音頻部分進行修改,以導出 音頻信號的重構部分,其巾該修改包括:相對於 遠離期望源點方向的賴方向的方向參數的音頻 : =’增大具有指示靠近期望源點方向的源點方向的; 向參數的音頻聲道的—部分的強度。在第二圖的示例中, 數36 (q)乘以要修改的音頻聲道部分來執行 二p,如果分析該音頻聲道部分源於靠近所選期望 大的縮放因數36乘以該音頻部分。因而在 其輸出38處,音頻部分修改器輸出與 頻聲道部分相對應的重構音頻信號的重構^八&如 部分=改器24的輸出38處的虛線所指示,^僅針g 輸出Μ而執行’而且還針對多聲道輪出 : 對該多耷道輸出信號的輸出聲道的 广 订 &。 巧如數不固定或是預定 換言之,音頻解碼器20的實施例根摅 用的方向性分料獲祕輸人。中使 相盔絰挤洚,-十i 1 很守粟人類聽覺系統的 V頁车騎度把來自麥克風陣列的音頻信說26分為頻帶。 17 20 200841326 ,據每個頻道巾㈣間來分析聲音的方向以及(可選的) 聲音的擴散。例如,這些屬性以方向角(方位角(azi)和 仰角(de))和擴散索引Psi (在〇和1之間改變)進行傳 、.然後,通過對所獲取的信號使用加權操作(該操作取 決於方向角azi和/或eIe、以及(可選的)擴散㈤)),對 所獲取的信號施加意欲或所選的方向特性。很鶴,可 針對不_帶有所區別地指定該加權’並城合 隨時間改變。 吊曰 10 15
w圖示出了基於DirAC合成的本發明的另一實灰 例。在讀意義上,第三圖的實關可以被轉為DirA( 再現的增強,這允許依據所分析的方向來控制聲音的绩 平。這使得可以強化來自—個或多財向的聲音 = 制來自-個或多個方向的聲音。當應用於多聲道再現, 實現對所再現聲音圖像的魏理。如果僅制—個聲道% 為輸出’則該效果等同於在信號記錄_使用1有任 向性圖案的方向性麥姐。在第三斷^出的實施例;、, 示出了方向參數的導出、以及—個傳輸音鱗道的導出。 例如,基㈣聲場麥姐所記_β格式錢風聲道w、 X、Υ和Ζ來執行該分析。 遂幀地Urame-W1Se)執行該過程。因此,將連續』 信號分為f貞’通過窗函數來對巾貞進行較,從而避免; 界處的不連續。在傅立葉義塊4G中對加窗信號幢 立葉變換,將麥克風信號分為N個頻帶。為了單^ 18 20 200841326 帶:處理,因為對餘,帶 幢内每個B格式麥’克風 =:導;=^ 分量的強度的係數。將這些頻率 ^ :出現的頻率 以導出音頻聲道和相關聯的方向參數。二I Μ 實施例中,· Β格式麥找聲道的全向^财_㈣。基於針對 性分析㈣執行嫩 數42,通過方向 ίο 15 _ 20 更對曰頻k號和全向聲道46 —同進 二重構。*存在擴散參數52時,將信號路徑分為非擴散路 仅54=和擴散路徑5扑。非擴散路徑*根據參數而進行縮 放’ '而在擴散Ψ為高時,大多數能量或振幅將保持在非 擴政巾4目反’當擴散為高時,大多數能量將移至擴 政路仏54b。在擴散路徑54b中,使用去相關器^或娜 對信號進行去相關或擴散。可以使用傳統已知技術來執行 去相關’例如與白雜訊信號進行迴旋(e_〇iutiGn),其中 白雜削^可以逐頻道而不同。只要去相關是保存能量 ,’便可以柄對輸㈣的非擴散信號賴*和擴散信 號路輕54b的信號簡單地相加,重新生成最終輸出,因為 已輕對㈣路徑上的錢進行了縮放,如擴散參數ψ所指 二。可以依據揚聲器個數,使用適合的縮放規則對擴散信 ^虎路控54b進行縮放。例如,可以使擴散路徑中的信號縮 19 200841326 放1版,其 當針對多聲道設置執行重構時,將直接”路 和擴散信號路《 54b分 54a 5
10
個子路徑(在分裂位置58a二们應的多 裂位置58a和58h考从、如處)為此,可以將在分 聲道上混音至多個^道^^解,為等同於將至少-個音頻 系統進行重播。因::'=ί個揚聲器的揚聲器 的源點方向=重定向塊6〇來重構各個音頻部分 向塊60通常j柄部分㈣度或減。為此,重定 使“其二 於重播的揚聲器設置。例如,可以 數的的振,移動的技術,實現相關聯的加權因 #二 ' ”丨重定向)和導出。通過向重定向塊60提 署^的4何揚聲器設置’可以使用重播揚聲11的任意配 ,來實現本發明的概念,而不會損失再現品f。在處理之 ^ =通過逆傅立葉變換塊&,對頻域信號執行多個逆傅立 葉變換,以導出可以通過各個揚聲器進行重播的時域信 號。在重播之前,必須通過求和單元64來執行重疊和相加 技術,以連接各個音頻幀,從而導出連續的時域信號,準 備好由揚聲器進行重播。 根據第三圖中示出的本發明的實施例,修改Dir-AC的 仏號處理,即引入音頻部分修改器66來修改實際處理的音 頻聲道的部分,這允許增大具有指示靠近期望方向的源點 方向的方向參數的音頻聲道部分的強度。這通過將附加的 20 20 200841326 加榷因數應用於直接信號路徑而實 頻率部分源於敏方向,贿過將卩,果所處理的 信號部分來強化信號。可以 σ心應用於該特定 應用,因為觀果應料财的聲麵彳于增益的 5 在可選〜— ’耳運#分產生同等的作用。 佈塊60中實7在’附加加權因數的應用也可以在重分 w+、 情况下,重分佈塊的應用姆大1 減小,加增益因數的重分佈增益因數。 』&大或 可以構中使時’例如, =场弟二圖所示的DirAC呈現方式來執 K)再現料頻聲道分為等於方向性分析所使用的那些頻:要 然後將k些頻聲分為流,擴散和非擴散流。例如,通過在 與^Oms的寬雜訊脈衝串進行迴旋之後將聲音作用於每個 揚聲器,從而再現擴散流。每個揚聲器的雜訊脈衝串均不 相同。將非擴撒流應用於從方向性分析所傳遞的方向,當 15然,該方向性分析取決於時間。為了實現多聲道揚聲器系 統中的方向感知,可以使用簡單的逐對或逐三元組的振幅 移動。此外,每個頻道乘以增益因數或縮放因數,這取決 於所分析的方向。通常,可以指定函數,其定義了用於再 現的期望的方向性圖案。例如,這可以是應當被強化的僅 2〇 僅一個方向。然而,任意的方向性圖案都易於以第三圖的 -實施例來實現。 在以下的方式中,將本發明的另一實施例描述為處理 步驟的列表。該列表基於以下假設··以B格式麥克風記錄 聲音,然後進行處理,以便使用DirAC樣式的呈現或提供 21 200841326 ,酋音頻聲道部分的源點方向〕的呈現,利用多聲 運或】早聲道揚聲器設置進行收聽。該過程如下:耳 來分i斤^頻f並在每飾_取決於頻率 5 10 15 角和仰角「 . ^、)擴散。作為示例’可以通過方位 ^iazi、ele)來對方向進行參數化。 可以ι/Λί數F ’其贿了期望的方向性®案。該函數 任意形狀。其典型地取決於方向。此外,如果= 數可以不同,也可以㈣=政針對不_率,該函 對每個時f據 更改。在每個頻帶處,針 因數據函數?導出方向性因數q,該方向性 於後,的音頻信號的加權(縮放)。 向性因鮮料相對應的方 針對任音I日⑽Γ 可以將該過程實現為 ,十對期望輸出聲道的DirAc呈現的_部分。 聽^先别所迷,可以使用多聲道或單聲道揚聲器系統收 =四1不出了關於如何利用本發明的方法和設備大大 增加議場景时與者誠知度的 100,示出了四個談話去1Π0 仕η己錄側 位置104不同的朝向。即a 對於記錄 ’摩自5炎洁者i〇2c的音頻作跋且 ==广的固定的源點方向。假設二 5自=號具有來自談話者腿的貢獻和例 如-些源自狄話者咖和_的討論的“背景”雜訊, 22 20 200841326 那麼所§己錄和傳輸至收聽地點110的寬頻信號將包括這兩 個信號分量。 作為示例’描繪了具有六個揚聲器112a-112f的收聽設 置,這六個揚聲器環繞著位於收聽位置114處的收聽者。 5因此,原理上,可以通過第四圖所描述的設置來再現源自 圍繞收聽者的大多數任意位置114處的聲音。傳統的多聲 道系統將使用這六個揚聲器112a-U2f來再現聲音,以在盡 可能接近記錄期間地重構在記錄位置1〇4處體驗到的空間 感。因此,在使用傳統技術再現聲音時,也可清晰地聽見 10在正在討論的談話者102&和102b的“背景,,下的談話者 102c的貢獻,這降低了談話者1〇2c的信號的清晰度。 根據本發明的實施例,可以使用方向選擇器來選擇相 對於記錄位置的期望源點方向,其用於將由揚聲器 112a-112f重播的重構音頻信號的重構版本。因此,收聽者 15 U4可以選擇與談話者l〇2c的位置相對應的期望方向 116。因此,音頻部分修改器可以修改音頻聲道的部分,以 V出重構g頻彳§號的重構部分,從而強化源自靠近所選方 向116的方向的音頻聲道部分的強度。在接收端,收聽者 可以決定應當再現哪個源點方向。做出該選擇,僅強化源 20自談話者102c的方向的那些信號部分,因而正在討論的談 話者102a和i〇2b的干擾將變小。除了強化來自所選方向 的仏號之外’可以通過振幅移動來再現該方向,如波形口如 和120b所象徵性指示。因為談話者102c將比揚聲器112c 更加靠近揚聲器112d,所以振幅移動將導致經由揚聲器 23 200841326 對強化信號的再現,而餘下的揚聲器將幾乎是 擴散信號部分進行重播)。因為談話者搬c 對於⑽’所以振幅移動將增大揚聲器112d相 對於%聲态112c的電平。 m=Γ Ξ不出了用於增強音頻信號的方向感知的方法實 在第一分析步驟150中,導出至少-個音頻
10
20 二對於έ己錄位置的音頻聲道—部分的源點方向 的相關聯的方向參數。 =擇步驟152中,針對重構音頻信號的重構部分, =錄位置的期望的源點方向,所述重構部分與 曰頻荦迢的一部分相對應。 、.在修改步驟154巾,對音鱗道的該部分進行修改, 二導出重構,信號的重構部分,其中該修改包括:相對 J ϋ ί才曰不讀期望源點方向的源點方向的方向參數的音 ^聲還的其他#分,增大具有指示靠近期望_方向的源 .妨=的方向參數的音頻聲_—部分的強度。 第,、圖不出了用於重構音頻信號的音頻解竭器的實施 例’所述音頻诚具妓少—個音麟道⑽和指示相對 f記錄位置的音解道部分的源點方向的相_的方向參 音頻解碼ϋ 158包括方向選卿164,麟針對重構音 頻信號的4構部分,選擇相對於記錄位置關望源點方 ^ ’所述重構部分與音頻聲道的一部分相對應。解石馬器158 延包括音頻部分修改器166,用於修改音頻聲道的一部分, 24 200841326 5 以$出重構音頻jS5虎的重構部分,其中該修改包括:相對 於f有指示遠離期望源財向的賴方向的方向參數的音 頻聲運的其他部分,增大具有指示靠近魅_方向的源 點方向的方向參數的音頻聲道的一部分的強度。
10
20 、如第六圖所示,當解碼器用於多聲道再現設置中時, =以$出單個重構部分168,或者可以同時導出多個重構部 分Π0’第七圖所示的用於增強音頻信號⑽的方向感知 的系統實施例基於第六圖的解碼器158。因此,以下僅對額 外引入的元件進行描述。用於增強音頻信號的方向感知的 糸f 180接收音頻錢182作為輸入,該音頻信號182可 ^疋ί個麥克風所記錄的單聲道信號或多聲道信號。音頻 舞瑪益184導出音頻錢’該音齡號具有至少—個音頻 = 和指示相對於記錄位置的音頻聲道—部分的源點 :向的相II聯的方向參數162。此外,如已經針對第六圖的 2解碼、輯描述’對所述至少—個音頻聲道和相關聯的 ° ΐί進行處理’以導出在感知上增強的輸出信號170。 辟+^ &主要在夕奪道音頻再5見領域描述了本發明,不同 頃域的應用切峨本發_枝和設射獲益。 二2明的概念可以用於集中於(通過提升或衰減;、電 放二,,、下的特定個人發言。此外,其可以用於抑制(或 认)%境分量,以及用於去混響或混響增強。其他1 =應用場景包括環峰訊信號的雜訊抵消 ;^ ^ 途可叹職轉韻方向性料。 了犯的用 依據本發明方法㈣定實現需求,可㈣硬體或軟 25 200841326 來實現本發明的方法。 而執行本發明方法的數输=質系統協作從 制信號存錯其上的盤、DVD或CD)(以:電可讀控 5 10 通常本㈣是具有_在機器可讀載因而 程式產品,該程式碼操作用於在電腦程式 ,亍本發明的方法。換言之,因二= 有,式碼的電難式,餘當電難式在電腦^執 仃本發明方法中的至少一種。 丁才執 儘管已經參照特定實施例特別示出並描述了以上内 容,但是本領域技術人員將會理解,可以在不偏離本發明 的精神和範圍的情況下做出形式和細節上的各種其4改 變。應理解,可以在適合於不同實施例的過程中做出各種 改變,而不會偏離這裏所公開的、並由所附申請專利範圍 所限定的更寬的概念。 _ 26 200841326 【圖式簡單說明】 第一圖示出了用於重構音頻信號的方法實施例; ,二圖示出了用於重構音頻信號的設備框圖; 5 10 第三圖示出了另一實施例的框圖; 四圖示出了在電話會議場景中的本發明的方法或本 毛月的设備的應用示例; 實施ϋ·圖丁出了用於增強音頻信號的方向性感知的方法 及 了用於重構音頻信號的解碼器實施例;以 第七圖示φ γ 實施例。 肖於㈣音輸號的方向倾知的系蛛 參 27 200841326 【主要元件符號說明】 選擇步驟10 修改步驟12 解碼器20 方向選擇器22音頻部分修改器24 多聲道音頻輸入26 方向分析器28 5 方向參數30 擴散參數32 音頻聲道34 縮放因數36 輸出38
10 15
傅立葉變換塊40 全向聲道46 音頻解碼器50 非擴散路徑54a 去相關器56a、56b 重定向塊60 求和單元64 記錄側100 收聽地點110 期望方向116 頻率參數42 輸入音頻編碼器44 方向性分析塊48 擴散參數52 擴散路徑54b 分裂位置58a、58b 逆傅立葉變換塊62 音頻部分修改器66 談話者102a-102d 記錄位置104 揚聲器112a-112f 收聽位置114 波形 120a、120b 第一分析步驟150 選擇步驟152 修改步驟154 音頻解碼器158 音頻聲道160 方向參數162 包括方向選擇器164 音頻部分修改蒸166 1構部分168 重構部分170 增強音頻信號180音頻信號182 音頻編碼器184 28 20

Claims (1)

  1. 200841326 十、申明專利範圍: 1、一種用於重構音頻信號的方法,所述音頻信號具 有至^ 個音頻聲道和指示相對於記錄位置的音頻聲道的 -部分的源點方向的相 關聯的方向參數,所述方法包括: 修改音頻聲道的一部分,以導出重構音頻信號的重構 口P刀其中所述修改包括:相對於具有指示遠離所設置源 點方向的源點方向的方向參數的音頻聲道的其他部分,增 /、有示罪近所設置源點方向的源點方向的方向參數的 音頻聲道的一部分的強度。 依據申請專利範圍第1項所述的方法,還包括: 1〇 選擇相對於記錄位置的所設置源點方向。 3、 依據申請專利範圍第1項所述的方法,還包括: 從記憶體讀取所設置方向。 4、 依據申請專利範圍第1項所述的方法,其中所述修 改步驟包括:修改音頻信號的一部分的頻域表示。 15 5、依據申請專利範圍第1項所述的方法,其中所述修 改步驟包括··修改音頻信號的一部分的時域表示。 6、 依據申請專利範圍第1項所述的方法,其中所述修 改步驟包括:導出針對音頻聲道的每個部分的縮放因數, 使得相對於具有指示遠離期望源點方向的源點方向的相關 20 ^的方向參數的音頻聲道的其他已縮放部分,具有指示靠 一近期望源點方向的源點方向的相關聯的方向參數的音頻聲 這的已縮放部分,即就是通過把音頻聲道的該部分與所述 縮放因數相乘而導出的縮放部分具有增大的強度。 7、 依據申請專利範圍第1項所述的方法,還包括: 29 200841326 導出至少一個音頻聲道的頻率表示。 8、依據申請專利範圍第7項所述的方法,其中所述導 出步驟包括:導出至少一個音頻聲道的第一和第二有限寬 度頻率間隔的表示,其中所述第一頻率間隔的寬度不同於 5 所述第二頻率間隔的寬度。 . 9、依據申請專利範圍第2項所述的方法,其中選擇期 、 望源點方向的步驟包括:接收指示期望方向的輸入參數作 •為用戶輸入。 10、 依據申請專利範圍第2項所述的方法,其中選擇 10 期望方向的步驟包括:接收與音頻信號相關聯的方向參 數,所述方向參數指示期望方向。 11、 依據申請專利範圍第2項所述的方法,其中選擇 期望方向的步驟包括:確定至少一個音頻聲道的有限寬度 頻率間隔的源點方向。 15 12、依據申請專利範圍第1項所述的方法,還包括: # 接收與音頻聲道相關聯的擴散參數,所述擴散參數指 示音頻聲道的一部分的擴散;以及 其中修改音頻聲道的一部分的步驟包括:相對於具有 指示較低擴散的擴散參數的音頻聲道的其他部分,減小具 20 有指示高擴散的擴散參數的音頻聲道的一部分的強度。 13、依據申請專利範圍第1項所述的方法,還包括: 將至少一個音頻聲道上混音至多聲道,以經由具有多 個揚聲器的揚聲器系統進行重播,其中多聲道中的每一個 都具有與至少一個音頻聲道的一部分相對應的聲道部分。 30 200841326 14、依據申請專利範圍第13項所述的方法,其中所述 修改步驟包括:相對於從具有指示遠離期望源點方向的源 點方向的方向參數的音頻聲道的其他部分上混音得到的多 聲道的其他聲道部分,增大從具有指示靠近源點期望方向 5 的源點方向的方向參數的音頻聲道的一部分上混音的每個 .聲道部分的強度。 . 15、依據申請專利範圍第13項所述的方法,還包括: ® 移動聲道部分的振幅,使得重構聲道部分的所感知源 點方向與使用預定揚聲器設置進行重播時的源點方向相對 10 應。 16、一種用於增強音頻信號的方向感知的方法,所述 方法包括· 導出至少一個音頻聲道和指示音頻聲道的一部分相對 於記錄位置的源點方向的相關聯的方向參數; 15 修改音頻聲道的一部分,以導出重構音頻信號的重構 參 部分,其中所述修改包括:相對於具有指示遠離所設置源 點方向的源點方向的方向參數的音頻聲道的其他部分,增 » 大具有指示靠近所設置源點方向的源點方向的方向參數的 音頻聲道的一部分的強度。 20 17、一種用於重構音頻信號的音頻解碼器,所述音頻 信號具有至少一個音頻鼕道和指示相對於記錄位置皓音頻 聲道的一部分的源點方向的相關聯的方向參數,所述音頻 解碼器包括: 音頻部分修改器,用於修改音頻聲道的一部分,以導 31 200841326 5 10 _ 15 2〇 出重構:=f重構部分’其中所迷修改包括:相對於 具有,t 置源點方向的源、點方向的方向參數的音頻聲13= ’增μ有指示靠延所設置源點方向的 源點5 H的音絲道的―度。 18:,=用於増強音頻信號的 知的音頻編碼 器,所述音頻編碼器包括: 心 信ift ’用於導出至少一個音頻聲道和指示了相 對於!己錄位置的音頻聲道的—部分的源點方向的關聯方向 參數,,用於修改音頻聲道的—部分,以便導出 離二Ϊ構部分’其中所逃修改包栝:相對於具 點方向的方向參數的音頻聲道的點方向的源 括:19、—種用於增強重構音_號的系統%述系統包 音頻編碼器,用於導出立 至少-個音頻聲道和指示相,所述音頻信號具有 部分的源财位置的音鱗道的一道二 解碼器,用於修改音頻聲 修改包括:相對於具有指二:==中所述 向的方向參數的音頻聲道^離〜㈣點方向的源點方 所設置、他部分,增大具有指示靠近 原點方向的源點方向的方向參數的音頻聲道的-部 200841326 分的強度。 20、一種用於產生音頻信號的方法,所述方法包括: 導出音頻聲道,使得相對於具有遠離所設置源點方向 的源點方向的音頻聲道的其他部分,強化具有靠近所設置 5 源點方向的源點方向的音頻聲道的一部分的強度。 • 21、一種用於記錄音頻信號的音頻記錄器,所述記錄 , 器包括: ® 聲道記錄器,用於導出音頻聲道,使得相對於具有遠 離所設置源點方向的源點方向的音頻聲道的其他部分,強 10 化具有靠近所設置源點方向的源點方向的音頻聲道的一部 分的強度。 22、 一種電腦程式,用於在電腦上運行時實現申請專 利範圍第1項所述的方法。 23、 一種電腦程式,用於在電腦上運行時實現申請專 15 利範圍第20項所述的方法。 參 33
TW097109730A 2007-03-21 2008-03-19 用於音頻重構增強的方法和設備 TWI456569B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US89618407P 2007-03-21 2007-03-21
US11/742,488 US20080232601A1 (en) 2007-03-21 2007-04-30 Method and apparatus for enhancement of audio reconstruction

Publications (2)

Publication Number Publication Date
TW200841326A true TW200841326A (en) 2008-10-16
TWI456569B TWI456569B (zh) 2014-10-11

Family

ID=39322757

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097109730A TWI456569B (zh) 2007-03-21 2008-03-19 用於音頻重構增強的方法和設備

Country Status (12)

Country Link
US (1) US20080232601A1 (zh)
EP (1) EP2130403B1 (zh)
JP (1) JP5455657B2 (zh)
KR (1) KR101096072B1 (zh)
CN (1) CN101658052B (zh)
AT (1) ATE476835T1 (zh)
BR (1) BRPI0808225B1 (zh)
DE (1) DE602008002066D1 (zh)
HK (1) HK1138977A1 (zh)
RU (1) RU2416172C1 (zh)
TW (1) TWI456569B (zh)
WO (1) WO2008113427A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI618408B (zh) * 2016-03-11 2018-03-11 聯發科技股份有限公司 校準複數個360度重構音頻/視頻軌道的方法和裝置

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
US8180062B2 (en) * 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
ES2425814T3 (es) * 2008-08-13 2013-10-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para determinar una señal de audio espacial convertida
US9888335B2 (en) 2009-06-23 2018-02-06 Nokia Technologies Oy Method and apparatus for processing audio signals
WO2011101708A1 (en) * 2010-02-17 2011-08-25 Nokia Corporation Processing of multi-device audio capture
KR20240009530A (ko) 2010-03-26 2024-01-22 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2375410B1 (en) * 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
CN101867853B (zh) * 2010-06-08 2014-11-05 中兴通讯股份有限公司 基于传声器阵列的语音信号处理方法及装置
EP2591614B1 (en) * 2010-07-06 2014-05-14 Bang & Olufsen A/S A method and an apparatus for a user to select one of a multiple of audio tracks
US9271081B2 (en) * 2010-08-27 2016-02-23 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
US9456289B2 (en) 2010-11-19 2016-09-27 Nokia Technologies Oy Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof
US9055371B2 (en) 2010-11-19 2015-06-09 Nokia Technologies Oy Controllable playback system offering hierarchical playback options
US9313599B2 (en) 2010-11-19 2016-04-12 Nokia Technologies Oy Apparatus and method for multi-channel signal playback
EP2600343A1 (en) * 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for merging geometry - based spatial audio coding streams
EP2805326B1 (en) * 2012-01-19 2015-10-14 Koninklijke Philips N.V. Spatial audio rendering and encoding
EP2645749B1 (en) * 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
US9578438B2 (en) 2012-03-30 2017-02-21 Barco Nv Apparatus and method for driving loudspeakers of a sound system in a vehicle
WO2013150341A1 (en) 2012-04-05 2013-10-10 Nokia Corporation Flexible spatial audio capture apparatus
US9161149B2 (en) 2012-05-24 2015-10-13 Qualcomm Incorporated Three-dimensional sound compression and over-the-air transmission during a call
WO2013186593A1 (en) 2012-06-14 2013-12-19 Nokia Corporation Audio capture apparatus
US9268522B2 (en) 2012-06-27 2016-02-23 Volkswagen Ag Devices and methods for conveying audio information in vehicles
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
KR101685408B1 (ko) 2012-09-12 2016-12-20 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 3차원 오디오를 위한 향상된 가이드 다운믹스 능력을 제공하기 위한 장치 및 방법
US9729993B2 (en) 2012-10-01 2017-08-08 Nokia Technologies Oy Apparatus and method for reproducing recorded audio with correct spatial directionality
US9396732B2 (en) * 2012-10-18 2016-07-19 Google Inc. Hierarchical deccorelation of multichannel audio
EP2733965A1 (en) * 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
CN103124386A (zh) * 2012-12-26 2013-05-29 山东共达电声股份有限公司 一种远讲用降噪、消回波、锐指向传声器
US9357306B2 (en) 2013-03-12 2016-05-31 Nokia Technologies Oy Multichannel audio calibration method and apparatus
WO2014147551A1 (en) * 2013-03-19 2014-09-25 Koninklijke Philips N.V. Method and apparatus for determining a position of a microphone
US10635383B2 (en) 2013-04-04 2020-04-28 Nokia Technologies Oy Visual audio processing apparatus
EP4300488A3 (en) 2013-04-05 2024-02-28 Dolby International AB Stereo audio encoder and decoder
KR102414609B1 (ko) * 2013-04-26 2022-06-30 소니그룹주식회사 음성 처리 장치, 정보 처리 방법, 및 기록 매체
EP2997573A4 (en) 2013-05-17 2017-01-18 Nokia Technologies OY Spatial object oriented audio apparatus
TWI634798B (zh) * 2013-05-31 2018-09-01 新力股份有限公司 Audio signal output device and method, encoding device and method, decoding device and method, and program
CN104575515A (zh) * 2013-10-23 2015-04-29 中兴通讯股份有限公司 一种提高语音质量的方法及装置
RU2558642C2 (ru) * 2013-12-18 2015-08-10 Владимир Георгиевич Потёмкин Способ формирования сигнала для управления электроакустическим излучателем
EP2942981A1 (en) * 2014-05-05 2015-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System, apparatus and method for consistent acoustic scene reproduction based on adaptive functions
US9959876B2 (en) * 2014-05-16 2018-05-01 Qualcomm Incorporated Closed loop quantization of higher order ambisonic coefficients
CN110459229B (zh) * 2014-06-27 2023-01-10 杜比国际公司 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法
CN105992120B (zh) * 2015-02-09 2019-12-31 杜比实验室特许公司 音频信号的上混音
WO2016168408A1 (en) 2015-04-17 2016-10-20 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
ES2797224T3 (es) 2015-11-20 2020-12-01 Dolby Int Ab Renderización mejorada de contenido de audio inmersivo
JP6634976B2 (ja) * 2016-06-30 2020-01-22 株式会社リコー 情報処理装置、及びプログラム
US10820097B2 (en) 2016-09-29 2020-10-27 Dolby Laboratories Licensing Corporation Method, systems and apparatus for determining audio representation(s) of one or more audio sources
US10257633B1 (en) 2017-09-15 2019-04-09 Htc Corporation Sound-reproducing method and sound-reproducing apparatus
US10382878B2 (en) * 2017-10-18 2019-08-13 Htc Corporation Sound reproducing method, apparatus and non-transitory computer readable storage medium thereof
CN109688497B (zh) * 2017-10-18 2021-10-01 宏达国际电子股份有限公司 声音播放装置、方法及非暂态存储介质
AU2018368589B2 (en) * 2017-11-17 2021-10-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
GB2572420A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
GB2572419A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
GB2573537A (en) * 2018-05-09 2019-11-13 Nokia Technologies Oy An apparatus, method and computer program for audio signal processing
US11432069B2 (en) 2019-10-10 2022-08-30 Boomcloud 360, Inc. Spectrally orthogonal audio component processing
US11962989B2 (en) 2020-07-20 2024-04-16 Orbital Audio Laboratories, Inc. Multi-stage processing of audio signals to facilitate rendering of 3D audio via a plurality of playback devices

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208860A (en) * 1988-09-02 1993-05-04 Qsound Ltd. Sound imaging method and apparatus
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JPH07222299A (ja) * 1994-01-31 1995-08-18 Matsushita Electric Ind Co Ltd 音像移動処理編集装置
US5850453A (en) * 1995-07-28 1998-12-15 Srs Labs, Inc. Acoustic correction apparatus
FR2738099B1 (fr) * 1995-08-25 1997-10-24 France Telecom Procede de simulation de la qualite acoustique d'une salle et processeur audio-numerique associe
US5870484A (en) * 1995-09-05 1999-02-09 Greenberger; Hal Loudspeaker array with signal dependent radiation pattern
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3594281B2 (ja) * 1997-04-30 2004-11-24 株式会社河合楽器製作所 ステレオ拡大装置及び音場拡大装置
EP0990370B1 (en) * 1997-06-17 2008-03-05 BRITISH TELECOMMUNICATIONS public limited company Reproduction of spatialised audio
FI116990B (fi) * 1997-10-20 2006-04-28 Nokia Oyj Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi
DE60010457T2 (de) * 2000-09-02 2006-03-02 Nokia Corp. Vorrichtung und Verfahren zur Verarbeitung eines Signales emittiert von einer Zielsignalquelle in einer geräuschvollen Umgebung
WO2002078388A2 (en) * 2001-03-27 2002-10-03 1... Limited Method and apparatus to create a sound field
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3810004B2 (ja) * 2002-03-15 2006-08-16 日本電信電話株式会社 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
WO2006003813A1 (ja) * 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US8873768B2 (en) * 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
JP4804014B2 (ja) * 2005-02-23 2011-10-26 沖電気工業株式会社 音声会議装置
US8023659B2 (en) * 2005-06-21 2011-09-20 Japan Science And Technology Agency Mixing system, method and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI618408B (zh) * 2016-03-11 2018-03-11 聯發科技股份有限公司 校準複數個360度重構音頻/視頻軌道的方法和裝置

Also Published As

Publication number Publication date
US20080232601A1 (en) 2008-09-25
DE602008002066D1 (de) 2010-09-16
JP2010521909A (ja) 2010-06-24
BRPI0808225B1 (pt) 2019-12-24
EP2130403B1 (en) 2010-08-04
RU2416172C1 (ru) 2011-04-10
TWI456569B (zh) 2014-10-11
CN101658052B (zh) 2013-01-30
BRPI0808225A2 (pt) 2014-07-08
KR101096072B1 (ko) 2011-12-20
KR20090121348A (ko) 2009-11-25
HK1138977A1 (en) 2010-09-03
WO2008113427A1 (en) 2008-09-25
JP5455657B2 (ja) 2014-03-26
CN101658052A (zh) 2010-02-24
EP2130403A1 (en) 2009-12-09
ATE476835T1 (de) 2010-08-15

Similar Documents

Publication Publication Date Title
TW200841326A (en) Method and apparatus for enhancement of audio reconstruction
US10685638B2 (en) Audio scene apparatus
US9015051B2 (en) Reconstruction of audio channels with direction parameters indicating direction of origin
KR101705960B1 (ko) 3 차원 사운드 압축 및 호출 동안의 오버-디-에어 송신
JP4993227B2 (ja) 多チャンネル音声フォーマット間の変換のための方法および装置
US8180062B2 (en) Spatial sound zooming
AU2011340891B2 (en) Apparatus and method for decomposing an input signal using a downmixer
US8509454B2 (en) Focusing on a portion of an audio scene for an audio signal
US7489788B2 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener
JP4887420B2 (ja) 中央チャンネルオーディオのレンダリング
TW202016925A (zh) 用於編碼、解碼、場景處理及與以指向性音訊編碼為基礎之空間音訊編碼有關的其他程序之裝置、方法及電腦程式
Pulkki et al. First‐Order Directional Audio Coding (DirAC)
CN113597776B (zh) 参数化音频中的风噪声降低
Alexandridis et al. Capturing and reproducing spatial audio based on a circular microphone array
ES2755675T3 (es) Aparato y método para escalado de señales centrales y mejora estereofónica basada en una relación señal a mezcla a dos canales
JP5611970B2 (ja) オーディオ信号を変換するためのコンバータ及び方法
Ziemer Source width in music production. methods in stereo, ambisonics, and wave field synthesis
Pihlajamäki Multi-resolution short-time fourier transform implementation of directional audio coding
Pihlajamäki Directional Audio Coding-menetelmän toteutus käyttäen monitarkkuuksista lyhytaikaista Fourier-muunnosta