TWI828065B - 具約束之無色去相關的全通網路系統 - Google Patents

具約束之無色去相關的全通網路系統 Download PDF

Info

Publication number
TWI828065B
TWI828065B TW111105983A TW111105983A TWI828065B TW I828065 B TWI828065 B TW I828065B TW 111105983 A TW111105983 A TW 111105983A TW 111105983 A TW111105983 A TW 111105983A TW I828065 B TWI828065 B TW I828065B
Authority
TW
Taiwan
Prior art keywords
channels
pass filter
amplitude response
sum
target amplitude
Prior art date
Application number
TW111105983A
Other languages
English (en)
Other versions
TW202243492A (zh
Inventor
喬瑟夫 安東尼 三世 馬里吉利歐
Original Assignee
美商博姆雲360公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商博姆雲360公司 filed Critical 美商博姆雲360公司
Publication of TW202243492A publication Critical patent/TW202243492A/zh
Application granted granted Critical
Publication of TWI828065B publication Critical patent/TWI828065B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

一種系統包含將一單聲道通道去相關成複數個輸出通道之一或多個運算裝置。一運算裝置判定定義對該複數個通道之一總和之一或多個約束的一目標振幅回應。該目標振幅回應係由該總和之振幅值與該總和之頻率值之間的關係定義。該運算裝置基於該目標振幅回應判定一單輸入多輸出全通濾波器之一傳遞函數,且基於該傳遞函數判定該全通濾波器之係數。該等運算裝置用該全通濾波器之該等係數處理該單聲道通道以產生該複數個通道。

Description

具約束之無色去相關的全通網路系統
本發明大體上係關於音訊處理,且更明確言之係關於音訊內容之去相關。
可將一音訊資料通道升混成多個通道。例如,一內容提供者可期望自單聲道升混至立體聲,但存在端點裝置無法提供兩個獨立通道而是將立體聲通道(stereo channel)加總在一起之可能性。當在端點處發生加總時,去相關技術(諸如逆相(phase-inversion)或基於混響器之效應)可失效。使用逆相之一種可能失效狀態可導致輸出處之無限衰減。因而,期望約束升混之最壞情況結果,使得經升混通道之總和超過最低品質要求。
一些實施例包含一種用於自一單聲道通道(monaural channel)產生複數個通道之方法。該方法包含藉由一處理電路判定定義對該複數個通道之一總和之一或多個約束的一目標振幅回應,該目標振幅回應係由該總和之振幅值與該總和之頻率值之間的關係定義。該方法進一步包含基於該目標振幅回應判定一單輸入多輸出全通濾波器之一傳遞函數,及基於該傳遞函數判定該全通濾波器之係數。該方法進一步包含用該全通濾波器之該等係數處理該單聲道通道以產生該複數個通道。
一些實施例包含一種用於自一單聲道通道產生複數個通道之系統。該系統包含經組態以判定定義對該複數個通道之一總和之一或多個約束之一目標振幅回應的一或多個運算裝置。該目標振幅回應係由該總和之振幅值與該總和之頻率值之間的關係定義。一或多個電腦基於該目標振幅回應判定一單輸入多輸出全通濾波器之一傳遞函數。該一或多個電腦基於該傳遞函數判定該全通濾波器之係數,且用該全通濾波器之該等係數處理該單聲道通道以產生該複數個通道。
一些實施例包含一種包含用於自一單聲道通道產生複數個通道之經儲存指令的非暫時性電腦可讀媒體,該等指令在由至少一個處理器執行時組態該至少一個處理器以:判定定義對該複數個通道之一總和之一或多個約束的一目標振幅回應,該目標振幅回應係由該總和之振幅值與該總和之頻率值之間的關係定義;基於該目標振幅回應判定一單輸入多輸出全通濾波器之一傳遞函數;基於該傳遞函數判定該全通濾波器之係數;及用該全通濾波器之該等係數處理該單聲道通道以產生該複數個通道。
圖(Figure (FIG.))及以下描述僅藉由繪示方式涉及較佳實施例。應注意,自以下論述,本文中所揭示之結構及方法之替代實施例將容易被認知為可在不脫離所主張內容之原理之情況下採用之可行替代例。
現將詳細參考數項實施例,該等實施例之實例係在附圖中繪示。應注意,在可行之任何情況下,類似或相同元件符號可用於圖中且可指示類似或相同功能性。圖僅出於繪示目的描繪所揭示系統(或方法)之實施例。熟習此項技術者將容易自以下描述認知,可在不脫離本文中所描述之原理之情況下採用本文中所繪示之結構及方法之替代實施例。
實施例係關於一種對將一單聲道通道去相關成多個通道提供單聲道呈現相容性之音訊系統。該音訊系統使用經受約束之音訊之一無色去相關達成單聲道呈現相容性。音訊系統約束升混之最壞情況結果以容許經升混通道之總和滿足或超過最低品質要求。此等品質要求或約束可由依據頻率而變化之一目標振幅回應指定。去相關指代更改一音訊資料通道,使得當呈現於兩個或更多個揚聲器上時,可增加音訊資料之心理聲學範圍(或「寬度」)。無色指代在輸出通道之各者處保留輸入音訊資料頻譜幅度(spectral magnitude)。音訊系統使用去相關進行升混,其中音訊系統根據目標振幅回應組態一全通濾波器,且將該全通濾波器應用於一單聲道通道以產生多個輸出通道。用於去相關之濾波器係無色的且在感知上增加單聲道音訊之音場(soundstage)之範圍。此等濾波器容許使用者指定對可能歸因於一單聲道信號之兩個或更多個經去相關版本之意外加總而產生之衰減及賦色的約束。
經受約束之無色去相關之優點包含對經加總輸出之感知變換之類型及程度進行調整的能力。如可由目標振幅回應定義之調整可由諸如呈現裝置之特性、音訊資料之預期內容、聆聽者在上下文中之感知能力,或單聲道呈現相容性之最低要求品質的考量來告知。 音訊系統
圖1係根據一些實施例之一音訊系統100之一方塊圖。音訊系統100提供將一單聲道通道去相關成多個通道。系統100包含一振幅回應模組102、一全通濾波器組態模組104及一全通濾波器模組106。系統100處理一單聲道輸入通道x(t)以產生多個輸出通道,諸如提供至一揚聲器110a之一通道y a(t)及提供至一揚聲器110b之一通道y b(t)。儘管展示兩個輸出通道,但系統100可產生任何數目個輸出通道(其等各自被稱為一通道y(t))。系統100可為一運算裝置,諸如一音樂播放器、揚聲器、智慧型揚聲器、智慧型電話、可穿戴裝置、平板電腦、膝上型電腦、桌上型電腦或類似者。
振幅回應模組102判定定義對輸出通道y(t)之總和之一或多個約束的一目標振幅回應。目標振幅回應係由通道之總和之振幅值與通道之總和之頻率值之間的關係定義,諸如依據頻率而變化之振幅。對通道之總和之一或多個約束可包含一目標寬頻衰減、一目標次頻帶衰減、一臨界點或一濾波器特性。振幅回應模組102可接收資料114及單聲道通道x(t)且使用此等輸入來判定目標振幅回應。資料114可包含諸如一呈現裝置(例如,一或多個揚聲器)之特性、音訊資料之預期內容、聆聽者在上下文中之感知能力或單聲道呈現相容性之最低要求品質的資訊。
目標寬頻衰減係對所有頻率之總和之振幅之一最大衰減量的一約束。目標次頻帶衰減係對由次頻帶定義之一頻率範圍的總和之振幅之一最大衰減量的一約束。目標振幅回應可包含各自針對總和之一不同次頻帶之一或多個目標次頻帶衰減值。
一臨界點係對一濾波器之目標振幅回應之曲率的一約束,其被描述為總和之增益處於一預定義值(諸如-3 dB或-∞ dB)所處之一頻率值。此點之放置可對目標振幅回應之曲率具有全域影響。一臨界點之一個實例與目標振幅回應係-∞ dB所處之頻率相對應。因為目標振幅回應之行為係在此點附近之頻率處使信號無效,所以此臨界點係零點。一臨界點之另一實例與目標振幅回應係-3 dB所處之頻率相對應。因為總和及差通道之目標振幅回應之行為在此點處相交,所以此臨界點係一交叉點。
濾波器特性係對如何對總和進行濾波之一約束。濾波器特性之實例包含一高通濾波器特性、一低通特性、一帶通特性或一帶阻特性。濾波器特性描述所得總和之形狀,如同其係一等化濾波之結果一樣。可依據什麼頻率可通過濾波器或什麼頻率被拒絕來描述等化濾波。因此,一低通特性容許低於一拐點之頻率通過且使高於該拐點之頻率衰減。一高通特性藉由容許高於一拐點之頻率通過且使低於該拐點之頻率衰減而相反操作。一帶通特性容許在一拐點周圍之一頻帶中之頻率通過,使其他頻率衰減。一帶阻特性拒絕在一拐點周圍之一頻帶中之頻率,而容許其他頻率通過。
目標振幅回應可定義對總和之超過一單一約束。例如,目標振幅回應可定義對全通濾波器之經加總輸出之臨界點及一濾波器特性的約束。在另一實例中,目標振幅回應可定義對目標寬頻衰減、臨界點及濾波器特性之約束。儘管被論述為作為獨立約束,但針對參數空間之大多數區域,約束可彼此相依。此結果可因系統關於相位係非線性而引起。為解決此,可設計目標振幅回應之額外較高階描述符,其等係目標振幅回應參數之非線性函數。
濾波器組態模組104基於自振幅回應模組102接收之目標振幅回應判定一單輸入多輸出全通濾波器之性質。特定言之,濾波器組態模組基於目標振幅回應判定全通濾波器之一傳遞函數,且基於傳遞函數判定全通濾波器之係數。全通濾波器係一去相關濾波器,其受目標振幅回應約束且經應用於單聲道輸入通道x(t)以產生輸出通道y a(t)及y b(t)。
全通濾波器可包含基於由目標振幅回應定義之約束之不同組態及參數。約束通道總和之目標寬頻衰減之一去相關濾波器具有保存頻譜內容(例如,完全地)之益處。當無法對於輸入通道抑或音訊呈現裝置作出關於特定頻譜帶之優先化的假定時,此一濾波器可為有用的。對於各輸出通道,全通濾波器之傳遞函數被定義為在由一值θ指定之一位準之一常數函數。
為組態或建立濾波器,濾波器組態模組104使用根據方程式1之一連續時間原型來判定一對正交全通濾波器: 方程式(1)
全通濾波器提供對兩個輸出信號之間的90°相位關係及輸入信號與兩個輸出信號之間的統一幅度關係提供約束,但不保證輸入(單聲道)信號與兩個(立體聲)輸出信號之任一者之間的一相位關係。
之離散形式被表示為 ,且係由其對單聲道信號 x(t)之作用來定義。結果係如由方程式2定義之一個2維向量: 方程式(2)
濾波器組態模組104根據方程式3判定一個2 × 2正交旋轉矩陣: 方程式(3) 其中θ判定旋轉角。
濾波器組態模組104判定如由方程式4定義之至一維之一投影: 方程式(4) 且其等之乘積在右側上與一第二2 × 1維投影序連,如由方程式5定義: 方程式(5)
因此,由濾波器組態模組104組態之濾波器可由方程式6定義: 方程式(6)
如由方程式6定義之此全通濾波器容許一個輸出通道相對於(若干)其他輸出通道之相位角之旋轉。
全通濾波器之多個輸出不限於兩個輸出通道。在一些實施例中,系統100自單聲道輸入通道產生兩個以上輸出通道。可藉由根據方程式7定義旋轉及投影運算 而將全通濾波器一般化為 N個通道: 方程式(7) 其中 係旋轉角之一個( N − 1)維向量。接著,可將此運算代入方程式,其中所得 N維輸出向量含有輸入之各經去相關版本。全通濾波器容許約束總和之寬頻衰減,例如,不同於使用其中總和之寬頻衰減係+∞ dB,因此基本上不受約束的逆相去相關。
可在 N= 2之情況下運用以下來判定總和之寬頻衰減,此處被表示為 方程式(8)
由於在加總中使用之通道僅相差一個相位項,衰減約束 係精確的。為定義包含一寬頻衰減常數之一目標振幅回應,可針對θ求解方程式9: 方程式(9)
使用方程式9,可藉由對總和之寬頻衰減之約束來參數化全通濾波器 。在典型呈現內容背景中,由此方程式產生之參數θ將最大化輸出之感知空間範圍。由於 被指定為一最小可允許總和增益因數,故若經感知寬度超過特定使用案例之要求,則可選擇導致較大增益因數之θ值。
N > 2之情況下,方程式8之更一般形式由方程式10定義: 方程式(10) 其可在選擇θ值時被應用為一約束。
之係數係由正交濾波器網路 以及角度θ判定,如下: 方程式(11) 其中正交濾波器係數 取決於正交濾波器本身之實施方案。
在一些實施例中,在可接受總和中之一些賦色之情況中,約束總和中之衰減之頻譜次頻帶區域之一去相關濾波器係期望的。藉由放寬總和必須完全無色之約束,空間範圍可進一步增加而超出如 之濾波器可能之空間範圍。所得目標振幅回應從一常數函數放寬為一個多項式,該多項式之特性可使用類似於在指定用於等化之濾波器時所使用之控制項的控制項來參數化。
在一些實施例中,系統100使用全通濾波器之一時域規格。例如,一個一階全通濾波器可由方程式12定義: 方程式(12) 其中β係在自−1至+1之範圍內之濾波器之一係數。濾波器實施方案可由方程式13定義: 方程式(13)
此濾波器之傳遞函數被表達為自一個輸出至另一輸出之差分相移 。此差分相移係如由方程式14定義之角頻率 ω之一函數: 方程式(14) 其中目標振幅回應可藉由用 置換方程式9中之θ來導出。總和增益 αf = 3 dB所處之頻率 f c可用作用於調諧之臨界點,如由方程式15及方程式16定義: 方程式(15) 方程式(16)
藉由將目標振幅回應正規化為0 dB,此臨界點對應於參數 f c(其可為一個-3 dB點)。
在一些實施例中,目標振幅回應可定義對寬頻及次頻帶衰減之約束。對於濾波器之係數 β f之所有可能值,此系統在加總中將始終表現得像一低通濾波器。此係由於未按 β f按比例調整之 x (t − 1)項。
藉由組合 ,可達成許多更靈活的約束函數。形式上,兩個濾波器如由方程式17定義般結合: 方程式(17) 其中 係分別繞過一階全通濾波器子系統 之布林(boolean)參數。在其中 之情況下,此等參數容許方程式(17)中所定義之兩個參數空間外加一額外獨有參數子空間之聯合。
方程式(15)中所定義之角頻率ω c現成為臨界點,其中目標振幅回應漸進地接近−∞: 方程式(18) 其中φ係經由方程式(19)自高階參數 導出之一個項: 方程式(19)
參數θ bf容許吾人控制關於拐點 f c之濾波器特性。對於 ,特性係低通,其具有在 f c處之零值及目標振幅函數中隨著θ bf之增加而自偏好低頻平穩地內插至平坦的一頻譜斜率。對於 ,特性隨著θ bf之增加而自其中在 f c處具有零值之平坦平穩地內插至高通。對於 ,目標振幅函數係純帶阻的,其在 f c處具有零值。
參數Γ係將由 f c及θ bf判定之目標振幅函數放置至兩個通道之總和(即,L+R)抑或差(即,L-R)中的一布林值。歸因於對至濾波器網路之兩個輸出之全通約束,Γ之作用係在互補目標振幅回應之間雙態觸變。
兩組係數β bf及β ab用於計算總系統之最終係數β abf。此提供方程式(17)中之複合運算。在係數空間中,兩個線性濾波器之複合等效於兩個多項式之相乘。考慮到此,直接自(17)中之組合系統之定義得出之係數β abf可描述如下: 方程式(20) 其中符號⋆用於明確地表示多項式係數之相乘。
在一些實施例中,系統100使用全通濾波器之一頻域規格。例如,濾波器組態模組104可使用呈方程式9之形式之方程式以自 K個窄頻衰減約束 之一向量化目標振幅回應判定 K個相位角 的一向量化傳遞函數。
相位角向量 θ產生如由方程式21定義之一有限脈衝回應濾波器: 方程式(21) 其中 表示逆離散傅立葉(Fourier)變換及 。接著, 2(K − 1)個FIR濾波器係數 之向量可應用於 x(t),如由方程式22定義: 方程式(22)
其中 表示卷積運算(convolution operation)。
雖然方程式21及方程式22提供用於約束目標振幅回應之一有效手段,但其實施方案通常將依賴由一逆DFT運算產生之相對高階FIR濾波器。此可能不適用於具有受約束資源之系統。在此等情況中,可使用諸如結合方程式16論述之一低階無限脈衝回應(IIR)實施方案。
全通濾波器模組106將如由濾波器組態模組104組態之全通濾波器應用於單聲道通道x(t)以產生輸出通道y a(t)及y b(t)。將全通濾波器應用於通道x(t)可如由方程式6、11、15或17定義般執行。全通濾波器模組106將各輸出通道提供至一各自揚聲器,諸如將通道y a(t)提供至揚聲器110a且將通道y b(t)提供至揚聲器110b。
圖2係根據一些實施例之一運算系統環境200之一方塊圖。運算系統200可包含一音訊系統202,音訊系統202可包含一或多個運算裝置(例如,伺服器),經由一網路208連接至使用者裝置210a及210b。音訊系統202經由網路208將音訊內容提供至使用者裝置210a及210b (亦被個別地稱為使用者裝置210)。網路208促進系統202與使用者裝置210之間的通信。網路208可包含各種類型之網路,包含網際網路。
音訊系統202包含一或多個處理器204及電腦可讀媒體206。一或多個處理器204執行引起一或多個處理器204執行諸如自一單聲道通道產生多個輸出通道之功能性的程式模組。(若干)處理器204可包含一中央處理單元(CPU)、一圖形處理單元(GPU)、一控制器、一狀態機、其他類型之處理電路,或組合地此等之一或多者的一或多者。一處理器204可進一步包含尤其儲存程式模組、作業系統資料之一本地記憶體。
電腦可讀媒體206係儲存用於振幅回應模組102、濾波器組態模組104、全通濾波器模組106及一通道加總模組212之程式碼的一非暫時性儲存媒體。如由振幅回應模組102及濾波器組態模組104組態之全通濾波器模組106自一單聲道通道產生多個輸出通道。系統202將多個輸出通道提供至包含用以呈現輸出通道之各者之多個揚聲器214的使用者裝置210a。
通道加總模組212藉由將由全通濾波器模組106產生之多個輸出通道相加在一起來產生一單聲道輸出通道。系統202將單聲道輸出通道提供至包含用以呈現單聲道輸出通道之一單一揚聲器216的使用者裝置210b。在一些實施例中,通道加總模組212定位於使用者裝置210b處。音訊系統202將多個輸出通道提供至使用者裝置210b,使用者裝置210b將多個通道轉換成用於揚聲器216之單聲道輸出通道。一使用者裝置210向使用者呈現音訊內容。使用者裝置210可為一使用者之一運算裝置,諸如一音樂播放器、智慧型揚聲器、智慧型電話、可穿戴裝置、平板電腦、膝上型電腦、桌上型電腦或類似者。 例示性程序
圖3係根據一些實施例之用於自一單聲道通道產生多個通道之一程序300之一流程圖。圖3中所展示之程序可由一音訊系統(例如,系統100或202)之組件來執行。在其他實施例中,其他實體可執行圖3中之一些或所有步驟。實施例可包含不同及/或額外步驟,或按不同順序執行步驟。
音訊系統判定305定義對待自一單聲道通道產生之多個通道之一總和之一或多個約束的一目標振幅回應。對總和之一或多個約束可包含一目標寬頻衰減、一目標次頻帶衰減、一臨界點或一濾波器特性。臨界點可為處於3 dB之一拐點。濾波器特性可包含一高通濾波器特性、一低通特性、一帶通特性或一帶阻特性之一者。
可基於呈現裝置之特性(例如,揚聲器之頻率回應、揚聲器之位置)、音訊資料之預期內容、聆聽者在上下文中之感知能力或單聲道呈現相容性之最低要求品質來判定一或多個約束。例如,若揚聲器無法充分再現低於200 hz之頻率,則音訊系統可有效地隱藏低於此頻率之目標振幅回應之經衰減區域。類似地,若預期音訊內容係語音,則音訊系統可選擇僅影響在可懂度所需之頻率之外之頻率的一目標振幅回應。若聆聽者將自上下文中之其他來源(諸如位置中之另一揚聲器陣列)得到可聽提示,則音訊系統可判定與該等同時提示互補之一目標振幅回應。
音訊系統基於目標振幅回應判定310一單輸入多輸出全通濾波器之一傳遞函數。傳遞函數定義輸出通道之相位角之相對旋轉。傳遞函數描述一濾波器網路針對各輸出,在依據頻率而變化之相位角旋轉方面對其輸入的影響。
音訊系統基於傳遞函數判定315全通濾波器之係數。此等係數將被選擇且以最適於約束類型及經選取實施方案之方式應用於傳入音訊串流。係數集之一些實例係在方程式11、方程式16、方程式18、方程式20及方程式21中定義。在一些實施例中,基於傳遞函數判定全通濾波器之係數包含使用一逆離散傅立葉變換(idft)。在此情況中,可如由方程式21定義般判定係數集。在一些實施例中,基於傳遞函數判定全通濾波器之係數包含使用一相位聲碼器。在此情況中,可如由方程式21定義般判定係數集,惟此等係數集將在再合成時域資料之前應用於頻域除外。
音訊系統用全通濾波器之係數處理320單聲道通道以產生複數個通道。若系統使用如方程式11、方程式16、方程式18及方程式20中之一IIR實施方案在時域中操作,則係數可按比例調整適當回饋及前饋延遲。若使用如方程式21中之一FIR實施方案,則僅可使用前饋延遲。若在頻譜域中判定及應用係數,則可在再合成之前將該等係數作為一複數乘法應用於頻譜資料。音訊系統可將複數個輸出通道提供至呈現裝置,諸如經由一網路連接至音訊系統之一使用者裝置。在一些實施例中,諸如當呈現裝置僅包含一單一揚聲器時,音訊系統將複數個通道組合成一單聲道輸出通道且將單聲道輸出通道提供至呈現裝置。
圖4A係根據一些實施例之包含一目標寬頻衰減之一目標振幅回應之一實例。展示自一單聲道通道產生之多個通道之一總和402及該多個通道之一差404。將目標振幅回應之約束應用於總和,而差可適於保持一全通特性。在此實例中,跨所有頻率之目標寬頻衰減係-6 dB。
圖4B係根據一些實施例之包含一臨界點之一目標振幅回應之一實例。展示自一單聲道通道產生之多個通道之一總和406及該多個通道之一差408。臨界點包含在1 kHz處之一個-3 dB臨界點(例如,一交叉)。
圖4C係根據一些實施例之包含一臨界點之一目標振幅回應之一實例。展示自一單聲道通道產生之多個通道之一總和410及該多個通道之一差412。臨界點包含在1 kHz處之一個-∞ dB臨界點(例如,零值)。
圖4D係根據一些實施例之包含一臨界點及一高通濾波器特性之一目標振幅回應之一實例。展示自一單聲道通道產生之多個通道之一總和414及該多個通道之一差416。-∞ dB臨界點係在1 kHz處,且存在一高通濾波器特性。
圖4E係根據一些實施例之包含一臨界點及一低通濾波器特性之一目標振幅回應之一實例。展示自一單聲道通道產生之多個通道之一總和418及該多個通道之一差420。-∞ dB臨界點係在1 kHz處,且存在一低通濾波器特性。 例示性電腦
圖5係根據一些實施例之一電腦500之一方塊圖。電腦500係包含實施一音訊系統(諸如音訊系統100或202)之電路之運算裝置之一實例。繪示耦合至一晶片組504之至少一個處理器502。晶片組504包含一記憶體控制器集線器520及一輸入/輸出(I/O)控制器集線器522。一記憶體506及一圖形配接器512耦合至記憶體控制器集線器520,且一顯示裝置518耦合至圖形配接器512。一儲存裝置508、鍵盤510、指標裝置514及網路配接器516耦合至I/O控制器集線器522。電腦500可包含各種類型之輸入或輸出裝置。電腦500之其他實施例具有不同架構。例如,在一些實施例中,記憶體506直接耦合至處理器502。
儲存裝置508包含一或多個非暫時性電腦可讀儲存媒體,諸如一硬碟機、光碟唯讀記憶體(CD-ROM)、DVD或一固態記憶體裝置。記憶體506保持由處理器502使用之程式碼(包括一或多個指令)及資料。程式碼可對應於關於圖1至圖3所描述之處理態樣。
指標裝置514結合鍵盤510用於將資料輸入至電腦系統500中。圖形配接器512在顯示裝置518上顯示影像及其他資訊。在一些實施例中,顯示裝置518包含用於接收使用者輸入及選擇之一觸控螢幕能力。網路配接器516將電腦系統500耦合至一網路。電腦500之一些實施例具有不同於圖5中所展示之組件及/或除圖5中所展示之組件以外的組件。
電路可包含執行儲存於一非暫時性電腦可讀媒體中之程式碼之一或多個處理器,該程式碼在由一或多個處理器執行時組態該一或多個處理器以實施一音訊系統或音訊系統之模組。實施一音訊系統或音訊系統之模組的電路之其他實例可包含一積體電路,諸如一特定應用積體電路(ASIC)、場可程式化閘陣列(FPGA)或其他類型之電腦電路。 額外考量
所揭示組態之例示性益處及優點包含歸因於經增強音訊系統適應於一裝置及相關聯音訊呈現系統以及由裝置OS提供之其他相關資訊(諸如使用案例資訊(例如,指示音訊信號係用於音樂播放而非遊戲))的動態音訊增強。經增強音訊系統可整合至一裝置中(例如,使用一軟體開發套件)抑或儲存於一遠端伺服器上以按需存取。以此方式,一裝置無需將儲存或處理資源專用於特定於其音訊呈現系統或音訊呈現組態之一音訊增強系統的維護。在一些實施例中,經增強音訊系統實現對呈現系統資訊進行變化級別之查詢,使得可跨變化級別之可用裝置特定呈現資訊應用有效音訊增強。
在本說明書各處,複數例項可實施被描述為一單一例項之組件、操作或結構。儘管一或多個方法之個別操作被繪示及描述為分離操作,然該等個別操作之一或多者可同時執行,且沒有要求按所繪示之順序執行該等操作。在例示性組態中作為分離組件呈現之結構及功能性可實施為一組合結構或組件。類似地,作為一單一組件呈現之結構及功能性可實施為分離組件。此等及其他變動、修改、添加及改良落在本文中之標的物之範疇內。
特定實施例在本文中被描述為包含邏輯或若干組件、模組或機構。模組可構成軟體模組(例如,體現於一機器可讀媒體上或一傳輸信號中之程式碼)抑或硬體模組。一硬體模組係能夠執行特定操作且可以一特定實施方式組態或配置之有形單元。在實例實施例中,一或多個電腦系統(例如,一獨立用戶端或伺服器電腦系統)或一電腦系統之一或多個硬體模組(例如,一處理器或一處理器群組)可由軟體(例如,一應用程式或應用程式部分)組態為操作以執行如本文中所描述之特定操作之一硬體模組。
可至少部分藉由經暫時組態(例如,藉由軟體)或永久組態以執行相關操作之一或多個處理器來執行本文中所描述之例示性方法之各種操作。無論暫時或永久組態,此等處理器可構成操作以執行一或多個操作或功能之處理器實施模組。在一些實例實施例中,本文中所提及之模組包括處理器實施模組。
類似地,本文中所描述之方法可至少部分為處理器實施的。例如,一方法之至少一些操作可由一或多個處理器或處理器實施硬體模組來執行。特定操作之執行可分佈在一或多個處理器當中,不僅駐留於一單一機器內,而且跨若干機器部署。在一些實例實施例中,該處理器或該等處理器可定位於一單一位置中(例如,在一家庭環境、一辦公室環境內或作為一伺服器群),而在其他實施例中,處理器可跨若干位置分佈。
除非另有明確陳述,否則本文中使用諸如「處理」、「運算」、「計算」、「判定」、「呈現」、「顯示」或類似者之字詞的論述可指代操縱或變換被表示為一或多個記憶體(例如,揮發性記憶體、非揮發性記憶體或其等之一組合)、暫存器或接收、儲存、傳輸或顯示資訊之其他機器組件內之實體(例如,電子、磁性或光學)量之資料的一機器(例如,一電腦)之動作或程序。
如本文中所使用,對「一項實施例」或「一實施例」之任何引用意謂結合該實施例所描述之一特定元件、特徵、結構或特性係包含於至少一項實施例中。在本說明書之各處出現片語「在一項實施例中」不一定全部指代相同實施例。
可使用表述「耦合」及「連接」以及其等衍生詞來描述一些實施例。應理解,此等術語並不旨在作為彼此之同義詞。例如,可使用術語「連接」來描述一些實施例以指示兩個或更多個元件彼此直接實體或電接觸。在另一實例中,可使用術語「耦合」來描述一些實施例以指示兩個或更多個元件直接實體或電接觸。然而,術語「耦合」亦可意謂兩個或更多個元件彼此並未直接接觸,但仍彼此協作或互動。實施例在此內容背景中不受限制。
如本文中所使用,術語「包括(comprises/comprising)」、「包含(includes/including)」、「具有(has/having)」或其等之任何其他變動旨在涵蓋非排他性包含。例如,包括一元件清單之一程序、方法、物件或設備不一定僅限於該等元件,而是可包含未明確列出或此程序、方法、物件或設備固有之其他元件。此外,除非有相反之明確陳述,否則「或」指代一包含性或而非一排他性或。例如,一條件A或B係由以下之任一者滿足:A係真(或存在)且B係假(或不存在),A係假(或不存在)且B係真(或存在),以及A及B皆為真(或存在)。
另外,使用「一(a/an)」係用於描述本文中之實施例之元件及組件。此僅為方便起見而進行且給出本發明之一般意義。此描述應被理解為包含一個或至少一個,且單數亦包含複數,除非明顯其另有含義。
此描述之一些部分在對資訊之操作之演算法及符號表示方面描述實施例。此等演算法描述及表示通常由熟習資料處理技術者用於向其他熟習此項技術者更有效地傳達其等工作之實質。此等操作雖然在功能上、運算方面或邏輯上進行描述,但應被理解為由電腦程式或等效電路、微程式碼或類似者實施。此外,在不失一般性之情況下,將此等操作配置稱為模組有時亦被證明係方便的。所描述操作及其等相關聯模組可體現於軟體、韌體、硬體或其等之任何組合中。
可用一或多個硬體或軟體模組單獨地或結合其他裝置來執行或實施本文中所描述之步驟、操作或程序之任一者。在一項實施例中,運用包括含有電腦程式碼之一電腦可讀媒體之一電腦程式產品來實施一軟體模組,該電腦程式碼可由一電腦處理器執行以用於執行所描述之任何或所有步驟、操作或程序。
實施例亦可關於一種用於執行本文中之操作之設備。此設備可經專門構造用於所需目的,及/或其可包括由儲存於電腦中之一電腦程式選擇性地啟動或重新組態之一通用運算裝置。此一電腦程式可儲存於一非暫時性、有形電腦可讀儲存媒體,或可耦合至一電腦系統匯流排之適於儲存電子指令的任何類型之媒體中。此外,本說明書中所提及之任何運算系統可包含一單一處理器或可為採用多處理器設計用於增加運算能力之架構。
實施例亦可關於一種由本文中所描述之一運算程序產生之產品。此一產品可包括由一運算程序所產生之資訊,其中該資訊儲存於一非暫時性、有形電腦可讀儲存媒體上且可包含一電腦程式產品或本文中所描述之其他資料組合的任何實施例。
在閱讀本發明時,熟習此項技術者將瞭解透過本文中之所揭示原理用於音訊內容去相關之一系統及一程序的額外替代結構及功能設計。因此,雖然已繪示及描述特定實施例及應用,但應理解,所揭示實施例不限於本文中所揭示之精確構造及組件。可在不脫離隨附發明申請專利範圍中所定義之精神及範疇之情況下,對本文中所揭示之方法及設備之配置、操作及細節進行熟習此項技術者將明白之各種修改、改變及變動。
最後,在本說明書中使用之語言已主要出於可讀性及指導目的而選擇,且其可並非經選擇以劃界或限定專利權。因此,專利權之範疇旨在不受此[實施方式]限制,而是受探討基於此之一應用之任何發明申請專利範圍限制。因此,實施例之揭示內容旨在闡釋而非限制在以下發明申請專利範圍中闡述之專利權之範疇。
100:音訊系統 102:振幅回應模組 104:全通濾波器組態模組 106:全通濾波器模組 110a:揚聲器 110b:揚聲器 114:資料 200:運算系統環境/運算系統 202:音訊系統 204:處理器 206:電腦可讀媒體 208:網路 210a:使用者裝置 210b:使用者裝置 212:通道加總模組 214:揚聲器 216:揚聲器 300:程序 305:判定 310:判定 315:判定 320:處理 402:總和 404:差 406:總和 408:差 410:總和 412:差 414:總和 416:差 418:總和 420:差 500:電腦/電腦系統 502:處理器 504:晶片組 506:記憶體 508:儲存裝置 510:鍵盤 512:圖形配接器 514:指標裝置 516:網路配接器 518:顯示裝置 520:記憶體控制器集線器 522:輸入/輸出(I/O)控制器集線器 x(t):單聲道輸入通道/單聲道通道 y a(t):輸出通道 y b(t):輸出通道
圖(Figure (FIG.)) 1係根據一些實施例之一音訊系統之一方塊圖。
圖2係根據一些實施例之一運算系統環境之一方塊圖。
圖3係根據一些實施例之用於自一單聲道通道產生多個通道之一程序之一流程圖。
圖4A係根據一些實施例之包含一目標寬頻衰減之一目標振幅回應之一實例。
圖4B係根據一些實施例之包含一臨界點之一目標振幅回應之一實例。
圖4C係根據一些實施例之包含一臨界點之一目標振幅回應之一實例。
圖4D係根據一些實施例之包含一臨界點及一高通濾波器特性之一目標振幅回應之一實例。
圖4E係根據一些實施例之包含一臨界點及一低通濾波器特性之一目標振幅回應之一實例。
圖5係根據一些實施例之一電腦之一方塊圖。
圖僅出於繪示目的描繪各項實施例。熟習此項技術者將容易自以下論述認知,可在不脫離本文中所描述之原理之情況下採用本文中所繪示之結構及方法之替代實施例。
100:音訊系統
102:振幅回應模組
104:全通濾波器組態模組
106:全通濾波器模組
110a:揚聲器
110b:揚聲器
114:資料
x(t):單聲道輸入通道/單聲道通道
ya(t):輸出通道
yb(t):輸出通道

Claims (31)

  1. 一種用於自一單聲道通道產生複數個通道之系統,其包括:一或多個運算裝置,其經組態以:判定定義對該複數個通道之一總和之一或多個約束的一目標振幅回應,該目標振幅回應係由該總和之振幅值與該總和之頻率值之間的關係定義;基於該目標振幅回應判定一單輸入多輸出全通濾波器之一傳遞函數;基於該傳遞函數判定該全通濾波器之多個係數;及用該全通濾波器之該等係數處理該單聲道通道以產生該複數個通道。
  2. 如請求項1之系統,其中該一或多個約束包含該複數個通道之該總和之一目標寬頻衰減。
  3. 如請求項1之系統,其中該一或多個約束包含該複數個通道之該總和之一目標次頻帶衰減。
  4. 如請求項1之系統,其中該一或多個約束包含關於該目標振幅回應之曲率定義之一臨界點。
  5. 如請求項4之系統,其中該臨界點定義該目標振幅回應係-3dB所處 之一頻率。
  6. 如請求項4之系統,其中該臨界點定義該目標振幅回應係-∞ dB所處之一頻率。
  7. 如請求項1之系統,其中該一或多個約束包含該複數個通道之該總和中之一濾波器特性。
  8. 如請求項7之系統,其中該濾波器特性包含以下之一者:一高通濾波器特性;一低通濾波器特性;一帶通濾波器特性;或一帶阻濾波器特性。
  9. 如請求項1之系統,其中該一或多個約束包含一臨界點及一濾波器特性。
  10. 如請求項1之系統,其中該一或多個約束包含一目標寬頻衰減、一臨界點及一濾波器特性。
  11. 如請求項1之系統,其中該一或多個運算裝置經組態以基於該傳遞函數判定該全通濾波器之該等係數包含:該一或多個運算裝置經組態以使用一逆離散傅立葉變換(idft)。
  12. 如請求項1之系統,其中該一或多個運算裝置經組態以基於該傳遞函數判定該全通濾波器之該等係數包含:該一或多個運算裝置經組態以使用一相位聲碼器。
  13. 如請求項1之系統,其中該傳遞函數定義該複數個通道之一第一通道之一第一相位角相對於該複數個通道之一第二通道之一第二相位角的一旋轉。
  14. 如請求項1之系統,其中該一或多個運算裝置進一步經組態以將該複數個通道組合成一單聲道輸出通道。
  15. 如請求項1之系統,其中該一或多個運算裝置進一步經組態以經由一網路將該複數個通道提供至一使用者裝置。
  16. 一種用於自一單聲道通道產生複數個通道之方法,其包括,藉由一電路:判定定義對該複數個通道之一總和之一或多個約束的一目標振幅回應,該目標振幅回應係由該總和之振幅值與該總和之頻率值之間的關係定義;基於該目標振幅回應判定一單輸入多輸出全通濾波器之一傳遞函數;基於該傳遞函數判定該全通濾波器之多個係數;及 用該全通濾波器之該等係數處理該單聲道通道以產生該複數個通道。
  17. 如請求項16之方法,其中該一或多個約束包含該複數個通道之該總和之一目標寬頻衰減。
  18. 如請求項16之方法,其中該一或多個約束包含該複數個通道之該總和之一目標次頻帶衰減。
  19. 如請求項16之方法,其中該一或多個約束包含關於該目標振幅回應之曲率定義之一臨界點。
  20. 如請求項19之方法,其中該臨界點定義該目標振幅回應係-3dB所處之一頻率。
  21. 如請求項19之方法,其中該臨界點定義該目標振幅回應係-∞ dB所處之一頻率。
  22. 如請求項16之方法,其中該一或多個約束包含該複數個通道之該總和中之一濾波器特性。
  23. 如請求項22之方法,其中該濾波器特性包含以下之一者:一高通濾波器特性; 一低通濾波器特性;一帶通濾波器特性;或一帶阻濾波器特性。
  24. 如請求項16之方法,其中該一或多個約束包含一臨界點及一濾波器特性。
  25. 如請求項16之方法,其中該一或多個約束包含一目標寬頻衰減、一臨界點及一濾波器特性。
  26. 如請求項16之方法,其中基於該傳遞函數判定該全通濾波器之該等係數包含使用一逆離散傅立葉變換(idft)。
  27. 如請求項16之方法,其中基於該傳遞函數判定該全通濾波器之該等係數包含使用一相位聲碼器。
  28. 如請求項16之方法,其中該傳遞函數定義該複數個通道之一第一通道之一第一相位角相對於該複數個通道之一第二通道之一第二相位角的一旋轉。
  29. 如請求項16之方法,其進一步包括藉由處理電路將該複數個通道組合成一單聲道輸出通道。
  30. 如請求項16之方法,其進一步包括藉由該處理電路經由一網路將該複數個通道提供至一使用者裝置。
  31. 一種包括用於自一單聲道通道產生複數個通道之經儲存指令之非暫時性電腦可讀媒體,該等指令在由至少一個處理器執行時組態該至少一個處理器以執行如請求項16至30中任一項之方法。
TW111105983A 2021-02-19 2022-02-18 具約束之無色去相關的全通網路系統 TWI828065B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/180,643 US11451919B2 (en) 2021-02-19 2021-02-19 All-pass network system for colorless decorrelation with constraints
US17/180,643 2021-02-19

Publications (2)

Publication Number Publication Date
TW202243492A TW202243492A (zh) 2022-11-01
TWI828065B true TWI828065B (zh) 2024-01-01

Family

ID=82900023

Family Applications (2)

Application Number Title Priority Date Filing Date
TW112142963A TW202410704A (zh) 2021-02-19 2022-02-18 具約束之無色去相關的全通網路系統
TW111105983A TWI828065B (zh) 2021-02-19 2022-02-18 具約束之無色去相關的全通網路系統

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW112142963A TW202410704A (zh) 2021-02-19 2022-02-18 具約束之無色去相關的全通網路系統

Country Status (7)

Country Link
US (2) US11451919B2 (zh)
EP (1) EP4278348A1 (zh)
JP (1) JP2024507219A (zh)
KR (1) KR20230148202A (zh)
CN (1) CN117043860A (zh)
TW (2) TW202410704A (zh)
WO (1) WO2022178155A1 (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208860A (en) * 1988-09-02 1993-05-04 Qsound Ltd. Sound imaging method and apparatus
US20050177360A1 (en) * 2002-07-16 2005-08-11 Koninklijke Philips Electronics N.V. Audio coding
US20070168183A1 (en) * 2004-02-17 2007-07-19 Koninklijke Philips Electronics, N.V. Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
US20160203822A1 (en) * 2004-04-16 2016-07-14 Dolby International Ab Reconstructing audio channels with a fractional delay decorrelator

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
US8208642B2 (en) * 2006-07-10 2012-06-26 Starkey Laboratories, Inc. Method and apparatus for a binaural hearing assistance system using monaural audio signals
US20110115987A1 (en) * 2008-01-15 2011-05-19 Sharp Kabushiki Kaisha Sound signal processing apparatus, sound signal processing method, display apparatus, rack, program, and storage medium
JP2016515342A (ja) * 2013-03-12 2016-05-26 ヒア アイピー ピーティーワイ リミテッド ノイズ低減法、およびシステム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208860A (en) * 1988-09-02 1993-05-04 Qsound Ltd. Sound imaging method and apparatus
US20050177360A1 (en) * 2002-07-16 2005-08-11 Koninklijke Philips Electronics N.V. Audio coding
US20070168183A1 (en) * 2004-02-17 2007-07-19 Koninklijke Philips Electronics, N.V. Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
US20160203822A1 (en) * 2004-04-16 2016-07-14 Dolby International Ab Reconstructing audio channels with a fractional delay decorrelator

Also Published As

Publication number Publication date
JP2024507219A (ja) 2024-02-16
TW202243492A (zh) 2022-11-01
EP4278348A1 (en) 2023-11-22
US11451919B2 (en) 2022-09-20
CN117043860A (zh) 2023-11-10
US20220272476A1 (en) 2022-08-25
US20220394408A1 (en) 2022-12-08
KR20230148202A (ko) 2023-10-24
WO2022178155A1 (en) 2022-08-25
TW202410704A (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
KR101346490B1 (ko) 오디오 신호 처리 방법 및 장치
AU2013235068A1 (en) Method and system for head-related transfer function generation by linear mixing of head-related transfer functions
JP7008862B2 (ja) カンファレンスのためのサブバンド空間処理およびクロストークキャンセルシステム
JP7437493B2 (ja) スペクトル直交オーディオ成分処理
US11477601B2 (en) Methods and devices for bass management
TWI828065B (zh) 具約束之無色去相關的全通網路系統
JP7270836B2 (ja) 音響心理学的周波数範囲拡張のための非線形適応フィルタバンク
WO2018190875A1 (en) Crosstalk cancellation for speaker-based spatial rendering
CN114143699B (zh) 一种音频信号处理方法、装置及计算机可读存储介质
US20230022072A1 (en) Colorless generation of elevation perceptual cues using all-pass filter networks
CN113316941B (zh) 声场保存音频通道求和
JP2024524866A (ja) 全域通過フィルタネットワークを使用する仰角知覚的示唆のカラーレス生成
CN117678014A (zh) 使用全通滤波器网络的仰角感知线索的无色生成
Mckenzie Towards a perceptually optimal bias factor for directional bias equalisation of binaural ambisonic rendering
TW202115716A (zh) 具有解相關分量之音訊濾波器組