TWI555011B - 處理音源訊號之方法、訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器 - Google Patents

處理音源訊號之方法、訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器 Download PDF

Info

Publication number
TWI555011B
TWI555011B TW103124820A TW103124820A TWI555011B TW I555011 B TWI555011 B TW I555011B TW 103124820 A TW103124820 A TW 103124820A TW 103124820 A TW103124820 A TW 103124820A TW I555011 B TWI555011 B TW I555011B
Authority
TW
Taiwan
Prior art keywords
signal
sound source
channel
correlation
reverberation
Prior art date
Application number
TW103124820A
Other languages
English (en)
Other versions
TW201521017A (zh
Inventor
席夢尼 傅吉
詹恩 保羅葛斯帝斯
Original Assignee
弗勞恩霍夫爾協會
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 弗勞恩霍夫爾協會 filed Critical 弗勞恩霍夫爾協會
Publication of TW201521017A publication Critical patent/TW201521017A/zh
Application granted granted Critical
Publication of TWI555011B publication Critical patent/TWI555011B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/12Arrangements for producing a reverberation or echo sound using electronic time-delay networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Description

處理音源訊號之方法、訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器
本發明係關於一種音源編碼/解碼之技術領域,特別是,空間音源編碼以及空間音源物件編碼,例如3D音源編解碼器系統之技術領域。本發明之多個實施例係關於一種根據室內脈衝響應處理音源訊號之方法、處理訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器。
空間音源編碼工具係此技術領域中所熟知,例如,在環繞MPEG標準中已有標準化規範。空間音源編碼從原始輸入聲道開始,例如在再現方案中依照其位置而識別的五個或是七個聲道,即左聲道、中間聲道、右聲道、左環繞聲道、右環繞聲道以及低頻增強聲道。空間音源編碼器通常從原始聲道衍生出至少一降混聲道,以及另外衍生出關於空間線索的參數數據,例如在聲道相干數值中的聲道間等級差異、聲道間相位差異、聲道間時間差異等等。至少一降混聲道係與指示空間線索的參數化輔助資訊一起傳送到空間音源解碼器。空間音源解碼器係解碼降混聲道以及相關聯的參數數據,最後取得與原始輸入聲道近似版本的輸出聲道。聲道在輸出端方案之設置通常為固定,例如,5.1聲道格式或7.1聲道格式等等。
此外,空間音源物件編碼工具係此技術領域中所熟知且在MPEG SAOC標準中已成標準。相比於空間音源編碼從原始聲道開始,空間音源物件編碼係從非自動專為特定轉譯再現方案的音源物件開始。另外,音源物件在再現場景中的位置為可變化,且可由使用者藉由將特定的轉譯資訊輸入至空間音源物件編碼解碼器來決定。另外,轉譯資訊,即在再現方案 中特定音源物件待放置的位置資訊,係以額外的輔助資訊或是元數據來傳送。為了獲得特定的數據壓縮,係由一SAOC編碼器來編碼音源物件之數量,SAOC編碼器係根據特定的降混合資訊來降混合物件以從輸入物件計算至少一運輸聲道。此外,SAOC編碼器係計算參數化側資訊,其代表物件間線索,例如物件位準差異(OLD)、物件相干數值等等。當在空間音源編碼(SAC)中,物件間參數數據係針對個別時間平鋪(time tiles)/頻率平鋪(frequency tiles)來計算,即,針對音源訊號之特定訊框(例如,1024或是2048個取樣值),係考慮複數個頻帶(例如,24、32或是64個頻帶)使得對於每一訊框以及每一頻帶皆存在參數數據。作為一舉例,當一音源片具有20個訊框且當每一訊框係細分成32個頻帶,則時間/頻率平鋪之數量係為640。
在3D音源系統內,期望提供彷彿在特定的室內聆聽音源訊號的音源訊號之空間感。在這種情況下,提供特定室內之室內脈衝響應,例如以量測的室內脈衝響應為基礎,室內脈衝響係用以處理音源訊號並呈現給聆聽者。可期望處理直接音效以及在此呈現中與晚期混響相分離的早期反射。
本發明之目的係提供一可行的方法,用以將音源訊號分別地與室內脈衝響應之一初期部分以及晚期混響進行處理,以允許達到感知上的結果,並盡可能地相同於具有完整脈衝響應的音源訊號的一卷積的結果。
藉由如申請專利範圍第1項所述之方法、如申請專利範圍第19項所述之訊號處理單元、如申請專利範圍第23項所述之二進制轉譯器、如申請專利範圍第24項所述之音源編碼器以及如申請專利範圍第25項所述之音源解碼器以達成本發明之目的。
本發明係基於發明人發現,在以習知的方法根據室內脈衝響應處理音源訊號上存在著一個問題,此問題係為當施加具有完整脈衝響應的卷積時,處理的音源訊號分別與初期部分以及混響進行處理的結果係相偏離。本發明係更基於發明人發現,混響的適當位準取決於輸入音源訊號以及脈衝響應兩者,因為,例如當使用一種合成混響的方法時,在混響上的輸 入音源訊號的作用不會完全保留下來。脈衝響應的作用可藉由使用作為輸入參數的已知的混響特性來考量。輸入訊號的作用可藉由用以調整混響位準的訊號相關縮放來考量,此混響位準係取決於輸入音源訊號的基礎。已發現藉由此方法,當針對二進制轉譯使用全卷積方法時,混響的感知位準與較佳的混響位準相匹配。
(1)本發明係提供一種根據室內脈衝響應處理音源訊號之方法,該方法包含:將音源訊號分別與該室內脈衝響應之初期部分以及晚期混響進行處理,其中處理晚期混響之步驟包含產生一縮放混響訊號,該縮放大小係取決於該音源訊號;以及將與室內脈衝響應之早期部分做處理的音源訊號與縮放混響訊號進行結合。
當相較於上述習知的方法時,本發明的方法係具有優勢在於,例如本發明允許不須計算全卷積結果或不須施加大量的或非精確的聽覺模式即可縮放晚期混響,使得其聽起來像是全卷積方法中的混響。縮放大小係為取決於輸入訊號,而不須取決於聆聽模式或目標混響響度比例因數可衍生出時間頻率域,在此係具有優勢的,因為通常也可在此域內得到編解碼器/解碼器鏈內的音源材料。
(2)根據多個實施例,縮放大小可取決於音源訊號之至少一輸入聲道之條件(例如輸入聲道之數量、主動輸入聲道之數量及/或在輸入聲道內的活動率)。
在此係具有優勢在於,因為縮放大小可從具有降低的計算成本的輸入音源訊號輕易地決定。例如,當相較於原始的音源訊號時,縮放大小可簡單地根據在原始的音源訊號內的聲道的數量決定,此原始的音源訊號係降混合到目前所考慮的包含降低的數量的聲道。或者,降混合到目前考慮的降混合聲道的一定數量的主動聲道(在目前音源訊框內顯示一些活動率的聲道)可組成用以縮放混響訊號的基礎。
(3)根據多個實施例,(除了輸入聲道條件之外)縮放大小係取決於音源訊號之預定義的或計算而得的相關性測量。
當減少處理過程中的計算複雜度時,使用預定義相關性測量係具有優勢的。預定義相關性測量值可具有一固定值,例如在符合0.1到0.9 之範圍的一數值,其能以複數個音源訊號之分析為基礎以憑實證來決定預定義相關性測量值。另一方面,儘管須要額外的計算資源,計算相關性測量係為具有優勢的,在此情況中,期望分別地針對目前經處理的音源訊號以取得更精確的量測。
(4)根據多個實施例,產生縮放混響訊號的步驟包含施加增益因數,其中增益因數係取決於音源訊號之至少一輸入聲道之條件及/或針對音源訊號取決於預定義或計算而得的相關性測量值,其中可在處理音源訊號的晚期混響之前、過程中或之後施加增益因數。
在此係具有優勢在於,因為增益因數能以上述的複數個參數為基礎輕易地計算,並可相對於在與具體實施例相依的處理鏈內的混響器靈活地運用。
(5)根據多個實施例,增益因數係取決於下列式子:g=c u +ρ.(c c -c u )
在此,ρ=音源訊號之預定義或計算而得的相關性測量,cu,cc=係為指示音源訊號之至少一輸入聲道之條件的因數,其中cu意指完全非相關聲道,cc係有關於全相關聲道。
在此係具有優勢的,因為隨著時間改變的複數個因數比例係具有在音源訊號內的一定數量的主動聲道。
(6)根據多個實施例,cu以及cc係取決於下列式子: 在此,K in =主動或固定的降混合聲道的數量。
在此係具有優勢在於,因為因數係直接地取決於音源訊號內的主動聲道的數量。如果沒有聲道是主動的,混響接著縮放為零,如果 多個聲道係為主動的,則混響的振福會增大。
(7)根據多個實施例,在複數個音源訊框上增益因數係執行低通濾波,其中經執行低通濾波的增益因數,如下:g s (t i )=c s,old g s (t i -1)+c s,new g
c s,new =1-c s,old 在此,ts=低通濾波器的時間常數
ti=在訊框ti上的音源訊框
gs=平滑增益因數
k=訊框大小,以及fs=取樣頻率
在此係具有優勢的,因為隨著時間而縮放的因數沒有發生突變。
(8)根據多個實施例,所產生的縮放混響訊號包含音源訊號之相關性分析,其中音源訊號之相關性分析步驟包含決定音源訊號之一音源訊框之一結合的相關性測量值,其中結合的相關性測量值可針對一音源訊框之複數個聲道,藉由結合複數個相關性係數進行計算,每一音源訊框包含至少一時槽,其中結合的相關性係數之步驟可包含計算音源訊框之複數個相關性係數值之平均值。
在此係具有優勢的,因為相關性可藉由描述音源訊框之整體相關性的單一數值來進行說明。在此,不須處理多個頻率相關值。
(9)根據多個實施例,決定該結合的相關性測量值之步驟包含:(i)針對該音源訊框之每一聲道計算整體平均值,(ii)藉由將相對應的複數個聲道減去平均值以計算出零平均音源訊框,(iii)針對複數個聲道結合計算該相關性係數,以及(iv)計算結合的相關性測量值,作為複數個相關性係數之該平均值。
在此係具有優勢的,因為,如上所述,每個訊框僅有一單一 整體相關性值進行計算(簡單處理),並且能以相似於“標準的”皮爾生相關係數進行計算,其中皮爾生相關係數也使用零平均訊號以及其標準偏差。
(10)根據多個實施例,針對聲道結合之相關性係數以下列式子進行計算: 在此,ρ[m,n]=相關性係數,σ(x m [j])=在橫跨聲道m之一時間點槽j的標準偏差,σ(x n [j]=在橫跨聲道n之一時槽時間點j的標準偏差,x m ,x n =零平均變數值,i [1,N]=頻帶,j [1,M]=複數個時槽,m,n [1,K]=複數個聲道,*=共軛複數。
在此係具有優勢的,因為可使用針對皮爾生相關係數的熟知的公式,並可將其轉換成與頻率以及時間相關的公式。
(11)根據多個實施例,處理音源訊號之晚期混響之步驟包含降混合音源訊號以及將降混合音源訊號施加到一混響器。
此係具有優勢的,因為例如處理混響器僅須處理少量的聲道,並且可直接地控制降混合處理過程。
(12)本發明係提供一種訊號處理單元,其包含一輸入、一初期部分處理器以及一晚期混響處理器,其中輸入係用以接收音源訊號,初期部分處理器係根據室內脈衝響應之初期部分以處理接收的音源訊號,晚期混響處理器係根據室內脈衝響應之晚期混響以處理該接收的音源訊號,晚期混響處理器係配置或編排用以產生取決於所接收的音源訊號的縮放混響訊號,輸出係用以將與室內脈衝響應之初期部分以及縮放混響訊號進行處理的音源訊號以及輸出音源訊號相結合。
(13)根據多個實施例,晚期混響處理器包含混響器、相關性 分析器以及增益級,混響器係用以接收音源訊號以及產生混響訊號,相關性分析器係根據音源訊號產生增益因數,增益級係耦接到混響器之輸入端或以輸出端,並藉由相關性分析器所提供的增益因數進行控制。
(14)根據多個實施例,訊號處理單元更包含低通濾波器以及延遲元件中的至少一種,其中低通濾波器係耦接於相關性分析以及增益級之間,延遲元件係耦接於增益級以及加法器之間,加法器更耦接到初期部分處理器以及輸出端。
(15)本發明係提供一種二進制轉譯器,其包含本發明之訊號處理單元。
(16)本發明係提供一種編碼音源訊號之音源編碼器,其包含本發明之訊號處理單元或本發明之用以在執行編碼之前處理音源訊號之二進制轉譯器。
(17)本發明係提供一種用以解碼編碼音源訊號之音源解碼器,其包含本發明的訊號處理單元或本發明之用以處理複數個解碼音源訊號之二進制轉譯器。
100‧‧‧3D音源編碼器、音源編碼器
102‧‧‧預轉譯/混合器電路、預轉譯器/混合器
104‧‧‧聲道訊號、訊號、聲道
106‧‧‧物件訊號、訊號、物件
108‧‧‧物件元數據資訊、OAM
110‧‧‧訊號
112‧‧‧空間音源物件編碼編碼器、SAOC編碼器
114‧‧‧SAOC運輸聲道、SAOC數據
116‧‧‧USAC編碼器
118‧‧‧訊號SAOC-SI、SAOC數據
120‧‧‧物件訊號
122‧‧‧預轉譯物件訊號
124‧‧‧OAM編碼器
126‧‧‧經壓縮物件元數據資訊、訊號、物件元數據、cOAM
128‧‧‧經壓縮輸出訊號、mp4、編碼訊號、訊號、3D音源數據流
200‧‧‧3D音源解碼器、音源解碼器、接收器、解碼器
202‧‧‧USAC解碼器
204‧‧‧聲道訊號、輸入訊號、聲道
206‧‧‧預轉譯物件訊號、輸入訊號、預轉譯物件
208‧‧‧物件訊號
210‧‧‧SAOC運輸聲道訊號、SAOC運輸聲道
212‧‧‧經壓縮物件元數據資訊
214‧‧‧訊號SAOC-SI、參數化資訊
216‧‧‧物件轉譯器
218‧‧‧預轉譯物件訊號、輸入訊號
220‧‧‧SAOC解碼器
222‧‧‧預轉譯物件訊號、輸入訊號
224‧‧‧OAM解碼器
226‧‧‧混合器
228‧‧‧聲道訊號、訊號、波形、傳輸聲道配置、混合器輸出訊號、多聲道音源材料
230‧‧‧32聲道揚聲器、參考符號
232‧‧‧格式轉換電路、揚聲器轉譯器模組、揚聲器轉譯器、格式轉換器
234‧‧‧5.1揚聲器系統、參考符號
236‧‧‧二進制轉譯器、二進制轉譯器模組、雙耳轉譯器
238‧‧‧耳機、參考符號、二進制降混合
240‧‧‧降混合處理、降混合器
242‧‧‧控制器、用以配置降混合器的控制器
248‧‧‧訊號
250‧‧‧降混合器
252‧‧‧中間降混合訊號
254‧‧‧二進制轉換器
300‧‧‧室內脈衝響應
301‧‧‧直接音效、初期部分、早期反射部分、直達波
302‧‧‧早期反射、初期部分、早期反射部分
304‧‧‧晚期混響、晚期混響部、擴散混響、晚期擴散混響
400‧‧‧輸入訊號、多聲道音源輸入訊號、多聲道訊號
402‧‧‧處理器、具有室內脈衝響應之全卷積
404‧‧‧雙聲道音源輸出訊號、整體二進制輸出訊號
406‧‧‧第一處理器、處理器、早期部分之處理
408‧‧‧處理器、晚期混響處理
410‧‧‧降混合器、降混合到少量的聲道
500‧‧‧二進制轉譯器
502‧‧‧處理、處理器、輸出訊號、卷積
504‧‧‧音源訊號、輸入訊號、音源輸入訊號
506‧‧‧經處理早期部分、輸出訊號、訊號
508‧‧‧數據庫、BRIRS
510‧‧‧加法器
512‧‧‧混響分支
514‧‧‧處理、混響處理器、混響器
516‧‧‧降混合器、降混合
518‧‧‧數據庫、RT60混響
520‧‧‧數據庫、混響能量
522‧‧‧分析
524‧‧‧相關性分析處理器、處理器、相關性分析
526‧‧‧增益級
528‧‧‧低通濾波器
530‧‧‧延遲元件
800‧‧‧二進制轉譯器、二進制轉譯器模組、轉譯器模組、二進制處理模組
802‧‧‧輸入、輸入音源訊號、輸入音源訊號、輸入訊號、QMF域音源訊號、音源輸入訊號、多聲道音源訊號、音源訊號、時域音源取樣值、音源數據、QMF域訊號表現
804‧‧‧頻帶耳室內脈衝響應、BRIR、BRIRs、室內脈衝響應、二進制室內脈衝響應、QMF域BRIRs、BRIR集合、QMF域BRIR
806‧‧‧最大頻帶的示值
808‧‧‧混響器參數、RT60資訊、頻率相關性混響時間值、混響時間值
810‧‧‧混響器參數、混響能量資訊、能量值
812‧‧‧快速卷積處理器、處理器、卷積快速處理器、頻帶快速卷積、快速卷積
814‧‧‧早期處理訊號、雙聲道QMF域卷積結果、計算結果
816a、816b‧‧‧混響器、QMF域混響器、混響模組、混響器模組、頻率域混響器模組
818‧‧‧立體聲降混合處理器、立體聲降混合
820‧‧‧相關性分析處理器、相關性分析、相關性測量
821a、821b‧‧‧增益階段、時間
822‧‧‧降混合訊號、QMF域立體聲混響、立體聲降混合
824a、824b‧‧‧控制訊號
826a、826b‧‧‧混響訊號、雙聲道QMF域晚期混響、晚期混響、第二中頻訊號、混響器輸出
828‧‧‧混合器、混合處理
830‧‧‧輸出音源訊號、輸出訊號、音源訊號、雙聲道之二進制輸出訊號
832‧‧‧輸入參數、轉換點、轉換時間值
900‧‧‧輸入混合器
902‧‧‧回饋延遲迴圈
904‧‧‧聲道間相干性校正
第1圖係繪示3D音源系統之3D音源編碼器之概略圖。
第2圖係繪示3D音源系統之3D音源解碼器之概略圖。
第3圖係繪示可在第2圖的3D音源解碼器內執行的格式轉換器之示例。
第4圖係繪示可在第2圖的3D音源解碼器內執行的二進制轉譯器之示例。
第5圖係繪示室內脈衝響應h(t)之示例。
第6圖係繪示將音源輸入訊號與室內脈衝響應進行處理的不同的可能性,其中第6(a)圖係繪示根據室內脈衝響應處理完整的音源訊號,第6(b)圖係繪示初期部分以及晚期混響部分之分開處理。
第7圖係繪示根據本發明之教導進行操作之訊號處理單元之方塊圖, 像是二進制轉譯器。
第8圖係繪示根據本發明之實施例之在二進制轉譯器內的音源訊號之二進制處理之示意圖。
第9圖係繪示根據本發明之實施例處理第8圖中的二進制轉譯器之頻率域混響器之示意圖。
本發明方法的多個實施例將在此進行描述。下列將開始描述在本發明的方法中可執行的3D音源編解碼系統之系統概略圖。
第1圖以及第2圖係繪示根據多個實施例之3D音源系統之演算方塊圖。更具體地說,第1圖係繪示3D音源編碼器100之概略圖。音源編碼器100可選擇性提供預轉譯/混合器電路102以在其上接收複數個輸入訊號,更具體地說,複數個輸入聲道將複數個聲道訊號104、複數個物件訊號106以及相對應的物件元數據108提供到音源編碼器100。預轉譯/混合器102(請見訊號110)所處理的物件訊號106可提供到空間音源物件編碼(SAOC)編碼器112。SAOC編碼器112產生提供到USAC編碼器116的SAOC運輸聲道114,其中USAC係”聯合語音以及音源編碼(Unified Speech and Audio Coding)的縮寫。此外,訊號SAOC-SI 118(SAOC-SI係”SAOC side information”之縮寫)也提供到USAC編碼器116。更進一步,USAC編碼器116直接從預轉譯/混合器、複數個聲道訊號以及複數個預轉譯物件訊號122接收物件訊號120。物件元數據資訊108施加到OAM編碼器124(OAM=物件元數據),此OAM編碼器124將經壓縮物件元數據資訊126提供到USAC編碼器。USAC編碼器116以上述的複數個輸入訊號為基礎以產生經壓縮輸出訊號mp4,如圖中所繪示的128。
第2圖係繪示3D音源系統之3D音源解碼器200之概略圖。第1圖之音源編碼器100所產生的編碼訊號128(mp4)係在音源解碼器200被接收,更具體地說,係在USAC解碼器202上。USAC解碼器202將接收的訊號128解碼成複數個聲道訊號204、複數個預轉譯物件訊號206、複數個物件訊號208以及複數個SAOC運輸聲道訊號210。更進一步,經壓縮物件元數據資訊212以及訊號SAOC-SI214係藉由USAC解碼器202輸 出。複數個物件訊號208係提供到輸出複數個預轉譯物件訊號218的物件轉譯器216。SAOC運輸聲道訊號210係提供到輸出複數個預轉譯物件訊號222的SAOC解碼器220。經壓縮物件元資訊212係提供到將複數個控制訊號分別輸出到物件轉譯器216以及SAOC解碼器220的OAM解碼器224,以產生複數個預轉譯物件訊號218以及複數個預轉譯物件訊號222。解碼器更包含混合器226,如第2圖所述,此混合器226係接收用以輸出複數個聲道訊號228的複數個輸入訊號204、206、218以及222。複數個聲道訊號可直接地輸出到揚聲器,例如以230標示的32聲道揚聲器。複數個訊號228可提供到接收作為控制輸入的再現佈局訊號的格式轉換電路232,此再現佈局訊號指示聲道訊號228的轉換方法。在第2圖所繪示的實施例中,假定使用可將複數個訊號提供到以234標示的5.1揚聲器系統的此一方法進行轉換。此外,聲道訊號228可提供到產生兩個輸出訊號的二進制轉譯器236,例如以238標示的耳機。
在本發明之一實施例中,第1圖以及第2圖中所描述的編碼/解碼系統係以適用於聲道以及物件訊號的編碼的MPEG-DUSAC編解碼為基礎(見訊號104以及106)。為了增加編碼大量物件的效率,可使用MPEG SAOC技術。三種型態的轉譯器可執行將物件轉譯到聲道、將聲道轉譯到耳機或將聲道轉譯到不同的揚聲器方案(見第2圖的參考符號230、234以及238)的任務。當明確地傳輸物件訊號或使用SAOC進行參數編碼時,壓縮相對應的物件元數據資訊108(請見訊號126),並多工傳輸到3D音源數據流128。
第1圖以及第2圖所繪示的整體3D音源系統的演算方塊圖將更進一步地描述如下。
可選擇性地提供預轉譯/混合器102,以在編碼之前將加入物件輸入場景的聲道轉換成聲道場景。功能上,其相等於下述的物件轉譯器/混合器。物件之預轉譯可期望確認在編碼器之輸入端上的一確認熵訊號,確認熵訊號基本上係為一定數量的獨立的同步主動物件訊號。利用預轉譯物件,則不須物件元數據傳輸。離散物件訊號係轉譯到編碼器所使用的聲道佈局。針對每一聲道的複數個物件的權重係從相關聯的物件元數據(OAM)中 取得。
USAC編碼器116係為針對揚聲器通道訊號、離散物件訊號、物件降混合訊號以及預轉譯訊號的核心編解碼器。其係基於MPEG-D USAC技術。基於輸入聲道以及物件分配的幾何以及語意資訊,藉由建立聲道物件之間的映射資訊以處理上述訊號的編碼。映射資訊系描述輸入聲道以及物件如何映射到USAC-channel元件,像是雙聲道元件(CPEs)、單一聲道元件(SCEs)、低頻效果產生器(LFEs)以及四聲道元件(QCEs),CPEs、SCEs、LFEs以及描述相對應的資訊如何傳輸到解碼器。在編碼器的速率控制上將全部額外的酬載像是SAOC數據114,118或物件元數據126作為考量。物件編碼取決於轉譯器的速率/失真要求以及交互作用的需求可能使用不同的方法。根據多個實施例,下列的物件編碼變異數係為可能的:
●預轉譯物件:在編碼之前,將物件訊號預轉譯以及混合到22.2聲道訊號。隨後的編碼鏈見22.2聲道訊號。
●離散物件波形:複數個物件係作為單聲道波形而提供到編碼器。編碼器使用單一聲道元件(SCEs)以傳輸複數個物件,但不傳輸複數個聲道訊號。在接收器側上,將解碼物件訊號進行轉譯以及混合。經壓縮物件元數據資訊係傳輸到接收器/轉譯器。
●參數化物件波形:複數個物件屬性以及它們彼此之間的關係係藉由SAOC複數個參數的平均值來描述。物件訊號的降混合係與USAC進行編碼。參數化資訊係沿著側邊進行傳輸。降混合聲道的數量的選擇取決於物件的數量以及整體數據速率。經壓縮物件元數據資訊係傳輸到SAOC轉譯器。
SAOC編碼器112以及SAOC解碼器220針對物件訊號可基於MPEG SAOC技術。系統可以非常有效率,基於較少數量的傳輸聲道以及額外的參數數據來修正以及轉譯一定數量的音源物件,例如OLDs、IOCs(內部物件相關性)、DMGs(降混合增益)。額外的參數數據顯示出相較於分別傳輸所有物件以使編碼非常有效率之數據率的一明顯較小的數據率。 SAOC編碼器112取物件/聲道訊號作為輸入單聲道波形,並輸出參數化資訊(其被包裝成3D音源數據流128)以及SAOC運輸聲道(其使用單一聲道元件進行編碼並進行傳輸)。SAOC解碼器220從解碼SAOC運輸聲道210以及參數化資訊214進行重建物件/聲道訊號,並基於再現佈局、經解壓縮物件元數據資訊以及以用戶為基礎的選擇性交互資訊以產生輸出音源場景。
提供物件元數據編解碼器(見OAM編碼器124以及OAM解碼器224),使得針對每一物件,相關聯的元數據指定幾何位置以及在3D空間內的複數個物件的音量係藉由在時間以及空間內的物件屬性的量化以進行有效率地編碼。經壓縮物件元數據cOAM 126係傳輸到接收器200以作為側資訊。
物件轉譯器216係根據給定的再現格式利用經壓縮物件元數據以產生物件波形。每一物件係根據其元數據轉譯到特定的輸出聲道。從部分的結果的總值產生此區塊的輸出。如果聲道以內容以及複數個離散/參數化物件兩者為基礎進行解碼,在輸出所產生的波形228之前或在將兩者饋入後處理器模組(像是二進制轉譯器236或揚聲器轉譯器模組232)內之前,以複數個波形以及轉譯物件波形為基礎的聲道係藉由混合器226進行混合。
二進制轉譯器模組236產生多聲道音源材料的二進制降混合,使得每一輸入聲道係藉由虛擬音源來表示。在正交鏡像濾波器(Quadrature Mirror Filtcrbank,QMF)域中進行逐一訊框的處理,雙聲道係以所量測的二進制室內脈衝響應為基礎。
揚聲器轉譯器232在傳輸聲道配置228以及所期望的再現格式之間進行轉換。其也可被稱為“格式轉換器”。格式轉換器執行少量輸出聲道的轉換,亦即產生降混合。
第3圖係繪示執行格式轉換器232之一示例。格式轉換器232也被稱為揚聲器轉譯器,其在傳輸器聲道配置以及所期望的再現格式之間進行轉換。格式轉換器232執行少量輸出聲道的轉換,亦即執行降混合(DMX)處理240。較佳地,降混合器240操作於QMF域,以接收混合器輸出訊號228,並輸出揚聲器訊號234。配置器242也被稱為控制器,其可接收指示混合器輸出佈局的訊號246以作為控制輸入,亦即決定混合器輸出 訊號228所表示的佈局的數據,訊號248指示所期望的再現佈局。基於此資訊,較佳地,控制器242係針對給定的輸入以及輸出格式的組合以自動化產生最佳化降混合矩陣,並將這些矩陣施加到降混合器240。格式轉換器允許232針對標準揚聲器配置以及針對具有非標準揚聲器位置的隨機配置。
第4圖係繪示第2圖之二進制轉譯器236之實施例。二進制轉譯器模組可提供多聲道音源材料之二進制降混合。雙耳能以量測的二進制室內脈衝響應為基礎。室內脈衝響應可將真實空間的聲學特性的“指紋”作為考量。量測以及儲存室內脈衝響應,任意的聲學訊號可提供“指紋”,藉此允許模擬聆聽者的與室內脈衝響應相關聯的室內聲學特性。二進制轉譯器236可配置或編排用以使用頭部相關轉移函數或二進制室內脈衝響應(BRIR),以將複數個輸出聲道轉譯成兩個二進制聲道。例如,針對行動裝置的二進制轉譯,可期望耳機或揚聲器附加到此類的行動裝置。在此類的行動裝置中,可能有必要限制解碼器以及轉譯複雜度。此外,在此類的情形中,忽略解相關,較佳地,首先,使用降混合器250對中間降混合訊號252執行降混合,亦即對少量的輸出聲道執行降混合,以針對實際二進制轉換器254產生少量的輸入聲道。例如,22.2聲道材料可藉由降混合器250降混合到5.1中間降混合,或者替換地,中間降混合可直接地藉由在“快捷(shortcut)”模式下的第2圖中的“SAOC解碼器220進行計算。二進制轉譯係僅施加10個HRTFs(頭部相關轉移函數)或用以轉譯在相異位置上的五個獨立的聲道的BRIR函數。相對地,如果22.2輸入聲道進行直接轉譯,則施加44個HRTF或BRIR函數。所需的雙耳演示的卷積運算需要高處理率,因此,降低處理率的同時,仍可取得可接受的音源品質,則將特別適用於行動裝置。二進制轉譯器236係產生多聲道音源材料228的二進制降混合238,使得每一輸入聲道(LFE聲道除外)係藉由虛擬音源來表示。可在QMF域內進行逐訊框處理。雙耳係以量測的二進制室內脈衝響應為基礎,直接音效以及早期反射可透過使用在假FFT域中的QMF域的頂端的快速卷積的一卷積方法打印到音源材料上,同時晚期混響可分別進行處理。
第5圖係繪示室內脈衝響應h(t)300之室內脈衝響應之示例。室內脈衝響應包含三個元件,係分別為直接音效301、早期反射302以及晚 期混響304。因此,當執行脈衝時,室內脈衝響應描述封閉的混響聲學空間的反射行為。早期反射302係利用增加的密度進行離散反射,脈衝響應個別反射而無法識別的較長的部分被稱為晚期混響304。直接音效301可輕易地以室內脈衝響應進行定義,並可與早期反射相分離,然而,從早期反射302到晚期混響304的轉換是不太明顯的。
如上所述,在二進制轉譯器內,例如第2圖中所描述的二進制轉譯器係根據已知的室內脈衝響應以不同的方法處理多聲道音源輸入訊號。
第6圖係繪示將音源輸入訊號與室內脈衝響應進行處理的不同的可能性。第6(a)圖係繪示根據室內脈衝響應處理完整的音源訊號,第6(b)圖係繪示初期部分以及晚期混響部分之分開處理。如第6(a)圖所繪示,接收輸入訊號400(例如多聲道音源輸入訊號)並將其施加到處理器402,處理器402係配置或編排用以允許具有室內脈衝響應(見第5圖)之多聲道音源輸入訊號400之全卷積,室內脈衝響應在其所描述的實施例中產生雙聲道音源輸出訊號404。
如上所述,此方法被認為是不利的,因為使用的卷積對於整體的脈衝響應在運算上是非常昂貴的。因此,按照另一個方法,如第6(b)圖所示,相對於第6(a)圖中的描述,替代地,整體的多聲道音源輸入訊號係藉由施加具有室內脈衝響應的全卷積進行處理,室內脈衝響應300之初期部分301與302(請見第5圖)以及晚期混響部分304係為分開地進行處理。更具體地說,如第6(b)圖所繪示,接收多聲道音源輸入訊號400,然而,此訊號係並列施加到第一處理器406以處理初期部分,亦即根據第5圖所繪示的室內脈衝響應300內的直接音效301以及早期反射302以處理音源訊號。多聲道音源輸入訊號400也施加到處理器408,以根據室內脈衝響應300之晚期混響以處理音源訊號。在第6(b)圖所繪示的實施例中,多聲道音源輸入訊號也可施加到降混合器410,用以將多聲道訊號400降混合到具有少量聲道的訊號。降混合器410之輸出係接著施加到處理器408。處理器406以及408的複數個輸出係在412上進行結合,以產生雙聲道音源輸出訊號404’。
在二進制轉譯器中,如上所述,可期望處理直接音效以及與 晚期混響相分離的早期反射,主要是因為計算的複雜度已降低。直接音效以及早期反射的處理可例如藉由處理器406(見第6(b)圖)所實施的卷積方法打印到音源訊號,同時晚期混響可被處理器408所提供的合成混響取代。接著,整體二進制輸出訊號404係為處理器406所提供的卷積結果以及處理器408所提供的合成混響訊號的組合。
此處理也描述於現有技術參考文獻[1]。上述的描述方法的結果在感知上應盡可能相等於完整的脈衝響應之卷積之結果,全轉換方法如第6(a)圖所描述。然而,如果音源訊號,或者更一般地,音源材料與直接音效以及脈衝響應的早期反射部分進行捲積,不同的產生的聲道係加在一起以形成與播放訊號相關聯的整體音效訊號並提供給聆聽者的一個耳機。然而,混響不會從整體訊號進行計算,一般而言,會在原始的輸入音源訊號之降混合或其中一聲道之混響訊號進行計算。因此,本發明的發明人決定晚期混響不會充分的符合處理器406所提供的卷積提供的。在此已發現混響的適當等級取決於輸入音源訊號以及室內脈衝響應300兩者。脈衝響應的作用係藉由使用作為混響器的輸入參數的混響特性而取得,此混響器可以為處理器408的部分,這些複數個輸入參數係從量測的脈衝響應的分析而取得,例如與頻率相關的混響時間值以及與頻率相關的能量量測值。一般而言,這些量測值可取決於一單一脈衝響應,例如,藉由在倍頻濾波分析內計算能量值以及RT60混響時間值,或者這些量測值可以為多個脈衝響應分析的結果的平均值。
然而,在此已發現,當使用如第6(b)圖所描述的合成混響方法時,儘管這些複數個輸入參數提供到混響器,在混響上的輸入音源訊號的作用不會完全地被保留。例如,由於降混合用於產生合成混響尾端,輸入音源訊號的作用會遺失。因此,混響的產生的位準在感知上不會相等於全卷積方法的結果,特別是在輸入訊號包含多個聲道的情況下。
迄今,將晚期混響的數量與全卷積方法的結果相比較或匹配到卷積結果係為非習知的方法。這些技術嘗試評價晚期混響的品質或其聽起來有多麼自然。例如,定義自然聲音的混響的一響度量測方法,此方法使用響度模式預測混響的感知響度。此方法描述於現有技術參考文獻[2],此 位準可符合目標值。此方法的缺點係為其依賴複雜但不精確的人類聽覺模式,並且需要目標響度針對使用全卷積結果的晚期混響以提供比例因數。
在現有技術參考文獻[3]所描述的另一個方法中,針對人工混響品質測試使用互相關標準。然而,此方法僅適用於測試相異的混響演算法,而不適用於多聲道音源、不適用於雙耳音源以及不適用於限定晚期混響的縮放。
另一個可能的方法係為以耳朵作為輸入聲道的使用數量的考量,然而,此方法不會給定感知上的正確的縮放,因為整體音效訊號的感知振福取決於不同的音源聲道的相關性,而不會僅取決於聲道的數量。
因此,根據本發明提供一種信號相關縮放程序的方法,此方法根據輸入音源訊號調整混響的位準。如上所述,當針對二進制轉譯使用全卷積方法時,混響的感知位準係期望與混響的位準相匹配,因此,適當的混響位準的量測的判定對於達到良好的音效品質係為重要的。根據多個實施例,音源訊號係分別地與室內脈衝響應之初期部分以及晚期混響進行處理,其中處理晚期混響的步驟包含產生縮放混響訊號,其縮放大小係取決於音源訊號。音源訊號以及縮放混響訊號之所處理的初期部分係結合成輸出訊號。根據一實施例,縮放大小係取決於音源訊號之至少一輸入聲道之條件(例如輸入聲道的數量、主動輸入聲道的數量及/或在輸入聲道內的活動率)。根據另一個實施例,縮放大小係針對音源訊號取決於預定義或計算而得的相關性測量。多個替代實施例可基於至少一輸入聲道以及預定義或計算而得的相關性測量的條件的組合以進行縮放。
根據多個實施例,縮放混響訊號可藉由施加增益因數而產生,此增益因數取決於音源訊號之至少一輸入聲道之條件,或針對音源訊號取決於預定義或計算而得的相關性測量,又或者取決於前面兩者的組合。
根據多個實施例,分開處理音源訊號的步驟包含,在第一處理步驟中,將音源訊號與室內脈衝響應300之早期反射部分301,302進行處理以及在第二處理步驟中,將音源訊號與室內脈衝響應300的擴散混響304進行處理,其中第一處理步驟與第二處理步驟不同,並且分開係為分開地進行處理。在第一處理步驟到第二處理步驟的過程中發生轉換時間上的改變。 根據更多的實施例,在第二處理步驟中,擴散(晚期)混響304可由合成混響來取代。在這種情況下,施加到第一處理步驟的室內脈衝響應僅有早期反射部分300,302(見第5圖),而不包含晚期擴散混響304。
在下文中,將根據以輸入音源訊號的相關性分析作為運算基礎的增益因數,對本發明方法之一實施例作更進一步地描述。第7圖係繪示根據本發明技術進行操作的訊號處理單元(像是二進制轉譯器)之方塊圖。二進制轉譯器500包含一第一分支部,此第一分支部包含從包含N個聲道的一輸入504音源訊號x[k]進行接收的處理器502。當處理器502成為二進制轉譯器的一部份時,處理輸入訊號504以產生輸出訊號506 xconv[k]。更具體地說,處理器502利用室內脈衝響應的直接音效以及早期反射以造成音源輸入訊號504的卷積,其中室內脈衝響應的直接音效以及早期反射係可從保存記錄的複數個二進制室內脈衝響應的外部數據庫508提供到處理器502。如上所述,處理器502可操作於數據庫508所提供的二進制室內脈衝響應的基礎,從而產生僅具有兩個聲道的輸出訊號502。輸出訊號506係從處理器502提供到加法器510。輸入訊號504更進一步係提供到包含混響處理器514以及降混合器516的混響分支512。降混合輸入訊號係提供到混響器514的複數個參數的基礎上,像是混響RT60,混響能量分別地保留在數據庫518以及520內,在僅包含兩個聲道的混響器514輸出上產生混響訊號r[k]。儲存於數據庫518以及520的複數個參數可藉由適當的分析從所儲存的二進制室內脈衝響應取得,如在第7圖所繪示的虛線上。
混響分支512更包含相關性分析處理器524,相關性分析處理器524接收輸入訊號504,並在其輸出上產生增益因數g。更進一步,所提供的增益級526係耦接於混響器514以及加法器510之間。增益級526係藉由增益因數g進行控制,從而在增益級526的輸出上產生施加到加法器510的縮放混響訊號rg[k]。加法器510將早期處理部分以及混響訊號結合,以提供也包含兩個聲道的輸出訊號y[k]。選擇性地,針對隨著音源訊框的數量而改變的平滑的增益因數,混響分支512可包含耦接於處理器524以及增益級之間的低通濾波器528。選擇性地,針對延遲的縮放混響訊號,延遲元件530也可提供到增益級526之輸出以及加法器510之間,使得其 匹配在室內脈衝響應內的早期反射以及混響之間的轉換。
如上所述,第7圖係繪示將直接音效以及早期反射與晚期混響分別處理之二進制轉譯器之方塊圖。如圖所示,輸入訊號x[k]係與二進制室內脈衝響應之直接的以及早期的反射進行處理,以產生訊號xconv[k]。如圖所示,此訊號係轉送到加法器510以將此訊號與混響訊號元件rg[k]相加。訊號係藉由將輸入訊號x[k]的降混合(立體聲降混合)饋入到混響器514內而產生,混響器514隨後的倍增器或增益級526係接收降混合的混響訊號r[k]以及增益因數g。增益因數g係處理器藉由524所執行的輸入訊號x[k]之相關性分析而取得,如上所述,可藉由低通濾波器528隨著時間進行平滑。經縮放或加權的混響元件可選擇性地藉由延遲元件530進行延遲,以使其起點與從早期反射到晚期混響的轉換點相匹配,使得在加法器510的輸出上取得輸出訊號y[k]。
第7圖所繪示的多聲道二進制轉譯器係採用合成雙聲道晚期混響,用於克服上面所討論的習知方法的缺點,根據本發明的方法,合成晚期混響係藉由增益因數g進行縮放以將感知與全卷積方法的結果相匹配。在聆聽者的耳機的多個聲道的疊加(例如22.2個以上)係為相關性依賴。這就是為什麼晚期混響可根據輸入訊號聲道的相關性進行縮放,本發明的方法的多個實施例係提供以相關性為基礎的時間依賴性縮放程序,此方法決定晚期混響之適當的振福。
針對計算比例因數,引入以相關性係數為基礎的相關性測量,根據多個實施例,係定義在二維的時間頻率域,例如QMF域。在-1以及1之間的相關性數值係針對每一多維的音源訊框、一定數量的頻帶N所定義的每一音源訊框、每個訊框一定數量的時槽M以及一定數量的音源聲道A。取得每個耳機的每個訊框的一比例因數。
如下所述,將更進一步地詳細描述本發明方法的實施例。首先,請參閱第7圖的相關性分析處理器524內所使用的相關性測量。根據此實施例,相關性測量係以皮爾遜積差相關係數(也稱為相關係數)為基礎,此皮爾遜積差相關係數係藉由將標準偏差的乘積值除以兩個變數值X,Y的協方差值而計算得出: 在此,E{.}=期望值的運算元
ρ {X,Y}=相關性係數,σ X ,σ Y =變數值X,Y的標準偏差
根據所描述的實施例,處理係轉送到時間頻率域內的二維,例如QMF域。二維係為時時常槽以及QMF頻帶。此方法係為合理的,因為數據時常進行編碼,並在時間頻率域進行傳輸。期望值的運算元係由隨著多個時間改變的平均值運算元取代,使得在(0,1)範圍內的兩個零平均變數值xm,xn之間的時間頻率相關性測量被定義如下: 在此,ρ[m,n]=相關性係數,σ(xm[j])=在聲道m之一時槽j的標準偏差,σ(xn[j])=在聲道n之一時槽j的標準偏差,xm,xn=零平均變數值,i[1,N]=頻帶,j[1,M]=時槽,m,n [1,K]複數個聲道,*共軛複數。
在針對音源訊框之複數個聲道結合(m,n)計算此係數之後,ρ[m,n,ti]的複數個數值係藉由取複數個相關性值ρ[m,n,ti]的平均值(或平均複數個相關性值ρ[m,n,ti])而結合到單一相關性測量ρ m(ti)。應當注意的 是,音源訊框可包含32個QMF時槽,ti指示個別的音源訊框。上述的處理可針對一音源訊框進行歸納,如下:
(i)首先,針對具有大小為[N,M,K]的音源或數據訊框x的每一複數個k聲道以計算整體平均值(k),其中根據多個實施例,所有的k聲道係降混合到混響器之一輸入聲道。
(ii)零平均音源或數據訊框係藉由將相對應的該複數個聲道減去複數個數值(k)以計算出一零平均音源或數據訊框。
(iii)針對複數個聲道結合(m,n)以計算所定義的相關性係數或相關性值c。
(iv)平均值相關性數值cm係作為複數個相關性數值ρ[m,n]的平均值進行計算(例如,藉由除以零以排除錯誤計算的數值)。
根據上述的實施例,縮放大小係針對音源訊號取決於所計算的相關性測量,儘管需要額外的計算資源,在此係具有優勢在於,例如當期望分別地針對目前處理的音源訊號以取得相關性測量值時。
然而,本發明並不限定於這樣的方法。根據其他實施例,在計算相關性測量時還有一預定義的相關性測量可使用。當減少在處理過程中的計算複雜度,使用預定義的相關性測量係為具有優勢的。預定義的相關性測量可具有一固定值,例如0.1到0.9,其可取決於複數個音源訊號的分析的基礎的實證。在此種情況下,可忽視相關性分析524,增益級之增益值可藉由適當的控制訊號來設定。
根據其他多個實施例,可縮放大小取決於音源訊號之至少一輸入聲道之條件(例如輸入聲道的數量、主動輸入聲道的數量及/或在輸入聲道內的活動率)。在此係具有優勢的,因為可使用減少的計算成本輕易地決定縮放大小。例如,縮放大小可簡單地藉由決定原始的音源訊號內的聲道的數量來決定縮放大小,此原始的音源訊號係降混合到目前考慮的降混合聲道,此降混合聲道包含與原始的音源訊號相比的數量縮減的聲道。替換地,降混合到目前考慮的降混合聲道的一定數量的主動聲道(聲道係顯示在目前音源訊框內的一些活動率)可針對縮放混響訊號以形成基礎。此可被執行於區塊524。
在下文中,將根據以音源訊號之至少一輸入聲道之條件為基礎以及以(固定的或上述計算而得的)相關性測量值為基礎的混響訊號的縮放大小來詳細描述一實施例。根據此一實施例,增益因數或增益或比例因數g係定義如下:g=c u +ρ.(c c -c u )
在此,ρ=音源訊號之預定義或計算而得的相關性測量值,cu,cc=係為指示音源訊號之至少一輸入聲道之條件的因數,其中cu意指完全非相關聲道,cc係有關於全相關聲道,K in =主動非零的或固定的降混合聲道之數量。
如果降混合聲道係為完全非相關(不具有聲道間相關性),施加因數cu。在僅使用至少一輸入聲道g=cu之條件的情況下,預定義固定的相關性係數值係設定為零。如果降混合聲道係為全相關(訊號係為每一個其他的加權版本(加入相位移以及偏移)),則施加因數cc。在僅使用至少一輸入聲道g=cc之條件的情況下,預定義固定的相關性係數值係設定為1。這些因數描述在音源訊框內的晚期混響的放大以及縮小(取決於(主動)聲道的數量)。
根據多個實施例以定義”聲道數量”K in ,如下:多聲道音源訊號係使用降混合矩陣Q降混合到立體聲降混合,此降混合矩陣Q係定義降混合聲道包含哪些輸入聲道(大小M×2,M係為音源輸入材料之輸入聲道之數量,例如針對5.1方案的6個聲道)。
針對降混合矩陣Q之示例可以為:
針對每一兩個降混合聲道的縮放大小係數進行計算,如下:g=f(c c ,c u ,ρ avg )=c u +ρ avg .(c c -c u )
其中,ρ avg 係為針對一定數量的K in K in 聲道結合[m,n]的所有的係數相關性[m,n]的平均值,c c ,c u 係取決於聲道數量K in ,其可以如下:
K in 可以為聲道的數量,其降混合到目前考慮的降混合聲道k[1,2](在降混合矩陣Q的行k上的列包含非零值)。此數量不會隨時間改變,因為降混合矩陣Q係為針對一輸入聲道配置進行預定義,且不會隨著一音源輸入訊號的長度而改變。
例如當考慮5.1輸入信號出現以下情況:○聲道1,3,4係降混合到降混合聲道1(見上述的矩陣Q),○在每一音源訊框(3個聲道)中K in =3
K in 可以為一定數量的主動聲道,其係降混合到目前所考慮的降混合聲道k[1,2](一定數量的輸入聲道在目前音源訊框內為主動的,在降混合矩陣Q的行k上的相對應的列包含一個非零值→在主動聲道交集內的聲道以及在Q的行K上的非均等元素的數量)。此數量可以為隨音源輸入訊號的長度改變的時間變數值,因為即使Q保持不變,訊號活動率可隨著時間值改變。
例如當考慮5.1輸入信號出現以下情況:
○聲道1,3,4係降混合到降混合聲道1(見上述的矩陣Q),
○在訊框n內:■主動聲道係為聲道1,2,4,■K in 係為在交集{1,4}內的主動聲道的數量,■Kin(n)=2
○在訊框n+1內:■主動聲道係為聲道1,2,3,4,■Kin係為在交集{1,3,4}內的聲道的數量,■Kin(n+1)=3
音源聲道(在預定義訊框)可考慮為主動式,在此情況下,其具有超過預設的臨界值的預定義訊框內的振福或能量,例如根據多個實施例,在音源聲道(在預定義訊框內)的活動率可被定義如下:●訊號的絕對振幅的總值或最大值(在時域,QMF域等內)在此訊框內係大於零,或●訊號能量的總值或最大值(在時域或QMF域內的振幅的經平方的絕對值)在訊框內係大於零。
另一個大於零的臨界值(相對於最大的能量或振福),例如臨界值0.01,也可使用零值來將其替代。
根據多個實施例,針對每個耳機提供的增益因數取決於主動(隨時間改變)的數量或在降混合聲道內所包含的聲道(降混合矩陣相等於零)Kin的固定數量。假定因數在全解相關以及全相關情況下進行線性增加。全相關表示訊號為每個其他的(具有偏移的相位差以及相關值)加權版本。
如上所述,增益或比例因數g可藉由低通濾波器528隨著音源訊框進行平滑。低通濾波器528可具有針對訊框大小k產生平滑增益因數gS(t)的時間常數ts,如下述:g s (t i )=c s,old g s (t i -1)+c s.new g
c s,new =1-c s,old 在此,ts=低通濾波器之時間常數[s]
ti=在訊框ti上的音源訊框
gs=平滑增益因數
k=訊框大小,以及fs=取樣頻率[Hz]
訊框大小k可以為在時域取樣值(例如第2048個取樣值)內的音源訊框的大小。
音源訊框x(ti)的左聲道殘響訊號係接著藉由因數gs,left(ti)進行縮放,右聲道殘響訊號係藉由因數gs,right(ti)進行縮放。比例因數係再次與K in 進行計算以作為(主動非零的或總數量的)呈現於立體聲降混合的左聲道的聲道數量,此立體聲降混合係饋入到產生比例因數gs,lcft(ti)的混響器內。接著,比例因數係再次與K in 進行計算以作為(主動非零的或總數量的)呈現於立體聲降混合的右聲道的聲道數量,此立體聲降混合係饋入到產生比例因數gs,right(ti)的混響器內。混響器回饋音源訊框的立體聲混響版本。混響版本(或混響器的輸入的左聲道)的左聲道係利用gs,left(ti)進行縮放,混響版本的右聲道(或混響器的輸入的右聲道)係利用gs,right(ti)進行縮放。
縮放人工(合成)晚期混響係施加到加法器510,以待加入於與直接音效以及早期反射進行處理的訊號506內。
如上所述,根據多個實施例,本發明的方法可針對音源訊號的二進制處理使用於二進制處理器。音源訊號之二進制處理之一實施例將描述於下文中。二進制處理可作為將解碼訊號轉換成二進制降混合訊號的一解碼器處理來執行,當聆聽耳機時,二進制降混合訊號係提供環繞音效體驗。
第8圖係繪示根據本發明之實施例之針對音源訊號的二進制處理之二進制轉譯器800之表現之示意圖。第8圖係提供在二進制轉譯器內的QMF域處理之概略圖。在輸入802上的二進制轉譯器800接收待處理的音源訊號,例如包含N個聲道以及64QMF頻帶的輸入訊號。此外,二進制轉譯器800係接收一定數量的複數個輸入參數以控制音源訊號的處理。複數個輸入參數包含雙適用於2xN個聲道以及64QMF頻帶耳室內脈衝響應(BRIR)804,最大頻帶的示值Kmax 806係用於具有BRIRs 804之早期反射部分的音源輸入訊號之卷積,以及係用於如上所述的複數個混響器參數係為808以及810(RT60以及混響能量)。二進制轉譯器800包含快速卷積處理器812,此快速卷積處理器812係用於將輸入音源訊號802與所接收的BRIRs 804之初期部分進行處理。處理器812在輸出上產生包含兩個聲道以及Kmax QMF頻帶的早期處理訊號。二進制轉譯器800包含早期處理分支以及混響分支,其中早期處理分支具有卷積快速處理器812,混響分支包含接收混響器816a以及816b,混響器816a以及816b係接收RT60資訊808以及混響能量資訊810以作為輸入參數。混響分支更包含立體聲降混合處理器818以及相關性分析處理器820,兩者也接收輸入音源訊號802。此外,增益階段821a係提供於立體聲降混合處理器818以及混響器816a之間,增益階段821b係提供於立體聲降混合處理器818以及混響器816b之間,用以控制立體聲降混合處理器818所提供的降混合訊號822之增益。立體聲降混合處理器818係提供以輸入訊號802為基礎之降混合訊號822,此降混合訊號822係具有兩個頻帶以及64 QMF頻帶。增益階段821a以及821b之增益係分別藉由相關性分析處理器820所提供的控制訊號824a以及824b進行控制。增益控制降混合訊號係分別輸入到混響器816a與816b,用以分別產生混響訊號826a與826b。早期處理訊號814以及混響訊號826a,826b係藉由混合器828進行接收,混合器828係將接收的訊號組合成具有兩個聲道以及64QMF頻帶的輸出音源訊號830。此外,根據本發明,快速卷積處理器812以及混響器816a,816b係接收另一輸入參數832,此另一輸入參數832係指示在室內脈衝響應804內從初期部分到晚期混響的轉換。
二進制轉譯器模組800(例如第2圖或第4圖的二進制轉譯 器236)具有作為輸入802的解碼數據流。訊號係藉由QMF分析濾波處理,如具有在ISO/IEC14496-3:2009之第8.6.4.2.項修改說明的ISO/IEC14496-3:2009第4.B.18.2項所列。轉譯器模組800也可處理QMF域輸入數據;在此情況下,分析濾波係可忽略。二進制室內脈衝響應(BRIRs)804係作為複雜QMF域濾波器。從時域二進制室內脈衝響應到複雜QMF濾波器表現的轉換係列於ISO/IEC FDIS 23003-1:2006之Annex B上。BRIRs 804在複雜QMF域中係限定特定數量的時槽,使得此時槽僅包含早期反射部分301與302(見第5圖),而不包含晚期擴散混響304。如上所述,已決定從早期反射到晚期混響的轉換點832,例如在二進制處理的預處理步驟中藉由BRIRs 804的分析而決定。接著,QMF域音源訊號802以及QMF域BRIRs 804係藉由頻帶快速卷積812的處理以執行二進制處理。QMF域混響器816a,816b係用以產生雙聲道QMF域晚期混響826a與826b。
混響模組816a與816b係使用一組頻率相關性混響時間值808以及能量值810以調整混響的性能。混響的波形係以音源輸入訊號802之立體聲降混合818為基礎,其係根據多聲道音源訊號802之相關性分析820來適應性縮放821a與821b振福大小。雙聲道QMF域卷積結果814以及雙聲道QMF域混響816a,816b係接著進行結合,最後,兩個QMF合成濾波器組計算雙耳時域輸出訊號830,如ISO/IEC 14496-3:2009之第4.6.18.4.2.項所列。轉譯器也可產生QMF域輸出數據;接著,忽略QMF合成濾波器組。
變數定義
音源訊號802係饋入二進制轉譯器模組800內以作為輸入訊號,如下所述。音源訊號830係為二進制處理的結果,被稱為輸出信號。二進制轉譯器模組800之輸入訊號802係為核心解碼器的音源輸出訊號(例如見第2圖的訊號228)。所使用的變數之定義如下:
處理
輸入訊號的處理描述於此。二進制轉譯模組操作於輸入音源訊號之長度L=2048時域取樣值的連續以及非重疊的訊框,每個長度L的經處理輸入訊框輸出L取樣值之一訊框。
(1)初始化以及預處理
在核心解碼器(例如見第2圖的解碼器200)傳遞音源取樣值之前,執行二進制處理區塊的初始化。初始化包含幾個處理步驟。
(a)分析值的讀取
混響器模組816a,816b取混響時間值808以及能量值810的頻率相關集合以作為輸入參數。從二進制處理模組800之初始化上的介面讀取這些數值。此外,讀取在時域取樣值內的從早期反射到晚期混響的轉換時間值832。數值可儲存於以32位元編寫每個取樣值、浮點值以及位元組順序的二進位檔。針對處理時所需的讀取值詳述於下表中:
(b)BRIRs的讀取以及預處理
二進制室內脈衝響應804係從分別儲存左耳以及右耳BRIR的兩個專用檔案中讀取。BRIR的時域取樣係以每個取樣為24位元解析度以及32個聲道儲存成整數聲音檔,在檔案中的BRIR的順序詳述於下表中:
如果在揚聲器的任一位置上沒有量測到BRIR,在聲音檔內的相對應聲道包含零值。LFE聲道沒有使用於二進制處理。
如預處理步驟,給定的二進制室內脈衝響應(BRIRs)的集合係從時域濾波器轉換到複雜值QMF域濾波器。在複雜值QMF域內的所給 定的時域濾波器係根據ISO/IEC FDIS 23003-1:2006之Annex B來執行。針對濾波器轉換的原型濾波器係數係根據ISO/IEC FDIS 23003-1:2006之 Annex B之Table B.1使用。處理具有1 v L trans之時域表現 以增益具有1 n L trans,n 的複雜值QMF域濾波器
(2)音源訊號處理
二進制轉譯器模組800之音源處理區塊係針對N in輸入聲道從核心解碼器取得時域音源取樣值802,並產生包含N out=雙聲道之二進制輸出訊號830。
作為輸入的處理
●從核心解碼器所解碼的音源數據802,●BRIR集合804之早期反射部分之複雜QMF域表現,以及●頻率相關性參數集合808,810,832係藉由QMF域混響器816a與816b執行,以產生晚期混響826a與826b。
(a)音源訊號之QMF分析
如第一處理步驟,二進制轉譯器模組係將N in聲道時域輸入 訊號(來自核心解碼器)L=2048時域取樣值轉換到維度 L n =32 QMF時槽(時槽符號n)以及K=64頻帶(頻帶符號k)的N in聲道QMF域訊號表現802。
如具有在ISO/IEC14496-3:2009之第8.6.4.2.項修改說明的ISO/IEC14496-3:2009第4.B.18.2項所列出的QMF分析,其係執行於時域 訊號之訊框以增益QMF域訊號之一訊框,其中1 v L 以及1 n L n
(b)QMF域音源訊號之快速卷積以及QMF域BRIR
接著,頻帶快速卷積812係執行以處理QMF域音源訊號802以及QMF域BRIR 804。FFT分析可針對輸入訊號802的每個聲道以及每個BRIR 804執行每個QMF頻帶k
由於在QMF域中的複雜值,一個FFT分析係執行於QMF域訊號表現的實部以及一個FFT分析係執行於QMF域訊號表現的虛部。接著,結合結果以組行最後的頻帶複雜值假FFT域訊號 以及頻帶複雜值BRIRs 針對左耳機
針對右耳機
FFT轉換長度係根據複雜值QMF域BRIR濾波器的長度L trans,n 以及在QMF域時槽的長度L n 所決定,使得L FFT=L trans,n +L n -1。
接著,複雜值假FFT域訊號係利用複雜值假FFT域BRIR濾波器倍增以形成快速卷積結果。向量m conv係用於發送訊號,而發送的輸入訊號的聲道相對應於BRIR數據集合中的BRIR對的聲道。
針對符合1 k K max的所有的QMF頻帶k執行頻帶倍增。最大頻帶K max係藉由QMF頻帶決定,此QMF頻帶係用以表示之一頻率,此頻率係為18kHz或出現在來自核心解碼器的音源訊號內的最大訊號頻率f max=min(f max,decoder,18kHz)。
從具有每一個BRIR對的每個輸入聲道所產生的倍增係在符合1 k K max的每個QMF頻帶k內進行總結,其中每個QMF頻帶k產生中間的雙聲道K max帶的假FFT域訊號。 以及皆為在QMF域頻帶k 內的假FFT卷積結果。
下一步,執行頻帶FFT分析以將卷積結果轉換回產生中間 的雙聲道K max帶的pseudo-FFT域訊號的QMF域,其中pseudo-FFT域訊號 係具有符合1 n L FFT以及1 k K maxL FFT時槽
針對具有L=32時槽的每個QMF域輸入訊框,恢復具有L=32時槽的卷積結果。儲存所留下的L FFT-32時槽,並在下列的(複數個)訊框中執行重疊附加的處理。
(c)晚期混響的產生
作為第二中頻訊號826a,826b的混響訊號被稱為 ,其係藉由頻率域混響器模組816a,816b而產生。頻率 域混響器模組816a,816b係以下列作為輸入
●輸入訊號之訊框之QMF域立體聲混響822
●包含頻率相關性混響時間值808以及能量值810的參數集合
頻率域混響器模組816a與816b轉換到雙聲道QMF域晚期混響的末端。
頻率相關性參數集合之所使用的最大頻帶數量係根據最大頻率進行計算。
首先,執行輸入訊號之訊框之QMF域立體聲降混合818,以形成輸入訊號聲道加權相加的轉譯器輸入。降混合矩陣MDNX內包含實值以及非負值的複數個加權增益值,此降混合矩陣的維度係為N out×N in。輸入訊號之聲道所包含的非零值係映射到兩個輸出聲道中之其中一個。
代表揚聲器的位置在左半邊的聲道係映射到左輸出聲道,代表揚聲器的位置在右半邊的聲道係映射到右輸出聲道。這些聲道的訊號皆係藉由係數1進行加權。這些聲道代表在中間平面上的揚聲器係映射到雙 耳訊號的兩輸出聲道。這些聲道的輸入訊號係藉由係數進行 加權。
此外,能量均等步驟係執行於降混合內,其將降混聲道的頻帶能量調整成相等於複數個輸入訊號聲道的頻帶能量的總值,降混合聲道包含此複數個輸入訊號聲道。能量均等步驟係藉由具有實值係數 的頻帶倍增來執行。
因數c eq,k 係受限於[0.5,2]區間。執行數值常數ε以避面被零值整除。降混合的頻寬受限於頻率f max;在所有高頻帶的數值接皆設定為零值。
第9圖係根據本發明之一實施例示意性地表示在二進制轉譯器800之頻率域混響器816a與816b內的處理。
在頻率域混響器內,使用輸入混合器900計算立體聲輸入之單聲道降混合。在第二輸入聲道上非相干地施加90°相位移。
單聲道訊號係接著被饋入於每個頻帶k內的產生延遲脈衝串列的回饋延遲迴圈902。相互並聯的兩個FIR解相關器係以延遲的方法將訊號能量分配於複數個脈衝之間的間隔,並產生在複數個輸出聲道之間的非相干性。施加延遲濾波器之振實密度以產生能量延遲。濾波器之相位操作係受限於四個選項以執行稀疏矩陣以及無乘法器的解相關器。
在針對每個QMF頻帶計算混響之後,混響模組包含聲道間相干性校正904。在ICC校正步驟中,使用頻率相關性直接增益值gdirect以及交錯混合增益gcross來調整ICC。
在輸入參數集合內係包含不同頻帶的能量總量值以及混響時間值,這些數值給定在內部映射到K=64 QMF頻帶上的一定數量的頻率點。
作為示例的兩個頻率域混響器係用以計算最後的中頻訊號 。訊號係為第一示例之混響器之第一輸出聲道, 係為第二示例之混響器之第二輸出聲道。兩個頻率域混響器結合成具 有雙聲道、64個頻帶以及32個時槽之維度的最後混響訊號訊框。
立體聲降混合822係根據輸入訊號訊框之相關性測量820對時間821a,b進行縮放,以確認混響器輸出的正確縮放。比例因數係定義 為在區間內的一數值,其線性相關於0以及1之間的相關 性係數c corr
以及
其中係意指橫跨聲道A之時槽的n標準偏差,運算元{*}係代表共軛複數以及係為在實際訊框內的QMF域訊號之零平均值的版本。
c corr進行兩次計算:一次係為針對活躍於實際訊框F上且為立體聲降混合之左聲道包含的複數個聲道A,B,此複數個聲道A,B,另一次係為針對活躍於實際訊框F上且為立體聲降混合之右聲道包含的複數個聲道A,BN DMX,act係為降混合道降混合聲道A之輸入聲道的數量(在降混合矩陣MDMXAth列內的矩陣元素的數量),並且活躍於目前訊框。
接著,比例因數係為
比例因數係藉由一階低通濾波器隨音源訊框進行平滑,以產 生平滑比例因數
比例因數係藉由具有相同平均值的時域相關性分析在第一音源輸入數據訊號進行初始化。
第一混響器示例的輸入係以比例因數進行縮放,第二混響器示例的輸入係以比例因數進行縮放。
(d)卷積結果以及晚期混響的結合
下一步,卷積之計算結果814,以及混 響器輸出826a與826b係針對QMF域音源音源輸入訊框 藉由混合處理828進行結合,此混合處理828係將兩個輸入訊號的頻寬加在一起。應當注意的是,卷積僅執行高達於頻帶K max,所以高於K max的上頻帶在內皆為零值。
晚期混響輸出係藉由在混合處理內的d=((L trans-20.64+1)/64+0.5)+1時槽的總量進行延遲。
延遲d考量BRIRs內的從早期反射到晚期反射的總轉換點以及20個QMF時槽之混響器之初始延遲,並針對BRIRs之QMF分析考量0.5 QMF時槽,以確認在合理的時槽上的晚期混響的插入。在一個時槽n上所結合的訊號係藉由+進行計算。
(e)二進制QMF域訊號之QMF分析
QMF域輸出訊號之32時槽之雙聲道訊框係根據ISO/IEC 14496-3:2009之第4.6.18.4.2項藉由QMF分析轉換成具有長度L的 雙聲道時域訊框,產生最後的時域輸出訊號830
根據本發明的方法,合成或人工的晚期混響係考量輸入訊號之特性,藉此增加輸出訊號的品質,並同時藉由分開的處理以取得降低的運算複雜度的優勢。此外,從上述可得知不須額外的聽覺模型或目標混響音量。
應當注意的是,本發明並不以上述的實施例為限。例如,上述實施例已結合QMF域進行描述,應當注意的是,也可以使用其他的頻率域,例如STFT域。此外,比例因數能以頻率相關性方法進行計算,使得隨 著頻帶之整體數量改變的相關性(亦即i [1,N])不會進行計算,而是以一定數量的S子集合進行計算,如下:i 1 [1,N 1],i 2 [N 1+1,N 2],...,i S [N S-1+N]
此外,平滑處理可施加於在頻帶,或是頻帶可根據特定規則進行結合,例如根據聽覺之頻率解析度。平滑可適用不同的時間常數,例如取決於聆聽者的偏好或訊框大小。
本發明的方法也可施加不同的訊框大小,甚至訊框大小可能僅為在時間頻率域內的時槽大小。
根據實施例,不同的降混合矩陣可用以降混合,例如對稱的降混合矩陣或非對稱的矩陣。
相關性測量可從傳送到音源數據流的複數個參數中衍生出來,例如從MPEG環繞或SAOC內的聲道間相關性。此外,根據實施例,其可能從平均值計算中排除矩陣的一些數值,例如錯誤計算值或在主對角線上的複數個數值,如果必要的話,也可將自相關值排除。
例如當施加低複雜雙耳設定時,可在解碼器上執行此處理,而不是在解碼器側上的二進制轉譯器內執行此處理。此處理產生比例因數之一些表現,例如比例因數本身、介於0及1之間的相關性測量、傳送到數據流內的參數以及其相似物,並針對固定下傳矩陣以數據流將這些參數從編碼器傳送到解碼器。
此外,雖然在上述實施例中已描述施加增益,在下文中則更詳細描述施加增益於混響器514,應當注意的是,根據其它實施例,此增益也可施加於混響器514之前或混響器之內,例如藉由修正混響器514內的增益。在此係具有優勢的,因為可能僅需要少量的運算。
儘管一些方面已在裝置的上下文中描述,很顯然地,這些方面也代表相對應的方法的描述,其中區塊或裝置相對應於方法步驟或方法步驟之特徵。相似地,描述於方法步驟的上下文中的方面也代表相對應的區塊或項目或相對應的裝置的特徵的描述。一些或全部的方法步驟可藉由(或使用)硬體設備來執行,像是例如微處理器、可編程計算機或電子電路。在 一些實施例中,一些中的一個或多個的最重要的方法步驟可藉由此類一裝置執行。
根據某些實施例之需求,本發明的多個實施例可在硬體或軟體上執行。可使用非短暫性儲存媒介來執行,例如數位儲存媒體(例如軟盤、DVD、Blu-Ray、CD、PROM以及EPROM、EEPROM或快閃記憶體),其具有儲存於其上的電子可讀控制訊號,並與可編程計算機系統相配合,使得執行相對應的方法。因此,計算機可讀取數位儲存媒體。
根據本發明之一些實施例,其包含具有電子可讀控制訊號的數據載體,此數據載體能與可編程計算機系統相配合,使得執行在本文中所描述的任一方法。
一般來說,本發明的多個實施例可作為具有程式碼的計算機程式產品而實現,當電腦上執行計算機程式產品時,此程式碼可用於執行任一方法。程式碼可例如儲存於機器可讀取的載體上。
其它實施例包含計算機程式,此計算機程式係儲存於機器可讀取的載體上,並用以執行在本文中所描述的任一方法。
換句話說,因此,本發明之一實施例係為具有程式碼之計算機程式,當電腦上執行計算機程式時,此程式碼係用以執行在本文中所描述的任一方法。
因此,本發明之另一實施例,數據載體(或數位儲存媒體,或者是機器可讀取的載體)包含其所記錄的計算機程式,此計算機程式係用以執行在本文中所描述的任一方法。數據載體、數位儲存媒體或記錄媒體通常是有實體及/或非暫態的。
因此,本發明方法之另一實施例,數據流或一串訊號代表用以執行在本文中所描述的任一方法的計算機程式。數據流或一串訊號可例如透過數據通訊連接傳輸,例如透過網路。
另一實施例包含處理裝置,例如電腦或可編程邏輯裝置,其係配置或編排用以執行在本文中所描述的任一方法。
另一實施例包含具有安裝於其上的計算機程式的電腦,此計算機程式係用以執行在本文中所描述的任一方法。
根據本發明之另一實施例,包含用以(例如電性地或光學地傳輸)將計算機程式傳輸到接收器的裝置或系統,此計算機程式係用以執行在本文中所描述的任一方法。接收器可例如為電腦、行動裝置、記憶裝置或其相似物。裝置或系統可例如包含用以將計算機程式傳輸到接收器的檔案伺服器。
在一些實施例中,可編程邏輯裝置(例如可程式邏輯陣列)可用以執行本文中所描述的方法的一些或全部的功能。在一些實施例中,可程式邏輯陣列可與微處理器相配合以執行在本文中所描述的任一方法。一般來說,較佳地,係藉由任何硬體裝置來執行這些方法。
上述多個實施例僅用於說明本發明的原理。應當理解的是,配置的變更及變動以及本文所描述的細節對於其他領域的技術人員是顯而易見的。因此,本發明僅由即將產生的權利要求項的範圍來限制,而不是本文中的多個實施例的描述以及說明的方面所提出的特定細節。
參考文獻:
[1] M. R. Schroeder, "Digital Simulation of Sound Transmission in Reverberant Spaces", The Journal of the Acoustical Society of America, VoS. 47, pp. 424-431 (1970) and enhanced in JA. Moorer, "About This Reverberation Business", Computer Music Journal, Vol. 3, no. 2, pp. 13-28, MIT Press (1979).
[2] Uhle, Christian; Paulus, Jo uni; Herre, Jürgen: “Predicting the Perceived Level of Late Reverberation Using Computational Models of Loudness” Proceedings, 17th International Conference on Digital Signal Processing (DSP), July 6 - 8, 2011, Corfu, Greece.
[3] Czyzewski, Andrzej: “A Method of Artificial Reverberation Quality Testing” J. Audio Eng. Soc., Vol. 38, No 3, 1990.
502‧‧‧處理、處理器、輸出訊號、卷積
504‧‧‧音源訊號、輸入訊號、音源輸入訊號
506‧‧‧經處理早期部分、輸出訊號、訊號
508‧‧‧數據庫、BRIRS
510‧‧‧加法器
512‧‧‧混響分支
514‧‧‧處理、混響處理器、混響器
516‧‧‧降混合器、降混合
518‧‧‧數據庫、RT60混響
520‧‧‧數據庫、混響能量
522‧‧‧分析
524‧‧‧相關性分析處理器、處理器、相關性分析
526‧‧‧增益級
528‧‧‧低通濾波器
530‧‧‧延遲元件

Claims (19)

  1. 一種根據室內脈衝響應(300)處理音源訊號(504,802)之方法,該方法包含:將該音源訊號(504,802)分別與該室內脈衝響應(300)之一初期部分(301,302)以及一晚期混響(304)進行處理(502,514,812,816a,816b),其中處理該晚期混響(304)之步驟包含產生一縮放混響訊號;以及將與該室內脈衝響應之該早期部分做處理的該音源訊號與該縮放混響訊號進行結合,其中產生該縮放混響訊號之步驟包含:根據該音源訊號(504,802)具有一固定值的預定義相關性測量值設定一增益因數以及使用該增益因數,預定義相關性測量值由複數個音源訊號之分析為基礎以憑實證所決定,或者是,使用該音源訊號(504,802)的一相關性分析來計算該音源訊號(504,802)的一相關性測量值與該增益因數,以及使用該增益因數。
  2. 如申請專利範圍第1項所述之方法,其中該縮放大小係取決於該音源訊號(504,802)之該至少一輸入聲道之一條件,其中該音源訊號(504,802)之該至少一輸入聲道之條件包含輸入聲道之數量、主動輸入聲道之數量以及在該至少一輸入聲道內的一活動中的至少一種。
  3. 如申請專利範圍第2項所述之方法,其中該增益因數係取決於該音源訊號(504,802)之該至少一輸入聲道之條件。
  4. 如申請專利範圍第3項所述之方法,其中產生該縮放混響訊號之步驟包含在處理該音源訊號(504,802)之該晚期混響(304)之前、過程中或之後使用該增益因數。
  5. 如申請專利範圍第3項所述之方法,其中該增益因數係取決於下列的式子:g=c u +ρ.(c c -c u )在此,ρ=該音源訊號(504,802)之預定義或計算而得的相關性測量值,cu,cc=係為指示該音源訊號(504,802)之至少一輸入聲道之條件的因 數,其中cu意指完全非相關聲道,cc係有關於全相關聲道,其中cu以及cc係取決於下列式子: 在此,K in =該音源訊號的主動輸入聲道之數量。
  6. 如申請專利範圍第1項所述之方法,其中該音源訊號(504,802)之該相關性分析包含決定該音源訊號(504,802)之一音源訊框之一結合的相關性測量值,其中該結合的相關性測量值係針對一音源訊框之複數個聲道結合,藉由結合複數個相關性係數以執行計算,每一音源訊框包含至少一時槽(time slot)。
  7. 如申請專利範圍第6項所述之方法,其中結合該相關性係數之步驟包含計算該音源訊框之複數個相關性係數之平均值。
  8. 如申請專利範圍第6項所述之方法,其中決定該結合的相關性測量值之步驟包含:(i)針對該音源訊框之每一個聲道計算一整體平均值,(ii)藉由將相對應的該複數個聲道減去該平均值以計算出一零平均音源訊框,(iii)針對複數個聲道結合計算該相關性係數,以及(iv)計算該結合的相關性測量值,作為複數個相關性係數之該平均值。
  9. 如申請專利範圍第6項所述之方法,其中一聲道結合之該相關性係數以下列式子進行計算: ρ[m,n]=相關性係數,σ(xm[j])=在橫跨聲道m之一時槽j的標準差,σ(xn[j])=在橫跨聲道n之一時槽j的標準差,xm,xn=零平均變數值, N=頻帶,M=複數個時槽,K=複數個聲道,i=1...N,j=1...M,m,n=1...K,*=共軛複數。
  10. 如申請專利範圍第1項所述之方法,包含延遲該縮放混響訊號,使其起點能匹配在該室內脈衝響應(300)內從早期反射到晚期混響(304)的轉換點。
  11. 如申請專利範圍第1項所述之方法,其中處理該音源訊號(504,802)是一多聲道音源輸入訊號,其中該晚期混響(304)之步驟包含使用該多聲道音源輸入訊號至一降混合器(410)以降混合該多聲道音源輸入訊號(504,802)到一具有較低數量通道的訊號,以及將該降混合音源訊號施加到一混響器。
  12. 一非實體的計算機產品包含一計算機可讀媒介,該計算機可讀媒介係儲存複數個指令,當一計算機執行該計算機可讀媒介時,該複數個指令係實現如申請專利範圍第1到11其中一項所述之方法。
  13. 一種訊號處理單元,包含:一輸入端,係用以接收一音源訊號(504,802),一初期部分處理器,係根據一室內脈衝響應(300)之一初期部分(301,302)以處理該接收的音源訊號(504,802),一晚期混響處理器,係根據該室內脈衝響應(300)之一晚期混響以處理該接收的音源訊號(504,802),該晚期混響處理器係用以產生一縮放混響訊號;以及一輸出端,係用以將該接收的音源訊號(504,802)之該經處理的初期部分以及該縮放混響訊號與一輸出音源訊號相結合,其中該晚期混響處理器係配置來藉由以下產生該縮放混響訊號:根據該音源訊號(504,802)具有一固定值的預定義相關性測量值設定 一增益因數以及使用該增益因數,預定義相關性測量值由複數個音源訊號之分析為基礎以憑實證所決定,或者是,使用該音源訊號(504,802)的一相關性分析來計算該音源訊號(504,802)的一相關性測量值與該增益因數,以及使用該增益因數。
  14. 如申請專利範圍第13項所述之訊號處理單元,其中該晚期混響處理器包含:一混響器,係用以接收該音源訊號(504,802)以及產生一混響訊號;以及一增益級,係耦接到該混響器之一輸入端或以一輸出端,並藉由該增益因數進行控制。
  15. 如申請專利範圍第13項所述之訊號處理單元,包含一相關性分析器,該相關性分析器係根據該音源訊號(504,802)產生該增益因數。
  16. 如申請專利範圍第13項所述之訊號處理單元,更包含下列中的至少一種:一低通濾波器,係耦接到該增益級,以及一延遲元件,係耦接於該增益級以及一加法器之間,該加法器更耦接到該初期部分處理器以及該輸出端。
  17. 一種二進制轉譯器,包含如申請專利範圍第13項所述之一訊號處理單元。
  18. 一種用以編碼音源訊號之音源編碼器,包含:如申請專利範圍第13項所述之一訊號處理單元或如申請專利範圍第17項所述之一二進制轉譯器,係用以在執行編碼之前處理該音源訊號。
  19. 一種用以解碼編碼音源訊號之音源解碼器,包含:如申請專利範圍第13項所述之一訊號處理單元或如申請專利範圍第17項所述之一二進制轉譯器,係用以處理該複數個解碼音源訊號。
TW103124820A 2013-07-22 2014-07-18 處理音源訊號之方法、訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器 TWI555011B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP13177361 2013-07-22
EP20130189255 EP2840811A1 (en) 2013-07-22 2013-10-18 Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder

Publications (2)

Publication Number Publication Date
TW201521017A TW201521017A (zh) 2015-06-01
TWI555011B true TWI555011B (zh) 2016-10-21

Family

ID=48808220

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103124820A TWI555011B (zh) 2013-07-22 2014-07-18 處理音源訊號之方法、訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器

Country Status (18)

Country Link
US (4) US9955282B2 (zh)
EP (4) EP2840811A1 (zh)
JP (4) JP6374502B2 (zh)
KR (1) KR101771533B1 (zh)
CN (1) CN105519139B (zh)
AR (1) AR097002A1 (zh)
AU (1) AU2014295165B2 (zh)
BR (1) BR112016001136B1 (zh)
CA (1) CA2918279C (zh)
ES (1) ES2760873T3 (zh)
MX (2) MX2016000699A (zh)
PL (1) PL3025520T3 (zh)
PT (1) PT3025520T (zh)
RU (1) RU2642376C2 (zh)
SG (1) SG11201600370UA (zh)
TW (1) TWI555011B (zh)
WO (1) WO2015011055A1 (zh)
ZA (1) ZA201601079B (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
EP3767970B1 (en) 2013-09-17 2022-09-28 Wilus Institute of Standards and Technology Inc. Method and apparatus for processing multimedia signals
FR3012247A1 (fr) * 2013-10-18 2015-04-24 Orange Spatialisation sonore avec effet de salle, optimisee en complexite
CN108449704B (zh) 2013-10-22 2021-01-01 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
CA2934856C (en) 2013-12-23 2020-01-14 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
KR101782917B1 (ko) 2014-03-19 2017-09-28 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9584938B2 (en) * 2015-01-19 2017-02-28 Sennheiser Electronic Gmbh & Co. Kg Method of determining acoustical characteristics of a room or venue having n sound sources
US10149082B2 (en) 2015-02-12 2018-12-04 Dolby Laboratories Licensing Corporation Reverberation generation for headphone virtualization
CA3219512A1 (en) 2015-08-25 2017-03-02 Dolby International Ab Audio encoding and decoding using presentation transform parameters
US10115403B2 (en) * 2015-12-18 2018-10-30 Qualcomm Incorporated Encoding of multiple audio signals
CN109076305B (zh) * 2016-02-02 2021-03-23 Dts(英属维尔京群岛)有限公司 增强现实耳机环境渲染
EP3293987B1 (en) * 2016-09-13 2020-10-21 Nokia Technologies Oy Audio processing
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
CN114025301A (zh) 2016-10-28 2022-02-08 松下电器(美国)知识产权公司 用于回放多个音频源的双声道渲染装置和方法
CN106875953B (zh) * 2017-01-11 2020-10-13 深圳市创成微电子有限公司 模拟混音音频处理方法及系统
CN108665902B (zh) * 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
GB2562518A (en) * 2017-05-18 2018-11-21 Nokia Technologies Oy Spatial audio processing
CN107358962B (zh) * 2017-06-08 2018-09-04 腾讯科技(深圳)有限公司 音频处理方法及音频处理装置
US10388265B2 (en) * 2017-06-20 2019-08-20 Signal/Noise Solutions L.L.C. Systems and methods for enhancing a signal-to-noise ratio
US9886939B2 (en) * 2017-06-20 2018-02-06 Signal/Noise Solutions, L.L.C. Systems and methods for enhancing a signal-to-noise ratio
WO2019004524A1 (ko) * 2017-06-27 2019-01-03 엘지전자 주식회사 6자유도 환경에서 오디오 재생 방법 및 오디오 재생 장치
CN109389986B (zh) 2017-08-10 2023-08-22 华为技术有限公司 时域立体声参数的编码方法和相关产品
EP3699905A4 (en) 2017-10-20 2020-12-30 Sony Corporation SIGNAL PROCESSING DEVICE, METHOD AND PROGRAM
WO2019078034A1 (ja) 2017-10-20 2019-04-25 ソニー株式会社 信号処理装置および方法、並びにプログラム
EP3570566B1 (en) * 2018-05-14 2022-12-28 Nokia Technologies Oy Previewing spatial audio scenes comprising multiple sound sources
CN109297583B (zh) * 2018-09-14 2020-07-24 北京理工大学 汽车车内双耳异响时变噪声响度评价方法
US10582299B1 (en) * 2018-12-11 2020-03-03 Amazon Technologies, Inc. Modeling room acoustics using acoustic waves
US20230319498A1 (en) * 2020-03-09 2023-10-05 Nippon Telegraph And Telephone Corporation Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium
CN115244953A (zh) * 2020-03-18 2022-10-25 索尼集团公司 声音处理装置、声音处理方法和声音处理程序
KR102500157B1 (ko) 2020-07-09 2023-02-15 한국전자통신연구원 오디오 신호의 바이노럴 렌더링 방법 및 장치
CN112037825B (zh) * 2020-08-10 2022-09-27 北京小米松果电子有限公司 音频信号的处理方法及装置、存储介质
JP2022144500A (ja) * 2021-03-19 2022-10-03 ヤマハ株式会社 音信号処理方法および音信号処理装置
US11665377B2 (en) * 2021-04-23 2023-05-30 At&T Intellectual Property I, L.P. System and method for identifying encrypted, pre-recorded media content in packet data networks
US11877143B2 (en) * 2021-12-03 2024-01-16 Microsoft Technology Licensing, Llc Parameterized modeling of coherent and incoherent sound

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1768107A1 (en) * 2004-07-02 2007-03-28 Matsushita Electric Industrial Co Ltd Audio signal decoding device and audio signal encoding device
WO2012116934A1 (en) * 2011-03-02 2012-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06335094A (ja) * 1993-05-25 1994-12-02 Matsushita Electric Ind Co Ltd 音場再生装置
US5371799A (en) * 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
JP3498888B2 (ja) 1996-10-11 2004-02-23 日本ビクター株式会社 サラウンド信号処理装置と方法及び映像音声再生方法、記録媒体への記録方法及び記録装置、記録媒体、処理プログラムの伝送方法及び受信方法、並びに記録データの伝送方法及び受信方法
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6188769B1 (en) * 1998-11-13 2001-02-13 Creative Technology Ltd. Environmental reverberation processor
US20020067836A1 (en) * 2000-10-24 2002-06-06 Paranjpe Shreyas Anand Method and device for artificial reverberation
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
JP3598993B2 (ja) * 2001-05-18 2004-12-08 ソニー株式会社 符号化装置及び方法
JP4062959B2 (ja) * 2002-04-26 2008-03-19 ヤマハ株式会社 残響付与装置、残響付与方法、インパルス応答生成装置、インパルス応答生成方法、残響付与プログラム、インパルス応答生成プログラムおよび記録媒体
JP4077279B2 (ja) * 2002-08-30 2008-04-16 アルパイン株式会社 残響レベル制御装置
US7949141B2 (en) * 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
US7412380B1 (en) * 2003-12-17 2008-08-12 Creative Technology Ltd. Ambience extraction and modification for enhancement and upmix of audio signals
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
KR100764903B1 (ko) 2004-09-07 2007-10-09 김병두 발전소용 미분탄 보일러 노 구조
DE102004043521A1 (de) 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
DE602006015294D1 (de) * 2005-03-30 2010-08-19 Dolby Int Ab Mehrkanal-audiocodierung
WO2007043388A1 (ja) * 2005-10-07 2007-04-19 Matsushita Electric Industrial Co., Ltd. 音響信号処理装置および音響信号処理方法
US8670570B2 (en) * 2006-11-07 2014-03-11 Stmicroelectronics Asia Pacific Pte., Ltd. Environmental effects generator for digital audio signals
JP4834146B2 (ja) * 2007-03-09 2011-12-14 パイオニア株式会社 音場再生装置及び音場再生方法
US7742746B2 (en) * 2007-04-30 2010-06-22 Qualcomm Incorporated Automatic volume and dynamic range adjustment for mobile audio devices
BRPI0911729B1 (pt) * 2008-07-31 2021-03-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V dispositivo e método para gerar um sinal binaural e para formar um conjunto de redução por intersemelhança
CN103489449B (zh) * 2009-06-24 2017-04-12 弗劳恩霍夫应用研究促进协会 音频信号译码器、提供上混信号表示型态的方法
GB2485979A (en) * 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
JP2012150278A (ja) * 2011-01-19 2012-08-09 Kitakyushu Foundation For The Advancement Of Industry Science And Technology 仮想空間のビジュアル変化に対応した音響効果の自動生成システム
KR101844336B1 (ko) * 2011-08-01 2018-04-02 삼성전자주식회사 공간감을 제공하는 신호 처리 장치 및 신호 처리 방법
US9420393B2 (en) * 2013-05-29 2016-08-16 Qualcomm Incorporated Binaural rendering of spherical harmonic coefficients

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1768107A1 (en) * 2004-07-02 2007-03-28 Matsushita Electric Industrial Co Ltd Audio signal decoding device and audio signal encoding device
WO2012116934A1 (en) * 2011-03-02 2012-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal

Also Published As

Publication number Publication date
JP2023071866A (ja) 2023-05-23
AU2014295165B2 (en) 2017-03-16
US9955282B2 (en) 2018-04-24
JP2018182757A (ja) 2018-11-15
AR097002A1 (es) 2016-02-10
PT3025520T (pt) 2019-12-18
US20230032120A1 (en) 2023-02-02
AU2014295165A1 (en) 2016-03-10
BR112016001136A2 (zh) 2017-07-25
EP4297017A2 (en) 2023-12-27
US20210067898A1 (en) 2021-03-04
EP3606102A1 (en) 2020-02-05
KR20160046800A (ko) 2016-04-29
KR101771533B1 (ko) 2017-08-25
EP2840811A1 (en) 2015-02-25
BR112016001136B1 (pt) 2022-05-24
EP3606102C0 (en) 2023-12-13
JP2021114799A (ja) 2021-08-05
TW201521017A (zh) 2015-06-01
CN105519139B (zh) 2018-04-17
RU2642376C2 (ru) 2018-01-24
ES2760873T3 (es) 2020-05-18
CA2918279C (en) 2018-08-07
JP7241447B2 (ja) 2023-03-17
EP3606102B1 (en) 2023-12-13
CA2918279A1 (en) 2015-01-29
US20180206059A1 (en) 2018-07-19
JP2016531484A (ja) 2016-10-06
EP3025520A1 (en) 2016-06-01
MX2016000699A (es) 2016-04-13
US11445323B2 (en) 2022-09-13
EP3025520B1 (en) 2019-09-18
EP4297017A3 (en) 2024-03-06
US10848900B2 (en) 2020-11-24
PL3025520T3 (pl) 2020-04-30
SG11201600370UA (en) 2016-02-26
JP6879979B2 (ja) 2021-06-02
MX2016000698A (es) 2016-04-15
ZA201601079B (en) 2017-08-30
CN105519139A (zh) 2016-04-20
US20160255453A1 (en) 2016-09-01
WO2015011055A1 (en) 2015-01-29
RU2016105692A (ru) 2017-08-25
JP6374502B2 (ja) 2018-08-15
US11910182B2 (en) 2024-02-20

Similar Documents

Publication Publication Date Title
TWI555011B (zh) 處理音源訊號之方法、訊號處理單元、二進制轉譯器、音源編碼器以及音源解碼器
TWI549119B (zh) 根據空間脈衝響應處理音源訊號之方法、訊號處理單元、音源編碼器、音源解碼器以及立體聲轉譯器
KR100928311B1 (ko) 오디오 피스 또는 오디오 데이터스트림의 인코딩된스테레오 신호를 생성하는 장치 및 방법
JP5081838B2 (ja) オーディオ符号化及び復号
KR20110002491A (ko) 바이노럴 오디오 신호들의 복호화