TW201330650A - 多聲道降混音裝置 - Google Patents

多聲道降混音裝置 Download PDF

Info

Publication number
TW201330650A
TW201330650A TW101101210A TW101101210A TW201330650A TW 201330650 A TW201330650 A TW 201330650A TW 101101210 A TW101101210 A TW 101101210A TW 101101210 A TW101101210 A TW 101101210A TW 201330650 A TW201330650 A TW 201330650A
Authority
TW
Taiwan
Prior art keywords
channel
sound
coefficient
module
zero point
Prior art date
Application number
TW101101210A
Other languages
English (en)
Other versions
TWI479905B (zh
Inventor
bao-ji Zhang
Dai-Ming Zhang
yi-ming Xu
Original Assignee
Univ Nat Central
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Central filed Critical Univ Nat Central
Priority to TW101101210A priority Critical patent/TWI479905B/zh
Priority to US13/417,157 priority patent/US8774418B2/en
Publication of TW201330650A publication Critical patent/TW201330650A/zh
Application granted granted Critical
Publication of TWI479905B publication Critical patent/TWI479905B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

一種多聲道降混音裝置,可將5.1聲道轉成四聲道之降混音架構,其中加入頭部轉移函數(Head-related transfer functions,HRTF)藉此於耳機播放聲場中加強虛擬喇叭聲源位置,而在頭部轉移函數部份以共極/零點模型(Common-acoustic-pole and zero model,CAPZ)重建原始頭部轉移函數之頻率響應,藉此可將原本各角度之全零點架構之頻率響應轉換成具極零點之架構,並且每個角度皆共用一組極點以及各自零點即可完美重建原始頭部轉移函數之頻率響應,能有助於硬體實現上降低產品成本。並且,對於一空間音場,其中包含直接音、反射音以及後期迴響,該些空間資訊可有效提升聲音之豐富性,為此本發明更加入人工迴響器(Artificial Reverberator)來真實呈現聲音於空間中反射情況,為四聲道耳機系統提供更為豐富之三維空間聆聽感受。

Description

多聲道降混音裝置
本發明係有關於一種多聲道降混音裝置,尤指涉及一種將5.1聲道劇院聲場效果實現於四聲道耳機,特別係指使用共極/零點模型將原本全零點之頭部轉移函數(Head-Related Transfer Functions,HRTF)轉換成無限脈衝響應濾波器(Infinite Impulse Response Filter,IIR Filter)架構之多聲道音場重建之降混音裝置。
一般而言,聲音訊號從耳機輸出則直接進入耳道並於腦中產生音場,但此種音訊缺少實際一空間中之音場資訊,無法明確呈現聲源移動之效果,為此,有人提出增強型立體聲耳機,將雙聲道耳機加入頭部轉移函數以對應一實際空間上雙聲道喇叭擺放位置。然而,隨著科技之發展,從家庭劇院至大型戲院皆以5.1聲道為基本架構,而習知技術為了以頭部轉移函數建構虛擬喇叭位置則必須付出相當數量之硬體成本,惟其隨著聲道數量之增加硬體成本也隨之倍數成長,導致費用支出逐漸增加,不符成本效益。故,一般習用者係無法符合使用者於實際使用時之所需。
本發明之主要目的係在於,克服習知技藝所遭遇之上述問題並提供一種以一四聲道耳機重建5.1環場音效,並利用共極/零點模型將原本全零點之頭部轉移函數轉換成IIR濾波器架構之多聲道音場重建之降混音裝置。
本發明之次要目的係在於,提供一種只需一組共極點係數以及與各角度相對應之零點係數即可完美重建原始頭部轉移函數之頻率響應,不僅能大幅降低實現於硬體上之成本,更能大幅提升即時性系統處理速度同時重現高音質之多聲道環場音效,藉此提昇音訊之豐富性,達到於耳機系統中提供更為豐富之三維空間聆聽感受之多聲道降混音裝置。
本發明之另一目的係在於,提供一種將5.1聲道劇院聲場效果實現於四聲道耳機,可有效將實際之多聲道環繞音場重建於四聲道耳機系統,具有低價位高聽覺享受之優勢,可提供給消費者另一種播放裝置上之選擇之多聲道降混音裝置。
為達以上之目的,本發明係一種多聲道降混音裝置,係包括一頭部轉移函數模組,係提供一頭部轉移函數,用以將單一音訊轉換成兩耳接收之訊號,俾以產生空間中虛擬喇叭音源位置;一共極/零點模型(Common-Acoustic-Pole and Zero model,CAPZ),係與該頭部轉移函數模組連接,將該頭部轉移函數轉換成具極/零點模型,其中各角度之頭部轉移函數係含有各角度之零點係數以及一組共極點係數;一人工迴響器(Artificial Reverberator),係依據使用者提供之空間資訊產生聲波在空間中多次反射迴響狀況,俾以產生一組空間迴響係數;一降混音(Down-Mix)模組,係與該共極/零點模型及該人工迴響器連接,用以依據各角度之零點係數以及一組共極點係數,並配合該空間迴響係數,將5.1聲道音訊降混音為四聲道音訊;一聲道分配器,係與該降混音模組連接,為具有雙聲道以上輸出之音效卡,用以輸出自該降混音模組傳遞來之四聲道音訊;以及一四聲道播放器,係與該聲道分配器連接,用以將該四聲道音訊轉換成聲音播出。
請參閱『第1圖~第3圖』所示,係分別為本發明之整體架構示意圖、本發明之人工迴響器架構示意圖及本發明之降混音架構示意圖。如圖所示:本發明係一種多聲道降混音裝置,係將5.1聲道降混音成四聲道之環場音效架構,其至少包括一頭部轉移函數(Head-Related Transfer Functions,HRTF)模組1、一共極/零點模型(Common-Acoustic-Pole and Zero model,CAPZ)2、一人工迴響器(Artificial Reverberator)3、一降混音(Down-Mix)模組4、一聲道分配器5以及一四聲道播放器6所構成,係可有效將實際之多聲道環繞音場重建於四聲道耳機系統,具有低價位高聽覺享受之優勢,可提供給消費者另一種播放裝置上之選擇。
上述所提之頭部轉移函數模組1係提供一頭部轉移函數,用以將單一音訊轉換成兩耳接收之訊號,俾以產生空間中虛擬喇叭音源位置。
該共極/零點模型2係與該頭部轉移函數模組1連接,先將各角度之頭部轉移函數轉換成共極/零點模型,其含有各角度之零點係數以及一組共極點係數,接著依據欲設定之空間中喇叭擺放位置選取對應之角度零點係數,並將共極點係數與對應角度之零點係數傳遞給該降混音模組4合成多聲道音訊。
該人工迴響器3係依據使用者提供之空間資訊產生聲波在空間中多次反射迴響狀況,經由模擬聲波反射自空間中六面牆延遲訊號,以及在一空間中迴響時間,產生一組可重建空間聲場效果之空間迴響係數,並將其傳遞給該降混音模組4合成迴響訊號。其中,該空間資訊係包含空間尺寸之長、寬、高以及牆壁厚度及其材質平均吸收係數。
該降混音模組4係與該共極/零點模型2及該人工迴響器3連接,經由該共極/零點模型2各角度之零點係數以及一組共極點係數,將5.1聲道音訊依據空間中喇叭擺放角度位置,加入頭部轉移函數加強聲音位置效果,並配合該人工迴響器3之空間迴響係數,進而將其降混音成四聲道音訊。
該聲道分配器5係與該降混音模組4連接,為具有雙聲道以上輸出之音效卡,用以輸出自該降混音模組傳遞來之四聲道音訊。其中,該聲道分配器5係可為兩張可輸出立體聲之音效卡或具四聲道音訊輸出之音效卡。
該四聲道播放器6係與該聲道分配器5連接,用以將該四聲道音訊轉換成聲音播出。其中,該四聲道播放器6係為一具四聲道輸出之耳機,其耳機左右兩邊輸出各具備兩聲道。
本發明以上述共極/零點模型2重建頭部轉移函數,係對於每個角度θ之頭部轉移函數可用共極/零點模型取代之,其推算方式如下:
其中,θ為對應頭部轉移函數之角度;P為極點數量;以及Q為零點數量。
其共用極點以及各角度零點之推算方式如下:
x=(A T A)-1 A T h a
其中x為最後估算之極點與零點係數,於其中:
x=[a T ,b T 1),b T 2),...,b T M )] T
a=[a 1 ,a 2 ,...,a P ] T
b(θ m )=[b 0 m ),b 1 m ),...,b Q m )] T
h a =[h T 1),h T 2),...,h T M )] T
h(θ m )=[h 0 m ),h 1 m ),...,h N -1 m ),0,...,0] T
上述人工迴響器3,於一較佳實施例中,係使用moorer人工迴響器為例,包含梳形濾波器(Comb Filter)31及全通濾波器(All-Pass Filter)32,其結構如第2圖所示,推算方式分別如下:
 (梳形濾波器)
 (全通濾波器)
圖中六個梳形濾波器31代表一空間中聲波自六面牆反射後到聽者之延遲時間,接著將這六個延遲後之訊號加總並經過全通濾波器32提升迴響效果。其空間中迴響時間之推算方式如下:
其中,E為一空間之體積(長x寬x高);C為聲速;total_absor為空間中每面牆之平均吸收係數。
上述降混音模組4係以降混音演算法將5.1聲道音訊降混音為四聲道音訊,其架構如第3圖所示,推算方式如下:
其中,Y為合成後之輸出訊號,其下標為所對應之聲道(左(L)、右(R)、後左(RL)及後右(RR));X為輸入訊號,其下標為所對應之聲道(左(L)、右(R)、中央(C)、後左(RL)、後右(RR)及重低音(LEF));*為迴旋積分符號;‧為乘法符號;Revb為一人工迴響器;B(z)為共極/零點模型之各對應角度之零點係數;A(z)為共極/零點模型之共極點係數;以及a、β為可控制之增益。
因此,本發明係提出一多聲道音場重建之降混音裝置,係以一四聲道耳機重建5.1環場音效,將5.1聲道劇院聲場效果實現於四聲道耳機,並利用共極/零點模型重新設計頭部轉移函數,可將原本全零點之頭部轉移函數轉換成無限脈衝響應濾波器(Infinite Impulse Response Filter,IIR Filter)架構,而將各角度之頭部轉移函數轉換成只需共用一組極點係數以及與各角度相對應之數組零點係數即可產生聲源定位效果,達到完美重建原始頭部轉移函數之頻率響應,不僅能大幅降低實現於硬體上之成本,且透過加入人工迴響器實現多聲道音訊在空間中聲波多次反射之聲場效果,更能大幅提升即時性系統處理速度同時重現高音質之多聲道環場音效,藉此提昇音訊之豐富性,進而於耳機系統中提供更為豐富之三維空間聆聽感受。
綜上所述,本發明係一種多聲道降混音裝置,可有效改善習用之種種缺點,不僅能大幅降低實現於硬體上之成本,更能大幅提升即時性系統處理速度同時重現高音質之多聲道環場音效,藉此提昇音訊之豐富性,達到於耳機系統中提供更為豐富之三維空間聆聽感受,進而使本發明之產生能更進步、更實用、更符合使用者之所須,確已符合發明專利申請之要件,爰依法提出專利申請。
惟以上所述者,僅為本發明之較佳實施例而已,當不能以此限定本發明實施之範圍;故,凡依本發明申請專利範圍及發明說明書內容所作之簡單的等效變化與修飾,皆應仍屬本發明專利涵蓋之範圍內。
1...一頭部轉移函數模組
2...共極/零點模型
3...人工迴響器
31...梳形濾波器
32...全通濾波器
4...降混音模組
5...聲道分配器
6...四聲道播放器
第1圖,係本發明之整體架構示意圖。
第2圖,係本發明之人工迴響器架構示意圖。
第3圖,係本發明之降混音架構示意圖。
1...一頭部轉移函數模組
2...共極/零點模型
3...人工迴響器
4...降混音模組
5...聲道分配器
6...四聲道播放器

Claims (8)

  1. 一種多聲道降混音裝置,係包括:一頭部轉移函數(Head-Related Transfer Functions,HRTF)模組,係提供一頭部轉移函數,用以將單一音訊轉換成兩耳接收之訊號,俾以產生空間中虛擬喇叭音源位置;一共極/零點模型(Common-Acoustic-Pole and Zero model,CAPZ),係與該頭部轉移函數模組連接,將該頭部轉移函數轉換成具極/零點模型,其中各角度之頭部轉移函數係含有各角度之零點係數以及一組共極點係數;一人工迴響器(Artificial Reverberator),係依據使用者提供之空間資訊產生聲波在空間中多次反射迴響狀況,俾以產生一組空間迴響係數;一降混音(Down-Mix)模組,係與該共極/零點模型及該人工迴響器連接,用以依據各角度之零點係數以及一組共極點係數,並配合該空間迴響係數,將5.1聲道音訊降混音為四聲道音訊;一聲道分配器,係與該降混音模組連接,為具有雙聲道以上輸出之音效卡,用以輸出自該降混音模組傳遞來之四聲道音訊;以及一四聲道播放器,係與該聲道分配器連接,用以將該四聲道音訊轉換成聲音播出。
  2. 依申請專利範圍第1項所述之多聲道降混音裝置,其中,該共極/零點模型係依據欲設定之空間中喇叭擺放位置選取對應之角度零點係數,並將共極點係數與對應角度之零點係數傳遞給該降混音模組合成多聲道音訊。
  3. 依申請專利範圍第1項所述之多聲道降混音裝置,其中,該人工迴響器係模擬聲波反射自空間中六面牆延遲訊號,以及在一空間中迴響時間,將此重建空間聲場效果之空間迴響係數傳遞給該降混音模組合成迴響訊號。
  4. 依申請專利範圍第1項所述之多聲道降混音裝置,其中,該人工迴響器係由梳形濾波器(Comb Filter)及全通濾波器(All-Pass Filter)組成。
  5. 依申請專利範圍第1項所述之多聲道降混音裝置,其中,該空間資訊係包含空間尺寸之長、寬、高以及牆壁厚度及其材質平均吸收係數。
  6. 依申請專利範圍第1項所述之多聲道降混音裝置,其中,該降混音模組係將5.1聲道音訊依據空間中喇叭擺放角度位置,加入頭部轉移函數加強聲音位置效果,並配合該人工迴響器之空間迴響係數,進而降混音成四聲道音訊。
  7. 依申請專利範圍第1項所述之多聲道降混音裝置,其中,該聲道分配器係為兩張可輸出立體聲之音效卡或具四聲道音訊輸出之音效卡。
  8. 依申請專利範圍第1項所述之多聲道降混音裝置,其中,該四聲道播放器係為一具四聲道輸出之耳機,其耳機左右兩邊輸出各具備兩聲道。
TW101101210A 2012-01-12 2012-01-12 Multi-channel down mixing device TWI479905B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW101101210A TWI479905B (zh) 2012-01-12 2012-01-12 Multi-channel down mixing device
US13/417,157 US8774418B2 (en) 2012-01-12 2012-03-09 Multi-channel down-mixing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW101101210A TWI479905B (zh) 2012-01-12 2012-01-12 Multi-channel down mixing device

Publications (2)

Publication Number Publication Date
TW201330650A true TW201330650A (zh) 2013-07-16
TWI479905B TWI479905B (zh) 2015-04-01

Family

ID=48779974

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101101210A TWI479905B (zh) 2012-01-12 2012-01-12 Multi-channel down mixing device

Country Status (2)

Country Link
US (1) US8774418B2 (zh)
TW (1) TWI479905B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105547296A (zh) * 2015-12-02 2016-05-04 上海航空电器有限公司 基于四元数的计算三维声源和人头相对位置的装置和方法
CN109644315A (zh) * 2017-02-17 2019-04-16 无比的优声音科技公司 用于缩混多声道音频信号的设备和方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
US10672408B2 (en) * 2015-08-25 2020-06-02 Dolby Laboratories Licensing Corporation Audio decoder and decoding method
WO2018200000A1 (en) 2017-04-28 2018-11-01 Hewlett-Packard Development Company, L.P. Immersive audio rendering
US10257633B1 (en) 2017-09-15 2019-04-09 Htc Corporation Sound-reproducing method and sound-reproducing apparatus
CN108156561B (zh) * 2017-12-26 2020-08-04 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端
CN114363793B (zh) * 2022-01-12 2024-06-11 厦门市思芯微科技有限公司 双声道音频转换为虚拟环绕5.1声道音频的系统及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE491314T1 (de) * 2006-04-05 2010-12-15 Harman Becker Automotive Sys Verfahren zum automatischen entzerren eines beschallungssystems
UA101542C2 (ru) * 2008-12-15 2013-04-10 Долби Лабораторис Лайсензин Корпорейшн Виртуализатор окружающего звука с динамическим сжатием диапазона и способ
US8308937B2 (en) * 2009-08-03 2012-11-13 Advanced Waste Water Systems Grey water diversion system
WO2012094335A1 (en) * 2011-01-04 2012-07-12 Srs Labs, Inc. Immersive audio rendering system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105547296A (zh) * 2015-12-02 2016-05-04 上海航空电器有限公司 基于四元数的计算三维声源和人头相对位置的装置和方法
CN109644315A (zh) * 2017-02-17 2019-04-16 无比的优声音科技公司 用于缩混多声道音频信号的设备和方法

Also Published As

Publication number Publication date
TWI479905B (zh) 2015-04-01
US20130182853A1 (en) 2013-07-18
US8774418B2 (en) 2014-07-08

Similar Documents

Publication Publication Date Title
US20200335115A1 (en) Audio encoding and decoding
TWI479905B (zh) Multi-channel down mixing device
KR101146841B1 (ko) 바이노럴 오디오 신호를 생성하기 위한 방법 및 장치
KR101010464B1 (ko) 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성
TWI322630B (en) Device and method for generating an encoded stereo signal of an audio piece or audio datastream,and a computer program for generation an encoded stereo signal
CN105874820B (zh) 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN110326310B (zh) 串扰消除的动态均衡
RU2011105972A (ru) Формирование бинауральных сигналов
CA2744429C (en) Converter and method for converting an audio signal
Jot et al. Binaural simulation of complex acoustic scenes for interactive audio
RU2427978C2 (ru) Кодирование и декодирование аудио
Jakka Binaural to multichannel audio upmix
Pelzer et al. 3D reproduction of room acoustics using a hybrid system of combined crosstalk cancellation and ambisonics playback
JP2004509544A (ja) 耳に近接配置されるスピーカ用の音声信号処理方法
Doukhan et al. CW_binaural~: A binaural synthesis external for Pure Data
Jakka Binauraalisen audiosignaalin muokkaus monikanavaiselle äänentoistojärjestelmälle
Kan et al. Psychoacoustic evaluation of different methods for creating individualized, headphone-presented virtual auditory space from B-format room impulse responses
Bejoy Virtual surround sound implementation using deccorrelation filters and HRTF
MX2008010631A (es) Codificacion y decodificacion de audio

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees