TW202405792A - 立體聲增強系統及立體聲增強方法 - Google Patents
立體聲增強系統及立體聲增強方法 Download PDFInfo
- Publication number
- TW202405792A TW202405792A TW111126730A TW111126730A TW202405792A TW 202405792 A TW202405792 A TW 202405792A TW 111126730 A TW111126730 A TW 111126730A TW 111126730 A TW111126730 A TW 111126730A TW 202405792 A TW202405792 A TW 202405792A
- Authority
- TW
- Taiwan
- Prior art keywords
- sound
- hrtf
- beamforming
- stereo enhancement
- unit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000005236 sound signal Effects 0.000 claims abstract description 193
- 210000005069 ears Anatomy 0.000 claims description 23
- 230000015572 biosynthetic process Effects 0.000 claims description 20
- 238000003786 synthesis reaction Methods 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 10
- 238000004088 simulation Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000001934 delay Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- NCGICGYLBXGBGN-UHFFFAOYSA-N 3-morpholin-4-yl-1-oxa-3-azonia-2-azanidacyclopent-3-en-5-imine;hydrochloride Chemical compound Cl.[N-]1OC(=N)C=[N+]1N1CCOCC1 NCGICGYLBXGBGN-UHFFFAOYSA-N 0.000 description 6
- 238000001914 filtration Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2203/00—Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
- H04R2203/12—Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
- H04R2430/23—Direction finding using a sum-delay beam-former
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Stereophonic System (AREA)
Abstract
本發明揭露一種立體聲增強系統及立體聲增強方法。立體聲增強系統包括波束成形單元及訊號處理單元。波束成形單元用以接收複數個輸入聲音信號並據以產生分別對應於複數個方向區間的複數個波束成形聲音信號。訊號處理單元耦接波束成形單元,用以接收分別對應於該複數個方向區間的該複數個波束成形聲音信號並據以產生第一合成輸出聲音信號及第二合成輸出聲音信號。
Description
本發明係與立體聲增強有關,特別是關於一種立體聲增強系統及立體聲增強方法。
一般而言,如圖1所示,由於傳統之錄音裝置1的麥克風10的距離及機構較不容易模擬人耳EAR,無法表現左右耳之間的距離,及頭遮蓋聲音的效應,因而導致錄音裝置1的麥克風10所錄到的聲音SOU的立體聲效果(Stereo effect)較差,聽起來較缺乏空間感(Spatial sense),亟待改善。
因此,本發明提出一種立體聲增強系統及立體聲增強方法,藉以有效解決先前技術所遭遇到之上述問題。
根據本發明之一較佳具體實施例為一種立體聲增強系統。於此實施例中,立體聲增強系統包括波束成形單元及訊號處理單元。波束成形單元用以接收複數個輸入聲音信號並據以產生分別對應於複數個方向區間的複數個波束成形聲音信號。訊號處理單元耦接波束成形單元,用以接收分別對應於該複數個方向區間的該複數個波束成形聲音信號並據以產生第一合成輸出聲音信號及第二合成輸出聲音信號。
於一實施例中,訊號處理單元包括複數個頭部相關傳輸函數(HRTF)單元、第一合成單元及第二合成單元。該複數個HRTF單元耦接波束成形單元且分別對應於該複數個方向區間,該複數個HRTF單元中之每一個HRTF單元接收該複數個波束成形聲音信號中之相對應的波束成形聲音信號並計算波束成形聲音信號以產生第一輸出聲音信號及第二輸出聲音信號。第一合成單元耦接該複數個HRTF單元,用以將該複數個HRTF單元產生的複數個第一輸出聲音信號合成為第一合成輸出聲音信號。第二合成單元耦接該複數個HRTF單元,用以將該複數個HRTF單元產生的複數個第二輸出聲音信號合成為第二合成輸出聲音信號。
於一實施例中,該複數個方向區間所分別包括的角度範圍之間有重疊。
於一實施例中,該複數個輸入聲音信號係來自錄音裝置且將錄音裝置的全部或部分的收音範圍切成該複數個方向區間,致使波束成形單元產生相對於錄音裝置所有方向區間的該複數個波束成形聲音信號。
於一實施例中,每一HRTF單元產生的第一輸出聲音信號及第二輸出聲音信號係分別對應於左耳及右耳。
於一實施例中,第一合成單元及第二合成單元分別輸出第一合成輸出聲音信號及第二合成輸出聲音信號至左耳及右耳。
於一實施例中,第一合成輸出聲音信號及第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬。
於一實施例中,該複數個HRTF單元係採用真實錄音模式。
於一實施例中,該複數個HRTF單元係採用模擬模式且包括下列至少一者:濾波單元,用以模擬雙耳間的時間差及位準差;延遲單元,用以模擬雙耳間的時間差;及增益單元,用以模擬雙耳間的位準差。
於一實施例中,訊號處理單元還包括:聲音偵測單元,耦接於波束成形單元與該複數個HRTF單元之間,用以分別偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音並輸出包括有效聲音的波束成形聲音信號至該複數個HRTF單元。
於一實施例中,訊號處理單元透過修改該複數個HRTF單元的延遲及增益來調整音場寬窄。
根據本發明之另一較佳具體實施例為一種立體聲增強方法。於此實施例中,立體聲增強方法包括下列步驟:(a)根據複數個輸入聲音信號產生分別對應於複數個方向區間的複數個波束成形聲音信號;(b)根據演算法計算該複數個波束成形聲音信號中之每一個波束成形聲音信號以產生對應於複數個方向區間中之每一個方向區間的第一輸出聲音信號及第二輸出聲音信號;以及(c)將複數個第一輸出聲音信號合成為第一合成輸出聲音信號且將複數個第二輸出聲音信號合成為第二合成輸出聲音信號。
於一實施例中,演算法為頭部相關傳輸函數(HRTF)或能模擬聲源至左右耳的通道響應之技術。
於一實施例中,步驟(a)還偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音且步驟(a)所產生的該複數個波束成形聲音信號包括有效聲音。
於一實施例中,立體聲增強方法還包括下列步驟:透過修改HRTF及其它能模擬聲源至左右耳通道響應之技術的增益及延遲來調整音場寬窄。
於一實施例中,該複數個方向區間所分別包括的角度範圍之間有重疊。
於一實施例中,該複數個輸入聲音信號係來自錄音裝置且將錄音裝置的全部或部分的收音範圍切成該複數個方向區間,致使步驟(a)產生相對於錄音裝置所有方向區間的該複數個波束成形聲音信號。
於一實施例中,第一合成輸出聲音信號及第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬。
於一實施例中,步驟(b)係採用真實錄音模式。
於一實施例中,步驟(b)係採用模擬模式且立體聲增強方法還包括下列至少一者:模擬雙耳間的時間差;以及模擬雙耳間的位準差。
相較於先前技術,本發明之立體聲增強系統及立體聲增強方法係透過波束成形方法將麥克風陣列所錄到的複數個聲音信號分離至對應於不同聲音方向區間的不同通道並分別在每個通道內應用頭部相關傳輸函數(HRTF)處理來增強聲音信號的空間感,藉以讓聲音信號呈現出較佳的立體聲效果,使得左右耳聽到的聲音變寬敞。
根據本發明之一較佳具體實施例為一種立體聲增強系統。於此實施例中,立體聲增強系統可保留錄音裝置的麥克風陣列所錄到的所有輸入聲音信號並透過波束成形方法將所有輸入聲音信號分離至對應於不同聲音方向區間的不同通道,再分別於每個通道內應用頭部相關傳輸函數(HRTF)處理來增強聲音信號的空間感,藉以有效提升聲音信號的立體聲效果,使得左右耳聽到的聲音變寬敞。
請參照圖2至圖4,圖2及圖3分別繪示將錄音裝置的收音範圍切成複數個方向區間以及分別位於不同聲音方向區間的複數個HRTF單元之不同實施例。圖4繪示圖3中之每一個HRTF單元輸出第一輸出聲音信號至左耳且輸出第二輸出聲音信號至右耳的示意圖。
如圖2所示,假設錄音裝置2的收音範圍為360度角,其全部的收音範圍(亦即360度角)被切成複數個方向區間DI1~DI7且每一個方向區間DI1~DI7分別設置有頭部相關傳輸函數(HRTF)單元HR1~HR7。當錄音裝置2錄到複數個輸入聲音信號時,立體聲增強系統會根據該複數個輸入聲音信號產生分別對應於複數個方向區間DI1~DI7的複數個波束成形聲音信號至相對應的HRTF單元HR1~HR7。
如圖3所示,假設錄音裝置3的收音範圍為360度角,其部分的收音範圍(例如210度角)被切成複數個方向區間DI1~DI4且每一個方向區間DI1~DI4分別設置有頭部相關傳輸函數(HRTF)單元HR1~HR4。當錄音裝置3錄到複數個輸入聲音信號時,立體聲增強系統會根據該複數個輸入聲音信號產生分別對應於複數個方向區間DI1~DI4的複數個波束成形聲音信號至相對應的HRTF單元HR1~HR4。
需說明的是,本發明並未透過錄音裝置(例如麥克風陣列)來偵測特定的目標方向區間。本發明將錄音裝置的全部或部分的收音範圍切成複數個方向區間的數量並不以上述實施例為限,並且每個角度範圍可以相同或不同,並無特定之限制。
此外,該複數個方向區間所分別包括的角度範圍之間會有重疊。舉例而言,假設方向區間DI1的角度範圍為0至30度且方向區間DI2的角度範圍為15至45度,則方向區間DI1與DI2分別包括的角度範圍之間重疊了15度,藉以確保當物體從方向區間DI1移動至方向區間DI2時,聲音仍能維持平順。
如圖4所示,每一個HRTF單元HR1~HR4分別接收並計算各自相對應的波束成形聲音信號後輸出第一輸出聲音信號SO11~SO14至左耳EL且輸出第二輸出聲音信號SO21~SO24至右耳ER。詳細而言,HRTF單元HR1輸出第一輸出聲音信號SO11至左耳EL且輸出第二輸出聲音信號SO21至右耳ER;HRTF單元HR2輸出第一輸出聲音信號SO12至左耳EL且輸出第二輸出聲音信號SO22至右耳ER;HRTF單元HR3輸出第一輸出聲音信號SO13至左耳EL且輸出第二輸出聲音信號SO23至右耳ER;HRTF單元HR4輸出第一輸出聲音信號SO14至左耳EL且輸出第二輸出聲音信號SO24至右耳ER。
請參照圖5,圖5繪示本發明之一較佳具體實施例中之立體聲增強系統的示意圖。如圖5所示,立體聲增強系統5包括波束成形單元50及訊號處理單元52。當波束成形單元50接收到M個輸入聲音信號SIN1~SINM時,波束成形單元50根據該M個輸入聲音信號SIN1~SINM產生分別對應於N個方向區間DI1~DIN的N個波束成形聲音信號BF1~BFN。訊號處理單元52耦接波束成形單元50,用以接收分別對應於該N個方向區間DI1~DIN的該N個波束成形聲音信號BF1~BFN並根據該N個波束成形聲音信號BF1~BFN產生第一合成輸出聲音信號SY1及第二合成輸出聲音信號SY2。其中,M及N為正整數。
需說明的是,訊號處理單元52所產生的第一合成輸出聲音信號SY1及第二合成輸出聲音信號SY2係分別傳送至左耳LE及右耳RE,並且第一合成輸出聲音信號SY1及第二合成輸出聲音信號SY2的音場會比該M個輸入聲音信號SIN1~SINM的音場來得寬,使得左耳EL及右耳RE分別聽到第一合成輸出聲音信號SY1及第二合成輸出聲音信號SY2時會有較佳的立體聲效果。
於實際應用中,波束成形單元50所接收到的該M個輸入聲音信號SIN1~SINM可來自錄音裝置(例如麥克風陣列),並且錄音裝置的收音範圍可被切成N個方向區間DI1~DIN,致使波束成形單元50產生相對於錄音裝置所有N個方向區間DI1~DIN的N個波束成形聲音信號BF1~BFN。
此外,本發明的立體聲增強系統5與錄音裝置可視實際需求設計為彼此分離的不同設備或彼此整合於同一設備。舉例而言,麥克風陣列可設置於運動攝影機上進行收音及增強立體聲處理後儲存下來或由使用者接耳機聆聽,但不以此為限。
於此實施例中,訊號處理單元52可包括N個HRTF單元HR1~HRN、第一合成單元521及第二合成單元522。該N個HRTF單元HR1~HRN耦接波束成形單元50且分別對應於該N個方向區間DI1~DIN。該N個HRTF單元HR1~HRN中之每一個HRTF單元接收並計算該N個波束成形聲音信號BF1~BFN中之相對應的波束成形聲音信號以產生N個第一輸出聲音信號SO11~SO1N及N個第二輸出聲音信號SO21~SO2N。
第一合成單元521耦接該N個HRTF單元HR1~HRN,用以將該N個HRTF單元HR1~HRN產生的該N個第一輸出聲音信號SO11~SO1N合成為第一合成輸出聲音信號SY1後傳至左耳LE。第二合成單元522耦接該N個HRTF單元HR1~HRN,用以將該N個HRTF單元HR1~HRN產生的該N個第二輸出聲音信號SO21~SO2N合成為第二合成輸出聲音信號SY2後傳至右耳RE。
於實際應用中,第一合成輸出聲音SY1及第二合成輸出聲音SY2可分別輸出至耳機的左耳部及右耳部,但不以此為限。
於另一實施例中,如圖6所示,訊號處理單元52還可包括聲音偵測單元520。聲音偵測單元520耦接於波束成形單元50與該N個HRTF單元HR1~HRN之間,用以分別偵測對應於該N個方向區間DI1~DIN的該N個波束成形聲音信號BF1~BFN是否包括有效聲音,並且聲音偵測單元520僅會將包括有效聲音的K個波束成形聲音信號BF1~BFK分別輸出至K個HRTF單元HR1~HRK。其中,K為小於或等於N的正整數。
需說明的是,聲音偵測單元520偵測該N個波束成形聲音信號BF1~BFN是否包括有效聲音的方式可包含但不限於下列兩種:
(1)語音活動偵測(Voice Activity Detection,VAD),可用以偵測人聲;以及
(2)聲音事件偵測(Sound Event Detection),可用以偵測特定的聲音事件,例如狗叫、門鈴聲、飛機聲…等。
接著,該K個HRTF單元HR1~HRK中之每一個HRTF單元接收並計算該K個波束成形聲音信號BF1~BFK中之相對應的波束成形聲音信號以產生K個第一輸出聲音信號SO11~SO1K及K個第二輸出聲音信號SO21~SO2K。第一合成單元521將該K個第一輸出聲音信號SO11~SO1K合成為第一合成輸出聲音信號SY1後傳至左耳LE。第二合成單元522將該K個第二輸出聲音信號SO21~SO2K合成為第二合成輸出聲音信號SY2後傳至右耳RE。
於實際應用中,該N個HRTF單元HR1~HRN可採用真實錄音模式或模擬模式。當該N個HRTF單元HR1~HRN採用模擬模式時,每一個HRTF單元可包括用以模擬雙耳間的位準差及時間差的濾波單元、用以模擬雙耳間的時間差的延遲單元及/或用以模擬雙耳間的位準差的增益單元,但不以此為限。訊號處理單元52可透過修改該N個HRTF單元HR1~HRN的延遲及增益來調整聲音信號的音場寬窄,但不以此為限。
舉例而言,如圖7所示,第一HRTF單元HR1可包括分別對應於左耳LE及右耳RE的第一濾波單元FG1及第二濾波單元FG2。當第一濾波單元FG1接收到波束成形聲音信號BF1時,第一濾波單元FG1對波束成形聲音信號BF1進行濾波處理後產生對應於左耳LE的第一輸出聲音信號SO11。當第二濾波單元FG2接收到波束成形聲音信號BF1時,第二濾波單元FG2對波束成形聲音信號BF1進行濾波處理後產生對應於右耳RE的第二輸出聲音信號SO21。至於其他HRTF單元HR2~HRN亦可依此類推,故於此不另行贅述。
根據本發明之另一較佳具體實施例為一種立體聲增強方法。於此實施例中,立體聲增強方法可應用於前述各實施例中之立體聲增強系統,但不以此為限。
請參照圖8,圖8繪示此實施例中之立體聲增強方法的流程圖。如圖8所示,立體聲增強方法可包括但不限於下列步驟:
步驟S10:根據複數個輸入聲音信號產生分別對應於複數個方向區間的複數個波束成形聲音信號;
步驟S12:根據演算法計算該複數個波束成形聲音信號中之每一個波束成形聲音信號以產生對應於複數個方向區間中之每一個方向區間的第一輸出聲音信號及第二輸出聲音信號;以及
步驟S14:將複數個第一輸出聲音信號合成為第一合成輸出聲音信號且將複數個第二輸出聲音信號合成為第二合成輸出聲音信號。其中,第一合成輸出聲音信號及第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬,藉以達到增強立體聲的效果。
於實際應用中,步驟S10中之該複數個輸入聲音信號可來自錄音裝置且錄音裝置的全部或部分的收音範圍被切成該複數個方向區間,致使步驟S10可產生相對於錄音裝置所有方向區間的該複數個波束成形聲音信號,其中該複數個方向區間所分別包括的角度範圍之間會有重疊,但不以此為限。
此外,步驟S10還可偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音且步驟S10所產生的該複數個波束成形聲音信號包括有效聲音。
於另一實施例中,立體聲增強方法還可包括下列步驟:透過修改HRTF及其它能模擬聲源至左右耳通道響應之技術的增益及延遲來調整音場寬窄,但不以此為限。
於另一實施例中,步驟S12中之演算法可以是頭部相關傳輸函數(HRTF)或其他任何能夠模擬聲源至左右耳的通道響應之技術。此外,步驟S12可採用真實錄音模式或模擬模式。當步驟S12採用模擬模式時,立體聲增強方法還可包括下列步驟之至少一者:模擬雙耳間的時間差;以及模擬雙耳間的位準差,但不以此為限。
相較於先前技術,本發明之立體聲增強系統及立體聲增強方法係透過波束成形方法將麥克風陣列所錄到的複數個聲音信號分離至對應於不同聲音方向區間的不同通道並分別在每個通道內應用頭部相關傳輸函數(HRTF)處理來增強聲音信號的空間感,藉以讓聲音信號呈現出較佳的立體聲效果,使得左右耳聽到的聲音變寬敞。
1:錄音裝置
10:麥克風
EAR:人耳
SOU:聲音
2:錄音裝置
3:錄音裝置
DI1~DI7:方向區間
HR1~HR7:頭部相關傳輸函數(HRTF)單元
LE:左耳
RE:右耳
5:立體聲增強系統
50:波束成形單元
52:訊號處理單元
520:聲音偵測單元
521:第一合成單元
522:第二合成單元
HR1~HRN:頭部相關傳輸函數(HRTF)單元
SIN1~SINM:輸入聲音信號
DI1~DIN:方向區間
CH1~CHN:通道
BF1~BFN:波束成形聲音信號
SO11~SO1N:第一輸出聲音信號
SO21~SO2N:第二輸出聲音信號
SY1:第一合成輸出聲音信號
SY2:第二合成輸出聲音信號
FG1:第一濾波單元
FG2:第二濾波單元
S10~S14:步驟
圖1繪示傳統之錄音裝置的麥克風的距離及機構難以模擬人耳而導致其錄到的聲音缺乏空間感的示意圖。
圖2及圖3分別繪示將錄音裝置的收音範圍切成複數個方向區間以及分別位於不同聲音方向區間的複數個頭部相關傳輸函數(HRTF)單元之不同實施例。
圖4繪示圖3中之每一個HRTF單元輸出第一輸出聲音信號至左耳且輸出第二輸出聲音信號至右耳的示意圖。
圖5繪示本發明之一較佳具體實施例中之立體聲增強系統的示意圖。
圖6繪示本發明之立體聲增強系統聲音還包括偵測單元的示意圖。
圖7繪示本發明之HRTF單元還包括分別對應於左右耳的兩個濾波單元的示意圖。
圖8繪示本發明之一較佳具體實施例中之立體聲增強方法的流程圖。
5:立體聲增強系統
50:波束成形單元
52:訊號處理單元
521:第一合成單元
522:第二合成單元
HR1~HRN:頭部相關傳輸函數(HRTF)單元
SIN1~SINM:輸入聲音信號
DI1~DIN:方向區間
CH1~CHN:通道
BF1~BFN:波束成形聲音信號
SO11~SO1N:第一輸出聲音信號
SO21~SO2N:第二輸出聲音信號
SY1:第一合成輸出聲音信號
SY2:第二合成輸出聲音信號
LE:左耳
RE:右耳
Claims (20)
- 一種立體聲增強系統,包括: 波束成形單元,用以接收複數個輸入聲音信號並據以產生分別對應於複數個方向區間的複數個波束成形聲音信號;以及 訊號處理單元,耦接該波束成形單元,用以接收分別對應於該複數個方向區間的該複數個波束成形聲音信號並據以產生第一合成輸出聲音信號及第二合成輸出聲音信號。
- 如請求項1所述的立體聲增強系統,其中該訊號處理單元包括: 複數個頭部相關傳輸函數(HRTF)單元,耦接該波束成形單元且分別對應於該複數個方向區間,該複數個HRTF單元中之每一個HRTF單元接收該複數個波束成形聲音信號中之相對應的波束成形聲音信號並計算該波束成形聲音信號以產生第一輸出聲音信號及第二輸出聲音信號; 第一合成單元,耦接該複數個HRTF單元,用以將該複數個HRTF單元產生的複數個第一輸出聲音信號合成為該第一合成輸出聲音信號;以及 第二合成單元,耦接該複數個HRTF單元,用以將該複數個HRTF單元產生的複數個第二輸出聲音信號合成為該第二合成輸出聲音信號。
- 如請求項2所述的立體聲增強系統,其中該複數個方向區間所分別包括的角度範圍之間有重疊。
- 如請求項2所述的立體聲增強系統,其中該複數個輸入聲音信號係來自錄音裝置且將該錄音裝置的全部或部分的收音範圍切成該複數個方向區間,致使該波束成形單元產生相對於該錄音裝置所有方向區間的該複數個波束成形聲音信號。
- 如請求項2所述的立體聲增強系統,其中每一HRTF單元產生的該第一輸出聲音信號及該第二輸出聲音信號係分別對應於左耳及右耳。
- 如請求項2所述的立體聲增強系統,其中該第一合成單元及該第二合成單元分別輸出該第一合成輸出聲音信號及該第二合成輸出聲音信號至左耳及右耳。
- 如請求項2所述的立體聲增強系統,其中該第一合成輸出聲音信號及該第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬。
- 如請求項2所述的立體聲增強系統,其中該複數個HRTF單元係採用真實錄音模式。
- 如請求項2所述的立體聲增強系統,其中該複數個HRTF單元係採用模擬模式且包括下列至少一者: 濾波單元,用以模擬雙耳間的位準差及時間差; 延遲單元,用以模擬雙耳間的時間差;以及 增益單元,用以模擬雙耳間的位準差。
- 如請求項2所述的立體聲增強系統,其中該訊號處理單元還包括: 聲音偵測單元,耦接於該波束成形單元與該複數個HRTF單元之間,用以分別偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音並輸出包括有效聲音的波束成形聲音信號至該複數個HRTF單元。
- 如請求項2所述的立體聲增強系統,其中該訊號處理單元透過修改該複數個HRTF單元的延遲及增益來調整音場寬窄。
- 一種立體聲增強方法,包括下列步驟: (a)根據複數個輸入聲音信號產生分別對應於複數個方向區間的複數個波束成形聲音信號; (b)根據演算法計算該複數個波束成形聲音信號中之每一個波束成形聲音信號以產生對應於複數個方向區間中之每一個方向區間的第一輸出聲音信號及第二輸出聲音信號;以及 (c)將複數個第一輸出聲音信號合成為第一合成輸出聲音信號且將複數個第二輸出聲音信號合成為第二合成輸出聲音信號。
- 如請求項12所述的立體聲增強方法,其中該演算法為頭部相關傳輸函數(HRTF)或能模擬聲源至左右耳的通道響應之技術。
- 如請求項13所述的立體聲增強方法,其中步驟(a)還偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音且步驟(a)所產生的該複數個波束成形聲音信號包括有效聲音。
- 如請求項13所述的立體聲增強方法,還包括下列步驟: 透過修改HRTF及其它能模擬聲源至左右耳通道響應之技術的增益及延遲來調整音場寬窄。
- 如請求項13所述的立體聲增強方法,其中該複數個方向區間所分別包括的角度範圍之間有重疊。
- 如請求項13所述的立體聲增強方法,其中該複數個輸入聲音信號係來自錄音裝置且將該錄音裝置的全部或部分的收音範圍切成該複數個方向區間,致使步驟(a)產生相對於該錄音裝置所有方向區間的該複數個波束成形聲音信號。
- 如請求項13所述的立體聲增強方法,其中該第一合成輸出聲音信號及該第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬。
- 如請求項13所述的立體聲增強方法,其中步驟(b)係採用真實錄音模式。
- 如請求項13所述的立體聲增強方法,其中步驟(b)係採用模擬模式且該立體聲增強方法還包括下列至少一者: 模擬雙耳間的時間差;以及 模擬雙耳間的位準差。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111126730A TW202405792A (zh) | 2022-07-15 | 2022-07-15 | 立體聲增強系統及立體聲增強方法 |
US18/062,653 US20240022855A1 (en) | 2022-07-15 | 2022-12-07 | Stereo enhancement system and stereo enhancement method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW111126730A TW202405792A (zh) | 2022-07-15 | 2022-07-15 | 立體聲增強系統及立體聲增強方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202405792A true TW202405792A (zh) | 2024-02-01 |
Family
ID=89509518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111126730A TW202405792A (zh) | 2022-07-15 | 2022-07-15 | 立體聲增強系統及立體聲增強方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20240022855A1 (zh) |
TW (1) | TW202405792A (zh) |
-
2022
- 2022-07-15 TW TW111126730A patent/TW202405792A/zh unknown
- 2022-12-07 US US18/062,653 patent/US20240022855A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240022855A1 (en) | 2024-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10021507B2 (en) | Arrangement and method for reproducing audio data of an acoustic scene | |
US20170353812A1 (en) | System and method for realistic rotation of stereo or binaural audio | |
US20040136538A1 (en) | Method and system for simulating a 3d sound environment | |
US10652686B2 (en) | Method of improving localization of surround sound | |
CN104768121A (zh) | 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频 | |
US9584938B2 (en) | Method of determining acoustical characteristics of a room or venue having n sound sources | |
Epain et al. | Objective evaluation of a three-dimensional sound field reproduction system | |
US6990210B2 (en) | System for headphone-like rear channel speaker and the method of the same | |
US11032660B2 (en) | System and method for realistic rotation of stereo or binaural audio | |
US11510013B2 (en) | Partial HRTF compensation or prediction for in-ear microphone arrays | |
US20240171929A1 (en) | System and Method for improved processing of stereo or binaural audio | |
Calamia et al. | A conformal, helmet-mounted microphone array for auditory situational awareness and hearing protection | |
US20200059750A1 (en) | Sound spatialization method | |
Satongar et al. | Measurement and analysis of a spatially sampled binaural room impulse response dataset | |
TW202405792A (zh) | 立體聲增強系統及立體聲增強方法 | |
KR100275779B1 (ko) | 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 장치 및 방법 | |
San Martín et al. | Influence of recording technology on the determination of binaural psychoacoustic indicators in soundscape investigations | |
KR100307622B1 (ko) | 위치 조절이 가능한 가상 음상을 이용한 오디오 재생 장치 및그 방법 | |
US20180295447A1 (en) | Speaker system | |
US20030108216A1 (en) | Means for compensating rear sound effect | |
Zea | Binaural In-Ear Monitoring of acoustic instruments in live music performance | |
TW519849B (en) | System and method for providing rear channel speaker of quasi-head wearing type earphone | |
Glasgal | Improving 5.1 and Stereophonic Mastering/Monitoring by Using Ambiophonic Techniques | |
Qiao et al. | A multi-loudspeaker binaural room impulse response dataset with high-resolution translational and rotational head coordinates in a listening room | |
Fodde | Spatial Comparison of Full Sphere Panning Methods |