TWI817177B - 聲音播放系統及可適性音場調整方法 - Google Patents
聲音播放系統及可適性音場調整方法 Download PDFInfo
- Publication number
- TWI817177B TWI817177B TW110129682A TW110129682A TWI817177B TW I817177 B TWI817177 B TW I817177B TW 110129682 A TW110129682 A TW 110129682A TW 110129682 A TW110129682 A TW 110129682A TW I817177 B TWI817177 B TW I817177B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- sound signal
- test
- sound
- received
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 230000005236 sound signal Effects 0.000 claims abstract description 234
- 238000012360 testing method Methods 0.000 claims abstract description 154
- 238000010801 machine learning Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 17
- 230000003044 adaptive effect Effects 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 10
- 235000006679 Mentha X verticillata Nutrition 0.000 description 6
- 235000002899 Mentha suaveolens Nutrition 0.000 description 6
- 235000001636 Mentha x rotundifolia Nutrition 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Images
Abstract
本發明實施例提供一種聲音播放系統及可適性音場調整方法。在此方法中,決定理想濾波器,且第一測試聲音訊號通過理想濾波器而輸出第一接收聲音訊號。第一接收聲音訊號是外部收音器對內建揚聲器所播出的第一測試聲音訊號收音所得到的,且第一測試聲音訊號包括測試超聲波訊號。依據第二測試聲音訊號及第二接收聲音訊號訓練濾波器模型,且濾波器模型是基於機器學習演算法所訓練。依據理想接收訊號及第三接收聲音訊號之間的誤差調整該濾波器模型。藉此,可根據不同播放環境適性地調整音場。
Description
本發明是有關於一種聲音訊號處理,且特別是有關於一種聲音播放系統及可適性音場調整方法。
市面上許多有內建揚聲器的行動裝置的設計開發過程缺少基於各種播放環境的考量,導致使用者於不同播放環境使用其行動裝置時,所聽到的音場會受到環境因素的干擾與影響。舉例而言,播放環境中的障礙物所反射的聲音訊號可能影響行動裝置所播出的聲音訊號,但現有技術並沒有針對不同的播放環境提供合適地音場調整。
有鑑於此,本發明實施例提供一種聲音播放系統及可適性音場調整方法,可針對播放環境適應性地調整音場。
本發明實施例的可適性音場調整方法適用於行動裝置,行動裝置包括內建收音器及內建揚聲器,這可適性音場調整方法
包括(但不僅限於)下列步驟:決定理想濾波器。第一測試聲音訊號通過理想濾波器而輸出第一接收聲音訊號。這第一接收聲音訊號是外部收音器對內建揚聲器所播出的第一測試聲音訊號收音所得到的,且第一測試聲音訊號包括測試超聲波訊號。依據第二測試聲音訊號及第二接收聲音訊號訓練濾波器模型。這濾波器模型是基於機器學習演算法所訓練,第二接收聲音訊號是內建收音器對內建揚聲器所播出的第二測試聲音訊號收音所得到的,且第二測試聲音訊號包括測試超聲波訊號。依據理想接收訊號及第三接收聲音訊號之間的誤差調整這濾波器模型。這理想接收訊號是第二測試聲音訊號通過理想濾波器所輸出的聲音訊號,第三接收聲音訊號是外部收音器對內建揚聲器所播出的第一估測輸出訊號收音所得到的,且第一估測輸出訊號是將第二測試聲音訊號通過這濾波器模型所輸出的聲音訊號。
本發明實施例的聲音播放系統包括(但不僅限於)外部收音器、行動裝置及運算裝置。行動裝置包括內建收音器及內建揚聲器。運算裝置經配置用以決定理想濾波器,依據第二測試聲音訊號及第二接收聲音訊號訓練濾波器模型,並依據理想接收訊號及第三接收聲音訊號之間的誤差調整濾波器模型。第一測試聲音訊號通過理想濾波器而輸出第一接收聲音訊號,第一接收訊號是外部收音器對內建揚聲器所播出的測試超聲波訊號收音所得到的,且第一測試聲音訊號包括測試超聲波訊號。濾波器模型是基於機器學習演算法所訓練,第二接收聲音訊號是內建收音器對內建揚聲
器所播出的第二測試聲音訊號收音所得到的,且第二測試聲音訊號包括測試超聲波訊號。理想接收訊號是第二測試聲音訊號通過理想濾波器所輸出的聲音訊號,第三接收聲音訊號是外部收音器對內建揚聲器所播出的第一估測輸出訊號收音所得到的,且第一估測輸出訊號是將第二測試聲音訊號通過濾波器模型所輸出的聲音訊號。
基於上述,依據本發明實施例的可適性音場調整方法及聲音播放系統,訓練出符合多種播放環境的濾波器模型,並據調整所欲輸出的聲音訊號。藉此,即便行動裝置擺放在不同環境,使用者聽到行動裝置所播放的聲音訊號可接近或相同於理想環境下所聽到的聲音訊號,從而補償環境中的障礙物所造成的影響。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
1、1’:聲音播放系統
10:外部收音器
20:行動裝置
21:內建收音器
22:內建揚聲器
23、33:處理器
24、34:通訊收發器
25、35:儲存器
30:運算裝置
O:障礙物
s’c:第一測試聲音訊號
sc:第二測試聲音訊號
m’ext:第一接收聲音訊號
mint:第二接收聲音訊號
mext:第三接收聲音訊號
m4:第四接收聲音訊號
sU:測試超聲波訊號
sH:理想接收訊號
sNN1:第一估測輸出訊號
sNN2:第二估測輸出訊號
s’o:第一測試聲源訊號
so:第二測試聲源訊號
scc:合成聲音訊號
sw:待播放聲源訊號
S210~S230、S211~S214、S221~S223、S231~S233、S241~S243:步驟
圖1是依據本發明一實施例的聲音播放系統的示意圖。
圖2是依據本發明實施例的行動裝置的方塊圖。
圖3A是依據本發明另一實施例的聲音播放系統的示意圖。
圖3B是依據本發明實施例的運算裝置的方塊圖。
圖4是依據本發明一實施例的可適性音場調整方法的流程圖。
圖5是依據本發明一實施例的決定理想濾波器的流程圖。
圖6是依據本發明一實施例的訓練濾波器模型的流程圖。
圖7是依據本發明一實施例的障礙條件的示意圖。
圖8是依據本發明實施例的使用濾波器模型的流程圖。
圖9是環境中設有障礙物的範例。
圖1是依據本發明一實施例的聲音播放系統1的示意圖。請參照圖1,聲音播放系統1包括(但不僅限於)外部收音器10及行動裝置20。
外部收音器10可以是動圈式(dynamic)、電容式(Condenser)、或駐極體電容(Electret Condenser)等類型的麥克風,外部收音器10也可以是其他可接收聲波(例如,人聲、環境聲、機器運作聲等)而轉換為聲音訊號的電子元件、類比至數位轉換器、濾波器、及音訊處理器之組合。在一些實施例中,外部收音器10可能是諸如智慧型手機、錄音筆或筆記型電腦的麥克風。
圖2是依據本發明實施例的行動裝置20的方塊圖。請參照圖2,行動裝置20可以是筆記型電腦、智慧型手機、平板電腦或智慧型喇叭。行動裝置20包括(但不僅限於)內建收音器21、內建揚聲器22、處理器23、通訊收發器24及儲存器25。
內建收音器21的實施態樣可參照外部收音器10,故不再贅述。在一實施例中,外部收音器10及/或內建收音器21用以對行動裝置20的內建揚聲器22所播出的聲波收音/錄音,以取得聲
波訊號。這聲波訊號可能包括測試聲音、測試超聲波聲音、合成聲音、受障礙物改變的聲音、理想環境的聲音、各種聲源聲音及/或其他環境音。
內建揚聲器22可以是喇叭或擴音器。在一實施例中,內建揚聲器22用以播放聲音。
處理器23耦接內建收音器21及內建揚聲器22。處理器23可以是中央處理單元(Central Processing Unit,CPU)、圖形處理單元(Graphic Processing unit,GPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位信號處理器(Digital Signal Processor,DSP)、可程式化控制器、現場可程式化邏輯閘陣列(Field Programmable Gate Array,FPGA)、特殊應用積體電路(Application-Specific Integrated Circuit,ASIC)或其他類似元件或上述元件的組合。在一實施例中,處理器23用以執行行動裝置20的所有或部份作業,且可載入並執行儲存器25所記錄的各軟體模組、檔案及資料。
通訊收發器24耦接處理器23。通訊收發器24例如是支援乙太網路(Ethernet)、光纖網路、或電纜等有線網路的收發器(其可能包括(但不僅限於)連接介面、訊號轉換器、通訊協定處理晶片等元件),也可能是支援Wi-Fi、第四代(4G)、第五代(5G)或更後世代行動網路等無線網路的收發器(其可能包括(但不僅限於)天線、數位至類比/類比至數位轉換器、通訊協定處理晶片等元件)。在一實施例中,通訊收發器24用以傳送或接收資料。
儲存器25耦接處理器23。儲存器25可以是任何型態的固定或可移動隨機存取記憶體(Radom Access Memory,RAM)、唯讀記憶體(Read Only Memory,ROM)、快閃記憶體(flash memory)、傳統硬碟(Hard Disk Drive,HDD)、固態硬碟(Solid-State Drive,SSD)或類似元件。在一實施例中,儲存器25用以儲存程式碼、軟體模組、組態配置、資料(例如,聲音訊號、模型、或障礙條件)或檔案。
圖3A是依據本發明另一實施例的聲音播放系統1’的示意圖。請參照圖3A,與圖1不同之處在於,聲音播放系統1’更包括運算裝置30。
圖3B是依據本發明實施例的運算裝置30的方塊圖。請參照圖3B,運算裝置30可以是桌上型電腦、筆記型電腦、AIO電腦、智慧型手機、平板電腦、或伺服器等裝置。運算裝置30包括(但不僅限於)處理器33、通訊收發器34及儲存器35。處理器33、通訊收發器34及儲存器35的實施態樣及功能可參照圖2中處理器23、通訊收發器24及儲存器25的說明,於此不再贅述。在一實施例中,處理器33用以執行運算裝置30的所有或部份作業,且可載入並執行儲存器25所記錄的各軟體模組、檔案及資料。
下文中,將搭配聲音播放系統1’中的各項元件、模組及訊號說明本發明實施例所述之方法。本方法的各個流程可依照實施情形而隨之調整,且並不僅限於此。另須說明的是,在一些實施例中,運算裝置30的處理器33的全部或部分作業也可在聲音播
放系統1中的行動裝置20的處理器23實現(即,行動裝置20作為運算裝置30),故其相同或相似的作業將不再贅述。
圖4是依據本發明一實施例的可適性音場調整方法的流程圖。請參照圖4,運算裝置30的處理器33決定理想濾波器(步驟S210)。具體而言,假設行動裝置20置於實驗室(例如,無響室)或無障礙物的理想環境中,人耳聽到或其他收音器接收到內建揚聲器22所播放的聲音中的干擾或雜訊較小或為零。而理想濾波器是假設在前述理想環境中透過內建揚聲器22播放的傳送聲音訊號與透過外部收音器10收音所得的接收聲音訊號之間的傳輸通道。以頻率域而言,傳送聲音訊號與理想濾波器的頻率響應的乘積等於或近似於接收聲音訊號(即,干擾及/或雜訊很小或為無)。
假設傳送聲音訊號為第一測試聲音訊號。在一實施例中,第一測試聲音訊號可以是測試超聲波訊號。測試超聲波訊號例如是30千赫茲(kHz)或40kHz以上的聲音訊號。值得注意的是,超聲波的特性有助於定位,故可進一步應用在探測設有障礙物的環境。在另一實施例中,第一測試訊號可以包括測試超聲波訊號及第一測試聲源訊號(即,兩聲音訊號的合成訊號)。這第一測試聲源訊號是假設在某一情境下且於聽覺範圍(例如,20Hz~20kHz)內的聲音訊號。例如,實驗或測試情境下的標準測試聲音訊號。而第一測試聲源訊號通過理想濾波器會輸出第一接收聲音訊號。這第一接收聲音訊號是外部收音器10對內建揚聲器22所播出的第一測試聲音訊號收音所得到的。
在一實施例中,外部收音器10及行動裝置20是擺放在一定範圍內無障礙物的理想環境中。假設外部收音器10位於使用者欲聆聽內建揚聲器22所播放聲音的位置。而外部收音器10相對於行動裝置20的距離與水平角度是基於前述使用者相對於內建揚聲器22的位置所決定的。例如,外部收音器10相對於行動裝置20(假設其中心點為原點)的距離為一公尺且水平角度為90度。須說明的是,外部收音器10的所處位置可依據實際需求而改變。例如,若某一應用情境是針對使用者近距離使用行動裝置20的情況,則外部收音器10與行動裝置20的距離可設定為小於一公尺。然而,在決定某一情境的理想濾波器的過程中,外部收音器10與行動裝置20的相對位置保持不變。
圖5是依據本發明一實施例的決定理想濾波器的流程圖。請參照圖1至圖3B以及圖5,運算裝置30的處理器33合成第一測試聲源訊號s’o及測試超聲波訊號sU,以產生第一測試聲音訊號s’c(步驟S211)。運算裝置30的處理器33透過通訊收發器34傳送第一測試聲音訊號s’c給行動裝置20。在理想環境中,行動裝置20的處理器23透過內建揚聲器22播出第一測試聲音訊號s’c(步驟S212)。在聲音播放系統1中,由行動裝置20的處理器23執行步驟S211以及步驟S212。在聲音播放系統1’中,由運算裝置30的處理器33執行步驟S211以及步驟S212。外部收音器10對第一測試聲音訊號s’c收音,以輸出第一接收聲音訊號m’ext給運算裝置30(步驟S213)。
處理器33依據第一測試聲音訊號s’c與第一接收聲音訊號m’ext的比值決定理想濾波器(步驟S214)。具體而言,處理器33可利用快速傅立葉轉換或其他時間域至頻率域轉換分別將第一測試聲音訊號s’c與第一接收聲音訊號m’ext轉換到頻率域的第一測試聲音訊號S’c(f)和第一接收聲音訊號M’ext(f)。接著,處理器33決定第一測試聲音訊號S’c(f)和第一接收聲音訊號M’ext(f)的比例得出理想狀態的頻率響應為:H(f)=M’ext(f)/S’c(f)...(1)。即,理想濾波器的頻率響應H(f)。
請參照圖4,處理器33依據第二測試聲音訊號及第二接收聲音訊號訓練濾波器模型(步驟S220)。具體而言,濾波器模型是基於機器學習演算法(例如,支援向量機(Support Vector Machine,SVM)、卷積神經網絡(Convolutional Neural Network,CNN)、深度神經網路(Deep Neural Network,DNN)、或其他演算法)所訓練。機器學習演算法可分析訓練樣本以自中獲得規律,從而透過規律對未知資料預測。而濾波器模型即是經學習後所建構出的機器學習模型,並據以對待評估資料推論。
在本實施例中,濾波器模型是將第二測試聲音訊號及第二接收聲音訊號作為訓練樣本。在一實施例中,第二測試聲音訊號為與第一測試聲音訊號相同或相似的測試超聲波訊號。在另一實施例中,第二測試訊號可以包括測試超聲波訊號及第二測試聲源訊號(即,兩聲音訊號的合成訊號)。這第二測試聲源訊號是假設在
某一情境下且於聽覺範圍(例如,20Hz~20kHz)內的聲音訊號。例如,客廳、音樂廳或戶外情境下的音樂、電影或演講的聲音訊號。而第二接收聲音訊號是內建收音器21對內建揚聲器22所播出的第二測試聲音訊號收音所得到的。
圖6是依據本發明一實施例的訓練濾波器模型的流程圖。請參照圖6,處理器33選擇第二測試聲源訊號so。例如,特定歌手的音樂。處理器33合成第二測試聲源訊號so及測試超聲波訊號sU,以產生第二測試聲音訊號sc(步驟S221)。處理器33透過通訊收發器34傳送第二測試聲音訊號sc給行動裝置20。須說明的是,處理器33可透過改變第二測試聲源訊號so來改變第二測試聲音訊號sc。
在訓練環境中,處理器23透過內建揚聲器22播出第二測試聲音訊號sc。內建收音器21接收第二測試聲音訊號sc,以輸出第二接收聲音訊號mint給運算裝置30。處理器33可將第二測試聲音訊號sc(包括特定數量(例如,128、512或1024)的取樣點)與內建收音器21所得到的第二接收聲音訊號mint(包括特定數量的取樣點)成為濾波器模組的輸入訊號,並據以訓練出可隨著環境改變的動態濾波器模型(步驟S222)。以深度神經網路為例,在學習/訓練階段,處理器33可基於訓練樣本決定隱藏層的任一層中的神經元的權重。
在一實施例中,處理器33更提供一個或更多個障礙條件(即,設計訓練環境)。各障礙條件包括障礙物與行動裝置20的相
對位置。這障礙物可以是牆、家具、電器或其他物體。相對位置可包括距離及水平角度。舉例而言,圖7是依據本發明一實施例的障礙條件的示意圖。請參照圖7,障礙物O為牆。障礙物O與行動裝置20之間的距離可以是1公分至50公分,且障礙物O位於行動裝置20的特定水平角度(例如,介於180度至360度之間)處。
處理器33可依據一個或更多個障礙條件訓練濾波器模型。而第二接收聲音訊號mint反應於障礙條件的變化而改變。也就是說,這些障礙條件是模擬行動裝置20所處的多種環境。而當障礙條件改變時,第二接收聲音訊號mint可能包括不同延遲或增益的第二測試聲音訊號sc。此外,已訓練的濾波器模型可得知在不同第二測試聲音訊號sc及/或不同障礙條件的情況下的第二接收聲音訊號mint。
請參照圖4,處理器33依據理想接收訊號及第三接收聲音訊號之間的誤差調整這濾波器模型(步驟S230)。具體而言,這理想接收訊號是第二測試聲音訊號通過理想濾波器所輸出的聲音訊號。也就是說,理想接收訊號是假設在理想環境下內建揚聲器20播放第二測試聲音訊號並透過外部收音器10收音所得到的聲音訊號。
另一方面。第三接收聲音訊號是外部收音器10對內建揚聲器22所播出的第一估測輸出訊號收音所得到的,且第一估測輸出訊號是將第二測試聲音訊號通過濾波器模型所輸出的聲音訊號。也就是說,第一估測輸出訊號是濾波器模型依據第二測試聲音訊
號所估測出適合在特定障礙條件下播放聲音訊號。以深度神經網路為例,第二測試聲音訊號通過許多層的權重調整,從而改變頻率響應、相位及/或時間差,並輸出第一估測輸出訊號。
此外,若欲將第三接收聲音訊號接近或等同於理想環境下收音所得的到聲音訊號(即,理想接收訊號),則處理器33可取得這兩個聲音訊號之間的差異,並依據這差異調整濾波器模型中的參數/係數,進而將差異收斂或最小化。以深度神經網路為例,處理器33依據前述差異改變隱藏層中的一個或更多個神經元的權重。
請參照圖1至圖3B以及圖6,針對特定障礙條件(反應在第二接收聲音訊號mint)及第二測試聲音訊號sc,在聲音播放系統1’中,運算裝置30的處理器33可透過理想濾波器預測第一估測輸出訊號sNN1。在聲音播放系統1中,行動裝置20的處理器23可透過理想濾波器預測第一估測輸出訊號SNN1。運算裝置30的處理器33可透過通訊收發器34傳送第一估測輸出訊號sNN1給行動裝置20。行動裝置20的處理器23透過內建揚聲器22播出第一估測輸出訊號sNN1(包括特定數量的取樣點)(步驟S223)。外部收音器10對內建揚聲器22播放第一估測輸出訊號sNN1的聲音收音,以輸出第三接收聲音訊號mext(包括特定數量的取樣點)給運算裝置30(步驟S231)。
另一方面,處理器33利用理想濾波器調整第二測試聲音訊號sc的頻率響應,以得出理想接收訊號sH(步驟S232)。例如,
處理器33將第二測試聲音訊號sc轉換至頻率域的第二測試聲音訊號Sc,並依據公式(1)將第二測試聲音訊號Sc與理想濾波器的頻率響應的乘積作為頻率域的理想接收訊號SH(可進一步轉換至時間域的理想接收訊號sH)。
處理器33設定目標函數(即,最小化理想接收訊號sH及第三接收聲音訊號mext之間的差異)(步驟S233)。例如,目標函數為損失函數(loss function)。損失函數可能採用均方誤差(Mean Square Error,MSE)、平均絕對值誤差(Mean Absolute Error,MAE)或交叉熵(cross-entropy)決定兩訊號之間的差異。若差異未超過損失門檻值,則濾波器模型的參數/係數可維持不變或不用重新訓練。而若差異超過損失門檻值,則處理器33可能需要對濾波器模型重新訓練或修正。例如,處理器33透過梯度下降(gradient descent)或梯度相關最佳解演算法取得最小差異對應的模型參數。而損失函數收斂到接受的範圍(例如,對應設定值或門檻值),可使得外部收音器10錄音所取得的第三接收聲音訊號mext最接近理想接收訊號sH。
須說明的是,處理器33可進一步改變障礙條件及/或第二測試聲音訊號sc,並對應地調整濾波器模型,使濾波器模型所估測的第一估測輸出訊號sNN1可接近或等同於不同障礙條件及/或第二測試聲音訊號sc的條件下的第三接收聲音訊號mext。
而若濾波器模型已訓練好(例如,差異小於門檻值及/或所有障礙條件皆已訓練),處理器23或處理器33可使用這濾波器模
型來產生內建揚聲器22播放的聲音訊號。
圖8是依據本發明實施例的使用濾波器模型的流程圖。圖9是環境中設有障礙物的範例。請參照圖8與圖9,假設行動裝置20與障礙物O之間的距離為30公分,且障礙物O位於行動裝置20的水平角度90度處。處理器33可合成待播放聲源訊號sw與測試超聲波訊號sU,以產生合成聲音訊號scc(步驟S241)。接著,處理器33將合成聲音訊號scc透過通訊收發器34傳送給行動裝置20。處理器23透過內建揚聲器22播放合成聲音訊號scc,並透過內建收音器21收音以取得第四接收聲音訊號m4。這第四接收聲音訊號m4即是用於反應礙障物O的相對位置。處理器33將第四接收聲音訊號m4及合成聲音訊號scc輸入/通過濾波器模型,以輸出第二估測輸出訊號sNN2(步驟S242)。處理器33透過通訊收發器34傳送給行動裝置20。處理器23即可透過內建揚聲器22播放第二估測輸出訊號sNN2。而由於濾波器模型已訓練完成,因此使用者所聽到的聲音將接近或等同於理想環境下的所聽到的聲音。
綜上所述,在本發明實施例的聲音播放系統及可適性音場調整方法中,藉助於機器學習演算法而訓練出符合多種環境的濾波器模型,從而補償不同環境中的障礙物所造成的反射影響。無論行動裝置設於任何環境,使用者所聽到的聲音都能接近於理想環境下所聽到的聲音。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精
神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
S210~S230:步驟
Claims (12)
- 一種可適性音場調整方法,適用於調整一行動裝置的音場,該行動裝置包括一內建收音器、一內建揚聲器以及一處理器,其中該可適性音場調整方法包括:透過該處理器依據一第一測試聲音訊號與一第一接收聲音訊號決定一理想濾波器,其中該第一接收聲音訊號是與該處理器通訊連接的一外部收音器對該內建揚聲器所播出的該第一測試聲音訊號收音所得到的,且該第一測試聲音訊號包括一測試超聲波訊號;透過該處理器將一第二測試聲音訊號及一第二接收聲音訊號作為一濾波器模型的一訓練樣本,且基於一機器學習演算法訓練該濾波器模型,其中該第二接收聲音訊號是該內建收音器對該內建揚聲器所播出的該第二測試聲音訊號收音所得到的,且該第二測試聲音訊號包括該測試超聲波訊號;以及透過該處理器依據一理想接收訊號及一第三接收聲音訊號之間的誤差調整該濾波器模型,其中該理想接收訊號是該第二測試聲音訊號通過該理想濾波器所輸出的聲音訊號,該第三接收聲音訊號是該外部收音器對該內建揚聲器所播出的一第一估測輸出訊號收音所得到的,且該第一估測輸出訊號是將該第二測試聲音訊號通過該濾波器模型所輸出的聲音訊號。
- 如請求項1所述的可適性音場調整方法,其中將該第二測試聲音訊號及該第二接收聲音訊號作為該訓練樣本訓練該濾波器模型的步驟包括:透過該處理器提供至少一障礙條件,其中每一該障礙條件包括一障礙物與該行動裝置的一相對位置;以及透過該處理器依據該至少一障礙條件訓練該濾波器模型,其中該第二接收聲音訊號反應於該至少一障礙條件的變化而改變。
- 如請求項1所述的可適性音場調整方法,其中依據該第二測試聲音訊號及該第二接收聲音訊號訓練該濾波器模型的步驟之前,更包括:透過該處理器選擇一第一測試聲源訊號,其中該第一測試聲源訊號是一情境下且於一聽覺範圍內的聲音訊號;以及透過該處理器合成該第一測試聲源訊號及該測試超聲波訊號,以產生該第二測試聲音訊號。
- 如請求項1所述的可適性音場調整方法,更包括:透過該處理器合成一待播放聲源訊號及該測試超聲波訊號,以產生一合成聲音訊號;以及透過該處理器將該合成聲音訊號與一第四接收聲音訊號通過該濾波器模型,以輸出一第二估測輸出訊號,其中該第二估測輸出訊號用於透過該內建揚聲器播放,該第四接收聲音訊號是該內建收音器對該內建揚聲器所播出的該合成聲音訊號收音所得到的。
- 如請求項1所述的可適性音場調整方法,其中決定該理想濾波器的步驟包括:透過該處理器合成一第二測試聲源訊號及該測試超聲波訊號,以產生該第一測試聲音訊號,其中該第二測試聲源訊號是一情境下且於一聽覺範圍內的聲音訊號;以及透過該處理器依據該第一測試聲音訊號與該第一接收聲音訊號的比值決定該理想濾波器。
- 一種聲音播放系統,包括:一外部收音器;一行動裝置,包括一內建收音器及一內建揚聲器;以及一運算裝置,通訊連接於該外部收音器以及該行動裝置,且經配置用以:依據一第一測試聲音訊號與一第一接收聲音訊號決定一理想濾波器,其中該第一接收聲音訊號是該外部收音器對該內建揚聲器所播出的該第一測試聲音訊號收音所得到的,且該第一測試聲音訊號包括一測試超聲波訊號;將一第二測試聲音訊號及一第二接收聲音訊號作為一濾波器模型的一訓練樣本,且基於一機器學習演算法訓練該濾波器模型,其中該第二接收聲音訊號是該內建收音器對該內建揚聲器所播出的該第二測試聲音訊號收音所得到的,且該第二測試聲音訊號包括該測試超聲波訊號;以及依據一理想接收訊號及一第三接收聲音訊號之間的誤差 調整該濾波器模型,其中該理想接收訊號是該第二測試聲音訊號通過該理想濾波器所輸出的聲音訊號,該第三接收聲音訊號是該外部收音器對該內建揚聲器所播出的一第一估測輸出訊號收音所得到的,且該第一估測輸出訊號是將該第二測試聲音訊號通過該濾波器模型所輸出的聲音訊號。
- 如請求項6所述的聲音播放系統,其中將該第二測試聲音訊號及該第二接收聲音訊號作為該訓練樣本,且基於該機器學習演算法訓練該濾波器模型之時,該運算裝置更經配置用以:提供至少一障礙條件,其中每一該障礙條件包括一障礙物與該行動裝置的一相對位置;以及依據該至少一障礙條件訓練該濾波器模型,其中該第二接收聲音訊號反應於該至少一障礙條件的變化而改變。
- 如請求項6所述的聲音播放系統,其中該運算裝置更經配置用以:選擇一第一測試聲源訊號,其中該第一測試聲源訊號是一情境下且於一聽覺範圍內的聲音訊號;以及合成該第一測試聲源訊號及該測試超聲波訊號,以產生該第二測試聲音訊號。
- 如請求項6所述的聲音播放系統,其中該運算裝置更經配置用以:合成一待播放聲源訊號及該測試超聲波訊號,以產生一合成聲音訊號;以及 將該合成聲音訊號與一第四接收聲音訊號通過該濾波器模型,以輸出一第二估測輸出訊號,其中該第二估測輸出訊號用於透過該內建揚聲器播放,該第四接收聲音訊號是該內建收音器對該內建揚聲器所播出的該合成聲音訊號收音所得到的。
- 如請求項6所述的聲音播放系統,其中該運算裝置更經配置用以:合成一第二測試聲源訊號及該測試超聲波訊號,以產生該第一測試聲音訊號,其中該第二測試聲源訊號是一情境下且於一聽覺範圍內的聲音訊號;以及依據該第一測試聲音訊號與該第一接收聲音訊號的比值決定該理想濾波器。
- 一種可適性音場調整方法,適用於調整一行動裝置的音場,該行動裝置包括一內建收音器及一內建揚聲器,其中一運算裝置與該行動裝置通訊連接,且該運算裝置包括一處理器,該可適性音場調整方法包括:透過該處理器依據一第一測試聲音訊號與一第一接收聲音訊號決定一理想濾波器,其中該第一接收聲音訊號是與該處理器通訊連接的一外部收音器對該內建揚聲器所播出的該第一測試聲音訊號收音所得到的,且該第一測試聲音訊號包括一測試超聲波訊號;透過該處理器將一第二測試聲音訊號及一第二接收聲音訊號作為一濾波器模型的一訓練樣本,且基於一機器學習演算法訓練 該濾波器模型,其中該第二接收聲音訊號是該內建收音器對該內建揚聲器所播出的該第二測試聲音訊號收音所得到的,且該第二測試聲音訊號包括該測試超聲波訊號;以及透過該處理器依據一理想接收訊號及一第三接收聲音訊號之間的誤差調整該濾波器模型,其中該理想接收訊號是該第二測試聲音訊號通過該理想濾波器所輸出的聲音訊號,該第三接收聲音訊號是該外部收音器對該內建揚聲器所播出的一第一估測輸出訊號收音所得到的,且該第一估測輸出訊號是將該第二測試聲音訊號通過該濾波器模型所輸出的聲音訊號。
- 一種聲音播放系統,包括:一外部收音器;一行動裝置,包括一內建收音器、一內建揚聲器以及一處理器;該處理器通訊連接於該內建收音器、該內建揚聲器以及該外部收音器,且經配置用以:依據一第一測試聲音訊號與一第一接收聲音訊號決定一理想濾波器,其中該第一接收聲音訊號是該外部收音器對該內建揚聲器所播出的該第一測試聲音訊號收音所得到的,且該第一測試聲音訊號包括一測試超聲波訊號;將一第二測試聲音訊號及一第二接收聲音訊號作為一濾波器模型的一訓練樣本,且基於一機器學習演算法訓練該濾波器模型,其中該第二接收聲音訊號是該內建收音器對該內建揚聲器 所播出的該第二測試聲音訊號收音所得到的,且該第二測試聲音訊號包括該測試超聲波訊號;以及依據一理想接收訊號及一第三接收聲音訊號之間的誤差調整該濾波器模型,其中該理想接收訊號是該第二測試聲音訊號通過該理想濾波器所輸出的聲音訊號,該第三接收聲音訊號是該外部收音器對該內建揚聲器所播出的一第一估測輸出訊號收音所得到的,且該第一估測輸出訊號是將該第二測試聲音訊號通過該濾波器模型所輸出的聲音訊號。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110129682A TWI817177B (zh) | 2021-08-11 | 2021-08-11 | 聲音播放系統及可適性音場調整方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110129682A TWI817177B (zh) | 2021-08-11 | 2021-08-11 | 聲音播放系統及可適性音場調整方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202307827A TW202307827A (zh) | 2023-02-16 |
TWI817177B true TWI817177B (zh) | 2023-10-01 |
Family
ID=86661225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110129682A TWI817177B (zh) | 2021-08-11 | 2021-08-11 | 聲音播放系統及可適性音場調整方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI817177B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI517028B (zh) * | 2010-12-22 | 2016-01-11 | 傑奧笛爾公司 | 音訊空間定位和環境模擬 |
US9478212B1 (en) * | 2014-09-03 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device |
TWI683534B (zh) * | 2019-09-19 | 2020-01-21 | 宏碁股份有限公司 | 等化處理的調整系統及其調整方法 |
-
2021
- 2021-08-11 TW TW110129682A patent/TWI817177B/zh active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI517028B (zh) * | 2010-12-22 | 2016-01-11 | 傑奧笛爾公司 | 音訊空間定位和環境模擬 |
US9478212B1 (en) * | 2014-09-03 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device |
TWI683534B (zh) * | 2019-09-19 | 2020-01-21 | 宏碁股份有限公司 | 等化處理的調整系統及其調整方法 |
Also Published As
Publication number | Publication date |
---|---|
TW202307827A (zh) | 2023-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240096348A1 (en) | Linear Filtering for Noise-Suppressed Speech Detection | |
US11688419B2 (en) | Linear filtering for noise-suppressed speech detection via multiple network microphone devices | |
US20180213309A1 (en) | Spatial Audio Processing Apparatus | |
CN110537221A (zh) | 用于空间音频处理的两阶段音频聚焦 | |
KR102470962B1 (ko) | 사운드 소스들을 향상시키기 위한 방법 및 장치 | |
US10873814B2 (en) | Analysis of spatial metadata from multi-microphones having asymmetric geometry in devices | |
CN109791769A (zh) | 使用自适应捕捉从麦克风阵列生成空间音频信号格式 | |
US11126398B2 (en) | Smart speaker | |
CN106535076B (zh) | 一种立体声音响系统的空间校准方法及其移动终端设备 | |
JP2020500480A5 (zh) | ||
CN104604254A (zh) | 声音处理装置、方法和程序 | |
KR20220044204A (ko) | 분산형 오디오 디바이스들을 위한 음향 반향 소거 제어 | |
US20230260525A1 (en) | Transform ambisonic coefficients using an adaptive network for preserving spatial direction | |
WO2022256577A1 (en) | A method of speech enhancement and a mobile computing device implementing the method | |
CN113553022A (zh) | 设备调整方法、装置、移动终端及存储介质 | |
CN110475181B (zh) | 设备配置方法、装置、设备和存储介质 | |
CN117693791A (zh) | 言语增强 | |
TWI662544B (zh) | 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置 | |
TWI817177B (zh) | 聲音播放系統及可適性音場調整方法 | |
WO2023051622A1 (zh) | 提升远场语音交互性能的方法和远场语音交互系统 | |
Peled et al. | Objective performance analysis of spherical microphone arrays for speech enhancement in rooms | |
CN117643075A (zh) | 用于言语增强的数据扩充 | |
CN115776629A (zh) | 声音播放系统及可适性音场调整方法 | |
WO2017171864A1 (en) | Acoustic environment understanding in machine-human speech communication | |
CN113611271B (zh) | 适用于移动终端的数字音量扩增方法、装置及存储介质 |